【智快網(wǎng)】10月30日消息,今日,百川智能宣布推出了全新的Baichuan2-192K大模型,這一模型具備令人矚目的上下文窗口長(zhǎng)度,達(dá)到了192K,可以處理約35萬(wàn)個(gè)漢字,被譽(yù)為目前全球上下文窗口最長(zhǎng)的大模型。
據(jù)了解,Baichuan2-192K的性能在支持長(zhǎng)上下文窗口方面表現(xiàn)卓越,相較于Claude2(100K上下文窗口,實(shí)測(cè)約8萬(wàn)字)有著4.4倍的突破,同時(shí)也超越了GPT-4(支持32K上下文窗口,實(shí)測(cè)約2.5萬(wàn)字)達(dá)到了14倍的差異。
上下文窗口長(zhǎng)度是大型語(yǔ)言模型的核心技術(shù)之一。通過(guò)更大的上下文窗口,模型能夠綜合更多上下文信息,獲取更豐富的語(yǔ)義信息,更好地理解上下文的相關(guān)性,減少歧義,從而更準(zhǔn)確、流暢地生成內(nèi)容,提升模型整體性能。
與此同時(shí),Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10個(gè)中英文長(zhǎng)文本問(wèn)答和摘要評(píng)測(cè)集上表現(xiàn)出色,成功地在7項(xiàng)評(píng)測(cè)中取得了最優(yōu)成績(jī)。
百川智能還宣布,Baichuan2-192K將以API調(diào)用和私有化部署的方式提供給企業(yè)用戶(hù)。目前,他們已經(jīng)啟動(dòng)了Baichuan2-192K的API內(nèi)測(cè),專(zhuān)門(mén)開(kāi)放給法律、媒體、金融等行業(yè)的核心合作伙伴,為不同領(lǐng)域的專(zhuān)業(yè)用戶(hù)提供更強(qiáng)大的語(yǔ)言處理工具。