快手自研大模型新面孔KwaiYii-13B表現(xiàn)亮眼
2023-08-21 10:55
近日消息,在多個(gè)知名大模型排行榜上,一個(gè)新面孔KwaiYii-13B近日表現(xiàn)亮眼,并一舉躍居CMMLU中文向排名首位。
截自微博
據(jù)悉,這是來自快手AI團(tuán)隊(duì)從零到一獨(dú)立自研的大模型——“快意”(KwaiYii)。根據(jù)其GitHub主頁介紹,“快意”是由快手AI團(tuán)隊(duì)研發(fā)的大規(guī)模語言模型,而本次引發(fā)關(guān)注的正是其新版本KwaiYii-13B。
該模型在多個(gè)Benchmark上都處于領(lǐng)先水平,證明了其在自然語言處理任務(wù)中的出色性能。其中,KwaiYi-13B-Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平,顯示了快意大模型在中文和英文上都具備非常強(qiáng)悍的能力。
圖源:極客公園公眾號(hào)
而KwaiYii-13B-Chat對話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對話等廣泛任務(wù),人工評估結(jié)果表明KwaiYi-13B-Chat超過主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近ChatGPT(3.5)同等水平。
據(jù)了解,目前“快意”已經(jīng)開啟內(nèi)測,并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn)API和定制化項(xiàng)目合作方案,以便在各種業(yè)務(wù)場景中進(jìn)行測試和驗(yàn)證。
KwaiYii-13B-Chat在人工評測上的效果,圖源:極客公園公眾號(hào)
2022年至今,快手AI團(tuán)隊(duì)已發(fā)表130多篇頂會(huì)論文,覆蓋機(jī)器學(xué)習(xí)、自然語言處理、圖像識(shí)別、語音識(shí)別、搜推廣等多項(xiàng)研究領(lǐng)域,包含 ICCV/CVPR(21)、ACM MM(9)、KDD(9)、SIGIR(9)等頂級(jí)會(huì)議。
7月8日,快手宣布正在內(nèi)測智能問答產(chǎn)品,在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能。8月8日,“快手AI對話”開啟小范圍測試,以搜索場景為入口,為用戶提供更多元、便捷的搜索形態(tài),大為降低用戶的搜索使用門檻。
快手App已內(nèi)測AI對話功能,圖源:極客公園公眾號(hào)
據(jù)了解,這兩個(gè)新產(chǎn)品功能均基于“快意”大模型研發(fā)。8月18日,“快手AI對話”功能已經(jīng)在快手APP安卓版本開放內(nèi)測,這也是短視頻直播行業(yè)首個(gè)基于大語言模型落地的智能問答產(chǎn)品,在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能。
參與測試的用戶點(diǎn)擊快手搜索首頁右上角AI圖標(biāo)即可進(jìn)入產(chǎn)品首頁,選擇輸入內(nèi)容對話或點(diǎn)擊引導(dǎo)問題便可開啟對話,或者觸發(fā)“搜索智能問答”卡片,通過底部入口可以啟用該功能。
據(jù)稱,快手AI團(tuán)隊(duì)將持續(xù)迭代“快意”大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力,另一方面也在推進(jìn)更多C端與B端業(yè)務(wù)場景下的落地。
來源:電商報(bào)