快手自研大模型新面孔KwaiYii-13B表現(xiàn)亮眼
2023-08-21 10:55
近日消息,在多個知名大模型排行榜上,一個新面孔KwaiYii-13B近日表現(xiàn)亮眼,并一舉躍居CMMLU中文向排名首位。
截自微博
據(jù)悉,這是來自快手AI團隊從零到一獨立自研的大模型——“快意”(KwaiYii)。根據(jù)其GitHub主頁介紹,“快意”是由快手AI團隊研發(fā)的大規(guī)模語言模型,而本次引發(fā)關注的正是其新版本KwaiYii-13B。
該模型在多個Benchmark上都處于領先水平,證明了其在自然語言處理任務中的出色性能。其中,KwaiYi-13B-Base預訓練模型具備優(yōu)異的通用技術底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領先水平,顯示了快意大模型在中文和英文上都具備非常強悍的能力。
圖源:極客公園公眾號
而KwaiYii-13B-Chat對話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學邏輯、代碼編寫、多輪對話等廣泛任務,人工評估結果表明KwaiYi-13B-Chat超過主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學解題上接近ChatGPT(3.5)同等水平。
據(jù)了解,目前“快意”已經(jīng)開啟內(nèi)測,并為業(yè)務團隊提供了標準API和定制化項目合作方案,以便在各種業(yè)務場景中進行測試和驗證。
KwaiYii-13B-Chat在人工評測上的效果,圖源:極客公園公眾號
2022年至今,快手AI團隊已發(fā)表130多篇頂會論文,覆蓋機器學習、自然語言處理、圖像識別、語音識別、搜推廣等多項研究領域,包含 ICCV/CVPR(21)、ACM MM(9)、KDD(9)、SIGIR(9)等頂級會議。
7月8日,快手宣布正在內(nèi)測智能問答產(chǎn)品,在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能。8月8日,“快手AI對話”開啟小范圍測試,以搜索場景為入口,為用戶提供更多元、便捷的搜索形態(tài),大為降低用戶的搜索使用門檻。
快手App已內(nèi)測AI對話功能,圖源:極客公園公眾號
據(jù)了解,這兩個新產(chǎn)品功能均基于“快意”大模型研發(fā)。8月18日,“快手AI對話”功能已經(jīng)在快手APP安卓版本開放內(nèi)測,這也是短視頻直播行業(yè)首個基于大語言模型落地的智能問答產(chǎn)品,在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能。
參與測試的用戶點擊快手搜索首頁右上角AI圖標即可進入產(chǎn)品首頁,選擇輸入內(nèi)容對話或點擊引導問題便可開啟對話,或者觸發(fā)“搜索智能問答”卡片,通過底部入口可以啟用該功能。
據(jù)稱,快手AI團隊將持續(xù)迭代“快意”大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力,另一方面也在推進更多C端與B端業(yè)務場景下的落地。
來源:電商報