您現(xiàn)在的位置:首頁 > 綜合 > 特別關(guān)注 > 正文

天天觀焦點:科大訊飛動真格:星火大模型七大維度評測 率先落地應(yīng)用

時間:2023-05-07 12:40:24    來源:紅星資本局    

5月6日,科大訊飛(002230.SZ)正式發(fā)布訊飛星火認知大模型(下稱“星火”)。

當(dāng)有的廠商為大模型不確定的商業(yè)化落地前景感到焦慮時,科大訊飛迎頭趕上,不僅現(xiàn)場收集問題進行測試,還針對大模型推出七大評測維度。


(資料圖片僅供參考)

更重要的是,紅星資本局注意到,科大訊飛成為了國內(nèi)率先將大模型落地應(yīng)用的廠商,并推出了推出面向教育、辦公、車載等行業(yè)的解決方案。

科大訊飛在AI領(lǐng)域十年如一日的積累,在此時成為了可以燎原的星火。

現(xiàn)場收集問題進行測試

科大訊飛動真格,七大維度評測

科大訊飛一上來就是動真格。

5月6日,在發(fā)布會現(xiàn)場,科大訊飛的董事長劉慶峰、研究院院長劉聰在發(fā)布會現(xiàn)場用幾分鐘收集了上千個問題,并隨機抽取了5個問題現(xiàn)場測試。

——“外星人感冒了需要戴口罩嗎?”

——“我想把40㎡的房子裝修成70㎡的感覺,請給出可行的方案。”

——“公眾場合大聲喧嘩會影響別人的心情,那小聲講話是不是就不會影響?”

如果只靠回答這些問題來證明星火的能力,那科大訊飛恐怕又會落入俗套,劉慶峰顯然看得更加長遠,不是從企業(yè)、而是從整個行業(yè)的角度去看待問題。

“我特別想說的是,如果我們要讓認知智能真的解決社會剛需(問題),而不是簡單地做PR、做宣傳的話,我們就要建立一套實實在在的用科學(xué)系統(tǒng)來評測的體系?!眲c峰說。

作為人工智能領(lǐng)軍之一,科大訊飛通過認知智能全國重點實驗室牽頭設(shè)計了評測體系,并與相關(guān)聯(lián)盟共同探討形成了覆蓋七大維度的481個細分任務(wù)對通用認知大模型進行評測。

其中,七大維度指的是文本生成、語言理解、知識問答、邏輯推理、數(shù)字能力、編程能力和多模態(tài),星火在此次的發(fā)布會上被現(xiàn)場考驗了每一個維度的問題。

——“請問孔子在2008年的奧運會上說了些什么?”

——“等腰三角形的頂角是底角度數(shù)的2倍,請問這個三角形的底角是多少度?”

——“俗話說,男子漢大丈夫?qū)幩啦磺?;但俗話又說,男子漢大丈夫能屈能伸。這兩種說法應(yīng)該怎么理解呢?”

紅星資本局在現(xiàn)場注意到,星火在個別維度上的表現(xiàn)偶有瑕疵,但整體表現(xiàn)優(yōu)秀,尤其是在最后一個維度多模態(tài)上,它的表現(xiàn)可謂是驚艷。

先是劉聰語音輸入要求,讓星火以“立夏”為題寫一篇200字散文,然后又要求星火以溫柔的男聲朗讀,每個任務(wù)星火都完美達成。甚至,在被提出生成女性形象的虛擬人朗讀時,星火只用不到10秒的時間成功生成虛擬人的視頻。

從接受語音需求到文本生成,再從語音朗讀到實時生成虛擬人,星火展現(xiàn)了大模型能達到的豐富形態(tài)和能力,讓我們認識到大模型在生活中存在的另一種無限可能。

業(yè)界尚愁落地不確定性

科大訊飛一口氣推出多款落地產(chǎn)品

當(dāng)前,業(yè)界普遍還認為,通用認知大模型的商業(yè)化前景尚不明確,行業(yè)落地存在不確定性。而科大訊飛憑借在AI領(lǐng)域的多年積累,此次一口氣推出了搭載大模型的多款產(chǎn)品。

以教育領(lǐng)域為例,搭載星火的科大訊飛AI學(xué)習(xí)機T20系列實現(xiàn)了中英文作文類人批改。

劉慶峰認為,在語言學(xué)習(xí)的過程中,作文能力很難得到提升。因為針對性的指導(dǎo)和批改耗時耗力,老師很難對每一個學(xué)生的情況進行深度的分析、教導(dǎo),而星火帶來了全新的體驗。

從現(xiàn)場實時演示來看,和傳統(tǒng)學(xué)習(xí)機一樣,該學(xué)習(xí)機也能進行針對字詞標(biāo)點糾錯、識別句式修辭錯誤等基礎(chǔ)批改,同時,該學(xué)習(xí)機還能圍繞寫作要求分析全篇結(jié)構(gòu)和文采,如某一句可以優(yōu)化、建議加入動作描寫和神態(tài)描寫等。

相對來看,學(xué)習(xí)機可能只調(diào)用了星火在文本生成、語言理解等維度的能力,另一產(chǎn)品更能綜合地體現(xiàn)星火多維度的能力——“大模型+數(shù)字員工”。

在發(fā)布會上,劉聰要求星火復(fù)盤科大訊飛的“飛凡計劃”(招收優(yōu)秀應(yīng)屆畢業(yè)生的招聘項目),在無人操作的情況下,星火自動登錄HR系統(tǒng),并根據(jù)要求導(dǎo)出數(shù)據(jù)、分析數(shù)據(jù)、生成PPT。

紅星資本局注意到,在整個過程中,星火或動用了語言理解、邏輯推理、數(shù)字能力、編程能力和多模態(tài)等多維度的能力完成指令。

星火正在對科大訊飛的“飛凡計劃”進行復(fù)盤

事實上,除了上述兩個領(lǐng)域外,科大訊飛還發(fā)布了星火在辦公和汽車等領(lǐng)域的行業(yè)應(yīng)用成果,如“大模型+智能辦公本”、“大模型+訊飛聽見”和“大模型+智能座艙”等。

從目前推出的大模型進度來看,科大訊飛毫無疑問是率先應(yīng)用落地的廠商。可以說,星火的現(xiàn)在,或許可能就是不少投身AI創(chuàng)業(yè)浪潮之人還在暢想的未來。

科大訊飛的多年積累

從數(shù)據(jù)、算法到模型、算力均有優(yōu)勢

為什么科大訊飛能成為率先將大模型應(yīng)用落地的廠商?

正如劉慶峰在此次發(fā)布會上說的,“這一次認知大模型本質(zhì)上是一次對話式的通用智慧的涌現(xiàn),語音和語言的核心能力是一個基礎(chǔ)條件?!?/p>

紅星資本局注意到,科大訊飛最早在2011年就承建了語音及語言信息處理國家工程實驗室,而且在認知智能領(lǐng)域中不斷投入進行研發(fā),有長達十幾年的積累。

以數(shù)據(jù)為例,劉聰今年曾對媒體透露,在嚴格遵守適用法律法規(guī)前提下,科大訊飛在多年認知智能系統(tǒng)研發(fā)推廣中積累了超50TB的行業(yè)語料和每天超10億人次用戶交互的活躍應(yīng)用。

當(dāng)然,光有數(shù)據(jù)積累是不夠的,還需要優(yōu)秀的算法和模型。

科大訊飛財報曾披露,其在認知智能大模型最核心的Transformer深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富的經(jīng)驗,且已廣泛應(yīng)用于科大訊飛的語音識別和圖文識別等,已達到國際領(lǐng)先水平。

另外,科大訊飛現(xiàn)已開源6個大類、超過40個通用領(lǐng)域的系列中文預(yù)訓(xùn)練語言模型,相關(guān)模型庫月均調(diào)用量超1000萬,在Github平臺獲得星標(biāo)數(shù)位列同類中文預(yù)訓(xùn)練語言模型前列。

這也體現(xiàn)在科大訊飛連年增長的研發(fā)費用中。紅星資本局翻閱財報發(fā)現(xiàn),在過去五年中,科大訊飛的研發(fā)費用分別為12.63億元、16.40億元、22.11億元、28.30億元和31.11億元。

更為重要的是,科大訊飛在算力上占據(jù)優(yōu)勢。

科大訊飛在今年4月曾通過投資者關(guān)系活動記錄表披露稱,其在總部自建有業(yè)界一流的數(shù)據(jù)中心,且已建成4 城7中心深度學(xué)習(xí)計算平臺,為大模型訓(xùn)練平臺建設(shè)奠定了硬件基石。

這些或許是科大訊飛喊出“10月底整體趕超ChatGPT”的底氣,我們拭目以待。

(文章來源:紅星資本局)

關(guān)鍵詞:

凡本網(wǎng)注明“XXX(非中國微山網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負責(zé)。

特別關(guān)注