去年底至今ChatGPT火爆,A股市場中科大訊飛存在感明顯,股價節(jié)節(jié)突破新高,市場把預期拉滿,等待著的是訊飛大模型交卷亮相。早前百度文心一言、阿里通義千問等眾多大模型已經(jīng)接連問世,同樣讓五月份發(fā)布的訊飛星火大模型壓力倍增,必須拿出“真金不怕火煉”的看家本領(lǐng)了。
5月6日,科大訊飛正式發(fā)布訊飛星火認知大模型,現(xiàn)場實測大模型七大核心能力,并發(fā)布教育、辦公、汽車、數(shù)字員工四大行業(yè)應用成果。兩個多小時的發(fā)布會中,更多的時間交給了各種功能的現(xiàn)場實測演示,文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力均一一驗證。
【資料圖】
這更像是一場大模型產(chǎn)品級發(fā)布會,而非其他企業(yè)技術(shù)概念式的炫技。“目前還沒有一家國產(chǎn)大模型面向公眾大規(guī)模開放,讓所有人都可以體驗。訊飛推出的這些功能都是產(chǎn)品級,購買相應硬件的用戶即可立刻獲得體驗。”科大訊飛如此表示。
在國外公司在大模型領(lǐng)域率先布局的情況下,要重視通用人工智能這樣一個產(chǎn)業(yè)化和重大的戰(zhàn)略機會,拿回人工智能在中文領(lǐng)域的主動權(quán)已經(jīng)至關(guān)重要?!?0月24日星火大模型將在中文通用大模型上超過ChatGPT現(xiàn)有水平,英文和ChatGPT現(xiàn)有水平持平?!卑l(fā)布會上科大訊飛董事長劉慶峰透露。
不只拼上線速度,還要比產(chǎn)品落地效果。那么科大訊飛星火大模型實際表現(xiàn)究竟幾何?科大訊飛如何推進大模式技術(shù)的產(chǎn)業(yè)化?大模型之戰(zhàn),科大訊飛長期的技術(shù)底氣是什么?
實測體驗感拉滿
世界的每一次革新都始于人類的提問,世界的相連始于哥倫布的提問,對于天空的夢想始于萊特兄弟的提問。而這一次,回答問題的隊伍中出現(xiàn)了“認知大模型”。面對實測,訊飛星火大模型也要回答自己的真實表現(xiàn)是否經(jīng)得住考驗。
“你為什么叫星火?”訊飛星火大模型回答稱:取名“星火”有三層寓意,當前認知大模型的智能涌現(xiàn),讓科大訊飛更加看清了通用人工智能AGI的遠景目標和實現(xiàn)路徑;早在2001年科大訊飛“半場會議”上,創(chuàng)業(yè)團隊就提出了“燃燒最亮的火把,要么率先燎原,要么最先熄滅”;“星火”來自中國傳統(tǒng)文化二十八星宿中的“心宿”星座,在中國傳統(tǒng)文化中,被視為吉祥的象征,代表著力量、勇氣和堅韌不拔的精神。
發(fā)布會上,科大訊飛副總裁、研究院院長劉聰現(xiàn)場演示了“星火大模型”7個方面的能力。在演示中,該模型可以寫文案、編故事,可以根據(jù)場景含義理解成語意思并給出針對性分析,并根據(jù)上下文邏輯推理;還可以解決基礎(chǔ)的數(shù)學問題、生成簡單代碼;此外,該模型還具備圖片、語音等多模態(tài)的輸入、輸出能力。
“今天是科大訊飛星火認知大模型的發(fā)布會,線下和線上觀看發(fā)布會的朋友們一直以來對科大訊飛都非常關(guān)心和支持,非常感謝大家,請幫我寫一篇歡迎詞。”劉聰通過語音和大模式溝通后,一篇要點俱全的歡迎詞隨機生成。
當被問及公司的股票昨天漲了10%,今天又跌了10%,股票漲還是跌了?星火大模型給出答案虧了1%了,很多網(wǎng)民的第一反應會以為是不賺不賠。當被問及從“1一直加到100,結(jié)果等于多少”,星火大模型很快算出答案為5050。而問及“花壇里面共有三種花,一共88朵,其中月季花是菊花的4倍,牡丹花數(shù)量是菊花的5倍少2朵,花壇里一共有多少牡丹花”時,星火認知大模型很快算出答案為43朵牡丹花。
在邏輯推理能力方面,當被問及“孔子在2008年的奧運會上說了些什么”,星火認知大模型指出,孔子在2008年的奧運會上沒有說過任何話。但當被要求“編一個孔子在2008年奧運會上給大家做漢語培訓的故事”時,星火認知大模型很快給出了自己的答案。
是否擁有連續(xù)對話能力與自我糾錯能力,是區(qū)別眾多語言大模型較為重要的一個標準。在“孔子奧運會”對話中,星火第一時間發(fā)現(xiàn)問題中隱藏著的錯誤,但在要求編故事后給出了答案,表現(xiàn)出了極強的連續(xù)對話能力,這讓星火大模型“活”了起來。
劉慶峰稱,“星火大模型”在中文長文本生成、醫(yī)療領(lǐng)域的知識問答、數(shù)理能力等方面已經(jīng)超過了ChatGPT,而在語言理解等方面還落后ChatGPT。他同時公布將于6月9日升級該模型的開放式問答、多輪對話、數(shù)學能力;并于8月15日升級代碼能力、多模態(tài)交互能力;他還稱,10月24日“星火大模型”將在中文通用大模型上超過ChatGPT現(xiàn)有水平,英文和ChatGPT現(xiàn)有水平持平。
真正解決社會剛需
當前的通用人工智能特別令人關(guān)注的7個維度包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力以及多模態(tài)能力,這些方面的提升將對整個人類的生產(chǎn)生活方式帶來顛覆。比如,改變信息分發(fā)獲取模式,革新內(nèi)容生產(chǎn)模式,全自然交互完成任務(wù),實現(xiàn)專家級的虛擬助手,顛覆傳統(tǒng)手工編程方式以及成為科研工作的加速器等。
“今天要看一個大模型系統(tǒng)到底好不好,首先要看它是不是能解決剛需、是不是真的有用,而不是一個簡單的單點測試。”劉慶峰表示,認知大模型這場長期競賽關(guān)鍵在于,是不是找到市場規(guī)模能夠自我造血的點,誰就最先能夠形成良性循環(huán)。
據(jù)央視財經(jīng)微博2月27日消息,2023年2月美國50%的企業(yè)已經(jīng)接入ChatGPT,商業(yè)化破局成為國內(nèi)大模型之戰(zhàn)的關(guān)鍵,科大訊飛瞄準的是解決社會剛需??拼笥嶏w自去年12月啟動“1+N”大模型技術(shù)攻關(guān)。其中, “1”指的是通用認知智能大模型算法研發(fā)及高效訓練方案底座平臺, “N”指的是將認知智能大模型技術(shù)應用在教育、醫(yī)療、人機交互、辦公、翻譯等多個行業(yè)領(lǐng)域。
“1+N”模式大大有利于認知大模型在細分領(lǐng)域的實用性,也意味著“星火”在行業(yè)中的“泛用性”很高,在“通用智能”與“專用大模型”相輔相成中,能夠在許多細分領(lǐng)域內(nèi)提供實用的幫助??拼笥嶏w早前在各個行業(yè)已經(jīng)深度布局了人工智能應用,這些行業(yè)應用貢獻高質(zhì)量文本是其特有的優(yōu)勢?!靶腔鸬拇笳Z言模型是科大訊飛的行業(yè)專用系統(tǒng)通過獨立、封閉環(huán)境訓練語料得到的結(jié)果,可以避免一本正經(jīng)回復錯誤消息,使得專用領(lǐng)域保障性更強?!眲c峰稱。
“科大訊飛此次并未發(fā)布訊飛醫(yī)療專用大模型,但將持續(xù)將積累多年的醫(yī)療能力嵌入通用人工智能中,醫(yī)療專用大模型預計將在1024大會期間發(fā)布?!彪m然科大訊飛智慧醫(yī)療已經(jīng)得到了相當規(guī)模的應用,針對醫(yī)療領(lǐng)域,劉慶峰顯然更謹慎。
此次發(fā)布會上,科大訊飛還公布了大模型能力帶來的對于教育、辦公等領(lǐng)域現(xiàn)有產(chǎn)品的功能升級。在教育領(lǐng)域,科大訊飛學習機借助該模型實現(xiàn)了批改作文、中英文口語對話的能力。在現(xiàn)場展示中,學習機產(chǎn)品可以通過拍照自動批改小學水平的中文作文及高考英語作文,可以實現(xiàn)指出錯別字、語句修訂、評分等功能。
在辦公領(lǐng)域,訊飛辦公本借助大模型能力可以根據(jù)手寫要點自動生成會議紀要,將會議語音轉(zhuǎn)化成書面化文稿;“訊飛聽見”還可通過AI分析文字內(nèi)容,自動生成摘要、待辦、文案等;在智能座艙領(lǐng)域,大模型進一步提升座艙內(nèi)語音交互能力;大模型基于自然語言自動生成業(yè)務(wù)流程,充當企業(yè)的“數(shù)字員工”完成重復性高的工作。
在行業(yè)人士看來,大模型終局類似“太極拳”,易學難精,貴在有持續(xù)數(shù)據(jù)場景資源,以及能夠持續(xù)迭代。當前,科大訊飛星火大模型亮眼表現(xiàn)充分彰顯了公司技術(shù)和行業(yè)高質(zhì)量數(shù)據(jù)優(yōu)勢,在數(shù)據(jù)和應用層面能夠形成良好協(xié)同,其中AI賦能帶來訊飛C端硬件價值量的提升,再者通過開放平臺對外輸出模型能力賦能千行百業(yè),認知模式浪潮下有望開啟公司新一輪成長機遇。
(文章來源:第一財經(jīng))