波多野结衣按摩,在线观看亚洲视频,国产嫩草在线观看,91视频最新地址

首頁 商業 > 正文

重塑未來!訊飛星火領跑國產大模型?

互聯網曾經近乎重寫了所有行業,通訊、購物、支付、打車、點餐等等,人們生活的方方面面幾乎被重塑。

如今大模型再次給予人們充分的想象空間。

第一財經提到,從樂觀的角度來看,ChatGPT可以取代一些重復性較強、規律性較為單一的工作,但同時它也可以釋放出更多的生產力,讓人們關注更有想象力、情感、思辨性的部分,并催生出AI提示工程師、AI調教師、AI創意師等一批新興職業。


【資料圖】

簡單來說,大模型相當于一個全新的系統,這個全新的系統可以大幅降低很多行業的門檻,未來也會有很多產品構建需要用到大模型,而人們的創造性勞動,將通過這個全新的系統得到大幅釋放。

根據中國科學技術信息研究所的不完全統計,目前國內已經發布了70多個大模型,不少產品都展現出了驚人的爆發力。

拿科大訊飛來說,基于訊飛星火認知大模型研發的功能落地學習機、辦公本等產品之后,科大訊飛今年再次突破高增速,618銷售額同比增長125%,并在多個品類中摘獲銷售額冠軍。

這一點,同樣體現在資本市場。6月20日,AI概念股表現搶眼,科大訊飛漲近7%,復權股價同樣創歷史新高。科大訊飛成交102億元,在兩市居首。

剛好筆者可以使用訊飛星火大模型了,最近也看到了不少有趣的測試,我們就一起看看現在的AI大模型發展到什么程度了。

1、錯別字識別哪家強

高考作文想必大家都看膩了,前陣子看到《智商稅研究中心》的這篇校對測評的設問還挺特別。

篇幅有限,拎出幾個比較能拉開差距的問題,來跟大家一起分享看看。

首先是字詞方面。

“洛陽親友如相問,就說我在岳陽樓。”將“相問”錯拼成“翔問”,考驗一下各家大模型的基本功。

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

訊飛星火、文心一言、通義千問、GPT4都順利完成基礎的校對,只有360智腦,追問之下仍表示無誤。

再來看語病方面。

校對語病的例子中整體表現不佳,不過讓AI直接識別判斷是否有歧義,還是能看出一點國產AI大模型之間的差距。

例如,“這句話有歧義嗎:在床上‘葛優癱’了一天,他突然想起來了。”

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

這里雖然幾乎全軍覆沒,不過訊飛星火還是指出了“可能存在一些解讀上的歧義”,一直表現不錯的GPT4沒能看出歧義還是有點意外。

最后看下指正校對錯誤后,AI大模型能否承認錯誤接受指正。

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

這部分訊飛星火意外地跟GPT4表現得旗鼓相當,反應迅速,簡潔明了,承認錯誤后直接給出了校對后的句子;文心一言還要再進一步給出指令才會給出答案;而通義千問和360智腦則是“積極認錯,堅決不改”。

校對文本錯誤在某種層面上,反映了大模型的基礎能力,地基打好了,才能有更多上探的空間。

總體來說,在基礎的校對能力上,訊飛星火算是國產大模型中最接近GPT4水平的;其他表現也中規中矩;至于360智腦,用360掌門人周鴻祎在360首發時的話來說,360智腦還只是個“孩子”,距離完善使用還有相當的一段路要走。

2、“數學高手”

寒窗苦讀十余年,無論教育制度怎么改,除了語文,還有一個怎么也躲不掉的,就是數學。

數學的重要性不言而喻,它培養了我們的邏輯思維能力。但相對于大模型擅長的文本內容,數學能力在一定程度上算是大模型的弱項

不過上個月才出的訊飛星火意外地表現有些驚喜。

訊飛星火首發后,知名科技行業觀察者《差評》,就曾對訊飛星火作出過全面測評,在數學測驗部分,也展示了訊飛星火基礎的數學能力,全部答對毫無壓力。

經典的雞兔同籠問題,即使變換參數和問法也能全部答對。

用《差評》文中的話來說,訊飛星火做數學題,有一種過于強大,可以和GPT4掰掰手腕的感覺。

這種感覺,將國產大模型的回答都放一起后則更加強烈。

《科創板日報》就曾在一篇文章中,對文心一言、科大訊飛、360智腦幾家比較有代表性的大模型進行測評展示。

例如,“某次數學競賽共20道題,評分標準是:每做對一題得5分,每做錯或不做一題扣1分。小華參加了這次競賽,得了64分。問:小華做對幾道題?”

正確答案應該是14題,我們看一下各家大模型的作答。

文心一言:

360智腦:

訊飛星火:

可以看到只有訊飛星火答對了,文中展示的另一道小升初數學題,同樣也只有訊飛星火答對。

《科創板日版》在文章開頭也指出,科大訊飛星火認知在數理能力表現尤為突出。

那到底能突出到什么程度呢?

我們繼續對訊飛星火加大難度看看。

大模型在數學領域的表現有著見微知著的效果,因為這需要結合大語言模型和計算引擎兩者的能力。在復雜邏輯條件下,學習多步驟推理,這對計算資源和數據,有著海量需求,對算力也有著極高的要求。

訊飛星火在數學方面能力的展示,更是一家企業數據資源和算力水平的展示。對于國產大模型來說,數學能力是意義非常的。

不過,大模型不是一朝一夕就能訓練完成的,如何落地?能不能落地?也是企業需要考慮的。

3、落地前景

大模型的出現注定是要破舊立新的,技術的發展回歸到現實生活中,還是要看它的實際應用能力。

《娛樂資本論》做過一期市面上主流的5款大模型,一共90個回答的橫評,想必耗費了不少時間精力,整體評價也是比較中肯的,頗具參考意義。

可以先看一下這張最終測試評分表。

大模型這種屬于比較底層的框架,我們勢必要做出自己的由中文語料訓練而成的大模型。所以我們不可避免地會與ChatGPT相比較。

從上圖來看,目前在落地應用方面,訊飛星火在主流國產大模型中,離ChatGPT是最近的。

具體到案例中,我們截取小紅書帶貨的商業文案來看一下。

文案較長,內容有所折疊,不過總的來說,文中展示的兩個作答還是比較貼切的。

星火自設了一款手機型號進行更準確的數據呈現,內容和邏輯這種長處不作過多分析,主要拉開差距的地方還是要求中的emoji表情。

相較于文心一言和天工未能察覺出需要在文案和題中帶有emoji表情,星火的emoji甚至還有關聯性,直接拿去發小紅書基本也足夠了。

《TMT時報》的記者也對文心一言、通義千問、訊飛星火的商業文案能力做過測試。

文心一言:

通義千問:

訊飛星火:

文心一言雖然洋洋灑灑寫了不少,不過作為海報文案還需再精簡一番;通義千問整體表現不錯,不過相對更側重中秋,而失了商業主體的主導作用;訊飛星火完成度依舊出色,也更突出所設定的AI醫療公司的保護健康的作用,是可以直接拿來使用的程度。

其實訊飛星火在落地應用方面,還做出了不小的嘗試。

訊飛星火升級到V1.5版本后,新增了星火助手功能,人手一個賈維斯不再是幻想。

目前經審核上傳的星火助手多達500多個,遍及各個行業和細分領域,還支持自己創建,并不斷調試出符合自己需求的專屬小助理。

除了我們比較能想象到的日常辦公,筆者對其中的腦暴部分更加感興趣,比如這個“小說靈感記錄員”。

從動物社會結構,到智慧與力量的平衡,再到文化傳承等等,這對創作類相關行業的增益可想而知。

星火助手發布時間還并不長,整體來看,仍有不少需要調試改進的地方。

不過,隨著時間的推移,星火助手在落地能力以及前景等方面已經展示出了相當的潛力。

4、尾聲

中國科學技術信息研究所發布的一份報告顯示,從全球已經發布的大模型分布來看,在大模型數量上,中國和美國超過全球總數的80%,中國從2020年進入大模型快速發展期,目前與美國保持同步增長態勢。

除了大模型,應用端也呈現出爆發式增長的態勢。

中國經營報在3月的一篇文中提到,天眼查數據顯示,截至當時,人工智能相關企業258.8萬余家,其中,2022年新增注冊企業73.2萬余家,新增注冊企業增速41.5%;近三年(2020~2022年)人工智能相關企業新增注冊企業增速均超過40%。

大模型以及大模型相關的企業,正在如雨后春筍般涌現。

時代的機遇下,作為國產大模型的重要代表之一,訊飛星火也已經隱隱有了燎原之勢。

關鍵詞:

最近更新

關于本站 管理團隊 版權申明 網站地圖 聯系合作 招聘信息

Copyright © 2005-2023 創投網 - www.extremexp.net All rights reserved
聯系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3