刷新大模型世界觀
近日,OpenAI宣布,安卓版ChatGPT已正式上線。在連續幾個月ChatGPT的網站與移動客戶端的全球流量(PV)環比持續下降的情況下,安卓版ChatGPT的推出能否讓OpenAI再度引爆市場?
ChatGPT只是露出海平面的冰山一角,實際上由生成式AI、大模型等激發的新一輪AI應用熱潮一直在持續升溫,且影響極其深遠。從2022年底ChatGPT的爆火開始,人們對大模型本身的關注度不斷高漲,國內形形色色的大模型也不斷涌現。如今半年多過去了,人們對于大模型已經見怪不怪,反而對大模型如何與行業場景相結合并加速落地傾注了極大的熱情。
(資料圖片僅供參考)
中國科學技術信息研究所發布的《中國人工智能大模型地圖研究報告》顯示,截至2023年5月28日,國內10億級參數規模以上的基礎大模型至少已有79個。所謂的“百模大戰”已經箭在弦上。迎接數智化時代的到來,通用模型與垂類模型會相互傾軋還是各領風騷?算力、數據與基礎軟件三大要素的同頻共振,將是決定大模型落地的關鍵?回答這些問題,從AI企業到行業用戶,將持刷新大模型世界觀。
“壟斷派”與“擴散派”之間的博弈
大模型真的“大”到高不可攀嗎?實際上,業界關于大模型的研究早已有之,只不過ChatGPT是最先產品化并實現商業落地的。回顧歷史,在擁有絕對技術代差的情況下,Google搜索引擎確實具有一枝獨秀的資本。另一個例子,曾經名噪一時的Netscape瀏覽器,在推出后差不多一年半的時間內幾乎壟斷了整個市場,但最終還是不敵IE瀏覽器,黯然退出了歷史舞臺。由此可見,如果在技術上沒有絕對的代差,那么由產品飛輪帶來的紅利能夠維持多久,需要打上一個大大的問號。說回到ChatGPT,OpenAI利用產品飛輪拉開的差距,或許還不足以成就其市場壟斷地位。換句話說,在沒有絕對技術代差的情況下,僅依靠產品飛輪帶來的暫時領先,是有其脆弱性的。國內大模型廠商的迅速崛起與產品上的持續迭代也證明了這一點,國內外在大模型研發上的差距正逐漸縮小。
大模型市場上漸漸形成了兩大陣營——一方是以OpenAI為代表的“壟斷派”,它們擁有核心技術,以自有大模型為殺手锏;另一方可以稱作“技術擴散派”,包括芯片廠商、云算力廠商和數據基礎軟件廠商等,它們是AI生態中的一份子,致力于為大模型的落地、AI應用的普及提供必要的支撐。
大模型的出現是AI技術上的一次突破,是眾多技術中的一個里程碑中。以此為契機,每個企業都可以擁有或建立屬于自己的大模型,從而更好地達成自己的商業目標。九章云極DataCanvas董事長方磊指出,相比曾經的搜索引擎市場的博弈,大模型的壟斷派和技術擴散派之間的博弈很可能是一個更加長期、復雜、激烈的過程,在此過程中,給每個企業和組織帶來的影響也會更加深遠和深刻。有足夠技術能力的企業可以開發自己的大模型,而不具備單打獨斗能力的,則可以借助開源社區的力量達成目標。從長遠來看,大模型終究會成為業務創新的剛需,但是獲取的途徑可以是多樣化的,同樣用戶的選擇也是多元化的。
ChatGPT、大模型積極的意義在于,它讓我們真實感受到,原來一些不敢想、不敢做的事情,現在已經有技術可以勝任。特別值得一提的是,大模型對算力、云和基礎軟件帶來了顛覆性的影響。在云計算的上半場,主力是移動互聯網,支持的主要是帶寬密集型應用,比如網站、APP等,其最突出的需求是彈性擴容能力。在這個階段,公有云是重帶寬而輕算力的。但是進入云計算的下半場,隨著AI浪潮的又一次興起,整個市場的驅動力變成了算力,人們追求的是更高的效率和更低的成本。比如,完成一次大模型的訓練是400萬元還是500萬元,這才是人們關注的焦點。“云計算邁入‘深水區’,算力和PaaS的銷售比例將越來越高。”方磊表示,“‘算力即是國力’。在‘東數西算’剛提出來時,有人可能會質疑,真的需要這么多的算力嗎?但是在進入以AI為驅動的算力密集型應用時代,人們不禁會感慨,‘東數西算’這一釋放算力需求的舉措真的是高瞻遠矚。由AI驅動的中國算力建設會掀起一次真正的‘狂飆’。”
對于大模型的落地而言,基礎軟件是重要的前提。這也是為什么越來越多的軟件廠商在大數據平臺、向量數據庫、湖倉一體等方面加大投入力度的重要原因。以前,基礎軟件存在較大的性能與成本上的差異化。因此,軟件、模型與硬件的統一優化空間巨大。“強大而靈活的基礎軟件、開放彈性的白盒模型,再加上精通業務的專業人才,將加速實現大模型落地‘最后一公里’的跨越。”方磊表示,“為此,我們重磅推出了AIFS(AI Foundation Software)人工智能基礎軟件 & DataPilot數據領航員產品體系,為AI應用的落地夯實基礎設施平臺。”
通用模型、垂類模型相輔相成
2023年3月,彭博社發布了專為金融領域打造的大型語言模型(LLM)BloombergGPT。它基于彭博社的金融數據源,以開源的GPT-3框架為基礎,構建了一個3630億個標簽的數據集,能夠更好地處理金融領域的數據和任務。通用大模型與面向行業和企業的垂類大模型,誰能在商業市場上最先叫響?
“有券商曾經向我們咨詢,能否一起開發一個類似BloombergGPT的證券行業大模型?”有一段時間,方磊一直被客戶類似的詢問所包圍。從需求方來看,確實有一些大型央企以及金融行業頭部企業對大模型非常感興趣。一方面,出于業務創新的考慮;另一方面,也是因為“數據邊界”問題,由于與業務密切相關的私域數據不能“走出”公司,因而無法直接采用通用大模型,所以希望構建屬于自己的垂類大模型。
從供給方來看,比如云算力廠商,就非常希望與九章云極DataCanvas這樣的基礎軟件廠商合作,推出打包的整體解決方案,讓大模型的訓練更具效率且成本更優。而這也正好契合了九章云極DataCanvas自身的定位,即“云中云”,為云算力廠商帶來基礎軟件方面的增值,便于行業用戶訓練自己的垂類模型。
Databricks于2023年4月12日發布了Dolly 2.0。據稱這是業內第一個開源的、遵循指令的LLM,用戶可在透明且免費提供的數據集上進行微調,從而構建自己的商業應用程序。這也給了同類AI基礎軟件廠商很大的啟示和信心,通過構建和優化AI基礎設施、數據平臺和提供參考大模型,就能讓行業客戶更簡單、快捷地打造屬于自己的垂類大模型。
在大模型狂飆了半年多以后,人們對于通用大模型與垂類大模型的構建、部署和應用有了更深刻的認知,慢慢形成了一種共識:通用大模型會漸漸收斂,就像公有云那樣大浪淘沙,最終市場上只剩下最強的幾個;而市場上更多的則是面向行業和企業的垂類大模型。從未來發展趨勢看,在開源的以及通用可參考的大模型之上,融入更多行業知識和企業經驗的垂類大模型將層出不窮。行業龍頭企業研發大模型,而中小企業在其上直接開發應用,或許將成為一種定式。
一種更切合實際的作法是像九章云極DataCanvas那樣,“大小均涉及”。作為一款行業領先的人工智能應用構建基礎設施平臺, AIFS覆蓋了大模型的訓練、精調、壓縮、部署、推理和監控,以及小模型的全生命周期過程,為數據科學家、應用程序開發人員和業務專家提供了一套工具,使不同角色的人員能夠相互協作,輕松處理數據并使用這些數據來開發、訓練和部署任何規模的模型。一句話, AIFS旨在為用戶自主構建全生命周期的“大+小”模型提供一站式支持。方磊表示:“我們致力于打造人工智能基礎設施,既要為企業構建個性化、自主的大模型賦能,又可以將大模型與以往積淀的小模型相融合,應用于業務。”
大模型確實威力巨大,但它是否可以放之四海皆準,解決一切問題呢?從目前來看,一些巨大的場景、尖端的應用,還是要采用專用系統,而碎片化的場景或者解決一些長尾的to C方面的問題,則更適合采用通用大模型。說到底,專與精是兩類不同的需求。一些行業的細分需求,寄希望于通過對通用大模型進行微調就能解決問題,實際上并不可行。一方面,通用大模型并一定具備特定行業所需的能力;另一方面,即使你想對大模型進行微調,可能也會因為大模型本身過于‘沉重’,而力不從心。從這個角度說,垂類大模型是有其存在和發展的必要性。
AI普惠化 任重道遠
眾所周知,微軟已經在Azure、Microsoft 365以及多款開發者工具中融入了人工智能功能。近日,微軟首席財務官Amy Hood在一次分析師電話會議上表示,公司未來還將進一步增加數據中心建設成本,以便更好地支撐人工智能服務。不僅是微軟,也不僅僅是美國華爾街,而是全世界都在熱切期待,生成式AI能夠為企業帶來真正的收益和增值。
今天,越來越多類ChatGPT的大模型正在不斷推出或在孕育之中,展現出巨大的技術和商業潛力,但欠缺的是足夠豐富的應用場景,以及開放的、安全可靠、高效的人工智能基礎設施。“現階段,大模型的應用還是由創新驅動的,并非完全由業務驅動。”方磊表示,“大模型的普惠化是當務之急。”
國內外主流的云廠商不僅推出了自有的大模型,更為大模型的落地提供了完善的支撐,既有產品和服務層面的,也有生態、渠道方面的。比如,亞馬遜云科技在近日舉行的紐約峰會上宣布,推出7項生成式AI創新,包括Amazon Bedrock新增基礎模型供應商Cohere和全新基礎模型,Amazon EC2 P5實例正式可用,Amazon OpenSearch Serverless支持全新向量引擎,編程助手Amazon CodeWhisperer與Amazon Glue實現集成等。
IDC發布的《IDC中國AI公有云服務市場份額,2022》報告顯示:2022年中國AI公有云服務市場呈現出80.6%的正增長,整體市場規模達79.7億元。生成式AI、大模型等新的能力在公有云上將實現更快的更新迭代。
“大模型時代需要完整基礎設施升級,而不是依靠單個大模型解決所有問題;大模型的落地將解決更困難的問題,引起更深遠的影響,而它并不比小模型更容易。”方磊如是說。
大模型帶來的顛覆性并不只體現在大模型本身,而是將引發算力、數據、基礎軟件的一次最深刻的變革。未來,不管大模型如何演進迭代,高性能的基礎軟件與數據架構都是不可或缺的“底座”,在AI惠普化的進程中發揮基礎與核心的作用。包括九章云極DataCanvas在內的眾多致力于AI普惠化的廠商,將軟件工具和解決方案作為賦能廣大行業用戶的抓手,持續融入前沿AI創新技術,助力其在大模型時代加速實現自主的數智化升級和AI規模化應用。
毋庸置疑,大模型應用終將走向普惠化。但在獲得技術紅利的過程中,人們也不得不在安全、監管、合規等方面投入更多精力。負責任地使用AI,將規范、引導大模型又快又好地落地。
關鍵詞:
您可能也感興趣:
為您推薦
小摩:收購捷普工廠后 比亞迪電子(00285)進一步深入“果鏈”
共話中國經濟新機遇丨專訪:中國可持續城市發展值得外資企業長期投入——訪瑞典恩華特集團首席執行官兼總裁卡爾松
國內首款商用可重構5G射頻收發芯片研制成功
排行
最近更新
- 刷新大模型世界觀
- 臨近開學 文具盲盒成“刺客”?當心別“刺傷”了孩子!
- 匯鴻集團: 公司外銷出口業務主要以美元和歐元結算。人民幣貶...
- 社區團購“死傷無數”,美團優選憑啥突圍?
- 保單連續兩年增速超過百分之八十 寵物保險市場持續升溫
- 宣城推行知識產權全生命周期服務
- 上海“你點我檢”踐行“人民城市”理念獲好評
- 房間網線插座怎么接(網線插座怎么接)
- 內蒙古自治區雜糧雜豆科技創新成果轉化中心揭牌
- 確保正常開學安全開學
- 預警升級!超強臺風“蘇拉”正在逼近,廣深港高鐵等列車將停運
- 速遞丨硬臥下鋪別人能不能坐?12306回應
- 海口:近3萬公頃濕地裝點百姓幸福家園
- 拓維信息:控股股東減持計劃終止
- 光刻膠概念股異動拉升,容大感光漲超10%
- 潘功勝:要暢通民營企業股、債、貸三種融資渠道
- 看圖get低碳生活新時尚,長沙市生活垃圾分類宣傳海報金銀銅獎出爐
- 秋天是一幅大寫意
- 夏末秋初市場轉好 港口煤價不會深跌
- 開學前夕,天山路街道為困境兒童送去文具禮包!
- 無悔華夏諸葛瑾怎么樣-諸葛瑾技能介紹一覽
- 貴州鎮遠農商銀行羊坪支行開展“禁止違規使用人民幣圖樣”宣...
- 【養生堂】今日17:25播出《誰說幽門螺桿菌只傷胃》
- 轉型升級,ZCAR竹子買車高質量發展穩增長
- 《蜂巢》設計顧盼,把浦叢當棋子,隱而未出的他,才是布局之人
- 迎來總是熱鬧、送往大多無聲,或許離別后第二賽場見呢!
- 北京地鐵兩條年底通車線路開始空載試運行
- 百度助奉節搭上“數字經濟快車”
- 自己交社保和公司交社保的區別是什么,如下
- TP-Link推出多款Wi-Fi 6E無線路由器 Wi-Fi 7正在路上