我們對AI大模型的誤解有多深?|天天信息
大模型可以無所不能嗎?怎樣讓模型少犯錯?企業應該部署多大的模型,一個超級大模型還是一堆專業模型?
(資料圖片僅供參考)
對于這些問題,第四范式聯合創始人、首席架構師胡時偉認為:類GPT模型是高級復讀機,有多少“人工”就有多少“智能”,絕非無所不能。模型100%會犯錯,一味地追求算力和數據并不能解決這個問題,因此模型之上必須要有運營兜底機制,知錯就改。算力決定參數規模,一堆專業模型比一個超級大模型更有落地可行性。
上述觀點源于6月10日新金融聯盟舉辦的“金融機構數智化轉型與大模型技術應用”內部研討會。會上,新金融聯盟學術理事、工商銀行首席技術官呂仲濤,民生銀行數據管理部總經理沈志勇、平安銀行數字資產管理與研發中心總經理劉錦淼也做了主題發言。新金融聯盟理事長、中國銀行原行長李禮輝及中國信通院金融科技研究中心副主任趙小飛進行了點評交流。
56家銀行及非銀機構、55家科技公司的170多位嘉賓通過線上線下參會。會議由新金融聯盟秘書長吳雨珊主持,中國金融四十人論壇提供學術支持。會議實錄詳見→《如何釋放大模型對金融行業的價值?》以下為胡時偉的發言全文,已經本人審核。
企業大模型落地的幾個關鍵問題
文 | 胡時偉
大模型并非“無所不能”
現在各行各業都十分關注大模型這一話題。第四范式在自己的大模型產品“式說”2月份發布以來,與17個行業的114家企業進行了密集與深入的溝通,發現業界普遍對大模型存在一些誤解,需要糾偏。
第一,要相信科學。大家普遍認為大模型已經具備“涌現”能力,可以無師自通。但大模型的能力主要還是源于給它提供了什么樣的數據,并不是直接“涌現”出來的。本質上講,類GPT模型的背后還是機器學習,需要高質量的數據訓練而來,并通過Fine-tuning(微調)進行調優才能實現一些特定的能力。
第二,有多少人工,就有多少智能。生成式AI到底能解決什么問題?通俗地講,從基礎大模型到行業大模型甚至到場景定制,我們目前認為它可以用以完成一份文檔。在一個特定場景下正確地完成一個文檔,一定來自于人反饋的數據。就像GPT要用到非常多維基百科的數據,是因為該數據質量更高。我們行業要做的是,一定要對大模型形成反饋閉環和迭代,即告訴大模型什么是好的,訓練它達到更好的效果。這件事情本質還是依賴人工。
第三,大模型生成一定會出錯。哪怕是GPT-4,在行業專業、嚴肅場景的應用也遠未達到工業可用的效果。這是技術本身的缺陷所致,靠算力和數據也無法從根本上解決這個問題。目前大部分企業的共識是模型之上必須加一層運營機制來兜底。
企業應該部署多大的模型?
企業在大模型落地過程中會面臨一個現實問題——預算有限,預算決定了算力,算力決定了參數規模。
因此,我們需要抉擇:應該部署一個超級大模型,期待它能夠把能力上升到一定程度,還是應該從解決問題出發,部署一堆專業模型,讓它們各司其職。這里面涉及兩個不同的思路。
第一個思路是通過增加參數和堆砌算力,把所有參數都給NLP模型。但從實際落地的角度來看,根據No Free Lunch(沒有免費的午餐)定理,沒有哪一個模型能以最優的方式解決所有問題。如果我們把所有的東西都放在一個模型里,最后會花出極大的代價,超級英雄成本很高,也很難管理。
因此,我個人認為會走向另外一個方向,即Learnware(學件)的思路,我們要做一堆參數過億的專業模型,來組成整體企業系統,這種方式更利于模型迭代、維護,同時更利于控制成本。就如同一家公司里不能都是董秘,還得有銷售、產研、市場等各個專業線。
大模型可實現傳統軟件兩大升級
“介質”同樣是企業落地大模型的關鍵要素。
想象一下,如果沒有APP,推薦算法 能用嗎? 沒有搜索,廣告算法能用嗎?APP和搜索就是推薦算法和廣告算法的介質。同樣, 大模型在企業落地時,企業軟件就是大模型的介質。如果介質沒有革新,只有算法革新,就像是一個人只有腦沒有手。
因此,我們非常需要關注介質層面的革新。企業中大部分工作的完成都需要使用軟件,但是大量軟件交互的方式都非常低效、復雜,現在我們可基于大模型解決兩個升級:
第一,由生成式大模型負責軟件界面的升級。人機交互要變成多模態,通過大模型更強的語義理解能力,可以更直接調用企業內部各種形式的信息、數據和模型。
第二,由判別式大模型負責軟件內核的升級。以前的軟件主要圍繞數據庫做增刪 改查,現在可由判別式大模型對軟件進行智能化升級。
讓大模型成為知錯就改的小助手
由于GPT在技術上存在局限性,因而無法做到百分之百準確,尤其在應用于嚴肅的金融場景時,大模型之上必須要加一層運營體系兜底,讓模型的輸出和操作從不可用變成可用,并且能做到知錯就改。
知錯就改有三個機制疊加保障:一是專家給答案。雖然聽起來不是那么智能,但在專家能給答案的地方一定要給答案,因為這個是最準確的。二是專家給示例,模型進行一定的上下文學習也可以表現更好。三是模型自主學習,基于專家生成的知識反饋給模型,讓模型少犯錯。
生成式大模型加上“執行可控、知錯能改”的運營體系,我們可以期待有一位善于理解、準確執行的工作助手。這位助手需要讓用戶可以清晰了解哪些內容是“100%準確”,哪些是“不確定的”,并且知錯能改。
總體來說,底層大模型不能解決所有問題,介質層及運營機制的革新對于數字化推動作用同樣重要。企業需重新打造決策類AI、生成式AI、應用層、介質層。我們目前探索落地的重點是讓生成式大模型結合介質,圍繞企業數字化轉型的目標,在企業里生成一堆Agent,分別用以查資料、查數據、準確操作軟件等,這可能是當下一個更加貼合實際、可落地的方向。
本文源自:新金融聯盟NFA
作者: 胡時偉
關鍵詞:
您可能也感興趣:
為您推薦
歐股集體低開 英國富時100指數跌0.5%
第三方支付流程說明|快訊
某職業技術學院怎么就成上海職業技術學院了?-環球熱資訊
排行
最近更新
- 我們對AI大模型的誤解有多深?|天天信息
- 安達智能:公司研發的中小型五軸聯動數控機床屬于中高端的數...
- 禹城市首例不動產“帶押過戶”業務落地 環球今頭條
- 廣汽集團:董事會同意向全資子公司廣汽資本有限公司增資5億元...
- 韓國6月前20天出口同比增長5.3%,芯片出口下降23.5%
- “滬”上溫暖,廈門國際銀行“暖心服務品牌日”年度特色活動...
- 即時看!神州細胞: 公司2023年6月沒有股票解禁。謝謝您對公...
- 晶寶股份(430590):擬10派2元,共派現1197.24萬元
- 當前焦點!《摩根士丹利將百度ADR評級上調至超配 目標價190美元》
- 醉駕+肇事逃逸+逆行 民警兩小時內火速破案 全球新動態
- 2比0擊敗巴勒斯坦隊 國足找到比賽感覺 今日熱文
- 麟北煤業公司組織開展世界環境日宣傳活動
- 準備隊多舉措反三違
- 世界熱議:數坤科技毛新生發布6周年公開信:中國科技企業必須...
- 解放思想 全力以赴 實現爭資爭項工作大提速、大突破-環球新消息
- 國內首個航空安全與仿真研究實驗室成立 我國自研完整視景系...
- iPhone16 無緣蘋果自研 5G 芯片
- 熱門線路和車站增開列車 確保端午假期旅客順利出行 每日消息
- “普及金融知識萬里行”民生銀行濟南濼源支行開展反假宣傳活...
- “粽”享快樂喜迎端午—滕州市龍泉街道中心幼兒園開展端午節...
- 岱廟市場監管所組織召開茶葉過度包裝行業培訓暨約談會|當前時訊
- 天天實時:高校回應學生因畢設被送關系戶自殺 家長校門口拉...
- 環球百事通!青海海西:兩名地質測繪人員無人區失聯 多部門...
- 【焦點熱聞】林茂任中央美術學院院長,范迪安不再擔任
- 天天即時看!電動汽車創新產品:萊茵金屬開發出新熱泵即插即...
- 30家!華為向日企收取專利使用費,日媒:任正非清醒來得太突...
- 實時焦點:北水動向|北水成交凈賣出32.63億 理想汽車(02015)...
- 一跨境賭博團伙被昆明警方“團滅”,4家“問題”大眾舞廳被查
- 北海:群眾安全感99.43% 居廣西第一
- 沿河:“粽”享濃情端午 共話強村富民_世界新消息