環球今日訊!誰說搞人工智能一定要大公司?這家不足兩百人的本土公司搞出了垂直應用領域大模型!
作者:電子創新網張國斌
(資料圖)
今年以來,隨著chatGPT的火爆,國內各種互聯網公司、云計算公司、大數據公司紛紛出洞,聲稱自己都在搞大模型,而且一幫自媒體也推波助瀾,為各大公司抬轎子吹號子,似乎只有大公司才能玩轉大模型,但是,大家可能忘了一個基本的事實,那就是,目前火爆的幾家人工智能大模型公司人數并不多!
今年1月,OpenAI創始人及CEO奧特曼透露公司員工人數為375人 ,與谷歌和臉書等科技巨頭從事人工智能工作的數千名員工相比,這是一個很小的數字。“我知道我不應該吹噓OpenAI,我們要感謝我們所有的外包公司為訓練模型提供了必不可少的數據。”而真正在ChatGPT項目中做出貢獻的人員,據OpenAI官網顯示,
共有87人。
該團隊平均年齡為32歲,“90后”是主力軍。華人成為了該團隊中一支重要的科技創新力量,共9人,占團隊總人數的比例超10%。華人學者歐陽龍更是參與了與 ChatGPT 相關的 7 大技術項目中的 4 大項目的研發,是InstructGPT 論文的第一作者,也是RLHF 論文的第二作者。
AI繪畫工具Midjourney的公司竟然
只有10人!
Midjourney繪畫作品:平民窟里的百萬富翁
所以老張認為,在人工智能領域,會走出類似半導體領域fabless的模式:就是小公司專注特色大模型開發,然后利用云算力通過互聯網數據和人類知識體系進行訓練,最后將訓練好的模型用于推理應用。
所以,在大模型應用領域,比拼的是模型的優劣而不是公司的規模,小公司如果開發出好的模型一樣可以完勝大公司!就好比10人不到的一家IC設計公司也可以設計一顆比拼大公司的IC!
在4月18日貿澤電子芯英雄聯盟直播“聊聊ChatGPT以及生成式AI對產業的顛覆”中,直播嘉賓南京云創大數據科技股份有限公司總裁劉鵬教授現場發布了該公司的大模型產品:云創大數據發布cGPT S1000自然語言搜索一體機!,云創大數據公司只有不到200人,其人工智能成果已經在政府、高校等領域廣泛應用!
據劉教授介紹,在人工智能實際應用中,我們常常需要對內部數據進行安全快速的搜索。比如對于企業內部積存的大量檔案、資料、文書等形式的文檔,如果使用傳統的關鍵詞匹配搜索某個特定文件,需要準確輸入文件名,一旦忘記文件名,搜索猶如大海撈針。
針對這一問題,cGPT S1000自然語言搜索一體機應運而生。該一體機在自然語言處理技術的加持下,基于對語句本身的理解,根據計算后的關聯相似度進行排序,可達0.1秒響應,快速篩選出接近語句語義的內容。比如,在專利搜索時,傳統算法只能通過關鍵詞搜索專利,無法查找包含相近含義的所有專利,現在在cGPT S1000自然語言搜索一體機中導入專利數據,經過一體機自動預處理后,即可在0.1秒內找到所有相關專利。
歡迎大家自行搜索體驗!
網址:zl.cstor.cn或識別下圖二維碼體驗:
據他介紹,之所以能夠達到這樣的效果,是因為cGPT S1000自然語言搜索一體機通過人工智能理解了自然語言相互之間的關系。正如以下視頻所展現的,這些詞語、句子之間相互關聯,它們或許是表達方式不同但是含義相同的語句,或許是同一學科領域內的相似概念。通過解讀這些關系,人工智能能夠真正理解自然語言的含義以及人類的意圖,繼而做出相應反饋。
對于資料紛繁復雜的各大企事業單位而言,將所有信息和資料放進cGPT S1000自然語言搜索一體機并通過一體機完成自動預處理,相當于構建了一個高保密的內部資源庫,內部員工可以在庫中快速查找所需信息。
cGPT S1000自然語言搜索一體機是云創大數據針對大規模自然語言處理應用場景,自主研發的高速向量計算搜索一體機。該一體機采用并行計算架構,融合高密度混合服務硬件,為用戶提供軟硬件一體化的高性能自然語言搜索解決方案。cGPT S1000自然語言搜索一體機支持TXT、Word、PDF、CSV等多種格式的數據源,支持對采集的數據源進行文本提取和數據清洗,采用分布式集群架構,智能化自動構建搜索資料庫。用戶只需將海量的業務文件、圖書論文文獻、文本數據等導入該一體機,即可建立個性化的定制搜索引擎
(運行原理)
cGPT S1000自然語言搜索一體機支持基于文本語義理解技術,具備更加準確的檢索能力,能夠將輸入查詢的文本與一體機中的文本進行快速比對,并將搜索到與輸入文本語義相近的多組結果根據相似度排序返回輸出。針對千萬級甚至上億量級的文本數據庫,該一體機依舊可以達到0.1秒級的返回結果速率。
cGPT S1000自然語言搜索一體機基于大數據分布式實時計算框架,結合定制化高密度計算硬件,實現大規模自然語言處理任務的分發與計算結果匯聚,保證計算任務執行的高效和穩定。基于特征向量計算算法以及分布式集群處理資源調度技術,該一體機實現了海量特征庫條件下1:N對比任務的高效分解與并行處理,可將單個任務響應效率提升到0.1秒級。
(總體架構)
劉教授表示,對于不同數據規模需求的用戶,自然語言搜索一體機提供了彈性的性能資源配置模式,可以有效地控制系統建設成本,靈活滿足千萬甚至上億量級業務規模的性能需求和使用場景。
它提供API接口,搜索應用可部署至本地服務器或者用戶私有云環境,與用戶業務打通融合的同時,實現內外網的物理隔絕,保障數據的私密性。
cGPT S1000自然語言搜索一體機基于語義理解技術,能夠快速查找需要的內容,可廣泛應用于資料查詢、專利搜索、電子病歷檢索、法律文獻檢索、學術文獻檢索、論文查重等多種場景。
資料查詢
用戶內部積存大量的檔案、資料、文書等各種形式的文檔,檢索資料不僅繁瑣且重復性高,耗費大量時間和精力。通過自然語言處理技術,只需簡短的一句話或幾個關鍵詞,自然語言搜索一體機即可完成資料搜索,命中率和準確率都大幅提高。
專利搜索
通過關鍵詞匹配不一定能夠找出某一主題的所有相關專利,而借助自然語言搜索一體機,可以準確找到已經成功申請的與該主題相關的所有專利信息,包括描述、編號等,從而在專利申請時避免重復申請等問題,大大節省時間和費用。
電子病歷檢索
基于自然語言搜索一體機,在自然語言處理技術的助力下,用戶可建設面向特定醫療領域的知識服務平臺,以此更好地提供電子病例檢索、處方查詢、醫療知識問答等醫療服務。
法律文獻搜索
基于自然語言搜索一體機,用戶可對案件信息進行查詢和梳理,比如針對某一案件,律師通過輸入描述,即可在資料庫中找出相似案例情況以及司法解釋,有助于案件分析、訴訟準備等,司法人員也可借助該一體機節省資料整理、分析的時間。
學術文獻檢索
查閱論文時,根據關鍵詞匹配,可以檢索出不少結果,但主要是包含關鍵詞的內容,不一定是用戶真正需要查找的,而借助自然語言搜索一體機,在準確表達查找內容的情況下,只需一句簡單描述,即可檢索到真正為用戶所需的論文。
論文查重
在論文查重時,針對論文可能存在的不同語種相互翻譯導致的抄襲,或者以替換詞語、改變表達的方式規避查重等問題,借助自然語言搜索一體機,可對其進行準確檢測,以語義為準,及時發現論文寫作時的抄襲、剽竊等亂象。
據劉教授介紹,云創微調的最大模型參數量達到1700多億,可以適合各種垂直領域應用。在本次直播活動中,由于航班延誤,劉鵬教授不得已在機場候機大廳進行直播報告,但報告效果絲毫未受影響,約3000名網友參與觀看。
具體而言,劉鵬教授所作報告主題為《人工智能引領未來》。在報告中,劉鵬教授分享了人工智能近10年的三次大飛躍及其技術本質,并梳理了人工智能技術創新發展對各行各業的影響。在此基礎上,劉鵬教授也介紹了云創大數據在大數據、人工智能領域的技術探索與成功案例。大家紛紛表示,本次報告幫助自己對ChatGPT與生成式AI建立了立體深入的認識,可謂收獲滿滿!
劉鵬教授,清華大學博士,中國大數據應用聯盟人工智能專家委員會主任、中國信息協會教育分會人工智能教育專家委員會主任、教育部全國普通高校畢業生就業創業指導委員會委員、2019年全國大學生數學建模比賽命題人、第45屆世界技能大賽中國區云計算選拔賽裁判長/專家指導組組長、中國電子學會云計算專家委員會云存儲組組長、工業和信息化部云計算研究中心專家、2002年PennySort國際計算機排序比賽冠軍與2003年全國挑戰杯比賽總冠軍。
貿澤電子“芯英雄聯盟”是電子創新網新推出的一檔知識分享型直播欄目,每期直播邀請半導體產業專家與電子創新網CEO張國斌先生共同分享產業趨勢、探討技術未來,助力本土半導體產業創新。
這是本次直播的回放,大家可以掃碼回看:
網址是:https://v.eetrend.com/content/2023/100569672.html
關鍵詞:
您可能也感興趣:
為您推薦
機票里面包含保險嗎?飛機保險有必要買嗎?
遼寧擴大緩繳社保費政策實施范圍 補繳期間免收滯納金
近十年財險業務快速發展 財產保險業風險保障水平不提升
排行
最近更新
- 環球今日訊!誰說搞人工智能一定要大公司?這家不足兩百人的...
- 新品發布丨廣電五舟開發者套件S200I2助力AI開發與落地更簡單
- Elektrobit軟件及服務幫助捷豹路虎夯實下一代車輛軟件架構基...
- 最新快訊!谷雨前后,推薦大家。九道家常菜,健脾去濕氣,記得...
- 雙師科創營結營 騰訊游戲未成年人保護4.0加速發力中
- 余額試算平衡的直接依據是什么?收付記賬法屬于復式記賬法嗎?
- 增值稅為什么由買方出?增值稅怎么計算?
- 蜂鳥快送和藍騎士的區別有哪些?藍騎士怎么加入?
- 全球簡訊:海南離島免稅政策實施12周年:購物金額超1800億元 ...
- 深圳天元中醫肛腸醫院騙人嗎?來看治愈患者的真實評價
- 世界熱門:一掃上場低迷!威少16中9斬獲28+5+5
- 債券投資的交易費用計入什么科目?股票手續費計入什么科目?
- 我家的加濕器霧量很小!怎么辦?
- 我的加濕器,噴的霧很小了,請問怎么修啊?我?
- 加濕器霧變小了怎么處理?_環球快播報
- 世界視訊!加濕器出霧量變小怎么辦?
- 硅膠鼻子能堅持多長時間?
- 每日速看!ZigZag在Arbitrum上線新版訂單簿DEX
- 張家口橋西區:關愛口腔健康 向勞動者致敬-天天播報
- 精選!營養師特別提醒!淄博燒烤很美味,但健康擼串要做到這...
- 春困乏力肝火旺?這份春季飲茶指南請查收 每日聚焦
- 天天動態:國民經濟恢復時期交通銀行的職能與任務(四)
- 天天關注:八部門聯合出臺中醫藥文化建設方案
- 多吃番茄能美白?番茄:臣妾做不到啊~
- 抗日戰爭時期錢幣上的勞動題材(上) 天天時快訊
- 記者手記:主動權牢牢掌握在自己手上_當前速看
- 新冠病毒XBB.1.16流行情況如何?會導致結膜炎嗎?國家疾控局...
- 實地智慧服務:物業或許會淘汰,但社區服務永不過時
- 中醫技術專家孫鳳偉師承清朝御醫道家療法并創新,適合現代人...
- 重慶移通學院淬煉商學院教師編寫案例入選中國工商管理案例中心
今日要聞
- 雙師科創營結營 騰訊游戲未成年人保護4.0加速發力中
- Elektrobit軟件及服務幫助捷豹路虎夯實下一代車輛軟件架構基礎 環球動態
- 環球今日訊!誰說搞人工智能一定要大公司?這家不足兩百人的本土公司搞出了垂直應用領域大模型!
- 新品發布丨廣電五舟開發者套件S200I2助力AI開發與落地更簡單
- 實地智慧服務:物業或許會淘汰,但社區服務永不過時
- 攜手時尚頂流殷桃 浙派集成灶&殷桃的時尚廚房高鐵專列又發車
- 伊膚泉&遠想生物王璨:營銷革新下,數字化營銷揭露醫美新發展
- 億利資源集團光伏治沙助力綠色健康產業鏈發展
- 每日速看!ZigZag在Arbitrum上線新版訂單簿DEX
- 七騰機器人榮獲2022中國機器人行業年度優秀應用案例獎