百度重磅發布百度語言與知識技術系列產品和數據集共建計劃
自然語言理解(NLP)素有“人工智能皇冠上的明珠”盛譽,這也意味著語言與知識等認知層面的技術突破將進一步促進AI深入發展。
8月25日,以“掌握知識、理解語言、擁有智能”為主題的百度大腦語言與知識技術峰會舉行,百度CTO王海峰發表主旨演講,解讀百度語言與知識技術的發展歷程與最新成果,與產學研各界分享技術及產業發展趨勢和展望,百度集團副總裁吳甜和百度技術委員會主席吳華分別發布百度語言與知識技術系列產品和數據集共建計劃,重磅推出5款產品的新發布,全面加速AI技術大規模應用。這是一場凝聚了百度在語言與知識領域十年技術積累和產業實踐的盛會,必將帶來深遠影響。
百度CTO王海峰
十年:開拓者、深耕者、引領者
語言與知識技術是人工智能認知能力的核心。2010年,百度成立自然語言處理部,在前瞻技術與產業格局上不斷引領、創新,十年間已成為中國NLP發展的一面旗幟。
峰會上,王海峰回顧,“在百度語言與知識技術的布局和發展中,我們始終在注意把握兩個趨勢,即技術發展趨勢和產業發展趨勢,并力爭引領趨勢。”
縱覽百度語言與知識技術發展歷程,從研究方法、研究對象、研究方向、產業應用等各個層面,布局完整,不斷打磨成熟,始終與應用的發展趨勢、需求一脈相承,與產業接軌。
十年來,百度大腦語言與知識技術成果豐碩,獲得包括國家科技進步獎在內的20多個獎項,30多項國際競賽冠軍,發表學術論文超過300篇,申請專利2000多項。技術不斷突破創新的同時,也在產品上創新探索,同時將領先的技術輸出給開發者與合作伙伴,提升各行業智能化水平。
全面分享語言與知識技術成果
王海峰全面分享了百度語言與知識技術完整布局和最新成果。
首先,知識圖譜是機器認知世界的重要基礎,百度打造了世界上最大規模知識圖譜,擁有超過50億實體和5500億事實,并在不斷演進和更新。百度知識圖譜應用于各行各業,每天的調用次數超過400億次。
其次,在融入知識的基礎上,語言理解能力不斷增強。2019年3月,百度提出知識增強的語義理解框架ERNIE,在深度學習的基礎上融入知識,同時具備持續學習能力,曾一舉登頂全球權威數據集GLUE榜單,首次突破90分大關,刷新榜單歷史?;谥R圖譜和語義表示,突破了閱讀理解、對話理解以及跨模態深度語義理解等技術。
第三,語言生成是語言與知識技術中的重要組成部分。基于預訓練技術的成功經驗,百度提出基于多流機制的語言生成預訓練技術,兼顧詞、短語等不同粒度的語義信息,顯著提升生成效果。百度也探索了多文檔摘要生成,通過圖結構語義表示引入篇章知識,在單文檔和多文檔摘要生成效果都有提升。
應用系統層面,對話系統和機器翻譯等成績卓著。百度提出了知識圖譜驅動的對話控制技術,以及首個基于隱空間的大規模開放域對話模型PLATO等,并推出智能對話定制和服務平臺UNIT,幫助開發者高效構建智能對話系統,實現規模化應用。百度翻譯支持200多種語言,每天響應超過千億字符的翻譯請求,支持超過40多萬家第三方應用,技術上,提出了多智能體聯合學習、基于語義單元的同傳模型、稀缺語種分組混合訓練算法等。
百度大腦語言與知識技術的持續探索和創新取得了令業界矚目的成績,同時這些技術以平臺化的方式輸出,賦能千行萬業,持續提升產業智能化水平。
重磅推出5款產品的新發布、2大計劃
王海峰首次發布了百度大腦語言與知識產品全景圖。百度集團副總裁吳甜接續發布語義理解技術與平臺文心、智能文檔分析平臺TextMind和AI同傳會議解決方案3大新產品,同時發布了6項升級,包括智能創作平臺的3個場景方案、以及智能對話定制與服務平臺UNIT的3項全新升級。
百度集團副總裁吳甜
吳甜表示,“我們一直致力于將語言與知識技術凝聚成一系列技術平臺和產品,在應用中產生大量價值,為廣大開發者和產業實踐者提供以語言與知識技術為核心驅動的系列產品。”
百度推出的語義理解技術與平臺文心,基于深度學習平臺飛槳打造,依托領先的語義理解核心技術,集成優秀的預訓練模型、全面的NLP算法集、端到端開發套件和平臺,提供一站式NLP開發與服務,讓開發者更簡單、高效地定制企業級NLP模型。文心經過了大量真實應用場景的淬煉,具備優秀的工業級落地實力。
全新發布的智能文檔分析平臺TextMind,基于OCR、NLP技術,以文檔解析為核心能力,支持文檔對比與文檔審核,具備“多快好省”的核心優勢,促進企業辦公智能升級。
百度大腦智能創作平臺針對媒體應用場景再升級,全新推出智能策劃、智能采編、智能審校三大媒體場景方案,進一步助力媒體人更快、更好地創作,可謂切中媒體人的“痛點”。
智能對話定制與服務平臺UNIT升級3大特性:更智能的任務式對話理解、極致便捷的表格問答和融合通用的新對話引擎。此次UNIT全新升級的三大能力,將進一步降低任務式對話、智能問答的定制成本,并融合通用對話能力,提升交互體驗。
全新發布的AI同傳會議解決方案,覆蓋會議全場景、全流程,旨在打造用戶隨身的“會議同傳專家”。吳甜現場展示了如何只用一臺電腦和一部手機快速搭建一套同傳服務,只需點點鼠標、打幾個字,就能快速獲得專業的同傳服務。
數據匱乏、算力不足歷來是語言與知識技術研發中面臨的瓶頸。為突破瓶頸,百度聯合中國計算機學會、中國中文信息學會發起中文自然語言處理數據共建計劃——千言,解決數據稀缺問題。千言一期由來自國內11家高校和企業的數據資源研發者共同建設,已涵蓋開放域對話、閱讀理解等7大任務,20余個中文開源數據集。
百度技術委員會主席吳華表示,“未來,我們希望有更多的數據集作者能夠參與共建千言,共同推動中文信息處理技術的進步,建設世界范圍的中文信息處理影響力。我們計劃在未來3年,面向20多個任務,收集和建設不少于100個中文自然語言處理數據集,覆蓋語言與知識技術全部領域。”
吳華還發布了百度語言與知識技術算力共享計劃,通過百度AI STUDIO平臺提供算力支持,讓廣大開發者破除算力桎梏,專注于技術創新。
十年征程,百度語言與知識技術發展歷程中培養、吸引了大量全球頂尖人才。會上,百度推出以王海峰為代表的百度NLP“十年十人”,十年堅守,不忘初心,秉持“技術信仰”,勇攀技術高峰,矢志不渝致力于讓機器更好地理解世界、更好地服務于人。
正如王海峰所言,“我們致力于更好地與學術界、產業界攜手,推動語言與知識技術發展,進而推動人工智能技術持續進步,為產業智能升級、社會經濟高質量發展貢獻力量。我們對未來充滿信心,堅持研究和發展讓機器掌握知識、理解語言、擁有智能,繼續突破和創新,為技術和社會進步做出更大貢獻。”
關鍵詞: 百度發布百度語言與知識技術
您可能也感興趣:
為您推薦
8家險企股權被掛牌轉讓,為何險企股權不再被追捧?
深圳最低工資標準調整為2360元/月 失業保險金為2124元/月
遼寧實施失業保險省級統籌 對缺口核定等作出詳細規定
排行
最近更新
- 第五屆金匠獎獲獎榜單
- 鏡外之境 國際當代攝影展”在遇見博物館·in Space開展
- 榕樹貸款以科技創新為本 助力金融數字化轉型提速
- 深度回顧2021:創新+品質,歐恩貝打造消費者信賴國產奶粉品牌
- 瑞豐農商行去年營收增長10.5% 不良貸款率為1.25%
- 交通銀行增資交銀投資獲監管批復 注冊資本變更為150億元
- 回顧8年的堅定和創新——木婉清集團的前世今生
- 開蓋即飲零添加,木婉清能量飲產品新升級
- 減脂也想吃零食怎么辦?看完木婉清健康餐桌計劃,讓你放心吃!
- ?天虹股份被深交所五連問,股價收“三連板”后大跌
- 誰是下一個九安醫療?“新冠概念”股市造富,偽概念股被爆炒成妖
- 長春高新股價進入下行通道 4個交易日里市值蒸發330億元
- 沒了薇婭競爭,李佳琦更貴了!全網最低價不復存在
- 羅永浩預告年后回歸科技界,耗資6個億的“真還傳”要殺青了?
- 支撐高質量發展 21年北京固定資產投資增長4.9%
- 地方經濟年報陸續出爐 地方穩增長舉措蓄勢待發
- 工信部:針對中小企業發展再出紓困幫扶政策
- 流通領域首個五年規劃出爐 加快資源要素流動
- ?明明原價能買票,為何還要購買平臺VIP
- 順鑫農業預計2021年度凈利潤同比下降80.95%-73.81%
- 京東科技境外首次公開發行股份申請已獲證監會接收材料 消息...
- 時隔一月 央行開展14天逆回購操作1500億元
- IBM第四季度凈利大漲72% 股價盤后一度飆升7%
- 連虧三年的唐德影視扭虧 去年凈利預計1800萬-2700萬元
- 強監管下,芒果超媒致力轉型能否延續高增長?
- 春節因素提振餐飲旅游板塊 預制菜和冰雪游成新風口
- 保利、招商等合營子公司東莞招商啟越房地產因虛假材料取得商...
- 海關嚴防境外疫情輸入
- 滑雪如何規避風險?這份安全須知一定得告訴孩子
- 年貨寄鄉愁 金龍魚品牌限定芝麻香油為春節增香添味