挑戰CET6翻譯考試的機器翻譯系統
日前,合肥師范學院舉辦了一場特殊的考試。說它特殊,是因為“考生”只有一個,而且是一套機器翻譯系統。考題來自三天前剛結束的大學英語六級(CET6)考試,評分的是兩位具有六級閱卷經驗的高校資深專家。“考生”一口氣做了三道翻譯題,每道題滿分15分,它得到13分的均分,每題用時只有5秒。“這套機器翻譯系統的表現讓我們驚喜,翻譯得很地道。”對于成績,專家的鑒定是:優秀!
看似普通的系統背后,是機器翻譯領域近一個世紀的技術積累,也包含著科大訊飛創新實現的領域翻譯技術突破以及最新推出的行業翻譯解決方案。
大學英語六級翻譯測試共有三道考題。按規定,考生們只需作答一題,時間是半小時。
詞匯量是第一需要具備的,目前六級詞匯量要求達到6000個,其中不乏生僻詞匯和短語;由于漢英間表達習慣的不同,邏輯、語序調整也十分重要。
科大訊飛團隊12月14日就將機器和系統封存在公證處,“此舉旨在確保在斷網和無人工干預的情況下測評。”科大訊飛負責機器翻譯的研發人員說。12月18日,在公證人員的見證下,考官分別打開三道考題,由人工輸入電腦后系統作答,不到5秒便導出了文本。
成績令人驚喜:每道題取三位評分專家的平均分,再計算三道題的平均分,最終機器翻譯系統拿下13分。參考往年大學英語六級翻譯考題的表現,可達到優秀六級考生的水平。
現場兩位評分專家來自上海交通大學外語學院,“這套系統翻譯出來的語言質量很高、語法也很地道,表現好過預期。”她們給出的評價稱:機器翻譯能準確表達原文意思、譯文流暢、結構清晰,可以較好地輔助不同語言的信息溝通。
“到目前為止,機器翻譯到底達到了什么樣的水平,還沒有人能夠給出明確答案。”科大訊飛負責機器翻譯的研發人員說。
據了解,科大訊飛自2012年啟動機器翻譯的研發工作,目前很多技術已達到世界領先水平。2014年,在IWSLT口譯翻譯比賽上就取得了中英互譯的第一名;2015年NIST國際openMT機器翻譯比賽,中英人工主觀分獲得冠軍;剛剛過去的2018年IWSLT比賽,在端到端的語音翻譯上再次以顯著優勢取得第一名。
“但機器翻譯還是很難,主要是其處理的對象——自然語言存在復雜性。”研發人員介紹,自然語言是人類在社會生活中,通過不斷的重復性使用而自然進化形成的溝通媒介(語言),并且在此過程中缺少規劃和設計,使得語言本身就存在諸多不確定性,“同樣一句話,在不同的語境中不同人就有不同的理解”。
機器翻譯系統何以在大學英語翻譯權威評測中獲得好成績?
“一是核心算法,二是大規模語料庫,三是高性能計算平臺。”研究人員介紹,機器翻譯技術是利用計算機把一種自然語言翻譯成另一種自然語言,從1933年正式被提出開始,目前已發展有三代技術、取得了長足的進步。
“最新一代技術是基于端到端的神經機器翻譯。”神經機器翻譯算法的提出,是當前機器翻譯取得重大突破的關鍵。但想拿到高分,少不了“獨門秘籍”。
“六級翻譯題涉及文化、經濟、歷史、社會等多領域,還有不少專業表達或中國特色詞匯,在整個翻譯系統可供訓練的語料中是比較匱乏的。”科大訊飛為了破解這一難題,對神經機器翻譯進行若干改進,其中一項重要改進是領域翻譯技術,即在通用翻譯模型之上進行了領域定制。
“翻譯中常會遇到行業術語,有的機器可能沒有見過、有的見過卻在不同行業有不同翻譯方式。”科大訊飛給出的解決方案是:提前將行業領域的關鍵詞匯融入翻譯模型,指導機器在平日訓練中自動學習術語,從而在翻譯過程中產生正確的譯文。
早在2016年,科大訊飛就發布了訊飛翻譯機產品,并在業界第一個推出了純離線的神經網絡的離線口語翻譯系統。而今,訊飛翻譯機的用戶遍及全球170個國家。
未來,有了最新的翻譯技術,它們會有什么改變?
在某跨國醫療技術峰會現場,你可以拿出最新升級的訊飛翻譯機2.0,和與會外賓專家暢聊。從“口袋里的翻譯官”升級為“行業翻譯官”,這臺小機器在通用翻譯模式下新增行業翻譯模式,正是使用了該技術;除了金融,在醫療、計算機等行業專業場景下都可以實現中文與英文的及時互譯。
讓人類更便捷的交流、更輕松的工作,機器翻譯技術的發展也正在實現著用人工智能建設美好世界的愿景。
關鍵詞:
您可能也感興趣:
為您推薦
深圳最低工資標準調整為2360元/月 失業保險金為2124元/月
遼寧實施失業保險省級統籌 對缺口核定等作出詳細規定
部分保險公司推出隔離險 理賠卻存在諸多限制
排行
最近更新
- 高端消費品牌開啟漲價潮,大牌還能“笑”多久?
- 百世進入“減法”梯隊 能否堅守當前的道路仍未可知
- 入場容易盈利難,團車造車想要站穩腳跟需要具備什么樣的能力?
- 爾旭大宅新型材料研產銷一體化,創新綠色新建材
- 兒童打鼾、張嘴睡覺要注意了 睡眠障礙將損害身體健康
- 8年開出4000多家門店,俏妃經期護理緣何成為女性剛需
- 預防大于治療,俏妃經期護理喚活女性生殖健康自生力
- 俏妃經期護理憑何為女性健康筑起防火墻
- 檳榔產業發展峰會展開,問道九五之尊品牌引領行業高質量發展
- 黑龍江科技招商大會大慶專場舉行 推動科技成果落地轉化
- 大事件 | 松偉官宣高圓圓為代言人,疊加億級高鐵投放
- “網紅”隔離險買易賠難?是營銷噱頭還是真保障
- 百億私募巨頭林利軍屈身道歉表信心,“少數”投資人為何不買賬?
- 雅居樂擬18.44億元向中海出售廣州亞運城26.66%股權
- 2021年中國跨境資金流動有序 國際收支自主平衡
- 時隔九年,娃哈哈再做醬酒,這次能成功嗎?
- 2025年中國綠色低碳循環發展消費體系將初步形成
- 銷量連續7年居世界首位 新能源汽車有望加速增長
- 一張滑雪票蘊藏無限商機:冬奧會點燃冰雪消費
- 綠城服務盈利增長不及預期 野村將其目標價由12.5港元下調13....
- 銀保監會規范銀行服務市場調節價管理:劃出五條紅線
- ?17家酒企上榜2021年綠色工廠名單
- 麥當勞在推特上發了一個手勢,要痛失韓國市場了?
- 衛生間如何進行清潔消毒?北京疾控:要注意4個環節8個方面
- 上海發布生物醫藥產業發展規劃 到2025年產業規模將超萬億元
- 上海:去年科技信貸授信規模1583億元,科技保險助力科研穩發展
- 中國癌癥防治十大建議發布 公眾應改變多種不良生活方式
- 火山有色加強服務傳統企業
- 螞蟻集團股票有哪些?相關螞蟻集團股票龍頭一覽
- Buck電路原理