視覺語言模型來了:支持中英文等多種語言
(資料圖片)
阿里云今日發(fā)布了大規(guī)模視覺語言模型Qwen-VL,并已在ModeScope平臺上開源。此前,阿里云已經開源了通用模型Qwen-7B和對話模型Qwen-7B-Chat。 據介紹,Qwen-VL是一款支持中英文等多種語言的視覺語言模型。與以往的視覺語言模型相比,Qwen-VL不僅具備圖文識別、描述、問答和對話的基本能力,還新增了視覺定位和圖像中文字理解等功能。 Qwen-VL以Qwen-7B為基礎,引入視覺編碼器,使模型支持視覺信號輸入。該模型支持的圖像輸入分辨率為448,而此前開源的LVLM模型通常僅支持224分辨率。 官方表示,Qwen-VL可用于知識問答、圖像標題生成、圖像問答、文檔問答、細粒度視覺定位等場景。在主流的多模態(tài)任務評測和多模態(tài)聊天能力評測中,Qwen-VL的表現遠超同等規(guī)模的通用模型。 在Qwen-VL的基礎上,通義千問團隊使用對齊機制,打造了基于LLM的視覺AI助手Qwen-VL-Chat,以便開發(fā)者快速搭建具備多模態(tài)能力的對話應用。 通義千問團隊還表示,為了測試模型的多模態(tài)對話能力,他們構建了一套基于GPT-4打分機制的測試集“試金石”。在對Qwen-VL-Chat及其他模型進行對比測試后,Qwen-VL-Chat在中英文的對齊評測中均取得了開源LVLM最好的結果。
關鍵詞:
您可能也感興趣:
為您推薦
水仙花簡譜怎么唱
蓮都區(qū)非物質文化遺產保護中心(關于蓮都區(qū)非物質文化遺產保護中心簡述)
官方推出姜子牙奧特曼和哪吒奧特曼,特攝迷罵聲不斷:就像縫合怪
排行
最近更新
- 視覺語言模型來了:支持中英文等多種語言
- 高瀾股份2023年上半年凈利-223.35萬 由盈轉虧
- 中學小賣部5年租金超900萬 這意味著什么?
- 名臣健康股東劉曉偉減持221萬股 套現約7343.83萬 2022年公...
- 2023年服貿會新變化有這些?
- 入住人才公寓后工作變動會影響居住嗎?
- 2023中信銀行武漢分行零售市場經理助理薪資待遇
- 弘陽服務(01971)委任翁美儀為聯席公司秘書等職
- 曼聯國米搶拜仁棄將,取決于1人!滕哈赫:馬奎爾是大英第一中衛(wèi)
- Multinationals on China丨CEO of Menarini China: Chi...
- 2023南拳媽媽“計劃重逢”天津站觀看攻略
- 重慶干杯節(jié)有哪些福利可領
- 南寧買房提取公積金流程
- 2023年服貿會金融服務專題打造“一站式金融盛會”
- 青島雙瑞船舶尾氣二氧化碳捕集系統(tǒng)獲LR及CCS船級社AIP證書
- 蘇州鮮肉月餅哪家好
- 焯水不是簡單煮一下!這6類必須焯水的食物 你可能一直都沒焯對
- 子洲:山區(qū)農業(yè)筑牢鄉(xiāng)村振興根基
- 【新聞快報】聊城舉辦首屆射箭射擊項目比賽
- 派林生物:靜注人免疫球蛋白獲得巴基斯坦藥品注冊證書
- PS掌機獨有技術讓延遲更低 玩家:可還是不能帶出門
- 云南能投發(fā)布上半年業(yè)績,凈利潤2.98億元,同比增長69.08%
- 夯實孩子關愛守護屏障,《蛋仔派對》多維度打擊網絡詐騙
- 2023年河南省博物館開放時間
- 量化組合:黎明前的黑暗!市場存在見底跡象
- 高鐵乘客突發(fā)疾病6名醫(yī)生出手:聽到廣播后就跑向患者車廂
- 天隴鐵路全線逾八成橋梁隧道 “蹚河跨江”打通甘肅南向通道
- 《我不是藥神》“白血病少年”飾演者捐髓背后|面孔
- 中方反對日本排海計劃的科學依據是什么?外交部回應
- 男子“采購”香煙倒賣, 賺錢不成倒賠了2萬