AI推理實踐丨多路極致性能目標(biāo)檢測最佳實踐設(shè)計解密
摘要:基于CANN的多路極致性能目標(biāo)檢測最佳實踐設(shè)計解密。
本文分享自華為云社區(qū)《基于CANN的AI推理最佳實踐丨多路極致性能目標(biāo)檢測應(yīng)用設(shè)計解密》,作者: 昇騰CANN 。
(資料圖片)
當(dāng)前人工智能領(lǐng)域,最熱門的無疑是以ChatGPT為代表的各種“新貴”大模型,它們高高在上,讓你無法觸及。但在人們的日常生活中,實際應(yīng)用需求最大的還是以Yolo模型為代表的目標(biāo)檢測“豪強(qiáng)”,它們每天都在以各種方式落地、應(yīng)用于我們?nèi)粘I畹姆椒矫婷妗?/p>
目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的一項關(guān)鍵技術(shù),它的任務(wù)是找出圖像中所有感興趣的目標(biāo),確定它們的類別和位置。隨著人工智能潛移默化地滲入人們的生活中,各行各業(yè)競相通過引入目標(biāo)檢測等技術(shù)打開市場空間,關(guān)于目標(biāo)檢測的各類人工智能需求也奔涌而來,比如:
- 在交通領(lǐng)域,目標(biāo)檢測可以用來檢測道路上的行人、車輛、交通標(biāo)志等物體,提升行駛安全和通行便利性。
- 在安全領(lǐng)域,目標(biāo)檢測可以用來檢測關(guān)鍵特征、特定行為或者可疑物體,以便快速發(fā)現(xiàn)和識別安全威脅。
- 在醫(yī)療領(lǐng)域,目標(biāo)檢測可以用來識別身體部位、病灶、心電圖、CT影像等,以便快速輔助診斷。
- 在生活領(lǐng)域,目標(biāo)檢測可以用于智能購物、智能家居等場景,提升人們生活的便利性。
但AI應(yīng)用開發(fā)門檻高,周期長。各類AI軟件棧理解成本高、AI算法模型與業(yè)務(wù)結(jié)合難度高、對開發(fā)人員的技能要求也較高。如何提升AI推理應(yīng)用的開發(fā)效率,降低開發(fā)門檻,是亟需改善的現(xiàn)狀。為此,昇騰CANN技術(shù)專家設(shè)計和開發(fā)了針對目標(biāo)檢測應(yīng)用的最佳實踐,讓開發(fā)者可以在昇騰平臺上快速部署目標(biāo)檢測應(yīng)用,輕松獲得幾十甚至上百路的檢測效果。下面我們就來詳細(xì)拆解一下這個實踐的設(shè)計思路。
基礎(chǔ)應(yīng)用分解
我們首先從一個基礎(chǔ)的目標(biāo)檢測推理應(yīng)用場景開始,推理流程通常包含如下幾個部分:
GPU AI推理業(yè)務(wù)流程
- 數(shù)據(jù)輸入是攝像頭獲取的視頻數(shù)據(jù)流,一般以H.264格式為主。
- 然后通過FFmpeg軟件,將連續(xù)的視頻流進(jìn)行拆幀和解碼。
- 下一階段是對解碼后的圖像進(jìn)行預(yù)處理,通常使用OpenCV對圖像進(jìn)行縮放,得到模型需要的圖像規(guī)格。
- 模型推理環(huán)節(jié),用戶可以選擇的方式比較多,比較典型的是使用TensorRT進(jìn)行推理應(yīng)用開發(fā)。
- 目標(biāo)檢測后處理需要進(jìn)行NMS計算,進(jìn)行圖片畫框等操作。
- 數(shù)據(jù)輸出階段,用戶根據(jù)需要實現(xiàn)一個結(jié)果呈現(xiàn)形式。
推理功能適配
將上面介紹的目標(biāo)檢測應(yīng)用遷移到昇騰平臺,開發(fā)者僅需關(guān)注“推理”環(huán)節(jié)的適配,包括如下兩個步驟:
- 將推理模型文件(onnx模型或pb模型)通過ATC工具轉(zhuǎn)化為昇騰平臺專屬的離線om文件。
- 使用昇騰AscendCL語言開發(fā)模型加載和模型執(zhí)行的邏輯。
基于CANN的AI推理業(yè)務(wù)流程
完成如上兩個環(huán)節(jié)后,推理應(yīng)用的功能就已經(jīng)遷移到昇騰平臺了。這時若整體的推理性能未達(dá)到理想預(yù)期,就需要進(jìn)入性能優(yōu)化提升階段。
性能提升方式一:使能DVPP硬件的高效編解碼能力
DVPP(Digital Vision Pre-Processing,數(shù)字視覺預(yù)處理)是昇騰AI處理器內(nèi)置的圖像處理單元,通過AscendCL媒體數(shù)據(jù)處理接口提供強(qiáng)大的媒體處理硬加速能力,主要包括以下功能:
- VPC(Vision Preprocessing Core):處理YUV、RGB等格式的圖片,包括縮放、摳圖、色域轉(zhuǎn)換等。
- JPEGD(JPEG Decoder):JPEG壓縮格式→YUV格式的圖片解碼。
- JPEGE(JPEG Encoder):YUV格式→JPEG壓縮格式的圖片編碼。
- VDEC(Video Decoder):H264/H265格式→YUV/RGB格式的視頻碼流解碼。
- VENC(Video Encoder):YUV420SP格式→H264/H265格式的視頻碼流編碼。
- PNGD(PNG Decoder):PNG格式→RGB格式的圖片解碼。
Ascend 310 AI處理器邏輯架構(gòu)中DVPP位置
開發(fā)者可以通過DVPP對圖像進(jìn)行硬件解碼和處理,提升圖像處理效率。另外,DVPP和執(zhí)行推理的計算單元AI Core是完全獨立的硬件單元,無需擔(dān)心使用DVPP后會對推理執(zhí)行的性能產(chǎn)生影響。
基于CANN的AI推理業(yè)務(wù)流程——使用DVPP進(jìn)行數(shù)據(jù)預(yù)處理
性能提升方式二:增加推理前后數(shù)據(jù)并行,讓推理步驟一刻不停
昇騰平臺采用異構(gòu)計算架構(gòu),所以要充分利用計算核心AI Core的超強(qiáng)能力,就需要保證AI Core計算需要的數(shù)據(jù)能夠持續(xù)不間斷供給,同時能夠無等待輸出。為了實現(xiàn)此能力,可以在數(shù)據(jù)預(yù)處理→模型推理,模型推理→數(shù)據(jù)后處理模塊間通過隊列的機(jī)制,增加推理模塊的并行流水。
基于CANN的AI推理業(yè)務(wù)流程——通過隊列增加推理并行流水
同理,在FFmpeg視頻拆幀和DVPP處理之間,也可以使用隊列,進(jìn)一步增加并行情況。但需要注意推理側(cè)的隊列數(shù)據(jù)會消耗硬件內(nèi)存,所以需要要合理設(shè)置。
性能提升方式三:多線程并發(fā),持續(xù)釋放AI Core性能
多線程是提升硬件資源利用率的重要手段,通過多線程的支持,可以實現(xiàn)多路不同源的視頻輸入;針對服務(wù)器多卡的場景,同樣支持多個卡并行執(zhí)行,充分釋放昇騰軟硬件的性能。
基于CANN的AI推理業(yè)務(wù)流程——多線程并發(fā)
基于目標(biāo)檢測最佳實踐,開發(fā)者可輕松實現(xiàn)已有AI推理應(yīng)用到昇騰平臺的遷移,并輕松達(dá)成高性能。開發(fā)者也可以參考此實踐快速上手AI開發(fā),玩轉(zhuǎn)昇騰平臺推理應(yīng)用。未來,CANN將持續(xù)致力于應(yīng)用開發(fā)的易用性提升,不斷滿足開發(fā)者的訴求。
點擊Link,獲取多路高性能目標(biāo)檢測最佳實踐源碼。
點擊關(guān)注,第一時間了解華為云新鮮技術(shù)~
關(guān)鍵詞:
您可能也感興趣:
今日熱點
為您推薦
江西明確養(yǎng)老托育服務(wù)機(jī)構(gòu)水電氣價格有關(guān)事項
《三國志戰(zhàn)略版》三仙盾滿特技配置 孫權(quán)陸遜魯肅
適用個稅優(yōu)惠的商業(yè)健康保險范圍擴(kuò)大
排行
最近更新
- AI推理實踐丨多路極致性能目標(biāo)檢測最佳實踐設(shè)計解密
- 中日韓行政區(qū)2022人均GDP:我國何時追平日韓?
- 亮點多搶先看!天津首條市域(郊)鐵路首列電動客車來了
- 科普:寒武紀(jì)明星動物奇蝦可能“欺軟怕硬”
- 央行發(fā)布《中央銀行存款賬戶管理辦法》:加強(qiáng)關(guān)鍵環(huán)節(jié)風(fēng)險管...
- 真崎航資源合集(真崎航資源)
- 男子路邊吃夜宵被飛來輪胎砸暈,自稱“頭發(fā)被撞掉一片”
- 下周免費游戲:鐵路模擬經(jīng)營類型
- 獨家述評|參與主體更多元 社區(qū)自治更聚力
- 7月8號開始運(yùn)勢一飛沖天,財庫猛漲,3生肖金財銀財如泉涌
- 觀察|當(dāng)腦機(jī)遇上AI 誰更像誰?
- 陷入“月薪15萬”騙局 電影《孤注一擲》“美艷荷官”金晨亮相
- 官方:貝蒂斯簽下萊斯特城邊鋒佩雷斯,簽約至2027年
- 科倫藥業(yè):中金公司、申萬宏源證券等多家機(jī)構(gòu)于7月5日調(diào)研我司
- 中國超級芯片的誕生必將引領(lǐng)碳中和技術(shù)的蓬勃發(fā)展!
- 大明湖在哪里? 濟(jì)南大明湖
- 工業(yè)重點領(lǐng)域能效標(biāo)桿水平和基準(zhǔn)水平(2023年版)
- 教育部:校外培訓(xùn)機(jī)構(gòu)不得聘用有性侵違法犯罪信息的從業(yè)人員
- 5人獲評2023年蕪湖市“最美主播”
- 春季禁漁期于6月30日結(jié)束,成都對垂釣有哪些要求?
- 保利置業(yè):上半年合同銷售金額同比增長127%
- 冠農(nóng)股份:公司的產(chǎn)品番倍爽在巴州庫爾勒的大型超市均有銷售...
- 異動快報:南礦集團(tuán)(001360)7月7日14點24分觸及漲停板
- “商湯日日新”大模型體系全面升級,智能涌現(xiàn),落地千行百業(yè)
- 研究揭示打印店顆粒物污染不容小覷
- 美聯(lián)儲加息聲浪高漲 現(xiàn)貨黃金反彈延續(xù)
- 央行發(fā)布《中央銀行存款賬戶管理辦法》
- AI繪畫分享 米山舞風(fēng)格
- 小孩疑似走失 定南城管幫助找到家人
- 中國人壽保險學(xué)生險理賠電話是多少?報銷流程是什么?
今日要聞
- 研究揭示打印店顆粒物污染不容小覷
- 中國超級芯片的誕生必將引領(lǐng)碳中和技術(shù)的蓬勃發(fā)展!
- 中國信通院發(fā)起大模型生態(tài)合作共同體 推動人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展
- 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新
- 央行發(fā)布《中央銀行存款賬戶管理辦法》:加強(qiáng)關(guān)鍵環(huán)節(jié)風(fēng)險管控,若出現(xiàn)非開戶機(jī)構(gòu)真實開戶意愿的不予開戶
- 陜西省商南縣發(fā)布高溫黃色預(yù)警
- 國家出手!禁止網(wǎng)暴者重新注冊賬號、從嚴(yán)從重處罰!
- 預(yù)計全年開展100場線下招聘會,深圳多措并舉促高校畢業(yè)生就業(yè)
- 戰(zhàn)網(wǎng)頻繁進(jìn)入睡眠模式怎么辦 戰(zhàn)網(wǎng)睡眠模式解決方法