手語識別和翻譯
摘要:為了使聾啞人與更多不懂手語的人自然地交流,本作品將手語翻譯成文字和語音,利用Microsoft Kinect記錄手語手勢的三維坐標(biāo),通過機(jī)器學(xué)習(xí)和優(yōu)化算法,在IntelAtom平臺上實現(xiàn)了手語翻譯。
簡介
手語是聾啞人士的主要溝通工具,它是利用手部和身體的動作來傳達(dá)意義。雖然手語幫助它的使用者之間互相溝通,但聾啞人士與一般人的溝通卻十分困難,這個溝通障礙是源于大部分人不懂得手語。
另一方面,聾啞小朋友由于很難表達(dá)自己,以及中國的聾啞教師數(shù)量有限,導(dǎo)致他們的學(xué)習(xí)出現(xiàn)困難,得不到和普通小朋友同等的學(xué)習(xí)機(jī)會。
為了解決這個問題,我們設(shè)計實現(xiàn)了一個從手語動作翻譯成文字和聲音的翻譯器,令學(xué)習(xí)手語更有趣、更方便、更容易,以達(dá)到這個項目縮少聾啞人士與其他人的溝通障礙的目的。
工作原理和算法
特征提取 深度圖像的分辨率是640x480,意味著每秒鐘的數(shù)據(jù)有17.6MB,存儲如此大量的數(shù)據(jù)是不可能的。同時許多沒有用處的數(shù)據(jù)(例如背景)都包含在原始數(shù)據(jù)中。因此我們必須從原始數(shù)據(jù)中提取出有用的信息。骨架是一種可以用來表示手語的有用信息。
我們利用Kinect和OpenNI提取用戶的骨架節(jié)點得到XYZ三點的坐標(biāo)。我們一共提取了6個骨架節(jié)點,左手、左手肘、左肩、右手、右手肘、右肩。對于每一幀,我們從這些節(jié)點中計算出14個特征向量來表示這一幀的手語動作。經(jīng)過標(biāo)準(zhǔn)化計算,我們用121幀來表示一個手語詞語,因此每一個詞語有1694個特征。
原始數(shù)據(jù)標(biāo)準(zhǔn)化 我們通過均勻分配和插值使原始數(shù)據(jù)標(biāo)準(zhǔn)化。通過二次插值法,利用最相近的三個原始數(shù)據(jù)計算出標(biāo)準(zhǔn)化的數(shù)據(jù),使得每一個手語動作都統(tǒng)一用121幀來表示。
支持向量機(jī) SVM(支持向量機(jī))是統(tǒng)計學(xué)和計算機(jī)科學(xué)中的概念,簡而言之,給定一組已經(jīng)分好類別的數(shù)據(jù),而且分類依據(jù)是未知的,支持向量機(jī)訓(xùn)練算法可以通過計算構(gòu)建一個模型 ,一組新的數(shù)據(jù)到來時可以預(yù)測出新的數(shù)據(jù)屬于哪一個類別。
SVM的模型將所有數(shù)據(jù)映像到一個高維空間里,并計算出不同類別數(shù)據(jù)之間的最大化幾何邊緣區(qū),然后把新的數(shù)據(jù)映射到同一個空間,根據(jù)之前計算出的最大化幾何邊緣區(qū)來預(yù)測新的數(shù)據(jù)屬于哪一個類別。
平臺限制與解決方法
平臺限制 使用Kinect的建議系統(tǒng)需求是CPU有雙核2.66 GHz或以上,內(nèi)存有2GB或以上,但I(xiàn)ntel提供的平臺只有分別1GHz CPU和1G 內(nèi)存,明顯與系統(tǒng)需求有差異。
即使我們使用Linux操作系統(tǒng),處理器使用率依舊滿載,并且?guī)手挥写蠹s2到4左右,遠(yuǎn)少于正常的30幀。在這種條件下,再加上處理器資源已被提取資源的線程占據(jù),所以不可能在處理器里進(jìn)行資料分析的工作。
瓶頸 為了找出瓶頸,我們首先關(guān)閉了圖像用戶接口。雖然處理器使用率降至85%,但幀率跟之前的一樣。我們觀察得到其中一個OpenNI控制的線程依然是占領(lǐng)了整個線程。只是由于所提供的平臺是雙線程的關(guān)系,使用率分別被定在50%及35%。
您可能也感興趣:
今日熱點
為您推薦
貸款370萬元買保險?消費(fèi)者需當(dāng)心有人盯上你的保單
銀保監(jiān)會要求保險機(jī)構(gòu)提升農(nóng)業(yè)保險保障水平 發(fā)展特色農(nóng)產(chǎn)品保險
湖北省棉花“保險+期貨”項目落地三縣市 5萬棉農(nóng)將成為受益者
更多
- e絡(luò)盟現(xiàn)貨發(fā)售Bourns獲獎產(chǎn)品IsoMOV?保護(hù)器
- 貿(mào)澤電子開售英飛凌XENSIV PAS CO2傳感器 節(jié)省75%占板空間
- 是德科技入選《財富》100 家最適宜工作的公司榜單
- 面向新一代數(shù)據(jù)中心,聯(lián)想凌拓發(fā)布全自研聯(lián)想ThinkSystem DX...
- 三星電機(jī)開發(fā)出13種適用于汽車動力系統(tǒng)的MLCC
- 意法半導(dǎo)體推出下一代衛(wèi)星用2.5V抗輻射加固數(shù)模轉(zhuǎn)換器
- Smart Modular推出Kestral PCIe傲騰存儲擴(kuò)展卡
- SUSE/openSUSE為下一代SUSE Linux Enterprise開發(fā)"可適應(yīng)的Linux平臺"
排行
最近更新
- 手語識別和翻譯
- RC電路原理
- MAX232引腳圖功能應(yīng)用電路
- 寄存器和移位寄存器
- 暖流|短信暖心 服務(wù)貼心
- 廣西力推中醫(yī)藥壯瑤醫(yī)藥 力爭實現(xiàn)基層社區(qū)中醫(yī)藥服務(wù)全覆蓋
- 中信證券:當(dāng)前地產(chǎn)債券正處于筑底階段
- RCEP生效“百日” 35份“紙黃金”助寧夏企業(yè)享紅利
- 計劃發(fā)債總額163.64億元!河南77個專項債項目通過評審
- 廣州白云管控區(qū)“蔬菜特供隊”:讓民眾吃上新鮮菜
- 深鐵集團(tuán)20億元公司債發(fā)行結(jié)束 票面利率分別為2.55%及2.97%
- 北京將持續(xù)降低核心區(qū)人口、建筑、商業(yè)、旅游密度
- 加拿大短端國債收益率領(lǐng)跌,在央行宣布加息50個基點后進(jìn)一步下滑
- 故鄉(xiāng)浙江上虞紀(jì)念“當(dāng)代茶圣”吳覺農(nóng)誕辰125周年
- 國際評級行業(yè)發(fā)展與監(jiān)管動態(tài)報告
- 工商銀行:500億元二級資本債券發(fā)行完畢
- 督察組:偷梁換柱,河北邯鄲用違規(guī)項目頂替化解鋼鐵產(chǎn)能
- 中金:中美利差倒掛未必會造成人民幣大幅貶值和資金流動壓力
- 提高干部群眾國家安全意識 社區(qū)舉辦國家安全教育日主題宣傳活動
- SBF提出推文上鏈等多條建議以去中心化Twitter
- 胃炎怎么治療 五種治療方法能給胃部消消炎
- 腎結(jié)石怎么治療 3種常見方法能將體內(nèi)結(jié)石擊碎
- 胰腺炎的癥狀 這5個信號竟是胰腺炎的征兆
- 眼睛干澀怎么辦 5種潤眼方法輕松應(yīng)對眼睛干澀
- 黃瓜的好處 想不到它竟是減肥瘦身的小幫手
- 全國已經(jīng)有一百多個城市的銀行自主下調(diào)房貸利率
- 核酸檢測和抗原檢測的區(qū)別
- 核酸檢測待復(fù)核什么意思
- 市領(lǐng)導(dǎo)到鞏義市調(diào)研緊密型醫(yī)共體工作 加速推動醫(yī)共體建設(shè)落...
- 南昌西湖區(qū):管控區(qū)孕婦緊急求助 多部門聯(lián)動5分鐘緊急送醫(yī)!