手語識別和翻譯
摘要:為了使聾啞人與更多不懂手語的人自然地交流,本作品將手語翻譯成文字和語音,利用Microsoft Kinect記錄手語手勢的三維坐標,通過機器學習和優化算法,在IntelAtom平臺上實現了手語翻譯。
簡介
手語是聾啞人士的主要溝通工具,它是利用手部和身體的動作來傳達意義。雖然手語幫助它的使用者之間互相溝通,但聾啞人士與一般人的溝通卻十分困難,這個溝通障礙是源于大部分人不懂得手語。
另一方面,聾啞小朋友由于很難表達自己,以及中國的聾啞教師數量有限,導致他們的學習出現困難,得不到和普通小朋友同等的學習機會。
為了解決這個問題,我們設計實現了一個從手語動作翻譯成文字和聲音的翻譯器,令學習手語更有趣、更方便、更容易,以達到這個項目縮少聾啞人士與其他人的溝通障礙的目的。
工作原理和算法
特征提取 深度圖像的分辨率是640x480,意味著每秒鐘的數據有17.6MB,存儲如此大量的數據是不可能的。同時許多沒有用處的數據(例如背景)都包含在原始數據中。因此我們必須從原始數據中提取出有用的信息。骨架是一種可以用來表示手語的有用信息。
我們利用Kinect和OpenNI提取用戶的骨架節點得到XYZ三點的坐標。我們一共提取了6個骨架節點,左手、左手肘、左肩、右手、右手肘、右肩。對于每一幀,我們從這些節點中計算出14個特征向量來表示這一幀的手語動作。經過標準化計算,我們用121幀來表示一個手語詞語,因此每一個詞語有1694個特征。
原始數據標準化 我們通過均勻分配和插值使原始數據標準化。通過二次插值法,利用最相近的三個原始數據計算出標準化的數據,使得每一個手語動作都統一用121幀來表示。
支持向量機 SVM(支持向量機)是統計學和計算機科學中的概念,簡而言之,給定一組已經分好類別的數據,而且分類依據是未知的,支持向量機訓練算法可以通過計算構建一個模型 ,一組新的數據到來時可以預測出新的數據屬于哪一個類別。
SVM的模型將所有數據映像到一個高維空間里,并計算出不同類別數據之間的最大化幾何邊緣區,然后把新的數據映射到同一個空間,根據之前計算出的最大化幾何邊緣區來預測新的數據屬于哪一個類別。
平臺限制與解決方法
平臺限制 使用Kinect的建議系統需求是CPU有雙核2.66 GHz或以上,內存有2GB或以上,但Intel提供的平臺只有分別1GHz CPU和1G 內存,明顯與系統需求有差異。
即使我們使用Linux操作系統,處理器使用率依舊滿載,并且幀率只有大約2到4左右,遠少于正常的30幀。在這種條件下,再加上處理器資源已被提取資源的線程占據,所以不可能在處理器里進行資料分析的工作。
瓶頸 為了找出瓶頸,我們首先關閉了圖像用戶接口。雖然處理器使用率降至85%,但幀率跟之前的一樣。我們觀察得到其中一個OpenNI控制的線程依然是占領了整個線程。只是由于所提供的平臺是雙線程的關系,使用率分別被定在50%及35%。
為您推薦
保險業去年原保費收入微降0.79% 健康險業務增長3.36%
銀保監會:嚴防銀行保險資金被用于盲目“加杠桿”,強化金融反壟斷
保險打工人年終獎多數和上年持平或下降,怎樣發才合理?
排行
最近更新
- 手語識別和翻譯
- RC電路原理
- 養老股票龍頭有哪些?2020養老板塊股票一覽表
- 康希諾生物股票代碼多少?康希諾上市時間表一覽
- 甲醇上市公司一覽,2021年甲醇上市公司有哪些?
- 轉基因概念股龍頭一覽,轉基因概念股價查詢(2021/10/14)
- MAX232引腳圖功能應用電路
- 寄存器和移位寄存器
- 1分鐘看懂什么是IGZO屏幕
- 電子工程師的八種級別,你是哪一種?
- 出版傳媒板塊概念股票有哪些?出版傳媒概念股一覽,5分鐘帶你...
- 2021年磷化工概念股票有那些?磷化工龍頭股一覽
- 麗鵬股份是做什么的?哪些題材包含麗鵬股份?
- 300301股票情況 長方集團300301股票怎么樣
- 電纜上市公司一覽,2021年電纜上市公司有哪些?
- 掃描電子顯微鏡原理
- 電流計算公式
- HDMI接口定義圖
- AXIe 技術標準
- 科技冬奧:5G+8K“身臨其境”開幕式
- 冬奧帶動冰雪盛宴 這些消費領域迎“新春”
- 白銀有關的股票有哪些?2020白銀板塊龍頭一覽表
- 特高壓概念股有哪些,特高壓概念上市公司龍頭一覽
- 2021年磷礦石概念上市公司一覽,磷礦石上市公司有哪些?
- 核酸檢測相關股票有哪些?核酸檢測概念股票龍頭一覽
- 新能源電池股票有哪些,新能源電池概念股票一覽
- 顏料行業相關上市公司有哪些?
- 差壓式流量計原理
- 一套完整的無線門禁系統解決方案
- 用料上佳 HP Pavilion g4-1016TX拆解