自技術(shù)問世以來,最長(zhǎng)的時(shí)間是人類一直在嘗試將人機(jī)交互發(fā)展到最佳的自然交互點(diǎn)。曾經(jīng)有一段時(shí)間計(jì)算機(jī)沒有屏幕。那時(shí),他們所能做的就是借助老式打字機(jī)一樣的鍵盤來鍵入文檔。
即使在今天,許多電視都配備了遙控器,這是一個(gè)更加智能的遙控器,但是仍然是手持設(shè)備,可以將人工命令作為電視的指令進(jìn)行傳輸。然后,GUI創(chuàng)新隨之出現(xiàn),使人與計(jì)算機(jī)之間的交互變得更加容易?,F(xiàn)在,我們有了對(duì)話框,窗口,拖放元素以及所有內(nèi)容的圖標(biāo)。
即使在今天,我們?nèi)匀恍枰髽?biāo)來傳達(dá)我們的想法,以使計(jì)算機(jī)能夠準(zhǔn)確地進(jìn)行處理。但是隨著AI的出現(xiàn),新一波的人機(jī)交互模式開始進(jìn)入主流應(yīng)用。
不需要中介翻譯的交互模式,例如鼠標(biāo)或鍵盤,甚至不需要屏幕上的可視元素。一個(gè)例子是語(yǔ)音識(shí)別人工智能支持的交互。這種交互模式就是為什么存在語(yǔ)音激活助手設(shè)備(例如Alexa)的原因。除了您的聲音外,您可以指示Alexa在麥當(dāng)勞下訂單,或者提高撰寫諸如Pick The Writer或Writing Judge的評(píng)論服務(wù)選項(xiàng)的能力。
但是,本文的重點(diǎn)是手勢(shì)識(shí)別和控制。手勢(shì)識(shí)別是一種新的交互模式,旨在教會(huì)我們的設(shè)備掌握人類運(yùn)動(dòng),以便他們可以立即解釋其含義,就像人類彼此之間的交互方式一樣。手勢(shì)識(shí)別屬于人機(jī)交互的新時(shí)代,即自然用戶界面(NUI)。
人的手勢(shì)包括面部表情,手勢(shì),手語(yǔ),步態(tài),姿勢(shì)等。手勢(shì)識(shí)別技術(shù)利用深度感應(yīng)3D相機(jī),紅外(IR)相機(jī)和復(fù)雜的數(shù)學(xué)算法來記錄人體運(yùn)動(dòng)并將其處理為我們?cè)O(shè)備可理解的指令。
支持手勢(shì)的設(shè)備和技術(shù)已經(jīng)存在于我們周圍
我們已經(jīng)開始看到這項(xiàng)技術(shù)在許多設(shè)備上的應(yīng)用,尤其是在汽車,醫(yī)療保健,軟件設(shè)計(jì)和制造行業(yè)。手勢(shì)和手勢(shì)識(shí)別功能存在于智能手機(jī),視頻游戲機(jī),車輛,醫(yī)療設(shè)備等中。
三星Galaxy Note 10就是一個(gè)很好的例子。這款高端智能手機(jī)配備了預(yù)期的面部識(shí)別和導(dǎo)航手勢(shì)功能。
這些功能已經(jīng)成為許多智能手機(jī)品牌的主食。劃動(dòng),捏合和雙擊是智能手機(jī)中的傳統(tǒng)手勢(shì)動(dòng)作。這種現(xiàn)實(shí)將當(dāng)今的智能手機(jī)牢固地植入了觸摸手勢(shì)輸入設(shè)備類別。
早在2010年,Microsoft便是第一個(gè)在其游戲機(jī)Xbox 360上推出被稱為Microsoft Kinect的手勢(shì)識(shí)別技術(shù)的公司。該運(yùn)動(dòng)感應(yīng)配件使游戲玩家能夠使用手和身體的運(yùn)動(dòng)來獲得更加身臨其境和直觀的真實(shí)感時(shí)的游戲體驗(yàn),使他們擺脫了操縱桿和鍵盤的限制。此后,Kinect的應(yīng)用程序得到了擴(kuò)展,現(xiàn)在它已成為Microsoft基于云的服務(wù)Azure的一部分。
總部位于瑞典的技術(shù)公司Tobii Rex設(shè)計(jì)了一種同名設(shè)備,將眼部設(shè)備的協(xié)調(diào)性提高到另一個(gè)層次。這個(gè)微小的矩形設(shè)備使用手勢(shì)控制來通過紅外光跟蹤眼睛的運(yùn)動(dòng),并將這些運(yùn)動(dòng)解釋為許多設(shè)備上的特定動(dòng)作。Tobii Rex的創(chuàng)建主要是為了讓身體有殘障的人在完全自由地工作時(shí),他們的計(jì)算機(jī)只能動(dòng)眼。
Digital Habit的OSOUND是壁裝式的圓形音頻系統(tǒng),可以連接到任何支持藍(lán)牙的設(shè)備,以播放音樂或收聽廣播等等。OSOUND的功能帶有強(qiáng)大的手勢(shì)界面,使用戶能夠通過識(shí)別的手勢(shì)完全控制系統(tǒng)。用戶可以暫停/播放音樂,移至下一首或上一首歌曲,控制音量等等。
然后是BMW 7系。自2016年以來,這家德國(guó)汽車制造商就將手勢(shì)識(shí)別功能引入了7系列汽車。手勢(shì)控件可讓您接聽或拒絕通話,提高或降低立體聲音量,調(diào)整車輛的多攝像頭角度等等。
只是為了做到這一點(diǎn),還有一個(gè)未分配的兩指手勢(shì)動(dòng)作,駕駛員可以對(duì)其進(jìn)行自定義,以響應(yīng)從“繪制最快路線”到更奇怪的指令(例如“訂購(gòu)披薩”)的任何內(nèi)容。
仍然有許多公司在做偉大的事情并解決社會(huì)中的關(guān)鍵問題。像Leap Motion這樣的公司尋求將手勢(shì)識(shí)別納入虛擬現(xiàn)實(shí)領(lǐng)域。Gestigon和uSens創(chuàng)建了SDK(軟件開發(fā)工具包),可幫助軟件開發(fā)人員在其客戶的應(yīng)用程序中包含手勢(shì)識(shí)別功能。Limix建立了一種技術(shù),可以在電話,揚(yáng)聲器或語(yǔ)音合成器上記錄手語(yǔ)并將其翻譯成可聽見的單詞。
手勢(shì)識(shí)別技術(shù)的顯著優(yōu)勢(shì)
手勢(shì)識(shí)別最明顯的好處之一是,它可以大大減輕設(shè)備的磨損。借助諸如鍵盤,音量按鈕甚至觸摸屏之類的交互外圍設(shè)備,該設(shè)備無疑會(huì)導(dǎo)致設(shè)備磨損。
這是因?yàn)橛脩舯仨毰c設(shè)備進(jìn)行持續(xù)不斷的接觸才能使用它。手勢(shì)識(shí)別技術(shù)消除了這種情況。操作設(shè)備時(shí)不會(huì)與設(shè)備直接接觸,這主要是非接觸式的用戶交互方式。
手勢(shì)識(shí)別提供了一種更加豐富,直觀,靈活和實(shí)驗(yàn)性的方法。用戶不僅可以享受傳統(tǒng)形式的手勢(shì)輸入,而且可以使用某些手勢(shì)輸入設(shè)備創(chuàng)建自定義和唯一的手勢(shì)并為其分配動(dòng)作。
這種NUI技術(shù)開始在更多設(shè)備中彈出,而且發(fā)展速度還不夠快。到目前為止,它已進(jìn)入我們的游戲體驗(yàn),智能手機(jī)使用,應(yīng)用程序,醫(yī)療和外科手術(shù)計(jì)劃,信息娛樂設(shè)備和場(chǎng)所,車輛等。
根據(jù)Grand View Research的一份報(bào)告,全球手勢(shì)識(shí)別和控制市場(chǎng)正在迅速發(fā)展。它預(yù)計(jì)將達(dá)到$ 30十億總價(jià)值來自2025年,隨著越來越多的市場(chǎng)和行業(yè)開始將其部署在自己的產(chǎn)品/服務(wù)陣容顯著的特征。
最后的話
還記得2002年湯姆·克魯斯(Tom Cruise)和史蒂芬·斯皮爾伯格(Steven Spielberg)的科幻經(jīng)典作品《少數(shù)派報(bào)告》嗎?那部電影明顯提醒了手勢(shì)控制已經(jīng)很長(zhǎng)時(shí)間了。當(dāng)時(shí),對(duì)于大多數(shù)觀眾來說,克魯斯的傳感器充滿了未來感,我們今天生活的世界證明電影制片人一直以來都是正確的。
就像語(yǔ)音識(shí)別一樣,手勢(shì)控制仍處于起步階段。這項(xiàng)技術(shù)可以增強(qiáng)人機(jī)交互的方式仍在學(xué)習(xí)和實(shí)施中。同樣,在將手勢(shì)識(shí)別主流接受和部署的主流方式上仍然存在挑戰(zhàn)。
諸如完善技術(shù)的準(zhǔn)確性,外圍設(shè)備設(shè)置的物流和空間管理等因素;硬件固定性和商業(yè)規(guī)模的局限性;適當(dāng)?shù)陌踩筒僮饕?guī)定;以及公眾的認(rèn)知度等等。
但是,這些挑戰(zhàn)和進(jìn)入障礙并非無法克服。世界開始集體關(guān)注手勢(shì)識(shí)別和其他NUI技術(shù)對(duì)全球經(jīng)濟(jì)的巨大前景只是時(shí)間問題。尋找這種方式來定位您的品牌,產(chǎn)品/服務(wù)的方法現(xiàn)在對(duì)于即將到來的有效的非接觸式交互世界來說是一件好事。