科技生活| 眼鏡聲納反射嘴部動作沉默發指令無聲勝有聲

有人不懂發聲，也有人可能發現自己處於嘈雜的環境中，即使大聲說話也是無人聽到，可以讀取用戶默默說出的話語的EchoSpeech眼鏡，可能對這些人有用。

這種實驗性眼鏡是由康奈爾大學未來互動智能電腦介面（SciFi）實驗室的一個團隊開發的。

兩個朝下的微型揚聲器被安裝在一個鏡片下方的框架上，另有兩個微型麥克風位於另一個鏡片下方。揚聲器發出聽不到的聲波，這些聲波從佩戴者移動的嘴上反射到麥克風上。

這些回聲由無線連接的智能手機上的深度學習算法進行實時分析。該算法被訓練成將特定的回聲與特定的嘴部動作聯繫起來，而這些動作又與特定的默讀命令(silently spoken commands)聯繫起來。

EchoSpeech目前能夠識別31個這樣的命令，準確率約為95%，並且只需要對每個用戶進行幾分鐘的訓練。重要的是，對於有隱私顧慮的人來說，該系統沒有安裝任何攝像頭，也沒有向互聯網發送任何信息。

更重要的是，由於它沒有利用耗電的攝像頭，它的電池一次充電可以運行10個小時。相比之下，研究人員聲稱，基於攝像頭的實驗性系統每次充電只能使用大約30分鐘。

該大學現在正致力於將該技術商業化。

領導這項研究的博士生Ruidong Zhang說：「對於不能發聲的人來說，這種無聲語音技術可以成為語音合成器的一個很好的輸入。它可以讓病人重新獲得他們的聲音。」

圖片：康奈爾大學

T09

科技生活| 眼鏡聲納反射嘴部動作 沉默發指令無聲勝有聲