科技
2023-04-07 16:56:22

科技生活| 眼鏡聲納反射嘴部動作 沉默發指令無聲勝有聲

有人不懂發聲,也有人可能發現自己處於嘈雜的環境中,即使大聲說話也是無人聽到,可以讀取用戶默默說出的話語 EchoSpeech眼鏡,可能對這些人有用。

這種實驗性眼鏡是由康奈爾大學未來互動智能電腦介面(SciFi)實驗室的一個團隊開發的。

兩個朝下的微型揚聲器被安裝在一個鏡片下方的框架上,另有兩個微型麥克風位於另一個鏡片下方。揚聲器發出聽不到的聲波,這些聲波從佩戴者移動的嘴上反射到麥克風上。

這些回聲由無線連接的智能手機上的深度學習算法進行實時分析。該算法被訓練成將特定的回聲與特定的嘴部動作聯繫起來,而這些動作又與特定的默讀命令(silently spoken commands)聯繫起來。

EchoSpeech目前能夠識別31個這樣的命令,準確率約為95%,並且只需要對每個用戶進行幾分鐘的訓練。重要的是,對於有隱私顧慮的人來說,該系統沒有安裝任何攝像頭,也沒有向互聯網發送任何信息。

更重要的是,由於它沒有利用耗電的攝像頭,它的電池一次充電可以運行10個小時。相比之下,研究人員聲稱,基於攝像頭的實驗性系統每次充電只能使用大約30分鐘。

該大學現在正致力於將該技術商業化。

領導這項研究的博士生Ruidong Zhang說:「對於不能發聲的人來說,這種無聲語音技術可以成為語音合成器的一個很好的輸入。它可以讓病人重新獲得他們的聲音。」

圖片:康奈爾大學

T09