唇讀并不是一種新的交流方式:它是聾人社區的主要工具,更不用說在喧鬧的聚會上或通過孩子們的頭頂傳遞信息的有用技能。然而,一種新的技術正在試圖使這種古老的交流方法機械化。自動唇讀,也被稱為自動語音閱讀,是語音識別技...
唇讀并不是一種新的交流方式:它是聾人社區的主要工具,更不用說在喧鬧的聚會上或通過孩子們的頭頂傳遞信息的有用技能。然而,一種新的技術正在試圖使這種古老的交流方法機械化。自動唇讀,也被稱為自動語音閱讀,是語音識別技術的一個發展分支。理論上,通過監測說話人的嘴唇運動和其他相關元素,特別設計的計算機程序可以解釋語言信息,即使噪音干擾或其他障礙物阻礙了人的聲音被正確聽到。

唇讀是聾人社區的主要工具。通常,自動唇讀需要一段說話人的視頻。嘴唇形成的形狀和節奏通常是口譯中最重要的因素,但其他各種動作都有助于解讀說話人的信息,另外,面部表情和頭部的運動也是決定因素。如果有任何有用的音頻,自動唇讀過程將大大簡化,因為來自聽覺部分的上下文線索可以提示聽不見的單詞或語音片段。自動唇讀技術的發展依賴于識別每次說話時使用相同嘴唇運動的孤立單詞的能力。唇形幾何估計(LGE)是一種更先進的計算機系統,可以監控和解釋這些模式。科學家們已經為荷蘭語開發了一個著名的自動唇讀和語音識別系統,但總的來說,這一領域仍有很大的發展空間,自動唇讀最近因其在阿道夫·希特勒的存檔家庭視頻中的應用而受到了極大的興趣和關注戰爭期間由伊娃·布勞恩拍攝,當語音識別技術應用到鏡頭中時,曾經默默無聞的電影變得栩栩如生,自動唇讀程序提供了一個歷史人物的一瞥,無疑將創造出對自動唇讀領域的持續興趣。