唇讀是聾人社區的主要工具。通常,自動唇讀需要一段說話人的視頻。嘴唇形成的形狀和節奏通常是口譯中最重要的因素,但其他各種動作都有助于解讀說話人的信息,另外,面部表情和頭部的運動也是決定因素。如果有任何有用的音頻,自動唇讀過程將大大簡化,因為來自聽覺部分的上下文線索可以提示聽不見的單詞或語音片段。自動唇讀技術的發展依賴于識別每次說話時使用相同嘴唇運動的孤立單詞的能力。唇形幾何估計(LGE)是一種更先進的計算機系統,可以監控和解釋這些模式。科學家們已經為荷蘭語開發了一個著名的自動唇讀和語音識別系統,但總的來說,這一領域仍有很大的發展空間,自動唇讀最近因其在阿道夫·希特勒的存檔家庭視頻中的應用而受到了極大的興趣和關注戰爭期間由伊娃·布勞恩拍攝,當語音識別技術應用到鏡頭中時,曾經默默無聞的電影變得栩栩如生,自動唇讀程序提供了一個歷史人物的一瞥,無疑將創造出對自動唇讀領域的持續興趣。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!