關鍵詞識別是語音識別軟件程序和工具的一個關鍵功能。語音識別軟件依靠復雜的技術來“理解”某人在說什么,然后將其轉換成文本。為了做到這一點,語音識別軟件需要依賴各種技術和分析方法。其中之一Sppech識別軟件依靠復...
關鍵詞識別是語音識別軟件程序和工具的一個關鍵功能。語音識別軟件依靠復雜的技術來“理解”某人在說什么,然后將其轉換成文本。為了做到這一點,語音識別軟件需要依賴各種技術和分析方法。其中之一Sppech識別軟件依靠復雜的技術來理解一個人在說什么,然后將其轉換成文本兩種不同類型的關鍵詞識別工作方式不同。第一種是無限制語音中的關鍵詞識別,或者是對沒有指定分詞的線性語音流的分析;第二種形式是孤立詞識別中的關鍵詞識別,軟件可以有“線索”指的是沉默或單詞間的停頓。在無限制的語音中,關鍵詞的識別依賴于一些叫做算法的特定程序。這些程序基本上是用“位”或單個音素來預測它們最可能的“意思”,或者它們最有可能被放置在什么上下文中。這項任務的一個流行算法稱為迭代維特比編碼,它有時被解釋為尋找一個序列與另一個序列的“最小規范化距離”,換句話說,比較數據位以進行“匹配”這有助于語音識別,其中一些算法在解釋人類語音時非常有效,而沒有真正理解它另一種類型,孤立詞識別中的關鍵詞識別,有時使用專家稱之為“動態時間扭曲”的方法。這個過程分析速度或速度,以幫助語音識別。有許多分析比較有助于形成最終結果,從而唯一地解釋單詞這兩種關鍵詞定位策略有時被專業人士稱為“隱馬爾可夫模型”來解釋。馬爾可夫模型是以提出它的科學家命名的,關鍵詞識別和其他語音識別軟件很大程度上是基于概率,以及序列記錄和比較,這樣機器就可以生成更接近人類用戶所說內容的文本事實證明,語音到文本技術對于將口頭交流轉換為頁面非常有用,而不需要大量的手動輸入。關鍵字工具和其他技術很可能會繼續推動更強大的語音識別程序,從而使不同媒介之間的通信更加有效。像這樣的技術與信息的數字傳輸齊頭并進,這將給現代世界及其公民帶來更多的不同能力
-
發表于 2020-07-31 18:08
- 閱讀 ( 2298 )
- 分類:電腦網絡