語音識別,或稱語音識別,是一種利用音頻輸入而不是鍵盤輸入數據的計算機技術。例如,對著麥克風講話,產生的結果與用鍵盤手動鍵入單詞的結果相同。簡單地說,語音識別軟件是用可識別單詞的內部數據庫設計的或短語。程序將語音...
語音識別,或稱語音識別,是一種利用音頻輸入而不是鍵盤輸入數據的計算機技術。例如,對著麥克風講話,產生的結果與用鍵盤手動鍵入單詞的結果相同。簡單地說,語音識別軟件是用可識別單詞的內部數據庫設計的或短語。程序將語音的音頻簽名與數據庫中相應的條目相匹配。

計算機的語音識別軟件允許用戶對著麥克風講話以輸入音頻信息,而不是音頻輸入信息雖然把語音轉換成文本聽起來很容易,但這是一項極其困難的任務。問題在于,實際上,單個的語音模式和口音是無限的,再加上人類自然傾向于把單詞放在一起。

智能手機配備了語音識別軟件,可用于發出命令和指令。
各種型號的語音識別軟件用于一系列應用,從個人聽寫到商業自動呼叫路由,從幫助殘疾人到體育和新聞事件字幕。每種模式的行為都不同,都有自己的能力和界限。
語音識別程序需要用戶"訓練"軟件來識別其特定的風格化語音模式,稱為
依賴于說話人的系統。個人通常在家里或辦公室使用這些類型的程序。電子郵件、備忘錄、信件、數據和文本可以通過麥克風輸入。
一些語音識別系統,稱為離散語音系統,要求用戶講話清晰、緩慢并將單詞分開連續語音系統旨在理解更自然的說話模式。
離散語音系統廣泛用于客戶服務路由。該系統與說話人無關,但只理解一小部分單詞或短語。來電者可以選擇回答問題,通常情況下,在收到應答后,系統會用"是"或"否"將呼叫者提升到下一級。如果呼叫者用唯一的應答進行應答,則自動應答通常為"對不起,我不明白您的意思,請再試一次",并重復問題和可用的答案。這種類型的語音識別也稱為語法約束識別。
連續語音是一種更復雜的語音識別軟件形式,其中,呼叫者可以自然地說話來解釋問題或請求服務。這個程序設計用來挑選關鍵詞或短語,并對客戶的需求做出統計上最好的猜測。說話顯然有助于程序識別需求。這種類型的系統有一個比謹慎的語音更密集的數據庫系統,也稱為自然語言識別。
自動語音識別(ASR)是一種專為聽寫而設計的語音識別模型。該軟件不同于以前的模型,它不努力理解所說的話,只識別所說的單詞。由于英語中的許多單詞發音相似,很容易出錯。ASR軟件經常出現在數字錄音機上。