語音合成器是一種將文字字符轉換成類似人類語音的聲音的裝置。根據單個裝置的復雜程度,產生的聲音可能有點高蹺和人為的聲音,或者聽起來很像真實的人的聲音。語音合成的概念已經存在了幾個世紀,但直到最近幾十年,這一過程...
語音合成器是一種將文字字符轉換成類似人類語音的聲音的裝置。根據單個裝置的復雜程度,產生的聲音可能有點高蹺和人為的聲音,或者聽起來很像真實的人的聲音。語音合成的概念已經存在了幾個世紀,但直到最近幾十年,這一過程才為公眾所接受。

Bell Laboratories生產了一種合成器在1930年代,通過使用鍵盤,有人試圖人工產生人類的語言模式,這種嘗試可以追溯到11世紀。最早的嘗試通常使用材料來復制人類的聲帶,并應用各種刺激來產生聲音。隨著時間的推移,設計使其能夠產生模仿元音發音的聲音。到18世紀后期,一些設計還能夠產生與輔音非常相似的聲音。
現代語音合成器的真正發展始于20世紀30年代。貝爾實驗室生產了一種被稱為聲碼器的合成器。數據通過鍵盤輸入,通過系統分析,并發出適當的聲音來形成單詞。雖然單詞的語調和屈折有些原始,但該設備確實能產生清晰易懂的單詞。在1939年的世界博覽會上,該設備的改進版voder向公眾介紹。
到20世紀50年代,研究一種語音使用可視圖像和輸入文本的合成器產生了部分成功的結果,同時,技術的進步開始改善音質在20世紀70年代,自動語音通信變得越來越普遍的時候,有幾個語音合成器能夠產生非常接近人類語音模式的聲音,這些設備被用來生產諸如在答錄機上預先錄制的信息和為視障人士提供的閱讀產品。
個人電腦的出現也為語音合成器的進一步改進打開了大門,有閱讀障礙或視力受限的人能夠享受使用各種計算機程序的樂趣。今天,大多數型號的語音合成器上的語音質量與20世紀初發明的設備產生的機器人聲音相去甚遠。今天的許多版本都能夠產生幾乎是與人類的語言沒有區別。