模糊匹配是一些計算機程序中使用的一種方法,尤其是那些設計用于在不同語言之間自動翻譯文本的方法。它適用于軟件所使用的數據庫與文本不完全匹配的情況。相反,數據庫尋找的是緊密匹配,通常由人工修改檢查這種匹配是可以...
模糊匹配是一些計算機程序中使用的一種方法,尤其是那些設計用于在不同語言之間自動翻譯文本的方法。它適用于軟件所使用的數據庫與文本不完全匹配的情況。相反,數據庫尋找的是緊密匹配,通常由人工修改檢查這種匹配是可以接受的準確度。大多數自動翻譯程序只是將文本與先前翻譯的數據庫進行比較。這個數據庫通常被稱為翻譯存儲器(TM)。每一個新的和確認的翻譯都會被添加到數據庫中,這意味著未來的翻譯通常更準確、更快捷。通常,基于TM的翻譯適用于整句話。例如,如果用戶先前認可某個法語句子是“工作日上午9點至下午5點營業,但在周三下午2點關閉,“那么下次軟件被要求翻譯這個句子時,它將自動使用與以前相同的法語措辭。模糊匹配工具適用于系統以前翻譯的文檔中沒有出現特定短語的情況。該工具包括軟件創建者或最終用戶以百分比匹配的形式設置可接受的模糊匹配級別如果該短語與先前翻譯的短語足夠接近,以滿足此百分比匹配,軟件將通知用戶匹配,給出先前的翻譯,并要求用戶確認或編輯建議的翻譯。要跟進前面的示例,如果模糊匹配閾值設置為90%,新的英文文檔中包含這樣一句話:“商店在工作日的上午9點到下午5點之間營業,但在星期三下午2點關門”,軟件會建議以前使用的翻譯,用戶可能會點擊批準如果新文檔中有這樣一句話:“商店在工作日的上午9點到下午5點之間營業,但在星期四下午2點關門”,軟件將建議以前使用的翻譯,用戶將更正此翻譯,以法語單詞星期四結束。如果新文檔中有這樣的句子,“商店開門了”從每個工作日的上午9點到下午5點,除了星期三下午2點關閉,“軟件不會認為這是一個模糊匹配,盡管意思是相同的,因此不會提供句子的自動翻譯,讓用戶手動翻譯
-
發表于 2020-08-06 05:33
- 閱讀 ( 3841 )
- 分類:電腦網絡