分布假設提出了一種觀點,即在文本中具有相同含義的詞被組合在一起。這種觀點檢查單詞的含義及其在整個文本中的分布情況,然后將其與具有相似或相關含義的詞的分布進行比較。這樣的檢查確定單詞的出現英國語言學家J.R.Fi...
分布假設提出了一種觀點,即在文本中具有相同含義的詞被組合在一起。這種觀點檢查單詞的含義及其在整個文本中的分布情況,然后將其與具有相似或相關含義的詞的分布進行比較。這樣的檢查確定單詞的出現英國語言學家J.R.Firth首先提出了“站在一堆書后面的女人”這一觀點,他以“你應該知道一個單詞由它所擁有的公司來認識”這一觀點而聞名他以研究韻律而聞名,他相信沒有一個系統能解釋語言是如何運作的,他認為需要幾個相互重疊的系統。美國語言學家澤利格·哈里斯建立在弗斯的工作基礎上。他想用數學來研究和分析語言數據。他對數學的貢獻是很重要的,但他也因在有生之年涵蓋了廣泛的語言學思想而聞名分布假設是語言學檢驗的一部分。數學和統計方法,而不是語言學方法,用來篩選大量的語言數據。這意味著,分布假設是計算語言學和統計語義學的一部分,它也與語言學家和語言哲學家關于兒童母語發展的觀點有關,一種被稱為語言習得的過程。統計語義學使用數學算法來研究詞的分布,然后根據意義過濾這些結果并進一步研究,以找出與意義相關的詞的分布情況。統計語義學主要有兩種方法:按詞簇分布和按文本分布地區通過相關詞義的簇來研究詞的分布,被稱為超空間模擬語言(HAL)。HAL研究文本中聚集在一起的單詞之間的關系。這可以是句內或段落內,但很少比這更遠。單詞的語義分布取決于單詞接下來出現的頻率全文研究使用潛在語義分析(LSA)。這是一種自然語言處理方法。在整個文本中,意義相近的詞會彼此靠近出現。使用一種稱為奇異值解壓縮(SVD)的數學方法對這類文本進行聚類檢查分布假設正被用來研究語義和詞匯關系的組成部分,這一假設可以應用于人工智能(AI),這將有助于計算機程序更好地理解單詞之間的關系和分布,并對兒童如何處理單詞、創建單詞聯想和句子也有一定的啟示
-
發表于 2020-09-16 06:01
- 閱讀 ( 1957 )
- 分類:社會民生