概念挖掘是一個側重于從文檔中提取思想和概念的過程。這種方法與文本挖掘有點相似,主要區別在于挖掘文本的重點是信息而不是思想。概念挖掘在許多應用中都有幫助,包括對軟件程序和各種應用程序的評估,這些程序通常被歸類...
概念挖掘是一個側重于從文檔中提取思想和概念的過程。這種方法與文本挖掘有點相似,主要區別在于挖掘文本的重點是信息而不是思想。概念挖掘在許多應用中都有幫助,包括對軟件程序和各種應用程序的評估,這些程序通常被歸類為計算機科學中人工智能學科的一部分。

概念挖掘是一個專注于以數字方式提取文檔中的想法和概念。概念挖掘可用于任何類型的文檔,而不管文檔的格式如何。此策略適用于較小的文檔,但是對于較長的文檔尤其有效,因為可以在整個文檔過程中提取思想。這與提取文本的特定部分不同,特別是如果提取的部分中包含的單詞根據使用的上下文可能具有不同的含義,由于概念挖掘將整個文本作為一個整體來考慮,那么基于文檔整體流程收集意圖和意義的能力會增加概念挖掘的實際應用包括能夠掃描公司數據庫中包含的多個文檔,并基于在類似文檔中找到的概念將它們關聯起來這有助于實現以文本挖掘或其他形式的數據挖掘無法實現的方式交叉引用大量文檔的能力。公司通常會將此方法與其他策略一起使用,以便為訪問相關的盡量減少延遲。雖然概念挖掘的想法已經存在了幾十年,這一過程變得越來越重要,因為各種規模和類型的公司和機構更多地依賴于電子數據,而不是紙質文件。為此,開發可定制的軟件應用程序,以允許從概念的角度將各種文件聯系起來,也變得越來越普遍這些軟件程序的配置允許一定程度的直觀活動,作為識別文本概念和查找與其他文檔的邏輯連接的手段,這種文檔組織和檢索方法可以極大地提高充分利用存儲在存儲中的文檔的能力,使思想和相關任務的檢索更快、更容易。