知識提取是利用各種信息源建立一個有凝聚力的知識庫的過程。作為這種方法的一部分,知識提取通常會利用一系列結構化和非結構化的資源。當成功時,知識提取會產生可靠的數據,這些數據可以由給定的程序,允許最終用戶將這些形...
知識提取是利用各種信息源建立一個有凝聚力的知識庫的過程。作為這種方法的一部分,知識提取通常會利用一系列結構化和非結構化的資源。當成功時,知識提取會產生可靠的數據,這些數據可以由給定的程序,允許最終用戶將這些形式化的知識用于他或她想要的任何目的。在知識提取過程中,可能會使用幾種不同的源。在結構化源的范圍內,可以從各種類型的關系數據庫或某種可擴展的數據庫中提取數據標記語言或XML源。非結構化源,如圖像、不同形式的文字處理文檔、電子表格,甚至記事本式程序中捕獲的文本,都可以用作提取過程的一部分。只要用于管理知識提取過程的程序能讀懂這些源,它們就可以作為一種資源,它擴展了通過提取而推進的項目的潛力,并允許最終生成的知識可用。在知識提取過程中,有幾種常見的應用程序。一個常見的例子是從非結構化源捕獲數據并將其合并到一些結構化知識源的類型。提取關系數據庫中的數據并使用它創建新文檔,或使用電子文檔將數據導入關系數據庫中,這是另一個例子,說明了這種類型的提取可以加快正式知識的共享,而不需要手動輸入從其他來源獲得的數據這種以某種新格式重用現有知識在許多場景中通常非常有用,這使得以現有源可能無法使用的方式利用這些知識。通過這種方式,用戶可以為許多不同的應用程序創建理想的源,而不僅僅是那些與形式知識的原始家園。使用數據提取,可以利用龐大的數據倉庫,輕松導入和導出數據,以創建可用于特定用途的新源。這些新創建的源也會在數據倉庫中找到一個位置,最終可用于創建新的提取,以滿足新的使用需求。記住這一點,可以查看知識提取作為一個非常有用的工具,它有助于充分利用現有的所有資源,簡化與共享正式知識有關的許多任務
-
發表于 2020-08-07 14:41
- 閱讀 ( 1847 )
- 分類:電腦網絡