結構挖掘是對半結構化數據源進行掃描,發現并突出顯示其結構元素的一種數據挖掘,半結構化數據源是指不使用傳統的表數據庫結構的數據源,但是它有一個語義元素,通過標記和標記來分離信息。結構挖掘可以用來挖掘數據庫,網站和...
結構挖掘是對半結構化數據源進行掃描,發現并突出顯示其結構元素的一種數據挖掘,半結構化數據源是指不使用傳統的表數據庫結構的數據源,但是它有一個語義元素,通過標記和標記來分離信息。結構挖掘可以用來挖掘數據庫,網站和許多其他形式的計算機信息來發現結構的元素。它可以幫助用戶了解片段之間是如何相互作用的,或者如何在某些標記下找到信息。這種挖掘還可以用來預測項目是什么,基于用戶編寫的規則。結構挖掘是一種數據挖掘類型,其中掃描半結構化數據源,發現并突出顯示其結構的元素。有許多不同類型的數據挖掘,其中大多數涉及挖掘傳統結構化源。這包括使用大多數數據庫中典型的表和節點。在結構挖掘中,只使用半結構化數據。在這種情況下,數據來自網站或簡單數據庫,這些數據庫的結構不符合傳統數據庫規則。這些數據需要標記或標記,以便正確地挖掘每個項目。通過讀取半結構化數據集,結構挖掘能夠發現結構是如何相互作用的,例如每個網站都有一個導航模型,正是這個模型決定了頁面之間的交互,通過挖掘結構,用戶可以發現這種導航是如何工作的,這有助于創建類似的導航架構。結構挖掘還可以通過將規則寫入挖掘程序來查找項目。例如,如果有圖書數據集,用戶可以編寫一條規則,任何沒有索引的書籍都應返回為虛構圖書,而有索引的書籍應返回為非虛構圖書大多數小說都沒有索引,所以這條規則可以很精確地預測數據是什么。這有助于用戶查看一個半結構化的集合,它有一個組織方法,但不適合用戶的需要。在弄清半結構化單元的結構后,用戶通常會將其與另一個半結構化單元進行比較,如果用戶有一個商業網站,他或她可以挖掘另一個商業網站進行導航和鏈接,并查看其網站的相似性。通過比較挖掘出的信息,用戶可以找到提高結構效率的方法
-
發表于 2020-08-06 22:01
- 閱讀 ( 816 )
- 分類:電腦網絡