模式匹配是一種將兩個或兩個以上的復雜數據庫或信息集合并到一起的技術。隨著數據庫和電子信息存儲在互聯網上的使用越來越廣泛和復雜,必須定義將數據集從一個數據庫合并到另一個數據庫的方法,模式匹配就是這樣一種技術...
模式匹配是一種將兩個或兩個以上的復雜數據庫或信息集合并到一起的技術。隨著數據庫和電子信息存儲在互聯網上的使用越來越廣泛和復雜,必須定義將數據集從一個數據庫合并到另一個數據庫的方法,模式匹配就是這樣一種技術,概念簡單,但數據合并的現實卻相當復雜術語“模式匹配”與“模式映射”同義,因為用戶實際上是在映射數據,不匹配。兩個或多個數據庫映射在一起,并且每個數據庫的相似方面相互映射。合并數據最常見的方法是使用精確引用。這種合并方式的一個例子是將一個數據庫的name列與另一個數據庫的name列相結合對于人或計算機來說,合并通常不是那么簡單。因為有太多的數據需要過濾、組合和使用,擁有一個數據庫而不是多個數據庫是必不可少的。模式映射的重點是使這一繁瑣的過程自動化并提高效率。例如,當一個數據庫有一個“學生專業”字段,而另一個數據庫有一個“學生的研究領域”字段時,可能需要模式匹配。這是相同的信息,但稍微不同的標題使混合信息的工作復雜化模式匹配將數據庫合并的復雜過程分為四個步驟:預集成、比較、整合和合并。在多個數據庫可以合并之前,需要分析它們的異同。在模式匹配領域,這就是所謂的預集成。計算機開始決定有效的集成方法。下一步,計算機通過在更詳細的層次上相互比較來評估方案。在比較步驟中,計算機查看每個數據庫條目并確定可能存在沖突的位置例如,“學生興趣”字段列出“醫生”,而另一個數據庫將其列為“醫生”。一個人可能會認為這些信息是相同的,但對于數據庫工具來說,它們是兩個獨立的實體計算機已經確定了所有潛在的沖突,它可以繼續努力解決問題。這可能很簡單,只需將“醫生”的所有實例都改為“醫生”。實際上,這個過程要復雜得多解決所有沖突后,計算機可以繼續在架構匹配過程中合并數據。在此階段,將兩個或多個數據庫合并到一個大型數據庫中。如果一切順利,則在集成和將來訪問數據庫期間不會發生沖突或錯誤
-
發表于 2020-07-31 14:31
- 閱讀 ( 1693 )
- 分類:電腦網絡