Web挖掘是一種信息收集形式,適用于從在線來源收集的數據。從Internet上的數據源收集數據允許用戶聚合大量信息進行分析,以便在在線環境中做出關鍵的業務決策。例如,研究人員可以使用web挖掘來收集有關web內容中特定關鍵...
Web挖掘是一種信息收集形式,適用于從在線來源收集的數據。從Internet上的數據源收集數據允許用戶聚合大量信息進行分析,以便在在線環境中做出關鍵的業務決策。例如,研究人員可以使用web挖掘來收集有關web內容中特定關鍵字使用情況的信息。或者,零售商和其他營銷專業人員使用在線數據挖掘來發現web流量的趨勢,即網站訪問者向買家的轉化,

對于營銷專業人士來說,網絡挖掘提供了與營銷活動相關的豐富用途。
,對數據進行分類和分析,web挖掘模仿了傳統的數據挖掘活動。相比之下,web挖掘活動關注的是基于web的信息,而不是像離線計算機數據庫、客戶記錄或硬拷貝會計數據這樣的大量信息源,傳統的數據挖掘通常會發生這種情況。僅關注從在線來源收集的數據可以為在線營銷策略、網站結構決策和類似的電子商務相關決策提供有針對性的分析。通過網絡挖掘收集數據還可以為廣泛的國際市場提供額外的好處人口統計,由于研究人員和信息收集者都可以訪問來自世界各地的網站。

從互聯網上收集的數據允許用戶為在在線環境中進行關鍵業務決策的分析
從專業角度講,web挖掘分為三類:web結構挖掘、使用情況挖掘和web內容挖掘,每個領域都關注特定信息,如特定網站的結構和超鏈接、有關訪問者使用情況的服務器日志信息,網站分析軟件包和服務是web使用挖掘的一個主要例子,它為網站管理員提供有關訪問者流量、使用的搜索結果、單擊的鏈接以及與特定頁面交互所花時間的信息。另一方面,結構挖掘,提供有關特定網站內部結構的詳細信息,包括超鏈接、數據庫和查詢功能。
對于營銷專業人士來說,web挖掘提供了與營銷活動相關的豐富用途。了解網站訪問者如何使用特定網站,競爭對手如何建立競爭網站,以及什么內容已經在線的信息是有價值的信息。這些信息有助于關鍵決策者根據先前證明的技術和記錄的信息制定營銷策略。
高校還通過驗證學生論文的唯一性和不抄襲的軟件來利用web挖掘。使用web內容挖掘原則上,這樣的評分助手在整個互聯網上搜索相似的內容。教師上傳學生文檔的文本,然后指導剽竊軟件在線檢查互聯網上是否有相似的短語或復制的文本。結果通常以匹配文本的百分比表示。提供了任何類似結果的鏈接允許教師訪問網站,以確定比賽是否真的是剽竊。