deepweb是互聯網中不屬于標準搜索方法的一部分。標準搜索引擎通過調出一個頁面并點擊所有鏈接來查找網頁。這使得它們可以像巨大的蜘蛛網一樣從單個頁面擴展出去,通過鏈接找到一頁又一頁。這個過程只捕獲互聯網上存在...
deepweb是互聯網中不屬于標準搜索方法的一部分。標準搜索引擎通過調出一個頁面并點擊所有鏈接來查找網頁。這使得它們可以像巨大的蜘蛛網一樣從單個頁面擴展出去,通過鏈接找到一頁又一頁。這個過程只捕獲互聯網上存在的網頁的一小部分;由于許多原因,大量的數據是完全不保密的。這些網頁永遠不會出現在標準的搜索引擎中,因此對大多數網絡用戶來說是看不見的。deep web存在的原因主要是由于搜索引擎的限制,surface web是大多數用戶都熟悉的Internet部分。此部分包含大多數用戶都知道的標準網頁和web服務。deep web由只有特定部分Internet用戶知道或可以訪問的信息組成。deep web與surface web相比是巨大的;在2000年,它是surface web的近50倍。deep web存在的原因主要是由于搜索引擎的局限性。當搜索引擎瀏覽鏈接時,它們無法訪問某些類型的網頁。這些網頁從不進入系統,因此,永遠不會索引。當用戶搜索其中一個頁面時,他或她將永遠找不到它,因為搜索引擎不會記錄它的存在或訪問失敗的情況。有許多不同的頁面類型很難或不可能被搜索引擎索引。動態和基于數據庫的網頁實際上是不可能的,因為它們需要特定的輸入才能存在。這些網頁通常是通過用戶輸入的方式即時生成的。由于動態頁面在需要時才存在,因此搜索引擎會跳過它們,因為它們不知道要問什么。私有或封閉的網頁構成了deep web的另一大部分由于這些頁面需要憑據或登錄信息,而搜索引擎卻沒有,因此無法訪問登錄另一端的信息。即使存在此問題,一些基于登錄的網站是surface web的一部分。該網站設置了允許引擎搜索其頁面的特殊規定。這在具有開放注冊并希望生成額外流量的頁面中很常見。deep web的另一大部分是由未鏈接或受限制的網站組成的。這些頁面不包含任何指向外部資源的鏈接或主動阻止現有鏈接。這可防止搜索引擎在頁面上絆倒,因此不會將其添加到任何列表中。這以前在個人網頁中很常見,但現代網絡使用的變化已使大多數個人網頁鏈接和索引
-
發表于 2020-08-06 14:43
- 閱讀 ( 1852 )
- 分類:電腦網絡