搜索引擎基本上是一種計算機算法,可以幫助用戶找到他們要找的特定信息。不同的搜索引擎以不同的方式工作,但它們都使用相同的基本原理。 互聯網搜索引擎旨在幫助用戶找到他們在網上尋找的東西搜索引擎要想發揮作用,首先...
搜索引擎基本上是一種計算機算法,可以幫助用戶找到他們要找的特定信息。不同的搜索引擎以不同的方式工作,但它們都使用相同的基本原理。

互聯網搜索引擎旨在幫助用戶找到他們在網上尋找的東西搜索引擎要想發揮作用,首先要做的就是建立一個本地數據庫,基本上,互聯網。早期版本只是索引了網頁的關鍵詞和標題,而現代版本則索引了每一頁上的所有文本,以及關于該網頁與其他網頁的關系的大量其他數據,以及在某些情況下,頁面上的所有或部分媒體也是如此。搜索引擎需要索引所有這些信息,以便能夠有效地在上面運行搜索,而不是每次發送搜索查詢時都必須在Internet上運行

搜索引擎的最新趨勢是擺脫基于關鍵字的搜索,而采用基于概念的搜索早期的版本通常需要將頁面提交給它們,以便對它們進行爬網,但現在大多數頁面都是通過跟蹤其他頁面的鏈接來找到的所謂的"機器人"或"蜘蛛",是為索引頁面而構建的計算機程序,從一頁到另一頁,記錄頁面上的所有數據,并跟蹤每個鏈接到新頁面。不同的搜索引擎以不同的時間間隔刷新索引,這取決于它們不斷爬行的蜘蛛數量和蜘蛛爬行的速度一些人每天或兩天上網,另一些人則每周或每月定期刷新。當蜘蛛瀏覽這些網頁時,它記錄在頁面上找到的單詞,記錄每個單詞出現的次數,單詞是否以某種方式加權,可能是基于大小、位置或HTML標記,并根據進入頁面的鏈接和頁面的一般上下文來決定單詞的相關性然后,搜索引擎必須衡量每一頁的價值,以及每一頁上出現的單詞的價值。這是最棘手的部分,也是最重要的。在最簡單的層面上,它可以簡單地跟蹤頁面上的每個單詞,并將該頁面記錄為與該關鍵字搜索相關的頁面。然而,這對大多數用戶沒有多大好處,因為所需要的是與搜索查詢最相關的頁面。因此,不同的引擎會采用不同的方法來加權重要性各種搜索引擎使用的算法都得到了很好的保護,以防止人們為了獲得更好的排名而專門創建頁面,或者至少限制他們可以這樣做的程度。這就是為什么不同的搜索引擎對相同的詞產生不同的結果Google可能會認為一個頁面是搜索詞的最佳結果,Ask可能會確定同一個頁面甚至不在前50名中。這完全是基于他們如何評價入站和出站鏈接、他們認為重要的關鍵字的密度、他們如何評價詞的不同位置以及任何數量的較小因素搜索引擎的最新趨勢,也可能是整個搜索的未來,是從基于關鍵字的搜索轉移到基于概念的搜索。在這種新的搜索形式中,不再局限于搜索者輸入的關鍵字,該程序試圖找出這些關鍵字的含義,這樣它就可以建議那些可能不包括確切的單詞,但仍然是搜索主題的頁面。這仍然是一個發展中的領域,但到目前為止,似乎有很大的潛力使搜索更具相關性,使網絡成為一個更容易找到你想要的東西的地方。