統計上不太可能的短語(SIPs)是由Amazon.com開發的一種搜索技術,用于搜索書籍內容中可能是唯一的或經常出現的短語。這是亞馬遜的專利搜索的一部分!?技術程序。本質上,Search Inside?允許Amazon訪問書籍的部分或完整文本,...
統計上不太可能的短語(SIPs)是由Amazon.com開發的一種搜索技術,用于搜索書籍內容中可能是唯一的或經常出現的短語。這是亞馬遜的專利搜索的一部分!?技術程序。本質上,Search Inside?允許Amazon訪問書籍的部分或完整文本,因此,如果在搜索中使用了統計上不太可能的短語,則可以使用某些短語來識別該書。手持計算機的人對這項技術的名稱有點困惑。當您執行搜索時,您希望您要搜索的內容緊密匹配。通過在一本書中標識一個唯一的短語,如果您使用該短語進行搜索,則您的搜索不太可能列出您不想要的內容。如果您正在查找一本特定的書,但記不住書名,但可以記住其中的引用,則可以使用該引用進行搜索書。或者,你可能想在一個更大的主題中搜索一個特定的主題。例如,如果你想搜索一本有職業建議的書,但你真正想讀的是如何在網絡上尋找工作,你可以搜索“人際網絡”而不是“職業建議”。馬上,一些最相關的搜索出現在亞馬遜的搜索結果頁面上,其中包括《在口渴之前挖好你的井:你需要的唯一一本網絡書》。如果你用這些統計上不太可能的短語進行搜索,你可能會注意到你會得到不完全匹配的結果。例如,網絡的第一個搜索結果不是針對職業網絡,而是針對計算機和技術網絡信息。你可以通過更具體的方式,使統計上不太可能出現的短語變得更好。例如,通過在“職業網絡”或“工作網絡”下搜索,可以獲得更好的結果統計上不太可能的詞組實際上是可能的詞組,因為它很可能是內部搜索所特有的詞組!?book將在您搜索的內容列表中居首。例如,從莎士比亞十四行詩中輸入一行莎士比亞的話來引出關于莎士比亞的書。這并不總是有效的,因為很多其他書都用一些非常著名的引語作為標題。如果你搜索“生存或不存在”,你就找不到哈姆雷特,也找不到麥克白用統計上不太可能的短語,比如“Out!“該死的斑點。”事實上,在后一個術語下,你會找到的第一本書是關于污點去除的書。使用統計上不太可能的短語也是搜索網頁內容的一種方式,而網絡爬蟲可能會使用類似的技術,以便人們能夠最有效地、特別地搜索某些獨特的行。這不是一種完美的技術因為網絡爬蟲不一定要評估內容,它可能會尋找關鍵字重復,這樣人們就可以找到重復次數更高的文章。并不是亞馬遜上所有的書都有搜索功能!?技術,但這似乎是一種趨勢。最終,即使系統稍有不足,也可以縮短搜索時間
-
發表于 2020-08-07 12:09
- 閱讀 ( 567 )
- 分類:電腦網絡