全文搜索引擎
全文搜索引擎(Full Text Search Engine)是目前使用最廣泛的搜索引擎。它的工作原理是計算機索引程序,通過掃描文章中的每一個詞,對每一個詞建立一個索引,注明該詞在文章中出現的次數和位置,并對它進行預排名處理。當用戶查詢關鍵詞時,檢索程序會根據事先建立的索引進行查找,并將查找的結果反饋給用戶,檢索過程類似于通過字典中的檢索字表查字的過程。
簡單地說,全文搜索引擎就是用戶最常用的,使用關鍵詞進行網頁搜索的搜索引擎(如Google、百度等)都屬于全文搜索引擎。Google全文搜索引擎。
全文搜索引擎的檢索方式通常分為按字檢索和按詞檢索兩種。按字檢索是指對文章中的每一個字都建立索引,檢索時將詞分解為字的組合;按詞檢索指對文章中的詞(語義單位)建立索引,檢索時按詞檢索,并且可以處理同義項等。英文搜索引擎按字檢索和按詞檢索時都有空格區分,切分詞就非常輕松;中文搜索引擎則是按字檢索和按詞檢索完全不一樣。按詞檢索中文詞時,需要以詞義和語義切分字詞,才能正確建立詞的索引,難度比英文搜索引擎大很多,這是擁有對中文優勢的百度能戰勝國際搜索巨頭Google最重要的原因之一。全文搜索引擎檢索方式。
根據搜索結果來源的不同,全文搜索引擎可以分為兩類:一類擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,能自建網頁數據庫,搜索結果直接從自身的數據庫中調用,上面提到的Google、百度就屬于此類;另一類則是租用其他搜索引擎的數據庫,并按自定的格式排列搜索結果,如Lycos搜索引擎,目前Lycos主要是通過與雅虎合作,以交易的方式提供給用戶。
從全文搜索引擎的抓取和檢索方式可以看出,全文搜索引擎的信息量巨大,也是用戶需求最大的搜索引擎,占據了絕大部分的搜索市場。這也使全文搜索引擎成為SEO主要針對的搜索引擎類型,不過全文搜索引擎也并非SEO的全部,目錄索引和元搜索引擎對網站優化也有很大的幫助。
|