目錄索引
目錄索引(Search Index/Directory)是搜索引擎按照各個網站的性質把其網址分門別類收集起來,既可以是網站自己提交,也可以是搜索引擎自己提取。通常目錄索引有幾級分類,然后是各個網站的詳細地址,一般還會提供各個網站的內容簡介,就像一個電話號碼簿。
用戶在目錄索引中查找網站時,既可以使用關鍵字進行查詢,也可以根據相關目錄逐級查詢,還能找到相關的網站。但在目錄查詢時,只能夠按照網站的名稱、網址、簡介等內容進行查詢,所以它的查詢結果也只是網站的URL地址,不能查到具體的網站頁面。所以從嚴格意義上來說,目錄索引并不是真正的搜索引擎,如國內的搜狐目錄、hao123、1234網址導航等及國際的Dmoz等。hao123網址導航,下面的各種菜單就是目錄的各級分類。
目錄索引和全文搜索引擎有著很大的區別,主要體現在以下3個方面。
(1)目錄索引通常是用戶提交,或者網站自己進行人工添加。在添加時,目錄索引工作人員會根據收錄規則對網站進行檢查,然后判斷是否進行收錄。全文搜索引擎是通過蜘蛛程序進行互聯網爬行,對網站進行收錄。
(2)目錄索引收錄的內容通常只有網站的名稱、網址、簡介等網站主體外的內容,而網站內各網頁的內容是沒有的;而全文搜索引擎是通過蜘蛛爬行抓取的,所以會抓取網站內所有可以抓取的網頁內容。
(3)目錄索引收錄對網站要求更高,評判標準十分嚴格,一般要求網站質量高的大網站才能被收錄。全文搜索引擎通常在收錄網站時要求不高,收錄的網站數量更多。
目錄索引嚴格意義上說并不是現代搜索引擎,因為通過搜索得到的網站全是通過人工編輯的,而不是搜索引擎自動抓取的,而且信息量和現代搜索引擎相比更是遠遠不及。所以目錄索引在搜索引擎發展初期能算作搜索引擎,現在已經遠遠不能滿足大部分人的需求了,像Yahoo等目錄索引,也開始了與全文搜索引擎合作,和Bing搜索的合作就是體現但是在目錄索引已經快沒有市場,與全文搜索引擎合作的情況下,很多全文搜索引擎卻加入了目錄索引的搜索形式,例如Google就使用ODP數據庫提供分類查詢。目錄索引雖然不能算嚴格意義上的搜索引擎,也不是我們所要關注的主要優化搜索引擎,但是目錄索引卻是一個很好的外鏈優化平臺。
|