1、收錄頁面:
一般收錄頁面需要有百度蜘蛛抓取完成,通過抓取算法來決定收錄那些頁面,在百度的算法調整后,對于偽原創、采集站點予以強烈的打擊,所以百度在收錄頁面方面變得更加的嚴格了,高質量內容頁面以及權重高的站點一般收錄頁面的幾率會高很多。對于收錄頁面這方面相信很多的站長都是很清楚,每天百度蜘蛛都在分分秒秒不停地收錄著,但是你會發現其實大部分的站點的收錄都減少了,這是為什么呢?因為百度需要過濾頁面。
2、過濾頁面:
很多頁面被百度收錄之后,百度認為該頁面對用戶沒有太大的價值,或者是質量度比較低的頁面,百度必然就會過濾,這也是用戶體驗好的一種表現,很多站點以優化為目的,絲毫不考慮用戶的體驗,例如一些橋頁、跳轉頁面這些就是典型,百度的k站就是一種過濾頁面的表現,把那些作弊的站點的頁面全部的過濾掉。很多人抱怨6.22和6.28百度k站事件,尤其是那些屌絲站長們整天在論壇抱怨這個抱怨那個,為什么k你的站,很顯然你的站點真的是以用戶體驗為核心運營站嗎?做SEO的人大多都是為了優化而運營站點,每天寫的站內的更新、做外鏈肯定一部分是為了優化而優化,百度k你的站是犧牲少部分人的利益,更多的用戶是從中獲益的,要知道多少人在使用百度,如果搜索出來的信息是你為了優化而運營的站點,低質量的頁面,那百度其實是拿自己未來的前途給你優化站點做鋪墊的。所以過濾頁面這方面百度非常的嚴格,大家也不要使用seo作弊技術了。
3、建立索引:
經過了收錄頁面以及過濾頁面的工作之后,百度會對這些頁面逐一進行標記和識別,并將這信息進行儲存為結構化的數據,儲存到百度的搜索的服務器中,這些儲存的數據有網頁的信息、網頁的標題關鍵詞頁面描述等標簽、網頁外鏈及描述、抓取記錄。還會將網頁中的關鍵詞信息進行識別和儲存,以便與用戶搜索的內容進行匹配。建立完善的索引數據庫,方便呈現出最佳的顯示信息
4、顯示信息:
用戶輸入的關鍵詞,百度會對其進行一系列復雜的分析,并根據分析的結論在索引庫中尋找與之最為匹配的一系列網頁,按照用戶輸入的關鍵詞所體現的需求強弱和網頁的優劣進行打分,并按照最終的分數進行排列,展現給用戶。一般顯示出最佳信息需要是最適合匹配關鍵詞相關的頁面,包括網站站內優化和網站站外優化的因素。