你把網(wǎng)站做好了,配色挑了,圖片放了,文案改了,鏈接也點了好幾遍,最后鄭重其事按下上線按鈕,心里想的是:“好了,全世界快來發(fā)現(xiàn)我?!苯Y(jié)果過了幾天一看,安靜得像新開的店鋪連路過的貓都沒抬頭。這時候很多人就會疑惑:網(wǎng)站為什么不被搜索引擎抓???說白了,搜索引擎也不是神仙,它不會突然心靈感應(yīng)到“這里新開了一家網(wǎng)站,快去看看”。如果網(wǎng)站本身在結(jié)構(gòu)、設(shè)置和內(nèi)容上沒有把門打開,它就很容易像把招牌掛在地下室,自己覺得挺正式,外面卻根本看不見。
最常見的問題,就是網(wǎng)站雖然上線了,但從技術(shù)上看并沒有真正“歡迎光臨”。有些網(wǎng)站在開發(fā)階段為了防止內(nèi)容提前被看到,會設(shè)置禁止抓取,等正式上線時卻忘了取消。結(jié)果搜索引擎的爬蟲一來,門口赫然寫著“謝絕入內(nèi)”,那它當然掉頭就走。這種情況就像你請客吃飯,門上貼著“暫停營業(yè)”,然后還納悶為什么沒人進來,多少有點誤會。
還有一種情況,是網(wǎng)站結(jié)構(gòu)太繞,搜索引擎進來了也容易迷路。頁面層級太深、導(dǎo)航混亂、內(nèi)部鏈接少,都會讓爬蟲像第一次逛大型迷宮,一路轉(zhuǎn)來轉(zhuǎn)去,最后只想回家。網(wǎng)站設(shè)計不只是給人看,也是在給搜索引擎指路。一個清晰的網(wǎng)站,首頁能帶出欄目頁,欄目頁能通向內(nèi)容頁,頁面之間還能互相連接,這樣搜索引擎抓取起來才順暢。要是每個頁面都像孤島,爬蟲就算想努力,也未必知道下一步該去哪兒。

頁面內(nèi)容太單薄,也是抓取和收錄效果不理想的常見原因。有些網(wǎng)站首頁看著挺漂亮,大圖輪播很氣派,動畫切換很絲滑,但真要看文字信息,除了“歡迎訪問”和“聯(lián)系我們”,幾乎沒有什么能讀的。搜索引擎畢竟不是來參加視覺展覽的,它更關(guān)心頁面到底講了什么,有沒有清晰主題,有沒有實際信息。如果整站內(nèi)容空空蕩蕩,或者幾頁內(nèi)容寫得都差不多,那它很難判斷你的網(wǎng)站價值,自然不會表現(xiàn)得太積極。
再有就是網(wǎng)站打開太慢。用戶遇到慢網(wǎng)站,可能皺皺眉關(guān)掉;搜索引擎遇到慢網(wǎng)站,也會覺得抓取效率太低。圖片太大、代碼太亂、服務(wù)器不穩(wěn)定,這些都會影響頁面訪問速度。別看速度這個問題平時不聲不響,一到抓取環(huán)節(jié)就很像拖后腿的同事,表面不搶戲,實際很影響結(jié)果。網(wǎng)站如果連打開都費勁,搜索引擎當然也不愿意頻繁來串門。
網(wǎng)址設(shè)置混亂,也很容易讓抓取效果打折。比如同一內(nèi)容能通過多個地址訪問,或者動態(tài)參數(shù)一長串,今天這個版本,明天那個版本,搜索引擎一看就頭大。它不是不能理解,而是會增加判斷成本。規(guī)范的網(wǎng)址、清楚的頁面指向、穩(wěn)定的內(nèi)容路徑,都會讓抓取這件事變得更輕松。簡單點說,網(wǎng)站越整潔,搜索引擎越省心。
還有些網(wǎng)站特別喜歡“神秘感”,重要內(nèi)容全做進圖片里,或者大量依賴腳本展示,文字少得像在玩猜謎游戲。用戶可能勉強還能靠視覺理解,搜索引擎就沒那么輕松了。網(wǎng)站設(shè)計如果只顧著炫效果,卻忽略信息可讀性,就容易變成“看著很熱鬧,實際很難識別”。真正友好的設(shè)計,應(yīng)該兼顧展示效果和信息傳達,而不是讓頁面像個花里胡哨的盒子,外表挺閃,里面打不開。
另外,網(wǎng)站更新頻率太低,也會影響抓取積極性。一個長期不更新的網(wǎng)站,在搜索引擎眼里就像一家多年不開燈的店,偶爾路過看看也就算了,沒必要天天來。適度增加新內(nèi)容、保持頁面活躍度,會讓搜索引擎更愿意重新訪問。它不是偏心,它只是更喜歡那些一直有新東西的網(wǎng)站。