我最近幫助客戶從其網站中刪除了舊的聯系方式,他們并沒有打算將其公之于眾,也沒有意識到,直到百度索引了那些頁面。
雖然這不會立即從百度取消索引,但它讓我想到有人可能想要阻止搜索引擎在任何損壞完成之前索引頁面的原因。
阻止百度對網頁編制索引的3個理由
雖然您可能想了解如何阻止百度對網頁編制索引的緊迫原因很少,但以下是一些營銷原因。
1.改善您的跟蹤和目標歸因
對于許多網站管理員和營銷人員,通過訪問“感謝您”頁面來跟蹤表單完成的目標。為了防止感謝頁面意外收到自然流量,您需要了解如何防止百度完全索引頁面。
如果除了填寫表單的用戶之外,您的網頁上還有自然流量登陸,那么您的目標和目標轉化率就不準確。
2.減少沒有用戶價值的頁面
雖然這是一個過于簡單化的模型,但您幾乎可以想象您的網站擁有一個SEO值。
對于有10頁的網站,每個頁面大約是SEO值的十分之一。如果網站所有者已經學會了如何進行關鍵字研究并優化了所有頁面,那么所有這些頁面都將高效且有效地生成有機流量。
相反,對包含100頁的網站進行成像。實際上有四個頁面涉及業務服務,其他96個頁面是“博客帖子”,實際上只是所有者將信息轉儲到他們的網站上。這些頁面未滿足已知的受眾需求,也未針對任何相關的關鍵字組進行優化。
在我們的簡化模型中,SEO值池稀薄。四個服務頁面中的每一個都接收到網站聚合SEO值的1/100,即使它們相對優化也非常弱。其他96頁正在接收96/100的價值,但它們是陷入困境并浪費您網站排名潛力的死路。
學習如何防止搜索引擎索引頁面(或96)是一種很好的方法來保持您的網站的SEO值不會過于分散。您可以隱藏搜索引擎中的大多數網站,以便百度只知道應該找到的有用且相關的網頁。
3.避免重復內容問題
發布與互聯網上的另一個頁面相同或幾乎相同的頁面可能會導致一些不必要的決策。
哪個頁面是原始的?即使其中一個頁面首先發布,重復頁面是否跟隨更權威的來源?如果這兩個頁面都在您的網站上,您打算將哪一個頁面包含在百度的搜索結果中?你可能并不總是喜歡這個結果。
為避免導致重復的內容問題,您可以嘗試阻止漫游器抓取您網站上的某些網頁。
如何防止百度索引頁面
阻止搜索引擎索引頁面的最簡單和最常用的方法是包含meta noindex標記。
包括Noindex標簽
noindex元標記用于網頁上的 HTML標記之間,以防止搜索引擎機器人在其索引中包含該頁面。這仍然允許抓取工具讀取您的網頁,但它表明它們不包含在其搜索結果中提供的副本。
阻止搜索引擎索引頁面的noindex標記如下所示:
如果您只是擔心阻止百度將網頁編入索引,您可以使用以下代碼:
如果您使用WordPress作為您的CMS(我強烈推薦),那么您可能想要使用Yoast SEO插件(我也強烈推薦)。只需點擊幾下鼠標,就可以將noindex標記添加到您想要的任何頁面。
在任何頁面的后端,向下滾動到您的Yoast SEO框。然后單擊齒輪圖標,并更改“允許搜索引擎在搜索結果中顯示此帖子?”的下拉字段,說“不”。
這不是指令,因此搜索引擎可以選擇忽略您的meta noindex標記。要獲得更加堅固的技術,您可以使用robots.txt文件。
在你的Robots.txt中禁止機器人
如果您想確保Googlebot和Baiduspider等機器人根本無法抓取您的網頁,您可以在robots.txt文件中添加指令。
Robots.txt是在Apache服務器的根目錄中找到的文件,它可以禁止某些機器人首先進入您的頁面。重要的是要注意,可以指示某些機器人忽略您的robots.txt文件,因此您實際上只能使用此技術阻止“好”機器人。
要禁止所有機器人訪問此頁面,您可以在robots.txt中使用以下代碼:
User-agent: *
Disallow:/ example-page /
請注意,您不必使用完整的URL,只需使用域名后面的URI。如果您只想阻止Baiduspider抓取該網頁,您可以使用以下代碼:
User-agent:Baiduspider
Disallow:/ example-page /
使用.htaccess阻止機器人抓取您的網站
我個人不知道任何需要使用它的客戶端,但您可以使用.htaccess文件來阻止任何用戶代理抓取您的網站。
這是一種徹底阻止Baiduspider抓取您的網站的方法,即使是“壞”機器人也無法忽略。需要注意的是,這更像是一個全面的解決方案,而且針對特定頁面的目標較少。管理.htaccess文件內多個頁面的目標拒絕訪問將是一場噩夢。
阻止Baiduspider的代碼如下所示:
RewriteEngine On
RewriteCond%{HTTP_USER_AGENT} Baiduspider [NC]
RewriteRule。*? -? [F,L]
如果您想一次阻止幾個機器人,可以像這樣設置代碼:
RewriteEngine On
RewriteCond%{HTTP_USER_AGENT} ^。*(Googlebot | Bingbot | Baiduspider)。* $ [NC]
RewriteRule。*? -? [F,L]
學習如何防止搜索引擎索引你的某個頁面有時是必要的,而且根據你選擇的方式而定并不是很困難。