SemrushBot是什么蜘蛛,這個(gè)爬蟲怎么屏蔽
SemrushBot是SEMrush的服務(wù)器搜索蜘蛛,SEMrush 是一個(gè)強(qiáng)大的、全面的在線營(yíng)銷競(jìng)爭(zhēng)情報(bào)平臺(tái),其中包括 SEO、PPC、社交媒體和視頻廣告研究。機(jī)器人抓取你的網(wǎng)頁(yè)來(lái)解析你的網(wǎng)站內(nèi)容,所以相關(guān)的信息在你的網(wǎng)站很容易索引和更容易獲得用戶搜索內(nèi)容。
可以看得出來(lái),對(duì)我們中文網(wǎng)站來(lái)說(shuō)一樣沒(méi)什么用,屬于營(yíng)銷類的蜘蛛,可以選擇屏蔽掉。
常規(guī)屏蔽方式就是寫一下robots規(guī)則來(lái)屏蔽它的爬取
User-agent: SemrushBot Disallow: / User-agent: SemrushBot-SA Disallow: / User-agent: SemrushBot-BA Disallow: / User-agent: SemrushBot-SI Disallow: / User-agent: SemrushBot-SWA Disallow: / User-agent: SemrushBot-CT Disallow: / User-agent: SemrushBot-BM Disallow: / User-agent: SemrushBot-SEOAB Disallow: /
這個(gè)這么長(zhǎng)是我在網(wǎng)上找到的,我昨天只添加了第一條,今天他還在繼續(xù)爬,所以不知道是我自己寫的不夠全面,還是它壓根把robots協(xié)議當(dāng)廁紙就不知道了。
為了防止他不講武德,直接服務(wù)器規(guī)則搞起,這次我們改進(jìn)一下,畢竟這些蜘蛛是真的多,比如我們換個(gè)思路,只保留我們需要的蜘蛛,其他全部屏蔽:
if ($http_user_agent !~* "Baidu|Yisou|Sogou|360|Bytes|bing|Google") { return 403; }
就是除了百度,神馬、搜狗、360、頭條、bing、谷歌以外的蜘蛛,全部返回403狀態(tài)(沒(méi)有權(quán)限訪問(wèn)本站),代碼來(lái)自網(wǎng)絡(luò),據(jù)發(fā)代碼的說(shuō)是這樣簡(jiǎn)寫也可以,不放心的話,可以把簡(jiǎn)寫全部換成蜘蛛全名。
掃一掃,關(guān)注我們
相關(guān)新聞
- LOYCMS 常用 if 判斷
- Pbootcms多域名跳轉(zhuǎn)其他語(yǔ)種的欄目錯(cuò)亂問(wèn)題
- pbootcms百度推廣競(jìng)價(jià)/?bd_vid埋碼無(wú)法打開(kāi)
- PbootCMS2.0教程之留言導(dǎo)出excel功能
- 讓網(wǎng)站實(shí)現(xiàn)一鍵切換繁體和簡(jiǎn)體
- 解決PbootCMS后臺(tái)會(huì)員中心無(wú)法隱藏的BUG
- 將網(wǎng)頁(yè)分享到微信帶有縮略圖和簡(jiǎn)介
- 使用偽靜態(tài)屏蔽SEMRUSHBOT,AHREFSBOT,MJ···
- SemrushBot是什么蜘蛛,這個(gè)爬蟲怎么屏蔽
- robots.txt寫法大全和robots.txt語(yǔ)法的作用···