爱营销致力于通过哈尔滨网站建设、哈尔滨网络推广、哈尔滨seo和网站优化等网络营销方案帮助企业提升网站排名,扩大品牌知名度,带来大量精准流量提升业绩。

Robots.txt优化的重点细节

seo优化技巧方法 爱营销 478℃ 0评论

Robots.txt优化的重点细节是每个站长都应该关注的问题,因为透过 Robots.txt 我们可以直接与搜索引擎蜘蛛进行对话,告诉他们哪些可以抓取,哪些不可以抓取,下面就让我们来一起看一下Robots.txt优化的重点细节。

一、为什么Robots.txt?

在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。

robots

robots

二、一些常见的问题和知识点

1、蜘蛛在发现一个网站的时候,第一步是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况);

2、建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件;

三、在robots.txt文件中设置网站地图

你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。你可以像这样来添加:

Sitemap:http://域名/map.xml(支持链接形式:xml、html,一般建议使用xml形式)

四、robots.txt优化的重点细节,Robots.txt的顺序.

在蜘蛛协议中,Disallow 与 Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。

引擎蜘蛛程序会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白:

User-agent: *

Allow: /aiyingxiao/bbs

Disallow: /aiyingxiao/

这个情况下,蜘蛛/aiyingxiao/bbs目录可以正常抓取,但/aiyingxiao/目录的文件无法抓取。通过这种方式可以允许蜘蛛访问特定目录中的部分url。

我们对调下位置观察一下。

User-agent: *

Disallow: /aiyingxiao/

Allow: /aiyingxiao/bbs

/aiyingxiao/目录出现在第一行,禁止抓取目录下的所有文件,那么第二行的Allow就无效,因为第一行中已经禁止抓取aiyingxiao目录下的所有文件,而bbs目录正好位于aiyingxiao目录下。因此匹配不成功。

五、Robots.txt路径问题

在蜘蛛协议中,Allow和Disallow后面可以跟两种路径形式,即绝对链接、相对链接。robots.txt优化的重点细节绝对链接就是完整的URL形式,而相对链接只针对根目录。

六、斜杠问题

Disallow: /aiyingxiao 表示禁止抓取aiyingxiao这个目录下的所有文件,如aiyingxiao/1.html、aiyingxiao/sdgdsg.php;

Disallow: /aiyingxiao/ 表示禁止抓取aiyingxiao这个目录,而aiyingxiao.1.html、aiyingxiao/sdgdsg.php是可以抓取的。

以上就是robots.txt优化的重点细节的相关内容,想要了解更多SEO优化知识可以访问爱营销SEO优化技巧版块。

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情