说到蜘蛛陷阱,可能很多seo新手都没有听过,什么是蜘蛛?蜘蛛陷阱是阻止 蜘蛛爬行网站的障碍物或者说是干扰物,很多蜘蛛陷阱是人为的,也有很多是不小心造成的,既然是蜘蛛陷阱那就是对于蜘蛛的陷阱,对用户是没有影响的,所以可 能网页界面看起来非常正常,但里面就有可能存在蜘蛛陷阱。如果消除这些蜘蛛陷阱,可以使蜘蛛更好的在网站内部爬行抓取,现在就来看一下一些SEOer不得 不知的蜘蛛陷阱!
1. flash动画 有的朋友会问,为什么Flash是蜘蛛陷阱的一种,其实这个问题很简单,就是因为蜘蛛识别不了Flash,很多网站喜欢在首页做一个Flash动画 然后再跳向HTML页面,用户可以访问网站看完片头后被转向得真正的HTML网页。但搜索引擎蜘蛛呢?蜘蛛是不能通过这个Flash跟踪到HTML版本页 面的。这就是一个陷阱,阻挡了蜘蛛继续抓取网站。如果Flash效果是必需的,木木seo建议在首页Flash文件之外加上一个通往HTML版本的链接, 这样蜘蛛可以跟踪这个链接抓取后面得HTML页面。
2. JS链接 Javascript可以创造出很多吸引人得视觉效果,有些网站喜欢使用Javascript脚本生成导航系统。这也是比较严重得蜘蛛陷阱之一。蜘 蛛对于js也是识别不了的,对于js特效可以加入网站,也可以将不需要被抓取的链接放入js,但是需要进行爬行抓取的链接一定不能放入JS,这会造成蜘蛛 不能继续爬行,同时js也不要太多,可以专门建一个js文件。
3. 动态URL 我们说现在蜘蛛是可以抓取部分URL链接的,但是动态URL是数据库直接生成的,有的带了问号、等号等多个参数。这类网址不仅不利于搜索引擎蜘蛛爬行,而且还可能造成蜘蛛的死循环,这是一个致命的蜘蛛陷阱。所以大多数情况都是建议大家网址静态化。
4. Session ID 有些网站为了跟踪用户访问使用Session ID,每个用户访问网站时都会生成独特唯一得Session ID,也即ID。这个ID都是加在URL中,搜索引擎蜘蛛的每一次访问也会被当成一个新得用户在URL中会加上一个不同的ID,这样蜘蛛每次来访问时所得 到的同一个页面会是一个不一样的URL。结果就很明显,这样一来会产生复制内容页面,造成了高度重复的内容页。
5. Frame框架 框架结构对蜘蛛来说和Flash、js一样都是一道墙,框架结构也会阻碍搜索引擎蜘蛛的爬行和抓取,让蜘蛛掉进陷阱。
6. 要求登录 这个是很常见的,有些网站内容放在需要用户登录之后才能看到得到,设置有的整个网站只能登陆进入后才能看,这对于用户当然没什么,而对于蜘蛛就造成 陷阱,为什么?因为蜘蛛不能填写用户名、密码、也不会注册,自然而然,蜘蛛不能进来抓取你的内容,所以除非是VIP内容或者是不需要蜘蛛抓取的内容,其它 的应该对蜘蛛公开,这样才能抓取。
7. 强制使用Cookies 有些网站为了实现某种功能、如记住用户登录信息、跟踪用户访问路径等、强制用户使用Cookies、用户浏览器如果没有启用Cookies、页面显示不正常。搜索引擎蜘蛛就相当于一个禁用Cookies得浏览器、强制使用Cookies只能造成搜索引擎蜘蛛无法正常访问
8.各种跳转 目前比较建议的网站跳转就是301、302重定向,而其它跳转,蜘蛛是非常的敏感。因为黑帽最喜欢用跳转这种手段了,黑了别人的网站,然后在别人的 网站上挂上一个指向自己网站的跳转。像js跳转、代码跳转等都不建议大家随便用,特别是如果在做404页面一定要用代码跳转,那建议时间在5秒以上。
9.网站链接结构 对于蜘蛛而言,我们主要说的就是网站的链接结构,其实网站的链接结构就等于一个房子,链接就是门,而蜘蛛就是我们邀请而来的朋友,网站链接结构槽糕 混乱就相当于朋友来到你家后根本就分不清楚东南西北,找不到入口出口。连对应的链接都找不到,蜘蛛怎么进行抓爬?所以链接结构还是需要呈扁平树状结构。 知道了这些可能的蜘蛛陷阱,大家以后就要注意别给蜘蛛搭陷阱了,那么现在赶紧去你的网站经常一下吧,看是否还有这些蜘蛛陷阱。