1. 网站要经常更新
更好是每天都能更新。当然并不是非要每次都更新几百上千篇文章,如果没有那么多内容,每天至少更新一篇文章也很有用的。
这个道理很简单,如果你的网站每天都更新,搜索引擎就会意识到,你的网站每天都会有新内容,那么它们每天都会来拜访你的网站以抓取新的内容。如果你一个月只更新一次,即使搜索引擎刚开始每天都来,可是都没有发现网站有新内容,那么它们就会渐渐增加再次访问网站的时间间隔。所以,如果你有100篇文章,不要在一天内把这100篇文章全部上传,之后的好多天因为没有内容而不能更新网站,更好的做法是每天上传5篇,这样在20天内,你的网站每天都有新的内容。
一旦让搜索引擎意识到你的网站是不断更新的,还能提高网站在搜索结果中的排名。
豆苗(http://www.doumiao.net)从上线的第一天开始,就保持着平均每天都更新3-5篇文章(因为这个网站只有我一个人在维护,精力有限),当然偶尔实在很忙的时候,也会有一两天没有更新。这样做的结果是我每次更新的文章基本上在1-3天内就会被Google和百度收录。大家可以看2007年12月豆苗网收录的记录(很可惜,更宝贵的第一个月的收录过程我没有保存下来,只好给大家看第2个月的记录了),百度,Google和Yahoo三大搜索引擎的收录量几乎每天都在增长,不过速度有点缓慢,之所以速度缓慢是因为我每天也就更新个3-5篇文章。
建议:每天更新一篇文章也是很有用的。
2. 原创内容
每个搜索引擎都喜欢具有原创内容的网站。Google、百度和Yahoo在其站长帮助中心中都明确了这一观点。
Google:请提供独特而相关的内容,使用户有理由首先访问您的网站。
百度:百度更喜欢独特的原创内容。所以,如果您的站点内容只是从各处采集复制而成,很可能不会被百度收录。
Yahoo:雅虎搜索引擎喜欢抓取原创的、专业的、特殊的、有意义的网页内容。
如果没有精力确保网站的所有内容都是原创,但至少也要确保你的网站有一部分内容是你自己原创的内容。
豆苗网除了互联网动态这一块内容,其他栏目都是豆苗原创或者看书整理的文章。根据豆苗被搜索引擎收录的过程,我明显能感觉到原创内容更容易让你的网站被搜索引擎收录,尤其是百度。在豆苗更初上线的半个月,百度只收录了豆苗网站的一篇文章,但是,它收录的这一篇却是我一两天前更新的原创内容,并且随着我每天的更新,收录的内容也在发生变化,但是收录数量一直是1,大概半个月后,终于获得了百度的信任,开始大量收录网站的页面,远远超过了当时Google的收录率。
建议:原创内容在新网站在刚上线初期尤其重要,所以一定要保证网站上线的前几个月内经常更新一些别的网站没有的内容。
进行网站内容建设的十二个建议,这篇文章对创建内容有一些很不错的建议。
以下三点在之前的文章里都有详细的讲解,这里就不再罗嗦了,只列出大概纲要,后面已经放上了将相应的链接,感兴趣的朋友可以点击查看详细内容。
3. 削除蜘蛛陷阱(Spider traps)
原文:使更多的网页被收录(一)——削除蜘蛛陷阱Spider traps.
蜘蛛程序陷阱是阻止蜘蛛程序爬行网站的障碍物,通常源于那些显示网页的技术方法,这些手段能很好地配合浏览器,但对蜘蛛诚信就构成了阻碍。不在网站上使用这些技术,就可以使蜘蛛程序收录更多的网页。
(1) 小心设置robots指示(robots directives)
(2) 削除弹出窗口
(3) 不要下拉导航
(4) 简化动态网址(Dynamic URLs)
(5) 消除页面显示的依赖条件
(6) 妥善使用重定向(redirect)
(7) 确保网站服务器的响应
4. 减少被忽视的内容
原文:使更多的网页被收录(二)——减少被忽视的内容
蜘蛛程序有一定的存在规则,如果你的内容违反这些规则,你就会有损失。找出这些规则是什么,和减少这些使蜘蛛程序忽视你网站内容的方法。
一旦你消除了蜘蛛陷阱,并且蜘蛛程序可以爬过你的网页,你可能要面对的下一个问题是它们忽略了你的一些内容。蜘蛛程序的口味很叼,如果你的内容不是那么可口,它们会转移到下一个网页或者下一个站点。让我们看看应该做些什么来保证你的网页尽可能对它们有吸引力。
(1) 精简网页
(2) 验证HTML
(3) 让FLASH保留的内容是你不想被收录的
(4) 避免使用框架
5. 建立蜘蛛程序的通道
原文:使更多的网页被收录(三)——建立蜘蛛程序的通道
削除蜘蛛陷阱有时候很困难、很费钱并且代价很大。在此情况下,唯一的选择是为蜘蛛程序提供一个替代的方法来经过站点,这样,它就可以避开陷阱。蜘蛛通道是站点上蜘蛛程序可以轻松经过的通道,例如网站地图、目录地图、国家地图或者是关键页面底部的文字链。
做到以上5点,让搜索引擎更快、更多收录你的网站将不再是问题。
另外,每个搜索引擎还提供自己的工具可以帮助我们的网站更快、更多的被它们收录。