良好架构的网站,最起码把一个网站内容主要的核心页面,指向较多其他页面的枢纽页面,都放存在
网站地图内,也可以适当给这些页面一些外部的链接,辅助蜘蛛的爬取和收录。
一个网站信息架构可能没有问题,或者一个小网站只有很少的页面,但是收录仍旧不理想,这时候就要考虑下可能是网页内容质量问题了。搜索引擎喜欢收录是新鲜的、原创的稀缺页面,而不喜欢那些互联网上大量重复、没有意义和价值的页面。当一个网站上存在大量的复制、采集的内容时候,这个网站的收录也自然难以提升上去。
有人在新浪微博发了一条微博,指责百度降低了他们网站的收录量,甚至很多已经收录的页面也被删除了。后来百度官方竟然回复了,列举了很多他们网站聚合页面,页面内的内容和标题根本不相关,完全是欺骗搜索引擎的做法,引起了轩然大波。