在http://www.bchealth.cn/页脚,看到有一个GoogleSitemap的链接,照理说应该是链接到标准的XML文件,但这个网站链接到了http://www.bchealth.cn/googlesitemap.aspx,其内容符合GoogleSitemap文件标准。这样的非XML文件,蜘蛛爬上后能否识别其中的链接,并且收录链接呢?对于这个问题,进行一下实验:·实验模型思路:
- 首先我在testPage目录下建立一个页面:tp001.html
- 然后手动编写一个sitemap.asp文件,内容符合GoogleSitemap标准。
- 在页面上加入sitemap.asp的链接,链接文字用“GoogleSitemap”,见本站页面底部。
- 确保没有任何外部链接,直接链接到测试页面。
·实验面对搜索引擎:Google·实验目标页面:http://www.seotest.cn/testPage/tp001.html·实验想得到的结果:Google蜘蛛是否会自动辨认非XML扩展名的Sitemap文件。
2007年5月11日:
测试已经很长时间了,我的tp001.html一直没被收录,这次实验到此结束。但有朋友说Google能认识非xml格式的SITEMAP。