公告 公告:提供快速收录审核服务(每站仅10)即可永久收录网站。

点击这里在线咨询客服
新站提交
  • 网站:4050
  • 待审:0
  • 小程序:9
  • 文章:171
  • 会员:1

编者按:前两周简要地给大家介绍了搜索抓取系统工作原理,根据该工作原理今天简要介绍一下如何建立网站是符合搜索引擎抓取系统习惯的。

1、简单明了的网站结构

Spider抓取相当于对web这个有向图进行遍历,那么一个简单明了结构层次分明的网站肯定是它所喜欢的,并尽量保证spider的可读性。

(1)树型结构最优的结构即“首页—频道—详情页”;

(2)扁平首页到详情页的层次尽量少,既对抓取友好又可以很好的传递权重。

(3)网状保证每个页面都至少有一个文本链接指向,可以使网站尽可能全面的被抓取收录,内链建设同样对排序能够产生积极作用。

(4)导航为每个页面加一个导航方便用户知晓所在路径。

(5)子域与目录的选择相信有大批的站长对此有疑问,在我们看来,当内容较少并且内容相关度较高时建议以目录形式来实现,有利于权重的继承与收敛;当内容量较多并且与主站相关度略差时建议再以子域的形式来实现。

2、简洁美观的url规则

(1)唯一性网站中同一内容页只与唯一一个url相对应,过多形式的url将分散该页面的权重,并且目标url在系统中有被滤重的风险;

(2)简洁性动态参数尽量少,保证url尽量短;

(3)美观性使得用户及机器能够通过url即可判断出页面内容的主旨;

我们推荐如下形式的url:url尽量短且易读使得用户能够快速理解,例如使用拼音作为目录名称;同一内容在系统中只产生唯一的url与之对应,去掉无意义的参数;如果无法保证url的唯一性,尽量使不同形式的url301到目标url;防止用户输错的备用域名301至主域名。

3、其他注意事项

(1)不要忽略倒霉的robots文件,默认情况下部分系统robots是封禁搜索引擎抓取的,当网站建立后及时查看并书写合适的robots文件,网站日常维护过程中也要注意定期检查;

(2)建立网站sitemap文件、死链文件,并及时通过百度站长平台进行提交;

(3)部分电商网站存在地域跳转问题,有货无货建议统一做成一个页面,在页面中标识有无货即可,不要此地区无货即返回一个无效页面,由于spider出口的有限性将造成正常页面无法收录。

(4)合理利用站长平台提供的robots、sitemap、索引量、抓取压力、死链提交、网站改版等工具。

标签专题:
分享到:
最新审核网站

内蒙古锡林郭勒职业学院www.xlglvc.cn

锡林郭勒职业学院成立于2003年5月,是自治区人民政府批准,教育部备案的全日制

焦作大学www.jzu.edu.cn

焦作大学是经河南省人民政府批准、教育部备案,由焦作市人民政府投资建设的一所

成都农业科技职业学院www.cdnkxy.com

成都农业科技职业学院是成都市人民政府主办的第一所高等职业学院。学校发轫于

长治学院www.czc.edu.cn

长治学院(Changzhi University)创建于1958年,前身为晋东南师范专科学校,2004年教

鹤壁职业技术学院www.hbzy.edu.cn

鹤壁职业技术学院是一所全日制公办高等职业学校,2001年4月组建成立,办学历史可

福建江夏学院www.fjjxu.edu.cn

福建江夏学院是福建省人民政府举办的省属全日制普通本科高校,学校现有13个二级
最新入驻小程序

美外卖团红包2021-08-12

美外卖团红包领取,每日可领66元外卖红包,已超99万人领取.先到先得,价格实惠

叮咚买菜2021-08-12

叮咚买菜是一款自营生鲜平台及提供配送服务的生活服务类APP。主要提供的产

饿了么红包2021-08-12

每日领饿了么餐饮红包,在家逛饿了么超市 百亿补贴 全场不只五折,生鲜日用最快

天猫商城优惠券2021-08-12

天猫超市优惠券,每日上新千款商品,人工为您精选好货。

苏宁易购优惠券2021-08-12

苏宁易购领券中心有免费的苏宁易购优惠券领取,有最新苏宁易购代金券,苏宁优惠

唯品会优惠券2021-08-12

唯品会vip购物网以1-7折超低折扣对全球各大品牌进行限时特卖,商品囊括服装