background image

结构的一部分,都应该能通过其他网页链接到,这样才能使

baiduspider 尽可能全地遍历网站内容。同

时,重要内容应该距离首页更近,有利于价值传递。
  【简单易懂的

URL】

  具有良好描述性、规范、简单的

URL,有利于用户更方便地记忆和直观判断网页内容,也有利于

搜索引擎更有效地抓取和理解网页。网站设计之初,就应该有合理的

URL 规划。

  我们认为:
  

1、对于移动站首页一般采用 m.a.com/3g.a.com/wap.a.com;

  

2、频道页采用 m.a.com/n1/、m.a.com/n2/(其对应于 PC 站点的频道 n2.a.com),当然,n1、n2 直接可

读更佳

;

  

3、详情页的 URL 尽量短,减少无效参数,例如统计参数等,保证同一页面只有一套 URL 地址

不同形式的

URL301 跳转到正常 URL 上;

  

4、Robots 封禁 baiduspider 抓取您不想展示给用户的 URL 形式以及不愿被百度抓取的私密数据。

  【涵盖主旨的

anchor】

  

anchor 即锚文本,对一个链接的描述性文字,锚文本写得越简洁明确,用户越易明白该指向网

页的主旨内容。用户发现你的网页是从其他网页上的链接,锚文本是该网页的唯一介绍。跟普通用户
相同,搜索引擎

spider 在刚发现一个网页时,锚文本也是对该页面理解的唯一因素,同时对于最终

的排序起到具有一定的作用。
  【工具:移动

sitemap】

  百度站长平台提供了移动

sitemap 提交工具,通过提交 sitemap,可以使百度更快更全地抓取收

录网站内容。
  【工具:移动索引量】
  百度站长平台同时提供了移动索引量工具,可以使站长及时了解到自己网站在移动端的收录情
况。
  【工具:移动死链提交】
  百度站长平台还提供了移动死链提交工具,通过提交死链

sitemap,可以使百度更快地发现网站

死链进行更新删除。
  【合理的返回码】
  百度

spider 在进行抓取和处理时,是根据 http 协议规范来设置相应逻辑的,常用的几个返回码

如下:
  

1、404,百度会认为网页已失效已删除,通常在索引中删除,短期内 spider 再次遇到也不会抓取

建议内容删除、网页失效等的情况下使用

404 返回码,告知百度 spider 该页面已失效。同时网站中尽

量减少死链的累计。如果网站临时关闭或抓取压力过大,不要直接返回

404,使用 503。

  

2、301,永久性重定向,百度会认为当前 URL 永久跳转至新 URL。当网站改版、更换域名等情况

下,建议使用

301,同时配合使用站长平台的网站改版工具。

  

3、503,百度会认为临时不可访问,不会直接删除,短期内再来检查几次。如果网站临时性关闭

建议使用

503

  良好排序
  首先简要介绍一下移动搜索结果的构成,移动搜索主要有如下几类结果构成:移动页面、转码页
面、

PC 页面。

  整体上,移动搜索的结果是由

PC 搜索结果加入更多的移动端特征后进一步调整而来,优先对移

动页面进行排序。其中,移动页面结果包括开放适配提交的与

PC 一一对应的移动页以及单独的移动

页面。百度移动搜索引擎中为更好满足用户信息需求,会同时为用户提供

PC 网页和 mobile 网页,但

目前大多数

PC 页在移动终端中直接浏览的体验较差(交互、兼容和流量等)。因此,我们会对百度搜索

结果中缺乏可替代

mobile 资源的 PC 页进行格式转换,变为适合手机浏览的 mobile 网页,使其能在