如果站点是在页面原有的 URL 后面加上/amp 或?amp 来达成 AMP 页面的,那么我们有必要禁止除百度和谷歌之外的搜索引擎抓取这些 amp 页面。
如果百度和谷歌都是共用一套 AMP 页面,那么 robots.txt 可以这样写:
- User-agent: baiduspider
- Allow: /amp
- Allow: ?amp
- User-agent: googlebot-mobile
- Allow: /amp
- Allow: ?amp
- User-agent: *
- Disallow: /amp
- Disallow: ?amp
如果百度用 MIP 页面,谷歌用 AMP 页面,那么 robots.txt 可以这样写:
- User-agent: baiduspider
- Allow: /mip
- Allow: ?mip
- User-agent: googlebot-mobile
- Allow: /amp
- Allow: ?amp
- User-agent: *
- Disallow: /mip
- Disallow: ?mip
- Disallow: /amp
- Disallow: ?amp