什么是规范标签 (Canonical Tags)?

规范 (Canonical) URL 是搜索引擎认为最能代表网站上一组重复页面的 URL。

虽然您可以直接向搜索引擎声明规范 URL,但即使您未主动声明,搜索引擎也可能自行将多个 URL 归为一组。如果 Google 发现某个 URL 可以通过多个不同路径访问,这种情况可能会自动发生。

尽管 Google 在检测重复内容方面表现优异,但其系统处理规模庞大,无法覆盖所有边缘情况。规范标签是确保网站良好表现的重要优化项。

如果 Google 发现多个 URL 包含相同内容,可能会降低这些页面在搜索结果中的排名,因为它们被视为重复内容。

这种情况也会跨域名发生。如果您运营两个不同网站并在每个站点发布相同内容,搜索引擎可能选择其中一个进行排名,或直接降低两者的排名。

这正是规范标签的价值所在。它们能告知 Google 哪些 URL 是原始内容源,哪些是重复版本。同一域名或不同域名下存在大量重复页面可能导致排名下降甚至处罚。

假设我们的电商网站允许通过 example.com/products/phoneexample.com/phone 访问同一产品。

这两个都是有效的 URL,但我们使用规范标签来避免自有内容被识别为重复。如果我们决定让 https://example.com/products/phone 参与排名,就会创建如下规范标签:

<link rel="canonical" href="https://example.com/products/phone" />

规范标签对 SEO 表现至关重要,因为不仅您可能创建不同 URL,用户或营销工具也可能生成各种变体。

例如当您在 Google 上开展营销活动时,Google 可能会添加一些 UTM 参数。这个新生成的特殊 URL 有可能被 Googlebot 收录,因此您需要确保始终展示规范标签来统一重复页面。

示例

import Head from 'next/head';
 
function IndexPage() {
  return (
    <div>
      <Head>
        <title>规范标签示例</title>
        <link
          rel="canonical"
          href="https://example.com/blog/original-post"
          key="canonical"
        />
      </Head>
      <p>这篇文章存在于两个 URL 下。</p>
    </div>
  );
}
 
export default IndexPage;

延伸阅读

On this page