URL正規化タグ(rel="canonical")をきちんと使っていないGoogleのウェブページ

2010年6月14日

SEO界における昨年の一番の出来事と言える
Googleの「URL正規化タグ(rel="canonical")」の採用。

  ▶「検索結果に優先的に表示させたいページの指定について
   (グーグルウェブマスター向け公式ブログ)

このタグ指定により、重複コンテンツ・重複URLの検索エンジンによる
インデックス化の分散を回避することが可能になりました。

指定の仕方は、
複製コンテンツページのheadセクションに以下の記述を追加します。
(なお、優先させるページ自身に、自身URLを記述して正規化しても構いません。)

<link rel="canonical" href="http://優先させるホームページのURL" />
(山括弧はブログ用に全角にしてあります)


簡単な説明はこれくらいにして、先日、米Googleが新しい検索インデックスシステム「Caffeine」を公式ブログで発表した際、米Googleはいわゆる公式ブログとウェブマスター向け公式ブログの両方で同じ内容のページ(タイトル「Our new search index: Caffeine」)をアップしていました。

実際、本文には「(Cross-posted on the Official Google Blog)」と、
両方のブログにまたがって投稿している旨が記載されています。


▼グーグル公式ブログでの公開
http://googlewebmastercentral.blogspot.com/2010/06/our-new-search-index-caffeine.html
グーグル公式ブログ


▼グーグルウェブマスター向け公式ブログでの公開
http://googleblog.blogspot.com/2010/06/our-new-search-index-caffeine.html
グーグルウェブマスター向け公式ブログ

そこで rel="canonical" が気になり、
グーグルは一体どちらを優先指定しているのかと、
HTMLのソースを確認してみました。

▼グーグル公式ブログのHTMLコード
グーグル公式ブログのHTMLコード

▼グーグルウェブマスター向け公式ブログのHTMLコード
グーグルウェブマスター向け公式ブログのHTMLコード

すると、両ページにおける正規化タグの記述は以下のようになっていました。
(山括弧はブログ用に全角にしてあります)

▼グーグル公式ブログ
<link href='http://googleblog.blogspot.com/2010/06/our-new-search-index-caffeine.html' rel='canonical'/>

▼グーグルウェブマスター向け公式ブログ
<link href='http://googlewebmastercentral.blogspot.com/2010/06/our-new-search-index-caffeine.html' rel='canonical'/>

同じ内容のページだというのに、
それぞれが自身のウェブページを正規化してしまっています。
グーグルの説明によれば、
本来どちらか一方のURLに一本化すべきはず。

まあ、ブログ投稿のシステムの一環として、
自身のURLを正規化タグに入るように設定してあるのでしょうが、
グーグル自体が正規化タグをきちんと使っていないというのは、
ちょっとした発見でした。

ちなみに、検索クエリ「"Our new search index: Caffeine"」(ピンポイントで検索するため、ダブルクォーテーションマークで囲んで検索)でグーグル検索すると、下画像のように、上述の2つのサイトが1位と2位で表示されます。

検索クエリ「"Our new search index: Caffeine"」での検索結果
検索クエリ「

グーグルは自社のサイトに対してさえ、ペナルティを与えるくらい厳しい企業です。
まさかグーグルが提唱するURL正規化タグ rel="canonical" を
自身のホームページできちんと使っていないとはね . . .


ラベル: ,



▲このページの先頭へ