URL正規化タグ(rel="canonical")をきちんと使っていないGoogleのウェブページ
2010年6月14日
SEO界における昨年の一番の出来事と言える
Googleの「URL正規化タグ(rel="canonical")」の採用。
(グーグルウェブマスター向け公式ブログ)
このタグ指定により、重複コンテンツ・重複URLの検索エンジンによる
インデックス化の分散を回避することが可能になりました。
指定の仕方は、
複製コンテンツページのheadセクションに以下の記述を追加します。
(なお、優先させるページ自身に、自身URLを記述して正規化しても構いません。)
<link rel="canonical" href="http://優先させるホームページのURL" />
(山括弧はブログ用に全角にしてあります)
簡単な説明はこれくらいにして、先日、米Googleが新しい検索インデックスシステム「Caffeine」を公式ブログで発表した際、米Googleはいわゆる公式ブログとウェブマスター向け公式ブログの両方で同じ内容のページ(タイトル「Our new search index: Caffeine」)をアップしていました。
実際、本文には「(Cross-posted on the Official Google Blog)」と、
両方のブログにまたがって投稿している旨が記載されています。
▼グーグル公式ブログでの公開
▼グーグルウェブマスター向け公式ブログでの公開
そこで rel="canonical" が気になり、
グーグルは一体どちらを優先指定しているのかと、
HTMLのソースを確認してみました。
▼グーグル公式ブログのHTMLコード
▼グーグルウェブマスター向け公式ブログのHTMLコード
すると、両ページにおける正規化タグの記述は以下のようになっていました。
(山括弧はブログ用に全角にしてあります)
▼グーグル公式ブログ
<link href='http://googleblog.blogspot.com/2010/06/our-new-search-index-caffeine.html' rel='canonical'/>
▼グーグルウェブマスター向け公式ブログ
<link href='http://googlewebmastercentral.blogspot.com/2010/06/our-new-search-index-caffeine.html' rel='canonical'/>
同じ内容のページだというのに、
それぞれが自身のウェブページを正規化してしまっています。
グーグルの説明によれば、
本来どちらか一方のURLに一本化すべきはず。
まあ、ブログ投稿のシステムの一環として、
自身のURLを正規化タグに入るように設定してあるのでしょうが、
グーグル自体が正規化タグをきちんと使っていないというのは、
ちょっとした発見でした。
ちなみに、検索クエリ「"Our new search index: Caffeine"」(ピンポイントで検索するため、ダブルクォーテーションマークで囲んで検索)でグーグル検索すると、下画像のように、上述の2つのサイトが1位と2位で表示されます。
検索クエリ「"Our new search index: Caffeine"」での検索結果
まさかグーグルが提唱するURL正規化タグ rel="canonical" を
自身のホームページできちんと使っていないとはね . . .
ラベル: Google, SEO(検索エンジン対策)
Tweet