URL正規化とは?正規化が必要な7つの具体例と設定方法を解説
URL正規化とは、サイト内に存在する同じ内容が書かれた複数のURLを、1つのURLに統合することです。301リダイレクトもしくは、canonicalタグでURL正規化をおこないます。この記事では、URL正規化の概要から必要な理由、設定方法、確認方法を解説します。
URL正規化とは
同じ内容のページが複数URL存在する場合に1つのURLに統合すること
URL正規化とは、同じ内容のページにもかかわらずURLが複数存在する場合に、検索エンジンから評価してもらいたいページのURLを1つに統合する施策です。
同じ内容のページのURLが複数存在するとは、「www」のあり・なし、「index.html」のあり・なしのような同一のコンテンツが複数のURLで表示されてしまう場合です。また、ECサイトの商品ページのように、色やサイズ、価格などのわずかな違いがある場合も含まれます。
同一、あるいはわずかな違いのURLが複数存在している場合、GoogleはいずれかひとつのURLを「正規URL」としてページをクロールし、残りのURLを重複コンテンツとみなします。
結果、WEBサイト運営者が「正規URL」として評価してもらいたいURLを、Googleが重複コンテンツとみなす可能性があります。
どのURLが「正規URL」なのかを、Googleに対して明示的に伝える作業がURL正規化です。
そもそもなぜ同じ内容のページが複数URLできてしまうのか?
作成時にURL正規化の設定をしていなかった
通常WEBサイトを作成する際に、wwwのあり・なし、index.htmlのあり・なしを避けるために、301リダイレクトを使い、URLの正規化をおこないます。
しかし、301リダイレクトを設定しURLの正規化をしていなかった場合、以下URL例のように、ページの内容が同じURLが複数存在することになります。
WEBサイトを作成する際には、URLの正規化をしておきましょう。
- http://www.example.com/
- http://example.com/
- https://www.example.com/
- https://example.com/
URLの自動生成により重複URLができた
常時SSL化をおこなった場合や、AMPを実装した場合には、同じ内容のページが表示されるURLが自動的に生成されます。
常時SSL化をおこなうと、「http」で始まるURLに対し、「https」が付いた同じ内容のページが自動的に生成されます。
【例】
- http://example.com/ → https://example.com/
- http://example.com/aaa → https://example.com/aaa
- http://example.com/bbb → https://example.com/bbb
また、AMPを実装した場合には、URLの末尾に「amp」が付いた全く同じ内容のページが表示されるURLが自動的に生成されます。
【例】
- https://example.com/ → https://example.com/amp
URLの自動生成する際には気を付けましょう。
URL正規化をしなければならない7つの具体例
URL正規化をしなければならないのは、以下のように同じ内容のページが表示されるURLが複数存在する場合です。
- 「www」の有無
- 「index.html」の有無
- 大文字小文字が混ざっている
- パラメーターの有無
- 「/」の有無
- 「https」と「http」のURLが存在している
- レスポンシブデザイン非対応のスマホページのURLが存在している
「www」の有無どちらのURLも存在している
パターン①:https://www.example.com/
パターン②:https://example.com/
「www」が付いているURLと、「www」が付いていないURLがある場合には、重複ページになるのを避けるために、URL正規化をおこないURLを統合する必要があります。
「www」のありなしどちらを正規化するかは、サイト運営者の好みで決めても問題ありませんが、コーポレートサイトでは「wwwあり」、サービスページでは「wwwなし」を使うサイトが多くみられます。
wwwが付いている方が、「https://」を省略したときにURLと理解されやすいですし、wwwが付いていない方はURLが短くなるメリットがあるため、どちらが都合よいかを考え、統一しましょう。
「index.html」の有無
パターン①:https://www.example.com/index.html
パターン②:https://example.com/
「index.html」が付いているURLと、付いていないURLがある場合には、URL正規化をおこなう必要があります。
URLにindex.htmlが付いているメリットは特にないので、「index.htmlなし」で正規化しましょう。
大文字小文字が混ざっている
パターン①:https://example.com/ABC
パターン②:https://example.com/aBc
パターン③:https://example.com/abc
パーマリンクの大文字と小文字を区別するかは、サーバー環境によって異なります。基本的にはパーマリンクに小文字を使用するのが一般的です。ワードプレスではデフォルトで大文字から小文字に変換されます。
パーマリンクに大文字小文字が混ざっている場合には、特別な理由がない限り小文字のURLを選びましょう。
パラメーターの有無
パターン①:https://XXXX.com/?from=mailmagazine&date=20180101
パターン②:https://XXXX.com/
WEBサイト内の導線や、広告効果を分析・改善するためにパラメーターを活用することがあります。この場合、同じコンテンツに異なるパラメーターを付与すると重複コンテンツとみなされる可能性があるため、パラメーターが付いていないURLを正規化します。
ただし、パラメーターによって異なるコンテンツを載せている場合は、URLの正規化をする必要はありません。
「/」の有無
パターン①:https://www.example.com/
パターン②:https://www.example.com
「/」が付いているURLと「/」が付いていないURLがある場合には、URL正規化をおこなう必要があります。
「/」が付いているURLと付いていないURLのどちらを正規化しても、SEO上問題ありません。ただし、どちらかに統一して正規化するようにしましょう。
「https」と「http」のURLが存在している
パターン①:http://www.example.com/
パターン②:https://www.example.com/
「https」と「http」の2つURLが存在する場合は、URLの正規化をする必要があります。「https」と「http」の違いは通信が暗号化されているかの違いです。
「http」のURLのページをユーザーが閲覧すると、通信が暗号化されず第三者から個人情報が盗まれてしまう恐れがあります。そのため、「https」のURLへの統一が必要です。
▼ 常時SSL化については下記の記事で詳しく解説しています。
レスポンシブデザイン非対応のスマホページのURLが存在している
PC用サイトURL:https://www.example.com/
スマホ用サイトURL:https://www.example.com/sp/
レスポンシブデザインに非対応のページもURLの正規化が必要です。レスポンシブデザインとは、同じURLを使いページを開いた際に、各デバイスにあわせた表示サイズへ自動で切り替わる技術のことです。
レスポンシブデザインが非対応の場合は、PC用、スマホ用などデバイスごとにURLが作成されている場合が多く、URL正規化の対象になります。
URL正規化が必要な理由は?
URL正規化が必要な理由は以下の5つです。
- 重複コンテンツが低評価に繋がるため
- クロールにかかる時間を減らすため
- 被リンクの分散を避けるため
- アクセス解析をスムーズに行うため
- コンテンツシンジケーションを管理するため
重複コンテンツが低評価に繋がるため
URL正規化をしないままで放置すると、Googleから重複コンテンツとみなされ低評価を受ける恐れがあります。
- http://www.example.com/
- http://example.com/
- https://www.example.com/
- https://example.com/
上記の例のように、表示される内容は同じにもかかわらずURLが複数存在する場合、ユーザーのユーザビリティが低下するため、Googleはひとつを正規URLと判断し、残りを重複コンテンツとします。
トラフィック獲得目的やランキング操作目的でページを複製する偽装行為をGoogleは禁止しているため、重複コンテンツが多くあるWEBサイトはスパム行為をおこなっていると判断され評価が下がります。
重複コンテンツの発生が意図的ではない「wwwの有無」「http,httpsの有無」がすぐにスパムと判断される可能性は低いですが、Googleは、重複コンテンツの作成を避けることを推奨しているため、重複コンテンツには注意しましょう。
▼ 重複コンテンツについては下記の記事で詳しく解説しています。
クロールにかかる時間を減らすため
URLの正規化をしなければ、重複コンテンツが大量に存在していることになり、クローラビリティの低下に繋がります。
クローラビリティとは、クローラーの巡回をしやすくすることです。
クローラーはリンクを辿ってページを巡回しますが「低品質なサイト」「サイト内のページ数が多く過負荷がかかるサイト」と判断されると、クロールキューで多くのページが待機待ちとなり「新しいぺージがクロールされるまでに時間がかかる」「サイト全体に対してクローラーが巡回する頻度が低下する」といったことが起きます。
Googleからの評価を最大化させるには既存ページへのクローリングではなく、新しく追加されたぺージや改修したページをクローリング・インデックスさせる方が効果的です。
重複ページがある場合はURLの正規化をおこない、できる限りGooglebotが新しいページをインデックスするようにクローラビリティの向上に繋げましょう。
被リンクの分散を避けるため
URLの正規化をおこなっていない場合、同一ドメイン内に同じコンテンツのページが複数存在している状態となり、被リンク評価が分散する恐れがあります。
ページの評価はサイト内及び、サイト外からの被リンクに影響を受けます。
Googleは被リンクが集まってるURLを重要なページと判断し評価しますが、同じ内容のWEBページであるにもかかわらず複数のURLが存在してしまうと、それぞれのURLに対して被リンクが貼られる可能性があり、被リンクを受けるURLが分散します。
被リンクが分散してしまうと、せっかく獲得した被リンクの効果が薄れる可能性があるため、1つのURLに被リンクが集まるようにURLを正規化しましょう。
アクセス解析をスムーズに行うため
Googleアナリティクス等のアクセス解析ツールでスムーズな分析をするためには、URLの正規化が必要です。
理由は同じ内容のURLが複数存在していると、特定のコンテンツに対してのトラッキング指標が複雑になり指標を統合するのが難しくなるためです。
例えば、同一ドメイン内に似た内容のページが複数存在し、各ページでコンバージョンが発生していると、計測をする際に、複数のURLから抽出したデータを結合させる必要があり無駄な分析作業が発生します。
アクセス解析の作業効率を高めるためにもURLの正規化をおこないましょう。
コンテンツシンジケーションを管理するため
コンテンツシンジケーションに関しては、自サイト内のURLの正規化ではなく、他社が運営しているサイトに「canonicalタグ」を設定してもらいURLを正規化してもらいます。
コンテンツシンジケーションとは、作成した記事やコンテンツを自社のWEBサイト内だけで使用するのではなく、プレスリリースやメディアなど第3者が運営する媒体に記事提供・記事配信する仕組みのことです。
コンテンツシンジケーションでURLの正規化をしないことによって問題になるケースは、ニュースサイトの方が「ドメインパワーが高い」「配信数が多い」場合、検索結果上で自社サイトよりもニュースサイトの方がランキングが上になってしまうことです。
大元の記事ページの順位を上げるためにもコンテンツ提供先に「rel=”canonical“」を設定してもらうようにしましょう。
URL正規化の設定方法
URL正規化の設定方法には、「301リダイレクト」と「canonicalタグ」の2種類があります。
「301リダイレクト」と「canonicalタグ」の違いは、「301リダイレクト」は閲覧者、クローラーに対して強制的にページ遷移・転送を行い正規URLのみ閲覧可能にします。「canonicalタグ」は、同一コンテンツが、AとBと異なるURLの場合、検索エンジンに評価してほしいWEBページを伝えるタグのことです。
301リダイレクトではURLの正規化が行えないケースがあるため、どちらでURL正規化すべきかを次の項目で解説します。
「301リダイレクト」での正規化
「301リダイレクト」で正規化するのは、以下のように同一コンテンツに対し複数のURLでアクセス可能な場合です。
- 「wwwのあり・なし」
- 「index.htmlのあり・なし」
- 「URL末尾の「/」のあり・なし」
- 「httpとhttps」
301リダイレクトの設定を行うためには、WEBサーバーに「.htaccess」のデータ(テキストファイル)をアップロードする必要があります。「.htaccess」とは、WEBサーバーの動きを、ディレクトリ単位で制御するファイルです。
【「〇〇〇.com」から「www.〇〇〇.com」に転送設定を行う場合の書き方】
RewriteEngine on
RewriteCond %{ HTTP_HOST} ^〇〇〇.com
RewriteRule ^(.*)$ https://www.〇〇〇.com /$1 [L,R=301]
【「index.html」ありをなしに統一する場合の書き方】
RewriteEngine on
RewriteCond %{THE_REQUEST} ^.*/index\.html
RewriteRule ^(.*)index.html$ https://www.〇〇〇.com/$1 [R=301,L]
ただし、301リダイレクトを用いたURLの正規化は、利用しているサーバーの環境や使用状況によって設定が困難な場合があります。
「.htaccess」ファイルは、Apache(アパッチ)というWEBサーバー用ソフトウェアが使われている環境下でしか利用できません。.htaccess(ドットエイチティーアクセス)ファイルによる、リダイレクト設定が困難な場合は、次に紹介する「canonical」を用いてURLの正規化をします。
▼ 301リダイレクトを用いたURLの正規化については下記の記事で詳しく解説しています。
「canonicalタグ」での正規化
「パラメータのあり・なし」「PC用サイトとスマホ用サイトのURLが異なる」という違いで複数のURLが存在しているときは、「canonical(カノニカル)」を用いてURLの正規化をします。
サーバーの利用制限や、.htaccessなどによる301リダイレクトの設定ができない場合にも、canonicalを用いてURLの正規化をします。
canonicalタグは<head>タグ内に、「rel=”canonical”」を記述し、オリジナルコンテンツとしてGoogleに認知させたいURLを記述します。
【記述方法例】
<link rel=”canonical” href=”https://〇〇〇.com/top”>
PC用サイトとスマホ用サイトのURLが異なるケースは、<link rel=”canonical”>だけでなく、<link rel=”alternate”>を用いてURLの正規化をします。ただし、PC用サイトとスマホ用サイトの構成により、用いるタグの使い方が異なるため注意が必要です。
▼ canonicalを用いたURLの正規化が必要になるケースについては下記の記事で詳しく解説しています。
URL正規化がされているかを確認する方法
URL正規化がされているかは、Googleサーチコンソールとリダイレクトチェックツールで確認できます。
Googleサーチコンソールでの確認方法
GoogleサーチコンソールでURL正規化がされているかを確認する手順は以下の通りです。
- Googleサーチコンソールにアクセス
- 確認したいURLを画面上部の検索窓に入力
- 「ページのインデックス登録」をクリック
- 検索結果の下部にある「インデックス作成」の欄に、「ユーザーが指定した正規URL」と「Googleが選択した正規URL」が表示される
「ユーザーが指定した正規URL」に正規化したいURLが表示されていれば、設定が正しく行われているということです。
リダイレクトチェックツールでの確認方法
301リダイレクトによるURL正規化が正しく出来ているかは、以下のリダイレクトチェックツールで確認できます。
ohotuku.jp
「ohotuku.jp」は、シンプルで使いやすい、無料のリダイレクト検証ツールです。「リダイレクトチェック」という項目に対象のURLを入力することで、リダイレクトの確認ができます。
リダイレクトチェッカー
「リダイレクトチェッカー」は、リダイレクトの移管順番・処理時間や種類などの情報も確認できるリダイレクト検証ツールです。
Mface Tools
「Mface Tools」は、Google・Yahoo!、MSNなどブラウザごとでリダイレクト確認できるリダイレクト検証ツールです。
「info:」「site:」での正規URL確認は現在廃止
以前は、「info:」及び「site:」コマンドを使用して、URL正規化がされているかを確認できましたが、2019年に廃止されました。
「site:」コマンドを使用して検索した場合は、入力した正確なリクエストに応えるために、正規URLではないURLも表示されます。
URL正規化をする際の注意点
URLの入力は間違えないよう慎重におこなう
URL正規化の設定で間違ったURLを記述すると、効果が無効化されたり、意図しない効果が出てしまう恐れがあります。
存在しないURLを間違って記述した場合は、URL正規化が正しくおこなわれません。
また、Googleから評価してもらいたいURLではなく、重複コンテンツのURLを301リダイレクトで正規URLとして設定してしまうと、ユーザーがGoogleから評価してもらいたいURLのページを閲覧できなくなります。
URL正規化の設定をおこなう際は、どのURLを正規化するのかを確認し、URLの入力を間違えないようにしましょう。
URL正規化設定してもすぐに反映されない場合がある
設定したURL正規化が反映されるのは、検索エンジンのクローラーが巡回した後です。
クローラーの巡回ペースはサイトによって異なるため、URL正規化の設定をして数日が経過しても反映されていない場合があります。
Googleサーチコンソールで正規化の確認をした際に、「データがまだありません」と表示された場合は、時間をおいてから再度確認してみましょう。
正規化の処理に「robots.txt」は使用しない
「robots.txt」は、検索エンジンのクローリングを拒否するときに記述するテキストファイルです。
「robots.txt」を使用することで、重複コンテンツとみなされなくなりますが、Googleはrobots.txtによるURL正規化を推奨していません。
robots.txtでは、クローラーの行動を完全に制御できず、ページが巡回されてしまう可能性もあります。
robots.txtでのURL正規化は、適切な対策とは言えないため使用は控えましょう。
▼ robots.txtについては下記の記事で詳しく解説しています。
URL削除ツールを使った正規化はしない
GoogleサーチコンソールのURL削除ツールは、リクエストしたURLを検索結果に表示しないようにする機能です。
URL削除ツールを使ってURLの正規化をおこなうと、削除したURLだけではなく、重複したURLが全て検索画面に表示されなくなります。
例えば、以下のURLのひとつをURL削除ツールで削除した場合、すべてのURLが検索結果に表示されません。
- http://www.example.com/
- http://example.com/
- https://www.example.com/
- https://example.com/
また、サーチコンソールのURL削除ツールからの削除申請は一時的な削除のため、一定期間立つと検索結果に表示されるようになります。
正規化の目的でURL削除ツールを使用しないでください。URL削除ツールでは、URLのすべてのバージョンが検索で非表示になります。
重複しているページの URL の正規化と正規タグの利用
「noindex」の使用を避ける
noindexとは、Googleなどの検索エンジンに、ページをインデックスさせないようにする「metaタグ」で、Googleに正しいURLを伝えるタグではありません。
URL正規化のために使用するものではないため、注意しましょう。
正規ページの選択を妨げる手段としてnoindexを使用しないでください。このディレクティブの目的はインデックスからページを除外することであり、正規ページの選択を管理することではありません。
重複しているページの URL の正規化と正規タグの利用
「https」から「http」へリダイレクトはしない
「https」から「http」へリダイレクトはしないように注意しましょう。
Googleは、URL正規化がおこなわれていない場合でも、「http」より「https」のURLを正規URLとして優先的に認識します。しかし、間違って「http」のURLを正規化してしまうと、「http」を正規URLとして判断されてしまいます。
さらに、「https」から「http」へのリダイレクトすることで、暗号化されていないページが表示されるため、常時SSL化した意味がなくなります。
サイトを訪れたユーザーが第三者から、個人情報が盗まれることを防ぐためにも、「https」と「http」の選択には注意しましょう。
まとめ
URL正規化とは、サイト内に全く同じ内容、またはほぼ同じ内容が表示されるWEBページが複数存在する場合に、検索エンジンから評価してもらいたいURLを指定することです。
URLを正規化することで重複コンテンツを解消でき、Googleからの低評価やクローラビリティの低下、被リンクの分散を防止できます。
URL正規化の設定方法には、「301リダイレクト」と「canonicalタグ」の2種類がありますが、状況に応じてどちらで対応するかを判断する必要があります。
設定方法と注意点を確認したうえで、正しい方法でURL正規化をおこないましょう。
URL正規化をする際には、本記事を参考にGoogleのガイドラインを遵守して設定しましょう。
ぜひ、読んで欲しい記事
- SEO対策SEO外部対策とは?やり方と注意点を徹底解説2024/11/19
2024/11/19
- SEO対策内部リンクとは?貼り方とSEO効果について解説2024/10/28
2024/10/28
- SEO対策更新頻度とSEOの関係は?最適なコンテンツの管理方法を解説2024/10/28
2024/10/28
- SEO対策ブラックハットSEOとは?ホワイトハットSEOとの違いと手法一覧2024/10/17
2024/10/17
- SEO対策ペンギンアップデートとは│基本と対応方法・由来を徹底解説2024/10/10
2024/10/10
- SEO対策HTTPステータスコード一覧│意味を完全解説2024/10/08
2024/10/08