重複コンテンツとは?基準と調べ方・10個の対策方法を解説
重複コンテンツとは、内容が全く同じ、もしくは非常に似ているコンテンツが複数ありそれぞれ独立したURLが存在しているコンテンツを指します。重複コンテンツがあると検索順位が下がる他、検索結果に表示されない可能性があるため重複コンテンツの発生を防ぐ対策が必要です。本記事では、重複コンテンツの調べ方や対策方法などを解説します。
重複コンテンツとは?
重複コンテンツとは、異なるURLにおいて同じか非常に似ているコンテンツが存在していることを指します。
例えば、カラー違いの商品ページが異なるURLでサイト内に存在している場合や、既存ぺージのタイトルや見出しの一部だけを変更して作成したコンテンツ、または「他サイトをコピーして作成したコンテンツ」いわゆるコピーコンテンツも重複コンテンツに該当します。
サイト内で重複コンテンツが多くある場合は、Googleのクロール効率が低下したり、どちらのぺージを評価すれば良いか検索エンジンが迷うためSEO評価が分散するなど、SEOに関する悪影響が出ます。
また、他サイトをコピーした重複コンテンツがある場合は、Googleから不正にランキングを操作する行為と判断され手動による対策という重いペナルティを与えられる可能性があります。
重複コンテンツの例
重複コンテンツのよくある具体的な例は、以下の8つです。
- URLの正規化ができていない事による重複
- 動的ページが自動生成される事による重複
- パラメーターやセッションIDが付与された事による重複
- デスクトップページとモバイルページを異なるURLで作成している事による重複
- 同一コンテンツでエリアページを複数作成した事による重複
- ECサイトでカラー違いの商品が異なるURLで作成している場合の重複
- プレスリリースサイトやニュースサイトに配信した事による重複(コンテンツシンジケーション)
- 他社のページの内容をコピーしてコンテンツを作成した事による重複(コピーコンテンツ)
例えば、「wwwのありなし」や「httpsとhttpどちらのURLもある」など、URLの正規化漏れによる重複コンテンツは、WEBサイトの作成者がURLの正規化について理解していない事が原因で発生します。
また、サイト内検索機能があるポータルサイトやECサイトでは、静的ページで作成したカテゴリページとサイト内検索窓から動的に生成された検索結果一覧ページの内容が同じコンテンツになってしまい、重複コンテンツが発生します。
どれも普段から注意していれば発生しませんが、WEBサイトを長く運営していると気づかぬうちに意図せずサイト内に重複コンテンツが発生する可能性があります。
重複コンテンツの基準
重複コンテンツの基準は、内容が同じもしくは類似するページが異なるURLで存在しているかどうかが判断基準です。
ただし、ページ内のテキストが何文字以上が重複していたら重複コンテンツになるといった明確な基準はありません。そのため、Googleの検索エンジンが重複コンテンツと判断しているかどうかを基準に考えるのがSEOではベストな選択となります。
▼ Googleが、重複コンテンツと判断しているか確認する方法は以下の2つです。
- Googleサーチコンソールで重複コンテンツとして表示される
- 検索結果に表示されるURLが不定期で入れ替わる
Googleから重複コンテンツとして判断されたURLは、Googleサーチコンソールのインデックスレポート内に「重複しています。ユーザーにより、正規ページとして選択されていません」もしくは、「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」にURLが表示されます。
また、上記レポート内に表示されない場合でも、内容が類似したぺージが複数ある場合は、検索エンジンがサイト内でマッチしているページがどれなのか判断を迷うため、検索結果に表示されるURLが不定期に変わります。
重複コンテンツとして検索エンジンから判断されているどうかの基準は、上記2つのパターンで検証をおこないます。
重複コンテンツの対策方法10選
重複コンテンツの対策方法は、重複コンテンツの内容や発生原因によって異なります。
ケースごとの対策方法は、以下になります。
対策方法 | 使用ケース | |
---|---|---|
1 | サイト内にあるページを把握する | 事前に重複コンテンツを防ぎたい場合 重複コンテンツの発生状況を確認したい場合 |
2 | 301リダイレクトを使う | 同じコンテンツを持つ複数のURLを一つにまとめたい場合 |
3 | canonicalタグを使う | 同一または類似のコンテンツが複数のURLに存在し、正規のURLを指定したい場合 |
4 | noindexタグを使う | 重複しているURLを検索エンジンにインデックスさせたくない場合 |
5 | alternateタグを使用する | デスクトップページとスマートフォンページでURLが分かれている場合 |
6 | XMLサイトマップを使用する | サイト内にある正規URLを検索エンジンに正確に伝えたい場合 ※canonialや301リダイレクト併用する事を推奨 |
7 | ページを削除・非公開にする | 不要なページや重複コンテンツを完全に削除したい場合 |
8 | 定型文や説明文などをサイト内で使いまわさない | 同じ内容のテキストを複数のページで使い回していることによる、重複コンテンツを避けたい場合 |
9 | 削除を要請する | 他のサイトが自分のコンテンツを無断で使用している場合に、Googleに削除要請したい場合 |
10 | コンテンツシンジケーションによる重複の対応方法 | 他サイトでのコンテンツの再利用が発生する場合に、自サイトがオリジナルのURLであることをGoogleに伝えたい場合 |
各対策方法について詳しく解説します。
サイト内にあるページを把握する
重複コンテンツを防ぐ為に一番重要な事は、サイト内にどのようなページがあるのかを把握する事です。
Googleサーチコンソールや、Screaming Frogなどの外部ツールを使ってサイトに存在するURLとページタイトル一覧をExcelやスプレットシートに書き出し、重複しているページが存在していないか定期的にチェックすることで重複コンテンツの発生を防ぐ事ができます。
また、重複コンテンツが発生しやすいタイミングは経験上「ページの追加」「サイトの修正」「サイト移転」などをおこなった直後のため、これらのタイミングでもサーチコンソールをチェックする事で重複コンテンツの発生を防いだり、重複コンテンツに対してすぐに対応できます。
301リダイレクトを使う
wwwの有無や、/の有無など、どちらか片方のURLだけあれば良いケースでは、301リダイレクトを使って片方のURLに転送をおこないURLを統合することで重複コンテンツを防ぐ事ができます。
また、検索意図が類似するテーマのページを統合する際も、301リダイレクトを使って統合先のURLに転送をおこなう事で、統合されたURLの評価を統合先のURLに引き継ぐ事ができます。
重複コンテンツを解消する上で、片方のURLだけユーザーが閲覧できれば良いケースは301リダイレクトを利用しましょう。
canonicalタグを使う
「canonicalタグ」は、検索エンジンにオリジナルのURLを伝えるために付け加えるタグのことです。
canonicalタグを指定することで、コンテンツが類似するURLの中からオリジナルのURLを検索エンジンに伝える事ができるため、指定したページを優先的に検索結果に表示させる事ができます。
canonicalタグは、類似するページであっても、ユーザーが閲覧できる必要がある場合に使用します。例えば、カラー違いで製品ぺージが複数存在する場合や、モバイルとPCでURLが異なる場合、計測用のパラメータが付与されている場合などが該当します。
noindexタグを使う
noindexタグとは、Googleに対してページのインデックスを拒否するためのタグです。Googleはnoindexが設定されているページを存在しないページとして扱うため、内容が重複しているページにnoindexタグを設定することで重複コンテンツを防ぐ事ができます。
利用ケースとしては、サイト内検索で生成された一覧ページと、カテゴリとして作成した商品一覧ページの内容が重複してしまう場合に、サイト内検索で作成される結果結果ページに対してnoindexを設定し重複コンテンツを一括で回避するといった使い方が考えらえます。
ただし、noindexは検索結果からは除外されますが、ユーザーはぺージを閲覧できます。
alternateタグを使用する
alternateタグとは、デスクトップページとスマートフォンページでURLが異なる場合などに使用するhtmlタグの事です。
デスクトップトップページとスマートフォンページでURLが異なる場合や、多言語サイトの場合は、同じコンテンツで2つのURLが存在するため、alternateタグを使って検索エンジンに別々のコンテンツを用意している事を伝えて重複コンテンツになるのを回避します。
尚、デスクトップトップページにはalternateタグでスマートフォンぺージのURLを指定、スマートフォンページにはcanonicalタグでデスクトップページのURLを指定します。
XMLサイトマップを使用する
XMLサイトマップ(sitemap.xml)は、検索エンジンに向けてサイト内にあるURLの存在を知らせるためのファイルです。
XMLサイトマップを使うことでオリジナルのURL(正規URL)を検索エンジンに伝えることができるため、重複コンテンツによって、検索結果に表示させたいURL以外のURLが表示されるのを防ぐ事ができます。
ただし、XMLサイトマップで正規URLを指定しても検索エンジンが必ずしも正規URLであると判断してくれるわけではないため、前述したcanonicalタグや301リダイレクトと併用して使用するようにしましょう。
ページを削除・非公開にする
サイト内で他ページと内容が重複しているページが以下の3つに該当している場合は、ページ自体を「削除」もしくは「非公開」にして重複コンテンツを防ぎます。
- ユーザーが閲覧する必要がないページである
- ページにアクセスがない
- ページが被リンクを獲得していない
これらに該当する重複ページは、サイト内にあってもマイナスの影響しかないぺージになるため削除する事を検討しましょう。
ただし、後々リライトや修正をおこないページの内容を再編集して公開する予定がある場合は、削除するよりも非公開にしておき、編集後にすぐに公開できるようにしておきましょう。
定型文や説明文などをサイト内で使いまわさない
メインコンテンツ内に他ページでも使用している定型文や説明文を多く使用すると、重複コンテンツと判断される可能性があります。
例えば、WEBサイト内にある多くのページで、自社の強みやメリット、特徴、Q&Aなどをメインコンテンツの大部分として利用している場合は類似するコンテンツと検索エンジンから判断される可能性があるため注意が必要です。
SEO評価にも影響するため、各ページのメインコンテンツエリアはページごとに独自性を持たせて作成しましょう。
削除を要請する(他サイトにコンテンツが無断使用されている場合)
他のサイトに自サイトのコンテンツが無断で使用されている場合は、該当ページのスクリーンショットを撮影し、盗用されたURLを記録した上で盗用サイトの運営者に連絡し、コンテンツの削除を求めます。
削除に応じない場合は、以下の手順でGoogleにDMCA侵害通知を提出して削除対応を求めましょう。
- 著作権侵害の報告: ウェブ検索にアクセスする
- 個人情報や自サイトのURL、無断で使用されたURLなど必要事項を入力します。
- 無断使用されたコンテンツについての詳細を記入します。
申請が通った場合には、対象のコンテンツは検索しても表示されなくなり、Lumenというサイトに申請した内容が公開されるようになります。反対に、申請の内容が曖昧などの理由から申請が却下される場合もあります。
コンテンツシンジケーションによる重複の対応方法
ニュースメディアを運営していると、別のニュースメディアに転載される事があります。この場合、複数のWEBサイトに同じコンテンツが掲載されるため重複コンテンツとなり、Googleがどのページがオリジナルのページなのか判断できません。
これを回避するために、配布先のページにnoindexタグを設定してもらうように要請しましょう。
ヒント: 配信パートナーによる重複を回避する必要がある場合については、配信記事と元の記事の全体的なコンテンツが大きく異なることが頻繁に見られるため、正規リンク要素はおすすめしません。代わりに、パートナーはメタタグを使用してコンテンツのインデックス登録をブロックする必要があります。
Google ニュースでの記事の重複を避ける
ただし、応じてくれるかは配信先パートナー次第となるため、パートナーが拒否した場合はどちらのページが検索に表示されるかはGoogle次第となります。
重複コンテンツによる悪影響
重複コンテンツが発生している事によってWEBサイトに与える悪影響は、大きく以下の3つです。
- 被リンク評価が分散する
- クロール効率が低下する
- ペナルティになる可能性がある
それぞれ詳しく解説します。
被リンク評価が分散する
重複コンテンツがある事が原因で被リンク評価が分散する可能性があります。例えば、「wwwありなし」のURLが正規化されていない場合、それぞれのURLに被リンクが集まってしまう事が考えられます。
このように、本来1つのページに集めることができた被リンクが分散してしまうことになり、GoogleからのSEO評価が薄れてしまいます。
上記ケースの場合、本来得られるはずのSEO評価が半分になってしまっているため、重複コンテンツになっているURLを301リダイレクトで統合しSEO評価を一つにする必要があります。
このように、重複コンテンツは獲得できる被リンクが分散するため、SEOにとってマイナスの影響を与える場合があります。
クロール効率が低下する
重複コンテンツが大量にある場合、クロール効率が低下する可能性があります。サイト内に重複コンテンツが発生した場合、検索結果に表示されるURLは1つですが、Googleのクロールは全てのページに対しておこなわれます。
Googleが1つのWEBサイトに対してクロールをおこなうリソースの上限は決まっているため、重複コンテンツにクロールのリソースが割かれてしまう事で、本来クロールして欲しい新規ページに対してのクロールが不十分になる可能性があります。
特に、1日に100ページ以上新規ページが公開されるような大規模サイトの場合は、無駄なクロールを抑えて、新規ページのクロールを増やしてインデックスさせる事が求められます。
このように、重複コンテンツによってクロール効率が低下すると、新規ページのインデックス率に悪影響が発生する可能性があります。
ペナルティになる可能性がある
他サイトのコンテンツをコピーして作成した重複コンテンツは、Googleからスパム行為と判断されペナルティを与えられる可能性があります。
Googleがスパム行為と判断する基準は以下になります。
・他のサイトのコンテンツをコピーし、元のソースを引用することさえせず、独自のコンテンツや価値を加えずに転載しているサイト
無断複製されたコンテンツ:Google ウェブ検索のスパムに関するポリシー
・他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えたうえで転載しているサイト
・ユーザーに対してなんらかの形で独自のメリットを提供することなく、他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
・ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだり編集したりしているだけのサイト
このように、他社のコンテンツを無断で使用する行為に対してGoogleは厳しく対処しており、ペナルティが与えられた場合は、サイト全体に関するキーワードの順位が大幅に下落したり、検索結果からWEBサイトが削除されます。
重複コンテンツを調べる方法
重複コンテンツを調べる方法は以下の4つです。
- Google Search Consoleを使って調べる
- 類似ページ判定ツールを使って調べる
- コピペ判定ツールを使って調べる
- 検索順位チェックツールを使って調べる
それぞれ詳しく解説します。
Google Search Consoleを使って調べる
Google Search Consoleを使うことで、自サイト内でGoogleから重複していると判断されているURLを確認できます。また、他社のコンテンツをコピーしたことによるGoogleからペナルティを受けているかどうかを確認もできます。
【Googleから重複コンテンツを判断されているURLを確認する方法】
- 左側メニューの「インデックス作成」の「ページ」を選択します。
- 重複と判断されたURLがある場合は「ページがインデックスに登録されなかった理由」に「重複しています。ユーザーにより、正規ページとして選択されていません」と表示されます。
- クリックすると重複判定されたURLの一覧が表示されます。
【重複コンテンツが原因でペナルティを受けているか確認する方法】
- 左側メニューの「セキュリティと手動による対策」を選択します。
- 「手動による対策」を選択します。
- ペナルティ対象となっているものがあれば画面中央に表示されます。なければ、「問題は検出されませんでした」と表示されます。
- 問題が検出された場合は、指示に沿って改善していきます。
類似ページ判定ツールを使って調べる
ぺージの類似度を調べてくれる外部の無料ツールを使う事で、重複コンテンツかどうかを調べる事ができます。sujiko.jpは、特定のページと類似していないかを確認できるツールです。サイト内、サイト外の類似ページを確認することができ、2つのページのURLを入力して判定をおこないます。
URL入力欄に2つのURLを入力して、「判定」をクリックすると以下のような判定結果が表示されます。
総合判定結果は、「激似」「高」「中」「低」の4段階で判定されます。その他に、タイトル・本文・HTML別の類似度をそれぞれ確認できます。
コピペ判定ツールを使って調べる
コピペ判定ツールを使う事で、他サイトのコンテンツと重複しているかどうかを無料で調べる事ができます。
CopyContentDetectorは、コンテンツの内容が他サイトと重複していないかを確認できるツールです。コンテンツのテキストを貼り付けてチェックすると、WEB上に存在するサイトを対象に、類似率を判定してくれます。
回数制限がなく会員登録も不要で、4,000文字以内のコンテンツであれば無料で確認ができます。
検索順位チェックツールを使って調べる
GRCなどの順位ツールを使用することで、検索エンジンからテーマが重複するコンテンツが複数あると認識されているか確認できます。
順位ツールにキーワードを登録して順位計測を一定期間おこないます。検索結果にヒットしているURLが複数ある場合は、類似したコンテンツと判断されている可能性が高いと考えられます。
上記画像のように検索結果に表示されるURLが入れ替わるという事は、検索意図が重複するカニバリゼーションが起きていて、検索エンジンがどちらのURLをキーワードにマッチするページとして評価したら良いか判断できない状態である事が考えられます。
重複コンテンツに関するよくある質問
重複コンテンツはペナルティになりますか?
他サイトからコンテンツをコピーして自サイトのコンテンツを作成した場合は、ペナルティの対象となりますが、一方で自サイト内での重複コンテンツに関してはペナルティにはなりません。
▼ Googleも公式セントラルの中で以下のように解説しています。
複数の URL からアクセスできるコンテンツがあっても問題はなく、気にする必要はありません。非効率ですが、手動による対策が必要になることはありません。ただし、他人のコンテンツをコピーすることは、また別の話です。
カニバリゼーションとの違いは何ですか?
重複コンテンツがページ内のコンテンツが完全に同じ、もしくは類似しているページが複数ある事に対して、SEOの文脈で使われるカニバリゼーションとは、検索意図が類似しているページがWEBサイト内に複数ある事を指します。
カニバリゼーションについては、別の記事で詳しく解説しています。
まとめ
重複コンテンツは、意図せず発生するケースがほとんどで、盗用など悪意がなくとも内容が類似してしまったり、動的ページなど異なるURLが生成されることにより、重複する可能性があります。コンテンツを作成する際には重複とならないよう注意と対策をおこない、発生していないかの定期的なチェックも必要です。
また重複コンテンツを防ごうとして誤った対策をすることで、検索結果に表示されなくなるなどのリスクもあるため、それぞれのケースに適した対策をとることが重要です。
ぜひ、読んで欲しい記事
- SEO対策ドメイン年齢とは?調べる方法とSEOとの関係について解説2024/09/05
2024/09/05
- SEO対策中古ドメインとは?選び方と効果、メリット・デメリットを解説2024/09/05
2024/09/05
- SEO対策SEO会社おすすめ33選!東京のSEOコンサルティング会社を紹介2024/09/04
2024/09/04
- SEO対策「他の人はこちらも検索」とは?仕組みと活用方法を解説!2024/09/02
2024/09/02
- SEO対策alt属性(altタグ)とは?書き方と設定する必要性・確認方法を解説2024/08/23
2024/08/23
- SEO対策重複コンテンツとは?基準と調べ方・10個の対策方法を解説2024/08/21
2024/08/21