コンテンツSEO SEOにおける重複コンテンツとは?基準からチェック方法、対策まで徹底解説!

重複コンテンツとみなされる基準は何か、どうやって対策すればよいのかお悩みではないでしょうか?重複コンテンツとは、異なるURLに同じようなコンテンツが掲載されている状態のことです。この記事では、重複コンテンツの基準やチェック方法、対策について解説します。
重複コンテンツとは
重複コンテンツとは、ほとんど同じ内容のコンテンツが異なるURLに掲載されている状態です。同じサイト内で重複コンテンツが発生しているケースと外部サイトとコンテンツが重複しているケースがあります。
サイト内の重複コンテンツ
同一ドメイン内でコンテンツが重複した内容のコンテンツが複数ある場合です。
サイト内で発生する重複コンテンツには以下のようなものがあります。
・URL表記が統一されていない
・PCとモバイルで別のページがある
・定型文を繰り返し使っている
・類似した内容のページがある
多くの場合では、悪意を持って重複コンテンツを発生させているわけではありません。
Googleとしても上記のような重複コンテンツは自然に発生するものと捉えており、多すぎない限りは評価がすぐに下がることはないでしょう。
Googleからペナルティを受ける可能性は低いですが、早めに対応することをおすすめします。
外部との重複コンテンツ
外部との重複コンテンツは、主に検索順位の操作や読者への偽装を目的として、悪意を持って作成されたコンテンツです。
自サイトと外部サイトで発生する重複コンテンツには以下のようなものがあります。
・他のサイトに寄稿している
・複数のドメインで類似したコンテンツを掲載している
・他サイトからコンテンツが盗用されている
・他サイトのコンテンツを盗用している
Googleからペナルティを受ける恐れがあるため、早急な対応が必要です。
重複コンテンツになるとどうなる?
Googleから重複コンテンツとみなされると、以下のような問題が発生する可能性があります。
・被リンク評価が分散する
・検索結果に表示されない
・Googleからペナルティを受ける
・クローラビリティが低下する
被リンク評価が分散する
同一ドメイン内に似た内容のページが複数存在している場合、被リンク評価が分散する恐れがあります。同じテーマ・キーワードで記事を書いた場合に発生しやすいです。
ページの評価は、サイト内及びサイト外からの被リンクに影響を受けます。質の高いページからリンクを貼られているページは、同様に質の高いページだと評価されやすくなります。このように、ページにリンクを貼った時にリンク先のページへSEO効果を与える現象がリンクジュースです。
重複コンテンツが複数存在していると、リンクジュースを受け渡す相手が複数になってしまいます。本来ならすべてのリンクジュースを受けられる状態であっても、受け取れるリンクジュースが分散するため、相対的に評価が下がるということです。
検索結果に表示されない
同一ドメイン内に似た内容のページが複数存在している場合、もしくは他サイトに似た内容のページが存在している場合、検索結果に表示されない可能性があります。
Googleは、検索結果に多様性を持たせるために、検索画面に同一ドメインから複数のページを表示しない仕様になっています。基本的に、同一ドメインから表示されるのは2ページまでです。例外的に3ページ表示されるケースもありますが、非常にまれなケースとなっています。
例えば、サイト内に全く同じページが複数あった場合、検索画面に表示されるのはどれかひとつのページのみです。
また、自サイトと他サイトに全く同じページが存在している場合は、どちらかのみが検索画面に表示されます。場合によっては、他サイトにページが盗用されたのに、盗用した側のページだけが検索画面に表示されることもあります。
Googleからペナルティを受ける
悪意のある重複コンテンツの場合、Googleからペナルティを受ける恐れがあります。
▼ ペナルティを受ける可能性があるのは、以下のようなケースです。
・複数のドメインで類似したコンテンツを掲載している
・他サイトのコンテンツを盗用している
▼ Googleからペナルティを受けると、以下のような処置が取られることになります。
・突然サイト、ページの検索順位が大幅に下がる
・titleタグのテキストで検索してもインデックスされていないように見える
・社名を入れても検索結果で上位表示されない
・自サイトが検索結果に表示されない
クローラビリティが低下する
悪意のない重複コンテンツであっても、ページ数があまりにも多い場合はクローラビリティが低下します。
クローラビリティとは、クローラーの巡回をしやすくすることです。クローラーはリンクをたどってページを巡回していますが、サイト内のページ数が多すぎるとすべてのページが巡回されなかったり、クロールされるまでに時間がかかったりすることもあります。
記事がGoogleから正しく評価されるためには、クローラーが巡回される回数が重要です。また、全てのページが一度の巡回でクロールされるわけではありません。重複コンテンツのように巡回される必要のないページが多すぎると、巡回してもらいたいページがクロールされない可能性が高くなります。
重複コンテンツをチェックする方法
重複コンテンツをチェックする方法は以下の3つです。
・Google Search Console
・調査ツール
・Google検索のコマンド
Google Search Console
重複コンテンツでGoogleからペナルティを受けているかは、Google Search Consoleでチェックできます。
▼ チェックする手順は以下の通りです。
1. Google Search Consoleにログイン
2. 左側のメニュー「セキュリティの手動による対策」→「手動による対策」をクリック
「問題は検出されませんでした」と表示されていれば、Googleからペナルティは受けていません。
※ただし、上記の手順で分かるのは手動ペナルティのみです。自動ペナルティを受けているかは分かりません。
調査ツール
ツールを使用することで、重複コンテンツかどうかをチェックできます。
重複コンテンツのチェックができるツールは以下の2つです。
・sujiko.jp
・CopyContentDetector
▼「sujiko.jp」は、2つのページを比較し類似度をチェックできるツールです。
無料・会員登録不要で使えますが、1日の利用回数には制限があります。
▼「CopyContentDetector」は、入力したテキストと似た内容のページがネット上に存在しているかをチェックするツールです。URLではなくテキストを入力してチェックするので、公開前のページもチェックできます。
上記ツールはページのテキストを比較して類似度をチェックする仕組みなので、実際にGoogleから重複コンテンツとみなされているかどうかは分かりません。類似度などから重複コンテンツなのかを判断する必要があります。
Google検索のコマンド
検索結果のURLの末尾に「&filter=0」を加えて再検索することで、重複コンテンツをチェックできます。
上記の手順は、Googleによる検索画面のフィルター機能を解除する方法です。
前述したように、Googleは検索画面に同一ドメインから複数のページを表示しない仕様になっています。フィルター機能を解除することで、本来なら非表示になっていたページもチェックできるようになります。表示されたページが重複コンテンツとは限りませんが、類似した内容のページである可能性が高いです。
重複コンテンツが見つかった場合の対策
重複コンテンツが見つかった場合の対策は以下の通りです。
・URLを正規化する
・301リダイレクト
・canonicalタグ
・alternateタグ
・noindexタグ
・URLパラメータ設定
・記事を削除する
・削除リクエスト
・robots.txtでクローラーを拒否する(非推奨)
上記の対策のどれかを行えば良いわけではありません。
重複コンテンツの内容に合わせて適切な対策を行う必要があります。
URLを正規化する
優先して評価してもらうURLをGoogleに対して指定するURLの正規化を行うことで、重複コンテンツとみなされなくなります。
URLの正規化が有効なのは以下のようなケースです。
・「www」のあり、なし
・「index.html」のあり、なし
・URL末尾「/」のあり、なし
・「http」と「https」
・「パラメータ」のあり、なし
・「PC用ページ」と「スマホ用ページ」のURLが異なる
URLの正規化は、「301リダイレクト」・「canonical」タグで行えます。
301リダイレクト
301リダイレクトによってURLを正規化をすることで、重複コンテンツとみなされなくなります。
301リダイレクトとは、ドメイン変更やWEBサイトの移設、ページのURL変更をするときに、これまでのURLから新たなURLへ変更した場合に、ユーザーや検索エンジンを新たなURLへ誘導するための仕組みです。
ユーザーにアクセスしてもらいたいページがひとつだけの場合に、301リダイレクトによるURLの正規化を行います。
ただし、301リダイレクトを用いたURLの正規化は利用しているサーバーの環境や使用状況によって設定が困難な場合があります。
.htaccessファイルによるリダイレクト設定が困難な場合は、canonicalタグを用いてURLの正規化をします。
canonicalタグ
canonicalタグによってURLを正規化をすることで、重複コンテンツとみなされなくなります。
canonicalタグの役割は、似た内容のページが複数存在する場合に、検索エンジンにオリジナルのコンテンツであることを伝えることです。
「パラメータのあり・なし」「PC用ページとスマホ用ページのURLが異なる」という違いで複数のURLが存在しているときは、canonicalタグを用いてURLの正規化をします。
canonicalタグを用いてURLの正規化をするのは、以下のようなケースです。
・異なるURLからひとつのページにアクセスしてもらいたい場合
・.htaccessファイルによるリダイレクト設定が困難な場合
alternateタグ
「PC用ページとスマホ用ページのURLが異なる」という場合は、alternateタグとcanonicalタグの設定が必要になります。alternateタグとは、スマホ用ページの存在をGoogleに伝えるためのタグです。
PC用ページとスマホ用ページが別に存在することをGoogleに伝えるために、PC用ページの<head>内に、スマホ用ページへ向けた「link rel=“alternate”」を記述します。
次に、PC用ページとスマホ用ページが同じ内容であることをGoogleに伝えるために、スマホ用ページ<head>内に、PC用ページへ向けた「link rel=“canonical”」を記述します。
noindexタグ
重複コンテンツにnoindexタグを設置することで、重複コンテンツとみなされなくなります。
noindexとは、特定のページをGoogleにインデックスさせないようにすることです。
noindexタグを設置したページは、誰でも自由にアクセスできる一方、Googleからの評価は得られなくなります。
noindexタグを設置するのは以下のようなケースです。
・サイト内に似たようなコンテンツがあり、ページにアクセスしてもらいたい場合
・他のサイトへコンテンツを寄稿している場合
重複コンテンツではあるものの、ページを削除してしまうとユーザビリティが低下する場合にnoindexタグを設置します。
他のサイトへコンテンツを寄稿している場合には、寄稿したサイトへnoindexタグの設置を依頼します。
また、寄稿したページにオリジナルページへ向けたcanonicalタグを設置してもらう、オリジナルページへ向けた外部リンクを設置してもらうといった方法でも対応できます。
URLパラメータ設定
Google Search ConsoleのURLパラメータ設定を行うことで、重複コンテンツとみなされなくなります。
URLパラメータとは、Google Search Consoleに含まれる機能の一つです。検索エンジンによるクロールを制御できるようになるため、重複コンテンツによって発生する問題を未然に回避できます。
【URLパラメータツールの使い方】
1. Googleサーチコンソールにログイン
2. 該当するWEBサイトURL(プロパティ)を選択
3. ダッシュボード内の【クロール】をクリック
4. 【URLパラメータ】をクリック
記事を削除する
記事を削除することで、サイト内のコンテンツの重複を避けることができます。
記事を削除するのは、以下のようなケースです。
・サイト内に似たような内容の記事がある
・他サイトの記事をコピペした記事がある
同じテーマ・同じキーワードで記事を書かせたり、記事制作会社を乗り換えたりすると、記事が似たような内容になりやすいです。表現が違うだけで同じ内容であれば、思い切って記事を削除することをおすすめします。
ただし、カニバリが発生していない場合やGoogleからペナルティを受けていない場合には、慌てて削除する必要はありません。別のテーマ・キーワードの記事にリライトすることで、記事をリサイクルすることができます。
また、他サイトの記事をコピペした記事がある場合は、早急に削除すべきです。コピペの程度によりますが、著作権違反とみなされる可能性もあります。
削除リクエスト
自サイトの記事が他サイトにコピペされている場合は、コピペしているサイトに連絡してもらうか、コピペ記事を検索結果から除外するようにGoogleへリクエストすることで、重複コンテンツとみなされなくなります。
自サイトの記事がオリジナルで他サイトがコピペした場合でも、オリジナル記事が検索画面に表示されず、コピペ記事の方が検索画面に表示されるケースもあります。
上記の現象が発生するのは、Googleから見ればどちらがコピペなのか客観的に判断できないからです。もちろん、読者から見てもどちらの記事がオリジナルなのかは判断できないでしょう。
放置したままでは解決しない問題なので、対策する必要があります。相手に直接連絡しづらい場合は、Googleへの削除要請がおすすめです。記事の削除要請は、Google Search Consoleの「著作権侵害による削除」ページから行えます。
robots.txtでクローラーを拒否する
robots.txtでクローラーを拒否することで、重複コンテンツとみなされなくなります。ただし、robots.txtによるクローラーの拒否は、Googleが推奨していない方法です。
robots.txtではクローラーの行動を完全に制御できず、記事が巡回されてしまう可能性もあります。robots.txtで対策しても重複コンテンツとみなされる可能性が残るため、適切な対策とは言えません。
重複コンテンツを生み出さないための対策
すでに発生している重複コンテンツへの対策を行っても、これからも重複コンテンツが発生しないとは限りません。重複コンテンツを生み出さないサイト運営も重要になります。
重複コンテンツを生み出さないための対策は以下の通りです。
・内部リンクの一貫性を保つ
・トップレベルドメインを使用する
・定型文の繰り返しを減らす
・空白のページを公開しない
・独自情報を盛り込む
・他社サイトのコンテンツを盗用しない
内部リンクの一貫性を保つ
内部リンクの一貫性を保つことで、重複コンテンツの発生を抑えることができます。
・http://www.example.com/page/
・http://www.example.com/page/index.htm
上記のように、内部リンクのURLに「/」・「index.htm」を含めるかどうかを統一します。
国別コードトップレベルドメインを使用する
国別のコンテンツを扱う場合は、国別コードトップレベルドメインを使用することで重複コンテンツの発生を抑えることができます。
国別コードトップレベルドメイン(ccTLD)とは、国別コードによって割り当てられているドメインのことです。「.jp(対象国:日本)」「.uk(対象国:イギリス)」「.de(対象国:ドイツ)」などがあります。
ドイツを対象としたコンテンツの場合、「http://www.example.com/de」 や「http://de.example.com」とするよりも、「http://www.example.de 」を使用する方がGoogleから認識されやすいです。
定型文の繰り返しを減らす
定型文の繰り返しを減らすことで、重複コンテンツをみなされにくくなります。
定型文の繰り返しが問題になるのは、複数の記事に同じ内容の文章が登場するケースです。
サイト利用者の利便性を高めることを目的として複数の記事に同じ説明文が登場するケースもありますが、記事全体の文字数に対し定型文の文字数の割合が高い場合は、重複コンテンツとみなされる可能性があります。たとえば、ECサイトの商品ページに支払い時の注意点を記載する場合です。
定型文を繰り返し使用する場合は、定型文の文字数を概要程度に抑え、別に作成した詳細ページへリンクを貼るようにしましょう。
空白のページを公開しない
空白のページは、ユーザーにとって好ましいものではありません。スタブページやプレースホルダを含む書きかけのページは、公開しないようにする必要があります。
どうしても空白のページを公開する必要がある場合は、noindexタグで記事がインデックスされないようにしておきましょう。
重複しないキーワード設計
重複コンテンツを避けるためには、記事を書く前に重複しないキーワード設計を行うことが重要です。
キーワードの検索意図が重複していると、類似した内容の記事を書くことになります。検索キーワードからユーザーの検索意図やニーズを把握し、類似するコンテンツを生み出さないようにしましょう。
独自情報を盛り込む
記事に以下のような独自情報を盛り込むことで、重複コンテンツを避けることができます。
・自社で行ったアンケート結果
・個人の体験談
・専門家へのインタビュー
・独自調査に基づくデータを使った検証結果
・独自に作成した画像、動画
上記のような独自情報は、他のサイトから真似されにくいオリジナルコンテンツです。
Googleから質の高いコンテンツを判断され、検索順位が上がりやすくなる効果も期待できます。読者から価値があると判断されれば、被リンクやサイテーションを獲得できるかもしれません。
他社サイトのコンテンツを盗用しない
他サイトの記事に書かれている内容を参考にするのは問題ありませんが、表現を変えただけで同じ内容の記事を書くと、重複コンテンツとみなされる恐れがあります。
また、著作権で保護されたコンテンツを盗作して記事を作成するのは、著作権侵害です。
まとめ
重複コンテンツにはさまざまなケースがあり、状況に応じて適切な対策を選ぶことが重要です。重複コンテンツの対策には専門知識が必要なケースも多く、間違った対策をすると効果が出なかったり、逆効果になったりすることもあります。
この記事で解説した対策が難しいと感じる場合は、専門家に任せることをおすすめします。
記事作成会社をお探しの方は、弊社でもお力になれることがあるかと思いますので、ぜひお気軽にご相談ください。コンテンツSEO経験豊富な弊社スタッフが、ヒアリングの上、御社に合ったご提案を致します。