SEO対策 ワードサラダとは?生成される仕組みと例文、SEOでのリスクを解説

ワードサラダとは、ツールを使い自動生成された文章で、文法は正しい並びですが、文の意味が通じないテキストのことです。Googleからの評価を高めるため、時間や手間をかけずに被リンクを貼る目的として作成されていましたが、現在は意図的に検索順位を操作する手法であり、スパム行為としてGoogleに判断されるようになっています。
ワードサラダとは
文法は正しいが文章の意味が通じないテキストコンテンツ
ワードサラダとは、文法的には正しく書かれているが、文章の意味が通じないテキストのことです。形態素解析とマルコフ連鎖という手法で作成するツールを使って、自動生成されるケースが一般的です。
以前はSEO効果を期待してワードサラダが使用されていましたが、検索アルゴリズムの精度が向上したことでSEO効果はなくなり、Googleからスパム行為と判断されペナルティを受ける恐れがあります。
他人が書いた文章や、RSSなどのネット上に存在する文章を元に、単語を無作為に組み合わせて作成しています。コピーした文章と同じ単語を使用しており、文法的には正しいので、一見すると普通の文章に見えますが、実際に読んでみると支離滅裂な内容になっています。
ユーザーが文章を読んでも意味が分からないため、テキストコンテンツとしての価値はありません。
ワードサラダが作られた背景
ワードサラダでテキストコンテンツが作成されていたのは、自作自演で被リンクを獲得するブラックハットSEOがおこなわれていたことが背景にあります。
被リンクとは、外部サイトから自社サイトに貼られているリンクです。被リンクは、Googleのコンテンツ評価基準のひとつであり、質の高い被リンクを獲得しているサイトは高品質なコンテンツとみなされるため、WEBサイトが検索上位表示されやすくなります。
以前の検索アルゴリズムでは、コンテンツの内容にかかわらず被リンクを大量に獲得できていればサイトが評価され、検索順位が上がっていました。
その為、SEO対策の盲点を狙い、大量のサテライトサイトを作成し、被リンクを獲得するという手法がおこなわれていました。この悪質なSEO対策を解決するために、Googleの検索アルゴリズムがアップデートされ、中身のないコンテンツからの被リンクは評価の対象とならないように修正されました。
そこで誕生したのが、ワードサラダです。
当時の検索アルゴリズムは、文章の文脈を正確に把握ができず、正しい文法でさえ書かれていれば意味のない文章であっても評価に繋がりました。
大量のサテライトサイトに、ワードサラダで作成したテキストコンテンツを投入し、コンテンツの質と関連性を疑似的に高め、被リンク効果を獲得しようとする悪質なSEO対策がおこなわれたのです。
本来であれば、価値の高いコンテンツを作成するためには、手間がかかりますがツールを使ってワードサラダを作成するため、時間をかけずに簡単にテキストの作成ができるのです。
つまり、ツールを使って疑似的に高品質なコンテンツを作成し、検索アルゴリズムを騙してサイトの評価を高めようとしたことが、ワードサラダが作られた背景と言えます。
ワードサラダを使った外部リンク例

ワードサラダの例文
ワードサラダの例文を2つ紹介します。
【例文①】

【例文②】

このように文章を読んでも意味不明な文章・文脈になっているのがワードサラダの特徴となります。
ワードサラダが生成される仕組み
形態素解析とマルコフ連鎖手法で生成される
ワードサラダは、サイトの運営者以外の人が書いた文章や、サイトの更新情報を配信するRSSなどのインターネット上に存在するテキストを土台にして、形態素解析とマルコフ連鎖という手法で単語をランダムに組み合わせて作成する仕組みです。
他人が書いた文章をそのまま使用すれば、Googleから重複コンテンツや、著作権違反とみなされる恐れがあります。
一方、高品質なコンテンツを独自に作成しようとすると、時間と手間がかかってしまいます。
そこで、重要なキーワードを使用したうえで、文法が正しい文章を作成し、なおかつコピペにならないようにするために、形態素解析とマルコフ連鎖という手法でワードサラダが生成されます。
形態素解析
形態素解析とは、文章を品詞の種類で分解して分析する手法です。検索エンジンやAIの自然言語処理、テキストマイニングツールなどで使用されています。
▼ 形態素解析で使われる主な品詞は以下の通りです。
- 名詞
- 代名詞
- 動詞
- 副動詞
- 助詞
- 助動詞
- 副詞
- 形容詞
- 連体詞
- 接続詞
「私は校庭で運動します」を形態素解析で最小単位に区切ると以下のようになります。
私 | は | 校庭 | で | 運動 | し | ます |
代名詞 | 係助詞 | 名詞 | 助詞 | 名詞 | 動詞 | 助動詞 |
▼ 日本語を形態素解析できるツールは以下の通りです。
- MECAB
- JUMAN
- 日本語形態素解析API
マルコフ連鎖
マルコフ連鎖とは、過去に起こった事象に関わらず、現在の状態のみで未来の状態が決まる確率過程の一種です。確率過程と呼ばれる技術で、既存のデータを一定の確率でランダムに文章を並べ変える方法になります。
「私はラーメンを食べた」「私は洋服を買った」という2文を、形態素解析で3つの単語単位で区切ると以下の文章になります。
「私はラーメンを食べた」 | 「私は猫を飼った」 |
私 は ラーメン | 私 は 猫 |
は ラーメン を | は 猫 を |
ラーメン を 食べ | 猫 を 飼 |
を 食べ た | を 飼 った |
区切った文章を、マルコフ連鎖を使い各ブロックをランダムに組み合わせることで、以下のようなワードサラダの文章が作成されます。
- 私はラーメンを飼った
- 私は猫を食べた
ワードサラダがSEOに及ぼすリスクとは
ワードサラダを作成した場合の、SEOに及ぼす影響やどのようなリスクがあるのかを解説していきます。
Googleのガイドライン違反になる
ワードサラダのように自動的に生成されたテキストコンテンツは、Googleのガイドライン違反です。
Googleは、ユーザーにとって価値のあるコンテンツ内容であることを評価の基準としており、ワードサラダのような意味のないテキストを作成しているサイトは、品質ガイドライン違反と判断されます。
その為、Googleのスパムに関するポリシーに違反すると、検索順位が大きく低下したり、インデックスから削除されたりする恐れがあります。
▼ 具体的には以下のようなテキストが該当します。
- キーワードが含んでいるが意味が理解できないテキスト
- 翻訳ツールを使い人が編集していないテキスト
- 類義語や言い換え、難読化などを自動的に行うツールで作成されたテキスト
- 無断で複製しているテキスト
- 複数のWEBサイト内の文章をつなぎ合わせて作成した価値のないテキスト
- ユーザーエクスペリエンスを考えず自動で生成したテキスト
【参考ページ】
スパム行為のある自動生成コンテンツ|Google 検索セントラル
現状、自動生成文章はAIに見破られる
以前の検索アルゴリズムは、文脈を正確に理解できる技術は備わっていませんでしたが、2019年のBERT(バート)アップデートで検索アルゴリズムが改良されたため、自動で生成されたテキストコンテンツかどうかを正確に判定できます。
関連ページの評価が下がる可能性もある
ワードサラダで作成された支離滅裂なテキストが、サイトやページ内に記述されていると、検索エンジンから正しく評価されないだけでなく、関連ページの評価が下がる可能性もあります。
ペナルティを受けることでサイトのドメイン自体の評価が低下し、サイト全体が影響を受けるかもしれません。
誤字脱字は自動生成された文章とみなされるのか?
文章に誤字脱字が多ければ、ワードサラダのような自動生成された文章のように見えるかもしれません。実際、誤字脱字のある文章がワードサラダとみなされるかどうかは、Googleが明言していないため分かりません。
テキストの大部分が、誤字脱字であればワードサラダとみなされるかもしれませんが、実際に検索上位表示されているページにも誤字脱字が見つかるケースもあるため、ページ内に数ヶ所の誤字脱字がある程度であればワードサラダとみなされることはないでしょう。
しかし、誤字脱字に関しては、ユーザーが内容を誤解したり間違った解釈をしたりする可能性があり、利便性を大きく損ねるため、ユーザーに取って有益なコンテンツに繋がらないこともあります。
また、誤字脱字によってページの内容がクローラーに正確に伝えられず、正しい評価を受けられない可能性もあります。
特に、検索キーワードに誤字脱字があると、大きな影響を受けるケースがあります。
例えば、「電子決済」と「電子決裁」は全く異なる意味なので、「電子決済」を「電子決裁」と書いてしまうと正しい評価が得られず、ページがインデックスされないかもしれません。
その為、文章を作成する際には、誤字脱字のないよう注意しましょう。
AIが自動作成した意味の通じる文章はワードサラダにあたる?
AIが自動作成した文章であっても、意味が通じる文章であればワードサラダとみなされるわけではありません。
Googleがワードサラダを問題視しているのは、ユーザーの利便性を高めることのない文章であり、ツールが作成した文章なのか、人間が執筆した文章なのかは関係ないからです。
そもそもGoogleは、支離滅裂な文章を自動生成された文章だと判断しているので、人間が膨大な時間をかけてワードサラダのような文章を書いた場合は、ワードサラダとみなされます。
「ChatGPT」などのAIが文章を自動作成した場合でも、意味の通じる文章となっていればワードサラダとはみなされません。
AIやツールで作成したかどうかではなく、ユーザーの有益に繋がる文章になっているかどうかが、ワードサラダに当たるかどうかの分かれ目です。
ワードサラダを使用したサイトからリンクされた場合の対処法
自サイトにワードサラダで作成されたテキストがある場合は、削除することで影響を回避できますが、ワードサラダを使用したサイトからリンクを獲得している場合は、自サイトがマイナスの影響を受ける恐れがあります。
ペンギンアップデート4.0が実施されたことで、品質の低いリンクは無効化されますが、Googleが見落としている可能性もあるからです。
その為、ワードサラダを使用したサイトからリンクを獲得している場合は、Googleサーチコンソールを使ってリンクの否認をおこないましょう。
▼ 自サイトに貼られた被リンクの確認方法・リンクの否認方法については、別記事で解説しているので以下記事をご確認ください。
まとめ
ワードサラダは、ブラックハットSEOのひとつとして乱用されていましたが、現在ではスパム行為と判断されるためSEO効果はありません。
サイト全体に悪影響を与える可能性もあるため、ワードサラダを使ってコンテンツを作成するのではなく、高品質なコンテンツを作成するようにしましょう。