【初心者向け】Google検索の仕組みを分かりやすく解説!クローリング・インデックス・ランキング
こんにちは!ウェブ企画パートナーズの竹内です。前回は「SEOとは何か」「その重要性」「広告との違い」「デメリット」について解説しましたが、今回は検索エンジンの仕組みについて詳しく説明していきたいと思います。
検索エンジンの仕組みを理解することで、自社サイトの目指すべき方向性が明確になりますし、様々なSEO業者の提案を聞いたときにも正しい知識があれば騙されにくくなるというメリットがあります。少し難しい内容もありますが、なるべくわかりやすく説明していきますね。
目次
検索エンジンの3つの主要プロセス
検索エンジン(今回はGoogleを中心に説明します)の仕組みは、大きく分けて以下の3つのプロセスで構成されています:
- クローリング
- インデックス
- ランキング
これら3つのステップを経て、私たちが普段見ているGoogle検索結果が表示されるようになっています。それでは一つずつ見ていきましょう。
1. クローリング
クローリングとは、Googleのロボット(GoogleBOTやクローラー、スパイダーとも呼ばれます)がウェブサイトを巡回して情報を収集する作業です。世界中では毎日膨大な数のサイトが新規作成されたり更新されたりしていますが、GoogleBOTはそれらを探しに行きます。
クローラーの動き方で重要なのは、「リンクを辿っていく」という点です。例えば、あるサイトのトップページにGoogleBOTがアクセスすると、そこからリンクされているページを次々と訪問していきます。つまり、どこからもリンクされていないページはGoogleBOTに見つけてもらいにくいということです。
ホームページに「新着情報」などを載せるのは理にかなっています。トップページからリンクすることで、GoogleBOTに新しいページを発見してもらいやすくなるからです。
クローリングの頻度は、ページの重要度によって異なります。多くのサイトからリンクを受けているページは重要と判断され、クローリングの頻度が高くなる傾向があります。
2. インデックス
クローリングが完了すると、収集した情報をGoogleのデータベースに保管・整理する「インデックス」という作業が行われます。日本語で言うと「索引化」、つまりデータを整理整頓する作業です。
ただし、すべてのページがインデックスされるわけではありません。以下のようなケースではインデックスされないことがあります:
- クローリングできなかった場合(ID・パスワードで保護されたページなど)
- ページの品質が低いと判断された場合(内容がほとんどないページなど)
- GoogleChromeでうまく表示できないページ
- サイト内に似たようなページが既にある場合
- 正規URLが設定されていない複製ページ
特に最後の点は重要で、例えばプレスリリースが複数のニュースサイトに同じ内容で掲載されるケースでは、「親ページ」のみがインデックスされる仕組みになっています。
3. ランキング
無事にインデックスされたページは、誰かが検索したときに表示される候補となります。ここでようやく、私たちが普段見ている検索結果の順位決定が行われます。
ランキングはGoogleの「アルゴリズム」によって決定されます。アルゴリズムとは、どういうサイトを良いサイトとするかという基準のことで、200以上の要素があると言われています。詳細は非公開ですが、代表的な要素は以下の通りです:
関連性
検索キーワードに対する関連性です。例えば「美容室」で検索しているのに整体のサイトが出てくると関連性が低いですよね。関連性は検索言語、デバイス(スマホかパソコンか)、位置情報(どの地域から検索しているか)などでも変わってきます。
コンテンツの質
同じ内容のサイトばかりが上位に表示されても検索ユーザーは満足しません。例えば「健康の保ち方」を検索して、1位から10位まで全て「早寝早起きが大事です」と書いてあっても意味がありませんよね。そのため、サイト独自の情報が評価されやすくなっています。
EEAT(専門性・経験・権威性・信頼性)
特に「YMYL(Your Money Your Life)」と呼ばれるお金・健康・生命・人生に関わる分野では、情報の信頼性が重要視されます。例えば、医師でもない人が健康情報を発信するよりも、病院が運営するサイトの方が信頼できますよね。Googleはあらゆる要因から情報源の信頼性を評価しています。
リンクの量と質
Googleはもともと「良い論文は多くの論文に引用される」という考え方を検索エンジン開発のヒントにしています。つまり、様々なサイトから紹介されているサイトは価値が高いと判断されます。
例えば、おすすめのカフェがあればSNSやブログで紹介したくなりますよね。人気のサービスは自然と紹介される率が高まります。また、日本政府からのリンクは、運営者不明のサイトからのリンクよりも質が高いと評価されます。
ユーザー体験
最近重視されている要素です。サイトの表示速度が遅いと、ユーザーはイライラして離脱してしまいます。Googleにとっても、重いサイトばかりを上位表示するとGoogleの検索体験自体が損なわれてしまうため、サイトの軽さや閲覧のしやすさも評価対象となっています。
コアアップデートについて
Googleのアルゴリズムは常に進化しています。細かな調整は年間100回以上行われていますが、その中でも「コアアップデート」と呼ばれる大規模な見直しが年に数回実施されます。
コアアップデートではアルゴリズムの根幹から見直すため、検索順位が大きく変動することがあります。例えば、DeNAの「WELQ事件」を受けて健康情報の信頼性を重視するようになったり、モバイル端末での検索増加に伴いサイト表示速度が重要視されるようになったりしています。
Googleはコアアップデートの実施日を公開していますが、具体的にどの要素をどれだけ重視するようになったかは非公開です。ただ、「今後はユーザー体験を重要視します」といった方向性を示すこともあります。
SEOのデメリットとして「Googleに振り回され続ける」という点を前回挙げましたが、それはこのコアアップデートに対応するためにコストがかかることを意味します。サイト運営者にとって、コアアップデートは時に味方に、時に敵になるものなのです。
まとめ
今回は検索エンジンの仕組みをざっくりと説明しました。クローリング、インデックス、ランキングという3つのプロセスとコアアップデートについて理解することで、SEOに関する基本的な知識が身につくはずです。
細かいテクニックはたくさんありますが、まずはこの大枠を理解することが重要です。より詳しく知りたい方は、GoogleのSEOスターターガイドや、マンガで解説されているコンテンツもありますので、ぜひ参考にしてみてください。
次回は「実際にどのようなページを作ればいいのか」「どういう調査をすればいいのか」など、より実践的な内容を解説する予定です。
それではまた!