普段何気なく使っているGoogle検索が、どのように行われているかご存知ですか?
詳しく答えられる方は中々いないのではないでしょうか。恥ずかしながら私もその1人です。
今日、ソーシャルメディアとコンテンツマーケティングを専門に行っているVertical Measuresが、Google検索の仕組みについて分かりやすいインフォグラフィックを公開されていたので、ご紹介します。
How Google Understands You
それぞれのフローへ簡単な解説を加えておきます。
検索結果はどこからくるの?
1. インデックスページ
Googleがこれまでにコレクションしたウェブページの数。この中から検索結果が返される。
Googleは毎日200億ページインデックス化している。
2. ナレッジ・グラフツール
言葉の意味(例えば類義語であったり異義語など)を把握し、他の言葉との関係性を見つけるためのデーターベース。
検索クエリへの入力
3. リテラル検索
検索エンジンはフレーズの一部、もしくは全体が一致するものを探します。例えばFLASH DRIVEとUSB STICKは同じものですよね。こうして良い検索結果を見つけます。
4. シマンテック検索
ユーザーが入力したテキストをナレッジ・グラフデータベースで用語・言語などを分析し、入力されたテキストの内容を理解します。
Googleはどうやって、あなたが検索している意味を知るのか?
5. Google+
あなたがGoogleへサインインしているなら、あなたのアカウントの履歴やロケーションなどを検索結果に反映します。
6. 言語への理解
あなたが検索した内容を構文・意味合いに分けて分析しています。
構文:音声と検索フレーズを独自のアルゴリズムで分けて関係性を見出している。
意味合い:別のアルゴリズムを用いて、フレーズをタグに分けてナレッジグラフデータベースのデータと比較している。
7. 構文
ペタバイトに及ぶウェブドキュメントや過去の検索データを分析し、言葉の関連性を見出している。
検索結果に反映されるオンサイト要素
8. サイト構成の関係性
ホームページ(トップ)、サブページ(ホームページとの関係性)、サブページ2(プライマリーページとの関係性)で構成されている。
9. ページ構成の関係性
H1, H2, H3, タイトル, ALTタグやメタディスクリプションなどの要素で決定する。
10. 内部リンクの関係性
ウェブページ内の関連情報(USBとポートは関係あるが、USBとコンテンツは関係がない)を基に決める。
11. 外部リンクの関係性
外部の似たようなトピックスや高い権威性を持ったウェブサイトとのリンクが考慮される。
12. schema.org
ウェブページのマイクロデータタグやコンテンツの最適化を行います。検索エンジンに対し、このページがどのようなページであるのかを、簡単に伝えることができるようになります。
検索結果
13. ナレッジ・グラフ
ナレッジ・グラフデータベースから出てきた結果。ブラウザの右側に表示されるアレ。
14. リテラル検索
一般的に“検索結果”と呼ばれるもの。ページランクなど様々な要素が関係している。
15. 関連する検索結果
ナレッジ・グラフデータベースを参照し、表示された似た意味合いを持つ検索結果。一番下に出てくる関連する検索結果にあたる。
How Google Understands You (Vertical Measures)
まとめ
私も非常に大雑把でしか検索についての理解が無かったので、こうしたインフォグラフィックは勉強になります。
意味合い、構文を理解する、なんていうのは人間も顔負けですし、インデックス量を考えれば人間を遥かに超えていると再認識しました。
しかもこれらのアルゴリズムは日々改良されているのですから、いかにGoogle検索が優れているかわかりますね。
(Photo: Thinking about small by falequin)