結果を自動的に生成する仕組み
世界には入手可能な情報が膨大に存在するため、情報分類のサポートがなければ必要な情報を見つけるのはほぼ不可能です。Google のランキング システムはそのために設計されています。検索インデックスに登録されている膨大な数のウェブページとその他のコンテンツを分類し、最も関連性の高い有用な結果を瞬時に提示します。
「近所のヘアサロン」という検索クエリが入力された検索バー
検索結果における重要な要因
最も有用な情報を表示するため、検索アルゴリズムはさまざまな要因とシグナル(検索クエリの単語、ページの関連性や有用性、ソースの専門性、ユーザーの位置情報や設定など)を検討します。各要因に適用される重み付けはクエリの性質によって異なります。たとえば、最新のニュース トピックに関するクエリに回答する場合は、言葉の定義に関するクエリに回答する場合よりも、コンテンツの鮮度が大きな役割を果たします。
クエリに対して返される結果の判断にかかわる主な要因について詳しくは、以下をご覧ください。
検索クエリの意味

関連性の高い結果を返すには、ユーザーがどんな情報を探しているか、つまり検索クエリの背後にどんな意図があるかをまず理解する必要があります。そのために、Google では、検索ボックスに入力された比較的少数の単語と、入手可能な最も有益なコンテンツとのマッチングの程度を把握するための言語モデルを構築しています。

このモデルには、スペルミスを認識して修正するような、単純に見える手順が含まれます。そしてさらに進んで、使用された単語と厳密に同じ単語が含まれていなくても適切なドキュメントを見つけることのできる、高度な類義語システムが試されます。たとえば、「ノートパソコンの明るさを変える」という検索に対して、メーカー側の記述が「ノートパソコンの明るさの調整」となっているような場合です。Google のシステムは、単語と意図がつながっていることを理解して、適切なコンテンツを提示します。このシステムは開発に 5 年以上かかりましたが、さまざまな言語の検索の 30% 以上で大きな成果を上げています。

「電球を取り換える方法」という検索クエリで「取り換える」が「交換する」に置き換わる

Google のシステムでは、求められている情報のタイプを把握する試みも行われます。検索クエリで「料理」や「絵」などの単語が使われた場合、システムは、レシピまたは画像を表示すればユーザーの意図に最もよく一致する可能性があると判断します。フランス語で検索された場合は、ほとんどの検索結果がフランス語で表示されます。それがユーザーの要望に合っていると思われるからです。また、多くの検索クエリが特定の地域を対象としていることも、Google のシステムは認識できます。「ピザ」という検索に対して、近隣のピザデリバリー店に関する結果が表示されるのはこのためです。

急上昇中のキーワードが検索された場合、システムは、古いページより最新情報のほうが有益であると判断します。つまり、スポーツの試合状況や企業の業績など特に新しい情報に関連する内容が検索された場合には、最新の情報が表示されます。

コンテンツの関連性

システムは次に、コンテンツを分析して、求められている内容に関連する可能性のある情報が含まれているか評価します。

情報の関連性を評価するための最も基本的なシグナルは、検索クエリと同じキーワードがコンテンツに含まれているかどうかです。たとえばウェブページの場合、キーワードがページに出現する(特に見出しや本文に含まれている)場合、そのページの情報は関連性が高い可能性があります。

ウェブサイトを虫メガネで調べる

Google のシステムでは、キーワードに着目するだけでなく、コンテンツが他の点で検索クエリと関連しているかも分析します。匿名化して集計したインタラクション データに基づいて検索クエリと検索結果の関連性を評価することもしています。インタラクション データをシグナルに変換して機械学習することで、関連性をより正しく推定できるようになります。たとえば、「犬」で検索する場合、必要なのは「犬」という単語が何百回も出現するページではありません。それを踏まえて、検索アルゴリズムでは、「犬」というキーワード以外で関連性の高いコンテンツ(犬の画像や動画、犬種のリストなど)がページに含まれているかどうかを評価しています。

なお、Google のシステムではこうした定量化可能なシグナルに基づいて関連性を評価していますが、ページのコンテンツの主観的概念(視点や政治的な偏向)を分析するようには設計されていません。

コンテンツの質

システムは、関連性のあるコンテンツを特定した後、最も役立ちそうなコンテンツを優先しようとします。そのために、どのコンテンツが専門性、権威性、信頼性を示しているか判定するために役立つシグナルを特定します。

たとえば、その判定を支援するために使用している要因の 1 つに、そのコンテンツへのリンクまたは言及が他の著名なウェブサイトに含まれているか把握するということがあります。含まれていれば、多くの場合、その情報の信頼性が高いことを示す十分なしるしとなります。さらに Google では、検索品質評価プロセスからのフィードバックを集計し、より正確に情報の質を判定できるようシステムを改善しています。

ウェブサイトをアルゴリズムで分析

ウェブをはじめ、あらゆる情報源のコンテンツは常に更新されています。Google では、システムの品質を継続的に測定、評価することで、情報の関連性と権威性のバランスを適正に保ち、表示される検索結果の信頼性を維持しています。
ウェブサイトのユーザビリティ

Google のシステムでは、コンテンツのユーザビリティも考慮されています。どのコンテンツも大きな差がない場合には、ユーザーにとってのアクセス性が高いコンテンツのほうが効果的である可能性があります。

たとえば、Google のシステムはページ エクスペリエンスの観点に着目します。コンテンツがモバイル フレンドリーであればモバイル デバイス ユーザーにとって読みやすいというようなことです。同様に、やはりモバイル ユーザーにとって重要な、コンテンツの読み込み速度を確認します。

ゴールドバッジの付いたウェブサイト

コンテキストと設定

現在地、過去の検索履歴、検索設定などの情報はすべて、検索の時点で最も有用で関連性が高い検索結果を確保するために役立っています。

Google では、ユーザーお住まいの国や所在地を使用して、お住まいの地域に関連するコンテンツを提供します。たとえば、シカゴに住んでいるユーザーが「football」で検索すると、ほとんどの場合、アメリカン フットボールやシカゴベアーズに関する検索結果が最初に表示されます。一方、ロンドンにいるユーザーが「football」で検索した場合は、サッカーやプレミアリーグに関係のある検索結果が表示されます。自分にとって役立ちそうな検索結果が表示されるようにするには、検索の設定も重要です。検索の設定では、使用する言語を指定したり、セーフサーチ(露骨な表現を含む検索結果を除外できるツール)を有効にしたりすることができます。

サッカーとアメリカン フットボールを表示している 2 つのウェブサイト

Google 検索は、Google アカウント内でのアクティビティに基づいて検索結果をカスタマイズする機能も備えています。たとえば「近くのイベント」を検索すると、ユーザーの興味や関心に合わせてカスタマイズされたおすすめのイベントが表示されることがあります。

こうした機能は、ユーザーの興味や関心に合った情報を提供するために開発されたもので、ユーザーに関するセンシティブな情報(人種、宗教、支持政党など)を推測することを目的としていません。

検索結果を改善するために検索履歴を使用するかどうか(Google アカウントにどのデータを保存するかなど)は、ユーザー自身が myaccount.google.com で変更できます。アカウントでのアクティビティに基づく検索のカスタマイズを無効にするには、[ウェブとアプリのアクティビティ] をオフにします。

設定にはセーフサーチなどのコンテンツ設定もあります。これらは、一部のユーザーに衝撃を与える可能性のある生々しいコンテンツを検索結果に含めるかどうか選択するのに役立ちます。