品質を判定する「Site quality score」の解説
特定のウェブサイトの品質スコアを決定するための方法について解説します。
特許番号:US9031929B1
タイトル:サイトの品質スコア
公開日:2015年5月12日
発明者:エイプリル・R・リーマンナブニートパンダ
出願人:Google Inc
Gooleパテント「Site quality score」の概要
文書(WEBページの品質をユーザーの行動データに基づいて判定するアルゴリズムです。
ユーザーの検索クエリのユニーク数と「ユーザーによる検索結果の選択」によって決定されます。
このスコアは、ユーザーが特定のサイトやそのサイト内のリソースを探し出し、好むという行動を示す量から決定されます。
ユニーク数とは、「一意性や独自性を指す」検索クエリの数
「ユニーク」は、一意性や独自性を指しています。特に、ユニークなクエリとは、他のクエリとは異なる、一意の検索クエリを指します。たとえば、「Apple」、「Apple Inc.」、「Apple社」などは、それぞれ異なる検索クエリとしてカウントされる可能性があります。
「ユーザーによる検索結果の選択」とは、CTR値(Click Through Rate)
CTR値とは、検索結果表示回数に対するクリック頻度です。
主に、検索クエリと文書の関連性を示す指標として用いられます。
計算式:品質スコア=第一カウント/第二カウント
第一カウント:検索エンジンが受け取った、特定のサイトを参照するユニークなクエリの数
分子は、第一のカウント(特定のサイトを参照するユニークなクエリの数)から閾値を減算したものです。
第二カウント:検索エンジンが受け取った、特定のサイトと関連付けられたユニークなクエリの数
第二のカウント(特定のサイトと関連付けられたユニークなクエリの数)を0より大きく1より小さい値(例えば、0.5、0.6、0.7、0.75、0.8、0.9など)の累乗に基づいています。
第一と第二のカウントに基づいて、特定のサイトのサイト品質スコアを決定
クエリが特定のサイトと関連付けられているとは、そのクエリがユーザーによる検索結果の選択に続くものであり、その検索結果はクエリに対する応答として検索エンジンによって提示され、特定のサイト内のリソースを識別します。
これらの第一と第二のカウントに基づいて、特定のサイトのサイト品質スコアを決定します。
正確な品質評価を可能にする計算式
また、この特許では、分子は「第一のカウントから閾値を減算したもの」または「下限値と第一のカウントから閾値を減算したものの大きい方」であり、分母は「基底値と第二のカウントを0より大きく1より小さい値の累乗したものの和」であるとも述べられています。これらの修正により、品質スコアの計算はさらに洗練され、特定のサイトの品質をより正確に評価することが可能となります。
高い品質スコアを持つ文書の特徴
高品質なサイト(または文書)の特徴は、ユーザーの行動に基づいて評価されます。
Googleアルゴリズムのひとつに「パッセージランキングシステム」というものがございます。
検索クエリが文書の節(章や段落)とどれくらい関連性があるかを判定するアルゴリズムですが、これと関連する仕組みといえます。
ユーザーがある文書にアクセスするたけに用いた検索クエリの数が重要で、ここではユニーク数がカウントされます。
「人工知能」というキーワードの場合、「ニューラルネットワーク」や「ディープラーニング」といった多様な検索クエリで検索対象に含まれ、実際にクリックされる(CTR値が高い)クエリがどれだけ多く存在するかが評価のポイントになります。
多様な検索クエリで流入している
サーチコンソールで調査した時、クエリの数が1,000を超えるようなページはスコアが高いと考えられます。
特許では、ユニーク数がカウントされますので、同じ意味を持つクエリは無視される場合があります。
CTR値を持つ多様なクエリで流入している。
CTR値を持つ多様なクエリ数が高い品質スコアを持つことになります。
高い品質を持つ文書にするためには、「多様な論点」を示すことが不可欠です。
Googleのアルゴリズムを特許文書ベースで研究している。
SEO対策のエキスパート。
一般社団法人全日本SEO協会で特別研究員
論文発表や東京国際フォーラム等でセミナーを開始
SEO検定審査委員会技術委員として試験や参考書籍の監修を行う。