WO2023073777A1

WO2023073777A1 - 情報処理システム、情報処理方法及びプログラム

Info

Publication number: WO2023073777A1
Application number: PCT/JP2021/039345
Authority: WO
Inventors: 直也榊原; 祐樹廣部
Original assignee: データ・サイエンティスト株式会社
Priority date: 2021-10-25
Filing date: 2021-10-25
Publication date: 2023-05-04
Also published as: JP7437104B2; JPWO2023073777A1

Abstract

検索エンジンにおいて、任意のウェブページの標的とする検索クエリによる検索結果として抽出されたウェブページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段と、を備え、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリの形態素とともに過去に検索で用いられた複合クエリの形態素のうち、標的クエリの形態素を除いたものである。

Description

情報処理システム、情報処理方法及びプログラム

　本発明は、情報処理システム、情報処理方法及びプログラムに関する。

　ウェブページ(以下、ページという)の制作にあたっては、検索エンジン対策が重視されることが多い。その際、制作対象ページの標的ユーザが用いると予測される任意の検索クエリ（以下、標的クエリという）をそのページの主題とみたて、その主題を成立させるための目次やメニュー、表、解説文などを的確に選定し記述すべく、その標的クエリの検索結果に上位表示される複数のページ（以下、検索ヒットページという）に含まれる形態素（以下、ページ形態素という）（特許文献１参照）を参考にしたり用いたりする。さらには、標的クエリを構成する形態素（以下、コア形態素という）に別の形態素が追加されて検索される、より複合度の高い検索クエリ（以下、複合クエリ）にも着目し、それらに含まれるコア形態素以外の形態素（以下、クエリ形態素という）についても参考にしたり用いたりする（例えば、特許文献２参照）。

このときクエリ形態素は、意味を成す最小の単語としても良いし、意味を成す複数語のまとまりを形態素としても良い。

特許第６１６４４３６号公報国際公開２０２１／０４０００３号公報特許第６６８０９５６号公報特許第６２５３０４１号公報

　クエリ形態素は、標的ユーザのサブニーズを示す傾向があることが知られており、標的クエリを主題としたページへの記述、とりわけ目次やメニューなどを示すＨＴＭＬタグまたは属性への記述に適しているものが含まれる傾向にある。

　ページ制作者は例えば、数十～数千に及ぶ多数のクエリ形態素を手作業で調査し、ページごとに適切と思われるものを選定したうえで、各ページ内において適切と思われるＨＴＭＬタグで挟まれた文字列またはＨＴＭＬタグ内の属性等を記載する。その後、ページごとにクエリ形態素の抜け漏れの確認や過不足対応なども行う。また、制作対象ページのクエリ形態素の実装度合いと各上位ページのそれらとを比較することによって、制作対象ページの内容的な競争力をリリース前に把握しようとする。これら一連の業務は非常に煩雑で多くの工数を要するため、合理化するための補助ツールが求められている。

　本発明の一つの目的は、上記問題に鑑みてなされたものであり、制作対象ページにおけるクエリ形態素の選定作業または標的クエリで検索ヒットするページにおけるクエリ形態素の実装度分析の効率を向上させることを可能とする情報処理システム、情報処理方法及びプログラムを提供することである。

　本発明の第１の態様に係る情報処理システムは、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段と、を備え、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものである。

　本発明の第２の態様に係る情報処理システムは、第１の態様に係る情報処理システムであって、前記複数のページのソースの一部に含まれるクエリ形態素は、当該ソース中の複数のサイト骨格タグに関連付けられて記載された複数の文字列であり、前記計数手段は、前記ソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力し、前記サイト骨格タグは目次やリンク先のページ主題など、サイト内容の骨格となる言葉が使用されるタグまたは属性の総称である。

　本発明の第３の態様に係る情報処理システムは、第２の態様に係る情報処理システムであって、前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を比較可能に表示するための情報を出力する。

　本発明の第４の態様に係る情報処理システムは、第２の態様に係る情報処理システムであって、前記計数手段は、前記クエリ形態素の数または割合を、サイト骨格タグの種類毎に計数し、前記出力手段は、前記サイト骨格タグの種類毎に前記クエリ形態素の数または割合を表示するための情報を出力する。

　本発明の第５の態様に係る情報処理システムは、第４の態様に係る情報処理システムであって、前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中に含まれるクエリ形態素の数または割合、サイト骨格タグの種類毎に計数し、前記出力手段は、前記クエリ形態素の数または割合を前記サイト骨格タグの種類毎に比較可能に表示するための情報を出力する。

　本発明の第６の態様に係る情報処理システムは、第１の態様に係る情報処理システムであって、前記計数手段は、標的クエリの検索ヒットページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を、クエリ形態素毎に表示するための情報を出力する。

　本発明の第７の態様に係る情報処理システムは、第６の態様に係る情報処理システムであって、前記計数手段は、標的クエリの検索ヒットページそれぞれについて、当該ページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を複数のページの間でクエリ形態素の種類毎に比較可能に表示するための情報を出力する。

　本発明の第８の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、クエリ形態素それぞれを、当該クエリ形態素に基づいて、複数のセグメントのいずれかに分類する分類手段と、ユーザが指定するセグメントを取得する取得手段と、複数の前記クエリ形態素をユーザが指定するセグメントでフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第９の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、前記標的クエリの形態素とクエリ形態素の両方が含まれる検索クエリの種類数を、クエリ形態素毎に計数する種類数計数手段と、複数の前記クエリ形態素を、対応する前記計数された検索クエリの種類数でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１０の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、前記標的クエリの形態素とクエリ形態素の両方が含まれる検索数を、クエリ形態素毎に計数する検索数計数手段と、複数の前記クエリ形態素を、対応する前記計数された検索数でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１１の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、前記標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる複数の検索クエリの検索数それぞれと、対応するクリック単価及び／または競合性を用いて、当該検索クエリに対する経済規模を、クエリ形態素毎に決定する経済規模決定手段と、複数の前記クエリ形態素を、対応する前記計数された経済規模でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１２の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、ユーザが指定したクエリ形態素もしくは当該クエリ形態素を含む検索クエリを取得する取得手段と、標的クエリによる検索結果に含まれる複数のページそれぞれについて、当該ページのソースに含まれる前記取得されたクエリ形態素の数で前記複数のページをランキングした結果と、複数の前記クエリ形態素のうち当該取得されたクエリ形態素以外の別クエリ形態素の数で前記複数のページをランキングした結果との類似度を、当該別クエリ形態素毎に決定する類似度決定手段と、複数の前記クエリ形態素を、対応する前記決定された類似度でフィルタもしくはソートする処理手段を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１３の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、標的クエリによる検索結果に含まれる複数のページ（例えば上位ページト）からユーザが選択した選択ページを取得する取得手段と、複数の前記クエリ形態素を、前記取得された選択ページに含まれるクエリ形態素でフィルタするか、前記取得された選択ページに含まれるクエリ形態素の数でソートするか、または前記取得された選択ページに含まれるクエリ形態素の数で前記複数のページをランキングした場合の順位でフィルタまたはソートする処理手段と、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１４の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する取得手段と、前記複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する解析結果取得手段と、前記解析結果に基づいて、前記複数のページから、前記選択ページとの間で、検索ニーズの混在具合が類似している類似ページを抽出する抽出手段と、クエリ形態素毎に、前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて統計量を決定する統計量決定手段と、複数の前記クエリ形態素を、対応する前記決定された統計量でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１５の態様に係る情報処理システムは、第１４の態様に係る情報処理システムであって、前記取得手段は、ユーザによって指定された順位をユーザ指定順位として取得し、前記統計量決定手段は、クエリ形態素毎に、前記複数のページのうちから当該クエリ形態素が多い順に前記ユーザ指定順位まで選択された前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて前記統計量を決定する。

　本発明の第１６の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、ユーザによって選択された上位ページを取得する取得手段と、複数の前記クエリ形態素を、前記上位ページにおけるクエリ形態素毎の統計量でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１７の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、ユーザによって選択された上位ページ及び下位ページを取得する取得手段と、複数の前記クエリ形態素を、当該クエリ形態素それぞれ毎に決定される上位ページにおけるクエリ形態素の統計量と下位ページにおけるクエリ形態素の統計量に基づく値でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１８の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、経済規模によるフィルタもしくはソートの要求を取得する取得手段と、複数の前記クエリ形態素を、前記経済規模でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第１９の態様に係る情報処理システムは、第６または７の態様に係る情報処理システムであって、コア形態素とクエリ形態素の両方が含まれる検索クエリの上位ページでどの程度特徴的に対象形態素が使用されているかを表す指標である業界特有度によるフィルタもしくはソートの要求を取得する取得手段と、複数の前記クエリ形態素を、前記業界特有度でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。

　本発明の第２０の態様に係る情報処理システムは、標的クエリによる検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手段と、前記判定されたカテゴリを表示するための情報を出力する出力手段と、を備える。

　本発明の第２１の態様に係る情報処理システムは、第２０の態様に係る情報処理システムであって、前記ページのカテゴリには、当該標的クエリに含まれるコア形態素を説明する説明タイプ、当該標的クエリに含まれるコア形態素に該当するものを一覧表示する一覧タイプが含まれる。

　本発明の第２２の態様に係る情報処理方法は、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順と、を有し、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものである。

　本発明の第２３の態様に係る情報処理方法は、標的クエリによる検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順と、前記判定されたカテゴリを表示するための情報を出力する出力手順と、を有する。

　本発明の第２４の態様に係るプログラムは、コンピュータに、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順、を実行させるためのプログラムであって、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものであるプログラムである。

　本発明の第２５の態様に係るプログラムは、コンピュータに、標的クエリによる検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順、前記判定されたカテゴリを表示するための情報を出力する出力手順、を実行させるためのプログラムである。

　本発明の一態様によれば、ページのソースの一部または全部に含まれるクエリ形態素の数または割合をユーザが把握することにより、当該ページにおいて、足りていないクエリ形態素の把握を容易化することができ、ページにおけるクエリ形態素の選定作業の効率を向上させることができる。

本実施形態に係る情報処理システムの概略構成図である。本実施形態に係る端末の概略構成図である。本実施形態に係るコンピュータシステムの概略構成図である。クエリ形態素集計画面の一例である。クエリ形態素のフィルタ・ソート例を説明するための画面Ｇ２の一例である。フィルタまたはソート前の共通処理の一例を示すシーケンス図である。選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示するための処理の一例を示すフローチャートである。選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第１の例を示すフローチャートである。選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第２の例を示すフローチャートである。選択されたページと検索ニーズが類似するページの統計量を表示するための処理の一例を示すフローチャートである。標的クエリによって評価されるページが説明タイプの場合のクエリ形態素集計画面の一例である。標的クエリによって評価されるページが一覧タイプの場合のクエリ形態素集計画面の一例である。

　以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。

　＜定義＞
　本実施形態における用語の定義について説明する。ウェブページは単にページということがある。また上位ページは、検索エンジンにおいて検索結果の上位に表示されるページである。ここで上位は任意に設定可能であり、例えば１位～Ｎ位（Ｎは自然数）である。

　クエリ形態素は、制作対象ページの標的ユーザが検索エンジンに検索要求する際に用いる任意の検索クエリ（以下、標的クエリという）に含まれるコア形態素とともに過去に他の複合クエリのうち、標的クエリの形態素を除いたものである。ここで標的クエリに含まれるコア形態素は１つであっても複数であってもよく、標的クエリそのものであってもよい。どの形態素を標的クエリ内のコア形態素とみなすかは、ユーザが任意に決定することができる。本実施形態では説明の簡略化のためコア形態素は１つであるものとして説明する。

　ページ形態素は、ページに記載された形態素であり、ページ制作者が意識的または無意識的にクエリ形態素と同一の形態素を含めることがある。

　サイト骨格タグは、（例えばページの骨子の構成要素にあたる形態素の投入が適する）サイト内容の骨格となる言葉が使用されるタグまたは属性の総称である。それらにおいてはリンク関係にある他のページの主題を予告または示唆しやすいという特徴があり、それぞれのサイト骨格タグにどのようなクエリ形態素を登用するかはサイトの構造設計（複数のページ同士の意味的な関係の設計）を検討するうえで極めて重要である。サイト骨格タグに含まれるタグには例えば、見出しタグ（例えば、h1～h6）、リストタグ（例えば、ul、ol、li、dt）、テーブルタグ（例えば、th、td）、フォーム内入力タグ（selectタグやcheckbox、radioなどinputタグ）、アンカータグ（例えば、aタグ）、画像タグ（imgタグ）、オプションタグ（optionタグ）等が含まれる。
　サイト骨格タグに含まれる属性には、例えばhref属性のようにaタグに付与する情報、inputタグのtype属性、imgタグのalt属性、title属性等が含まれる。ここで属性の例について詳細に説明する。<a href=”/index.html”>リンク</a>のような例の場合、<a></a>で挟まれている部分はコンテンツとなり、hrefのようにaタグに付与する情報が属性であり、aタグのhref属性に/index.htmlが指定されている。例えば、checkboxやradioなどはテキスト入力と同じinputタグが使用され、type属性で切り替えが行われる。クエリ形態素がコンテンツではなくこのような属性に使われるケースもあり、例えばimgタグのalt属性に使われる。

　図１は、本実施形態に係る情報処理システムの概略構成図である。図１に示すように、情報処理システムＳは、端末１－１～１－Ｋ（Ｋは自然数）と、端末１－１～１－Ｋと通信回路網ＣＮを介して接続されたコンピュータシステム２とを備える。検索エンジンの一例である検索エンジンサーバ３は、通信回路網ＣＮを介して通信可能にコンピュータシステム２に接続されている。

　端末１－１～１－Ｋは、別々のユーザによって使用されるもので、例えば、多機能携帯電話（いわゆるスマートフォン）などの携帯電話、タブレット、ノートパソコン、またはデスクトップパソコンなどである。本実施形態では一例として、端末１－１～１－Ｋには、例えばウェブブラウザを介して、コンピュータシステム２から送信された情報が表示されるものとして以下説明する。以下、端末１－１～１－Ｋを総称して端末１とも呼ぶ。

　コンピュータシステム２は、本実施形態に係る情報処理システムＳを管理する管理団体によって使用されるものである。コンピュータシステム２は端末１－１～１－Ｋに対して情報を提供する。コンピュータシステム２は、一台のコンピュータで構成されてもよいし、複数のコンピュータで構成されてもよい。本実施形態では一例として、コンピュータシステム２は、一台のコンピュータであるものとして説明する。

　図２は、本実施形態に係る端末の概略構成図である。図２に示すように、端末１は例えば、入力インタフェース１１と、通信モジュール１２と、ストレージ１３と、メモリ１４と、出力インタフェース１５と、プロセッサ１６とを備える。

　入力インタフェース１１は、ユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ１６へ出力する。
　通信モジュール１２は、通信回路網ＣＮに接続されており、コンピュータシステム２と通信する。この通信は有線であっても無線であってもよいが、無線であるものとして説明する。

　ストレージ１３には、プロセッサ１６が読み出して実行するためのプログラム及び各種のデータが格納されている。
　メモリ１４は、データ及びプログラムを一時的に保持する。メモリ１４は、揮発性メモリであり、例えばＲＡＭ（Random Access Memory）である。
　出力インタフェース１５は、ディスプレイ１７に接続されており、プロセッサ１６の指令に従って映像信号をディスプレイ１７に出力する。

　プロセッサ１６は、ストレージ１３からプログラムをメモリ１４にロードし、当該プログラムに含まれる一連の命令を実行することによって、処理を実行する。
　ディスプレイ１７は、プロセッサ１６の指令に従って情報を表示する。なおディスプレイ１７は端末１に外付けで接続されているだけではなく、端末１に内蔵であってもよい。

　図３は、本実施形態に係るコンピュータシステムの概略構成図である。図３に示すように、コンピュータシステム２は、入力インタフェース２１と、通信モジュール２２と、ストレージ２３と、メモリ２４と、出力インタフェース２５と、プロセッサ２６とを備える。
　入力インタフェース２１は、コンピュータシステム２の管理者（例えば、管理団体の従業員）からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ２６へ出力する。
　通信モジュール２２は、通信回路網ＣＮに接続されており、端末１－１～１－Ｋと通信する。この通信は有線であっても無線であってもよいが、有線であるものとして説明する。

　ストレージ２３は、プロセッサ２６が読み出して実行するためのプログラム及び各種のデータが格納されている。
　メモリ２４は、データ及びプログラムを一時的に保持する。メモリ２４は、揮発性メモリであり、例えばＲＡＭ（Random Access Memory）である。
　出力インタフェース２５は、外部の装置と接続可能であり、当該外部の装置へ信号を出力可能である。

　プロセッサ２６は、ストレージ２３からプログラムをメモリ２４にロードし、当該プログラムに含まれる一連の命令を実行することによって、計数手段２６１、出力手段２６２、分類手段２６３、処理手段２６４、種類数計数手段２６５、検索数計数手段２６６、経済規模決定手段２６７、取得手段２６８、類似度決定手段２６９、解析結果取得手段２７０、抽出手段２７１、統計量決定手段２７２、判定手段２７３、特有度決定手段２７４として機能する。それぞれの処理については後述する。

　計数手段２６１は、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する。出力手段２６２は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する。この処理について、図４におけるクエリ形態素集計画面に表示されるクエリ形態素の数を用いてについて説明する。

　＜実施例１＞
　続いて実施例１において端末１に表示されるクエリ形態素集計画面について説明する。図４は、クエリ形態素集計画面の一例である。図４に示すように、クエリ形態素集計画面Ｇ１には、一例として標的クエリ「cad」を用いた検索エンジンでの検索結果に含まれる検索順位１～１０位までのページが、そのページのタイトル、ＵＲＬ、解析結果とともに示されている。ここで解析結果とは、各ページに含まれる形態素の分布の違いを解析した結果である。ここでは一例として、各ページに含まれる形態素を多次元の特徴ベクトルデータに変換してクラスタリング処理を行った結果を、各ページそれぞれのカラーバー上に色や模様を異ならせて表示している。

　この解析結果を取得するために、解析結果取得手段２７０は、複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する。具体的には例えば、解析結果取得手段２７０は、特許文献３（特許第６６８０９５６号公報）の請求項１２及びその明細書の対応箇所に記載の方法、または請求項１７及びその明細書の対応箇所に記載の方法に従って、解析結果を取得する。

　図４に示すように、解析結果画面Ｇ１には、検索順位１～６位までのページそれぞれに含まれるクエリ形態素の総数（図４のTOTALに対応する数字）が表示されている。また解析結果画面Ｇ１には、検索順位１～６位までのページそれぞれに含まれるサイト骨格タグと関連付けられて記載された（例えば、タグに挟まれたもしくは、属性として記載された）クエリ形態素の総数（図４のサイト骨格タグTOTALに対応する数字）が表示されている。その内訳として、検索順位１～６位までのページそれぞれに含まれる、ヘッダータグ、リストタグ、テーブルタグ、フォーム内タグ、アンカータグ、画像タグそれぞれと関連付けられて記載された（例えば、タグに挟まれたもしくは、属性として記載された）クエリ形態素の数が示されている。更に、検索順位１～６位までのページそれぞれに含まれるその他のタグと関連付けられて記載された（例えば、タグに挟まれたもしくは属性として記載された）クエリ形態素の総数（図４のその他のタグTOTALに対応する数字）が表示されている。

　上記の例では、計数手段２６１が計数する対象となる前記ページのソースの一部に含まれるクエリ形態素は、当該ソース中の複数のサイト骨格タグに関連付けられて記載された複数の文字列である。上記の表示を実現するために、計数手段２６１は、前記ソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数する。そして出力手段２６２は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する。

　＜計数の観点１：一つのサイト骨格タグについて複数のページそれぞれで計数＞
　より詳細には、計数手段２６１は、前記の検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数する。
　そして出力手段２６２は、前記計数されたクエリ形態素の数または割合を比較可能に表示するための情報を出力する。これにより、一つのサイト骨格タグに関連付けられたクエリ形態素の数を、検索ヒットページ間で比較することができる。

　＜計数の観点２：サイト骨格タグの種類毎の計数＞
　また計数手段２６１は、前記クエリ形態素の数または割合を、サイト骨格タグの種類毎に計数する。そして出力手段２６２は、前記サイト骨格タグの種類毎に前記クエリ形態素の数または割合を表示するための情報を出力する。これにより、複数種類のサイト骨格タグの間で、そのサイト骨格タグに関連付けられたクエリ形態素の数を、比較することができる。

　＜計数の観点１と計数の観点２の組合せ＞
　この計数の観点１とこの計数の観点２の組合せると、計数手段２６１は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中に含まれるクエリ形態素の数または割合、サイト骨格タグの種類毎に計数する。そして出力手段２６２は、前記クエリ形態素の数または割合を前記サイト骨格タグの種類毎に比較可能に表示するための情報を出力する。これにより、サイト骨格タグそれぞれに関連付けられたクエリ形態素の数を、検索ヒットページ間で比較することができる。

　更に解析結果画面Ｇ１には、クエリ形態素毎に、その名称、クエリ種類数、経済規模が表示されている。ここでは、クエリ種類数とは、標的クエリ（図４の例では「cad」）と該当するクエリ形態素（例えば、検索クエリ〈autocad〉から抽出されたクエリ形態素「auto」）とを含む検索クエリの種類数である。ここで、経済規模は、クエリ形態素の抽出元となった1つまたは複数の検索クエリについてどのくらいの経済規模があるかを示す。クエリ形態素の経済規模は例えば、標的クエリと当該クエリ形態素が使用されている検索クエリそれぞれについて、単位期間（例えば月）あたりの検索数（検索ボリュームともいう）と、ＰＰＣ広告のクリック単価と、ＰＰＣ広告の競合性と、のうち、いずれか２つまたは３つを乗じた値を合計した値である。

　更にクエリ形態素毎に、検索順位１～６位までのページそれぞれに含まれる当該クエリ形態素の数が示されている。

　上記の表示を実現するために、計数手段２６１は、標的クエリの検索ヒットページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数する。そして出力手段２６２は、前記計数されたクエリ形態素の数または割合を、クエリ形態素毎に表示するための情報を出力する。ここで割合は例えば、上記ページに含まれるクエリ形態素の総数に占める対象のクエリ形態素の割合である。これにより、複数のクエリ形態素に渡って、上記ページに含まれる数または割合を比較することができる。

　より詳細には、計数手段２６１は、標的クエリの検索ヒットページそれぞれについて、当該ページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数する。そして出力手段２６２は、前記計数されたクエリ形態素の数または割合を複数のページの間でクエリ形態素の種類毎に比較可能に表示するための情報を出力する。ここで割合は例えば、上記ページに含まれるクエリ形態素の総数に占める対象のクエリ形態素の割合である。これにより、標的クエリの検索ヒットページに渡って、クエリ形態素の種類毎に、クエリ形態素の数または割合を比較することができる。

　図６は、フィルタまたはソート前の共通処理の一例を示すシーケンス図である。
　（ステップＳ１１０）コンピュータシステム２は、端末１からの要求に応じて検索クエリ入力画面データを端末１に送信する。これにより、検索クエリ入力画面が端末１に表示される。

　（ステップＳ１２０）次に端末１は、検索クエリ入力画面においてユーザによって入力された検索クエリをコンピュータシステム２へ送信する。

　（ステップＳ１３０）次にコンピュータシステム２は、検索クエリとともに検索要求を検索エンジンサーバ３へ送信する。

　（ステップＳ１４０）検索エンジンサーバ３は、検索クエリとともに検索要求を受信し、検索要求に応じて検索クエリで検索を実行する。

　（ステップＳ１５０）検索エンジンサーバ３は、検索結果をコンピュータシステム２へ送信する。

　（ステップＳ１６０）コンピュータシステム２は、検索結果を受信し、検索結果の例えば１位から１０位の各ＵＲＬ（Uniform Resource Locator）を宛先とするＨＴＴＰリクエストを通信回路網ＣＮに順次送信する。

　（ステップＳ１７０）各ＨＴＴＰリクエストを受信したウェブサーバは、該当するページデータをコンピュータシステム２に返信する。

　（ステップＳ１８０）コンピュータシステム２は、これらのページデータを受信した場合、各ページに含まれる形態素毎に計数し、解析結果画面データを生成して、解析結果画面データを端末１へ送信する。これにより、クエリ形態素集計画面（例えば、図４の画面Ｇ１）が端末１に表示される。

　このとき、複数の形態素をひとつのグループとしてまとめ、グループ内の形態素の計数結果の合計としても良い。例えば「学習」、「勉強」の関係にあるような同義語など標的ユーザが読み取る内容が同じ形態素について別々に計数するのではなく、一つのグループとしてまとめて計数することで、言い換えなどを同じ形態素としてカウントすることが可能になり、読者の感覚に近い形で計数することが可能となる。

　このとき、複数の形態素をまとめる方法として、あらかじめ定義した同義語・類似語データベースに基づいて自動で処理しても良い。また、グループの追加やグループ内の形態素を追加・削除することで、ユーザが調整しても良い。これにより、例えば「学習」「勉強」を同じ意味として扱うべき状況か、それぞれを厳密に分けるべきかをユーザが調整することが可能となる。

　前記ユーザが調整した結果を用いることで、同義語・類義語の定義や分類を機械学習アルゴリズムなどを用いて更新する仕組みを追加しても良い。

　＜クエリ形態素のフィルタ・ソート例＞
　続いてクエリ形態素のフィルタ・ソート例について説明する。図５は、クエリ形態素のフィルタ・ソート例を説明するための画面Ｇ２の一例である。クエリ形態素集計画面（例えば、図４の画面Ｇ１）表示後において、ユーザから所定の操作を受け付けた場合、図５の画面Ｇ２のように、クエリ形態素のフィルタ・ソートを設定するためにポップアップされた設定領域Ｒ２が表示される。図５の画面Ｇ２における設定領域Ｒ２において、検索クエリを選択可能なセレクトボックスＲ２１が表示されており、検索クエリが選択された場合、選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示することができる。

　選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示するための処理について図７を用いて説明する。図７は、選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示するための処理の一例を示すフローチャートである。

　（ステップＳ２１０）端末１のプロセッサ１６は、例えば、図５の画面Ｇ２の設定領域Ｒ２におけるセレクトボックスＲ２１で選択された、クエリ形態素を含む検索クエリを受け付ける。

　（ステップＳ２２０）端末１のプロセッサ１６は、受け付けた検索クエリをコンピュータシステム２へ送信する。

　（ステップＳ２３０）取得手段２６８は、ユーザが指定したクエリ形態素（例えば「3d」）もしくは当該クエリ形態素（例えば「3d」）を含む検索クエリ（図５の例では、「3d cad」）を取得する。
　そして類似度決定手段２６９は、標的クエリによる検索結果に含まれる複数のページそれぞれについて、当該ページのソースに含まれる前記取得されたクエリ形態素（図５の例では「3d」）の数で前記複数のページをランキングした結果と、複数の前記クエリ形態素のうち当該取得されたクエリ形態素以外の別クエリ形態素（例えば、「auto」）の数で前記複数のページをランキングした結果との類似度を、当該別クエリ形態素毎に（図５の例では、「auto」、「free」、「soft」、「2020」など毎に）決定する。

　（ステップＳ２４０）処理手段２６４は、複数の前記クエリ形態素を、対応する前記決定された類似度でフィルタもしくはソートする。

　（ステップＳ２５０）出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。

　（ステップＳ２６０）端末１は、処理後画面データを受信し、この処理後画面データを用いて処理後画面を表示する。

　図５の画面Ｇ２における設定領域Ｒ２において、サイトを選択可能なセレクトボックスＲ２２が表示されており、サイトを選択された場合、選択されたサイトがリーチしているクエリ群のクエリ形態素が表示される。

　選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第１の例について図８を用いて説明する。図８は、選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第１の例を示すフローチャートである。

　（ステップＳ３１０）端末１のプロセッサ１６は、例えば、図５の画面Ｇ２の設定領域Ｒ２におけるセレクトボックスＲ２２で選択された、選択ページを受け付ける。

　（ステップＳ３２０）端末１のプロセッサ１６は、受け付けた選択ページを識別する選択ページ識別情報をコンピュータシステム２へ送信する。

　（ステップＳ３３０）取得手段２６８は、標的クエリによる検索結果に含まれる複数のサイト（もしくはページ）からユーザが選択した選択サイトを取得する。ここで当該複数のサイトは例えば上位サイトである。上位サイトは予め決められた順位範囲のサイト（例えば１位～３位のサイト）であってもよいし、ユーザによって指定された範囲のサイトであってもよい。
　処理手段２６４は、複数の前記クエリ形態素を、前記取得された選択サイトに含まれるクエリ形態素でフィルタするか、前記取得された選択サイトに含まれるクエリ形態素の数でソートする。

　（ステップＳ３４０）出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。

　（ステップＳ３５０）端末１は、処理後画面データを受信し、この処理後画面データを用いて処理後画面を表示する。

　選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第２の例について図９を用いて説明する。図９は、選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第２の例を示すフローチャートである。ステップＳ４１０、Ｓ４２０、Ｓ４４０、Ｓ４５０は、図８の対応するステップＳ３１０、Ｓ３２０、Ｓ３４０、Ｓ３５０と同様であるので、その説明を省略する。
　（ステップＳ４３０）取得手段２６８は、標的クエリによる検索結果に含まれる複数のサイト（もしくはページ）からユーザが選択した選択サイトを取得する。
　処理手段２６４は、前記取得された選択サイトに含まれるクエリ形態素の数で前記複数のページをランキングした場合の順位でフィルタまたはソートする。

　図５の画面Ｇ２における設定領域Ｒ２において、ページを選択可能なセレクトボックスＲ２３が表示されており、上位何ページまでを上位ページとして選択する選択可能なセレクトボックスＲ２３０が表示されている。更に昇順ボタンＲ２３１、降順ボタンＲ２３２が表示されている。
　セレクトボックスＲ２３でページが選択され且つセレクトボックスＲ２４で上位何ページまでかを選択された状態で、昇順ボタンＲ２３１が押された場合、例えば選択されたページと似たキャラの上位Ｍページ（図５の例ではＭは３）の含有量合計の昇順で複数のクエリ形態素がソートされて表示される。一方、セレクトボックスＲ２３でページが選択され且つセレクトボックスＲ２４で上位何ページまでかを選択された状態で、降順ボタンＲ２３２が押された場合、例えば選択されたページと似たキャラの上位Ｍページ（図５の例ではＭは３）の含有量合計の降順で複数のクエリ形態素がソートされて表示される。ここでキャラとは、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質である。

　選択されたページと検索ニーズが類似するページの統計量（例えば上位ページの含有量合計）を表示するための処理について図１０を用いて説明する。図１０は、選択されたページと検索ニーズが類似するページの統計量を表示するための処理の一例を示すフローチャートである。

　（ステップＳ５１０）端末１のプロセッサ１６は、例えば、図５の画面Ｇ２の設定領域Ｒ２におけるセレクトボックスＲ２３で選択された、選択ページを受け付ける。またセレクトボックスＲ２３０で選択された、上位ページに該当するページ数を受け付ける。

　（ステップＳ５２０）端末１のプロセッサ１６は、受け付けた選択ページを識別する選択ページ識別情報と上位ページに該当するページ数をコンピュータシステム２へ送信する。

　（ステップＳ５３０）取得手段２６８は、標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する。
　解析結果取得手段２７０は、前記複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する。

　（ステップＳ５４０）抽出手段２７１は、前記解析結果に基づいて、前記複数のページから、前記選択ページとの間で、検索ニーズの混在具合が類似している類似ページを抽出する。図５の例では抽出手段２７１は例えば、検索ニーズの混在具合が類似している上位Ｍページ（Ｍは、ユーザによって選択された上位ページに該当するページ数）を類似ページとして抽出する。

　（ステップＳ５５０）統計量決定手段２７２は、クエリ形態素毎に、前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて統計量（ここではその一例として含有量合計）を決定する。

　（ステップＳ５６０）処理手段２６４は、複数の前記クエリ形態素を、対応する前記決定された統計量でフィルタもしくはソートする。

　（ステップＳ５７０）出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。

　（ステップＳ５８０）端末１は、処理後画面データを受信し、この処理後画面データを用いて処理後画面を表示する。

　ここでは、取得手段２６８は、ユーザによって指定された順位をユーザ指定順位として取得する。統計量決定手段２７２は、クエリ形態素毎に、前記複数のページのうちから当該クエリ形態素が多い順に前記ユーザ指定順位まで選択された前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて前記統計量を決定する。

　図５の画面Ｇ２における設定領域Ｒ２において、上位何ページを上位ページとして選択する選択可能なセレクトボックスＲ２４が表示されており、ここではセレクトボックスＲ２４において上位「３ページ」が選択されている。これに伴い、上位「３ページ」が具体的に何位のページかを選択可能なセレクトボックスＲ２４１、セレクトボックスＲ２４２、セレクトボックスＲ２４３が表示されている。ここでは一例として「１位」、「２位」、「３位」が上位「３ページ」として選択されている。更に昇順ボタンＲ２４４、降順ボタンＲ２４５が表示されている。

　この状態で昇順ボタンＲ２４４が押された場合、例えば選択された「１位」、「２位」、「３位」のページにおけるクエリ形態素毎の含有量合計の昇順で複数のクエリ形態素がソートされて表示される。一方、この状態で降順ボタンＲ２４５が押された場合、例えば選択された「１位」、「２位」、「３位」のページにおけるクエリ形態素毎の含有量合計の降順で複数のクエリ形態素がソートされて表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　取得手段２６８は、ユーザによって選択された上位ページを取得する。
　処理手段２６４は、複数の前記クエリ形態素を、上位ページにおけるクエリ形態素毎の統計量（ここでは一例として含有量合計）でフィルタもしくはソートする。例えば昇順ボタンＲ２４４が押された場合、処理手段２６４は昇順にソートし、降順ボタンＲ２４５が押された場合、処理手段２６４は降順にソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　図５の画面Ｇ２における設定領域Ｒ２において、上位何ページを上位ページとして選択する選択可能なセレクトボックスＲ２５が表示されており、ここではセレクトボックスＲ２５において上位「３ページ」が選択されている。これに伴い、上位「３ページ」が具体的に何位のページかを選択可能なセレクトボックスＲ２５１、セレクトボックスＲ２５２、セレクトボックスＲ２５３が表示されている。ここでは一例として「１位」、「２位」、「３位」が上位「３ページ」として選択されている。
　更に図５の画面Ｇ２における設定領域Ｒ２において、下位何ページまでを上位ページとして選択する選択可能なセレクトボックスＲ２６が表示されており、ここではセレクトボックスＲ２６において下位「３ページ」が選択されている。これに伴い、下位「３ページ」が具体的に何位のページかを選択可能なセレクトボックスＲ２６１、セレクトボックスＲ２６２、セレクトボックスＲ２６３が表示されている。ここでは一例として「８位」、「９位」、「１０位」が下位「３ページ」として選択されている。更に昇順ボタンＲ２５４、降順ボタンＲ２５５が表示されている。

　この状態で昇順ボタンＲ２５４が押された場合、選択された「１位」、「２位」、「３位」のページにおけるクエリ形態素の含有量合計と、選択された「８位」、「９位」、「１０位」のページにおける対応するクエリ形態素の含有量合計の差が、当該クエリ形態素それぞれ毎に決定される。そして、この含有量合計の差の昇順で複数のクエリ形態素がソートされて表示される。一方、この状態で降順ボタンＲ２５５が押された場合、この含有量合計の差の降順で複数のクエリ形態素がソートされて表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　取得手段２６８は、ユーザによって選択された上位ページ及び下位ページを取得する。
　処理手段２６４は、複数の前記クエリ形態素を、当該クエリ形態素それぞれ毎に決定される上位ページにおけるクエリ形態素の統計量と下位ページにおけるクエリ形態素の統計量に基づく値（ここでは一例として差分値）でフィルタもしくはソートする。例えば昇順ボタンＲ２５４が押された場合、処理手段２６４は昇順にソートし、降順ボタンＲ２５５が押された場合、処理手段２６４は降順にソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　＜経済規模によるフィルタまたはソート＞
　図５の画面Ｇ２における設定領域Ｒ２において、経済規模に対応する昇順ボタンＲ２７１、降順ボタンＲ２７２が表示されている。クエリ形態素（例えば、「auto」、「free」、「soft」など）毎に、標的クエリ（ここでは一例として「cad」）と当該クエリ形態素を含む検索クエリの経済規模が算出可能である。ここで経済規模は例えば特許文献２に記載の経済規模である。
　昇順ボタンＲ２７１が押された場合、標的クエリとクエリ形態素を含む検索クエリの経済規模の昇順で複数のクエリ形態素がソートされて表示される。一方、降順ボタンＲ２７２が押された場合、標的クエリとクエリ形態素を含む検索クエリの経済規模の降順で複数のクエリ形態素がソートされて表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　取得手段２６８は、経済規模によるフィルタもしくはソートの要求を取得する。
　経済規模決定手段２６７は例えば、標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる複数の検索クエリの検索数それぞれと、対応するクリック単価及び／または競合性を用いて、当該検索クエリに対する経済規模を、クエリ形態素毎に決定する。
　処理手段２６４は、複数の前記クエリ形態素を、経済規模でフィルタもしくはソートする。その際、例えば昇順ボタンＲ２７１が押された場合、処理手段２６４は昇順にソートし、降順ボタンＲ２７２が押された場合、処理手段２６４は降順にソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　＜検索数によるフィルタまたはソート＞
　また図５の画面Ｇ２における設定領域Ｒ２において、検索数に対応する昇順ボタンＲ２８１、降順ボタンＲ２８２が表示されている。昇順ボタンＲ２８１が押された場合、標的クエリとクエリ形態素を含む検索クエリの過去の所定期間の検索数の昇順で複数のクエリ形態素がソートされて表示される。一方、降順ボタンＲ２８２が押された場合、標的クエリとクエリ形態素を含む検索クエリの過去の所定期間の検索数の降順で複数のクエリ形態素がソートされて表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　取得手段２６８は、検索数によるフィルタもしくはソートの要求を取得する。
　検索数計数手段２６６は、標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる検索数を、クエリ形態素毎に計数する。
　処理手段２６４は、複数の前記クエリ形態素を、対応する前記計数された検索数でフィルタもしくはソートする。その際、例えば昇順ボタンＲ２８１が押された場合、処理手段２６４は昇順にソートし、降順ボタンＲ２８２が押された場合、処理手段２６４は降順にソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　＜クエリ種類数によるフィルタまたはソート＞
　また図５の画面Ｇ２における設定領域Ｒ２において、クエリ種類数に対応する昇順ボタンＲ２９１、降順ボタンＲ２９２が表示されている。昇順ボタンＲ２９１が押された場合、標的クエリとクエリ形態素を含む検索クエリの種類数の昇順で複数のクエリ形態素がソートされて表示される。ここで検索クエリの種類数は、例えば過去の所定期間で検索実行された検索クエリの種類の数である。一方、降順ボタンＲ２９２が押された場合、標的クエリとクエリ形態素を含む検索クエリの種類数の降順で複数のクエリ形態素がソートされて表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　取得手段２６８は、検索クエリの種類数によるフィルタもしくはソートの要求を取得する。
　種類数計数手段２６５は、標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる検索クエリの種類数を、クエリ形態素毎に計数する。
　処理手段２６４は、複数の前記クエリ形態素を、対応する前記計数された検索クエリの種類数でフィルタもしくはソートする。その際、例えば昇順ボタンＲ２９１が押された場合、処理手段２６４は昇順にソートし、降順ボタンＲ２９２が押された場合、処理手段２６４は降順にソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　＜業界特有度によるフィルタまたはソート＞
　また図５の画面Ｇ２における設定領域Ｒ２において、業界特有度に対応する昇順ボタンＲ３０１、降順ボタンＲ３０２が表示されている。昇順ボタンＲ３０１が押された場合、業界特有度の昇順で複数のクエリ形態素がソートされて表示される。一方、降順ボタンＲ３０２が押された場合、業界特有度の降順で複数のクエリ形態素がソートされて表示される。

　ここで業界特有度は、標的クエリを構成する形態素であるコア形態素（例えば「cad」）とクエリ形態素の両方が含まれる検索クエリの上位ページでどの程度特徴的に対象形態素が使用されているかを表す指標であり、例えばコア形態素（例えば「cad」）とクエリ形態素の両方が含まれる検索クエリによる検索結果の上位ページ群で登場頻度が高いほど高く且つコア形態素（例えば「cad」）と他のクエリ形態素の両方が含まれる他の検索クエリ群の検索結果の上位ページ群で頻度が低いほど高くなるように設定されたパラメータである。この業界特有度は、一例として特許文献４（特許第６２５３０４１号公報）の特有度であってもよく、具体的には例えば当該形態素の業界用語としての特有度を所定の評価関数に基づき算定されたものであってもよいが、これに限らない。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　取得手段２６８は、検索クエリの種類数によるフィルタもしくはソートの要求を取得する。
　特有度決定手段２７４は、業界特有度を所定の評価関数に基づき、クエリ形態素毎に決定する。
　処理手段２６４は、複数の前記クエリ形態素を、対応する前記決定された業界特有度でフィルタもしくはソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　＜セグメントによるフィルタまたはソート＞
　また図５の画面Ｇ２における設定領域Ｒ２において、セグメントの例として、ブランド、エリア、エコノミカル、オピニオン、サービス、その他が示されており、ブランドを選択可能なチェックボックスＲ３１、エリアを選択可能なチェックボックスＲ３２、エコノミカルを選択可能なチェックボックスＲ３３、オピニオンを選択可能なチェックボックスＲ３４、サービスを選択可能なチェックボックスＲ３５、その他を選択可能なチェックボックスＲ３６が示されている。これにより、選択されたセグメントに含まれるクエリ形態素が表示される。ここでは一例として、全てのチェックボックスが選択されているので、全てのセグメントのクエリ形態素が表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　分類手段２６３は、クエリ形態素それぞれを、当該クエリ形態素に基づいて、複数のセグメントのいずれかに分類する。
　取得手段２６８は、ユーザが指定するセグメントを取得する。
　処理手段２６４は、複数の前記クエリ形態素をユーザが指定するセグメントでフィルタもしくはソートする。
　出力手段２６２は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末１へ送信する。これにより、端末１で処理後画面が表示される。

　以上、本実施形態に係る情報処理システムＳは、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段２６１と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段２６２と、を備える。

　これにより、ページのソースの一部または全部に含まれるクエリ形態素の数または割合をユーザが把握することにより、当該ページにおいて、足りていないクエリ形態素の把握を容易化することができ、ページにおけるクエリ形態素の選定作業の効率を向上させることができる。

　＜実施例２＞
　続いて実施例２において、端末１に表示されるクエリ形態素集計画面について図１１及び図１２を用いて説明する。図１１は、標的クエリによって評価されるページが説明タイプの場合のクエリ形態素集計画面の一例である。図１２は、標的クエリによって評価されるページが一覧タイプの場合のクエリ形態素集計画面の一例である。ここで説明タイプは、当該標的クエリを構成する形態素であるコア形態素を説明するカテゴリであり、一覧タイプは、当該標的クエリを構成する形態素であるコア形態素に該当するものを一覧表示するカテゴリである。ページのカテゴリには、説明タイプ、一覧タイプが含まれる。

　図１１の画面Ｇ３において、テキストボックスＲ４１には、標的クエリの一例としてユーザによって入力された「掃除機　機能」が示されている。この「機能」というクエリ形態素を含む検索クエリの場合、検索クエリに含まれる形態素（ここでは「掃除機」）の「機能」を説明するページが検索結果として抽出されるから、この「機能」というクエリ形態素を含む検索クエリは「説明タイプ」である。よって、テキストボックスＲ４１に「掃除機　機能」と入力された場合、ラベルＲ４２として「説明タイプ」とカテゴリが表示される。

　一方、図１２の画面Ｇ４において、テキストボックスＲ４３は、標的クエリの一例としてユーザによって入力された「掃除機　比較」が示されている。この「比較」というクエリ形態素を含む検索クエリの場合、検索クエリに含まれる形態素（ここでは「掃除機」）を「比較」して一覧表示するページが検索結果として抽出されるから、この「比較」というクエリ形態素を含む検索クエリは「一覧タイプ」である。テキストボックスＲ４３に「掃除機　比較」と入力された場合、ラベルＲ４４として「一覧タイプ」とカテゴリが表示される。

　この表示を実現するために、コンピュータシステム２において例えば以下の処理が実行される。
　判定手段２７３は、標的クエリ（例えば、「掃除機　比較」）による検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定してもよい。ここで例えば、サイト骨格タグのうちaタグとhタグに着目した場合、説明タイプのページであれば、多くの場合、それぞれのサブニーズについてhタグで骨格を作る傾向がある。一方、一覧タイプのページのうち例えば商品一覧などのページであれば、各商品がサブニーズだとするとそれぞれの商品詳細ページへのリンク文字としてaタグ内で使われる頻度が高い傾向にある。このような傾向であれば、標的クエリ群がhタグに偏って使用されているページでは説明タイプ、aタグに偏って使用されているページでは一覧タイプと判断することも可能である。上記は一例であり、機械学習技術により、検索結果上位ページ内での標的クエリの使われ方の傾向とページタイプとの関連を学習させた判別器などによってページタイプを判定しても良い。このように、標的クエリによる検索結果に含まれるページのソース中にサイト骨格タグとして第1の種類のタグ（例えばaタグ）と第２の種類のタグ（例えばhタグ）が含まれる場合において、判定手段２７３は、標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のタグ（例えばaタグ）の数と第2の種類のタグ（例えばhタグ）の数の比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定してもよい。その際例えば、判定手段２７３は、aタグの数とhタグの数の割合で、aタグの割合の方が大きければ当該カテゴリを一覧タイプと判定し、ｈタグの割合の方が大きければ当該カテゴリを説明タイプと判定してもよい。出力手段２６２は、前記判定されたカテゴリを表示するための情報を出力し、この情報を端末１に送信する。端末１は、この情報を表示することにより、図１１または図１２のように、カテゴリ（例えば、「説明タイプ」または「一覧タイプ」）が表示される。

　以上、本実施形態に係る情報処理システムＳは、標的クエリによる検索結果に含まれるページのソース中に含まれるクエリ形態素の数と、当該ソース中の複数のサイト骨格タグに挟まれた複数の文字列中に含まれるクエリ形態素の数との比較に基づいて、当該検索クエリによって評価されるページのカテゴリを判定する判定手段２７３と、前記判定されたカテゴリを表示するための情報を出力する出力手段２６２と、を備える。

　この構成により、標的クエリによる検索結果に含まれるページがどのようなカテゴリに属するページであるのかを把握することができる。

　なお、上述した実施形態で説明したコンピュータシステム２のプロセッサ２６で実行された一部または全部の手段が、端末１のプロセッサ１６で実行されてもよい。上述した実施形態で説明したコンピュータシステム２の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、コンピュータシステム２の少なくとも一部の機能を実現するプログラムをコンピュータ読み取り可能な記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。

　また、コンピュータシステム２の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線（無線通信も含む）を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。

　さらに、一つまたは複数の情報機器によってコンピュータシステム２を機能させてもよい。複数の情報機器を用いる場合、そのうちの１つをコンピュータとし、当該コンピュータが所定のプログラムを実行することによりコンピュータシステム２の少なくとも１つの手段として機能が実現されてもよい。

　また、方法の発明においては、全ての工程（ステップ）をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。

　以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

１　端末
１１　入力インタフェース
１２　通信モジュール
１３　ストレージ
１４　メモリ
１５　出力インタフェース
１６　プロセッサ
１７　ディスプレイ
２　コンピュータシステム
２１　入力インタフェース
２２　通信モジュール
２３　ストレージ
２４　メモリ
２５　出力インタフェース
２６　プロセッサ
２６１　計数手段
２６２　出力手段
２６３　分類手段
２６４　処理手段
２６５　種類数計数手段
２６６　検索数計数手段
２６７　経済規模決定手段
２６８　取得手段
２６９　類似度決定手段
２７０　解析結果取得手段
２７１　抽出手段
２７２　統計量決定手段
２７３　判定手段
２７４　特有度決定手段
３　検索エンジンサーバ

Claims

　標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段と、
　前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段と、
　を備え、
　前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリの形態素のうち、標的クエリの形態素を除いたものである
　情報処理システム。
　前記複数のページのソースの一部に含まれるクエリ形態素は、当該ソース中の複数のサイト骨格タグに関連付けられて記載された複数の文字列であり、
　前記計数手段は、前記ソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、
　前記出力手段は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力し、
　前記サイト骨格タグはサイト内容の骨格となる言葉が使用されるタグまたは属性の総称である
　請求項１に記載の情報処理システム。
　前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、
　前記出力手段は、前記計数されたクエリ形態素の数または割合を比較可能に表示するための情報を出力する
　請求項２に記載の情報処理システム。
　前記計数手段は、前記クエリ形態素の数または割合を、サイト骨格タグの種類毎に計数し、
　前記出力手段は、前記サイト骨格タグの種類毎に前記クエリ形態素の数または割合を表示するための情報を出力する
　請求項２に記載の情報処理システム。
　前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中に含まれるクエリ形態素の数または割合、サイト骨格タグの種類毎に計数し、
　前記出力手段は、前記クエリ形態素の数または割合を前記サイト骨格タグの種類毎に比較可能に表示するための情報を出力する
　請求項４に記載の情報処理システム。
　前記計数手段は、標的クエリの検索ヒットページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、
　前記出力手段は、前記計数されたクエリ形態素の数または割合を、クエリ形態素毎に表示するための情報を出力する
　請求項１に記載の情報処理システム。
　前記計数手段は、標的クエリの検索ヒットページそれぞれについて、当該ページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、
　前記出力手段は、前記計数されたクエリ形態素の数または割合を複数のページの間でクエリ形態素の種類毎に比較可能に表示するための情報を出力する
　請求項６に記載の情報処理システム。
　クエリ形態素それぞれを、当該クエリ形態素に基づいて、複数のセグメントのいずれかに分類する分類手段と、
　ユーザが指定するセグメントを取得する取得手段と、
　複数の前記クエリ形態素をユーザが指定するセグメントでフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　前記標的クエリの形態素とクエリ形態素の両方が含まれる検索クエリの種類数を、クエリ形態素毎に計数する種類数計数手段と、
　複数の前記クエリ形態素を、対応する前記計数された検索クエリの種類数でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　前記標的クエリの形態素とクエリ形態素の両方が含まれる検索数を、クエリ形態素毎に計数する検索数計数手段と、
　複数の前記クエリ形態素を、対応する前記計数された検索数でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　前記標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる複数の検索クエリの検索数それぞれと、対応するクリック単価及び／または競合性を用いて、当該検索クエリに対する経済規模を、クエリ形態素毎に決定する経済規模決定手段と、
　複数の前記クエリ形態素を、対応する前記計数された経済規模でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　ユーザが指定したクエリ形態素もしくは当該クエリ形態素を含む検索クエリを取得する取得手段と、
　標的クエリによる検索結果に含まれる複数のページそれぞれについて、当該ページのソースに含まれる前記取得されたクエリ形態素の数で前記複数のページをランキングした結果と、複数の前記クエリ形態素のうち当該取得されたクエリ形態素以外の別クエリ形態素の数で前記複数のページをランキングした結果との類似度を、当該別クエリ形態素毎に決定する類似度決定手段と、
　複数の前記クエリ形態素を、対応する前記決定された類似度でフィルタもしくはソートする処理手段を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する取得手段と、
　複数の前記クエリ形態素を、前記取得された選択ページに含まれるクエリ形態素でフィルタするか、前記取得された選択ページに含まれるクエリ形態素の数でソートするか、または前記取得された選択ページに含まれるクエリ形態素の数で前記複数のページをランキングした場合の順位でフィルタまたはソートする処理手段と、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する取得手段と、
　前記複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する解析結果取得手段と、
　前記解析結果に基づいて、前記複数のページから、前記選択ページとの間で、検索ニーズの混在具合が類似している類似ページを抽出する抽出手段と、
　クエリ形態素毎に、前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて統計量を決定する統計量決定手段と、
　複数の前記クエリ形態素を、対応する前記決定された統計量でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　前記取得手段は、ユーザによって指定された順位をユーザ指定順位として取得し、
　前記統計量決定手段は、クエリ形態素毎に、前記複数のページのうちから当該クエリ形態素が多い順に前記ユーザ指定順位まで選択された前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて前記統計量を決定する
　請求項１４に記載の情報処理システム。
　ユーザによって選択された上位ページを取得する取得手段と、
　複数の前記クエリ形態素を、前記上位ページにおけるクエリ形態素毎の統計量でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　ユーザによって選択された上位ページ及び下位ページを取得する取得手段と、
　複数の前記クエリ形態素を、当該クエリ形態素それぞれ毎に決定される上位ページにおけるクエリ形態素の統計量と下位ページにおけるクエリ形態素の統計量に基づく値でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　経済規模によるフィルタもしくはソートの要求を取得する取得手段と、
　複数の前記クエリ形態素を、前記経済規模でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　コア形態素とクエリ形態素の両方が含まれる検索クエリの上位ページでどの程度特徴的に対象形態素が使用されているかを表す指標である業界特有度によるフィルタもしくはソートの要求を取得する取得手段と、
　複数の前記クエリ形態素を、前記業界特有度でフィルタもしくはソートする処理手段と、
　を備え、
　前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
　請求項６または７に記載の情報処理システム。
　標的クエリによる検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手段と、
　前記判定されたカテゴリを表示するための情報を出力する出力手段と、
　を備える情報処理システム。
　前記ページのカテゴリには、当該標的クエリを構成する形態素であるコア形態素を説明する説明タイプ、当該標的クエリを構成する形態素であるコア形態素に該当するものを一覧表示する一覧タイプが含まれる
　請求項２０に記載の情報処理システム。
　標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順と、
　前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順と、
　を有し、
　前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものである情報処理方法。
　標的クエリによる検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順と、
　前記判定されたカテゴリを表示するための情報を出力する出力手順と、
　を有する情報処理方法。
　コンピュータに、
　標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順、
　前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順、
　を実行させるためのプログラムであって、
　前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものであるプログラム。
　コンピュータに、
　標的クエリによる検索結果に含まれるページのソース中に含まれる第１の種類のサイト骨格タグの数と第２の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順、
　前記判定されたカテゴリを表示するための情報を出力する出力手順、
　を実行させるためのプログラム。