JP5041802B2 - クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法 - Google Patents

クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法 Download PDF

Info

Publication number
JP5041802B2
JP5041802B2 JP2006350301A JP2006350301A JP5041802B2 JP 5041802 B2 JP5041802 B2 JP 5041802B2 JP 2006350301 A JP2006350301 A JP 2006350301A JP 2006350301 A JP2006350301 A JP 2006350301A JP 5041802 B2 JP5041802 B2 JP 5041802B2
Authority
JP
Japan
Prior art keywords
query
words
search
queries
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006350301A
Other languages
English (en)
Other versions
JP2008158998A (ja
JP2008158998A5 (ja
Inventor
学 颯々野
光晴 牧田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2006350301A priority Critical patent/JP5041802B2/ja
Publication of JP2008158998A publication Critical patent/JP2008158998A/ja
Publication of JP2008158998A5 publication Critical patent/JP2008158998A5/ja
Application granted granted Critical
Publication of JP5041802B2 publication Critical patent/JP5041802B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法に関する。
従来より、語句又は文章データと、データベースとを照合し、語句又は文章分析を行う方法、サーバが知られている(例えば、特許文献1)。当該検索方法、サーバは、検索処理部と、類義語検索処理部と、データベースとで構成されている。当該検索方法、サーバは、通信回線から受信した語句又は文章データに含まれる語句と、当該語句の類義語との双方でデータベースを照合し、はじめに受信した語句または文章データとデータベースに含まれる意味説明に関係がない可能性を低くする。
特開2005−222188号公報
しかしながら、上述した特許文献1では、サーバは、通信回線から受信した語句又は文章データに含まれる語句から当該語句の類義語を、既定のデータベースから検索するため、当該語句がデータベースに含まれていない語句の場合は、検索することができない。
また、特許文献1では、サーバは、通信回線から受信した語句又は文章データに含まれる語句と、既定のデータベースとを語句のマッチングのみで照合している。当該受信した語句又は文章データに含まれるクエリのデータを活用したり、語句の検索件数や、二語以上のクエリデータを使用して同時に検索する場合の検索件数といった情報は、マッチングにおいて活用していない。
本発明は、通信回線から受信した語句又は文章データに含まれるクエリを活用して、当該語句又は文章を分析するクエリ分析サーバ、評価観点語データベース及び語句データベース生成方法を提供することを目的とする。
本発明者らは、通信回線から受信した語句又は文章データに含まれるクエリを活用して、当該語句又は文章を分析するクエリ分析サーバ、評価観点語データベース及び語句データベース生成方法を見出し、本発明を完成するに至った。
) 検索サーバと通信可能に接続されたクエリ分析サーバであって、
当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するクエリ受信部と、
前記クエリのうち評価の対象となる語句が記憶された評価対象語データベースと、
前記二語以上のクエリのうち一のクエリが、前記評価対象語データベースに記憶されているかを判断する評価対象語検索部と、
当該二語以上のクエリの検索件数を算出するクエリ算出部と、
前記クエリ受信部が受信した二語以上のクエリと、前記クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部と、
前記二語以上のクエリのうち前記評価対象語データベースに記憶された語句が一致した場合で、かつ、前記クエリ記憶部に記憶された前記二語以上のクエリの検索件数を参照して、当該検索件数が所定以上の場合には、前記二語以上のクエリのうち、前記評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断するクエリ判断部とを備えるクエリ分析サーバ。
)の構成は、クエリ分析サーバが、検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、検索サーバから受信し、クエリのうち評価の対象となる語句を評価対象語データベースに記憶し、二語以上のクエリのうち一のクエリが、評価対象語データベースに記憶されているかを判断し、当該二語以上のクエリの検索件数を算出し、クエリ受信部が受信した二語以上のクエリと、クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶し、二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合で、かつ、クエリ記憶部に記憶された二語以上のクエリの検索件数を参照し、当該検索件数が所定以上の場合には、二語以上のクエリのうち、評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断することができる。
よって、クエリ分析サーバは、受信した二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合で、かつ、クエリ記憶部に記憶された二語以上のクエリの検索件数を参照し、当該検索件数が所定以上の場合には、二語以上のクエリのうち、評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断することが可能である。
) ()に記載のクエリ分析サーバのクエリ判断部が判断した評価観点語が記憶された評価観点語データベース。
)の構成は、クエリ分析サーバが、判断した、評価観点語が記憶された、評価観点語データベースを、提供することができる。
) 検索サーバと通信可能に接続された語句データベースの生成方法であって、
クエリのうち評価の対象となる語句を記憶するステップと、
当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するステップと、
前記二語以上のクエリのうち一のクエリが、所定のデータベースに記憶されているかを判断するステップと、
当該二語以上のクエリの検索件数を算出するステップと、
前記受信した二語以上のクエリと、前記算出されたクエリの検索件数とを関係づけて記憶するステップと、
前記二語以上のクエリのうち所定のデータベースに記憶された語句が一致した場合には、前記二語以上のクエリの検索件数を参照するステップと、
当該参照した検索件数が所定以上の場合には、前記二語以上のクエリのうち、前記所定の対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するステップと、を備える語句データベース生成方法。
)の方法は、検索サーバと通信可能に接続された語句データベースの生成方法であって、クエリのうち評価の対象となる語句を記憶し、当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、検索サーバから受信し、二語以上のクエリのうち一のクエリが、評価対象語データベースに記憶されているかを判断し、当該二語以上のクエリの検索件数を算出し、受信した二語以上のクエリと、算出されたクエリの検索件数とを関係づけて記憶し、二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合には、二語以上のクエリの検索件数を参照し、当該参照した検索件数が所定以上の場合には、二語以上のクエリのうち、所定の対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶して、語句データベースを生成することができる。
よって、データベースは、受信した二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合には、二語以上のクエリの検索件数を参照し、当該参照した検索件数が所定以上の場合には、当該他のクエリを評価観点語として記憶して、語句データベースを生成することが可能である。したがって、例えば、データベースは、評価対象語データベースに、語句「WWWモバイル」が記憶されており、二語のクエリ「WWWモバイル」と「小型キーボード」の検索件数が600件であり、二語のクエリ「WWWモバイル」と「小型キーボード」の検索件数が20件である場合に、語句「小型キーボード」を、評価観点語として記憶して、語句データベースを生成することが可能である。
本発明によれば、クエリ分析サーバは、外部から受信した語句、文章を含む関連クエリを、記憶されたクエリと当該クエリの検索件数に基づいて、語句又は文章の構造を、判断することが可能である。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、又実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本発明の実施形態に係るクエリ分析システム1の構成の一例を示す。すなわち、クエリ分析システム1は、一以上のユーザ端末50と、検索サーバ200と、クエリ分析サーバ100とが互いに通信回線ネットワーク30により通信可能に接続されている。通信回線ネットワーク30は、インターネットであってよいし、LAN(Local Area Network)、専用回線もしくはこれらの組み合わせにより構成されるネットワークである。
ユーザ端末50は、検索サーバ200に対して検索要求を行う情報処理装置である。ユーザ端末50は、このユーザ端末50が処理する情報、データを制御する制御部と、通信回線ネットワーク30と接続されて通信を実現する通信部と、このユーザ端末50が処理する情報、データを記録する記憶部と、このユーザ端末50が処理する情報、データを表示する表示部と、このユーザ端末50の入力を受け付ける入力部とから構成される。なお、ユーザ端末50は、コンピュータであってよいし、携帯電話等の携帯情報端末であってもよい。
制御部は、ユーザ端末50を制御する中央処理演算装置であり、CPU(Central Processing Unit)であってよい(図11にて後述する)。ユーザ端末50は、記憶部に記録されたプログラムを読み出すことで、Webブラウザを実現する。Webブラウザは、ユーザ端末50を操作するユーザが検索機能を利用するためのインターフェースを提供する機能であり、Webサーバ、検索サーバ200から送信されたWebページを受信して、これを所定の書式で表示し、この表示したページに対して、入力部から検索等の入力を受け付ける機能を備える。
検索サーバ200は、ユーザ端末50から受信した検索要求に応じて、検索処理を行う情報処理装置である。検索サーバ200は、この検索サーバ200が処理する情報、データを制御する制御部と、通信回線ネットワーク30と接続されて通信を実現する通信部と、この検索サーバ200が処理する情報、データを記録する記憶部と、この検索サーバ200が処理する情報、データを表示する表示部と、この検索サーバ200の入力を受け付ける入力部とから構成されてよい。なお、検索サーバ200は、コンピュータであってよいし、携帯電話等の携帯情報端末であってもよい。
検索サーバ200は、クエリ受付部210と検索処理部220を少なくとも備える。通常、ユーザ端末50からクエリ受付部210を介して、クエリが入力される。ここで、クエリとは、検索サーバ200に対して、Webページの情報(リンク情報)を求める(検索要求)を行う際に、このWebページの選択基準となるキーワードである。入力されたクエリは、クエリ受付部210から検索処理部220により、当該クエリに関連したWebページの検索が行われ、検索処理が行われる。
ここで、検索サーバ200は、クエリ受付部210にて受付けたクエリを、クエリ分析サーバ100に送信する(ステップS01)。
クエリ分析サーバ100は、検索サーバ200から受信したクエリに対して、クエリの記憶と、クエリに関連した語句又は文章(関連クエリ)の判断を行う情報処理装置である。クエリ分析サーバ100は、このクエリ分析サーバ100が処理する情報、データを制御する制御部と、検索サーバ200、或いは通信回線ネットワーク30と接続されて通信を実現する通信部と、このクエリ分析サーバ100が処理する情報、データを記録する記憶部と、このクエリ分析サーバ100が処理する情報、データを表示する表示部と、このクエリ分析サーバ100の入力を受け付ける入力部とから構成されてよい。なお、クエリ分析サーバ100は、コンピュータであってよいし、携帯電話等の携帯情報端末であってもよい。
クエリ分析サーバ100は、検索サーバ200から送信されるクエリを受信するクエリ受信部110と、受信したクエリの検索件数を算出するクエリ算出部115とを備え、クエリ及び検索件数を関係づけて記憶するクエリ記憶部150と、関連クエリを判断するクエリ判断部130とを備える。
最初に、クエリ受信部110は、検索サーバ200から、クエリを受信する(ステップS01)。次に、クエリ算出部が受信したクエリの検索件数を算出する。すなわち、当該クエリを1回受信するごとに、1ずつ検索件数をカウントアップすることで、クエリの検索件数を算出してもよい。例えば、「携帯電話」というクエリは、20回クエリを検索サーバ200から受信したので、検索件数は20件であるとしてよい。
また、検索件数の他の態様としては、検索サーバ200が検索結果として得た文章数(リンク数)が、検索件数であってもよい。この場合には、検索処理後の当該文章数を検索サーバ200又はクエリ分析サーバ100に記憶する。クエリ分析サーバ100は、記憶された文章数を(場合によっては、検索サーバ200から文章数を受信して)検索件数とする。
クエリ記憶部150は、制御部からの命令に応じて、クエリ算出部115が算出した検索件数と、当該クエリを関係づけて自らの記憶領域に記憶する(ステップS02)。
次に、クエリ判断部130は、クエリに関連した語句又は文章からなる関連クエリを受信したことに応じて、クエリ記憶部150に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断する(ステップS03)。ここで、関連クエリは、クエリ受付部210が受信した新たなクエリの語句を関連クエリとしてもよいし(図2参照)、外部から受信した文章を関連クエリとしてもよい(図5参照)。
図2は、本発明の実施形態に係るクエリ分析システム1aの構成の一例を示す。クエリ分析システム1aは、クエリ分析システム1における構成及び処理をさらに、具体的に示したシステムである。クエリ分析システム1aにおけるクエリ分析サーバ100aは、クエリ分割部120と、更新クエリ送信部140とを含む点が、クエリ分析システム1aと異なる。
クエリ分析システム1aは、一以上の語句が複合された語句で構成される関連クエリを分析する。例えば、関連クエリとは、熟語の複合語、カタカナの複合語、アルファベットの複合語等であってよい。すなわち、「遺伝子配列」という語句は、「遺伝子」という語句と「配列」という語句が合わさった複合語であり、本実施例の関連クエリに該当する。その他、「コンピュータインターフェース」や「JET式PRINTER」等が本実施例の関連クエリに該当する。すなわち、前者は「コンピュータ」、「インターフェース」の複合語であり、後者は「JET」、「式」、「PRINTER」の複合語であるからである。
クエリ分析サーバ100aのクエリ受信部110は、上述のクエリ分析サーバ100と同様に、クエリ受付部210よりクエリを受信し(ステップS10)、クエリ算出部115が、当該クエリの検索件数を算出し(ステップS11)、クエリ記憶部150が、制御部からの命令に応じて、クエリ算出部115が算出した検索件数と、当該クエリを関係づけて自らの記憶領域に記憶する(ステップS12)。ここで処理されるクエリは、複合語を構成するそれぞれの語句(例えば、上述の「コンピュータ」、「インターフェース」の各々)である。図4は、クエリ算出部115が算出した検索件数と、当該クエリを関係づけたテーブルを示す。
次に、検索サーバ200aは、クエリ受付部210が受付けた複合語である新たなクエリを、関連クエリとして、クエリ受信部110に送信する(ステップS13)。これを受信したクエリ受信部110は、関連クエリをクエリ分割部120に送信する(ステップS14)。
クエリ分割部120は、複合語である関連クエリを一文字ずつ分割し、関連クエリの文字順で、分割した関連クエリと分割位置とを関係づけた分割文字データを、分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブル(例えば、図3)を生成する。
図3は、クエリ分割部120に分割文字テーブルを示す。関連クエリ(例えば、「遺伝子配列」)を一文字ずつ分割(「遺」、「伝」、「子」、「配」、「列」)し、関連クエリの文字順(「遺」→「伝」→「子」→「配」→「列」)で、分割した関連クエリと分割位置(2、3行目の分割位置など)とを関係づけた分割文字データ(例えば、2行目で分割すると「遺」、「伝子配列」が一の分割文字データであり、3行目で分割すると「遺伝」、「子配列」が一の分割文字データである)を、分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブル(図3)を生成する。クエリ分割部120は、クエリ判断部に処理を移す(ステップS15)。
クエリ判断部130は、分割文字データの分割された各々の語句が、クエリ記憶部150にクエリとして記憶されているかを判断し、分割文字データの分割された各々の語句がクエリとして記憶されている場合には、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する。
ここで、クエリ判断部130は、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する際に、当該分割文字テーブルのうち、所定の分割文字データを抽出し、当該抽出した分割文字データにより、当該関連クエリの分割位置を特定することで、当該関連クエリの語句の構造を判断する。
例えば、関連クエリが「遺伝子配列」である場合を例とすると、クエリ判断部130は、分割文字データの分割された各々の語句(例えば、「遺伝子」、「配列」)が、クエリ記憶部150にクエリとして記憶されているか(例えば、「遺伝子」、「配列」がそれぞれ記憶されているか)を判断する。上述のように、「遺伝子」、「配列」という語句は、クエリ記憶部150が、検索件数とともに関係づけて記憶している。したがって、図3の4行目を分割位置とした「遺伝子」、「配列」の分割文字データは、分割された各々の語句がクエリとして記憶されている場合に該当する。
したがって、クエリ判断部130は、当該クエリと当該クエリの検索件数を参照する。例えば、関連クエリが「遺伝子配列」であるとすると、2行目に分割位置を設けた分割文字データ(「遺」、「伝子配列」)を抽出すると、当該分割文字データは、図4のテーブルによれば、「遺」が検索件数80件、「伝子配列」が15件である。これに対して、4行目に分割位置を設けた分割文字データ(「遺伝子」、「配列」)を抽出すると、当該分割文字データは、図4のテーブルによれば、「遺伝子」が検索件数6000件、「配列」が47000件である。よって、前者の検索件数の和は、95件であるのに対して、後者の検索件数の和は、53000件である。
これにより、クエリ判断部130は、「遺伝子配列」の語句は、「遺」、「伝子配列」よりも、検索件数の和が多い語句であることから「遺伝子」、「配列」の複合語ではないかと判断する。クエリ判断部130は、このように分割文字テーブルの全ての分割文字データに対して、本処理を実行することで、関連クエリである「遺伝子配列」の分割位置を特定することで、語句の構造を判断する。
なお、クエリ判断部130が、上記処理を実行する際に、クエリが一語(例えば、「列」等)の場合は、検索件数が多すぎてしまい、クエリ判断部130の関連クエリの語句の構造を判断する際に、妥当ではない場合がある。この場合には、クエリ判断部130は、クエリが一語の場合を除外して、判断してもよい。
さらに、クエリ判断部130が、上記処理を実行する際に、例えば、「遺伝」、「子配列」の分割文字データは、「遺伝」という語句を含むため、検索件数が、「遺伝子」、「配列」よりも多くなってしまう場合がある。この場合は、検索件数が多い分割文字データのみを列挙して、管理者等からの関連クエリの分割位置を判断させるために、選択を受け付ける態様であってもよい。
次に、クエリ判断部130は、更新クエリ送信部140に処理を移す(ステップS16)。更新クエリ送信部140は、クエリ判断部130が、関連クエリの分割位置を特定したことに応じて、分割位置から分割された二以上の語句に対して、検索式を付加して検索サーバ200aの検索処理部220に送信する(ステップS17)。
ここで、検索式とは、2語以上の語句に対して検索処理を行うための(AND、OR、NOT)等の論理式である。すなわち、クエリ判断部130が分割位置を特定した2語以上のクエリに対して、上記の検索式を付加する。例えば、検索式は、単に分割位置を特定したクエリに対して、「AND」の検索式を付与するのみであってよい。
この場合に、更新クエリ送信部140が送信した、検索式が付加された2語以上のクエリを、検索サーバ200aが受信して(ステップS17)、検索処理部220が検索処理を行う。検索サーバ200aは、当該検索処理の結果を、最初に関連クエリ(分割が特定された元の関連クエリ)を入力した、ユーザ端末50に送信してもよい。
図5は、本発明の実施形態に係るクエリ分析システム1bの構成の一例を示す。クエリ分析システム1bは、クエリ分析システム1における構成及び処理をさらに、具体的に示したシステムである。なお、図示しないが、クエリ分析サーバ100bは、クエリ分析サーバ100と同様に、検索サーバ200bから送信されるクエリを受信し、受信したクエリの検索件数を算出し、クエリ及び検索件数を関係づけて記憶する。
検索サーバ200bは、ユーザ端末50からクエリの受信を受付けるクエリ受付部210と、受付けたクエリのログを記憶するクエリログ記憶部240(ステップS20)と、クエリログ記憶部240に記憶されたクエリをクエリ分析サーバ100bに送信する(ステップS21、S22)クエリログ送信部230と、を備える。ここで、クエリログとは、ユーザ端末50から入力されたクエリの履歴や、当該クエリとユーザ端末50のユーザ情報が関係づけられたデータであってよく、クエリの履歴は、当該クエリと同時に検索要求された語句(クエリ)に関する情報を含んでいてよい。
検索サーバ200bは、クエリログをクエリ分析サーバ100bに送信する(ステップS22)。クエリ分析サーバ100bは、クエリログを受信し、併用語検出部180が、クエリログから併用語を検出する。
併用語検出部180は、クエリログから、一のユーザ端末50から同時に複数のクエリを使用して検索要求のあった入力キーワードを抽出し、この入力キーワードのうち、入力されたクエリの1語目、2語目、3語目・・・を抽出する。図6は、入力キーワードと入力されたクエリの1語目、2語目、3語目・・・の関係を例示した図である。入力キーワードとして、1語目に「AAA携帯電話」、2語目に「カナ漢字変換」、3語目に「音楽再生」が入力された場合、及び、他のユーザ端末50から、1語目に「YYYモバイル」、2語目に「小型キーボード」が入力された場合を示す。
併用語検出部180は、併用語算出部185に処理を移す(ステップS23)。ここで、クエリ分析サーバ100bの併用語算出部185は、クエリ分析サーバ100と同様に、クエリごとの検索件数を算出するとともに、一のユーザ端末50から同時に併用して入力された複数のクエリ(併用語)の検索件数も算出し、併用語記憶部190が、算出したこれらの検索件数を記憶する(ステップS24)。
図7は、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)及び、キーワードと併用語とが同時に検索要求があった検索件数を示すテーブル図である。例えば、クエリとして、「YYY携帯電話」と「カナ漢字変換」とが同時にクエリとして併用された場合に、この両者が同時に検索された検索件数が1000件であることを示す。すなわち、クエリ分析サーバ100bは、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)との検索件数を図7のテーブルのように、記憶しておく。
ここで、検索要求のあったクエリのうち、どの語句が図7のキーワードであり、併用語であるとするかは、所定の辞書を参照して、辞書に登録されている語句であれば、キーワードとして判断して、その他のクエリを併用語とする態様であってよい。
次に、クエリ分析サーバ100bの文章受信部160は、ユーザ端末50等の外部の情報通信端末から、関連クエリとして所定の文章の入力を受信し(ステップS25)、係り受け判断部170に処理を移す(ステップS26)。ここで、所定の文章とは、係り受けを一以上含む文章である。さらに、係り受けとは、語句(又は文節)と語句(又は文節)との関係を示すために文章中に使われる記載である。係り受け判断部170は、併用語記憶部190に記憶されたクエリと当該クエリの検索件数に応じて、関連クエリの文章の係り受けを判断する(ステップS27)。
図8は、クエリ分析サーバ100bに入力された文章の一例を示す。このように係り受けを有する文章のうち、「YYY携帯電話」、「カナ漢字変換」、「音楽再生」、「WWWモバイル」、「小型キーボード」という語句が、どのような関係であるかを判断したいとする。すなわち、「カナ漢字変換」は、「YYY携帯電話」に関係するのか、「WWWモバイル」に関係するのかといった関係を判断する。
そこで、図7のテーブルに基づけば、「YYY携帯電話」は、「カナ漢字変換」と同時に検索要求されている件数が、1000件であるのにかかわらず、「WWWモバイル」は、「カナ漢字変換」と同時に検索要求されている件数が、50件である。したがって、クエリ分析サーバ100bの係り受け判断部170は、「YYY携帯電話」は、「カナ漢字変換」と関係があると判断することが可能である。
[評価観点語データベース]
次に、図9に基づいて、評価観点語データベース195について説明する。最初に、クエリ分析サーバ100cは、検索サーバ200等の外部から送信された二語以上のクエリを、クエリ受信部110にて受信する(ステップS30)。そして、クエリ分析サーバ100cは、対象語検索部172に処理を移し、対象語検索部172は、二語以上のクエリが、評価対象語データベース175に記憶されているかを判断する(ステップS32)。
評価対象語データベース175は、クエリ分析サーバ100cを管理する管理者等から入力された評価の対象となる語句が記憶されたデータベースである。評価の対象となる語句とは、例えば、「YYY携帯電話」等の商品の名称であったり、芸能人や著名人の名称、店舗やサービスの名称等であってよい。
次に、クエリ分析サーバ100cは、評価観点語算出部182に処理を移し(ステップS33)、評価観点語算出部182は、当該二語以上のクエリが同時に検索された件数を示す検索件数を加算する。そして、クエリ記憶部150が、二語以上のクエリと、評価観点語算出部182により算出されたクエリの検索件数とを関係づけて記憶する(ステップS34)。
例えば、クエリ分析サーバ100cは、ユーザ端末50から二語以上のクエリとして、「YYY携帯電話」、「カナ漢字変換」であったとすると、これらの二語以上のクエリが同時に検索された場合に、今回の検索件数として一だけ、先に記憶された検索件数に加算し、二語以上のクエリと検索件数とを関係づけて、図10に示すテーブルのように関係づけて記憶する。
次に、評価観点語判断部192は、クエリ記憶部150に記憶されたテーブルを参照して、二語以上のクエリのうち評価対象語データベース175に記憶された語句が一致したものに対して、二語以上のクエリのうち、評価対象語データベース175に記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として、評価観点語データベース195に記憶するかを判断する(ステップS35、S36)。ここでの判断基準は、クエリ記憶部150に記憶された検索件数を参照し、当該検索件数が所定以上の場合には、評価観点語判断部192は、評価観点語データベース195に記憶すると判断する。
例えば、検索サーバ200から、「WWWモバイル」、「小型キーボード」を二語以上のクエリとして、クエリ受信部110が受信した場合について説明する。評価対象語データベース175には、予め「WWWモバイル」が、評価対象語として記憶されているとする。この場合には、クエリ分析サーバ100cは、「WWWモバイル」という語句が評価対象語として記憶されていると判断して、当該「WWWモバイル」と「小型キーボード」との検索件数を加算し、図10のテーブルに示すように関係づけて、記憶する。
次に、所定のタイミングで、評価観点語判断部192は、クエリ記憶部150に記憶された検索件数を参照し、当該検索件数が所定以上の場合には、クエリ記憶部150に記憶すると判断する。図10の例で、所定の値が300であるとすると、「WWWモバイル」の評価対象語に対して、「小型キーボード」という語は、同時検索件数が600であるため、所定の値を上回っている。そこで、評価観点語判断部192は、「小型キーボード」を評価観点語データベース195に記憶すると判断する。このような処理で、クエリ分析サーバ100cは、評価観点語データベースを生成することが可能である。
[クエリ分析サーバ100のハードウェア構成]
図11は、図1で説明した本発明の好適な実施形態に係るクエリ分析サーバ100のハードウェア構成の一例を示す図である。下記の説明では、クエリ分析サーバ100により説明を行うが、検索サーバ200、ユーザ端末50におけるハードウェア構成もほぼ同様に構成される。
クエリ分析サーバ100は、制御部101を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、USBポート1090、I/Oコントローラ1070、並びにキーボード及びマウス1100等の入力手段や表示装置1022を備えるコンピュータであってよい。
I/Oコントローラ1070には、テープドライブ1072、ハードディスク1074、光ディスクドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。
BIOS1060は、クエリ分析サーバ100の起動時にCPU1010が実行するブートプログラムや、クエリ分析サーバ100のハードウェアに依存するプログラム等を格納する。
データ記憶部107を構成するハードディスク1074は、クエリ分析サーバ100がサーバとして機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、さらに必要に応じて各種データベースを構成可能である。
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラム又はデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050又はハードディスク1074に提供することもできる。また、同様にテープドライブ1072に対応したテープメディア1071を主としてバックアップのために使用することもできる。
クエリ分析サーバ100に提供されるプログラムは、ハードディスク1074、光ディスク1077、又はメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、又は通信I/F1040を介してダウンロードされることによって、クエリ分析サーバ100にインストールされ実行されてもよい。
前述のプログラムは、内部又は外部の記憶媒体に格納されてもよい。ここで、データ記憶部107を構成する記憶媒体としては、ハードディスク1074、光ディスク1077、又はメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク1074又は光ディスクライブラリー等の記憶装置を記録媒体として使用し、通信回線を介してプログラムをクエリ分析サーバ100に提供してもよい。
ここで、表示装置1022は、ユーザにデータの入力を受付ける画面を表示したり、クエリ分析サーバ100による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
ここで、入力手段は、ユーザによる入力の受付を行うものであり、キーボード及びマウス1100等により構成してよい。
また、通信I/F1040は、クエリ分析サーバ100を専用ネットワーク又は公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
以上の例は、クエリ分析サーバ100について主に説明したが、装置に、プログラムをインストールして、その装置をサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明したサーバにより実現される機能は、上述の方法を当該装置により実行することにより、或いは、上述のプログラムを当該装置に導入して実行することによっても実現可能である。
本発明の好適な実施形態に係るクエリ分析システム1の構成及び処理のフローを示す図である。 本発明の好適な実施形態に係るクエリ分析システム1aの構成及び処理のフローを示す図である。 クエリ分析システム1aによる関連クエリの分割において、分割文字テーブルについて説明する図である。 クエリ分析システム1aによる関連クエリの分割において、クエリと当該クエリの検索件数のテーブルについて説明する図である。 本発明の好適な実施形態に係るクエリ分析システム1bの構成及び処理のフローを示す図である。 クエリ分析システム1bによる係り受けの判断において、入力キーワードと入力されたクエリの1語目、2語目、3語目等の関係について説明する図である。 クエリ分析システム1bによる係り受けの判断において、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)及び、キーワードと併用語とが同時に検索要求があった検索件数を示すテーブル図である。 クエリ分析システム1bによる係り受けの判断において、図8は、クエリ分析サーバ100bに入力された文章の一例を示す図である。 本発明の好適な実施形態に係るクエリ分析システム1cの構成及び処理のフローを示す図である。 クエリ分析システム1cにおいて、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)及び、キーワードと併用語とが同時に検索要求があった検索件数を示すテーブル図である。 本発明の好適な実施形態に係るクエリ分析サーバ100、検索サーバ200、ユーザ端末50のハードウェア構成を示す図である。
符号の説明
1 クエリ分析システム
30 通信回線ネットワーク
50 ユーザ端末
100 クエリ分析サーバ
110 クエリ受信部
115 クエリ算出部
130 クエリ判断部
150 クエリ記憶部
172 対象語検索部
175 評価対象語データベース
182 評価観点語算出部
192 評価観点語判断部
195 評価観点語データベース
200 検索サーバ
210 クエリ受付部
220 検索処理部
1005 バスライン
1010、1012 CPU
1022 表示装置
1050 メインメモリ
1070 コントローラ
1071 テープメディア
1072 テープドライブ
1074 ハードディスク
1076 光ディスクドライブ
1077 光ディスク
1078 半導体メモリ
1090 USBポート
1100 キーボード及びマウス

Claims (3)

  1. 検索サーバと通信可能に接続されたクエリ分析サーバであって、
    当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するクエリ受信部と、
    前記クエリのうち評価の対象となる語句が記憶された評価対象語データベースと、
    前記二語以上のクエリのうち一のクエリが、前記評価対象語データベースに記憶されているかを判断する評価対象語検索部と、
    当該二語以上のクエリの検索件数を算出するクエリ算出部と、
    前記クエリ受信部が受信した二語以上のクエリと、前記クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部と、
    前記二語以上のクエリのうち前記評価対象語データベースに記憶された語句が一致した場合で、かつ、前記クエリ記憶部に記憶された前記二語以上のクエリの検索件数を参照して、当該検索件数が所定以上の場合には、前記二語以上のクエリのうち、前記評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断するクエリ判断部とを備えるクエリ分析サーバ。
  2. 請求項1に記載のクエリ分析サーバのクエリ判断部が判断した評価観点語が記憶された評価観点語データベース。
  3. 検索サーバと通信可能に接続された語句データベースの生成方法であって、
    クエリのうち評価の対象となる語句を記憶するステップと、
    当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するステップと、
    前記二語以上のクエリのうち一のクエリが、所定のデータベースに記憶されているかを判断するステップと、
    当該二語以上のクエリの検索件数を算出するステップと、
    前記受信した二語以上のクエリと、前記算出されたクエリの検索件数とを関係づけて記憶するステップと、
    前記二語以上のクエリのうち所定のデータベースに記憶された語句が一致した場合には、前記二語以上のクエリの検索件数を参照するステップと、
    当該参照した検索件数が所定以上の場合には、前記二語以上のクエリのうち、前記所定の対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するステップと、を備える語句データベース生成方法。
JP2006350301A 2006-12-26 2006-12-26 クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法 Active JP5041802B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006350301A JP5041802B2 (ja) 2006-12-26 2006-12-26 クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006350301A JP5041802B2 (ja) 2006-12-26 2006-12-26 クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法

Publications (3)

Publication Number Publication Date
JP2008158998A JP2008158998A (ja) 2008-07-10
JP2008158998A5 JP2008158998A5 (ja) 2009-05-07
JP5041802B2 true JP5041802B2 (ja) 2012-10-03

Family

ID=39659803

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006350301A Active JP5041802B2 (ja) 2006-12-26 2006-12-26 クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法

Country Status (1)

Country Link
JP (1) JP5041802B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5179564B2 (ja) * 2010-12-28 2013-04-10 ヤフー株式会社 クエリセグメント位置決定装置
CN110738056B (zh) * 2018-07-03 2023-12-19 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06314296A (ja) * 1993-03-02 1994-11-08 Fujitsu Ltd 情報検索システム
JPH07262191A (ja) * 1994-03-24 1995-10-13 Sony Corp 単語分割方法、および音声合成装置
JP2003005776A (ja) * 2001-06-21 2003-01-08 Nec Corp 音声合成装置

Also Published As

Publication number Publication date
JP2008158998A (ja) 2008-07-10

Similar Documents

Publication Publication Date Title
US20180276293A1 (en) Automated self-service user support based on ontology analysis
JP6095621B2 (ja) 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置
US10552467B2 (en) System and method for language sensitive contextual searching
US8825694B2 (en) Mobile device retrieval and navigation
KR101128921B1 (ko) 다의적 문자의 명확화
US20170185644A1 (en) Command searching enhancements
US20060195435A1 (en) System and method for providing query assistance
WO2016027714A1 (ja) 質問文生成装置及びコンピュータプログラム
KR101040119B1 (ko) 콘텐츠 검색 장치 및 방법
US20060020576A1 (en) Search system reusing search condition and the related method
US20090055386A1 (en) System and Method for Enhanced In-Document Searching for Text Applications in a Data Processing System
US20100293162A1 (en) Automated Keyword Generation Method for Searching a Database
US20120117102A1 (en) Query suggestions using replacement substitutions and an advanced query syntax
JP2007072646A (ja) 検索装置、検索方法およびプログラム
JP2010061420A (ja) 商品情報検索装置、方法及びシステム
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
JP5041802B2 (ja) クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法
US20220343087A1 (en) Matching service requester with service providers
CN109800361A (zh) 一种兴趣点名称的挖掘方法、装置、电子设备及存储介质
US20060195313A1 (en) Method and system for selecting and conjugating a verb
JP2010086210A (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP2010250389A (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JP2008123054A (ja) 質問文の自動生成システム
JP2008262442A (ja) 検索キーデータを表示させる方法及びサーバ

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090318

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111124

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120710

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5041802

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250