JP2004334638A - Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored - Google Patents

Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored Download PDF

Info

Publication number
JP2004334638A
JP2004334638A JP2003131254A JP2003131254A JP2004334638A JP 2004334638 A JP2004334638 A JP 2004334638A JP 2003131254 A JP2003131254 A JP 2003131254A JP 2003131254 A JP2003131254 A JP 2003131254A JP 2004334638 A JP2004334638 A JP 2004334638A
Authority
JP
Japan
Prior art keywords
search
word
search term
term
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003131254A
Other languages
Japanese (ja)
Inventor
Toshiaki Makino
俊朗 牧野
Masayuki Sugizaki
正之 杉崎
Masaru Miyamoto
勝 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003131254A priority Critical patent/JP2004334638A/en
Publication of JP2004334638A publication Critical patent/JP2004334638A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an additional retrieval word acquiring device, an additional retrieval word acquiring method, a program for realizing the device and the method, and a recording medium in which its program is stored for acquiring a retrieval word to be added in retrieval to be successively performed by analyzing a retrieval log generated by a retrieval engine, and to efficiently apply a word relevant to things which are highly likely to be in the news as the retrieval word. <P>SOLUTION: This additional retrieval word acquiring system is provided with an extracting means for extracting records including a single retrieval word different from any of retrieval words according to all desired retrieval words in a retrieval log generated by a retrieval engine and a retrieval word acquiring means for acquiring the single retrieval word included in the extracted records in the descending order of the priority of those records. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、検索エンジンによって生成された検索ログを解析することにより、後続して行われる検索の際に追加されるべき検索語を取得する追加検索語取得装置、追加検索語取得方法、これらの装置や方法を実現するプログラムおよびそのプログラムが記憶された記録媒体に関する。
【0002】
【従来の技術】
検索エンジンは、文書等が蓄積されたデータベースにアクセスし、ユーザによって指定された検索式に合致する文書、あるいはその文書に関する情報を提供する。
また、このような検索式は、「ニュース」のような単一の語だけではなく、例えば、「ニュース経済」のように複数の語を含む論理式として与えられる。
さらに、インタネット等を介して検索サービスを提供する検索サイトでは、上記の複数の語は、一般に、検索式『「ニュース」AND「経済」』として識別され、その検索式に基づく検索の結果として、「ニュース」と「経済」との双方に関係する文書等が提供される。
【0003】
また、上述した検索エンジンや検索サイトの利用の過程では、先行して得られた検索の結果が多数に亘る場合には、その検索の結果は、ユーザによって追加された新たな語(以下、「追加検索語」という。)を併せて含む文書等の集合に順次絞り込まれる。
【特許文献1】
特開平9−218881号公報(要約、請求項1)
【0004】
【発明が解決しようとする課題】
ところで、上述した従来例では、検索結果の絞り込みに際して適用されるべき追加検索語は、その絞り込みを意図するユーザによって適宜指定されなければならない。
したがって、絞り込みの方針が確定、その方針に適合した追加検索語がこのユーザによって想起される場合には、効率的に、かつ円滑に「絞り込み検索」が実現される。
【0005】
しかし、例えば、「絞り込み検索」が行われるべき時点において話題性が高い事物にかかわる情報が効率的に検索されるべき場合には、適切な追加検索語の想起は、ユーザにとって必ずしも容易ではなく、かつ困難である場合が多かった。
なお、本願発明に関連した先行技術としては、例えば、特開平10−320419号公報に掲載されるように、検索エンジンによって生成された検索ログ(実績として検索式、その検索式が入力された時点(日時)、この検索式に含まれる検索語を入力したユーザの識別情報やクッキーなどの情報が含まれる。)が参照され、「ユーザ毎に、検索語が入力された時刻の最小の差」が小さいほど、検索式に含まれる検索語の間における関連度が大きく評価される技術がある。
【0006】
しかし、この先行技術では、入力された時刻の差が小さい2つの検索語は、実体的には関連性がないにもかかわらず関連づけられる。
したがって、これらの検索語の内、遅れて入力された検索語は、追加検索語として識別されるとは限らなかった。また、このような先行技術は、2つの検索語の間における関連性の程度を算出することはできても、先行して指定された2つの検索語に追加されるべき追加検索語を求めることは本質的にできなかった。
【0007】
本発明の目的は、「絞り込み検索」等に適用されるべき追加検索語として、話題性が高い事物にかかわる語を効率的に適用可能な追加検索語取得装置、追加検索語取得方法、プログラムおよび記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
請求項1に記載の発明では、抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する。
すなわち、このような単一の検索語は、ユーザによって適宜指定されなくても、検索エンジンが実際に先行して行った検索に適用された検索語の内、上述した優先度が高い検索語に自動的に選定される。
【0009】
したがって、「絞り込み検索」や「検索の再試行」に適用されるべき検索語は、ユーザが想起できない場合であっても、先行して多数のユーザによって適用され、かつ話題性が高い事物を示す語に円滑に設定される。
請求項2に記載の発明では、検索語変換手段は、所望の検索語を個別に関連する語の集合に変換する。抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する。
【0010】
すなわち、このような単一の検索語は、検索ログの内、『単に「上述した所望の検索語の全て」に併せて、何らかの単一の語を含むレコード』から取得される場合に比べて、先行して行われた類似の検索の結果が広範に反映されたレコードから取得される。
したがって、このような単一の検索語が適用されて行われるべき「絞り込み検索」や「検索の再試行」の効率化や最適化が図られる。
【0011】
請求項3に記載の発明では、検索語拡張手段は、取得された単一の検索語をその単一の検索語に関連する語の集合に拡張する。
すなわち、このような単一の検索語は、その単一の検索語が単に「絞り込み検索」や「検索の再試行」に適用される場合に比べて、これらの「絞り込み検索」や「検索の再試行」に有効に活用される。
【0012】
したがって、「絞り込み検索」や「検索の再試行」の効率化や最適化が可能となる。
請求項4に記載の発明では、抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードに個別に含まれる単一の検索語を取得する。検索語候補通知手段は、取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する。マンマシンインタフェース手段は、操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる。
【0013】
すなわち、上述した単一の検索語は、既述の優先度が単に高いレコードに含まれる検索語だけではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
したがって、請求項1に記載の発明に比べて、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
【0014】
請求項5に記載の発明では、検索語変換手段は、所望の検索語を個別に関連する語の集合に変換する。抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードに個別に含まれる単一の検索語を取得する。検索語候補通知手段は、取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する。マンマシンインタフェース手段は、操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる。
【0015】
すなわち、上述した単一の検索語は、既述の優先度が単に高いレコードに含まれる検索語だけではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
したがって、請求項2に記載の発明に比べて、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
【0016】
請求項6に記載の発明では、検索語取得手段は、抽出されたレコードの優先度の降順にこれらのレコードに個別に含まれる単一の検索語を取得する。検索語候補通知手段は、取得された単一の検索語と、その単一の検索語に関連する語の集合との双方もしくは何れか一方を優先度の降順に操作者に通知する。
すなわち、上述した単一の検索語の選択にかかわるマンマシンインタフェースは、その単一の検索語の候補が既述の優先度に何ら対応付けられることなくユーザに通知される場合に比べて、効率的に、かつ確度高く実現される。
【0017】
したがって、操作性に併せて、利便性が高められる。
請求項7に記載の発明では、検索語拡張手段は、選択された単一の検索語をその単一の検索語に関連する語の集合に拡張する。
すなわち、このような単一の検索語は、その単一の検索語が単に「絞り込み検索」や「検索の再試行」に適用される場合に比べて、これらの「絞り込み検索」や「検索の再試行」に有効に活用される。
【0018】
したがって、「絞り込み検索」や「検索の再試行」の効率化や最適化が可能となる。
請求項8に記載の発明では、優先度は、抽出されたレコードの属性毎に付与される。
すなわち、検索ログから抽出された何れのレコードに関しても、上述した属性の識別が可能である限り、その属性に対応した所望の優先度の順に単一の検索語が選択され、あるいはその単一の検索語の候補がユーザに通知される。
【0019】
したがって、「絞り込み検索」や「検索の再試行」に際して適用されるべき単一の検索語の選定またはその選定にかかわるマンマシンインタフェースは、確実な基準に基づいて行われる。
請求項9に記載の発明では、単一の検索語は、ユーザによって適宜指定されなくても、請求項1に記載の発明と同様に、検索エンジンが実際に先行して行った検索に適用された検索語の内、上述した優先度が高い検索語に自動的に選定される。
【0020】
したがって、「絞り込み検索」や「検索の再試行」に適用されるべき検索語は、ユーザが想起できない場合であっても、先行して多数のユーザによって適用され、かつ話題性が高い事物を示す語に円滑に設定される。
請求項10に記載の発明では、請求項2に記載の発明と同様に、先行して検索演算によって行われた類似の検索の結果が広範に反映されたレコードから取得される。
【0021】
したがって、このような単一の検索語が適用されて行われるべき「絞り込み検索」や「検索の再試行」の効率化や最適化が図られる。
請求項11に記載の発明では、単一の検索語は、請求項4に記載の発明と同様に、既述の優先度が単に高いレコードに含まれる検索語ではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
【0022】
したがって、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
請求項12に記載の発明では、単一の検索語は、請求項5に記載の発明と同様に、既述の優先度が単に高いレコードに含まれる検索語ではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
【0023】
したがって、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
請求項13に記載のプログラムは、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置を構成する抽出手段、検索語取得手段、検索語変換手段、検索語拡張手段、検索語候補通知手段およびマンマシンインタフェース手段の全てもしくは一部として、コンピュータを機能させる。
【0024】
したがって、本発明にかかわるプログラムを実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載された追加検索語取得装置の構成要素となる。
請求項14に記載の記録媒体は、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置を構成する抽出手段、検索語取得手段、検索語変換手段、検索語拡張手段、検索語候補通知手段およびマンマシンインタフェース手段の全てもしくは一部として、コンピュータを機能させるためのプログラムが記録され、かつコンピュータ読み取り可能である。
【0025】
このようなプログラムは、上述したコンピュータによって実行されるべきソフトウエアまたはそのコンピュータに組み込まれたマイクロプログラムとして構成され、このようなコンピュータとは別体の着脱可能な記録媒体に記録されることによって流通し得る。
したがって、本発明にかかわる記録媒体からこのようなプログラムを読み取って実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置の構成要素となる。
【0026】
【発明の実施の形態】
以下、図面に基づいて本発明の実施形態について詳細に説明する。
図1は、本発明の第一および第二の実施形態を示す図である。
図において、プロセッサ11には、マンマシンインタフェースに供されるディスプレイ12、キーボード13およびマウス14が接続され、そのプロセッサ11の外部記憶上に後述する検索ログデータベース15と集計結果データベース16とが備えられる。
【0027】
図2は、本発明の第一の実施形態の動作フローチャートである。
以下、図1および図2を参照して本発明の第一の実施形態の動作を説明する。
検索ログデータベース15は、先行して与えられた検索語(検索式)に応じて検索エンジンによって記録され、例えば、図3に示すように、下記の各フィールドからなるレコードの列として構成される。
【0028】
・ 検索語や検索式が与えられた時刻が格納された「検索時刻」フィールド
・ その検索語(あるいはこの検索語を含む検索式)が格納された「検索式」フィールド
・ このような検索語(検索式)を示す検索の要求を発したユーザを示す「ユーザ識別子」フィールド
集計結果データベース16は、例えば、図4(a) に示すように、下記の各フィールドからなるレコードの列として構成される。
【0029】
・ 上記の検索式に含まれる検索語の列が格納される「検索式」フィールド
・ 検索エンジンの起動(検索の要求)がその検索式に基づいて行われた回数の総和が格納される「利用回数」フィールド
・ 該当する検索式に基づいて検索エンジンを起動した(検索の要求を発した)ユーザの人数が格納される「利用人数」フィールド
プロセッサ11は、ディスプレイ12、キーボード13およびマウス14を介してマンマシンインタフェースをとり、そのマンマシンインタフェースの下でユーザによって与えられた検索の要求(単一または複数の検索語を含む)を識別すると、下記の処理を行う。
【0030】
・ 検索の要求に含まれる検索語を含む検索式を生成する。
・ その検索式を検索エンジンに与えることによって、検索処理を起動する。
・ その検索処理の結果として与えられた情報の集合に併せて、この検索処理の形態を示す既述の「検索時刻」、「検索式」および「ユーザ識別子」からなるレコードを検索ログデータベース15に付加する。
【0031】
また、プロセッサ11は、上述したマンマシンインタフェースの下で検索ログの集計処理が行われるべき期間および契機が与えられると、下記の手順に基づいてその集計処理を行う。
(1) 検索ログデータベース15のレコードの内、「検索時刻」フィールドの値で示される時刻が上記の期間に属するレコードを全て抽出する。
【0032】
(2) これらの抽出されたレコードに含まれる個々の「検索式」について、下記の処理を行う。
▲1▼ 該当する「検索式」が「検索式」フィールドに格納されているレコードの総数として既述の「利用回数」を求める。
▲2▼ 該当する「検索式」と共に検索ログデータベース15の「ユーザ識別子」フィールドに格納されているユニークな「ユーザ識別子」の総数として既述の「利用人数」を求める。
【0033】
▲3▼ 該当する「検索式」に併せて、このようにして求められた「利用回数」および「利用人数」からなるレコードを集計結果データベース16に付加する。
さらに、プロセッサ11は、検索ログデータベース15に含まれる全ての有効なレコードについて上述した処理を完結した後には、既述のマンマシンインタフェースの下で与えられた新たな検索の要求に応じて下記の処理を行う。
【0034】
(a) 該当する新たな検索の要求に含まれる単一または複数の検索語(以下、単に、「先行検索語」という。)の全て(以下、簡単のため、識別子「a」で表記する。)を取得する(図2(1))。
(b) 集計結果データベース16のレコードの内、「検索式」フィールドに、このような「先行検索語」の全てに併せて、何らかの検索語wが含まれるレコード(以下、「特定のレコード」という。)の全てを抽出する(図2(2))。
【0035】
(c) これらの「特定のレコード」にかかわる下記の値を算出する(図2(3))。
・ 全ての「特定のレコード」の「利用人数」フィールドの値の平均値ma+1
・ これらの「利用人数」フィールドの値の標準偏差ka+1
(d) 以下の手順に基づいて、これらの「特定のレコード」の個々の優先度を算出する(図2(4))。
【0036】
▲1▼ 該当する「特定のレコード」の「利用人数」フィールドの値nawを参照する。
▲2▼ この値naw、既述の平均値ma+1 および標準偏差ka+1 に対して、下式で示されるように、「利用人数(=naw)」が大きいほど大きな値となる優先度vawを算出する。
【0037】
aw=(naw−ma+1)/ka+1
(e) このような優先度vawが最大である単一の「特定のレコード」を選定する(図2(5))。
(f) その単一の「特定のレコード」の「検索式フィールド」に格納されている検索語の内、「先行検索語」の何れにも該当しない単一の検索語(以下、「追加検索語」と称し、簡単のため、「先行検索語」の何れとも異なると仮定する。)を取得する(図2(6))。
【0038】
(g) この「追加検索語」を適用することによる「絞り込み検索」、または「検索の再試行」の要求を検索エンジンに与える(図2(7))。
すなわち、「絞り込み検索」や「検索の再試行」が行われる時点には、先行して実際に「先行検索語」と共に適用された回数が大きい検索語が「追加検索語」として自動的に適用される。
【0039】
したがって、本実施形態によれば、ユーザが「追加検索語」を想起することなく、多数のユーザによって適用され、かつ話題性が高い事物を示す語が効率的に「絞り込み検索」や「検索の再試行」に適用される。
なお、本実施形態では、「特定レコード」は、集計結果データベース16のレコードの内、単に既述の「先行検索語」の全てに併せて、何らかの検索語wが「検索式」フィールドに含まれるレコードとして抽出されている。
【0040】
しかし、このような「特定のレコード」は、上述した「先行検索語」の全てからなる「先行検索語列」に代えて、例えば、これらの「先行検索語」の全てまたは一部が下記の何れかの語(概念辞書等の参照によって求められてもよい。)で置換されることによって生成された単一もしくは複数の「代替先行検索語列」が適用されることによって、多様な形態による「絞り込み検索」や「検索の再試行」の実現に併せて、効率化や最適化が図られてもよい。
【0041】
・ 類義語
・ 反意語
・ 上位概念の語
・ 下位概念の語
また、本実施形態では、既述の優先度が最大である「特定のレコード」の「検索式フィールド」に格納されている検索語の内、単に「先行検索語」の何れにも該当しない単一の検索語が「追加検索語」として取得されている。
【0042】
しかし、このような「追加検索語」は、例えば、上述した「代替先行検索語列」が生成される過程と同様に、概念辞書等の参照の下で取得された類義語、反意語、上位概念の語、下位概念の語等々で置換されることによって、多様な形態による「絞り込み検索」や「検索の再試行」の実現に併せて、効率化や最適化が図られてもよい。
【0043】
さらに、本実施形態では、既述の優先度の算出と、追加検索語の取得との何れの処理も、集計結果データベース16の全てのレコードが参照されることによって行われている。
しかし、これらの処理の一方もしくは全ては、例えば、集計結果データベース16のレコードの内、下記の条件の全てまたは一部が成立するレコードのみが参照されることによって行われてもよい。
【0044】
・ 「利用回数」フィールドの値が所定の上限値を超える。
・ 「利用人数」フィールドの値が所定の上限値を超える。
・ 「検索式」フィールドに、検索語が所定の順列として含まれる。
また、「集計結果データベース16のレコードの内、このような処理の過程で参照されるべきレコード」の属性が上記の条件では定義されない場合には、例えば、その集計結果データベース16を生成する集計処理は、下記の形態の全てまたは一部で行われてもよい。
【0045】
・ 検索が行われた時刻(検索ログデータベース15の「検索時刻」フィールドの値で示される。)が所望の期間や時間帯に属する。
・ 検索の要求を発したユーザ(検索ログデータベース15の「ユーザ識別子」フィールドの値で示される。)が所望の属性(ユーザとの契約の形態、そのユーザからクッキー等として引き渡された情報に基づいて特定される。)を有する。
【0046】
さらに、本実施形態では、検索ログデータベース15の各レコードは、「検索時刻」フィールド、「検索式」フィールドおよび「ユーザ識別子」フィールドのみから構成されている。
しかし、例えば、利用人数が集計されるべき場合には、このようなレコードには、ユーザの識別に供される「ユーザ識別子」に併せて、個々のユーザから引き渡されたクッキー等の情報が含まれてもよい。
【0047】
また、本実施形態では、集計結果データベース16の各レコードは、「検索式」フィールド、「利用回数」フィールドおよび「利用人数」フィールドのみから構成されている。
しかし、このようなレコードは、例えば、「利用回数」と「利用人数」との何れか一方のみが含まれて構成されてもよい。
【0048】
さらに、本実施形態では、集計結果データベース16は、検索ログデータベース15の全てのレコードに既述の集計処理が施されることによって生成されている。
しかし、このような集計処理は、「検索時刻」フィールドの値が所望の期間に属するレコードのみに施されてもよく、あるいは図4(b) に示すように、その「検索時刻」フィールドの値に基づいて識別された複数の期間について個別に求められてもよい。
【0049】
図5は、本発明の第二の実施形態の動作フローチャートである。
以下、図1および図5を参照して本発明の第二の実施形態の動作を説明する。
本実施形態の特徴は、プロセッサ11によって行われる下記の処理の手順にある。
プロセッサ11は、既述の第一の実施形態と同様の手順に基づいて「特定のレコード」の全てを抽出し、さらに、下記の処理を行う。
【0050】
(A) ディスプレイ12を介してユーザに、これらの抽出された「特定のレコード」を下記の何れかの帳票として通知する(図5(1))。
・ 全ての「特定のレコード」の「検索式」フィールドの値(「先行検索語」に該当する検索語が除外され、あるいは特定の表示属性で示されてもよい。)の列を示す帳票
・ 既述の優先度vawの降順に、全ての「特定のレコード」の「検索式」フィールドの値(「先行検索語」に該当する検索語が除外され、あるいは特定の表示属性で示されてもよい。)がソーティングされ、またはマージされることによって生成された帳票
(B) 既定のマンマシンインタフェース(例えば、キーボード13だけではなくマウス14を介して実現される「グラヒック・ユーザ・インタフェース」であってもよい。)の下で、このような帳票に含まれる「検索式」フィールドの値の選択を実現する(図5(2))。
【0051】
(C) 選択された「検索式」フィールドの値に含まれる「追加検索語」を適用することによる「絞り込み検索」(または、「検索の再試行」)の要求を検索エンジンに与える(図5(3))。
すなわち、「追加検索語」は、上述した優先度vawが単に最大である「特定のレコード」の「検索式」フィールドに含まれる語ではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
【0052】
したがって、本実施形態によれば、「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
なお、上述した各実施形態では、検索ログデータベース15と集計結果データベース16との双方がプロセッサ11によってアクセスされる外部記憶装置の所定の記憶領域に配置されている。
【0053】
しかし、本発明はこのような構成に限定されず、これらの検索ログデータベース15と集計結果データベース16との双方もしくは何れか一方は、例えば、プロセッサ11の主記憶の所定の記憶領域に配置され、あるいはLANやインタネットを介してアクセス可能なデータベースとして構成されてもよい。
さらに、上述した各実施形態では、データベースエンジンの実体が詳細に開示されていない。
【0054】
しかし、このようなデータベースエンジンは、本願発明の特徴ではなく、かつ多様な技術が適用されることによって実現が可能であり、しかも、ローカルエリアネットワーク、インタネットその他の通信網を介してアクセス可能なデータベースではなく、例えば、プロセッサ11によって直接実行されるソフトウエアであってもよい。
【0055】
また、上述した各実施形態では、既述のマンマシンインタフェースは、プロセッサ11の入出力機器として備えられたディスプレイ12、キーボード13およびマウス14を介して実現されている。
しかし、このようなマンマシンインタフェースは、例えば、インタネットその他の通信網を介してプロセッサ11にアクセスすることが可能な情報処理装置(パソコンやワークステーションに限らず、PDA(Personal Digital Assistants)等であってもよい。)に備えられた入出力装置を介して実現されてもよい。
【0056】
さらに、上述した各実施形態は、プロセッサ11によって実行されるソフトウエアとして構成されている。
しかし、本発明はこのような構成に限定されず、既述の処理の全てまたは一部は、専用のハードウエアによって行われてもよい。
また、本発明は、上述した実施形態に限定されるものではなく、本発明の反意において、多様な形態による実施形態が可能であり、かつ構成装置の一部もしくは全てに如何なる改良が施されてもよい。
【0057】
【発明の効果】
上述したように請求項1、9に記載の発明では、「絞り込み検索」や「検索の再試行」に適用されるべき検索語は、ユーザが想起できない場合であっても、先行して多数のユーザによって適用され、かつ話題性が高い事物を示す語に円滑に設定される。
また、請求項2、3、7、10に記載の発明では、後続して行われるべき「絞り込み検索」や「検索の再試行」の効率化や最適化が図られる。
【0058】
さらに、請求項4、5、11、12に記載の発明では、後続して行われるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
また、請求項6に記載の発明では、操作性に併せて、利便性が高められる。
さらに、請求項8に記載の発明では、「絞り込み検索」や「検索の再試行」に際して適用されるべき単一の検索語の選定またはその選定にかかわるマンマシンインタフェースが、確実な基準に基づいて行われる。
【0059】
また、請求項13に記載のプログラムプログラムを実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載された追加検索語取得装置の構成要素となる。
さらに、請求項14に記載の記録媒体から上述したプログラムを読み取ってする実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置の構成要素となる。
【0060】
したがって、これらの発明が適用されたデータベースシステムおよび情報検索システムでは、話題性が高い情報の検索が的確に、かつ迅速に実現され、性能および付加価値が高められる。
【図面の簡単な説明】
【図1】本発明の第一および第二の実施形態を示す図である。
【図2】本発明の第一の実施形態の動作フローチャートである。
【図3】検索ログの構成を示す図である。
【図4】集計結果の構成を示す図である。
【図5】本発明の第二の実施形態の動作フローチャートである。
【符号の説明】
11 プロセッサ
12 ディスプレイ
13 キーボード
14 マウス
15 検索ログデータベース
16 集計結果データベース
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention analyzes a search log generated by a search engine to obtain a search word to be added in a subsequent search, an additional search word acquisition device, an additional search word acquisition method, The present invention relates to a program realizing an apparatus and a method, and a recording medium storing the program.
[0002]
[Prior art]
The search engine accesses a database in which documents and the like are stored, and provides documents that match the search formula specified by the user or information about the documents.
Such a search expression is given as a logical expression including not only a single word such as “news” but also a plurality of words such as “news economy”.
Further, in a search site that provides a search service via the Internet or the like, the above plurality of words are generally identified as a search expression “news” AND “economic”, and as a result of a search based on the search expression, Documents related to both “news” and “economy” are provided.
[0003]
Further, in the process of using the search engine and the search site described above, if the search result obtained in advance is large, the search result is a new word added by the user (hereinafter, “ ).
[Patent Document 1]
Japanese Patent Application Laid-Open No. 9-218881 (abstract, claim 1)
[0004]
[Problems to be solved by the invention]
By the way, in the above-described conventional example, an additional search word to be applied when narrowing down search results must be appropriately designated by a user who intends to narrow down the search results.
Therefore, when the narrowing-down policy is determined and an additional search word suitable for the narrowing-down policy is recalled by the user, the “narrowing-down search” is efficiently and smoothly realized.
[0005]
However, for example, when information related to a highly topical thing should be efficiently searched at the time when “refinement search” is to be performed, recalling an appropriate additional search word is not always easy for the user, And it was often difficult.
As prior art related to the present invention, for example, as disclosed in Japanese Patent Application Laid-Open No. H10-320419, a search log generated by a search engine (a search expression as an actual result, a time when the search expression is input) (Date and time, and information such as identification information and cookies of the user who input the search term included in this search expression.) Is referred to, and the “minimum difference in the time when the search term was input for each user” is referred to. There is a technique in which the smaller the is, the greater the degree of relevance between search terms included in the search expression is.
[0006]
However, in this prior art, two search terms having a small difference between the input times are related even though they are not physically related.
Therefore, of these search terms, a search term entered late is not always identified as an additional search term. Further, such prior art is capable of calculating a degree of relevance between two search words, but seeking an additional search word to be added to the two previously specified search words. Essentially couldn't.
[0007]
An object of the present invention is to provide an additional search word acquisition device, an additional search word acquisition method, a program, and a program that can efficiently apply words related to a highly topical thing as additional search words to be applied to “refinement search” and the like. It is intended to provide a recording medium.
[0008]
[Means for Solving the Problems]
According to the first aspect of the present invention, the extraction unit includes, in the search log generated by the search engine, a record including a single search term different from any of these search terms in addition to all of the desired search terms. Is extracted. The search term acquiring means acquires a single search term included in the extracted records in descending order of priority of these records.
In other words, such a single search term is not included in the search terms applied to the search that was actually performed earlier by the search engine, and is not included in the search term having the higher priority described above. Selected automatically.
[0009]
Therefore, even if the user cannot recall, the search term to be applied to “refine search” or “retrieval of search” is applied by a large number of users in advance, and indicates a thing with high topicality. Words are set smoothly.
According to the second aspect of the present invention, the search word conversion means converts a desired search word into a set of individually related words. The extraction means includes, in a search log generated by a search engine, a search term including a single search term different from any of these terms, in addition to any of the terms individually associated with all of the desired search terms. Extract records containing. The search term acquiring means acquires a single search term included in the extracted records in descending order of priority of these records.
[0010]
That is, such a single search term is compared with a case in which the search log is obtained from “records including any single word together with“ all of the above-described desired search terms ”in the search log”. , The result of a similar search performed earlier is obtained from a record that is widely reflected.
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” to be performed by applying such a single search word are achieved.
[0011]
According to the third aspect of the present invention, the search term expansion unit expands the obtained single search word into a set of words related to the single search word.
In other words, such a single search term is compared to a case where the single search term is simply applied to “refinement search” or “retrieval of search”. It is effectively used for "retry".
[0012]
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” can be made.
According to the fourth aspect of the present invention, the extraction means includes, in the search log generated by the search engine, a record including a single search term different from any of these search terms in addition to all of the desired search terms. Is extracted. The search term acquisition means acquires a single search term individually included in the extracted record. The search word candidate notifying unit notifies the operator of the acquired single search word and / or a word related to the single search word. The man-machine interface means takes a man-machine interface relating to selection of either the search word or the word notified to the operator.
[0013]
That is, the above-described single search term is set not only to the search term included in the record having the high priority described above, but also to a word flexibly adapted to the user's judgment and intention.
Therefore, as compared with the first aspect of the present invention, the degree of freedom of “narrow search” and “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is performed. Becomes possible.
[0014]
In the invention described in claim 5, the search word conversion means converts a desired search word into a set of individually related words. The extracting means includes, in the search log generated by the search engine, a record including a single search term different from any of these terms in addition to any of the terms individually related to all of the desired search terms. Extract. The search term acquisition means acquires a single search term individually included in the extracted record. The search word candidate notifying unit notifies the operator of the acquired single search word and / or a word related to the single search word. The man-machine interface means takes a man-machine interface relating to selection of either the search word or the word notified to the operator.
[0015]
That is, the above-described single search term is set not only to the search term included in the record having the high priority described above, but also to a word flexibly adapted to the user's judgment and intention.
Therefore, as compared with the invention described in claim 2, the degree of freedom of “narrow search” or “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is achieved. Becomes possible.
[0016]
According to the invention described in claim 6, the search term acquisition means acquires a single search term individually included in the extracted records in descending order of priority of the records. The search word candidate notifying unit notifies the operator of the obtained single search word and / or a set of words related to the single search word in descending order of priority.
In other words, the man-machine interface related to the selection of a single search term described above is more efficient than a case where the single search term candidate is notified to the user without being associated with any of the priorities described above. It is realized with high accuracy and accuracy.
[0017]
Therefore, convenience is improved in addition to operability.
In the invention according to claim 7, the search term expanding means extends the selected single search term to a set of terms related to the single search term.
In other words, such a single search term is compared to a case where the single search term is simply applied to “refinement search” or “retrieval of search”. It is effectively used for "retry".
[0018]
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” can be made.
In the invention according to claim 8, the priority is assigned to each attribute of the extracted record.
That is, for any record extracted from the search log, as long as the above-described attribute can be identified, a single search word is selected in the order of desired priority corresponding to the attribute, or the single search word is selected. The user is notified of search word candidates.
[0019]
Therefore, the selection of a single search word to be applied in the “narrowing search” or the “retrieval of the search” or the man-machine interface related to the selection is performed based on reliable criteria.
According to the ninth aspect of the present invention, a single search term is applied to a search actually performed by a search engine in advance, similarly to the first aspect of the invention, even if the single search term is not appropriately designated by a user. Of the search words, the search word having the higher priority is automatically selected.
[0020]
Therefore, even if the user cannot recall, the search term to be applied to “refine search” or “retrieval of search” is applied by a large number of users in advance, and indicates a thing with high topicality. Words are set smoothly.
According to the tenth aspect, similarly to the second aspect, a result of a similar search performed by a search operation in advance is obtained from a record in which the result is widely reflected.
[0021]
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” to be performed by applying such a single search word are achieved.
In the invention described in claim 11, a single search word is not a search word included in a record having a high priority as described above, but is determined by the user's judgment and intention, similarly to the invention described in claim 4. Set to a word that is flexibly adapted.
[0022]
Therefore, the degree of freedom of “narrow search” or “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is possible.
In the twelfth aspect of the present invention, a single search term is not a search term contained in a record having a high priority as described above, but is determined by the user's judgment and intention, similarly to the fifth aspect of the invention. Set to a word that is flexibly adapted.
[0023]
Therefore, the degree of freedom of “narrow search” or “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is possible.
A program according to a thirteenth aspect of the present invention provides an additional search term acquisition device according to any one of the first to eighth aspects, wherein the extraction means, the search term acquisition means, the search term conversion means, the search term extension means, The computer is caused to function as all or a part of the search word candidate notification means and the man-machine interface means.
[0024]
Therefore, a computer that executes the program according to the present invention is a component of the additional search term acquisition device according to any one of claims 1 to 8.
A recording medium according to claim 14, wherein an extraction unit, a search word acquisition unit, a search word conversion unit, and a search word expansion unit that constitute the additional search word acquisition device according to any one of claims 1 to 8. A program for causing a computer to function as all or part of the search word candidate notification means and the man-machine interface means is recorded and readable by a computer.
[0025]
Such a program is configured as software to be executed by the above-described computer or a microprogram incorporated in the computer, and is distributed by being recorded on a detachable recording medium separate from such a computer. I can do it.
Therefore, a computer that reads and executes such a program from the recording medium according to the present invention is a component of the additional search term acquisition device according to any one of claims 1 to 8.
[0026]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing first and second embodiments of the present invention.
In the figure, a display 12, a keyboard 13 and a mouse 14 provided for a man-machine interface are connected to a processor 11, and a search log database 15 and a tallying result database 16 described later are provided on an external storage of the processor 11. .
[0027]
FIG. 2 is an operation flowchart of the first embodiment of the present invention.
Hereinafter, the operation of the first embodiment of the present invention will be described with reference to FIGS.
The search log database 15 is recorded by a search engine in accordance with a search term (search expression) given in advance, and is configured as, for example, a row of records including the following fields as shown in FIG.
[0028]
・ "Search time" field that stores the time when the search word or search expression was given
-"Search expression" field in which the search word (or search expression containing this search word) is stored
A “user identifier” field indicating a user who has issued a search request indicating such a search term (search expression)
The aggregation result database 16 is, for example, configured as a row of records including the following fields, as shown in FIG.
[0029]
・ "Search expression" field that stores the sequence of search terms included in the above search expression
-"Use count" field that stores the total number of times the search engine was started (search request) based on the search formula
・ The "Number of users" field that stores the number of users who have started the search engine (issued a search request) based on the relevant search formula
Processor 11 takes a man-machine interface via display 12, keyboard 13 and mouse 14 and identifies a search request (including one or more search terms) given by a user under the man-machine interface. The following processing is performed.
[0030]
-Generate a search expression that includes the search term included in the search request.
-The search process is started by giving the search expression to the search engine.
In addition to the set of information given as a result of the search processing, a record including the above-described “search time”, “search expression”, and “user identifier” indicating the form of the search processing is stored in the search log database 15. Add.
[0031]
Further, when a period and an opportunity to perform the search log tallying process under the man-machine interface described above are given, the processor 11 performs the tallying process based on the following procedure.
(1) From the records of the search log database 15, all the records whose time indicated by the value of the “search time” field belongs to the above period are extracted.
[0032]
(2) The following processing is performed for each “search formula” included in these extracted records.
{Circle around (1)} The above-mentioned “number of times of use” is obtained as the total number of records in the “search expression” field corresponding to the “search expression”.
{Circle around (2)} The aforementioned “number of users” is obtained as the total number of unique “user identifiers” stored in the “user identifier” field of the search log database 15 together with the corresponding “search formula”.
[0033]
{Circle around (3)} A record including the “number of uses” and “the number of users” obtained in this way is added to the tallying result database 16 along with the corresponding “search formula”.
Further, after completing the above-described processing for all valid records included in the search log database 15, the processor 11 responds to the following new search request given under the aforementioned man-machine interface, and Perform processing.
[0034]
(A) All of the single or plural search words (hereinafter, simply referred to as “preceding search words”) included in the relevant new search request (hereinafter, simply referred to as identifier “a” for simplicity). ) Is obtained (FIG. 2 (1)).
(B) Among the records of the totaling result database 16, in the “search expression” field, a record that includes some search word w in addition to all of such “preceding search words” (hereinafter, referred to as “specific record”) .) Are extracted (FIG. 2 (2)).
[0035]
(C) The following values relating to these “specific records” are calculated (FIG. 2 (3)).
・ The average value m of the “Number of users” field of all “Specific records”a + 1
The standard deviation k of the values in these "number of users" fieldsa + 1
(D) Based on the following procedure, the priority of each of these "specific records" is calculated (FIG. 2 (4)).
[0036]
{Circle around (1)} The value n of the “number of users” field of the corresponding “specific record”awSee
(2) This value naw, The average value m described abovea + 1  And standard deviation ka + 1  , The number of users (= naw) ”Is larger, the priority v is larger.awIs calculated.
[0037]
vaw= (Naw-Ma + 1) / Ka + 1
(E) such priority vawIs selected (FIG. 2 (5)).
(F) Among the search terms stored in the “search expression field” of the single “specific record”, a single search term that does not correspond to any of the “preceding search terms” (hereinafter “additional search”) (For the sake of simplicity, it is assumed that it is different from any of the "preceding search words") (FIG. 2 (6)).
[0038]
(G) A request for “refine search” or “retrieval of search” by applying this “additional search word” is given to the search engine (FIG. 2 (7)).
In other words, at the time of “narrow search” or “retrieval of search”, a search term that has been applied with the “preceding search term” in advance is automatically applied as “additional search term”. Is done.
[0039]
Therefore, according to the present embodiment, words that are applied by a large number of users and that indicate a topic with high topicality can be efficiently used by the user without recalling “additional search words”. Retry.
In the present embodiment, the “specific record” includes any search word w in the “search expression” field in addition to all of the above-mentioned “preceding search words” in the records of the aggregation result database 16. It has been extracted as a record.
[0040]
However, such a “specific record” is replaced with a “preceding search word string” composed of all of the above “preceding search words”. For example, all or a part of these “preceding search words” is as follows: By applying one or a plurality of “alternative preceding search word strings” generated by being replaced by any word (may be obtained by referring to a concept dictionary or the like), various forms are obtained. Efficiency and optimization may be achieved in conjunction with the realization of “narrow search” and “retrieval of search”.
[0041]
・ Synonyms
・ Antonym
・ Superordinate terms
・ Subordinate terms
Further, in the present embodiment, among the search terms stored in the “search expression field” of the “specific record” having the highest priority, a simple search term that does not correspond to any of the “preceding search terms” is simply used. One search word has been acquired as an “additional search word”.
[0042]
However, such an “additional search word” is, for example, similar to the process of generating the “alternative preceding search word string” described above, and is a synonym, antonym, or superordinate concept acquired under reference to a concept dictionary or the like. By being replaced with words, sub-concept words, etc., efficiency and optimization may be achieved along with the realization of “narrow search” and “retrieval of search” in various forms.
[0043]
Furthermore, in the present embodiment, both the calculation of the priority described above and the acquisition of the additional search term are performed by referring to all the records of the aggregation result database 16.
However, one or all of these processes may be performed, for example, by referring to only the records that satisfy all or a part of the following conditions among the records of the tally result database 16.
[0044]
・ The value of the “use count” field exceeds a predetermined upper limit.
-The value in the "Number of users" field exceeds a predetermined upper limit.
-The search term is included in the "search formula" field as a predetermined permutation.
If the attribute of “records to be referred to in the course of such processing among the records of the aggregation result database 16” is not defined under the above conditions, for example, the aggregation processing for generating the aggregation result database 16 is performed. May be performed in all or some of the following forms.
[0045]
The time at which the search was performed (indicated by the value of the “search time” field of the search log database 15) belongs to a desired period or time zone.
The user who has issued the search request (indicated by the value of the "user identifier" field of the search log database 15) is based on the desired attribute (the form of the contract with the user, the information passed from the user as a cookie, etc.) Specified).
[0046]
Further, in the present embodiment, each record of the search log database 15 includes only a “search time” field, a “search formula” field, and a “user identifier” field.
However, for example, when the number of users should be aggregated, such a record includes information such as a cookie delivered from each user along with a “user identifier” used for identifying the user. It may be.
[0047]
Further, in the present embodiment, each record of the tally result database 16 includes only a “search formula” field, a “number of uses” field, and a “number of users” field.
However, such a record may include, for example, only one of “the number of uses” and “the number of users”.
[0048]
Further, in the present embodiment, the tally result database 16 is generated by performing the above-described tally processing on all records of the search log database 15.
However, such a totaling process may be performed only on the records in which the value of the “search time” field belongs to a desired period, or as shown in FIG. May be individually obtained for a plurality of periods identified based on
[0049]
FIG. 5 is an operation flowchart of the second embodiment of the present invention.
Hereinafter, the operation of the second embodiment of the present invention will be described with reference to FIGS.
The feature of the present embodiment lies in the following processing procedure performed by the processor 11.
The processor 11 extracts all “specific records” based on the same procedure as in the first embodiment described above, and further performs the following processing.
[0050]
(A) The extracted “specific record” is notified to the user via the display 12 as one of the following forms (FIG. 5 (1)).
-A form showing a row of values of the "search formula" field of all "specific records" (a search term corresponding to the "preceding search term" may be excluded or indicated by a specific display attribute).
・ Priority v as described aboveawIn the descending order, the values of the “search expression” field of all “specific records” (the search words corresponding to “preceding search words” may be excluded or may be indicated by specific display attributes) are sorted. , Or a form generated by merging
(B) Under a predetermined man-machine interface (for example, it may be a “graphics user interface” realized via the mouse 14 instead of the keyboard 13), such a form included in such a form The selection of the value of the "search formula" field is realized (FIG. 5 (2)).
[0051]
(C) A request for “narrow search” (or “retrieval of search”) by applying “additional search terms” included in the value of the selected “search expression” field is given to the search engine (FIG. 5). (3)).
That is, the “additional search word” is the priority vawIs simply not the word contained in the “search formula” field of the “specific record” that is the largest, but is set to a word that flexibly adapts to the user's judgment and intention.
[0052]
Therefore, according to the present embodiment, the degree of freedom of “narrow search” and “retrieval of search” is increased, and adaptation to various fields is possible.
In each of the above-described embodiments, both the search log database 15 and the aggregation result database 16 are arranged in a predetermined storage area of the external storage device accessed by the processor 11.
[0053]
However, the present invention is not limited to such a configuration, and either or both of the search log database 15 and the aggregation result database 16 are arranged in a predetermined storage area of the main storage of the processor 11, for example. Alternatively, it may be configured as a database accessible via a LAN or the Internet.
Further, in each of the embodiments described above, the substance of the database engine is not disclosed in detail.
[0054]
However, such a database engine is not a feature of the present invention and can be realized by applying various technologies, and furthermore, a database engine accessible via a local area network, the Internet or other communication networks. Instead, for example, software that is directly executed by the processor 11 may be used.
[0055]
In each of the above-described embodiments, the above-described man-machine interface is realized via the display 12, the keyboard 13, and the mouse 14 provided as input / output devices of the processor 11.
However, such a man-machine interface is, for example, an information processing device (not limited to a personal computer or a workstation, but a PDA (Personal Digital Assistants)) capable of accessing the processor 11 via the Internet or other communication networks. May be realized via an input / output device provided in the system.
[0056]
Furthermore, each embodiment described above is configured as software executed by the processor 11.
However, the present invention is not limited to such a configuration, and all or a part of the above-described processing may be performed by dedicated hardware.
Further, the present invention is not limited to the above-described embodiment, and in the contrary to the present invention, various embodiments are possible, and some or all of the constituent devices are improved. May be.
[0057]
【The invention's effect】
As described above, according to the first and ninth aspects of the present invention, a search word to be applied to “narrow search” or “retrieval of search” is a large number of search words even if the user cannot recall it. Words that are applied by the user and that indicate things with high topicality are set smoothly.
Further, according to the second, third, seventh, and tenth aspects of the present invention, the efficiency and optimization of the “narrowed search” and the “retrieval of the search” to be performed subsequently are achieved.
[0058]
Further, according to the inventions described in claims 4, 5, 11, and 12, the degree of freedom of “narrow search” or “retrieval of search” to be performed subsequently can be increased, and adaptation to various fields is possible. Become.
According to the invention described in claim 6, convenience is enhanced in addition to operability.
Further, according to the invention described in claim 8, selection of a single search word to be applied at the time of “refining search” or “retrieval of search” or a man-machine interface related to the selection is performed based on a certain standard. Done.
[0059]
Further, a computer that executes the program described in claim 13 is a component of the additional search term acquisition device described in any one of claims 1 to 8.
Further, a computer that reads and executes the above-described program from the recording medium according to claim 14 is a component of the additional search term acquisition device according to any one of claims 1 to 8.
[0060]
Therefore, in the database system and the information retrieval system to which these inventions are applied, retrieval of highly topical information is realized accurately and quickly, and performance and added value are enhanced.
[Brief description of the drawings]
FIG. 1 is a diagram showing first and second embodiments of the present invention.
FIG. 2 is an operation flowchart of the first embodiment of the present invention.
FIG. 3 is a diagram showing a configuration of a search log.
FIG. 4 is a diagram showing a configuration of a tally result.
FIG. 5 is an operation flowchart of a second embodiment of the present invention.
[Explanation of symbols]
11 processor
12 Display
13 Keyboard
14 mouse
15 Search log database
16 Count Result Database

Claims (14)

検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出する抽出手段と、
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する検索語取得手段と
を備えたことを特徴とする追加検索語取得装置。
Extracting means for extracting a record including a single search term different from any of these search terms, along with all of the desired search terms, among search logs generated by the search engine;
A search term acquisition unit that acquires a single search term included in the extracted records in descending order of priority of these records;
所望の検索語を個別に関連する語の集合に変換する検索語変換手段と、
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出する抽出手段と、
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する検索語取得手段と
を備えたことを特徴とする追加検索語取得装置。
Search word conversion means for converting a desired search word into a set of individually related words;
A record including a search term including a single search term different from any of these terms, in addition to any of the terms individually related to all of the desired search terms in a search log generated by a search engine. Extraction means for extracting
A search term acquisition unit that acquires a single search term included in the extracted records in descending order of priority of these records;
請求項1または請求項2に記載の追加検索語取得装置において、
前記取得された単一の検索語をその単一の検索語に関連する語の集合に拡張する検索語拡張手段を備えた
ことを特徴とする追加検索語取得装置。
The additional search term acquisition device according to claim 1 or 2,
An additional search term acquisition device, comprising: a search term extension unit for extending the acquired single search term into a set of terms related to the single search term.
検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出する抽出手段と、
前記抽出されたレコードに個別に含まれる単一の検索語を取得する検索語取得手段と、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する検索語候補通知手段と、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとるマンマシンインタフェース手段と
を備えたことを特徴とする追加検索語取得装置。
Extracting means for extracting a record including a single search term different from any of these search terms, along with all of the desired search terms, among search logs generated by the search engine;
Search term acquisition means for acquiring a single search term individually included in the extracted record,
A search term candidate notifying unit that notifies the operator of the obtained single search term and / or a term related to the single search term;
An additional search word acquisition device, comprising: a man-machine interface unit that takes a man-machine interface for selecting one of the search word and the word notified to the operator.
所望の検索語を個別に関連する語の集合に変換する検索語変換手段と、
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含むレコードを抽出する抽出手段と、
前記抽出されたレコードに個別に含まれる単一の検索語を取得する検索語取得手段と、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する検索語候補通知手段と、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとるマンマシンインタフェース手段と
を備えたことを特徴とする追加検索語取得装置。
Search word conversion means for converting a desired search word into a set of individually related words;
Extraction of extracting, from a search log generated by a search engine, a record including a single search term different from any of these terms, along with any term individually related to all of the desired search terms. Means,
Search term acquisition means for acquiring a single search term individually included in the extracted record,
A search term candidate notifying unit that notifies the operator of the obtained single search term and / or a term related to the single search term;
An additional search word acquisition device, comprising: a man-machine interface unit that takes a man-machine interface for selecting one of the search word and the word notified to the operator.
請求項4または請求項5に記載の追加検索語取得装置において、
前記検索語取得手段は、
前記抽出されたレコードの優先度の降順にこれらのレコードに個別に含まれる単一の検索語を取得し、
前記検索語候補通知手段は、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を前記優先度の降順に前記操作者に通知する
ことを特徴とする追加検索語取得装置。
The additional search term acquisition device according to claim 4 or claim 5,
The search term acquisition means,
Obtain a single search term individually contained in these records in descending order of priority of the extracted records,
The search word candidate notifying means,
And (b) notifying the operator of at least one of the obtained single search word and a word related to the single search word in descending order of the priority. apparatus.
請求項4ないし請求項6の何れか1項に記載の追加検索語取得装置において、
前記選択された単一の検索語をその単一の検索語に関連する語の集合に拡張する検索語拡張手段を備えた
ことを特徴とする追加検索語取得装置。
The additional search term acquisition device according to any one of claims 4 to 6,
An additional search term acquisition device, comprising: a search term expansion unit for expanding the selected single search term into a set of terms related to the single search term.
請求項1〜3、6の何れか1項に記載の追加検索語取得装置において、
前記優先度は、
前記抽出されたレコードの属性毎に付与される
ことを特徴とする追加検索語取得装置。
The additional search term acquisition device according to any one of claims 1 to 3,
The priority is
An additional search term acquisition device, which is provided for each attribute of the extracted record.
検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出し、
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する
ことを特徴とする追加検索語取得方法。
In the search log generated by the search engine, along with all the desired search terms, a record including a single search term different from any of these search terms is extracted,
A method for acquiring an additional search term, wherein a single search term included in the extracted records in descending order of priority of these records is acquired.
所望の検索語を個別に関連する語の集合に変換し、
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出し、
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する
ことを特徴とする追加検索語取得方法。
Convert the desired search terms into a set of individually related terms,
A record including a search term including a single search term different from any of these terms, in addition to any of the terms individually related to all of the desired search terms in a search log generated by a search engine. Extract
A method for acquiring an additional search term, wherein a single search term included in the extracted records in descending order of priority of these records is acquired.
検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出し、
前記抽出されたレコードに個別に含まれる単一の検索語を取得し、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知し、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる
ことを特徴とする追加検索語取得方法。
In the search log generated by the search engine, along with all the desired search terms, a record including a single search term different from any of these search terms is extracted,
Obtaining a single search term individually included in the extracted record,
Notifying the operator of the obtained single search word and / or a word related to the single search word,
A method for acquiring an additional search word, wherein a man-machine interface for selecting either the search word or the word notified to the operator is used.
所望の検索語を個別に関連する語の集合に変換し、
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出し、
前記抽出されたレコードに個別に含まれる単一の検索語を取得し、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知し、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる
ことを特徴とする追加検索語取得方法。
Convert the desired search terms into a set of individually related terms,
A record including a search term including a single search term different from any of these terms, in addition to any of the terms individually related to all of the desired search terms in a search log generated by a search engine. Extract
Obtaining a single search term individually included in the extracted record,
Notifying the operator of the obtained single search word and / or a word related to the single search word,
A method for acquiring an additional search word, wherein a man-machine interface for selecting either the search word or the word notified to the operator is used.
請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置を構成する抽出手段、検索語取得手段、検索語変換手段、検索語拡張手段、検索語候補通知手段およびマンマシンインタフェース手段の全てもしくは一部として、コンピュータを機能させるためのプログラム。An extraction unit, a search word acquisition unit, a search word conversion unit, a search word expansion unit, a search word candidate notification unit, and a man-machine interface that constitute the additional search word acquisition device according to any one of claims 1 to 8. A program that causes a computer to function as all or part of the means. 請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置を構成する抽出手段、検索語取得手段、検索語変換手段、検索語拡張手段、検索語候補通知手段およびマンマシンインタフェース手段の全てもしくは一部として、コンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。An extraction unit, a search word acquisition unit, a search word conversion unit, a search word expansion unit, a search word candidate notification unit, and a man-machine interface that constitute the additional search word acquisition device according to any one of claims 1 to 8. A computer-readable recording medium that records a program for causing a computer to function as all or a part of the means.
JP2003131254A 2003-05-09 2003-05-09 Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored Pending JP2004334638A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003131254A JP2004334638A (en) 2003-05-09 2003-05-09 Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003131254A JP2004334638A (en) 2003-05-09 2003-05-09 Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored

Publications (1)

Publication Number Publication Date
JP2004334638A true JP2004334638A (en) 2004-11-25

Family

ID=33506483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003131254A Pending JP2004334638A (en) 2003-05-09 2003-05-09 Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored

Country Status (1)

Country Link
JP (1) JP2004334638A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075898A1 (en) * 2005-01-13 2006-07-20 Nhn Corporation Method and system for managing various kinds of keywords by interworking the keywords depending on user authentication
JP2006285460A (en) * 2005-03-31 2006-10-19 Konica Minolta Holdings Inc Information search system
JP2009505221A (en) * 2005-08-11 2009-02-05 アマゾン テクノロジーズ インコーポレーテッド A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior
KR100884889B1 (en) 2007-03-26 2009-02-23 엔에이치엔(주) Method and system for adding automatic indexing word to search database
JP2010067011A (en) * 2008-09-11 2010-03-25 Fujitsu Ltd Method and device for detecting document group
JP2012048592A (en) * 2010-08-30 2012-03-08 Hitachi Solutions Ltd File retrieval system having automatic index generation device for retrieval
JP5452704B1 (en) * 2012-12-28 2014-03-26 ヤフー株式会社 Query template acquisition device, query template acquisition method, and program
JP2016038667A (en) * 2014-08-06 2016-03-22 日本電信電話株式会社 Information provision device, information provision method and information provision program
WO2016147401A1 (en) * 2015-03-19 2016-09-22 株式会社 東芝 Classification device, method, and program
JP6124489B1 (en) * 2016-08-01 2017-05-10 ヤフー株式会社 Query providing apparatus, query providing method, and query providing program

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075898A1 (en) * 2005-01-13 2006-07-20 Nhn Corporation Method and system for managing various kinds of keywords by interworking the keywords depending on user authentication
JP2006285460A (en) * 2005-03-31 2006-10-19 Konica Minolta Holdings Inc Information search system
JP2009505221A (en) * 2005-08-11 2009-02-05 アマゾン テクノロジーズ インコーポレーテッド A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior
JP4866421B2 (en) * 2005-08-11 2012-02-01 アマゾン テクノロジーズ インコーポレーテッド A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior
KR100884889B1 (en) 2007-03-26 2009-02-23 엔에이치엔(주) Method and system for adding automatic indexing word to search database
JP2010067011A (en) * 2008-09-11 2010-03-25 Fujitsu Ltd Method and device for detecting document group
JP2012048592A (en) * 2010-08-30 2012-03-08 Hitachi Solutions Ltd File retrieval system having automatic index generation device for retrieval
JP5452704B1 (en) * 2012-12-28 2014-03-26 ヤフー株式会社 Query template acquisition device, query template acquisition method, and program
JP2016038667A (en) * 2014-08-06 2016-03-22 日本電信電話株式会社 Information provision device, information provision method and information provision program
WO2016147401A1 (en) * 2015-03-19 2016-09-22 株式会社 東芝 Classification device, method, and program
JPWO2016147401A1 (en) * 2015-03-19 2017-06-08 株式会社東芝 Classification apparatus, method and program
US11163812B2 (en) 2015-03-19 2021-11-02 Kabushiki Kaisha Toshiba Classification apparatus and classification method
JP6124489B1 (en) * 2016-08-01 2017-05-10 ヤフー株式会社 Query providing apparatus, query providing method, and query providing program
JP2018022214A (en) * 2016-08-01 2018-02-08 ヤフー株式会社 Query providing device, query providing method and query providing program

Similar Documents

Publication Publication Date Title
US10956472B2 (en) Dynamic load balancing based on question difficulty
KR100745483B1 (en) Data store for knowledge-based data mining system
US6473752B1 (en) Method and system for locating documents based on previously accessed documents
KR101443475B1 (en) Search suggestion clustering and presentation
EP2159715B1 (en) System and method for providing a topic-directed search
US8965894B2 (en) Automated web page classification
US20100023509A1 (en) Protecting information in search queries
WO2007001128A1 (en) Method and system for determining relation between search terms in the internet search system
JP2007519111A (en) Method, system, and program for processing anchor text
US20150356456A1 (en) Real-Time or Frequent Ingestion by Running Pipeline in Order of Effectiveness
TW201027375A (en) Search system, search method and program
JP4049317B2 (en) Search support apparatus and program
JP2004334638A (en) Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored
JPH10240766A (en) Information retrieval method and device therefor
US9552415B2 (en) Category classification processing device and method
KR20130076684A (en) Multi-document summarization method and system using semmantic analysis between tegs
JP2006178599A (en) Document retrieval device and method
Kim et al. Design of question answering system with automated question generation
Aknouche et al. Integrating query context and user context in an information retrieval model based on expanded language modeling
Li et al. Complex query recognition based on dynamic learning mechanism
JP2003271648A (en) Retrieval device, retrieval method, and program
Jabal et al. Provenance-based scientific workflow search
TW201822031A (en) Method of creating chart index with text information and its computer program product capable of generating a virtual chart message catalog and schema index information to facilitate data searching
Akritidis et al. Computing scientometrics in large-scale academic search engines with mapreduce
US20230359658A1 (en) Business matching support device, business matching support method, and program