JP2004334638A - Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored - Google Patents
Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored Download PDFInfo
- Publication number
- JP2004334638A JP2004334638A JP2003131254A JP2003131254A JP2004334638A JP 2004334638 A JP2004334638 A JP 2004334638A JP 2003131254 A JP2003131254 A JP 2003131254A JP 2003131254 A JP2003131254 A JP 2003131254A JP 2004334638 A JP2004334638 A JP 2004334638A
- Authority
- JP
- Japan
- Prior art keywords
- search
- word
- search term
- term
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、検索エンジンによって生成された検索ログを解析することにより、後続して行われる検索の際に追加されるべき検索語を取得する追加検索語取得装置、追加検索語取得方法、これらの装置や方法を実現するプログラムおよびそのプログラムが記憶された記録媒体に関する。
【0002】
【従来の技術】
検索エンジンは、文書等が蓄積されたデータベースにアクセスし、ユーザによって指定された検索式に合致する文書、あるいはその文書に関する情報を提供する。
また、このような検索式は、「ニュース」のような単一の語だけではなく、例えば、「ニュース経済」のように複数の語を含む論理式として与えられる。
さらに、インタネット等を介して検索サービスを提供する検索サイトでは、上記の複数の語は、一般に、検索式『「ニュース」AND「経済」』として識別され、その検索式に基づく検索の結果として、「ニュース」と「経済」との双方に関係する文書等が提供される。
【0003】
また、上述した検索エンジンや検索サイトの利用の過程では、先行して得られた検索の結果が多数に亘る場合には、その検索の結果は、ユーザによって追加された新たな語(以下、「追加検索語」という。)を併せて含む文書等の集合に順次絞り込まれる。
【特許文献1】
特開平9−218881号公報(要約、請求項1)
【0004】
【発明が解決しようとする課題】
ところで、上述した従来例では、検索結果の絞り込みに際して適用されるべき追加検索語は、その絞り込みを意図するユーザによって適宜指定されなければならない。
したがって、絞り込みの方針が確定、その方針に適合した追加検索語がこのユーザによって想起される場合には、効率的に、かつ円滑に「絞り込み検索」が実現される。
【0005】
しかし、例えば、「絞り込み検索」が行われるべき時点において話題性が高い事物にかかわる情報が効率的に検索されるべき場合には、適切な追加検索語の想起は、ユーザにとって必ずしも容易ではなく、かつ困難である場合が多かった。
なお、本願発明に関連した先行技術としては、例えば、特開平10−320419号公報に掲載されるように、検索エンジンによって生成された検索ログ(実績として検索式、その検索式が入力された時点(日時)、この検索式に含まれる検索語を入力したユーザの識別情報やクッキーなどの情報が含まれる。)が参照され、「ユーザ毎に、検索語が入力された時刻の最小の差」が小さいほど、検索式に含まれる検索語の間における関連度が大きく評価される技術がある。
【0006】
しかし、この先行技術では、入力された時刻の差が小さい2つの検索語は、実体的には関連性がないにもかかわらず関連づけられる。
したがって、これらの検索語の内、遅れて入力された検索語は、追加検索語として識別されるとは限らなかった。また、このような先行技術は、2つの検索語の間における関連性の程度を算出することはできても、先行して指定された2つの検索語に追加されるべき追加検索語を求めることは本質的にできなかった。
【0007】
本発明の目的は、「絞り込み検索」等に適用されるべき追加検索語として、話題性が高い事物にかかわる語を効率的に適用可能な追加検索語取得装置、追加検索語取得方法、プログラムおよび記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
請求項1に記載の発明では、抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する。
すなわち、このような単一の検索語は、ユーザによって適宜指定されなくても、検索エンジンが実際に先行して行った検索に適用された検索語の内、上述した優先度が高い検索語に自動的に選定される。
【0009】
したがって、「絞り込み検索」や「検索の再試行」に適用されるべき検索語は、ユーザが想起できない場合であっても、先行して多数のユーザによって適用され、かつ話題性が高い事物を示す語に円滑に設定される。
請求項2に記載の発明では、検索語変換手段は、所望の検索語を個別に関連する語の集合に変換する。抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する。
【0010】
すなわち、このような単一の検索語は、検索ログの内、『単に「上述した所望の検索語の全て」に併せて、何らかの単一の語を含むレコード』から取得される場合に比べて、先行して行われた類似の検索の結果が広範に反映されたレコードから取得される。
したがって、このような単一の検索語が適用されて行われるべき「絞り込み検索」や「検索の再試行」の効率化や最適化が図られる。
【0011】
請求項3に記載の発明では、検索語拡張手段は、取得された単一の検索語をその単一の検索語に関連する語の集合に拡張する。
すなわち、このような単一の検索語は、その単一の検索語が単に「絞り込み検索」や「検索の再試行」に適用される場合に比べて、これらの「絞り込み検索」や「検索の再試行」に有効に活用される。
【0012】
したがって、「絞り込み検索」や「検索の再試行」の効率化や最適化が可能となる。
請求項4に記載の発明では、抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに併せて、これらの検索語の何れとも異なる単一の検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードに個別に含まれる単一の検索語を取得する。検索語候補通知手段は、取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する。マンマシンインタフェース手段は、操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる。
【0013】
すなわち、上述した単一の検索語は、既述の優先度が単に高いレコードに含まれる検索語だけではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
したがって、請求項1に記載の発明に比べて、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
【0014】
請求項5に記載の発明では、検索語変換手段は、所望の検索語を個別に関連する語の集合に変換する。抽出手段は、検索エンジンによって生成された検索ログの内、所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含むレコードを抽出する。検索語取得手段は、抽出されたレコードに個別に含まれる単一の検索語を取得する。検索語候補通知手段は、取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する。マンマシンインタフェース手段は、操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる。
【0015】
すなわち、上述した単一の検索語は、既述の優先度が単に高いレコードに含まれる検索語だけではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
したがって、請求項2に記載の発明に比べて、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
【0016】
請求項6に記載の発明では、検索語取得手段は、抽出されたレコードの優先度の降順にこれらのレコードに個別に含まれる単一の検索語を取得する。検索語候補通知手段は、取得された単一の検索語と、その単一の検索語に関連する語の集合との双方もしくは何れか一方を優先度の降順に操作者に通知する。
すなわち、上述した単一の検索語の選択にかかわるマンマシンインタフェースは、その単一の検索語の候補が既述の優先度に何ら対応付けられることなくユーザに通知される場合に比べて、効率的に、かつ確度高く実現される。
【0017】
したがって、操作性に併せて、利便性が高められる。
請求項7に記載の発明では、検索語拡張手段は、選択された単一の検索語をその単一の検索語に関連する語の集合に拡張する。
すなわち、このような単一の検索語は、その単一の検索語が単に「絞り込み検索」や「検索の再試行」に適用される場合に比べて、これらの「絞り込み検索」や「検索の再試行」に有効に活用される。
【0018】
したがって、「絞り込み検索」や「検索の再試行」の効率化や最適化が可能となる。
請求項8に記載の発明では、優先度は、抽出されたレコードの属性毎に付与される。
すなわち、検索ログから抽出された何れのレコードに関しても、上述した属性の識別が可能である限り、その属性に対応した所望の優先度の順に単一の検索語が選択され、あるいはその単一の検索語の候補がユーザに通知される。
【0019】
したがって、「絞り込み検索」や「検索の再試行」に際して適用されるべき単一の検索語の選定またはその選定にかかわるマンマシンインタフェースは、確実な基準に基づいて行われる。
請求項9に記載の発明では、単一の検索語は、ユーザによって適宜指定されなくても、請求項1に記載の発明と同様に、検索エンジンが実際に先行して行った検索に適用された検索語の内、上述した優先度が高い検索語に自動的に選定される。
【0020】
したがって、「絞り込み検索」や「検索の再試行」に適用されるべき検索語は、ユーザが想起できない場合であっても、先行して多数のユーザによって適用され、かつ話題性が高い事物を示す語に円滑に設定される。
請求項10に記載の発明では、請求項2に記載の発明と同様に、先行して検索演算によって行われた類似の検索の結果が広範に反映されたレコードから取得される。
【0021】
したがって、このような単一の検索語が適用されて行われるべき「絞り込み検索」や「検索の再試行」の効率化や最適化が図られる。
請求項11に記載の発明では、単一の検索語は、請求項4に記載の発明と同様に、既述の優先度が単に高いレコードに含まれる検索語ではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
【0022】
したがって、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
請求項12に記載の発明では、単一の検索語は、請求項5に記載の発明と同様に、既述の優先度が単に高いレコードに含まれる検索語ではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
【0023】
したがって、このような単一の検索語が適用されるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
請求項13に記載のプログラムは、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置を構成する抽出手段、検索語取得手段、検索語変換手段、検索語拡張手段、検索語候補通知手段およびマンマシンインタフェース手段の全てもしくは一部として、コンピュータを機能させる。
【0024】
したがって、本発明にかかわるプログラムを実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載された追加検索語取得装置の構成要素となる。
請求項14に記載の記録媒体は、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置を構成する抽出手段、検索語取得手段、検索語変換手段、検索語拡張手段、検索語候補通知手段およびマンマシンインタフェース手段の全てもしくは一部として、コンピュータを機能させるためのプログラムが記録され、かつコンピュータ読み取り可能である。
【0025】
このようなプログラムは、上述したコンピュータによって実行されるべきソフトウエアまたはそのコンピュータに組み込まれたマイクロプログラムとして構成され、このようなコンピュータとは別体の着脱可能な記録媒体に記録されることによって流通し得る。
したがって、本発明にかかわる記録媒体からこのようなプログラムを読み取って実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置の構成要素となる。
【0026】
【発明の実施の形態】
以下、図面に基づいて本発明の実施形態について詳細に説明する。
図1は、本発明の第一および第二の実施形態を示す図である。
図において、プロセッサ11には、マンマシンインタフェースに供されるディスプレイ12、キーボード13およびマウス14が接続され、そのプロセッサ11の外部記憶上に後述する検索ログデータベース15と集計結果データベース16とが備えられる。
【0027】
図2は、本発明の第一の実施形態の動作フローチャートである。
以下、図1および図2を参照して本発明の第一の実施形態の動作を説明する。
検索ログデータベース15は、先行して与えられた検索語(検索式)に応じて検索エンジンによって記録され、例えば、図3に示すように、下記の各フィールドからなるレコードの列として構成される。
【0028】
・ 検索語や検索式が与えられた時刻が格納された「検索時刻」フィールド
・ その検索語(あるいはこの検索語を含む検索式)が格納された「検索式」フィールド
・ このような検索語(検索式)を示す検索の要求を発したユーザを示す「ユーザ識別子」フィールド
集計結果データベース16は、例えば、図4(a) に示すように、下記の各フィールドからなるレコードの列として構成される。
【0029】
・ 上記の検索式に含まれる検索語の列が格納される「検索式」フィールド
・ 検索エンジンの起動(検索の要求)がその検索式に基づいて行われた回数の総和が格納される「利用回数」フィールド
・ 該当する検索式に基づいて検索エンジンを起動した(検索の要求を発した)ユーザの人数が格納される「利用人数」フィールド
プロセッサ11は、ディスプレイ12、キーボード13およびマウス14を介してマンマシンインタフェースをとり、そのマンマシンインタフェースの下でユーザによって与えられた検索の要求(単一または複数の検索語を含む)を識別すると、下記の処理を行う。
【0030】
・ 検索の要求に含まれる検索語を含む検索式を生成する。
・ その検索式を検索エンジンに与えることによって、検索処理を起動する。
・ その検索処理の結果として与えられた情報の集合に併せて、この検索処理の形態を示す既述の「検索時刻」、「検索式」および「ユーザ識別子」からなるレコードを検索ログデータベース15に付加する。
【0031】
また、プロセッサ11は、上述したマンマシンインタフェースの下で検索ログの集計処理が行われるべき期間および契機が与えられると、下記の手順に基づいてその集計処理を行う。
(1) 検索ログデータベース15のレコードの内、「検索時刻」フィールドの値で示される時刻が上記の期間に属するレコードを全て抽出する。
【0032】
(2) これらの抽出されたレコードに含まれる個々の「検索式」について、下記の処理を行う。
▲1▼ 該当する「検索式」が「検索式」フィールドに格納されているレコードの総数として既述の「利用回数」を求める。
▲2▼ 該当する「検索式」と共に検索ログデータベース15の「ユーザ識別子」フィールドに格納されているユニークな「ユーザ識別子」の総数として既述の「利用人数」を求める。
【0033】
▲3▼ 該当する「検索式」に併せて、このようにして求められた「利用回数」および「利用人数」からなるレコードを集計結果データベース16に付加する。
さらに、プロセッサ11は、検索ログデータベース15に含まれる全ての有効なレコードについて上述した処理を完結した後には、既述のマンマシンインタフェースの下で与えられた新たな検索の要求に応じて下記の処理を行う。
【0034】
(a) 該当する新たな検索の要求に含まれる単一または複数の検索語(以下、単に、「先行検索語」という。)の全て(以下、簡単のため、識別子「a」で表記する。)を取得する(図2(1))。
(b) 集計結果データベース16のレコードの内、「検索式」フィールドに、このような「先行検索語」の全てに併せて、何らかの検索語wが含まれるレコード(以下、「特定のレコード」という。)の全てを抽出する(図2(2))。
【0035】
(c) これらの「特定のレコード」にかかわる下記の値を算出する(図2(3))。
・ 全ての「特定のレコード」の「利用人数」フィールドの値の平均値ma+1
・ これらの「利用人数」フィールドの値の標準偏差ka+1
(d) 以下の手順に基づいて、これらの「特定のレコード」の個々の優先度を算出する(図2(4))。
【0036】
▲1▼ 該当する「特定のレコード」の「利用人数」フィールドの値nawを参照する。
▲2▼ この値naw、既述の平均値ma+1 および標準偏差ka+1 に対して、下式で示されるように、「利用人数(=naw)」が大きいほど大きな値となる優先度vawを算出する。
【0037】
vaw=(naw−ma+1)/ka+1
(e) このような優先度vawが最大である単一の「特定のレコード」を選定する(図2(5))。
(f) その単一の「特定のレコード」の「検索式フィールド」に格納されている検索語の内、「先行検索語」の何れにも該当しない単一の検索語(以下、「追加検索語」と称し、簡単のため、「先行検索語」の何れとも異なると仮定する。)を取得する(図2(6))。
【0038】
(g) この「追加検索語」を適用することによる「絞り込み検索」、または「検索の再試行」の要求を検索エンジンに与える(図2(7))。
すなわち、「絞り込み検索」や「検索の再試行」が行われる時点には、先行して実際に「先行検索語」と共に適用された回数が大きい検索語が「追加検索語」として自動的に適用される。
【0039】
したがって、本実施形態によれば、ユーザが「追加検索語」を想起することなく、多数のユーザによって適用され、かつ話題性が高い事物を示す語が効率的に「絞り込み検索」や「検索の再試行」に適用される。
なお、本実施形態では、「特定レコード」は、集計結果データベース16のレコードの内、単に既述の「先行検索語」の全てに併せて、何らかの検索語wが「検索式」フィールドに含まれるレコードとして抽出されている。
【0040】
しかし、このような「特定のレコード」は、上述した「先行検索語」の全てからなる「先行検索語列」に代えて、例えば、これらの「先行検索語」の全てまたは一部が下記の何れかの語(概念辞書等の参照によって求められてもよい。)で置換されることによって生成された単一もしくは複数の「代替先行検索語列」が適用されることによって、多様な形態による「絞り込み検索」や「検索の再試行」の実現に併せて、効率化や最適化が図られてもよい。
【0041】
・ 類義語
・ 反意語
・ 上位概念の語
・ 下位概念の語
また、本実施形態では、既述の優先度が最大である「特定のレコード」の「検索式フィールド」に格納されている検索語の内、単に「先行検索語」の何れにも該当しない単一の検索語が「追加検索語」として取得されている。
【0042】
しかし、このような「追加検索語」は、例えば、上述した「代替先行検索語列」が生成される過程と同様に、概念辞書等の参照の下で取得された類義語、反意語、上位概念の語、下位概念の語等々で置換されることによって、多様な形態による「絞り込み検索」や「検索の再試行」の実現に併せて、効率化や最適化が図られてもよい。
【0043】
さらに、本実施形態では、既述の優先度の算出と、追加検索語の取得との何れの処理も、集計結果データベース16の全てのレコードが参照されることによって行われている。
しかし、これらの処理の一方もしくは全ては、例えば、集計結果データベース16のレコードの内、下記の条件の全てまたは一部が成立するレコードのみが参照されることによって行われてもよい。
【0044】
・ 「利用回数」フィールドの値が所定の上限値を超える。
・ 「利用人数」フィールドの値が所定の上限値を超える。
・ 「検索式」フィールドに、検索語が所定の順列として含まれる。
また、「集計結果データベース16のレコードの内、このような処理の過程で参照されるべきレコード」の属性が上記の条件では定義されない場合には、例えば、その集計結果データベース16を生成する集計処理は、下記の形態の全てまたは一部で行われてもよい。
【0045】
・ 検索が行われた時刻(検索ログデータベース15の「検索時刻」フィールドの値で示される。)が所望の期間や時間帯に属する。
・ 検索の要求を発したユーザ(検索ログデータベース15の「ユーザ識別子」フィールドの値で示される。)が所望の属性(ユーザとの契約の形態、そのユーザからクッキー等として引き渡された情報に基づいて特定される。)を有する。
【0046】
さらに、本実施形態では、検索ログデータベース15の各レコードは、「検索時刻」フィールド、「検索式」フィールドおよび「ユーザ識別子」フィールドのみから構成されている。
しかし、例えば、利用人数が集計されるべき場合には、このようなレコードには、ユーザの識別に供される「ユーザ識別子」に併せて、個々のユーザから引き渡されたクッキー等の情報が含まれてもよい。
【0047】
また、本実施形態では、集計結果データベース16の各レコードは、「検索式」フィールド、「利用回数」フィールドおよび「利用人数」フィールドのみから構成されている。
しかし、このようなレコードは、例えば、「利用回数」と「利用人数」との何れか一方のみが含まれて構成されてもよい。
【0048】
さらに、本実施形態では、集計結果データベース16は、検索ログデータベース15の全てのレコードに既述の集計処理が施されることによって生成されている。
しかし、このような集計処理は、「検索時刻」フィールドの値が所望の期間に属するレコードのみに施されてもよく、あるいは図4(b) に示すように、その「検索時刻」フィールドの値に基づいて識別された複数の期間について個別に求められてもよい。
【0049】
図5は、本発明の第二の実施形態の動作フローチャートである。
以下、図1および図5を参照して本発明の第二の実施形態の動作を説明する。
本実施形態の特徴は、プロセッサ11によって行われる下記の処理の手順にある。
プロセッサ11は、既述の第一の実施形態と同様の手順に基づいて「特定のレコード」の全てを抽出し、さらに、下記の処理を行う。
【0050】
(A) ディスプレイ12を介してユーザに、これらの抽出された「特定のレコード」を下記の何れかの帳票として通知する(図5(1))。
・ 全ての「特定のレコード」の「検索式」フィールドの値(「先行検索語」に該当する検索語が除外され、あるいは特定の表示属性で示されてもよい。)の列を示す帳票
・ 既述の優先度vawの降順に、全ての「特定のレコード」の「検索式」フィールドの値(「先行検索語」に該当する検索語が除外され、あるいは特定の表示属性で示されてもよい。)がソーティングされ、またはマージされることによって生成された帳票
(B) 既定のマンマシンインタフェース(例えば、キーボード13だけではなくマウス14を介して実現される「グラヒック・ユーザ・インタフェース」であってもよい。)の下で、このような帳票に含まれる「検索式」フィールドの値の選択を実現する(図5(2))。
【0051】
(C) 選択された「検索式」フィールドの値に含まれる「追加検索語」を適用することによる「絞り込み検索」(または、「検索の再試行」)の要求を検索エンジンに与える(図5(3))。
すなわち、「追加検索語」は、上述した優先度vawが単に最大である「特定のレコード」の「検索式」フィールドに含まれる語ではなく、ユーザの判断や意図に柔軟に適応した語に設定される。
【0052】
したがって、本実施形態によれば、「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
なお、上述した各実施形態では、検索ログデータベース15と集計結果データベース16との双方がプロセッサ11によってアクセスされる外部記憶装置の所定の記憶領域に配置されている。
【0053】
しかし、本発明はこのような構成に限定されず、これらの検索ログデータベース15と集計結果データベース16との双方もしくは何れか一方は、例えば、プロセッサ11の主記憶の所定の記憶領域に配置され、あるいはLANやインタネットを介してアクセス可能なデータベースとして構成されてもよい。
さらに、上述した各実施形態では、データベースエンジンの実体が詳細に開示されていない。
【0054】
しかし、このようなデータベースエンジンは、本願発明の特徴ではなく、かつ多様な技術が適用されることによって実現が可能であり、しかも、ローカルエリアネットワーク、インタネットその他の通信網を介してアクセス可能なデータベースではなく、例えば、プロセッサ11によって直接実行されるソフトウエアであってもよい。
【0055】
また、上述した各実施形態では、既述のマンマシンインタフェースは、プロセッサ11の入出力機器として備えられたディスプレイ12、キーボード13およびマウス14を介して実現されている。
しかし、このようなマンマシンインタフェースは、例えば、インタネットその他の通信網を介してプロセッサ11にアクセスすることが可能な情報処理装置(パソコンやワークステーションに限らず、PDA(Personal Digital Assistants)等であってもよい。)に備えられた入出力装置を介して実現されてもよい。
【0056】
さらに、上述した各実施形態は、プロセッサ11によって実行されるソフトウエアとして構成されている。
しかし、本発明はこのような構成に限定されず、既述の処理の全てまたは一部は、専用のハードウエアによって行われてもよい。
また、本発明は、上述した実施形態に限定されるものではなく、本発明の反意において、多様な形態による実施形態が可能であり、かつ構成装置の一部もしくは全てに如何なる改良が施されてもよい。
【0057】
【発明の効果】
上述したように請求項1、9に記載の発明では、「絞り込み検索」や「検索の再試行」に適用されるべき検索語は、ユーザが想起できない場合であっても、先行して多数のユーザによって適用され、かつ話題性が高い事物を示す語に円滑に設定される。
また、請求項2、3、7、10に記載の発明では、後続して行われるべき「絞り込み検索」や「検索の再試行」の効率化や最適化が図られる。
【0058】
さらに、請求項4、5、11、12に記載の発明では、後続して行われるべき「絞り込み検索」や「検索の再試行」の自由度が高められ、かつ多様な分野に対する適応が可能となる。
また、請求項6に記載の発明では、操作性に併せて、利便性が高められる。
さらに、請求項8に記載の発明では、「絞り込み検索」や「検索の再試行」に際して適用されるべき単一の検索語の選定またはその選定にかかわるマンマシンインタフェースが、確実な基準に基づいて行われる。
【0059】
また、請求項13に記載のプログラムプログラムを実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載された追加検索語取得装置の構成要素となる。
さらに、請求項14に記載の記録媒体から上述したプログラムを読み取ってする実行するコンピュータは、請求項1ないし請求項8の何れか1項に記載の追加検索語取得装置の構成要素となる。
【0060】
したがって、これらの発明が適用されたデータベースシステムおよび情報検索システムでは、話題性が高い情報の検索が的確に、かつ迅速に実現され、性能および付加価値が高められる。
【図面の簡単な説明】
【図1】本発明の第一および第二の実施形態を示す図である。
【図2】本発明の第一の実施形態の動作フローチャートである。
【図3】検索ログの構成を示す図である。
【図4】集計結果の構成を示す図である。
【図5】本発明の第二の実施形態の動作フローチャートである。
【符号の説明】
11 プロセッサ
12 ディスプレイ
13 キーボード
14 マウス
15 検索ログデータベース
16 集計結果データベース[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention analyzes a search log generated by a search engine to obtain a search word to be added in a subsequent search, an additional search word acquisition device, an additional search word acquisition method, The present invention relates to a program realizing an apparatus and a method, and a recording medium storing the program.
[0002]
[Prior art]
The search engine accesses a database in which documents and the like are stored, and provides documents that match the search formula specified by the user or information about the documents.
Such a search expression is given as a logical expression including not only a single word such as “news” but also a plurality of words such as “news economy”.
Further, in a search site that provides a search service via the Internet or the like, the above plurality of words are generally identified as a search expression “news” AND “economic”, and as a result of a search based on the search expression, Documents related to both “news” and “economy” are provided.
[0003]
Further, in the process of using the search engine and the search site described above, if the search result obtained in advance is large, the search result is a new word added by the user (hereinafter, “ ).
[Patent Document 1]
Japanese Patent Application Laid-Open No. 9-218881 (abstract, claim 1)
[0004]
[Problems to be solved by the invention]
By the way, in the above-described conventional example, an additional search word to be applied when narrowing down search results must be appropriately designated by a user who intends to narrow down the search results.
Therefore, when the narrowing-down policy is determined and an additional search word suitable for the narrowing-down policy is recalled by the user, the “narrowing-down search” is efficiently and smoothly realized.
[0005]
However, for example, when information related to a highly topical thing should be efficiently searched at the time when “refinement search” is to be performed, recalling an appropriate additional search word is not always easy for the user, And it was often difficult.
As prior art related to the present invention, for example, as disclosed in Japanese Patent Application Laid-Open No. H10-320419, a search log generated by a search engine (a search expression as an actual result, a time when the search expression is input) (Date and time, and information such as identification information and cookies of the user who input the search term included in this search expression.) Is referred to, and the “minimum difference in the time when the search term was input for each user” is referred to. There is a technique in which the smaller the is, the greater the degree of relevance between search terms included in the search expression is.
[0006]
However, in this prior art, two search terms having a small difference between the input times are related even though they are not physically related.
Therefore, of these search terms, a search term entered late is not always identified as an additional search term. Further, such prior art is capable of calculating a degree of relevance between two search words, but seeking an additional search word to be added to the two previously specified search words. Essentially couldn't.
[0007]
An object of the present invention is to provide an additional search word acquisition device, an additional search word acquisition method, a program, and a program that can efficiently apply words related to a highly topical thing as additional search words to be applied to “refinement search” and the like. It is intended to provide a recording medium.
[0008]
[Means for Solving the Problems]
According to the first aspect of the present invention, the extraction unit includes, in the search log generated by the search engine, a record including a single search term different from any of these search terms in addition to all of the desired search terms. Is extracted. The search term acquiring means acquires a single search term included in the extracted records in descending order of priority of these records.
In other words, such a single search term is not included in the search terms applied to the search that was actually performed earlier by the search engine, and is not included in the search term having the higher priority described above. Selected automatically.
[0009]
Therefore, even if the user cannot recall, the search term to be applied to “refine search” or “retrieval of search” is applied by a large number of users in advance, and indicates a thing with high topicality. Words are set smoothly.
According to the second aspect of the present invention, the search word conversion means converts a desired search word into a set of individually related words. The extraction means includes, in a search log generated by a search engine, a search term including a single search term different from any of these terms, in addition to any of the terms individually associated with all of the desired search terms. Extract records containing. The search term acquiring means acquires a single search term included in the extracted records in descending order of priority of these records.
[0010]
That is, such a single search term is compared with a case in which the search log is obtained from “records including any single word together with“ all of the above-described desired search terms ”in the search log”. , The result of a similar search performed earlier is obtained from a record that is widely reflected.
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” to be performed by applying such a single search word are achieved.
[0011]
According to the third aspect of the present invention, the search term expansion unit expands the obtained single search word into a set of words related to the single search word.
In other words, such a single search term is compared to a case where the single search term is simply applied to “refinement search” or “retrieval of search”. It is effectively used for "retry".
[0012]
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” can be made.
According to the fourth aspect of the present invention, the extraction means includes, in the search log generated by the search engine, a record including a single search term different from any of these search terms in addition to all of the desired search terms. Is extracted. The search term acquisition means acquires a single search term individually included in the extracted record. The search word candidate notifying unit notifies the operator of the acquired single search word and / or a word related to the single search word. The man-machine interface means takes a man-machine interface relating to selection of either the search word or the word notified to the operator.
[0013]
That is, the above-described single search term is set not only to the search term included in the record having the high priority described above, but also to a word flexibly adapted to the user's judgment and intention.
Therefore, as compared with the first aspect of the present invention, the degree of freedom of “narrow search” and “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is performed. Becomes possible.
[0014]
In the invention described in
[0015]
That is, the above-described single search term is set not only to the search term included in the record having the high priority described above, but also to a word flexibly adapted to the user's judgment and intention.
Therefore, as compared with the invention described in
[0016]
According to the invention described in
In other words, the man-machine interface related to the selection of a single search term described above is more efficient than a case where the single search term candidate is notified to the user without being associated with any of the priorities described above. It is realized with high accuracy and accuracy.
[0017]
Therefore, convenience is improved in addition to operability.
In the invention according to
In other words, such a single search term is compared to a case where the single search term is simply applied to “refinement search” or “retrieval of search”. It is effectively used for "retry".
[0018]
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” can be made.
In the invention according to claim 8, the priority is assigned to each attribute of the extracted record.
That is, for any record extracted from the search log, as long as the above-described attribute can be identified, a single search word is selected in the order of desired priority corresponding to the attribute, or the single search word is selected. The user is notified of search word candidates.
[0019]
Therefore, the selection of a single search word to be applied in the “narrowing search” or the “retrieval of the search” or the man-machine interface related to the selection is performed based on reliable criteria.
According to the ninth aspect of the present invention, a single search term is applied to a search actually performed by a search engine in advance, similarly to the first aspect of the invention, even if the single search term is not appropriately designated by a user. Of the search words, the search word having the higher priority is automatically selected.
[0020]
Therefore, even if the user cannot recall, the search term to be applied to “refine search” or “retrieval of search” is applied by a large number of users in advance, and indicates a thing with high topicality. Words are set smoothly.
According to the tenth aspect, similarly to the second aspect, a result of a similar search performed by a search operation in advance is obtained from a record in which the result is widely reflected.
[0021]
Therefore, the efficiency and optimization of “narrow search” and “retrieval of search” to be performed by applying such a single search word are achieved.
In the invention described in claim 11, a single search word is not a search word included in a record having a high priority as described above, but is determined by the user's judgment and intention, similarly to the invention described in
[0022]
Therefore, the degree of freedom of “narrow search” or “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is possible.
In the twelfth aspect of the present invention, a single search term is not a search term contained in a record having a high priority as described above, but is determined by the user's judgment and intention, similarly to the fifth aspect of the invention. Set to a word that is flexibly adapted.
[0023]
Therefore, the degree of freedom of “narrow search” or “retrieval of search” to which such a single search word should be applied is increased, and adaptation to various fields is possible.
A program according to a thirteenth aspect of the present invention provides an additional search term acquisition device according to any one of the first to eighth aspects, wherein the extraction means, the search term acquisition means, the search term conversion means, the search term extension means, The computer is caused to function as all or a part of the search word candidate notification means and the man-machine interface means.
[0024]
Therefore, a computer that executes the program according to the present invention is a component of the additional search term acquisition device according to any one of
A recording medium according to claim 14, wherein an extraction unit, a search word acquisition unit, a search word conversion unit, and a search word expansion unit that constitute the additional search word acquisition device according to any one of
[0025]
Such a program is configured as software to be executed by the above-described computer or a microprogram incorporated in the computer, and is distributed by being recorded on a detachable recording medium separate from such a computer. I can do it.
Therefore, a computer that reads and executes such a program from the recording medium according to the present invention is a component of the additional search term acquisition device according to any one of
[0026]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing first and second embodiments of the present invention.
In the figure, a
[0027]
FIG. 2 is an operation flowchart of the first embodiment of the present invention.
Hereinafter, the operation of the first embodiment of the present invention will be described with reference to FIGS.
The
[0028]
・ "Search time" field that stores the time when the search word or search expression was given
-"Search expression" field in which the search word (or search expression containing this search word) is stored
A “user identifier” field indicating a user who has issued a search request indicating such a search term (search expression)
The
[0029]
・ "Search expression" field that stores the sequence of search terms included in the above search expression
-"Use count" field that stores the total number of times the search engine was started (search request) based on the search formula
・ The "Number of users" field that stores the number of users who have started the search engine (issued a search request) based on the relevant search formula
Processor 11 takes a man-machine interface via
[0030]
-Generate a search expression that includes the search term included in the search request.
-The search process is started by giving the search expression to the search engine.
In addition to the set of information given as a result of the search processing, a record including the above-described “search time”, “search expression”, and “user identifier” indicating the form of the search processing is stored in the
[0031]
Further, when a period and an opportunity to perform the search log tallying process under the man-machine interface described above are given, the processor 11 performs the tallying process based on the following procedure.
(1) From the records of the
[0032]
(2) The following processing is performed for each “search formula” included in these extracted records.
{Circle around (1)} The above-mentioned “number of times of use” is obtained as the total number of records in the “search expression” field corresponding to the “search expression”.
{Circle around (2)} The aforementioned “number of users” is obtained as the total number of unique “user identifiers” stored in the “user identifier” field of the
[0033]
{Circle around (3)} A record including the “number of uses” and “the number of users” obtained in this way is added to the tallying
Further, after completing the above-described processing for all valid records included in the
[0034]
(A) All of the single or plural search words (hereinafter, simply referred to as “preceding search words”) included in the relevant new search request (hereinafter, simply referred to as identifier “a” for simplicity). ) Is obtained (FIG. 2 (1)).
(B) Among the records of the totaling
[0035]
(C) The following values relating to these “specific records” are calculated (FIG. 2 (3)).
・ The average value m of the “Number of users” field of all “Specific records”a + 1
The standard deviation k of the values in these "number of users" fieldsa + 1
(D) Based on the following procedure, the priority of each of these "specific records" is calculated (FIG. 2 (4)).
[0036]
{Circle around (1)} The value n of the “number of users” field of the corresponding “specific record”awSee
(2) This value naw, The average value m described abovea + 1 And standard deviation ka + 1 , The number of users (= naw) ”Is larger, the priority v is larger.awIs calculated.
[0037]
vaw= (Naw-Ma + 1) / Ka + 1
(E) such priority vawIs selected (FIG. 2 (5)).
(F) Among the search terms stored in the “search expression field” of the single “specific record”, a single search term that does not correspond to any of the “preceding search terms” (hereinafter “additional search”) (For the sake of simplicity, it is assumed that it is different from any of the "preceding search words") (FIG. 2 (6)).
[0038]
(G) A request for “refine search” or “retrieval of search” by applying this “additional search word” is given to the search engine (FIG. 2 (7)).
In other words, at the time of “narrow search” or “retrieval of search”, a search term that has been applied with the “preceding search term” in advance is automatically applied as “additional search term”. Is done.
[0039]
Therefore, according to the present embodiment, words that are applied by a large number of users and that indicate a topic with high topicality can be efficiently used by the user without recalling “additional search words”. Retry.
In the present embodiment, the “specific record” includes any search word w in the “search expression” field in addition to all of the above-mentioned “preceding search words” in the records of the
[0040]
However, such a “specific record” is replaced with a “preceding search word string” composed of all of the above “preceding search words”. For example, all or a part of these “preceding search words” is as follows: By applying one or a plurality of “alternative preceding search word strings” generated by being replaced by any word (may be obtained by referring to a concept dictionary or the like), various forms are obtained. Efficiency and optimization may be achieved in conjunction with the realization of “narrow search” and “retrieval of search”.
[0041]
・ Synonyms
・ Antonym
・ Superordinate terms
・ Subordinate terms
Further, in the present embodiment, among the search terms stored in the “search expression field” of the “specific record” having the highest priority, a simple search term that does not correspond to any of the “preceding search terms” is simply used. One search word has been acquired as an “additional search word”.
[0042]
However, such an “additional search word” is, for example, similar to the process of generating the “alternative preceding search word string” described above, and is a synonym, antonym, or superordinate concept acquired under reference to a concept dictionary or the like. By being replaced with words, sub-concept words, etc., efficiency and optimization may be achieved along with the realization of “narrow search” and “retrieval of search” in various forms.
[0043]
Furthermore, in the present embodiment, both the calculation of the priority described above and the acquisition of the additional search term are performed by referring to all the records of the
However, one or all of these processes may be performed, for example, by referring to only the records that satisfy all or a part of the following conditions among the records of the
[0044]
・ The value of the “use count” field exceeds a predetermined upper limit.
-The value in the "Number of users" field exceeds a predetermined upper limit.
-The search term is included in the "search formula" field as a predetermined permutation.
If the attribute of “records to be referred to in the course of such processing among the records of the
[0045]
The time at which the search was performed (indicated by the value of the “search time” field of the search log database 15) belongs to a desired period or time zone.
The user who has issued the search request (indicated by the value of the "user identifier" field of the search log database 15) is based on the desired attribute (the form of the contract with the user, the information passed from the user as a cookie, etc.) Specified).
[0046]
Further, in the present embodiment, each record of the
However, for example, when the number of users should be aggregated, such a record includes information such as a cookie delivered from each user along with a “user identifier” used for identifying the user. It may be.
[0047]
Further, in the present embodiment, each record of the
However, such a record may include, for example, only one of “the number of uses” and “the number of users”.
[0048]
Further, in the present embodiment, the
However, such a totaling process may be performed only on the records in which the value of the “search time” field belongs to a desired period, or as shown in FIG. May be individually obtained for a plurality of periods identified based on
[0049]
FIG. 5 is an operation flowchart of the second embodiment of the present invention.
Hereinafter, the operation of the second embodiment of the present invention will be described with reference to FIGS.
The feature of the present embodiment lies in the following processing procedure performed by the processor 11.
The processor 11 extracts all “specific records” based on the same procedure as in the first embodiment described above, and further performs the following processing.
[0050]
(A) The extracted “specific record” is notified to the user via the
-A form showing a row of values of the "search formula" field of all "specific records" (a search term corresponding to the "preceding search term" may be excluded or indicated by a specific display attribute).
・ Priority v as described aboveawIn the descending order, the values of the “search expression” field of all “specific records” (the search words corresponding to “preceding search words” may be excluded or may be indicated by specific display attributes) are sorted. , Or a form generated by merging
(B) Under a predetermined man-machine interface (for example, it may be a “graphics user interface” realized via the mouse 14 instead of the keyboard 13), such a form included in such a form The selection of the value of the "search formula" field is realized (FIG. 5 (2)).
[0051]
(C) A request for “narrow search” (or “retrieval of search”) by applying “additional search terms” included in the value of the selected “search expression” field is given to the search engine (FIG. 5). (3)).
That is, the “additional search word” is the priority vawIs simply not the word contained in the “search formula” field of the “specific record” that is the largest, but is set to a word that flexibly adapts to the user's judgment and intention.
[0052]
Therefore, according to the present embodiment, the degree of freedom of “narrow search” and “retrieval of search” is increased, and adaptation to various fields is possible.
In each of the above-described embodiments, both the
[0053]
However, the present invention is not limited to such a configuration, and either or both of the
Further, in each of the embodiments described above, the substance of the database engine is not disclosed in detail.
[0054]
However, such a database engine is not a feature of the present invention and can be realized by applying various technologies, and furthermore, a database engine accessible via a local area network, the Internet or other communication networks. Instead, for example, software that is directly executed by the processor 11 may be used.
[0055]
In each of the above-described embodiments, the above-described man-machine interface is realized via the
However, such a man-machine interface is, for example, an information processing device (not limited to a personal computer or a workstation, but a PDA (Personal Digital Assistants)) capable of accessing the processor 11 via the Internet or other communication networks. May be realized via an input / output device provided in the system.
[0056]
Furthermore, each embodiment described above is configured as software executed by the processor 11.
However, the present invention is not limited to such a configuration, and all or a part of the above-described processing may be performed by dedicated hardware.
Further, the present invention is not limited to the above-described embodiment, and in the contrary to the present invention, various embodiments are possible, and some or all of the constituent devices are improved. May be.
[0057]
【The invention's effect】
As described above, according to the first and ninth aspects of the present invention, a search word to be applied to “narrow search” or “retrieval of search” is a large number of search words even if the user cannot recall it. Words that are applied by the user and that indicate things with high topicality are set smoothly.
Further, according to the second, third, seventh, and tenth aspects of the present invention, the efficiency and optimization of the “narrowed search” and the “retrieval of the search” to be performed subsequently are achieved.
[0058]
Further, according to the inventions described in
According to the invention described in
Further, according to the invention described in claim 8, selection of a single search word to be applied at the time of “refining search” or “retrieval of search” or a man-machine interface related to the selection is performed based on a certain standard. Done.
[0059]
Further, a computer that executes the program described in
Further, a computer that reads and executes the above-described program from the recording medium according to claim 14 is a component of the additional search term acquisition device according to any one of
[0060]
Therefore, in the database system and the information retrieval system to which these inventions are applied, retrieval of highly topical information is realized accurately and quickly, and performance and added value are enhanced.
[Brief description of the drawings]
FIG. 1 is a diagram showing first and second embodiments of the present invention.
FIG. 2 is an operation flowchart of the first embodiment of the present invention.
FIG. 3 is a diagram showing a configuration of a search log.
FIG. 4 is a diagram showing a configuration of a tally result.
FIG. 5 is an operation flowchart of a second embodiment of the present invention.
[Explanation of symbols]
11 processor
12 Display
13 Keyboard
14 mouse
15 Search log database
16 Count Result Database
Claims (14)
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する検索語取得手段と
を備えたことを特徴とする追加検索語取得装置。Extracting means for extracting a record including a single search term different from any of these search terms, along with all of the desired search terms, among search logs generated by the search engine;
A search term acquisition unit that acquires a single search term included in the extracted records in descending order of priority of these records;
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出する抽出手段と、
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する検索語取得手段と
を備えたことを特徴とする追加検索語取得装置。Search word conversion means for converting a desired search word into a set of individually related words;
A record including a search term including a single search term different from any of these terms, in addition to any of the terms individually related to all of the desired search terms in a search log generated by a search engine. Extraction means for extracting
A search term acquisition unit that acquires a single search term included in the extracted records in descending order of priority of these records;
前記取得された単一の検索語をその単一の検索語に関連する語の集合に拡張する検索語拡張手段を備えた
ことを特徴とする追加検索語取得装置。The additional search term acquisition device according to claim 1 or 2,
An additional search term acquisition device, comprising: a search term extension unit for extending the acquired single search term into a set of terms related to the single search term.
前記抽出されたレコードに個別に含まれる単一の検索語を取得する検索語取得手段と、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する検索語候補通知手段と、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとるマンマシンインタフェース手段と
を備えたことを特徴とする追加検索語取得装置。Extracting means for extracting a record including a single search term different from any of these search terms, along with all of the desired search terms, among search logs generated by the search engine;
Search term acquisition means for acquiring a single search term individually included in the extracted record,
A search term candidate notifying unit that notifies the operator of the obtained single search term and / or a term related to the single search term;
An additional search word acquisition device, comprising: a man-machine interface unit that takes a man-machine interface for selecting one of the search word and the word notified to the operator.
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含むレコードを抽出する抽出手段と、
前記抽出されたレコードに個別に含まれる単一の検索語を取得する検索語取得手段と、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知する検索語候補通知手段と、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとるマンマシンインタフェース手段と
を備えたことを特徴とする追加検索語取得装置。Search word conversion means for converting a desired search word into a set of individually related words;
Extraction of extracting, from a search log generated by a search engine, a record including a single search term different from any of these terms, along with any term individually related to all of the desired search terms. Means,
Search term acquisition means for acquiring a single search term individually included in the extracted record,
A search term candidate notifying unit that notifies the operator of the obtained single search term and / or a term related to the single search term;
An additional search word acquisition device, comprising: a man-machine interface unit that takes a man-machine interface for selecting one of the search word and the word notified to the operator.
前記検索語取得手段は、
前記抽出されたレコードの優先度の降順にこれらのレコードに個別に含まれる単一の検索語を取得し、
前記検索語候補通知手段は、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を前記優先度の降順に前記操作者に通知する
ことを特徴とする追加検索語取得装置。The additional search term acquisition device according to claim 4 or claim 5,
The search term acquisition means,
Obtain a single search term individually contained in these records in descending order of priority of the extracted records,
The search word candidate notifying means,
And (b) notifying the operator of at least one of the obtained single search word and a word related to the single search word in descending order of the priority. apparatus.
前記選択された単一の検索語をその単一の検索語に関連する語の集合に拡張する検索語拡張手段を備えた
ことを特徴とする追加検索語取得装置。The additional search term acquisition device according to any one of claims 4 to 6,
An additional search term acquisition device, comprising: a search term expansion unit for expanding the selected single search term into a set of terms related to the single search term.
前記優先度は、
前記抽出されたレコードの属性毎に付与される
ことを特徴とする追加検索語取得装置。The additional search term acquisition device according to any one of claims 1 to 3,
The priority is
An additional search term acquisition device, which is provided for each attribute of the extracted record.
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する
ことを特徴とする追加検索語取得方法。In the search log generated by the search engine, along with all the desired search terms, a record including a single search term different from any of these search terms is extracted,
A method for acquiring an additional search term, wherein a single search term included in the extracted records in descending order of priority of these records is acquired.
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出し、
前記抽出されたレコードにこれらのレコードの優先度の降順に含まれる単一の検索語を取得する
ことを特徴とする追加検索語取得方法。Convert the desired search terms into a set of individually related terms,
A record including a search term including a single search term different from any of these terms, in addition to any of the terms individually related to all of the desired search terms in a search log generated by a search engine. Extract
A method for acquiring an additional search term, wherein a single search term included in the extracted records in descending order of priority of these records is acquired.
前記抽出されたレコードに個別に含まれる単一の検索語を取得し、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知し、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる
ことを特徴とする追加検索語取得方法。In the search log generated by the search engine, along with all the desired search terms, a record including a single search term different from any of these search terms is extracted,
Obtaining a single search term individually included in the extracted record,
Notifying the operator of the obtained single search word and / or a word related to the single search word,
A method for acquiring an additional search word, wherein a man-machine interface for selecting either the search word or the word notified to the operator is used.
検索エンジンによって生成された検索ログの内、前記所望の検索語の全てに個別に関連する何れかの語に併せて、これらの語の何れとも異なる単一の検索語を含む検索語を含むレコードを抽出し、
前記抽出されたレコードに個別に含まれる単一の検索語を取得し、
前記取得された単一の検索語と、その単一の検索語に関連する語との双方もしくは何れか一方を操作者に通知し、
前記操作者に通知された検索語または語の何れかの選択にかかわるマンマシンインタフェースをとる
ことを特徴とする追加検索語取得方法。Convert the desired search terms into a set of individually related terms,
A record including a search term including a single search term different from any of these terms, in addition to any of the terms individually related to all of the desired search terms in a search log generated by a search engine. Extract
Obtaining a single search term individually included in the extracted record,
Notifying the operator of the obtained single search word and / or a word related to the single search word,
A method for acquiring an additional search word, wherein a man-machine interface for selecting either the search word or the word notified to the operator is used.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003131254A JP2004334638A (en) | 2003-05-09 | 2003-05-09 | Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003131254A JP2004334638A (en) | 2003-05-09 | 2003-05-09 | Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004334638A true JP2004334638A (en) | 2004-11-25 |
Family
ID=33506483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003131254A Pending JP2004334638A (en) | 2003-05-09 | 2003-05-09 | Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004334638A (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006075898A1 (en) * | 2005-01-13 | 2006-07-20 | Nhn Corporation | Method and system for managing various kinds of keywords by interworking the keywords depending on user authentication |
JP2006285460A (en) * | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | Information search system |
JP2009505221A (en) * | 2005-08-11 | 2009-02-05 | アマゾン テクノロジーズ インコーポレーテッド | A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior |
KR100884889B1 (en) | 2007-03-26 | 2009-02-23 | 엔에이치엔(주) | Method and system for adding automatic indexing word to search database |
JP2010067011A (en) * | 2008-09-11 | 2010-03-25 | Fujitsu Ltd | Method and device for detecting document group |
JP2012048592A (en) * | 2010-08-30 | 2012-03-08 | Hitachi Solutions Ltd | File retrieval system having automatic index generation device for retrieval |
JP5452704B1 (en) * | 2012-12-28 | 2014-03-26 | ヤフー株式会社 | Query template acquisition device, query template acquisition method, and program |
JP2016038667A (en) * | 2014-08-06 | 2016-03-22 | 日本電信電話株式会社 | Information provision device, information provision method and information provision program |
WO2016147401A1 (en) * | 2015-03-19 | 2016-09-22 | 株式会社 東芝 | Classification device, method, and program |
JP6124489B1 (en) * | 2016-08-01 | 2017-05-10 | ヤフー株式会社 | Query providing apparatus, query providing method, and query providing program |
-
2003
- 2003-05-09 JP JP2003131254A patent/JP2004334638A/en active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006075898A1 (en) * | 2005-01-13 | 2006-07-20 | Nhn Corporation | Method and system for managing various kinds of keywords by interworking the keywords depending on user authentication |
JP2006285460A (en) * | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | Information search system |
JP2009505221A (en) * | 2005-08-11 | 2009-02-05 | アマゾン テクノロジーズ インコーポレーテッド | A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior |
JP4866421B2 (en) * | 2005-08-11 | 2012-02-01 | アマゾン テクノロジーズ インコーポレーテッド | A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior |
KR100884889B1 (en) | 2007-03-26 | 2009-02-23 | 엔에이치엔(주) | Method and system for adding automatic indexing word to search database |
JP2010067011A (en) * | 2008-09-11 | 2010-03-25 | Fujitsu Ltd | Method and device for detecting document group |
JP2012048592A (en) * | 2010-08-30 | 2012-03-08 | Hitachi Solutions Ltd | File retrieval system having automatic index generation device for retrieval |
JP5452704B1 (en) * | 2012-12-28 | 2014-03-26 | ヤフー株式会社 | Query template acquisition device, query template acquisition method, and program |
JP2016038667A (en) * | 2014-08-06 | 2016-03-22 | 日本電信電話株式会社 | Information provision device, information provision method and information provision program |
WO2016147401A1 (en) * | 2015-03-19 | 2016-09-22 | 株式会社 東芝 | Classification device, method, and program |
JPWO2016147401A1 (en) * | 2015-03-19 | 2017-06-08 | 株式会社東芝 | Classification apparatus, method and program |
US11163812B2 (en) | 2015-03-19 | 2021-11-02 | Kabushiki Kaisha Toshiba | Classification apparatus and classification method |
JP6124489B1 (en) * | 2016-08-01 | 2017-05-10 | ヤフー株式会社 | Query providing apparatus, query providing method, and query providing program |
JP2018022214A (en) * | 2016-08-01 | 2018-02-08 | ヤフー株式会社 | Query providing device, query providing method and query providing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10956472B2 (en) | Dynamic load balancing based on question difficulty | |
KR100745483B1 (en) | Data store for knowledge-based data mining system | |
US6473752B1 (en) | Method and system for locating documents based on previously accessed documents | |
KR101443475B1 (en) | Search suggestion clustering and presentation | |
EP2159715B1 (en) | System and method for providing a topic-directed search | |
US8965894B2 (en) | Automated web page classification | |
US20100023509A1 (en) | Protecting information in search queries | |
WO2007001128A1 (en) | Method and system for determining relation between search terms in the internet search system | |
JP2007519111A (en) | Method, system, and program for processing anchor text | |
US20150356456A1 (en) | Real-Time or Frequent Ingestion by Running Pipeline in Order of Effectiveness | |
TW201027375A (en) | Search system, search method and program | |
JP4049317B2 (en) | Search support apparatus and program | |
JP2004334638A (en) | Additional retrieval word acquiring apparatus and method, program for realizing same, and recording medium with its program stored | |
JPH10240766A (en) | Information retrieval method and device therefor | |
US9552415B2 (en) | Category classification processing device and method | |
KR20130076684A (en) | Multi-document summarization method and system using semmantic analysis between tegs | |
JP2006178599A (en) | Document retrieval device and method | |
Kim et al. | Design of question answering system with automated question generation | |
Aknouche et al. | Integrating query context and user context in an information retrieval model based on expanded language modeling | |
Li et al. | Complex query recognition based on dynamic learning mechanism | |
JP2003271648A (en) | Retrieval device, retrieval method, and program | |
Jabal et al. | Provenance-based scientific workflow search | |
TW201822031A (en) | Method of creating chart index with text information and its computer program product capable of generating a virtual chart message catalog and schema index information to facilitate data searching | |
Akritidis et al. | Computing scientometrics in large-scale academic search engines with mapreduce | |
US20230359658A1 (en) | Business matching support device, business matching support method, and program |