JP2007148948A - 文書検索プログラム - Google Patents

文書検索プログラム Download PDF

Info

Publication number
JP2007148948A
JP2007148948A JP2005344874A JP2005344874A JP2007148948A JP 2007148948 A JP2007148948 A JP 2007148948A JP 2005344874 A JP2005344874 A JP 2005344874A JP 2005344874 A JP2005344874 A JP 2005344874A JP 2007148948 A JP2007148948 A JP 2007148948A
Authority
JP
Japan
Prior art keywords
user
search
related word
word
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005344874A
Other languages
English (en)
Inventor
Yusuke Sato
祐介 佐藤
Makoto Iwayama
真 岩山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005344874A priority Critical patent/JP2007148948A/ja
Publication of JP2007148948A publication Critical patent/JP2007148948A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 文書検索装置において、検索履歴をユーザ間で共有することで、入力された検索式と関連語との関連度の指標を提示し、関連語の選択を容易にすることを目的とする。
【解決手段】 検索語を見出し語とし、その見出し語と関連したキーワードが記載された関連語表を格納した関連語データベース104と、ユーザが入力した検索語と対で検索に使用した関連語を、ユーザ名、検索語、該検索語と該関連語を過去に対にて使用した回数とを一組として全ユーザ分の組を記載した検索履歴表を格納した関連度情報データベース105と、ユーザ履歴抽出結果一覧に表示する他ユーザのグループを格納するためのユーザグループデータベース106と、ユーザ本人の履歴と他ユーザの履歴との類似度を算出するユーザ履歴類似度計算部206と、ユーザ本人の関連語履歴に無く、現在の検索に有効となりうる関連語を他ユーザの履歴から探索するための推薦単語検索部207とを備えた。
【選択図】 図1

Description

本発明は、文書検索装置においてユーザの検索式入力支援を可能とする装置、方法及びプログラムに関する。
一般に、検索キーワードを入力することで目的の文書集合を検索することができる文書検索装置において、的確に所望の文書集合を得るためには、検索キーワードについての関連語をも網羅した検索式を入力する必要がある。関連語とは、ある単語について、その単語と意味的に同一、もしくは類似した意味を持つ単語のことをいう。例えば、「プリンタ」という単語は「印刷装置」、「画像印字装置」といった単語で表現される場合もあり、したがって検索キーワードに「プリンタ」として検索した場合には、「印刷装置」、「画像印字装置」という単語により表現された文書は検索結果に現れない。
ある単語に関する関連語の候補は数が非常に多くなることが一般的であるため、関連語についての何らかの指標を示すことで、選択を容易にする技術がさまざまに考案されている。例えば同一ユーザが一度選択したキーワードは再度選択される確率が高いことに着目し、その関連語がそれまでに検索キーワードとして選択された回数をその関連語と共に選択回数の多い順に並べて一覧で表示することで関連語の選択を支援することを可能とする技術がある(例えば、特許文献1参照)。
又、ユーザの過去の検索式履歴に基づいて、検索式の候補を提示するような技術もある(例えば、特許文献2参照)。
特開平5−257980号公報
特開2005−78334号公報
上記特許文献1の技術によれば、提示される関連語は本人の履歴のみに基づいている。そのため、関連語についての新たな見地を得られる可能性は低い。
また、特許文献2は検索式の候補を提示することで検索目的を明確化することを目的としている。そのために、検索式の関連語の候補を提示するものである。よって、検索漏れを防ぐことが目的である本技術とはその効果が異なる。さらには特許文献2の技術においてはあくまでユーザの入力した検索語を用いた検索によって類似する検索式を検索するため、入力漏れとなっている新たな関連語を見付けようとする検討がなされていない。
本発明の目的は、上記の問題を解決し、自/他ユーザの両方の関連語の履歴を、自ユーザの履歴を先頭として横並びで表示することで履歴の違いを明確にして関連語を提供することにある。
上記課題を解決するために本願で開示する代表的な発明は以下の通りである。
ユーザ毎に該ユーザが入力した検索キーワードとその関連語とを対応付けてその選択回数とともに記録する関連度情報データベースと、ユーザ毎に参考先として用いる他のユーザを記録するユーザグループデータベースとを備える装置において、新たな検索キーワードの入力を受けて該検索キーワードに対応付けられる関連語を抽出して関連語対を生成し、ユーザグループデータベースから該入力を行ったユーザに対応付けられる他のユーザの情報に基づいて、上記抽出した関連語対の選択回数を集計し、上記関連語対を上記集計した選択回数とともに表示する検索支援プログラム。
本発明は、入力した検索キーワードに対する関連語集合から関連語が選択できる文書検索装置において、他ユーザの関連語の選択履歴の一覧を自ユーザの履歴との類似度順に並列化して表示することによって、自分と近い検索目的のユーザの使用状況を優先的に参考にしつつ、それぞれのユーザとの関連語の使用傾向の違いが比較し易い形で見て取ることができる。よって、検索漏れの防止に有効な関連語の入力を容易に行うことができ、効率的な検索が可能となる。また、自ユーザの履歴に無く、他ユーザの履歴中で選択回数が特に多い関連語を強調表示することで、未知の検索知識を新たに得ることも可能となる。
以下、本発明の実施の形態を図面により詳細に説明する。
図1に、本実施例の文書検索装置の全体構成を示す。図1の文書検索装置は、入力装置部101、出力装置部102、検索制御部103、関連語データベース104、関連度情報データベース105、ユーザグループデータベース106、文書データベース107を備えている。
入力装置部101は、検索式を入力するためのキーボードやマウスといった一般的な入力装置、出力装置部102は、検索結果や関連語情報抽出結果などを表示するための、ディスプレイといった一般的な出力装置から構成される。
関連語データベース104は、見出し語と、その見出し語と対応した複数の関連語との対とを格納した格納手段である。関連語データベース104は検索対象となる文書集合から事前に抽出されている場合もあるし、既存の関連語辞書から構成されている場合もある。図8は、関連語データベース104に格納されているデータの例であり、図8中の「見出し語」801が、ユーザ入力の検索キーワードを表し、「関連語群」802が、該検索キーワードについての関連語群を表す。例えば、検索キーワード「車両」から抽出される関連語群は「自動車、移動体、自動二輪、トラック、自車、作業用自動車、普通車、客車、レーシングカー、タンクローリ」であることを表している。
関連度情報データベース105は、関連語を使用したユーザ名、検索キーワード、関連語、選択回数を1つの対にしたレコードとして格納する格納手段である。図9は、関連度情報データベース105に格納されているデータの例である。図9中の901が検索キーワードを使用したユーザ名「uname」であり、902が検索キーワード「mkey」であり、903が検索キーワードと対で選択した関連語「exWord」であり、904が該ユーザが該検索キーワードと該関連語を対で選択した選択回数「count」を表す。この例では、「userA」が検索キーワード「ディーゼルエンジン」と関連語「ディーゼル機関」を対にして「6」回選択したことを示し、また、「userB」が検索キーワード「センサ装置」と関連語「検査器」を対にして「11」回選択したことを表している。データベース中にはない、ユーザ名と見出し語と関連語の組に対する選択回数が関連度情報抽出部203から要求された場合には、その選択回数として「0」を渡す。
ユーザグループデータベース106は、関連度情報抽出結果表示、ユーザ履歴抽出結果表示の際にグループ化を行うユーザを格納する格納手段である。各ユーザは、事前に全ユーザの中から自分が参考にしたいと思う履歴を有するユーザを選択して登録しておく。図10がその例である。1001が登録を行っているユーザ名であり、1002がその登録内容である。例えば、userAはuserBとuserCについての情報のみを出力するように登録している。
文書データベース107は、検索対象の文書などを格納する格納手段である。
検索制御部103は、上記入力装置部101、出力装置部102の入出力を制御する他に、図2に示すような機能を有する。図2は検索制御部103の構成図であり、形態素解析部201、関連語抽出部202、関連度情報抽出部203、ユーザグループ抽出部204、ユーザ履歴抽出部205、ユーザ履歴類似度計算部206、推薦単語検索部207、選択制御部208より構成される。各部はコンピュータにプログラムが読み込まれることによって実現されるものであっても、一部ハードウェアとの協調によって実現されるものでも良い。
形態素解析部201は、入力装置部101から入力した検索式を、その検索式がキーワードの集合、単文、もしくは複文にかかわらず形態素解析を行うことで、単一、もしくは複数のキーワードに分解して、検索処理、もしくは関連語抽出部202に渡す。
関連語抽出部202は、形態素解析部201より受け取ったキーワード群を見出し語として、関連語データベース104から関連語群を取得し、上記検索キーワードと上記関連語群により関連語対群を構築して関連度情報抽出部203に上記関連語対群を渡す。
関連度情報抽出部203は、関連語抽出部202により抽出された関連語対群について、関連語データベース104には格納されていない関連語を関連度情報データベース105から抽出する。この抽出は、ユーザグループデータベース106において、自ユーザに対応付けられている他ユーザの分だけ行う。更に、上記の抽出により構成した新たな関連語対群中の関連語について、入力した検索語との関係において過去に関連語として選択された回数を抽出する。この選択回数は上記ユーザグループデータベース106より取得した各ユーザの関連語の選択回数であり、これらの総和を関連語毎に計算して関連語対テーブルを作成し、出力装置部102へ渡す。
ユーザグループ抽出部204は、各ユーザが登録した他ユーザのグループ分けについての情報をユーザグループデータベース106より抽出する。
ユーザ履歴抽出部205は、選択制御部103から検索キーワードを受け取り、その検索キーワードについての過去に選択した関連語とその選択回数を、指定したユーザ分だけ関連度情報データベース105から抽出して、ユーザ毎の関連語リストを作成し、ユーザ履歴類似度計算部206に渡す。
ユーザ履歴類似度計算部206は、ユーザ履歴抽出部205から受け取った関連語リストのうち、他ユーザのリストそれぞれについて自ユーザのリストとの類似度を計算し、その類似度順に他ユーザのリストを整列させ、推薦単語検索部207へ渡す。
推薦単語検索部207は、ユーザ毎の関連語とその選択回数が対となったリストを受け取り、他ユーザの関連語リストの中から、自ユーザのリストには無く、ある閾値以上の選択回数をもつ関連語を検索してマーキングし、出力装置部102へ渡す。
選択制御部208は、出力装置部102により表示された検索キーワードや関連語が選択されると、関連度情報抽出結果表示、ユーザ履歴抽出結果表示のそれぞれの場合に応じて、検索キーワードに選択された関連語を追加するといった制御を行う。
ここで、上記の構成の文書検索装置の処理について、図3のフローチャートを用いて説明する。文書検索装置は入力装置部101による検索キーワードの入力(S301)を確認すると、拡張命令と検索命令の待ち状態(S302)となる。ここで、入力した検索キーワードについての拡張命令を受けると、ステップS302からS303へと進み、形態素解析部201が検索キーワードの形態素解析を行う。次に、形態素解析された検索キーワードにより、関連度情報の抽出結果を表示し(S304)、検索キーワード選択命令の待ち状態となる(S305)。ユーザから関連度情報抽出結果中の検索キーワードの選択命令を受けた場合には、ステップS305からS306へと進み、その検索キーワードに関するユーザ履歴の抽出を行う。そして、関連度情報抽出結果、ユーザ履歴抽出結果のどちらか、もしくは両方からの関連語の選択命令の待ち状態となる。関連語の選択命令を受け取った場合(S307)には、選択制御部208が選択された関連語を検索キーワードに追加して、再び拡張命令と検索命令の待ち状態に入る(S302)。上記ステップS305において検索キーワードの選択命令を行わなかった場合には、ステップS305からS307へと進み、関連度情報抽出結果からの関連語選択命令の待ち状態となる。関連語選択命令を受け取った場合には、同様に選択された関連語を検索キーワードに追加して、再び拡張命令と検索命令の待ち状態に入る(S302)。
上記ステップS302において検索命令を受け取った場合には、ステップS302からS308へと進み、形態素解析部201が検索キーワードの形態素解析を行い、その結果を関連度情報抽出部203へと渡す。形態素解析された検索キーワードを受け取った関連度情報抽出部203は、検索キーワードと関連語の対についての選択回数の更新を関連度情報データベース105に対して行った(S309)後、文書検索を行う(S310)。検索結果の出力後、再び関連語の選択命令があった場合にはステップS311からS307へと進み、上記と同様の処理を繰り返す。関連語の選択命令が無ければ、文書検索処理を終了する。
なお、本発明による文書検索装置利用時には利用者が特定できることを前提とする。この方法については利用開始時にユーザ登録及びユーザ認証を行うことにより、利用者の情報を記憶させておくことにより実現する形態であっても良い。
上記ステップS304において行われる処理について、図4のフローチャートを用いて説明する。ユーザからの検索キーワード拡張命令(S302)に対し、関連語抽出部202はまず、形態素解析後の検索キーワードを受け取り関連語対群の初期値とする(S401)。次に、それぞれの検索キーワードを見出し語として、関連語データベース104より関連語の抽出を試みる(S402)。各検索キーワードについての関連語が関連語データベース104に存在する場合は、ステップS403からS404へと進み、抽出した関連語をそれぞれの関連語対に追加する。関連語対とは、検索キーワードと複数の関連語群との組のことを指す。さらに、これら検索キーワードと関連語の対のうち、関連語どうし、もしくは検索キーワードと関連語との間で共通の単語が含まれている場合には、それらのグループ化を行う(S405)。例えば検索キーワードとしてディーゼルエンジン、内燃機関、車両を入力すると、関連語データベース104に関連語が登録されている場合(S403 YES)には以下の3つの関連語対「ディーゼルエンジン、内燃機関、エンジン、原動機、主機関、ディーゼル機関」、「内燃機関、エンジン、ディーゼルエンジン、ガソリンエンジン、エンジン本体、本体」、「車両、自動車、移動体、自動二輪車、トラック、自車」が作成される(S404)。この関連語対群に対してグループ化を試みる(S405)。この場合検索キーワード“ディーゼルエンジン”が“内燃機関”の関連語中にもあるため、これら2つの関連語対をグループ化して1つの関連語対「ディーゼルエンジン、内燃機関、エンジン、原動機、主機関、ディーゼル機関、ガソリンエンジン、エンジン本体、本体」とする。グループ化の際には、2つの関連語対の和集合をとり、2つある検索キーワードのうちより、例えば先頭にあるものを新たな検索キーワードとする(上記の場合はディーゼルエンジンを新たな検索キーワードとする)。また、上記の例では検索キーワードと関連語が共通していたが、関連語同士が共通している場合にもグループ化を行う。以上のグループ化の操作を全ての関連語対の組み合わせについて試して関連語対群を再構築し、関連度情報抽出部203へ上記関連語対群を渡す。なお、上記の例では、関連語データベース104より抽出した関連語群は5語となっているが、抽出可能な単語数をユーザが指定できることが望ましい。このようにして、関連語データベース104からの情報も利用することで、他ユーザの関連語の知識だけでなく、関連語データベース104にある普遍的な関連語の知識も提供が可能となる。
ステップS403において、関連語データベース104に関連語が登録されていない場合は、検索キーワードのみを関連語対群とし関連度情報抽出部203へ渡す。
関連度情報抽出部203は、関連語対を関連語抽出部202から受け取ると、まず初めにユーザグループ抽出部204にユーザグループが登録されているかどうかを問い合わせる(S406)。ユーザグループ抽出部204は、自ユーザがユーザグループをユーザグループデータベース106に登録している場合には、該ユーザグループを抽出して関連度情報抽出部203へ渡す(S407)。ユーザグループが登録されていない場合にはその代わりとして全ユーザを設定する(S408)。関連度情報抽出部203は受け取った上記ユーザグループと関連語対に基づき、関連語対内の語と対で選択した関連語とその回数を自ユーザとそのユーザ分だけ関連度情報データベース105より抽出する(S409)。その際、ユーザ名と検索キーワードに関して、図9のunameとmkeyに該当するレコードだけではなく、unameとexWordのレコードについても抽出する。そして、各関連語の選択回数の総和を計算する(S410)。さらには、各検索キーワードに対して、ステップS407により取得した、ユーザグループ中の各ユーザと自ユーザの関連語と選択回数のリストを用いて、自ユーザのリストにはなく、他ユーザのリスト中での選択回数がある閾値以上をもつ関連語に、推薦単語検索部207がマーキングを行う(S411)。最後に、関連語対中の関連語を上記で求めた選択回数の降順に整列してそれぞれの関連語対に関する関連語テーブルを構築し、それらを出力装置部102へ渡す。出力装置部102は受け取った関連語テーブルを表示する際には、マーキングされた関連語を強調させて表示する(S412)。図6が、検索キーワードとして「ディーゼルエンジン 内燃機関 動力源 センサ装置 流量センサ 車両」が入力された場合のステップS304における関連度情報抽出結果の表示例である。この場合、ディーゼルエンジン、内燃機関、動力源と、センサ装置、流量センサがそれぞれグループ化され、「ディーゼルエンジン」、「センサ装置」、「車両」を新たな検索キーワードとした3つの関連語対が作成される。601がそれぞれの関連語対を展開した表であり、表中の先頭が検索キーワードになっている(602)。よって、この例では「ディーゼルエンジン」、「センサ装置」、「車両」の3つについての表が出力されている。表601中の、603が関連語抽出部202と関連度情報抽出部203により抽出された関連語群である。各関連語についてのユーザの登録している他のユーザの履歴に基づく選択回数の総和が604に示される。このように、ユーザグループで指定したユーザの総和を提示することで、信頼あるユーザの情報に基づいた関連語選択の全体的な傾向を把握することが可能となる。また、ディーゼルエンジンの関連語では「主機関」が、センサ装置の関連語では「ブレーキペダル操作角」が、車両の関連語では「移動体」と「自動二輪車」がそれぞれ強調表示されて推薦関連語であることを示している。したがって、ユーザはこれまでには知らなかった新たな関連語の知識を容易に得ることができる。605のチェックボックスにチェックを入れると、対応する関連語を選択制御部208が検索キーワードに追加する。ユーザ入力の検索キーワードの中で、他の検索キーワードの関連語とみなされた語(図6の例では「内燃機関」、「動力源」、「流量センサ」)はデフォルトでチェックボックスが「オン」の状態になる。表601中の検索キーワードを選択すると、ステップS305からS306へと進み、対応する検索キーワードのユーザ履歴抽出結果が表示される。
ステップS306におけるユーザ履歴抽出処理について、図5のフローチャートを用いて説明する。図6の表中の検索キーワードを選択すると、選択制御部208がそのキーワードと、そのキーワードの関連語群をユーザ履歴抽出部205へ渡す(S501)。この際、上記キーワード群のうちユーザ入力のものには、それがわかるようなフラグを付加する。上記キーワード群を受け取ったユーザ履歴抽出部205は、まず履歴を抽出するユーザグループをユーザグループ抽出部204に問い合わせる。問い合わせを受けたユーザグループ抽出部204は、自ユーザがユーザグループを登録している場合には、ユーザグループデータベース106から該ユーザグループを抽出し、ユーザ履歴抽出部205へ渡す。上記ユーザグループの登録が無い場合、ユーザ履歴抽出部205はユーザグループを全ユーザに設定してステップS503へと進む。ユーザ履歴抽出部205は、ユーザグループ抽出部204より受け取った上記ユーザグループに含まれる各ユーザと選択制御部208より受け取った上記キーワード群に含まれる語の両方をもつエントリーを、関連度情報データベース105より取得する。取得した上記ユーザ履歴はユーザ毎に分類される(S505)。図11に取得したユーザ履歴の分類結果の概念図を示す。この例は、選択制御部208よりキーワード群として「ディーゼルエンジン、内燃機関、動力源、エンジン、原動機 主機関、ディーゼル機関、ガソリンエンジン、エンジン本体、本体」が渡され、ユーザグループ抽出部204より「userB」、「userC」が渡された場合のユーザ履歴取得結果である。なお、ユーザ入力のキーワードであることを示すフラグは、例えば「*」といった印を語尾に直接付加しても良いし、ビット単位でのフラグであっても良い。1101がユーザ名、1102が関連語(903に対応)、1103が選択回数(904に対応)、1104がユーザ入力の語であるかのフラグである。一覧の先頭に自ユーザ(userA)の履歴が必ず位置する。1104に「*」があるものがユーザ入力の語であることを示している。これらの結果はユーザ履歴類似度計算部206へ渡される。
ユーザ履歴を受け取ったユーザ履歴類似度計算部206は、自ユーザの履歴と、他ユーザの履歴それぞれとの類似度を計算して、各ユーザの関連語のリストに付加する(S506)。類似度の計算は、各ユーザの履歴を各要素が関連語の選択回数であるベクトルに変換し、それらベクトル間の類似度を計算する。ベクトル間の類似度にはコサイン尺度や内積といった一般的に使われている方法を用いる。上記類似度に基づき、他ユーザの履歴をその類似度の降り順に整列して推薦単語検索部207へと渡す(S507)。ユーザ履歴を受け取った推薦単語検索部207は、自ユーザの履歴に無く、他ユーザの履歴中での選択回数がある閾値以上の関連語を検索し、その単語をマーキングする(S508)。上記選択回数の閾値は予めシステム側で設定しておくことが望ましいが、ユーザによる設定を可能にしても良い。推薦単語検索部207は、マーキングが終了したユーザ履歴を出力装置部102へと渡し、出力装置部102は各ユーザのリストを整列された順に、リスト内の関連語を選択回数の降り順、かつ、マーキングされた関連語を強調して表示する(S509)。また、ユーザ入力フラグがある語はチェックボックスにチェックを入れる。
図7は、検索キーワードとして図6における「ディーゼルエンジン」を選択した場合の上記抽出結果の表示例である。各表の一番上の部分701が検索キーワード「ディーゼルエンジン」を過去に使用したことのあるユーザの名前であり、この例では「userA」、「userB」、「userC」が検索キーワード「ディーゼルエンジン」を使用したことがあることを示している。表示に際してプライバシーを考慮すべき場合には、他人の個人名を明示せずに表示すれば良い。702は、検索キーワード「ディーゼルエンジン」と対で選択した関連語群である。703は、その関連語を検索キーワードと対で過去に選択した回数を示している。したがって、図7中の左側の表の例では、ユーザ「userA」は、検索キーワード「ディーゼルエンジン」とともに、関連語「ガソリンエンジン」を「39」回、「原動機」を「22」回、「ディーゼル機関」を「13」回...といった選択履歴を過去にもっていることを表している。また、userCの表中の関連語「主機関」が自ユーザの履歴に無くある閾値以上の選択回数をもつ関連語に該当するため、推薦関連語として強調表示されている。チェックボックス704のうち、ユーザ入力のキーワードである「内燃機関」と「動力源」のものは、初めから選択された状態となっている。チェックボックス704を選択することで、選択制御部208が該当する関連語を検索キーワードに追加する。
ステップS302において検索命令を受け取った場合には、選択制御部208から、新たに追加された検索キーワードと関連語の対と、検索操作を行ったユーザ名が関連度情報抽出部203に渡される。関連度情報抽出部203は受け取ったその対とユーザ名を見出し語として関連度情報データベース105から、その選択回数を検索し、該当する選択回数値を「1」だけ増して関連度情報データベース105の同箇所に格納する。また、該当する選択回数値がこの時点で関連度情報データベース105に蓄積されていない場合には、該ユーザ名、検索キーワード、関連語の対についての新たなレコードを作成し、その選択回数を「1」として格納する。
以上説明したように本発明によれば、図7にあるような、ユーザ履歴抽出部205の結果表示のように、他ユーザの関連語の選択履歴を自分の履歴との類似度が大きい順に横並びにすることで、自分と近い検索目的のユーザの使用状況を優先的に参考にしつつ、それぞれのユーザとの違いが比較し易い形で見て取ることができる。よって、検索に有効な関連語の入力を容易に行うことが可能となる。また、強調表示された単語から、これまでには知らなかった新たな検索知識を得ることも可能である。
本発明の情報検索装置の構成図。 検索制御部103の構成を示した図。 本発明の文書検索装置による検索操作のフローチャート示した図。 関連度情報を抽出して表示するまでのフローチャートを示した図。 ユーザ履歴を抽出して表示するまでのフローチャートを示した図。 関連度情報抽出結果の表示例を示した図。 ユーザ履歴抽出結果の表示例を示した図。 関連語データベース104に格納された関連語の例を示した図。 関連度情報データベース105に格納されたデータの例を示した図。 ユーザグループデータベース106に格納されたデータの例を示した図。 関連度情報データベース105からのユーザ履歴抽出結果後の概念図。
符号の説明
101:入力装置部、102:出力装置部、103:検索制御部、104:関連語データベース、105:関連度情報データベース、106:ユーザグループデータベース、107:文書データベース
201:形態素解析部、202:関連語抽出部、203:関連ど情報抽出部、204:ユーザグループ抽出部、205:ユーザ履歴抽出部、206:ユーザ履歴類似度計算部、207:推薦単語検索部、208:選択制御部。

Claims (5)

  1. ユーザ毎に該ユーザが入力した検索キーワードとその関連語とを対応付けてその選択回数とともに関連度情報データベースに記録し、
    ユーザ毎に参考先として用いる他のユーザをユーザグループデータベースに記録し、
    新たな検索キーワードの入力を受け、
    該検索キーワードに対応付けられる関連語を抽出して関連語対を生成し、
    上記ユーザグループデータベースから該入力を行ったユーザに対応付けられる他のユーザの情報に基づいて、上記抽出した関連度対の選択回数を集計し、
    上記関連語対を上記集計した選択回数とともに表示することを特徴とする検索支援プログラム。
  2. 検索キーワードの選択を受け、上記他のユーザ毎に該検索キーワードの関連語対の一覧を表示することを特徴とする請求項1記載の検索支援プログラム。
  3. 上記入力を行ったユーザのユーザ履歴と上記他のユーザのユーザ履歴との類似度を計算し、
    上記ユーザ毎の上記検索キーワードの関連語の表示は、上記類似度の順に該ユーザを並べて表示することを特徴とする請求項2記載の検索支援プログラム。
  4. 上記他ユーザの履歴の中から、自ユーザの履歴には無い関連語を検索し、
    上記関連語対中の上記自ユーザ履歴には無い関連語を明示して表示することを特徴とする請求項1乃至3の何れかに記載の検索支援プログラム。
  5. 予め記録される関連語データベースから上記新たに入力された検索キーの関連語を抽出して上記関連語対に追加することを特徴とする請求項1乃至4の何れかに記載の検索支援プログラム。
JP2005344874A 2005-11-30 2005-11-30 文書検索プログラム Pending JP2007148948A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005344874A JP2007148948A (ja) 2005-11-30 2005-11-30 文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005344874A JP2007148948A (ja) 2005-11-30 2005-11-30 文書検索プログラム

Publications (1)

Publication Number Publication Date
JP2007148948A true JP2007148948A (ja) 2007-06-14

Family

ID=38210274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005344874A Pending JP2007148948A (ja) 2005-11-30 2005-11-30 文書検索プログラム

Country Status (1)

Country Link
JP (1) JP2007148948A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259245A (ja) * 2008-04-11 2009-11-05 Fujitsu Ltd 入力タームに関連するタームを対話式に動的に表示するための方法及び記憶媒体
JP2010026792A (ja) * 2008-07-18 2010-02-04 Yahoo Japan Corp 配信された広告に関する情報を蓄積するサーバ、方法及びプログラム
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2010128592A (ja) * 2008-11-25 2010-06-10 Sony Corp 履歴表示装置、履歴表示システム、履歴表示方法、およびプログラム
WO2011079462A1 (en) * 2009-12-31 2011-07-07 Nokia Corporation Methods and apparatuses for user interest modeling
JP4828653B1 (ja) * 2010-12-07 2011-11-30 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP2012014349A (ja) * 2010-06-30 2012-01-19 Nec System Technologies Ltd 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法
JP2012174122A (ja) * 2011-02-23 2012-09-10 Ntt Docomo Inc キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム
JP2013544406A (ja) * 2010-11-16 2013-12-12 マイクロソフト コーポレーション 関連画像検索結果集合のブラウジング
JP2014215915A (ja) * 2013-04-26 2014-11-17 エヌ・ティ・ティ・コミュニケーションズ株式会社 相関値算出システム、判定システム、相関値算出方法、判定方法及びコンピュータプログラム
US9158790B2 (en) 2010-12-07 2015-10-13 Rakuten, Inc. Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
JP2016021217A (ja) * 2014-06-20 2016-02-04 株式会社神戸製鋼所 文書検索装置、文書検索方法、及び、文書検索プログラム
WO2016088183A1 (ja) * 2014-12-01 2016-06-09 株式会社日立製作所 文字列検索システムおよびその制御方法
JP2017016355A (ja) * 2015-06-30 2017-01-19 株式会社インタラクティブソリューションズ 検索情報管理装置、検索情報管理方法及び検索情報管理プログラム
CN109597932A (zh) * 2018-11-20 2019-04-09 咪咕文化科技有限公司 一种查找产品的方法、终端和计算机可读存储介质
CN109726399A (zh) * 2018-12-28 2019-05-07 北京明略软件系统有限公司 一种文本处理方法、装置及计算机可读存储介质
CN111475729A (zh) * 2020-04-07 2020-07-31 腾讯科技(深圳)有限公司 搜索内容推荐方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05257980A (ja) * 1992-03-13 1993-10-08 Toshiba Corp 文書検索装置
JP2002007450A (ja) * 2000-06-16 2002-01-11 Matsushita Electric Works Ltd 検索支援システム
JP2005301584A (ja) * 2004-04-09 2005-10-27 Mitsubishi Electric Corp 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム
JP2005309998A (ja) * 2004-04-23 2005-11-04 Fujitsu Ltd コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05257980A (ja) * 1992-03-13 1993-10-08 Toshiba Corp 文書検索装置
JP2002007450A (ja) * 2000-06-16 2002-01-11 Matsushita Electric Works Ltd 検索支援システム
JP2005301584A (ja) * 2004-04-09 2005-10-27 Mitsubishi Electric Corp 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム
JP2005309998A (ja) * 2004-04-23 2005-11-04 Fujitsu Ltd コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259245A (ja) * 2008-04-11 2009-11-05 Fujitsu Ltd 入力タームに関連するタームを対話式に動的に表示するための方法及び記憶媒体
JP2010026792A (ja) * 2008-07-18 2010-02-04 Yahoo Japan Corp 配信された広告に関する情報を蓄積するサーバ、方法及びプログラム
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2010128592A (ja) * 2008-11-25 2010-06-10 Sony Corp 履歴表示装置、履歴表示システム、履歴表示方法、およびプログラム
JP4645728B2 (ja) * 2008-11-25 2011-03-09 ソニー株式会社 履歴表示装置、履歴表示システム、履歴表示方法、およびプログラム
WO2011079462A1 (en) * 2009-12-31 2011-07-07 Nokia Corporation Methods and apparatuses for user interest modeling
US9031952B2 (en) 2009-12-31 2015-05-12 Nokia Corporation Methods and apparatuses for user interest modeling
CN102687166A (zh) * 2009-12-31 2012-09-19 诺基亚公司 用于用户兴趣建模的方法和设备
CN102687166B (zh) * 2009-12-31 2016-02-10 诺基亚技术有限公司 用于用户兴趣建模的方法和设备
JP2012014349A (ja) * 2010-06-30 2012-01-19 Nec System Technologies Ltd 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法
US9384216B2 (en) 2010-11-16 2016-07-05 Microsoft Technology Licensing, Llc Browsing related image search result sets
US9372873B2 (en) 2010-11-16 2016-06-21 Microsoft Technology Licensing, Llc Browsing related image search result sets
JP2013544406A (ja) * 2010-11-16 2013-12-12 マイクロソフト コーポレーション 関連画像検索結果集合のブラウジング
JP4828653B1 (ja) * 2010-12-07 2011-11-30 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
US9158790B2 (en) 2010-12-07 2015-10-13 Rakuten, Inc. Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
WO2012077369A1 (ja) * 2010-12-07 2012-06-14 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP2012174122A (ja) * 2011-02-23 2012-09-10 Ntt Docomo Inc キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム
JP2014215915A (ja) * 2013-04-26 2014-11-17 エヌ・ティ・ティ・コミュニケーションズ株式会社 相関値算出システム、判定システム、相関値算出方法、判定方法及びコンピュータプログラム
JP2016021217A (ja) * 2014-06-20 2016-02-04 株式会社神戸製鋼所 文書検索装置、文書検索方法、及び、文書検索プログラム
WO2016088183A1 (ja) * 2014-12-01 2016-06-09 株式会社日立製作所 文字列検索システムおよびその制御方法
JP2017016355A (ja) * 2015-06-30 2017-01-19 株式会社インタラクティブソリューションズ 検索情報管理装置、検索情報管理方法及び検索情報管理プログラム
CN109597932A (zh) * 2018-11-20 2019-04-09 咪咕文化科技有限公司 一种查找产品的方法、终端和计算机可读存储介质
CN109726399A (zh) * 2018-12-28 2019-05-07 北京明略软件系统有限公司 一种文本处理方法、装置及计算机可读存储介质
CN109726399B (zh) * 2018-12-28 2022-11-11 北京明略软件系统有限公司 一种文本处理方法、装置及计算机可读存储介质
CN111475729A (zh) * 2020-04-07 2020-07-31 腾讯科技(深圳)有限公司 搜索内容推荐方法及装置
CN111475729B (zh) * 2020-04-07 2023-07-25 腾讯科技(深圳)有限公司 搜索内容推荐方法及装置

Similar Documents

Publication Publication Date Title
JP2007148948A (ja) 文書検索プログラム
US8150859B2 (en) Semantic table of contents for search results
JP5611390B2 (ja) 対話型サーチクエリーを改良するためのシステム及び方法
US7680778B2 (en) Support for reverse and stemmed hit-highlighting
JP4997743B2 (ja) 文書検索装置、文書検索プログラムおよび文書検索方法
US20080091666A1 (en) Method and System for Processing a Text Search Query in a Collection of Documents
US20070244863A1 (en) Systems and methods for performing searches within vertical domains
US20070244862A1 (en) Systems and methods for ranking vertical domains
US9552398B1 (en) Presenting search query results
CN103430172A (zh) 检索装置、检索方法及程序
CN107870915B (zh) 对搜索结果的指示
CN102831224B (zh) 一种数据索引库的建立方法、搜索建议生成方法和装置
EP2306333A1 (en) Offline software library
JP2005250980A (ja) 文書検索システム、検索条件入力装置、検索実行装置、文書検索方法、および文書検索プログラム
CA2649534A1 (en) Systems and methods for performing searches within vertical domains
JPH05324719A (ja) 文書検索システム
CN106951513B (zh) 一种法律案件或法律法规关键字处理方法及关键字处理系统
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP4362492B2 (ja) 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム
JP3558267B2 (ja) 文書検索装置
KR101120040B1 (ko) 연관 질의어 추천 장치 및 방법
JP5292873B2 (ja) 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP4221249B2 (ja) 文献データ検索方法及びプログラム
CN107704461B (zh) 一种基于数据分析的智能路况信息检索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426