本発明は、データベースに格納された情報に含まれる単語相互間の関連を記憶した連想辞書を利用して情報検索を行う情報検索装置に関するものである。
従来、データベースを検索するために用いられる連想辞書を作成する方法として、人手によりデータベースの情報における単語相互間の関係を調べて連想辞書を作成する方法のほかに、電子化文書中の単語の出現頻度情報などを用いて連想辞書を自動的に作成する方法がある。この単語相互間の関係から連想辞書を自動的に作成する方法についても種々の方法が開発されている。
このように作成された連想辞書の利用方法として、例えば、情報検索装置において検索キーワードにより情報を検索した結果、該当する情報がない場合等に、連想辞書を用いて検索キーワードに関連するキーワードを抽出し、抽出した関連キーワードにより再度情報を検索することが行われている。
このような情報検索装置としては、検索キーワードの入力補助として、関連語が格納されている複数の連想辞書を用意し、検索に際してユーザに複数の連想辞書から1つの連想辞書を選択させ、選択された連想辞書からユーザが入力したキーワードに関連した関連語を取得して表示することができる文書処理装置が開示されている(例えば、特許文献1参照)。また、個人のニーズに対応するため、個人別連想辞書を構築し、検索キーワードを入力後、個人別の連想辞書に対して検索キーワードを検索し、個人別連想辞書内に検索キーワードが存在しない場合は全キーワードが格納されている統合連想辞書から検索キーワードに関する関連語を取得し、ユーザに提示する連想辞書作成装置が開示されている(例えば、特許文献2参照)。
特開平10−134075号公報 特開2000−348042号公報
しかしながら、従来の複数の連想辞書からユーザが使用したい辞書を選択して連想辞書を利用することができる文書処理装置では、ユーザが連想辞書に含まれる関連語の種類を理解することができるので、利用したい場面で適切な連想辞書を選択することができるが、連想辞書に含まれる関連語がユーザの嗜好の変化などによって動的に変更される場合等には、ユーザが連想辞書に含まれる関連語の種類を特定できないため、適切な場面で連想辞書を適切に利用することが困難であった。
例えば、テレビ番組において、放送波に重畳されている電子番組表などの番組情報に存在する出演者名同士の関連度合いを計算して構築された一般連想辞書と、ユーザの嗜好に合った出演者名同士を嗜好度合いに従って関連度合いを計算して構築された嗜好連想辞書とを利用して番組検索を行う装置の場合、ユーザの嗜好が移り変わると嗜好連想辞書に格納される出演者名が追加、または削除されるため、ユーザは嗜好連想辞書に格納される出演者名を知ることができない。このため、ユーザは特定の出演者名に関連付けられた出演者名を取得するため、まず嗜好連想辞書を参照して、嗜好連想辞書にはユーザの嗜好に合った関連する出演者名が存在しないことを理解した後、一般連想辞書を参照するしかなく、ユーザにとっては負荷が大きくなる。
また、従来の個人別連想辞書と全キーワードが格納されている統合連想辞書を使い分けることができる連想辞書作成装置では、検索キーワードが個人別連想辞書に存在する場合は必ず個人別連想辞書を利用するため、検索の文脈や表示コンテンツ、検索の場面を考慮して、個人別連想辞書と統合連想辞書とを場面に応じて適切に使い分けることができなかった。
例えば、テレビ番組全体に対して、放送波に重畳されている電子番組表などの番組情報に存在する単語間の関係を格納した一般連想辞書と、ユーザの好みのジャンルの番組の番組情報に存在する単語間の関係を格納した嗜好連想辞書とを利用して番組検索を行う装置の場合、ユーザの好みのジャンル外の番組情報に存在する単語に関係する関連語を嗜好連想辞書から取得しようとしても、ユーザの好みのジャンルと対象としている番組のジャンルとが異なるため、適切な関連語を取得することが困難であった。
そこで、本発明は上記の事情に鑑みてなされたものであり、ユーザの嗜好に適応して含まれる単語が動的に変更される嗜好連想辞書と、データベースに含まれる全キーワードの関係を記憶している一般連想辞書とを適切に切り替えて利用することができる情報検索装置を提供することを目的とする。
上記目的を達成するため、本発明に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つを前記適合度に基づいて選択し、選択した前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つから前記入力情報に関連する単語である関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とする。
以上のように、本発明に係る情報検索装置によれば、入力情報に対して検索条件を拡張するために嗜好連想辞書と一般連想辞書とを利用して関連語を取得する際、嗜好連想辞書の特徴を示す嗜好連想辞書特徴情報と入力情報との適合度を算出し、この適合度に基づいて嗜好連想辞書を利用する場面を決定することにより、嗜好連想辞書をより適切な検索条件や検索の文脈、表示コンテンツ、検索の場面で利用することができる。
図1は、本発明の実施の形態1に係る情報検索装置の構成を示すブロック図である。
図2は、本発明の実施の形態1に係る情報検索装置に用いられるプロファイルの一例を示す図である。
図3は、本発明の実施の形態1に係る情報検索装置に用いられる一般連想辞書の一例を示す図である。
図4は、本発明の実施の形態1に係る情報検索装置に用いられる嗜好連想辞書の一例を示す図である。
図5は、本発明の実施の形態1に係る情報検索装置の動作の流れを示すフローチャートである。
図6は、本発明の実施の形態1に係る情報検索装置に用いられる状況キーワードおよび感情キーワードを格納しているプロファイルの一例を示す図である。
図7は、本発明の実施の形態1に係る情報検索装置の表示部に表示されている情報の一例を示す図である。
図8は、本発明の実施の形態1に係る情報検索装置に用いられる関連値が格納されている嗜好連想辞書の一例を示す図である。
図9は、本発明の実施の形態1に係る情報検索装置に用いられる適合度とそれに対応した取得関連語数との関係を記憶するテーブルの一例を示す図である。
図10は、本発明の実施の形態1に係る情報検索装置に用いられる関連値が格納されている一般連想辞書の一例を示す図である。
図11は、本発明の実施の形態1に係る情報検索装置に用いられる適合度とそれに対応した取得関連語数との関係を記憶するテーブルの一例を示す図である。
図12は、本発明の実施の形態2に係る情報検索装置の構成を示すブロック図である。
図13は、本発明の実施の形態2に係る情報検索装置に用いられる嗜好連想辞書の一例を示す図である。
図14は、本発明の実施の形態2に係る情報検索装置に用いられる一般連想辞書の一例を示す図である。
図15は、本発明の実施の形態2に係る情報検索装置の動作の流れを示すフローチャートである。
図16は、本発明の実施の形態2に係る情報検索装置に用いられる取得単語記憶部の内容の一例を示す図である。
図17は、本発明の実施の形態2に係る情報検索装置に用いられる取得単語記憶部の内容の一例を示す図である。
符号の説明
101 入力部
102 プロファイル記憶部
103、203 一般連想辞書記憶部
104、201 嗜好連想辞書記憶部
105 コンテンツ記憶部
106 適合度算出部
107 検索条件生成部
108 検索部
202 取得単語記憶部
204 嗜好関連語取得部
205 未取得関連語判定部
206 一般関連語取得部
301 表示部
本発明の実施の形態に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つから、前記適合度算出手段で算出された前記適合度に基づいて前記入力情報に関連する単語である関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とするものである。
これによって、入力情報に応じて一般連想辞書および嗜好連想辞書の少なくとも一方から適切に関連語を取得することができる。
ここで、前記適合度算出手段は、前記嗜好連想辞書特徴情報としてユーザの嗜好に関する情報であるプロファイルを用いてもよい。
これによって、ユーザの嗜好を反映した嗜好連想辞書は、ユーザの嗜好に関する情報であるプロファイルと同様の特徴を有しているので、適合度をプロファイルに基づいて簡単に算出することができる。
また、前記適合度算出手段は、前記嗜好連想辞書特徴情報として前記嗜好連想辞書記憶手段に記憶されている単語を用いてもよい。
これによって、例えば、手作業によってユーザが嗜好連想辞書を編集、作成する装置など、プロファイルが存在しないような装置においても、入力情報に応じて一般連想辞書と嗜好連想辞書とをより適切に切り替えて利用することができる。
また、前記適合度算出手段は、前記入力情報として事前に前記検索手段により検索された情報を用いてもよい。
これによって、例えば、事前に検索を行い表示した検索結果に含まれるキーワードがユーザによって入力された場合に、前回の表示されている検索結果を考慮して一般連想辞書と嗜好連想辞書とを適切に切り替えて利用することができ、検索結果が嗜好連想辞書と適合する場合には、関連語としてユーザに適応した関連語を取得することができる。
また、前記検索条件生成手段は、前記適合度の値の大きさに基づいて、前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段を選択し、選択した前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段から前記関連語を取得してもよい。
また、前記検索条件生成手段は、前記適合度の値の大きさに応じた数量の前記関連語を取得してもよい。
また、前記検索条件生成手段は、前記適合度の値の大きさに応じた数量の前記関連語を前記嗜好連想辞書記憶手段および前記一般連想辞書記憶手段からそれぞれ取得してもよい。
また、本発明の実施の形態に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を関連度合いを示す関連値とともに記憶する嗜好連想辞書記憶手段と、ユーザによって入力された情報である入力情報に関連する単語である関連語として、前記嗜好連想辞書記憶手段から前記入力情報に対して前記関連値が所定の閾値以上である単語を取得するとともに、検索条件を拡張することを要求する検索条件拡張命令を受け付けると、前記所定の閾値を所定の値だけ下げる嗜好関連語取得手段と、前記検索条件拡張命令が入力されている場合に、前記嗜好関連語取得手段で前記入力情報に関連する未取得の関連語が取得されたか否かを判定する未取得関連語判定手段と、前記未取得関連語判定手段で、前記未取得の関連語が取得されていないと判定された場合に、前記一般連想辞書記憶手段から前記関連語を取得する一般関連語取得手段と、前記末取得関連語判定手段で、前記未取得の関連語が取得されたと判定された場合には、前記未取得の関連語を用いて検索条件を生成し、前記未取得の関連語が取得されていないと判定された場合には、前記一般関連語取得手段で取得された前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とするものである。
これによって、検索条件拡張命令により嗜好連想辞書用の所定の閾値を下げて嗜好連想辞書から関連語を取得することができ、さらに、嗜好連想辞書に格納される関連語を優先的に利用しながらも、嗜好連想辞書から関連語が取得できない場合には、一般連想辞書を利用して関連語を取得することができる。
ここで、前記一般連想辞書記憶手段は、前記データベースに格納された情報に含まれる複数の単語間の関係を関連度合い示す関連値とともに記憶し、前記一般関連語取得手段は、前記一般連想辞書記憶手段から前記入力情報に対して前記関連値が所定の閾値以上である単語を前記関連語として取得するとともに、同じ前記入力情報に対して前記関連語の取得が2回目以上である場合には、前記所定の閾値を所定の値だけ下げてもよい。
また、本発明の実施の形態に係る番組情報検索装置は、検索対象となる番組情報が格納されたデータベースから検索要求に適合する番組情報を検索する番組情報検索装置であって、前記データベースに格納された番組情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された番組情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つから、前記適合度算出手段で算出された前記適合度に基づいて前記入力情報に関連する単語である関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する番組情報を検索する検索手段とを備えることを特徴とするものである。
なお、本発明は、このような情報検索装置として実現することができるだけでなく、このような情報検索装置が備える特徴的な手段をステップとする情報検索方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
以下、本発明の各実施の形態について、それぞれ図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る情報検索装置の構成を示すブロック図である。
この情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を関連語を用いて検索するための装置であり、入力部101、プロファイル記憶部102、一般連想辞書記憶部103、嗜好連想辞書記憶部104、コンテンツ記憶部105、適合度算出部106、検索条件生成部107、および検索部108を含んで構成される。
入力部101は、キーボードやマウス、リモコン等の入力装置で構成され、ユーザが検索キーワードを含む検索条件や入力データを入力する。
プロファイル記憶部102は、ユーザの嗜好に関する情報であるプロファイルをユーザごとに記憶している。プロファイルには、例えば、ユーザの好みのコンテンツが属するジャンル、好みの出演者や視聴時間などを含み、それぞれのデータ(ジャンル、出演者、視聴時間など)に対応付けられた好みの度合いを示す重み値などが格納されている。
図2は、プロファイル記憶部102に格納されているプロファイルの一例を示す図である。ここでは、プロファイルには、データの種類を示すラベルと、データと、データに対するユーザの好みの度合いを示す重み値とが対応付けられて格納されており、例えば図2に示すように(ラベル、データ、重み値)として、((<ジャンル>、ドラマ、80)、(<ジャンル>、ニュース、30)、(<人名>、松下太郎、80)、(<人名>、松下花子、70)、(<人名>、松下一郎、60)、(<放送時間>、12:00〜13:00、90)、…)が格納されている。
コンテンツ記憶部105には、例えばテレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツに関する情報などが格納されている。
一般連想辞書記憶部103は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語間の関係を示す一般連想辞書を記憶している。一般連想辞書には、例えば、複数の関連のある単語である関連単語が組にして格納されている。図3は、一般連想辞書記憶部103に格納されている一般連想辞書の一例を示す図ある。ここでは、一般連想辞書には、図3に示すように関連単語の組として、(ドラマ、松下太郎、松下花子、松下五郎)、(バラエティ、松下太郎、松下次郎、漫才)、(時代劇、松下一郎)、…、が格納されている。
嗜好連想辞書記憶部104は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語に対して、ユーザの嗜好を反映した単語間の関係を示す嗜好連想辞書を記憶している。嗜好連想辞書には、例えば、プロファイルに含まれるユーザが視聴したテレビ放送番組に関する情報から抽出されるジャンルや人名、放送時間などの単語に対して、コンテンツ記憶部105に格納されている情報における関連単語が組みにして格納されている。ここでは、プロファイルに含まれる単語をユーザが視聴したテレビ放送番組に関する情報から抽出される単語としたが、ユーザが直接入力する好みのジャンルや人名、放送時間をプロファイルに含まれる単語としてもよい。図4は、嗜好連想辞書記憶部104に格納されている嗜好連想辞書の一例を示す図である。ここでは、嗜好連想辞書には、図4に示すように嗜好連想辞書関連単語の組として、(ドラマ、松下太郎、松下花子)、(松下太郎、松下一郎)が格納されている。
適合度算出部106は、入力部101から入力された検索条件と嗜好連想辞書記憶部104に格納されている嗜好連想辞書との適合度を算出する。ここでは、検索条件に含まれる検索キーワードを入力情報として用い、また、嗜好連想辞書はプロファイル記憶部102に格納されるプロファイルに基づき作成されているので、プロファイルを嗜好連想辞書に格納される単語の特徴を示す嗜好連想辞書特徴情報として用いる。よって、適合度算出部106は、検索条件に含まれる検索キーワードと、プロファイル記憶部102に格納されているプロファイルとの適合度を算出する。すなわち、適合度算出部106は、入力される検索条件に含まれる検索キーワードでプロファイルを検索し、プロファイル内においてこの検索キーワードに対して付与されている重み値を加算した値を適合度として算出する。なお、入力情報として、入力部101から入力された検索条件に含まれる検索キーワードを用いているとしているが、この入力には例えば指定することも含まれる。
検索条件生成部107は、適合度算出部106で算出された適合度に基づいて、一般連想辞書記憶部103に格納されている一般連想辞書、または嗜好連想辞書記憶部104に格納されている嗜好連想辞書を選択し、選択した一般連想辞書または嗜好連想辞書から検索キーワードに関連する関連語を取得し、検索条件を生成する。ここでは、検索条件生成部107は、適合度算出部106で算出された適合度が、所定の閾値よりも小さい場合は一般連想辞書から関連語を取得し、適合度が所定の閾値よりも大きい場合は嗜好連想辞書から関連語を取得する。
検索部108は、検索条件生成部107で生成された検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果として出力する。
次に、このように構成された本実施の形態による情報検索装置の動作について説明する。図5は情報検索装置の動作の流れを示すフローチャートである。
ユーザによって入力部101から検索条件が入力されると、この検索条件を適合度算出部106が受け付ける(ステップS101)。具体的な一例として、ユーザが入力部101から検索条件「松下太郎のドラマを見たい」を入力した場合と、「松下太郎のバラエティを見たい」を入力した場合とについてそれぞれ説明する。
適合度算出部106は、受け付けた検索条件と、プロファイル記憶部102に格納されているプロファイルとの適合度を算出する(ステップS102)。すなわち、適合度算出部106は、入力部101から入力された検索条件から検索キーワードを抽出し、プロファイル記憶部102に記憶されるプロファイル内に検索キーワードが存在する場合は、その検索キーワードに対する重み値を加算することで、検索条件とプロファイルとの適合度を算出する。上記の例の検索条件が「松下太郎のドラマを見たい」である場合には、適合度算出部106は、検索キーワード「松下太郎、ドラマ」を抽出し、プロファイルに格納されている「松下太郎」の重み値「80」と「ドラマ」の重み値「80」を加算して、適合度として「160」を算出する。また、上記の例の検索条件が「松下太郎のバラエティを見たい」である場合には、適合度算出部106は、検索キーワード「松下太郎、バラエティ」を抽出し、プロファイルに格納されている「松下太郎」の重み値「80」のみにより適合度として「80」を算出する。
次に、検索条件生成部107は、適合度算出部106で算出された適合度と所定の閾値との大小を判定する(ステップS103)。ここで、適合度が所定の閾値以下の場合(ステップS103でNO)には、検索条件生成部107は、一般連想辞書記憶部103に格納される一般連想辞書を選択し、選択した一般連想辞書から検索条件に含まれる検索キーワードに関連する関連語を取得し(ステップS104)、検索条件を生成する(ステップS106)。一方、適合度が所定の閾値よりも大きい場合(ステップS103でYES)には、検索条件生成部107は、嗜好連想辞書記憶部104に格納される嗜好連想辞書を選択し、選択した嗜好連想辞書から検索条件に含まれる検索キーワードに関連する関連語を取得し(ステップS105)、検索条件を生成する(ステップS106)。上記の例の検索条件が「松下太郎のバラエティを見たい」である場合には、適合度算出部106で算出された検索キーワード「松下太郎、バラエティ」に対する適合度が「80」であるので、検索条件生成部107は、所定の閾値(ここでは一例として、所定の閾値を「100」とする)以下と判断する。そして、検索条件生成部107は、一般連想辞書記憶部103に格納されている一般連想辞書から検索キーワード「松下太郎、バラエティ」の関連語「ドラマ、松下花子、松下五郎、松下次郎、漫才」を取得し、取得した関連語と検索キーワードとを検索条件として出力する。また、上記の例の検索条件が「松下太郎のドラマを見たい」である場合には、適合度算出部106で算出された検索キーワード「松下太郎、ドラマ」に対する適合度が「160」であるので、検索条件生成部107は、所定の閾値「100」よりも大きいと判断する。そして、検索条件生成部107は、嗜好連想辞書記憶部104に格納されている嗜好連想辞書から検索キーワード「松下太郎、ドラマ」の関連語「松下花子、松下一郎」を取得し、取得した関連語と検索キーワードとを検索条件として出力する。
次に、検索部108は、検索条件生成部107で生成された検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS107)。上記の例の検索条件が「松下太郎のバラエティを見たい」である場合には、検索部108は、検索条件生成部107で生成された検索条件「松下太郎、ドラマ、松下花子、松下五郎、バラエティ、松下次郎、漫才」のいずれかのキーワードが含まれる情報をコンテンツ記憶部105から取得し、それぞれの検索結果とする。また、上記の例の検索条件が「松下太郎のドラマを見たい」である場合には、検索部108は、検索条件「松下太郎、ドラマ、松下花子、松下一郎」のいずれかのキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
なお、本実施の形態では、適合度算出部106は、入力部101から入力される検索条件とプロファイル記憶部102に格納されるプロファイルとの適合度を算出したが、プロファイルの代わりに嗜好連想辞書記憶部104に格納されている嗜好連想辞書を用いて適合度を算出するようにしてもよい。この場合、例えばユーザによって入力部101から検索条件「松下五郎の時代劇を見たい」が入力された場合、検索条件から検索キーワード「松下五郎、時代劇」を抽出し、嗜好連想辞書記憶部104に格納されている嗜好連想辞書から検索キーワード「松下五郎、時代劇」の関連語を所定数以上取得できた場合は、取得した関連語と検索キーワードを検索条件として検索部108に出力し、関連語が所定数以下の場合は、一般連想辞書記憶部103に格納される一般連想辞書から関連語を取得し、取得した関連語と検索キーワードを検索条件として検索部108に出力する。この例では、嗜好連想辞書から取得される検索キーワード「松下五郎、時代劇」の関連語の数は「0」となり、例えば所定数を4とすると、所定数以下となるため、一般連想辞書から検索キーワード「松下五郎、時代劇」の関連語「ドラマ、松下太郎、松下花子、松下一郎」を取得し、取得した関連語と検索キーワードとを検索条件として検索部108に出力する。こうすることで、手作業によってユーザが嗜好連想辞書を編集、作成する装置など、プロファイルが存在しないような装置においても、検索条件に対して一般連想辞書と嗜好連想辞書をより適切に自動的に切り替えて利用することができる。
また、本実施の形態では、適合度算出部106は、入力部101から入力される検索条件に含まれる検索キーワードとプロファイル記憶部102に格納されるプロファイルとの適合度を算出したが、プロファイルの情報として使用場所等の使用状況を表す状況キーワードやユーザの感情を表す感情キーワードなども格納している場合、入力部101からユーザの状況や感情キーワード等も入力できるようにし、ユーザが入力した状況や感情キーワード等とプロファイルとの適合度を算出するようにしてもよい。
図6は、状況キーワードおよび感情キーワードを格納しているプロファイルの一例を示す図である。このプロファイルには、図6に示すように状況キーワードと、感情キーワードと、データの種類を示すラベルと、データと、データに対するユーザの好みの度合いを示す重み値とが対応付けられて格納されている。この場合、例えば家の「リビング」においてユーザによって入力部101から検索条件として「松下太郎が出ている楽しいドラマを見たい」が入力された場合、適合度算出部106は、検索条件から感情キーワード「楽しい」と検索キーワード「松下太郎、ドラマ」を抽出し、プロファイル内の状況キーワード「リビング」、感情キーワード「楽しい」の項目に属するデータ「松下太郎、ドラマ」の重み値を加算して適合度「160」を算出し、算出した適合度を検索条件生成部107に出力する。こうすることで、ユーザの状況や感情に合わせて一般連想辞書と嗜好連想辞書をより適切な状況で自動的に切り替えて利用することができ、ユーザの状況や感情に合った関連語を取得することができる。
また、本実施の形態では、適合度算出部106は、入力部101から入力される検索条件とプロファイル記憶部102に格納されるプロファイルとの適合度を算出したが、情報検索装置がさらに表示部301を備え、表示部301においてコンテンツを表示している場合、そのコンテンツとプロファイルとの適合度を算出するようにしてもよい。
図7は、表示部に表示されている情報の一例を示す図である。例えば、図7に示すように表示部301に松下太郎が出演しているドラマの情報が表示されている状況で、ユーザによって入力部101から検索条件として、「松下太郎の他の番組を見たい」と入力された場合、適合度算出部106は、検索条件から検索キーワード「松下太郎」を抽出し、次に表示部301に表示している情報の中でコンテンツの特徴を現す単語(ここでは一例として「松下太郎、ドラマ」)を抽出する。そして、適合度算出部106は、抽出した単語「松下太郎、ドラマ」と図3に示すプロファイルとの適合度「160」を算出し、この算出した適合度「160」と検索キーワード「松下太郎」とを検索条件生成部107に出力する。こうすることで、事前に検索を行い表示した検索結果に含まれるキーワードがユーザによって入力部101から入力された場合に、前回の表示されている検索結果を考慮して一般連想辞書と嗜好連想辞書とを自動的に切り替えて利用することができ、表示コンテンツが嗜好連想辞書と適合する場合には、関連語としてユーザに適応した関連語を取得することができる。
また、本実施の形態では、検索条件生成部107は、一般連想辞書記憶部103に格納される一般連想辞書、または、嗜好連想辞書記憶部104に格納される嗜好連想辞書から入力部101から入力される検索条件に含まれる検索キーワードに関連する関連語を全て取得していたが、一般連想辞書と嗜好連想辞書にそれぞれの辞書内の関連語間の関連度合いが関連値として定義されている場合、検索キーワードに関連する関連語から関連値の大きい関連語のみを取得するようにしてもよい。
図8は、関連値が格納されている嗜好連想辞書の一例を示す図である。ここで、例えば、検索条件生成部107は、適合度算出部106から適合度「160」と検索キーワード「松下太郎、ドラマ」とが入力された場合、適合度「160」が所定の閾値「100」よりも大きいと判断し、図8に示す嗜好連想辞書記憶部104に格納される嗜好連想辞書から所定の数の関連語(ここでは、一例として関連値の大きい方から3個、または所定の重み値以上の関連語としてもよい)「松下一郎、松下次郎、松下三郎」を取得し、取得した関連語と検索キーワードとを検索条件として出力する。こうすることで、取得される関連語の関連度合いに関する精度を向上させることができる。
また、本実施の形態では、検索条件生成部107は、嗜好連想辞書記憶部104に格納される嗜好連想辞書から入力部101から入力される検索条件に含まれる検索キーワードに関連する関連語を取得する際に、全ての関連語を取得していたが、嗜好連想辞書内の関連語同士の関連度合いが関連値として定義されている場合、適合度算出部106で算出される適合度に比例した数量の関連語を関連度が高い順に嗜好連想辞書から取得するようにしてもよい。
この場合、例えば、検索条件生成部107は、適合度算出部106から適合度「160」と検索キーワード「松下太郎、ドラマ」が入力された場合、適合度「160」が所定の閾値「100」よりも大きくさらに嗜好連想辞書に対する適合度も高いと判断し、適合度が高い場合は、嗜好連想辞書記憶部104に格納される図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から3個)、または、適合度に反比例した重み値以上の関連語としてもよい)「松下一郎、松下次郎、松下三郎」を取得する。
また、例えば、検索条件生成部107は、適合度算出部106から適合度110と検索キーワード「松下太郎、ニュース」が入力された場合、適合度110が所定の閾値100よりも大きいが嗜好連想辞書に対する適合度は低いと判断し、適合度が低い場合は、図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した一般連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から1個)、または、適合度に反比例した重み値以上の関連語としてもよい)「松下一郎」を取得する。
こうすることで、検索条件と嗜好連想辞書の適合度が高い場合は検索条件に関連度合いが高い関連語の数量が多く嗜好連想辞書に格納されていると考え、取得する関連語を多くし、検索条件と嗜好連想辞書の適合度が低い場合は検索条件に関連度合い高い関連語の数量が嗜好連想辞書には少ないと考え、取得する関連語を少なくすることで、取得する関連語の関連度合いに関する精度を向上させることができる。
また、本実施の形態では、検索条件生成部107は、一般連想辞書記憶部103に格納される一般連想辞書、または、嗜好連想辞書記憶部104に格納される嗜好連想辞書を選択し、入力部101から入力される検索条件に含まれる検索キーワードに関連する関連語を取得していたが、一般連想辞書と嗜好連想辞書の両方から適合度算出部106で算出される適合度に応じた数量の関連語を取得するようにしてもよい。
この場合、検索条件生成部107は、例えば適合度算出部106から適合度160と検索キーワード「松下太郎、ドラマ」が入力された場合、嗜好連想辞書に対する適合度が高いと判断し、適合度が高い場合は、嗜好連想辞書記憶部104に格納される図8に示すような嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から3個)、または、適合度に反比例した重み値以上の関連語)「松下一郎、松下次郎、松下三郎」を取得する。さらに、検索条件生成部107は、一般連想辞書記憶部103に格納される図10に示すような一般連想辞書から所定数の関連語(ここでは、一例として図11に示すような適合度とそれに対応した一般連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から1個)、または、検索条件生成部107で取得する関連語総数をあらかじめ決めておき、この総数から嗜好連想辞書から取得される関連語総数を除いた数でもよい)「松下六郎」を取得する。
また、検索条件生成部107は、例えば適合度算出部106から適合度110と検索キーワード「松下太郎、ニュース」が入力された場合、嗜好連想辞書に対する適合度が低いと判断し、適合度が低い場合は、図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(重み値の大きい方から1個)、または、適合度に反比例した重み値以上の関連語)「松下一郎」を取得する。さらに、検索条件生成部107は、図10に示すような一般連想辞書から所定数の関連語(ここでは、一例として図11に示すような適合度とそれに対応した一般連想辞書から取得する関連語の数が格納されるテーブルを参照して(重み値の大きい方から2個)、または、検索条件生成部107で取得する関連語総数をあらかじめ決めておき、この総数から嗜好連想辞書から取得される関連語総数除いた数でもよい)「松下六郎、松下五郎」を取得する。
こうすることで、検索条件と嗜好連想辞書の適合度が低い場合でも、一般連想辞書から関連語を取得するだけでなく、嗜好連想辞書からも検索条件との関連度合いが高い関連語のみを取得することで、一般的な関連語のみでなく、嗜好が反映された関連語をユーザに案内、または、情報検索することができる。
また、本実施の形態では、コンテンツ記憶部105に蓄積されるコンテンツは、テレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツであるとしたが、これに限定されることはなく、インターネット上のWEBページやコンテンツの情報を含んでもよい。
また、本実施の形態では、適合度算出部106は、検索条件とプロファイル記憶部102に格納されるプロファイルとの適合度を算出する際に、プロファイル内に含まれる重み値を加算することで適合度を求めていたが、これに限定されることはなく、例えば、検索条件に含まれる検索キーワードに対する重み値を求めてベクトルと見なし、プロファイルから求められるベクトルとの内積値などを適合度としてもよく、検索条件とプロファイルとの距離を計算できる任意の手法を利用することができる。ここで、検索条件とプロファイルとの適合度として距離を利用する場合は、適合度が小さいほど検索条件とプロファイルとが適合しているこということであり、検索条件生成部107は、適合度が所定の閾値よりも小さい場合は嗜好連想辞書から関連語を取得し、適合度が所定の閾値よりも大きい場合は一般連想辞書から関連語を取得する。
また、本実施の形態では、検索条件生成部107は関連語を取得して検索条件を生成したが、情報検索装置がさらに表示部を備え、検索条件生成部107は取得した関連語を表示部に表示して、ユーザに関連語を選択させ、ユーザによって選択された関連語を用いて検索条件を生成するようにしてもよい。こうすることで、ユーザは関連語を特定して情報検索を行うことができる。
以上のように、本実施の形態によれば、検索キーワードに対して検索条件を拡張するために嗜好連想辞書と一般連想辞書とを利用する際、嗜好連想辞書の特徴を表す嗜好連想辞書特徴情報と検索条件や表示コンテンツ、検索の場面に関する情報の特徴との適合度を算出し、この適合度に基づいて嗜好連想辞書を利用する場面を決定することにより、嗜好連想辞書をより適切な検索条件や検索の文脈、表示コンテンツ、検索の場面で利用することができる。
(実施の形態2)
図12は、本発明の実施の形態2に係る情報検索装置の構成を示すブロック図である。なお、実施の形態1と同様の部分については同じ符号を付し、詳細な説明を省略する。
本実施の形態の情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を関連語を用いて検索するための装置であり、入力部101、コンテンツ記憶部105、検索部207、嗜好連想辞書記憶部201、取得単語記憶部202、一般連想辞書記憶部203、嗜好関連語取得部204、未取得関連語判定部205、および一般関連語取得部206を含んで構成される。
嗜好連想辞書記憶部201は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語に対して、ユーザの嗜好を反映した単語間の関係を示す嗜好連想辞書を記憶している。嗜好連想辞書には、例えば、関連のある単語同士を対とした関連語対(関連語1、関連語2)と関連語対の関連度合いを表す関連値とが対応付けて格納されている。図13は、嗜好連想辞書記憶部201に格納されている嗜好連想辞書の一例を示す図である。ここでは、嗜好連想辞書には、図13に示すように(関連語対、関連値)として、((松下次郎、松下太郎)、80)、((ドラマ、松下花子)、70)、((松下太郎、松下花子)、50)が格納されている。なお、ここでは関連値が高いほど関連度合いが高いものとする。
取得単語記憶部202は、未取得関連語判定部205で取得される関連語を記憶する。
一般連想辞書記憶部203は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語間の関係を示す一般連想辞書を記憶している。一般連想辞書には、例えば、関連のある単語同士を対とした関連語対(関連語1、関連語2)と関連語対の関連度合いを表す関連値とが対応付けて格納されている。図14は、一般連想辞書記憶部203に格納される一般連想辞書の一例を示す図ある。ここでは、一般連想辞書には、図14に示すように(関連語対、関連値)として、((松下太郎、松下一郎)、80)、((バラエティ、松下一郎)、70)、((バラエティ、漫才)、90)、…、が格納されている。
嗜好関連語取得部204は、入力部101から検索条件が入力された場合には、検索条件に含まれる検索キーワードと所定の閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する。また、嗜好関連語取得部204は、入力部101から検索条件拡張命令が入力された場合には、所定の閾値を下げて、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する。
未取得関連語判定部205は、入力部101から検索条件が入力された場合には、取得単語記憶部202を初期化して嗜好関連語取得部204で取得された関連語を取得単語記憶部202に格納し、さらにこの関連語を検索部207に出力する。また、未取得関連語判定部205は、入力部101から検索条件拡張命令が入力された場合には、嗜好関連語取得部204で取得される関連語が取得単語記憶部202に既に記憶されているか判定する。取得関連語判定部205は、関連語が記憶されていない場合には、前記関連語を取得単語記憶部202に追加記憶して、さらに前記関連語を検索部207に出力する。また、記憶されている場合には、一般関連語取得部206に入力部101から入力された検索条件に含まれる検索キーワードを出力する。
一般関連語取得部206は、未取得関連語判定部205から検索キーワードが入力されると、一般連想辞書記憶部203に格納される一般連想辞書から検索キーワードと所定の閾値以上の関連値で関連付けられた関連語を取得し、取得した関連語を検索部207に出力する。また、一般関連語取得部206は、未取得関連語判定部205から入力される検索キーワードが2回目以上である場合には、所定の閾値を下げて、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を一般連想辞書記憶部203に格納される一般連想辞書から取得する。
検索部207は、未取得関連語判定部205、または、一般関連語取得部206から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする。
次に、このように構成された本実施の形態による情報検索装置の動作について説明する。図15はこの情報検索装置の動作の流れを示すフローチャートである。
ユーザによって入力部101から検索条件または検索条件拡張命令が入力されると、この検索条件または検索条件拡張命令を嗜好関連語取得部204が受け付ける(ステップS201)。
次に、嗜好関連語取得部204は、受け付けた検索条件または検索条件拡張命令が検索条件であるか検索条件拡張命令であるかを判定する(ステップS202)。この判定の結果、検索条件である場合(ステップS202でYES)には、嗜好関連語取得部204は、検索条件に含まれる検索キーワードと嗜好連想辞書用の所定の閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する(ステップS203)。具体的な一例として、ユーザが入力部101から検索条件「松下太郎」を入力した場合について説明する。この例では、嗜好関連語取得部204は、入力部101から入力された検索条件「松下太郎」に含まれる検索キーワード「松下太郎」と所定の閾値(ここでは一例として、所定の閾値を「60」とする)以上の関連値で関連付けられた関連語「松下次郎」を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する。
次に、未取得関連語判定部205は、取得単語記憶部202を初期化して(ステップS204)、嗜好関連語取得部204で取得された関連語を取得単語記憶部202に格納し(ステップS205)、さらに関連語を検索部207に出力する。上記の例では、未取得関連語判定部205は、取得単語記憶部202を初期化して、嗜好関連語取得部204で取得された関連語「松下次郎」を取得単語記憶部202に格納し、さらに関連語を検索部207に出力する。図16は、関連語「松下次郎」が格納された時の取得単語記憶部202の内容を示す図である。
次に、検索部207は、未取得関連語判定部205から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS213)。上記の例では、検索部207は、未取得関連語判定部205から関連語「松下次郎」が入力されると、入力された関連語「松下次郎」から検索条件「松下次郎」を生成し、検索条件「松下次郎」のキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
一方、上記判定の結果、検索条件拡張命令である場合(ステップS202でNO)には、嗜好関連語取得部204は、嗜好連想辞書用の所定の閾値を下げる(ステップS206)。そして、嗜好関連語取得部204は、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する(ステップS207)。具体的な一例として、ユーザによって入力部101から検索条件「松下太郎」が入力された後に、検索条件拡張命令が入力された場合について説明する。この例では、嗜好関連語取得部204は、入力部101から検索条件拡張命令が入力されると、閾値「60」を閾値「50」に下げ(ここでは一例として閾値の下げ幅を「10」とする)、嗜好連想辞書記憶部201に格納される嗜好連想辞書から検索条件「松下太郎」に含まれる検索キーワード「松下太郎」と閾値50以上の関連値で関連付けられた関連語「松下次郎、松下花子」を取得する。また、ここでは、閾値以上の関連語を取得するようにしたが、関連値の大きい順に取得する関連語数を増加するようにしてもよい。
次に、未取得関連語判定部205は、嗜好関連語取得部204で取得された関連語が取得単語記憶部202に既に記憶されているか判定する(ステップS208)。この判定の結果、記憶されていない場合、すなわち未取得の関連語を取得できた場合(ステップS208でYES)には、未取得関連語判定部205は、この関連語を取得単語記憶部202に追加記憶して(ステップS209)、さらにこの関連語を検索部207に出力する。上記の例では、未取得関連語判定部205は、嗜好関連語取得部204で取得される関連語「松下次郎、松下花子」の内、関連語「松下花子」が取得単語記憶部202に記憶されていないと判定し、関連語「松下花子」を取得単語記憶部202に追加記憶して、さらに関連語「松下花子」を検索部207に出力する。図17は、関連語「松下花子」が格納された時の取得単語記憶部202の内容を示す図である。
次に、検索部207は、未取得関連語判定部205から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS213)。上記の例では、検索部207は、未取得関連語判定部205から関連語「松下花子」が入力されると、入力された関連語「松下花子」から検索条件「松下花子」を生成し、検索条件「松下花子」のキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
一方、上記判定の結果、関連語が記憶されている場合、すなわち未取得の関連語を取得できなかった場合(ステップS208でNO)には、入力部101から入力された検索条件に含まれる検索キーワードを一般関連語取得部206に出力する。一般関連語取得部206は、未取得関連語判定部205から検索キーワードが入力されると、未取得関連語判定部205から検索キーワードが入力されたのが初回目であるか否かを判定する(ステップS210)。初回目である場合(ステップS210でYES)には、一般関連語取得部206は、一般連想辞書記憶部203に格納されている一般連想辞書から検索キーワードと一般連想辞書用の所定の閾値以上の関連値で関連付けられた関連語を取得し(ステップS212)、取得した関連語を検索部207に出力する。また、初回目でない場合(ステップS210でNO)には、一般関連語取得部206は、一般連想辞書用の所定の閾値を下げる(ステップS211)。そして、一般関連語取得部206は、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を一般連想辞書記憶部203に格納されている一般連想辞書から取得する(ステップS212)、取得した関連語を検索部207に出力する。
次に、検索部207は、一般関連語取得部206から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS213)。
具体的な一例として、ユーザによって入力部101から検索条件「松下太郎」が入力された後に、検索条件拡張命令の2回目が入力された場合について説明する。嗜好関連語取得部204は、入力部101から検索条件拡張命令が入力されると、閾値50を閾値40に下げ、嗜好連想辞書記憶部201に格納される嗜好連想辞書から検索条件「松下太郎」に含まれる検索キーワード「松下太郎」と閾値40以上の関連値で関連付けられた関連語「松下次郎、松下花子」を取得する。次に、未取得関連語判定部205は、嗜好関連語取得部204で取得される関連語「松下次郎、松下花子」が取得単語記憶部202に既に記憶されていると判定し、入力部101から入力された検索条件「松下太郎」に含まれる検索キーワード「松下太郎」を一般関連語取得部206に出力する。
次に、一般関連語取得部206は、未取得関連語判定部205から検索キーワード「松下太郎」が入力されると、一般連想辞書記憶部203に格納される一般連想辞書から検索キーワード「松下太郎」と所定の閾値(ここでは一例として、所定の閾値を80とする)以上の関連値で関連付けられた関連語「松下一郎」を取得し、取得した関連語「松下一郎」を検索部207に出力する。検索部207は、一般関連語取得部206から関連語「松下一郎」が入力されると、入力された関連語「松下一郎」から検索条件「松下一郎」を生成し、検索条件「松下一郎」のキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
なお、本実施の形態では、一般関連語取得部206は、未取得関連語判定部205から入力された検索キーワードに関連した関連語を一般連想辞書記憶部203から取得するようにしたが、さらに、取得単語記憶部202を参照し、一般連想辞書記憶部203から取得した関連語から取得単語記憶部202に記憶されている関連語を除き、残された関連語のみを検索部207に出力するようにしてもよい。こうすることで、既に検索を行った関連語を検索することがなくなり、ユーザに同じ関連語で検索した重複した検索結果を提示しなくてもよくなる。
また、本実施の形態では、コンテンツ記憶部105に蓄積されるコンテンツは、テレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツであるとしたが、これに限定されることはなく、インターネット上のWEBページやコンテンツの情報を含んでもよい。
また、本実施の形態では、検索部207は関連語を取得して検索条件を生成したが、情報検索装置がさらに表示部を備え、検索部207は取得した関連語を表示部に表示して、ユーザに関連語を選択させ、ユーザの選択した関連語を用いて検索条件を生成するようにしてもよい。こうすることで、ユーザは関連語を特定して情報検索を行うことができる。
以上のように、本実施の形態によれば、嗜好連想辞書に格納される関連語を優先的に利用しながらも、嗜好連想辞書から関連語が取得できない場合には、一般連想辞書を利用して関連語を取得することができる。
なお、上記実施の形態1において、一般連想辞書記憶部103は一般連想辞書記憶手段に、嗜好連想辞書記憶部104は嗜好連想辞書記憶手段に、適合度算出部106は適合度算出手段に、検索条件生成部107は検索条件生成手段に、検索部108は検索手段に、それぞれ相当する。
また、上記実施の形態2において、嗜好連想辞書記憶部201は嗜好連想辞書記憶手段に、一般連想辞書記憶部203は一般連想辞書記憶手段に、嗜好関連語取得部204は嗜好関連語取得手段に、未取得関連語判定部205は未取得関連語判定手段に、一般関連語取得部206は一般関連語取得手段に、検索部207は検索条件生成手段および検索手段に、それぞれ相当する。
本発明に係る情報検索装置は、嗜好連想辞書と一般連想辞書を利用する際、嗜好連想辞書をより適切な検索条件や検索の文脈、表示コンテンツ、検索場面で利用することができ、ハードディスクレコーダやDVDレコーダ、TV、オーディオコンポ、インターネットにアクセスして情報検索を行うことができる端末等として有用である。
本発明は、データベースに格納された情報に含まれる単語相互間の関連を記憶した連想辞書を利用して情報検索を行う情報検索装置に関するものである。
従来、データベースを検索するために用いられる連想辞書を作成する方法として、人手によりデータベースの情報における単語相互間の関係を調べて連想辞書を作成する方法のほかに、電子化文書中の単語の出現頻度情報などを用いて連想辞書を自動的に作成する方法がある。この単語相互間の関係から連想辞書を自動的に作成する方法についても種々の方法が開発されている。
このように作成された連想辞書の利用方法として、例えば、情報検索装置において検索キーワードにより情報を検索した結果、該当する情報がない場合等に、連想辞書を用いて検索キーワードに関連するキーワードを抽出し、抽出した関連キーワードにより再度情報を検索することが行われている。
このような情報検索装置としては、検索キーワードの入力補助として、関連語が格納されている複数の連想辞書を用意し、検索に際してユーザに複数の連想辞書から1つの連想辞書を選択させ、選択された連想辞書からユーザが入力したキーワードに関連した関連語を取得して表示することができる文書処理装置が開示されている(例えば、特許文献1参照)。また、個人のニーズに対応するため、個人別連想辞書を構築し、検索キーワードを入力後、個人別の連想辞書に対して検索キーワードを検索し、個人別連想辞書内に検索キーワードが存在しない場合は全キーワードが格納されている統合連想辞書から検索キーワードに関する関連語を取得し、ユーザに提示する連想辞書作成装置が開示されている(例えば、特許文献2参照)。
特開平10−134075号公報
特開2000−348042号公報
しかしながら、従来の複数の連想辞書からユーザが使用したい辞書を選択して連想辞書を利用することができる文書処理装置では、ユーザが連想辞書に含まれる関連語の種類を理解することができるので、利用したい場面で適切な連想辞書を選択することができるが、連想辞書に含まれる関連語がユーザの嗜好の変化などによって動的に変更される場合等には、ユーザが連想辞書に含まれる関連語の種類を特定できないため、適切な場面で連想辞書を適切に利用することが困難であった。
例えば、テレビ番組において、放送波に重畳されている電子番組表などの番組情報に存在する出演者名同士の関連度合いを計算して構築された一般連想辞書と、ユーザの嗜好に合った出演者名同士を嗜好度合いに従って関連度合いを計算して構築された嗜好連想辞書とを利用して番組検索を行う装置の場合、ユーザの嗜好が移り変わると嗜好連想辞書に格納される出演者名が追加、または削除されるため、ユーザは嗜好連想辞書に格納される出演者名を知ることができない。このため、ユーザは特定の出演者名に関連付けられた出演者名を取得するため、まず嗜好連想辞書を参照して、嗜好連想辞書にはユーザの嗜好に合った関連する出演者名が存在しないことを理解した後、一般連想辞書を参照するしかなく、ユーザにとっては負荷が大きくなる。
また、従来の個人別連想辞書と全キーワードが格納されている統合連想辞書を使い分けることができる連想辞書作成装置では、検索キーワードが個人別連想辞書に存在する場合は必ず個人別連想辞書を利用するため、検索の文脈や表示コンテンツ、検索の場面を考慮して、個人別連想辞書と統合連想辞書とを場面に応じて適切に使い分けることができなかった。
例えば、テレビ番組全体に対して、放送波に重畳されている電子番組表などの番組情報に存在する単語間の関係を格納した一般連想辞書と、ユーザの好みのジャンルの番組の番組情報に存在する単語間の関係を格納した嗜好連想辞書とを利用して番組検索を行う装置の場合、ユーザの好みのジャンル外の番組情報に存在する単語に関係する関連語を嗜好連想辞書から取得しようとしても、ユーザの好みのジャンルと対象としている番組のジャンルとが異なるため、適切な関連語を取得することが困難であった。
そこで、本発明は上記の事情に鑑みてなされたものであり、ユーザの嗜好に適応して含まれる単語が動的に変更される嗜好連想辞書と、データベースに含まれる全キーワードの関係を記憶している一般連想辞書とを適切に切り替えて利用することができる情報検索装置を提供することを目的とする。
上記目的を達成するため、本発明に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つを前記適合度に基づいて選択し、選択した前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つから前記入力情報に関連する単語である関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とする。
以上のように、本発明に係る情報検索装置によれば、入力情報に対して検索条件を拡張するために嗜好連想辞書と一般連想辞書とを利用して関連語を取得する際、嗜好連想辞書の特徴を示す嗜好連想辞書特徴情報と入力情報との適合度を算出し、この適合度に基づいて嗜好連想辞書を利用する場面を決定することにより、嗜好連想辞書をより適切な検索条件や検索の文脈、表示コンテンツ、検索の場面で利用することができる。
本発明の実施の形態に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つから、前記適合度算出手段で算出された前記適合度に基づいて前記入力情報に関連する単語である関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とするものである。
これによって、入力情報に応じて一般連想辞書および嗜好連想辞書の少なくとも一方から適切に関連語を取得することができる。
ここで、前記適合度算出手段は、前記嗜好連想辞書特徴情報としてユーザの嗜好に関する情報であるプロファイルを用いてもよい。
これによって、ユーザの嗜好を反映した嗜好連想辞書は、ユーザの嗜好に関する情報であるプロファイルと同様の特徴を有しているので、適合度をプロファイルに基づいて簡単に算出することができる。
また、前記適合度算出手段は、前記嗜好連想辞書特徴情報として前記嗜好連想辞書記憶手段に記憶されている単語を用いてもよい。
これによって、例えば、手作業によってユーザが嗜好連想辞書を編集、作成する装置など、プロファイルが存在しないような装置においても、入力情報に応じて一般連想辞書と嗜好連想辞書とをより適切に切り替えて利用することができる。
また、前記適合度算出手段は、前記入力情報として事前に前記検索手段により検索された情報を用いてもよい。
これによって、例えば、事前に検索を行い表示した検索結果に含まれるキーワードがユーザによって入力された場合に、前回の表示されている検索結果を考慮して一般連想辞書と嗜好連想辞書とを適切に切り替えて利用することができ、検索結果が嗜好連想辞書と適合する場合には、関連語としてユーザに適応した関連語を取得することができる。
また、前記検索条件生成手段は、前記適合度の値の大きさに基づいて、前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段を選択し、選択した前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段から前記関連語を取得してもよい。
また、前記検索条件生成手段は、前記適合度の値の大きさに応じた数量の前記関連語を取得してもよい。
また、前記検索条件生成手段は、前記適合度の値の大きさに応じた数量の前記関連語を前記嗜好連想辞書記憶手段および前記一般連想辞書記憶手段からそれぞれ取得してもよい。
また、本発明の実施の形態に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を関連度合いを示す関連値とともに記憶する嗜好連想辞書記憶手段と、ユーザによって入力された情報である入力情報に関連する単語である関連語として、前記嗜好連想辞書記憶手段から前記入力情報に対して前記関連値が所定の閾値以上である単語を取得するとともに、検索条件を拡張することを要求する検索条件拡張命令を受け付けると、前記所定の閾値を所定の値だけ下げる嗜好関連語取得手段と、前記検索条件拡張命令が入力されている場合に、前記嗜好関連語取得手段で前記入力情報に関連する未取得の関連語が取得されたか否かを判定する未取得関連語判定手段と、前記未取得関連語判定手段で、前記未取得の関連語が取得されていないと判定された場合に、前記一般連想辞書記憶手段から前記関連語を取得する一般関連語取得手段と、前記未取得関連語判定手段で、前記未取得の関連語が取得されたと判定された場合には、前記未取得の関連語を用いて検索条件を生成し、前記未取得の関連語が取得されていないと判定された場合には、前記一般関連語取得手段で取得された前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とするものである。
これによって、検索条件拡張命令により嗜好連想辞書用の所定の閾値を下げて嗜好連想辞書から関連語を取得することができ、さらに、嗜好連想辞書に格納される関連語を優先的に利用しながらも、嗜好連想辞書から関連語が取得できない場合には、一般連想辞書を利用して関連語を取得することができる。
ここで、前記一般連想辞書記憶手段は、前記データベースに格納された情報に含まれる複数の単語間の関係を関連度合い示す関連値とともに記憶し、前記一般関連語取得手段は、前記一般連想辞書記憶手段から前記入力情報に対して前記関連値が所定の閾値以上である単語を前記関連語として取得するとともに、同じ前記入力情報に対して前記関連語の取得が2回目以上である場合には、前記所定の閾値を所定の値だけ下げてもよい。
また、本発明の実施の形態に係る番組情報検索装置は、検索対象となる番組情報が格納されたデータベースから検索要求に適合する番組情報を検索する番組情報検索装置であって、前記データベースに格納された番組情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された番組情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段および前記嗜好連想辞書記憶手段の少なくとも1つから、前記適合度算出手段で算出された前記適合度に基づいて前記入力情報に関連する単語である関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する番組情報を検索する検索手段とを備えることを特徴とするものである。
なお、本発明は、このような情報検索装置として実現することができるだけでなく、このような情報検索装置が備える特徴的な手段をステップとする情報検索方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
以下、本発明の各実施の形態について、それぞれ図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る情報検索装置の構成を示すブロック図である。
この情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を関連語を用いて検索するための装置であり、入力部101、プロファイル記憶部102、一般連想辞書記憶部103、嗜好連想辞書記憶部104、コンテンツ記憶部105、適合度算出部106、検索条件生成部107、および検索部108を含んで構成される。
入力部101は、キーボードやマウス、リモコン等の入力装置で構成され、ユーザが検索キーワードを含む検索条件や入力データを入力する。
プロファイル記憶部102は、ユーザの嗜好に関する情報であるプロファイルをユーザごとに記憶している。プロファイルには、例えば、ユーザの好みのコンテンツが属するジャンル、好みの出演者や視聴時間などを含み、それぞれのデータ(ジャンル、出演者、視聴時間など)に対応付けられた好みの度合いを示す重み値などが格納されている。
図2は、プロファイル記憶部102に格納されているプロファイルの一例を示す図である。ここでは、プロファイルには、データの種類を示すラベルと、データと、データに対するユーザの好みの度合いを示す重み値とが対応付けられて格納されており、例えば図2に示すように(ラベル、データ、重み値)として、((<ジャンル>、ドラマ、80)、(<ジャンル>、ニュース、30)、(<人名>、松下太郎、80)、(<人名>、松下花子、70)、(<人名>、松下一郎、60)、(<放送時間>、12:00〜13:00、90)、…)が格納されている。
コンテンツ記憶部105には、例えばテレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツに関する情報などが格納されている。
一般連想辞書記憶部103は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語間の関係を示す一般連想辞書を記憶している。一般連想辞書には、例えば、複数の関連のある単語である関連単語が組にして格納されている。図3は、一般連想辞書記憶部103に格納されている一般連想辞書の一例を示す図ある。ここでは、一般連想辞書には、図3に示すように関連単語の組として、(ドラマ、松下太郎、松下花子、松下五郎)、(バラエティ、松下太郎、松下次郎、漫才)、(時代劇、松下一郎)、…、が格納されている。
嗜好連想辞書記憶部104は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語に対して、ユーザの嗜好を反映した単語間の関係を示す嗜好連想辞書を記憶している。嗜好連想辞書には、例えば、プロファイルに含まれるユーザが視聴したテレビ放送番組に関する情報から抽出されるジャンルや人名、放送時間などの単語に対して、コンテンツ記憶部105に格納されている情報における関連単語が組みにして格納されている。ここでは、プロファイルに含まれる単語をユーザが視聴したテレビ放送番組に関する情報から抽出される単語としたが、ユーザが直接入力する好みのジャンルや人名、放送時間をプロファイルに含まれる単語としてもよい。図4は、嗜好連想辞書記憶部104に格納されている嗜好連想辞書の一例を示す図である。ここでは、嗜好連想辞書には、図4に示すように嗜好連想辞書関連単語の組として、(ドラマ、松下太郎、松下花子)、(松下太郎、松下一郎)が格納されている。
適合度算出部106は、入力部101から入力された検索条件と嗜好連想辞書記憶部104に格納されている嗜好連想辞書との適合度を算出する。ここでは、検索条件に含まれる検索キーワードを入力情報として用い、また、嗜好連想辞書はプロファイル記憶部102に格納されるプロファイルに基づき作成されているので、プロファイルを嗜好連想辞書に格納される単語の特徴を示す嗜好連想辞書特徴情報として用いる。よって、適合度算出部106は、検索条件に含まれる検索キーワードと、プロファイル記憶部102に格納されているプロファイルとの適合度を算出する。すなわち、適合度算出部106は、入力される検索条件に含まれる検索キーワードでプロファイルを検索し、プロファイル内においてこの検索キーワードに対して付与されている重み値を加算した値を適合度として算出する。なお、入力情報として、入力部101から入力された検索条件に含まれる検索キーワードを用いているとしているが、この入力には例えば指定することも含まれる。
検索条件生成部107は、適合度算出部106で算出された適合度に基づいて、一般連想辞書記憶部103に格納されている一般連想辞書、または嗜好連想辞書記憶部104に格納されている嗜好連想辞書を選択し、選択した一般連想辞書または嗜好連想辞書から検索キーワードに関連する関連語を取得し、検索条件を生成する。ここでは、検索条件生成部107は、適合度算出部106で算出された適合度が、所定の閾値よりも小さい場合は一般連想辞書から関連語を取得し、適合度が所定の閾値よりも大きい場合は嗜好連想辞書から関連語を取得する。
検索部108は、検索条件生成部107で生成された検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果として出力する。
次に、このように構成された本実施の形態による情報検索装置の動作について説明する。図5は情報検索装置の動作の流れを示すフローチャートである。
ユーザによって入力部101から検索条件が入力されると、この検索条件を適合度算出部106が受け付ける(ステップS101)。具体的な一例として、ユーザが入力部101から検索条件「松下太郎のドラマを見たい」を入力した場合と、「松下太郎のバラエティを見たい」を入力した場合とについてそれぞれ説明する。
適合度算出部106は、受け付けた検索条件と、プロファイル記憶部102に格納されているプロファイルとの適合度を算出する(ステップS102)。すなわち、適合度算出部106は、入力部101から入力された検索条件から検索キーワードを抽出し、プロファイル記憶部102に記憶されるプロファイル内に検索キーワードが存在する場合は、その検索キーワードに対する重み値を加算することで、検索条件とプロファイルとの適合度を算出する。上記の例の検索条件が「松下太郎のドラマを見たい」である場合には、適合度算出部106は、検索キーワード「松下太郎、ドラマ」を抽出し、プロファイルに格納されている「松下太郎」の重み値「80」と「ドラマ」の重み値「80」を加算して、適合度として「160」を算出する。また、上記の例の検索条件が「松下太郎のバラエティを見たい」である場合には、適合度算出部106は、検索キーワード「松下太郎、バラエティ」を抽出し、プロファイルに格納されている「松下太郎」の重み値「80」のみにより適合度として「80」を算出する。
次に、検索条件生成部107は、適合度算出部106で算出された適合度と所定の閾値との大小を判定する(ステップS103)。ここで、適合度が所定の閾値以下の場合(ステップS103でNO)には、検索条件生成部107は、一般連想辞書記憶部103に格納される一般連想辞書を選択し、選択した一般連想辞書から検索条件に含まれる検索キーワードに関連する関連語を取得し(ステップS104)、検索条件を生成する(ステップS106)。一方、適合度が所定の閾値よりも大きい場合(ステップS103でYES)には、検索条件生成部107は、嗜好連想辞書記憶部104に格納される嗜好連想辞書を選択し、選択した嗜好連想辞書から検索条件に含まれる検索キーワードに関連する関連語を取得し(ステップS105)、検索条件を生成する(ステップS106)。上記の例の検索条件が「松下太郎のバラエティを見たい」である場合には、適合度算出部106で算出された検索キーワード「松下太郎、バラエティ」に対する適合度が「80」であるので、検索条件生成部107は、所定の閾値(ここでは一例として、所定の閾値を「100」とする)以下と判断する。そして、検索条件生成部107は、一般連想辞書記憶部103に格納されている一般連想辞書から検索キーワード「松下太郎、バラエティ」の関連語「ドラマ、松下花子、松下五郎、松下次郎、漫才」を取得し、取得した関連語と検索キーワードとを検索条件として出力する。また、上記の例の検索条件が「松下太郎のドラマを見たい」である場合には、適合度算出部106で算出された検索キーワード「松下太郎、ドラマ」に対する適合度が「160」であるので、検索条件生成部107は、所定の閾値「100」よりも大きいと判断する。そして、検索条件生成部107は、嗜好連想辞書記憶部104に格納されている嗜好連想辞書から検索キーワード「松下太郎、ドラマ」の関連語「松下花子、松下一郎」を取得し、取得した関連語と検索キーワードとを検索条件として出力する。
次に、検索部108は、検索条件生成部107で生成された検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS107)。上記の例の検索条件が「松下太郎のバラエティを見たい」である場合には、検索部108は、検索条件生成部107で生成された検索条件「松下太郎、ドラマ、松下花子、松下五郎、バラエティ、松下次郎、漫才」のいずれかのキーワードが含まれる情報をコンテンツ記憶部105から取得し、それぞれの検索結果とする。また、上記の例の検索条件が「松下太郎のドラマを見たい」である場合には、検索部108は、検索条件「松下太郎、ドラマ、松下花子、松下一郎」のいずれかのキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
なお、本実施の形態では、適合度算出部106は、入力部101から入力される検索条件とプロファイル記憶部102に格納されるプロファイルとの適合度を算出したが、プロファイルの代わりに嗜好連想辞書記憶部104に格納されている嗜好連想辞書を用いて適合度を算出するようにしてもよい。この場合、例えばユーザによって入力部101から検索条件「松下五郎の時代劇を見たい」が入力された場合、検索条件から検索キーワード「松下五郎、時代劇」を抽出し、嗜好連想辞書記憶部104に格納されている嗜好連想辞書から検索キーワード「松下五郎、時代劇」の関連語を所定数以上取得できた場合は、取得した関連語と検索キーワードを検索条件として検索部108に出力し、関連語が所定数以下の場合は、一般連想辞書記憶部103に格納される一般連想辞書から関連語を取得し、取得した関連語と検索キーワードを検索条件として検索部108に出力する。この例では、嗜好連想辞書から取得される検索キーワード「松下五郎、時代劇」の関連語の数は「0」となり、例えば所定数を4とすると、所定数以下となるため、一般連想辞書から検索キーワード「松下五郎、時代劇」の関連語「ドラマ、松下太郎、松下花子、松下一郎」を取得し、取得した関連語と検索キーワードとを検索条件として検索部108に出力する。こうすることで、手作業によってユーザが嗜好連想辞書を編集、作成する装置など、プロファイルが存在しないような装置においても、検索条件に対して一般連想辞書と嗜好連想辞書をより適切に自動的に切り替えて利用することができる。
また、本実施の形態では、適合度算出部106は、入力部101から入力される検索条件に含まれる検索キーワードとプロファイル記憶部102に格納されるプロファイルとの適合度を算出したが、プロファイルの情報として使用場所等の使用状況を表す状況キーワードやユーザの感情を表す感情キーワードなども格納している場合、入力部101からユーザの状況や感情キーワード等も入力できるようにし、ユーザが入力した状況や感情キーワード等とプロファイルとの適合度を算出するようにしてもよい。
図6は、状況キーワードおよび感情キーワードを格納しているプロファイルの一例を示す図である。このプロファイルには、図6に示すように状況キーワードと、感情キーワードと、データの種類を示すラベルと、データと、データに対するユーザの好みの度合いを示す重み値とが対応付けられて格納されている。この場合、例えば家の「リビング」においてユーザによって入力部101から検索条件として「松下太郎が出ている楽しいドラマを見たい」が入力された場合、適合度算出部106は、検索条件から感情キーワード「楽しい」と検索キーワード「松下太郎、ドラマ」を抽出し、プロファイル内の状況キーワード「リビング」、感情キーワード「楽しい」の項目に属するデータ「松下太郎、ドラマ」の重み値を加算して適合度「160」を算出し、算出した適合度を検索条件生成部107に出力する。こうすることで、ユーザの状況や感情に合わせて一般連想辞書と嗜好連想辞書をより適切な状況で自動的に切り替えて利用することができ、ユーザの状況や感情に合った関連語を取得することができる。
また、本実施の形態では、適合度算出部106は、入力部101から入力される検索条件とプロファイル記憶部102に格納されるプロファイルとの適合度を算出したが、情報検索装置がさらに表示部301を備え、表示部301においてコンテンツを表示している場合、そのコンテンツとプロファイルとの適合度を算出するようにしてもよい。
図7は、表示部に表示されている情報の一例を示す図である。例えば、図7に示すように表示部301に松下太郎が出演しているドラマの情報が表示されている状況で、ユーザによって入力部101から検索条件として、「松下太郎の他の番組を見たい」と入力された場合、適合度算出部106は、検索条件から検索キーワード「松下太郎」を抽出し、次に表示部301に表示している情報の中でコンテンツの特徴を現す単語(ここでは一例として「松下太郎、ドラマ」)を抽出する。そして、適合度算出部106は、抽出した単語「松下太郎、ドラマ」と図3に示すプロファイルとの適合度「160」を算出し、この算出した適合度「160」と検索キーワード「松下太郎」とを検索条件生成部107に出力する。こうすることで、事前に検索を行い表示した検索結果に含まれるキーワードがユーザによって入力部101から入力された場合に、前回の表示されている検索結果を考慮して一般連想辞書と嗜好連想辞書とを自動的に切り替えて利用することができ、表示コンテンツが嗜好連想辞書と適合する場合には、関連語としてユーザに適応した関連語を取得することができる。
また、本実施の形態では、検索条件生成部107は、一般連想辞書記憶部103に格納される一般連想辞書、または、嗜好連想辞書記憶部104に格納される嗜好連想辞書から入力部101から入力される検索条件に含まれる検索キーワードに関連する関連語を全て取得していたが、一般連想辞書と嗜好連想辞書にそれぞれの辞書内の関連語間の関連度合いが関連値として定義されている場合、検索キーワードに関連する関連語から関連値の大きい関連語のみを取得するようにしてもよい。
図8は、関連値が格納されている嗜好連想辞書の一例を示す図である。ここで、例えば、検索条件生成部107は、適合度算出部106から適合度「160」と検索キーワード「松下太郎、ドラマ」とが入力された場合、適合度「160」が所定の閾値「100」よりも大きいと判断し、図8に示す嗜好連想辞書記憶部104に格納される嗜好連想辞書から所定の数の関連語(ここでは、一例として関連値の大きい方から3個、または所定の重み値以上の関連語としてもよい)「松下一郎、松下次郎、松下三郎」を取得し、取得した関連語と検索キーワードとを検索条件として出力する。こうすることで、取得される関連語の関連度合いに関する精度を向上させることができる。
また、本実施の形態では、検索条件生成部107は、嗜好連想辞書記憶部104に格納される嗜好連想辞書から入力部101から入力される検索条件に含まれる検索キーワードに関連する関連語を取得する際に、全ての関連語を取得していたが、嗜好連想辞書内の関連語同士の関連度合いが関連値として定義されている場合、適合度算出部106で算出される適合度に比例した数量の関連語を関連度が高い順に嗜好連想辞書から取得するようにしてもよい。
この場合、例えば、検索条件生成部107は、適合度算出部106から適合度「160」と検索キーワード「松下太郎、ドラマ」が入力された場合、適合度「160」が所定の閾値「100」よりも大きくさらに嗜好連想辞書に対する適合度も高いと判断し、適合度が高い場合は、嗜好連想辞書記憶部104に格納される図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から3個)、または、適合度に反比例した重み値以上の関連語としてもよい)「松下一郎、松下次郎、松下三郎」を取得する。
また、例えば、検索条件生成部107は、適合度算出部106から適合度110と検索キーワード「松下太郎、ニュース」が入力された場合、適合度110が所定の閾値100よりも大きいが嗜好連想辞書に対する適合度は低いと判断し、適合度が低い場合は、図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した一般連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から1個)、または、適合度に反比例した重み値以上の関連語としてもよい)「松下一郎」を取得する。
こうすることで、検索条件と嗜好連想辞書の適合度が高い場合は検索条件に関連度合いが高い関連語の数量が多く嗜好連想辞書に格納されていると考え、取得する関連語を多くし、検索条件と嗜好連想辞書の適合度が低い場合は検索条件に関連度合い高い関連語の数量が嗜好連想辞書には少ないと考え、取得する関連語を少なくすることで、取得する関連語の関連度合いに関する精度を向上させることができる。
また、本実施の形態では、検索条件生成部107は、一般連想辞書記憶部103に格納される一般連想辞書、または、嗜好連想辞書記憶部104に格納される嗜好連想辞書を選択し、入力部101から入力される検索条件に含まれる検索キーワードに関連する関連語を取得していたが、一般連想辞書と嗜好連想辞書の両方から適合度算出部106で算出される適合度に応じた数量の関連語を取得するようにしてもよい。
この場合、検索条件生成部107は、例えば適合度算出部106から適合度160と検索キーワード「松下太郎、ドラマ」が入力された場合、嗜好連想辞書に対する適合度が高いと判断し、適合度が高い場合は、嗜好連想辞書記憶部104に格納される図8に示すような嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から3個)、または、適合度に反比例した重み値以上の関連語)「松下一郎、松下次郎、松下三郎」を取得する。さらに、検索条件生成部107は、一般連想辞書記憶部103に格納される図10に示すような一般連想辞書から所定数の関連語(ここでは、一例として図11に示すような適合度とそれに対応した一般連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から1個)、または、検索条件生成部107で取得する関連語総数をあらかじめ決めておき、この総数から嗜好連想辞書から取得される関連語総数を除いた数でもよい)「松下六郎」を取得する。
また、検索条件生成部107は、例えば適合度算出部106から適合度110と検索キーワード「松下太郎、ニュース」が入力された場合、嗜好連想辞書に対する適合度が低いと判断し、適合度が低い場合は、図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(重み値の大きい方から1個)、または、適合度に反比例した重み値以上の関連語)「松下一郎」を取得する。さらに、検索条件生成部107は、図10に示すような一般連想辞書から所定数の関連語(ここでは、一例として図11に示すような適合度とそれに対応した一般連想辞書から取得する関連語の数が格納されるテーブルを参照して(重み値の大きい方から2個)、または、検索条件生成部107で取得する関連語総数をあらかじめ決めておき、この総数から嗜好連想辞書から取得される関連語総数除いた数でもよい)「松下六郎、松下五郎」を取得する。
こうすることで、検索条件と嗜好連想辞書の適合度が低い場合でも、一般連想辞書から関連語を取得するだけでなく、嗜好連想辞書からも検索条件との関連度合いが高い関連語のみを取得することで、一般的な関連語のみでなく、嗜好が反映された関連語をユーザに案内、または、情報検索することができる。
また、本実施の形態では、コンテンツ記憶部105に蓄積されるコンテンツは、テレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツであるとしたが、これに限定されることはなく、インターネット上のWEBページやコンテンツの情報を含んでもよい。
また、本実施の形態では、適合度算出部106は、検索条件とプロファイル記憶部102に格納されるプロファイルとの適合度を算出する際に、プロファイル内に含まれる重み値を加算することで適合度を求めていたが、これに限定されることはなく、例えば、検索条件に含まれる検索キーワードに対する重み値を求めてベクトルと見なし、プロファイルから求められるベクトルとの内積値などを適合度としてもよく、検索条件とプロファイルとの距離を計算できる任意の手法を利用することができる。ここで、検索条件とプロファイルとの適合度として距離を利用する場合は、適合度が小さいほど検索条件とプロファイルとが適合しているこということであり、検索条件生成部107は、適合度が所定の閾値よりも小さい場合は嗜好連想辞書から関連語を取得し、適合度が所定の閾値よりも大きい場合は一般連想辞書から関連語を取得する。
また、本実施の形態では、検索条件生成部107は関連語を取得して検索条件を生成したが、情報検索装置がさらに表示部を備え、検索条件生成部107は取得した関連語を表示部に表示して、ユーザに関連語を選択させ、ユーザによって選択された関連語を用いて検索条件を生成するようにしてもよい。こうすることで、ユーザは関連語を特定して情報検索を行うことができる。
以上のように、本実施の形態によれば、検索キーワードに対して検索条件を拡張するために嗜好連想辞書と一般連想辞書とを利用する際、嗜好連想辞書の特徴を表す嗜好連想辞書特徴情報と検索条件や表示コンテンツ、検索の場面に関する情報の特徴との適合度を算出し、この適合度に基づいて嗜好連想辞書を利用する場面を決定することにより、嗜好連想辞書をより適切な検索条件や検索の文脈、表示コンテンツ、検索の場面で利用することができる。
(実施の形態2)
図12は、本発明の実施の形態2に係る情報検索装置の構成を示すブロック図である。なお、実施の形態1と同様の部分については同じ符号を付し、詳細な説明を省略する。
本実施の形態の情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を関連語を用いて検索するための装置であり、入力部101、コンテンツ記憶部105、検索部207、嗜好連想辞書記憶部201、取得単語記憶部202、一般連想辞書記憶部203、嗜好関連語取得部204、未取得関連語判定部205、および一般関連語取得部206を含んで構成される。
嗜好連想辞書記憶部201は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語に対して、ユーザの嗜好を反映した単語間の関係を示す嗜好連想辞書を記憶している。嗜好連想辞書には、例えば、関連のある単語同士を対とした関連語対(関連語1、関連語2)と関連語対の関連度合いを表す関連値とが対応付けて格納されている。図13は、嗜好連想辞書記憶部201に格納されている嗜好連想辞書の一例を示す図である。ここでは、嗜好連想辞書には、図13に示すように(関連語対、関連値)として、((松下次郎、松下太郎)、80)、((ドラマ、松下花子)、70)、((松下太郎、松下花子)、50)が格納されている。なお、ここでは関連値が高いほど関連度合いが高いものとする。
取得単語記憶部202は、未取得関連語判定部205で取得される関連語を記憶する。
一般連想辞書記憶部203は、コンテンツ記憶部105に格納されている情報に含まれている複数の単語間の関係を示す一般連想辞書を記憶している。一般連想辞書には、例えば、関連のある単語同士を対とした関連語対(関連語1、関連語2)と関連語対の関連度合いを表す関連値とが対応付けて格納されている。図14は、一般連想辞書記憶部203に格納される一般連想辞書の一例を示す図ある。ここでは、一般連想辞書には、図14に示すように(関連語対、関連値)として、((松下太郎、松下一郎)、80)、((バラエティ、松下一郎)、70)、((バラエティ、漫才)、90)、…、が格納されている。
嗜好関連語取得部204は、入力部101から検索条件が入力された場合には、検索条件に含まれる検索キーワードと所定の閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する。また、嗜好関連語取得部204は、入力部101から検索条件拡張命令が入力された場合には、所定の閾値を下げて、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する。
未取得関連語判定部205は、入力部101から検索条件が入力された場合には、取得単語記憶部202を初期化して嗜好関連語取得部204で取得された関連語を取得単語記憶部202に格納し、さらにこの関連語を検索部207に出力する。また、未取得関連語判定部205は、入力部101から検索条件拡張命令が入力された場合には、嗜好関連語取得部204で取得される関連語が取得単語記憶部202に既に記憶されているか判定する。未取得関連語判定部205は、関連語が記憶されていない場合には、前記関連語を取得単語記憶部202に追加記憶して、さらに前記関連語を検索部207に出力する。また、記憶されている場合には、一般関連語取得部206に入力部101から入力された検索条件に含まれる検索キーワードを出力する。
一般関連語取得部206は、未取得関連語判定部205から検索キーワードが入力されると、一般連想辞書記憶部203に格納される一般連想辞書から検索キーワードと所定の閾値以上の関連値で関連付けられた関連語を取得し、取得した関連語を検索部207に出力する。また、一般関連語取得部206は、未取得関連語判定部205から入力される検索キーワードが2回目以上である場合には、所定の閾値を下げて、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を一般連想辞書記憶部203に格納される一般連想辞書から取得する。
検索部207は、未取得関連語判定部205、または、一般関連語取得部206から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする。
次に、このように構成された本実施の形態による情報検索装置の動作について説明する。図15はこの情報検索装置の動作の流れを示すフローチャートである。
ユーザによって入力部101から検索条件または検索条件拡張命令が入力されると、この検索条件または検索条件拡張命令を嗜好関連語取得部204が受け付ける(ステップS201)。
次に、嗜好関連語取得部204は、受け付けた検索条件または検索条件拡張命令が検索条件であるか検索条件拡張命令であるかを判定する(ステップS202)。この判定の結果、検索条件である場合(ステップS202でYES)には、嗜好関連語取得部204は、検索条件に含まれる検索キーワードと嗜好連想辞書用の所定の閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する(ステップS203)。具体的な一例として、ユーザが入力部101から検索条件「松下太郎」を入力した場合について説明する。この例では、嗜好関連語取得部204は、入力部101から入力された検索条件「松下太郎」に含まれる検索キーワード「松下太郎」と所定の閾値(ここでは一例として、所定の閾値を「60」とする)以上の関連値で関連付けられた関連語「松下次郎」を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する。
次に、未取得関連語判定部205は、取得単語記憶部202を初期化して(ステップS204)、嗜好関連語取得部204で取得された関連語を取得単語記憶部202に格納し(ステップS205)、さらに関連語を検索部207に出力する。上記の例では、未取得関連語判定部205は、取得単語記憶部202を初期化して、嗜好関連語取得部204で取得された関連語「松下次郎」を取得単語記憶部202に格納し、さらに関連語を検索部207に出力する。図16は、関連語「松下次郎」が格納された時の取得単語記憶部202の内容を示す図である。
次に、検索部207は、未取得関連語判定部205から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS213)。上記の例では、検索部207は、未取得関連語判定部205から関連語「松下次郎」が入力されると、入力された関連語「松下次郎」から検索条件「松下次郎」を生成し、検索条件「松下次郎」のキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
一方、上記判定の結果、検索条件拡張命令である場合(ステップS202でNO)には、嗜好関連語取得部204は、嗜好連想辞書用の所定の閾値を下げる(ステップS206)。そして、嗜好関連語取得部204は、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を嗜好連想辞書記憶部201に格納される嗜好連想辞書から取得する(ステップS207)。具体的な一例として、ユーザによって入力部101から検索条件「松下太郎」が入力された後に、検索条件拡張命令が入力された場合について説明する。この例では、嗜好関連語取得部204は、入力部101から検索条件拡張命令が入力されると、閾値「60」を閾値「50」に下げ(ここでは一例として閾値の下げ幅を「10」とする)、嗜好連想辞書記憶部201に格納される嗜好連想辞書から検索条件「松下太郎」に含まれる検索キーワード「松下太郎」と閾値50以上の関連値で関連付けられた関連語「松下次郎、松下花子」を取得する。また、ここでは、閾値以上の関連語を取得するようにしたが、関連値の大きい順に取得する関連語数を増加するようにしてもよい。
次に、未取得関連語判定部205は、嗜好関連語取得部204で取得された関連語が取得単語記憶部202に既に記憶されているか判定する(ステップS208)。この判定の結果、記憶されていない場合、すなわち未取得の関連語を取得できた場合(ステップS208でYES)には、未取得関連語判定部205は、この関連語を取得単語記憶部202に追加記憶して(ステップS209)、さらにこの関連語を検索部207に出力する。上記の例では、未取得関連語判定部205は、嗜好関連語取得部204で取得される関連語「松下次郎、松下花子」の内、関連語「松下花子」が取得単語記憶部202に記憶されていないと判定し、関連語「松下花子」を取得単語記憶部202に追加記憶して、さらに関連語「松下花子」を検索部207に出力する。図17は、関連語「松下花子」が格納された時の取得単語記憶部202の内容を示す図である。
次に、検索部207は、未取得関連語判定部205から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS213)。上記の例では、検索部207は、未取得関連語判定部205から関連語「松下花子」が入力されると、入力された関連語「松下花子」から検索条件「松下花子」を生成し、検索条件「松下花子」のキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
一方、上記判定の結果、関連語が記憶されている場合、すなわち未取得の関連語を取得できなかった場合(ステップS208でNO)には、入力部101から入力された検索条件に含まれる検索キーワードを一般関連語取得部206に出力する。一般関連語取得部206は、未取得関連語判定部205から検索キーワードが入力されると、未取得関連語判定部205から検索キーワードが入力されたのが初回目であるか否かを判定する(ステップS210)。初回目である場合(ステップS210でYES)には、一般関連語取得部206は、一般連想辞書記憶部203に格納されている一般連想辞書から検索キーワードと一般連想辞書用の所定の閾値以上の関連値で関連付けられた関連語を取得し(ステップS212)、取得した関連語を検索部207に出力する。また、初回目でない場合(ステップS210でNO)には、一般関連語取得部206は、一般連想辞書用の所定の閾値を下げる(ステップS211)。そして、一般関連語取得部206は、検索条件に含まれる検索キーワードと下げた閾値以上の関連値で関連付けられた関連語を一般連想辞書記憶部203に格納されている一般連想辞書から取得する(ステップS212)、取得した関連語を検索部207に出力する。
次に、検索部207は、一般関連語取得部206から関連語が入力されると、入力された関連語から検索条件を生成し、生成した検索条件に合致した情報をコンテンツ記憶部105から取得し、検索結果とする(ステップS213)。
具体的な一例として、ユーザによって入力部101から検索条件「松下太郎」が入力された後に、検索条件拡張命令の2回目が入力された場合について説明する。嗜好関連語取得部204は、入力部101から検索条件拡張命令が入力されると、閾値50を閾値40に下げ、嗜好連想辞書記憶部201に格納される嗜好連想辞書から検索条件「松下太郎」に含まれる検索キーワード「松下太郎」と閾値40以上の関連値で関連付けられた関連語「松下次郎、松下花子」を取得する。次に、未取得関連語判定部205は、嗜好関連語取得部204で取得される関連語「松下次郎、松下花子」が取得単語記憶部202に既に記憶されていると判定し、入力部101から入力された検索条件「松下太郎」に含まれる検索キーワード「松下太郎」を一般関連語取得部206に出力する。
次に、一般関連語取得部206は、未取得関連語判定部205から検索キーワード「松下太郎」が入力されると、一般連想辞書記憶部203に格納される一般連想辞書から検索キーワード「松下太郎」と所定の閾値(ここでは一例として、所定の閾値を80とする)以上の関連値で関連付けられた関連語「松下一郎」を取得し、取得した関連語「松下一郎」を検索部207に出力する。検索部207は、一般関連語取得部206から関連語「松下一郎」が入力されると、入力された関連語「松下一郎」から検索条件「松下一郎」を生成し、検索条件「松下一郎」のキーワードが含まれる情報をコンテンツ記憶部105から取得し、検索結果とする。
なお、本実施の形態では、一般関連語取得部206は、未取得関連語判定部205から入力された検索キーワードに関連した関連語を一般連想辞書記憶部203から取得するようにしたが、さらに、取得単語記憶部202を参照し、一般連想辞書記憶部203から取得した関連語から取得単語記憶部202に記憶されている関連語を除き、残された関連語のみを検索部207に出力するようにしてもよい。こうすることで、既に検索を行った関連語を検索することがなくなり、ユーザに同じ関連語で検索した重複した検索結果を提示しなくてもよくなる。
また、本実施の形態では、コンテンツ記憶部105に蓄積されるコンテンツは、テレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツであるとしたが、これに限定されることはなく、インターネット上のWEBページやコンテンツの情報を含んでもよい。
また、本実施の形態では、検索部207は関連語を取得して検索条件を生成したが、情報検索装置がさらに表示部を備え、検索部207は取得した関連語を表示部に表示して、ユーザに関連語を選択させ、ユーザの選択した関連語を用いて検索条件を生成するようにしてもよい。こうすることで、ユーザは関連語を特定して情報検索を行うことができる。
以上のように、本実施の形態によれば、嗜好連想辞書に格納される関連語を優先的に利用しながらも、嗜好連想辞書から関連語が取得できない場合には、一般連想辞書を利用して関連語を取得することができる。
なお、上記実施の形態1において、一般連想辞書記憶部103は一般連想辞書記憶手段に、嗜好連想辞書記憶部104は嗜好連想辞書記憶手段に、適合度算出部106は適合度算出手段に、検索条件生成部107は検索条件生成手段に、検索部108は検索手段に、それぞれ相当する。
また、上記実施の形態2において、嗜好連想辞書記憶部201は嗜好連想辞書記憶手段に、一般連想辞書記憶部203は一般連想辞書記憶手段に、嗜好関連語取得部204は嗜好関連語取得手段に、未取得関連語判定部205は未取得関連語判定手段に、一般関連語取得部206は一般関連語取得手段に、検索部207は検索条件生成手段および検索手段に、それぞれ相当する。
本発明に係る情報検索装置は、嗜好連想辞書と一般連想辞書を利用する際、嗜好連想辞書をより適切な検索条件や検索の文脈、表示コンテンツ、検索場面で利用することができ、ハードディスクレコーダやDVDレコーダ、TV、オーディオコンポ、インターネットにアクセスして情報検索を行うことができる端末等として有用である。
図1は、本発明の実施の形態1に係る情報検索装置の構成を示すブロック図である。
図2は、本発明の実施の形態1に係る情報検索装置に用いられるプロファイルの一例を示す図である。
図3は、本発明の実施の形態1に係る情報検索装置に用いられる一般連想辞書の一例を示す図である。
図4は、本発明の実施の形態1に係る情報検索装置に用いられる嗜好連想辞書の一例を示す図である。
図5は、本発明の実施の形態1に係る情報検索装置の動作の流れを示すフローチャートである。
図6は、本発明の実施の形態1に係る情報検索装置に用いられる状況キーワードおよび感情キーワードを格納しているプロファイルの一例を示す図である。
図7は、本発明の実施の形態1に係る情報検索装置の表示部に表示されている情報の一例を示す図である。
図8は、本発明の実施の形態1に係る情報検索装置に用いられる関連値が格納されている嗜好連想辞書の一例を示す図である。
図9は、本発明の実施の形態1に係る情報検索装置に用いられる適合度とそれに対応した取得関連語数との関係を記憶するテーブルの一例を示す図である。
図10は、本発明の実施の形態1に係る情報検索装置に用いられる関連値が格納されている一般連想辞書の一例を示す図である。
図11は、本発明の実施の形態1に係る情報検索装置に用いられる適合度とそれに対応した取得関連語数との関係を記憶するテーブルの一例を示す図である。
図12は、本発明の実施の形態2に係る情報検索装置の構成を示すブロック図である。
図13は、本発明の実施の形態2に係る情報検索装置に用いられる嗜好連想辞書の一例を示す図である。
図14は、本発明の実施の形態2に係る情報検索装置に用いられる一般連想辞書の一例を示す図である。
図15は、本発明の実施の形態2に係る情報検索装置の動作の流れを示すフローチャートである。
図16は、本発明の実施の形態2に係る情報検索装置に用いられる取得単語記憶部の内容の一例を示す図である。
図17は、本発明の実施の形態2に係る情報検索装置に用いられる取得単語記憶部の内容の一例を示す図である。
符号の説明
101 入力部
102 プロファイル記憶部
103、203 一般連想辞書記憶部
104、201 嗜好連想辞書記憶部
105 コンテンツ記憶部
106 適合度算出部
107 検索条件生成部
108 検索部
202 取得単語記憶部
204 嗜好関連語取得部
205 未取得関連語判定部
206 一般関連語取得部
301 表示部
上記目的を達成するため、本発明に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段を前記適合度の値の大きさに基づいて選択し、選択した前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段から前記入力情報に関連する単語である関連語を前記適合度の値の大きさに応じた数量分取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とする。
また、本発明に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記適合度の値が所定の閾値よりも大きい場合は前記嗜好連想辞書記憶手段を、前記適合度の値が前記所定の閾値以下の場合は前記一般連想辞書記憶手段を選択し、選択した前記一般連想辞書記憶手段または前記嗜好連想辞書記憶手段から前記関連語を取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とする。
また、本発明に係る情報検索装置は、検索対象となる情報が格納されたデータベースから検索要求に適合する情報を検索する情報検索装置であって、前記データベースに格納された情報に含まれる複数の単語間の関係を記憶する一般連想辞書記憶手段と、前記データベースに格納された情報に対するユーザの嗜好を反映した複数の単語間の関係を記憶する嗜好連想辞書記憶手段と、前記嗜好連想辞書記憶手段に記憶されている単語の特徴を示す嗜好連想辞書特徴情報とユーザによって入力された情報である入力情報との適合度合いを示す適合度を算出する適合度算出手段と、前記適合度が高いと前記嗜好連想辞書記憶手段から取得する関連語の数が前記一般連想辞書記憶手段から取得する関連語の数よりも多くなり、前記適合度が低いと前記嗜好連想辞書記憶手段から取得する関連語の数が前記一般連想辞書記憶手段から取得する関連語の数よりも少なくなるように、前記入力情報に関連する関連語をそれぞれ前記嗜好連想辞書記憶手段と前記一般連想辞書記憶手段から取得し、取得した前記関連語を用いて検索条件を生成する検索条件生成手段と、前記データベースから前記検索条件生成手段で生成された前記検索条件に適合する情報を検索する検索手段とを備えることを特徴とする。
また、例えば、検索条件生成部107は、適合度算出部106から適合度110と検索キーワード「松下太郎、ニュース」が入力された場合、適合度110が所定の閾値100よりも大きいが嗜好連想辞書に対する適合度は低いと判断し、適合度が低い場合は、図8に示す嗜好連想辞書から所定数の関連語(ここでは、一例として図9に示すような適合度とそれに対応した嗜好連想辞書から取得する関連語の数が格納されるテーブルを参照して(ここでは、重み値の大きい方から1個)、または、適合度に反比例した重み値以上の関連語としてもよい)「松下一郎」を取得する。