JP2007299159A - コンテンツ検索装置 - Google Patents
コンテンツ検索装置 Download PDFInfo
- Publication number
- JP2007299159A JP2007299159A JP2006125892A JP2006125892A JP2007299159A JP 2007299159 A JP2007299159 A JP 2007299159A JP 2006125892 A JP2006125892 A JP 2006125892A JP 2006125892 A JP2006125892 A JP 2006125892A JP 2007299159 A JP2007299159 A JP 2007299159A
- Authority
- JP
- Japan
- Prior art keywords
- content
- answer
- search
- user
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】コンテンツ群からユーザが所望するコンテンツを検索する場合に、面倒な操作入力を不要とし、迅速且つ確実に絞込みができるようにする。
【解決手段】エージェント1は、制御回路2を主体として、音声認識部3、音声合成部4などを備えると共に、通信装置7を介してインターネット12に接続されるサーバ13にアクセス可能で、コンテンツ群が登録されたデータベース14a〜14cの検索処理を実行する。データベース14a〜14cには、コンテンツの情報と共にコンテンツを検索するための質問事項の回答をデータとして持つメタ情報が付随して登録されている。エージェント1は、質問事項を音声合成によりスピーカ11から出力し、ユーザが音声により回答の番号を答えると音声認識をして回答を特定する。得られた回答に基づいて検索処理を実行し、これを繰り返すことで絞込みを行う。
【選択図】図1
【解決手段】エージェント1は、制御回路2を主体として、音声認識部3、音声合成部4などを備えると共に、通信装置7を介してインターネット12に接続されるサーバ13にアクセス可能で、コンテンツ群が登録されたデータベース14a〜14cの検索処理を実行する。データベース14a〜14cには、コンテンツの情報と共にコンテンツを検索するための質問事項の回答をデータとして持つメタ情報が付随して登録されている。エージェント1は、質問事項を音声合成によりスピーカ11から出力し、ユーザが音声により回答の番号を答えると音声認識をして回答を特定する。得られた回答に基づいて検索処理を実行し、これを繰り返すことで絞込みを行う。
【選択図】図1
Description
本発明は、有限個のコンテンツの中からユーザが所望するコンテンツを検索するためのものであり、音声認識を有効に利用したコンテンツ検索装置に関する。
従来より、多数のコンテンツを有するコンテンツ群から希望するコンテンツを選び出すためには、一般にコンテンツに含まれるキーワードなどを指定してそれが含まれる条件で該当するものを検索している。このとき、コンテンツを検索する際にキーボードなどの文字の入力ができる入力デバイスを持っていない装置構成においては、文字を機器に入力するというのは非常に難しい。また、逆にボタンを複数用意する構成にすると、今度は操作する際にどのボタンを押していいか分かり難くなる。
そこで、ユーザが操作するのではなく、音声により回答するとこれを認識できるようにして操作入力の煩わしさを解消し、簡単にコンテンツの検索を行えるようにしたものが考えられている(例えば特許文献1参照)。このものは、システムからユーザに質問をしてその回答を音声により入力してこれを認識し、希望するコンテンツの絞込みをしようというものである。
また、コンテンツの検索をする場合に、コンテンツの検索に有効となるメタ情報を抽出しこれによって所望するコンテンツを抽出するキーワードとするものが考えられている(例えば特許文献2参照)。
特許3378595号公報
特開2005−92295号公報
ところで、上記した特許文献1に示されるような音声認識を用いるものでは、ユーザが話した言葉を音声認識により判定するのに複雑な処理を要すると共にその処理に時間がかかるので、実用的には適用することが難しい。特に、家庭用の電化製品などの使用に適用しようとする場合、簡単且つ迅速にコンテンツを検索できるようにすることが難しくなるという不具合がある。
本発明は上記事情を考慮してなされたもので、その目的は、有限個のコンテンツからなるコンテンツ群からユーザが希望するコンテンツを音声認識により迅速且つ確実に検索することができるようにしたコンテンツ検索装置を提供することにある。
上記課題を解決するための構成として、本発明のコンテンツ検索装置は、データベースに登録された検索対象となる有限個のコンテンツのコンテンツ群から所望するコンテンツを検索するために設定されユーザが選択可能な複数の回答が設定された複数の質問事項を記憶する記憶手段と、前記質問事項に対する音声による回答の入力を音声認識する音声認識手段と、前記コンテンツ群から前記ユーザが所望するコンテンツを検索する検索手段とを備え、前記検索手段は、前記記憶手段に記憶された複数の質問事項から選んだ質問事項を前記ユーザに与える第1の手段と、そのユーザからの音声による回答を前記音声認識手段により認識させて前記質問事項に対する回答を特定する第2の手段と、特定された回答に該当するコンテンツを前記コンテンツ群から検索する第3の手段と、前記第3の手段により検索されたコンテンツの個数が所定個数を超えて存在するときに、それら複数のコンテンツからなる部分コンテンツ群を新たなコンテンツ群として前記第1の手段から第3の手段を繰り返し実行する第4の手段と、検索されたコンテンツの個数が所定個数以内になると、それらのコンテンツを前記ユーザが選択可能に提示する第5の手段とを備えたところに特徴を有する。
本発明は、上記構成を採用したので、検索手段は、第1の手段により、記憶手段に記憶された複数の質問事項から選んだ質問事項を前記ユーザに与え、これによってユーザが選択可能な複数の回答が提示されると、第2の手段により、その質問事項に対するユーザからの音声による回答を音声認識手段により認識させて回答を特定し、第3の手段により、特定された回答に該当するコンテンツを有限個のコンテンツを有するコンテンツ群から検索する。検索結果得られたコンテンツの個数が所定個数を超えて存在するときには、第4の手段により、それら複数のコンテンツからなる部分コンテンツ群を新たなコンテンツ群として第1の手段から第3の手段を繰り返し実行し、検索されたコンテンツの個数が所定個数以内になると、第5の手段により、えら得たコンテンツをユーザが選択可能に提示する。
これにより、質問事項に対応してユーザが選択した回答を音声により受け付け、その回答に基づいてコンテンツ群を絞り込んでいくので、音声認識手段による音声認識処理では、ユーザの音声による回答を予め準備している複数個の回答の中から該当するものを特定することを行えば達成できるので、迅速且つ確実にユーザの回答を認識でき、これによって、コンテンツ群の中から質問事項を複数回ユーザに提示することでコンテンツの絞込みを行うことができるようになる。
(第1の実施形態)
以下、本発明の第1の実施形態について、図1〜図6を参照して説明する。
図1はコンテンツ検索システム全体のブロック構成を示すもので、このシステム構成においては、検索を実行する装置として家庭内に設ける設備の構成として例示している。コンテンツ検索の主体となって実行するエージェント1は、例えばロボットのような外形をした装置として設けられている(図5、図6参照)。このエージェント1は、ユーザPに対して質問を投じてその音声による回答を得てユーザPが希望するコンテンツの絞込みを行うように構成されている。
以下、本発明の第1の実施形態について、図1〜図6を参照して説明する。
図1はコンテンツ検索システム全体のブロック構成を示すもので、このシステム構成においては、検索を実行する装置として家庭内に設ける設備の構成として例示している。コンテンツ検索の主体となって実行するエージェント1は、例えばロボットのような外形をした装置として設けられている(図5、図6参照)。このエージェント1は、ユーザPに対して質問を投じてその音声による回答を得てユーザPが希望するコンテンツの絞込みを行うように構成されている。
エージェント1は、制御回路2を主体として構成されている。制御回路2は、CPUを中心としてROM、RAMや各種の回路を含んで構成されるもので、後述するプログラムによりコンテンツ検索処理を実行する検索手段としての機能を備えた構成とされている。制御回路2には、音声認識部3、音声合成部4、表示部5および操作部6が接続されると共に、通信装置7、メモリ8、インターフェース9が接続されている。
音声認識手段としての音声認識部3は、音声認識エンジンが搭載されており、音声認識処理をする際に必要となる辞書がメモリ8に記憶されている。この辞書には音声認識のための待ちうけ語が登録されており、音声認識部3に接続されたマイクロホン10により音声入力を受け付けている期間に入力された音声を認識し、辞書内に登録された言葉の中で入力音声に一番近い言葉を選択し、認識結果として出力する。なお、音声認識に用いる辞書は言葉の追加・削除が可能である。
また、音声合成手段としての音声合成部4は、音声合成エンジンが搭載されており、制御回路2側から出力すべきテキスト文が入力されると、テキスト文を音声合成により音声信号として作成し、出力端子に接続されたスピーカ11により合成音声として読み上げることで出力することが可能である。
表示部5は簡単な内容を表示するためのもので、例えば検索対象となるコンテンツ群を選択する際にコンテンツ群の名前を表示することができる。操作部6は、コンテンツ群の選択をするためのもので、ユーザPが希望する検索対象のコンテンツ群に対応するスイッチを操作することで選択できるように構成されている。なお、表示部5や操作部6は必要に応じて設ければ良く、これらの機能も音声認識や音声合成によって音声によってユーザPに伝えたり、ユーザPが発する音声を音声認識により把握して入力したりすることで代替することができるものである。
通信装置7は、外部の公衆通信網であるインターネット12に接続されており、このインターネット12を介してサーバ13にアクセス可能に構成されている。サーバ13には、各種データベース14a、14b、14cが接続されている。これらのデータベース14a〜14cには、カテゴリ別に多数のコンテンツが登録されている。例えば、テレビの番組(コンテンツ)に関する情報が登録されたデータベースや、映画や音楽の曲などのコンテンツが登録されたデータベースや、あるいは料理のレシピなどのコンテンツが登録されたデータベースなど様々なものが想定されている。なお、データベース14a〜14cは、家庭の外部のサーバ13に設けるのではなく、家庭内に設ける構成とすることもできる。この場合には、メモリ8をハードディスク装置などの大容量のものとすることでデータベースとしての機能を兼ね備えたものとすることができる。
インターフェース9は、例えばビデオデッキ15のような家庭内に設けられる家電機器と通信をするためのもので、有線通信方式のものではLAN接続するためのインターフェースであり、無線通信方式のものではbluetootなどの無線LANのインターフェースや赤外線通信などの光通信用のインターフェースである。
ここではビデオデッキ15にテレビ番組(コンテンツ)の録画予約をするための通信手段として構成されているもので、エージェント1の制御回路2から検索結果のデータに応じてコマンドを送信するように構成されている。ビデオデッキ15以外にも、DVDレコーダやCDプレーヤあるいはラジオ、テレビなどの家電機器としても良いし、IHクッキングヒータや電子レンジなどの調理機器としても良いし、さらには他の家電機器を制御する構成とすることもできる。
また、前記したデータベース14a〜14cには、コンテンツを検索する際に有効な手段となる検索用の質問内容と、その統計的に得られた質問に対する回答の情報がメタ情報としてコンテンツに付随した状態で登録されており、記憶手段としての機能も兼ね備えている。質問内容は例えば図2(a)に示すように、複数の質問のそれぞれに質問番号、質問文のテキスト、回答の選択肢のテキストが記述されている。選択肢は「わからない」という回答0を含めて最大5つまでとする。しかし、選択肢が5つも必要ではない場合については、必要ない選択肢の部分は空欄にしておく。
エージェント1は、制御回路2により、質問文のテキストデータ・選択肢のテキストデータを音声合成データとして音声合成部4に出力すると、これを音声に変換してスピーカ11から出力することで読み上げるように構成されている。なお、エージェント1に質問を読み上げさせるためには、質問内容はテキストの代わりにあらかじめ質問を読み上げた音声ファイルを作成し保持していてもよい。音声合成を自動で行うとイントネーションや漢字の読み方が不自然になる場合があるが、これに対して予め人が音声により読み上げた音声ファイルを登録しておくことでこういった問題が解消される。
メタ情報は、図2(b)に示すように、各コンテンツに対応して、上記した質問事項に対する回答の一般的なものが設定され、これがコンテンツ情報と共に付随した情報として登録されている。ただし、質問内容に記述されているすべての質問に対する回答が記述されている必要はない。
次に、上記構成の作用について図3〜図6も参照して説明する。
まず、ユーザPはエージェント1に対して、所望するコンテンツ検索を開始させるためのコマンドを伝える必要がある。エージェント1が操作部6を備えていてそこに入力用のボタンをいくつか持っている場合、ボタンのひとつを検索開始ボタンにしておき、該当ボタンが押されたら検索を開始するとしておいてもよい。また、この実施形態におけるように複数のデータベース14a〜14cが存在するときには、それらのうちの所望のデータベース14a〜14cを選ぶためのボタンを用意しておく。
まず、ユーザPはエージェント1に対して、所望するコンテンツ検索を開始させるためのコマンドを伝える必要がある。エージェント1が操作部6を備えていてそこに入力用のボタンをいくつか持っている場合、ボタンのひとつを検索開始ボタンにしておき、該当ボタンが押されたら検索を開始するとしておいてもよい。また、この実施形態におけるように複数のデータベース14a〜14cが存在するときには、それらのうちの所望のデータベース14a〜14cを選ぶためのボタンを用意しておく。
例えばこの実施形態におけるように、ビデオ録画を行うためにテレビ番組表から番組を検索するときのボタンは「ビデオ録画」、夕食のメニューを決めるためにレシピデータベースからレシピを検索する場合には「レシピ検索」など、用途の書かれたボタンが用意されているものとする。ボタンを特に持っていない場合、音声認識でユーザPが該当する音声を入力した場合に検索を開始するとしておいてもよい。エージェント1は検索を実行していない待機中の状態ではメモリ8の辞書に「ビデオ録画」、「レシピ検索」などの検索を開始させるコマンドのみ登録しておく。ユーザPから音声の入力があったときには辞書から一番近い言葉を選び、そのデータベース14a〜14cに対する検索を開始する。
データベース14a〜14cから、例えば「ビデオ録画」に対応するテレビ番組の予約用のデータベース14aが決定されると、エージェント1の制御回路2はコンテンツの検索処理プログラムを開始する。図3は検索処理プログラムのフローチャートである。エージェント1の制御回路3は、検索処理プログラムを開始すると、選択肢形式の質問をユーザPに行うが、音声認識の精度を高くするためにはメモリ8の辞書に登録する語彙は少ない方がいい。そこで、ここでは選択肢は4つ以内と限定する。そのためコンテンツの数が4つ以内であれば直接コンテンツの名前を選択肢にして質問することができる。
このため、制御回路3は、まず検索対象のデータベース14aに登録されているコンテンツ群に属するコンテンツの数が4つ以内かどうかを調べる(ステップS1)。ここで、4つよりも多くコンテンツが存在する場合つまり「NO」と判断されるときには、制御回路3は、質問検索ルーチンS2を実行する。質問検索ルーチンS2は、図4に示すようなフローチャートにしたがって実行される。ここでは、制御回路2は、まずユーザPにする質問を決定する(ステップT1)。質問の選出の仕方は次のようにして行なわれる。
前述したように、データベース14aには、ビデオ録画に対応したテレビ番組がコンテンツとして登録されており、さらに、それらのコンテンツに付随して図2(b)に示したようなメタ情報が登録されている。メタ情報として登録されたデータに対応する質問内容は図2(a)に示すようなものであるが、準備されているすべての質問内容に対応した回答が記述されているとは限らない。そこで、ここでは制御回路2は、検索対象のコンテンツ群に属しているすべてのコンテンツに付随して登録されているメタ情報に記述されている質問のみを選ぶ(ステップT1)。
また、制御回路2による質問内容の決定に際しては、できるだけ質問回数を少なくして最終的にユーザPが所望するコンテンツが検索できることが好ましいから、これを次のようにして推定する。すなわち、検索終了までの質問回数の期待値Eを計算して期待値が小さいものを選ぶようにする。
この検索方法では質問回数が少ない方がいい。そこでステップT1で決定しようとする対象の質問の中で質問回数の期待値Eが最も少なくなる質問を選択する。ここでは次のように仮定して計算する。まず、対象となるコンテンツ群のコンテンツが質問によってa個、b個、c個、d個、e個の5つに分割されるとする。そして、この質問の後にn者択一の質問のみが繰り返され、その質問によってコンテンツ数が必ずn等分されるとすると仮定する。このとき、a個、b個、c個、d個、e個にわかれたコンテンツの中から1つのコンテンツを選び出すために必要な質問回数の期待値Eは、次式(1)で得られる。
このようにして最適な質問を決定すると、エージェント1の制御回路2は、その質問をユーザPに音声により問い合わせる(ステップT2)。ここで、制御回路2によるステップT1およびT2の実施が、本発明でいう検索手段の第1の手段に相当する。図5は選択された質問をユーザPに質問するシーンである。エージェント1の制御回路2は、質問内容のテキスト内容に対応する信号を音声合成部4に出力すると、音声合成部4によりスピーカ11から合成音声として出力される。
この様子は、ロボットとして外観が構成されているエージェント1がユーザPに話しかけるようにして質問をするという形で実行される。ここでは、図5に示すように、エージェント1が質問内容として「誰と見たいですか?」を音声で発話し、続けて選択肢を発話する。エージェント1は必ず選択肢には番号をつけて発話するように構成されている。ユーザPは返答として選択肢の番号のみ発話することで回答することができる。また、質問に対する答えを知らない場合や考えつかない場合には「わからない」と回答することができ、この「わからない」という回答を選択肢の一つとして設定している。さらに、提示した回答の選択肢では該当する選択肢がない場合は「パス」と発話することができるように設定されている。
こうすることでエージェント1側においては、メモリ8の辞書に「1」、「2」、「3」、「4」、「わからない」、「パス」の6つのみ登録しておけばいい。音声認識部3においては、ユーザPが入力した音声をマイクロホン10を介して入力すると、音声認識処理によってこの5つのうちのどれに一番近いかを判別するだけでいいので、精度良く認識することができるようになる。このときの、制御回路2による音声認識処理が、本発明における検索手段の第2の手段に相当するものである。
なお、選択肢が4つよりも少ない場合は必要な番号のみ辞書に登録しておけばよい。また、選択肢としての言葉は、ここでは「0」〜「4」に設定しているが、番号が音声認識しにくい場合には、「A」、「B」、「C」、「D」、「E」や、「ハート」、「ダイヤ」、「スペード」、「クラブ」など、認識しやすい言葉を設定することができる。また、「わからない」という語は決まったフレーズであるから、「パス」と共にそのまま設定することもできる。さらに、選択肢の言葉として、質問の内容に含まれる言葉や質問内容をそのまま設定することもできる。
そして、ユーザPからの音声入力があると、音声認識部3は、認識処理を行って認識し、選択肢のどれを答えたか、あるいは「パス」と答えたかを調べる。制御回路2は、音声認識部3からの認識処理結果により、選択肢の番号を答えた場合(ステップT3で「YES」の場合)、その選択肢に該当するコンテンツをデータベース14aのコンテンツ群から絞り込み(ステップT4)、検索された部分コンテンツ群を新たなコンテンツ群として次の質問に対する検索対象として図3のステップS1にリターンする。このとき、エージェント1の制御回路2はどの質問を何回目に行ったかを記憶しておく。制御回路2によるステップT4の実行が、本発明でいう検索手段の第3の手段に相当するものである。
またユーザPが「パス」と答えた場合には、制御回路2は、ステップT3で「NO」と判断し、この質問は不適切であったものとして、以降の検索ではこの質問は選ばないように削除し(ステップT5)、図3のステップS1にリターンするものとする。
制御回路2は、上述のようにして質問検索ルーチンS2を実行することによって、検索対象のコンテンツ群の絞り込みを行い、最終的に検索されるコンテンツの数が4つ以内になるまで行う。これが本発明でいう検索手段の第4の手段に相当する。コンテンツの数が4つ以内であれば(ステップS1で「YES」の場合)、制御回路2は、コンテンツ名を直接選択肢にして四者択一でユーザPに質問する(ステップS3)。これが本発明でいう検索手段の第5の手段に相当する。
図6は、エージェント1がユーザPに対してコンテンツ名で質問をするシーンを示している。エージェント1は質問内容「タイトルはどれですか?」を音声で発話し、続けてコンテンツのタイトル名を発話する。制御回路2は、選択肢の中からコンテンツが選ばれたかどうかを調べ、選ばれていれば(ステップS4で「YES」の場合)検索処理を終了(リターン)し、メインプログラムに戻る。
また、制御回路2は、ユーザの回答が「パス」であってコンテンツが選ばれなければ(ステップS4で「NO」の場合)、絞り込んだコンテンツの中に探しているコンテンツがないということなので、検索処理をやり直すことになる。ここでは、検索処理のやり直しの際に、検索対象となる部分コンテンツ群を拡張する必要がある。エージェント1の制御回路2は、前述したように質問と返答を記憶しているので、それぞれの質問した段階でコンテンツがいくつまでしぼられたかを再現することが可能である。そこで該当コンテンツではないと確認されたコンテンツをはずして、検索対象のコンテンツ群に属するコンテンツの数が4つ以上になるまで質問の履歴をさかのぼり、検索対象を拡大する(ステップS5)。検索対象となるコンテンツ群を拡大した後は、ステップS1に戻って、最初から同じように質問を繰り返してコンテンツを絞り込んでいく。このようにしてデータベース14aからユーザPが所望するコンテンツを音声認識のみで検索することができるようになる。
次に、エージェント1の制御回路2は、メインプログラムにリターンすると、検索したコンテンツを使用して家庭内の家電機器であるビデオデッキ15を制御することが可能である。ここでは、制御回路2は、検索結果のテレビ番組に対応する録画予約情報をインターフェース9を介してビデオデッキ15に送信し、これによって録画予約を自動的に行なうようになる。
なお、制御対象とする家電機器としてはビデオデッキ15以外にも、たとえば、DVDレコーダとすることもできる。また、制御対象の家電機器としてIHクッキングヒータや電子レンジなどの調理機器を設定することもできる。この場合には、検索対象のコンテンツ群として料理のレシピが設定された場合などに、検索したレシピの調理条件を自動予約することができる。
このような第1の実施形態によれば、次の効果を得ることができる。
第1に、エージェント1の制御回路2により、ユーザPに対して、質問事項を音声合成により出力し、その質問内容に対するユーザPからの回答を音声により選択肢となる番号などにより答えるようにすることで、簡単且つ迅速にユーザPの回答を把握できるようになる。
第1に、エージェント1の制御回路2により、ユーザPに対して、質問事項を音声合成により出力し、その質問内容に対するユーザPからの回答を音声により選択肢となる番号などにより答えるようにすることで、簡単且つ迅速にユーザPの回答を把握できるようになる。
第2に、質問内容に対する回答をコンテンツに付随してメタ情報としてデータベースに登録しているので、検索処理において絞込みを行ないやすく、また、メタ情報として登録されている質問内容を選ぶことでユーザPからの回答を確実に引き出すことができるようになる。
第3に、質問の決定に際して、仮定条件を設定して式(1)に従って質問回数の期待値Eを計算することでその期待値Eが低くなる条件つまり質問回数が少なくなる条件で質問をするようにしたので、ユーザPによる回答の回数をできるだけ少なくして所望のコンテンツを迅速に絞り込むことができる。
第4に、質問に対するユーザPの回答が「パス」などの実質無回答の質問を削除して次回以降に使用しないようにしたので、ユーザPに対して無用な質問を繰り返すことなく迅速にコンテンツの絞込みを行なうことができるようになる。
第5に、質問によるコンテンツの決定が失敗した場合に、最後に検索された部分コンテンツ群を除いた上で拡大したコンテンツ群を設定し、再び質問を繰り返してコンテンツの検索処理を行うようにしたので、無駄な質問をなくしながらユーザPが所望するコンテンツの絞込みを確実に実施することができるようになる。
(第2の実施形態)
図7〜図9は本発明の第2の実施形態を示すもので、以下、第1の実施形態と異なる部分について説明する。
図7〜図9は本発明の第2の実施形態を示すもので、以下、第1の実施形態と異なる部分について説明する。
このコンテンツ検索システムでは、コンテンツに対する質問の情報が多ければ多いほど絞り込みの性能が向上する。それには、質問と回答のデータを増加させていく必要がある。そこで、この実施形態においては、ユーザとの対話で得られたデータをアップロードしてデータベース3を逐次更新していくことができるようにしたシステムを提供する。
このシステムではデータベース14a〜14cに登録するコンテンツに付随して登録するデータを次のようにして設定している。図7は、そのデータ構造を示している。ここでは、質問内容は第1の実施形態と同じ(図2(a)参照)であるが、メタ情報の持ち方が異なる。すなわち、図7(a)に示すように、メタ情報には質問の番号とこれに対する回答の情報は、回答の番号を示す数字ではなく、統計データを取得した際に回答番号別に選択した人数を記述するようにしている。これは、質問事項に対する各回答に評価点をつけたデータとして設定登録するもので、回答が一義的に設定されているのではなく、評価点が高いものがその時点での標準的な回答として登録されることになる。ここで「Null」というのは統計データの取得時に回答者が「わからない」と答えている人数である。
また、この実施形態においては、このメタ情報に加えて、新たに図7(b)に示すようなユーザ情報を持たせる構成としている。このユーザ情報は、ユーザがコンテンツ検索を行った結果として正しく検索できた場合に、そのコンテンツに対してユーザがどう回答したかを記録しておく。図中の数字は各回答番号について回答した回数である。
そして、コンテンツの検索処理をする際には、これに先立って、コンテンツに対する質問の回答をメタ情報とユーザ情報から決定する。あるコンテンツのメタ情報に記述された質問Q[n]の回答人数をAcm[n](m:回答の番号)とし、ユーザ情報に記述された回答回数をAum[n]とすると、各回答の回答数は以下の式(2)ように計算するおとができる。
例えば、統計的な情報を重視してコンテンツの検索をしたいと考えるユーザにおいては、メタ情報の重み付け係数Wcをユーザ情報の重み付け係数Wuよりも大きく設定することでその好みを満たすことができる。また、逆に、統計的な情報によらずユーザP自身の選択の情報を優先させたいと考えるユーザにおいては、WuをWcよりも大きく設定することが好ましい。
このようにして計算したA0[n](「わからない」に対する回答数), A1[n], A2[n], A3[n], A4[n]の中で一番数の多いものをこのコンテンツの質問に対する回答とする。このようにして各コンテンツに対する質問の回答を決定し、実施例1と同じように質問をユーザPに行いコンテンツを検索する。コンテンツ検索がうまくいった際は質問に対する回答をユーザ情報に繰り入れるように記録する。
ただし、この方法だとすでに回答が得られている質問に対する回答数を増加させるのみでまだ回答の得られていない質問の回答を収集することができない。そこで、コンテンツ検索に使用する質問にまぜてまだ回答の得られていない質問を行い、回答を収集する。ユーザPは検索の際に余分に質問に答えることになるが、それほどユーザが苦にならない程度例えば1,2問であれば実用上問題にならない。具体的にはコンテンツ検索が終了し、コンテンツが決定した際でそのコンテンツで回答が得られていない質問を行う。もし、検索の際の質問数がある程度多ければユーザに不快感を与えないためにデータ収集のための質問は行わないようにしておく。こうすることでデータ収集も同時に行うことができる。
また、1回の検索でユーザPから得られた回答はすべてユーザ情報に記録するが、同時にメタ情報にも記録する。こうすることですべてのユーザPに共通のメタ情報3bも更新することができるのではじめて使うユーザにも最新の情報で検索ができるようになる。
上記の方法だと検索されないコンテンツについてはメタ情報やユーザ情報が更新されないことになる。そこで、検索処理以外でも更新する方法について述べる。たとえばテレビ番組であれば、図8に示すように、ユーザPがテレビ16を視聴している際に、その番組に対してデータベースの質問内容から任意に選んだ質問をしてユーザPから回答を収集する。
ただし、番組視聴中に話しかけられると不快に思う人もいるので、番組の始まった直後や、番組が終わる直前などの時間帯を選んで実施する。この時間帯ならCMが入っている可能性が高いので不快には思われない。あるいは、図9に示すように、あるコンテンツのメタ情報と比較的近いメタ情報を持った別のコンテンツを視聴しているときにユーザPに質問をするようにする。全く興味のないコンテンツの質問をされても的確な回答は得られないので、興味のあるユーザPに質問する必要がある。メタ情報3bが近いということはそのコンテンツの内容が似ているということなので、現在視聴している番組に似た番組であればユーザPの好みにあったコンテンツについて質問をすることになるので、的確な回答を得ることができる。またそのコンテンツの紹介にもなる。テレビ番組以外でもレシピなどでも同じようにそのコンテンツを参照しているときに質問をすることができる。
このような第2の実施形態によれば、コンテンツに付随するメタ情報を統計データに基づいた各回答に対する回答数を記述するので、データの変動に追随した適切なメタ情報として利用することができるようになる。また、メタ情報に加えて、ユーザの選択回数も反映させるユーザ情報を付加するようにしたので、ユーザの嗜好に応じたコンテンツ検索を実現することができるようになる。
そして、上記したメタ情報およびユーザ情報の合成の際に、重み付け係数を設定しているので、それらの値を調整することにより、どちらの情報を優先させるかを好みに応じて設定することができ、より実用性の高いものとすることができる。
(第3の実施形態)
上記各実施形態においては、データベース14a〜14cに登録されていないコンテンツについては検索することができない。しかし、テレビ番組などは新しい番組が始まるので、コンテンツ自体も動的に追加していく必要がある。この実施形態では、データベースへのコンテンツの動的な追加方法を提供するものである。
上記各実施形態においては、データベース14a〜14cに登録されていないコンテンツについては検索することができない。しかし、テレビ番組などは新しい番組が始まるので、コンテンツ自体も動的に追加していく必要がある。この実施形態では、データベースへのコンテンツの動的な追加方法を提供するものである。
まず、コンテンツが調理のレシピなどの場合について述べる。レシピの場合は、コンテンツの数が少ないとユーザPの好みのコンテンツが得られない場合はあるが、ユーザPはレシピをひとつに決めてそれを検索するのではなく、レシピに対するイメージがありそのイメージにあったレシピを検索するので、必ず必要なレシピというのも存在しない。そのためコンテンツを増加する必然性は特にない。
そこで、コンテンツを追加するときにある程度タスクを課してもよい。そこでコンテンツを追加するときに質問内容に回答し、このコンテンツのメタ情報を作成してもらう。回答人数は多いほどいい。こうすることで追加されたコンテンツはメタ情報を持っているので検索することが可能である。そして、一度検索されればメタ情報は随時更新されるので回答人数も増加していく。
次にコンテンツがテレビ番組などの場合について述べる。テレビ番組は新しい番組が始まった場合には必ず追加しなければならない。しかし新しい番組が出るたびにメタ情報を作成するのは非常に困難である。そこで、まずメタ情報は番組情報から自動的に作成する。テレビ番組はEPG(electronic program guide)などの番組表では番組のタイトル、ジャンル、時間、出演者などの情報が入っている。
そこで、これらの情報からメタ情報を作成する。たとえば、「何時間の番組ですか?」という質問には番組の時間情報で回答ができる。また、「音楽番組ですか?」という質問には番組のジャンルで回答ができる。こういった番組情報から回答できる質問をいくつか用意しておき、自動的にメタ情報を作成する。こうすることで追加されたコンテンツはメタ情報を持っているので検索することが可能である。一度検索されればメタ情報は随時更新されるので回答人数も増加していく。
本発明は、上記実施例にのみ限定されるものではなく、次のように変形または拡張できる。
データベース14a〜14cは、家庭内に配置する構成とすることもできる。これによって全ての構成をエージェント1に含めたものとすることもできる。この場合には、コンテンツ検索の際にインターネット12を通じた通信は直接的には不要となるが、データベースの情報を更新するためには、最新のコンテンツデータを登録しているサーバ13に定期的に接続する構成を採用することが好ましい。
データベース14a〜14cは、家庭内に配置する構成とすることもできる。これによって全ての構成をエージェント1に含めたものとすることもできる。この場合には、コンテンツ検索の際にインターネット12を通じた通信は直接的には不要となるが、データベースの情報を更新するためには、最新のコンテンツデータを登録しているサーバ13に定期的に接続する構成を採用することが好ましい。
データベースの種類は、上記以外にも種々のものが考えられる。例えば、図書館などにおける書籍をコンテンツとしたデータベースや、映像ライブラリのデータベースなどがあり、いずれのものにおいても本発明を適用したコンテンツ検索を行うことができるものである。
図面中、1はエージェント、2は制御回路(検索手段)、3は音声認識部(音声認識手段)、4は音声合成部(音声合成手段)、7は通信装置、8はメモリ、9はインターフェース、12はインターネット、13はサーバ、14a〜14cはデータベース、15はビデオデッキ(家電機器)である。
Claims (8)
- データベースに登録された検索対象となる有限個のコンテンツのコンテンツ群から所望するコンテンツを検索するために設定されユーザが選択可能な複数の回答が設定された複数の質問事項を記憶する記憶手段と、
前記質問事項に対する音声による回答の入力を音声認識する音声認識手段と、
前記コンテンツ群から前記ユーザが所望するコンテンツを検索する検索手段とを備え、
前記検索手段は、
前記記憶手段に記憶された複数の質問事項から選んだ質問事項を前記ユーザに与える第1の手段と、
そのユーザからの音声による回答を前記音声認識手段により認識させて前記質問事項に対する回答を特定する第2の手段と、
特定された回答に該当するコンテンツを前記コンテンツ群から検索する第3の手段と、
前記第3の手段により検索されたコンテンツの個数が所定個数を超えて存在するときに、それら複数のコンテンツからなる部分コンテンツ群を新たなコンテンツ群として前記第1の手段から第3の手段を繰り返し実行する第4の手段と、
検索されたコンテンツの個数が所定個数以内になると、それらのコンテンツを前記ユーザが選択可能に提示する第5の手段と
を備えたことを特徴とするコンテンツ検索装置。 - 請求項1に記載のコンテンツ検索装置において、
前記データベースに登録された前記コンテンツ群のコンテンツには、前記複数の質問事項と共に、それらの質問事項のそれぞれに対して検索対象に該当する回答がメタ情報として付加された状態で登録され、
前記検索手段は、前記第3の手段を実行するときに前記ユーザの回答を検索条件として前記コンテンツ群の各コンテンツに付加された前記メタ情報を検索して該当するコンテンツを検索するように構成されていることを特徴とするコンテンツ検索装置。 - 請求項2に記載のコンテンツ検索装置において、
前記メタ情報は、前記質問事項に対して準備された複数個の回答に評価点を付けた回答データとして設定され、それらの回答データは、統計的回答数に重み付け係数を乗じた点数と、ユーザ回答に重み付け係数を乗じた点数との和からなる評価点が付加されたものとして登録され、
前記検索手段は、前記第3の手段の実行時に、前記質問事項に対して特定された回答に該当するコンテンツを、前記メタ情報に付加されている回答データの前記評価点が最も高い回答を検索対象に該当する回答として検索を実行するように構成されていることを特徴とするコンテンツ検索装置。 - 請求項3に記載のコンテンツ検索装置において、
前記メタ情報の回答データに付加される評価点は、前記統計的回答数およびユーザ回答に乗ずる重み付け係数を変更設定可能に設定されていることを特徴とするコンテンツ検索装置。 - 請求項1ないし4のいずれかに記載のコンテンツ検索装置において、
前記質問事項に対する音声による回答の入力は、複数の回答に対応付けられた選択肢を示す符号を音声により入力するように設定され、
前記検索手段は、前記音声認識手段から入力される選択肢を示す符号の認識結果から対応する回答を判定するように構成されていることを特徴とするコンテンツ検索装置。 - 請求項1ないし5のいずれかに記載のコンテンツ検索装置において、
前記検索手段は、前記第1の手段により前記質問事項を前記ユーザに与える場合に、前記コンテンツ群のコンテンツに応じて最適な質問事項を前記記憶手段から選択して提示するように構成されていることを特徴とするコンテンツ検索装置。 - 請求項6に記載のコンテンツ検索装置において、
前記検索手段は、前記最適な質問事項に加えて他の質問事項を提示し、そのときのユーザの回答を新たな回答データとしてメタ情報に付加して登録することを特徴とするコンテンツ検索装置。 - 請求項6または7に記載のコンテンツ検索装置において、
前記検索手段は、前記ユーザがコンテンツを使用している際にそのコンテンツに関して質問事項を提示し、そのときのユーザの回答を新たな回答データとしてメタ情報に付加して登録することを特徴とするコンテンツ検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006125892A JP2007299159A (ja) | 2006-04-28 | 2006-04-28 | コンテンツ検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006125892A JP2007299159A (ja) | 2006-04-28 | 2006-04-28 | コンテンツ検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007299159A true JP2007299159A (ja) | 2007-11-15 |
Family
ID=38768607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006125892A Pending JP2007299159A (ja) | 2006-04-28 | 2006-04-28 | コンテンツ検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007299159A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085873A (ja) * | 2012-10-24 | 2014-05-12 | Ntt Docomo Inc | 情報処理装置、情報処理システム、及び質問回答方法 |
JP2016519805A (ja) * | 2013-03-14 | 2016-07-07 | ロウルズ リミテッド ライアビリティ カンパニー | 複数のデバイス上でコンテンツを提供すること |
WO2016158005A1 (ja) * | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 制御装置、制御方法及びコンピュータプログラム |
US9842584B1 (en) | 2013-03-14 | 2017-12-12 | Amazon Technologies, Inc. | Providing content on multiple devices |
JP2018173784A (ja) * | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 検索処理方法、検索処理プログラム、および検索処理装置 |
US10929446B2 (en) | 2015-03-20 | 2021-02-23 | Kabushiki Kaisha Toshiba | Document search apparatus and method |
WO2022201541A1 (ja) * | 2021-03-26 | 2022-09-29 | 日本電気株式会社 | 検索装置、検索方法、及びコンピュータ読み取り可能な記録媒体 |
US11809885B2 (en) | 2020-01-29 | 2023-11-07 | Toyota Jidosha Kabushiki Kaisha | Agent device, agent system, and recording medium |
-
2006
- 2006-04-28 JP JP2006125892A patent/JP2007299159A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085873A (ja) * | 2012-10-24 | 2014-05-12 | Ntt Docomo Inc | 情報処理装置、情報処理システム、及び質問回答方法 |
JP2016519805A (ja) * | 2013-03-14 | 2016-07-07 | ロウルズ リミテッド ライアビリティ カンパニー | 複数のデバイス上でコンテンツを提供すること |
US9842584B1 (en) | 2013-03-14 | 2017-12-12 | Amazon Technologies, Inc. | Providing content on multiple devices |
US10121465B1 (en) | 2013-03-14 | 2018-11-06 | Amazon Technologies, Inc. | Providing content on multiple devices |
US10133546B2 (en) | 2013-03-14 | 2018-11-20 | Amazon Technologies, Inc. | Providing content on multiple devices |
US10832653B1 (en) | 2013-03-14 | 2020-11-10 | Amazon Technologies, Inc. | Providing content on multiple devices |
US10929446B2 (en) | 2015-03-20 | 2021-02-23 | Kabushiki Kaisha Toshiba | Document search apparatus and method |
WO2016158005A1 (ja) * | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 制御装置、制御方法及びコンピュータプログラム |
JP2018173784A (ja) * | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 検索処理方法、検索処理プログラム、および検索処理装置 |
US11809885B2 (en) | 2020-01-29 | 2023-11-07 | Toyota Jidosha Kabushiki Kaisha | Agent device, agent system, and recording medium |
WO2022201541A1 (ja) * | 2021-03-26 | 2022-09-29 | 日本電気株式会社 | 検索装置、検索方法、及びコンピュータ読み取り可能な記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10692504B2 (en) | User profiling for voice input processing | |
US7725486B2 (en) | Information retrieval apparatus | |
CN108153800B (zh) | 信息处理方法、信息处理装置以及记录介质 | |
JP2007299159A (ja) | コンテンツ検索装置 | |
JP4130846B2 (ja) | 操作支援装置および操作支援方法 | |
JP4331257B2 (ja) | 情報検索装置 | |
US20160055245A1 (en) | Systems and methods for providing information discovery and retrieval | |
JP4434972B2 (ja) | 情報提供システム、情報提供方法及びそのプログラム | |
CN108063969A (zh) | 显示设备、控制显示设备的方法、服务器以及控制服务器的方法 | |
JP2002082748A (ja) | ユーザ支援装置 | |
JP6120927B2 (ja) | 対話システム、対話を制御する方法、およびコンピュータを対話システムとして機能させるためのプログラム | |
JP2006033795A (ja) | リモートコントロールシステム、コントローラ、コンピュータにコントローラの機能を付与するプログラム、当該プログラムを格納した記憶媒体、およびサーバ。 | |
JP2005056361A (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
US20070233663A1 (en) | Method, apparatus, and computer program product for searching information | |
WO2004079593A1 (ja) | 情報閲覧方法及び情報閲覧装置 | |
JP2018092582A (ja) | 情報処理方法、情報処理装置、及び、プログラム | |
JP2009064391A (ja) | キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体 | |
JP2001028010A (ja) | マルチメディアコンテンツ自動抽出システム及びその方法 | |
JP2007316803A (ja) | 操作支援装置および操作支援方法 | |
JP2005209024A (ja) | 操作支援装置および操作支援方法 | |
JP2009134484A (ja) | コンテンツ選択支援装置、コンテンツ選択支援方法及びそのプログラム | |
JP6482703B1 (ja) | 推定装置、推定方法および推定プログラム | |
JP3759700B2 (ja) | 利用者嗜好反映型検索方法及びその実施装置並びにその処理プログラムと記録媒体 | |
JP2005242720A (ja) | データベース検索方法、データベース検索装置およびデータベース検索プログラム | |
WO2020116193A1 (ja) | 情報処理装置、情報処理方法、およびプログラム |