JP2007299159A

JP2007299159A - コンテンツ検索装置

Info

Publication number: JP2007299159A
Application number: JP2006125892A
Authority: JP
Inventors: Yuuka Tamura; 優佳田村; Takeshi Yabuuchi; 武之薮内; Hiroki Marutani; 裕樹丸谷
Original assignee: Toshiba Corp; Toshiba Consumer Marketing Corp; Toshiba Home Appliances Corp
Current assignee: Toshiba Corp; Toshiba Consumer Marketing Corp; Toshiba Lifestyle Products and Services Corp
Priority date: 2006-04-28
Filing date: 2006-04-28
Publication date: 2007-11-15

Abstract

【課題】コンテンツ群からユーザが所望するコンテンツを検索する場合に、面倒な操作入力を不要とし、迅速且つ確実に絞込みができるようにする。
【解決手段】エージェント１は、制御回路２を主体として、音声認識部３、音声合成部４などを備えると共に、通信装置７を介してインターネット１２に接続されるサーバ１３にアクセス可能で、コンテンツ群が登録されたデータベース１４ａ〜１４ｃの検索処理を実行する。データベース１４ａ〜１４ｃには、コンテンツの情報と共にコンテンツを検索するための質問事項の回答をデータとして持つメタ情報が付随して登録されている。エージェント１は、質問事項を音声合成によりスピーカ１１から出力し、ユーザが音声により回答の番号を答えると音声認識をして回答を特定する。得られた回答に基づいて検索処理を実行し、これを繰り返すことで絞込みを行う。
【選択図】図１

Description

本発明は、有限個のコンテンツの中からユーザが所望するコンテンツを検索するためのものであり、音声認識を有効に利用したコンテンツ検索装置に関する。

従来より、多数のコンテンツを有するコンテンツ群から希望するコンテンツを選び出すためには、一般にコンテンツに含まれるキーワードなどを指定してそれが含まれる条件で該当するものを検索している。このとき、コンテンツを検索する際にキーボードなどの文字の入力ができる入力デバイスを持っていない装置構成においては、文字を機器に入力するというのは非常に難しい。また、逆にボタンを複数用意する構成にすると、今度は操作する際にどのボタンを押していいか分かり難くなる。

そこで、ユーザが操作するのではなく、音声により回答するとこれを認識できるようにして操作入力の煩わしさを解消し、簡単にコンテンツの検索を行えるようにしたものが考えられている（例えば特許文献１参照）。このものは、システムからユーザに質問をしてその回答を音声により入力してこれを認識し、希望するコンテンツの絞込みをしようというものである。

また、コンテンツの検索をする場合に、コンテンツの検索に有効となるメタ情報を抽出しこれによって所望するコンテンツを抽出するキーワードとするものが考えられている（例えば特許文献２参照）。
特許３３７８５９５号公報特開２００５−９２２９５号公報

ところで、上記した特許文献１に示されるような音声認識を用いるものでは、ユーザが話した言葉を音声認識により判定するのに複雑な処理を要すると共にその処理に時間がかかるので、実用的には適用することが難しい。特に、家庭用の電化製品などの使用に適用しようとする場合、簡単且つ迅速にコンテンツを検索できるようにすることが難しくなるという不具合がある。

本発明は上記事情を考慮してなされたもので、その目的は、有限個のコンテンツからなるコンテンツ群からユーザが希望するコンテンツを音声認識により迅速且つ確実に検索することができるようにしたコンテンツ検索装置を提供することにある。

上記課題を解決するための構成として、本発明のコンテンツ検索装置は、データベースに登録された検索対象となる有限個のコンテンツのコンテンツ群から所望するコンテンツを検索するために設定されユーザが選択可能な複数の回答が設定された複数の質問事項を記憶する記憶手段と、前記質問事項に対する音声による回答の入力を音声認識する音声認識手段と、前記コンテンツ群から前記ユーザが所望するコンテンツを検索する検索手段とを備え、前記検索手段は、前記記憶手段に記憶された複数の質問事項から選んだ質問事項を前記ユーザに与える第１の手段と、そのユーザからの音声による回答を前記音声認識手段により認識させて前記質問事項に対する回答を特定する第２の手段と、特定された回答に該当するコンテンツを前記コンテンツ群から検索する第３の手段と、前記第３の手段により検索されたコンテンツの個数が所定個数を超えて存在するときに、それら複数のコンテンツからなる部分コンテンツ群を新たなコンテンツ群として前記第１の手段から第３の手段を繰り返し実行する第４の手段と、検索されたコンテンツの個数が所定個数以内になると、それらのコンテンツを前記ユーザが選択可能に提示する第５の手段とを備えたところに特徴を有する。

本発明は、上記構成を採用したので、検索手段は、第１の手段により、記憶手段に記憶された複数の質問事項から選んだ質問事項を前記ユーザに与え、これによってユーザが選択可能な複数の回答が提示されると、第２の手段により、その質問事項に対するユーザからの音声による回答を音声認識手段により認識させて回答を特定し、第３の手段により、特定された回答に該当するコンテンツを有限個のコンテンツを有するコンテンツ群から検索する。検索結果得られたコンテンツの個数が所定個数を超えて存在するときには、第４の手段により、それら複数のコンテンツからなる部分コンテンツ群を新たなコンテンツ群として第１の手段から第３の手段を繰り返し実行し、検索されたコンテンツの個数が所定個数以内になると、第５の手段により、えら得たコンテンツをユーザが選択可能に提示する。

これにより、質問事項に対応してユーザが選択した回答を音声により受け付け、その回答に基づいてコンテンツ群を絞り込んでいくので、音声認識手段による音声認識処理では、ユーザの音声による回答を予め準備している複数個の回答の中から該当するものを特定することを行えば達成できるので、迅速且つ確実にユーザの回答を認識でき、これによって、コンテンツ群の中から質問事項を複数回ユーザに提示することでコンテンツの絞込みを行うことができるようになる。

（第１の実施形態）
以下、本発明の第１の実施形態について、図１〜図６を参照して説明する。
図１はコンテンツ検索システム全体のブロック構成を示すもので、このシステム構成においては、検索を実行する装置として家庭内に設ける設備の構成として例示している。コンテンツ検索の主体となって実行するエージェント１は、例えばロボットのような外形をした装置として設けられている（図５、図６参照）。このエージェント１は、ユーザＰに対して質問を投じてその音声による回答を得てユーザＰが希望するコンテンツの絞込みを行うように構成されている。

エージェント１は、制御回路２を主体として構成されている。制御回路２は、ＣＰＵを中心としてＲＯＭ、ＲＡＭや各種の回路を含んで構成されるもので、後述するプログラムによりコンテンツ検索処理を実行する検索手段としての機能を備えた構成とされている。制御回路２には、音声認識部３、音声合成部４、表示部５および操作部６が接続されると共に、通信装置７、メモリ８、インターフェース９が接続されている。

音声認識手段としての音声認識部３は、音声認識エンジンが搭載されており、音声認識処理をする際に必要となる辞書がメモリ８に記憶されている。この辞書には音声認識のための待ちうけ語が登録されており、音声認識部３に接続されたマイクロホン１０により音声入力を受け付けている期間に入力された音声を認識し、辞書内に登録された言葉の中で入力音声に一番近い言葉を選択し、認識結果として出力する。なお、音声認識に用いる辞書は言葉の追加・削除が可能である。

また、音声合成手段としての音声合成部４は、音声合成エンジンが搭載されており、制御回路２側から出力すべきテキスト文が入力されると、テキスト文を音声合成により音声信号として作成し、出力端子に接続されたスピーカ１１により合成音声として読み上げることで出力することが可能である。

表示部５は簡単な内容を表示するためのもので、例えば検索対象となるコンテンツ群を選択する際にコンテンツ群の名前を表示することができる。操作部６は、コンテンツ群の選択をするためのもので、ユーザＰが希望する検索対象のコンテンツ群に対応するスイッチを操作することで選択できるように構成されている。なお、表示部５や操作部６は必要に応じて設ければ良く、これらの機能も音声認識や音声合成によって音声によってユーザＰに伝えたり、ユーザＰが発する音声を音声認識により把握して入力したりすることで代替することができるものである。

通信装置７は、外部の公衆通信網であるインターネット１２に接続されており、このインターネット１２を介してサーバ１３にアクセス可能に構成されている。サーバ１３には、各種データベース１４ａ、１４ｂ、１４ｃが接続されている。これらのデータベース１４ａ〜１４ｃには、カテゴリ別に多数のコンテンツが登録されている。例えば、テレビの番組（コンテンツ）に関する情報が登録されたデータベースや、映画や音楽の曲などのコンテンツが登録されたデータベースや、あるいは料理のレシピなどのコンテンツが登録されたデータベースなど様々なものが想定されている。なお、データベース１４ａ〜１４ｃは、家庭の外部のサーバ１３に設けるのではなく、家庭内に設ける構成とすることもできる。この場合には、メモリ８をハードディスク装置などの大容量のものとすることでデータベースとしての機能を兼ね備えたものとすることができる。

インターフェース９は、例えばビデオデッキ１５のような家庭内に設けられる家電機器と通信をするためのもので、有線通信方式のものではＬＡＮ接続するためのインターフェースであり、無線通信方式のものではｂｌｕｅｔｏｏｔなどの無線ＬＡＮのインターフェースや赤外線通信などの光通信用のインターフェースである。

ここではビデオデッキ１５にテレビ番組（コンテンツ）の録画予約をするための通信手段として構成されているもので、エージェント１の制御回路２から検索結果のデータに応じてコマンドを送信するように構成されている。ビデオデッキ１５以外にも、ＤＶＤレコーダやＣＤプレーヤあるいはラジオ、テレビなどの家電機器としても良いし、ＩＨクッキングヒータや電子レンジなどの調理機器としても良いし、さらには他の家電機器を制御する構成とすることもできる。

また、前記したデータベース１４ａ〜１４ｃには、コンテンツを検索する際に有効な手段となる検索用の質問内容と、その統計的に得られた質問に対する回答の情報がメタ情報としてコンテンツに付随した状態で登録されており、記憶手段としての機能も兼ね備えている。質問内容は例えば図２（ａ）に示すように、複数の質問のそれぞれに質問番号、質問文のテキスト、回答の選択肢のテキストが記述されている。選択肢は「わからない」という回答０を含めて最大５つまでとする。しかし、選択肢が５つも必要ではない場合については、必要ない選択肢の部分は空欄にしておく。

エージェント１は、制御回路２により、質問文のテキストデータ・選択肢のテキストデータを音声合成データとして音声合成部４に出力すると、これを音声に変換してスピーカ１１から出力することで読み上げるように構成されている。なお、エージェント１に質問を読み上げさせるためには、質問内容はテキストの代わりにあらかじめ質問を読み上げた音声ファイルを作成し保持していてもよい。音声合成を自動で行うとイントネーションや漢字の読み方が不自然になる場合があるが、これに対して予め人が音声により読み上げた音声ファイルを登録しておくことでこういった問題が解消される。

メタ情報は、図２（ｂ）に示すように、各コンテンツに対応して、上記した質問事項に対する回答の一般的なものが設定され、これがコンテンツ情報と共に付随した情報として登録されている。ただし、質問内容に記述されているすべての質問に対する回答が記述されている必要はない。

次に、上記構成の作用について図３〜図６も参照して説明する。
まず、ユーザＰはエージェント１に対して、所望するコンテンツ検索を開始させるためのコマンドを伝える必要がある。エージェント１が操作部６を備えていてそこに入力用のボタンをいくつか持っている場合、ボタンのひとつを検索開始ボタンにしておき、該当ボタンが押されたら検索を開始するとしておいてもよい。また、この実施形態におけるように複数のデータベース１４ａ〜１４ｃが存在するときには、それらのうちの所望のデータベース１４ａ〜１４ｃを選ぶためのボタンを用意しておく。

例えばこの実施形態におけるように、ビデオ録画を行うためにテレビ番組表から番組を検索するときのボタンは「ビデオ録画」、夕食のメニューを決めるためにレシピデータベースからレシピを検索する場合には「レシピ検索」など、用途の書かれたボタンが用意されているものとする。ボタンを特に持っていない場合、音声認識でユーザＰが該当する音声を入力した場合に検索を開始するとしておいてもよい。エージェント１は検索を実行していない待機中の状態ではメモリ８の辞書に「ビデオ録画」、「レシピ検索」などの検索を開始させるコマンドのみ登録しておく。ユーザＰから音声の入力があったときには辞書から一番近い言葉を選び、そのデータベース１４ａ〜１４ｃに対する検索を開始する。

データベース１４ａ〜１４ｃから、例えば「ビデオ録画」に対応するテレビ番組の予約用のデータベース１４ａが決定されると、エージェント１の制御回路２はコンテンツの検索処理プログラムを開始する。図３は検索処理プログラムのフローチャートである。エージェント１の制御回路３は、検索処理プログラムを開始すると、選択肢形式の質問をユーザＰに行うが、音声認識の精度を高くするためにはメモリ８の辞書に登録する語彙は少ない方がいい。そこで、ここでは選択肢は４つ以内と限定する。そのためコンテンツの数が４つ以内であれば直接コンテンツの名前を選択肢にして質問することができる。

このため、制御回路３は、まず検索対象のデータベース１４ａに登録されているコンテンツ群に属するコンテンツの数が４つ以内かどうかを調べる（ステップＳ１）。ここで、４つよりも多くコンテンツが存在する場合つまり「ＮＯ」と判断されるときには、制御回路３は、質問検索ルーチンＳ２を実行する。質問検索ルーチンＳ２は、図４に示すようなフローチャートにしたがって実行される。ここでは、制御回路２は、まずユーザＰにする質問を決定する（ステップＴ１）。質問の選出の仕方は次のようにして行なわれる。

前述したように、データベース１４ａには、ビデオ録画に対応したテレビ番組がコンテンツとして登録されており、さらに、それらのコンテンツに付随して図２（ｂ）に示したようなメタ情報が登録されている。メタ情報として登録されたデータに対応する質問内容は図２（ａ）に示すようなものであるが、準備されているすべての質問内容に対応した回答が記述されているとは限らない。そこで、ここでは制御回路２は、検索対象のコンテンツ群に属しているすべてのコンテンツに付随して登録されているメタ情報に記述されている質問のみを選ぶ（ステップＴ１）。

また、制御回路２による質問内容の決定に際しては、できるだけ質問回数を少なくして最終的にユーザＰが所望するコンテンツが検索できることが好ましいから、これを次のようにして推定する。すなわち、検索終了までの質問回数の期待値Ｅを計算して期待値が小さいものを選ぶようにする。

この検索方法では質問回数が少ない方がいい。そこでステップＴ１で決定しようとする対象の質問の中で質問回数の期待値Ｅが最も少なくなる質問を選択する。ここでは次のように仮定して計算する。まず、対象となるコンテンツ群のコンテンツが質問によってａ個、ｂ個、ｃ個、ｄ個、ｅ個の５つに分割されるとする。そして、この質問の後にｎ者択一の質問のみが繰り返され、その質問によってコンテンツ数が必ずｎ等分されるとすると仮定する。このとき、ａ個、ｂ個、ｃ個、ｄ個、ｅ個にわかれたコンテンツの中から1つのコンテンツを選び出すために必要な質問回数の期待値Ｅは、次式（１）で得られる。

これは質問が五者択一とした場合だが、同じように二者択一や三者択一あるいは四者択一の場合も計算できる。ｎは２〜５ならいくつでもいい。この計算を各質問に対して行い、期待値Ｅが最も小さくなった質問を選択することにする。

このようにして最適な質問を決定すると、エージェント１の制御回路２は、その質問をユーザＰに音声により問い合わせる（ステップＴ２）。ここで、制御回路２によるステップＴ１およびＴ２の実施が、本発明でいう検索手段の第１の手段に相当する。図５は選択された質問をユーザＰに質問するシーンである。エージェント１の制御回路２は、質問内容のテキスト内容に対応する信号を音声合成部４に出力すると、音声合成部４によりスピーカ１１から合成音声として出力される。

この様子は、ロボットとして外観が構成されているエージェント１がユーザＰに話しかけるようにして質問をするという形で実行される。ここでは、図５に示すように、エージェント１が質問内容として「誰と見たいですか？」を音声で発話し、続けて選択肢を発話する。エージェント１は必ず選択肢には番号をつけて発話するように構成されている。ユーザＰは返答として選択肢の番号のみ発話することで回答することができる。また、質問に対する答えを知らない場合や考えつかない場合には「わからない」と回答することができ、この「わからない」という回答を選択肢の一つとして設定している。さらに、提示した回答の選択肢では該当する選択肢がない場合は「パス」と発話することができるように設定されている。

こうすることでエージェント１側においては、メモリ８の辞書に「１」、「２」、「３」、「４」、「わからない」、「パス」の６つのみ登録しておけばいい。音声認識部３においては、ユーザＰが入力した音声をマイクロホン１０を介して入力すると、音声認識処理によってこの５つのうちのどれに一番近いかを判別するだけでいいので、精度良く認識することができるようになる。このときの、制御回路２による音声認識処理が、本発明における検索手段の第２の手段に相当するものである。

なお、選択肢が４つよりも少ない場合は必要な番号のみ辞書に登録しておけばよい。また、選択肢としての言葉は、ここでは「０」〜「４」に設定しているが、番号が音声認識しにくい場合には、「Ａ」、「Ｂ」、「Ｃ」、「Ｄ」、「Ｅ」や、「ハート」、「ダイヤ」、「スペード」、「クラブ」など、認識しやすい言葉を設定することができる。また、「わからない」という語は決まったフレーズであるから、「パス」と共にそのまま設定することもできる。さらに、選択肢の言葉として、質問の内容に含まれる言葉や質問内容をそのまま設定することもできる。

そして、ユーザＰからの音声入力があると、音声認識部３は、認識処理を行って認識し、選択肢のどれを答えたか、あるいは「パス」と答えたかを調べる。制御回路２は、音声認識部３からの認識処理結果により、選択肢の番号を答えた場合（ステップＴ３で「ＹＥＳ」の場合）、その選択肢に該当するコンテンツをデータベース１４ａのコンテンツ群から絞り込み（ステップＴ４）、検索された部分コンテンツ群を新たなコンテンツ群として次の質問に対する検索対象として図３のステップＳ１にリターンする。このとき、エージェント１の制御回路２はどの質問を何回目に行ったかを記憶しておく。制御回路２によるステップＴ４の実行が、本発明でいう検索手段の第３の手段に相当するものである。

またユーザＰが「パス」と答えた場合には、制御回路２は、ステップＴ３で「ＮＯ」と判断し、この質問は不適切であったものとして、以降の検索ではこの質問は選ばないように削除し（ステップＴ５）、図３のステップＳ１にリターンするものとする。

制御回路２は、上述のようにして質問検索ルーチンＳ２を実行することによって、検索対象のコンテンツ群の絞り込みを行い、最終的に検索されるコンテンツの数が４つ以内になるまで行う。これが本発明でいう検索手段の第４の手段に相当する。コンテンツの数が４つ以内であれば（ステップＳ１で「ＹＥＳ」の場合）、制御回路２は、コンテンツ名を直接選択肢にして四者択一でユーザＰに質問する（ステップＳ３）。これが本発明でいう検索手段の第５の手段に相当する。

図６は、エージェント１がユーザＰに対してコンテンツ名で質問をするシーンを示している。エージェント１は質問内容「タイトルはどれですか？」を音声で発話し、続けてコンテンツのタイトル名を発話する。制御回路２は、選択肢の中からコンテンツが選ばれたかどうかを調べ、選ばれていれば（ステップＳ４で「ＹＥＳ」の場合）検索処理を終了（リターン）し、メインプログラムに戻る。

また、制御回路２は、ユーザの回答が「パス」であってコンテンツが選ばれなければ（ステップＳ４で「ＮＯ」の場合）、絞り込んだコンテンツの中に探しているコンテンツがないということなので、検索処理をやり直すことになる。ここでは、検索処理のやり直しの際に、検索対象となる部分コンテンツ群を拡張する必要がある。エージェント１の制御回路２は、前述したように質問と返答を記憶しているので、それぞれの質問した段階でコンテンツがいくつまでしぼられたかを再現することが可能である。そこで該当コンテンツではないと確認されたコンテンツをはずして、検索対象のコンテンツ群に属するコンテンツの数が４つ以上になるまで質問の履歴をさかのぼり、検索対象を拡大する（ステップＳ５）。検索対象となるコンテンツ群を拡大した後は、ステップＳ１に戻って、最初から同じように質問を繰り返してコンテンツを絞り込んでいく。このようにしてデータベース１４ａからユーザＰが所望するコンテンツを音声認識のみで検索することができるようになる。

次に、エージェント１の制御回路２は、メインプログラムにリターンすると、検索したコンテンツを使用して家庭内の家電機器であるビデオデッキ１５を制御することが可能である。ここでは、制御回路２は、検索結果のテレビ番組に対応する録画予約情報をインターフェース９を介してビデオデッキ１５に送信し、これによって録画予約を自動的に行なうようになる。

なお、制御対象とする家電機器としてはビデオデッキ１５以外にも、たとえば、ＤＶＤレコーダとすることもできる。また、制御対象の家電機器としてＩＨクッキングヒータや電子レンジなどの調理機器を設定することもできる。この場合には、検索対象のコンテンツ群として料理のレシピが設定された場合などに、検索したレシピの調理条件を自動予約することができる。

このような第１の実施形態によれば、次の効果を得ることができる。
第１に、エージェント１の制御回路２により、ユーザＰに対して、質問事項を音声合成により出力し、その質問内容に対するユーザＰからの回答を音声により選択肢となる番号などにより答えるようにすることで、簡単且つ迅速にユーザＰの回答を把握できるようになる。

第２に、質問内容に対する回答をコンテンツに付随してメタ情報としてデータベースに登録しているので、検索処理において絞込みを行ないやすく、また、メタ情報として登録されている質問内容を選ぶことでユーザＰからの回答を確実に引き出すことができるようになる。

第３に、質問の決定に際して、仮定条件を設定して式（１）に従って質問回数の期待値Ｅを計算することでその期待値Ｅが低くなる条件つまり質問回数が少なくなる条件で質問をするようにしたので、ユーザＰによる回答の回数をできるだけ少なくして所望のコンテンツを迅速に絞り込むことができる。

第４に、質問に対するユーザＰの回答が「パス」などの実質無回答の質問を削除して次回以降に使用しないようにしたので、ユーザＰに対して無用な質問を繰り返すことなく迅速にコンテンツの絞込みを行なうことができるようになる。

第５に、質問によるコンテンツの決定が失敗した場合に、最後に検索された部分コンテンツ群を除いた上で拡大したコンテンツ群を設定し、再び質問を繰り返してコンテンツの検索処理を行うようにしたので、無駄な質問をなくしながらユーザＰが所望するコンテンツの絞込みを確実に実施することができるようになる。

（第２の実施形態）
図７〜図９は本発明の第２の実施形態を示すもので、以下、第１の実施形態と異なる部分について説明する。

このコンテンツ検索システムでは、コンテンツに対する質問の情報が多ければ多いほど絞り込みの性能が向上する。それには、質問と回答のデータを増加させていく必要がある。そこで、この実施形態においては、ユーザとの対話で得られたデータをアップロードしてデータベース３を逐次更新していくことができるようにしたシステムを提供する。

このシステムではデータベース１４ａ〜１４ｃに登録するコンテンツに付随して登録するデータを次のようにして設定している。図７は、そのデータ構造を示している。ここでは、質問内容は第１の実施形態と同じ（図２（ａ）参照）であるが、メタ情報の持ち方が異なる。すなわち、図７（ａ）に示すように、メタ情報には質問の番号とこれに対する回答の情報は、回答の番号を示す数字ではなく、統計データを取得した際に回答番号別に選択した人数を記述するようにしている。これは、質問事項に対する各回答に評価点をつけたデータとして設定登録するもので、回答が一義的に設定されているのではなく、評価点が高いものがその時点での標準的な回答として登録されることになる。ここで「Ｎｕｌｌ」というのは統計データの取得時に回答者が「わからない」と答えている人数である。

また、この実施形態においては、このメタ情報に加えて、新たに図７（ｂ）に示すようなユーザ情報を持たせる構成としている。このユーザ情報は、ユーザがコンテンツ検索を行った結果として正しく検索できた場合に、そのコンテンツに対してユーザがどう回答したかを記録しておく。図中の数字は各回答番号について回答した回数である。

そして、コンテンツの検索処理をする際には、これに先立って、コンテンツに対する質問の回答をメタ情報とユーザ情報から決定する。あるコンテンツのメタ情報に記述された質問Ｑ［ｎ］の回答人数をＡｃｍ［ｎ］(ｍ：回答の番号)とし、ユーザ情報に記述された回答回数をＡｕｍ［ｎ］とすると、各回答の回答数は以下の式（２）ように計算するおとができる。

ここで、Ｗｃ，Ｗｕはそれぞれメタ情報およびユーザ情報の重み付け係数である。この重み付け係数Ｗｃ，Ｗｕを調整することによって、統計的な情報とユーザの個人的な情報とどちらをどれくらい優先させるかを決めることができる。質問によってメタ情報とユーザ情報の回答数が異なるので、Ｗｃ，Ｗｕはそれぞれの回答数に応じて変更してもよい。あるいは、ユーザが好みに応じて適宜の数値に設定するようにしても良い。

例えば、統計的な情報を重視してコンテンツの検索をしたいと考えるユーザにおいては、メタ情報の重み付け係数Ｗｃをユーザ情報の重み付け係数Ｗｕよりも大きく設定することでその好みを満たすことができる。また、逆に、統計的な情報によらずユーザＰ自身の選択の情報を優先させたいと考えるユーザにおいては、ＷｕをＷｃよりも大きく設定することが好ましい。

このようにして計算したＡ0［ｎ］（「わからない」に対する回答数）, Ａ1［ｎ］, Ａ2［ｎ］, Ａ3［ｎ］, Ａ4［ｎ］の中で一番数の多いものをこのコンテンツの質問に対する回答とする。このようにして各コンテンツに対する質問の回答を決定し、実施例１と同じように質問をユーザＰに行いコンテンツを検索する。コンテンツ検索がうまくいった際は質問に対する回答をユーザ情報に繰り入れるように記録する。

ただし、この方法だとすでに回答が得られている質問に対する回答数を増加させるのみでまだ回答の得られていない質問の回答を収集することができない。そこで、コンテンツ検索に使用する質問にまぜてまだ回答の得られていない質問を行い、回答を収集する。ユーザＰは検索の際に余分に質問に答えることになるが、それほどユーザが苦にならない程度例えば１，２問であれば実用上問題にならない。具体的にはコンテンツ検索が終了し、コンテンツが決定した際でそのコンテンツで回答が得られていない質問を行う。もし、検索の際の質問数がある程度多ければユーザに不快感を与えないためにデータ収集のための質問は行わないようにしておく。こうすることでデータ収集も同時に行うことができる。

また、１回の検索でユーザＰから得られた回答はすべてユーザ情報に記録するが、同時にメタ情報にも記録する。こうすることですべてのユーザＰに共通のメタ情報３ｂも更新することができるのではじめて使うユーザにも最新の情報で検索ができるようになる。

上記の方法だと検索されないコンテンツについてはメタ情報やユーザ情報が更新されないことになる。そこで、検索処理以外でも更新する方法について述べる。たとえばテレビ番組であれば、図８に示すように、ユーザＰがテレビ１６を視聴している際に、その番組に対してデータベースの質問内容から任意に選んだ質問をしてユーザＰから回答を収集する。

ただし、番組視聴中に話しかけられると不快に思う人もいるので、番組の始まった直後や、番組が終わる直前などの時間帯を選んで実施する。この時間帯ならＣＭが入っている可能性が高いので不快には思われない。あるいは、図９に示すように、あるコンテンツのメタ情報と比較的近いメタ情報を持った別のコンテンツを視聴しているときにユーザＰに質問をするようにする。全く興味のないコンテンツの質問をされても的確な回答は得られないので、興味のあるユーザＰに質問する必要がある。メタ情報３ｂが近いということはそのコンテンツの内容が似ているということなので、現在視聴している番組に似た番組であればユーザＰの好みにあったコンテンツについて質問をすることになるので、的確な回答を得ることができる。またそのコンテンツの紹介にもなる。テレビ番組以外でもレシピなどでも同じようにそのコンテンツを参照しているときに質問をすることができる。

このような第２の実施形態によれば、コンテンツに付随するメタ情報を統計データに基づいた各回答に対する回答数を記述するので、データの変動に追随した適切なメタ情報として利用することができるようになる。また、メタ情報に加えて、ユーザの選択回数も反映させるユーザ情報を付加するようにしたので、ユーザの嗜好に応じたコンテンツ検索を実現することができるようになる。

そして、上記したメタ情報およびユーザ情報の合成の際に、重み付け係数を設定しているので、それらの値を調整することにより、どちらの情報を優先させるかを好みに応じて設定することができ、より実用性の高いものとすることができる。

（第３の実施形態）
上記各実施形態においては、データベース１４ａ〜１４ｃに登録されていないコンテンツについては検索することができない。しかし、テレビ番組などは新しい番組が始まるので、コンテンツ自体も動的に追加していく必要がある。この実施形態では、データベースへのコンテンツの動的な追加方法を提供するものである。

まず、コンテンツが調理のレシピなどの場合について述べる。レシピの場合は、コンテンツの数が少ないとユーザＰの好みのコンテンツが得られない場合はあるが、ユーザＰはレシピをひとつに決めてそれを検索するのではなく、レシピに対するイメージがありそのイメージにあったレシピを検索するので、必ず必要なレシピというのも存在しない。そのためコンテンツを増加する必然性は特にない。

そこで、コンテンツを追加するときにある程度タスクを課してもよい。そこでコンテンツを追加するときに質問内容に回答し、このコンテンツのメタ情報を作成してもらう。回答人数は多いほどいい。こうすることで追加されたコンテンツはメタ情報を持っているので検索することが可能である。そして、一度検索されればメタ情報は随時更新されるので回答人数も増加していく。

次にコンテンツがテレビ番組などの場合について述べる。テレビ番組は新しい番組が始まった場合には必ず追加しなければならない。しかし新しい番組が出るたびにメタ情報を作成するのは非常に困難である。そこで、まずメタ情報は番組情報から自動的に作成する。テレビ番組はＥＰＧ（electronic program guide）などの番組表では番組のタイトル、ジャンル、時間、出演者などの情報が入っている。

そこで、これらの情報からメタ情報を作成する。たとえば、「何時間の番組ですか？」という質問には番組の時間情報で回答ができる。また、「音楽番組ですか？」という質問には番組のジャンルで回答ができる。こういった番組情報から回答できる質問をいくつか用意しておき、自動的にメタ情報を作成する。こうすることで追加されたコンテンツはメタ情報を持っているので検索することが可能である。一度検索されればメタ情報は随時更新されるので回答人数も増加していく。

本発明は、上記実施例にのみ限定されるものではなく、次のように変形または拡張できる。
データベース１４ａ〜１４ｃは、家庭内に配置する構成とすることもできる。これによって全ての構成をエージェント１に含めたものとすることもできる。この場合には、コンテンツ検索の際にインターネット１２を通じた通信は直接的には不要となるが、データベースの情報を更新するためには、最新のコンテンツデータを登録しているサーバ１３に定期的に接続する構成を採用することが好ましい。

データベースの種類は、上記以外にも種々のものが考えられる。例えば、図書館などにおける書籍をコンテンツとしたデータベースや、映像ライブラリのデータベースなどがあり、いずれのものにおいても本発明を適用したコンテンツ検索を行うことができるものである。

本発明の第１の実施形態を示す電気的なブロック構成図質問の内容と回答の選択肢のデータ構造およびコンテンツに付随するメタ情報のデータ構造を示す図検索処理プログラムのフローチャート質問検索ルーチンのフローチャートエージェントによる質問とユーザの回答のシーンを示す図エージェントによるコンテンツ名による質問とユーザの回答のシーンを示す図本発明の第２の実施形態を示すコンテンツに付随するメタ情報のデータ構造を示す図エージェントによるコンテンツのメタ情報の回答数を増やすための質問とユーザの回答のシーンを示す図エージェントによる類似するコンテンツのメタ情報の回答数を増やすための質問とユーザの回答のシーンを示す図

符号の説明

図面中、１はエージェント、２は制御回路（検索手段）、３は音声認識部（音声認識手段）、４は音声合成部（音声合成手段）、７は通信装置、８はメモリ、９はインターフェース、１２はインターネット、１３はサーバ、１４ａ〜１４ｃはデータベース、１５はビデオデッキ（家電機器）である。

Claims

データベースに登録された検索対象となる有限個のコンテンツのコンテンツ群から所望するコンテンツを検索するために設定されユーザが選択可能な複数の回答が設定された複数の質問事項を記憶する記憶手段と、
前記質問事項に対する音声による回答の入力を音声認識する音声認識手段と、
前記コンテンツ群から前記ユーザが所望するコンテンツを検索する検索手段とを備え、
前記検索手段は、
前記記憶手段に記憶された複数の質問事項から選んだ質問事項を前記ユーザに与える第１の手段と、
そのユーザからの音声による回答を前記音声認識手段により認識させて前記質問事項に対する回答を特定する第２の手段と、
特定された回答に該当するコンテンツを前記コンテンツ群から検索する第３の手段と、
前記第３の手段により検索されたコンテンツの個数が所定個数を超えて存在するときに、それら複数のコンテンツからなる部分コンテンツ群を新たなコンテンツ群として前記第１の手段から第３の手段を繰り返し実行する第４の手段と、
検索されたコンテンツの個数が所定個数以内になると、それらのコンテンツを前記ユーザが選択可能に提示する第５の手段と
を備えたことを特徴とするコンテンツ検索装置。
請求項１に記載のコンテンツ検索装置において、
前記データベースに登録された前記コンテンツ群のコンテンツには、前記複数の質問事項と共に、それらの質問事項のそれぞれに対して検索対象に該当する回答がメタ情報として付加された状態で登録され、
前記検索手段は、前記第３の手段を実行するときに前記ユーザの回答を検索条件として前記コンテンツ群の各コンテンツに付加された前記メタ情報を検索して該当するコンテンツを検索するように構成されていることを特徴とするコンテンツ検索装置。
請求項２に記載のコンテンツ検索装置において、
前記メタ情報は、前記質問事項に対して準備された複数個の回答に評価点を付けた回答データとして設定され、それらの回答データは、統計的回答数に重み付け係数を乗じた点数と、ユーザ回答に重み付け係数を乗じた点数との和からなる評価点が付加されたものとして登録され、
前記検索手段は、前記第３の手段の実行時に、前記質問事項に対して特定された回答に該当するコンテンツを、前記メタ情報に付加されている回答データの前記評価点が最も高い回答を検索対象に該当する回答として検索を実行するように構成されていることを特徴とするコンテンツ検索装置。
請求項３に記載のコンテンツ検索装置において、
前記メタ情報の回答データに付加される評価点は、前記統計的回答数およびユーザ回答に乗ずる重み付け係数を変更設定可能に設定されていることを特徴とするコンテンツ検索装置。
請求項１ないし４のいずれかに記載のコンテンツ検索装置において、
前記質問事項に対する音声による回答の入力は、複数の回答に対応付けられた選択肢を示す符号を音声により入力するように設定され、
前記検索手段は、前記音声認識手段から入力される選択肢を示す符号の認識結果から対応する回答を判定するように構成されていることを特徴とするコンテンツ検索装置。
請求項１ないし５のいずれかに記載のコンテンツ検索装置において、
前記検索手段は、前記第１の手段により前記質問事項を前記ユーザに与える場合に、前記コンテンツ群のコンテンツに応じて最適な質問事項を前記記憶手段から選択して提示するように構成されていることを特徴とするコンテンツ検索装置。
請求項６に記載のコンテンツ検索装置において、
前記検索手段は、前記最適な質問事項に加えて他の質問事項を提示し、そのときのユーザの回答を新たな回答データとしてメタ情報に付加して登録することを特徴とするコンテンツ検索装置。
請求項６または７に記載のコンテンツ検索装置において、
前記検索手段は、前記ユーザがコンテンツを使用している際にそのコンテンツに関して質問事項を提示し、そのときのユーザの回答を新たな回答データとしてメタ情報に付加して登録することを特徴とするコンテンツ検索装置。