JP2007178927A - 情報検索装置および方法 - Google Patents

情報検索装置および方法 Download PDF

Info

Publication number
JP2007178927A
JP2007178927A JP2005380168A JP2005380168A JP2007178927A JP 2007178927 A JP2007178927 A JP 2007178927A JP 2005380168 A JP2005380168 A JP 2005380168A JP 2005380168 A JP2005380168 A JP 2005380168A JP 2007178927 A JP2007178927 A JP 2007178927A
Authority
JP
Japan
Prior art keywords
program
recognition
information
viewing history
viewing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005380168A
Other languages
English (en)
Other versions
JP2007178927A5 (ja
Inventor
Hiroki Yamamoto
寛樹 山本
Michio Aizawa
道雄 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005380168A priority Critical patent/JP2007178927A/ja
Priority to US11/615,160 priority patent/US20070150273A1/en
Publication of JP2007178927A publication Critical patent/JP2007178927A/ja
Publication of JP2007178927A5 publication Critical patent/JP2007178927A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】 音声認識を用いた番組等の情報検索における音声認識精度を向上させること。
【解決手段】 視聴履歴記憶部103は、利用者が過去に視聴した番組の視聴頻度の情報を含む視聴履歴を記憶している。キーワード抽出部102は、視聴頻度に関する基準を上回る番組を番組情報データから抽出する。認識辞書作成部106は、抽出された番組の関連語を認識辞書に登録する。その後、音声認識部108は、入力した音声に対し、関連語が登録された認識辞書を用いて音声認識を行う。
【選択図】 図1B

Description

本発明は、音声認識を利用して番組等の情報を検索する情報検索装置および方法に関する。
電子番組ガイド(Electronic Program Guide : EPG)を用いた番組検索を行う情報検索装置は、例えば特許文献1〜3に開示されている。
特許文献1、2に開示されている情報検索装置は、EPGを用いて番組検索を行う際に、入力されたキーワードの同義語あるいは関連語を含む番組を検索できるように構成されている。
特許文献3に開示されている情報検索装置では、利用者の視聴履歴や過去の音声認識の利用履歴に基づいて、認識辞書に登録する単語や単語に付与する重みを決定し、利用者がよく見る番組や過去に見た番組が認識されやすくなるよう工夫している。
また、認識対象語の同義語や別の読みを認識辞書に登録することにより、利用者が認識語彙をあいまいに記憶している場合でも所望の結果を得られるように工夫された音声認識装置が特許文献4、5に開示されている。
特開2004−32349号公報 特開2005−27043号公報 特開2004−295102号公報 特開平10−274996号公報 特開平3−147010号公報
特許文献1、2に開示されている情報検索装置に音声認識を適用する場合、番組に関連したキーワードが発声される。また、音声認識を用いて番組を検索する際に、例えば「日本テレビ」を「日テレ」、7時から放送される「ニュース7」を「7時のニュース」と呼ぶように、利用者自身が番組検索の際のキーワードを省略したり別称で発声することがある。
特許文献4、5に開示されている音声認識装置では、各認識対象語について入力が予想される別称や同義語をあらかじめ認識辞書に登録しておくことで、利用者が認識辞書に登録されている語を特に意識することなく所望の音声認識結果が得られるようにしている。同様に、EPGで配信された番組情報に基づき、番組検索に必要な番組名、放送局、出演者の略称や別称、番組に関連したキーワード(以下、別称や略称、番組に関連したキーワードをまとめて「関連語」という。)をあらかじめ認識辞書に追加しておけば、番組検索の際の利用者の利便性は向上する。
しかしながら、多チャンネル化によりEPGで配信される番組数が多くなると、認識辞書に追加すべき関連語が膨大になり、認識率が低下するという課題がある。
さらに従来例の別の課題として視聴履歴の記録方法がある。
利用者の中には、生活習慣により特定の時間帯しかテレビ番組を見ない利用者や、特定の番組ではなく、特定の放送局が特定の時間帯に放送する番組を好んで視聴する利用者もいると考えられる。例えば、平日会社勤めをしている人の多くは、帰宅後にテレビを見ることが多いだろうし、例えば、地上波NHKの朝8時15分からの「連続テレビ小説」を毎日かかさず見ている人もいる。同様に、地上波NHKの日曜の8時からの「大河ドラマ」、フジテレビ(CX)系列の月曜9時の「月9」はドラマを放送する時間帯として広く知られている。これらの放送枠の番組は一定期間ごとに放送内容が変わり番組名が変更されながらも、一定の視聴率を記録していることから、この放送枠の番組を好んで視聴している利用者がいると推測できる。
ところで、特許文献1に開示された情報検索装置では、利用者の視聴履歴を番組名ごとに記録している。しかし、このような視聴履歴の記録方法を用いる場合、番組改変により番組名が変った場合は、同じ放送枠の番組であっても視聴履歴を0から数えなおさなくてはならない。また、EPGでは配信される番組名が省略される場合があり、同じ番組であっても途中で放送履歴が0になるという課題もある。したがって、特許文献1に開示されている視聴履歴の記録方法は、特に番組にこだわらずに特定の時間帯の番組を習慣的に観る利用者や、同じ放送枠を好んで視聴するような利用者の視聴履歴の記録方法としては適当ではない。また、配信される番組名が途中から省略されるような場合にも適当ではない。
本発明は、上記した課題の少なくともいずれかが解決された情報検索装置および方法を提供することを目的とする。
本発明の一側面は、音声認識を用いて番組の検索を行う情報検索装置に係り、前記音声認識の認識対象語が記述された認識辞書を記憶する認識辞書記憶手段と、番組情報データを記憶する番組情報記憶手段と、利用者が過去に視聴した番組の視聴頻度の情報を含む視聴履歴を記憶する視聴履歴記憶手段と、前記視聴頻度に関する基準を上回る番組を前記番組情報データから抽出する抽出手段と、前記抽出手段により抽出された番組の関連語を前記認識辞書に登録する登録手段と、入力した音声に対し、前記登録手段により前記関連語が登録された前記認識辞書を用いて音声認識を行う音声認識手段と、前記音声認識手段による音声認識の結果を前記番組情報データから検索する検索手段とを有することを特徴とする。
本発明によれば、音声認識を用いた番組等の情報検索における音声認識精度を向上させることができ、これにより利用者の利便性を向上させることができる。
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、本発明は以下の実施形態に限定されるものではなく、本発明の実施に有利な具体例を示すにすぎない。また、以下の実施形態の中で説明されている特徴の組み合わせの全てが本発明の課題解決手段として必須のものであるとは限らない。
(実施形態1)
図1Aは、本実施形態における情報処理装置の一例である番組検索装置のハードウェア構成例を示すブロック図である。
この番組検索装置は、装置全体の制御をつかさどるCPU1、ブートプログラムや固定的なデータを記憶しているROM2、主記憶装置として機能するとともにCPU1のワークエリアを提供するRAM3をはじめ、以下の構成を備える。
HDD4はハードディスク装置である。ここには、図示するように、OS41をはじめ、後述する番組検索プログラム42、認識辞書43、関連語辞書44、EPGなどの番組情報データ45、視聴履歴46、頻度−重みテーブル47が格納される。また、VRAM5は表示しようとするイメージデータを展開するメモリであり、ここにイメージデータ等を展開することでCRT6に表示させることができる。7は各種設定を行うための操作パネルである。8は音声を入力するマイクロホン、9はインターネット等のネットワークに接続するためのインタフェース(I/F)である。
なお、この番組検索装置は、テレビジョン受像機やビデオ録画装置等に組み込まれていてもよい。
図1Bは、上記した番組検索装置の機能構成を示すブロック図である。
番組情報記憶部101は、制御部109で受信したEPGなどの番組情報データ45を記憶する。これは図1Aに示したようにHDD4で実現される。番組情報データ45のデータ構造例を図2に示す。図示のように、番組情報データ45は、番組ごとに、「放送局」、「放送日時」、「番組名」、「ジャンル」、「出演者」の属性データを含む構成である。
キーワード抽出部102は、番組情報記憶部101に記憶された番組情報データ45から、音声認識を用いて番組を検索する際に必要なキーワードを抽出する。本実施形態では、抽出するキーワードの種類を「放送局」、「番組名」、「出演者」とするが、これに限るものではない。また、抽出するキーワードの種類を制御部109を介して利用者が選択できるように構成してもよい。
視聴履歴記憶部103は、利用者が過去に視聴した番組の情報を視聴履歴46として記憶する。これは図1Aに示したようにHDD4で実現される。なお、本明細書において、たとえば本番組検索装置がテレビジョン受像機の一部として実現されている場合は、ある番組がテレビ画面上に表示された場合をもってその番組が「視聴」されたものとする。一方、本番組検索装置がビデオ録画装置の一部として実現されている場合は、ある番組が録画された場合をもってその番組が「視聴」されたたものとしてもよいし、あるいは、録画した映像を再生した時点でその番組が「視聴」されたものとしてもよい。
視聴履歴46のデータ構造例を図3に示す。図示のように、視聴履歴46は、番組ごとに、「番組名」、その番組が最後に視聴された日時を示す「視聴日時」、および「頻度」のデータを含む構成である。利用者がある番組を視聴すると、その番組の「視聴日時」は、その視聴を開始した時刻に更新されるとともに、「頻度」が1増加する。なお、「視聴日時」を更新する際には、当該番組の更新前の視聴日時が当該番組の放送開始時刻以降の場合は視聴日時の更新のみ行い、頻度は更新しないようにする。このようにすることで、例えばサッカー番組を視聴中に、一時的にニュースを見て、またもとのサッカー番組の視聴に戻る場合などに、サッカー番組の視聴頻度を二重に数えなくて済む。また、視聴履歴の記録に際して、例えばある番組が一定時間以上視聴されたら「視聴」とみなす、あるいは番組の全放送時間の一定割合以上視聴されたら「視聴」とみなす、などの制限を設けるのが好ましい。また、視聴日時から一定期間経過した番組は視聴履歴46から削除するようにしてもよい。
関連語辞書記憶部104は、単語ごとに、その類義語、略称、別称などの関連した単語を関連語辞書44として記憶する。これは図1Aに示したようにHDD4で実現される。関連語辞書44のデータ構造例を図4に示す。図示のように、関連語辞書44には、番組名や放送局、出演者の名称に対する省略形や言い換えが記憶されている。関連語辞書44は、あらかじめ作成されたものでも良いし、外部から提供される関連語辞書を制御部109で受信して、更新できるようにしてもよい。また、利用者が制御部109を介して関連語の追加や削除など自由に編集できるようにしてもよい。また、関連語辞書44にはこの他に、一般に使用されている類義語、同義語、シソーラスなどのデータを含めても良い。
関連語抽出部105は、視聴履歴が一定の基準を満たす番組を番組情報データ45から取得し、関連語辞書44を参照することで、取得した番組の関連語を抽出する。たとえば、視聴履歴について頻度が10以上であることを基準と仮定する。図3に示した視聴履歴46を例にとると、基準を満たす番組、すなわち、頻度が10以上の番組は、「ワールド・ビジネス・ジャパン」と「ズームアウト・スーパー」である。そして、これら2つの番組の「放送局」「放送時間」「番組名」「出演者」「ジャンル」などのキーワードの関連語を、関連語辞書44を参照して抽出する。たとえば、図4に示した関連語辞書44を参照して「番組名」の関連語を抽出する場合、「ズーム・アウト・スーパー」に対して「ズーム・アウト」、「ワールド・ビジネス・ジャパン」に対して「WBJ」が抽出される。ここでは「番組名」の関連語のみを抽出したが、複数種類のキーワードについて関連語を抽出できることはいうまでもない。また、関連語を抽出するキーワードの種類を制御部109を介して、利用者が選択できるようにしてもよい。
認識辞書作成部106は、抽出されたキーワードおよび関連語にそれぞれ、音声認識に必要な読みなどの情報および視聴履歴に基づいて決定した重みを加えて、それぞれ図5、図6に示すような認識辞書43を作成する。図5は単語抽出部102で抽出したキーワードから作成した認識辞書、図6は関連語抽出部105で抽出した単語から作成した認識辞書の例である。ここでは関連語の認識辞書に記録する関連語の表記は、番組情報に記載されている表記を記録しているが、関連語の表記をそのまま用いてもよい。また、キーワードと関連語で個別に認識辞書を作成しているが、両方をまとめて一つの認識辞書を作成してもよい。また、単語の種類ごとに個別の認識辞書を作成するようにしてもよい。
また、単語の重みは、後述する音声認識部108で認識結果を求める際に、視聴履歴の頻度が多い番組が認識されやすくなるように決定する。例えば、音声認識部108で計算する各単語の認識スコアに乗算する乗算係数として定めても良いし、また各単語の認識スコアに加算する加算係数として定めても良い。本実施形態では、乗算係数を重みとして用い、ここでは、視聴履歴46と、図7に示すような視聴履歴の頻度ごとに重みの値が記述された頻度−重みテーブル47とを参照して重みを決定している。例えば、図3の視聴履歴46の例において、頻度が6である「ラフ・ジェネレーション」については、図7の頻度−重みテーブル47を参照することで、図5に示した認識辞書43では、重み1.1が付与されている。同様に、図3の視聴履歴46の例において、頻度が34である「ズームアウト・スーパー」については、図7の頻度−重みテーブルを参照することで、図5に示した認識辞書43では、重み1.3が付与されている。くわえて、その関連語である「ズームアウト」についても、重み1.3が付与されている。以上の説明では、番組名の単語にのみ重みを付与しているが、これに限るものではなく、「放送局」「ジャンル」などに重みを付与するようにしてもよい。
認識辞書記憶部107は認識辞書作成部106で作成された認識辞書43を記憶する。これも図1Aに示すようにHDD4で実現されるものである。
音声認識部108は、認識辞書記憶部107に記憶されている認識辞書43を参照し、認識辞書に付与された各単語の重みを加味して利用者の発話から特定の単語を認識する。
制御部109は、音声認識部108で認識された単語により番組情報記憶部101に記憶されている番組情報データを検索し、該当する番組に関する情報を出力する。また、制御部109は、外部から配信される番組情報データを受信する。また、制御部109は、利用者がキーワード抽出部102で抽出するキーワードや関連語抽出部105で抽出する関連語の種類を選択できるように構成する場合はその選択処理も行う。制御部109はさらに、番組が視聴されたときに、視聴履歴記憶部103に記憶された視聴履歴46の更新も行う。上記したように、この際、最後の視聴日時から一定期間経過した視聴履歴を削除するようにしてもよい。また、外部から関連語辞書が提供される場合、制御部109はこれを受信する。さらに、利用者が関連語辞書を編集できるように構成する場合は、関連語辞書の編集の処理を行う。
本実施形態における番組検索装置の構成は概ね上記のとおりである。次に、この番組検索装置の動作について説明する。
まず、番組情報データから認識辞書を作成する処理を説明する。図8は本番組検索装置における認識辞書作成処理を示すフローチャートである。このフローチャートに対応するプログラムはたとえば番組検索プログラム42に含まれ、実際にはRAM3にロードされてCPU1によって実行される。なおこの認識辞書作成処理は、ユーザが指定したタイミングで開始してもよいし、毎日深夜2時、毎週日曜日などあらかじめ定めたタイミングで開始するようにしてもよい。
まず、制御部109は、テレビジョン信号あるいはインターネットなどを介して配信されるEPGなどの番組情報データを受信し(ステップS101)、それを番組情報記憶部101に記憶する(ステップS102)。次に、キーワード抽出部102は、番組情報記憶部101に記憶された番組情報データ45から、音声認識を用いて番組を検索する際に必要なキーワードを抽出する(ステップS103)。上述したとおり、本実施形態では、抽出するキーワードの種類を「放送局」、「番組名」、「出演者」としている。
関連語抽出部105は、視聴履歴が一定の基準を満たす番組を番組情報データ45から取得し、関連語辞書44を参照することで、取得した番組の関連語を抽出する(ステップS104)。
認識辞書作成部106は、キーワード抽出部102および関連語抽出部105が抽出した単語に、音声認識する際の読みの情報を付与して認識辞書43を作成し(ステップS105)、認識辞書記憶部107に記憶する(ステップS106)。
次に、本実施形態における番組検索処理を説明する。
図9は本実施形態における番組検索処理を示すフローチャートである。このフローチャートに対応するプログラムは番組検索プログラム42に含まれ、実際にはRAM3にロードされてCPU1によって実行されるものである。
この処理は、利用者が操作パネル7より番組検索の指示を与えると開始される。この指示の後、利用者はキーワードを発声し、この発声がマイクロホン8より入力される(ステップS201)。音声認識部108は、認識辞書記憶部107に記憶された認識辞書43を用いて音声認識を行う(ステップS202)。続いて、制御部109は、番組情報記憶部101に記憶されている番組情報データ45から、ステップS202で得られた認識結果に該当する番組を検索し(ステップS203)、その検索結果を出力する(ステップS204)。ステップS204では具体的には、該当する番組が番組情報データ45内にある場合は、制御部109は該当する番組の情報をCRT6に表示する。一方、該当する番組が番組情報データ45内にない場合は、例えば、その旨をCRT6に表示するなどして利用者に通知する。
図5、図6に示した認識辞書43が作成されている場合を例にとって説明する。この場合は、「ズームアウト・スーパー」および「ワールド・ビジネス・ジャパン」という番組を視聴する頻度が多い利用者が番組検索を行う場合である。これらの視聴頻度の多い番組に関しては、番組情報データ45に記憶されている番組名に加え、「ズームアウト」あるいは「WBJ」という略称による番組検索が可能になる。この例では、利用者が番組検索の際に略称を用いる場合で説明しているが、この逆、すなわち番組情報が略称や通称で記述された番組情報データを正式な名称で検索する場合にも有効である。関連語抽出部106で関連語辞書44を参照して関連語を抽出する際に、略称や通称から正式な名称を抽出し、認識辞書43に加えることができる。
以上の構成によれば、番組情報データ45、視聴履歴46、関連語辞書44に基づいて、利用者の視聴頻度が高い番組に関するキーワードの関連語が認識辞書43に登録される。逆にいえば、その利用者の視聴履歴が低い番組に関するキーワードの関連語は認識辞書43には登録されない。こうして、その利用者のための音声認識に有用な単語が認識辞書43に登録される一方、無駄な単語の登録が低減される。これにより、認識辞書43に登録される単語数の増加を抑えつつ、視聴頻度が多い番組については、検索できる語の種類が増える。また、視聴頻度に基づき、認識辞書43に登録された単語の重みを決定することにより、視聴頻度が多い番組に関わる単語が認識されやすくなる。以上のような効果が得られる番組検索装置によって、利用者にとって使いやすい音声インタフェースが実現できる。
(実施形態2)
実施形態2では、上述の実施形態1とは異なる視聴履歴の記憶方法を用いて番組検索を実現する例を説明する。
上述の実施形態1のように番組名ごとに視聴履歴を記憶する方法では、映画番組のように毎回番組名が変わるような番組を定期的に視聴するような利用者の視聴傾向を視聴履歴に反映させることが難しい。例えば、ある利用者が毎週金曜21時からの映画を欠かさず観るとする。しかし番組情報データで配信される番組名は映画タイトルに応じて毎週変わる場合は、視聴履歴の頻度が増えず、したがって当該番組の関連語はいつまでたっても認識辞書に登録されないということが起こりうる。また、EPGなどの番組情報データを供給する側の都合で、同じ番組でも、ある時点から番組名が略語で配信されるような場合にも同様の問題が起こりうる。本実施形態では、このような問題を解決するため、時間帯や放送枠ごとに視聴履歴を記憶する方法について説明する。
本実施形態の番組検索装置は、上述の実施形態1で説明した番組検索装置と同様の構成で実現できる。したがって、各モジュールが行う処理についても実施形態1と相違する部分のみ説明し、その他の部分については説明を省略する。
まず、時間帯ごとに記憶する例を説明する。図10は、本実施形態における視聴履歴46のデータ構造例を示している。時間帯ごとに視聴履歴を記録する場合は、例えば図10に示すように、視聴履歴46は、「時間帯」、その時間帯の番組を最後に視聴した日時を示す「視聴日時」、および「頻度」のデータを含む構成である。例えば、利用者が8時15分からテレビを視聴した場合は、時間帯「08:00−09:00」の視聴日時を更新し、この時間帯の頻度を1つ増やす。同様に、19時10分から野球中継を見始め、野球中継終了後、ドラマやニュースを22時40分まで見た場合は、当該時間帯すなわち「19:00−20:00」から「22:00−23:00」までの時間帯の視聴履歴を更新する。
視聴履歴を記録する際に、実施形態1と同様に、3分以上など一定時間以上視聴した場合のみ視聴履歴を記録するような制限を設け、選曲のためにチャンネルを替えるような場合まで視聴履歴に反映されることがないようにするのが好ましい。
また、視聴履歴を更新する際に、当該時間帯の更新前の「視聴日時」が、更新する際の「視聴日時」と同日の場合、「視聴日時」のみ更新し、「頻度」は更新しない。
次に、上記で説明した時間帯ごとに記憶した視聴履歴を参照する場合の関連語抽出部105における関連語の抽出方法について説明する。
関連語抽出部105は、視聴履歴記憶部103に記憶されている視聴履歴46を参照し、番組情報記憶部101に記憶されている番組情報データ45から視聴履歴が一定基準を満たす時間帯の番組について、その番組情報の関連語を抽出する。例えば、図2に示した番組情報データ45、図4に示した関連語辞書44、図10に示した視聴履歴46に対して、「頻度30以上」を基準に関連語を抽出する場合を考える。この場合、該当する時間帯は「08:00−09:00」、「21:00−22:00」「22:00−23:00」である。図2の番組情報データ45中でこの時間帯に放送される番組は、「ガンバ」「ラフ・ジェネレーション」「ひとりでブルジョワ・MaxHeat」である。関連語抽出部105はこれらの番組について、それぞれの番組情報の関連語を関連語辞書44を参照して抽出する。例えば、上述の例で「番組名」の関連語だけを抽出する場合、「ラフ・ジェネ」、「ブルジョワ」が抽出される。
また、複数の時間帯にまたがって放送される番組、例えば21時から22時50分まで放送される番組については、「21:00−22:00」または「22:00−23:00」の視聴履歴の頻度が上記基準を満たした場合に関連語を抽出するのが好ましい。
上記説明では、番組の時間帯ごとに視聴履歴を記憶する場合について説明したが、これに限るものではない。例えば図11に示すように、曜日と時間帯で構成される「放送枠」ごとに視聴履歴を記憶するようにしてもよい。さらに、放送枠を形成する要素としては、「曜日」「時間帯」以外にも「放送局」や「ジャンル」などを組み合わせる方法が考えられる。例えば、曜日とジャンルを組み合わせると、「月曜のドラマ」、「月曜から金曜のニュース」、「土曜日の映画の」ような分類ごとの視聴履歴が記憶できる。
以上説明したように時間帯あるいは放送枠ごとに視聴履歴を記憶することにより、利用者の視聴履歴を適切に記憶することができるようになる。その結果、視聴履歴に基づいて行う処理をより適切に行えるようになり、利用者の利便性が向上する。
(実施形態3)
上記実施形態では、番組を検索する番組検索装置を例にあげて説明したが、本発明はこれに限られない。本発明は、例えば書籍を検索する書籍検索装置にも適用可能である。この場合、上記実施形態の視聴履歴に相当するのは、例えば書籍の売上であり、書籍のジャンルを考慮すれば、上記実施形態の放送枠と同様の実施を行うことが可能である。具体的に、ジャンルを考慮することは、書籍ごとの売上ではなく、書籍の各ジャンルの売上を考慮することに相当する。この場合、売上が多いジャンルに属する書籍のタイトルの関連語が音声認識辞書に登録されることになる。また、本発明は、例えば楽曲を検索する楽曲検索装置にも適用可能である。この場合、楽曲の売上、リクエスト回数などが上記実施形態の視聴履歴に相当し、楽曲のジャンルを考慮すれば、上記と同様の実施を行うことが可能である。
(他の実施形態)
以上、本発明の実施形態を詳述したが、本発明は、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の各機能を実現するプログラムを、システムまたは装置に直接または遠隔から供給し、そのシステムまたは装置に含まれるコンピュータがその供給されたプログラムコードを読み出して実行することによっても達成される。
従って、本発明の機能・処理をコンピュータで実現するために、そのコンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、上記機能・処理を実現するためのコンピュータプログラム自体も本発明の一つである。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、記録媒体としては、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
また、プログラムは、クライアントコンピュータのブラウザを用いてインターネットのホームページからダウンロードしてもよい。すなわち、ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードしてもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードする形態も考えられる。つまり、本発明の機能・処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明の構成要件となる場合がある。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布してもよい。この場合、所定条件をクリアしたユーザにのみ、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報で暗号化されたプログラムを復号して実行し、プログラムをコンピュータにインストールしてもよい。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現されてもよい。なお、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ってもよい。もちろん、この場合も、前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ってもよい。このようにして、前述した実施形態の機能が実現されることもある。
実施形態における番組検索装置のハードウェア構成を示すブロック図である。 実施形態における番組検索装置の機能構成を示すブロック図である。 実施形態における番組情報データのデータ構造例を示す図である。 実施形態における視聴履歴のデータ構造例を示す図である。 実施形態における関連語辞書のデータ構造例を示す図である。 実施形態におけるキーワードの認識辞書のデータ構造例を示す図である。 実施形態における関連語の認識辞書のデータ構造例を示す図である。 実施形態における頻度−重みテーブルのデータ構造例を示す図である。 実施形態における認識辞書作成処理を示すフローチャートである。 実施形態における番組検索処理を示すフローチャートである。 視聴履歴のデータ構造の変形例を示す図である。 視聴履歴のデータ構造の更に別の変形例を示す図である。

Claims (9)

  1. 音声認識を用いて番組の検索を行う情報検索装置であって、
    前記音声認識の認識対象語が記述された認識辞書を記憶する認識辞書記憶手段と、
    番組情報データを記憶する番組情報記憶手段と、
    利用者が過去に視聴した番組の視聴頻度の情報を含む視聴履歴を記憶する視聴履歴記憶手段と、
    前記視聴頻度に関する基準を上回る番組を前記番組情報データから抽出する抽出手段と、
    前記抽出手段により抽出された番組の関連語を前記認識辞書に登録する登録手段と、
    入力された音声に対し、前記登録手段により前記関連語が登録された前記認識辞書を用いて音声認識を行う音声認識手段と、
    前記音声認識手段による音声認識の結果を前記番組情報データから検索する検索手段と、
    を有することを特徴とする情報検索装置。
  2. 前記視聴履歴は、利用者が過去に視聴した番組ごとの視聴頻度の情報を含むことを特徴とする請求項1に記載の情報検索装置。
  3. 前記視聴履歴は、放送枠ごとの視聴頻度の情報を含むことを特徴とする請求項1に記載の情報検索装置。
  4. 前記放送枠は、番組を放送する時間帯、番組を放送する曜日、番組を放送する放送局、番組のジャンルの、いずれかまたはこれらの組合せであることを特徴とする請求項3に記載の情報検索装置。
  5. 前記認識辞書には、視聴頻度に応じた重み付け係数が認識対象語ごとに記述され、
    前記音声認識手段は、各認識対象語の認識スコアを、対応する前記重み付け係数で重み付けする手段を含むことを特徴とする請求項1から4までのいずれかに記載の情報検索装置。
  6. 前記関連語は、略語、通称、同義語、類義語、類似語、同表記異音語、訳語のうちの少なくともいずれかを含むことを特徴とする請求項1から5までのいずれかに記載の情報検索装置。
  7. 前記番組情報データは、電子番組ガイドデータであることを特徴とする請求項1から6までのいずれかに記載の情報検索装置。
  8. 音声認識の認識対象語が記述された認識辞書を記憶する認識辞書記憶手段と、
    番組情報データを記憶する番組情報記憶手段と、
    利用者が過去に視聴した番組の視聴頻度の情報を含む視聴履歴を記憶する視聴履歴記憶手段と、
    を有する情報検索装置によって実行される情報検索方法であって、
    前記視聴頻度に関する基準を上回る番組を前記番組情報データから抽出する抽出ステップと、
    前記抽出ステップにより抽出された番組の関連語を前記認識辞書に登録する登録ステップと、
    入力された音声に対し、前記登録ステップにより前記関連語が登録された前記認識辞書を用いて音声認識を行う音声認識ステップと、
    前記音声認識ステップによる音声認識の結果を前記番組情報データから検索する検索ステップと、
    を有することを特徴とする情報検索方法。
  9. 請求項8に記載の情報検索方法を、コンピュータに実行させるためのプログラム。
JP2005380168A 2005-12-28 2005-12-28 情報検索装置および方法 Pending JP2007178927A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005380168A JP2007178927A (ja) 2005-12-28 2005-12-28 情報検索装置および方法
US11/615,160 US20070150273A1 (en) 2005-12-28 2006-12-22 Information retrieval apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005380168A JP2007178927A (ja) 2005-12-28 2005-12-28 情報検索装置および方法

Publications (2)

Publication Number Publication Date
JP2007178927A true JP2007178927A (ja) 2007-07-12
JP2007178927A5 JP2007178927A5 (ja) 2008-12-11

Family

ID=38195030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005380168A Pending JP2007178927A (ja) 2005-12-28 2005-12-28 情報検索装置および方法

Country Status (2)

Country Link
US (1) US20070150273A1 (ja)
JP (1) JP2007178927A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009025411A (ja) * 2007-07-17 2009-02-05 Yamaha Corp 音声認識装置およびプログラム
JP2010067153A (ja) * 2008-09-12 2010-03-25 Casio Comput Co Ltd 路線検索装置および路線検索プログラム
JP2013068783A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 音声認識装置、音声認識方法およびプログラム
JP2016102899A (ja) * 2014-11-28 2016-06-02 日本電信電話株式会社 音声認識装置、音声認識方法および音声認識プログラム
JP2017072725A (ja) * 2015-10-07 2017-04-13 Necソリューションイノベータ株式会社 生成装置、生成方法、生成プログラム、および認識システム
JP2020098949A (ja) * 2018-12-17 2020-06-25 アルパイン株式会社 放送受信器の音声入力システム
JP2020155976A (ja) * 2019-03-20 2020-09-24 東芝映像ソリューション株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7241142B1 (ja) 2021-09-27 2023-03-16 Tvs Regza株式会社 受信装置および選局システム
WO2023149644A1 (ko) * 2022-02-03 2023-08-10 삼성전자주식회사 전자 장치 및 사용자 언어 모델 생성 방법

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9167206B2 (en) 2008-08-29 2015-10-20 Centurylink Intellectual Property Llc Method and system for communication with a set-top box
US9300993B2 (en) 2008-08-29 2016-03-29 Centurylink Intellectual Property Llc Method and system for providing a content notification for a set-top box
US9215419B2 (en) 2008-12-31 2015-12-15 Centurylink Intellectual Property Llc System and method for set-top box recording
US8467275B2 (en) 2009-05-29 2013-06-18 Centurylink Intellectual Property Llc System and method for sharing user content through a set-top box
US8253558B2 (en) 2009-06-11 2012-08-28 Embarq Holdings Company, Llc System and method for emergency communication of a location through a set-top box
US20110231189A1 (en) * 2010-03-19 2011-09-22 Nuance Communications, Inc. Methods and apparatus for extracting alternate media titles to facilitate speech recognition
US8484024B2 (en) * 2011-02-24 2013-07-09 Nuance Communications, Inc. Phonetic features for speech recognition
JP5768492B2 (ja) * 2011-05-18 2015-08-26 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
KR20130080530A (ko) * 2012-01-05 2013-07-15 한국전자통신연구원 연관 검색어를 이용한 프로그램 검색 장치 및 방법
FR2996399B3 (fr) * 2012-09-28 2015-05-15 Samsung Electronics Co Ltd Appareil de traitement d'image et procede de commande de celui-ci et systeme de traitement d'image
US9955204B2 (en) 2013-03-06 2018-04-24 Centurylink Intellectual Property Llc System and method for distributing content through a set-top box
US9955227B2 (en) 2013-03-13 2018-04-24 Centurylink Intellectual Property Llc System and method for communicating alerts through a set-top box
US9635404B2 (en) * 2013-04-24 2017-04-25 The Nielsen Company (Us), Llc Methods and apparatus to correlate census measurement data with panel data
US9706263B2 (en) * 2015-04-03 2017-07-11 At&T Intellectual Property I, L.P. System and method for providing location-dependent emergency alert services
GB2548152A (en) * 2016-03-11 2017-09-13 Sony Corp Apparatus, method and computer program
AU2017280105A1 (en) * 2016-06-24 2019-02-21 Sourse Pty Ltd Selectively playing videos
US10418026B2 (en) 2016-07-15 2019-09-17 Comcast Cable Communications, Llc Dynamic language and command recognition
WO2018016295A1 (ja) * 2016-07-20 2018-01-25 ソニー株式会社 受信装置、およびデータ処理方法
US10715874B2 (en) * 2018-07-25 2020-07-14 Rovi Guides, Inc. Systems and methods for displaying notifications of anticipated dynamic events on a media progress indicator
JP7009338B2 (ja) * 2018-09-20 2022-01-25 Tvs Regza株式会社 情報処理装置、情報処理システム、および映像装置
US11024310B2 (en) * 2018-12-31 2021-06-01 Sling Media Pvt. Ltd. Voice control for media content search and selection
US11272247B2 (en) * 2020-06-24 2022-03-08 Dish Wireless L.L.C. Multi-mode conversion of multiple video streams

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041081A (ja) * 2000-07-28 2002-02-08 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP2004326198A (ja) * 2003-04-21 2004-11-18 Matsushita Electric Ind Co Ltd 嗜好情報利用型データ検索装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3500741B2 (ja) * 1994-03-01 2004-02-23 ソニー株式会社 テレビ放送の選局方法及び選局装置
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US5774841A (en) * 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5809471A (en) * 1996-03-07 1998-09-15 Ibm Corporation Retrieval of additional information not found in interactive TV or telephony signal by application using dynamically extracted vocabulary
JPH10243352A (ja) * 1997-02-27 1998-09-11 Hitachi Ltd 映像情報記録再生装置
JP3979556B2 (ja) * 1998-12-22 2007-09-19 パイオニア株式会社 番組選択装置及び番組選択方法
US6314398B1 (en) * 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体
GB0023930D0 (en) * 2000-09-29 2000-11-15 Canon Kk Database annotation and retrieval
JP2003078493A (ja) * 2001-09-05 2003-03-14 Fujitsu Ten Ltd 放送端末装置及び情報提供システム
US7519534B2 (en) * 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium
US7698138B2 (en) * 2003-01-15 2010-04-13 Panasonic Corporation Broadcast receiving method, broadcast receiving system, recording medium, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041081A (ja) * 2000-07-28 2002-02-08 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP2004326198A (ja) * 2003-04-21 2004-11-18 Matsushita Electric Ind Co Ltd 嗜好情報利用型データ検索装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009025411A (ja) * 2007-07-17 2009-02-05 Yamaha Corp 音声認識装置およびプログラム
JP2010067153A (ja) * 2008-09-12 2010-03-25 Casio Comput Co Ltd 路線検索装置および路線検索プログラム
JP2013068783A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 音声認識装置、音声認識方法およびプログラム
US8983847B2 (en) 2011-09-22 2015-03-17 Kabushiki Kaisha Toshiba Voice recognition apparatus, method, and computer program product
JP2016102899A (ja) * 2014-11-28 2016-06-02 日本電信電話株式会社 音声認識装置、音声認識方法および音声認識プログラム
JP2017072725A (ja) * 2015-10-07 2017-04-13 Necソリューションイノベータ株式会社 生成装置、生成方法、生成プログラム、および認識システム
JP2020098949A (ja) * 2018-12-17 2020-06-25 アルパイン株式会社 放送受信器の音声入力システム
JP7091234B2 (ja) 2018-12-17 2022-06-27 アルパイン株式会社 放送受信器の音声入力システム
JP2020155976A (ja) * 2019-03-20 2020-09-24 東芝映像ソリューション株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7202938B2 (ja) 2019-03-20 2023-01-12 Tvs Regza株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7241142B1 (ja) 2021-09-27 2023-03-16 Tvs Regza株式会社 受信装置および選局システム
JP2023047760A (ja) * 2021-09-27 2023-04-06 Tvs Regza株式会社 受信装置および選局システム
WO2023149644A1 (ko) * 2022-02-03 2023-08-10 삼성전자주식회사 전자 장치 및 사용자 언어 모델 생성 방법

Also Published As

Publication number Publication date
US20070150273A1 (en) 2007-06-28

Similar Documents

Publication Publication Date Title
JP2007178927A (ja) 情報検索装置および方法
JP4650552B2 (ja) 電子機器、コンテンツ推薦方法及びプログラム
KR100718606B1 (ko) 프로그램의 추출방법 및 프로그램의 추출장치
US7756916B2 (en) Display method
JP2007300497A (ja) 番組検索装置、及び番組検索装置の制御方法
JP2000013708A (ja) 番組選択支援装置
US20120066235A1 (en) Content processing device
US20100083314A1 (en) Information processing apparatus, information acquisition method, recording medium recording information acquisition program, and information retrieval system
JP2010124319A (ja) イベントカレンダー表示装置、イベントカレンダー表示方法、イベントカレンダー表示プログラム及びイベント情報抽出装置
JP4601306B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP2006129122A (ja) 放送受信装置、放送受信方法、放送受信プログラム及びプログラム記録媒体
JP2004295102A5 (ja)
JP2004086754A (ja) 嗜好情報抽出システム
JP2010130051A (ja) 個人向けコンテンツ配信システム
CN101605011B (zh) 信息处理装置、信息处理方法
JP2007028463A (ja) 受信装置および番組情報提示方法
JP2012084966A (ja) 動画情報視聴装置及び動画情報視聴方法
JP5645690B2 (ja) 情報処理装置及び情報処理方法
JP6759278B2 (ja) 映像表示装置及びその視聴支援方法並びにプログラム
JP2008306300A (ja) 情報処理装置、情報処理方法、およびプログラム
RU2605002C2 (ru) Устройство и способ управления персональным каналом
JP2012203773A (ja) 動画推薦装置及び動画推薦方法
JP7132974B2 (ja) 映像表示装置
JP2006268966A (ja) デジタル放送受信装置
JP2002300614A (ja) 個人データベースの生成方法、及び個人データベースの表示方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081028

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081028

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110225