WO2006049249A1

WO2006049249A1 - ディジタル映像再生装置

Info

Publication number: WO2006049249A1
Application number: PCT/JP2005/020300
Authority: WO
Inventors: Atsushi Iisaka; Atsushi Yamashita; Takuya Hirai
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-11-08
Filing date: 2005-11-04
Publication date: 2006-05-11
Also published as: JP3824168B2; US7953602B2; EP1811776A1; EP1811776B1; CN100536552C; CN101057497A; JP2006134506A; US20080208576A1; EP1811776A4

Abstract

　文字情報認識手段（１０１）は、インデックス画像に含まれている選択用ボタンから文字認識処理によって文字情報を抽出する。インデックス辞書作成手段（１０２）は、文字情報認識手段（１０１）から出力されたテキストデータに基づいて、音声認識手段（１０４）による音声認識処理に利用可能なインデックス辞書を作成する。音声認識手段（１０４）は、ＡＤＣ（７）を通じて取り込まれる音声データ（Ｄ１）と記憶手段（１０７）に記憶されているインデックス辞書を用いて音声認識処理を行う。再生制御手段（１０５）は、音声認識手段（１０４）の音声認識処理結果に基づいてチャプターの再生を制御する。これにより、ＤＶＤビデオのチャプター選択画面に表示されるチャプター選択用ボタンの中から所望のボタンを音声で選択可能となる。

Description

明細書

ディジタル映像再生装置

技術分野

[0001] 本発明はディジタル映像コンテンツを再生するためのディジタル映像再生装置に関する。

背景技術

[0002] 従来、 DVD (Digital Versatile Disc)プレーヤーなどのディジタル映像再生装置では、コンテンツの再生開始時に、インデックス画像としてチャプターの一覧が表示され、装置本体やリモコンに設けられたキーを操作してチャプターの選択を行うことができる。これにより、ユーザは所望のチャプター力もコンテンツを再生することができる。

[0003] ところで、最近の BSディジタルノヽイビジョンテレビには音声認識機能が搭載されているものがあり、放送局名やチャンネル名などを音声によって入力することによってチヤンネルを切り替えることができる。

[0004] また、入力音声に対して音声認識処理を行い、この処理結果に基づいて入力音声に対応する文字列を画面に表示する装置が提案されている (例えば、特許文献 1参照)。

特許文献 1 :特開平 11 41538号公報

発明の開示

発明が解決しょうとする課題

[0005] ところで、 DVDプレーヤーなどの映像再生装置において、チャプターに付けられた名前を発声することによってチャプターを選択できれば便利である。し力しながら、音声によるチャプターの選択を可能とするためには、ユーザの発声した言葉がどのチヤプターを表しているのかを判定するための参照テーブルが予め用意されている必要がある。

[0006] し力しながら、通常は、ディジタル映像コンテンツにはそのような参照テーブルが含まれていないので、仮に映像再生装置に音声認識機能を組み込むことによって、ュ一ザが発声した言葉を音声認識処理によって認識できるようにしたとしても、ユーザが発声した言葉力チャプターを特定することは不可能である。

[0007] それゆえに本発明は、ディジタル映像コンテンツの再生位置を音声によって指定することのできるディジタル映像再生装置を提供することを目的とする。

課題を解決するための手段

[0008] 上記課題を解決するために、本発明は以下の構成を採用した。なお、括弧内の参照符号および図番号は、本発明の理解を助けるために、図面との対応関係を示したものであって、本発明の範囲を何ら限定するものではない。

[0009] 本発明の第 1の局面は、ディジタル映像コンテンツを再生するためのディジタル映像再生装置（1)であって、ディジタル映像コンテンツの信号に基づ、て音声認識処理に利用可能な辞書を作成する辞書作成手段（102)と、前記辞書作成手段によつて作成された辞書を用いて音声認識処理を行う音声認識手段（104)と、前記音声認識手段の音声認識結果に基づいてディジタル映像コンテンツの再生制御を行う再生制御手段（105)とを備える。

[0010] 本発明の第 2の局面は、第 1の局面において、ディジタル映像コンテンツの映像信号に含まれてヽる、当該ディジタル映像コンテンツの再生位置をユーザに選択させるための再生位置選択用画像 (図 2、図 4、図 5)から、文字情報を認識する文字情報認識手段（101)をさらに備え、前記辞書作成手段は、前記文字情報認識手段によつて認識された文字情報を用いて、ユーザに再生位置を音声で選択させるためのィンデッタス辞書を作成することを特徴とする。

[0011] 本発明の第 3の局面は、第 2の局面において、前記再生位置選択用画像を表示装置に表示するときに、当該再生位置選択用画像に基づ、て前記インデックス辞書に登録された文字情報に対応する文字列部分を、前記文字情報認識手段の認識結果に基づいて強調表示するインデックス表示手段（106)をさらに備えることを特徴とする。

[0012] 本発明の第 4の局面は、第 2の局面において、前記文字情報認識手段によって認識された文字情報を、過去に利用したディジタル映像コンテンツのチャプター情報として不揮発的に記憶する不揮発性記憶手段（107)をさらに備えることを特徴とする。 [0013] 本発明の第 5の局面は、第 4の局面において、前記不揮発性記憶手段は、前記文字情報認識手段によって認識された文字情報を、当該文字情報に対応する前記デイジタル映像コンテンツの部分が過去に再生されたかどうかを示す履歴情報とともに記憶することを特徴とする。

[0014] 本発明の第 6の局面は、第 5の局面において、前記不揮発性記憶手段は、前記文字情報認識手段によって認識された文字情報を、前記履歴情報とともに、当該文字情報に対応する前記ディジタル映像コンテンツの部分が再生された日時とともに記憶することを特徴とする。

[0015] 本発明の第 7の局面は、第 2の局面において、前記辞書作成手段は、前記文字情報認識手段によって認識された文字情報の字数が予め定めた閾値を超えていた場合に、当該文字情報の字数を短くしたものを用いて前記インデックス辞書を作成することを特徴とする。

[0016] 本発明の第 8の局面は、第 2の局面において、前記文字情報認識手段によって認識された文字情報が日本語かどうかを判断する言語判断手段（101)と、前記文字情報認識手段によって文字情報が認識されなカゝつた場合もしくは前記文字情報認識手段によって認識された文字情報が英語でな力た場合に、前記再生位置選択用画像に対して予め定めた規則に従って符号を付加する符号付加手段（103)と、前記符号付加手段によって符号の付加された再生位置選択用画像を表示装置 (5)に表示させるインデックス表示手段（106)とをさらに備え、前記辞書作成手段は、前記文字情報認識手段によって認識された英語の文字情報と、前記符号付加手段によって再生位置選択用画像に付加された符号とを用いて、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする。

[0017] 本発明の第 9の局面は、第 1の局面において、ディジタル映像コンテンツの映像信号に含まれてヽる、当該ディジタル映像コンテンツの再生位置をユーザに選択させるための再生位置選択用画像（図 2、図 4、図 5)に対して、予め定めた規則に従って符号を付加する符号付加手段（103)と、前記符号付加手段によって符号の付加された再生位置選択用画像を表示装置（5)に表示させるインデックス表示手段（106)とをさらに備え、前記辞書作成手段は、前記符号付加手段によって再生位置選択用画像に付加された符号を用いて、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする。

[0018] 本発明の第 10の局面は、第 1の局面において、前記辞書作成手段は、ディジタル映像コンテンツの信号に含まれてヽる、当該ディジタル映像コンテンツの再生位置をユーザに選択させるためのテキスト情報を用いて、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする。

発明の効果

[0019] 上記第 1の局面によれば、ディジタル TVのコンテンツのタイトルや DVDビデオのコンテンッのチャプター名などを音声で選択できるようになる。

[0020] 上記第 2の局面によれば、例えば、 DVDビデオなどのチャプター選択画面などでチャプターを音声で選択することが可能となる。

[0021] 上記第 3の局面によれば、例えば、所望のチャプターを選択するためにどの言葉を発声すればよいのかをユーザに分力り易く提示することができる。

[0022] 上記第 4の局面によれば、例えば、ユーザは、メディアをセットせずとも過去に利用したことのある DVD等のメディアのチャプター情報を見られるようになる。

[0023] 上記第 5の局面によれば、例えば、ユーザは、過去に再生したチャプターがどれであるか、再生していないチャプターがどれであるかを確認することができる。

[0024] 上記第 6の局面によれば、例えば、過去の再生日時を手がかりに過去に見たチヤプターを選択することができる。

[0025] 上記第 7の局面によれば、例えば、チャプター名が長い場合に、チャプター名の全てを発声することなくより簡単に選択することが可能となる。

[0026] 上記第 8の局面によれば、例えば、チャプター名が特に付されていないチャプターや、英語以外の言語のチャプター名が付されたチャプターであっても、符号を発声することによって簡単に選択することが可能となる。

[0027] 上記第 9の局面によれば、例えば、 DVDビデオなどのチャプター選択画面などでチャプター選択用のボタンに文字列が含まれていない場合であっても、符号を発声することによってチャプターを選択することが可能となる。

[0028] 上記第 10の局面によれば、例えば、ディジタル TVのコンテンツなどのように、映像中の選択用ボタンに対応するテキスト情報がコンテンツ自体に予め含まれている場合に、このテキスト情報を用いて音声認識用の辞書を簡単に作成することができる。図面の簡単な説明

[0029] [図 1]図 1は、本発明の一実施形態に係るディジタル映像再生装置の構成を示す図である。

[図 2]図 2は、インデックス画像の第 1の例である。

[図 3]図 3は、システムコントローラ 4の機能を示す図である。

[図 4]図 4は、インデックス画像の第 2の例である。

[図 5]図 5は、インデックス画像の第 3の例である。

[図 6]図 6は、インデックス辞書の第 1の例である。

[図 7]図 7は、インデックス辞書の第 2の例である。

[図 8]図 8は、インデックス表示手段 106によってカ卩ェされたインデックス画像の第 1の例である。

[図 9]図 9は、インデックス表示手段 106によってカ卩ェされたインデックス画像の第 2の例である。

[図 10]図 10は、インデックス表示手段 106によってカ卩ェされたインデックス画像の第 3の例である。

[図 11]図 11は、インデックス辞書の第 3の例である。

[図 12]図 12は、インデックス辞書とともに記憶手段 107に記憶される情報の一例である。

符号の説明

[0030] 1 ディジタル映像再生装置

2 DVDドライブ

3 バッファ

4 システムコントローラ 10 インデックス画像

20 背景表示

21〜25 選択用ボタン

51〜55 アンダーライン

61〜65 発話マーク

71、 72 符号

81〜85 符号

101 文字情報認識手段

102 インデックス辞書作成手段

103 符号付加手段

104 音声認識手段

105 再生制御手段

106 インデックス表示手段

107 記憶手段

発明を実施するための最良の形態

[0031] 以下、図面を参照しながら、本発明の一実施形態に係るディジタル映像再生装置について説明する。

[0032] 図 1にお、て、ディジタル映像再生装置 1は、 DVDビデオを再生できる DVDドライブ 2と、 DVDドライブ 2によって再生された映像を一時的に記憶するバッファ 3と、ディジタル映像再生装置 1を全体的に制御するシステムコントローラ 4と、映像を表示する表示装置 5と、ユーザが音声入力を開始しょうとするときに押すボタン 6と、音声を入力するためのマイク 8と、マイク 8からのアナログ音声信号をディジタル音声信号に変換する ADC (Analog to Digital Converter) 7とを備えている。なお、 DVDドライブ 2やマイク 8は必ずしもディジタル映像再生装置 1に内蔵されてヽる必要はなヽ。

[0033] ユーザがディジタル映像コンテンツ（ここでは DVDビデオとする）を記録した DVD を DVDドライブ 2に装着すると、初期画面として DVDビデオから図 2に示すようなィンデッタス画像が読み出されて表示装置 5に表示される。 DVDビデオは複数のチヤプターに区分されており、インデックス画像には各チャプターを選択するための選択用ボタン 21〜25が表示される。なお、選択用ボタンは必ずしも図 2のようなボタンに限らず、選択用ボタンの輪郭が表示されない (すなわち背景と同一色)場合や、チヤプターの先頭の映像の縮小画像を選択用ボタンとして利用する場合もある。なお、図 2の 20は選択用ボタンではなく背景表示の一部である。図 2は、 DVDビデオが 5つのチャプターで構成されている場合の例を示している。ユーザは、図示しない入力装置を用いて、このチャプターの一覧力所望のチャプターを選択することによって、そのチャプターから DVDビデオをを再生することができる。

[0034] 選択用ボタン 21〜25に表示されているチャプター名（「an entrance ceremony 」、「an excursion」など）は、 DVDビデオにテキスト情報（文字コード）としては含まれておらず、選択用ボタン 21〜25を含むインデックス画像が単なる画像情報として DVDビデオに記憶されているに過ぎない。インデックス画像のうち、どの領域がどの選択用ボタンに対応するかを区別するための情報は、 DVDビデオに記憶されて、る

[0035] 次に、図 5を用いてシステムコントローラ 4の機能について説明する。システムコントローラ 4は、マイコン、 DSP、メモリーなどのハードウェアと、 ROMなどに記憶されたソフトウエアとの組み合わせによって実現され、画像情報内の文字認識処理や、音声認識処理や、チャプターの再生処理などを行う。具体的には、システムコントローラ 4 は、文字情報認識手段 101、インデックス辞書作成手段 102、符号付加手段 103、音声認識手段 104、再生制御手段 105、インデックス表示手段 106および記憶手段 107として機能する。以下、各手段について詳細に説明する。

[0036] 文字情報認識手段 101は、 DVDドライブ 2から読み出されたインデックス画像に含まれている図 2の選択用ボタン 21〜25 (すなわち各チャプターを選択するための画像領域)から文字認識処理によって文字情報を抽出する。なお、文字情報認識手段 101は、文字認識処理によって抽出された文字情報が英語か否かを判断する機能を有しており、ここで英語の文字情報が抽出された力否かに応じて、この後の処理手順が変化する。なお、ここではディジタル映像再生装置 1が英語圏で使用されることを前提として説明しているが、例えばディジタル映像再生装置 1が日本語圏で使用される場合には、日本語の文字情報が抽出されたカゝ否かに応じて、この後の処理手順が変化することになる。すなわち、より一般的には、文字情報認識手段 101は、文字認識処理によって抽出された文字情報が特定の言語か否かを判断する機能を有していればよい。

[0037] 文字情報認識手段 101において英語の文字情報が抽出された場合には、文字情報認識手段 101は、抽出した文字情報をテキストデータとしてインデックス辞書作成手段 102へ出力する。一方、英語の文字情報が抽出されな力つた場合 (すなわち、文字情報が何ら抽出されな力つた場合もしくは英語以外の文字情報が抽出された場合）には、文字情報認識手段 101は、符号付加手段 103に対して符号付加処理を依頼する。例えば、図 4のように選択用ボタンにおいてチャプター名が日本語で表示されている場合や、図 5のように選択用ボタンがチャプターの先頭映像の縮小画像 (サムネイル)である場合に、文字情報認識手段 101は符号付加手段 103に符号付加処理を依頼することになる。

[0038] なお、文字情報認識手段 101におヽて利用される文字認識技術としては、公知の任意の技術を用いることができる。

[0039] 符号付加手段 103は、英語の文字情報が含まれていない選択用ボタンに対して予め定めた規則に従って番号などの符号を割り当て、各選択用ボタンに割り当てた符号に対応するテキストデータをインデックス辞書作成手段 102へ出力する。

[0040] インデックス辞書作成手段 102は、文字情報認識手段 101から出力されたテキストデータ（「入学式」、「遠足」など)または符号付加手段 103から出力されたテキストデータ（「1」、「2」など）に基づいて、音声認識手段 104による音声認識処理に利用可能なインデックス辞書を作成する。以下、インデックス辞書作成手段 102の処理をより具体的に説明する。

[0041] インデックス辞書作成手段 102は、まず、文字情報認識手段 101または符号付カロ手段 103から出力されたテキストデータの中に同一のテキストデータが無いかどうかをチェックし、同一のテキストデータがある場合は、それらのテキストデータを区別できるようにテキストデータの後ろに数字 (より正確には数字に対応するテキストデータ)等を追加する。例えば、インデックス辞書作成手段 102に入力されるテキストデータの中に「an excursion が 2つあった場合には、一方を「excursion' one」に、他方を「 excursion' two」に変換する。

[0042] インデックス画像に含まれて、る全ての選択用ボタンにっ、てテキストデータが作成できたら、インデックス辞書作成手段 102は、これらのテキストデータを用いて音声認識処理用のインデックス辞書を作成し、記憶手段 107に記憶する。記憶手段 107 は、電源が切れても記憶内容を保持し続ける不揮発性の記憶手段であってもよヽし、電源が切れれば記憶内容が失われる揮発性の記憶手段であってもよい。インデッタス辞書には、テキストデータと関連付けて、対応する選択用ボタンのインデックス画像における表示位置も同時に記録される。図 6は、図 2のインデックス画像に基づいて作成されるインデックス辞書の内容を示している。図 7は、図 4または図 5のインデッタス画像に基づヽて作成されるインデックス辞書の内容を示して!/、る。

[0043] なお、インデックス辞書作成手段 102は、前述のように同一のテキストデータが複数存在していたことからテキストデータに数字等を追加したものについては、数字等を追加した後のものをテキストデータとして記録すると同時に、この記録されているテキストデータが本来のテキストデータに数字等を追加したものであることを示す情報 (フラグ)をこのテキストデータと関連付けてインデックス辞書に記録する。

[0044] インデックス表示手段 106は、インデックス画像に含まれる各選択用ボタンを選択するためにユーザが発声すべき言葉をユーザに提示するための表示制御を行う。より具体的には、文字情報認識手段 101によって英語として認識された文字列については、必要に応じてインデックス画像におけるその文字列の表示位置を文字情報認識手段 101から取得し、図 8のように文字列にアンダーライン 51〜55を引いたり、文字列を枠で囲ったり、文字列の近くにその文字列が発話すべき文字列であることを示す発話マーク 61〜65を付加したりすることによって、その文字列を強調する。また、インデックス辞書作成手段 102において、そのテキストデータに数字等を追加した文字列については、図 9のようにその文字列の後に数字（71、 72)を追加表示する。また、文字情報認識手段 101によって英語以外の言語として認識された文字列については、図 10のように符号付加手段 103によってこの文字列に割り当てられた符号 (8 1〜85)を追加表示する。このようなインデックス表示手段 106の処理の結果、ユーザはインデックス画面にぉ、て所望のチャプターを選択した、ときにどの文字列を発声すれば良!、かが一目で分力るようになる。

[0045] ユーザが音声入力を開始するためにボタン 6を押すと、ボタン 6から音声認識開始信号 S1が出力される。音声認識手段 104は、音声認識開始信号 S1を受信すると、 ADC7を通じて取り込まれる音声データ D1と記憶手段 107に記憶されているインデックス辞書を用いて音声認識処理を行う。この音声認識処理の結果、インデックス辞書にお、て音声データ D1に対応するテキストデータが見つ力つた場合には、音声認識手段 104はインデックス辞書力もこのテキストデータに対応する選択用ボタンの表示位置情報を取得して、これを再生制御手段 105に出力する。

[0046] 再生制御手段 105は、音声認識手段 104から受け取った表示位置情報からチヤプターを特定し、そのチャプターの再生を開始する。

[0047] なお、日本語圏において、文字情報認識手段 101が、文字認識処理によって抽出された文字情報が日本語か否かを判断する機能を有しており、日本語においてインデッタス画像に含まれるチャプター名の文字が漢字によって表記されて、る場合には、発音される文字列と同じ辞書を作るために、インデックス辞書作成手段 102は、まず、文字情報認識手段 101または符号付加手段 103から出力されたテキストデータをカタカナデータ（「二ユウガクシキ」、「ェンソク」、「イチ」、「二」など）に変換する。ィンデッタス辞書には、カタカナデータと関連付けて、文字情報認識手段 101および符号付加手段 103から出力されたテキストデータや、対応する選択用ボタンのインデッタス画像における表示位置も同時に記録される。図 11は、図 4のインデックス画像に基づ 1、て作成されるインデックス辞書の内容を示して!ヽる。

[0048] 以上のようなシステムコントローラ 4の機能により、ユーザはインデックス画像に含まれている選択用ボタンから任意の選択用ボタンを音声で選択して、その選択用ボタンに対応するチャプターの視聴を開始することができる。このように、本実施の形態によれば、チャプターを音声で選択することができるため、特に車載用の DVD再生装置として特に有用である。また、本実施の形態にさらにナビゲーシヨン機能を追加することによって、ディジタル映像コンテンツの再生機能を備えたナビゲーシヨン装置としてちよい。 [0049] なお、記憶手段 107として不揮発性の記憶手段を利用し、インデックス辞書作成手段 102によって作成したインデックス辞書を、ディジタル映像再生装置 1の電源を切つた後も保持しておくようにすれば、ディジタル映像再生装置 1の電源を一度切って力も入れ直したときに、記憶手段 107に過去に記憶されたデータを使用することができるので、ディジタル映像再生装置 1の使い勝手を向上することができる。以下、記憶手段 107として不揮発性の記憶手段を利用した応用例について説明する。

[0050] この応用例においては、インデックス辞書作成手段 102によって作成されたインデックス辞書は、図 12に示すように、 DVDビデオのタイトルや DVDに固有の情報や他の付加情報と関連付けて記憶手段 107に記録される。 DVDに固有の情報としては、例えば、 DVDに記録されて、るデータの大きさや映像の時間やチャプター数などである。また、再生制御手段 105は、チャプターの再生を行ったときに、その再生日時をそのチャプターに対応する選択用ボタンの表示位置情報と関連づけて再生履歴情報として記憶手段 107に記憶する。また、ユーザがチャプターの途中で再生を停止した場合には、再生制御手段 105は、停止時点における映像のタイムカウンター値を再生時の日時と関連づけて再生履歴情報として記憶手段 107に記憶する。

[0051] ディジタル映像再生装置 1の電源が投入されると、システムコントローラ 4は、まず D VDドライブ 2に DVDが挿入されて!、るかを確認する。 DVDドライブ 2に DVDが挿入されていた場合には、システムコントローラ 4は、記憶手段 107に記憶されている図 1 2のような情報を参照して、現在 DVDドライブ 2に挿入されている DVDが過去に挿入されたことのある DVDかどうかを確認する。そして、現在 DVDドライブ 2に挿入されている DVDが過去に挿入されたことのある DVDであった場合は、過去に作成したインデッタス辞書を利用して音声認識処理を実行し、初めて挿入された DVDであった場合は、インデックス画像力もインデックス辞書を作成して記憶手段 107に記憶し、このインデックス辞書を利用して音声認識処理を実行する。これにより、過去に利用したことのある DVDについてはインデックス辞書を改めて作成する手間が省けるため、 DV Dドライブ 2に DVDを挿入して力音声によってチャプターを選択可能となるまでに時間を短縮することができる。

[0052] また、記憶手段 107に記憶されて、る再生日時情報を利用すれば、チャプター毎に過去に再生した力否かを示す情報をインデックス表示手段 106によってインデックス画像に付加して力も表示装置 5に表示させることもできる。

[0053] また、記憶手段 107に記憶されているカウンター値情報を利用すれば、ユーザが過去に再生を途中で停止したチャプターを再び選択したときに、その停止時点からチヤプターの再生を開始することができる。

[0054] なお、本実施の形態では、 DVDに記録されたディジタル映像コンテンツを再生する場合を例に説明したが、本発明はこれに限らず、他の記録媒体に記録されたディジタル映像コンテンツを再生する場合や、通信回線を通じて供給されるディジタル映像コンテンツを再生する場合や、放送波によって供給されるディジタル映像コンテンッを再生する場合にも、本発明を同様に適用することができる。なお、ディジタル TV のコンテンツなどのように、映像中の選択用ボタンに対応するテキスト情報がコンテンッ自体に予め含まれている場合には、文字情報認識手段 101による文字認識処理を行うことなしに、インデックス辞書作成手段 102はそのテキスト情報を用いてインデックス辞書を作成すればょヽ。

産業上の利用可能性

[0055] 車両搭載用のナビゲーシヨンシステムには音声認識機能を有するものが多く存在し、 DVDの再生が可能なものが広く普及している。このようなシステムに本発明のディジタル信号カゝら音声認識で使用できる辞書を作成する手段を追加することにより、ドライバが運転中であっても音声によって安全にチャプターの選択を行うことができ、特に車載用として有用である。

Claims

請求の範囲

[1] ディジタル映像コンテンツを再生するためのディジタル映像再生装置であって、ディジタル映像コンテンツの信号に基づいて音声認識処理に利用可能な辞書を作成する辞書作成手段と、

前記辞書作成手段によって作成された辞書を用いて音声認識処理を行う音声認識手段と、

前記音声認識手段の音声認識結果に基づいてディジタル映像コンテンツの再生制御を行う再生制御手段とを備えた、ディジタル映像再生装置。

[2] ディジタル映像コンテンツの映像信号に含まれている、当該ディジタル映像コンテンッの再生位置をユーザに選択させるための再生位置選択用画像から、文字情報を認識する文字情報認識手段をさらに備え、

前記辞書作成手段は、前記文字情報認識手段によって認識された文字情報を用 Vヽて、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする、請求項 1に記載のディジタル映像再生装置。

[3] 前記再生位置選択用画像を表示装置に表示するときに、当該再生位置選択用画像に基づいて前記インデックス辞書に登録された文字情報に対応する文字列部分を、前記文字情報認識手段の認識結果に基づ!、て強調表示するインデックス表示手段をさらに備えることを特徴とする、請求項 2に記載のディジタル映像再生装置。

[4] 前記文字情報認識手段によって認識された文字情報を、過去に利用したディジタル映像コンテンツのチャプター情報として不揮発的に記憶する不揮発性記憶手段をさらに備えることを特徴とする、請求項 2に記載のディジタル映像再生装置。

[5] 前記不揮発性記憶手段は、前記文字情報認識手段によって認識された文字情報を、当該文字情報に対応する前記ディジタル映像コンテンッの部分が過去に再生されたかどうかを示す履歴情報とともに記憶することを特徴とする、請求項 4に記載のディジタル映像再生装置。

[6] 前記不揮発性記憶手段は、前記文字情報認識手段によって認識された文字情報を、前記履歴情報とともに、当該文字情報に対応する前記ディジタル映像コンテンツの部分が再生された日時とともに記憶することを特徴とする、請求項 5に記載のディジタル映像再生装置。

[7] 前記辞書作成手段は、前記文字情報認識手段によって認識された文字情報の字数が予め定めた閾値を超えていた場合に、当該文字情報の字数を短くしたものを用 Vヽて前記インデックス辞書を作成することを特徴とする、請求項 2に記載のディジタル映像再生装置。

[8] 前記文字情報認識手段によって認識された文字情報が日本語かどうかを判断する言語判断手段と、

前記文字情報認識手段によって文字情報が認識されな力つた場合もしくは前記文字情報認識手段によって認識された文字情報が英語でな力つた場合に、前記再生位置選択用画像に対して予め定めた規則に従って符号を付加する符号付加手段と前記符号付加手段によって符号の付加された再生位置選択用画像を表示装置に表示させるインデックス表示手段とをさらに備え、

前記辞書作成手段は、前記文字情報認識手段によって認識された英語の文字情報と、前記符号付加手段によって再生位置選択用画像に付加された符号とを用いて、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする、請求項 2に記載のディジタル映像再生装置。

[9] ディジタル映像コンテンツの映像信号に含まれている、当該ディジタル映像コンテンッの再生位置をユーザに選択させるための再生位置選択用画像に対して、予め定めた規則に従って符号を付加する符号付加手段と、

前記符号付加手段によって符号の付加された再生位置選択用画像を表示装置に表示させるインデックス表示手段とをさらに備え、

前記辞書作成手段は、前記符号付加手段によって再生位置選択用画像に付加された符号を用いて、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする、請求項 1に記載のディジタル映像再生装置。

[10] 前記辞書作成手段は、ディジタル映像コンテンツの信号に含まれている、当該ディジタル映像コンテンツの再生位置をユーザに選択させるためのテキスト情報を用いて

、ユーザに再生位置を音声で選択させるためのインデックス辞書を作成することを特徴とする、請求項 1に記載のディジタル映像再生装置。