以下の説明において、「動画データ」とは複数の画像を含むデータをいい、複数の画像のデータ以外にもヘッダ情報など付随するデータも含む概念をいう。
また、以下の説明において、動画の「シーン」とは、動画データ内の連続する一部分をいう。
以下、本発明の実施形態の一例を説明する。
図1は、本実施例に係る映像記録再生装置のハードウェア構成の一例である。ここで、映像記録再生装置は、例えば、CPU101、主記憶装置102、補助記憶装置103、音声出力装置104、表示装置105、指示入力装置106、動画データ入力装置107から構成される。また、ネットワークを介して動画データを取得する場合には、さらに、ネットワークデータ送受信装置108を有する。上記101から108までの各装置はバス109によって接続され、各装置間で相互にデータの送受信が行われる。
ここで、本実施例に係る映像記録再生装置は、動画データ入力装置107やネットワークデータ送受信装置108などにより例えばデジタル放送やIP放送などを受信し、その放送データの中から動画データを取得する、もしくはネットワークデータ送受信装置108を介して接続されるネットワーク上のサーバー装置内の動画データなどを取得し、その動画データを記録、再生する。
CPU101は、主記憶装置102や補助記憶装置103に格納されているプログラムを実行する。
主記憶装置102は、例えば、ランダムアクセスメモリ(RAM)やリードオンリーメモリ(ROM)等で実現される。主記憶装置102は、CPU101によって実行されるソフトウェアプログラムや映像記録再生装置において処理されるデータや動画データ等を格納する。
補助記憶装置103は、例えば、ハードディスク(HDD)、Blu−ray Discや、DVDなどの光ディスクドライブ、フロッピー(登録商標)ディスクなどの磁気ディスクドライブ、あるいはフラッシュメモリ等の不揮発性メモリ等を、単体あるいは複数組合せて構成される。補助記憶装置103は、CPU101によって実行されるソフトウェアプログラムや映像記録再生装置において処理されるデータや動画データ等を格納する。
音声出力装置104は、例えば、例えばサウンドカードとスピーカ等によって実現され、動画データに含まれる音声を出力する。
表示装置105は、例えば、液晶ディスプレイデバイス、プラズマディスプレイデバイス、プロジェクタデバイス等によって実現され、映像記録再生装置において処理される動画データや映像記録再生装置の動作設定や状況の表示画面を表示する。
指示入力装置106は、例えば、リモコン、キーボード、マウス等で実現され、利用者は指示入力装置106を通して録画、再生等の装置の動作に関する設定を行う。
動画データ取得装置107には、動画データが入力される。動画データ入力装置107は、例えば、主記憶装置102あるいは補助記憶装置103に格納されている動画データを読み込む装置や、テレビ放送等を受信する場合にはテレビのチューナユニットとすることができる。
ネットワーク送受信装置108には、例えば、LANカード等のネットワークカードによって実現され、ネットワークで繋がっている他の装置から動画データが入力される。
図2は映像記録再生装置の機能ブロックの一例である。これらの機能ブロックの一部あるいは全部は、CPU101によって実行されるソフトウェアプログラムとして実現してもよく、図1で示したハードウェアに加えて、ハードウェアとして実現されてもよい。
なお、以下では、一例として、これらの機能ブロックの全てがCPU101によって実行されるソフトウェアプログラムであるものとして説明する。
映像記録再生装置は、動画データ入力部201、文字情報抽出部202、インデックスデータ生成部203、インデックスデータ保持部207、インデックスデータ取得部208、ユーザ指定レベル情報取得部209、シーン開始位置取得部212、文字列提示制御部213、シーン開始位置提示部214、再生制御部215、音声出力制御部216、表示制御部217、再生動画データ入力部218、再生位置指定部219から構成される。
ただし、他の装置ですでに作成済みのインデックスデータを使用するなど、インデックスデータを映像記録再生装置で生成しない場合には、必ずしも動画データ入力部201と、文字情報抽出部202と、インデックスデータ生成部203と、インデックスデータ保持部207は必要ない。
動画データ入力部201は、動画データ入力装置107またはネットワーク送受信装置108から後述するインデックスデータを生成する対象の動画データが入力される。
文字情報抽出部202は、動画データ入力部201に入力された動画データを解析して文字列を抽出し、その文字列およびそれが抽出された動画データ上の時刻を抽出する。これは、例えば映像上で喋られている台詞の字幕データを取得し、その文字列およびそれが表示される時間とともに記録することで実現すればよい。なお、デジタルテレビ放送では、音声のES(Elementary Stream)や映像のESともに字幕のESが送られてきているので、この字幕のESを取得し、デコードすることで、字幕として表示される文字列とそれが表示される時刻の情報を取得できる。映像ESと共に送信される字幕ESを用いて文字列を抽出する場合、文字情報抽出部202は動画データに付随する文字情報を抽出することとなる。
また、動画データ入力部201に入力された動画データの音声を認識することで、映像上で喋られている台詞の文字列を取得できる。なお、音声認識の技術については、従来の技術を用いればよいため、説明は省略する。また、動画データ入力部201に入力された動画データの画像上に表示されるテロップを認識することで、画像上テロップの文字列を取得してもよい。なお、テロップ認識の技術については、従来の技術を用いればよいため、説明は省略する。音声認識やテロップ認識により文字情報を抽出する場合には、文字情報抽出部202は、動画データに含まれる文字情報を抽出することとなる。
インデックスデータ生成部203は、シーン開始位置検出部204、レベル設定部205、提示用文字列設定部206から構成される。文字情報抽出部202で抽出された文字列およびそれが抽出された動画データ上の時刻を予め定めたレベル決定テーブルを用いて解析し、インデックスデータを生成する。レベル決定テーブルの詳細については図3を用いて後述する。インデックスデータの構造については図4を用いて後述する。
シーン開始位置検出部204は、動画データを元に所定の個数(=N)のシーンについて開始時刻を検出する。これは、文字情報抽出部202で動画データから抽出された文字列に対して、シーンの終わり及び開始時に出現する言葉をクエリとして、たとえば、以下に例示する検出方法を用いて検索することで実現できる。
第1の検出方法は、特定の文字列を検索する方法である。例えば、「スポーツです」を検索することで、ニュース番組でスポーツコーナーが始まるときに出現する「スポーツです」という文字列を検出し、スポーツコーナーの開始時刻を検出できる。開始時刻は、検索語が見つかった位置に対応する時刻それぞれに、予め定められたオフセットを加えた値とする。
第2の検出方法は、文頭の文字列を対象として、特定の文字列を検索する方法である。例えば、文頭にある「続いては」という文字列を検索することで、ニュース番組でトピックが切り替わる際に出現する文頭の「続いては」という文字列を検出し、スポーツコーナーの開始時刻を検出できる。開始時刻は、検索語が見つかった位置に対応する時刻それぞれに対して、時間的に前方に予め定められたオフセットを加えた値とする。
第3の検出方法は、特定の文字列を検索し、当該特定の文字列の最初の出現位置を求める方法である。例えば、「気象情報」とう文字列が最初に出現した位置を求めることで、ニュース番組の気象情報コーナーで出現する「気象情報」という文字列を検出する一方、そのコーナーの中で出現する「気象情報」は検出しないため、正しい気象情報コーナーの開始時刻を検出できる。開始時刻は、検索語が見つかった位置に対応する時刻それぞれに対して、時間的に前方に予め定められたオフセットを加えた値とする。
第4の検出方法は、特定の文字列を所定時間内または所定の個数の文の中から検索し、予め定めた閾値の個数以上存在する位置を求める方法である。例えば、ニュース番組の気象情報コーナーでは「晴れ」という文字列が頻出するため、「晴れ」が2分以内に3回以上存在する位置を検索することで、気象情報コーナーの付近の時刻を取得できる。開始時刻は、最初に特定の文字列が出現した位置、または特定の文字列が出現した位置の平均、または最後に出現した位置に対応する時刻に対して、時間的に前方に予め定められたオフセットを加えた値をシーンの開始時刻とする。
第5の検出方法は、動画データから文字列が抽出されない期間が、所定の期間を超えた場合、文字列が抽出されない期間の最後の位置に対応する時刻に、予め定められたオフセットを加えた値をシーンの開始時刻とする方法である。一般的にCM中は動画データから文字列が抽出されないため、CM明けのニュースのトピックは文字列が再び抽出された位置と一致する。そのため、所定の期間を超えて文字列が抽出されない期間の最後の位置に対応する時刻が、ニュースのトピックの開始時刻に近い。よって、当該文字列が抽出されない期間の最後の位置に対応する時刻に対して、時間的に前方にオフセットを加えた値をシーンの開始時刻とすることで、ニュースのトピックの開始時刻を取得できる。
例えば、以上の検索方法に基づいてシーンごとに複数のルールを用意して、シーンの開始時刻を検出すればよい。
また、以上説明した方法に加えて、動画データから字幕を制御するためのコードを抽出し、所定のコードの出現回数の条件、所定のコードの出現時間の条件を用いてシーンの開始位置を検出しても良い。
また、以上説明した動画データから抽出した文字列からシーンの開始位置を検出する方法と前記字幕を制御するコードからシーンの開始位置を検出する方法を組み合わせてもよい。
次に、レベル設定部205は、シーン開始位置検出部204で検出されたN個の各シーンの開始位置にレベルを設定する。ここで、以下の説明において「レベル」とは、シーンもしくはシーンの開始位置の種類を示す値である。レベルの設定には、例えば、図3に示すようなレベル決定テーブルを用いる。レベル決定テーブルは、例えば、図1の主記憶装置102や補助記憶装置103に予め記録しておく。シーン開始位置検出部204で検出したN個のシーンそれぞれの開始位置の集合に対して、図3に示すようなレベル決定テーブルの304の数値をレベルとして割り当てる。
ここで、図3に示すレベル決定テーブルの一例について、詳細を説明する。図3にはレベル決定テーブルの一例として、「ニュース番組」のレベル決定テーブルを示す。図3において、301はデータのエントリ番号であり、302はカテゴリを表す文字列あるいはコードであり、303は利用者に提示するための文字列であり、304はレベルであり、305はシーンをマージする個数であり、306はシーン開始位置検出部204で検出されるシーンの内容を表す文字列またはコードである。レベル決定テーブルは上述した301ないし306のデータの組でエントリを構成する。図3の例においては特に311ないし314の4つのエントリがあることを示している。
なお、レベル決定テーブルの304の数値の大小によって、そのシーンのレベルの上位、下位を示してもよい。例えば、数字が小さい場合に、上位を示すように設定する場合は、最も細かいシーンの区切り位置、例えば、ニュース番組での「トピック」のようなシーンの区切りには最上位レベルであることを示す値、例えば1を設定する。また、シーンの最も細かい区切り位置に含まれる区切りであって、その1種類であるシーンの区切り、例えば、ニュース番組での「お天気」、「スポーツ」のようなシーンには、シーンの区切り位置に設定された値に+1した値、例えば2を設定する。次に、例えば有名人などの固有名詞である「○○太郎」の出現シーンには、さらに+1した値、例えば3を設定すればよい。
また、例えば、数字が大きい場合に、上位を示すように設定する場合は、最上位のシーンを0として、一つレベルの低いシーンには−1を設定し、さらにレベルの低いシーンには−2を設定すればよい。
また、この301ないし306のデータに、チャンネル、放送波の種類、放送時間、CMの有無、生放送の情報を追加してもよい。これにより、レベルを、チャンネル、放送波の種類、放送時間、CMの有無、生放送の少なくとも一つごとに設定でき、また、提示用文字列を、チャンネル、放送波の種類、放送時間、CMの有無、生放送の少なくとも一つごとに設定できる。
レベル設定部205は、上記の図3に示すレベル決定テーブルを用いて、シーン開始位置検出部204で検出された各シーンの開始位置にレベルを設定する。
提示用文字列設定部206は、上記の図3に示すレベル決定テーブルを用いて、シーン開始位置検出部204で検出されたN個の各シーンの開始位置に利用者に提示するための文字列を設定する。
また、レベル設定部205は、各シーンの開始位置に設定したレベル設定の結果をインデックスデータ格納する。提示用文字列設定部206は、各シーンの開始位置に設定した文字列の結果をインデックスデータ格納する。
ここで、図4に示すインデックスデータの一例について、詳細を説明する。図4はインデックスデータのデータ構造の一例である。図4において、401はデータのエントリ番号であり、図3のレベル決定テーブルの301に対応する値が格納される。402は後述する提示用文字列設定部206で各シーンに割り当てられる「トピック」「お天気」「スポーツ」「○○太郎」といった提示用文字列であり、図3のレベル決定テーブルの303に対応する値が格納される。403はレベル設定部205で各シーンに割り当てられるレベルであり、図3のレベル決定テーブルの304に対応する値が格納される。405はシーンが開始位置(時刻)の集合であり、レベル設定部205が、図3のレベル決定テーブルの305、306を参照してマージするシーンの数と種類を判別して、前述のレベルを設定した各シーンの開始位置(時刻)に対してマージを行った結果の集合である。
すなわち、本実施例では、図3のエントリ#1の306には、「トピック」「お天気」「スポーツ」と記録されているので、図4のエントリ#1の405には、シーン開始位置検出部204で検出された「トピック」「お天気」「スポーツ」の各シーンの開始位置(時刻)がマージされて記録される。ここで、「開始位置(時刻)をマージして記録する」とは、「トピック」「お天気」「スポーツ」の各種類のシーンの開始位置(時刻)を一つの集合に格納し、複数種類のシーンの開始位置(時刻)が重複する場合に、一つの開始位置(時刻)として記録することをいう。
この場合、複数種類のシーンの開始位置(時刻)が重複する場合の判断は、厳密に時、分、秒まで一致するものを重複すると判断しても良いが、2、3分以内に複数種類のシーンの開始位置(時刻)が存在する場合を重複すると判断しても良い。後者の場合は、上記図4のインデックスデータを用いて動画を再生する際に、一般的に利用者の望む期間よりも短期間の再生位置の変更などを排除することができ、利用者がより望む映像再生を実現することが可能となる。
また図4において、404はシーン開始時刻の個数であり、上記のマージがなされた結果、405に格納される時刻の集合である。
なお、図4の例におけるインデックスデータにおいては、上述した401ないし405のデータの組でエントリを構成する。図4においては、特に411ないし414の4つのエントリがあることを示している。
以上説明したとおり、シーン開始位置検出部204、レベル設定部205、提示用文字列設定部206から構成されるインデックスデータ生成部203は、文字情報抽出部202が抽出した文字列を用いて複数の種類のシーンの開始位置(時刻)を検出し、レベル決定テーブルを用いて検出したシーンの開始位置(時刻)に対し、レベルの設定と、提示文字列を設定し、インデックスデータを生成する。
次に、図2の説明に戻り、インデックスデータ保持部207は、インデックスデータ生成部203において生成したインデクシングデータを保持する。これは、例えばインデックスデータ生成部203において生成したインデクシングデータを主記憶装置102あるいは補助記憶装置103に格納することによって実現できる。
インデックスデータ取得部208は、インデックスデータ保持部207において保持されたインデックスデータ、あるいは他の装置などによって既に生成されているインデックスデータを取得する。これは、例えば主記憶装置102あるいは補助記憶装置103に格納されているインデックスデータを読み出すことによって実現できる。あるいは他の装置などによって既に生成されたインデックスデータを取得する場合には、ネットワークデータ送受信装置108を介して、該当するインデックスデータが保存されている装置にアクセスし、該当するインデックスデータを取得すればよい。インデックスデータの取得方法としては一般的なネットワークデータの取得方法が適用可能である。すわち、従来の技術を用いればよいため、説明は省略する。
ユーザ指定レベル情報取得部209は、利用者などにより外部から指定されたレベルを、後述するシーン開始位置取得部212に通知する。これは例えば、図5におけるレベル決定ボタン513、514及び515が利用者により選択されることで通知されたレベルの値を後述するシーン開始位置取得部212に通知する。
なお、レベル決定ボタン513、514及び515は、図5に示す四角のボタンに限られず、選択を促す表示であればどのような表示でもよい。後述する提示文字列517ないし520そのものやぞれぞれの文字列を囲む領域が選択できるようにしてもよい。
また、図4のインデックスデータに示されるレベル2のように、一つのレベル情報に、複数の文字列が対応付けられている場合には、図5のレベル決定ボタン514のように、複数の文字列からなるグループを選択するように表示すればよい。
ここで、本実施例において利用者が所望するインデックスのレベルを指定する際に用いる映像記録再生装置の表示画面の一例を図5を用いて説明する。図5は、利用者に提示用文字列を提示した一例を含む本実施例に係る映像記録再生装置の表示画面の一例である。図5の例では、ニュース番組に対してレベル3までのシーンの内容を提示している。図5において、501は表示装置103上の画面であり、502は動画操作ウィンドウ、504は動画表示ウィンドウである。再生される動画データは、この動画表示ウィンドウ504に表示される。また、505は動画データの再生時間軸を示す再生位置表示スライダーであり、利用者は、この再生位置表示スライダー505により、再生している位置を知るとともに再生位置を変更あるいは指定することが可能となる。ここで、506は現在の再生位置を表示するマークである。
また、511および512は再生位置指定ボタンである。後述する再生位置指定部219は、利用者が再生位置指定ボタン511または512を選択した情報を取得して、後述する再生制御部215が再生位置を変更する。
また、503は、シーン内容表示ウィンドウである。後述する文字列提示制御部213は、このシーン内容表示ウィンドウ503内に、インデックスデータに格納された提示用文字列を表示することで、利用者に動画データに含まれるシーンの内容の説明を提示可能となる。図5においては、517ないし520が、レベルごとの提示用文字列である。また、513ないし515は、517ないし520で示された提示用文字列に対応するレベルのシーンの開始位置(時刻)をインデックスとして使用するか否かを指定するためのボタンである。これらを選択することによって、選択された提示用文字列に対応するレベルをユーザ指定レベル情報取得部209が取得するように構成する。複数のボタンが選択された場合は、選択されたそれぞれのボタンに対応するレベルをユーザ指定情報入力部209が取得する。
また、選択済みのボタンは図5のボタン514のように斜線を入れるなど、選択済みの表示を各ボタンに施すことが望ましい。これにより、利用者が選択したシーンを表示画面から理解しやすくなる。
また、上位のレベルの提示文字列に対応するボタンを選択することによって、図4のインデックスデータにおける上位のレベルのエントリにマージされた下位のレベルのエントリに対応する下位のボタンを選択済みとする表示を行ってもよい。この表示により、利用者は、提示文字列に対応するシーンの上位下位の関係を理解しやすくなる。例えば、図5の例では、利用者が提示文字列517「トピック」のボタン513を選択した場合、図4のインデックスデータにおいて提示文字列「トピック」のエントリ#0にマージされたエントリ#1、エントリ#2に対応する提示文字列「お天気」「スポーツ」を示すボタン514に斜線を表示し選択済みの表示とすればよい。
次に、図2の説明に戻り、シーン開始位置取得部212は、ユーザ指定レベル情報取得部209が利用者によるボタンの選択など、外部から取得したレベルが、インデックスデータ取得部208で入力されたインデックスデータ内のレベルと一致するエントリを抽出し、抽出したエントリのシーンの開始時刻405を取得する。複数のエントリが抽出された場合は、それぞれのエントリのシーン開始時時刻をマージし、時刻の早い順にソートして取得する。
文字列提示制御部213は、インデックスデータ取得部208で入力したインデックスデータに格納された提示用文字列を利用者に提示する。これは、例えば図5に示すようにシーン内容表示ウィンドウ503上の提示用文字列表示制御部517、518、519及び520に表示する。
シーン開始位置提示部214は、シーン開始位置入力部208に入力されたシーンの開始位置を提示する。シーン開始位置提示の一例は、図5において示されている。図5では、507ないし510が、シーンの開始位置を示すマークである。例えば、動画データの再生時間軸を示す再生位置表示スライダー505の上部に、シーン開始位置取得部212が取得したシーンの開始時刻に対応する位置にマークを表示することにより実現できる。このとき、シーン開始位置取得部212が取得したシーンの開始時刻とは、上述したように、利用者の選択などにより外部から指定されたレベルに対応するシーンの開始時刻である。
図5では、再生位置表示スライダー505の左端を時刻0として、右端を録画終了時刻とすることにより、再生位置表示スライダー505の長さが動画データ全体の再生時間を示している。ここで、利用者など外部から指定されたレベルのシーンの開始時刻405に対応する再生位置表示スライダー505上における位置は、動画データ全体の再生時間に対する時刻0から当該シーンの開始時刻405までの時間の比を再生位置表示スライダー505の長さに乗ずることにより求めることができる。このように算出した各シーンの位置に、マーク506、508、510を表示する。
また、図6に示すように、シーンのレベルの違いをマークの形や色や違いに反映させても良い。例えば、図5の画面の例では、「お天気」「スポーツ」のシーンに対応するレベルを示すボタン514が選択されており、再生位置表示スライダー505上には、上記「お天気」「スポーツ」のシーンの再生開始位置に対応するマーク507、508、510が示されている。これに対し、図6の画面例で、さらに「○○太郎」のシーンのレベルのシーンに対応するレベルを示すボタン515が選択されており、再生位置表示スライダー505上には、上記「○○太郎」のシーンの再生開始位置に対応するマーク609が、マーク507、508、510とは異なる色で表示されている。
このように、シーンのレベルごとに再生位置表示スライダー505上に表示するマークの種類を変更することにより、利用者が選択したシーンの開始位置を表示画面から理解しやすくすることができる。
なお、図5及び図6でマーク507、508、609、610は三角記号としたが、どのような形であっても良く、表示位置も再生位置表示スライダー505内部、表示位置も再生位置表示スライダー505の下部にあってもよい。
図2の説明に戻る。音声出力制御部216は、後述する再生制御部215において生成された再生音声を音声出力装置104に出力する。
表示制御部217は、後述する再生制御部215において生成された再生画像を表示装置105に表示する。
再生動画データ入力部218は、再生対象の動画データを動画データ入力装置107から入力する。
再生位置指定部219は、利用者の選択などにより外部からの再生位置の変更の指示があった場合に、その旨を後述する再生制御部215に通知する。例えば、図5における再生位置指定ボタン511あるいは512が利用者により選択された場合、すなわち図1の指示入力装置106の操作により、再生位置指定ボタン511あるいは512が選択された場合に、再生位置指定部219は、後述する再生制御部215に対してイベントあるいはフラグにより当該選択を通知する。
再生制御部215は、動画データを再生動画データ入力部218から入力し、シーンの開始位置をシーン開始位置取得部212より取得し、ユーザなどにより外部から指定したレベルあるいは提示用文字列をユーザ指定情報入力部209から取得し、再生画像及び再生音声を生成して表示制御部217および音声出力制御部216に出力することによって、動画データを再生する。この再生制御部215の処理内容の一例を図7に示す。
図7は、再生制御部215の処理内容を説明するフローチャートである。
再生制御部215は、まず、現在の再生位置(動画データにおける時刻)を取得する(ステップ701)。すなわち、ここで取得する位置は、例えば図5の例では、再生位置表示スライダー505においてマーク506で表示される現在位置である。
次に、現在の再生位置を基準とした場合の次の再生開始位置を取得する(ステップ702)。これは、現在の再生位置よりも後で、かつ現在の再生位置に最も近い位置をシーン開始位置取得部212に入力されたシーンの開始位置から取得することによって実現できる。すなわち、ここで取得する位置は、例えば図5の例では、再生位置表示スライダー505においてマーク508で表示される次の再生位置である。
次に、ステップ702で取得した再生開始位置へジャンプし(ステップ703)、当該再生開始位置から動画データの再生を行う(ステップ704)。これは、当該再生位置からの動画データにおける再生画像を、表示制御部217を介して表示装置105への表示すること、及び当該再生位置からの動画データにおける再生音声を、音声出力制御部216を介して音声出力装置104への出力することにより実現される。すなわち、例えば図5の例では、マーク508で表示される次の再生位置からの動画データが再生され、動画表示ウィンドウ504に表示される。
なお、同動画データの再生中、定期的に再生が終了したか否かを判断し(ステップ705)、再生が終了した場合には動画データの再生を終了する。具体的には、動画データをすべて再生し終わった場合、あるいは利用者など外部から再生の終了が指示された場合に再生の終了と判断する。
さらに、同動画データの再生中、定期的に再生位置指定部219により再生位置の変更が指示されたか否かを判断する(ステップ706)。このステップ706における判断の結果、再生位置指定部219により再生位置の変更が指示されていないと判断した場合には、ステップ704に戻り、ステップ704ないしステップ706を繰り返すことで、動画データの再生を継続する。
一方、ステップ706における判断の結果、再生位置指定部219により再生位置の変更が指示された判断した場合には、ステップ701に戻り、ステップ701ないしステップ706を繰り返すことで、次の再生開始位置から動画データの再生を行う。
なお、このとき、再生位置指定部219において、利用者の選択など外部からの指示により、再生位置指定ボタン512が選択された場合には、ステップ702において、現在の再生位置よりも後で、かつ現在の再生位置に最も近い位置を取得する。
一方、再生位置指定部211において、利用者の選択など外部からの指示により、再生位置指定ボタン511が選択された場合には、ステップ702において、現在の再生位置よりも前で、かつ現在の再生位置に最も近い位置を取得する。これにより、利用者など外部から再生位置指定ボタン512が選択された場合には、時間的に次のシーン位置から動画データの再生が行われる。
また、利用者の選択など外部からの指示により、再生位置指定ボタン511が選択された場合には、時間的に前のシーン位置から動画データの再生が行われる。以上の処理により、利用者が指定したシーンの位置から動画データの再生が可能となる。
例えば、利用者が「ニュース番組」の全トピックに興味がある場合には、図5の表示画面において「トピック」のシーンの対応するボタン513を選択して動画データを視聴すればよい。このとき、「トピック」のシーンの全再生開始位置に対応するマークが再生位置表示スライダー505に表示される。このように視聴することにより、利用者が次のトピックに再生位置を変更したくなったときに、再生位置指定ボタン512を選択すれば、次の「トピック」のシーンの再生開始位置から視聴することができる。
また、利用者が「ニュース番組」のうち、一部である「お天気」または「スポーツ」を視聴したい場合は、図5の表示画面において「お天気」「スポーツ」のシーンの対応するボタン514を選択して動画データを視聴すればよい。このとき、「お天気」および「スポーツ」のシーンの全再生開始位置に対応するマークが再生位置表示スライダー505に表示される。このように視聴することにより、利用者が「スポーツ」のシーンを視聴した後、次の「スポーツ」のシーンや「お天気」のシーンに再生位置を変更したくなったときに、再生位置指定ボタン512を選択すれば、次の「スポーツ」のシーンや「お天気」のシーンに再生位置を変更することができる。このとき、「スポーツ」および「お天気」のシーン以外の「トピック」のシーンの開始位置は省くことができる。すなわち、利用者が必要としないシーンを省いて視聴することが可能となり、利用者にとってより好適な映像再生を実現することができる。
次に、本実施例に係る映像記録再生装置の全体的な動作について、動画データの録画時と再生時に分けて説明する。
まず、動画データの録画時の動作を説明する。
図8は、本実施例に係る映像記録再生装置の動画データ録画時の動作を示すフローチャートである。
動画データの録画時には、まず、本実施例の映像記録再生装置は、動画データ入力装置107やネットワークデータ送受信装置108から動画データ入力部201に録画対象の動画データを入力する(ステップ801)。次にインデックスデータ生成部203が、インデックスデータを生成する(ステップ802)。さらに、インデックスデータ保持部207が、ステップ802でインデックスデータ生成部203によって生成したインデックスデータを保存する(ステップ803)。このとき、ステップ802やステップ803と並行して、動画データ入力装置107やネットワークデータ送受信装置108から入力した動画データそのものを主記憶装置102や補助記憶装置103に記録する。以上により録画を終了する。
なお、他の装置ですでに作成済みのインデックスデータを使用するなど、インデックスデータを本実施例に係る映像記録再生装置で生成しない場合には、必ずしもステップ801と、ステップ802と、ステップ803は必要ない。
なお、上記の例では、動画データ入力装置107やネットワークデータ送受信装置108から動画データを入力した際にインデックスデータを作成した。しかし、そのインデックスデータの作成のタイミングは、これに限られない。例えば、まず、動画データ入力装置107やネットワークデータ送受信装置108から動画データを入力して、主記憶装置102または補助記憶装置103に記録しておく。そして、指示入力装置106を介して利用者など外部からインデックスデータ作成指示がなされたとき、毎日AM0:00など、予め定めておいたタイミング、またはCPU101が主記憶装置102または補助記憶装置103に記録された動画データを解析してインデックスデータが未解析である動画データを発見したときなど、動画データの記録後に、図8のステップ802、803を実行してもよい。
次に、動画データ再生時における本実施例に係る映像記録再生装置の動作を説明する。
図9は、本実施例に係る映像記録再生装置の動画データ再生時の動作を示すフローチャートである。
動画データの再生時には、まず、本実施例に係る映像記録再生装置は、シーンのレベルを入力する(ステップ901)。これは、例えば、ユーザ指定レベル情報取得部209が、利用者などが指示入力装置106を介して選択したレベルを取得することにより実現する。
次に、インデックスデータ取得部208が、インデックスデータ保持部207からインデックスデータを入力する(ステップ902)。
続いて、シーン開始位置取得部212が、上記インデックスデータ取得部208に入力されたインデックスデータを用いて、ユーザ指定レベル情報取得部209が取得した利用者などが選択したレベルに対応する開始位置を取得する(ステップ903)。
次に、再生動画データ入力部218が、再生対象の動画データを入力する(ステップ904)。
さらに、再生制御部215が、ステップ903においてシーン開始位置取得部212が取得したシーン開始位置をもちいて、ステップ904において再生動画データ入力部218が入力した動画データの再生の制御を行う(ステップ905)。ステップ905の具体例としては、再生位置指定部219から利用者などによる再生位置の指定が入力された場合に、ステップ903においてシーン開始位置取得部212が取得したシーン開始位置からの再生動画データを、表示制御部217を介して表示装置105へ出力し、当該シーンの位置からの再生音声を、音声出力制御部216を介して音声出力装置104へ出力する。
これにより、表示装置105には利用者が選択したレベルに対応するシーンの開始位置からの動画が表示され、音声出力装置104には、当該シーンの開始位置からの音声が出力される。
以上説明した本実施例に係る映像記録再生装置によれば、利用者が所望のシーンの種類を指定して、そのシーンから動画データを再生することが可能となり、利用者にとってより好適な映像再生を実現することができる。
さらに、本実施例に係る映像記録再生装置によれば、上記の再生を実現するための動画データのインデックスデータの作成をともなう録画が可能となり、利用者にとってより好適な映像再生を行うための映像録画を実現することができる。
101・・・CPU、102・・・主記憶装置、104・・・音声出力装置、105・・・表示装置、106・・・指示入力装置、107・・・動画データ入力装置、109・・・バス、201・・・動画データ入力装置、202・・・文字情報抽出部、203・・・インデックスデータ生成部、204・・・シーン開始位置検出部、205・・・レベル設定部、206・・・提示用文字列設定部、207・・・インデックスデータ保持部、208・・・インデックスデータ取得部、209・・・ユーザ指定レベル情報取得部、212・・・シーン開始位置取得部、213・・・文字列提示制御部、214・・・シーン開始位置提示部、215・・・再生制御部、216・・・音声出力制御部、217・・・表示制御部、218・・・再生動画入力部、219・・・再生位置指定部