JP2006352631A - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2006352631A
JP2006352631A JP2005177646A JP2005177646A JP2006352631A JP 2006352631 A JP2006352631 A JP 2006352631A JP 2005177646 A JP2005177646 A JP 2005177646A JP 2005177646 A JP2005177646 A JP 2005177646A JP 2006352631 A JP2006352631 A JP 2006352631A
Authority
JP
Japan
Prior art keywords
data
image
recording
feature
monitor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005177646A
Other languages
English (en)
Inventor
Noboru Murabayashi
昇 村林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005177646A priority Critical patent/JP2006352631A/ja
Publication of JP2006352631A publication Critical patent/JP2006352631A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

【課題】画サイズの異なるそれぞれの画像から抽出される特徴の整合性を確保することができるようにする。
【解決手段】特徴抽出の対象とする画像の画サイズがモニタの画サイズと同じである場合、供給されてきた画像から直接特徴が抽出される。モニタの画サイズと異なることから、特徴抽出の対象とする画像がレターボックスが付加された画像である場合、付加された黒部分の領域を除いた、有効領域の画像データに基づいて、モニタの画サイズと同じ画サイズの画像が生成され、生成された画像を対象として特徴抽出が行われる。本発明は、複数の画サイズの画像を処理することが可能な情報処理装置に適用することができる。
【選択図】図37

Description

本発明は、情報処理装置および方法、並びにプログラムに関し、特に、画サイズの異なるそれぞれの画像から抽出される特徴の整合性を確保することができるようにする情報処理装置および方法、並びにプログラムに関する。
従来より、パーソナルコンピュータなどにおいては、データの記録媒体としてハードディスク(HDD(Hard Disk Drive))が用いられている。HDDは、その大容量化、低価格化、小型化が進んでいることなどから、近年、パーソナルコンピュータ以外にも、録画機器や携帯型の音楽再生機器などの各種の機器にも用いられている。
また、データの記録媒体として、HDDの他に、CD(Compact Disk)やDVD(Digital Versatile Disk)などの光ディスクも用いられており、近年は、従来よりあるDVDより、データの高速読み書き、大容量を実現した次世代光ディスクが提案されている。例えば、民生用機器を対象とした次世代光ディスクのフォーマットとして、Blu-ray Disc(商標)方式(以下、BDという)と、HD-DVD(High Definition DVD)(商標)方式(以下、HD-DVDという)が提案されている。
従来よりあるDVD(以下、通常DVDという)は両面記録、2層記録などが可能であり、DVD-ROMの場合、その記録容量は片面1層記録で4.7GB、片面2層記録で8.5GB、両面各1層記録で9.4GBである。これに対し、BDの記録容量は、片面記録で27GBとなっている。転送レートも36Mbpsと、通常DVDと較べて高速でのデータの読み出しが可能となっている。また、HD-DVDの記録容量は、片面単層15〜20GB、2層30〜40GBであり、これもまた通常DVDと較べて記録容量が大きい。
広く普及している通常DVDに対応した記録再生機器を、全て、BDやHD-DVDに対応した記録再生機器に短期間で置き換えることは困難であることから、近年、BDまたはHD-DVDでのデータの記録再生と、通常DVDでのデータの記録再生が可能な光ディスクも開発されている。
複数の記録方式に対応した光ディスクのうちのBDやHD-DVDに対応した記録層を用いることにより、通常DVDと較べて、高画質記録、長時間記録などが可能となる。
ここで、映像(画像)の記録方法として、例えば、複数の記録方式に対応した光ディスクのうちのBDやHD-DVDに対応した記録層と、通常DVDに対応した記録層のそれぞれに、同一の画像を記録する方法が考えられる。具体的には、高伝送レート、大容量といった特性を生かして、BDやHD-DVDに対応した記録層には伝送レートの高い、高画質モードで画像データを記録し、一方、通常DVDに対応した記録層には伝送レートの低い、通常画質モードで同じ画像データを記録することが考えられる。
このように、1枚の光ディスクに高画質モードと通常画質モードの放送番組や映画などを記録することによって、ユーザは、例えば、画質の悪さが比較的気にならない携帯型の再生機器では通常DVDのデータを再生し、家庭内の据え置き型の再生機器ではBDまたはHD-DVDのデータを再生したりすることができる。
再生方法としては、単に、記録された順に、時系列的に再生させるのではなく、ユーザが見たいと思うシーンを再生する方法や、重要と思われるシーン(キーフレーム)だけを再生(ダイジェスト再生)する方法の2つの方法が考えられる。これにより、ユーザは、例えば、続けて記録された連続ドラマやシリーズ番組をその記録順に全て視聴することなく、記録されたものの全体を知ることができる。
前者の特殊再生を実現するため、下記特許文献1および2には、記録されている画像の特徴データを用いて、類似するシーン毎に画像データを自動的に分類し、代表画をサムネイル表示することによって、ユーザに、再生位置を選択させる技術が開示されている。
一方、後者の特殊再生を実現するため、下記特許文献3には、記録されている画像の特徴データに基づいて重要区間を判定し、判定した重要区間だけを再生する技術が開示されている。
画像の特徴データを用いる処理としては、いわゆるチャプター点を特徴データに基づいて画像に設定することも考えられる。このようなチャプター点が設定された画像データを用いることによって、ユーザは、例えば、指定したチャプター点の範囲にある画像の切り出しやコピーなどの編集処理を行うことができる。
特開2002−44573号公報 特開2002−344852号公報 特開2003−219348号公報
ところで、複数の記録方式に対応した光ディスクを用いて、BDやHD-DVDに対応した記録層と通常DVDに対応した記録層にそれぞれ同一の画像を記録する場合、上述したような代表画のサムネイル表示、ダイジェスト再生、編集処理などを行うときに用いられる特徴データは、BDやHD-DVDに対応した記録層に記録された画像から得られる特徴データと、通常DVDに対応した記録層に記録された画像から得られる特徴データとで整合性を確保しておく必要がある。
特徴データは、例えば、画像に現れる特徴(例えば、画素値)などに基づいて抽出することによって、あるいは、画像を記録する際に、エンコードの対象となっているデータ全体から抽出された一部のデータを特徴データとすることによって得られる。このことから、同じ画像を対象とした場合であっても、記録方式が異なると、異なるデータが、記録方式が異なるそれぞれの画像の特徴データとして取得されることがある。
この場合、記録方式によって、チャプター点、キーフレームの位置などが異なり、BDやHD-DVDのデータの再生中に、チャプター点を指定してある区間の再生を指示した場合と、通常DVDのデータの再生中に、同じチャプター点を指定して同じ区間の再生を指示した場合とで、記録されている画像は同じであるにもかかわらず、再生位置が異なるものとなる。
異なるデータが特徴データとして取得される原因としては、例えば、BDやHD-DVDでは16:9の画面サイズで記録して、通常DVDでは4:3の画面サイズで記録するなどのように、画面サイズの違いがある。画面サイズが違うことにより同じ画像の信号であってもY,Cb,Crの信号特性が異なるものとなり、そのため、これらの信号に基づいて取得される特徴データが異なるものになることがある。
また、音声の特徴データについても、量子化ビット数、サンプリング周波数などの違い、5.1チャンネルサラウンド記録と2チャンネルステレオ記録などの違い、その他の要因から、同じ音声を対象とする場合でも、それから得られる特徴データが異なるものになることがある。
図1AおよびB、図2AおよびBは、それぞれ、特徴データの整合性について説明する図である。
図1Aに示されるストリームは通常DVD方式で記録された画像のストリームであり、図2Aに示されるストリームはBD方式(またはHD-DVD方式)で記録された画像のストリームである。画像の内容はいずれも同じものである。なお、図1AおよびB、並びに図2AおよびBにおいて、数字が付されている四角形はその1つが1シーン(所定の数のフレーム)を示す。
このようなストリームが記録されている状態で、通常DVD方式で記録された画像のストリームと、BD方式で記録された画像のストリームに基づいて特徴データの抽出処理が行われ、抽出処理の結果から、例えば、図1Bに示されるようにシーン3,7,13と、図2Bに示されるようにシーン5,8,15が、それぞれ特徴シーン(キーフレーム)として抽出されたものとする。
すなわち、記録されている画像の内容は同じであるにもかかわらず、特徴データに整合性がなく、異なるシーンが特徴シーンとして抽出されている。
ユーザは、特徴データに基づいて抽出された特徴シーンの代表画を見るなどして編集処理などを行うから、このように特徴データに整合性が確保されていない場合、編集処理の際に混乱してしまうおそれがある。
例えば、通常DVD方式で記録された画像のストリームと、BD方式で記録された画像のストリームから、同じ範囲のストリームをそれぞれ選択して他の記録媒体にコピーさせようとした場合、その編集処理の際に表示される代表画が異なるから、ユーザは、代表画の表示を見て、コピーさせようとする同じ範囲をそれぞれのストリームから正確に選択することができない。
また、ユーザによりダイジェスト再生が指示された場合、その再生位置は、特徴データに基づいて設定された特徴点の位置に従って行われるから、このように特徴データに整合性が確保されていない場合、通常DVD方式で記録された画像のストリームのダイジェスト再生を行う場合と、BD方式で記録された画像のストリームのダイジェスト再生を行う場合とで再生位置が異なり、違和感を感じることがある。
このように、内容が同じであるにもかかわらず特徴点の位置が異なり、これにより、ストリームを再生したときに再生位置が異なるものとなってしまうということは、画像の画サイズ(アスペクト比)と、その画像を表示させるモニタの画サイズの関係によっても起こりうる。
例えば、地上アナログ放送により画サイズが4:3の番組が放送されており、これと同じ内容の番組が、地上デジタル放送により画サイズが16:9のハイビジョン番組として放送されており、この双方の番組を4:3の画サイズのモニタに表示させた場合、例えば番組の出演者の顔が、地上アナログ放送の番組を表示させたときと、地上アナログ放送の番組を表示させたときとでモニタの所定の位置を基準として異なる位置に異なる大きさで表示され、このことが、それぞれの番組の画像から抽出される特徴量に差として現れることがある。
特徴量に差が生じた場合、上述した特徴点は特徴量に基づいて設定されるから、同じ内容の番組であるにもかかわらず、一方の番組では特徴点が設定された位置に他方の番組では設定されないなどのようなことが起こりうる。
本発明はこのような状況に鑑みてなされたものであり、画サイズの異なるそれぞれの画像から抽出される特徴の整合性を確保することができるようにするものである。
本発明の第1の側面は、処理対象の画像の画サイズがモニタの画サイズと異なる場合、処理対象の画像をモニタに表示したときに有効となる領域のデータに基づいて、モニタの画サイズと同じ画サイズの画像を生成する生成手段/ステップと、生成手段/ステップにより生成された画像から特徴を抽出する抽出手段/ステップとを含む情報処理装置、情報処理方法、またはプログラムである。
抽出手段には、さらに、処理対象の画像の画サイズがモニタの画サイズと同じである場合、処理対象の画像から第2の特徴を抽出させるようにすることができる。
抽出手段により抽出された第1の特徴を表すデータを、モニタの画サイズと異なる画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させるとともに、第2の特徴を表すデータを、モニタの画サイズと同じ画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させる記録制御手段をさらに設けることができる。
本発明の第1の側面においては、処理対象の画像の画サイズがモニタの画サイズと異なる場合、処理対象の画像をモニタに表示したときに有効となる領域のデータに基づいて、モニタの画サイズと同じ画サイズの画像が生成され、生成された画像から特徴が抽出される。
本発明の第2の側面は、処理対象の画像から特徴を抽出する抽出手段/ステップと、処理対象の画像の画サイズがモニタの画サイズと異なる場合、処理対象の画像のうちの特徴抽出に用いられた領域と、処理対象の画像をモニタに表示したときに有効となる領域のうちの、特徴抽出に用いられた領域に対応する領域との大きさの比に基づいて、モニタの画サイズと異なる画サイズの画像から抽出手段/ステップにより抽出された特徴を補正する補正手段/ステップとを含む情報処理装置、情報処理方法、またはプログラムである。
補正手段により補正された特徴を表すデータを、モニタの画サイズと異なる画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させるとともに、モニタの画サイズと同じ画サイズの画像から抽出手段により抽出された特徴を表すデータを、モニタの画サイズと同じ画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させる記録制御手段をさらに設けることができる。
本発明の第2の側面においては、処理対象の画像から特徴が抽出され、処理対象の画像の画サイズがモニタの画サイズと異なる場合、処理対象の画像のうちの特徴抽出に用いられた領域と、処理対象の画像をモニタに表示したときに有効となる領域のうちの、特徴抽出に用いられた領域に対応する領域との大きさの比に基づいて、モニタの画サイズと異なる画サイズの画像から抽出された特徴が補正される。
本発明の第3の側面は、処理対象の画像の画サイズがモニタの画サイズと異なる場合、処理対象の画像のうちの、処理対象の画像をモニタに表示したときに有効となる領域から特徴を抽出する抽出手段/ステップを含む情報処理装置、情報処理方法、またはプログラムである。
抽出手段には、さらに、処理対象の画像の画サイズがモニタの画サイズと同じである場合、処理対象の画像の全ての領域から第2の特徴を抽出させるようにすることができる。
抽出手段により抽出された第1の特徴を表すデータを、モニタの画サイズと異なる画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させるとともに、第2の特徴を表すデータを、モニタの画サイズと同じ画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させる記録制御手段をさらに設けるようにすることができる。
本発明の第3の側面においては、処理対象の画像の画サイズがモニタの画サイズと異なる場合、処理対象の画像のうちの、処理対象の画像をモニタに表示したときに有効となる領域から特徴が抽出される。
本発明によれば、画サイズの異なるそれぞれの画像から抽出される特徴、または特徴に基づいて設定される特徴点の整合性を確保することができる。
以下、本発明の実施の形態について図を参照して説明する。
ここでは、画像音声データ(画像音声ストリーム)の特徴の抽出処理を行い、抽出処理の結果から特徴データを検出し、検出した特徴データに基づいて所定のキーフレーム(重要点、重要位置)、特徴点を検出し、ダイジェスト再生(要約再生)動作、チャプター設定動作などの、特徴データを用いた動作を実現する場合について考える。
「発明が解決しようとする課題」の欄に記載した、同じ内容の画像音声データを異なる記録方式で取り込んだ場合に、特徴データに基づいて定まる特徴点の整合性を確保することができないという問題を解決する方法としては、例えば、
(1)1つの画像音声データのあるベースバンド帯域を対象として特徴抽出処理を行うことにより特徴データを検出し、その特徴データを、記録方式の異なる画像音声データ(異なる記録方式で取り込んだときに得られる複数の画像音声データ)間で共通に用いる方法
(2)記録方式の異なる複数の画像音声データのうちのいずれか1つの画像音声データを対象として特徴抽出処理を行うことにより特徴データを検出し、その特徴データを、記録方式の異なる画像音声データの間で共通に用いる方法
などが考えられる。
なお、本発明の実施の形態については、以下の順序で説明する。
(1)情報の記録態様について
(1.1)2記録方式の場合
(1.2)3以上の記録方式の場合
(2)情報の再生態様について
(3)特徴データ、特殊再生用データの記録態様について
(3.1)特徴データ
(3.2)特殊再生用データ
(3.3)記録態様
(3.3.1)画像音声データの内容が同じものである場合
(3.3.2)画像音声データの内容が違うものである場合
(3.4)他の記録態様(ICメモリ、ICタグに記録する場合)
(4)予約記録(予約録画、タイマー記録)モード時の動作
(5)記録側構成例
(6)特徴データを用いたダイジェスト再生およびチャプター処理
(6.1)特徴データを用いたダイジェスト再生
(6.2)特徴データを用いた自動チャプター処理
(7)全体構成
(7.1)記録側構成
(7.2)再生側構成
(7.2.1)通常再生モード動作
(7.2.2)ダイジェスト再生モード、チャプターモード
(7.2.2.1)プレイリストデータ、チャプターデータが記録されている場合
(7.2.2.2)プレイリストデータ、チャプターデータが記録されていない場合
(7.2.2.2.1)特徴データが記録されている場合
(7.2.2.2.2)特徴データが記録されていない場合
(8)他の全体構成
(8.1)記録側構成
(8.2)再生側構成
(9)特徴抽出処理
(9.1)音声系特徴抽出処理
(9.1.1)無音特徴抽出処理
(9.1.2)その他の音声特徴抽出処理
(9.2)画像系特徴処理
(9.2.1)シーンチェンジ特徴
(9.2.2)色特徴
(9.2.3)類似シーン特徴
(9.2.4)テロップ特徴
(10)大容量記録媒体と他の記録媒体を併用可能な場合の実施例
(10.1)記録可能な記録方式の判定方法
(10.2)記録方法
(10.2.1)記録媒体Aに記録方式1と記録方式2の双方のデータが記録されている場合
(10.2.2)記録媒体Aに記録方式1のデータのみが記録されている場合
(10.2.3)記録媒体Aに記録方式2のデータのみが記録されている場合
(11)記録方式1の複数の画像音声データを、記録方式2で記録する場合の実施例
(11.1)動作モード設定順序、動作順序
(12)記録容量が不足する場合の実施例
(12.1)2記録方式対応ディスクの場合
(12.2)記録レートの切り換え
(13)動作フローチャート
(14)その他の変形実施例
(14.1)画像信号を補間して特徴抽出処理を行う方法
(14.2)特徴データを補正する方法
(14.3)特徴抽出処理に用いる処理範囲を変更する方法
(14.4)動作フローチャート
(14.4.1)画像信号を補間して特徴抽出処理を行う方法の場合
(14.4.2)特徴データを補正する方法の場合
(14.4.3)特徴抽出処理の処理範囲を変更する方法の場合
(1)情報の記録態様について
はじめに、本発明の一実施形態に係る記録再生装置に着脱される記録媒体(光ディスク)におけるデータの記録態様について説明する。
(1.1)2記録方式の場合
ここで、2記録方式とは、例えば、通常DVD方式とBD方式といったように、異なる2つの記録方式で、データを1つの光ディスク(記録媒体)に記録する方式をいう。すなわち、本発明の一実施形態に係る記録再生装置において用いられる記録媒体には複数の層が設けられており、それぞれの層に異なる記録方式でデータを記録することができるようになされている。また、その複数の層から、異なる記録方式で記録されたデータを読み出し、再生することができるようになされている。
図3および図4は、2記録方式でのデータの記録の例を示す図である。
図3は、外部から供給されてきた1つのストリームが異なる2つの記録方式で記録される場合の例を示し、本発明を適用した記録再生装置におけるデータの記録方法を示すものである。
図4は、2つのストリームがそれぞれ異なる記録方式で記録される場合の例を示し、本発明を適用した記録再生装置におけるデータの記録方法と比較するものとして示すものである。
記録媒体1には、記録方式1のデータが記録される層である記録方式1層、記録方式2のデータが記録される層である記録方式2層が設けられている。例えば、記録方式1としては通常DVD方式が採用され、記録方式2としてはBD方式(またはHD-DVD方式)が採用される。この場合、記録方式1の転送レート(伝送レート、または記録レート)と記録方式2の転送レートを比較した場合、記録方式2の転送レートの方が高い。
図3に示すように、外部から供給されてきたストリーム1には、信号処理系2−1において信号処理方式1の信号処理が施され、処理結果のデータに対応するレーザがピックアップ3−1を介して照射されることによってストリーム1が記録媒体1の記録方式1層に記録される。また、ストリーム1には、信号処理系2−2において信号処理方式2の信号処理が施され、処理結果のデータに対応するレーザがピックアップ3−2を介して照射されることによってストリーム1が記録媒体1の記録方式2層に記録される。
一方、図4の例においては、外部から供給されてきたストリーム1は信号処理系2−1において信号処理方式1の信号処理が施された後、記録媒体1の記録方式1層に記録される。また、信号処理系2−1に供給されたものと異なるストリームであるストリーム2に対しては、信号処理系2−2において信号処理方式2の信号処理が施された後、記録媒体1の記録方式2層に記録される。
(1.2)3以上の記録方式の場合
この場合も、上述したように、記録方式1は通常DVD方式、記録方式2はBD方式(またはHD-DVD方式)とすることができる。また、記録方式3は通常CD方式とすることができる。この通常CD方式では、音声データの他に、静止画や画像なども記録される。
この場合、記録媒体1には、図3、図4に示される記録方式1層、記録方式2層の他、通常CD方式のデータが記録される層が設けられる。
なお、記録方式1として通常DVD方式、記録方式2としてHD-DVD方式、記録方式3としてBD方式を採用することもできる。また、さらに多くの層が記録媒体1に設けられる場合、記録方式1として通常DVD方式、記録方式2としてHD-DVD方式、記録方式3としてBD方式、記録方式4としてCD方式を採用し、4つの異なる記録方式でそれぞれの層にデータを記録するようにすることもできる。このように、記録媒体1においては、2以上の複数の記録方式でデータを記録させることができる。
(2)情報の再生態様について
図5は、記録媒体1に2記録方式で記録されたデータを再生する場合の例を示す図である。
記録方式1層に通常DVD方式で記録されたデータはピックアップ3−1を介して読み出され、信号処理系10−1において再生処理が行われる。得られた再生信号(画像信号、音声信号)は後段の構成に出力される。
また、記録方式2層にBD方式で記録されたデータはピックアップ3−2を介して読み出され、信号処理系10−2において再生処理が行われる。得られた再生信号(画像信号、音声信号)も後段の構成に出力される。
このように、記録媒体1からは、記録方式1で記録されたデータと、記録方式2で記録されたデータのうちの少なくともいずれかを選択的に再生することができるようになされている。
(3)特徴データ、特殊再生用データの記録態様について
はじめに、特徴データと特殊再生用データについて説明する。
(3.1)特徴データ
特徴データは、画像特徴データと音声特徴データに分類され、そのうちの画像特徴データには、テロップ特徴データ、カラー特徴データ、その他の特徴データが含まれる。また、音声特徴データには無音特徴データが含まれる。
例えば、画像特徴データのうちのテロップ特徴データは、テロップが表示されるフィールド(またはフレームなど)の位置情報と、テロップの特徴を表すDCT(Discrete Cosine Transform)のAC(Alternating current)係数データとの一対のデータなどとされる。これは、ストリームのある位置における特徴、特性を表すデータと考えられる。
なお、記録開始時刻、記録開始位置などが分かっている場合や、特徴データの順番などから、その特徴データがストリーム全体のどの位置の特徴データであるのかが分かる場合には、フィールドの位置情報は除かれ、DCTのAC係数などのデータのみが、特徴データとして記録媒体1に記録されるようにしてもよい。すなわち、この場合、特徴データは、記録開始位置を基準とした位置順に並べられたDCT係数データや、時系列順に並べられたDCT係数データとなる。
特徴データは、ストリーム中の重要位置を表すフレームであるキーフレームを検出する際などに用いられる。キーフレームの位置は、フィールド番号、フレーム番号、記録開始点からの時間、その他の位置情報で表され、これらの位置情報は、プレイリストデータとして後述する処理により生成される。すなわち、特徴データがあれば、プレイリストデータの生成が可能となる。特徴データに基づいて生成されたプレイリストデータは、ダイジェスト再生、チャプター処理の際に適宜用いられる。
このように、特徴データは、プレイリストデータを生成するためにも用いられるものであり、プレイリストデータがあれば、ダイジェスト再生、後述するチャプター処理が可能となるが、ユーザ自身でプレイリストデータを修正することも考えられることから、プレイリストデータの生成後には消去するのではなく、特徴データを、プレイリストデータとともに、記録媒体1や内蔵HDDなどの所定の記録媒体に残しておくようにしてもよい。
また、再生対象とするストリームが記録されている記録媒体に、そのストリームのプレイリストデータが記録されていないこともあることから、特徴データは、内蔵HDDなどの所定の記録媒体に残しておくようにしてもよい。例えば、過去に再生したことのあるストリームが記録されている記録媒体に、そのストリームのプレイリストデータが記録されていない場合、その、過去の再生ときに特徴データの検出やプレイリストデータの生成などが行われ、保持されていることにより、再度、同じストリームを再生するときに、保持されているプレイリストデータを用いてダイジェスト再生、チャプター処理などを行うことが可能となる。
特徴データの検出方法については後述する。
(3.2)特殊再生用データ
特殊再生用データは、プレイリストデータとチャプターデータからなり、例えば、特殊再生の際に用いられる特徴点(特徴位置)の位置情報である。プレイリストデータは、特徴データに基づく特徴点の検出処理により生成される。
ここで、特殊再生には、ストリーム全体のうちの特徴的なシーンだけを再生するダイジェスト再生、所定時間のシーンを所定間隔で再生するスキップ再生、ストリーム中の所定の位置に含まれる画面を静止画として表示(サムネイル表示を含む)すること、チャプターが設定された位置の画面を静止画として表示(サムネイル表示を含む)することなどの、ストリーム全体(または所定の範囲)を時系列順に再生する通常再生以外の再生方法が含まれる。
ダイジェスト再生モードで、キーフレーム区間だけを再生する場合には、キーフレーム区間の開始位置、終了位置をそれぞれ特徴点と考えることができ、それらの位置情報をプレイリストデータと考えることができる。また、キーフレーム区間の開始位置だけを特徴点と考えることもできる。
これらの特徴点のデータを用いた処理としては、例えば、放送番組の場面変化を見たい場合や、編集、記録した内容の概要を知りたい場合に、それらの特徴点が設定されたフレームをサムネイル表示するなどの処理に用いられる。
特徴点、キーフレーム位置としては、例えば、テロップの表示が開始された位置、あるシーンと類似するシーンの開始位置、CM区間の終了位置などとすることができる。
CM終了後の本編の開始位置やCM開始前の本編終了位置などは、CMの開始位置や終了位置から求めることができるから、別の観点から見れば、CM開始前の本編の終了位置(終了点)やCM終了後の本編の開始位置(開始点)、すなわち、番組本編の開始位置、終了位置をそれぞれ特徴点とすることもできる。
図6は、プレイリストデータをテキストデータとして表示した場合の例を示す図である。
図6に示されるような特徴点開始位置、特徴点終了位置を表すフィールド番号などのデータが、所定のファイル、またはデータそのものとして、HDDやディスクなどの所定の記録媒体に記録される。
当然、フィールド番号ではなく、例えば、フレーム番号や、プログラムの記録開始からの時間情報などの位置情報がプレイリストデータとして記録されるようにしてもよい。また、プレイリストデータとして、図6(a)列に示す特徴区間の最初の位置情報だけが記録されるようにしてもよい。
このようなプレイリストデータが、スキップ再生などの特殊再生モード時や、特徴点のサムネイル表示モード時などに用いられる。
図6において、(a)列のデータは特徴区間の開始位置を表す情報であり、(b)列のデータは特徴区間の終了位置を表す情報である。図6の例では、プレイリストデータに登録されている最初のデータにより特定される区間は100〜700フィールドの区間であり、この区間が特徴区間とされている。
例えば、ダイジェスト再生モードでは、図6(a)列と(b)列のデータから、それにより特定される区間だけの再生が行われ、ストリーム全体を時系列順に再生する場合に較べて、短時間で、ストリームの再生が行われることになる。図6の例の場合、100〜700フィールド、900〜1500フィールド、2000〜2600フィールド、・・・、5000〜5600フィールドの区間だけがスキップ再生され、それ以外の区間は再生されない。
また、サムネイル表示モードでは、図6(a)列のデータにより特定される位置の画像がサムネイル表示される。
(3.3)記録態様
図7は、2つの記録方式(記録方式1、記録方式2)のストリームが記録されている記録媒体1における特徴データ、特殊再生用データの記録態様を示す図である。
後述するように、特徴データ、特殊再生用データは必要に応じて記録媒体1に記録しないようにすることもできる。ここでも、記録方式1は通常DVD方式、記録方式2はBD方式である。
図7の(1)乃至(3)には、記録方式1層と記録方式2層に記録されているストリームの内容が同一内容である場合の組合せが示され、(4)には、違う内容である場合の組合せが示されている。
(3.3.1)画像音声データの内容が同じものである場合
図7(1)に示されるように、記録方式1層には特徴データ、特殊再生用データが記録され、一方、記録方式2層には記録されないようにすることができる。
BD方式、またはHD-DVD方式のデータの再生機能を有する装置は、一般的に、通常DVD方式の再生機能だけを有する装置に較べて、大容量データの再生を行うことができ、性能が高く、価格も高いものと考えられる。そのため、BD方式、またはHD-DVD方式の記録再生機能を有する装置は、通常DVD方式のデータの記録再生機能も付加的に搭載されている場合が多いと考えられ、このような装置の場合、図7(1)の組合せは有効な記録方法の1つと考えられる。
また、図7(2)に示されるように、記録方式1層には特徴データ、特殊再生用データが記録されずに、記録方式2層にだけ特徴データ、特殊再生用データが記録されるようにすることができる。
さらに、図7(3)に示されるように、記録方式1層と記録方式2層のいずれにも特徴データ、特殊再生用データが記録されるようにすることができる。この組合せの場合、どちらか一方の記録方式の再生機能しか有していない装置でも対応できる。
なお、同じストリームが2つの記録方式でそれぞれ記録されている、すなわち、記録されている映画の内容や番組内容が同じであり、かつ、図7(3)に示されるように、記録方式1層と記録方式2層の双方に特徴データ、特殊再生用データが記録される場合、それぞれのストリーム中の対応する位置(同じシーンの位置)に特徴点が設定され、それに基づいて行われるダイジェスト再生の再生区間が、一方の記録方式のストリームを再生したときと、他方の記録方式のストリームを再生したときとで整合性が確保されていることが好ましい。
例えば、内容が同じであるにもかかわらず、一方の記録方式のストリームをダイジェスト再生したときと、他方の記録方式のストリームをダイジェスト再生したときとで、再生される内容が異なる場合、ユーザは違和感を感じることになる。
図8は、特徴データとプレイリストデータの記録状態の例を示す図である。
図8(a)に示されるように、特徴データとプレイリストデータ(および後述するチャプターデータ)が記録媒体1に記録されるようにしたり、図8(b)に示されるように、特徴データは記録されずに、プレイリストデータだけが記録媒体1に記録されるようにすることができる。また、図8(c)に示されるように、特徴データだけが記録媒体1に記録され、プレイリストデータは記録されないようにすることができる。
さらに、図8(d)に示されるように、特徴データとプレイリストデータが記録媒体1に記録されないようにすることができる。図8(d)の組合せの場合、いまの状態では記録媒体1に記録されているストリームの特殊再生を行うことができないから、必要に応じて、後述するような特徴の抽出処理、プレイリストデータの作成処理が行われ、それに基づいて、特殊再生が行われる。
(3.3.2)画像音声データの内容が違うものである場合
この場合、図7(4)に示されるように、ストリームが違う内容である場合の図7(3)の組合せと同様に、記録方式1層と記録方式2層のいずれにも特徴データ、特殊再生用データが記録されるようにすることができる。
(3.4)他の記録態様(ICメモリ、ICタグに記録する場合)
以上のように、記録媒体1の記録方式1層や記録方式2層の所定の領域に記録されるのではなく、特徴データとプレイリストデータの記録態様としては次のようなものも考えられる。
図9AおよびBは、記録媒体1を上方(記録媒体1の表面に対して垂直方向)から見た図である。
図9Aは、記録媒体1の通常記録領域(例えば、フォーマットで推奨される記録領域)とは異なる領域である内周側の領域1Aに、特徴データとプレイリストデータが記録される場合の例を示している。当然、外周側に記録されるようにしてもよい。
図9Bは、記録媒体1の内周側のある位置にICメモリ1Bが埋め込まれており、それに、特徴データとプレイリストデータが記録される場合の例を示している。記録媒体1の外周側にICメモリ1Bが埋め込まれるようにすることもできる。例えば、このICメモリ1Bは、記録媒体1の製造の過程でICのパターンを所定の層に入れ込むことで記録媒体1に用意される。
なお、ICメモリ1Bに替えてICタグが用いられるようにしてもよい。この場合、記録媒体1の記録再生装置には、記録媒体1に設けられるICタグに対してデータを無線で書き込んだり、ICタグに記録されているデータを無線で読み出したりすることができるリーダライタが用意される。
図10は、記録方式1層、記録方式2層以外に、図9AおよびBに示すような特徴データ、特殊再生用データの他の記録領域(内側の領域1A、ICメモリ1B)が設けられている場合における特徴データ、特殊再生用データの記録態様を示す図である。
図10(1)乃至(6)は、記録方式1層と記録方式2層に記録されているストリームの内容が同一内容である場合の組合せを示し、図10(7)乃至(11)は、それらのストリームの内容が違う内容である場合の組合せを示す。
(4)予約記録(予約録画、タイマー記録)モード時の動作
ここで、ユーザによる設定に応じて、長時間番組を予約記録する場合の記録再生装置の動作について説明する。通常、ユーザはできるだけ高画質で記録したストリームを鑑賞したいと思うものと想定し、デフォルト設定(初期設定)では、できるだけ高画質で記録する、記録方式2の記録モードでストリームの記録が行われる。
高画質なハイビジョン番組を、高画質記録モードである記録方式2で記録方式2層の記録領域に記録している最中に、番組全体を記録するには、いま使用している記録方式2層の記録容量が不足することが自動的に検出されたとき、または、間もなく不足することが自動的に検出されたとき、装置により、他の記録方式である、例えば記録方式1に記録方式が切り換えられて、それ以降のデータの記録が行われる。
このとき、記録方式を切り換えて、他の記録層に継続して同じ番組(プログラム)を記録したことを示す所定の情報が、切り換え先の記録層である記録方式1層、または切り換え元の記録層である記録方式2層の所定の記録領域に記録される。
なお、ユーザが、記録モードの設定を変更することができるようにしてもよい。例えば、ユーザは、記録方式2(BD方式またはHD-DVD方式)で記録が行われるデフォルトの設定を、記録方式1(通常DVD方式)で記録が行われるように変更することができる。
(5)記録側構成例
図11および図12は、同じコンテンツを複数の記録方式で記録媒体1に記録する記録側の構成例を示すブロック図である。
図11は、入力されたストリーム(画像音声データ)から、直接、特徴の抽出を行い、抽出された特徴を表す特徴データを記録媒体1に記録させる構成を示す。
記録再生装置に入力されたストリームは記録方式1エンコード処理系21、記録方式2エンコード処理系22に供給され、そのそれぞれにおいて、記録方式に応じたエンコード処理が行われる。記録方式1エンコード処理系21によるエンコード結果は記録方式1記録信号処理系24に出力され、記録方式2エンコード処理系22によるエンコード結果は記録方式2記録信号処理系25に出力される。
また、記録再生装置に入力されたストリームは特徴データ信号処理系23にも供給され、特徴データ信号処理系23において、所定の画像特徴抽出処理により画像特徴データが、また、所定の音声特徴抽出処理により音声特徴データが、それぞれ検出される。検出された特徴データは、特徴データの他にプレイリストデータやチャプターデータも記録媒体1に記録させる場合(例えば、図8(a)の組合せでデータが記録される記録媒体1を得る場合)にはプレイリストデータ(チャプターデータ)信号処理系26に出力され、記録媒体1には特徴データだけを記録し、プレイリストデータやチャプターデータを記録しない場合(例えば、図8(c)の組合せでデータが記録される記録媒体1を得る場合)には記録方式1記録信号処理系24、記録方式2記録信号処理系25に出力される。
記録方式1記録信号処理系24においては、記録方式1層(図の層a、層b)に対して記録方式1エンコード処理系21から供給されてきた通常DVD方式のデータを記録させる通常DVD記録処理と、特徴データ信号処理系23やプレイリストデータ(チャプターデータ)信号処理系26から供給されてきたデータを、図7、図10の組合せで所定の記録層(位置)に記録させる処理とが行われる。
なお、図11において、層aは、記録媒体1の記録方式1層がDVD DL(Dual Layer)に対応したものである場合に設けられる層である。後述する図12等においても同様である。
記録方式2記録信号処理系25においては、記録方式2層に対して記録方式2エンコード処理系22から供給されてきたBD方式、またはHD-DVD方式のデータを記録させる記録処理と、特徴データ信号処理系23やプレイリストデータ(チャプターデータ)信号処理系26から供給されてきたデータを、図7、図10の組合せで所定の記録層(位置)に記録させる処理とが行われる。
図11において点線で示すメモリ系27は、例えば、記録方式1記録信号処理系24が、記録方式1エンコード処理系21から供給されてきたデータと、特徴データ信号処理系23により得られた特徴データ(あるいはプレイリストデータ(チャプターデータ)信号処理系26により得られたプレイリストデータ、チャプターデータ)を記録媒体1に同時に記録することができない場合に、特徴データ信号処理系23により得られたデータを一時的に保存しておくときに用いられる。
例えば、同時記録を行うことができないにもかかわらず、図7(3)に示すように、特徴データとプレイリストデータなどを各記録層にそれぞれ記録するとき、特徴データ信号処理系23やプレイリストデータ(チャプターデータ)信号処理系26により得られたデータはメモリ系27に一時的に記憶され、記録可能なタイミングで読み出される。
記録方式1エンコード処理系21によるエンコード結果から得られた特徴データを記録方式1のデータの特徴データとし、また、記録方式2エンコード処理系22によるエンコード結果から得られた特徴データを記録方式2のデータの特徴データとするのではなく、以上のように、1つのストリームから得られた特徴データやそれから得られたプレイリストデータなどを、記録方式1および2のデータの共通の特徴データ、プレイリストデータとして記録媒体1に記録することにより、記録方式1のデータの特徴データと、記録方式2のデータの特徴データの間で整合性が失われるといったことを防止することができる。
すなわち、共通の特徴データやそれから得られたプレイリストデータなどに基づいて、サムネイル表示や特殊再生が行われることにより、ストリーム中の、サムネイル画像の選択位置、特殊再生時の再生位置が、記録方式1のデータを対象とする場合と記録方式2のデータを対象とする場合とで異なるものとなることを防止することができ、それを見ているユーザに違和感を与えてしまうことを防止することができる。
図12は、記録方式1エンコード処理系21と記録方式2エンコード処理系22のうちの少なくともいずれかにおいて行われる処理の過程で得られたデータから特徴を抽出し、抽出された特徴を表す特徴データを、記録方式1のデータと記録方式2のデータの共通の特徴データとして記録媒体1に記録させる構成を示す。図11と対応する部分には同じ符号を付してある。
例えば、特徴抽出に用いるデータ(処理の過程で得られたデータ)は、エンコード方式をMPEG方式とした場合、DCT処理で得られるAC係数、DC係数などとされる。
記録方式1エンコード処理系21によるエンコード結果を、特徴抽出に用いるデータとし、抽出した特徴を表す特徴データ、あるいは、それから得られたプレイリストデータなどの特殊再生用データを、記録方式1、記録方式2のストリームの共通の特徴データ、特殊再生用データとする場合、記録方式1エンコード処理系21によるエンコード結果は特徴データ信号処理系23にも供給される。
特徴データ信号処理系23においては特徴抽出処理が行われ、得られた特徴データが記録方式1記録信号処理系24、記録方式2記録信号処理系25に供給され、記録媒体1の所定の記録位置に記録されるとともに、必要に応じてプレイリストデータ(チャプターデータ)信号処理系26にも供給される。プレイリストデータ(チャプターデータ)信号処理系26においては、特徴データ信号処理系23により得られた特徴データに基づくプレイリストデータなどの生成処理が行われ、得られたプレイリストデータが記録方式1記録信号処理系24、記録方式2記録信号処理系25に供給され、所定の記録位置に記録される。
上述したように、複数の記録層に同時記録を行うことができない場合、必要に応じて、特徴データ信号処理系23により得られた特徴データ(あるいはプレイリストデータ(チャプターデータ)信号処理系26により得られたプレイリストデータ、チャプターデータ)は、メモリ系27に一時的に記録され、所定のタイミングで読み出されて、記録媒体1の所定の記録位置に記録される。
なお、記録方式1エンコード処理系21によるエンコード結果に替えて、記録方式2エンコード処理系22によるエンコード結果を特徴抽出に用いるデータとし、抽出した特徴を表す特徴データ、あるいは、それから得られたプレイリストデータなどの特殊再生用データを、記録方式1、記録方式2のストリームの共通の特徴データ、特殊再生用データとする場合、図12に点線で示すように、記録方式2エンコード処理系22によるエンコード結果は特徴データ信号処理系23にも供給され、それ以降、上述したような、記録方式1エンコード処理系21によるエンコード結果を用いる場合と同様の処理が各系において行われる。
このように、記録方式1または2のうちのいずれか一方のエンコード結果(あるいは、エンコード処理の過程で得られたデータ)から得られた特徴データやそれから得られたプレイリストデータなどを、記録方式1および2のデータの共通の特徴データとすることによっても、記録方式1のデータの特徴データと、記録方式2のデータの特徴データの間で整合性が失われるといったことを防止することができる。
ここで、図11または図12に示す構成において、データを記録する順序を図13に示す。
図13(1)乃至(6)にそれぞれ示すように、記録層a→記録層b→記録層c、記録層a→記録層c→記録層b、記録層b→記録層c→記録層a、記録層b→記録層a→記録層c、記録層c→記録層b→記録層a、記録層c→記録層a→記録層bの順序でストリームや特徴データなどを記録することができる。
なお、記録層a,b,cに対する3層同時記録、またはいずれか2つの層に対する2層同時記録によってそれぞれのデータが記録されるようにしてもよい。
(6)特徴データを用いたダイジェスト再生およびチャプター処理
下記の動作概要に関係する信号処理については、適宜、ここでの項目の他に後の項目で詳細に説明する。
図14A乃至Gは、特徴データを用いたダイジェスト再生およびチャプター処理について説明する図である。はじめに、特徴データを用いたダイジェスト再生について説明する。
(6.1)特徴データを用いたダイジェスト再生
ここでは、図14Aに示すような画像音声データ系列があると想定する。この画像音声データ系列は、放送番組や映画ソフトその他のコンテンツであり、ハードディスク(HDD)や光磁気ディスク、大容量半導体メモリなどの所定の記録媒体から読み出され、再生処理に用いられるものとする。
特徴データを用いたダイジェスト再生には、
(a)特徴点の間(特徴位置)をスキップ再生する方法
(b)特徴点区間を再生する方法
(c)特徴データに基づいて所定の意味的構造区間を想定し、その意味的構造区間に基づ
いて再生する方法
などが含まれる。
上記方法(a)は、例えば、テレビCMの開始点、終了点を検出し、検出したテレビCMの開始点、終了点から求められる番組本編の開始点、終了点を特徴点とし、番組本編区間のみを再生する方法である。日本で放送されるテレビCMを考えた場合、15秒の整数倍の時間毎に無音区間を検出できるという特徴があることから、例えば、テレビCMの開始点、終了点の検出は、その特徴に基づいて行われる。
方法(b)は、例えば、テロップが表示されている区間を再生する方法である。ニュース番組などでは、重要な部分はテロップが表示されることが多いことから、これにより、重要と考えられる部分だけを再生することができる。
方法(c)は、例えば、ニュース番組の意味的構造として、「アナウンサーがニュースを読み上げている区間」を検出し、その区間を再生する方法である。ニュース番組の全体を見た場合、アナウンサーが出ているシーンが多いと想定でき、それぞれの画像を類似するシーン毎に分類した場合に出現頻度の多いシーン(条件1)で、話者音声区間(条件2)で、ニュース番組なのでテロップ表示(条件3)があると想定し、その3つの条件を満たす区間を検出することで、「アナウンサーがニュースを読み上げている区間」という意味的構造区間を検出することができる。
なお、このような意味的区間の検出処理を考えた場合に、3条件の全部を満たさない場合も考えられる。
そこで、検出処理において評価値(スコア)という概念を用いるようにしてもよい。例えば、評価値(条件を満たす程度を表す値)の最大を100とし、上記3条件をすべて満たす場合は満点(100)、2条件だけ満たす場合は評価値70、1条件だけ満たす場合は評価値30、というように所定の評価値設定処理を行い、設定された評価値が閾値を超える区間が意味的区間として選択され、その区間だけ再生させるようにすることもできる。
なお、評価値の設定の方法はこれに限らず、それぞれの条件に、特徴データに応じた重み付けがされ、その条件を満たすか否かで設定されるようにしてもよい。例えば、上記条件1(出現頻度の一番多いシーン)を満たす場合には評価値50、条件2(話者音声区間)を満たす場合には評価値20、条件3(テロップ表示区間)を満たす場合には評価値30、といったように、満たす条件に応じて異なる評価値が設定され、設定された評価値が閾値を超えるか否かに応じて、意味的区間として選択されるようにしてもよい。閾値が80として設定されている場合、少なくとも、条件1と条件3の2条件を満たす区間が、意味的区間として選択されることになる。
図14Bは、図14Aの画像音声データ系列において、所定の意味を設定し、シーンチェンジ、音声セグメントなどに応じて所定のビデオ構造(意味的ビデオ構造)に区切った区間の例を示すものである。
ここで、図14Cに示すように、図14Bの区間毎(所定の時間内に記録された区間、所定のプログラム区間などの区間毎)の所定評価値を設定する。この評価値は、キーフレーム区間を含む区間のように、全区間をみて重要と考えられる区間ほど、高い評価値(評価データ)が設定される。
すなわち、高い評価データが設定された区間だけが再生されることにより、その区間にはキーフレーム区間が含まれることから、全区間を再生しなくても、ユーザは番組の概要を把握したりすることができる。
図14Dは、評価値に基づく再生区間の例を示す図である。
この例においては、図14Aに示す画像音声データ系列のフレームf1〜f2,f4〜f5,f7〜f8の各区間が、その区間に設定された評価値がしきい値Th以上の区間とされており、この場合、図14Dに示すように、A1,A2,A3の各区間がスキップ再生されることでダイジェスト再生が実現される。
(6.2)特徴データを用いた自動チャプター処理
図14Eは、チャプター点の設定位置の例を示す図である。
例えば、上述したような、所定のキーフレームの先頭またはその近傍、および、そのキーフレームの区間の最後に続く(最後に接続する)、キーフレーム区間ではない区間の先頭またはその近傍にチャプター点が設定される。
図14Fは、チャプター点が自動設定されたフレームの例を示す図である。
図14Fの例においては、チャプターフレームf1,f4,f7は、それぞれキーフレーム区間A1,A2,A3の先頭(またはその近傍)にあるフレームであり、f3,f6,f9は、それぞれキーフレーム区間A1,A2,A3の後に続く、キーフレーム区間ではない区間B1,B2,B3の先頭(またはその近傍)にあるフレームである。
従来のDVD記録再生装置のいわゆる自動チャプター設定機能により設定される区切り点は、その点を編集操作の目安にする場合や、早送りフォワード再生(FF再生)、早送り逆再生(リワインド再生、REW再生)する場合に利用される。例えば、従来の自動チャプター設定機能では、5分間隔、10分間隔、15分間隔などのように、所定の時間間隔でチャプターが設定されるようになされており、このようなチャプターの設定処理によれば、図14Gに示すように、キーフレームと思われる位置の開始点にチャプター点を設定することができない場合がある。
また、従来のDVD記録再生装置においては、手動チャプター(マニュアルチャプター)処理という、ユーザ自身が所望する任意の位置にチャプター点を設定することができる機能もあるが、記録した、あるいは記録する番組(プログラム)を実際に見てチャプター点を設定することになるので、ユーザにとっては面倒な操作であり、効率的ではない。
しかし、本発明を適用した記録再生装置のように、特徴データを用いたチャプター点設定処理では、図14Eに示すように、キーフレーム区間の先頭、またはその近傍と、そのキーフレーム区間の最後に接続される(または最後に続く)、キーフレーム区間ではない区間の先頭またはその近傍に、チャプター点を適切に、かつ自動的に設定することができ、従来のチャプター処理と較べて、より効果的な(編集やダイジェスト再生にとって有効な)チャプター点の設定を行うことが可能になる。
図15は、チャプター点が自動設定されたフレーム(チャプターフレーム)の表示例を示す図である。
図15の例においては、図14Eに示すような位置に設定されたチャプター点に基づいて選択されたチャプター画像f1,f3,f4,f6,f7,f9が、画面の下方にサムネイル表示されている。
ユーザは、図15に示すような画面を見て、例えば、記録再生装置の内蔵記録媒体であるハードディスクに記録された放送番組を対象として、図14Dのキーフレーム区間A1,A2,A3を切り出し、その区間のデータを、記録媒体1などのディスク記録媒体に記録させたり、チャプター画像f1,f4,f7から、それに続く所定の区間だけをスキップ再生させたりすることができる。
(7)全体構成
図16は、図11または図12の記録側の構成を含む、記録再生装置全体の構成例を示すブロック図である。
ここでは、記録対象の画像音声データは放送番組のデータとし、その放送番組のデータに対してはMPEG(Moving Picture Exports Group)に準拠した圧縮処理が施されるものとする。なお、その他の圧縮処理としてウェーブレット変換、フラクタル解析処理などを用いることも可能である。例えば、下記の説明において、画像データのDCT係数は、ウェーブレット変換の場合には多重解像度解析における解析係数などに相当し、同様の信号処理を行うことも考えられる。
なお、図16において、音声エンコード処理系44と画像エンコード処理系49を併せた1つの構成は図11の記録方式1エンコード処理系21、記録方式2エンコード処理系22のそれぞれに対応し、記録処理系46は図11の記録方式1記録信号処理系24、記録方式2記録信号処理系25にそれぞれ対応する。また、特徴抽出処理系50は図11の特徴データ信号処理系23に対応し、メモリ系51は図11のメモリ系27に対応し、プレイリストデータ(チャプターデータ)生成処理系59は図11のプレイリストデータ(チャプターデータ)信号処理系26に対応する。さらに、記録媒体63(記録媒体B)は上述した記録媒体1に対応する。記録媒体47(記録媒体A)は例えば内蔵のHDDである。
(7.1)記録側構成
受信アンテナ系41と受信系42により所定の放送番組が受信され、音声信号は音声A/D変換処理系43で所定のサンプリング周波数、所定の量子化ビット数でA/D変換処理が行われ、得られた音声データが音声エンコード処理系44に入力される。
音声エンコード処理系44では、例えばMPEGオーディオやAC3オーディオ(ドルビーAC3、またはAudio Code number 3)などの所定の帯域圧縮方式で信号処理が行われる。
同様に、受信された放送番組の画像信号は画像A/D変換処理系48で所定のサンプリング周波数、所定の量子化ビット数でA/D変換処理が行われ、得られた画像データは画像エンコード処理系49に入力される。
画像エンコード処理系49では、MPEGビデオやウェーブレット変換などの所定の帯域圧縮方式で信号処理が行われる。
音声信号の特徴抽出を行うため、音声A/D変換処理系43から音声エンコード処理系44に入力される信号の一部、または、音声エンコード処理系44によるエンコード処理の過程で得られる信号の一部は特徴抽出処理系50に適宜入力される。
同様に、画像信号の特徴抽出を行うため、画像A/D変換処理系48から画像エンコード処理系49に入力される信号の一部、または、画像エンコード処理系49によるエンコード処理の過程で得られる信号の一部も特徴抽出処理系50に適宜入力される。
特徴抽出処理系50においては、例えば、放送番組の記録時に、所定区間毎に特徴データの抽出が順次行われる。抽出された特徴データは、所定のエンコード処理が施された画像音声データとともに記録媒体Aの所定の記録領域に記録される。また、特徴抽出処理系50により生成された特徴データは、適宜、システムコントローラ系60を介してプレイリストデータ(チャプターデータ)生成処理系59に供給される。
プレイリストデータ(チャプターデータ)生成処理系59においては、特徴データから、ダイジェスト再生を行うためのプレイリストデータ、またはチャプターデータの生成が行われる。
ここで、プレイリストデータ(チャプターデータ)生成処理系59により行われるプレイリストデータ、チャプターデータ生成の信号処理プロセス(信号処理過程)について説明する。信号処理プロセスには以下のようなものが考えられる。
(a)特徴データをメモリ系51、またはシステムコントローラ系60のメモリ領域に所定の量だけ蓄積した後、蓄積した特徴データに基づいてプレイリストデータ、チャプターデータ生成処理を行う。
(b)特徴抽出処理を行う毎に、それにより得られた特徴データを画像音声データとともに記録媒体Aに逐次記録し、所定の量だけ記録させた後、その記録媒体Aに記録させた特徴データを読み出して(再生して)、読み出した特徴データに基づいてプレイリストデータ、チャプターデータ生成処理を行う。
上記(a)の場合、例えば、所定時間tの放送番組を記録することを考えると、放送番組の記録開始から時間tだけ経過した時点で、その放送番組のすべての特徴データが集積されるので、このとき、時間tのなかで、ダイジェスト再生時間tdに対応するキーフレームがどこになるかを決める、プレイリストデータ生成処理を行うことができる。すなわち、この、時間tに得られる特徴データが、メモリ系51、またはシステムコントローラ系60のメモリ領域に蓄積されることになる。
一方、上記(b)の場合、上記(a)の場合と同様に、放送番組の記録開始から時間tが経過するまでの間、記録媒体Aに対する特徴データの記録が行われ、時間tが経過したことが検出されたとき、それまでに記録媒体Aに記録された特徴データが読み出されて、ダイジェスト再生時間tdに応じたプレイリストデータ生成処理が開始される。
プレイリストデータ生成処理が終了したとき、ダイジェスト再生を行う準備ができたことになる。
以上のようにして生成されたプレイリストデータは記録処理系46に供給され、所定の処理が施された後、記録媒体Aの所定の記録領域に記録される。
ここで、プレイリストデータは、図6を参照して説明したように、例えば、区間毎の再生開始フレーム番号と再生終了フレーム番号の対のデータである。プレイリストデータは、記録された画像音声データ(プログラム)全体のうちの所定の区間だけをスキップ再生することによってダイジェスト再生を実現するために使用するものであるから、このようなフレーム番号のデータの他に、タイムコードや、MPEGにおけるPTS(Presentation Time Stamp)、DTS(Decode Time Stamp)などのタイムスタンプにより表されるようにしてもよい。
(7.2)再生側構成
(7.2.1)通常再生モード動作
はじめに、通常再生モードが設定されているときの動作について説明する。ユーザ入力I/F系61からの出力により、記録再生装置のモードが通常再生モードとして設定されたとき、例えば記録媒体Aから、所定の画像音声データ、特徴データなどが読み出され、再生処理系52に供給されて所定の再生処理が行われる。再生処理により得られたデータは再生データ分離処理系53に出力される。
再生データ分離処理系53においては、画像音声データを画像データと音声データに分離する処理が行われ、その処理により得られた音声データは音声デコード処理系54に、画像データは画像デコード処理系56にそれぞれ出力される。
音声デコード処理系54においては、再生データ分離処理系53から供給されてきた音声データに対して、記録時に帯域圧縮処理された信号処理方式に対応する所定のデコード処理が行われ、デコード結果に対して音声D/A変換処理系55においてD/A変換処理が施されることによって得られた音声信号が外部に出力される。
同様に、画像デコード処理系56においては、再生データ分離処理系53から供給されてきた画像データに対して、記録時に帯域圧縮処理された信号処理方式に対応する所定のデコード処理が行われ、デコード結果に対して画像D/A変換処理系57においてD/A変換処理が施されることによって得られた画像信号が外部に出力される。
(7.2.2)ダイジェスト再生モード、チャプターモード
ダイジェスト再生モード時やチャプターモード時、画像音声データと共に、特徴データ、プレイリストデータ、チャプターデータが記録媒体に記録されているかどうかで信号処理方法が異なる。特徴データとプレイリストデータが記録媒体に記録されているかどうかは、図8のように整理することができる。
(7.2.2.1)プレイリストデータ、チャプターデータが記録されている場合
図8(a)、(b)の場合に相当し、プレイリストデータ、チャプターデータが記録媒体Aや記録媒体Bに記録されており、それらのデータを用いて、ダイジェスト再生モード時にはダイジェスト再生を、チャプター表示モード時にはチャプター画像のサムネイル表示を、それぞれ行うことができる。
例えば、ユーザ操作に応じて、ユーザ入力I/F系61からシステムコントローラ系60にダイジェスト再生モードでの動作を行うことを指示するコマンドが供給された場合、特徴データ、プレイリストデータ、チャプターデータなどが、再生対象の画像音声データとともに記録媒体Aに記録されているときには、それらのデータが再生データ分離処理系53により分離され、分離された特徴データ、プレイリストデータ、チャプターデータがシステムコントローラ系60に入力される。
システムコントローラ系60においては、再生処理系52等に対する制御が行われ、プレイリストデータに基づくスキップ再生が行われることでダイジェスト再生が実現される。また、チャプターデータに基づいて、チャプター点、またはその近傍における画像をサムネイル画像として表示処理系65により表示させる処理が行われ、これにより、サムネイル画像の表示が実現される。
なお、再生データ分離処理系53で、特徴データ、プレイリストデータ、チャプターデータを分離することができない場合には、それぞれのデータはシステムコントローラ系60に入力されないので、再生データ分離処理系53とシステムコントローラ系60は、特徴データ、プレイリストデータ、チャプターデータなどが、記録媒体Aに記録されているかどうかの判定機能を有することになる。
(7.2.2.2)プレイリストデータ、チャプターデータが記録されていない場合
図8(c)、(d)の場合に相当し、プレイリストデータ、チャプターデータが記録媒体A、または記録媒体Bに記録されておらず、いまの状態では、ダイジェスト再生モード時に記録媒体A,Bに記録されている画像音声データのダイジェスト再生処理を行うことができず、また、チャプターモード時に、サムネイル画像の表示やチャプター再生(チャプター画像の位置を基準として所定の時間だけ再生すること)などの一連のチャプター関連処理を行うことができない。
この状態は、放送番組などを受信することによって得られた画像音声データを再生対象とするのではなく、例えば、記録媒体Bがパッケージ販売される映画などのDVDソフトであり、それを再生する場合や、その他の、特徴を抽出していない画像音声データを再生する場合などに起こりうる。
プレイリストデータ、またはチャプターデータが生成されておらず、再生することができない場合、プレイリストデータやチャプターデータの生成が行われ、生成されたプレイリストデータやチャプターデータを用いて、上述した、ダイジェスト再生処理やチャプター関連処理が行われる。生成されたプレイリストデータやチャプターデータは、適宜、画像音声データと同じ記録媒体に記録される。
また、再生されたプレイリストデータ、チャプターデータを生成し直したい場合も同様に、再生された特徴データからダイジェスト再生用のプレイリストデータ、およびチャプター関連処理用のチャプターデータが生成される。
(7.2.2.2.1)特徴データが記録されている場合
図8(c)の場合に相当し、画像音声データの記録時に特徴抽出処理だけが行われており(プレイリストデータ、チャプターデータの生成処理は行われておらず)、特徴データを再生することができる場合、再生処理系52から、または再生データ分離処理系53から、特徴データがプレイリストデータ(チャプター)生成処理系59に入力され、プレイリストデータ(チャプターデータ)生成処理系59において、プレイリストデータ、またはチャプターデータの生成が行われる。
このように、特徴データだけが再生できる場合において、ユーザがダイジェスト再生モードを指示したとき、図17Aに示されるような、プレイリストデータやチャプターデータがないことを示すメッセージが表示処理系65により表示されるようにしてもよい。また、プレイリストデータやチャプターデータが生成されたとき、図17Bに示すようなメッセージが表示処理系65により表示されるようにしてもよい。
生成されたプレイリストデータはシステムコントローラ系60に入力され、ユーザ操作による所定のダイジェスト再生時間に応じたプレイリストデータに基づいて、所定の区間をスキップ再生するように再生制御系58に対する制御がシステムコントローラ系60により行われ、再生制御系58により記録媒体Aからデータが再生される。
また、生成されたチャプターデータはシステムコントローラ系60に入力され、ユーザ操作による所定のチャプター関連動作モードに応じて、チャプターデータに基づく所定のチャプター点が設定された画像のサムネイル表示、チャプター点のカットや接続などの編集処理、ユーザにより選択されたチャプター点のスキップ再生など、所定のチャプター関連動作を行うように再生制御系58に対する制御がシステムコントローラ系60により行われたり、表示処理系65に対する制御が行われたりする。
例えば、記録媒体Bに記録されている画像音声データをダイジェスト再生する場合にも上述したものと同様の処理が行われ、再生制御系58により記録媒体Bからのデータの再生が制御されることによりダイジェスト再生処理が実現される。また、チャプターデータを用いた編集処理(編集操作)、チャプター点間(またはその近傍)のスキップ再生、チャプター点(またはその近傍)のサムネイル画像の表示などのチャプター関連動作を行う場合にも、上述したものと同様の処理が行われ、再生制御系58により記録媒体Bからのデータの再生が制御されることによりそれらのチャプター関連動作が実現される。
(7.2.2.2.2)特徴データが記録されていない場合
図8(d)の場合に相当する。上述した例では特徴データからプレイリストデータ、チャプターデータを生成する場合について説明したが、例えば、他のユーザが記録媒体Bに記録させた画像音声データを、記録媒体Aにコピーしたような場合を考えると、記録媒体Aからは、その画像音声データの再生はできるが、特徴データを再生することができない場合も想定できる。
このように、記録媒体Aに放送番組などの画像音声データは記録されているが、特徴データが記録されておらず、再生することができない場合において、ユーザがダイジェスト再生モードまたはチャプター関連動作モードを指示したとき、図18Aに示されるような、特徴データがないことを示すメッセージが表示処理系65により表示されるようにしてもよい。
この状態において、記録媒体Aに記録されている画像音声データをダイジェスト再生モードで再生する場合、再生処理系52により再生されたデータは再生データ分離処理系53に入力され、再生データ分離処理系53により分離された画像データと音声データは特徴抽出処理系50に入力される。特徴抽出処理系50においては、画像の特徴データであるDCTのDC係数、AC係数、動きベクトル(モーションベクトル)などを検出する処理、音声の特徴データである音声パワーを検出する処理などが行われる。
特徴抽出処理系50においてはさらに、上述したような各種の画像音声特徴データに基づいて、テロップ特徴データ(テロップ区間判定データ)、人物特徴データ、その他の画像特徴データ(画像特徴区間判定データ)、および、話者音声特徴データ(話者音声判定データ)、拍手歓声特徴データ(拍手歓声判定データ)、その他の音声特徴データ(音声特徴区間判定データ)の抽出処理が必要に応じて行われる。
特徴抽出処理系50により取得された各種の画像特徴データ、および音声特徴データはシステムコントローラ系60に順次入力される。所定番組、あるいは所定の画像音声区間のすべてを対象として特徴抽出処理系50により特徴抽出処理が行われたとき、特徴抽出処理が終了したと判定される。
ここで、特徴抽出処理中である場合、システムコントローラ系60から、そのことを表す信号が表示処理系65に入力され、表示処理系65により、例えば、図18Bに示すようなメッセージが表示されるようにしてもよい。同様に、特徴抽出処理が終了した場合、表示処理系65により、例えば、図18Cに示すようなメッセージが表示されるようにしてもよい。
次に、以上のようにして取得された特徴データから、プレイリストデータ、チャプターデータを生成する処理について説明する。
特徴抽出処理系50により抽出された特徴データは、例えば、対象とする所定の区間から抽出されたデータ毎にメモリ系51に一時的に蓄積され、すべての区間を対象とした特徴データの抽出が終了したとき、プレイリストデータ(チャプターデータ)生成処理系59に入力され、それに基づいて、プレイリストデータまたはチャプターデータの生成が行われる。
ここで、特徴抽出処理系50から、直接、プレイリストデータ(チャプターデータ)生成処理系59に、所定の区間から抽出された特徴データが逐次入力されるようにしても良く、上述したように、全ての区間を対象とした特徴データの抽出が終了したときに出力されるシステムコントローラ系60からの信号により、プレイリストデータ(チャプターデータ)生成処理系59において、プレイリストデータ、またはチャプターデータの生成が開始されるようにしてもよい。また、特徴抽出処理系50により抽出された特徴データは、システムコントローラ系60を介してプレイリストデータ(チャプターデータ)生成処理系59に入力されるようにしてもよい。
プレイリストデータ(チャプターデータ)生成処理系59で、プレイリストデータ、またはチャプターデータの生成が終了すると、そのことを示す信号がプレイリストデータ(チャプターデータ)生成処理系59からシステムコントローラ系60に入力され、その後、ユーザが要求する時間に応じたダイジェスト再生や、ユーザが要求するチャプター関連動作が行われる。
プレイリストデータ、またはチャプターデータの生成が終了した場合、図17Bに示したような表示が行われたり、生成されたプレイリストデータ、またはチャプターデータに基づいて処理が行われている場合、いまのモードが、ダイジェスト再生モード、チャプター関連動作モードであることを表すメッセージが表示処理系65により表示されるようにしてもよい。
ユーザがダイジェスト再生を行う場合に、例えば、記録した放送番組が1時間であったとし、それを30分で要約して再生したいのか、20分で要約して再生したいのかなど、ユーザの所望するダイジェスト再生時間は分からないので、記録した放送番組などの画像音声データの特徴抽出した全区間の全時間長に応じて、あらかじめ、何種類かの要約時間に対応するプレイリストデータを生成しておくようにすることもできる。
具体的には、放送番組の記録時間が1時間であったら、40分、30分、20分のダイジェスト再生を行うときに用いられる、それぞれのプレイリストデータが生成される。このように、複数種類のプレイリストデータが生成されるようにすることにより、リモコン62(リモートコントローラ62)などに対するユーザ入力により時間が選択された場合に、すぐに、その選択された時間に対応したダイジェスト再生動作を行うことが可能になる。
記録媒体Bに記録されている画像音声データを再生する場合、記録媒体処理系64により記録媒体Bが検出され、検出された記録媒体Bに記録されている画像音声データの再生が再生処理系52により行われる。再生データ分離処理系53においては、再生処理系52により再生されたデータから、画像データと音声データを分離する処理が行われる。その後の処理は、上述したような、記録媒体Aに記録されている画像音声データを再生する場合と同様であり、その詳細な説明は省略する。
(8)他の全体構成例
図19は、記録再生装置の他の構成例を示すブロック図である。図16と同じ部分には同じ符号を付してある。重複する説明については適宜省略する。
(8.1)記録側構成
図19の記録再生装置は、データ記録時の特徴データの抽出処理、およびプレイリストデータ、チャプターデータの生成処理が、システムコントローラ系60によりソフトウェア的に行われる点が図16の記録再生装置と異なる。
また、この図19の記録再生装置では、インターネットなどよりなるネットワーク系72を介してダウンロードされたソフトウェアがシステムコントローラ系60により実行され、特徴抽出処理、プレイリストデータ、チャプターデータの生成処理が適宜行われる。
ソフトウェアをダウンロードすることができるようにすることにより、例えば、特徴抽出処理、プレイリストデータ、チャプターデータの生成処理を実現する機能が搭載されていない装置がはじめにあった場合に、時間をおいて、後から、そのような機能を追加することができるという利点がある。これにより、設計、製造の側では、製造販売などの時間的な問題から、特徴抽出処理、プレイリストデータ、チャプターデータの生成処理を実現する機能を搭載させることが間に合わない場合などには、そのような機能を搭載しない簡単な構成のシステム(記録再生装置)を提供した後で、それらの機能を追加してユーザに提供することができる。
一方、ユーザ側では、そのような機能を搭載しない簡単な構成のシステムを購入した後で、ソフトウェア的な処理で機能を追加することができる。また、各処理系を修正、改良する場合などにも、ソフトウェアをダウンロードすることによって(アップグレードすることによって)、それに対応することができる。
このようなソフトウェアのダウンロードを行う場合、ユーザは、リモコン62などを操作してインターネット上のサイトにネットワーク系72を介して接続し、それを行う。ダウンロードされたソフトウェアは、システムコントローラ系60により解凍処理されることによって取得され、それがインストールされることにより機能の追加が実現される。
システムコントローラ系60を構成する所定の性能を備えたマイクロプロセッサ(MPU、またはCPU)を用い、それにソフトウェアを実行させることで、上述したような所定の特徴抽出処理などを、画像音声データの記録処理と同時に行わせるようにすることができる。また、メモリ系51として、このシステムコントローラ系60を構成する、内蔵のデータ記憶メモリが用いられるようにしてもよい。
なお、記録処理として所定の方式の帯域圧縮を行う場合、所定の性能を備えたMPU、CPU、またはDSP(Digital Signal Processor)によりそれを行わせることも考えられ、この帯域圧縮処理を行うものと同じMPU、CPU、またはDSPにより、特徴抽出処理、プレイリストデータ、チャプターデータの生成処理なども行わせるようにしてもよい。
(8.2)再生側構成
上述した、図16の場合と同様であるため、再生側の構成により行われる処理の詳細については省略する。図16の構成例と異なるのは、再生モード時に特徴データを検出することができず、特徴抽出処理を行う必要がある場合に、その一連の特徴抽出処理を、システムコントローラ系60においてソフトウェア的に行うことである。
例えば、記録時の処理と同様に、再生時の処理をも、システムコントローラ系60を構成するMPU、CPUなどにソフトウェア的に行わせることにより、再生時の特徴抽出処理や、プレイリストデータ、チャプターデータの生成処理を、再生処理と同時に行わせることができる。
(9)特徴抽出処理
次に、音声系特徴抽出処理、および画像系特徴抽出処理の詳細について説明する。
(9.1)音声系特徴抽出処理
(9.1.1)無音特徴抽出処理
図20は、音声系の特徴抽出を行う構成の例を示すブロック図である。
図20において、MPEG方式で圧縮された画像音声データ(ストリームデータ)がストリーム分離系100に入力され、ストリーム分離系100により分離された音声データは音声データデコード系101に入力されて、所定のデコード処理が行われる。
デコードされた音声データ(音声信号)はレベル処理系102、データカウンタ系103、データバッファ系104に各々入力される。レベル処理系102では、音声データの所定区間の平均パワー(または平均レベル)Pavを演算するため、データの絶対値化処理が行われ、データカウンタ系103で、所定のサンプル数のデータが計測されるまで、音声データ積算処理系105で積算処理が行われる。
ここで、Pavは、音声データの値(レベル)をAd(n)(nは平均を求める区間の位置を表す)として下式(1)により求められる。
Figure 2006352631
平均レベルを演算する所定区間として、例えば、約0.01sec(10msec)〜1secが考えられ、サンプリング周波数FsをFs=48KHzとすると、480〜48000サンプルの積算演算が行われ、サンプル数Smで平均処理が行われて平均レベル(平均パワー)Pavが求められる。
音声データ積算処理系105から出力された平均レベルPavは、判定処理系106に入力され、しきい値設定系107により設定されたしきい値Athと比較処理されて、その平均レベルPavが求められた区間が、無音区間であるか否かの判定処理が行われる。
ここで、しきい値設定系107によるしきい値Athの設定において、Athは固定値Ath0として設定することが考えられるが、固定値Ath0の他に、音声区間の平均レベルに応じた、変動しきい値Athmを設定することも考えられる。
変動しきい値Athmとしては、例えば、処理を考えている区間をnとし、それより前の区間(n-k)の平均レベルPav(n-k)を考え、下式(2)により表される値を用いることが考えられる。
Figure 2006352631
例えば、t=2とすると、変動しきい値Athmは下式(3)で表され、
Figure 2006352631
mは、おおよそ、20〜2くらいの範囲から設定することが考えられる。
(9.1.2)その他の音声特徴抽出処理
データバッファ系104に蓄積された音声データは周波数解析処理系108に入力され、周波数解析処理系108により所定の周波数解析処理が行われる。
ここで、周波数解析処理としてFFT(高速フーリエ変換)などが考えられ、データバッファ系104からのデータの解析サンプルデータ数は、例えば、512,1024,2048、その他、など2のべき乗の所定のサンプル数とされる。
周波数解析処理系108による解析結果を表すデータは判定処理系109に入力され、判定処理系109により所定の判定処理が行われる。
判別対象としている区間が音楽(楽音)の区間であるか否かは、例えば、所定の周波数帯域のスペクトルピークの継続性に基づいて判別することができる。この判別については、例えば、特開2002−116784号公報に開示されている。
判別対象としている区間が話者音声の区間であるか否かは、人の会話音声波形には息継ぎの区間があるので、波形に急峻な対上がり、または立下り区間が見られ、その立ち上がり、または立下り区間を検出することで判別することができる。この場合、音楽信号波形には、話者音声の信号波形に比べて、一般的に、波形の立ち上がり、または立下り区間が現れる確率は小さいと考えられるので、この楽音波形の特性(特徴)も考慮して、総合的に、音声信号の属性判定が行われるようにしてもよい。
また、話者音声信号の波形特徴(波形特性)、音楽信号の波形特徴の相違から音声信号の属性判定を行う場合、波形における時間的な物理特性を検出することになるので、上述したような周波数解析を行ってから、判定処理を行う方法(周波数領域での信号解析、判定処理)の他に、ベースバンド領域で判定処理を行う方法(時間領域での信号解析、判定処理)も考えられる。
図21は、音声信号(音声データ)にデコード処理を施すことなく、圧縮されたままで、信号の属性解析を行う場合の構成例を示す図である。図20と同じ部分には同じ符号を付してある。
MPEG方式で圧縮された画像音声データがストリーム分離系100に入力され、画像音声データが、ストリーム分離系100により画像データと音声データに分離される。分離された音声データはストリームデータ解析系110に入力され、所定のサンプリング周波数、量子化ビット数での信号解析処理が行われ、得られた音声データがサブバンド解析処理系111に入力される。
サブバンド解析処理系111においてはサブバンド解析処理が行われ、所定のサブバンド帯域のデータに対して上式(1)乃至(3)で表されるものと同様の所定信号処理が行われる。
すなわち、サブバンド解析処理系111によるサブバンド解析処理の結果は、音声データ積算処理系105に入力され、データカウンタ系103で所定のサンプリング数のデータが検出されるまで、所定の積算処理が音声データ積算処理系105により行われる。また、その後、しきい値設定系107により設定される所定のしきい値に基づいて、いまの判別対象としている区間が無音区間であるか否かを判定する処理が判定処理系106により行われる。
ここでの無音判定処理では、音声データのスペクトルを考慮してエネルギーが多く集まっている帯域である、おおよそ3KHz以下のサブバンド帯域のデータを用いることが考えられる。
また、周波数解析により楽音、話者音声の判定処理を行うことについて述べたが、図21の構成によれば、サブバンド解析系111により周波数解析が行われたものと考えられるので、上述したような所定スペクトルピークの継続性判定処理により属性判定が行われるようにしてもよい。この場合、スペクトルピークは、各サブバンド帯域の中の最大データ帯域と考えることができ、FFT解析処理の場合と同様の信号処理を行うことができるものと考えられる。
(9.2)画像系特徴処理
次に、画像系特徴抽出処理について説明する。図22は、画像系の特徴抽出を行う構成の例を示すブロック図である。
図22において、例えば、ストリーム分離系(図示せず)で所定の分離処理が行われることによって得られた画像データは、ストリームデータ解析系200に入力され、レート検出、画素数検出などの所定のデータ解析が行われ、その解析結果がDCT係数処理系201に出力される。
DCT係数処理系201においては、DCTのDC係数検出、AC係数検出などの所定のDCT演算処理(逆DCT演算処理)が行われ、その処理結果に基づいて、後段の各処理系により画像特徴抽出処理が行われる。
(9.2.1)シーンチェンジ特徴
シーンチェンジ検出処理系202では、例えば、1フレームの画像が所定の数の領域に分割され、その領域毎に、DCTのDC係数データのY(輝度データ),Cb,Cr(色差データ)の平均値が演算される。また、その演算された平均値に基づいて、フレーム間差分演算、またはフィールド間差分演算が行われ、所定しきい値と比較されることによってシーンチェンジの検出が行われる。
シーンチェンジがない場合は各領域のフレーム間(またはフィールド)差分データは所定のしきい値より小さく、シーンチェンジがある場合はそのしきい値より差分データが大きくなることから、それに基づいてシーンチェンジを検出することができる。
ここで、1フレームの分割数は、例えば、図23に示すように36分割とすることができる。フレームの領域分割の方法は、図23に示すものに限らず、分割数を多くすることも少なくすることも考えられるが、少なすぎるとシーンチェンジの検出精度が鈍感になり、多すぎると精度が鋭くなりすぎることが考えられるので、およそ4〜400くらいの範囲で、適当な分割数を設定することが考えられる。
(9.2.2)色特徴
DCTのDC係数の所定領域におけるY,Cb,Crデータの平均値から、色特徴検出処理系203において色特徴を検出することができる。所定領域としては、例えば、図24に示すような領域を考えることができる。
例えば、放送番組のジャンルが「相撲」である場合、図24の領域から茶色が含まれる領域を検出することができた場合、そのシーンは「土俵のシーン」の確率が高いと想定できる。
このような色特徴と、例えば、音声の歓声特徴とを組み合わせると、「土俵のシーン」+「歓声のシーン」から、いま注目しているシーンが、「取組みが開始するシーン」の確率が高いと想定できるので、このようなシーン区間が、キーフレーム区間と設定される。
(9.2.3)類似シーン特徴
これは、類似している画像(シーン)を検出し、類似するシーンに同じIDを割り振る(付与する、または付加する)類似画像検出処理系204による処理であり、その詳細は、例えば、特開2002−344872号公報に開示されている。
この処理においては、例えば、1フレームが複数の領域(例えば、25の領域)に分割され、その分割された各領域のDCTの平均DC係数が求められる。また、その求められた平均DC係数をベクトル成分として、各シーン間のベクトル距離が、所定のしきい値より小さい場合、それらのシーンは類似するシーンとして判定され、類似シーンとして判定されたシーンに同じIDが割り当てられる。
割り当てられるIDの初期値は例えば1とされ、上述した所定のしきい値よりベクトル距離が小さいシーンが検出されない場合は、IDの最大値に1を加算したものが新たなIDとされ、そのシーンに割り当てられる。
(9.2.4)テロップ特徴
テロップ検出判定処理系206においては、例えば、図24に示すような各領域におけるDCTのAC係数の平均値が求められる。所定の大きさ以上の文字情報を含むテロップは、比較的、輪郭がはっきりしており、図24に示す何れかの領域にテロップが現れた場合には、所定のしきい値以上のAC係数を検出することができ、これにより、テロップの検出が行われる。
このように、DCTのAC係数を検出する方法の他に、ベースバンド領域(時間領域の信号)でエッジを検出する方法も考えられ、例えば、画像の輝度データのフレーム間差分によりエッジを検出することも考えられる。また、ウェーブレット変換により、多重解像度解析を行い、所定の高周波成分データを含む所定の多重解析度領域におけるデータを用いて、領域の平均値を演算するようにして、上記AC係数を用いる場合と同様の処理を行うことも考えられる。
その他、図22において、特定色判定処理系205により特定色(例えば肌色)の検出が行われ、顔が検出されることにより、人物の検出を行うことも考えられる。
以上のようにして図20乃至図22の各系により得られた特徴データは外部(例えば、図16のプレイリストデータ(チャプターデータ)生成処理系59)に供給され、プレイリストデータ、チャプターデータの生成に用いられる。
(10)大容量記録媒体と他の記録媒体を併用可能な場合の実施例
この実施例は、図16または図19に示す記録再生装置において、「大容量記録媒体」に相当する記録媒体Aから、「他の記録媒体」に相当する記録媒体Bへのデータのコピー記録処理、編集記録処理などの動作モードに相当する。
ここで、記録媒体Bは、例えば、上述したように、複数の記録方式に対応し、それぞれの記録方式のデータの記録先となる複数の記録層を備えるものであり、記録再生装置に対して着脱可能な光ディスクである。このように、HDD(記録媒体A)などの、記録容量の大きい記録媒体に記録されている画像音声データなどを記録再生装置に対して着脱可能な、HDDよりも記録容量の小さい光ディスク(記録媒体B)の記録方式または記録レートに応じた所定の記録層にそのままコピーさせたり(コピー記録処理)、編集したものを記録させたりする(編集記録処理)ことがユーザの使用方法として考えられる。
このようなコピー記録処理、編集記録処理などは、例えば、記録再生装置の動作モードに基づいて自動的に、または、ユーザの手動操作に応じて行われる。
ここで、図16または図19の記録媒体Aには、記録方式1(通常DVD方式)、記録方式2(BDまたはHD-DVD方式)の2方式の画像音声データ、および、その画像音声データから得られた特徴データ、特殊再生用データ(プレイリストデータ、チャプターデータ)が記録されているものとする。
以下、コピー記録処理(コピー動作モード)について説明する。例えば、ユーザの操作に従って記録再生装置のモードがコピー動作モードになったとき、はじめに、記録再生装置に装着されている、データのコピー先となる記録媒体Bに記録可能な記録方式の判定が行われる。
(10.1)記録可能な記録方式の判定方法
記録再生装置においては、記録方式1、記録方式2での記録媒体Bに対するデータの記録は図3に示すような信号処理系によって行われる。また、記録方式1、記録方式2で記録媒体Bに記録されているデータの再生は図5に示すような信号処理系によって行われる。すなわち、図3の信号処理系は、図16または図19の記録再生装置における記録側の信号処理系に対応し、図5の信号処理系は、図16または図19の記録再生装置における再生側の信号処理系に対応する。
記録媒体Bがどの記録方式に対応したものであるかの確認は、例えば、記録方式1、記録方式2のテスト用データを記録媒体Bの対応する層にそれぞれ記録し、その後、再生モードで、直前に記録させたテスト用データを正常に再生することができるか否かを判定することにより行われる。
また、このとき行われる、テスト用データを正常に再生することができるか否かの判定は、エラーレートが検出されることによって、または、再生信号処理系として設けられる、図示せぬ誤り訂正信号処理系によりECCフラグ((Error-Correcting Code)フラグ)などが検出されることによって自動的に行われる。具体的には、図16または図19の再生処理系52からシステムコントローラ系60にECCフラグ信号が入力され、システムコントローラ系60において所定時間内に計測されたフラグ数が、所定のしきい値と比較されることによって自動的に判定される。
記録媒体Bに物理的な識別IDが設定されている場合、その識別IDが検出され、識別IDに基づいて、記録媒体Bが、どの記録方式に対応した記録媒体であるのかが確認されるようにしてもよい。この場合、記録再生装置には、例えば、識別IDと、記録方式の対応テーブルが用意される。
(10.2)記録方法
図25は、記録媒体Aのデータの記録状況と、記録媒体Bに記録することが可能な記録方式の組合せの例を示す図である。データのコピー記録処理、編集記録処理などの記録動作は、この図の組合せに従って行われる。
図25(1)は、記録媒体Aには記録方式1と記録方式2のデータが記録されており、記録媒体Bは、記録方式1と記録方式2の双方の記録方式に対応したものである場合の組合せを示す。また、図25(2)は、記録媒体Aには記録方式1と記録方式2のデータが記録されており、記録媒体Bは、記録方式1だけに対応したものである場合の組合せを示す。さらに、図25(3)は、記録媒体Aには記録方式1と記録方式2のデータが記録されており、記録媒体Bは、記録方式2だけに対応したものである場合の組合せを示す。
同様に、図25(4)は、記録媒体Aには記録方式1のデータのみが記録されており、記録媒体Bは、記録方式1と記録方式2の双方の記録方式に対応したものである場合の組合せを示す。また、図25(5)は、記録媒体Aには記録方式1のデータのみが記録されており、記録媒体Bは、記録方式1だけに対応したものである場合の組合せを示す。さらに、図25(6)は、記録媒体Aには記録方式1のデータのみが記録されており、記録媒体Bは、記録方式2に対応したものである場合の組合せを示す。
図25(7)は、記録媒体Aには記録方式2のデータのみが記録されており、記録媒体Bは、記録方式1と記録方式2の双方の記録方式に対応したものである場合の組合せを示す。また、図25(8)は、記録媒体Aには記録方式2のデータのみが記録されており、記録媒体Bは、記録方式1だけに対応したものである場合の組合せを示す。さらに、図25(9)は、記録媒体Aには記録方式2のデータのみが記録されており、記録媒体Bは、記録方式2だけに対応したものである場合の組合せを示す。
なお、以上においては、記録媒体Aから記録媒体Bにデータをコピーさせる処理について説明したが、逆の処理、すなわち、記録媒体Bから記録媒体Aにデータをコピーさせる処理も、記録再生装置においては同様にして行われる。また、記録媒体Bは、記録再生装置に設けられるトレイに着脱可能なディスク状の記録媒体であるものとして説明したが、それに限らず、記録媒体Aに記録されているデータを、所定のケーブルなどを介して記録再生装置に接続された、USB(Universal Serial Bus)接続の記録媒体、IEEE(Institute of Electrical and Electronics Engineers)1394接続の記録媒体などの外部記録媒体に記録させる場合や、反対に、その外部記録媒体から記録媒体Aにデータを記録させる場合も同様である。
次に、図25に示す各組合せの状態のときの動作について詳細に説明する。
(10.2.1)記録媒体Aに記録方式1と記録方式2の双方のデータが記録されている場合
図25(1)の場合:
これは、記録媒体Bが記録方式1、記録方式2の双方の記録方式に対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式1、記録方式2の双方の記録方式で記録媒体Bに記録させる場合の組合せである。
例えば、上述したようにして、記録媒体Bに記録可能な記録方式が自動的に判定された後、記録媒体Aから、記録方式1のデータと較べて伝送レートが高い記録方式2の画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式2層に記録される。
同様に、記録方式1の画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式1層に記録される。
なお、このような記録の際、特徴データ、特殊再生用データなども記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録される。
図25(2)の場合:
これは、記録媒体Bが記録方式1(通常DVD方式)のみに対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式1で記録媒体Bに記録させる場合の組合せである。
記録方式1の画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式1層に記録される。
なお、この記録モードの際も、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録されるが、例えば、この図25(2)の場合は、記録方式1層のみに、または、他の所定記録領域に、それらのデータは記録される。
図25(3)の場合:
これは、記録媒体Bが記録方式2(BD方式またはHD-DVD方式)のみに対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式2で記録媒体Bに記録させる場合の組合せである。
記録媒体Aから、記録方式1のデータと較べて伝送レートが高い記録方式2の画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式2層に記録される。
なお、この記録モードの際、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録されるが、例えば、この図25(3)の場合は、記録方式2層のみに、または、他の所定記録領域に、それらのデータは記録される。
(10.2.2)記録媒体Aに記録方式1のデータのみが記録されている場合
図25(4)の場合:
これは、記録媒体Bが記録方式1、記録方式2の双方の記録方式に対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式1、記録方式2の双方の記録方式で記録媒体Bに記録させる場合の組合せである。
この場合、記録媒体Aには記録方式1(通常DVD方式)の画像音声データのみが記録されていて、伝送レートの高い記録方式2の画像音声データがないことから、記録方式1の画像音声データにアップコンバート処理を施すことによって、記録方式2の画像音声データを生成する処理が行われる。これは、図26に示すようなMPEG方式における、MP@MLからMP@HLへの変換処理と考えられる。
図26に示すプロファイル、レベル、画サイズ比(アスペクト比)などのMPEGの属性は、画像音声データ中に配置される所定のビットデータを検出することで確認することができる。図16または図19の記録再生装置においては、再生処理系52、音声デコード処理系54、または画像デコード処理系56からの信号により、システムコントローラ系60によって確認される。
記録方式1の画像音声データが再生処理系52により再生され、再生された画像音声データが記録処理系46に入力される。記録処理系46においては、アップコンバート処理が行われ、そのアップコンバート処理によって得られた記録方式2の画像音声データの記録が、記録媒体処理系64を介して、記録媒体Bの記録方式2層を記録先として行われる。
アップコンバート処理は、再生信号である記録方式1の画像音声データをデコードし、記録方式2で再エンコードする方法が考えられるが、帯域圧縮されている記録方式1の画像音声データをベースバンド帯域まですべてデコードしないで、所定の伝送レート変換、必要に応じて、画サイズ変換(4対3から16対9への変換)、その他の変換処理など、他の方法で行うようにすることも考えられる。
なお、記録方式1の画像音声データを単なるデータと考え、例えばMP@MLのままで記録媒体Bの記録方式2層に記録する場合、以上のようなアップコンバート処理、画サイズ変換処理などは行わず、読み出されたデータが、そのまま記録されるようにしてもよい。
一方、記録方式1の画像音声データの記録については、その画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式1層に記録される。
この記録モードの際も、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録される。
図25(5)の場合:
これは、記録媒体Bが記録方式1(通常DVD方式)のみに対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式1で記録媒体Bに記録させる場合の組合せである。
記録方式1の画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式1層に記録される。
なお、この記録モードの際も、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録されるが、例えば、この図25(5)の場合は、記録方式1層のみに、または、他の所定記録領域に、それらのデータは記録される。
図25(6)の場合:
これは、記録媒体Bが記録方式2(BD方式またはHD-DVD方式)のみに対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式2で記録媒体Bに記録させる場合の組合せである。
この場合、記録媒体Aには記録方式1(通常DVD方式)の画像音声データのみが記録されていて、伝送レートの高い記録方式2の画像音声データがないことから、記録方式1の画像音声データにアップコンバート処理を施すことによって、記録方式2の画像音声データを生成する処理が行われる。すなわち、上述した、「図25(4)の場合」と同様の処理が行われる。
なお、この記録モードの際、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録されるが、例えば、この図25(6)の場合は、記録方式2層のみに、または、他の所定記録領域に、それらのデータは記録される。
(10.2.3)記録媒体Aに記録方式2のデータのみが記録されている場合
図25(7)の場合:
これは、記録媒体Bが記録方式1、記録方式2の双方の記録方式に対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式1、記録方式2の双方の記録方式で記録媒体Bに記録させる場合の組合せである。
この場合、記録媒体Aには記録方式2(BD方式またはHD-DVD方式)の画像音声データのみが記録されていて、伝送レートの低い記録方式1の画像音声データがないことから、記録方式2の画像音声データにダウンコンバート処理を施すことによって、記録方式1の画像音声データを生成する処理が行われる。
記録方式2の画像音声データが再生処理系52により再生され、再生された画像音声データが記録処理系46に入力される。記録処理系46においては、ダウンコンバート処理が行われ、そのダウンコンバート処理によって得られた記録方式1の画像音声データの記録が、記録媒体処理系64を介して、記録媒体Bの記録方式1層を記録先として行われる。
ダウンコンバート処理は、再生信号である記録方式2の画像音声データをデコードし、記録方式1で再エンコードする方法が考えられるが、帯域圧縮されている記録方式2の画像音声データをベースバンド帯域まですべてデコードしないで、所定の伝送レート変換、必要に応じて、画サイズ変換(16対9から4対3への変換)、その他の変換処理など、他の方法で行うようにすることも考えられる。
なお、記録媒体Aに記録されている記録方式2の画像音声データが、図26に示すMPEGのMP@MLのデータである場合には、以上のようなダウンコンバート処理、画サイズ変換処理などは行わず、読み出されたデータが、そのまま記録されるようにしてもよい。
一方、記録方式2の画像音声データの記録については、その画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式2層に記録される。
この記録モードの際も、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録される。
図25(8)の場合:
これは、記録媒体Bが記録方式1(通常DVD方式)のみに対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式1で記録媒体Bに記録させる場合の組合せである。
この場合、記録媒体Aには記録方式2(BD方式またはHD-DVD方式)の画像音声データのみが記録されていて、伝送レートの低い記録方式1の画像音声データがないことから、記録方式2の画像音声データにダウンコンバート処理を施すことによって、記録方式1の画像音声データを生成する処理が行われる。すなわち、上述した、「図25(7)の場合」と同様の処理が行われる。
この記録モードの際、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録されるが、例えば、この図25(8)の場合は、記録方式1層のみに、または、他の所定記録領域に、それらのデータは記録される。
図25(9)の場合:
これは、記録媒体Bが記録方式2(BD方式またはHD-DVD方式)のみに対応したものであることがシステムコントローラ系60により判定され、記録媒体Aに記録されている画像音声データを、記録方式2で記録媒体Bに記録させる場合の組合せである。
記録媒体Aから、記録方式1のデータと較べて伝送レートが高い記録方式2の画像音声データが再生処理系52により再生され、記録処理系46において所定の記録処理が施された後、記録媒体処理系64を介して、記録媒体Bの記録方式2層に記録される。
なお、この記録モードの際、特徴データ、特殊再生用データなどが記録媒体Aから読み出され、図7、図10を参照して説明したような所定の記録層、記録領域に記録されるが、例えば、この図25(9)の場合は、記録方式2層のみに、または、他の所定記録領域に、それらのデータは記録される。
(11)記録方式1の複数の画像音声データを、記録方式2で記録する場合の実施例
記録レート(伝送レート)が低い記録方式の複数の画像音声データを、それよりも記録レートの高い記録方式の画像音声データとして記録し直すことがある。
記録媒体Bの記録層のうち、BD方式またはHD-DVD方式に対応する記録方式2層の記録容量は、通常DVD方式に対応する記録方式1層の記録容量に比べて大きいことから、例えば、記録方式1の複数の画像音声データを、記録方式2で記録することは、複数枚に分かれて記録されている通常DVD方式の画像音声データをBD方式またはHD-DVD方式の画像音声データとして1枚の記録媒体Bの記録方式2層に記録させる場合などに行われる。
ここで、BD方式の記録媒体の記録容量と、通常DVD方式の記録媒体の記録容量について考える。
BD方式のディスクは片面27GB、通常DVD方式のディスクは4.7GBなので、
27/4.7=5.7
から、少なくとも5枚の通常DVD方式のディスクに記録されているデータを、1枚のBD方式のディスクに記録させることができることになる。
図27A,Bは、通常DVD方式の記録媒体とBD方式の記録媒体の記録容量について示す図である。図27Aの例においては、通常DVD方式のディスクの記録容量は記録容量1で表されている。
図27B(1)に示すように、通常DVD方式のディスク1乃至5の合計の記録容量は、BD方式のディスク1枚の記録容量2より少ない。
このような、複数の記録媒体に記録されている複数の画像音声データを、1つの記録媒体にコピー記録させるような動作は、ユーザによる所定の操作に応じて記録再生装置により行われる。
(11.1)動作モード設定順序、動作順序
このような動作を行わせる場合、はじめに、ユーザによりリモコン62などが操作され、動作モードの選択、設定が行われる。
次に、通常DVD方式のディスク何枚分のデータを、BD方式のディスク1枚にコピー記録するかの選択がリモコン62などから入力される。入力された情報は、ユーザ入力I/F系61を介してシステムコントローラ系60に入力される。
このような操作がユーザにより行われた場合において、ユーザにより入力された所定の枚数分の通常DVD方式のディスクに記録されているデータが、1枚のBD方式のディスクに収まらないとき、例えば、システムコントローラ系60による制御に従って、表示処理系65により所定の警告表示が行われたり、音声出力系66により所定の警告音声が出力されるようにしてもよい。警告音声としては、例えば、ピー音、または、システムコントローラ系60内のROMなどに記憶されている音声データに基づく「1枚では記録できません」などの合成音声が出力される。
図27B(2)は、このように、ユーザにより入力された枚数分の通常DVD方式のディスクに記録されているデータを、1枚のBD方式のディスクに記録させることができない場合の概念図である。
図27B(2)の例においては、データの記録元となるBD方式のディスクには、容量aのデータが既に記録されているため、通常DVD方式のディスク1〜3までのデータしか、BD方式のディスクに追加的に記録することができない。
このように、記録しようとするデータの全てを1枚のBD方式のディスクに記録させることができない場合、例えば、2枚のBD方式のディスクがあれば全てのデータを記録することができるときには、システムコントローラ系60内のメモリから音声データが読み出され、音声出力系66により「2枚で記録できます」などのような音声情報が出力されるようにしてもよいし、表示処理系65により所定のメッセージが表示されるようにしてもよい。
以上のような通常DVD方式のディスクに記録されているデータをBD方式のディスクに記録させる処理の過程で、例えば、4対3から16対9への画サイズの変換、再エンコード処理などの所定の信号処理を行う場合、その処理には、図25(4),(6)の組合せのときのような信号処理を適用することもできる。また、通常DVD方式のディスクに記録されている特徴データ、特殊再生用データを記録させる処理には、図7、図10を参照して説明した処理を適用することができる。
(12)記録容量が不足する場合の実施例
(12.1)2記録方式対応ディスクの場合
例えば、記録方式2で、MP@HLなどの伝送レートが比較的高いデータを記録媒体Bに記録させている最中に、その記録媒体Bの記録方式2に対応した記録方式2層の記録容量が不足し、記録対象としている画像音声データの全てを記録することができない場合がある。このことは、例えば、EPG(Electronic Program Guide)などを用いてタイマー記録が設定されており、それに従って記録している番組(例えば、スポーツ番組)の放送が予定の時刻に終了せず、放送時間の延長に伴って記録時間を延長させる場合などに起こりうる。
上述したように、図16または図19の記録媒体Bが記録方式1(通常DVD方式)と記録方式2(BD方式またはHD-DVD方式)に対応していると仮定し、伝送レートが高い記録方式2でのデータの記録中に記録方式2層の記録容量が不足することが検出された場合、図28Aの記録途中のp点(時刻1)で、記録方式が記録方式2から記録方式1に切り換えられ、それ以降、対象としていた番組の記録が終了する時刻2までの間、記録方式1でのデータの記録が行われる。
なお、図28Bは、記録方式を記録方式1から記録方式2に切り換える場合の例を示しており、記録途中のp点(時刻1)で、記録方式が記録方式1から記録方式2に切り換えられ、それ以降、対象としていた番組の記録が終了する時刻2までの間、記録方式2でのデータの記録が行われる。
このようにして記録方式を切り換える場合、データの記録先は、図3を参照して説明したように、切り換えた記録方式に対応した記録層とされる。また、特徴データ、特殊再生用データも記録先も、記録方式の切り換えに伴って必要に応じて変更される。
また、例えば、特殊再生用データを生成する元になる特徴データを抽出する処理が、記録方式2の画像音声データを用いて行われている場合、その特徴抽出処理も、記録方式1の画像音声データを用いた処理に切り換えられる。
さらに、特徴抽出処理が、所定の帯域圧縮処理を行う前の、画像音声データのベースバンド領域で行われている場合、記録方式の切り換えが行われたとしても特徴抽出処理の出力はそのまま用いられ、図7または図10を参照して説明したような領域(位置)への特徴データの記録先の切り換えが行われる。図10を参照して説明した、記録方式1に対応した記録方式1層、記録方式2に対応した記録方式2層の記録領域以外のその他の領域が、特徴データや特殊再生用データの記録先である場合、記録方式の切り換えが行われたとしても、特徴データ、特殊再生用データの記録は、そのまま、その他の領域を記録先として行われる。
(12.2)記録レートの切り換え
ここでは、記録容量の不足が検出された場合の処理として、記録レートの切り換えを行う場合について説明する。
このような記録レートの切り換えは、例えば、図29に示すように、記録媒体Bの残りの記録容量に応じて行われる。ここで、記録方式1は通常画質の記録モードであり、記録方式2は高画質の記録モードである。通常画質の記録モードでは通常の記録レートで記録が行われ、高画質の記録モードでは通常の記録レートよりも高い記録レートで記録が行われる。
図29(a)に示すように、記録方式2で記録を続けたとしても記録媒体Bの記録容量が足りる場合、記録終了まで記録方式2での記録が続けられ、一方、図29(b)に示すように、記録方式2で記録を続けたときには記録媒体Bの記録容量が足りなくなる場合、所定の位置である点pで、記録方式が記録方式2から記録方式1に切り換えられ、それ以降、記録終了まで記録方式1での記録が行われる。
図30は、記録時間と記録容量の特性の例を記録方式(記録レート)毎に示す図である。
点aから点cまでの特性は、記録方式2(高記録レート)で記録を行った場合の特性を示し、この記録方式2での記録を続けた場合、記録するデータの量は、時刻t2で記録媒体Bの最大記録容量D(記録容量制限値)に到達する。
点aから点eまでの特性は、記録方式1(通常記録レート)で記録を行った場合の特性を示し、この記録方式1で記録を続けた場合、記録するデータの量は、時刻t4で記録媒体Bの最大記録容量Dに到達する。
図30に示されるように、記録容量に制限がある場合には、高画質記録モード(記録方式2)で記録を行ったときの記録許容時間は、通常画質記録モード(記録方式1)で記録を行ったときの記録許容時間よりも短い。
そこで、記録方式2の記録モードで記録を行っていて、図30に示すように、データ量が最大記録容量Dに到達する時刻t2よりも前の時刻である時刻t1の時点で記録モードを記録方式1に切り換えることにより、記録モードを変えない場合には時刻t2までしか記録することができないところを、時刻t3まで記録することが可能になる。すなわち、記録時間を伸ばすことができる。
この場合、特徴抽出処理をMPEGなどの帯域圧縮処理が施されたデータを用いて行うときには、時刻t1までは、記録方式2で記録する過程で得られたデータを用いてそれが行われ、記録方式が切り換えられた時刻t1以降は、記録方式1で記録する過程で得られたデータを用いて行われる。
このように、特徴抽出処理に用いるデータを、記録モード、記録方式に応じて切り換えることにより、整合性が確保された特徴データの検出、特殊再生用データの生成が可能になる。
(13)動作フローチャート
次に、図31および図32のフローチャートを参照して、記録再生装置による記録処理について説明する。
ここでは、記録媒体Bが複数方式のデータの記録に対応し、かつ、記録対象の画像音声データが図3に示すように1つであるものとする。
ステップS1において、対象の画像音声データを、単一の記録方式で記録するか否かが判定され、単一の記録方式で記録すると判定された場合、ステップS2に進む。
すなわち、記録媒体Bが、記録方式1、記録方式2の2つの方式での記録に対応しているか否かが判定され、2つの方式に対応していると判定された場合、さらに、それぞれの記録方式に対応する記録層に記録するか、どちらか1つの記録方式に対応する記録層に記録するのかが判定される。記録媒体Bがどの方式のデータの記録に対応しているか否かは、上述したように、例えば、記録方式1、記録方式2のテスト用データを記録し、エラーレートの検出結果に基づいて判定される。
ステップS2において、対象の画像音声データを、記録方式1で記録するのか、記録方式2で記録するのかが判定される。この判定は、例えば、ユーザによる選択操作に基づいて行われたり、入力された画像音声データの種類などに基づいて自動的に行われる。
例えば、図16または図19において、受信系42でハイビジョン放送が受信され、その番組を記録する場合には、できるだけ高画質で記録しておくように、ここでは、記録方式2が、画像音声データの記録方式として自動的に選択される。このような自動判定は、番組のメタデータや識別情報などが受信系42からシステムコントローラ系60に入力され、システムコントローラ系60により行われる。
ステップS2において、対象の画像音声データを記録方式1で記録すると判定された場合、ステップS3に進み、データの取り込みが行われる。取り込まれたデータは特徴抽出処理系50に入力される。
ステップS4において、特徴抽出処理系50により特徴抽出処理が行われ、特徴データが検出される。検出された特徴データはプレイリストデータ(チャプターデータ)生成処理系59に適宜入力され、プレイリストデータ(チャプターデータ)生成処理系59において特殊再生用データの生成が行われる。ここで得られた特徴データ、特殊再生用データは記録処理系46に入力される。
特徴データの抽出、特殊再生用データの生成、およびそれらの記録は、例えば、次の方法により行われる。
所定の区間毎、または所定のデータ量毎にデータを取り込んで、それを対象として特徴データの検出、プレイリストデータの生成を行い、逐次、記録媒体Bに記録する方法(処理方法1)。
全ての画像音声データの記録が終了してから、その画像音声データを読み出し、それを対象として特徴データの検出、プレイリストデータの生成を行い、記録媒体の所定の領域、位置に記録しなおす方法(処理方法2)。
画像音声データを記録するのと同時に、特徴データの検出を行い、検出した特徴データを画像音声データとともに記録媒体Bに記録し、記録終了後、特徴データだけを読み出して、読み出した特徴データに基づいて生成したプレイリストデータを記録媒体Bに再度記録する方法(処理方法3)。このとき生成されたプレイリストデータは、記録媒体Bに記録されている画像音声データの特殊再生に利用することもできる。
ステップS5において、画像音声データなどに対して所定の記録処理が施され、記録媒体Bの記録方式1層に画像音声データが記録される。
ステップS6において、記録を終了するか否かが判定され、終了すると判定された場合、処理は終了され、一方、終了すると判定されていない場合、処理はステップS7に進む。
ステップS7において、記録方式を変更(切り換え)するか否かが判定され、変更しないと判定された場合、ステップS3に戻り、それ以降の処理が繰り返される。
ステップS7において、記録方式を変更すると判定された場合、ステップS8に進み、それ以降の処理が行われる。また、ステップS2において、対象の画像音声データを記録方式2で記録すると判定された場合も、ステップS8に進み、それ以降の処理が行われる。
ステップS8において、データの取り込みが行われる。取り込まれたデータは特徴抽出処理系50に入力される。
ステップS9において、特徴抽出処理系50により特徴抽出処理が行われ、特徴データが検出される。検出された特徴データはプレイリストデータ(チャプターデータ)生成処理系59に適宜入力され、プレイリストデータ(チャプターデータ)生成処理系59において特殊再生用データの生成が行われる。ここで得られた特徴データ、特殊再生用データは記録処理系46に入力される。
ステップS10において、画像音声データなどに対して所定の記録処理が施され、記録媒体Bの記録方式2層に画像音声データが記録される。
ステップS11において、記録を終了するか否かが判定され、終了すると判定された場合、処理は終了され、一方、終了すると判定されていない場合、処理はステップS12に進む。
ステップS12において、記録方式を変更(切り換え)するか否かが判定され、変更しないと判定された場合、ステップS8に戻り、それ以降の処理が繰り返される。
ステップS12において、記録方式を変更すると判定された場合、ステップS3に進み、それ以降の処理が行われる。例えば、対象としている画像音声データの全てを記録するためには記録媒体Bの記録方式2層の記録容量が不足する場合、ここで、記録方式を変更すると判定され、記録方式1での記録が開始される。
一方、ステップS1において、対象の画像音声データを、単一の記録方式で記録しない、すなわち、複数の記録方式で記録すると判定された場合、ステップS13(図32)に進む。
ステップS13において、データの取り込みが行われる。取り込まれたデータは特徴抽出処理系50に入力される。
ステップS14において、特徴抽出処理系50により特徴抽出処理が行われ、特徴データが検出される。検出された特徴データはプレイリストデータ(チャプターデータ)生成処理系59に適宜入力され、プレイリストデータ(チャプターデータ)生成処理系59において特殊再生用データの生成が行われる。ここで得られた特徴データ、特殊再生用データは記録処理系46に入力される。
なお、ここでの特徴データの抽出処理、特殊再生用データの生成処理は、上述したように、得られる特徴データ、特殊再生用データが、記録方式1の画像音声データを再生した場合と記録方式2の画像音声データを再生した場合とで整合性が確保されるように行われる。
ステップS15において、画像音声データなどに対して所定の記録処理が施され、記録媒体Bの記録方式1層と記録方式2層に画像音声データが記録される。整合性を確保するようにして得られた特徴データ、特殊再生用データも、記録媒体Bの所定の領域に記録される。
ステップS16において、記録を終了するか否かが判定され、終了すると判定された場合、処理は終了され、一方、終了すると判定されていない場合、処理はステップS17に進む。
ステップS17において、記録方式を単一の記録方式に変更するか否かが判定され、変更しない場合、ステップS13に戻り、それ以降の処理が繰り返される。
ステップS17において、記録方式を単一の記録方式のものに変更すると判定された場合、ステップS2に進み、それ以降の処理が行われる。
(14)その他の変形実施例
例えば、地上アナログ放送と地上デジタル放送でコンテンツとしての同じ番組が放送される場合を想定する。また、ここでは、その同じ番組が同じ時刻に放送される場合を想定する。
この場合も、上述した放送コンテンツを受信したときと同様に、地上アナログ放送と地上デジタル放送で放送されたそれぞれの番組を対象として、記録処理、特徴抽出処理、チャプター処理、ダイジェスト再生処理を行うことができる。
処理対象の番組は同じ内容のものであるから、チャプター点、ダイジェスト再生区間がそれぞれの番組において同じ位置に特徴データに基づいて設定され、記録された地上アナログ放送の番組を再生する場合と、地上デジタル放送の番組を再生する場合とで、再生点、再生区間の整合性ができるだけとれていることが好ましい。
また、上述したような特徴抽出処理を行わせる場合、地上アナログ放送の番組を処理する構成と、地上デジタル放送の番組を処理する構成をできるだけ共通にした方が、システム全体の構成が複雑になるのを避けるという点から好ましい。
例えば、図33の構成を一部に備える装置のように、地上アナログ放送と地上デジタル放送の両方を受信し、受信した番組を記録再生する装置とすることにより、図33に示す構成の後段に設けられる、特徴抽出処理などを行う処理系(図33の構成から出力された信号を処理する処理系)を共通化することができる。
なお、図33に示す構成は、図16等に示すシステム全体のブロック構成例における受信アンテナ系41と受信系42の部分に対応する。受信系42は受信アンテナ系41において受信された地上デジタル放送信号を処理する地上デジタル受信処理系301、受信アンテナ系41において受信された地上アナログ放送信号を処理する地上アナログ受信処理系302、および、地上デジタル受信処理系301の出力であるデジタル受信信号から音声信号と画像信号を取得する信号処理系303から構成される。
地上アナログ受信処理系302と信号処理系303により得られた音声信号は図16の音声A/D変換処理系43に、画像信号は画像A/D変換処理系48にそれぞれ出力され、出力された音声信号、画像信号に基づいて特徴抽出処理等が行われる。特徴抽出処理は、地上アナログ放送で放送される番組と地上デジタル放送で放送される番組の画サイズ(アスペクト比)が違う場合、この画サイズの違いが、抽出される特徴データに差として現れないようにして行われる。
図34A,Bは、画サイズの違いについて示す図である。
図34Aは、地上アナログ放送で放送された横:縦=4:3の画サイズ(通常画サイズ)の番組を通常画サイズのモニタに表示させた例を示す図である。
一方、図34Bは、例えば、地上デジタル放送で行われているハイビジョン放送により放送された横:縦=16:9の画サイズの番組(ハイビジョン番組)を、画サイズをそのままに、解像度について所定のダウンコンバート処理を行って通常画サイズのモニタに表示させた例を示す図である。
画サイズをそのままにしてハイビジョン番組を通常画サイズのモニタに表示させた場合、その見え方は、図34Bに示すように、いわゆるレターボックスといわれる上下に黒部分((A)、(B)の部分)が付加されたものになる。
上述した特徴抽出処理には、MPEGストリームから直接行う方法、すなわち周波数帯域での処理方法と、画像音声データをデコード処理し、ベースバンド帯域を対象として行う方法、すなわち時間軸領域での処理方法の2つがある。MPEGストリームから直接処理を行う方法では、例えば、DCT係数から、カラー特徴、シーンチェンジ特徴、類似画像特徴、その他の特徴データを抽出することができることについてはすでに説明した。
ここでは説明を簡単にするため、処理対象をベースバンド帯域とし、地上アナログ放送、地上デジタル放送の番組の特徴を抽出する処理について説明する。
なお、周波数帯域を処理対象とする場合、以下に説明する、ベースバンド帯域を処理対象とした場合の処理に対応する処理が行われることになる。例えば、後述する図35における領域P1のデータに注目した場合、その領域P1に対応する周波数帯域でのデータ、例えばDCTデータを対象とした処理が行われることになる。
上述したように、ユーザが番組を見るモニタの画サイズの違いによって、同じ番組でも、抽出される特徴データに相違があり、地上アナログ放送の番組から抽出される特徴データと、地上デジタル放送の番組から抽出される特徴データの整合性をとることができない場合がある。
図35および図36は、特徴データの整合性をとることができない理由について説明する図である。
ここでは、画像系特徴データのうちのテロップ特徴を抽出する場合について考える。
まず、特徴抽出処理の対象とする領域を、図35の左側に示すように、通常画サイズの1フレームを分割したP1〜P8の8つの領域と仮定する。この各領域を、さらに、図35の実線矢印の先に示すように所定のブロック領域に分割して考え、ブロック領域毎にエッジ検出を行い、特徴量として求められた値が所定の閾値以上の値である場合には、そのブロック領域にテロップが存在すると判定するような処理がテロップ特徴を抽出する処理において行われる。
エッジ検出は、周波数帯域での処理ではDCTのAC係数に基づいて行われる。なお、ベースバンド帯域での処理では、そのAC係数の代わりに、例えば画素毎のフレーム間差分データ値に基づいて行われる。
地上アナログ放送の通常画サイズの番組(番組の1画像)のうち、図34Aの(S)の部分にテロップ特徴が検出されるものとし(テロップが表示されるものとし)、例えば、それと同じハイビジョン番組を、上記したように、画サイズをそのままにダウンコンバート処理を施して通常画サイズのモニタに表示させた場合、番組は図34Bに示すように表示されることになり、この表示においては、テロップ特徴は図34Bの(T)の部分で検出されることになる。すなわち、地上デジタル放送の番組を表示させた場合、地上アナログ放送の番組を表示させたときのテロップの表示領域である領域(S)と較べて、より狭く、より画面中央に近い位置に形成される領域(T)に同じテロップが表示されることになる。
このように、地上アナログ放送の番組と地上デジタル放送の番組を通常画サイズのモニタにそれぞれ表示させた場合、同じテロップが、モニタの所定の位置を基準として異なる領域に表示されることになる。
そのため、地上アナログ放送の番組から特徴を抽出する処理系と、地上デジタル放送の番組から特徴を抽出する処理系を共通のものとした構成では、図35の領域P1に着目した場合、地上アナログ放送の番組を対象とするときには、テロップがその領域に表示されることからa1〜a16の検出ブロックの全てにおいて閾値以上の特徴量が検出されるが、地上デジタル放送の番組を対象とするときには、地上アナログ放送の番組のときとはテロップの表示位置が異なるから、a9〜a16の検出ブロックにおいては閾値以上の特徴量が検出されないことなどが起こりうる。
図36は、特徴量の検出結果の例を示す図である。図36において、縦軸は特徴量を表し、横軸は再生開始からの時間を表す。
例えば、時刻t1〜t2の間に図34A,Bに示す領域(S)、(T)を対象としてテロップ特徴の検出が行われた場合、図36に示すように、領域(S)から抽出された特徴量の検出結果と、領域(T)から抽出された特徴量の検出結果に差が現れる。図36において、特性aは地上アナログ放送の番組の領域(S)を対象とした場合の特徴量の検出結果を示し、特性bは地上デジタル放送の番組の領域(T)を対象とした場合の特徴量の検出結果を示す。
このように、ハイビジョン番組をダウンコンバートして特徴抽出処理を行う場合、テロップの出現部分によっては、通常画サイズの番組を対象として特徴抽出処理を行う場合よりも、検出される特徴量が少なくなることがある。このことから、同じ番組の同じ画像が処理対象になっているにも関わらず、閾値の設定によっては、通常画サイズの番組ではテロップが検出されるが、ハイビジョン番組ではテロップが検出されないことなどが起こることがある。
以上のような観点から、画サイズが相違する場合でも、整合性のある特徴抽出処理を行うことができる3つの方法について説明する。
(14.1)画像信号を補間して特徴抽出処理を行う方法
この方法は、特徴抽出の対象の画像が、通常画サイズのモニタに表示させた場合に図37左上に示すように黒部分が検出されるものであるときには、特徴抽出処理を行う特徴抽出処理系50に画像信号が入力される前の段階でライン数補間処理を行い、特徴抽出処理の対象となる画像を、図37右上に示すように黒部分が含まれないようにする方法である。
なお、図37左上の表示例では、領域(A)と(B)以外の領域(F)が、番組の内容が表示される有効領域である。また、図37右下の表示例では、領域(A)、(B)、(C)、(D)以外の領域(G)が有効領域である。
補間処理は、有効領域の画像を、黒部分を含めた領域全体の大きさまで(モニタと同じ画サイズまで)引き伸ばすことにより行うことができる。また、補間処理は、所定のラインの画像データを、その近傍のラインの画像データを元にした補間フィルタ処理により生成することにより行うこともできる。
図37の例では、左上から右上に示すように、360ラインを480ラインにする補間処理が行われている。
これは、例えば、地上アナログ放送の通常画サイズである4:3で水平垂直画素数を640×480と仮定した場合、
640/480= 4/3
となり、レターボックスが付加された後の有効領域の画サイズである16:9で水平垂直画素数を640×360と仮定した場合、
640/360= 16/9
となることによる。
すなわち、有効領域のデータに基づいて、360ラインを480ラインにする処理が行われ、480ラインとなった、黒部分がない画像を対象に特徴抽出処理が行われる。
例えば、
360/480=3/4
であるから、図38に示すように、補間処理として、3ラインのデータを入力として4ラインのデータを生成して出力する処理が行われる。
入力される3ラインのデータをそれぞれLn,Ln+1,Ln+2とし、出力される4ラインのうちの1つのラインのデータをHnとした場合、所定の補間係数がk0,k1,k2で与えられるものとすると、出力される1つのラインのデータであるHnは、
Hn = (k0×Ln)+(k1×Ln+1)+(k2×Ln+2)
で表される。
ここで、番組によっては、ダウンコンバートしたハイビジョン番組を通常画サイズのモニタに表示させた場合、図37右下に示すように領域(C)、(D)の左右の部分にも黒部分が含まれるものになる場合があるが、この場合も、以上の処理と同様の処理により、黒部分をなくすように、有効領域のデータに基づいて画像を補間することができる。
すなわち、上下(A)、(B)の領域だけが黒部分である場合は垂直方向だけ補間処理が行われ、上下左右(A)、(B)、(C)、(D)の領域に黒部分がある場合は垂直方向と水平方向の両方向の補間処理が行われることになる。
例えば、図37の右下に示すように補間処理前の水平方向のデータ数は480、右上に示すように補間処理後の水平方向のデータ数は640であり、
480/640=3/4
であるから、この場合も、3列の画像データから4列の画像データを生成することで補間が行われる。
ライン数補間処理、補間フィルタについては、例えば、特開平6−178305号公報、特開平01−194780号公報、特開昭59−112767号公報に開示されている。
図39は、以上のように画像の補間を適宜行い、補間して得られた画像に基づいて特徴データを抽出することによって特徴データの整合性を確保する記録再生装置の一部の構成の例を示すブロック図である。図39に示す構成のうちの一部は、例えば、図16の特徴抽出処理系50内でソフトウェア的に実現される。
画サイズ検出系311では、供給されてきた画像信号に含まれる輝度信号、色差信号から、処理対象の画像が、図37の左上や右下に示すような黒部分を含む画像であるか、または、そのような黒部分を含まない画像であるのかが判定される。画サイズ検出系311に供給される画像に対しては、その前段において、受信された番組の画像の画サイズとモニタの画サイズに応じて、適宜、レターボックスを付加する処理が行われている。
画サイズ検出系311による判定結果はシステムコントローラ系60に入力される。システムコントローラ系60は、処理対象の画像に黒部分が含まれる場合には画像信号補間処理系321の出力が特徴抽出処理系323に出力されるように、また、処理対象の画像に黒部分が含まれない場合には外部から供給されてきた画像信号がそのまま特徴抽出処理系323に出力されるように、画サイズ検出系311による判定結果に応じて切換え処理系322を制御する。
すなわち、画像に黒部分が含まれると判定された場合は、画像信号補間処理系321により補間処理が施された画像信号が特徴抽出処理系323に入力され、特徴抽出処理が行われる。また、黒部分が含まれないと判定された場合は、処理対象の画像が、通常画サイズの番組の画像であると判定され、この場合、画像信号補間処理系321による補間処理は行われないで、外部から供給されてきたそのままの画像信号に基づいて特徴抽出処理が行われる。
画像信号補間処理系321では、外部から供給されてきた画像に黒部分が含まれている場合、上述したようにして補間処理が行われ、補間処理により得られた黒部分がない画像信号が切換え処理系322に出力される。
切換え処理系322では、システムコントローラ系60による制御に従って、画像信号補間処理系321から供給されてきた画像信号と、外部から供給されてきた画像信号のうちのいずれかが選択され、選択された画像信号が特徴抽出処理系323に出力される。
特徴抽出処理系323では、図22を参照して説明したような特徴抽出処理が切換え処理系322から供給されてきた画像信号に基づいて行われ、抽出された特徴を表すデータが外部に出力される。
なお、図37左上に示す上下の領域に黒部分が含まれる場合と、図37右下に示す上下左右の領域に黒部分が含まれる場合とで、補間処理の補間係数が調整されたり、特徴抽出処理系323の処理方法が変更されるようにしてもよい。
(14.2)特徴データを補正する方法
この方法は、特徴抽出処理に用いられる画像信号は外部から供給されてきたものを用い(画像信号の補間は行わず)、特徴抽出処理により得られた特徴データに対して適宜補正を行う方法である。
例えば、通常画サイズの地上アナログ放送の番組であって、図40に斜線を付して示す下側のブロック領域57〜64に特徴量Sが検出される番組がある場合において、それと同じ内容の番組が地上デジタル放送のハイビジョン番組として放送されており、ダウンコンバート処理を施してそのハイビジョン番組を通常画サイズのモニタに表示させたとき、図41に斜線を付して示すブロック領域50〜55の領域で、上記特徴量Sの抽出に用いられた領域(ブロック領域57〜64)に対応する領域の特徴量である特徴量Tが検出されることがある。
図40に示すように、地上アナログ放送の番組の画素数が横640×縦480、画サイズが4:3であり、それと同じ番組であるハイビジョン番組の画サイズが16:9であれば、そのハイビジョン番組を通常画サイズのモニタに表示させた場合、横の画素数が640であるときには、縦の画素数yは、
640/y=16/9
からy=360となる。
ここで、図40の画像全体を16:9の画サイズの画像とした場合にどう見えるかを考える。
モニタの画サイズが4:3であるから、上記y=360、横の画素数をxとした場合、
x/360=4/3
となり、x=480となる。
このことから、通常画サイズの4:3の番組を見た場合と、画サイズが16:9のハイビジョン番組をダウンコンバートし、それを通常画サイズのモニタで見た場合とでは、図40のブロック領域1〜64からなる領域全体は、図41のブロック領域10〜15,18〜23,26〜31,34〜39,42〜47,50〜55からなる領域に対応することになる。
図40と図41を比較してわかるように、図40では特徴量Sの抽出に用いられた領域はブロック領域57〜64の8つのブロック領域から構成されるのに対して、図41では特徴量Tの抽出に用いられた領域はブロック領域50〜55の6つのブロック領域から構成されることになり、
8/6=4/3
の割合で、検出される特徴量に違いがあると考えられる。
そこで、例えば補正係数kとして、
k=4/3
と、上記のブロック領域の数の割合に応じた係数を考え、通常画サイズが4:3である画像から抽出された特徴量Sに対して、
T=k×S
のように、ブロック領域の数(特徴抽出に用いられた領域の大きさ)に応じた補正係数を用いて補正を行うことにより、それぞれの画像の対応する位置から抽出される特徴量の間にできるだけ整合性をとることができる。
ここでは、補正係数の設定方法を、特徴量とその特徴量の検出領域数が単純に比例関係にあるものとして考えたが、例えば、特徴点を設定するかしないかの特徴量に基づく判定に用いられる閾値を設定する際に、補正係数が用いられるようにしてもよい。
また、ここでは、画像系の特徴量の例としてテロップ特徴データを考えたが、他の画像系の特徴量を抽出する場合にも同様に考えることができ、その場合、補正係数kは、抽出する特徴データの種類に応じて変更されるようにしてもよい。
図42は、以上のように特徴データの補正を適宜行うことによって特徴データの整合性を確保する記録再生装置の一部の構成の例を示すブロック図である。図39に示す構成と同じ構成には同じ符号を付してある。
画サイズ検出系311では、供給されてきた画像信号に含まれる輝度信号、色差信号から、処理対象の画像が、黒部分を含む画像であるか、含まない画像であるかが判定される。
画サイズ検出系311による判定結果はシステムコントローラ系60に出力される。システムコントローラ系60は、処理対象の画像に黒部分が含まれる場合、特徴抽出処理系331により得られた特徴データの補正を特徴データ補正処理系332に行わせるとともに、その特徴データ補正処理系332により補正された特徴データが外部に出力されるように切換え処理系333を制御する。また、システムコントローラ系60は、処理対象の画像に黒部分が含まれない場合、特徴抽出処理系331により得られた特徴データがそのまま外部に出力されるように切換え処理系333を制御する。
特徴抽出処理系331では、外部から供給されてきた画像信号から特徴が抽出され、抽出された特徴を表す特徴データが特徴データ補正処理系332と切換え処理系333に出力される。
特徴データ補正処理系332では、特徴抽出処理系331から供給されてきた特徴データが、例えば、抽出された特徴の種類に応じた補正係数が用いられて補正され、補正して得られた特徴データが切換え処理系333に出力される。すなわち、特徴データ補正処理系332は、図43に示すように、それぞれの特徴データを補正する複数の処理系からなり、図43の例においては、特徴抽出処理系331により抽出された色特徴を補正する色特徴補正処理系341、特徴抽出処理系331により抽出された類似特徴を補正する類似特徴補正処理系342、特徴抽出処理系331により抽出されたテロップ特徴を補正するテロップ特徴補正処理系343が示されている。
図42の説明に戻り、切換え処理系333では、システムコントローラ系60による制御に従って、特徴抽出処理系331から供給されてきた特徴データと、特徴データ補正処理系332から供給されてきた補正後の特徴データのうちのいずれかが選択され、選択された特徴データが外部に出力される。
(14.3)特徴抽出処理に用いる処理範囲を変更する方法
この方法は、特徴抽出処理に用いる処理範囲を、画像に含まれる黒部分に応じて適宜変更する方法である。
図44は、処理範囲を適宜変更して特徴抽出処理を行うことによって特徴データの整合性を確保する記録再生装置の一部の構成の例を示すブロック図である。図39等に示す構成と同じ構成には同じ符号を付してある。
画サイズ検出系311では、供給されてきた画像信号に含まれる輝度信号、色差信号から、処理対象の画像が、黒部分を含む画像であるか、含まない画像であるかが判定される。
画サイズ検出系311による判定結果はシステムコントローラ系60に出力される。システムコントローラ系60は、処理対象の画像に黒部分が含まれる場合、その画像全体のうち、黒部分を除いた有効領域の範囲のみのデータを用いて特徴抽出処理系351に特徴抽出処理を行わせ、画像に黒部分が含まれない場合、画像全体を対象として特徴抽出処理系351に特徴抽出処理を行わせる。
特徴抽出処理系351では、処理対象の画像のうち、システムコントローラ系60により指定された範囲の画像データが用いられて特徴が抽出され、抽出された特徴を表す特徴データが外部に出力される。
以上のような構成により、図40に示す黒部分が含まれない画像が処理対象となっている場合、例えば、テロップ特徴検出に用いられる範囲がブロック領域57〜64の範囲となるようにシステムコントローラ系60により制御される。また、図41に示す上下に黒部分が含まれる画像が処理対象となっている場合、テロップ特徴検出に用いられる範囲がブロック領域50〜55となるようにシステムコントローラ系60により制御される。
(14.4)動作フローチャート
(14.4.1)画像信号を補間して特徴抽出処理を行う方法(方法1)の場合
はじめに、図45のフローチャートを参照して、画像信号を補間して特徴抽出処理を行う一連の処理について説明する。
ステップS31において、図39の画サイズ検出系311により黒部分の検出、画サイズの判定(属性判定)が行われ、ステップS32に進み、システムコントローラ系60により、処理対象の画像が、黒部分が含まれない第1の属性の画像であるか否かが画サイズ検出系311による属性判定の結果に基づいて判定される。
ステップS32において、処理対象の画像が、黒部分が含まれる属性の画像であると判定された場合、ステップS33に進み、画像信号補間処理系321による信号処理として画像の補間処理が行われる。この処理により黒部分が除かれた画像は切換え処理系322に出力される。
ステップS33において画像の補間処理が行われた後、または、ステップS32において、処理対象の画像が、黒部分が含まれない第1の属性の画像であると判定された場合、ステップS34に進み、特徴抽出処理系323により特徴抽出処理が行われる。
すなわち、処理対象の画像が、黒部分が含まれる属性の画像であると判定された場合、画像信号補間処理系321において補間処理が施された信号が特徴抽出処理系323に入力され、特徴抽出処理が行われる。また、黒部分が含まれない第1の属性の画像であると判定された場合、外部から供給されてきたそのままの画像信号に基づいて特徴抽出処理が行われる。
特徴抽出処理系323により抽出された特徴データは外部に出力され、ステップS35において例えば記録媒体Aなどに記録される。また、ステップS35においては、特徴データに基づいて生成されたプレイリストデータやチャプターデータが記録媒体Aなどに記録される。
ステップS36において、処理を終了するか否かが判定され、例えば、処理対象の画像がまだ供給されてくることから処理を終了しないと判定された場合、ステップS31以降の処理が繰り返される。一方、ステップS36において、処理を終了すると判定された場合、処理は終了される。
(14.4.2)特徴データを補正する方法(方法2)の場合
次に、図46のフローチャートを参照して、抽出された特徴データに適宜補正を行う処理について説明する。
ステップS51において、図42の特徴抽出処理系331により特徴抽出処理が行われる。特徴抽出処理系331により得られた特徴データは特徴データ補正処理系332と切換え処理系333に出力される。
ステップS52において、画サイズ検出系311により黒部分の検出、画サイズの判定(属性判定)が行われ、ステップS53に進み、システムコントローラ系60により、処理対象の画像が、黒部分が含まれない第1の属性の画像であるか否かが画サイズ検出系311による属性判定の結果に基づいて判定される。
ステップS53において、処理対象の画像が、黒部分が含まれる属性の画像であると判定された場合、ステップS54に進み、特徴データ補正処理系332による信号処理として、ステップS51で特徴抽出処理系331により抽出された特徴データの補正処理が行われる。特徴抽出処理系331により補正された特徴データは切換え処理系333に出力される。
ステップS54において特徴データの補正処理が行われた後、または、ステップS53において、処理対象の画像が、黒部分が含まれない第1の属性の画像であると判定された場合、ステップS55に進み、切換え処理系333から出力された特徴データが例えば記録媒体Aなどに記録される。また、ステップS55においては、特徴データに基づいて生成されたプレイリストデータやチャプターデータが記録媒体Aなどに記録される。
すなわち、処理対象の画像が、黒部分が含まれる属性の画像であると判定された場合、特徴データ補正処理系332において補正処理が施された特徴データが外部に出力され、記録される。また、黒部分が含まれない第1の属性の画像であると判定された場合、特徴抽出処理系331により抽出された特徴データがそのまま外部に出力され、記録される。
ステップS56において、処理を終了するか否かが判定され、例えば、処理対象の画像がまだ供給されてくることから処理を終了しないと判定された場合、ステップS51以降の処理が繰り返される。一方、ステップS56において、処理を終了すると判定された場合、処理は終了される。
(14.4.3)特徴抽出処理の処理範囲を変更する方法(方法3)の場合
図47のフローチャートを参照して、処理範囲を変更して行う特徴抽出処理について説明する。
ステップS71において、図44の画サイズ検出系311により黒部分の検出、画サイズの判定(属性判定)が行われ、ステップS72に進み、システムコントローラ系60により、処理対象の画像が、黒部分が含まれない第1の属性の画像であるか否かが画サイズ検出系311による判定結果に基づいて判定される。
ステップS72において、処理対象の画像が、黒部分が含まれない第1の属性の画像であると判定された場合、ステップS73に進み、システムコントローラ系60による制御に従って、画像全体を対象とした特徴抽出処理(特徴抽出処理1)が特徴抽出処理系351により行われる。
一方、ステップS72において、処理対象の画像が、黒部分が含まれる属性の画像であると判定された場合、ステップS74に進み、システムコントローラ系60による制御に従って、黒部分を除いた有効領域の範囲のみの画像データを対象とした特徴抽出処理(特徴抽出処理2)が特徴抽出処理系351により行われる。
ステップS73またはS74の処理において抽出された特徴データは外部に出力され、ステップS75において例えば記録媒体Aなどに記録される。また、ステップS75においては、特徴データに基づいて生成されたプレイリストデータやチャプターデータが記録媒体Aなどに記録される。
ステップS76において、処理を終了するか否かが判定され、例えば、処理対象の画像がまだ供給されてくることから処理を終了しないと判定された場合、ステップS71以降の処理が繰り返される。一方、ステップS76において、処理を終了すると判定された場合、処理は終了される。
以上のいずれの処理によっても、通常画サイズの地上アナログ放送の番組と、画サイズが16:9の地上デジタル放送のハイビジョン番組のいずれの番組のデータからでも、整合性のとれた特徴データを抽出することができ、それにより定められる特徴点、ダイジェスト再生区間などをほぼ同じ位置に設定することが可能になる。
これにより、通常画サイズの地上アナログ放送の番組と、画サイズが16:9の地上デジタル放送のハイビジョン番組が同じ内容の番組である場合であっても、例えばダイジェスト再生を指示したときにはほぼ同じ区間が再生されることになり、番組毎に再生区間が異なることによりユーザが違和感を感じるといったことを防止することができる。
また、以上のような構成をもって処理が行われることにより、通常画サイズの地上アナログ放送の番組の処理を行う場合と、画サイズが16:9の地上デジタル放送のハイビジョン番組の処理を行う場合とで共通の構成を用いることができ、それぞれの番組を処理する専用の構成をそれぞれ用意する必要がない。
以上においては、通常DVDより高画質での記録が可能なフォーマットとして、BDフォーマット、またはHD-DVDフォーマットが用いられるものとしたが、フォーマットはこれに限定されるものではなく、例えば、BDフォーマットとHD-DVDフォーマットの双方に汎用性を持たせた1つのフォーマットであってもよい。
上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。この場合、そのソフトウェアを実行させる装置は、例えば、図48に示されるようなパーソナルコンピュータにより構成される。
図48において、CPU(Central Processing Unit)401は、ROM(Read Only Memory)402に記憶されているプログラム、または、記憶部408からRAM(Random Access Memory)403にロードされたプログラムに従って各種の処理を実行する。RAM403にはまた、CPU401が各種の処理を実行する上において必要なデータなどが適宜記憶される。
CPU401、ROM402、およびRAM403は、バス404を介して相互に接続されている。このバス404にはまた、入出力インタフェース405も接続されている。
入出力インタフェース405には、キーボード、マウスなどよりなる入力部406、LCD(Liquid Crystal Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部407、ハードディスクなどより構成される記憶部408、ネットワークを介しての通信処理を行う通信部409が接続されている。
入出力インタフェース405にはまた、必要に応じてドライブ410が接続される。ドライブ410には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどよりなるリムーバブルメディア411が適宜装着され、それから読み出されたコンピュータプログラムが必要に応じて記憶部408にインストールされる。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば、汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。
この記録媒体は、図48に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(登録商標)(Mini-Disk)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア411により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM402や、記憶部408に含まれるハードディスクなどで構成される。
なお、本明細書において、各ステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
特徴データの整合性について説明する図である。 特徴データの整合性について説明する他の図である。 2記録方式での記録の例を示す図である。 2記録方式での記録の他の例を示す図である。 再生の例を示す図である。 プレイリストをテキストデータとして表示した場合の例を示す図である。 特徴データ、特殊再生用データの記録先の組合せの例を示す図である。 特徴データとプレイリストデータの記録状態の例を示す図である。 ディスク状の記録媒体を上方から見た図である。 特徴データ、特殊再生用データの記録先の組合せの他の例を示す図である。 同じコンテンツを複数の記録方式で記録する記録側の構成例を示すブロック図である。 同じコンテンツを複数の記録方式で記録する記録側の他の構成例を示すブロック図である。 記録順序の例を示す図である。 ダイジェスト再生およびチャプター処理について説明する図である。 チャプター画像の表示例を示す図である。 記録再生装置全体の構成例を示すブロック図である。 メッセージの表示例を示す図である。 他のメッセージの表示例を示す図である。 記録再生装置全体の他の構成例を示すブロック図である。 音声系の特徴抽出を行う構成の例を示すブロック図である。 音声系の特徴抽出を行う構成の他の例を示すブロック図である。 画像系の特徴抽出を行う構成の例を示すブロック図である。 シーンチェンジの検出に用いられる領域の例を示す図である。 テロップ領域、カラー特徴の検出に用いられる領域の例を示す図である。 記録媒体Aのデータの記録状況と、記録媒体Bに記録することが可能な記録方式の組合せの例を示す図である。 MPEG方式におけるデータ属性を示す図である。 データの記録容量の例を示す図である。 各時間帯に採用される記録方式の例を示す図である。 各時間帯に採用される記録方式の他の例を示す図である。 記録時間と記録容量の特性の例を示す図である。 記録処理について説明するフローチャートである。 記録処理について説明する、図31に続くフローチャートである。 記録再生装置の一部の構成例を示すブロック図である。 番組の表示例を示す図である。 特徴データの整合性をとることができない理由について説明する図である。 特徴データの整合性をとることができない理由について説明する他の図である。 補間の例を示す図である。 補間の例を示す図である。 記録再生装置の一部の構成例を示すブロック図である。 特徴量の検出領域の例を示す図である。 特徴量の検出領域の例を示す図である。 記録再生装置の一部の構成例を示すブロック図である。 図42の特徴データ補正処理系の詳細な構成例を示すブロック図である。 記録再生装置の一部の構成例を示すブロック図である。 画像信号を補間して特徴抽出処理を行う一連の処理について説明するフローチャートである。 特徴抽出処理の後に補正処理を行う処理について説明するフローチャートである。 処理範囲を変更して行う特徴抽出処理について説明するフローチャートである。 パーソナルコンピュータの構成例を示すブロック図である。
符号の説明
1 記録媒体, 2−1 信号処理系(信号処理方式1), 2−2 信号処理系(信号処理方式2), 10−1 信号処理系(信号処理方式1), 10−2 信号処理系(信号処理方式2), 21 記録方式1エンコード処理系, 22 記録方式2エンコード処理系, 23 特徴データ信号処理系, 24 記録方式1記録信号処理系, 25 記録方式2記録信号処理系, 26 プレイリストデータ(チャプターデータ)信号処理系, 27 メモリ系, 301 地上デジタル受信処理系, 302 地上アナログ受信処理系, 311 画サイズ検出系, 321 画像信号補間処理系, 322 切換え処理系, 323 特徴抽出処理系, 331 特徴抽出処理系, 332 特徴データ補正処理系, 333 切換え処理系, 351 特徴抽出処理系

Claims (14)

  1. 処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像を前記モニタに表示したときに有効となる領域のデータに基づいて、前記モニタの画サイズと同じ画サイズの画像を生成する生成手段と、
    前記生成手段により生成された画像から第1の特徴を抽出する抽出手段と
    を備える情報処理装置。
  2. 前記抽出手段は、さらに、前記処理対象の画像の画サイズが前記モニタの画サイズと同じである場合、前記処理対象の画像から第2の特徴を抽出する
    請求項1に記載の情報処理装置。
  3. 前記抽出手段により抽出された前記第1の特徴を表すデータを、前記モニタの画サイズと異なる画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させるとともに、前記第2の特徴を表すデータを、前記モニタの画サイズと同じ画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして前記所定の記録媒体に記録させる記録制御手段をさらに備える
    請求項2に記載の情報処理装置。
  4. 画像の特徴を抽出する情報処理方法において、
    処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像を前記モニタに表示したときに有効となる領域のデータに基づいて、前記モニタの画サイズと同じ画サイズの画像を生成する生成ステップと、
    前記生成ステップの処理により生成された画像から特徴を抽出する抽出ステップと
    を含む情報処理方法。
  5. 画像の特徴を抽出する処理をコンピュータに実行させるプログラムにおいて、
    処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像を前記モニタに表示したときに有効となる領域のデータに基づいて、前記モニタの画サイズと同じ画サイズの画像を生成する生成ステップと、
    前記生成ステップの処理により生成された画像から特徴を抽出する抽出ステップと
    を含むプログラム。
  6. 処理対象の画像から特徴を抽出する抽出手段と、
    前記処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像のうちの特徴抽出に用いられた領域と、前記処理対象の画像を前記モニタに表示したときに有効となる領域のうちの、前記特徴抽出に用いられた領域に対応する領域との大きさの比に基づいて、前記モニタの画サイズと異なる画サイズの画像から前記抽出手段により抽出された特徴を補正する補正手段と
    を備える情報処理装置。
  7. 前記補正手段により補正された特徴を表すデータを、前記モニタの画サイズと異なる画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させるとともに、前記モニタの画サイズと同じ画サイズの画像から前記抽出手段により抽出された特徴を表すデータを、前記モニタの画サイズと同じ画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして前記所定の記録媒体に記録させる記録制御手段をさらに備える
    請求項6に記載の情報処理装置。
  8. 画像の特徴を抽出する情報処理方法において、
    処理対象の画像から特徴を抽出する抽出ステップと、
    前記処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像のうちの特徴抽出に用いられた領域と、前記処理対象の画像を前記モニタに表示したときに有効となる領域のうちの、前記特徴抽出に用いられた領域に対応する領域との大きさの比に基づいて、前記モニタの画サイズと異なる画サイズの画像から前記抽出ステップの処理により抽出された特徴を補正する補正ステップと
    を含む情報処理方法。
  9. 画像の特徴を抽出する処理をコンピュータに実行させるプログラムにおいて、
    処理対象の画像から特徴を抽出する抽出ステップと、
    前記処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像のうちの特徴抽出に用いられた領域と、前記処理対象の画像を前記モニタに表示したときに有効となる領域のうちの、前記特徴抽出に用いられた領域に対応する領域との大きさの比に基づいて、前記モニタの画サイズと異なる画サイズの画像から前記抽出ステップの処理により抽出された特徴を補正する補正ステップと
    を含むプログラム。
  10. 処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像のうちの、前記処理対象の画像をモニタに表示したときに有効となる領域から第1の特徴を抽出する抽出手段を備える情報処理装置。
  11. 前記抽出手段は、さらに、前記処理対象の画像の画サイズが前記モニタの画サイズと同じである場合、前記処理対象の画像の全ての領域から第2の特徴を抽出する
    請求項10に記載の情報処理装置。
  12. 前記抽出手段により抽出された前記第1の特徴を表すデータを、前記モニタの画サイズと異なる画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして所定の記録媒体に記録させるとともに、前記第2の特徴を表すデータを、前記モニタの画サイズと同じ画サイズの画像からなるコンテンツの再生時に再生位置を特定するために参照されるデータとして前記所定の記録媒体に記録させる記録制御手段をさらに備える
    請求項11に記載の情報処理装置。
  13. 画像の特徴を抽出する情報処理方法において、
    処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像のうちの、前記処理対象の画像をモニタに表示したときに有効となる領域から特徴を抽出する抽出ステップを含む情報処理方法。
  14. 画像の特徴を抽出する処理をコンピュータに実行させるプログラムにおいて、
    処理対象の画像の画サイズがモニタの画サイズと異なる場合、前記処理対象の画像のうちの、前記処理対象の画像をモニタに表示したときに有効となる領域から特徴を抽出する抽出ステップを含むプログラム。
JP2005177646A 2005-06-17 2005-06-17 情報処理装置および方法、並びにプログラム Withdrawn JP2006352631A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005177646A JP2006352631A (ja) 2005-06-17 2005-06-17 情報処理装置および方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005177646A JP2006352631A (ja) 2005-06-17 2005-06-17 情報処理装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2006352631A true JP2006352631A (ja) 2006-12-28

Family

ID=37647971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005177646A Withdrawn JP2006352631A (ja) 2005-06-17 2005-06-17 情報処理装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2006352631A (ja)

Similar Documents

Publication Publication Date Title
JP2006331591A (ja) 情報処理装置および方法、並びにプログラム
JP4546467B2 (ja) コンテンツ蓄積システム、ホームサーバ装置、情報提供装置、集積回路、及びプログラム
JP4683116B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび撮像装置
JPWO2007039994A1 (ja) ダイジェスト作成装置およびそのプログラム
JP2007134010A (ja) 情報処理装置、表示方法及びそのプログラム
ZA200502463B (en) Apparatus for recording a main file and auxiliary files in a track on a record carrier
KR20060027826A (ko) 비디오 처리장치, 비디오 처리장치용 집적회로, 비디오처리방법, 및 비디오 처리 프로그램
TWI254281B (en) Trick mode audio playback
JPWO2006016590A1 (ja) 情報信号処理方法、情報信号処理装置及びコンピュータプログラム記録媒体
US7801420B2 (en) Video image recording and reproducing apparatus and video image recording and reproducing method
JP2012054672A (ja) 記録再生装置
JP2006303869A (ja) 特定条件区間検出装置および特定条件区間検出方法
JP4683277B2 (ja) 再生装置および方法、並びにプログラム
JP4600236B2 (ja) 再生装置、記録再生装置、データ処理方法及びそのプログラム
JP2008153920A (ja) 動画像一覧表示装置
JP2007149235A (ja) コンテンツ編集装置、プログラム、及び記録媒体
JPWO2007039995A1 (ja) ダイジェスト作成装置およびそのプログラム
JP2006270233A (ja) 信号処理方法及び信号記録再生装置
WO2010122617A1 (ja) 番組間重複部分検出方法とそれを搭載する映像音声記録装置
JP2006352631A (ja) 情報処理装置および方法、並びにプログラム
JP2006333279A (ja) 記録装置および方法、並びにプログラム
JP4230402B2 (ja) サムネイル画像抽出方法、装置、プログラム
JP2005328329A (ja) 映像再生装置と映像録画再生装置と映像再生方法
JP4551734B2 (ja) 変速再生装置及び変速再生方法
JP4335175B2 (ja) 情報再生装置、情報再生方法及びコンピュータプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902