JP2009033413A - 情報処理装置及び情報処理方法、並びにプログラム - Google Patents

情報処理装置及び情報処理方法、並びにプログラム Download PDF

Info

Publication number
JP2009033413A
JP2009033413A JP2007194505A JP2007194505A JP2009033413A JP 2009033413 A JP2009033413 A JP 2009033413A JP 2007194505 A JP2007194505 A JP 2007194505A JP 2007194505 A JP2007194505 A JP 2007194505A JP 2009033413 A JP2009033413 A JP 2009033413A
Authority
JP
Japan
Prior art keywords
classification
program
content
unit
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007194505A
Other languages
English (en)
Other versions
JP4992592B2 (ja
Inventor
Shunji Yoshimura
俊司 吉村
Hiroshige Okamoto
裕成 岡本
Tatsuya Narahara
立也 楢原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007194505A priority Critical patent/JP4992592B2/ja
Priority to US12/220,385 priority patent/US8234278B2/en
Priority to CN2008101442526A priority patent/CN101355673B/zh
Publication of JP2009033413A publication Critical patent/JP2009033413A/ja
Application granted granted Critical
Publication of JP4992592B2 publication Critical patent/JP4992592B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】チャプタが付与されるチャプタ点の検出に適した番組の分類を検出する。
【解決手段】記録再生装置1では、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15は、番組の特徴量を抽出し、識別部17は、特徴ベクトル生成部16から供給された、抽出された特徴量からなる特徴ベクトルに基づいて、番組の分類を識別し、チャプタ点検出部18は、検出された番組の分類に基づいて、チャプタ点を検出する。検出されたチャプタ点にチャプタが付与されて、ダイジェスト再生が行われる。本発明は、例えば、ビデオレコーダに適用できる。
【選択図】図1

Description

本発明は、情報処理装置及び情報処理方法、並びにプログラムに関し、特に、コンテンツの分類に応じてコンテンツに対して所定の処理を行う場合において、その処理に最適なコンテンツの分類を識別し、識別した分類に応じた方法でその処理を実行することができるようにした情報処理装置及び情報処理方法、並びにプログラムに関する。
デジタルテレビジョン放送の普及に伴い電子番組表(EPG(Electric Program Guide))の利用も一般的なものとなってきている。
EPGを構成するデータには、番組のタイトルや放送日時の他、番組がニュース番組であるかサッカー番組であるかなどのジャンルを示す情報(以下、ジャンル情報と称する)などの番組の分類を示す情報が含まれている。
ところでこのEPGから得られる番組のジャンル情報は、記録再生装置における各種の機能に利用されている。
例えば、録画した大量の映像の内容を簡単に把握することができるように、録画した映像から、要約映像を作成して再生するいわゆるダイジェスト再生機能が存在するが、このダイジェスト再生では、その精度を向上させる用途として番組のジャンル情報が利用されている(特許文献1参照)。
特許文献1では、録画された映像から検出された所定の特徴量が、EPGから取得された番組のジャンル情報に基づいて重み付けされ、その結果に基づいてダイジェスト再生される映像が決定される。
特開2003−283993号公報
しかしながら、EPGは、主として、視聴者が番組選択するのに便利なように、例えば放送局側において作成されるものであって、それに示されているジャンル情報も、視聴者の番組選択に対応した分類となっている。従ってその分類が、機器側の処理(例えば、ダイジェスト再生)に必ずしも適していない場合がる。
本発明は、このような状況に鑑みてなされたものであり、機器側の処理に最適なコンテンツの分類を識別することができるようにするものである。
本発明の一側面の情報処理装置は、コンテンツの特徴量を抽出する抽出手段と、前記抽出手段により抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別手段と、前記コンテンツに対する所定の処理を、前記識別手段により識別された分類に応じた方法で実行する実行手段とを備える。
前記実行手段は、前記識別手段により識別された前記分類に応じて、前記所定の処理の方法を選択し、選択したその方法で、前記所定の処理を実行することができる。
前記コンテンツは、ビデオデータを含んで構成されており、前記所定の処理は、前記コンテンツから、ダイジェスト再生されるチャプタ点を検出する処理であり、前記実行手段は、前記識別手段により識別された前記分類に応じて、チャプタ点検出に利用する特徴量及びその特徴量に基づいてチャプタ点を検出するための演算方法を選択し、選択したその特徴量及び演算方法で、チャプタ点を検出することができる。
所定の分類に属する所定のコンテンツを前記所定の分類に識別することができるパラメータを生成する学習手段をさらに備え、前記識別手段は、前記学習手段により生成されたパラメータに基づいて、前記コンテンツの分類を識別することができる。
前記識別手段は、外部の学習装置により生成された所定の分類に属する所定のコンテンツを前記所定の分類に識別することができるパラメータを入力し、入力したパラメータに基づいて、前記コンテンツの分類を識別することができる。
本発明の一側面の情報処理方法は、コンテンツの特徴量を抽出する抽出ステップと、前記抽出ステップの処理で抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別ステップと、前記コンテンツに対する所定の処理を、前記識別ステップの処理で識別された分類に応じた方法で実行する実行ステップとを含む。
本発明の一側面のプログラムは、コンテンツに対する所定の処理を実行する情報処理をコンピュータに実行させるプログラムにおいて、前記コンテンツの特徴量を抽出する抽出ステップと、前記抽出ステップの処理で抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別ステップと、前記コンテンツに対する所定の処理を、前記識別ステップの処理で識別された分類に応じた方法で実行する実行ステップとを含む。
本発明の一側面の情報処理装置、情報処理方法、又はプログラムにおいては、コンテンツの特徴量が抽出され、抽出された前記特徴量に基づいて前記コンテンツの分類が識別され、前記コンテンツに対する所定の処理が、識別された分類に応じた方法で実行される。
本発明の一側面によれば、実行される所定の処理に最適なコンテンツの分類を識別することができ、その分類に応じた方法で所定の処理をコンテンツに対して実行することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の一側面の情報処理装置は、
コンテンツの特徴量を抽出する抽出手段(例えば、図1のオーディオ特徴量抽出部14又はビデオ特徴量抽出部15)と、
前記抽出手段により抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別手段(例えば、図1の識別部17)と、
前記コンテンツに対する所定の処理を、前記識別手段により識別された分類に応じた方法で実行する実行手段(例えば、図1のチャプタ点検出部18)と
を備える情報処理装置。
本発明の情報処理方法又はプログラムは、
コンテンツの特徴量を抽出する抽出ステップ(例えば、図1のオーディオ特徴量抽出部14又はビデオ特徴量抽出部15の処理)と、
前記抽出ステップの処理で抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別ステップ(例えば、図1の識別部17の処理)と、
前記コンテンツに対する所定の処理を、前記識別ステップの処理で識別された分類に応じた方法で実行する実行ステップ(例えば、図1のチャプタ点検出部18の処理)と
を含む情報処理方法。
図1は、本発明を適用した記録再生装置1の構成例を示している。この記録再生装置1は、受信されたデジタルテレビジョン放送の番組を録画し、録画した番組をダイジェスト再生することができる機能を有している。記録再生装置1は、ダイジェスト再生を行うに当り、ダイジェスト再生において再生される映像を検出し、その映像にチャプタを付与するが、後述するように、チャプタが付与される映像(以下、適宜、チャプタ点と称する)の検出に適した番組の分類を識別し、識別したその番組の分類に応じた方法で、チャプタ点を検出する。
データ分離部11には、図示せぬ受信部から供給された、その受信部により受信された、例えばデジタルテレビジョン放送波のデジタルデータが入力される。データ分離部11は、入力されたデジタルデータからEPG(電子番組ガイド)データ、及びオーディオデータとビデオデータ(以下、適宜、AVデータと称する)に分離する。
データ分離部11は、分離したEPGデータを保持部22に供給して保持させ、分離したAVデータを、入力制御部12に供給する。
入力制御部12は、受信された放送番組の録画が行われるとき、データ分離部11から供給されたAVデータを、保持部20に供給して保持させる。
入力制御部12はまた、データ分離部11から供給されたAVデータを、チャプタ点検出対象としてデコーダ13にする。
デコーダ13は、入力制御部12から供給されたチャプタ点検出対象としてのAVデータ、又は保持部20からチャプタ点検出対象として読み出したAVデータを、オーディオデータとビデオデータに分離し、オーディオデータをオーディオ特徴量抽出部14に、ビデオデータをビデオ特徴量抽出部15に、それぞれ供給する。
オーディオ特徴量抽出部14は、デコーダ13から供給されたオーディオデータから、音量、周波数スペクトラム、左右チャンネル相関値などを、オーディオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
ビデオ特徴量抽出部15は、デコーダ13から供給されたビデオデータから、色ヒストグラム、差分画像、縮小画像などを、ビデオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
特徴ベクトル生成部16は、オーディオ特徴量抽出部14又はビデオ特徴量抽出部15から供給された特徴量の中から、識別部17において、チャプタ点が付される番組の分類を識別するのに用いる所定の特徴量を選択し、選択した特徴量を要素とするベクトル(以下、特徴ベクトルと称する)を生成する。特徴ベクトル生成部16は、生成した特徴ベクトルを、識別部17に供給する。
識別部17は、特徴ベクトル生成部16から供給された特徴ベクトルに基づいて、番組の分類(いまの例の場合、チャプタ点を検出するのに適した番組の分類)を識別する。
例えば識別部17は、線形識別器、非線形識別器、又はニューラルネットなどの識別器で構成され、特徴ベクトルを構成する各要素を、学習器31により設定された識別パラメータに基づいて生成した直線や曲線等で分割した所定の特徴空間に配置し、配置した各要素の分布が属する特徴空間の分割領域に基づいて、番組の分類を識別する。
識別部17は、識別結果として、番組の分類を示す情報(以下、分類情報と称する)を、チャプタ点検出部18に供給する。
チャプタ点検出部18は、識別部17から供給された分類情報が示す番組の分類に応じて、チャプタ点を検出し、検出したチャプタ点を示す情報(以下、チャプタ点情報と称する)を、保持部19に供給して保持させる。
例えばチャプタ点検出部18は、オーティオ特徴量抽出部14又はビデオ特徴量抽出部15から供給される特徴量の中から、番組の分類に応じた特徴量を選択するとともに、番組の分類に応じた演算処理を実行する。
すなわちこの場合、チャプタ点検出部18は、番組の分類に応じた特徴量の選択及び演算を実行するための実行データ(例えば、パラメータやアルゴリズムを含むプログラム)を、番組の分類毎に保持しており、番組の分類に応じた実行データを選択して実行することにより、チャプタ点を検出する。
再生部21は、保持部20に保持されているAVデータを読み出して、通常の再生やダイジェスト再生を行う。ダイジェスト再生を行う際は、再生部21は、保持部19に保持されているチャプタ点情報に示されている映像(例えば、フレーム)にチャプタを付与するとともに、チャプタが付与された映像を、保持部20から適宜読み出して再生する。すなわちチャプタが付された映像が間引かれて再生される。
学習器31は、モデルの学習処理を行い、学習の結果として識別部17において番組の分類の識別に用いられるパラメータ、すなわち例えば特徴空間を分割するための直線や曲線を生成するためのパラメータを、識別部17に供給して設定する。
サッカーの試合を放送する番組では、図2に示すように、通常、グランドの映像を含むシーンが多く放送されるので、サッカーの試合を放送する番組からは、例えば緑色の頻度が高い色ヒストグラムが多く(例えば、連続して)得られる。
そこで学習時において学習器31は、図2に示すようなグランドの映像を含むシーンから構成されるサッカーの試合を放送する番組を、分類が「サッカー番組」の教師データとし、教師データから得られるフレーム毎の色ヒストグラムの特徴ベクトルを、識別部17に供給する。そして学習器31は、識別部17からの識別結果を参照して、識別部17が、分類が「サッカー番組」であると識別することができるような識別パラメータ(すなわち、例えば色ヒストグラムから得られた緑色の頻度の特徴空間上の分布が、「サッカー番組」の領域内となるように特徴空間を分割する直線等を生成するための識別パラメータ)を生成し、識別部17に供給して設定する。
また、事件や出来事を報道する番組は、図3に示すように、人物とスタジオの映像を含むシーンが多く放送されるので、事件や出来事を報道する番組からは、人物とスタジオの特有の色の頻度が高い色ヒストグラムが多く得られる。
そこで学習時において学習器31は、図3に示すような人物とスタジオの映像を含むシーンから構成される事件や出来事を報道する番組を、分類が「ニュース番組」の教師データとし、教師データから得られるフレーム毎の色ヒストグラムの特徴ベクトルを識別部17に供給する。そして学習器31は、識別部17からの識別結果を参照して、識別部17が、分類が「ニュース番組」であると識別することができるような識別パラメータ(すなわち、例えば特定の色の頻度の特徴空間上の分布が、「ニュース番組」の領域内となるように特徴空間を分割する直線等を生成するための識別パラメータ)を生成し、識別部17に供給して設定する。
なお教師データを用いないで学習することもできる。例えば特徴空間を、特徴ベクトルの要素の配置などから、いくつかの類型に分類し、その分類が実現できるような識別パラメータが生成される。
図1に戻り制御部41は、記録再生装置1全体を制御し、番組録画、通常再生、ダイジェスト再生等の処理を実行させる。
次に、チャプタ点検出処理を、具体的に説明する。
図4に示すような、サッカーの試合を放送する番組からチャプタ点を検出する場合について説明する。図4の上段には、サッカーの試合を放送する番組を構成する映像が示され、図4の下段には、その映像と同時に出力される音声の音量が示されている。
いまの場合、オーディオ特徴量抽出部14は、デコーダ13から供給された図4に示すように音量が変動する音声のオーディオデータから、音量、周波数スペクトラム、左右チャンネル相関値などを、オーディオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
ビデオ特徴量抽出部15は、デコーダ13から供給された図4に示す映像のビデオデータから、色ヒストグラム、差分画像、縮小画像などを、ビデオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
特徴ベクトル生成部16は、いまの例の場合、オーディオ特徴量抽出部14又はビデオ特徴量抽出部15から供給された特徴量のうち、ビデオ特徴量抽出部15から供給された色ヒストグラムを用いて、特徴ベクトルを生成し、識別部17に供給する。
図4に示した映像からは、図2を参照して上述したように、例えば緑色の頻度が高い色ヒストグラムを多く含む特徴ベクトルが生成され、識別部17に供給される。
識別部17は、緑色の頻度が高い色ヒストグラムを多く含む特徴ベクトルが特徴ベクトル生成部16から供給されると、上述したように、そのような特徴ベクトルからは、番組の分類が「サッカー番組」であることを識別できるように学習しているので、番組の分類が「サッカー番組」であると識別し、その識別結果として、分類が「サッカー番組」であることを示す分類情報を、チャプタ点検出部18に供給する。
サッカーの試合を放送する番組は、キックオフのとき、ゴールチャンスがあったとき、又はゴールがあったとき等の盛り上がっているシーン(図4の例では、図中、上向きの矢印が付されている映像F42,F51,F53)で音量が高くなる特徴がある。
すなわちこの盛り上がっているシーンが、ユーザが興味を有する点であるので、ダイジェスト再生においてはこのシーンが再生されることが望ましい。そこで識別部17から番組の分類が「サッカー番組」であることを示す分類情報が供給された場合、チャプタ点検出部18は、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15から供給された特徴量の中から音量を選択し、一定以上の音量が得られた盛り上がりシーンをチャプタ点とする演算を行う。チャプタ点検出部18は、その演算の結果検出したチャプタ点のチャプタ点情報を、保持部19に供給して保持させる。
このように番組の分類が「サッカー番組」であると識別された場合、盛り上がり点がチャプタ点として検出されると、ダイジェスト再生において、キックオフのとき、ゴールチャンスがあったとき、又はゴールがあったとき等の盛り上がっているシーンの映像F42,F51,F53等が、ダイジェスト再生される。
次に、図5に示すような、事件や出来事を報道する番組からチャプタ点を検出する場合について説明する。
オーディオ特徴量抽出部14は、デコーダ13から供給されたオーディオデータから、音量、周波数スペクトラム、左右チャンネル相関値などを、オーディオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
ビデオ特徴量抽出部15は、デコーダ13から供給された図5に示す映像のビデオデータから、色ヒストグラム、差分画像、縮小画像などを、ビデオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
特徴ベクトル生成部16は、いまの例の場合、オーディオ特徴量抽出部14又はビデオ特徴量抽出部15から供給された特徴量のうち、ビデオ特徴量抽出部15から供給された色ヒストグラムを用いて、特徴ベクトルを生成し、識別部17に供給する。
図5に示した映像からは、図3を参照して上述したように、人物とスタジオの特有の色の頻度が高い色ヒストグラムを多く含む特徴ベクトルが生成されて、識別部17に供給される。
識別部17は、人物とスタジオの特有の色の頻度が高い色ヒストグラムを多く含む特徴ベクトルが特徴ベクトル生成部16から供給されると、上述したように、そのような特徴ベクトルからは、番組の分類が「ニュース番組」であることを識別できるように学習しているので、番組の分類が「ニュース番組」であると識別し、その識別結果として、分類が「ニュース番組」であることを示す分類情報を、チャプタ点検出部18に供給する。
事件や出来事を報道する番組は、報道の内容を説明するアナウンサーの映像と事件等に応じた映像が順次切り替わる(図5の例では、図中、上向きの矢印が付されている映像F61,F63,F71,F72で切り替わっている)特徴がある。
すなわちこの映像が切り替わるシーンが、報道の内容を説明するアナウンサーの映像と報道に応じた映像の冒頭のシーンであるので、ダイジェスト再生においてはこのシーンが再生されることが望ましい。そこで識別部17から番組の分類が「ニュース番組」であることを示す分類情報が供給された場合、チャプタ点検出部18は、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15から供給された特徴量の中から色ヒストグラムと差分画像を選択し、それらを用いて、映像の連続性がない位置(例えば、フレーム)(以下、カット点と称する)(すなわち報道の内容を説明するアナウンサーの映像と報道に応じた映像が切り替わる位置)を、チャプタ点とする演算を実行する。チャプタ点検出部18は、その演算の結果検出したチャプタ点のチャプタ点情報を、保持部19に供給して保持させる。
このように番組が「ニュース番組」であると識別された場合、カット点をチャプタ点として検出されると、ダイジェスト再生において、報道の内容を説明するアナウンサーの映像と報道に応じた映像が切り替わるシーンの映像F42、F51、F53が、ダイジェスト再生される。
次に、図6に示すような、サッカーの試合結果(いわゆるダイジェスト)を紹介する番組からチャプタ点を検出する場合について説明する。
オーディオ特徴量抽出部14は、デコーダ13から供給されたオーディオデータから、音量、周波数スペクトラム、左右チャンネル相関値などを、オーディオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
ビデオ特徴量抽出部15は、デコーダ13から供給された図6に示す映像のビデオデータから、色ヒストグラム、差分画像、縮小画像などを、ビデオの特徴量として抽出し、特徴ベクトル生成部16及びチャプタ点検出部18に供給する。
特徴ベクトル生成部16は、いまの例の場合、オーディオ特徴量抽出部14又はビデオ特徴量抽出部15から供給された特徴量のうち、ビデオ特徴量抽出部15から供給された色ヒストグラムを用いて、特徴ベクトルを生成し、識別部17に供給する。
図6に示した映像からは、人物とスタジオの特有の色の頻度が高い色ヒストグラム多く含む色ヒストグラムが生成されて、識別部17に供給される。
識別部17は、人物とスタジオの特有の色の頻度が高い色ヒストグラムを多く含む特徴ベクトルが特徴ベクトル生成部16から供給されると、上述したように、そのような特徴ベクトルからは、番組の分類が「ニュース番組」であることを識別できるように学習しているので、番組の分類が「ニュース番組」であると識別し、その識別結果として、分類が「ニュース番組」であることを示す分類情報を、チャプタ点検出部18に供給する。
識別部17から番組の分類が「ニュース番組」であることを示す分類情報が供給されると、チャプタ点検出部18は、図5の例の場合と同様に、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15から供給された特徴量の中から色ヒストグラムと差分画像を選択し、それらを用いて、カット点をチャプタ点とする演算を実行する。チャプタ点検出部18は、その演算の結果検出したチャプタ点のチャプタ点情報を、保持部19に供給して保持させる。
サッカーの試合結果(いわゆるダイジェスト)を紹介する番組は、試合結果の内容を説明するアナウンサーの映像と試合の映像が順次切り替わる(図6の例では、図中、上向きの矢印が付されている映像F81,F82,F91,F92で切り替わっている)特徴がある。この特徴は、アナウンサーの映像とそれ以外の映像が順次切り替わる点で、事件や出来事を報道する番組(図5)の特徴に対応している。
すなわちこの映像が切り替わるシーンが、試合内容を説明するアナウンサーの映像と試合の映像の冒頭のシーンであるので、分類が「ニュース番組」とされる番組の場合と同様に、ダイジェスト再生においてはこのシーンが再生されることが望ましい。
図6に示したようなサッカーの試合結果を紹介する番組は、EPGでは、そのジャンルが「サッカー番組」とされるが、このように、分類が「ニュース番組」であると識別し、分類が「ニュース番組」である番組に対する場合と同様な方法で、チャプタ点を検出するようにしたので、サッカーの試合結果を紹介する番組に対して最適なダイジェスト再生を行うことができる。図6の例の場合、試合結果を説明するアナウンサーの映像とその試合に応じた映像が切り替わるシーンの映像F81,F83,F91,F92等が、ダイジェスト再生される。
例えば図6に示す番組に対して、EPGでの分類に応じて、図4の例の場合のように盛り上がり点をチャプタ点として検出すると、ダイジェスト再生において適切な映像を再生することができない。
以上のようにして、ダイジェスト再生で利用されるチャプタ点の検出に適した番組の分類識別が行われ、その分類に基づいてチャプタ点が検出される。
なお以上においては、放送番組をダイジェスト再生する場合に利用されるチャプタ点検出を例として説明したが、他のコンテンツをダイジェスト再生する場合のチャプタ点検出についても同様に適用することができる。例えばカムコーダで撮ったパーソナルコンテンツについても適用することができる。なおパーソナルコンテンツの分類用の学習が必要となるが、図1の例では、学習器31が記録再生装置1に内蔵されているので、その学習が容易となる。
なお学習器31が内蔵されず、外部の学習器で生成された識別パラメータを、記録再生装置1に供給し、識別部17に設定するようにすることもできる。この識別パラメータの記録再生装置1への供給は、識別パラメータを記録再生装置1が読み取り可能な記録媒体に記録させることによって行うこともできるし、記録再生装置1がネットワークと接続されている場合、そのネットワークを介して提供することもできる。
また以上においては、ダイジェスト再生で利用されるチャプタ点の検出に適した番組の分類を識別する場合を例として説明したが、他の処理に適した分類が識別されるようにすることもできる。
また以上においては、分類識別処理が実行されるタイミングについては言及しなかったが、番組を録画とすると同時に行うことができる。すなわち入力制御部12は、AVデータを保持部20に供給して記憶させるとともに(すなわち録画させるとともに)、デコーダ13に供給する。
デコーダ13乃至識別部17は、入力制御部12から供給されたAVデータに基づいて、上述したように分類識別処理を実行する。なおこの際、チャプタ点検出部18は、動作せず、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15から供給された特徴量は、例えばチャプタ点検出部18に保持されるようにすることもできるし、破棄されるようにすることもできる。
なおチャプタ点検出は、番組の録画が完了し、番組の分類が識別された後、保持部20に保持されたAVデータがデコーダ13によって読み出され、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15によって各特徴量が抽出され、チャプタ点検出部18において、抽出された特徴量から先に識別された番組の分類に応じた特徴量が選択されて、チャプタ点が検出される。
また分類識別に必要な特徴ベクトルの特徴量を、番組全体に渡って抽出することもできるし、例えば番組の先頭の所定の時間(例えば、10分間)の部分から抽出することもできる。番組全体に渡って特徴量を抽出する場合には、上述したように番組の録画が完了した後、分類識別が行われるが、番組の一部から特徴量を抽出する場合、オーディオ特徴量抽出部14及びビデオ特徴量抽出部15のそれぞれと、チャプタ点検出部18の間にバッファを設け、特徴ベクトルが生成されて分類が識別されるまでの特徴量をバッファしておけば、分類が識別された後に、直ちにチャプタ点検出を開始することができる。
また以上においては、番組の分類が「ニュース番組」又は「サッカー番組」である場合を例として説明したが、「音楽番組」など、他の分類に識別することができるようにすることができる。歌や演奏を放送する番組には、司会者と出演者との会話の時間が長く、その分類を「ニュース番組」とした方が、ダイジェスト再生におけるチャプタ点を適切に検出することができる場合がある。
また分類は、いわゆるジャンルに相当するものに限らず、他のものであってもよい。歌や演奏を放送する番組には、以下に示すようなタイプがあるが、それらを分類として識別することができれば、ダイジェスト再生におけるチャプタ点検出をさらに適切に行うことができる。
・司会者と出演者との会話などよりも、実際の歌や演奏の時間が長いタイプ
・司会者と出演者との会話などが長いタイプ
・ホールなどの収録であって、観客の声援や拍手が入るタイプ
また以上においては、分類識別に当り、EPGデータを利用しなかったが、保持部22に保持されたEPG情報をさらに利用して番組の分類識別の精度を向上させることもできる。
図7は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207、ハードディスクや不揮発性のメモリなどよりなる記憶部208、ネットワークインタフェースなどよりなる通信部209、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどのリムーバブルメディア211を駆動するドライブ210が接続されている。
以上のように構成されるコンピュータでは、CPU201が、例えば、記憶部208に記憶されているプログラムを、入出力インタフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU201)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア211に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インタフェース205を介して、記憶部208にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部209で受信し、記憶部208にインストールすることができる。その他、プログラムは、ROM202や記憶部208に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
本発明を適用した記録再生装置1の構成例を示すブロック図である。 教師データの例を示す図である。 他の教師データの例を示す図である。 チャプタ点検出対象の番組の例を示す図である。 チャプタ点検出対象の他の番組の例を示す図である。 チャプタ点検出対象の他の番組の例を示す図である。 パーソナルコンピュータの構成例を示すブロック図である。
符号の説明
1 記録再生装置, 11 データ分離部, 12 入力制御部, 13 デコーダ, 14 オーディオ特徴量抽出部, 15 ビデオ特徴量抽出部, 16 特徴ベクトル生成部, 17 識別部, 18 チャプタ点検出部, 19 保持部, 20 保持部, 21 再生部, 22 保持部, 31 学習部, 41 制御部

Claims (7)

  1. コンテンツの特徴量を抽出する抽出手段と、
    前記抽出手段により抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別手段と、
    前記コンテンツに対する所定の処理を、前記識別手段により識別された分類に応じた方法で実行する実行手段と
    を備える情報処理装置。
  2. 前記実行手段は、前記識別手段により識別された前記分類に応じて、前記所定の処理の方法を選択し、選択したその方法で、前記所定の処理を実行する
    請求項1に記載の情報処理装置。
  3. 前記コンテンツは、ビデオデータを含んで構成されており、
    前記所定の処理は、前記コンテンツから、ダイジェスト再生されるチャプタ点を検出する処理であり、
    前記実行手段は、前記識別手段により識別された前記分類に応じて、チャプタ点検出に利用する特徴量及びその特徴量に基づいてチャプタ点を検出するための演算方法を選択し、選択したその特徴量及び演算方法に基づいて、チャプタ点を検出する
    請求項2に記載の情報処理装置。
  4. 所定の分類に属する所定のコンテンツを前記所定の分類に識別することができるパラメータを生成する学習手段をさらに備え、
    前記識別手段は、前記学習手段により生成されたパラメータに基づいて、前記コンテンツの分類を識別する
    請求項1に記載の情報処理装置。
  5. 前記識別手段は、外部の学習装置により生成された所定の分類に属する所定のコンテンツを前記所定の分類に識別することができるパラメータを入力し、入力したパラメータに基づいて、前記コンテンツの分類を識別する
    請求項1に記載の情報処理装置。
  6. コンテンツの特徴量を抽出する抽出ステップと、
    前記抽出ステップの処理で抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別ステップと、
    前記コンテンツに対する所定の処理を、前記識別ステップの処理で識別された分類に応じた方法で実行する実行ステップと
    を含む情報処理方法。
  7. コンテンツに対する所定の処理を実行する情報処理をコンピュータに実行させるプログラムにおいて、
    前記コンテンツの特徴量を抽出する抽出ステップと、
    前記抽出ステップの処理で抽出された前記特徴量に基づいて前記コンテンツの分類を識別する識別ステップと、
    前記コンテンツに対する所定の処理を、前記識別ステップの処理で識別された分類に応じた方法で実行する実行ステップと
    を含む情報処理をコンピュータに実行させるプログラム。
JP2007194505A 2007-07-26 2007-07-26 情報処理装置及び情報処理方法、並びにプログラム Expired - Fee Related JP4992592B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007194505A JP4992592B2 (ja) 2007-07-26 2007-07-26 情報処理装置及び情報処理方法、並びにプログラム
US12/220,385 US8234278B2 (en) 2007-07-26 2008-07-24 Information processing device, information processing method, and program therefor
CN2008101442526A CN101355673B (zh) 2007-07-26 2008-07-28 信息处理装置和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007194505A JP4992592B2 (ja) 2007-07-26 2007-07-26 情報処理装置及び情報処理方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2009033413A true JP2009033413A (ja) 2009-02-12
JP4992592B2 JP4992592B2 (ja) 2012-08-08

Family

ID=40296302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007194505A Expired - Fee Related JP4992592B2 (ja) 2007-07-26 2007-07-26 情報処理装置及び情報処理方法、並びにプログラム

Country Status (3)

Country Link
US (1) US8234278B2 (ja)
JP (1) JP4992592B2 (ja)
CN (1) CN101355673B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010186358A (ja) * 2009-02-13 2010-08-26 Nippon Telegr & Teleph Corp <Ntt> 映像分類方法、映像分類装置および映像分類プログラム
JP2010237946A (ja) * 2009-03-31 2010-10-21 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2017517995A (ja) * 2014-04-11 2017-06-29 サムスン エレクトロニクス カンパニー リミテッド 要約コンテンツサービスのための放送受信装置及び方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9065836B1 (en) * 2012-06-18 2015-06-23 Google Inc. Facilitating role-based sharing of content segments
JP2019021381A (ja) * 2017-07-11 2019-02-07 株式会社デンソー 点火プラグ

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002044572A (ja) * 2000-07-21 2002-02-08 Sony Corp 情報信号処理装置及び情報信号処理方法および情報信号記録装置
WO2007039995A1 (ja) * 2005-09-30 2007-04-12 Pioneer Corporation ダイジェスト作成装置およびそのプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3367268B2 (ja) * 1995-04-21 2003-01-14 株式会社日立製作所 映像のダイジェスト作成装置及び方法
US6160950A (en) * 1996-07-18 2000-12-12 Matsushita Electric Industrial Co., Ltd. Method and apparatus for automatically generating a digest of a program
WO2003005235A1 (en) * 2001-07-04 2003-01-16 Cogisum Intermedia Ag Category based, extensible and interactive system for document retrieval
JP4615166B2 (ja) * 2001-07-17 2011-01-19 パイオニア株式会社 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP4039873B2 (ja) 2002-03-27 2008-01-30 三洋電機株式会社 映像情報記録再生装置
US20070071406A1 (en) * 2005-09-28 2007-03-29 Sanyo Electric Co., Ltd. Video recording and reproducing apparatus and video reproducing apparatus
US8224087B2 (en) * 2007-07-16 2012-07-17 Michael Bronstein Method and apparatus for video digest generation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002044572A (ja) * 2000-07-21 2002-02-08 Sony Corp 情報信号処理装置及び情報信号処理方法および情報信号記録装置
WO2007039995A1 (ja) * 2005-09-30 2007-04-12 Pioneer Corporation ダイジェスト作成装置およびそのプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010186358A (ja) * 2009-02-13 2010-08-26 Nippon Telegr & Teleph Corp <Ntt> 映像分類方法、映像分類装置および映像分類プログラム
JP2010237946A (ja) * 2009-03-31 2010-10-21 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2017517995A (ja) * 2014-04-11 2017-06-29 サムスン エレクトロニクス カンパニー リミテッド 要約コンテンツサービスのための放送受信装置及び方法

Also Published As

Publication number Publication date
US8234278B2 (en) 2012-07-31
JP4992592B2 (ja) 2012-08-08
US20090030947A1 (en) 2009-01-29
CN101355673B (zh) 2011-07-27
CN101355673A (zh) 2009-01-28

Similar Documents

Publication Publication Date Title
JP4482829B2 (ja) 嗜好抽出装置、嗜好抽出方法及び嗜好抽出プログラム
US8139165B2 (en) Television receiver
US8068719B2 (en) Systems and methods for detecting exciting scenes in sports video
JP4767216B2 (ja) ダイジェスト生成装置、方法及びプログラム
US8682132B2 (en) Method and device for detecting music segment, and method and device for recording data
JP2005173569A (ja) オーディオ信号の分類装置及び方法
KR20060027826A (ko) 비디오 처리장치, 비디오 처리장치용 집적회로, 비디오처리방법, 및 비디오 처리 프로그램
US20120089393A1 (en) Acoustic signal processing device and method
JP2005538634A (ja) コンテンツ提示の方法及び装置
CN102265609A (zh) 节目数据处理装置、方法和程序
JP4621607B2 (ja) 情報処理装置及びその方法
JP2002044572A (ja) 情報信号処理装置及び情報信号処理方法および情報信号記録装置
JP2007524321A (ja) ビデオトレーラ
JP2009239729A (ja) コンテンツのシーン出現を通知する装置、方法およびプログラム
JP4992592B2 (ja) 情報処理装置及び情報処理方法、並びにプログラム
JP2003163881A (ja) 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
JP4433027B2 (ja) 信号処理装置、信号処理方法、およびプログラム
KR102255152B1 (ko) 가변적인 크기의 세그먼트를 전송하는 컨텐츠 처리 장치와 그 방법 및 그 방법을 실행하기 위한 컴퓨터 프로그램
JP2008312183A (ja) 情報処理装置および方法、並びにプログラム
JP4712812B2 (ja) 記録再生装置
JP2006311462A (ja) コンテンツ検索装置及びその方法
JP2008108166A (ja) 楽曲選択装置、楽曲選択方法
JP5424306B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP2005167456A (ja) Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置
JP4257563B2 (ja) 情報処理装置および方法、記録媒体、並びにデータベース構築装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110922

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120410

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120423

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4992592

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees