JP5559128B2 - 装置、方法及びプログラム - Google Patents

装置、方法及びプログラム Download PDF

Info

Publication number
JP5559128B2
JP5559128B2 JP2011243018A JP2011243018A JP5559128B2 JP 5559128 B2 JP5559128 B2 JP 5559128B2 JP 2011243018 A JP2011243018 A JP 2011243018A JP 2011243018 A JP2011243018 A JP 2011243018A JP 5559128 B2 JP5559128 B2 JP 5559128B2
Authority
JP
Japan
Prior art keywords
section
music
processing target
video
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011243018A
Other languages
English (en)
Other versions
JP2012037910A (ja
Inventor
祐治 高尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011243018A priority Critical patent/JP5559128B2/ja
Publication of JP2012037910A publication Critical patent/JP2012037910A/ja
Application granted granted Critical
Publication of JP5559128B2 publication Critical patent/JP5559128B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本発明は、装置、方法及びプログラムに関する。
近年、大容量のハードディスク等の記憶装置を搭載した映像音声録画装置が普及している。これに伴い、録画情報のデータ容量が大きくなる傾向にあり、録画情報の中から所望の情報、例えば、歌や楽器等が演奏される音楽区間を効率よく検索するための機能が搭載されている。具体的には、音楽区間の開始位置と終了位置にチャプタ番号を設けることで利用者が容易に所望の音楽区間を検索できるようになっている。
従来の技術として、録画情報に含まれる音声情報に基づいて音楽区間を検出する音楽検出装置がある(例えば、特許文献1)。
この特許文献1の音楽検出装置によると、録画情報中の2チャンネルの音声からなる音声情報を抽出し、2チャンネルの音声のパワーの合計、および2チャンネルの音声のパワーの差を算出し、これらの算出されたパワーの比を求め、パワーの比を閾値と比較して比較結果に基づいて音楽区間かどうかを判定することで、音楽区間を検出することができる。
特開2006−301134号公報
しかし、従来の音楽検出装置によると、音声情報にステレオ効果のある音楽区間を検出することができるが、ステレオ効果のある音楽区間以外の番組区間やCM区間を検出することにより音楽区間の開始位置および終了位置に誤差を生じるという問題がある。
従って、本発明の目的は、音楽区間を精度よく検出する装置、方法及びプログラムを提供することにある。
(1)本発明は、上記目的を達成するため、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する検出部と、前記処理対象情報に含まれる映像情報のうち、前記検出部が検出した第1区間の開始位置と終了位置付近の映像情報の映像変化部分を検出する映像解析部と、前記検出部が検出した前記第1区間の開始位置付近の映像変化部分を新たな開始位置とし、前記第1区間の終了位置付近の映像変化部分を新たな終了位置として、前記第1区間を補正して第2区間とする補正部とを有することを特徴とする装置を提供する。
また、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出するステップと、前記処理対象情報に含まれる映像情報のうち、前記第1区間を検出するステップで検出した第1区間の開始位置と終了位置付近の映像情報の映像変化部分を検出するステップと、前記第1区間を検出するステップで検出した前記第1区間の開始位置付近の映像変化部分を新たな開始位置とし、前記第1区間の終了位置付近の映像変化部分を新たな終了位置として、前記第1区間を補正して第2区間とするステップとを有することを特徴とする方法を提供する。
また、コンピュータに、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する機能と、前記処理対象情報に含まれる映像情報のうち、前記第1区間を検出する機能が検出した第1区間の開始位置と終了位置付近の映像情報の映像変化部分を検出する機能と、前記第1区間を検出する機能が検出した前記第1区間の開始位置付近の映像変化部分を新たな開始位置とし、前記第1区間の終了位置付近の映像変化部分を新たな終了位置として、前記第1区間を補正して第2区間とする機能とを実現させることを特徴とするプログラムを提供する。
このような構成によれば、音楽区間補正部は、映像変化部分に基づいて、音楽区間検出部が検出した音楽区間の開始位置および終了位置を補正するため、音楽区間においてトーク部分と別セットを組むような音楽番組等を録画した録画情報においては、音楽区間の検出精度を向上することができる。
(2)また、本発明は、上記目的を達成するため、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する検出部と、前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出する字幕検出部と、前記検出部が検出した第1区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記第1区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記第1区間を補正して第2区間とする補正部とを有することを特徴とする装置を提供する。
また、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出するステップと、前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出するステップと、前記第1区間を検出するステップで検出した第1区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記第1区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記第1区間を補正して第2区間とするステップとを有することを特徴とする方法を提供する。
また、コンピュータに、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する機能と、前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出する機能と、前記第1区間を検出する機能が検出した第1区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記第1区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記第1区間を補正して第2区間とする機能とを実現させることを特徴とするプログラムを提供する。
このような構成によれば、音楽区間補正部は、音楽字幕部分に基づいて、音楽区間検出部が検出した音楽区間の開始位置および終了位置を補正するため、音楽区間において歌詞が表示されたり、タイトルや作詞/作曲者名が表示されたりするような音楽番組等を録画した録画情報において、音楽区間の検出精度を向上することができる。
本発明によれば、精度良く音楽区間を検出できる。
本発明の第1の実施の形態に係る音楽検出装置の構成を示す概略図である。 本発明の第1の実施の形態に係る音楽検出装置の動作を示す概略図である。 本発明の第1の実施の形態に係る音楽区間検出部の動作を示すフローチャートである。 本発明の第1の実施の形態に係る音量解析部および音楽区間補正部の動作を示すフローチャートである。 本発明の第2の実施の形態に係る音楽検出装置の動作を示す概略図である。 本発明の第2の実施の形態に係る映像解析部の動作を示すフローチャートである。 本発明の第2の実施の形態に係る音楽区間補正部の動作を示すフローチャートである。 本発明の第3の実施の形態に係る音楽検出装置の動作を示す概略図である。 本発明の第3の実施の形態に係る映像解析部および音楽区間補正部の動作を示すフローチャートである。 本発明の第4の実施の形態に係る音楽検出装置の動作を示す概略図である。 本発明の第4の実施の形態に係る字幕・テロップ検出部および音楽区間補正部の動作を示すフローチャートである。
以下に、本発明の音楽検出装置の実施の形態を、図面を参照して詳細に説明する。
〔第1の実施の形態〕
(音楽検出装置の構成)
図1は、本発明の第1の実施の形態に係る音楽検出装置の構成を示す概略図である。
音楽検出装置1は、録画情報60に含まれる音声情報30を入力して音楽検出区間100を検出する音楽区間検出部10と、音楽区間検出部10の検出した音楽検出区間100を補正して音楽区間情報70を出力する音楽区間補正部20と、音声情報30を解析して解析結果を音楽区間補正部20へ出力する音量解析部21と、録画情報60に含まれる映像情報40を解析して解析結果を音楽区間補正部20へ出力する映像解析部22と、録画情報60に含まれる字幕情報50または映像情報40を解析して解析結果を音楽区間補正部20へ出力する字幕・テロップ検出部23とを有する。
音楽検出装置1は、例えば、ハードディスクレコーダーやパーソナルコンピューターに内蔵され、各部はハードウエアで設置されてもよいし、ソフトウエアとしてインストールされてもよい。また、一部をハードウエア、他部をソフトウエアとして構成してもよい。
音声情報30、映像情報40および字幕情報50を含む録画情報60は、例えば、MPEG(Moving Picture Experts Group)ムービー等の圧縮された情報によって構成される。音声情報30は、左右に独立した2チャンネルの音声を出力する。また、録画情報60は、図示しないチューナーを介して受信したデジタルテレビ放送を録画した情報、DVD等に記録された情報、またはリアルタイムで受信するデジタルテレビ放送の情報であってもよい。
音楽区間検出部10は、入力した音声情報30を所定の区間に分割し、各区間ごとに音声情報30のチャンネル間の音量差、および両チャンネルの合計音量を算出し、音量差と合計音量の比を閾値と比較することで音楽区間を検出する。
また、音楽区間検出部10は、音楽区間が重なる頻度の高いCM区間と、実際の音楽区間とを区別するために、CM区間と音楽区間の重なり区間と、実際の音楽区間とを比較し、音楽区間の出現比を算出することでCM区間と音楽区間の重なり区間を非音楽区間として処理する手段(図示せず)を備える。
音量解析部21は、音声情報30を入力し、音声情報30の音声の各チャンネルの音量振幅を解析して、所定の閾値以下になった場合に無音部分と定義する。なお、無音部分は、音声情報30をデコードする前の状態であるオーディオストリームをスペクトル解析して検出するようにしてもよい。
音楽区間補正部20は、音楽検出区間100を補正した音楽区間情報70を出力し、音楽区間情報70は、図示しないチャプタ番号登録部に入力され、録画情報60にチャプタ番号が登録されることで、利用者は、録画情報60の音楽区間を容易に検索することができるようになる。
図2は、本発明の第1の実施の形態に係る音楽検出装置の動作を示す概略図である。
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t〜t)を検出する。次に、音量解析部21が、音声情報30を解析し、音声情報30中から無音部分を抽出する。次に、音楽区間補正部20が、音楽検出区間100の開始時間(t)に最も近い無音部分を無音検出部分210(t)として、音楽検出区間100の開始時間を補正し、音楽検出区間100の終了時間(t)に最も近い無音部分を無音検出部分210(t)として、音楽検出区間100の終了時間を補正する。
図3は、本発明の第1の実施の形態に係る音楽区間検出部の動作を示すフローチャートである。
まず、音楽区間検出部10は、音声情報30を入力する(S10)。次に、音楽区間検出部10は、入力した音声情報30を時間について所定の長さの区間に分割する(S11)。次に、ある区間について、音声情報30の音声2チャンネルについて音量差Vdを算出する(S12)。次に、音声2チャンネルについて合計音量Vsを算出する(S13)。次に、VdとVsとの比Vfを算出する(S14)。
比Vfが予め定めた閾値より大きい状態が、所定時間、例えば1分以上継続する場合(S15;Yes)、その区間に音楽区間フラグを付与する(S16)。すべての区間についてS12〜S16の処理が終了すると(S17;Yes)、音楽区間フラグの付いた区間をマージして音楽検出区間100を音楽区間補正部20へ出力する。
図4は、本発明の第1の実施の形態に係る音量解析部および音楽区間補正部の動作を示すフローチャートである。
まず、音楽区間補正部20は、音楽区間検出部10から音楽検出区間100を入力し、音楽検出区間100の開始位置(t)と終了位置(t)を取得する(S20)。次に、音量解析部21は、音声情報30を入力し、音楽検出区間100の開始位置付近における無音部分を検出する(S21)。また、音楽検出区間100の終了位置付近における無音部分を検出する(S22)。
次に、音楽区間補正部20は、音量解析部21が検出した無音部分のうち、音楽検出区間100の開始位置に最も近い無音部分、および終了位置に最も近い無音部分をそれぞれ無音検出部分210(t、t)と定義する(S23)。次に、音楽検出区間100の開始位置および終了位置をそれぞれ無音検出部分210に補正する(S24)。次に、補正した音楽検出区間100(t〜t)について音楽区間情報70を出力する(S25)。
(第1の実施の形態の効果)
上記した第1の実施の形態によると、音楽区間補正部20は、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を、音量解析部21が検出した無音検出部分210に補正する。音楽区間の開始位置および終了位置に無音部分が出現する頻度が多い音楽番組等を録画した録画情報60において、高い確率で音楽区間の検出精度を向上することができる。また、音楽区間の開始位置および終了位置にチャプタ番号を登録することで、利用者が容易に音楽区間を検索できるようになる。
〔第2の実施の形態〕
図5は、本発明の第2の実施の形態に係る音楽検出装置の動作を示す概略図である。なお、以下の説明において、第1の実施の形態と同一の構成および機能を有する部分については共通の符号を付している。
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t14〜t17)を検出する。次に、音量解析部21が、音声情報30を解析し、音声情報30中から無音部分を抽出する。次に、映像解析部22が、映像情報40を解析し、トーク検出部分220(t11〜t13)を検出する。次に、音楽区間補正部20が、音楽検出区間100の開始時間に最も近い無音部分で、トーク検出部分220に属さない無音部分を無音検出部分210(t15)として、音楽検出区間100の開始時間を補正し、音楽検出区間100の終了時間に最も近い無音部分を無音検出部分210(t16)として、音楽検出区間100の終了時間を補正する。
トーク検出部分220は、例えば、デジタルテレビ放送の音楽番組において、司会者とアーティストが会話するシーンであり、司会者のカット、アーティストのカットが交互に現れるようなシーンを指す。
図6は、本発明の第2の実施の形態に係る映像解析部の動作を示すフローチャートである。
まず、映像解析部22に音楽検出区間100の開始位置(t14)と終了位置(t17)それぞれの前後、例えば前後10秒間の映像情報40を入力する(S30)。次に、映像解析部22は、入力した映像情報40から所定の時間おきに定期的に静止画を取得する(S31)。次に、取得した複数の静止画を比較して、似ている静止画にフラグを付与する(S32)。
静止画を時間順に並べた場合にフラグの並びに特徴的な規則性、例えば、似ている画像1および画像2が交互に現れるような規則性がある場合(S33;Yes)、規則性がある区間をトーク検出部分220(t11〜t13)と定義する(S34)。
図7は、本発明の第2の実施の形態に係る音楽区間補正部の動作を示すフローチャートである。
まず、音楽区間補正部20は、音楽区間検出部10から音楽検出区間100を入力し、音楽検出区間100の開始位置(t14)と終了位置(t17)を取得する(S40)。次に、音量解析部21は、音声情報30を入力し、音楽検出区間100の開始位置付近における無音部分を検出する(S41)。また、音楽検出区間100の終了位置付近における無音部分を検出する(S42)。
次に、音楽区間補正部20は、音量解析部21が検出した無音部分のうち、図6の動作において定義したトーク検出部分220(t11〜t13)に属する無音部分210a(t12)を排除する(S43)。次に、音楽検出区間100の開始位置に最も近い無音部分、および終了位置に最も近い無音部分をそれぞれ無音検出部分210(t15、t16)と定義する(S44)。次に、音楽検出区間100の開始位置および終了位置をそれぞれ無音検出部分210に補正する(S45)。次に、補正した音楽検出区間100(t15〜t16)について音楽区間情報70を出力する(S46)。
(第2の実施の形態の効果)
上記した第2の実施の形態によると、第1の実施の形態に加え、音楽区間補正部20は、トーク検出部分220に属する無音部分210aを省いて、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を補正する。トーク検出部分220が出現する頻度が多い音楽番組等を録画した録画情報においては、トーク検出部分220に無音部分を含む確率が高いため、トーク検出部分220の無音部分を排除することで、高い確率で音楽区間の検出精度を向上することができる。
なお、トーク検出部分220は、音声情報30を解析して会話を検出してもよい。
〔第3の実施の形態〕
図8は、本発明の第3の実施の形態に係る音楽検出装置の動作を示す概略図である。
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t23〜t27)を検出する。次に、映像解析部22が、映像情報40を解析し、映像情報40中から特徴量の大きく変化する変化部分221を抽出する。次に、音楽区間補正部20が、音楽検出区間100の開始時間に最も近い変化部分221を映像切替検出部分222(t22)として、音楽検出区間100の開始時間を補正し、音楽検出区間100の終了時間に最も近い無音部分を映像切替検出部分222(t26)として、音楽検出区間100の終了時間を補正する。
図9は、本発明の第3の実施の形態に係る映像解析部および音楽区間補正部の動作を示すフローチャートである。
まず、映像解析部22に音楽検出区間100の開始位置(t23)と終了位置(t27)それぞれの前後、例えば前後10秒間の映像情報40を入力する(S50)。次に、映像解析部22は、映像情報40を監視し、映像の輝度値および色相値を測定する(S51)。測定の結果、輝度値または色相値が大きく変化する部分を変化部分として検出する(S52)。
次に、音楽区間補正部20は、映像解析部22が検出した変化部分のうち、音楽検出区間100の開始位置に最も近い変化部分、および終了位置に最も近い変化部分をそれぞれ映像切替検出部分222(t22、t26)と定義する(S53)。次に、音楽検出区間100の開始位置および終了位置をそれぞれ映像切替検出部分222に補正する(S54)。次に、補正した音楽検出区間100(t22〜t26)について音楽区間情報70を出力する(S55)。
(第3の実施の形態の効果)
上記した第3の実施の形態によると、音楽区間補正部20は、映像切替検出部分222に基づいて、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を補正する。音楽区間においてトーク部分と別セットを組むような音楽番組等を録画した録画情報においては、音楽区間において照明効果等によってトーク部分とは異なる色相や輝度を有するシーンを含む確率が高いため、輝度値または色相値の変化する部分に音楽区間を補正することで、高い確率で音楽区間の検出精度を向上することができる。
なお、映像切替検出部分222は、輝度値および色相値以外の特徴量を解析して検出してもよい。
〔第4の実施の形態〕
図10は、本発明の第4の実施の形態に係る音楽検出装置の動作を示す概略図である。
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t32〜t34)を検出する。次に、字幕・テロップ検出部23が、字幕情報50を解析し、字幕情報50中から音楽に関連する文字列、例えば、音符を表す記号や、「作詞」、「作曲」等が検出される音楽字幕検出部分232を抽出する。次に、音楽区間補正部20が、音楽字幕検出部分232の開始位置を音楽字幕検出出現部分230(t31)として、音楽検出区間100の開始時間を補正し、音楽字幕検出部分232の終了位置を音楽字幕検出消失部分231(t33)として、音楽検出区間100の終了時間を補正する。
図11は、本発明の第4の実施の形態に係る字幕・テロップ検出部および音楽区間補正部の動作を示すフローチャートである。
まず、字幕・テロップ検出部23に音楽検出区間100の開始位置(t32)と終了位置(t34)それぞれの前後、例えば前後10秒間の字幕情報50を入力する(S60)。次に、字幕・テロップ検出部23は、字幕情報50を監視する(S61)。監視の結果、特定の文字列が抽出される部分を音楽字幕検出部分232(t31〜t33)として検出する(S62)。
次に、音楽区間補正部20は、字幕・テロップ検出部23が検出した音楽字幕検出部分232の開始位置、つまり、音楽字幕検出出現部分230(t31)に音楽検出区間100の開始位置を補正する(S63)。次に、音楽区間補正部20は、字幕・テロップ検出部23が検出した音楽字幕検出部分232の終了位置、つまり、音楽字幕検出消失部分231(t33)に音楽検出区間100の終了位置を補正する(S65)。次に、補正した音楽検出区間100(t31〜t33)について音楽区間情報70を出力する(S65)。
(第4の実施の形態の効果)
上記した第4の実施の形態によると、音楽区間補正部20は、音楽字幕検出部分232に基づいて、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を補正する。音楽区間において歌詞が表示されたり、タイトルや作詞/作曲者名が表示されたりするような音楽番組等を録画した録画情報において、音楽字幕検出部分232に音楽検出区間100を補正することで、高い確率で音楽区間の検出精度を向上することができる。
なお、音楽字幕検出部分232の検出は、字幕情報50を解析する他、映像情報40に含まれるテロップ等を文字解析して検出してもよい。
1…音楽検出装置、10…音楽区間検出部、20…音楽区間補正部、21…音量解析部、22…映像解析部、23…字幕・テロップ検出部、30…音声情報、40…映像情報、50…字幕情報、60…録画情報、70…音楽区間情報、100…音楽検出区間、210…無音検出部分、210a…無音部分、220…トーク検出部分、221…変化部分、222…映像切替検出部分、230…音楽字幕検出出現部分、231…音楽字幕検出消失部分、232…音楽字幕検出部分

Claims (12)

  1. 処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する検出部と、
    前記処理対象情報に含まれる映像情報のうち、前記検出部が検出した第1区間の開始位置と終了位置付近の映像情報の映像変化部分を検出する映像解析部と、
    前記検出部が検出した前記第1区間の開始位置付近の映像変化部分を新たな開始位置とし、前記第1区間の終了位置付近の映像変化部分を新たな終了位置として、前記第1区間を補正して第2区間とする補正部とを有することを特徴とする装置。
  2. 前記映像解析部は、前記映像情報の色相および輝度の少なくとも1つを取得して、前記色相および輝度の少なくとも1つに基づいて映像変化部分を検出することを特徴とする請求項1に記載の装置。
  3. 処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する検出部と、
    前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出する字幕検出部と、
    前記検出部が検出した第1区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記第1区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記第1区間を補正して第2区間とする補正部とを有することを特徴とする装置。
  4. 前記字幕検出部は、前記字幕情報から特定の文字列を抽出した場合に、前記音楽字幕部分を検出することを特徴とする請求項3に記載の装置。
  5. 前記字幕検出部は、前記処理対象情報に含まれる映像情報のテロップから前記音楽字幕部分を検出することを特徴とする請求項3に記載の装置。
  6. 処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出するステップと、
    前記処理対象情報に含まれる映像情報のうち、前記第1区間を検出するステップで検出した第1区間の開始位置と終了位置付近の映像情報の映像変化部分を検出するステップと、
    前記第1区間を検出するステップで検出した前記第1区間の開始位置付近の映像変化部分を新たな開始位置とし、前記第1区間の終了位置付近の映像変化部分を新たな終了位置として、前記第1区間を補正して第2区間とするステップとを有することを特徴とする方法。
  7. 処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出するステップと、
    前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出するステップと、
    前記第1区間を検出するステップで検出した第1区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記第1区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記第1区間を補正して第2区間とするステップとを有することを特徴とする方法。
  8. コンピュータに、
    処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する機能と、
    前記処理対象情報に含まれる映像情報のうち、前記第1区間を検出する機能が検出した第1区間の開始位置と終了位置付近の映像情報の映像変化部分を検出する機能と、
    前記第1区間を検出する機能が検出した前記第1区間の開始位置付近の映像変化部分を新たな開始位置とし、前記第1区間の終了位置付近の映像変化部分を新たな終了位置として、前記第1区間を補正して第2区間とする機能とを実現させることを特徴とするプログラム。
  9. 前記コンピュータに、前記映像情報の色相および輝度の少なくとも1つを取得して、前記色相および輝度の少なくとも1つに基づいて映像変化部分を検出する機能を実現させることを特徴とする請求項8に記載のプログラム。
  10. コンピュータに、
    処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の第1区間を検出する機能と、
    前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出する機能と、
    前記第1区間を検出する機能が検出した第1区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記第1区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記第1区間を補正して第2区間とする機能とを実現させることを特徴とするプログラム。
  11. 前記コンピュータに、前記字幕情報から特定の文字列を抽出した場合に、前記音楽字幕部分を検出する機能を実現させることを特徴とする請求項10に記載のプログラム。
  12. 前記コンピュータに、前記処理対象情報に含まれる映像情報のテロップから前記音楽字幕部分を検出する機能を実現させることを特徴とする請求項10に記載のプログラム。
JP2011243018A 2011-11-07 2011-11-07 装置、方法及びプログラム Expired - Fee Related JP5559128B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011243018A JP5559128B2 (ja) 2011-11-07 2011-11-07 装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011243018A JP5559128B2 (ja) 2011-11-07 2011-11-07 装置、方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007252163A Division JP4864847B2 (ja) 2007-09-27 2007-09-27 音楽検出装置および音楽検出方法

Publications (2)

Publication Number Publication Date
JP2012037910A JP2012037910A (ja) 2012-02-23
JP5559128B2 true JP5559128B2 (ja) 2014-07-23

Family

ID=45849893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011243018A Expired - Fee Related JP5559128B2 (ja) 2011-11-07 2011-11-07 装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5559128B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10764643B2 (en) * 2016-06-15 2020-09-01 Opentv, Inc. Context driven content rewind
US20200037022A1 (en) * 2018-07-30 2020-01-30 Thuuz, Inc. Audio processing for extraction of variable length disjoint segments from audiovisual content

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3517349B2 (ja) * 1998-03-18 2004-04-12 日本電信電話株式会社 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
JP4373962B2 (ja) * 2005-05-17 2009-11-25 株式会社東芝 音声と映像信号から判定した映像信号の区切り情報設定方法及び装置
JP2007171289A (ja) * 2005-12-19 2007-07-05 Mitsubishi Electric Corp 曲検出装置
JP4442585B2 (ja) * 2006-05-11 2010-03-31 三菱電機株式会社 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置

Also Published As

Publication number Publication date
JP2012037910A (ja) 2012-02-23

Similar Documents

Publication Publication Date Title
US8855796B2 (en) Method and device for detecting music segment, and method and device for recording data
US8682132B2 (en) Method and device for detecting music segment, and method and device for recording data
US7941031B2 (en) Video processing apparatus, IC circuit for video processing apparatus, video processing method, and video processing program
JP3891111B2 (ja) 音響信号処理装置及び方法、信号記録装置及び方法、並びにプログラム
JP2002140712A (ja) Av信号処理装置および方法、プログラム、並びに記録媒体
JP2007049515A (ja) 映像音声記録装置
US7764862B2 (en) Method of and apparatus for setting video signal delimiter information judged from audio and video signals
JP4611952B2 (ja) 番組録画装置及びコマーシャル検出方法
EP1293914A2 (en) Apparatus, method and processing program for summarizing image information
JP4215681B2 (ja) 動画像処理装置及びその方法
JP5559128B2 (ja) 装置、方法及びプログラム
JP2007049380A (ja) 映像音声記録装置
JP4432823B2 (ja) 特定条件区間検出装置および特定条件区間検出方法
JP4719604B2 (ja) コマーシャル検出方法およびコマーシャル検出装置並びにコマーシャル検出プログラムが記録された記録媒体
JP4864847B2 (ja) 音楽検出装置および音楽検出方法
WO2007013407A1 (ja) ダイジェスト生成装置、ダイジェスト生成方法、ダイジェスト生成プログラムを格納した記録媒体、およびダイジェスト生成装置に用いる集積回路
JP3983532B2 (ja) 場面抽出装置
US20060263062A1 (en) Method of and apparatus for setting video signal delimiter information using silent portions
JP4381345B2 (ja) 音声モードを利用した映像信号の区切り情報設定方法及び装置
JP2007082091A (ja) 映像信号の区切り情報設定装置及び方法
JP2009135754A (ja) ダイジェスト作成装置及び方法
JP6164445B2 (ja) チャプタ設定装置
JP2007318426A (ja) 映像解析装置および映像解析方法
JP2006303868A (ja) 信号属性判定装置、信号属性判定方法、情報信号記録装置、情報信号記録方法、情報信号再生装置、情報信号再生方法、情報信号記録再生装置および情報信号記録再生方法並びに記録媒体
JP2005223794A (ja) 映像音響コンテンツの記録装置及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140605

LAPS Cancellation because of no payment of annual fees