JP2009086016A - Music detecting device and music detecting method - Google Patents
Music detecting device and music detecting method Download PDFInfo
- Publication number
- JP2009086016A JP2009086016A JP2007252163A JP2007252163A JP2009086016A JP 2009086016 A JP2009086016 A JP 2009086016A JP 2007252163 A JP2007252163 A JP 2007252163A JP 2007252163 A JP2007252163 A JP 2007252163A JP 2009086016 A JP2009086016 A JP 2009086016A
- Authority
- JP
- Japan
- Prior art keywords
- music
- section
- detection
- music section
- processing target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
Description
本発明は、音楽検出装置および音楽検出方法に関する。 The present invention relates to a music detection device and a music detection method.
近年、大容量のハードディスク等の記憶装置を搭載した映像音声録画装置が普及している。これに伴い、録画情報のデータ容量が大きくなる傾向にあり、録画情報の中から所望の情報、例えば、歌や楽器等が演奏される音楽区間を効率よく検索するための機能が搭載されている。具体的には、音楽区間の開始位置と終了位置にチャプタ番号を設けることで利用者が容易に所望の音楽区間を検索できるようになっている。 In recent years, video / audio recording apparatuses equipped with a storage device such as a large-capacity hard disk have become widespread. Along with this, the data capacity of the recorded information tends to increase, and a function for efficiently searching for desired music information such as a song or a musical instrument from the recorded information is installed. . Specifically, by providing chapter numbers at the start position and end position of the music section, the user can easily search for the desired music section.
従来の技術として、録画情報に含まれる音声情報に基づいて音楽区間を検出する音楽検出装置がある(例えば、特許文献1)。 As a conventional technique, there is a music detection device that detects a music section based on audio information included in recorded information (for example, Patent Document 1).
この特許文献1の音楽検出装置によると、録画情報中の2チャンネルの音声からなる音声情報を抽出し、2チャンネルの音声のパワーの合計、および2チャンネルの音声のパワーの差を算出し、これらの算出されたパワーの比を求め、パワーの比を閾値と比較して比較結果に基づいて音楽区間かどうかを判定することで、音楽区間を検出することができる。
しかし、従来の音楽検出装置によると、音声情報にステレオ効果のある音楽区間を検出することができるが、ステレオ効果のある音楽区間以外の番組区間やCM区間を検出することにより音楽区間の開始位置および終了位置に誤差を生じるという問題がある。 However, according to the conventional music detection device, a music section having a stereo effect can be detected in the audio information, but the start position of the music section is detected by detecting a program section or a CM section other than the music section having the stereo effect. In addition, there is a problem that an error occurs in the end position.
従って、本発明の目的は、音楽区間を精度良く検出する音楽検出装置を提供することにある。 Accordingly, an object of the present invention is to provide a music detection apparatus that accurately detects a music section.
(1)本発明は、上記目的を達成するため、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の音楽区間を検出する音楽区間検出部と、前記音声情報中の無音部分を検出する音量解析部と、前記音楽区間の開始位置に最も近い前記無音部分を新たな開始位置とし、前記音楽区間の終了位置に最も近い前記無音部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置を提供する。 (1) In order to achieve the above object, the present invention provides a music section detection unit that detects a music section in the processing target information based on voice information included in the processing target information, and a silent portion in the voice information. A volume analysis unit to detect, and the silence section closest to the start position of the music section as a new start position, and the silence section closest to the end position of the music section as a new end position, the music section is corrected There is provided a music detecting device including a music section correcting unit.
このような構成によれば、音楽区間検出部が検出した音楽区間の開始位置および終了位置を、音量解析部が検出した無音部分に補正するため、音楽区間の開始位置および終了位置に無音部分が出現する頻度が多い音楽番組等を録画した場合に音楽区間の検出精度を向上することができる。 According to such a configuration, since the start position and end position of the music section detected by the music section detection unit are corrected to the silence part detected by the volume analysis unit, there is a silence part at the start position and end position of the music section. When a music program or the like that frequently appears is recorded, the detection accuracy of the music section can be improved.
(2)また、本発明は、上記目的を達成するため、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の音楽区間を検出する音楽区間検出部と、前記音声情報中の無音部分を検出する音量解析部と、前記処理対象情報に含まれる映像情報に基づき、前記処理対象情報中のトーク部分を検出する映像解析部と、前記音楽区間の開始位置付近の前記無音部分のうち前記トーク部分に属さない無音部分で前記開始位置に最も近い前記無音部分を新たな開始位置とし、前記音楽区間の終了位置付近の前記無音部分のうち前記トーク部分に属さない無音部分で前記終了位置に最も近い前記無音部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置を提供する。 (2) Further, in order to achieve the above object, the present invention provides a music section detection unit that detects a music section in the processing target information based on voice information included in the processing target information, and silence in the voice information. A volume analysis unit for detecting a part, a video analysis unit for detecting a talk part in the processing target information based on the video information included in the processing target information, and the silent part near the start position of the music section. The silence part that does not belong to the talk part and that is closest to the start position is set as a new start position, and the end position is the silence part that does not belong to the talk part among the silence parts near the end position of the music section. And a music section correction unit that corrects the music section with the silent part closest to the position as a new end position.
このような構成によれば、音楽区間補正部は、トーク部分に属する無音部分を省いて、音楽区間検出部が検出した音楽区間の開始位置および終了位置を無音部分に補正するため、トーク部分が出現する頻度が多い音楽番組等を録画した録画情報においては、無音部分を含む確率が高いトーク部分を省いて音楽区間の検出精度を向上することができる。 According to such a configuration, the music section correction unit omits the silent part belonging to the talk part and corrects the start position and the end position of the music section detected by the music section detection part to the silent part. In recorded information that records a music program or the like that appears frequently, it is possible to improve the accuracy of detecting a music section by omitting a talk portion that has a high probability of including a silent portion.
(3)また、本発明は、上記目的を達成するため、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の音楽区間を検出する音楽区間検出部と、前記処理対象情報に含まれる映像情報に基づき、前記処理対象情報中の映像変化部分を検出する映像解析部と、前記音楽区間の開始位置に最も近い前記映像変化部分を新たな開始位置とし、前記音楽区間の終了位置に最も近い前記映像変化部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置を提供する。 (3) Further, in order to achieve the above object, the present invention includes a music section detection unit that detects a music section in the processing target information based on audio information included in the processing target information, and is included in the processing target information. A video analysis unit for detecting a video change part in the processing target information based on the video information to be processed, and the video change part closest to the start position of the music section as a new start position, at the end position of the music section There is provided a music detection device comprising a music section correction unit for correcting the music section with the closest video change portion as a new end position.
このような構成によれば、音楽区間補正部は、映像変化部分に基づいて、音楽区間検出部が検出した音楽区間の開始位置および終了位置を補正するため、音楽区間においてトーク部分と別セットを組むような音楽番組等を録画した録画情報においては、音楽区間の検出精度を向上することができる。 According to such a configuration, the music section correction unit corrects the start position and the end position of the music section detected by the music section detection unit based on the video change part, so that a different set from the talk part is set in the music section. In recording information in which a music program or the like to be assembled is recorded, the detection accuracy of the music section can be improved.
(4)また、本発明は、上記目的を達成するため、処理対象情報に含まれる音声情報に基づき、前記処理対象情報中の音楽区間を検出する音楽区間検出部と、前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出する字幕検出部と、前記音楽区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記音楽区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置を提供する。 (4) In order to achieve the above object, the present invention includes a music section detection unit that detects a music section in the processing target information based on audio information included in the processing target information, and is included in the processing target information. A subtitle detection unit for detecting a music subtitle portion in the processing target information based on the subtitle information to be processed, and an appearance portion of the music subtitle portion near the start position of the music section as a new start position, and the end of the music section There is provided a music detection apparatus comprising a music section correction unit that corrects the music section with a disappearance portion of the music subtitle portion near the position as a new end position.
このような構成によれば、音楽区間補正部は、音楽字幕部分に基づいて、音楽区間検出部が検出した音楽区間の開始位置および終了位置を補正するため、音楽区間において歌詞が表示されたり、タイトルや作詞/作曲者名が表示されたりするような音楽番組等を録画した録画情報において、音楽区間の検出精度を向上することができる。 According to such a configuration, the music section correction unit corrects the start position and end position of the music section detected by the music section detection unit based on the music subtitle portion, so that the lyrics are displayed in the music section, It is possible to improve the detection accuracy of a music section in recorded information in which a music program or the like in which a title or a song / song name is displayed is recorded.
本発明によれば、精度良く音楽区間を検出できる。 According to the present invention, a music section can be detected with high accuracy.
以下に、本発明の音楽検出装置の実施の形態を、図面を参照して詳細に説明する。 Embodiments of a music detection apparatus according to the present invention will be described below in detail with reference to the drawings.
〔第1の実施の形態〕
(音楽検出装置の構成)
図1は、本発明の第1の実施の形態に係る音楽検出装置の構成を示す概略図である。
[First Embodiment]
(Configuration of music detector)
FIG. 1 is a schematic diagram showing the configuration of a music detection apparatus according to the first embodiment of the present invention.
音楽検出装置1は、録画情報60に含まれる音声情報30を入力して音楽検出区間100を検出する音楽区間検出部10と、音楽区間検出部10の検出した音楽検出区間100を補正して音楽区間情報70を出力する音楽区間補正部20と、音声情報30を解析して解析結果を音楽区間補正部20へ出力する音量解析部21と、録画情報60に含まれる映像情報40を解析して解析結果を音楽区間補正部20へ出力する映像解析部22と、録画情報60に含まれる字幕情報50または映像情報40を解析して解析結果を音楽区間補正部20へ出力する字幕・テロップ検出部23とを有する。
The
音楽検出装置1は、例えば、ハードディスクレコーダーやパーソナルコンピューターに内蔵され、各部はハードウエアで設置されてもよいし、ソフトウエアとしてインストールされてもよい。また、一部をハードウエア、他部をソフトウエアとして構成してもよい。
The
音声情報30、映像情報40および字幕情報50を含む録画情報60は、例えば、MPEG(Moving Picture Experts Group)ムービー等の圧縮された情報によって構成される。音声情報30は、左右に独立した2チャンネルの音声を出力する。また、録画情報60は、図示しないチューナーを介して受信したデジタルテレビ放送を録画した情報、DVD等に記録された情報、またはリアルタイムで受信するデジタルテレビ放送の情報であってもよい。
The recording information 60 including the
音楽区間検出部10は、入力した音声情報30を所定の区間に分割し、各区間ごとに音声情報30のチャンネル間の音量差、および両チャンネルの合計音量を算出し、音量差と合計音量の比を閾値と比較することで音楽区間を検出する。
The music
また、音楽区間検出部10は、音楽区間が重なる頻度の高いCM区間と、実際の音楽区間とを区別するために、CM区間と音楽区間の重なり区間と、実際の音楽区間とを比較し、音楽区間の出現比を算出することでCM区間と音楽区間の重なり区間を非音楽区間として処理する手段(図示せず)を備える。
Further, the music
音量解析部21は、音声情報30を入力し、音声情報30の音声の各チャンネルの音量振幅を解析して、所定の閾値以下になった場合に無音部分と定義する。なお、無音部分は、音声情報30をデコードする前の状態であるオーディオストリームをスペクトル解析して検出するようにしてもよい。
The sound
音楽区間補正部20は、音楽検出区間100を補正した音楽区間情報70を出力し、音楽区間情報70は、図示しないチャプタ番号登録部に入力され、録画情報60にチャプタ番号が登録されることで、利用者は、録画情報60の音楽区間を容易に検索することができるようになる。
The music
図2は、本発明の第1の実施の形態に係る音楽検出装置の動作を示す概略図である。 FIG. 2 is a schematic diagram showing the operation of the music detection apparatus according to the first embodiment of the present invention.
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t2〜t4)を検出する。次に、音量解析部21が、音声情報30を解析し、音声情報30中から無音部分を抽出する。次に、音楽区間補正部20が、音楽検出区間100の開始時間(t2)に最も近い無音部分を無音検出部分210(t1)として、音楽検出区間100の開始時間を補正し、音楽検出区間100の終了時間(t4)に最も近い無音部分を無音検出部分210(t3)として、音楽検出区間100の終了時間を補正する。
The music
図3は、本発明の第1の実施の形態に係る音楽区間検出部の動作を示すフローチャートである。 FIG. 3 is a flowchart showing the operation of the music section detection unit according to the first embodiment of the present invention.
まず、音楽区間検出部10は、音声情報30を入力する(S10)。次に、音楽区間検出部10は、入力した音声情報30を時間について所定の長さの区間に分割する(S11)。次に、ある区間について、音声情報30の音声2チャンネルについて音量差Vdを算出する(S12)。次に、音声2チャンネルについて合計音量Vsを算出する(S13)。次に、VdとVsとの比Vfを算出する(S14)。
First, the music
比Vfが予め定めた閾値より大きい状態が、所定時間、例えば1分以上継続する場合(S15;Yes)、その区間に音楽区間フラグを付与する(S16)。すべての区間についてS12〜S16の処理が終了すると(S17;Yes)、音楽区間フラグの付いた区間をマージして音楽検出区間100を音楽区間補正部20へ出力する。
When the state in which the ratio V f is greater than a predetermined threshold continues for a predetermined time, for example, 1 minute or longer (S15; Yes), a music section flag is assigned to the section (S16). When the processing of S12 to S16 is completed for all the sections (S17; Yes), the sections with the music section flag are merged, and the music detection section 100 is output to the music
図4は、本発明の第1の実施の形態に係る音量解析部および音楽区間補正部の動作を示すフローチャートである。 FIG. 4 is a flowchart showing operations of the volume analysis unit and the music section correction unit according to the first embodiment of the present invention.
まず、音楽区間補正部20は、音楽区間検出部10から音楽検出区間100を入力し、音楽検出区間100の開始位置(t2)と終了位置(t4)を取得する(S20)。次に、音量解析部21は、音声情報30を入力し、音楽検出区間100の開始位置付近における無音部分を検出する(S21)。また、音楽検出区間100の終了位置付近における無音部分を検出する(S22)。
First, the music
次に、音楽区間補正部20は、音量解析部21が検出した無音部分のうち、音楽検出区間100の開始位置に最も近い無音部分、および終了位置に最も近い無音部分をそれぞれ無音検出部分210(t1、t3)と定義する(S23)。次に、音楽検出区間100の開始位置および終了位置をそれぞれ無音検出部分210に補正する(S24)。次に、補正した音楽検出区間100(t1〜t3)について音楽区間情報70を出力する(S25)。
Next, the music
(第1の実施の形態の効果)
上記した第1の実施の形態によると、音楽区間補正部20は、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を、音量解析部21が検出した無音検出部分210に補正する。音楽区間の開始位置および終了位置に無音部分が出現する頻度が多い音楽番組等を録画した録画情報60において、高い確率で音楽区間の検出精度を向上することができる。また、音楽区間の開始位置および終了位置にチャプタ番号を登録することで、利用者が容易に音楽区間を検索できるようになる。
(Effects of the first embodiment)
According to the first embodiment described above, the music
〔第2の実施の形態〕
図5は、本発明の第2の実施の形態に係る音楽検出装置の動作を示す概略図である。なお、以下の説明において、第1の実施の形態と同一の構成および機能を有する部分については共通の符号を付している。
[Second Embodiment]
FIG. 5 is a schematic diagram showing the operation of the music detection apparatus according to the second embodiment of the present invention. In the following description, parts having the same configuration and function as those of the first embodiment are denoted by common reference numerals.
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t14〜t17)を検出する。次に、音量解析部21が、音声情報30を解析し、音声情報30中から無音部分を抽出する。次に、映像解析部22が、映像情報40を解析し、トーク検出部分220(t11〜t13)を検出する。次に、音楽区間補正部20が、音楽検出区間100の開始時間に最も近い無音部分で、トーク検出部分220に属さない無音部分を無音検出部分210(t15)として、音楽検出区間100の開始時間を補正し、音楽検出区間100の終了時間に最も近い無音部分を無音検出部分210(t16)として、音楽検出区間100の終了時間を補正する。
The music
トーク検出部分220は、例えば、デジタルテレビ放送の音楽番組において、司会者とアーティストが会話するシーンであり、司会者のカット、アーティストのカットが交互に現れるようなシーンを指す。 The talk detection part 220 is a scene in which a moderator and an artist have a conversation in a music program of a digital television broadcast, for example, and indicates a scene in which a moderator's cut and an artist's cut appear alternately.
図6は、本発明の第2の実施の形態に係る映像解析部の動作を示すフローチャートである。 FIG. 6 is a flowchart showing the operation of the video analysis unit according to the second embodiment of the present invention.
まず、映像解析部22に音楽検出区間100の開始位置(t14)と終了位置(t17)それぞれの前後、例えば前後10秒間の映像情報40を入力する(S30)。次に、映像解析部22は、入力した映像情報40から所定の時間おきに定期的に静止画を取得する(S31)。次に、取得した複数の静止画を比較して、似ている静止画にフラグを付与する(S32)。
First, the
静止画を時間順に並べた場合にフラグの並びに特徴的な規則性、例えば、似ている画像1および画像2が交互に現れるような規則性がある場合(S33;Yes)、規則性がある区間をトーク検出部分220(t11〜t13)と定義する(S34)。
When still images are arranged in time order, there is a regularity of a sequence of flags, for example, when there is a regularity such that
図7は、本発明の第2の実施の形態に係る音楽区間補正部の動作を示すフローチャートである。 FIG. 7 is a flowchart showing the operation of the music section correction unit according to the second embodiment of the present invention.
まず、音楽区間補正部20は、音楽区間検出部10から音楽検出区間100を入力し、音楽検出区間100の開始位置(t14)と終了位置(t17)を取得する(S40)。次に、音量解析部21は、音声情報30を入力し、音楽検出区間100の開始位置付近における無音部分を検出する(S41)。また、音楽検出区間100の終了位置付近における無音部分を検出する(S42)。
First, the music
次に、音楽区間補正部20は、音量解析部21が検出した無音部分のうち、図6の動作において定義したトーク検出部分220(t11〜t13)に属する無音部分210a(t12)を排除する(S43)。次に、音楽検出区間100の開始位置に最も近い無音部分、および終了位置に最も近い無音部分をそれぞれ無音検出部分210(t15、t16)と定義する(S44)。次に、音楽検出区間100の開始位置および終了位置をそれぞれ無音検出部分210に補正する(S45)。次に、補正した音楽検出区間100(t15〜t16)について音楽区間情報70を出力する(S46)。
Next, the music
(第2の実施の形態の効果)
上記した第2の実施の形態によると、第1の実施の形態に加え、音楽区間補正部20は、トーク検出部分220に属する無音部分210aを省いて、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を補正する。トーク検出部分220が出現する頻度が多い音楽番組等を録画した録画情報においては、トーク検出部分220に無音部分を含む確率が高いため、トーク検出部分220の無音部分を排除することで、高い確率で音楽区間の検出精度を向上することができる。
(Effect of the second embodiment)
According to the second embodiment described above, in addition to the first embodiment, the music
なお、トーク検出部分220は、音声情報30を解析して会話を検出してもよい。
Note that the talk detection unit 220 may detect the conversation by analyzing the
〔第3の実施の形態〕
図8は、本発明の第3の実施の形態に係る音楽検出装置の動作を示す概略図である。
[Third Embodiment]
FIG. 8 is a schematic diagram showing the operation of the music detection apparatus according to the third embodiment of the present invention.
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t23〜t27)を検出する。次に、映像解析部22が、映像情報40を解析し、映像情報40中から特徴量の大きく変化する変化部分221を抽出する。次に、音楽区間補正部20が、音楽検出区間100の開始時間に最も近い変化部分221を映像切替検出部分222(t22)として、音楽検出区間100の開始時間を補正し、音楽検出区間100の終了時間に最も近い無音部分を映像切替検出部分222(t26)として、音楽検出区間100の終了時間を補正する。
The music
図9は、本発明の第3の実施の形態に係る映像解析部および音楽区間補正部の動作を示すフローチャートである。 FIG. 9 is a flowchart showing operations of the video analysis unit and the music section correction unit according to the third embodiment of the present invention.
まず、映像解析部22に音楽検出区間100の開始位置(t23)と終了位置(t27)それぞれの前後、例えば前後10秒間の映像情報40を入力する(S50)。次に、映像解析部22は、映像情報40を監視し、映像の輝度値および色相値を測定する(S51)。測定の結果、輝度値または色相値が大きく変化する部分を変化部分として検出する(S52)。
First, the
次に、音楽区間補正部20は、映像解析部22が検出した変化部分のうち、音楽検出区間100の開始位置に最も近い変化部分、および終了位置に最も近い変化部分をそれぞれ映像切替検出部分222(t22、t26)と定義する(S53)。次に、音楽検出区間100の開始位置および終了位置をそれぞれ映像切替検出部分222に補正する(S54)。次に、補正した音楽検出区間100(t22〜t26)について音楽区間情報70を出力する(S55)。
Next, the music
(第3の実施の形態の効果)
上記した第3の実施の形態によると、音楽区間補正部20は、映像切替検出部分222に基づいて、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を補正する。音楽区間においてトーク部分と別セットを組むような音楽番組等を録画した録画情報においては、音楽区間において照明効果等によってトーク部分とは異なる色相や輝度を有するシーンを含む確率が高いため、輝度値または色相値の変化する部分に音楽区間を補正することで、高い確率で音楽区間の検出精度を向上することができる。
(Effect of the third embodiment)
According to the third embodiment described above, the music
なお、映像切替検出部分222は、輝度値および色相値以外の特徴量を解析して検出してもよい。
Note that the video switching
〔第4の実施の形態〕
図10は、本発明の第4の実施の形態に係る音楽検出装置の動作を示す概略図である。
[Fourth Embodiment]
FIG. 10 is a schematic diagram showing the operation of the music detection apparatus according to the fourth embodiment of the present invention.
音楽区間検出部10は、音声情報30を解析することで音楽検出区間100(t32〜t34)を検出する。次に、字幕・テロップ検出部23が、字幕情報50を解析し、字幕情報50中から音楽に関連する文字列、例えば、音符を表す記号や、「作詞」、「作曲」等が検出される音楽字幕検出部分232を抽出する。次に、音楽区間補正部20が、音楽字幕検出部分232の開始位置を音楽字幕検出出現部分230(t31)として、音楽検出区間100の開始時間を補正し、音楽字幕検出部分232の終了位置を音楽字幕検出消失部分231(t33)として、音楽検出区間100の終了時間を補正する。
The music
図11は、本発明の第4の実施の形態に係る字幕・テロップ検出部および音楽区間補正部の動作を示すフローチャートである。 FIG. 11 is a flowchart showing operations of the caption / telop detection unit and the music section correction unit according to the fourth embodiment of the present invention.
まず、字幕・テロップ検出部23に音楽検出区間100の開始位置(t32)と終了位置(t34)それぞれの前後、例えば前後10秒間の字幕情報50を入力する(S60)。次に、字幕・テロップ検出部23は、字幕情報50を監視する(S61)。監視の結果、特定の文字列が抽出される部分を音楽字幕検出部分232(t31〜t33)として検出する(S62)。
First, the subtitle information 50 is input to the subtitle /
次に、音楽区間補正部20は、字幕・テロップ検出部23が検出した音楽字幕検出部分232の開始位置、つまり、音楽字幕検出出現部分230(t31)に音楽検出区間100の開始位置を補正する(S63)。次に、音楽区間補正部20は、字幕・テロップ検出部23が検出した音楽字幕検出部分232の終了位置、つまり、音楽字幕検出消失部分231(t33)に音楽検出区間100の終了位置を補正する(S65)。次に、補正した音楽検出区間100(t31〜t33)について音楽区間情報70を出力する(S65)。
Next, the music
(第4の実施の形態の効果)
上記した第4の実施の形態によると、音楽区間補正部20は、音楽字幕検出部分232に基づいて、音楽区間検出部10が検出した音楽検出区間100の開始位置および終了位置を補正する。音楽区間において歌詞が表示されたり、タイトルや作詞/作曲者名が表示されたりするような音楽番組等を録画した録画情報において、音楽字幕検出部分232に音楽検出区間100を補正することで、高い確率で音楽区間の検出精度を向上することができる。
(Effect of the fourth embodiment)
According to the fourth embodiment described above, the music
なお、音楽字幕検出部分232の検出は、字幕情報50を解析する他、映像情報40に含まれるテロップ等を文字解析して検出してもよい。
Note that the music subtitle detection portion 232 may be detected by analyzing the subtitle information 50 as well as character analysis of a telop or the like included in the
1…音楽検出装置、10…音楽区間検出部、20…音楽区間補正部、21…音量解析部、22…映像解析部、23…字幕・テロップ検出部、30…音声情報、40…映像情報、50…字幕情報、60…録画情報、70…音楽区間情報、100…音楽検出区間、210…無音検出部分、210a…無音部分、220…トーク検出部分、221…変化部分、222…映像切替検出部分、230…音楽字幕検出出現部分、231…音楽字幕検出消失部分、232…音楽字幕検出部分
DESCRIPTION OF
Claims (8)
前記音声情報中の無音部分を検出する音量解析部と、
前記音楽区間の開始位置に最も近い前記無音部分を新たな開始位置とし、前記音楽区間の終了位置に最も近い前記無音部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置。 A music section detection unit that detects a music section in the processing target information based on audio information included in the processing target information;
A volume analysis unit for detecting a silent portion in the audio information;
A music section correction unit that corrects the music section with the silent part closest to the start position of the music section as a new start position and the silent part closest to the end position of the music section as a new end position; A music detection device comprising:
前記音声情報中の無音部分を検出する音量解析部と、
前記処理対象情報に含まれる映像情報に基づき、前記処理対象情報中のトーク部分を検出する映像解析部と、
前記音楽区間の開始位置付近の前記無音部分のうち前記トーク部分に属さない無音部分で前記開始位置に最も近い前記無音部分を新たな開始位置とし、前記音楽区間の終了位置付近の前記無音部分のうち前記トーク部分に属さない無音部分で前記終了位置に最も近い前記無音部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置。 A music section detection unit that detects a music section in the processing target information based on audio information included in the processing target information;
A volume analysis unit for detecting a silent portion in the audio information;
A video analysis unit that detects a talk portion in the processing target information based on video information included in the processing target information;
Among the silent portions near the start position of the music section, the silent portions that do not belong to the talk portion and are closest to the start position are set as new start positions, and the silent portions near the end position of the music section A music detection apparatus comprising: a music section correction unit that corrects the music section using the silent part that does not belong to the talk part and is closest to the end position as a new end position.
前記処理対象情報に含まれる映像情報に基づき、前記処理対象情報中の映像変化部分を検出する映像解析部と、
前記音楽区間の開始位置に最も近い前記映像変化部分を新たな開始位置とし、前記音楽区間の終了位置に最も近い前記映像変化部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置。 A music section detection unit that detects a music section in the processing target information based on audio information included in the processing target information;
A video analysis unit that detects a video change portion in the processing target information based on the video information included in the processing target information;
A music section correction unit that corrects the music section using the video change portion closest to the start position of the music section as a new start position and the video change portion closest to the end position of the music section as a new end position. And a music detection device.
前記処理対象情報に含まれる字幕情報に基づき、前記処理対象情報中の音楽字幕部分を検出する字幕検出部と、
前記音楽区間の開始位置付近の前記音楽字幕部分の出現部分を新たな開始位置とし、前記音楽区間の終了位置付近の前記音楽字幕部分の消失部分を新たな終了位置として、前記音楽区間を補正する音楽区間補正部とを有することを特徴とする音楽検出装置。 A music section detection unit that detects a music section in the processing target information based on audio information included in the processing target information;
A subtitle detection unit that detects a music subtitle portion in the processing target information based on subtitle information included in the processing target information;
The music section is corrected using the appearance portion of the music subtitle portion near the start position of the music section as a new start position and the disappearance portion of the music subtitle portion near the end position of the music section as a new end position. A music detection apparatus comprising a music section correction unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007252163A JP4864847B2 (en) | 2007-09-27 | 2007-09-27 | Music detection apparatus and music detection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007252163A JP4864847B2 (en) | 2007-09-27 | 2007-09-27 | Music detection apparatus and music detection method |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011243018A Division JP5559128B2 (en) | 2011-11-07 | 2011-11-07 | Apparatus, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009086016A true JP2009086016A (en) | 2009-04-23 |
JP4864847B2 JP4864847B2 (en) | 2012-02-01 |
Family
ID=40659574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007252163A Expired - Fee Related JP4864847B2 (en) | 2007-09-27 | 2007-09-27 | Music detection apparatus and music detection method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4864847B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011004197A (en) * | 2009-06-18 | 2011-01-06 | Toshiba Corp | Recording and reproducing apparatus and reproducing method |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11265396A (en) * | 1998-03-18 | 1999-09-28 | Nippon Telegr & Teleph Corp <Ntt> | Music video classification method, its device and medium for recording music video classification program |
JP2000099069A (en) * | 1998-09-24 | 2000-04-07 | Sony Corp | Information signal processing method and device |
JP2005284308A (en) * | 2005-05-26 | 2005-10-13 | Kddi Corp | Audio information classifying device |
WO2006003848A1 (en) * | 2004-06-30 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | Musical composition information calculating device and musical composition reproducing device |
JP2006301134A (en) * | 2005-04-19 | 2006-11-02 | Hitachi Ltd | Device and method for music detection, and sound recording and reproducing device |
JP2006324771A (en) * | 2005-05-17 | 2006-11-30 | Toshiba Corp | Video signal delimiter information setting method and apparatus judged from audio and video signal |
JP2007171289A (en) * | 2005-12-19 | 2007-07-05 | Mitsubishi Electric Corp | Music detecting apparatus |
JP2008076776A (en) * | 2006-09-21 | 2008-04-03 | Sony Corp | Data recording device, data recording method, and data recording program |
-
2007
- 2007-09-27 JP JP2007252163A patent/JP4864847B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11265396A (en) * | 1998-03-18 | 1999-09-28 | Nippon Telegr & Teleph Corp <Ntt> | Music video classification method, its device and medium for recording music video classification program |
JP2000099069A (en) * | 1998-09-24 | 2000-04-07 | Sony Corp | Information signal processing method and device |
WO2006003848A1 (en) * | 2004-06-30 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | Musical composition information calculating device and musical composition reproducing device |
JP2006301134A (en) * | 2005-04-19 | 2006-11-02 | Hitachi Ltd | Device and method for music detection, and sound recording and reproducing device |
JP2006324771A (en) * | 2005-05-17 | 2006-11-30 | Toshiba Corp | Video signal delimiter information setting method and apparatus judged from audio and video signal |
JP2005284308A (en) * | 2005-05-26 | 2005-10-13 | Kddi Corp | Audio information classifying device |
JP2007171289A (en) * | 2005-12-19 | 2007-07-05 | Mitsubishi Electric Corp | Music detecting apparatus |
JP2008076776A (en) * | 2006-09-21 | 2008-04-03 | Sony Corp | Data recording device, data recording method, and data recording program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011004197A (en) * | 2009-06-18 | 2011-01-06 | Toshiba Corp | Recording and reproducing apparatus and reproducing method |
Also Published As
Publication number | Publication date |
---|---|
JP4864847B2 (en) | 2012-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8855796B2 (en) | Method and device for detecting music segment, and method and device for recording data | |
US8682132B2 (en) | Method and device for detecting music segment, and method and device for recording data | |
EP1924092A1 (en) | Content replay apparatus, content reproducing apparatus, content replay method, content reproducing method, program and recording medium | |
KR20060027826A (en) | Video processing apparatus, ic circuit for video processing apparatus, video processing method, and video processing program | |
JP2007049515A (en) | Video audio recording apparatus | |
JP2004191780A (en) | Device and method for sound signal processing, device and method for signal recording, and program | |
JP4611952B2 (en) | Program recording apparatus and commercial detection method | |
JP2008205745A (en) | Image reproducing device and method | |
US7764862B2 (en) | Method of and apparatus for setting video signal delimiter information judged from audio and video signals | |
KR20030023576A (en) | Image information summary apparatus, image information summary method and image information summary processing program | |
KR20090111620A (en) | Method and apparatus for segmenting recorded news program according to articles | |
JP4215681B2 (en) | Moving image processing apparatus and method | |
JP5559128B2 (en) | Apparatus, method, and program | |
JP2007049380A (en) | Video/audio recording apparatus | |
JP4719604B2 (en) | Commercial detection method, commercial detection apparatus, and recording medium on which commercial detection program is recorded | |
JP4864847B2 (en) | Music detection apparatus and music detection method | |
JP2007267121A (en) | Cm detection apparatus | |
JP3925466B2 (en) | Stream data editing method and apparatus | |
US20060263062A1 (en) | Method of and apparatus for setting video signal delimiter information using silent portions | |
JP4381345B2 (en) | Video signal delimiter information setting method and apparatus using audio mode | |
JP2009135754A (en) | Digest creating apparatus and method | |
JP6164445B2 (en) | Chapter setting device | |
JP2009118204A (en) | Cm detection method and moving image reproduction apparatus using same | |
JP2007127761A (en) | Conversation section detector and conversation detection program | |
JP2007318426A (en) | Video analyzing device and video analyzing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141118 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141118 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |