JPH11265396A - 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 - Google Patents
音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体Info
- Publication number
- JPH11265396A JPH11265396A JP10068159A JP6815998A JPH11265396A JP H11265396 A JPH11265396 A JP H11265396A JP 10068159 A JP10068159 A JP 10068159A JP 6815998 A JP6815998 A JP 6815998A JP H11265396 A JPH11265396 A JP H11265396A
- Authority
- JP
- Japan
- Prior art keywords
- music
- video
- image
- information
- telop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
用いて、曲のテンポの早さを自動的に検出し、音楽を分
類することを目的としている。 【解決手段】 映像情報を入力し、映像情報の音情報か
ら音楽を検出し、検出された音楽に対応する画像情報の
特徴を抽出し、画像の特徴に基づいて音楽を分類する。
Description
て音楽映像を分類する音楽映像分類方法、装置および音
楽映像分類プログラムを記録した記録媒体に関する。
などのジャンルの他、悲しい曲、楽しい曲、テンポの早
い曲、遅い曲などの分類があるが、自動的にこのような
分類を行うためには高度な音楽認識技術が必要であり、
実用には至っていない。ただテンポの抽出には、ドラム
のビートを周波数スペクトルの急激な立ち上がりから検
出し、利用するものがある。
する方法では、ドラムのような強いパワーを持つ楽器を
用いない場合には、正確なテンポが抽出出来ないという
問題があった。
を用いて、曲のテンポの早さを自動的に検出し、音楽を
分類することを目的としている。
め、本発明においては、映像情報を入力し、映像情報の
音情報から音楽を検出し、検出された音楽に対応する画
像情報の特徴を抽出し、画像の特徴に基づいて音楽を分
類することにより、ビートが明確に検出できないような
音楽でもテンポによる分類ができるようにしている。
無、テロップの有無および大きさ、被写体あるいはカメ
ラの動きのうち、少なくとも1つを検出することによ
り、音情報を用いずに音楽のテンポを算出することがで
きるようにしている。
度、テロップの単位時間あたりの出現頻度を大きさで正
規化した値、被写体あるいはカメラの動きの大きさのう
ち少なくとも1つに基づいて音楽を分類するようにして
いる。
図面を参照して説明する。図1は、本発明の一実施形態
の音楽映像分類装置の概略構成を示すブロック図であ
る。本実施形態の音楽映像分類装置は、映像を入力する
映像入力部101と、音楽を検出する音楽検出部102
と、検出された音楽を蓄積する音楽蓄積部103と、画
像の特徴を抽出する画像特徴抽出部104と、音楽を分
類する音楽分類部108と、蓄積された音楽を検索し、
再生する音楽再生部109から構成されている。また、
画像特徴抽出部104は、カット点検出部105と、テ
ロップ検出部106と、動き検出部107から構成され
ている。
装置の処理の流れを示したフローチャートである。本発
明をソフトウェアで実現した場合でも同様の処理の流れ
となる。
における音情報が解析され、音楽の検出が行われる。音
楽の検出は、音情報の周波数スペクトルのピークが、周
波数方向に対して時間的に安定しているという特徴を用
いる方法(南他、「音解析による映像インデクシン
グ」、電子情報通信学会総合大会、D−12−64、1
997)などを用いることが可能である。
グ」は、映像に含まれる音情報から、音声や音楽を自動
的に検出し、これらが含まれる部分のみを抜き出して映
像を要約するものである。例えば、歌番組のトークを聞
かずに歌の部分のみを聞きたいといった場合に有効であ
る。音楽が存在する場合、周波数スペクトルのピーク
は、周波数方向に対して時間的に安定しているという特
徴があることから、ピークを検出し、時間的な持続性を
算出することによって、音楽を検出することができる。
れ、音楽が開始された場合には、音楽蓄積処理203に
よって音楽を蓄積しながら、対応する画像情報から画像
特徴抽出処理204が行われる。画像特徴抽出処理20
4では、カット点の検出、テロップ領域の検出、被写体
あるいはカメラの動きの検出のうち少なくともいずれか
1つが行われる。カット点の検出には、画素値のフレー
ム間差分を用いる方法(谷口他、「映像ショット切換え
検出法とその映像アクセスインタフェースへの応用」、
電子情報通信学会論文誌J79−D−2、No.4、1
996)などが利用可能である。
の映像アクセスインタフェースへの応用」は、映像の場
面の変わり目であるカット点を自動的に検出し、カット
の直後の静止画を順次並べて表示することによって、映
像の内容が一覧できる。この文献の方法では、映像のフ
レーム間差分を求めることによって、カット点を求める
ことを基本とし、隣接するフレームだけでなく、少し間
をおいたフレームとの差分を評価することによって、フ
ェード等のゆっくりとした変化も捉えることができる。
また、応用例として、1日分のテレビの映像の一覧を作
成し、好きな時間の映像を見ることができるシステムを
構築している。
域が背景部分に比べて高輝度であり、エッジを抽出しや
すいという性質を用いた方法(茂木他、「ニュース映像
中の文字認識に基づく記事の索引付け」、電子情報通信
学会技術研究報告IE95−153、1996)や、映
像符号化の国際標準であるMPEGなどのフレーム間の
相関を用いて符号化された映像データのうち、フレーム
間の相関を用い、かつ動き補償を用いないで符号化され
た画素が時間的・空間的に集中している部分を抽出する
方法(特願平8−131898「動画像テロップ抽出方
法及び装置」)などの方法を用いることができる。
づく記事の索引付け」は、映像中に現れる文字情報(テ
ロップ)は、映像の検索に有効であり、ニュースを例に
取ると、ニュースの項目や主要な場面でテロップが現れ
る。テロップの出現を自動的に検出することによって、
映像をニュース項目ごとに分割したり、テロップが表示
されている画像を並べるだけで大体の内容を知ることが
可能である。この文献では、テロップの領域が背景部分
に比べて高輝度であり、エッジを抽出しやすいという性
質を用いた方法を取り入れている。
置」は、映像符号化の国際標準であるMPEGなどのフ
レーム間の相関を用いて符号化された映像データのう
ち、フレーム間の相関を用い、かつ動き補償を用いない
で符号化された画素が時間的・空間的に集中している部
分を抽出する方法である。目的は、ニュー映像中の文字
認識に基づく記事の索引付けと同じである。
出する方法については、動きベクトルの特徴を用いる方
法(阿久津他、「動画像インデクシング目的としたカメ
ラ操作の規定方法」、電子情報通信学会論文誌J75−
D−2、No.2、1992)などが利用可能である。
たカメラ操作の規定方法」は、映像を撮影する時には、
カメラを横に振ったり、ズームしたりといったことが行
われるが、これは、空間的な広がりを表現するためや、
ある特定の箇所をより詳しく見せるために行うものであ
る。よって、そのような操作を伴う映像は、撮影者の意
図が入っていることが多く、この文献は、これらの操作
を自動的に検出する方法について述べている。応用例と
しては、カメラが動いた量を算出し、その量だけ画像を
ずらしながら貼り付けることでパノラマを作成するもの
がある。
定され、音楽分類処理206において、画像特徴抽出処
理204で抽出された特徴量に基づいて音楽が分類され
る。画像の特徴としてカット点を用いた場合には、カッ
ト点が単位時間あたりに出現する頻度を算出し、頻度が
高い場合には、音楽のテンポが早く、頻度が低い場合に
は音楽のテンポが遅いと分類される。また、テロップを
用いた場合には、カット点と同様にテロップの出現頻度
によって分類するが、表示される文字数が少ない場合に
は、出現頻度が高くてもテンポが早いとは限らないの
で、テロップ領域の大きさの逆数を出現頻度に乗じた値
を用いる。さらに、被写体あるいはカメラの動きを用い
た場合には、動きベクトルが大きいほどテンポが早いと
分類される。
に蓄積され、音楽再生部109によって音楽を検索、再
生することが可能である。なお前記において音楽映像の
分類について説明したが、当該分類の態様はデータ処理
装置が実行できるプログラムの形で保持することがで
き、本発明は当該プログラムを記録した記録媒体をも含
むものである。
映像情報を入力し、映像情報の音情報から音楽を検出
し、検出された音楽に対応する画像情報の特徴を抽出
し、画像の特徴に基づいて音楽を分類することを可能に
し、ビートが明確に検出できないような音楽でもテンポ
による分類を可能にする。
して請求項3、6および9の発明は、場面の替わり目で
あるカット点の有無、テロップの有無および大きさ、被
写体あるいはカメラの動きのうち、少なくとも1つを検
出することにより、音情報を分析する処理を用いないで
音楽のテンポを算出することを可能にする。
構成を示すブロック図である。
の流れと本発明をソフトウェアで実現した場合の処理の
流れを示すフローチャートである。
Claims (9)
- 【請求項1】 与えられた映像情報から音楽映像を分類
する方法であって、 映像情報を入力する映像入力段階と、 映像情報における音情報から音楽を検出する音楽検出段
階と、 検出された音楽を蓄積する音楽蓄積段階と、 検出された音楽に対応する画像情報の特徴を抽出する画
像特徴抽出段階と、 前記画像の特徴に基づいて音楽を分類する音楽分類段階
と、 蓄積された音楽を検索、再生する音楽再生段階と、 を実行することを特徴とする音楽映像分類方法。 - 【請求項2】 前記画像特徴抽出段階において、場面の
替わり目であるカット点の有無、テロップの有無および
大きさ、被写体あるいはカメラの動きのうち、少なくと
も1つを検出することを特徴とする請求項1記載の音楽
映像分類方法。 - 【請求項3】 前記音楽分類段階は、カット点の単位時
間あたりの出現頻度、テロップの単位時間あたりの出現
頻度を大きさで正規化した値、被写体あるいはカメラの
動きの大きさのうち少なくとも1つに基づいて音楽を分
類することを特徴とする請求項2記載の音楽映像分類方
法。 - 【請求項4】 与えられた映像情報から音楽映像を分類
する装置であって、 映像情報を入力する映像入力部と、 映像情報における音情報から音楽を検出する音楽検出部
と、 検出された音楽を蓄積する音楽蓄積部と、 検出された音楽に対応する画像情報の特徴を抽出する画
像特徴抽出部と、 前記画像の特徴に基づいて音楽を分類する音楽分類部
と、 蓄積された音楽を検索、再生する音楽再生部と、 を具備することを特徴とする音楽映像分類装置。 - 【請求項5】 前記画像特徴抽出部は、場面の替わり目
であるカット点の有無を検出するカット点検出部、テロ
ップの有無および大きさを検出するテロップ検出部、被
写体あるいはカメラの動きを検出する動き検出部のう
ち、少なくとも1つを具備することを特徴とする請求項
4記載の音楽映像分類装置。 - 【請求項6】 前記音楽分類部は、カット点の単位時間
あたりの出現頻度、テロップの単位時間あたりの出現頻
度を大きさで正規化した値、被写体あるいはカメラの動
きの大きさのうち少なくとも1つに基づいて音楽を分類
することを特徴とする請求項5記載の音楽映像分類装
置。 - 【請求項7】 与えられた映像情報から音楽映像を分類
するプログラムを記録した記録媒体であって、 映像情報を入力する映像入力処理と、 映像情報における音情報から音楽を検出する音楽検出処
理と、 検出された音楽を蓄積する音楽蓄積処理と、 検出された音楽に対応する画像情報の特徴を抽出する画
像特徴抽出処理と、 前記画像の特徴に基づいて音楽を分類する音楽分類処理
と、 蓄積された音楽を検索、再生する音楽再生処理と、 をコンピュータに実行させるための音楽映像分類プログ
ラムを記録したことを特徴とする記録媒体。 - 【請求項8】 前記画像特徴抽出処理は、場面の替わり
目であるカット点の有無を検出するカット点検出処理、
テロップの有無および大きさを検出するテロップ検出処
理、被写体あるいはカメラの動きを検出する動き検出処
理のうち、少なくとも1つを実行するようにしているこ
とを特徴とする請求項7記載の記録媒体。 - 【請求項9】 前記音楽分類処理は、カット点の単位時
間あたりの出現頻度、テロップの単位時間あたりの出現
頻度を大きさで正規化した値、被写体あるいはカメラの
動きの大きさのうち少なくとも1つに基づいて音楽を分
類するようにしていることを特徴とする請求項8記載の
記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06815998A JP3517349B2 (ja) | 1998-03-18 | 1998-03-18 | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06815998A JP3517349B2 (ja) | 1998-03-18 | 1998-03-18 | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11265396A true JPH11265396A (ja) | 1999-09-28 |
JP3517349B2 JP3517349B2 (ja) | 2004-04-12 |
Family
ID=13365710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06815998A Expired - Lifetime JP3517349B2 (ja) | 1998-03-18 | 1998-03-18 | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3517349B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273505A (ja) * | 1999-12-14 | 2001-10-05 | Canon Inc | ビジュアル言語分類システム |
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
JP2004522177A (ja) * | 2000-06-29 | 2004-07-22 | ミュージックゲノム.コム インコーポレイテッド | 音楽に対する好みを予測するためのシステムおよび方法 |
JP2007033851A (ja) * | 2005-07-27 | 2007-02-08 | Sony Corp | ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法 |
JP2008089848A (ja) * | 2006-09-29 | 2008-04-17 | Yamaha Corp | 歌詞表示システム、カラオケ装置および生演奏カラオケシステム |
JP2009086016A (ja) * | 2007-09-27 | 2009-04-23 | Toshiba Corp | 音楽検出装置および音楽検出方法 |
US7631095B2 (en) | 2005-02-16 | 2009-12-08 | Sharp Laboratories Of America, Inc. | Systems and methods for obtaining the metadata for an Internet radio station in a bandwidth-efficient manner |
US7974495B2 (en) | 2002-06-10 | 2011-07-05 | Digimarc Corporation | Identification and protection of video |
WO2011118037A1 (ja) * | 2010-03-26 | 2011-09-29 | 富士通株式会社 | カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 |
JP2012037910A (ja) * | 2011-11-07 | 2012-02-23 | Toshiba Corp | 音楽検出装置 |
CN102903126A (zh) * | 2012-08-08 | 2013-01-30 | 公安部第三研究所 | 一种视频图像纹理特征提取和结构化描述的系统和方法 |
-
1998
- 1998-03-18 JP JP06815998A patent/JP3517349B2/ja not_active Expired - Lifetime
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
JP4612772B2 (ja) * | 1999-12-14 | 2011-01-12 | キヤノン株式会社 | 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体 |
JP2001273505A (ja) * | 1999-12-14 | 2001-10-05 | Canon Inc | ビジュアル言語分類システム |
JP2004522177A (ja) * | 2000-06-29 | 2004-07-22 | ミュージックゲノム.コム インコーポレイテッド | 音楽に対する好みを予測するためのシステムおよび方法 |
US7974495B2 (en) | 2002-06-10 | 2011-07-05 | Digimarc Corporation | Identification and protection of video |
US7631095B2 (en) | 2005-02-16 | 2009-12-08 | Sharp Laboratories Of America, Inc. | Systems and methods for obtaining the metadata for an Internet radio station in a bandwidth-efficient manner |
JP2007033851A (ja) * | 2005-07-27 | 2007-02-08 | Sony Corp | ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法 |
JP2008089848A (ja) * | 2006-09-29 | 2008-04-17 | Yamaha Corp | 歌詞表示システム、カラオケ装置および生演奏カラオケシステム |
JP2009086016A (ja) * | 2007-09-27 | 2009-04-23 | Toshiba Corp | 音楽検出装置および音楽検出方法 |
WO2011118037A1 (ja) * | 2010-03-26 | 2011-09-29 | 富士通株式会社 | カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 |
US20130071089A1 (en) * | 2010-03-26 | 2013-03-21 | Fujitsu Limited | Category creating program, category creating apparatus, and category creating method |
JP5516720B2 (ja) * | 2010-03-26 | 2014-06-11 | 富士通株式会社 | カテゴリ生成プログラム、カテゴリ生成装置およびカテゴリ生成方法 |
KR101469021B1 (ko) * | 2010-03-26 | 2014-12-04 | 후지쯔 가부시끼가이샤 | 카테고리 생성 프로그램, 카테고리 생성 장치 및 카테고리 생성 방법 |
US9047916B2 (en) * | 2010-03-26 | 2015-06-02 | Fujitsu Limited | Recording medium, category creating apparatus, and category creating method |
JP2012037910A (ja) * | 2011-11-07 | 2012-02-23 | Toshiba Corp | 音楽検出装置 |
CN102903126A (zh) * | 2012-08-08 | 2013-01-30 | 公安部第三研究所 | 一种视频图像纹理特征提取和结构化描述的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3517349B2 (ja) | 2004-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5031312B2 (ja) | 複数のフレームを含むビデオの要約を生成するための方法およびシステム | |
US7796860B2 (en) | Method and system for playing back videos at speeds adapted to content | |
Li et al. | An overview of video abstraction techniques | |
Hanjalic | Content-based analysis of digital video | |
Smith et al. | Video skimming and characterization through the combination of image and language understanding | |
US7020351B1 (en) | Method and apparatus for enhancing and indexing video and audio signals | |
KR100915847B1 (ko) | 스트리밍 비디오 북마크들 | |
US7327885B2 (en) | Method for detecting short term unusual events in videos | |
US6928233B1 (en) | Signal processing method and video signal processor for detecting and analyzing a pattern reflecting the semantics of the content of a signal | |
US20060008152A1 (en) | Method and apparatus for enhancing and indexing video and audio signals | |
US6940910B2 (en) | Method of detecting dissolve/fade in MPEG-compressed video environment | |
US7266771B1 (en) | Video stream representation and navigation using inherent data | |
KR20040070269A (ko) | 광고방송 및 다른 비디오 콘텐츠의 검출을 위한 패밀리히스토그램 기반으로 한 기술들 | |
JP2006314090A (ja) | コンピュータ実施される、ビデオを変換して表示する方法 | |
JPH11265396A (ja) | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 | |
Zhang | Content-based video browsing and retrieval | |
JP2010039877A (ja) | 要約コンテンツ生成装置および要約コンテンツ生成プログラム | |
JP3469122B2 (ja) | 編集用映像区間分類方法及び装置、並びにこの方法を記録した記録媒体 | |
JP3341574B2 (ja) | 映像信号記録/再生装置 | |
Lie et al. | News video summarization based on spatial and motion feature analysis | |
Peker et al. | An extended framework for adaptive playback-based video summarization | |
JP2001119661A (ja) | 動画編集システムおよび記録媒体 | |
JPH11261946A (ja) | 映像表示方法および装置並びに該映像表示方法を記録した記録媒体 | |
JP2002199332A (ja) | オーディオ概要情報、オーディオビデオ概要情報の抽出装置、再生装置、および記録媒体 | |
JP2011044871A (ja) | シーンラベル生成装置、シーンラベル生成方法及びコンテンツ配信サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040123 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080130 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090130 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090130 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100130 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120130 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130130 Year of fee payment: 9 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |