JP4202964B2 - 映像データへの楽曲データ付加装置 - Google Patents
映像データへの楽曲データ付加装置 Download PDFInfo
- Publication number
- JP4202964B2 JP4202964B2 JP2004137517A JP2004137517A JP4202964B2 JP 4202964 B2 JP4202964 B2 JP 4202964B2 JP 2004137517 A JP2004137517 A JP 2004137517A JP 2004137517 A JP2004137517 A JP 2004137517A JP 4202964 B2 JP4202964 B2 JP 4202964B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- parameter
- sensitivity parameter
- data
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Of Color Television Signals (AREA)
- Electrophonic Musical Instruments (AREA)
Description
(1.楽曲データの準備)
まず、楽曲が記録された音響信号をデジタル化した楽曲データについて説明する。時系列信号として与えられたアナログ音響信号を従来の一般的なPCMの手法を用いてデジタル化する。具体的には、所定のサンプリング周波数でアナログ音響信号をサンプリングし、振幅を所定の量子化ビット数を用いてデジタルデータに変換する処理を行う。このようにしてデジタル化した音響信号は、量子化ビット数に応じた値をもつサンプルの時系列の集合となる。例えば、サンプリング周波数を48kHz、量子化ビット数を16ビットとした場合、1秒間のアナログ音響信号は、−32768〜32767の値をとるサンプル48000個からなるデジタル音響信号に変換されることになる。このようにして得られたデジタル音響信号の各サンプルi(i=0〜S−1)の値をX(i)とする。例えば、3分間のステレオ音楽の場合、サンプリング周波数を48kHzとすると、サンプル数S=17280000(=48000×2×180)となる。なお、ステレオ音楽の場合、元の左右の信号から得られたサンプルは、交互に記録されることになる。
上記のようなデジタル音響信号すなわち楽曲データに対して、検索用の各音響感性パラメータを算出する。具体的には、専用のソフトウェアが搭載されたコンピュータに、対象とする楽曲データを読み込ませ、読み込んだ楽曲データに対して、以下の各数式に従った処理を行うことにより算出される。音楽のダイナミックレンジを表す音量パラメータPvは以下の〔数式1〕により算出される。
Pv=20・log10(Σi=0,S-1|X(i)|/S)
Ps=20・log10(Σi=0,S/2-1|R(i)|・2/S)
但し、|x(2i)|≧|x(2i+1)|のときR(i)=x(2i)/x(2i+1)
|x(2i)|<|x(2i+1)|のときR(i)=x(2i+1)/x(2i)
f(n)=440×2γ(n)
γ(n)=(n−69)/12
ただし、n=0,1,2,・・・,127
Zk(n)=[[Σi=kT,kT+T-1 (X(2i)+X(2i+1)) /(2・cos (2πf(n)i/F)) ]2+[Σi=kT,kT+T-1 (X(2i)+X(2i+1)) /(2・sin (2πf(n)i/F)) ]2 ]1/4
Pp=[Σk=0,K-1{Σn=0,N-1n・Zk(n)/Σn=0,N-1Zk(n) }]/K
Pn={Σk=0,K-1C(k)}/K
ただし、C(k)はフレームkにおいて、Zk(n)>閾値となるnの総数
Ph=[Σk=0,K-1{Zk(m+4) −Zk(m+3)+Zk(m+16)−Zk(m+15)+Zk(m−8)−Zk(m−9)}/6]/K
Po=[Σk=0,K-1{Σn=0,N-1(Zk(n)+Zk(n+12) +Zk(n+19) +Zk(n+24)}/4]/K
Zk(n)=[[Σj=kT,kT+T-1 Y(j) ・cos (2πf(n)j/F) ]2 +[Σj=kT,kT+T-1Y(j) ・sin (2πf(n)j/F) ]2 ]1/4
Pt={Σk=0,L-1440・2(M2(k)-64)/12}/L
ただし、単位はBPM(1分あたりの拍数)
Pr={Σk=0,L-1100・2(M1(k)-M2(k))/12}/L
次に、楽曲データ付加装置について説明する。図1は第1の実施形態における楽曲データ付加装置の構成図である。図1において、10は楽曲データ記憶手段、20は音響感性パラメータ記憶手段、30は映像解析手段、40はパラメータ変換手段、50は検索実行手段、60は楽曲データ付加手段である。図1に示す楽曲データ付加装置は、ハードウェアとしてはコンピュータ本体およびその周辺機器で構成され、これらのハードウェアに各手段として機能するための専用のソフトウェアを搭載することにより実現される。
D(x,y)=〔{R(f,x,y)−R(f−1,x,y)}2+{G(f,x,y)−G(f−1,x,y)}2+{B(f,x,y)−B(f−1,x,y)}2〕1/2
V=Max
S=255×(Max−Min)/Max
r=(Max−R)/(Max−Min)
g=(Max−G)/(Max−Min)
b=(Max−B)/(Max−Min)
Rが最大のとき、H=60×(b−g)
Gが最大のとき、H=60×(r−b)+120
Bが最大のとき、H=60×(g−r)+240
(H<0の場合、H←H+360で正値にする)
上記の例では、1つの映像データに対して1つの楽曲データを付加するようにしたが、1つの映像データに対して2以上の楽曲データを付加するようにすることも可能である。例えば、映像の状態が途中で大きく変化した場合、その映像の状態に合わせて楽曲データも変化させることが望ましい。このような処理を行う場合には、具体的には、映像解析手段30が各映像パラメータの算出を行う際、映像パラメータを算出するための値が、あらかじめ定めた閾値以上に大きく変化している場合、その変化があったフレームの前までのフレーム群について一旦平均値を算出し、そのフレームまでの映像感性パラメータを算出する。例えば、各フレームについて算出したC,H,S,V,色数の値が隣接するフレーム間で大きく異なる場合、また、フレーム変動の値自体が大きい場合には、そのフレームまでの映像感性パラメータを算出することになる。そして、そのフレームから後については、別途平均値を算出して別の映像感性パラメータを算出する。このようにして、1つの映像データについて各映像感性パラメータの値が複数算出されることになる。パラメータ変換手段40では、各映像感性パラメータについて値が複数与えられた場合には、それぞれの値に基づいて音響感性パラメータのパラメータ条件を設定し、複数の楽曲データの検索を行い、映像感性パラメータ算出の基となるC,H,S,V,色数等の値が大きく変化したフレームの前後で、異なる楽曲データを付加することになる。楽曲データを切り換える際は、クロスフェード(前の楽曲と次の楽曲を若干オーバーラップさせ、オーバーラップ部分で前の楽曲のレベルを徐々に下げ、次の楽曲のレベルを徐々に上げる基本的なミキシング手法)により自動的につなげることもできるが、MAエンジニアによる手作業による編集が中心となる。
20・・・音響感性パラメータ記憶手段
30・・・映像解析手段
40・・・パラメータ変換手段
50・・・検索実行手段
60・・・楽曲データ付加手段
70・・・映像データ記憶手段
Claims (5)
- 楽曲をデジタルデータ化した楽曲データを複数記憶した楽曲データ記憶手段と、
前記楽曲データに対して音響解析を実施して算出された音量、音高、音符数、和声、倍音、テンポの6項目の各パラメータを音響感性パラメータとして、前記楽曲データを特定する情報と対応づけて記録した音響感性パラメータ記憶手段と、
映像データに対して映像解析を実施してコントラスト、色相、彩度、明度、色数、フレーム変動の6項目の各パラメータを映像感性パラメータとして算出する映像解析手段と、
前記映像感性パラメータのコントラストを前記音響感性パラメータの音量に、前記映像感性パラメータの色相を前記音響感性パラメータの音高に、前記映像感性パラメータの彩度を前記音響感性パラメータの音符数に、前記映像感性パラメータの明度を前記音響感性パラメータの和声に、前記映像感性パラメータの色数を前記音響感性パラメータの倍音に、前記映像感性パラメータのフレーム変動を前記音響感性パラメータのテンポに、各映像感性パラメータ、各音響感性パラメータをその値が上位から下位まで所定数の区分に分けた場合に、対応する区分となるように変換するパラメータ変換手段と、
前記映像感性パラメータから変換された前記音響感性パラメータを基に、前記音響感性パラメータ記憶手段を検索し、該当する楽曲特定情報を1以上抽出して、利用者に提示する検索実行手段と、
前記検索実行手段により提示された楽曲特定情報の中から利用者により選択された楽曲特定情報に対応する楽曲データを前記楽曲データ記憶手段から抽出し、抽出された楽曲データを前記映像データに対応付けて付加する楽曲データ付加手段と、
を有することを特徴とする映像データへの楽曲データ付加装置。 - 請求項1において、
前記パラメータ変換手段は、その値を基に各映像感性パラメータ、各音響感性パラメータをともに上位、中位、下位の3つの区分に分けるものであり、各映像感性パラメータが上位の場合に、各音響感性パラメータを上位として、各映像感性パラメータが中位の場合に、各音響感性パラメータを中位として、各映像感性パラメータが下位の場合に、各音響感性パラメータを下位として、変換するものであり、
前記検索実行手段は、前記音響感性パラメータ記憶手段に記憶された各音響感性パラメータの値を参照し、前記音響感性パラメータの区分に属する音響感性パラメータの値をもつ楽曲特定情報を抽出することを特徴とする映像データへの楽曲データ付加装置。 - 請求項1または請求項2において、
前記楽曲データの音響解析は、楽曲データの波形データ解析、周波数解析、時間軸を間引いた周波数解析の3手法で構成され、前記音響感性パラメータの中で、波形データ解析により音量パラメータが算出され、周波数解析により、音高、音符数、和声、倍音の各パラメータが算出され、時間軸を間引いた周波数解析により、テンポパラメータが算出されるものであることを特徴とする映像データへの楽曲データ付加装置。 - 請求項1から請求項3のいずれかにおいて、
前記映像データの映像解析は、各映像フレーム内のRGBで構成される各画素の原色の組合せから色数が算出され、隣接フレーム間の各原色同士の差分の二乗平均値によりフレーム変動が算出され、各映像フレーム内のRGBで構成される各画素をHSV色空間値に変換し、Hのフレーム内平均値を基に色相が算出され、Sのフレーム内平均値を基に彩度が算出され、Vのフレーム内平均値を基に明度が算出され、Vのフレーム内の最大値と最小値の差を基にコントラストが算出されるものであることを特徴とする映像データへの楽曲データ付加装置。 - 請求項1から請求項4のいずれかにおいて、
前記映像解析手段によりフレーム単位に算出された映像パラメータについて、隣接フレーム間で映像パラメータの値が所定の値以上に顕著に変化する箇所がある場合、その前後の映像フレームで前記映像データを分断し、映像パラメータの平均値を分断された前後のフレーム群ごとに算出することにより、前記パラメータ変換手段に複数の映像パラメータを渡すものであることを特徴とする映像データへの楽曲データ付加装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004137517A JP4202964B2 (ja) | 2004-05-06 | 2004-05-06 | 映像データへの楽曲データ付加装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004137517A JP4202964B2 (ja) | 2004-05-06 | 2004-05-06 | 映像データへの楽曲データ付加装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005321460A JP2005321460A (ja) | 2005-11-17 |
JP4202964B2 true JP4202964B2 (ja) | 2008-12-24 |
Family
ID=35468820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004137517A Expired - Fee Related JP4202964B2 (ja) | 2004-05-06 | 2004-05-06 | 映像データへの楽曲データ付加装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4202964B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4976716B2 (ja) * | 2006-03-22 | 2012-07-18 | クラリオン株式会社 | 車載音響機器 |
JP4489058B2 (ja) * | 2006-07-13 | 2010-06-23 | アルパイン株式会社 | 和音判定方法および装置 |
JP4548424B2 (ja) * | 2007-01-09 | 2010-09-22 | ヤマハ株式会社 | 楽音処理装置およびプログラム |
JP5371609B2 (ja) * | 2009-07-29 | 2013-12-18 | 株式会社第一興商 | 映像作品の内容の流れが選曲に影響するカラオケ装置 |
KR101579229B1 (ko) * | 2014-07-31 | 2015-12-21 | 경북대학교 산학협력단 | 영상 출력 장치 및 그 제어 방법 |
KR20190080086A (ko) * | 2017-12-28 | 2019-07-08 | 심재훈 | 그래픽 컨텐츠 기반 작곡서비스 운영장치 |
-
2004
- 2004-05-06 JP JP2004137517A patent/JP4202964B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005321460A (ja) | 2005-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9875304B2 (en) | Music selection and organization using audio fingerprints | |
US10242097B2 (en) | Music selection and organization using rhythm, texture and pitch | |
JP5282548B2 (ja) | 情報処理装置、音素材の切り出し方法、及びプログラム | |
US10225328B2 (en) | Music selection and organization using audio fingerprints | |
JP4313563B2 (ja) | 楽曲検索装置及び方法 | |
JP2010122630A (ja) | 情報処理装置、音声解析方法、及びプログラム | |
US10623480B2 (en) | Music categorization using rhythm, texture and pitch | |
JP2005156713A (ja) | 楽曲自動分類装置及び方法 | |
CN1717716B (zh) | 用于生成音乐数据的设备和方法 | |
US11271993B2 (en) | Streaming music categorization using rhythm, texture and pitch | |
Kirchhoff et al. | Evaluation of features for audio-to-audio alignment | |
KR100512143B1 (ko) | 멜로디 기반 음악 검색방법과 장치 | |
JP4202964B2 (ja) | 映像データへの楽曲データ付加装置 | |
JP4799333B2 (ja) | 楽曲分類方法、楽曲分類装置及びコンピュータプログラム | |
JPH10247099A (ja) | 音声信号の符号化方法および音声の記録再生装置 | |
JP5005445B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
JP4932614B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
JP4483561B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
JP5879813B2 (ja) | 複数音源の識別装置および複数音源に連動する情報処理装置 | |
JP4268328B2 (ja) | 音響信号の符号化方法 | |
JP4413643B2 (ja) | 楽曲検索再生装置 | |
JP2006201614A (ja) | 音程認識装置およびこれを利用した音声変換装置 | |
JP4152502B2 (ja) | 音響信号の符号化装置および符号データの編集装置 | |
Müller et al. | Music synchronization | |
JP4156252B2 (ja) | 音響信号の符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080917 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081009 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4202964 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131017 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |