JP6549234B2 - 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム - Google Patents
楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム Download PDFInfo
- Publication number
- JP6549234B2 JP6549234B2 JP2017537159A JP2017537159A JP6549234B2 JP 6549234 B2 JP6549234 B2 JP 6549234B2 JP 2017537159 A JP2017537159 A JP 2017537159A JP 2017537159 A JP2017537159 A JP 2017537159A JP 6549234 B2 JP6549234 B2 JP 6549234B2
- Authority
- JP
- Japan
- Prior art keywords
- sound data
- fft
- execution interval
- reproduction time
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 57
- 238000007405 data analysis Methods 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 8
- 238000010183 spectrum analysis Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 101100173585 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fft1 gene Proteins 0.000 description 1
- 101100173586 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fft2 gene Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
音データの解析は、ある程度の長さの音データをサンプリングし、入力された波形を、例えば、FFT(Fast Fourier Transform)を用いて解析することにより行われる。
このような音データの解析は、DJ関連機器の分野においても、BPM(Beats Per Minute)楽曲に関連する技術として利用されている。
DJ関連機器でこのような音データの解析を利用すれば、解析されたテンポ、キー、スケール等により、曲と曲との間を違和感なくつなぐことができるため、パフォーマンスの高いDJを提供することができる。
入力された音データの再生時間を検出する再生時間検出手段と、
前記再生時間検出手段で検出された再生時間に応じて、FFT(Fast Fourier Transform)の実行間隔を設定する実行間隔設定手段と、
前記実行間隔設定手段で設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う音データ解析手段と、
を備えていることを特徴とする。
入力された音データのデータ長を検出するデータ長検出手段と、
前記データ長検出手段で検出されたデータ長に応じて、FFTの実行間隔を設定する実行間隔設定手段と、
前記実行間隔設定手段で設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う音データ解析手段と、
を備えていることを特徴とする。
入力された音データの再生時間を検出する手順と、
検出された再生時間に応じて、FFTの実行間隔を設定する手順と、
設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う手順と、
を実行することを特徴とする。
入力された音データの再生時間を検出する手順と、
検出された再生時間に応じて、FFTの実行間隔を設定する手順と、
設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う手順と、
をコンピュータに実行させることを特徴とする。
図1には、本実施形態に係る楽曲解析装置1が示されている。この楽曲解析装置1は、入力されたPCMデータ等のデジタル化された音データSDを解析し、その音データSDのキーを判定して、表示装置等の表示画面上に入力された音データのキー表示KDとして表示させる装置である。
楽曲解析装置1は、一般的なコンピュータ、OS(Operation System)を搭載した携帯情報端末で起動するソフトウェアアプリケーションとして構成され、再生時間検出手段2、音データ判定手段3、音データ複製手段4、音データ解析手段5、実行間隔設定手段6、及びキー判定手段7を備える。
解析の可否の判定は、音データ解析手段5に適用される窓関数に必要な最短の時間以上の時間を、音データSDの再生時間が有しているか否かで判定される。
例えば、BPM200の通常の4/4拍子の楽曲の場合、1拍は300msecとなり、16分音符は75msecとなる。FFTを実行して、音階のA0にあたる27.5Hzの低音の音データSDの解析を行う場合、最低でも1.2sのデータが必要である。
音データ判定手段3は、音データSDが所定の再生時間未満であると判定したら、その旨の判定結果を、音データ複製手段4に出力する。
なお、複製は、再生時間t2が音データ解析手段5で解析できるだけの再生時間であればよく、複製の回数Nは整数でなくてもよい。
音データ複製手段4は、複製により、所定の時間以上とされた音データSD’を音データ解析手段5に出力する。
FFTには、図3に示すように、通常、窓関数であるハミング窓HMWが適用されている。ハミング窓HMWは、FFTの実行時間中の時間軸上の両端の信号強度の増幅を弱め、FFT実行時に、サンプリングされた波形の継ぎ目の不連続部分の影響を少なくするために適用されている。
そこで、本実施形態では、解析可能なデータとして、FFT実行時間のうち信号強度が弱められない解析期間T0の信号強度を用いて、周波数スペクトル解析を行っている。解析期間T0は、任意に定めうるが、本実施形態では、ハミング窓HMWの0.7(70%)値で設定している。
なお、本実施形態では、ハミング窓HMWを適用しているが、これに限らず、ハニング窓、フラップトップ窓等を窓関数として用いてもよい。
具体的には、実行間隔設定手段6は、図4に示されるように、1回目にFFT1が実行された後、2回目のFFT2の実行開始の時間を、実行間隔TIとして設定する。以後、本実施形態では、3回目のFFT3は、時間2TI後に開始され、順次FFTが実行される。
実行間隔設定手段6は、例えば、再生時間が30sec以上の長い音データSDの場合、図5に示されるように、実行間隔TIを大きくし、再生時間が30s未満の短い音データSDの場合、図6に示されるように、実行間隔TIを小さくする。実行間隔TIの下限値は、FFT1、FFT2・・・の解析期間T0が連続するような実行間隔TIとする。
実行間隔設定手段6は、設定した実行間隔TIを前述した音データ解析手段5に出力する。
音データ解析手段5は、実行間隔TIに基づいて、FFTを繰り返し実行し、FFTの実行の度に解析結果をキー判定手段7に出力する。
具体的には、キー判定手段7は、オクターブあたり12の音階それぞれについて、各音をルートとするマイナーキー及びメジャーキーの2種類、計24種類の音階の基準周波数を記憶している。
キー判定手段7は、実行間隔TI毎に入力される解析結果を時間軸方向に合算し、得られた合算値から、信号強度の強い周波数に近い基準周波数を選択し、図7に示されるように、各音階の信号強度を求める。
次に、キー判定手段7は、図8に示されるように、信号強度の強い順番に並べ替え、正規化し、信号強度の強いいくつかの音階を選択して、音データSD、SD’のキーを判定する。
キー判定手段7は、音データSD、SD’のキー判定結果をキー表示KDとして、コンピュータのディスプレイや、携帯端末の画面上に表示する。
まず、コンピュータや携帯端末のユーザーが、楽曲解析装置1を画面上で選択し、プログラムを起動し、解析対象である音データSDを選択すると、楽曲解析装置1に音データSDが入力される(手順S1)。
音データSDが入力されたら、再生時間検出手段2は、音データSDの再生時間を検出する(手順S2)。
音データ判定手段3は、音データSDの再生時間が所定の時間以上であるかどうかを判定する(手順S3)。
はじめから音データSDの再生時間が所定の時間以上であるか、音データSD’の再生時間が所定の時間以上となった場合、実行間隔設定手段6は、音データSD、SD’の再生時間に基づいて、音データ解析手段5の実行間隔TIを設定する(手順S6)。
音データ解析手段5は、音データSD、SD’が終了したか否かを判定し(手順S8)、音データSD、SD’が終了したと判定されたら、解析結果をキー判定手段に出力する。
キー判定手段7は、解析結果に基づいて、音データSD、SD’のキー判定を行う(手順S9)。
キー判定手段7は、判定結果である音データSD、SD’のキーを、コンピュータや携帯端末の表示画面上に出力する(手順S10)。
楽曲解析装置1が音データ複製手段4を備えていることにより、非常に短い音データSDであっても、複製により所定時間以上の音データSD’とすることができるため、音データSDの再生時間によらず、音データ解析手段5により、FFTを実行して周波数スペクトル解析を行って、音データSD、SD’のキー判定を行うことができる。
これにより、音データSDの再生時間の長短によらず、DJ関連機器で様々な音データSDを利用できるので、パフォーマンスの高いDJを提供することができる。
一方、再生時間の長い音データSDの場合、実行間隔TIの実行間隔TIを長くして、音データSDの再生中のFFTの実行回数を減らして、解析時間を短縮することができる。なお、長い音データSDの場合、FFTの実行回数が相対的に少なくなり、解析が粗くなる傾向があるが、キー判定等の用途には充分な実行回数が得られるため、支障なく良好な結果を得ることができる。
前述した実施形態では、楽曲解析装置1は、音データSDのキー判定を行うものであったが、本発明はこれに限らず、キー及びスケール判定を行う楽曲解析装置として利用してもよい。
また、前述した実施形態では、実行間隔設定手段6は、音データSD、SD’の再生時間に基づいて、実行間隔TIを設定していたが、本発明はこれに限られない。入力される音データのデータ長に基づいて、実行間隔を設定してもよい。
その他、本発明の目的を達成できる範囲で他の構成を採用してもよい。
Claims (6)
- 入力された音データの再生時間を検出する再生時間検出手段と、
前記再生時間検出手段で検出された再生時間に応じて、FFT(Fast Fourier Transform)の実行間隔を設定する実行間隔設定手段と、
前記実行間隔設定手段で設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う音データ解析手段と、
を備えていることを特徴とする楽曲解析装置。 - 入力された音データのデータ長を検出するデータ長検出手段と、
前記データ長検出手段で検出されたデータ長に応じて、FFTの実行間隔を設定する実行間隔設定手段と、
前記実行間隔設定手段で設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う音データ解析手段と、
を備えていることを特徴とする楽曲解析装置。 - 請求項1又は請求項2に記載の楽曲解析装置において、
前記実行間隔設定手段は、
入力された音データの再生時間又はデータ長が、所定の時間又は所定のデータ長よりも長い場合、FFTの実行間隔を通常のFFTの実行間隔よりも長くとり、
入力された音データの再生時間又はデータ長が所定の時間又は所定のデータ長よりも短い場合、FFTの実行間隔を通常のFFTの実行間隔よりも短くとること、
を特徴とする楽曲解析装置。 - 請求項1又は請求項2に記載の楽曲解析装置において、
入力された音データの再生時間又はデータ長が、前記FFTの解析可能な再生時間又はデータ長より短い場合、入力された音データを解析可能な再生時間又はデータ長以上になるまで複製する音データ複製手段を備え、
前記音データ解析手段は、当該複製した音データを解析対象とすることを特徴とする楽曲解析装置。 - 入力された音データの再生時間を検出する手順と、
検出された再生時間に応じて、FFTの実行間隔を設定する手順と、
設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う手順と、
を実行することを特徴とする楽曲解析方法。 - 入力された音データの再生時間を検出する手順と、
検出された再生時間に応じて、FFTの実行間隔を設定する手順と、
設定されたFFTの実行間隔に基づいて、FFTを実行し、入力された音データの解析を行う手順と、
をコンピュータに実行させることを特徴とする楽曲解析プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/075077 WO2017037920A1 (ja) | 2015-09-03 | 2015-09-03 | 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017037920A1 JPWO2017037920A1 (ja) | 2018-06-14 |
JP6549234B2 true JP6549234B2 (ja) | 2019-07-24 |
Family
ID=58186787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017537159A Active JP6549234B2 (ja) | 2015-09-03 | 2015-09-03 | 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3346468B1 (ja) |
JP (1) | JP6549234B2 (ja) |
WO (1) | WO2017037920A1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3741106B2 (ja) * | 2003-02-21 | 2006-02-01 | ヤマハ株式会社 | 楽音波形分析方法及び楽音波形分析合成方法 |
JP4767691B2 (ja) * | 2005-07-19 | 2011-09-07 | 株式会社河合楽器製作所 | テンポ検出装置、コード名検出装置及びプログラム |
JP4823804B2 (ja) * | 2006-08-09 | 2011-11-24 | 株式会社河合楽器製作所 | コード名検出装置及びコード名検出用プログラム |
JP2013235050A (ja) * | 2012-05-07 | 2013-11-21 | Sony Corp | 情報処理装置及び方法、並びにプログラム |
-
2015
- 2015-09-03 EP EP15903039.4A patent/EP3346468B1/en active Active
- 2015-09-03 JP JP2017537159A patent/JP6549234B2/ja active Active
- 2015-09-03 WO PCT/JP2015/075077 patent/WO2017037920A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP3346468A4 (en) | 2019-04-24 |
EP3346468A1 (en) | 2018-07-11 |
EP3346468B1 (en) | 2021-11-03 |
JPWO2017037920A1 (ja) | 2018-06-14 |
WO2017037920A1 (ja) | 2017-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9330649B2 (en) | Selecting audio samples of varying velocity level | |
WO2022105221A1 (zh) | 人声伴奏对齐方法及装置 | |
WO2020015411A1 (zh) | 一种训练改编水平评价模型、评价改编水平的方法及装置 | |
CN108292499A (zh) | 技巧确定装置和记录介质 | |
US20110255700A1 (en) | Detecting Musical Structures | |
JP5395399B2 (ja) | 携帯端末、拍位置推定方法および拍位置推定プログラム | |
JP2015079151A (ja) | 楽曲判別装置、楽曲判別装置の判別方法、プログラム | |
WO2019043797A1 (ja) | 楽曲解析装置および楽曲解析プログラム | |
JP6549234B2 (ja) | 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム | |
Cornelis et al. | Evaluation and recommendation of pulse and tempo annotation in ethnic music | |
Pang et al. | Automatic detection of vibrato in monophonic music | |
WO2017037919A1 (ja) | 楽曲解析装置、楽曲解析方法、及び楽曲解析プログラム | |
WO2021059701A1 (ja) | 楽曲解析装置、楽曲解析方法、および楽曲解析プログラム | |
JP2015200685A (ja) | アタック位置検出プログラムおよびアタック位置検出装置 | |
JP2007272118A (ja) | 楽曲テンポ抽出方法、装置及びプログラム | |
JP6946442B2 (ja) | 楽曲解析装置および楽曲解析プログラム | |
JP2015040970A (ja) | 小節間隔推定およびその推定のための特徴量抽出を行う装置、方法、およびプログラム | |
JP6168649B2 (ja) | コード検出装置及びプログラム | |
CN112908289B (zh) | 节拍确定方法、装置、设备和存储介质 | |
JP2014109603A (ja) | 演奏評価装置、演奏評価方法 | |
WO2024034118A1 (ja) | 音声信号処理装置、音声信号処理方法およびプログラム | |
JP6854350B2 (ja) | 楽曲解析装置および楽曲解析プログラム | |
JP7176114B2 (ja) | 楽曲解析装置、プログラムおよび楽曲解析方法 | |
JP6847242B2 (ja) | 楽曲解析装置および楽曲解析プログラム | |
WO2024034115A1 (ja) | 音声信号処理装置、音声信号処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180302 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6549234 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |