JP2007041488A - 音声信号の音階的特性分析方法ならびに、その装置 - Google Patents
音声信号の音階的特性分析方法ならびに、その装置 Download PDFInfo
- Publication number
- JP2007041488A JP2007041488A JP2005248382A JP2005248382A JP2007041488A JP 2007041488 A JP2007041488 A JP 2007041488A JP 2005248382 A JP2005248382 A JP 2005248382A JP 2005248382 A JP2005248382 A JP 2005248382A JP 2007041488 A JP2007041488 A JP 2007041488A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- determined
- response
- time frame
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
【課題】自然音や楽曲などの音声信号の音階特性の大小を定め音声信号の選別方法を提供する。
【解決手段】デジタル音声データにおいて、任意時間フレームを定め周波数領域データを得る。レスポンスの大きい順につけられた倍音周波数値を所定数、定め、レスポンス順位毎に最頻値である周波数をレスポンス順位数定める。この中より1つの計測基準周波数を定め、別途定める音階特性分析基準である周波数位置関係を示した音階位置係数列が、計測基準周波数とそれぞれのレスポンス順位位置の周波数との関係が音階位置係数列に該当している割合をレスポンス順位毎に数値として算出し、全レスポンス順位の割合値を音階特性の度数と定める。
【選択図】図5
【解決手段】デジタル音声データにおいて、任意時間フレームを定め周波数領域データを得る。レスポンスの大きい順につけられた倍音周波数値を所定数、定め、レスポンス順位毎に最頻値である周波数をレスポンス順位数定める。この中より1つの計測基準周波数を定め、別途定める音階特性分析基準である周波数位置関係を示した音階位置係数列が、計測基準周波数とそれぞれのレスポンス順位位置の周波数との関係が音階位置係数列に該当している割合をレスポンス順位毎に数値として算出し、全レスポンス順位の割合値を音階特性の度数と定める。
【選択図】図5
Description
この発明は、音声信号を任意時間フレームに分割し各時間フレームの周波数成分を抽出することにより、その音声信号の音階的特性を解明する方法および装置に関するものである。
デジタル音声データ(デジタル波形データ)を所定時間フレームに分割し、周波数分析してメロディを抽出する方法がある。非特許文献1:特許公開2002−91433、特許文献1:特許公開H10−149160、などがある。
又、カラオケ装置の歌唱者の音声信号を評価するカラオケの採点機能がある。
非特許文献2:特許公開H05−217285
非特許文献2:特許公開H05−217285
メロディ抽出方法では、単にメロディを抽出して、譜面として正確なものを再現することが目的であった。
カラオケ採点機能では、楽譜通りに演奏されているかを比較して採点する方法なので、譜面情報及び基準演奏情報がなければ、採点することが出来なかった。
デジタル音声データ(音声信号)において所定の最小時間フレームを1単位として、複数の時間フレームに分割する。
分割された各々の最小時間フレーム内における周期を分析し、この周期に関し同系統の最小時間フレームがある場合は、それらを一群の時間フレームとして、任意時間フレームを形成する。
以上で定めた各任意時間フレームを周波数領域に変換して、各任意時間フレームが構成する周波数の中で、応答値(レスポンス)の大きい順に付けた整数値をレスポンス順位と定める。
周波数分析結果より各任意時間フレームのレスポンス順位に対応する周波数を定め、全ての任意時間フレーム中より成る各所定数レスポンス順位に対応する最頻値となる周波数を定める。
以上で定めた各所定数レスポンス順位の最頻周波数の中より、ある条件を満たした1つの計測基準周波数を定める。
又、音階特性分析基準として任意基準位置からの周波数の位置関係を示した係数列を音階位置係数列と別途定める。
上記のある条件を満たした1つの計測基準周波数に対して、各任意時間フレームの各所定数レスポンス順位に相当する周波数が上記の別途定めた音階位置係数列に該当している割合を各レスポンス順位毎に数値として算出し、上記デジタル音声データ(音声信号)の音階的特性を数値を用いて定める。
基準となる譜面情報や基準演奏データのようなものを必要としないでので、自然音「川のせせらぎ」「風の音」「波の音」「騒音」などの音階特性の分析が可能となる。
音声信号(楽曲)における音階特性を解明することにより、音声信号の選別と評価が可能となる。
三味線やバイオリンなどの楽器において、フレットが無い為に音程を取るのに高度な技術を必要とする楽器演奏の評価に用いることが出来る。又、声楽演奏での演奏評価も可能である。いずれの場合も基になる楽譜の情報等は必要としない。
又、オーケストラ、アンサンブル演奏などの、複数楽器を同時に演奏する形態の複数楽器間の音程における調和性(楽器間のチューニング)という観点からの演奏評価も可能となる。
又、音階の自然特性を解明することにより、自然特性を有している音声信号の選別が可能となる。自然特性の高い音声信号ほど、人体及び精神作用に良い影響をもたらし、自然特性の低い音声信号では、ノイズのように、人体及び精神に悪影響を及ぼすと考えられるので、これらの判別が可能になれば、音楽療法分野への貢献が可能となる。
1.ハードウエア構成の説明
(1)[一般的な方法]
図1は、マイク(1)より増幅した音声信号を、AD変換(3)してデジタル音声データとして記憶装置(5)に取りこみ演算処理部(4)にて、音階の特性分析を行い、表示部(6)で分析結果を表示する。
(1)[一般的な方法]
図1は、マイク(1)より増幅した音声信号を、AD変換(3)してデジタル音声データとして記憶装置(5)に取りこみ演算処理部(4)にて、音階の特性分析を行い、表示部(6)で分析結果を表示する。
(2)[コンピュータを用いた方法]
図2は、一般的なパーソナルコンピュータの構成図であり、上記手段の演算処理部(4)をCPU(7)で実現し、増幅部(2)とAD変換部(3)をオーディオボード(12)で実現した場合のハードウエア構成図である。
図2は、一般的なパーソナルコンピュータの構成図であり、上記手段の演算処理部(4)をCPU(7)で実現し、増幅部(2)とAD変換部(3)をオーディオボード(12)で実現した場合のハードウエア構成図である。
ハードディスク(9)にはオペレーティングシステム(10)がインストールされており、ファイル及びデータの入出力は、オペレーティングシステム(10)制御下のプログラムを利用することになる。以下の説明では、ファイル及びキーボード、画面等のデータ入出力は、OSに命令を出力することにより実現する。
マイク(11)より入力した音声信号を、デジタル音声データとして、ハードディスク(9)に取り込む。又、他の方法として、CD−ROMドライブ(15)より、CD−Audio(16)の音声信号をデジタル音声データのファイルとして取出し、ハードディスク(9)に記憶し、再び読込みを行い、その読み込んだ音声データをコンピュータ上で分析して結果をコンピュータの画面(8)に表示させる。
2.分析の方法
(1)分析の方法・周波数抽出処理
図3が、本発明のパーソナルコンピュータ上での分析方法フローチャートである。
(1)分析の方法・周波数抽出処理
図3が、本発明のパーソナルコンピュータ上での分析方法フローチャートである。
図5が、本発明の分析方法・推移図である。以下図面に従って説明すると、ハードディスク(9)より、OSに従って、デジタル音声データのファイルを読み込み(ステップS1)任意音声信号データ帯(18)内を最適と思われる最小時間フレームに分割する(a,b,c,d....)。
各最小時間フレーム内の周期のバラツキを測定し(ステップS2)、図5−19のように最小時間フレームを1単位として、周期に関して同系統の最小時間フレームがある場合は、それらを一群の時間フレームとし任意時間フレームを形成する(ステップS3)(19)。
上記で求めた各任意時間フレーム(19)をFFT処理(20、21、22、23)することにより周波数領域データを得る(ステップS4)。各任意時間フレーム毎に所定数のレスポンス順位位置に相当する倍音周波数を抽出(24、25、26、27)する(ステップS5)。所定数は、この実施例の場合、5つと定めた。
レスポンス順位とは周波数分析した時に、その構成周波数中で応答値(レスポンス)が最も大きい値を「1」と定めた場合の整数値である。以下、周波数応答値の大きい順に「2」、「3」....と定める。又、最小時間フレームと任意時間フレームの関係には次のような関係が成り立つ。任意時間フレーム=最小時間フレーム×n(nは、符号無しの整数値 1、2、3、、、、、、)
(2)分析の方法・音階分析処理部
図5−28の如く、音声データ帯(18)、全てより成る全任意時間フレーム中の、所定数レスポンス順位位置毎の倍音周波数の中で最も多く出現している周波数をそれぞれ求め(28)、ここで求めた所定数レスポンス順位位置毎の最頻周波数(28)の中で最も低い周波数を1つだけ計測基準周波数(基準最頻最低周波数)と定める。(29)(ステップS6)
図5−28の如く、音声データ帯(18)、全てより成る全任意時間フレーム中の、所定数レスポンス順位位置毎の倍音周波数の中で最も多く出現している周波数をそれぞれ求め(28)、ここで求めた所定数レスポンス順位位置毎の最頻周波数(28)の中で最も低い周波数を1つだけ計測基準周波数(基準最頻最低周波数)と定める。(29)(ステップS6)
この計測基準周波数(基準最頻最低周波数)を基準値として、各任意時間フレームの所定数レスポンス順位位置のそれぞれの周波数との関係がどのような位置関係になっているのかを次に定める音階位置係数列に従って分析する(ステップS7)。
音階特性の分析基準として、任意基準位置からの周波数の位置関係を示した係数列を音階位置係数列と別途、定める。
上記計測基準周波数に対して全ての任意時間フレーム中の各所定数レスポンス順位位置の各々の周波数が、求めようとする特性としての上記の音階位置係数列に該当している割合を各々のレスポンス順位位置毎に算出して(30)(ステップS7)、以上で定めた全ての所定数レスポンス順位位置の割合値を合算して、総合計の値(17)を音階特性の度数値として、パーソナルコンピュータ上の画面(8)に表示させる。(ステップS8)
上記の説明で、求めようとする特性である音階位置係数列の1つの例として、自然性が考えられる。この場合の求めようとする特性の音階位置係数列を自然音階特性と呼ぶ。これにより、音声信号の自然性という観点から、音声信号の音階特性分析が可能となる。
3.その他の実施形態
測定しようとする周波数の位置関係を示した音階特性分析基準である音階位置係数列の特性として、その他に、平均律音階特性、ピタゴラス音律音階特性、中全音律音階特性、キルンベルガー音律音階特性、ベルクマイスター音律音階特性等の、諸々の音律より構成される音階特性の測定も可能となる。
測定しようとする周波数の位置関係を示した音階特性分析基準である音階位置係数列の特性として、その他に、平均律音階特性、ピタゴラス音律音階特性、中全音律音階特性、キルンベルガー音律音階特性、ベルクマイスター音律音階特性等の、諸々の音律より構成される音階特性の測定も可能となる。
a〜k・・・所定の最小時間フレーム
10・・・・オペレーティングシステム
11・・・・マイク
17・・・・音階特性度数値
20〜23・任意時間フレームの周波数分析図
24〜27・任意時間フレームの各レスポンス順位の周波数値
28・・・・全ての任意時間フレームの各レスポンス順位における最頻値となる周波数
29・・・・分析の基準となる計測基準周波数
30・・・・総合的な分析結果を導き出すための各レスポンス順位の音階特性値
10・・・・オペレーティングシステム
11・・・・マイク
17・・・・音階特性度数値
20〜23・任意時間フレームの周波数分析図
24〜27・任意時間フレームの各レスポンス順位の周波数値
28・・・・全ての任意時間フレームの各レスポンス順位における最頻値となる周波数
29・・・・分析の基準となる計測基準周波数
30・・・・総合的な分析結果を導き出すための各レスポンス順位の音階特性値
Claims (3)
- デジタル音声データ(音声信号)において所定の最小時間フレームを1単位として、複数の時間フレームに分割し、それらの周期を分析する。この周期に関し同系統の最小時間フレームがある場合は、それらを一群の時間フレームとして、任意時間フレームを形成する。
この各任意時間フレームを周波数領域に変換して、応答値(レスポンス)の大きい順に付けた整数値をレスポンス順位と定める。各任意時間フレームのレスポンス順位に対応する周波数を定め、全ての任意時間フレーム中より成る各所定数レスポンス順位に対応する最頻値となる周波数を定める。この最頻値となる周波数の中より、ある条件を満たした1つの計測基準周波数を定める。
又、音階特性分析基準として任意基準位置からの周波数の位置関係を示した係数列を音階位置係数列と別途定める。
上記のある条件を満たした1つの計測基準周波数に対して、各任意時間フレームの各所定数レスポンス順位に相当する周波数が上記の別途定めた音階位置係数列に該当している割合を各レスポンス順位毎に数値として算出し、総合計し、音階的特性を数値を用いて定める。以上の如く構成された音声分析方法。 - 音声をマイク及びピックアップ等で入力し、アンプで増幅した電気的音声信号を得る。電気的音声信号をAD変換して、デジタル音声データを得る。以上の如く構成された請求項1の音声分析装置。
- コンピュータ上で動作する請求項1の音声分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005248382A JP2007041488A (ja) | 2005-08-02 | 2005-08-02 | 音声信号の音階的特性分析方法ならびに、その装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005248382A JP2007041488A (ja) | 2005-08-02 | 2005-08-02 | 音声信号の音階的特性分析方法ならびに、その装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007041488A true JP2007041488A (ja) | 2007-02-15 |
Family
ID=37799501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005248382A Pending JP2007041488A (ja) | 2005-08-02 | 2005-08-02 | 音声信号の音階的特性分析方法ならびに、その装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007041488A (ja) |
-
2005
- 2005-08-02 JP JP2005248382A patent/JP2007041488A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4645241B2 (ja) | 音声処理装置およびプログラム | |
WO2022095656A1 (zh) | 一种音频处理方法、装置、设备及介质 | |
Saitis et al. | Brightness perception for musical instrument sounds: Relation to timbre dissimilarity and source-cause categories | |
WO2009104269A1 (ja) | 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体 | |
Chau et al. | The emotional characteristics of piano sounds with different pitch and dynamics | |
KR101459324B1 (ko) | 음원 평가방법 및 이를 이용한 음원의 평가장치 | |
JP5229998B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
JP4479701B2 (ja) | 楽曲練習支援装置、動的時間整合モジュールおよびプログラム | |
Geringer | Eight artist-level violinists performing unaccompanied Bach: Are there consistent tuning patterns? | |
Lee et al. | The Timbre Perception Test (TPT): A new interactive musical assessment tool to measure timbre perception ability | |
JP3996565B2 (ja) | カラオケ装置 | |
JP2009282464A (ja) | コード検出装置およびコード検出プログラム | |
Chau et al. | The emotional characteristics of bowed string instruments with different pitch and dynamics | |
Bozkurt | A system for tuning instruments using recorded music instead of theory-based frequency presets | |
JP6281211B2 (ja) | 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム | |
Arom et al. | Experimental ethnomusicology: An interactive approach to the study of musical scales | |
JP6102076B2 (ja) | 評価装置 | |
JP5005445B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
JP4932614B2 (ja) | コード名検出装置及びコード名検出用プログラム | |
JP2016184112A (ja) | アンサンブル評価装置 | |
JP2007041488A (ja) | 音声信号の音階的特性分析方法ならびに、その装置 | |
Beauchamp | Perceptually correlated parameters of musical instrument tones | |
Bader | Characterization of guitars through fractal correlation dimensions of initial transients | |
Trail et al. | Direct and surrogate sensing for the Gyil african xylophone. | |
JP4367156B2 (ja) | 調律装置及びそのプログラム |