JP2002372968A - 音響信号の比較評価方法および装置 - Google Patents

音響信号の比較評価方法および装置

Info

Publication number
JP2002372968A
JP2002372968A JP2001179839A JP2001179839A JP2002372968A JP 2002372968 A JP2002372968 A JP 2002372968A JP 2001179839 A JP2001179839 A JP 2001179839A JP 2001179839 A JP2001179839 A JP 2001179839A JP 2002372968 A JP2002372968 A JP 2002372968A
Authority
JP
Japan
Prior art keywords
data
calculated
calculating
signal
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001179839A
Other languages
English (en)
Inventor
Toshio Motegi
敏雄 茂出木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2001179839A priority Critical patent/JP2002372968A/ja
Publication of JP2002372968A publication Critical patent/JP2002372968A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 MIDI符号化のような波形データを持たな
い符号データであっても、原音信号との客観的な比較が
可能な音響信号の比較評価方法および装置を提供する。 【解決手段】 互いに比較対象とする原音響信号、この
原音響信号を基に符号化した符号データを復号した復号
音響信号を入力し(S1a・S1b)、入力された2つ
の音響信号それぞれに対して時間軸上に複数の単位区間
を設定し(S2a・S2b)、設定された単位区間ごと
に周波数解析を行なって、各音響信号について、時系列
に複数のスペクトルデータを算出する(S3a・S3
b)。算出された複数のスペクトルデータを時系列に積
算していくことにより、各音響信号について、積算スペ
クトルデータを算出し(S4)、算出された2つの積算
スペクトルデータの合致度を算出する(S5)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音響信号の符号化研究
における品質評価、特にMIDI再生音と原音との関係
のように互いに非同期の関係にある信号の比較評価技術
に関する。
【0002】
【従来の技術】音響信号に代表される時系列信号には、
その構成要素として複数の周期信号が含まれている。こ
のため、与えられた時系列信号にどのような周期信号が
含まれているかを解析する手法は、古くから知られてい
る。例えば、フーリエ解析は、与えられた時系列信号に
含まれる周波数成分を解析するための方法として広く利
用されている。
【0003】このような時系列信号の解析方法を利用す
れば、音響信号を符号化することも可能である。コンピ
ュータの普及により、原音となるアナログ音響信号を所
定のサンプリング周波数でサンプリングし、各サンプリ
ング時の信号強度を量子化してデジタルデータとして取
り込むことが容易にできるようになってきており、こう
して取り込んだデジタルデータに対してフーリエ解析な
どの手法を適用し、原音信号に含まれていた周波数成分
を抽出すれば、各周波数成分を示す符号によって原音信
号の符号化が可能になる。
【0004】また、電子楽器による楽器音を符号化しよ
うという発想から生まれたMIDI(Musical Instrume
nt Digital Interface)規格も、パーソナルコンピュー
タの普及とともに盛んに利用されるようになってきてい
る。このMIDI規格による符号データ(以下、MID
Iデータという)は、基本的には、楽器のどの鍵盤キー
を、どの程度の強さで弾いたか、という楽器演奏の操作
を記述したデータであり、このMIDIデータ自身に
は、実際の音の波形は含まれていない。そのため、実際
の音を再生する場合には、楽器音の波形を記憶したMI
DI音源が別途必要になるが、その符号化効率の高さが
注目を集めており、MIDI規格による符号化および復
号化の技術は、現在、パーソナルコンピュータを用いて
楽器演奏、楽器練習、作曲などを行うソフトウェアに広
く採り入れられている。
【0005】そこで、音響信号に代表される時系列信号
に対して、所定の手法で解析を行うことにより、その構
成要素となる周期信号を抽出し、抽出した周期信号をM
IDIデータを用いて符号化しようとする提案がなされ
ている。例えば、特開平10−247099号公報、特
開平11−73199号公報、特開平11−73200
号公報、特開平11−95753号公報、特開2000
−99009号公報、特開2000−99092号公
報、特開2000−99093号公報、特開2000−
261322号公報、特開2001−5450号公報、
特開2001−148633号公報には、任意の時系列
信号について、構成要素となる周波数を解析し、その解
析結果からMIDIデータを作成することができる種々
の方法が提案されている。
【0006】このようにして、符号化されたデータは、
製品として販売する前にその精度を評価する必要があ
る。MPEG方式などを代表とする波形符号化方式にお
いては、原音響信号の波形データを基に類似の波形デー
タで符号化する方式であるため、符号データを復号化し
た波形データと原音波形データとをコンピュータの演算
により比較照合すれば、客観的な評価が可能となってい
る。
【0007】
【発明が解決しようとする課題】しかしながら、上記各
公報において提案してきたMIDI符号化方式により符
号化したデータの品質精度を評価しようとする場合、原
音響信号との同期をとることが難しく、客観的な評価が
できない。これは、上述のようにMIDIデータ自身に
は、実際の音の波形は含まれていないためであり、評価
を行う場合は、MIDI音源を利用して再生した音を、
人間が自分の耳で聞き、原音と聞き比べて主観的な評価
を行うしかない。
【0008】上記のような点に鑑み、本発明は、MID
I符号化のような波形データを持たない符号データであ
っても、原音信号との客観的な比較が可能な音響信号の
比較評価方法および装置を提供することを課題とする。
【0009】
【課題を解決するための手段】上記課題を解決するた
め、本発明では、互いに比較対象とする第1の音響信号
と第2の音響信号を入力し、入力された2つの音響信号
それぞれに対して時間軸上に複数の単位区間を設定し、
設定された単位区間ごとに周波数解析を行なって、各音
響信号について、時系列に複数のスペクトルデータを算
出し、算出された複数のスペクトルデータを時系列に積
算していくことにより、各音響信号について積算スペク
トルデータを算出し、算出された複数のスペクトルデー
タの各単位区間ごとに強度値を積算することにより、各
音響信号についてエンベロープデータを算出し、算出さ
れた2つの積算スペクトルデータの合致度を算出すると
共に、算出された2つのエンベロープデータの合致度を
算出するようにしたことを特徴とする。
【0010】本発明によれば、2つの音響信号、それぞ
れについて周波数解析を行なってスペクトルデータを得
た後、このスペクトルデータに基づいて積算スペクトル
データ、エンベロープデータを算出し、両音響信号から
得られた積算スペクトルデータの類似性、エンベロープ
データの類似性を判定するようにしたので、符号化の方
式に関わらず、再生された音響信号から、両音響信号の
類似性を判断することが可能となる。
【0011】また、本発明では、第1の音響信号および
第2の音響信号として、それぞれ原音響信号、および原
音響信号を基に符号化した符号データを復号した復号音
響信号とすることにより、音響信号の符号化の精度を評
価することが可能となる。
【0012】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して詳細に説明する。
【0013】(音響信号符号化の基本原理)はじめに、
本発明に係る音響信号の比較評価方法の評価対象となる
符号データの作成、および音響信号の比較評価方法の基
本原理を述べておく。この基本原理は、前掲の各公報に
開示されているので、ここではその概要のみを簡単に述
べることにする。
【0014】図1(a)に示すように、時系列信号とし
てアナログ音響信号が与えられたものとする。図1の例
では、横軸に時間t、縦軸に振幅(強度)をとって、こ
の音響信号を示している。ここでは、まずこのアナログ
音響信号を、デジタルの音響データとして取り込む処理
を行う。これは、従来の一般的なPCMの手法を用い、
所定のサンプリング周波数でこのアナログ音響信号をサ
ンプリングし、振幅を所定の量子化ビット数を用いてデ
ジタルデータに変換する処理を行えば良い。ここでは、
説明の便宜上、PCMの手法でデジタル化した音響デー
タの波形も図1(a)のアナログ音響信号と同一の波形
で示すことにする。
【0015】続いて、この解析対象となる音響信号の時
間軸上に、複数の単位区間を設定する。図1(a)に示
す例では、時間軸t上に等間隔に6つの時刻t1〜t6
が定義され、これら各時刻を始点および終点とする5つ
の単位区間d1〜d5が設定されている。図1の例で
は、全て同一の区間長をもった単位区間が設定されてい
るが、個々の単位区間ごとに区間長を変えるようにして
もかまわない。あるいは、隣接する単位区間が時間軸上
で部分的に重なり合うような区間設定を行ってもかまわ
ない。
【0016】こうして単位区間が設定されたら、各単位
区間ごとの音響信号(以下、区間信号と呼ぶことにす
る)について、それぞれ代表周波数を選出する。各区間
信号には、通常、様々な周波数成分が含まれているが、
例えば、その中で成分の強度割合の大きな周波数成分を
代表周波数として選出すれば良い。ここで、代表周波数
とはいわゆる基本周波数が一般的であるが、音声のフォ
ルマント周波数などの倍音周波数や、ノイズ音源のピー
ク周波数も代表周波数として扱うことがある。代表周波
数は1つだけ選出しても良いが、音響信号によっては複
数の代表周波数を選出した方が、より精度の高い符号化
が可能になる。図1(b)には、個々の単位区間ごとに
それぞれ3つの代表周波数を選出し、1つの代表周波数
を1つの代表符号(図では便宜上、音符として示してあ
る)として符号化した例が示されている。ここでは、代
表符号(音符)を収容するために3つのトラックT1,
T2,T3が設けられているが、これは個々の単位区間
ごとに選出された3つずつの代表符号を、それぞれ異な
るトラックに収容するためである。
【0017】例えば、単位区間d1について選出された
代表符号n(d1,1),n(d1,2),n(d1,
3)は、それぞれトラックT1,T2,T3に収容され
ている。ここで、各符号n(d1,1),n(d1,
2),n(d1,3)は、MIDI符号におけるノート
ナンバーを示す符号である。MIDI符号におけるノー
トナンバーは、0〜127までの128通りの値をと
り、それぞれピアノの鍵盤の1つのキーを示すことにな
る。具体的には、例えば、代表周波数として440Hz
が選出された場合、この周波数はノートナンバーn=6
9(ピアノの鍵盤中央の「ラ音(A3音)」に対応)に
相当するので、代表符号としては、n=69が選出され
ることになる。もっとも、図1(b)は、上述の方法に
よって得られる代表符号を音符の形式で示した概念図で
あり、実際には、各音符にはそれぞれ強度に関するデー
タも付加されている。例えば、トラックT1には、ノー
トナンバーn(d1,1),n(d2,1)・・・なる
音高を示すデータとともに、e(d1,1),e(d
2,1)・・・なる強度を示すデータが収容されること
になる。この強度を示すデータは、各代表周波数の成分
が、元の区間信号にどの程度の度合いで含まれていたか
によって決定される。具体的には、各代表周波数をもっ
た周期関数の区間信号に対する相関値に基づいて強度を
示すデータが決定されることになる。また、図1(b)
に示す概念図では、音符の横方向の位置によって、個々
の単位区間の時間軸上での位置が示されているが、実際
には、この時間軸上での位置を正確に数値として示すデ
ータが各音符に付加されていることになる。
【0018】音響信号を符号化する形式としては、必ず
しもMIDI形式を採用する必要はないが、この種の符
号化形式としてはMIDI形式が最も普及しているた
め、実用上はMIDI形式の符号データを用いるのが好
ましい。MIDI形式では、「ノートオン」データもし
くは「ノートオフ」データが、「デルタタイム」データ
を介在させながら存在する。「ノートオン」データは、
特定のノートナンバーNとベロシティーVを指定して特
定の音の演奏開始を指示するデータであり、「ノートオ
フ」データは、特定のノートナンバーNとベロシティー
Vを指定して特定の音の演奏終了を指示するデータであ
る。また、「デルタタイム」データは、所定の時間間隔
を示すデータである。ベロシティーVは、例えば、ピア
ノの鍵盤などを押し下げる速度(ノートオン時のベロシ
ティー)および鍵盤から指を離す速度(ノートオフ時の
ベロシティー)を示すパラメータであり、特定の音の演
奏開始操作もしくは演奏終了操作の強さを示すことにな
る。
【0019】前述の方法では、第i番目の単位区間di
について、代表符号としてJ個のノートナンバーn(d
i,1),n(di,2),・・・,n(di,J)が
得られ、このそれぞれについて強度e(di,1),e
(di,2),・・・,e(di,J)が得られる。そ
こで、次のような手法により、MIDI形式の符号デー
タを作成することができる。まず、「ノートオン」デー
タもしくは「ノートオフ」データの中で記述するノート
ナンバーNとしては、得られたノートナンバーn(d
i,1),n(di,2),・・・,n(di,J)を
そのまま用いれば良い。一方、「ノートオン」データも
しくは「ノートオフ」データの中で記述するベロシティ
ーVとしては、得られた強度e(di,1),e(d
i,2),・・・,e(di,J)を所定の方法で規格
化した値を用いれば良い。また、「デルタタイム」デー
タは、各単位区間の長さに応じて設定すれば良い。
【0020】(周期関数との相関を求める具体的な方
法)上述した基本原理の基づく方法では、区間信号に対
して、1つまたは複数の代表周波数が選出され、この代
表周波数をもった周期信号によって、当該区間信号が表
現されることになる。ここで、選出される代表周波数
は、文字どおり、当該単位区間内の信号成分を代表する
周波数である。この代表周波数を選出する具体的な方法
には、後述するように、短時間フーリエ変換を利用する
方法と、一般化調和解析の手法を利用する方法とがあ
る。いずれの方法も、基本的な考え方は同じであり、あ
らかじめ周波数の異なる複数の周期関数を用意してお
き、これら複数の周期関数の中から、当該単位区間内の
区間信号に対する相関が高い周期関数を見つけ出し、こ
の相関の高い周期関数の周波数を代表周波数として選出
する、という手法を採ることになる。すなわち、代表周
波数を選出する際には、あらかじめ用意された複数の周
期関数と、単位区間内の区間信号との相関を求める演算
を行うことになる。そこで、ここでは、周期関数との相
関を求める具体的な方法を述べておく。
【0021】複数の周期関数として、図2に示すような
三角関数が用意されているものとする。これらの三角関
数は、同一周波数をもった正弦関数と余弦関数との対か
ら構成されており、128通りの標準周波数f(0)〜
f(127)のそれぞれについて、正弦関数および余弦
関数の対が定義されていることになる。ここでは、同一
の周波数をもった正弦関数および余弦関数からなる一対
の関数を、当該周波数についての周期関数として定義す
ることにする。すなわち、ある特定の周波数についての
周期関数は、一対の正弦関数および余弦関数によって構
成されることになる。このように、一対の正弦関数と余
弦関数とにより周期関数を定義するのは、信号に対する
周期関数の相関値を求める際に、相関値が位相の影響を
受ける事を考慮するためである。なお、図2に示す各三
角関数内の変数Fおよびkは、区間信号Xについてのサ
ンプリング周波数Fおよびサンプル番号kに相当する変
数である。例えば、周波数f(0)についての正弦波
は、sin(2πf(0)k/F)で示され、任意のサ
ンプル番号kを与えると、区間信号を構成する第k番目
のサンプルと同一時間位置における周期関数の振幅値が
得られる。
【0022】ここでは、128通りの標準周波数f
(0)〜f(127)を図3に示すような式で定義した
例を示すことにする。すなわち、第n番目(0≦n≦1
27)の標準周波数f(n)は、以下に示す〔数式1〕
で定義されることになる。
【0023】〔数式1〕 f(n)=440×2γ (n) γ(n)=(n−69)/12
【0024】このような式によって標準周波数を定義し
ておくと、最終的にMIDIデータを用いた符号化を行
う際に便利である。なぜなら、このような定義によって
設定される128通りの標準周波数f(0)〜f(12
7)は、等比級数をなす周波数値をとることになり、M
IDIデータで利用されるノートナンバーに対応した周
波数になるからである。したがって、図2に示す128
通りの標準周波数f(0)〜f(127)は、対数尺度
で示した周波数軸上に等間隔(MIDIにおける半音単
位)に設定した周波数ということになる。
【0025】続いて、任意の区間の区間信号に対する各
周期関数の相関の求め方について、具体的な説明を行
う。例えば、図4に示すように、ある単位区間dについ
て区間信号Xが与えられていたとする。ここでは、区間
長Lをもった単位区間dについて、サンプリング周波数
Fでサンプリングが行なわれており、全部でw個のサン
プル値が得られているものとし、サンプル番号を図示の
ように、0,1,2,3,・・・,k,・・・,w−
2,w−1とする(白丸で示す第w番目のサンプルは、
右に隣接する次の単位区間の先頭に含まれるサンプルと
する)。この場合、任意のサンプル番号kについては、
X(k)なる振幅値がデジタルデータとして与えられて
いることになる。短時間フーリエ変換においては、X
(k)に対して各サンプルごとに中央の重みが1に近
く、両端の重みが0に近くなるような窓関数W(k)を
乗ずることが通常である。すなわち、X(k)×W
(k)をX(k)と扱って以下のような相関計算を行う
もので、窓関数の形状としては余弦波形状のハミング窓
が一般に用いられている。ここで、wは以下の記述にお
いても定数のような記載をしているが、一般にはnの値
に応じて変化させ、区間長Lを超えない範囲で最大とな
るF/f(n)の整数倍の値に設定することが望まし
い。
【0026】このような区間信号Xに対して、第n番目
の標準周波数f(n)をもった正弦関数Rnとの相関値
を求める原理を示す。両者の相関値A(n)は、図5の
第1の演算式によって定義することができる。ここで、
X(k)は、図4に示すように、区間信号Xにおけるサ
ンプル番号kの振幅値であり、sin(2πf(n)k
/F)は、時間軸上での同位置における正弦関数Rnの
振幅値である。この第1の演算式は、単位区間d内の全
サンプル番号k=0〜w−1の次元について、それぞれ
区間信号Xの振幅値と正弦関数Rnの振幅ベクトルの内
積を求める式ということができる。
【0027】同様に、図5の第2の演算式は、区間信号
Xと、第n番目の標準周波数f(n)をもった余弦関数
との相関値を求める式であり、両者の相関値はB(n)
で与えられる。なお、相関値A(n)を求めるための第
1の演算式も、相関値B(n)を求めるための第2の演
算式も、最終的に2/wが乗ぜられているが、これは相
関値を規格化するためのものでり、前述のとおりwはn
に依存して変化させるのが一般的であるため、この係数
もnに依存する変数である。
【0028】区間信号Xと標準周波数f(n)をもった
標準周期関数との相関実効値は、図5の第3の演算式に
示すように、正弦関数との相関値A(n)と余弦関数と
の相関値B(n)との二乗和平方根値E(n)によって
示すことができる。この相関実効値の大きな標準周期関
数の周波数を代表周波数として選出すれば、この代表周
波数を用いて区間信号Xを符号化することができる。
【0029】すなわち、この相関値E(n)が所定の基
準以上の大きさとなる1つまたは複数の標準周波数を代
表周波数として選出すれば良い。なお、ここで「相関値
E(n)が所定の基準以上の大きさとなる」という選出
条件は、例えば、何らかの閾値を設定しておき、相関値
E(n)がこの閾値を超えるような標準周波数f(n)
をすべて代表周波数として選出する、という絶対的な選
出条件を設定しても良いが、例えば、相関値E(n)の
大きさの順にQ番目までを選出する、というような相対
的な選出条件を設定しても良い。
【0030】(一般化調和解析の手法)ここでは、本発
明に係る音響信号の符号化を行う際に有用な一般化調和
解析の手法について説明する。既に説明したように、音
響信号を符号化する場合、個々の単位区間内の区間信号
について、相関値の高いいくつかの代表周波数を選出す
ることになる。一般化調和解析は、より高い精度で代表
周波数の選出を可能にする手法であり、その基本原理は
次の通りである。
【0031】図6(a)に示すような単位区間dについ
て、信号S(j)なるものが存在するとする。ここで、
jは後述するように、繰り返し処理のためのパラメータ
である(j=1〜J)。まず、この信号S(j)に対し
て、図2に示すような128通りの周期関数すべてにつ
いての相関値を求める。そして、最大の相関値が得られ
た1つの周期関数の周波数を代表周波数として選出し、
当該代表周波数をもった周期関数を要素関数として抽出
する。続いて、図6(b)に示すような含有信号G
(j)を定義する。この含有信号G(j)は、抽出され
た要素関数に、その振幅として、当該要素関数の信号S
(j)に対する相関値を乗じることにより得られる信号
である。例えば、周期関数として図2に示すように、一
対の正弦関数と余弦関数とを用い、周波数f(n)が代
表周波数として選出された場合、振幅A(n)をもった
正弦関数A(n)sin(2πf(n)k/F)と、振
幅B(n)をもった余弦関数B(n)cos(2πf
(n)k/F)との和からなる信号が含有信号G(j)
ということになる(図6(b)では、図示の便宜上、一
方の関数しか示していない)。ここで、A(n),B
(n)は、図5の式で得られる規格化された相関値であ
るから、結局、含有信号G(j)は、信号S(j)内に
含まれている周波数f(n)をもった信号成分というこ
とができる。
【0032】こうして、含有信号G(j)が求まった
ら、信号S(j)から含有信号G(j)を減じることに
より、差分信号S(j+1)を求める。図6(c)は、
このようにして求まった差分信号S(j+1)を示して
いる。この差分信号S(j+1)は、もとの信号S
(j)の中から、周波数f(n)をもった信号成分を取
り去った残りの信号成分からなる信号ということができ
る。そこで、パラメータjを1だけ増加させることによ
り、この差分信号S(j+1)を新たな信号S(j)と
して取り扱い、同様の処理を、パラメータjをj=1〜
Jまで1ずつ増やしながらJ回繰り返し実行すれば、J
個の代表周波数を選出することができる。
【0033】このような相関計算の結果として出力され
るJ個の含有信号G(1)〜G(J)は、もとの区間信
号Xの構成要素となる信号であり、もとの区間信号Xを
符号化する場合には、これらJ個の含有信号の周波数を
示す情報および振幅(強度)を示す情報を符号データと
して用いるようにすれば良い。尚、Jは代表周波数の個
数であると説明してきたが、標準周波数f(n)の個数
と同一すなわちJ=128であってもよく、周波数スペ
クトルを求める目的においてはそのように行うのが通例
である。
【0034】以上のような処理により、各単位区間につ
いて、各周波数に対する強度値の集合であるスペクトル
データが得られることになる。以上のような手法は、後
述するような比較対象とする2つの音響信号それぞれの
スペクトルデータの算出にも利用される。さて、MID
I等の符号データ作成についても上記の手法が用いら
れ、上述のようにして所定数の周波数群が選出された
ら、この周波数群の各周波数に対応する「音の高さを示
す情報」、選出された各周波数の信号強度に対応する
「音の強さを示す情報」、当該単位区間の始点に対応す
る「音の発音開始時刻を示す情報」、当該単位区間に後
続する単位区間の始点に対応する「音の発音終了時刻を
示す情報」、の4つの情報を含む所定数の符号データを
作成すれば、当該単位区間内の区間信号Xを所定数の符
号データにより符号化することができる。符号データと
して、MIDIデータを作成するのであれば、「音の高
さを示す情報」としてノートナンバーを用い、「音の強
さを示す情報」としてベロシティーを用い、「音の発音
開始時刻を示す情報」としてノートオン時刻を用い、
「音の発音終了時刻を示す情報」としてノートオフ時刻
を用いるようにすれば良い。
【0035】(本発明に係る音響信号の比較評価方法)
ここからは、本発明の音響信号比較評価方法について、
図7に示すフローチャートを用いて説明する。ここで
は、原音響信号と、この原音響信号を上記符号化方法に
よりMIDI符号化したMIDIデータの比較を行っ
て、このMIDIデータの符号化精度を評価するもので
ある。まず、前準備として、原音響信号をMIDI化し
たMIDIデータを実際にMIDI音源を用いて再生
し、この再生音を録音してPCM化することにより音響
信号(この音響信号を、以下、復号音響信号という。)
を得る。前準備が終わったら、原音響信号と復号音響信
号をそれぞれ入力する(ステップS1)。
【0036】続いて、各音響信号について、その時間軸
上の全区間に渡って単位区間を設定する(ステップS
2:図中、S2a・S2bとして図示)。このステップ
S2における手法は、上記基本原理において、図1
(a)を用いて説明した通りである。
【0037】続いて、各単位区間ごとの音響信号、すな
わち区間信号について、周波数解析を行って各周波数に
対応する強度値を求めることにより、スペクトルデータ
を算出する(ステップS3:図中、S3a・S3bとし
て図示)。具体的には、図2に示したような128種の
周期関数に対して区間信号の相関強度を求め、その周期
関数の周波数、求めた相関強度がここでのスペクトルデ
ータとなる。ただし、本実施形態では、上記基本原理で
説明した場合のように、代表周波数を選出するのではな
く、用意した周期関数全てに対応する相関強度を取得す
る。
【0038】続いて、算出された各単位区間ごとのスペ
クトルデータを時系列にしたがって積算する(ステップ
S4)。具体的には、各単位区間tにおける各ノートナ
ンバーnに対応する強度値Et(n)を全単位区間につ
いて積算することにより、各ノートナンバーnにおける
積算値ΣtEt(n)を算出する。この積算値ΣtEt
(n)の集合が積算スペクトルデータである。
【0039】続いて、比較対象となる2つの音響信号か
ら得られたそれぞれの積算スペクトルデータの類似度を
判定する(ステップS5)。具体的には、原音響信号か
ら得られた積算値ΣtE1t(n)、復号音響信号から得
られた積算値ΣtE2t(n)を用いて以下の〔数式2〕
により積算スペクトルデータの合致度SMを算出する。
【0040】〔数式2〕 SM=[Σn{S2(n)−S1(n)}21/2 /{ΣnS1
(n) 21/2 ただし、 S1(n)={ΣtE1t(n) }/Emax1 S2(n)={ΣtE2t(n) }/Emax2 また、 Emax1は積算値ΣtE1t(n)のうち、nを変化さ
せたとき最大のもの Emax2は積算値ΣtE2t(n)のうち、 nを変化させたと
き最大のもの、である。
【0041】なお、本実施形態において、「Σn」は、
nを0〜127まで変化させたときの総和を意味し、
「Σt」は、t、すなわち単位区間を、音響信号の開始
時刻から終了時刻まで変化させたときの総和を意味す
る。上記〔数式2〕においては、両積算スペクトルデー
タの各ノードナンバーにおける差分に基づいて、合致度
SMの算出を行っており、この合致度SMが小さいほ
ど、両音響信号は類似していると判断される。すなわ
ち、各ノートナンバーにおける積算スペクトルデータの
差分が小さいほど両音響信号は類似していることにな
る。なお、両音響信号から得られた積算値ΣtE1t(n)、
ΣtE2t(n)をそれぞれ最大積算強度値Emax1、Emax2で
割るのは、両音響信号の信号レベルが異なる場合にも、
両者を比較可能な強度値に正規化するためである。この
ような積算スペクトルデータの合致度SMを算出するの
は、両音響信号が非同期であっても、両音響信号の類似
性の判断を可能とするためである。さらに、合致度とし
て、100−100×SMなどの値を算出しておき、こ
れを出力するようにすると、数値が100を示したとき
に完全に一致するものとなり、よりわかりやすい形で類
似度の提示を行うことが可能となる。
【0042】また、ステップS4、S5の処理と平行し
て、算出された各単位区間ごとのスペクトルデータにつ
いて、各単位区間ごとに全周波数の強度値を積算する
(ステップS6)。具体的には、各単位区間tにおける
各ノートナンバーnに対応する強度値Et(n)を全ノ
ートナンバーについて積算することにより、各単位区間
tにおける積算値ΣnEt(n)を算出する。このΣn
Et(n)の集合がエンベロープデータである。
【0043】続いて、比較対象となる2つの音響信号か
ら得られたそれぞれのエンベロープデータの類似度を判
定する(ステップS7)。具体的には、原音響信号から
得られた積算値ΣnE1t(n)、復号音響信号から得ら
れた積算値ΣnE2t(n)を用いて以下の〔数式3〕に
よりエンベロープデータの合致度EMを算出する。
【0044】〔数式3〕 EM = [Σt{ S1(t) × S2(t) }] / ΣtS
1(t) 2 ただし、 S1(t)={ΣnE1t(n) }/Emax1 S2(n)={ΣnE2t(n) }/Emax2 また、 Emax1は積算値ΣnE1t(n)のうち、tを変化さ
せたとき最大のもの Emax2は積算値ΣnE2t(n)のうち、tを変化させたとき
最大のもの、である。
【0045】上記〔数式3〕においては、両エンベロー
プデータの各単位区間における積算強度値の乗算値に基
づいて、合致度EMの算出を行っており、この合致度E
Mが1に近付くほど、両音響信号は類似していると判断
される。すなわち、各単位区間における積算強度値の値
が近いほど両音響信号は類似していることになる。な
お、両音響信号から得られた積算値ΣnE1t(n)、ΣnE2
t(n)をそれぞれ最大積算強度値Emax1、Emax2で割るの
は、〔数式2〕の場合と同様、両音響信号の信号レベル
が異なる場合にも、両者を比較可能な強度値に正規化す
るためである。このようなエンベロープデータの合致度
EMだけでも、両音響信号の類似性を判断することは可
能であるが、両音響信号が非同期である場合に、的確な
合致度が得られないことがある。そこで、上述のような
積算スペクトルデータの合致度SMも算出し、両合致度
の値から判断するようにしているのである。さらに、合
致度として、100×EMなどの値を算出しておき、こ
れを出力するようにすると、数値が100を示したとき
に完全に一致するものとなり、よりわかりやすい形で類
似度の提示を行うことが可能となる。
【0046】続いて、算出された積算スペクトルデータ
の合致度SM、およびエンベロープデータの合致度EM
を出力する(ステップS8:図中、S8a・S8bとし
て示す)。これらを表示・印字等で出力することによ
り、入力した両音響信号が類似しているかどうか、すな
わち、MIDI符号化した符号データが、どの程度の精
度で原音響信号を再現しているかを確認することができ
る。
【0047】(装置構成)続いて、上記音響信号の比較
評価方法を実行するための比較評価装置の装置構成につ
いて説明する。図8は、本発明に係る音響信号比較評価
装置の構成図である。図8において、音響信号入力手段
1は、上記ステップS1に対応する処理、すなわち、音
響信号をPCM等のデジタルデータの形式で入力するた
めのものであり、電子記録媒体の読取り装置等により実
現される。本実施形態では、原音響信号および復号音響
信号を入力するために利用される。
【0048】周波数解析手段2は、上記ステップS2お
よびステップS3に対応する処理、すなわち、音響信号
入力手段1から入力された音響信号に複数の単位区間を
設定し、各単位区間ごとに周波数解析を行って、各単位
区間におけるスペクトルデータを算出するためのもので
あり、本実施形態では、原音響信号、復号音響信号それ
ぞれに対して、周波数解析を行なう。
【0049】スペクトル積算手段3は、上記ステップS
4に対応する処理、すなわち、音響信号から得られた各
単位区間ごとのスペクトルデータを全単位区間について
積算し、各周波数と、各周波数に対応する積算強度値の
関係を示す積算スペクトルデータを算出する機能を有す
る。本実施形態では、原音響信号、復号音響信号それぞ
れから得られたスペクトルデータに対して積算処理を行
う。
【0050】エンベロープ算出手段4は、上記ステップ
S6に対応する処理、すなわち、音響信号から得られた
各単位区間ごとのスペクトルデータを全周波数について
積算し、各単位区間と、各単位区間に対応する積算強度
値の関係を示すエンベロープデータを算出する機能を有
する。本実施形態では、原音響信号、復号音響信号それ
ぞれから得られたスペクトルデータに対してエンベロー
プ算出処理を行う。
【0051】積算スペクトル照合手段5は、上記ステッ
プS5に対応する処理、すなわち、2つの音響信号から
得られた積算スペクトルデータの照合を行う機能を有す
る。このスペクトルデータの照合は、上記のように〔数
式2〕を利用して合致度SMを算出することにより行わ
れる。本実施形態では、原音響信号、復号音響信号それ
ぞれから得られた積算スペクトルデータに対して照合処
理を行う。
【0052】エンベロープ照合手段6は、上記ステップ
S7に対応する処理、すなわち、2つの音響信号から得
られたエンベロープデータの照合を行う機能を有する。
このエンベロープデータの照合は、上記のように〔数式
3〕を利用して合致度EMを算出することにより行われ
る。本実施形態では、原音響信号、復号音響信号それぞ
れから得られたエンベロープデータに対して照合処理を
行う。
【0053】出力手段7は、上記ステップS8に対応す
る処理、すなわち、積算スペクトルデータの合致度S
M、およびエンベロープデータの合致度EMを出力する
機能を有する。出力手段としては、ディスプレイ装置等
の表示出力手段、あるいはプリンタ等の印字出力手段が
適用できる。なお、図1中、周波数解析手段2、スペク
トル積算手段3、エンベロープ算出手段4、積算スペク
トル照合手段5、エンベロープ照合手段6は、コンピュ
ータ本体、コンピュータに搭載された専用ソフトウェ
ア、およびコンピュータに接続された周辺機器等で実現
される。
【0054】
【発明の効果】以上、説明したように本発明によれば、
互いに比較対象とする第1の音響信号と第2の音響信号
を入力し、入力された2つの音響信号それぞれに対して
時間軸上に複数の単位区間を設定し、設定された単位区
間ごとに周波数解析を行なって、各音響信号について、
時系列に複数のスペクトルデータを算出し、算出された
複数のスペクトルデータを時系列に積算していくことに
より、各音響信号について積算スペクトルデータを算出
し、算出された複数のスペクトルデータの各単位区間ご
とに強度値を積算することにより、各音響信号について
エンベロープデータを算出し、算出された2つの積算ス
ペクトルデータの合致度を算出すると共に、算出された
2つのエンベロープデータの合致度を算出するようにし
たので、符号化の方式に関わらず、再生された音響信号
から、両音響信号の類似性を判断することが可能となる
という効果を奏する。
【0055】さらに、第1の音響信号および第2の音響
信号として、それぞれ原音響信号、および原音響信号を
基に符号化した符号データを復号した復号音響信号とす
ることにより、音響信号の符号化の精度を評価すること
が可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一部として利用される音響信号符号化
の基本原理を示す図である。
【図2】本発明で利用される周期関数の一例を示す図で
ある。
【図3】図2に示す各周期関数の周波数とMIDIノー
トナンバーnとの関係式を示す図である。
【図4】解析対象となる信号と周期信号との相関計算の
手法を示す図である。
【図5】図4に示す相関計算を行うための計算式を示す
図である。
【図6】一般化調和解析の基本的な手法を示す図であ
る。
【図7】本発明に係る音響信号比較評価方法のフローチ
ャートである。
【図8】本発明に係る音響信号比較評価装置の構成図で
ある。
【符号の説明】
1・・・音響信号入力手段 2・・・周波数解析手段 3・・・スペクトル積算手段 4・・・エンベロープ算出手段 5・・・積算スペクトル照合手段 6・・・エンベロープ照合手段 7・・・出力手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】互いに比較対象とする第1の音響信号と第
    2の音響信号を入力する段階と、 前記入力された2つの音響信号それぞれに対して時間軸
    上に複数の単位区間を設定し、前記単位区間ごとに周波
    数解析を行なって、前記各音響信号について、時系列に
    複数のスペクトルデータを算出する段階と、 前記算出された複数のスペクトルデータを時系列に積算
    していくことにより、前記各音響信号について、積算ス
    ペクトルデータを算出する段階と、 前記算出された複数のスペクトルデータの各単位区間ご
    とに強度値を積算することにより、前記各音響信号につ
    いて、エンベロープデータを算出する段階と、 前記算出された2つの積算スペクトルデータの合致度を
    算出する段階と、 前記算出された2つのエンベロープデータの合致度を算
    出する段階と、 を有することを特徴とする音響信号の比較評価方法。
  2. 【請求項2】前記第1の音響信号および第2の音響信号
    は、それぞれ原音響信号、および原音響信号を基に符号
    化した符号データを復号した復号音響信号であり、前記
    積算スペクトルデータの合致度、エンベロープデータの
    合致度を算出することにより、符号化の精度を評価する
    ものであることを特徴とする請求項1に記載の音響信号
    の比較評価方法。
  3. 【請求項3】音響信号を入力する音響信号入力手段と、 前記音響信号入力手段により入力された音響信号に対し
    て時間軸上に複数の単位区間を設定し、前記単位区間ご
    とに周波数解析を行なって時系列に複数のスペクトルデ
    ータを算出する周波数解析手段と、 前記周波数解析手段により算出された複数のスペクトル
    データを時系列に積算していくことにより、積算スペク
    トルデータを算出するスペクトル積算手段と、 前記周波数解析手段により算出された複数のスペクトル
    データを各単位区間ごとに強度値を積算することによ
    り、エンベロープデータを算出するエンベロープ算出手
    段と、 前記スペクトル積算手段により算出された2つの積算ス
    ペクトルデータの類似性を判定する積算スペクトル照合
    手段と、 前記エンベロープ算出手段により算出された2つのエン
    ベロープデータの類似性を判定するエンベロープ照合手
    段と、 前記積算スペクトル照合手段、および前記エンベロープ
    照合手段による照合結果を出力する出力手段と、 を有することを特徴とする音響信号の比較評価装置。
  4. 【請求項4】前記スペクトルデータがMIDI規格のノ
    ートナンバーに対応する周波数における強度配列から構
    成されていることを特徴とする請求項3に記載の音響信
    号の比較評価装置。
  5. 【請求項5】前記第1の音響信号と前記第2の音響信号
    は互いに非同期で入力されることを特徴とする請求項3
    または請求項4に記載の音響信号の比較評価装置。
  6. 【請求項6】コンピュータに、互いに比較対象とする第
    1の音響信号と第2の音響信号それぞれに対して時間軸
    上に複数の単位区間を設定し、前記単位区間ごとに周波
    数解析を行なって、前記各音響信号について、時系列に
    複数のスペクトルデータを算出する段階、前記算出され
    た複数のスペクトルデータを時系列に積算していくこと
    により、前記各音響信号について、積算スペクトルデー
    タを算出する段階、前記算出された複数のスペクトルデ
    ータの各単位区間ごとに強度値を積算することにより、
    前記各音響信号について、エンベロープデータを算出す
    る段階、前記算出された2つの積算スペクトルデータの
    合致度を算出する段階、前記算出された2つのエンベロ
    ープデータの合致度を算出する段階、を実行させるため
    のプログラム。
JP2001179839A 2001-06-14 2001-06-14 音響信号の比較評価方法および装置 Withdrawn JP2002372968A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001179839A JP2002372968A (ja) 2001-06-14 2001-06-14 音響信号の比較評価方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001179839A JP2002372968A (ja) 2001-06-14 2001-06-14 音響信号の比較評価方法および装置

Publications (1)

Publication Number Publication Date
JP2002372968A true JP2002372968A (ja) 2002-12-26

Family

ID=19020344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001179839A Withdrawn JP2002372968A (ja) 2001-06-14 2001-06-14 音響信号の比較評価方法および装置

Country Status (1)

Country Link
JP (1) JP2002372968A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295470A (ja) * 2006-04-27 2007-11-08 Fujitsu Ten Ltd デジタルデータ受信機
JP2011257512A (ja) * 2010-06-08 2011-12-22 Dainippon Printing Co Ltd 差分符号データの作成方法および装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295470A (ja) * 2006-04-27 2007-11-08 Fujitsu Ten Ltd デジタルデータ受信機
JP4562685B2 (ja) * 2006-04-27 2010-10-13 富士通テン株式会社 デジタルデータ受信機
JP2011257512A (ja) * 2010-06-08 2011-12-22 Dainippon Printing Co Ltd 差分符号データの作成方法および装置

Similar Documents

Publication Publication Date Title
JP4132362B2 (ja) 音響信号の符号化方法およびプログラム記録媒体
JP4037542B2 (ja) 音響信号の符号化方法
JP2002372968A (ja) 音響信号の比較評価方法および装置
JP2000293188A (ja) 和音リアルタイム認識方法及び記憶媒体
JP4268328B2 (ja) 音響信号の符号化方法
JP4156252B2 (ja) 音響信号の符号化方法
JP4695781B2 (ja) 音響信号の符号化方法
JP2001005450A (ja) 音響信号の符号化方法
JP2002153434A (ja) 時系列信号解析装置
JP2002215142A (ja) 音響信号の符号化方法
JP2002244691A (ja) 音響信号の符号化方法
JP2003216147A (ja) 音響信号の符号化方法
JP3935745B2 (ja) 音響信号の符号化方法
JP4220108B2 (ja) 音響信号符号化システム
JP4156269B2 (ja) 時系列信号の周波数解析方法および音響信号の符号化方法
JP4662406B2 (ja) 周波数解析方法および音響信号の符号化方法
JP2002123296A (ja) 音響信号の符号化方法および分離方法
JP2002229568A (ja) 音響情報再生方法
JP3776782B2 (ja) 音響信号の符号化方法
JP2003263155A (ja) 周波数解析装置および音響信号の符号化装置
JPH1173199A (ja) 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体
JP4156268B2 (ja) 時系列信号の周波数解析方法および音響信号の符号化方法
JP4697919B2 (ja) 音響信号の符号化方法
JP4580548B2 (ja) 周波数解析方法
JP4473979B2 (ja) 音響信号の符号化方法および復号化方法ならびに当該方法を実行するプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902