JP2002123296A - 音響信号の符号化方法および分離方法 - Google Patents

音響信号の符号化方法および分離方法

Info

Publication number
JP2002123296A
JP2002123296A JP2000319175A JP2000319175A JP2002123296A JP 2002123296 A JP2002123296 A JP 2002123296A JP 2000319175 A JP2000319175 A JP 2000319175A JP 2000319175 A JP2000319175 A JP 2000319175A JP 2002123296 A JP2002123296 A JP 2002123296A
Authority
JP
Japan
Prior art keywords
frequency
standard
signal
fine
frequencies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000319175A
Other languages
English (en)
Inventor
Toshio Motegi
敏雄 茂出木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2000319175A priority Critical patent/JP2002123296A/ja
Publication of JP2002123296A publication Critical patent/JP2002123296A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 複数音源による演奏から得られる音響信号に
ついても、忠実に再現することが可能な音響信号の符号
化方法および分離方法を提供する。 【解決手段】時系列の音響信号に対して単位区間を設定
し、単位区間ごとに信号解析を行って、各単位区間につ
いて周波数、信号強度の集合であるスペクトルを作成す
る(a)。このスペクトルに現れる複数の山の各ピーク
位置における標準偏差を算出し、この標準偏差の値にし
たがって、音響信号を分離する(b)(c)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、放送メディア(ラジ
オ、テレビ)、通信メディア(CS映像・音声配信、イ
ンターネット音楽配信、通信カラオケ)、パッケージメ
ディア(CD、MD、カセット、ビデオ、LD、CD−
ROM、ゲームカセット、携帯音楽プレーヤ向け固体メ
モリ媒体)などで提供する各種オーディオコンテンツの
制作、並びに、専用携帯音楽プレーヤ、携帯電話・PH
S・ポケベルなどに向けたボーカルを含む音楽コンテン
ツ、歌舞伎・能・読経・詩歌など文芸作品の音声素材ま
たは語学教育音声教材のMIDI伝送に利用するのに好
適な音響信号の符号化技術に関する。
【0002】
【従来の技術】音響信号に代表される時系列信号には、
その構成要素として複数の周期信号が含まれている。こ
のため、与えられた時系列信号にどのような周期信号が
含まれているかを解析する手法は、古くから知られてい
る。例えば、フーリエ解析は、与えられた時系列信号に
含まれる周波数成分を解析するための方法として広く利
用されている。
【0003】このような時系列信号の解析方法を利用す
れば、音響信号を符号化することも可能である。コンピ
ュータの普及により、原音となるアナログ音響信号を所
定のサンプリング周波数でサンプリングし、各サンプリ
ング時の信号強度を量子化してデジタルデータとして取
り込むことが容易にできるようになってきており、こう
して取り込んだデジタルデータに対してフーリエ解析な
どの手法を適用し、原音信号に含まれていた周波数成分
を抽出すれば、各周波数成分を示す符号によって原音信
号の符号化が可能になる。
【0004】一方、電子楽器による楽器音を符号化しよ
うという発想から生まれたMIDI(Musical Instrume
nt Digital Interface)規格も、パーソナルコンピュー
タの普及とともに盛んに利用されるようになってきてい
る。このMIDI規格による符号データ(以下、MID
Iデータという)は、基本的には、楽器のどの鍵盤キー
を、どの程度の強さで弾いたか、という楽器演奏の操作
を記述したデータであり、このMIDIデータ自身に
は、実際の音の波形は含まれていない。そのため、実際
の音を再生する場合には、楽器音の波形を記憶したMI
DI音源が別途必要になるが、その符号化効率の高さが
注目を集めており、MIDI規格による符号化および復
号化の技術は、現在、パーソナルコンピュータを用いて
楽器演奏、楽器練習、作曲などを行うソフトウェアに広
く採り入れられている。
【0005】そこで、音響信号に代表される時系列信号
に対して、所定の手法で解析を行うことにより、その構
成要素となる周期信号を抽出し、抽出した周期信号をM
IDIデータを用いて符号化しようとする提案がなされ
ている。例えば、特開平10−247099号公報、特
開平11−73199号公報、特開平11−73200
号公報、特開平11−95753号公報、特開2000
−99009号公報、特開2000−99092号公
報、特開平2000−99093号公報、特願平11−
58431号明細書、特願平11−177875号明細
書、特願平11−329297号明細書には、任意の時
系列信号について、構成要素となる周波数を解析し、そ
の解析結果からMIDIデータを作成することができる
種々の方法が提案されている。
【0006】
【発明が解決しようとする課題】上記各公報または明細
書において提案してきたMIDI符号化方式により、演
奏録音等から得られる音響信号の効率的な符号化が可能
になった。しかしながら、従来の符号化方式では、単一
音源による演奏から得られる音響信号の再現性は高い
が、複数音源による演奏から得られる音響信号を再現す
ることは困難である。
【0007】上記のような点に鑑み、本発明は、複数音
源による演奏から得られる音響信号についても、忠実に
再現することが可能な音響信号の符号化方法を提供する
ことを課題とする。
【0008】
【課題を解決するための手段】上記課題を解決するた
め、本発明では、与えられた音響信号に対して、標準周
波数を有する複数の標準周期関数との相関を求めること
により、各標準周波数に対応した信号強度の周波数成分
からなるスペクトル集合を算出し、各標準周波数につい
て、その標準周波数の近傍の標準周波数との間に複数の
微細周波数を各々設定し、微細周波数を有する複数の微
細周期関数との相関を求め、この相関値を基に各微細周
波数に対応した信号強度の分布形状パラメータを各標準
周波数ごとに算出し、算出された分布形状パラメータに
したがって、スペクトル集合を構成する周波数成分を複
数のグループに分類する分類し、各グループに分類され
た各周波数成分に対して、各々が属するグループの識別
符号を含めて符号化するようにしたことを特徴とする。
本発明によれば、上記のような手順により元の音響信号
に混在する複数の音源から発せられる音響信号成分の特
徴を、その分布形状パラメータを調べることにより分離
するようにしたので、複数音源による演奏から得られる
音響信号が与えられた場合であっても、元のそれぞれの
音源に対応する音響信号を抽出することが可能となる。
【0009】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して詳細に説明する。
【0010】(音響信号符号化方法の基本原理)はじめ
に、本発明に係る音響信号の符号化方法の基本原理を述
べておく。この基本原理は、前掲の各公報あるいは明細
書に開示されているので、ここではその概要のみを簡単
に述べることにする。
【0011】図1(a)に示すように、時系列信号とし
てアナログ音響信号が与えられたものとする。図1の例
では、横軸に時間t、縦軸に振幅(強度)をとって、こ
の音響信号を示している。ここでは、まずこのアナログ
音響信号を、デジタルの音響データとして取り込む処理
を行う。これは、従来の一般的なPCMの手法を用い、
所定のサンプリング周波数でこのアナログ音響信号をサ
ンプリングし、振幅を所定の量子化ビット数を用いてデ
ジタルデータに変換する処理を行えば良い。ここでは、
説明の便宜上、PCMの手法でデジタル化した音響デー
タの波形も図1(a)のアナログ音響信号と同一の波形
で示すことにする。
【0012】続いて、この解析対象となる音響信号の時
間軸上に、複数の単位区間を設定する。図1(a)に示
す例では、時間軸t上に等間隔に6つの時刻t1〜t6
が定義され、これら各時刻を始点および終点とする5つ
の単位区間d1〜d5が設定されている。図1の例で
は、全て同一の区間長をもった単位区間が設定されてい
るが、個々の単位区間ごとに区間長を変えるようにして
もかまわない。あるいは、隣接する単位区間が時間軸上
で部分的に重なり合うような区間設定を行ってもかまわ
ない。
【0013】こうして単位区間が設定されたら、各単位
区間ごとの音響信号(以下、区間信号と呼ぶことにす
る)について、それぞれ代表周波数を選出する。各区間
信号には、通常、様々な周波数成分が含まれているが、
例えば、その中で成分の強度割合の大きな周波数成分を
代表周波数として選出すれば良い。ここで、代表周波数
とはいわゆる基本周波数が一般的であるが、音声のフォ
ルマント周波数などの倍音周波数や、ノイズ音源のピー
ク周波数も代表周波数として扱うことがある。代表周波
数は1つだけ選出しても良いが、音響信号によっては複
数の代表周波数を選出した方が、より精度の高い符号化
が可能になる。図1(b)には、個々の単位区間ごとに
それぞれ3つの代表周波数を選出し、1つの代表周波数
を1つの代表符号(図では便宜上、音符として示してあ
る)として符号化した例が示されている。ここでは、代
表符号(音符)を収容するために3つのトラックT1,
T2,T3が設けられているが、これは個々の単位区間
ごとに選出された3つずつの代表符号を、それぞれ異な
るトラックに収容するためである。
【0014】例えば、単位区間d1について選出された
代表符号n(d1,1),n(d1,2),n(d1,
3)は、それぞれトラックT1,T2,T3に収容され
ている。ここで、各符号n(d1,1),n(d1,
2),n(d1,3)は、MIDI符号におけるノート
ナンバーを示す符号である。MIDI符号におけるノー
トナンバーは、0〜127までの128通りの値をと
り、それぞれピアノの鍵盤の1つのキーを示すことにな
る。具体的には、例えば、代表周波数として440Hz
が選出された場合、この周波数はノートナンバーn=6
9(ピアノの鍵盤中央の「ラ音(A3音)」に対応)に
相当するので、代表符号としては、n=69が選出され
ることになる。もっとも、図1(b)は、上述の方法に
よって得られる代表符号を音符の形式で示した概念図で
あり、実際には、各音符にはそれぞれ強度に関するデー
タも付加されている。例えば、トラックT1には、ノー
トナンバーn(d1,1),n(d2,1)・・・なる
音高を示すデータとともに、e(d1,1),e(d
2,1)・・・なる強度を示すデータが収容されること
になる。この強度を示すデータは、各代表周波数の成分
が、元の区間信号にどの程度の度合いで含まれていたか
によって決定される。具体的には、各代表周波数をもっ
た周期関数の区間信号に対する相関値に基づいて強度を
示すデータが決定されることになる。また、図1(b)
に示す概念図では、音符の横方向の位置によって、個々
の単位区間の時間軸上での位置が示されているが、実際
には、この時間軸上での位置を正確に数値として示すデ
ータが各音符に付加されていることになる。
【0015】音響信号を符号化する形式としては、必ず
しもMIDI形式を採用する必要はないが、この種の符
号化形式としてはMIDI形式が最も普及しているた
め、実用上はMIDI形式の符号データを用いるのが好
ましい。MIDI形式では、「ノートオン」データもし
くは「ノートオフ」データが、「デルタタイム」データ
を介在させながら存在する。「ノートオン」データは、
特定のノートナンバーNとベロシティーVを指定して特
定の音の演奏開始を指示するデータであり、「ノートオ
フ」データは、特定のノートナンバーNとベロシティー
Vを指定して特定の音の演奏終了を指示するデータであ
る。また、「デルタタイム」データは、所定の時間間隔
を示すデータである。ベロシティーVは、例えば、ピア
ノの鍵盤などを押し下げる速度(ノートオン時のベロシ
ティー)および鍵盤から指を離す速度(ノートオフ時の
ベロシティー)を示すパラメータであり、特定の音の演
奏開始操作もしくは演奏終了操作の強さを示すことにな
る。
【0016】前述の方法では、第i番目の単位区間di
について、代表符号としてJ個のノートナンバーn(d
i,1),n(di,2),・・・,n(di,J)が
得られ、このそれぞれについて強度e(di,1),e
(di,2),・・・,e(di,J)が得られる。そ
こで、次のような手法により、MIDI形式の符号デー
タを作成することができる。まず、「ノートオン」デー
タもしくは「ノートオフ」データの中で記述するノート
ナンバーNとしては、得られたノートナンバーn(d
i,1),n(di,2),・・・,n(di,J)を
そのまま用いれば良い。一方、「ノートオン」データも
しくは「ノートオフ」データの中で記述するベロシティ
ーVとしては、得られた強度e(di,1),e(d
i,2),・・・,e(di,J)を所定の方法で規格
化した値を用いれば良い。また、「デルタタイム」デー
タは、各単位区間の長さに応じて設定すれば良い。
【0017】(周期関数との相関を求める具体的な方
法)上述した基本原理の基づく方法では、区間信号に対
して、1つまたは複数の代表周波数が選出され、この代
表周波数をもった周期信号によって、当該区間信号が表
現されることになる。ここで、選出される代表周波数
は、文字どおり、当該単位区間内の信号成分を代表する
周波数である。この代表周波数を選出する具体的な方法
には、後述するように、短時間フーリエ変換を利用する
方法と、一般化調和解析の手法を利用する方法とがあ
る。いずれの方法も、基本的な考え方は同じであり、あ
らかじめ周波数の異なる複数の周期関数を用意してお
き、これら複数の周期関数の中から、当該単位区間内の
区間信号に対する相関が高い周期関数を見つけ出し、こ
の相関の高い周期関数の周波数を代表周波数として選出
する、という手法を採ることになる。すなわち、代表周
波数を選出する際には、あらかじめ用意された複数の周
期関数と、単位区間内の区間信号との相関を求める演算
を行うことになる。そこで、ここでは、周期関数との相
関を求める具体的な方法を述べておく。
【0018】複数の周期関数として、図2に示すような
三角関数が用意されているものとする。これらの三角関
数は、同一周波数をもった正弦関数と余弦関数との対か
ら構成されており、128通りの標準周波数f(0)〜
f(127)のそれぞれについて、正弦関数および余弦
関数の対が定義されていることになる。ここでは、同一
の周波数をもった正弦関数および余弦関数からなる一対
の関数を、当該周波数についての周期関数として定義す
ることにする。すなわち、ある特定の周波数についての
周期関数は、一対の正弦関数および余弦関数によって構
成されることになる。このように、一対の正弦関数と余
弦関数とにより周期関数を定義するのは、信号に対する
周期関数の相関値を求める際に、相関値が位相の影響を
受ける事を考慮するためである。なお、図2に示す各三
角関数内の変数Fおよびkは、区間信号Xについてのサ
ンプリング周波数Fおよびサンプル番号kに相当する変
数である。例えば、周波数f(0)についての正弦波
は、sin(2πf(0)k/F)で示され、任意のサ
ンプル番号kを与えると、区間信号を構成する第k番目
のサンプルと同一時間位置における周期関数の振幅値が
得られる。
【0019】ここでは、128通りの標準周波数f
(0)〜f(127)を図3に示すような式で定義した
例を示すことにする。すなわち、第n番目(0≦n≦1
27)の標準周波数f(n)は、以下の(数式1)で定
義されることになる。
【0020】(数式1) f(n)=440×2γ (n) γ(n)=(n−69)/12
【0021】このような式によって標準周波数を定義し
ておくと、最終的にMIDIデータを用いた符号化を行
う際に便利である。なぜなら、このような定義によって
設定される128通りの標準周波数f(0)〜f(12
7)は、等比級数をなす周波数値をとることになり、M
IDIデータで利用されるノートナンバーに対応した周
波数になるからである。したがって、図2に示す128
通りの標準周波数f(0)〜f(127)は、対数尺度
で示した周波数軸上に等間隔(MIDIにおける半音単
位)に設定した周波数ということになる。このため、本
願では、図に掲載するグラフにおけるノートナンバー軸
を、いずれも対数尺度で示すことにする。
【0022】続いて、任意の区間の区間信号に対する各
周期関数の相関の求め方について、具体的な説明を行
う。例えば、図4に示すように、ある単位区間dについ
て区間信号Xが与えられていたとする。ここでは、区間
長Lをもった単位区間dについて、サンプリング周波数
Fでサンプリングが行なわれており、全部でw個のサン
プル値が得られているものとし、サンプル番号を図示の
ように、0,1,2,3,・・・,k,・・・,w−
2,w−1とする(白丸で示す第w番目のサンプルは、
右に隣接する次の単位区間の先頭に含まれるサンプルと
する)。この場合、任意のサンプル番号kについては、
X(k)なる振幅値がデジタルデータとして与えられて
いることになる。短時間フーリエ変換においては、X
(k)に対して各サンプルごとに中央の重みが1に近
く、両端の重みが0に近くなるような窓関数W(k)を
乗ずることが通常である。すなわち、X(k)×W
(k)をX(k)と扱って以下のような相関計算を行う
もので、窓関数の形状としては余弦波形状のハミング窓
が一般に用いられている。ここで、wは以下の記述にお
いても定数のような記載をしているが、一般にはnの値
に応じて変化させ、区間長Lを超えない範囲で最大とな
るF/f(n)の整数倍の値に設定することが望まし
い。
【0023】このような区間信号Xに対して、第n番目
の標準周波数f(n)をもった正弦関数Rnとの相関値
を求める原理を示す。両者の相関値A(n)は、図5の
第1の演算式によって定義することができる。ここで、
X(k)は、図4に示すように、区間信号Xにおけるサ
ンプル番号kの振幅値であり、sin(2πf(n)k
/F)は、時間軸上での同位置における正弦関数Rnの
振幅値である。この第1の演算式は、単位区間d内の全
サンプル番号k=0〜w−1の次元について、それぞれ
区間信号Xの振幅値と正弦関数Rnの振幅ベクトルの内
積を求める式ということができる。
【0024】同様に、図5の第2の演算式は、区間信号
Xと、第n番目の標準周波数f(n)をもった余弦関数
との相関値を求める式であり、両者の相関値はB(n)
で与えられる。なお、相関値A(n)を求めるための第
1の演算式も、相関値B(n)を求めるための第2の演
算式も、最終的に2/wが乗ぜられているが、これは相
関値を規格化するためのものでり、前述のとおりwはn
に依存して変化させるのが一般的であるため、この係数
もnに依存する変数である。
【0025】区間信号Xと標準周波数f(n)をもった
標準周期関数との相関実効値は、図5の第3の演算式に
示すように、正弦関数との相関値A(n)と余弦関数と
の相関値B(n)との二乗和平方根値E(n)によって
示すことができる。この相関実効値の大きな標準周期関
数の周波数を代表周波数として選出すれば、この代表周
波数を用いて区間信号Xを符号化することができる。
【0026】すなわち、この相関値E(n)が所定の基
準以上の大きさとなる1つまたは複数の標準周波数を代
表周波数として選出すれば良い。なお、ここで「相関値
E(n)が所定の基準以上の大きさとなる」という選出
条件は、例えば、何らかの閾値を設定しておき、相関値
E(n)がこの閾値を超えるような標準周波数f(n)
をすべて代表周波数として選出する、という絶対的な選
出条件を設定しても良いが、例えば、相関値E(n)の
大きさの順にQ番目までを選出する、というような相対
的な選出条件を設定しても良い。
【0027】(一般化調和解析の手法)ここでは、本発
明に係る音響信号の符号化を行う際に有用な一般化調和
解析の手法について説明する。既に説明したように、音
響信号を符号化する場合、個々の単位区間内の区間信号
について、相関値の高いいくつかの代表周波数を選出す
ることになる。一般化調和解析は、より高い精度で代表
周波数の選出を可能にする手法であり、その基本原理は
次の通りである。
【0028】図6(a)に示すような単位区間dについ
て、信号S(j)なるものが存在するとする。ここで、
jは後述するように、繰り返し処理のためのパラメータ
である(j=1〜J)。まず、この信号S(j)に対し
て、図2に示すような128通りの周期関数すべてにつ
いての相関値を求める。そして、最大の相関値が得られ
た1つの周期関数の周波数を代表周波数として選出し、
当該代表周波数をもった周期関数を要素関数として抽出
する。続いて、図6(b)に示すような含有信号G
(j)を定義する。この含有信号G(j)は、抽出され
た要素関数に、その振幅として、当該要素関数の信号S
(j)に対する相関値を乗じることにより得られる信号
である。例えば、周期関数として図2に示すように、一
対の正弦関数と余弦関数とを用い、周波数f(n)が代
表周波数として選出された場合、振幅A(n)をもった
正弦関数A(n)sin(2πf(n)k/F)と、振
幅B(n)をもった余弦関数B(n)cos(2πf
(n)k/F)との和からなる信号が含有信号G(j)
ということになる(図6(b)では、図示の便宜上、一
方の関数しか示していない)。ここで、A(n),B
(n)は、図5の式で得られる規格化された相関値であ
るから、結局、含有信号G(j)は、信号S(j)内に
含まれている周波数f(n)をもった信号成分というこ
とができる。
【0029】こうして、含有信号G(j)が求まった
ら、信号S(j)から含有信号G(j)を減じることに
より、差分信号S(j+1)を求める。図6(c)は、
このようにして求まった差分信号S(j+1)を示して
いる。この差分信号S(j+1)は、もとの信号S
(j)の中から、周波数f(n)をもった信号成分を取
り去った残りの信号成分からなる信号ということができ
る。そこで、パラメータjを1だけ増加させることによ
り、この差分信号S(j+1)を新たな信号S(j)と
して取り扱い、同様の処理を、パラメータjをj=1〜
Jまで1ずつ増やしながらJ回繰り返し実行すれば、J
個の代表周波数を選出することができる。
【0030】このような相関計算の結果として出力され
るJ個の含有信号G(1)〜G(J)は、もとの区間信
号Xの構成要素となる信号であり、もとの区間信号Xを
符号化する場合には、これらJ個の含有信号の周波数を
示す情報および振幅(強度)を示す情報を符号データと
して用いるようにすれば良い。尚、Jは代表周波数の個
数であると説明してきたが、標準周波数f(n)の個数
と同一すなわちJ=128であってもよく、周波数スペ
クトルを求める目的においてはそのように行うのが通例
である。
【0031】こうして、各単位区間について、所定数の
周波数群が選出されたら、この周波数群の各周波数に対
応する「音の高さを示す情報」、選出された各周波数の
信号強度に対応する「音の強さを示す情報」、当該単位
区間の始点に対応する「音の発音開始時刻を示す情
報」、当該単位区間に後続する単位区間の始点に対応す
る「音の発音終了時刻を示す情報」、の4つの情報を含
む所定数の符号データを作成すれば、当該単位区間内の
区間信号Xを所定数の符号データにより符号化すること
ができる。符号データとして、MIDIデータを作成す
るのであれば、「音の高さを示す情報」としてノートナ
ンバーを用い、「音の強さを示す情報」としてベロシテ
ィーを用い、「音の発音開始時刻を示す情報」としてノ
ートオン時刻を用い、「音の発音終了時刻を示す情報」
としてノートオフ時刻を用いるようにすれば良い。
【0032】(本発明に係る音響信号の符号化方法)続
いて、本発明に係る音響信号の符号化方法について、図
7のフローチャートを用いて詳細に説明する。まず、与
えられた音響信号に対しては、単位区間を設定し、各単
位区間に対して図7のような処理を行い、各単位区間ご
とに得られた符号データを時系列に連結するような処理
を行うが、ここでは単位区間に対して行われる処理につ
いて述べる。与えられた(単位区間の)音響信号に対し
て短時間フーリエ変換または一般化調和解析等を利用し
て周波数解析を行う(ステップS1)。本実施形態で
は、このステップS1において、図2に示したように1
28個の標準周期関数を用意し、128個の標準周波数
f(n)全てについての強度情報、すなわちスペクトル
を得るようにする。この標準周波数に基づいて得られる
スペクトルを標準スペクトルと呼ぶことにする。
【0033】各単位区間について、128個の標準周波
数に対する強度情報が得られるが、最終的な符号長を削
減しステップ2以降の処理を軽減するため、このステッ
プS1において16個程度の代表周波数を選別すること
がある。代表周波数の選出は、強度情報が大きい方から
16個程度抽出するのが一般的であるが、対象とする音
響信号が音声信号の場合、特開2000−99093号
公報に開示されているようなフォルマント抽出方法を用
いても良い。この段階で代表周波数の選別が行なわれた
場合、ステップS2以降における標準周波数や周波数成
分は、特に代表周波数と明記はしないが、選別された代
表周波数に対応する標準周波数や周波数成分に限定され
るものとする。
【0034】次に、より細かい周波数間隔で周期関数を
用意して、これらの周期関数を用いて、各標準周波数に
ついて、その標準周波数の近傍の標準周波数との範囲内
で周波数解析を行う(ステップS2)。本実施形態で
は、各標準周波数間に12種の周波数を有する周期関数
を用意するようにする。このステップS2で用いられる
周波数および周期関数を、微細周波数および微細周期関
数と呼ぶことにする。微細周波数を設定する範囲を、対
象とする標準周波数の直前と直後の標準周波数間に限定
すれば、各標準周波数について、12×2+1種の微細
周波数およびそれらに対応する強度情報、すなわちスペ
クトルが得られることになる。ここで得られたスペクト
ルを微細スペクトルと呼ぶことにする。
【0035】さらにステップS2では、得られた微細ス
ペクトルの分布形状パラメータの算出を行う。分布形状
パラメータとは、微細スペクトルを構成する周波数成分
の分布を表す数値である。本実施形態では、この分布形
状パラメータとして標準偏差を用いる。具体的には、対
象とする標準周波数に対応するノートナンバーをNp、
その±1半音分に含まれるノートナンバーをNp+i/
13(iは−12≦i≦12を満たす整数)、ノートナ
ンバーNp+i/13に対応するスペクトル強度をI
(Np+i/13)として、以下の(数式2)を用いて
算出する。
【0036】(数式2) σp=[Σi{(i/13)2×I(Np+i/13)}/Σi
(Np+i/13)]1/2
【0037】すなわち、この(数式2)においては、対
象とする標準周波数に対応するノートナンバーNpに対
して±1半音分のスペクトル分布を解析し、その標準偏
差σpを得ていることになる。
【0038】続いて、算出された標準偏差σpにしたが
って、各周波数を複数のグループに分類する(ステップ
S3)。符号データとしてMIDIデータを作成する場
合は、このグループは、MIDIデータのチャンネルに
対応する。具体的な処理としては、閾値をあらかじめ定
めておき、標準偏差σpがこの閾値より高いか低いかに
より分類を行う。例えば、ノートナンバーNpに対応す
る標準周波数について求めた標準偏差σpが閾値より高
い場合、その標準周波数成分をチャンネル1に格納する
データとし、標準偏差σpが閾値より低い場合、その標
準周波数成分をチャンネル2に格納するデータとして分
離する。これにより、図8(a)に示したような微細ス
ペクトルで表現される音響データが図8(b)、図8
(c)に示すような微細スペクトルで表現される2つの
音響データに分離されることになる。
【0039】続いて、分類された音響データを符号化し
て、それぞれのチャンネルに記録する(ステップS
4)。例えば、図13の例では、この単位区間につい
て、チャンネル1には、ノートナンバーNpとそれに対
応する強度の組が4組記録されることになり、チャンネ
ル2には、3組記録されることになる。
【0040】ステップS1〜ステップS4の処理を全単
位区間に対して行うことにより、2つのチャンネルを有
する符号データが得られる。この段階での符号データ
は、各単位区間について、所定数の標準周波数が選出さ
れ、各標準周波数に対応する「音の高さを示す情報」、
各標準周波数の信号強度に対応する「音の強さを示す情
報」、当該単位区間の始点に対応する「音の発音開始時
刻を示す情報」、当該単位区間に後続する単位区間の始
点に対応する「音の発音終了時刻を示す情報」、の4つ
の情報を含む形式となっている。この形式のままでも符
号データとして扱うことはできるが、このままではデー
タ量が多くなるため、符号データの統合を行うことが好
ましい。符号データの統合処理としては、特開平11−
95753号公報に開示したような処理が行われる。具
体的には、同じ音の高さ(音高)を示す音符が複数連続
して配置されていた場合には、この複数の音符を1つの
音符に統合するようにする。言い換えれば、複数の単位
区間にまたがった音符によって、個々の単位区間ごとの
音符を置換するとも言える。
【0041】また、統合対象とする音符は、必ずしも同
じ音高の音符とする必要はなく、ある程度の類似性をも
った音符を統合対象としても良い。例えば、互いに平均
律の半音階にて1半音音程の差しかない一連の音符を統
合対象として1つの音符に置換することもできる。この
場合は、例えば、一連の音符の中で音高の低い方の音符
によって置換すれば良い。一般的に拡張すれば、隣接す
る複数の単位区間について、所定の条件下で互いに類似
する符号データがある場合、これら類似する符号データ
を、複数の単位区間にまたがった統合符号データに置換
することにより、音符数を削減することが可能となる。
【0042】なお、上記の符号化処理によって作成され
る符号データには、それぞれ強度を示すデータ(MID
Iデータの場合はベロシティー)が付加されている。し
たがって、符号データを統合した場合、強度を示すデー
タも統合する必要がある。ここで、統合対象となる符号
データに、それぞれ異なる強度データが定義されていた
場合には、例えば、最も大きな強度データを統合後の符
号データについての強度データと定めるようにすれば良
い。ただ、MIDIデータの場合、2つの符号データを
統合する際に、先行する符号データの強度に比べて、後
続する符号データの強度がかなり大きい場合、これら2
つの符号データを統合すると不自然になる。これは、通
常のMIDI音源の再生音は、楽器の演奏音から構成さ
れており、音の強度が時間と共に減衰していくのが一般
的だからである。したがって、先行する符号データの強
度に比べて、後続する符号データの強度が小さい場合に
は、1つの統合符号データに置換しても不自然さは生じ
ないが、逆の場合には、不自然さが生じることになる。
そこで、2つの符号データの強度差が所定の基準以上で
あり、かつ、先行する符号データの強度に比べて、後続
する符号データの強度が大きい場合には、統合を行わな
い。このようにして統合処理が行われた符号データは、
記録媒体に記録されるか、またはネットワークを介する
などして流通されることになる。
【0043】符号データを復号化して音響信号として再
生する場合には、MIDI音源装置等を用いて行う。通
常、MIDI音源装置では、どの音源を使用するかが指
定され、入力された符号データを読み取って、先頭部で
指定されているバンク番号、プログラム番号に応じて、
音源である波形が選別されて再生が行われている。しか
しながら、音源を識別するコード番号を指定しなくて
も、音響符号データの周波数の分布状態により、音源が
特定できることが知られている。この周波数分布により
音源を特定する情報を、MIDI音源装置に登録してお
けば、本実施形態で符号化した符号データを読み取った
際に、チャンネル1、チャンネル2それぞれに対して音
源を特定して再生することが可能になる。
【0044】(本発明に係る音響信号の分離方法)上述
のような音響信号の符号化方法を利用することにより、
符号化を行わずに単に音響信号の分離を行うことができ
る。次に、このような音響信号の分離方法について説明
する。本発明に係る音響信号の分離方法では、与えられ
た音響信号に対して単位区間を設定し、各単位区間に対
して図9に示したフローチャートに従った処理を行い、
各単位区間ごとに得られた波形信号を時系列に接続する
ような処理を行うことになる。ここでは単位区間に対し
て行われる処理について図9を用いて説明する。
【0045】まず、与えられた音響信号に対して単位区
間の設定が行われた後、各単位区間に対して、標準周波
数解析(ステップS11)、微細周波数解析(ステップ
S12)、分類(ステップS13)の各処理が行われ
る。これらは、図7に示したステップS1〜ステップS
3の処理と各々全く同様な処理であるため、説明を省略
する。
【0046】ステップS13において分類が行われた
ら、各グループの標準周波数成分に対応する周波数およ
び振幅をもつ標準周期関数の標準信号波形を発生させ、
発生された標準信号波形をグループごとに1つの複合波
形に合成する(ステップS14)。例えば、2つのグル
ープに分類された場合には、2つの複合波形が得られる
ことになる。ステップS11〜ステップS14の処理を
全単位区間に対して行うことにより、全単位区間につい
て2つのチャンネルに分離された複合波形が得られる。
【0047】続いて、各グループごとに時系列方向に連
結を行い、音響信号の開始時刻から終了信号まで連続す
る2つの複合波形を作成する。この具体的な例を、図1
0を用いて説明する。単位区間A、単位区間Bが時間軸
上で若干オーバーラップして存在する場合に、単位区間
A、単位区間Bに対して上記ステップS11〜ステップ
S14までの処理を行い、それぞれ図10(a)、
(b)に示すような複合波形a、複合波形bが得られた
とする。この場合、図10(c)に示すように連結処理
が行われる。図10(c)においては、各単位区間の複
合波形を時系列方向に連結するだけでなく、徐々に振幅
が大きくなるような立ち上がり制御、徐々に振幅が小さ
くなるような立ち下がり制御を行う。図10(c)で
は、単位区間A、単位区間Bのどちらにおいても、区間
開始時刻から徐々に振幅が大きくなっており、区間終了
時刻を過ぎると、徐々に振幅が小さくなっていることが
わかる。このようにして、元の音響信号は、2つの音源
に対応した複合波形(音響信号)に分離されることにな
る。
【0048】
【発明の効果】以上、説明したように本発明によれば、
与えられた音響信号に対して、標準周波数を有する複数
の標準周期関数との相関を求めることにより、各標準周
波数に対応した信号強度の周波数成分からなるスペクト
ル集合を算出し、各標準周波数について、その標準周波
数の近傍の標準周波数との間に複数の微細周波数を各々
設定し、微細周波数を有する複数の微細周期関数との相
関を求め、この相関値を基に各微細周波数に対応した信
号強度の分布形状パラメータを各標準周波数ごとに算出
し、算出された分布形状パラメータにしたがって、スペ
クトル集合を構成する周波数成分を複数のグループに分
類する分類し、各グループに分類された各周波数成分に
対して、各々が属するグループの識別符号を含めて符号
化するようにしたので、複数音源による演奏から得られ
る音響信号が与えられた場合であっても、元のそれぞれ
の音源に対応する音響信号を抽出することが可能になる
という効果を奏する。
【図面の簡単な説明】
【図1】本発明の音響信号の符号化方法の基本原理を示
す図である。
【図2】本発明で利用される周期関数の一例を示す図で
ある。
【図3】図2に示す各周期関数の周波数とMIDIノー
トナンバーnとの関係式を示す図である。
【図4】解析対象となる信号と周期信号との相関計算の
手法を示す図である。
【図5】図4に示す相関計算を行うための計算式を示す
図である。
【図6】一般化調和解析の基本的な手法を示す図であ
る。
【図7】本発明に係る音響信号の符号化方法を示すフロ
ーチャートである。
【図8】音響データをそのスペクトル特性により分類す
る様子を示す図である。
【図9】本発明に係る音響信号の分離方法を示すフロー
チャートである。
【図10】単位区間ごとの複合波形を連結する様子を示
す図である。
【符号の説明】
A(n),B(n)・・・相関値 d,d1〜d5・・・単位区間 E(n)・・・相関値 G(j)・・・含有信号 n,n1〜n6・・・ノートナンバー S(j),S(j+1)・・・差分信号 X,X(k)・・・区間信号
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // G10L 101:027 G10L 3/00 531N 101:14 7/04 F

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】与えられた音響信号に対して、標準周波数
    を有する複数の標準周期関数との相関を求めることによ
    り、各標準周波数に対応した信号強度の周波数成分から
    なるスペクトル集合を算出する標準周波数解析段階と、 前記各標準周波数について、当該標準周波数の近傍の標
    準周波数との間に複数の微細周波数を各々設定し、前記
    微細周波数を有する複数の微細周期関数との相関を求
    め、この相関値を基に各微細周波数に対応した信号強度
    の分布形状パラメータを各標準周波数ごとに算出する微
    細周波数解析段階と、 前記算出された分布形状パラメータにしたがって、前記
    スペクトル集合を構成する周波数成分を複数のグループ
    に分類する分類段階と、 前記各グループに分類された各周波数成分に対して、各
    々が属するグループの識別符号を含めて符号化する符号
    化段階と、 を有することを特徴とする音響信号の符号化方法。
  2. 【請求項2】前記標準周波数解析段階において、算出さ
    れた信号強度に応じて代表周波数を選別し、前記スペク
    トル集合の部分集合として選別された代表周波数に対応
    する周波数成分を要素にもつ部分スペクトル集合を生成
    し、前記微細周波数解析段階、前記分類段階、前記符号
    化段階は前記代表周波数の周波数成分に限定してなされ
    るようにしていることを特徴とする請求項1記載の音響
    信号の符号化方法。
  3. 【請求項3】与えられた音響信号に対して、標準周波数
    を有する複数の標準周期関数との相関を求めることによ
    り、各標準周波数に対応した信号強度の周波数成分から
    なるスペクトル集合を算出する標準周波数解析段階と、 前記各標準周波数について、当該標準周波数の前後に隣
    接する標準周波数との間に複数の微細周波数を各々設定
    し、前記微細周波数を有する複数の微細周期関数との相
    関を求め、この相関値を基に各微細周波数に対応した信
    号強度の分布形状パラメータを各標準周波数ごとに算出
    する微細周波数解析段階と、 前記算出された分布形状パラメータにしたがって、前記
    スペクトル集合を構成する周波数成分を複数のグループ
    に分類する分類段階と、 前記各グループに分類された各周波数成分に基づき、標
    準周期関数の標準信号波形を複数発生させ、それらを合
    成することにより1つの複合波形を生成し、グループに
    対応した複数の複合波形を得る波形合成段階と、 を有することを特徴とする音響信号の分離方法。
JP2000319175A 2000-10-19 2000-10-19 音響信号の符号化方法および分離方法 Withdrawn JP2002123296A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000319175A JP2002123296A (ja) 2000-10-19 2000-10-19 音響信号の符号化方法および分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000319175A JP2002123296A (ja) 2000-10-19 2000-10-19 音響信号の符号化方法および分離方法

Publications (1)

Publication Number Publication Date
JP2002123296A true JP2002123296A (ja) 2002-04-26

Family

ID=18797683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000319175A Withdrawn JP2002123296A (ja) 2000-10-19 2000-10-19 音響信号の符号化方法および分離方法

Country Status (1)

Country Link
JP (1) JP2002123296A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005143074A (ja) * 2003-11-07 2005-06-02 Psytechnics Ltd 品質評価装置
JP2013045084A (ja) * 2011-08-26 2013-03-04 Yamaha Corp 信号処理装置
JP2021055600A (ja) * 2019-09-30 2021-04-08 本田技研工業株式会社 スペクトル算出装置及びスペクトル算出方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005143074A (ja) * 2003-11-07 2005-06-02 Psytechnics Ltd 品質評価装置
JP2013045084A (ja) * 2011-08-26 2013-03-04 Yamaha Corp 信号処理装置
JP2021055600A (ja) * 2019-09-30 2021-04-08 本田技研工業株式会社 スペクトル算出装置及びスペクトル算出方法
JP7133527B2 (ja) 2019-09-30 2022-09-08 本田技研工業株式会社 スペクトル算出装置及びスペクトル算出方法

Similar Documents

Publication Publication Date Title
JPH1195753A (ja) 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体
JP2000099009A (ja) 音響信号の符号化方法
JP2002123296A (ja) 音響信号の符号化方法および分離方法
JP2000293188A (ja) 和音リアルタイム認識方法及び記憶媒体
JP4331289B2 (ja) 音響信号の符号化方法
JP2003216147A (ja) 音響信号の符号化方法
JP4156252B2 (ja) 音響信号の符号化方法
JP2001005450A (ja) 音響信号の符号化方法
JP2002244691A (ja) 音響信号の符号化方法
JP4220108B2 (ja) 音響信号符号化システム
JP4268328B2 (ja) 音響信号の符号化方法
JP2002215142A (ja) 音響信号の符号化方法
JP4156269B2 (ja) 時系列信号の周波数解析方法および音響信号の符号化方法
JP4473979B2 (ja) 音響信号の符号化方法および復号化方法ならびに当該方法を実行するプログラムを記録した記録媒体
JP4695781B2 (ja) 音響信号の符号化方法
JP4152502B2 (ja) 音響信号の符号化装置および符号データの編集装置
JP4601865B2 (ja) 音響信号の符号化方法
JP3935745B2 (ja) 音響信号の符号化方法
JP4580548B2 (ja) 周波数解析方法
JP3776782B2 (ja) 音響信号の符号化方法
JP4156268B2 (ja) 時系列信号の周波数解析方法および音響信号の符号化方法
JP4662406B2 (ja) 周波数解析方法および音響信号の符号化方法
JPH1173199A (ja) 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体
JP2003216169A (ja) 周波数解析方法および音響信号の符号化方法
JP4662407B2 (ja) 周波数解析方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080108