JPH1195753A

JPH1195753A - 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体

Info

Publication number: JPH1195753A
Application number: JP9273949A
Authority: JP
Inventors: Toshio Motegi; 敏雄茂出木
Original assignee: Dai Nippon Printing Co Ltd
Current assignee: Dai Nippon Printing Co Ltd
Priority date: 1997-09-19
Filing date: 1997-09-19
Publication date: 1999-04-09
Anticipated expiration: 2017-09-19
Also published as: JP3795201B2

Abstract

(57)【要約】【課題】音響信号に対して効率的な符号化を行う。【解決手段】符号化対象となる音響信号をＰＣＭコー
ド化し、音響データとして取り込み、時間軸上に複数の
単位区間ｄ１〜ｄ５を設定する（図(a) ）。各単位区間
ごとに、フーリエ変換を行い、スペクトルを求める（図
(b) ）。周波数軸ｆに対応させて離散的に１２８個のノ
ートナンバー（０〜１２７）を定義し、各ノートナンバ
ーごとに実効強度を求める（図(c) ）。実効強度の大き
い順にＰ個のノートナンバーＮｐ（ｄ１，１）〜Ｎｐ
（ｄ１，Ｐ）を抽出し、Ｐ個のトラック上の各単位区間
に対応する時間位置に配置する。各トラック上のノート
ナンバーをＭＩＤＩデータで表現し、Ｐチャンネルステ
レオ音として、原音響信号を再生する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音響信号の符号化方
法に関し、時系列の強度信号として与えられる音響信号
を符号化し、これを復号化して再生する技術に関する。
特に、本発明はヴォーカル音響信号（人の話声，歌声の
信号）を、ＭＩＤＩ形式の符号データに効率良く変換す
る処理に適しており、音声を記録する種々の産業分野へ
の応用が期待される。

【０００２】

【従来の技術】音響信号を符号化する技術として、ＰＣ
Ｍ（Pulse Code Modulation ）の手法は最も普及してい
る手法であり、現在、オーディオＣＤやＤＡＴなどの記
録方式として広く利用されている。このＰＣＭの手法の
基本原理は、アナログ音響信号を所定のサンプリング周
波数でサンプリングし、各サンプリング時の信号強度を
量子化してデジタルデータとして表現する点にあり、サ
ンプリング周波数や量子化ビット数を高くすればするほ
ど、原音を忠実に再生することが可能になる。ただ、サ
ンプリング周波数や量子化ビット数を高くすればするほ
ど、必要な情報量も増えることになる。そこで、できる
だけ情報量を低減するための手法として、信号の変化差
分のみを符号化するＡＤＰＣＭ（Adaptive Differentia
l Pulse Code Modulation ）の手法も用いられている。

【０００３】一方、電子楽器による楽器音を符号化しよ
うという発想から生まれたＭＩＤＩ（Musical Instrume
nt Digital Interface）規格も、パーソナルコンピュー
タの普及とともに盛んに利用されるようになってきてい
る。このＭＩＤＩ規格による符号データ（以下、ＭＩＤ
Ｉデータという）は、基本的には、楽器のどの鍵盤キー
を、どの程度の強さで弾いたか、という楽器演奏の操作
を記述したデータであり、このＭＩＤＩデータ自身に
は、実際の音の波形は含まれていない。そのため、実際
の音を再生する場合には、楽器音の波形を記憶したＭＩ
ＤＩ音源が別途必要になる。しかしながら、上述したＰ
ＣＭの手法で音を記録する場合に比べて、情報量が極め
て少なくてすむという特徴を有し、その符号化効率の高
さが注目を集めている。このＭＩＤＩ規格による符号化
および復号化の技術は、現在、パーソナルコンピュータ
を用いて楽器演奏、楽器練習、作曲などを行うソフトウ
エアに広く採り入れられており、カラオケ、ゲームの効
果音といった分野でも広く利用されている。

【０００４】

【発明が解決しようとする課題】上述したように、ＰＣ
Ｍの手法により音響信号を符号化する場合、十分な音質
を確保しようとすれば情報量が膨大になり、データ処理
の負担が重くならざるを得ない。したがって、通常は、
ある程度の情報量に抑えるため、ある程度の音質に妥協
せざるを得ない。もちろん、ＭＩＤＩ規格による符号化
の手法を採れば、非常に少ない情報量で十分な音質をも
った音の再生が可能であるが、上述したように、ＭＩＤ
Ｉ規格そのものが、もともと楽器演奏の操作を符号化す
るためのものであるため、広く一般音響への適用を行う
ことはできない。別言すれば、ＭＩＤＩデータを作成す
るためには、実際に楽器を演奏するか、あるいは、楽譜
の情報を用意する必要がある。

【０００５】このように、従来用いられているＰＣＭの
手法にしても、ＭＩＤＩの手法にしても、それぞれ音響
信号の符号化方法としては一長一短があり、一般の音響
について、少ない情報量で十分な音質を確保することは
できない。ところが、一般の音響についても効率的な符
号化を行いたいという要望は、益々強くなってきてい
る。いわゆるヴォーカル音響と呼ばれる人間の話声や歌
声を取り扱う分野では、かねてからこのような要望が強
く出されている。たとえば、語学教育、声楽教育、犯罪
捜査などの分野では、ヴォーカル音響信号を効率的に符
号化する技術が切望されている。

【０００６】そこで本発明は、人の声音や歌声を含む音
響信号に対しても効率的な符号化を行うことができる音
響信号の符号化方法を提供することを目的とする。

【０００７】

【課題を解決するための手段】

(1) 本発明の第１の態様は、時系列の強度信号として
与えられる音響信号を符号化するための音響信号の符号
化方法において、符号化対象となる音響信号の時間軸上
に複数の単位区間を設定する区間設定段階と、個々の単
位区間ごとに、当該単位区間内の音響信号に含まれる周
波数成分を第１の軸に、各周波数成分ごとの強度を第２
の軸にとったスペクトルを作成するスペクトル作成段階
と、スペクトルの第１の軸に対応させて離散的に複数Ｑ
個の符号コードを定義し、この複数Ｑ個の符号コードを
第１の軸に、各符号コードごとの強度を第２の軸にとっ
た強度グラフを、個々の単位区間ごとのスペクトルに基
いてそれぞれ作成する強度グラフ作成段階と、強度グラ
フにおける各符号コードごとの強度に基いて、個々の単
位区間ごとに、Ｑ個の全符号コードの中から当該単位区
間を代表するＰ個の代表符号コードを抽出し、これら抽
出した代表符号コードおよびその強度によって、個々の
単位区間の音響信号を表現する符号化段階と、を行うよ
うにしたものである。

【０００８】(2) 本発明の第２の態様は、上述の第１
の態様に係る音響信号の符号化方法において、区間設定
段階で、隣接する単位区間が時間軸上で部分的に重複す
るような設定を行うようにしたものである。

【０００９】(3) 本発明の第３の態様は、上述の第２
の態様に係る音響信号の符号化方法において、区間長Ｌ
およびオフセット長ΔＬを定義し（ただし、ΔＬ＜
Ｌ）、各単位区間の時間軸上での長さを区間長Ｌに設定
し、任意のｉに対して第ｉ番目の単位区間の始点と第
（ｉ＋１）番目の単位区間の始点との時間軸上での隔た
りをオフセット長ΔＬに設定するようにしたものであ
る。

【００１０】(4) 本発明の第４の態様は、上述の第１
〜第３の態様に係る音響信号の符号化方法において、ス
ペクトル作成段階で、符号化対象となる音響信号を所定
のサンプリング周期でサンプリングしてデジタル音響デ
ータとして取り込み、この取り込んだ音響データに対し
て各単位区間ごとにフーリエ変換を行うことによりスペ
クトルを作成するようにしたものである。

【００１１】(5) 本発明の第５の態様は、上述の第３
の態様に係る音響信号の符号化方法において、スペクト
ル作成段階で、オフセット長△Ｌに基づいて決定される
重み関数を窓関数として設定し、符号化対象となる音響
信号の各単位区間に対して、前記窓関数を重畳した上で
フーリエ変換を行うことによりスペクトルを作成するよ
うにしたものである。

【００１２】(6) 本発明の第６の態様は、上述の第４
の態様に係る音響信号の符号化方法において、スペクト
ル作成段階で、複数通りのサンプリング周期で取り込ま
れた複数通りの音響データに対してそれぞれフーリエ変
換を行うことにより、複数通りのスペクトルを用意し、
これらのスペクトルを合成するようにしたものである。

【００１３】(7) 本発明の第７の態様は、上述の第１
〜第６の態様に係る音響信号の符号化方法において、強
度グラフ作成段階で、複数Ｑ個の符号コードとしてＭＩ
ＤＩデータで利用されるノートナンバーを用い、符号化
段階で、個々の単位区間の音響信号を、代表符号コード
として抽出されたノートナンバーと、その強度に基いて
決定されたベロシティーと、当該単位区間の長さに基い
て決定されたデルタタイムと、を示すデータからなるＭ
ＩＤＩ形式の符号データによって表現するようにしたも
のである。

【００１４】(8) 本発明の第８の態様は、上述の第１
〜第７の態様に係る音響信号の符号化方法において、符
号化段階で代表符号コードを抽出する際に、符号化対象
となる強度グラフにおける候補の中から強度の大きい順
にＰ個の符号コードを抽出して代表符号コードとするよ
うにしたものである。

【００１５】(9) 本発明の第９の態様は、上述の第１
〜第７の態様に係る音響信号の符号化方法において、符
号化段階で代表符号コードを抽出する際に、符号化対象
となる強度グラフにおけるその時点での候補の中から最
も強度の大きい符号コードを第ｉ番目の代表符号コード
として抽出した後、この第ｉ番目の代表符号コードおよ
びその倍音成分に相当する符号コードを候補から削除す
る処理を、ｉ＝１〜（Ｐ−１）について繰り返し実行
し、更に、残った候補の中から最も強度の大きい符号コ
ードを第Ｐ番目の代表符号コードとして抽出することに
より、合計Ｐ個の代表符号コードの抽出を行うようにし
たものである。

【００１６】(10) 本発明の第１０の態様は、上述の第
１〜第７の態様に係る音響信号の符号化方法において、
各符号コードに基いて音を再生するために用いる音源を
予め特定しておき、この音源を用いた各符号コードの再
生音の周波数特性に基いて補正テーブルを定義してお
き、符号化段階で代表符号コードを抽出する際に、符号
化対象となる強度グラフにおけるその時点での候補の中
から最も強度の大きい符号コードを第ｉ番目の参照コー
ドとし、この第ｉ番目の参照コードに補正テーブルを適
用することにより得られる符号コードを第ｉ番目の代表
符号コードとして抽出し、第ｉ番目の参照コードおよび
第ｉ番目の代表符号コードを候補から除外する処理を、
ｉ＝１〜Ｐについて繰り返し実行し、合計Ｐ個の代表符
号コードの抽出を行うようにしたものである。

【００１７】(11) 本発明の第１１の態様は、上述の第
１〜第７の態様に係る音響信号の符号化方法において、
各符号コードに基いて音を再生するために用いる音源を
予め特定しておき、この音源を用いて各符号コードを実
際に再生することにより得られる音響信号に対して、ス
ペクトル作成段階および強度グラフ作成段階を実行し、
各符号コードについての固有強度グラフを予め求めてお
き、符号化段階で代表符号コードを抽出する際に、符号
化対象となる強度グラフにおけるその時点での候補の中
から最も強度の大きい符号コードを第ｉ番目の代表符号
コードとして抽出した後、符号化対象となる強度グラフ
の各強度値から第ｉ番目の代表符号コードについての固
有強度グラフの各強度値を減算する処理を、ｉ＝１〜
（Ｐ−１）について繰り返し実行し、更に、残った候補
の中から最も強度の大きい符号コードを第Ｐ番目の代表
符号コードとして抽出することにより、合計Ｐ個の代表
符号コードの抽出を行うようにしたものである。

【００１８】(12) 本発明の第１２の態様は、上述の第
１〜第７の態様に係る音響信号の符号化方法において、
各符号コードに基いて音を再生するために用いる音源を
予め特定しておき、この音源を用いて各符号コードを実
際に再生することにより得られる音響信号の固有波形を
予め求めておき、第ｉ番目の代表符号コードを決定する
ために、第ｉ番目の音響信号の波形情報を入力し、入力
した波形情報に対してスペクトル作成段階および強度グ
ラフ作成段階を行い、続く符号化段階で、作成された強
度グラフにおける候補の中から最も強度の大きい符号コ
ードを第ｉ番目の代表符号コードとして抽出し、更に、
第ｉ番目の音響信号の強度値から第ｉ番目の代表符号コ
ードについての固有波形の各強度値を減算し、その結果
得られる音響信号を第（ｉ＋１）番目の音響信号とする
符号抽出処理を定義し、符号化対象となる原音響信号に
対して区間設定段階を行い、各単位区間ごとの原音響信
号をそれぞれ第１番目の音響信号として、ｉ＝１〜（Ｐ
−１）について符号抽出処理を繰り返し実行し、最後
に、第Ｐ番目の音響信号の波形情報を入力し、入力した
波形情報に対してスペクトル作成段階および強度グラフ
作成段階を行い、続く符号化段階で、作成された強度グ
ラフにおける候補の中から最も強度の大きい符号コード
を第Ｐ番目の代表符号コードとして抽出する処理を実行
することにより、各単位区間ごとにそれぞれ合計Ｐ個の
代表符号コードの抽出を行うようにしたものである。

【００１９】(13) 本発明の第１３の態様は、上述の第
１〜第１２の態様に係る音響信号の符号化方法におい
て、隣接する複数の単位区間について、所定の条件下で
互いに類似する代表符号コードがある場合、これら類似
する代表符号コードを、複数の単位区間に跨がった統合
符号コードに置換する処理を行うようにしたものであ
る。

【００２０】(14) 本発明の第１４の態様は、上述の第
１〜第１３の態様に係る音響信号の符号化方法におい
て、各単位区間ごとに抽出されるＰ個の符号コードを、
それぞれＰ個のトラックに分離して収容するようにし、
抽出されたＰ個の符号コードを周波数に基いてソートし
てから各トラックに収容するようにしたものである。

【００２１】(15) 本発明の第１５の態様は、上述の第
１〜第１４の態様に係る音響信号の符号化方法を実行す
る音響信号の符号化のためのプログラムをコンピュータ
読み取り可能な記録媒体に記録するようにしたものであ
る。

【００２２】(16) 本発明の第１６の態様は、上述の第
１〜第１４の態様に係る音響信号の符号化方法により符
号化された符号データをコンピュータ読み取り可能な記
録媒体に記録するようにしたものである。

【００２３】

【発明の実施の形態】以下、本発明を図示する実施形態
に基づいて説明する。

【００２４】§１．本発明に係る音響信号の符号化方
法の基本原理はじめに、本発明に係る音響信号の符号化方法の基本原
理を図１を参照しながら説明する。いま、図１(a) に示
すように、時系列の強度信号としてアナログ音響信号が
与えられたものとしよう。図示の例では、横軸に時間
ｔ、縦軸に振幅（強度）をとってこの音響信号を示して
いる。ここでは、まずこのアナログ音響信号を、デジタ
ルの音響データとして取り込む処理を行う。これは、従
来の一般的なＰＣＭの手法を用い、所定のサンプリング
周期でこのアナログ音響信号をサンプリングし、振幅を
所定の量子化ビット数を用いてデジタルデータに変換す
る処理を行えばよい。ここでは、説明の便宜上、ＰＣＭ
の手法でデジタル化した音響データの波形も、図１(a)
のアナログ音響信号と同一の波形で示すことにする。

【００２５】続いて、この符号化対象となる音響信号の
時間軸上に、複数の単位区間を設定する。図１(a) に示
す例では、時間軸ｔ上に等間隔に６つの時刻ｔ１〜ｔ６
が定義され、これら各時刻を始点および終点とする５つ
の単位区間ｄ１〜ｄ５が設定されている（より実用的な
区間設定方法については後述する）。

【００２６】こうして単位区間が設定されたら、各単位
区間ごとの音響信号に対してそれぞれフーリエ変換を行
い、スペクトルを作成する。このとき、ハニング窓（Ha
nning Window )など周知の窓関数で切り出した音響信号
にフィルタをかけてフーリエ変換を施すことが望まし
い。一般にフーリエ変換は、切り出した区間前後に同様
な信号が無限に存在することが想定されているため、矩
形窓（窓なし）の場合、作成したスペクトルに高周波ノ
イズがのることが多い。このような場合、ハニング窓な
ど区間の両端の重みが０になるような関数を用いるのが
望ましい。ハニング窓関数Ｈ（ｋ）は、単位区間長をＬ
とすると、ｋ＝１…Ｌに対して、Ｈ（ｋ）＝０．５−０．５＊ｃｏｓ（２πｋ／Ｌ）で与えられる関数である。

【００２７】図１(b) には、単位区間ｄ１について作成
されたスペクトルの一例が示されている。このスペクト
ルでは、横軸上に定義された周波数ｆによって、単位区
間ｄ１内の音響信号に含まれる周波数成分（０〜Ｆｓ：
ここでＦｓはサンプリング周波数）が示されており、縦
軸上に定義された複素強度Ａによって、各周波数成分ご
との複素強度が示されている。なお、このようなスペク
トルを得る手法としては、フーリエ変換の他にも種々の
手法が知られており、どのような手法を利用してもかま
わない。また、アナログ音響信号から直接的にスペクト
ルを作成する手法を用いれば、音響信号をＰＣＭの手法
でデジタル化する必要はない。

【００２８】次に、このスペクトルの周波数軸ｆに対応
させて、離散的に複数Ｑ個の符号コードを定義する。こ
の例では、符号コードとしてＭＩＤＩデータで利用され
るノートナンバーＮを用いており、Ｎ＝０〜１２７まで
の１２８個の符号コードを定義している。ノートナンバ
ーＮは、音符の音階を示すパラメータであり、たとえ
ば、ノートナンバーＮ＝６９は、ピアノの鍵盤中央の
「ラ音（Ａ３音）」を示しており、４４０Ｈｚの音に相
当する。このように、１２８個のノートナンバーには、
いずれも所定の周波数が対応づけられるので、スペクト
ルの周波数軸ｆ上の所定位置に、それぞれ１２８個のノ
ートナンバーＮが離散的に定義されることになる。

【００２９】ここで、ノートナンバーＮは、１オクター
ブ上がると、周波数が２倍になる対数尺度の音階を示す
ため、周波数軸ｆに対して線形には対応しない。そこ
で、周波数軸ｆを対数尺度で表し、この対数尺度軸上に
ノートナンバーＮを定義した強度グラフを作成する。図
１(c) は、このようにして作成された単位区間ｄ１につ
いての強度グラフを示す。この強度グラフの横軸は、図
１(b) に示すスペクトログラムの横軸を対数尺度に変換
したものであり、ノートナンバーＮ＝０〜１２７が等間
隔にプロットされている。一方、この強度グラフの縦軸
は、図１(b) に示すスペクトルの複素強度Ａを実効強度
Ｅに変換したものであり、各ノートナンバーＮの位置に
おける強度を示している。一般に、フーリエ変換によっ
て得られる複素強度Ａは、実数部Ｒと虚数部Ｉとによっ
て表されるが、実効強度Ｅは、Ｅ＝（Ｒ^２＋Ｉ^２）
^１／２なる演算によって求めることができる。

【００３０】こうして求められた単位区間ｄ１の強度グ
ラフは、単位区間ｄ１の音響信号に含まれる振動成分に
ついて、ノートナンバーＮ＝０〜１２７に相当する各振
動成分の割合を実効強度として示すグラフということが
できる。そこで、この強度グラフに示されている各実効
強度に基いて、全Ｑ個（この例ではＱ＝１２８）のノー
トナンバーの中からＰ個のノートナンバーを選択し、こ
のＰ個のノートナンバーＮを、単位区間ｄ１を代表する
代表符号コードとして抽出する。ここでは、説明の便宜
上、Ｐ＝３として、全１２８個の候補の中から３個のノ
ートナンバーを代表符号コードとして抽出する場合を示
すことにする。たとえば、「候補の中から強度の大きい
順にＰ個の符号コードを抽出する」という基準に基いて
抽出を行えば、図１(c) に示す例では、第１番目の代表
符号コードとしてノートナンバーＮｐ（ｄ１，１）が、
第２番目の代表符号コードとしてノートナンバーＮｐ
（ｄ１，２）が、第３番目の代表符号コードとしてノー
トナンバーＮｐ（ｄ１，３）が、それぞれ抽出されるこ
とになる。

【００３１】このようにして、Ｐ個の代表符号コードが
抽出されたら、これらの代表符号コードとその実効強度
によって、単位区間ｄ１の音響信号を表現することがで
きる。たとえば、上述の例の場合、図１(c) に示す強度
グラフにおいて、ノートナンバーＮｐ（ｄ１，１）、Ｎ
ｐ（ｄ１，２）、Ｎｐ（ｄ１，３）の実効強度がそれぞ
れＥｐ（ｄ１，１）、Ｅｐ（ｄ１，２）、Ｅｐ（ｄ１，
３）であったとすれば、以下に示す３組のデータ対によ
って、単位区間ｄ１の音響信号を表現することができ
る。

【００３２】Ｎｐ（ｄ１，１），Ｅｐ（ｄ１，１）Ｎｐ（ｄ１，２），Ｅｐ（ｄ１，２）Ｎｐ（ｄ１，３），Ｅｐ（ｄ１，３）以上、単位区間ｄ１についての処理について説明した
が、単位区間ｄ２〜ｄ５についても、それぞれ別個に同
様の処理が行われ、代表符号コードおよびその強度を示
すデータが得られることになる。たとえば、単位区間ｄ
２については、Ｎｐ（ｄ２，１），Ｅｐ（ｄ２，１）Ｎｐ（ｄ２，２），Ｅｐ（ｄ２，２）Ｎｐ（ｄ２，３），Ｅｐ（ｄ２，３）なる３組のデータ対が得られる。このようにして各単位
区間ごとに得られたデータによって、原音響信号を符号
化することができる。

【００３３】図２は、上述の方法による符号化の概念図
である。図２(a) には、図１(a) と同様に、原音響信号
について５つの単位区間ｄ１〜ｄ５を設定した状態が示
されており、図２(b) には、各単位区間ごとに得られた
符号データが音符の形式で示されている。この例では、
個々の単位区間ごとに３個の代表符号コードを抽出して
おり（Ｐ＝３）、これら代表符号コードに関するデータ
を３つのトラックＴ１〜Ｔ３に分けて収容するようにし
ている。たとえば、単位区間ｄ１について抽出された代
表符号コードＮｐ（ｄ１，１），Ｎｐ（ｄ１，２），Ｎ
ｐ（ｄ１，３）は、それぞれトラックＴ１，Ｔ２，Ｔ３
に収容されている。もっとも、図２(b)は、本発明によ
って得られる符号データを音符の形式で示した概念図で
あり、実際には、各音符にはそれぞれ強度に関するデー
タが付加されている。たとえば、トラックＴ１には、ノ
ートナンバーＮｐ（ｄ１，１），Ｎｐ（ｄ２，１），Ｎ
ｐ（ｄ３，１）…なる音階を示すデータとともに、Ｅｐ
（ｄ１，１），Ｅｐ（ｄ２，１），Ｅｐ（ｄ３，１）…
なる強度を示すデータが収容されることになる。

【００３４】本発明における符号化の形式としては、必
ずしもＭＩＤＩ形式を採用する必要はないが、この種の
符号化形式としてはＭＩＤＩ形式が最も普及しているた
め、実用上はＭＩＤＩ形式の符号データを用いるのが最
も好ましい。ＭＩＤＩ形式では、「ノートオン」データ
もしくは「ノートオフ」データが、「デルタタイム」デ
ータを介在させながら存在する。「ノートオン」データ
は、特定のノートナンバーＮとベロシティーＶとを指定
して特定の音の演奏開始を指示するデータであり、「ノ
ートオフ」データは、特定のノートナンバーＮとベロシ
ティーＶとを指定して特定の音の演奏終了を指示するデ
ータである。また、「デルタタイム」データは、所定の
時間間隔を示すデータである。ベロシティーＶは、たと
えば、ピアノの鍵盤などを押し下げる速度（ノートオン
時のベロシティー）および鍵盤から指を離す速度（ノー
トオフ時のベロシティー）を示すパラメータであり、特
定の音の演奏開始操作もしくは演奏終了操作の強さを示
すことになる。

【００３５】本実施形態では、上述したように、第ｉ番
目の単位区間ｄｉについて、代表符号コードとしてＰ個
のノートナンバーＮｐ（ｄｉ，１），Ｎｐ（ｄｉ，
２），…，Ｎｐ（ｄｉ，Ｐ）が得られ、このそれぞれに
ついて実効強度Ｅｐ（ｄｉ，１），Ｅｐ（ｄｉ，２），
…，Ｅｐ（ｄｉ，Ｐ）が得られる。そこで本実施形態で
は、次のような手法により、ＭＩＤＩ形式の符号データ
を作成している。まず、「ノートオン」データもしくは
「ノートオフ」データの中で記述するノートナンバーＮ
としては、得られたノートナンバーＮｐ（ｄｉ，１），
Ｎｐ（ｄｉ，２），…，Ｎｐ（ｄｉ，Ｐ）をそのまま用
いている。一方、「ノートオン」データもしくは「ノー
トオフ」データの中で記述するベロシティーＶとして
は、得られた実効強度Ｅｐ（ｄｉ，１），Ｅｐ（ｄｉ，
２），…，Ｅｐ（ｄｉ，Ｐ）を、値が０〜１の範囲とな
るように規格化し、この規格化後の実効強度Ｅの平方根
に１２７を乗じた値を用いている。すなわち、実効強度
Ｅについての最大値をＥmax とした場合、Ｖ＝（Ｅ／Ｅmax ）^１／２・１２７なる演算で求まる値Ｖをベロシティーとして用いてい
る。あるいは対数をとって、Ｖ＝ｌｏｇ（Ｅ／Ｅmax ）・１２７＋１２７（ただし、Ｖ＜０の場合はＶ＝０とする）なる演算で求
まる値Ｖをベロシティーとして用いてもよい。また、
「デルタタイム」データは、各単位区間の長さに応じて
設定すればよい。

【００３６】結局、上述した実施形態では、３トラック
からなるＭＩＤＩ符号データが得られることになる。こ
のＭＩＤＩ符号データを所定のＭＩＤＩ音源を用いて再
生すれば、３チャンネルのステレオ再生音として原音響
信号が再生される。なお、ＭＩＤＩ符号データの再生機
能をもった一般的な装置は、８チャンネルあるいは１６
チャンネルのステレオ再生を行うことが可能であり、実
用上は、Ｐ＝８あるいはＰ＝１６に設定し、８トラック
あるいは１６トラックからなるＭＩＤＩ符号データを作
成するのが好ましい。

【００３７】上述した手順による符号化処理は、実際に
はコンピュータを用いて実行される。本発明による符号
化処理を実現するためのプログラムは、磁気ディスクや
光ディスクなどのコンピュータ読み取り可能な記録媒体
に記録して供給することができ、また、本発明による符
号化処理によって符号化された符号データは、同様に、
磁気ディスクや光ディスクなどのコンピュータ読み取り
可能な記録媒体に記録して供給することができる。

【００３８】§２．より実用的な区間設定方法これまで、本発明に係る音響信号の符号化方法の基本原
理を述べたが、以下、より実用的な符号化方法を述べ
る。ここでは、区間設定を行う上でのより実用的な手法
を説明する。図２(a) に示された例では、時間軸ｔ上に
等間隔に定義された６つの時刻ｔ１〜ｔ６を境界とし
て、５つの単位区間ｄ１〜ｄ５が設定されている。この
ような区間設定に基いて符号化を行った場合、再生時
に、境界となる時刻において音の不連続が発生しやす
い。したがって、実用上は、隣接する単位区間が時間軸
上で部分的に重複するような区間設定を行うのが好まし
い。

【００３９】図３(a) は、このように部分的に重複する
区間設定を行った例である。図示されている単位区間ｄ
１〜ｄ４は、いずれも部分的に重なっており、このよう
な区間設定に基いて前述の処理を行うと、図３(b) の概
念図に示されているような符号化が行われることにな
る。この例では、それぞれの単位区間の中心を基準位置
として、各音符をそれぞれの基準位置に配置している
が、単位区間に対する相対的な基準位置は、必ずしも中
心に設定する必要はない。図３(b) に示す概念図を図２
(b) に示す概念図と比較すると、音符の密度が高まって
いることがわかる。このように重複した区間設定を行う
と、作成される符号データの数は増加することになる
が、再生時に音の不連続が生じない自然な符号化が可能
になる。

【００４０】図４は、時間軸上で部分的に重複する区間
設定を行う具体的な手法を示す図である。この具体例で
は、音響信号を２２ｋＨｚのサンプリング周波数でサン
プリングすることによりデジタル音響データとして取り
込み、個々の単位区間の区間長Ｌを１０２４サンプル分
（約４７ｍｓｅｃ）に設定し、各単位区間ごとのずれ量
を示すオフセット長ΔＬを２０サンプル分（約０．９ｍ
ｓｅｃ）に設定したものである。すなわち、任意のｉに
対して、第ｉ番目の単位区間の始点と第（ｉ＋１）番目
の単位区間の始点との時間軸上での隔たりがオフセット
長ΔＬに設定されることになる。たとえば、第１番目の
単位区間ｄ１は、１〜１０２４番目のサンプルを含んで
おり、第２番目の単位区間ｄ２は、２０サンプル分ずれ
た２１〜１０４４番目のサンプルを含んでいることにな
る。

【００４１】このように、時間軸上で部分的に重複する
区間設定を行った場合、隣接する単位区間においてかな
りのサンプルが共通して用いられることになり、各単位
区間ごとに求めたスペクトルに有効な差が生じないこと
が予想される。たとえば、上述の例の場合、第１番目の
単位区間ｄ１と第２番目の単位区間ｄ２とを比較する
と、２１〜１０２４番目のサンプルは両単位区間で全く
共通して利用されており、両者の相違は、わずか２０サ
ンプル分に依存していることになる。このように、隣接
する単位区間のスペクトルに十分な差が得られないと、
変化の激しい音響信号に追従できず、結果的に時間分解
能が低下するという問題が生じることになる。このよう
な問題に対処するためには、わずか２０サンプル分の相
違により、フーリエ変換の入力側に大きな変化が生じる
ような対策を講じればよい。

【００４２】そこで、本願発明者は、§１で言及した窓
関数に対して、変化する２０サンプル分を強調するよう
な細工を施すことを考案した。前述した周知のハニング
窓は、むしろ隣接区間の変動を抑える方向に働くため、
上述の問題に対処する観点からは逆効果である。そこ
で、区間両端の重みが減少するというハニング窓の特徴
を継承しつつ、２０サンプル分を強調するような関数を
考案し、実際に適用してみた。具体的には、単位区間の
区間長をＬ、オフセット長をΔＬとして、 α＝Ｌ／２−ΔＬ／２ β＝Ｌ／２＋ΔＬ／２なるα，βを定め、区間［α，β］で表される中央近傍
区間（単位区間の中央位置に定義された幅ΔＬの区間）
を定義し、ｋ＝１…αのときＨ（ｋ）＝０．５−０．５＊ｃｏｓ（πｋ／２α）ｋ＝α…βのときＨ（ｋ）＝０．５−０．５＊ｃｏｓ（π（ｋ−α）／ΔＬ＋π／２）ｋ＝β…ＬのときＨ（ｋ）＝０．５−０．５＊ｃｏｓ（π（ｋ−β）／２α＋３π／２）なる改良型窓関数Ｈ（ｋ）を用いるようにすればよい。
この改良型窓関数Ｈ（ｋ）は、半値幅がちょうどΔＬに
なるように狭幅に変形した分布関数であり、この関数を
用いて実験を行ったところ、十分な効果が確認できた。

【００４３】なお、上述した具体例のように、２２ｋＨ
ｚのサンプリング周波数でサンプリングを行い、単位区
間の区間長Ｌを１０２４サンプル分に設定した場合に
は、対数スケール変換により１２８種類のノートナンバ
ーのうち上半分に相当するデータしか連続的に得ること
ができず、低音部のデータがいわゆる歯抜け状態にな
り、全体的に高音に偏ったスペクトルになることが確認
できた。結局、１２８種類のノートナンバーすべてをカ
バーすることを考えると、区間長Ｌを８倍の８１９２サ
ンプル以上に設定する必要がある。しかしながら、区間
長Ｌを８倍にすると、各区間ごとの演算時間が６４倍に
なり、しかも前述した時間分解能の低下という問題を助
長することになり現実的ではない。

【００４４】そこで本願発明者は、同じ区間長で低音部
に焦点を当てたスペクトルを別途求め、この別途求めた
スペクトルを通常のスペクトルに合成する手法を考案し
た。低音部に焦点を当てたスペクトルは、次のような方
法で、通常のスペクトルと同一演算負荷で容易に求める
ことができる。たとえば、図１(b) において、区間長Ｌ
は同一にしたまま、サンプリング周波数を通常の１／８
であるＦｓ／８に設定すれば、Ｆｓ／８以下の周波数成
分が拡大されたスペクトルを求めることができる。この
処理は、音響信号のサンプル数を１／８に間引きして、
同一区間長のサンプルを取り出してフーリエ変換を行う
処理と等価である（区間長の時間軸のスケールは８倍に
なっている）。幸いなことに、既に離散データになって
いる音響信号のサンプリング周波数を上げるのは困難で
あるが、逆に下げるのは容易である。こうして得られた
１／８間引きスペクトルを通常のスペクトルに合成する
ことにより、ノートナンバー２４以上をすべてカバーで
きることが確認できた（ノートナンバー２４は、ピアノ
の最低音であり、これ以下の音は、通常の楽器で再生す
ることができないため、実用上は不要である。）。しか
も、この手法による演算負荷は、１０２４サンプル分の
フーリエ変換をたかだか２回行う程度ですむ。

【００４５】なお、強度グラフの横軸に定義された１２
８種類のノートナンバーのそれぞれについての実効強度
Ｅを求めるには、たとえば、各ノートナンバーＮに所定
の周波数レンジを割り当て、割り当てられたレンジ内の
各周波数の実効強度の平均値を、当該ノートナンバーＮ
の実効強度とすればよい。図５は、このような手法で実
効強度を求める概念を示すグラフである。まず、フーリ
エ変換によって得られたスペクトルの横軸を対数尺度に
変換し、縦軸を実効強度に変換すれば、図５に示すよう
なグラフが得られる。横軸上に示された周波数値２５
９，２８０，２９１，…は、それぞれノートナンバーＮ
＝６０，６１，６２，…に対応する周波数である。ここ
で、たとえば、ノートナンバーＮ＝６１についての実効
強度を求めるには、周波数値２８０の近傍の所定の周波
数レンジ（図にハッチングを施した領域）を、ノートナ
ンバーＮ＝６１に割り当て、このレンジ内の各周波数の
実効強度の最大値を、ノートナンバーＮ＝６１について
の実効強度とすればよい。

【００４６】§３．符号コードの統合処理上述の§２で述べたように、部分的に重複する区間設定
を行った場合、作成される符号コードの数はかなり増え
ることになる。ここでは、最終的に作成される符号コー
ドの数をできるだけ削減するために効果的な統合処理を
説明する。

【００４７】たとえば、図６(a) に示すような音符で示
される符号コードが作成された場合を考える。図示の例
では、すべての符号コードが八分音符から構成されてい
る。これは、区間長Ｌが一定であるため、作成される個
々の符号コードも同一の長さになるためである。しかし
ながら、この図６(a) に示す音符群は、図６(b) に示す
ように書き直すことができる。すなわち、同じ音階を示
す音符が複数連続して配置されていた場合には、この複
数の音符を１つの音符に統合することができる。別言す
れば、複数の単位区間に跨がった音符によって、個々の
単位区間ごとの音符を置換することができる。

【００４８】この図６に示す例では、同じ音階の音符の
みを統合したが、統合対象となる音符は、必ずしも同じ
音階の音符に限定されるものではなく、ある程度の類似
性をもった音符を統合対象としてかまわない。たとえ
ば、互いに１音階の差しかない一連の音符を統合対象と
して、１つの音符に置換することもできる。この場合
は、たとえば、一連の音符の中で音階の低い方の音符に
よって置換すればよい。一般的に拡張すれば、隣接する
複数の単位区間について、所定の条件下で互いに類似す
る代表符号コードがある場合、これら類似する代表符号
コードを、複数の単位区間に跨がった統合符号コードに
置換することにより、音符数を削減することが可能にな
る。

【００４９】なお、図６では、音符を統合する例につい
て、符号コードの統合処理の概念を説明したが、本発明
に係る符号化処理によって作成される符号コードには、
それぞれ強度を示すデータ（ＭＩＤＩデータの場合はベ
ロシティー）が付加されている。したがって、符号コー
ドを統合した場合、強度を示すデータも統合する必要が
ある。ここで、統合対象となる符号コードに、それぞれ
異なる強度データが定義されていた場合には、たとえ
ば、最も大きな強度データを統合後の符号コードについ
ての強度データと定めるようにすればよい。ただ、ＭＩ
ＤＩデータの場合、２つの符号コードを統合する際に、
先行する符号コードの強度に比べて、後続する符号コー
ドの強度がかなり大きい場合、これら２つの符号コード
を統合すると不自然になる。これは、通常のＭＩＤＩ音
源の再生音は、楽器の演奏音から構成されており、音の
強度が時間とともに減衰してゆくのが一般的だからであ
る。したがって、先行する符号コードの強度に比べて、
後続する符号コードの強度が小さい場合には、１つの統
合符号コードに置換しても不自然さは生じないが、逆の
場合には、不自然さが生じることになる。そこで、２つ
の符号コードの強度差が所定の基準以上であり、かつ、
先行する符号コードの強度に比べて、後続する符号コー
ドの強度が大きい場合には、統合を行わない、というよ
うな条件を設定しておくのが好ましい。

【００５０】上述のように、符号コードの統合処理が行
われると、符号コードの数を低減させるメリットが得ら
れるので、できる限り統合処理が促進されるような配慮
を行うのが望ましい。このような配慮を行うための最も
効果的な手法は、符号コードを周波数に基いてソートし
てから各トラックに収容する手法である。図６(a) に示
した音符群は、同一のトラック上に収容された符号コー
ドである。統合処理の対象となる音符は、通常、同一の
トラック上に収容されている必要がある。ところが、実
際には、図２(b) に示すように、複数Ｐ個のトラック
（図２(b) の例では、Ｐ＝３）が定義され、各単位区間
ごとに抽出されたＰ個の符号コードは、このＰ個のトラ
ックにそれぞれ分けて収容されることになり、統合対象
となる音符が出現する確率は、各トラックへの分離処理
の方法に大きく依存する。たとえば、図２(b) に示すよ
うに、３つの符号データを３個のトラックＴ１，Ｔ２，
Ｔ３に分離する場合、３つのうち最も周波数の低いもの
をトラックＴ１へ、次に周波数の低いものをトラックＴ
２へ、最も周波数の高いものをトラックＴ３へ、それぞ
れ収容するように分離方法を決めておけば、周波数に全
く無関係に分離した場合に比べて、統合対象となる音符
が出現する確率は向上すると考えられる。

【００５１】結局、各単位区間ごとに抽出されるＰ個の
符号コードを、それぞれＰ個のトラックに分離して収容
する際に、抽出されたＰ個の符号コードを周波数に基い
てソートしてから各トラックに収容するようにすれば、
統合対象となる符号コードを増加させることができる。
図７は、Ｐ＝８の場合についての周波数ソート例を示す
概念図である。Ｐ＝８の場合、ある単位区間ｄ１につい
ての代表符号コードとして、８個のノートナンバーＮｐ
（ｄ１，１）〜Ｎｐ（ｄ１，８）が抽出されることにな
る。この抽出処理では、８個のノートナンバーは、たと
えば、実効強度の大きさの順に順次抽出されることにな
り、実効強度の大きさの順にソートされた状態になって
いる（図７の左列）。これを、周波数でソートすれば、
たとえば、図７の中列のように順序が入れ替わる。こう
してソートされたノートナンバーを、図７の右列に示す
ように、８個のトラックＴ１〜Ｔ８に収容するようにす
れば、たとえば、８個のノートナンバーの中で最も周波
数の低い（ナンバーの小さい）ノートナンバーは常にト
ラックＴ１に収容され、最も周波数の高い（ナンバーの
大きい）ノートナンバーは常にトラックＴ８に収容され
るようになる。その結果、いずれのトラックにおいて
も、統合対象となるノートナンバーの出現頻度が向上す
ることになる。

【００５２】§４．代表符号コードの抽出方法図１(c) に示す例では、単位区間ｄ１の強度グラフにお
いて、横軸上に定義された１２８個のノートナンバーの
中から、３つのノートナンバーＮｐ（ｄ１，１），Ｎｐ
（ｄ１，２），Ｎｐ（ｄ１，３）が代表符号コードとし
て抽出され、抽出された各代表符号コードは、３つのト
ラックＴ１，Ｔ２，Ｔ３にそれぞれ分離して収容される
ことになる。一般的に、Ｐ個のトラックＴ１〜ＴＰを用
意した場合、Ｐ個のノートナンバーＮｐ（ｄ１，１），
Ｎｐ（ｄ１，２），…，Ｎｐ（ｄ１，Ｐ）を代表符号コ
ードとして抽出する必要がある。ここでは、この代表符
号コードを抽出する方法として、具体的な５つの方法を
述べることにする。

【００５３】＜＜＜４．１第１の抽出方法＞＞＞第
１の方法は、符号化対象となる強度グラフにおける候補
の中から強度の大きい順にＰ個の符号コードを抽出し
て、これを代表符号コードとする方法である。図１(c)
に示された３つのノートナンバーＮｐ（ｄ１，１），Ｎ
ｐ（ｄ１，２），Ｎｐ（ｄ１，３）は、この第１の方法
に基いて抽出されている。すなわち、図１(c) に示す強
度グラフにおいて、実効強度Ｅの最も大きなノートナン
バーＮｐ（ｄ１，１）が第１代表符号コードとして抽出
され、実効強度Ｅが２番目に大きなノートナンバーＮｐ
（ｄ１，２）が第２代表符号コードとして抽出され、実
効強度Ｅが３番目に大きなノートナンバーＮｐ（ｄ１，
３）が第３代表符号コードとして抽出されることにな
る。

【００５４】図８は、この第１の方法の原理を説明する
図である。ここでは、説明の便宜上、５つのノートナン
バーＮａ，Ｎｂ，Ｎｃ，Ｎｄ，Ｎｅについて、それぞれ
図８(a) に示すような実効強度が定義され、他のノート
ナンバーについては、いずれも実効強度が零である単純
な場合を考える（実際には、１２８個のノートナンバー
すべてが、いくらかの実効強度値をもつのが一般的であ
る）。第１の方法によれば、この５つの候補の中で、実
効強度が最も大きなノートナンバーＮｂが第１代表符号
コードとして抽出される。こうして抽出されたノートナ
ンバーは、候補から削除される。図８に示す例では、第
１代表符号コードとして抽出されたノートナンバーＮｂ
が候補から削除されることになる。図８(b) には、候補
から削除されたノートナンバーＮｂのグラフが破線で示
されている。続いて、図８(b) に実線グラフで示されて
いる残りの４候補の中で最も実効強度が大きなノートナ
ンバーＮｃが第２代表符号コードとして抽出され、候補
から削除されることになる。このような処理を第Ｐ代表
符号コードが抽出されるまで繰り返し実行すればよい。

【００５５】もともと、各単位区間ごとに抽出された代
表符号コードは、当該単位区間内の原音響信号に含まれ
ている代表的な周波数成分を示すためのものであるか
ら、原理的には、実効強度の大きい順にＰ個の代表符号
コードを抽出するという第１の方法は、最も適当な方法
のように見える。しかしながら、この第１の抽出方法を
用いて実際に符号化を行った結果、再生時に全体的に音
程が高音側にシフトするという現象が確認できた。たと
えば、男性の話声を原音響信号として、この第１の抽出
方法を用いた符号化を行い、得られた符号データを、一
般のＭＩＤＩ音源を用いて再生した場合、もとの男性の
話声にくらべてやや甲高い女性の話声に近い再生音が得
られた。

【００５６】本願発明者は、このような現象が生じる理
由は、ＭＩＤＩ音源に利用される楽器音などが、倍音成
分（基本成分の整数倍の周波数をもった成分）を含んで
いるためであると考えている。たとえば、ピアノの鍵盤
中央の「ラ音（Ａ３音）」の基本周波数成分は４４０Ｈ
ｚであるが、実際にこの「ラ音（Ａ３音）」の鍵盤を弾
いてみると、基本周波数成分である４４０Ｈｚの音とと
もに、その２倍の周波数成分８８０Ｈｚの音（１オクタ
ーブ上のラ音（Ａ４音））や、３倍、４倍、…の周波数
成分の音（倍音成分）が混在していることがわかる。し
たがって、たとえば、代表符号コードとして、ノートナ
ンバーＮ＝６９（Ａ３音）を抽出した場合、再生時に
は、このノートナンバーＮ＝６９の基本周波数成分であ
る４４０Ｈｚの音の他に、８８０Ｈｚ，１３２０Ｈｚ，
…などの倍音成分の音が混在することになる。したがっ
て、この第１の抽出方法によって、実効強度の大きい順
にＰ個の代表符号コードを抽出すると、ＭＩＤＩ音源を
用いた再生時には、各代表符号コードの基本周波数成分
の音に、これらの倍音成分の音が加わることになり、全
体的に高音側の強度が高められた状態で再生が行われる
ことになる。再生時に音程が全体的に高音側にシフトす
るという現象は、このような理由により発生すると思わ
れる。

【００５７】本願発明者は、このような理由に着目し、
再生時に音程が全体的に高音側にシフトするという現象
を抑えるための代表符号コードの抽出方法を想到するに
至った。以下に述べる各抽出方法は、いずれもこのよう
な着想に基く方法である。

【００５８】＜＜＜４．２第２の抽出方法＞＞＞第
２の方法は、符号化対象となる強度グラフにおけるその
時点での候補の中から最も強度の大きい符号コードを第
ｉ番目の代表符号コードとして抽出した後、この第ｉ番
目の代表符号コードおよびその倍音成分に相当する符号
コードを候補から削除する処理を、ｉ＝１〜（Ｐ−１）
について繰り返し実行し、最後に、残った候補の中から
最も強度の大きい符号コードを第Ｐ番目の代表符号コー
ドとして抽出することにより、合計Ｐ個の代表符号コー
ドの抽出を行う方法である。

【００５９】たとえば、図９(a) に示すように、５つの
ノートナンバーＮａ，Ｎｂ，Ｎｃ，Ｎｄ，Ｎｅについ
て、それぞれ図のような実効強度が定義されている場合
を考える。まず、ｉ＝１として、候補の中からこの時点
で最も強度の大きい符号コードであるノートナンバーＮ
ｂが、第１代表符号コードとして抽出される。続いて、
この抽出されたノートナンバーＮｂおよびその倍音成分
に相当する符号コードが候補から削除される。たとえ
ば、ノートナンバーＮｃがノートナンバーＮｂの倍音成
分であったとすると、図９(b) に破線で示すように、既
に抽出されたノートナンバーＮｂとともに、その倍音成
分であるノートナンバーＮｃが候補から削除される。図
９(b) では、候補から削除されたノートナンバーＮｂ，
Ｎｃのグラフが破線で示されている。続いて、ｉ＝２へ
の更新が行われ、残った候補の中から最も強度の大きい
符号コードであるノートナンバーＮａが、第２代表符号
コードとして抽出される。そして、この抽出されたノー
トナンバーＮａおよびその倍音成分に相当する符号コー
ドが候補から削除される。

【００６０】このような処理を、ｉ＝３，ｉ＝４，…と
更新しながら、ｉ＝Ｐ−１まで実行すれば、（Ｐ−１）
番目の代表符号コードまでの抽出が完了する。最後に、
残った候補の中から最も強度の大きい符号コードを第Ｐ
番目の代表符号コードとして抽出すれば、合計Ｐ個の代
表符号コードを抽出することができる。

【００６１】この第２の抽出方法では、１つの代表符号
コードが抽出されると、その倍音成分に相当する符号コ
ードが候補から削除されるため、最終的に抽出されたＰ
個の代表符号コードの中には、互いに倍音関係にある符
号コードが含まれないことになる。したがって、再生時
に倍音成分が強調されて甲高い音になる現象を緩和する
ことができる。ただ、この第２の抽出方法では、再生音
が甲高い音になる現象を完全に抑制することはできな
い。その理由は、一般的なＭＩＤＩ音源には、本来の基
本周波数成分の強度よりも、倍音成分の強度の方が大き
い音が含まれているためと考えられる。

【００６２】図１０は、一般的なピアノのＭＩＤＩ音源
について、ノートナンバーＮ＝２４〜８４に含まれるピ
ーク周波数を測定した結果を示す図表である。たとえ
ば、ノートナンバーＮ＝２４は、本来は「Ｃ０音」の音
階に相当する音であるが、この音をＭＩＤＩ音源で再生
した際の再生音に含まれる周波数成分を調べると、ピー
ク周波数が１２９Ｈｚという本来の音階の基本周波数よ
りも高い結果が得られている。この図表の「対応する音
階」欄に示された音階は、このピーク周波数に対応する
音階を示しており、ノートナンバーＮ＝２４の場合、対
応する音階は「Ｃ２」音になっている。別言すれば、
「Ｃ０音」を本来の音階とするノートナンバーＮ＝２４
の音を再生すると、実際には、「Ｃ０音」に対応する基
本周波数の強度よりも、その４倍音成分である「Ｃ２
音」に対応する周波数（１２９Ｈｚ）の強度の方が大き
いことがわかる。このような傾向は、主に、ノートナン
バーＮ＝５７以下の音についてみられる。すなわち、ノ
ートナンバーＮ＝５７以下の音のうち、Ｎ＝４１，４
５，４６，４８，４９，５２，５４，５６については、
それぞれ基本周波数の強度が最も大きく、本来の音階と
ピーク周波数に対応する音階とが一致しているが、それ
以外の音ではいずれも基本周波数の強度よりも倍音成分
の強度の方が大きくなっており、ピーク周波数に対応す
る音階が本来の音階に一致していない。なお、ノートナ
ンバーＮ＝５８以上の音については、いずれも基本周波
数の強度が最も大きく、本来の音階とピーク周波数に対
応する音階とが一致している。

【００６３】このような特性があると、この第２の抽出
方法では、再生時に音程が全体的に高音側にシフトする
という現象を完全に抑制することはできない。すなわ
ち、ノートナンバーＮ＝５７以下の音が代表符号コード
として抽出された場合、これらの本来の音階の強度より
も倍音成分の強度の方が大きくなるため、依然として、
再生時には高音側が強調されることになる。

【００６４】＜＜＜４．３第３の抽出方法＞＞＞第
３の抽出方法は、図１０に示すような特性を考慮した方
法である。すなわち、予め、各符号コードに基いて音を
再生するために用いる音源を特定しておき、この特定の
音源を用いた各符号コードの再生音の周波数特性（たと
えば、図１０に示すような特性）を求めておく。そし
て、求めた周波数特性に基いて、所定の補正テーブルを
定義する。具体的には、特定のノートナンバーの音を、
それより低いノートナンバーの音で代用するような補正
テーブルを定義すればよい。たとえば、図１０に示す周
波数特性をもった音源を用いて再生を行う場合であれ
ば、ノートナンバーＮ＝４８（Ｃ２音）の音は、それよ
り低いノートナンバーＮ＝２４（Ｃ０音）で代用するこ
とができる。なぜなら、ノートナンバーＮ＝２４の音を
再生した場合、本来の音階である「Ｃ０音」の強度より
も、倍音成分である「Ｃ２音」の強度の方が大きいから
である。

【００６５】このように低い音で代用することが可能な
ノートナンバーについては、それぞれ代用対象となるノ
ートナンバーを予め定めておき、代用対象に置換する旨
の補正指示を補正テーブルの形で用意しておけばよい。
代表符号コードの抽出時には、この補正テーブルを参照
しながら、実際に抽出する符号コードを補正するように
する。たとえば、本来であれば、その時点で強度の最も
大きいノートナンバーＮ＝４８（Ｃ２音）の音を抽出す
べき場合でも、ノートナンバーＮ＝４８（Ｃ２音）をノ
ートナンバーＮ＝２４（Ｃ０音）に補正する旨の指示が
補正テーブルにあれば、ノートナンバーＮ＝２４（Ｃ０
音）を代表符号コードとして抽出すればよい。

【００６６】結局、符号化対象となる強度グラフにおけ
るその時点での候補の中から最も強度の大きい符号コー
ドを第ｉ番目の参照コードとし、この第ｉ番目の参照コ
ードに、用意した補正テーブルを適用することにより得
られる符号コードを第ｉ番目の代表符号コードとして抽
出し、第ｉ番目の参照コードおよび第ｉ番目の代表符号
コードの双方を候補から除外する処理を、ｉ＝１〜Ｐに
ついて繰り返し実行し、合計Ｐ個の代表符号コードの抽
出を行うようにすればよい。

【００６７】たとえば、図１１(a) に示すように、５つ
のノートナンバーＮａ，Ｎｂ，Ｎｃ，Ｎｄ，Ｎｅについ
て、それぞれ図のような実効強度が定義されている場合
を考える。まず、ｉ＝１として、候補の中からこの時点
で最も強度の大きい符号コードであるノートナンバーＮ
ｂが、第１参照コードとして抽出される。続いて、この
第１参照コードに、用意した補正テーブルを適用する。
たとえば、補正テーブルに、ノートナンバーＮｂをノー
トナンバーＮｂ^＊に補正する旨の指示があったとすれ
ば、図１１(b) に示すように、補正後のノートナンバー
Ｎｂ^＊が第１代表符号コードとして抽出されることにな
る。このとき、第１参照コードであるノートナンバーＮ
ｂと補正後のノートナンバーＮｂ^＊は候補から除外され
る。図１１(c) では、候補から除外されたノートナンバ
ーＮｂのグラフが破線で示されている（Ｎｂ^＊はもとも
と強度成分が０に近いため図示されていない）。

【００６８】続いて、ｉ＝２への更新が行われ、図１１
(c) に示すように、残った候補の中から最も強度の大き
い符号コードであるノートナンバーＮｃが、第２参照コ
ードとして抽出される。そして、この第２参照コード
に、用意した補正テーブルを適用する。たとえば、補正
テーブルに、ノートナンバーＮｃをノートナンバーＮｃ
^＊に補正する旨の指示があったとすれば、図１１(d) に
示すように、補正後のノートナンバーＮｃ^＊が第２代表
符号コードとして抽出されることになる。このとき、第
２参照コードであるノートナンバーＮｃは候補から除外
される。このような処理を、ｉ＝３，ｉ＝４，…と更新
しながら、ｉ＝Ｐまで実行すれば、Ｐ番目の代表符号コ
ードまでの抽出が完了する。

【００６９】この第３の抽出方法を行う際には、補正テ
ーブルの作成方法が重要である。用いる補正テーブルが
不適当であると、補正により音程が大きく外れてしまう
結果を招くことになる。なお、用意すべき補正テーブル
は、厳密に言えば、再生時に用いる音源に依存すること
になるが、一般的なＭＩＤＩ音源はいずれも類似した周
波数特性を有することが多いため、特定の音源について
用意した補正テーブルは、別な音源を用いる場合にも、
ある程度の汎用性をもって利用することができる。

【００７０】本願発明者が行った実験によれば、この第
３の抽出方法を行うことにより、再生時の音程が全体的
に高音側にシフトするという現象をある程度低減させる
ことができるが、この現象をより効果的に抑制するため
には、前述した第２の抽出方法とこの第３の抽出方法を
組み合わせて用いるのが好ましい。すなわち、図１１
(b) に示すように、第１代表符号コードとしてノートナ
ンバーＮｂ^＊を抽出した後、第１参照コードであるノー
トナンバーＮｂとともに、その倍音成分を候補から削除
するようにする。たとえば、ノートナンバーＮｃがノー
トナンバーＮｂの倍音成分であったとすると、図１１
(e) に破線で示すように、ノートナンバーＮｂ，Ｎｃが
ともに候補から削除されることになり、第２参照コード
としては、ノートナンバーＮａが抽出されることにな
る。そして、この第２参照コードに、用意した補正テー
ブルを適用した結果、補正テーブルに、ノートナンバー
ＮａをノートナンバーＮａ^＊に補正する旨の指示があっ
たとすれば、図１１(f) に示すように、補正後のノート
ナンバーＮａ^＊が第２代表符号コードとして抽出される
ことになる。このとき、第２参照コードであるノートナ
ンバーＮａとその倍音成分が候補から削除される。この
ような処理を、ｉ＝３，ｉ＝４，…と更新しながら、ｉ
＝Ｐまで実行すれば、Ｐ番目の代表符号コードまでの抽
出が完了する。

【００７１】＜＜＜４．４第４の抽出方法＞＞＞第
４の抽出方法では、音を再生するために用いる音源を予
め特定しておき、この音源を用いて各符号コードを実際
に再生することにより得られる音響信号の波形を実測し
ておく。そして、この音響信号の波形に対して、§１で
述べたスペクトル作成段階および強度グラフ作成段階を
実行し、各符号コードについての強度グラフを予め求め
ておく。すなわち、ノートナンバーＮ＝０〜１２７の１
２８通りの音を、実際のＭＩＤＩ音源を用いて再生し、
この再生波形に対して、図１(b) に示すようなスペクト
ルを求め（たとえば、§１で述べた単位区間と同一長さ
の区間を代表区間として設定し、この代表区間について
のスペクトルを求める。このとき、代表区間の設定は、
できるだけ信号の立ち上がりまたは立ち下がり部分を避
けて設定する。あるいは適当な複数区間についての平均
スペクトルを求めてもよい。）、更に、図１(c) に示す
ような強度グラフ（ここでは、各符号コード（ノートナ
ンバー）についての固有強度グラフと呼ぶ）を求めてお
く。結局、ノートナンバーＮ＝０〜１２７について、１
２８通りの固有強度グラフが得られることになる。以上
が、この第４の抽出方法の準備段階となる。

【００７２】実際に符号化対象となる音響信号を符号化
する段階では、次のような方法で、代表符号コードの抽
出が行われる。すなわち、符号化対象となる強度グラフ
におけるその時点での候補の中から最も強度の大きい符
号コードを第ｉ番目の代表符号コードとして抽出した
後、符号化対象となる強度グラフの各強度値からこの第
ｉ番目の代表符号コードについての固有強度グラフの各
強度値を減算する処理を、ｉ＝１〜（Ｐ−１）について
繰り返し実行し、更に、残った候補の中から最も強度の
大きい符号コードを第Ｐ番目の代表符号コードとして抽
出することにより、合計Ｐ個の代表符号コードの抽出を
行う。

【００７３】たとえば、図１２(a) に示すように、５つ
のノートナンバーＮａ，Ｎｂ，Ｎｃ，Ｎｄ，Ｎｅについ
て、それぞれ図のような実効強度が定義されている場合
を考える。まず、ｉ＝１として、候補の中からこの時点
で最も強度の大きい符号コードであるノートナンバーＮ
ｂが、第１代表符号コードとして抽出される。このノー
トナンバーＮｂについては、上述した準備段階におい
て、固有強度グラフが求められている。たとえば、特定
のＭＩＤＩ音源を用いて、このノートナンバーＮｂを再
生した場合に、図１２(b) に示すような再生信号波形が
得られる場合、この再生信号波形に対して、§１で述べ
たスペクトル作成段階および強度グラフ作成段階を実行
することにより、図１２(c) に示すようなノートナンバ
ーＮｂの固有強度グラフが用意されていることになる。
そこで、図１２(a) に示す符号化対象となる強度グラフ
の各強度値からこのノートナンバーＮｂについての固有
強度グラフの各強度値を減算する処理を行う。図１２
(d) は減算の結果を示すグラフである。図に破線で示し
た部分が、減算によって削除された部分である。結局、
減算の結果、この時点における「符号化対象となる強度
グラフ」は、図１２(e)のようなグラフになる。

【００７４】続いて、ｉ＝２への更新が行われ、図１２
(e) に示すように、残った候補の中から最も強度の大き
い符号コードであるノートナンバーＮａが、第２代表符
号コードとして抽出される。そして、この時点における
「符号化対象となる強度グラフ」である図１２(e) のグ
ラフの各強度値から、ノートナンバーＮａについての固
有強度グラフ（図示されていない）の各強度値を減算す
る処理を行い、この減算の結果得られたグラフが、新た
な「符号化対象となる強度グラフ」となる。

【００７５】このような処理を、ｉ＝３，ｉ＝４，…と
更新しながら、ｉ＝Ｐ−１まで実行すれば、（Ｐ−１）
番目の代表符号コードまでの抽出が完了する。最後に、
残った候補の中から最も強度の大きい符号コードを第Ｐ
番目の代表符号コードとして抽出すれば、合計Ｐ個の代
表符号コードを抽出することができる。

【００７６】この第４の抽出方法は、再生時に利用する
音源の特性に大きく依存するため、予め再生に利用する
予定の音源が特定できている場合の利用に適している。
１つの代表符号コードを抽出するたびに、その代表符号
コードについての実際の再生音に含まれる周波数成分を
減じてゆく手法を採っているため、極めて忠実な再生が
可能になる。

【００７７】なお、上述の例では、得られた固有強度グ
ラフの強度値をそのまま減じているが、固有強度グラフ
の強度値について規格化を行った上で、減算を行うよう
にしてもよい。たとえば、図１２(a) に示す「符号化対
象となる強度グラフ」における代表符号コードとして抽
出されたノートナンバーＮｂの強度値をＸとし、図１２
(c) の固有強度グラフにおける同じノートナンバーＮｂ
の強度値をＹとした場合、後者の固有強度グラフの各強
度値をＸ／Ｙ倍してから減算を行うようにすると、減算
結果として得られる新たな「符号化対象となる強度グラ
フ」におけるノートナンバーＮｂの強度値を零にするこ
とができ、同じノートナンバーＮｂが繰り返し代表符号
コードとして抽出されることを防ぐことができる。

【００７８】＜＜＜４．５第５の抽出方法＞＞＞第
５の抽出方法では、上述した第４の抽出方法と同様に、
準備段階として、音を再生するために用いる音源を予め
特定しておき、この音源を用いて各符号コードを実際に
再生することにより得られる音響信号の波形を実測して
おく。ただし、この第５の抽出方法では、この実測した
波形自体を保存しておき、後の処理の減算に用いるよう
にする。具体的には、ノートナンバーＮ＝０〜１２７の
１２８通りの音を、実際のＭＩＤＩ音源を用いて再生
し、この１２８通りの再生波形をそのまま保存しておく
ことになる。ここでは、これら各ノートナンバーについ
ての再生波形を、各符号コードについての固有波形と呼
ぶことにする。

【００７９】実際に符号化対象となる音響信号を符号化
する場合、次のような「符号抽出処理」を定義し、この
「符号抽出処理」を繰り返し実行することになる。すな
わち、ここで定義される「符号抽出処理」とは、「第ｉ
番目の代表符号コードを決定するために、第ｉ番目の音
響信号の波形情報を入力し、入力した波形情報に対し
て、§１で述べたスペクトル作成段階および強度グラフ
作成段階を行い、続く符号化段階で、作成された強度グ
ラフにおける候補の中から最も強度の大きい符号コード
を第ｉ番目の代表符号コードとして抽出し、更に、第ｉ
番目の音響信号の強度値から前記第ｉ番目の代表符号コ
ードについての固有波形の各強度値を減算し、その結果
得られる音響信号を第（ｉ＋１）番目の音響信号とする
処理」である。

【００８０】この第５の抽出方法では、まず、符号化対
象となる原音響信号に対して区間設定処理を施し、時間
軸上に複数の単位区間を設定する。そして、各単位区間
ごとの音響信号をそれぞれ第１番目の音響信号として、
上述した「符号抽出処理」を、各単位区間のそれぞれご
とに、ｉ＝１〜（Ｐ−１）について繰り返し実行し、最
後に、第Ｐ番目の音響信号の波形情報を入力し、入力し
た波形情報に対して、§１で述べたスペクトル作成段階
および強度グラフ作成段階を行い、続く符号化段階で、
作成された強度グラフにおける候補の中から最も強度の
大きい符号コードを第Ｐ番目の代表符号コードとして抽
出すれば、各単位区間ごとにそれぞれ合計Ｐ個の代表符
号コードの抽出を行うことができる。以上が、第５の抽
出方法の基本手順である。以下、この基本手順を図１３
に示す具体例に即して説明する。

【００８１】まず、符号化対象となる原音響信号に対し
て、区間設定段階が行われ、各単位区間ごとの原音響信
号が、それぞれ第１番目の音響信号となる。以下の処理
は、それぞれ各単位ごとに行われることになる。まず、
ｉ＝１に設定され、第１回目の「符号抽出処理」が実行
される。ここでは、ある単位区間ｄについての第１番目
の音響信号として、図１３(a) に示すような波形をもっ
た信号が入力されたものとしよう。この信号は、単位区
間ｄについての原信号というべき信号である。続いて、
この図１３(a) に示す信号に対して、フーリエ変換を行
いスペクトルを求め、このスペクトルに基いて強度グラ
フを求める。ここでは、図１３(b) に示すような強度グ
ラフが得られたものとする。

【００８２】次に、この強度グラフにおいて、最も強度
の大きい符号コードであるノートナンバーＮｂが、第１
代表符号コードとして抽出される。その後、図１３(a)
に示す第１番目の音響信号の強度値から、図１３(c) に
示す第１代表符号コードについての固有波形（準備段階
で予め求めて保存してある）の各強度値を減算する。そ
の結果、たとえば、図１３(d) に示すような音響信号が
得られたとする。この図１３(d) に示す減算結果は、第
２番目の音響信号となる。

【００８３】続いて、ｉ＝２への更新が行われ、今度
は、図１３(d) に示す第２番目の音響信号に対してフー
リエ変換を行いスペクトルを求め、このスペクトルに基
いて強度グラフを求める。ここでは、図１３(e) に示す
ような強度グラフが得られたものとする。次に、この強
度グラフにおいて、最も強度の大きい符号コードである
ノートナンバーＮｃが、第２代表符号コードとして抽出
される。その後、図１３(d) に示す第２番目の音響信号
の強度値から、第２代表符号コードについての固有波形
（図示されていない）の各強度値を減算し、第３番目の
音響信号を求める。

【００８４】このような処理を、ｉ＝３，ｉ＝４，…と
更新しながら、ｉ＝Ｐ−１まで実行すれば、（Ｐ−１）
番目の代表符号コードまでの抽出が完了する。最後に、
残った候補の中から最も強度の大きい符号コードを第Ｐ
番目の代表符号コードとして抽出すれば、合計Ｐ個の代
表符号コードを抽出することができる。

【００８５】以上の処理を、各単位区間ごとに実行すれ
ば、各単位区間ごとに、それぞれＰ個の代表符号コード
を得ることができる。

【００８６】

【発明の効果】以上のとおり本発明に係る符号化方法に
よれば、音響信号に対して効率的な符号化を行うことが
できるようになる。

【図面の簡単な説明】

【図１】本発明に係る音響信号の符号化方法の基本原理
を示す図である。

【図２】図１(c) に示す強度グラフに基いて作成された
符号コードを示す図である。

【図３】時間軸上に部分的に重複するように単位区間設
定を行うことにより作成された符号コードを示す図であ
る。

【図４】時間軸上に部分的に重複するような単位区間設
定の具体例を示す図である。

【図５】周波数軸とノートナンバーとの対応関係を示す
グラフである。

【図６】単位区間の統合処理により符号データの量を削
減した例を示す図である。

【図７】複数のノートナンバーを周波数でソートしてか
らトラックに収容する概念を示す図である。

【図８】強度グラフに基いて代表符号コードを抽出する
第１の方法を示す図である。

【図９】強度グラフに基いて代表符号コードを抽出する
第２の方法を示す図である。

【図１０】ＭＩＤＩ音源で各ノートナンバーを再生した
場合の周波数特性を示す図表である。

【図１１】強度グラフに基いて代表符号コードを抽出す
る第３の方法を示す図である。

【図１２】強度グラフに基いて代表符号コードを抽出す
る第４の方法を示す図である。

【図１３】強度グラフに基いて代表符号コードを抽出す
る第５の方法を示す図である。

【符号の説明】

Ａ…複素強度ｄ１〜ｄ５…単位区間Ｅ…実効強度Ｆｓ…サンプリング周波数ｆ…周波数Ｌ…単位区間の区間長 ΔＬ…オフセット長Ｎ…ノートナンバーＮａ〜Ｎｅ…ノートナンバーＮａ^＊，Ｎｂ^＊，Ｎｃ^＊…補正により得られたノートナ
ンバーＮｐ（ｄｊ，ｉ）…単位区間ｄｊについて抽出された第
ｉ番目の代表符号コード（ノートナンバー）Ｅｐ（ｄｊ，ｉ）…代表符号コードＮｐ（ｄｊ，ｉ）の
実効強度Ｔ１〜Ｔ８…トラックｔ１〜ｔ６…時刻

Claims

【特許請求の範囲】

【請求項１】時系列の強度信号として与えられる音響
信号を符号化するための符号化方法であって、符号化対象となる音響信号の時間軸上に複数の単位区間
を設定する区間設定段階と、個々の単位区間ごとに、当該単位区間内の音響信号に含
まれる周波数成分を第１の軸に、各周波数成分ごとの強
度を第２の軸にとったスペクトルを作成するスペクトル
作成段階と、前記スペクトルの第１の軸に対応させて離散的に複数Ｑ
個の符号コードを定義し、この複数Ｑ個の符号コードを
第１の軸に、各符号コードごとの強度を第２の軸にとっ
た強度グラフを、個々の単位区間ごとのスペクトルに基
いてそれぞれ作成する強度グラフ作成段階と、前記強度グラフにおける各符号コードごとの強度に基い
て、個々の単位区間ごとに、Ｑ個の全符号コードの中か
ら当該単位区間を代表するＰ個の代表符号コードを抽出
し、これら抽出した代表符号コードおよびその強度によ
って、個々の単位区間の音響信号を表現する符号化段階
と、を有することを特徴とする音響信号の符号化方法。
【請求項２】請求項１に記載の符号化方法において、区間設定段階で、隣接する単位区間が時間軸上で部分的
に重複するような設定を行うことを特徴とする音響信号
の符号化方法。
【請求項３】請求項２に記載の符号化方法において、区間長Ｌおよびオフセット長ΔＬを定義し（ただし、Δ
Ｌ＜Ｌ）、各単位区間の時間軸上での長さを区間長Ｌに
設定し、任意のｉに対して第ｉ番目の単位区間の始点と
第（ｉ＋１）番目の単位区間の始点との時間軸上での隔
たりをオフセット長ΔＬに設定することを特徴とする音
響信号の符号化方法。
【請求項４】請求項１〜３のいずれかに記載の符号化
方法において、スペクトル作成段階で、符号化対象となる音響信号を所
定のサンプリング周期でサンプリングしてデジタル音響
データとして取り込み、この取り込んだ音響データに対
して各単位区間ごとにフーリエ変換を行うことによりス
ペクトルを作成することを特徴とする音響信号の符号化
方法。
【請求項５】請求項３に記載の符号化方法において、スペクトル作成段階で、オフセット長△Ｌに基づいて決
定される重み関数を窓関数として設定し、符号化対象と
なる音響信号の各単位区間に対して、前記窓関数を重畳
した上でフーリエ変換を行うことによりスペクトルを作
成することを特徴とする音響信号の符号化方法。
【請求項６】請求項４に記載の符号化方法において、スペクトル作成段階で、複数通りのサンプリング周期で
取り込まれた複数通りの音響データに対してそれぞれフ
ーリエ変換を行うことにより、複数通りのスペクトルを
用意し、これらのスペクトルを合成することを特徴とす
る音響信号の符号化方法。
【請求項７】請求項１〜６のいずれかに記載の符号化
方法において、強度グラフ作成段階で、複数Ｑ個の符号コードとしてＭ
ＩＤＩデータで利用されるノートナンバーを用い、符号化段階で、個々の単位区間の音響信号を、代表符号
コードとして抽出されたノートナンバーと、その強度に
基いて決定されたベロシティーと、当該単位区間の長さ
に基いて決定されたデルタタイムと、を示すデータから
なるＭＩＤＩ形式の符号データによって表現することを
特徴とする音響信号の符号化方法。
【請求項８】請求項１〜７のいずれかに記載の符号化
方法において、符号化段階で代表符号コードを抽出する際に、符号化対
象となる強度グラフにおける候補の中から強度の大きい
順にＰ個の符号コードを抽出して代表符号コードとする
ことを特徴とする音響信号の符号化方法。
【請求項９】請求項１〜７のいずれかに記載の符号化
方法において、符号化段階で代表符号コードを抽出する際に、符号化対
象となる強度グラフにおけるその時点での候補の中から
最も強度の大きい符号コードを第ｉ番目の代表符号コー
ドとして抽出した後、この第ｉ番目の代表符号コードお
よびその倍音成分に相当する符号コードを候補から削除
する処理を、ｉ＝１〜（Ｐ−１）について繰り返し実行
し、更に、残った候補の中から最も強度の大きい符号コ
ードを第Ｐ番目の代表符号コードとして抽出することに
より、合計Ｐ個の代表符号コードの抽出を行うことを特
徴とする音響信号の符号化方法。
【請求項１０】請求項１〜７のいずれかに記載の符号
化方法において、各符号コードに基いて音を再生するために用いる音源を
予め特定しておき、この音源を用いた各符号コードの再
生音の周波数特性に基いて補正テーブルを定義してお
き、符号化段階で代表符号コードを抽出する際に、符号化対
象となる強度グラフにおけるその時点での候補の中から
最も強度の大きい符号コードを第ｉ番目の参照コードと
し、この第ｉ番目の参照コードに前記補正テーブルを適
用することにより得られる符号コードを第ｉ番目の代表
符号コードとして抽出し、前記第ｉ番目の参照コードお
よび前記第ｉ番目の代表符号コードを候補から除外する
処理を、ｉ＝１〜Ｐについて繰り返し実行し、合計Ｐ個
の代表符号コードの抽出を行うことを特徴とする音響信
号の符号化方法。
【請求項１１】請求項１〜７のいずれかに記載の符号
化方法において、各符号コードに基いて音を再生するために用いる音源を
予め特定しておき、この音源を用いて各符号コードを実
際に再生することにより得られる音響信号に対して、ス
ペクトル作成段階および強度グラフ作成段階を実行し、
各符号コードについての固有強度グラフを予め求めてお
き、符号化段階で代表符号コードを抽出する際に、符号化対
象となる強度グラフにおけるその時点での候補の中から
最も強度の大きい符号コードを第ｉ番目の代表符号コー
ドとして抽出した後、符号化対象となる強度グラフの各
強度値から前記第ｉ番目の代表符号コードについての固
有強度グラフの各強度値を減算する処理を、ｉ＝１〜
（Ｐ−１）について繰り返し実行し、更に、残った候補
の中から最も強度の大きい符号コードを第Ｐ番目の代表
符号コードとして抽出することにより、合計Ｐ個の代表
符号コードの抽出を行うことを特徴とする音響信号の符
号化方法。
【請求項１２】請求項１〜７のいずれかに記載の符号
化方法において、各符号コードに基いて音を再生するために用いる音源を
予め特定しておき、この音源を用いて各符号コードを実
際に再生することにより得られる音響信号の固有波形を
予め求めておき、第ｉ番目の代表符号コードを決定するために、第ｉ番目
の音響信号の波形情報を入力し、入力した波形情報に対
してスペクトル作成段階および強度グラフ作成段階を行
い、続く符号化段階で、作成された強度グラフにおける
候補の中から最も強度の大きい符号コードを第ｉ番目の
代表符号コードとして抽出し、更に、第ｉ番目の音響信
号の強度値から前記第ｉ番目の代表符号コードについて
の固有波形の各強度値を減算し、その結果得られる音響
信号を第（ｉ＋１）番目の音響信号とする符号抽出処理
を定義し、符号化対象となる原音響信号に対して区間設定段階を行
い、各単位区間ごとの原音響信号をそれぞれ第１番目の
音響信号として、ｉ＝１〜（Ｐ−１）について前記符号
抽出処理を繰り返し実行し、最後に、第Ｐ番目の音響信
号の波形情報を入力し、入力した波形情報に対してスペ
クトル作成段階および強度グラフ作成段階を行い、続く
符号化段階で、作成された強度グラフにおける候補の中
から最も強度の大きい符号コードを第Ｐ番目の代表符号
コードとして抽出する処理を実行することにより、各単
位区間ごとにそれぞれ合計Ｐ個の代表符号コードの抽出
を行うことを特徴とする音響信号の符号化方法。
【請求項１３】請求項１〜１２のいずれかに記載の符
号化方法において、隣接する複数の単位区間について、所定の条件下で互い
に類似する代表符号コードがある場合、これら類似する
代表符号コードを、複数の単位区間に跨がった統合符号
コードに置換する処理を行うことを特徴とする音響信号
の符号化方法。
【請求項１４】請求項１〜１３のいずれかに記載の符
号化方法において、各単位区間ごとに抽出されるＰ個の符号コードを、それ
ぞれＰ個のトラックに分離して収容するようにし、抽出
されたＰ個の符号コードを周波数に基いてソートしてか
ら各トラックに収容するようにしたことを特徴とする音
響信号の符号化方法。
【請求項１５】請求項１〜１４のいずれかに記載の符
号化方法を実行する音響信号の符号化のためのプログラ
ムが記録されたコンピュータ読み取り可能な記録媒体。
【請求項１６】請求項１〜１４のいずれかに記載の符
号化方法により符号化された符号データが記録されたコ
ンピュータ読み取り可能な記録媒体。