JP2001148633A

JP2001148633A - 音響信号の符号化方法

Info

Publication number: JP2001148633A
Application number: JP32929799A
Authority: JP
Inventors: Toshio Motegi; 敏雄茂出木
Original assignee: Dai Nippon Printing Co Ltd
Current assignee: Dai Nippon Printing Co Ltd
Priority date: 1999-11-19
Filing date: 1999-11-19
Publication date: 2001-05-29

Abstract

(57)【要約】【課題】一般の音響信号をＭＩＤＩデータを用いて高
い品質をもって符号化する。【解決手段】符号化対象となる音響信号をデータとし
て取り込み、単位区間ｄ内の信号Ｘについて相関の高い
三角関数を、周期Ｔ（ｎ）をもった仮代表周期関数とし
て選出する。単位区間ｄを周期Ｔ（ｎ）の整数ｍ倍ずら
した参照区間ｒ（ｎ）を定義する。単位区間ｄ内の信号
Ｘの仮代表周期関数に対する位相角θ１（ｎ）と、参照
区間ｒ（ｎ）内の信号Ｙの仮代表周期関数に対する位相
角θ２（ｎ）と、を求め、両位相角の差Δθ（ｎ）を用
いて、ＴＴ（ｎ）＝（ｍ・Ｔ（ｎ）−Ｔ（ｎ）・Δθ
（ｎ）／２π）／ｍなる演算を行い、周期ＴＴ（ｎ）を
求める。この周期ＴＴ（ｎ）をもった周期関数を正式の
代表周期関数と定義し、単位区間ｄ内の信号Ｘを代表さ
せる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音響信号の符号化方
法に関し、時系列の強度信号として与えられる音響信号
を符号化し、これを復号化して再生する技術に関する。
特に、本発明は一般の音響信号を、ＭＩＤＩ形式の符号
データに効率良く変換する処理に適しており、放送メデ
ィア（ラジオ、テレビ）、通信メディア（ＣＳ映像・音
声配信、インターネット配信）、パッケージメディア
（ＣＤ、ＭＤ、カセット、ビデオ、ＬＤ、ＣＤ−ＲＯ
Ｍ、ゲームカセット）などで提供する各種オーディオコ
ンテンツを制作する種々の産業分野や、医療聴診音（た
とえば、心音）などの各種音響信号解析や診断の分野へ
の応用が期待される。

【０００２】

【従来の技術】音響信号を符号化する技術として、ＰＣ
Ｍ（Pulse Code Modulation ）の手法は最も普及してい
る手法であり、現在、オーディオＣＤやＤＡＴなどの記
録方式として広く利用されている。このＰＣＭの手法の
基本原理は、アナログ音響信号を所定のサンプリング周
波数でサンプリングし、各サンプリング時の信号強度を
量子化してデジタルデータとして表現する点にあり、サ
ンプリング周波数や量子化ビット数を高くすればするほ
ど、原音を忠実に再生することが可能になる。ただ、サ
ンプリング周波数や量子化ビット数を高くすればするほ
ど、必要な情報量も増えることになる。そこで、できる
だけ情報量を低減するための手法として、信号の変化差
分のみを符号化するＡＤＰＣＭ（Adaptive Differentia
l Pulse Code Modulation ）の手法も用いられている。

【０００３】一方、電子楽器による楽器音を符号化しよ
うという発想から生まれたＭＩＤＩ（Musical Instrume
nt Digital Interface）規格も、パーソナルコンピュー
タの普及とともに盛んに利用されるようになってきてい
る。このＭＩＤＩ規格による符号データ（以下、ＭＩＤ
Ｉデータという）は、基本的には、楽器のどの鍵盤キー
を、どの程度の強さで弾いたか、という楽器演奏の操作
を記述したデータであり、このＭＩＤＩデータ自身に
は、実際の音の波形は含まれていない。そのため、実際
の音を再生する場合には、楽器音の波形を記憶したＭＩ
ＤＩ音源が別途必要になる。しかしながら、上述したＰ
ＣＭの手法で音を記録する場合に比べて、情報量が極め
て少なくてすむという特徴を有し、その符号化効率の高
さが注目を集めている。このＭＩＤＩ規格による符号化
および復号化の技術は、現在、パーソナルコンピュータ
を用いて楽器演奏、楽器練習、作曲などを行うソフトウ
エアに広く採り入れられており、カラオケ、ゲームの効
果音といった分野でも広く利用されている。

【０００４】

【発明が解決しようとする課題】上述したように、ＰＣ
Ｍの手法により音響信号を符号化する場合、十分な音質
を確保しようとすれば情報量が膨大になり、データ処理
の負担が重くならざるを得ない。したがって、通常は、
ある程度の情報量に抑えるため、ある程度の音質に妥協
せざるを得ない。もちろん、ＭＩＤＩ規格による符号化
の手法を採れば、非常に少ない情報量で十分な音質をも
った音の再生が可能であるが、上述したように、ＭＩＤ
Ｉ規格そのものが、もともと楽器演奏の操作を符号化す
るためのものであるため、広く一般音響への適用を行う
ことはできない。別言すれば、ＭＩＤＩデータを作成す
るためには、実際に楽器を演奏するか、あるいは、楽譜
の情報を用意する必要がある。

【０００５】このように、従来用いられているＰＣＭの
手法にしても、ＭＩＤＩの手法にしても、それぞれ音響
信号の符号化方法としては一長一短があり、一般の音響
について、少ない情報量で十分な音質を確保することは
できない。ところが、一般の音響についても効率的な符
号化を行いたいという要望は、益々強くなってきてい
る。いわゆるヴォーカル音響と呼ばれる人間の話声や歌
声を取り扱う分野では、かねてからこのような要望が強
く出されている。たとえば、語学教育、声楽教育、犯罪
捜査などの分野では、ヴォーカル音響信号を効率的に符
号化する技術が切望されている。このような要求に応え
るために、特開平１０−２４７０９９号公報、特開平１
１−７３１９９号公報、特開平１１−７３２００号公
報、特開平１１−９５７５３号公報、特願平１０−２８
３４５３号明細書、特願平１０−２８３４５４号明細
書、特願平１１−５８４３１号明細書、特願平１１−１
７７８７５号明細書には、ＭＩＤＩデータを利用するこ
とが可能な新規な符号化方法が提案されている。

【０００６】これらの方法では、音響信号の時間軸に沿
って複数の単位区間を設定し、各単位区間ごとに相関の
高い所定の周期関数を対応させ、この周期関数に応じた
ＭＩＤＩデータを作成するという手順が実行される。し
かしながら、これまで提案されてきたこれらの手法で
は、必ずしも原音響信号に忠実な符号化を行うことがで
きず、再生音に歪みが発生するなど品質低下の問題が生
じていた。

【０００７】そこで本発明は、ＭＩＤＩデータのような
符号データへの変換を高い品質をもって行うことが可能
な音響信号の符号化方法を提供することを目的とする。

【０００８】

【課題を解決するための手段】(1) 本発明の第１の態
様は、時系列の強度信号として与えられる音響信号を符
号化するための符号化方法において、符号化対象となる
音響信号を、デジタルの音響データとして取り込む入力
段階と、音響データの時間軸上に複数の単位区間を設定
する区間設定段階と、複数通りの標準周波数を設定し、
各標準周波数をもった標準周期関数をそれぞれ定義する
標準周期関数定義段階と、個々の単位区間内の音響デー
タと各標準周期関数との相関を計算し、相関が所定の基
準以上の大きさとなる１つまたは複数の標準周期関数を
仮代表周期関数として選出する仮代表選出段階と、個々
の単位区間について、当該単位区間について選出された
仮代表周期関数の周期の整数倍に相当する時間だけ、当
該単位区間をずらすことにより得られる参照区間を定義
する参照区間定義段階と、個々の単位区間について、当
該単位区間について選出された仮代表周期関数と当該単
位区間内の音響データとの位相差を示す第１の位相角
と、当該単位区間について選出された仮代表周期関数と
当該単位区間についての当該仮代表周期関数の周期の整
数倍だけずれた参照区間内の音響データとの位相差を示
す第２の位相角と、を求め、第１の位相角と第２の位相
角との差に基づいて、当該仮代表周期関数の周期を補正
することにより代表周期関数を求める補正段階と、個々
の単位区間の音響データを、当該単位区間について求め
られた代表周期関数の周波数もしくはこれに近似する所
定の周波数を示す周波数情報を含む符号データによって
表現する符号化段階と、を行うようにしたものである。

【０００９】(2) 本発明の第２の態様は、上述の第１
の態様に係る音響信号の符号化方法において、符号化段
階において、個々の単位区間の音響データを、当該単位
区間について求められた代表周期関数の周波数に近似し
た標準周波数を示す周波数情報を含む符号データによっ
て表現するようにしたものである。

【００１０】(3) 本発明の第３の態様は、上述の第１
または第２の態様に係る音響信号の符号化方法におい
て、標準周波数として、周波数値が等比級数配列をなす
周波数を設定するようにしたものである。

【００１１】(4) 本発明の第４の態様は、上述の第１
〜第３の態様に係る音響信号の符号化方法において、個
々の単位区間について、代表周期関数と当該単位区間内
の音響データとの相関値を計算し、個々の単位区間の音
響データを、当該単位区間について求められた代表周期
関数の周波数もしくはこれに近似する所定の周波数を示
す周波数情報と、当該代表周期関数について計算された
相関値を示す強度情報と、を含む符号データによって表
現するようにしたものである。

【００１２】(5) 本発明の第５の態様は、上述の第１
〜第４の態様に係る音響信号の符号化方法において、個
々の単位区間について、代表周期関数と当該単位区間内
の音響データとの位相を計算し、個々の単位区間の音響
データを、当該単位区間について求められた代表周期関
数の周波数もしくはこれに近似する所定の周波数を示す
周波数情報と、当該代表周期関数について計算された位
相を示す位相情報と、を含む符号データによって表現す
るようにしたものである。

【００１３】(6) 本発明の第６の態様は、上述の第１
〜第５の態様に係る音響信号の符号化方法において、仮
代表選出段階において、仮代表周期関数の選出基準とし
て、相関値が所定の閾値以上である標準周期関数を選出
する方法、または、相関値の大きい順に所定数の標準周
期関数を選出する方法を採るようにしたものである。

【００１４】(7) 本発明の第７の態様は、上述の第１
〜第６の態様に係る音響信号の符号化方法において、仮
代表選出段階において、音響データのフーリエスペクト
ルにおけるスペクトル強度値に基いて、１つまたは複数
の仮代表周波数を選出するようにしたものである。

【００１５】(8) 本発明の第８の態様は、上述の第１
〜第６の態様に係る音響信号の符号化方法において、第
ｊ番目の対象音響データに対する相関が最も大きくなる
標準周期関数を第ｊ番目の仮代表周期関数として選出
し、この第ｊ番目の仮代表周期関数の周期を補正するこ
とにより第ｊ番目の代表周期関数を求め、この第ｊ番目
の代表周期関数からなる信号成分を第ｊ番目の対象音響
データから減じることにより得られる音響データを、第
（ｊ＋１）番目の対象音響データとする処理を、ｊ＝１
〜Ｐ（Ｐは任意の整数）まで繰り返し実行し、Ｐ個の代
表周期関数を選出するようにしたものである。

【００１６】(9) 本発明の第９の態様は、上述の第１
〜第８の態様に係る音響信号の符号化方法において、所
定の周期関数と所定区間内の音響データとの相関を計算
する際に、当該周期関数の周期の整数倍に相当する長さ
をもった区間を相関計算対象区間として設定し、当該所
定区間内のうち相関計算対象区間内の部分についてのみ
相関計算を実行するようにしたものである。

【００１７】(10) 本発明の第１０の態様は、上述の第
１〜第９の態様に係る音響信号の符号化方法において、
個々の周波数をもった周期関数として、それぞれ互いに
位相がπ／２だけ異なる第１の関数および第２の関数を
定義し、第１の関数に対する相関値と第２の関数に対す
る相関値との二乗和平方根値に基づいて当該周期関数に
対する相関を求め、第１の関数に対する相関値と第２の
関数に対する相関値との比率に基づいて当該周期関数に
対する位相を求めるようにしたものである。

【００１８】(11) 本発明の第１１の態様は、上述の第
１〜第１０の態様に係る音響信号の符号化方法におい
て、ある単位区間について、仮代表周期関数の周期Ｔの
ｍ倍（ｍは整数）だけずれた位置に参照区間が定義され
ている場合に、第１の位相角と第２の位相角との差Δθ
（ただし、−π≦Δθ≦＋π）を用いて、ＴＴ＝（ｍＴ
−Ｔ・Δθ／２π）／ｍなる補正計算によって、代表周
期関数の周期ＴＴを求めるようにしたものである。

【００１９】(12) 本発明の第１２の態様は、上述の第
１１の態様に係る音響信号の符号化方法において、ｍＴ
の値が所定の設定値Ｔmax を超えない範囲内で最大とな
るように、仮代表周期関数の周期Ｔに応じて異なる整数
ｍを設定するようにしたものである。

【００２０】(13) 本発明の第１３の態様は、上述の第
１〜第１２の態様に係る音響信号の符号化方法におい
て、時間軸上で近接配置された複数の符号データに含ま
れる周波数情報、強度情報、位相情報なる３つの要素の
うちのいくつかが、それぞれ所定の許容範囲内で近似し
ている場合、これら複数の符号データを１つの符号デー
タに統合する処理を行うようにしたものである。

【００２１】(14) 本発明の第１４の態様は、上述の第
１〜第１３の態様に係る音響信号の符号化方法におい
て、同一の単位区間について複数の代表周期関数が求ま
っている場合に、これら各代表周期関数と当該単位区間
内の音響データとの位相をそれぞれ計算し、一方の周波
数が他方の周波数の整数Ｚ倍の関係にあり、かつ、それ
ぞれについて計算された位相が整数Ｚにより一意的に定
まる特定の条件を満たすような２つの代表周期関数が存
在する場合に、周波数の高い代表周期関数に関する符号
データを削除する処理を行うようにしたものである。

【００２２】(15) 本発明の第１５の態様は、上述の第
１〜第１４の態様に係る音響信号の符号化方法におい
て、楽譜のノートナンバーに対応する標準周波数を予め
設定しておき、符号化段階において、代表周期関数の周
波数を、これに近似した標準周波数に対応するノートナ
ンバーによって表現し、ＭＩＤＩデータにより符号化を
行うようにしたものである。

【００２３】(16) 本発明の第１６の態様は、上述の第
１〜第１５の態様に係る音響信号の符号化方法をコンピ
ュータに実行させるためのプログラムを、コンピュータ
読み取り可能な記録媒体に記録するようにしたものであ
る。

【００２４】

【発明の実施の形態】以下、本発明を図示する実施形態
に基づいて説明する。

【００２５】§１．本発明に係る音響信号の符号化方法
の基本原理はじめに、本発明に係る音響信号の符号化方法の基本原
理を述べておく。この基本原理は、前掲の各公報あるい
は明細書に開示されているので、ここではその概要のみ
を簡単に述べることにする。

【００２６】いま、図１(a) に示すように、時系列の強
度信号としてアナログ音響信号が与えられたものとしよ
う。図示の例では、横軸に時間ｔ、縦軸に振幅（強度）
をとってこの音響信号を示している。ここでは、まずこ
のアナログ音響信号を、デジタルの音響データとして取
り込む処理を行う。これは、従来の一般的なＰＣＭの手
法を用い、所定のサンプリング周期でこのアナログ音響
信号をサンプリングし、振幅を所定の量子化ビット数を
用いてデジタルデータに変換する処理を行えばよい。こ
こでは、説明の便宜上、ＰＣＭの手法でデジタル化した
音響データの波形も、図１(a) のアナログ音響信号と同
一の波形で示すことにする。

【００２７】続いて、この符号化対象となる音響信号の
時間軸上に、複数の単位区間を設定する。図１(a) に示
す例では、時間軸ｔ上に等間隔に６つの時刻ｔ１〜ｔ６
が定義され、これら各時刻を始点および終点とする５つ
の単位区間ｄ１〜ｄ５が設定されている（より実用的な
区間設定方法については後述する）。

【００２８】こうして単位区間が設定されたら、各単位
区間ごとの音響信号（ここでは、区間信号と呼ぶことに
する）について、それぞれ代表周波数を選出する。各区
間信号には、通常、様々な周波数成分が含まれている
が、その中でも振幅の大きな周波数成分を代表周波数と
して選出すればよい。代表周波数は１つだけ選出しても
よいが、複数の代表周波数を選出した方が、より精度の
高い符号化が可能になる。代表周波数を選出する方法の
ひとつは、フーリエ変換を利用する方法である。すなわ
ち、各区間信号ごとに、それぞれフーリエ変換を行い、
スペクトルを作成する。このとき、ハニング窓（Hannin
g Window )などの重み関数で、切り出した区間信号にフ
ィルタをかけてフーリエ変換を施す。一般にフーリエ変
換は、切り出した区間前後に同様な信号が無限に存在す
ることが想定されているため、重み関数を用いない場
合、作成したスペクトルに高周波ノイズがのることが多
い。ハニング窓関数など区間の両端の重みが０になるよ
うな重み関数を用いると、このような弊害をある程度抑
制できる。ハニング窓関数Ｈ（ｋ）は、単位区間長をＬ
とすると、ｋ＝１…Ｌに対して（ｋは単位区間内の位置
を示すパラメータ）、Ｈ（ｋ）＝０．５−０．５＊ｃｏｓ（２πｋ／Ｌ）で与えられる関数である。

【００２９】図１(b) には、単位区間ｄ１について作成
されたスペクトルの一例が示されている。このスペクト
ルでは、横軸上に定義された周波数ｆによって、単位区
間ｄ１についての区間信号に含まれる周波数成分（０〜
Ｆ：ここでＦはサンプリング周波数）が示されており、
縦軸上に定義された複素強度Ａによって、各周波数成分
ごとの複素強度が示されている。

【００３０】次に、このスペクトルの周波数軸ｆに対応
させて、離散的に複数Ｘ個の符号コードを定義する。別
言すれば、周波数軸ｆ上に、複数Ｘ通りの周波数を設定
することになる。この例では、符号コードとしてＭＩＤ
Ｉデータで利用されるノートナンバーｎを用いており、
ｎ＝０〜１２７までの１２８個の符号コードを定義して
いる。ノートナンバーｎは、音符の音階を示すパラメー
タであり、たとえば、ノートナンバーｎ＝６９は、ピア
ノの鍵盤中央の「ラ音（Ａ３音）」を示しており、４４
０Ｈｚの音に相当する。このように、１２８個のノート
ナンバーには、いずれも所定の設定周波数が対応づけら
れるので、スペクトルの周波数軸ｆ上の所定位置に、そ
れぞれ１２８個のノートナンバーｎが離散的に定義され
ることになる。

【００３１】ここで、ノートナンバーｎは、１オクター
ブ上がると、周波数が２倍になる対数尺度の音階を示す
ため、周波数軸ｆに対して線形には対応しない。すなわ
ち、周波数軸ｆ上に離散的に定義された各ノートナンバ
ーに対応する設定周波数は、個々の周波数値が等比級数
配列をなす周波数ということになる。そこで、ここでは
周波数軸ｆを対数尺度で表し、この対数尺度軸上にノー
トナンバーｎを定義した強度グラフを作成してみる。図
１(c) は、このようにして作成された単位区間ｄ１につ
いての強度グラフを示す。この強度グラフの横軸は、図
１(b) に示すスペクトルの横軸を対数尺度に変換したも
のであり、ノートナンバーｎ＝０〜１２７が等間隔にプ
ロットされている。一方、この強度グラフの縦軸は、図
１(b) に示すスペクトルの複素強度Ａを実効強度Ｅに変
換したものであり、各ノートナンバーｎの位置における
強度を示している。一般に、フーリエ変換によって得ら
れる複素強度Ａは、実数部Ｒ（余弦関数との相関を示
す）と虚数部Ｉ（正弦関数との相関を示す）とによって
表されるが、実効強度Ｅは、Ｅ＝（Ｒ^２＋Ｉ^２）^１／ ^２
なる二乗和平方根値として演算によって求めることがで
きる。

【００３２】こうして求められた単位区間ｄ１の強度グ
ラフは、単位区間ｄ１についての区間信号に含まれる振
動成分について、ノートナンバーｎ＝０〜１２７に相当
する各振動成分の割合を実効強度として示すグラフとい
うことができる。そこで、この強度グラフに示されてい
る各実効強度に基いて、全１２８個のノートナンバーの
中からＰ個のノートナンバーを選択し、このＰ個のノー
トナンバーｎを、単位区間ｄ１を代表する代表符号コー
ドとして抽出する。これは、全１２８通りの設定周波数
の中から、Ｐ個の周波数を代表周波数として選出するこ
とに他ならない。ここでは、説明の便宜上、Ｐ＝３とし
て、全１２８個の候補の中から３個のノートナンバーを
代表符号コードとして抽出する場合を示すことにする。
たとえば、「候補の中から強度の大きい順にＰ個の符号
コードを抽出する」という基準に基いて抽出を行えば、
図１(c) に示す例では、第１番目の代表符号コードとし
てノートナンバーｎ（ｄ１，１）が、第２番目の代表符
号コードとしてノートナンバーｎ（ｄ１，２）が、第３
番目の代表符号コードとしてノートナンバーｎ（ｄ１，
３）が、それぞれ抽出されることになる。

【００３３】このようにして、Ｐ個の代表符号コードが
抽出されたら、これらの代表符号コードとその実効強度
によって、単位区間ｄ１についての区間信号を表現する
ことができる。たとえば、上述の例の場合、図１(c) に
示す強度グラフにおいて、ノートナンバーｎ（ｄ１，
１）、ｎ（ｄ１，２）、ｎ（ｄ１，３）の実効強度がそ
れぞれｅ（ｄ１，１）、ｅ（ｄ１，２）、ｅ（ｄ１，
３）であったとすれば、以下に示す３組のデータ対によ
って、単位区間ｄ１の音響信号を表現することができ
る。ｎ（ｄ１，１），ｅ（ｄ１，１）ｎ（ｄ１，２），ｅ（ｄ１，２）ｎ（ｄ１，３），ｅ（ｄ１，３）

【００３４】以上、単位区間ｄ１についての処理につい
て説明したが、単位区間ｄ２〜ｄ５についても、それぞ
れ別個に同様の処理が行われ、代表符号コードおよびそ
の強度を示すデータが得られることになる。たとえば、
単位区間ｄ２については、ｎ（ｄ２，１），ｅ（ｄ２，１）ｎ（ｄ２，２），ｅ（ｄ２，２）ｎ（ｄ２，３），ｅ（ｄ２，３）なる３組のデータ対が得られる。このようにして各単位
区間ごとに得られたデータによって、原音響信号を符号
化することができる。

【００３５】図２は、上述の方法による符号化の概念図
である。図２(a) には、図１(a) と同様に、原音響信号
について５つの単位区間ｄ１〜ｄ５を設定した状態が示
されており、図２(b) には、各単位区間ごとに得られた
符号データが音符の形式で示されている。この例では、
個々の単位区間ごとに３個の代表符号コードを抽出して
おり（Ｐ＝３）、これら代表符号コードに関するデータ
を３つのトラックＴ１〜Ｔ３に分けて収容するようにし
ている。たとえば、単位区間ｄ１について抽出された代
表符号コードｎ（ｄ１，１），ｎ（ｄ１，２），ｎ（ｄ
１，３）は、それぞれトラックＴ１，Ｔ２，Ｔ３に収容
されている。もっとも、図２(b) は、上述の方法によっ
て得られる符号データを音符の形式で示した概念図であ
り、実際には、各音符にはそれぞれ強度に関するデータ
が付加されている。たとえば、トラックＴ１には、ノー
トナンバーｎ（ｄ１，１），ｎ（ｄ２，１），ｎ（ｄ
３，１）…なる音階を示すデータとともに、ｅ（ｄ１，
１），ｅ（ｄ２，１），ｅ（ｄ３，１）…なる強度を示
すデータが収容されることになる。また、図２(b) に示
す概念図では、音符の横方向の位置によって、個々の単
位区間の時間軸上での位置が示されているが、実際に
は、この時間軸上での位置を正確に数値として示すデー
タが各音符に付加されていることになる。

【００３６】なお、ここで採用する符号化の形式として
は、必ずしもＭＩＤＩ形式を採用する必要はないが、こ
の種の符号化形式としてはＭＩＤＩ形式が最も普及して
いるため、実用上はＭＩＤＩ形式の符号データを用いる
のが最も好ましい。ＭＩＤＩ形式では、「ノートオン」
データもしくは「ノートオフ」データが、「デルタタイ
ム」データを介在させながら存在する。「ノートオン」
データは、特定のノートナンバーＮとベロシティーＶと
を指定して特定の音の演奏開始を指示するデータであ
り、「ノートオフ」データは、特定のノートナンバーＮ
とベロシティーＶとを指定して特定の音の演奏終了を指
示するデータである。また、「デルタタイム」データ
は、所定の時間間隔を示すデータである。ベロシティー
Ｖは、たとえば、ピアノの鍵盤などを押し下げる速度
（ノートオン時のベロシティー）および鍵盤から指を離
す速度（ノートオフ時のベロシティー）を示すパラメー
タであり、特定の音の演奏開始操作もしくは演奏終了操
作の強さを示すことになる。

【００３７】前述の方法では、第ｉ番目の単位区間ｄｉ
について、代表符号コードとしてＰ個のノートナンバー
ｎ（ｄｉ，１），ｎ（ｄｉ，２），…，ｎ（ｄｉ，Ｐ）
が得られ、このそれぞれについて実効強度ｅ（ｄｉ，
１），ｅ（ｄｉ，２），…，ｅ（ｄｉ，Ｐ）が得られ
る。そこで、次のような手法により、ＭＩＤＩ形式の符
号データを作成することができる。まず、「ノートオ
ン」データもしくは「ノートオフ」データの中で記述す
るノートナンバーＮとしては、得られたノートナンバー
ｎ（ｄｉ，１），ｎ（ｄｉ，２），…，ｎ（ｄｉ，Ｐ）
をそのまま用いればよい。一方、「ノートオン」データ
もしくは「ノートオフ」データの中で記述するベロシ
ティーＶとしては、得られた実効強度ｅ（ｄｉ，１），
ｅ（ｄｉ，２），…，ｅ（ｄｉ，Ｐ）を、所定の方法で
規格化した値を用いればよい。また、「デルタタイム」
データは、各単位区間の長さに応じて設定すればよい。

【００３８】結局、上述した実施形態では、３トラック
からなるＭＩＤＩ符号データが得られることになる。こ
のＭＩＤＩ符号データを３台のＭＩＤＩ音源を用いて再
生すれば、６チャンネルのステレオ再生音として音響信
号が再生される。

【００３９】なお、上述の例では、区間信号のフーリエ
スペクトルを求め、その強度値の大きい順にＰ個の周波
数（ノートナンバー）を選出して代表周波数とする処理
を行っているが、代表周波数の選出には、その他の方法
を用いてもかまわない。たとえば、特願平１１−５８４
３１号明細書には、一般化調和解析の手法を用いて代表
周波数の選出を行う例が示されている。この方法の基本
原理は次のとおりである。たとえば、図３(a) に示すよ
うな単位区間ｄについて、区間信号Ｘｊが与えられてい
るとしよう。ここで、この区間信号Ｘｊについてのフー
リエスペクトルを求め、そのピーク位置に相当する周波
数を代表周波数として選出する。続いて、図３(b) に示
すように、選出された代表周波数をもった周期関数Ｇｊ
を定義する。このとき、周期関数Ｇｊの振幅は、上記フ
ーリエスペクトルの代表周波数位置におけるスペクトル
強度に応じたものとなるように設定する。そして、区間
信号Ｘｊと周期関数Ｇｊとの差分信号Ｘｊ＋１を求める
（たとえば、図３(c) のようになる）。この差分信号Ｘ
ｊ＋１を新たな区間信号Ｘｊとして取り扱い、同様の処
理をパラメータｊをｊ＝１〜Ｐまで１ずつ増やしながら
Ｐ回繰り返し実行すれば、Ｐ個の代表周波数を選出する
ことができる。

【００４０】また、上述した例では、非常に単純な区間
設定例を述べたが、実際には、より実用的な区間設定を
行うのが好ましい。すなわち、図２(a) に示された例で
は、時間軸ｔ上に等間隔に定義された６つの時刻ｔ１〜
ｔ６を境界として、５つの単位区間ｄ１〜ｄ５が設定さ
れている。このような区間設定に基いて符号化を行った
場合、再生時に、境界となる時刻において音の不連続が
発生しやすい。したがって、実用上は、隣接する単位区
間が時間軸上で部分的に重複するような区間設定を行う
のが好ましい。

【００４１】図４(a) は、このように部分的に重複する
区間設定を行った例である。図示されている単位区間ｄ
１〜ｄ４は、いずれも部分的に重なっており、このよう
な区間設定に基いて前述の処理を行うと、図４(b) の概
念図に示されているような符号化が行われることにな
る。この例では、それぞれの単位区間の中心を基準位置
として、各音符をそれぞれの基準位置に配置している
が、単位区間に対する相対的な基準位置は、必ずしも中
心に設定する必要はない。図４(b) に示す概念図を図２
(b) に示す概念図と比較すると、音符の密度が高まって
いることがわかる。このように重複した区間設定を行う
と、作成される符号データの数は増加することになる
が、再生時に音の不連続が生じない自然な符号化が可能
になる。

【００４２】図５は、時間軸上で部分的に重複する区間
設定を行う具体的な手法を示す図である。この具体例で
は、音響信号を２２ｋＨｚのサンプリング周波数でサン
プリングすることによりデジタル音響データとして取り
込み、個々の単位区間の区間長Ｌを１０２４サンプル分
（約４７ｍｓｅｃ）に設定し、各単位区間ごとのずれ量
を示すオフセット長ΔＬを２０サンプル分（約０．９ｍ
ｓｅｃ）に設定したものである。すなわち、任意のｉに
対して、第ｉ番目の単位区間の始点と第（ｉ＋１）番目
の単位区間の始点との時間軸上での隔たりがオフセット
長ΔＬに設定されることになる。たとえば、第１番目の
単位区間ｄ１は、１〜１０２４番目のサンプルを含んで
おり、第２番目の単位区間ｄ２は、２０サンプル分ずれ
た２１〜１０４４番目のサンプルを含んでいることにな
る。時間軸上において、第１番目の単位区間ｄ１の始点
位置に基準点ｔ０を設定すれば、第２番目の単位区間ｄ
２の始点位置はｔ０＋ΔＬであり、第３番目の単位区間
ｄ３の始点位置はｔ０＋２・ΔＬとなる。もっとも、実
用上は、オフセット長ΔＬを５１２サンプル分程度に設
定しても（別言すれば、区間長Ｌの半分程度のみを重複
区間としても）、再生時に音の不連続が意識されること
はない。

【００４３】§２．代表周波数の具体的な選出方法上述した基本原理に基く方法では、時系列の強度信号と
して与えられる音響信号が、デジタルの音響データとし
て取り込まれ、この音響データの時間軸上に複数の単位
区間が設定される。そして、各単位区間内の音響データ
（区間信号）に対して、１つまたは複数の代表周波数が
選出され、この代表周波数をもった周期信号（代表周期
関数）によって、当該区間信号が表現されることにな
る。ここで選出される代表周波数は、文字どおり、当該
単位区間内の信号成分を代表する周波数であり、§１で
は、この代表周波数を、区間信号のフーリエスペクトル
に基いて選出する方法および一般化調和解析の手法を利
用して選出する方法を述べた。いずれの方法であって
も、結局は、周波数の異なるいくつかの周期関数を用意
しておき、これら複数の周期関数の中から、当該単位区
間内の音響データに対する相関が高い周期関数を見つけ
出し、この相関の高い周期関数の周波数を代表周波数と
して選出する、という概念は共通している。すなわち、
代表周波数を選出する際には、予め用意された複数の周
期関数と、単位区間内の音響信号との相関を求める演算
を行うことになる。

【００４４】そこで、この相関の求め方について、もう
少し具体的な説明を行っておこう。たとえば、図６に示
すように、ある単位区間ｄについて区間信号Ｘが与えら
れたとする。ここでは、区間長Ｌをもった単位区間ｄに
ついて、サンプリング周波数Ｆでサンプリングが行われ
ており、全部でｗ個のサンプル値が得られているものと
し、サンプル番号を図示のように、０，１，２，３，
…，ｋ，…，ｗ−２，ｗ−１としよう（白丸で示す第ｗ
番目のサンプルは、右に隣接する次の単位区間の先頭に
含まれるサンプルとする）。この場合、任意のサンプル
番号ｋについては、Ｘ（ｋ）なる振幅値がデジタルデー
タとして与えられていることになる。

【００４５】一方、複数の周期関数としては、図７に示
すような２５６通りの三角関数が用意されているものと
しよう。これらの三角関数は、同一周波数をもった正弦
波と余弦波との対から構成されており、１２８通りの標
準周波数ｆ（０）〜ｆ（１２７）のそれぞれについて、
正弦波および余弦波の対が定義されていることになる。
各三角関数内の変数Ｆおよびｋは、図６に示すように、
区間信号Ｘについてのサンプリング周波数Ｆおよびサン
プル番号ｋに相当する変数である。たとえば、周波数ｆ
（０）についての正弦波は、sin （２πｆ（０）ｋ／
Ｆ）で示され、任意のサンプル番号ｋを与えると、第ｋ
番目のサンプルと同一時間位置における周期関数の振幅
値が得られる。

【００４６】ここでは、１２８通りの標準周波数ｆ
（０）〜ｆ（１２７）を、図８に示すような式で定義し
た例を示すことにする。すなわち、第ｎ番目（０≦ｎ≦
１２７）の標準周波数ｆ（ｎ）は、ｆ（ｎ）＝４４０・２^γ（ｎ） γ（ｎ）＝（ｎ−６９）／１２なる式で定義されることになる。このような式によって
標準周波数を定義しておくと、最終的にＭＩＤＩデータ
を用いた符号化を行う際に便利である。なぜなら、この
ような定義によって設定される１２８通りの標準周波数
ｆ（０）〜ｆ（１２７）は、等比級数をなす周波数値を
とることになり、ＭＩＤＩデータで利用されるノートナ
ンバーに対応した周波数になるからである。たとえば、
ノートナンバーｎ＝６９は、ピアノの鍵盤中央の「ラ音
（Ａ３音）」を示しており、４４０Ｈｚの音に相当する
ことになる。図８に示す式によって第ｎ番目の標準周波
数ｆ（ｎ）を定義しておけば、ｎ＝６９を代入すると、
ｆ（ｎ）＝４４０が得られることになる。別言すれば、
図８に示す式によって定義された１２８通りの標準周波
数ｆ（０）〜ｆ（１２７）は、ＭＩＤＩデータにおける
１２８通りのノートナンバーｎ＝０〜１２７に対応した
周波数ということになる。

【００４７】図９は、ある単位区間ｄについての区間信
号Ｘと、第ｎ番目の標準周波数ｆ（ｎ）をもった正弦波
Ｒｎとの相関値を求める原理を示す図である。両者の相
関値Ａ（ｎ）は、図１０の第１の演算式によって定義す
ることができる。ここで、Ｘ（ｋ）は、図９に示すよう
に、区間信号Ｘにおけるサンプル番号ｋの振幅値であ
り、sin （２πｆ（ｎ）・ｋ／Ｆ）は、時間軸上での同
位置における正弦波Ｒｎの振幅値である。この第１の演
算式は、単位区間ｄ内の全サンプル番号ｋ＝０〜ｗ−１
の位置について、それぞれ区間信号Ｘの振幅値と正弦波
Ｒｎの振幅値との積を求め、その総和を求める式という
ことができる。振幅値は正負の符号を有しているので、
その積も正負の符号を有したものになる。したがって、
区間信号Ｘと正弦波Ｒｎとの間に全く相関がなかったと
すれば、両振幅の積の符号は、全くランダムに正になっ
たり負になったりするので、その総和は０になる。逆
に、両者間に相関があれば、両振幅の積の総和の絶対値
は、相関の程度に応じて大きくなる。たとえば、区間信
号Ｘの振幅が正である時には、正弦波Ｒｎの振幅も常に
正であり、区間信号Ｘの振幅が負である時には、正弦波
Ｒｎの振幅も常に負である、というような正の相関があ
る場合（区間信号Ｘと正弦波Ｒｎとが同一周波数で同位
相）ならば、積の総和は正の最大値になり、これとは逆
に、区間信号Ｘの振幅が正である時には、正弦波Ｒｎの
振幅は常に負であり、区間信号Ｘの振幅が負である時に
は、正弦波Ｒｎの振幅は常に正である、というような負
の相関がある場合（区間信号Ｘと正弦波Ｒｎとが同一周
波数で逆位相）ならば、積の総和は負の最大値になる。

【００４８】同様に、図１０の第２の演算式は、区間信
号Ｘと、第ｎ番目の標準周波数ｆ（ｎ）をもった余弦波
との相関値を求める式であり、両者の相関値はＢ（ｎ）
で与えられる。なお、相関値Ａ（ｎ）を求めるための第
１の演算式も、相関値Ｂ（ｎ）を求めるための第２の演
算式も、最終的に係数２／ｗが乗ぜられているが、これ
は相関値を規格化するためのものである。すなわち、分
母のｗは、単位区間ｄ内に含まれる総サンプル数であ
り、ｋ＝０〜ｗ−１の全ｗ個のサンプルについて求めた
総和を、総サンプル数ｗで割ることにより、１サンプル
分についての平均を求める意味をもっている。一方、分
子の２は、相関値Ａ（ｎ），Ｂ（ｎ）が−１〜＋１の間
の値となるようにするための定数である。

【００４９】区間信号Ｘと標準周波数ｆ（ｎ）をもった
標準周期関数との総合的な相関は、たとえば、図１０の
第３の演算式に示すように、正弦波との相関値Ａ（ｎ）
と余弦波との相関値Ｂ（ｎ）との二乗和平方根値Ｅ
（ｎ）によって示すことができる。このように、二乗和
平方根値を用いれば、正の相関と負の相関との双方を反
映させた総合的な相関を求めることができる。たとえ
ば、正弦波に対しては正の相関を示し、余弦波に対して
は負の相関を示すような場合、相関値Ａ（ｎ）は正の値
となり、相関値Ｂ（ｎ）は負の値となるが、二乗和平方
根値Ｅ（ｎ）は、両相関値の絶対値を反映した値とな
る。

【００５０】図１０に示す演算式は、周期関数として三
角関数を用いた場合の例（別言すれば、波形形状が正弦
波になる関数の例）であるが、本発明を実施する上で用
いる周期関数の波形形状は、正弦波に限定されるもので
はなく、三角波、矩形波、鋸歯状波などの波形形状をも
った周期関数を用いてもかまわない。実用上は、周期関
数として、その波形形状が正弦波、三角波、矩形波、鋸
歯状波になる複数通りの関数を定義しておき、取り込ん
だ音響データの特性に基いて、所定の波形形状をもった
関数を手動（オペレータの指示）により選択的に用いる
ことができるようにしておくのが好ましい。もちろん、
オペレータの選択指示を待たずに、取り込んだ音響デー
タの特性を分析し、最も適した周期関数を自動選択する
ような機能をもたせておくこともできる。

【００５１】図１１に示す式は、三角関数の代わりに、
標準周波数ｆ（ｎ）をもった一般的な周期関数Ｒｎを用
いた場合の相関を定義する演算式である。相関値Ａ
（ｎ）を求める演算式では、周期関数Ｒｎ（ｋ）が用い
られているのに対し、相関値Ｂ（ｎ）を求める演算式で
は、周期関数Ｒｎ（ｋ＋Ｆ／４ｆ（ｎ））が用いられて
いるのは、両周期関数は、同じ標準周波数ｆ（ｎ）を有
しているにもかかわらず、互いに位相がπ／２だけ異な
っているためである。上述したように、Ｆは区間信号Ｘ
のサンプリング周波数であり、Ｆ／ｆ（ｎ）は、１周期
内のサンプル総数に相当する。したがって、Ｆ／４ｆ
（ｎ）は、１／４周期に相当する時間内のサンプル数を
示す値となり、位相差π／２をサンプル番号の単位で示
した値となる。このように、標準周波数ｆ（ｎ）をも
ち、互いに位相がπ／２だけ異なる一対の周期関数につ
いて、それぞれ相関値Ａ（ｎ），Ｂ（ｎ）を求めれば、
その二乗和平方根値Ｅ（ｎ）が、標準周波数ｆ（ｎ）を
もった周期関数に対する総合的な相関を示すパラメータ
になる。

【００５２】フーリエスペクトルの実効強度Ｅは、図１
０の演算式による二乗和平方根値Ｅ（ｎ）に他ならな
い。たとえば、図１(c) に示すグラフには、ノートナン
バーｎ＝０〜１２７のそれぞれについての実効強度Ｅが
示されているが、第ｎ番目のノートナンバーｎの実効強
度は、図１０に示す二乗和平方根値Ｅ（ｎ）として求め
られた値である。§１で述べたＭＩＤＩデータを利用し
た符号化方法では、この二乗和平方根値Ｅ（ｎ）を、Ｍ
ＩＤＩデータのベロシティーとして用いることになる。
以上のような手法によれば、区間信号Ｘに含まれている
任意の標準周波数ｆ（ｎ）をもった標準周期関数Ｒｎの
振幅成分を、二乗和平方根値Ｅ（ｎ）として得ることが
できる。この二乗和平方根値Ｅ（ｎ）の値は、区間信号
Ｘと標準周波数ｆ（ｎ）を有する標準周期関数Ｒｎとの
総合的な相関を示す値ということができるので、この相
関値の大きな標準周期関数の周波数を代表周波数として
選出すれば、この代表周波数を用いて区間信号Ｘを符号
化することができる。

【００５３】結局、ある１つの単位区間ｄ内の区間信号
Ｘを符号化するのであれば、次のような手法を採ればよ
い。まず、図７に示すような１２７通りの標準周波数を
もった標準周期関数をそれぞれ一対ずつ用意する（１つ
の周波数について、互いに位相がπ／２だけ異なる一対
の周期関数を用意する）。このとき、各標準周波数値が
図８に示すような式で定義される等比級数配列となるよ
うな設定をしておくと、ノートナンバーに対応した符号
データを得る上で都合がよい。そして、図１０に示す演
算式に基いて、標準周波数ｆ（ｎ）をもった標準周期関
数との相関値Ａ（ｎ），Ｂ（ｎ）を求める処理を、ｎ＝
０〜１２７のそれぞれについて行い、それぞれについて
二乗和平方根値Ｅ（ｎ）を求める。そして、この二乗和
平方根値Ｅ（ｎ）が所定の基準以上の大きさとなる１つ
または複数の標準周波数を代表周波数として選出すれば
よい。なお、ここで「Ｅ（ｎ）が所定の基準以上の大き
さとなる」という選出条件は、たとえば、何らかの閾値
を設定しておき、Ｅ（ｎ）がこの閾値を越えるような標
準周波数ｆ（ｎ）をすべて代表周波数として選出する、
という絶対的な選出条件を設定してもよいが、たとえ
ば、Ｅ（ｎ）の大きさの順に３番目までを選出する、と
いうような相対的な選出条件を設定してもよい。

【００５４】§３．位相に関する情報一般に、周期的な信号には、周波数に関する情報、振幅
（強度）に関する情報、位相に関する情報が含まれてい
る。ところが、§２で述べたような符号化を行うと、区
間信号Ｘに含まれていた位相に関する情報は失われてし
まう。すなわち、最終的に得られる符号がＭＩＤＩデー
タであったとすると、区間信号Ｘに含まれていた周波数
の情報はノートナンバーとして符号化され、区間信号Ｘ
に含まれていた振幅の情報はベロシティー（図１０に示
す二乗和平方根値Ｅ（ｎ））として符号化されるが、区
間信号Ｘに含まれていた位相に関する情報は、ＭＩＤＩ
データによっては表現されないことになる。

【００５５】しかしながら、実際には、二乗和平方根値
Ｅ（ｎ）を求めるための演算過程で、位相に関する情報
は既に得られているのである。すなわち、区間信号Ｘの
位相は、図１０に示す相関値Ａ（ｎ）とＢ（ｎ）との比
として定義することができる。相関値Ａ（ｎ）は正弦波
との相関の度合いを示す値であり、相関値Ｂ（ｎ）は余
弦波との相関の度合いを示す値である。したがって、二
乗和平方根値Ｅ（ｎ）は、標準周波数ｆ（ｎ）をもった
標準周期関数Ｒｎとの総合的な相関（位相を考慮しない
相関）を示すパラメータとなるが、相関値の比Ａ（ｎ）
／Ｂ（ｎ）は、同じ標準周波数ｆ（ｎ）をもった周期関
数であっても、正弦波に近いか余弦波に近いかの度合い
を示しており、位相を示すパラメータとなる。別言すれ
ば、所定の標準周波数ｆ（ｎ）を有し、互いに位相がπ
／２だけ異なる一対の周期関数を用意し、区間信号Ｘに
ついて、これら一対の周期関数との相関値Ａ（ｎ），Ｂ
（ｎ）を求めれば、このＡ（ｎ）／Ｂ（ｎ）なる比（符
号を考慮した比）が、区間信号Ｘ内に含まれている標準
周波数ｆ（ｎ）の成分をもった周期信号の位相を示すパ
ラメータということになる。

【００５６】実用上は、位相に関する情報を、位相角と
して表現すると便利である。そこで、ここでは、相関値
の比Ａ（ｎ）／Ｂ（ｎ）を利用して、図１２に示す演算
式によって、第ｎ番目の標準周波数ｆ（ｎ）をもった標
準周期関数Ｒｎについての位相角θ（ｎ）を定義する。
このような定義を行うと、位相角θ（ｎ）は、必ず０≦
θ（ｎ）＜２πの範囲の値をとる。たとえば、図１０に
示す演算式を用いて相関値を演算すると、Ａ（ｎ）＝
１，Ｂ（ｎ）＝０なる結果が得られた場合（正弦波に対
して正の最大相関を有し、余弦波に対しては全く相関を
有していない場合）、位相角θ（ｎ）＝π／２（正弦波
の位相角に一致）となる。逆に、Ａ（ｎ）＝０，Ｂ
（ｎ）＝１なる結果が得られた場合（余弦波に対して正
の最大相関を有し、正弦波に対しては全く相関を有して
いない場合）、位相角θ（ｎ）＝０（余弦波の位相角に
一致）となる。また、Ａ（ｎ）＝−１，Ｂ（ｎ）＝０な
る結果が得られた場合（正弦波に対して負の最大相関を
有し、余弦波に対しては全く相関を有していない場
合）、位相角θ（ｎ）＝π３／２となり、Ａ（ｎ）＝
０，Ｂ（ｎ）＝−１なる結果が得られた場合（余弦波に
対して負の最大相関を有し、正弦波に対しては全く相関
を有していない場合）、位相角θ（ｎ）＝πとなる。

【００５７】このように、各代表周波数を求める際に、
当該代表周波数をもった周期信号（代表周期関数）につ
いての位相角を求めることができるので、最終的な符号
データには、当該代表周波数の値ｆ（ｎ）、当該代表周
波数成分の振幅値Ｅ（ｎ）、そして当該代表周波数につ
いての位相角θ（ｎ）を示す情報を含ませることができ
る。たとえば、上述の手順により、３通りの代表周波数
ｆ（ｎ１），ｆ（ｎ２），ｆ（ｎ３）が選出されたとし
よう。この場合、各代表周波数について、それぞれ二乗
和平方根値Ｅ（ｎ１），Ｅ（ｎ２），Ｅ（ｎ３）と、位
相角θ（ｎ１），θ（ｎ２），θ（ｎ３）とが求まるこ
とになる。そこで、単位区間ｄ内の区間信号Ｘは、代表
周波数（ＭＩＤＩデータを利用する場合であれば、ノー
トナンバー）、当該代表周波数をもった周期関数Ｒｎに
ついての二乗和平方根値（ＭＩＤＩデータを利用する場
合であれば、ベロシティー）、当該単位区間ｄの時間軸
上での位置（ＭＩＤＩデータを利用する場合であれば、
デルタタイム）、を示す情報に、更に、当該代表周波数
について計算された位相角を示す情報を付加した符号デ
ータによって表現できる。

【００５８】図４では、単位区間ｄ１内の音響データ
が、３つの音符ｎ（ｄ１，１），ｎ（ｄ１，２），ｎ
（ｄ１，３）によって表現される例を示した。各音符
は、その五線譜上の上下位置によって音階、すなわち周
波数を示しており（これらの周波数は、選出された３つ
の代表周波数に相当する）、また、五線譜上の左右位置
および音符の種類によって、単位区間ｄ１の時間軸上で
の位置（始点位置と長さ／もしくは始点位置と終点位
置）を示している。また、個々の音符は、振幅強度に関
する情報ｅ（ｄ１，１），ｅ（ｄ１，２），ｅ（ｄ１，
３）ももっている。これに更に、位相に関する情報を付
加することができる。一般のＭＩＤＩ音符では、どの音
階の音を、どの期間にわたって、どのような強さで演奏
するか、という情報だけが提示されることになるが、こ
れに位相に関する情報を更に付加しておけば、どのよう
な位相をもった音響波形で演奏するか、という位相に関
する演奏指示を与えることができるようになるので、原
音響信号をより忠実に再生することが可能になる。

【００５９】§４．より精度の高い相関計算ここでは、§２で述べた相関計算の精度をより高める工
夫について述べる。図９のグラフを用いて説明したよう
に、区間長Ｌをもった単位区間ｄ内の音響信号（区間信
号Ｘ）と、所定の標準周期関数Ｒｎ（図示の例では標準
周波数ｆ（ｎ）をもった正弦波）との相関値Ａ（ｎ）
は、図１０に示すような計算によって求めることができ
る。ここで、Ｘ（ｋ）は区間信号Ｘを構成する第ｋ番目
のサンプルの振幅値、sin （２πｆ（ｎ）ｋ／Ｆ）は、
時間軸上で当該サンプルと同じ位置における正弦波関数
の振幅値であり、区間長Ｌにわたって、ｋ＝０〜ｗ−１
についてのｗ個のサンプルについて、両振幅値の積の総
和が求められ、総サンプル数ｗで除せられることにな
る。

【００６０】しかしながら、区間長Ｌを任意に設定した
場合、図１０に示す式によって与えられる相関値Ａ
（ｎ），Ｂ（ｎ）は、必ずしも正確な相関値にはならな
い。たとえば、区間信号Ｘが周波数ｆ（ｎ）をもった理
想的な正弦波であった場合、同じ周波数ｆ（ｎ）をもっ
た正弦波からなる周期関数Ｒｎに対する相関値は、本来
であれば最大になるはずであるが、任意の区間長Ｌにつ
いて、図１０の式による計算を行うと、相関値Ａ（ｎ）
は必ずしも最大値をとらない。同様に、区間信号Ｘが周
期関数Ｒｎに対して全く相関がない場合、本来であれば
相関値が零になるはずであるが、任意の区間長Ｌについ
て、図１０の式による計算を行うと、相関値Ａ（ｎ）は
必ずしも零にはならない。なぜなら、図１０に示す相関
演算式では、周期関数Ｒｎの周期に比べ無限大に近い長
いｗの区間で計算することを前提としているため、区間
長Ｌが周期関数Ｒｎの整数倍か否かは計算結果にさほど
影響しないのに対し、本願のような音響信号解析分野で
は、たかだか周期の数倍レベルの短い区間で計算するこ
とが要求され、区間長Ｌが周期関数Ｒｎの周期の整数倍
であるか否かが計算結果に大きな影響を与えるためであ
る。

【００６１】たとえば、図９に図示されている例では、
単位区間ｄ内に、周期関数Ｒｎが約１．２５周期分含ま
れている。このように、周期関数Ｒｎの周期の整数倍に
はならない区間について、相関計算を行うと、区間信号
Ｘが完全相関を示す信号であった場合でも、計算により
得られる相関値は最大値にはならず、逆に、区間信号Ｘ
が全く相関のない信号であった場合でも、計算によって
得られる相関値は零にはならない。そもそも、図１０に
示す式は、周期関数の整数倍の区間を計算対象区間とす
る前提で立てられた式なのであり、より精度の高い相関
計算を行うためには、相関計算の対象区間を、周期関数
の周期の整数倍に相当する長さをもった区間とし、この
相関計算対象区間に対してのみ、相関計算を実行するよ
うにしなくてはならない。

【００６２】これを図１３に示す具体例で説明してみよ
う。この例では、区間長Ｌをもった単位区間ｄが示され
ており、この単位区間ｄ内に区間信号Ｘが与えられてい
る。この区間信号Ｘについての代表周波数を選出するた
めに、種々の周波数をもった周期関数との相関が計算さ
れるわけであるが、このとき、各周期関数ごとに、異な
る相関計算対象区間を設定するのである。たとえば、第
ｎ番目の標準周波数ｆ（ｎ）をもった標準周期関数Ｒｎ
との相関計算を行う場合、この標準周期関数Ｒｎの周期
の整数倍に相当する区間を相関計算対象区間とし、この
相関計算対象区間に対してのみ、相関計算を実行するの
である。図示の例の場合、単位区間ｄ内には、サンプル
番号０〜ｗ−１までの全ｗ個のサンプルが含まれている
が（前述のように、第ｗ番目のサンプルは右に隣接する
次の単位区間の先頭に含まれるサンプルとして取り扱
う）、この単位区間ｄの区間長Ｌは、標準周期関数Ｒｎ
の周期の整数倍にはなっていない。そこで、標準周期関
数Ｒｎの周期の整数倍となるような区間、すなわち、サ
ンプル番号０〜ｗ（ｎ）に至る区間を相関計算対象区間
として設定する。この相関計算対象区間内には、サンプ
ル番号０〜ｗ（ｎ）−１までの全ｗ（ｎ）個のサンプル
が含まれることになる（第ｗ（ｎ）番目のサンプルは、
相関計算対象区間内のサンプルとしては取り扱わな
い）。

【００６３】結局、サンプル番号ｗが、区間長Ｌに基づ
いて一義的に定まる番号であるのに対し、サンプル番号
ｗ（ｎ）は、標準周波数ｆ（ｎ）をもった標準周期関数
Ｒｎとの相関計算を行うために、この標準周波数ｆ
（ｎ）に応じて定まる番号ということになる。したがっ
て、図７に示す１２８通りの標準周波数をもった標準周
期関数との相関計算を行う際には、それぞれの相関計算
ごとに異なる相関計算対象区間が設定されることにな
る。このように、標準周期関数の周期の整数倍の区間に
ついてのみ相関計算を行うようにすれば、より精度の高
い相関値を得ることができるようになる。

【００６４】上述のような手法を用いることにより、高
精度の相関値Ａ（ｎ），Ｂ（ｎ）および二乗和平方根値
Ｅ（ｎ）を求めるには、図１０に示す演算式の代わり
に、図１４に示す演算式を用いるようにすればよい。図
１０の演算式における定数ｗの代わりに、図１４の演算
式では変数ｗ（ｎ）が用いられている。ここで、変数ｗ
（ｎ）は、上述したように、相関計算の対象となる標準
周期関数Ｒｎの周波数ｆ（ｎ）に応じて定まる値であ
り、標準周期関数Ｒｎの周期の整数倍に相当する相関計
算対象区間を設定したときに、その中に含まれるサンプ
ルの総数に相当する値ということになる。区間信号Ｘと
標準周期関数Ｒｎとの振幅値の積は、ｋ＝０から、ｋ＝
ｗ（ｎ）−１に至るまでの合計ｗ（ｎ）個分だけ加算さ
れることになる。

【００６５】ところで、相関計算対象区間は、理論的に
は、標準周期関数Ｒｎの周期の整数倍に相当する区間で
あれば、どのような長さをもった区間であってもかまわ
ないが、実用上は、単位区間ｄを超えない範囲内で、で
きるだけ長い区間に設定した方が好ましい。相関計算を
行う上で、できるだけサンプル数を増やした方が、精度
の高い結果が得られるのは当然である。そこで、実用上
は、単位区間ｄを超えない範囲内で最も長く、かつ、標
準周期関数Ｒｎの周期の整数倍の長さを有する区間を、
相関計算対象区間に設定すればよい。この条件を式で示
せば、ｗ（ｎ）は、ｗ（ｎ）≦ｗという条件下で、ｗ
（ｎ）＝Ｍ・Ｆ／ｆ（ｎ）を満たす最大値（Ｍは整数）
ということになる。ここで、Ｆはサンプリング周波数、
ｆ（ｎ）は標準周期関数Ｒｎの周波数であり、Ｆ／ｆ
（ｎ）は、標準周期関数Ｒｎの１周期分に含まれるサン
プル数ということになり、標準周期関数Ｒｎの周期のＭ
倍に相当する区間が相関計算対象区間として設定される
ことになる。

【００６６】なお、図１０の演算式における変数ｋが、
図１４の演算式では（ｋ＋Ｋ）に置き換わっているが、
これは、区間信号Ｘを構成する各サンプルの番号を、絶
対サンプル番号として示したためである。すなわち、こ
れまでの説明では、ある１つの単位区間ｄ内の区間信号
Ｘを符号化する手順を述べたが、実際には、図４(a)に
示すように、時間軸上で少しずつずらしながら、多数の
単位区間を定義し、個々の単位区間ごとにそれぞれ符号
化を行うことになる。したがって、特定の単位区間内に
おいてのみ意味をもつ相対サンプル番号（当該単位区間
の先頭のサンプルを第０番目のサンプルとしたもの）を
用いる代わりに、どの単位区間についても共通の絶対サ
ンプル番号を用いた方が好ましい。たとえば、図５に示
す基準点ｔ０（この例では、第１の単位区間ｄ１の始点
位置に設定しているが、時間軸上の任意の位置に設定し
てかまわない）に位置するサンプルを第０番目のサンプ
ルとして、以下連続番号を付した番号を絶対サンプル番
号として用いることができる。結局、図１３の左端のサ
ンプルは、単位区間ｄ内における相対サンプル番号とし
ては、第０番目のサンプルということになるが、絶対サ
ンプル番号としては、第Ｋ番目のサンプルということに
なる。したがって、単位区間ｄ内において相対サンプル
番号ｋで特定されるサンプルは、絶対サンプル番号を用
いて標記すると、絶対サンプル番号（ｋ＋Ｋ）で特定さ
れることになる。

【００６７】§５．代表周波数の補正原理これまで述べてきたとおり、本発明に係る音響信号の符
号化方法の基本原理は、原音響信号の各単位区間ごと
に、それぞれ所定の代表周波数を決定し、この代表周波
数を示す情報を含む符号データにより、当該単位区間内
の音響信号を符号化するというものである。そして、代
表周波数を選出する具体的な方法として、たとえば、図
７に示すような１２８通りの標準周波数を設定してお
き、各標準周波数をもった標準周期関数との相関をそれ
ぞれ演算し、相関の高い標準周波数を代表周波数として
選出する方法を示した。しかしながら、本願発明者が行
った実験によると、このような方法によって選出された
代表周波数は、必ずしも当該単位区間内の原音響信号
（区間信号Ｘ）を代表する周波数として相応しい周波数
になるとは限らないことがわかった。その理由は、予め
用意された標準周波数が離散的な値として定義されてい
るためと考えられる。たとえば、図７に示す例では、合
計１２８通りの標準周波数が定義されているが、これら
の標準周波数の値は当然ながら離散的な値にならざるを
得えない。したがって、たとえば、区間信号Ｘに周波数
ｆの信号成分が含まれていたとしても、この周波数ｆが
いずれかの標準周波数に一致しない限り、周波数ｆをも
った周期関数に対する相関結果が低くなり、相対的に他
の周波数成分ｆ’（ノイズ成分を含め）の方が高く評価
され、それらが優先的に誤選出されてしまう可能性があ
る。

【００６８】このように、これまで述べてきた手法で
は、予め設定された有限個の標準周波数との相関のみに
基づいて代表周波数の選出が行われるため、本来選出さ
れるべき標準周波数が代表として選出されず、これに隣
接する標準周波数（場合によっては、かなりずれた位置
にある標準周波数）が代表として誤選出されるケースが
生じるようである。もちろん、予め設定する標準周波数
の数を増やし、離散値のきめを細かく設定するようにす
れば、誤選出はかなり解消するものと思われるが、演算
負担が著しく増加することになり、現実的ではない。ま
た、最終的にＭＩＤＩデータによる符号化を行うのであ
れば、ＭＩＤＩデータのノートナンバーに相当する周波
数以外の周波数を標準周波数として用意することは意味
がない。そこで、本願発明者は、位相に関する情報を用
いて、一度選出された代表周波数に対する補正を行うと
いう手法を見出だしたのである。以下、この手法の基本
原理について説明する。

【００６９】いま、図１５の最上段に示すような周期Ｔ
Ｔをもった原信号Ｓが区間信号Ｘ内に含まれていたとす
る。ここで、もし代表周期関数として、図１５の２段目
に示すような周期Ｔ０をもった周期関数Ｓ０が選出され
た場合（周期Ｔ０＝周期ＴＴ）、正しい代表周波数をも
った周期関数Ｓ０が選出されたことになる。ところが、
図１５の３段目に示すような周期Ｔ１をもった周期関数
Ｓ１が選出された場合（周期Ｔ１＜周期ＴＴ）、本来の
周波数よりも高い周波数が代表周波数として選出された
ことになり、逆に、図１５の４段目に示すような周期Ｔ
２をもった周期関数Ｓ２が選出された場合（周期Ｔ２＞
周期ＴＴ）、本来の周波数よりも低い周波数が代表周波
数として選出されたことになる。もちろん、これまで述
べてきた手法を実施することにより、正しい代表周波数
をもった周期関数Ｓ０が、必ず代表周期関数として選出
されれば問題はない。しかしながら、実際には、周期関
数Ｓ１やＳ２のように、本来の代表周波数とは異なる周
波数をもった周期関数が代表として選出されるケースが
生じることになる。

【００７０】ここで、各周期関数Ｓ０，Ｓ１，Ｓ２に対
する原信号Ｓの位相を考えてみると、時刻ｔ０では、す
べての周期関数の位相が揃っていたのに、時間とともに
それぞれの位相に変化が生じてくる。すなわち、正しい
代表周波数をもった周期関数Ｓ０に対しては、原信号Ｓ
の位相は常に揃っているが、周期関数Ｓ１に対する原信
号Ｓの位相は徐々に遅れてゆき、逆に、周期関数Ｓ２に
対する原信号Ｓの位相は徐々に進んでゆくことになる。
たとえば、一周期後の時点では、周期関数Ｓ１に対する
原信号Ｓの位相は、ΔＴ１だけ遅れていることになり、
周期関数Ｓ２に対する原信号Ｓの位相は、ΔＴ２だけ進
んでいることになる。したがって、各周期関数の周期の
関係は、ＴＴ＝Ｔ１＋ΔＴ１ＴＴ＝Ｔ２−ΔＴ２となる。ここで、位相の進み遅れを角度で示すことにす
れば、位相差ΔＴ１は位相角Δθ１（ただし、Δθ１＜
０）で表され、位相差ΔＴ２は位相角Δθ２（ただし、
Δθ２＞０）で表される。位相角の符号は、位相の遅れ
または進みを示している。一周期分の進み遅れが位相角
２πに相当するので、各位相角の符号を考慮すると、 ΔＴ１＝−ＴＴ・Δθ１／２π ΔＴ２＝＋ＴＴ・Δθ２／２π なる関係式が得られ、結局、各周期関数の周期の関係
は、ＴＴ＝Ｔ１−ＴＴ・Δθ１／２π ＴＴ＝Ｔ２−ＴＴ・Δθ２／２π となる。ここで、原信号Ｓの周期ＴＴが未知であり、こ
の周期ＴＴを計算によって求めることを考えると、ＴＴ
とＴ１またはＴＴとＴ２とがほぼ等しいと近似して、ＴＴ＝Ｔ１−Ｔ１・Δθ１／２π ＴＴ＝Ｔ２−Ｔ２・Δθ２／２π なる式が得られることになる。

【００７１】図１６(a) ，(b) に示す式は、上述の関係
をまとめた式である。結局、位相角に進み遅れを示す符
号をもたせ、−π〜＋πの範囲内の位相角Δθを定義す
るようにすれば、位相が遅れている場合でも、位相が進
んでいる場合でも、時間軸上において１周期分隔たるこ
とにより、周期ＴＴを有する原信号と周期Ｔを有する代
表周期関数との間に、位相角Δθに相当する位相の進み
遅れが生じたとすれば、図１６(c) に示すように、ＴＴ＝Ｔ−Ｔ・Δθ／２π なる関係式が近似的に成り立つことになるので、既知の
周期Ｔを有する代表周期関数に対して、未知の周期ＴＴ
を有する原信号Ｓが、１周期ごとに生じる位相の進み遅
れを、位相角Δθとして求めることができれば、図１６
(c) に示す式によって、未知の周期ＴＴを計算すること
ができる。計算精度をより高めるためには、１周期ごと
に生じる位相の進み遅れの代わりに、複数ｍ周期にわた
って累積して生じる進み遅れを求めるのが好ましい。た
とえば、時間軸上においてｍ周期分隔たることにより、
位相の進み遅れが位相角Δθ_ｍに達したとすれば、図１
６(d) に示すように、ＴＴ＝（ｍＴ−Ｔ・Δθ_ｍ／２π）／ｍなる式によって、未知の周期ＴＴをより高い精度で計算
することができる。

【００７２】要するに、上述の基本原理は、原信号Ｓに
ついて選出された代表周期関数が、原信号を代表する正
確な周期関数であるか否かを、位相の進み遅れが生じる
か否かという観点で判断できることを意味している。た
とえば、正しい代表周期関数Ｓ０が選出された場合を考
えてみよう。この場合、原信号Ｓと代表周期関数Ｓ０と
の位相関係は、時間の経過とともに変化することはな
く、位相の進み遅れは生じない。図１５に示す例では、
たまたま原信号Ｓと代表周期関数Ｓ０との位相は一致し
ており、原信号Ｓの代表周期関数Ｓ０に対する位相角θ
は、時間軸上のどの位置においてもθ＝０となっている
が、もちろん、実際には、両者の位相がずれている場合
もある。「両者の位相がずれている」ということと、
「両者の位相に進み遅れが生じる」ということとは、全
く別な事象である。たとえば、原信号Ｓの代表周期関数
Ｓ０に対する位相角θがθ＝４５°であったとすると、
両者の位相は一致していないが、時間軸上のどの位置に
おいても、この位相角θ＝４５°という関係は変わらな
いのであり、位相の進み遅れを示す位相角Δθ＝０にな
る。両者の周波数が正確に一致していれば、複数ｍ周期
分隔たったとしても、位相角θ＝４５°という関係は維
持されるので、ｍ周期分隔たった位置における位相の進
み遅れを示す位相角Δθ_ｍは、やはり０になる。したが
って、図１６(d)に示す式ＴＴ＝（ｍＴ−Ｔ・Δθ_ｍ／２π）／ｍでは、ＴＴ＝Ｔなる結果が得られる。すなわち、選出さ
れた代表周期関数Ｓ０の周期Ｔは、原信号Ｓの周期ＴＴ
に一致していることになり、代表周期関数Ｓ０は正しい
周期関数であるとの判断ができる。

【００７３】ところが、誤差を含んだ代表周期関数Ｓ１
あるいはＳ２が選出された場合を考えると、これらの周
期関数に対しては、原信号Ｓは位相の進み遅れを生じる
ことになる。すなわち、１周期隔たった位置において
は、位相角Δθ（Δθ≠０）分の進み遅れが生じ、ｍ周
期隔たった位置においては、位相角Δθ_ｍ＝ｍ・Δθ分
の進み遅れが生じることになる。そこで、ｍ周期隔たっ
た位置における位相の進み遅れΔθ_ｍを求めることがで
きれば、上式を用いて、誤差を含んだ代表周期関数Ｓ１
あるいはＳ２の周期Ｔに基づいて、原信号Ｓの周期ＴＴ
を求めることができる。このような方法によれば、選出
された代表周期関数の周期を補正し、より正確な代表周
期関数を得ることができるようになる。

【００７４】§６．正確な代表周波数の決定方法前述した§５の基本原理を利用すれば、§４までに述べ
てきた手法によって選出された代表周波数を、より正確
な周波数に補正することが可能になる。以下、この補正
方法を図１７のモデルを参照しながら説明する。ここで
は、図１７の上段に示されているような原音響信号を符
号化する場合を考えよう。既に述べたように、本発明に
係る符号化は、所定の区間長Ｌをもった単位区間ごとに
行われる。図１７上段の例では、実線で囲った矩形内部
分が、単位区間ｄとして設定されており、この単位区間
ｄ内の原音響信号が区間信号Ｘとなる。したがって、以
下に述べる符号化方法は、この区間信号Ｘを符号化する
方法ということになる。図には、この区間信号Ｘの右に
隣接する隣接信号Ｙ（実線の矩形外に示された波形部
分）が示されているが、後述するように、この隣接信号
Ｙの部分は、区間信号Ｘの符号化を正確に行うために参
照されることになる。

【００７５】さて、まず§２で述べた方法により、区間
信号Ｘについての代表周波数（代表周期関数）の選出を
行う。たとえば、図７に示すように、１２８通りの標準
周波数を予め設定しておき、これら各標準周波数をもっ
た標準周期関数と区間信号Ｘとの相関を計算し、相関が
所定の基準以上の大きさとなる１つまたは複数の標準周
期関数を代表周期関数として選出する。具体的には、§
４で述べた精度の高い相関計算方法を適用し、図１４に
示す式を用いて相関値Ａ（ｎ），Ｂ（ｎ）を求め、二乗
和平方根値Ｅ（ｎ）を算出し、この二乗和平方根値Ｅ
（ｎ）の大きさに基づいて、１つまたは複数の代表周波
数（代表周期関数）を選出するのが好ましい。しかしな
がら、こうして選出した代表周波数は、必ずしも区間信
号Ｘを代表する正確な代表周波数になっているとは限ら
ない。そこで、ここでは、§４までの手法で選出された
代表周波数あるいは代表周期関数を、とりあえず「仮」
のものとして取り扱うことにし、「仮代表周波数」ある
いは「仮代表周期関数」と呼ぶことにする。

【００７６】こうして選出された仮代表周期関数が、区
間信号Ｘを代表する正確な周期関数になっているか否か
は、この仮代表周期関数に対する区間信号Ｘの位相が進
み遅れを生じるか否かによって判断することができる。
ここでは、仮代表周波数として、第ｎ番目の標準周波数
ｆ（ｎ）が選出され、その結果、図１７下段に示すよう
な一対の周期関数、すなわち、 sin（２πｆ（ｎ）・
（ｋ＋Ｋ）／Ｆ）およびcos（２πｆ（ｎ）・（ｋ＋
Ｋ）／Ｆ）が仮代表周期関数として選出された場合を考
える。さて、区間信号Ｘの位相が、選出された仮代表周
期関数に対して、進み遅れを生じるか否かを調べるため
に、単位区間ｄを、当該仮代表周期関数の周期Ｔ（ｎ）
（ここで、Ｔ（ｎ）＝１／ｆ（ｎ））の整数倍に相当す
る時間だけずらすことにより、参照区間ｒ（ｎ）を定義
する。図１７において、一点鎖線で囲った矩形内部が、
この参照区間ｒ（ｎ）を示している。ここで、参照区間
は、特定の仮代表周期関数ごとにそれぞれ別個に定義さ
れるので、１つの単位区間ｄについて複数通りの仮代表
周期関数が選出された場合には、同一の単位区間ｄにつ
いて、各仮代表周期関数ごとに複数通りの参照区間が定
義されることになる。図示の参照区間ｒ（ｎ）は、仮代
表周波数ｆ（ｎ）をもった仮代表周期関数についての参
照区間を意味している。

【００７７】この例では、参照区間ｒ（ｎ）の区間長
は、単位区間ｄの区間長と同一に設定してあるが、必ず
しも両区間の区間長を同一に設定する必要はない。ただ
し、各区間の先頭位置は、仮代表周期関数の周期Ｔ
（ｎ）の整数倍に相当する時間だけずれている必要があ
る。図１７には、整数ｍ倍だけずらすことにより、単位
区間ｄの先頭位置に対して、参照区間ｒ（ｎ）の先頭位
置が、時間軸上ｍ・Ｔ（ｎ）だけ後方に隔たって設定さ
れている例が示されている。この例では、単位区間ｄの
後方に参照区間ｒ（ｎ）を定義しているが、逆に、単位
区間ｄの前方に参照区間ｒ（ｎ）を定義してもかまわな
い。また、この例では、単位区間ｄと参照区間ｒ（ｎ）
とが部分的に重複しているが、このように部分的に重複
するような定義を行ってもよいし、重複が全く起こらな
いような定義を行ってもよい。あるいは、単位区間ｄと
参照区間ｒ（ｎ）との間に空隙部分が生じるような定義
を行ってもかまわない。

【００７８】ただ、実用上は、整数ｍ＝１程度に設定し
たのでは、たかだか１周期分についての位相の進み遅れ
しか求めることができないので、位相の進み遅れを高い
精度で検出することはできない。整数ｍを大きく設定す
ればするほど、位相の進み遅れが累積することになるの
で、位相の進み遅れを累積させるという観点からは、整
数ｍをできるだけ大きく設定し、ずれ量を大きくした方
がよい。しかしながら、ずれ量があまり大きくなりすぎ
ると、別な問題が生じることになる。すなわち、参照区
間ｒ（ｎ）は、区間信号Ｘの仮代表周期関数に対する位
相の進み遅れの有無を検出するために利用される区間で
あるため、参照区間ｒ（ｎ）内の隣接信号Ｙは、単位区
間ｄ内の区間信号Ｘに対して、周波数および位相ともに
整合性をもった信号である必要がある。単位区間ｄと参
照区間ｒ（ｎ）との時間軸上でのずれ量があまり大きく
なると、区間信号Ｘと隣接信号Ｙとの間の周波数および
位相に関する整合性が確保できなくなるおそれがある。
したがって、整数ｍはできるだけ大きく設定した方がよ
いのであるが、ずれ量の絶対値であるｍ・Ｔ（ｎ）をあ
まり大きく設定するのは好ましくない。したがって、実
用上は、ｍ・Ｔ（ｎ）の値が所定の上限値Ｔmax を超え
ない範囲内で最大となるように、仮代表周期関数の周期
Ｔ（ｎ）に応じて異なる整数ｍを設定するのが好まし
い。こうすれば、仮代表周期関数の周期Ｔ（ｎ）が小さ
い場合には、整数ｍの値を大きく設定することができ、
位相の進み遅れを累積させるという観点から、精度の高
い結果を得ることができる。しかも両区間の時間軸上で
のずれ量は、Ｔmax が上限となるため、区間信号Ｘと隣
接信号Ｙとの間の周波数および位相に関する整合性も確
保することができる。

【００７９】本願発明者が行った実験によれば、上限値
Ｔmax を区間長Ｌと同じ程度に設定すると、かなり好ま
しい結果が得られた。この場合、参照区間ｒ（ｎ）の単
位区間ｄに対するずれ量は、区間長Ｌに近い値となり、
図１７に示されている実例のｍ・Ｔ（ｎ）よりも更に２
周期分ほど長くなる。このときのずれ量は、結果的に、
図１３に示す相関計算対象区間に等しくなる。これは、
図１３に示す相関計算対象区間も、区間長Ｌを超えない
範囲内で、周期関数の周期Ｔ（ｎ）の整数Ｍ倍となるよ
うな最大区間として定義された区間だからである。結
局、この相関計算対象区間に相当する時間軸上での長さ
を、図１７に示すモデルにおけるずれ量ｍ・Ｔ（ｎ）と
して設定すれば、サンプル数にしてちょうどｗ（ｎ）個
分だけずらした区間として、参照区間ｒ（ｎ）が定義さ
れることになる。以下、このようなずれ量設定を行った
場合の例を述べることにする。

【００８０】さて、上述のように、単位区間ｄに対し
て、サンプル数にしてｗ（ｎ）個分だけずらした区間と
して参照区間ｒ（ｎ）が定義できたら、まず、区間信号
Ｘ（単位区間ｄ内の原音響信号）と仮代表周期関数との
位相差を示す第１の位相角θ１（ｎ）を求める。続い
て、隣接信号Ｙ（参照区間ｒ（ｎ）内の原音響信号）と
仮代表周期関数との位相差を示す第２の位相角θ２
（ｎ）を求める。更に、第１の位相角θ１（ｎ）と第２
の位相角θ２（ｎ）との差を、 Δθ（ｎ）＝θ２（ｎ）−θ１（ｎ）なる計算で求めれば、この差に相当する位相角Δθ
（ｎ）は、−π≦Δθ（ｎ）≦＋πなる範囲の値とな
り、仮代表周期関数の周期Ｔ（ｎ）の整数ｍ倍だけ隔た
った時間位置における位相の進み遅れを示すパラメータ
ということになる。そこで、この図１７に示すモデル
に、図１６(d) に示す式を適用すれば、図１８に示す式ＴＴ（ｎ）＝（ｍ・Ｔ（ｎ）−Ｔ（ｎ）・Δθ（ｎ）／
２π）／ｍが得られることになる。この式は、仮代表周期関数の周
期Ｔ（ｎ）に基づいて、区間信号Ｘに含まれている真の
周期関数の周期ＴＴ（ｎ）を予想する式に他ならない。
別言すれば、Δθ（ｎ）≠０の場合、仮代表周期関数の
周波数は、区間信号Ｘに含まれている真の周期関数の周
波数に対して、何らかの誤差を生じていたことになり、
上式は、この誤差を補正するための式ということにな
る。

【００８１】第１の位相角θ１（ｎ）および第２の位相
角θ２（ｎ）を求めるには、§３で述べた手法を利用す
ればよい。まず、第１の位相角θ１（ｎ）は、単位区間
ｄについて、図１９に示す式を適用すればよい。ここ
で、相関値Ａ１（ｎ）は、単位区間ｄ内の区間信号Ｘと
仮代表周波数ｆ（ｎ）をもった周期信号 sin（２πｆ
（ｎ）・（ｋ＋Ｋ）／Ｆ）との相関値であり、相関値Ｂ
１（ｎ）は、単位区間ｄ内の区間信号Ｘと仮代表周波数
ｆ（ｎ）をもった周期信号 cos（２πｆ（ｎ）・（ｋ＋
Ｋ）／Ｆ）との相関値である。これらの式は、図１４の
式に相当するものであり、単位区間ｄ（区間長Ｌ）全体
に含まれる全ｗ個のサンプルについてではなく、相関計
算対象区間（区間長ｗ（ｎ）／Ｆ）内のｗ（ｎ）個のサ
ンプルについてのみ計算を行うことにより、相関計算の
精度を向上させている。もっとも、この相関値Ａ１
（ｎ），Ｂ１（ｎ）を求める計算は、既に、仮代表周波
数ｆ（ｎ）を選出する段階において行われているので、
実用上は、その結果をそのまま流用すれば足りる。相関
値Ａ１（ｎ），Ｂ１（ｎ）が得られたら、これらの比に
基づき、図１９の下半分に示す式（§３において述べた
図１２の式に相当）により第１の位相角θ１（ｎ）が得
られる。

【００８２】一方、第２の位相角θ２（ｎ）は、参照区
間ｒ（ｎ）について、図２０に示す式を適用すればよ
い。ここで、相関値Ａ２（ｎ）は、参照区間ｒ（ｎ）内
の隣接信号Ｙと仮代表周波数ｆ（ｎ）をもった周期信号
sin（２πｆ（ｎ）・（ｋ＋Ｋ＋ｗ（ｎ））／Ｆ）との
相関値であり、相関値Ｂ１（ｎ）は、参照区間ｒ（ｎ）
内の隣接信号Ｙと仮代表周波数ｆ（ｎ）をもった周期信
号 cos（２πｆ（ｎ）・（ｋ＋Ｋ＋ｗ（ｎ））／Ｆ）と
の相関値である。これらの式も、基本的には、図１４の
式に相当するものであり、参照区間ｒ（ｎ）全体に含ま
れる全ｗ個のサンプルについてではなく、相関計算対象
区間内のｗ（ｎ）個のサンプルについてのみ計算を行う
ことにより、相関計算の精度を向上させている。なお、
この図２０に示す式は、前述したように、参照区間ｒ
（ｎ）の単位区間ｄに対するずれ量を、サンプル数にし
てｗ（ｎ）個分（すなわち、相関計算対象区間に相当す
る長さ）に設定した場合の例であり、隣接信号Ｙを示す
関数として、Ｘ（ｋ＋Ｋ＋ｗ（ｎ））なる関数を定義し
ている。これをもう少し詳しく説明してみよう。

【００８３】まず、区間信号Ｘと隣接信号Ｙとの相違を
考えてみると、両信号ともに基本的には原音響信号の一
部であり、前者が単位区間ｄ内の信号をさすのに対し、
後者が参照区間ｒ（ｎ）内の信号をさすという区間の違
いがあるだけである。そこで、図２０の式では、隣接信
号Ｙについても、区間信号Ｘと同じ関数名Ｘを用いて示
してある。区間信号Ｘおよび隣接信号Ｙを、同じ関数Ｘ
（ξ）で表した場合、区間信号Ｘの場合の引数ξは、
「ｋ＋Ｋ」であるのに対し、隣接信号Ｙの場合の引数ξ
は、「ｋ＋Ｋ＋ｗ（ｎ）」になる。ここで、ｋは、相対
サンプル番号であり、ｋ＝０，１，２，…，ｗ−１の値
をとり、Ｋは、絶対サンプル番号であり、単位区間ｄの
先頭位置にあるサンプルの累積番号に相当する。また、
ｗ（ｎ）は、参照区間ｒ（ｎ）の単位区間ｄに対するず
れ量に相当するサンプル数である。以上、図２０の上半
分に示す式の意味を簡単に説明したが、これらの式を用
いて、相関値Ａ２（ｎ），Ｂ２（ｎ）が得られたら、こ
れらの比に基づき、図２０の下半分に示す式（§３にお
いて述べた図１２の式に相当）により第２の位相角θ２
（ｎ）が得られる。

【００８４】このようにして、第１の位相角θ１（ｎ）
および第２の位相角θ２（ｎ）が求まったら、図２１に
示す式により、仮代表周期関数の周期Ｔ（ｎ）をより正
確な周期ＴＴ（ｎ）に補正することができる。すなわ
ち、ｍ周期分だけ累積された位相の進み遅れを示す位相
角Δθ（ｎ）を、 Δθ（ｎ）＝θ２（ｎ）−θ１（ｎ）として求め、ＴＴ（ｎ）＝（ｗ（ｎ）／Ｆ−Ｔ（ｎ）・Δθ（ｎ）／
２π）／ｍなる式によって、補正後の周期ＴＴ（ｎ）が求まる。こ
の式は、図１８に示す式におけるｍ・Ｔ（ｎ）なる項
を、ｗ（ｎ）／Ｆなる項に置き換えたものである。これ
は、ここで述べている例が、参照区間ｒ（ｎ）の単位区
間ｄに対するずれ量を、サンプル数にしてｗ（ｎ）個分
に設定した場合の例であるためであり、図１７に示すモ
デルにおけるずれ量ｍ・Ｔ（ｎ）が、ｗ（ｎ）／Ｆに相
当するためである。こうして、仮代表周波数ｆ（ｎ）を
もった仮代表周期関数の周期Ｔ（ｎ）が、周期ＴＴ
（ｎ）に補正されたら、ｆｆ（ｎ）＝１／ＴＴ（ｎ）なる周波数ｆｆ（ｎ）が、代表周波数として決定され、
この代表周波数ｆｆ（ｎ）をもった周期関数が代表周期
関数として決定される。

【００８５】もちろん、このような補正によって得られ
た代表周波数ｆｆ（ｎ）は、予め用意した標準周波数と
は必ずしも一致しない。たとえば、図７に示すような１
２８通りの標準周波数ｆ（０）〜ｆ（１２７）を用意し
て、§２に示す手順によって仮代表周波数を選出した場
合、この仮代表周波数自身は、予め用意した１２８通り
の標準周波数から選出された周波数になるが、上述した
方法により、この仮代表周波数に補正を施すことにより
得られる代表周波数は、必ずしも標準周波数から選出さ
れた周波数にはならない（もちろん、位相の進み遅れを
示す位相角Δθ（ｎ）が０になった場合には、仮代表周
波数がそのまま代表周波数となる）。したがって、この
補正によって得られた代表周波数をそのまま周波数情報
として含む符号データを生成した場合、様々な周波数情
報を含んだ符号データが生成されることになる。もちろ
ん、生成した符号データを復号化する装置が、このよう
な様々な周波数情報を含んだ符号データを取り扱うこと
ができれば、特に問題は生じない。しかしながら、たと
えば、ＭＩＤＩデータを取り扱う一般的な装置において
復号化を行うのが前提であれば、ノートナンバーに対応
した標準周波数のみを含む符号データを生成するのが好
ましい。この場合は、補正によって得られた代表周波数
に近似する標準周波数を、最終的な周波数情報として符
号データに含ませるようにすればよい。

【００８６】標準周波数ｆ（ｎ）とノートナンバーＮ
（ｎ）との関係は、図２１に示すように、Ｎ（ｎ）＝４０・ｌｏｇ（ｆ（ｎ）／４４０）なる式で表される（但し、Ｎ（ｎ）は、０〜１２７の整
数）。したがって、補正によって得られた代表周波数ｆ
ｆ（ｎ）に最も近似する標準周波数ｆ（ｎ）を、最終的
な符号データに含ませるようにすれば、ノートナンバー
に対応した標準周波数のみを含む符号データを生成する
ことができる。

【００８７】以上、最終的に生成する符号データ内の周
波数の取り扱いについて述べたが、ＭＩＤＩデータの場
合、区間信号Ｘの代表周波数が周波数情報（ノートナン
バー）として表現されるとともに、当該代表周波数をも
った代表周期関数に対する区間信号Ｘの相関値が強度情
報（ベロシティー）として表現されることになる。ま
た、§３で述べたように、必要に応じて、代表周期関数
に対する区間信号Ｘの位相情報を符号データに付加する
場合もある。このような強度情報あるいは位相情報とし
ては、仮代表周期関数を選出する際に計算した相関値
（二乗和平方根値Ｅ（ｎ））や位相角（θ（ｎ））をそ
のまま用いることも可能であるが、より正確な強度情報
や位相情報を得るためには、補正後の代表周期関数を用
いた再計算を行うのが好ましい。たとえば、仮代表周波
数ｆ（ｎ）に対する補正を行うことにより、代表周波数
ｆｆ（ｎ）が得られたとしたら、単位区間ｄについて、
図２２に示す式に基づく再計算を行えばよい。

【００８８】ここで、ＡＡ（ｎ）は、代表周波数ｆｆ
（ｎ）をもった周期関数 sin（２πｆ（ｎ）・（ｋ＋
Ｋ）／Ｆ）と区間信号Ｘとの相関値であり、ＢＢ（ｎ）
は、代表周波数ｆｆ（ｎ）をもった周期関数 cos（２π
ｆ（ｎ）・（ｋ＋Ｋ）／Ｆ）と区間信号Ｘとの相関値で
ある。これら両相関値の二乗和平方根値ＥＥ（ｎ）とし
て、代表周波数ｆｆ（ｎ）についての正確な強度情報を
得ることができる。また、これら両相関値の比に基づい
て、代表周波数ｆｆ（ｎ）をもった代表周期関数に対す
る区間信号Ｘの正確な位相情報を得ることができる。

【００８９】§７．一般化調和解析の手法を用いた代表
周波数の選出方法本発明に係る符号化の原理として、§１では、区間信号
のフーリエスペクトルにおけるスペクトル強度値に基づ
いて、複数の仮代表周波数を選出する方法の他に、特願
平１１−５８４３１号明細書に開示されている一般化調
和解析の手法を用いて複数の仮代表周波数を選出する方
法があることを述べた。前者の方法を採った場合、複数
Ｐ個の仮代表周波数が同時に求まるので（フーリエスペ
クトルのスペクトル強度値の大きさの順にＰ個の仮代表
周波数を抽出すればよい）、§６で述べた周波数補正に
より正確な代表周波数を求める際には、それぞれの仮代
表周波数に対して別個独立した周波数補正を施し、それ
ぞれについて代表周波数を得るようにすればよい。とこ
ろが、後者の方法を採った場合、複数Ｐ個の仮代表周波
数が同時に求まるのではなく、周波数の選出が１つずつ
順番に行われてゆくことになる。そこで、この後者の方
法に、§６で述べた周波数補正法を適用する際には、次
のような手順を採るのが好ましい。

【００９０】まず、単位区間ｄ内に任意の区間信号Ｘが
与えられたものとする。ここでは、この当初の区間信号
をＸ１と表現する。この区間信号Ｘ１に対して、第１回
目のフーリエ変換を行い、フーリエスペクトルを求め、
スペクトル強度値が最も高い標準周波数を、第１の仮代
表周波数ｆ（ｎ１）として選出する。続いて、この第１
の仮代表周波数ｆ（ｎ１）に対して、§６で述べた周波
数補正を施し、第１の代表周波数ｆｆ（ｎ１）を求め
る。そして、この第１の代表周波数ｆｆ（ｎ１）をもっ
た第１の代表周期関数Ｇ１の信号成分を、区間信号Ｘ１
から引き去り、残った差分信号を新たな区間信号Ｘ２と
する。そして、この区間信号Ｘ２に対して、第２回目の
フーリエ変換を行い、フーリエスペクトルを求め、スペ
クトル強度値が最も高い標準周波数を、第２の仮代表周
波数ｆ（ｎ２）として選出する。続いて、この第２の仮
代表周波数ｆ（ｎ２）に対して、§６で述べた周波数補
正を施し、第２の代表周波数ｆｆ（ｎ２）を求める。そ
して、この第２の代表周波数ｆｆ（ｎ２）をもった第２
の代表周期関数Ｇ２の信号成分を、区間信号Ｘ２から引
き去り、残った差分信号を新たな区間信号Ｘ３とする。
このような処理をＰ回繰り返して行えば、合計Ｐ個の代
表周波数を決定することができる。

【００９１】以上の処理を一般論として説明すれば、次
のとおりである。まず、図３(a) に示すように、第ｊ番
目の区間信号Ｘｊが与えられたときに、この区間信号Ｘ
ｊに対する相関が最も大きくなる標準周期関数を第ｊ番
目の仮代表周期関数として選出する。そして、§６で述
べた周波数補正法に基づき、この第ｊ番目の仮代表周期
関数の周期を補正することにより、第ｊ番目の代表周期
関数Ｇｊ（周波数ｆｆｊ）を求める。そして、図３(b)
に示すように、区間信号Ｘｊに含まれている第ｊ番目の
代表周期関数Ｇｊからなる信号成分を、第ｊ番目の区間
信号Ｘｊから減じ、その結果得られる差分信号を、図３
(c) に示すように、第（ｊ＋１）番目の区間信号Ｘｊ＋
１とする。このような作業を、ｊ＝１〜Ｐまで繰り返し
実行することにより、合計Ｐ個の代表周波数を得ること
ができる。

【００９２】なお、第ｊ番目の代表周期関数Ｇｊからな
る信号成分を、第ｊ番目の区間信号Ｘｊから減じる際の
具体的な演算は、図２３に示す式に基づいて行えばよ
い。この式で、Ｘ_ｊ＋１（ｋ＋Ｋ）は第（ｊ＋１）番目
の区間信号を示し、Ｘ_ｊ（ｋ＋Ｋ）は第ｊ番目の区間信
号を示し、Ｇ_ｊ（ｋ＋Ｋ）は第ｊ番目の代表周期関数を
示し、ｆｆ_ｊはその周波数を示し、ＡＡ（ｊ），ＢＢ
（ｊ）は、第ｊ番目の区間信号Ｘ_ｊと周波数ｆｆ_ｊをも
った正弦波および余弦波との相関値を示している。

【００９３】§８．符号データの統合処理図４(b) に示す符号化の例では、個々の符号がすべて８
分音符で示されている。これは、単位区間ｄ１，ｄ２，
ｄ３，ｄ４，…がいずれも同一の区間長を有しているた
めである。しかしながら、実際の音響信号には、複数の
単位区間にわたって持続する音の成分が多数含まれてお
り、これらを個々の単位区間ごとに細切れに符号化する
と、符号化の効率は極めて低下してしまう。そこで、一
連の音成分を表現していると判断できる複数の符号につ
いては、１つの符号に統合する処理を行うのが好まし
い。たとえば、図４(b) のトラックＴ１に配置されてい
るノートｎ（ｄ２，１）とノートｎ（ｄ３，１）は、同
一音程の８分音符であるから、これを１つの４分音符に
統合しても問題はない。

【００９４】ただ、本願発明により生成された符号デー
タには、周波数情報の他に、必要に応じて、強度情報あ
るいは位相情報が含まれている場合があるので、符号の
統合を行うか否かを判断する際には、これら３つの要素
を総合的に判断するのが好ましい。たとえば、同一音程
（周波数情報が同一）の２つの符号データが連続してい
る場合であっても、両者の位相が不連続であったとする
と、両符号データはそれぞれ別個の音成分を表現してい
る可能性が高く、１つの符号に統合するべきではない。
本願発明者は、時間軸上で近接配置された複数の符号デ
ータについての符号の統合化を行う基準として、これら
符号データに含まれる周波数情報、強度情報、位相情報
なる３つの要素のうちのいくつかが、それぞれ所定の許
容範囲内で近似している複数の符号データが生成された
場合に、これら複数の符号データを１つの符号データに
統合する処理を行うようにすると、理想的な符号統合化
が可能になると考えている。たとえば、強度情報に関し
ては一切考慮せずに、周波数情報と位相情報とがそれぞ
れ所定の許容範囲内で近似していた場合に統合化を行う
ようにしてもよいし、周波数情報、強度情報、位相情報
のすべてが、それぞれ所定の許容範囲内で近似していた
場合に統合化を行うようにしてもよい。

【００９５】所定の許容範囲は、実情に合わせて適宜設
定することが可能である。たとえば、周波数情報に関し
ては、「同一の周波数」というような厳格な範囲を定め
ることもできるし、「ノートナンバーの差が１以内」と
いうような範囲を定めることもできる。位相情報に関し
ても同様に、たとえば、「差がπ／１０以内」というよ
うな範囲を定めることができる。また、時間軸上で近接
配置された複数の符号データであるか否かの基準として
は、たとえば、「単位区間の始端位置の差が５ｍｓ以
内」というような範囲を定めることができる。

【００９６】図２４は、このような方針に基く符号デー
タの統合処理の具体的な処理手順を示す図であり、ここ
では、時間軸上で近接配置された複数の符号データのう
ち、周波数情報および位相情報が、それぞれ所定の許容
範囲内で近似していた場合に統合化を行うような処理が
行われている。たとえば、図２４(a) に示すような符号
データが生成されたものとしよう。ここに示すＮ１〜Ｎ
４は、それぞれ所定の周波数（１２８通りの標準周波数
のうちのいずれか）、所定の位相角、所定の振幅強度を
有する符号データであり、同一名称の符号データは周波
数が同一であることを示しており、横軸上の位置は、時
間軸上での位置を示している。このような符号データ群
が得られたら、図２４(b) に示すように、各符号データ
を周波数ごとにそれぞれ分離して配置してみる。この例
では、Ｎ１〜Ｎ４という４種類の周波数をもつ符号デー
タが存在するので、これらをそれぞれ４行に分けて配置
する。すると、同一行に隣接配置された符号データは、
同一周波数を有し、時間軸上の近似範囲に配置された符
号データということになるので、もし、位相角の差が所
定の許容範囲内であったとすれば、前述した統合化の基
準を満たすことになる。そこで、同一行に隣接配置され
た符号データのうち、位相角の差が所定の許容範囲内に
あるものを統合化し、１つの符号データに置き換える。
なお、置換後の位相角は、たとえば、置換前の各符号デ
ータの位相角の平均となるように設定すればよい。

【００９７】図２４(c) は、このような統合化後の符号
データを示す図である。矩形で囲われた符号データが、
統合化後の１つの符号データを示している。たとえば、
図２４(c) の１行目に示されている２つの符号データ
「Ｎ１，Ｎ１」は、図２４(b)に示されている４つの符
号データ「Ｎ１，Ｎ１，Ｎ１，Ｎ１」を統合して得られ
たものである。この例では、図２４(b) に示す４つの符
号データのうち、１番目および２番目の符号データの位
相角の差は許容範囲内であり、３番目および４番目の符
号データの位相角の差も許容範囲内であるが、２番目お
よび３番目の符号データの位相角の差が許容範囲を越え
ていた場合の統合結果が示されている。図２４(d) は、
この図２４(c) に示す符号データをＭＩＤＩ符号で示す
場合のノートオンおよびノートオフの符号列を示す図で
ある。このように、符号の統合化を行うことにより、本
来、図２４(a) に示すような形態であった符号データ
を、図２４(d) に示すように、合計１２組のノートオン
またはノートオフデータによって表現することが可能に
なる。

【００９８】§９．ＭＩＤＩデータによる表現手法図２５は、現在、最も標準的に利用されているＳＭＦ
（Standard MIDI File）フォーマットによるＭＩＤＩデ
ータの形式を示す図である。図示のとおり、このＭＩＤ
Ｉデータは、「ノートオン」データもしくは「ノートオ
フ」データが、「デルタタイム」データを介在させなが
ら存在する。「デルタタイム」データは、１〜４バイト
のデータで構成され、所定の時間間隔を示すデータであ
る。一方、「ノートオン」データは、全部で３バイトか
ら構成されるデータであり、１バイト目はノートオン符
号「９０ H」に固定されており（後述するように、チャ
ンネル番号０の場合。 Hは１６進数を示す）、２バイト
目にノートナンバーＮを示すコードが、３バイト目にベ
ロシティーＶonを示すコードが、それぞれ配置される。
ノートナンバーＮは、音階（一般の音楽でいう全音７音
階の音階ではなく、ここでは半音１２音階の音階をさ
す）の番号を示す数値であり、このノートナンバーＮが
定まると、たとえば、ピアノの特定の鍵盤キーが指定さ
れることになる（Ｃ−２の音階がノートナンバーＮ＝０
に対応づけられ、以下、Ｎ＝１２７までの１２８通りの
音階が対応づけられる。ピアノの鍵盤中央のラの音（Ａ
３音）は、ノートナンバーＮ＝６９になる）。ベロシテ
ィーＶonは、音の強さを示すパラメータであり（もとも
とは、ピアノの鍵盤などを弾く速度を意味する）、Ｖon
＝０〜１２７までの１２８段階の強さが定義される。

【００９９】同様に、「ノートオフ」データも、全部で
３バイトから構成されるデータであり、１バイト目は常
にノートオフ符号「８０ H」に固定されており（チャン
ネル番号０の場合）、２バイト目にノートナンバーＮを
示すコードが、３バイト目にベロシティーＶoff を示す
コードが、それぞれ配置される。「ノートオン」データ
と「ノートオフ」データとは対になって用いられ、この
一対のデータにより１つのノート（音符）についての発
音開始操作および発音終了操作が表現されることにな
る。たとえば、「９０ H，６９，８０」なる３バイトの
「ノートオン」データは、ノートナンバーＮ＝６９に対
応する鍵盤中央のラのキーを押し下げる操作（ラの音符
の発音開始操作）を表現し、以後、同じノートナンバー
Ｎ＝６９を指定した「ノートオフ」データが与えられる
まで、そのキーを押し下げた状態が維持される（実際に
は、ピアノなどのＭＩＤＩ音源波形を用いた場合、有限
の時間内に、ラの音の波形は減衰してしまう）。そし
て、ノートナンバーＮ＝６９を指定した「ノートオフ」
データは、たとえば、「８０ H，６９，５０」のような
３バイトのデータとして与えられ、このような「ノート
オフ」データは、鍵盤中央のラのキーから指を離す操作
（ラの音符の発音終了操作）を表現する。なお、「ノー
トオフ」データにおけるベロシティーＶoff の値は、た
とえばピアノの場合、鍵盤キーから指を離す速度を示す
パラメータになる。

【０１００】別言すれば、特定のノート（音符）に関す
る情報が、同一ノートナンバーＮを引用した「ノートオ
ン」データと「ノートオフ」データとのデータ対によっ
て表現されることになる。すなわち、特定のノート（音
符）に関して、「ノートオン」データにより発音開始操
作（たとえば、ピアノの鍵盤キーを押し下げる操作）が
記述され、「ノートオフ」データにより発音終了操作
（たとえば、鍵盤キーから指を離す操作）が記述され
る。また、この特定のノートの発音時間（発音開始操作
から発音終了操作に至るまでの時間：実際に楽器の音が
鳴り始めてから鳴り終わるまでの時間とは必ずしも一致
しない）は、「ノートオン」データと、これと対になる
「ノートオフ」データとの間に介在するデルタタイムに
よって定まる。

【０１０１】図２６に、具体的なＭＩＤＩデータの構成
例を示す。図２６(a) に示す例は、ノートナンバーＮ１
で示されるノート（音符）の演奏情報を、ＭＩＤＩデー
タで記述したものである。データｄ１は、１〜４バイト
からなるデルタタイムＴ１を示すデータ（必要なバイト
数は、デルタタイムの長さによって異なる）である。こ
のデルタタイムのデジタル値は、たとえば、Ｔ１＝１／
７６８秒のようなスケーリングを予め定義しておくこと
により、時間を示す値となる。データｄ２は、ノートナ
ンバーＮ１で示されるノート（以下、単にノートＮ１と
いう）の発音開始操作を記述した「ノートオン」データ
であり、１バイト目にノートオン符号：９０H 、２バイ
ト目にノートナンバー：Ｎ１、３バイト目にベロシティ
ー：Ｖonの各コードが配置されている。たとえば、ピア
ノの場合、ノートＮ１に対応する鍵盤キーを、ベロシテ
ィーＶonで示される強さ（速度）で押し下げるという発
音開始操作を示すことになる。続くデータｄ３は、１〜
４バイトからなるデルタタイムＴ２を示すデータであ
り、やはり具体的な時間を示す値となる。最後のデータ
ｄ４は、ノートＮ１の発音終了操作を記述した「ノート
オフ」データであり、１バイト目にノートオフ符号：８
０H 、２バイト目にノートナンバー：Ｎ１、３バイト目
にベロシティー：Ｖoff の各コードが配置されている。
たとえば、ピアノの場合、ノートＮ１に対応する鍵盤キ
ーから、ベロシティーＶoff で示される強さ（速度）で
指を離すという発音終了操作を示すことになる。

【０１０２】こうして、図２６(a) に示すデータｄ１〜
ｄ４によって、ノートＮ１に関する演奏情報が記述され
ることになる。このように、ＭＩＤＩデータでは、同一
のノートナンバーＮを引用した一対のデータ（「ノート
オン」データおよび「ノートオフ」データ）によって、
特定のノートに関する演奏情報が示される。また、「ノ
ートオン」データや「ノートオフ」データで示される発
音開始操作や発音終了操作を実行するタイミングは、先
行する「デルタタイム」データに基づいて定まる。たと
えば、このＭＩＤＩデータを再生する際の基準時刻をｔ
０とすれば、データｄ２で示される発音開始操作の時刻
は、これに先行する「デルタタイム」データｄ１に基づ
いて定まり、具体的には、時刻（ｔ０＋Ｔ１）の時点で
発音開始操作が実行される。同様に、データｄ４で示さ
れる発音終了操作の時刻は、これに先行する「デルタタ
イム」データｄ１，ｄ３に基づいて定まり、具体的に
は、時刻（ｔ０＋Ｔ１＋Ｔ２）の時点で発音終了操作が
実行される。したがって、この例の場合のノートＮ１の
発音時間は、デルタタイムＴ２に一致する。

【０１０３】図２６(b) に示す例は、ノートＮ１の演奏
時間とノートＮ２の演奏時間とが一部重なり、和音が発
生する例である。まず、最初のデータｄ１によって、デ
ルタタイムＴ１が示され、続くデータｄ２によって、ノ
ートＮ１についての発音開始操作が示される。次のデー
タｄ３によって、再びデルタタイムＴ２が示され、続く
データｄ４によって、ノートＮ２についての発音開始操
作が示される。すなわち、この時点では、２つのノート
Ｎ１，Ｎ２が同時に発音している状態になり、和音とし
ての再生が行われることになる。続くデータｄ５によっ
て、デルタタイムＴ３が示され、データｄ６によって、
ノートＮ２についての発音終了操作が示される。更に、
データｄ７によって、デルタタイムＴ４が示され、最後
のデータｄ８によって、ノートＮ１についての発音終了
操作が示される。

【０１０４】結局、この図２６(b) に示すデータｄ１〜
ｄ８のうち、一対のデータｄ２，ｄ８は、同一のノート
ナンバーＮ１を引用してノートＮ１に関する演奏情報を
記述したデータであり、一対のデータｄ４，ｄ６は、同
一のノートナンバーＮ２を引用してノートＮ２に関する
演奏情報を記述したデータということになる。ここで、
個々の操作を行うべき時刻は、やはり先行するデルタタ
イムに基づいて定まることになる。すなわち、このＭＩ
ＤＩデータを再生する際の基準時刻をｔ０とすれば、デ
ータｄ２で示されるノートＮ１の発音開始操作は時刻
（ｔ０＋Ｔ１）、データｄ４で示されるノートＮ２の発
音開始操作は時刻（ｔ０＋Ｔ１＋Ｔ２）、データｄ６で
示されるノートＮ２の発音終了操作は時刻（ｔ０＋Ｔ１
＋Ｔ２＋Ｔ３）、データｄ８で示されるノートＮ１の発
音終了操作は時刻（ｔ０＋Ｔ１＋Ｔ２＋Ｔ３＋Ｔ４）と
なり、ノートＮ１の発音時間は、Ｔ２＋Ｔ３＋Ｔ４とな
り、ノートＮ２の発音時間は、Ｔ３となる。

【０１０５】以上、ＭＩＤＩデータを用いた一般的な音
響データの表現方法を簡単に説明したが、本発明に係る
方法を用いれば、任意の音響信号をＭＩＤＩデータに変
換することが可能になる。この場合、図７に示すよう
に、ノートナンバーに対応する１２８通りの標準周波数
を予め設定しておけばよい。ただ、§６で述べた周波数
補正を行うと、最終的に得られる代表周波数は、必ずし
も予め用意した１２８通りの標準周波数にはならない場
合があり、ノートナンバーとして表現することができな
くなる。このような場合は、代表周波数を、１２８通り
の標準周波数の中の最も近い標準周波数によって置き換
えるようにすればよい。

【０１０６】また、位相情報をＭＩＤＩデータに盛り込
むのであれば、チャンネル番号を位相を示す情報として
利用することが可能である。上述の説明では、チャンネ
ル番号が０という前提の下で、ノートオン符号「９０
H」およびノートオフ符号「８０ H」が固定であると述
べたが、これらの符号の下位４ビットは必ずしも０に固
定されているわけではなく、チャンネル番号０〜１５の
いずれかを特定するコードとして利用できる。通常、複
数のチャンネルは、複数種類の楽器の音色を表現するた
めに利用されることが多いが、位相情報として利用すれ
ば、ＭＩＤＩデータを用いて位相情報を表現することが
可能になる。

【０１０７】§１０．倍音成分の除去処理一般に、楽器音には、多数の倍音成分が含まれている。
たとえば、ピアノのある１つの鍵盤を鳴らした場合、当
該鍵盤の音は、特定のノートナンバーに対応しており、
理論的には、この特定のノートナンバーで示される単一
の周波数λの音に対応しているはずである。しかしなが
ら、実際には、この周波数λの整数倍である２λ，３
λ，４λといった周波数をもった倍音成分の音も同時に
発生することになる。より具体的に言えば、たとえば、
ノートナンバーＮ＝６９に対応するピアノ鍵盤中央のラ
のキーを鳴らすと、本来の４４０Ｈｚの音とともに、８
８０Ｈｚ，１３２０Ｈｚ，１７６０Ｈｚといった２倍
音，３倍音，４倍音の音も発生することになる。したが
って、本発明に係る手法を用いて、ピアノ鍵盤中央のラ
のキーを鳴らしたときの音をＭＩＤＩ符号化した場合、
本来の４４０Ｈｚの周波数が代表周波数として選出され
るとともに、その倍音成分である８８０Ｈｚ，１３２０
Ｈｚ，１７６０Ｈｚといった周波数も代表周波数として
選出されてしまう可能性がある。もし、これらの倍音成
分がすべて代表周波数として選出されてしまうと、最終
的には、４４０Ｈｚ，８８０Ｈｚ，１３２０Ｈｚ，１７
６０Ｈｚという４種類の代表周波数が選出され、１つの
ピアノのキーの音に対して、４つのＭＩＤＩ音符が作成
されてしまうことになり好ましくない。この場合、最も
周波数の低い４４０ＨｚについてのＭＩＤＩデータのみ
を残し、それ以外の３つのＭＩＤＩデータは除去しなけ
ればならない（実際の演奏操作としては、ラのキーを鳴
らしただけであるから、本来、この演奏操作を記述する
ＭＩＤＩデータのみが作成されなければならない）。

【０１０８】逆に言えば、１つの単位区間ｄに対して、
複数Ｐ個の代表周波数が選出され、この複数の代表周波
数の中に、一方の周波数が他方の周波数の整数倍になる
関係をもつものがあれば、この整数倍の成分は原音響信
号に含まれていた楽器の倍音成分であることが予想され
る。もし楽器の倍音成分であるならば、これを除去する
必要がある。しかしながら、一方の周波数が他方の周波
数の整数倍になる関係にある、という条件だけで、これ
を楽器の倍音成分と判断して除去することはできない。
たとえば、周波数が整数倍となる関係にある複数の鍵盤
キーを、和音として同時に鳴らした場合にも、互いに整
数倍となる代表周波数が選出されることになる。

【０１０９】結局、本発明を利用して、ピアノの演奏音
をＭＩＤＩデータとして符号化する場合、得られた符号
データの中に周波数が整数倍となるような複数の符号が
含まれていたとしても、意図的に和音として複数のキー
が鳴らされたのか（第１の要因）、あるいは単一のキー
しか鳴らされていないのにその倍音成分が混じってしま
ったのか（第２の要因）、を認識しなければ、余分な符
号の除去を行ってよいのかどうかを判断することはでき
ない。もちろん、このような事情は、ピアノの演奏音の
符号化に限られるものではなく、その他の楽器音を符号
化する場合でも同様である。要するに、複数の音源が同
時に鳴らされたために、周波数が互いに整数倍となるよ
うな複数の符号が生成された（第１の要因）のであれ
ば、これらの符号はいずれも除去すべきではないが、単
一の音源しか鳴らされていないのに、その倍音成分が混
じったために、周波数が互いに整数倍となるような複数
の符号が生成された（第２の要因）のであれば、倍音成
分についての符号は除去しなければならない。

【０１１０】上述した第１の要因か第２の要因かを認識
する方法としては、音の強弱を参考にする方法や、楽器
の調律時における周波数の微小なずれを参考にする方法
などが考えられる。音の強弱を参考にする方法は、「基
本音に付随して発生する倍音成分は、通常、基本音に比
べて信号強度が低い」という性質を利用するもので、た
とえば、基本となる周波数成分の信号に比べ、その整数
倍の周波数成分の信号強度の方が高ければ、これら２つ
の信号は別々の音源によって発生（第１の要因）した可
能性が高い。一方、楽器の調律時における周波数の微小
なずれを参考にする方法は、たとえば、「ピアノなどの
オクターブ和音は、周波数が完全に２倍の関係になるよ
うに調律されていない」という点を利用するもので、た
とえば、２つの信号の周波数が正確に整数倍になってい
た場合には、この２つの信号は、和音によるものではな
く、同一の音源によって発生（第２の要因）した可能性
が高い。しかしながら、これらの認識方法は、かならず
しも精度の高い認識方法ではない。

【０１１１】本願発明者は、上述した第１の要因か第２
の要因かを認識するにあたって、本発明に係る音響信号
の符号化方法に利用するのに適した、新たな方法を考え
ついた。この方法は、音の位相を参考にする方法であ
り、その原理を以下に述べる。いま、第１の要因、すな
わち、和音の演奏のように、複数の音源が同時に鳴らさ
れたために、周波数が互いに整数倍となるような複数の
符号が生成された場合を考える。この場合、別々の音源
から別々の音響信号が発生したわけであるから、各音響
信号には位相の整合性はなく、全くバラバラの位相をも
った音響信号が得られることになる。ところが、第２の
要因、すなわち、単一の音源しか鳴らされていないの
に、その倍音成分が混じったために、周波数が互いに整
数倍となるような複数の符号が生成された場合は、もと
もと単一の音源に基づいて発生した音響信号であるか
ら、各音響信号には位相の整合性が見られるはずであ
る。

【０１１２】たとえば、図２７に示すグラフには、基本
音，２倍音，３倍音，４倍音の各信号波形が示されてい
る。ここで、倍音と基本音との位相関係に着目すると、
図２８の図表に示すような関係が得られることがわか
る。この図表には、基本音の０°，２２．５°，３０
°，…，１８０°という各位相角で示される時間軸上の
位置において、２倍音，３倍音，４倍音の各信号の位相
角がどのようになるかが示されており、括弧内の数字
は、基本音の位相と各倍音の位相との位相差に相当する
角度を示している。たとえば、この図表の１行目を見る
と、いずれの信号も位相角０°となっているが、これは
図２７における点Ｐ１０，Ｐ２０，Ｐ３０，Ｐ４０にお
ける各信号の位相角を示している。この図表の４行目に
は、基本音の信号が位相角４５°となった時点（図２７
の点Ｐ１１に対応）における各倍音信号の位相角が示さ
れている。すなわち、この時点では、２倍音では位相角
が９０°（図２７の点Ｐ２１に対応）、３倍音では位相
角が１３５°（図２７の点Ｐ３１に対応）、４倍音では
位相角が１８０°（図２７の点Ｐ４１に対応）となって
いる。同様に、この図表の７行目には、基本音の信号が
位相角９０°となった時点（図２７の点Ｐ１２に対応）
における各倍音信号の位相角が示されている。すなわ
ち、この時点では、２倍音では位相角が１８０°（図２
７の点Ｐ２２に対応）、３倍音では位相角が２７０°
（図２７の点Ｐ３２に対応）、４倍音では位相角が０°
（図２７の点Ｐ４２に対応）となっている。更に、この
図表の９行目には、基本音の信号が位相角１８０°とな
った時点（図２７の点Ｐ１３に対応）における各倍音信
号の位相角が示されている。すなわち、この時点では、
２倍音では位相角が０°（図２７の点Ｐ２３に対応）、
３倍音では位相角が１８０°（図２７の点Ｐ３３に対
応）、４倍音では位相角が０°（図２７の点Ｐ４３に対
応）となっている。

【０１１３】結局、単一の音源しか鳴らされていないの
に、その倍音成分が混じったために（第２の要因）、周
波数が互いに整数倍となるような複数の信号が生成され
た場合には、各信号の位相が図２８に示すような特定の
条件を満たすことになる。図示のとおり、この特定の条
件は、２倍音，３倍音，４倍音のそれぞれで異なってい
るが、基本音と２倍音、基本音と３倍音、基本音と４倍
音、といった特定の組み合わせにおける位相の条件は一
意的に定まることになる。したがって、この一意的に定
まる特定の条件を満たすか否かを判断することにより、
第２の要因に基づいて生成された複数の信号であるか否
かを認識することが可能になる。かくして、第２の要因
に基づいて生成された複数の信号が確認された場合に
は、倍音成分である周波数の高い方の信号は不用である
ので、当該信号を示す符号データを削除する処理を行え
ばよい。

【０１１４】既に述べたように、本発明に係る符号化方
法では、得られた代表周期関数と区間信号との位相を求
めることができる。したがって、この位相情報に基づい
て、図２８に示すような特定の条件が満たされているか
否かを調べ、条件が満たされているものについては、倍
音除去の処理を行うようにすればよい。結局、この倍音
除去処理は、同一の単位区間について、複数の代表周期
関数が求まっている場合、これら各代表周期関数と当該
単位区間内の区間信号との位相をそれぞれ計算し、一方
の周波数が他方の周波数の整数Ｚ倍の関係にあり、か
つ、それぞれについて計算された位相が整数Ｚにより一
意的に定まる特定の条件を満たすような２つの代表周期
関数が存在する場合には、周波数の高い代表周期関数に
関する符号データを削除する処理ということができる。

【０１１５】以上、本発明をいくつかの実施形態に基づ
いて説明したが、本発明はこれらの実施形態に限定され
るものではなく、この他にも種々の形態で実施可能であ
る。特に、本発明に係る音響信号の符号化方法は、主と
してコンピュータを用いたソフトウエア処理によって実
現するべきものであり、実用上は、汎用のパソコンなど
を利用して実現可能である。また、本発明に係る音響信
号の符号化方法は、コンピュータプログラムとして記述
することが可能であり、そのようなコンピュータプログ
ラムは、コンピュータ読み取り可能な記録媒体に記録し
て配付することが可能である。

【０１１６】

【発明の効果】以上のとおり、本発明に係る音響信号の
符号化方法によれば、ＭＩＤＩデータのような符号デー
タへの変換を高い品質をもって行うことが可能になる。

【図面の簡単な説明】

【図１】先願発明に係る音響信号の符号化方法の基本原
理を示す図である。

【図２】図１(c) に示す強度グラフに基づいて作成され
た符号コードを示す図である。

【図３】一般化調和解析の手法により、単位区間ｄ内の
区間信号Ｘｊと周期関数Ｇｊとの差分を求める原理図で
ある。

【図４】時間軸上に部分的に重複するように単位区間設
定を行うことにより作成された符号コードを示す図であ
る。

【図５】時間軸上に部分的に重複するような単位区間設
定の具体例を示す図である。

【図６】符号化の対象となる区間信号Ｘとサンプル番号
との関係を示す図である。

【図７】符号化のために用意された１２８通りの標準周
期関数の一例を示す図である。

【図８】標準周波数とノートナンバーとの関係式を示す
図である。

【図９】図６に示す区間信号Ｘと図７に示す標準周期関
数との相関を求める計算を示す図である。

【図１０】図９に示す相関計算に用いられる計算式（三
角関数を用いた式）を示す図である。

【図１１】図９に示す相関計算に用いられる計算式（一
般の周期関数を用いた式）を示す図である。

【図１２】相関計算の結果から、位相角を求める計算式
を示す図である。

【図１３】図９に示す相関計算を行う際に設定する相関
計算対象区間を示す図である。

【図１４】図１３に示すような相関計算対象区間を設定
した上での相関計算式を示す図である。

【図１５】原信号Ｓに対して求められた代表周期関数Ｓ
０，Ｓ１，Ｓ２の位相の進み遅れを示すグラフである。

【図１６】図１５に示す位相の進み遅れの関係式を示す
図である。

【図１７】単位区間ｄと参照区間ｒ（ｎ）とを設定し、
両者間での位相の進み遅れを求める原理を示す図であ
る。

【図１８】図１７に示す原理に基づいて求められた位相
の進み遅れを示す情報により、周波数補正を行う式を示
す図である。

【図１９】図１７に示す単位区間ｄについての区間信号
Ｘの位相角θ１（ｎ）を求める式を示す図である。

【図２０】図１７に示す参照区間ｒ（ｎ）についての隣
接信号Ｙの位相角θ２（ｎ）を求める式を示す図であ
る。

【図２１】図１９に示す式により得られる位相角θ１
（ｎ）と、図２０に示す式により得られる位相角θ２
（ｎ）とに基づいて、周波数補正を行う式を示す図であ
る。

【図２２】図１７に示す単位区間ｄについて、補正後の
周期関数に対する区間信号Ｘの相関を再計算する式を示
す図である。

【図２３】一般化調和解析の手法により、複数の代表周
期関数を決定する際に用いる式を示す図である。

【図２４】符号統合処理の具体的な手順を示す図であ
る。

【図２５】現在、最も標準的に利用されているＳＭＦ
（Standard MIDI File）フォーマットによるＭＩＤＩデ
ータの形式を示す図である。

【図２６】具体的なＭＩＤＩデータの構成例を示す図で
ある。

【図２７】基本音に対する倍音信号の信号波形を示すグ
ラフである。

【図２８】倍音と基本音との位相関係を示す図表であ
る。

【符号の説明】

Ａ…複素強度Ａ（ｎ），Ａ１（ｎ），Ａ２（ｎ），ＡＡ（ｎ）… sin
関数との相関値Ｂ（ｎ），Ｂ１（ｎ），Ｂ２（ｎ），ＢＢ（ｎ）… cos
関数との相関値ｄ，ｄ１〜ｄ８…単位区間／ＭＩＤＩデータＥ，Ｅ（ｎ），ＥＥ（ｎ）…実効強度（二乗和平方根
値）ｅ…振幅強度Ｆ…サンプリング周波数ｆ，ｆ（ｎ）…周波数ｆｆ（ｎ）…補正後の周波数Ｇｊ…代表周期関数の信号成分Ｋ…絶対サンプル番号ｋ…１単位区間内の相対サンプル番号Ｌ…単位区間の区間長 ΔＬ…オフセット長Ｍ…整数ｍ…整数Ｎ１〜Ｎ４…符号データＮ（ｎ）…ノートナンバーｎ，ｎ１，ｎ２，ｎ３…ノートナンバーＰ１０〜Ｐ４３…信号波形上の１点Ｒｎ…周期信号ｒ（ｎ）…参照区間Ｓ…原信号Ｓ０，Ｓ１，Ｓ２…代表周期関数Ｔ１〜Ｔ３…トラックＴ，Ｔ（ｎ），Ｔ０，Ｔ１，Ｔ２…周期ＴＴ，ＴＴ（ｎ）…補正後の周期 ΔＴ１，ΔＴ２…位相差ｔ０〜ｔ６…時刻Ｘ，Ｘｊ，Ｘｊ＋１…区間信号ｗ…単位区間内のサンプル数ｗ（ｎ）…相関計算対象区間内のサンプル数 θ（ｎ）…代表周期関数に対する位相角 θ１（ｎ）…単位区間ｄ内の区間信号Ｘの位相角 θ２（ｎ）…参照区間ｒ（ｎ）内の隣接信号Ｙの位相角 Δθ，Δθ１，Δθ２…位相の進み遅れを示す位相角 Δθ_ｍ，Δθ（ｎ）…ｍ周期分累積した位相の進み遅れ
を示す位相角

Claims

【特許請求の範囲】

【請求項１】時系列の強度信号として与えられる音響
信号を符号化するための符号化方法であって、符号化対象となる音響信号を、デジタルの音響データと
して取り込む入力段階と、前記音響データの時間軸上に複数の単位区間を設定する
区間設定段階と、複数通りの標準周波数を設定し、各標準周波数をもった
標準周期関数をそれぞれ定義する標準周期関数定義段階
と、個々の単位区間内の音響データと前記各標準周期関数と
の相関を計算し、相関が所定の基準以上の大きさとなる
１つまたは複数の標準周期関数を仮代表周期関数として
選出する仮代表選出段階と、個々の単位区間について、当該単位区間について選出さ
れた仮代表周期関数の周期の整数倍に相当する時間だ
け、当該単位区間をずらすことにより得られる参照区間
を定義する参照区間定義段階と、個々の単位区間について、当該単位区間について選出さ
れた仮代表周期関数と当該単位区間内の音響データとの
位相差を示す第１の位相角と、当該単位区間について選
出された仮代表周期関数と当該単位区間についての当該
仮代表周期関数の周期の整数倍だけずれた参照区間内の
音響データとの位相差を示す第２の位相角と、を求め、
前記第１の位相角と前記第２の位相角との差に基づい
て、当該仮代表周期関数の周期を補正することにより代
表周期関数を求める補正段階と、個々の単位区間の音響データを、当該単位区間について
求められた代表周期関数の周波数もしくはこれに近似す
る所定の周波数を示す周波数情報を含む符号データによ
って表現する符号化段階と、を有することを特徴とする音響信号の符号化方法。
【請求項２】請求項１に記載の音響信号の符号化方法
において、符号化段階において、個々の単位区間の音響データを、
当該単位区間について求められた代表周期関数の周波数
に近似した標準周波数を示す周波数情報を含む符号デー
タによって表現することを特徴とする音響信号の符号化
方法。
【請求項３】請求項１または２に記載の音響信号の符
号化方法において、標準周波数として、周波数値が等比級数配列をなす周波
数を設定することを特徴とする音響信号の符号化方法。
【請求項４】請求項１〜３のいずれかに記載の音響信
号の符号化方法において、個々の単位区間について、代表周期関数と当該単位区間
内の音響データとの相関値を計算し、個々の単位区間の
音響データを、当該単位区間について求められた代表周
期関数の周波数もしくはこれに近似する所定の周波数を
示す周波数情報と、当該代表周期関数について計算され
た相関値を示す強度情報と、を含む符号データによって
表現することを特徴とする音響信号の符号化方法。
【請求項５】請求項１〜４のいずれかに記載の音響信
号の符号化方法において、個々の単位区間について、代表周期関数と当該単位区間
内の音響データとの位相を計算し、個々の単位区間の音
響データを、当該単位区間について求められた代表周期
関数の周波数もしくはこれに近似する所定の周波数を示
す周波数情報と、当該代表周期関数について計算された
位相を示す位相情報と、を含む符号データによって表現
することを特徴とする音響信号の符号化方法。
【請求項６】請求項１〜５のいずれかに記載の音響信
号の符号化方法において、仮代表選出段階において、仮代表周期関数の選出基準と
して、相関値が所定の閾値以上である標準周期関数を選
出する方法、または、相関値の大きい順に所定数の標準
周期関数を選出する方法を採ることを特徴とする音響信
号の符号化方法。
【請求項７】請求項１〜６のいずれかに記載の音響信
号の符号化方法において、仮代表選出段階において、音響データのフーリエスペク
トルにおけるスペクトル強度値に基いて、１つまたは複
数の仮代表周波数を選出することを特徴とする音響信号
の符号化方法。
【請求項８】請求項１〜６のいずれかに記載の音響信
号の符号化方法において、第ｊ番目の対象音響データに対する相関が最も大きくな
る標準周期関数を第ｊ番目の仮代表周期関数として選出
し、この第ｊ番目の仮代表周期関数の周期を補正するこ
とにより第ｊ番目の代表周期関数を求め、この第ｊ番目
の代表周期関数からなる信号成分を前記第ｊ番目の対象
音響データから減じることにより得られる音響データ
を、第（ｊ＋１）番目の対象音響データとする処理を、
ｊ＝１〜Ｐ（Ｐは任意の整数）まで繰り返し実行し、Ｐ
個の代表周期関数を選出することを特徴とする音響信号
の符号化方法。
【請求項９】請求項１〜８のいずれかに記載の音響信
号の符号化方法において、所定の周期関数と所定区間内の音響データとの相関を計
算する際に、当該周期関数の周期の整数倍に相当する長
さをもった区間を相関計算対象区間として設定し、当該
所定区間内のうち前記相関計算対象区間内の部分につい
てのみ相関計算を実行することを特徴とする音響信号の
符号化方法。
【請求項１０】請求項１〜９のいずれかに記載の音響
信号の符号化方法において、個々の周波数をもった周期関数として、それぞれ互いに
位相がπ／２だけ異なる第１の関数および第２の関数を
定義し、第１の関数に対する相関値と第２の関数に対す
る相関値との二乗和平方根値に基づいて当該周期関数に
対する相関を求め、第１の関数に対する相関値と第２の
関数に対する相関値との比率に基づいて当該周期関数に
対する位相を求めることを特徴とする音響信号の符号化
方法。
【請求項１１】請求項１〜１０のいずれかに記載の音
響信号の符号化方法において、ある単位区間について、仮代表周期関数の周期Ｔのｍ倍
（ｍは整数）だけずれた位置に参照区間が定義されてい
る場合に、第１の位相角と第２の位相角との差Δθ（た
だし、−π≦Δθ≦＋π）を用いて、ＴＴ＝（ｍＴ−Ｔ
・Δθ／２π）／ｍなる補正計算によって、代表周期関
数の周期ＴＴを求めることを特徴とする音響信号の符号
化方法。
【請求項１２】請求項１１に記載の音響信号の符号化
方法において、ｍＴの値が所定の設定値Ｔmax を超えない範囲内で最大
となるように、仮代表周期関数の周期Ｔに応じて異なる
整数ｍを設定することを特徴とする音響信号の符号化方
法。
【請求項１３】請求項１〜１２のいずれかに記載の音
響信号の符号化方法において、時間軸上で近接配置された複数の符号データに含まれる
周波数情報、強度情報、位相情報なる３つの要素のうち
のいくつかが、それぞれ所定の許容範囲内で近似してい
る場合、これら複数の符号データを１つの符号データに
統合する処理を行うことを特徴とする音響信号の符号化
方法。
【請求項１４】請求項１〜１３のいずれかに記載の音
響信号の符号化方法において、同一の単位区間について複数の代表周期関数が求まって
いる場合に、これら各代表周期関数と当該単位区間内の
音響データとの位相をそれぞれ計算し、一方の周波数が
他方の周波数の整数Ｚ倍の関係にあり、かつ、それぞれ
について計算された前記位相が前記整数Ｚにより一意的
に定まる特定の条件を満たすような２つの代表周期関数
が存在する場合に、周波数の高い代表周期関数に関する
符号データを削除する処理を行うことを特徴とする音響
信号の符号化方法。
【請求項１５】請求項１〜１４のいずれかに記載の音
響信号の符号化方法において、楽譜のノートナンバーに対応する標準周波数を予め設定
しておき、符号化段階において、代表周期関数の周波数
を、これに近似した標準周波数に対応するノートナンバ
ーによって表現し、ＭＩＤＩデータにより符号化を行う
ことを特徴とする音響信号の符号化方法。
【請求項１６】請求項１〜１５のいずれかに記載の音
響信号の符号化方法をコンピュータに実行させるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体。