JP2003263155A - Frequency analyzer and acoustic signal encoding device - Google Patents

Frequency analyzer and acoustic signal encoding device

Info

Publication number
JP2003263155A
JP2003263155A JP2002064309A JP2002064309A JP2003263155A JP 2003263155 A JP2003263155 A JP 2003263155A JP 2002064309 A JP2002064309 A JP 2002064309A JP 2002064309 A JP2002064309 A JP 2002064309A JP 2003263155 A JP2003263155 A JP 2003263155A
Authority
JP
Japan
Prior art keywords
correlation
signal
section
frequency
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002064309A
Other languages
Japanese (ja)
Inventor
Toshio Motegi
敏雄 茂出木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2002064309A priority Critical patent/JP2003263155A/en
Publication of JP2003263155A publication Critical patent/JP2003263155A/en
Withdrawn legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a frequency analyzer and an acoustic signal encoding device, capable of reducing a total period of time required for correlation calculation by removing overlapped correlation calculation in an overlapped area of unit sections. <P>SOLUTION: Unit sections each of which a reference unit for analysis are set up so that adjacent unit sections (dI, dI<SB>+1</SB>) on time series are mutually overlapped and the time series signals of respective unit sections are successively extracted as section signals. The correlation of the unit section dI<SB>+1</SB>is calculated by calculating the correlation of a signal located on the head part dh of the preceding section signal with a prescribed harmonic function, calculating the correlation of a signal located on the end part db of the current section signal with the prescribed harmonic signal, subtracting the correlation value calculated for the head part dh from the whole correlation value of the preceding section dI, and adding the correlation value calculated for the end part db to the whole correlation value of the preceding section dI. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、放送メディア(ラジ
オ、テレビ)、通信メディア(CS映像・音声配信、イ
ンターネット音楽配信、通信カラオケ)、パッケージメ
ディア(CD、MD、カセット、ビデオ、LD、CD−
ROM、ゲームカセット、携帯音楽プレーヤ向け固体メ
モリ媒体)などで提供する各種オーディオコンテンツの
制作、並びに、音楽演奏録音信号から楽譜出版、通信カ
ラオケ配信用MIDIデータ、演奏ガイド機能付き電子
楽器向け自動演奏データ、携帯電話・PHS・ポケベル
などの着信メロディデータを自動的に作成する自動採譜
技術に関する。
The present invention relates to broadcast media (radio, television), communication media (CS video / audio distribution, Internet music distribution, communication karaoke), package media (CD, MD, cassette, video, LD, CD). −
Production of various audio contents provided in ROM, game cassettes, solid-state memory media for portable music players, etc., as well as music performance recording signals, musical score publishing, MIDI data for communication karaoke distribution, and automatic performance data for electronic musical instruments with performance guide function. , Automatic music transcription technology for automatically creating ringing melody data for mobile phones, PHS, pagers, etc.

【0002】[0002]

【従来の技術】音響信号に代表される時系列信号には、
その構成要素として複数の周期信号が含まれている。こ
のため、与えられた時系列信号にどのような周期信号が
含まれているかを解析する手法は、古くから知られてい
る。例えば、フーリエ解析は、与えられた時系列信号に
含まれる周波数成分を解析するための方法として広く利
用されている。
2. Description of the Related Art A time series signal represented by an acoustic signal is
A plurality of periodic signals are included as its constituent elements. Therefore, a method of analyzing what kind of periodic signal is included in a given time series signal has been known for a long time. For example, Fourier analysis is widely used as a method for analyzing frequency components included in a given time series signal.

【0003】このような時系列信号の周波数解析方法を
利用すれば、音響信号を符号化することも可能である。
コンピュータの普及により、原音となるアナログ音響信
号を所定のサンプリング周波数でサンプリングし、各サ
ンプリング時の信号強度を量子化してデジタルデータと
して取り込むことが容易にできるようになってきてお
り、こうして取り込んだデジタルデータに対してフーリ
エ解析などの手法を適用し、原音信号に含まれていた周
波数成分を抽出すれば、各周波数成分を示す符号によっ
て原音信号の符号化が可能になる。
By using such a frequency analysis method for time series signals, it is possible to encode acoustic signals.
With the spread of computers, it has become easy to sample the analog sound signal that is the original sound at a predetermined sampling frequency, quantize the signal strength at each sampling, and capture it as digital data. If a method such as Fourier analysis is applied to the data and the frequency components included in the original sound signal are extracted, the original sound signal can be encoded by the code indicating each frequency component.

【0004】また、電子楽器による楽器音を符号化しよ
うという発想から生まれたMIDI(Musical Instrume
nt Digital Interface)規格も、パーソナルコンピュー
タの普及とともに盛んに利用されるようになってきてい
る。このMIDI規格による符号データ(以下、MID
Iデータという)は、基本的には、楽器のどの鍵盤キー
を、どの程度の強さで弾いたか、という楽器演奏の操作
を記述したデータであり、このMIDIデータ自身に
は、実際の音の波形は含まれていない。そのため、実際
の音を再生する場合には、楽器音の波形を記憶したMI
DI音源が別途必要になるが、その符号化効率の高さが
注目を集めており、MIDI規格による符号化および復
号化の技術は、現在、パーソナルコンピュータを用いて
楽器演奏、楽器練習、作曲などを行うソフトウェアに広
く採り入れられている。
MIDI (Musical Instrume) was born from the idea of encoding musical instrument sounds by electronic musical instruments.
The nt Digital Interface) standard has also been actively used with the spread of personal computers. Code data according to this MIDI standard (hereinafter referred to as MID
Basically, the I data) is data that describes the operation of the musical instrument playing, such as which keyboard key of the musical instrument was played and with what strength. The MIDI data itself contains the actual sound. Waveform not included. Therefore, when reproducing the actual sound, the MI that stores the waveform of the instrument sound is stored.
Although a DI sound source is required separately, its high coding efficiency has been attracting attention, and the MIDI coding and decoding technology is currently used for musical instrument performance, musical instrument practice, composition, etc. using a personal computer. It is widely adopted in software that does.

【0005】そこで、音響信号に代表される時系列信号
に対して、所定の手法で解析を行うことにより、その構
成要素となる周期信号を抽出し、抽出した周期信号をM
IDIデータを用いて符号化しようとする提案がなされ
ている。例えば、特開平10−247099号公報、特
開平11−73199号公報、特開平11−73200
号公報、特開平11−95753号公報、特開2000
−99009号公報、特開2000−99092号公
報、特開2000−99093号公報、特開2000−
261322号公報、特開2001−5450号公報、
特開2001−148633号公報には、任意の時系列
信号について、構成要素となる周波数を解析し、その解
析結果からMIDIデータを作成することができる種々
の方法が提案されている。
Therefore, a time-series signal typified by an acoustic signal is analyzed by a predetermined method to extract a periodic signal which is a constituent element thereof, and the extracted periodic signal is M
Proposals have been made to encode using IDI data. For example, JP-A-10-247099, JP-A-11-73199, and JP-A-11-73200.
JP, JP-A-11-95753, JP, 2000
-99009, JP 2000-99092 A, JP 2000-99093 A, JP 2000-
261322, JP 2001-5450 A,
Japanese Unexamined Patent Application Publication No. 2001-148633 proposes various methods capable of analyzing a frequency as a constituent element of an arbitrary time series signal and creating MIDI data from the analysis result.

【0006】上記公報に記載された発明では、短時間フ
ーリエ変換法もしくは一般化調和解析の手法を用いて時
系列信号の周波数解析を行ってきた。短時間フーリエ変
換法では、計算負荷は少ないが、周波数分解能が比較的
低く、一般化調和解析の手法では、周波数分解能は高い
が、計算負荷も大きいという問題があった。そこで、本
出願人は、特願2002−9223号において、相関計
算テーブルを利用することにより、周波数分解能は高
く、計算負荷も少ない手法を提案した。
In the invention described in the above publication, the frequency analysis of the time series signal has been performed by using the short-time Fourier transform method or the generalized harmonic analysis method. The short-time Fourier transform method has a small calculation load, but has a relatively low frequency resolution, and the generalized harmonic analysis method has a problem that the frequency resolution is high but the calculation load is large. Therefore, the applicant of the present application has proposed in Japanese Patent Application No. 2002-9223 a method that uses a correlation calculation table to have a high frequency resolution and a small calculation load.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上記相
関計算テーブルを用いた手法では、隣接する単位区間を
重複させて設定しているため、時間分解能を高めるため
に、重複領域を大きくすると、相関計算を行う回数も増
大するという問題が生じる。
However, in the method using the above correlation calculation table, the adjacent unit sections are set so as to overlap each other. Therefore, if the overlap region is increased to increase the time resolution, the correlation calculation is performed. There is a problem that the number of times of performing is also increased.

【0008】上記のような点に鑑み、本発明は、単位区
間の重複領域における相関計算の重複をなくし、相関計
算にかかる総所要時間を削減することが可能な周波数解
析装置および音響信号の符号化装置を提供することを課
題とする。
In view of the above points, the present invention eliminates the overlap of the correlation calculation in the overlapping area of the unit section and reduces the total time required for the correlation calculation, and the code of the acoustic signal. An object of the present invention is to provide an activation device.

【0009】[0009]

【課題を解決するための手段】上記課題を解決するた
め、本発明では、与えられた時系列信号を時系列のスペ
クトルデータに変換する周波数解析装置として、解析を
行う基本単位である単位区間を、時系列上において隣接
する単位区間が互いに重複するように設定し、各単位区
間の時系列信号を順次抽出する区間信号抽出手段と、前
記区間信号抽出手段により直前に抽出された前区間信号
と新たに抽出された現区間信号との間で合致しない前区
間信号の先頭部に位置する信号に対して、所定の調和関
数との相関を算出する前区間先頭の相関算出手段と、前
区間信号と新たに抽出された現区間信号との間で合致し
ない現区間信号の後尾部に位置する信号に対して、所定
の調和関数との相関を算出する現区間後尾の相関算出手
段と、前区間全体の相関値に対して、前記前区間先頭の
相関算出手段により算出した値を減算し、前記現区間後
尾の相関算出手段により算出した値を加算することによ
り現区間全体の相関値を算出する相関合算手段と、前記
相関合算手段で得られた現区間全体の相関値を保持する
ための前区間相関値の記憶手段と、前記相関合算手段で
得られた現区間全体の相関値に基づいて所定の変換を行
い、各単位区間に対応するスペクトルデータを算出する
スペクトル算出手段により構成するようにしたことを特
徴とする。
In order to solve the above-mentioned problems, in the present invention, as a frequency analysis device for converting a given time-series signal into time-series spectrum data, a unit section which is a basic unit for analysis is used. , Section signal extraction means for setting adjacent unit sections in time series so as to overlap each other and sequentially extracting time series signals of each unit section, and a previous section signal extracted immediately before by the section signal extraction means. Correlation calculation means at the beginning of the previous section for calculating the correlation with a predetermined harmonic function for the signal located at the beginning of the previous section signal that does not match the newly extracted current section signal, and the previous section signal And a newly-extracted current section signal, the current section tail correlation calculation means for calculating a correlation with a predetermined harmonic function for a signal located at the tail of the current section signal that does not match, and a previous section overall The correlation sum for calculating the correlation value of the entire current section by subtracting the value calculated by the correlation calculation section at the beginning of the preceding section and adding the value calculated by the correlation calculation section at the end of the current section to the function value Means, storage means for storing the correlation value of the previous section for holding the correlation value of the entire current section obtained by the correlation summing means, and a predetermined value based on the correlation value of the entire current section obtained by the correlation summing means It is characterized in that it is configured by a spectrum calculation means for performing conversion and calculating spectrum data corresponding to each unit section.

【0010】本発明によれば、複数の単位区間を、時系
列に隣接する単位区間が互いに重複するように設定し
て、各単位区間と調和関数との相関値を算出することに
より、時系列信号の周波数解析を行う際に、各単位区間
の相関値の算出を、単位区間内の全区間信号と調和関数
との相関を求めるのでなく、直前の単位区間の相関値を
利用して、直前の単位区間の現単位区間と重複しない部
分の相関値を算出して減算すると共に現単位区間の直前
の単位区間と重複しない部分の相関値を算出して加算す
ることにより算出するようにしたので、単位区間の重複
領域における相関計算の重複をなくし、相関計算にかか
る総所要時間を削減することが可能となる。
According to the present invention, a plurality of unit sections are set so that adjacent unit sections in the time series overlap with each other, and the correlation value between each unit section and the harmonic function is calculated to obtain the time series. When performing the frequency analysis of a signal, the correlation value of each unit section is calculated by using the correlation value of the immediately preceding unit section instead of calculating the correlation between all section signals in the unit section and the harmonic function. Since the correlation value of the part of the unit section that does not overlap with the current unit section is calculated and subtracted, and the correlation value of the part that does not overlap with the unit section immediately before the current unit section is calculated and added, the calculation is performed. It is possible to eliminate the overlap of the correlation calculation in the overlapping area of the unit section and reduce the total time required for the correlation calculation.

【0011】[0011]

【発明の実施の形態】以下、本発明の実施形態について
図面を参照して詳細に説明する。 (1.基本原理)はじめに、本発明に係る周波数の解析お
よび音響信号の符号化の基本原理を述べておく。この基
本原理は、前掲の各公報もしくは明細書に開示されてい
るので、ここではその概要のみを簡単に述べることにす
る。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below in detail with reference to the drawings. (1. Basic Principle) First, the basic principle of frequency analysis and audio signal coding according to the present invention will be described. Since this basic principle is disclosed in the above-mentioned publications or specifications, only the outline thereof will be briefly described here.

【0012】図1(a)に示すように、時系列信号とし
てアナログ音響信号が与えられたものとする。図1の例
では、横軸に時間t、縦軸に振幅(強度)をとって、こ
の音響信号を示している。ここでは、まずこのアナログ
音響信号を、デジタルの音響データとして取り込む処理
を行う。これは、従来の一般的なPCMの手法を用い、
所定のサンプリング周波数でこのアナログ音響信号をサ
ンプリングし、振幅を所定の量子化ビット数を用いてデ
ジタルデータに変換する処理を行えば良い。
As shown in FIG. 1A, it is assumed that an analog acoustic signal is given as a time series signal. In the example of FIG. 1, the horizontal axis represents time t, and the vertical axis represents amplitude (intensity) to show this acoustic signal. Here, first, a process of taking in the analog acoustic signal as digital acoustic data is performed. This uses the conventional general PCM method,
The analog acoustic signal may be sampled at a predetermined sampling frequency, and the amplitude may be converted into digital data by using a predetermined number of quantization bits.

【0013】続いて、この解析対象となる音響信号の時
間軸上に、複数の単位区間を設定する。図1(a)に示
す例では、時間軸t上に等間隔に6つの時刻t1〜t6
が定義され、これら各時刻を始点および終点とする5つ
の単位区間d1〜d5が設定されている。図1の例で
は、全て同一の区間長をもった単位区間が時間軸上で重
複せずに設定されているが、隣接する単位区間が時間軸
上で部分的に重なり合うような区間設定を行ってもかま
わない。特に、本発明においては、単位区間を重複する
ことを必須要件としている。
Then, a plurality of unit sections are set on the time axis of the acoustic signal to be analyzed. In the example shown in FIG. 1A, six times t1 to t6 are equally spaced on the time axis t.
Is defined, and five unit sections d1 to d5 whose start point and end point are the respective time points are set. In the example of FIG. 1, all unit sections having the same section length are set without overlapping on the time axis, but the section setting is performed so that adjacent unit sections partially overlap on the time axis. It doesn't matter. Particularly, in the present invention, it is an essential requirement that the unit sections overlap.

【0014】こうして単位区間が設定されたら、各単位
区間ごとの音響信号(以下、区間信号と呼ぶことにす
る)について、それぞれ代表周波数を選出する。各区間
信号には、通常、様々な周波数成分が含まれているが、
例えば、その中で成分の強度割合の大きな周波数成分を
代表周波数として選出すれば良い。ここで、代表周波数
とはいわゆる基本周波数が一般的であるが、音声のフォ
ルマント周波数などの倍音周波数や、ノイズ音源のピー
ク周波数も代表周波数として扱うことがある。代表周波
数は1つだけ選出しても良いが、音響信号によっては複
数の代表周波数を選出した方が、より精度の高い符号化
が可能になる。図1(b)には、個々の単位区間ごとに
それぞれ3つの代表周波数を選出し、1つの代表周波数
を1つの代表符号(図では便宜上、音符として示してあ
る)として符号化した例が示されている。ここでは、代
表符号(音符)を収容するために3つのトラックT1,
T2,T3が設けられているが、これは個々の単位区間
ごとに選出された3つずつの代表符号を、それぞれ異な
るトラックに収容するためである。
When the unit section is set in this way, a representative frequency is selected for each acoustic signal (hereinafter referred to as section signal) for each unit section. Each section signal usually contains various frequency components,
For example, a frequency component having a large intensity ratio of the components may be selected as the representative frequency. Here, the representative frequency is generally a so-called fundamental frequency, but a harmonic frequency such as a formant frequency of voice or a peak frequency of a noise sound source may be treated as a representative frequency. Although only one representative frequency may be selected, more accurate encoding becomes possible if a plurality of representative frequencies are selected depending on the acoustic signal. FIG. 1B shows an example in which three representative frequencies are selected for each unit section and one representative frequency is encoded as one representative code (in the figure, it is shown as a note for convenience). Has been done. Here, three tracks T1 for accommodating a representative code (note) are provided.
T2 and T3 are provided so that the three representative codes selected for each unit section are accommodated in different tracks.

【0015】例えば、単位区間d1について選出された
代表符号n(d1,1),n(d1,2),n(d1,
3)は、それぞれトラックT1,T2,T3に収容され
ている。ここで、各符号n(d1,1),n(d1,
2),n(d1,3)は、MIDI符号におけるノート
ナンバーを示す符号である。MIDI符号におけるノー
トナンバーは、0〜127までの128通りの値をと
り、それぞれピアノの鍵盤の1つのキーを示すことにな
る。具体的には、例えば、代表周波数として440Hz
が選出された場合、この周波数はノートナンバーn=6
9(ピアノの鍵盤中央の「ラ音(A3音)」に対応)に
相当するので、代表符号としては、n=69が選出され
ることになる。もっとも、図1(b)は、上述の方法に
よって得られる代表符号を音符の形式で示した概念図で
あり、実際には、各音符にはそれぞれ強度に関するデー
タも付加されている。例えば、トラックT1には、ノー
トナンバーn(d1,1),n(d2,1)・・・とい
う音高を示すデータとともに、e(d1,1),e(d
2,1)・・・という強度を示すデータが収容されるこ
とになる。この強度を示すデータは、各代表周波数の成
分が、元の区間信号にどの程度の度合いで含まれていた
かによって決定される。具体的には、各代表周波数をも
った周期関数の区間信号に対する相関値に基づいて強度
を示すデータが決定されることになる。また、図1
(b)に示す概念図では、音符の横方向の位置によっ
て、個々の単位区間の時間軸上での位置が示されている
が、実際には、この時間軸上での位置を正確に数値とし
て示すデータが各音符に付加されていることになる。
For example, the representative codes n (d1,1), n (d1,2), n (d1,) selected for the unit section d1.
3) are housed in the tracks T1, T2, T3, respectively. Here, each code n (d1,1), n (d1,
2) and n (d1,3) are codes indicating note numbers in the MIDI code. The note number in the MIDI code takes 128 values from 0 to 127, and each indicates one key on the keyboard of the piano. Specifically, for example, the representative frequency is 440 Hz
Is selected, the frequency is note number n = 6
Since it corresponds to 9 (corresponding to "Ra sound (A3 sound)" at the center of the keyboard of the piano), n = 69 is selected as the representative code. However, FIG. 1B is a conceptual diagram showing the representative code obtained by the above-described method in the form of a musical note, and in fact, each musical note is also provided with data relating to its strength. For example, the track T1 includes note numbers n (d1,1), n (d2,1) ... Pitch data and e (d1,1), e (d
Data indicating the strength of 2, 1, 1 ... The data indicating this intensity is determined by the degree to which the component of each representative frequency is included in the original section signal. Specifically, the data indicating the intensity is determined based on the correlation value of the section signal of the periodic function having each representative frequency. Also, FIG.
In the conceptual diagram shown in (b), the position of each unit section on the time axis is shown by the position of the note in the lateral direction. The data shown as is added to each note.

【0016】音響信号を符号化する形式としては、必ず
しもMIDI形式を採用する必要はないが、この種の符
号化形式としてはMIDI形式が最も普及しているた
め、実用上はMIDI形式の符号データを用いるのが好
ましい。MIDI形式では、「ノートオン」データもし
くは「ノートオフ」データが、「デルタタイム」データ
を介在させながら存在する。「ノートオン」データは、
特定のノートナンバーNとベロシティーVを指定して特
定の音の演奏開始を指示するデータであり、「ノートオ
フ」データは、特定のノートナンバーNとベロシティー
Vを指定して特定の音の演奏終了を指示するデータであ
る。また、「デルタタイム」データは、所定の時間間隔
を示すデータである。ベロシティーVは、例えば、ピア
ノの鍵盤などを押し下げる速度(ノートオン時のベロシ
ティー)および鍵盤から指を離す速度(ノートオフ時の
ベロシティー)を示すパラメータであり、特定の音の演
奏開始操作もしくは演奏終了操作の強さを示すことにな
る。
It is not always necessary to adopt the MIDI format as the format for encoding the acoustic signal, but since the MIDI format is the most popular as this type of encoding format, the MIDI format code data is practically used. Is preferably used. In the MIDI format, “note on” data or “note off” data exists with “delta time” data interposed. The "Note On" data is
The "note-off" data is data for instructing the start of playing a specific sound by designating a specific note number N and velocity V. The "note-off" data is a data of a specific note designated by a specific note number N and velocity V. This is data for instructing the end of performance. The "delta time" data is data indicating a predetermined time interval. Velocity V is a parameter indicating, for example, the speed at which the piano keyboard is pushed down (velocity at note-on) and the speed at which the finger is released from the keyboard (velocity at note-off), and operation to start playing a specific sound. Alternatively, it indicates the strength of the performance ending operation.

【0017】前述の方法では、第i番目の単位区間di
について、代表符号としてJ個のノートナンバーn(d
i,1),n(di,2),・・・,n(di,J)が
得られ、このそれぞれについて強度e(di,1),e
(di,2),・・・,e(di,J)が得られる。そ
こで、次のような手法により、MIDI形式の符号デー
タを作成することができる。まず、「ノートオン」デー
タもしくは「ノートオフ」データの中で記述するノート
ナンバーNとしては、得られたノートナンバーn(d
i,1),n(di,2),・・・,n(di,J)を
そのまま用いれば良い。一方、「ノートオン」データも
しくは「ノートオフ」データの中で記述するベロシティ
ーVとしては、得られた強度e(di,1),e(d
i,2),・・・,e(di,J)を所定の方法で規格
化した値を用いれば良い。また、「デルタタイム」デー
タは、各単位区間の長さに応じて設定すれば良い。
In the above method, the i-th unit section di
About J note numbers n (d
i, 1), n (di, 2), ..., N (di, J) are obtained for each of these intensities e (di, 1), e
(Di, 2), ..., E (di, J) are obtained. Therefore, the code data in the MIDI format can be created by the following method. First, as the note number N described in the “note on” data or the “note off” data, the obtained note number n (d
i, 1), n (di, 2), ..., N (di, J) may be used as they are. On the other hand, as the velocity V described in the “note-on” data or the “note-off” data, the obtained intensities e (di, 1), e (d
i, 2), ..., E (di, J) may be standardized by a predetermined method. The “delta time” data may be set according to the length of each unit section.

【0018】(2.周期関数との相関を求める具体的な方
法)上述した基本原理に基づく方法では、区間信号に対
して、1つまたは複数の代表周波数が選出され、この代
表周波数をもった周期信号によって、当該区間信号が表
現されることになる。ここで、選出される代表周波数
は、文字どおり、当該単位区間内の信号成分を代表する
周波数である。この代表周波数を選出する具体的な方法
としては、短時間フーリエ変換を利用する方法、一般化
調和解析を利用する方法、相関計算テーブルを利用する
方法がある。このうち相関計算テーブルを利用する方法
は、本出願人が特願2002−9223号において提案
した方法である。本発明は、相関計算テーブルを利用す
る方法を用いた場合に、特に効果が高いため、相関計算
テーブルを用いて周期関数との相関を求める具体的な方
法を述べておく。
(2. Concrete Method for Obtaining Correlation with Periodic Function) In the method based on the above-mentioned basic principle, one or a plurality of representative frequencies are selected for the section signal and have the representative frequency. The section signal is represented by the periodic signal. Here, the selected representative frequency is literally a frequency representing the signal component in the unit section. As a specific method for selecting the representative frequency, there are a method using a short-time Fourier transform, a method using a generalized harmonic analysis, and a method using a correlation calculation table. Among these, the method of using the correlation calculation table is the method proposed by the applicant in Japanese Patent Application No. 2002-9223. Since the present invention is particularly effective when a method using a correlation calculation table is used, a specific method for obtaining a correlation with a periodic function using the correlation calculation table will be described.

【0019】複数の周期関数として、図2に示すような
三角関数が用意されているものとする。これらの三角関
数は、同一周波数をもった正弦関数と余弦関数との対か
ら構成されており、128通りの標準周波数f(0)〜
f(127)のそれぞれについて、正弦関数および余弦
関数の対が定義されていることになる。ここでは、同一
の周波数をもった正弦関数および余弦関数からなる一対
の関数を、当該周波数についての周期関数として定義す
ることにする。すなわち、ある特定の周波数についての
周期関数は、一対の正弦関数および余弦関数によって構
成されることになる。このように、一対の正弦関数と余
弦関数とにより周期関数を定義するのは、信号に対する
周期関数の相関値を求める際に、相関値が位相の影響を
受ける事を考慮するためである。なお、図2に示す各三
角関数内の変数Fおよびkは、区間信号Xについてのサ
ンプリング周波数Fおよびサンプル番号kに相当する変
数である。例えば、周波数f(0)についての正弦波
は、sin(2πf(0)k/F)で示され、任意のサ
ンプル番号kを与えると、区間信号を構成する第k番目
のサンプルと同一時間位置における周期関数の振幅値が
得られる。ここでは、128通りの標準周波数f(0)
〜f(127)を以下に示す〔数式1〕で定義する。
It is assumed that a trigonometric function as shown in FIG. 2 is prepared as a plurality of periodic functions. These trigonometric functions are composed of a pair of a sine function and a cosine function having the same frequency, and 128 standard frequencies f (0) to
For each of f (127), a pair of sine and cosine functions will be defined. Here, a pair of functions including a sine function and a cosine function having the same frequency will be defined as a periodic function for the frequency. That is, the periodic function for a specific frequency is composed of a pair of sine function and cosine function. Thus, the reason why the periodic function is defined by a pair of sine function and cosine function is to consider that the correlation value is influenced by the phase when the correlation value of the periodic function with respect to the signal is obtained. The variables F and k in each trigonometric function shown in FIG. 2 are variables corresponding to the sampling frequency F and the sample number k for the interval signal X. For example, a sine wave for the frequency f (0) is represented by sin (2πf (0) k / F), and given an arbitrary sample number k, the same time position as the kth sample forming the interval signal is given. The amplitude value of the periodic function at is obtained. Here, 128 standard frequencies f (0)
~ F (127) is defined by the following [Formula 1].

【0020】〔数式1〕 f(n)=440×2γ (n) γ(n)=(n−69)/12 ただし、n=0,1,2,・・・,127[Formula 1] f (n) = 440 × 2 γ (n) γ (n) = (n−69) / 12 where n = 0, 1, 2, ..., 127

【0021】このような式によって標準周波数を定義し
ておくと、最終的にMIDIデータを用いた符号化を行
う際に便利である。なぜなら、このような定義によって
設定される128通りの標準周波数f(0)〜f(12
7)は、等比級数をなす周波数値をとることになり、M
IDIデータで利用されるノートナンバーに対応した周
波数になるからである。したがって、図2に示す128
通りの標準周波数f(0)〜f(127)は、対数尺度
で示した周波数軸上に等間隔(MIDIにおける半音単
位)に設定した周波数ということになる。
Defining the standard frequency by such an equation is convenient when finally performing encoding using MIDI data. This is because there are 128 standard frequencies f (0) to f (12) set by such a definition.
7) is to take frequency values forming a geometric series, and M
This is because the frequency corresponds to the note number used in the IDI data. Therefore, 128 shown in FIG.
The standard frequencies f (0) to f (127) are the frequencies set at equal intervals (semitone unit in MIDI) on the frequency axis shown by the logarithmic scale.

【0022】続いて、任意の区間の区間信号に対する各
周期関数の相関の求め方について、具体的な説明を行
う。例えば、図3に示すように、ある単位区間dについ
て区間信号Xが与えられていたとする。ここでは、区間
長Lをもった単位区間dについて、サンプリング周波数
Fでサンプリングが行なわれており、全部でw個のサン
プル値が得られているものとし、サンプル番号を図示の
ように、0,1,2,3,・・・,k,・・・,w−
2,w−1とする(白丸で示す第w番目のサンプルは、
右に隣接する次の単位区間の先頭に含まれるサンプルと
する)。この場合、任意のサンプル番号kについては、
X(k)なる振幅値がデジタルデータとして与えられて
いることになる。ここで、wは以下の記述においても定
数のような記載をしているが、一般にはnの値に応じて
変化させ、区間長Lを超えない範囲で最大となるF/f
(n)の整数倍の値に設定することが望ましい。通常、
図1に示したように所定の単位区間、すなわち短時間に
おいて解析する場合は、X(k)に対して各サンプルご
とに中央の重みが1に近く、両端の重みが0に近くなる
ような窓関数W(k)を乗じることが行われており、こ
れが短時間フーリエ変換法である。ただし、本発明で
は、後述するように、ある単位区間の解析を行う場合
に、直接その単位区間の相関値を計算せずに、その直前
の単位区間の相関値を基本にして、基本の相関値から、
直前の単位区間に特有の部分の相関値を減算し、重複し
ていない現単位区間の後尾部分の相関値を加算する処理
を行っている。このためには、窓関数W(k)を乗じる
ことは好ましくなく、これが、本発明において、短時間
フーリエ変換法および一般化調和解析法を利用しない理
由である。
Next, a concrete description will be given of how to obtain the correlation of each periodic function with respect to a section signal of an arbitrary section. For example, as shown in FIG. 3, it is assumed that the section signal X is given to a certain unit section d. Here, it is assumed that the unit section d having the section length L is sampled at the sampling frequency F and w sample values are obtained in total, and the sample number is 0, as shown in the figure. 1,2,3, ..., k, ..., w-
2, w-1 (the w-th sample shown by the white circle is
It shall be the sample included at the beginning of the next unit section adjacent to the right). In this case, for any sample number k,
This means that the amplitude value X (k) is given as digital data. Here, w is also described as a constant in the following description, but in general, it is changed according to the value of n and becomes maximum within a range not exceeding the section length L.
It is desirable to set the value to an integral multiple of (n). Normal,
As shown in FIG. 1, when the analysis is performed in a predetermined unit section, that is, in a short time, the central weight is close to 1 and the weights at both ends are close to 0 for each sample with respect to X (k). The window function W (k) is multiplied, which is the short-time Fourier transform method. However, in the present invention, as will be described later, in the case of analyzing a certain unit section, the correlation value of the unit section immediately before that is not directly calculated, but the basic correlation is calculated. From the value,
The correlation value of the portion peculiar to the immediately preceding unit section is subtracted, and the correlation value of the tail portion of the current unit section that does not overlap is added. For this purpose, it is not preferable to multiply by the window function W (k), which is the reason why the short time Fourier transform method and the generalized harmonic analysis method are not used in the present invention.

【0023】このような区間信号Xに対して、第n番目
の標準周波数f(n)をもった正弦関数Rnとの相関値
を求める原理を示す。両者の相関値A(n)は、以下の
〔数式2〕によって定義することができる。
The principle of obtaining the correlation value with the sine function Rn having the nth standard frequency f (n) for such a section signal X will be described. The correlation value A (n) between the two can be defined by the following [Formula 2].

【0024】〔数式2〕 A(n)=(2/w)Σk=0,w-1x(k) sin(2πfnk/F) B(n)=(2/w)Σk=0,w-1x(k) cos(2πfnk/F) E(n)={A(n)2+B(n) 21/2 [Formula 2] A (n) = (2 / w) Σ k = 0, w-1 x (k) sin (2πf n k / F) B (n) = (2 / w) Σ k = 0, w-1 x (k) cos (2πf n k / F) E (n) = {A (n) 2 + B (n) 2 } 1/2

【0025】上記〔数式2〕において、X(k)は、図
3に示すように、区間信号Xにおけるサンプル番号kの
振幅値であり、sin(2πfnk/F)は、時間軸上
での同位置における正弦関数Rnの振幅値である。な
お、数式が繁雑になるのを避けるため、数式内ではf
(n)をfnと表現している。〔数式2〕の第1の演算
式は、単位区間d内の全サンプル番号k=0〜w−1の
次元について、それぞれ区間信号Xの振幅値と正弦関数
Rnの振幅ベクトルの内積を求める式ということができ
る。
In the above [Formula 2], X (k) is the amplitude value of the sample number k in the interval signal X, as shown in FIG. 3, and sin (2πf n k / F) is on the time axis. It is the amplitude value of the sine function Rn at the same position of. In order to avoid complicated expressions, f
(N) is expressed as f n . The first arithmetic expression of [Equation 2] is an expression for obtaining the inner product of the amplitude value of the interval signal X and the amplitude vector of the sine function Rn for the dimensions of all sample numbers k = 0 to w−1 in the unit interval d. Can be said.

【0026】同様に、上記〔数式2〕の第2の演算式
は、区間信号Xと、第n番目の標準周波数f(n)をも
った余弦関数との相関値を求める式であり、両者の相関
値はB(n)で与えられる。なお、相関値A(n)を求
めるための第1の演算式も、相関値B(n)を求めるた
めの第2の演算式も、最終的に2/wが乗ぜられている
が、これは相関値を規格化するためのものでり、前述の
とおりwはnに依存して変化させるのが一般的であるた
め、この係数もnに依存する変数である。
Similarly, the second arithmetic expression of the above [Equation 2] is an expression for obtaining the correlation value between the interval signal X and the cosine function having the nth standard frequency f (n). The correlation value of is given by B (n). Note that both the first arithmetic expression for obtaining the correlation value A (n) and the second arithmetic expression for obtaining the correlation value B (n) are finally multiplied by 2 / w. Is for normalizing the correlation value, and since w is generally changed depending on n as described above, this coefficient is also a variable depending on n.

【0027】区間信号Xと標準周波数f(n)をもった
標準周期関数との相関実効値は、上記〔数式2〕の第3
の演算式に示すように、正弦関数との相関値A(n)と
余弦関数との相関値B(n)との二乗和平方根のうち、
正の値であるE(n)によって示すことができる。この
相関実効値の大きな標準周期関数の周波数を代表周波数
として選出すれば、この代表周波数を用いて区間信号X
を符号化することができる。
The effective value of the correlation between the interval signal X and the standard periodic function having the standard frequency f (n) is the third value of the above [Formula 2].
As shown in the following equation, of the square root of the sum of squares of the correlation value A (n) with the sine function and the correlation value B (n) with the cosine function,
It can be indicated by a positive value, E (n). If the frequency of the standard periodic function having a large effective value of the correlation is selected as the representative frequency, the interval signal X
Can be encoded.

【0028】すなわち、この相関値E(n)が所定の基
準以上の大きさとなる1つまたは複数の標準周波数を代
表周波数として選出すれば良い。なお、ここで「相関値
E(n)が所定の基準以上の大きさとなる」という選出
条件は、例えば、何らかの閾値を設定しておき、相関値
E(n)がこの閾値を超えるような標準周波数f(n)
をすべて代表周波数として選出する、という絶対的な選
出条件を設定しても良いが、例えば、相関値E(n)の
大きさの順にQ番目までを選出する、というような相対
的な選出条件を設定しても良い。
That is, one or a plurality of standard frequencies whose correlation value E (n) is greater than a predetermined standard may be selected as the representative frequency. The selection condition that “the correlation value E (n) is greater than or equal to a predetermined reference” is, for example, a threshold that is set in advance and the correlation value E (n) exceeds the threshold. Frequency f (n)
May be set as a representative frequency, but an absolute selection condition may be set. For example, relative selection conditions such as selecting up to the Qth in the order of the magnitude of the correlation value E (n). May be set.

【0029】(2.1.相互相関テーブルを利用した手法)
設定された単位区間における区間信号と調和関数との相
関計算を行う手法としては、短時間フーリエ変換法と、
一般化調和解析を利用した手法が有名である。しかし、
短時間フーリエ変換法では周波数分解能が充分でなく、
短時間フーリエ変換法の問題点をこれを解決するための
一般化調和解析を利用した手法では、短時間フーリエ変
換法に比べて、周期関数である調和関数との相関演算回
数が桁違いに多いため、計算負荷が大きいという問題が
あった。そこで、本出願人は、特願2002−9223
号において、相互相関テーブルを利用して周波数解析を
行う手法を提案した。この手法により、短時間フーリエ
変換法と同等な計算負荷で一般化調和解析と同等な周波
数分解能を実現することが可能であると共に、一般化調
和解析で問題になっていた、抽出される信号成分の精度
の向上を図ることが可能となる。この相互相関テーブル
を利用した手法を次に説明する。
(2.1. Method using cross-correlation table)
As a method of calculating the correlation between the section signal and the harmonic function in the set unit section, a short-time Fourier transform method,
The method using generalized harmonic analysis is famous. But,
The short-time Fourier transform method does not have sufficient frequency resolution,
In the method using generalized harmonic analysis to solve the problems of the short-time Fourier transform method, the number of correlation operations with the harmonic function, which is a periodic function, is orders of magnitude higher than that of the short-time Fourier transform method. Therefore, there is a problem that the calculation load is large. Therefore, the present applicant has filed Japanese Patent Application No. 2002-9223.
In this issue, we proposed a method for frequency analysis using a cross-correlation table. With this method, it is possible to realize a frequency resolution equivalent to that of generalized harmonic analysis with a computational load equivalent to that of the short-time Fourier transform method, and the extracted signal components that have been a problem in generalized harmonic analysis. It is possible to improve the accuracy of. A method using this cross-correlation table will be described below.

【0030】まず、上述のように、複数の標準周波数を
設定し、各標準周波数に対応する標準周期関数を調和関
数として準備する。このとき設定される標準周波数とし
ては、周波数解析の特性に合わせて任意に設定すること
ができるが、音響信号の符号化に利用するためには、図
2および〔数式1〕に示したように、MIDI規格のノ
ートナンバーnに対応させて設定することが好ましい。
First, as described above, a plurality of standard frequencies are set, and a standard periodic function corresponding to each standard frequency is prepared as a harmonic function. The standard frequency set at this time can be arbitrarily set according to the characteristics of the frequency analysis, but in order to use it for encoding the acoustic signal, as shown in FIG. 2 and [Equation 1], , MIDI standard note number n is preferably set.

【0031】続いて、各調和関数同士の相関である相互
相関を全ての組合せに対して算出し、相互相関テーブル
を作成する。この際、周波数f(m)の調和関数の周波
数f(n)の調和関数に対する相互相関R(fm,fn)
は、以下の〔数式3〕により算出する。
Then, the cross-correlation, which is the correlation between the harmonic functions, is calculated for all the combinations, and the cross-correlation table is created. At this time, the cross-correlation R (f m , f n ) of the harmonic function of the frequency f (m) with respect to the harmonic function of the frequency f ( n )
Is calculated by the following [Formula 3].

【0032】〔数式3〕 A(fm,fn)=(2/T(n))Σk=0,T(n)-1sin(2πfm
/F) sin(2πfnk/F) B(fm,fn)=(2/T(n))Σk=0,T(n)-1sin(2πfm
/F) cos(2πfnk/F) R(fm,fn)={A(fm,fn)2+B(fm,fn) 21/2
[Formula 3] A (f m , f n ) = (2 / T (n)) Σ k = 0, T (n) -1 sin (2πf m k
/ F) sin (2πf n k / F) B (f m, f n) = (2 / T (n)) Σ k = 0, T (n) -1 sin (2πf m k
/ F) cos (2πf n k / F) R (f m , f n ) = {A (f m , f n ) 2 + B (f m , f n ) 2 } 1/2

【0033】上記〔数式3〕の第3式で算出される相互
相関R(fm,fn)は2次元の相互相関テーブルの1要素
を示す。図2に示したようにm、nがノートナンバーに
対応している場合、相互相関テーブルには、各ノートナ
ンバーmに対応する128個のノートナンバーの相関値
が記録され、全部で128×128個の相関値が記録さ
れることになる。
The cross-correlation R (f m , f n ) calculated by the third expression of the above [Expression 3] represents one element of the two-dimensional cross-correlation table. As shown in FIG. 2, when m and n correspond to note numbers, the correlation value of 128 note numbers corresponding to each note number m is recorded in the cross-correlation table, which is 128 × 128 in total. Correlation values will be recorded.

【0034】相互相関テーブルの準備ができたら、解析
対象となる時系列信号の全区間に渡って単位区間を設定
し、設定された単位区間の時系列信号を区間信号として
抽出する。単位区間の設定は、図1(a)に示したのと
は異なり、隣接する単位区間が互いに重複するように設
定する。
When the cross-correlation table is prepared, a unit section is set over the entire section of the time series signal to be analyzed, and the time series signal of the set unit section is extracted as a section signal. Differently from the case shown in FIG. 1A, the unit sections are set such that adjacent unit sections overlap each other.

【0035】続いて、抽出した区間信号に対して、全調
和関数との相関計算を行う。例えば、図2に示したよう
なノートナンバーに対応して標準周波数を設定した場合
には、128個の調和関数との相関計算が行われる。こ
の段階での調和関数との相関計算は、下記の〔数式4〕
により行われる。すなわち、区間信号のうち、先頭か
ら、相関計算を行う調和関数の周期の整数倍で単位区間
長を超えない部分と、調和関数との相関を算出する。算
出された相関値は、各単位区間ごとに用意される信号相
関配列に格納される。ここでは、1つの区間信号に対し
ては、各調和関数との相関計算が行われるのは、この1
回だけとなり、相関計算の回数を抑えるのに貢献してい
る。この段階での標準周波数f(n)の調和関数と、区
間信号x(k)との相関値E(fn)は、以下の〔数式
4〕により算出される。
Subsequently, the correlation calculation with the total harmonic function is performed on the extracted section signal. For example, when the standard frequency is set corresponding to the note number as shown in FIG. 2, correlation calculation with 128 harmonic functions is performed. The correlation calculation with the harmonic function at this stage is performed by the following [Formula 4].
Done by. That is, the correlation between the harmonic function and the portion of the interval signal from the beginning that is an integral multiple of the cycle of the harmonic function for which correlation calculation is performed and does not exceed the unit interval length is calculated. The calculated correlation value is stored in the signal correlation array prepared for each unit section. Here, the correlation calculation with each harmonic function is performed for one section signal is
Since it is only once, it contributes to suppressing the number of correlation calculations. The correlation value E (f n ) between the harmonic function of the standard frequency f (n) and the interval signal x (k) at this stage is calculated by the following [Formula 4].

【0036】〔数式4〕 A(fn)=(2/T(n))Σk=0,T(n)-1x(k) sin(2πf
nk/F) B(fn)=(2/T(n))Σk=0,T(n)-1x(k) cos(2πf
nk/F) E(fn)={A(fn)2+B(fn) 21/2
[Formula 4] A (f n ) = (2 / T (n)) Σ k = 0, T (n) -1 x (k) sin (2πf
n k / F) B (f n ) = (2 / T (n)) Σ k = 0, T (n) -1 x (k) cos (2πf
n k / F) E (f n ) = {A (f n ) 2 + B (f n ) 2 } 1/2

【0037】この〔数式4〕は、〔数式2〕の相関計算
サンプル数wを相関計算時間T(n)に置き替えただけ
で、実質的には上記と同等の式である。
This [Equation 4] is substantially the same as the above, except that the correlation calculation sample number w in [Equation 2] is replaced by the correlation calculation time T (n).

【0038】信号相関配列が得られたら、配列中の各要
素である相関値を、相互相関テーブルを利用して補正す
る。具体的には、標準周波数f(n)との相関値E
(fn)の補正値E´(fn)は、標準周波数f(m)との相
関値E(fm)、標準周波数f(m)の標準周波数f
(n)に対する相互相関R(fm,fn)、標準周波数f
(m)の自己相関R(fm,fm)を用いて、以下の〔数式
5〕により算出される。
When the signal correlation array is obtained, the correlation value which is each element in the array is corrected using the cross correlation table. Specifically, the correlation value E with the standard frequency f (n)
correction value (f n) E'(f n ) , the correlation value between the standard frequency f (m) E (f m ), the standard frequency f of the normal frequency f (m)
The cross-correlation R for (n) (f m, f n), the standard frequency f
It is calculated by the following [Equation 5] using the autocorrelation R (f m , f m ) of (m).

【0039】〔数式5〕 E´(fn)= E(fn)−Σm=0,N-1E(fm) R(fm,fn)
/R(fm,fm)
[Equation 5] E ′ (f n ) = E (f n ) −Σ m = 0, N−1 E (f m ) R (f m , f n ).
/ R (f m, f m )

【0040】上記〔数式5〕により算出された補正値E
´(fn)は、相関配列中の標準周波数f(n)に対応す
る位置に格納され、以降は相関値E(fm)として他の補
正値E´(fn)の算出に利用される。このようにして、
設定された全標準周波数に対応する補正値E´(fn)を
算出する。このとき、n=0〜N−1のうち、どの相関
値E(fn)から補正していくかについては、基本的に
は、信号相関配列における相関値の初期値の大きさの順
に従う。こうしてN個の相関値が補正された信号相関配
列が得られる。ただし、この時点では配列内の要素のう
ち、負の値になっているものがある場合がある。その場
合は、その値を0にすることにより、信号相関配列の値
が全て0または正の値となるようにし、これを補正相関
配列とする。このように補正相関配列の値を0以上にす
るのは、相関値が負の値ということは基本的に有り得な
いので、現実的でない値を削除するためである。また、
負の値の要素を0にする処理を、信号相関配列中の全て
の要素が補正された後で行うのは、補正値E´(fn)が
負であった場合に、この補正値E´(fn)を〔数式5〕
に示したE(fm)として、他の補正値の算出に利用する
ためである。これにより、補正値が負であった場合は、
〔数式5〕の右辺のΣによる総和が減少し、結果として
補正前の相関値E(fn)に増加されるようになる。本発
明では、このようにして補正値が負であったとしても、
その値を変更せずにそのまま利用して他の要素の補正値
を求めるため、一般化調和解析のように、減算する含有
信号の順番により差分信号が変化し、得られる相関値が
異なるということがない。そのため、信号相関配列にお
ける相関値の初期値の大きさの順番に依存することな
く、補正を行うことが可能となる。
Correction value E calculated by the above [Formula 5]
'(F n) is stored in a position corresponding to the normal frequency f in the correlation sequence (n), and later is used to calculate the correlation value E (f m) as another correction value E'(f n) It In this way
A correction value E ′ (f n ) corresponding to all set standard frequencies is calculated. At this time, which correlation value E (f n ) is corrected from n = 0 to N−1 basically follows the order of the magnitude of the initial value of the correlation value in the signal correlation array. . In this way, a signal correlation array in which N correlation values are corrected is obtained. However, at this point, some of the elements in the array may have negative values. In that case, the value is set to 0 so that all the values in the signal correlation array become 0 or a positive value, and this is set as the correction correlation array. The reason why the value of the corrected correlation array is set to 0 or more in this way is to delete an unrealistic value, since a negative correlation value is basically impossible. Also,
The process of setting a negative value element to 0 is performed after all the elements in the signal correlation array are corrected, when the correction value E ′ (f n ) is negative. ′ (F n ) is [Formula 5]
This is because it is used for the calculation of other correction values as E (f m ). As a result, if the correction value is negative,
The sum total of Σ on the right side of [Equation 5] decreases, and as a result, the correlation value E (f n ) before correction increases. In the present invention, even if the correction value is negative in this way,
Since the correction values of other elements are obtained by directly using the values without changing them, the difference signal changes depending on the order of the included signals to be subtracted, and the obtained correlation value is different, as in generalized harmonic analysis. There is no. Therefore, the correction can be performed without depending on the order of the magnitude of the initial value of the correlation value in the signal correlation array.

【0041】上記相関演算、および相関補正を設定され
た全単位区間に対して行うことにより、全単位区間にお
けるN個の周波数成分が得られる。
By performing the above-mentioned correlation calculation and correlation correction for all the set unit intervals, N frequency components in all the unit intervals can be obtained.

【0042】ここで、相互相関テーブルを用いた相関値
の補正の効果を図4を用いて概念的に説明する。図4に
おいて、横軸はノートナンバー(周波数)に対応してお
り、縦軸は信号強度あるいは相関強度に対応している。
ここで、単一音の音源の周波数解析を行う場合を考えて
みる。単一音の音源の原信号スペクトルは、図4(a)
に示すように、1つの周波数で表現される。この単一音
の周波数解析を行った場合、図4(a)に示すように1
つの周波数だけ抽出されれば、最も精度の高い周波数解
析が行われたことになる。ところが、この単一音に対し
て短時間フーリエ解析による周波数解析を行うと、図4
(b)に示すように多数の周波数成分が抽出されること
になる。また、図4(a)に示した単一音に対して一般
化調和解析による周波数解析を行うと、図4(c)に示
すように多数の周波数成分が抽出される。ただ、図4
(b)と図4(c)を比較するとわかるように、一般化
調和解析を利用した方が、抽出すべき周波数の相関強度
が他の周波数より大きな値となり、短時間フーリエ変換
を利用するよりも精度は高くなる。
Here, the effect of correction of the correlation value using the cross-correlation table will be conceptually described with reference to FIG. In FIG. 4, the horizontal axis corresponds to the note number (frequency), and the vertical axis corresponds to the signal strength or the correlation strength.
Now, consider the case of performing frequency analysis of a single sound source. The original signal spectrum of a single-tone sound source is shown in FIG.
It is represented by one frequency as shown in. When frequency analysis of this single sound is performed, as shown in FIG.
If only one frequency is extracted, the most accurate frequency analysis has been performed. However, when frequency analysis by short-time Fourier analysis is performed on this single sound, the result shown in FIG.
As shown in (b), many frequency components will be extracted. Further, when frequency analysis by generalized harmonic analysis is performed on the single tone shown in FIG. 4A, a large number of frequency components are extracted as shown in FIG. 4C. However, Figure 4
As can be seen from a comparison between (b) and FIG. 4 (c), using the generalized harmonic analysis makes the correlation strength of the frequency to be extracted larger than the other frequencies, rather than using the short-time Fourier transform. Is also more accurate.

【0043】この手法では、あらかじめ準備した相互相
関テーブルを利用して各ノートナンバーについて補正値
を求める。この補正値を図4(d)に示す。図4(d)
に示す補正値は、上記〔数式5〕の右辺の−Σ以降に対
応している。図4(d)に示した補正値により図4
(b)に示した相関強度を補正することにより、図4
(e)に示すような目的とすべき、単一の周波数成分が
抽出される。
In this method, a correction value is obtained for each note number using a cross-correlation table prepared in advance. This correction value is shown in FIG. Figure 4 (d)
The correction value shown in (4) corresponds to -Σ and after on the right side of the above [Formula 5]. The correction values shown in FIG.
By correcting the correlation strength shown in FIG.
A single frequency component to be the target as shown in (e) is extracted.

【0044】以上のような処理により、各単位区間につ
いて、各周波数に対する強度値の集合である周波数群
(スペクトルデータ)が得られることになる。このよう
にして所定数の周波数群が選出されたら、この周波数群
の各周波数に対応する「音の高さを示す情報」、選出さ
れた各周波数の信号強度に対応する「音の強さを示す情
報」、当該単位区間の始点に対応する「音の発音開始時
刻を示す情報」、当該単位区間に後続する単位区間の始
点に対応する「音の発音終了時刻を示す情報」、の4つ
の情報を含む符号データ(これを音素データと呼ぶこと
にする)を作成すれば、当該単位区間内の区間信号Xを
所定数の符号データにより符号化することができる。符
号データとして、MIDIデータを作成するのであれ
ば、「音の高さを示す情報」としてノートナンバーを用
い、「音の強さを示す情報」としてベロシティーを用
い、「音の発音開始時刻を示す情報」としてノートオン
時刻を用い、「音の発音終了時刻を示す情報」としてノ
ートオフ時刻を用いるようにすれば良い。
By the above processing, a frequency group (spectral data), which is a set of intensity values for each frequency, is obtained for each unit section. When a predetermined number of frequency groups are selected in this way, "information indicating the pitch of the sound" corresponding to each frequency of this frequency group, "sound intensity corresponding to the signal strength of each selected frequency""Informationindicating","information indicating the sound production start time" corresponding to the start point of the unit section, and "information indicating sound production end time" corresponding to the start point of the unit section subsequent to the unit section. If code data including information (which will be referred to as phoneme data) is created, the section signal X in the unit section can be coded by a predetermined number of code data. If MIDI data is created as code data, note number is used as "information indicating pitch of tone", velocity is used as "information indicating intensity of tone", and "start time of sound generation" The note-on time may be used as the “information indicating” and the note-off time may be used as the “information indicating the sound production end time”.

【0045】(3.1.本発明に係る周波数解析装置および
音響信号の符号化装置)以下、本発明に係る周波数解析
装置および音響信号の符号化装置について説明してい
く。図5は、本発明に係る周波数解析の概要を示すフロ
ーチャートである。まず、複数の標準周波数を設定し、
各標準周波数に対応する標準周期関数を調和関数として
準備する(ステップS1)。このとき設定される標準周
波数としては、周波数解析の特性に合わせて任意に設定
することができるが、音響信号の符号化に利用するため
には、図2および〔数式1〕に示したように、MIDI
規格のノートナンバーnに対応させて設定することが好
ましい。
(3.1. Frequency Analysis Apparatus and Acoustic Signal Coding Apparatus According to the Present Invention) The frequency analysis apparatus and acoustic signal coding apparatus according to the present invention will be described below. FIG. 5 is a flowchart showing an outline of frequency analysis according to the present invention. First, set multiple standard frequencies,
A standard periodic function corresponding to each standard frequency is prepared as a harmonic function (step S1). The standard frequency set at this time can be arbitrarily set according to the characteristics of the frequency analysis, but in order to use it for encoding the acoustic signal, as shown in FIG. 2 and [Equation 1], , MIDI
It is preferable to set in correspondence with the standard note number n.

【0046】続いて、解析対象となる時系列信号の全区
間に渡って単位区間を設定し、設定された単位区間の時
系列信号を区間信号として抽出する(ステップS2)。
単位区間の設定は、図1(a)に示したのとは異なり、
隣接する単位区間が互いに重複するように行う。
Subsequently, a unit section is set over the entire section of the time series signal to be analyzed, and the time series signal of the set unit section is extracted as a section signal (step S2).
The setting of the unit section is different from that shown in FIG.
The unit sections adjacent to each other are overlapped with each other.

【0047】続いて、抽出した区間信号に対して、全調
和関数との相関計算を行う(ステップS3)。例えば、
図2に示したようなノートナンバーに対応して標準周波
数を設定した場合には、128個の調和関数との相関計
算が行われる。このステップS3における調和関数との
相関計算は、上記〔数式4〕を用いた手法で行われる。
すなわち、区間信号のうち、先頭から、相関計算を行う
調和関数の周期の整数倍で単位区間長を超えない部分
と、調和関数との相関を算出する。ただし、先頭の単位
区間と2番目以降の単位区間では、相関計算の方法が異
なる。先頭の単位区間については、上記〔数式4〕に従
って、単位区間全体に渡って相関計算を行うが、2番目
以降の単位区間では、既に計算した直前の単位区間の相
関値から重複部分の相関値を減じ、その単位区間内で直
前の単位区間と重複していない部分の相関値だけを新た
に計算して加算する処理を行っていく。
Then, the correlation calculation with the total harmonic function is performed on the extracted section signal (step S3). For example,
When the standard frequency is set corresponding to the note number as shown in FIG. 2, correlation calculation with 128 harmonic functions is performed. The correlation calculation with the harmonic function in step S3 is performed by the method using the above [Formula 4].
That is, the correlation between the harmonic function and the portion of the interval signal from the beginning that is an integral multiple of the cycle of the harmonic function for which correlation calculation is performed and does not exceed the unit interval length is calculated. However, the correlation calculation method is different between the first unit section and the second and subsequent unit sections. For the first unit section, the correlation calculation is performed over the entire unit section according to the above [Formula 4], but in the second and subsequent unit sections, the correlation value of the overlapping portion is calculated from the correlation value of the immediately preceding unit section that has already been calculated. Is subtracted, and only the correlation value of a portion that does not overlap with the immediately preceding unit section in the unit section is newly calculated and added.

【0048】図6を用いて直前の単位区間の相関値を用
いた、目的とする現単位区間の相関値の計算の考え方に
ついて説明する。ここでは、直前の単位区間を前区間、
目的とする現単位区間を、現区間もしくは後区間と呼ぶ
ことにする。図6において、図6(a)は、音響信号の
波形を示すものであり、図6(b)は時系列の音響信号
に設定された固定長Lの単位区間diおよび単位区間d
i+1の様子を示す図である。なお、図6(b)におい
て、Dは、単位区間diの開始時刻と単位区間di+1の開
始時刻との差であり、全単位区間が固定長であるため、
単位区間diの終了時刻と単位区間di+1の終了時刻の差
もDとなる。本明細書では、この時間的長さDを更新区
間と呼ぶことにする。図6に示すように、固定長Lの単
位区間di+ 1の相関値を計算する場合、既に計算が終了
している固定長Lの単位区間diの相関値を利用する。
具体的には、単位区間di内の単位区間di+1と重複して
いない先頭領域dhにおける区間信号と調和関数との相
関値と、単位区間di+1内の単位区間diと重複していな
い後尾領域dbにおける区間信号と調和関数との相関値
をそれぞれ計算し、単位区間diの相関値から先頭領域
dhの相関値を減算すると共に後尾領域dbの相関値を
加算する。これにより単位区間diと単位区間di+1の重
複領域の相関値の計算をしなくて済むので、時系列信号
全体における相関計算の総負荷が少なくなる。
The concept of calculation of the target correlation value of the current unit section using the correlation value of the immediately preceding unit section will be described with reference to FIG. Here, the immediately preceding unit section is the previous section,
The target current unit section is called a current section or a subsequent section. In FIG. 6, FIG. 6A shows the waveform of the acoustic signal, and FIG. 6B shows the unit section d i and the unit section d of the fixed length L set in the time-series acoustic signal.
It is a figure which shows the mode of i + 1 . Since in FIG. 6 (b), D is the difference between the start time and the unit interval d i + 1 of the start time of the unit section d i, all the unit interval is a fixed length,
The difference between the end time of the unit section d i and the end time of the unit section d i + 1 is also D. In this specification, this temporal length D will be referred to as an update interval. As shown in FIG. 6, when the correlation value of the unit section d i + 1 of the fixed length L is calculated, the correlation value of the unit section d i of the fixed length L for which the calculation has already been completed is used.
Specifically, the correlation value between the harmonic function and the interval signal in the head area dh does not overlap with the unit section d i + 1 in the unit section d i, the unit section d i of the unit section in d i + 1 The correlation values of the section signals and the harmonic functions in the non-overlapping tail region db are calculated, the correlation value of the head region dh is subtracted from the correlation value of the unit segment d i , and the correlation value of the tail region db is added. As a result, it is not necessary to calculate the correlation value of the overlapping region of the unit section d i and the unit section d i + 1 , and the total load of the correlation calculation for the entire time series signal is reduced.

【0049】ここで、具体的に相関値を求める計算式を
用いて計算負荷の軽減について説明する。第i番目の単
位区間における周波数f(n)に対する相関値En
(i)は、上記〔数式2〕を基に、以下の〔数式6〕の
ように表現することができる。なお、相関値は、準備し
た調和関数の数だけ算出される。例えば、図2に示した
ように128個の調和関数を準備した場合には、128
個の相関値が算出されるが、ここでは、ある1つの標準
周波数による相関値En(i)を代表して示す。
Here, the reduction of the calculation load will be specifically described by using the calculation formula for obtaining the correlation value. Correlation value En for frequency f (n) in the i-th unit section
(I) can be expressed as the following [Equation 6] based on the above [Equation 2]. The correlation value is calculated by the number of prepared harmonic functions. For example, if 128 harmonic functions are prepared as shown in FIG.
Although the correlation value is calculated individually, here, the correlation value En (i) at a certain standard frequency is shown as a representative.

【0050】〔数式6〕 En(i)={((2/L)Σk=1,Lx(k) sin(2πfn
k/F))2+((2/L)Σk=1,Lx(k) cos(2πfn
/F))21/2
[Equation 6] En (i) = {((2 / L) Σ k = 1, L x (k) sin (2πf n
k / F)) 2 + ((2 / L) Σ k = 1, L x (k) cos (2πf n k
/ F)) 2 } 1/2

【0051】上記〔数式6〕においては、説明の便宜
上、サンプル番号を図3に示した、0,1,2,3,・
・・,k,・・・,w−2,w−1から1,2,3,・
・・,L−1,Lと置き換えている。すなわち、計算負
荷の削減量をわかりやすくするため、サンプル点の数を
固定長Lと同じ値としている。そして、Lは周期F/f
(n)の整数倍になるように与え、実際には周波数f
(n)に依存して変化する。
In the above [Formula 6], for convenience of explanation, sample numbers 0, 1, 2, 3, ...
.., k, ..., w-2, w-1 to 1, 2, 3, ...
.., L-1 and L are replaced. That is, in order to make it easy to understand the reduction amount of the calculation load, the number of sample points is set to the same value as the fixed length L. And L is the period F / f
It is given as an integer multiple of (n), and the frequency f is actually
It changes depending on (n).

【0052】ここで、計算量の変化をわかりやすくする
ために、上記〔数式6〕において、調和関数の正弦関数
と区間信号の各サンプル点における振幅値の乗算値の総
和である「(2/L)Σk=1,Lx(k) sin(2πfnk/
F)」をSn(i,1,L)、「(2/L)Σk=1,Lx(k)
cos(2πfnk/F)」をCn(i,1,L)と置き換
える。これにより、〔数式6〕は以下の〔数式7〕のよ
うに変形できる。
Here, in order to make it easy to understand the change in the calculation amount, in the above [Equation 6], it is the sum of the product of the sine function of the harmonic function and the amplitude value at each sample point of the interval signal, "(2 / L) Σ k = 1, L x (k) sin (2πf n k /
F) ”is Sn (i, 1, L),“ (2 / L) Σ k = 1, L x (k)
Replace “cos (2πf n k / F)” with Cn (i, 1, L). Thereby, [Formula 6] can be transformed into [Formula 7] below.

【0053】〔数式7〕 En(i)={Sn(i,1,L)2+ Cn(i,1,
L)21/2
[Equation 7] En (i) = {Sn (i, 1, L) 2 + Cn (i, 1,)
L) 2 } 1/2

【0054】上記〔数式7〕において、Sn(i,1,
L)は、調和関数の正弦関数と区間信号の相関をサンプ
ル点1からサンプル点Lまで計算したものであり、Cn
(i,1,L)は、調和関数の余弦関数と区間信号の相
関をサンプル点1からサンプル点Lまで計算したもので
ある。すなわち、Sn(i,1,L)、Cn(i,1,
L)共にL点分の計算を行っている。これに対して、単
位区間di+1の相関値En(i+1)は、以下の〔数式
8〕のように表現できる。
In the above [Formula 7], Sn (i, 1,
L) is the correlation between the sine function of the harmonic function and the interval signal calculated from sample point 1 to sample point L, and Cn
(I, 1, L) is the correlation between the cosine function of the harmonic function and the interval signal calculated from sample point 1 to sample point L. That is, Sn (i, 1, L), Cn (i, 1, L)
L) Both are calculating for L points. On the other hand, the correlation value En (i + 1) of the unit section d i + 1 can be expressed as the following [Equation 8].

【0055】〔数式8〕 En(i+1)={Sn(i+1,1,L)2+ Cn
(i+1,1,L)21/2
[Equation 8] En (i + 1) = {Sn (i + 1,1, L) 2 + Cn
(I + 1,1, L) 2 } 1/2

【0056】単位区間di+1も区間長は単位区間diと同
じLであるため、サンプル点は単位区間の先頭をサンプ
ル点1、最後尾をサンプル点Lとしている。この式を詳
細に書き直すと、以下の〔数式9〕ようになる。
Since the unit section d i + 1 has the same section length L as that of the unit section d i , the sample points are the sample point 1 at the beginning of the unit section and the sample point L at the end. If this equation is rewritten in detail, the following [Equation 9] is obtained.

【0057】〔数式9〕 En(i+1)={((2/L)Σk=1,Lx(k+D) sin
(2πfn(k+D)/F)) 2+((2/L)Σk=1,Lx(k+
D) cos(2πfn(k+D)/F))21/2
[Equation 9] En (i + 1) = {((2 / L) Σk = 1, Lx (k + D) sin
(2πfn(k + D) / F)) 2+ ((2 / L) Σk = 1, Lx (k +
D) cos (2πfn(k + D) / F))2}1/2

【0058】〔数式9〕は、〔数式6〕の「k」を「k
+D」で置き換えたものとなっている。これは、実際に
は単位区間diと単位区間di+1では、その更新区間であ
るDだけサンプル点が異なるので、区間信号xの値もそ
れに伴って変化するためである。区間信号と相関計算を
行う調和関数については、更新区間Dのオフセットを加
えないのが通常であるが、本実施形態では、前述の通り
Lを周期F/f(n)の整数倍に設定しているため、更
新区間Dのオフセットを加えても理論上はEn(i+
1)の値は変化しない。本願では発明の構成上、単位区
間の更新区間に合わせて位相を変化させてやる必要があ
るため、更新区間Dのオフセットを加え、sin(2πfn
k/F)、 cos(2πfnk/F)は、それぞれsin(2πf
n(k+D)/F)、cos(2πfn(k+D)/F)と置き換え
る。そうすると、〔数式9〕は、以下の〔数式10〕の
ように書き換えることができる。
In [Equation 9], "k" in [Equation 6] is replaced with "k".
It is replaced with "+ D". This is because the unit section d i and the unit section d i + 1 actually have different sampling points by the update section D, so that the value of the section signal x also changes accordingly. Regarding the harmonic function for performing the correlation calculation with the interval signal, it is usual not to add the offset of the update interval D, but in this embodiment, L is set to an integral multiple of the period F / f (n) as described above. Therefore, theoretically, En (i +
The value of 1) does not change. In the present application, because of the configuration of the invention, it is necessary to change the phase in accordance with the update section of the unit section. Therefore, the offset of the update section D is added and sin (2πf n
k / F) and cos (2πf n k / F) are sin (2πf n )
n (k + D) / F) and cos (2πf n (k + D) / F). Then, [Formula 9] can be rewritten as [Formula 10] below.

【0059】〔数式10〕 En(i+1)=[{(2/L)Σk=1,Lx(k) sin(2π
nk/F)−(2/D)Σ k=1,Dx(k) sin(2πfnk/
F)+(2/D)Σk=L-D+1,Lx(k+D) sin(2πf n(k
+D)/F)}2+{(2/L)Σk=1,Lx(k) cos(2πfn
k/F)−(2/D)Σk=1,Dx(k) cos(2πfnk/F)
+(2/D)Σk=L-D+1,Lx(k+D) cos(2πfn(k+
D)/F)}21/2
[Formula 10] En (i + 1) = [{(2 / L) Σk = 1, Lx (k) sin (2π
fnk / F)-(2 / D) Σ k = 1, Dx (k) sin (2πfnk /
F) + (2 / D) Σk = L-D + 1, Lx (k + D) sin (2πf n(k
+ D) / F)}2+ {(2 / L) Σk = 1, Lx (k) cos (2πfn
k / F)-(2 / D) Σk = 1, Dx (k) cos (2πfnk / F)
+ (2 / D) Σk = L-D + 1, Lx (k + D) cos (2πfn(k +
D) / F)}2]1/2

【0060】〔数式9〕から〔数式10〕への変換は、
単位区間di+1の先頭を基準として割り当てたサンプル
点1からサンプル点Lを、単位区間diの先頭を基準と
して置き換え、その際、単位区間diの後尾領域dbに
おける相関値を位相Dだけずらして行っていることを示
す。さらに、〔数式10〕は、〔数式6〕から〔数式
7〕への変換と同様に、以下の〔数式11〕に示すよう
に書き換えることができる。
The conversion from [Equation 9] into [Equation 10] is
The sample points 1 to L assigned with the head of the unit section d i + 1 as a reference are replaced with the head of the unit section d i as a reference, and the correlation value in the tail region db of the unit section d i is phase D Show that you are just staggering. Further, [Formula 10] can be rewritten as shown in [Formula 11] below, similarly to the conversion from [Formula 6] to [Formula 7].

【0061】〔数式11〕 En(i+1)=[{Sn(i,1,L)−Sn(i,
1,D)+Sn(i+1,L−D+1,L)}2+{C
n(i,1,L)−Cn(i,1,D)+Cn(i+
1,L−D+1,L)}21/2
[Equation 11] En (i + 1) = [{Sn (i, 1, L) -Sn (i,
1, D) + Sn (i + 1, L-D + 1, L)} 2 + {C
n (i, 1, L) -Cn (i, 1, D) + Cn (i +
1, L-D + 1, L)} 2 ] 1/2

【0062】上記〔数式11〕のうち、Sn(i,1,
L)、Cn(i,1,L)については、〔数式7〕の算
出の際に既に求められているため、計算する必要はな
く、新たに算出が必要なのは、Sn(i,1,D)、S
n(i+1,L−D+1,L)、Cn(i,1,D)、
Cn(i+1,L−D+1,L)となる。Sn(i,
1,L)、Cn(i,1,L)はサンプル点1からサン
プル点LまでのL個のサンプル点における区間信号と調
和関数の振幅値の乗算を行っているが、Sn(i,1,
D)、Cn(i,1,D)はサンプル点1からサンプル
点DまでのD個のサンプル点、Sn(i+1,L−D+
1,L)、Cn(i+1,L−D+1,L)も、サンプ
ル点L−D+1からサンプル点LまでのD個のサンプル
点における区間信号と調和関数の振幅値の乗算を行うこ
とになる。
In the above [Formula 11], Sn (i, 1,
L) and Cn (i, 1, L) have already been obtained when calculating [Equation 7], and therefore need not be calculated. Sn (i, 1, D) is newly calculated. ), S
n (i + 1, L-D + 1, L), Cn (i, 1, D),
It becomes Cn (i + 1, L-D + 1, L). Sn (i,
1, L) and Cn (i, 1, L) multiply the interval signal at the L sample points from sample point 1 to sample point L by the amplitude value of the harmonic function, but Sn (i, 1) ,
D) and Cn (i, 1, D) are D sample points from sample point 1 to sample point D, and Sn (i + 1, L-D +).
1, L) and Cn (i + 1, L-D + 1, L), the section signals at the D sample points from the sample point L-D + 1 to the sample point L are also multiplied by the amplitude value of the harmonic function.

【0063】このことからわかるように単位区間di+1
における計算量は、そのまま計算を行った場合は、L個
のサンプル点における計算をしなければならないが、直
前の単位区間diで求めた相関値を利用した場合、2D
個のサンプル点における計算をすれば良いことになる。
すなわち、計算量は2D/Lとなる。これは、時間分解
能を高めるために隣接する単位区間の重複領域を大きく
すればするほど、すなわち更新区間Dを小さくすればす
るほど、かかっていた計算量を大幅に削減することが可
能になることを示している。
As can be seen from this, the unit section d i + 1
When the calculation is performed as it is, the calculation at L sample points must be performed. However, when the correlation value obtained in the immediately preceding unit section d i is used, 2D
It suffices to perform the calculation at each sample point.
That is, the calculation amount is 2D / L. This means that the larger the overlapping area of the adjacent unit sections in order to improve the time resolution, that is, the smaller the update section D, the more the amount of calculation required can be significantly reduced. Is shown.

【0064】単位区間ごとに算出された相関値は、各単
位区間ごとに用意された信号相関配列に格納されること
になる。同様にして、全単位区間について相関計算を行
い、各単位区間ごとの相関値が得られたら、上記2.1.の
項で説明したように、相互相関テーブルを利用して信号
相関配列の値を補正する(ステップS4)。
The correlation value calculated for each unit section is stored in the signal correlation array prepared for each unit section. Similarly, perform correlation calculation for all unit intervals, and when the correlation value for each unit interval is obtained, correct the value of the signal correlation array using the cross-correlation table as described in section 2.1. Yes (step S4).

【0065】ステップS3における相関計算、ステップ
S4における相関補正をステップS3において設定され
た全単位区間に対して行うことにより、全単位区間にお
けるN個の周波数成分が得られる。すなわち、全単位区
間における周波数のスペクトルデータが得られることに
なる。
By performing the correlation calculation in step S3 and the correlation correction in step S4 for all the unit intervals set in step S3, N frequency components in all the unit intervals can be obtained. That is, the spectrum data of the frequencies in all the unit sections can be obtained.

【0066】(3.2.音響信号の符号化)以上のようにし
て時系列信号の周波数解析が行われ、各単位区間につい
て含有信号がN個抽出される。時系列信号として音響信
号を採用し、音響信号の符号化を行う場合には、標準周
波数f(n)を図2に示したようにMIDIのノートナ
ンバー、すなわち半音単位の音高の間隔で設定し、各ノ
ートナンバーに対応するN(=128)個の周波数成分
が得られる。そして、上述のように周波数成分の周波数
をノートナンバー、相関値をベロシティ、単位区間の始
点をノートオン時刻、後続する単位区間の始点をノート
オフ時刻とするMIDIデータへの変換を行うことによ
り、音響信号が符号化される。
(3.2. Coding of acoustic signal) The frequency analysis of the time-series signal is performed as described above, and N contained signals are extracted for each unit section. When an acoustic signal is adopted as the time-series signal and the acoustic signal is encoded, the standard frequency f (n) is set at MIDI note numbers, that is, pitch intervals in semitone units, as shown in FIG. Then, N (= 128) frequency components corresponding to each note number are obtained. Then, as described above, by performing conversion into MIDI data in which the frequency of the frequency component is the note number, the correlation value is the velocity, the start point of the unit section is the note-on time, and the start point of the following unit section is the note-off time, The audio signal is encoded.

【0067】(3.3.周波数の設定について)上記実施形
態においては、抽出すべき周波数を、MIDI規格のノ
ートナンバーnに対応させた標準周波数として〔数式
1〕のように設定したが、実際には、さらに細かい間隔
で設定しないと、精度の高い検出を行うことができな
い。その理由は、周波数の設定が、上記〔数式1〕のよ
うに、ノートナンバーに比例した対数的な間隔になって
いるため、周波数が高くなるほど計算間隔が粗くなり、
周波数成分が見落とされる確率が増大するためである。
時系列信号として音響信号を解析し、符号化を行う場合
には、〔数式1〕のようにノートナンバーに対応した間
隔で設定する必要がある。そして、隣接する標準周波数
間に設定する細かい周波数は〔数式1〕のように対数的
な間隔にとることが望ましい。例えば、各ノートナンバ
ー間に12個の周波数を、それぞれノートナンバーの1
/13間隔となるように設定する。すなわち、各標準周
波数間の等比級数的な間隔で周波数を設定することにな
る。具体的には、標準周波数f(n)と標準周波数f
(n+1)の間には、周波数f(n+m/M)が設定さ
れることになる。ここで、Mは0以上の整数、mは0〜
M−1の値をとる整数である。この場合、等比級数的な
間隔で周波数を設定すると、各周波数は、以下の〔数式
12〕で表現される。
(3.3. Regarding Frequency Setting) In the above embodiment, the frequency to be extracted is set as the standard frequency corresponding to the MIDI standard note number n as in [Equation 1]. If the intervals are not set finer, highly accurate detection cannot be performed. The reason is that the frequency setting is a logarithmic interval proportional to the note number, as in the above [Formula 1]. Therefore, the higher the frequency, the coarser the calculation interval,
This is because the probability of missing a frequency component increases.
When an acoustic signal is analyzed as a time-series signal and encoded, it is necessary to set at intervals corresponding to note numbers as in [Equation 1]. Then, it is desirable that the fine frequencies set between the adjacent standard frequencies have logarithmic intervals as in [Equation 1]. For example, 12 frequencies between each note number, 1 for each note number
/ 13 interval is set. That is, the frequencies are set at geometric intervals between the standard frequencies. Specifically, the standard frequency f (n) and the standard frequency f
The frequency f (n + m / M) is set between (n + 1). Here, M is an integer of 0 or more, m is 0
It is an integer that takes the value of M-1. In this case, if frequencies are set at geometrical intervals, each frequency is expressed by the following [Equation 12].

【0068】〔数式12〕 f(n)=440×2(n-69)/12 f(n+m/M )=440×2(n+m/M-69)/12 f(n+1)=440×2(n+1-69)/12 ただし、n=0,1,2,・・・,127、m=0,1,
2,・・・,M−1
[Equation 12] f (n) = 440 × 2 (n-69) / 12 f (n + m / M) = 440 × 2 (n + m / M-69) / 12 f (n + 1) = 440 × 2 (n + 1-69) / 12 However, n = 0,1,2, ..., 127, m = 0,1,
2, ..., M-1

【0069】例えば、上述のように各ノートナンバー間
に12個の周波数を、それぞれノートナンバーの1/1
3間隔となるように設定した場合は、〔数式12〕にお
いてM=13とした場合に該当する。このような設定を
行った場合、周波数は全部で128×13個設定される
ことになり、相関値の算出精度は向上されることにな
る。音響信号への符号化の際には、このように細かい周
波数設定に対応する周波数が存在しないため、最大とな
る相関値を選別して最も近いノートナンバーに対応する
強度(ベロシティ)成分として与える。
For example, as described above, twelve frequencies are provided between note numbers, each of which is 1/1 of the note number.
The setting of 3 intervals corresponds to the case where M = 13 in [Equation 12]. When such a setting is made, the frequency is set to 128 × 13 in total, and the calculation accuracy of the correlation value is improved. Since there is no frequency corresponding to such a fine frequency setting when encoding into an audio signal, the maximum correlation value is selected and given as an intensity (velocity) component corresponding to the closest note number.

【0070】しかし、上述のように細かい間隔で周波数
を設定すると当然のことながら、相関計算にかかる計算
負荷は膨大なものになる。そして、計算時間を費やして
算出した個々の細かい周波数に対応する相関値は選別さ
れて、そのほとんどが使用されない。すなわち、個々の
細かい周波数に対応する相関値の大小関係は重要である
が、絶対的な精度は必要としない。そこで、本発明にお
いては、標準周波数間に実際に細かい間隔で周波数を設
定して、設定した各周波数と区間信号との相関計算を一
々行うのでなく、隣接する標準周波数の相関値を基に各
標準周波数間における細かい周波数に対応する相関値を
推定し、各標準周波数に対応する最大となる細かい周波
数の相関値を探索する処理を行う。例えば、周波数f
(n+m/M )における相関値En+m/Mは、以下の〔数
式13〕により算出される。
However, if the frequencies are set at fine intervals as described above, it goes without saying that the calculation load for the correlation calculation becomes enormous. Then, the correlation values corresponding to the individual fine frequencies calculated by spending the calculation time are selected, and most of them are not used. That is, the magnitude relation of the correlation values corresponding to each fine frequency is important, but absolute accuracy is not required. Therefore, in the present invention, the frequencies are actually set at fine intervals between the standard frequencies, and the correlation calculation between each set frequency and the section signal is not performed one by one, but each frequency is set based on the correlation value of the adjacent standard frequency. A process of estimating a correlation value corresponding to a fine frequency between standard frequencies and searching for a correlation value of a maximum fine frequency corresponding to each standard frequency is performed. For example, frequency f
(N + m / M) correlation value E n + m / M in is calculated by the following [Equation 13].

【0071】〔数式13〕 En+m/M ={((2/L)Σx(k) sin(2πfn+m/Mk/
F))2+((2/L)Σx(k) cos(2πfn+m/Mk/
F))21/2={ Sn+m/M 2+Cn+m/M 21/2
[Equation 13] E n + m / M = {((2 / L) Σx (k) sin (2πf n + m / M k /
F)) 2 + ((2 / L) Σx (k) cos (2πf n + m / M k /
F)) 2 } 1/2 = {S n + m / M 2 + C n + m / M 2 } 1/2

【0072】なお、数式が繁雑になるのを避けるため、
この〔数式13〕および下記の〔数式14〕内ではf
(n)をfn、 f(n+m/M )をfn+m/M、f(n+
1)をfn+1と表現している。ここで、標準周波数f
(n)とf(n+1)との間における細かい周波数の調
和関数sin(2πfn+m/Mk/F)を2つの隣接する標準周
波数の調和関数を基に線形近似すると、すなわちsin(2
πfn+m/Mk/F)≒sin(2πfnk/F)+{sin(2πf
n+1k/F)−sin(2πfnk/F)}m/Mとおくと、上
記〔数式13〕は、以下の〔数式14〕のように変形さ
れる。
In order to avoid complicated formulas,
In this [Formula 13] and the following [Formula 14], f
(N) is f n , f (n + m / M) is f n + m / M , f (n +
1) is expressed as f n + 1 . Here, the standard frequency f
Linearly approximating a fine frequency harmonic function sin (2πf n + m / M k / F) between (n) and f (n + 1) based on two adjacent standard frequency harmonic functions, that is, sin (2
πf n + m / M k / F) ≈sin (2πf n k / F) + {sin (2πf
If n + 1 k / F) -sin (2πf n k / F)} m / M is set, the above [Formula 13] is transformed into the following [Formula 14].

【0073】〔数式14〕 En+m/M =[{Sn+(Sn+1−Sn)m/M}2+{Cn
+(Cn+1−Cn)m/M}21/2
[Equation 14] E n + m / M = [{S n + (S n + 1 −S n ) m / M} 2 + {C n
+ (C n + 1 −C n ) m / M} 2 ] 1/2

【0074】このことは、標準周波数間に等比級数間隔
で周波数を設定した場合には、設定した数分の相関計算
を行わなければならないのに対し、相関計算は標準周波
数に対して行うだけで良く、求めた相関値を利用した加
減算を行えば良いことを示している。相関計算の負荷に
比べると、加減算にかかる負荷はほとんど無視できるほ
ど小さいため、例えば、上述のように標準周波数間に1
2個の周波数を設定して相関計算を行った場合に比べ
て、相関値算出のための総計算負荷は約1/13にな
る。
This means that, when frequencies are set at geometric series intervals between standard frequencies, correlation calculation for the set number must be performed, whereas correlation calculation is performed only for standard frequencies. It means that the addition and subtraction using the calculated correlation value should be performed. Compared with the load of correlation calculation, the load of addition and subtraction is almost negligible.
The total calculation load for calculating the correlation value is about 1/13 as compared with the case where the correlation calculation is performed by setting two frequencies.

【0075】(4.装置構成)続いて、本発明に係る周波
数解析装置および音響信号符号化装置の装置構成につい
て説明する。図7は、本発明に係るMIDI符号に変換
するための音響信号符号化装置の機能ブロック図であ
る。図7において、1は音響信号入力手段、2は周波数
解析装置、3は音素連結手段、4はMIDI符号変換手
段である。
(4. Device Configuration) Next, the device configurations of the frequency analysis device and the acoustic signal coding device according to the present invention will be described. FIG. 7 is a functional block diagram of an audio signal encoding apparatus for converting to a MIDI code according to the present invention. In FIG. 7, 1 is an acoustic signal input means, 2 is a frequency analysis device, 3 is a phoneme connection means, and 4 is a MIDI code conversion means.

【0076】音響信号入力手段1は、時系列信号である
音響信号を入力するためのものである。図7に示す装置
を周波数解析装置として用いる場合は、音響信号に限ら
ず時系列信号を入力することができる。周波数解析装置
2は、上記ステップS2〜ステップS4の処理を実行す
るものであり、時系列信号の周波数解析を行って単位区
間ごとの周波数成分(周波数および相関値、すなわちス
ペクトルデータ)を抽出する機能を有する。
The acoustic signal input means 1 is for inputting an acoustic signal which is a time series signal. When the device shown in FIG. 7 is used as a frequency analysis device, not only acoustic signals but also time series signals can be input. The frequency analysis device 2 executes the processing of steps S2 to S4, and has a function of performing frequency analysis of a time-series signal to extract frequency components (frequency and correlation values, that is, spectrum data) for each unit section. Have.

【0077】音素連結手段3は、音響信号に対して周波
数解析を行った結果得られる単位区間の開始時刻、後続
する単位区間の開始時刻、周波数、強度値の4つの情報
からなる音素データを、隣接する音素データの類似性に
基づいて互いに連結して連結音素データとする処理を行
う。MIDI符号変換手段4は、符号化された符号デー
タをMIDI形式に変換するものであり、上述のように
連結音素データの発音開始時刻にノートオン、発音終了
時刻のノートオフイベントを発生させると共に、ノート
オンイベント発生時に、周波数に対応したノートナンバ
ー、強度値に対応したベロシティを設定する機能を有す
る。
The phoneme connecting means 3 obtains phoneme data consisting of four pieces of information, which are the start time of a unit section, the start time of the following unit section, the frequency, and the intensity value, which are obtained as a result of frequency analysis of the acoustic signal. Based on the similarity of adjacent phoneme data, the phoneme data is connected to each other to form connected phoneme data. The MIDI code conversion means 4 converts the encoded code data into a MIDI format, and generates a note-on event at the sounding start time and a note-off event at the sounding end time of the concatenated phoneme data as described above. It has the function of setting the note number corresponding to the frequency and the velocity corresponding to the intensity value when a note-on event occurs.

【0078】ここで、周波数解析装置2の詳細について
説明する。本発明においては、周波数解析装置2として
3つの構成パターンがあるので、それぞれ説明する。ま
ず、第1の構成パターンは図8(a)に示すような構成
となる。区間信号抽出手段11は、上記ステップS2の
処理を行う機能を有している。前区間先頭の相関算出手
段12は、上記ステップS3において、目的とする現単
位区間の相関値を算出する際に、その直前の前単位区間
の先頭領域dhと区間信号の相関を算出する機能を有し
ている。後区間後尾の相関算出手段13は、上記ステッ
プS3において、目的とする現単位区間の相関値を算出
する際に、その現単位区間の後尾領域dbと区間信号の
相関を算出する機能を有している。前区間相関値の記憶
手段14は、前区間の相関値を記憶するための記憶手段
である。相関合算手段15は、上記ステップS3におい
て、目的とする現単位区間の相関値を算出する際に、前
区間相関値の記憶手段14に記憶された前区間の相関値
を抽出し、この相関値に対して、前区間先頭の相関算出
手段12で算出した相関値を減算すると共に、後区間後
尾の相関算出手段13で算出した相関値を加算する処理
を行う機能を有している。スペクトル算出手段16は、
上記相互相関テーブルを利用してスペクトルデータを出
力する機能を有している。
Here, the details of the frequency analysis device 2 will be described. In the present invention, the frequency analysis device 2 has three configuration patterns, which will be described respectively. First, the first configuration pattern has a configuration as shown in FIG. The section signal extraction means 11 has a function of performing the process of step S2. In step S3, the correlation calculating means 12 at the beginning of the preceding section has a function of calculating the correlation between the leading area dh of the preceding preceding unit section and the section signal when calculating the target correlation value of the current unit section. Have The correlation calculating means 13 of the tail of the rear section has a function of calculating the correlation between the tail region db of the current unit section and the section signal when calculating the correlation value of the target current unit section in step S3. ing. The previous section correlation value storage unit 14 is a storage unit for storing the previous section correlation value. In step S3, the correlation summing means 15 extracts the correlation value of the previous section stored in the storage section 14 of the previous section correlation value when calculating the correlation value of the target current unit section, and this correlation value On the other hand, it has a function of subtracting the correlation value calculated by the correlation calculating means 12 at the beginning of the preceding section and adding the correlation value calculated by the correlation calculating means 13 at the end of the succeeding section. The spectrum calculation means 16 is
It has a function of outputting spectrum data by using the cross-correlation table.

【0079】また、第2の構成パターンは図8(b)に
示すような構成となる。図8(b)において、図8
(a)と同一の機能を有するものについては、同一の符
号を付して説明を省略し、第1の構成パターンと異なる
ものについて説明する。基本調和関数との相関算出手段
21は、ある基本とする標準周波数をf(n)としたと
きに、標準周波数f(n)の調和関数と区間信号との相
関を算出する機能を有している。差分調和関数との相関
算出手段22は、ある基本とする標準周波数をf(n)
としたときに、隣接する標準周波数f(n+1)の調和
関数とf(n)の調和関数との差分信号sin(2πfn+1
k/F)−sin(2πfnk/F)およびcos(2πfn+1k/
F)−cos(2πfnk/F)と区間信号との相関を算出す
る機能を有している。相関調整手段23は、上記〔数式
13〕および〔数式14〕に従って、標準周波数f
(n)と標準周波数f(n+1)の間に存在する周波数
に対応する相関値を、標準周波数f(n)の調和関数と
の相関値および標準周波数f(n+1)の調和関数とf
(n)の調和関数との差分信号との相関値を用いて近似
的に算出する機能を有している。
The second configuration pattern has a configuration as shown in FIG. 8 (b). In FIG.
For those having the same function as (a), the same reference numerals are given and the description thereof is omitted, and only those different from the first configuration pattern will be described. The correlation calculating means 21 with the basic harmonic function has a function of calculating the correlation between the harmonic function of the standard frequency f (n) and the section signal, where f (n) is a certain standard frequency. There is. The correlation calculating means 22 with the difference harmonic function determines a certain standard frequency as f (n).
, The difference signal sin (2πf n + 1 ) between the adjacent harmonic function of the standard frequency f (n + 1) and the adjacent harmonic function of f (n).
k / F) -sin (2πf n k / F) and cos (2πf n + 1 k /
It has a function of calculating the correlation between F) -cos (2πf n k / F) and the interval signal. The correlation adjusting means 23 uses the standard frequency f according to the above [Formula 13] and [Formula 14]
The correlation value corresponding to the frequency existing between (n) and the standard frequency f (n + 1) is the correlation value with the harmonic function of the standard frequency f (n) and the harmonic function of the standard frequency f (n + 1) and f.
It has a function of approximately calculating using the correlation value between the harmonic function of (n) and the difference signal.

【0080】また、第3の構成パターンは図9に示すよ
うな構成となる。第3の構成パターンは、第1の構成パ
ターンと第2の構成パターンを組み合わせたものになっ
ている。図9においても、図8(a)、図8(b)と同
一の機能を有するものについては、同一の符号を付して
説明を省略し、第1、第2の構成パターンと異なるもの
について説明する。図9において、前区間先頭の相関算
出手段12a、後区間後尾の相関算出手段13a、前区
間相関値の記憶手段14a、相関合算手段15aは、図
8(b)に示した基本調和関数との相関算出手段21の
処理を、図8(a)に示した前区間先頭の相関算出手段
12、後区間後尾の相関算出手段13、前区間相関値の
記憶手段14、相関合算手段15で実行するためのもの
であり、前区間先頭の相関算出手段12b、後区間後尾
の相関算出手段13b、前区間相関値の記憶手段14
b、相関合算手段15bは、図8(b)に示した差分調
和関数との相関算出手段22の処理を、図8(a)に示
した前区間先頭の相関算出手段12、後区間後尾の相関
算出手段13、前区間相関値の記憶手段14、相関合算
手段15で実行するためのものである。
The third configuration pattern has a configuration as shown in FIG. The third configuration pattern is a combination of the first configuration pattern and the second configuration pattern. In FIG. 9 as well, those having the same functions as those in FIGS. 8A and 8B are denoted by the same reference numerals and description thereof is omitted, and those different from the first and second configuration patterns explain. In FIG. 9, the correlation calculating means 12a at the beginning of the preceding section, the correlation calculating means 13a at the tail of the following section, the storing means 14a of the correlation value of the preceding section, and the correlation summing means 15a are the same as those of the basic harmonic function shown in FIG. The processing of the correlation calculation unit 21 is executed by the correlation calculation unit 12 at the beginning of the preceding section, the correlation calculation unit 13 at the end of the succeeding section, the storage unit 14 of the correlation value of the preceding section, and the correlation summing unit 15 shown in FIG. 8A. This is for the purpose of the correlation calculation means 12b at the beginning of the preceding section, the correlation calculation means 13b at the tail of the following section, and the storage section 14 for the correlation value of the preceding section.
b, the correlation summing means 15b performs the processing of the correlation calculation means 22 with the differential harmonic function shown in FIG. 8B by the correlation calculation means 12 at the beginning of the preceding section and the processing at the tail of the succeeding section shown in FIG. 8A. This is to be executed by the correlation calculation unit 13, the previous section correlation value storage unit 14, and the correlation summation unit 15.

【0081】なお、図7〜図9に示した周波数解析装置
および音響信号符号化装置は、実際には、コンピュータ
等の演算処理装置に専用のソフトウェアを搭載すること
により実現される。具体的には、図5のフローチャート
に示したようなステップを上記手順で実行するためのプ
ログラムをコンピュータに搭載しておく。そして、音響
信号等の時系列信号をPCM方式等でデジタル化した
後、コンピュータで実現される音響信号符号化装置に取
り込み、ステップS2〜ステップS4の処理を行った
後、抽出したスペクトルデータを出力する。音響信号符
号化装置においては、さらに、MIDI形式等の符号デ
ータに変換して出力する。出力された符号データは、例
えば、MIDIデータの場合、MIDIシーケンサ、M
IDI音源を用いて音響信号として再生される。
The frequency analysis device and the acoustic signal coding device shown in FIGS. 7 to 9 are actually realized by installing dedicated software in an arithmetic processing device such as a computer. Specifically, a program for executing the steps shown in the flowchart of FIG. 5 in the above procedure is installed in the computer. Then, after time-series signals such as acoustic signals are digitized by the PCM method or the like, they are taken into an acoustic signal encoding device realized by a computer, the processes of steps S2 to S4 are performed, and then the extracted spectrum data is output. To do. The acoustic signal encoding device further converts the encoded data into MIDI format data and outputs the encoded data. If the output code data is MIDI data, for example, a MIDI sequencer, M
It is reproduced as an acoustic signal using an IDI sound source.

【0082】[0082]

【発明の効果】以上、説明したように本発明によれば、
与えられた時系列信号を時系列のスペクトルデータに変
換する周波数解析装置として、解析を行う基本単位であ
る単位区間を、時系列上において隣接する単位区間が互
いに重複するように設定し、各単位区間の時系列信号を
順次抽出する区間信号抽出手段と、前記区間信号抽出手
段により直前に抽出された前区間信号と新たに抽出され
た現区間信号との間で合致しない前区間信号の先頭部に
位置する信号に対して、所定の調和関数との相関を算出
する前区間先頭の相関算出手段と、前区間信号と新たに
抽出された現区間信号との間で合致しない現区間信号の
後尾部に位置する信号に対して、所定の調和関数との相
関を算出する現区間後尾の相関算出手段と、前区間全体
の相関値に対して、前記前区間先頭の相関算出手段によ
り算出した値を減算し、前記現区間後尾の相関算出手段
により算出した値を加算することにより現区間全体の相
関値を算出する相関合算手段と、前記相関合算手段で得
られた現区間全体の相関値を保持するための前区間相関
値の記憶手段と、前記相関合算手段で得られた現区間全
体の相関値に基づいて所定の変換を行い、各単位区間に
対応するスペクトルデータを算出するスペクトル算出手
段により構成するようにしたので、単位区間の重複領域
における相関計算の重複をなくし、相関計算にかかる総
所要時間を削減することが可能となるという効果を奏す
る。
As described above, according to the present invention,
As a frequency analysis device for converting a given time-series signal into time-series spectrum data, a unit section that is the basic unit for analysis is set so that adjacent unit sections on the time series overlap each other, and each unit Section signal extracting means for sequentially extracting time-series signals of a section, and a leading portion of the previous section signal that does not match between the previous section signal extracted immediately before by the section signal extracting section and the newly extracted current section signal For the signal located at, the correlation calculation means at the beginning of the previous section for calculating the correlation with the predetermined harmonic function, and the current section signal that does not match between the previous section signal and the newly extracted current section signal For the signal located at the tail, the correlation calculating means for calculating the correlation with a predetermined harmonic function, and the correlation value for the entire previous interval, the value calculated by the correlation calculating means for the beginning of the previous interval Reduced Then, the correlation summing means for calculating the correlation value of the entire current section by adding the values calculated by the correlation calculation means at the end of the current section, and the correlation value of the whole current section obtained by the correlation summing means are held. And a spectrum calculating means for performing a predetermined conversion based on the correlation value of the entire current section obtained by the correlation summing means, and calculating spectrum data corresponding to each unit section. Thus, there is an effect that it is possible to eliminate the overlap of the correlation calculation in the overlapping region of the unit section and reduce the total time required for the correlation calculation.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係る周波数解析装置および音響信号符
号化装置の基本原理を示す図である。
FIG. 1 is a diagram showing a basic principle of a frequency analysis device and an acoustic signal encoding device according to the present invention.

【図2】本発明で利用される周期関数の一例を示す図で
ある。
FIG. 2 is a diagram showing an example of a periodic function used in the present invention.

【図3】解析対象となる信号と周期信号との相関計算の
手法を示す図である。
FIG. 3 is a diagram showing a method of calculating a correlation between a signal to be analyzed and a periodic signal.

【図4】相関補正テーブルを利用した効果を他の手法と
比較した場合の概念図である。
FIG. 4 is a conceptual diagram when the effect of using the correlation correction table is compared with other methods.

【図5】本発明に係る周波数解析装置および音響信号符
号化装置の処理動作を示すフローチャートである。
FIG. 5 is a flowchart showing processing operations of the frequency analysis device and the acoustic signal encoding device according to the present invention.

【図6】時系列信号に対して隣接する単位区間を互いに
重複して設定した状態を示す図である。
FIG. 6 is a diagram showing a state in which adjacent unit sections are set to overlap each other with respect to a time-series signal.

【図7】本発明に係る音響信号符号化装置の装置構成を
示す図である。
FIG. 7 is a diagram showing a device configuration of an audio signal encoding device according to the present invention.

【図8】本発明に係る周波数解析装置の第1、第2の構
成パターンを示す図である。
FIG. 8 is a diagram showing first and second configuration patterns of the frequency analysis device according to the present invention.

【図9】本発明に係る周波数解析装置の第3の構成パタ
ーンを示す図である。
FIG. 9 is a diagram showing a third configuration pattern of the frequency analysis device according to the present invention.

【符号の説明】[Explanation of symbols]

d,d1〜d5,di,di+1・・・単位区間 D・・・更新区間 L・・・単位区間長 n ・・・ノートナンバー En(i),En(i+1),En+m/M・・・相関値 X,X(k)・・・区間信号d, d1 to d5, d i , d i + 1 ... Unit section D ... Update section L ... Unit section length n ... Note number En (i), En (i + 1), En + m / M: Correlation value X, X (k): Section signal

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H03M 7/30 G10L 7/02 A Fターム(参考) 5D045 AC10 DA20 5D082 BB01 5D108 BA39 5D378 MM41 5J064 AA02 AA03 BA16 BC01 BC27 BD02 BD03 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) H03M 7/30 G10L 7/02 A F term (reference) 5D045 AC10 DA20 5D082 BB01 5D108 BA39 5D378 MM41 5J064 AA02 AA03 BA16 BC01 BC27 BD02 BD03

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】与えられた時系列信号を時系列のスペクト
ルデータに変換する周波数解析装置であって、 解析を行う基本単位である単位区間を、時系列上におい
て隣接する単位区間が互いに重複するように設定し、各
単位区間の時系列信号を順次抽出する区間信号抽出手段
と、 前記区間信号抽出手段により直前に抽出された前区間信
号と新たに抽出された現区間信号との間で合致しない前
区間信号の先頭部に位置する信号に対して、所定の調和
関数との相関を算出する前区間先頭の相関算出手段と、 前区間信号と新たに抽出された現区間信号との間で合致
しない現区間信号の後尾部に位置する信号に対して、所
定の調和関数との相関を算出する現区間後尾の相関算出
手段と、 前区間全体の相関値に対して、前記前区間先頭の相関算
出手段により算出した値を減算し、前記現区間後尾の相
関算出手段により算出した値を加算することにより現区
間全体の相関値を算出する相関合算手段と、 前記相関合算手段で得られた現区間全体の相関値を保持
するための前区間相関値の記憶手段と、 前記相関合算手段で得られた現区間全体の相関値に基づ
いて所定の変換を行い、各単位区間に対応するスペクト
ルデータを算出するスペクトル算出手段と、 を有することを特徴とする周波数解析装置。
1. A frequency analysis device for converting a given time-series signal into time-series spectrum data, wherein unit sections that are basic units for performing analysis overlap adjacent unit sections on the time series. Thus, the section signal extracting means for sequentially extracting the time-series signal of each unit section, and the previous section signal extracted immediately before by the section signal extracting means and the newly extracted current section signal are matched. The correlation calculation means at the beginning of the previous section for calculating the correlation with the predetermined harmonic function for the signal located at the beginning of the previous section signal, and the previous section signal and the newly extracted current section signal For the signal located at the tail of the current section signal that does not match, the correlation calculating means of the tail of the current section for calculating the correlation with a predetermined harmonic function, and the correlation value of the entire previous section, Correlation calculation means Correlation summing means for calculating the correlation value of the entire current section by adding the values calculated by the correlation calculation means at the end of the current section, and the entire current section obtained by the correlation summing means A storage unit for storing the correlation value of the previous section for holding the correlation value of, and a predetermined conversion is performed based on the correlation value of the entire current section obtained by the correlation summing unit, and spectrum data corresponding to each unit section is calculated. And a spectrum calculating means for performing the frequency analysis.
【請求項2】与えられた時系列信号を時系列のスペクト
ルデータに変換する周波数解析装置であって、 解析を行う基本単位である単位区間を、時系列上におい
て隣接する単位区間が互いに重複するように設定し、各
単位区間の時系列信号を順次抽出する区間信号抽出手段
と、 前記区間信号抽出手段により抽出された区間信号と所定
の基本調和関数との相関を算出する基本調和関数との相
関算出手段と、 前記区間信号と、所定の基本調和関数に周波数が隣接す
る他の調和関数との差分関数との相関を算出する差分調
和関数との相関算出手段と、 前記基本調和関数との相関算出手段で算出された相関値
に対して、前記差分調和関数との相関算出手段で得られ
た相関値に重みを掛けて加算し、前記重みを一定の間隔
で変化させることにより、1つの基本調和関数の周波数
に対して周波数が微小に変化した複数の相関値を算出す
る相関調整手段と、 前記相関調整手段により得られた相関値に基づいて、所
定の変換を行い、各単位区間に対応するスペクトルデー
タを算出するスペクトル算出手段と、 を有することを特徴とする周波数解析装置。
2. A frequency analysis device for converting a given time-series signal into time-series spectrum data, wherein unit sections which are basic units for performing analysis overlap adjacent unit sections on the time series. Set as such, the interval signal extraction means for sequentially extracting the time-series signal of each unit interval, and the basic harmonic function for calculating the correlation between the interval signal extracted by the interval signal extraction means and a predetermined basic harmonic function Correlation calculation means, the section signal, the correlation calculation means of the difference harmonic function to calculate the correlation with the difference function of the other harmonic function frequency adjacent to the predetermined basic harmonic function, of the basic harmonic function The correlation value calculated by the correlation calculation unit is multiplied by the correlation value obtained by the correlation calculation unit with the difference harmonic function and added, and the weight is changed at regular intervals to obtain one value. Correlation adjusting means for calculating a plurality of correlation values in which the frequency slightly changes with respect to the frequency of the fundamental harmonic function, and based on the correlation value obtained by the correlation adjusting means, a predetermined conversion is performed, and each unit interval And a spectrum calculation means for calculating spectrum data corresponding to the frequency analysis device.
【請求項3】前記基本調和関数との相関算出手段および
差分調和関数との相関算出手段の各々が、請求項1に記
載の前区間先頭の相関算出手段、現区間後尾の相関算出
手段、相関合算手段、前区間相関値の記憶手段により構
成されることを特徴とする請求項2に記載の周波数解析
装置。
3. The correlation calculating means with the basic harmonic function and the correlation calculating means with the differential harmonic function are respectively the correlation calculating means at the beginning of the preceding section, the correlation calculating means at the tail of the current section, and the correlation. The frequency analysis device according to claim 2, wherein the frequency analysis device is configured by a summing unit and a storage unit of the previous section correlation value.
【請求項4】前記調和関数、基本調和関数、差分調和関
数が正弦波関数および余弦波関数で構成され、前記各相
関算出手段が正弦波成分および余弦波成分からなる2次
元ベクトルで構成される相関値を出力し、前記相関合算
手段および相関調整手段が、前記各相関値に対するベク
トル加減算を行って2次元ベクトルで構成される相関値
を出力し、前記スペクトル算出手段が2次元ベクトルで
構成される相関値をスカラー値で構成されるスペクトル
データに変換する処理を行うことを特徴とする請求項1
または請求項2に記載の周波数解析装置。
4. The harmonic function, the fundamental harmonic function and the differential harmonic function are composed of a sine wave function and a cosine wave function, and each of the correlation calculating means is composed of a two-dimensional vector composed of a sine wave component and a cosine wave component. A correlation value is output, the correlation summing means and the correlation adjusting means perform vector addition and subtraction on each of the correlation values to output a correlation value composed of a two-dimensional vector, and the spectrum calculation means is composed of a two-dimensional vector. 2. A process of converting a correlation value according to the above into spectral data composed of a scalar value is performed.
Alternatively, the frequency analysis device according to claim 2.
【請求項5】前記スペクトル算出手段が、各調和関数に
対するスペクトルデータを相互相関テーブルとして備
え、算出されたスペクトルデータに対して、前記相互相
関テーブルに基づいて補正を行っていることを特徴とす
る請求項1または請求項2に記載の周波数解析装置。
5. The spectrum calculating means is provided with spectrum data for each harmonic function as a cross-correlation table, and the calculated spectrum data is corrected based on the cross-correlation table. The frequency analysis device according to claim 1 or 2.
【請求項6】与えられた音響信号を入力して時系列信号
を得るための音響信号入力手段と、 請求項1から請求項5のいずれかの構成からなる周波数
解析装置と、 得られた時系列のスペクトルデータに対して時系列に連
結を行い音素データを作成する音素連結手段と、 得られた音素データをMIDI形式符号に変換するMI
DI符号変換手段と、 を有することを特徴とする音響信号の符号化装置。
6. An acoustic signal input means for inputting a given acoustic signal to obtain a time-series signal, a frequency analysis device having the configuration according to any one of claims 1 to 5, and A phoneme linking unit that creates phoneme data by connecting the spectrum data of the series in time series, and an MI that converts the obtained phoneme data into a MIDI format code.
An audio signal encoding apparatus, comprising: DI code conversion means.
JP2002064309A 2002-03-08 2002-03-08 Frequency analyzer and acoustic signal encoding device Withdrawn JP2003263155A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002064309A JP2003263155A (en) 2002-03-08 2002-03-08 Frequency analyzer and acoustic signal encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002064309A JP2003263155A (en) 2002-03-08 2002-03-08 Frequency analyzer and acoustic signal encoding device

Publications (1)

Publication Number Publication Date
JP2003263155A true JP2003263155A (en) 2003-09-19

Family

ID=29197163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002064309A Withdrawn JP2003263155A (en) 2002-03-08 2002-03-08 Frequency analyzer and acoustic signal encoding device

Country Status (1)

Country Link
JP (1) JP2003263155A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653534B2 (en) 2004-06-14 2010-01-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for determining a type of chord underlying a test signal
JP2010044305A (en) * 2008-08-18 2010-02-25 Nippon Telegr & Teleph Corp <Ntt> Encoder, encoding method, encoding program, and recording medium
US8017855B2 (en) 2004-06-14 2011-09-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for converting an information signal to a spectral representation with variable resolution

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653534B2 (en) 2004-06-14 2010-01-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for determining a type of chord underlying a test signal
US8017855B2 (en) 2004-06-14 2011-09-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for converting an information signal to a spectral representation with variable resolution
JP2010044305A (en) * 2008-08-18 2010-02-25 Nippon Telegr & Teleph Corp <Ntt> Encoder, encoding method, encoding program, and recording medium

Similar Documents

Publication Publication Date Title
CN112382257B (en) Audio processing method, device, equipment and medium
JP3795201B2 (en) Acoustic signal encoding method and computer-readable recording medium
JP2003263155A (en) Frequency analyzer and acoustic signal encoding device
JP2000099009A (en) Acoustic signal coding method
JP4331289B2 (en) Method for encoding an acoustic signal
JP4695781B2 (en) Method for encoding an acoustic signal
JP4156252B2 (en) Method for encoding an acoustic signal
JP4156269B2 (en) Frequency analysis method for time series signal and encoding method for acoustic signal
JP2003216147A (en) Encoding method of acoustic signal
JP4662406B2 (en) Frequency analysis method and acoustic signal encoding method
JP3776782B2 (en) Method for encoding an acoustic signal
JP3935745B2 (en) Method for encoding acoustic signal
JP4220108B2 (en) Acoustic signal coding system
JP2001005450A (en) Method of encoding acoustic signal
JP4580548B2 (en) Frequency analysis method
JP2003216169A (en) Analyzing method of frequency and encoding method of acoustic signal
JPH071429B2 (en) Chord generator
JP4697919B2 (en) Method for encoding an acoustic signal
JP2002244691A (en) Encoding method for sound signal
JP2003122379A (en) Frequency analyzing method and encoding method for sound signal
JP2003084799A (en) Frequency analysis method and sound signal encoding method
JP4061070B2 (en) Frequency analysis method and acoustic signal encoding method
JP4662407B2 (en) Frequency analysis method
JP4156268B2 (en) Frequency analysis method for time series signal and encoding method for acoustic signal
JP2002215142A (en) Encoding method for acoustic signal

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050510