JP5392057B2 - Audio processing apparatus, audio processing method, and audio processing program - Google Patents

Audio processing apparatus, audio processing method, and audio processing program Download PDF

Info

Publication number
JP5392057B2
JP5392057B2 JP2009291156A JP2009291156A JP5392057B2 JP 5392057 B2 JP5392057 B2 JP 5392057B2 JP 2009291156 A JP2009291156 A JP 2009291156A JP 2009291156 A JP2009291156 A JP 2009291156A JP 5392057 B2 JP5392057 B2 JP 5392057B2
Authority
JP
Japan
Prior art keywords
signal
fundamental wave
digital audio
signals
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009291156A
Other languages
Japanese (ja)
Other versions
JP2011133568A (en
Inventor
定浩 安良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2009291156A priority Critical patent/JP5392057B2/en
Publication of JP2011133568A publication Critical patent/JP2011133568A/en
Application granted granted Critical
Publication of JP5392057B2 publication Critical patent/JP5392057B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理装置、音声処理方法および音声処理プログラムに関する。   The present invention relates to a voice processing apparatus, a voice processing method, and a voice processing program for analyzing a digital voice signal and processing the digital voice signal using the analysis result.

近年、音声符号化技術の進歩により、CD(Compact Disc)等に収録されている楽曲の音質を極力維持したままファイルサイズを小さくすることが可能となり、その結果として、メモリタイプのポータブルオーディオプレーヤに例えば大量の楽曲を収録して携帯することが可能となった。   In recent years, due to advances in audio coding technology, it has become possible to reduce the file size while maintaining the sound quality of music recorded on CDs (Compact Discs) as much as possible. For example, a large amount of music can be recorded and carried.

しかし、上述した音声符号化技術は、人間の聴覚特性を利用して通常聞き取れない高周波数領域の音声信号をカットしたり、マスキング効果により聞き取れない音のデータを間引いたりしているため、原音と比較すると、音の伸び、広がり、ダイナミックレンジ、艶っぽさに乏しくなる。そのため、音声符号化技術により圧縮されたデジタル音声信号の音質を改善する技術が開発されている。   However, the above-described speech coding technology cuts out high-frequency speech signals that are not normally heard using human auditory characteristics, or thins out sound data that cannot be heard due to the masking effect. In comparison, the sound will be less stretched, spread, dynamic range and glossy. Therefore, a technique for improving the sound quality of a digital audio signal compressed by an audio encoding technique has been developed.

例えば、デジタル音声信号の極大値と極小値とを特定し、極小値から極大値まで、または、極大値から極小値までのサンプル数を計数し、極大値および極小値を除くサンプル毎に、前のサンプルの値との差分を算出してこれにサンプル数に応じた係数を乗算し、この乗算結果を、極大値や極小値に近いサンプル位置に対して加減算する技術が開示されている(例えば、特許文献1)。   For example, the maximum and minimum values of a digital audio signal are identified, the number of samples from the minimum value to the maximum value, or from the maximum value to the minimum value is counted, and for each sample excluding the maximum value and the minimum value, A technique is disclosed in which a difference from a sample value is calculated, a coefficient corresponding to the number of samples is multiplied, and the multiplication result is added to or subtracted from a sample position close to a maximum value or a minimum value (for example, Patent Document 1).

また、同様に、極値間のサンプル数を計数し、極大値や極小値と各々1サンプル前の値との差分を算出してこれにサンプル数に応じた係数を乗算し、この乗算結果を、極大値や極小値に直接、または、極大値や極小値に近いサンプル位置に加減算する技術も知られている(例えば、特許文献2)。   Similarly, the number of samples between extreme values is counted, the difference between the maximum value or the minimum value and the value one sample before is calculated, and this is multiplied by a coefficient corresponding to the number of samples. There is also known a technique of adding or subtracting directly to or from a sample position close to a maximum value or minimum value (for example, Patent Document 2).

特許第3401171号公報Japanese Patent No. 3401171 特許第3659489号公報Japanese Patent No. 3659489

上述した特許文献1や2の技術では、極小値から極大値までの区間と極大値から極小値までの区間とが独立して制御され、それぞれの区間のサンプル数に応じて、乗算する係数や加減算対象となるサンプル位置が決定される。したがって、デジタル音声信号の不規則な変化に対しても半周期に相当する区間毎に適切な音質改善処理を行うことができる。   In the techniques of Patent Documents 1 and 2 described above, the interval from the minimum value to the maximum value and the interval from the maximum value to the minimum value are controlled independently, and the coefficient to be multiplied according to the number of samples in each interval, The sample position to be added / subtracted is determined. Therefore, appropriate sound quality improvement processing can be performed for each section corresponding to a half cycle even for irregular changes in the digital audio signal.

一方、デジタル音声信号に含まれる各信号の周波数とサンプリング周波数とが等しくなる保証はないので、デジタル音声信号が仮に規則的な正弦波であったとしても、その周波数がサンプリング周波数と異なれば、半周期毎のサンプル数、すなわち極小値から極大値までのサンプル数と極大値から極小値までのサンプル数とが異なる場合が生じ得る。   On the other hand, since there is no guarantee that the frequency of each signal included in the digital audio signal is equal to the sampling frequency, even if the digital audio signal is a regular sine wave, if the frequency is different from the sampling frequency, it is half There may occur a case where the number of samples per period, that is, the number of samples from the minimum value to the maximum value is different from the number of samples from the maximum value to the minimum value.

このように極値間のサンプル数が異なると、乗算する係数や加減算対象となるサンプル位置が変わり、半周期毎に音質の改善量が異なることとなるので、規則的な正弦波に対しても音質改善処理が偏る結果を招き、十分に音質改善効果が発揮されない場合があった。   Thus, if the number of samples between extreme values is different, the coefficient to be multiplied and the sample position to be added or subtracted will change, and the amount of improvement in sound quality will differ every half cycle, so even for regular sine waves In some cases, the sound quality improvement processing is biased, and the sound quality improvement effect is not sufficiently exhibited.

本発明は、このような課題に鑑み、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能な、音声処理装置、音声処理方法および音声処理プログラムを提供することを目的としている。   In view of such a problem, the present invention provides a sound processing apparatus capable of achieving uniform sound quality improvement by uniformly performing sound improvement processing on each signal included in a digital sound signal, An object is to provide a voice processing method and a voice processing program.

上記課題を解決するために、本発明の音声処理装置は、入力されたデジタル音声信号の周波数分析を行い、デジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離する信号分離部と、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号加算部と、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する残差信号加算部と、を備え、1または複数の基本波信号は、相異なる周波数の複数の基本波信号であり、信号分離部は、1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から1または複数の基本波信号を順次減算してデジタル音声信号を1または複数の基本波信号と残差信号とに分離することを特徴とする。 In order to solve the above-described problem, the audio processing apparatus of the present invention performs frequency analysis of an input digital audio signal, and removes one or more fundamental wave signals and one or more fundamental wave signals from the digital audio signal. A signal separation unit that separates the residual signal into a residual signal, and a correction signal addition unit that generates a correction signal whose amplitude is expanded for each of one or a plurality of fundamental wave signals and adds the correction signal to the fundamental signal. A residual signal adding unit that adds a residual signal to one or a plurality of fundamental signals to which correction signals are added, respectively , wherein the one or the plurality of fundamental signals are a plurality of fundamental signals having different frequencies. The signal separation unit obtains a difference signal when a plurality of fundamental wave signals having the same frequency as that of one or more fundamental wave signals are subtracted from the digital audio signal, respectively, and the difference signal is decremented in ascending order of energy of the difference signal. Characterized that you separate the digital audio signal into a one or more of the fundamental wave signal and the residual signal by sequentially subtracting one or more of the fundamental wave signal from the barrel audio signal.

音声処理装置は、デジタル音声信号を所定のフレーム単位で切り出し、その所定のフレームごとのデジタル音声信号を生成するフレーム化部と、入力されたフレーム単位のデジタル音声信号を、隣り合うフレームのデジタル音声信号の一部がオーバラップするように合成するオーバラップ合成部と、をさらに備え、信号分離部に入力されるデジタル音声信号はフレーム化部で生成された所定のフレームに区切られたデジタル音声信号であり、オーバラップ合成部に入力されるフレーム単位のデジタル音声信号は残差信号加算部から入力されてもよい。 The audio processing device cuts out a digital audio signal in a predetermined frame unit, generates a digital audio signal for each predetermined frame, and inputs the input digital audio signal in a frame unit into a digital audio of an adjacent frame. An overlap synthesis unit that synthesizes the signals so that part of the signals overlap, and the digital audio signal input to the signal separation unit is a digital audio signal divided into predetermined frames generated by the framing unit The digital audio signal in units of frames input to the overlap synthesis unit may be input from the residual signal addition unit.

上述した1または複数の基本波信号は、所定の周波数と、所定の周波数を有する正弦波および余弦波のそれぞれの振幅とで表される信号であってもよい。   The one or more fundamental wave signals described above may be signals represented by a predetermined frequency and the amplitudes of a sine wave and a cosine wave having the predetermined frequency.

補正信号加算部は、1または複数の基本波信号それぞれの周波数と正弦波の振幅と余弦波の振幅とに応じて補正信号を生成してもよい。具体的に、補正信号加算部は、基本波信号の周波数と、振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値とが予め対応付けられた補正テーブルを参照し、1または複数の基本波信号それぞれの周波数に応じて振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値を抽出し、1または複数の基本波信号それぞれの正弦波の振幅と余弦波の振幅とを乗じて補正信号を生成してもよい。   The correction signal adding unit may generate a correction signal according to the frequency of each of the one or more fundamental wave signals, the amplitude of the sine wave, and the amplitude of the cosine wave. Specifically, the correction signal adding unit refers to a correction table in which the frequency of the fundamental wave signal and the value of the correction signal at each sample position of the sine wave and cosine wave having an amplitude of 1 are associated in advance. Alternatively, the value of the correction signal at each sample position of the sine wave and cosine wave whose amplitude is 1 is extracted according to the frequency of each of the plurality of fundamental wave signals, and the amplitude and cosine of the sine wave of each of the one or more fundamental wave signals. The correction signal may be generated by multiplying the amplitude of the wave.

上記課題を解決するために、本発明の音声処理方法は、入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から1または複数の基本波信号を順次減算してデジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離し、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算し、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算することを特徴とする。 In order to solve the above-described problem, the audio processing method of the present invention performs frequency analysis of an input digital audio signal, and each of a plurality of fundamental wave signals having the same frequency as one or a plurality of fundamental wave signals having different frequencies. A difference signal when subtracted from the digital audio signal alone is obtained, and one or more fundamental wave signals are sequentially subtracted from the digital audio signal in order of increasing energy of the difference signal, so that the digital audio signal is converted into one or more fundamental wave signals. Separated into residual signals excluding one or a plurality of fundamental signals, a correction signal is generated for each of the one or more fundamental signals so that the absolute value of the amplitude is expanded and added to the fundamental signal The residual signal is added to one or a plurality of fundamental wave signals to which the correction signals are added.

上記課題を解決するために、本発明の音声処理プログラムは、コンピュータに、入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から1または複数の基本波信号を順次減算してデジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号生成ステップと、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する残差信号加算ステップと、を実行させることを特徴とする。
In order to solve the above problems, a sound processing program of the present invention performs frequency analysis of a digital sound signal input to a computer, and a plurality of fundamental waves having the same frequency as one or a plurality of fundamental wave signals having different frequencies. A difference signal is obtained when each signal is subtracted from the digital audio signal alone, and one or more fundamental wave signals are sequentially subtracted from the digital audio signal in order of increasing energy of the difference signal to thereby obtain one or more basic digital audio signals. A signal separation step for separating a wave signal and a residual signal from which one or more fundamental wave signals are removed, and a correction signal that increases the absolute value of the amplitude for each of the one or more fundamental wave signals And a correction signal generating step for adding to the fundamental signal, and a residual signal for adding the residual signal to one or a plurality of fundamental signals to which the correction signal has been added. Characterized in that to execute a signal adding step.

以上説明したように、本発明によれば、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。   As described above, according to the present invention, it is possible to achieve uniform sound quality improvement by uniformly performing sound improvement processing on each signal included in a digital sound signal.

音声処理装置の利用状態を説明するための説明図である。It is explanatory drawing for demonstrating the utilization condition of a speech processing unit. 音声処理装置の概略的な構成を説明するための機能ブロック図である。It is a functional block diagram for demonstrating the schematic structure of a speech processing unit. フレーム化部におけるフレーム信号の生成過程を説明するための説明図である。It is explanatory drawing for demonstrating the production | generation process of the frame signal in a framing part. 周波数分析候補となる所定数の周波数の一例を示した説明図である。It is explanatory drawing which showed an example of the predetermined number of frequency used as a frequency analysis candidate. 補正信号加算部のさらに具体的な構成を説明するための機能ブロック図である。It is a functional block diagram for demonstrating the more specific structure of a correction signal addition part. サンプル数と係数との関係を示した係数テーブルである。It is a coefficient table showing the relationship between the number of samples and coefficients. 補正信号加算部による音質改善処理の動作を説明するための説明図である。It is explanatory drawing for demonstrating operation | movement of the sound quality improvement process by the correction signal addition part. 補正信号加算部による音質改善処理の動作を説明するための説明図である。It is explanatory drawing for demonstrating operation | movement of the sound quality improvement process by the correction signal addition part. 補正信号加算部における音質改善処理を説明するための説明図である。It is explanatory drawing for demonstrating the sound quality improvement process in a correction signal addition part. オーバラップ合成部の動作を説明するための説明図である。It is explanatory drawing for demonstrating operation | movement of an overlap synthetic | combination part. コンピュータの典型例を示した機能ブロック図である。It is a functional block diagram showing a typical example of a computer. 音声分析合成方法の全体的な流れを示したフローチャートである。It is the flowchart which showed the whole flow of the speech analysis synthesis method.

以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書および図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。   Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The dimensions, materials, and other specific numerical values shown in the embodiments are merely examples for facilitating the understanding of the invention, and do not limit the present invention unless otherwise specified. In the present specification and drawings, elements having substantially the same function and configuration are denoted by the same reference numerals, and redundant description is omitted, and elements not directly related to the present invention are not illustrated. To do.

(音声処理装置100)
図1は、音声処理装置100の利用状態を説明するための説明図である。音声処理装置100は、放送局102から放送波を通じて、コンテンツサーバ104から通信網106を通じて、または、記憶媒体108から直接、デジタル音声信号を取得し、そのデジタル音声信号に高周波数成分を付加することで、デジタル音声信号の音質を改善する。ユーザは、改善されたデジタル音声信号を、音声処理装置100から直接、または、ポータブルオーディオプレーヤや携帯電話といった再生装置110に転送して聴くことができる。
(Speech processor 100)
FIG. 1 is an explanatory diagram for explaining a usage state of the speech processing apparatus 100. The audio processing apparatus 100 acquires a digital audio signal through broadcast waves from the broadcast station 102, through the communication network 106 from the content server 104, or directly from the storage medium 108, and adds a high frequency component to the digital audio signal. To improve the sound quality of digital audio signals. The user can listen to the improved digital audio signal directly from the audio processing device 100 or by transferring it to a playback device 110 such as a portable audio player or a mobile phone.

また、コンテンツサーバ104が、音声処理装置100を有しても良く、その場合、コンテンツサーバ104の音声処理装置100によって、高周波数成分が付加された音声信号はパーソナルコンピュータやポータブルオーディオプレーヤ、携帯電話といった再生装置110へ、通信網106を通じて、配信される。   Further, the content server 104 may include the audio processing device 100. In this case, the audio signal to which the high frequency component is added by the audio processing device 100 of the content server 104 is used as a personal computer, a portable audio player, or a mobile phone. To the playback device 110 through the communication network 106.

また、ポータブルオーディオプレーヤ、携帯電話といった再生装置110が音声処理装置100を有しても良い。その場合、コンテンツサーバ104から通信網106を通じて配信されるデジタル音声信号は、ポータブルオーディオプレーヤ、携帯電話といった再生装置110の音声処理装置100によって、高周波数成分が付加されて再生される。   Further, the playback device 110 such as a portable audio player or a mobile phone may include the sound processing device 100. In this case, a digital audio signal distributed from the content server 104 through the communication network 106 is reproduced with a high frequency component added by the audio processing device 100 of the reproduction device 110 such as a portable audio player or a mobile phone.

音声処理装置100が取得可能なデジタル音声信号としては、CDやDVD(Digital Versatile Disk)規格に基づいた音声信号の他、MPEG(Moving Picture Expert Group)−2、AAC(Advanced Audio Coding)、HE−AAC(High efficiency-AAC)、ATRAC(Adaptive TRansform Acoustic Coding)、MP3(MPEG Audio Layer-3)、WMA(Windows(登録商標) Media Audio)等の音声符号化処理によって周波数帯域が狭められた音声信号も含む。ここでは、入力されるデジタル音声信号の一例として、サンプリング周波数fs=44.1kHz、量子化ビット数16ビットのデジタル音声信号(CD規格)を挙げて音声処理装置100の各機能を説明する。   Digital audio signals that can be acquired by the audio processing apparatus 100 include audio signals based on CD and DVD (Digital Versatile Disk) standards, MPEG (Moving Picture Expert Group) -2, AAC (Advanced Audio Coding), and HE-. Audio signal whose frequency band is narrowed by audio encoding processing such as AAC (High Efficiency-AAC), ATRAC (Adaptive TRansform Acoustic Coding), MP3 (MPEG Audio Layer-3), WMA (Windows (registered trademark) Media Audio) Including. Here, as an example of the input digital audio signal, each function of the audio processing apparatus 100 will be described by taking a digital audio signal (CD standard) having a sampling frequency fs = 44.1 kHz and a quantization bit number of 16 bits.

図2は、音声処理装置100の概略的な構成を説明するための機能ブロック図である。音声処理装置100は、フレーム化部120と、信号分離部122と、補正信号加算部124と、残差信号加算部126と、オーバラップ合成部128とを含んで構成される。   FIG. 2 is a functional block diagram for explaining a schematic configuration of the sound processing apparatus 100. The speech processing apparatus 100 includes a framing unit 120, a signal separation unit 122, a correction signal addition unit 124, a residual signal addition unit 126, and an overlap synthesis unit 128.

フレーム化部120は、音声処理装置100が取得したデジタル音声信号を、処理単位である所定のフレーム単位(所定サンプル数長)で順次切り出し、フレーム単位のデジタル音声信号(以下、単にフレーム信号という)を生成する。   The framing unit 120 sequentially cuts out the digital audio signal acquired by the audio processing apparatus 100 in a predetermined frame unit (predetermined number of samples) as a processing unit, and a digital audio signal in frame units (hereinafter simply referred to as a frame signal). Is generated.

図3は、フレーム化部120におけるフレーム信号の生成過程を説明するための説明図である。図3に示したように、連続する1のデジタル音声信号が入力された場合、フレーム化部120は、まず、入力されたデジタル音声信号から所定の長さで区切られる一部のデジタル音声信号Aのみを切り出してフレーム信号0を生成する。このとき、デジタル音声信号Aの前段にはデジタル音声信号が存在しないので、デジタル音声信号Aを含む所定サンプル数長のフレーム信号0は、図3のようにヌル値とデジタル音声信号Aとから形成される。また、フレーム化部120は、次のフレーム信号のため、デジタル音声信号Aの所定の位置から後尾までの所定長のデータである後部信号A’をバッファ(図示せず)に一時的に保持する。   FIG. 3 is an explanatory diagram for explaining a frame signal generation process in the framing unit 120. As shown in FIG. 3, when one continuous digital audio signal is input, the framing unit 120 firstly selects a part of the digital audio signal A that is delimited by a predetermined length from the input digital audio signal. Only the frame signal 0 is cut out to generate the frame signal 0. At this time, since there is no digital audio signal before the digital audio signal A, the frame signal 0 having a predetermined number of samples including the digital audio signal A is formed from a null value and the digital audio signal A as shown in FIG. Is done. The framing unit 120 temporarily stores a rear signal A ′, which is data of a predetermined length from a predetermined position to the tail of the digital audio signal A, in a buffer (not shown) for the next frame signal. .

続いて、フレーム化部120は、引き続き入力されるデジタル音声信号に応じて、デジタル音声信号Bを切り出し、保持していたデジタル音声信号Aの後部信号A’とデジタル音声信号Bとをその順に接続し、所定サンプル数長のフレーム信号1を生成する。以後、フレーム化部120は、デジタル音声信号Bの後部信号B’と次に切り出したデジタル音声信号Cとでフレーム信号2を生成するといった具合にフレーム信号の生成を繰り返す。   Subsequently, the framing unit 120 cuts out the digital audio signal B in accordance with the digital audio signal that is continuously input, and connects the rear signal A ′ and the digital audio signal B that have been held in that order. Then, a frame signal 1 having a predetermined sample length is generated. Thereafter, the framing unit 120 repeats the generation of the frame signal such that the frame signal 2 is generated from the rear signal B ′ of the digital audio signal B and the digital audio signal C cut out next.

したがって、フレーム化部120によって生成されたフレーム信号は、前後のフレーム信号と一部がオーバラップすることとなる。例えば、フレーム信号0とフレーム信号1とは後部信号A’に相当するデータがオーバラップする。以後の信号分離部122、補正信号加算部124、残差信号加算部126、オーバラップ合成部128では、かかるフレーム信号(フレーム単位のデジタル音声信号)に対して処理が遂行される。また、ここでは、オーバラップされる後部信号A’、B’、…の長さを、所定サンプル数長のフレーム信号に対して1/3の長さとして図示しているが、かかる場合に限らず、1/2以下の任意の数値とすることができる。   Therefore, the frame signal generated by the framing unit 120 partially overlaps with the preceding and following frame signals. For example, the data corresponding to the rear signal A ′ overlaps between the frame signal 0 and the frame signal 1. In the subsequent signal separation unit 122, correction signal addition unit 124, residual signal addition unit 126, and overlap synthesis unit 128, processing is performed on the frame signal (digital audio signal in frame units). In addition, here, the length of the overlapped rear signals A ′, B ′,... Is illustrated as 1/3 of the length of a frame signal having a predetermined number of samples. However, it can be an arbitrary numerical value of 1/2 or less.

本実施形態においては、このように生成された各フレーム信号を、後述するオーバラップ合成部128においてオーバラップさせつつ再度合成する。かかるオーバラップ部分によってデジタル音声信号の連続性を確保することが可能となり、当該実施形態に基づいて新たに生成される高周波数成分を形成する補正信号の連続性も確保される。こうして、フレーム信号を切り出すことによる端部(エッジ)の影響を回避することができ、安定した音質改善効果を得ることが可能となる。   In the present embodiment, the frame signals generated in this way are combined again while being overlapped by an overlap combining unit 128 described later. Such an overlap portion makes it possible to ensure the continuity of the digital audio signal, and also ensure the continuity of the correction signal that forms a high frequency component newly generated based on the embodiment. In this way, it is possible to avoid the influence of edges (edges) caused by cutting out the frame signal, and to obtain a stable sound quality improvement effect.

そして、フレーム化部120は、生成したフレーム信号を順次、信号分離部122に送信する。   Then, the framing unit 120 sequentially transmits the generated frame signal to the signal separation unit 122.

信号分離部122は、フレーム化部120から受信した所定のフレームに区切られたフレーム信号の周波数分析を行い、フレーム信号を1または複数の基本波信号と、1または複数の基本波信号を除いた残差信号とに分離する。本実施形態において、信号分離部122は、一般調和解析(GHA:Generalized Harmonic Analysis)を用いて基本波信号と残差信号とを分離する。   The signal separation unit 122 performs frequency analysis of the frame signal divided into predetermined frames received from the framing unit 120, and removes the frame signal from one or more fundamental wave signals and one or more fundamental wave signals. Separated into residual signals. In the present embodiment, the signal separation unit 122 separates the fundamental signal and the residual signal using Generalized Harmonic Analysis (GHA).

かかる一般調和解析は、周波数分析法として広く用いられている高速フーリエ変換(FFT:Fast Fourier Transform)と比較して、演算負荷は重くなるものの、(1)高速フーリエ変換よりも周波数分析精度が高い、(2)雑音を抑圧することができる、(3)分析対象となるフレーム信号以外の波形を予測することができるといった点で有利である。   Such general harmonic analysis has a higher computational load compared to Fast Fourier Transform (FFT), which is widely used as a frequency analysis method, but (1) has higher frequency analysis accuracy than Fast Fourier Transform. (2) It is advantageous in that noise can be suppressed and (3) a waveform other than the frame signal to be analyzed can be predicted.

また、高速フーリエ変換を用いてフレーム信号の周波数分析を実行すると、そのフレーム信号は、フレーム単位の周期関数として扱われるので、端部において不連続な周波数成分が生じ、原信号となるデジタル音声信号に含まれていない新たな周波数成分を検出してしまう。さらに、フレーム信号の端部の連続性を確保すべく窓関数を施すと、高速フーリエ変換の周波数分析結果が常に窓関数の影響を受けてしまう。   When the frequency analysis of the frame signal is performed using the fast Fourier transform, the frame signal is handled as a periodic function in units of frames, so that a discontinuous frequency component is generated at the end, and the digital audio signal that becomes the original signal A new frequency component not included in is detected. Furthermore, if a window function is applied to ensure the continuity of the end of the frame signal, the frequency analysis result of the fast Fourier transform is always affected by the window function.

一方、本実施形態の一般調和解析では、フレーム信号から、残差エネルギーが最小となる適切な正弦波や余弦波の組合せを導出しているので、時間分解能に依存しない高い周波数分解能で周波数分析を遂行することができる。このように信号分離部122は、一般調和解析を用いて基本波信号と残差信号とを分離することが最も望ましいが、これに限定されるわけではなく、種々の周波数分析法を用いることができる。   On the other hand, in the general harmonic analysis of this embodiment, since an appropriate combination of sine wave and cosine wave that minimizes residual energy is derived from the frame signal, frequency analysis is performed with high frequency resolution that does not depend on time resolution. Can be carried out. As described above, it is most desirable that the signal separation unit 122 separates the fundamental wave signal and the residual signal using general harmonic analysis, but the present invention is not limited to this, and various frequency analysis methods may be used. it can.

信号分離部122は、このような一般調和解析に従い、まず、サンプリング周波数fsに基づいて周波数分析候補となる所定数の相異なる周波数f(kは整数)を決定する。そして、決定された所定数の周波数fの基本波信号b[i](iは0〜L−1の整数、Lはフレーム信号のサンプル数)を、それぞれ単独でフレーム信号から減算して差分信号e[i]を求め、さらにその二乗和により差分信号のエネルギーEを導出する。 In accordance with such general harmonic analysis, the signal separation unit 122 first determines a predetermined number of different frequencies f k (k is an integer) as frequency analysis candidates based on the sampling frequency fs. Then, the fundamental wave signal b k [i] (i is 0 to L-1 integer, L is the number of samples of the frame signal) of the determined predetermined number of frequency f k and singly by subtracting from the frame signal The difference signal e k [i] is obtained, and the energy E k of the difference signal is derived from the sum of squares thereof.

なお、信号分離部122は、図示しないデコーダがデジタル音声信号をデコードするときに抽出したデジタル音声信号のサンプリング周波数の情報を取得して、そのサンプリング周波数に応じて周波数分析候補となる所定数の相異なる周波数f(kは整数)を決定するようにしてもよい。ただし、CDプレーヤのように入力されるデジタル音声信号のサンプリング周波数が常に一定である再生装置に、本実施形態に係わる音声処理装置100を用いる場合、信号分離部122は、必ずしもサンプリング周波数の情報を取得する必要はない。 The signal separation unit 122 acquires information on the sampling frequency of the digital audio signal extracted when a decoder (not shown) decodes the digital audio signal, and a predetermined number of phases that are frequency analysis candidates according to the sampling frequency. Different frequencies f k (k is an integer) may be determined. However, when the audio processing apparatus 100 according to the present embodiment is used in a playback apparatus in which the sampling frequency of the input digital audio signal is always constant, such as a CD player, the signal separation unit 122 does not necessarily have the sampling frequency information. There is no need to acquire.

図4は、周波数分析候補となる所定数の周波数の一例を示した説明図である。ここでは所定数の周波数として、その周波数の波形における極値の前後の半周期でサンプル数が同一となる周波数が選択される。本実施形態においてサンプリング周波数fsは44.1kHzであるから、極値の前後の半周期でサンプル数が同一となる周波数fは、サンプリング周波数fsの1/2の周波数をさらに半周期のサンプル数FS(FSは整数)で分周した値fs/2/FSとなる。 FIG. 4 is an explanatory diagram showing an example of a predetermined number of frequencies that are frequency analysis candidates. Here, as the predetermined number of frequencies, a frequency having the same number of samples in a half cycle before and after the extreme value in the waveform of the frequency is selected. In this embodiment, since the sampling frequency fs is 44.1 kHz, the frequency f k in which the number of samples is the same in the half cycle before and after the extreme value is equal to half the sampling frequency fs and the number of samples in the half cycle. A value fs / 2 / FS divided by FS (FS is an integer) is obtained.

ただし、FS=1の周波数f(22.05kHz)の周波数成分は、サンプリング定理に従って処理対象となるフレーム信号x[i](iは0〜L−1の整数)に含まれないので、周波数fは、図4に示すように、サンプル数FS=2、3、4、…となる周波数に限られる。本実施形態では、サンプル数FS=2、3、4、…、10の相異なる9つの周波数f〜f10を周波数分析候補とする。周波数fを極値の前後の半周期でサンプル数が同一となる周波数とした理由は後ほど述べる。 However, since the frequency component of the frequency f 1 (22.05 kHz) of FS = 1 is not included in the frame signal x 0 [i] (i is an integer of 0 to L−1) to be processed according to the sampling theorem, As shown in FIG. 4, the frequency f k is limited to the frequency at which the number of samples FS = 2, 3, 4,. In this embodiment, nine different frequencies f 2 to f 10 with the number of samples FS = 2, 3, 4,. The reason why the frequency fk is set to the frequency at which the number of samples is the same in the half cycle before and after the extreme value will be described later.

また、周波数fの基本波信号b[i]は、数式1で表すことができる。ただし、iは0〜L−1、kは2、3、4、…、10である。

Figure 0005392057
…(数式1) Further, the fundamental wave signal b k [i] having the frequency f k can be expressed by Equation 1. However, i is 0 to L-1, and k is 2, 3, 4,.
Figure 0005392057
... (Formula 1)

信号分離部122は、図4に示した周波数をFSの小さい順に選択し、処理対象となるフレーム信号x[i]に対する基本波信号b[i]の正弦波の振幅S(f)を数式2を用いて導出し、余弦波の振幅C(f)を数式3を用いて導出する。ただし、kは2、3、4、…、10である。

Figure 0005392057
…(数式2)
Figure 0005392057
…(数式3) The signal separation unit 122 selects the frequencies shown in FIG. 4 in ascending order of FS, and the amplitude S (f k ) of the sine wave of the fundamental wave signal b k [i] with respect to the frame signal x 0 [i] to be processed. Is derived using Equation 2, and the amplitude C (f k ) of the cosine wave is derived using Equation 3. However, k is 2, 3, 4,...
Figure 0005392057
... (Formula 2)
Figure 0005392057
... (Formula 3)

このようにして導出された振幅S(f)と振幅C(f)とを数式1に代入して基本波信号b[i]を求め、処理対象となるフレーム信号x[i]から、その基本波信号b[i]を、数式4のようにそれぞれ個別に減算して差分信号e[i]を求める。

Figure 0005392057
…(数式4) The fundamental wave signal b k [i] is obtained by substituting the amplitude S (f k ) and the amplitude C (f k ) derived in this way into Equation 1, and the frame signal x 0 [i] to be processed is obtained. Thus, the fundamental signal b k [i] is subtracted individually as shown in Equation 4 to obtain a differential signal e k [i].
Figure 0005392057
... (Formula 4)

そして、差分信号e[i]のエネルギーEを、数式5のように二乗和により導出し、その周波数fに関連付けて一時的に保持する。

Figure 0005392057
…(数式5) Then, the energy E k of the difference signal e k [i] is derived by the sum of squares as shown in Equation 5, and temporarily stored in association with the frequency f k .
Figure 0005392057
... (Formula 5)

ここでは、導出された所定数の差分信号e[i]のエネルギーEが小さいほど、その周波数fの基本波信号b[i]が、処理対象となるフレーム信号x[i]に含まれる占有率(度合い)が高いことを表す。信号分離部122は、このような差分信号e[i]のエネルギーEを図4に示すfs/2/FS(FS=2、3、4、…10)の9つの周波数fすべてに関して計算する。 Here, as the energy E k of the predetermined number of derived difference signals e k [i] is smaller, the fundamental signal b k [i] of the frequency f k is the frame signal x 0 [i] to be processed. It represents that the occupation rate (degree) included in is high. The signal separation unit 122 uses the energy E k of the differential signal e k [i] for all nine frequencies f k of fs / 2 / FS (FS = 2, 3, 4,... 10) shown in FIG. calculate.

このような差分信号e[i]のエネルギーEを個々に求めたのは、1または複数の基本波信号b[i]すべてを除いた最終的な残差信号を最小にするためには、一般調和解析の下、フレーム信号x[i]から占有率が高い基本波信号b[i]を優先して分離する必要があるからである。したがって、信号分離部122は、差分エネルギーEが小さい順、すなわち基本波信号b[i]における占有率が高い順に9つの周波数fを並び替える。 The reason why the energy E k of the differential signal e k [i] is individually determined is to minimize the final residual signal except for all of the one or more fundamental wave signals b k [i]. This is because, under general harmonic analysis, it is necessary to preferentially separate the fundamental wave signal b k [i] having a high occupation rate from the frame signal x 0 [i]. Therefore, the signal separation unit 122 rearranges the nine frequencies f k in ascending order of the differential energy E k , that is, in descending order of the occupation ratio in the fundamental wave signal b k [i].

続いて、信号分離部122は、その9つの周波数fに対応する9つの基本波信号b[i]を、並び替えられた周波数fの順に、原信号であるフレーム信号x[i]から順次減算する。ただし、上述した差分信号e[i]を導出する工程では、毎回、原信号であるフレーム信号x[i]から改めて基本波信号b[i]を減算したのに対し、ここでは、フレーム信号x[i]から1の基本波信号b[i]を減算すると、その減算した後の残差信号d[i]に対して、次の基本波信号b[i]の振幅S(f)および振幅C(f)を数式2、3を用いて改めて導出し、その基本波信号b[i]を減算していく。したがって、減算する順番によっては基本波信号b[i]の振幅S(f)および振幅C(f)が変化する。並び替えに用いた基本波信号b[i]と当該フレーム信号x[i]から順次減算する基本波信号b[i]とは所定の周波数fを有する正弦波と余弦波で表されることで共通し、その正弦波と余弦波の振幅のみが異なる。並び替えに用いた基本波信号b[i]は並び替えが完了すると用いられることはなくなり、振幅S(f)および振幅C(f)が変化した基本波信号b[i]が最終的な基本波信号b[i]として以後の処理でも用いられる。このような基本波信号b[i]の減算を経て残差信号d[i]が導出される。したがって、残差信号d[i]は、数式6のように表すことができる。ただし、iは0〜L−1、kは2、3、4、…、10である。

Figure 0005392057
…(数式6) Then, the signal separation unit 122, the nine corresponding to the frequency f k nine fundamental signal b k [i], the order of the frequency f k rearranged, a original signal frame signal x 0 [i ] In turn. However, in the above-described step of deriving the differential signal e k [i], the fundamental signal b k [i] is subtracted from the frame signal x 0 [i], which is the original signal, every time. When one fundamental wave signal b k [i] is subtracted from the frame signal x 0 [i], the amplitude of the next fundamental wave signal b k [i] with respect to the residual signal d [i] after the subtraction. S (f k ) and amplitude C (f k ) are derived again using Equations 2 and 3, and the fundamental wave signal b k [i] is subtracted. Therefore, depending on the order of subtraction, the amplitude S (f k ) and amplitude C (f k ) of the fundamental wave signal b k [i] change. Table sine wave and cosine wave having a predetermined frequency f k is the fundamental wave signal b k [i] are sequentially subtracted from the frame signal x 0 [i] the fundamental wave signal b k [i] used in the rearrangement In common, only the amplitudes of the sine wave and cosine wave are different. Fundamental signal b k used for the rearrangement [i] will not be used and rearrangement is complete, the amplitude S (f k) and the amplitude C (f k) has changed the fundamental wave signal b k [i] is The final fundamental wave signal b k [i] is also used in the subsequent processing. The residual signal d [i] is derived through the subtraction of the fundamental wave signal b k [i]. Therefore, the residual signal d [i] can be expressed as Equation 6. However, i is 0 to L-1, and k is 2, 3, 4,.
Figure 0005392057
... (Formula 6)

こうしてフレーム信号x[i]から占有率が高い基本波信号b[i]が順次分離され、残差信号d[i]のエネルギーは漸減する。 In this way, the fundamental signal b k [i] having a high occupation rate is sequentially separated from the frame signal x 0 [i], and the energy of the residual signal d [i] is gradually reduced.

このように、フレーム信号x[i]における占有率が高い基本波信号b[i]から優先して分離する構成により、フレーム信号x[i]を1または複数の基本波信号b[i]の組合せで適切に表すことができ、かつ、残差信号d[i]を最小限に抑えることが可能となる。 Thus, the frame signal x 0 by the configuration which separates preferentially from the fundamental wave signal is high occupancy b k [i] in the [i], a frame signal x 0 [i] one or more of the fundamental wave signal b k The combination of [i] can be appropriately expressed, and the residual signal d [i] can be minimized.

ここで、周波数分析候補となる所定数(ここでは9つ)の周波数fは、サンプリング周波数fs(例えば44.1kHz)に対して図4の如く一義的に求まるので、サンプリング周波数fsに応じて、所定数の周波数fと基本波信号b[i]とを一意に対応付けた基本波テーブルを予め作成しておくこともできる。ただし、基本波テーブルでは、振幅S(f)や振幅C(f)を所定値(例えば1)とした場合の各サンプルiにおける正弦波および余弦波の値までが示されるに留まり、信号分離部122は、振幅S(f)や振幅C(f)を乗じて基本波信号b[i]を導出することとなる。かかる基本波テーブルによって、演算負荷の軽減を図ることが可能となる。かかる基本波テーブルは図示しないメモリに保持されてもよく、通信網106から取得するとしてもよい。 Here, since a predetermined number (here, 9) of frequencies fk as frequency analysis candidates are uniquely obtained as shown in FIG. 4 with respect to the sampling frequency fs (for example, 44.1 kHz), the frequency fk is determined according to the sampling frequency fs. A fundamental wave table in which a predetermined number of frequencies f k and fundamental wave signals b k [i] are uniquely associated can be created in advance. However, the fundamental wave table only shows the values of the sine wave and cosine wave in each sample i when the amplitude S (f k ) and the amplitude C (f k ) are set to predetermined values (for example, 1). The separating unit 122 multiplies the amplitude S (f k ) and the amplitude C (f k ) to derive the fundamental wave signal b k [i]. Such a fundamental wave table can reduce the calculation load. Such a fundamental wave table may be held in a memory (not shown) or may be acquired from the communication network 106.

信号分離部122は、引き続き並び替えられた順に基本波信号b[i]を減算していき、周波数分析候補として準備されたすべての周波数fに関する基本波信号b[i]を減算し終わると、その残差信号d[i]を最終的な残差信号として残差信号加算部126に送信する。 Signal separator 122, gradually subtracting the fundamental wave signal b k [i] to continue the sorted order, by subtracting the fundamental wave signal b k [i] for all frequencies f k, which is prepared as a frequency analysis candidates When finished, the residual signal d [i] is transmitted to the residual signal adding unit 126 as a final residual signal.

ここで、周波数分析候補として準備されたすべての周波数fに関する基本波信号b[i]を減算していなくとも、その残差信号d[i]のエネルギーが十分に小さくなっていれば、例えば、残差信号d[i]が所定のエネルギー以下となれば、フレーム信号x[i]を十分に分離できたとして、その時点で基本波信号b[i]の分離を停止し、残差信号d[i]を残差信号加算部126に送信する。 Here, even if the fundamental signal b k [i] for all the frequencies f k prepared as frequency analysis candidates is not subtracted, if the energy of the residual signal d [i] is sufficiently small, For example, if the residual signal d [i] is equal to or lower than a predetermined energy, the separation of the fundamental signal b k [i] is stopped at that time, assuming that the frame signal x 0 [i] can be sufficiently separated. Residual signal d [i] is transmitted to residual signal adding section 126.

このとき、基本波信号b[i]は、それぞれ、所定の周波数と、所定の周波数を有する正弦波の振幅と、余弦波の振幅とで表される信号なので、信号分離部122は、基本波信号b[i]そのものではなく、基本波信号b[i]の周波数を示す周波数情報と、正弦波成分の振幅情報と、余弦波成分の振幅情報といったパラメータと、基本波信号b[i]の個数情報とを補正信号加算部124に送信する。かかる構成により、信号分離部122と補正信号加算部124とのアクセス負荷を著しく軽減することができる。 At this time, the fundamental wave signal b k [i] is a signal represented by a predetermined frequency, an amplitude of a sine wave having a predetermined frequency, and an amplitude of a cosine wave. Not the wave signal b k [i] itself, but parameters such as frequency information indicating the frequency of the fundamental wave signal b k [i], amplitude information of the sine wave component, amplitude information of the cosine wave component, and the fundamental wave signal b k. The number information of [i] is transmitted to the correction signal adding unit 124. With this configuration, the access load between the signal separation unit 122 and the correction signal addition unit 124 can be significantly reduced.

また、信号分離部122は、数式6に示すように、フレーム信号x[i]から対象となる基本波信号b[i]をすべて除いた残差信号d[i]を残差信号加算部126に送信する。 Further, as shown in Expression 6, the signal separation unit 122 adds a residual signal d [i] obtained by removing all the target fundamental wave signals b k [i] from the frame signal x 0 [i]. To the unit 126.

本実施形態においては、後述するように基本波信号b[i]のみに音質改善処理が施され、残差信号d[i]には施されない。しかし、残差信号d[i]はエネルギー量としても無視可能な信号なので、残差信号d[i]に音質改善処理を施さなくとも、原信号であるフレーム信号x[i]の音質改善レベルに影響はなく、むしろ残差信号d[i]に音質改善処理を施す処理負荷を他の処理に有効活用できる。 In the present embodiment, as will be described later, only the fundamental wave signal b k [i] is subjected to the sound quality improvement process, and is not applied to the residual signal d [i]. However, since the residual signal d [i] is a signal that can be ignored as the amount of energy, the sound quality of the frame signal x 0 [i] that is the original signal is improved without performing the sound quality improvement process on the residual signal d [i]. There is no effect on the level, but rather the processing load for applying the sound quality improvement processing to the residual signal d [i] can be effectively utilized for other processing.

また、図4で示したように、基本波信号b[i]の周波数fを、極値の前後の半周期でサンプル数が同一となる周波数f=fs/2/FSとすることで、残差信号d[i]を除いたフレーム信号x[i](1または複数の基本波信号b[i])を極値の前後の半周期でサンプル数が同一となる正弦波および余弦波で表すことができ、同一の正弦波や余弦波において、乗算する係数や加減算対象となるサンプル位置が異なるといった問題がなくなる。さらに、基本波信号b[i]は、初期位相0の正弦波および余弦波のみで形成されるため、フレーム信号x[i]に対して補正信号を画一的に付加することができるので、音質改善の均一化を図ることが可能となる。 Further, as shown in FIG. 4, the frequency f k of the fundamental wave signal b k [i] is set to a frequency f k = fs / 2 / FS at which the number of samples is the same in a half cycle before and after the extreme value. Thus, the sine wave having the same number of samples in the half period before and after the extreme value of the frame signal x 0 [i] (one or more fundamental wave signals b k [i]) excluding the residual signal d [i]. In the same sine wave or cosine wave, there is no problem that the coefficient to be multiplied or the sample position to be added or subtracted is different. Furthermore, since the fundamental wave signal b k [i] is formed only by a sine wave and a cosine wave having an initial phase 0, a correction signal can be uniformly added to the frame signal x 0 [i]. Therefore, it is possible to achieve uniform sound quality improvement.

補正信号加算部124は、信号分離部122が分離した1または複数の基本波信号それぞれに対し、音圧0を中心とした振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する。   The correction signal adding unit 124 generates a correction signal for each of one or a plurality of fundamental wave signals separated by the signal separation unit 122 so that the absolute value of the amplitude centered on the sound pressure 0 is expanded to generate a fundamental wave. Add to signal.

図5は、補正信号加算部124のさらに具体的な構成を説明するための機能ブロック図であり、図6は、サンプル数と係数との関係を示した係数テーブルであり、図7および図8は、補正信号加算部124による音質改善処理の動作を説明するための説明図である。補正信号加算部124は、極値特定部150と、サンプル数計数部152と、補正信号生成部154と、遅延部156と、加算部158とを含んで構成される。また、係数テーブルは図示しないメモリに保持されてもよく、通信網106から取得するとしてもよい。ここで、まず、補正信号加算部124で実行される音質改善処理の基本的動作を説明する。   FIG. 5 is a functional block diagram for explaining a more specific configuration of the correction signal adding unit 124. FIG. 6 is a coefficient table showing the relationship between the number of samples and the coefficients. These are explanatory drawings for explaining the operation of the sound quality improvement processing by the correction signal adding unit 124. The correction signal adding unit 124 includes an extreme value specifying unit 150, a sample number counting unit 152, a correction signal generating unit 154, a delay unit 156, and an adding unit 158. The coefficient table may be held in a memory (not shown) or may be acquired from the communication network 106. First, the basic operation of the sound quality improvement process executed by the correction signal adding unit 124 will be described.

極値特定部150は、補正信号加算部124が受信したフレーム信号x[i](1または複数の基本波信号b[i])の極大値と極小値とを特定する。具体的に、極値特定部150は、フレーム信号x[i]の各サンプルにおける値を順次比較し、値が増加している状態または増減無しの状態から減少に転じたとき、その減少に転じる直前のサンプルにおける値を極大値とし、値が減少している状態または増減無しの状態から増加に転じたとき、その増加に転じる直前のサンプルにおける値を極小値とする。 The extreme value specifying unit 150 specifies the maximum value and the minimum value of the frame signal x 0 [i] (one or a plurality of fundamental wave signals b k [i]) received by the correction signal adding unit 124. Specifically, the extreme value specifying unit 150 sequentially compares the values in the respective samples of the frame signal x 0 [i], and when the value changes from a state where the value is increasing or a state where there is no increase / decrease, the extreme value specifying unit 150 The value in the sample immediately before turning is set to the maximum value, and when the value is decreasing or the state in which there is no increase / decrease is changed to the increase, the value in the sample immediately before starting the increase is set to the minimum value.

サンプル数計数部152は、任意の極値(極大値または極小値)から次の極値までのサンプル数、すなわち、極大値から極小値まで、または極小値から極大値までのサンプル数を計数する。   The sample number counting unit 152 counts the number of samples from an arbitrary extreme value (maximum value or minimum value) to the next extreme value, that is, the number of samples from the maximum value to the minimum value, or from the minimum value to the maximum value. .

補正信号生成部154は、フレーム信号x[i]における所定のサンプル間の変化量と1の係数とを乗じてデジタル音声信号の振幅の絶対値が拡大されるような補正値を生成し、所定のサンプル位置に配して補正信号を生成する。 The correction signal generation unit 154 generates a correction value such that the absolute value of the amplitude of the digital audio signal is expanded by multiplying the change amount between predetermined samples in the frame signal x 0 [i] and a coefficient of 1, A correction signal is generated at a predetermined sample position.

例えば、図7の例では、補正信号生成部154は、図6の係数テーブルを参照し、図7(a)に示すフレーム信号x[i]に基づきサンプル数計数部152が計数した極大値から極小値まで、または極小値から極大値までの極値間のサンプル数、例えば「4」に対応した、係数「0.5」を抽出する。 For example, in the example of FIG. 7, the correction signal generation unit 154 refers to the coefficient table of FIG. 6, and the local maximum value counted by the sample number counting unit 152 based on the frame signal x 0 [i] illustrated in FIG. The coefficient “0.5” corresponding to the number of samples between the extreme values from the minimum value to the minimum value or between the minimum value and the maximum value, for example, “4” is extracted.

ここで、図6の係数テーブルにおいて、サンプル数が多いほど係数の値が小さいのは以下の理由からである。すなわち、任意の極値から次の極値までのサンプル数が多い場合、そのフレーム信号x[i]の周波数は低く、例えば22.1kHzの低域通過フィルタ(LPF:Low Pass Filter)でフィルタリングが施されている場合であっても、その低周波数のフレーム信号x[i]の高調波は抑制されずに残る。したがって、大きな高周波数成分を付加しなくとも十分に高音質を維持できるので、係数は小さくて済む。 Here, in the coefficient table of FIG. 6, the larger the number of samples, the smaller the coefficient value is for the following reason. That is, when the number of samples from an arbitrary extreme value to the next extreme value is large, the frequency of the frame signal x 0 [i] is low, for example, filtering with a 22.1 kHz low pass filter (LPF). Is applied, harmonics of the low-frequency frame signal x 0 [i] remain without being suppressed. Therefore, a sufficiently high sound quality can be maintained without adding a large high-frequency component, and the coefficient can be small.

一方、任意の極値から次の極値までのサンプル数が少ない場合、そのフレーム信号x[i]の周波数は高く、例えば22.1kHzの低域通過フィルタでフィルタリングが施されている場合に、その高周波数のフレーム信号x[i]の高調波はほとんど削減されている。したがって、高周波数成分を十分に付加しないと音質の改善を図ることができないので、係数は大きい必要がある。 On the other hand, when the number of samples from an arbitrary extreme value to the next extreme value is small, the frequency of the frame signal x 0 [i] is high, for example, when filtering is performed by a low-pass filter of 22.1 kHz. The harmonics of the high-frequency frame signal x 0 [i] are almost reduced. Therefore, the sound quality cannot be improved unless sufficient high-frequency components are added, so the coefficient needs to be large.

続いて、補正信号生成部154は、図7(a)に示すフレーム信号x[i]の極大値と1サンプリング前のサンプル値との差分値dlに、係数テーブルから抽出した0.5を乗算した乗算結果Δdlを極大値のサンプル位置に配し、フレーム信号の極小値と1サンプリング前のサンプル値との差分値dsに0.5を乗算した乗算結果Δdsを極小値のサンプル位置に配して図7(b)に示す補正信号co[i]を生成する。 Subsequently, the correction signal generation unit 154 sets 0.5 extracted from the coefficient table to the difference value dl between the maximum value of the frame signal x 0 [i] illustrated in FIG. The multiplied multiplication result Δdl is arranged at the sample position of the maximum value, and the multiplication result Δds obtained by multiplying the difference value ds between the minimum value of the frame signal and the sample value before one sampling by 0.5 is arranged at the sample position of the minimum value. Then, the correction signal co [i] shown in FIG. 7B is generated.

また、ここでは、乗算結果Δdl、Δdsを極大値や極小値のサンプル位置に加減算するような補正信号が生成されているが、加減算対象となるサンプル位置は、かかる場合に限らず、例えば、極大値や極小値の前後所定数のサンプル位置に加減算することもできる。   Further, here, a correction signal for adding and subtracting the multiplication results Δdl and Δds to and from the sample position of the maximum value or the minimum value is generated. However, the sample position to be added or subtracted is not limited to this, for example, the maximum It is also possible to add / subtract to a predetermined number of sample positions before and after the value or minimum value.

例えば、補正信号生成部154は、図8(a)に示すフレーム信号x[i]の極大値と1サンプリング前のサンプル値との差分値dlに、係数テーブルから抽出した0.5を乗算した乗算結果Δdlを極大値の前後1のサンプル位置に配し、フレーム信号の極小値と1サンプリング前のサンプル値との差分値dsに0.5を乗算した乗算結果Δdsを極小値の前後1のサンプル位置に配して図8(b)に示す補正信号co[i]を生成する。また、極大値や極小値のサンプル位置と極大値や極小値の前後所定数のサンプル位置にそれぞれ乗算結果Δdl、Δdsを配して、図7(b)と図8(b)とを合成した補正信号を生成することも可能である。 For example, the correction signal generation unit 154 multiplies the difference value dl between the maximum value of the frame signal x 0 [i] shown in FIG. 8A and the sample value before one sampling by 0.5 extracted from the coefficient table. The obtained multiplication result Δdl is arranged at one sample position before and after the maximum value, and the multiplication result Δds obtained by multiplying the difference value ds between the minimum value of the frame signal and the sample value before one sampling by 0.5 is set to 1 before and after the minimum value. The correction signal co [i] shown in FIG. 8B is generated at the sample positions. Further, the multiplication results Δdl and Δds are arranged at the sample positions of the local maximum value and the local minimum value and a predetermined number of sample positions before and after the local maximum value and the local minimum value, respectively, and FIG. 7B and FIG. It is also possible to generate a correction signal.

このように、特定の高周波数成分を付加するための複雑な計算を伴うことなく、任意のサンプル位置における振幅の絶対値を大きくするといった単純な処理で高周波数成分を付加する構成により、処理負荷を軽減しつつ音質の改善を図ることが可能となる。   In this way, the processing load is increased by a simple process of increasing the absolute value of the amplitude at an arbitrary sample position without complicated calculation for adding a specific high frequency component. It is possible to improve sound quality while reducing noise.

遅延部156は、原信号となるフレーム信号x[i]を、極値特定部150、サンプル数計数部152、補正信号生成部154での処理時間分だけ遅延させ、図7(a)と図7(b)や図8(a)と図8(b)のようにフレーム信号x[i]と補正信号co[i]とを同期させる。 The delay unit 156 delays the frame signal x 0 [i], which is the original signal, by the processing time in the extreme value specifying unit 150, the sample number counting unit 152, and the correction signal generating unit 154, as shown in FIG. As shown in FIG. 7B, FIG. 8A, and FIG. 8B, the frame signal x 0 [i] and the correction signal co [i] are synchronized.

加算部158は、例えば図7(a)および図8(a)に示されるフレーム信号x[i]に、図7(b)および図8(b)に示される補正信号co[i]を加算して、図7(c)および図8(c)に示すような音質改善処理が施されたフレーム信号x’[i]を生成する。本実施形態においては、このような矩形波に近くなるように補正信号を付加することで高周波数成分を拡張し、音質の改善を図ることができる。 For example, the adder 158 adds the correction signal co [i] shown in FIGS. 7B and 8B to the frame signal x 0 [i] shown in FIGS. 7A and 8A. The frame signal x 0 ′ [i] subjected to the sound quality improvement processing as shown in FIG. 7C and FIG. In the present embodiment, the correction signal is added so as to be close to such a rectangular wave, thereby expanding the high frequency component and improving the sound quality.

しかし、このような音質改善処理を無作為に実行すると、フレーム信号x[i]に含まれる各信号の周波数とサンプリング周波数fsとが所定の関係を有さないので、仮に、フレーム信号x[i]が規則的な正弦波のみから形成されていたとしても、その周波数がサンプリング周波数fsと異なれば、極小値から極大値までのサンプル数と極大値から極小値までのサンプル数とが異なり、乗算する係数や加減算対象となるサンプル位置が半周期毎に異なり音質改善処理が偏ることとなる。例えば、フレーム信号x[i]の全周期のサンプル数が「7」である場合、半周期のいずれか一方のサンプル数が「4」となり、他方が「3」となってしまい、その補正量もサンプル数に応じて偏る。 However, running such a sound quality improvement process at random, since the frequency and the sampling frequency fs of the signal included in the frame signal x 0 [i] does not have a predetermined relationship, if the frame signal x 0 Even if [i] is formed only from a regular sine wave, if the frequency is different from the sampling frequency fs, the number of samples from the minimum value to the maximum value differs from the number of samples from the maximum value to the minimum value. Therefore, the coefficient to be multiplied and the sample position to be added / subtracted differ every half cycle, and the sound quality improvement processing is biased. For example, when the number of samples in the entire period of the frame signal x 0 [i] is “7”, the number of samples in one of the half periods is “4” and the other is “3”. The amount also depends on the number of samples.

本実施形態においては、上述したように、音質改善処理の対象を、フレーム信号x[i]ではなく、そのフレーム信号x[i]に含まれる、極値の前後の半周期でサンプル数が同一となる周波数に基づく基本波信号b[i]としているので、画一的かつ均一に音声改善処理を施すことができる。 In the present embodiment, as described above, the target of the sound quality improvement process is not the frame signal x 0 [i], but the number of samples in the half cycle before and after the extreme value included in the frame signal x 0 [i]. Since the fundamental wave signals b k [i] are based on the same frequency, the sound improvement processing can be performed uniformly and uniformly.

例えば、本実施形態における補正信号加算部124に入力される1または複数の基本波信号b[i]の1の基本波信号b[i]を例に挙げると、上述した極値特定部150が特定すべき極大値と極小値の値は、基本波信号b[i]の正弦波成分および余弦波成分それぞれの振幅情報から特定でき、極大値と極小値のサンプル位置は、基本波信号b[i]の周波数を示す周波数情報から特定できる。 For example, taking the first fundamental signal b k [i] of one or more of the fundamental wave signal b k to be inputted to the correction signal addition section 124 [i] in the present embodiment example, extreme specifying unit described above The maximum and minimum values to be identified by 150 can be identified from the amplitude information of the sine wave component and cosine wave component of the fundamental wave signal b k [i], and the sample positions of the maximum and minimum values are the fundamental wave. It can be identified from frequency information indicating the frequency of the signal b k [i].

また、サンプル数計数部152が特定すべきサンプル数も、周波数情報から図4を参照して一意に決定することができる。したがって、補正信号生成部154が生成すべき補正信号も、基本波信号b[i]の各情報から一意に導き出すことが可能となる。 Also, the number of samples to be specified by the sample number counting unit 152 can be uniquely determined from the frequency information with reference to FIG. Therefore, the correction signal to be generated by the correction signal generation unit 154 can be uniquely derived from each information of the fundamental wave signal b k [i].

上述したように、基本波信号b[i]は、サンプリング周波数fsの1/2を整数で分周した所定数の周波数fのみで形成される。したがって、極値の前後の半周期でサンプル数が同一となるばかりでなく、正弦波や余弦波の開始点および終了点がサンプル点に位置することとなる。そうすると、補正信号加算部124は、画一的な補正値を付加するだけといった単純処理によって補正信号を生成できる。 As described above, the fundamental wave signal b k [i] is formed with only a predetermined number of frequencies f k obtained by dividing 1/2 of the sampling frequency fs by an integer. Accordingly, not only the number of samples is the same in the half cycle before and after the extreme value, but also the start and end points of the sine wave and cosine wave are located at the sample points. Then, the correction signal adding unit 124 can generate a correction signal by a simple process such as simply adding a uniform correction value.

図9は、本実施形態の補正信号加算部124における音質改善処理を説明するための説明図である。例えば、図9(a)に示す正弦波sin[i]の音質改善処理では、極大値と極小値が、その周波数fから求まるサンプル数FS(ここでは4)毎に出現し、同様に、図9(b)に示す余弦波cos[i]の補正でも、極大値と極小値がサンプル数FS毎に出現する。また、サンプル数FSに応じて、加減算対象となるサンプル位置および係数も定まる。さらに、その振幅に応じて、加減算される値も一意に求まる。そうすると、当該正弦波sin[i]や余弦波cos[i]に対する補正信号が基本波信号b[i]の各情報から一意に導き出される。したがって、補正信号加算部124は、基本波信号それぞれの周波数fと正弦波sin[i]の振幅と余弦波cos[i]の振幅とに応じて、図9(a)や図9(b)のように、音質改善処理を画一的に施すことが可能となる。 FIG. 9 is an explanatory diagram for explaining the sound quality improvement processing in the correction signal adding unit 124 of the present embodiment. For example, in the sound quality improvement processing of the sine wave sin [i] shown in FIG. 9A, the maximum value and the minimum value appear for every sample number FS (here, 4) obtained from the frequency f k . Even in the correction of the cosine wave cos [i] shown in FIG. 9B, the maximum value and the minimum value appear for each number of samples FS. Further, the sample position and coefficient to be added / subtracted are also determined according to the number of samples FS. Further, the value to be added or subtracted is uniquely determined according to the amplitude. Then, a correction signal for the sine wave sin [i] and the cosine wave cos [i] is uniquely derived from each information of the fundamental wave signal b k [i]. Therefore, the correction signal adding unit 124 may change the frequency f k of each fundamental wave signal, the amplitude of the sine wave sin [i], and the amplitude of the cosine wave cos [i] according to FIGS. ), The sound quality improvement process can be applied uniformly.

ここでは、サンプル数FSが偶数の場合を説明したが、サンプル数FSが奇数の場合も同様に画一的な補正信号を生成することができる。   Although the case where the sample number FS is an even number has been described here, a uniform correction signal can be generated in the same manner when the sample number FS is an odd number.

また、正弦波および余弦波の各サンプル位置における補正信号co[i]の値は、基本波信号b[i]の周波数fに対して一義的に求まるので、補正信号加算部124は、基本波信号b[i]の周波数fと、振幅が1である正弦波および余弦波の各サンプル位置における補正信号co[i]の値とが対応付けられた補正テーブルを予め作成しておくこともできる。かかる補正テーブルは図示しないメモリに保持されてもよく、通信網106から取得するとしてもよい。そして、補正信号加算部124は、補正テーブルを参照し、1または複数の基本波信号b[i]それぞれの周波数fに応じて振幅が1である正弦波および余弦波の各サンプル位置における補正信号co[i]の値を抽出し、1または複数の基本波信号b[i]それぞれの正弦波の振幅と余弦波の振幅とを乗じて補正信号co[i]を生成する。 Further, since the value of the correction signal co [i] at each sample position of the sine wave and cosine wave is uniquely determined with respect to the frequency f k of the fundamental wave signal b k [i], the correction signal adding unit 124 A correction table in which the frequency f k of the fundamental wave signal b k [i] and the value of the correction signal co [i] at each sample position of the sine wave and cosine wave having an amplitude of 1 is created in advance It can also be left. Such a correction table may be held in a memory (not shown) or may be acquired from the communication network 106. Then, the correction signal adding unit 124 refers to the correction table, and at each sample position of the sine wave and cosine wave whose amplitude is 1 according to the frequency f k of each of the one or more fundamental wave signals b k [i]. The value of the correction signal co [i] is extracted, and the correction signal co [i] is generated by multiplying the amplitude of the sine wave and the amplitude of the cosine wave of each of the one or more fundamental wave signals b k [i].

さらに、基本波信号に含まれる正弦波や余弦波と補正信号とが比例関係にあるので、正弦波や余弦波と補正信号とを予め加算した信号とを対応付けてテーブルを作成することも可能である。   Furthermore, since the sine wave or cosine wave included in the fundamental wave signal is proportional to the correction signal, it is possible to create a table by associating the sine wave or cosine wave with the signal obtained by adding the correction signal in advance. It is.

かかる残差信号d[i]を除く基本波信号b[i]のみに対して補正信号co[i]を生成する構成により、補正信号co[i]を生成する際の処理負荷を著しく軽減することが可能となり、プログラムの簡素化を図ったり、処理能力の低い安価な処理装置を採用してコストの削減を図ることができる。 The processing load when generating the correction signal co [i] is significantly reduced by the configuration in which the correction signal co [i] is generated only for the fundamental wave signal b k [i] excluding the residual signal d [i]. Therefore, the program can be simplified, and the cost can be reduced by using an inexpensive processing apparatus having a low processing capability.

また、すべての基本波信号b[i]に対して、適切なサンプル位置に適切な係数を乗じた乗算結果を均等に加減算することが可能となり、また、フレーム信号の変化に拘わらず、基本波信号b[i]の同じサンプル位置に振幅に比例する同じ補正値を加えることができるので、偏りのない高周波数信号を付加することが可能となる。このように、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。 Further, it becomes possible to add and subtract evenly the multiplication results obtained by multiplying the appropriate sample position by the appropriate coefficient with respect to all the fundamental wave signals b k [i]. Since the same correction value proportional to the amplitude can be added to the same sample position of the wave signal b k [i], it is possible to add a high-frequency signal without bias. As described above, the sound quality improvement can be made uniform by performing the sound improvement process uniformly on each signal included in the digital sound signal.

残差信号加算部126は、補正信号加算部124によって補正信号co[i]が加減算された1または複数の基本波信号b[i](フレーム信号x’[i])と、信号分離部122で分離された残差信号d[i]とを加算して、フレーム信号を再構成する。したがって、再構成されたフレーム信号x”[i]は、数式7のようになる。ただし、数式7中のδs[i]および、δc[i]はそれぞれ振幅1の正弦波と余弦波に対する変位量を表し、iは0〜L−1、kは2、3、4、…、10である。

Figure 0005392057
…(数式7) The residual signal adding unit 126 performs signal separation on one or more fundamental wave signals b k [i] (frame signal x 0 ′ [i]) obtained by adding or subtracting the correction signal co [i] by the correction signal adding unit 124. The residual signal d [i] separated by the unit 122 is added to reconstruct the frame signal. Therefore, the reconstructed frame signal x 0 ″ [i] is expressed by Equation 7. However, δs [i] and δc [i] in Equation 7 are respectively for a sine wave and a cosine wave having an amplitude of 1. The displacement amount is represented, i is 0 to L-1, k is 2, 3, 4,.
Figure 0005392057
... (Formula 7)

オーバラップ合成部128は、残差信号加算部126において再構成されたフレーム信号と、1つ前のフレーム信号とを(隣り合うフレーム同士を)、デジタル音声信号の一部がオーバラップするように合成し、最終の出力信号を生成する。   The overlap synthesizing unit 128 combines the frame signal reconstructed by the residual signal adding unit 126 and the previous frame signal (adjacent frames) so that a part of the digital audio signal overlaps. Combine and generate the final output signal.

図10は、オーバラップ合成部128の動作を説明するための説明図である。図10中フレーム信号は、フレーム化部120によって生成された後、信号分離部122、補正信号加算部124および残差信号加算部126を経由した信号であり、A、B、Cの英数字は、図3のデジタル音声信号A、B、Cに対応している。   FIG. 10 is an explanatory diagram for explaining the operation of the overlap composition unit 128. The frame signal in FIG. 10 is a signal that is generated by the framing unit 120 and then passes through the signal separation unit 122, the correction signal addition unit 124, and the residual signal addition unit 126. The alphanumeric characters A, B, and C are , Corresponding to the digital audio signals A, B and C in FIG.

具体的に、オーバラップ合成部128は、まず、再構成されたフレーム信号x”[i](フレーム信号0、フレーム信号1、フレーム信号2、…)に対して図10に示す窓関数Wを乗じる。フレーム化部120において既に正弦波窓による窓関数が施されている場合、オーバラップ合成部128においも正弦波窓による窓関数を採用する。また、フレーム化部120において窓関数が採用されていない場合、ハニング窓やブラックマン窓を採用する。窓関数はかかる場合に限られず、2つのフレーム信号がオーバラップしたとき、そのオーバラップ部分が合成してオーバラップしない部分と等しくなれば、既存の様々な窓関数を採用することができる。 Specifically, the overlap synthesis unit 128 first performs the window function W shown in FIG. 10 on the reconstructed frame signal x 0 ″ [i] (frame signal 0, frame signal 1, frame signal 2,...). When a window function using a sine wave window has already been applied in the framing unit 120, a window function using a sine wave window is also used in the overlap synthesis unit 128. In addition, a window function is used in the framing unit 120. If not, the Hanning window or the Blackman window is used, and the window function is not limited to such a case, and when two frame signals overlap, if the overlap part is synthesized and equal to the non-overlapping part Various existing window functions can be employed.

図10におけるフレーム信号1が入力されたときには、既にフレーム信号0のデジタル音声信号Aが保持されており、オーバラップ合成部128は、フレーム信号0のデジタル音声信号Aと、フレーム信号1の後部信号A’とがオーバラップするように、デジタル音声信号Aと後部信号A’を加算して合成信号A”を生成する。同時にオーバラップ合成部128は、フレーム信号1のデジタル音声信号Bを次回の加算処理のため一次的に保持する。そして、周波数時間変換部146からフレーム信号2が入力されると、オーバラップ合成部128は、フレーム信号1のとき同様、フレーム信号1のデジタル音声信号Bと、フレーム信号2の後部信号B’とをオーバラップするように加算して合成信号B”を生成する。オーバラップ合成部128は、このようにして生成された合成信号A”、B”、C”、…を接続して随時出力する。   When the frame signal 1 in FIG. 10 is input, the digital audio signal A of the frame signal 0 is already held, and the overlap synthesis unit 128 performs the digital audio signal A of the frame signal 0 and the rear signal of the frame signal 1. The digital audio signal A and the rear signal A ′ are added so that A ′ overlaps to generate a synthesized signal A ″. At the same time, the overlap synthesizing unit 128 converts the digital audio signal B of the frame signal 1 into the next time. When the frame signal 2 is input from the frequency time converter 146, the overlap synthesizer 128 receives the digital audio signal B of the frame signal 1 and the frame signal 1 as in the case of the frame signal 1. Then, the synthesized signal B ″ is generated by adding the rear signal B ′ of the frame signal 2 so as to overlap. The overlap synthesis unit 128 connects the synthesized signals A ″, B ″, C ″,... Generated in this way and outputs them as needed.

(音声処理プログラム)
また、上述した音声処理装置100は、コンピュータを用いて実現することができる。
(Speech processing program)
Further, the above-described voice processing apparatus 100 can be realized using a computer.

図11は、音声処理装置100として、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理することが可能なコンピュータ(情報処理装置)200の典型例を示した機能ブロック図である。コンピュータ200は、中央処理装置210と、一時記憶装置212と、外部記憶装置214と、入力部216と、出力部218とを含んで構成される。   FIG. 11 is a functional block diagram showing a typical example of a computer (information processing apparatus) 200 that can analyze a digital audio signal and process the digital audio signal using the analysis result as the audio processing apparatus 100. It is. The computer 200 includes a central processing unit 210, a temporary storage device 212, an external storage device 214, an input unit 216, and an output unit 218.

中央処理装置(CPU)210は、一時記憶装置212や外部記憶装置214のプログラムやアプリケーションによりコンピュータ200全体を制御する。一時記憶装置212は、RAM、EEPROM、不揮発性RAM等から構成され、中央処理装置210で処理されるデジタル音声信号等を一時的に記憶する。外部記憶装置214は、フラッシュメモリ、HDD等で構成され、中央処理装置210で処理されるプログラムを記憶する。入力部216は、放送局102から放送波を通じて、コンテンツサーバ104から通信網106を通じて、または、記憶媒体108から直接、デジタル音声信号を入力し、一時記憶装置212に送信する。出力部218は、当該コンピュータ200によって生成された出力信号を再生装置110に転送する。   A central processing unit (CPU) 210 controls the entire computer 200 with programs and applications in the temporary storage device 212 and the external storage device 214. The temporary storage device 212 includes a RAM, an EEPROM, a nonvolatile RAM, and the like, and temporarily stores digital audio signals and the like processed by the central processing unit 210. The external storage device 214 includes a flash memory, an HDD, and the like, and stores a program processed by the central processing unit 210. The input unit 216 inputs a digital audio signal from the broadcast station 102 through broadcast waves, from the content server 104 through the communication network 106, or directly from the storage medium 108, and transmits it to the temporary storage device 212. The output unit 218 transfers the output signal generated by the computer 200 to the playback device 110.

上述した音質改善処理は、中央処理装置210がプログラムを実行することによって為される。したがって、音声処理装置100が提供されると同時に、コンピュータ200に、デジタル音声信号の周波数分析を行い、デジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号生成ステップと、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する残差信号加算ステップと、を実行させる音声処理プログラムも提供される。また、このプログラムは、記憶媒体から読みとられてコンピュータに取り込まれてもよいし、通信網106を介してコンピュータ200に取り込まれてもよい。   The sound quality improvement process described above is performed by the central processing unit 210 executing a program. Therefore, at the same time when the audio processing apparatus 100 is provided, the computer 200 performs frequency analysis of the digital audio signal, and removes the digital audio signal from one or more fundamental wave signals and one or more fundamental wave signals. A signal separation step that separates the signal into signals, a correction signal generation step that generates a correction signal that increases the absolute value of the amplitude for each of the one or more fundamental wave signals, and adds the correction signal to the fundamental wave signal; There is also provided an audio processing program for executing a residual signal adding step of adding a residual signal to one or a plurality of fundamental wave signals to which signals are added. In addition, this program may be read from a storage medium and loaded into a computer, or may be loaded into the computer 200 via the communication network 106.

(音声処理方法)
次に、上述した音声処理装置100を用いてデジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理方法を説明する。
(Audio processing method)
Next, a speech processing method for analyzing a digital speech signal using the speech processing apparatus 100 described above and processing the digital speech signal using the analysis result will be described.

図12は、音声分析合成方法の全体的な流れを示したフローチャートである。音声処理装置100のフレーム化部120は、音声処理装置100が取得したデジタル音声信号を、所定のフレーム単位(所定サンプル数長)で順次切り出し、フレーム信号を生成する(S300)。   FIG. 12 is a flowchart showing the overall flow of the speech analysis / synthesis method. The framing unit 120 of the audio processing device 100 sequentially extracts the digital audio signal acquired by the audio processing device 100 in predetermined frame units (predetermined number of samples) to generate a frame signal (S300).

続いて、信号分離部122は、一般調和解析に基づき、フレーム信号の周波数分析を行い、所定数の相異なる周波数fの所定数の基本波信号b[i]を、それぞれ単独でフレーム信号から減算して差分信号e[i]を求める(S302)。信号分離部122は、所定数の周波数fすべてに関して処理が遂行されたか否か判断し(S304)、すべてに関して遂行されていない場合(S304のNO)、差分信号導出ステップS302を繰り返す。 Subsequently, the signal separation unit 122 performs a frequency analysis of the frame signal based on the general harmonic analysis, and each of the predetermined number of fundamental wave signals b k [i] having a predetermined number of different frequencies f k is a frame signal. The difference signal e k [i] is obtained by subtracting from (S302). The signal separation unit 122 determines whether or not processing has been performed for all of the predetermined number of frequencies f k (S304), and when not performed for all (NO in S304), repeats the differential signal derivation step S302.

所定数の周波数fすべてに関して遂行されると(S304のYES)、差分信号のエネルギーEが小さい順に9つの周波数fを並び替える(S306)。そして、信号分離部122は、すべての周波数fに関する基本波信号b[i]が減算されるか、または、残差信号d[i]が所定のエネルギー以下となるまで(S308のNO)、その9つの周波数fに対応する9つの基本波信号b[i]を、並び替えられた周波数fの順に、フレーム信号x[i]から順次減算し、残差信号d[i]を導出する(S310)。こうして、信号分離部122は、デジタル音声信号を1または複数の基本波信号b[i]と残差信号d[i]とに分離することができる。 Once accomplished for all frequencies f k of a predetermined number (YES in S304), rearranges the nine frequencies f k energy E k is the ascending order of the difference signal (S306). Then, the signal separation unit 122 subtracts the fundamental wave signal b k [i] for all the frequencies f k or until the residual signal d [i] becomes equal to or lower than a predetermined energy (NO in S308). , the nine corresponding to the frequency f k nine fundamental signal b k [i], the order of the frequency f k rearranged sequentially subtracted from the frame signal x 0 [i], the residual signal d [i ] Is derived (S310). Thus, the signal separation unit 122 can separate the digital audio signal into one or a plurality of fundamental wave signals b k [i] and a residual signal d [i].

そして、補正信号加算部124は、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算し(S312)、残差信号加算部126は、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する(S314)。   Then, the correction signal adding unit 124 generates a correction signal that increases the absolute value of the amplitude for each of the one or a plurality of fundamental wave signals, adds the correction signal to the fundamental wave signal (S312), and adds the residual signal. The unit 126 adds the residual signal to one or a plurality of fundamental signals to which the correction signals are added (S314).

最後に、オーバラップ合成部128は、残差信号加算部126において再構成されたフレーム信号と、1つ前のフレーム信号とを、一部がオーバラップするように合成し、最終の出力信号を生成する(S316)。   Finally, the overlap synthesizer 128 synthesizes the frame signal reconstructed by the residual signal adder 126 and the previous frame signal so as to partially overlap, and outputs the final output signal. Generate (S316).

以上説明した音声処理方法によってもデジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。   Even with the audio processing method described above, it is possible to uniformly improve the sound quality by uniformly performing audio improvement processing on each signal included in the digital audio signal.

以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。   As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to this embodiment. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Is done.

なお、本明細書の音声処理方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。   Note that each step in the voice processing method of the present specification does not necessarily have to be processed in time series in the order described in the flowchart, and may include parallel or subroutine processing.

本発明は、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理装置、音声処理方法および音声処理プログラムに利用することができる。   The present invention can be used in an audio processing apparatus, an audio processing method, and an audio processing program that analyze a digital audio signal and process the digital audio signal using the analysis result.

100 …音声処理装置
120 …フレーム化部
122 …信号分離部
124 …補正信号加算部
126 …残差信号加算部
128 …オーバラップ合成部
200 …コンピュータ
DESCRIPTION OF SYMBOLS 100 ... Audio | voice processing apparatus 120 ... Framing part 122 ... Signal separation part 124 ... Correction signal addition part 126 ... Residual signal addition part 128 ... Overlap synthesis part 200 ... Computer

Claims (7)

入力されたデジタル音声信号の周波数分析を行い、前記デジタル音声信号を1または複数の基本波信号と前記1または複数の基本波信号を除いた残差信号とに分離する信号分離部と、
前記1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算する補正信号加算部と、
前記補正信号がそれぞれ加算された前記1または複数の基本波信号に前記残差信号を加算する残差信号加算部と、
を備え、
前記1または複数の基本波信号は、相異なる周波数の複数の基本波信号であり、
前記信号分離部は、前記1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独で前記デジタル音声信号から減算した場合の差分信号を求め、前記差分信号のエネルギーが小さい順に前記デジタル音声信号から前記1または複数の基本波信号を順次減算して前記デジタル音声信号を1または複数の前記基本波信号と前記残差信号とに分離することを特徴とする音声処理装置。
A signal separation unit that performs frequency analysis of the input digital audio signal and separates the digital audio signal into one or more fundamental wave signals and a residual signal excluding the one or more fundamental wave signals;
A correction signal adding unit that generates a correction signal that increases an absolute value of an amplitude for each of the one or more fundamental wave signals and adds the correction signal to the fundamental wave signal;
A residual signal adding unit that adds the residual signal to the one or more fundamental wave signals to which the correction signals are added, and
With
The one or more fundamental wave signals are a plurality of fundamental wave signals having different frequencies,
The signal separation unit obtains a difference signal when a plurality of fundamental wave signals having the same frequency as the one or more fundamental wave signals are subtracted from the digital audio signal independently, and the difference signal has a lower energy in order An audio processing apparatus, wherein the digital audio signal is sequentially subtracted from the digital audio signal to separate the digital audio signal into one or more fundamental wave signals and the residual signal.
デジタル音声信号を所定のフレーム単位で切り出し、その所定のフレームごとのデジタル音声信号を生成するフレーム化部と、
入力されたフレーム単位のデジタル音声信号を、隣り合うフレームのデジタル音声信号の一部がオーバラップするように合成するオーバラップ合成部と、
をさらに備え、
前記信号分離部に入力されるデジタル音声信号は前記フレーム化部で生成された所定のフレームに区切られたデジタル音声信号であり、
前記オーバラップ合成部に入力されるフレーム単位のデジタル音声信号は前記残差信号加算部から入力されることを特徴とする請求項1に記載の音声処理装置。
A framing unit that cuts out a digital audio signal in units of a predetermined frame and generates a digital audio signal for each predetermined frame;
An overlap synthesizing unit that synthesizes the input digital audio signal in units of frames so that part of the digital audio signals of adjacent frames overlap;
Further comprising
The digital audio signal input to the signal separation unit is a digital audio signal divided into predetermined frames generated by the framing unit,
The audio processing apparatus according to claim 1, wherein the digital audio signal in units of frames input to the overlap synthesis unit is input from the residual signal addition unit.
前記1または複数の基本波信号は、所定の周波数と、前記所定の周波数を有する正弦波および余弦波のそれぞれの振幅とで表される信号であることを特徴とする請求項1または2に記載の音声処理装置。   The one or more fundamental wave signals are signals represented by a predetermined frequency and respective amplitudes of a sine wave and a cosine wave having the predetermined frequency. Voice processing device. 前記補正信号加算部は、前記1または複数の基本波信号それぞれの周波数と正弦波の振幅と余弦波の振幅とに応じて前記補正信号を生成することを特徴とする請求項3に記載の音声処理装置。   4. The audio according to claim 3, wherein the correction signal adding unit generates the correction signal according to a frequency of each of the one or more fundamental wave signals, an amplitude of a sine wave, and an amplitude of a cosine wave. Processing equipment. 前記補正信号加算部は、
前記基本波信号の周波数と、振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値とが予め対応付けられた補正テーブルを参照し、
前記1または複数の基本波信号それぞれの周波数に応じて前記振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値を抽出し、前記1または複数の基本波信号それぞれの正弦波の振幅と余弦波の振幅とを乗じて前記補正信号を生成することを特徴とする請求項4に記載の音声処理装置。
The correction signal adding unit is
Refer to the correction table in which the frequency of the fundamental wave signal and the value of the correction signal at each sample position of the sine wave and cosine wave having an amplitude of 1 are associated in advance,
The value of the correction signal at each sample position of the sine wave and cosine wave having the amplitude of 1 is extracted according to the frequency of each of the one or more fundamental wave signals, and the sine wave of each of the one or more fundamental wave signals The sound processing apparatus according to claim 4, wherein the correction signal is generated by multiplying the amplitude of the cosine wave and the amplitude of the cosine wave.
入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独で前記デジタル音声信号から減算した場合の差分信号を求め、前記差分信号のエネルギーが小さい順に前記デジタル音声信号から前記1または複数の基本波信号を順次減算して前記デジタル音声信号を前記1または複数の基本波信号と前記1または複数の基本波信号を除いた残差信号とに分離し、
前記1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算し、
前記補正信号がそれぞれ加算された前記1または複数の基本波信号に前記残差信号を加算することを特徴とする音声処理方法。
Analyzing the frequency of the input digital audio signal, obtaining a differential signal when subtracting a plurality of fundamental signals having the same frequency as one or a plurality of fundamental signals having different frequencies from the digital audio signal, The one or more fundamental wave signals are sequentially subtracted from the digital audio signal in ascending order of energy of the difference signal to remove the one or more fundamental wave signals and the one or more fundamental wave signals from the digital audio signal. Separated into residual signals,
For each of the one or more fundamental wave signals, a correction signal that increases the absolute value of the amplitude is generated and added to the fundamental wave signal,
An audio processing method, wherein the residual signal is added to the one or more fundamental wave signals to which the correction signals are added.
コンピュータに、
入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独で前記デジタル音声信号から減算した場合の差分信号を求め、前記差分信号のエネルギーが小さい順に前記デジタル音声信号から前記1または複数の基本波信号を順次減算して前記デジタル音声信号を前記1または複数の基本波信号と前記1または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、
前記1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算する補正信号生成ステップと、
前記補正信号がそれぞれ加算された前記1または複数の基本波信号に前記残差信号を加算する残差信号加算ステップと、
を実行させることを特徴とする音声処理プログラム。
On the computer,
Analyzing the frequency of the input digital audio signal, obtaining a differential signal when subtracting a plurality of fundamental signals having the same frequency as one or a plurality of fundamental signals having different frequencies from the digital audio signal, The one or more fundamental wave signals are sequentially subtracted from the digital audio signal in ascending order of energy of the difference signal to remove the one or more fundamental wave signals and the one or more fundamental wave signals from the digital audio signal. A signal separation step for separating into a residual signal,
A correction signal generation step of generating a correction signal that increases an absolute value of an amplitude for each of the one or more fundamental wave signals and adding the correction signal to the fundamental wave signal;
A residual signal adding step of adding the residual signal to the one or more fundamental wave signals to which the correction signals are respectively added;
A voice processing program characterized by causing
JP2009291156A 2009-12-22 2009-12-22 Audio processing apparatus, audio processing method, and audio processing program Active JP5392057B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009291156A JP5392057B2 (en) 2009-12-22 2009-12-22 Audio processing apparatus, audio processing method, and audio processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009291156A JP5392057B2 (en) 2009-12-22 2009-12-22 Audio processing apparatus, audio processing method, and audio processing program

Publications (2)

Publication Number Publication Date
JP2011133568A JP2011133568A (en) 2011-07-07
JP5392057B2 true JP5392057B2 (en) 2014-01-22

Family

ID=44346395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009291156A Active JP5392057B2 (en) 2009-12-22 2009-12-22 Audio processing apparatus, audio processing method, and audio processing program

Country Status (1)

Country Link
JP (1) JP5392057B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6844504B2 (en) * 2017-11-07 2021-03-17 株式会社Jvcケンウッド Digital audio processing equipment, digital audio processing methods, and digital audio processing programs
JP7251400B2 (en) * 2019-08-08 2023-04-04 株式会社Jvcケンウッド DIGITAL SOUND PROCESSING DEVICE, DIGITAL SOUND PROCESSING METHOD, AND DIGITAL SOUND PROCESSING PROGRAM

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3401171B2 (en) * 1997-10-22 2003-04-28 日本ビクター株式会社 Audio information processing method, audio information processing apparatus, and audio information recording method on recording medium
JP2000268510A (en) * 1999-03-19 2000-09-29 Victor Co Of Japan Ltd Encoder
EP1343143B1 (en) * 2000-12-14 2011-10-05 Sony Corporation Analysis-synthesis of audio signal
JP3659489B2 (en) * 2000-12-20 2005-06-15 日本ビクター株式会社 Digital audio processing apparatus and computer program recording medium
JP2003084799A (en) * 2001-09-17 2003-03-19 Dainippon Printing Co Ltd Frequency analysis method and sound signal encoding method
JP4123486B2 (en) * 2006-10-02 2008-07-23 日本ビクター株式会社 Digital audio processing method, digital audio processing apparatus, and computer program
JP2008089983A (en) * 2006-10-02 2008-04-17 Victor Co Of Japan Ltd Encoding apparatus
JP5023812B2 (en) * 2007-05-30 2012-09-12 株式会社Jvcケンウッド Digital audio processing apparatus and digital audio processing program

Also Published As

Publication number Publication date
JP2011133568A (en) 2011-07-07

Similar Documents

Publication Publication Date Title
CN101971252B (en) Device and method for manipulating an audio signal having a transient event
US9111526B2 (en) Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
CA2779388C (en) Sbr bitstream parameter downmix
WO2010024371A1 (en) Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program
KR101264486B1 (en) Apparatus and Method for Determining a Plurality of Local Center of Gravity Frequencies of a Spectrum of an Audio Signal
US8229738B2 (en) Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method
JP6401521B2 (en) Signal processing apparatus and signal processing method
JP2004198485A (en) Device and program for decoding sound encoded signal
JP2003108197A (en) Audio signal decoding device and audio signal encoding device
JP5392057B2 (en) Audio processing apparatus, audio processing method, and audio processing program
KR20060036724A (en) Method and apparatus for encoding/decoding audio signal
EP2595147A1 (en) Audio data encoding method and device
Moliner et al. Virtual bass system with fuzzy separation of tones and transients
JP4760278B2 (en) Interpolation device, audio playback device, interpolation method, and interpolation program
US20160189725A1 (en) Voice Processing Method and Apparatus, and Recording Medium Therefor
CN113196387A (en) High resolution audio coding and decoding
JP2011186187A (en) Speech processor, speech processing method and speech processing program
CN110335623B (en) Audio data processing method and device
CN113302688B (en) High resolution audio codec
JP2003280691A (en) Voice processing method and voice processor
KR101333162B1 (en) Tone and speed contorol system and method of audio signal using imdct input
KR100663379B1 (en) Sound enhancement system of portable device for multimedia audio and method thereof
JP7130878B2 (en) High resolution audio coding
JP2013057895A (en) Audio reproduction device, audio reproduction method, and computer program
JP4963955B2 (en) Signal processing method, signal processing apparatus, and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130930

R150 Certificate of patent or registration of utility model

Ref document number: 5392057

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150