JP5392057B2 - Audio processing apparatus, audio processing method, and audio processing program - Google Patents
Audio processing apparatus, audio processing method, and audio processing program Download PDFInfo
- Publication number
- JP5392057B2 JP5392057B2 JP2009291156A JP2009291156A JP5392057B2 JP 5392057 B2 JP5392057 B2 JP 5392057B2 JP 2009291156 A JP2009291156 A JP 2009291156A JP 2009291156 A JP2009291156 A JP 2009291156A JP 5392057 B2 JP5392057 B2 JP 5392057B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- fundamental wave
- digital audio
- signals
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理装置、音声処理方法および音声処理プログラムに関する。 The present invention relates to a voice processing apparatus, a voice processing method, and a voice processing program for analyzing a digital voice signal and processing the digital voice signal using the analysis result.
近年、音声符号化技術の進歩により、CD(Compact Disc)等に収録されている楽曲の音質を極力維持したままファイルサイズを小さくすることが可能となり、その結果として、メモリタイプのポータブルオーディオプレーヤに例えば大量の楽曲を収録して携帯することが可能となった。 In recent years, due to advances in audio coding technology, it has become possible to reduce the file size while maintaining the sound quality of music recorded on CDs (Compact Discs) as much as possible. For example, a large amount of music can be recorded and carried.
しかし、上述した音声符号化技術は、人間の聴覚特性を利用して通常聞き取れない高周波数領域の音声信号をカットしたり、マスキング効果により聞き取れない音のデータを間引いたりしているため、原音と比較すると、音の伸び、広がり、ダイナミックレンジ、艶っぽさに乏しくなる。そのため、音声符号化技術により圧縮されたデジタル音声信号の音質を改善する技術が開発されている。 However, the above-described speech coding technology cuts out high-frequency speech signals that are not normally heard using human auditory characteristics, or thins out sound data that cannot be heard due to the masking effect. In comparison, the sound will be less stretched, spread, dynamic range and glossy. Therefore, a technique for improving the sound quality of a digital audio signal compressed by an audio encoding technique has been developed.
例えば、デジタル音声信号の極大値と極小値とを特定し、極小値から極大値まで、または、極大値から極小値までのサンプル数を計数し、極大値および極小値を除くサンプル毎に、前のサンプルの値との差分を算出してこれにサンプル数に応じた係数を乗算し、この乗算結果を、極大値や極小値に近いサンプル位置に対して加減算する技術が開示されている(例えば、特許文献1)。 For example, the maximum and minimum values of a digital audio signal are identified, the number of samples from the minimum value to the maximum value, or from the maximum value to the minimum value is counted, and for each sample excluding the maximum value and the minimum value, A technique is disclosed in which a difference from a sample value is calculated, a coefficient corresponding to the number of samples is multiplied, and the multiplication result is added to or subtracted from a sample position close to a maximum value or a minimum value (for example, Patent Document 1).
また、同様に、極値間のサンプル数を計数し、極大値や極小値と各々1サンプル前の値との差分を算出してこれにサンプル数に応じた係数を乗算し、この乗算結果を、極大値や極小値に直接、または、極大値や極小値に近いサンプル位置に加減算する技術も知られている(例えば、特許文献2)。 Similarly, the number of samples between extreme values is counted, the difference between the maximum value or the minimum value and the value one sample before is calculated, and this is multiplied by a coefficient corresponding to the number of samples. There is also known a technique of adding or subtracting directly to or from a sample position close to a maximum value or minimum value (for example, Patent Document 2).
上述した特許文献1や2の技術では、極小値から極大値までの区間と極大値から極小値までの区間とが独立して制御され、それぞれの区間のサンプル数に応じて、乗算する係数や加減算対象となるサンプル位置が決定される。したがって、デジタル音声信号の不規則な変化に対しても半周期に相当する区間毎に適切な音質改善処理を行うことができる。
In the techniques of
一方、デジタル音声信号に含まれる各信号の周波数とサンプリング周波数とが等しくなる保証はないので、デジタル音声信号が仮に規則的な正弦波であったとしても、その周波数がサンプリング周波数と異なれば、半周期毎のサンプル数、すなわち極小値から極大値までのサンプル数と極大値から極小値までのサンプル数とが異なる場合が生じ得る。 On the other hand, since there is no guarantee that the frequency of each signal included in the digital audio signal is equal to the sampling frequency, even if the digital audio signal is a regular sine wave, if the frequency is different from the sampling frequency, it is half There may occur a case where the number of samples per period, that is, the number of samples from the minimum value to the maximum value is different from the number of samples from the maximum value to the minimum value.
このように極値間のサンプル数が異なると、乗算する係数や加減算対象となるサンプル位置が変わり、半周期毎に音質の改善量が異なることとなるので、規則的な正弦波に対しても音質改善処理が偏る結果を招き、十分に音質改善効果が発揮されない場合があった。 Thus, if the number of samples between extreme values is different, the coefficient to be multiplied and the sample position to be added or subtracted will change, and the amount of improvement in sound quality will differ every half cycle, so even for regular sine waves In some cases, the sound quality improvement processing is biased, and the sound quality improvement effect is not sufficiently exhibited.
本発明は、このような課題に鑑み、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能な、音声処理装置、音声処理方法および音声処理プログラムを提供することを目的としている。 In view of such a problem, the present invention provides a sound processing apparatus capable of achieving uniform sound quality improvement by uniformly performing sound improvement processing on each signal included in a digital sound signal, An object is to provide a voice processing method and a voice processing program.
上記課題を解決するために、本発明の音声処理装置は、入力されたデジタル音声信号の周波数分析を行い、デジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離する信号分離部と、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号加算部と、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する残差信号加算部と、を備え、1または複数の基本波信号は、相異なる周波数の複数の基本波信号であり、信号分離部は、1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から1または複数の基本波信号を順次減算してデジタル音声信号を1または複数の基本波信号と残差信号とに分離することを特徴とする。 In order to solve the above-described problem, the audio processing apparatus of the present invention performs frequency analysis of an input digital audio signal, and removes one or more fundamental wave signals and one or more fundamental wave signals from the digital audio signal. A signal separation unit that separates the residual signal into a residual signal, and a correction signal addition unit that generates a correction signal whose amplitude is expanded for each of one or a plurality of fundamental wave signals and adds the correction signal to the fundamental signal. A residual signal adding unit that adds a residual signal to one or a plurality of fundamental signals to which correction signals are added, respectively , wherein the one or the plurality of fundamental signals are a plurality of fundamental signals having different frequencies. The signal separation unit obtains a difference signal when a plurality of fundamental wave signals having the same frequency as that of one or more fundamental wave signals are subtracted from the digital audio signal, respectively, and the difference signal is decremented in ascending order of energy of the difference signal. Characterized that you separate the digital audio signal into a one or more of the fundamental wave signal and the residual signal by sequentially subtracting one or more of the fundamental wave signal from the barrel audio signal.
音声処理装置は、デジタル音声信号を所定のフレーム単位で切り出し、その所定のフレームごとのデジタル音声信号を生成するフレーム化部と、入力されたフレーム単位のデジタル音声信号を、隣り合うフレームのデジタル音声信号の一部がオーバラップするように合成するオーバラップ合成部と、をさらに備え、信号分離部に入力されるデジタル音声信号はフレーム化部で生成された所定のフレームに区切られたデジタル音声信号であり、オーバラップ合成部に入力されるフレーム単位のデジタル音声信号は残差信号加算部から入力されてもよい。 The audio processing device cuts out a digital audio signal in a predetermined frame unit, generates a digital audio signal for each predetermined frame, and inputs the input digital audio signal in a frame unit into a digital audio of an adjacent frame. An overlap synthesis unit that synthesizes the signals so that part of the signals overlap, and the digital audio signal input to the signal separation unit is a digital audio signal divided into predetermined frames generated by the framing unit The digital audio signal in units of frames input to the overlap synthesis unit may be input from the residual signal addition unit.
上述した1または複数の基本波信号は、所定の周波数と、所定の周波数を有する正弦波および余弦波のそれぞれの振幅とで表される信号であってもよい。 The one or more fundamental wave signals described above may be signals represented by a predetermined frequency and the amplitudes of a sine wave and a cosine wave having the predetermined frequency.
補正信号加算部は、1または複数の基本波信号それぞれの周波数と正弦波の振幅と余弦波の振幅とに応じて補正信号を生成してもよい。具体的に、補正信号加算部は、基本波信号の周波数と、振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値とが予め対応付けられた補正テーブルを参照し、1または複数の基本波信号それぞれの周波数に応じて振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値を抽出し、1または複数の基本波信号それぞれの正弦波の振幅と余弦波の振幅とを乗じて補正信号を生成してもよい。 The correction signal adding unit may generate a correction signal according to the frequency of each of the one or more fundamental wave signals, the amplitude of the sine wave, and the amplitude of the cosine wave. Specifically, the correction signal adding unit refers to a correction table in which the frequency of the fundamental wave signal and the value of the correction signal at each sample position of the sine wave and cosine wave having an amplitude of 1 are associated in advance. Alternatively, the value of the correction signal at each sample position of the sine wave and cosine wave whose amplitude is 1 is extracted according to the frequency of each of the plurality of fundamental wave signals, and the amplitude and cosine of the sine wave of each of the one or more fundamental wave signals. The correction signal may be generated by multiplying the amplitude of the wave.
上記課題を解決するために、本発明の音声処理方法は、入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から1または複数の基本波信号を順次減算してデジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離し、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算し、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算することを特徴とする。 In order to solve the above-described problem, the audio processing method of the present invention performs frequency analysis of an input digital audio signal, and each of a plurality of fundamental wave signals having the same frequency as one or a plurality of fundamental wave signals having different frequencies. A difference signal when subtracted from the digital audio signal alone is obtained, and one or more fundamental wave signals are sequentially subtracted from the digital audio signal in order of increasing energy of the difference signal, so that the digital audio signal is converted into one or more fundamental wave signals. Separated into residual signals excluding one or a plurality of fundamental signals, a correction signal is generated for each of the one or more fundamental signals so that the absolute value of the amplitude is expanded and added to the fundamental signal The residual signal is added to one or a plurality of fundamental wave signals to which the correction signals are added.
上記課題を解決するために、本発明の音声処理プログラムは、コンピュータに、入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から1または複数の基本波信号を順次減算してデジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号生成ステップと、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する残差信号加算ステップと、を実行させることを特徴とする。
In order to solve the above problems, a sound processing program of the present invention performs frequency analysis of a digital sound signal input to a computer, and a plurality of fundamental waves having the same frequency as one or a plurality of fundamental wave signals having different frequencies. A difference signal is obtained when each signal is subtracted from the digital audio signal alone, and one or more fundamental wave signals are sequentially subtracted from the digital audio signal in order of increasing energy of the difference signal to thereby obtain one or more basic digital audio signals. A signal separation step for separating a wave signal and a residual signal from which one or more fundamental wave signals are removed, and a correction signal that increases the absolute value of the amplitude for each of the one or more fundamental wave signals And a correction signal generating step for adding to the fundamental signal, and a residual signal for adding the residual signal to one or a plurality of fundamental signals to which the correction signal has been added. Characterized in that to execute a signal adding step.
以上説明したように、本発明によれば、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。 As described above, according to the present invention, it is possible to achieve uniform sound quality improvement by uniformly performing sound improvement processing on each signal included in a digital sound signal.
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書および図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The dimensions, materials, and other specific numerical values shown in the embodiments are merely examples for facilitating the understanding of the invention, and do not limit the present invention unless otherwise specified. In the present specification and drawings, elements having substantially the same function and configuration are denoted by the same reference numerals, and redundant description is omitted, and elements not directly related to the present invention are not illustrated. To do.
(音声処理装置100)
図1は、音声処理装置100の利用状態を説明するための説明図である。音声処理装置100は、放送局102から放送波を通じて、コンテンツサーバ104から通信網106を通じて、または、記憶媒体108から直接、デジタル音声信号を取得し、そのデジタル音声信号に高周波数成分を付加することで、デジタル音声信号の音質を改善する。ユーザは、改善されたデジタル音声信号を、音声処理装置100から直接、または、ポータブルオーディオプレーヤや携帯電話といった再生装置110に転送して聴くことができる。
(Speech processor 100)
FIG. 1 is an explanatory diagram for explaining a usage state of the
また、コンテンツサーバ104が、音声処理装置100を有しても良く、その場合、コンテンツサーバ104の音声処理装置100によって、高周波数成分が付加された音声信号はパーソナルコンピュータやポータブルオーディオプレーヤ、携帯電話といった再生装置110へ、通信網106を通じて、配信される。
Further, the
また、ポータブルオーディオプレーヤ、携帯電話といった再生装置110が音声処理装置100を有しても良い。その場合、コンテンツサーバ104から通信網106を通じて配信されるデジタル音声信号は、ポータブルオーディオプレーヤ、携帯電話といった再生装置110の音声処理装置100によって、高周波数成分が付加されて再生される。
Further, the
音声処理装置100が取得可能なデジタル音声信号としては、CDやDVD(Digital Versatile Disk)規格に基づいた音声信号の他、MPEG(Moving Picture Expert Group)−2、AAC(Advanced Audio Coding)、HE−AAC(High efficiency-AAC)、ATRAC(Adaptive TRansform Acoustic Coding)、MP3(MPEG Audio Layer-3)、WMA(Windows(登録商標) Media Audio)等の音声符号化処理によって周波数帯域が狭められた音声信号も含む。ここでは、入力されるデジタル音声信号の一例として、サンプリング周波数fs=44.1kHz、量子化ビット数16ビットのデジタル音声信号(CD規格)を挙げて音声処理装置100の各機能を説明する。
Digital audio signals that can be acquired by the
図2は、音声処理装置100の概略的な構成を説明するための機能ブロック図である。音声処理装置100は、フレーム化部120と、信号分離部122と、補正信号加算部124と、残差信号加算部126と、オーバラップ合成部128とを含んで構成される。
FIG. 2 is a functional block diagram for explaining a schematic configuration of the
フレーム化部120は、音声処理装置100が取得したデジタル音声信号を、処理単位である所定のフレーム単位(所定サンプル数長)で順次切り出し、フレーム単位のデジタル音声信号(以下、単にフレーム信号という)を生成する。
The framing
図3は、フレーム化部120におけるフレーム信号の生成過程を説明するための説明図である。図3に示したように、連続する1のデジタル音声信号が入力された場合、フレーム化部120は、まず、入力されたデジタル音声信号から所定の長さで区切られる一部のデジタル音声信号Aのみを切り出してフレーム信号0を生成する。このとき、デジタル音声信号Aの前段にはデジタル音声信号が存在しないので、デジタル音声信号Aを含む所定サンプル数長のフレーム信号0は、図3のようにヌル値とデジタル音声信号Aとから形成される。また、フレーム化部120は、次のフレーム信号のため、デジタル音声信号Aの所定の位置から後尾までの所定長のデータである後部信号A’をバッファ(図示せず)に一時的に保持する。
FIG. 3 is an explanatory diagram for explaining a frame signal generation process in the
続いて、フレーム化部120は、引き続き入力されるデジタル音声信号に応じて、デジタル音声信号Bを切り出し、保持していたデジタル音声信号Aの後部信号A’とデジタル音声信号Bとをその順に接続し、所定サンプル数長のフレーム信号1を生成する。以後、フレーム化部120は、デジタル音声信号Bの後部信号B’と次に切り出したデジタル音声信号Cとでフレーム信号2を生成するといった具合にフレーム信号の生成を繰り返す。
Subsequently, the framing
したがって、フレーム化部120によって生成されたフレーム信号は、前後のフレーム信号と一部がオーバラップすることとなる。例えば、フレーム信号0とフレーム信号1とは後部信号A’に相当するデータがオーバラップする。以後の信号分離部122、補正信号加算部124、残差信号加算部126、オーバラップ合成部128では、かかるフレーム信号(フレーム単位のデジタル音声信号)に対して処理が遂行される。また、ここでは、オーバラップされる後部信号A’、B’、…の長さを、所定サンプル数長のフレーム信号に対して1/3の長さとして図示しているが、かかる場合に限らず、1/2以下の任意の数値とすることができる。
Therefore, the frame signal generated by the framing
本実施形態においては、このように生成された各フレーム信号を、後述するオーバラップ合成部128においてオーバラップさせつつ再度合成する。かかるオーバラップ部分によってデジタル音声信号の連続性を確保することが可能となり、当該実施形態に基づいて新たに生成される高周波数成分を形成する補正信号の連続性も確保される。こうして、フレーム信号を切り出すことによる端部(エッジ)の影響を回避することができ、安定した音質改善効果を得ることが可能となる。
In the present embodiment, the frame signals generated in this way are combined again while being overlapped by an
そして、フレーム化部120は、生成したフレーム信号を順次、信号分離部122に送信する。
Then, the framing
信号分離部122は、フレーム化部120から受信した所定のフレームに区切られたフレーム信号の周波数分析を行い、フレーム信号を1または複数の基本波信号と、1または複数の基本波信号を除いた残差信号とに分離する。本実施形態において、信号分離部122は、一般調和解析(GHA:Generalized Harmonic Analysis)を用いて基本波信号と残差信号とを分離する。
The
かかる一般調和解析は、周波数分析法として広く用いられている高速フーリエ変換(FFT:Fast Fourier Transform)と比較して、演算負荷は重くなるものの、(1)高速フーリエ変換よりも周波数分析精度が高い、(2)雑音を抑圧することができる、(3)分析対象となるフレーム信号以外の波形を予測することができるといった点で有利である。 Such general harmonic analysis has a higher computational load compared to Fast Fourier Transform (FFT), which is widely used as a frequency analysis method, but (1) has higher frequency analysis accuracy than Fast Fourier Transform. (2) It is advantageous in that noise can be suppressed and (3) a waveform other than the frame signal to be analyzed can be predicted.
また、高速フーリエ変換を用いてフレーム信号の周波数分析を実行すると、そのフレーム信号は、フレーム単位の周期関数として扱われるので、端部において不連続な周波数成分が生じ、原信号となるデジタル音声信号に含まれていない新たな周波数成分を検出してしまう。さらに、フレーム信号の端部の連続性を確保すべく窓関数を施すと、高速フーリエ変換の周波数分析結果が常に窓関数の影響を受けてしまう。 When the frequency analysis of the frame signal is performed using the fast Fourier transform, the frame signal is handled as a periodic function in units of frames, so that a discontinuous frequency component is generated at the end, and the digital audio signal that becomes the original signal A new frequency component not included in is detected. Furthermore, if a window function is applied to ensure the continuity of the end of the frame signal, the frequency analysis result of the fast Fourier transform is always affected by the window function.
一方、本実施形態の一般調和解析では、フレーム信号から、残差エネルギーが最小となる適切な正弦波や余弦波の組合せを導出しているので、時間分解能に依存しない高い周波数分解能で周波数分析を遂行することができる。このように信号分離部122は、一般調和解析を用いて基本波信号と残差信号とを分離することが最も望ましいが、これに限定されるわけではなく、種々の周波数分析法を用いることができる。
On the other hand, in the general harmonic analysis of this embodiment, since an appropriate combination of sine wave and cosine wave that minimizes residual energy is derived from the frame signal, frequency analysis is performed with high frequency resolution that does not depend on time resolution. Can be carried out. As described above, it is most desirable that the
信号分離部122は、このような一般調和解析に従い、まず、サンプリング周波数fsに基づいて周波数分析候補となる所定数の相異なる周波数fk(kは整数)を決定する。そして、決定された所定数の周波数fkの基本波信号bk[i](iは0〜L−1の整数、Lはフレーム信号のサンプル数)を、それぞれ単独でフレーム信号から減算して差分信号ek[i]を求め、さらにその二乗和により差分信号のエネルギーEkを導出する。
In accordance with such general harmonic analysis, the
なお、信号分離部122は、図示しないデコーダがデジタル音声信号をデコードするときに抽出したデジタル音声信号のサンプリング周波数の情報を取得して、そのサンプリング周波数に応じて周波数分析候補となる所定数の相異なる周波数fk(kは整数)を決定するようにしてもよい。ただし、CDプレーヤのように入力されるデジタル音声信号のサンプリング周波数が常に一定である再生装置に、本実施形態に係わる音声処理装置100を用いる場合、信号分離部122は、必ずしもサンプリング周波数の情報を取得する必要はない。
The
図4は、周波数分析候補となる所定数の周波数の一例を示した説明図である。ここでは所定数の周波数として、その周波数の波形における極値の前後の半周期でサンプル数が同一となる周波数が選択される。本実施形態においてサンプリング周波数fsは44.1kHzであるから、極値の前後の半周期でサンプル数が同一となる周波数fkは、サンプリング周波数fsの1/2の周波数をさらに半周期のサンプル数FS(FSは整数)で分周した値fs/2/FSとなる。 FIG. 4 is an explanatory diagram showing an example of a predetermined number of frequencies that are frequency analysis candidates. Here, as the predetermined number of frequencies, a frequency having the same number of samples in a half cycle before and after the extreme value in the waveform of the frequency is selected. In this embodiment, since the sampling frequency fs is 44.1 kHz, the frequency f k in which the number of samples is the same in the half cycle before and after the extreme value is equal to half the sampling frequency fs and the number of samples in the half cycle. A value fs / 2 / FS divided by FS (FS is an integer) is obtained.
ただし、FS=1の周波数f1(22.05kHz)の周波数成分は、サンプリング定理に従って処理対象となるフレーム信号x0[i](iは0〜L−1の整数)に含まれないので、周波数fkは、図4に示すように、サンプル数FS=2、3、4、…となる周波数に限られる。本実施形態では、サンプル数FS=2、3、4、…、10の相異なる9つの周波数f2〜f10を周波数分析候補とする。周波数fkを極値の前後の半周期でサンプル数が同一となる周波数とした理由は後ほど述べる。 However, since the frequency component of the frequency f 1 (22.05 kHz) of FS = 1 is not included in the frame signal x 0 [i] (i is an integer of 0 to L−1) to be processed according to the sampling theorem, As shown in FIG. 4, the frequency f k is limited to the frequency at which the number of samples FS = 2, 3, 4,. In this embodiment, nine different frequencies f 2 to f 10 with the number of samples FS = 2, 3, 4,. The reason why the frequency fk is set to the frequency at which the number of samples is the same in the half cycle before and after the extreme value will be described later.
また、周波数fkの基本波信号bk[i]は、数式1で表すことができる。ただし、iは0〜L−1、kは2、3、4、…、10である。
信号分離部122は、図4に示した周波数をFSの小さい順に選択し、処理対象となるフレーム信号x0[i]に対する基本波信号bk[i]の正弦波の振幅S(fk)を数式2を用いて導出し、余弦波の振幅C(fk)を数式3を用いて導出する。ただし、kは2、3、4、…、10である。
このようにして導出された振幅S(fk)と振幅C(fk)とを数式1に代入して基本波信号bk[i]を求め、処理対象となるフレーム信号x0[i]から、その基本波信号bk[i]を、数式4のようにそれぞれ個別に減算して差分信号ek[i]を求める。
そして、差分信号ek[i]のエネルギーEkを、数式5のように二乗和により導出し、その周波数fkに関連付けて一時的に保持する。
ここでは、導出された所定数の差分信号ek[i]のエネルギーEkが小さいほど、その周波数fkの基本波信号bk[i]が、処理対象となるフレーム信号x0[i]に含まれる占有率(度合い)が高いことを表す。信号分離部122は、このような差分信号ek[i]のエネルギーEkを図4に示すfs/2/FS(FS=2、3、4、…10)の9つの周波数fkすべてに関して計算する。
Here, as the energy E k of the predetermined number of derived difference signals e k [i] is smaller, the fundamental signal b k [i] of the frequency f k is the frame signal x 0 [i] to be processed. It represents that the occupation rate (degree) included in is high. The
このような差分信号ek[i]のエネルギーEkを個々に求めたのは、1または複数の基本波信号bk[i]すべてを除いた最終的な残差信号を最小にするためには、一般調和解析の下、フレーム信号x0[i]から占有率が高い基本波信号bk[i]を優先して分離する必要があるからである。したがって、信号分離部122は、差分エネルギーEkが小さい順、すなわち基本波信号bk[i]における占有率が高い順に9つの周波数fkを並び替える。
The reason why the energy E k of the differential signal e k [i] is individually determined is to minimize the final residual signal except for all of the one or more fundamental wave signals b k [i]. This is because, under general harmonic analysis, it is necessary to preferentially separate the fundamental wave signal b k [i] having a high occupation rate from the frame signal x 0 [i]. Therefore, the
続いて、信号分離部122は、その9つの周波数fkに対応する9つの基本波信号bk[i]を、並び替えられた周波数fkの順に、原信号であるフレーム信号x0[i]から順次減算する。ただし、上述した差分信号ek[i]を導出する工程では、毎回、原信号であるフレーム信号x0[i]から改めて基本波信号bk[i]を減算したのに対し、ここでは、フレーム信号x0[i]から1の基本波信号bk[i]を減算すると、その減算した後の残差信号d[i]に対して、次の基本波信号bk[i]の振幅S(fk)および振幅C(fk)を数式2、3を用いて改めて導出し、その基本波信号bk[i]を減算していく。したがって、減算する順番によっては基本波信号bk[i]の振幅S(fk)および振幅C(fk)が変化する。並び替えに用いた基本波信号bk[i]と当該フレーム信号x0[i]から順次減算する基本波信号bk[i]とは所定の周波数fkを有する正弦波と余弦波で表されることで共通し、その正弦波と余弦波の振幅のみが異なる。並び替えに用いた基本波信号bk[i]は並び替えが完了すると用いられることはなくなり、振幅S(fk)および振幅C(fk)が変化した基本波信号bk[i]が最終的な基本波信号bk[i]として以後の処理でも用いられる。このような基本波信号bk[i]の減算を経て残差信号d[i]が導出される。したがって、残差信号d[i]は、数式6のように表すことができる。ただし、iは0〜L−1、kは2、3、4、…、10である。
こうしてフレーム信号x0[i]から占有率が高い基本波信号bk[i]が順次分離され、残差信号d[i]のエネルギーは漸減する。 In this way, the fundamental signal b k [i] having a high occupation rate is sequentially separated from the frame signal x 0 [i], and the energy of the residual signal d [i] is gradually reduced.
このように、フレーム信号x0[i]における占有率が高い基本波信号bk[i]から優先して分離する構成により、フレーム信号x0[i]を1または複数の基本波信号bk[i]の組合せで適切に表すことができ、かつ、残差信号d[i]を最小限に抑えることが可能となる。 Thus, the frame signal x 0 by the configuration which separates preferentially from the fundamental wave signal is high occupancy b k [i] in the [i], a frame signal x 0 [i] one or more of the fundamental wave signal b k The combination of [i] can be appropriately expressed, and the residual signal d [i] can be minimized.
ここで、周波数分析候補となる所定数(ここでは9つ)の周波数fkは、サンプリング周波数fs(例えば44.1kHz)に対して図4の如く一義的に求まるので、サンプリング周波数fsに応じて、所定数の周波数fkと基本波信号bk[i]とを一意に対応付けた基本波テーブルを予め作成しておくこともできる。ただし、基本波テーブルでは、振幅S(fk)や振幅C(fk)を所定値(例えば1)とした場合の各サンプルiにおける正弦波および余弦波の値までが示されるに留まり、信号分離部122は、振幅S(fk)や振幅C(fk)を乗じて基本波信号bk[i]を導出することとなる。かかる基本波テーブルによって、演算負荷の軽減を図ることが可能となる。かかる基本波テーブルは図示しないメモリに保持されてもよく、通信網106から取得するとしてもよい。
Here, since a predetermined number (here, 9) of frequencies fk as frequency analysis candidates are uniquely obtained as shown in FIG. 4 with respect to the sampling frequency fs (for example, 44.1 kHz), the frequency fk is determined according to the sampling frequency fs. A fundamental wave table in which a predetermined number of frequencies f k and fundamental wave signals b k [i] are uniquely associated can be created in advance. However, the fundamental wave table only shows the values of the sine wave and cosine wave in each sample i when the amplitude S (f k ) and the amplitude C (f k ) are set to predetermined values (for example, 1). The separating
信号分離部122は、引き続き並び替えられた順に基本波信号bk[i]を減算していき、周波数分析候補として準備されたすべての周波数fkに関する基本波信号bk[i]を減算し終わると、その残差信号d[i]を最終的な残差信号として残差信号加算部126に送信する。
ここで、周波数分析候補として準備されたすべての周波数fkに関する基本波信号bk[i]を減算していなくとも、その残差信号d[i]のエネルギーが十分に小さくなっていれば、例えば、残差信号d[i]が所定のエネルギー以下となれば、フレーム信号x0[i]を十分に分離できたとして、その時点で基本波信号bk[i]の分離を停止し、残差信号d[i]を残差信号加算部126に送信する。
Here, even if the fundamental signal b k [i] for all the frequencies f k prepared as frequency analysis candidates is not subtracted, if the energy of the residual signal d [i] is sufficiently small, For example, if the residual signal d [i] is equal to or lower than a predetermined energy, the separation of the fundamental signal b k [i] is stopped at that time, assuming that the frame signal x 0 [i] can be sufficiently separated. Residual signal d [i] is transmitted to residual
このとき、基本波信号bk[i]は、それぞれ、所定の周波数と、所定の周波数を有する正弦波の振幅と、余弦波の振幅とで表される信号なので、信号分離部122は、基本波信号bk[i]そのものではなく、基本波信号bk[i]の周波数を示す周波数情報と、正弦波成分の振幅情報と、余弦波成分の振幅情報といったパラメータと、基本波信号bk[i]の個数情報とを補正信号加算部124に送信する。かかる構成により、信号分離部122と補正信号加算部124とのアクセス負荷を著しく軽減することができる。
At this time, the fundamental wave signal b k [i] is a signal represented by a predetermined frequency, an amplitude of a sine wave having a predetermined frequency, and an amplitude of a cosine wave. Not the wave signal b k [i] itself, but parameters such as frequency information indicating the frequency of the fundamental wave signal b k [i], amplitude information of the sine wave component, amplitude information of the cosine wave component, and the fundamental wave signal b k. The number information of [i] is transmitted to the correction
また、信号分離部122は、数式6に示すように、フレーム信号x0[i]から対象となる基本波信号bk[i]をすべて除いた残差信号d[i]を残差信号加算部126に送信する。
Further, as shown in
本実施形態においては、後述するように基本波信号bk[i]のみに音質改善処理が施され、残差信号d[i]には施されない。しかし、残差信号d[i]はエネルギー量としても無視可能な信号なので、残差信号d[i]に音質改善処理を施さなくとも、原信号であるフレーム信号x0[i]の音質改善レベルに影響はなく、むしろ残差信号d[i]に音質改善処理を施す処理負荷を他の処理に有効活用できる。 In the present embodiment, as will be described later, only the fundamental wave signal b k [i] is subjected to the sound quality improvement process, and is not applied to the residual signal d [i]. However, since the residual signal d [i] is a signal that can be ignored as the amount of energy, the sound quality of the frame signal x 0 [i] that is the original signal is improved without performing the sound quality improvement process on the residual signal d [i]. There is no effect on the level, but rather the processing load for applying the sound quality improvement processing to the residual signal d [i] can be effectively utilized for other processing.
また、図4で示したように、基本波信号bk[i]の周波数fkを、極値の前後の半周期でサンプル数が同一となる周波数fk=fs/2/FSとすることで、残差信号d[i]を除いたフレーム信号x0[i](1または複数の基本波信号bk[i])を極値の前後の半周期でサンプル数が同一となる正弦波および余弦波で表すことができ、同一の正弦波や余弦波において、乗算する係数や加減算対象となるサンプル位置が異なるといった問題がなくなる。さらに、基本波信号bk[i]は、初期位相0の正弦波および余弦波のみで形成されるため、フレーム信号x0[i]に対して補正信号を画一的に付加することができるので、音質改善の均一化を図ることが可能となる。
Further, as shown in FIG. 4, the frequency f k of the fundamental wave signal b k [i] is set to a frequency f k = fs / 2 / FS at which the number of samples is the same in a half cycle before and after the extreme value. Thus, the sine wave having the same number of samples in the half period before and after the extreme value of the frame signal x 0 [i] (one or more fundamental wave signals b k [i]) excluding the residual signal d [i]. In the same sine wave or cosine wave, there is no problem that the coefficient to be multiplied or the sample position to be added or subtracted is different. Furthermore, since the fundamental wave signal b k [i] is formed only by a sine wave and a cosine wave having an
補正信号加算部124は、信号分離部122が分離した1または複数の基本波信号それぞれに対し、音圧0を中心とした振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する。
The correction
図5は、補正信号加算部124のさらに具体的な構成を説明するための機能ブロック図であり、図6は、サンプル数と係数との関係を示した係数テーブルであり、図7および図8は、補正信号加算部124による音質改善処理の動作を説明するための説明図である。補正信号加算部124は、極値特定部150と、サンプル数計数部152と、補正信号生成部154と、遅延部156と、加算部158とを含んで構成される。また、係数テーブルは図示しないメモリに保持されてもよく、通信網106から取得するとしてもよい。ここで、まず、補正信号加算部124で実行される音質改善処理の基本的動作を説明する。
FIG. 5 is a functional block diagram for explaining a more specific configuration of the correction
極値特定部150は、補正信号加算部124が受信したフレーム信号x0[i](1または複数の基本波信号bk[i])の極大値と極小値とを特定する。具体的に、極値特定部150は、フレーム信号x0[i]の各サンプルにおける値を順次比較し、値が増加している状態または増減無しの状態から減少に転じたとき、その減少に転じる直前のサンプルにおける値を極大値とし、値が減少している状態または増減無しの状態から増加に転じたとき、その増加に転じる直前のサンプルにおける値を極小値とする。
The extreme
サンプル数計数部152は、任意の極値(極大値または極小値)から次の極値までのサンプル数、すなわち、極大値から極小値まで、または極小値から極大値までのサンプル数を計数する。
The sample
補正信号生成部154は、フレーム信号x0[i]における所定のサンプル間の変化量と1の係数とを乗じてデジタル音声信号の振幅の絶対値が拡大されるような補正値を生成し、所定のサンプル位置に配して補正信号を生成する。
The correction
例えば、図7の例では、補正信号生成部154は、図6の係数テーブルを参照し、図7(a)に示すフレーム信号x0[i]に基づきサンプル数計数部152が計数した極大値から極小値まで、または極小値から極大値までの極値間のサンプル数、例えば「4」に対応した、係数「0.5」を抽出する。
For example, in the example of FIG. 7, the correction
ここで、図6の係数テーブルにおいて、サンプル数が多いほど係数の値が小さいのは以下の理由からである。すなわち、任意の極値から次の極値までのサンプル数が多い場合、そのフレーム信号x0[i]の周波数は低く、例えば22.1kHzの低域通過フィルタ(LPF:Low Pass Filter)でフィルタリングが施されている場合であっても、その低周波数のフレーム信号x0[i]の高調波は抑制されずに残る。したがって、大きな高周波数成分を付加しなくとも十分に高音質を維持できるので、係数は小さくて済む。 Here, in the coefficient table of FIG. 6, the larger the number of samples, the smaller the coefficient value is for the following reason. That is, when the number of samples from an arbitrary extreme value to the next extreme value is large, the frequency of the frame signal x 0 [i] is low, for example, filtering with a 22.1 kHz low pass filter (LPF). Is applied, harmonics of the low-frequency frame signal x 0 [i] remain without being suppressed. Therefore, a sufficiently high sound quality can be maintained without adding a large high-frequency component, and the coefficient can be small.
一方、任意の極値から次の極値までのサンプル数が少ない場合、そのフレーム信号x0[i]の周波数は高く、例えば22.1kHzの低域通過フィルタでフィルタリングが施されている場合に、その高周波数のフレーム信号x0[i]の高調波はほとんど削減されている。したがって、高周波数成分を十分に付加しないと音質の改善を図ることができないので、係数は大きい必要がある。 On the other hand, when the number of samples from an arbitrary extreme value to the next extreme value is small, the frequency of the frame signal x 0 [i] is high, for example, when filtering is performed by a low-pass filter of 22.1 kHz. The harmonics of the high-frequency frame signal x 0 [i] are almost reduced. Therefore, the sound quality cannot be improved unless sufficient high-frequency components are added, so the coefficient needs to be large.
続いて、補正信号生成部154は、図7(a)に示すフレーム信号x0[i]の極大値と1サンプリング前のサンプル値との差分値dlに、係数テーブルから抽出した0.5を乗算した乗算結果Δdlを極大値のサンプル位置に配し、フレーム信号の極小値と1サンプリング前のサンプル値との差分値dsに0.5を乗算した乗算結果Δdsを極小値のサンプル位置に配して図7(b)に示す補正信号co[i]を生成する。
Subsequently, the correction
また、ここでは、乗算結果Δdl、Δdsを極大値や極小値のサンプル位置に加減算するような補正信号が生成されているが、加減算対象となるサンプル位置は、かかる場合に限らず、例えば、極大値や極小値の前後所定数のサンプル位置に加減算することもできる。 Further, here, a correction signal for adding and subtracting the multiplication results Δdl and Δds to and from the sample position of the maximum value or the minimum value is generated. However, the sample position to be added or subtracted is not limited to this, for example, the maximum It is also possible to add / subtract to a predetermined number of sample positions before and after the value or minimum value.
例えば、補正信号生成部154は、図8(a)に示すフレーム信号x0[i]の極大値と1サンプリング前のサンプル値との差分値dlに、係数テーブルから抽出した0.5を乗算した乗算結果Δdlを極大値の前後1のサンプル位置に配し、フレーム信号の極小値と1サンプリング前のサンプル値との差分値dsに0.5を乗算した乗算結果Δdsを極小値の前後1のサンプル位置に配して図8(b)に示す補正信号co[i]を生成する。また、極大値や極小値のサンプル位置と極大値や極小値の前後所定数のサンプル位置にそれぞれ乗算結果Δdl、Δdsを配して、図7(b)と図8(b)とを合成した補正信号を生成することも可能である。
For example, the correction
このように、特定の高周波数成分を付加するための複雑な計算を伴うことなく、任意のサンプル位置における振幅の絶対値を大きくするといった単純な処理で高周波数成分を付加する構成により、処理負荷を軽減しつつ音質の改善を図ることが可能となる。 In this way, the processing load is increased by a simple process of increasing the absolute value of the amplitude at an arbitrary sample position without complicated calculation for adding a specific high frequency component. It is possible to improve sound quality while reducing noise.
遅延部156は、原信号となるフレーム信号x0[i]を、極値特定部150、サンプル数計数部152、補正信号生成部154での処理時間分だけ遅延させ、図7(a)と図7(b)や図8(a)と図8(b)のようにフレーム信号x0[i]と補正信号co[i]とを同期させる。
The
加算部158は、例えば図7(a)および図8(a)に示されるフレーム信号x0[i]に、図7(b)および図8(b)に示される補正信号co[i]を加算して、図7(c)および図8(c)に示すような音質改善処理が施されたフレーム信号x0’[i]を生成する。本実施形態においては、このような矩形波に近くなるように補正信号を付加することで高周波数成分を拡張し、音質の改善を図ることができる。
For example, the
しかし、このような音質改善処理を無作為に実行すると、フレーム信号x0[i]に含まれる各信号の周波数とサンプリング周波数fsとが所定の関係を有さないので、仮に、フレーム信号x0[i]が規則的な正弦波のみから形成されていたとしても、その周波数がサンプリング周波数fsと異なれば、極小値から極大値までのサンプル数と極大値から極小値までのサンプル数とが異なり、乗算する係数や加減算対象となるサンプル位置が半周期毎に異なり音質改善処理が偏ることとなる。例えば、フレーム信号x0[i]の全周期のサンプル数が「7」である場合、半周期のいずれか一方のサンプル数が「4」となり、他方が「3」となってしまい、その補正量もサンプル数に応じて偏る。 However, running such a sound quality improvement process at random, since the frequency and the sampling frequency fs of the signal included in the frame signal x 0 [i] does not have a predetermined relationship, if the frame signal x 0 Even if [i] is formed only from a regular sine wave, if the frequency is different from the sampling frequency fs, the number of samples from the minimum value to the maximum value differs from the number of samples from the maximum value to the minimum value. Therefore, the coefficient to be multiplied and the sample position to be added / subtracted differ every half cycle, and the sound quality improvement processing is biased. For example, when the number of samples in the entire period of the frame signal x 0 [i] is “7”, the number of samples in one of the half periods is “4” and the other is “3”. The amount also depends on the number of samples.
本実施形態においては、上述したように、音質改善処理の対象を、フレーム信号x0[i]ではなく、そのフレーム信号x0[i]に含まれる、極値の前後の半周期でサンプル数が同一となる周波数に基づく基本波信号bk[i]としているので、画一的かつ均一に音声改善処理を施すことができる。 In the present embodiment, as described above, the target of the sound quality improvement process is not the frame signal x 0 [i], but the number of samples in the half cycle before and after the extreme value included in the frame signal x 0 [i]. Since the fundamental wave signals b k [i] are based on the same frequency, the sound improvement processing can be performed uniformly and uniformly.
例えば、本実施形態における補正信号加算部124に入力される1または複数の基本波信号bk[i]の1の基本波信号bk[i]を例に挙げると、上述した極値特定部150が特定すべき極大値と極小値の値は、基本波信号bk[i]の正弦波成分および余弦波成分それぞれの振幅情報から特定でき、極大値と極小値のサンプル位置は、基本波信号bk[i]の周波数を示す周波数情報から特定できる。
For example, taking the first fundamental signal b k [i] of one or more of the fundamental wave signal b k to be inputted to the correction
また、サンプル数計数部152が特定すべきサンプル数も、周波数情報から図4を参照して一意に決定することができる。したがって、補正信号生成部154が生成すべき補正信号も、基本波信号bk[i]の各情報から一意に導き出すことが可能となる。
Also, the number of samples to be specified by the sample
上述したように、基本波信号bk[i]は、サンプリング周波数fsの1/2を整数で分周した所定数の周波数fkのみで形成される。したがって、極値の前後の半周期でサンプル数が同一となるばかりでなく、正弦波や余弦波の開始点および終了点がサンプル点に位置することとなる。そうすると、補正信号加算部124は、画一的な補正値を付加するだけといった単純処理によって補正信号を生成できる。
As described above, the fundamental wave signal b k [i] is formed with only a predetermined number of frequencies f k obtained by dividing 1/2 of the sampling frequency fs by an integer. Accordingly, not only the number of samples is the same in the half cycle before and after the extreme value, but also the start and end points of the sine wave and cosine wave are located at the sample points. Then, the correction
図9は、本実施形態の補正信号加算部124における音質改善処理を説明するための説明図である。例えば、図9(a)に示す正弦波sin[i]の音質改善処理では、極大値と極小値が、その周波数fkから求まるサンプル数FS(ここでは4)毎に出現し、同様に、図9(b)に示す余弦波cos[i]の補正でも、極大値と極小値がサンプル数FS毎に出現する。また、サンプル数FSに応じて、加減算対象となるサンプル位置および係数も定まる。さらに、その振幅に応じて、加減算される値も一意に求まる。そうすると、当該正弦波sin[i]や余弦波cos[i]に対する補正信号が基本波信号bk[i]の各情報から一意に導き出される。したがって、補正信号加算部124は、基本波信号それぞれの周波数fkと正弦波sin[i]の振幅と余弦波cos[i]の振幅とに応じて、図9(a)や図9(b)のように、音質改善処理を画一的に施すことが可能となる。
FIG. 9 is an explanatory diagram for explaining the sound quality improvement processing in the correction
ここでは、サンプル数FSが偶数の場合を説明したが、サンプル数FSが奇数の場合も同様に画一的な補正信号を生成することができる。 Although the case where the sample number FS is an even number has been described here, a uniform correction signal can be generated in the same manner when the sample number FS is an odd number.
また、正弦波および余弦波の各サンプル位置における補正信号co[i]の値は、基本波信号bk[i]の周波数fkに対して一義的に求まるので、補正信号加算部124は、基本波信号bk[i]の周波数fkと、振幅が1である正弦波および余弦波の各サンプル位置における補正信号co[i]の値とが対応付けられた補正テーブルを予め作成しておくこともできる。かかる補正テーブルは図示しないメモリに保持されてもよく、通信網106から取得するとしてもよい。そして、補正信号加算部124は、補正テーブルを参照し、1または複数の基本波信号bk[i]それぞれの周波数fkに応じて振幅が1である正弦波および余弦波の各サンプル位置における補正信号co[i]の値を抽出し、1または複数の基本波信号bk[i]それぞれの正弦波の振幅と余弦波の振幅とを乗じて補正信号co[i]を生成する。
Further, since the value of the correction signal co [i] at each sample position of the sine wave and cosine wave is uniquely determined with respect to the frequency f k of the fundamental wave signal b k [i], the correction signal adding unit 124 A correction table in which the frequency f k of the fundamental wave signal b k [i] and the value of the correction signal co [i] at each sample position of the sine wave and cosine wave having an amplitude of 1 is created in advance It can also be left. Such a correction table may be held in a memory (not shown) or may be acquired from the
さらに、基本波信号に含まれる正弦波や余弦波と補正信号とが比例関係にあるので、正弦波や余弦波と補正信号とを予め加算した信号とを対応付けてテーブルを作成することも可能である。 Furthermore, since the sine wave or cosine wave included in the fundamental wave signal is proportional to the correction signal, it is possible to create a table by associating the sine wave or cosine wave with the signal obtained by adding the correction signal in advance. It is.
かかる残差信号d[i]を除く基本波信号bk[i]のみに対して補正信号co[i]を生成する構成により、補正信号co[i]を生成する際の処理負荷を著しく軽減することが可能となり、プログラムの簡素化を図ったり、処理能力の低い安価な処理装置を採用してコストの削減を図ることができる。 The processing load when generating the correction signal co [i] is significantly reduced by the configuration in which the correction signal co [i] is generated only for the fundamental wave signal b k [i] excluding the residual signal d [i]. Therefore, the program can be simplified, and the cost can be reduced by using an inexpensive processing apparatus having a low processing capability.
また、すべての基本波信号bk[i]に対して、適切なサンプル位置に適切な係数を乗じた乗算結果を均等に加減算することが可能となり、また、フレーム信号の変化に拘わらず、基本波信号bk[i]の同じサンプル位置に振幅に比例する同じ補正値を加えることができるので、偏りのない高周波数信号を付加することが可能となる。このように、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。 Further, it becomes possible to add and subtract evenly the multiplication results obtained by multiplying the appropriate sample position by the appropriate coefficient with respect to all the fundamental wave signals b k [i]. Since the same correction value proportional to the amplitude can be added to the same sample position of the wave signal b k [i], it is possible to add a high-frequency signal without bias. As described above, the sound quality improvement can be made uniform by performing the sound improvement process uniformly on each signal included in the digital sound signal.
残差信号加算部126は、補正信号加算部124によって補正信号co[i]が加減算された1または複数の基本波信号bk[i](フレーム信号x0’[i])と、信号分離部122で分離された残差信号d[i]とを加算して、フレーム信号を再構成する。したがって、再構成されたフレーム信号x0”[i]は、数式7のようになる。ただし、数式7中のδs[i]および、δc[i]はそれぞれ振幅1の正弦波と余弦波に対する変位量を表し、iは0〜L−1、kは2、3、4、…、10である。
オーバラップ合成部128は、残差信号加算部126において再構成されたフレーム信号と、1つ前のフレーム信号とを(隣り合うフレーム同士を)、デジタル音声信号の一部がオーバラップするように合成し、最終の出力信号を生成する。
The
図10は、オーバラップ合成部128の動作を説明するための説明図である。図10中フレーム信号は、フレーム化部120によって生成された後、信号分離部122、補正信号加算部124および残差信号加算部126を経由した信号であり、A、B、Cの英数字は、図3のデジタル音声信号A、B、Cに対応している。
FIG. 10 is an explanatory diagram for explaining the operation of the
具体的に、オーバラップ合成部128は、まず、再構成されたフレーム信号x0”[i](フレーム信号0、フレーム信号1、フレーム信号2、…)に対して図10に示す窓関数Wを乗じる。フレーム化部120において既に正弦波窓による窓関数が施されている場合、オーバラップ合成部128においも正弦波窓による窓関数を採用する。また、フレーム化部120において窓関数が採用されていない場合、ハニング窓やブラックマン窓を採用する。窓関数はかかる場合に限られず、2つのフレーム信号がオーバラップしたとき、そのオーバラップ部分が合成してオーバラップしない部分と等しくなれば、既存の様々な窓関数を採用することができる。
Specifically, the
図10におけるフレーム信号1が入力されたときには、既にフレーム信号0のデジタル音声信号Aが保持されており、オーバラップ合成部128は、フレーム信号0のデジタル音声信号Aと、フレーム信号1の後部信号A’とがオーバラップするように、デジタル音声信号Aと後部信号A’を加算して合成信号A”を生成する。同時にオーバラップ合成部128は、フレーム信号1のデジタル音声信号Bを次回の加算処理のため一次的に保持する。そして、周波数時間変換部146からフレーム信号2が入力されると、オーバラップ合成部128は、フレーム信号1のとき同様、フレーム信号1のデジタル音声信号Bと、フレーム信号2の後部信号B’とをオーバラップするように加算して合成信号B”を生成する。オーバラップ合成部128は、このようにして生成された合成信号A”、B”、C”、…を接続して随時出力する。
When the
(音声処理プログラム)
また、上述した音声処理装置100は、コンピュータを用いて実現することができる。
(Speech processing program)
Further, the above-described
図11は、音声処理装置100として、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理することが可能なコンピュータ(情報処理装置)200の典型例を示した機能ブロック図である。コンピュータ200は、中央処理装置210と、一時記憶装置212と、外部記憶装置214と、入力部216と、出力部218とを含んで構成される。
FIG. 11 is a functional block diagram showing a typical example of a computer (information processing apparatus) 200 that can analyze a digital audio signal and process the digital audio signal using the analysis result as the
中央処理装置(CPU)210は、一時記憶装置212や外部記憶装置214のプログラムやアプリケーションによりコンピュータ200全体を制御する。一時記憶装置212は、RAM、EEPROM、不揮発性RAM等から構成され、中央処理装置210で処理されるデジタル音声信号等を一時的に記憶する。外部記憶装置214は、フラッシュメモリ、HDD等で構成され、中央処理装置210で処理されるプログラムを記憶する。入力部216は、放送局102から放送波を通じて、コンテンツサーバ104から通信網106を通じて、または、記憶媒体108から直接、デジタル音声信号を入力し、一時記憶装置212に送信する。出力部218は、当該コンピュータ200によって生成された出力信号を再生装置110に転送する。
A central processing unit (CPU) 210 controls the
上述した音質改善処理は、中央処理装置210がプログラムを実行することによって為される。したがって、音声処理装置100が提供されると同時に、コンピュータ200に、デジタル音声信号の周波数分析を行い、デジタル音声信号を1または複数の基本波信号と1または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号生成ステップと、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する残差信号加算ステップと、を実行させる音声処理プログラムも提供される。また、このプログラムは、記憶媒体から読みとられてコンピュータに取り込まれてもよいし、通信網106を介してコンピュータ200に取り込まれてもよい。
The sound quality improvement process described above is performed by the
(音声処理方法)
次に、上述した音声処理装置100を用いてデジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理方法を説明する。
(Audio processing method)
Next, a speech processing method for analyzing a digital speech signal using the
図12は、音声分析合成方法の全体的な流れを示したフローチャートである。音声処理装置100のフレーム化部120は、音声処理装置100が取得したデジタル音声信号を、所定のフレーム単位(所定サンプル数長)で順次切り出し、フレーム信号を生成する(S300)。
FIG. 12 is a flowchart showing the overall flow of the speech analysis / synthesis method. The framing
続いて、信号分離部122は、一般調和解析に基づき、フレーム信号の周波数分析を行い、所定数の相異なる周波数fkの所定数の基本波信号bk[i]を、それぞれ単独でフレーム信号から減算して差分信号ek[i]を求める(S302)。信号分離部122は、所定数の周波数fkすべてに関して処理が遂行されたか否か判断し(S304)、すべてに関して遂行されていない場合(S304のNO)、差分信号導出ステップS302を繰り返す。
Subsequently, the
所定数の周波数fkすべてに関して遂行されると(S304のYES)、差分信号のエネルギーEkが小さい順に9つの周波数fkを並び替える(S306)。そして、信号分離部122は、すべての周波数fkに関する基本波信号bk[i]が減算されるか、または、残差信号d[i]が所定のエネルギー以下となるまで(S308のNO)、その9つの周波数fkに対応する9つの基本波信号bk[i]を、並び替えられた周波数fkの順に、フレーム信号x0[i]から順次減算し、残差信号d[i]を導出する(S310)。こうして、信号分離部122は、デジタル音声信号を1または複数の基本波信号bk[i]と残差信号d[i]とに分離することができる。
Once accomplished for all frequencies f k of a predetermined number (YES in S304), rearranges the nine frequencies f k energy E k is the ascending order of the difference signal (S306). Then, the
そして、補正信号加算部124は、1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算し(S312)、残差信号加算部126は、補正信号がそれぞれ加算された1または複数の基本波信号に残差信号を加算する(S314)。
Then, the correction
最後に、オーバラップ合成部128は、残差信号加算部126において再構成されたフレーム信号と、1つ前のフレーム信号とを、一部がオーバラップするように合成し、最終の出力信号を生成する(S316)。
Finally, the
以上説明した音声処理方法によってもデジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。 Even with the audio processing method described above, it is possible to uniformly improve the sound quality by uniformly performing audio improvement processing on each signal included in the digital audio signal.
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to this embodiment. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Is done.
なお、本明細書の音声処理方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。 Note that each step in the voice processing method of the present specification does not necessarily have to be processed in time series in the order described in the flowchart, and may include parallel or subroutine processing.
本発明は、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理装置、音声処理方法および音声処理プログラムに利用することができる。 The present invention can be used in an audio processing apparatus, an audio processing method, and an audio processing program that analyze a digital audio signal and process the digital audio signal using the analysis result.
100 …音声処理装置
120 …フレーム化部
122 …信号分離部
124 …補正信号加算部
126 …残差信号加算部
128 …オーバラップ合成部
200 …コンピュータ
DESCRIPTION OF
Claims (7)
前記1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算する補正信号加算部と、
前記補正信号がそれぞれ加算された前記1または複数の基本波信号に前記残差信号を加算する残差信号加算部と、
を備え、
前記1または複数の基本波信号は、相異なる周波数の複数の基本波信号であり、
前記信号分離部は、前記1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独で前記デジタル音声信号から減算した場合の差分信号を求め、前記差分信号のエネルギーが小さい順に前記デジタル音声信号から前記1または複数の基本波信号を順次減算して前記デジタル音声信号を1または複数の前記基本波信号と前記残差信号とに分離することを特徴とする音声処理装置。 A signal separation unit that performs frequency analysis of the input digital audio signal and separates the digital audio signal into one or more fundamental wave signals and a residual signal excluding the one or more fundamental wave signals;
A correction signal adding unit that generates a correction signal that increases an absolute value of an amplitude for each of the one or more fundamental wave signals and adds the correction signal to the fundamental wave signal;
A residual signal adding unit that adds the residual signal to the one or more fundamental wave signals to which the correction signals are added, and
With
The one or more fundamental wave signals are a plurality of fundamental wave signals having different frequencies,
The signal separation unit obtains a difference signal when a plurality of fundamental wave signals having the same frequency as the one or more fundamental wave signals are subtracted from the digital audio signal independently, and the difference signal has a lower energy in order An audio processing apparatus, wherein the digital audio signal is sequentially subtracted from the digital audio signal to separate the digital audio signal into one or more fundamental wave signals and the residual signal.
入力されたフレーム単位のデジタル音声信号を、隣り合うフレームのデジタル音声信号の一部がオーバラップするように合成するオーバラップ合成部と、
をさらに備え、
前記信号分離部に入力されるデジタル音声信号は前記フレーム化部で生成された所定のフレームに区切られたデジタル音声信号であり、
前記オーバラップ合成部に入力されるフレーム単位のデジタル音声信号は前記残差信号加算部から入力されることを特徴とする請求項1に記載の音声処理装置。 A framing unit that cuts out a digital audio signal in units of a predetermined frame and generates a digital audio signal for each predetermined frame;
An overlap synthesizing unit that synthesizes the input digital audio signal in units of frames so that part of the digital audio signals of adjacent frames overlap;
Further comprising
The digital audio signal input to the signal separation unit is a digital audio signal divided into predetermined frames generated by the framing unit,
The audio processing apparatus according to claim 1, wherein the digital audio signal in units of frames input to the overlap synthesis unit is input from the residual signal addition unit.
前記基本波信号の周波数と、振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値とが予め対応付けられた補正テーブルを参照し、
前記1または複数の基本波信号それぞれの周波数に応じて前記振幅が1である正弦波および余弦波の各サンプル位置における補正信号の値を抽出し、前記1または複数の基本波信号それぞれの正弦波の振幅と余弦波の振幅とを乗じて前記補正信号を生成することを特徴とする請求項4に記載の音声処理装置。 The correction signal adding unit is
Refer to the correction table in which the frequency of the fundamental wave signal and the value of the correction signal at each sample position of the sine wave and cosine wave having an amplitude of 1 are associated in advance,
The value of the correction signal at each sample position of the sine wave and cosine wave having the amplitude of 1 is extracted according to the frequency of each of the one or more fundamental wave signals, and the sine wave of each of the one or more fundamental wave signals The sound processing apparatus according to claim 4, wherein the correction signal is generated by multiplying the amplitude of the cosine wave and the amplitude of the cosine wave.
前記1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算し、
前記補正信号がそれぞれ加算された前記1または複数の基本波信号に前記残差信号を加算することを特徴とする音声処理方法。 Analyzing the frequency of the input digital audio signal, obtaining a differential signal when subtracting a plurality of fundamental signals having the same frequency as one or a plurality of fundamental signals having different frequencies from the digital audio signal, The one or more fundamental wave signals are sequentially subtracted from the digital audio signal in ascending order of energy of the difference signal to remove the one or more fundamental wave signals and the one or more fundamental wave signals from the digital audio signal. Separated into residual signals,
For each of the one or more fundamental wave signals, a correction signal that increases the absolute value of the amplitude is generated and added to the fundamental wave signal,
An audio processing method, wherein the residual signal is added to the one or more fundamental wave signals to which the correction signals are added.
入力されたデジタル音声信号の周波数分析を行い、周波数が相異なる1または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独で前記デジタル音声信号から減算した場合の差分信号を求め、前記差分信号のエネルギーが小さい順に前記デジタル音声信号から前記1または複数の基本波信号を順次減算して前記デジタル音声信号を前記1または複数の基本波信号と前記1または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、
前記1または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算する補正信号生成ステップと、
前記補正信号がそれぞれ加算された前記1または複数の基本波信号に前記残差信号を加算する残差信号加算ステップと、
を実行させることを特徴とする音声処理プログラム。 On the computer,
Analyzing the frequency of the input digital audio signal, obtaining a differential signal when subtracting a plurality of fundamental signals having the same frequency as one or a plurality of fundamental signals having different frequencies from the digital audio signal, The one or more fundamental wave signals are sequentially subtracted from the digital audio signal in ascending order of energy of the difference signal to remove the one or more fundamental wave signals and the one or more fundamental wave signals from the digital audio signal. A signal separation step for separating into a residual signal,
A correction signal generation step of generating a correction signal that increases an absolute value of an amplitude for each of the one or more fundamental wave signals and adding the correction signal to the fundamental wave signal;
A residual signal adding step of adding the residual signal to the one or more fundamental wave signals to which the correction signals are respectively added;
A voice processing program characterized by causing
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009291156A JP5392057B2 (en) | 2009-12-22 | 2009-12-22 | Audio processing apparatus, audio processing method, and audio processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009291156A JP5392057B2 (en) | 2009-12-22 | 2009-12-22 | Audio processing apparatus, audio processing method, and audio processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011133568A JP2011133568A (en) | 2011-07-07 |
JP5392057B2 true JP5392057B2 (en) | 2014-01-22 |
Family
ID=44346395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009291156A Active JP5392057B2 (en) | 2009-12-22 | 2009-12-22 | Audio processing apparatus, audio processing method, and audio processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5392057B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6844504B2 (en) * | 2017-11-07 | 2021-03-17 | 株式会社Jvcケンウッド | Digital audio processing equipment, digital audio processing methods, and digital audio processing programs |
JP7251400B2 (en) * | 2019-08-08 | 2023-04-04 | 株式会社Jvcケンウッド | DIGITAL SOUND PROCESSING DEVICE, DIGITAL SOUND PROCESSING METHOD, AND DIGITAL SOUND PROCESSING PROGRAM |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3401171B2 (en) * | 1997-10-22 | 2003-04-28 | 日本ビクター株式会社 | Audio information processing method, audio information processing apparatus, and audio information recording method on recording medium |
JP2000268510A (en) * | 1999-03-19 | 2000-09-29 | Victor Co Of Japan Ltd | Encoder |
EP1343143B1 (en) * | 2000-12-14 | 2011-10-05 | Sony Corporation | Analysis-synthesis of audio signal |
JP3659489B2 (en) * | 2000-12-20 | 2005-06-15 | 日本ビクター株式会社 | Digital audio processing apparatus and computer program recording medium |
JP2003084799A (en) * | 2001-09-17 | 2003-03-19 | Dainippon Printing Co Ltd | Frequency analysis method and sound signal encoding method |
JP4123486B2 (en) * | 2006-10-02 | 2008-07-23 | 日本ビクター株式会社 | Digital audio processing method, digital audio processing apparatus, and computer program |
JP2008089983A (en) * | 2006-10-02 | 2008-04-17 | Victor Co Of Japan Ltd | Encoding apparatus |
JP5023812B2 (en) * | 2007-05-30 | 2012-09-12 | 株式会社Jvcケンウッド | Digital audio processing apparatus and digital audio processing program |
-
2009
- 2009-12-22 JP JP2009291156A patent/JP5392057B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011133568A (en) | 2011-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101971252B (en) | Device and method for manipulating an audio signal having a transient event | |
US9111526B2 (en) | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal | |
CA2779388C (en) | Sbr bitstream parameter downmix | |
WO2010024371A1 (en) | Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program | |
KR101264486B1 (en) | Apparatus and Method for Determining a Plurality of Local Center of Gravity Frequencies of a Spectrum of an Audio Signal | |
US8229738B2 (en) | Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method | |
JP6401521B2 (en) | Signal processing apparatus and signal processing method | |
JP2004198485A (en) | Device and program for decoding sound encoded signal | |
JP2003108197A (en) | Audio signal decoding device and audio signal encoding device | |
JP5392057B2 (en) | Audio processing apparatus, audio processing method, and audio processing program | |
KR20060036724A (en) | Method and apparatus for encoding/decoding audio signal | |
EP2595147A1 (en) | Audio data encoding method and device | |
Moliner et al. | Virtual bass system with fuzzy separation of tones and transients | |
JP4760278B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
US20160189725A1 (en) | Voice Processing Method and Apparatus, and Recording Medium Therefor | |
CN113196387A (en) | High resolution audio coding and decoding | |
JP2011186187A (en) | Speech processor, speech processing method and speech processing program | |
CN110335623B (en) | Audio data processing method and device | |
CN113302688B (en) | High resolution audio codec | |
JP2003280691A (en) | Voice processing method and voice processor | |
KR101333162B1 (en) | Tone and speed contorol system and method of audio signal using imdct input | |
KR100663379B1 (en) | Sound enhancement system of portable device for multimedia audio and method thereof | |
JP7130878B2 (en) | High resolution audio coding | |
JP2013057895A (en) | Audio reproduction device, audio reproduction method, and computer program | |
JP4963955B2 (en) | Signal processing method, signal processing apparatus, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20111012 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130930 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5392057 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |