JP2016213683A - Audio signal processing device and audio signal processing method - Google Patents
Audio signal processing device and audio signal processing method Download PDFInfo
- Publication number
- JP2016213683A JP2016213683A JP2015095986A JP2015095986A JP2016213683A JP 2016213683 A JP2016213683 A JP 2016213683A JP 2015095986 A JP2015095986 A JP 2015095986A JP 2015095986 A JP2015095986 A JP 2015095986A JP 2016213683 A JP2016213683 A JP 2016213683A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- audio signal
- quantization
- noise shaping
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、音声信号の量子化等、音声信号のディジタル処理の技術に関する。 The present invention relates to a technique for digital processing of an audio signal, such as quantization of an audio signal.
ディジタルの音声信号を生成する際、信号を量子化する手順が行われる。従来、この量子化の手順においては、例えば、出力信号を1サンプリング時間遅延する遅延手段と、遅延手段によって遅延された遅延信号と入力信号とを加算して加算結果を得る加算手段と、加算結果の信号のうちで、固有に持つ共振周波数の前後の周波数成分のみを増幅して共振結果を得る共振手段と、共振結果を量子化し、量子化結果を得る量子化手段とを有するノイズシェーピング手段を備え、入力信号を加算手段、共振手段、量子化手段の順に処理して出力信号として出力させる構成において、この入力信号の一部を量子化手段から再び加算手段に帰還させる構成を備えたA/D変換装置が知られている(例えば、特許文献1参照)。 When a digital audio signal is generated, a procedure for quantizing the signal is performed. Conventionally, in this quantization procedure, for example, delay means for delaying an output signal by one sampling time, addition means for adding the delay signal delayed by the delay means and the input signal, and obtaining an addition result; A noise shaping means comprising: a resonance means for amplifying only the frequency components before and after the inherent resonance frequency, and obtaining a resonance result; and a quantization means for quantizing the resonance result and obtaining a quantization result. A / A comprising a configuration in which an input signal is processed in the order of addition means, resonance means, and quantization means and output as an output signal, and a part of this input signal is fed back from the quantization means to the addition means again. A D converter is known (see, for example, Patent Document 1).
しかしながら、上記特許文献1に記載の発明は、例えば量子化手段で処理された信号の一部を加算手段に帰還させる構成を備えている等、構成と処理が複雑になるという問題がある。
However, the invention described in
本発明は上記課題に鑑みてなされたものであり、簡素な構成と処理によってノイズシェーピングを実現して量子化ノイズの聴感上の影響を低減させることができる音声信号処理装置、音声信号処理方法を提供することを課題としている。 The present invention has been made in view of the above problems, and provides an audio signal processing device and an audio signal processing method capable of realizing noise shaping with a simple configuration and processing to reduce the audible effect of quantization noise. The issue is to provide.
かかる課題を解決するために、請求項1に記載の発明は、複数の時系列信号によって形成される音声信号を生成するための量子化手段と、該量子化手段において量子化を行った際に発生する量子化ノイズについてノイズシェーピングを行うためのノイズシェーピング手段とを備えた音声信号処理装置であって、前記ノイズシェーピング手段は、量子化された前記音声信号のノイズシェーピングを実現できる特性を有する第一のフィルタと、該第一のフィルタの逆特性を有する第二のフィルタとを備え、前記第一のフィルタを前記量子化手段の後段に、前記第二のフィルタを前記量子化手段の前段にそれぞれ設けたことを特徴とする。
In order to solve this problem, the invention described in
請求項2に記載の発明は、請求項1に記載の構成に加え、前記第一のフィルタと前記第二のフィルタとの間には、前記第一のフィルタで処理された前記音声信号を前記第二のフィルタに帰還させる帰還手段が設けられないように構成されたことを特徴とする。 According to a second aspect of the present invention, in addition to the configuration of the first aspect, the audio signal processed by the first filter is inserted between the first filter and the second filter. The present invention is characterized in that no feedback means for returning to the second filter is provided.
請求項3に記載の発明は、請求項1又は2に記載の構成に加え、前記第一のフィルタと前記第二のフィルタとはそれぞれ所定の伝達関数を備え、前記第二のフィルタの前記伝達関数は前記第一のフィルタの前記伝達関数の逆関数となるように構成されていることを特徴とする。 According to a third aspect of the present invention, in addition to the configuration of the first or second aspect, each of the first filter and the second filter has a predetermined transfer function, and the transmission of the second filter. The function is configured to be an inverse function of the transfer function of the first filter.
請求項4に記載の発明は、請求項3に記載の構成に加え、前記第一のフィルタの備える前記伝達関数は、全ての係数が整数であるように構成されたことを特徴とする。
The invention described in
請求項5に記載の発明は、請求項1乃至4の何れか一つに記載の構成に加え、前記ノイズシェーピング手段は、符号化の前に音声信号の周波数特性を変化させることで、前記音声信号の大きさに対する前記量子化ノイズの大きさを小さくできる前処理手段と共に用いられることを特徴とする。 According to a fifth aspect of the present invention, in addition to the configuration according to any one of the first to fourth aspects, the noise shaping means changes the frequency characteristics of the audio signal before encoding, thereby The present invention is characterized in that it is used together with preprocessing means that can reduce the magnitude of the quantization noise with respect to the magnitude of the signal.
請求項6に記載の発明は、複数の時系列信号によって形成される音声信号を生成するための量子化手順と、該量子化手段において量子化を行った際に発生する量子化ノイズについてノイズシェーピングを行うためのノイズシェーピング手順とを備えた音声信号処理方法であって、前記ノイズシェーピング手順は、量子化された前記音声信号のノイズシェーピングを実現できる特性を有する第一のフィルタによって前記音声信号の処理を行う第一のフィルタリング手順と、該第一のフィルタの逆特性を有する第二のフィルタによって前記音声信号の処理を行う第二のフィルタリング手順とを備え、前記第一のフィルタリング手順を前記量子化手順の後段において、前記第二のフィルタリング手順を前記量子化手段の前段においてそれぞれ行うことを特徴とする。 According to a sixth aspect of the present invention, there is provided a quantization procedure for generating an audio signal formed by a plurality of time-series signals, and noise shaping for quantization noise generated when quantization is performed by the quantization means. And a noise shaping procedure for performing the noise shaping procedure, wherein the noise shaping procedure is performed by the first filter having a characteristic capable of realizing noise shaping of the quantized audio signal. A first filtering procedure for performing processing, and a second filtering procedure for processing the audio signal by a second filter having a reverse characteristic of the first filter, wherein the first filtering procedure is the quantum filter. In the subsequent stage of the quantization procedure, the second filtering procedure is performed in the previous stage of the quantization means. The features.
請求項1、及び請求項6に記載の発明によれば、量子化された音声信号のノイズシェーピングを実現できる特性を有する第一のフィルタによる処理を量子化手段の処理の後段において行うことにより、量子化ノイズのノイズシェーピングを行うことができる。また、第一のフィルタの逆特性を有する第二のフィルタによる処理を量子化手段の処理の前段において行うことにより、音声信号自体は第二のフィルタの処理と第一のフィルタの処理とがそれぞれ行われることで、元の状態を維持したまま量子化できる。そして、第一のフィルタによる処理、量子化手段による処理、第二のフィルタによる処理の順に音声信号を処理することにより、量子化とノイズシェーピングとを、簡素な構成における簡素な処理として実現できる。これにより、簡素な構成と処理によってノイズシェーピングを実現して量子化ノイズの聴感上の影響を低減させることができる。 According to the first and sixth aspects of the invention, by performing the processing by the first filter having a characteristic capable of realizing noise shaping of the quantized audio signal in the subsequent stage of the processing of the quantization means, Noise shaping of quantization noise can be performed. Also, by performing the processing by the second filter having the inverse characteristic of the first filter in the preceding stage of the quantization means processing, the audio signal itself is subjected to the processing of the second filter and the processing of the first filter, respectively. By being performed, quantization can be performed while maintaining the original state. Then, by processing the audio signal in the order of processing by the first filter, processing by the quantization means, and processing by the second filter, quantization and noise shaping can be realized as simple processing with a simple configuration. As a result, noise shaping can be realized with a simple configuration and processing, and the audible effect of quantization noise can be reduced.
請求項2に記載の発明によれば、第一のフィルタで処理された音声信号を第二のフィルタに帰還させる帰還手段が設けられないように構成されていることにより、信号を帰還させるための複雑な構成が形成されることと帰還させた信号を含めた信号処理を行うという複雑な処理の発生や、帰還によってシステムの出力が無限に増大してシステムの破損を招くようなシステムの不安定化を抑止できて、簡素な構成と処理によってノイズシェーピングを具体的に実現し、特別な配慮を行わなくてもシステムの安定化を図ることができる。 According to the second aspect of the present invention, the feedback means for feeding back the audio signal processed by the first filter to the second filter is not provided, so that the signal is fed back. Instability of the system such as the formation of a complicated configuration and the generation of complicated processing such as signal processing including the feedback signal, and system output infinitely increasing the system output due to feedback Therefore, noise shaping can be specifically realized with a simple configuration and processing, and the system can be stabilized without special consideration.
請求項3に記載の発明によれば、第一のフィルタと、第二のフィルタとは、所定の伝達関数を備えたことにより、複数の時系列信号からなる音声信号のノイズシェーピングを、伝達関数を用いて確実に行うことが可能となる。また、第二のフィルタの伝達関数は第一のフィルタの伝達関数の逆関数となるように構成されていることにより、第二のフィルタと第一のフィルタとでそれぞれ処理された信号は元の状態が維持される。これにより、原信号を変質させずに量子化とノイズシェーピングを行うことが可能になる。 According to the third aspect of the present invention, since the first filter and the second filter have a predetermined transfer function, noise shaping of an audio signal composed of a plurality of time-series signals can be performed. It is possible to carry out with certainty. Further, since the transfer function of the second filter is configured to be an inverse function of the transfer function of the first filter, the signals processed by the second filter and the first filter are the original ones. State is maintained. As a result, quantization and noise shaping can be performed without altering the original signal.
請求項4に記載の発明によれば、第一のフィルタの備える伝達関数は、全ての係数が整数であるように構成されたことにより、第一のフィルタで処理した音声信号を再度量子化する必要がなく、簡素な構成と簡素な手順において量子化とノイズシェーピングを行うことが可能になる。 According to the fourth aspect of the present invention, the transfer function of the first filter is configured so that all the coefficients are integers, so that the audio signal processed by the first filter is quantized again. There is no need to perform quantization and noise shaping with a simple configuration and a simple procedure.
請求項5に記載の発明によれば、符号化の前に音声信号の周波数特性を変化させることで、音声信号の大きさに対する量子化ノイズの大きさを小さくできる前処理手段と共にノイズシェーピング手段が用いられることにより、存在する量子化ノイズの大きさを音声信号の大きさに対して小さくしつつノイズシェーピングを行い、音声信号の音質をより向上させることができる。 According to the fifth aspect of the present invention, the noise shaping means and the preprocessing means that can reduce the magnitude of the quantization noise with respect to the magnitude of the voice signal by changing the frequency characteristic of the voice signal before encoding. By being used, noise shaping can be performed while reducing the size of the existing quantization noise with respect to the size of the audio signal, and the sound quality of the audio signal can be further improved.
[基本構成]
図1にこの発明の実施の形態を示す。
[Basic configuration]
FIG. 1 shows an embodiment of the present invention.
図1は、この実施の形態に係る音声信号処理装置の全体構成を示す機能ブロック図である。 FIG. 1 is a functional block diagram showing the overall configuration of the audio signal processing apparatus according to this embodiment.
この実施の形態の音声信号処理装置1Aには、例えば、入力されたアナログの音声信号をディジタルの音声信号に変換(A/D変換)して出力する処理に用いられる。音声信号処理装置1Aは、例えば、少なくとも一のCPU等の制御手段を備え、音声信号をA/D変換するための各種処理や、A/D変換に関連する各種処理等を行う。 The audio signal processing apparatus 1A according to this embodiment is used for, for example, a process of converting an input analog audio signal into a digital audio signal (A / D conversion) and outputting the digital audio signal. The audio signal processing apparatus 1A includes, for example, at least one control unit such as a CPU, and performs various processes for A / D conversion of an audio signal, various processes related to A / D conversion, and the like.
図1に示す通り、この実施の形態の音声信号処理装置1Aは、符号化部1、前処理部2、量子化部3を備えている。
As shown in FIG. 1, the audio
符号化部1は、A/D変換の際の符号化処理を行う。即ち、符号化部1にはアナログ信号を標本化、量子化した後のデータが入力され、このデータを符号化してディジタル信号を生成する。符号化部1による符号化は、例えば、時系列信号によって形成される音声信号を線形予測によって予測符号化を行う形態(例えば、適応的差分パルス符号変調(adaptive differential pulse code modulation:ADPCM、以下「ADPCM」と記載する))等が考えられる。ただしこれに限定されず、どのような符号化方法を用いてもよい。また、符号化部1においてA/D変換時の標本化や量子化が行われる構成であってもよい。
The
前処理部2は、符号化部1から出力されたディジタル信号に対し、この実施の形態における量子化処理を行う前の信号成分を調整する機能を備えている。具体的には、前処理部2は量子化処理が行われる前の音声信号の高域周波数の信号成分を増幅させる機能を有している。この前処理部2は、例えばこの実施の形態の符号化部1においてADPCM等の予測符号化による符号化が行われる場合、符号化されたディジタル信号に対し、ローパスフィルタ(図示せず)による高域周波数成分のカットやバンドパスフィルタ(図示せず)による特定周波数帯以外の周波数成分のカット等を行う機能を有している。これにより、
音声データや出力された音声の大きさに対する量子化ノイズの大きさを相対的に小さくすることができる。
The preprocessing
It is possible to relatively reduce the magnitude of the quantization noise with respect to the voice data and the output voice.
量子化部3は、符号化部1及び前処理部2から出力された音声信号を量子化する。この、量子化部3の具体的構成と処理の原理については後述する。
The
[量子化部の具体的構成]
図1に示す通り、量子化部3は、「量子化手順」を行う「量子化手段」としての量子化処理部31と、量子化処理部31の後段に設けられた、「ノイズシェーピング手順」を行う「ノイズシェーピング手段」、及び「第一のフィルタリング手順」を行う「第一のフィルタ」としてのポストフィルタ32と、量子化処理部31の前段に設けられた、「ノイズシェーピング手順」を行う「ノイズシェーピング手段」、及び、「第二のフィルタリング手順」を行う「第二のフィルタ」としてのプリフィルタ33とを備えている。
[Specific configuration of quantization unit]
As illustrated in FIG. 1, the
なお、量子化部3においては、プリフィルタ33、量子化処理部31、ポストフィルタ32の順に処理が行われる構成のみが存在し、処理された信号の一部を帰還させる「帰還手段」に相当する構成(例えば、ポストフィルタ32で処理された音声信号の一部をプリフィルタ33に帰還させるための構成)は設けられていない。そのため、複雑な処理の発生や、帰還によってシステムの出力が無限に増大してシステムの破損を招くようなシステムの不安定化を抑止できる。そして、簡素な構成により、特別な配慮を行わなくてもシステムの安定化を図ることができる。
Note that the
量子化処理部31は、サンプリングされた音声信号(この実施の形態においては、符号化部1及び前処理部2から出力された音声信号)を量子化するための具体的な処理を行う。
The
ポストフィルタ32は、量子化された音声信号のノイズシェーピングを実現できる特性を有しており、量子化された音声信号についてのノイズシェーピングを行う。即ち、ポストフィルタ32は、量子化処理部31から出力された音声信号に存在する各種のノイズ、例えば量子化によって発生した量子化ノイズを、ノイズが目立ちやすい周波数帯である高い周波数帯や音声信号の小さい周波数帯から、ノイズが目立ちにくい周波数帯である低い周波数帯や音声信号の大きい周波数帯に移動させることで、ノイズの存在を目立たなくして量子化された音声信号が出力された際の音質を向上させる機能を奏する。ポストフィルタ32は、後述するような所定の伝達関数を備えており、この伝達関数によって音声信号の演算処理を行う。また、ポストフィルタ32の備える伝達関数は、後述するように、全ての係数が整数であるように構成されている。
The
プリフィルタ33は、ポストフィルタ32の逆特性を有している。プリフィルタ33もポストフィルタ32と同様に所定の伝達関数を備えており、この伝達関数によって音声信号の演算処理を行う。プリフィルタ33の備える伝達関数は、ポストフィルタ32の備える伝達関数の逆関数となるように構成されており、この伝達関数によって音声信号の演算処理を行う。これにより、プリフィルタ33の備える伝達関数とポストフィルタ32の備える伝達関数とを乗算すると、全通過フィルタとなるように構成されており、プリフィルタ33で演算処理を行った音声信号をポストフィルタ32で演算処理を行うと、その音声信号の信号値は、原信号の信号値と同じになる。
The
なお、量子化部3においては、図示せぬバッファが設けられており、このバッファ(図示せず)には、ポストフィルタ32やプリフィルタ33で伝達関数を用いて処理が行われる場合に用いられる、直前数個分の信号(や信号値)が一時的に保管されるように構成されている。
Note that the
[ポストフィルタの原理]
ポストフィルタ32においては、z領域における、下記(式1)に示す伝達関数
[Principles of post filter]
In the
を用いて処理を行う。なお、
Process using. In addition,
はフィードバック要素であり、z−1の時間遅れを含むものである。 Is a feedback element and includes a time delay of z- 1 .
式1の伝達関数は、z領域における伝達関数として
The transfer function of
として表すこともできる。なお、ここでの係数anは整数に限られている。これは、係数anを整数に限定することにより、ポストフィルタ32で処理された音声信号を更に量子化する必要がなくなり(係数に少数点以下の値が発生すると、その信号をさらに量子化して小さい単位に細分化しなければ適切な処理が図れない可能性が生ずるが、係数を整数のみとすることで、更なる細分化が不要になるから。)、構成の簡素化と処理の簡素化を図ることができるからである。 It can also be expressed as Note that the coefficient in a n is limited to an integer. This can be achieved by limiting the coefficient a n integer, when it is not necessary to further quantize the audio signal processed by the post-filter 32 (the value after the decimal point coefficient occurs, the signal further by quantizing There is a possibility that proper processing cannot be achieved unless it is subdivided into small units, but since further subdivision is not required by using only integer coefficients.) Simplification of configuration and simplification of processing It is because it can plan.
上記(式1)や(式2)の伝達関数を用いて、ポストフィルタ32からポストフィルタ32への音声信号の帰還を行わずにノイズシェーピングを行える理由を以下説明する。
The reason why the noise shaping can be performed without performing the feedback of the audio signal from the
まず、帰還の要素を含む伝達関数における処理は、一般には、図2に示すような帰還を含む構成で実現される。同図においては、量子化処理部31の前段と後段からそれぞれポストフィルタ32に送り、更に量子化処理部31の前段に信号を帰還させることで(式1)や(式2)の伝達関数による処理を実現している。
First, processing in a transfer function including a feedback element is generally realized by a configuration including feedback as shown in FIG. In the same figure, the signal is sent to the post-filter 32 from the previous stage and the subsequent stage of the
この図2において、量子化処理部31において発生する量子化ノイズをQとすると、元の音声信号に対して量子化ノイズQを足すものと同価になり、図3に示すものと同価となる。ここで、量子化前と量子化後の差分信号は量子化ノイズQであるため、帰還ループを外すと、図4に示すものと同価になる。この図4に示すものから量子化ノイズQをまとめると、図5に示すものと同価値になる。この図5に示すものの並列要素(図5において
In FIG. 2, if the quantization noise generated in the
のブロックとその直上の実線で示された要素)は加算となり(一般的に知られた等価交換規則)、また、要素がない線は1倍の要素があると扱えるため、最終的に、図5は、図6に示すものと等価となる。この図6は、帰還を要素に含んでおらず、上記(式1)(式2)で示すものと等価である。従って、(式1)(式2)においてこの実施の形態のノイズシェーピングを実現することが可能である。なお、図2乃至図5においては、説明の簡単のために便宜的にポストフィルタ32と記載したが、これらは等価変換の過程のものであって、図2乃至図5に示す通り、関数の内容が図6に示すものと異なっている。その点で、図2乃至図5に示すポストフィルタ32は、図6のポストフィルタ32と(等価であっても)厳密な意味では同一ではない。
(The element indicated by the solid line immediately above it) is an addition (generally known equivalent exchange rule), and a line without an element can be treated as having one element. 5 is equivalent to that shown in FIG. FIG. 6 does not include feedback as an element, and is equivalent to that shown in the above (Expression 1) and (Expression 2). Therefore, the noise shaping of this embodiment can be realized in (Expression 1) and (Expression 2). In FIGS. 2 to 5, the
[ポストフィルタとプリフィルタを用いた構成]
上述のように、ポストフィルタ32にてノイズシェーピングに用いられる所定の伝達関数を
H(z)・・・(式3)
とした場合、プリフィルタ33においては、所定の伝達関数として、ポストフィルタ32の伝達関数とは逆関数、即ち
[Configuration using post-filter and pre-filter]
As described above, the predetermined transfer function used for noise shaping by the
In this case, in the pre-filter 33, as a predetermined transfer function, a function reverse to the transfer function of the post-filter 32, that is,
が用いられることになる。
これにより、この実施の形態の量子化部3は、図7に示すように構成される。これにより、一般的なノイズシェーピングシステムよりも簡素な構成で簡素な処理によってノイズシェーピングを実現できるようになる。
Will be used.
Thus, the
[前処理部と量子化部との組み合わせによる構成(実装最適化)]
この実施の形態において、前処理部2において用いられるフィルタの伝達関数Gn*(z)は、z=−1に零点を持つものである。
[Configuration by combining pre-processing and quantization units (mounting optimization)]
In this embodiment, the transfer function Gn * (z) of the filter used in the
仮に、前処理部2において用いられるフィルタの伝達関数をGn*(z)とし、前処理部2のみによって量子化ノイズの除去を行う場合、音声信号処理装置1の前処理部2と量子化部3の構成は、図8に示すようになる(なお、図8において、量子化部3にはプリフィルタ33、ポストフィルタ32が設けられておらず、量子化処理部31のみが設けられた構成であるとする)。これに、プリフィルタ33、ポストフィルタ32が設けられた構成とした場合、図9に示す構成となる。図8、図9に示す通り、双方のシステム構成の構成は大きく相違しない。即ち、前処理部2の構成と共にこの実施の形態のプリフィルタ33、ポストフィルタ32を用いても、構成はさほど複雑化したものにはならずに済む。
If the transfer function of the filter used in the
なお、図9に示す伝達関数Gn(z)は、図8に示す、前処理部2において用いられるフィルタの伝達関数
Gn*(z)・・・(式5)
を、上記(式3)に示すポストフィルタ32の伝達関数H(z)で割ったもの、すなわち
Note that the transfer function Gn (z) shown in FIG. 9 is the transfer function Gn * (z) of the filter used in the
Divided by the transfer function H (z) of the
である。 It is.
なお、上述した通り、(式5)に示す伝達関数Gn*(z)は、z=−1に零点を持つものであるから、プリフィルタ33に用いられる、ポストフィルタ32の逆特性フィルタ
As described above, since the transfer function Gn * (z) shown in (Equation 5) has a zero at z = −1, the inverse characteristic filter of the
と直列接続した合成特性
Characteristics in series with
は約分により分母からzを除去することができ、FIRフィルタによる実装が可能である。 Can remove z from the denominator by reduction, and can be implemented with an FIR filter.
ここで、伝達関数Gn*(z)は、z=−1に零点を持ち、振幅が高周波帯域に向かい緩やかに単調減少するフィルタである。ここで、伝達関数Gn*(z)によるフィルタリングで生じる量子化ノイズQは周波数に依らず一定のレベルであると仮定すると、ナイキスト周波数付近の帯域では量子化ノイズQがフィルタリング後のエネルギーを上回り、劣化の影響が強くなる。特に、原信号の高周波エネルギーが小さいときに量子化ノイズQによる劣化の影響を受ける帯域が広くなる。よって、以下の条件を満たす特性(即ち伝達関数H(z)の特性)が量子化ノイズQに対して有効と考えられる。
・ナイキスト周波数で振幅を零とする。
・簡素な実装をするため次数を1とする。
・伝達関数H(z)のポストフィルタ32は因果性フィルタとする。
Here, the transfer function Gn * (z) is a filter having a zero point at z = −1 and whose amplitude gradually decreases monotonously toward the high frequency band. Here, assuming that the quantization noise Q generated by filtering by the transfer function Gn * (z) is a constant level regardless of the frequency, the quantization noise Q exceeds the energy after filtering in the band near the Nyquist frequency, The effect of deterioration becomes stronger. In particular, when the high frequency energy of the original signal is small, the band affected by the deterioration due to the quantization noise Q is widened. Therefore, a characteristic that satisfies the following condition (that is, a characteristic of the transfer function H (z)) is considered to be effective for the quantization noise Q.
・ Set the amplitude to zero at the Nyquist frequency.
・ The order is set to 1 for simple implementation.
The
さらには、上記(式1)が示すように、伝達関数H(z)の零次項は1となる必要がある。 Furthermore, as the above (Formula 1) shows, the zero-order term of the transfer function H (z) needs to be 1.
これらの条件を満たすポストフィルタ32の伝達関数H(z)を
H(z)=1+z−1・・・(式9)
とすると、上記伝達関数Gn(z)は、例えばn=3,5,7,9のとき、下記(式10)〜(式13)のように算出される。
The transfer function H (z) of the
Then, the transfer function Gn (z) is calculated as in the following (Expression 10) to (Expression 13) when n = 3, 5, 7, 9 for example.
上記(式10)〜(式13)に示す伝達関数Gn(z)のフィルタを用いた音声信号処理装置1Aの出力は、図2に示すポストフィルタ32を用いたシステムと同じものになる。
The output of the audio signal processing apparatus 1A using the filter of the transfer function Gn (z) shown in the above (Equation 10) to (Equation 13) is the same as the system using the
以上に示した、この実施の形態に示すノイズシェーピングは、下記(条件1)(条件2)の条件を満たすどのようなポストフィルタ32に対しても適用が可能となる。
・(条件1):伝達関数H(z)の係数がすべて整数であること。
(条件2):前処理部2の伝達関数Gn*(z)との合成特性{Gn*(z)/H(z)}を約分することで分母のzを除去できること。
The noise shaping shown in this embodiment described above can be applied to any
(Condition 1): All the coefficients of the transfer function H (z) are integers.
(Condition 2): z in the denominator can be removed by dividing the composite characteristic {Gn * (z) / H (z)} with the transfer function Gn * (z) of the
以上示した通り、この実施の形態の音声信号処理装置1Aにおいては、量子化された音声信号のノイズシェーピングを実現できる特性を有するポストフィルタ32による処理を量子化処理部31の処理の後段において行うことにより、量子化ノイズのノイズシェーピングを行うことができる。また、ポストフィルタ32の逆特性を有するプリフィルタ33による処理を量子化処理部31の処理の前段において行うことにより、音声信号自体はプリフィルタ33の処理とポストフィルタ32の処理とがそれぞれ行われることで、元の状態を維持したまま量子化できる。そして、ポストフィルタ32による処理、量子化手段による処理、プリフィルタ33による処理の順に音声信号を処理することにより、量子化とノイズシェーピングとを、簡素な構成における簡素な処理として実現できる。これにより、簡素な構成と処理によってノイズシェーピングを実現して量子化ノイズの聴感上の影響を低減させることができる。
As described above, in the audio signal processing apparatus 1A according to this embodiment, the post-filter 32 having a characteristic capable of realizing noise shaping of the quantized audio signal is performed in the subsequent stage of the process of the
この実施の形態の音声信号処理装置1Aにおいては、ポストフィルタ32で処理された音声信号をプリフィルタ33に帰還させる帰還手段が設けられないように構成されていることにより、信号を帰還させるための複雑な構成が形成されることと帰還させた信号を含めた信号処理を行うという複雑な処理の発生や、帰還によってシステムの出力が無限に増大してシステムの破損を招くようなシステムの不安定化を抑止できて、簡素な構成と処理によってノイズシェーピングを具体的に実現し、特別な配慮を行わなくてもシステムの安定化を図ることができる。
The audio signal processing apparatus 1A according to this embodiment is configured so that no feedback means for returning the audio signal processed by the
この実施の形態の音声信号処理装置1Aにおいては、ポストフィルタ32は伝達関数H(z)を、プリフィルタ33は伝達関数1/H(z)を備えたことにより、複数の時系列信号からなる音声信号のノイズシェーピングを、伝達関数を用いて確実に行うことが可能となる。また、プリフィルタ33の伝達関数1/Hz)はポストフィルタ32の伝達関数H(z)の逆関数となるように構成されていることにより、プリフィルタ33とポストフィルタ32とでそれぞれ処理された信号は元の状態が維持される。これにより、原信号を変質させずに量子化とノイズシェーピングを行うことが可能になる。
In the audio signal processing apparatus 1A of this embodiment, the
この実施の形態の音声信号処理装置1Aにおいては、ポストフィルタ32の備える伝達関数H(z)は、全ての係数が整数であるように構成されたことにより、ポストフィルタ32で処理した音声信号を再度量子化する必要がなく、簡素な構成と簡素な手順において量子化とノイズシェーピングを行うことが可能になる。
In the audio signal processing apparatus 1A according to this embodiment, the transfer function H (z) included in the
この実施の形態の音声信号処理装置1Aにおいては、符号化の前に音声信号の周波数特性を変化させることで、音声信号の大きさに対する量子化ノイズの大きさを小さくできる,前処理部2と共にポストフィルタ32とプリフィルタ33が用いられることにより、存在する量子化ノイズの大きさを音声信号の大きさに対して小さくしつつノイズシェーピングを行い、音声信号の音質をより向上させることができる。
In the audio signal processing apparatus 1A of this embodiment, the magnitude of the quantization noise with respect to the size of the audio signal can be reduced by changing the frequency characteristics of the audio signal before encoding. By using the
上記実施の形態においては、時系列信号は音声信号としたが、これに限定されず、動画の画像信号等、時系列的に動的変化を示し、相関性の高いものであればどのようなものであってもよい。また、この実施の形態の時系列信号を形成する音声信号は、データベース等に予め記録された音声サンプル等であって、それらの中から相関性の高いものを抽出して複数の系列を形成することで実現するものであってもよい。 In the above embodiment, the time series signal is an audio signal. However, the present invention is not limited to this, and any video signal such as a moving image signal that shows a dynamic change in time series and has high correlation can be used. It may be a thing. Also, the audio signal forming the time series signal of this embodiment is an audio sample or the like recorded in advance in a database or the like, and a plurality of sequences are formed by extracting highly correlated ones from them. It may be realized.
上記実施の形態は本発明の例示であり、本発明が上記実施の形態のみに限定されることを意味するものではないことは、いうまでもない。 The above embodiment is an exemplification of the present invention, and it is needless to say that the present invention is not limited to the above embodiment.
図10,図11に、この実施の形態に係る音声信号処理装置1Aにおいて本発明に係る処理を行った信号に基づく音声データの再生結果と、比較例として、従来の方法に係る処理を行った信号に基づく音声データの再生結果を示す。図10、図11において、符号101は本発明に基づく音声データの再生結果である。具体的には、図1に示す符号化部1にて線形予測による予測符号化を行って符号化した音声信号に、ポストフィルタ32とプリフィルタ33とを用いて量子化処理部31が量子化した音声信号を復号して再生した音声の音質を示したものである(なお、本実施例においては、本発明に基づく音声データ(再生結果101に示すもの)に前処理部2の処理は行っていない。)。一方、符号102は、比較例としての音声データの再生結果である。具体的には、図1に示す符号化部1にて線形予測による予測符号化を行って符号化した音声信号に、(ポストフィルタ32とプリフィルタ33とを用いずに)量子化処理部31が量子化した音声信号を復号して再生した音声の音質を示したものである(なお、本実施例においては、比較例としての音声データ(再生結果102に示すもの)にも前処理部2の処理は行っていない)。
10 and 11, the audio signal reproduction result based on the signal subjected to the process according to the present invention in the audio signal processing apparatus 1A according to this embodiment and the process according to the conventional method are performed as a comparative example. The reproduction | regeneration result of the audio | voice data based on a signal is shown. 10 and 11,
同図に示す通り、本発明に基づいて処理を行った音声データの再生結果101の方が、比較例の音声データの再生結果102よりもODGscoreが高い(すなわち音質が良好である)ことを示している。これにより、本発明に基づいて処理を行った音声の方が、従来の方法で処理を行った音声に比べて良好な音質で再生できることが示された。
As shown in the figure, the ODG score is higher (that is, the sound quality is better) in the
1A・・・音声信号処理装置
2・・・前処理部(前処理手段)
31・・・量子化処理部(量子化手段)
32・・・ポストフィルタ(ノイズシェーピング手段、第一のフィルタ)
33・・・プリフィルタ(ノイズシェーピング手段、第二のフィルタ)
DESCRIPTION OF SYMBOLS 1A ... Audio | voice
31 ... Quantization processing unit (quantization means)
32 ... Post filter (noise shaping means, first filter)
33 ... Pre-filter (noise shaping means, second filter)
Claims (6)
前記ノイズシェーピング手段は、
量子化された前記音声信号のノイズシェーピングを実現できる特性を有する第一のフィルタと、
該第一のフィルタの逆特性を有する第二のフィルタとを備え、
前記第一のフィルタを前記量子化手段の後段に、前記第二のフィルタを前記量子化手段の前段にそれぞれ設けたことを特徴とする音声信号処理装置。 Quantization means for generating an audio signal formed by a plurality of time-series signals, and noise shaping means for performing noise shaping on quantization noise generated when quantization is performed in the quantization means An audio signal processing apparatus comprising:
The noise shaping means includes
A first filter having characteristics capable of realizing noise shaping of the quantized audio signal;
A second filter having a reverse characteristic of the first filter,
An audio signal processing apparatus, wherein the first filter is provided at a subsequent stage of the quantization means, and the second filter is provided at an upstream stage of the quantization means.
前記ノイズシェーピング手順は、
量子化された前記音声信号のノイズシェーピングを実現できる特性を有する第一のフィルタによって前記音声信号の処理を行う第一のフィルタリング手順と、
該第一のフィルタの逆特性を有する第二のフィルタによって前記音声信号の処理を行う第二のフィルタリング手順とを備え、
前記第一のフィルタリング手順を前記量子化手順の後段において、前記第二のフィルタリング手順を前記量子化手段の前段においてそれぞれ行うことを特徴とする音声信号処理方法。 A quantization procedure for generating an audio signal formed by a plurality of time-series signals, and a noise shaping procedure for performing noise shaping on quantization noise generated when quantization is performed in the quantization means. An audio signal processing method comprising:
The noise shaping procedure includes:
A first filtering procedure for processing the audio signal by a first filter having a characteristic capable of realizing noise shaping of the quantized audio signal;
A second filtering procedure for processing the audio signal by a second filter having an inverse characteristic of the first filter;
An audio signal processing method, wherein the first filtering procedure is performed after the quantization procedure, and the second filtering procedure is performed before the quantization means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015095986A JP6307715B2 (en) | 2015-05-08 | 2015-05-08 | Audio signal processing apparatus and audio signal processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015095986A JP6307715B2 (en) | 2015-05-08 | 2015-05-08 | Audio signal processing apparatus and audio signal processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016213683A true JP2016213683A (en) | 2016-12-15 |
JP6307715B2 JP6307715B2 (en) | 2018-04-11 |
Family
ID=57552128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015095986A Active JP6307715B2 (en) | 2015-05-08 | 2015-05-08 | Audio signal processing apparatus and audio signal processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6307715B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019065716A1 (en) | 2017-09-29 | 2019-04-04 | 国立大学法人名古屋工業大学 | Re-quantization device having noise shaping function, signal compression device having noise shaping function, and signal transmission device having noise shaping function |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0723007A (en) * | 1993-06-29 | 1995-01-24 | Sony Corp | Audio signal transmitting device |
JPH07193814A (en) * | 1991-08-12 | 1995-07-28 | Casio Comput Co Ltd | Data compessor |
JPH10242863A (en) * | 1997-02-28 | 1998-09-11 | Nippon Columbia Co Ltd | Analog-to-digital converter |
JP2002374170A (en) * | 2001-06-12 | 2002-12-26 | Nippon Precision Circuits Inc | One-bit d/a converter |
-
2015
- 2015-05-08 JP JP2015095986A patent/JP6307715B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07193814A (en) * | 1991-08-12 | 1995-07-28 | Casio Comput Co Ltd | Data compessor |
JPH0723007A (en) * | 1993-06-29 | 1995-01-24 | Sony Corp | Audio signal transmitting device |
JPH10242863A (en) * | 1997-02-28 | 1998-09-11 | Nippon Columbia Co Ltd | Analog-to-digital converter |
JP2002374170A (en) * | 2001-06-12 | 2002-12-26 | Nippon Precision Circuits Inc | One-bit d/a converter |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019065716A1 (en) | 2017-09-29 | 2019-04-04 | 国立大学法人名古屋工業大学 | Re-quantization device having noise shaping function, signal compression device having noise shaping function, and signal transmission device having noise shaping function |
CN111164896A (en) * | 2017-09-29 | 2020-05-15 | 国立大学法人名古屋工业大学 | Re-quantization device with noise shaping function, signal compression device with noise shaping function, and signal transmission device with noise shaping function |
US10892774B2 (en) | 2017-09-29 | 2021-01-12 | Nagoya Institute Of Technology | Re-quantization device having noise shaping function, signal compression device having noise shaping function, and signal transmission device having noise shaping function |
Also Published As
Publication number | Publication date |
---|---|
JP6307715B2 (en) | 2018-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9900721B2 (en) | Method and apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals | |
KR100814673B1 (en) | audio coding | |
JP5031898B2 (en) | Audio conversion coding based on pitch correction | |
CN107591158B (en) | System for maintaining reversible dynamic range control information associated with a parametric audio encoder | |
JP6180544B2 (en) | Generation of comfort noise with high spectral-temporal resolution in discontinuous transmission of audio signals | |
KR100813193B1 (en) | Method and device for quantizing a data signal | |
KR100848370B1 (en) | Audio Encoding | |
US6252968B1 (en) | Acoustic quality enhancement via feedback and equalization for mobile multimedia systems | |
KR20120070578A (en) | Audio signal encoding employing interchannel and temporal redundancy reduction | |
JP5045295B2 (en) | Signal processing apparatus and method, and program | |
JP6976277B2 (en) | Audio decoders and methods for converting digital audio signals from the first frequency domain to the second frequency domain | |
CN101106384B (en) | Partitioned fast convolution in time domain and frequency domain | |
JP6307715B2 (en) | Audio signal processing apparatus and audio signal processing method | |
Bae et al. | A new hybrid non-uniform coding with low bit rates for sound signal in near field communication | |
JP4508599B2 (en) | Data compression method | |
JP2008046405A (en) | Encoding method and decoding method in adaptive differential pulse code modulation system | |
KR100848789B1 (en) | Postprocessing method for removing cross talk | |
CN102422347B (en) | Encoding device, decoding device, and methods therefor | |
JP5131596B2 (en) | Signal separating / reproducing apparatus and signal separating / reproducing method | |
JP5241373B2 (en) | Harmonic generator | |
US20030187528A1 (en) | Efficient implementation of audio special effects | |
JP2005057439A (en) | Band-division type encoding/decoding method and decoding device used for the same | |
US10056093B2 (en) | Encoding device, decoding device, and communication system for extending voice band | |
JP4024784B2 (en) | Audio decoding device | |
JP5817011B1 (en) | Audio signal encoding apparatus, audio signal decoding apparatus, and audio signal encoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6307715 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |