JPH08211899A - Method and device for encoding voice - Google Patents
Method and device for encoding voiceInfo
- Publication number
- JPH08211899A JPH08211899A JP7041341A JP4134195A JPH08211899A JP H08211899 A JPH08211899 A JP H08211899A JP 7041341 A JP7041341 A JP 7041341A JP 4134195 A JP4134195 A JP 4134195A JP H08211899 A JPH08211899 A JP H08211899A
- Authority
- JP
- Japan
- Prior art keywords
- minimum
- ratio
- band
- level
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、デジタル信号の高能率
な符号化装置に属し、特にビットの割り当てに関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a highly efficient digital signal coding apparatus, and more particularly to bit allocation.
【0002】[0002]
【従来の技術】従来の高能率な符号化方法の処理は、入
力した信号を帯域分割した後、各帯域に直交変換を施
し、聴覚特性を利用してマスキングのしきい値(以下マ
スキングしきい値という。)を算出する。そして、この
マスキングしきい値と各帯域の信号レベルを比較し、そ
の比較結果に応じて符号化フォーマットに納まるよう
に、各帯域にビットを割り当てる方法がとられている。
この符号化方法について、図6を用いて説明する。図6
は、従来の符号化装置を示す概略ブロック図である。2. Description of the Related Art In the processing of a conventional highly efficient coding method, an input signal is band-divided, orthogonal transformation is applied to each band, and the auditory characteristic is used to make a masking threshold (hereinafter referred to as a masking threshold). Value)) is calculated. Then, a method is used in which the masking threshold value is compared with the signal level in each band, and bits are assigned to each band so that the bits fit in the coding format according to the comparison result.
This encoding method will be described with reference to FIG. Figure 6
FIG. 4 is a schematic block diagram showing a conventional encoding device.
【0003】図6において、帯域分割部601は、入力
された信号を均一または、不均一に帯域の分割を行う。
帯域分割は、具体的に入力信号を複数のフィルタを用い
て帯域分割するフィルタバンクや離散コサイン変換等の
直交変換で行う。In FIG. 6, a band division unit 601 divides an input signal into bands either uniformly or non-uniformly.
The band division is performed by orthogonal transform such as filter bank or discrete cosine transform that specifically divides the input signal into bands using a plurality of filters.
【0004】また、マスキングしきい値算出部602
は、入力信号を高速フーリエ変換(FFT)などで周波
数分析し、聴覚特性を利用してマスキングしきい値の算
出を行う。このマスキングしきい値は、ビットアロケー
ション部603で、帯域分割部601の出力である各帯
域の信号と比較され、符号化フォーマットに納まるよう
に各帯域に割り当てる情報量(以下ビット数という。)
を決定する。これをビットアロケーションという。Further, a masking threshold value calculation unit 602
Performs frequency analysis on the input signal by Fast Fourier Transform (FFT) or the like, and calculates a masking threshold value by utilizing auditory characteristics. This masking threshold value is compared with the signal of each band output from the band division unit 601 in the bit allocation unit 603, and the amount of information assigned to each band so as to fit in the encoding format (hereinafter referred to as the number of bits).
To decide. This is called bit allocation.
【0005】再量子化部604は、ビットアロケーショ
ン部603で決定されたビット数に基づいて、帯域分割
された信号を再量子化する。再量子化された信号は、フ
ォーマティング部605で、ビットアロケーション部6
03でのビット割当情報等とともに、所定のフォーマッ
トに収めて出力される。The requantization unit 604 requantizes the band-divided signal based on the number of bits determined by the bit allocation unit 603. The requantized signal is sent to the formatting unit 605 and the bit allocation unit 6
It is output together with the bit allocation information and so on in 03 in a predetermined format.
【0006】このような符号化処理のフォーマットとし
て用いられている代表的なものとして、ISO/IEC DIS 11
172に記載されているMPEGオーディオがある。上記
の符号化装置のマスキングしきい値算出部602、ビッ
トアロケーション部603におけるビットアロケーショ
ンの処理について、図7を用いて説明する。図7は、従
来のビットアロケーションの処理を示すフローチャート
である。[0006] As a typical one used as a format of such an encoding process, ISO / IEC DIS 11
There is MPEG audio described in 172. The bit allocation processing in the masking threshold value calculation unit 602 and the bit allocation unit 603 of the above encoding device will be described with reference to FIG. FIG. 7 is a flowchart showing a conventional bit allocation process.
【0007】以下、信号マスキング比(Signal
Masking Ratio)をSMR、信号ノイズ比
(Signal Noise Ratio)をSNR、
ノイズマスキング比(Noise Masking R
atio)をNMR、最大のノイズマスキング比帯域
(Noise Masking Ratio Ban
d)をNMRBとする。Hereinafter, the signal masking ratio (Signal
Masking Ratio) to SMR, Signal Noise Ratio (Signal Noise Ratio) to SNR,
Noise masking ratio (Noise Masking R)
NMR), the maximum noise masking ratio band (Noise Masking Ratio Ban)
Let d) be NMRB.
【0008】初期値設定ステップ701は、全帯域に割
り当てるビット数を初期値(通常は0)に設定し、各帯
域の信号レベルとマスキングしきい値の比から信号マス
キング比SMRを算出する。In the initial value setting step 701, the number of bits assigned to all bands is set to an initial value (usually 0), and the signal masking ratio SMR is calculated from the ratio of the signal level of each band to the masking threshold value.
【0009】ノイズマスキング比算出ステップ702
は、各帯域に割り当られたビット数から導かれる信号レ
ベルと量子化ノイズレベル(ノイズレベル)の比である
信号ノイズ比SNRを求め、SMRからSNRを減算し
てノイズレベルとマスキングしきい値の比であるノイズ
マスキング比NMRを求める。Noise masking ratio calculation step 702
Is a signal noise ratio SNR that is the ratio of the signal level derived from the number of bits assigned to each band and the quantization noise level (noise level), and subtracts the SNR from SMR to obtain the noise level and masking threshold. The noise masking ratio NMR which is the ratio of
【0010】最大ノイズマスキング比帯域検出ステップ
703は、全帯域の中で最大のNMRを持つ帯域NMR
Bを検出する。The maximum noise masking ratio band detection step 703 is a band NMR having the largest NMR among all bands.
B is detected.
【0011】ノイズマスキング比比較ステップ704
は、NMRBのNMRが情報を割り当てる最小割当しき
い値に達しているかどうかを判断し、達していなければ
ビットアロケーションを終了し、達していれば次のノイ
ズマスキング比更新ステップ705の処理を行う。Noise masking ratio comparison step 704
Determines whether the NMR of NMRB has reached the minimum allocation threshold for allocating information, and if not, terminates bit allocation, and if so, performs the processing of the next noise masking ratio update step 705.
【0012】ノイズマスキング比更新ステップ705
は、NMRBのビット数を1段階(1ビット)増加し、
増加したビット数から導かれるSNRをSMRから減算
してNMRを求め、そのNMRをその帯域のNMRとし
て更新する。Noise masking ratio update step 705
Increases the number of bits of NMRB by one step (1 bit),
The SNR derived from the increased number of bits is subtracted from the SMR to obtain the NMR, and the NMR is updated as the NMR of the band.
【0013】必要情報量算出ステップ706は、ビット
数の増加に伴い、必要とするビット数を算出する。The necessary information amount calculating step 706 calculates the required number of bits as the number of bits increases.
【0014】情報量比較ステップ707は、必要とする
ビット数と使用可能なビット数を比較する。そして、必
要ビット数が使用可能ビット数以下ならば、ビット数、
NMRの更新を行い、前記の最大ノイズマスキング比帯
域検出ステップ703の処理に戻る。また、必要ビット
数が使用可能ビット数より大きければ、次の更新キャン
セルステップ708の処理を行う。The information amount comparing step 707 compares the required bit number with the usable bit number. If the required number of bits is less than or equal to the number of usable bits, the number of bits,
The NMR is updated and the process returns to the maximum noise masking ratio band detection step 703. If the required number of bits is larger than the usable number of bits, the next update cancel step 708 is performed.
【0015】更新キャンセルステップ708は、ビット
数の更新をもとに戻し、NMRBのNMRを最小割当し
きい値に設定する。そして、最大ノイズマスキング比帯
域検出ステップ703の処理に戻る。Update cancellation step 708 reverts to updating the number of bits and sets NMRB NMR to the minimum allocation threshold. Then, the process returns to the maximum noise masking ratio band detection step 703.
【0016】以上の処理ループによりビットアロケーシ
ョンを行う。この処理を図8を用いて説明する。図8
は、従来のビットアロケーションの情報割当量を模式的
に示した図である。Bit allocation is performed by the above processing loop. This process will be described with reference to FIG. FIG.
FIG. 6 is a diagram schematically showing a conventional information allocation amount of bit allocation.
【0017】図8において、帯域分割された各帯域の信
号は、マスキングしきい値算出部602で算出されたマ
スキングしきい値と比較される。In FIG. 8, the band-divided signal of each band is compared with the masking threshold value calculated by the masking threshold value calculation unit 602.
【0018】それぞれの帯域の信号レベルとマスキング
しきい値を比較した結果から、それぞれのSMRを算出
する。この信号レベルとマスキングしきい値により算出
された値は、マスキング効果の影響を受けない信号の可
聴可能なしきい値となる。Each SMR is calculated from the result of comparison between the signal level of each band and the masking threshold. The value calculated by this signal level and the masking threshold value becomes an audible threshold value of the signal that is not affected by the masking effect.
【0019】最初のビット数としては、初期値0ビット
を割り当てているため、各帯域のSNRは0であり、信
号レベルとノイズレベルは同等である。表1にビット数
とSNRの関係を示す。Since an initial value of 0 bits is assigned as the initial number of bits, the SNR of each band is 0, and the signal level and noise level are equivalent. Table 1 shows the relationship between the number of bits and SNR.
【0020】[0020]
【表1】 [Table 1]
【0021】図9は、ビット数とSNRの関係を示す模
式図である。図9(a)は、2ビットを割り当てた場合
であり、図9(b)は、6ビット割り当てた場合であ
る。FIG. 9 is a schematic diagram showing the relationship between the number of bits and SNR. FIG. 9A shows a case where 2 bits are allocated, and FIG. 9B shows a case where 6 bits are allocated.
【0022】図9(a)に示すように、2ビットの場
合、量子化ノイズレベルが信号レベルに近接しており、
量子化ノイズレベルは、マスキングしきい値より上の値
となり、聴感上量子化ノイズを認識することになる。ビ
ットを割り当てていくことにより、SNRが増大する。
例えば、図9(b)に示すように、6ビット割り当てら
れた場合、量子化ノイズレベルがマスキングしきい値よ
り下の値となり、量子化ノイズはマスキングされ聴感上
の認識が困難となる。As shown in FIG. 9A, in the case of 2 bits, the quantization noise level is close to the signal level,
The quantization noise level becomes a value above the masking threshold value, and the quantization noise is audibly recognized. By allocating bits, the SNR increases.
For example, as shown in FIG. 9B, when 6 bits are allocated, the quantization noise level becomes a value below the masking threshold value, and the quantization noise is masked, which makes it difficult to perceptually recognize.
【0023】それぞれの帯域でSMRからSNRを減算
し、NMRを算出する。各帯域の中でNMRが最大の帯
域を検出し、その帯域から優先的にビット数の割り当て
を行う。SNR is subtracted from SMR in each band to calculate NMR. In each band, the band in which NMR is maximum is detected, and the number of bits is preferentially assigned from that band.
【0024】そして、使用可能なビット数が割り当てら
れたときに、ビットアロケーションの処理が終了する。Then, when the number of usable bits is allocated, the bit allocation process ends.
【0025】[0025]
【発明が解決しようとする課題】前記のビットアロケー
ションは、マスキングしきい値算出結果に基づいて、大
きいダイナミックレンジを必要とする帯域から優先的に
ビット数を割り当てている。図10は、従来の技術にお
けるビットアロケーション算出結果を示す模式図であ
る。In the above bit allocation, the number of bits is preferentially allocated from the band requiring a large dynamic range based on the masking threshold value calculation result. FIG. 10 is a schematic diagram showing a bit allocation calculation result in the conventional technique.
【0026】図10に示すように、大きいダイナミック
レンジを必要とする帯域から優先的にビット数を割り当
てるため、高い周波数の帯域において、ビット数の割り
当てられない帯域が存在することになる。ビット数の割
り当てられない帯域の存在する伝送系を伝送した場合、
その信号を再生した音は、例えば楽器の倍音が歪み、楽
器に同期した高域のノイズとして検出され、聴感上悪影
響を及ぼす。As shown in FIG. 10, since the number of bits is preferentially assigned from the band requiring a large dynamic range, there is a band in which the number of bits is not assigned in the high frequency band. When transmitting a transmission system that has a band where the number of bits is not allocated,
The sound reproduced from the signal is distorted as an overtone of the musical instrument, for example, and is detected as high-frequency noise synchronized with the musical instrument, which adversely affects the hearing.
【0027】以上のことを鑑み、本発明は、ビットの割
り当てを行う符号化方法及び符号化装置において、適応
的なビット割当方法を用いて、高域の歪を低減すること
を目的とする。In view of the above, it is an object of the present invention to reduce distortion in a high frequency band by using an adaptive bit allocation method in a coding method and a coding apparatus for allocating bits.
【0028】[0028]
【課題を解決するための手段】本発明による音声符号化
方法は、入力信号を複数の帯域に分割して、それぞれの
帯域の信号レベルとマスキングレベルとの比を基に、情
報量の割り当てを決定する情報量割当手段を持つ音声符
号化方法において、情報量割当手段は、それぞれの帯域
毎に信号レベルと最小可聴限レベルとの比を求める信号
最小可聴限比検出ステップと、信号最小可聴限比検出ス
テップで求めた信号レベルと最小可聴限レベルとの比の
うち、少なくとも1つの帯域の比を基に伝送すべき最小
となる信号レベルと最小可聴限レベルとの比を求める最
小信号最小可聴限比検出ステップと、最小信号最小可聴
限比検出ステップにおいて、最小となる信号レベルと最
小可聴限レベルとの比以上の信号レベルと最小可聴限レ
ベルとの比を持つ帯域を抽出する帯域抽出ステップと、
帯域抽出ステップで抽出した帯域の情報量と各帯域にお
ける情報量の最低割当量を比較する割当量比較ステップ
と、割当量比較ステップで比較した帯域のうち、最低割
当量以下のとき、最低割当量を割り当てる最低割当ステ
ップを有することを特徴とする。A speech coding method according to the present invention divides an input signal into a plurality of bands and allocates an information amount based on a ratio between a signal level and a masking level of each band. In the speech coding method having the information amount allocating means for deciding, the information amount allocating means comprises a signal minimum audibility ratio detecting step for obtaining a ratio between a signal level and a minimum audible level for each band, and a signal minimum audible limit. Minimum signal minimum audibility for determining the ratio of the minimum signal level and minimum audible level to be transmitted based on the ratio of at least one band among the ratios of the signal level and the minimum audible level obtained in the ratio detection step. In the limit ratio detection step and the minimum signal minimum audible limit ratio detection step, the ratio of the signal level and the minimum audible level that are equal to or higher than the ratio of the minimum signal level and the minimum audible level is A band extraction step of extracting a frequency band,
The allocation amount comparison step that compares the information amount of the band extracted in the band extraction step with the minimum allocation amount of the information amount in each band, and the minimum allocation amount that is less than or equal to the minimum allocation amount among the bands compared in the allocation amount comparison step Is characterized by having a minimum allocation step of allocating.
【0029】本発明による音声符号化方法は、入力信号
を複数の帯域に分割して、それぞれの帯域の信号レベル
とマスキングレベルとの比を基に、情報量の割り当てを
決定する情報量割当手段を持つ音声符号化装置におい
て、情報量割当手段は、それぞれの帯域毎に信号レベル
と最小可聴限レベルとの比を求める信号最小可聴限比検
出手段と、信号最小可聴限比検出手段で求めた信号レベ
ルと最小可聴限レベルとの比のうち、少なくとも1つの
周波数帯域の比を基に伝送すべき最小となる信号レベル
と最小可聴限レベルとの比を求める最小信号最小可聴限
比検出手段と、最小信号最小可聴限比検出手段の最小と
なる信号レベルと最小可聴限レベルとの比以上の信号レ
ベルと最小可聴限レベルとの比を持つ帯域を抽出する帯
域抽出手段と、帯域抽出手段で抽出した帯域の情報量と
各帯域における情報量の最低割当量とを比較する割当量
比較手段と、割当量比較手段で比較した帯域のうち、情
報量が前記最低割当量以下のとき、最低割当量を割り当
てる最低割当手段を有することを特徴とする。In the voice coding method according to the present invention, the input signal is divided into a plurality of bands, and the information amount allocation means determines the allocation of the information amount based on the ratio between the signal level and the masking level of each band. In the speech coding apparatus having, the information amount assigning means obtains the signal minimum audible ratio detecting means for obtaining the ratio between the signal level and the minimum audible level for each band, and the signal minimum audible ratio detecting means. A minimum signal minimum audibility ratio detecting means for obtaining a ratio between the minimum signal level and the minimum audible level to be transmitted based on the ratio of at least one frequency band among the ratios of the signal level and the minimum audible level. Band extraction means for extracting a band having a ratio of the signal level and the minimum audible level that is equal to or higher than the ratio between the minimum signal level and the minimum audible level of the minimum signal minimum audible ratio detection means; When the amount of information is less than or equal to the minimum amount of allocation among the amounts of information of the bands extracted by the output unit and the minimum amount of allocation of information in each band, and the bands compared by the amount of comparison unit , And has a minimum allocation means for allocating the minimum allocation amount.
【0030】また、音声符号化装置において、信号最小
可聴限比検出手段で求めた信号レベルと最小可聴限レベ
ルの比のうち、少なくとも1つの帯域の比を伝送すべき
最小となる信号レベルと最小可聴限レベルの比とするこ
とを特徴とする。Further, in the speech coding apparatus, of the ratio of the signal level obtained by the signal minimum audibility ratio detecting means and the minimum audible level, the minimum signal level and the minimum signal level for transmitting at least one band ratio. It is characterized in that it is a ratio of audible limits.
【0031】また、音声符号化装置において、信号最小
可聴限比検出手段で求めた信号レベルと最小可聴限レベ
ルの比のうち、少なくとも1つの帯域の比から帯域に割
り当てられた信号レベルとノイズレベルの比を減算して
得た値を、伝送すべき最小となる信号レベルと最小可聴
限レベルの比とすることを特徴とする。Further, in the speech coding apparatus, the signal level and the noise level assigned to the band from the ratio of at least one band among the ratios of the signal level and the minimum audible level obtained by the signal minimum audible ratio detecting means. It is characterized in that the value obtained by subtracting the ratio of is the ratio of the minimum signal level to be transmitted and the minimum audible level.
【0032】[0032]
【作用】本発明によれば、ノイズレベルとマスキングレ
ベルの比と、信号レベルと最小可聴限レベルの比を求
め、各帯域の中で最大のノイズレベルとマスキングレベ
ルの比をもつ帯域を検出し、その帯域にビットを割り当
てる。その帯域の信号レベルと最小可聴限レベルの比
を、そのまま伝送すべき可聴可能な信号レベルと最小可
聴限レベルの比のしきい値とし、その信号レベルと最小
可聴限レベルの比のしきい値以上の信号レベルと最小可
聴限レベルの比をもつ帯域に対し、必要最小限のビット
数を割り当てることにより、高い周波数域でのビットが
割り当てられない帯域の存在を防ぐことができる。According to the present invention, the ratio between the noise level and the masking level and the ratio between the signal level and the minimum audible level are obtained, and the band having the maximum ratio between the noise level and the masking level is detected. , Allocate bits to that band. The ratio of the signal level of the band and the minimum audible level is used as the threshold value of the ratio of the audible signal level and the minimum audible level to be transmitted as it is, and the threshold value of the ratio of the signal level and the minimum audible level. By allocating the required minimum number of bits to the band having the ratio of the above signal level and the minimum audible level, it is possible to prevent the existence of the band in which the bit is not allocated in the high frequency range.
【0033】また、ノイズレベルとマスキングレベルの
比と、信号レベルと最小可聴限レベルの比を求め、ノイ
ズレベルとマスキングレベルの比によって、ある帯域に
ビットが割り当てられ、そのビットを割り当てた後の信
号レベルとノイズレベルの比を算出し、その帯域の信号
レベルと最小可聴限レベルの比から前記の信号レベルと
ノイズレベルの比を減算することで、可聴可能な信号レ
ベルと最小可聴限レベルの比のしきい値を求め、その可
聴可能な信号レベルと最小可聴限レベルの比のしきい値
より大きい信号レベルと最小可聴限レベルの比をもつ帯
域に対し、必要最小限のビット数を割り当てることによ
り、高い周波数域でのビットが割り当てられない帯域の
存在を防ぐことができる。Further, the ratio between the noise level and the masking level and the ratio between the signal level and the minimum audible level are obtained, and a bit is assigned to a certain band according to the ratio between the noise level and the masking level. The ratio of the signal level and the noise level is calculated, and the ratio of the signal level and the noise level is subtracted from the ratio of the signal level and the minimum audible level of the band to determine the audible signal level and the minimum audible level. Obtain the ratio threshold and assign the minimum required number of bits to a band with a signal level-minimum audible level ratio greater than the audible signal level-minimum audible level ratio threshold. As a result, it is possible to prevent the existence of a band in which bits are not allocated in a high frequency range.
【0034】[0034]
【実施例】本発明の実施例を図1、図2、図3、図4、
図5に基づいて説明する。図1は、本発明による一実施
例を示すフローチャート図である。図2は、マスキング
効果の概要説明図である。図3は、最小可聴限の概要説
明図である。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention are shown in FIGS.
A description will be given based on FIG. FIG. 1 is a flowchart showing an embodiment according to the present invention. FIG. 2 is a schematic explanatory diagram of the masking effect. FIG. 3 is a schematic explanatory diagram of the minimum audible limit.
【0035】図1において、101は初期値設定ステッ
プ、102はノイズマスキング比及び信号最小可聴限比
算出ステップ、103は最大ノイズマスキング比帯域検
出ステップ、104はノイズマスキング比比較ステッ
プ、105は第1ノイズマスキング比更新ステップ、1
06は信号最小可聴限比しきい値算出ステップ、107
は信号最小可聴限比比較ステップ、108は最低情報割
当量比較ステップ、109は第2ノイズマスキング比更
新ステップ、110は帯域検出ステップ、111は必要
情報量算出ステップ、112は情報量比較ステップ、1
13は更新キャンセルステップである。In FIG. 1, 101 is an initial value setting step, 102 is a noise masking ratio and signal minimum audible ratio calculating step, 103 is a maximum noise masking ratio band detecting step, 104 is a noise masking ratio comparing step, and 105 is a first step. Noise masking ratio update step, 1
06 is a signal minimum audibility ratio threshold calculation step, 107
Is a signal minimum audibility ratio comparing step, 108 is a minimum information allocation amount comparing step, 109 is a second noise masking ratio updating step, 110 is a band detecting step, 111 is a necessary information amount calculating step, 112 is an information amount comparing step, 1
Reference numeral 13 is an update cancellation step.
【0036】信号最小可聴限比検出ステップはノイズマ
スキング比及び信号最小可聴限比算出ステップ102で
あり、最小信号最小可聴限比検出ステップは信号最小可
聴限比しきい値算出ステップ106であり、帯域抽出ス
テップは信号最小可聴限比比較ステップ107であり、
割当量比較ステップは最低情報割当量検出ステップ10
8であり、最低割当ステップは第2ノイズマスキング比
更新ステップ109である。The signal minimum audibility ratio detection step is a noise masking ratio and signal minimum audibility ratio calculation step 102, the minimum signal minimum audibility ratio detection step is a signal minimum audibility ratio threshold calculation step 106, and the band The extraction step is a signal minimum audibility ratio comparison step 107,
The allocation comparison step is the minimum information allocation detection step 10
8 and the lowest allocation step is the second noise masking ratio updating step 109.
【0037】本発明のビットアロケーションの処理方法
における各ステップの処理について説明する。以下、信
号最小可聴限比(Signal Threshold
of Audibility Ratio)をSARと
する。The processing of each step in the bit allocation processing method of the present invention will be described. Hereinafter, the signal minimum audible ratio (Signal Threshold
of Audio Ratio) to SAR.
【0038】初期値設定ステップ101は、全帯域に割
り当てるビット数を初期値(通常は0)に設定し、各帯
域の信号レベルとマスキングしきい値の比から信号マス
キング比SMRを算出する。In the initial value setting step 101, the number of bits assigned to all bands is set to an initial value (usually 0), and the signal masking ratio SMR is calculated from the ratio of the signal level of each band to the masking threshold value.
【0039】ここで、マスキングとは、図2に示すよう
に、例えば、静寂な環境ではせせらぎの音を聞き取れる
が、嵐の中では聞き取れないことがある。つまり、2つ
以上の音がある場合、一方の音によって他方が邪魔され
て聞こえなくなる状態をいう。マスキングしきい値は、
各分割された帯域でのマスキングのレベルのことをい
う。Here, masking means that, as shown in FIG. 2, for example, the sound of murmuring can be heard in a quiet environment, but it may not be heard in a storm. In other words, when there are two or more sounds, it means that one sound interferes with the other and cannot be heard. The masking threshold is
It refers to the level of masking in each divided band.
【0040】ノイズマスキング比及び信号最小可聴限比
算出ステップ(以下NMR及びSAR算出ステップとい
う。)102は、SMRから各帯域に割り当てた情報か
ら導かれる信号と量子化ノイズとの比である信号ノイズ
比SNRを減算することにより、各帯域のノイズマスキ
ング比NMRを求める。それとともに、各帯域の信号レ
ベルと最小可聴限レベルとの比SARを算出するもので
ある。A noise masking ratio and signal minimum audibility ratio calculating step (hereinafter referred to as NMR and SAR calculating step) 102 is a signal noise which is a ratio of a signal derived from information allocated from the SMR to each band and a quantization noise. The noise masking ratio NMR of each band is obtained by subtracting the ratio SNR. At the same time, the ratio SAR between the signal level of each band and the minimum audible limit level is calculated.
【0041】ここで、最小可聴限とは、例えば、静寂時
に聴覚が検知できる音圧の最小レベルのことをいい、図
3に示すような特性をもつ。一般に静寂時ではノイズの
限界に関係し、音の周波数(音の高低)によって最小可
聴限が異なる。Here, the minimum audible limit refers to, for example, the minimum level of sound pressure that can be detected by the auditory sense during silence, and has a characteristic as shown in FIG. Generally, in quiet time, it is related to the limit of noise, and the minimum audible limit varies depending on the frequency of the sound (the pitch of the sound).
【0042】最大ノイズマスキング比帯域検出ステップ
(以下NMRB検出ステップという。)103は、全帯
域の中で最大のNMRを持つ帯域を選択する。The maximum noise masking ratio band detection step (hereinafter referred to as NMRB detection step) 103 selects a band having the maximum NMR among all bands.
【0043】ノイズマスキング比比較ステップ(以下N
MR比較ステップという。)104は、NMRBのNM
Rが情報を割り当てる最小割当しきい値に達しているか
どうかを判断するものである。Noise masking ratio comparison step (hereinafter N
This is called MR comparison step. ) 104 is NM of NMRB
It is for determining whether R has reached a minimum allocation threshold for allocating information.
【0044】ここで、最小割当しきい値は、ビット数を
割り当てるための最小のNMRのしきい値を示するもの
である。つまり、マスキングしきい値より小さいNMR
をもつ帯域に対して、多くのビット数を割り当てても、
ビットを割り当てる意味がなくなる。NMRのしきい値
を設け、そのNMRのしきい値より小さい帯域には、ビ
ット数の割り当て処理を行わないようにするためのしき
い値である。一般的に、この最小割当しきい値は、極小
の値(例えばマイナス無限大)を用いる。Here, the minimum allocation threshold indicates the minimum NMR threshold for allocating the number of bits. In other words, NMR smaller than the masking threshold
Even if a large number of bits are assigned to the band having
There is no point in allocating bits. This is a threshold value for providing a threshold value for NMR and for not performing the bit number allocation processing in a band smaller than the threshold value for NMR. Generally, this minimum allocation threshold value uses a minimum value (for example, minus infinity).
【0045】第1ノイズマスキング比更新ステップ(以
下第1NMR更新ステップという。)105は、NMR
Bのビット数を1段階(1ビット)増加し、増加したビ
ット数から導かれるSNRをSMRから減算することに
よりNMRを更新するものである。SNRは、ビット数
を1ビット増加すると、量子化ノイズが減少するため、
その帯域のSNRは増加する。The first noise masking ratio updating step (hereinafter referred to as the first NMR updating step) 105 is an NMR.
The number of bits of B is increased by one step (1 bit), and the SNR derived from the increased number of bits is subtracted from SMR to update the NMR. In SNR, when the number of bits is increased by 1 bit, the quantization noise decreases,
The SNR for that band increases.
【0046】信号最小可聴限比しきい値算出ステップ
(以下SARしきい値算出ステップという。)106
は、NMRBにおけるSARから伝送すべき最小の信号
最小可聴限比しきい値(以下SARしきい値という。)
を求めるものである。Signal minimum audibility ratio threshold calculation step (hereinafter referred to as SAR threshold calculation step) 106.
Is the minimum signal minimum audible ratio threshold (hereinafter referred to as SAR threshold) that should be transmitted from the SAR in NMRB.
Is to seek.
【0047】ここで、SARしきい値の算出は、1番目
として、NMRBで求めたSARをSARしきい値とす
る方法と、2番目として、NMRBで求めたSARから
当該帯域のビット割り当てによるSNRを減算し、それ
により求めた値をSARしきい値とする2通りの方法が
ある。Here, the SAR threshold is calculated firstly by using the SAR obtained by NMRB as the SAR threshold, and secondly by the SAR obtained by NMRB by SNR by bit allocation of the band. Is subtracted, and the value obtained thereby is used as the SAR threshold value.
【0048】これらの2通りの方法のうち、1番目の方
法は処理が容易であるが、本実施例では、2番目の方法
を用いた場合を説明する。2番目の方法は、1番目の方
法より、聴感上重要であるが伝送されない帯域が少なく
なるため、聴感上良好なビット割り当てが行われる。本
実施例では、NMRBで求めたSARから当該帯域のビ
ット割り当てによるSNRを減算し、それにより求めた
値をSARしきい値とする方法で説明をする。Of these two methods, the first method is easy to process, but in this embodiment, the case of using the second method will be described. The second method is less perceptually important but less transmitted than the first method, so that bit allocation which is good for hearing is performed. In this embodiment, a method will be described in which the SNR obtained by NMRB is subtracted from the SNR obtained by bit allocation in the band, and the value obtained by the subtraction is used as the SAR threshold.
【0049】信号最小可聴限比比較ステップ107は、
各帯域のSARとSARしきい値を比較し、そのSAR
がSARしきい値以上である帯域を検出するものであ
る。The signal minimum audibility ratio comparison step 107 is
SAR of each band and SAR threshold are compared, and the SAR
Is for detecting a band that is equal to or higher than the SAR threshold.
【0050】最低情報割当量比較ステップ108は、S
ARしきい値以上のSARを持つ帯域のビット数と最低
割当ビット数を比較するものである。The minimum information allocation amount comparison step 108 is S
The number of bits in a band having a SAR equal to or larger than the AR threshold is compared with the minimum number of allocated bits.
【0051】ここで、最低割当ビット数は、予め規定し
ているものであり、例えば、No.0〜No.31の3
2の帯域があった場合、No.0〜No.7までの帯域
を3ビット、No.8〜No.31までの帯域を2ビッ
トとする。Here, the minimum number of allocated bits is defined in advance, for example, No. 0-No. 31 of 3
When there is a band of No. 2, No. 0-No. Bands up to 7 are 3 bits, No. 8 to No. The band up to 31 is 2 bits.
【0052】第2ノイズマスキング比更新ステップ(以
下第2NMR更新ステップという。)109は、SAR
しきい値未満のSARを持つ帯域のビット数を最低割当
ビット数へ変更し、SMRから変更したビット数から導
かれるSNRを減算することで、帯域のNMRを更新す
るものである。The second noise masking ratio updating step (hereinafter referred to as the second NMR updating step) 109 is performed by the SAR.
The number of bits in the band having the SAR less than the threshold is changed to the minimum number of allocated bits, and the SNR derived from the changed number of bits is subtracted from the SMR to update the NMR of the band.
【0053】帯域検出ステップ110は、全ての帯域に
ビットが割り当てられたかを検出するものである。The band detection step 110 detects whether or not bits have been allocated to all bands.
【0054】必要情報量算出ステップ111は、更新後
の情報割当量についての必要とするビット数を算出する
ものである。The necessary information amount calculation step 111 calculates the required number of bits for the updated information allocation amount.
【0055】情報量比較ステップ112は、必要とする
ビット数と使用可能なビット数とを比較するものであ
る。The information amount comparing step 112 compares the required bit number with the usable bit number.
【0056】更新キャンセルステップ113は、ビット
数の更新をもとに戻し、NMRBのNMRを最小割当し
きい値に設定するものである。The update cancel step 113 returns the update of the number of bits to the original value and sets the NMR of NMRB to the minimum allocation threshold value.
【0057】以上の各ステップによるビットアロケーシ
ョンの処理動作を説明する。初期値設定ステップ101
は、ある帯域幅で帯域分割された入力信号に対し、全帯
域に割り当てるビット数を初期値(通常は0ビット)に
設定するとともに、その各帯域の信号とマスキングしき
い値の比からSMRを算出する。The bit allocation processing operation in each of the above steps will be described. Initial value setting step 101
Sets the number of bits to be allocated to all bands to an initial value (usually 0 bit) for an input signal band-divided by a certain bandwidth, and calculates the SMR from the ratio of the signal in each band to the masking threshold value. calculate.
【0058】そして、NMR及びSAR算出ステップ1
02は、各帯域に割り当てられたビット数から導かれる
SNRを前記のSMRから減算し、各帯域のNMRを算
出する。NMRの算出と同時に、各帯域の信号レベルと
最小可聴限レベルとの比であるSARも算出する。Then, the NMR and SAR calculation step 1
02 subtracts the SNR derived from the number of bits allocated to each band from the SMR to calculate the NMR of each band. Simultaneously with the calculation of NMR, SAR, which is the ratio between the signal level of each band and the minimum audible level, is also calculated.
【0059】NMRB検出ステップ103は、NMR及
びSAR算出ステップ102で算出したNMRが全体の
帯域の中で、最大のNMRを持つ帯域を選択する。In the NMRB detection step 103, the band having the maximum NMR is selected from the entire bands calculated by the NMR and the SAR calculation step 102.
【0060】そして、NMR比較ステップ104は、N
MRB検出ステップ103で選択されたNMRBのNM
Rが、ビット数を割り当てる最小割当しきい値に達して
いるかどうかを判断し、その最小割当しきい値に達して
いればビットアロケーションは終了し、その最小割当し
きい値に達してなければ第1NMR更新ステップ105
でNMRの更新を行う。Then, in the NMR comparison step 104, N
NM of NMRB selected in MRB detection step 103
R determines whether the minimum allocation threshold for allocating the number of bits is reached, and if the minimum allocation threshold is reached, the bit allocation ends, and if the minimum allocation threshold is not reached, the first allocation is finished. 1 NMR update step 105
To update the NMR.
【0061】第1NMR更新部105では、NMRBの
ビット数を1段階(1ビット)増加し、増加されたビッ
ト数からSNRを導き、そのSNRをSMRから減算す
ることでNMRを算出し、新たなNMRとして更新す
る。In the first NMR updating unit 105, the number of bits of NMRB is increased by one step (1 bit), the SNR is derived from the increased number of bits, and the SNR is subtracted from the SMR to calculate the NMR, and a new NMR is calculated. Update as NMR.
【0062】次に、SARしきい値算出ステップ106
で、NMRBにおけるSARから伝送すべき最小の信号
最小可聴限比しきい値(以下SARしきい値という。)
を算出する。Next, SAR threshold calculation step 106
Then, the minimum signal minimum audibility ratio threshold value (hereinafter referred to as SAR threshold value) to be transmitted from SAR in NMRB.
To calculate.
【0063】SAR比較ステップ107は、各帯域毎の
SARとNMRBのSARしきい値を比較し、SARが
SARしきい値以上の帯域の場合、最低情報割当量比較
ステップ108の処理を行い、SARがSARしきい値
未満の帯域の場合、帯域検出ステップ110の処理を行
う。The SAR comparison step 107 compares the SAR threshold of each band with the SAR threshold of the NMRB. If the SAR is a band equal to or more than the SAR threshold, the process of the minimum information allocation amount comparison step 108 is performed, and the SAR is compared. Is less than the SAR threshold, the process of band detection step 110 is performed.
【0064】SARがSARしきい値以上であった場
合、最低情報割当量比較ステップ108は、SARがS
ARしきい値以上であった帯域のビット数を最低割当ビ
ット数と比較し、最低割当ビット数に満たないビット数
であれば、第1NMR更新部109の処理を行い、最低
割当ビット数以上であれば、帯域検出ステップ110の
処理を行う。If SAR is greater than or equal to the SAR threshold, the minimum information allocation comparison step 108 is
The number of bits in the band that is equal to or larger than the AR threshold value is compared with the minimum number of allocated bits, and if the number of bits is less than the minimum allocated number of bits, the first NMR updating unit 109 performs the process so that If there is, the processing of band detection step 110 is performed.
【0065】第2NMR更新部109は、ビット数が最
低割当ビット数未満と判断された帯域のビット数を、最
低割当ビット数へ変更し、変更したビット数からSNR
を導き、そのSNRからSMRを減算してNMRを算出
する。そのNMRは、当該帯域のNMRとして更新す
る。その後、帯域検出ステップ110の処理を行う。The second NMR updating unit 109 changes the bit number of the band whose bit number is determined to be less than the minimum allocated bit number to the minimum allocated bit number, and then changes the SNR from the changed bit number.
Is derived, and SMR is subtracted from the SNR to calculate NMR. The NMR is updated as the NMR of the band. Then, the process of band detection step 110 is performed.
【0066】帯域検出ステップ110では、SAR比較
ステップ107、最低情報割当量比較ステップ108、
第2NMR更新部109のそれぞれの処理が、SAR比
較ステップ107で選択された全ての帯域に対して行わ
れたかを検出し、まだ処理を施されていない帯域があっ
た場合は、SAR比較ステップ107の処理に戻る。S
AR比較ステップ107で選択された全ての帯域に対し
て処理が施されたと判断すると、次に、必要情報量算出
ステップ111は、更新された後のビット数について、
必要ビット数を算出する。In the band detection step 110, the SAR comparison step 107, the minimum information allocation amount comparison step 108,
It is detected whether or not each processing of the second NMR updating unit 109 has been executed for all the bands selected in the SAR comparison step 107, and if there is a band that has not been processed yet, the SAR comparison step 107 Return to processing. S
When it is determined that the processing has been performed on all the bands selected in the AR comparison step 107, the necessary information amount calculation step 111 then determines the number of bits after the update,
Calculate the required number of bits.
【0067】そして、情報量比較ステップ112は、必
要ビット数と使用可能ビット数を比較し、必要ビット数
が使用可能ビット数以下であれば、ビット数及びNMR
の更新を受け入れ、最大ノイズマスキング比帯域検出部
104の処理を行う。また、必要ビット数が使用可能ビ
ット数より大きければ、全ての帯域に対して更新キャン
セルステップ113の処理を行う。The information amount comparing step 112 compares the required number of bits with the usable number of bits, and if the required number of bits is less than the usable number of bits, the number of bits and the NMR
Is accepted and the processing of the maximum noise masking ratio band detection unit 104 is performed. If the required number of bits is larger than the usable number of bits, the update cancel step 113 is performed on all the bands.
【0068】更新キャンセルステップ113は、ビット
数の更新をもとの値に戻し、NMRBのNMRを最小割
当しきい値に設定する。そして、最大ノイズマスキング
比帯域検出ステップ104の処理を行う。In the update cancel step 113, the update of the number of bits is returned to the original value, and the NMR of NMRB is set to the minimum allocation threshold value. Then, the maximum noise masking ratio band detection step 104 is performed.
【0069】以上の処理を繰り返し行い、全ての帯域に
おいてビットの割り当てが施される。The above processing is repeated to assign bits in all bands.
【0070】具体的な処理を図4、図5の模式図を用い
て説明する。図4は、本発明によるビットアロケーショ
ンの情報割当量を模式的に示した図である。図5は、S
ARしきい値算出結果を模式的に示した図である。Specific processing will be described with reference to the schematic diagrams of FIGS. FIG. 4 is a diagram schematically showing the information allocation amount of bit allocation according to the present invention. FIG. 5 shows S
It is the figure which showed the AR threshold calculation result typically.
【0071】例えば、全帯域に割り当てるビット数を初
期値0ビットに設定し、各帯域のSMRを算出する。そ
のSMRと各帯域のSNRからNMRを算出する。それ
と同時に、各帯域のSARを算出する。For example, the number of bits assigned to all bands is set to an initial value of 0 bits, and the SMR of each band is calculated. NMR is calculated from the SMR and the SNR of each band. At the same time, the SAR of each band is calculated.
【0072】各帯域の中で最大のNMRをもつ帯域を検
出し、その帯域がNo.16であるとする。このNo.
16をNMRBとして、No.16のNMRが最小割当
しきい値に達しているかを判断する。NMRが最小割当
しきい値より小さい場合は、ビットアロケーションを終
了する。The band having the maximum NMR is detected in each band, and that band is No. Assume that it is 16. This No.
No. 16 as NMRB. Determine if 16 NMR has reached the minimum assigned threshold. If the NMR is less than the minimum allocation threshold, terminate bit allocation.
【0073】NMRBであるNo.16のNMRが最小
割当しきい値に達していれば、No.16のビット数を
1段階増加し、増加したビット数から導かれるSNRか
らNMRを算出し、そのNMRをNo.16のNMRと
して更新する。NMRB No. If the 16 NMR has reached the minimum assigned threshold, No. The number of bits of 16 is increased by one step, the NMR is calculated from the SNR derived from the increased number of bits, and the NMR is calculated as No. 16 NMR is updated.
【0074】次に、この帯域のSARを求め、SARし
きい値として設定する。Next, the SAR of this band is obtained and set as the SAR threshold.
【0075】このNo.16のSARしきい値と各帯域
のSARを比較し、No.16のSARしきい値より大
きいSARを持つ帯域を検出する。No.16のSAR
しきい値より大きいSARを持つ帯域が、No.1、N
o.3、No.6・・・等とする。This No. No. 16 is compared with the SAR threshold of 16 and the SAR of each band. Detect bands with SAR greater than 16 SAR threshold. No. 16 SAR
The band having the SAR larger than the threshold is No. 1, N
o. 3, No. 6 ... etc.
【0076】まず、この中のNo.1の帯域について、
割り当てられているビット数と当該帯域の最低割当ビッ
ト数を比較し、最低割当ビット数未満であれば最低割当
ビット数に変更し、更新したビット数から導かれたSN
RからNMRを求め、そのNMRを更新した後、次の帯
域のSARとSARしきい値との比較処理が行われる。First of all, For 1 band,
The allocated number of bits is compared with the minimum allocated bit number of the band, and if it is less than the minimum allocated bit number, it is changed to the minimum allocated bit number and the SN derived from the updated bit number
After obtaining the NMR from R and updating the NMR, the SAR of the next band and the SAR threshold value are compared.
【0077】また、No.1の帯域のビット数が最低割
当ビット数以上であれば、次の帯域のSARとSARし
きい値との比較処理が行われる。No. If the number of bits in one band is equal to or more than the minimum number of allocated bits, the SAR of the next band is compared with the SAR threshold value.
【0078】そして、SARしきい値を超える帯域の検
出がすべて終了すると、No.16がNMRBであった
場合、更新したビット数について、必要ビット数を算出
する。When the detection of all the bands exceeding the SAR threshold is completed, No. If 16 is NMRB, the required number of bits is calculated for the updated number of bits.
【0079】その必要ビット数と使用可能ビット数を比
較し、必要ビット数が使用可能ビット数以下であれば、
ビット数の更新を受け入れ、再度NMRBの検出処理を
行う。The required number of bits and the usable number of bits are compared, and if the required number of bits is less than or equal to the usable number of bits,
The update of the bit number is accepted, and the NMRB detection process is performed again.
【0080】必要ビット数が使用可能ビット数より大き
ければ、ビット数の更新をキャンセルし、NMRBであ
るNo.16のNMRを最小割当しきい値に設定し、そ
の後NMRBの検出処理を行う。If the required number of bits is larger than the number of usable bits, the updating of the number of bits is canceled and the No. 16 NMR is set to the minimum allocation threshold value, and then NMRB detection processing is performed.
【0081】NMRBの検出処理を繰り返し行い、最後
に、NMRBのNMRが最小割当しきい値以下になれ
ば、ビットアロケーションの処理を終了する。The process of detecting the NMRB is repeated, and finally, when the NMR of the NMRB falls below the minimum allocation threshold value, the process of bit allocation is terminated.
【0082】高い帯域は、比較的信号レベルが低く、マ
スキングされやすいため、ダイナミックレンジが小さ
い。そのため、ビット数が割り当てられないこともある
が、本発明のように、ダイナミックレンジの小さい帯域
でも、聴覚特性を利用して最低のビット数を割り当てる
ことにより、ビット割り当てのない帯域が減少し、聴感
上の悪影響を及ぼす歪を防止することができる。The high band has a relatively low signal level and is easily masked, so that the dynamic range is small. Therefore, the number of bits may not be assigned, but even in a band with a small dynamic range, by assigning the lowest number of bits by using the auditory characteristics, the band without bit assignment decreases, It is possible to prevent distortion that adversely affects hearing.
【0083】[0083]
【発明の効果】本発明によれば、定められたビット数の
範囲で、信号にビットアロケーションの処理を施す場
合、ビットアロケーションにより生じる聴感上の悪影響
を防止し、音質が改善される。According to the present invention, when bit allocation processing is performed on a signal within a predetermined number of bits, the audible adverse effect caused by the bit allocation is prevented and the sound quality is improved.
【図1】本発明における一実施例を示すフロチャートで
ある。FIG. 1 is a flow chart showing an example of the present invention.
【図2】マスキング効果を示す概要説明図である。FIG. 2 is a schematic explanatory view showing a masking effect.
【図3】最小可聴限を示す概要説明図である。FIG. 3 is a schematic explanatory diagram showing a minimum audible limit.
【図4】本発明におけるビットアロケーションの情報割
当量を模式的に示す図である。FIG. 4 is a diagram schematically showing an information allocation amount of bit allocation in the present invention.
【図5】本発明におけるSARしきい値算出結果を模式
的に示した図である。FIG. 5 is a diagram schematically showing a SAR threshold value calculation result in the present invention.
【図6】従来の符号化装置を示す概略ブロック図であ
る。FIG. 6 is a schematic block diagram showing a conventional encoding device.
【図7】従来のビットアロケーションの処理を示すフロ
チャートである。FIG. 7 is a flowchart showing a conventional bit allocation process.
【図8】従来のビットアロケーシヨンの情報割当量を模
式的に示した図である。FIG. 8 is a diagram schematically showing an information allocation amount of a conventional bit allocation.
【図9】ビット数とSNRの関係を示す模式図である。
(a)は、2ビット割り当てた場合の模式図である。
(b)は、6ビット割り当てた場合の模式図である。FIG. 9 is a schematic diagram showing the relationship between the number of bits and SNR.
(A) is a schematic diagram when 2 bits are allocated.
(B) is a schematic diagram when 6 bits are allocated.
【図10】従来のビットアロケーション算出結果を模式
的に示した図である。FIG. 10 is a diagram schematically showing a conventional bit allocation calculation result.
101・・・初期値設定ステップ 102・・・ノイズマスキング比及び信号最小可聴限比
算出ステップ 103・・・最大ノイズマスキング比帯域検出ステップ 104・・・ノイズマスキング比比較ステップ 105・・・第1ノイズマスキング比更新ステップ 106・・・信号最小可聴限比しきい値算出ステップ 107・・・信号最小可聴限比比較ステップ 108・・・最低情報割当量検出ステップ 109・・・第2ノイズマスキング比更新ステップ 110・・・帯域検出ステップ 111・・・必要情報量算出ステップ 112・・・情報量比較ステップ 113・・・更新キャンセルステップ 601・・・帯域分割部 602・・・マスキングしきい値算出部 603・・・ビットアロケーション部 604・・・再量子化部 605・・・フォーマティング部 701・・・初期値設定ステップ 702・・・ノイズマスキング比算出ステップ 703・・・最大ノイズマスキング比帯域検出ステップ 704・・・ノイズマスキング比比較ステップ 705・・・ノイズマスキング比更新ステップ 706・・・必要情報量算出ステップ 707・・・情報量比較ステップ 708・・・更新キャンセルステップ101 ... Initial value setting step 102 ... Noise masking ratio and signal minimum audibility ratio calculation step 103 ... Maximum noise masking ratio band detection step 104 ... Noise masking ratio comparison step 105 ... First noise Masking ratio updating step 106 ... Signal minimum audible ratio threshold calculating step 107 ... Signal minimum audible ratio comparing step 108 ... Minimum information allocation amount detecting step 109 ... Second noise masking ratio updating step 110 ... Band detection step 111 ... Necessary information amount calculation step 112 ... Information amount comparison step 113 ... Update cancellation step 601 ... Band division unit 602 ... Masking threshold value calculation unit 603. .... Bit allocation unit 604 ... Requantization unit 605 ... Adjusting unit 701 ... Initial value setting step 702 ... Noise masking ratio calculation step 703 ... Maximum noise masking ratio band detection step 704 ... Noise masking ratio comparison step 705 ... Noise masking ratio updating step 706. .. Necessary information amount calculation step 707 ... Information amount comparison step 708 ... Update cancellation step
Claims (4)
の帯域の信号レベルとマスキングレベルとの比を基に情
報量の割り当てを決定する情報量割当手段を持つ音声符
号化方法において、前記情報量割当手段は、それぞれの
帯域毎に信号レベルと最小可聴限レベルとの比を求める
信号最小可聴限比検出ステップと、該信号最小可聴限比
検出ステップで求めた信号レベルと最小可聴限レベルと
の比のうち少なくとも1つの帯域の比を基に伝送すべき
最小となる信号レベルと最小可聴限レベルとの比を求め
る最小信号最小可聴限比検出ステップと、該最小信号最
小可聴限比検出ステップにおいて最小となる信号レベル
と最小可聴限レベルとの比以上の信号レベルと最小可聴
限レベルとの比を持つ帯域を抽出する帯域抽出ステップ
と、該帯域抽出ステップで抽出した帯域の情報量と前記
各帯域における情報量の最低割当量を比較する割当量比
較ステップと、該割当量比較ステップで比較した帯域の
うち情報量が前記最低割当量以下のとき前記最低割当量
を割り当てる最低割当ステップを有することを特徴とす
る音声符号化方法。1. A speech coding method having information amount allocating means for dividing an input signal into a plurality of bands and deciding allocation of information amount based on a ratio of a signal level and a masking level in each band. The information amount allocating means includes a signal minimum audibility ratio detecting step for obtaining a ratio between a signal level and a minimum audible level for each band, and a signal level and a minimum audible level for the signal minimum audible ratio detecting step. A minimum signal minimum audibility ratio detecting step for obtaining a ratio between a minimum signal level and a minimum audible level to be transmitted based on a ratio of at least one band among the ratio of A band extraction step of extracting a band having a ratio of a signal level and a minimum audible level equal to or higher than a ratio of a minimum signal level and a minimum audible level in the step; When the amount of information in the bands compared in the band compared in the allocated amount comparison step and the amount of information of the band extracted in A speech coding method comprising: a minimum allocation step of allocating the minimum allocation amount.
の帯域の信号レベルとマスキングレベルとの比を基に情
報量の割り当てを決定する情報量割当手段を持つ音声符
号化装置において、前記情報量割当手段は、それぞれの
帯域毎に信号レベルと最小可聴限レベルとの比を求める
信号最小可聴限比検出手段と、該信号最小可聴限比検出
手段で求めた信号レベルと最小可聴限レベルとの比のう
ち少なくとも1つの周波数帯域の比を基に伝送すべき最
小となる信号レベルと最小可聴限レベルとの比を求める
最小信号最小可聴限比検出手段と、該最小信号最小可聴
限比検出手段の最小となる信号レベルと最小可聴限レベ
ルとの比以上の信号レベルと最小可聴限レベルとの比を
持つ帯域を抽出する帯域抽出手段と、該帯域抽出手段で
抽出した帯域の情報量と前記各帯域における情報量の最
低割当量とを比較する割当量比較手段と、該割当量比較
手段で比較した帯域のうち情報量が前記最低割当量以下
のとき前記最低割当量を割り当てる最低割当手段を有す
ることを特徴とする音声符号化装置。2. A speech coding apparatus having an information amount allocating means for dividing an input signal into a plurality of bands and deciding allocation of an information amount based on a ratio between a signal level and a masking level in each band. The information amount allocating means includes a signal minimum audibility ratio detecting means for obtaining a ratio between the signal level and the minimum audible level for each band, and a signal level and a minimum audible level for the signal minimum audible ratio detecting means. And a minimum signal minimum audibility ratio detecting means for obtaining a ratio between a minimum signal level and a minimum audible level to be transmitted based on a ratio of at least one frequency band among the ratios of the minimum signal and the minimum audible ratio. A band extracting unit that extracts a band having a ratio of a signal level and a minimum audible level that is equal to or higher than a ratio of the minimum signal level and the minimum audible level of the detecting unit, and information of the band extracted by the band extracting unit. Amount and a minimum allocation amount of the information amount in each band, and a minimum allocation amount of the minimum allocation amount when the information amount is less than or equal to the minimum allocation amount in the bands compared by the allocation amount comparing unit. A speech coding apparatus having an assigning means.
信号最小可聴限比検出手段で求めた信号レベルと最小可
聴限レベルの比のうち少なくとも1つの帯域の比を伝送
すべき最小となる信号レベルと最小可聴限レベルの比と
することを特徴とする音声符号化装置。3. The speech coding apparatus according to claim 2, wherein
It is characterized in that the ratio of at least one band of the ratio of the signal level and the minimum audible level obtained by the signal minimum audible ratio detecting means is set to the ratio of the minimum signal level to be transmitted and the minimum audible level. Speech coding device.
信号最小可聴限比検出手段で求めた信号レベルと最小可
聴限レベルの比のうち少なくとも1つの帯域の比から前
記帯域に割り当てられた信号レベルとノイズレベルの比
を減算して得た値を伝送すべき最小となる信号レベルと
最小可聴限レベルの比とすることを特徴とする音声符号
化装置。4. The speech coding apparatus according to claim 2, wherein
A value obtained by subtracting the ratio of the signal level and the noise level assigned to the band from the ratio of at least one band of the ratio of the signal level and the minimum audible level obtained by the signal minimum audible ratio detecting means is transmitted. A speech coding apparatus characterized by setting a ratio between a minimum signal level to be performed and a minimum audible level.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7041341A JPH08211899A (en) | 1995-02-06 | 1995-02-06 | Method and device for encoding voice |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7041341A JPH08211899A (en) | 1995-02-06 | 1995-02-06 | Method and device for encoding voice |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08211899A true JPH08211899A (en) | 1996-08-20 |
Family
ID=12605825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7041341A Withdrawn JPH08211899A (en) | 1995-02-06 | 1995-02-06 | Method and device for encoding voice |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08211899A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09321628A (en) * | 1996-05-29 | 1997-12-12 | Nec Corp | Voice coding device |
JP2009501945A (en) * | 2005-07-15 | 2009-01-22 | マイクロソフト コーポレーション | Frequency segmentation to obtain bands for efficient coding of digital media. |
US9026452B2 (en) | 2007-06-29 | 2015-05-05 | Microsoft Technology Licensing, Llc | Bitstream syntax for multi-process audio decoding |
JP2016085334A (en) * | 2014-10-24 | 2016-05-19 | 富士通株式会社 | Audio encoding device, audio encoding method, and audio encoding program |
US9443525B2 (en) | 2001-12-14 | 2016-09-13 | Microsoft Technology Licensing, Llc | Quality improvement techniques in an audio encoder |
-
1995
- 1995-02-06 JP JP7041341A patent/JPH08211899A/en not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09321628A (en) * | 1996-05-29 | 1997-12-12 | Nec Corp | Voice coding device |
US9443525B2 (en) | 2001-12-14 | 2016-09-13 | Microsoft Technology Licensing, Llc | Quality improvement techniques in an audio encoder |
JP2009501945A (en) * | 2005-07-15 | 2009-01-22 | マイクロソフト コーポレーション | Frequency segmentation to obtain bands for efficient coding of digital media. |
US9026452B2 (en) | 2007-06-29 | 2015-05-05 | Microsoft Technology Licensing, Llc | Bitstream syntax for multi-process audio decoding |
US9349376B2 (en) | 2007-06-29 | 2016-05-24 | Microsoft Technology Licensing, Llc | Bitstream syntax for multi-process audio decoding |
US9741354B2 (en) | 2007-06-29 | 2017-08-22 | Microsoft Technology Licensing, Llc | Bitstream syntax for multi-process audio decoding |
JP2016085334A (en) * | 2014-10-24 | 2016-05-19 | 富士通株式会社 | Audio encoding device, audio encoding method, and audio encoding program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4981123B2 (en) | Calculation and adjustment of perceived volume and / or perceived spectral balance of audio signals | |
KR100909679B1 (en) | Enhanced Artificial Bandwidth Expansion System and Method | |
KR101143724B1 (en) | Encoding device and method thereof, and communication terminal apparatus and base station apparatus comprising encoding device | |
KR100896737B1 (en) | Device and method for robustry classifying audio signals, method for establishing and operating audio signal database and a computer program | |
US6725192B1 (en) | Audio coding and quantization method | |
JP2801197B2 (en) | Digital audio signal transmission method | |
US20040162720A1 (en) | Audio data encoding apparatus and method | |
JP3765622B2 (en) | Audio encoding / decoding system | |
JPH04304029A (en) | Digital signal coder | |
AU1679097A (en) | A noisy speech parameter enhancement method and apparatus | |
JPH05304479A (en) | High efficient encoder of audio signal | |
US7650278B2 (en) | Digital signal encoding method and apparatus using plural lookup tables | |
JP4021124B2 (en) | Digital acoustic signal encoding apparatus, method and recording medium | |
JP2001102930A (en) | Method and device for correcting quantization error, and method and device for decoding audio information | |
US20010050959A1 (en) | Encoder and communication device | |
JPH06242798A (en) | Bit allocating method of converting and encoding device | |
JPH08211899A (en) | Method and device for encoding voice | |
JPH08166799A (en) | Method and device for high-efficiency coding | |
EP0746115A2 (en) | Audio signal processing circuit for subband coding | |
JP2003510643A (en) | Processing circuit for correcting audio signal, receiver, communication system, portable device, and method therefor | |
JP3297238B2 (en) | Adaptive coding system and bit allocation method | |
EP1211671A2 (en) | Automatic gain control with noise suppression | |
JP2993324B2 (en) | Highly efficient speech coding system | |
US20060104460A1 (en) | Adaptive time-based noise suppression | |
KR100224812B1 (en) | Method for allocating bits in coding of audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020507 |