JPH0335300A - Voice coding and decoding transmission system - Google Patents
Voice coding and decoding transmission systemInfo
- Publication number
- JPH0335300A JPH0335300A JP1170374A JP17037489A JPH0335300A JP H0335300 A JPH0335300 A JP H0335300A JP 1170374 A JP1170374 A JP 1170374A JP 17037489 A JP17037489 A JP 17037489A JP H0335300 A JPH0335300 A JP H0335300A
- Authority
- JP
- Japan
- Prior art keywords
- adaptive
- bit
- signal
- allocation pattern
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims description 48
- 238000013139 quantization Methods 0.000 claims abstract description 46
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 3
- 230000003044 adaptive effect Effects 0.000 claims description 84
- 238000000034 method Methods 0.000 claims description 59
- 230000005236 sound signal Effects 0.000 claims description 49
- 230000002123 temporal effect Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 20
- 238000013441 quality evaluation Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Abstract
Description
【発明の詳細な説明】
(目次)1既要
産業上の利用分野
従来の技術 ・・・第14図
発明が解決しようとする課題
課題を解決するための手段
作用
第1の実施例 ・・
第2の実施例 ・・
第3の実施例 ・・
第4の実施例 ・・
発明の効果
・第4.5.6図
・第7図
・第8.9.10図
・第12.13図
〔概要 〕
音声信号を情報圧縮し高能率に情報を伝送する方式で、
特に時間領域或いは周波数領域でビット割当パターンを
変化させる音声符号化伝送方式に関し、
全ての割当パターンについて処理することなく、且つフ
レーム内の情報量割当パターンを処理されているフレー
ムから求めることにより、処理されているフレームに対
して、最適な情報量の割当ができる音声信号の高能率符
号化伝送装置を提供することを目的とし、
各フレーム毎に抽出した量子化レベル数の異なる符号語
から局部復号信号を生成し、伝送ビットレートが一定に
なるような割当パターンに従って前記フレーム内の各サ
ブフレームの局部復号信号を合成し、1フレームの局部
復号信号を生成して、特性の最も良い割当パターンに対
応する符号語を多重化して送信するよう構成するもので
ある。[Detailed Description of the Invention] (Table of Contents) 1. Existing Industrial Fields of Application Prior Art...Fig. 14 Problems to be Solved by the Invention Means and Action for Solving the Problems First Embodiment... 2. Example 3. Example 4. Effect of the invention, Figure 4.5.6, Figure 7, Figure 8.9.10, Figure 12.13. Overview] A method that compresses information in audio signals and transmits information with high efficiency.
In particular, regarding audio coding transmission systems that change bit allocation patterns in the time domain or frequency domain, processing can be performed by determining the information allocation pattern within a frame from the frame being processed without processing all allocation patterns. The purpose is to provide a high-efficiency coding and transmission device for audio signals that can allocate an optimal amount of information to each frame. generate a signal, combine local decoded signals of each subframe in the frame according to an allocation pattern that makes the transmission bit rate constant, generate a local decoded signal of one frame, and select an allocation pattern with the best characteristics. The configuration is such that corresponding code words are multiplexed and transmitted.
〔産業上の利用分野 〕
本発明は、音声信号を情報圧縮し高能率で情報を伝送す
る方式、特に時間領域或いは周波数領域で割当パターン
を変化させる音声符号・復号化伝送方式に関する。[Industrial Field of Application] The present invention relates to a method for compressing information in an audio signal and transmitting the information with high efficiency, and particularly to an audio encoding/decoding transmission method that changes an allocation pattern in the time domain or frequency domain.
入力音声信号の情報量圧縮を行う音声符号化伝送方式は
、適応予測と適応量子化を使用したADPCMと、入力
音声信号の時間的変化に応じて時間領域で適応的にビッ
ト数を割り当てる時間領域適応ビット割当を組み合わせ
情報量の圧縮を行う方式、また入力音声信号を複数の帯
域に分割し、各帯域に割当るビット数の割当パターンを
入力音声信号の時間的変化に応じてフレーム毎に適応的
にビット数を割り当てる周波数領域適応ビット割当てに
より情報圧縮を行う方式等がある。Audio coding and transmission methods that compress the information content of input audio signals are ADPCM that uses adaptive prediction and adaptive quantization, and time domain that adaptively allocates the number of bits in the time domain according to temporal changes in the input audio signal. A method that compresses the amount of information by combining adaptive bit allocation, and also divides the input audio signal into multiple bands and adapts the allocation pattern of the number of bits allocated to each band for each frame according to temporal changes in the input audio signal. There are methods for compressing information using frequency domain adaptive bit allocation, which allocates the number of bits automatically.
近年のディジタル回線の普及に伴い、その回線の有効利
用を図るため、また音声蓄積、応答システム等において
、音声情報の蓄積を行う場合には、蓄積用メモリの容量
削減が重要であるため、音声信号の情報量を圧縮し更に
高能率に符号化する方式が要求されている。With the spread of digital lines in recent years, it is important to reduce the capacity of storage memory in order to make effective use of the lines, and when storing voice information in voice storage and response systems. There is a need for a method that compresses the amount of information in a signal and encodes it with higher efficiency.
従来のミ適応予測と適応量子化を使用したADPCMと
、入力信号の時間的変化に応して時間領域で適応的に情
報(ビット)を割り当てる時間領域適応ビット割当を組
み合わせ、情報量の圧縮を行う音声信号の高能率符号化
伝送方式の一例が、文献r多1)原産“’16kb/s
適応ピッ[・割当予測符号化アルゴリズムの検討゛、昭
和59年度電子通信学会通信部門全国大会、52−4p
p、2−283−2−284jに開示されている。(第
15図(a))この方法では、入力音声信号をフレーム
に分割し、更に該フレームをサブフレームに分割し、フ
レーム内の情報量が一定になるようにビ・ント割当パタ
ーンに応してサブフレーム毎の割当ビット数を変化させ
るものであり、その際のビット割当パターンを選択する
ための情報は、適応予測と適応量子化を使用しているた
め、一つ前のフレームの残差信号電力を使用するもので
あり、次にどのようなパターンの残差信号が発生するか
を予測し、その予測にもとづいて割り当てパターンを決
定するものである。It compresses the amount of information by combining conventional ADPCM using adaptive prediction and adaptive quantization with time-domain adaptive bit allocation, which adaptively allocates information (bits) in the time domain according to temporal changes in the input signal. An example of a high-efficiency coding transmission method for audio signals is described in the literature 1) "'16kb/s
Adaptive Pi [・Study of Assignment Predictive Coding Algorithm], 1985 National Conference of the Telecommunications Division of the Institute of Electronics and Communication Engineers, p. 52-4
p, 2-283-2-284j. (Figure 15(a)) In this method, the input audio signal is divided into frames, and the frames are further divided into subframes, and the input audio signal is divided into subframes according to the bit allocation pattern so that the amount of information in the frame is constant. The number of allocated bits for each subframe is changed by using adaptive prediction and adaptive quantization, so the information used to select the bit allocation pattern is based on the residual of the previous frame. It uses signal power, predicts what pattern of residual signal will be generated next, and determines the allocation pattern based on the prediction.
また、入力信号を複数の周波数帯域に分割し、各帯域へ
の割り当てビット数の割当パターンを、音声信号の時間
的変化に応してフレーム毎に適応的に変化させる符号化
伝送方式の一例が、文献r林 伸二他 バックワード
形高品質適応予測適応ビット割当符号化方弐″” 電子
通信学会論文誌86/10 Vol、J69−A、N
o、10pp、1234−1.242Jに開示されてい
る。Another example is a coding transmission method that divides the input signal into multiple frequency bands and adaptively changes the allocation pattern of the number of bits allocated to each band for each frame in response to temporal changes in the audio signal. , Reference Shinji Hayashi et al. Backward type high quality adaptive prediction adaptive bit allocation coding method 2'' Journal of the Institute of Electronics and Communication Engineers 86/10 Vol. J69-A, N
o, 10pp, 1234-1.242J.
(第15図(b))この方法でも、割当パターンは前記
の時間領域での割当パターンの決定と同様に、一つ前の
フレームの残差信号電力を使用するものである。(FIG. 15(b)) In this method as well, the allocation pattern uses the residual signal power of the previous frame, similar to the determination of the allocation pattern in the time domain.
従って、従来の時間領域及び周波数帯域での割当パター
ンの決定方法の技術では、現在処理されているフレーム
の一つ前のフレームの残差信号から割当パターンを決定
しているため、現フレームの残差信号と次のフレームの
残差信号との性質が大きく異なっていると、前フレーム
から予測した割当パターンでは、現在のフレームのピン
トの割当には最適にならず、符号語を再生する場合に特
性の劣化を引き起こすことになる。Therefore, in the conventional time domain and frequency band allocation pattern determination methods, the allocation pattern is determined from the residual signal of the frame immediately before the currently processed frame. If the characteristics of the difference signal and the residual signal of the next frame are significantly different, the allocation pattern predicted from the previous frame will not be optimal for the focus allocation of the current frame, and will not be optimal when reproducing the codeword. This will cause deterioration of characteristics.
そこで、考えられる全ての割当パターンについて符号化
することも考えられる。この場合全てのパターンの中か
ら特性の最もよいものを選択することによって、最適な
割当パターンを選択できることになる。しかし、全ての
パターンについて符号化を行うことは装置構成の拡大、
処理量の大幅な増加等の大きな問題を生じ、全体の効率
を考慮した場合に有効とは言えない。Therefore, it may be possible to encode all possible allocation patterns. In this case, the optimal allocation pattern can be selected by selecting the one with the best characteristics from among all the patterns. However, encoding all patterns requires expansion of the device configuration.
This causes major problems such as a significant increase in the amount of processing, and cannot be said to be effective when considering overall efficiency.
本発明は、全ての割当パターンについて処理することな
く、且つフレーム内の情報量割当パターンを現在処理さ
れているフレームから求めることにより、処理されてい
るフレームに対して、最適な情報量の割当ができる音声
信号の高能率符号化伝送装置を提供することを目的とす
る。The present invention makes it possible to allocate the optimal amount of information to the frame being processed without processing all the allocation patterns and by finding the information amount allocation pattern within the frame from the frame currently being processed. The purpose of the present invention is to provide a highly efficient encoding and transmitting device for audio signals.
第1図に時間領域での割当パターンを使用する音声符号
化伝送方式の原理図を示す。図中111はMピッt−i
子化レベル数の適応量子化器、■13〜116はN−M
ビット逆量子化レベル数の適応逆量子化器、117はN
ビットレベル数の逆量子化結果に基づき動作する適応予
測器、112は選択・多重化部、118は局部復号信号
の品質評価部である。FIG. 1 shows a principle diagram of a speech coding transmission method using an allocation pattern in the time domain. 111 in the figure is M pit t-i
Adaptive quantizer for the number of childization levels, ■13 to 116 are N-M
Adaptive inverse quantizer for the number of bit inverse quantization levels, 117 is N
An adaptive predictor operates based on the result of dequantization of the number of bit levels, 112 is a selection/multiplexing unit, and 118 is a locally decoded signal quality evaluation unit.
また、第2図は周波数領域での割当パターンを使用する
音声符号化伝送方式の原理図を示すものである。図中1
は帯域分割フィルタ、211〜2nmは量子化レベル数
の異なる符号器、23は局部復号信号の品質評価部、2
4は選択・多重化部である。Further, FIG. 2 shows a principle diagram of a speech coding transmission system using an allocation pattern in the frequency domain. 1 in the diagram
2 is a band division filter, 211 to 2 nm is an encoder with a different number of quantization levels, 23 is a locally decoded signal quality evaluation unit, 2
4 is a selection/multiplexing section.
本発明は前記目的を達成するため、第1の手段として時
間領域での割当パターンを使用するものとして、Mビッ
トa子化レベル数の適応量子化器111とN (<M)
ビット逆量子化レベル数の適応逆量子化器113とNビ
ットレベル数の逆量子化結果に基づき動作する適応予測
器117からなるエンベデッド符号化器と、前記適応量
子化器111からの符号語を復号するN+l−Mヒツト
逆量子化しヘル数の適応逆量子化器114〜116とを
設け、前記適応逆量子化器の出力と適応予測器との出力
によりそれぞれの局部復号信号を抽出し、前記局部復号
信号をそれぞれサブフレームに分割し、伝送ビットレー
トに適応した割当パターンに従ってサブフレームごとの
局部復号信号を合成し、それぞれの合成局部復号信号と
入力音声信号とを比較しその品質を評価し、特性の最も
良い割当パターンを選択し、該選択に従って適応量子化
器からの符号語をサブフレーム毎に下位ピントを削除し
、多重化して伝送するよう構成するものである。In order to achieve the above object, the present invention uses an allocation pattern in the time domain as a first means.
An embedded encoder includes an adaptive dequantizer 113 for the number of bit dequantization levels and an adaptive predictor 117 that operates based on the dequantization result for the number of N bit levels, and a code word from the adaptive quantizer 111. Adaptive inverse quantizers 114 to 116 are provided for inversely quantizing N+l-M hits to be decoded and Hell's number, and respective locally decoded signals are extracted by the outputs of the adaptive inverse quantizers and the outputs of the adaptive predictor; Each locally decoded signal is divided into subframes, local decoded signals for each subframe are synthesized according to an allocation pattern adapted to the transmission bit rate, and the quality is evaluated by comparing each synthesized locally decoded signal with the input audio signal. , the allocation pattern with the best characteristics is selected, and the codewords from the adaptive quantizer are deleted for each subframe in accordance with the selection, and the codewords are multiplexed and transmitted.
更に、周波数領域での割当パターンを使用するものとし
て、前記各帯域毎に、前記割当パターンに存在するビッ
ト数のそれぞれ量子化レベル数の異なる複数の符号化器
211〜2nmを設け、前記符号化器からそれぞれ局部
復号信号を抽出し、前記割当パターンの全ての組み合わ
せについての1フレーム分の局部復号信号を生成し、そ
れぞれの局部復号信号と入力音声信号とを比較しその品
質を評価し、特性の最も良い組み合わせを選択し、該選
択された割当パターンに従って該当する符号語を多重化
して伝送するよう構成するものである。Furthermore, as a device that uses an allocation pattern in the frequency domain, a plurality of encoders 211 to 2 nm are provided for each band, each having a different number of quantization levels for the number of bits existing in the allocation pattern, and extracts local decoded signals from each of the devices, generates one frame worth of local decoded signals for all combinations of the allocation patterns, compares each local decoded signal with the input audio signal to evaluate its quality, and determines the characteristics. According to the selected allocation pattern, the corresponding code words are multiplexed and transmitted.
本発明の前記第1の手段は時間領域における割当パター
ンの決定方式である。入力音声信号はフレーム毎に処理
される。1フレーム分の入力音声信号はMbitの適応
量子化器111で量子化され、選択多重化部112に入
力するとともに、各N、N+1. ・・・・M−1,
Nビットの逆量子化器において必要な上位ビットをそれ
ぞれの適応逆量子化のビット数で逆量子化する。Mbi
Lの適応量子化器111は、Nビットの適応逆量子化器
113及びNビットの逆量子化結果に基づき動作する適
応予測器117によりエンベツド符号化器を構成するも
のである。エンベツド符号化器とはSビットの量子化器
及びT (<3)ビットの逆量子化器及び適応予測器か
ら構成された符号化器であり、信号を伝送する際に符号
語の下位のS−Tビットに他の情報を載せることを可能
とした符号化方式テアリ、文献rCCITT、G722
Jにも開示されている。該エンベツド符号化に(↑う量
子化特性例を第3図に示す。該符号化方式では例えば0
000,0001の4ビツトを上位3ピント000で表
現したり、oooo、ooot。The first means of the present invention is a method for determining an allocation pattern in the time domain. The input audio signal is processed frame by frame. The input audio signal for one frame is quantized by an Mbit adaptive quantizer 111, inputted to a selective multiplexer 112, and input to each N, N+1 . ...M-1,
In an N-bit dequantizer, necessary upper bits are dequantized by the number of bits of each adaptive dequantization. Mbi
The L adaptive quantizer 111 constitutes an embedded encoder by an N-bit adaptive inverse quantizer 113 and an adaptive predictor 117 that operates based on the N-bit inverse quantization result. An embedded encoder is an encoder composed of an S-bit quantizer, a T (<3)-bit inverse quantizer, and an adaptive predictor. - Encoding method Tearly that makes it possible to carry other information on the T bit, document rCCITT, G722
It is also disclosed in J. Figure 3 shows an example of the quantization characteristics of the embedded encoding (↑).
The 4 bits of 000,0001 are expressed as the top 3 pinpoints of 000, oooo, ooot.
ooio、ootiの4ビツトを上位2ビツト00で表
現するものである。The four bits of ooio and ooti are expressed by the upper two bits of 00.
また前記各適応逆量子化器の出力はNビットの逆量子化
結果に基づき動作する適応予測器117の出力と加えら
れそれぞれの局部複合信号が生成され局部復号信号評価
部l18に入力される。同時に対応するlフレーム分の
入力信号も入力される。Further, the output of each of the adaptive inverse quantizers is added to the output of the adaptive predictor 117 which operates based on the N-bit inverse quantization results to generate respective local composite signals, which are input to the local decoded signal evaluation unit l18. At the same time, input signals for corresponding l frames are also input.
局部復号信号評価部117では、それぞれの1フレーム
分の局部復号信号をサブフレームに分割し、複数の情報
量割当パターンに応じて、サブフレーム毎に1サンプル
当たりの情報量をM−Nbitの範囲で変化させた局部
復号信号を組み合わせて1フレーム分の局部復号信号を
合成する。この時、情報量割当パターンは、1フレーム
の情報量の総和が1フレームに許容された伝送ビット数
を越えないようなパターンとする。The local decoded signal evaluation unit 117 divides each one-frame locally decoded signal into subframes, and determines the amount of information per sample for each subframe in the range of M-N bits according to a plurality of information amount allocation patterns. The locally decoded signals changed in are combined to synthesize one frame's worth of locally decoded signals. At this time, the information amount allocation pattern is such that the total amount of information for one frame does not exceed the number of transmission bits allowed for one frame.
複数の情報量割当パターンに応して合成されたlフレー
ム分の局部復号信号の中で、入力信号と比較して、最も
特性の良いパターンを選択し、その結果を選択多重化部
112に出力する。選択多重化部112は、符号語が階
層構造であるため、情報量割当パターンに応じて、サブ
フレーム毎にMbttの符号語の下位ビットを削除して
パターンに刻応する符号語を生成し、1フレーム分の符
号語を多重化する。更に、局部複合信号評価部118で
選択された情報量割当パターンを補助情報として多重化
して伝送することになる。Among the locally decoded signals for l frames synthesized according to a plurality of information allocation patterns, the pattern with the best characteristics is selected by comparing it with the input signal, and the result is output to the selective multiplexing section 112. do. Since the codeword has a hierarchical structure, the selective multiplexing unit 112 deletes the lower bits of the Mbtt codeword for each subframe according to the information allocation pattern, and generates a codeword that corresponds to the pattern. Code words for one frame are multiplexed. Further, the information amount allocation pattern selected by the local composite signal evaluation section 118 is multiplexed and transmitted as auxiliary information.
第2の手段は周波数領域における割当パターンの決定方
式である。入力音声信号はフレーム毎に処理される。1
フレームの入力音声信号は帯域分割フィルターでn個の
帯域に分割される。帯域分割された信号はそれぞれ独立
なため、各41P域での符号化による品質の劣化は独立
となり、そのため、符号化による劣化を各帯域毎に独立
に評価しても良い。各帯域の信号は、情報割当パターン
に作在する各帯域毎に割当てられる符号化ビットレート
に対応した、複数の符号化ビットレートの異なる符号化
器で並列に符号化される。複数の符号化ビットレートの
異なる符号化器はそれぞれ符号語と局部復号信号を出力
する。23の評価部では、各帯域毎に複数の符号化ビッ
トレートの異なる符号化器の局部復号信号を評価し、そ
の評価結果を情報割当パターンを参照しながら組み合わ
せて、全ての帯域に渡って総合的に評価し、最も特性の
良い情報割当パターンを選択し、選択・多重部24に出
力する。選択・多重部24は、各帯域毎に情報割当パタ
ーンに対応した符号語を選択し、多重化し、更に、情報
割当パターンを多重化して伝送路に送出する。情報割当
パターンは、1フレームの総情報量が1フレームに割当
られる情報量以下になるようなパターンからなる。復号
側では、■フレーム毎に情報割当パターンに応じた復号
化器を各帯域毎に選択し、復号化処理を行った後、帯域
合成し再生信号を出力する。The second means is a method for determining an allocation pattern in the frequency domain. The input audio signal is processed frame by frame. 1
A frame input audio signal is divided into n bands by a band division filter. Since the band-divided signals are independent, the quality deterioration due to encoding in each 41P band is independent, and therefore the deterioration due to encoding may be evaluated independently for each band. The signals of each band are encoded in parallel by a plurality of encoders with different encoding bit rates corresponding to the encoding bit rates assigned to each band existing in the information allocation pattern. A plurality of encoders with different encoding bit rates each output a code word and a locally decoded signal. The evaluation unit No. 23 evaluates local decoded signals of multiple encoders with different encoding bit rates for each band, combines the evaluation results while referring to the information allocation pattern, and performs a comprehensive evaluation across all bands. The information allocation pattern with the best characteristics is selected and output to the selection/multiplexing section 24. The selection/multiplexer 24 selects and multiplexes code words corresponding to the information allocation pattern for each band, and further multiplexes the information allocation pattern and sends the multiplexed code word to the transmission path. The information allocation pattern is a pattern in which the total amount of information for one frame is less than or equal to the amount of information allocated to one frame. On the decoding side, (1) a decoder is selected for each band according to the information allocation pattern for each frame, and after performing decoding processing, band synthesis is performed and a reproduced signal is output.
本発明では、帯域毎の評価結果を情報割当パターンを参
照しながら組み合わせて、全ての帯域に渡って総合的に
評価するため、複数の符号化パターンが、ある帯域に同
一の情報量を割当た場合には、その帯域に於いて、その
情1IJfiに対応した符号化処理は、−回となるため
、処理量の増大が防げ、又、−情報割当を行うフレーム
から割当パターンを算出するため、最適な割当が行える
。In the present invention, evaluation results for each band are combined with reference to information allocation patterns to comprehensively evaluate all bands, so multiple encoding patterns allocate the same amount of information to a certain band. In this case, in that band, the encoding process corresponding to the information 1IJfi will be performed - times, thereby preventing an increase in the amount of processing, and - Since the allocation pattern is calculated from the frame to which information is allocated, Optimal allocation can be made.
(第1の実施例)
本発明における時間領域の割当パターン決定方式の実施
例1を第4図に示す。(First Embodiment) FIG. 4 shows a first embodiment of the time domain allocation pattern determination method according to the present invention.
本実施例における伝送路の伝送ビットレートは4ビツト
/サンプルとする。またサブフレーム数は2とする。こ
の場合−船釣に考えられる割当パターンは前半、後半へ
の割当ビット数が(6゜2)(5,3)(4,4)(3
,5)(2,6)の5パターンとなる。従って適応量子
化器401は6ビツト/サンプルとする。また適応逆量
子化器407〜411は2〜6ビツト/サンプルとする
。適応予測器402、適応量子化器401、逆量子化器
407〜411の適応則は、前記文献rcc ITT、
G722J で規定されテイルものを使用し、6bit
の下位4bitを削除した、2bitの符号語の逆量子
化結果を使用するものであり、適応予測器も2ビツト/
サンプルの結果に基づき動作する。また、2〜5ビツト
/サンプルの各逆量子化器407〜410はその前段に
対応する下位ビットを削除するための下位ビット削除部
403〜406を有する。The transmission bit rate of the transmission path in this embodiment is 4 bits/sample. Further, the number of subframes is assumed to be two. In this case, the possible allocation pattern for boat fishing is that the number of bits allocated to the first half and the second half is (6°2) (5, 3) (4, 4) (3
, 5) (2, 6). Therefore, the adaptive quantizer 401 has 6 bits/sample. Further, the adaptive inverse quantizers 407 to 411 are set to 2 to 6 bits/sample. The adaptive rules of the adaptive predictor 402, adaptive quantizer 401, and inverse quantizers 407 to 411 are described in the above-mentioned document RCC ITT,
Use the tail specified by G722J, 6bit
This method uses the dequantization result of a 2-bit code word with the lower 4 bits deleted, and the adaptive predictor also uses a 2-bit/2-bit code word.
Acts on sample results. Further, each of the 2 to 5 bit/sample inverse quantizers 407 to 410 has lower bit deletion units 403 to 406 for deleting lower bits corresponding to the previous stage thereof.
lフレームの長さは、音声信号の非定常性と、補助情報
量を考慮して設定する。The length of the l frame is set in consideration of the non-stationarity of the audio signal and the amount of auxiliary information.
局部復号信号評価部では、本方式によるビット割当パタ
ーンに応じて、サブフレーム毎に局部復号信号を切り出
し、組み合わせることで、1フレームの局部復号信号が
合成される。この各パターンに対応した局部復号信号と
入力信号との間の信号対雑音比(S/N)を計算し、S
/N最大となるパターンを選択する。In the local decoded signal evaluation section, local decoded signals are cut out for each subframe according to the bit allocation pattern according to the present method, and the locally decoded signals are combined, thereby synthesizing one frame of locally decoded signals. The signal-to-noise ratio (S/N) between the locally decoded signal and the input signal corresponding to each pattern is calculated, and the S
/N Select the maximum pattern.
選択・多重化部において前記結果に基づき、サブフレー
ム毎に下位ビットを削除、或いはそのままとし、所望の
符号語を得る。この符号語を1フレーム分多重化し、更
に情報量割当パターンを示す信号も多重化して伝送路に
送出する。Based on the result, the selection/multiplexing section deletes or leaves the lower bits unchanged for each subframe to obtain a desired code word. This code word is multiplexed for one frame, and a signal indicating the information amount allocation pattern is also multiplexed and sent to the transmission path.
以下、制御動作を実施例のフローチャトを示す第5図で
、より詳細に説明する。Hereinafter, the control operation will be explained in more detail with reference to FIG. 5, which shows a flowchart of the embodiment.
ステップl)入力音声信号の1フレームが入力する。(
Sl)
ステップ2)前回入力の音声信号による適応予測器40
2の出力である予測信号で誤差信号を抽出する。(32
)
ステップ3)前記誤差信号を6ビツトの適応量子化器4
01で1サンプルを6ビツトで量子化する。(S3)
ステップ4〕前記量子化された6ビツト/サンプルの信
号から各下位ビット削除部403で下位の1〜4ビツト
を削除し、対応する適応量子化器407〜411におい
て逆量子化し、2ビツト適応予測器402で得た予測信
号との和からそれぞれの局部復号化信号a −eを抽出
され品質評価部412に入力する。(S4)ステップ5
)適応予測器402.適応量子化器401、逆量子化器
407〜411を2ビット/サンプルの適応逆量子化器
402による局部復号信号でパラメータを更新する。Step l) One frame of the input audio signal is input. (
Sl) Step 2) Adaptive predictor 40 based on the previous input audio signal
The error signal is extracted using the predicted signal that is the output of step 2. (32
) Step 3) Convert the error signal to a 6-bit adaptive quantizer 4.
01 quantizes one sample with 6 bits. (S3) Step 4] Each lower bit deletion unit 403 deletes the lower 1 to 4 bits from the quantized 6-bit/sample signal, and the corresponding adaptive quantizers 407 to 411 dequantize the signal. Each local decoded signal a to e is extracted from the sum with the prediction signal obtained by the bit adaptive predictor 402 and input to the quality evaluation section 412 . (S4) Step 5
) adaptive predictor 402. The parameters of the adaptive quantizer 401 and the inverse quantizers 407 to 411 are updated using the locally decoded signal from the 2-bit/sample adaptive inverse quantizer 402.
ステップ6)1フレーム分のサンプル敷金ての処理が終
了するまで上記動作が続けられる。(S6)
ステップ7)前記各局部復号化信号a ”−eをそれぞ
れサブフレームに分割する。本実施例では2分割する。Step 6) The above operation is continued until processing of the sample deposit for one frame is completed. (S6) Step 7) Each of the locally decoded signals a''-e is divided into subframes. In this embodiment, it is divided into two.
(S7)
ステップ8)サブフレーム毎の局部復号信号から情報量
割当パターンに対応するlフレーム分の局部復号信号を
合成する。つまり信号aの前半のサブフレームと信号e
の後半のサブフレームとを合成するとビット数がサブフ
レーム毎に(2,6)となり、逆に合成すると(6,2
)が得られ、この場合のlフレームの平均ビット数〜/
サンプル数は4ビツトの信号が得られる。(S7) Step 8) Locally decoded signals for l frames corresponding to the information amount allocation pattern are synthesized from the locally decoded signals for each subframe. In other words, the first half subframe of signal a and signal e
When combining with the second half of the subframe, the number of bits becomes (2, 6) for each subframe, and conversely, when combining
) is obtained, and the average number of bits of l frame in this case ~/
As for the number of samples, a 4-bit signal can be obtained.
同様にして信号す、dからビット数がサブフレーム毎に
(3,5)、(5,3)が、信号Cより(4,4)を得
る。(S8)
ステップ9)この5パターンの局部復号信号は全て平均
ビット/サンプル数は4ビツトである。Similarly, the bit numbers (3, 5) and (5, 3) are obtained for each subframe from the signals S and d, and (4, 4) from the signal C. (S8) Step 9) The average bit/sample number of all of these five patterns of locally decoded signals is 4 bits.
こうして得られた5つの信号をそれぞれ入力音声信号f
と比較し、S/Nをそれぞれ算出し、一番特性のよいパ
ターンを選択し、該パターンを示す信号gを下位ビット
削除・多重化部413に出力する。(S9)
ステップ10)下位ビット削除・多重化部413で入力
するlサンプル毎の符号語を、前記信号gに従ってサブ
フサーム毎に下位の数ビットを削除する。例えば選択さ
れたパターンが(6゜2)であると前半のサブフレーム
はそのまま、後半のサブフレームは下位4ビツトを削除
するものである。(SIO)
ステップ11)前記動作により下位ビットを制御された
符号語を多重化する。(Sll)ステップ12)前記多
重化された符号語と品質評価部412の出力信号gとを
多重化し送信するものでる。(S12)
以上が符号側の制御動作である。The five signals obtained in this way are respectively input audio signals f
The S/N ratio is calculated for each pattern, the pattern with the best characteristics is selected, and a signal g indicating the selected pattern is output to the lower bit deletion/multiplexing section 413. (S9) Step 10) The lower bit deletion/multiplexing unit 413 deletes the lower several bits of the input code word for each l sample for each subftherm according to the signal g. For example, if the selected pattern is (6°2), the first half of the subframe is left as is, and the lower four bits of the second half of the subframe are deleted. (SIO) Step 11) Multiplex the codewords whose lower bits have been controlled by the above operation. (Sll) Step 12) The multiplexed code word and the output signal g of the quality evaluation unit 412 are multiplexed and transmitted. (S12) The above is the control operation on the code side.
次に前記符号側に対応した復号例の実施例を第6図に示
す。復号側では符号側に対応して2〜6ビツト逆量子化
レベル数の逆量子化器が並列に設けられている。送信さ
れてくる多重信号は分離部601において符号側で選択
された割当パターンを示す信号と各符号語とに分離され
る。該割当パターンを示す信号は切替え部602に入力
し、サブフサーム毎にどの逆量子化器に入力させるかを
制御するものであり、サブフレーム毎に切替え符号語を
任意の逆量子化器に入力させるものである。Next, FIG. 6 shows an embodiment of a decoding example corresponding to the code side. On the decoding side, inverse quantizers of 2 to 6 bit inverse quantization levels are provided in parallel corresponding to the code side. The transmitted multiplexed signal is separated by a separating section 601 into a signal indicating the allocation pattern selected on the code side and each code word. A signal indicating the allocation pattern is input to the switching unit 602 to control which inverse quantizer is input for each subframe, and a switching code word is input to any inverse quantizer for each subframe. It is something.
こうして得られた信号は予測器608の予測信号と合成
され再生音声信号として出力される。The signal thus obtained is combined with the predicted signal of the predictor 608 and output as a reproduced audio signal.
(第2の実施例)
本発明のようにエンベデッド符号化を用いて各割当パタ
ーンでの局部復号信号を作威し、品質評価して行うビッ
ト割当は周波数領域及び時間領域の両方での適応ビット
割当を行う符号化にも適応可能であり、その実施例2を
第7図に示す。この場合のサブフレームは、各周波数帯
域毎に分割し、更に時間領域で分割されるものであり、
情報量割当パターンは、時間領域と周波数領域の2次元
のパターンとなる。例えば、高域側サブフレーム前半、
−後半、低域側サブフレーム前半、後半のようになり、
全てのサブフレームの情報量の総和が1フレームの情報
量となる。ここでの実施例では1フレームが4分割され
るものである。以下に本実施例で通常考えられる割当パ
ターンを示す。(Second Embodiment) As in the present invention, embedded coding is used to create locally decoded signals in each allocation pattern, and bit allocation is performed by quality evaluation using adaptive bits in both the frequency domain and time domain. It is also applicable to coding that performs allocation, and a second embodiment thereof is shown in FIG. In this case, the subframe is divided into each frequency band and further divided into the time domain.
The information amount allocation pattern is a two-dimensional pattern in the time domain and frequency domain. For example, the first half of the high-frequency subframe,
−The second half, the first half and the second half of the low-frequency side subframe,
The sum of the information amounts of all subframes is the information amount of one frame. In this embodiment, one frame is divided into four. The allocation patterns that are normally considered in this embodiment are shown below.
時間 時間 時間 時間 時間低域(54”
54) ゝ45” 45ノ (44)但し本実施例では
高域より低域にビット数を多く割り当てるパターンを採
用している。time time time time time time low range (54”
54) ゝ45'' 45ノ (44) However, in this embodiment, a pattern is adopted in which a larger number of bits is allocated to the low range than the high range.
入力音声信号は帯域分割フィルタ701を介し高域と低
域とに分割し、それぞれ対応の時間領域の低域の符号化
部702は2〜6ビント逆量子化レベル数の量子化器を
有し、高域の符号化部703の内部は示していないが、
低域の符号化部702と略同様の構成であり、異なるの
は2〜4レベル数の逆量子化レベル数の逆量子化器を有
するところである。ここでの量子化及び逆量子化は前記
実施例で述べたものと同様である。品質評価部704で
は、各逆量子化器からの局部復号信号を時間領域でのサ
ブフレーム毎に上記の割当パターンに従って各帯域毎の
局部復号信号を合成する。更に帯域合成し、1フレーム
分の4分割信号から合成した局部復号信号を生成し、入
力音声信号と比較し、S/Nを算出し特性の最もよいパ
ターンを選択し、該選択信号により前記実施例同様下位
ビット削除・多重化部で処理されるものである。An input audio signal is divided into a high band and a low band through a band division filter 701, and each corresponding time domain low band encoding unit 702 has a quantizer with a number of 2 to 6 bit dequantization levels. , although the inside of the high-frequency encoding section 703 is not shown,
It has substantially the same configuration as the low-frequency encoding section 702, except that it has dequantizers with dequantization levels of 2 to 4 levels. The quantization and inverse quantization here are the same as those described in the previous embodiment. The quality evaluation section 704 combines the locally decoded signals from each inverse quantizer for each subframe in the time domain into a locally decoded signal for each band according to the above allocation pattern. Furthermore, band synthesis is performed to generate a locally decoded signal synthesized from the four-divided signals of one frame, which is compared with the input audio signal, calculates the S/N, selects the pattern with the best characteristics, and uses the selected signal to perform the above-mentioned implementation. As in the example, this is processed by the lower bit deletion/multiplexing unit.
復号化部では実施例1同様に同時に送信されてくる割当
パターンを示す信号に応じて、逆量子化し帯域修正して
再生信号を得るものである。As in the first embodiment, the decoding section dequantizes and corrects the band according to the signals indicating the allocation pattern that are simultaneously transmitted to obtain a reproduced signal.
このように時間領域と周波数領域で割当を行うと、割当
パターンの数を増すことが可能となり、より細かな情報
量割当が可能となる。When allocation is performed in the time domain and frequency domain in this way, it becomes possible to increase the number of allocation patterns, and more detailed information amount allocation becomes possible.
また、従来の単純な符号化に比べより特性の優れた符号
化を、更に従来のような全ての割当パターンについて符
号化をするのではなく、必要な逆量子化器を数個用いる
ことで簡単に行なえる優れた方式である。In addition, it is possible to easily perform encoding with better characteristics than conventional simple encoding, and by using several necessary inverse quantizers instead of encoding all allocation patterns as in the conventional method. This is an excellent method that can be used in many situations.
(第3の実施例)
次に周波数領域での適応ビット割当を行う方式の実施例
3を第8図に示す。801は第1の帯域分割フィルタ、
802,803は第1の帯域分割フィルタの出力を更に
分割する第2.第3の帯域分割フィルタである。本実施
例3では帯域を4分割するものである。その場合考えら
れるピント割当パターンの一例を第9図に示す。本実施
例では該パターンに従って制御されるものである。ここ
での伝送路の伝送ビットレートは3ビット/サンプル程
度である。(Third Embodiment) Next, a third embodiment of a system for adaptive bit allocation in the frequency domain is shown in FIG. 801 is a first band division filter;
802 and 803 are second band division filters that further divide the output of the first band division filter. This is a third band division filter. In the third embodiment, the band is divided into four. FIG. 9 shows an example of a focus assignment pattern that can be considered in that case. In this embodiment, control is performed according to the pattern. The transmission bit rate of the transmission path here is approximately 3 bits/sample.
帯域分割フィルタ801〜803には、QMF(Qua
drature m1rror filter)を使用
する。符号器にはADPCMを使用し、割当パターンは
音声信号の性質を考慮し、周波数の低い帯域に多めの情
報量を割当てるパターンとする。(前記第9図) 第9
図から各帯域毎に割当パターンに存在する量子化ビット
数を持つADPCM符号器を並列に並べる。従って各帯
域のADPCMの量子化ビット数は、低い帯域から、6
.5.4ビット符号器804〜806.5+ 4+
3ビット符号器807〜809.3.2ビット符号器
810,811.3,2ビット符号器812,813と
なる。The band division filters 801 to 803 include QMF (Qua
drature m1rror filter). ADPCM is used for the encoder, and the allocation pattern is a pattern that takes into account the characteristics of the audio signal and allocates a large amount of information to a low frequency band. (Figure 9 above) 9th
As shown in the figure, ADPCM encoders having the number of quantization bits existing in the allocation pattern for each band are arranged in parallel. Therefore, the number of quantization bits of ADPCM for each band is 6
.. 5.4 bit encoder 804~806.5+ 4+
These are 3-bit encoders 807 to 809.3, 2-bit encoders 810, 811.3, and 2-bit encoders 812, 813.
以下本実施例3のフローチャートを示す第10図に従っ
て本実施例を詳細に説明する。The present embodiment will be described in detail below with reference to FIG. 10 showing a flowchart of the third embodiment.
ステップ1)1フレームの音声信号が入力する。Step 1) One frame of audio signal is input.
(T 1 )
ステップ2)帯域分割フィルタ801〜803を介し4
帯域に分割する。(T2)
ステップ3)全てのADPCM符号化器804〜813
でそれぞれ−フレーム分の符号化処理を行う。 (T3
)
ステップ4)各符号化器804〜813は内部に復号化
機能を有するものであり、該復号化機能を介して、1フ
レーム分の局部復号信号を品質評価部814にそれぞれ
出力する。(T4)ステップ5)各帯域毎に、各ADP
CMの局部復号信号と対応する各帯域の入力音声信号を
比較し、それぞれの誤差信号を抽出し、その2乗和(l
フレーム分)を算出する。(T5)ステップ6)前記各
ADPCM対応の2乗和に聴感上の重み付けを行う。(
T6)
ステップ7)前記第9図の割当パターンに従って各局部
復号信号を合成した場合の、各帯域毎の前記T6で得た
2乗和に聴感上の重み付けしたものの総和を各割当パタ
ーン毎に算出する。(T 1 ) Step 2) 4 through band division filters 801 to 803
Divide into bands. (T2) Step 3) All ADPCM encoders 804 to 813
In each case, encoding processing for -frames is performed. (T3
) Step 4) Each of the encoders 804 to 813 has an internal decoding function, and each outputs one frame's worth of locally decoded signals to the quality evaluation section 814 via the decoding function. (T4) Step 5) For each band, each ADP
The locally decoded CM signal and the corresponding input audio signal of each band are compared, each error signal is extracted, and the sum of squares (l
frame). (T5) Step 6) Perceptually weighting is performed on the sum of squares corresponding to each ADPCM. (
T6) Step 7) When each locally decoded signal is synthesized according to the allocation pattern shown in FIG. 9, calculate the sum of the sum of squares obtained in T6 above for each band with auditory weighting for each allocation pattern. do.
(T7)
ステップ8)T7で求めた総和が最も小さいものを特性
の最も良い割当パターンとして選択し、該割当パターン
を示す信号を選択・多重化部815へ出力する。(T8
)
ステップ9)選択・多重化部815へ入力する各ADP
CMからの符号語のうち、前記品質評価部814からの
信号に従って各帯域のA D P CMからの符号語を
選択し、前記該割当パターンを示す信号とともに多重化
する。(T9)ステップ10)伝送路にlフレーム分の
符号語データを出力する。(TIO)
ステップ11)各帯域毎に選択されたADT’CMの内
部パラメータを各帯域内の他のADPCMに複写する。(T7) Step 8) The one with the smallest sum determined in T7 is selected as the allocation pattern with the best characteristics, and a signal indicating the allocation pattern is output to the selection/multiplexing section 815. (T8
) Step 9) Each ADP input to the selection/multiplexing section 815
Among the codewords from the CMs, the codewords from the ADP CM of each band are selected according to the signal from the quality evaluation section 814 and multiplexed with the signal indicating the allocation pattern. (T9) Step 10) Output code word data for l frames to the transmission path. (TIO) Step 11) Copy the internal parameters of the ADT'CM selected for each band to other ADPCMs within each band.
これはフレーム毎に各帯域に割り当てられる情報量が異
なるため、復号器との同期を取るため、各帯域毎にフレ
ームの先頭で、一つ前で選択された量子化ビット数の符
号器の内部パラメーターを該当する帯域の並列に存在す
るADPCMに複写するものである。(Tll)
以上が符号側の制御である。This is because the amount of information allocated to each band differs for each frame, so in order to synchronize with the decoder, at the beginning of the frame for each band, the coder internally uses the previously selected quantization bit number. The parameters are copied to the ADPCMs existing in parallel in the corresponding band. (Tll) The above is the control on the code side.
次に前記符号側に対応した復号側の構成を第11図に示
す。1101は分離部、1102〜1105は各帯域毎
の切替え部、1106〜1115はそれぞれ逆量子化レ
ベル数の異なるAD P CM復号器、1116は帯域
合成フィルタである。Next, FIG. 11 shows the configuration of the decoding side corresponding to the code side. 1101 is a separation unit, 1102 to 1105 are switching units for each band, 1106 to 1115 are ADP CM decoders each having a different number of dequantization levels, and 1116 is a band synthesis filter.
分離部1101では、符号側で選択された割当パターン
を示す信号と各符号語が分離される。各符号語はそれぞ
れ割当ての帯域用の切替え部1102〜1105に入力
する。各切替え部で分離部1101で分離された符号側
で選択された割当パターンを示す信号に従って入力する
符号語を帯域毎に対応したADPCM復号器に切り替え
て入力する。その出力は帯域毎に帯域合成フィルタ11
16に入力し合成され再生音声信号として出力される。Separation section 1101 separates the signal indicating the allocation pattern selected on the code side and each code word. Each code word is input to switching units 1102 to 1105 for assigned bands. In each switching unit, the input code word is switched and input to the ADPCM decoder corresponding to each band according to the signal indicating the allocation pattern selected on the code side separated by the separation unit 1101. The output is filtered by a band synthesis filter 11 for each band.
16, which is synthesized and output as a reproduced audio signal.
従来のように、全ての割当パターンに付いて符号化・復
号化を行い最適なものを選択する場合と本実施例の場合
では、割当パターンは、8パターンあるため固定割当の
場合に比べてADPCMの処理は8倍になるが、本発明
によれば、3倍になるものが2帯域と2倍になるものが
2帯域あるため、平均2,5倍の処理となる。しかし、
全てのパターンについて符号化する方法に比べれば極め
て簡単な処理で品質の良い信号の伝送が可11ヒとなる
ものである。In the conventional case where all allocation patterns are encoded and decoded and the optimal one is selected, in the case of this embodiment, there are 8 allocation patterns, so the ADPCM However, according to the present invention, since there are two bands in which the data is tripled and two bands in which the data is doubled, the processing is 2.5 times as much on average. but,
Compared to a method in which all patterns are encoded, it is possible to transmit high-quality signals with extremely simple processing.
(第4の実施例)
本発明では第1の実施例でのエンヘデント符号器及びい
くつかの逆量子化器を用いた構成の符号化器を各帯域毎
にビット数対応で設けることで多数のADPCMを使用
することなく、より簡単な処理で実現できる。その実施
例4を第12図に示す。図中第8図と同一部材には同一
符号を付す。(Fourth Embodiment) In the present invention, a large number of This can be achieved with simpler processing without using ADPCM. Example 4 is shown in FIG. In the figure, the same members as in FIG. 8 are given the same reference numerals.
またADPCM4〜6ビノト符号化器804〜806は
エンベデッド符号化器を有するADPCM符号器90が
、同様に807〜809は91が、810.811は9
2が、812,813は93がその機能を果たすもの、
である。エンベデッド符号化器を有するADPCM符号
化!S90の内部構成を第t3図に示す。他のエンベデ
ッド符号化器を有するADPCM符号化器91〜93は
量子化。Further, the ADPCM 4 to 6 binot encoders 804 to 806 have an embedded encoder, the ADPCM encoder 90 has an embedded encoder, 807 to 809 have 91, and 810.811 has 9.
2, 812, 813 is 93 that performs the function,
It is. ADPCM encoding with embedded encoder! The internal configuration of S90 is shown in FIG. t3. ADPCM encoders 91 to 93 having other embedded encoders perform quantization.
逆量子化のビット数等が異なるだけで同様の構成である
。第13図は第4図の実施例1と略同様の構成となって
いる。異なるのは各下位ビット削除部の出力が適応逆量
子化部と選択・多重化部へ出力されることである。該構
成により実施例3同様に各帯域における割当パターンに
従ったビット数での局部復号信号が得られる。品質評価
部での処理は実施例3と全く同様のものである。The configurations are the same except for the number of bits for inverse quantization. FIG. 13 has substantially the same configuration as the first embodiment shown in FIG. The difference is that the output of each lower bit deletion section is output to an adaptive inverse quantization section and a selection/multiplexing section. With this configuration, similarly to the third embodiment, a locally decoded signal with the number of bits according to the allocation pattern in each band can be obtained. The processing in the quality evaluation section is exactly the same as in the third embodiment.
エンベデッドADPCMを使用すると、ADPCMにお
ける適応予測、適応量子化の適応更新期を共通にするこ
とが可能となるため、ADPCMを並列に複数個動作さ
せた場合でも、複数の逆量子化の処理が増加するだけと
なる。この場合、フレーム毎に各帯域に割当られる情報
量が異なっていても、適応予測、適応量子化の処理は共
通なため、フレームの先頭で内部パラメーターを複写す
る必要はなく、実施例3より更に処理が簡単となるもの
である。Using embedded ADPCM makes it possible to share the same adaptive update period for adaptive prediction and adaptive quantization in ADPCM, so even when multiple ADPCMs are operated in parallel, the processing of multiple dequantizations increases. Just do it. In this case, even if the amount of information allocated to each band differs from frame to frame, the processes of adaptive prediction and adaptive quantization are common, so there is no need to copy the internal parameters at the beginning of the frame, and this is further improved than in the third embodiment. This makes processing easier.
以上時間領域5周波数領域及びその両方の実施例を説明
してきたが、各品質評価部の評価の仕方としては色々考
えられる。例えばケプヌトラム距離、誤差信号の絶対値
のピーク値、誤差信号の絶対値の総和、誤差信号の二乗
和、これらの組み合わせ等が考えられるものであり本発
明は実施例に限られるものではない。Although embodiments in the time domain, frequency domain, and both have been described above, various methods of evaluation by each quality evaluation section can be considered. For example, the cepnutrum distance, the peak value of the absolute value of the error signal, the sum of the absolute values of the error signal, the sum of squares of the error signal, a combination thereof, etc. can be considered, and the present invention is not limited to the embodiments.
(発明の効果 〕
本発明によれば、適応予測と適応量子化を使用したAD
PCMに、特性の良い時間領域適応ビット割当処理を組
み合わせることが可能となり、音声信号の時間的変動を
効率良く利用した、高能率音声符号化伝送装置が実現で
きる。また、音声信号を複数の帯域に分割し、フレーム
毎に音声信号の性質の時間的変動に応して各帯域毎に割
り当てる情報量を変化させる音声符号化方式に於いて、
少ない処理量の増大で最適なものを選択できるため、音
声信号の周波数領域における非定常性を効率良く利用す
ることが可能となり、効率の良い音声信号の高能率符号
化伝送装置が構成できる。(Effects of the Invention) According to the present invention, AD using adaptive prediction and adaptive quantization
It becomes possible to combine PCM with time-domain adaptive bit allocation processing with good characteristics, and a highly efficient speech coding and transmission device that efficiently utilizes temporal fluctuations in speech signals can be realized. In addition, in an audio encoding method that divides an audio signal into multiple bands and changes the amount of information allocated to each band according to temporal fluctuations in the characteristics of the audio signal for each frame,
Since the optimum one can be selected with a small increase in the amount of processing, it becomes possible to efficiently utilize the non-stationarity of the audio signal in the frequency domain, and a highly efficient encoding and transmission device for the audio signal can be configured.
従って、本発明によって、より高品質に、全てのパター
ンについて処理するのに比べ極めて簡単な、手数の少な
い処理での音声符号・復号化伝送方式を提供することが
できる。Therefore, according to the present invention, it is possible to provide a speech encoding/decoding transmission system that has higher quality and requires much simpler processing than processing all patterns.
第1図は時間領域における割当パターンを使用した音声
符号化伝送方式の原理図、
第2図は周波数領域における割当パターンを使用した音
声符号化伝送方式の原理図、
第3図はエンベデッド符号化に伴う量子化特性例、
第4図は時間領域における割当パターンを使用した音声
符号化伝送方式の一実施例、
第5図は第4図の音声符号化伝送方式のフローチャート
示す図、
第6図は第4図の符号化に対応する復号化を行う音声符
号化方式の一実施例、
第7図は周波数領域及び時間領域での割当パターンを使
用する音声符号化伝送方式の一実施例、第8図は周波数
領域における割当パターンを使用した音声符号化伝送方
式の一実施例、第9図は第8図の音声符号化伝送方式で
使用する割当パターンを示す図、
第10図は第8図の音声符号化伝送方式のフローチャー
ト示す図、
第11図は第8図の符号化に対応する復号化を行う音声
符号化方式の一実施例、
第12図は第8図の音声符号化伝送方式に符号化器とし
て、エンベデッド符号器を用いた場合の一実施例、
第13図は第12図中のエンベデッド符号化を使用した
ADPCM符号化器符号化器内部構図、第14図は従来
の構成を示す図である。
図中
11
112.24
113〜116
17
118.23
適応量子化器
選択・多重化部
適応逆量子化器
適応予測器
品質評価部
■
・帯域分割フィルタ
1〜2nm・
・符号器
本発明に
お
ける需透口
熟
詔
笥号語(量子化コード)
2bit BbIt 4b
量子化コード
第
図
第4藺にbげるフローチ、−ト
第
図
割
当
パ
タ
ン
を
刀ス
す
団Figure 1 is a diagram of the principle of a speech coding transmission method using an allocation pattern in the time domain, Figure 2 is a diagram of the principle of a speech coding transmission method using an allocation pattern in the frequency domain, and Figure 3 is a diagram of the principle of an audio coding transmission method using an allocation pattern in the frequency domain. 4 shows an example of the audio coding transmission method using an allocation pattern in the time domain, FIG. 5 shows a flowchart of the audio coding transmission method shown in FIG. 4, and FIG. FIG. 4 is an example of an audio encoding method that performs decoding corresponding to the encoding; FIG. 7 is an example of an audio encoding transmission method that uses allocation patterns in the frequency domain and time domain; The figure shows an example of an audio coding transmission method using an allocation pattern in the frequency domain, FIG. 9 shows an allocation pattern used in the audio coding transmission method of FIG. 8, and FIG. Figure 11 is an example of a voice encoding method that performs decoding corresponding to the encoding in Figure 8. Figure 12 is an example of a voice encoding transmission method that performs decoding corresponding to the encoding in Figure 8. An example in which an embedded encoder is used as an encoder, FIG. 13 shows the internal configuration of the ADPCM encoder using embedded encoding in FIG. 12, and FIG. 14 shows the conventional configuration. FIG. In the figure 11 112.24 113 to 116 17 118.23 Adaptive quantizer selection/multiplexing unit Adaptive inverse quantizer Adaptive predictor Quality evaluation unit Quantization Code Word (Quantization Code) 2bit BbIt 4b Quantization Code Diagram 4th Flowchart, -G Diagram Assignment Pattern.
Claims (11)
に1フレームを幾つかのサブフレームに分割して、所定
の伝送ビットレートになるようにそれぞれのサブフレー
ムに1サンプル当たりの量子化ビット数を割当て符号化
する音声符号化伝送方式において、 各フレーム毎に抽出した量子化レベル数の異なる符号語
から局部復号信号を生成し、所定の伝送ビットレートに
なるような割当パターンに従って前記フレーム内の各サ
ブフレームの局部復号信号を合成し、1フレームの局部
復号信号を生成して、特性の最も良い割当パターンに対
応する符号語を多重化して伝送することを特徴とする音
声符号化方式。(1) A method that compresses the amount of information of an input audio signal, in which one frame is divided into several subframes, and each subframe is given a quantum amount per sample to achieve a predetermined transmission bit rate. In an audio coding transmission method that allocates and encodes the number of quantization bits, a locally decoded signal is generated from codewords with different numbers of quantization levels extracted for each frame, and the above-mentioned decoded signal is generated according to an allocation pattern that achieves a predetermined transmission bit rate. Speech encoding characterized in that locally decoded signals of each subframe within a frame are combined to generate a locally decoded signal of one frame, and code words corresponding to an allocation pattern with the best characteristics are multiplexed and transmitted. method.
応予測と適応量子化を使用したADPCM(Adpti
veDifferentialPulseCodeMo
dulation)符号化と、入力音声信号の時間的変
化に応じて時間領域で適応的にビットを割当てる時間領
域適応ビット割当を組み合わせた音声符号化方式に於い
て、 Mビット量子化レベル数の適応量子化器(111)とN
(<M)ビット逆量子化レベル数の適応逆量子化器(1
13)とNビットレベル数の逆量子化結果に基づき動作
する適応予測器(117)からなるエンベデッド符号化
器と、 前記適応量子化器(111)からの符号語を復号するN
+1〜Mビット逆量子化レベル数の適応逆量子化器(1
14〜116)とを設け、 前記適応逆量子化器の出力と適応予測器との出力により
それぞれの局部復号信号を抽出し、前記局部復号信号を
それぞれサブフレームに分割し、伝送ビットレートに適
応した割当パターンに従ってサブフレームごとの局部復
号信号を合成し、それぞれの局部復号信号と入力音声信
号とを比較しその品質を評価し、特性の最も良い割当パ
ターンを選択し、該選択に従って適応量子化器からの符
号語をサブフサーム毎に下位ビットを削除し、多重化し
て伝送する音声符号化伝送方式。(2) A method for compressing the amount of information of an input audio signal, especially ADPCM (AdpCM) that uses adaptive prediction and adaptive quantization.
veDifferentialPulseCodeMo
In an audio encoding method that combines time-domain adaptive bit allocation that adaptively allocates bits in the time domain according to temporal changes in the input audio signal, adaptive quantization with M-bit quantization levels is used. Converter (111) and N
Adaptive inverse quantizer (<M) number of bit inverse quantization levels (1
13) and an adaptive predictor (117) that operates based on the result of inverse quantization of the number of N bit levels;
Adaptive inverse quantizer with +1 to M bit inverse quantization levels (1
14 to 116) are provided, each locally decoded signal is extracted by the output of the adaptive inverse quantizer and the output of the adaptive predictor, each of the locally decoded signals is divided into subframes, and the locally decoded signal is adapted to the transmission bit rate. synthesize local decoded signals for each subframe according to the selected allocation pattern, compare each local decoded signal with the input audio signal to evaluate its quality, select the allocation pattern with the best characteristics, and perform adaptive quantization according to the selection. A voice coding transmission method that deletes the lower bits of the code word from the device for each subftherm, multiplexes it, and transmits it.
ーンを示す信号をも一緒に多重化して伝送することを特
徴とする請求項(2)記載の音声符号化伝送方式。(3) The audio coding transmission system according to claim (2), wherein when multiplexing code words, a signal indicating a selected allocation pattern is also multiplexed and transmitted.
応予測と適応量子化を使用したADPCM符号化と、入
力音声信号の時間的変化に応じて時間領域で適応的にビ
ット数を割当てる時間領域適応ビット割当を組み合わせ
た音声符号化により符号化された信号を逆量子化を使用
して復号する音声復号化方式に於いて、 符号器側から伝送される割当パターンを示す信号に従っ
て符号語の各サブフレーム毎に入力する逆量子化器を切
替える切替え部(602)を設け、各サブフレームを量
子化時のレベル数と対応した逆量子化レベル数の逆量子
化器に入力して再生音声信号を得ることを特徴する音声
復号化方式。(4) A method that compresses the amount of information of an input audio signal, in particular ADPCM encoding using adaptive prediction and adaptive quantization, and adaptively allocating the number of bits in the time domain according to temporal changes in the input audio signal. In an audio decoding method that uses inverse quantization to decode a signal encoded by audio encoding that combines time-domain adaptive bit allocation, codewords are generated according to a signal indicating an allocation pattern transmitted from the encoder side. A switching unit (602) is provided to switch the input inverse quantizer for each subframe, and each subframe is input to the inverse quantizer with the number of inverse quantization levels corresponding to the number of levels at the time of quantization and reproduced. An audio decoding method characterized by obtaining audio signals.
符号化装置、及び請求項(4)記載の音声復号化方式に
基づく復号装置とを有する音声符号・復号化伝送装置。(5) A voice encoding/decoding transmission device comprising an encoding device based on the voice encoding transmission method according to claim (3) and a decoding device based on the voice decoding method according to claim (4).
力音声信号をフレーム毎に複数の周波数帯域に分割し、
各帯域の時間的変化に応じて割当てるビット数の割当パ
ターンを変化させる適応ビット割当符号化方式に於いて
、 前記各帯域毎に、前記割当パターンに存在するビット数
のそれぞれ量子化レベル数の異なる複数の符号化器(2
11〜2nm)を設け、 前記符号化器からそれぞれ局部復号信号を抽出し、前記
割当パターンの全ての組み合わせについての1フレーム
分の局部復号信号を生成し、それぞれの局部復号信号と
入力音声信号とを比較しその品質を評価し、特性の最も
良い組み合わせを選択し、該選択された割当パターンに
従って該当する符号語を多重化して伝送することを特徴
とする音声符号化伝送方式。(6) A method for compressing the amount of information of an input audio signal, in particular, dividing the input audio signal into multiple frequency bands for each frame,
In an adaptive bit allocation coding method that changes the allocation pattern of the number of bits to be allocated according to temporal changes in each band, the number of bits existing in the allocation pattern has a different number of quantization levels for each band. Multiple encoders (2
11 to 2 nm), extracts each local decoded signal from the encoder, generates one frame worth of local decoded signals for all combinations of the allocation patterns, and combines each local decoded signal with the input audio signal. 1. A speech coding and transmission system characterized in that the quality of the signals is compared, the quality thereof is evaluated, the best combination of characteristics is selected, and the corresponding codewords are multiplexed and transmitted according to the selected allocation pattern.
ーンを示す信号をも一緒に多重化して伝送することを特
徴とする請求項(6)記載の音声符号化伝送方式。(7) The audio coding transmission system according to claim (6), wherein when multiplexing code words, a signal indicating a selected allocation pattern is also multiplexed and transmitted.
力音声信号をフレーム毎に複数の周波数帯域に分割し、
各帯域の時間的変化に応じて割当てるビット数の割当パ
ターンを変化させる適応ビット割当符号化方式にて符号
化され伝送されてくる信号を復号化する音声復号化方式
に於いて、送信されてくる符号語及びビット割当パター
ンを示す信号を分離し、該ビット割当パターンを示す信
号に従って前記符号語の周波数領域ごとに該当する逆量
子化レベル数の逆量子化器で復号し、周波数領域毎の復
号化信号を合成して再生音声信号を得ることを特徴とす
る音声復号化方式。(8) A method for compressing the amount of information of an input audio signal, in particular, dividing the input audio signal into multiple frequency bands for each frame,
In an audio decoding method that decodes signals that are encoded and transmitted using an adaptive bit allocation encoding method that changes the allocation pattern of the number of bits allocated according to temporal changes in each band. A code word and a signal indicating a bit allocation pattern are separated, and decoded by a dequantizer having a corresponding number of dequantization levels for each frequency domain of the code word according to the signal indicating the bit allocation pattern, and decoding is performed for each frequency domain. An audio decoding method characterized in that a reproduced audio signal is obtained by synthesizing encoded signals.
符号化装置、及び請求項(8)記載の音声復号化方式に
基づく復号装置とを有する音声符号・復号化伝送装置。(9) A voice encoding/decoding transmission device comprising an encoding device based on the voice encoding transmission method according to claim (7) and a decoding device based on the voice decoding method according to claim (8).
量子化レベル数の適応量子化器とNビット逆量子化レベ
ル数の逆量子化器とNビットレベル数の逆量子化結果に
もとづいて動作する適応予測器からなるエンベデッド符
号化器と、N+1〜Mビット逆量子化レベル数の下位ビ
ット削除機能を有する逆量子化器とで構成したことを特
徴とする請求項(7)記載の音声符号化伝送方式。(10) Multiple encoders corresponding to frequency bands are based on an adaptive quantizer with M-bit quantization levels, an inverse quantizer with N-bit inverse quantization levels, and an inverse quantization result with N-bit levels. Claim (7), characterized in that the embedded encoder is composed of an adaptive predictor that operates according to Audio coding transmission method.
音声信号を複数の周波数帯域に分割し、各帯域の時間的
変化に応じて割当てるビット数の割当パターンを変化さ
せ、更に適応予測と適応量子化を使用したADPCM符
号化と、入力音声信号の時間的変化に応じて時間領域で
適応的にビット数を割当てる時間領域適応ビット割当を
組み合わせた音声符号化伝送方式に於いて、 各周波数帯域毎に、Mビット量子化レベル数の適応量子
化器とN(<M)ビット逆量子化レベル数の適応逆量子
化器とNビットレベル数の逆量子化結果に基づき動作す
る適応予測器からなるエンベデッド符号化器と、 前記適応量子化器からの符号語を復号するN+1〜Mビ
ット逆量子化レベル数の適応逆量子化器とを設け、 前記適応逆量子化器の出力と適応予測器との出力により
それぞれの局部復号信号を抽出し、前記局部復号信号を
それぞれサブフレームに分割し、伝送ビットレートに適
応した割当パターンに従って各帯域毎の局部復号信号を
合成し、更に前記割当パターンに従って1フレーム分の
局部復号信号を合成し、それぞれの合成局部復号信号と
入力音声信号とを比較しその品質を評価し、特性の最も
良い割当パターンを選択し、該選択に従って適応量子化
器からの符号語をサブフサーム毎に下位ビットを削除し
、多重化して伝送する音声符号化伝送方式。(11) A method that compresses the amount of information in an input audio signal. It divides the input audio signal into multiple frequency bands, changes the allocation pattern of the number of bits allocated according to the temporal changes in each band, and also uses adaptive prediction. In an audio coding transmission system that combines ADPCM encoding using adaptive quantization and time domain adaptive bit allocation that adaptively allocates the number of bits in the time domain according to temporal changes in the input audio signal, each frequency For each band, an adaptive quantizer with M bit quantization levels, an adaptive dequantizer with N (<M) bit dequantization levels, and an adaptive predictor that operates based on the dequantization results with N bit levels. and an adaptive inverse quantizer with a number of N+1 to M bit inverse quantization levels for decoding the code word from the adaptive quantizer, the output of the adaptive inverse quantizer and the adaptive prediction are provided. extracts each locally decoded signal from the output from the transmitter, divides each locally decoded signal into subframes, synthesizes the locally decoded signal for each band according to an allocation pattern adapted to the transmission bit rate, and further divides the locally decoded signal into subframes according to the allocation pattern adapted to the transmission bit rate. synthesize local decoded signals for one frame according to A voice coding transmission method that deletes the lower bits of the code word for each subftherm, multiplexes it, and transmits it.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1170374A JPH0335300A (en) | 1989-06-30 | 1989-06-30 | Voice coding and decoding transmission system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1170374A JPH0335300A (en) | 1989-06-30 | 1989-06-30 | Voice coding and decoding transmission system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0335300A true JPH0335300A (en) | 1991-02-15 |
Family
ID=15903754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1170374A Pending JPH0335300A (en) | 1989-06-30 | 1989-06-30 | Voice coding and decoding transmission system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0335300A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08179798A (en) * | 1994-12-27 | 1996-07-12 | Nec Corp | Voice pitch lag coding method and device |
JP2005326862A (en) * | 2004-05-13 | 2005-11-24 | Samsung Electronics Co Ltd | Apparatus and method for speech signal compression, apparatus and method for speech signal decompression, and computer readable recording medium |
JP2007121782A (en) * | 2005-10-28 | 2007-05-17 | Konami Digital Entertainment:Kk | Speech coding apparatus, method and program, and speech decoding apparatus, method and program, and speech coding data |
JP2008513823A (en) * | 2004-09-17 | 2008-05-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Joint audio coding to minimize perceptual distortion |
-
1989
- 1989-06-30 JP JP1170374A patent/JPH0335300A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08179798A (en) * | 1994-12-27 | 1996-07-12 | Nec Corp | Voice pitch lag coding method and device |
JP2005326862A (en) * | 2004-05-13 | 2005-11-24 | Samsung Electronics Co Ltd | Apparatus and method for speech signal compression, apparatus and method for speech signal decompression, and computer readable recording medium |
US8019600B2 (en) | 2004-05-13 | 2011-09-13 | Samsung Electronics Co., Ltd. | Speech signal compression and/or decompression method, medium, and apparatus |
JP2008513823A (en) * | 2004-09-17 | 2008-05-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Joint audio coding to minimize perceptual distortion |
JP2007121782A (en) * | 2005-10-28 | 2007-05-17 | Konami Digital Entertainment:Kk | Speech coding apparatus, method and program, and speech decoding apparatus, method and program, and speech coding data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2327627C (en) | Process for processing at least one coded binary audio flux organized into frames | |
EP1455345B1 (en) | Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology | |
JP3071795B2 (en) | Subband coding method and apparatus | |
US7539612B2 (en) | Coding and decoding scale factor information | |
US5206884A (en) | Transform domain quantization technique for adaptive predictive coding | |
US6122618A (en) | Scalable audio coding/decoding method and apparatus | |
KR100261254B1 (en) | Scalable audio data encoding/decoding method and apparatus | |
US20020049586A1 (en) | Audio encoder, audio decoder, and broadcasting system | |
JPH0243382B2 (en) | ||
USRE46082E1 (en) | Method and apparatus for low bit rate encoding and decoding | |
US6134523A (en) | Coding bit rate converting method and apparatus for coded audio data | |
EP1618686A1 (en) | Support of a multichannel audio extension | |
EP0665547B1 (en) | Encoding and decoding system | |
JP4245288B2 (en) | Speech coding apparatus and speech decoding apparatus | |
CA2575379A1 (en) | Signal decoding apparatus | |
AU717993B2 (en) | Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system | |
JPH03108824A (en) | Voice coding/decoding transmission system | |
US6792402B1 (en) | Method and device for defining table of bit allocation in processing audio signals | |
JPH0335300A (en) | Voice coding and decoding transmission system | |
JPH0537395A (en) | Band-division encoding method | |
JPH06327034A (en) | Method of picture coding and method of picture synthesis | |
KR0144935B1 (en) | Coding and decoding apparatus for bit rate | |
JP3352401B2 (en) | Audio signal encoding and decoding method and apparatus | |
JPH0535295A (en) | Voice encoding method | |
JP2003015698A (en) | Audio signal encoding device and audio signal decoding device |