JPH02500620A - coded communication system - Google Patents

coded communication system

Info

Publication number
JPH02500620A
JPH02500620A JP50722288A JP50722288A JPH02500620A JP H02500620 A JPH02500620 A JP H02500620A JP 50722288 A JP50722288 A JP 50722288A JP 50722288 A JP50722288 A JP 50722288A JP H02500620 A JPH02500620 A JP H02500620A
Authority
JP
Japan
Prior art keywords
filter
decoder
parameters
actual error
coder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP50722288A
Other languages
Japanese (ja)
Inventor
キシデイア、コスタス
ゴウビイアナキス,ニコラオス
Original Assignee
ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB878720388A external-priority patent/GB8720388D0/en
Priority claimed from GB888801858A external-priority patent/GB8801858D0/en
Application filed by ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー filed Critical ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー
Publication of JPH02500620A publication Critical patent/JPH02500620A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

In an LPC type coded communications system the excitation source is derived from previous filter outputs at the decoder; in one embodiment the speech output is used, in other embodiments, intermediate excitation outputs are used. To enable tracking the coder derives the filter parameters by using the same excitations, supplied by a local decoder, to synthesise locally the actual error produced at the decoder; the parameters are optimised iteratively by varying the delay of an FIR stage and deriving the actual error in a loop, and selecting the delay for minimum actual error. The IIR parameters may be calculated jointly with the other FIR parameters inside the loop, either for minimum prediction error or minimum actual error. The FIR stage may comprise several parallel FIRs, separately excited.

Description

【発明の詳細な説明】 発明の名称 コード化通信システム この発明は、コード化された音声(スピーチ)信号を伝送するシステムに関する 。この発明はまた、このような音声信号をコード化およびデコードする送受t= 機に関する。[Detailed description of the invention] name of invention coded communication system The present invention relates to a system for transmitting coded audio (speech) signals. . The present invention also provides a transmitter/receiver t= Regarding machines.

コード化された音声信号を伝送する多くの従来システムでは、コード化部におけ る入力音声サンプルからフィルターの特性を引出し、これをデコーダ一部へ送っ ているロブコーダ一部では、送られてきたフィルター特性を、デコードフィルタ ーを構成するのに用いている。その後、このデコードフィルターは、適当な励起 信号源により励起されて、入力音声信号に対する合成再生信号を生成する。In many conventional systems that transmit coded audio signals, the coding section extracts the characteristics of the filter from the input audio sample and sends it to part of the decoder. Some rob coders use the filter characteristics sent to them as decoding filters. It is used to configure the This decoding filter then uses the appropriate excitation It is excited by a signal source to generate a synthetic reproduction signal for the input audio signal.

線形予el符号化(LPG)では、音声信号の短周期なスペクトラルエンベロー ブをモデル化するのに、周期的に更新される有限個の係数を用いた全極型リカー シブフィルタ−が採用されている。これらの係数は、通常、「予測誤差」を最小 化するように工夫された線形方程式の組を解くことによって、直接計算される。In linear pre-el coding (LPG), the short-period spectral envelope of the audio signal is An all-pole liquor model using a finite number of periodically updated coefficients to model A sibu filter is used. These coefficients typically minimize the “prediction error” It is computed directly by solving a set of linear equations devised to give

(なお上記予測誤差とは、入力された音声信号と予測された音声信号との差分の 計測値をいう。)ある種のLPGシステムでは、上記差分の信号から話し手のピ ッチに対応した長い周期性を取り除くために、コード化側に予測ステージを含ま せている。この予測ステージはフィルターの一種と考えることができ、対応する フィルターパラメータもデコーダ一部に送られる。(The above prediction error is the difference between the input audio signal and the predicted audio signal. Refers to measured value. ) In some LPG systems, the speaker's pitch can be determined from the above difference signal. Including a prediction stage on the coding side to remove the long periodicity corresponding to It's set. This prediction stage can be thought of as a type of filter, corresponding to Filter parameters are also sent to part of the decoder.

前記予測誤差は、予測された音声信号にピッチの予測が含まれているか否かに関 係なく、現実の誤差とは異なったものになる。というのも、この予測は励起モデ ルに基づくものであって、デコーダ一部における実際の励起に基づくものではな いからである。The prediction error is related to whether or not the predicted speech signal includes a pitch prediction. Regardless, the error will be different from the actual error. This is because this prediction is based on the excitation model. based on the actual excitation in some part of the decoder. It is the body.

最近のLPGシステムには、例えば多重励起(MP)、レギュラーパルス励起’ (RPE)、およびコードブック励起(CE)といったタイプのLPGシステム がある。デコーダ一部で用いられる励起は、コード化部において選択もしくは銹 導される。このようなシステムでは、デコーダ一部が制御可能な励起信号発生器 を含んでおり、その場合のコード化部はデコーダ一部へ制御信号を伝送するもの でなければならない。Modern LPG systems include, for example, multiple pumping (MP), regular pulse pumping’ (RPE), and codebook excitation (CE) types of LPG systems. There is. The excitation used in part of the decoder is selected or be guided. In such systems, part of the decoder is a controllable excitation signal generator. In that case, the encoding section is the one that transmits the control signal to the decoder part. Must.

デコーダ一部は、それ故、2ステージフイルター(比較的遅延の短い全極フィル ターおよび比較的遅延の長いフィルター)と励起発生器とによって構成できる。Some decoders are therefore equipped with two-stage filters (relatively short delay all-pole filters). (a filter with a relatively long delay) and an excitation generator.

励起制御信号は、それ自身がコード化部で生成される。The excitation control signal itself is generated in the coding section.

MP型LPGでは、これを「合成による解析」により達成している。すなわち、 非修正の励起パルスシーケンスを合成音声で局部的に用い、実際の誤差信号を生 成するために実際の入力信号から合成音声シーケンスを減算し、誤差信号に聴感 上の重み付けを行い、その後、重み付けされた誤差信号を最適化閉ループ内の制 御に用いて、(重み付けされた)実際の誤差を最小化する励起シーケンスを選択 する。In MP type LPG, this is achieved through "analysis by synthesis." That is, The unmodified excitation pulse sequence is used locally in the synthesized speech to generate the actual error signal. Subtract the synthesized speech sequence from the actual input signal to create an audible error signal. Then, the weighted error signal is used as a constraint in an optimization closed loop. control to select the excitation sequence that minimizes the (weighted) actual error. do.

この発明は、音声のコード化法を提供する。このコード化法では、フィルターパ ラメータがコード化部の入力音声信号から周期的に取り出される。導出されたフ ィルターパラメータは、デコーダ一部のフィルターの応答を更新するために、デ コーダ一部へ送られる。なお、デコーダ一部フィルターに入力される励起入力は 、デコーダ一部において、デコーダ一部フィルターの音声出力から取り出される 。The present invention provides a method for encoding speech. This encoding method uses filter parameters. parameters are periodically extracted from the input audio signal of the encoder. The derived f Filter parameters are used to update the response of some filters in the decoder. Sent to part of the coder. In addition, the excitation input to the decoder part filter is , in the decoder part, is extracted from the audio output of the decoder part filter. .

つまり、励起シーケンスに関連したデータの伝送をやめ、デコーダ一部において それ以前の出力音声から励起を単純に引き出すことで、ビットレートを下げるこ とができる。好ましくは、フィルターパラメータのうちの少なくともいくつかは 、予測誤差ではなくデコーダ一部で生成されることになる実際の誤差を減らすよ うに取り出される。なお、合成フィルターはコード化部に設けられていてもよく 、また実際の誤差は局部的に合成された音声を入力音声信号から減算することで 取り出してもよい。This means that the data associated with the excitation sequence is no longer transmitted and some parts of the decoder You can reduce the bitrate by simply pulling the excitation from the previous output audio. I can do it. Preferably, at least some of the filter parameters are , to reduce the actual error that would be generated by the decoder part rather than the prediction error. The sea urchin is taken out. Note that the synthesis filter may be provided in the encoding section. , and the actual error can be determined by subtracting the locally synthesized audio from the input audio signal. You can take it out.

好ましくは、パラメータの生成は、実際の誤差を最小化してフィルターの全ゼロ ステージの遅延パラメータを反復して取り出すことにより達成される。また好ま しくは、その他のパラメータのうち少なくともいくつかは前記ループ内で算出さ れる。また好ましくは、残り全てのパラメータを遅延パラメータ反復ループ内で 計算することにより、これらをまとめて最適化する。他の実施例では、これらの 最適化法は、フィルターの複数並列フィードフォワードステージの励起として、 以前にデコードされた音声でなく以前の励起を用いたシステムに適用することが できる。本願発明の採用によって、大幅な信号対雑音比の改善や装置の小型化が 効果的に行い得、これにより所定の信号対雑音比に対してコード化の遅れをより 短くできる。Preferably, the generation of parameters minimizes the actual error and reduces the total zeros of the filter. This is achieved by iteratively retrieving the stage's delay parameters. I also like it Alternatively, at least some of the other parameters are calculated within said loop. It will be done. Also preferably, all remaining parameters are These are optimized together by calculation. In other embodiments, these The optimization method uses the excitation of multiple parallel feedforward stages of the filter as Can be applied to systems using previous excitation rather than previously decoded speech. can. By adopting the claimed invention, it is possible to significantly improve the signal-to-noise ratio and downsize the device. This reduces the coding delay for a given signal-to-noise ratio. It can be made shorter.

この発明の他の形態は特許請求の範囲おいて詳述されている。これよりこの発明 は添付図面を参照し、実施例を用いて説明される。Other forms of the invention are set out in the claims. From now on, this invention will be described by way of example with reference to the accompanying drawings, in which:

図面の簡単な説明 第1図はこの発明によるコーダーををする一般化した送信器の略図、 第1a図はこの発明によるコーダーを有する送信器の一実施例を示し、 第2図はこの発明によるデコーダーを有する一般化した受信器の略図、 第2a図はこの発明によるデコーダーを有する受信器の一実施例を示し、 第3図は、第1図又は第2図の単一励起合成フィルターの構成要素を示す略図、 第4a図及び第4b図は、この発明によるコーダーの合成フィルターのパラメー タを最も効果的に活用する方法に対応する6つのアルゴリズムを提供し、 第5図はこの発明の他の形態によるコーダーの複合の励起合成フィルターの構成 要素を示す略図、第6図は複合入力合成フィルターのパラメータを鼓も効果的に 活用する方法の例を示し、 第7a図及び第7b図は、この発明の実施例において発生する励起波の波形を示 す図である。Brief description of the drawing FIG. 1 is a schematic diagram of a generalized transmitter with a coder according to the invention; FIG. 1a shows an embodiment of a transmitter with a coder according to the invention, FIG. 2 is a schematic diagram of a generalized receiver with a decoder according to the invention; FIG. 2a shows an embodiment of a receiver with a decoder according to the invention, FIG. 3 is a schematic diagram showing the components of the single excitation synthesis filter of FIG. 1 or 2; Figures 4a and 4b show the parameters of the synthesis filter of the coder according to the invention. We provide six algorithms that address how to use data most effectively. FIG. 5 shows the configuration of a composite excitation synthesis filter of a coder according to another embodiment of the present invention. A schematic diagram showing the elements, Figure 6 shows the parameters of the composite input synthesis filter effectively. Show examples of how to utilize Figures 7a and 7b show waveforms of excitation waves generated in an embodiment of the invention. This is a diagram.

以下の説明は、第1図の送信器を参照して、フレームにサンプルのCY−:]  (]i−0.1,2....n−1を与えるための実例を示している。各フレー ムから、フィルターの最適利用ステージ1は、次に示す゛合成分析°技術を用い 、フィルターパラメータを引き出す。励起シーケンス源2は最を発生し・この最 初の励起シーケンスは、H(z)の応答を有する所定のインパルス応答フィルタ ーB (z)と・無限インパルス応答(全ての極)フィルター1/A(z)に一 致して、2つのステージの合成フィルター3を駆動する:に=1 折フレームのサイズである。The following description refers to the transmitter of FIG. (]i-0.1, 2...n-1 is shown. Each frame Based on the system, stage 1 of optimal use of filters uses the following ``synthetic analysis'' technology. , pull out the filter parameters. Excitation sequence source 2 generates the maximum The initial excitation sequence is a predetermined impulse response filter with a response of H(z). - B (z) and infinite impulse response (all poles) filter 1/A (z) Accordingly, the two-stage synthesis filter 3 is driven: to=1 This is the size of the folding frame.

誤差のより良い測定は、誤差スペクトラムにおけるフォーマット領域を強調しな い方法で、誤差信号を周波数重み付けを摂関数で、重み付はフィルター5によっ て望ましくフィルターリングされる。この信号は反復閉ループにおいて、最適計 算器6によって合成フィルター3のパラメータを最適にするために最小にされる 。合成フィルター3は[akコ、[b コ、dlに対する値を取得する。これら の値は量子化に 器7によって量子化され、コーダー8を通過する。コーダー8はデコードステー ションへの伝送に関するパラメータをコード化する。また、コーダー8は受信ス テーションでのデコーダーと機能的に等しいローカルデコーダー10への伝送に 関するパラメータもコード化する。A better measure of error should not emphasize the format region in the error spectrum. The error signal is frequency-weighted by a centrifugal function, and the weighting is performed by filter 5. filtered as desired. In an iterative closed loop, this signal is is minimized by calculator 6 to optimize the parameters of synthesis filter 3. . The synthesis filter 3 obtains values for [ak, [b], and dl. these The value of is quantized The signal is quantized by a unit 7 and passed through a coder 8. Coder 8 is a decoding station. code the parameters for transmission to the application. Also, the coder 8 for transmission to a local decoder 10 which is functionally equivalent to the decoder at the station. Related parameters are also coded.

ローカルデコーダー10において、パラメータはローカルの出力フレームを生成 するために、パラメータが最適化された同じ励起シーケンス[X 、]によって 励起シーケンス発発生器 器2から駆動される。In the local decoder 10, the parameters generate a local output frame. By the same excitation sequence [X,] the parameters were optimized to excitation sequence generator It is driven from the device 2.

この合成出力は、励起適応計算器12によって必要に応じて受信され、処理され る。この励起適応計算器12はデコーダー合成フィルター11の出力から新しい 励起シーケンスr x −s ]を構築する。新しい励起シーケンスは、先にデ コードされた音声(PDS)信号の一部を形成する次の入力音声フレームの使用 に対して励起シーケンス発生器2を通過させる。This combined output is received and processed as required by the excitation adaptation calculator 12. Ru. This excitation adaptation calculator 12 receives a new value from the output of the decoder synthesis filter 11. An excitation sequence rx-s] is constructed. The new excitation sequence is first Use of the next input audio frame forming part of the coded speech (PDS) signal is passed through the excitation sequence generator 2.

励起適応計算器12およびローカルデコーダー10は第1a図に示すように本発 明のすべての実施例において必要ではない。この簡単な実施例において、入力音 声[y−]のフル −ムは受信され、最適化されたフィルターパラメータは励起シーケンス発生器2 によって供給される励起シーケンスを用いることにより閉ループにおいて得られ る。これが行われた場合、これらの最適化されたパラメータを用いることによて 前述したようにローカルデコーダー合成フィルター11よりはむしろ)合成フィ ルター3によって合成され、合成フレ発生器2に供給され、これを次の励起シー ケンス[X 、〕として与えている。(入力音声の第1フレームがコード化され ている場合、必要とされる初期の励起シーケンスも記憶している。) 第2図において、遠方デコーダー20内のデコーダーユニットはフィルターパラ メータ[a ]、[bk〕、dlを元に戻すためにコーダー8と反対の動作を行 う。このフィルターパラメータは送信器において先に最適化された配置を生成す るために、合成フィルター21を通過する。励起シーケンス発生器23は励起シ ーケンス[X 、]でフィルターを駆動する。この励起シーケンス[X 、]は 送信器で用いられてい−す るのと同じであり、音声の第1のフレームに対して、送信器で用いられているの と等しい初期の励起シーケンスである。The excitation adaptation calculator 12 and the local decoder 10 are connected to the main source as shown in FIG. 1a. It is not necessary in all embodiments of the present invention. In this simple example, the input sound full voice [y-] - the optimized filter parameters are received by the excitation sequence generator 2. obtained in a closed loop by using the excitation sequence supplied by Ru. If this is done, by using these optimized parameters (rather than the local decoder synthesis filter 11 as described above) It is synthesized by the router 3 and is supplied to the synthesized flare generator 2, which uses it as the next excitation sheet. It is given as kens [X,]. (The first frame of the input audio is encoded If so, it also remembers the required initial excitation sequence. ) In FIG. 2, the decoder unit in the far decoder 20 has a filter parameter. Perform the opposite operation to coder 8 to restore meters [a], [bk], and dl. cormorant. This filter parameter generates a pre-optimized placement at the transmitter. It passes through a synthesis filter 21 in order to The excitation sequence generator 23 generates an excitation sequence. The filter is driven by the sequence [X,]. This excitation sequence [X,] is The materials used in the transmitter is the same as the one used by the transmitter for the first frame of audio. is the initial excitation sequence equal to .

この出力もローカルデコーダー10と同様な方法で、励起シーケンス発生器23 において新しい励起シーケンス[X 、]″−1 を作るために、励起適応計算器22に供給される。This output is also sent to the excitation sequence generator 23 in the same way as the local decoder 10. The new excitation sequence [X, ]″−1 is fed to the excitation adaptation calculator 22 in order to create .

第2a図に示すように、単一人力の実施例では、励起適応計算器22は必要ない 。また、励起シーケンス発生器23は、上述したように最後にデコードしたフレ ーム(および初期動イルター及び同じ初期励起を用いて全く同じ合成を行なうの で、この結果作られる更新された励起シーケンスもまた同じであり、励起シーケ ンスデータを伝送する必要はない。As shown in FIG. 2a, in a single-person implementation, the excitation adaptation calculator 22 is not required. . In addition, the excitation sequence generator 23 also outputs the last decoded frame as described above. If we perform exactly the same synthesis using , the resulting updated excitation sequence is also the same, and the excitation sequence There is no need to transmit any performance data.

誤って受信したフィルターパラメータは“不正”の励起シーケンスを生じ、この 励起シーケンスは、次のパラメータ群を送信機側で最適化するためのシーケンス ではないので、伝−力ルデコーダーを一致させることが望ましい。これを実現す るには制御ビットを周期的に前記両デコーダーに送り、各励起シーケンス発生器 23に、あらかじめプログラムされた初期励起シーケンスをリスタートさせるよ う指示すればよい。Incorrectly received filter parameters will result in an “incorrect” excitation sequence and this The excitation sequence is a sequence for optimizing the following parameter groups on the transmitter side. Therefore, it is desirable to match the transmission decoders. make this happen To do this, control bits are periodically sent to both decoders and each excitation sequence generator 23, restart the pre-programmed initial excitation sequence. Just give instructions.

上述した機能の殆どあるいは全部は、単一デジタルプロセッサで実現可能であり 、余分の物理的回路を必要としない。Most or all of the functions described above can be achieved with a single digital processor. , does not require extra physical circuitry.

第1図及び第1a図の送信機のフィルター最適化ステージ1について詳細に述べ る。LPCコーディング技術を用いた多くの従来システムでは、最適化プロセス は、予/l1ll (有意の)誤差の値を最小にすることにより行なわれる。こ の有意の誤差は音声信号の現在値と過去のサンプル値にもとすく予測値とを比較 することにより得られる。We now describe in detail the filter optimization stage 1 of the transmitter of Figures 1 and 1a. Ru. In many conventional systems using LPC coding techniques, the optimization process is performed by minimizing the value of the pre/l1ll (significant) error. child The significant error is the comparison between the current value of the audio signal and the predicted value based on past sample values. It can be obtained by

但し、e、はithサンプルの予測誤差である。However, e is the prediction error of the ith sample.

この技術はこの発明を具現化する場合にも使用しようと思えばできるが、合成フ ィルター3の合成音声出力間の実加圧みすけフィルター5を通すことにより、得 られる重みず1つのフィルター特性を最適化することが望ましい。Although this technique can be used to embody this invention, it is By passing the actual pressurized misuke filter 5 between the synthesized voice outputs of the filter 3, the obtained It is desirable to optimize the filter characteristics for each weight.

重みすけフィルター5はMPLPGあるいはRPE−LPGと同様に定義される ので、その動作説明を省略する。The weighted filter 5 is defined similarly to MPLPG or RPE-LPG. Therefore, the explanation of its operation will be omitted.

“実際の誤差”とは認知的に重みすけされた実際の21差を含むものとする。"Actual error" shall include the actual cognitively weighted difference.

に複雑な計算を伴う非線形の問題であり、この発明の好適実施例では、フィルタ ー特性は、直通信号である最小予測誤差エネルギーe”iに対するパラメータを (平均最小二乗法を用いて)初めに計算することにより、問題を部分的に線形化 することにより選択される。これらの値を用いて、残りのバより得られる。is a nonlinear problem that involves complex calculations, and in the preferred embodiment of this invention, the filter - Characteristics are the parameters for the minimum prediction error energy e”i, which is a direct signal. Partially linearize the problem by first computing (using mean least squares) Selected by Using these values, the remaining values are obtained.

他のパラメータの値はループ内あるいはループ外で下記の如くに計算することが できる。The values of other parameters can be calculated inside or outside the loop as follows: can.

第3図において、フィルター最適化ステージ1の合成フィルター3は直列接続さ れた2ステージで構成される。すなn−di わち、伝送特性B (z)z を有する無限インパルス応答フィルターから成る 第1フィルター回路31と、伝送特性1 / A (z)を有する無限インパル ス応答フィルターから成る第2フィルター回路32で構成される。従って、全体 のフィルターインパルス応答H(Z)は式Aにおいて必要となるである。第1の フィルター回路31は、q1+1係数回路[b、] (i−0,11,、、q  )及びq 1+d を遅延回路で構成されており、(d 1+n−1)の長さの 遅延を有し、その後にq1+1ステージの非リカーシブフィルタ−が結合されて いる。実際には、少数の係数回路(q 1−0.1o「2)が用いられる。In Figure 3, the synthesis filter 3 of filter optimization stage 1 is connected in series. It consists of two stages. Suna n-di That is, it consists of an infinite impulse response filter with transmission characteristic B(z)z The first filter circuit 31 and an infinite impulse having a transmission characteristic of 1/A(z) The second filter circuit 32 includes a second filter circuit 32 consisting of a frequency response filter. Therefore, the whole The filter impulse response H(Z) of is required in equation A. first The filter circuit 31 is a q1+1 coefficient circuit [b,] (i-0,11,,,q ) and q1+d are constructed with delay circuits, and the length of (d1+n-1) is delay, followed by a q1+1 stage non-recursive filter. There is. In reality, a small number of coefficient circuits (q1-0.1o "2") are used.

使用される遅延回路(それゆえ、遅延長)の数は実際の動作で所定の最大数N− 1(この値はフレームサイズnより小さくでも大きくても良い)まで変わる。The number of delay circuits (and therefore delay lengths) used is limited to a predetermined maximum number N- in practical operation. 1 (this value may be smaller or larger than the frame size n).

それゆえ、この第1のフィルター回路31は励起信号EX 、3を受取、[X  、] シーケンスの最も最近のq l+d 1+nサンプル値を含んでいる。Therefore, this first filter circuit 31 receives the excitation signal EX,3 and [X ,] contains the most recent ql+d1+n sample values of the sequence.

第2フィルター回路はフィルター係数 [akコ (k−1,21,、、p)に より定義される全極応答を有するリカーシブフィルタ−から成る。The second filter circuit has filter coefficients [ak (k-1, 21,,,p) consists of a recursive filter with an all-pole response defined by

以下の、記述では、ベクトル標示を用いる。ベクトルaは[ak]係数群を示し 、ベクトルbは[b、]係数群を示す。The following description uses vector markings. Vector a indicates the [ak] coefficient group , vector b indicates a group of coefficients [b,].

入力音用の各受信したフレームに対して、フィルター最適化計算器6は最初に、 平均予測誤差エネルギーeTeの[a、〕係数を計算する。For each received frame for the input sound, the filter optimization calculator 6 first: Calculate the [a,] coefficient of the average prediction error energy eTe.

好適実施例では、(第4図及び第5図の方法1参照)0とN−1の間の各d1の 値に対してループ内のbベクトルと結合してaベクトルを計算し、上述したよう に最小のe に対警 最小にするaベクトルとbベクトルは次式で得られる。In the preferred embodiment (see method 1 of FIGS. 4 and 5), each d1 between 0 and N-1 Compute the a vector by combining it with the b vector in the loop for the value, as described above. against the police to the minimum e The a vector and b vector to be minimized are obtained by the following equations.

但し、Xは −(n+d 十q )から −(dl+1)までの励起サンプルX kのnx (ql +1)マトリクスであり、Yはy からy までのykサン プルの(nxp)マトリ−p n−2 クスである。However, X is the excitation sample X from -(n+d 1q) to -(dl+1) nx (ql + 1) matrix of k, and Y is yk sun from y to y Pull's (nxp) matrix-p n-2 It's Kusu.

実際の誤差エネルギーiT″i!は次ぎの3つの方法のいずれかを用いて最小化 される。The actual error energy iT″i! is minimized using one of the following three methods: be done.

実際の誤差エネルギー否T古はニーy−’9を用いてもめられる。それゆえ、) I (Z)は°合成解析°ループ内で決定される。このループ内ではdlはNの 値の範囲で変化する。The actual error energy is determined using y-'9. therefore,) I(Z) is determined within the synthesis analysis loop. In this loop, dl is N Varies within a range of values.

−に対して最適化されるのに対し、iと5は最小予11FI誤差エネルギー11 1に対して選択される。これについては、スキーム1として、第4図で述べる。−, while i and 5 are optimized for the minimum predetermined 11 FI error energy 11 1. This will be described in FIG. 4 as Scheme 1.

第2実施例においては、Eを評価するためのアプローチは上述のスキーム1の変 形である。この場合、iと6は予測誤差;T古を最小にするようなd の値に対 する方程式(D)により定義される。一度、dlが最適化されると、ベクトルb は(F)式を用いて実際の誤差を最小にするように(最適化ループの外で)再評 価される。In a second embodiment, the approach for evaluating E is a variation of Scheme 1 above. It is the shape. In this case, i and 6 are prediction errors; for the value of d that minimizes T is defined by equation (D). Once dl is optimized, vector b is re-evaluated (outside the optimization loop) using equation (F) to minimize the actual error. valued.

ここで、mはその出力がゼロの時の、1/A(z)フィルターの出力を示してい る。そのメモリは従前の合成された音声フレームの最も最近のサンプルから構成 される。Qは(n x n)の渦状のマトリクスを意味し、qkは合成検索ステ ップによる従前の分析から得られたiとdlを用いた1/A(z)フィルターの インパルス応答のに番目の値である。これは、第4図に第2スキームとして示さ れる。Here, m indicates the output of the 1/A(z) filter when its output is zero. Ru. Its memory consists of the most recent sample of the previous synthesized audio frame. be done. Q means a (n x n) spiral matrix, and qk is a synthetic search step. of the 1/A(z) filter using i and dl obtained from the previous analysis by is the second value of the impulse response. This is shown as the second scheme in Figure 4. It will be done.

第3の実施例において、dlの各与えられた値に対し、方程式(D)を用いて、 予ΔIIJ誤差を最小にするように、a(及びb)が計算される。石の値は実際 の誤差を最小にするためのループ内で、(F)を用いて、(再)計算される。In a third example, for each given value of dl, using equation (D): a (and b) are calculated to minimize the pre-ΔIIJ error. Stone value is actual is (re)calculated using (F) in a loop to minimize the error of .

従ッテ、各d [(0(d、(N−1)に対して定義された合成ループによる分 析内で、iが式(D)を用いて、最初古T古は(G)式から直接水める事もでき る。Therefore, each d [(0(d,(N-1)) is divided by a composition loop defined for In the analysis, if i uses equation (D), the first ancient T ancient can also be calculated directly from equation (G). Ru.

実際の誤差エネルギーを最小にするd1値、対応するa。The d1 value that minimizes the actual error energy, corresponding to a.

5値は最適となるようにそれから選択される。これは、第4図にスキーム3とし て示される。Five values are then selected to be optimal. This is shown in Figure 4 as Scheme 3. is shown.

上記のスキーム2と3は精度上の理由で、予測誤差エネルギーiよりも実際の誤 差エネルギーiを最小にする事により5が(再)定義されるように選択される。For accuracy reasons, the above schemes 2 and 3 are based on the actual error rather than the prediction error energy i. 5 is chosen to be (re)defined by minimizing the difference energy i.

他の実施例において、第4.5図に方法IIとして示されるように、iは、6が ゼロに等しいとの仮定のちとに、6とは独立に、(H)式に従ってループの外で 、予測エネルギーを最小にするように、はじめに計算される。In another embodiment, i is 6, as shown in Figure 4.5 as Method II. After the assumption that it is equal to zero, outside the loop according to equation (H), independently of 6, , is first calculated to minimize the predicted energy.

E = (YTY)″l YTY ’ (H)次に、iが与えられ、6とd1パ ラメータが上述のスキーム1.2.3により、最適化できる。特に、最小予測エ ネルギーをeTeを生成するbの値は(J)式により与えられる。E = (YTY)″l YTY’ (H) Next, i is given, and 6 and d1 parameter parameter can be optimized according to scheme 1.2.3 above. In particular, the minimum predicted The value of b for generating energy eTe is given by equation (J).

6 = (xTx)−1x” (y −yM) (J)スキーム1.2.3への 対応するアプローチは、それぞれスキーム4,5.6として、それぞれ¥S4図 に示され、この発明の第4.5.6の実施例を構成する。6 = (xTx) - 1x" (y - yM) (J) to Scheme 1.2.3 The corresponding approaches are shown as Schemes 4 and 5.6, respectively, in Figure S4. , which constitutes the 4.5.6 embodiment of the present invention.

生成されたパラメータはそれから量子化器7により量子化される。この量子化器 はパラメータ間に利用できるビットを割り付ける。The generated parameters are then quantized by a quantizer 7. This quantizer allocates available bits between parameters.

合成フィルターに対する励起は単一の励起シーケンス[X、]を用いて説明した が、数個の励起シーケンスを用いることが望ましい。従って、第1図において、 励起シーケンス源2は複数の異なるシーケンス[X 、1. [u 、] 。The excitation for the synthesis filter was explained using a single excitation sequence [X,] However, it is desirable to use several excitation sequences. Therefore, in Figure 1, The excitation sequence source 2 generates a plurality of different sequences [X, 1. [u,].

[V 、]を合成フィルター3に供給するように適合させられ−す る。[V, ] is adapted to supply the synthesis filter 3. Ru.

力される過去にデコードされた音声y、でよく、他のシーケンスは、合成フィル ター3の中間出力から励起適合計算器12によって得られる。(あるいは、その ようなシーケンスの全てが以下に述べるようにして得てもよい。)第5図におい て、フィルター3は(当然、第1.2.28図のフィルター11.21も)直列 に配置された2つのステージから構成される。第1のフィルター素子51はj個 のフィルター51a、51b、、、51jから構成され、各フィルターは励起シ ーケンス[X、]。The previously decoded audio y, input to is obtained by the excitation adaptation calculator 12 from the intermediate output of the controller 3. (or that All such sequences may be obtained as described below. ) Figure 5 Smell Therefore, filter 3 (of course, filter 11.21 in Fig. 1.2.28) is connected in series. It consists of two stages located at The number of first filter elements 51 is j. It consists of filters 51a, 51b, . . . , 51j, each filter having an excitation series. - Kens [X,].

[u ]、EV−1]等を受け、出力を生成する。図示され−す るように、フィルター51a、51b等は、それぞれ応答(1) Z−n−dl  (2) Z−n−d2B (z) 、B (z) (3)Z−n−d3、を有する。そして、それらのB (2) 組み合わされた出力は第2フイルター素子32に供給される。[u ], EV-1], etc., and generates an output. Illustrated As shown in FIG. (2) Z-n-d2B (z), B (z) (3) It has Z-n-d3. And those B (2) The combined output is provided to a second filter element 32.

第2フイルター素子32は、前述のように、応答1/A (z)を有する反復フ ィルターである。The second filter element 32 is a repeating filter with a response 1/A(z), as described above. It is a filter.

図示されるように、各フィルター51a、51b等はフィ単一の励起フィルター を用いる場合において、パラメータ間に対し、実際の誤差エネルギーを最小にす る事により最適化される。この最適化は第1から第6の実施例において、説明さ れたそれらに基づいた方法を用いて、部分的に線形化することにより(すなわち 、最小子Al11エネルギーをめる事によりいくつかのパラメータを計算する事 により)、計算上の複雑さを減少して行われる。As shown, each filter 51a, 51b, etc. is a single excitation filter. is used, the actual error energy is minimized between the parameters. Optimized by This optimization is explained in the first to sixth embodiments. By partially linearizing (i.e. , some parameters can be calculated by taking the minimum Al11 energy. ), with reduced computational complexity.

一般的には、フィルターパラメータは、フィルターが成長その精度を改善するよ うに、順番に最適化される。In general, the filter parameters will allow the filter to grow and improve its accuracy. are optimized in order.

これは伝送スキームに役に立ち、もしビットの割合の減少か要求されるのであれ ば、より早い係数のみ(例えば(1)、dl)か伝送される必要がある。This is useful in transmission schemes, if a reduction in the proportion of bits is required. For example, only the earlier coefficients (eg (1), dl) need to be transmitted.

S b 第6図に示すように、一実施例におけるフィルター最適化ステージ6は単一の励 起ケースの場合の第1の実施例(方法l)に基づく計算を採用するために用いら れる。プロセスの第1ステージにおいて、a、b 及びdlは零に見せかけた他 のパラメータによって第4図のスキーム1.2、若しくは3に従う実際の誤差エ ネルギーを最小にすることによって見付けられる。S b As shown in FIG. 6, filter optimization stage 6 in one embodiment used to adopt the calculation based on the first embodiment (method l) for the It will be done. In the first stage of the process, a, b, and dl were made to look like zero, and The actual error error according to scheme 1.2 or 3 in Fig. 4 can be calculated depending on the parameters of It is found by minimizing the energy.

好ましい実施例においては、種々の方法で、それら自身でa及びb を再限定す るために使用されることができ、以下のように説明される。In preferred embodiments, a and b may themselves be redefined in various ways. It can be used for

第1のアプローチはスキーム1(若しくはスキーム2)に基づく。もしb が、 iおよびb と独立して計算されるときは最小の予測エネルギーe”e解法は以 下の式で与えられる。 。The first approach is based on Scheme 1 (or Scheme 2). If b is When computed independently of i and b, the minimum predicted energy e”e solution is: It is given by the formula below. .

b (2)−(uTu)−’uT(y−Ya−Xb (1))まで、励起サンプ ルukのnx (ql+1)マトリクスを示し、第1ステージの等式Fに相当す る。b (2)-(uTu)-'uT(y-Ya-Xb(1)), excitation sample nx(ql+1) matrix of Luke, which corresponds to the equation F of the first stage. Ru.

−(2)は交互にiと結合されたり、i及びb と結合されて計算され、この場 合、第1ステージにおける等式(D)に相当する簡単なマトリクス表示が用いら れる。−(2) is computed by being alternately combined with i or with i and b, and in this case In this case, a simple matrix representation corresponding to equation (D) in the first stage is used. It will be done.

ルギーに対して計算することができる。しかしながら、これるフィルターが選択 される。can be calculated for Rugi. However, Koruru filter is selected be done.

フィルターパラメータのいくつかは、前記プロセスによって既に決定された特別 な値d□−d1′及びd2−d、、’に対して(ループを外れて)再評価される 。特に、合成プロセスによる第2の解析が最小予測エネルギーに対するフィルタ 、<ラメータを評価するとき、フィルターパラメータのいくつか又はすべては、 最小予測誤差エネルギーと最小の実際の誤差エネルギーのいずれかに対して、以 下のように再限定さ計算される。Some of the filter parameters are special is reevaluated (out of the loop) for the values d□−d1′ and d2−d,,’ . In particular, the second analysis by the synthesis process is the filter for the minimum predicted energy. , < When evaluating the parameter, some or all of the filter parameters are For either the minimum predicted error energy or the minimum actual error energy, The re-limited calculation is as below.

交互に、スキーム3のアルゴリズムに基づくアプローチが採用される。例えば、 (i) b はa及びb と独立して、d2のN異なる値に対して実行される合 成ループによっての解析範囲−T二 は最小のエネルギーeeであるd 2− d 2 ’の値に対して選択される。Alternately, an approach based on the algorithm of Scheme 3 is adopted. for example, (i) b is a combination performed independently of a and b for N different values of d2. Analysis range by forming loop-T2 is selected for the value of d2-d2' which is the minimum energy ee.

(ii) b は最小予測誤差エネルギーeTeに対続され、6(2)は、最小 予測誤差に対して再評価される。(ii) b is concatenated with the minimum prediction error energy eTe, and 6(2) is the minimum Reevaluated for prediction errors.

(iii) b(2)は最小予測誤差に対してi及び−(1)と結合して計算さ れる。新しいiベクトルは存続され、一方、b 及びb は等式(D3)からの 最小予測誤差に対して再評価される。(iii) b(2) is calculated by combining i and −(1) for the minimum prediction error. It will be done. The new i vector is preserved, while b and b are from equation (D3) Reevaluated for minimum prediction error.

最適化値d1及びd2、即ちdユ′及びd2′が与えられると、フィルターパラ メータのいくつかは等式(D3)を用いて(合成ループによる解析によらない) 単一のステ・ノブにおいて、再最適化が行なわれ、その結果、b 及び−(2) を再限定する。Given the optimized values d1 and d2, i.e. du' and d2', the filter parameters Some of the meters are calculated using equation (D3) (not analyzed by the synthesis loop) On a single Ste-knob, re-optimization is performed, resulting in b and -(2) relimit.

−(3)及びd3を計算するため、及び先のフィルター特す 性を再計算するための第3のステージに対する上述した計算の延長は、もし等式 がより高い項を含むように適当に修正さ合計項数があるステージから次のステー ジに展開する最適化プロセスのように順次増加する。- (3) and to calculate d3 and specify the previous filter An extension of the calculations described above to a third stage for recalculating the equations from one stage to the next with a total number of terms modified appropriately to include higher terms. It increases sequentially like an optimization process that unfolds over multiple pages.

この発明の他の実施例においては、第4b図のスキームの4.5又は6のアプロ ーチは以下のように行なわれ、係数[akコは、通常のLPG解法を用いて最小 予測誤差エネルギーiTiに対して最初に最適化される。In other embodiments of the invention, approaches 4.5 or 6 of the scheme of FIG. The search is performed as follows, where the coefficient [ak is the minimum value using the usual LPG solution method. It is first optimized for the prediction error energy iTi.

フィルタ係数の計算において用いられている方法は、ステージ1で用いられ得る 6つのスキームのうちの1つ、或いはそれ以上のスキームに基づく広範なアルゴ リズムから選択される。第2のステージの式を検討すると、ステージ1の式と形 式的に類似していることが判る。フィルタ最適化計算器6はステージ2と、それ に続くステージのためにステージ1と同じ方法を、必要に応じて拡張して用いる 事ができる。繰り返しプログラミング技術を簡単にでき、ひいてはシステムの簡 略化につながるからである。The method used in calculating the filter coefficients can be used in stage 1 A wide range of algorithms based on one or more of six schemes Selected from rhythm. Considering the second stage equation, the stage 1 equation and form It can be seen that the formulas are similar. The filter optimization calculator 6 includes stage 2 and its For subsequent stages, use the same method as for stage 1, extending as necessary. I can do things. Easily repeat programming techniques and, in turn, simplify systems. This is because it leads to simplification.

フィルタパラメータのいくつかを選択することは、最小予測誤差エネルギeに対 してそれらを計算することによって実行されるが、他の(例えば逆フイルタ動作 [yi]によって)計算され、算出され得ることは理解されよう。Choosing some of the filter parameters affects the minimum prediction error energy e. but other (e.g. inverse filter operations) [yi]) and can be calculated.

上述のH(Z)フィルタを適応することは、係数の組みの値に限定されるのみな らず、フィルタの°構造°、すなわちに再定義されるということを実現すること が重要である。Adapting the H(Z) filter described above is only limited to the values of the set of coefficients. However, the structure of the filter is redefined, i.e. is important.

励起適応計算器]2の動作を次に述べる。前述の適用から、合成フィルタ21を 駆動するために受信ステーションで用いられる励起は、そのフィルタが最適化さ れるものでなければならないということは明らかである。受信フィルタ21が、 送信器中のローカルデコーダフィルタ11と最適化フィルタ3と同一である場合 、励起は、送信されたパラメータが最適化されるためのそれと同じでなければな らない。The operation of Excitation Adaptive Calculator] 2 will be described next. From the above application, the synthesis filter 21 is The excitation used at the receiving station to drive the It is clear that it must be possible. The reception filter 21 is When the local decoder filter 11 and optimization filter 3 in the transmitter are the same , the excitation must be the same as that for the transmitted parameters to be optimized. No.

予めプログラム化されている初期シーケンスでもって送信器2と受信器23にお ける励起シーケンス発生器を提供することにより、上記のように、これは構成さ れる。シーケンスが有する正確な特性はクリティカルなものではなく、例えば零 平均ガウシアン(Gaussian)ランダムシーケンスのようなものである。transmitter 2 and receiver 23 with a pre-programmed initial sequence. This can be configured as described above by providing an excitation sequence generator that It will be done. The exact properties the sequence has are not critical, e.g. It is like an average Gaussian random sequence.

この単一シーケンスは、第5図に示したような構成の複合入力合成フィルタ3の 各入力を駆動するのに用いることができる。上述したような3つの応答、 を待った最初の3個のフィルタ51as 51bs 51cについて考える0こ こで、nは分析フレームのフレームサイズ、パラメータd1、d2、d3の値は 、シーケンス[X、]中の特定のセグメントを示し、これらはH(Z)合成フィ ルタ3のFIR要索51a、51b、51c中に各々に対する励起信号として供 給される。This single sequence is applied to a composite input synthesis filter 3 configured as shown in FIG. It can be used to drive each input. Three responses as mentioned above, Considering the first three filters 51as, 51bs, and 51c that waited for Here, n is the frame size of the analysis frame, and the values of parameters d1, d2, and d3 are , denote certain segments in the sequence [X,], which are H(Z) synthetic fi Provided as an excitation signal for each of the FIR signals 51a, 51b, and 51c of the router 3. be provided.

この発明のPDSの実施例において、付加信号演算回路]2は単に励起fJ号格 納部と音声出力部との間のリンクである。PDS信号を励起シーケンスとして用 いることは、与えられた伝送速度における信号対雑音比(SNR)を上げる点、 およびコード化の遅れを少なくする点のいずれか一方、もしくは双方の点からみ て極めて有効である。In the embodiment of the PDS of this invention, the additional signal calculation circuit]2 is simply the excitation fJ number. This is a link between the storage section and the audio output section. Use PDS signal as excitation sequence This increases the signal-to-noise ratio (SNR) at a given transmission rate, and/or reduce coding delays. It is extremely effective.

以上述べたように、X (Z)の代わりに他の入力を用いることももちろん可能 である。特に、X (Z)は最初のフィルタ要素31または51の出力から(即 ち、全体のフィルタH(Z)の中間出力として)取り出すことができる。この場 合、このフィルタ要素は、その出力と入力との間にフィードバック回路があるの で、無限応答フィルタとして考えることができる。ここで、励起信号はこの中間 出力からのみ取り出される。また、A (Z)フィルタへの入力は、例えば、ロ ーズ(Rose)およびバーンウェル(Barnwel I)による、°自己励 起ボコーダ: 4800ボーを用いた長距離通話に対する他のアプローチ”、( ICASSPのIEEE PROC,における1986年4月号の453〜45 6頁)に示された“自己励起ボコーダ′の中で生成されたデータと同等のもので ある。As mentioned above, it is of course possible to use other inputs instead of X (Z). It is. In particular, X (Z) is derived from the output of the first filter element 31 or 51 (immediately In other words, it can be taken out (as an intermediate output of the entire filter H(Z)). this place In this case, this filter element has a feedback circuit between its output and input. It can be thought of as an infinite response filter. Here, the excitation signal is Extracted only from output. Also, the input to the A(Z) filter is, for example, °Self-excitation by Rose and Barnwell I ``Vocoder: Another approach to long distance calls using 4800 baud'', ( 453-45 of ICASSP's IEEE PROC, April 1986 issue. This is equivalent to the data generated in the “self-exciting vocoder” shown in page 6). be.

上述したようなパラメータ最適化法は、並行フィルタ構造を有する場合も同様に 適用可能である。The parameter optimization method described above can be applied similarly to cases with parallel filter structures. Applicable.

第7a図に示したグラフは、全極フィルタ32に対する入力として用いられる代 表的な信号波形を示す。この信号はPDS信号であって、全零フィルタ31によ ってろ波されたものであり、音声波形に極めて類似したものである。二のPDS 励起の音声近似性は、第7b図に示したPES励起波形とはまったく異なるもの である。これらのPES励起波形は、M P L P Cのような従来のシステ ムの中で用いられる励起波形に極めて似たものである。The graph shown in FIG. A typical signal waveform is shown. This signal is a PDS signal and is passed through the all-zero filter 31. It is filtered and has a very similar waveform to the voice waveform. Second PDS The audio approximation of the excitation is completely different from the PES excitation waveform shown in Figure 7b. It is. These PES excitation waveforms are compatible with conventional systems such as MPL This is very similar to the excitation waveform used in the system.

これらの励起は、人間のボーカルコードによって形成された声門パルス列に極め て似ているパルス列である。These excitations are unique to the glottal pulse train formed by the human vocal chord. This is a similar pulse train.

このように、この発明によるPDS励起は、従来のPES励起を用いる場合より もずっと良好な結果が得られる。従って、PDS信号は、少ないろ波処理を行う だけであるにもかかわらず、“音声近似”信号であり、従来の音声源/フィルタ モデルにおけるランダム波形から各音声フレームを再合成しなければならない方 法に対して、音声フレーム間の変化を見るために、単にフィルタにおいて先行音 声フレームを変形するだけでよい。In this way, PDS excitation according to the present invention is more effective than when using conventional PES excitation. gives much better results. Therefore, the PDS signal undergoes less filtering. However, it is an “audio approximation” signal and cannot be used with conventional audio sources/filters. Those who have to resynthesize each audio frame from random waveforms in the model For the method, in order to see the changes between audio frames, we simply use the preceding sound in the filter. All you have to do is transform the voice frame.

各実施例において、フレームサイズの増加に伴ってSNRが減少することが分っ た。特に、単一の励起シーケンスによるPDSを用いた実施例では、特に、フレ ームサイズの小さいところで高い5NR4’!性を示し、このことは伝送される 音声の明瞭度を高めることを意味している。さらに、単一励起型のPDSを用い る実施例はより小さいフレームサイズで構成することができ、この結果、コード 化による遅れを減少させることができる効果か得られる。In each example, it was found that the SNR decreased as the frame size increased. Ta. In particular, in embodiments using PDS with a single excitation sequence, the frequency High 5NR4' in a small room size! This is transmitted This means improving the clarity of speech. Furthermore, using single excitation type PDS implementations can be configured with smaller frame sizes, resulting in code This has the effect of reducing delays caused by conversion.

フィルタパラメータを個々に評価する代わりに、いくつかのパラメータを合わせ て評価することによって好都合なことがある。Instead of evaluating filter parameters individually, combine several parameters It may be advantageous to evaluate the

フィルタの係数の個数を増加したり、または、d、の最大値を増加したりするこ とによって、コード化、デコード化の際のSNRを高めることができることが分 った。SNRの改善を行うために、フレーム当たりの伝送ビットを増加させる必 要があるとしても、ビット数を新しいフィルタの係数に対して割当てることより は、遅延パラメータのために特別なビットを割当てることの方が有利であること は明らかである。It is possible to increase the number of coefficients of the filter or increase the maximum value of d. It was found that the SNR during encoding and decoding can be increased by It was. In order to improve SNR, it is necessary to increase the transmitted bits per frame. Even if necessary, it is better to allocate the number of bits to the coefficients of the new filter. that it is advantageous to allocate a special bit for the delay parameter is clear.

国際調査報告international search report

Claims (25)

【特許請求の範囲】[Claims] (1)フィルターパラメータは、コーダーにおいて入力音声信号から周期的に導 き出され、デコーダーフィルターの応答を更新するために、デコーダーに送信さ れ、前記デコーダーフィルターへの励起入力は前記デコーダーフィルターの音声 出力から前記デコーダーにおいて導き出されることを特徴とする音声通信の方法 。(1) The filter parameters are periodically derived from the input audio signal in the coder. sent to the decoder to update the decoder filter response. and the excitation input to the decoder filter is the audio of the decoder filter. A method of voice communication, characterized in that the output is derived in the decoder. . (2)前記フィルターパラメータを導き出すことは、前記入力音声信号と前記デ コーダーの前記出力との間の実際の誤差を減少させるように、実行されることを 特徴とする請求項1記載の方法。(2) Deriving the filter parameters includes combining the input audio signal and the data to be performed, so as to reduce the actual error between the coder's output and the coder's output. The method of claim 1, characterized in that: (3)前記デコーダーは、直列の第1と第2のフィルターを具備する合成フィル ターを含み、前記第1フィルターは可変遅延パラメータを有し、前記第2のフィ ルターは無限インパルス応答フィルターであり、および前記フィルターパラメー タは、前記遅延パラメータを変え、前記入力音声信号と前記デコーダーの前記出 力との間の前記実際の誤差の対応する評価を導きだし、その後、この評価された 実際の誤差を減少させる前記遅延パラメータ値を選択することとを含む反復プロ セスによって、前記コーダーにおいて周期的に導き出されることを特徴とする請 求項2記載の方法。(3) The decoder includes a composite filter comprising a first and a second filter in series. the first filter has a variable delay parameter and the second filter has a variable delay parameter; router is an infinite impulse response filter, and the filter parameters the input audio signal and the output of the decoder by changing the delay parameter; Derive the corresponding evaluation of said actual error between the forces and then this estimated and selecting said delay parameter values that reduce the actual error. The coder is periodically derived by a process. The method described in claim 2. (4)前記コーダーは、そのような合成フィルターを含み、前記実際の誤差の評 価は、前記遅延パラメータの各値に対する合成音声出力を生成し、前記合成音声 出力と前記入力音声信号とを比較することによって、前記コーダーにおいて導き 出されることを特徴とする請求項3記載の方法。(4) said coder includes such a synthesis filter, and said coder includes an evaluation of said actual error; generating a synthesized speech output for each value of said delay parameter; in the coder by comparing the output with the input audio signal. 4. A method according to claim 3, characterized in that: (5)前記遅延パラメータ値の各々に対して、前記第1のフィルターの他のパラ メータに対し、および前記第2のフィルターのパラメータに対する値は、一緒に 計算され、前記評価された実際の誤差を導き出すために使用されることを特徴す る請求項3あるいは4記載の方法。(5) For each of the delay parameter values, other parameters of the first filter are determined. The values for the meter and for the parameters of the second filter are together calculated and used to derive said estimated actual error. 5. The method according to claim 3 or 4. (6)前記第2のフィルターのパラメータに対する値は、前記反復プロセス外で 初めに評価され、前記第1のフィルターの他のパラメータに対する値は、前記遅 延パラメータ値の各々に対して計算され、前記評価された実際の誤差を導き出す ために使用されることを特徴する請求項3あるいは4記載の方法。(6) The values for the parameters of the second filter are determined outside the iterative process. The values for the other parameters of the first filter are initially evaluated and the values for the other parameters of the first filter are Deriving the estimated actual error calculated for each of the extended parameter values 5. The method according to claim 3, wherein the method is used for: (7)フィルターパラメータは、コーダーにおいて入力音声信号から周期的に導 き出され、デコーダーフィルターの応答を更新するために、デコーダーに送信さ れ、前記デコーダーは、直列の第1と第2のフィルターを具備し、前記第1フィ ルターは可変遅延パラメータを有し、前記第2のフィルターは無限インパルス応 答フィルターであり、前記デコーダーフィルターへの励起入力は前記デコーダー フィルターの1以上の中間出力から前記デコーダーにおいて導き出され、前記フ ィルターパラメータは、前記遅延パラメータを変え、前記第1と第2のフィルタ ーの他のパラメータ値を計算し、前記入力音声信号と前記デコーダーの前記出力 との間の前記実際の誤差の評価を導きだすために、前記値を使用し、その後、こ の評価された実際の誤差を減少させるように前記遅延パラメータ値を選択するこ ととを含む反復プロセスによって、前記コーダーにおいて導き出されることを特 徴とする音声通信の方法。(7) The filter parameters are periodically derived from the input audio signal in the coder. sent to the decoder to update the decoder filter response. The decoder includes first and second filters in series, and the first and second filters are arranged in series. The filter has a variable delay parameter, and the second filter has an infinite impulse response. the excitation input to the decoder filter is the excitation input to the decoder filter. derived in the decoder from one or more intermediate outputs of the filter; The filter parameters vary the delay parameters and the filter parameters vary between the first and second filters. calculate other parameter values of the input audio signal and the output of the decoder; and then use this value to derive an estimate of the actual error between selecting the delay parameter value to reduce the estimated actual error of is derived in said coder by an iterative process including A method of voice communication. (8)前記遅延パラメータ値の各々に対して、前記第1のフィルターの他のパラ メータの値は、予測誤差が低くなるように計算されることを特徴する請求項5乃 至7のうちいずれかに記載の方法。(8) For each of the delay parameter values, other parameters of the first filter are determined. 5. The meter value is calculated such that the prediction error is low. The method described in any one of (7) to (7) above. (9)前記遅延パラメータ値の各々に対して、前記第1のフィルターの他のパラ メータの値は、実際の誤差が低くなるように計算されることを特徴する請求項5 乃至7のうちいずれかに記載の方法。(9) For each of the delay parameter values, other parameters of the first filter are determined. 5. The meter value is calculated in such a way that the actual error is low. 7. The method according to any one of 7. (10)前記遅延パラメータの選択後、前記第1のフィルターの他のパラメータ の値は、実際の誤差が低くなるように再計算されることを特徴する請求項5乃至 7のうちいずれかに記載の方法。(10) After selecting the delay parameter, other parameters of the first filter The value of is recalculated so that the actual error is lowered. 7. The method described in any one of 7. (11)前記実際の誤差は、重要性が低いと認識されるスペクトラル領域の依存 を減少させるように重み付けられることを特徴とする請求項1乃至10のうちい ずれ化に記載の方法。(11) The actual error depends on the spectral region that is perceived to be less important. Claims 1 to 10 are weighted to reduce the The method described in Shifting. (12)前の合成音声出力化ら導き出された信号によって励起される時、それら の特性を有するフィルターによって生成される合成音声出力と入力音声信号との 間の実際の誤差の評価を減少させるように、前記入力音声信号からフィルター特 性を周期的に導き出すように構成された手段を具備することを特徴とする音声コ ーダー。(12) When excited by a signal derived from a previous synthesized speech output, they The difference between the input audio signal and the synthesized audio output generated by the filter with the characteristics of filter characteristics from said input audio signal so as to reduce the estimation of the actual error between A voice code, characterized in that it comprises means configured to periodically derive the gender. -der. (13)前記合成音声出力を生成するのに適応する合成フィルターを有し、前記 実際の誤差の評価は、前記入力音声信号と前記合成フィルターの前記合成音声出 力との間で形成される誤差であることを特徴とする請求項12記載のコーダー。(13) comprising a synthesis filter adapted to generate the synthesized speech output; The actual error evaluation is based on the input audio signal and the synthesized audio output of the synthesis filter. 13. The coder according to claim 12, wherein the error is an error formed between the force and the force. (14)入力音声信号からフィルター特性を周期的に導き出すように構成された 手段を具備し、前記フィルター特性は、直列の第1と第2のフィルターを具備す る合成フィルターを具備する合成フィルターによって生成される出力と前記入力 音声信号との間の実際の誤差を減少させるように導き出され、前記第1フィルタ ーは複数の並列フィードフォワードフィルターを具備し、前記複数の並列フィー ドフォワードフィルターの少なくとも1つは、前記並列フィードフォワードフィ ルターの出力の結合から導き出される複数の異なる励起シーケンスの1つを受信 するように接続され、前記第2のフイルターは無限インパルス応答フィルターで あり、前記無限インパルス応答フィルターは、励起されるとき、それらの特性を 有することを特徴とす音声コーダー。(14) configured to periodically derive filter characteristics from the input audio signal means, the filter characteristic comprising first and second filters in series. an output produced by a synthesis filter comprising a synthesis filter and said input the first filter is derived to reduce the actual error between the audio signal and the audio signal; comprises a plurality of parallel feedforward filters, and the plurality of parallel feedforward filters At least one of the feedforward filters includes the parallel feedforward filter. Receive one of several different excitation sequences derived from the combination of router outputs and the second filter is an infinite impulse response filter. , said infinite impulse response filters change their characteristics when excited A voice coder comprising: (15)ある第1の並列フィードフォワードフィルターの遅延パラメータを変え 、そのような値に対して前記実際の誤差の当該評価を導きだし、前記実際の誤差 を減少させるその遅延パラメータ値を選択し、その後、前記並列フィードフォワ ードフィルターの各々の前記遅延パラメータに対して前記ステップを繰り返すこ ととを具備する方法によって、前記フィルター特性を導き出すように構成された 手段を具備することを特徴とする請求項14記載のコーダー。(15) Changing the delay parameter of a certain first parallel feedforward filter , derive such an estimate of said actual error for such a value, and calculate said actual error Then select that delay parameter value to decrease the parallel feedforward repeating the above steps for the delay parameters of each of the code filters; configured to derive the filter characteristics by a method comprising: and 15. A coder according to claim 14, characterized in that it comprises means. (16)合成音声出力を生成するのに適応するローカルデコーダーをさらに具備 することを特徴とする請求項12乃至14のいずれかに記載のコーダー。(16) further comprising a local decoder adapted to generate synthesized speech output; The coder according to any one of claims 12 to 14. (17)フィルターを具備し、コード化音声信号の受信時に、それから前記フィ ルターの特性を更新するように構成され、前記フィルターは、励起入力と、それ に接続された音声出力とを有し、その結果前記フィルターは前の音声出力から使 用時に励起されることを特徴とするコード化音声のためのデコーダー。(17) comprising a filter, and upon receiving the coded audio signal, the filter The filter is configured to update the characteristics of the filter, and the filter is configured to update the characteristics of the filter. an audio output connected to a A decoder for coded speech, characterized in that it is excited when used. (18)フィルターを具備し、コード化音声信号の受信時に、それから前記フィ ルターの特性を更新するように構成され、前記フィルターは、直列の第1と第2 のフィルターを具備し、前記第1フィルターは複数の並列フィードフォワードフ ィルターを具備し、前記複数の並列フィードフォワードフィルターの少なくとも 1つは、前記並列フィードフォワードフィルターの出力の結合から導き出される 複数の異なる励起シーケンスの1つを受信するように接続され、前記第2のフィ ルターは無限インパルス応答フィルターであることを特徴とするコード化音声の ためのデコーダー。(18) comprising a filter, and upon receiving the coded audio signal, the filter The filter is configured to update the characteristics of the filter, and the filter includes a first and a second , the first filter includes a plurality of parallel feed forward filters. filter, at least one of the plurality of parallel feedforward filters One is derived from the combination of the outputs of the parallel feedforward filters. said second fibre, connected to receive one of a plurality of different excitation sequences; A router is an infinite impulse response filter for coded speech. decoder for. (19)少なくとも1つの前記並列フィードフォワードフィルターは、前記第2 のフィルターの出力から導き出される励起シーケンスを受信するのように接続さ れていることを特徴とする請求項18記載のデコーダー。(19) At least one of the parallel feedforward filters includes the second connected to receive the excitation sequence derived from the output of the filter of 19. The decoder according to claim 18, wherein: (20)請求項17乃至19のいずれかに記載のデコーダーを具備する受信器。(20) A receiver comprising the decoder according to any one of claims 17 to 19. (21)第2図及び第2図aを参照して述べられたものと実質的に同等な受信器 。(21) A receiver substantially equivalent to that described with reference to Figures 2 and 2a. . (22)請求項12乃至16のいずれかに記載のコーダーを具備する送信器。(22) A transmitter comprising the coder according to any one of claims 12 to 16. (23)第1図及び第1図aを参照して述べられたものと実質的に同等な送信器 。(23) A transmitter substantially equivalent to that described with reference to FIG. 1 and FIG. 1a. . (24)請求項1乃至23のいずれかに記載の送信器と受信器を具備する音声通 信システム。(24) An audio communication device comprising the transmitter and receiver according to any one of claims 1 to 23. trust system. (25)図面を参照して説明されたものとほとんど同等の音声通信の方法。(25) A voice communication method almost equivalent to that described with reference to the drawings.
JP50722288A 1987-08-28 1988-08-26 coded communication system Pending JPH02500620A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB878720388A GB8720388D0 (en) 1987-08-28 1987-08-28 Speech coding
GB8720388 1987-08-28
GB888801858A GB8801858D0 (en) 1988-01-28 1988-01-28 Coded communications system
GB8801858 1988-01-28

Publications (1)

Publication Number Publication Date
JPH02500620A true JPH02500620A (en) 1990-03-01

Family

ID=26292659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50722288A Pending JPH02500620A (en) 1987-08-28 1988-08-26 coded communication system

Country Status (3)

Country Link
EP (1) EP0341271A1 (en)
JP (1) JPH02500620A (en)
WO (1) WO1989002148A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830299A (en) * 1994-07-19 1996-02-02 Nec Corp Voice coder

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI90477C (en) * 1992-03-23 1994-02-10 Nokia Mobile Phones Ltd A method for improving the quality of a coding system that uses linear forecasting
FI96248C (en) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Method for providing a synthetic filter for long-term interval and synthesis filter for speech coder
FI98164C (en) * 1994-01-24 1997-04-25 Nokia Mobile Phones Ltd Processing of speech coder parameters in a telecommunication system receiver
TW317051B (en) * 1996-02-15 1997-10-01 Philips Electronics Nv

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4038495A (en) * 1975-11-14 1977-07-26 Rockwell International Corporation Speech analyzer/synthesizer using recursive filters
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830299A (en) * 1994-07-19 1996-02-02 Nec Corp Voice coder

Also Published As

Publication number Publication date
WO1989002148A1 (en) 1989-03-09
EP0341271A1 (en) 1989-11-15

Similar Documents

Publication Publication Date Title
JP3042886B2 (en) Vector quantizer method and apparatus
EP0422232B1 (en) Voice encoder
US6510407B1 (en) Method and apparatus for variable rate coding of speech
JP4005359B2 (en) Speech coding and speech decoding apparatus
KR100304682B1 (en) Fast Excitation Coding for Speech Coders
US5359696A (en) Digital speech coder having improved sub-sample resolution long-term predictor
CN1947173B (en) Hierarchy encoding apparatus and hierarchy encoding method
JP2002328700A (en) Hiding of frame erasure and method for the same
JPH0736118B2 (en) Audio compressor using Serp
JP2010539528A (en) Method and apparatus for fast search of algebraic codebook in speech and audio coding
US5953697A (en) Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes
JP2004526213A (en) Method and system for line spectral frequency vector quantization in speech codecs
JP2000155597A (en) Voice coding method to be used in digital voice encoder
JPH02500620A (en) coded communication system
US7337110B2 (en) Structured VSELP codebook for low complexity search
JP3905706B2 (en) Speech coding apparatus, speech processing apparatus, and speech processing method
US5719993A (en) Long term predictor
JP3578933B2 (en) Method of creating weight codebook, method of setting initial value of MA prediction coefficient during learning at the time of codebook design, method of encoding audio signal, method of decoding the same, and computer-readable storage medium storing encoding program And computer-readable storage medium storing decryption program
JP2956068B2 (en) Audio encoding / decoding system
JP2004094132A (en) Data rate conversion method and data rate converter
JP2946525B2 (en) Audio coding method
WO2014070700A1 (en) Method and apparatus for generating a candidate code-vector to code an informational signal
JP3552201B2 (en) Voice encoding method and apparatus
JP4373667B2 (en) Adaptive codebook update method, adaptive codebook update device, speech encoding device, and speech decoding device
JP3954050B2 (en) Speech coding apparatus and speech coding method