JP2958726B2 - Apparatus for coding and decoding a sampled analog signal with repeatability - Google Patents

Apparatus for coding and decoding a sampled analog signal with repeatability

Info

Publication number
JP2958726B2
JP2958726B2 JP3332967A JP33296791A JP2958726B2 JP 2958726 B2 JP2958726 B2 JP 2958726B2 JP 3332967 A JP3332967 A JP 3332967A JP 33296791 A JP33296791 A JP 33296791A JP 2958726 B2 JP2958726 B2 JP 2958726B2
Authority
JP
Japan
Prior art keywords
new
amplitude
amplitudes
input
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3332967A
Other languages
Japanese (ja)
Other versions
JPH05268098A (en
Inventor
ジェラード ベレンズ ジョン
ミューラー フランク
ランバータス アドリアナス バン ラベステイン ロベルタス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KONIN KEE PII ENU NV
Original Assignee
KONIN KEE PII ENU NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KONIN KEE PII ENU NV filed Critical KONIN KEE PII ENU NV
Publication of JPH05268098A publication Critical patent/JPH05268098A/en
Application granted granted Critical
Publication of JP2958726B2 publication Critical patent/JP2958726B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

Frequency components are calculated from the STP-filtered speech signal. The amplitudes of these are combined in a manner such that the resultant values are associated with frequencies which are situated equidistantly on a linear Bark scale. Said components are quantised, possibly after scaling. In the decoder, the components are again distributed over the frequency spectrum. In the coder, the fundamental regularity D is determined with an LTP technique, after which it is transmitted. In the decoder the phases of the reconstructed signal at the spacing D in the past are determined. These phases are combined with the amplitudes already present in the frequency spectrum, after which transformation back to the time domain takes place. Inverse STP filtering is then carried out.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は反復性をもつサンプル化
されたアナログ信号をコード化する装置、特に、該サン
プル化された信号(以下にサンプル化信号とすることが
ある)がそれぞれ所定のサンプル数を含む連続するセグ
メントに分割され;該セグメントに対して短期予測分析
がなされて該短期予測分析で決定された係数が伝送され
ると共に短期予測フィルターにも供給され;該フィルタ
ーの出力で得られる残差信号に対して変換がなされて該
残差信号内にある情報がコード化されて伝送される上記
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a device for encoding a sampled analog signal having repetition, and more particularly to a device for encoding a sampled signal (hereinafter sometimes referred to as a sampled signal) each having a predetermined signal. Divided into consecutive segments containing the number of samples; the short-term prediction analysis is performed on the segment and the coefficients determined in the short-term prediction analysis are transmitted and also supplied to the short-term prediction filter; Is converted to the residual signal
Such a device, wherein the information in the residual signal is encoded and transmitted.

【0002】また本発明は上記装置によりコード化され
た信号をデコード化する装置、特に、該残差信号から変
換されている受け取った情報信号が、受け取った短期予
測分析係数と共に逆短期予測フィルターに供給され;該
フィルターの出力に、該サンプル化アナログ信号を再構
築する一連のサンプルが出される上記装置に関する。
[0002] The present invention is an apparatus for decoding a coded signal by said device, in particular, information signal received has been converted from the residual signal, the inverse short-term prediction filter with the received short-term prediction analysis coefficients Supplied to the output of the filter, wherein a series of samples are produced which reconstruct the sampled analog signal.

【0003】本発明は上記装置に関するが、そこにおけ
る概念は方法の発明にも適用されうるものであり、以下
の説明では方法として言及されることがある。また用語
「予測」は「予報」と、用語「多重化」は「掛け算」と
記されることがある。
[0003] The present invention relates to the above device, wherein
The concept can also be applied to the invention of the method.
Is sometimes referred to as a method. Also terms
“Forecast” is “forecast” and the term “multiplexing” is “multiplication”
May be written.

【0004】[0004]

【従来技術とその問題点】例えば話信号のような、非常
に一貫性のあるアナログ信号は、それぞれ特定の持続時
間をもつ連続セグメント上の多数の異なる変換をなすこ
とによって、サンプリング後、有効にコード化されるこ
とが知られている。この目的のための公知変換の1つ
は、線形予報コード化(LPC)であり、L.R.ラビ
ナー、R.W.シェーファー「話信号のデジタル処理」
プレティス・ホール、第8章に説明されている。すなわ
ち、LPCは特定の持続時間(話信号の場合には、例え
ば20ms)をもつ信号セグメントに対して使われ、短
期コード化として考えられている。また、短期予報(S
TP)ばかりでなく、長期予報(LTP)をも利用し、
これら2つの技術を組み合わせることにより、非常に有
効なコード化が達成される。LTPの原理は、P.ベリ
ー他「ヨーロッパ無線電話ネットワークのための話コー
ダー・デコーダー」周波数、42巻、No.2−3、1
988年、85〜93頁に記載され、改善されたLTP
原理はオランダ特許出願第9001985号明細書に記
載されている。
BACKGROUND OF THE INVENTION A highly consistent analog signal, such as a speech signal, can be efficiently used after sampling by performing a number of different transformations on successive segments, each having a particular duration. It is known to be coded. One known transform for this purpose is Linear Predictive Coding (LPC); R. Raviner, R.A. W. Shafer "Digital processing of speech signals"
It is described in Pretis Hall, Chapter 8. That is, LPC is used for signal segments having a specific duration (for example, 20 ms for speech signals) and is considered as short-term coding. In addition, short-term forecasts (S
Not only TP) but also long-term forecasts (LTP)
By combining these two techniques, very efficient coding is achieved. The principle of LTP is described in Berry et al. "Talk coder / decoder for European wireless telephone networks", frequency 42, no. 2-3, 1
988, pages 85-93, with improved LTP
The principle is described in Dutch Patent Application No. 9001985.

【0005】[0005]

【発明の構成】本発明の目的は、受信側でデコーダーに
よって再生された話の質を損うことなく、STP原理適
用後に残る残差信号内の人間の耳に関する情報を、非常
に有効に、すなわち少数のビット/秒で送信するための
方法を提供することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a very useful method for retrieving information about the human ear in a residual signal remaining after applying the STP principle without impairing the quality of speech reproduced by a decoder at a receiving side. That is, to provide a method for transmitting at a small number of bits / second.

【0006】この目的のため、本発明によるコード化は
残差信号を周波数領域に変換し;該変換において得られ
る少なくとも多数の周波数成分の振幅を結合し、好まし
くはこの結合は結合信号に関連する周波数が線形バーク
・スケール上で等間隔に位置するようなされ;そして、
該結合信号を表す信号が伝送されることを特徴とするも
のである。
For this purpose, the coding according to the invention is
Transform the residual signal into the frequency domain; combine the amplitudes of at least a number of frequency components obtained in the transform, preferably such that the frequencies associated with the combined signal are equally spaced on a linear Bark scale Done; and
A signal representing the combined signal is transmitted.

【0007】本発明によるデコード方法は、周波数領域
における元の振幅が受信される結合振幅値から再生さ
れ、LTP分析の結果として送られる情報が該振幅に関
する位相値を計算するために使われ、振幅とともに、こ
の計算された位相値が時間領域に変換されることを特徴
とするものである。
The decoding method according to the invention is characterized in that the original amplitude in the frequency domain is recovered from the received combined amplitude value and the information sent as a result of the LTP analysis is used to calculate a phase value for that amplitude, In addition, the calculated phase value is converted to a time domain.

【0008】本発明によれば、残差信号は感知できるよ
うにコードされる。ということは、人間の耳に検知でき
るデコード信号における差異に関係のある情報のみが送
られることを意味している。
According to the present invention, the residual signal is coded sensibly. This means that only information relevant to the difference in the decoded signal that can be detected by the human ear is sent.

【0009】まず、人間の耳は絶対位相値を検知できる
のではなく、位相関係を検知できるだけであるため、受
信端で元の位相関係を再生できるなら、コード化すべき
残差信号から位相情報を送る必要は原理的にないという
公知の事実のために用いられる。
First, since the human ear cannot detect the absolute phase value but only the phase relationship, if the original phase relationship can be reproduced at the receiving end, it should be coded.
It is used due to the known fact that there is in principle no need to send phase information from the residual signal.

【0010】さらに、本発明は、人間の聴覚は隣接した
周波数帯をもつ多数のフィルターからなる鎖として機能
するが、そのフィルターはいわゆる臨界帯またはバーク
(Bark)と呼ばれる異なる帯域をもち、その臨界帯
の帯域幅は高周波数に対してよりも低周波数に対して狭
いという知見を利用している。この知見によって形成さ
れる周波数スケールは線形バーク・スケールと呼ばれ
る。バーク・スケールの原理をさらに詳しく知るために
は、B.スカーフ、S.ブース「刺激・生理学・閾値」
認識と人間行動ハンドブック、14章、1〜43頁、1
986年がよい。
Further, the present invention provides that the human hearing functions as a chain of multiple filters with adjacent frequency bands, the filters having different bands called so-called critical bands or Barks. It utilizes the knowledge that the bandwidth of a band is narrower for lower frequencies than for higher frequencies. The frequency scale formed by this finding is called the linear bark scale. To find out more about the principle of the Bark scale, see Scarf, S.M. Booth "Stimulation / Physiology / Threshold"
Recognition and Human Behavior Handbook, Chapter 14, pages 1-43, 1
986 is good.

【0011】まず残差信号を周波数領域に変換し、次に
情報を送信する原理はすでに前から知られている。例え
ば、P.チャン他「話コード化のためのフーリエ変換ベ
クトル量子化」IEEE通信会報、COM35、No.
10、1059〜1068頁に載っている。
The principle of first converting the residual signal into the frequency domain and then transmitting the information has been known for some time. For example, Chang et al., "Fourier Transform Vector Quantization for Talk Coding," IEEE Communication Report, COM35, No. 1, p.
10, 1059-1068.

【0012】しかし、この会報には、ベクトル量子化を
用いて変換した後、振幅情報を送ることについては何も
言及していない。
However, this bulletin does not mention anything about sending amplitude information after conversion using vector quantization.

【0013】図1はコーディング・ユニットのブロック
図、図2はデコーディング・ユニットのブロック図であ
る。マイク1から運ばれるアナログ信号は、ローパス・
フィルター2によって帯域幅を制限され、アナログデジ
タル・コンバーター3において、アナログ信号を表す一
連の振幅と時分割サンプルに変換される。コンバーター
3の出力信号は短期分析ユニット4の入力と短期予報フ
ィルター5の入力に供給される。これらユニット4とフ
ィルター5は例えば160サンプルのセグメントに短期
予報を送り、分析ユニット4は量子化されコード化され
てデコーダー・ユニット(図2)に送られる短期予報フ
ィルター係数の形で出力信号を供給する。ユニット4と
フィルター5の構造と機能は当業者にはよく知られてお
り、本発明にとってそれ以上の重要性をもたないので、
これ以上の説明は省く。
FIG. 1 is a block diagram of a coding unit, and FIG. 2 is a block diagram of a decoding unit. The analog signal carried from microphone 1 is low-pass
The bandwidth is limited by a filter 2 and converted in an analog-to-digital converter 3 into a series of amplitude and time-division samples representing the analog signal. The output signal of the converter 3 is supplied to the input of the short-term analysis unit 4 and the input of the short-term forecast filter 5. The unit 4 and the filter 5 send short-term forecasts, for example, in segments of 160 samples, and the analysis unit 4 supplies output signals in the form of short-term forecast filter coefficients which are quantized and coded and sent to a decoder unit (FIG. 2). I do. Since the structure and function of the unit 4 and the filter 5 are well known to those skilled in the art and have no further significance for the present invention,
Further explanation is omitted.

【0014】STPフィルター信号はLTP分析ユニッ
ト6に送られる。このユニット6において、例えばオラ
ンダ特許出願9001985号に記載されているような
方法で、160サンプルのセグメント毎に2回、LTP
分析がなされる。そのようなLTP分析において、コー
ド化すベき信号セグメントに対し、特定のサーチ戦略に
従って、特定接続時間をもつ先行信号のセグメントとで
きるだけよく似たセグメントにサーチがなされ、発見さ
れたセグメントの初期とコード化すべきセグメントの初
期との間に置かれたサンプルの数Dを表す形で信号が送
られる。
The STP filter signal is sent to the LTP analysis unit 6. In this unit 6, LTP is performed twice for every 160 sample segments, for example in a manner as described in Dutch patent application no.
An analysis is made. In such an LTP analysis, the signal segment to be coded is searched according to a particular search strategy for a segment as similar as possible to the segment of the preceding signal with a particular connection time, and the initial and code of the found segment A signal is sent representing the number D of samples placed between the beginning of the segment to be segmented.

【0015】STPフィルター5の出力信号は残差信号
と呼ばれる。本発明によればこの残差信号のコード化さ
れての伝送は、知覚されうる情報のみが伝送されるよう
行なわれる。この目的のため該残差信号中で160サン
プルよりなるセグメントは、回路7において30サンプ
ルよりなる8のサブセグメントに分割される。これはま
ず供給されたセグメントを20のサンプルよりなる8の
サブセグメントに分割し、次いでこれらの先端に、先行
するサブセグメントの終端10サンプルをつけた完成す
る。これはまた各セグメントで終端10サンプルは、
(後続するセグメントの最初のサブセグメントを完成す
るため)貯えられなければならないことを示す。次い
で、30サンプルよりなる各サブセグメントは回路8に
おいて窓関数(例えば余弦関数)により多重化される。
窓関数の選択は、各サンプル毎にサブセグメントの重な
り部分において2つの多重化因子の2乗の和が同一であ
るよう選択される。2乗に対してこの条件でなければな
らない理由とは、窓関数による多重化が、コーディング
・ユニット及びデコーディング・ユニットの両方で生じ
るからである。窓処理されたサブセグメントに対して回
路9で離散フーリエ変換(DFT)がなされ、16の異
なる周波数成分が各サブセグメントに対して得られる。
0から15までのこれら16成分のうち、1から13ま
での成分の振幅Aが回路10で計算される。成分0,1
4,15は話通信用に選ばれた300〜3,400Hz
の周波数帯の外側にあるので無視できる。もしもっと広
い、または狭い周波数帯が適切であれば、考慮すべき振
幅成分の数はそれに応じて調整し得る。前記13の成分
から始めて、4つのいわゆるバーク振幅成分が回路11
で計算される。これらは、線形バーク・スケールに等間
隔に置かれた周波数に結びついた振幅である。バーク振
幅成分B〜Bは、たとえば、DFT振幅A〜A
13から次式で計算できる。
The output signal of the STP filter 5 is called a residual signal. According to the invention, the coded transmission of this residual signal is such that only perceivable information is transmitted. For this purpose, the segment of 160 samples in the residual signal is divided in circuit 7 into 8 sub-segments of 30 samples. This completes the supplied segment first by dividing it into eight sub-segments of 20 samples, then ending them with the last 10 samples of the preceding sub-segment. This also means that the last 10 samples in each segment
Indicates that it must be stored (to complete the first subsegment of the subsequent segment). Each subsegment of 30 samples is then multiplexed in circuit 8 by a window function (eg, a cosine function).
The window function is selected such that the sum of the squares of the two multiplexing factors is the same at the overlap of the subsegments for each sample. The reason for this requirement for squaring is that multiplexing by the window function occurs in both the coding and decoding units. A discrete Fourier transform (DFT) is performed on the windowed sub-segments in circuit 9 and 16 different frequency components are obtained for each sub-segment.
The circuit 10 calculates the amplitude A of the components 1 to 13 out of the 16 components 0 to 15. Component 0,1
4, 15 are 300 to 3,400 Hz selected for speech communication
Can be ignored because it is outside the frequency band of. If a wider or narrower frequency band is appropriate, the number of amplitude components to be considered can be adjusted accordingly. Starting from the 13 components, four so-called Bark amplitude components are
Is calculated. These are the amplitudes associated with equally spaced frequencies on the linear bark scale. The bark amplitude components B 1 to B 4 are, for example, DFT amplitudes A 1 to A
13 from the following equation.

【0016】[0016]

【数5】 (Equation 5)

【0017】望むなら、利得率Gは次式のように4つの
バーク振幅成分から回路12でスケーリング値として計
算される。
If desired, the gain factor G is calculated as a scaling value in circuit 12 from the four bark amplitude components as follows:

【0018】[0018]

【数6】 (Equation 6)

【0019】スケーリング値Gの適用は、スケール化振
幅がより効率的にコード化できるという利点をもつ。G
の値は回路13で量子化され、デコーディング・ユニッ
トに送られる。スケール・ファクターGが計算されれ
ば、全バーク成分は回路14で量子化ゲイン・ファクタ
ーGによって分割される。分割の結果は回路15で量子
化され、コード化されて、デコーディング・ユニットに
送られる。
The application of the scaling value G has the advantage that the scaled amplitude can be coded more efficiently. G
Is quantized in circuit 13 and sent to the decoding unit. Once the scale factor G has been calculated, all the bark components are divided in circuit 14 by the quantization gain factor G. The result of the division is quantized in circuit 15 and coded and sent to a decoding unit.

【0020】スケーリング値が使われなければ、回路1
2,13,14は省くことができ、バーク振幅成分に対
する4つの計算値は回路15での量子化後、直接送られ
得る。
If no scaling value is used, circuit 1
2, 13 and 14 can be omitted and the four calculated values for the bark amplitude component can be sent directly after quantization in circuit 15.

【0021】デコーダー・ユニットの回路16でデコー
ド後、4つのスケール化バーク振幅成分は、回路17で
デコードされたゲイン・ファクターGとマルチプライヤ
ー18で掛け算される結果、再生バーク振幅成分B
が得られる。スケーリング・ファイターがコーディ
ング・ユニットで使われていなければ、これはもちろん
適用できない。回路19で、周波数領域の振幅A〜A
13(周波数スケールで等間隔)は、次式で計算され
る。
After decoding by the decoder unit circuit 16, the four scaled bark amplitude components are multiplied by the gain factor G decoded by the circuit 17 by the multiplier 18, so that the reproduced bark amplitude components B 1 to B 1 are output.
B 4 is obtained. This is, of course, not applicable unless a scaling fighter is used in the coding unit. In the circuit 19, the amplitudes A 1 to A in the frequency domain
13 (equal intervals on the frequency scale) is calculated by the following equation.

【0022】[0022]

【数7】 (Equation 7)

【0023】逆DFT(IDFT)回路におけるIDF
Tによって、コーダーで考えた13周波数成分を時間領
域に戻すことができるように、振幅および位相が必要で
ある。
IDF in inverse DFT (IDFT) circuit
The amplitude and phase are required so that T allows the 13 frequency components considered by the coder to be returned to the time domain.

【0024】位相は回路23でデコードされ、サンプル
間隔DからなるLTP情報の助けを借りて、次のように
して求められる。
The phase is decoded by the circuit 23 and is obtained as follows with the help of the LTP information consisting of the sample interval D.

【0025】回路22の出力に現れるような再生STP
残差の120の最新サンプルが各場合とも貯えられてい
る。回路24で、現在のサブセグメントからDだけ離れ
たところにある過去のサブセグメントが決定され、この
サブセグメントは、コーダーの回路8で使われたと同一
の窓関数によって回路25で掛け算される。次に、回路
26でこのサブセグメントにDFTが適用された後、1
3成分の位相が回路27で計算される。こうして決定さ
れた位相と、すでに計算された振幅とを使って、IDF
Tが回路20でなされ、A,A14,A15,A16
の振幅がゼロにセットされる。
Reproduction STP as it appears at the output of circuit 22
The 120 latest samples of the residuals are stored in each case. In circuit 24, a past subsegment that is D away from the current subsegment is determined, and this subsegment is multiplied in circuit 25 by the same window function used in circuit 8 of the coder. Next, after the DFT is applied to this subsegment in circuit 26, 1
The phases of the three components are calculated by the circuit 27. Using the phase thus determined and the amplitude already calculated, the IDF
T is made by the circuit 20 and A 0 , A 14 , A 15 , A 16
Is set to zero.

【0026】回路20の出力で30サンプル長のサブセ
グメントの再生が利用できるが、コーダーでなされた窓
関数によって変形されている。したがって、再生サブセ
グメントは回路21で窓関数によって再び掛け算され
る。窓関数と2回掛け合わされたサブセグメントの初め
の10サンプルの場合には、窓関数と2回掛け合わさ
れ、このために貯えられている前のセグメントの終りの
10サンプルが回路22で加えられる。この結果、合成
の10サンプルにおける掛け算要素の和は1に等しい。
At the output of circuit 20, a 30-sample long subsegment reproduction is available, but modified by a window function performed by the coder. Thus, the playback subsegment is again multiplied by the window function in circuit 21. In the case of the first 10 samples of the sub-segment multiplied twice with the window function, it is multiplied twice with the window function, so that the last 10 samples of the previous segment stored are added in circuit 22. As a result, the sum of the multiplication elements in the ten samples of the synthesis is equal to one.

【0027】このサブセグメントの終りの10サンプル
は貯えられる。初めの20サンプルは、STP残差のセ
グメントの再生の一部をなす。8サブセグメントが再生
され結合された後、STP残差の完全再生セグメントが
得られ、STP分析がコーディング・ユニットでなされ
たセグメントよりも過去の10サンプルに置かれる。
The last 10 samples of this subsegment are stored. The first 20 samples are part of the playback of the segment of the STP residual . After the eight sub-segments have been reconstructed and combined, a complete reconstructed segment of the STP residual is obtained, and the STP analysis is placed on the past 10 samples than the segment made in the coding unit.

【0028】受け取ったSTP係数の助けを借りてそれ
自身知られた方法でフィルター回路28で、逆STPフ
ィルターリングがこのセグメントになされ、このとき
行セグメントからのフィルター係数が初めの10サンプ
ルに対して使われる。
In a manner known per se with the help of the received STP coefficients , the inverse STP filter is
Irutaringu is made in this segment, the filter coefficients from the previous <br/> line segment at this time is used relative to the beginning of the 10 samples.

【0029】フィルター28の出力信号はデジタルアナ
ログ・コンバーター29においてアナログ信号に変換さ
れる。このアナログ信号はローパス・フィルター30を
経てスピーカー31に送られる。このスピーカーはマイ
ク1に与えられた話信号を高忠実に再生し、本発明に従
う方法によって少数のビットでコード化された話信号を
送ることができる。
The output signal of the filter 28 is converted to an analog signal in a digital-to-analog converter 29. This analog signal is sent to the speaker 31 via the low-pass filter 30. This speaker reproduces the speech signal applied to the microphone 1 with high fidelity and can transmit a speech signal encoded with a small number of bits by the method according to the present invention.

【0030】望むなら、話信号の再生のためDの最適値
を得るため、回路23と24の間に回路23′を設け
て、デコーダーが受けるDの値にさらに多数の操作を与
えさせることができる。これらは次の3つの連続操作で
ある。
If desired, a circuit 23 'can be provided between circuits 23 and 24 to provide more operations to the value of D received by the decoder in order to obtain an optimum value of D for the reproduction of the speech signal. it can. These are the following three successive operations.

【0031】1)受けたDの値の列がある傾向を示すな
ら、そして現在のDがその傾向の許容範囲の外にはずれ
ているなら、現在のDはその傾向の範囲内にある値とお
き代えられる。連続値の列における傾向を決定し、その
傾向から外れる信号に対する値のおき代えを決定するア
ルゴリズムは、それ自身、当業者によく知られている。
1) If the sequence of values of D received shows a trend, and if the current D is out of the acceptable range for the trend, then the current D is determined by the value within the trend. Be replaced. Algorithms that determine the trend in a sequence of continuous values and determine the replacement of values for signals that deviate from the trend are themselves well known to those skilled in the art.

【0032】2)3つの中間値I,I,Iが、補
挿法によって前記アルゴリズムの助けを借りながら、D
の2つの連続値D,Dの間で計算される。例えば、
次のようにして行なわれる。
2) The three intermediate values I 1 , I 2 , I 3 are obtained by interpolation with the aid of the algorithm
Is calculated between two consecutive values D 1 and D 2 . For example,
It is performed as follows.

【0033】[0033]

【数8】 (Equation 8)

【0034】間隔Dがセグメントあたり2回、コーディ
ング・ユニットで決定されるので、補挿法が実行され
る。補挿法を使わなければ、4つの連続サブセグメント
のデコーディングが同一の値のDについて行われる。コ
ーディング・ユニットの信号に基本的な規則性がなけれ
ば、4つのサブセグメントの間、規則性がデコーダー内
に誤って与えられよう。この問題は補挿法によって克服
される。
Since the interval D is determined twice per segment in the coding unit, an interpolation method is performed. Without interpolation, the decoding of four consecutive sub-segments is performed for the same value of D. If there is no basic regularity in the coding unit signal, regularity will be erroneously provided in the decoder during the four sub-segments. This problem is overcome by interpolation.

【0035】話信号に基本的な規則性が存在すれば、信
号のくり返し間隔は一般にゆっくりと変化する。補挿法
により、Dの値の変化はデコーダーにおいて平滑な性質
をもつ。
If there is a basic regularity in the speech signal, the signal repetition interval generally changes slowly. Due to the interpolation method, the change in the value of D has a smooth property in the decoder.

【0036】3)必要なら、おき代え値を計算すること
によってDの値を等しくさせ、補挿法を行った後、計算
された間隔Dが、信号内にある現実のくり返し間隔Dと
できるだけよく一致する。しかし、間隔Dが30よりも
小さければ、積が最小30になるように選ばれた整数と
Dが掛け合わされる。現在のセグメントに対して30未
満の間隔でサブセグメントの全サンプルがまだ再生され
ておらず、位相を計算することに使えないため、これは
必要である。
3) If necessary, make the value of D equal by calculating the replacement value, and after performing the interpolation method, make the calculated interval D as good as possible the actual repetition interval D in the signal. Matches. However, if the spacing D is less than 30, D is multiplied by an integer chosen to minimize the product. This is necessary because all samples of the sub-segment have not yet been regenerated at intervals less than 30 for the current segment and cannot be used to calculate phase.

【0037】それにもかかわらず30未満の間隔Dが送
られる理由は、信号の基本的規則性が30未満の多数の
サンプルを取り巻けば、実際のくり返し間隔の互いに等
しくない倍数である値を、デコードされた間隔Dがとる
ことを妨げる。その結果、等化アルゴリズムは傾向を検
出する機会をもたなくなる。
Nevertheless, the reason that an interval D of less than 30 is sent is that the fundamental regularity of the signal, around a large number of samples less than 30, is a value that is an unequal multiple of the actual repetition interval, This prevents the decoded interval D from being taken. As a result, the equalization algorithm has no opportunity to detect trends.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による装置のコーディング・ユニットの
1実施例のブロック図である。
FIG. 1 is a block diagram of one embodiment of a coding unit of an apparatus according to the present invention.

【図2】本発明による装置のデコーディング・ユニット
の1実施例のブロック図である。
FIG. 2 is a block diagram of one embodiment of a decoding unit of the device according to the invention.

【符号の説明】[Explanation of symbols]

1 マイク 2 ローパス・フィルター 3 アナログデジタル・コンバーター 4 短期予報分析ユニット 5 短期予報フィルター 6 長期予報分析ユニット 7〜17 回路 18 マルチプライヤー 19〜27 回路 28 フィルター 29 デジタルアナログ・コンバーター 30 ローパス・フィルター 31 スピーカー Reference Signs List 1 microphone 2 low-pass filter 3 analog-to-digital converter 4 short-term forecast analysis unit 5 short-term forecast filter 6 long-term forecast analysis unit 7 to 17 circuit 18 multiplier 19 to 27 circuit 28 filter 29 digital-to-analog converter 30 low-pass filter 31 speaker

フロントページの続き (72)発明者 ロベルタス ランバータス アドリアナ ス バン ラベステイン オランダ国 2275 ティビー ボーバー グ ホークウエー 46 (56)参考文献 特開 平1−296300(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 3/02 G10L 7/00 - 7/04 G10L 9/00 - 9/18 Continuation of the front page (72) Inventor Robertus Lambertas Adrianas van Lavestein The Netherlands 2275 Tibby Bobberg Hawkway 46 (56) References JP-A-1-296300 (JP, A) (58) Fields investigated (Int. Cl. 6, DB name) G10L 3/00 - 3/02 G10L 7/00 - 7/04 G10L 9/00 - 9/18

Claims (14)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 反復性をもつアナログ信号をコード化す
る装置であって、 量子化されサンプル化されたアナログ信号に対して短期
予測分析を実行し、そして該短期予測分析で決定された
係数を第1の出力に供給する手段、 サンプル化されたアナログ信号を受け、そしてセグメン
ト化された残差信号を生成する短期予測フィルター、 該セグメント化された残差信号をサブセグメントに分割
する手段、 該サブセグメントを時間領域から周波数領域へ変換し、
そしてサブセグメント毎に、周波数成分を得、且つ該周
波数成分は周波数領域に変換される際各周波数成分毎の
振幅を有するように構成した手段と、 多数の該振幅を結合していくつかの新しい周波数成分毎
の振幅を計算し、いくつかの新しい振幅の数は該多数の
振幅より少ないようにし、そして該、新しい周波数成分
の振幅を 第2の出力に供給する手段、 を含むことを特徴とする上記装置。
1. An apparatus for coding an iterative analog signal, comprising: performing a short-term prediction analysis on a quantized and sampled analog signal; and calculating coefficients determined in the short-term prediction analysis. first means for providing an output, means for dividing received a sampled analog signal, and short-term prediction filter for generating a segmented residual signal, the segmented residual signal in sub-segments, the Transform the subsegments from the time domain to the frequency domain,
Then, for each sub-segment , the frequency component is obtained and the
When the wave number component is converted to the frequency domain,
Means configured to have an amplitude, and combining a number of said amplitudes to produce several new frequency components.
And calculate the amplitude of some new amplitudes
Less than the amplitude and the new frequency component
Means for providing the amplitude of the second output to the second output.
【請求項2】 セグメント化された残差信号のサブセグ
メントに対して長期予測分析を実行し、そして該長期予
測分析で決定された係数を第3の出力に供給する手段を
含む請求項1の装置。
2. The method of claim 1, further comprising: performing a long-term prediction analysis on the sub-segments of the segmented residual signal; and providing the coefficients determined in the long-term prediction analysis to a third output. apparatus.
【請求項3】 スケーリング値として利得関数を計算
し、該利得関数で新しい振幅のそれぞれを分割し、そし
て該利得関数を第4の出力に供給する手段を含む請求項
2の装置。
3. The apparatus of claim 2 including means for calculating a gain function as a scaling value, dividing each of the new amplitudes with the gain function, and providing the gain function to a fourth output.
【請求項4】 サブセグメントのそれぞれを窓関数で多
重化する手段を含む請求項3の装置。
4. The apparatus of claim 3 including means for multiplexing each of the subsegments with a window function.
【請求項5】 新しい振幅を量子化する手段を含む請求
項4の装置。
5. The apparatus of claim 4 including means for quantizing the new amplitude.
【請求項6】 13の周波数成分の振幅A−A13
結合されて、4の新しい振幅B−Bを式; に従って計算し、そして利得関数Gが式; に従って計算される請求項5の装置。
6. The amplitudes A 1 -A 13 of the thirteen frequency components are combined to form a new amplitude B 1 -B 4 of four ; And the gain function G is given by the equation: Apparatus according to claim 5, calculated according to:
【請求項7】 コード化された信号をデコード化する装
置であって、 短期予測分析で決定された係数を受ける第1の入力、多数の周波数成分の振幅を結合することにより計算され
たいくつかの 新しい振幅を受ける第2の入力、長期予報分析において決定された位相値を受信する第3
の入力、 多数 の新しい振幅から幾つかの新しい周波数成分の振幅
であってかつ該新しい振幅の数は該幾つかの新しい周波
成分の振幅よりも少ない周波数成分の振幅を計算する
手段、 該幾つかの新しい周波数成分の振幅を周波数領域から時
間領域へと変換して新しいサブセグメントとする逆変換
する手段、及び、 該第1の入力に結合されて該係数を受ける第1のフィル
ター入力をもち、該第3の入力の位相値と第2の入力の
いくつかの振幅を用いて逆変換する該逆変換手段に結合
されて該新しいサブセグメントを受ける第2のフィルタ
ー入力をもち、そして、サンプル化されたアナログ信号
を表す一連のサンプルを生成する逆短期予測フィルタ
ー、 を含むことを特徴とする上記装置。
7. An apparatus for decoding a coded signal, comprising: a first input receiving coefficients determined in a short-term predictive analysis, calculated by combining the amplitudes of a number of frequency components.
A second input receiving some new amplitudes, a third receiving the phase values determined in the long-term forecast analysis
Means for calculating the amplitude of a frequency component that is an amplitude of some new frequency components from a number of new amplitudes and the number of the new amplitudes is less than the amplitude of the some new frequency components; Means for transforming the amplitude of the new frequency component from the frequency domain to the time domain into a new subsegment; and a first filter input coupled to the first input and receiving the coefficients; The phase value of the third input and the phase value of the second input
An inverse short-term filter having a second filter input coupled to the inverse transform means for inverse transforming using some amplitude and receiving the new subsegment, and producing a series of samples representing the sampled analog signal The above device, comprising: a prediction filter.
【請求項8】 長期予測分析で決定された係数を受ける
第3の入力、 該第3の入力及び該逆変換手段に結合されており、現在
のサブセグメントに関してDサンプル離れた過去のサブ
セグメントを決定する手段、 決定されたサブセグメントを時間領域から周波数領域変
換する手段、及び、 変換され決定されたサブセグメントから位相を計算し、
そしてこれら位相を該逆変換手段に供給する手段を含む
請求項7の装置。
8. A third input for receiving the coefficients determined in the long-term prediction analysis, coupled to the third input and the inverse transform means, for determining a past sub-segment that is D samples away from the current sub-segment. Means for determining, means for transforming the determined subsegment from the time domain to the frequency domain, and calculating a phase from the transformed and determined subsegment,
8. The apparatus of claim 7 including means for supplying said phases to said inverse transform means.
【請求項9】 スケーリング値として利得関数を受ける
第4の入力、及び、該受けた新しい振幅のそれぞれを該
利得関数で多重化する手段を含む請求項8の装置。
9. The apparatus of claim 8, further comprising a fourth input receiving the gain function as a scaling value, and means for multiplexing each of the received new amplitudes with the gain function.
【請求項10】 新しいサブセグメントのそれぞれを窓
関数で多重化する手段、及び、決定されたサブセグメン
トのそれぞれを窓関数で多重化する手段を含む請求項9
の装置。
10. A means for multiplexing each of the new subsegments with a window function, and means for multiplexing each of the determined subsegments with a window function.
Equipment.
【請求項11】 該第2の入力に結合されて新しい振幅
をデコード化する手段を含む請求項10の装置。
11. The apparatus of claim 10 further comprising means coupled to said second input for decoding a new amplitude.
【請求項12】 13の新しい周波数成分の振幅A’
−A’13が4の新しい振幅B’−B’から式: に従って計算される請求項11の装置。
12. The amplitude A ′ 1 of the thirteen new frequency components.
-A '13 new amplitude B of 4' expression from 1 -B '4: Apparatus according to claim 11, calculated according to:
【請求項13】 所定のアルゴリズムに従ってDサンプ
ル離れた値を等化する手段を含む請求項8の装置。
13. The apparatus of claim 8 including means for equalizing values D samples apart according to a predetermined algorithm.
【請求項14】 2の連続するD及びDサンプルの
値間のDサンプル離れた値に対する3の中間値I,I
及びIを式: I=0.75*D+0.25*D =0.50*D+0.50*D =0.25*D+0.75*D に従って計算する手段を含む請求項8の装置。
14. Two consecutive D's1And D2sample
Intermediate value I of 3 for values D samples away between values1, I
2And I3With the formula: I1= 0.75 * D1+ 0.25 * D2  I2= 0.50 * D1+ 0.50 * D2  I3= 0.25 * D1+ 0.75 * D2  9. The apparatus of claim 8 including means for calculating according to:
JP3332967A 1990-10-23 1991-10-17 Apparatus for coding and decoding a sampled analog signal with repeatability Expired - Lifetime JP2958726B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL9002308 1990-10-23
NL9002308A NL9002308A (en) 1990-10-23 1990-10-23 METHOD FOR CODING AND DECODING A SAMPLED ANALOGUE SIGNAL WITH A REPEATING CHARACTER AND AN APPARATUS FOR CODING AND DECODING ACCORDING TO THIS METHOD

Publications (2)

Publication Number Publication Date
JPH05268098A JPH05268098A (en) 1993-10-15
JP2958726B2 true JP2958726B2 (en) 1999-10-06

Family

ID=19857866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3332967A Expired - Lifetime JP2958726B2 (en) 1990-10-23 1991-10-17 Apparatus for coding and decoding a sampled analog signal with repeatability

Country Status (11)

Country Link
EP (1) EP0482699B1 (en)
JP (1) JP2958726B2 (en)
AT (1) ATE157188T1 (en)
CA (1) CA2053133C (en)
DE (1) DE69127339T2 (en)
DK (1) DK0482699T3 (en)
ES (1) ES2106051T3 (en)
FI (1) FI105623B (en)
NL (1) NL9002308A (en)
NO (1) NO305188B1 (en)
PT (1) PT99294A (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07261797A (en) * 1994-03-18 1995-10-13 Mitsubishi Electric Corp Signal encoding device and signal decoding device
JPH09127995A (en) * 1995-10-26 1997-05-16 Sony Corp Signal decoding method and signal decoder
JP2000165251A (en) * 1998-11-27 2000-06-16 Matsushita Electric Ind Co Ltd Audio signal coding device and microphone realizing the same
FI116992B (en) 1999-07-05 2006-04-28 Nokia Corp Methods, systems, and devices for enhancing audio coding and transmission
EP1113432B1 (en) * 1999-12-24 2011-03-30 International Business Machines Corporation Method and system for detecting identical digital data
CN114519996B (en) * 2022-04-20 2022-07-08 北京远鉴信息技术有限公司 Method, device and equipment for determining voice synthesis type and storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5650398A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
JP2892462B2 (en) * 1990-08-27 1999-05-17 沖電気工業株式会社 Code-excited linear predictive encoder

Also Published As

Publication number Publication date
FI914993A0 (en) 1991-10-23
EP0482699B1 (en) 1997-08-20
FI105623B (en) 2000-09-15
CA2053133C (en) 1996-05-21
NL9002308A (en) 1992-05-18
DE69127339T2 (en) 1998-01-29
EP0482699A3 (en) 1992-08-19
DK0482699T3 (en) 1998-03-30
NO914105L (en) 1992-04-24
ATE157188T1 (en) 1997-09-15
EP0482699A2 (en) 1992-04-29
FI914993A (en) 1992-04-24
NO914105D0 (en) 1991-10-18
JPH05268098A (en) 1993-10-15
PT99294A (en) 1994-01-31
CA2053133A1 (en) 1992-04-24
NO305188B1 (en) 1999-04-12
DE69127339D1 (en) 1997-09-25
ES2106051T3 (en) 1997-11-01

Similar Documents

Publication Publication Date Title
KR100840439B1 (en) Audio coding apparatus and audio decoding apparatus
JPS6161305B2 (en)
JPH0516599B2 (en)
JPH02308632A (en) Method for transmitting or storing audio signal
JPH0713600A (en) Vocoder ane method for encoding of drive synchronizing time
KR101058064B1 (en) Low Bit Rate Audio Encoding
KR100352351B1 (en) Information encoding method and apparatus and Information decoding method and apparatus
US6032113A (en) N-stage predictive feedback-based compression and decompression of spectra of stochastic data using convergent incomplete autoregressive models
JP2007504503A (en) Low bit rate audio encoding
JP3466080B2 (en) Digital data encoding / decoding method and apparatus
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
JP3344944B2 (en) Audio signal encoding device, audio signal decoding device, audio signal encoding method, and audio signal decoding method
JP2958726B2 (en) Apparatus for coding and decoding a sampled analog signal with repeatability
KR100303580B1 (en) Transmitter, Encoding Device and Transmission Method
KR100952065B1 (en) Coding method, apparatus, decoding method, and apparatus
JP2001507822A (en) Encoding method of speech signal
US5687281A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
KR100601748B1 (en) Encoding method and decoding method for digital voice data
US5588089A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US10734005B2 (en) Method of encoding, method of decoding, encoder, and decoder of an audio signal using transformation of frequencies of sinusoids
WO1997016818A1 (en) Method and system for compressing a speech signal using waveform approximation
JP3336619B2 (en) Signal processing device
JPH07111456A (en) Method and device for compressing voice signal
JP3827720B2 (en) Transmission system using differential coding principle
JPH08129400A (en) Voice coding system

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080730

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 13