JPS63108400A - Voice encoder - Google Patents

Voice encoder

Info

Publication number
JPS63108400A
JPS63108400A JP61254542A JP25454286A JPS63108400A JP S63108400 A JPS63108400 A JP S63108400A JP 61254542 A JP61254542 A JP 61254542A JP 25454286 A JP25454286 A JP 25454286A JP S63108400 A JPS63108400 A JP S63108400A
Authority
JP
Japan
Prior art keywords
correlation
cross
pulse
frame
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61254542A
Other languages
Japanese (ja)
Inventor
福井 昭
中川 富士夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61254542A priority Critical patent/JPS63108400A/en
Publication of JPS63108400A publication Critical patent/JPS63108400A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Abstract] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、マルチパルス駆動音声符号化方式に関する。[Detailed description of the invention] [Industrial application field] The present invention relates to a multi-pulse driven audio encoding system.

特に、演算量の制限下で符号化音質の優れたパルスを探
索する手段に関する。
In particular, the present invention relates to means for searching for pulses with excellent encoded sound quality under a limited amount of calculation.

〔概要〕〔overview〕

本発明は、相互相関のフレーム外も探索してフレーム内
のパルスをあらかじめ定めた数だけ求める音声符号化方
法において、 相互相関のフレーム外のパルス個数が所定の個数に達し
たとき相互相関の絶対値の最大値の探索を相互相関のフ
レーム内に限定することにより、     −i  − 制限されたパルス探索ループ回数で符号化音質の改良を
図ることができるようにしたもげである。
The present invention provides a speech encoding method in which a predetermined number of pulses within the frame are obtained by searching outside the cross-correlation frame, and when the number of pulses outside the cross-correlation frame reaches a predetermined number, the absolute value of the cross-correlation is determined. By limiting the search for the maximum value within the cross-correlation frame, it is possible to improve the encoded sound quality with a limited number of pulse search loops.

〔従来の技術〕[Conventional technology]

8〜16kbpsのビットレートで音声を符号化する方
式の一つとして、20ミリ秒程度のフレームに対し10
〜30個のパルスで線形予測フィルタを駆動するマルチ
パルス駆動音声符号化方式がある。本方式では、人力信
号と合成信号との誤差が最小になるようにパルスを求め
る必要があるが、演算の簡略化法として、入力信号と線
形予測フィルタのインパルス応答の相互相関の絶対値が
最大になる位置にパルスを立て、2つ目以降のパルスは
相互相関のパルスを立てた位置からインパルス応答を引
いたものを新たな相互相関として同様にして求めていく
方法が提案されている。
One of the methods for encoding audio at a bit rate of 8 to 16 kbps is 10 bits per frame of about 20 milliseconds.
There is a multi-pulse driven speech encoding method that drives a linear predictive filter with ~30 pulses. In this method, it is necessary to find pulses so that the error between the human signal and the composite signal is minimized, but as a method to simplify the calculation, the absolute value of the cross-correlation between the input signal and the impulse response of the linear prediction filter is maximized. A method has been proposed in which a pulse is set at the position where the cross-correlation pulse is set, and the second and subsequent pulses are obtained by subtracting the impulse response from the position at which the cross-correlation pulse was set, and then obtaining the new cross-correlation in the same way.

また、入力信号とインパルス応答の相互相関から前フレ
ームの影響を除去するために、合成フィルタの入力をゼ
ロにして影響信号を求めて入力信号から引き、ノイズを
聴感特性を利用してマスクするように聴感の重み付はフ
ィルタを通した信号を求め、この信号とインパルス応答
の相互相関を用いるのが一般的である。パルス探索では
、相互相関のフレーム内のみでなくフレーム外も探索し
、フレーム内のパルス数をあらかじめ定めた数だけ求め
る方がフレーム内のみを探索するより符号化音質が優れ
ていることを特徴とするが知られている。
In addition, in order to remove the influence of the previous frame from the cross-correlation between the input signal and impulse response, the input of the synthesis filter is set to zero, the influence signal is obtained and subtracted from the input signal, and the noise is masked using the auditory characteristics. For auditory weighting, it is common to obtain a signal passed through a filter and use the cross-correlation between this signal and the impulse response. Pulse search is characterized by searching not only within the cross-correlation frame but also outside the frame, and finding a predetermined number of pulses within the frame provides better encoded sound quality than searching only within the frame. It is known to do.

このようにして探索されたマルチパルスはマルチパルス
駆動音声符号化手段に与えられる。
The thus searched multipulses are applied to multipulse driven speech encoding means.

〔参考文献〕[References]

東海大学出版会列 古井;ディジタル音声処理1)5〜
1)6ページ。
Tokai University Press series Furui; Digital audio processing 1) 5~
1) 6 pages.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

しかし、マルチパルス符号化を実時藺で行うには、全体
のパルス探索ループ回数を制限する必要があり、その場
合には、必ずしもフレーム外もパルス探索を行った方が
符号化音質が良くなるとは限らなかった。
However, in order to perform multi-pulse encoding in real time, it is necessary to limit the overall number of pulse search loops, and in that case, it is not always necessary to perform pulse search outside the frame for better encoded sound quality. was not limited.

本発明は、パルス探索ループ回数が制限されていても、
優れた符号化音質を実現できる音声符号化装置を提供す
ることを目的とする。
Even if the number of pulse search loops is limited,
It is an object of the present invention to provide a speech encoding device that can realize excellent encoded sound quality.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は、音声入力信号を線形予測分析して線形予測係
数を決定する手段と、この線形予測係数に相応の線形予
測フィルタのインパルス応答を求める手段と、音声入力
信号とインパルス応答の相互相関を求める手段と、この
相互相関の絶対値が最大になる時間位置に位置しこの相
互相関の大きさを振幅とする第一のパルスおよびあらか
じめ定められた範囲内の相互相関に基づき決定された振
幅と時間位置を有し、この第一のパルスにつづくあらか
じめ定められた個数のパルス群を生成する手段とを備え
た音声符号化装置において、上記相互相関のあらかじめ
定められた範囲外のパルスの個数が上記あらかじめ定め
られた個数に達したときは、上記相互相関の絶対値の最
大値の探索を上記相互相関のあらかじめ定められた範囲
内に限定する手段を備えたことを特徴とする。
The present invention provides means for determining linear prediction coefficients by linear predictive analysis of an audio input signal, means for determining an impulse response of a linear prediction filter corresponding to the linear prediction coefficient, and cross-correlation between the audio input signal and the impulse response. a first pulse located at a time position where the absolute value of this cross-correlation is maximum and whose amplitude is the magnitude of this cross-correlation; and an amplitude determined based on the cross-correlation within a predetermined range. and a means for generating a predetermined number of pulses following the first pulse, wherein the number of pulses outside the predetermined range of the cross-correlation is The present invention is characterized by comprising means for limiting the search for the maximum value of the absolute value of the cross-correlation within the predetermined range of the cross-correlation when the predetermined number is reached.

〔作用〕[Effect]

音声入力信号を線形予測分析して決定した線形予測係数
に相応の線形予測フィルタのインパルス応答と音声入力
信号との相互相関の絶対値の最大の位置に相互相関の大
きさの第一のパルスを立てる。この相互相関のパルスを
立てた位置にインパルス応答の自己相関をパルスの大き
さに正規化し、この値を相互相関から差し引いた値をあ
らかじめ定められた相互相関の範囲内で新たな相互相関
を求めあらかじめ定めた個数のパルスを立てるに際し、
相互相関の範囲内のみでなく範囲外でもパルス探索を行
い、相互相関のあらかじめ定められた範囲外のパルスの
個数があらかじめ定められた個数に達した場合は、相互
相関の絶対値最大値の探索を相互相関のあらかじめ定め
られた範囲内に限定する。
A first pulse with the magnitude of the cross-correlation is placed at the position of the maximum absolute value of the cross-correlation between the impulse response of the linear prediction filter corresponding to the linear prediction coefficient determined by linear prediction analysis of the audio input signal and the audio input signal. stand up The autocorrelation of the impulse response is normalized to the pulse size at the position where the cross-correlation pulse is set, and this value is subtracted from the cross-correlation to obtain a new cross-correlation within the predetermined cross-correlation range. When generating a predetermined number of pulses,
A pulse search is performed not only within the cross-correlation range but also outside the cross-correlation range, and when the number of pulses outside the cross-correlation range reaches a predetermined number, search for the maximum absolute value of the cross-correlation. is limited to within a predetermined range of cross-correlation.

〔実施例〕〔Example〕

以下、本発明実施例を図面に基づいて説明する。 Embodiments of the present invention will be described below based on the drawings.

第1図はこの実施例の構成を示すブロック構成図である
。この実施例装置は、影響信号X、を合成する合成フィ
ルタ1と、入力信号Xとこめ影響信号X、との差に対し
聴感の重み付けを行う重み付はフィルタ2と、入力信号
Xを線形予測分析して線形予測係数Aを生成する線形予
測分析回路3と、線形予測係数Aを係数とする線形予測
フィルタのインパルス応答Rを求めるインパルス応答生
成回路4と、重み付はフィルタの出力X%1とインパル
ス応答との相互相関Φ×rを求める相互相関生成回路5
と、インパルス応答の自己相関Φrrを求める自己相関
生成回路6と、相互相関Φxrと自己相関Φrrに基づ
いてパルス探索を行うパルス探索回路7と、パルス探索
回路7の出力と線形予測係数Aを符号化する符号化回路
8とを備える。
FIG. 1 is a block diagram showing the configuration of this embodiment. This embodiment device includes a synthesis filter 1 that synthesizes the influence signal X, a weighting filter 2 that performs auditory weighting on the difference between the input signal X and the influence signal A linear prediction analysis circuit 3 analyzes and generates a linear prediction coefficient A, an impulse response generation circuit 4 calculates an impulse response R of a linear prediction filter using the linear prediction coefficient A as a coefficient, and weighting is performed by filter output X%1 Cross-correlation generation circuit 5 for calculating the cross-correlation Φ×r between Φ×r and the impulse response
, an autocorrelation generation circuit 6 that calculates the autocorrelation Φrr of the impulse response, a pulse search circuit 7 that performs a pulse search based on the cross-correlation Φxr and the autocorrelation Φrr, and encodes the output of the pulse search circuit 7 and the linear prediction coefficient A. and an encoding circuit 8 for encoding.

次に、この実施例の動作を第1図および第2図に基づい
て説明する。入力信号Xから前フレームの影、響を除去
するために、合成フィルタの内部データを保持したまま
入力をゼロにして影響信号X。
Next, the operation of this embodiment will be explained based on FIGS. 1 and 2. In order to remove the influence of the previous frame from the input signal X, the influence signal X is created by setting the input to zero while retaining the internal data of the synthesis filter.

を求め、入力信号Xから引き、ノイズを聴感特性を利用
してマスクするように聴感の重み付はフィルタ2を通し
た信号Xwを求める。入力信号Xを線形予測分析して、
線形予測係数Aを求める。線形予測係数Aを係数に持つ
線形予測フィルタのインパルス応答Rを求め、重み付は
信号X−とインパルス応答Rの相互相関Φxrと、イン
パルス応答Rの自己相関Φrrを求める0次に、パルス
探索では、長さlxの相互相関φxr (i)、i =
 1〜I xの最大値φxr (is)を求め、位置i
mに大きさΦxr(is、)のパルスを立てる。相互相
関Φxrから長さ±Trの自己相関Φrrを位置isで
大きさを Φxr(iII+)に合わせて引く。
is obtained, subtracted from the input signal X, and subjected to aural weighting to obtain a signal Xw that is passed through a filter 2 so as to mask noise using the audible characteristics. Perform linear predictive analysis on the input signal X,
Find the linear prediction coefficient A. The impulse response R of the linear prediction filter having the linear prediction coefficient A as a coefficient is determined, and the weighting is the cross-correlation Φxr of the signal X- and the impulse response R, and the autocorrelation Φrr of the impulse response R is determined. , cross-correlation φxr (i) of length lx, i =
Find the maximum value φxr (is) of 1 to I x, and find the maximum value φxr (is) of
A pulse of magnitude Φxr(is,) is generated at m. The autocorrelation Φrr of length ±Tr is subtracted from the cross-correlation Φxr at the position is with the magnitude adjusted to Φxr(iII+).

(i−−1r〜Ir) このようにしてパルスをあらかじめ定めた数だけ、例え
ば9.6kbpsに符号化する場合には、15個程度求
める。同じ位置にパルスが立つこともあるため、15個
の異なる位置のパルスを求めるためには数十回にわたり
パルス探索演算を行わな(ではならない。同じ位置にパ
ルスが立った場合は、以前に求めたパルスの大きさと今
回の大きさを足した値を新たにパルスの大きさとする。
(i--1r to Ir) When encoding a predetermined number of pulses in this manner, for example, at 9.6 kbps, approximately 15 pulses are obtained. Since pulses may appear at the same position, in order to find pulses at 15 different positions, pulse search calculations must be performed several dozen times. The new pulse size is the sum of the previous pulse size and the current size.

前述のように、音声を例えば20ミリ秒毎のフレームに
分割し、フレーム内に15個のパルスを求める場合には
、相互相関長をフレーム長より長くとり、フレーム内の
みでなくフレーム外もパルスを探索し、フレーム内のパ
ルス数があらかじめ定めた数だけ求める方がフレーム内
のみを探索するよりも符号化音質が優れている。しかし
、マルチパルス符号化を実時間で行うためには、全体の
パルス探索ループ回数を制限する必要があり、その場合
には、必ずしもフレーム外でもパルス探索を行った方が
符号化音質が良くなるとは限らなかった。
As mentioned above, if audio is divided into frames of, for example, every 20 milliseconds and 15 pulses are to be found within each frame, the cross-correlation length should be longer than the frame length, and pulses will be generated not only within the frame but also outside the frame. Searching for a predetermined number of pulses within a frame results in better encoded sound quality than searching only within the frame. However, in order to perform multi-pulse encoding in real time, it is necessary to limit the overall number of pulse search loops, and in that case, it is not necessary to perform pulse search outside the frame for better encoded sound quality. was not limited.

第2図は、パルス探索ループを制限する場合のパルス探
索のフローチャートである。従来は、図中の破線の部分
がなく、1フレームが160サンプ゛  ルの場合に、
フレーム外のパルス探索を40サンプル長くして200
サンプルまで行う場合には、最初にパルス探索範囲を2
00に設定してパルス探索を行い、パルスがあらかじめ
定めた値、第2図では15になるまで、または、合計ル
ープ回数があらかじめ定めた値、第2図では25になる
まで行う。フレーム外のパルスを探索しない場合は、最
初にパルス探索範囲を160に設定して行う。
FIG. 2 is a flowchart of pulse search when the pulse search loop is limited. Conventionally, when there is no broken line in the figure and one frame has 160 samples,
Extend the pulse search outside the frame by 40 samples to 200
If you want to perform sampling, first set the pulse search range to 2.
00 and pulse search is performed until the pulse reaches a predetermined value, 15 in FIG. 2, or until the total number of loops reaches a predetermined value, 25 in FIG. If a pulse outside the frame is not to be searched, the pulse search range is first set to 160.

本発明では、第2図の破線の部分を追加したことが特徴
になっている。すなわち、最初、パルス探索長はフレー
ム外を含む200サンプルとし、フレーム外にパルスが
あらかじめ定めた数、第2図では5になったらパルス探
索長をフレーム長である160に制限する。
The present invention is characterized in that the portion indicated by the broken line in FIG. 2 is added. That is, initially, the pulse search length is set to 200 samples including outside the frame, and when the number of pulses outside the frame reaches a predetermined number (5 in FIG. 2), the pulse search length is limited to 160 samples, which is the frame length.

〔発明の効果〕〔Effect of the invention〕

本発明は以上説明したように、フレーム外に立つパルス
の個数があらかじめ定めた値以上になると、パルス探索
範囲をフレーム内に限定するので、パルス探索ループ回
数が制限されている場合の符号化音声の音質を高める効
果がある。
As explained above, the present invention limits the pulse search range to within the frame when the number of pulses standing outside the frame exceeds a predetermined value. It has the effect of improving the sound quality.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明実施例の構成を示すブロック構成図。 第2図は本発明実施例の動作を示すフローチャート。 1・・・合成フィルタ、2・・・重み付はフィルタ、3
・・・線形予測分析回路、4・・・インパルス応答生成
回路、5・・・相互相関生成回路、6・・・自己相関生
成回路、7・・・パルス探索回路、8・・・符号化回路
。 特許出願人 日本電気株式会社、−1、代理人  弁理
士 井 出 直 孝0、  パ′:実施例の構成 第1図
FIG. 1 is a block configuration diagram showing the configuration of an embodiment of the present invention. FIG. 2 is a flowchart showing the operation of the embodiment of the present invention. 1... Synthesis filter, 2... Weighting is a filter, 3
...Linear prediction analysis circuit, 4. Impulse response generation circuit, 5. Cross correlation generation circuit, 6. Autocorrelation generation circuit, 7. Pulse search circuit, 8. Encoding circuit. . Patent applicant: NEC Corporation, -1, agent: Nao Takashi Ide0, PA': Structure of the embodiment Fig. 1

Claims (1)

【特許請求の範囲】[Claims] (1)音声入力信号を線形予測分析して線形予測係数を
決定する手段と、 この線形予測係数に相応の線形予測フィルタのインパル
ス応答を求める手段と、 音声入力信号とインパルス応答の相互相関を求める手段
と、 この相互相関の絶対値が最大になる時間位置に位置しこ
の相互相関の大きさを振幅とする第一のパルスおよびあ
らかじめ定められた範囲内の相互相関に基づき決定され
た振幅と時間位置を有し、この第一のパルスにつづくあ
らかじめ定められた個数のパルス群を生成する手段と を備えた音声符号化装置において、 上記相互相関のあらかじめ定められた範囲外のパルスの
個数が上記あらかじめ定められた個数に達したときは、
上記相互相関の絶対値の最大値の探索を上記相互相関の
あらかじめ定められた範囲内に限定する手段 を備えたことを特徴とする音声符号化装置。
(1) Means for determining linear prediction coefficients by performing linear predictive analysis on an audio input signal; Means for determining an impulse response of a linear prediction filter corresponding to the linear prediction coefficient; and determining cross-correlation between the audio input signal and the impulse response. means, a first pulse located at a time position where the absolute value of this cross-correlation is maximum and having an amplitude equal to the magnitude of this cross-correlation, and an amplitude and time determined based on the cross-correlation within a predetermined range; and means for generating a predetermined number of pulses following the first pulse, wherein the number of pulses outside the predetermined range of the cross-correlation is When the predetermined number is reached,
A speech encoding device characterized by comprising means for limiting the search for the maximum value of the absolute value of the cross-correlation within a predetermined range of the cross-correlation.
JP61254542A 1986-10-24 1986-10-24 Voice encoder Pending JPS63108400A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61254542A JPS63108400A (en) 1986-10-24 1986-10-24 Voice encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61254542A JPS63108400A (en) 1986-10-24 1986-10-24 Voice encoder

Publications (1)

Publication Number Publication Date
JPS63108400A true JPS63108400A (en) 1988-05-13

Family

ID=17266488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61254542A Pending JPS63108400A (en) 1986-10-24 1986-10-24 Voice encoder

Country Status (1)

Country Link
JP (1) JPS63108400A (en)

Similar Documents

Publication Publication Date Title
JP3167787B2 (en) Digital speech coder
KR970001166B1 (en) Speech processing method and apparatus
EP0342687B1 (en) Coded speech communication system having code books for synthesizing small-amplitude components
WO1980002211A1 (en) Residual excited predictive speech coding system
JP2779325B2 (en) Pitch search time reduction method using pre-processing correlation equation in vocoder
JP2615664B2 (en) Audio coding method
JP3255190B2 (en) Speech coding apparatus and its analyzer and synthesizer
JPS63108400A (en) Voice encoder
US4962536A (en) Multi-pulse voice encoder with pitch prediction in a cross-correlation domain
JPH07101358B2 (en) Multi-pulse coding method and apparatus
JPS6238500A (en) Highly efficient voice coding system and apparatus
JPH058839B2 (en)
JPH0650439B2 (en) Multi-pulse driven speech coder
JPS63197999A (en) Voice coding system
JP2560682B2 (en) Speech signal coding / decoding method and apparatus
JPH0736119B2 (en) Piecewise optimal function approximation method
KR940002853B1 (en) Adaptationally sampling method for starting and finishing points of a sound signal
JPH0235994B2 (en)
JP2969619B2 (en) Speech coder
JP3112462B2 (en) Audio coding device
JPH0754438B2 (en) Voice processor
JPH0738119B2 (en) Speech waveform coding / decoding device
JPH0752360B2 (en) Speech coder
JPS61262800A (en) Voice coding system
JPH0632030B2 (en) Speech coding method