JPS62278600A - Synthesization of variable length frame type code encoder - Google Patents

Synthesization of variable length frame type code encoder

Info

Publication number
JPS62278600A
JPS62278600A JP61122690A JP12269086A JPS62278600A JP S62278600 A JPS62278600 A JP S62278600A JP 61122690 A JP61122690 A JP 61122690A JP 12269086 A JP12269086 A JP 12269086A JP S62278600 A JPS62278600 A JP S62278600A
Authority
JP
Japan
Prior art keywords
frame
synchronization
analysis
variable
variable length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61122690A
Other languages
Japanese (ja)
Other versions
JPH0754439B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61122690A priority Critical patent/JPH0754439B2/en
Publication of JPS62278600A publication Critical patent/JPS62278600A/en
Publication of JPH0754439B2 publication Critical patent/JPH0754439B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 3、発明の詳細な説明 〔産業上の利用分野〕 本発明は可変長フレーム型符号復号化装置の同期方&<
関し、特に同期処理における通話遅延の大幅な改善を図
った可変長フレーム型符号復号化装置の同期方法に関す
る。
[Detailed Description of the Invention] 3. Detailed Description of the Invention [Field of Industrial Application] The present invention relates to a method of synchronizing a variable length frame type code decoding device &<
In particular, the present invention relates to a method for synchronizing a variable-length frame type code/decoding device that significantly improves call delay in synchronization processing.

〔従来の技術〕[Conventional technology]

入力音声を基本分析フレーム周期で分析し、音声パラメ
ータとしてのスペクトル包絡パラメータと音源情報とを
抽出、これを符号化して伝送路を介して復号化側に送出
し原入力音声の合成を行なう符号復号化装置はよく知ら
れている。
Coding/decoding that analyzes input speech at the basic analysis frame period, extracts spectral envelope parameters and sound source information as speech parameters, encodes this, and sends it to the decoding side via a transmission path to synthesize the original input speech. oxidation equipment is well known.

この場合、入力音声スペクトルの巨視的特徴を示すスペ
クトル包絡パラメータはL P C(LinearPr
ediction Coding、  線形予測分析)
係数もしくはその誘導形式のものが利用され、これには
αパラメー、J、  Kパラメータ、あるいはLSP(
LineSpectrum Pa1rs、線スペクトル
対)等の諸係数が利用される。また、入力音声スペクト
ルの微視的特徴を示す音源情報としては、ピッチ周波数
に対応するパルス周波数と白色雑音とを有声/無声情報
に対応してモデル化して符号化、復号化するために必要
なピッチ周波数、有声/無声、音源振幅等が利用され、
このほか音源の波形情報を利用するものとして、マルチ
パルス、残差波形等が符号。
In this case, the spectral envelope parameter indicating the macroscopic characteristics of the input speech spectrum is L P C (LinearPr
diction coding, linear predictive analysis)
Coefficients or their derived forms are used, including α parameters, J, K parameters, or LSP (
Various coefficients such as Line Spectrum Pa1rs and Line Spectrum Pairs are used. In addition, as sound source information that indicates the microscopic characteristics of the input speech spectrum, the pulse frequency corresponding to the pitch frequency and white noise are necessary for encoding and decoding by modeling them corresponding to voiced/unvoiced information. Pitch frequency, voiced/unvoiced, sound source amplitude, etc. are used,
Other types of code that utilize the waveform information of the sound source include multipulse and residual waveform.

復号化される場合もある。It may also be decrypted.

可変長フレーム型符号復号化装置は、上述した符号復号
化装置において、符号化側から復号化側に送出すべき音
声パラメータのうちスペクトル包絡パラメータを分析フ
レーム単位で忠実に伝送する代りに複数の分析フレーム
を代表する代表分析フレームを選定したうえ、この代表
分析フレームのスペクトル包絡パラメータとこの代表分
析フレームと同一のスペクトル包絡パラメータをもつも
のとして指定される分析フレーム数いわゆるリピートビ
ットとを伝送することによって伝送ビットレートの大幅
な低減を実現するものである。
A variable-length frame type code/decoder is a variable-length frame type code/decoder that performs multiple analyzes instead of faithfully transmitting spectral envelope parameters in analysis frame units among audio parameters to be sent from the coding side to the decoding side in the code/decoding device described above. By selecting a representative analysis frame representing the frames, and transmitting the spectral envelope parameter of this representative analysis frame and the number of analysis frames designated as having the same spectral envelope parameter as this representative analysis frame, so-called repeat bits. This realizes a significant reduction in transmission bit rate.

このような可変長フレーム型符号復号化装置における可
変長フレームの構成形式にも種種の手法があるが基本的
には次のような内容が利用されている。
Although there are various methods for constructing a variable length frame in such a variable length frame code decoding device, the following are basically used.

すなわち、あらかじめ設定する個数M個の分析フレーム
よりなる区分ごとにこの区分スペクトル包絡を最適近似
する最適近似関係を設定する。この区分的最適近似に利
用する関数としては、たとえば矩形5&lt1等があり
、その設定は、分析フレームごとのスペクトル包絡パラ
メータによる空間ベクトル相互間の距離の総和が最小と
なるような近似矩形包絡を区分ごとく見出す形式で行な
われる。
That is, an optimum approximation relationship is set for each section consisting of a preset number M of analysis frames to optimally approximate the section spectrum envelope. Examples of functions used in this piecewise optimal approximation include rectangle 5&lt1, etc., and the settings are such that the approximate rectangular envelope is divided such that the sum of the distances between spatial vectors is the minimum according to the spectral envelope parameter for each analysis frame. It is done in the form of a ``head''.

こうして得られる近似矩形を構成する複数i個の分析フ
レームをもってその区分を代表する代表7レームとする
。上述したi個は、区分ごとにそれぞれのスペクトル包
絡に対応して任意に設定され、また、このような最適近
似自体は、分析次数を含み分析フレームごとのスペクト
ル包絡パラメータによる空間ベクトル相互間の総当り的
ベクトル距離の総和を評価尺度とし、これを最小とする
分析フレームの組合せをDr (Dynamic Pr
ograming。
A plurality of i analysis frames constituting the approximate rectangle thus obtained are assumed to be seven representative frames representing the division. The above-mentioned i pieces are arbitrarily set corresponding to the respective spectral envelopes for each section, and such optimal approximation itself is based on the total number of interspace vectors based on the spectral envelope parameters for each analysis frame, including the analysis order. The sum of the hit vector distances is used as an evaluation measure, and the combination of analysis frames that minimizes this is called Dr (Dynamic Pr
ograming.

動的計画法)によって容易に求められることもよく知ら
れている。
It is also well known that it can be easily determined using dynamic programming (dynamic programming).

さて、こうして求められた可変長フレーム形式によるス
ペクトル包絡パラメータは、音源情報とともに所定の形
一式で符号化され復号化側に伝送されるが、この場合、
これらデータ送受信における7レ一ム同期が符号化側と
復号化側との間で必要となる。
Now, the spectral envelope parameters obtained in the variable length frame format are encoded together with the sound source information in a predetermined format and transmitted to the decoding side, but in this case,
Seven-rem synchronization is required between the encoding side and the decoding side in data transmission and reception.

この同期形式としては、独立同期もしくは強制同期のい
ずれかが利用されることが多いが、いずれの場合にして
も可変長フレームを構成する1区分が同期処理における
基本フレームとなって扱われている。
As this synchronization format, either independent synchronization or forced synchronization is often used, but in either case, one segment that makes up the variable length frame is treated as the basic frame in the synchronization process. .

すiわち、独立同期において、復号化側が符号側とのク
ロック周波数差によるスリップを除去すべく同期制御を
実施するには1区画単位のデータを蓄積しつつ、同期ず
れの場合はこの1区分単位のデータ削除によるフレーム
更新を介して同期回復を行ない、また強制同期にあって
も符号化側から復号化側に提供されるクロックの発生1
分配。
In other words, in independent synchronization, in order for the decoding side to perform synchronization control to eliminate the slip caused by the clock frequency difference with the code side, it is necessary to accumulate data in units of one section, and in case of synchronization deviation, this one section Synchronization is recovered through frame updating due to unit data deletion, and clock generation is provided from the encoding side to the decoding side even in forced synchronization.
distribution.

伝送等にもとづく障害影響の除去を図るために1区分単
位のデータを蓄積しつつ、これも1区分シフトによるフ
レーム同期を前提として行なっているのが現状である。
At present, data is accumulated in units of one section in order to eliminate the effects of disturbances due to transmission, etc., and this is also done on the premise of frame synchronization by one section shift.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上述した従来のこの糧の可変長フレーム型符号復号化装
置の同期方法は、独立同期1強制同期を問わず1区分単
位のデータを蓄積しつつ1区分をZ’lAフレーム単位
としてフレーム同期を図るという方法で行なわれるだめ
、分析フレーム単位でフレーム同期を行なう通常の符号
復号化装置に比し著しい通話遅延が避けられないという
問題がある。
The synchronization method of the conventional variable-length frame type code decoding device described above is to accumulate data in units of one section, regardless of independent synchronization or forced synchronization, and achieve frame synchronization using one section as a Z'lA frame unit. If this method is used, there is a problem in that a significant call delay is unavoidable compared to a normal code/decoder that performs frame synchronization on an analysis frame basis.

この通話遅延は、可変長フレームの1区分が数100m
5EC程度になることも珍しくないことを考慮すれば自
明のことである。
This call delay is due to the fact that one segment of the variable length frame is several hundred meters long.
This is obvious considering that it is not uncommon for the amount to be around 5EC.

本発明の目的は上述した欠点を除去し、可変長フレーム
型符号復号化装置の同期方法において、1区分よりも十
分短く、たとえば基本分析フレームもしくはこれに対応
するタイムスロット分のサンプル数穆度のデータの蓄積
のみでフレーム同期を図るという手段を備えることによ
り、同期処理にもとづく通話遅延を著しく改善した可変
長フレーム型符号復号化装置の同期方法を提供すること
におる。
SUMMARY OF THE INVENTION An object of the present invention is to eliminate the above-mentioned drawbacks, and to provide a synchronization method for a variable-length frame type code decoding device, which is sufficiently shorter than one section, for example, a basic analysis frame or a time slot corresponding thereto. It is an object of the present invention to provide a method for synchronizing a variable-length frame type code decoding device, which significantly improves call delays caused by synchronization processing by providing means for achieving frame synchronization only by accumulating data.

〔問題点を解決するための手段〕[Means for solving problems]

本発明の方法は、独立同期もしくは強制同期を符号化側
との同期に利用する可変長フレーム型符号復号化装置の
同期方法において、可変長7レ一ム区分ごとに代表スペ
クトル包絡パラメータによって指定される有声区間もし
くは前記可変長フレーム区分ごとの無音区間あるいは前
記有声区間および無音区間の時間長を符号化側と復号化
側の同期ずれの程度に対応して適応制御しつつ符号化側
と復号化側との同期保持を行なわしめる同期保持手段を
備えて構成される。
The method of the present invention is a synchronization method for a variable-length frame code decoding device that uses independent synchronization or forced synchronization for synchronization with the encoding side. A voiced section or a silent section for each variable-length frame segment, or a time length of the voiced section and silent section is adaptively controlled in accordance with the degree of synchronization difference between the coding side and the decoding side, and the encoding side and the decoding side are The device is equipped with synchronization maintaining means for maintaining synchronization with the other side.

〔実施例〕〔Example〕

次に図面を参照して本発明の詳細な説明する。 Next, the present invention will be described in detail with reference to the drawings.

第1図は本発明の一実施例を示すブロック図であり、符
号化側1と復号化側2から成る。
FIG. 1 is a block diagram showing one embodiment of the present invention, which consists of an encoding side 1 and a decoding side 2.

符号化側1はさらに、A/Dコンバータ11゜窓処理器
12.LSP分析器13.音源情報分析器14.可変長
7レーム選択器15.クロック発生器16およびマルチ
プレクサ17等を備えて構成される。
The encoding side 1 further includes an A/D converter 11° window processor 12. LSP analyzer13. Sound source information analyzer 14. Variable length 7 frame selector 15. It is configured to include a clock generator 16, a multiplexer 17, and the like.

また、復号化側2は、デマルチプレクサ21゜フレーム
同期器22.固定長フレーム化器23゜メそす24.適
応制御器25.修正メツセージ発生器26.クロック発
生回路27および音声合成器28等を備えて構成される
The decoding side 2 also includes a demultiplexer 21° frame synchronizer 22 . Fixed length framer 23°Mesosu 24. Adaptive controller 25. Modified message generator 26. It is configured to include a clock generation circuit 27, a speech synthesizer 28, and the like.

第1図に示す実施例は同期方式として独立同期を利用す
る場合を例とし、かつスペクトル包絡パラメータとして
はLSP係数を利用しているが、これは強制同期方式と
し、かつ他oLPC係数を利用するものとしても差支え
なく、基本的にはほぼ同様に実施できる。
The embodiment shown in FIG. 1 uses independent synchronization as the synchronization method and uses LSP coefficients as the spectrum envelope parameter, but this is a forced synchronization method and uses other oLPC coefficients. There is no problem with this, and basically it can be implemented in almost the same way.

さて、入力音声はA/Dコンバータ11に供給され、高
域遮断周波数3.4 KHz OLPF (Low P
a5s1;’1lter)を介して不要な高域周波数を
除去したのち8 KH2のサンプリング周波数で標本化
され12ビツトの量子化ステップでディジタル化される
Now, the input audio is supplied to the A/D converter 11, and the high cutoff frequency is 3.4 KHz OLPF (Low P
After removing unnecessary high frequencies through a 5s1;'1lter), the signal is sampled at a sampling frequency of 8KH2 and digitized with a 12-bit quantization step.

窓処理器12は、A/Dフンバータ11から量子化音声
信号を受けると、あらかじめ設定する1ブロック分、た
とえば30m5Ec(240サンプル)ずつを一時的に
メモIJ Ic格納し、これにおらかじめ設定した窓関
数のハミング関数を乗算して切出す窓処理を10m5E
Cの分析フレーム周期ごとく行なう。従って基本的分析
フレーム長は10m5ECとなる。
When the window processor 12 receives the quantized audio signal from the A/D frequency converter 11, the window processor 12 temporarily stores one preset block worth, for example, 30m5Ec (240 samples) each in a memo IJIc, and stores the preset settings therein. The window processing to cut out by multiplying the Hamming function of the window function is 10m5E.
This is carried out every analysis frame period of C. Therefore, the basic analysis frame length is 10m5EC.

窓処理器12の出力はLSP分析器13と音源情報分析
器14に供給される。
The output of the window processor 12 is supplied to an LSP analyzer 13 and a sound source information analyzer 14.

LSP分析器13は、入力する分析フレームごとのデー
タを公知の手法によってLPC分析して所定の8次のα
パラメータを抽出し、さらKこれを利用してS次元の空
間ベクトルとしてのLSF係数を誘導する。本実施例で
はSとして偶数を選んでいる。C8P係数を次の(1)
式のPで示す。
The LSP analyzer 13 performs LPC analysis on data for each input analysis frame using a known method to obtain a predetermined 8th-order α
The parameters are extracted and then used to derive LSF coefficients as S-dimensional space vectors. In this embodiment, an even number is selected as S. The C8P coefficient is the following (1)
It is represented by P in the formula.

? (Pl + ”2 +・・・・・・Ps)・・・・
・・・・・・・・・・・・・・・・・(1)(1)式に
示すP1〜Psは声道の開閉状態にもとづいて得られる
共振周波数の組の形式で表現される周波数領域パラメー
タでおる。
? (Pl + "2 +...Ps)...
・・・・・・・・・・・・・・・・・・(1) P1 to Ps shown in equation (1) are expressed in the form of a set of resonance frequencies obtained based on the open/closed state of the vocal tract. It is determined by frequency domain parameters.

L8F分析器13で得られる分析フレームごとのLAP
係数は可変長フレーム選択器15に供給される。
LAP for each analysis frame obtained by L8F analyzer 13
The coefficients are supplied to a variable length frame selector 15.

可変長フレーム選択器15は、分析フレーム単位で入力
するスペクトル包絡パラメータの系列に対し次のように
して区分的最適関数近似にもとづく可変長フレーム選択
を実施する。
The variable length frame selector 15 performs variable length frame selection based on piecewise optimal function approximation in the following manner for a series of spectral envelope parameters input in units of analysis frames.

すなわち、本実施例では相続<20個の分析フレーム区
間、すなわち200m5ECを1区分とし、この区分と
とに区分的最適関数近似を矩形近似によって行なってい
る。この場合、近似関数として矩形関数の代りに折線近
似関数等信の近似関数を利用しても勿論差支えない。
That is, in this embodiment, one section is an analysis frame section with inheritance<20, that is, 200 m5 EC, and piecewise optimal function approximation is performed on this section by rectangular approximation. In this case, it is of course possible to use an approximation function such as a polygonal line approximation function instead of the rectangular function as the approximation function.

さて、区分ごとに含まれる20個の分析フレームのうち
i個が代表分析フレームとして選択されたとする。ここ
でiは1から20のうち任意に選定される数である。こ
の代表分析フレームに属するLAP係数ベクトルを利用
してこの区分中の他の分析フレームに属するLSF係数
ベクトルをも近似的に代表せしめるのであるが、この場
合矩形関数近似を行ない、この近似誤差による歪が最小
となるようにiを選定するのである。この場合の歪は基
本的には前述した係数のベクトル距離を尺度として得ら
れ、分析フレームごとの係数間のベクトル距離の総和が
最小であるものが歪最小という観点にもとづいてDP手
法を利用して容易に求めることができる。
Now, it is assumed that i pieces out of 20 analysis frames included in each category are selected as representative analysis frames. Here, i is a number arbitrarily selected from 1 to 20. The LAP coefficient vectors belonging to this representative analysis frame are used to approximately represent the LSF coefficient vectors belonging to other analysis frames in this division. i is selected so that . Distortion in this case is basically obtained using the vector distance of the coefficients as described above as a measure, and the DP method is used based on the viewpoint that the minimum distortion is the one with the minimum sum of vector distances between coefficients for each analysis frame. can be easily determined.

こうして、区分ごとに次次i i HI3の代表分析フ
レームが選定され、かつこれらi個の代表分析フレーム
が代表すべき分析フレームもそれぞれ決定され、可変長
フレーム構成のLAP係数データとしてマルチプレクサ
17に供給される。
In this way, representative analysis frames of the next i i HI3 are selected for each division, and the analysis frames to be represented by these i representative analysis frames are also determined, and are supplied to the multiplexer 17 as LAP coefficient data having a variable length frame structure. be done.

音源情報分析器14は、窓処理器12から受ける分析フ
レームごとの量子化音声信号を利用し、会知の分析手法
によってピッチ周期、有声/無声の別および音源振幅を
得てこれら音源情報ブータラ分析フレームごとくマルチ
プレクサ17に供給する。
The sound source information analyzer 14 uses the quantized audio signal for each analysis frame received from the window processor 12, obtains the pitch period, voiced/unvoiced status, and sound source amplitude using a well-known analysis method, and analyzes these sound source information. Each frame is supplied to the multiplexer 17.

クロック発生器16は、A/Dコンバータ11からマル
チプレクサ17までのディジタル処理に必要なりロック
t1を提供する。
The clock generator 16 is necessary for digital processing from the A/D converter 11 to the multiplexer 17 and provides a lock t1.

マルチプレクサ17は、こうして入力したLAP係数デ
ータと音源情報データとを伝送に適する形に合成符号化
した多重化信号として伝送路100を介して復号化側2
に送出し、従ってクロックt1に関する情報もこの多重
化信号に含まれて符号化側2に提供されることとなる。
The multiplexer 17 sends the input LAP coefficient data and sound source information data to the decoding side 2 via the transmission path 100 as a multiplexed signal that is synthesized and encoded in a form suitable for transmission.
Therefore, information regarding the clock t1 is also included in this multiplexed signal and provided to the encoding side 2.

復号化側2では、符号化側1のマルチプレクサ17から
提供された多重化信号をデマルチプレクサ21で受け、
この時系列データのスペクトルにもとづきクロックt1
を抽出、このクロックt1を利用しつつ多重化信号の分
離を行なったのち復号化して符号化側1のマルチプレク
サ17の入力状態に復元し、区分単位で提供されるLS
P周波数データと分析フレーム単位で提供される音源情
報データはフレーム同期器22に供給する。また、デマ
ルチプレクサ21で抽出したクロック11はフレーム同
期器22.固定長フレーム化器23.メモリ24.修正
メツセージ発生器26等にそれぞれ供給される。
On the decoding side 2, the multiplexed signal provided from the multiplexer 17 on the encoding side 1 is received by the demultiplexer 21,
Based on the spectrum of this time series data, clock t1
is extracted, the multiplexed signal is separated using this clock t1, and then decoded and restored to the input state of the multiplexer 17 on the encoding side 1.
The P frequency data and the sound source information data provided in units of analysis frames are supplied to the frame synchronizer 22. Further, the clock 11 extracted by the demultiplexer 21 is transmitted to the frame synchronizer 22. Fixed length framer 23. Memory 24. The corrected message generators 26 and the like are each supplied with the corrected message generators 26 and the like.

フレーム同期器22は、こうして提供されるクロックt
1に関する情報を利用してLAP係数データを送出した
区分単位のフレームと、音源データを送出した分析フレ
ームのフレーム同期を行ないつつこれらデータを受信し
これを固定長フレーム化器23に供給する。
The frame synchronizer 22 receives the clock t thus provided.
Using the information regarding LAP coefficient data, frame synchronization is performed between the divisional frame to which the LAP coefficient data was sent and the analysis frame to which the sound source data was sent, and these data are received and supplied to the fixed-length frame generator 23.

フレーム同期器23はまたフレーム同期を行ないつつ受
信するLSP係数データからはリピートビット、また音
源データからは電カビノドに関するデータを抽出し、こ
れらを適応制御器25に供給する。上述したリピートビ
ットは、区分ごとに選択されたi行の代表分析フレーム
のそれぞれが代表する分析フレームの個数ならびに区分
内順番に関するデータである。
The frame synchronizer 23 also performs frame synchronization while extracting repeat bits from the received LSP coefficient data and data related to electric kabino from the sound source data, and supplies these to the adaptive controller 25. The above-mentioned repeat bit is data regarding the number of analysis frames represented by each of the i rows of representative analysis frames selected for each section and the order within the section.

固定長フレーム化器23は、デマルチプレクサ21から
提供されるクロック1.の駆動のもとに代表分析フレー
ムとリピートビット等を利用し、代表分析フレーム間の
補間を行なってLSF係数の固定フレーム別指定状態を
復元する。すなわちLSP分析器13の出力状態に復元
する。
Fixed length framer 23 receives clocks 1 . Under the drive of , representative analysis frames and repeat bits are used to perform interpolation between representative analysis frames to restore the specified state of LSF coefficients for each fixed frame. That is, the output state of the LSP analyzer 13 is restored.

こうして、固定長フレーム化されたLSP係数は別途分
析フレーム単位でフレーム同期器22から提供された音
源情報とともに音声パラメータとしてメモリ24に分析
フレーム単位で格納される。
In this way, the LSP coefficients converted into fixed-length frames are separately stored in the memory 24 as audio parameters in analysis frame units together with the sound source information provided from the frame synchronizer 22 in analysis frame units.

メモリ24に格納される場合の書込みクロックはデマル
チプレクサ21から供給され太線で示すクロック1.が
利用され、これを読出して音声合成器28に供給するク
ロックは復号化側2のクロック発生器27から供給され
る点線で示すクロックt2が利用される。これら2つの
クロックは互いに独立同期の形式で符号化側と復号化側
との同期保持に利用される。このような独立同期は、符
号化側におけるクロックの安定性の確保や柔軟性のある
システム構成、効率的な故障対応といった点では優れて
いるものの両クロック間の時間ずれが原因となる通話遅
延が避けられない。このことを詳述すると次のとおりで
ある。
The write clocks for storing data in the memory 24 are supplied from the demultiplexer 21 and are clocks 1. The clock t2 shown by the dotted line supplied from the clock generator 27 on the decoding side 2 is used as the clock for reading this and supplying it to the speech synthesizer 28. These two clocks are used to maintain synchronization between the encoding side and the decoding side in a mutually independent synchronization format. Although this type of independent synchronization is superior in terms of ensuring clock stability on the encoding side, flexible system configuration, and efficient failure handling, it also suffers from call delays caused by the time difference between the two clocks. Inevitable. This will be explained in detail as follows.

いま、かりに復号化側2のクロックt2が符号化側のク
ロックt1よりも速い方向にずれているとすると、メモ
リ24に対する書込みよりは読出し速度が速く、最終的
には読出すべきフレームデータが無くなってしまうこと
になる。また、クロックt2がクロック11よりも遅い
方向にずれている場合には読出しの終了しないうちVC
次の7レームデータの書込み命令が出されるという状態
が発生することとなる。このような場合、このずれの状
態を監視しつつ、これがある許容値を超えるこぎは次の
分析7レームの書込み、読出しに飛越しシフトし符号、
復号化側間のフレーム同期を確保している。
Now, if the clock t2 on the decoding side 2 is shifted in a faster direction than the clock t1 on the encoding side, the reading speed will be faster than writing to the memory 24, and eventually there will be no frame data to read. This will result in In addition, if the clock t2 deviates in a direction slower than the clock 11, the VC
A situation occurs in which a write command for the next 7 frames of data is issued. In such a case, while monitoring the state of the deviation, if it exceeds a certain tolerance value, the writing and reading of the next analysis 7 frames will be interlaced and shifted, and the code will be changed.
Frame synchronization between decoding sides is ensured.

しかしながら、可変長フレーム型の符号復号装置では、
このようにして調整されるフレーム同期が1区分を基本
フレーム単位として処理しており、これによる通話遅延
は通常の符号復号化装置に比して著しく増大したものと
なる。
However, in a variable length frame type code/decoder,
Frame synchronization adjusted in this manner processes one segment as a basic frame unit, and the call delay due to this is significantly increased compared to a normal code/decoder.

本実施例は上述したフレーム同期修正を1区分よりも十
分に短い分析フレーム単位で実施して通話遅延の大幅な
改善を図っている。
In this embodiment, the above-described frame synchronization correction is performed in analysis frame units that are sufficiently shorter than one segment, thereby achieving a significant improvement in call delay.

固定長フレーム化器23は適応制御器25から調節フレ
ームに関するデータを受ける都度、メモリ24に出力す
べき分析フレームから当該分析フレームを削除する。こ
の調節フレームは、区分中にあって再生音質に強い影響
をもつ子音もしくは子音と母音の共存部は除き、その時
間長が本質的に不定であり従って再生音質に対する影響
が十分に少ない有声音定常部ならびに無音部分もしくは
この無音部分と実効的に等価な音声中のポーズ部分を対
象として指定され、かつそのタイミングは修正メツセー
ジ発生器26から修正メンセージを受ける都度行なわれ
るものとしている。
Each time the fixed length framer 23 receives data regarding an adjustment frame from the adaptive controller 25, it deletes the relevant analysis frame from the analysis frames to be output to the memory 24. This adjustment frame is used for stationary voiced sounds whose time length is essentially indeterminate and therefore has a sufficiently small influence on the reproduced sound quality, excluding consonants or consonant-vowel coexistence parts that are in the segment and have a strong influence on the reproduced sound quality. and a silent part, or a pause part in the voice that is effectively equivalent to the silent part, and the timing is such that it is performed every time a modified message is received from the modified message generator 26.

ところで、可変長フV−ム化されたスペクトル包絡パラ
メータにおいて、代表分析フレームによって指定される
分析フレーム群の時間長が長く、従ってフレーム同期保
持のために削除される1分析フレームの影響が相対的に
少なくて済む区間のひとつが有声音定常部であυ、もう
ひとつがポーズを含む無音部である。これら有声音定常
部と無音部とを音声電力の観点で評価すると、前者は明
らかに電力犬であり後者は電力小である。どの分析フレ
ームを削除の対象とするかは、フレーム同期器22から
提供される電力ビットを利用し、リピートビットによっ
て指定される分析7レームから次のようにして選定する
By the way, in the spectral envelope parameter converted into a variable length frame, the time length of the analysis frame group specified by the representative analysis frame is long, so the influence of one analysis frame deleted to maintain frame synchronization is relatively One of the sections that requires less is the voiced stationary section υ, and the other is the silent section that includes pauses. When these voiced sound stationary parts and silent parts are evaluated from the viewpoint of voice power, the former clearly has high power and the latter has low power. Which analysis frame is to be deleted is selected from the seven analysis frames specified by the repeat bit using the power bit provided by the frame synchronizer 22 as follows.

修正メツセージ発生器26は常時クロック11とクロッ
クt2を受けつつ、クロック相互間の時間ずれ±Δtを
監視する。この時間ずれ±Δtがある許容値を超えたと
き修正メツセージ発生器26は適応制御器25に対し区
分中から削除すべき分析フレームを指定する調節フレー
ムデータを出力せしめる修正メツセージを出力する。
The modified message generator 26 constantly receives the clock 11 and the clock t2 and monitors the time difference ±Δt between the clocks. When this time deviation ±Δt exceeds a certain tolerance value, the modified message generator 26 outputs a modified message that causes the adaptive controller 25 to output adjustment frame data specifying the analysis frame to be deleted from the classification.

適応制御器25は、修正メツセージを受けると電カビノ
ドとリピートビットにもとづき時間的に最゛近傍の削除
対象分析フレームを決定、この情報を調節フレームデー
タとして出力し、分析フレーム単位での同期保持を行な
う。
When the adaptive controller 25 receives the correction message, it determines the temporally nearest analysis frame to be deleted based on the electric pattern and the repeat bit, outputs this information as adjustment frame data, and maintains synchronization in units of analysis frames. Let's do it.

音声合成器28はクロックt2を受けつつ、メモリ23
から分析フレーム単位でスペクトル包絡パラメータと音
源データを供給される。
The speech synthesizer 28 receives the clock t2 and the memory 23
The spectral envelope parameters and sound source data are supplied in units of analysis frames.

音声合成器28は、LAP合成フィルタのフィルタ係数
としてLSP係数を利用し、また音源データから再生し
た音源信号でこのフィルタを駆動してディジタル音声信
号を発生、さらにこれをD/Aコンバータにかけてアナ
ログ音声信号とじたうえLPFで3.4 KHz以上の
不要な高域成分を除去し出力音声を得る。
The speech synthesizer 28 uses LSP coefficients as filter coefficients of the LAP synthesis filter, drives this filter with a sound source signal reproduced from sound source data to generate a digital sound signal, and converts this into a D/A converter to generate analog sound. After concatenating the signal, unnecessary high-frequency components of 3.4 KHz or higher are removed using an LPF to obtain output audio.

こうして、区分単位による可変長フレーム符号。Thus, a variable length frame code with segmentation units.

復号化を実施しつつ、しかもフレーム同期保持は分析フ
レーム単位で処理することができる。
While performing decoding, frame synchronization maintenance can be processed on an analysis frame basis.

なお、本実施例ではスペクトル包絡パラメータのうち代
表分析フレームによって指定される区間の時間長と無音
区間の時間長とを併用して適応制御するものとしている
が、これをそれぞれ単独に適応制御するものとしても一
向に差支えない。
Note that in this embodiment, the time length of the section specified by the representative analysis frame and the time length of the silent section among the spectral envelope parameters are jointly used for adaptive control, but each of these is adaptively controlled independently. However, there is no problem at all.

また、本実施では1区分よりも十分短い区間として分析
フレームを同期における基本フレームとして利用してい
るが、これはほぼ同様な時間長のサンプル数を対象とし
ても容易に実施しうることは明らかである。
In addition, in this implementation, the analysis frame is used as a basic frame for synchronization, which is a sufficiently shorter period than one division, but it is clear that this can be easily implemented even when the number of samples of approximately the same time length is targeted. be.

〔発明の効果〕〔Effect of the invention〕

以上説明した如く本発明によれば、独立同期もしくは強
制同期を符号化側と復合化側との同期に利用する可変長
フレーム型符号化装置の同期方法において、スペクトル
包絡パラメータの代表時間長もしくは無音区間長、ある
いはこれら2つの時間長を符号化側と復合化側との同期
すれの程度に対応して適応制御するという平部を備える
ととくより、同期ずれ修正に伴なう通話遅延を著しく低
減せしめる可変長フレーム型符号復号化装置の同期方法
が実現できるという効果がある。
As explained above, according to the present invention, in the synchronization method of a variable length frame type encoding device that uses independent synchronization or forced synchronization for synchronization between the encoding side and the decoding side, In particular, by providing a flat part that adaptively controls the interval length or these two time lengths in accordance with the degree of synchronization between the encoding side and the decoding side, it is possible to significantly reduce call delays caused by correction of synchronization deviation. There is an effect that it is possible to realize a synchronization method for a variable-length frame code decoding device that reduces synchronization.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示すブロック図である。 1・・・・・・符号化側、2・・・・・・復合化側、1
1・・・・・・A/Dコンバータ、12・・・・・・窓
処理器、13・・−・・・LAP分析器、14・・・・
・・音源情報分析器、15・・−・・・可変長フレーム
選択器、16・・・・・−クロック発生器、17・・・
・・・マルチプレクサ、21・・・・・・デマルチプレ
クサ、22・・・・・・フレーム同期器、23・・・・
・・固定長フレーム化器、24・・・・・・メモリ、2
5・・・・・・適応制御器、26・・・・・・修正メツ
セージ発生器、26゜27・・・・・・クロック発生器
、28・・・・・・音声合成器、100・・・・・・伝
送路。 代理人 弁理士  内 原   晋 手続補正書(自発) 昭和  年62゛餉10  日 事件との関係       出 願 人東京都港区芝五
丁目33番1号 (423)   日本電気株式会社 代表者 関本忠弘 4、代理人 & 補正の対象 明細書の「発明の詳細な説明」の欄 6、補正の内容
FIG. 1 is a block diagram showing one embodiment of the present invention. 1...Encoding side, 2...Decoding side, 1
1... A/D converter, 12... Window processor, 13... LAP analyzer, 14...
...Sound source information analyzer, 15...Variable length frame selector, 16...-Clock generator, 17...
... multiplexer, 21 ... demultiplexer, 22 ... frame synchronizer, 23 ...
...Fixed length framer, 24...Memory, 2
5...Adaptive controller, 26...Modified message generator, 26°27...Clock generator, 28...Speech synthesizer, 100... ...Transmission line. Agent Patent attorney Susumu Uchihara Procedural amendment (voluntary) Relationship to the Showa 1962-10 Incident Applicant 5-33-1 Shiba, Minato-ku, Tokyo (423) NEC Corporation Representative Tadahiro Sekimoto 4 , Agent & Column 6 of “Detailed Description of the Invention” of the specification subject to amendment, Contents of amendment

Claims (1)

【特許請求の範囲】 独立同期もしくは強制同期を符号化側と復号化側との同
期に利用する可変長フレーム型符号復号装置の同期方法
において、 可変長フレーム区分ごとに代表スペクトル包絡パラメー
タによって指定される有声区間もしくは前記可変調フレ
ーム区分ごとの無音区間あるいは前記有声区間および無
音区間の時間長を符号化側と復号化側との同期ずれの程
度に対応して適応制御しつつ符号化側と復号化側との同
期保持を行なわしめる同期保持手段を備えて成ることを
特徴とする可変長フレーム型符号復号化装置の同期方法
[Claims] In a synchronization method for a variable-length frame type code/decoder that uses independent synchronization or forced synchronization to synchronize an encoder and a decoder, The coding side and the decoding process are performed while adaptively controlling the voiced period or the silent period for each variable-tone frame segment, or the time length of the voiced period and the silent period according to the degree of synchronization difference between the coding side and the decoding side. 1. A method for synchronizing a variable-length frame type code decoding device, comprising: synchronization maintaining means for maintaining synchronization with a coding side.
JP61122690A 1986-05-27 1986-05-27 Method of synchronizing variable length frame type code decoding device Expired - Lifetime JPH0754439B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61122690A JPH0754439B2 (en) 1986-05-27 1986-05-27 Method of synchronizing variable length frame type code decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61122690A JPH0754439B2 (en) 1986-05-27 1986-05-27 Method of synchronizing variable length frame type code decoding device

Publications (2)

Publication Number Publication Date
JPS62278600A true JPS62278600A (en) 1987-12-03
JPH0754439B2 JPH0754439B2 (en) 1995-06-07

Family

ID=14842208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61122690A Expired - Lifetime JPH0754439B2 (en) 1986-05-27 1986-05-27 Method of synchronizing variable length frame type code decoding device

Country Status (1)

Country Link
JP (1) JPH0754439B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543140A (en) * 2006-07-06 2009-12-03 クゥアルコム・インコーポレイテッド Clock compensation technology for audio decoding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543140A (en) * 2006-07-06 2009-12-03 クゥアルコム・インコーポレイテッド Clock compensation technology for audio decoding
US9420332B2 (en) 2006-07-06 2016-08-16 Qualcomm Incorporated Clock compensation techniques for audio decoding

Also Published As

Publication number Publication date
JPH0754439B2 (en) 1995-06-07

Similar Documents

Publication Publication Date Title
JP5792710B2 (en) Sinusoidal coding
KR100615480B1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPS5936275B2 (en) Residual excitation predictive speech coding method
JPH07123242B2 (en) Audio signal decoding device
JPS63142399A (en) Voice analysis/synthesization method and apparatus
CA2452022C (en) Apparatus and method for changing the playback rate of recorded speech
US4703505A (en) Speech data encoding scheme
JP4867076B2 (en) Compression unit creation apparatus for speech synthesis, speech rule synthesis apparatus, and method used therefor
JPS62278600A (en) Synthesization of variable length frame type code encoder
JPH0481199B2 (en)
JPH10232699A (en) Lpc vocoder
JP3285472B2 (en) Audio decoding device and audio decoding method
JP2000099094A (en) Time series signal processor
JPH10333698A (en) Vice encoding method, voice decoding method, voice encoder, and recording medium
JPS62285541A (en) Error control method in voice digital transmission of vocoder system
JPS5915299A (en) Voice analyzer
JPH01261700A (en) Voice coding system
JPH02309400A (en) Variable length frame type vocoder
JP2000187491A (en) Voice analyzing/synthesizing device
JPS5965896A (en) Pitch synchronizing voice analysis and synthesization method
JPH043878B2 (en)
JPH05150800A (en) Speech encoder
JPH0426119B2 (en)
JPS6342532A (en) Audio encoding device
JPS62100027A (en) Voice coding system