JPS63192099A - 音声分析合成方式 - Google Patents

音声分析合成方式

Info

Publication number
JPS63192099A
JPS63192099A JP62025184A JP2518487A JPS63192099A JP S63192099 A JPS63192099 A JP S63192099A JP 62025184 A JP62025184 A JP 62025184A JP 2518487 A JP2518487 A JP 2518487A JP S63192099 A JPS63192099 A JP S63192099A
Authority
JP
Japan
Prior art keywords
analysis
coefficients
quantization
section
bits
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62025184A
Other languages
English (en)
Inventor
松田 高男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62025184A priority Critical patent/JPS63192099A/ja
Publication of JPS63192099A publication Critical patent/JPS63192099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 本発明は音声波形をいったん分析して情報要素の形に変
換、伝送し、それを元の音声に復元する音声分析合成方
式において、 ピッチ周期の長短に応じて分析係数の量子化ビット数の
割り当てを最適なものに選択することにより、 音声品質を改善するようにしたものである。
(産業上の利用分野) 本発明は音声分析合成方式に係り、特にPARCOR方
式(Partial Autocorrelation
 Coeffi−Cient )により音声を分析し、
合成する音声分析合成方式に関する。
音声分析合成方式のうち最も代表的なPARCOR分析
合成方式は、音声スペクトルの特徴を能率的に表現でき
る点で優れており、音声を9600bps 、 480
0bps 、 2400bpsといった非常に低いビッ
トレートで音声を伝送でき、情報伝送容量が限られてい
る回路で音声を効率的に伝送するのに有効な符号化方式
であり、特に海外ネットワークや衡星回線、あるいは音
声応答装置等への応用が有効である。
このようなPARCOR分析合成方式では合成音声の品
質向上が重要となる。
〔従来の技術〕
第4図は従来のPARCOR分析合成方式の・−例のブ
ロック図を示す。第4図において、送信部(分析側)の
入力端子1よりのアナログ音声信号はA/D変換器2に
よりディジタル信号Xに変換された後PARCOR分析
部3に供給され、ここで複数個の相続く音声標本値に基
づいてPARCOR係数に1〜kTlと残差信号εとに
される。残差信号εから相関部4は音声のピッチ周期T
、振幅A、有声/無声係数V/lJ Vの駆動音源情報
を得る。
PARCOR係数に1〜に1は量子化部5により所定傷
子化ビット数で量子化され、またピッチ周11T及び振
幅Aの情報は逗子化部6で量子化され、それぞれ符号化
部7に前記有声/無声情報と共に供給され、ここで符号
化された後、伝送路へ送出される。
このディジタル符号化信号は受信部(合成側)内の復号
化部8により復号化され、そのうちピッチ周期情報T′
はパルス発生器9の出力パルスの周期を可変し、振幅情
報A′は増幅部12のゲインを可変し、有声/無声情報
V/uV’ はスイッチ回路11をスイッチング111
11mシ、有声のときはパルス発生器9の出力パルスを
選択出力させ、無声のときはランダム雑音発生器10の
出力ランダム雑音を選択出力させる。
スイッチ回路11の出力信号は増幅部12により増幅さ
れて擬似的な残差信号ε′とされた後、合成フィルタ1
4に供給される。また、前記復号化部8の出力信号を、
復号化部13により更に復号化して得られたPARCO
R係数kl′〜に1′は合成フィルタ14に供給されて
その特性を可変制御する。
これにより、合成フィルタ14からはディジタル信号x
′が復元されて取り出され、更にD/A変換器15を通
して出力端子16へ原アナログ音声信号と略同−のアナ
ログ合成音声信号として出力される。
ここで、従来はフレーム周期15m5,1フレームのビ
ット数72ビツト、 4800bpsでディジタル信号
を伝送路へ送出する場合の、量子化部5によるPARC
OR係数に+ 〜に+o (n=10の場合)の各」子
化ビット数の割り当ては第5図に示す如く、低次の係数
はど多くのビットを割り当て、高次の係数はど割り当て
る量子化ビット数を少なくしていた。
これは、PARCOR係数の特徴を利用したものである
が、この母子化ビット数の割り当ては、話者の音声ピッ
チには無関係で固定である。この量子化ビット数の割り
当ては、あらゆるピッチに対して平均的に最適なものが
選ばれていた。なお、1フレーム72ビツト中、PAR
COR係数に+〜に1・の全ビット数は第5図に示す如
く58ビツトであり、残りの14ビツトのうち6ビツト
はビッヂ周期Tの情報ビット、6ビツトは振幅Aの情報
ビット、更に有声/無声情報V/UVと同期ビットが各
1ビツトである。
〔発明が解決しようとする問題点〕
PARCOR係数はそれぞれ相異なるスペクトル感度を
もち、低次の係数はど高感度で重要な情報を担っている
ことから、第5図に示すように、低次の係数はど母子化
ビット数の羽り当てが多くなっており、前記したように
、このPARCOR係数の量子化ビット数の割り当ては
従来固定であった。
しかし、実際は女声の場合と男声の場合を比較すると、
同一の量子化ビット数に対する量子化ひずみは女声の場
合の方が大きく、女声の方が係数の量子化による品質劣
化が顕著に現われることが知られている(例えば、北脇
他: PARCOR形音声分析合成系、音響学会研究実
用化報告第27巻第6号(1978))。
このため、従来はPARCOR係数の量子化ビット数の
割り当ての固定化のため、ピッチ周期によって音声品質
が左右され、充分な音声品質が得られない場合があった
。また、2400bpS 。
4800bpsといった低ビツトレートになるほど、音
質の激しい劣化は避けられなかった。
本発明は上記の点に鑑みて創作されたもので、ピッチ周
期が変化してもB声品質を改善することができる音声分
析合成方式を提供することを目的とする。
〔問題点を解決するための手段〕
第1図は本発明方式の原理ブロック図を示す。
同図中、第4図と同一構成部分には同一符号を付し、そ
の説明を省略する。第1図において、19は分析部、2
0及び22はビット割り当て@握部。
21は量子化部、23は復号化部である。
分析部19により音声分析をして得られた複数の分析係
数に1〜に1+は、量子化部21により別々に量子化後
、符号化部7により符号化され、少なくともピッチ周期
Tを含む音源情報と共に一定のビットレートで伝送路へ
送出され、受信側では復号化部8.23により復号化し
た分析係数及び音源情報に基づいて、もとの音声スペク
トルを合成復元する。
このような音声分析合成方式において、送信部ではビッ
ト割り当て制御部20とmft部21とが設けられ、ま
た受信部ではビット割り当て制御部22と復号化部23
とが設けられ、各々ピッチ周期に応じて量子化ビット数
の割り当てが選択された分析係数を得る。
〔作用〕
量子化部6より取り出された入力音声のピッチ周W4T
に関する信号は符号化部7に供給される一方、ビット割
り当てviw部20に供給される。
ビツト割り当てllltl部20は量子化部6よりの量
子化されたピッチ周期■の入力情報に基づき、量子化部
21で量子化される分析部19よりのn個の分析係数に
1〜kI+の量子化ビット数の割り当てを、ピッチ周期
■が長いとき(低ピツチのとき)は短いとき(高ピツチ
のとき)に比べ低次の係数の量子化ビット数の割り当て
を少なくし、高次の係数の量子化ビット数の割り当てを
多くする制御を行なう。
mft部21によりピッチ周期Tの長短に応じた量子化
ビット数の割り当てで量子化された分析係数は、符号化
部7に並列に供給される。
また、受信側にもビット割り当て@開部22と復号化1
s23が設けられ、送信部と同様に、ピッチ周期Tの長
短に応じて量子化ビット数が選択されたnilの分析係
数に、t〜に1′がga号化部23より取り出される。
このようにして、話者のピッチに最も適合した量子化ビ
ット数の割り当てで、所要の個数n個の分析係数が量子
化され、また復号して取り出すことができる。
なお、分析部19としてPARCOR係数の他にも、線
形予測分析による係数(LPG方式の係数)その他の係
数を得るような音声分析合成方式に本発明を適用するこ
とができる。
(実施例〕 第2図は本発明の一実施例のブロック図を示す。
同図中、第1図、第4図と同一構成部分には同一符号を
付し、その説明を省略する。第2図において、ビット割
り当て制御部20は、所定のしきい値(例えば2001
S )と量子化部6よりのピッチ周期Tのデータとを比
較する比較部25と、比較部25の出力を計数する計数
部26とからなる。
また、量子化121は高ピツチ(ピッチ周期が短い)用
の第1の量子化部27.低ピツチ(ピッチ周期が長い)
用の第2のm子化部28及びそれらの出力係数の一方を
選択出力するセレクタ29とからなる。
また、受信部のビット割り当て關握部22は、送信部の
ビット割り当て制御部20と同様に、比較部30及び計
数部31よりなる。更に、復号化部23は第1の復号化
1!132.第2の復号化部33及びセレクタ34より
なる。
次に上記の構成の動作について説明するに、PARCO
R分析部3より並列に取り出されたn1l(例えばn−
10)のPARCOR係数に1〜に1は量子化部27及
び28に夫々供給され、ここで所定割り当ての量子化ビ
ット数で量子化される。
一例として、n=10.フレーム周期15m5で、1フ
レーム72ビツトのうち58ビツトが8子化及び符号化
されたPARCOR係数kl −k toの全ビット数
で、ピッチ周期T及び振幅Aの各情報ビット数が各々6
ビツト、有声/無声V/uVの情報及び同期ビットが各
々1ビツトで伝送されるビットレート4800bpsの
場合を例にとると、高ピツチ用の量子化部27における
入力P′ARCOR係数に1〜k1mに対する」ftビ
ット数の割り当ては第3図に高ピツチの欄で示され、低
次のPARCOR係数はど量子化ビット数が多く特に最
も低次のPACOR係数に+は量子化ビット数13ビッ
トと、かなり多く割り当てられている。
一方、低ピツチ用の量子化部28における入力PARC
OR係数に+〜に+・に対する量子化ビット数の割り当
ては、第3図に低ピツチの欄で示され、低次のPARC
OR係数はど量子化ビット数の割り当てが多い点は高ピ
ツチ用と変らないが、低次のPARCOR係数の量子化
ビット数の割り当ては少なく、5次以上の高次のPAR
COR係数に5〜に1・の量子化ビット数が5ビツトと
比較的多く割り当てられており、低次と高次のPARC
OR係数聞での割り当て量子化ピット数にそれほど差が
ない点が高ピツチ用と異なる。
また、人力音声信号のピッチ周期Tが成るしきい値(こ
こでは20013 )よりも長い低ピツチか、そのしき
い値よりも短い高ピツチかが比較部25で比較され、更
に同じ比較部!L’f)t一定数以上連続するかどうか
が計数部26で判別される。
高ピツチの比較結果が一定数以上連続する場合は、計数
部26の出力信号によりセレクタ29が量子化部27の
出力PARCOR係数を選択出力するよう制御され、逆
に低ピツチの比較結果が一定数以上連続する場合は、セ
レクタ29が量子化部28の出力PARCOR係数を選
択出力するよう制御される。セレクタ29の出力PAR
COR係数は符号化部7へ出力される。
一方、受信部においては、送信部と同様に、比較部30
よりの比較結果が高ピツチであり、それが一定数以上連
続する場合は、計数部31の出力信号によりセレクタ3
4が高ピツチ用復号化部32よりの復号化されたPAR
COR係数に1′〜kTl′を選択出力するよう制御さ
れ、逆に低ピツチの比較結果が一定数以上連続する場合
は、セレクタ34が低ピツチ用復号化部33よりの復号
化されたPARCOR係数に1′〜に1′を選択出力す
るよう制御される。
セレクタ34の出力PARCOR係数に1′〜に、、’
は合成フィルタ14にそのフィルタ特性制御信号として
印加される。このようにして、受信部も送信部と同様に
、復号化したピッチ周期T′の長短に応じて復号化部3
2及台33の出力PARCOR係数に1′〜に1′の一
方を選択出力する。これにより、出力端子16には音声
スペクトルの復元されたもとのアナログ音声信号が、従
来より高品質で得られる。本買施例によれば、ピッチ周
W4Tに応じたPARCOR係数の原子化ビット数の割
り当ての切換えは、音源情報として本来必要なピッチ周
期の情報を利用して行なっているので、新たな切換え用
補助情報は不要で、ビットレートを増加させることはな
い。
なお、本発明は上記の実施例に限定されるものではなく
、例えば高ピツチ用PARCOR係数と低ピッチ用PA
RCOR係数の量子化ビット数の割り当ては音質が最適
になるよう経験則に基づいて第3図に示した値について
説明したが、これに限定されるものではなく、またピッ
チ周期は高ピツチと低ピツチの2つだけでなく、より細
かく分け、それらについて量子化ビット数の割り当ての
選定を行なうことも可能である。
更に、本発明はPARCOR分析合成方式だけでなく、
ピッチ周期を音源情報とし、音声分析をして得た複数の
分析係数を別々に通子化後符号化して送受信するすべて
の音声分析合成方式に適用できるものである。
〔発明の効果〕
上述の如く、本発明によれば、話者のピッチに最も適合
した量子化ピット数の割り当てで、所要の個数nlの分
析係数の茄子化が行なわれるので、従来の音声分析合成
方式に比し、復号化された音声信号の品質をより向上す
ることができ、また、分析係数の量子化ピット数の割り
当ての切換えは、従来よりもともと必要な音声情報とし
て送受信しているピッチ周期情報を利用しているから、
上記切換えのために新たな補助情報は不要であり、従来
と同等のビットレートを確保することができる等の特長
を有するものである。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例のブロック図、第3図は本発
明の分析係数の量子化ピット数の割り当ての一実施例を
示す図、 第4図は従来の一例のブロック図、 第5図は従来の分析係数の母子化ビット数の割り当ての
一例を示す図である。 図において、 1はアナログ音声信号入力端子、 2はA/D変換器、 4は相関部、 8.23は復号化部、 14は合成フィルタ、 15はD/A変換器、 16はアナログ音声信号出力端子、 19は分析部、 20.22はビット割り当て制御部、 21.27.28はm子化部、 23.32,33は復号化部、 29.34はセレクタである。 j′ 代理人 弁理士 井 桁 貞、−,1,,1,:、・1
、一一−−−′ 松通罰− 参発蛸の原理ブ′ローI2用 第1図 本類−不炊めヒ帰拳1り台1の一爽施々りの司第:1図 す!ψ4+□宵 傘ヒ軟り慴漣(めピッ)lII++*rの一一呵の回第
5図

Claims (1)

  1. 【特許請求の範囲】 音声分析をして得られた複数の分析係数を別々に量子化
    した後符号化して、少なくともピッチ周期を含む音源情
    報と共に一定のビットレートで伝送し、受信側で復号化
    した分析係数及び音源情報に基づいてもとの音声スペク
    トルを合成復元する音声分析合成方式において、 量子化された該複数の分析係数の各々の量子化ビット数
    の割り当てを、前記ピッチ周期が長いときは短いときに
    比べて低次の分析係数の量子化ビット数の割り当てを少
    なくし、かつ、高次の分析係数の量子化ビット数の割り
    当てを多くするよう該ピッチ周期の長短に応じて該分析
    係数の夫々の量子化ビット数の割り当てを可変選択する
    手段(20、21、22、23)を設けたことを特徴と
    する音声分析合成方式。
JP62025184A 1987-02-05 1987-02-05 音声分析合成方式 Pending JPS63192099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62025184A JPS63192099A (ja) 1987-02-05 1987-02-05 音声分析合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62025184A JPS63192099A (ja) 1987-02-05 1987-02-05 音声分析合成方式

Publications (1)

Publication Number Publication Date
JPS63192099A true JPS63192099A (ja) 1988-08-09

Family

ID=12158901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62025184A Pending JPS63192099A (ja) 1987-02-05 1987-02-05 音声分析合成方式

Country Status (1)

Country Link
JP (1) JPS63192099A (ja)

Similar Documents

Publication Publication Date Title
KR100242864B1 (ko) 디지탈 신호 부호화 장치 및 방법
RU2144261C1 (ru) Передающая система на принципах различного кодирования
JPH0748697B2 (ja) 信号のディジタル・ブロック・コ−ド化方法
JPS62234435A (ja) 符号化音声の復号化方式
JP2002328699A (ja) 符号化装置および復号化装置
US5826221A (en) Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values
JPH11259100A (ja) 励起ベクトルの符号化方法
JP3144009B2 (ja) 音声符号復号化装置
Zelinski et al. Approaches to adaptive transform speech coding at low bit rates
US5299281A (en) Method and apparatus for converting a digital speech signal into linear prediction coding parameters and control code signals and retrieving the digital speech signal therefrom
JP2858122B2 (ja) デジタル適応変換符号化方法
JPS63192099A (ja) 音声分析合成方式
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
US5875424A (en) Encoding system and decoding system for audio signals including pulse quantization
JPH02146100A (ja) 音声符号化・復号化装置
US5761633A (en) Method of encoding and decoding speech signals
JP2621275B2 (ja) 音声符号化速度変換装置
JPH09190198A (ja) 狭い帯域幅チャネルで音声を送信する方法、狭い帯域幅チャネルからデジタル化された音声を受信する方法、および狭い帯域幅チャネルで音声を送信する装置
JP3041325B1 (ja) 音声符号化装置及び音声復号化装置
JPH11145846A (ja) 信号圧縮伸張装置及び方法
JPH0414813B2 (ja)
JPS62271000A (ja) 音声の符号化方法
JP2754567B2 (ja) マルチパルス位置量子化装置
JP3235365B2 (ja) 高能率符号化方法及びその装置
JPS60200298A (ja) 適応型符号化装置