JPH0294832A - 音声符号化および復号化システム - Google Patents

音声符号化および復号化システム

Info

Publication number
JPH0294832A
JPH0294832A JP24454388A JP24454388A JPH0294832A JP H0294832 A JPH0294832 A JP H0294832A JP 24454388 A JP24454388 A JP 24454388A JP 24454388 A JP24454388 A JP 24454388A JP H0294832 A JPH0294832 A JP H0294832A
Authority
JP
Japan
Prior art keywords
signal
voiced
unvoiced
sound
time axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24454388A
Other languages
English (en)
Inventor
Hidehira Iseda
衡平 伊勢田
Yoshihiro Tomita
吉弘 富田
Shigeyuki Umigami
重之 海上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP24454388A priority Critical patent/JPH0294832A/ja
Publication of JPH0294832A publication Critical patent/JPH0294832A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (概 要〕 電話音声などの音声信号を高能率で符号化して伝送し、
復号する音声符号化および復号化システムに関し、 特に、時間領域調波圧縮・伸長方式(TDIIS)によ
る音声符号化・復号化において、無声音の符号化および
復号化の品質を向上させることを目的とし送信側におい
て、音声入力信号が無声音のときはそのまま音声入力信
号を通過させ、有声音のときは音声入力信号を時間軸圧
縮処理し、受信側において、無声音のときは復号した信
号をそのまま出力し、有声音のときは該複合化信号を時
間軸伸長処理するように構成する。
〔産業上の利用分野〕
本発明は、音声符号化および復号化システムに関するも
のであり、特に、時間領域調波圧縮・伸長方式(TDH
5)による音声符号化および復号化を行う場合、無声音
の符号化および復号化の品質を向上させることを目的と
した音声符号化および復号化システムに関する。
近年のディジタル回線の普及に伴い、その回線の有効な
利用を図るため、音声信号を高い品質を維持しつつ高能
率に情報量圧縮を行う、音声信号圧縮技術が種々提案さ
れている。そのなかで、音声信号の時間的周期性(ピッ
チ周期)を利用して、送信側では、特性のよく似た数周
器の信号を適切な重みを掛は合わせて1周期の信号に圧
縮して符号化し、再生側では、圧縮されたその信号の前
後の関係を考慮しながら圧縮とは逆の伸長を行う、「時
間領域調波(軸)圧縮および伸長方式(TDH3:Ti
me Domain llarmonic Scali
ng)が知られている。
一方、将来の多種多様な通信サービスを効率的に実現す
る伝送手段として、情報源のバースト性を利用して、情
報量の時間的変動に応じて符号化ビットレートを変化さ
せる方式が知られている。
〔従来の技術〕
上記TDOSを第6図および第7図(A)、 (B)を
参照して述べる。
第6図において、ピッチ周期抽出部(P ITCH) 
502が音声入力信号SINのピッチ周期を抽出し、時
間軸圧縮部(TDHC:Time Domain Ha
rmonic Compression)501がその
抽出されたピッチ周期に応じて音声入力信号SINの時
間軸方向を圧縮する。符号化部(ENCODER) 5
03は圧縮された信号を任意の符号化方式、例えば、A
DPCM方式で符号化する。この圧縮され符号化された
信号は、伝送路504を介して受信側の復号化部(DE
CODER) 505において復号され、再生信号とな
る。この再生信号は時間軸伸長部(TDIIE:Tim
e Domain Harmonic Expansi
on)506において、上記ピッチ周期抽出部502で
抽出されたピッチ周期に基づいて、上記圧縮とは逆の時
間軸伸長が施される。
第7図(A)は、送信側における時間軸圧縮処理を示す
図であり、周期性のある2ピツチの音声信号を1ピツチ
に圧縮した場合を示す。すなわら、前の周期の信号には
重み窓W(m)を掛け、後の周期の信号には前とは逆の
重み窓(1−W(m))を掛け、それぞれを加算して、
1つの信号として時間軸を圧縮している。
一方、第7図(B)は、受信側の時間軸伸長処理を示す
図であり、3周期分の圧縮再生信号のうち、前の2周期
分の信号に重み窓(1−W (rn))を掛け、後の2
周期分の信号に重み窓W (m)を掛けたものを加算し
て、もとの2周期分の信号に時間軸を伸長している。
〔発明が解決しようとする課題〕
上記TDH5では、周期性のない無声音についても、周
期性のある有声音と同様に時間軸の圧縮および時間軸の
伸長を行っている。その結果として、無声音に対して、
正しい符号化および復号、再生処理が行われず、再生音
声の品質が劣化するという問題がある。
また、上記T D II Sにおいては、常に、固定の
ビットレートで信号伝送を行っており、情報源が発生す
る情報量の時間変動に応じた適切な符号化ビットレート
で信号の伝送が行われていないという問題がある。
本発明は、音声信号の特性を利用して符号化ビットレー
トを変化させるとともに、周期性のない無音声信号の再
生音声品質を向上させることを目的とする。
〔課題を解決するための手段〕
本発明の音声符号化および復号化システムは、第1図に
その原理ブロックを示すように、音声信号符号化手段1
00と、伝送路200と、音声信号再生手段300とか
ら構成される。
音声信号符号化手段100は、音声入力信号srNが有
声音であるか無声音であるかを判別し有声・無声判別信
号5JUDGEを出力するとともに、有声音の場合はさ
らにその音声入力信号のピッチ周期を検出してピッチ周
期信号5P11’CI+を出力する周期抽出および有声
・無声判定手段2と、該有声・無声判別信号に応答して
、該音声入力信号が無声音のときはそのまま該音声入力
信号を通過させ、有声音のときは該周期信号に基づいて
該音声入力信号を時間軸圧縮処理する時間軸圧縮手段1
と、該時間軸圧縮手段の出力信号を符号化する符号化手
段3とを有する。
音声信号再生手段300は、伝送路200を介して該ピ
ッチ周期信号、該有声・無声判別信号および該符号化信
号を受信し該符号化信号を再生するものであり、該受信
符号化信号を復号する復号化手段6と、該有声・無声判
別信号に応答し、無声音のときは該復号された信号をそ
のまま出力し、有声音のときは該ピッチ周期信号に基づ
いて該復号化信号を時間軸伸長処理する時間軸伸長手段
7とを有する。
好適には、該時間軸伸長手段は、無声音から有声音への
変化時に該有声音の時間軸伸長処理に該有声音の前の無
声音を含ませないように構成される。
なお、符号化手段3で符号化された信号を多重化する多
重化手段4、および、多重化信号を分離する多重分離手
段5を、伝送路2000前後に設ける。
〔作 用〕
ピッチ周期抽出および有声・無声判定手段2は、音声入
力信号SINを、自己相関法、共分散法などを用いて有
声音か無声音を判別し、有声音の場合、「高」レベルの
有声・無声判別信号5JUDGEを出力し、無声音の場
合「低」レベルの有声・無声判別信号5JIIDGEを
出力する。ピッチ周期抽出および有声・無声判別手段2
は、有声音と判別した場合、更に、その音声入力信号S
INのピッチ周期を抽出し、ピッチ周期信号5PTTC
11を出力する。
時間軸圧縮手段1は、上記音声判別信号5JLICDH
が「低」レベルの場合、即ち1.音声入力信号srNが
無声音の場合は、時間軸圧縮処理を行わず、音声入力信
号SINをそのまま出力する。一方、有声・無声判別信
号5JUDGBが「高」レベルの場合、即ち、音声入力
信号SINが有声音の場合は、時間軸圧縮手段1は、音
声入力信号SINについてピッチ周期信号で示されたピ
ッチ周期で時間軸圧縮(TOIIC)処理を施す。T 
D II C処理のアルゴリズムを下記の式で示す。
圧縮された信号:5c Sc(i) = (1−Wc(i))XSIN(i)+
Wc(i)  X5IN(i+Pp)・・・ (1) 但、i=1.2.・・・、PP PP :ピッチ周期 Wc :圧縮用重み関数 SIN:音声入力信号 Wc(i)  =(S   (1/ 2))/ PP 
  ・・・ (2)上記T O11C処理を、時間軸を
1/2にした場合の例を、第2図に示す。
符号化手段3は、時間軸圧縮手段1からの圧縮されてい
ない無声音、または圧縮された有声音を符号化する。
符号化された音声信号Scは、伝送路200を介して復
号化手段6に印加され、復号される。
時間軸伸長手段7は、復号化信号を入力し、周期抽出お
よび有声・無声判定手段2からの有声・無声判別信号5
JUDGEが「低」レベルのときは、復号化信号をその
まま出力する。一方、有声・無声判別信号5JUDGE
が「高」レベルの場合は、下記のアルゴリズムに基づい
て、T 011 E処理を行う。
伸長された信号:Sア S 1(i) = (1’#t(j)) X S c(
j)+WE(J) X S C(J  Pp)j=1 
、2 、・・・、2xPp ・・・ (3) 但、WE :伸長用重み関数 W、(j)=  (j−(1/2))/ (2XPP)
j=1.2.・・・、2XPP ・・・ (4) T D II E処理は第3図に図示したように行われ
る。
以上の処理により、基本的に、無声音の品質は劣化せず
、有声音については、TDIISに基づく高能率符号化
伝送が行われる。
符号化手段3の信号は、多重化手段4を介して多重化さ
れて伝送路200に出力される。また、伝送路200か
らの多重化された符号化信号は、多重分離手段5により
1分離される。
ただし、第3図に示すように、TDIIE処理では、伸
長時に伸長するフレームの前後のフレームの信号を使用
するため、無声音から有声音に変化したとき、周期性の
ない無声音の信号を用いて伸長処理に使用することにな
る。このため、有声音の再生信号に品質の低下が生じる
ことがある。上記の品質の低下を防止するため、無声音
から有声音に切り替わる遷移時点においては、第4図に
示すように、前のフレームの信号を使用しないようにす
る。
無声音から有声音への遷移時点のT D II E処理
に用いる重み窓関数W’t(j)および伸長信号S’c
(j)を次に示す。
W’t(j) = 1 j=1.2.・・・、P。
w’E(j)=  (j−pp  −(1/2))/P
Pj=Pr +1 、・・・、2XPP S′バD  =Sc(j)XW’え(j)j=1  、
 2  、・・・、Pp ・・・ (7) S’E(j)  =  (I   W’E(j))%5
c(j)” W’ E(J)  X S c(j   
P l、)j=Pp+1.・・・、2xP。
・・・ (8) 以上の遷移処理を行うことにより、無声音から有声音へ
の遷移時点においても、品質の高い時間軸伸長が可能に
なる。
なお、有声音から無声音に切り替わる遷移時点において
は・無声音はバイパスされTDIIIE処理されないの
で上記問題は生じない。
〔実施例〕
本発明の実施例の音声符号化および復号化システムのブ
ロック図を第5図に示す。
同図において、音声信号符号化手段100内の時間軸圧
細手゛段1に対応する時間軸圧縮処理部10は、第1の
信号切替部11、無声音信号通過線12、第2の信号切
替部13、時間軸圧縮(TDIIC)処理部14が図示
のごと(接続されている。T OII C処理部14は
上記第(1)−(4)式で表した信号圧縮処理、より具
体的には2ピッチ周期の信号を1ピッチ周期の信号に時
間軸圧縮する処理を行う。周期抽出および有声・無声判
定手段2に対応するピッチ周期抽出有声・無声判定部2
0は音声入力信号SINが有声音か無声音かをフレーム
毎に判定し、有声音の場合「高」レベルの有声・無声判
別信号5JUDGBを出力し、無声音の場合「低」レベ
ルの有声・無声判別信号S、IUDGEを出力する。
更に、有声音の場合、そのピッチ周期を検出して1、ピ
ッチ周期信号5PTTCHを出力する。
音声入力信号SINは、電話の会話信号の場合、例えば
、8KIIzでサンプリングされている。上記有声・無
声の判別には、自己相関法、共分散法等が用いられる。
ピッチ周期抽出は、例えば、66fiz毎に行われる。
第1および第2の信号切替部11 、13は、有声・無
声判別信号5JUDGBが「低」レベルの場合、図示実
線のごとく、音声入力信号SINを無声音信号通過線1
2を通過させ、T D II C処理をバイパスする。
また、有声・無声判別信号5JUDGBが「高」レベル
の場合、信号切替部11 、13は図示破線のごとくな
り、音声入力信号SINをTDIIC処理部14で時間
軸圧縮させるようにする。
時間軸圧縮処理部10からの圧縮信号Scが、符号化手
段3に対応する符号化処理部30において、ADPCM
、サブバンド符号化法などの符号化処理が施される。
符号化処理された圧縮信号Scは、多重化手段4に対応
する多重化処理部40において、多重化されて、伝送路
200に送出される。
信号再生側の、多重分離手段5に対応する多重分離処理
部50は、伝送路200を介して受信された上記符号化
され多重化された信号を分離する。
分離された信号が、符号化手段6に対応する復号化処理
部60において、上記符号化処理部30の処理と逆の復
号処理が行われる。復号信号は、時間軸伸長手段7に対
応する時間軸伸長処理部70に印加される。
時間軸伸長処理部70は、第3の(δ号切替部71、無
声音信号通過線72、第4の信号切替部73、時間軸伸
長(TDIIB)処理部74、有声音切替処理部75、
無声音切替処理部76が図示のごとく接続されている。
信号切替部71 、73は、有声・無声判別信号5JU
DGEが「低」レベルの場合、位置aが選択されて復号
化信号がそのまま出力されるように制御される。音声判
別信号5JIIDGEが次の場合、信号切替部71 、
 T3はそれぞれ次の位置に選択されるように制御され
る。
イ、5JUDGEがm続シテ「高」レベル位置;b口、
5JUDGEが「低」レベルから「高」レベルに変化し
た時 位置二C ハ、5JUDGEが「高」レベルから「低」レベルに変
化した時 位置:d 信号切替部71 、73の位置がbの場合、復号化信号
が、TDHE処理部74において、上記第(3)(4)
式に基づいてT OII B処理が行われる。信号切替
部71゜73の位置がCの場合、復号化信号が、無声音
から有声音への遷移処理を行う有声音切替処理部75に
おいて、上記第(5)〜(8)式に基づいて遷移処理が
行われる。信号切替部71 、73の位置がdの場合は
、有声音から無声音への遷移処理を行う無声音切替処理
部76において、復号化信号が遷移処理される。上記処
理は、ピッチ周期信号5PITC)Iで示されるピッチ
周期に基づいて行われる。
上記実施例は、コンピュータを用いた信号処理、専用ハ
ードによる信号処理、その他の手段による信号処理で可
能である。
以上、電話の音声信号を例示して実施例を述べたが、本
発明は、周期性がありT OII S処理の適用が有効
な信号であるとともに、非周期性を有する信号が混在す
る他の種々の1δ号処理に適用可能であることはいうま
でもない。
〔発明の効果〕
以上に述べたように本発明によれば、周期性のない無声
音についてはTDI!S処理を行わずそのまま通過させ
るので、無声音の品質低下が防止できるという効果を奏
する。
特に、本発明は、無声音から有声音への変化時点におい
て、無声音が有声音へ及ぼす悪影容を回避しているので
、常に、有声音、無声音のいずれの品質を低下させずに
、高能率の符号化および復号化が実現できるという効果
を奏する。
【図面の簡単な説明】
第1図は本発明の音声符号化伝送システムの原理ブロッ
ク図、 第2図、第3図及び第4図は本発明の音声符号化伝送シ
ステムの動作を説明する図、 第5図は本発明の実施例の音声符号化伝送システムの回
路図、 第6図は従来の音声符号化伝送システムの構成図、 第7図(A)、 (B)は第6図の音声符号化伝送シス
テムの動作を説明する図、である。 (符号の説明) 1・・・時間軸圧縮手段、 2・・・ピッチ周期抽出および有声・無声判定手段、3
・・・符号化手段、     4・・・多重化手段、5
・・・多重分離手段、   6・・・復号化手段、7・
・・時間軸伸長手段、 IO・・・時間軸圧縮処理部、11 、13・・・信号
切替部、12・・・無声音信号通過線、14・・・TD
IIC処理部、20・・・ピッチ周期抽出有声・無声判
別部、30・・・符号化処理部、  40・・・多重化
処理部、50・・・多重分離処理部−160・・・符号
化処理部、・・・T OII E処理部、 ・・・無声音信号通過線、 ・・・時間軸伸長処理部、 ・・・有声音切替処理部、 ・・・無声音切替処理部。 71 、73・・・信号切替部、

Claims (1)

  1. 【特許請求の範囲】 1、音声入力信号(SIN)の無声音部と有声音部とを
    判別し有声・無声判別信号(SJUDGE)を出力する
    とともに、有声音と判別した時そのピッチ周期を検出し
    てピッチ周期信号(SPITCH)を出力する周期抽出
    および有声・無声判定手段(2)と、該有声・無声判別
    信号に応答して、該音声入力信号が無声音のときはその
    まま該音声入力信号を通過させ、有声音のときは該周期
    信号に基づいて該音声入力信号を時間軸圧縮処理する時
    間軸圧縮手段(1)と、該時間軸圧縮手段の出力信号を
    符号化する符号化手段(3)とを有する、音声信号符号
    化手段(100)と、 伝送路(200)と、 該伝送路を介して該ピッチ周期信号、該有声・無声判別
    信号および該符号化信号を受信し該符号化信号を再生す
    る音声信号再生手段(300)であって、該受信符号化
    信号を復号する復号化手段(6)と、該有声・無声判別
    信号に応答し、無声音のときは該復号された信号をその
    まま出力し、有声音のときは該ピッチ周期信号に基づい
    て該復号化信号を時間軸伸長処理する時間軸伸長手段(
    7)とを有したものと、 を具備する、音声符号化および復号化システム。 2、該時間軸伸長手段が、無声音から有声音への変化時
    に該有声音の時間軸伸長処理に該有声音の前の無声音を
    含ませないようにしたことを特徴とする、請求項1記載
    の音声符号化および復号化システム。
JP24454388A 1988-09-30 1988-09-30 音声符号化および復号化システム Pending JPH0294832A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24454388A JPH0294832A (ja) 1988-09-30 1988-09-30 音声符号化および復号化システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24454388A JPH0294832A (ja) 1988-09-30 1988-09-30 音声符号化および復号化システム

Publications (1)

Publication Number Publication Date
JPH0294832A true JPH0294832A (ja) 1990-04-05

Family

ID=17120263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24454388A Pending JPH0294832A (ja) 1988-09-30 1988-09-30 音声符号化および復号化システム

Country Status (1)

Country Link
JP (1) JPH0294832A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
WO2000019407A1 (en) * 1998-09-29 2000-04-06 Sanyo Electric Co., Ltd. Method and device of sampling pitch period of voice signal and device for time-axis compression/decompression of voice signal

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
WO2000019407A1 (en) * 1998-09-29 2000-04-06 Sanyo Electric Co., Ltd. Method and device of sampling pitch period of voice signal and device for time-axis compression/decompression of voice signal

Similar Documents

Publication Publication Date Title
US5774849A (en) Method and apparatus for generating frame voicing decisions of an incoming speech signal
EP0911807B1 (en) Sound synthesizing method and apparatus, and sound band expanding method and apparatus
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
JPH0944193A (ja) 通信システムにおける時間的障害回復のための装置
JP2005534950A (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
JPH0636158B2 (ja) 音声分析合成方法及び装置
JP2856185B2 (ja) 音声符号化復号化システム
US6029127A (en) Method and apparatus for compressing audio signals
JP3444131B2 (ja) 音声符号化及び復号装置
JPH09330097A (ja) 音声再生装置
JPH0294832A (ja) 音声符号化および復号化システム
JPH1049199A (ja) 無音圧縮音声符号化復号化装置
JPH0236628A (ja) 音声信号の送信方式及び送受信方式
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3475772B2 (ja) 音声符号化装置および音声復号装置
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JPH02146100A (ja) 音声符号化・復号化装置
US6134519A (en) Voice encoder for generating natural background noise
JPH0588697A (ja) 欠落音声補間方式
JP2744618B2 (ja) 音声符号化伝送装置、並びに音声符号化装置及び音声復号化装置
JP2002099299A (ja) 無音圧縮音声符号化復号化装置
JP2935213B2 (ja) 音声情報伝送方式
JPH0784597A (ja) 音声符号化装置および音声復号化装置
JPH0232397A (ja) 音声信号処理装置
JPH01261700A (ja) 音声符号化方式