JP2848610B2 - 音声分析合成装置 - Google Patents

音声分析合成装置

Info

Publication number
JP2848610B2
JP2848610B2 JP63169373A JP16937388A JP2848610B2 JP 2848610 B2 JP2848610 B2 JP 2848610B2 JP 63169373 A JP63169373 A JP 63169373A JP 16937388 A JP16937388 A JP 16937388A JP 2848610 B2 JP2848610 B2 JP 2848610B2
Authority
JP
Japan
Prior art keywords
unit
speech
waveform
adpcm
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63169373A
Other languages
English (en)
Other versions
JPH0219900A (ja
Inventor
一行 鷲見
修一 河間
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP63169373A priority Critical patent/JP2848610B2/ja
Publication of JPH0219900A publication Critical patent/JPH0219900A/ja
Application granted granted Critical
Publication of JP2848610B2 publication Critical patent/JP2848610B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、入力された音声を分析/符号化してメモ
リ素子等に記録された符号データを、LSI(大規模集積
回路)等を用いて復号する音声分析合成装置に関する。
〈従来の技術〉 従来より、音声波形の符号化および復号化には情報量
の圧縮効率の高い適応量子化方式(例えば、適応差分パ
ルス符号化変調(ADPCM),適応デルタ変調(ADM)およ
び適応パルス符号化変調(APCM)等)がよく用いられて
いる。この適応量子化方式は量子化の幅を入力信号のレ
ベルに応じて適応的に変化する方式である。
〈発明が解決しようとする課題〉 このように、適応量子化方式は入力信号のレベルに応
じて適応的に量子化の幅を変えることができる。しかし
ながら、上記適応量子化方式は、符号化時において立ち
上がりが急峻な入力波形が入力された場合には速やかに
適応することができず、傾斜過負荷歪み(以下、オーバ
ーロード歪みと言う)が発生する。第2図は適応量子化
器にステップ波形を入力したときの応答波形を示し、大
きなオーバーロード歪みが生じていることがわかる。
一般に音声は次のようにして発生される。すなわち、
声帯の急峻な開閉運動により音圧がインパルス的に発生
され、これが声道の共振特性によって音響的に色付けさ
れて音声波形となる。このため、通常音声波形は第3図
に示すように立ち上がりが急峻な減衰波形となることが
多い。したがって、このような立ち上がりの急峻な音声
波形を上記適応量子化方式によって量子化すると、上述
のようにオーバーロード歪みを持つ波形として量子化さ
れてしまうという問題がある。
そこで、この発明の目的は、オーバーロード歪みを軽
減することができる音声分析合成装置を提供することに
ある。
〈課題を解決するための手段〉 上記目的を達成するため、請求項1に係る発明は、A/
D変換器,記憶部,音声分析手段,符号データ格納部,
音声合成手段,D/A変換器からなる音声分析合成装置にお
いて、A/D変換器は,入力される音声信号をA/D変換して
サンプルデータを出力し、記憶部は,A/D変換器のサンプ
ルデータを記憶し、音声分析手段は,記憶部の最後に記
憶されたサンプルデータから最初に記憶されたサンプル
データに向かって逆向きに読み出して適応量子化する量
子化部と,量子化部の出力を符号化し符号データを出力
する符号化部を備え、符号データ格納部は,音声分析手
段の符号データを格納し、音声合成手段は,符号データ
格納部の最後に格納した符号データから最初に格納した
符号データに向かって逆向きに読み出して復号化しディ
ジタル合成音声を出力し、D/A変換器は,ディジタル合
成音声をA/D変換することを特徴としている。
〈作用〉 音声信号が入力されると、この入力された音声信号は
A/D変換器によってサンプリングされてA/D変換され、得
られたサンプルデータが記憶部に記憶される。そして、
この記憶部に記憶されたサンプルデータは、音声分析手
段の量子化部によって、最後に記憶されたサンプルデー
タから最初に記憶されたサンプルデータに向かって逆向
きに読み出されて適応量子化され、得られた量子化デー
タは符号化部によって符号化される。こうして得られた
符号データは符号データ格納部に格納される。一方、こ
の符号データ格納部に格納された符号データは、音声合
成手段によって、最後に格納された符号データから最初
に格納された符号データに向かって逆向きに読み出され
て復号化される。
したがって、立ち上がりが急峻な減衰波形である音声
波形を逆向きに分析/符号化することができ、そのため
に上記音声分析手段は立ち上がりの緩やかな音声波形を
分析/符号化することができる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明す
る。
第1図はこの発明の音声分析合成装置のブロック図で
ある。以下、第1図にしたがって適応量子化方式として
ADPCM方式を用いた場合について説明する。
第3図に示すように、一般に音声波形は立ち上がりが
急峻な減衰波形を有している。したがって、このような
音声波形を時間方向と逆向きに見れば、第4図に示すよ
うに立ち上がりが緩やかな波形となる。そこで、この発
明は、入力された音声波形を時間方向と逆向きに分析す
る(すなわち、立ち上がりの緩やかな方向に分析する)
ことによって、オーバーロード歪みを軽減するのであ
る。
入力音声波形はA/D変換器1によってディジタル値に
変換され、記憶装置2に一旦記録される。次に、記憶装
置2に記憶されたディジタル音声データは時間方向と逆
向きに読み出されて、すなわち記憶装置2に記憶された
一番最後のサンプリングデータから読み出されて上記音
声分析手段としてADPCM符号化器3によって符号化され
る。このようにして、ディジタル音声データを時間方向
と逆向きに符号化して得られたADPCM符号データは、上
記符号データ格納部としてのROM(リードオンメモリ)
4等の半導体メモリに書き込まれる。ここまでの処理は
パソコン等で処理することが可能である。
上述のようにしてADPCM符号データが書き込まれたROM
4は別の小型音声合成装置にセットされる。そして、こ
の小型音声合成装置の上記音声合成手段としてのADPCM
復号化器5によってROM4内のADPCM符号データが読み出
され、復号化されて元のディジタル音声データに戻され
る。そしてさらに、D/A変換器6によって合成音声波形
が得られる。
ここで、ROM4内のADPCM符号データを復号する際に、
上述の符号化方向とは時間的に逆の方向に復号化すれ
ば、復号化されてD/A変換された後の合成音声波形の時
間的方向と入力音声波形の時間的方向とは同じになる。
したがって、合成音声波形は入力音声波形と同じ時間方
向に出力されるのである。
このように、入力音声の符号化時には、記憶装置2よ
りディジタル音声データを最後に記憶されたサンプリン
グデータから読み出し、ADPCM符号化器3によって通常
のADPCM符号化を行う。このADPCM符号化器3は具体的に
は第5図に示すようなADPCM符号化回路である。このADP
CM符号化回路は、適応量子化部11,符号化部12,符号化側
論理部13,加算器15,加算器16および符号化側固定一次予
測部14から構成される。このADPCM符号化回路はパソコ
ン等で構成することができる。
また、符号データの復号化時には、入力音声波形を時
間的に逆向きに符号化してROM4に書き込まれた符号デー
タを、最後に書き込まれた符号データから読み出してAD
PCM復号化器5で復号化する。このADPCM復号化器5は具
体的には第6図に示すようなADPCM復号化回路である。
このADPCM復号化回路は、復号化部21,復号化側論理部2
2,復号化側固定一次予測部23および加算器24から構成さ
れる。
次に、ADPCM符号化およびADPCM復号化について詳細に
説明する。
第7図はADPCM符号化時におけるADPCM分析を示す。現
在の入力波形に対する を差し引いた を符号化器12によって符号化して符号Cnを得る。そし
て、この符号CnのADPCM符号データをROM4に記憶する。
このとき、この発明において、上述のようにA/D変換器
1でA/D変換された音声波形の最後のサンプルデータか
ら時間的に逆方向に向かって順次ADPCM分析を行うもの
である。したがって、A/D変換された最初のサンプルデ
ータが一番最後に分析されることになる。この最後の分
析における最初のサンプルデータに対する また、この を決定したときの適応量子化幅をΔsとし、 を符号化部12によって符号化して得られた符号をCsとす
る。
上記ROM4の内部には、第8図に示すように符号化器12
によって得られた符号C0,C1,…,Cn,…,Csを記憶する。
また、最後には、復号する際の初期値として適応量子化
値Δsおよび を記憶する。この場合、ROM4に記憶された符号の順序
は、C0の方が語尾でありCsの方が語頭に相当する。
復号化時には、入力音声波形の語頭より合成するた
め、上述の復号化時とは逆に符号Csから順に復号化す
る。その際に、初期データΔsおよび が必要であるが、これらのデータはROM4から最初に読み
出すことができる。したがって、ROM4から初期データΔ
s、 およびCsを読み出して波形の すなわち、合成波高値)をADPCM復号化器5によって次
のようにして算出する。
すなわち、最初の合成波高値はROM4に最後に記憶され
であり、この値 をそのままADPCM復号化器5により出力してD/A変換器6
に入力する。
は次のように求める。まず、ROM4に記憶されている適応
量子化幅の初期値Δsと最初の符号データCsより を求める。そして、 を差し引いた値が次の である。
以降の波高値は次のようにして求める。まず、適応量子
化幅Δnを下記(1)式によって求め、この適応量子化
幅Δnを用いて を(2)式によって求め、次に1つ前のサンプルデータ
からの とから(3)式によって を算出する。このようにして、順次nの大きいほうから
(すなわち、A/D変換器1に入力された時間方向に) を算出し、D/A変換器6に入力する。
ここで、M-1(Cn+1)は適応量子化幅Δn+1を符号Cn+1
に基づいて更新するための係数であり、(1)式のよう
にこのM-1(Cn+1)に適応量子化幅Δn+1を乗ずることに
よって次の適応量子化幅Δnを算出できる。この計算は
復号化側論理部22によって行われる。
また、D(Cn)は符号Cnから復号化される量子化値で
あり、(2)式のように量子化値D(Cn)に単位幅であ
る適応量子化幅Δnを乗ずることにより を求めることができる。
第9図は計算機シュミレーションによって求めた合成
音声波形を示す。第9図(a)は原音の音声波形であ
る。
第9図(b)は、第9図(a)の音声波形を示す原音
を、時間軸の順方向に(すなわち、図中左から右へ)通
常のADPCM符号化およびADPCM復号化を行って得られた合
成音声波形である。図から明らかなように、第9図
(a)の原音音声波形に見られる急峻な立ち上がり部分
は、点線によって示すようにオーバーロード歪みとなっ
て欠けてしまっている。第9図(d)は、第9図(a)
の原音音声波形に対する第9図(b)の合成音声波形の
誤差波形を示す。この誤差波形によって分かるように、
原音音声波形と合成音声波形との誤差は原音音声波形の
急峻な立ち上がり部で最も大きい。
第9図(c)は、第9図(a)の音声波形を示す原音
を、本実施例の音声分析合成装置によって入力音声の時
間軸の逆方向にADPCM符号化を行い、入力音声の時間軸
の順方向にADPCM復号化を行って得られた合成音声波形
である。図から明らかなように、原音音声波形の急峻な
立ち上がり部分が忠実に再生されている。また、第9図
(e)の誤差波形においても、原音音声波形の急峻な立
ち上がり部における誤差も少なく、本実施例における効
果が実証された。
本実施例の音声分析合成装置によるADPCM方式(以
下、逆方向ADPCM方式と言う)と、従来のADPCM方式(以
下、順方向ADPCM方式と言う)によって、音声を分析し
て合成した場合のセグメンタルSN比(以下、SNRsegと言
う)を第1表に示す。いずれも符号のビット長は3ビッ
トである。男声による2つの文章と女性による2つの文
章とについて、順方向ADPCM方式と逆方向ADPCM方式によ
って音声分析合成を行っ た。その結果、表から明らかなようにすべてにおいて逆
方向ADPCM方式の方が順方向ADPCM方式を上回るSNRseg値
を示し、平均値において2.19dB上回った値を示した。し
たがって、逆方向ADPCM方式は量子化誤差が少なく優れ
た音声分析合成方式であるといことができる。
このように、この発明の音声分析合成装置によって音
声を符号化する場合には、入力音声信号をA/D変換した
後のディジタル音声データを時間方向と逆向きに符号化
するので、立ち上がりの緩やかな入力音声波形を符号化
することができ、オーバーロード歪みの少ないSNRsegの
良い合成音声を得ることができる。
上記実施例においては、適応量子化方式としてADPCM
方式を用いたが、この発明はこれに限定されるものでは
なく、ADM方式およびAPCM方式等を用いてもよい。
〈発明の効果〉 以上より明らかなように、請求項1に係る発明の音声
分析合成装置は、記憶部と、量子化部および符号化部を
有する音声分析手段と、符号データ格納部と、音声合成
手段を備えて、上記記憶部に記憶されたサンプルデータ
を、最後に記憶されたサンプルデータから最初に記憶さ
れたサンプルデータに向かって逆向きに読み出して適応
量子化および符号化を行い、得られた符号データを上記
符号データ格納部に格納し、最後に格納された符号デー
タから最初に格納された符号データから最初の符号化に
よる符号データに向かって逆向きに読み出して復号化す
るようにしたので、立ち上がりの急峻な減衰波形である
音声波形を時間方向と逆向きに(すなわち、立ち上がり
の緩やかな方向に)分析/符号化することができる。し
たがって、この発明によれば、従来のADPCM方式と同じ
情報量で、オーバーロード歪みが少なくSNRsegの良い合
成音声を得ることができる。
【図面の簡単な説明】
第1図はこの発明の音声分析合成装置のブロック図、第
2図はオーバーロード歪みの説明図、第3図は音声波形
をADPCM分析合成したときに現れるオーバーロード歪み
の説明図、第4図は音声波形を時間方向と逆向きに行う
ADPCM分析の説明図、第5図はADPCM符号化回路のブロッ
ク図、第6図はADPCM復号化回路のブロック図、第7図
は逆方向ADPCM方式による音声分析の説明図、第8図は
第1図におけるROMに記憶されたデータの内容を示す
図、第9図はシュミレーションによる順方向ADPCM方式
および逆方向ADPCM方式の合成波形と誤差波形を示す図
である。 1……A/D変換器、2……記憶装置、3……ADPCM符号化
器、4……ROM、5……ADPCM復号化器、6……D/A変換
器、11……適応量子化部、12……符号化部、13……符号
化側論理部、14……符号化側固定一次予測部、15,16,24
……加算器、21……復号化部、22……復号化側論理部、
23……復号化側固定一次予測部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭59−104699(JP,A) 特開 昭63−18727(JP,A) 特開 昭61−109099(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 9/18 H03M 7/34,7/38

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】A/D変換器(1)、記憶部(2)、音声分
    析手段(3)、符号データ格納部(4)、音声合成手段
    (5)、D/A変換器(6)からなる音声分析合成装置に
    おいて、 A/D変換器(1)は、入力される音声信号をA/D変換して
    サンプルデータを出力し、 記憶部(2)は、A/D変換器(1)のサンプルデータを
    記憶し、 音声分析手段(3)は、記憶部(2)の最後に記憶され
    たサンプルデータから最初に記憶されたサンプルデータ
    に向かって逆向きに読み出して適応量子化する量子化部
    (11)と、量子化部(11)の出力を符号化し符号データ
    を出力する符号化部(12)を備え、 符号データ格納部(4)は、音声分析手段(3)の符号
    データを格納し、 音声合成手段(5)は、符号データ格納部(4)の最後
    に格納した符号データから最初に格納した符号データに
    向かって逆向きに読み出して復号化しディジタル合成音
    声を出力し、 D/A変換器(6)は、ディジタル合成音声をA/D変換する 音声分析合成装置。
JP63169373A 1988-07-07 1988-07-07 音声分析合成装置 Expired - Fee Related JP2848610B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63169373A JP2848610B2 (ja) 1988-07-07 1988-07-07 音声分析合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63169373A JP2848610B2 (ja) 1988-07-07 1988-07-07 音声分析合成装置

Publications (2)

Publication Number Publication Date
JPH0219900A JPH0219900A (ja) 1990-01-23
JP2848610B2 true JP2848610B2 (ja) 1999-01-20

Family

ID=15885391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63169373A Expired - Fee Related JP2848610B2 (ja) 1988-07-07 1988-07-07 音声分析合成装置

Country Status (1)

Country Link
JP (1) JP2848610B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4470122B2 (ja) * 2007-06-18 2010-06-02 株式会社アクセル 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム

Also Published As

Publication number Publication date
JPH0219900A (ja) 1990-01-23

Similar Documents

Publication Publication Date Title
KR100272477B1 (ko) 코드여진선형 예측부호화기 및 복호기
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
CA2179194A1 (en) System and method for performing voice compression
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
JP3339335B2 (ja) 圧縮符号化復号方式
US5673364A (en) System and method for compression and decompression of audio signals
JP2848610B2 (ja) 音声分析合成装置
WO1998037636A1 (fr) Procede de codage de signaux vocaux
JPH07199996A (ja) 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置
JP3237178B2 (ja) 符号化方法及び復号化方法
KR101038446B1 (ko) 오디오 코딩
JP3227929B2 (ja) 音声符号化装置およびその符号化信号の復号化装置
JPS5875341A (ja) 差分によるデ−タ圧縮装置
WO2004112256A1 (ja) 音声符号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3803306B2 (ja) 音響信号符号化方法、符号化器及びそのプログラム
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP2905215B2 (ja) 録音再生装置
JPH05303399A (ja) 音声時間軸圧縮伸長装置
JPS59104699A (ja) 音声合成器
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPH0833742B2 (ja) 音声合成方式
JP2637965B2 (ja) 音声符号化復号化方法とその装置
JPS5914760B2 (ja) Adpcm再生器
JP2003323200A (ja) 音声符号化のための線形予測係数の勾配降下最適化

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees