JP2848610B2

JP2848610B2 - 音声分析合成装置

Info

Publication number: JP2848610B2
Application number: JP63169373A
Authority: JP
Inventors: 一行鷲見; 修一河間; 智一森尾
Original assignee: Consejo Superior de Investigaciones Cientificas CSIC
Current assignee: Consejo Superior de Investigaciones Cientificas CSIC
Priority date: 1988-07-07
Filing date: 1988-07-07
Publication date: 1999-01-20
Anticipated expiration: 2014-01-20
Also published as: JPH0219900A

Description

【発明の詳細な説明】〈産業上の利用分野〉この発明は、入力された音声を分析／符号化してメモ
リ素子等に記録された符号データを、LSI（大規模集積
回路）等を用いて復号する音声分析合成装置に関する。

〈従来の技術〉従来より、音声波形の符号化および復号化には情報量
の圧縮効率の高い適応量子化方式（例えば、適応差分パ
ルス符号化変調（ADPCM），適応デルタ変調（ADM）およ
び適応パルス符号化変調（APCM）等）がよく用いられて
いる。この適応量子化方式は量子化の幅を入力信号のレ
ベルに応じて適応的に変化する方式である。

〈発明が解決しようとする課題〉このように、適応量子化方式は入力信号のレベルに応
じて適応的に量子化の幅を変えることができる。しかし
ながら、上記適応量子化方式は、符号化時において立ち
上がりが急峻な入力波形が入力された場合には速やかに
適応することができず、傾斜過負荷歪み（以下、オーバ
ーロード歪みと言う）が発生する。第２図は適応量子化
器にステップ波形を入力したときの応答波形を示し、大
きなオーバーロード歪みが生じていることがわかる。

一般に音声は次のようにして発生される。すなわち、
声帯の急峻な開閉運動により音圧がインパルス的に発生
され、これが声道の共振特性によって音響的に色付けさ
れて音声波形となる。このため、通常音声波形は第３図
に示すように立ち上がりが急峻な減衰波形となることが
多い。したがって、このような立ち上がりの急峻な音声
波形を上記適応量子化方式によって量子化すると、上述
のようにオーバーロード歪みを持つ波形として量子化さ
れてしまうという問題がある。

そこで、この発明の目的は、オーバーロード歪みを軽
減することができる音声分析合成装置を提供することに
ある。

〈課題を解決するための手段〉上記目的を達成するため、請求項１に係る発明は、A/
D変換器，記憶部，音声分析手段，符号データ格納部，
音声合成手段,D/A変換器からなる音声分析合成装置にお
いて、A/D変換器は，入力される音声信号をA/D変換して
サンプルデータを出力し、記憶部は,A/D変換器のサンプ
ルデータを記憶し、音声分析手段は，記憶部の最後に記
憶されたサンプルデータから最初に記憶されたサンプル
データに向かって逆向きに読み出して適応量子化する量
子化部と，量子化部の出力を符号化し符号データを出力
する符号化部を備え、符号データ格納部は，音声分析手
段の符号データを格納し、音声合成手段は，符号データ
格納部の最後に格納した符号データから最初に格納した
符号データに向かって逆向きに読み出して復号化しディ
ジタル合成音声を出力し、D/A変換器は，ディジタル合
成音声をA/D変換することを特徴としている。

〈作用〉音声信号が入力されると、この入力された音声信号は
A/D変換器によってサンプリングされてA/D変換され、得
られたサンプルデータが記憶部に記憶される。そして、
この記憶部に記憶されたサンプルデータは、音声分析手
段の量子化部によって、最後に記憶されたサンプルデー
タから最初に記憶されたサンプルデータに向かって逆向
きに読み出されて適応量子化され、得られた量子化デー
タは符号化部によって符号化される。こうして得られた
符号データは符号データ格納部に格納される。一方、こ
の符号データ格納部に格納された符号データは、音声合
成手段によって、最後に格納された符号データから最初
に格納された符号データに向かって逆向きに読み出され
て復号化される。

したがって、立ち上がりが急峻な減衰波形である音声
波形を逆向きに分析／符号化することができ、そのため
に上記音声分析手段は立ち上がりの緩やかな音声波形を
分析／符号化することができる。

〈実施例〉以下、この発明を図示の実施例により詳細に説明す
る。

第１図はこの発明の音声分析合成装置のブロック図で
ある。以下、第１図にしたがって適応量子化方式として
ADPCM方式を用いた場合について説明する。

第３図に示すように、一般に音声波形は立ち上がりが
急峻な減衰波形を有している。したがって、このような
音声波形を時間方向と逆向きに見れば、第４図に示すよ
うに立ち上がりが緩やかな波形となる。そこで、この発
明は、入力された音声波形を時間方向と逆向きに分析す
る（すなわち、立ち上がりの緩やかな方向に分析する）
ことによって、オーバーロード歪みを軽減するのであ
る。

入力音声波形はA/D変換器１によってディジタル値に
変換され、記憶装置２に一旦記録される。次に、記憶装
置２に記憶されたディジタル音声データは時間方向と逆
向きに読み出されて、すなわち記憶装置２に記憶された
一番最後のサンプリングデータから読み出されて上記音
声分析手段としてADPCM符号化器３によって符号化され
る。このようにして、ディジタル音声データを時間方向
と逆向きに符号化して得られたADPCM符号データは、上
記符号データ格納部としてのROM（リードオンメモリ）
４等の半導体メモリに書き込まれる。ここまでの処理は
パソコン等で処理することが可能である。

上述のようにしてADPCM符号データが書き込まれたROM
4は別の小型音声合成装置にセットされる。そして、こ
の小型音声合成装置の上記音声合成手段としてのADPCM
復号化器５によってROM4内のADPCM符号データが読み出
され、復号化されて元のディジタル音声データに戻され
る。そしてさらに、D/A変換器６によって合成音声波形
が得られる。

ここで、ROM4内のADPCM符号データを復号する際に、
上述の符号化方向とは時間的に逆の方向に復号化すれ
ば、復号化されてD/A変換された後の合成音声波形の時
間的方向と入力音声波形の時間的方向とは同じになる。
したがって、合成音声波形は入力音声波形と同じ時間方
向に出力されるのである。

このように、入力音声の符号化時には、記憶装置２よ
りディジタル音声データを最後に記憶されたサンプリン
グデータから読み出し、ADPCM符号化器３によって通常
のADPCM符号化を行う。このADPCM符号化器３は具体的に
は第５図に示すようなADPCM符号化回路である。このADP
CM符号化回路は、適応量子化部11,符号化部12,符号化側
論理部13,加算器15,加算器16および符号化側固定一次予
測部14から構成される。このADPCM符号化回路はパソコ
ン等で構成することができる。

また、符号データの復号化時には、入力音声波形を時
間的に逆向きに符号化してROM4に書き込まれた符号デー
タを、最後に書き込まれた符号データから読み出してAD
PCM復号化器５で復号化する。このADPCM復号化器５は具
体的には第６図に示すようなADPCM復号化回路である。
このADPCM復号化回路は、復号化部21,復号化側論理部2
2,復号化側固定一次予測部23および加算器24から構成さ
れる。

次に、ADPCM符号化およびADPCM復号化について詳細に
説明する。

第７図はADPCM符号化時におけるADPCM分析を示す。現
在の入力波形に対するを差し引いたを符号化器12によって符号化して符号Cnを得る。そし
て、この符号CnのADPCM符号データをROM4に記憶する。
このとき、この発明において、上述のようにA/D変換器
１でA/D変換された音声波形の最後のサンプルデータか
ら時間的に逆方向に向かって順次ADPCM分析を行うもの
である。したがって、A/D変換された最初のサンプルデ
ータが一番最後に分析されることになる。この最後の分
析における最初のサンプルデータに対するまた、このを決定したときの適応量子化幅をΔｓとし、を符号化部12によって符号化して得られた符号をCsとす
る。

上記ROM4の内部には、第８図に示すように符号化器12
によって得られた符号C₀,C₁，…,Cn,…,Csを記憶する。
また、最後には、復号する際の初期値として適応量子化
値Δｓおよびを記憶する。この場合、ROM4に記憶された符号の順序
は、C₀の方が語尾でありCsの方が語頭に相当する。

復号化時には、入力音声波形の語頭より合成するた
め、上述の復号化時とは逆に符号Csから順に復号化す
る。その際に、初期データΔｓおよびが必要であるが、これらのデータはROM4から最初に読み
出すことができる。したがって、ROM4から初期データΔ
ｓ、およびCsを読み出して波形のすなわち、合成波高値）をADPCM復号化器５によって次
のようにして算出する。

すなわち、最初の合成波高値はROM4に最後に記憶され
たであり、この値をそのままADPCM復号化器５により出力してD/A変換器６
に入力する。

は次のように求める。まず、ROM4に記憶されている適応
量子化幅の初期値Δｓと最初の符号データCsよりを求める。そして、を差し引いた値が次のである。

以降の波高値は次のようにして求める。まず、適応量子
化幅Δｎを下記（１）式によって求め、この適応量子化
幅Δｎを用いてを（２）式によって求め、次に１つ前のサンプルデータ
からのとから（３）式によってを算出する。このようにして、順次ｎの大きいほうから
（すなわち、A/D変換器１に入力された時間方向に）を算出し、D/A変換器６に入力する。

ここで、M^-1(Cn+₁）は適応量子化幅Δn+₁を符号Cn+₁
に基づいて更新するための係数であり、（１）式のよう
にこのM^-1(Cn+₁）に適応量子化幅Δn+₁を乗ずることに
よって次の適応量子化幅Δｎを算出できる。この計算は
復号化側論理部22によって行われる。

また、Ｄ（Cn）は符号Cnから復号化される量子化値で
あり、（２）式のように量子化値Ｄ（Cn）に単位幅であ
る適応量子化幅Δｎを乗ずることによりを求めることができる。

第９図は計算機シュミレーションによって求めた合成
音声波形を示す。第９図（ａ）は原音の音声波形であ
る。

第９図（ｂ）は、第９図（ａ）の音声波形を示す原音
を、時間軸の順方向に（すなわち、図中左から右へ）通
常のADPCM符号化およびADPCM復号化を行って得られた合
成音声波形である。図から明らかなように、第９図
（ａ）の原音音声波形に見られる急峻な立ち上がり部分
は、点線によって示すようにオーバーロード歪みとなっ
て欠けてしまっている。第９図（ｄ）は、第９図（ａ）
の原音音声波形に対する第９図（ｂ）の合成音声波形の
誤差波形を示す。この誤差波形によって分かるように、
原音音声波形と合成音声波形との誤差は原音音声波形の
急峻な立ち上がり部で最も大きい。

第９図（ｃ）は、第９図（ａ）の音声波形を示す原音
を、本実施例の音声分析合成装置によって入力音声の時
間軸の逆方向にADPCM符号化を行い、入力音声の時間軸
の順方向にADPCM復号化を行って得られた合成音声波形
である。図から明らかなように、原音音声波形の急峻な
立ち上がり部分が忠実に再生されている。また、第９図
（ｅ）の誤差波形においても、原音音声波形の急峻な立
ち上がり部における誤差も少なく、本実施例における効
果が実証された。

本実施例の音声分析合成装置によるADPCM方式（以
下、逆方向ADPCM方式と言う）と、従来のADPCM方式（以
下、順方向ADPCM方式と言う）によって、音声を分析し
て合成した場合のセグメンタルSN比（以下、SNRsegと言
う）を第１表に示す。いずれも符号のビット長は３ビッ
トである。男声による２つの文章と女性による２つの文
章とについて、順方向ADPCM方式と逆方向ADPCM方式によ
って音声分析合成を行った。その結果、表から明らかなようにすべてにおいて逆
方向ADPCM方式の方が順方向ADPCM方式を上回るSNRseg値
を示し、平均値において2.19dB上回った値を示した。し
たがって、逆方向ADPCM方式は量子化誤差が少なく優れ
た音声分析合成方式であるといことができる。

このように、この発明の音声分析合成装置によって音
声を符号化する場合には、入力音声信号をA/D変換した
後のディジタル音声データを時間方向と逆向きに符号化
するので、立ち上がりの緩やかな入力音声波形を符号化
することができ、オーバーロード歪みの少ないSNRsegの
良い合成音声を得ることができる。

上記実施例においては、適応量子化方式としてADPCM
方式を用いたが、この発明はこれに限定されるものでは
なく、ADM方式およびAPCM方式等を用いてもよい。

〈発明の効果〉以上より明らかなように、請求項１に係る発明の音声
分析合成装置は、記憶部と、量子化部および符号化部を
有する音声分析手段と、符号データ格納部と、音声合成
手段を備えて、上記記憶部に記憶されたサンプルデータ
を、最後に記憶されたサンプルデータから最初に記憶さ
れたサンプルデータに向かって逆向きに読み出して適応
量子化および符号化を行い、得られた符号データを上記
符号データ格納部に格納し、最後に格納された符号デー
タから最初に格納された符号データから最初の符号化に
よる符号データに向かって逆向きに読み出して復号化す
るようにしたので、立ち上がりの急峻な減衰波形である
音声波形を時間方向と逆向きに（すなわち、立ち上がり
の緩やかな方向に）分析／符号化することができる。し
たがって、この発明によれば、従来のADPCM方式と同じ
情報量で、オーバーロード歪みが少なくSNRsegの良い合
成音声を得ることができる。

【図面の簡単な説明】

第１図はこの発明の音声分析合成装置のブロック図、第
２図はオーバーロード歪みの説明図、第３図は音声波形
をADPCM分析合成したときに現れるオーバーロード歪み
の説明図、第４図は音声波形を時間方向と逆向きに行う
ADPCM分析の説明図、第５図はADPCM符号化回路のブロッ
ク図、第６図はADPCM復号化回路のブロック図、第７図
は逆方向ADPCM方式による音声分析の説明図、第８図は
第１図におけるROMに記憶されたデータの内容を示す
図、第９図はシュミレーションによる順方向ADPCM方式
および逆方向ADPCM方式の合成波形と誤差波形を示す図
である。１……A/D変換器、２……記憶装置、３……ADPCM符号化
器、４……ROM、５……ADPCM復号化器、６……D/A変換
器、11……適応量子化部、12……符号化部、13……符号
化側論理部、14……符号化側固定一次予測部、15,16,24
……加算器、21……復号化部、22……復号化側論理部、
23……復号化側固定一次予測部。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭59−104699（ＪＰ，Ａ) 特開昭63−18727（ＪＰ，Ａ) 特開昭61−109099（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G10L 9/18 H03M 7/34,7/38

Claims

(57)【特許請求の範囲】

【請求項１】A/D変換器（１）、記憶部（２）、音声分
析手段（３）、符号データ格納部（４）、音声合成手段
（５）、D/A変換器（６）からなる音声分析合成装置に
おいて、 A/D変換器（１）は、入力される音声信号をA/D変換して
サンプルデータを出力し、記憶部（２）は、A/D変換器（１）のサンプルデータを
記憶し、音声分析手段（３）は、記憶部（２）の最後に記憶され
たサンプルデータから最初に記憶されたサンプルデータ
に向かって逆向きに読み出して適応量子化する量子化部
（11）と、量子化部（11）の出力を符号化し符号データ
を出力する符号化部（12）を備え、符号データ格納部（４）は、音声分析手段（３）の符号
データを格納し、音声合成手段（５）は、符号データ格納部（４）の最後
に格納した符号データから最初に格納した符号データに
向かって逆向きに読み出して復号化しディジタル合成音
声を出力し、 D/A変換器（６）は、ディジタル合成音声をA/D変換する音声分析合成装置。