JP2001184098A

JP2001184098A - 音声通信装置及びその通信方法

Info

Publication number: JP2001184098A
Application number: JP36564099A
Authority: JP
Inventors: Takayuki Ishikawa; 孝行石川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1999-12-22
Filing date: 1999-12-22
Publication date: 2001-07-06
Anticipated expiration: 2019-12-22
Also published as: JP3468184B2

Abstract

(57)【要約】【課題】ＬＰＣ係数の増加なく、より忠実なスペクトル
の再現と、より情報の圧縮度が高い狭帯域音声通信を可
能とする。【解決手段】２分割帯域ごとのＬＰＣ分析器でフレーム
化された入力音声信号を線形予測分析しＬＰＣ係数を求
め、ベクトル量子化器１５１，１５２でベクトル量子化
する。ベクトル蓄積器は、１０フレーム分集成した大フ
レーム単位でベクトル量子化ＬＰＣ係数を蓄積し、類似
度判定器が、その中から互いに類似性のあるもの判別
し，更にその中から一つのみを代表値として選択する。
一方、ＬＰＣ逆フィルタ、音源分析器、ケプストラム分
析器、音源補正器等で処理された音源信号は、ベクトル
量子化器５１１〜５１３でベクトル量子化され、多重化
器で、前述の代表ベクトル量子化ＬＰＣ係数及び類似性
のないベクトル量子化ＬＰＣ係数とともに多重化され、
符号化音声信号として伝送路へ送出される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声通信装置及びそ
の通信方法に関し、特に線形予測符号化（ＬＰＣ）分析
・合成方式を用いた音声通信装置と、その送信装置及び
受信装置と、それらの通信方法とに関する。

【０００２】

【従来の技術】ＬＰＣ係数と残差信号を用いたＬＰＣ分
析・合成方式の音声通信装置として、従来よりピッチ励
振型ＬＰＣボコーダが知られている。図３はこの従来の
音声通信装置（送信装置及び受信装置）としてのピッチ
励振型ＬＰＣボコーダの一例のブロック図を示す。

【０００３】同図において、送信装置側の入力音声信号
は音声帯域制限用ローパスフィルタ（ＬＰＦ）２２によ
り、例えば３００Ｈｚ〜３．４ｋＨｚの電話音声帯域に
制限された後、Ａ／Ｄ変換器２３に供給されて、所定の
標本化周波数で標本化された所定量子化ビット数の音声
データに変換される。

【０００４】この音声データは、線形予測分析器（ＬＰ
Ｃ分析器）２４に供給され、ここで公知の線形予測分析
によりｋパラメータ、αパラメータ等の８個〜１２個程
度のＬＰＣ係数に変換される。音源分析器２５はこのＬ
ＰＣ係数を用いて公知の方法で残差信号を抽出し、更に
これを２乗和して音源信号（電力）を算出する。また、
上記の音声データは、ピッチ抽出器２６に供給されて、
音源データのピッチ周波数（声帯振動数）が抽出され
る。

【０００５】以上のＬＰＣ分析器２４から出力されたＬ
ＰＣ係数と、音源分析器２５から出力された音源信号
（電力）と、ピッチ抽出器２６から出力されたピッチ周
波数とは、それぞれ多重化器２７に供給され、ここで多
重化された後、伝送路を介して合成側（受信装置側）へ
送出される。

【０００６】受信装置側では、分離器２８で入力された
信号から上記のＬＰＣ係数、音源信号（電力）及びピッ
チ周波数をそれぞれ分離する。パルス列発生器２９は分
離器２８からのピッチ周波数に応じたインパルス列を発
生する。有声／無声判定器３０は分離器２８からのピッ
チ周波数及び電力により有声音声か無声音声かを判定
し、その判定結果をスイッチ回路３２へスイッチング信
号として供給する。

【０００７】スイッチ回路３２は、有声音声判定時は上
記のスイッチング信号に基づき、パルス列発生器２９か
らピッチ周期に対応した固定周期（固定間隔）で取り出
されたインパルス列を選択して音源復調器３３へ供給
し、無声音声判定時は声帯振動が無くピッチ周波数が存
在しないため、前記ピッチ周波数に基づき固定周期的に
励振されるインパルス列の代わりに、上記のスイッチン
グ信号に基づき、雑音発生器３１から取り出された白色
雑音信号に応じたランダムパルス列を選択して音源復調
器３３へ供給する。

【０００８】音源復調器３３は、スイッチ回路３２から
のパルス列と分離器２８により分離された電力とに基づ
いて音源信号を復調する。ＬＰＣ合成フィルタ３４はこ
の復調音源信号に励振され、分離器２８により分離され
たＬＰＣ係数により係数が制御されてディジタル合成音
声信号を出力する。

【０００９】このディジタル合成音声信号は、Ｄ／Ａ変
換器３５に供給されてアナログ信号に変換された後、Ｌ
ＰＦ３６により不要周波数成分が除去されて電話音声帯
域の音声信号とされて出力される。

【００１０】このように、従来の音声通信装置では、有
声音声の合成に際し、音源情報を電話音声帯域（３００
Ｈｚ〜３．４ｋＨｚ）で一括分析し、その結果得られた
ピッチ周波数に応じた固定周期でパルス列発生器２９か
らインパルス列を発生している。

【００１１】

【発明が解決しようとする課題】しかし、本来の自然音
声（有声音声）声帯振動は、一定（固定周期）ではな
く、肉声の変化に応じた時間的、周波数的揺らぎ、瞬時
変動を伴う準周期的な動作をしている。しかるに、上記
の従来の音声通信装置では、音源情報（ピッチ周波数）
を分析するにあたって、上述した肉声の周波数的揺ら
ぎ、時間的揺らぎを無視して、電話音声帯域（３００Ｈ
ｚ〜３．４ｋＨｚ）を定常信号とみなし、全帯域を一括
して分析しているため、その肉声の変動に伴う時間的、
周波数的な揺らぎを表現し得ず、このため、自然性に乏
しい機械的合成音声しか生成できないという問題があ
る。

【００１２】一般に周波数分析の欠点は、その周波数の
定倍の信号を検出してしまうことがあることであり、ピ
ッチ周波数分析においても、その倍の周波数（倍ピッ
チ）や半分の周波数（半ピッチ）を検出して、音声品質
の自然性が劣化した合成音声を生成してしまうことがあ
る。

【００１３】また、従来、音声信号（残差信号）の帯域
内信号を一括して有声・無声と判定しているが、帯域内
すべてが同じ状態（有声・無声）でいることは無く、周
波数帯域ごとに有声・無声が混在することがある。ま
た、有声音声時においても、各周波数帯域ごとにピッチ
周期が異なることがある。

【００１４】更に、上記の従来の音声通信装置では、Ｌ
ＰＣ分析は帯域内スペクトルを一括して表現させるた
め、通常使用する８個〜１２個程度のＬＰＣ係数では、
エネルギーが集中している低域周波数帯に割り当てら
れ、高域周波数帯の表現精度が不十分になるため、フォ
ルマント帯域幅の過小推定、高次（第３次）フォルマン
トの近似性に劣り、忠実なスペクトルの再現ができない
場合がある。

【００１５】更に音源信号は実際には定常的信号ではな
く、揺らぎを伴うものであり、周波数帯域ごとにその揺
らぎ幅が異なるものである。

【００１６】なお、スペクトル精度の向上を図るため、
ＬＰＣ係数を増加させることも考えられるが、ＬＰＣ係
数の増加は、通信情報量の増加にもつながるため、１２
個を越えるＬＰＣ係数の使用は望ましくなく、実際に狭
帯域通信を行う音声通信装置においては、１２個を越え
るＬＰＣ係数の使用は現状では困難である。

【００１７】本発明は以上の点に鑑みなされたもので、
より自然性の高い音声合成を再現するとともに、ＬＰＣ
係数及び音源情報をベクトル量子化により情報量を圧縮
し、かつ、相互類似度の高いＬＰＣ係数は代表を１つの
み選択し更に情報量を圧縮することにより、ＬＰＣ係数
を増加させることなく（情報量の増加を伴わずに）、よ
り忠実なスペクトルの再現（高品質音声）をすることが
できる音声通信装置及びその通信方法を提供することを
目的とする。

【００１８】

【課題を解決するための手段】本発明の音声通信送信装
置は；予め定めた音声帯域を第１の分割数の帯域に分割
し、その分割帯域のそれぞれについて所定周期のフレー
ム化された入力音声信号を線形予測分析して線形予測係
数を出力する線形予測分析手段と；前記線形予測分析手
段から出力される分割帯域ごとの前記線形予測係数をベ
クトル量子化する第１の量子化手段と；同じ分割帯域ご
との前記線形予測係数と前記入力音声信号とを受け、残
差信号を抽出する逆フィルタ手段と；前記残差信号を第
２の分割数の帯域に分割し、その分割帯域のそれぞれの
残差信号に基づいて分割帯域ごとに音源信号を抽出する
音源分析手段と；前記分割帯域ごとの音源信号からケプ
ストラム信号を抽出するケプストラム分析手段と；前記
ケプストラム信号を基に前記音源信号を補正する音源補
正手段と；前記音源補正手段から出力される分割帯域ご
との補正された前記音源信号をベクトル量子化する第２
の量子化手段と；前記第１の量子化手段から出力される
分割帯域ごとの前記ベクトル量子化済線形予測係数をフ
レームを所定数分集成した大フレーム単位で蓄積するベ
クトル蓄積手段と；前記ベクトル蓄積手段に蓄積された
複数のベクトル量子化済線形予測係数を互いに類似性の
あるものとないものとに分離し、類似性ありとみなした
複数のベクトル量子化済線形予測係数の中から一つのみ
を代表ベクトル量子化済線形予測係数として選択する類
似度判定手段と；前記類似度判定手段から出力される前
記代表ベクトル量子化済線形予測係数及び類似性ありと
みなされなかった残りのベクトル量子化済線形予測係数
と、前記第２の量子化手段から出力される分割帯域ごと
の前記ベクトル量子化済音源信号とをそれぞれ多重化し
符号化音声信号として出力する多重化手段とを備える。

【００１９】本発明の音声通信受信装置は；上記音声通
信送信装置からの符号化音声信号を受け、その信号から
分割帯域ごとの代表ベクトル量子化済線形予測係数及び
類似性ありとみなされなかった残りのベクトル量子化済
線形予測係数と、当該分割帯域ごとのベクトル量子化済
音源信号とをそれぞれ分離し、前記代表ベクトル量子化
済線形予測係数を類似性ありとみなしたフレーム数分の
ベクトル量子化済線形予測係数として複製し、前記類似
性ありとみなされなかった残りのベクトル量子化済線形
予測係数とともに大フレーム分の値に復元するととも
に、各ベクトル値をスカラー値に復元する分離手段と；
前記分離手段から出力される分割帯域ごとの前記線形予
測係数及び音源信号から全帯域分の合成音声信号を再生
する合成手段とを備える。

【００２０】本発明の音声通信装置は、音声信号を入力
し符号化音声信号として伝送路へ出力する上記構成の音
声通信送信装置と、前記伝送路を介して前記音声通信送
信装置と接続され入力された符号化音声信号から合成音
声信号を再生する上記構成のの音声通信受信装置とから
成る。

【００２１】本発明の音声通信送信方法は；予め定めた
音声帯域を第１の分割数の帯域に分割し、その分割帯域
のそれぞれについて所定周期のフレーム化された入力音
声信号を線形予測分析して線形予測係数を求め；前記線
形予測分析手段から出力される分割帯域ごとの前記線形
予測係数をベクトル量子化し；同じ分割帯域ごとの前記
線形予測係数と前記入力音声信号とから残差信号を抽出
し；前記残差信号を第２の分割数の帯域に分割し、その
分割帯域のそれぞれの残差信号に基づいて分割帯域ごと
に音源信号を抽出し；前記分割帯域ごとの音源信号から
ケプストラム信号を抽出し；前記ケプストラム信号を基
に前記音源信号を補正し；前記分割帯域ごとの補正され
た音源信号をベクトル量子化し；前記分割帯域ごとの前
記ベクトル量子化済線形予測係数をフレームを所定数分
集成した大フレーム単位で蓄積し；蓄積された複数のベ
クトル量子化済線形予測係数を互いに類似性のあるもの
とないものとに分離し、類似性ありとみなした複数のベ
クトル量子化済線形予測係数の中から一つのみを代表ベ
クトル量子化済線形予測係数として選択し；前記代表ベ
クトル量子化済線形予測係数及び類似性ありとみなされ
なかった残りのベクトル量子化済線形予測係数と、前記
ベクトル量子化済音源信号とをそれぞれ多重化し符号化
音声信号として出力する工程を有する。

【００２２】本発明の音声通信受信方法は、上記音声通
信送信方法により処理された符号化音声信号を受信し、
その信号から分割帯域ごとの代表ベクトル量子化済線形
予測係数及び類似性ありとみなされなかった残りのベク
トル量子化済線形予測係数と、当該分割帯域ごとのベク
トル量子化済音源信号とをそれぞれ分離し、前記代表ベ
クトル量子化済線形予測係数を類似性ありとみなしたフ
レーム数分のベクトル量子化済線形予測係数として複製
し、前記類似性ありとみなされなかった残りのベクトル
量子化済線形予測係数とともに大フレーム分の値に復元
するとともに、各ベクトル値をスカラー値に復元し、前
記復元された分割帯域ごとの線形予測係数及び音源信号
から全帯域分の合成音声信号を再生する工程を有する。

【００２３】本発明の音声通信方法は、送信側にて、入
力音声信号を上記音声通信送信方法により処理し符号化
音声信号として伝送路へ送出し、受信側にて、前記伝送
路を介して受信した符号化音声信号を上記音声通信受信
方法により合成音声信号として再生する工程を有する。

【００２４】

【発明の実施の形態】まず、本発明の概要を説明する。
本発明の音声通信装置は、音声信号をスペクトラル包絡
情報及び音源信号を生成し符号化音声信号として伝送す
る音声通信装置に関し、複数種類の周波数分析器、逆フ
ィルタ、音源補正器、及びベクトル量子化器を備えた音
声通信送信装置と、この音声通信送信装置と伝送路を介
して接続される音源信号復調器を備えた音声通信受信装
置とから成る。

【００２５】音声通信送信装置は、音声帯域を第１の分
割帯域それぞれについて所定周期のフレーム化された入
力音声信号を線形予測分析（ＬＰＣ分析）して線形予測
係数（ＬＰＣ係数）を出力する線形予測分析手段と、線
形予測係数をベクトル量子化する第１の量子化手段と、
線形予測係数と入力音声信号との残差信号を抽出する逆
フィルタ手段と、残差信号から第２の分割帯域ごとに音
源信号を抽出する音源分析手段と、音源信号からケプス
トラム信号を抽出するケプストラム分析手段と、ケプス
トラム信号を基に音源信号を補正する音源補正手段と、
補正された音源信号をベクトル量子化する第２の量子化
手段と、ベクトル量子化済線形予測係数をフレームを所
定数分集成した大フレーム単位で蓄積するベクトル蓄積
手段と、蓄積された複数のベクトル量子化済線形予測係
数を互いに類似性のあるものとないものとに分離し、類
似性ありとみなした複数のベクトル量子化済線形予測係
数の中から一つのみを代表ベクトル量子化済線形予測係
数として選択する類似度判定手段と、ベクトル量子化済
線形予測係数及び類似性ありとみなされなかった残りの
ベクトル量子化済線形予測係数と、ベクトル量子化済音
源信号とをそれぞれ多重化し符号化音声信号として出力
する多重化手段とを備える。

【００２６】音声通信受信装置は、符号化音声信号を受
け、その信号から分割帯域ごとの代表ベクトル量子化済
線形予測係数及び類似性ありとみなされなかった残りの
ベクトル量子化済線形予測係数と、当該分割帯域ごとの
ベクトル量子化済音源信号とをそれぞれ分離し、代表ベ
クトル量子化済線形予測係数を類似性ありとみなしたフ
レーム数分のベクトル量子化済線形予測係数として複製
し、類似性ありとみなされなかった残りのベクトル量子
化済線形予測係数とともに大フレーム分の値に復元する
とともに、各ベクトル値をスカラー値に復元する分離手
段と、線形予測係数及び音源信号から合成音声信号を再
生する合成手段とを備える。

【００２７】本発明では、分割帯域のそれぞれについて
入力音声信号を線形予測分析して線形予測係数（ＬＰＣ
係数）を得るようにしたため、従来のＬＰＣ分析の欠点
といわれていた（１）フォルマント帯域幅の過小推定、
（２）第３フォルマントの近似性の悪さをそれぞれ改善
でき、このＬＰＣ係数を用いて逆フィルタにより高精度
の残差信号を抽出することができる。

【００２８】また、この高精度の残差信号を更に帯域分
割し、それぞれについて音源分析手段にて音源信号を得
るようにしたため、各帯域ごとに混在している有声音声
／無声音声を分離し、有声音声においては各帯域ごとに
最適な音源情報の抽出ができる。

【００２９】更に、各帯域ごとに音源信号の揺らぎを測
定し、かつ補正するため、自然音声に近い揺らぎを持つ
音源信号の抽出ができる。従って、個々の特性に合わせ
た精度の良い音源情報を抽出することができるため、本
来の人間の発声機構に忠実な音声分析・合成ができる。

【００３０】加えて、ベクトル量子化済線形予測係数を
全て伝送するのではなく、類似性のあるベクトル値は一
つの代表ベクトル値のみ伝送する代表ベクトル送出方式
であるため、音質を保ちながら、通信情報量の削減をす
ることができる。

【００３１】次に、本発明の実施の形態について図面を
参照して詳細に説明する。

【００３２】図１は本発明の音声通信送信装置１００の
一実施の形態を示すブロック図である。同図において、
入力音声信号は音声帯域制限用ローパスフィルタ（ＬＰ
Ｆ）１１０により、例えば３００Ｈｚ〜３．４ｋＨｚの
電話音声帯域に制限された後、アナログ・ディジタル変
換器（Ａ／Ｄ変換器）１２０に供給されて、所定の標本
化周波数（例えば８ｋＨｚ）で標本化された所定量子化
ビット数（例えば１６ビット）のディジタル音声データ
に変換される。この音声データは所定周期（本例では２
２．５ｍｓｅｃ）で連続するフレームで構成されてお
り、以下の処理においては、このフレーム単位で処理さ
れる。

【００３３】この音声データは、バンドパスフィルタ群
１３０に供給されて、所定の周波数帯域ごとの複数の帯
域に分割される。本例では、１．２ｋＨｚを中心に２分
割される。すなわち、音声データは、バンドパスフィル
タ群１３０を構成するバンドパスフィルタ（ＢＰＦ）１
３１及び１３２にそれぞれ供給され、ＢＰＦ１３１から
帯域が３００Ｈｚ〜１．２ｋＨｚ、ＢＰＦ１３２から帯
域が１．２ｋＨｚ〜３．４ｋＨｚとされて取り出され
る。

【００３４】ＢＰＦ１３１及び１３２から出力された各
帯域分割音声データは、分割帯域ごとに対応して設けら
れた線形予測分析器（ＬＰＣ分析器）１４１及び１４２
にそれぞれ供給され、公知の線形予測分析によりＬＳＰ
パラメータ、αパラメータ等のＬＰＣ係数（線形予測係
数））に変換された後、ＬＰＣ逆フィルタ１６０にＡ／
Ｄ変換器１２０の出力音声データと共に入力される。

【００３５】各ＬＰＣ分析器１４１及び１４２からのＬ
ＰＣ係数（本例ではαパラメータを使用）を圧縮・量子
化するためのベクトル量子化器１５１及び１５２にそれ
ぞれ入力し、各々のＬＰＣ係数のベクトル量子化値（ベ
クトル量子化済ＬＰＣ係数）を算出しベクトル蓄積器１
８１及び１８２にそれぞれ送出する。

【００３６】各ベクトル蓄積器１８１及び１８２は、音
声の声道周期として違和感のない１００ｍｓｅｃ〜２２
０ｍｓｅｃ程度の時間長に相当するように音声データの
フレームを複数集成して大フレームとし（本例は１フレ
ーム２２．５ｍｓｅｃとして、１０フレームを１大フレ
ームとしている）、この大フレーム単位にそれを構成す
る各フレームに対応するベクトル値（ベクトル量子化済
ＬＰＣ係数）を蓄積するとともに、類似度判定器１９１
及び１９２にそれぞれ送出する。

【００３７】各類似度判定器１９１及び１９２は、前述
の大フレームを構成する１０フレーム分のベクトル信号
（ベクトル量子化済ＬＰＣ係数）の中から互いに類似性
のある信号を抽出し、その中の一つのみを代表ベクトル
として選択する。実験的には、有声音声の場合は１０フ
レーム中２〜５フレームが類似性があると算出される場
合が多い。よって線形予測ベクトル量子化情報量の２〜
５フレーム分のデータを１フレーム分のデータとして選
択された代表ベクトル値（代表ベクトル量子化済ＬＰＣ
係数）と、類似性なしと判定されたベクトル値（ベクト
ル量子化済ＬＰＣ係数）とを多重化器１０へ送る。この
ように、互いに類似性のある２〜５フレーム分のデータ
を１フレーム分のデータとするので１／２〜１／５に情
報圧縮が可能である。

【００３８】一方、ＬＰＣ逆フィルタ１６０は、Ａ／Ｄ
変換器１２０の出力音声データに対し、ＬＰＣ分析器１
４１及び１４２からの２つの分割帯域のＬＰＣ係数を用
いて線形予測分析のスペクトル包絡特性とは逆のフィル
タ特性を付与し、残差信号を出力する。

【００３９】この残差信号は、バンドパスフィルタ群１
７０に供給されて複数の帯域に分割される。本例では、
１．５ｋＨｚと２．５ｋＨｚを境にして帯域が３分割さ
れる。すなわち、残差信号は、バンドパスフィルタ群１
７０を構成するＢＰＦ１７１，１７２，及び１７３にそ
れぞれ供給され、ＢＰＦ１７１から３００Ｈｚ〜１．５
ｋＨｚの周波数成分が取り出され、ＢＰＦ１７２から
１．５ｋＨｚ〜２．５ｋＨｚの周波数成分が取り出さ
れ、ＢＰＦ１７３から２．５ｋＨｚ〜３．４ｋＨｚの周
波数成分が取り出される。

【００４０】各ＢＰＦ１７１，１７２，及び１７３から
それぞれ取り出された帯域分割残差信号は、分帯域ごと
に対応してそれぞれ複数個（本例は２個）ずつ設けられ
た音源分析器２１１〜２１２、２２１〜２２２、及び２
３１〜２３２にそれぞれ供給され、ここで２乗和されて
分割帯域ごとの音源信号（電力）として取り出される。

【００４１】各音源分析器２１１〜２１２、２２１〜２
２２、及び２３１〜２３２からの各帯域ごとの音源信号
は、対応するケプストラム分析器３１１〜３１２、３２
１〜３２２、及び３３１〜３３２にそれぞれ供給され
る。

【００４２】各ケプストラム分析器３１１〜３１２、３
２１〜３２２、及び３３１〜３３２は、各帯域ごとの音
源信号の周波数軸上のケプストラム値（ケフレンシー）
を算出し、対応する音源補正器４１１〜４１２、４２１
〜４２２、及び４３１〜４３２にそれぞれ出力する。

【００４３】各音源補正器４１１〜４１２、４２１〜４
２２、及び４３１〜４３２は、ケプストラム値のケフレ
ンシー上の分散値を測定し、分散が小さいときには、定
常信号と判断、分散が大きいときは揺らぎがある信号と
判断する。揺らぎがあると判断された音源信号はピッチ
周期（声帯信号）に同期した変動（揺らぎ）を与え補正
する。更に、各音源補正器４１１〜４１２、４２１〜４
２２、及び４３１〜４３２の出力は、次に説明する各帯
域対応の判定器５０１，５０２，及び５０３を通して、
第２のベクトル量子化器である、ベクトル量子化器５１
１，５１２，及び５１３にそれぞれ出力する。

【００４４】なお、音源分析器、ケプストラム分析器、
及び音源補正器を各帯域ごとに２つずつ設けるのは次の
理由による。音源分析にあたり、ＢＰＦ群１７０で各帯
域に分割された出力信号を、それぞれの帯域ごとでの倍
ピッチ又は半ピッチを含めて算出するように更に２分割
し、それぞれの計算結果からどちらかの分割側（２個の
うち１個）がより正しいかを各帯域ごとに判定器５０
１，５０２，及び５０３で判定して、入力信号により近
い値を示す分析ルートを正しい値とし、そのルートから
得られた値を正しい各帯域ごとの分析情報とするためで
ある。

【００４５】各ベクトル量子化器５１１，５１２，及び
５１３は、判定器５０１，５０２，及び５０３でそれぞ
れ選択された側の音源補正器４１１〜４１２、４２１〜
４２２、及び４３１〜４３２で補正された音源信号のベ
クトル量子化値（ベクトル量子化済音源信号）をそれぞ
れ算出する。

【００４６】多重化器５２０は、ベクトル量子化器５１
１，５１２，及び５１３からそれぞれ取り出された分割
帯域ごとのベクトル量子化された音源信号（電力）と、
もう一つのベクトル量子化器１５１及び１５２（ベクト
ル蓄積器、類似度判定器経由）からそれぞれ取り出され
た２つの分割帯域のベクトル量子化されたＬＰＣ係数と
をそれぞれ多重化し、符号化音声信号として伝送路７０
０へ出力する。

【００４７】図２は本発明の音声通信受信装置８００の
一実施の形態を示すブロック図である。同図において、
分離器８１０は、伝送路７００を介して音声通信送信装
置１００から入力された符号化音声信号より、送信側と
同様の３つの分割帯域のベクトル量子化された音源信号
（電力）と２つの分割帯域のベクトル量子化されたＬＰ
Ｃ係数とをそれぞれ分離するとともに、選択された代表
ベクトル値（ベクトル量子化済ＬＰＣ係数）を類似性あ
りとみなしたフレーム数分のベクトル値として複製し、
類似性なしと判定されたベクトル値ととともに大フレー
ム（１０フレーム）分の値に復元した後、通常の線形計
算に扱えるスカラー値に復元する。

【００４８】このうちＬＰＣ係数はＬＰＣ補間器８２０
に供給され、音声帯域の上位側と下位側をそれぞれ示し
ているＬＰＣ値（ベクトル値）を、線形演算で扱えるス
カラー値に変更した後、両ＬＰＣ係数（スカラー値）を
単純に重ね合わせることで、音声全帯域を表現している
ＬＰＣ係数に再生し、ここで一定周期（例えば２２．５
ｍｓｅｃ）ごとに入力されるＬＰＣ係数の前回の入力値
と今回の入力値とを利用した線形補間値から、例えば
５．６２５ｍｓｅｃ単位のＬＰＣ係数に修正される（換
言すると、２２．５ｍｓｅｃ単位で変化するＬＰＣ係数
が、５．６２５ｍｓｅｃ単位で変化するＬＰＣ係数に変
換される）。

【００４９】また、分離器８１０により分離された分割
帯域ごとの音源信号（電力）は、音源復調器８３０に供
給され、ここで帯域ごとの音源信号（電力）を補間処理
して全帯域（３００Ｈｚ〜３．４ｋＨｚ）のピッチ情報
に復元される。ここで音源復調器８３０は、３つのバン
ドパスフィルタ群を持ち、それぞれ、低域、中域、高域
の音源再生用として、各帯域ごとの音源情報（スカラー
値）をフィルタ係数とし、その帯域に対応したピッチ情
報をエネルギーとして駆動する。そしてこの３つのフィ
ルタの出力の線形和が、音声全帯域を表す音源情報とな
る。

【００５０】ＬＰＣ合成フィルタ８４０は、ＬＰＣ補間
器８２０から出力された修正後のＬＰＣ係数をフィルタ
係数とし、音源復調器８３０から出力された復調後のピ
ッチ情報を入力エネルギーとしたディジタル合成音声デ
ータを再生する。

【００５１】このディジタル合成音声データは、ディジ
タル・アナログ変換器（Ｄ／Ａ変換器）８５０に供給さ
れてディジタル・アナログ変換されてアナログ信号の合
成音声信号として取り出され、次段のＬＰＦ８６０によ
り不要周波数成分を除去された後、再成合成音声信号と
して出力される。

【００５２】このように、この実施の形態では、音声信
号帯域を２分割して得られたＬＰＣ係数を用いてＬＰＣ
逆フィルタ１６０により抽出した高精度の残差信号を更
に３つの帯域に分割し、それぞれについて音源分析器２
１１〜２１２、２２１〜２２２、及び２３１〜２３２に
て音源信号を得ることにより、各帯域ごとに混在してい
る有声音声／無声音声を分離し、個々の特性に合わせた
精度の良い音源情報を抽出することができ、かつ各帯域
ごとに音源信号の揺らぎを測定し補正するため、自然音
声に近い揺らぎを持つ音源信号の抽出ができる。従っ
て、本来の人間の発声機構に忠実な音声分析・合成がで
きる。

【００５３】更に周波数分析上の欠点である倍周期検出
を補正するために、音源分析器を２分割し、ＢＰＦ群１
７０で分割されたそれぞれの帯域における倍ピッチ又
は、半ピッチを含めて算出しているため、分析エラーを
極限できるという特徴を持つ。

【００５４】また、声道情報であるベクトル量子化済線
形予測（ＬＰＣ）係数を全て送るのではなく、類似性の
あるものは一つの代表値のみを送るため、音質の低下な
しで、通信情報量の削減ができる。

【００５５】なお、本発明は上記の実施の形態に限定さ
れるものではなく、例えばバンドパスフィルタ群１３０
及び１７０の各ＢＰＦの特性は固定として説明したが、
入力情報を基に中心周波数を可変することもでき、ま
た、分割数も２分割から４分割程度まで可能であるこ
と、ケプストラムの分散値の判定は本実施例では固定と
して説明したが、ピッチ周波数に応じて可変してもよい
ことが実験的に確認されている。従来のＬＰＣボコーダ
はＬＰＣ分析に４０ビット、ピッチに７ビット、音源に
６ビット、同期に１ビットの計５４ビットを１フレーム
２２．５ｍｓｅｃとして伝送（５４／２２．５ｍ＝２４
００ｂｐｓ）としている。

【００５６】今回の方式はＬＰＣ分析におけるベクトル
量子化器（１５１、１５２）のそれぞれのビット割当を
１０ビットとし、計２０ビットをＬＰＣ係数に割り当て
る。また、代表値選択情報用としての類似度判定情報を
３ビットとし、計６ビットを割り当てる。更に音源情報
にしてもベクトル量子化器（５１１、５１２、５１３）
のそれぞれのビットを４ビットとし、計１２ビットを音
源情報に割り当てる。また、ピッチ情報として各帯域の
音源ごとに５ビットの計１５ビットを割り当てる。（Ｌ
ＰＣ係数２０ビット、類似度判定情報６ビット、音源情
報１２ビット、ピッチ情報１５ビット、同期１ビットの
計５４ビットで実現できる）よって、本発明の実施例に
おいて、更なる音質向上をビット情報の増加無く実現で
きることがわかる。

【００５７】

【発明の効果】以上説明したように、本発明によれば、
分割帯域のそれぞれについて入力音声信号を線形予測分
析して線形予測係数（ＬＰＣ係数）を用いて逆フィルタ
により高精度の残差信号を抽出した後、この高精度の残
差信号を更に帯域分割し、それぞれについて音源分析手
段にて音源信号を得ることにより、各帯域ごとに混存し
ている有声音声／無声音声を分離するようにしたため、
個々の特性に合わせた（各周波数帯域ごとに最適な）精
度の良い音源情報を抽出することができるとともに、周
波数分析上の欠点といえる、倍ピッチ、半ピッチによる
分析エラーを防ぐことができ、各帯域ごとに音源信号の
揺らぎを測定しかつ補正するため自然音声に近い揺らぎ
を持つ音源信号の抽出をし、本来の人間の発声機構に忠
実な音声分析・合成ができ、より自然性の高い合成音声
を得ることができる。また、ベクトル量子化済線形予測
（ＬＰＣ）係数を全て送るのではなく、類似性のあるも
のは一つの代表値のみを送るため、ＬＰＣ係数の増加な
く（通信情報量の削減）、より忠実なスペクトルの再現
（音質の低下なし）ができるとともに、より情報の圧縮
度が高い狭帯域音声通信を行うことができる。

【図面の簡単な説明】

【図１】本発明の音声通信送信装置の一実施の形態を示
すブロック図である。

【図２】本発明の音声通信受信装置の一実施の形態を示
すブロック図である。

【図３】従来の音声通信送信装置及び音声通信受信装置
を示すブロック図である。

【符号の説明】

１００音声通信送信装置１１０，８６０ローパスフィルタ（ＬＰＦ）１２０Ａ／Ｄ変換器１３０，１７０バンドパスフィルタ群１３１，１３２，１７１〜１７３バンドパスフィル
タ（ＢＰＦ）１４１，１４２ＬＰＣ分析器１５１，１５２，５１１〜５１３ベクトル量子化器１６０ＬＰＣ逆フィルタ２１１，２１２，２２１，２２２，２３１，２３２
音源分析器３１１，３１２，３２１，３２２，３３１，３３２
ケプストラム分析器４１１，４１２，４２１，４２２，４３１，４３２
音源補正器５０１〜５０３判定器５２０多重化器８００音声通信受信装置８１０分離器８２０ＬＰＣ補間器８３０音源復調器８４０ＬＰＣ合成フィルタ８５０Ｄ／Ａ変換器

Claims

【特許請求の範囲】

【請求項１】予め定めた音声帯域を第１の分割数の帯
域に分割し、その分割帯域のそれぞれについて所定周期
のフレーム化された入力音声信号を線形予測分析して線
形予測係数を出力する線形予測分析手段と、前記線形予測分析手段から出力される分割帯域ごとの前
記線形予測係数をベクトル量子化する第１の量子化手段
と、同じ分割帯域ごとの前記線形予測係数と前記入力音声信
号とを受け、残差信号を抽出する逆フィルタ手段と、前記残差信号を第２の分割数の帯域に分割し、その分割
帯域のそれぞれの残差信号に基づいて分割帯域ごとに音
源信号を抽出する音源分析手段と、前記分割帯域ごとの音源信号からケプストラム信号を抽
出するケプストラム分析手段と、前記ケプストラム信号を基に前記音源信号を補正する音
源補正手段と、前記音源補正手段から出力される分割帯域ごとの補正さ
れた前記音源信号をベクトル量子化する第２の量子化手
段と、前記第１の量子化手段から出力される分割帯域ごとの前
記ベクトル量子化済線形予測係数をフレームを所定数分
集成した大フレーム単位で蓄積するベクトル蓄積手段
と、前記ベクトル蓄積手段に蓄積された複数のベクトル量子
化済線形予測係数を互いに類似性のあるものとないもの
とに分離し、類似性ありとみなした複数のベクトル量子
化済線形予測係数の中から一つのみを代表ベクトル量子
化済線形予測係数として選択する類似度判定手段と、前記類似度判定手段から出力される前記代表ベクトル量
子化済線形予測係数及び類似性ありとみなされなかった
残りのベクトル量子化済線形予測係数と、前記第２の量
子化手段から出力される分割帯域ごとの前記ベクトル量
子化済音源信号とをそれぞれ多重化し符号化音声信号と
して出力する多重化手段とを備えることを特徴とする音
声通信送信装置。
【請求項２】請求項１記載の音声通信送信装置からの
符号化音声信号を受け、その信号から分割帯域ごとの代
表ベクトル量子化済線形予測係数及び類似性ありとみな
されなかった残りのベクトル量子化済線形予測係数と、
当該分割帯域ごとのベクトル量子化済音源信号とをそれ
ぞれ分離し、前記代表ベクトル量子化済線形予測係数を
類似性ありとみなしたフレーム数分のベクトル量子化済
線形予測係数として複製し、前記類似性ありとみなされ
なかった残りのベクトル量子化済線形予測係数とともに
大フレーム分の値に復元するとともに、各ベクトル値を
スカラー値に復元する分離手段と、前記分離手段から出力される分割帯域ごとの前記線形予
測係数及び音源信号から全帯域分の合成音声信号を再生
する合成手段とを備えることを特徴とする音声通信受信
装置。
【請求項３】音声信号を入力し符号化音声信号として
伝送路へ出力する請求項１記載の音声通信送信装置と、
前記伝送路を介して前記音声通信送信装置と接続され入
力された符号化音声信号から合成音声信号を再生する請
求項２記載の音声通信受信装置とから成ることを特徴と
する音声通信装置。
【請求項４】予め定めた音声帯域を第１の分割数の帯
域に分割し、その分割帯域のそれぞれについて所定周期
のフレーム化された入力音声信号を線形予測分析して線
形予測係数を求め、前記線形予測分析手段から出力される分割帯域ごとの前
記線形予測係数をベクトル量子化し、同じ分割帯域ごとの前記線形予測係数と前記入力音声信
号とから残差信号を抽出し、前記残差信号を第２の分割数の帯域に分割し、その分割
帯域のそれぞれの残差信号に基づいて分割帯域ごとに音
源信号を抽出し、前記分割帯域ごとの音源信号からケプストラム信号を抽
出し、前記ケプストラム信号を基に前記音源信号を補正し、前記分割帯域ごとの補正された音源信号をベクトル量子
化し、前記分割帯域ごとの前記ベクトル量子化済線形予測係数
をフレームを所定数分集成した大フレーム単位で蓄積
し、蓄積された複数のベクトル量子化済線形予測係数を互い
に類似性のあるものとないものとに分離し、類似性あり
とみなした複数のベクトル量子化済線形予測係数の中か
ら一つのみを代表ベクトル量子化済線形予測係数として
選択し、前記代表ベクトル量子化済線形予測係数及び類似性あり
とみなされなかった残りのベクトル量子化済線形予測係
数と、前記ベクトル量子化済音源信号とをそれぞれ多重
化し符号化音声信号として出力することを特徴とする音
声通信送信方法。
【請求項５】請求項４記載の音声通信送信方法により
処理された符号化音声信号を受信し、その信号から分割
帯域ごとの代表ベクトル量子化済線形予測係数及び類似
性ありとみなされなかった残りのベクトル量子化済線形
予測係数と、当該分割帯域ごとのベクトル量子化済音源
信号とをそれぞれ分離し、前記代表ベクトル量子化済線
形予測係数を類似性ありとみなしたフレーム数分のベク
トル量子化済線形予測係数として複製し、前記類似性あ
りとみなされなかった残りのベクトル量子化済線形予測
係数とともに大フレーム分の値に復元するとともに、各
ベクトル値をスカラー値に復元し、前記復元された分割
帯域ごとの線形予測係数及び音源信号から全帯域分の合
成音声信号を再生することを特徴とする音声通信受信方
法。
【請求項６】送信側にて、入力音声信号を請求項４記
載の音声通信送信方法により処理し符号化音声信号とし
て伝送路へ送出し、受信側にて、前記伝送路を介して受
信した符号化音声信号を請求項５記載の音声通信受信方
法により合成音声信号として再生することを特徴とする
音声通信方法。