JP2001184098A - 音声通信装置及びその通信方法 - Google Patents

音声通信装置及びその通信方法

Info

Publication number
JP2001184098A
JP2001184098A JP36564099A JP36564099A JP2001184098A JP 2001184098 A JP2001184098 A JP 2001184098A JP 36564099 A JP36564099 A JP 36564099A JP 36564099 A JP36564099 A JP 36564099A JP 2001184098 A JP2001184098 A JP 2001184098A
Authority
JP
Japan
Prior art keywords
signal
vector
linear prediction
sound source
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36564099A
Other languages
English (en)
Other versions
JP3468184B2 (ja
Inventor
Takayuki Ishikawa
孝行 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP36564099A priority Critical patent/JP3468184B2/ja
Publication of JP2001184098A publication Critical patent/JP2001184098A/ja
Application granted granted Critical
Publication of JP3468184B2 publication Critical patent/JP3468184B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】LPC係数の増加なく、より忠実なスペクトル
の再現と、より情報の圧縮度が高い狭帯域音声通信を可
能とする。 【解決手段】2分割帯域ごとのLPC分析器でフレーム
化された入力音声信号を線形予測分析しLPC係数を求
め、ベクトル量子化器151,152でベクトル量子化
する。ベクトル蓄積器は、10フレーム分集成した大フ
レーム単位でベクトル量子化LPC係数を蓄積し、類似
度判定器が、その中から互いに類似性のあるもの判別
し,更にその中から一つのみを代表値として選択する。
一方、LPC逆フィルタ、音源分析器、ケプストラム分
析器、音源補正器等で処理された音源信号は、ベクトル
量子化器511〜513でベクトル量子化され、多重化
器で、前述の代表ベクトル量子化LPC係数及び類似性
のないベクトル量子化LPC係数とともに多重化され、
符号化音声信号として伝送路へ送出される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声通信装置及びそ
の通信方法に関し、特に線形予測符号化(LPC)分析
・合成方式を用いた音声通信装置と、その送信装置及び
受信装置と、それらの通信方法とに関する。
【0002】
【従来の技術】LPC係数と残差信号を用いたLPC分
析・合成方式の音声通信装置として、従来よりピッチ励
振型LPCボコーダが知られている。図3はこの従来の
音声通信装置(送信装置及び受信装置)としてのピッチ
励振型LPCボコーダの一例のブロック図を示す。
【0003】同図において、送信装置側の入力音声信号
は音声帯域制限用ローパスフィルタ(LPF)22によ
り、例えば300Hz〜3.4kHzの電話音声帯域に
制限された後、A/D変換器23に供給されて、所定の
標本化周波数で標本化された所定量子化ビット数の音声
データに変換される。
【0004】この音声データは、線形予測分析器(LP
C分析器)24に供給され、ここで公知の線形予測分析
によりkパラメータ、αパラメータ等の8個〜12個程
度のLPC係数に変換される。音源分析器25はこのL
PC係数を用いて公知の方法で残差信号を抽出し、更に
これを2乗和して音源信号(電力)を算出する。また、
上記の音声データは、ピッチ抽出器26に供給されて、
音源データのピッチ周波数(声帯振動数)が抽出され
る。
【0005】以上のLPC分析器24から出力されたL
PC係数と、音源分析器25から出力された音源信号
(電力)と、ピッチ抽出器26から出力されたピッチ周
波数とは、それぞれ多重化器27に供給され、ここで多
重化された後、伝送路を介して合成側(受信装置側)へ
送出される。
【0006】受信装置側では、分離器28で入力された
信号から上記のLPC係数、音源信号(電力)及びピッ
チ周波数をそれぞれ分離する。パルス列発生器29は分
離器28からのピッチ周波数に応じたインパルス列を発
生する。有声/無声判定器30は分離器28からのピッ
チ周波数及び電力により有声音声か無声音声かを判定
し、その判定結果をスイッチ回路32へスイッチング信
号として供給する。
【0007】スイッチ回路32は、有声音声判定時は上
記のスイッチング信号に基づき、パルス列発生器29か
らピッチ周期に対応した固定周期(固定間隔)で取り出
されたインパルス列を選択して音源復調器33へ供給
し、無声音声判定時は声帯振動が無くピッチ周波数が存
在しないため、前記ピッチ周波数に基づき固定周期的に
励振されるインパルス列の代わりに、上記のスイッチン
グ信号に基づき、雑音発生器31から取り出された白色
雑音信号に応じたランダムパルス列を選択して音源復調
器33へ供給する。
【0008】音源復調器33は、スイッチ回路32から
のパルス列と分離器28により分離された電力とに基づ
いて音源信号を復調する。LPC合成フィルタ34はこ
の復調音源信号に励振され、分離器28により分離され
たLPC係数により係数が制御されてディジタル合成音
声信号を出力する。
【0009】このディジタル合成音声信号は、D/A変
換器35に供給されてアナログ信号に変換された後、L
PF36により不要周波数成分が除去されて電話音声帯
域の音声信号とされて出力される。
【0010】このように、従来の音声通信装置では、有
声音声の合成に際し、音源情報を電話音声帯域(300
Hz〜3.4kHz)で一括分析し、その結果得られた
ピッチ周波数に応じた固定周期でパルス列発生器29か
らインパルス列を発生している。
【0011】
【発明が解決しようとする課題】しかし、本来の自然音
声(有声音声)声帯振動は、一定(固定周期)ではな
く、肉声の変化に応じた時間的、周波数的揺らぎ、瞬時
変動を伴う準周期的な動作をしている。しかるに、上記
の従来の音声通信装置では、音源情報(ピッチ周波数)
を分析するにあたって、上述した肉声の周波数的揺ら
ぎ、時間的揺らぎを無視して、電話音声帯域(300H
z〜3.4kHz)を定常信号とみなし、全帯域を一括
して分析しているため、その肉声の変動に伴う時間的、
周波数的な揺らぎを表現し得ず、このため、自然性に乏
しい機械的合成音声しか生成できないという問題があ
る。
【0012】一般に周波数分析の欠点は、その周波数の
定倍の信号を検出してしまうことがあることであり、ピ
ッチ周波数分析においても、その倍の周波数(倍ピッ
チ)や半分の周波数(半ピッチ)を検出して、音声品質
の自然性が劣化した合成音声を生成してしまうことがあ
る。
【0013】また、従来、音声信号(残差信号)の帯域
内信号を一括して有声・無声と判定しているが、帯域内
すべてが同じ状態(有声・無声)でいることは無く、周
波数帯域ごとに有声・無声が混在することがある。ま
た、有声音声時においても、各周波数帯域ごとにピッチ
周期が異なることがある。
【0014】更に、上記の従来の音声通信装置では、L
PC分析は帯域内スペクトルを一括して表現させるた
め、通常使用する8個〜12個程度のLPC係数では、
エネルギーが集中している低域周波数帯に割り当てら
れ、高域周波数帯の表現精度が不十分になるため、フォ
ルマント帯域幅の過小推定、高次(第3次)フォルマン
トの近似性に劣り、忠実なスペクトルの再現ができない
場合がある。
【0015】更に音源信号は実際には定常的信号ではな
く、揺らぎを伴うものであり、周波数帯域ごとにその揺
らぎ幅が異なるものである。
【0016】なお、スペクトル精度の向上を図るため、
LPC係数を増加させることも考えられるが、LPC係
数の増加は、通信情報量の増加にもつながるため、12
個を越えるLPC係数の使用は望ましくなく、実際に狭
帯域通信を行う音声通信装置においては、12個を越え
るLPC係数の使用は現状では困難である。
【0017】本発明は以上の点に鑑みなされたもので、
より自然性の高い音声合成を再現するとともに、LPC
係数及び音源情報をベクトル量子化により情報量を圧縮
し、かつ、相互類似度の高いLPC係数は代表を1つの
み選択し更に情報量を圧縮することにより、LPC係数
を増加させることなく(情報量の増加を伴わずに)、よ
り忠実なスペクトルの再現(高品質音声)をすることが
できる音声通信装置及びその通信方法を提供することを
目的とする。
【0018】
【課題を解決するための手段】本発明の音声通信送信装
置は;予め定めた音声帯域を第1の分割数の帯域に分割
し、その分割帯域のそれぞれについて所定周期のフレー
ム化された入力音声信号を線形予測分析して線形予測係
数を出力する線形予測分析手段と;前記線形予測分析手
段から出力される分割帯域ごとの前記線形予測係数をベ
クトル量子化する第1の量子化手段と;同じ分割帯域ご
との前記線形予測係数と前記入力音声信号とを受け、残
差信号を抽出する逆フィルタ手段と;前記残差信号を第
2の分割数の帯域に分割し、その分割帯域のそれぞれの
残差信号に基づいて分割帯域ごとに音源信号を抽出する
音源分析手段と;前記分割帯域ごとの音源信号からケプ
ストラム信号を抽出するケプストラム分析手段と;前記
ケプストラム信号を基に前記音源信号を補正する音源補
正手段と;前記音源補正手段から出力される分割帯域ご
との補正された前記音源信号をベクトル量子化する第2
の量子化手段と;前記第1の量子化手段から出力される
分割帯域ごとの前記ベクトル量子化済線形予測係数をフ
レームを所定数分集成した大フレーム単位で蓄積するベ
クトル蓄積手段と;前記ベクトル蓄積手段に蓄積された
複数のベクトル量子化済線形予測係数を互いに類似性の
あるものとないものとに分離し、類似性ありとみなした
複数のベクトル量子化済線形予測係数の中から一つのみ
を代表ベクトル量子化済線形予測係数として選択する類
似度判定手段と;前記類似度判定手段から出力される前
記代表ベクトル量子化済線形予測係数及び類似性ありと
みなされなかった残りのベクトル量子化済線形予測係数
と、前記第2の量子化手段から出力される分割帯域ごと
の前記ベクトル量子化済音源信号とをそれぞれ多重化し
符号化音声信号として出力する多重化手段とを備える。
【0019】本発明の音声通信受信装置は;上記音声通
信送信装置からの符号化音声信号を受け、その信号から
分割帯域ごとの代表ベクトル量子化済線形予測係数及び
類似性ありとみなされなかった残りのベクトル量子化済
線形予測係数と、当該分割帯域ごとのベクトル量子化済
音源信号とをそれぞれ分離し、前記代表ベクトル量子化
済線形予測係数を類似性ありとみなしたフレーム数分の
ベクトル量子化済線形予測係数として複製し、前記類似
性ありとみなされなかった残りのベクトル量子化済線形
予測係数とともに大フレーム分の値に復元するととも
に、各ベクトル値をスカラー値に復元する分離手段と;
前記分離手段から出力される分割帯域ごとの前記線形予
測係数及び音源信号から全帯域分の合成音声信号を再生
する合成手段とを備える。
【0020】本発明の音声通信装置は、音声信号を入力
し符号化音声信号として伝送路へ出力する上記構成の音
声通信送信装置と、前記伝送路を介して前記音声通信送
信装置と接続され入力された符号化音声信号から合成音
声信号を再生する上記構成のの音声通信受信装置とから
成る。
【0021】本発明の音声通信送信方法は;予め定めた
音声帯域を第1の分割数の帯域に分割し、その分割帯域
のそれぞれについて所定周期のフレーム化された入力音
声信号を線形予測分析して線形予測係数を求め;前記線
形予測分析手段から出力される分割帯域ごとの前記線形
予測係数をベクトル量子化し;同じ分割帯域ごとの前記
線形予測係数と前記入力音声信号とから残差信号を抽出
し;前記残差信号を第2の分割数の帯域に分割し、その
分割帯域のそれぞれの残差信号に基づいて分割帯域ごと
に音源信号を抽出し;前記分割帯域ごとの音源信号から
ケプストラム信号を抽出し;前記ケプストラム信号を基
に前記音源信号を補正し;前記分割帯域ごとの補正され
た音源信号をベクトル量子化し;前記分割帯域ごとの前
記ベクトル量子化済線形予測係数をフレームを所定数分
集成した大フレーム単位で蓄積し;蓄積された複数のベ
クトル量子化済線形予測係数を互いに類似性のあるもの
とないものとに分離し、類似性ありとみなした複数のベ
クトル量子化済線形予測係数の中から一つのみを代表ベ
クトル量子化済線形予測係数として選択し;前記代表ベ
クトル量子化済線形予測係数及び類似性ありとみなされ
なかった残りのベクトル量子化済線形予測係数と、前記
ベクトル量子化済音源信号とをそれぞれ多重化し符号化
音声信号として出力する工程を有する。
【0022】本発明の音声通信受信方法は、上記音声通
信送信方法により処理された符号化音声信号を受信し、
その信号から分割帯域ごとの代表ベクトル量子化済線形
予測係数及び類似性ありとみなされなかった残りのベク
トル量子化済線形予測係数と、当該分割帯域ごとのベク
トル量子化済音源信号とをそれぞれ分離し、前記代表ベ
クトル量子化済線形予測係数を類似性ありとみなしたフ
レーム数分のベクトル量子化済線形予測係数として複製
し、前記類似性ありとみなされなかった残りのベクトル
量子化済線形予測係数とともに大フレーム分の値に復元
するとともに、各ベクトル値をスカラー値に復元し、前
記復元された分割帯域ごとの線形予測係数及び音源信号
から全帯域分の合成音声信号を再生する工程を有する。
【0023】本発明の音声通信方法は、送信側にて、入
力音声信号を上記音声通信送信方法により処理し符号化
音声信号として伝送路へ送出し、受信側にて、前記伝送
路を介して受信した符号化音声信号を上記音声通信受信
方法により合成音声信号として再生する工程を有する。
【0024】
【発明の実施の形態】まず、本発明の概要を説明する。
本発明の音声通信装置は、音声信号をスペクトラル包絡
情報及び音源信号を生成し符号化音声信号として伝送す
る音声通信装置に関し、複数種類の周波数分析器、逆フ
ィルタ、音源補正器、及びベクトル量子化器を備えた音
声通信送信装置と、この音声通信送信装置と伝送路を介
して接続される音源信号復調器を備えた音声通信受信装
置とから成る。
【0025】音声通信送信装置は、音声帯域を第1の分
割帯域それぞれについて所定周期のフレーム化された入
力音声信号を線形予測分析(LPC分析)して線形予測
係数(LPC係数)を出力する線形予測分析手段と、線
形予測係数をベクトル量子化する第1の量子化手段と、
線形予測係数と入力音声信号との残差信号を抽出する逆
フィルタ手段と、残差信号から第2の分割帯域ごとに音
源信号を抽出する音源分析手段と、音源信号からケプス
トラム信号を抽出するケプストラム分析手段と、ケプス
トラム信号を基に音源信号を補正する音源補正手段と、
補正された音源信号をベクトル量子化する第2の量子化
手段と、ベクトル量子化済線形予測係数をフレームを所
定数分集成した大フレーム単位で蓄積するベクトル蓄積
手段と、蓄積された複数のベクトル量子化済線形予測係
数を互いに類似性のあるものとないものとに分離し、類
似性ありとみなした複数のベクトル量子化済線形予測係
数の中から一つのみを代表ベクトル量子化済線形予測係
数として選択する類似度判定手段と、ベクトル量子化済
線形予測係数及び類似性ありとみなされなかった残りの
ベクトル量子化済線形予測係数と、ベクトル量子化済音
源信号とをそれぞれ多重化し符号化音声信号として出力
する多重化手段とを備える。
【0026】音声通信受信装置は、符号化音声信号を受
け、その信号から分割帯域ごとの代表ベクトル量子化済
線形予測係数及び類似性ありとみなされなかった残りの
ベクトル量子化済線形予測係数と、当該分割帯域ごとの
ベクトル量子化済音源信号とをそれぞれ分離し、代表ベ
クトル量子化済線形予測係数を類似性ありとみなしたフ
レーム数分のベクトル量子化済線形予測係数として複製
し、類似性ありとみなされなかった残りのベクトル量子
化済線形予測係数とともに大フレーム分の値に復元する
とともに、各ベクトル値をスカラー値に復元する分離手
段と、線形予測係数及び音源信号から合成音声信号を再
生する合成手段とを備える。
【0027】本発明では、分割帯域のそれぞれについて
入力音声信号を線形予測分析して線形予測係数(LPC
係数)を得るようにしたため、従来のLPC分析の欠点
といわれていた(1)フォルマント帯域幅の過小推定、
(2)第3フォルマントの近似性の悪さをそれぞれ改善
でき、このLPC係数を用いて逆フィルタにより高精度
の残差信号を抽出することができる。
【0028】また、この高精度の残差信号を更に帯域分
割し、それぞれについて音源分析手段にて音源信号を得
るようにしたため、各帯域ごとに混在している有声音声
/無声音声を分離し、有声音声においては各帯域ごとに
最適な音源情報の抽出ができる。
【0029】更に、各帯域ごとに音源信号の揺らぎを測
定し、かつ補正するため、自然音声に近い揺らぎを持つ
音源信号の抽出ができる。従って、個々の特性に合わせ
た精度の良い音源情報を抽出することができるため、本
来の人間の発声機構に忠実な音声分析・合成ができる。
【0030】加えて、ベクトル量子化済線形予測係数を
全て伝送するのではなく、類似性のあるベクトル値は一
つの代表ベクトル値のみ伝送する代表ベクトル送出方式
であるため、音質を保ちながら、通信情報量の削減をす
ることができる。
【0031】次に、本発明の実施の形態について図面を
参照して詳細に説明する。
【0032】図1は本発明の音声通信送信装置100の
一実施の形態を示すブロック図である。同図において、
入力音声信号は音声帯域制限用ローパスフィルタ(LP
F)110により、例えば300Hz〜3.4kHzの
電話音声帯域に制限された後、アナログ・ディジタル変
換器(A/D変換器)120に供給されて、所定の標本
化周波数(例えば8kHz)で標本化された所定量子化
ビット数(例えば16ビット)のディジタル音声データ
に変換される。この音声データは所定周期(本例では2
2.5msec)で連続するフレームで構成されてお
り、以下の処理においては、このフレーム単位で処理さ
れる。
【0033】この音声データは、バンドパスフィルタ群
130に供給されて、所定の周波数帯域ごとの複数の帯
域に分割される。本例では、1.2kHzを中心に2分
割される。すなわち、音声データは、バンドパスフィル
タ群130を構成するバンドパスフィルタ(BPF)1
31及び132にそれぞれ供給され、BPF131から
帯域が300Hz〜1.2kHz、BPF132から帯
域が1.2kHz〜3.4kHzとされて取り出され
る。
【0034】BPF131及び132から出力された各
帯域分割音声データは、分割帯域ごとに対応して設けら
れた線形予測分析器(LPC分析器)141及び142
にそれぞれ供給され、公知の線形予測分析によりLSP
パラメータ、αパラメータ等のLPC係数(線形予測係
数))に変換された後、LPC逆フィルタ160にA/
D変換器120の出力音声データと共に入力される。
【0035】各LPC分析器141及び142からのL
PC係数(本例ではαパラメータを使用)を圧縮・量子
化するためのベクトル量子化器151及び152にそれ
ぞれ入力し、各々のLPC係数のベクトル量子化値(ベ
クトル量子化済LPC係数)を算出しベクトル蓄積器1
81及び182にそれぞれ送出する。
【0036】各ベクトル蓄積器181及び182は、音
声の声道周期として違和感のない100msec〜22
0msec程度の時間長に相当するように音声データの
フレームを複数集成して大フレームとし(本例は1フレ
ーム22.5msecとして、10フレームを1大フレ
ームとしている)、この大フレーム単位にそれを構成す
る各フレームに対応するベクトル値(ベクトル量子化済
LPC係数)を蓄積するとともに、類似度判定器191
及び192にそれぞれ送出する。
【0037】各類似度判定器191及び192は、前述
の大フレームを構成する10フレーム分のベクトル信号
(ベクトル量子化済LPC係数)の中から互いに類似性
のある信号を抽出し、その中の一つのみを代表ベクトル
として選択する。実験的には、有声音声の場合は10フ
レーム中2〜5フレームが類似性があると算出される場
合が多い。よって線形予測ベクトル量子化情報量の2〜
5フレーム分のデータを1フレーム分のデータとして選
択された代表ベクトル値(代表ベクトル量子化済LPC
係数)と、類似性なしと判定されたベクトル値(ベクト
ル量子化済LPC係数)とを多重化器10へ送る。この
ように、互いに類似性のある2〜5フレーム分のデータ
を1フレーム分のデータとするので1/2〜1/5に情
報圧縮が可能である。
【0038】一方、LPC逆フィルタ160は、A/D
変換器120の出力音声データに対し、LPC分析器1
41及び142からの2つの分割帯域のLPC係数を用
いて線形予測分析のスペクトル包絡特性とは逆のフィル
タ特性を付与し、残差信号を出力する。
【0039】この残差信号は、バンドパスフィルタ群1
70に供給されて複数の帯域に分割される。本例では、
1.5kHzと2.5kHzを境にして帯域が3分割さ
れる。すなわち、残差信号は、バンドパスフィルタ群1
70を構成するBPF171,172,及び173にそ
れぞれ供給され、BPF171から300Hz〜1.5
kHzの周波数成分が取り出され、BPF172から
1.5kHz〜2.5kHzの周波数成分が取り出さ
れ、BPF173から2.5kHz〜3.4kHzの周
波数成分が取り出される。
【0040】各BPF171,172,及び173から
それぞれ取り出された帯域分割残差信号は、分帯域ごと
に対応してそれぞれ複数個(本例は2個)ずつ設けられ
た音源分析器211〜212、221〜222、及び2
31〜232にそれぞれ供給され、ここで2乗和されて
分割帯域ごとの音源信号(電力)として取り出される。
【0041】各音源分析器211〜212、221〜2
22、及び231〜232からの各帯域ごとの音源信号
は、対応するケプストラム分析器311〜312、32
1〜322、及び331〜332にそれぞれ供給され
る。
【0042】各ケプストラム分析器311〜312、3
21〜322、及び331〜332は、各帯域ごとの音
源信号の周波数軸上のケプストラム値(ケフレンシー)
を算出し、対応する音源補正器411〜412、421
〜422、及び431〜432にそれぞれ出力する。
【0043】各音源補正器411〜412、421〜4
22、及び431〜432は、ケプストラム値のケフレ
ンシー上の分散値を測定し、分散が小さいときには、定
常信号と判断、分散が大きいときは揺らぎがある信号と
判断する。揺らぎがあると判断された音源信号はピッチ
周期(声帯信号)に同期した変動(揺らぎ)を与え補正
する。更に、各音源補正器411〜412、421〜4
22、及び431〜432の出力は、次に説明する各帯
域対応の判定器501,502,及び503を通して、
第2のベクトル量子化器である、ベクトル量子化器51
1,512,及び513にそれぞれ出力する。
【0044】なお、音源分析器、ケプストラム分析器、
及び音源補正器を各帯域ごとに2つずつ設けるのは次の
理由による。音源分析にあたり、BPF群170で各帯
域に分割された出力信号を、それぞれの帯域ごとでの倍
ピッチ又は半ピッチを含めて算出するように更に2分割
し、それぞれの計算結果からどちらかの分割側(2個の
うち1個)がより正しいかを各帯域ごとに判定器50
1,502,及び503で判定して、入力信号により近
い値を示す分析ルートを正しい値とし、そのルートから
得られた値を正しい各帯域ごとの分析情報とするためで
ある。
【0045】各ベクトル量子化器511,512,及び
513は、判定器501,502,及び503でそれぞ
れ選択された側の音源補正器411〜412、421〜
422、及び431〜432で補正された音源信号のベ
クトル量子化値(ベクトル量子化済音源信号)をそれぞ
れ算出する。
【0046】多重化器520は、ベクトル量子化器51
1,512,及び513からそれぞれ取り出された分割
帯域ごとのベクトル量子化された音源信号(電力)と、
もう一つのベクトル量子化器151及び152(ベクト
ル蓄積器、類似度判定器経由)からそれぞれ取り出され
た2つの分割帯域のベクトル量子化されたLPC係数と
をそれぞれ多重化し、符号化音声信号として伝送路70
0へ出力する。
【0047】図2は本発明の音声通信受信装置800の
一実施の形態を示すブロック図である。同図において、
分離器810は、伝送路700を介して音声通信送信装
置100から入力された符号化音声信号より、送信側と
同様の3つの分割帯域のベクトル量子化された音源信号
(電力)と2つの分割帯域のベクトル量子化されたLP
C係数とをそれぞれ分離するとともに、選択された代表
ベクトル値(ベクトル量子化済LPC係数)を類似性あ
りとみなしたフレーム数分のベクトル値として複製し、
類似性なしと判定されたベクトル値ととともに大フレー
ム(10フレーム)分の値に復元した後、通常の線形計
算に扱えるスカラー値に復元する。
【0048】このうちLPC係数はLPC補間器820
に供給され、音声帯域の上位側と下位側をそれぞれ示し
ているLPC値(ベクトル値)を、線形演算で扱えるス
カラー値に変更した後、両LPC係数(スカラー値)を
単純に重ね合わせることで、音声全帯域を表現している
LPC係数に再生し、ここで一定周期(例えば22.5
msec)ごとに入力されるLPC係数の前回の入力値
と今回の入力値とを利用した線形補間値から、例えば
5.625msec単位のLPC係数に修正される(換
言すると、22.5msec単位で変化するLPC係数
が、5.625msec単位で変化するLPC係数に変
換される)。
【0049】また、分離器810により分離された分割
帯域ごとの音源信号(電力)は、音源復調器830に供
給され、ここで帯域ごとの音源信号(電力)を補間処理
して全帯域(300Hz〜3.4kHz)のピッチ情報
に復元される。ここで音源復調器830は、3つのバン
ドパスフィルタ群を持ち、それぞれ、低域、中域、高域
の音源再生用として、各帯域ごとの音源情報(スカラー
値)をフィルタ係数とし、その帯域に対応したピッチ情
報をエネルギーとして駆動する。そしてこの3つのフィ
ルタの出力の線形和が、音声全帯域を表す音源情報とな
る。
【0050】LPC合成フィルタ840は、LPC補間
器820から出力された修正後のLPC係数をフィルタ
係数とし、音源復調器830から出力された復調後のピ
ッチ情報を入力エネルギーとしたディジタル合成音声デ
ータを再生する。
【0051】このディジタル合成音声データは、ディジ
タル・アナログ変換器(D/A変換器)850に供給さ
れてディジタル・アナログ変換されてアナログ信号の合
成音声信号として取り出され、次段のLPF860によ
り不要周波数成分を除去された後、再成合成音声信号と
して出力される。
【0052】このように、この実施の形態では、音声信
号帯域を2分割して得られたLPC係数を用いてLPC
逆フィルタ160により抽出した高精度の残差信号を更
に3つの帯域に分割し、それぞれについて音源分析器2
11〜212、221〜222、及び231〜232に
て音源信号を得ることにより、各帯域ごとに混在してい
る有声音声/無声音声を分離し、個々の特性に合わせた
精度の良い音源情報を抽出することができ、かつ各帯域
ごとに音源信号の揺らぎを測定し補正するため、自然音
声に近い揺らぎを持つ音源信号の抽出ができる。従っ
て、本来の人間の発声機構に忠実な音声分析・合成がで
きる。
【0053】更に周波数分析上の欠点である倍周期検出
を補正するために、音源分析器を2分割し、BPF群1
70で分割されたそれぞれの帯域における倍ピッチ又
は、半ピッチを含めて算出しているため、分析エラーを
極限できるという特徴を持つ。
【0054】また、声道情報であるベクトル量子化済線
形予測(LPC)係数を全て送るのではなく、類似性の
あるものは一つの代表値のみを送るため、音質の低下な
しで、通信情報量の削減ができる。
【0055】なお、本発明は上記の実施の形態に限定さ
れるものではなく、例えばバンドパスフィルタ群130
及び170の各BPFの特性は固定として説明したが、
入力情報を基に中心周波数を可変することもでき、ま
た、分割数も2分割から4分割程度まで可能であるこ
と、ケプストラムの分散値の判定は本実施例では固定と
して説明したが、ピッチ周波数に応じて可変してもよい
ことが実験的に確認されている。従来のLPCボコーダ
はLPC分析に40ビット、ピッチに7ビット、音源に
6ビット、同期に1ビットの計54ビットを1フレーム
22.5msecとして伝送(54/22.5m=24
00bps)としている。
【0056】今回の方式はLPC分析におけるベクトル
量子化器(151、152)のそれぞれのビット割当を
10ビットとし、計20ビットをLPC係数に割り当て
る。また、代表値選択情報用としての類似度判定情報を
3ビットとし、計6ビットを割り当てる。更に音源情報
にしてもベクトル量子化器(511、512、513)
のそれぞれのビットを4ビットとし、計12ビットを音
源情報に割り当てる。また、ピッチ情報として各帯域の
音源ごとに5ビットの計15ビットを割り当てる。(L
PC係数20ビット、類似度判定情報6ビット、音源情
報12ビット、ピッチ情報15ビット、同期1ビットの
計54ビットで実現できる)よって、本発明の実施例に
おいて、更なる音質向上をビット情報の増加無く実現で
きることがわかる。
【0057】
【発明の効果】以上説明したように、本発明によれば、
分割帯域のそれぞれについて入力音声信号を線形予測分
析して線形予測係数(LPC係数)を用いて逆フィルタ
により高精度の残差信号を抽出した後、この高精度の残
差信号を更に帯域分割し、それぞれについて音源分析手
段にて音源信号を得ることにより、各帯域ごとに混存し
ている有声音声/無声音声を分離するようにしたため、
個々の特性に合わせた(各周波数帯域ごとに最適な)精
度の良い音源情報を抽出することができるとともに、周
波数分析上の欠点といえる、倍ピッチ、半ピッチによる
分析エラーを防ぐことができ、各帯域ごとに音源信号の
揺らぎを測定しかつ補正するため自然音声に近い揺らぎ
を持つ音源信号の抽出をし、本来の人間の発声機構に忠
実な音声分析・合成ができ、より自然性の高い合成音声
を得ることができる。また、ベクトル量子化済線形予測
(LPC)係数を全て送るのではなく、類似性のあるも
のは一つの代表値のみを送るため、LPC係数の増加な
く(通信情報量の削減)、より忠実なスペクトルの再現
(音質の低下なし)ができるとともに、より情報の圧縮
度が高い狭帯域音声通信を行うことができる。
【図面の簡単な説明】
【図1】本発明の音声通信送信装置の一実施の形態を示
すブロック図である。
【図2】本発明の音声通信受信装置の一実施の形態を示
すブロック図である。
【図3】従来の音声通信送信装置及び音声通信受信装置
を示すブロック図である。
【符号の説明】
100 音声通信送信装置 110,860 ローパスフィルタ(LPF) 120 A/D変換器 130,170 バンドパスフィルタ群 131,132,171〜173 バンドパスフィル
タ(BPF) 141,142 LPC分析器 151,152,511〜513 ベクトル量子化器 160 LPC逆フィルタ 211,212,221,222,231,232
音源分析器 311,312,321,322,331,332
ケプストラム分析器 411,412,421,422,431,432
音源補正器 501〜503 判定器 520 多重化器 800 音声通信受信装置 810 分離器 820 LPC補間器 830 音源復調器 840 LPC合成フィルタ 850 D/A変換器

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 予め定めた音声帯域を第1の分割数の帯
    域に分割し、その分割帯域のそれぞれについて所定周期
    のフレーム化された入力音声信号を線形予測分析して線
    形予測係数を出力する線形予測分析手段と、 前記線形予測分析手段から出力される分割帯域ごとの前
    記線形予測係数をベクトル量子化する第1の量子化手段
    と、 同じ分割帯域ごとの前記線形予測係数と前記入力音声信
    号とを受け、残差信号を抽出する逆フィルタ手段と、 前記残差信号を第2の分割数の帯域に分割し、その分割
    帯域のそれぞれの残差信号に基づいて分割帯域ごとに音
    源信号を抽出する音源分析手段と、 前記分割帯域ごとの音源信号からケプストラム信号を抽
    出するケプストラム分析手段と、 前記ケプストラム信号を基に前記音源信号を補正する音
    源補正手段と、 前記音源補正手段から出力される分割帯域ごとの補正さ
    れた前記音源信号をベクトル量子化する第2の量子化手
    段と、 前記第1の量子化手段から出力される分割帯域ごとの前
    記ベクトル量子化済線形予測係数をフレームを所定数分
    集成した大フレーム単位で蓄積するベクトル蓄積手段
    と、 前記ベクトル蓄積手段に蓄積された複数のベクトル量子
    化済線形予測係数を互いに類似性のあるものとないもの
    とに分離し、類似性ありとみなした複数のベクトル量子
    化済線形予測係数の中から一つのみを代表ベクトル量子
    化済線形予測係数として選択する類似度判定手段と、 前記類似度判定手段から出力される前記代表ベクトル量
    子化済線形予測係数及び類似性ありとみなされなかった
    残りのベクトル量子化済線形予測係数と、前記第2の量
    子化手段から出力される分割帯域ごとの前記ベクトル量
    子化済音源信号とをそれぞれ多重化し符号化音声信号と
    して出力する多重化手段とを備えることを特徴とする音
    声通信送信装置。
  2. 【請求項2】 請求項1記載の音声通信送信装置からの
    符号化音声信号を受け、その信号から分割帯域ごとの代
    表ベクトル量子化済線形予測係数及び類似性ありとみな
    されなかった残りのベクトル量子化済線形予測係数と、
    当該分割帯域ごとのベクトル量子化済音源信号とをそれ
    ぞれ分離し、前記代表ベクトル量子化済線形予測係数を
    類似性ありとみなしたフレーム数分のベクトル量子化済
    線形予測係数として複製し、前記類似性ありとみなされ
    なかった残りのベクトル量子化済線形予測係数とともに
    大フレーム分の値に復元するとともに、各ベクトル値を
    スカラー値に復元する分離手段と、 前記分離手段から出力される分割帯域ごとの前記線形予
    測係数及び音源信号から全帯域分の合成音声信号を再生
    する合成手段とを備えることを特徴とする音声通信受信
    装置。
  3. 【請求項3】 音声信号を入力し符号化音声信号として
    伝送路へ出力する請求項1記載の音声通信送信装置と、
    前記伝送路を介して前記音声通信送信装置と接続され入
    力された符号化音声信号から合成音声信号を再生する請
    求項2記載の音声通信受信装置とから成ることを特徴と
    する音声通信装置。
  4. 【請求項4】 予め定めた音声帯域を第1の分割数の帯
    域に分割し、その分割帯域のそれぞれについて所定周期
    のフレーム化された入力音声信号を線形予測分析して線
    形予測係数を求め、 前記線形予測分析手段から出力される分割帯域ごとの前
    記線形予測係数をベクトル量子化し、 同じ分割帯域ごとの前記線形予測係数と前記入力音声信
    号とから残差信号を抽出し、 前記残差信号を第2の分割数の帯域に分割し、その分割
    帯域のそれぞれの残差信号に基づいて分割帯域ごとに音
    源信号を抽出し、 前記分割帯域ごとの音源信号からケプストラム信号を抽
    出し、 前記ケプストラム信号を基に前記音源信号を補正し、 前記分割帯域ごとの補正された音源信号をベクトル量子
    化し、 前記分割帯域ごとの前記ベクトル量子化済線形予測係数
    をフレームを所定数分集成した大フレーム単位で蓄積
    し、 蓄積された複数のベクトル量子化済線形予測係数を互い
    に類似性のあるものとないものとに分離し、類似性あり
    とみなした複数のベクトル量子化済線形予測係数の中か
    ら一つのみを代表ベクトル量子化済線形予測係数として
    選択し、 前記代表ベクトル量子化済線形予測係数及び類似性あり
    とみなされなかった残りのベクトル量子化済線形予測係
    数と、前記ベクトル量子化済音源信号とをそれぞれ多重
    化し符号化音声信号として出力することを特徴とする音
    声通信送信方法。
  5. 【請求項5】 請求項4記載の音声通信送信方法により
    処理された符号化音声信号を受信し、その信号から分割
    帯域ごとの代表ベクトル量子化済線形予測係数及び類似
    性ありとみなされなかった残りのベクトル量子化済線形
    予測係数と、当該分割帯域ごとのベクトル量子化済音源
    信号とをそれぞれ分離し、前記代表ベクトル量子化済線
    形予測係数を類似性ありとみなしたフレーム数分のベク
    トル量子化済線形予測係数として複製し、前記類似性あ
    りとみなされなかった残りのベクトル量子化済線形予測
    係数とともに大フレーム分の値に復元するとともに、各
    ベクトル値をスカラー値に復元し、前記復元された分割
    帯域ごとの線形予測係数及び音源信号から全帯域分の合
    成音声信号を再生することを特徴とする音声通信受信方
    法。
  6. 【請求項6】 送信側にて、入力音声信号を請求項4記
    載の音声通信送信方法により処理し符号化音声信号とし
    て伝送路へ送出し、受信側にて、前記伝送路を介して受
    信した符号化音声信号を請求項5記載の音声通信受信方
    法により合成音声信号として再生することを特徴とする
    音声通信方法。
JP36564099A 1999-12-22 1999-12-22 音声通信装置及びその通信方法 Expired - Fee Related JP3468184B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36564099A JP3468184B2 (ja) 1999-12-22 1999-12-22 音声通信装置及びその通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36564099A JP3468184B2 (ja) 1999-12-22 1999-12-22 音声通信装置及びその通信方法

Publications (2)

Publication Number Publication Date
JP2001184098A true JP2001184098A (ja) 2001-07-06
JP3468184B2 JP3468184B2 (ja) 2003-11-17

Family

ID=18484759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36564099A Expired - Fee Related JP3468184B2 (ja) 1999-12-22 1999-12-22 音声通信装置及びその通信方法

Country Status (1)

Country Link
JP (1) JP3468184B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
WO2004049304A1 (ja) * 2002-11-25 2004-06-10 Matsushita Electric Industrial Co., Ltd. 音声合成方法および音声合成装置
US7752052B2 (en) 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
US7752052B2 (en) 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
US8209188B2 (en) 2002-04-26 2012-06-26 Panasonic Corporation Scalable coding/decoding apparatus and method based on quantization precision in bands
WO2004049304A1 (ja) * 2002-11-25 2004-06-10 Matsushita Electric Industrial Co., Ltd. 音声合成方法および音声合成装置
CN100365704C (zh) * 2002-11-25 2008-01-30 松下电器产业株式会社 声音合成方法以及声音合成装置
US7562018B2 (en) 2002-11-25 2009-07-14 Panasonic Corporation Speech synthesis method and speech synthesizer

Also Published As

Publication number Publication date
JP3468184B2 (ja) 2003-11-17

Similar Documents

Publication Publication Date Title
US7596492B2 (en) Apparatus and method for concealing highband error in split-band wideband voice codec and decoding
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
US5873059A (en) Method and apparatus for decoding and changing the pitch of an encoded speech signal
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JPH06118995A (ja) 広帯域音声信号復元方法
JPS62234435A (ja) 符号化音声の復号化方式
JP2011150357A (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JPS5936275B2 (ja) 残留励起予測音声符号化方式
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
KR20030041169A (ko) 무성 음성의 코딩 방법 및 장치
US6141637A (en) Speech signal encoding and decoding system, speech encoding apparatus, speech decoding apparatus, speech encoding and decoding method, and storage medium storing a program for carrying out the method
JPH0636158B2 (ja) 音声分析合成方法及び装置
US5826221A (en) Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values
JP4726445B2 (ja) 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP3468184B2 (ja) 音声通信装置及びその通信方法
JP3201268B2 (ja) 音声通信装置
JP3282595B2 (ja) 音声符号化・復号化装置及び通信装置
JP2581696B2 (ja) 音声分析合成器
JP2973966B2 (ja) 音声通信装置
JP3166673B2 (ja) ボコーダ符号化復号装置
JP2796408B2 (ja) 音声情報圧縮装置
JPH11102199A (ja) 音声通信装置
JP2004077688A (ja) 音声通信装置
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030805

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100905

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130905

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees