JP2973966B2 - 音声通信装置 - Google Patents

音声通信装置

Info

Publication number
JP2973966B2
JP2973966B2 JP9045345A JP4534597A JP2973966B2 JP 2973966 B2 JP2973966 B2 JP 2973966B2 JP 9045345 A JP9045345 A JP 9045345A JP 4534597 A JP4534597 A JP 4534597A JP 2973966 B2 JP2973966 B2 JP 2973966B2
Authority
JP
Japan
Prior art keywords
signal
sound source
linear prediction
band
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9045345A
Other languages
English (en)
Other versions
JPH10240296A (ja
Inventor
孝行 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9045345A priority Critical patent/JP2973966B2/ja
Publication of JPH10240296A publication Critical patent/JPH10240296A/ja
Application granted granted Critical
Publication of JP2973966B2 publication Critical patent/JP2973966B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声通信装置に係
り、特に線形予測符号化(LPC)分析・合成方式を用
いた音声通信装置に関する。
【0002】
【従来の技術】LPC係数と残差信号を用いたLPC分
析・合成方式の音声通信装置として、従来よりピッチ励
振型LPCボコーダが知られている。図2はこの従来の
音声通信装置としてのピッチ励振型LPCボコーダの一
例のブロック図を示す。同図中、入力音声信号は音声帯
域制限用ローパスフィルタ(LPF)21により例えば
300Hz〜3.4kHzの電話音声帯域に制限された
後、A/D変換器22に供給されて所定の標本化周波数
で標本化された、所定量子化ビット数の音声データに変
換される。
【0003】この音声データは、線形予測分析器(LP
C分析器)23に供給され、ここで公知の線形予測分析
によりkパラメータ、αパラメータ等の8ケ〜12ケ程
度のLPC係数に変換される。音源分析器24はこのL
PC係数を用いて公知の方法で残差信号を抽出し、更に
これを2乗和して音源信号(電力)を算出する。また、
上記の音声データは、ピッチ抽出器25に供給されて、
音源データのピッチ周波数(声帯振動数)が抽出され
る。以上のLPC分析器23から出力されたLPC係数
と、音源分析器24から出力された音源信号(電力)
と、ピッチ抽出器25から出力されたピッチ周波数と
は、それぞれ多重化器26に供給され、ここで多重化さ
れた後、伝送路を介して合成側へ送出される。
【0004】合成側(受信側)では入力された信号を分
離器27で上記のLPC係数、音源信号(電力)及びピ
ッチ周波数をそれぞれ分離する。パルス列発生器28は
分離器27よりのピッチ周波数に応じたインパルス列を
発生する。有声/無声判定器29は分離器27よりのピ
ッチ周波数及び電力から有声音声か無声音声かを判定
し、その判定結果をスイッチ回路31へスイッチング信
号として供給する。
【0005】スイッチ回路31は、有声音声判定時は上
記のスイッチング信号に基づき、パルス列発生器28か
らピッチ周期に対応した固定周期(固定間隔)で取り出
されたインパルス列を選択して音源復調器32へ供給
し、無声音声判定時は声帯振動が無くピッチ周波数が存
在しないため、前記ピッチ周波数に基づき固定周期的に
励振されるインパルス列の代わりに、上記のスイッチン
グ信号に基づき、雑音発生器30から取り出された白色
雑音信号に応じたランダムパルス列を選択して音源復調
器32へ供給する。
【0006】音源復調器32は、スイッチ回路からのパ
ルス列と分離器27により分離された電力とに基づいて
音源信号を復調する。LPC合成フィルタ33はこの復
調音源信号に励振され、分離器27により分離されたL
PC係数により係数が制御されてディジタル合成音声信
号を出力する。このディジタル合成音声信号は、D/A
変換器34に供給されてアナログ信号に変換された後、
LPF35により不要周波数成分が除去されて電話音声
帯域の音声信号とされて出力される。
【0007】このように、従来の音声通信装置では、有
声音声の合成に際し、音源情報を電話音声帯域(300
Hz〜3.4kHz)で一括分析し、その結果得られた
ピッチ周波数に応じた固定周期でパルス列発生器28か
らインパルス列を発生している。
【0008】
【発明が解決しようとする課題】しかし、本来の自然音
声(有声音声)声帯振動は、一定(固定周期)ではな
く、肉声の変化に応じた時間的、周波数的揺らぎ、瞬時
変動を伴う準周期的な動作をしている。しかるに、上記
の従来の音声通信装置では、音源情報(ピッチ周波数)
を分析するにあたって、上述した肉声の周波数的揺ら
ぎ、時間的揺らぎを無視して、電話音声帯域(300H
z〜3.4kHz)を定常信号とみなし、全帯域を一括
して分析しているため、その肉声の変動に伴う時間的、
周波数的な揺らぎを表現し得ず、このため、自然性に乏
しい機械的合成音声しか生成できないという問題があ
る。
【0009】また、従来、音声信号(残差信号)の帯域
内信号を一括して有声・無声と判定しているが、帯域内
すべてが同じ状態(有声・無声)でいることは無く、周
波数帯域毎に有声・無声が混在することがある。また、
有声音声時においても、各周波数帯域毎にピッチ周期が
異なることがある。
【0010】更に、上記の従来の音声通信装置では、L
PC分析は帯域内スペクトルを一括して表現させるた
め、通常使用する8ケ〜12ケ程度のLPC係数では、
エネルギーが集中している低域周波数帯に割り当てら
れ、高域周波数帯の表現精度が不十分になるため、フォ
ルマント帯域幅の過小推定、高次(第3次)フォルマン
トの近似性に劣り、忠実なスペクトルの再現ができない
場合がある。
【0011】なお、スペクトル精度の向上を図るため、
LPC係数を増加させることも考えられるが、LPC係
数の増加は、通信情報量の増加にもつながるため、12
ケを越えるLPC係数の使用は望ましくなく、実際に狭
帯域通信を行う音声通信装置においては、12ケを越え
るLPC係数の使用は現状では困難である。
【0012】本発明は以上の点に鑑みなされたもので、
より自然性の高い音声合成が再現できる音声通信装置を
提供することを目的とする。
【0013】また、本発明の他の目的は、LPC係数を
増加させることなく、情報量の増加を伴わずにより忠実
なスペクトルの再現(高品質音声)ができる音声通信装
置を提供することにある。
【0014】また、本発明の更に他の目的は、LPC係
数及び音源情報をベクトル量子化により情報量を更に圧
縮することにより、従来方式と同じ音質を実現するの
に、より少ない情報、すなわち狭帯域型の音声通信装置
を提供することにある。
【0015】
【課題を解決するための手段】上記の目的を達成するた
め、本発明は、予め定めた音声帯域を第1の分割数の帯
域に分割してその分割帯域のそれぞれについて入力音声
信号を線形予測分析して線形予測係数を出力する線形予
測分析手段と、前記線形予測分析手段から出力された分
割帯域毎の前記線形予測係数を別々にベクトル量子化す
る第1の量子化手段と、前記線形予測分析手段から出力
された分割帯域毎の前記線形予測係数と前記入力音声信
号とを受け、残差信号を抽出する逆フィルタと、前記逆
フィルタからの残差信号を第2の分割数の帯域に分割
し、その分割帯域のそれぞれの残差信号に基づいて分割
帯域毎に音源信号を抽出する音源分析手段と、前記音源
分析手段から出力された分析帯域毎の前記音源信号をベ
クトル量子化する第2の量子化手段と、前記第1の量子
化手段から出力された分割帯域毎の前記線形予測係数と
前記第2の量子化手段から出力された分割帯域毎の前記
音源信号とをそれぞれ多重化して伝送路へ出力する多重
化器と、前記伝送路を経て入力された信号から前記分割
帯域毎の線形予測係数と分割帯域毎の音源信号とをそれ
ぞれ分離すると共にスカラー値に復元する分離器と、前
記分離器からの前記線形予測係数と音源信号とから合成
音声信号を再生する合成手段とを有する構成としたもの
である。
【0016】この発明では、分割帯域のそれぞれについ
て入力音声信号を線形予測分析して線形予測係数(LP
C係数)を得るようにしたため、従来のLPC分析の欠
点といわれていたフォルマント帯域幅の過小推定、
第3フォルマントの近似性の悪さをそれぞれ改善でき、
このLPC係数を用いて逆フィルタにより高精度の残差
信号を抽出することができる。
【0017】また、本発明は、この高精度の残差信号を
更に帯域分割し、それぞれについて音源分析手段にて音
源信号を得るようにしたため、各帯域毎に混在している
有声音声/無声音声を分離し、有声音声においては各帯
域毎に最適な音源情報の抽出ができる。従って、この発
明では、個々の特性に合わせた精度の良い音源情報を抽
出することができるため、本来の人間の発声機構に忠実
な音声分析・合成ができる。更に、本発明は、第1及び
第2の量子化手段により、LPC係数及び音源情報をそ
れぞれベクトル量子化することにより、情報量を更に圧
縮できる。
【0018】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面と共に説明する。
【0019】図1は本発明になる音声通信装置の一実施
の形態のブロック図を示す。同図において、入力音声信
号は音声帯域制限用ローパスフィルタ(LPF)1によ
り例えば300Hz〜3.4kHzの電話音声帯域に制
限された後、A/D変換器2に供給されて所定の標本化
周波数(例えば8kHz)で標本化された、所定量子化
ビット数(例えば16ビット)の音声データに変換され
る。
【0020】この音声データは、バンドパスフィルタ群
3に供給されて1.2kHzを中心に帯域を2分割され
る。すなわち、音声データはバンドパスフィルタ群3を
構成するバンドパスフィルタ(BPF)3及び3
それぞれ供給され、BPF から帯域が300Hz〜
1.2kHzとされて取り出される一方、BPF3
ら帯域が1.2kHz〜3.4kHzとされて取り出さ
れる。
【0021】BPF3及び3から出力された帯域分
割音声データは、分割帯域毎に対応して設けられた線形
予測分析器(LPC分析器)4及び4に供給され、
公知の線形予測分析によりLSPパラメータ、αパラメ
ータ等のLPC係数に変換された後、LPC逆フィルタ
6にA/D変換器2の出力音声データと共に入力され
る。
【0022】また、LPC分析器41及び42からのLP
C個数(ここではαパラメータを使用)は、ベクトル量
子化器51及び52に供給されて圧縮・量子化され、それ
ぞれのベクトル量子化されたLPC係数が多重化器10
に供給される。
【0023】LPC逆フィルタ6はA/D変換器2の出
力音声データに対し、LPC分析器4及び4からの
2つの分割帯域のLPC係数を用いて線形予測分析のス
ペクトル包絡特性とは逆のフィルタ特性を付与し、残差
信号を出力する。この残差信号は、バンドパスフィルタ
群7に供給されて1.5kHzと2.5kHzを境にし
て帯域が3分割される。すなわち、残差信号は、バンド
パスフィルタ群7を構成するBPF71、72及び73
それぞれ供給され、BPF71から300Hz〜1.5
kHzの周波数成分が取り出され、BPF72から1.
5kHz〜2.5kHzの周波数成分が取り出され、B
PF73から2.5kHz〜3.4kHzの周波数成分
が取り出される。
【0024】BPF71、72及び73からそれぞれ取り
出された帯域分割残差信号は、分割帯域毎に対応して設
けられた音源分析器81、82及び83にそれぞれ供給さ
れ、ここで2乗和されて分割帯域毎の音源信号(電力)
として取り出される。更に、音源分析器81、82及び8
3の出力音源信号は、第2のベクトル量子化器であるベ
クトル量子化器91、92及び93に供給される。多重化
器10は、ベクトル量子化器91、92及び93からそれ
ぞれ取り出された分割帯域毎の音源信号(電力)と、も
う一つのベクトル量子化器51及び52からそれぞれ取り
出された2つの分割帯域のLPC係数とをそれぞれ多重
化して伝送路へ出力する。
【0025】合成側(受信側)では入力された多重化信
号を、分離器12で上記の3つの分割帯域の音源信号
(電力)と2つの分割帯域のLPC係数にそれぞれ分離
すると共に、ベクトル値を通常の線形計算に扱えるスカ
ラー値に復元する。このうち、LPC係数はLPC補間
器13に供給され、ここで一定周期(例えば20mse
c)毎に入力されるLPC係数の前回の入力値と今回の
入力値とを利用した線形補間値から、例えば5msec
単位のLPC係数に修正される(換言すると、20ms
ec単位で変化するLPC係数が、5msec単位で変
化するLPC係数に変換される。)。
【0026】また、分離器12により分離された分割帯
域毎の音源信号(電力)は音源復調器14に供給され、
ここで帯域毎の音源信号(電力)を補間処理して全帯域
(300Hz〜3.4kHz)のピッチ情報(音源情
報)に復元される。LPC合成フィルタ15は、LPC
補間器13から出力された修正後のLPC係数をフィル
タ係数とし、音源復調器14から出力された復調後のピ
ッチ情報を入力エネルギーとしたディジタル合成音声デ
ータを再生する。
【0027】このディジタル合成音声データは、D/A
変換器16に供給されてディジタル・アナログ変換され
てアナログ信号の合成音声信号として取り出され、次段
のLPF17により不要周波数成分を除去された後、再
生合成音声信号として出力される。
【0028】このように、この実施の形態では、音声信
号帯域を2分割して得られたLPC係数を用いてLPC
逆フィルタ6により抽出した高精度の残差信号を更に3
つの帯域に分割し、それぞれについて音源分析器8
及び8にて音源信号を得ることにより、各帯域毎
に混在している有声音声/無声音声を分離し、個々の特
性に合わせた精度の良い音源情報を抽出することができ
る。従って、本来の人間の発声機構に忠実な音声分析・
合成ができる。また、ベクトル量子化器51、52及び9
1〜93により、情報量の更なる圧縮を可能にしている。
【0029】なお、本発明は上記の実施の形態に限定さ
れるものではなく、例えばバンドパスフィルタ群3及び
7の各BPFの特性は固定として説明したが、入力情報
を基に中心周波数を可変することもでき、また、分割数
も2分割から4分割程度まで可能であることが実験的に
確認されている。
【0030】
【発明の効果】以上説明したように、本発明によれば、
分割帯域のそれぞれについて入力音声信号を線形予測分
析して線形予測係数(LPC係数)を用いて逆フィルタ
により高精度の残差信号を抽出した後、この高精度の残
差信号を更に帯域分割し、それぞれについて音源分析手
段にて音源信号を得ることにより、各帯域毎に混在して
いる有声音声/無声音声を分離するようにしたため、個
々の特性に合わせた(各周波数帯域毎に最適な)精度の
良い音源情報を抽出することができ、本来の人間の発声
機構に忠実な音声分析・合成ができ、より自然性の高い
合成音声を得ることができる。
【0031】また、本発明によれば、LPC係数を増加
させることなく、より忠実なスペクトルの再現ができ、
しかも、LPC係数及び音源情報をそれぞれベクトル量
子化により情報量を更に圧縮しているため、より情報の
圧縮度が高い狭帯域音声通信を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態のブロック図である。
【図2】従来の一例のブロック図である。
【符号の説明】
1 音声帯域制限用ローパスフィルタ(LPF) 2 A/D変換器 3、7 パンドパスフィルタ群 3、3、7、7、7 パンドパスフィルタ
(BPF) 4、4 LPC分析器 5、5、91〜93 ベクトル量子化器 6 LPC逆フィルタ 8、8、8 音源分析器 10 多重化器 12 分離器 13 LPC補間器 14 音源復調器 15 LPC合成フィルタ 16 D/A変換器 17 ローパスフィルタ(LPF)
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/20 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 予め定めた音声帯域を第1の分割数の帯
    域に分割してその分割帯域のそれぞれについて入力音声
    信号を線形予測分析して線形予測係数を出力する線形予
    測分析手段と、 前記線形予測分析手段から出力された分割帯域毎の前記
    線形予測係数を別々にベクトル量子化する第1の量子化
    手段と、 前記線形予測分析手段から出力された分割帯域毎の前記
    線形予測係数と前記入力音声信号とを受け、残差信号を
    抽出する逆フィルタと、 前記逆フィルタからの残差信号を第2の分割数の帯域に
    分割し、その分割帯域のそれぞれの残差信号に基づいて
    分割帯域毎に音源信号を抽出する音源分析手段と、 前記音源分析手段から出力された分析帯域毎の前記音源
    信号をベクトル量子化する第2の量子化手段と、 前記第1の量子化手段から出力された分割帯域毎の前記
    線形予測係数と前記第2の量子化手段から出力された分
    割帯域毎の前記音源信号とをそれぞれ多重化して伝送路
    へ出力する多重化器と、 前記伝送路を経て入力された信号から前記分割帯域毎の
    線形予測係数と分割帯域毎の音源信号とをそれぞれ分離
    すると共にスカラー値に復元する分離器と、 前記分離器からの前記線形予測係数と音源信号とから合
    成音声信号を再生する合成手段とを有することを特徴と
    する音声通信装置。
  2. 【請求項2】 前記合成手段は、前記分離器からのスカ
    ラー値とされた前記分割帯域毎の音源信号に対して信号
    間の補間処理をして前記予め定めた音声帯域の音源情報
    を復元する音源復調器と、前記分離器により分離された
    前記線形予測係数をフィルタ係数とし、前記音源復調器
    からの音源情報を入力エネルギーとして前記合成音声信
    号を再生する合成フィルタとを有することを特徴とする
    請求項1記載の音声通信装置。
  3. 【請求項3】 前記分離器により分離された前記分割帯
    域毎の線形予測係数を入力信号として受け、該入力信号
    の前回の値と今回の値との線形補間値から入力信号間隔
    よりも短い時間間隔で値が変化する線形予測係数に修正
    して前記合成フィルタへ前記フイルタ係数として出力す
    るLPC補間器を有することを特徴とする請求項2記載
    の音声通信装置。
JP9045345A 1997-02-28 1997-02-28 音声通信装置 Expired - Fee Related JP2973966B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9045345A JP2973966B2 (ja) 1997-02-28 1997-02-28 音声通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9045345A JP2973966B2 (ja) 1997-02-28 1997-02-28 音声通信装置

Publications (2)

Publication Number Publication Date
JPH10240296A JPH10240296A (ja) 1998-09-11
JP2973966B2 true JP2973966B2 (ja) 1999-11-08

Family

ID=12716706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9045345A Expired - Fee Related JP2973966B2 (ja) 1997-02-28 1997-02-28 音声通信装置

Country Status (1)

Country Link
JP (1) JP2973966B2 (ja)

Also Published As

Publication number Publication date
JPH10240296A (ja) 1998-09-11

Similar Documents

Publication Publication Date Title
KR100242864B1 (ko) 디지탈 신호 부호화 장치 및 방법
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US7596492B2 (en) Apparatus and method for concealing highband error in split-band wideband voice codec and decoding
KR100472585B1 (ko) 음성신호의재생방법및장치와그전송방법
JPH06118995A (ja) 広帯域音声信号復元方法
JPS62234435A (ja) 符号化音声の復号化方式
JPH0636158B2 (ja) 音声分析合成方法及び装置
JPH11177434A (ja) 音声符号化復号方式
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP3201268B2 (ja) 音声通信装置
JP2581696B2 (ja) 音声分析合成器
JP2973966B2 (ja) 音声通信装置
Esteban et al. 9.6/7.2 kbps voice excited predictive coder (VEPC)
JP3468184B2 (ja) 音声通信装置及びその通信方法
JP2796408B2 (ja) 音声情報圧縮装置
JP3282595B2 (ja) 音声符号化・復号化装置及び通信装置
JP3166673B2 (ja) ボコーダ符号化復号装置
JPH11102199A (ja) 音声通信装置
JP3994332B2 (ja) 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム
JP2004077688A (ja) 音声通信装置
JPH0756599A (ja) 広帯域音声信号復元方法
JP3338885B2 (ja) 音声符号化復号化装置
JPH11145846A (ja) 信号圧縮伸張装置及び方法
JP2535809B2 (ja) 線形予測型音声分析合成装置
JPH0437999B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees