JP2001195099A - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JP2001195099A
JP2001195099A JP2000006501A JP2000006501A JP2001195099A JP 2001195099 A JP2001195099 A JP 2001195099A JP 2000006501 A JP2000006501 A JP 2000006501A JP 2000006501 A JP2000006501 A JP 2000006501A JP 2001195099 A JP2001195099 A JP 2001195099A
Authority
JP
Japan
Prior art keywords
voice
impulse
phase
signal
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000006501A
Other languages
English (en)
Inventor
Norio Nomura
規雄 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000006501A priority Critical patent/JP2001195099A/ja
Publication of JP2001195099A publication Critical patent/JP2001195099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 高品質な音声を伝送すると共に、必要と
する音声品質に応じて伝送レートを設定しフレキシブル
に利用範囲の広い音声処理装置を提供すること。 【解決手段】 ピッチ合成フィルタ4は、乗算器3の出
力信号としてピークパルス信号の前後に現れるピッチパ
ルス信号を補正し、位相合成フィルタ5は音声ピッチ合
成フィルタ4の出力信号における位相を補正し、最小位
相合成フィルタ6においては位相合成フィルタ5の出力
信号における振幅が最小となるように位相を補正し、音
声信号を高精度で生成する。位相合成フィルタ5におい
てはピッチ合成フィルタ4の出力信号における位相を補
正し、最小位相合成フィルタ6においては位相合成フィ
ルタ5の出力信号における振幅が最小となるように位相
を補正し、音声信号を高精度で生成して高品質な音声を
伝送する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特にディジタル音
声通信やディジタル音声記録等において音声品質や伝送
レートの異なる多種類のボイスレコーダを提供する際に
好適である音声処理装置に関する。
【0002】
【従来の技術】従来から音声処理装置には、例えば音響
分析によって音響の特徴要素を抽出し、これを狭帯域に
おいて伝送して受端において復号器において音声を再合
成して音声を生成する音声処理装置がある。このような
音声処理装置としては、特開平7−261798号公報
(音声分析合成装置)に記載されているものがある。こ
の装置においては、音声信号の符号情報から元の音声信
号を復元する際に肉声に近い音色などを実現することが
できる。
【0003】図10は従来の音声処理装置を音声ボイス
レコーダ(以下、「音声ボコーダ」という)に適用したも
のであり、音声ボコーダにおける復号器における構成を
説明するブロック図である。
【0004】同図において、Pはピッチ周期、U/Vは
有声または無声を示すフラグ、ゲインGは利得、LPC(L
inear Predict Code)は線形予測コードであり、これら
が符号化器(図示しない)から復号器50に伝送される
伝送パラメータである。この音声処理装置では、マルチ
プレクサ53は、有声音(V)のときインパルス列発生
器51の出力であるインパルス列を、無声音(U)のと
き雑音発生器52の出力であるランダム雑音を選択す
る。
【0005】そして、インパルス列発生器51により発
生されたインパルス列信号に、乗算器(調整手段)54
が利得を掛けてLPC合成フィルタ55を通過することに
より、音声を生成する。なお、符号化器(図示しない)
は、入力音声を分析して伝送パラメータを決定するが、
LPC合成フィルタ55のパラメータである線形予測コー
ドLPCを、線形予測分析により計算することができる。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
音声処理装置においては、線形予測コードLPCを線形予
測分析により計算するとき位相情報が失われるため、音
声波形を正確に生成することができず、音声品質が劣化
することがあるという問題がある。
【0007】また従来の音声処理装置では、位相特性を
補正する手段がないため、音声品質や伝送レートの異な
る多種類の音声ボコーダを構成することができないこと
があり、その結果として使用状況に応じて利用範囲を容
易に変えることができないという問題がある。
【0008】本発明はかかる点に鑑みてなされたもので
あり、高品質な音声を伝送すると共に、必要とする音声
品質に応じて伝送レートを設定しフレキシブルに利用範
囲の広い音声処理装置を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明の音声処理装置
は、インパルス信号を発生するインパルス発生手段と、
インパルス発生手段において発生したインパルス信号の
利得を調整し出力を調整する調整手段と、調整手段の出
力信号にピークパルス信号の前後に現れるピッチパルス
信号を生成付加する音声ピッチ補正手段と、音声ピッチ
補正手段の出力信号における位相特性を補正する位相補
正手段と、位相補正手段の出力信号におけるスペクトル
振幅特性を補正する最小位相補正手段と、を具備する構
成を採る。
【0010】この構成によれば、音声ピッチ補正手段に
おいて調整手段の出力信号に対してピークパルス信号の
前後に現れるピッチパルス信号を補正し、位相補正手段
においては音声ピッチ補正手段の出力信号における位相
特性を補正して、最小位相補正手段においては位相補正
手段の出力信号におけるスペクトル振幅特性を補正し、
合成音声の位相特性とスペクトル振幅特性を最適化し音
声信号を高精度で生成するようにしたため、高品質な音
声を伝送することができる。
【0011】本発明の音声処理装置は、インパルス信号
を発生するインパルス発生手段と、インパルス発生手段
において発生したインパルス信号の利得を調整する調整
手段と、調整手段の出力信号におけるピークパルス信号
の前後に現れるピッチパルス信号を補正する音声ピッチ
補正手段と、合成音声におけるスペクトル振幅特性が最
適になるように音声ピッチ補正手段の出力信号のスペク
トル振幅特性を補正する最小位相補正手段と、を具備す
る構成を採る。
【0012】この構成によれば、音声ピッチ合成フィル
タにおいて調整手段の出力信号としてピークパルス信号
の前後に現れるピッチパルス信号を補正し、最小位相合
成フィルタ6においては合成音声におけるスペクトル振
幅特性の誤差が最小となるようにスペクトル振幅特性を
補正することにより、音声信号を高精度で生成するよう
にしたため、位相補正手段を用いなくてもより少ない構
成により品質の比較的良好な音声を伝送し、かつ伝送レ
ートを減少させ必要とする音声品質に応じて伝送レート
を設定しフレキシブルで利用範囲を広くすることができ
る。
【0013】本発明の音声処理装置は、インパルス発生
手段において発生したインパルス信号の利得を調整する
調整手段と、調整手段の出力信号における位相特性を補
正する位相補正手段と、合成音声におけるスペクトル振
幅特性が最適となるように位相補正手段の出力信号のス
ペクトル振幅特性を補正する最小位相補正手段と、を具
備する構成を採る。
【0014】この構成によれば、位相補正手段において
調整手段の出力信号における位相特性を補正し、最小位
相補正手段においては合成音声におけるスペクトル振幅
特性が最適となるようにスペクトル振幅特性を補正し
て、音声信号を高精度で生成するようにしたため、音声
ピッチ補正手段を用いなくてもより少ない構成により品
質の比較的良好な音声を伝送し、かつ伝送レートを減少
させることができ必要とする音声品質に応じて伝送レー
トを設定しフレキシブルで利用範囲を広くすることがで
きる。
【0015】
【発明の実施の形態】本発明の骨子は、ディジタル音声
通信やディジタル音声記録等において音声品質や伝送レ
ートの異なる多種類のボイスレコーダを提供する際に、
音声品質に応じて伝送レートを設定し、音声品質を追求
したり、音声品質をやや落としても伝送レートを低減で
きるようにしたことである。
【0016】以下、本発明の実施の形態について、図面
を参照して詳細に説明する。
【0017】図1は、本発明の実施の形態1に係る音声
処理装置の一部の構成を示すブロック図である。なお、
図1は復号器1における構成である。復号器1に入力す
るパラメータは、Pがピッチ周期、ゲインGが利得、イ
ンパルス応答がそれぞれhpt[n],hap[n]及びhm
in[n]であるフィルタのフィルタ係数であり後述する
図3に示す符号器から復号器1に入力する。
【0018】同図において、復号器1は、インパルス信
号を発生するインパルス発生部(インパルス発生手段)
2を備えており、インパルス発生信号が乗算器(調整手
段)3に入力されるようになっている。
【0019】乗算器3は、インパルス発生部2の出力で
あるインパルス信号の利得(G:ゲイン)を調整して、
インパルスの大きさを決定するようになっている。
【0020】ピッチ合成フィルタ(音声ピッチ補正手
段)4は、乗算器3の出力信号とhpt[n]フィルタ
の出力信号に基づいて図5に示すピークパルス信号PHP
の前後に現れるピッチパルス信号PLPを合成(補正)す
るようになっている。
【0021】位相合成フィルタ(位相補正手段)5は、
ピッチ合成フィルタ4の出力信号とhap[n]フィル
タの出力信号に基づいて合成(補正)するようになって
いる。
【0022】最小位相合成フィルタ(最小位相補正手
段)6は、位相合成フィルタ5の出力信号とhmin
[n]フィルタの出力信号に基づいて合成(補正)する
ようになっている。
【0023】以上に説明した3種類のフィルタを使用す
るにおいては、インパルス応答の与え方により異なった
役割を持つようになっている。ピッチ合成フィルタ4は
音声の繰り返し特性を制御し、位相合成フィルタ5は位
相特性を制御し、さらに最小位相合成フィルタ6はスペ
クトル振幅特性を制御することができる。
【0024】図2は実施の形態の音声処理装置における
復号器の動作を説明する説明図である。
【0025】同図中において、*は畳みこみ演算を示す
ものである。図1に示すP、G、hpt[n]、hap
[n]、hmin[n]の伝送パラメータは音声のピッ
チ周期毎に伝送される。パルス位置P1におけるG×h
pt*hap*hminの音声からピッチ周期毎にパル
ス位置P2及びパルス位置P3のそれぞれの音声を図1
に示す復号器1において合成すると、復号音声DTが得
られる。
【0026】以上のように復号器1では、伝送パラメー
タP、G、hpt[n]、hap[n]、hmin
[n]を受信する毎に波形を合成し、以前に合成した波
形とオーバーラップして加算を行うことにより、復号音
声DTを作成することができる。なお、実際の音声信号
では、hpt[n]、hap[n]、hmin[n]が
1ピッチ周期前のものと相関が高いため、全てのピッチ
周期で伝送する必要はない。
【0027】図3は実施の形態の音声処理装置における
符号器の構成を説明するブロック図である。
【0028】同図において、符号器は図1に示す復号器
1のピッチ合成フィルタ4、位相合成フィルタ5、及び
最小位相合成フィルタ6のそれぞれのインパルス応答h
pt[n]、hap[n]、hmin[n]について複
素ケプストラム分析を用いて計算することができる。
【0029】図4は図1における音声処理装置の入力音
声s[n]の例を示す図である。入力音声s[n]を入
力すると、公知の手段である窓掛け処理11、FFT処
理12、複素LOG処理13、逆FFT処理14によ
り、複素ケプストラム分析e[n]を計算し、以下に詳
述するケプストラム分離15をする。複素ケプストラム
は、3つの成分ept[n]、eap[n]、emin
[n]に分離することができる。ここで、ケプストラム
次数Kであり、K=20程度の数である。
【0030】第1の成分ept[n]は、 ept[n]=e[n] (n<−K) =0 (−K≦n≦K) =e[n] (K<n) 第2の成分eap[n]は、 eap[n]=e[n] (−K≦n<0) =−e[−n] (0<n≦K) =0 (上記以外のn) 第3の成分emin[n]は、 emin[n]=e[0] (n=0) =e[n]+e[−n] (0<n≦K) =0 (上記以外のn)
【0031】以上のようにして求めた3つの成分ept
[n]、eap[n]、emin[n]からFFT処理
16、複素exp処理17及び逆FFT処理18を行い
インパルス応答hpt[n]、hap[n]、hmin
[n]を求めることができる。
【0032】図5は図1におけるピッチ合成フィルタ4
における図3による処理後のインパルス応答hpt
[n]を示す波形図、図6は位相合成フィルタ5におけ
る処理後のインパルス応答hap[n]を示す波形図、
図7は最小位相合成フィルタ6における処理後のインパ
ルス応答hmin[n]を示す波形図である。
【0033】図5に示すように、インパルス応答hpt
[n]では、信号の繰り返し成分を表し、ピークパルス
PHPの両側パルスが前後のピッチ波形PWである。図6に
示すように、インパルス応答hap[n]では、全域通
過特性c1となり、スペクトル振幅特性が平坦化する。
図7に示すように、インパルス応答hmin[n]で
は、最小位相特性c2になり、最小位相特性となるよう
にスペクトル振幅特性が得られる。
【0034】次に、実施の形態1の変形例1は請求項2
に対応するものであり、実施の形態1の構成から位相合
成フィルタ5を取り除いたものである。
【0035】図8は変形例1における位相合成フィルタ
のインパルス応答IPR1を示す図である。本変形例で
は、ピッチ合成フィルタ(音声ピッチ補正手段)4にお
いて乗算器(調整手段)3の出力信号としてピークパル
スPHPの前後に現れるピッチ波形PWのパルス信号を補正
(合成)し、最小位相合成フィルタ(最小位相補正手
段)においては合成音声におけるスペクトル振幅特性が
最適となるようにスペクトル振幅特性を補正して音声信
号を高精度で生成する。これにより、位相合成フィルタ
5を用いなくてもより少ない構成により品質の比較的良
好な音声を伝送し、かつ伝送レートを減少させ必要とす
る音声品質に応じて伝送レートを設定しフレキシブルで
利用範囲を広くすることができる。
【0036】次に、実施の形態1の変形例2は請求項3
に対応するものであり、実施の形態1の構成からピッチ
合成フィルタ4を取り除いたものである。
【0037】図9は変形例2におけるピッチ合成フィル
タのインパルス応答IPR2を示す図である。本変形例
では、位相合成フィルタ(位相補正手段)5において乗
算器(調整手段)3の出力信号における位相特性を補正
し、最小位相合成フィルタ(最小位相補正手段)6にお
いては合成音声におけるスペクトル振幅特性が最適とな
るようにスペクトル振幅特性を補正して音声信号を高精
度に生成する。これにより、ピッチ合成フィルタ4を用
いなくてもより少ない構成により品質の比較的良好な音
声を伝送し、かつ伝送レートを減少させ必要とする音声
品質に応じて伝送レートを設定しフレキシブルで利用範
囲を広くすることができる。
【0038】本発明の実施の形態及び変形例1、2で
は、音声品質や伝送レートの異なる多種類のボイスレコ
ーダを提供する際に、音声品質に応じて伝送レートを設
定することにより、音声品質を良好にすることが可能に
なるので、利用範囲を広くすることができる。
【0039】
【発明の効果】以上に説明したように、本発明によれ
ば、高品質な音声を伝送すると共に、必要とする音声品
質に応じて伝送レートを設定し、フレキシビルな利用範
囲の広い音声処理装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声処理装置の一
部の構成を示すブロック図
【図2】実施の形態の音声処理装置における復号器の動
作を説明する説明図
【図3】実施の形態の音声処理装置における符号器の構
成を説明するブロック図
【図4】図1における音声処理装置の入力音声の例を示
す図
【図5】図1におけるピッチ合成フィルタ4におけるイ
ンパルス応答を示す波形図
【図6】図1における位相合成フィルタにおけるインパ
ルス応答hap[n]を示す波形図
【図7】図1における最小位相合成フィルタにおけるイ
ンパルス応答を示す波形図
【図8】変形例1における位相合成フィルタのインパル
ス応答を示す図
【図9】変形例2におけるピッチ合成フィルタのインパ
ルス応答を示す図
【図10】従来の音声処理装置における復号器における
構成を説明するブロック図
【符号の説明】
1 復号器 2 インパルス発生部(インパルス発生手段) 3 乗算器(調整器) 4 ピッチ合成フィルタ(音声ピッチ補正手段) 5 位相合成フィルタ(位相補正手段) 6 最小位相合成フィルタ(最小位相補正手段)

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 インパルス信号を発生するインパルス発
    生手段と、 前記インパルス発生手段において発生したインパルス信
    号の利得を調整し出力を調整する調整手段と、 前記調整手段の出力信号としてピークパルス信号の前後
    に現れるピッチパルス信号を補正する音声ピッチ補正手
    段と、 前記音声ピッチ補正手段の出力信号における位相特性を
    補正する位相補正手段と、 合成音声におけるスペクトル振幅特性が最適となるよう
    に前記位相補正手段の出力信号のスペクトル振幅特性を
    補正する最小位相補正手段と、を具備することを特徴と
    する音声処理装置。
  2. 【請求項2】 インパルス信号を発生するインパルス発
    生手段と、 インパルス発生手段において発生したインパルス信号の
    利得を調整する調整手段と、 前記調整手段の出力信号としてピークパルス信号の前後
    に現れるピッチパルス信号を補正する音声ピッチ補正手
    段と、 合成音声におけるスペクトル振幅特性が最適となるよう
    に前記音声ピッチ補正手段の出力信号のスペクトル振幅
    特性を補正する最小位相補正手段と、を具備することを
    特徴とする音声処理装置。
  3. 【請求項3】 インパルス信号を発生するインパルス発
    生手段と、 前記インパルス発生手段において発生したインパルス信
    号の利得を調整し調整する調整手段と、前記調整手段の
    出力信号における位相特性を補正する位相補正手段と、 合成音声におけるスペクトル振幅特性が最適となるよう
    に前記位相補正手段の出力信号のスペクトル振幅特性を
    補正する最小位相補正手段と、を具備することを特徴と
    する音声処理装置。
JP2000006501A 2000-01-14 2000-01-14 音声処理装置 Pending JP2001195099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000006501A JP2001195099A (ja) 2000-01-14 2000-01-14 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000006501A JP2001195099A (ja) 2000-01-14 2000-01-14 音声処理装置

Publications (1)

Publication Number Publication Date
JP2001195099A true JP2001195099A (ja) 2001-07-19

Family

ID=18535019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000006501A Pending JP2001195099A (ja) 2000-01-14 2000-01-14 音声処理装置

Country Status (1)

Country Link
JP (1) JP2001195099A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514331A (ja) * 2005-10-31 2009-04-02 テレフオンアクチーボラゲット エル エム エリクソン(パブル) デジタルフィルタ遅延の低減

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514331A (ja) * 2005-10-31 2009-04-02 テレフオンアクチーボラゲット エル エム エリクソン(パブル) デジタルフィルタ遅延の低減

Similar Documents

Publication Publication Date Title
US5485543A (en) Method and apparatus for speech analysis and synthesis by sampling a power spectrum of input speech
RU2417457C2 (ru) Способ конкатенации кадров в системе связи
US9734835B2 (en) Voice decoding apparatus of adding component having complicated relationship with or component unrelated with encoding information to decoded voice signal
JP3522012B2 (ja) コード励振線形予測符号化装置
JPH06337699A (ja) ピッチ・エポック同期線形予測符号化ボコーダおよび方法
US6513007B1 (en) Generating synthesized voice and instrumental sound
WO2006090553A1 (ja) 音声帯域拡張装置
JP6428256B2 (ja) 音声処理装置
JP2001195099A (ja) 音声処理装置
US20090222268A1 (en) Speech synthesis system having artificial excitation signal
JP2600384B2 (ja) 音声合成方法
EP0421531B1 (en) Device for sound synthesis
JPH04116700A (ja) 音声分析・合成装置
JP3057907B2 (ja) 音声符号化装置
JP2615856B2 (ja) 音声合成方法とその装置
JP2871001B2 (ja) 音声分析合成装置
JPS6087400A (ja) マルチパルス型音声符号復号化装置
JPH0514280B2 (ja)
JPH06351095A (ja) 残響音生成方法
JPH01187000A (ja) 音声合成装置
JPH034300A (ja) 音声符号化復号化方式
JP2817196B2 (ja) 音声符号化方式
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JPH0339320B2 (ja)
JPS6265100A (ja) Csm型音声合成器