JPS6019520B2

JPS6019520B2 - 音声処理装置

Info

Publication number: JPS6019520B2
Application number: JP53037496A
Authority: JP
Inventors: 哲田口
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1978-03-30
Filing date: 1978-03-30
Publication date: 1985-05-16
Also published as: JPS54133004A

Description

【発明の詳細な説明】本発明は狭帯城音声伝送を可能とした、又は合成音声の
音質を向上した音声の分析又は合成を行なう音声処理装
置に関する。

云わゆるボコーダ装置として知られている音声分析合成
装置、例えばチャネルボコーダ、ホルマントボコーダ、
相関ボコーダ、パターンマッチングボコーダ、位相ボコ
ーダ（以上５種類のボコーダは、例えば、加藤康雄、落
合和雄、「スペクトルに着目した処理伝送」、電子通信
学会誌、ＶＯＬ．５１．ＮＯ．１１．ページ１４２０〜
１４２６、昭和４３年１１月）、線形予測ボコーダ（例
えば、ＪｏｈｎＲＨａｓｋｅｗ、Ｊ．Ｍ．Ｋｅｌｌｙ、
Ｒｏ戊でｔＭ．Ｋｅｌｌｙ、ＪＲ．ａｎｄＴｈｏｍａｓ
日．Ｍｃｋｉｎｎｅｙ、“ＲｅＳ山ｔｓｏｆａ
ＳｔｕｄｙｏｆｔｈｅＬｉｎｅａｒＰｒｅｄｉ
ｃｔｉｏｎＶｏｃｏｄｅｒ’’、ｌＥＥＥＴｒａｎｓ
ａｃｔｉｏｎｓｏｎＣｏｍｍｕｎｉｃａｔｉｏｎｓ
、ＶＯＬ．ＣＯＭ−２１、Ｎｏ．９、Ｓｅｐｔｅｍ戊ｒ
ｌ９７３ｐｐ．１００８〜１０１５）、線スペクトルボ
コーダ（例えば、板倉文忠、東倉洋一、「擬ホルマント
ボコーダ」、電子通信学会技術研究報告、ＥＡ−７６−
２１、１９７母手７月２１日）等の音声分析合成装置は
、種々の音声の特徴を表現するパラメータを、分析側に
おいて被分析音声信号を分析して抽出し、前記パラメー
タを直接、又は他のパラメータに変換して（例えば線形
予測ボコーダにおいては、反射係数と直接的に又は間接
的に関係のある線形予測係数をＬＯＧＡＲＥＡＲＡＴ
ＩＯに変換する手段等、（例えば、ＪｏｈｎＮねｋｈ。

ｕｌ、‘‘ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ：Ａ
ＴｕｔｏｒｉａｌＲｅｖｉｅｖ ’’、Ｐｒｏｃｅ
ｅＤｉｎ鱗ｏｆ仇ｅｌＥＥＥ、ＶＯＬ．６３
、ＮＯ．４Ａｐｒｉｌｌ９７ふ第５７６ページ、Ｖ．Ｃ
．項）量子化し合成側へ伝送する。合成側では前記直接
的な又は変換された形の量子化パラメータを用いて音声
を合成する。前記の分析され、直接的に又は変換後に伝
送されるパラメータの多くは、その頻度分布が有声音と
無声音とで異なることが知られている。

例えば音源情報においては短時間平均電力（例えば、Ｂ
ｉＳｈｎｕＳ．Ａｔ，ａ１・Ｌａｗ汀ｅｎＣｅＲ．
Ｒａｂｉｎｅｒ、‘‘ＡＰａｔ企てｎＲｅＣｏｇｎｉ
ｔｉｏｎＡｐｐｒｏａｃｈのＶｏｉｃｅｄ −Ｕ
ｎｖｏｉｃｅｄ − ＳｉｌｅｎｃｅＣｌａｓ
ｓｉｆｉｃａｔｉｏｎ１５ｗｉｔｈＡｐｐｌｉｃａｔｉ
ｏｎｓｔｏＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎ
’’、ｌＥＥＥＴｒａ船ａｃｔｉｏｎｓｏｎＡｃｏ
ｕｓｔｉｃｓ、Ｓｐｅｅｃｈ、ａｎｄＳｉ部ａＩＰ
ｒｏｃｅｓｓｉｎｇ、ＶＯＬ．ＡＳＳＰ−２４．Ｎｏ．
幻皿ｅｌ９７０第２０３ページ、Ｆｉｇ一３）、スベク
トラム情報においては第１ホルマントの周波数帯城幅等
、多くのパラメータが有声と無声とではその分布を異と
している。特に線形予測ボコーダに用いられるパラメー
タの多くは、例えば前記短時間平均電力、予測残差電力
、線形方程式の直接的な解として求まる予測係数、前記
予測係数の変形である部分自己相関係数、正規化予測残
差電力等その分布は有声と無声とでは大きく異なる。

なお前記ＬＯＧＡＲＥＡＲＡＴＩＯは前記部分自己相
関係数から直接的に求まり、前記部分自己相関係数同様
、有声と無声とでは分布を異にする。本発明は有声と無
声とで分布を異にする分析パラメータを、有声／無声判
別結果に基いて、有声の場合には有声における各パラメ
ータの分布に適する軍子化を行ない、無声の場合には無
声における各パラメータの分布に適する量子化を行なう
ことにより、より精密な分析パラメータの量子化を実施
し得る音声分析合成装置を提供するものである。

本発明によれば、有声／無声の判別を行なって音声を分
析又は合成する音声処理装置において、前記有声／無声
の判別結果により、分析パラメータを有声、無声に対応
して量子化する手段と量子化された分析パラメータを有
声、無声に対応して復号する手段の少なくとも一方を具
備して成ることを特徴とする音声処理装置が得られる。

次に図面を参照して本発明を詳細に説明する。図は本発
明の一実施例を説明するためのブロック図である。図に
於いて、１０１は本発明の構成範囲を示す。１０２は分
析側を、１０３は合成側を、１０４は量子化パラメータ
伝送路を示す。

波形入力端子１１１を介して音声波形入力信号が有声／
無声判別回路１０５と分析器１０６とへ供給される。有
声／無声判別器１０５は周知の手段（例えば、谷戸文魔
、樽松明、「音声分析合成系における有声無声判定の検
討ハ昭和５２王度電子通信学会情報部門全国大会、論文
集、２０５ページ）により有声／無声判別を行ない、判
別結果を符号化器１０７へ出力する。分析器１０６は例
えば短時間平均電力、ピッチ周期、複数の線形予測係数
等の音声の特徴を表現するパラメータを前記音声波形入
力信号を分析することにより抽出し、抽出した各パラメ
ータを符号化器１０７へ出力する。符号化器１０７は有
声／無声判別器１０５より供給される有声／無声判別信
号に基づいて、分析器１０６より供給される各パラメー
タを、分布特性に基づいて最適に量子化する。例えば１
次の線形予測係数に対応する１次のＫパラメータ（部分
自己相関係数）Ｋ，値は有声音の場合十０．６〜十１．
０に集中し、無声音の場合には略−０．７〜十０．７に
わたって分布している。従って有声時のＫ，は十０．６
〜十１．０の範囲にのみ量子化ビットを割り当て、この
値を一定の量子化ステップで量子化し、無声時には−０
．７〜十０．７の領域にわたって量子化ビットを割り当
てて量子化を行なう。更に符号化器１０７は前記量子化
された各パラメータと有声／無声判別信号とを量子化パ
ラメータ伝送路１０４へ出力する。復号化器１０８は量
子化パラメータ伝送路１０４を介して供給される前記量
子化された各パラメータを同様に量子化パラメータ伝送
路１０４を介して供給される有声／無声判別信号に基づ
いて復号する。更に復号化器１０８は前記復号された各
パラメータと有声／無線判別信号とを合成器１０９へ出
力する。合成器１０９は前記復号された各パラメータと
無声／無声判別信号とから音声を合成し、波形出力端子
１１０を介して前記合成された音声を出力する。本発明
により、例えば同一の伝送容量においてはより精密な分
析パラメータの量子化効果により、合成側における合成
音の音質を向−上することができる。

また同一の音質を保障するのに必要な量子化ＢＩＴ数を
削減し得ることから、伝送容量を減少し得るのは明らか
である。言い換えるならば、例えば、いわゆるＫ，と呼
ばれる１次の部分自己相関係数の量子イ船ＩＴ数を有毒
と無声とで異なる数にする等の手段で、有声と無声とで
量子化ＢＩＴ数を異なる値に設定し、ある時間ブロック
単位で、もしくは長時間平均的に伝送容量を減少し得る
ことも明らかである。

また有声と無声とでパラメータの量子化ＢＩＴ数を変え
る場合には、例えば有声の場合により少ないＢＩＴ数で
量子化されるならば有声と無声との量子化ＢＩＴ数の差
のＢＩＴ数を有声を分析した結果か得られる他の新らし
いパラメータに与えることも可能である。更に、有声／
無声判別信号に基づいて適切なパラメータを選択するこ
とも可能である。以上述べた音声分析合成装置は、分析
側、合成側それぞれ単独で用いることが可能である。例
えば音声分析合成装置の分析側のみを用いたことに対応
する音声分析装置は、音声信号の圧縮等の用途に用いら
れる。ま音声分析合成装置の合成側のみを用いたことに
対応する音声合成装置は音声応答等の用途に用いられる
。以上の説明から明らかのように、本発明は有声と無声
とで分布を異にする分析パラメータを、有声／無声判別
結果に基づいて、有声の場合には、有声における各パラ
メータの分布に適する量子化を行ない、無声の場合には
無声における各パラメータの分布に適する量子化を行な
うことにより、より高度な音声信号の圧縮が可能となる
という効果を持つ。

【図面の簡単な説明】

図は本発明の一実施例を説明するためのブロック図であ
る。１０１・…・・本発明の構成範囲、１０２・・・・・・
分析側、１０３・・・・・・合成側、１０４・・・・・
・量子化パラメータ伝送路、１０５・・・・・・有声／
無声判別器、１０６・・・・・・分析器、１０７・・・
・・・符号化器、１０８・・・・・・復号化器、１０９
・・・・・・合成器、１１０・・…・波形出力端子、１
１１・・・・・・波形入力端子。

Claims

【特許請求の範囲】

１分析側では予め定めた時間間隔毎に入力音声信号の
周波数スペクトラムと音源情報等を示すパラメータおよ
び有声／無声判別情報を求めた後量子化し、合成側では
前記パラメータにより諸係数および励振音源情報が定ま
る合成フイルタによつて入力音声信号を合声する音声成
理装置において、分析側では前記パラメータのうち、有
声と無声とでその頻度分布が異なる特定のパラメータを
前記有声／無声判別情報に基づいて予め定めた量子化態
様で量子化し、合成側では前記有声／無声判別情報に基
づいて前記予め定めた量子化態様に対応して前記特定の
パラメータを復号することを特徴とする音声処理装置。