JP2000276199A

JP2000276199A - 音声符号化方法及び送信装置及び受信装置

Info

Publication number: JP2000276199A
Application number: JP11079025A
Authority: JP
Inventors: Isao Tejima; 功手嶋
Original assignee: Kokusai Electric Corp
Current assignee: Kokusai Electric Corp
Priority date: 1999-03-24
Filing date: 1999-03-24
Publication date: 2000-10-06

Abstract

(57)【要約】【課題】自然性を高めて再生音源の品質を向上するこ
とにより再生音声の品質を向上できる音声符号化方法及
び送信装置及び受信装置を提供する。【解決手段】分析フレームをサブフレーム分割器３ａ
で複数のサブフレームに分割し、サブフレーム毎にサブ
フレームピッチ抽出器４で有声／無声判定及びピッチ情
報の検出を行い、検出された複数のピッチ情報から基準
となる基準ピッチを基準ピッチ検出器５で決定し、サブ
フレームピッチ差分量子化器７で基準ピッチと各サブフ
レームのピッチ情報との差分を求め、基準ピッチ情報と
各サブフレームの有声／無声判定結果及び差分情報とを
それぞれ符号化して伝送する音声符号化方法及び送信装
置及び受信装置である。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、低速度の音声符号
化方法及び音声の送信装置及び受信装置に係り、特に、
再生音声の品質を向上できる音声符号化方法及び送信装
置及び受信装置に関するものである。

【０００２】

【従来の技術】電波資源の有効利用を目的とした低速度
の音声符号化において、数ｋｂｐｓ程度の音声符号化方
法は、符号励振型線形予測方式（Code Excited Linear
Prediction：ＣＥＬＰ）に代表されるハイブリッド符号
化が主流であり、良好な音声品質が実現されている。

【０００３】ここで、ＣＥＬＰ方式の概略について、図
４を使って簡単に説明する。図４は、一般的なＣＥＬＰ
方式を説明するブロック図である。ＣＥＬＰ方式はコー
ド駆動ＬＰＣ符号化といわれ、コードブック内の雑音を
音源として音声合成フィルタを駆動する方式であり、入
力音声と合成音声との間の誤差信号が最小となる最適雑
音駆動信号を抽出し、そのコードインデックスと利得情
報Ｇをパラメータとして伝送するものである。

【０００４】具体的には、予め音声信号の複数サンプル
をベクトルで表してベクトル符号をコードブック３０に
記憶しておき、入力音声をフレーム単位で取り込んで符
号化すると共に、コードブック３０に記憶されたものか
ら選択されたコードを増幅器３２で増幅したものとそれ
までに符号化された情報に基づいて現在のフレームの音
声を長期予測器３４及び短期予測器３６で予測した予測
結果とを加算器３３，３５で合成し、更に入力音声を減
算器３７で合成して聴覚重み付けフィルタ３８で聴覚重
み付けを行い、誤差電力最小化部３９で重み付けされた
音声波形の平均誤差計算を行って、歪みをできるだけ小
さくするようにコードブック３０のベクトルを選択し、
選択されたコードのインデックスと増幅器３２における
利得情報Ｇとを伝送するようになっている。

【０００５】一方、２４００ｂｐｓ程度の更に低速の領
域では、線形予測分析符号化方式（Linear Predictive
Coding：ＬＰＣ）に代表される分析合成型が主流であ
る。ここで、ＬＰＣ方式の概略について、図５を使って
説明する。図５は、一般的なＬＰＣ方式用いて音声伝送
する場合の概念を説明するブロック図である。ＬＰＣ方
式は、符号化側において、音声信号を分析フレーム単位
で線形予測分析したＬＰＣ係数と、分析フレーム単位で
判定した無声／有声の識別結果と、有声の場合のピッチ
周期と、電力情報とを符号化し、復号化側において、復
号化した無声／有声の識別結果を基にして、駆動音源と
して雑音或いは復号化したピッチ周期を持つ単一パルス
を切換えて音源として用い、再生された音源に復号化し
たＬＰＣ係数を合成して、音声を再生するものである。

【０００６】具体的に図５では、符号化した音声を伝送
する場合において、送信側で、音声信号を分析フレーム
単位で取り込んで、線形予測分析部４０で予測分析して
周波数特性（スペクトル情報）を表すＬＰＣ係数を出力
し、ＬＰＣ係数を符号化部４１で符号化すると共に、取
り込んだ音声信号についてピッチ分析部４２で音声の有
無を判定し、有声の場合にピッチ周期を検出し、更に電
力情報を取得して、音声の有無情報（図５ではＶ／ＵＶ
ｆｌａｇ）、ピッチ周期情報、電力情報（図５ではパ
ワー）を音源情報として符号化部４３で符号化して、分
析フレーム単位で符号化されたＬＰＣ係数、音声の有無
情報、ピッチ周期情報、電力情報を多重化部４４で多重
化して伝送する。

【０００７】一方、受信側では、受信した多重化された
情報を多重分離部４５で分離し、ＬＰＣ係数について復
号化部４６で復号化し、その他の音源情報については復
号化部４８で復号化し、音源再生部４９で復号された音
声の有無情報、ピッチ周期情報、電力情報に基づいて音
源を再生し、再生された音源とＬＰＣ係数とを合成フィ
ルタ４７で合成して分析フレーム単位の再生音声を出力
するようになっている。

【０００８】しかしながら、上記説明したＬＰＣ方式の
音声符号化方法では、音源再生のための情報に割り当て
られる情報量が限られるため、音源の単純なモデル化を
行うことになり、音声を有声／無声という２つの極端な
クラスに分け、有声の場合に１分析フレームを１つのピ
ッチ情報で表すため、ピッチの揺らぎ等を表現できず、
再生音声は自然性がかなり損なわれて機械的な音にな
り、また有声／無声判定の判定誤りが起きた場合など
は、音源の大きな品質劣化を引き起こし、再生音声の品
質低下が問題になっている。

【０００９】そこで、高品質な音声を再生するために、
予測分析して得られるＬＰＣ係数の伝送に関する改良策
として、特許第２６０５２５６号、特公平６−５０４４
０、特公平７−３１５２０、特公平６−３６１５７，特
公平７−９６００が提案されている。

【００１０】また、高品質な音声を再生するために、音
源情報の伝送に関する改良策として、特許第２６１５５
４８号に、音声の分析フレームをピッチ周期に応じた小
区間に分割し、小区間の内の代表的な区間のパルス列ま
たはパルス列と雑音の組み合わせで表して音源情報と
し、当該音源情報とピッチパラメータと、スペクトルパ
ラメータを伝送し、受信側で代表区間のパルス列に対し
て時間的に滑らかな変化を与える処理を施して音源信号
を再生し、更に音声信号を再生する音声符号化方法が提
案されている。

【００１１】また、再生音声品質を保ちながら、ビット
レートを削減する方法、又はビットレートを保ちながら
再生音声品質を向上させる方法として、特開平５−１３
６６９７号明細書には、２つの分析フレームを１組と
し、第１のフレームは通常フレームとして通常のＬＰＣ
係数、ピッチパルス間隔、振幅、有声／無声の判定結果
を伝送し、第２のフレームは差分フレームとして、通常
フレームの振幅，有声／無声の判定結果と、通常フレー
ムのＬＰＣ係数との差分と、通常フレームのピッチパル
ス間隔との差分と、２番目のピッチパルス間隔と振幅と
を伝送する音声符号化方法が提案されている。

【００１２】

【発明が解決しようとする課題】しかしながら、従来の
音声符号化方法では、分析フレーム単位の伝送データ内
で音源に割り当てられる情報量が限られるため、分析フ
レーム内の音声信号に関して音源の単純なモデル化を行
うことから音源の自然性が損なわれ、再生音声の品質が
低下するという問題点があった。

【００１３】また、従来の音声符号化方法を用いた音声
の伝送においては、伝送速度の低速化の為に２４００ｂ
ｐｓ以下にビットレートを落とす場合には、分析フレー
ム長を伸ばす必要があることから、さらに品質が低下す
るという問題点があった。

【００１４】本発明は上記実情に鑑みて為されたもの
で、自然性を高めて再生音源の品質を向上することによ
り再生音声の品質を向上できる音声符号化方法及び送信
装置及び受信装置を提供することを目的とする。

【００１５】

【課題を解決するための手段】上記従来例の問題点を解
決するための本発明は、音声の符号化側において、音声
の分析フレームを複数のサブフレームに分割し、サブフ
レーム単位で有声／無声情報と、有声の場合のピッチ情
報を取得し、取得したピッチ情報から基準となる基準ピ
ッチを決定して符号化すると共に、サブフレーム単位で
ピッチ情報と基準ピッチとの差分情報を求めて量子化
し、有声／無声情報と共に符号化し、復号化側におい
て、基準ピッチとサブフレーム単位の有声／無声情報及
び差分情報を用いて音源を再生する音声符号化方法及び
送信装置及び受信装置であり、有声／無声情報及び有声
の場合のピッチ情報の取得を時間軸上で細かく行うこと
で、ピッチの揺らぎを捕らえ、再生音源の品質を向上で
きる。

【００１６】上記従来例の問題点を解決するための本発
明は、音声の符号化側において、音声の分析フレームを
複数のサブフレームに分割し、サブフレーム単位で電力
情報を取得して符号化し、復号化側において、サブフレ
ーム単位の電力情報を用いて増幅し、音声を再生する送
信装置及び受信装置であり、音源情報の取得を時間軸上
で細かく行うことで、音声再生の品質をより向上でき
る。

【００１７】

【発明の実施の形態】本発明の実施の形態について図面
を参照しながら説明する。尚、以下で説明する機能実現
手段は、当該機能を実現する手段であれば、どのような
回路又は装置であっても構わず、また機能の一部又は全
部をソフトウェアで実現することも可能である。更に、
機能実現手段を複数の回路によって実現してもよく、複
数の機能実現手段を単一の回路で実現してもよい。

【００１８】本発明に係る音声符号化方法は、分析フレ
ームを複数のサブフレームに分割し、サブフレーム単位
で有声／無声判定及びピッチ情報の検出を行い、検出さ
れた複数のピッチ情報から基準となる基準ピッチを決定
し、基準ピッチと各サブフレームのピッチ情報との差分
情報を求め、基準ピッチ情報と各サブフレームの有声／
無声判定結果及び差分情報とをそれぞれ符号化して伝送
するものなので、音源のモデル化単位を時間軸上で細か
くすることでピッチの揺らぎを捕らえて自然性を高め、
再生音源の品質を向上することによって、再生音声の品
質を向上できるものである。

【００１９】また、本発明に係る送信装置における音源
情報の符号化手段は、分析フレーム単位の音声信号を複
数のサブフレームに分割するサブフレーム分割手段と、
サブフレーム毎に有声／無声判定を行って有声／無声情
報を取得し、有声の場合にピッチ周期検出を行ってピッ
チ情報を取得するピッチ抽出手段と、検出された複数の
ピッチ情報から基準ピッチ情報を決定し、前記基準ピッ
チ情報を符号化する基準ピッチ決定符号化手段と、サブ
フレーム毎に、有声の場合のピッチ情報と基準ピッチ情
報との差分情報をとり、有声／無声情報と共に符号化し
てピッチ差分情報とするピッチ差分符号化手段とから構
成されている。

【００２０】これにより、サブフレーム分割手段によっ
て小さくした音源のモデル化単位で、ピッチ抽出手段に
よる有声／無声情報とピッチ情報の取得を行うため、時
間経過に伴うピッチの揺らぎを捕らえた詳細な音源情報
を得ることができ、且つ基準ピッチ決定符号化手段とピ
ッチ差分符号化手段とによって、基準ピッチと差分情報
とに表現することによって情報量を軽減できる。

【００２１】また、本発明に係る受信装置における音源
の復号化手段は、符号化された基準ピッチの情報を復号
する基準ピッチ復号手段と、サブフレーム毎にピッチ差
分情報を復号して、有声／無声情報と有声の場合の差分
情報を取得し、有声の場合に基準ピッチ情報と差分情報
からピッチ情報を算出するピッチ復号手段と、サブフレ
ーム毎に有声／無声情報とピッチ情報に従って音源を再
生する音源再生手段とから構成されている。

【００２２】これにより、基準ピッチ復号手段により復
号化された基準ピッチの情報とピッチ復号手段により復
号化されたサブフレーム毎の差分情報とによって音源再
生手段でサブフレーム単位で音源を再生するため、時間
経過に伴うピッチの揺らぎを表現でき、自然性を高めた
音源を再生でき、再生音源の品質を向上して再生音声の
品質を向上できるものである。

【００２３】ここで、本発明に係る音声符号化方法を用
いた音声の送信装置の構成について図１を使って説明す
る。図１は、本発明に係る送信装置の構成ブロック図で
ある。尚、図１では、サブフレーム数が２の場合を示し
ている。

【００２４】本発明の送信装置は、スペクトル分析手段
としてのＬＳＰパラメータ分析器１と、コードブック１
０と、ベクトル量子化器１１と、サブフレーム分割手段
としての逆フィルタ２と、サブフレーム分割器３ａと、
ピッチ抽出手段としてのサブフレームピッチ抽出器４-
1，４-2と、基準ピッチ決定符号化手段としての基準ピ
ッチ検出器５と、基準ピッチ符号器６と、ピッチ差分符
号化手段としてのサブフレームピッチ差分量子化器７-
1，７-2と、電力情報取得手段としての，サブフレーム
分割器３ｂと、サブフレーム電力抽出器８-1，８-2と、
サブフレーム電力符号器９-1，９-2と、多重化手段とし
ての多重化器１２とから構成されている。

【００２５】次に、本発明の送信装置の送信側の各部に
ついて説明する。ＬＳＰパラメータ分析器１は、請求項
のスペクトルパラメータ分析器に相当し、入力される分
析フレーム単位の音声信号をスペクトルパラメータ分析
してスペクトルパラメータを取り出すものである。本発
明ではスペクトルパラメータ分析に線形予測（Linear P
redictive Coding：ＬＰＣ）分析を用い、ＬＳＰ係数が
計算されて線スペクトル対（Line Spectrum Pair：ＬＳ
Ｐ）に変換され、ＬＳＰパラメータが出力される。

【００２６】コードブック１０は、あらかじめトレーニ
ング信号により学習させておいたＬＳＰパラメータをコ
ードベクトルとして記憶しているＬＳＰパラメータのコ
ードブックである。

【００２７】ベクトル量子化器１１は、ＬＳＰパラメー
タ分析器１で求めたＬＳＰパラメータと、コードブック
１０のコードベクトルとを照合して最適なベクトルを選
択し、分析フレームに対するＬＳＰパラメータをコード
インデックスの形で出力するものである。

【００２８】逆フィルタ２は、入力した分析フレーム単
位の音声信号から、ＬＳＰパラメータ分析器１により求
めたＬＳＰパラメータを取り除いた音源信号（予測残
差）を算出するものである。

【００２９】サブフレーム分割器３ａは、逆フィルタ２
からの予測残差を複数のサブフレームに分割するもの
で、分割数は２〜５分割がよいが、ここでは２分割とし
て説明する。

【００３０】サブフレームピッチ抽出器４は、サブフレ
ーム毎に有声／無声の判定を行い、有声の場合にはピッ
チ周期を検出してピッチ情報とし、有声／無声の判定結
果（有声／無声情報）と有声の場合のピッチ情報とを出
力するものである。

【００３１】基準ピッチ検出器５は、サブフレーム毎に
サブフレームピッチ抽出器４で求められたピッチ情報の
中から、基準となる基準ピッチを決定するものである。
基準ピッチの決定方法としては、何れか１つのサブフレ
ームのピッチ情報を選択するか、又は各サブフレームの
ピッチ情報の最大値、中間値、最小値、平均値を取るな
どいろいろ考えられる。本願では、各サブフレームのピ
ッチ情報の最大値を基準値（基準ピッチ情報）と設定し
た。それは、各サブフレーム間でのピッチの差分は±両
方あるため、最大値を検出すれば他のサブフレームのピ
ッチ情報として、マイナス側すなわち基準ピッチより小
さい値だけを考慮すればよいことになり、後続の差分の
量子化が簡単で情報量を小さくできることになる。

【００３２】基準ピッチ符号器６は、基準ピッチ検出器
５で決定された基準ピッチ情報を量子化して基準ピッチ
量子化情報を出力し、更に基準ピッチ量子化情報を符号
化して基準ピッチ符号化情報を出力するものである。

【００３３】ここで、基準ピッチ情報の量子化及び符号
化の具体的な方法としてスカラー量子化の例で図６を用
いて説明する。図６は、本発明における基準ピッチ情報
の量子化及び符号化方法の具体例を説明する説明図であ
る。基準ピッチ情報の量子化及び符号化は、例えば、図
６に示すような量子化範囲と量子化値と符号語（インデ
ックス）からなる量子化テーブルを設け、当該量子化テ
ーブルに従って行われる。図６に示した例は、ピッチ情
報が例えば１〜５０の値であって有限のビット数（ここ
では４ビット）で符号化するための量子化テーブルであ
る。

【００３４】実際には、例えば、決定された基準ピッチ
情報が１７であるとすると、量子化範囲をサーチし、１
７が含まれる量子化範囲に対応する量子化値２０が基準
ピッチ量子化情報として出力される。そして、更に、量
子化値に対応付けられている符号語（インデックス）が
基準ピッチ符号化情報として出力されることになる。

【００３５】尚、実際に決定された基準ピッチ情報と量
子化値との間に差分がある場合（図６の例では２０−１
７＝３）に、この差分値を更に量子化して伝送すること
で伝送誤差を抑えることもできる。

【００３６】サブフレームピッチ差分量子化器７は、サ
ブフレームピッチ抽出器４から有声／無声フラグと有声
の場合のピッチ情報とを受け取り、当該ピッチ情報と基
準ピッチ符号器６から出力される基準ピッチ量子化情報
との差分情報（ピッチ差分）をとって量子化し、更に、
有声／無声情報と共に符号化してサブフレームのピッチ
差分情報として出力するものである。尚、基準ピッチ符
号器６において、基準ピッチ情報と基準ピッチ量子化情
報との差分も伝送するのであれば、ピッチ情報と基準ピ
ッチ情報との差分を差分情報として量子化、符号化して
伝送することによって、伝送誤差を抑え、受信機側にお
ける音声の再生精度が向上する。

【００３７】ピッチ差分の量子化の具体的な方法として
は、例えば、ピッチ差分量と有声／無声フラグに２ビッ
トを割り当てることとし、無声のとき二進数で００、ピ
ッチ差分量が０〜−１のとき０１、ピッチ差分量が−２
〜−３のとき１０、ピッチ差分量が−４以上のとき１１
とすることで２ビットで表すこととする。

【００３８】一般にピッチ周期の変動は小さいことか
ら、各サブフレームにおけるピッチ差分量は小さいので
割り当てビット数は２ビット程度で十分である。本実施
の形態では、この方法でサブフレームごとの音源信号を
符号化することによって、情報量をあまり増加させるこ
となく、時間経過に伴うピッチの揺らぎを表現でき自然
性を向上できる。

【００３９】サブフレーム分割器３ｂは、入力された分
析フレーム単位の音声信号を複数のサブフレームに分割
するもので、分割数は２〜５分割がよいが、サブフレー
ム分割器３ａと同様にここでは２分割として説明する。

【００４０】サブフレーム電力抽出器８は、サブフレー
ム毎に音声信号の自乗和で電力を算出して電力情報を出
力するものである。なお、電力情報の量子化、符号化に
当たってもピッチ情報の場合と同様な方法を用いれば低
速化に寄与可能であるが、電力情報は変動幅が大きいた
め、包絡線のなめらかさが失われることから音声品質が
劣化するおそれがある。そこで、電力に関しては、入力
音声のサブフレーム毎に独立に算出、量子化を行う。

【００４１】サブフレーム電力符号器９は、サブフレー
ム電力算出器８で求められたサブフレーム毎の電力情報
を符号化して、サブフレーム電力情報として出力するも
のである。

【００４２】多重化器１２は、ベクトル量子化器１１か
らのコードインデックスと、基準ピッチ符号器６からの
基準ピッチ符号化情報と、各サブフレームに対するサブ
フレームピッチ差分量子化器７からのピッチ差分情報
と、各サブフレームに対するサブフレーム電力量子化器
９からのサブフレーム電力情報とを多重化して多重化信
号を伝送路に出力するものである。

【００４３】次に、本発明の送信装置の送信側の動作に
ついて図１を用いて説明する。本発明の送信装置の送信
側では、送信する音声信号を、離散化してフレーム（分
析フレーム）単位で入力する。ここで、例えば分析フレ
ーム長は、４０ｍｓ程度とし、低ビットレート化し易く
する。

【００４４】そして、分析フレーム単位で入力された音
声信号からＬＳＰパラメータ分析器１によってＬＳＰパ
ラメータが取り出され、ベクトル量子化器１１でコード
ブック１０に予め記憶されているＬＳＰパラメータと照
合されて最適なベクトルが選択されてコードインデック
スが出力される。

【００４５】一方、分析フレーム単位で入力された音声
信号は、逆フィルタ２でＬＳＰパラメータ分析器１によ
り求めたＬＳＰパラメータが取り除かれて音源信号（予
測残差）が算出され、サブフレーム分割器３-aによって
複数（図１では２つ）のサブフレームに分割される。

【００４６】次に、分割されたサブフレーム毎に設けた
サブフレームピッチ抽出器４によって、それぞれ有声／
無声情報と有声の場合のピッチ情報とが取得されて出力
され、基準ピッチ検出器５によって、各サブフレームの
ピッチ情報から基準ピッチが決定され、基準ピッチ符号
器６で量子化されて基準ピッチ量子化情報が出力され、
更に基準ピッチ量子化情報が符号化されて、基準ピッチ
符号化情報が出力される。

【００４７】そして、各サブフレームピッチ差分量子化
器７において、基準ピッチ符号器６からの基準ピッチ量
子化情報と、各サブフレームピッチ抽出器４からのピッ
チ情報との差分情報（ピッチ差分）が取られて量子化さ
れ、ピッチ差分と有声／無声情報とが符号化されてサブ
フレームのピッチ差分情報として出力される。

【００４８】一方、分析フレーム単位で入力された音声
信号は、サブフレーム分割器３ｂによって、複数（図１
では２つ）のサブフレームに分割され、各々サブフレー
ム電力抽出器８で電力情報が算出され、サブフレーム電
力符号器９で符号化されて、サブフレーム電力情報とし
て出力される。

【００４９】そして、ベクトル量子化器１１からのコー
ドインデックスと、基準ピッチ符号器６からの基準ピッ
チ符号化情報と、各サブフレームに対応するサブフレー
ムピッチ差分量子化器７からのピッチ差分情報と、各サ
ブフレームに対応するサブフレーム電力量子化器９から
のサブフレーム電力情報とが、多重器１２で多重化され
て多重化信号が伝送路に出力される。

【００５０】この時、具体例として例えば、サンプリン
グ周波数８ｋＨｚフレーム長４０ｍｓとした場合の伝送
ビット配分は、図２に示すように、スペクトルパラメー
タのコードインデックスにｌ１ｂｉｔ、符号化された基
準ピッチ情報に５ｂｉｔ、サブフレームピッチ差分情報
に２ｂｉｔずつ計４ｂｉｔ、符号化サブフレーム電力情
報に６ｂｉｔずつ計１２ｂｉｔ与えた場合、合計３２ｂ
ｉｔ／フレームとなり、伝送速度は８００ｂｐｓとな
り、きわめて低速度化が実現できることになる。図２
は、本発明の多重化信号の具体例を示すフォーマット図
である。

【００５１】尚、伝送する情報量の軽減を重視する場合
には、電力情報の取得のためのサブフレーム化を省略し
ても構わない。その場合には、図１の構成からサブフレ
ーム分割器３ｂ、サブフレーム電力抽出器８-2、サブフ
レーム電力量子化器９-2が省略され、サブフレーム電力
抽出器８-1、サブフレーム電力量子化器９-1が、サブフ
レーム単位の信号ではなく分析フレーム単位の信号を扱
うように変更する。

【００５２】次に、本発明に係る音声符号化方法を実現
する受信装置の受信側の構成について図３を使って説明
する。図３は、本発明に係る受信装置の受信側の構成ブ
ロック図である。尚、図３では、サブフレーム数が２の
場合を示している。

【００５３】本発明の受信装置の受信側は、分離手段と
しての分離器１３と、基準ピッチ復号手段としての基準
ピッチ復号器１４と、ピッチ復号手段としてのサブフレ
ームピッチ復号器１６-1，１６-2と、音源再生手段とし
てのピッチ再生器１８-1，１８-2と及びノイズ発生器１
９及び切替器１５と、スペクトルパラメータ復号手段と
してのコードブック探索器２０と、コードブック２４
と、係数補間器２１と、電力情報復号手段としてのサブ
フレーム電力復号器１７-1，１７-2と、音声再生手段と
しての合成フィルタ２２と、増幅器２３とから構成され
ている。

【００５４】次に、本発明の受信装置の受信側の各部に
ついて説明する。分離器１３は、多重化信号を基準ピッ
チ符号化情報と、各サブフレームのピッチ差分情報と、
各サブフレームのサブフレーム電力情報と、コードイン
デックスとに分離出力するものである。

【００５５】基準ピッチ復号器１４は、基準ピッチ符号
化情報を復号化して基準ピッチ情報を出力するものであ
る。

【００５６】サブフレームピッチ復号器１６は、対応す
るサブフレームのピッチ差分情報を入力し、復号して有
声／無声情報及び有声の時の差分情報を取得し、有声の
ときには基準ピッチ復号器１４から出力される基準ピッ
チ情報と取得した差分情報から当該サブフレームのピッ
チ情報を算出するものである。尚、送信側におけるピッ
チ差分情報の符号化の際に量子化を行っているので、量
子化の範囲内でいかなる値を取るかは、任意である。

【００５７】ピッチ再生器１８は、対応するサブフレー
ムピッチ復号器１６からのピッチ情報に従って音源信号
を再生して出力するものである。ノイズ発生器１９は、
無声のときの適当なノイズ信号を発生するものである。

【００５８】切替器１５は、分離器１３から出力される
各サブフレームのピッチ差分情報を順に入力し、当該ピ
ッチ差分情報に含まれる有声／無声情報に従って、無声
の場合はノイズ発生器１９からのノイズ信号を取り込ん
で出力し、有声の場合はサブフレームに対応するピッチ
再生器１８からの再生された音源信号を取り込んで再生
音源信号を出力するものである。

【００５９】コードブック２４は、送信側のコードブッ
ク１０と同じ内容のＬＳＰパラメータをコードベクトル
として記憶しているＬＳＰパラメータコードブックであ
る。コードブック探索器２０は、コードインデックスを
入力し、コードブック２４を参照してコードインデック
スに対応するＬＳＰパラメータを出力するものである。

【００６０】係数補間器２１は、ＬＳＰパラメータを入
力し、以前の分析フレームのＬＳＰパラメータを保存し
ておき、現分析フレームのＬＳＰパラメータと線形補間
する事により、分析フレーム間でのＬＳＰパラメータを
なめらかに接続する補間ＬＳＰパラメータを出力するも
のである。

【００６１】合成フィルタ２２は、切替器１５から出力
される有声時若しくは無声時の再生音源信号と係数補間
器２１から出力される補間ＬＳＰパラメータを合成して
合成音声を出力するものである。

【００６２】サブフレーム電力復号器１７は、サブフレ
ーム毎のサブフレーム電力情報を復号するものである。
増幅器２３は、各サブフレームに対応するサブフレーム
電力復号器１７から出力されるサブフレーム電力情報の
値をゲインとして、合成フィルタ２２からの合成音声出
力を増幅し、再生（復号）音声出力を得るものである。

【００６３】次に、本発明の受信装置の受信側の動作に
ついて図３を用いて説明する。本発明の受信装置の受信
側では、伝送路を介して受信した多重化信号が、分離器
１３で基準ピッチ符号化情報と、各サブフレームのピッ
チ差分情報と、各サブフレームのサブフレーム電力情報
と、コードインデックスとに分離され各々出力される。

【００６４】そして、分離器１３で分離された基準ピッ
チ符号化情報は、基準ピッチ復号器１４で復号され、各
サブフレームピッチ復号器１６-1，１６-2に出力され
る。

【００６５】そして、分離器１３で分離された各サブフ
レームのピッチ差分情報は、各々対応するサブフレーム
ピッチ復号器１６-1，１６-2に入力され、サブフレーム
ピッチ復号器において復号され、有声／無声情報と有声
の場合の差分情報とが取得され、有声の場合に基準ピッ
チ復号器１４からの基準ピッチ情報と差分情報からピッ
チ情報が算出され、当該ピッチ情報に従って対応するピ
ッチ再生器１８で音源信号が再生されて出力される。

【００６６】一方、分離器１３で分離された各サブフレ
ームのピッチ差分情報は、同時に切替器１５にも入力さ
れて、切替器１５において、無声のときにはノイズ発生
器１９によって発生されたノイズ信号に、また有声のと
きにはサブフレームに対応するピッチ再生器１８で再生
された音源信号に切り換えられて、再生音源信号として
出力される。

【００６７】また、分離器１３で分離されたコードイン
デックスは、コードブック探索器２０でコードブック２
４が参照されて、ＬＳＰパラメータに変換され、係数補
間器２１で以前のフレームのＬＳＰパラメータの値から
線形補間されてなめらかに変化する補間ＬＳＰパラメー
タが出力される。

【００６８】そして、切替器１５からの再生音源信号
と、係数補間器２１からの補間ＬＳＰパラメータから合
成フィルタ２２で音声信号が合成され、更に分離器１３
で分離されたサブフレーム電力情報が各サブフレーム電
力復号器１７で復号されたサブフレーム電力情報の値を
ゲインとして、増幅器２３で合成フィルタ２２の出力が
増幅されて再生音声が得られるようになっている。

【００６９】本発明の実施の形態の音声符号化方法及び
送信装置及び受信装置によれば、符号化側で分析フレー
ムを複数のサブフレームに分割し、サブフレーム毎に有
声／無声の判定とピッチ検出を行うので、音源のモデル
化を時間軸上で細かく行うことで、有声／無声の判定も
細かく行い、更に有声の場合の音声の持つピッチの時間
変化を細かく捕らえるため、復号化側でピッチの揺らぎ
を表現でき、再生音源の自然性を改善して品質を向上で
き、その結果再生音声の品質を向上できる効果がある。

【００７０】また、サブフレーム単位でピッチ周期検出
されたピッチ情報を全て伝送するわけではなく、基準ピ
ッチを決定して、基準ピッチ情報と、各サブフレームの
ピッチ情報と基準ピッチとの差分情報とを伝送するの
で、伝送するデータ量を軽減できる効果がある。

【００７１】そして、基準ピッチ情報は量子化し、更に
符号化して伝送するので、伝送するデータ量を軽減で
き、また、基準ピッチ情報と量子化した基準ピッチ量子
化情報との差分も量子化して伝送すれば、伝送誤差を抑
えることができる。

【００７２】更に、各サブフレームのピッチ差分情報は
量子化し、有声／無声の判定結果と共に符号化して伝送
するで、伝送するデータ量を更に軽減できる効果があ
る。

【００７３】更に発明の実施の形態の送信装置及び受信
装置では、分析フレームを複数のサブフレームに分割
し、サブフレーム毎に電力情報の抽出を行うので、音量
についても再生の精度を向上でき、その結果再生音声の
自然性を改善して品質を向上できる効果がある。

【００７４】また、本発明の実施の形態の送信装置及び
受信装置によれば、分析フレーム単位で入力した音声信
号をパラメータ分析して得られたＬＳＰパラメータにつ
いて、予めＬＳＰパラメータの標準パターンを記憶して
いるコードブックを参照して最適なベクトルを量子化し
てコードインデックスとして伝送するので、伝送するデ
ータ量を更に低減できる効果がある。

【００７５】更に、受信側では、受信したコードインデ
ックスに従って送信側と同様のコードブックを参照して
ＬＳＰパラメータを求め、以前の分析フレームのＬＳＰ
パラメータとの間で補間処理を施して滑らかな変化を再
生するので、再生音声の品質を更に向上できる効果があ
る。

【００７６】また、本発明の送信装置及び受信装置によ
れば、音源の分析単位を時間軸上で短くして情報量は増
大するが、ピッチ情報については基準ピッチとの差分を
量子化及び符号化し、またＬＳＰパラメータについては
ベクトル量子化することによって情報量を軽減してお
り、それにより、ビットレートを上げることなく再生音
声の品質を向上できる効果がある。

【００７７】

【発明の効果】本発明によれば、音声の符号化側におい
て、音声の分析フレームを複数のサブフレームに分割
し、サブフレーム単位で有声／無声情報と、有声の場合
のピッチ情報を取得し、取得したピッチ情報から基準と
なる基準ピッチを決定して基準ピッチ情報として量子化
及び符号化すると共に、サブフレーム単位でピッチ情報
と基準ピッチ情報との差分情報を求めて量子化し、有声
／無声情報と共に符号化し、復号化側において、基準ピ
ッチ情報とサブフレーム単位の有声／無声情報及び差分
情報を用いて音源を再生する音声符号化方法及び送信装
置及び受信装置としているので、有声／無声情報及び有
声の場合のピッチ情報の取得を時間軸上で細かく行うこ
とで、音源再生の精度を向上することになり、その結果
再生音声の自然性を改善して品質を向上できる効果があ
る。

【００７８】本発明によれば、音声の符号化側におい
て、音声の分析フレームを複数のサブフレームに分割
し、サブフレーム単位で電力情報を取得して符号化し、
復号化側において、サブフレーム単位の電力情報を用い
て増幅し、音声を再生する送信装置及び受信装置として
いるので、音源情報の取得を時間軸上で細かく行うこと
で、音声再生の精度をより向上できる効果がある。

【図面の簡単な説明】

【図１】本発明に係る送信装置の構成ブロック図であ
る。

【図２】本発明の多重化信号の具体例を示すフォーマッ
ト図である。

【図３】本発明に係る受信装置の受信側の構成ブロック
図である。

【図４】一般的なＣＥＬＰ方式を説明するブロック図で
ある。

【図５】一般的なＬＰＣ方式用いて音声伝送する場合の
概念を説明するブロック図である。

【図６】本発明における基準ピッチ情報の量子化及び符
号化方法の具体例を説明する説明図である。

【符号の説明】

１…ＬＳＰパラメータ分析器、２…逆フィルタ、３
ａ，３ｂ…サブフレーム分割器、４…サブフレームピ
ッチ抽出器、５…基準ピッチ検出器、６…基準ピッ
チ符号器、７…サブフレームピッチ差分量子化器、
８…サブフレーム電力抽出器、９…サブフレーム電力
量子化器、１０…コードブック、１１…ベクトル量
子化器、１２…多重化器、１３…分離器、１４…
基準ピッチ復号器、１５…切替器、１６…サブフレ
ームピッチ復号器、１７…サブフレーム電力復号器、
１８…ピッチ再生器、１９…ノイズ発生器、２０
…コードブック探索器、２１…係数補間器、２２…
合成フィルタ、２３…増幅器、２４…コードブック

Claims

【特許請求の範囲】

【請求項１】音声信号を分析フレーム単位でスペクト
ル分析したスペクトルパラメータと、前記音声信号から
スペクトル成分を除去した信号から得られる音源情報と
を符号化する音声分析合成型の音声符号化方法であっ
て、音声の分析フレームを複数のサブフレームに分割し、前
記サブフレーム単位で音源情報を取得して符号化するこ
とを特徴とする音声符号化方法。
【請求項２】音声信号を分析フレーム単位でスペクト
ル分析したスペクトルパラメータと、前記音声信号から
スペクトル成分を除去した信号から得られる音源情報と
を符号化する音声分析合成型の音声符号化方法であっ
て、音声の分析フレームを複数のサブフレームに分割し、前
記サブフレーム単位で有声／無声の判定を行って有声／
無声情報を取得し、有声の場合にピッチ周期検出を行っ
てピッチ情報を取得し、前記ピッチ情報から基準となる
基準ピッチを決定して基準ピッチ情報を符号化すると共
に、前記サブフレーム単位で前記ピッチ情報と前記基準
ピッチ情報との差分を求めて量子化し、有声／無声情報
と共に符号化することを特徴とする音声符号化方法。
【請求項３】分析フレーム単位で入力された音声信号
をスペクトル分析してスペクトルのパラメータを取得す
るスペクトル分析手段と、前記音声信号から前記スペクトルの成分を除去した音源
信号を複数のサブフレームに分割するサブフレーム分割
手段と、前記サブフレーム毎に有声／無声の判定を行って有声／
無声情報を取得し、有声の場合にピッチ周期検出を行っ
てピッチ情報を取得するピッチ抽出手段と、前記複数のピッチ情報から基準ピッチ情報を決定し、前
記基準ピッチ情報を符号化する基準ピッチ決定符号化手
段と、サブフレーム毎に、有声の場合のピッチ情報と基準ピッ
チ情報との差分情報をとり、有声／無声情報と共に符号
化してピッチ差分情報とするピッチ差分符号化手段と、前記音声信号から電力情報を取得して符号化する電力情
報取得手段と、前記スペクトルのパラメータと、前記符号化された基準
ピッチ情報と、前記サブフレーム毎のピッチ差分情報
と、前記符号化された電力情報とを多重化して送信する
多重化手段とを有することを特徴とする送信装置。
【請求項４】受信した多重化信号を、スペクトルのパ
ラメータと、符号化された基準ピッチ情報と、サブフレ
ーム毎のピッチ差分情報と、符号化された電力情報とに
分離する分離手段と、前記符号化された基準ピッチ情報を復号する基準ピッチ
復号手段と、サブフレーム毎に前記ピッチ差分情報を復号して、有声
／無声情報と有声の場合の差分情報を取得し、有声の場
合に前記復号された基準ピッチ情報と前記差分情報から
ピッチ情報を算出するピッチ復号手段と、サブフレーム毎に前記有声／無声情報と前記ピッチ情報
に従って音源を再生する音源再生手段と、前記符号化されたスペクトルパラメータを復号するスペ
クトルパラメータ復号手段と、前記符号化された電力情報を復号する電力情報復号手段
と、前記再生された音源と前記スペクトルパラメータを合成
し、前記電力情報に従って増幅して音声を再生する音声
再生手段とを有することを特徴とする受信装置。
【請求項５】分析フレーム単位で音声信号を分析し、
分析結果を符号化して送信する送信装置であって、予めサンプルのスペクトルパラメータを記憶しておく第
１のコードブックと、入力した音声信号からスペクトルパラメータを取り出す
スペクトルパラメータ分析器と、前記スペクトルパラメータと前記第１のコードブックの
スペクトルパラメータとを照合し、最適なスペクトルパ
ラメータを選択して対応するコードインデックスを求め
るベクトル量子化器と、前記音声信号から前記スペクトルパラメータを取り除い
た音源信号を算出する逆フィルタと、前記音源信号を複数のサブフレームに分割する第１のサ
ブフレーム分割器と、前記サブフレーム毎に有声／無声の判定を行って判定結
果を有声／無声情報とし、有声の場合にピッチ周期を検
出してピッチ情報を取得するサブフレームピッチ抽出器
と、前記サブフレーム毎のピッチ情報から基準となる基準ピ
ッチ情報を決定する基準ピッチ検出器と、前記基準ピッチ情報を量子化し符号化する基準ピッチ符
号化器と、前記サブフレーム毎のピッチ情報と前記量子化された基
準ピッチ情報との差分を差分情報として量子化し、有声
／無声情報と共に符号化してピッチ差分情報とするサブ
フレームピッチ差分量子化器と、前記音声信号を複数のサブフレームに分割する第２のサ
ブフレーム分割器と、当該サブフレーム毎に電力を算出して電力情報を求める
サブフレーム電力算出器と、前記算出された電力を符号化して電力情報とするサブフ
レーム電力量子化器と、前記コードインデックスと、前記符号化された基準ピッ
チ情報と、サブフレーム毎の前記ピッチ差分情報と、サ
ブフレーム毎の前記電力情報とを多重化して送信する多
重化器とを有することを特徴とする送信装置。
【請求項６】符号化された分析フレーム単位の音声信
号の分析結果を受信して音声信号を再生する受信装置で
あって、多重化信号を受信して、コードインデックスと、符号化
された基準ピッチ情報と、サブフレーム毎のピッチ差分
情報と、サブフレーム毎の電力情報とに分離する分離器
と、送信側の前記第１のコードブックと同様の内容でスペク
トルパラメータを記憶している第２のコードブックと、前記コードインデックスに従って前記第２のコードブッ
クの対応するスペクトルパラメータを求めるコードブッ
ク探索器と、前記符号化された基準ピッチ情報を復号する基準ピッチ
情報復号器と、サブフレーム毎に前記ピッチ差分情報を復号して、有声
／無声情報と有声の場合の差分情報を取得し、有声の場
合に前記基準ピッチ情報と前記差分情報からピッチ情報
を算出するサブフレームピッチ復号器と、前記算出されたピッチ情報に従って音源信号を再生する
ピッチ再生器と、ノイズを発生するノイズ発生器と、サブフレーム毎の前記ピッチ差分情報に含まれる有声／
無声情報に従って、前記ピッチ再生器もしくは前記ノイ
ズ発生器を切り換えて再生音源信号を取り出す切替器
と、サブフレーム毎の前記電力情報を復号するサブフレーム
電力復号器と、前記再生音源信号と前記スペクトルパラメータとを合成
して合成音声を出力する合成フィルタと、前記合成フィルタからの合成音声を前記復号されたサブ
フレーム毎の電力情報によって増幅し、音声を再生する
増幅器とを有することを特徴とする受信装置。
【請求項７】基準ピッチ検出器が、複数のサブフレー
ムピッチ抽出器からのピッチ情報の最大値を基準ピッチ
とする基準ピッチ検出器であることを特徴とする請求項
５記載の送信装置。
【請求項８】コードブック探索器と合成フィルタとの
間に配置され、前記コードブック探索器から出力される
スペクトルパラメータを入力し、以前のスペクトルパラ
メータを記憶しておいて、前記以前のスペクトルパラメ
ータと前記入力したスペクトルパラメータとから補間し
たスペクトルパラメータを前記合成フィルタに与える係
数補間器を設けたことを特徴とする請求項６記載の受信
装置。