JP2000276199A - 音声符号化方法及び送信装置及び受信装置 - Google Patents
音声符号化方法及び送信装置及び受信装置Info
- Publication number
- JP2000276199A JP2000276199A JP11079025A JP7902599A JP2000276199A JP 2000276199 A JP2000276199 A JP 2000276199A JP 11079025 A JP11079025 A JP 11079025A JP 7902599 A JP7902599 A JP 7902599A JP 2000276199 A JP2000276199 A JP 2000276199A
- Authority
- JP
- Japan
- Prior art keywords
- information
- pitch
- subframe
- voiced
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 自然性を高めて再生音源の品質を向上するこ
とにより再生音声の品質を向上できる音声符号化方法及
び送信装置及び受信装置を提供する。 【解決手段】 分析フレームをサブフレーム分割器3a
で複数のサブフレームに分割し、サブフレーム毎にサブ
フレームピッチ抽出器4で有声/無声判定及びピッチ情
報の検出を行い、検出された複数のピッチ情報から基準
となる基準ピッチを基準ピッチ検出器5で決定し、サブ
フレームピッチ差分量子化器7で基準ピッチと各サブフ
レームのピッチ情報との差分を求め、基準ピッチ情報と
各サブフレームの有声/無声判定結果及び差分情報とを
それぞれ符号化して伝送する音声符号化方法及び送信装
置及び受信装置である。
とにより再生音声の品質を向上できる音声符号化方法及
び送信装置及び受信装置を提供する。 【解決手段】 分析フレームをサブフレーム分割器3a
で複数のサブフレームに分割し、サブフレーム毎にサブ
フレームピッチ抽出器4で有声/無声判定及びピッチ情
報の検出を行い、検出された複数のピッチ情報から基準
となる基準ピッチを基準ピッチ検出器5で決定し、サブ
フレームピッチ差分量子化器7で基準ピッチと各サブフ
レームのピッチ情報との差分を求め、基準ピッチ情報と
各サブフレームの有声/無声判定結果及び差分情報とを
それぞれ符号化して伝送する音声符号化方法及び送信装
置及び受信装置である。
Description
【0001】
【発明の属する技術分野】本発明は、低速度の音声符号
化方法及び音声の送信装置及び受信装置に係り、特に、
再生音声の品質を向上できる音声符号化方法及び送信装
置及び受信装置に関するものである。
化方法及び音声の送信装置及び受信装置に係り、特に、
再生音声の品質を向上できる音声符号化方法及び送信装
置及び受信装置に関するものである。
【0002】
【従来の技術】電波資源の有効利用を目的とした低速度
の音声符号化において、数kbps程度の音声符号化方
法は、符号励振型線形予測方式(Code Excited Linear
Prediction:CELP)に代表されるハイブリッド符号
化が主流であり、良好な音声品質が実現されている。
の音声符号化において、数kbps程度の音声符号化方
法は、符号励振型線形予測方式(Code Excited Linear
Prediction:CELP)に代表されるハイブリッド符号
化が主流であり、良好な音声品質が実現されている。
【0003】ここで、CELP方式の概略について、図
4を使って簡単に説明する。図4は、一般的なCELP
方式を説明するブロック図である。CELP方式はコー
ド駆動LPC符号化といわれ、コードブック内の雑音を
音源として音声合成フィルタを駆動する方式であり、入
力音声と合成音声との間の誤差信号が最小となる最適雑
音駆動信号を抽出し、そのコードインデックスと利得情
報Gをパラメータとして伝送するものである。
4を使って簡単に説明する。図4は、一般的なCELP
方式を説明するブロック図である。CELP方式はコー
ド駆動LPC符号化といわれ、コードブック内の雑音を
音源として音声合成フィルタを駆動する方式であり、入
力音声と合成音声との間の誤差信号が最小となる最適雑
音駆動信号を抽出し、そのコードインデックスと利得情
報Gをパラメータとして伝送するものである。
【0004】具体的には、予め音声信号の複数サンプル
をベクトルで表してベクトル符号をコードブック30に
記憶しておき、入力音声をフレーム単位で取り込んで符
号化すると共に、コードブック30に記憶されたものか
ら選択されたコードを増幅器32で増幅したものとそれ
までに符号化された情報に基づいて現在のフレームの音
声を長期予測器34及び短期予測器36で予測した予測
結果とを加算器33,35で合成し、更に入力音声を減
算器37で合成して聴覚重み付けフィルタ38で聴覚重
み付けを行い、誤差電力最小化部39で重み付けされた
音声波形の平均誤差計算を行って、歪みをできるだけ小
さくするようにコードブック30のベクトルを選択し、
選択されたコードのインデックスと増幅器32における
利得情報Gとを伝送するようになっている。
をベクトルで表してベクトル符号をコードブック30に
記憶しておき、入力音声をフレーム単位で取り込んで符
号化すると共に、コードブック30に記憶されたものか
ら選択されたコードを増幅器32で増幅したものとそれ
までに符号化された情報に基づいて現在のフレームの音
声を長期予測器34及び短期予測器36で予測した予測
結果とを加算器33,35で合成し、更に入力音声を減
算器37で合成して聴覚重み付けフィルタ38で聴覚重
み付けを行い、誤差電力最小化部39で重み付けされた
音声波形の平均誤差計算を行って、歪みをできるだけ小
さくするようにコードブック30のベクトルを選択し、
選択されたコードのインデックスと増幅器32における
利得情報Gとを伝送するようになっている。
【0005】一方、2400bps程度の更に低速の領
域では、線形予測分析符号化方式(Linear Predictive
Coding:LPC)に代表される分析合成型が主流であ
る。ここで、LPC方式の概略について、図5を使って
説明する。図5は、一般的なLPC方式用いて音声伝送
する場合の概念を説明するブロック図である。LPC方
式は、符号化側において、音声信号を分析フレーム単位
で線形予測分析したLPC係数と、分析フレーム単位で
判定した無声/有声の識別結果と、有声の場合のピッチ
周期と、電力情報とを符号化し、復号化側において、復
号化した無声/有声の識別結果を基にして、駆動音源と
して雑音或いは復号化したピッチ周期を持つ単一パルス
を切換えて音源として用い、再生された音源に復号化し
たLPC係数を合成して、音声を再生するものである。
域では、線形予測分析符号化方式(Linear Predictive
Coding:LPC)に代表される分析合成型が主流であ
る。ここで、LPC方式の概略について、図5を使って
説明する。図5は、一般的なLPC方式用いて音声伝送
する場合の概念を説明するブロック図である。LPC方
式は、符号化側において、音声信号を分析フレーム単位
で線形予測分析したLPC係数と、分析フレーム単位で
判定した無声/有声の識別結果と、有声の場合のピッチ
周期と、電力情報とを符号化し、復号化側において、復
号化した無声/有声の識別結果を基にして、駆動音源と
して雑音或いは復号化したピッチ周期を持つ単一パルス
を切換えて音源として用い、再生された音源に復号化し
たLPC係数を合成して、音声を再生するものである。
【0006】具体的に図5では、符号化した音声を伝送
する場合において、送信側で、音声信号を分析フレーム
単位で取り込んで、線形予測分析部40で予測分析して
周波数特性(スペクトル情報)を表すLPC係数を出力
し、LPC係数を符号化部41で符号化すると共に、取
り込んだ音声信号についてピッチ分析部42で音声の有
無を判定し、有声の場合にピッチ周期を検出し、更に電
力情報を取得して、音声の有無情報(図5ではV/UV
flag)、ピッチ周期情報、電力情報(図5ではパ
ワー)を音源情報として符号化部43で符号化して、分
析フレーム単位で符号化されたLPC係数、音声の有無
情報、ピッチ周期情報、電力情報を多重化部44で多重
化して伝送する。
する場合において、送信側で、音声信号を分析フレーム
単位で取り込んで、線形予測分析部40で予測分析して
周波数特性(スペクトル情報)を表すLPC係数を出力
し、LPC係数を符号化部41で符号化すると共に、取
り込んだ音声信号についてピッチ分析部42で音声の有
無を判定し、有声の場合にピッチ周期を検出し、更に電
力情報を取得して、音声の有無情報(図5ではV/UV
flag)、ピッチ周期情報、電力情報(図5ではパ
ワー)を音源情報として符号化部43で符号化して、分
析フレーム単位で符号化されたLPC係数、音声の有無
情報、ピッチ周期情報、電力情報を多重化部44で多重
化して伝送する。
【0007】一方、受信側では、受信した多重化された
情報を多重分離部45で分離し、LPC係数について復
号化部46で復号化し、その他の音源情報については復
号化部48で復号化し、音源再生部49で復号された音
声の有無情報、ピッチ周期情報、電力情報に基づいて音
源を再生し、再生された音源とLPC係数とを合成フィ
ルタ47で合成して分析フレーム単位の再生音声を出力
するようになっている。
情報を多重分離部45で分離し、LPC係数について復
号化部46で復号化し、その他の音源情報については復
号化部48で復号化し、音源再生部49で復号された音
声の有無情報、ピッチ周期情報、電力情報に基づいて音
源を再生し、再生された音源とLPC係数とを合成フィ
ルタ47で合成して分析フレーム単位の再生音声を出力
するようになっている。
【0008】しかしながら、上記説明したLPC方式の
音声符号化方法では、音源再生のための情報に割り当て
られる情報量が限られるため、音源の単純なモデル化を
行うことになり、音声を有声/無声という2つの極端な
クラスに分け、有声の場合に1分析フレームを1つのピ
ッチ情報で表すため、ピッチの揺らぎ等を表現できず、
再生音声は自然性がかなり損なわれて機械的な音にな
り、また有声/無声判定の判定誤りが起きた場合など
は、音源の大きな品質劣化を引き起こし、再生音声の品
質低下が問題になっている。
音声符号化方法では、音源再生のための情報に割り当て
られる情報量が限られるため、音源の単純なモデル化を
行うことになり、音声を有声/無声という2つの極端な
クラスに分け、有声の場合に1分析フレームを1つのピ
ッチ情報で表すため、ピッチの揺らぎ等を表現できず、
再生音声は自然性がかなり損なわれて機械的な音にな
り、また有声/無声判定の判定誤りが起きた場合など
は、音源の大きな品質劣化を引き起こし、再生音声の品
質低下が問題になっている。
【0009】そこで、高品質な音声を再生するために、
予測分析して得られるLPC係数の伝送に関する改良策
として、特許第2605256号、特公平6−5044
0、特公平7−31520、特公平6−36157,特
公平7−9600が提案されている。
予測分析して得られるLPC係数の伝送に関する改良策
として、特許第2605256号、特公平6−5044
0、特公平7−31520、特公平6−36157,特
公平7−9600が提案されている。
【0010】また、高品質な音声を再生するために、音
源情報の伝送に関する改良策として、特許第26155
48号に、音声の分析フレームをピッチ周期に応じた小
区間に分割し、小区間の内の代表的な区間のパルス列ま
たはパルス列と雑音の組み合わせで表して音源情報と
し、当該音源情報とピッチパラメータと、スペクトルパ
ラメータを伝送し、受信側で代表区間のパルス列に対し
て時間的に滑らかな変化を与える処理を施して音源信号
を再生し、更に音声信号を再生する音声符号化方法が提
案されている。
源情報の伝送に関する改良策として、特許第26155
48号に、音声の分析フレームをピッチ周期に応じた小
区間に分割し、小区間の内の代表的な区間のパルス列ま
たはパルス列と雑音の組み合わせで表して音源情報と
し、当該音源情報とピッチパラメータと、スペクトルパ
ラメータを伝送し、受信側で代表区間のパルス列に対し
て時間的に滑らかな変化を与える処理を施して音源信号
を再生し、更に音声信号を再生する音声符号化方法が提
案されている。
【0011】また、再生音声品質を保ちながら、ビット
レートを削減する方法、又はビットレートを保ちながら
再生音声品質を向上させる方法として、特開平5−13
6697号明細書には、2つの分析フレームを1組と
し、第1のフレームは通常フレームとして通常のLPC
係数、ピッチパルス間隔、振幅、有声/無声の判定結果
を伝送し、第2のフレームは差分フレームとして、通常
フレームの振幅,有声/無声の判定結果と、通常フレー
ムのLPC係数との差分と、通常フレームのピッチパル
ス間隔との差分と、2番目のピッチパルス間隔と振幅と
を伝送する音声符号化方法が提案されている。
レートを削減する方法、又はビットレートを保ちながら
再生音声品質を向上させる方法として、特開平5−13
6697号明細書には、2つの分析フレームを1組と
し、第1のフレームは通常フレームとして通常のLPC
係数、ピッチパルス間隔、振幅、有声/無声の判定結果
を伝送し、第2のフレームは差分フレームとして、通常
フレームの振幅,有声/無声の判定結果と、通常フレー
ムのLPC係数との差分と、通常フレームのピッチパル
ス間隔との差分と、2番目のピッチパルス間隔と振幅と
を伝送する音声符号化方法が提案されている。
【0012】
【発明が解決しようとする課題】しかしながら、従来の
音声符号化方法では、分析フレーム単位の伝送データ内
で音源に割り当てられる情報量が限られるため、分析フ
レーム内の音声信号に関して音源の単純なモデル化を行
うことから音源の自然性が損なわれ、再生音声の品質が
低下するという問題点があった。
音声符号化方法では、分析フレーム単位の伝送データ内
で音源に割り当てられる情報量が限られるため、分析フ
レーム内の音声信号に関して音源の単純なモデル化を行
うことから音源の自然性が損なわれ、再生音声の品質が
低下するという問題点があった。
【0013】また、従来の音声符号化方法を用いた音声
の伝送においては、伝送速度の低速化の為に2400b
ps以下にビットレートを落とす場合には、分析フレー
ム長を伸ばす必要があることから、さらに品質が低下す
るという問題点があった。
の伝送においては、伝送速度の低速化の為に2400b
ps以下にビットレートを落とす場合には、分析フレー
ム長を伸ばす必要があることから、さらに品質が低下す
るという問題点があった。
【0014】本発明は上記実情に鑑みて為されたもの
で、自然性を高めて再生音源の品質を向上することによ
り再生音声の品質を向上できる音声符号化方法及び送信
装置及び受信装置を提供することを目的とする。
で、自然性を高めて再生音源の品質を向上することによ
り再生音声の品質を向上できる音声符号化方法及び送信
装置及び受信装置を提供することを目的とする。
【0015】
【課題を解決するための手段】上記従来例の問題点を解
決するための本発明は、音声の符号化側において、音声
の分析フレームを複数のサブフレームに分割し、サブフ
レーム単位で有声/無声情報と、有声の場合のピッチ情
報を取得し、取得したピッチ情報から基準となる基準ピ
ッチを決定して符号化すると共に、サブフレーム単位で
ピッチ情報と基準ピッチとの差分情報を求めて量子化
し、有声/無声情報と共に符号化し、復号化側におい
て、基準ピッチとサブフレーム単位の有声/無声情報及
び差分情報を用いて音源を再生する音声符号化方法及び
送信装置及び受信装置であり、有声/無声情報及び有声
の場合のピッチ情報の取得を時間軸上で細かく行うこと
で、ピッチの揺らぎを捕らえ、再生音源の品質を向上で
きる。
決するための本発明は、音声の符号化側において、音声
の分析フレームを複数のサブフレームに分割し、サブフ
レーム単位で有声/無声情報と、有声の場合のピッチ情
報を取得し、取得したピッチ情報から基準となる基準ピ
ッチを決定して符号化すると共に、サブフレーム単位で
ピッチ情報と基準ピッチとの差分情報を求めて量子化
し、有声/無声情報と共に符号化し、復号化側におい
て、基準ピッチとサブフレーム単位の有声/無声情報及
び差分情報を用いて音源を再生する音声符号化方法及び
送信装置及び受信装置であり、有声/無声情報及び有声
の場合のピッチ情報の取得を時間軸上で細かく行うこと
で、ピッチの揺らぎを捕らえ、再生音源の品質を向上で
きる。
【0016】上記従来例の問題点を解決するための本発
明は、音声の符号化側において、音声の分析フレームを
複数のサブフレームに分割し、サブフレーム単位で電力
情報を取得して符号化し、復号化側において、サブフレ
ーム単位の電力情報を用いて増幅し、音声を再生する送
信装置及び受信装置であり、音源情報の取得を時間軸上
で細かく行うことで、音声再生の品質をより向上でき
る。
明は、音声の符号化側において、音声の分析フレームを
複数のサブフレームに分割し、サブフレーム単位で電力
情報を取得して符号化し、復号化側において、サブフレ
ーム単位の電力情報を用いて増幅し、音声を再生する送
信装置及び受信装置であり、音源情報の取得を時間軸上
で細かく行うことで、音声再生の品質をより向上でき
る。
【0017】
【発明の実施の形態】本発明の実施の形態について図面
を参照しながら説明する。尚、以下で説明する機能実現
手段は、当該機能を実現する手段であれば、どのような
回路又は装置であっても構わず、また機能の一部又は全
部をソフトウェアで実現することも可能である。更に、
機能実現手段を複数の回路によって実現してもよく、複
数の機能実現手段を単一の回路で実現してもよい。
を参照しながら説明する。尚、以下で説明する機能実現
手段は、当該機能を実現する手段であれば、どのような
回路又は装置であっても構わず、また機能の一部又は全
部をソフトウェアで実現することも可能である。更に、
機能実現手段を複数の回路によって実現してもよく、複
数の機能実現手段を単一の回路で実現してもよい。
【0018】本発明に係る音声符号化方法は、分析フレ
ームを複数のサブフレームに分割し、サブフレーム単位
で有声/無声判定及びピッチ情報の検出を行い、検出さ
れた複数のピッチ情報から基準となる基準ピッチを決定
し、基準ピッチと各サブフレームのピッチ情報との差分
情報を求め、基準ピッチ情報と各サブフレームの有声/
無声判定結果及び差分情報とをそれぞれ符号化して伝送
するものなので、音源のモデル化単位を時間軸上で細か
くすることでピッチの揺らぎを捕らえて自然性を高め、
再生音源の品質を向上することによって、再生音声の品
質を向上できるものである。
ームを複数のサブフレームに分割し、サブフレーム単位
で有声/無声判定及びピッチ情報の検出を行い、検出さ
れた複数のピッチ情報から基準となる基準ピッチを決定
し、基準ピッチと各サブフレームのピッチ情報との差分
情報を求め、基準ピッチ情報と各サブフレームの有声/
無声判定結果及び差分情報とをそれぞれ符号化して伝送
するものなので、音源のモデル化単位を時間軸上で細か
くすることでピッチの揺らぎを捕らえて自然性を高め、
再生音源の品質を向上することによって、再生音声の品
質を向上できるものである。
【0019】また、本発明に係る送信装置における音源
情報の符号化手段は、分析フレーム単位の音声信号を複
数のサブフレームに分割するサブフレーム分割手段と、
サブフレーム毎に有声/無声判定を行って有声/無声情
報を取得し、有声の場合にピッチ周期検出を行ってピッ
チ情報を取得するピッチ抽出手段と、検出された複数の
ピッチ情報から基準ピッチ情報を決定し、前記基準ピッ
チ情報を符号化する基準ピッチ決定符号化手段と、サブ
フレーム毎に、有声の場合のピッチ情報と基準ピッチ情
報との差分情報をとり、有声/無声情報と共に符号化し
てピッチ差分情報とするピッチ差分符号化手段とから構
成されている。
情報の符号化手段は、分析フレーム単位の音声信号を複
数のサブフレームに分割するサブフレーム分割手段と、
サブフレーム毎に有声/無声判定を行って有声/無声情
報を取得し、有声の場合にピッチ周期検出を行ってピッ
チ情報を取得するピッチ抽出手段と、検出された複数の
ピッチ情報から基準ピッチ情報を決定し、前記基準ピッ
チ情報を符号化する基準ピッチ決定符号化手段と、サブ
フレーム毎に、有声の場合のピッチ情報と基準ピッチ情
報との差分情報をとり、有声/無声情報と共に符号化し
てピッチ差分情報とするピッチ差分符号化手段とから構
成されている。
【0020】これにより、サブフレーム分割手段によっ
て小さくした音源のモデル化単位で、ピッチ抽出手段に
よる有声/無声情報とピッチ情報の取得を行うため、時
間経過に伴うピッチの揺らぎを捕らえた詳細な音源情報
を得ることができ、且つ基準ピッチ決定符号化手段とピ
ッチ差分符号化手段とによって、基準ピッチと差分情報
とに表現することによって情報量を軽減できる。
て小さくした音源のモデル化単位で、ピッチ抽出手段に
よる有声/無声情報とピッチ情報の取得を行うため、時
間経過に伴うピッチの揺らぎを捕らえた詳細な音源情報
を得ることができ、且つ基準ピッチ決定符号化手段とピ
ッチ差分符号化手段とによって、基準ピッチと差分情報
とに表現することによって情報量を軽減できる。
【0021】また、本発明に係る受信装置における音源
の復号化手段は、符号化された基準ピッチの情報を復号
する基準ピッチ復号手段と、サブフレーム毎にピッチ差
分情報を復号して、有声/無声情報と有声の場合の差分
情報を取得し、有声の場合に基準ピッチ情報と差分情報
からピッチ情報を算出するピッチ復号手段と、サブフレ
ーム毎に有声/無声情報とピッチ情報に従って音源を再
生する音源再生手段とから構成されている。
の復号化手段は、符号化された基準ピッチの情報を復号
する基準ピッチ復号手段と、サブフレーム毎にピッチ差
分情報を復号して、有声/無声情報と有声の場合の差分
情報を取得し、有声の場合に基準ピッチ情報と差分情報
からピッチ情報を算出するピッチ復号手段と、サブフレ
ーム毎に有声/無声情報とピッチ情報に従って音源を再
生する音源再生手段とから構成されている。
【0022】これにより、基準ピッチ復号手段により復
号化された基準ピッチの情報とピッチ復号手段により復
号化されたサブフレーム毎の差分情報とによって音源再
生手段でサブフレーム単位で音源を再生するため、時間
経過に伴うピッチの揺らぎを表現でき、自然性を高めた
音源を再生でき、再生音源の品質を向上して再生音声の
品質を向上できるものである。
号化された基準ピッチの情報とピッチ復号手段により復
号化されたサブフレーム毎の差分情報とによって音源再
生手段でサブフレーム単位で音源を再生するため、時間
経過に伴うピッチの揺らぎを表現でき、自然性を高めた
音源を再生でき、再生音源の品質を向上して再生音声の
品質を向上できるものである。
【0023】ここで、本発明に係る音声符号化方法を用
いた音声の送信装置の構成について図1を使って説明す
る。図1は、本発明に係る送信装置の構成ブロック図で
ある。尚、図1では、サブフレーム数が2の場合を示し
ている。
いた音声の送信装置の構成について図1を使って説明す
る。図1は、本発明に係る送信装置の構成ブロック図で
ある。尚、図1では、サブフレーム数が2の場合を示し
ている。
【0024】本発明の送信装置は、スペクトル分析手段
としてのLSPパラメータ分析器1と、コードブック1
0と、ベクトル量子化器11と、サブフレーム分割手段
としての逆フィルタ2と、サブフレーム分割器3aと、
ピッチ抽出手段としてのサブフレームピッチ抽出器4-
1,4-2と、基準ピッチ決定符号化手段としての基準ピ
ッチ検出器5と、基準ピッチ符号器6と、ピッチ差分符
号化手段としてのサブフレームピッチ差分量子化器7-
1,7-2と、電力情報取得手段としての,サブフレーム
分割器3bと、サブフレーム電力抽出器8-1,8-2と、
サブフレーム電力符号器9-1,9-2と、多重化手段とし
ての多重化器12とから構成されている。
としてのLSPパラメータ分析器1と、コードブック1
0と、ベクトル量子化器11と、サブフレーム分割手段
としての逆フィルタ2と、サブフレーム分割器3aと、
ピッチ抽出手段としてのサブフレームピッチ抽出器4-
1,4-2と、基準ピッチ決定符号化手段としての基準ピ
ッチ検出器5と、基準ピッチ符号器6と、ピッチ差分符
号化手段としてのサブフレームピッチ差分量子化器7-
1,7-2と、電力情報取得手段としての,サブフレーム
分割器3bと、サブフレーム電力抽出器8-1,8-2と、
サブフレーム電力符号器9-1,9-2と、多重化手段とし
ての多重化器12とから構成されている。
【0025】次に、本発明の送信装置の送信側の各部に
ついて説明する。LSPパラメータ分析器1は、請求項
のスペクトルパラメータ分析器に相当し、入力される分
析フレーム単位の音声信号をスペクトルパラメータ分析
してスペクトルパラメータを取り出すものである。本発
明ではスペクトルパラメータ分析に線形予測(Linear P
redictive Coding:LPC)分析を用い、LSP係数が
計算されて線スペクトル対(Line Spectrum Pair:LS
P)に変換され、LSPパラメータが出力される。
ついて説明する。LSPパラメータ分析器1は、請求項
のスペクトルパラメータ分析器に相当し、入力される分
析フレーム単位の音声信号をスペクトルパラメータ分析
してスペクトルパラメータを取り出すものである。本発
明ではスペクトルパラメータ分析に線形予測(Linear P
redictive Coding:LPC)分析を用い、LSP係数が
計算されて線スペクトル対(Line Spectrum Pair:LS
P)に変換され、LSPパラメータが出力される。
【0026】コードブック10は、あらかじめトレーニ
ング信号により学習させておいたLSPパラメータをコ
ードベクトルとして記憶しているLSPパラメータのコ
ードブックである。
ング信号により学習させておいたLSPパラメータをコ
ードベクトルとして記憶しているLSPパラメータのコ
ードブックである。
【0027】ベクトル量子化器11は、LSPパラメー
タ分析器1で求めたLSPパラメータと、コードブック
10のコードベクトルとを照合して最適なベクトルを選
択し、分析フレームに対するLSPパラメータをコード
インデックスの形で出力するものである。
タ分析器1で求めたLSPパラメータと、コードブック
10のコードベクトルとを照合して最適なベクトルを選
択し、分析フレームに対するLSPパラメータをコード
インデックスの形で出力するものである。
【0028】逆フィルタ2は、入力した分析フレーム単
位の音声信号から、LSPパラメータ分析器1により求
めたLSPパラメータを取り除いた音源信号(予測残
差)を算出するものである。
位の音声信号から、LSPパラメータ分析器1により求
めたLSPパラメータを取り除いた音源信号(予測残
差)を算出するものである。
【0029】サブフレーム分割器3aは、逆フィルタ2
からの予測残差を複数のサブフレームに分割するもの
で、分割数は2〜5分割がよいが、ここでは2分割とし
て説明する。
からの予測残差を複数のサブフレームに分割するもの
で、分割数は2〜5分割がよいが、ここでは2分割とし
て説明する。
【0030】サブフレームピッチ抽出器4は、サブフレ
ーム毎に有声/無声の判定を行い、有声の場合にはピッ
チ周期を検出してピッチ情報とし、有声/無声の判定結
果(有声/無声情報)と有声の場合のピッチ情報とを出
力するものである。
ーム毎に有声/無声の判定を行い、有声の場合にはピッ
チ周期を検出してピッチ情報とし、有声/無声の判定結
果(有声/無声情報)と有声の場合のピッチ情報とを出
力するものである。
【0031】基準ピッチ検出器5は、サブフレーム毎に
サブフレームピッチ抽出器4で求められたピッチ情報の
中から、基準となる基準ピッチを決定するものである。
基準ピッチの決定方法としては、何れか1つのサブフレ
ームのピッチ情報を選択するか、又は各サブフレームの
ピッチ情報の最大値、中間値、最小値、平均値を取るな
どいろいろ考えられる。本願では、各サブフレームのピ
ッチ情報の最大値を基準値(基準ピッチ情報)と設定し
た。それは、各サブフレーム間でのピッチの差分は±両
方あるため、最大値を検出すれば他のサブフレームのピ
ッチ情報として、マイナス側すなわち基準ピッチより小
さい値だけを考慮すればよいことになり、後続の差分の
量子化が簡単で情報量を小さくできることになる。
サブフレームピッチ抽出器4で求められたピッチ情報の
中から、基準となる基準ピッチを決定するものである。
基準ピッチの決定方法としては、何れか1つのサブフレ
ームのピッチ情報を選択するか、又は各サブフレームの
ピッチ情報の最大値、中間値、最小値、平均値を取るな
どいろいろ考えられる。本願では、各サブフレームのピ
ッチ情報の最大値を基準値(基準ピッチ情報)と設定し
た。それは、各サブフレーム間でのピッチの差分は±両
方あるため、最大値を検出すれば他のサブフレームのピ
ッチ情報として、マイナス側すなわち基準ピッチより小
さい値だけを考慮すればよいことになり、後続の差分の
量子化が簡単で情報量を小さくできることになる。
【0032】基準ピッチ符号器6は、基準ピッチ検出器
5で決定された基準ピッチ情報を量子化して基準ピッチ
量子化情報を出力し、更に基準ピッチ量子化情報を符号
化して基準ピッチ符号化情報を出力するものである。
5で決定された基準ピッチ情報を量子化して基準ピッチ
量子化情報を出力し、更に基準ピッチ量子化情報を符号
化して基準ピッチ符号化情報を出力するものである。
【0033】ここで、基準ピッチ情報の量子化及び符号
化の具体的な方法としてスカラー量子化の例で図6を用
いて説明する。図6は、本発明における基準ピッチ情報
の量子化及び符号化方法の具体例を説明する説明図であ
る。基準ピッチ情報の量子化及び符号化は、例えば、図
6に示すような量子化範囲と量子化値と符号語(インデ
ックス)からなる量子化テーブルを設け、当該量子化テ
ーブルに従って行われる。図6に示した例は、ピッチ情
報が例えば1〜50の値であって有限のビット数(ここ
では4ビット)で符号化するための量子化テーブルであ
る。
化の具体的な方法としてスカラー量子化の例で図6を用
いて説明する。図6は、本発明における基準ピッチ情報
の量子化及び符号化方法の具体例を説明する説明図であ
る。基準ピッチ情報の量子化及び符号化は、例えば、図
6に示すような量子化範囲と量子化値と符号語(インデ
ックス)からなる量子化テーブルを設け、当該量子化テ
ーブルに従って行われる。図6に示した例は、ピッチ情
報が例えば1〜50の値であって有限のビット数(ここ
では4ビット)で符号化するための量子化テーブルであ
る。
【0034】実際には、例えば、決定された基準ピッチ
情報が17であるとすると、量子化範囲をサーチし、1
7が含まれる量子化範囲に対応する量子化値20が基準
ピッチ量子化情報として出力される。そして、更に、量
子化値に対応付けられている符号語(インデックス)が
基準ピッチ符号化情報として出力されることになる。
情報が17であるとすると、量子化範囲をサーチし、1
7が含まれる量子化範囲に対応する量子化値20が基準
ピッチ量子化情報として出力される。そして、更に、量
子化値に対応付けられている符号語(インデックス)が
基準ピッチ符号化情報として出力されることになる。
【0035】尚、実際に決定された基準ピッチ情報と量
子化値との間に差分がある場合(図6の例では20−1
7=3)に、この差分値を更に量子化して伝送すること
で伝送誤差を抑えることもできる。
子化値との間に差分がある場合(図6の例では20−1
7=3)に、この差分値を更に量子化して伝送すること
で伝送誤差を抑えることもできる。
【0036】サブフレームピッチ差分量子化器7は、サ
ブフレームピッチ抽出器4から有声/無声フラグと有声
の場合のピッチ情報とを受け取り、当該ピッチ情報と基
準ピッチ符号器6から出力される基準ピッチ量子化情報
との差分情報(ピッチ差分)をとって量子化し、更に、
有声/無声情報と共に符号化してサブフレームのピッチ
差分情報として出力するものである。尚、基準ピッチ符
号器6において、基準ピッチ情報と基準ピッチ量子化情
報との差分も伝送するのであれば、ピッチ情報と基準ピ
ッチ情報との差分を差分情報として量子化、符号化して
伝送することによって、伝送誤差を抑え、受信機側にお
ける音声の再生精度が向上する。
ブフレームピッチ抽出器4から有声/無声フラグと有声
の場合のピッチ情報とを受け取り、当該ピッチ情報と基
準ピッチ符号器6から出力される基準ピッチ量子化情報
との差分情報(ピッチ差分)をとって量子化し、更に、
有声/無声情報と共に符号化してサブフレームのピッチ
差分情報として出力するものである。尚、基準ピッチ符
号器6において、基準ピッチ情報と基準ピッチ量子化情
報との差分も伝送するのであれば、ピッチ情報と基準ピ
ッチ情報との差分を差分情報として量子化、符号化して
伝送することによって、伝送誤差を抑え、受信機側にお
ける音声の再生精度が向上する。
【0037】ピッチ差分の量子化の具体的な方法として
は、例えば、ピッチ差分量と有声/無声フラグに2ビッ
トを割り当てることとし、無声のとき二進数で00、ピ
ッチ差分量が0〜−1のとき01、ピッチ差分量が−2
〜−3のとき10、ピッチ差分量が−4以上のとき11
とすることで2ビットで表すこととする。
は、例えば、ピッチ差分量と有声/無声フラグに2ビッ
トを割り当てることとし、無声のとき二進数で00、ピ
ッチ差分量が0〜−1のとき01、ピッチ差分量が−2
〜−3のとき10、ピッチ差分量が−4以上のとき11
とすることで2ビットで表すこととする。
【0038】一般にピッチ周期の変動は小さいことか
ら、各サブフレームにおけるピッチ差分量は小さいので
割り当てビット数は2ビット程度で十分である。本実施
の形態では、この方法でサブフレームごとの音源信号を
符号化することによって、情報量をあまり増加させるこ
となく、時間経過に伴うピッチの揺らぎを表現でき自然
性を向上できる。
ら、各サブフレームにおけるピッチ差分量は小さいので
割り当てビット数は2ビット程度で十分である。本実施
の形態では、この方法でサブフレームごとの音源信号を
符号化することによって、情報量をあまり増加させるこ
となく、時間経過に伴うピッチの揺らぎを表現でき自然
性を向上できる。
【0039】サブフレーム分割器3bは、入力された分
析フレーム単位の音声信号を複数のサブフレームに分割
するもので、分割数は2〜5分割がよいが、サブフレー
ム分割器3aと同様にここでは2分割として説明する。
析フレーム単位の音声信号を複数のサブフレームに分割
するもので、分割数は2〜5分割がよいが、サブフレー
ム分割器3aと同様にここでは2分割として説明する。
【0040】サブフレーム電力抽出器8は、サブフレー
ム毎に音声信号の自乗和で電力を算出して電力情報を出
力するものである。なお、電力情報の量子化、符号化に
当たってもピッチ情報の場合と同様な方法を用いれば低
速化に寄与可能であるが、電力情報は変動幅が大きいた
め、包絡線のなめらかさが失われることから音声品質が
劣化するおそれがある。そこで、電力に関しては、入力
音声のサブフレーム毎に独立に算出、量子化を行う。
ム毎に音声信号の自乗和で電力を算出して電力情報を出
力するものである。なお、電力情報の量子化、符号化に
当たってもピッチ情報の場合と同様な方法を用いれば低
速化に寄与可能であるが、電力情報は変動幅が大きいた
め、包絡線のなめらかさが失われることから音声品質が
劣化するおそれがある。そこで、電力に関しては、入力
音声のサブフレーム毎に独立に算出、量子化を行う。
【0041】サブフレーム電力符号器9は、サブフレー
ム電力算出器8で求められたサブフレーム毎の電力情報
を符号化して、サブフレーム電力情報として出力するも
のである。
ム電力算出器8で求められたサブフレーム毎の電力情報
を符号化して、サブフレーム電力情報として出力するも
のである。
【0042】多重化器12は、ベクトル量子化器11か
らのコードインデックスと、基準ピッチ符号器6からの
基準ピッチ符号化情報と、各サブフレームに対するサブ
フレームピッチ差分量子化器7からのピッチ差分情報
と、各サブフレームに対するサブフレーム電力量子化器
9からのサブフレーム電力情報とを多重化して多重化信
号を伝送路に出力するものである。
らのコードインデックスと、基準ピッチ符号器6からの
基準ピッチ符号化情報と、各サブフレームに対するサブ
フレームピッチ差分量子化器7からのピッチ差分情報
と、各サブフレームに対するサブフレーム電力量子化器
9からのサブフレーム電力情報とを多重化して多重化信
号を伝送路に出力するものである。
【0043】次に、本発明の送信装置の送信側の動作に
ついて図1を用いて説明する。本発明の送信装置の送信
側では、送信する音声信号を、離散化してフレーム(分
析フレーム)単位で入力する。ここで、例えば分析フレ
ーム長は、40ms程度とし、低ビットレート化し易く
する。
ついて図1を用いて説明する。本発明の送信装置の送信
側では、送信する音声信号を、離散化してフレーム(分
析フレーム)単位で入力する。ここで、例えば分析フレ
ーム長は、40ms程度とし、低ビットレート化し易く
する。
【0044】そして、分析フレーム単位で入力された音
声信号からLSPパラメータ分析器1によってLSPパ
ラメータが取り出され、ベクトル量子化器11でコード
ブック10に予め記憶されているLSPパラメータと照
合されて最適なベクトルが選択されてコードインデック
スが出力される。
声信号からLSPパラメータ分析器1によってLSPパ
ラメータが取り出され、ベクトル量子化器11でコード
ブック10に予め記憶されているLSPパラメータと照
合されて最適なベクトルが選択されてコードインデック
スが出力される。
【0045】一方、分析フレーム単位で入力された音声
信号は、逆フィルタ2でLSPパラメータ分析器1によ
り求めたLSPパラメータが取り除かれて音源信号(予
測残差)が算出され、サブフレーム分割器3-aによって
複数(図1では2つ)のサブフレームに分割される。
信号は、逆フィルタ2でLSPパラメータ分析器1によ
り求めたLSPパラメータが取り除かれて音源信号(予
測残差)が算出され、サブフレーム分割器3-aによって
複数(図1では2つ)のサブフレームに分割される。
【0046】次に、分割されたサブフレーム毎に設けた
サブフレームピッチ抽出器4によって、それぞれ有声/
無声情報と有声の場合のピッチ情報とが取得されて出力
され、基準ピッチ検出器5によって、各サブフレームの
ピッチ情報から基準ピッチが決定され、基準ピッチ符号
器6で量子化されて基準ピッチ量子化情報が出力され、
更に基準ピッチ量子化情報が符号化されて、基準ピッチ
符号化情報が出力される。
サブフレームピッチ抽出器4によって、それぞれ有声/
無声情報と有声の場合のピッチ情報とが取得されて出力
され、基準ピッチ検出器5によって、各サブフレームの
ピッチ情報から基準ピッチが決定され、基準ピッチ符号
器6で量子化されて基準ピッチ量子化情報が出力され、
更に基準ピッチ量子化情報が符号化されて、基準ピッチ
符号化情報が出力される。
【0047】そして、各サブフレームピッチ差分量子化
器7において、基準ピッチ符号器6からの基準ピッチ量
子化情報と、各サブフレームピッチ抽出器4からのピッ
チ情報との差分情報(ピッチ差分)が取られて量子化さ
れ、ピッチ差分と有声/無声情報とが符号化されてサブ
フレームのピッチ差分情報として出力される。
器7において、基準ピッチ符号器6からの基準ピッチ量
子化情報と、各サブフレームピッチ抽出器4からのピッ
チ情報との差分情報(ピッチ差分)が取られて量子化さ
れ、ピッチ差分と有声/無声情報とが符号化されてサブ
フレームのピッチ差分情報として出力される。
【0048】一方、分析フレーム単位で入力された音声
信号は、サブフレーム分割器3bによって、複数(図1
では2つ)のサブフレームに分割され、各々サブフレー
ム電力抽出器8で電力情報が算出され、サブフレーム電
力符号器9で符号化されて、サブフレーム電力情報とし
て出力される。
信号は、サブフレーム分割器3bによって、複数(図1
では2つ)のサブフレームに分割され、各々サブフレー
ム電力抽出器8で電力情報が算出され、サブフレーム電
力符号器9で符号化されて、サブフレーム電力情報とし
て出力される。
【0049】そして、ベクトル量子化器11からのコー
ドインデックスと、基準ピッチ符号器6からの基準ピッ
チ符号化情報と、各サブフレームに対応するサブフレー
ムピッチ差分量子化器7からのピッチ差分情報と、各サ
ブフレームに対応するサブフレーム電力量子化器9から
のサブフレーム電力情報とが、多重器12で多重化され
て多重化信号が伝送路に出力される。
ドインデックスと、基準ピッチ符号器6からの基準ピッ
チ符号化情報と、各サブフレームに対応するサブフレー
ムピッチ差分量子化器7からのピッチ差分情報と、各サ
ブフレームに対応するサブフレーム電力量子化器9から
のサブフレーム電力情報とが、多重器12で多重化され
て多重化信号が伝送路に出力される。
【0050】この時、具体例として例えば、サンプリン
グ周波数8kHzフレーム長40msとした場合の伝送
ビット配分は、図2に示すように、スペクトルパラメー
タのコードインデックスにl1bit、符号化された基
準ピッチ情報に5bit、サブフレームピッチ差分情報
に2bitずつ計4bit、符号化サブフレーム電力情
報に6bitずつ計12bit与えた場合、合計32b
it/フレームとなり、伝送速度は800bpsとな
り、きわめて低速度化が実現できることになる。図2
は、本発明の多重化信号の具体例を示すフォーマット図
である。
グ周波数8kHzフレーム長40msとした場合の伝送
ビット配分は、図2に示すように、スペクトルパラメー
タのコードインデックスにl1bit、符号化された基
準ピッチ情報に5bit、サブフレームピッチ差分情報
に2bitずつ計4bit、符号化サブフレーム電力情
報に6bitずつ計12bit与えた場合、合計32b
it/フレームとなり、伝送速度は800bpsとな
り、きわめて低速度化が実現できることになる。図2
は、本発明の多重化信号の具体例を示すフォーマット図
である。
【0051】尚、伝送する情報量の軽減を重視する場合
には、電力情報の取得のためのサブフレーム化を省略し
ても構わない。その場合には、図1の構成からサブフレ
ーム分割器3b、サブフレーム電力抽出器8-2、サブフ
レーム電力量子化器9-2が省略され、サブフレーム電力
抽出器8-1、サブフレーム電力量子化器9-1が、サブフ
レーム単位の信号ではなく分析フレーム単位の信号を扱
うように変更する。
には、電力情報の取得のためのサブフレーム化を省略し
ても構わない。その場合には、図1の構成からサブフレ
ーム分割器3b、サブフレーム電力抽出器8-2、サブフ
レーム電力量子化器9-2が省略され、サブフレーム電力
抽出器8-1、サブフレーム電力量子化器9-1が、サブフ
レーム単位の信号ではなく分析フレーム単位の信号を扱
うように変更する。
【0052】次に、本発明に係る音声符号化方法を実現
する受信装置の受信側の構成について図3を使って説明
する。図3は、本発明に係る受信装置の受信側の構成ブ
ロック図である。尚、図3では、サブフレーム数が2の
場合を示している。
する受信装置の受信側の構成について図3を使って説明
する。図3は、本発明に係る受信装置の受信側の構成ブ
ロック図である。尚、図3では、サブフレーム数が2の
場合を示している。
【0053】本発明の受信装置の受信側は、分離手段と
しての分離器13と、基準ピッチ復号手段としての基準
ピッチ復号器14と、ピッチ復号手段としてのサブフレ
ームピッチ復号器16-1,16-2と、音源再生手段とし
てのピッチ再生器18-1,18-2と及びノイズ発生器1
9及び切替器15と、スペクトルパラメータ復号手段と
してのコードブック探索器20と、コードブック24
と、係数補間器21と、電力情報復号手段としてのサブ
フレーム電力復号器17-1,17-2と、音声再生手段と
しての合成フィルタ22と、増幅器23とから構成され
ている。
しての分離器13と、基準ピッチ復号手段としての基準
ピッチ復号器14と、ピッチ復号手段としてのサブフレ
ームピッチ復号器16-1,16-2と、音源再生手段とし
てのピッチ再生器18-1,18-2と及びノイズ発生器1
9及び切替器15と、スペクトルパラメータ復号手段と
してのコードブック探索器20と、コードブック24
と、係数補間器21と、電力情報復号手段としてのサブ
フレーム電力復号器17-1,17-2と、音声再生手段と
しての合成フィルタ22と、増幅器23とから構成され
ている。
【0054】次に、本発明の受信装置の受信側の各部に
ついて説明する。分離器13は、多重化信号を基準ピッ
チ符号化情報と、各サブフレームのピッチ差分情報と、
各サブフレームのサブフレーム電力情報と、コードイン
デックスとに分離出力するものである。
ついて説明する。分離器13は、多重化信号を基準ピッ
チ符号化情報と、各サブフレームのピッチ差分情報と、
各サブフレームのサブフレーム電力情報と、コードイン
デックスとに分離出力するものである。
【0055】基準ピッチ復号器14は、基準ピッチ符号
化情報を復号化して基準ピッチ情報を出力するものであ
る。
化情報を復号化して基準ピッチ情報を出力するものであ
る。
【0056】サブフレームピッチ復号器16は、対応す
るサブフレームのピッチ差分情報を入力し、復号して有
声/無声情報及び有声の時の差分情報を取得し、有声の
ときには基準ピッチ復号器14から出力される基準ピッ
チ情報と取得した差分情報から当該サブフレームのピッ
チ情報を算出するものである。尚、送信側におけるピッ
チ差分情報の符号化の際に量子化を行っているので、量
子化の範囲内でいかなる値を取るかは、任意である。
るサブフレームのピッチ差分情報を入力し、復号して有
声/無声情報及び有声の時の差分情報を取得し、有声の
ときには基準ピッチ復号器14から出力される基準ピッ
チ情報と取得した差分情報から当該サブフレームのピッ
チ情報を算出するものである。尚、送信側におけるピッ
チ差分情報の符号化の際に量子化を行っているので、量
子化の範囲内でいかなる値を取るかは、任意である。
【0057】ピッチ再生器18は、対応するサブフレー
ムピッチ復号器16からのピッチ情報に従って音源信号
を再生して出力するものである。ノイズ発生器19は、
無声のときの適当なノイズ信号を発生するものである。
ムピッチ復号器16からのピッチ情報に従って音源信号
を再生して出力するものである。ノイズ発生器19は、
無声のときの適当なノイズ信号を発生するものである。
【0058】切替器15は、分離器13から出力される
各サブフレームのピッチ差分情報を順に入力し、当該ピ
ッチ差分情報に含まれる有声/無声情報に従って、無声
の場合はノイズ発生器19からのノイズ信号を取り込ん
で出力し、有声の場合はサブフレームに対応するピッチ
再生器18からの再生された音源信号を取り込んで再生
音源信号を出力するものである。
各サブフレームのピッチ差分情報を順に入力し、当該ピ
ッチ差分情報に含まれる有声/無声情報に従って、無声
の場合はノイズ発生器19からのノイズ信号を取り込ん
で出力し、有声の場合はサブフレームに対応するピッチ
再生器18からの再生された音源信号を取り込んで再生
音源信号を出力するものである。
【0059】コードブック24は、送信側のコードブッ
ク10と同じ内容のLSPパラメータをコードベクトル
として記憶しているLSPパラメータコードブックであ
る。コードブック探索器20は、コードインデックスを
入力し、コードブック24を参照してコードインデック
スに対応するLSPパラメータを出力するものである。
ク10と同じ内容のLSPパラメータをコードベクトル
として記憶しているLSPパラメータコードブックであ
る。コードブック探索器20は、コードインデックスを
入力し、コードブック24を参照してコードインデック
スに対応するLSPパラメータを出力するものである。
【0060】係数補間器21は、LSPパラメータを入
力し、以前の分析フレームのLSPパラメータを保存し
ておき、現分析フレームのLSPパラメータと線形補間
する事により、分析フレーム間でのLSPパラメータを
なめらかに接続する補間LSPパラメータを出力するも
のである。
力し、以前の分析フレームのLSPパラメータを保存し
ておき、現分析フレームのLSPパラメータと線形補間
する事により、分析フレーム間でのLSPパラメータを
なめらかに接続する補間LSPパラメータを出力するも
のである。
【0061】合成フィルタ22は、切替器15から出力
される有声時若しくは無声時の再生音源信号と係数補間
器21から出力される補間LSPパラメータを合成して
合成音声を出力するものである。
される有声時若しくは無声時の再生音源信号と係数補間
器21から出力される補間LSPパラメータを合成して
合成音声を出力するものである。
【0062】サブフレーム電力復号器17は、サブフレ
ーム毎のサブフレーム電力情報を復号するものである。
増幅器23は、各サブフレームに対応するサブフレーム
電力復号器17から出力されるサブフレーム電力情報の
値をゲインとして、合成フィルタ22からの合成音声出
力を増幅し、再生(復号)音声出力を得るものである。
ーム毎のサブフレーム電力情報を復号するものである。
増幅器23は、各サブフレームに対応するサブフレーム
電力復号器17から出力されるサブフレーム電力情報の
値をゲインとして、合成フィルタ22からの合成音声出
力を増幅し、再生(復号)音声出力を得るものである。
【0063】次に、本発明の受信装置の受信側の動作に
ついて図3を用いて説明する。本発明の受信装置の受信
側では、伝送路を介して受信した多重化信号が、分離器
13で基準ピッチ符号化情報と、各サブフレームのピッ
チ差分情報と、各サブフレームのサブフレーム電力情報
と、コードインデックスとに分離され各々出力される。
ついて図3を用いて説明する。本発明の受信装置の受信
側では、伝送路を介して受信した多重化信号が、分離器
13で基準ピッチ符号化情報と、各サブフレームのピッ
チ差分情報と、各サブフレームのサブフレーム電力情報
と、コードインデックスとに分離され各々出力される。
【0064】そして、分離器13で分離された基準ピッ
チ符号化情報は、基準ピッチ復号器14で復号され、各
サブフレームピッチ復号器16-1,16-2に出力され
る。
チ符号化情報は、基準ピッチ復号器14で復号され、各
サブフレームピッチ復号器16-1,16-2に出力され
る。
【0065】そして、分離器13で分離された各サブフ
レームのピッチ差分情報は、各々対応するサブフレーム
ピッチ復号器16-1,16-2に入力され、サブフレーム
ピッチ復号器において復号され、有声/無声情報と有声
の場合の差分情報とが取得され、有声の場合に基準ピッ
チ復号器14からの基準ピッチ情報と差分情報からピッ
チ情報が算出され、当該ピッチ情報に従って対応するピ
ッチ再生器18で音源信号が再生されて出力される。
レームのピッチ差分情報は、各々対応するサブフレーム
ピッチ復号器16-1,16-2に入力され、サブフレーム
ピッチ復号器において復号され、有声/無声情報と有声
の場合の差分情報とが取得され、有声の場合に基準ピッ
チ復号器14からの基準ピッチ情報と差分情報からピッ
チ情報が算出され、当該ピッチ情報に従って対応するピ
ッチ再生器18で音源信号が再生されて出力される。
【0066】一方、分離器13で分離された各サブフレ
ームのピッチ差分情報は、同時に切替器15にも入力さ
れて、切替器15において、無声のときにはノイズ発生
器19によって発生されたノイズ信号に、また有声のと
きにはサブフレームに対応するピッチ再生器18で再生
された音源信号に切り換えられて、再生音源信号として
出力される。
ームのピッチ差分情報は、同時に切替器15にも入力さ
れて、切替器15において、無声のときにはノイズ発生
器19によって発生されたノイズ信号に、また有声のと
きにはサブフレームに対応するピッチ再生器18で再生
された音源信号に切り換えられて、再生音源信号として
出力される。
【0067】また、分離器13で分離されたコードイン
デックスは、コードブック探索器20でコードブック2
4が参照されて、LSPパラメータに変換され、係数補
間器21で以前のフレームのLSPパラメータの値から
線形補間されてなめらかに変化する補間LSPパラメー
タが出力される。
デックスは、コードブック探索器20でコードブック2
4が参照されて、LSPパラメータに変換され、係数補
間器21で以前のフレームのLSPパラメータの値から
線形補間されてなめらかに変化する補間LSPパラメー
タが出力される。
【0068】そして、切替器15からの再生音源信号
と、係数補間器21からの補間LSPパラメータから合
成フィルタ22で音声信号が合成され、更に分離器13
で分離されたサブフレーム電力情報が各サブフレーム電
力復号器17で復号されたサブフレーム電力情報の値を
ゲインとして、増幅器23で合成フィルタ22の出力が
増幅されて再生音声が得られるようになっている。
と、係数補間器21からの補間LSPパラメータから合
成フィルタ22で音声信号が合成され、更に分離器13
で分離されたサブフレーム電力情報が各サブフレーム電
力復号器17で復号されたサブフレーム電力情報の値を
ゲインとして、増幅器23で合成フィルタ22の出力が
増幅されて再生音声が得られるようになっている。
【0069】本発明の実施の形態の音声符号化方法及び
送信装置及び受信装置によれば、符号化側で分析フレー
ムを複数のサブフレームに分割し、サブフレーム毎に有
声/無声の判定とピッチ検出を行うので、音源のモデル
化を時間軸上で細かく行うことで、有声/無声の判定も
細かく行い、更に有声の場合の音声の持つピッチの時間
変化を細かく捕らえるため、復号化側でピッチの揺らぎ
を表現でき、再生音源の自然性を改善して品質を向上で
き、その結果再生音声の品質を向上できる効果がある。
送信装置及び受信装置によれば、符号化側で分析フレー
ムを複数のサブフレームに分割し、サブフレーム毎に有
声/無声の判定とピッチ検出を行うので、音源のモデル
化を時間軸上で細かく行うことで、有声/無声の判定も
細かく行い、更に有声の場合の音声の持つピッチの時間
変化を細かく捕らえるため、復号化側でピッチの揺らぎ
を表現でき、再生音源の自然性を改善して品質を向上で
き、その結果再生音声の品質を向上できる効果がある。
【0070】また、サブフレーム単位でピッチ周期検出
されたピッチ情報を全て伝送するわけではなく、基準ピ
ッチを決定して、基準ピッチ情報と、各サブフレームの
ピッチ情報と基準ピッチとの差分情報とを伝送するの
で、伝送するデータ量を軽減できる効果がある。
されたピッチ情報を全て伝送するわけではなく、基準ピ
ッチを決定して、基準ピッチ情報と、各サブフレームの
ピッチ情報と基準ピッチとの差分情報とを伝送するの
で、伝送するデータ量を軽減できる効果がある。
【0071】そして、基準ピッチ情報は量子化し、更に
符号化して伝送するので、伝送するデータ量を軽減で
き、また、基準ピッチ情報と量子化した基準ピッチ量子
化情報との差分も量子化して伝送すれば、伝送誤差を抑
えることができる。
符号化して伝送するので、伝送するデータ量を軽減で
き、また、基準ピッチ情報と量子化した基準ピッチ量子
化情報との差分も量子化して伝送すれば、伝送誤差を抑
えることができる。
【0072】更に、各サブフレームのピッチ差分情報は
量子化し、有声/無声の判定結果と共に符号化して伝送
するで、伝送するデータ量を更に軽減できる効果があ
る。
量子化し、有声/無声の判定結果と共に符号化して伝送
するで、伝送するデータ量を更に軽減できる効果があ
る。
【0073】更に発明の実施の形態の送信装置及び受信
装置では、分析フレームを複数のサブフレームに分割
し、サブフレーム毎に電力情報の抽出を行うので、音量
についても再生の精度を向上でき、その結果再生音声の
自然性を改善して品質を向上できる効果がある。
装置では、分析フレームを複数のサブフレームに分割
し、サブフレーム毎に電力情報の抽出を行うので、音量
についても再生の精度を向上でき、その結果再生音声の
自然性を改善して品質を向上できる効果がある。
【0074】また、本発明の実施の形態の送信装置及び
受信装置によれば、分析フレーム単位で入力した音声信
号をパラメータ分析して得られたLSPパラメータにつ
いて、予めLSPパラメータの標準パターンを記憶して
いるコードブックを参照して最適なベクトルを量子化し
てコードインデックスとして伝送するので、伝送するデ
ータ量を更に低減できる効果がある。
受信装置によれば、分析フレーム単位で入力した音声信
号をパラメータ分析して得られたLSPパラメータにつ
いて、予めLSPパラメータの標準パターンを記憶して
いるコードブックを参照して最適なベクトルを量子化し
てコードインデックスとして伝送するので、伝送するデ
ータ量を更に低減できる効果がある。
【0075】更に、受信側では、受信したコードインデ
ックスに従って送信側と同様のコードブックを参照して
LSPパラメータを求め、以前の分析フレームのLSP
パラメータとの間で補間処理を施して滑らかな変化を再
生するので、再生音声の品質を更に向上できる効果があ
る。
ックスに従って送信側と同様のコードブックを参照して
LSPパラメータを求め、以前の分析フレームのLSP
パラメータとの間で補間処理を施して滑らかな変化を再
生するので、再生音声の品質を更に向上できる効果があ
る。
【0076】また、本発明の送信装置及び受信装置によ
れば、音源の分析単位を時間軸上で短くして情報量は増
大するが、ピッチ情報については基準ピッチとの差分を
量子化及び符号化し、またLSPパラメータについては
ベクトル量子化することによって情報量を軽減してお
り、それにより、ビットレートを上げることなく再生音
声の品質を向上できる効果がある。
れば、音源の分析単位を時間軸上で短くして情報量は増
大するが、ピッチ情報については基準ピッチとの差分を
量子化及び符号化し、またLSPパラメータについては
ベクトル量子化することによって情報量を軽減してお
り、それにより、ビットレートを上げることなく再生音
声の品質を向上できる効果がある。
【0077】
【発明の効果】本発明によれば、音声の符号化側におい
て、音声の分析フレームを複数のサブフレームに分割
し、サブフレーム単位で有声/無声情報と、有声の場合
のピッチ情報を取得し、取得したピッチ情報から基準と
なる基準ピッチを決定して基準ピッチ情報として量子化
及び符号化すると共に、サブフレーム単位でピッチ情報
と基準ピッチ情報との差分情報を求めて量子化し、有声
/無声情報と共に符号化し、復号化側において、基準ピ
ッチ情報とサブフレーム単位の有声/無声情報及び差分
情報を用いて音源を再生する音声符号化方法及び送信装
置及び受信装置としているので、有声/無声情報及び有
声の場合のピッチ情報の取得を時間軸上で細かく行うこ
とで、音源再生の精度を向上することになり、その結果
再生音声の自然性を改善して品質を向上できる効果があ
る。
て、音声の分析フレームを複数のサブフレームに分割
し、サブフレーム単位で有声/無声情報と、有声の場合
のピッチ情報を取得し、取得したピッチ情報から基準と
なる基準ピッチを決定して基準ピッチ情報として量子化
及び符号化すると共に、サブフレーム単位でピッチ情報
と基準ピッチ情報との差分情報を求めて量子化し、有声
/無声情報と共に符号化し、復号化側において、基準ピ
ッチ情報とサブフレーム単位の有声/無声情報及び差分
情報を用いて音源を再生する音声符号化方法及び送信装
置及び受信装置としているので、有声/無声情報及び有
声の場合のピッチ情報の取得を時間軸上で細かく行うこ
とで、音源再生の精度を向上することになり、その結果
再生音声の自然性を改善して品質を向上できる効果があ
る。
【0078】本発明によれば、音声の符号化側におい
て、音声の分析フレームを複数のサブフレームに分割
し、サブフレーム単位で電力情報を取得して符号化し、
復号化側において、サブフレーム単位の電力情報を用い
て増幅し、音声を再生する送信装置及び受信装置として
いるので、音源情報の取得を時間軸上で細かく行うこと
で、音声再生の精度をより向上できる効果がある。
て、音声の分析フレームを複数のサブフレームに分割
し、サブフレーム単位で電力情報を取得して符号化し、
復号化側において、サブフレーム単位の電力情報を用い
て増幅し、音声を再生する送信装置及び受信装置として
いるので、音源情報の取得を時間軸上で細かく行うこと
で、音声再生の精度をより向上できる効果がある。
【図1】本発明に係る送信装置の構成ブロック図であ
る。
る。
【図2】本発明の多重化信号の具体例を示すフォーマッ
ト図である。
ト図である。
【図3】本発明に係る受信装置の受信側の構成ブロック
図である。
図である。
【図4】一般的なCELP方式を説明するブロック図で
ある。
ある。
【図5】一般的なLPC方式用いて音声伝送する場合の
概念を説明するブロック図である。
概念を説明するブロック図である。
【図6】本発明における基準ピッチ情報の量子化及び符
号化方法の具体例を説明する説明図である。
号化方法の具体例を説明する説明図である。
1…LSPパラメータ分析器、 2…逆フィルタ、 3
a,3b…サブフレーム分割器、 4…サブフレームピ
ッチ抽出器、 5…基準ピッチ検出器、 6…基準ピッ
チ符号器、 7…サブフレームピッチ差分量子化器、
8…サブフレーム電力抽出器、 9…サブフレーム電力
量子化器、 10…コードブック、 11…ベクトル量
子化器、 12…多重化器、 13…分離器、 14…
基準ピッチ復号器、 15…切替器、 16…サブフレ
ームピッチ復号器、 17…サブフレーム電力復号器、
18…ピッチ再生器、 19…ノイズ発生器、 20
…コードブック探索器、 21…係数補間器、 22…
合成フィルタ、 23…増幅器、 24…コードブック
a,3b…サブフレーム分割器、 4…サブフレームピ
ッチ抽出器、 5…基準ピッチ検出器、 6…基準ピッ
チ符号器、 7…サブフレームピッチ差分量子化器、
8…サブフレーム電力抽出器、 9…サブフレーム電力
量子化器、 10…コードブック、 11…ベクトル量
子化器、 12…多重化器、 13…分離器、 14…
基準ピッチ復号器、 15…切替器、 16…サブフレ
ームピッチ復号器、 17…サブフレーム電力復号器、
18…ピッチ再生器、 19…ノイズ発生器、 20
…コードブック探索器、 21…係数補間器、 22…
合成フィルタ、 23…増幅器、 24…コードブック
Claims (8)
- 【請求項1】 音声信号を分析フレーム単位でスペクト
ル分析したスペクトルパラメータと、前記音声信号から
スペクトル成分を除去した信号から得られる音源情報と
を符号化する音声分析合成型の音声符号化方法であっ
て、 音声の分析フレームを複数のサブフレームに分割し、前
記サブフレーム単位で音源情報を取得して符号化するこ
とを特徴とする音声符号化方法。 - 【請求項2】 音声信号を分析フレーム単位でスペクト
ル分析したスペクトルパラメータと、前記音声信号から
スペクトル成分を除去した信号から得られる音源情報と
を符号化する音声分析合成型の音声符号化方法であっ
て、 音声の分析フレームを複数のサブフレームに分割し、前
記サブフレーム単位で有声/無声の判定を行って有声/
無声情報を取得し、有声の場合にピッチ周期検出を行っ
てピッチ情報を取得し、前記ピッチ情報から基準となる
基準ピッチを決定して基準ピッチ情報を符号化すると共
に、前記サブフレーム単位で前記ピッチ情報と前記基準
ピッチ情報との差分を求めて量子化し、有声/無声情報
と共に符号化することを特徴とする音声符号化方法。 - 【請求項3】 分析フレーム単位で入力された音声信号
をスペクトル分析してスペクトルのパラメータを取得す
るスペクトル分析手段と、 前記音声信号から前記スペクトルの成分を除去した音源
信号を複数のサブフレームに分割するサブフレーム分割
手段と、 前記サブフレーム毎に有声/無声の判定を行って有声/
無声情報を取得し、有声の場合にピッチ周期検出を行っ
てピッチ情報を取得するピッチ抽出手段と、 前記複数のピッチ情報から基準ピッチ情報を決定し、前
記基準ピッチ情報を符号化する基準ピッチ決定符号化手
段と、 サブフレーム毎に、有声の場合のピッチ情報と基準ピッ
チ情報との差分情報をとり、有声/無声情報と共に符号
化してピッチ差分情報とするピッチ差分符号化手段と、 前記音声信号から電力情報を取得して符号化する電力情
報取得手段と、 前記スペクトルのパラメータと、前記符号化された基準
ピッチ情報と、前記サブフレーム毎のピッチ差分情報
と、前記符号化された電力情報とを多重化して送信する
多重化手段とを有することを特徴とする送信装置。 - 【請求項4】 受信した多重化信号を、スペクトルのパ
ラメータと、符号化された基準ピッチ情報と、サブフレ
ーム毎のピッチ差分情報と、符号化された電力情報とに
分離する分離手段と、 前記符号化された基準ピッチ情報を復号する基準ピッチ
復号手段と、 サブフレーム毎に前記ピッチ差分情報を復号して、有声
/無声情報と有声の場合の差分情報を取得し、有声の場
合に前記復号された基準ピッチ情報と前記差分情報から
ピッチ情報を算出するピッチ復号手段と、 サブフレーム毎に前記有声/無声情報と前記ピッチ情報
に従って音源を再生する音源再生手段と、 前記符号化されたスペクトルパラメータを復号するスペ
クトルパラメータ復号手段と、 前記符号化された電力情報を復号する電力情報復号手段
と、 前記再生された音源と前記スペクトルパラメータを合成
し、前記電力情報に従って増幅して音声を再生する音声
再生手段とを有することを特徴とする受信装置。 - 【請求項5】 分析フレーム単位で音声信号を分析し、
分析結果を符号化して送信する送信装置であって、 予めサンプルのスペクトルパラメータを記憶しておく第
1のコードブックと、 入力した音声信号からスペクトルパラメータを取り出す
スペクトルパラメータ分析器と、 前記スペクトルパラメータと前記第1のコードブックの
スペクトルパラメータとを照合し、最適なスペクトルパ
ラメータを選択して対応するコードインデックスを求め
るベクトル量子化器と、 前記音声信号から前記スペクトルパラメータを取り除い
た音源信号を算出する逆フィルタと、 前記音源信号を複数のサブフレームに分割する第1のサ
ブフレーム分割器と、 前記サブフレーム毎に有声/無声の判定を行って判定結
果を有声/無声情報とし、有声の場合にピッチ周期を検
出してピッチ情報を取得するサブフレームピッチ抽出器
と、 前記サブフレーム毎のピッチ情報から基準となる基準ピ
ッチ情報を決定する基準ピッチ検出器と、 前記基準ピッチ情報を量子化し符号化する基準ピッチ符
号化器と、 前記サブフレーム毎のピッチ情報と前記量子化された基
準ピッチ情報との差分を差分情報として量子化し、有声
/無声情報と共に符号化してピッチ差分情報とするサブ
フレームピッチ差分量子化器と、 前記音声信号を複数のサブフレームに分割する第2のサ
ブフレーム分割器と、 当該サブフレーム毎に電力を算出して電力情報を求める
サブフレーム電力算出器と、 前記算出された電力を符号化して電力情報とするサブフ
レーム電力量子化器と、 前記コードインデックスと、前記符号化された基準ピッ
チ情報と、サブフレーム毎の前記ピッチ差分情報と、サ
ブフレーム毎の前記電力情報とを多重化して送信する多
重化器とを有することを特徴とする送信装置。 - 【請求項6】 符号化された分析フレーム単位の音声信
号の分析結果を受信して音声信号を再生する受信装置で
あって、 多重化信号を受信して、コードインデックスと、符号化
された基準ピッチ情報と、サブフレーム毎のピッチ差分
情報と、サブフレーム毎の電力情報とに分離する分離器
と、 送信側の前記第1のコードブックと同様の内容でスペク
トルパラメータを記憶している第2のコードブックと、 前記コードインデックスに従って前記第2のコードブッ
クの対応するスペクトルパラメータを求めるコードブッ
ク探索器と、 前記符号化された基準ピッチ情報を復号する基準ピッチ
情報復号器と、 サブフレーム毎に前記ピッチ差分情報を復号して、有声
/無声情報と有声の場合の差分情報を取得し、有声の場
合に前記基準ピッチ情報と前記差分情報からピッチ情報
を算出するサブフレームピッチ復号器と、 前記算出されたピッチ情報に従って音源信号を再生する
ピッチ再生器と、 ノイズを発生するノイズ発生器と、 サブフレーム毎の前記ピッチ差分情報に含まれる有声/
無声情報に従って、前記ピッチ再生器もしくは前記ノイ
ズ発生器を切り換えて再生音源信号を取り出す切替器
と、 サブフレーム毎の前記電力情報を復号するサブフレーム
電力復号器と、 前記再生音源信号と前記スペクトルパラメータとを合成
して合成音声を出力する合成フィルタと、 前記合成フィルタからの合成音声を前記復号されたサブ
フレーム毎の電力情報によって増幅し、音声を再生する
増幅器とを有することを特徴とする受信装置。 - 【請求項7】 基準ピッチ検出器が、複数のサブフレー
ムピッチ抽出器からのピッチ情報の最大値を基準ピッチ
とする基準ピッチ検出器であることを特徴とする請求項
5記載の送信装置。 - 【請求項8】 コードブック探索器と合成フィルタとの
間に配置され、前記コードブック探索器から出力される
スペクトルパラメータを入力し、以前のスペクトルパラ
メータを記憶しておいて、前記以前のスペクトルパラメ
ータと前記入力したスペクトルパラメータとから補間し
たスペクトルパラメータを前記合成フィルタに与える係
数補間器を設けたことを特徴とする請求項6記載の受信
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11079025A JP2000276199A (ja) | 1999-03-24 | 1999-03-24 | 音声符号化方法及び送信装置及び受信装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11079025A JP2000276199A (ja) | 1999-03-24 | 1999-03-24 | 音声符号化方法及び送信装置及び受信装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000276199A true JP2000276199A (ja) | 2000-10-06 |
Family
ID=13678412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11079025A Pending JP2000276199A (ja) | 1999-03-24 | 1999-03-24 | 音声符号化方法及び送信装置及び受信装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000276199A (ja) |
-
1999
- 1999-03-24 JP JP11079025A patent/JP2000276199A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JPH08123494A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 | |
KR102259112B1 (ko) | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 | |
JP2003044098A (ja) | 音声帯域拡張装置及び音声帯域拡張方法 | |
KR100275429B1 (ko) | 음성 부호화 장치 | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP2003337600A (ja) | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 | |
JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
JP3266178B2 (ja) | 音声符号化装置 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3537008B2 (ja) | 音声符号化通信方式とその送受信装置 | |
KR100796836B1 (ko) | 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체 | |
JPH09185397A (ja) | 音声情報記録装置 | |
JP3050978B2 (ja) | 音声符号化方法 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JPH10207496A (ja) | 音声符号化装置及び音声復号装置 | |
JP2000276199A (ja) | 音声符号化方法及び送信装置及び受信装置 | |
JP2001318698A (ja) | 音声符号化装置及び音声復号化装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3845316B2 (ja) | 音声符号化装置及び音声復号装置 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP2008090311A (ja) | 音声符号化方法 | |
JPH06130994A (ja) | 音声符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040427 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040907 |