JPH1069299A - 音声符号装置及び音声復号装置 - Google Patents
音声符号装置及び音声復号装置Info
- Publication number
- JPH1069299A JPH1069299A JP8228337A JP22833796A JPH1069299A JP H1069299 A JPH1069299 A JP H1069299A JP 8228337 A JP8228337 A JP 8228337A JP 22833796 A JP22833796 A JP 22833796A JP H1069299 A JPH1069299 A JP H1069299A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- processing unit
- input
- code
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 音声符号/復号装置に関し、音声の線形予測
分析に係る各種パラメータ情報が一時的に破壊されても
受話者に不快感を与えないことを課題とする。 【解決手段】 音源と全極型調音系モデルに基づき音声
合成の各種パラメータ情報を演算して入力音声をフレー
ム単位に符号化する音声符号化処理部と、各フレームの
符号化終了時に、得られたパラメータ情報中の1又は2
以上のパラメータ情報につき音声合成系の安定条件等を
評価し、異常の場合は、生成された音声符号データの内
の少なくとも振幅に係る情報を抑制する音声符号監視処
理部とを備える音声符号装置。上記生成された音声符号
データを入力して合成音声信号を再生する音声復号化処
理部と、前記入力した符号データ中の1又は2以上のパ
ラメータ情報につき音声再生系の安定条件等を評価し、
異常の場合は、再生音声信号の出力を抑制する音声復号
監視処理部とを備える音声復号装置。
分析に係る各種パラメータ情報が一時的に破壊されても
受話者に不快感を与えないことを課題とする。 【解決手段】 音源と全極型調音系モデルに基づき音声
合成の各種パラメータ情報を演算して入力音声をフレー
ム単位に符号化する音声符号化処理部と、各フレームの
符号化終了時に、得られたパラメータ情報中の1又は2
以上のパラメータ情報につき音声合成系の安定条件等を
評価し、異常の場合は、生成された音声符号データの内
の少なくとも振幅に係る情報を抑制する音声符号監視処
理部とを備える音声符号装置。上記生成された音声符号
データを入力して合成音声信号を再生する音声復号化処
理部と、前記入力した符号データ中の1又は2以上のパ
ラメータ情報につき音声再生系の安定条件等を評価し、
異常の場合は、再生音声信号の出力を抑制する音声復号
監視処理部とを備える音声復号装置。
Description
【0001】
【発明の属する技術分野】本発明は音声符号装置及び音
声復号装置に関し、更に詳しくは音源と全極型の調音系
モデルに基づき入力音声をフレーム単位に符号化する音
声符号装置及び前記符号化データを入力して対応する合
成音声信号を再生する音声復号装置に関する。
声復号装置に関し、更に詳しくは音源と全極型の調音系
モデルに基づき入力音声をフレーム単位に符号化する音
声符号装置及び前記符号化データを入力して対応する合
成音声信号を再生する音声復号装置に関する。
【0002】この種の装置の代表的なものに、例えば音
声の高能率符号/復号が可能なCELP(Code Excited
Linear Predictive Coding )型の音声符号装置及び音
声復号装置がある。CELP型の音声符号装置及び音声
復号装置はコーデック(CODEC)として広くディジ
タル携帯電話器等に搭載され、その安定な動作が望まれ
る。
声の高能率符号/復号が可能なCELP(Code Excited
Linear Predictive Coding )型の音声符号装置及び音
声復号装置がある。CELP型の音声符号装置及び音声
復号装置はコーデック(CODEC)として広くディジ
タル携帯電話器等に搭載され、その安定な動作が望まれ
る。
【0003】
【従来の技術】図12,図13は従来技術を説明する図
(1),(2)である。図12はCELP型音声符号装
置の機能ブロック図で、各機能ブロックは不図示のMP
UやRAM,ROM等を具備するディジタルシグナルプ
ロセッサ(DSP)100のプログラム実行により実現
される。
(1),(2)である。図12はCELP型音声符号装
置の機能ブロック図で、各機能ブロックは不図示のMP
UやRAM,ROM等を具備するディジタルシグナルプ
ロセッサ(DSP)100のプログラム実行により実現
される。
【0004】図において、1は入力音声のパワーを算出
して量子化する入力パワ−計算部、2は聴覚のマスキン
グ(masking)効果に基づき入力音声に重み付けを行う聴
覚重み付け処理部、3は線形予測分析部、31は窓かけ
処理部、32は自己相関係数算出部、33は線形予測係
数(LPC)・反射係数(偏自己相関係数)算出部、3
4は線スペクトル対係数(LSP係数)算出部、4は音
源の周期的成分(ピッチベクトルP)を記憶する適応符
号帳、5は音源の非周期的成分(コードベクトルC)を
記憶している雑音符号帳、6,7は乗算器、8は加算
器、9はフレーム遅延部、10は重み付け合成フィル
タ、11は減算器、12は誤差電力評価部、13は符号
化制御部である。
して量子化する入力パワ−計算部、2は聴覚のマスキン
グ(masking)効果に基づき入力音声に重み付けを行う聴
覚重み付け処理部、3は線形予測分析部、31は窓かけ
処理部、32は自己相関係数算出部、33は線形予測係
数(LPC)・反射係数(偏自己相関係数)算出部、3
4は線スペクトル対係数(LSP係数)算出部、4は音
源の周期的成分(ピッチベクトルP)を記憶する適応符
号帳、5は音源の非周期的成分(コードベクトルC)を
記憶している雑音符号帳、6,7は乗算器、8は加算
器、9はフレーム遅延部、10は重み付け合成フィル
タ、11は減算器、12は誤差電力評価部、13は符号
化制御部である。
【0005】外部より入力音声のフレーム(例えば32
0サンプル/40ms)が入力する。符号化制御部13
はインデックス信号IP ,IC により符号帳4,5から
ピッチベクトルP,コードベクトルCを読み出すと共
に、これらにピッチゲインb,コードゲインgを掛け合
わせて駆動音源信号(bP+gC)を生成する。重み付
け合成フィルタ10は駆動音源信号(bP+gC)にL
PCベクトル(lpc[0]〜lpc[n−1])によ
る重み付け合成を行って合成音声を再生する。減算器1
1は聴覚重み付けされた入力音声と合成音声との差を求
めて誤差信号eを形成する。誤差電力評価部12は誤差
信号eの電力を求めて誤差電力を評価し、評価結果を符
号化制御部13にフィードバックする。こうして符号化
制御部13は、入力音声の1フレームにつき誤差電力を
最小とするようなピッチベクトルPとコードベクトルC
とを探査し、得られたインデックス信号IP ,IC と、
ゲインb,gと、パワーpowと、線スペクトル対係数
LSPとをコード化して外部に出力する。
0サンプル/40ms)が入力する。符号化制御部13
はインデックス信号IP ,IC により符号帳4,5から
ピッチベクトルP,コードベクトルCを読み出すと共
に、これらにピッチゲインb,コードゲインgを掛け合
わせて駆動音源信号(bP+gC)を生成する。重み付
け合成フィルタ10は駆動音源信号(bP+gC)にL
PCベクトル(lpc[0]〜lpc[n−1])によ
る重み付け合成を行って合成音声を再生する。減算器1
1は聴覚重み付けされた入力音声と合成音声との差を求
めて誤差信号eを形成する。誤差電力評価部12は誤差
信号eの電力を求めて誤差電力を評価し、評価結果を符
号化制御部13にフィードバックする。こうして符号化
制御部13は、入力音声の1フレームにつき誤差電力を
最小とするようなピッチベクトルPとコードベクトルC
とを探査し、得られたインデックス信号IP ,IC と、
ゲインb,gと、パワーpowと、線スペクトル対係数
LSPとをコード化して外部に出力する。
【0006】この音声符号化動作を更に時系列に見る
と、例えば入力音声「shi」は無声部を成す非周期成
分「sh」とこれに続く有声部を成すピッチ周期成分
「i」とから成る。無声部「sh」の区間における駆動
音源信号(bP+gC)はgC(雑音)成分が支配的で
あり、これをフレーム遅延させて適応符号帳4にフィー
ドバックする。入力音声が無声部「sh」から有声部
「i」に移る区間では、gC成分が減少すると共に入力
音声のピッチ成分を反映(抽出)したbP成分が支配的
となり、これをフレーム遅延させて適応符号帳4にフィ
ードバックする。こうして入力音声への滑らかな追従が
可能となる。
と、例えば入力音声「shi」は無声部を成す非周期成
分「sh」とこれに続く有声部を成すピッチ周期成分
「i」とから成る。無声部「sh」の区間における駆動
音源信号(bP+gC)はgC(雑音)成分が支配的で
あり、これをフレーム遅延させて適応符号帳4にフィー
ドバックする。入力音声が無声部「sh」から有声部
「i」に移る区間では、gC成分が減少すると共に入力
音声のピッチ成分を反映(抽出)したbP成分が支配的
となり、これをフレーム遅延させて適応符号帳4にフィ
ードバックする。こうして入力音声への滑らかな追従が
可能となる。
【0007】線形予測分析部3において、窓かけ処理部
31は入力音声に窓かけを行う。自己相関係数算出部3
2は窓かけした入力音声に基づき自己相関係数を求め
る。LPC・反射係数算出部33は自己相関係数に基づ
き線形予測係数LPC(linearpredictor coefficients
)及び反射係数(偏自己相関係数に相当)kを求め
る。自己相関係数からLPCを求める方法の一つにDL
I(Durbin-Levinson-Itakura )法がある。このアルゴ
リズムを用いてLPCを求めると同時に反射係数kを求
める。
31は入力音声に窓かけを行う。自己相関係数算出部3
2は窓かけした入力音声に基づき自己相関係数を求め
る。LPC・反射係数算出部33は自己相関係数に基づ
き線形予測係数LPC(linearpredictor coefficients
)及び反射係数(偏自己相関係数に相当)kを求め
る。自己相関係数からLPCを求める方法の一つにDL
I(Durbin-Levinson-Itakura )法がある。このアルゴ
リズムを用いてLPCを求めると同時に反射係数kを求
める。
【0008】線形予測係数LPCは全極型の重み付け合
成フィルタ10に加えられる。但し、LPCは係数感度
が高く、これを低ビット量子化すると、音質劣化や合成
系不安定の要因となるため、符号化されない。一方、偏
自己相関(反射)係数kは予測不可能な部分(即ち、前
向き予測残差と後向き予測残差)間の相関として定義さ
れ、通常の相関より高密度の情報がパックされている。
但し、基本的には時間軸上のパラメータであるためフレ
ーム間隔の増大による歪み(音声劣化)が大きく、これ
も符号化されない。
成フィルタ10に加えられる。但し、LPCは係数感度
が高く、これを低ビット量子化すると、音質劣化や合成
系不安定の要因となるため、符号化されない。一方、偏
自己相関(反射)係数kは予測不可能な部分(即ち、前
向き予測残差と後向き予測残差)間の相関として定義さ
れ、通常の相関より高密度の情報がパックされている。
但し、基本的には時間軸上のパラメータであるためフレ
ーム間隔の増大による歪み(音声劣化)が大きく、これ
も符号化されない。
【0009】LSP係数算出部34は反射係数kから線
スペクトル対LSP(Line spectrumpair)を求める。L
SPは声道の共振周波数をパラメータとして音声情報を
表現するものであり、周波数軸上のパラメータであるか
らフレーム間隔の増大による歪みが少ない。また係数感
度が低いので低ビット符号化が可能であり、これを符号
化している。
スペクトル対LSP(Line spectrumpair)を求める。L
SPは声道の共振周波数をパラメータとして音声情報を
表現するものであり、周波数軸上のパラメータであるか
らフレーム間隔の増大による歪みが少ない。また係数感
度が低いので低ビット符号化が可能であり、これを符号
化している。
【0010】図13は従来のCELP型音声復号装置の
機能ブロック図で、各機能ブロックは不図示のMPUや
RAM,ROM等を具備する図12と同様のディジタル
シグナルプロセッサ(DSP)200のプログラム実行
により実現される。図において、4は適応符号帳、5は
雑音符号帳、6,7は乗算器、8は加算器、9はフレー
ム遅延部、10は重み付け合成フィルタ、21は復号化
制御部、22はLPC・反射係数算出部、26はスピー
カ(SP)である。
機能ブロック図で、各機能ブロックは不図示のMPUや
RAM,ROM等を具備する図12と同様のディジタル
シグナルプロセッサ(DSP)200のプログラム実行
により実現される。図において、4は適応符号帳、5は
雑音符号帳、6,7は乗算器、8は加算器、9はフレー
ム遅延部、10は重み付け合成フィルタ、21は復号化
制御部、22はLPC・反射係数算出部、26はスピー
カ(SP)である。
【0011】外部からの符号データ(IP ,IC ,b,
g,LSP,pow)は復号化制御部21に入力する。
復号化制御部21は、入力のインデックス信号IP ,I
C により符号帳4,5からピッチベクトルP,コードベ
クトルCを読み出すと共に、これらに入力のピッチゲイ
ンb,コードゲインgを掛け合わせて駆動音源信号(b
P+gC)を生成する。LPC・反射係数算出部22は
入力のLSPから反射係数k及びLPCを逆算する。重
み付け合成フィルタ10は駆動音源信号(bP+gC)
にLPCベクトル(lpc[0]〜lpc[n−1])
による合成を行って合成(出力)音声を再生する。
g,LSP,pow)は復号化制御部21に入力する。
復号化制御部21は、入力のインデックス信号IP ,I
C により符号帳4,5からピッチベクトルP,コードベ
クトルCを読み出すと共に、これらに入力のピッチゲイ
ンb,コードゲインgを掛け合わせて駆動音源信号(b
P+gC)を生成する。LPC・反射係数算出部22は
入力のLSPから反射係数k及びLPCを逆算する。重
み付け合成フィルタ10は駆動音源信号(bP+gC)
にLPCベクトル(lpc[0]〜lpc[n−1])
による合成を行って合成(出力)音声を再生する。
【0012】
【発明が解決しようとする課題】上記の如く、一般にこ
の種の装置を構成する各機能ブロックはDSP100,
200のプログラム実行により実現され、自ら演算し又
は外部より入力した各種パラメータ(LPC,k,LS
P,pow等)はDSP内のRAMやレジスタに一時的
に記憶される。プロセッサが正常な場合は、線形予測分
析に係る各種係数は、合成系の安定条件を満たすように
処理される。
の種の装置を構成する各機能ブロックはDSP100,
200のプログラム実行により実現され、自ら演算し又
は外部より入力した各種パラメータ(LPC,k,LS
P,pow等)はDSP内のRAMやレジスタに一時的
に記憶される。プロセッサが正常な場合は、線形予測分
析に係る各種係数は、合成系の安定条件を満たすように
処理される。
【0013】しかるに、この種の装置を具備する携帯電
話機等は電磁障害やバッテリー不足等の様々な悪条件下
で使用されるのが常であり、この為にプロセッサの誤演
算やRAMデータ等の破壊が一時的に発生する場合も少
なくない。この場合に、全極型の合成フィルタは過去の
出力信号に重み付けをして入力に帰還するため、一旦合
成系のどこかでデータが破壊されると、該合成系は動作
不安定となり、その後は異音を発生し続け、受話者に不
快感を与える。
話機等は電磁障害やバッテリー不足等の様々な悪条件下
で使用されるのが常であり、この為にプロセッサの誤演
算やRAMデータ等の破壊が一時的に発生する場合も少
なくない。この場合に、全極型の合成フィルタは過去の
出力信号に重み付けをして入力に帰還するため、一旦合
成系のどこかでデータが破壊されると、該合成系は動作
不安定となり、その後は異音を発生し続け、受話者に不
快感を与える。
【0014】本発明の目的は、音声の線形予測分析に係
る各種パラメータデータが一時的に破壊されても受話者
に不快感を与えない音声符号装置及び音声復号装置を提
供することにある。
る各種パラメータデータが一時的に破壊されても受話者
に不快感を与えない音声符号装置及び音声復号装置を提
供することにある。
【0015】
【課題を解決するための手段】上記の課題は例えば図1
(A)の構成により解決される。即ち、本発明(1)の
音声符号装置は、音源と全極型の調音系モデルに基づき
音声を合成するための各種パラメータ情報を演算して入
力音声をフレーム単位に符号化し、対応する符号データ
を出力する音声符号化処理部と、前記フレーム単位の符
号化終了時に、前記音声符号化処理部により得られたパ
ラメータ情報の内の1又は2以上のパラメータ情報につ
き所定の内容を評価すると共に、該評価結果が異常の場
合は、前記音声符号化処理部が生成した符号データの内
の少なくとも合成音声の振幅に係る情報を抑制する音声
符号監視処理部とを備える。
(A)の構成により解決される。即ち、本発明(1)の
音声符号装置は、音源と全極型の調音系モデルに基づき
音声を合成するための各種パラメータ情報を演算して入
力音声をフレーム単位に符号化し、対応する符号データ
を出力する音声符号化処理部と、前記フレーム単位の符
号化終了時に、前記音声符号化処理部により得られたパ
ラメータ情報の内の1又は2以上のパラメータ情報につ
き所定の内容を評価すると共に、該評価結果が異常の場
合は、前記音声符号化処理部が生成した符号データの内
の少なくとも合成音声の振幅に係る情報を抑制する音声
符号監視処理部とを備える。
【0016】本発明(1)によれば、音声符号監視処理
部は、符号化終了時(符号データ送出前)の1又は2以
上のパラメータ情報につき所定の内容(合成系の安定条
件等)を評価すると共に、評価結果が異常の場合は、符
号データの内の少なくとも合成音声の振幅に係る情報を
抑制(例えば値を小さく制限)するので、異音データの
送出を迅速(未然)に阻止でき、受話者に不快感を与え
ない。
部は、符号化終了時(符号データ送出前)の1又は2以
上のパラメータ情報につき所定の内容(合成系の安定条
件等)を評価すると共に、評価結果が異常の場合は、符
号データの内の少なくとも合成音声の振幅に係る情報を
抑制(例えば値を小さく制限)するので、異音データの
送出を迅速(未然)に阻止でき、受話者に不快感を与え
ない。
【0017】好ましくは、本発明(2)においては、上
記本発明(1)において、音声符号監視処理部は、パラ
メータ情報の評価結果が所定回数連続して異常の場合、
RAMを初期化して再度音声符号化処理を行う。従っ
て、合成系を早期に正常に戻せる。また好ましくは、本
発明(3)においては、上記本発明(1)において、音
声符号監視処理部は、入力音声につき求められた現時点
及び又は前時点の線形予測係数の内容が所定の範囲内に
あるか否かを評価する。
記本発明(1)において、音声符号監視処理部は、パラ
メータ情報の評価結果が所定回数連続して異常の場合、
RAMを初期化して再度音声符号化処理を行う。従っ
て、合成系を早期に正常に戻せる。また好ましくは、本
発明(3)においては、上記本発明(1)において、音
声符号監視処理部は、入力音声につき求められた現時点
及び又は前時点の線形予測係数の内容が所定の範囲内に
あるか否かを評価する。
【0018】所定の範囲を越える場合としては、例えば
1又は2以上の線形予測係数の値が予め規定した閾値を
越える場合、又はn個の線形予測係数lpc[0]〜l
pc[n−1]の全てがプロセッサが表現できる最大値
又は最小値になっている場合、等がある。また、現時点
のパラメータ情報は元より、前時点のパラメータ情報で
も、現時点のパラメータ情報の演算に利用される場合が
あるので、これを評価する。
1又は2以上の線形予測係数の値が予め規定した閾値を
越える場合、又はn個の線形予測係数lpc[0]〜l
pc[n−1]の全てがプロセッサが表現できる最大値
又は最小値になっている場合、等がある。また、現時点
のパラメータ情報は元より、前時点のパラメータ情報で
も、現時点のパラメータ情報の演算に利用される場合が
あるので、これを評価する。
【0019】また好ましくは、本発明(4)において
は、上記本発明(1)において、音声符号監視処理部
は、入力音声につき求められた現時点及び又は前時点の
偏自己相関係数の内容が音声合成システムの安定条件を
満たしているか否かを評価する。反射係数(偏自己相関
係数に相当)kは、声道内の音波の伝播過程を音波の透
過と反射の過程で記述したものであり、|ki |<1
(i=1〜n−1)であれば合成系は安定とされる。そ
こで、例えばこの安定条件を評価する。
は、上記本発明(1)において、音声符号監視処理部
は、入力音声につき求められた現時点及び又は前時点の
偏自己相関係数の内容が音声合成システムの安定条件を
満たしているか否かを評価する。反射係数(偏自己相関
係数に相当)kは、声道内の音波の伝播過程を音波の透
過と反射の過程で記述したものであり、|ki |<1
(i=1〜n−1)であれば合成系は安定とされる。そ
こで、例えばこの安定条件を評価する。
【0020】また好ましくは、本発明(5)において
は、上記本発明(1)において、音声符号監視処理部
は、入力音声につき求められた現時点及び又は前時点の
線スペクトル対係数が音声合成システムの安定条件を満
たしているか否かを評価する。線スペクトル対LSP
は、声道の共振周波数ω[i](i=1〜n−1)をパ
ラメータとして音声情報を表現するものであり、0<ω
0 <ω1 <…<ωn-1 <πであれば合成系は安定とされ
る。そこで、例えばこの安定条件を評価する。
は、上記本発明(1)において、音声符号監視処理部
は、入力音声につき求められた現時点及び又は前時点の
線スペクトル対係数が音声合成システムの安定条件を満
たしているか否かを評価する。線スペクトル対LSP
は、声道の共振周波数ω[i](i=1〜n−1)をパ
ラメータとして音声情報を表現するものであり、0<ω
0 <ω1 <…<ωn-1 <πであれば合成系は安定とされ
る。そこで、例えばこの安定条件を評価する。
【0021】なお、線スペクトル対係数lsp[i]と
共振周波数ω[i]との間にはlsp[i]=−cos
ω[i](i=1〜n−1)の関係がある。従って、−
1<lsp[0]<lsp[1]<…<lsp[n−
1]<1の安定条件を評価しても良い。又は、上記の0
<ω0 <ω1 <…<ωn-1 <πの関係をπで正規化し、
0<(ω0 /π)<(ω1 /π)<…<(ωn-1 /π)
<1の安定条件を評価しても良い。
共振周波数ω[i]との間にはlsp[i]=−cos
ω[i](i=1〜n−1)の関係がある。従って、−
1<lsp[0]<lsp[1]<…<lsp[n−
1]<1の安定条件を評価しても良い。又は、上記の0
<ω0 <ω1 <…<ωn-1 <πの関係をπで正規化し、
0<(ω0 /π)<(ω1 /π)<…<(ωn-1 /π)
<1の安定条件を評価しても良い。
【0022】また好ましくは、本発明(6)において
は、上記本発明(1)において、音声符号監視処理部
は、入力音声のパワーをコード化したパワーコードの逆
量子化値と合成音声のパワーとの比が所定より大きいか
否かを評価する。音声符号化プロセスが正常であればこ
れらのパワー比は略1程度になる。しかし、送出すべき
パワーコードの逆量子化値が破壊され、又は内部で再生
した合成音声そのものがが異常であると、前記パワー比
は所定から大きくずれてくる。そこで、このパワー比を
評価する。なお、パワー比に代えて、両パワーの相違を
評価しても良い。
は、上記本発明(1)において、音声符号監視処理部
は、入力音声のパワーをコード化したパワーコードの逆
量子化値と合成音声のパワーとの比が所定より大きいか
否かを評価する。音声符号化プロセスが正常であればこ
れらのパワー比は略1程度になる。しかし、送出すべき
パワーコードの逆量子化値が破壊され、又は内部で再生
した合成音声そのものがが異常であると、前記パワー比
は所定から大きくずれてくる。そこで、このパワー比を
評価する。なお、パワー比に代えて、両パワーの相違を
評価しても良い。
【0023】また上記の課題は例えば図1(B)の構成
により解決される。即ち、本発明(7)の音声復号装置
は、音源と全極型の調音系モデルに基づき入力音声のフ
レーム単位に生成された音声合成のための符号データを
入力して対応する合成音声信号を再生する音声復号化処
理部と、前記入力した符号データの内の1又は2以上の
パラメータ情報につき所定の内容を評価すると共に、該
評価結果が異常の場合は、前記合成音声信号の出力を抑
制する音声復号監視処理部とを備える。
により解決される。即ち、本発明(7)の音声復号装置
は、音源と全極型の調音系モデルに基づき入力音声のフ
レーム単位に生成された音声合成のための符号データを
入力して対応する合成音声信号を再生する音声復号化処
理部と、前記入力した符号データの内の1又は2以上の
パラメータ情報につき所定の内容を評価すると共に、該
評価結果が異常の場合は、前記合成音声信号の出力を抑
制する音声復号監視処理部とを備える。
【0024】本発明(7)によれば、音声復号監視処理
部は、入力(受信)した符号データの内の1又は2以上
のパラメータ情報につき所定の内容(合成系の安定条件
等)を評価すると共に、評価結果が異常の場合は、合成
音声信号の出力を抑制(例えば合成音声の振幅に係る符
号データg,b等を小さく制限し、又は合成音声の出力
の振幅を調整するので、異音の発生を迅速(未然)に阻
止でき、受話者に不快感を与えない。
部は、入力(受信)した符号データの内の1又は2以上
のパラメータ情報につき所定の内容(合成系の安定条件
等)を評価すると共に、評価結果が異常の場合は、合成
音声信号の出力を抑制(例えば合成音声の振幅に係る符
号データg,b等を小さく制限し、又は合成音声の出力
の振幅を調整するので、異音の発生を迅速(未然)に阻
止でき、受話者に不快感を与えない。
【0025】好ましくは、本発明(8)においては、上
記本発明(7)において、音声復号監視処理部は、パラ
メータ情報の評価結果が所定回数連続して異常の場合、
RAMを初期化して再度音声復号処理を行う。従って、
音声合成系(再生系)を早期に正常に戻せる。また好ま
しくは、本発明(9)においては、上記本発明(7)に
おいて、音声復号監視処理部は、入力した現時点及び又
は前時点の線形予測係数の内容が所定範囲内にあるか否
かを評価する。
記本発明(7)において、音声復号監視処理部は、パラ
メータ情報の評価結果が所定回数連続して異常の場合、
RAMを初期化して再度音声復号処理を行う。従って、
音声合成系(再生系)を早期に正常に戻せる。また好ま
しくは、本発明(9)においては、上記本発明(7)に
おいて、音声復号監視処理部は、入力した現時点及び又
は前時点の線形予測係数の内容が所定範囲内にあるか否
かを評価する。
【0026】所定の範囲を越える場合としては、例えば
1又は2以上の線形予測係数の値が予め規定した閾値を
越える場合、又はn個の線形予測係数lpc[0]〜l
pc[n−1]の全てがプロセッサが表現できる最大値
又は最小値になっている場合、等がある。また好ましく
は、本発明(10)においては、上記本発明(7)にお
いて、音声復号監視処理部は、入力した現時点及び又は
前時点の偏自己相関係数の内容が音声合成システムの安
定条件を満たしているか否かを評価する。
1又は2以上の線形予測係数の値が予め規定した閾値を
越える場合、又はn個の線形予測係数lpc[0]〜l
pc[n−1]の全てがプロセッサが表現できる最大値
又は最小値になっている場合、等がある。また好ましく
は、本発明(10)においては、上記本発明(7)にお
いて、音声復号監視処理部は、入力した現時点及び又は
前時点の偏自己相関係数の内容が音声合成システムの安
定条件を満たしているか否かを評価する。
【0027】例えば偏自己相関(反射)係数|ki |<
1(i=1〜n−1)の安定条件を評価する。また好ま
しくは、本発明(11)においては、上記本発明(7)
において、音声復号監視処理部は、入力した現時点及び
又は前時点の線スペクトル対係数が音声合成システムの
安定条件を満たしているか否かを評価する。
1(i=1〜n−1)の安定条件を評価する。また好ま
しくは、本発明(11)においては、上記本発明(7)
において、音声復号監視処理部は、入力した現時点及び
又は前時点の線スペクトル対係数が音声合成システムの
安定条件を満たしているか否かを評価する。
【0028】例えば、共振周波数ω[i]につき0<ω
0 <ω1 <…<ωn-1 <π、又は0<(ω0 /π)<
(ω1 /π)<…<(ωn-1 /π)<1、又は線スペク
トル対係数lsp[i]につき−1<lsp[0]<l
sp[1]<…<lsp[n−1]<1の安定条件を評
価する。また好ましくは、本発明(12)においては、
上記本発明(7)において、音声復号監視処理部は、入
力した入力音声についてのパワーコードの逆量子化値と
合成音声のパワーとの比が所定より大きいか否かを評価
する。
0 <ω1 <…<ωn-1 <π、又は0<(ω0 /π)<
(ω1 /π)<…<(ωn-1 /π)<1、又は線スペク
トル対係数lsp[i]につき−1<lsp[0]<l
sp[1]<…<lsp[n−1]<1の安定条件を評
価する。また好ましくは、本発明(12)においては、
上記本発明(7)において、音声復号監視処理部は、入
力した入力音声についてのパワーコードの逆量子化値と
合成音声のパワーとの比が所定より大きいか否かを評価
する。
【0029】例えば、両パワーのパワー比又は相違を評
価する。
価する。
【0030】
【発明の実施の形態】以下、添付図面に従って本発明に
好適なる実施の形態を詳細に説明する。なお、全図を通
して同一符号は同一又は相当部分を示すものとする。図
2は実施の形態によるCELP型音声符号装置の機能ブ
ロック図で、各機能ブロックは不図示のMPUやRA
M,ROM等を具備するDSP100のプログラム実行
により実現される。
好適なる実施の形態を詳細に説明する。なお、全図を通
して同一符号は同一又は相当部分を示すものとする。図
2は実施の形態によるCELP型音声符号装置の機能ブ
ロック図で、各機能ブロックは不図示のMPUやRA
M,ROM等を具備するDSP100のプログラム実行
により実現される。
【0031】図において、14は合成音声のローカルパ
ワ−lpowを求めるローカルパワー計算部、15は音
声符号化に係る各種パラメータデータの異常を監視する
と共に必要なら出力データの抑制及びRAMデータ等の
初期化を行う音声符号監視処理部であり、これらの処理
プログラムはDSP100内に組み込まれる。他の機能
ブロックについては図12と同様で良い。
ワ−lpowを求めるローカルパワー計算部、15は音
声符号化に係る各種パラメータデータの異常を監視する
と共に必要なら出力データの抑制及びRAMデータ等の
初期化を行う音声符号監視処理部であり、これらの処理
プログラムはDSP100内に組み込まれる。他の機能
ブロックについては図12と同様で良い。
【0032】図3〜図6は実施の形態による音声符号監
視処理のフローチャート(1)〜(4)である。図3は
音声符号監視処理のメイン処理を示しており、入力音声
の各1フレーム分の音声符号化処理を終えた時点でこの
処理に入力する。メイン処理は他にも様々に構成できる
がここに一例を示す。sw1〜sw5はプログラムスイ
ッチを示しており、監視対象のパラメータ情報を選択す
る目的で使用する。sw1〜sw5の内容は、例えば本
符号装置を搭載する携帯電話機等の主制御を行うCPU
(不図示)から制御インタフェースを介して任意に設定
可能であり、更には該携帯機のコンソールよりCPUを
介してマニュアル設定することも可能である。
視処理のフローチャート(1)〜(4)である。図3は
音声符号監視処理のメイン処理を示しており、入力音声
の各1フレーム分の音声符号化処理を終えた時点でこの
処理に入力する。メイン処理は他にも様々に構成できる
がここに一例を示す。sw1〜sw5はプログラムスイ
ッチを示しており、監視対象のパラメータ情報を選択す
る目的で使用する。sw1〜sw5の内容は、例えば本
符号装置を搭載する携帯電話機等の主制御を行うCPU
(不図示)から制御インタフェースを介して任意に設定
可能であり、更には該携帯機のコンソールよりCPUを
介してマニュアル設定することも可能である。
【0033】このメイン処理の構造は、基本的には、ス
イッチswの内容が「1」の場合は続く監視処理(サブ
ルーチン)を実行(CALL)し、スイッチswの内容
が「0」の場合は続く監視処理をスキップするようにな
っている。例えば、ステップS1ではsw1=1か否か
を判別し、sw1=1の場合は続くステップS2で後述
のLPC監視処理を実行し、またsw1=0の場合はス
テップS2の処理をスキップする。以下、ステップS3
〜ステップS10まで同じパターンである。従って、プ
ログラムスイッチの操作により任意の1又は2種以上の
所望のパラメータ情報につき異常の監視及び異常の際の
適正な制御処理を実行できる。以下、各監視処理を説明
する。
イッチswの内容が「1」の場合は続く監視処理(サブ
ルーチン)を実行(CALL)し、スイッチswの内容
が「0」の場合は続く監視処理をスキップするようにな
っている。例えば、ステップS1ではsw1=1か否か
を判別し、sw1=1の場合は続くステップS2で後述
のLPC監視処理を実行し、またsw1=0の場合はス
テップS2の処理をスキップする。以下、ステップS3
〜ステップS10まで同じパターンである。従って、プ
ログラムスイッチの操作により任意の1又は2種以上の
所望のパラメータ情報につき異常の監視及び異常の際の
適正な制御処理を実行できる。以下、各監視処理を説明
する。
【0034】図4(A)はLPC(線形予測係数)監視
処理を示している。ステップS21では現時点のLPC
の全ベクトル要素lpc[0]〜lpc[n−1]の各
内容が例えばDSP100で表現できる最小値MINか
否かを判別し、MINでない場合は、更にステップS2
2で現時点のLPCの全ベクトル要素lpc[0]〜l
pc[n−1]の各内容が例えばDSP100で表現で
きる最大値MAXか否かを判別する。続くステップS2
3,S24では前時点(1フレーム前)のLPCの全ベ
クトル要素plpc[0]〜plpc[n−1]の内容
につきステップS21,S22と同様の判別を行う。
処理を示している。ステップS21では現時点のLPC
の全ベクトル要素lpc[0]〜lpc[n−1]の各
内容が例えばDSP100で表現できる最小値MINか
否かを判別し、MINでない場合は、更にステップS2
2で現時点のLPCの全ベクトル要素lpc[0]〜l
pc[n−1]の各内容が例えばDSP100で表現で
きる最大値MAXか否かを判別する。続くステップS2
3,S24では前時点(1フレーム前)のLPCの全ベ
クトル要素plpc[0]〜plpc[n−1]の内容
につきステップS21,S22と同様の判別を行う。
【0035】上記いずれの判別もNOの場合は、ステッ
プS25でエラー数をカウントするカウンタClpcの
内容をクリアし、処理を抜ける。また上記何れか1つの
判別がYESの場合は、RAMやレジスタの内容が破壊
されたと考えられるので、ステップS26でエラーカウ
ンタClpcに+1する。ステップS27では出力デー
タ(例えば受信側合成音声の振幅を抑圧できるデータ
g,b,pow等)を抑圧(値を0又は小さく)する。
これにより、受信側で発生する異音を未然に抑制でき
る。ステップS28ではカウンタClpcの内容が所定
閾値LMT(例えば3〜4回)を越えたか否かを判別
し、越えた場合はステップS29でRAMを初期化す
る。これにより音声符号化をやり直すことになる。また
合成フィルタ10のタップ係数も初期化され、異音の発
生が速やかに修復される。また、上記カウンタClpc
の内容が所定閾値LMTを越えない場合はステップS2
9の処理をスキップする。
プS25でエラー数をカウントするカウンタClpcの
内容をクリアし、処理を抜ける。また上記何れか1つの
判別がYESの場合は、RAMやレジスタの内容が破壊
されたと考えられるので、ステップS26でエラーカウ
ンタClpcに+1する。ステップS27では出力デー
タ(例えば受信側合成音声の振幅を抑圧できるデータ
g,b,pow等)を抑圧(値を0又は小さく)する。
これにより、受信側で発生する異音を未然に抑制でき
る。ステップS28ではカウンタClpcの内容が所定
閾値LMT(例えば3〜4回)を越えたか否かを判別
し、越えた場合はステップS29でRAMを初期化す
る。これにより音声符号化をやり直すことになる。また
合成フィルタ10のタップ係数も初期化され、異音の発
生が速やかに修復される。また、上記カウンタClpc
の内容が所定閾値LMTを越えない場合はステップS2
9の処理をスキップする。
【0036】なお、線形予測係数の内容につき予め上限
値、下限値を設定し、線形予測係数(いずれかのベクト
ル要素)の内容がこの範囲を越えるか否かで異常を判別
するように構成しても良い。また、現時点の線形予測係
数lpcのみ、又は前時点の線形予測係数plcpのみ
を判別の対象としても良い。図4(B)はPOW(パワ
ー)監視処理を示している。ステップS51で入力音声
のパワ−pow(出力データpowの逆量子化値)と合
成音声のローカルパワーlpowとの比を求め、該比が
所定値MAXより大か否かを判別する。大でない場合は
ステップS52でエラーカウンタCpowの内容をクリ
アし、処理を抜ける。また大の場合は、出力データpo
w又はローカルパワーlpowに異常があると考えられ
るので、ステップS53でカウンタCpowに+1す
る。ステップS54では出力データ(例えば受信側合成
音声の振幅を抑圧できるデータg,b,pow等)を抑
圧する。ステップS55ではカウンタCpowの内容が
所定値LMTを越えたか否かを判別し、越えた場合はス
テップS56でRAMを初期化する。また、越えない場
合はステップS56の処理をスキップする。
値、下限値を設定し、線形予測係数(いずれかのベクト
ル要素)の内容がこの範囲を越えるか否かで異常を判別
するように構成しても良い。また、現時点の線形予測係
数lpcのみ、又は前時点の線形予測係数plcpのみ
を判別の対象としても良い。図4(B)はPOW(パワ
ー)監視処理を示している。ステップS51で入力音声
のパワ−pow(出力データpowの逆量子化値)と合
成音声のローカルパワーlpowとの比を求め、該比が
所定値MAXより大か否かを判別する。大でない場合は
ステップS52でエラーカウンタCpowの内容をクリ
アし、処理を抜ける。また大の場合は、出力データpo
w又はローカルパワーlpowに異常があると考えられ
るので、ステップS53でカウンタCpowに+1す
る。ステップS54では出力データ(例えば受信側合成
音声の振幅を抑圧できるデータg,b,pow等)を抑
圧する。ステップS55ではカウンタCpowの内容が
所定値LMTを越えたか否かを判別し、越えた場合はス
テップS56でRAMを初期化する。また、越えない場
合はステップS56の処理をスキップする。
【0037】なお、パワー比pow/lpowに代えて
パワー比lpow/powを評価しても良い。又はパワ
ー比につき予め上限値MAX、下限値MINを設定し、
MIN<pow/lpow<MAXでないか、又はMI
N<lpow/pow<MAXでないかを判別しても良
い。又は両パワーpow,lpowの大きさの相違を評
価しても良い。
パワー比lpow/powを評価しても良い。又はパワ
ー比につき予め上限値MAX、下限値MINを設定し、
MIN<pow/lpow<MAXでないか、又はMI
N<lpow/pow<MAXでないかを判別しても良
い。又は両パワーpow,lpowの大きさの相違を評
価しても良い。
【0038】図5(A)はk(反射係数)監視処理を示
している。ステップS31では現時点の反射係数(偏自
己相関係数に相当)kの全ベクトル要素が|k[i]|
<1(i=0〜n−1)の安定条件を満たしているか否
かを判別する。満たしている場合は、更にステップS3
2で前時点の反射係数kの全ベクトル要素が|pk
[i]|<1(i=0〜n−1)の安定条件を満たして
いるか否かを判別する。
している。ステップS31では現時点の反射係数(偏自
己相関係数に相当)kの全ベクトル要素が|k[i]|
<1(i=0〜n−1)の安定条件を満たしているか否
かを判別する。満たしている場合は、更にステップS3
2で前時点の反射係数kの全ベクトル要素が|pk
[i]|<1(i=0〜n−1)の安定条件を満たして
いるか否かを判別する。
【0039】上記いずれの判別もYESの場合は、合成
系の安定条件を満たしているので、ステップS33でエ
ラーカウンタCkの内容をクリアし、処理を抜ける。ま
た上記何れか1つの判別がNOの場合は、合成系の安定
条件を満たしていないので、ステップS34でエラーカ
ウンタCkに+1する。ステップS35では出力データ
(例えば受信側合成音声の振幅を抑圧できるデータg,
b,pow等)を抑圧(値を0又は小さく)する。ステ
ップS36ではカウンタCkの内容が所定閾値LMTを
越えたか否かを判別し、越えた場合はステップS37で
RAMを初期化する。また、上記カウンタCkの内容が
所定閾値LMTを越えない場合はステップS37の処理
をスキップする。なお、現時点の反射係数kのみ、又は
前時点の反射係数pkのみを判別の対象としても良い。
系の安定条件を満たしているので、ステップS33でエ
ラーカウンタCkの内容をクリアし、処理を抜ける。ま
た上記何れか1つの判別がNOの場合は、合成系の安定
条件を満たしていないので、ステップS34でエラーカ
ウンタCkに+1する。ステップS35では出力データ
(例えば受信側合成音声の振幅を抑圧できるデータg,
b,pow等)を抑圧(値を0又は小さく)する。ステ
ップS36ではカウンタCkの内容が所定閾値LMTを
越えたか否かを判別し、越えた場合はステップS37で
RAMを初期化する。また、上記カウンタCkの内容が
所定閾値LMTを越えない場合はステップS37の処理
をスキップする。なお、現時点の反射係数kのみ、又は
前時点の反射係数pkのみを判別の対象としても良い。
【0040】図5(B)はLSP(線スペクトル対)監
視処理を示している。ステップS41では現時点のLS
Pの全ベクトル要素が−1<lsp[0]<lsp
[1]<…<lsp[n−1]<1の安定条件を満たし
ているか否かを判別する。満たしている場合は、更にス
テップS42で前時点のLSPの全ベクトル要素が−1
<plsp[0]<plsp[1]<…<plsp[n
−1]<1の安定条件を満たしているか否かを判別す
る。
視処理を示している。ステップS41では現時点のLS
Pの全ベクトル要素が−1<lsp[0]<lsp
[1]<…<lsp[n−1]<1の安定条件を満たし
ているか否かを判別する。満たしている場合は、更にス
テップS42で前時点のLSPの全ベクトル要素が−1
<plsp[0]<plsp[1]<…<plsp[n
−1]<1の安定条件を満たしているか否かを判別す
る。
【0041】上記いずれの判別もYESの場合は、合成
系の安定条件を満たしているので、ステップS43でエ
ラーカウンタClspの内容をクリアし、処理を抜け
る。また上記何れか1つの判別がNOの場合は、合成系
の安定条件を満たしていないので、ステップS44でエ
ラーカウンタClspに+1する。ステップS45では
出力データ(例えば受信側合成音声の振幅を抑圧できる
データg,b,pow等)を抑圧(値を0又は小さく)
する。ステップS46ではカウンタClspの内容が所
定閾値LMTを越えたか否かを判別し、越えた場合はス
テップS47でRAMを初期化する。また、上記カウン
タClspの内容が所定閾値LMTを越えない場合はス
テップS47の処理をスキップする。
系の安定条件を満たしているので、ステップS43でエ
ラーカウンタClspの内容をクリアし、処理を抜け
る。また上記何れか1つの判別がNOの場合は、合成系
の安定条件を満たしていないので、ステップS44でエ
ラーカウンタClspに+1する。ステップS45では
出力データ(例えば受信側合成音声の振幅を抑圧できる
データg,b,pow等)を抑圧(値を0又は小さく)
する。ステップS46ではカウンタClspの内容が所
定閾値LMTを越えたか否かを判別し、越えた場合はス
テップS47でRAMを初期化する。また、上記カウン
タClspの内容が所定閾値LMTを越えない場合はス
テップS47の処理をスキップする。
【0042】なお、現時点のlspのみ、又は前時点の
plspのみを判別の対象としても良い。また、上記線
スペクトル対係数lsp[i]の安定条件評価に代え
て、各対応する共振周波数ω[i]につき0<ω[0]
<ω[1]<…<ω[n−1]<π、又はこれをπで正
規化した0<(ω[0]/π)<(ω[1]/π)<…
<(ω[n−1]/π)<1の安定条件を評価してもよ
い。
plspのみを判別の対象としても良い。また、上記線
スペクトル対係数lsp[i]の安定条件評価に代え
て、各対応する共振周波数ω[i]につき0<ω[0]
<ω[1]<…<ω[n−1]<π、又はこれをπで正
規化した0<(ω[0]/π)<(ω[1]/π)<…
<(ω[n−1]/π)<1の安定条件を評価してもよ
い。
【0043】図6は複合監視処理を示している。なお、
上記と同一の処理には同一ステップ番号を付して説明を
省略する。複合監視処理では、LPC,k及びLSPに
つき上記と同様の安定条件を判別すると共に、何れか1
つの判別で異常(不安定)と判定されると、ステップS
62でエラーカウンタCcpxに+1する。例えばある
フレームでlpc[0]〜lpc[n−1]=MAXを
満足し、かつ次のフレームで|k[2]|<1の安定条
件を満足しなかった場合は、Ccpx=2となる。従っ
て、各項目では単発的なエラーでも、予測システム全体
で見て連続となるようなエラーは有効に検出される。
上記と同一の処理には同一ステップ番号を付して説明を
省略する。複合監視処理では、LPC,k及びLSPに
つき上記と同様の安定条件を判別すると共に、何れか1
つの判別で異常(不安定)と判定されると、ステップS
62でエラーカウンタCcpxに+1する。例えばある
フレームでlpc[0]〜lpc[n−1]=MAXを
満足し、かつ次のフレームで|k[2]|<1の安定条
件を満足しなかった場合は、Ccpx=2となる。従っ
て、各項目では単発的なエラーでも、予測システム全体
で見て連続となるようなエラーは有効に検出される。
【0044】ステップS21〜S42のいずれの判別も
異常でない場合は、ステップS61でエラーカウンタC
cpxの内容をクリアし、処理を抜ける。また上記何れ
か1つの判別が異常の場合は、ステップS62でエラー
カウンタCcpxに+1する。ステップS63では出力
データ(例えば受信側合成音声の振幅を抑圧できるデー
タg,b,pow等)を抑圧(値を0又は小さく)す
る。ステップS64ではカウンタCcpxの内容が所定
閾値LMTを越えたか否かを判別し、越えた場合はステ
ップS65で例えばRAMを初期化する。また、上記カ
ウンタCcpxの内容が所定閾値LMTを越えない場合
はステップS65の処理をスキップする。
異常でない場合は、ステップS61でエラーカウンタC
cpxの内容をクリアし、処理を抜ける。また上記何れ
か1つの判別が異常の場合は、ステップS62でエラー
カウンタCcpxに+1する。ステップS63では出力
データ(例えば受信側合成音声の振幅を抑圧できるデー
タg,b,pow等)を抑圧(値を0又は小さく)す
る。ステップS64ではカウンタCcpxの内容が所定
閾値LMTを越えたか否かを判別し、越えた場合はステ
ップS65で例えばRAMを初期化する。また、上記カ
ウンタCcpxの内容が所定閾値LMTを越えない場合
はステップS65の処理をスキップする。
【0045】図7は実施の形態によるCELP型音声復
号装置の機能ブロック図で、各機能ブロックは不図示の
MPUやRAM,ROM等を具備する図2と同様のDS
P200のプログラム実行により実現される。図におい
て、23は音声復号化に係る各種パラメータデータの異
常を監視すると共に必要なら出力音声の抑圧及びRAM
データ等の初期化を行う音声復号監視処理部、24は再
生音声の出力パワ−opowを求める出力パワー計算部
であり、これらの処理プログラムはDSP200内に組
み込まれる。他の機能ブロックについては図13と同様
で良い。
号装置の機能ブロック図で、各機能ブロックは不図示の
MPUやRAM,ROM等を具備する図2と同様のDS
P200のプログラム実行により実現される。図におい
て、23は音声復号化に係る各種パラメータデータの異
常を監視すると共に必要なら出力音声の抑圧及びRAM
データ等の初期化を行う音声復号監視処理部、24は再
生音声の出力パワ−opowを求める出力パワー計算部
であり、これらの処理プログラムはDSP200内に組
み込まれる。他の機能ブロックについては図13と同様
で良い。
【0046】図8〜図11は実施の形態による音声復号
監視処理のフローチャート(1)〜(4)である。図8
は音声復号監視処理のメイン処理を示しており、各1フ
レーム分の音声符号データを受信復号(但し、伝送路信
号上の復号)した時点でこの処理に入力する。メイン処
理のスイッチ制御構造等は図3で述べたものと同様で良
い。以下、各監視処理を説明する。
監視処理のフローチャート(1)〜(4)である。図8
は音声復号監視処理のメイン処理を示しており、各1フ
レーム分の音声符号データを受信復号(但し、伝送路信
号上の復号)した時点でこの処理に入力する。メイン処
理のスイッチ制御構造等は図3で述べたものと同様で良
い。以下、各監視処理を説明する。
【0047】図9(A)はLPC(線形予測係数)監視
処理を示しており、この処理は基本的には図4(A)に
ついて述べた処理と同様で良い。但し、LPCの監視は
LPCの復号(逆算)データlpc及び又はplpcに
つき行い、また必要ならRAMを初期化し、またステッ
プS27では出力の再生音声を抑圧する。この抑圧の方
法には色々考えられるが、例えば再生音声の振幅に係る
復号データg,b等を小さい値に制限する。なお、再生
音声の出力が「0」となるように抑圧しても良いが、音
声が途切れると却って不快感となる場合もある。そこ
で、好ましくは、例えば異音が大きくならない程度、又
は半減する程度に抑圧する。
処理を示しており、この処理は基本的には図4(A)に
ついて述べた処理と同様で良い。但し、LPCの監視は
LPCの復号(逆算)データlpc及び又はplpcに
つき行い、また必要ならRAMを初期化し、またステッ
プS27では出力の再生音声を抑圧する。この抑圧の方
法には色々考えられるが、例えば再生音声の振幅に係る
復号データg,b等を小さい値に制限する。なお、再生
音声の出力が「0」となるように抑圧しても良いが、音
声が途切れると却って不快感となる場合もある。そこ
で、好ましくは、例えば異音が大きくならない程度、又
は半減する程度に抑圧する。
【0048】図9(B)はPOW(パワー)監視処理を
示しており、この処理は基本的には図4(B)について
述べた処理と同様で良い。但し、図4(B)のローカル
パワ−lpowはここでは再生音声のパワーopowと
なっている。また、パワ−の監視は復号データpowと
再生音声のパワーopowとにつき行い、また必要なら
RAMを初期化し、またステップS54では出力の再生
音声を抑圧する。
示しており、この処理は基本的には図4(B)について
述べた処理と同様で良い。但し、図4(B)のローカル
パワ−lpowはここでは再生音声のパワーopowと
なっている。また、パワ−の監視は復号データpowと
再生音声のパワーopowとにつき行い、また必要なら
RAMを初期化し、またステップS54では出力の再生
音声を抑圧する。
【0049】図10(A)はk(反射係数)監視処理を
示しており、この処理は基本的には図5(A)について
述べた処理と同様で良い。但し、kの監視はkの復号
(逆算)データk及び又はpkにつき行い、また必要な
らRAMを初期化し、またステップS35では出力の再
生音声を抑圧する。図10(B)はLSP(線スペクト
ル対)監視処理を示しており、この処理は基本的には図
5(B)について述べた処理と同様で良い。但し、LS
Pの監視はLSPの復号データlsp及び又はplsp
につき行い、またRAM等の初期化は全領域について行
い、またステップS45では出力の再生音声を抑圧す
る。
示しており、この処理は基本的には図5(A)について
述べた処理と同様で良い。但し、kの監視はkの復号
(逆算)データk及び又はpkにつき行い、また必要な
らRAMを初期化し、またステップS35では出力の再
生音声を抑圧する。図10(B)はLSP(線スペクト
ル対)監視処理を示しており、この処理は基本的には図
5(B)について述べた処理と同様で良い。但し、LS
Pの監視はLSPの復号データlsp及び又はplsp
につき行い、またRAM等の初期化は全領域について行
い、またステップS45では出力の再生音声を抑圧す
る。
【0050】図11は複合監視処理を示しており、この
処理は基本的には図6について述べた処理と同様で良
い。但し、上記図9,図10で述べた但し書きの条件が
付加されることは言うまでもない。また、ステップS6
3では出力の再生音声を抑圧する。なお、上記各実施の
形態では、各監視処理(サブルーチン)は内部で出力デ
ータや再生音声の抑圧処理及びRAM等の初期化処理を
行ったがこれに限らない。この部分はメイン処理で行
い、かつ各監視処理は監視判定のみを行って、監視結果
をフラグ情報の1/0でメイン処理に返すように構成し
ても良い。
処理は基本的には図6について述べた処理と同様で良
い。但し、上記図9,図10で述べた但し書きの条件が
付加されることは言うまでもない。また、ステップS6
3では出力の再生音声を抑圧する。なお、上記各実施の
形態では、各監視処理(サブルーチン)は内部で出力デ
ータや再生音声の抑圧処理及びRAM等の初期化処理を
行ったがこれに限らない。この部分はメイン処理で行
い、かつ各監視処理は監視判定のみを行って、監視結果
をフラグ情報の1/0でメイン処理に返すように構成し
ても良い。
【0051】また、本符号・復号装置を例えば携帯電話
機等に搭載したような場合には、DSPのメイン処理又
は各監視処理より携帯電話機の主CPUに対して監視結
果のフラグ情報を転送すると共に、主CPUよりDSP
の必要な初期化処理及び出力音声の抑制処理を行うよう
に構成しても良い。また、上記実施の形態ではCELP
型音声符号/復号装置の例を述べたが、本発明は音源と
全極型の調音系モデルに基づき入力音声をフレーム単位
に符号化/復号化する他の様々な音声符号/復号装置に
適用できる。
機等に搭載したような場合には、DSPのメイン処理又
は各監視処理より携帯電話機の主CPUに対して監視結
果のフラグ情報を転送すると共に、主CPUよりDSP
の必要な初期化処理及び出力音声の抑制処理を行うよう
に構成しても良い。また、上記実施の形態ではCELP
型音声符号/復号装置の例を述べたが、本発明は音源と
全極型の調音系モデルに基づき入力音声をフレーム単位
に符号化/復号化する他の様々な音声符号/復号装置に
適用できる。
【0052】また、上記本発明に好適なる実施の形態を
述べたが、本発明思想を逸脱しない範囲内で、各部の構
成、制御、及びこれらの組合せの様々な変更が行えるこ
とは言うまでも無い。
述べたが、本発明思想を逸脱しない範囲内で、各部の構
成、制御、及びこれらの組合せの様々な変更が行えるこ
とは言うまでも無い。
【0053】
【発明の効果】以上述べた如く本発明によれば、音声符
号/復号のフレームの区切りに、線形予測分析に係る各
種パラメータの安定条件等を評価すると共に、異常の場
合は符号(出力)データや再生音声を速やかに抑制し、
必要なら関連する記憶データ等を初期化するので、この
種の装置を電磁界や電源、温度等の過酷な状況下で使用
しても、異音の発生や継続が有効に抑制され、受話者に
不快感を与えない。
号/復号のフレームの区切りに、線形予測分析に係る各
種パラメータの安定条件等を評価すると共に、異常の場
合は符号(出力)データや再生音声を速やかに抑制し、
必要なら関連する記憶データ等を初期化するので、この
種の装置を電磁界や電源、温度等の過酷な状況下で使用
しても、異音の発生や継続が有効に抑制され、受話者に
不快感を与えない。
【図1】図1は本発明の原理を説明する図である。
【図2】図2は実施の形態による音声符号装置の機能ブ
ロック図である。
ロック図である。
【図3】図3は実施の形態による音声符号監視処理のフ
ローチャート(1)である。
ローチャート(1)である。
【図4】図4は実施の形態による音声符号監視処理のフ
ローチャート(2)である。
ローチャート(2)である。
【図5】図5は実施の形態による音声符号監視処理のフ
ローチャート(3)である。
ローチャート(3)である。
【図6】図6は実施の形態による音声符号監視処理のフ
ローチャート(4)である。
ローチャート(4)である。
【図7】図7は実施の形態によるCELP型音声復号装
置の機能ブロック図である。
置の機能ブロック図である。
【図8】図8は実施の形態による音声復号監視処理のフ
ローチャート(1)である。
ローチャート(1)である。
【図9】図9は実施の形態による音声復号監視処理のフ
ローチャート(2)である。
ローチャート(2)である。
【図10】図10は実施の形態による音声復号監視処理
のフローチャート(3)である。
のフローチャート(3)である。
【図11】図11は実施の形態による音声復号監視処理
のフローチャート(4)である。
のフローチャート(4)である。
【図12】図12は従来技術を説明する図(1)であ
る。
る。
【図13】図13は従来技術を説明する図(2)であ
る。
る。
1 入力パワ−計算部 2 聴覚重み付け処理部 3 線形予測分析部 4 適応符号帳 5 雑音符号帳 6,7 乗算器 8 加算器 9 フレーム遅延部 10 重み付け合成フィルタ 11 減算器 12 誤差電力評価部 13 符号化制御部 14 ローカルパワー計算部 15 音声符号監視処理部 21 復号化制御部 22 LPC・反射係数算出部 23 音声復号監視処理部 24 出力パワー計算部 26 スピーカ 100,200 ディジタルシグナルプロセッサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西池 理香 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 伊藤 正人 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 西田 文昭 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 宇都木 潔 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 栗原 秀明 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内
Claims (12)
- 【請求項1】 音源と全極型の調音系モデルに基づき音
声を合成するための各種パラメータ情報を演算して入力
音声をフレーム単位に符号化し、対応する符号データを
出力する音声符号化処理部と、 前記フレーム単位の符号化終了時に、前記音声符号化処
理部により得られたパラメータ情報の内の1又は2以上
のパラメータ情報につき所定の内容を評価すると共に、
該評価結果が異常の場合は、前記音声符号化処理部が生
成した符号データの内の少なくとも合成音声の振幅に係
る情報を抑制する音声符号監視処理部とを備えることを
特徴とする音声符号装置。 - 【請求項2】 音声符号監視処理部は、パラメータ情報
の評価結果が所定回数連続して異常の場合、RAMを初
期化して再度音声符号化処理を行うことを特徴とする請
求項1の音声符号装置。 - 【請求項3】 音声符号監視処理部は、入力音声につき
求められた現時点及び又は前時点の線形予測係数の内容
が所定の範囲内にあるか否かを評価することを特徴とす
る請求項1の音声符号装置。 - 【請求項4】 音声符号監視処理部は、入力音声につき
求められた現時点及び又は前時点の偏自己相関係数の内
容が音声合成システムの安定条件を満たしているか否か
を評価することを特徴とする請求項1の音声符号装置。 - 【請求項5】 音声符号監視処理部は、入力音声につき
求められた現時点及び又は前時点の線スペクトル対係数
が音声合成システムの安定条件を満たしているか否かを
評価することを特徴とする請求項1の音声符号装置。 - 【請求項6】 音声符号監視処理部は、入力音声のパワ
ーをコード化したパワーコードの逆量子化値と合成音声
のパワーとの比が所定より大きいか否かを評価すること
を特徴とする請求項1の音声符号装置。 - 【請求項7】 音源と全極型の調音系モデルに基づき入
力音声のフレーム単位に生成された音声合成のための符
号データを入力して対応する合成音声信号を再生する音
声復号化処理部と、 前記入力した符号データの内の1又は2以上のパラメー
タ情報につき所定の内容を評価すると共に、該評価結果
が異常の場合は、前記合成音声信号の出力を抑制する音
声復号監視処理部とを備えることを特徴とする音声復号
装置。 - 【請求項8】 音声復号監視処理部は、パラメータ情報
の評価結果が所定回数連続して異常の場合、RAMを初
期化して再度音声復号処理を行うことを特徴とする請求
項7の音声復号装置。 - 【請求項9】 音声復号監視処理部は、入力した現時点
及び又は前時点の線形予測係数の内容が所定範囲内にあ
るか否かを評価することを特徴とする請求項7の音声復
号装置。 - 【請求項10】 音声復号監視処理部は、入力した現時
点及び又は前時点の偏自己相関係数の内容が音声合成シ
ステムの安定条件を満たしているか否かを評価すること
を特徴とする請求項7の音声復号装置。 - 【請求項11】 音声復号監視処理部は、入力した現時
点及び又は前時点の線スペクトル対係数が音声合成シス
テムの安定条件を満たしているか否かを評価することを
特徴とする請求項7の音声復号装置。 - 【請求項12】 音声復号監視処理部は、入力した入力
音声についてのパワーコードの逆量子化値と合成音声の
パワーとの比が所定より大きいか否かを評価することを
特徴とする請求項7の音声復号装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8228337A JPH1069299A (ja) | 1996-08-29 | 1996-08-29 | 音声符号装置及び音声復号装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8228337A JPH1069299A (ja) | 1996-08-29 | 1996-08-29 | 音声符号装置及び音声復号装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1069299A true JPH1069299A (ja) | 1998-03-10 |
Family
ID=16874885
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8228337A Withdrawn JPH1069299A (ja) | 1996-08-29 | 1996-08-29 | 音声符号装置及び音声復号装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1069299A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009109120A1 (zh) * | 2008-02-29 | 2009-09-11 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
-
1996
- 1996-08-29 JP JP8228337A patent/JPH1069299A/ja not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009109120A1 (zh) * | 2008-02-29 | 2009-09-11 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4438127B2 (ja) | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 | |
| EP1096476B1 (en) | Speech signal decoding | |
| JPH1097296A (ja) | 音声符号化方法および装置、音声復号化方法および装置 | |
| EP0856185B1 (en) | Repetitive sound compression system | |
| JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
| JP2007279754A (ja) | 音声符号化装置 | |
| JP4786183B2 (ja) | 音声復号化装置、音声復号化方法、プログラム、記録媒体 | |
| JP3270922B2 (ja) | 符号化,復号化方法及び符号化,復号化装置 | |
| JPH04264597A (ja) | 音声符号化装置および音声復号装置 | |
| JPH1083199A (ja) | 量子化装置及び方法 | |
| KR20010090438A (ko) | 백그라운드 잡음 재생을 이용한 음성 코딩 | |
| US7486719B2 (en) | Transcoder and code conversion method | |
| JPH1069299A (ja) | 音声符号装置及び音声復号装置 | |
| JP3050978B2 (ja) | 音声符号化方法 | |
| JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
| JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
| JP4295372B2 (ja) | 音声符号化装置 | |
| EP1564723A1 (en) | Transcoder and coder conversion method | |
| JP2638522B2 (ja) | 音声符号化装置 | |
| JP3785363B2 (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
| JP3607774B2 (ja) | 音声符号化装置 | |
| JPH09244695A (ja) | 音声符号化装置及び復号化装置 | |
| JPH0786952A (ja) | 音声の予測符号化方法 | |
| JP4034929B2 (ja) | 音声符号化装置 | |
| JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20031104 |