JPH1069299A

JPH1069299A - 音声符号装置及び音声復号装置

Info

Publication number: JPH1069299A
Application number: JP8228337A
Authority: JP
Inventors: Yasuko Shirai; 靖子白井; Hiroshi Katayama; 浩片山; Rika Nishiike; 理香西池; Masato Ito; 正人伊藤; Fumiaki Nishida; 文昭西田; Kiyoshi Utsugi; 潔宇都木; Hideaki Kurihara; 秀明栗原
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1996-08-29
Filing date: 1996-08-29
Publication date: 1998-03-10

Abstract

(57)【要約】【課題】音声符号／復号装置に関し、音声の線形予測
分析に係る各種パラメータ情報が一時的に破壊されても
受話者に不快感を与えないことを課題とする。【解決手段】音源と全極型調音系モデルに基づき音声
合成の各種パラメータ情報を演算して入力音声をフレー
ム単位に符号化する音声符号化処理部と、各フレームの
符号化終了時に、得られたパラメータ情報中の１又は２
以上のパラメータ情報につき音声合成系の安定条件等を
評価し、異常の場合は、生成された音声符号データの内
の少なくとも振幅に係る情報を抑制する音声符号監視処
理部とを備える音声符号装置。上記生成された音声符号
データを入力して合成音声信号を再生する音声復号化処
理部と、前記入力した符号データ中の１又は２以上のパ
ラメータ情報につき音声再生系の安定条件等を評価し、
異常の場合は、再生音声信号の出力を抑制する音声復号
監視処理部とを備える音声復号装置。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声符号装置及び音
声復号装置に関し、更に詳しくは音源と全極型の調音系
モデルに基づき入力音声をフレーム単位に符号化する音
声符号装置及び前記符号化データを入力して対応する合
成音声信号を再生する音声復号装置に関する。

【０００２】この種の装置の代表的なものに、例えば音
声の高能率符号／復号が可能なＣＥＬＰ（Code Excited
Linear Predictive Coding ）型の音声符号装置及び音
声復号装置がある。ＣＥＬＰ型の音声符号装置及び音声
復号装置はコーデック（ＣＯＤＥＣ）として広くディジ
タル携帯電話器等に搭載され、その安定な動作が望まれ
る。

【０００３】

【従来の技術】図１２，図１３は従来技術を説明する図
（１），（２）である。図１２はＣＥＬＰ型音声符号装
置の機能ブロック図で、各機能ブロックは不図示のＭＰ
ＵやＲＡＭ，ＲＯＭ等を具備するディジタルシグナルプ
ロセッサ（ＤＳＰ）１００のプログラム実行により実現
される。

【０００４】図において、１は入力音声のパワーを算出
して量子化する入力パワ−計算部、２は聴覚のマスキン
グ（masking)効果に基づき入力音声に重み付けを行う聴
覚重み付け処理部、３は線形予測分析部、３１は窓かけ
処理部、３２は自己相関係数算出部、３３は線形予測係
数（ＬＰＣ）・反射係数（偏自己相関係数）算出部、３
４は線スペクトル対係数（ＬＳＰ係数）算出部、４は音
源の周期的成分（ピッチベクトルＰ）を記憶する適応符
号帳、５は音源の非周期的成分（コードベクトルＣ）を
記憶している雑音符号帳、６，７は乗算器、８は加算
器、９はフレーム遅延部、１０は重み付け合成フィル
タ、１１は減算器、１２は誤差電力評価部、１３は符号
化制御部である。

【０００５】外部より入力音声のフレーム（例えば３２
０サンプル／４０ｍｓ）が入力する。符号化制御部１３
はインデックス信号Ｉ_P，Ｉ_Cにより符号帳４，５から
ピッチベクトルＰ，コードベクトルＣを読み出すと共
に、これらにピッチゲインｂ，コードゲインｇを掛け合
わせて駆動音源信号（ｂＰ＋ｇＣ）を生成する。重み付
け合成フィルタ１０は駆動音源信号（ｂＰ＋ｇＣ）にＬ
ＰＣベクトル（ｌｐｃ［０］〜ｌｐｃ［ｎ−１］）によ
る重み付け合成を行って合成音声を再生する。減算器１
１は聴覚重み付けされた入力音声と合成音声との差を求
めて誤差信号ｅを形成する。誤差電力評価部１２は誤差
信号ｅの電力を求めて誤差電力を評価し、評価結果を符
号化制御部１３にフィードバックする。こうして符号化
制御部１３は、入力音声の１フレームにつき誤差電力を
最小とするようなピッチベクトルＰとコードベクトルＣ
とを探査し、得られたインデックス信号Ｉ_P，Ｉ_Cと、
ゲインｂ，ｇと、パワーｐｏｗと、線スペクトル対係数
ＬＳＰとをコード化して外部に出力する。

【０００６】この音声符号化動作を更に時系列に見る
と、例えば入力音声「ｓｈｉ」は無声部を成す非周期成
分「ｓｈ」とこれに続く有声部を成すピッチ周期成分
「ｉ」とから成る。無声部「ｓｈ」の区間における駆動
音源信号（ｂＰ＋ｇＣ）はｇＣ（雑音）成分が支配的で
あり、これをフレーム遅延させて適応符号帳４にフィー
ドバックする。入力音声が無声部「ｓｈ」から有声部
「ｉ」に移る区間では、ｇＣ成分が減少すると共に入力
音声のピッチ成分を反映（抽出）したｂＰ成分が支配的
となり、これをフレーム遅延させて適応符号帳４にフィ
ードバックする。こうして入力音声への滑らかな追従が
可能となる。

【０００７】線形予測分析部３において、窓かけ処理部
３１は入力音声に窓かけを行う。自己相関係数算出部３
２は窓かけした入力音声に基づき自己相関係数を求め
る。ＬＰＣ・反射係数算出部３３は自己相関係数に基づ
き線形予測係数ＬＰＣ（linearpredictor coefficients
）及び反射係数（偏自己相関係数に相当）ｋを求め
る。自己相関係数からＬＰＣを求める方法の一つにＤＬ
Ｉ（Durbin-Levinson-Itakura ）法がある。このアルゴ
リズムを用いてＬＰＣを求めると同時に反射係数ｋを求
める。

【０００８】線形予測係数ＬＰＣは全極型の重み付け合
成フィルタ１０に加えられる。但し、ＬＰＣは係数感度
が高く、これを低ビット量子化すると、音質劣化や合成
系不安定の要因となるため、符号化されない。一方、偏
自己相関（反射）係数ｋは予測不可能な部分（即ち、前
向き予測残差と後向き予測残差）間の相関として定義さ
れ、通常の相関より高密度の情報がパックされている。
但し、基本的には時間軸上のパラメータであるためフレ
ーム間隔の増大による歪み（音声劣化）が大きく、これ
も符号化されない。

【０００９】ＬＳＰ係数算出部３４は反射係数ｋから線
スペクトル対ＬＳＰ(Line spectrumpair)を求める。Ｌ
ＳＰは声道の共振周波数をパラメータとして音声情報を
表現するものであり、周波数軸上のパラメータであるか
らフレーム間隔の増大による歪みが少ない。また係数感
度が低いので低ビット符号化が可能であり、これを符号
化している。

【００１０】図１３は従来のＣＥＬＰ型音声復号装置の
機能ブロック図で、各機能ブロックは不図示のＭＰＵや
ＲＡＭ，ＲＯＭ等を具備する図１２と同様のディジタル
シグナルプロセッサ（ＤＳＰ）２００のプログラム実行
により実現される。図において、４は適応符号帳、５は
雑音符号帳、６，７は乗算器、８は加算器、９はフレー
ム遅延部、１０は重み付け合成フィルタ、２１は復号化
制御部、２２はＬＰＣ・反射係数算出部、２６はスピー
カ（ＳＰ）である。

【００１１】外部からの符号データ（Ｉ_P，Ｉ_C，ｂ，
ｇ，ＬＳＰ，ｐｏｗ）は復号化制御部２１に入力する。
復号化制御部２１は、入力のインデックス信号Ｉ_P，Ｉ
_Cにより符号帳４，５からピッチベクトルＰ，コードベ
クトルＣを読み出すと共に、これらに入力のピッチゲイ
ンｂ，コードゲインｇを掛け合わせて駆動音源信号（ｂ
Ｐ＋ｇＣ）を生成する。ＬＰＣ・反射係数算出部２２は
入力のＬＳＰから反射係数ｋ及びＬＰＣを逆算する。重
み付け合成フィルタ１０は駆動音源信号（ｂＰ＋ｇＣ）
にＬＰＣベクトル（ｌｐｃ［０］〜ｌｐｃ［ｎ−１］）
による合成を行って合成（出力）音声を再生する。

【００１２】

【発明が解決しようとする課題】上記の如く、一般にこ
の種の装置を構成する各機能ブロックはＤＳＰ１００，
２００のプログラム実行により実現され、自ら演算し又
は外部より入力した各種パラメータ（ＬＰＣ，ｋ，ＬＳ
Ｐ，ｐｏｗ等）はＤＳＰ内のＲＡＭやレジスタに一時的
に記憶される。プロセッサが正常な場合は、線形予測分
析に係る各種係数は、合成系の安定条件を満たすように
処理される。

【００１３】しかるに、この種の装置を具備する携帯電
話機等は電磁障害やバッテリー不足等の様々な悪条件下
で使用されるのが常であり、この為にプロセッサの誤演
算やＲＡＭデータ等の破壊が一時的に発生する場合も少
なくない。この場合に、全極型の合成フィルタは過去の
出力信号に重み付けをして入力に帰還するため、一旦合
成系のどこかでデータが破壊されると、該合成系は動作
不安定となり、その後は異音を発生し続け、受話者に不
快感を与える。

【００１４】本発明の目的は、音声の線形予測分析に係
る各種パラメータデータが一時的に破壊されても受話者
に不快感を与えない音声符号装置及び音声復号装置を提
供することにある。

【００１５】

【課題を解決するための手段】上記の課題は例えば図１
（Ａ）の構成により解決される。即ち、本発明（１）の
音声符号装置は、音源と全極型の調音系モデルに基づき
音声を合成するための各種パラメータ情報を演算して入
力音声をフレーム単位に符号化し、対応する符号データ
を出力する音声符号化処理部と、前記フレーム単位の符
号化終了時に、前記音声符号化処理部により得られたパ
ラメータ情報の内の１又は２以上のパラメータ情報につ
き所定の内容を評価すると共に、該評価結果が異常の場
合は、前記音声符号化処理部が生成した符号データの内
の少なくとも合成音声の振幅に係る情報を抑制する音声
符号監視処理部とを備える。

【００１６】本発明（１）によれば、音声符号監視処理
部は、符号化終了時（符号データ送出前）の１又は２以
上のパラメータ情報につき所定の内容（合成系の安定条
件等）を評価すると共に、評価結果が異常の場合は、符
号データの内の少なくとも合成音声の振幅に係る情報を
抑制（例えば値を小さく制限）するので、異音データの
送出を迅速（未然）に阻止でき、受話者に不快感を与え
ない。

【００１７】好ましくは、本発明（２）においては、上
記本発明（１）において、音声符号監視処理部は、パラ
メータ情報の評価結果が所定回数連続して異常の場合、
ＲＡＭを初期化して再度音声符号化処理を行う。従っ
て、合成系を早期に正常に戻せる。また好ましくは、本
発明（３）においては、上記本発明（１）において、音
声符号監視処理部は、入力音声につき求められた現時点
及び又は前時点の線形予測係数の内容が所定の範囲内に
あるか否かを評価する。

【００１８】所定の範囲を越える場合としては、例えば
１又は２以上の線形予測係数の値が予め規定した閾値を
越える場合、又はｎ個の線形予測係数ｌｐｃ［０］〜ｌ
ｐｃ［ｎ−１］の全てがプロセッサが表現できる最大値
又は最小値になっている場合、等がある。また、現時点
のパラメータ情報は元より、前時点のパラメータ情報で
も、現時点のパラメータ情報の演算に利用される場合が
あるので、これを評価する。

【００１９】また好ましくは、本発明（４）において
は、上記本発明（１）において、音声符号監視処理部
は、入力音声につき求められた現時点及び又は前時点の
偏自己相関係数の内容が音声合成システムの安定条件を
満たしているか否かを評価する。反射係数（偏自己相関
係数に相当）ｋは、声道内の音波の伝播過程を音波の透
過と反射の過程で記述したものであり、｜ｋ_i｜＜１
（ｉ＝１〜ｎ−１）であれば合成系は安定とされる。そ
こで、例えばこの安定条件を評価する。

【００２０】また好ましくは、本発明（５）において
は、上記本発明（１）において、音声符号監視処理部
は、入力音声につき求められた現時点及び又は前時点の
線スペクトル対係数が音声合成システムの安定条件を満
たしているか否かを評価する。線スペクトル対ＬＳＰ
は、声道の共振周波数ω［ｉ］（ｉ＝１〜ｎ−１）をパ
ラメータとして音声情報を表現するものであり、０＜ω
₀＜ω₁＜…＜ω_n-1＜πであれば合成系は安定とされ
る。そこで、例えばこの安定条件を評価する。

【００２１】なお、線スペクトル対係数ｌｓｐ［ｉ］と
共振周波数ω［ｉ］との間にはｌｓｐ［ｉ］＝−ｃｏｓ
ω［ｉ］（ｉ＝１〜ｎ−１）の関係がある。従って、−
１＜ｌｓｐ［０］＜ｌｓｐ［１］＜…＜ｌｓｐ［ｎ−
１］＜１の安定条件を評価しても良い。又は、上記の０
＜ω₀＜ω₁＜…＜ω_n-1＜πの関係をπで正規化し、
０＜（ω₀／π）＜（ω₁／π）＜…＜（ω_n-1／π）
＜１の安定条件を評価しても良い。

【００２２】また好ましくは、本発明（６）において
は、上記本発明（１）において、音声符号監視処理部
は、入力音声のパワーをコード化したパワーコードの逆
量子化値と合成音声のパワーとの比が所定より大きいか
否かを評価する。音声符号化プロセスが正常であればこ
れらのパワー比は略１程度になる。しかし、送出すべき
パワーコードの逆量子化値が破壊され、又は内部で再生
した合成音声そのものがが異常であると、前記パワー比
は所定から大きくずれてくる。そこで、このパワー比を
評価する。なお、パワー比に代えて、両パワーの相違を
評価しても良い。

【００２３】また上記の課題は例えば図１（Ｂ）の構成
により解決される。即ち、本発明（７）の音声復号装置
は、音源と全極型の調音系モデルに基づき入力音声のフ
レーム単位に生成された音声合成のための符号データを
入力して対応する合成音声信号を再生する音声復号化処
理部と、前記入力した符号データの内の１又は２以上の
パラメータ情報につき所定の内容を評価すると共に、該
評価結果が異常の場合は、前記合成音声信号の出力を抑
制する音声復号監視処理部とを備える。

【００２４】本発明（７）によれば、音声復号監視処理
部は、入力（受信）した符号データの内の１又は２以上
のパラメータ情報につき所定の内容（合成系の安定条件
等）を評価すると共に、評価結果が異常の場合は、合成
音声信号の出力を抑制（例えば合成音声の振幅に係る符
号データｇ，ｂ等を小さく制限し、又は合成音声の出力
の振幅を調整するので、異音の発生を迅速（未然）に阻
止でき、受話者に不快感を与えない。

【００２５】好ましくは、本発明（８）においては、上
記本発明（７）において、音声復号監視処理部は、パラ
メータ情報の評価結果が所定回数連続して異常の場合、
ＲＡＭを初期化して再度音声復号処理を行う。従って、
音声合成系（再生系）を早期に正常に戻せる。また好ま
しくは、本発明（９）においては、上記本発明（７）に
おいて、音声復号監視処理部は、入力した現時点及び又
は前時点の線形予測係数の内容が所定範囲内にあるか否
かを評価する。

【００２６】所定の範囲を越える場合としては、例えば
１又は２以上の線形予測係数の値が予め規定した閾値を
越える場合、又はｎ個の線形予測係数ｌｐｃ［０］〜ｌ
ｐｃ［ｎ−１］の全てがプロセッサが表現できる最大値
又は最小値になっている場合、等がある。また好ましく
は、本発明（１０）においては、上記本発明（７）にお
いて、音声復号監視処理部は、入力した現時点及び又は
前時点の偏自己相関係数の内容が音声合成システムの安
定条件を満たしているか否かを評価する。

【００２７】例えば偏自己相関（反射）係数｜ｋ_i｜＜
１（ｉ＝１〜ｎ−１）の安定条件を評価する。また好ま
しくは、本発明（１１）においては、上記本発明（７）
において、音声復号監視処理部は、入力した現時点及び
又は前時点の線スペクトル対係数が音声合成システムの
安定条件を満たしているか否かを評価する。

【００２８】例えば、共振周波数ω［ｉ］につき０＜ω
₀＜ω₁＜…＜ω_n-1＜π、又は０＜（ω₀／π）＜
（ω₁／π）＜…＜（ω_n-1／π）＜１、又は線スペク
トル対係数ｌｓｐ［ｉ］につき−１＜ｌｓｐ［０］＜ｌ
ｓｐ［１］＜…＜ｌｓｐ［ｎ−１］＜１の安定条件を評
価する。また好ましくは、本発明（１２）においては、
上記本発明（７）において、音声復号監視処理部は、入
力した入力音声についてのパワーコードの逆量子化値と
合成音声のパワーとの比が所定より大きいか否かを評価
する。

【００２９】例えば、両パワーのパワー比又は相違を評
価する。

【００３０】

【発明の実施の形態】以下、添付図面に従って本発明に
好適なる実施の形態を詳細に説明する。なお、全図を通
して同一符号は同一又は相当部分を示すものとする。図
２は実施の形態によるＣＥＬＰ型音声符号装置の機能ブ
ロック図で、各機能ブロックは不図示のＭＰＵやＲＡ
Ｍ，ＲＯＭ等を具備するＤＳＰ１００のプログラム実行
により実現される。

【００３１】図において、１４は合成音声のローカルパ
ワ−ｌｐｏｗを求めるローカルパワー計算部、１５は音
声符号化に係る各種パラメータデータの異常を監視する
と共に必要なら出力データの抑制及びＲＡＭデータ等の
初期化を行う音声符号監視処理部であり、これらの処理
プログラムはＤＳＰ１００内に組み込まれる。他の機能
ブロックについては図１２と同様で良い。

【００３２】図３〜図６は実施の形態による音声符号監
視処理のフローチャート（１）〜（４）である。図３は
音声符号監視処理のメイン処理を示しており、入力音声
の各１フレーム分の音声符号化処理を終えた時点でこの
処理に入力する。メイン処理は他にも様々に構成できる
がここに一例を示す。ｓｗ１〜ｓｗ５はプログラムスイ
ッチを示しており、監視対象のパラメータ情報を選択す
る目的で使用する。ｓｗ１〜ｓｗ５の内容は、例えば本
符号装置を搭載する携帯電話機等の主制御を行うＣＰＵ
（不図示）から制御インタフェースを介して任意に設定
可能であり、更には該携帯機のコンソールよりＣＰＵを
介してマニュアル設定することも可能である。

【００３３】このメイン処理の構造は、基本的には、ス
イッチｓｗの内容が「１」の場合は続く監視処理（サブ
ルーチン）を実行（ＣＡＬＬ）し、スイッチｓｗの内容
が「０」の場合は続く監視処理をスキップするようにな
っている。例えば、ステップＳ１ではｓｗ１＝１か否か
を判別し、ｓｗ１＝１の場合は続くステップＳ２で後述
のＬＰＣ監視処理を実行し、またｓｗ１＝０の場合はス
テップＳ２の処理をスキップする。以下、ステップＳ３
〜ステップＳ１０まで同じパターンである。従って、プ
ログラムスイッチの操作により任意の１又は２種以上の
所望のパラメータ情報につき異常の監視及び異常の際の
適正な制御処理を実行できる。以下、各監視処理を説明
する。

【００３４】図４（Ａ）はＬＰＣ（線形予測係数）監視
処理を示している。ステップＳ２１では現時点のＬＰＣ
の全ベクトル要素ｌｐｃ［０］〜ｌｐｃ［ｎ−１］の各
内容が例えばＤＳＰ１００で表現できる最小値ＭＩＮか
否かを判別し、ＭＩＮでない場合は、更にステップＳ２
２で現時点のＬＰＣの全ベクトル要素ｌｐｃ［０］〜ｌ
ｐｃ［ｎ−１］の各内容が例えばＤＳＰ１００で表現で
きる最大値ＭＡＸか否かを判別する。続くステップＳ２
３，Ｓ２４では前時点（１フレーム前）のＬＰＣの全ベ
クトル要素ｐｌｐｃ［０］〜ｐｌｐｃ［ｎ−１］の内容
につきステップＳ２１，Ｓ２２と同様の判別を行う。

【００３５】上記いずれの判別もＮＯの場合は、ステッ
プＳ２５でエラー数をカウントするカウンタＣｌｐｃの
内容をクリアし、処理を抜ける。また上記何れか１つの
判別がＹＥＳの場合は、ＲＡＭやレジスタの内容が破壊
されたと考えられるので、ステップＳ２６でエラーカウ
ンタＣｌｐｃに＋１する。ステップＳ２７では出力デー
タ（例えば受信側合成音声の振幅を抑圧できるデータ
ｇ，ｂ，ｐｏｗ等）を抑圧（値を０又は小さく）する。
これにより、受信側で発生する異音を未然に抑制でき
る。ステップＳ２８ではカウンタＣｌｐｃの内容が所定
閾値ＬＭＴ（例えば３〜４回）を越えたか否かを判別
し、越えた場合はステップＳ２９でＲＡＭを初期化す
る。これにより音声符号化をやり直すことになる。また
合成フィルタ１０のタップ係数も初期化され、異音の発
生が速やかに修復される。また、上記カウンタＣｌｐｃ
の内容が所定閾値ＬＭＴを越えない場合はステップＳ２
９の処理をスキップする。

【００３６】なお、線形予測係数の内容につき予め上限
値、下限値を設定し、線形予測係数（いずれかのベクト
ル要素）の内容がこの範囲を越えるか否かで異常を判別
するように構成しても良い。また、現時点の線形予測係
数ｌｐｃのみ、又は前時点の線形予測係数ｐｌｃｐのみ
を判別の対象としても良い。図４（Ｂ）はＰＯＷ（パワ
ー）監視処理を示している。ステップＳ５１で入力音声
のパワ−ｐｏｗ（出力データｐｏｗの逆量子化値）と合
成音声のローカルパワーｌｐｏｗとの比を求め、該比が
所定値ＭＡＸより大か否かを判別する。大でない場合は
ステップＳ５２でエラーカウンタＣｐｏｗの内容をクリ
アし、処理を抜ける。また大の場合は、出力データｐｏ
ｗ又はローカルパワーｌｐｏｗに異常があると考えられ
るので、ステップＳ５３でカウンタＣｐｏｗに＋１す
る。ステップＳ５４では出力データ（例えば受信側合成
音声の振幅を抑圧できるデータｇ，ｂ，ｐｏｗ等）を抑
圧する。ステップＳ５５ではカウンタＣｐｏｗの内容が
所定値ＬＭＴを越えたか否かを判別し、越えた場合はス
テップＳ５６でＲＡＭを初期化する。また、越えない場
合はステップＳ５６の処理をスキップする。

【００３７】なお、パワー比ｐｏｗ／ｌｐｏｗに代えて
パワー比ｌｐｏｗ／ｐｏｗを評価しても良い。又はパワ
ー比につき予め上限値ＭＡＸ、下限値ＭＩＮを設定し、
ＭＩＮ＜ｐｏｗ／ｌｐｏｗ＜ＭＡＸでないか、又はＭＩ
Ｎ＜ｌｐｏｗ／ｐｏｗ＜ＭＡＸでないかを判別しても良
い。又は両パワーｐｏｗ，ｌｐｏｗの大きさの相違を評
価しても良い。

【００３８】図５（Ａ）はｋ（反射係数）監視処理を示
している。ステップＳ３１では現時点の反射係数（偏自
己相関係数に相当）ｋの全ベクトル要素が｜ｋ［ｉ］｜
＜１（ｉ＝０〜ｎ−１）の安定条件を満たしているか否
かを判別する。満たしている場合は、更にステップＳ３
２で前時点の反射係数ｋの全ベクトル要素が｜ｐｋ
［ｉ］｜＜１（ｉ＝０〜ｎ−１）の安定条件を満たして
いるか否かを判別する。

【００３９】上記いずれの判別もＹＥＳの場合は、合成
系の安定条件を満たしているので、ステップＳ３３でエ
ラーカウンタＣｋの内容をクリアし、処理を抜ける。ま
た上記何れか１つの判別がＮＯの場合は、合成系の安定
条件を満たしていないので、ステップＳ３４でエラーカ
ウンタＣｋに＋１する。ステップＳ３５では出力データ
（例えば受信側合成音声の振幅を抑圧できるデータｇ，
ｂ，ｐｏｗ等）を抑圧（値を０又は小さく）する。ステ
ップＳ３６ではカウンタＣｋの内容が所定閾値ＬＭＴを
越えたか否かを判別し、越えた場合はステップＳ３７で
ＲＡＭを初期化する。また、上記カウンタＣｋの内容が
所定閾値ＬＭＴを越えない場合はステップＳ３７の処理
をスキップする。なお、現時点の反射係数ｋのみ、又は
前時点の反射係数ｐｋのみを判別の対象としても良い。

【００４０】図５（Ｂ）はＬＳＰ（線スペクトル対）監
視処理を示している。ステップＳ４１では現時点のＬＳ
Ｐの全ベクトル要素が−１＜ｌｓｐ［０］＜ｌｓｐ
［１］＜…＜ｌｓｐ［ｎ−１］＜１の安定条件を満たし
ているか否かを判別する。満たしている場合は、更にス
テップＳ４２で前時点のＬＳＰの全ベクトル要素が−１
＜ｐｌｓｐ［０］＜ｐｌｓｐ［１］＜…＜ｐｌｓｐ［ｎ
−１］＜１の安定条件を満たしているか否かを判別す
る。

【００４１】上記いずれの判別もＹＥＳの場合は、合成
系の安定条件を満たしているので、ステップＳ４３でエ
ラーカウンタＣｌｓｐの内容をクリアし、処理を抜け
る。また上記何れか１つの判別がＮＯの場合は、合成系
の安定条件を満たしていないので、ステップＳ４４でエ
ラーカウンタＣｌｓｐに＋１する。ステップＳ４５では
出力データ（例えば受信側合成音声の振幅を抑圧できる
データｇ，ｂ，ｐｏｗ等）を抑圧（値を０又は小さく）
する。ステップＳ４６ではカウンタＣｌｓｐの内容が所
定閾値ＬＭＴを越えたか否かを判別し、越えた場合はス
テップＳ４７でＲＡＭを初期化する。また、上記カウン
タＣｌｓｐの内容が所定閾値ＬＭＴを越えない場合はス
テップＳ４７の処理をスキップする。

【００４２】なお、現時点のｌｓｐのみ、又は前時点の
ｐｌｓｐのみを判別の対象としても良い。また、上記線
スペクトル対係数ｌｓｐ［ｉ］の安定条件評価に代え
て、各対応する共振周波数ω［ｉ］につき０＜ω［０］
＜ω［１］＜…＜ω［ｎ−１］＜π、又はこれをπで正
規化した０＜（ω［０］／π）＜（ω［１］／π）＜…
＜（ω［ｎ−１］／π）＜１の安定条件を評価してもよ
い。

【００４３】図６は複合監視処理を示している。なお、
上記と同一の処理には同一ステップ番号を付して説明を
省略する。複合監視処理では、ＬＰＣ，ｋ及びＬＳＰに
つき上記と同様の安定条件を判別すると共に、何れか１
つの判別で異常（不安定）と判定されると、ステップＳ
６２でエラーカウンタＣｃｐｘに＋１する。例えばある
フレームでｌｐｃ［０］〜ｌｐｃ［ｎ−１］＝ＭＡＸを
満足し、かつ次のフレームで｜ｋ［２］｜＜１の安定条
件を満足しなかった場合は、Ｃｃｐｘ＝２となる。従っ
て、各項目では単発的なエラーでも、予測システム全体
で見て連続となるようなエラーは有効に検出される。

【００４４】ステップＳ２１〜Ｓ４２のいずれの判別も
異常でない場合は、ステップＳ６１でエラーカウンタＣ
ｃｐｘの内容をクリアし、処理を抜ける。また上記何れ
か１つの判別が異常の場合は、ステップＳ６２でエラー
カウンタＣｃｐｘに＋１する。ステップＳ６３では出力
データ（例えば受信側合成音声の振幅を抑圧できるデー
タｇ，ｂ，ｐｏｗ等）を抑圧（値を０又は小さく）す
る。ステップＳ６４ではカウンタＣｃｐｘの内容が所定
閾値ＬＭＴを越えたか否かを判別し、越えた場合はステ
ップＳ６５で例えばＲＡＭを初期化する。また、上記カ
ウンタＣｃｐｘの内容が所定閾値ＬＭＴを越えない場合
はステップＳ６５の処理をスキップする。

【００４５】図７は実施の形態によるＣＥＬＰ型音声復
号装置の機能ブロック図で、各機能ブロックは不図示の
ＭＰＵやＲＡＭ，ＲＯＭ等を具備する図２と同様のＤＳ
Ｐ２００のプログラム実行により実現される。図におい
て、２３は音声復号化に係る各種パラメータデータの異
常を監視すると共に必要なら出力音声の抑圧及びＲＡＭ
データ等の初期化を行う音声復号監視処理部、２４は再
生音声の出力パワ−ｏｐｏｗを求める出力パワー計算部
であり、これらの処理プログラムはＤＳＰ２００内に組
み込まれる。他の機能ブロックについては図１３と同様
で良い。

【００４６】図８〜図１１は実施の形態による音声復号
監視処理のフローチャート（１）〜（４）である。図８
は音声復号監視処理のメイン処理を示しており、各１フ
レーム分の音声符号データを受信復号（但し、伝送路信
号上の復号）した時点でこの処理に入力する。メイン処
理のスイッチ制御構造等は図３で述べたものと同様で良
い。以下、各監視処理を説明する。

【００４７】図９（Ａ）はＬＰＣ（線形予測係数）監視
処理を示しており、この処理は基本的には図４（Ａ）に
ついて述べた処理と同様で良い。但し、ＬＰＣの監視は
ＬＰＣの復号（逆算）データｌｐｃ及び又はｐｌｐｃに
つき行い、また必要ならＲＡＭを初期化し、またステッ
プＳ２７では出力の再生音声を抑圧する。この抑圧の方
法には色々考えられるが、例えば再生音声の振幅に係る
復号データｇ，ｂ等を小さい値に制限する。なお、再生
音声の出力が「０」となるように抑圧しても良いが、音
声が途切れると却って不快感となる場合もある。そこ
で、好ましくは、例えば異音が大きくならない程度、又
は半減する程度に抑圧する。

【００４８】図９（Ｂ）はＰＯＷ（パワー）監視処理を
示しており、この処理は基本的には図４（Ｂ）について
述べた処理と同様で良い。但し、図４（Ｂ）のローカル
パワ−ｌｐｏｗはここでは再生音声のパワーｏｐｏｗと
なっている。また、パワ−の監視は復号データｐｏｗと
再生音声のパワーｏｐｏｗとにつき行い、また必要なら
ＲＡＭを初期化し、またステップＳ５４では出力の再生
音声を抑圧する。

【００４９】図１０（Ａ）はｋ（反射係数）監視処理を
示しており、この処理は基本的には図５（Ａ）について
述べた処理と同様で良い。但し、ｋの監視はｋの復号
（逆算）データｋ及び又はｐｋにつき行い、また必要な
らＲＡＭを初期化し、またステップＳ３５では出力の再
生音声を抑圧する。図１０（Ｂ）はＬＳＰ（線スペクト
ル対）監視処理を示しており、この処理は基本的には図
５（Ｂ）について述べた処理と同様で良い。但し、ＬＳ
Ｐの監視はＬＳＰの復号データｌｓｐ及び又はｐｌｓｐ
につき行い、またＲＡＭ等の初期化は全領域について行
い、またステップＳ４５では出力の再生音声を抑圧す
る。

【００５０】図１１は複合監視処理を示しており、この
処理は基本的には図６について述べた処理と同様で良
い。但し、上記図９，図１０で述べた但し書きの条件が
付加されることは言うまでもない。また、ステップＳ６
３では出力の再生音声を抑圧する。なお、上記各実施の
形態では、各監視処理（サブルーチン）は内部で出力デ
ータや再生音声の抑圧処理及びＲＡＭ等の初期化処理を
行ったがこれに限らない。この部分はメイン処理で行
い、かつ各監視処理は監視判定のみを行って、監視結果
をフラグ情報の１／０でメイン処理に返すように構成し
ても良い。

【００５１】また、本符号・復号装置を例えば携帯電話
機等に搭載したような場合には、ＤＳＰのメイン処理又
は各監視処理より携帯電話機の主ＣＰＵに対して監視結
果のフラグ情報を転送すると共に、主ＣＰＵよりＤＳＰ
の必要な初期化処理及び出力音声の抑制処理を行うよう
に構成しても良い。また、上記実施の形態ではＣＥＬＰ
型音声符号／復号装置の例を述べたが、本発明は音源と
全極型の調音系モデルに基づき入力音声をフレーム単位
に符号化／復号化する他の様々な音声符号／復号装置に
適用できる。

【００５２】また、上記本発明に好適なる実施の形態を
述べたが、本発明思想を逸脱しない範囲内で、各部の構
成、制御、及びこれらの組合せの様々な変更が行えるこ
とは言うまでも無い。

【００５３】

【発明の効果】以上述べた如く本発明によれば、音声符
号／復号のフレームの区切りに、線形予測分析に係る各
種パラメータの安定条件等を評価すると共に、異常の場
合は符号（出力）データや再生音声を速やかに抑制し、
必要なら関連する記憶データ等を初期化するので、この
種の装置を電磁界や電源、温度等の過酷な状況下で使用
しても、異音の発生や継続が有効に抑制され、受話者に
不快感を与えない。

【図面の簡単な説明】

【図１】図１は本発明の原理を説明する図である。

【図２】図２は実施の形態による音声符号装置の機能ブ
ロック図である。

【図３】図３は実施の形態による音声符号監視処理のフ
ローチャート（１）である。

【図４】図４は実施の形態による音声符号監視処理のフ
ローチャート（２）である。

【図５】図５は実施の形態による音声符号監視処理のフ
ローチャート（３）である。

【図６】図６は実施の形態による音声符号監視処理のフ
ローチャート（４）である。

【図７】図７は実施の形態によるＣＥＬＰ型音声復号装
置の機能ブロック図である。

【図８】図８は実施の形態による音声復号監視処理のフ
ローチャート（１）である。

【図９】図９は実施の形態による音声復号監視処理のフ
ローチャート（２）である。

【図１０】図１０は実施の形態による音声復号監視処理
のフローチャート（３）である。

【図１１】図１１は実施の形態による音声復号監視処理
のフローチャート（４）である。

【図１２】図１２は従来技術を説明する図（１）であ
る。

【図１３】図１３は従来技術を説明する図（２）であ
る。

【符号の説明】

１入力パワ−計算部２聴覚重み付け処理部３線形予測分析部４適応符号帳５雑音符号帳６，７乗算器８加算器９フレーム遅延部１０重み付け合成フィルタ１１減算器１２誤差電力評価部１３符号化制御部１４ローカルパワー計算部１５音声符号監視処理部２１復号化制御部２２ＬＰＣ・反射係数算出部２３音声復号監視処理部２４出力パワー計算部２６スピーカ１００，２００ディジタルシグナルプロセッサ

───────────────────────────────────────────────────── フロントページの続き (72)発明者西池理香神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内 (72)発明者伊藤正人神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内 (72)発明者西田文昭神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内 (72)発明者宇都木潔神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内 (72)発明者栗原秀明神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内

Claims

【特許請求の範囲】

【請求項１】音源と全極型の調音系モデルに基づき音
声を合成するための各種パラメータ情報を演算して入力
音声をフレーム単位に符号化し、対応する符号データを
出力する音声符号化処理部と、前記フレーム単位の符号化終了時に、前記音声符号化処
理部により得られたパラメータ情報の内の１又は２以上
のパラメータ情報につき所定の内容を評価すると共に、
該評価結果が異常の場合は、前記音声符号化処理部が生
成した符号データの内の少なくとも合成音声の振幅に係
る情報を抑制する音声符号監視処理部とを備えることを
特徴とする音声符号装置。
【請求項２】音声符号監視処理部は、パラメータ情報
の評価結果が所定回数連続して異常の場合、ＲＡＭを初
期化して再度音声符号化処理を行うことを特徴とする請
求項１の音声符号装置。
【請求項３】音声符号監視処理部は、入力音声につき
求められた現時点及び又は前時点の線形予測係数の内容
が所定の範囲内にあるか否かを評価することを特徴とす
る請求項１の音声符号装置。
【請求項４】音声符号監視処理部は、入力音声につき
求められた現時点及び又は前時点の偏自己相関係数の内
容が音声合成システムの安定条件を満たしているか否か
を評価することを特徴とする請求項１の音声符号装置。
【請求項５】音声符号監視処理部は、入力音声につき
求められた現時点及び又は前時点の線スペクトル対係数
が音声合成システムの安定条件を満たしているか否かを
評価することを特徴とする請求項１の音声符号装置。
【請求項６】音声符号監視処理部は、入力音声のパワ
ーをコード化したパワーコードの逆量子化値と合成音声
のパワーとの比が所定より大きいか否かを評価すること
を特徴とする請求項１の音声符号装置。
【請求項７】音源と全極型の調音系モデルに基づき入
力音声のフレーム単位に生成された音声合成のための符
号データを入力して対応する合成音声信号を再生する音
声復号化処理部と、前記入力した符号データの内の１又は２以上のパラメー
タ情報につき所定の内容を評価すると共に、該評価結果
が異常の場合は、前記合成音声信号の出力を抑制する音
声復号監視処理部とを備えることを特徴とする音声復号
装置。
【請求項８】音声復号監視処理部は、パラメータ情報
の評価結果が所定回数連続して異常の場合、ＲＡＭを初
期化して再度音声復号処理を行うことを特徴とする請求
項７の音声復号装置。
【請求項９】音声復号監視処理部は、入力した現時点
及び又は前時点の線形予測係数の内容が所定範囲内にあ
るか否かを評価することを特徴とする請求項７の音声復
号装置。
【請求項１０】音声復号監視処理部は、入力した現時
点及び又は前時点の偏自己相関係数の内容が音声合成シ
ステムの安定条件を満たしているか否かを評価すること
を特徴とする請求項７の音声復号装置。
【請求項１１】音声復号監視処理部は、入力した現時
点及び又は前時点の線スペクトル対係数が音声合成シス
テムの安定条件を満たしているか否かを評価することを
特徴とする請求項７の音声復号装置。
【請求項１２】音声復号監視処理部は、入力した入力
音声についてのパワーコードの逆量子化値と合成音声の
パワーとの比が所定より大きいか否かを評価することを
特徴とする請求項７の音声復号装置。