JP5964897B2

JP5964897B2 - 音符号化システム及び符号化装置、復号化装置

Info

Publication number: JP5964897B2
Application number: JP2014151276A
Authority: JP
Inventors: 蒔田　憲和; 憲和蒔田
Original assignee: Tamura Corp
Current assignee: Tamura Corp
Priority date: 2014-07-24
Filing date: 2014-07-24
Publication date: 2016-08-03
Anticipated expiration: 2034-07-24
Also published as: JP2016024450A

Description

本発明は、対数関数を含む関数を近似して演算する演算装置、及び当該演算装置を適用した適応差分パルス符号変調（ＡＤＰＣＭ：ＡｄｐａｔｉｖｅＤｉｆｆｅｒｎｔｉａｌＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ）を用いた音符号化システムに関する。

携帯電話やワイヤレスマイクなど、音声を伝送する際にはアナログである音をデジタル化し、デジタル音声信号に圧縮して伝送する方法が採られている。このデジタル音声信号の圧縮方式としては、デジタル音声が近接するサンプル間で高い相関を持つ性質を利用した方式が多く提案されており、ＤＰＣＭ（差分パルス符号変調：ＤｉｆｆｅｒｎｔｉａｌＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ）方式やＡＤＰＣＭ方式が知られている。

何れの方式を用いる音声符号化システムの場合も、入力された音声を符号化する音声符号化装置と、符号化された音声を復号する音声復号化装置とを備える。何れの方式も、音声符号化装置において、サンプリングされた実際のデジタル音声とその予測値との差分によって予測誤差を求め、この予測誤差を量子化及び符号化して伝送路を介して音声復号化装置に伝送する。音声復号化装置ではこの符号化されたものを復号した音声と、サンプリングされた実際のデジタル音声の予測値とを加算して入力された音声を再生する。このように、何れの方式も差分情報のみを伝送し、伝送先で入力音声を復元する構成となっているので、伝送する情報量を少なくすることができる利点がある。

一方、ＤＰＣＭ方式とＡＤＰＣＭ方式には次のような違いがある。すなわち、ＤＰＣＭ方式では、上記の予測誤差は、サンプリングされた現在時刻の標本値と、その一つ前の標本値との差分としている。この差分値を一定の量子化単位で量子化している。音声復号化装置では、伝送され復号した予測誤差に現在時刻から１標本時間だけ遅延させたデジタル音声を加算することで音声を再生する。

一方、ＡＤＰＣＭ方式では、ＩＴＵ−ＴＧ．７２６に代表されるように、音声信号のレベルが時間変動するため、量子化する際に一定の量子化単位で量子化するよりも、音声レベルの大小に応じてステップサイズを変えながら適応的に量子化する。すなわち、レベルの大きい音声信号は大きなステップサイズで大まかに量子化し、レベルの小さな音声信号は小さなステップサイズで細かく量子化する。このようにすることで、量子化する際に発生する量子化誤差を小さくすることができ、より正確な音声の再現が可能となる。

特開平１１−１５０４８０号公報国際公開第２００４／１１２２５６号

ところで、ＩＴＵ−ＴＧ．７２６に代表される従来のＡＤＰＣＭ方式を用いた音声符号化システムでは、予測誤差を符号化する際に、予測誤差の絶対値ｘを対数化している。その際、その対数を整数部ｘ_ｅと小数部ｘ_ｍとに分解する。すなわち、ｌｏｇ_２ｘ＝ｘ_ｅ＋ｘ_ｍとして、整数部ｘ_ｅと小数部ｘ_ｍとを求めている。ここで、整数部ｘ_ｅは、ｘと２^ｋの大小をｋ＝０から比較し、ｘを超えない最大の２^ｋによる指数ｋとして求めている。一方、小数部ｘ_ｍは、演算量を少なくする観点から、ｘ_ｍ＝ｌｏｇ_２（１＋ｘ_ｍ）と近似して求めている。

しかし、この近似は、演算量を少なくする観点からなされたものであるため、必ずしも精度の良いものではなかった。そのため、従来のＡＤＰＣＭ方式を用いた音声符号化システムでは、再現できる音声の音質が劣化してしまう虞があった。

さらに、このような精度の悪い近似は、上記の近似方法に限らず、演算過程で対数関数を近似する一般の演算装置に対しても、同様に行われうるものである。

本発明は、上記のような課題を解決するためになされたものであり、演算過程に対数関数を近似する演算を含む場合に、精度良く近似することのできる演算装置及びこの演算装置を用いた音符号化システムを提供することにある。

本発明の音符号化システムは、次の構成を備えることを特徴とする。
（１）入力された音を符号化する符号化装置。
（２）入力された音符号を復号化する復号化装置。
（３）前記符号化装置が出力した音符号を前記復号化装置に伝送する伝送媒体。
（４）前記符号化装置及び前記復号化装置のそれぞれに備えられ、対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置。
（５）前記符号化装置及び前記復号化装置は、前記演算装置として、音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有すること。
（６）前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を上回らない折れ線関数により近似すること。

また、次の構成を備えるようにしても良い。
（７）前記適応正規化部は、近似対象となる関数から、当該関数上の複数の点を線分で結んで得られる折れ線関数を引いたものの近似誤差が最小となる複数の点を求め、この複数の点を折れ線関数の各線分の端点として上回らない折れ線関数を求めること。

また、本発明の音符号化システムは、上記（１）〜（５）の構成と、次の構成を備えることを特徴とする。
（６’）前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を下回らない折れ線関数により近似すること。

また、次の構成を備えるようにしても良い。
（７’）前記下回らない折れ線関数は、各線分が、その定義域内で前記複数の点として前記近似対象となる関数との接点を有する接線であり、前記適応正規化部は、前記接点を、その接点が乗る線分とこれに隣接する両線分による前記近似対象となる関数との近似誤差が最小となるように求めること。

また、本発明の音符号化システムは、上記（１）〜（５）の構成と、次の構成を備えることを特徴とする。
（６’’）前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、折れ線関数は、端点（ｘ _ｎ，ｙ _ｎ）と（ｘ _ｎ＋１，ｙ _ｎ＋１）を持つ線分Ｓ _ｎを式（３１）で表し、この線分Ｓ _ｎによる区分誤差評価関数Ｅ _Ｓを式（３２）で表した場合に、式（３３）の誤差評価関数Ｅを最小化したときに得られるものであること。

本発明によれば、近似精度を向上させることのできる演算装置、及び当該演算装置を適用した音符号化システムを得ることができる。

第１の実施形態に係る音符号化システムの全体構成を示す図である。第１の実施形態に係るエンコーダ及びデコーダの概略構成を示す図である。第１の実施形態に係る適応正規化部を示す図である。上回らない折れ線近似を説明するためのグラフである。下回らない折れ線近似を説明するためのグラフである。線分数又は節点数に対する近似誤差の二乗平均値を両対数軸にプロットしたグラフである。符号化装置の動作フローチャートである。復号化装置の動作フローチャートである。

以下、図面を参照して、本発明の実施形態の音符号化システムについて説明する。

［１．第１の実施形態］
［１−１．概略構成］
図１は、本実施形態に係る音符号化システムの全体構成を示す図である。本音符号化システムは、符号化装置１０、復号化装置２０、及び符号された音情報を伝送する伝送媒体３０を備えている。

符号化装置１０は、システム外部から入力されたアナログ信号である音やデジタル信号を符号化し、音符号を含む情報として出力する。符号化装置１０と復号化装置２０は伝送媒体３０を介して接続されており、伝送媒体３０は、符号化装置１０から出力された音符号を含む情報を復号化装置２０へ伝送する。復号化装置２０は、符号化装置１０から伝送された音符号を含む情報をアナログ信号に復号し、本システム外部へ出力する。本音符号化システムは、例えば、ワイヤレスマイクシステムに用いることができる。

［１−２．各部構成］
（符号化装置）
符号化装置１０は、ユーザインターフェイスＵＩ１１、外部接続Ｉ／Ｆ１２、制御部１３、記憶部１４、音入力Ｉ／Ｆ１５、エンコーダ１６、及び符号出力Ｉ／Ｆ１７を備えている。

ユーザインターフェイスＵＩ１１は、図示しない操作入力部と状態出力部を有し、本システムとユーザとのインターフェイスを提供する。操作入力部は、スイッチやモーションセンサなどの検出器によりユーザが要求する操作を検出し、制御部１３へ伝達する。状態出力部は、ＬＥＤやＬＣＤなどの表示器や、バイブレータによる振動、スピーカによる音声出力などにより装置の内部状態を出力し、ユーザへのフィードバックを与える。

内部状態の出力としては、例えば、表示器に後述するエンコーダ１６の駆動に用いられているパラメータの表示を行うことができる。また、システムに入力される音源が変更される等の理由でユーザの要求により当該音源に適したパラメータに変更する場合は、操作入力部によりユーザ所望のパラメータを受け付けて制御信号として制御部１３へ出力し、制御部１３への当該信号の入力を契機として制御部１３によりシステム各部のパラメータを変更する。なお、ユーザインターフェイスＵＩ１１は、操作入力部か状態出力部のいずれか一方のみを実装するようにしても良い。また、操作入力部がタッチパネル及び表示器を備え、記憶部１４に記憶された複数のパラメータを表示し、ユーザによるパラメータの選択を受け付けるようにしても良いし、当該表示器にエンコーダ１６の駆動に用いられるパラメータも表示しても良い。パラメータの表示は、パラメータに一意に対応した識別子を表示しても良いし、エンコーダ１６内の各処理部に区分けして表示しても良い。

外部接続Ｉ／Ｆ１２は、外部接続装置とのインターフェイスを提供する。外部接続Ｉ／Ｆ１２と外部接続装置との接続媒体は有線又は無線である。外部接続装置は、外部接続Ｉ／Ｆ１２を介して本システムの内部状態を取得し、また動作制御を行うことができるものを用いる。外部接続装置としては、コンピュータやモバイル端末などが挙げられる。外部接続装置は、エンコーダ１６内部の処理部で用いられるパラメータを有し、当該パラメータを外部接続Ｉ／Ｆ１２を介して記憶部１３に入力し記憶させるようにしても良い。なお、外部接続装置はそのパラメータを予め保持していても良いし、取得した本システムの内部状態から別途生成するようにしても良い。また、外部接続装置は、エンコーダ１６内の処理部のパラメータを取得するようにしても良く、さらに当該パラメータを保持して記憶部１３への入力のために用いても良い。

制御部１３は、ユーザインターフェイスＵＩ１１、外部接続Ｉ／Ｆ１２、記憶部１４、音入力Ｉ／Ｆ１５、エンコーダ１６、及び符号出力Ｉ／Ｆ１７とそれぞれ接続されており、制御手段として機能する。すなわち、制御部１３は、本システムの内部状態の管理、各部動作制御、並びに、外部接続Ｉ／Ｆ１２、音入力Ｉ／Ｆ１５、及び符号出力Ｉ／Ｆ１７との通信を行う。

制御部１３は、起動時に本システム各部の内部状態をリセットする。また、各部からの要求若しくは特定の内部状態の検出により、予め指定された内部状態をリセットし、本システム全体若しくは所定の部位を再起動させても良い。また、各部からの要求若しくは特定の内部状態の検出により、所定のパラメータを記憶部１４から参照し、後述する所定の動作制御Ｉ／Ｆのパラメータを動的に更新しても良い。なお、各部からの要求には、ユーザインターフェイスＵＩ１１を介したユーザからの要求と、外部接続装置からの要求と、処理部からの要求との少なくともいずれかを含む。さらに、外部から動的に入力されたパラメータを含め、パラメータが正当であるか、後述のエンコーダ１６及びデコーダ２６とで共通のパラメータが整合しているかの確認をし、各部へ確認結果を通知しても良い。

制御部１３は、音や音情報、音符号を各部が入出力するための周期的なタイミングを生成し、各部にそのタイミングを与える。或いは、周期的なタイミング以外にも、各部の動作に必要となる所定のタイミングを生成しても良い。また、制御部１３は、音情報や音符号など情報全般の記憶部１４への蓄積、及び記憶部１４からその蓄積した情報の各部への転送を行う。

記憶部１４は、内部状態や各部の動作を決める複数種類のパラメータを記憶し、制御部１３を介して又は直接それらの情報の参照と更新を行う。この複数種類のパラメータは、複数の音源に対応したものであり、これらのパラメータの中から少なくとも何れかのパラメータが、後述のエンコーダ１６及びデコーダ２６の処理部において、音情報や音符号などの処理に用いられる。記憶部１４は、個別にパラメータを参照と更新を行えるようにしても良く、各パラメータを一意に識別する識別値を各パラメータに紐付けて記憶しても良い。また、状態変化の履歴や音情報、音符号を蓄積して記憶するようにしても良い。

音入力Ｉ／Ｆ１５は、本システム外部の音源の音を所定のタイミングで入力して時系列の音情報に変換し、出力する。音入力Ｉ／Ｆ１５は、例えばマイクなどの音響的トランスデューサーを有し、到来した音を所定のパラメータに応じて電気信号化し、音情報として出力する。この音情報は、エンコーダ１６及び／又は制御部１３へ出力される。なお、音入力Ｉ／Ｆ１５は、音情報をプリエンファシス処理などにより変換してもよいし、外部接続装置からの音情報を直接入出力するようにしても良い。

エンコーダ１６は、入力された音情報を変換して音符号として出力する。すなわち、音入力Ｉ／Ｆ１５から入力された音情報を量子化及び符号化し、音符号として符号出力Ｉ／Ｆ１７及び制御部１３に出力する。このエンコーダ１６の詳細な構成は後述する。

符号出力Ｉ／Ｆ１７は、エンコーダ１６から入力された音符号を所定のタイミングで伝送媒体３０へ出力する。なお、符号出力Ｉ／Ｆ１７は、音符号の出力タイミングと同期させるための情報、例えば音符号をフレーミングして出力する場合のフレーム同期信号等を併せて制御部１３に出力しても良い。また、符号出力Ｉ／Ｆ１７は、音符号に関連する又は独立した情報を併せて出力しても良いし、制御部１３経由で記憶部１４に蓄積された音符号を、制御部１３を介して所定のタイミングで出力するようにしても良い。

（伝送媒体）
伝送媒体３０は、符号化装置１０の符号出力Ｉ／Ｆ１７から出力される音符号を含む情報を、復号化装置２０の後述する符号入力Ｉ／Ｆ２５へ出力する。伝送媒体３０は、有線であっても無線であっても良い。また、伝送媒体３０の伝送は、逐次伝送する実時間伝送形式であっても、記憶装置などに蓄積し、蓄積したものを順次伝送する蓄積形式であっても良い。

（復号化装置）
復号化装置２０は、ユーザインターフェイスＵＩ２１、外部接続Ｉ／Ｆ２２、制御部２３、記憶部２４、符号入力Ｉ／Ｆ２５、デコーダ２６、及び音出力Ｉ／Ｆ２７を備えている。ユーザインターフェイスＵＩ２１、外部接続Ｉ／Ｆ２２、制御部２３、及び記憶部２４については、符号化装置１０のユーザインターフェイスＵＩ１１、外部接続Ｉ／Ｆ１２、制御部１３、及び記憶部１４とそれぞれ同様の構成であるため、その説明は省略する。

符号入力Ｉ／Ｆ２５は、伝送媒体３０から音符号を含む情報を所定のタイミングで入力し、デコーダ２６及び／又は制御部２３へ出力する。なお、符号入力Ｉ／Ｆ２５は、入力情報に含まれる音符号とのタイミング同期信号を制御部２３へ出力するようにしても良いし、入力情報に含まれる音符号に関連する又は独立した情報を制御部２３へ出力するようにしても良い。また、符号入力Ｉ／Ｆ２５は、伝送媒体３０が蓄積形式である場合、所定のタイミングで順次伝送媒体３０から音符号を含む情報を入力する。

デコーダ２６は、入力された音符号を変換して音情報として音出力Ｉ／Ｆ２７に出力する。デコーダ２６の詳細な構成は後述する。

音出力Ｉ／Ｆ２７は、デコーダ２６から入力された時系列的な音情報を所定のタイミングで本システム外部へ音に変換して出力する。音出力Ｉ／Ｆ２７は、例えば、スピーカなどの音響的トランスデューサーを有し、音情報を所定のパラメータに応じて音に変換して出力する。なお、音出力Ｉ／Ｆ２７は、音情報をデエンファシス処理などにより変換しても良いし、入力された音情報を外部接続装置へ直接出力するようにしても良い。

［１−３．エンコーダ及びデコーダの詳細構成］
（エンコーダ）
図２に示すように、エンコーダ１６は、前処理部４１、加算器４２、適応正規化部４３、最適量子化部４４、最適逆量子化部４５、適応予測部４６、加算器４７、及び後処理部４８を有している。

これらの各処理部は、動作制御Ｉ／Ｆ４１ｐ、４３ｐ〜４６ｐ、４８ｐを有し、これらには、各処理部の処理に必要なパラメータが一時的に記憶及び／又は予め格納されている。動作制御Ｉ／Ｆ４１ｐ、４３ｐ〜４６ｐ、４８ｐは、自身が設けられた処理部の処理に用いられるパラメータが一時的に記憶される。これらの各処理部は、制御部１３からの要求に応じて当該パラメータに基づいて、各種の処理を行う。なお、動作制御Ｉ／Ｆ４１ｐ、４３ｐ〜４６ｐ、４８ｐは、パラメータの記憶を行うので記憶手段と称することもできる。

パラメータは、各種の人の音声（老若男女に限らず特定の人物など）や楽器等の音などの複数種の音源に対して、それぞれ最適に設計されている。この各パラメータは、制御部１３からの要求に応じて記憶部１４に記憶されたパラメータを動的に参照したものを用いても良い。より詳細には、動作制御Ｉ／Ｆ４１ｐ、４３ｐ〜４６ｐ、４８ｐは、自身が設けられた処理部に入力された音情報又は音符号に応じて、当該処理部で用いるパラメータを更新するための制御信号を制御部１３に出力する。そして、制御部１３は、記憶部１４に記憶されたパラメータの中から当該制御信号に対応するパラメータを参照し、そのパラメータに処理部で用いるパラメータを更新できるようになっている。

更新後のパラメータとしては、動作制御Ｉ／Ｆ４１ｐ、４３ｐ〜４６ｐ、４８ｐに予め格納されたものを用いても良い。さらに、ユーザインターフェイスＵＩ１１、１２によりユーザからの入力を受け付けたものや、外部接続Ｉ／Ｆ１２、２２を介して外部接続装置から入力されたものを用いても良い。

このように、エンコーダ１６の各部は、パラメータが音源に応じて可変であり、音源に応じて動的にも静的にもできるので、量子化誤差を小さくすることができるとともに、音源に適したコーデックを構成して音質の良い音を得ることができるようになっている。

前処理部４１は、音入力Ｉ／Ｆ１７若しくは制御部１３から入力された音情報に対して所定の処理を行い、その処理された音情報を加算器４２に出力する。この所定の処理としては、例えば、所定のパラメータに応じて処理を行っても良いし、入力された音情報をそのまま出力しても良い。また、入力された音情報の振幅をスケーリングして出力しても良いし、その振幅が過大である場合、クリッピングして出力しても良い。

加算器４２は、前処理部４１、適応正規化部４３及び適応予測部４６と接続されている。前処理部４１から入力された音情報と、適応予測部４６から入力された音情報の予測値との差分を算出し、この差分を予測誤差として適応正規化部４３に出力する。

適応正規化部４３は、入力された予測誤差とその予測値とに基づいて正規化した正規化予測誤差を算出する。具体的には、適応正規化部４３は、最適量子化部４４と接続されており、加算器４２から入力された予測誤差を正規化関数により正規化予測誤差を求め、最適量子化部４４、適応予測部４６及び加算器４７に出力する。

正規化関数は、予測誤差とその予測値との関数である。正規化関数としては、詳しくは後述するが、例えば、後述の式（２）又は式（３）である。正規化関数は、動作制御Ｉ／Ｆ４３ｐに格納される。なお、動作制御Ｉ／Ｆ４３ｐに複数の正規化関数がパラメータとして格納されている場合には、制御部１３からのパラメータ制御により所望の関数を選択することができる。

適応正規化部４３は、予測誤差の予測値（以下、正規化係数ともいう。）を後述する式（１１）のように、過去を含めて入力された後述の量子正規化予測誤差に応じて予測誤差予測関数により更新する。正規化関数は、所定のパラメータ及び正規化係数に応じて予測誤差を正規化するものである。なお、前述の予測誤差予測関数を含め、本明細書において「過去を含め」とは、更新する次の時刻より前の時刻のことを指し、現在時刻及び現在より前の時刻を含むことをいう。

一方、適応正規化部４３は、最適逆量子化部４５とも接続されており、最適逆量子化部４５から入力される後述の量子正規化予測誤差と、その正規化に対応する逆正規化関数により正規化を解き、関数値を量子化予測誤差として適応予測部４６及び加算器４７に出力する。逆正規化関数は、正規化関数の逆関数であり、所定のパラメータ及び正規化係数に応じて入力値の正規化を解くものである。なお、正規化係数は正規化関数と逆正規化関数とで同一である。

正規化係数は、同期収束構造を有する。すなわち、初期値の異なる正規化係数同士は同条件で逐次更新を進めると同一の値に収束する。同期収束構造については詳しくは後述する。

適応正規化部４３は、異常制御機能を有している。例えば、動作制御Ｉ／Ｆ４３ｐに所定の閾値を予め格納しておき、正常時にはない予測誤差や量子正規化予測誤差の入力を検出した場合、異常値の伝播を速やかに解消させる機能であり、詳しくは後述する。

最適量子化部４４は、適応正規化部４３から入力された正規化予測誤差を量子化し、対応する音符号を求める。最適量子化部４４は、最適逆量子化部４５及び後処理部４８と接続されており、これらに求めた音符号を出力する。より詳細には、最適量子化部４４は、動作制御Ｉ／Ｆ４４ｐに格納され最適に設計されたパラメータにより量子化し、量子正規化予測誤差に対応する量子化レベルを音符号として出力する。この量子化範囲は、適応的に更新させず、コーデック駆動時で一定である。なお、音符号は、量子正規化予測誤差に対応する値以外に、異常を表すための値としても良い。

最適逆量子化部４５は、最適量子化部４４から入力された音符号に対応する量子化値、すなわち量子正規化予測誤差を出力する。より詳細には、最適逆量子化部４５は、動作制御Ｉ／Ｆ４５ｐに格納され最適に設計されたパラメータにより逆量子化し、量子正規化予測誤差を適応正規化部４３に出力する。

加算器４７は、適応正規化部４３、及び適応予測部４６と接続されている。加算器４７は、適応正規化部４３からの量子化予測誤差と、適応予測部４６からの予測値とを加算し、得られた音情報を適応予測部４６に出力する。なお、この加算して得た音情報は、最終的にデコーダ２６が出力する音情報と同じになる。

適応予測部４６は、過去を含めて入力された量子化予測誤差と過去の復号音情報から、所定のパラメータで規定される後述の適応予測モデルを駆動し、次に入力される音情報の予測値を求め、加算器４２、４７に出力する。出力した予測値と直前の量子化予測誤差の和が復号音情報となる。適応予測モデルは、予測係数を逐次更新することで入力される音情報系列に適応化していく。予測係数は同期収束構造を有する。すなわち、初期値の異なる予測係数同士は同条件で逐次更新を進めると同一の値に収束する。

適応予測部４６は、異常制御機能を有している。例えば、動作制御Ｉ／Ｆ４６ｐに所定の閾値を予め格納しておき、予測値が期待する音情報の振幅範囲を超えて求められた場合、同範囲にクリッピングする機能などであり、詳しくは後述する。

後処理部４８は、入力された音符号を、動作制御Ｉ／Ｆ４８ｐに予め格納された所定のパラメータに応じて処理し、その処理された音符号を符号出力Ｉ／Ｆ１７に出力する。当該処理としては、例えば、入力された音符号をそのまま出力する処理や、入力された音符号の正負を反転する処理などが挙げられる。

（デコーダ）
図２に示すように、デコーダ２６は、前処理部５１、最適逆量子化部５５、適応正規化部５３、適応予測部５６、加算器５７、及び後処理部５８を有している。なお、これらの各部は、動作制御Ｉ／Ｆ５１ｐ、５３ｐ、５５ｐ、５６ｐ、５８ｐを有し、各種の処理とそれぞれ対応したパラメータが格納されている。動作制御Ｉ／Ｆ５１ｐ、５３ｐ、５５ｐ、５６ｐ、５８ｐは、パラメータの記憶を行うので記憶手段と称することもできる。適応正規化部５３、最適逆量子化部５５及び適応予測部５６は、エンコーダ１６の適応正規化部４３、最適逆量子化部４５及び適応予測部４６と同様の構成であるので、その説明は省略する。

前処理部５１は、符号入力Ｉ／Ｆ２５若しくは制御部２３から入力された音符号を、動作制御Ｉ／Ｆ５１ｐに予め格納された所定のパラメータに応じて処理し、その処理された音符号を最適逆量子化部５５に出力する。当該処理としては、例えば、入力された音符号をそのまま出力することが挙げられる。また、前処理部５１は、例えば、入力された音符号が、動作制御Ｉ／Ｆ５１ｐに予め格納した異常を示す値であった場合、その旨を制御部２３へ通知し、動作制御Ｉ／Ｆ５１ｐに予め格納したパラメータにより指定された正常な音符号に替えて出力しても良い。

後処理部５８は、加算器５７から入力された復号音情報を、動作制御Ｉ／Ｆ５８ｐに予め格納された所定のパラメータに応じて処理し、その処理された復号音情報を音出力Ｉ／Ｆ２７に出力する。当該処理としては、例えば、入力された音符号をそのまま出力することが挙げられる。また、後処理部５８は、例えば、動作制御Ｉ／Ｆ５８ｐに所定の閾値を予め格納しておき、入力された復号音情報が期待する音情報の振幅範囲を超えて求められた場合、同範囲にクリッピングして出力するようにしても良い。

［１−３．作用］
次に、上記の構成を有する本システムの音符号化及び復号化の作用について説明する。本システムは、エンコーダ１６及びデコーダ２６の各動作制御Ｉ／Ｆに格納された多様なパラメータにより、その振る舞いや特性が制御される。ここでは、以下の点を前提する。
・所望のシステム性能を満足するように全てのパラメータが最適に設計されているものとする。
・エンコーダ１６及びデコーダ２６は、予め設計されたサンプリング周波数と音情報の情報量に従って音情報の入出力を行うものとする。
・音情報を時系列に取り扱うため、サンプル番号をｋで表し、ある瞬間ｋにサンプルされた時系列情報ｓの瞬時情報をｓ（ｋ）と表現するものとする。

［予測誤差］
エンコーダ１６の前処理部４１から出力された音情報ｓ_ｉ（ｋ）に対する適応予測部４６の予測値ｐ（ｋ）が与えられたとき、予測誤差ｄ（ｋ）は式（１）のように表せる。

適応予測部４６の適応予測モデルが理想的に駆動されているならば、予測誤差は白色化されてそれ以上予測の余地がない。そのためこの場合は直ちに量子化の手続きを踏めば良い。しかし、現実には入力される音情報は非定常であるため予測しきれず、有色性が残存する。また、音情報の時系列によっては準周期性をも呈してしまう。

［適応正規化］
そこで、本システムでは、予測誤差をも予測し、予測誤差の予測乖離度ｄ_ｄ（ｋ）を求めて、より白色化された時系列情報を量子化する。ここで、適応的に予測された予測誤差ｄ（ｋ）の予測値をｐ_ｄ（ｋ）とし、予測乖離度ｄ_ｄ（ｋ）を求める関数をｆ_ｄ（）で表すと、予測乖離度ｄ_ｄ（ｋ）は、例えば、式（２）のように、予測誤差をその予測値で除したものとする。ｐ_ｄ（ｋ）の予測方法は後述するが、理想的に予測誤差の変動を予測できたならば、予測乖離度の期待値Ｅ［ｆ_ｄ（ｄ（ｋ）、ｐ_ｄ（ｋ））］は１となる。

或いは、予測乖離度ｄ_ｄ（ｋ）は、対数ドメインでのｄ（ｋ）を予測して、ｆ_ｄ（）を比ｒと予測誤差の符号ｓを成分とするベクトルを出力する関数として式（３）の通り求めても良い。
ｓｇｎ（ｘ）は、ｘ≧０で１、ｘ＜０で−１を出力する符号関数である。なお、関数ｆ_ｄ（）の構造そのものは、予め動作制御Ｉ／Ｆ４３ｐに格納されたものを用いても良いし、関数ｆ_ｄ（）の構造そのものをパラメータとして制御部１３から適応正規化部４３に入力し、適応正規化部４３を動的に構築するようにしても良い。

適応正規化部４３は後段の最適量子化部４４に予測乖離度を出力するが、量子化構造は適応的に更新させず、コーデック駆動時は一定である。すなわち、最適量子化部４４における量子化閾値のリストは制御部１３からパラメータとして与えられ、本システムの駆動時では一定である。そのため、予測誤差を正規化により、変動する予測誤差の値を規定の範囲に収まるように変換するわけであるから、この予測乖離度を求めることによる白色化を正規化と称する。すなわち、この予測乖離度ｄ_ｄ（ｋ）が正規化予測誤差であり、予測値ｐ_ｄ（ｋ）が正規化係数である。

以上のように、適応正規化部４３が予測誤差を正規化することにより、予測誤差の分散を小さくすることができる。これにより、正規化した予測誤差（正規化予測誤差＝予測乖離度）を規定の範囲に収めることができるので、量子誤差を小さくすることができる。結果として音の質を向上させ、音の再現性を向上させることができる。

［最適量子化］
次に、正規化予測誤差を量子化し、対応する音符号を求める。この量子化において量子化レベルＬは予め設定されている。音符号は伝送媒体３０を介して最終的にデコーダ２６に入力されるため、情報量を最大化する目的からも量子化レベルＬ＝２^ｍ（ｍは自然数）と設計するのが望ましい。量子化閾値のリストはパラメータとして制御部１３から与えられる。量子化閾値は昇順に整列されており、ｉ番目の閾値をｑ_ｔｈ（ｉ）で表すものとする。

量子化区間が量子化範囲で連続であるとすれば、音符号ｃ（ｘ）は式（４）の通り求めることができる。

音符号ｃ（ｘ）への入力は正規化予測誤差であるため、量子化閾値のドメインも適応正規化部４３のドメインと整合をとって設計する。

適応正規化部４３が対数ドメインで駆動され式（３）が音符号ｃ（ｘ）のｘに入力される場合、音符号は式（５）の通り求めることができる。ここで、ｘ．ｍはベクトルｘのｍ成分を表す。

一方、量子化区間は不連続であっても良い。この場合、量子化閾値は対象区間の両端の値を指定する。なお、量子化区間の探索には二分探索を用いて探索時間を低減するようにしても良い。

また、符号化装置１０の各部や復号化装置２０でも異常検出が行えるように、量子化とは独立した異常レベルを式（６）のように定義しても良い。式（６）ではｃ（ｘ）＝０が異常レベルに該当する。

以上のように、最適量子化部４４で量子化及び符号化され生成された音符号は、最適逆量子化部４５と後処理部４８へ出力され、最終的にデコーダ２６へ入力される。

［最適逆量子化］
最適逆量子化部４５は、最適量子化部４４から入力された音符号に対応する量子化値、すなわち量子正規化予測誤差を求め、適応正規化部４３に出力する。ここで、量子化値のリストは、最適な設計によりパラメータとして制御部１３から与えられるが、量子化閾値と対応するものである。量子化値は昇順に整列されており、ｉ番目量子化値をｑ（ｉ）で表すものとする。

量子正規化予測誤差をＱ［ｄ_ｄ（ｋ）］、量子化誤差をｅ_ｑ（ｋ）とすれば、量子正規化予測誤差Ｑ［ｄ_ｄ（ｋ）］と正規化予測誤差ｄ_ｄ（ｋ）の関係は、式（７）となる。

量子化区間を最小化することで量子化誤差を最小化できることが分かる。量子化区間を小さくするには、量子化レベルを大きくするか、量子化範囲を小さくすれば良い。すなわち、最適量子化部４４へ入力される正規化予測誤差ｄ_ｄ（ｋ）の分散を小さくすれば良い。このため、量子正規化予測誤差Ｑ［ｄ_ｄ（ｋ）］は、適応正規化部４３へフィードバックされる。

［適応逆正規化］
適応正規化部４３は、最適逆量子化部４５から入力された量子正規化予測誤差Ｑ［ｄ_ｄ（ｋ）］と予測誤差ｄ（ｋ）の正規化に用いた正規化係数ｐ_ｄ（ｋ）との関数により正規化を解き、その関数値を量子化予測誤差として適応予測部４６に出力する。この関数は、正規化関数の正規化を解くものであるため、正規化関数ｆ_ｄ（）の逆関数ｆ_ｄ ^−１（）と考えることができる。

ここで、正規化予測誤差を式（２）とした場合、量子化予測誤差Ｑ［ｄ（ｋ）］は式（８）の通り表される。

一方、正規化予測誤差を式（３）の対数ドメインとした場合、量子化予測誤差Ｑ［ｄ（ｋ）］は、音符号も用いて式（９）の通り表される。

ここで、量子化予測誤差と予測誤差との誤差を検証する。そのために、式（８）を次の式（１０）の通り展開する。

この式（１０）から明らかなように、予測誤差に対し、正規化、量子化、逆量子化、及び逆正規化のプロセスを経たことにより、予測誤差にｅ_ｑ（ｋ）ｐ_ｄ（ｋ）だけノイズが付加されることが分かる。また、このノイズを最小化するためには量子化誤差ｅ_ｑ（ｋ）及び正規化係数ｐ_ｄ（ｋ）を最小化すれば良いことも分かる。

前述の通り、量子化誤差ｅ_ｑ（ｋ）を小さくするためには、量子化レベルが一定の条件下では正規化予測誤差ｄ_ｄ（ｋ）の分散が小さいほど良い。正規化係数ｐ_ｄ（ｋ）を最小化するためには、予測誤差を最小化することに加えて、理想的に予測誤差を予測できれば良い。

これらの最適化を実現するため、適応正規化部４３は入力される予測誤差ｄ（ｋ）を適応的に予測する必要がある。ここで、デコーダ２６へは音符号が入力されるため、予測誤差ｄ（ｋ）の予測構造が同期収束制御されなければエンコーダ１６とデコーダ２６の内部状態が不一致のまま進行し、期待したとおりの音は復元されなくなる。

そのため、予測誤差ｄ（ｋ）の予測構造としては、同期収束構造を備える必要がある。そこで、上記の通り、予測誤差ｄ（ｋ）の予測値は正規化係数ｐ_ｄ（ｋ）であるから、正規化係数ｐ_ｄ（ｋ）に同期収束構造を与える。

すなわち、正規化係数ｐ_ｄ（ｋ＋１）は過去を含めた量子正規化予測誤差Ｑ［ｄ_ｄ（ｋ）］及び正規化係数ｐ_ｄ（ｋ）から、式（１１）の形式の予測誤差予測関数Ｐ_ｄ（）で更新される。

予測誤差予測関数Ｐ_ｄ（）は同期収束構造を備え、例えば、量子正規化予測誤差Ｑ［ｄ_ｄ（ｋ）］及び正規化係数ｐ_ｄ（ｋ）の線形結合として表すことができる。この関数Ｐ_ｄ（）は、内部状態が異なる同構造の複数システムに同一の入力を時系列に与えていくと、システムの時定数に応じて全システムの内部状態が同期し、同一状態へ収束する制御構造を有する。なお、量子正規化予測誤差及び正規化係数の初期値は予め設定しておく。

より詳細には、予測誤差予測関数Ｐ_ｄ（）は、次の特徴を有する。
(i) 利得項と減衰項を含み構成される。
(ii) 量子正規化予測誤差の正負で利得項が異なる。
(iii) 過去を含む量子正規化予測誤差で利得項が異なる。
(iv) 過去を含む量子正規化予測誤差に比例した利得率
(v) 過去を含む量子正規化予測誤差の変化量で利得項が異なる。
(vi) 過去を含む量子正規化予測誤差の変化量に比例した利得率
(vii) 過去を含む正規化係数に比例した減衰率
(viii) 量子正規化予測誤差に下限閾値を設ける。
(ix) 比例係数や閾値をパラメータとする。

この関数Ｐ_ｄ（）をブロック図としたものを図３に示す。すなわち、適応正規化部４３は、上記の関数Ｐ_ｄ（）として機能する正規化係数更新部を備える。この正規化係数更新部は、複数の利得項算出部４３１、利得項選択条件部４３２、切替部４３３、及び減衰項算出部４３４を有する。

利得項選択条件部４３２は、直接又は遅延素子４３２ａを介して入力された過去を含む量子正規化予測誤差に応じて、複数の利得項算出部４３１のうち正規化係数更新の算出にどの利得項算出部４３１を用いるかを選択し、その切り替え信号を切替部４３３に出力する。切替部４３３は、利得項選択条件部４３２からの信号を受けて正規化係数更新の算出に用いる利得項算出部４３１に切り換える。

各利得項算出部４３１は、複数の係数制御条件部４３１０〜４３１ｎを有し、これらは直接又は遅延素子４３１ａを介して入力された量子正規化予測誤差に応じて利得率である係数ｋ_ｉ（ｉ＝１，２，…ｎ）を決定する。また、係数制御条件部４３１０〜４３１ｎは、直接又は遅延素子４３１ａを介して入力された量子正規化予測誤差の変化量に応じて利得率である係数ｋ_ｉ（ｉ＝１，２，…ｎ）を決定するようにしても良い。利得項算出部４３１は、加算器４３１ｂによってこの係数と量子正規化予測誤差とを線形結合し、利得項を算出する。減衰項算出部４３４は、遅延素子４３４ａ、減衰率である係数ａ_ｉ（ｉ＝１，２，…ｌ）及び加算器４３４ｂを複数含み構成され、過去分の正規化係数から、遅延素子４３４ａ及び係数ａ_ｉに基づいた線形結合により減衰項を算出する。このように、正規化係数更新部は、求めた利得項及び減衰項から次の正規化係数を求める。なお、利得項選択条件部４３２及び切替部４３３による利得項算出部４３１の切り替えは、利得項算出部４３１による利得項の算出と並行して行うようにしても良い。

なお、上記(ix)のように予測誤差予測関数Ｐ_ｄ（）が用いる係数等をパラメータとするが、この関数自体をパラメータとしてもよい。例えば、動作制御Ｉ／Ｆ４３ｐに予め格納しておいても良いし、記憶部１４に予め記憶させておき制御部１３経由で取得するようにしても良い。また、上記(viii)のように量子化正規化予測誤差に下限値を設けることにより、量子化誤差を小さくすることができる。

以上のように、適応正規化部４３は、過去を含めた量子正規化予測誤差Ｑ［ｄ_ｄ（ｋ）］及び正規化係数ｐ_ｄ（ｋ）を駆動源として、これらを予測誤差予測関数Ｐ_ｄ（）に代入していくことにより、正規化係数を更新していく。このように、適応正規化部４３は、予測誤差ｄ（ｋ）の予測値ｐ_ｄ（ｋ）を更新させ予測誤差ｄ（ｋ）を予測するため、予測誤差の予測部としての機能を有しているということができる。更新した正規化係数は、次の正規化、逆量子化、及び正規化係数の次の更新に用いられる。

［適応予測］
適応正規化部４３の量子化予測誤差Ｑ［ｄ（ｋ）］と適応予測部４６の予測値ｐ（ｋ）から、入力された音情報ｓ_ｉ（ｋ）は、式（１）を用いて式（１２）の通りｓ_ｏ（ｋ）として復元される。デコーダ２６は最終的にこの音情報ｓ_ｏ（ｋ）を出力する。なお、式（１２）を示すに当たり、式（８）、（１０）について、量子化予測誤差Ｑ［ｄ（ｋ）］と予測誤差ｄ（ｋ）との誤差をｅ（ｋ）とし両者の関係を式（１３）の通り一般化している。

式（１２）から正規化と量子化による誤差が出力音に含まれてしまうことが分かるが、この誤差の根源は予測誤差である。そのため、適応正規化部４３で理想的に予測誤差を予測できたとしても、予測誤差自体の分散が大きければ量子化誤差も大きいものとなってしまう。

そこで、適応予測部４６では、過去を含む復元した音情報と適応正規化部４３から入力された量子化予測誤差から、予測誤差の分散が最小となるように、次に入力される音情報を予測して出力する。この予測には、本システムに入力される時系列な音情報の空間を上手く記述できる予測モデルを用いる。

前述のように、予測モデルは、予測係数を適応的に更新させ、この予測係数によりその振る舞いを制御する。予測係数の適応的な更新方法として、予測誤差を最小化させるように予測誤差を調整する方法を用いることができる。例えば、最小二乗法や最急降下法を採用することができる。なお、予測モデル自体をパラメータとしても良い。

入力空間が音声である場合、予測モデルとして複数極モデルが適している。本システムでは、安定条件の問題から式（１４）の通り３次以上の極を多数の零モデルで近似している点で実用的である。この場合、量子正規化予測誤差を駆動源とする。ａ_ｉ、ｂ_ｉは予測係数である。Ｍは２以上の整数である。

零モデルの次数は入力空間のスペクトル分布との関連があり、予測誤差に影響するため、予め入力空間に最適な次数の設計をしておく必要がある。なお、この次数をパラメータとして与えるようにしても良い。

零モデル近似は多くの次数を必要としそれと同数の乗算を行うため計算規模が大きくなる。これを回避するために式（１５）のように近似を行っても良い。これによれば、式（１４）よりも精度良く予測が可能になる。

以上のように、適応予測部４６において、予測誤差の分散が最小となるように音情報の予測値を求める。但し、適応予測部４６、５６は、適応正規化部４３、５３と同様にエンコーダ１６とデコーダ２６とで内部状態が非同期に駆動される可能性がある。このため、予測係数の更新式は同時に同期収束制御の構造を有していなければならない。

［同期収束制御］
次に、同期収束制御について説明する。本システムでは、適応正規化部４３、５３や適応予測部４６、５６がそれぞれ過去の出力値を入力とするフィードバック適応形式である。この場合、エンコーダ１６とデコーダ２６との間で、適応パラメータ等の同一適応器（適応システム）の内部状態が同期しなければならない。非同期状態のままでは意図しない音情報がデコーダ２６から出力されてしまうからである。

しかし、エンコーダ１６とデコーダ２６は一般的に非同期に駆動を開始する。このため、速やかにこの非同期状態を解消し、同期のとれた状態へ収束させることが望ましい。そこで、本システムでは、適応正規化部４３、５３及び適応予測部４６、５６が、同期収束制御の構造を有する。

非同期状態から同期状態へ収束させるためには、適応システム、すなわち適応正規化部４３、５３、適応予測部４６、５６が次の条件(1)〜(5)を満足する必要があり、条件(6)、(7)を満足するようにしても良い。換言すると、次の条件(1)〜(5)を満足することが同期収束構造を有するということであり、条件(1)〜(5)を満たすことを前提として、さらに条件(6)、(7）を満たすようにしても良い。なお、条件(1)〜(4)及び(6)において、システムとは、同期収束させる対象をいい、例えば、一対の適応正規化部４３、５３や、一対の適応予測部４６、５６である。また、制御式は、例えば、上記の式（１１）、（１４）、（１５）である。
(1) システムの入力と出力に対する関係は制御式により表される。
(2) システムの入力は内部状態を有しない単純入力とシステム出力とからなる。
(3) 同期対象システム間（例えば、適応正規化部４３と適応正規化部５３）の単純入力及び制御式は同一とする。
(4) 制御式は入力と内部状態を含み、入力されたシステム出力は内部状態に含まれる。
(5) 制御式の内部状態を含む項は任意速度（時定数）でその絶対値が逓減するように更新するが、この速度は収束時定数で決まるものとする。
(6) 過去の自システム出力を入力しても良い。
(7) 制御式の内部状態を含む項は逓減率を十分下回る程度に量子化できる。

なお、収束時定数をパラメータとしても良い。これにより収束速度制御が可能となる。また、同期収束速度は、入力空間のスペクトル分布との関連があり、予測誤差に影響するため、予め入力空間に最適な収束時定数の設計をしておく必要がある。

以上のように、適応システムが同期収束構造を有することにより、エンコーダ１６とデコーダ２６の始動タイミングによらずに同期収束させ、音の再現性を向上させることができる。特に、適応正規化部４３、５３が同期収束構造を有することにより、予測誤差の予測がより正確にできるようになる。適応予測部４６、５６が同期収束構造を有することにより、音情報の予測がより正確にできるようになる。

［異常制御］
本システムでは、外部からの入力や予測における内部状態のフィードバックによる閉ループ構造を有するため、異常発生によって復帰不可能な状態に陥る可能性がある。異常状態としては、例えば、システムの各部が非同期状態であること、システムの各部への入力が期待する範囲を超えていること等が挙げられる。この異常状態の要因としては、通信路としての伝送媒体３０の故障等が挙げられる。本システムでは、このような異常発生によって復帰不可能な状態に陥ることを回避するため、以下の方法を採ることができる。なお、以下の方法は、何れか一つだけ行っても良いし、二以上を組み合わせて行っても良い。

(1) エンコーダ１６及び／又はデコーダ２６の各処理部に期待する範囲外の値が入力された場合は、その範囲の境界値へクリッピングする。例えば、前処理部４１の動作制御Ｉ／Ｆ４１ｐに所定の閾値又は範囲を格納しておき、当該閾値又は範囲を基準に前処理部４１に入力された音情報と比較し、異常かどうかを判定する。異常である場合は、クリッピングを行う。

(2) デコーダ２６の前処理部５１が、入力された音符号と動作制御Ｉ／Ｆ５１ｐに予め格納された所定の閾値とを比較し、入力音符号が当該閾値を超えて異常であると判定した場合、その旨を制御部５３に通知する。この場合、例えば、制御部５３の制御により、ユーザインターフェイスＵＩ２１を介して異常をユーザに通知したり、音出力Ｉ／Ｆ２７からパラメータにより指定された音情報を出力させたりする。

上記の方法によれば、異常な音情報若しくは音符号を正常な音情報若しくは音符号へ変換することができる。但し、同期収束するまでの期間、適応正規化部４３、５３への入力系列とその内部状態がエンコーダ１６とデコーダ２６との間で相違してしまう。さらに、エンコーダ１６の適応正規化部４３の出力をデコーダ２６の入力とするため、同期収束するまではデコーダ２６から過大なレベルで出力が発散するなど意図せぬ音情報が出力されてしまう可能性がある。そこで、本システムでは、同期の早期回復処置として以下の処置を行う。

（同期の早期回復）
(a) 異常音符号入力期間にデコーダ２６を停止させる。例えば、デコーダ２６の前処理部５１に入力された音符号の異常を検出する検出部を設ける。検出部には、入力された音符号が異常であるかを判定するための所定の閾値又は範囲が予め設定されており、入力された音符号と当該所定の閾値又は範囲とを比較することにより異常か否かを判定する。動作制御Ｉ／Ｆ５１ｐにこの所定の閾値又は範囲を予め格納しておき、動作制御Ｉ／Ｆ５１ｐを検出部として機能させるようにしても良い。このように、デコーダ２６を停止させることで、異常入力検出時点の内部状態を保持できるので、非同期化の進行を最小限に抑制することができる。従って、エンコーダ１６とデコーダ２６の非同期問題を早期に解消することができる。

(b) デコーダ２６の内部状態を、異常と判定した時の内部状態よりも初期状態の方向へ遷移させる。すなわち、同期収束するまでの意図せぬ音情報の生成は、異常入力解消時点でデコーダ２６に残留している異常な音符号の影響を要因とするものであることが分かった。つまり、異常検出時点から異常解消時点までに入力された異常な音符号によって、デコーダ２６の内部状態を示す状態変数が変わっていくため、デコーダ２６の内部状態が遷移していき、初期状態からの遷移度合いが大きくなる。このように異常入力解消時点のデコーダ２６の内部状態には異常な音符号による影響が過去の積算情報として残存するため、予期せぬ作用を生じさせる可能性がある。よって、異常入力解消時にデコーダ２６の内部状態を初期状態の方向へ遷移させることにより、異音生成を抑制でき、同期収束の高速化を図ることができる。内部状態の初期状態の方向への遷移は、異常入力解消時点の内部状態より遷移させれば良い。より好ましくは、異常入力検出の開始時点の内部状態より初期状態の方向へ遷移させる。デコーダ２６の内部状態の遷移には、正規化係数を現在値に応じて調整すること、及び内部状態のリセットが含まれる。正規化係数の調整と内部状態のリセットの両方を行っても良い。

(c) 上記(a)及び(b)の処理を組み合わせて行っても良い。例えば、異常入力期間にデコーダ２６を停止させ、伝送媒体３０等の異常が解消され、再びデコーダ２６を起動する際に正規化係数の調整及び／又は内部状態のリセットを実行しても良い。

(d) 同期収束に関連するパラメータのうち、時定数に関するパラメータの利得を、同期収束するまでの間一時的に引き上げる。これにより、例えば、異常入力が解消しデコーダ２６の再起動の際に、同期収束を高速化させることができる。また、同期収束するまでの短期間に留め、その期間経過後に復元させることで、音質劣化を抑制することができる。

一方、異常の発生により上記のような処置を施したとしても、異常が解消されない間は情報が欠落しているため、エンコーダ１６が符号化した音情報を期待通りに復元できない場合が多い。この点、音情報の流れは非定常であるが、音情報は雑音でなければ短期定常な音情報セグメントが遷移するシーケンスとみなすことができる。このセグメントでは一定のピッチで音の振幅波形が繰り返すものと解釈できる。従って、情報欠落による音情報の正常な復元ができない場合は、以下の補間処理を行うことができる。

すなわち、異常入力期間が音情報セグメントよりも短い期間という条件においては、欠落した音情報を直近に出力した音情報セグメントから抽出し、欠落部分を補間し再生させることでより確からしい音情報を出力することができる。この補間する音情報の抽出には、欠落部分と関連する音情報セグメントのピッチ推定が必要となる。

ピッチ推定には、音情報の流れの短期間の自己相関関数を用いることができる。時刻ｎでサンプリングされた音情報の瞬時値をｓ［ｎ］とすれば、ラグｍにおける短期自己相関関数Ｒ_ｓ（ｎ，ｍ）を式（１６）の通りとすることができる。但し、ｋ_ｌとｋ_ｇは音情報セグメントの定常期間に関連するパラメータとし、対象セグメント以前の影響の度合いを制御させても良い。

時系列音情報ｓ［ｎ］における任意の短期自己相関関数Ｒ_ｓ（ｎ，ｍ）を用いて、式（１７）の通り時刻ｎにおけるピッチｐ_ｓ［ｎ］を推定する。

異常入力検出時点ｎ_ａで推定された出力音情報のピッチｐ_ｓ［ｎ］より、デコーダ２６の出力音情報系列ｓ［ｎ_ａ−ｐ_ｓ［ｎ_ａ］＋１］からｓ［ｎ_ａ］までを、異常入力が解消するまで繰り返し再生して音情報と出力させても良い。

このピッチ推定は常時行っても良いし、異常入力検出時にのみ行っても良い。また、再生音情報の振幅を徐々に低減させフェードアウトするようにしても良い。異常入力解消時点からデコードされた音情報と再生音情報を一定期間クロスフェードによりブレンドさせて出力しても良い。

ところで、デコーダ２６の適応予測部５６においては、予測モデルが閉ループ構造を含む場合、安定領域境界近傍に予測係数が配置更新されるなどで、予測値が音情報の振幅範囲を超える可能性もある。この場合は、予測値を振幅範囲内にクリッピングしても良い。また予測係数をより安定的な領域へ再配置しても良い。

［対数関数と指数関数の近似解法］
適応正規化部４３、５３では、予測誤差の正規化に対数関数を、逆正規化に指数関数を用いる場合がある。この場合、これらの両関数の実装は適用する問題の要求を満たしつつ、計算コストや精度の観点で効率的に行われるべきである。以下では、本システムにおける対数関数及び指数関数の近似解法について説明する。そのため、まず、近似解法の基礎的な部分と、従来のＧ．７２６での誤差解析、及び本システムが満たすべき条件について説明する。

なお、当該近似解法は、適応正規化部４３、５３で実装されるが、これに限られない。すなわち、本システムの対数関数及び指数関数の近似解法は、対数関数や指数関数を用いるＣＰＵを備えた一般の演算装置に対しても適用可能である。

（近似解法の基礎）
任意の正数ｘについて、基数ｂを用いて表すことを考える。ｘ’_ｍを１以上ｂ未満の実数、ｘ_ｅを整数とすれば、このｘは式（１８）の通り一意に表すことができる。

式（１８）を用いれば、ｂを底とするｘの対数は式（１９）の通り求めることができる。ここで、ｘ_ｍ＝ｌｏｇ_ｂｘ’_ｍとした。
ｘ_ｍは０以上１未満の実数であるため、式（１９）は、式（１８）の定義により、ｘの対数を整数部と小数部に分けて求めることができる。

一方、ｙ＝ｘ_ｅ＋ｘ_ｍを指数とする基数ｂの指数関数ｂ^ｙは、ｙを任意の実数としても、指数関数は対数関数の逆関数であるため、定義よりｘ’_ｍはｂのｘ_ｍ乗であるから、式（１８）の通りｘとして求めることができる。また、実用上、対数変換される値は有界と考えても問題ないため、対数の整数部ｘ_ｅも有界であると考えてよい。しかし、小数部ｘ_ｍは何らかの解法により近似的に求める必要がある。

以降は式(１８)、（１９）の定義による対数関数と指数関数の近似解法について考えるが、一般的な２値演算を基礎とするＣＰＵによる演算を容易にするため、基数ｂを２と固定しても問題ない。これは、式(２０)、（２１）のとおり定数ｌｏｇ_２ｂに関する係数を乗ずることにより任意の基数へ変換可能であることによる。

さらに、指数関数は対数関数の逆関数であるため、以降は対数関数の近似解法について説明する。

（Ｇ．７２６の実装と誤差解析）
従来のＡＤＰＣＭ方式を用いるＩＴＵ−ＴＧ．７２６では、予測誤差の絶対値ｘを対数化するが、その対数の整数部ｘ_ｅは、ｘと２^ｋの大小をｋ＝０から比較し、ｘを超えない最大の２^ｋによる指数ｋとして求めている。この手法による演算量はΟ（ｋ）である。小数部ｘ_ｍは式（１８）のｘ’_ｍを１＋ｘ_ｍとおき、ｘ_ｍ＝ｌｏｇ_２（１＋ｘ_ｍ）として、演算量を優先的に近似して求めている。この近似による誤差は平均で０．０５をも上回ってしまう。

（多項式近似）
Ｇ．７２６の実装も近似誤差を低減するべく、ｘ’_ｍが［１，２）の区間でｌｏｇ_２ｘ’_ｍを多項式近似することも考えられる。そこで、このｎ次多項式を式（２２）のｆ_ＰＬ（ｘ，ｎ）とする。

ｌｏｇ_２ｘをｎ次多項式ｆ_ＰＬ（ｘ，ｎ）で最適近似するには、ｆ_ＰＬ（ｘ，ｎ）−ｌｏｇ_２ｘの平均二乗誤差を最小とすれば良い。そのためには、式（２３）のｎ元連立方程式を解けば良い。

しかし、たとえ２次の多項式によって精度良く近似できたとしても、その逆関数である指数関数の近似式を解析的に求めると、ｘの平方根を含む関数となってしまい、指数関数を効率的に解くことができない。３次以上ではなおさらである。また、当然にｌｏｇ_２ｘの逆関数である指数関数２^ｘを式（２３）と同様のアプローチで多項式近似すれば、同程度の精度で近似することはできる。但し、このアプローチによるとそれぞれの近似多項式は相互に逆関数の関係とはならない。

（適応正規化部の変換に対する要求）
上記のように対数関数の近似式とその逆関数となる指数関数の近似式が相互に逆関数とならない場合、双方の近似式を用いてある数を対数変換し、さらに指数変換したとしても元の数には復元できず、計算誤差以外の二重の近似誤差を含んでしまう。適応正規化部４３、５３における予測誤差の量子化誤差がエンコーダ１６とデコーダ２６の適応予測部４６、５６に伝播するが、これに加えてこの対数−指数変換における恒等変換誤差をも伝播することになり、予想誤差の増加、ひいてはデコーダ２６の復号音情報の品質劣化を招く虞がある。

また、近似対象とする定義域または値域の全域に亘り近似可能でなければならない。すなわち、Ｇ．７２６のように、０≦ｘ_ｍ≦１では０≦ｌｏｇ_２（１＋ｘ_ｍ）≒ｘ_ｍ≦１の全域を近似可能であるような条件をいう。しかし、最適な多項式近似ではたとえ２次の多項式であったとしても、この条件を満足することができず変換領域が制限されてしまい、性能劣化を招く虞がある。

さらに近似精度については、多項式の次数を上げれば精度も向上するが、乗算を含む演算量も増加してしまい望ましくない。これらの多項式近似による問題を解決するために、両関数の最適な折れ線近似とその最適化法を提案する。

［折れ線近似の基礎］
本システムの近似方法は、近似対象の関数を当該関数上の複数の点を線分で結んだ折れ線により近似する方法である。この折れ線近似で用いられる折れ線関数は、区分的な１次式で表される線分の連結である。そのため、その逆関数もまた１次式で表される線分の連結となり、解析的に容易に逆関数を求めることができる。このため、多項式近似のような恒等変換誤差を含むことはないという利点が得られる。

また、折れ線近似による演算量は、その線分数の対数に比例する回数の比較と、乗算と加算が１回のみであり、線分数を増加させ近似精度を向上させたとしても、算術演算量は一定である優位性を有する。

端点が（ｘ_ｎ，ｙ_ｎ）、（ｘ_ｎ＋１，ｙ_ｎ＋１）の線分を有するＮ線分による折れ線関数ｆ_ＢＬ（ｘ，Ｎ）は式（２４）の通り表すことができる。なお、対数関数の近似においてはｘ_ｎ＋１＝ｘ_ｎとなることはない。
以下では、後述の上回らない折れ線近似、下回らない折れ線近似、制約のない折れ線近似の３通りの方法を示すが、何れを用いてもよい。これらの折れ線近似は、例えば、適応正規化部４３、５３において、式（３）に示すように正規化予測誤差を求める関数に、予測誤差の絶対値の対数関数が含まれる場合に用いることができる。

［上回らない折れ線近似］
まず、近似する関数値を上回らない条件が付される、負の誤差のみの場合の折れ線近似について考える。また、線分数は２の累乗とする。このようにしても一般性は失われない。

はじめに、線分数２^１での近似を求める。定義域と値域の条件により端点（ｘ_０ ^（１），ｙ_０ ^（１））＝（１，０）、（ｘ_２ ^（１），ｙ_２ ^（１））＝（２，１）は決まっているため、（ｘ_１ ^（１），ｙ_１ ^（１））を求める問題となる。ここで、線分数２^ｍとした場合の端点ｎの位置を（ｘ_ｎ ^（ｍ），ｙ_ｎ ^（ｍ））と表す。

近似誤差最小とするためには、折れ線関数が有するすべての端点を、近似する対数関数上に配置されなければならない。そうするとｙ_１ ^（１）はｙ_１ ^（１）＝ｌｏｇ_２ｘ_１ ^（１）で表せるから、結果的に近似誤差最小となるｘ_１ ^（１）を求める問題に帰着する。

ｘ_１ ^（１）を求めるために、ここで、図４に示すように、誤差曲線ｌｏｇ_２ｘ−（ｘ−１）を考える。ただし、１≦ｘ≦２である。この誤差曲線は線分数２^０での折れ線近似、すなわちＧ．７２６と同様の近似における誤差を表す。ここから線分数２^１とした場合の近似誤差は図３の網掛け領域となる。この領域を最小とするためには三角形（ｘ_０ ^（１），ｙ_０ ^（１））、（ｘ_１ ^（１），ｙ_１ ^（１））、（ｘ_２ ^（１），ｙ_２ ^（１））の面積を最大化すれば良いことがわかる。

すなわち、（ｘ_１ ^（１），ｙ_１ ^（１））がこの誤差曲線の極大点に配置されればよい。これは式（２５）を満足するｘ_１ ^（１）を求めることになる。この場合ｘ_０ ^（０）＜ｘ_１ ^（１）＜ｘ_１ ^（０）の範囲で求める。
式（２５）では線分数２^ｍのときの任意の端点（ｘ_ｎ ^（ｍ），ｙ_ｎ ^（ｍ））を、線分数２^ｍ＋１へと更新したときの端点（ｘ_２ｎ ^{（ｍ＋１）}，ｙ_２ｎ ^{（ｍ＋１）}）と対応付け、同一としている。

このようにして求められた線分数２^１における近似最適化された端点群を、線分数２^２の折れ線関数へ継承する。同様に、継承により対応付けられていない端点群を、式（２５）を用いて近似最適化する。同様にして線分２^ｍにおいて近似最適化された端点群を、線分数２^ｍ＋１の折れ線関数へ継承しさらに近似最適化していくことで、所望の近似精度をもつ負の誤差のみの折れ線関数を求めることができる。

［下回らない折れ線近似］
次に、近似する関数値を下回らない条件が付される、正の誤差のみの場合の折れ線近似について考える。

はじめに、線分数２^１での近似を求める。端点（ｘ_０ ^（１），ｙ_０ ^（１））、（ｘ_２ ^（１），ｙ_２ ^（１））は上回らない折れ線近似と同様であるが、近似する関数を下回らない条件により、各線分は定義域内で接点を有する近似対象関数の接線となることが近似誤差を最小とする条件の一つである。

端点（ｘ_０ ^（１），ｙ_０ ^（１））、（ｘ_２ ^（１），ｙ_２ ^（１））は、近似対象関数上にあるため接点であり、両端点を有する２線分はそれを通る接線としてそれぞれ確定している。そのため（ｘ_１ ^（１），ｙ_１ ^（１））には自由度がなく、両線分の交点として一意に求めることができる。

このように下回らない折れ線近似では、図５に示す線分数２^１の折れ線関数が近似の基本状態であるため、上回らない折れ線近似とは端点の表現を変更し、線分数は２^ｍ＋１で定まるものとする。この場合の端点ｎの位置を（ｘ_ｎ ^（ｍ），ｙ_ｎ ^（ｍ））と表す。０≦ｍは同様である。よって、端点（ｘ_０ ^（１），ｙ_０ ^（１））は、線分数２^０＋１における端点（ｘ_０ ^（０），ｙ_０ ^（０））と表現し直す。残る２端点（ｘ_１ ^（１），ｙ_１ ^（１））、（ｘ_２ ^（１），ｙ_２ ^（１））についても同様に、（ｘ_１ ^（０），ｙ_１ ^（０））、（ｘ_２ ^（０），ｙ_２ ^（０））とする。

続いて、線分数２^１＋１での近似を求める。これは基本状態の線分数２^０＋１から増加した１線分の、近似誤差最小となる両端点を求める問題となる。ここで、線分数２^ｍ＋１における、端点（ｘ_ｎ ^（ｍ），ｙ_ｎ ^（ｍ））と（ｘ_ｎ＋１ ^（ｍ），ｙ_ｎ＋１ ^（ｍ））を有する線分Ｓ_ｎ ^（ｍ）は式（２６）の通り表すことができる。

また、近似対象関数の接線Ｔは、その接点を（ｘ_Ｔ、ｙ_Ｔ＝ｌｏｇ_２（ｘ_Ｔ））とすれば式（２７）の通り表すことができる。
さらに、線分Ｓ_ｎ ^（ｍ）に属する接点を（ｕ_ｎ ^（ｍ），ｖ_ｎ ^（ｍ））と表すものとする。

上記表記によれば、既に定まっている最左端点（ｘ_０ ^（１），ｙ_０ ^（１））と最右端点（ｘ_３ ^（１），ｙ_３ ^（１））は、（ｕ_０ ^（１），ｖ_０ ^（１））、（ｕ_２ ^（１），ｖ_２ ^（１））でもある。一方、（ｘ_１ ^（１），ｙ_１ ^（１））、（ｘ_２ ^（１），ｙ_２ ^（１））更には（ｕ_１ ^（１），ｖ_１ ^（１））は未定である。

この（ｘ_１ ^（１），ｙ_１ ^（１））は接線Ｔ（ｘ，ｕ_０ ^（１））とＴ（ｘ，ｕ_１ ^（１））の交点であり、（ｘ_２ ^（１），ｙ_２ ^（１））は接線Ｔ（ｘ，ｕ_１ ^（１））とＴ（ｘ，ｕ_２ ^（１））の交点であることに注目すれば、Ｔ（ｘ，ｕ_０ ^（１））とＴ（ｘ，ｕ_２ ^（１））はすでに確定しているため（ｕ_１ ^（１），ｖ_１ ^（１））を定めれば（ｘ_１ ^（１），ｙ_１ ^（１））と（ｘ_２ ^（１），ｙ_２ ^（１））も定まることがわかる。

この点、接点（ｕ_１ ^（１），ｖ_１ ^（１））は、自身が乗る線分Ｓ_１ ^（１）と隣接する線分Ｓ_０ ^（１）、Ｓ_２ ^（１）による近似誤差が最小となるように求めればよい。それには式（２８）の区分誤差評価関数Ｅ_Ｓ（）を用いることができる。この関数は接線Ｔ（ｘ，ｘ_Ｔ）による区間［ａ，ｂ］での近似誤差の二乗平均を求める。

一方、近似誤差の最小化には、接点（ｕ_１ ^（１），ｖ_１ ^（１））で定まる（ｘ_１ ^（１），ｙ_１ ^（１））、（ｘ_２ ^（１），ｙ_２ ^（１））とともに式（２８）を用いて式（２９）をＥ（１，１）として最小化することもできる。この場合、Ｅ（１，１）＝Ｅ_Ｓ（ｕ_０ ^（１），１，ｘ_１ ^（１））＋Ｅ_Ｓ（ｕ_１ ^（１），ｘ_１ ^（１），ｘ_２ ^（１））＋Ｅ_Ｓ（ｕ_２ ^（１），ｘ_２ ^（１），２）となる。

式（２９）のＥ（ｍ，ｎ）はｕ_ｎ ^（ｍ）の関数である。このため、その最小化には式（３０）の通り、導関数を０とするｕ_ｎ ^（ｍ）を解析的に求めてもよいし、非線形最適化問題を解いてＥ（ｍ，ｎ）が最小となるｕ_ｎ ^（ｍ）を求めてもよい。前者の場合、解析的であるから誤差なく最小化することができる。

上記のような方法により、近似誤差を最小とする接点（ｕ_１ ^（１），ｖ_１ ^（１））を求める。求めた接点、端点は、線分数２^２＋１での折れ線近似を最適化する際に継承して利用する。その際、接点（ｕ_ｎ ^（ｍ），ｖ_ｎ ^（ｍ））を（ｕ_２ｎ ^{（ｍ＋１）}，ｖ_２ｎ ^{（ｍ＋１）}）と対応付け、同一点とする。

線分数２^２＋１では近似誤差最小化のために、接線Ｔ（ｘ，ｕ_０ ^（２））とＴ（ｘ，ｕ_２ ^（２））から最適な接点（ｕ_１ ^（２），ｖ_１ ^（２））を求め、接線Ｔ（ｘ，ｕ_２ ^（２））とＴ（ｘ，ｕ_４ ^（２））から最適な接点（ｕ_３ ^（２），ｖ_３ ^（２））を求める。このように順次隣接する接線Ｔ（ｘ，ｕ_ｎー１ ^（ｍ）），Ｔ（ｘ，ｕ_ｎ＋１ ^（ｍ））から関与する近似誤差を最小とする接点（ｕ_ｎ ^（ｍ），ｖ_ｎ ^（ｍ））を求めていく。

同様に線分２^ｍ＋１において、近似最適化され確定した接点群を、線分数２^ｍ＋１＋１の折れ線関数へ継承し、さらに近似最適化していくことで、所望の近似精度をもつ正の誤差のみの折れ線関数を求めることができる。

［制約のない折れ線近似］
上回らない折れ線近似のごとき端点に関する制約や、下回らない折れ線近似のごとき線分に関する制約がない折れ線近似について考える。すなわち、（１，０）、（２，１）以外の端点については、同じｘ座標値において近似対象関数上の点を上回る端点、及び同じｘ座標値において近似対象関数上の点を下回る端点を含む。つまり、制約がない折れ線近似関数は、近似対象関数を交差する線分を含んでなる折れ線近似関数であり、近似対象関数を上回る線分、下回る線分、近似対象関数と接する線分、及び少なくとも一方の端点が近似対象関数上に乗る線分、の少なくともいずれかを含んでいても良い。これまでの折れ線近似のように順次折れ線数を増やして直前の最適化情報を継承しつつ近似誤差を改善する必要がないため、端点を（ｘ_ｎ，ｙ_ｎ）と表現する。また、端点（ｘ_ｎ，ｙ_ｎ）と（ｘ_ｎ＋１，ｙ_ｎ＋１）を持つ線分Ｓ_ｎも式（３１）の通り表せる。

このＳ_ｎによる区分誤差評価関数Ｅ_Ｓも式（３２）を用いる。

線分数Ｎの場合の総合的な誤差評価関数ＥはＥ_Ｓを用いて式（３３）と表すことができる。

式（３３）のすべての端点による偏導関数を０とする連立方程式を解析的に解ける場合は、それにより求まった端点群が近似誤差最小の最適近似を構成する。この連立方程式が解析的に解けない場合は、非線形最適化法などにより式（３３）を最小化させればよいが、その際は端点数を上回らない折れ線近似や下回らない折れ線近似と同数とし、それぞれの近似での最適解である端点群を初期状態とすれば、良好な最適解が得られる。

（比較）
これら３種の折れ線近似の、線分数又は節点数に対する近似誤差の二乗平均値を両対数軸にプロットしたグラフを図６に示す。下回らない折れ線近似のみ横軸を節点数としている。従来のＧ．７２６の平均二乗誤差が０．００４程度であるのに対し、図６に示すように、本近似方法はいずれも一桁以上良好な近似結果が得られる。なお、対数化の際の整数部は、二分探索によればＯ（ｌｏｇ_２ｋ）の演算量であるから、従来のＧ．７２６の演算量Ｏ（ｋ）よりも少ないので、従来よりも高速に求めることができる。

［１−４．動作］
図７及び図８を参照し、本システムの動作について説明する。図７は、符号化装置１０の動作フローチャートである。図８は、復号化装置２０の動作フローチャートである。なお、これらは動作の一例であり、これらの順序に限定されない。

本システムの運用の前提条件として、パラメータは所望のシステム特性を満足するように設計されているものとするが、パラメータとシステム特性との対応関係を運用時に測定又は調整する場合は、その測定又は調整したパラメータを用いる。

［初期化］
図７及び図８に示すように、まず、運用開始時の初期設定として、符号化装置１０と復号化装置２０ともに各部のパラメータを設定する（ステップＳ０１）。すなわち、各装置１０、２０の記憶部１４、２４に予め記憶されているパラメータか、ユーザインターフェイスＵＩ１１、２１若しくは外部接続Ｉ／Ｆ１２、２２経由で入力されるパラメータを各装置１０、２０の各部に設定する。

なお、制御部１３、２３は、パラメータ識別値を用いて設定されたパラメータの適用可否を判定し、適用不可の場合は、表示器に表示する等ユーザインターフェイスＵＩ１１、２１若しくは外部接続Ｉ／Ｆ１２、２２経由で外部へ通知するとともに、本運用を保留しても良い。

次に、各装置１０、２０は、状態変数などの内部状態をリセットして初期状態とする（ステップＳ０２）。運用開始前の不定な状態変数により意図しない音が出力されるのを防止するためである。

［情報入力及び出力］
符号化装置１０は、設定されたパラメータに従って音又は音情報を音入力Ｉ／Ｆ１５等により外部から入力するか、記憶部１４に記憶している音情報をエンコーダ１６に入力する（ステップＳ０３）。エンコーダ１６は設定されたパラメータに従って音符号へ符号化し（ステップＳ０４）、設定されたパラメータに従って同期信号などエンコードされた音符号及びその再生に必要な情報や、記憶部１４に蓄積された音符号を復号化装置２０へ出力する（ステップＳ０５）。エンコードされた音符号に再生に必要な情報には、パラメータ識別値を含む。

復号化装置２０には、設定されたパラメータに従って伝送媒体３０から入力された音符号及びその再生に必要な情報が入力される（ステップＳ０６）。ここで、エンコーダ１６とデコーダ２６に共通するパラメータは同一でなければならない。特に、本システムでは、パラメータ可変であるため、音符号のデコードに先立って、パラメータの整合性を確認する。

すなわち、復号化装置２０の制御部２３は、入力情報に含まれるパラメータ識別値と復号化装置２０に現在設定されているパラメータ識別値を照合する（ステップＳ０７）。整合する場合は（ステップＳ０７のＹＥＳ）、入力された音符号のデコードを許可し、設定されたパラメータに従ってデコードして音情報に復号する（ステップＳ０８）。さらに、復号された音情報を音出力Ｉ／Ｆ２７を介して復号化装置２０外部へ出力する（ステップＳ０９）。

一方、パラメータ識別値が整合しない場合は（ステップＳ０７のＮＯ）、不整合処理を行う（ステップＳ１０）。すなわち、ユーザインターフェイスＵＩ２１や外部接続Ｉ／Ｆ２２を介して不整合を外部に通知するとともに、デコードを許可しない。また、符号化装置１０から入力されたパラメータ識別値と対応するパラメータを記憶部２４や各部の動作制御Ｉ／Ｆに有していれば、そのパラメータに切り換えて整合させる。なお、デコーダ２６のパラメータにエンコーダ１６のパラメータを合わせるようにしても良い。

ステップＳ０５又はステップＳ０９の後、制御部１３、２３が、ユーザや外部接続装置からのリセット要求、及び、エンコーダ１６又はデコーダ２６において異常を検出した部位からのリセット要求を確認する（ステップＳ１１）。リセット要求がある場合は（ステップＳ１１のＹＥＳ）、ステップＳ０２に戻る。一方、リセット要求がない場合は（ステップＳ１１のＮＯ）、ステップＳ１２に進む。ユーザ等により、本システムの運用中にユーザインターフェイスＵＩ１１、１２若しくは外部接続Ｉ／Ｆ１２、２２経由でパラメータ設定変更の要求がある場合（ステップＳ１２のＹＥＳ）、ステップＳ０１に戻り要求されたパラメータを更新する。この場合、必要に応じて更新前に装置１０、２０を一時停止の上リセットし、更新後に再始動しても良い。パラメータ設定変更の要求がない場合（ステップＳ１２のＮＯ）、音入力のステップＳ０３、符号入力のステップＳ０６に戻るか（ステップＳ１３のＮＯ）、終了する（ステップＳ１３のＹＥＳ）。

なお、ステップＳ０１、Ｓ０２、Ｓ１１、Ｓ１２は、符号化装置１０と復号化装置２０とで同時並行して行っても良いし、それぞれ独立に行っても良く、その前後も任意である。また、何れか一方だけ行うようにしても良い。

［１−５．効果］
（１）本実施形態の音符号化システムでは、対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部となる適応正規化部４３、５３を有し、適応正規化部４３、５３は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ近似対象となる関数値を上回らない折れ線関数により近似するようにした。特に、適応正規化部４３、５３は、近似対象となる関数から、当該関数上の複数の点を線分で結んで得られる折れ線関数を引いたものの近似誤差が最小となる複数の点を求め、この複数の点を折れ線関数の各線分の端点として上回らない折れ線関数を求めるようにした。

これにより、ＩＴＵ−ＴＧ．７２６に代表される従来のＡＤＰＣＭ方式を用いたものよりも、近似精度を向上させることができる。例えば、平均二乗誤差は、ＩＴＵ−ＴＧ．７２６よりも一桁以上良好な近似結果を得ることができる。従って、音の質を向上させることができ、音の再現性を向上させることができる。

（２）適応正規化部４３、５３は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ近似対象となる関数値を下回らない折れ線関数により近似するようにした。特に、下回らない折れ線関数は、各線分が、その定義域内で複数の点として近似対象となる関数との接点を有する接線であり、適応正規化部４３、５３は、接点を、その接点が乗る線分とこれに隣接する両線分による近似対象となる関数との近似誤差が最小となるように求めるようにした。

これにより、ＩＴＵ−ＴＧ．７２６に代表される従来のＡＤＰＣＭ方式を用いたものよりも、近似精度を向上させることができる。例えば、平均二乗誤差は、ＩＴＵ−ＴＧ．７２６よりも一桁以上良好な近似結果を得ることができる。さらに、下回らない折れ線近似よりも近似精度を向上させることができる。従って、音の質をより向上させることができ、音の再現性を更に向上させることができる。

（３）適応正規化部４３、５３は、近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、折れ線関数は、端点（ｘ_ｎ，ｙ_ｎ）と（ｘ_ｎ＋１，ｙ_ｎ＋１）を持つ線分Ｓ_ｎを式（３１）で表し、この線分Ｓ_ｎによる区分誤差評価関数Ｅ_Ｓを式（３２）で表した場合に、式（３３）の誤差評価関数Ｅを最小化したときに得られるものとした。これにより、ＩＴＵ−ＴＧ．７２６に代表される従来のＡＤＰＣＭ方式を用いたものよりも、近似精度を向上させることができるだけでなく、上記の上回らない折れ線近似や下回らない折れ線近似よりも更に近似精度を向上させることができる。

［２．他の実施形態］
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。以下は、その一例である。

（１）第１の実施形態の音符号化システムでは、パラメータの設定は、ユーザの要求に基づくものとして説明したが、これに限られない。符号化装置１０、復号化装置２０で用いられる各パラメータは、音や音情報、音符号などの各装置１０、２０への入力を契機として、自動的に変更するように構成しても良い。例えば、符号化装置１０の音入力Ｉ／Ｆ１５への入力が、男性の音声から楽器の音に切り替わった場合、予測誤差の確率分布が変わってくるため、音の信号レベル、周波数特性等の変化を検知して、エンコーダ１６及びデコーダ２６の動作制御Ｉ／Ｆのパラメータを、当該楽器の音に適したパラメータに変更するようにしても良い。入力の変化を判定する方法としては、例えば、エンコーダ１６及びデコーダ２６各部の動作制御Ｉ／Ｆに入力変化を判別する閾値や範囲を設定する。

（２）第１の実施形態の音符号化システムでは、エンコーダ１６とデコーダ２６とが別体として構成したが、これらを一体として構成したシステムとして構成しても良い。また、適応予測部５６が復号した音情報を出力するエンコーダが実装された単一装置としてシステムを構成しても良い。この場合、設定パラメータとシステム特性との対応関係を求める場合に有用である。

（３）第１の実施形態に係る音符号化システムでは、エンコーダ１６及びデコーダ２６の処理部に設けられた動作制御Ｉ／Ｆによって、当該処理部に入力された音情報又は音符号に応じてパラメータ更新のための制御信号を制御部１３、２３に出力し、制御部１３、２３によってパラメータを更新させたが、これに限られず、逆の関係であっても良い。すなわち、動作制御Ｉ／Ｆにより、当該動作制御Ｉ／Ｆが設けられた所定の内部状態の検知及び制御部１３、２３への通知を行い、制御部１３、２３が通知された各処理部の内部状態に応じてパラメータを更新させる制御信号を各処理部へ出力し、動作制御Ｉ／Ｆがその制御信号に基づいて処理部で用いるパラメータを更新するようにしても良い。

１０符号化装置
１１ユーザインターフェイスＵＩ
１２外部接続Ｉ／Ｆ
１３制御部
１４記憶部
１５音入力Ｉ／Ｆ
１６エンコーダ
１７符号出力Ｉ／Ｆ
２０復号化装置
２１ユーザインターフェイスＵＩ
２２外部接続Ｉ／Ｆ
２３制御部
２４記憶部
２５符号入力Ｉ／Ｆ
２６デコーダ
２７音出力Ｉ／Ｆ
３０伝送媒体
４１、５１前処理部
４２加算器
４３、５３適応正規化部
４４最適量子化部
４５、５５最適逆量子化部
４６、５６適応予測部
４７、５７加算器
４８、５８後処理部
４１ｐ、４３ｐ〜４６ｐ、４８ｐ動作制御Ｉ／Ｆ
５１ｐ、５３ｐ、５５ｐ、５６ｐ、５８ｐ動作制御Ｉ／Ｆ
４３１利得項算出部
４３１ａ遅延素子
４３１ｂ加算器
４３１０〜４３１ｎ係数制御条件部
４３２利得項選択条件部
４３２ａ遅延素子
４３３切替部
４３４減衰項算出部
４３４ａ遅延素子
４３４ｂ加算器

Claims

入力された音を符号化する符号化装置と、
入力された音符号を復号化する復号化装置と、
前記符号化装置が出力した音符号を前記復号化装置に伝送する伝送媒体と、
前記符号化装置及び前記復号化装置のそれぞれに備えられ、対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置と、
を備え、
前記符号化装置及び前記復号化装置は、前記演算装置として、音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を上回らない折れ線関数により近似すること、
を特徴とする音符号化システム。
前記適応正規化部は、前記近似対象となる関数から、当該関数上の複数の点を線分で結んで得られる折れ線関数を引いたものの近似誤差が最小となる前記複数の点を求め、この複数の点を折れ線関数の各線分の端点として前記上回らない折れ線関数を求めること、
を特徴する請求項１に記載の音符号化システム。
入力された音を符号化する符号化装置と、
入力された音符号を復号化する復号化装置と、
前記符号化装置が出力した音符号を前記復号化装置に伝送する伝送媒体と、
前記符号化装置及び前記復号化装置のそれぞれに備えられ、対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置と、
を備え、
前記符号化装置及び前記復号化装置は、前記演算装置として、音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を下回らない折れ線関数により近似すること、
を特徴とする音符号化システム。
前記下回らない折れ線関数は、各線分が、その定義域内で前記複数の点として前記近似対象となる関数との接点を有する接線であり、
前記適応正規化部は、前記接点を、その接点が乗る線分とこれに隣接する両線分による前記近似対象となる関数との近似誤差が最小となるように求めること、
を特徴とする請求項３に記載の音符号化システム。
入力された音を符号化する符号化装置と、
入力された音符号を復号化する復号化装置と、
前記符号化装置が出力した音符号を前記復号化装置に伝送する伝送媒体と、
前記符号化装置及び前記復号化装置のそれぞれに備えられ、対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置と、
を備え、
前記符号化装置及び前記復号化装置は、前記演算装置として、音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、
前記折れ線関数は、端点（ｘ_ｎ，ｙ_ｎ）と（ｘ_ｎ＋１，ｙ_ｎ＋１）を持つ線分Ｓ_ｎを式（１）で表し、この線分Ｓ_ｎによる区分誤差評価関数Ｅ_Ｓを式（２）で表した場合に、式（３）の誤差評価関数Ｅを最小化したときに得られるものであること、
を特徴とする音符号化システム。
Ｎ：線分数、ｘ：線分上のｘ座標、ｙ：線分上のｙ座標
入力された音を符号化する符号化装置であって、
音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、
対数関数を含む関数を近似対象として、これに近似する関数を演算し、
前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、
近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を上回らない折れ線関数により近似すること、
を特徴とする符号化装置。
入力された音符号を復号化する復号化装置であって、
音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、
対数関数を含む関数を近似対象として、これに近似する関数を演算し、
前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、
近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を上回らない折れ線関数により近似すること、
を特徴とする復号化装置。
入力された音を符号化する符号化装置であって、
音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、
対数関数を含む関数を近似対象として、これに近似する関数を演算し、
前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、
近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を下回らない折れ線関数により近似すること、
を特徴とする符号化装置。
入力された音符号を復号化する復号化装置であって、
音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、
対数関数を含む関数を近似対象として、これに近似する関数を演算し、
前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、
近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を下回らない折れ線関数により近似すること、
を特徴とする復号化装置。
入力された音を符号化する符号化装置であって、
音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、
対数関数を含む関数を近似対象として、これに近似する関数を演算し、
前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、
近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、
前記折れ線関数は、端点（ｘ _ｎ，ｙ _ｎ）と（ｘ _ｎ＋１，ｙ _ｎ＋１）を持つ線分Ｓ _ｎを式（１）で表し、この線分Ｓ _ｎによる区分誤差評価関数Ｅ _Ｓを式（２）で表した場合に、式（３）の誤差評価関数Ｅを最小化したときに得られるものであること、
を特徴とする符号化装置。
Ｎ：線分数、ｘ：線分上のｘ座標、ｙ：線分上のｙ座標
入力された音を符号化する復号化装置であって、
音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、
対数関数を含む関数を近似対象として、これに近似する関数を演算し、
前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含み、
近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、
前記折れ線関数は、端点（ｘ _ｎ，ｙ _ｎ）と（ｘ _ｎ＋１，ｙ _ｎ＋１）を持つ線分Ｓ _ｎを式（１）で表し、この線分Ｓ _ｎによる区分誤差評価関数Ｅ _Ｓを式（２）で表した場合に、式（３）の誤差評価関数Ｅを最小化したときに得られるものであること、
を特徴とする復号化装置。
Ｎ：線分数、ｘ：線分上のｘ座標、ｙ：線分上のｙ座標