JP4516345B2

JP4516345B2 - 音声符号化情報処理装置および音声符号化情報処理プログラム

Info

Publication number: JP4516345B2
Application number: JP2004118361A
Authority: JP
Inventors: 智康小森; 善明鹿喰; 和久井口; 秀一青木
Original assignee: Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2004-04-13
Filing date: 2004-04-13
Publication date: 2010-08-04
Anticipated expiration: 2024-04-13
Also published as: JP2005301002A

Description

本発明は、音声を符号化した音声符号化情報を処理する音声符号化情報処理装置および音声符号化情報処理プログラムに関する。

従来、音声を符号化情報（音声符号化情報、いわゆる、音声ストリーム）に変換する変換符号化方法には、ＭＰＥＧ−ｌａｙｅｒ１，２，３、ドルビーＡＣ−３、ＭＰＥＧ−２ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）等の各種の方法がある。

また、音声符号化情報（音声ストリーム）を処理するものとして、例えば、「ミキシング回路、符号化処理装置および符復号化装置」（特許文献１参照）、「ＡＡＣ音声符号化の復号方法と符号化方法」（非特許文献１参照）、「オーディオデータのカスケード式符号化および復号化方法」（特許文献２参照）、「デジタル化オーディオ信号の伝送方法」（特許文献３参照）、「オーディオ信号の符号化方法及び符号化装置」（特許文献４参照）が挙げられる。

これらを簡単に説明すると、「ミキシング回路、符号化処理装置および符復号化装置」には、いわゆるビットストリームデータ同士のミキシングを可能にすることが開示されているが、ミキシング可能なビットストリームデータが、ＰＣＭデータ等のｒａｗデータ（生データ、元のままのデータ）に限定されている。また、「ＡＡＣ音声符号化の復号方法と符号化方法」には、文字通り、ＡＡＣ音声符号化情報（ＡＡＣの音声ストリーム）の復号方法と符号化方法の例が記述されているが、高音質化の方法や効率的な再符号化方法等は記述されていない。

また、「オーディオデータのカスケード式符号化および復号化方法」には、いわゆるタンデムコーデック時（カスケード式オーディオコーデック；オーディオ信号（音声）のカスケード式の符号化、復号化）に窓かけの同期をとる方法が開示されており、カスケード接続時に音声をベースバンド信号に復号してから再符号化する場合に、窓かけの同期をとることで、音声の音質劣化を改善可能なことが記述されている。しかし、音声符号化情報（音声ストリーム）の接続や、ミキシングを行った場合の音声の音質劣化に関しては、窓かけの同期をとることが、音声の音質劣化を改善できるか否か言及されていない。

また、「デジタル化オーディオ信号の伝送方法」には、タンデムコーデック時の符号化パラメータを継承して、音声を符号化する方法が開示されており、例えば、高レートの音声符号化情報（音声ストリーム）を低レートの音声符号化情報に変換する際に、符号化パラメータを利用することで、タンデムコーデック時の音声の音質劣化（符号化劣化）を減少させることや、エラー保護を行うことが開示されている。しかし、音声符号化情報（音声ストリーム）の接続や、ミキシングを行った場合の音声の音質劣化に関しては、窓かけの同期をとることが、音声の音質劣化を改善できるか否か言及されていない。

さらに、「オーディオ信号の符号化方法及び符号化装置」には、オーディオ信号（音声）を符号化した際の音質劣化を改善する方法と、オーディオ符号化エンコーダの計算量を減少させる方法とが開示されている。しかし、オーディオ符号化エンコーダの計算量を減少させることができるが、再量子化をする際に、効率的な符号化方法に関して言及されていない。

特開平９−３２１６３０号公報（段落００１６〜００２６、図１）特表平９−５０３６３７号公報（発明の詳細な説明、全頁）特開平１−５０１４３５号公報（４頁左下〜５頁左上、図１）特開２００３−２７１１９９号公報（段落００２９〜００３４、図１）ＩＳＯ／ＩＥＣ−１３８１８−７：２００３ｐａｒｔ７：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）ｐａｒｔ７全頁

しかしながら、従来の音声符号化情報（音声ストリーム）を処理するものでは、音声符号化情報が、一度時間領域のデータに変換された状態で、再度エンコード（再符号化）されて、音声符号化情報同士を加算したり、接続したりして行っていたので、再符号化時に符号化劣化が生じ、結果として、音声の音質劣化が発生してしまうという問題がある。

また、音声符号化情報（音声ストリーム）を処理する装置では、音声符号化情報を符号化・復号化するデコーダ・エンコーダを具備するために、回路規模が大きくなり、コストが増加すると共に、当該デコーダ・エンコーダによる演算量（計算量）が増加するという問題がある。

さらに、背景技術のところで、列記した「ミキシング回路、符号化処理装置および符復号化装置」および「オーディオ信号の符号化方法及び符号化装置」には、高音質化の方法や効率的な再符号化方法等が記載されておらず、「オーディオデータのカスケード式符号化および復号化方法」および「デジタル化オーディオ信号の伝送方法」には、音声の音質劣化を改善できるか否かが記載されておらず、実際に、音声符号化情報を処理する場合に、音声の音質劣化を改善して、効率的な再符号化を行うことが実現されていないという問題がある。

そこで、本発明では、前記した問題を解決し、回路規模を大きくすることなく、コストおよび演算量の増加を抑制し、符号化劣化が生じることなく、音声の音質劣化を防止して、効率的な再符号化を実現することができる音声符号化情報処理装置および音声符号化情報処理プログラムを提供することを目的とする。

前記課題を解決するため、請求項１に記載の音声符号化情報処理装置は、音声を符号化した音声符号化情報が複数集まってなる音声符号化情報群を周波数係数に変換して加算した後、前記音声符号化情報に変換する音声符号化情報処理装置であって、入力された前記音声符号化情報群を周波数係数に変換する周波数係数変換手段と、この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算するゲイン乗算手段と、このゲイン乗算手段から出力された周波数係数を加算する周波数係数加算手段と、この周波数係数加算手段によって加算された周波数係数を音声符号化情報に変換する音声符号化情報変換手段と、を備え、前記ゲイン乗算手段は、前記音声符号化情報のそれぞれに予め含まれている量子化精度情報を変更することで、前記ゲインを乗算する際の計算量を削減し、前記周波数係数加算手段は、前記周波数係数を加算する際に、前記周波数係数の量子化精度を制御する量子化精度制御手段を備え、前記量子化精度制御手段は、２つの前記音声符号化情報のそれぞれに予め含まれているスケールファクター値の差分にゲインと前記２つの前記音声符号化情報のうちの一方を変換した前記周波数係数とを乗じた値に、前記２つの前記音声符号化情報のうちの他方を変換した前記周波数係数を加えて量子化値を算出することで、前記量子化精度の計算量を削減する構成とした。

かかる構成によれば、音声符号化情報処理装置は、周波数係数変換手段によって、入力された複数の音声符号化情報（音声ストリーム）からなる音声符号化情報群を周波数係数に変換する。この周波数係数変換手段は、周波数係数加算手段で加算する単位（ブロック単位）で周波数係数に変換するか、周波数係数を示す要素に変換する。例えば、ＡＡＣのｓｙｎｔａｘ（構成法、記述法）によると、周波数係数であるＤＣＴ係数は、スケールファクター値、量子化値の関数として記述される。

続いて、この音声符号化情報処理装置は、ゲイン乗算手段によって、この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算する。音声符号化情報処理装置は、周波数係数変換手段で変換された周波数係数に、ゲイン乗算手段によって、音声符号化情報の出力の比率となるゲイン（例えば、外部から入力された固定値［外部ゲイン］）が乗算される。つまり、ゲイン乗算手段で周波数係数に掛けあわせるゲイン（値）は、周波数係数加算手段で加算された際の各音声符号化情報の割合を変化させるものであると言える。また、周波数係数が動的な値であり、可変する場合、当該周波数係数を時間領域の係数とみなして、畳み込みを行うことも可能である。時間領域の信号に畳み込みを行うことで、フィルターやＥＱ等を実現することができる。つまり、周波数領域の信号にも畳み込みを行うことで、音声符号化情報の成分を変更することができる。さらに、音声符号化情報処理装置は、ゲイン乗算手段によって、量子化精度情報を変更すること、例えば、ＡＡＣの場合、量子化情報に記述されている量子化値を２倍にする代わりに、スケールファクターゲインを制御して、ほぼ２倍になるようにして、近似計算を行うことで、大幅に計算量の削減を実現することができる。そして、音声符号化情報処理装置は、周波数係数加算手段によって、このゲイン乗算手段から出力された周波数係数を加算する。つまり、この周波数係数加算手段は、周波数係数変換手段で変換されたブロック単位で周波数係数を加算する。そして、この音声符号化情報処理装置は、音声符号化情報変換手段によって、周波数係数加算手段で加算された周波数係数を音声符号化情報に変換する。この音声符号化情報変換手段では、まず、加算した周波数係数をコーデック（例えば、ハフマン符号化）した符号化データとし、次に、この符号化データを並べ替えたストリーム（音声ストリーム；音声符号化情報）として出力する。

また、音声符号化情報処理装置は、周波数係数加算手段が量子化精度制御手段を備え、量子化精度を制御することで、異なる量子化精度情報を持った、音声符号化情報の周波数係数を加算することができる。

また、音声符号化情報処理装置は、量子化精度制御手段が音声符号化情報のそれぞれに予め含まれている量子化精度情報、つまり、符号化後の音声の細かさを制御するものに基づいて、音声符号化情報を復号する際の誤差を大きくとってもいい場合であれば、周波数係数および量子化精度情報を計算する回数を減らすことができるため、計算量を大幅に削減することができる。

請求項２に記載の音声符号化情報処理装置は、請求項１に記載の音声符号化情報処理装置において、接続点制御手段と、音声符号化情報切替手段と、をさらに備える構成とした。

かかる構成によれば、音声符号化情報処理装置は、接続点制御手段によって、音声符号化情報群に含まれている各音声符号化情報の接続する箇所を示す接続点近傍で、当該音声符号化情報を接続し、音声符号化情報切替手段によって、接続された音声符号化情報と、接続されなかった音声符号化情報とを切り替えて出力する。

請求項６に記載の音声符号化情報処理プログラムは、音声を符号化した音声符号化情報が複数集まってなる音声符号化情報群を周波数係数に変換して加算した後、前記音声符号化情報に変換する装置を、入力された前記音声符号化情報群を周波数係数に変換する周波数係数変換手段、この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算するゲイン乗算手段、このゲイン乗算手段から出力された周波数係数を加算する周波数係数加算手段、この周波数係数加算手段によって加算された周波数係数を音声符号化情報に変換する音声符号化情報変換手段、として機能させ、前記ゲイン乗算手段は、前記音声符号化情報のそれぞれに予め含まれている量子化精度情報を変更することで、前記ゲインを乗算する際の計算量を削減し、前記周波数係数加算手段は、前記周波数係数を加算する際に、前記周波数係数の量子化精度を制御する量子化精度制御手段を備え、前記量子化精度制御手段は、２つの前記音声符号化情報のそれぞれに予め含まれているスケールファクター値の差分にゲインと前記２つの前記音声符号化情報のうちの一方を変換した前記周波数係数とを乗じた値に、前記２つの前記音声符号化情報のうちの他方を変換した前記周波数係数を加えて量子化値を算出することで、前記量子化精度の計算量を削減する構成とした。

かかる構成によれば、音声符号化情報処理プログラムは、周波数係数変換手段によって、入力された複数の音声符号化情報（音声ストリーム）からなる音声符号化情報群を周波数係数に変換する。続いて、この音声符号化情報処理プログラムは、周波数係数加算手段によって、周波数係数変換手段で変換された周波数係数を加算し、音声符号化情報変換手段によって、周波数係数加算手段で加算された周波数係数を音声符号化情報に変換する。この音声符号化情報変換手段では、まず、加算した周波数係数をコーデック（例えば、ハフマン符号化）した符号化データとし、次に、この符号化データを並べ替えたストリーム（音声ストリーム；音声符号化情報）として出力する。

請求項１、３に記載の発明によれば、入力された複数の音声符号化情報（音声ストリーム）からなる音声符号化情報群を周波数係数に変換し、この変換された周波数係数を加算する。そして、加算された周波数係数を音声符号化情報に変換する。このため、音声符号化情報を周波数領域で処理することによって、従来のように、音声符号化情報を時間領域のデータに変換するために回路規模を大きくすることなく、コストおよび演算量の増加を抑制することができ、さらに、音声符号化情報の復号・符号化に伴って発生する符号化劣化が生じることなく、音声の音質劣化を防止することができる。

また、請求項１、３に記載の発明によれば、周波数係数を加算する際に、量子化精度を制御することで、異なる量子化精度情報を持った音声符号化情報を変換した周波数係数を加算することができる。

また、請求項１、３に記載の発明によれば、音声符号化情報のそれぞれに予め含まれている量子化精度情報、つまり、符号化後の音声の細かさを制御するものを利用して、量子化精度（丸め誤差）の計算量を削減することによって、回路規模を大きくすることなく、コストの増加を抑制することができる。

また、請求項１、３に記載の発明によれば、ゲイン（例えば、外部から入力された固定値［外部ゲイン］）が乗算されるので、音声符号化情報の復号・符号化に伴って発生する符号化劣化が調整され、音声の音質劣化を防止することができる。

また、請求項１、３に記載の発明によれば、量子化精度情報を変更すること、例えば、ＡＡＣの場合、量子化情報に記述されている量子化値を２倍にする代わりに、スケールファクターゲインを制御して、ほぼ２倍になるようにして、近似計算を行うことで、大幅に計算量の削減を実現することができる。

請求項２に記載の発明によれば、音声符号化情報群に含まれている各音声符号化情報の接続する箇所を示す接続点近傍で、当該音声符号化情報を接続し、接続された音声符号化情報と、接続されなかった音声符号化情報とを切り替えて出力する。このため、接続点近傍での異音の発生を抑制することができると共に、接続点近傍以外での計算量を大きく削減し、接続点近傍以外での音の音質劣化を抑制することができる。

次に、本発明の実施形態について、適宜、図面を参照しながら詳細に説明する。
この実施形態の説明では、音声符号化情報処理装置について、第一実施形態から第六実施形態までの６個の実施形態を説明することとし、まず、第一実施形態から第六実施形態までのそれぞれの音声符号化情報処理装置の構成の説明、動作の説明を順次行うこととする。

〈音声符号化情報処理装置［第一実施形態］の構成〉
図１は、音声符号化情報処理装置のブロック図である。
この図１に示すように、音声符号化情報処理装置１は、複数の音声符号化情報（音声ストリーム）が入力され、これらの音声符号化情報（複数の音声符号化情報を音声符号化情報群という）を、周波数領域で加算して処理するもので、周波数係数変換手段３と、周波数係数加算手段５と、音声符号化情報変換手段７とを備えている。

周波数係数変換手段３は、音声符号化情報（音声ストリーム）を周波数領域上のデータである周波数係数（または、周波数係数を示す要素）に変換するものである。この周波数係数変換手段３は、周波数係数加算手段５で周波数係数の加算が行えるように、音声符号化情報（音声ストリーム）のブロック単位で、当該音声符号化情報を周波数係数に変換する。この実施形態では、周波数係数変換手段３は、音声符号化情報として、ＡＡＣの音声ストリームを入力しており、当該周波数係数変換手段３は、ＡＡＣの音声ストリームを、周波数係数であるＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）係数に変換している。

また、この周波数係数変換手段３は、音声符号化情報（音声ストリーム）に含まれているヘッダ情報を分離して、音声符号化情報変換手段７に出力するものである。このヘッダ情報には、音声符号化情報の属性を定義したプロファイルと、サンプリング周波数と、チャンネルコンフィグレーション等が含まれている。つまり、音声符号化情報の内、本体の音声信号（オーディオ信号）以外の部分は、周波数係数に変換する必要が無いので、分離されて、改めて音声符号化情報に再符号化する際に用いられることとなる。

さらに、音声符号化情報の内において、本体の音声信号（オーディオ信号）以外の部分には、シングルチャンネルの音声符号化情報（音声ストリーム）であるのか、カップリングチャンネルの音声符号化情報であるのか、ＴＮＳやパルスコーディングが使用された音声符号化情報であるのかを示す情報が含まれている。

ＤＣＴ係数は、時間領域の信号である音声符号化情報（音声ストリーム）を周波数領域の信号に変換したものであり、スケールファクター値と量子化値との関数によって表されるものである。
スケールファクター値は、ＤＣＴ係数の値を制御する値の一つであり、量子化精度を制御する値である。
量子化値は、ＤＣＴ係数を浮動小数点形式で表現した場合の仮数値（常用対数の正の小数部分）を指すものである。

また、スケールファクター値は、グローバルゲインとスケールファクターゲインとによって表されるものである。
グローバルゲインおよびスケールファクターゲインは、量子化精度をどのくらいにしているかを示している係数（量子化係数）のことであり、音声符号化情報の周波数帯域毎に量子化係数を変化させて、精度を変化させるためのものである。

また、周波数係数を示す要素として表すと、ＡＡＣの音声ストリームは、ＤＣＴ係数をＫ、量子化値をＲ、スケールファクター値をＳ、ゲインをＧ（Ｇ＾Ｓ）とすると、Ｋ＝Ｒ×Ｇ＾Ｓ（Ｇ^S）と表すことが可能となる。

また、スケールファクター値Ｓについて、グローバルゲインをｇｌｇとし、スケールファクターゲインをｓｆｇとすると、スケールファクター値は、Ｓ＝ｇｌｇ−ｓｆｇ［ｓｂ］で表現される。

音声符号化情報処理装置１に入力される２つ（複数、ここでは２つ）の音声符号化情報を、音声ストリームＡおよび音声ストリームＢとすると、この周波数係数変換手段３から出力される周波数係数は、Ｒ＿Ａ［Ｉ］およびＲ＿Ｂ［Ｉ］と表現することとする。但し、Ｉ＝０〜１０２３である。また、音声ストリームＡおよび音声ストリームＢのゲインは、Ｓ＿Ａ［ｓｂ］およびＳ＿Ｂ［ｓｂ］と表現することとし、Ｓ＿Ａ［ｓｂ］＝Ｓ＿Ｂ［ｓｂ］とする。但し、ｓｂ＝０〜４８である。

なお、ｓｂは、スケールファクター値のインデックスであり、ＩはＤＣＴ係数、量子化値のインデックスである。また、ＤＣＴ係数Ｋ、量子化値Ｒ、ゲインＧ（Ｇ＾Ｓ）の具体的な算出（導出）方法については、ＩＳＯ／ＩＥＣ１３８１８−７９．ＮｏｉｓｅｌｅｓｓＣｏｄｉｎｇにおいて量子化値Ｒの算出方法が、同１０．ＱｕａｎｔｉｚａｔｉｏｎにおいてＤＣＴ係数Ｋの算出方法が、同１１．ＳｃａｌｅｆａｃｔｏｒｓにおいてゲインＧ（Ｇ＾Ｓ）の算出方法がそれぞれ記載されている。このスケールファクター値のインデックスであるｓｂについて、周波数係数（ＤＣＴ係数）のバンド分けの例を図１４に示す。

この図１４に示すように、スケールファクター値のインデックスｓｂ（０〜４８）と、ｏｆｆｓｅｔの値およびｔｏｐの値とが関連付けられている。

図１に戻って、音声符号化情報処理装置１の構成の説明を続ける。
周波数係数加算手段５は、周波数係数変換手段３で音声符号化情報（音声ストリーム）が変換された周波数係数を、ブロック単位で加算するものである。この実施形態では、周波数係数変換手段３は、音声符号化情報として、ＡＡＣの音声ストリームを入力しており、この場合、１０２４周波数係数が１ブロック単位となる。加算する周波数係数は、予め周波数係数変換手段３で付加しておいたスケールファクター値のインデックスが同じもの同士である。つまり、Ｓ＿Ａ［ｓｂ］＝Ｓ＿Ｂ［ｓｂ］の条件を満たす場合に、新しい量子化値（加算した周波数係数）ｘ＿ｑｕａｎｔ＿ｎｅｗ［Ｉ］＝Ｒ＿Ａ［Ｉ］＋Ｒ＿Ｂ［Ｉ］で表すことができる。

音声符号化情報変換手段７は、周波数係数加算手段５によって加算された周波数係数（量子化値）を処理（再符号化、並べ替え）して、いわゆるストリーム（音声ストリーム）を生成するもので、ノイズレスコーディング部７ａと、ビットストリームマルチプレクサ部７ｂとを備えている。

ノイズレスコーディング部７ａは、加算された周波数係数（量子化値）を再符号化した符号化データに変換するものである。この実施形態では、ハフマン符号語に変換するものである。なお、具体的な算出方法は、ＩＳＯ／ＩＥＣ１３８１７−７９章ＡＮＮＥＸＣ．８ＮｏｉｓｅｌｅｓｓＣｏｄｉｎｇに詳細に記載されている。

また、このノイズレスコーディング部７ａは、図１５に示すハフマンテーブルを参照して、周波数係数（量子化値）をハフマン符号語に変換している。このハフマンテーブル（ハフマンコードブック）は、データを圧縮する圧縮方法に用いられるもので、よく使われるデータを少ないビット数で表して、逆にあまり使われていないデータを使用している他のデータのビット数よりも多いビット数で表すためのものである。

図１に戻って、音声符号化情報処理装置１の構成の説明を続ける。
ビットストリームマルチプレクサ部７ｂは、周波数係数変換手段３で分離された当初の音声符号化情報（音声ストリーム）に含まれていたヘッダ情報と、ノイズレスコーディング部７ａで符号化された符号化データ（ハフマン符号語）とを、所定の形式に従って、並べ替えて出力するものである。

所定の形式とは、この実施形態では、ＩＳＯ／ＩＥＣ１３８１７−７６章ｓｙｎｔａｘに詳細に記載されている形式を指すものである。このｓｙｎｔａｘに記述されている音声フレームについて、簡単に説明する。

この音声フレームには、ヘッダ部と、データブロック部とがあり、ヘッダ部には各種システム情報（ヘッダ情報）が記述されており、データブロック部には、オーディオデータと、周波数係数変換手段３で変換されたＤＣＴ係数Ｋを表現するための量子化値ＲおよびゲインＧ＾Ｓのパラメータとが記述されている。

〈音声符号化情報処理装置［第一実施形態］の動作〉
次に、図７に示すフローチャートを参照して、図１に示した音声符号化情報処理装置１の動作について説明する（適宜、図１参照）。
まず、音声符号化情報処理装置１は、入力された音声符号化情報（音声ストリーム）群を、周波数係数変換手段３によって、周波数係数に変換する（ステップＳ１）。続いて、音声符号化情報処理装置１は、周波数係数加算手段５によって、周波数係数を加算する（ステップＳ２）。

そして、音声符号化情報処理装置１は、音声符号化情報変換手段７のノイズレスコーディング部７ａによって、加算した周波数係数を、ハフマン符号語にコーディング（符号化）し（ステップＳ３）、ビットストリームマルチプレクサ部７ｂによって、ハフマン符号語を並べ替えて、ストリーム化した音声符号化情報（音声ストリーム）に変換して出力する（ステップＳ４）。

この音声符号化情報処理装置１によれば、周波数係数変換手段３によって、入力された複数の音声符号化情報（音声ストリーム）からなる音声符号化情報群が周波数係数に変換され、周波数係数加算手段５によって、周波数係数変換手段３で変換された周波数係数が加算される。そして、音声符号化情報変換手段７によって、周波数係数加算手段５で加算された周波数係数（加算された音声ストリーム）が再符号化され、この再符号化されたハフマン符号語（符号化データ）が並べ替えられた音声符号化情報（音声ストリーム）として出力される。このため、音声符号化情報を周波数領域で処理することによって、従来のように、音声符号化情報を時間領域のデータに変換するために回路規模を大きくすることなく、コストおよび演算量の増加を抑制することができ、さらに、音声符号化情報の復号・符号化に伴って発生する符号化劣化が生じることなく、音声の音質劣化を防止することができる。

〈音声符号化情報処理装置［第二実施形態］の構成〉
図２は、音声符号化情報処理装置（第二実施形態）のブロック図である。
この図２に示すように、音声符号化情報処理装置１Ａは、複数の音声符号化情報（音声ストリーム）が入力され、これらの音声符号化情報を、周波数領域で加算する際に、量子化精度を制御しながら処理するもので、周波数係数変換手段３と、周波数係数加算手段５Ａと、音声符号化情報変換手段７Ａとを備えている。図１に示した音声符号化情報処理装置１の構成と同じ構成については、同一の符号を付して、その説明を省略する。

周波数係数加算手段５Ａは、周波数係数変換手段３で変換された周波数係数を、量子化精度を制御して加算するもので、量子化精度制御部５ａを備えている。この実施形態では、周波数係数変換手段３に、音声符号化情報として、ＡＡＣの音声ストリームが入力されており、この場合、１０２４周波数係数が１ブロック単位となる。そして、周波数係数加算手段５Ａは、加算する音声フレームにおいて、同じインデックスを持つ周波数係数同士を足し合わせる。

量子化精度制御部５ａは、量子化精度を制御する、つまり、スケールファクター値Ｓに応じて、量子化値Ｒを調整するものである。例えば、足し合わせるべき周波数係数の量子化値をＲ＿Ａ［Ｉ］およびＲ＿Ｂ［Ｉ］とし、スケールファクター値をＳ＿Ａ［ｓｂ］およびＳ＿Ｂ［ｓｂ］とし、ＤＣＴ係数をＫ＿Ａ［Ｉ］およびＫ＿Ｂ［Ｉ］とする。仮に、スケールファクター値Ｓ＿Ａ［ｓｂ］＜スケールファクター値Ｓ＿Ｂ［ｓｂ］であった場合、新しい量子化値Ｒ＿ｎｅｗ［Ｉ］は、Ｒ＿ｎｅｗ［Ｉ］＝Ｋ＿Ａ［Ｉ］＋Ｋ＿Ｂ［Ｉ］Ｇ＾（Ｓ＿Ｂ［ｓｂ］−Ｓ＿Ａ［ｓｂ］）となる。また、この量子化値の含まれるバンド（帯域）の新スケールファクター値はＳ＿Ａ［ｓｂ］を使用することができる。

スケールファクター値の符号化では、スケールファクター値Ｓ＿Ａ［ｓｂ］を使用することによって、当該スケールファクター値Ｓ＿Ａ［ｓｂ］を継承することができ、新しい量子化値Ｒ＿ｎｅｗ［Ｉ］の第２項Ｋ＿Ｂ［Ｉ］Ｇ＾（Ｓ＿Ｂ［ｓｂ］−Ｓ＿Ａ［ｓｂ］）の計算と、この第２項と第１項のＫ＿Ａ［Ｉ］との加算だけで、新しい量子化値Ｒ＿ｎｅｗ［Ｉ］を得ることができるため、第１項の乗算を、インデックスの数分減少させることができる。

また、予め、Ｓ＿Ｂ［ｓｂ］−Ｓ＿Ａ［ｓｂ］の差と量子化値が丸められてしまう範囲との対応付がなされたテーブルを作成しておけば、Ｓ＿Ｂ［ｓｂ］−Ｓ＿Ａ［ｓｂ］の差と量子化値が丸められてしまう範囲との大小比較と加算とによって、新しい量子化値Ｒ＿ｎｅｗ［Ｉ］を算出（導出）することが可能になる。

また、ここで説明した音声符号化情報（音声ストリーム）内の情報（Ｓ＿Ａ［ｓｂ］）を継承して符号化を簡略化する方法以外に、単純に新しいＤＣＴ係数（周波数係数）をＫ＿ｎｅｗ［Ｉ］＝Ｋ＿Ａ［Ｉ］＋Ｋ＿Ｂ［Ｉ］として、量子化値Ｒを算出（導出）する方法もある。

音声符号化情報変換手段７Ａは、周波数係数加算手段５Ａで周波数係数同士が加算されたものを音声符号化情報（音声ストリーム）に変換（再変換）するもので、量子化部７ｃと、ノイズレスコーディング部７ａと、レート歪みコントローラ部７ｄと、ビットストリームマルチプレクサ部７ｂとを備えている。この音声符号化情報変換手段７Ａは、スケールファクターバンド（周波数バンド毎）によって、量子化精度を制御するものである。但し、この音声符号化情報変換手段７Ａは、聴覚モデルを考慮して、全スケールファクターバンドで量子化精度を制御することも可能である。

量子化部７ｃは、レート歪みコントローラ部７ｄによる制御に従って、周波数係数加算手段５Ａで加算された周波数係数を量子化値Ｒに変換するものである。この量子化部７ｃにおける量子化値Ｒの具体的な算出方法は、ＩＳＯ／ＩＥＣ１３８１７−７ＡＮＮＥＸＣ．７Ｑｕａｎｔｉｚａｔｉｏｎに詳細に記載されている。ここに記載されている一部分を抜粋して、量子化部７ｃの説明をする。

ｉ番目のインデックスを持つ周波数係数の量子化値への出力を、ｘ＿ｑｕａｎｔ＿ｎｅｗ［ｉ］とし、音声符号化情報Ａ、Ｂ（図に示した２つの音声符号化情報それぞれ）が周波数係数変換手段３に入力され、周波数係数加算手段５Ａで加算されたｉ番目のインデックスを持つ周波数係数（係数出力）を、ｍｄｃｔ＿ｌｉｎｅ＿ｎｅｗ［ｉ］とし、補正項をｃｏｍｍｏｎ＿ｓｃｆ＿ｎｅｗとし、補正値（０．４０５４）をＭＡＧＩＣ＿ＮＵＭＢＥＲとすると、

ｇａｉｎ＿ｎｅｗ［ｓｂ］＝２＾｛（３／１６）×（ｓｃｆ＿ｎｅｗ［ｓｂ］−ｃｏｍｍｏｎ＿ｓｃｆ＿ｎｅｗ）｝・・・数式（１）

ｘ＿ｑｕａｎｔ＿ｎｅｗ［ｉ］＝（ｉｎｔ）｛｜ｍｄｃｔ＿ｌｉｎｅ＿ｎｅｗ［ｉ］｜＾（３／４）×ｇａｉｎ＿ｎｅｗ［ｓｂ］＋ＭＡＧＩＣ＿ＮＵＭＢＥＲ｝
・・・数式（２）

これら数式（１）および数式（２）を用いて、量子化部７ｃは、レート歪みコントローラ部７ｄによる制御（出力）により、ｓｃｆ＿ｎｅｗ［ｓｂ］、ｃｏｍｍｏｎ＿ｓｃｆ＿ｎｅｗを更新して、周波数係数加算手段５Ａから出力された周波数係数から量子化値を生成するものである。

レート歪みコントローラ部７ｄは、ビットレートが所定の値以下になるように、スケールファクターと、量子化部７ｃとを制御するものである。
つまり、このレート歪みコントローラ部７ｄは、許容される量子化ノイズの大きさ内において、必要なビット数が、使用可能なビット数を下回るまで、スケールファクター値の計算と、量子化値の計算とを繰り返し行って、所定の値以下になるように、ビットレートを削減していくものである。

この実施形態では、レート歪みコントローラ部７ｄは、ビットレートを削減する機能を有しているものであるが、量子化ノイズとビットレートとのトレードオフが実現できる機能を備えていれば、別の構成であってもよい。

〈音声符号化情報処理装置［第二実施形態］の動作〉
次に、図８に示すフローチャートを参照して、図２に示した音声符号化情報処理装置１Ａの動作について説明する（適宜、図２参照）。
まず、音声符号化情報処理装置１Ａは、入力された音声符号化情報（音声ストリーム）群を、周波数係数変換手段３によって、周波数係数に変換する（ステップＳ１１）。続いて、音声符号化情報処理装置１Ａは、周波数係数加算手段５Ａによって、量子化精度を制御しつつ、周波数係数を加算する（ステップＳ１２）。

そして、音声符号化情報処理装置１Ａは、音声符号化情報変換手段７Ａの量子化部７ｃによって、加算した周波数係数を量子化値に変換する（ステップＳ１３）。そして、音声符号化情報処理装置１Ａは、音声符号化情報変換手段７Ａのノイズレスコーディング部７ａによって、量子化値をハフマン符号語にコーディング（符号化）し（ステップＳ１４）、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であるか否かを判断する（ステップＳ１５）。

ここで、音声符号化情報処理装置１Ａは、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であると判断しなかった場合（ステップＳ１５、Ｎｏ）、ビットレートが所定の値以下になるように制御し（ステップＳ１６）、さらに、ステップＳ１４に戻り、再度、量子化値をハフマン符号語に変換する。

また、音声符号化情報処理装置１Ａは、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であると判断した場合（ステップＳ１５、Ｙｅｓ）、音声符号化情報変換手段７Ａのビットストリームマルチプレクサ部７ｂによって、ハフマン符号語を並べ替えて、ストリーム化した音声符号化情報（音声ストリーム）に変換して出力する（ステップＳ１７）。

この音声符号化情報処理装置１Ａによれば、周波数係数加算手段５Ａによって、周波数係数を加算する際に、量子化精度を制御することで、異なる量子化精度情報を持った音声符号化情報を変換した周波数係数を加算することができる。

〈音声符号化情報処理装置［第三実施形態］の構成〉
図３は、音声符号化情報処理装置（第三実施形態）のブロック図である。
この図３に示すように、音声符号化情報処理装置１Ｂは、複数の音声符号化情報（音声ストリーム）が入力され、これらの音声符号化情報（複数の音声符号化情報を音声符号化情報群という）に対して、周波数領域で外部ゲインを乗算してから加算して処理するもので、周波数係数変換手段３と、周波数係数乗算手段（ゲイン乗算手段）９と、周波数係数加算手段５と、音声符号化情報変換手段７とを備えている。図１に示した音声符号化情報処理装置１の構成と同じ構成については、同一の符号を付して、その説明を省略する。

周波数係数乗算手段９は、周波数係数変換手段３で複数の音声符号化情報が変換された複数の周波数係数（周波数係数群）、或いは、量子化値とスケールファクター値とに対して、外部ゲインを乗算するものである。この周波数係数乗算手段９における外部ゲイン乗算の具体的な一例について説明する。

例えば、一方の音声符号化情報（音声ストリーム）Ａの出力を２倍にすると共に、他方の音声符号化情報（音声ストリーム）Ｂの出力を１倍にする外部ゲインが入力された場合、この周波数係数乗算手段９の出力は、Ｋ＿Ａ＿ｎｅｗ［Ｉ］＝２×Ｋ＿Ａ［Ｉ］、Ｋ＿Ｂ＿ｎｅｗ［Ｉ］＝Ｋ＿Ｂ［Ｉ］となる。

ここで乗算する入力値（外部ゲイン）として、固定値（ここでは、２，１）の例として示したが、入力値（外部ゲイン）は動的な値であってもよく、さらに、畳み込みを行う処理等も想定できる。

〈音声符号化情報処理装置［第三実施形態］の動作〉
次に、図９に示すフローチャートを参照して、図３に示した音声符号化情報処理装置１Ｂの動作について説明する（適宜、図３参照）。
まず、音声符号化情報処理装置１Ｂは、入力された音声符号化情報（音声ストリーム）群を、周波数係数変換手段３によって、周波数係数に変換する（ステップＳ２１）。続いて、音声符号化情報処理装置１Ｂは、周波数係数乗算手段９によって、周波数係数に外部ゲインを乗算する（ステップＳ２２）。

そして、音声符号化情報処理装置１Ｂは、周波数係数加算手段５によって、外部ゲインを乗算した周波数係数を加算する（ステップ２３）。そして、音声符号化情報処理装置１Ｂは、音声符号化情報変換手段７のノイズレスコーディング部７ａによって、加算した周波数係数を、ハフマン符号語にコーディング（符号化）し（ステップＳ２４）、ビットストリームマルチプレクサ部７ｂによって、ハフマン符号語を並べ替えて、ストリーム化した音声符号化情報（音声ストリーム）に変換して出力する（ステップＳ２５）。

この音声符号化情報処理装置１Ｂによれば、周波数係数乗算手段９によって、周波数係数にゲイン（例えば、外部から入力された固定値［外部ゲイン］）が乗算されるので、音声符号化情報の復号・符号化に伴って発生する符号化劣化が調整され、音声の音質劣化を防止することができる。

〈音声符号化情報処理装置［第四実施形態］の構成〉
図４は、音声符号化情報処理装置（第四実施形態）のブロック図である。
この図４に示すように、音声符号化情報処理装置１Ｃは、複数の音声符号化情報（音声ストリーム）が入力され、これらの音声符号化情報を、周波数領域で、外部ゲインを乗算してから加算する際に、量子化精度を制御しながら処理するもので、周波数係数変換手段３と、周波数係数乗算手段（ゲイン乗算手段）９Ｃと、周波数係数加算手段５Ａと、音声符号化情報変換手段７Ａとを備えている。図２、図３に示した音声符号化情報処理装置１Ａ、１Ｂの構成と同じ構成については、同一の符号を付して、その説明を省略する。

周波数係数乗算手段９Ｃは、周波数係数変換手段３で複数の音声符号化情報が変換された複数の周波数係数（周波数係数群）、或いは、量子化値とスケールファクター値とに対して、外部ゲインを乗算する際に、計算処理を軽減するために、近似計算によって行うものである。この周波数係数乗算手段９Ｃにおける外部ゲイン乗算の具体的な一例について説明する。

例えば、ＡＡＣの２つの音声符号化情報（音声ストリーム）Ａ、Ｂが音声符号化情報処理装置１Ｃに入力され、一方の音声符号化情報（音声ストリーム）Ａの出力を２倍にすると共に、他方の音声符号化情報（音声ストリーム）Ｂの出力を１倍にする外部ゲインが入力された場合、この周波数係数乗算手段９Ｃの出力は、Ｋ＿Ａ＿ｎｅｗ［Ｉ］＝Ｋ＿Ａ［Ｉ］、Ｋ＿Ｂ＿ｎｅｗ［Ｉ］＝Ｋ＿Ｂ［Ｉ］とする。

ここで、この周波数係数乗算手段９Ｃでは、計算処理軽減のために、次に示す数式（３）を用いて近似計算を行う。

ｇａｉｎ＿ｎｅｗ＿Ａ［ｓｂ］＝２＾｛（３／１６）×（ｓｃｆ＿ｎｅｗ［ｓｂ］−ｃｏｍｍｏｎ＿ｓｃｆ＿ｎｅｗ）｝・・・数式（３）

ここで、ｃｏｍｍｏｎ＿ｓｃｆ＿ｎｅｗを５インクリメント（５増加させる）すると、全てのｇａｉｎ＿ｎｅｗ＿Ａ［ｓｂ］は、ほぼ１／２倍になる。すると、音声符号化情報変換手段７Ａの出力は、量子化値に数式（３）の逆数を乗じた数値に比例するので、周波数係数、量子化値を２倍にする代わりに、スケールファクターゲインを制御して、ほぼ２倍になるように、近似計算を行うことによって、大幅に計算量を削減することが可能になる。

また、同計算をスケールファクターゲイン［ｓｂ］毎に行うことで、スケールファクターバンド（周波数係数であるスペクトルがスペクトル係数の複数のグループに分けられたもの）毎に乗算するゲインを変更することができる。このような近似計算によって、加算する周波数係数それぞれに乗算するゲインを変更するために生じる計算量を減らすことができる。

〈音声符号化情報処理装置［第四実施形態］の動作〉
次に、図１０に示すフローチャートを参照して、図４に示した音声符号化情報処理装置１Ｃの動作について説明する（適宜、図４参照）。
まず、音声符号化情報処理装置１Ｃは、入力された音声符号化情報（音声ストリーム）群を、周波数係数変換手段３によって、周波数係数に変換する（ステップＳ３１）。続いて、音声符号化情報処理装置１Ｃは、周波数係数乗算手段９Ｃによって、周波数係数に外部ゲインを乗算する（ステップＳ３２）。

そして、音声符号化情報処理装置１Ｃは、周波数係数加算手段５Ａによって、量子化精度を制御しつつ、周波数係数を加算する（ステップＳ３３）。

そして、音声符号化情報処理装置１Ｃは、音声符号化情報変換手段７Ａの量子化部７ｃによって、加算した周波数係数を量子化値に変換する（ステップＳ３４）。そして、音声符号化情報処理装置１Ｃは、音声符号化情報変換手段７Ａのノイズレスコーディング部７ａによって、量子化値をハフマン符号語にコーディング（符号化）し（ステップＳ３５）、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であるか否かを判断する（ステップＳ３６）。

ここで、音声符号化情報処理装置１Ｃは、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であると判断しなかった場合（ステップＳ３６、Ｎｏ）、ビットレートが所定の値以下になるように制御し（ステップＳ３７）、さらに、ステップＳ３５に戻り、再度、量子化値をハフマン符号語に変換する。

また、音声符号化情報処理装置１Ｃは、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であると判断した場合（ステップＳ３６、Ｙｅｓ）、音声符号化情報変換手段７Ａのビットストリームマルチプレクサ部７ｂによって、ハフマン符号語を並べ替えて、ストリーム化した音声符号化情報（音声ストリーム）に変換して出力する（ステップＳ３８）。

この音声符号化情報処理装置１Ｃによれば、周波数係数乗算手段９Ｃによって、近似計算を行うことで、スケールファクターゲイン（量子化情報）を変更した結果生じる計算量を、削減することができる。

〈音声符号化情報処理装置［第五実施形態］の構成〉
図５は、音声符号化情報処理装置（第五実施形態）のブロック図である。
この図５に示すように、音声符号化情報処理装置１Ｄは、複数の音声符号化情報（音声ストリーム）が入力され、これらの音声符号化情報を任意の接続点で接続させると共に、接続させた音声符号化情報を、周波数領域で外部ゲインを乗算してから加算処理するもので、接続点制御手段１１と、周波数係数変換手段３と、周波数係数乗算手段９と、周波数係数加算手段５と、音声符号化情報変換手段７と、音声符号化情報切替手段１３とを備えている。図３に示した音声符号化情報処理装置１Ｂの構成と同じ構成については、同一の符号を付して、その説明を省略する。

接続点制御手段１１は、入力された音声符号化情報（音声ストリーム）群をどの時刻で、または、どの音声フレームで接続するか、或いは、どの音声フレームを加算処理するかが接続点制御入力信号として入力され、この接続点制御入力信号に基づいて、接続処理を行うと共に、加算処理する場合には、周波数係数変換手段３に出力し、加算処理しない場合には、音声符号化情報切替手段１３に出力するものである。
なお、この接続点制御入力信号は、音声フレーム番号を特定したものである。

音声符号化情報切替手段１３は、接続点制御手段１１から出力された音声符号化情報（音声ストリーム）と、音声符号化情報変換手段７から出力された音声符号化情報（音声ストリーム）とを連続的に切り替えて出力するものである。

これら接続点制御手段１１および音声符号化情報切替手段１３によって、音声符号化情報（音声ストリーム）を接続する際の概念を図１３に示す。図１３は、ＡＡＣの音声符号化情報（音声ストリーム）を時間的に重複して接続していく概念（接続の仕方）を説明した図である。図１３に示すように、音声ストリームを模式的に示すと、時間領域の音声信号にｓｉｎｅ窓（２０４８／２５６ｓａｍｐｌｅ）をかけて、ＤＣＴ変換およびハフマン符号化を行ったＡＡＣストリームを連続的に列べたストリーム列として表すことができる。図１３に示した接続の仕方では、１０２４ｓａｍｐｌｅの窓で「今日は」「は良い」「い天気です」の終端の音素と先端の音素とを接続した際の例である。

つまり、図１３に示すように、「今日は」という音声符号化情報（音声ストリーム、ここでは、ストリーム列と記載）と、「は良い」という音声符号化情報と、「い天気です」という音声符号化情報とを接続する際に、接続点制御入力信号（音声フレーム番号）に従って、「今日は」のほぼ終端のＡＡＣストリームおよび「は良い」のほぼ先端の音声フレームと、「は良い」のほぼ終端のＡＡＣストリームおよび「い天気です」のほぼ先端の音声ストリームとをそれぞれ接続点として接続する。

なお、この接続点における音声符号化情報は、周波数係数変換手段３の方に出力され、周波数係数として、ＤＣＴ領域（周波数領域）で足し合わされ、音声符号化情報変換手段７で、再量子化（再符号化）されて、音声符号化情報切替手段１３に出力される。また、接続点以外の音声符号化情報は接続点制御手段１１から音声符号化情報切替手段１３にそのまま出力される。

具体的に説明すると、各音素の両端、ここでは、「今日は［ｈａ］」の“ａ”と、「は良い［ｉ］」の“ｉ”のＡＤＴＳフレームのＤＣＴ成分に関して、スケールファクターの大きさをゲインの大きい方に合わせて再量子化を行って、両窓のストリームを、例えば、周波数係数乗算手段９で１／２倍（外部ゲイン）し、周波数係数加算手段５で足し合わせた上で、音声符号化情報変換手段７でハフマン符号化を行って、所定のビットレートでＴＳ化（音声ストリーム）して接続する。

〈音声符号化情報処理装置［第五実施形態］の動作〉
次に、図１１に示すフローチャートを参照して、図５に示した音声符号化情報処理装置１Ｄの動作について説明する（適宜、図５参照）。
まず、音声符号化情報処理装置１Ｄは、入力された音声符号化情報（音声ストリーム）群について、音声符号化情報それぞれの接続点近傍であるか否かを、接続点制御手段１１により接続点制御入力信号に従って判断する（ステップＳ４１）。音声符号化情報それぞれの接続点近傍であると判断された場合（ステップＳ４１、Ｙｅｓ）、音声符号化情報は、周波数係数変換手段３に入力され、音声符号化情報それぞれの接続点近傍であると判断されなかった場合（ステップＳ４１、Ｎｏ）、音声符号化情報は、音声符号化情報切替手段１３に入力される。

続いて、音声符号化情報処理装置１Ｄは、音声符号化情報を周波数係数変換手段３に入力すると、当該音声符号化情報を周波数係数に変換する（ステップＳ４２）。そして、音声符号化情報処理装置１Ｄは、周波数係数乗算手段９によって、周波数係数に外部ゲインを乗算する（ステップＳ４３）。

そして、音声符号化情報処理装置１Ｄは、周波数係数加算手段５によって、外部ゲインを乗算した周波数係数を加算する（ステップ４４）。そして、音声符号化情報処理装置１Ｄは、音声符号化情報変換手段７のノイズレスコーディング部７ａによって、加算した周波数係数を、ハフマン符号語にコーディング（符号化）し（ステップＳ４５）、ビットストリームマルチプレクサ部７ｂによって、ハフマン符号語を並べ替えて、ストリーム化した音声符号化情報（音声ストリーム）に変換して出力する（ステップＳ４６）。

その後、音声符号化情報処理装置１Ｄは、音声符号化情報切替手段１３によって、接続点制御手段１１から入力された音声符号化情報と、音声符号化情報変換手段７によって変換された音声符号化情報とを切り替えて出力する（ステップＳ４７）。

この音声符号化情報処理装置１Ｄによれば、接続点制御手段１１によって、接続点制御入力信号に従って、音声符号化情報群に含まれている各音声符号化情報の接続する箇所を示す接続点近傍で当該音声符号化情報が接続され、接続された音声符号化情報と、接続されなかった音声符号化情報とが、音声符号化情報切替手段１３によって切り替えられて出力される。このため、接続点近傍での異音の発生を抑制することができると共に、接続点近傍以外での計算量を大きく削減し、接続点近傍以外での音の音質劣化を抑制することができる。

〈音声符号化情報処理装置［第六実施形態］の構成〉
図６は、音声符号化情報処理装置（第六実施形態）のブロック図である。
この図６に示すように、音声符号化情報処理装置１Ｅは、複数の音声符号化情報（音声ストリーム）が入力され、これらの音声符号化情報を任意の接続点で接続させると共に、接続させた音声符号化情報を、周波数領域で外部ゲインを乗算してから加算処理する際に、量子化精度を制御しながら行うもので、接続点制御手段１１と、周波数係数変換手段３と、周波数係数乗算手段９と、周波数係数加算手段５Ａと、音声符号化情報変換手段７Ａと、音声符号化情報切替手段１３とを備えている。図２、図５に示した音声符号化情報処理装置１Ａ、１Ｄの構成と同じ構成については、同一の符号を付して、その説明を省略する。

この音声符号化情報処理装置１Ｅによれば、接続点制御手段１１によって、接続点制御入力信号に従って、音声符号化情報群に含まれている各音声符号化情報の接続する箇所を示す接続点近傍で当該音声符号化情報が接続され、接続された音声符号化情報と、接続されなかった音声符号化情報とが、音声符号化情報切替手段１３によって切り替えられて出力される。このため、接続点近傍での異音の発生を抑制することができると共に、接続点近傍以外での計算量を大きく削減し、接続点近傍以外での音の音質劣化を抑制することができる。また、音声符号化情報が接続される際に量子化精度が制御されつつ行われるので、計算量を減少させることができる。

〈音声符号化情報処理装置［第六実施形態］の動作〉
次に、図１２に示すフローチャートを参照して、図６に示した音声符号化情報処理装置１Ｅの動作について説明する（適宜、図６参照）。
まず、音声符号化情報処理装置１Ｅは、入力された音声符号化情報（音声ストリーム）群について、音声符号化情報それぞれの接続点近傍であるか否かを、接続点制御手段１１により接続点制御入力信号に従って判断する（ステップＳ５１）。音声符号化情報それぞれの接続点近傍であると判断された場合（ステップＳ５１、Ｙｅｓ）、音声符号化情報は、周波数係数変換手段３に入力され、音声符号化情報それぞれの接続点近傍であると判断されなかった場合（ステップＳ５１、Ｎｏ）、音声符号化情報は、音声符号化情報切替手段１３に入力される。

続いて、音声符号化情報処理装置１Ｅは、音声符号化情報を周波数係数変換手段３に入力すると、当該音声符号化情報を周波数係数に変換する（ステップＳ５２）。そして、音声符号化情報処理装置１Ｅは、周波数係数乗算手段９によって、周波数係数に外部ゲインを乗算する（ステップＳ５３）。

そして、音声符号化情報処理装置１Ｅは、周波数係数加算手段５Ａによって、量子化精度を制御しつつ、外部ゲインを乗算した周波数係数を加算する（ステップ５４）。そして、音声符号化情報処理装置１Ｅは、音声符号化情報変換手段７Ａのの量子化部７ｃによって、加算した周波数係数を量子化値に変換する（ステップＳ５５）。そして、音声符号化情報処理装置１Ｅは、音声符号化情報変換手段７Ａのノイズレスコーディング部７ａによって、量子化値をハフマン符号語にコーディング（符号化）し（ステップＳ５６）、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であるか否かを判断する（ステップＳ５７）。

ここで、音声符号化情報処理装置１Ｅは、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であると判断しなかった場合（ステップＳ５７、Ｎｏ）、ビットレートが所定の値以下になるように制御し（ステップＳ５８）、さらに、ステップＳ５６に戻り、再度、量子化値をハフマン符号語に変換する。

また、音声符号化情報処理装置１Ｅは、レート歪みコントローラ部７ｄによって、ビットレートが所定の値以下であると判断した場合（ステップＳ５７、Ｙｅｓ）、音声符号化情報変換手段７Ａのビットストリームマルチプレクサ部７ｂによって、ハフマン符号語を並べ替えて、ストリーム化した音声符号化情報（音声ストリーム）に変換して出力する（ステップＳ５９）

その後、音声符号化情報処理装置１Ｅは、音声符号化情報切替手段１３によって、接続点制御手段１１から入力された音声符号化情報と、音声符号化情報変換手段７Ａによって変換された音声符号化情報とを切り替えて出力する（ステップＳ６０）。

以上、本発明の実施形態について説明したが、本発明は前記実施形態には限定されない。例えば、本実施形態では、音声符号化情報処理装置１〜１Ｅとして説明したが、各装置１〜１Ｅの各構成の処理を一つずつの情報の処理過程ととらえた音声符号化情報処理方法とみなすことや、各装置１〜１Ｅの各構成の処理を汎用的または専用的なコンピュータ言語で記述して音声符号化情報処理プログラムとみなすことができる。これらの場合、音声符号化情報処理装置１〜１Ｅそれぞれと同様の効果が得られる。

本発明の実施形態に係る音声符号化情報処理装置（第一実施形態）のブロック図である。本発明の実施形態に係る音声符号化情報処理装置（第二実施形態）のブロック図である。本発明の実施形態に係る音声符号化情報処理装置（第三実施形態）のブロック図である。本発明の実施形態に係る音声符号化情報処理装置（第四実施形態）のブロック図である。本発明の実施形態に係る音声符号化情報処理装置（第五実施形態）のブロック図である。本発明の実施形態に係る音声符号化情報処理装置（第六実施形態）のブロック図である。図１に示した音声符号化情報処理装置（第一実施形態）の動作を説明するフローチャートである。図２に示した音声符号化情報処理装置（第二実施形態）の動作を説明するフローチャートである。図３に示した音声符号化情報処理装置（第三実施形態）の動作を説明するフローチャートである。図４に示した音声符号化情報処理装置（第四実施形態）の動作を説明するフローチャートである。図５に示した音声符号化情報処理装置（第五実施形態）の動作を説明するフローチャートである。図６に示した音声符号化情報処理装置（第六実施形態）の動作を説明するフローチャートである。ＡＡＣの音声符号化情報（音声ストリーム）を時間的に重複して接続していく概念（接続の仕方）を説明した図である。ＤＣＴ係数のバンド分けを例示した図である。ハフマンコードブックを例示した図である。

符号の説明

１、１Ａ、１Ｂ、１Ｃ、１Ｄ、１Ｅ音声符号化情報処理装置
３周波数係数変換手段
５、５Ａ周波数係数加算手段
５ａ量子化精度制御部（量子化精度制御手段）
７、７Ａ音声符号化情報変換手段
９、９Ｃ周波数係数乗算手段（ゲイン乗算手段）
１１接続点制御手段
１３音声符号化情報切替手段

Claims

音声を符号化した音声符号化情報が複数集まってなる音声符号化情報群を周波数係数に変換して加算した後、前記音声符号化情報に変換する音声符号化情報処理装置であって、
入力された前記音声符号化情報群を周波数係数に変換する周波数係数変換手段と、
この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算するゲイン乗算手段と、
このゲイン乗算手段から出力された周波数係数を加算する周波数係数加算手段と、
この周波数係数加算手段によって加算された周波数係数を音声符号化情報に変換する音声符号化情報変換手段と、を備え、
前記ゲイン乗算手段は、前記音声符号化情報のそれぞれに予め含まれている量子化精度情報を変更することで、前記ゲインを乗算する際の計算量を削減し、
前記周波数係数加算手段は、前記周波数係数を加算する際に、前記周波数係数の量子化精度を制御する量子化精度制御手段を備え、
前記量子化精度制御手段は、２つの前記音声符号化情報のそれぞれに予め含まれているスケールファクター値の差分にゲインと前記２つの前記音声符号化情報のうちの一方を変換した前記周波数係数とを乗じた値に、前記２つの前記音声符号化情報のうちの他方を変換した前記周波数係数を加えて量子化値を算出することで、前記量子化精度の計算量を削減することを特徴とする音声符号化情報処理装置。
前記音声符号化情報それぞれの接続する箇所を示す接続点近傍で、当該音声符号化情報を接続する接続点制御手段と、
この接続点制御手段で制御された接続点近傍で接続された音声符号化情報を、切り替えて出力する音声符号化情報切替手段と、
を備えることを特徴とする請求項１に記載の音声符号化情報処理装置。
音声を符号化した音声符号化情報が複数集まってなる音声符号化情報群を周波数係数に変換して加算した後、前記音声符号化情報に変換する装置を、
入力された前記音声符号化情報群を周波数係数に変換する周波数係数変換手段、
この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算するゲイン乗算手段、
このゲイン乗算手段から出力された周波数係数を加算する周波数係数加算手段、
この周波数係数加算手段によって加算された周波数係数を音声符号化情報に変換する音声符号化情報変換手段、として機能させ、
前記ゲイン乗算手段は、前記音声符号化情報のそれぞれに予め含まれている量子化精度情報を変更することで、前記ゲインを乗算する際の計算量を削減し、
前記周波数係数加算手段は、前記周波数係数を加算する際に、前記周波数係数の量子化精度を制御する量子化精度制御手段を備え、
前記量子化精度制御手段は、２つの前記音声符号化情報のそれぞれに予め含まれているスケールファクター値の差分にゲインと前記２つの前記音声符号化情報のうちの一方を変換した前記周波数係数とを乗じた値に、前記２つの前記音声符号化情報のうちの他方を変換した前記周波数係数を加えて量子化値を算出することで、前記量子化精度の計算量を削減することを特徴とする音声符号化情報処理プログラム。