JPWO2004095424A1

JPWO2004095424A1 - 符号変換方法及び装置とプログラム並びに記録媒体

Info

Publication number: JPWO2004095424A1
Application number: JP2005505787A
Authority: JP
Inventors: 村島　淳; 淳村島
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2003-04-22
Filing date: 2004-04-22
Publication date: 2006-07-13
Anticipated expiration: 2024-04-22
Also published as: JP4737416B2; US20060224389A1; WO2004095424A1; KR100749703B1; EP1617415B1; CN1774742A; KR20050122268A; CA2522492A1; EP1617415A4; CN1774742B; US7747431B2; EP1617415A1; DE602004025688D1

Abstract

音声復号装置１は、第１の符号列から第１の復号化方式により第１の復号音声を生成し、音声符号化装置２は、第１の符号列に含まれる情報を用いて第１の復号音声が音声信号か非音声信号か区別し、該区別に基づいて第１の復号音声を第２の符号化方式により符号化して第２の符号列を生成する。これにより、音声をある方式により符号化して得た符号を、他の方式により復号可能な符号へ低演算量で変換する装置と方法を提供する。

Description

本発明は、音声信号を低ビットレートで伝送あるいは蓄積するための符号化および復号方法に関し、特に、音声を、ある方式により符号化して得た符号を他の方式により復号可能な符号に変換する符号変換方法及び装置とプログラム並びに記録媒体に関する。

音声信号を中、低ビットレートで高能率に符号化する方法として、音声信号を線形予測（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ：ＬＰ）フィルタとそれを駆動する励振信号に分離して符号化する方法が広く用いられている。その代表的な方法の一つにＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ（ＣＥＬＰ）が知られている（例えば非特許文献１参照：Ｍ．Ｒ．ＳｃｈｒｏｅｄｅｒａｎｄＢ．ＳＡｔａｌ：”Ｃｏｄｅｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ：Ｈｉｇｈｑｕａｌｉｔｙｓｐｅｅｃｈａｔｖｅｒｙｌｏｗｂｉｔｒａｔｅｓ，”Ｐｒｏｃ．ｏｆＩＥＥＥＩｎｔ．Ｃｏｎｆ．ｏｎＡｃｏｕｓｔ．，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，ｐｐ．９３７−９４０，１９８５）。ＣＥＬＰは、入力音声の周波数特性を表すＬＰ係数が設定されたＬＰフィルタを、入力音声のピッチ周期を表す適応コードブック（ＡｄａｐｔｉｖｅＣｏｄｅｂｏｏｋ：ＡＣＢ）と、乱数やパルスから成る固定コードブック（ＦｉｘｅｄＣｏｄｅｂｏｏｋ：ＦＣＢ）との和で表される励振信号により駆動することで、合成音声信号を得る手法である。前記ＡＣＢ成分と前記ＦＣＢ成分には各々ゲイン（ＡＣＢゲインとＦＣＢゲイン）を乗ずる演算が行われる。
ところで、例えば、３Ｇ移動体網と有線パケット網間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題がある。これに対する解決手法として、タンデム接続が考えられている。
ここで、第５図を参照すると、第５図には、第１の音声符号化方式（方式１）を用いて音声を符号化して得た符号（第１の符号列）を、第２の方式（方式２）により復号可能な符号（第２の符号列）に変換する符号変換装置の構成の一例が示されている。タンデム接続に基づく従来の符号変換装置をより第５図を用いて具体的に説明する。なお、音声の符号化方法および復号方法に関しては、前述の非特許文献１または３ＧＰＰ仕様書（３ｒｄｇｅｎｅｒａｔｉｏｎＰａｒｔｙ：ＴｅｃｈｎｉｃａｌＳｐｅｃｉｆｉｃａｔｉｏｎ）等に開示されている（非特許文献２：”ＡＭＲｓｐｅｅｃｈｃｏｄｅｃ；Ｔｒａｎｓｃｏｄｉｎｇｆｕｎｃｔｉｏｎｓ”３ＧＰＰＴＳ２６．０９０４章）。ここでは、符号列は、音声符号化復号の処理単位であるフレーム周期（例えば２０ｍｓｅｃ周期）で入出力されるものとして説明する。
第５図に示された音声復号装置１Ａは、入力端子３を介して入力される第１の符号列から符号化方式１に対応した第１の復号化方式により音声信号または雑音などの非音声信号を復号し、復号された信号を第１の復号信号として、音声符号化装置２Ａと音声検出装置５へ出力する。
音声検出装置５は、音声復号装置１Ａから出力される第１の復号信号を入力し、第１の復号信号が音声区間に相当するのか、非音声区間に相当するのかを区別し、その区別に応じた音声検出結果フラグを音声符号化装置２Ａへ出力する。音声検出方法の詳細については、３ＧＰＰ仕様書等が示されているので、ここでは、詳述しない（非特許文献３”ＡＭＲｓｐｅｅｃｈｃｏｄｅｃ；ＶｏｉｃｅＡｃｔｉｖｉｔｙＤｅｔｅｃｔｏｒ（ＶＡＤ）”３ＧＰＰＴＳ２６．０９４３章）。
音声符号化装置２Ａは、音声復号装置１Ａから出力される第１の復号信号と音声検出装置５から出力される音声検出結果フラグとを入力する。音声検出結果フラグから第１の復号信号が音声区間に相当するのか非音声区間に相当するのか区別可能であり、音声符号化装置２Ａは、この音声検出結果フラグに応じて音声信号または非音声信号を第２の符号化方法により符号化して得られる符号列を第２の符号列として出力端子４を介して出力する。以上により第５図の説明を終える。
なお、音声復号装置１Ａに入力されるヘッダおよびフレームタイプ情報についても詳細が知られている（非特許文献４：”ＡＭＲｓｐｅｅｃｈｃｏｄｅｃ；ｆｒａｍｅｓｔｒｕｃｔｕｒｅ”３ＧＰＰＴＳ２６．１０１４章）。また、後述される雑音の符号化及び復号方法についても知られている（非特許文献５：”ＡＭＲｓｐｅｅｃｈｃｏｄｅｃ；ｃｏｍｆｏｒｔｎｏｉｓｅａｓｐｅｃｔｓ”３ＧＰＰＴＳ２６．０９２５章及び６章）。
しかしながら、上述した従来の符号変換装置は、第１の符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別するのに音声検出装置を用いているため、符号変換装置の規模が大きくなるという問題点を有している。換言すれば、第５図に示された符号変換装置に改善の可能性について、上記非特許文献１〜５は全く指摘していない。

本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、装置規模を縮小できる符号変換装置及び方法並びにそのプログラムを記録した記録媒体を提供することにある。これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には明らかとなるであろう。
上記課題を解決するため、本発明の一つのアスペクトに係る符号変換方法は、第１の方式に準拠する第１の符号列を、第２の方式に準拠する第２の符号列へ変換する符号変換方法において、前記第１の符号列から第１の復号化方式により第１の復号音声を生成する第１のステップと、前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて前記第１の復号音声を第２の符号化方法により符号化して第２の符号列を生成する第２のステップを含む。
また、本発明に係る上記符号変換方法において、好ましくは、前記第２のステップにおいて、前記第１の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第１の復号音声が音声信号か非音声信号かを区別する。
本発明の他のアスペクトに係る符号変換装置は、第１の方式に準拠する第１の符号列を、第２の方式に準拠する第２の符号列へ変換する符号変換装置において、前記第１の符号列から第１の復号化方式により第１の復号音声を生成する音声復号回路と、前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第１の復号音声を第２の符号化方法により符号化して第２の符号列を生成する音声符号化回路を含む。
また、本発明に係る上記符号変換装置において、好ましくは、前記第１の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第１の復号音声が音声信号か非音声信号かを区別する。
本発明のさらに他のアスペクトに係る符号変換プログラムは、第１の方式に準拠する第１の符号列を、第２の方式に準拠する第２の符号列へ変換する符号変換装置を構成するコンピュータに、
（ａ）前記第１の符号列から第１の復号化方式により第１の復号音声を生成する処理と、
（ｂ）前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第１の復号音声を第２の符号化方法により符号化して第２の符号列を生成する処理を実行させる。
また、本発明に係る上記符号変換プログラムにおいて、好ましくは、前記第１の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第１の復号音声が音声信号か非音声信号かを区別する。
さらに、本発明のさらに他のアスペクトに係る記録媒体は、上記符号変換プログラムを記録保持している。

第１図は本発明に係る符号変換装置の第１の実施例の構成を示す図である。
第２図は本発明に係る符号変換装置の第１の実施例の詳細な構成を示す図である。
第３図は本発明に係る符号変換装置の第１の実施例の処理手順を示す流れ図である。
第４図は本発明に係る符号変換装置の第２の実施例の構成を示す図である。
第５図は従来の符号変換装置の構成を示す図である。

以下、本発明の実施の形態について説明する。まず、本発明の装置と方法の概要と原理を説明したあと、実施例について以下に詳細に説明する。第１図は本発明に係る符号変換装置の第１の実施例の構成を示す図であり、図示された符号変換装置は、音声復号装置１と、音声符号化装置２とによって構成されており、第５図に示された音声検出装置５を備えていない。
音声復号装置１には、入力端子３を介して、第１の方式に準拠して、即ち、第１の方式にしたがって符号化された第１の符号列が与えられる。音声復号装置１は当該第１の符号列から第１の復号化方式により第１の復号音声を生成する。
音声符号化装置２は、第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第１の復号音声を第２の符号化方法により符号化して第２の符号列を生成する。
本発明に係る方法は以下のステップを有する。
ステップａ：第１の符号列から第１の復号化方式により第１の復号音声を生成する。
ステップｂ：第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて、前記第１の復号音声を、第２の符号化方法により符号化して出力端子４を介して第２の符号列を生成する。
次に、本発明の作用効果を説明する。本発明によれば、第１の符号列に含まれるフレームタイプ情報を用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別する。このため、音声検出装置が不要となり符号変換装置の規模を縮小することができる。
更に、第１図を参照して、本発明の実施例に係る符号変換装置をより具体的に説明する。第１図に示された入力端子３、出力端子４、音声復号装置１、音声符号化装置２は、結線の仕方が一部で異なる他は、基本的に、第５図に示した要素と同じ構成とされる。第５図に示した構成との相違点は、音声検出装置５において、第１の復号信号が音声区間に相当するのか非音声区間に相当するのかを区別する代わりに、第１の符号列から得られるフレームタイプ情報を利用して該区別を行う構成としていることである。このため、本発明に係る符号変換装置では、第５図の音声検出装置５が不要となる。
音声復号装置１は、入力端子３を介して第１の符号列を受ける。当該第１の符号列は、ここでは、第１の符号方式によって符号化されているものとする。音声復号装置１は第１の符号方式に応じた方式１の復号化方式により音声信号または雑音などの非音声信号を復号し、復号された信号を、第１の復号信号として、音声符号化装置２へ出力する。一般的に、第１の符号列は、ヘッダとペイロードからなる。該ヘッダには、フレームタイプ情報が含まれており、これにより該符号列から復号される信号が音声区間に相当するのか非音声（無音や雑音）区間に相当するのか区別可能であり、音声復号装置１は、このフレームタイプ情報に応じて、音声信号または非音声信号（雑音信号）を生成する。
音声復号装置１は、フレームタイプ情報を、音声符号化装置２へ出力する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、上記特許文献４が参照できる。
ペイロードは、前記フレームタイプ情報が音声区間に相当するとき、音声信号を表すパラメータ（音声パラメータ）に対応する符号からなる。
一方、フレームタイプ情報が非音声区間に相当するときは、ペイロードは雑音信号を表すパラメータ（雑音パラメータ）に対応する符号からなるか、あるいは、ペイロードには何も含まれないか、のいずれかであることが多い。
このことから、音声区間と非音声区間とではペイロードの大きさが異なることになる。したがって、前記フレームタイプ情報の代わりに、ペイロードの大きさ、あるいは、第１の符号列の大きさを用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別することもできる。
音声符号化装置２は、音声復号装置１から出力される、第１の復号信号と、フレームタイプ情報とを入力する。第５図に示した構成における音声検出結果フラグと同様に、フレームタイプ情報から第１の復号信号が音声区間に相当するのか非音声区間に相当するのかを区別可能であり、音声符号化装置２は、このフレームタイプ情報に応じて、音声信号または雑音信号を第２の符号化方法により、符号化して得られる符号列を第２の符号列として出力端子４を介して出力する。
ここで、フレームタイプ情報における音声と非音声に対応する表現と、従来例の音声検出装置５で用いられる音声検出結果における音声と非音声に対応する表現とをあらかじめ関連付けておいてもよい。この場合、この関連付けに基づいて、音声復号装置１から出力されたフレームタイプ情報に対応する音声検出結果を音声符号化装置２は入力することになり、第５図の従来の符号変換装置を構成する音声復号装置１Ａおよび音声符号化装置２Ａに修正を加える必要がない。したがって、標準方式に準拠した音声復号装置１Ａと音声符号化装置２Ａを、そのまま、利用することができる。
次に、第２図を参照して、本実施例において、符号変換装置を構成する音声復号装置１と音声符号化装置２について詳細に説明する。音声復号装置１は、ヘッダ情報抽出回路１１と、音声復号回路１２と、雑音復号回路１３と、第１の切替器１４とを含んで構成される。
一方、音声符号化装置２は、第２の切替器２１と、音声符号化回路２２と、雑音符号化回路２３と、ヘッダ情報付加回路２４とを含んで構成される。
ヘッダ情報抽出回路１１は、入力端子３を介して入力される第１の符号列からヘッダとペイロードとを分離する。この場合、当該ヘッダには、フレームタイプ情報が含まれているものとする。フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を音声復号回路１２へ出力する。ここで、音声パラメータには、例えば、ＬＰ（線形予測）係数、ＡＣＢ（適応コードブック）、ＦＣＢ（固定コードブック）、ＡＣＢゲインおよびＦＣＢゲインがあり、各々に対応する符号を第１のＬＰ係数符号、第１のＡＣＢ符号、第１のＦＣＢ符号、第１のゲイン符号とする。
一方、フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を雑音復号回路１３へ出力する。ここで、雑音パラメータには、例えば、ＬＰ係数およびフレームエネルギーがあり、各々に対応する符号を第１のＬＰ係数符号と第１のフレームエネルギー符号とする。
音声復号回路１２は、ヘッダ情報抽出回路１１から出力される第１のＬＰ係数符号、第１のＡＣＢ符号、第１のＦＣＢ符号、第１のゲイン符号を入力し、これらの符号から方式１の復号化方式により音声を復号し、復号された音声を第１の復号音声として第１の切替器１４へ出力する。
雑音復号回路１３は、ヘッダ情報抽出回路１１から出力される第１のＬＰ係数符号および第１のフレームエネルギー符号を入力し、これらの符号から方式１の復号化方式により雑音を復号し、復号された雑音を第１の復号雑音として第１の切替器１４へ出力する。ここで、雑音の復号化方式の詳細については、例えば、上記非特許文献５の第６章が参照できる。
第１の切替器１４は、ヘッダ情報抽出回路１１から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声区間に対応するときは、音声復号回路１から出力される第１の復号音声を第２の切替器２１へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音復号回路１３から出力される第１の復号雑音を第２の切替器２１へ出力する。
第２の切替器２１は、ヘッダ情報抽出回路１１から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声区間に対応するときは、第１の切替器１４から出力される第１の復号音声を音声符号化回路２２へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、第１の切替器１４から出力される第１の復号雑音を雑音符号化回路２３へ出力する。
音声符号化回路２２は、第２の切替器２１から出力される第１の復号音声を入力し、これを第２の符号化方法により符号化してＬＰ係数符号、ＡＣＢ符号、ＦＣＢ符号、ゲイン符号を得る。そしてこれらの符号を第２のＬＰ係数符号、第２のＡＣＢ符号、第２のＦＣＢ符号、第２のゲイン符号として、ヘッダ情報付加回路２４へ出力する。
雑音符号化回路２３は、第２の切替器２１から出力される第１の復号雑音を入力し、これを第２の符号化方法により符号化してＬＰ係数符号、フレームエネルギー符号を得る。そしてこれらの符号を第２のＬＰ係数符号、第２のフレームエネルギー符号として、ヘッダ情報付加回路２４へ出力する。ここで、雑音の符号化方法の詳細については、例えば、上記非特許文献５の第５章等が参照できる。
ヘッダ情報付加回路２４は、ヘッダ情報抽出回路１１から出力されるフレームタイプ情報を入力し、該フレームタイプ情報が音声区間に対応するとき、音声符号化回路２２から出力される第２のＬＰ係数符号、第２のＡＣＢ符号、第２のＦＣＢ符号、第２のゲイン符号をペイロードとし、これにヘッダを付加して得られる第２の符号列を出力端子４を介して出力する。一方、フレームタイプ情報が非音声区間に対応するときは、雑音符号化回路２３から出力される第２のＬＰ係数符号、第２のフレームエネルギー符号をペイロードとし、これにヘッダを付加して得られる第２の符号列を出力端子４を介して出力する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、上記非特許文献４等が参照できる。以上により第１の実施例の説明を終える。
第３図は、本発明の一実施例の符号変換方法を説明するフローチャートである。第３図と、第１図又は第２図を参照すると、本発明の一実施例の方法は以下のステップを有することが分る。
音声復号装置１は入力端子３より第１の符号列を入力する（ステップＳ１）。
音声復号装置１は、入力した第１の符号列から第１の復号化方式により第１の復号音声を生成する（ステップＳ２）。
より詳細には、音声復号装置１では、入力端子３から入力した第１の符号列からフレームタイプ情報が含まれているヘッダとペイロードとを分離し、フレームタイプ情報が音声区間に対応するとき、音声復号回路１２で音声パラメータに対応する符号を第１の符号化方式に対応する第１の復号化方式により音声を復号し、復号された音声を第１の復号音声として出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を第１の符号化方式に対応する復号化方式により雑音を復号し復号された雑音を雑音復号回路１３で第１の復号雑音として出力する。このように、音声復号装置１は、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するときは、前記第１の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第１の復号雑音を出力するように、第１の切替部１４で切替制御する。
他方、音声符号化装置２は、第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号かを判別する（ステップＳ３）。
図示された音声符号化装置２は、音声復号装置１のヘッダ情報抽出回路１１からフレームタイプ情報を受け、フレームタイプ情報から音声区間に対応するか非音声区間に対応するか判別する。
音声符号化装置２は、該判別結果に基づいて前記第１の復号音声を第２の符号化方法により符号化して第２の符号列を生成する（ステップＳ４）。
フレームタイプ情報が音声区間に対応するときは、前記第１の復号音声を第２の符号化方法により音声符号化回路２２で符号化して第２の符号列として出力し、他方、前記フレームタイプ情報が非音声区間に対応するときは、前記第１の復号雑音を雑音符号化回路２３で第２の符号化方法により符号化して第２の符号列として出力端子４を介して出力する（ステップＳ５）。
より詳細には、ヘッダ情報付加回路２４において、フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するとき、音声復号装置１からの第１の復号音声を第２の符号化方法により符号化した第２の符号をペイロードとし、該ペイロードにヘッダを付加して得られる第２の符号列を出力端子から出力し、前記フレームタイプ情報が非音声区間に対応するときは、音声復号装置１からの第１の復号雑音を第２の符号化方法により符号化した第２の符号をペイロードとし、該ペイロードにヘッダを付加して得られる第２の符号列を出力端子４から出力する。
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御（プログラム制御方式）で実現するようにしてもよい。第４図は本発明の第２の実施例として、上記実施例の符号変換処理を、ディジタル信号処理プロセッサ等の処理装置（コンピュータ）で実現する場合の装置構成を模式的に示す図である。記録媒体３６から読み出されたプログラムを実行するコンピュータ３１において、第１の符号化復号装置により音声を符号化して得た第１の符号列を第２の符号化復号装置により復号可能な第２の符号列へ変換する符号変換処理を実行するにあたり、記録媒体３６には、
（ａ）前記第１の符号列から第１の復号化方式により第１の復号音声を生成する処理と、
（ｂ）前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて前記第１の復号音声を第２の符号化方法により符号化して第２の符号列を生成する処理、
を実行させるためのプログラムが記録されている。記録媒体３６から該プログラムを記録媒体読出装置３５、記録媒体読出装置インタフェース３４を介してメモリ３３に読み出してＣＰＵ３２は、当該プログラムを実行する。上記プログラムは、マスクＲＯＭ等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、ＣＤ−ＲＯＭ、ＦＤ、ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ（ＤＶＤ）、磁気テープ（ＭＴ）、可搬型ＨＤＤ等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
以上本発明を上記実施例に即して説明したが、本発明は、上記実施例の構成にのみ限定されるものでなく、本発明の原理の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。例えば、本発明は第１及び第２の符号化方式は互いに異なっている場合に限らず、第１及び第２の符号化方式が同一の場合に適用して同様な効果を得ることができる。また、第１の符号列が音声信号か非音声信号かを区別する際、フレームタイプ情報及び第１の符号列の双方を用いて、区別しても良い。
発明の効果：
以上説明したように、本発明によれば、符号変換装置の規模を縮小することができる、という効果を奏する。その理由は、本発明においては、第１の符号列に含まれるフレームタイプ情報を用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別するように構成し、音声検出装置を不要としたためである。

Claims

第１の符号化方式に準拠する第１の符号列を受け、前記第１の符号列を第２の符号化方式に準拠する第２の符号列へ変換して出力する符号変換方法において、
前記第１の符号列から第１の符号化方式に対応する第１の復号化方式により第１の復号音声を生成する第１のステップと、
前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて、前記第１の復号音声を第２の符号化方式により符号化して第２の符号列を生成する第２のステップと、
を含む、ことを特徴とする符号変換方法。
前記第２のステップは、前記第１の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて、前記第１の復号音声が音声信号か非音声信号かを区別するステップを含むことを特徴とする請求項１記載の符号変換方法。
前記第１のステップは、前記第１の符号列からフレームタイプ情報が含まれているヘッダとペイロードとを分離するステップと、前記フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を第１の方式の復号化方式により音声を復号し、復号された音声を第１の復号音声として出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を第１の方式の復号化方式により雑音を復号し復号された雑音を第１の復号雑音として出力するステップとを有し、
前記第２のステップは、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するときは、前記第１の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第１の復号雑音を出力するように制御するステップ、
を含むことを特徴とする請求項１記載の符号変換方法。
前記第２のステップは、更に、前記フレームタイプ情報が音声区間に対応するときは、前記第１の復号音声を第２の符号化方式により符号化して第２の符号として出力するステップと、前記フレームタイプ情報が非音声区間に対応するときは、前記第１の復号雑音を第２の符号化方式により符号化して第２の符号として出力するステップと、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するとき、前記第１の復号音声を第２の符号化方式により符号化した第２の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第２の符号列を出力端子から出力するステップと、前記フレームタイプ情報が非音声区間に対応するときは、前記第１の復号雑音を第２の符号化方式により符号化した第２の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第２の符号列を出力端子から出力するステップ、を含むことを特徴とする請求項３記載の符号変換方法。
第１の符号化方式に準拠する第１の符号列を入力し、前記第１の符号列を第２の符号化方式に準拠する第２の符号列へ変換して出力する符号変換装置において、
前記第１の符号列から、前記第１の符号化方式に対応する第１の復号化方式により第１の復号音声を生成する音声復号回路と、
前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号か区別し、前記区別に基づいて、前記第１の復号音声を第２の符号化方式により符号化して第２の符号列を生成する音声符号化回路と、
を含む、ことを特徴とする符号変換装置。
前記第１の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第１の復号音声が音声信号か非音声信号かを区別することを特徴とする請求項５記載の符号変換装置。
前記音声復号装置は、
ヘッダ情報抽出回路と、音声復号回路と、雑音復号回路と、第１の切替器と、
を含み、
前記ヘッダ情報抽出回路は、前記第１の符号列から、フレームタイプ情報が含まれているヘッダとペイロードとを分離し、前記フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を音声復号回路へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を雑音復号回路へ出力し、
前記音声復号回路は、前記ヘッダ情報抽出回路から出力される第１の符号を受け、当該第１の符号から第１の符号化方式に対応した第１の復号化方式により音声を復号し、復号された音声を第１の復号音声として前記第１の切替器へ出力し、
前記雑音復号回路は、前記ヘッダ情報抽出回路から出力される第１の符号を受け、当該第１の符号から第１の符号化方式に対応する第１の復号化方式により雑音を復号し、復号された雑音を第１の復号雑音として前記第１の切替器へ出力し、
前記第１の切替器は、前記ヘッダ情報抽出回路から出力されるフレームタイプ情報を受け、前記フレームタイプ情報が音声区間に対応するときは、前記音声復号回路から出力される第１の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記雑音復号回路から出力される第１の復号雑音を出力する、
ことを特徴とする請求項５記載の符号変換装置。
前記音声符号化回路は、
第２の切替器と、音声符号化回路と、雑音符号化回路と、ヘッダ情報付加回路と、
を含み、
前記第２の切替器は、前記音声復号装置の前記ヘッダ情報抽出回路から出力されるフレームタイプ情報を受け、前記フレームタイプ情報が音声区間に対応するときは、前記第１の切替器から出力される第１の復号音声を前記音声符号化回路へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第１の切替器から出力される第１の復号雑音を前記雑音符号化回路へ出力し、
前記音声符号化回路は、前記第２の切替器から出力される第１の復号音声を受け、当該第１の復号音声を第２の符号化方式により符号化して第２の符号として、前記ヘッダ情報付加回路へ出力し、
前記雑音符号化回路は、前記第２の切替器から出力される第１の復号雑音を受け、当該第１の復号雑音を第２の符号化方式により符号化して第２の符号として、前記ヘッダ情報付加回路へ出力し、
前記ヘッダ情報付加回路は、前記音声復号装置の前記ヘッダ情報抽出回路から出力されるフレームタイプ情報を受け、該フレームタイプ情報が音声区間に対応するとき、前記音声符号化回路から出力される第２の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第２の符号列を出力端子を介して出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記雑音符号化回路から出力される第２の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第２の符号列を出力端子を介して出力する、
ことを特徴とする請求項７記載の符号変換装置。
第１の符号化方式に準拠する第１の符号列を受け、前記第１の符号列を第２の方式に準拠する第２の符号列へ変換する符号変換装置を構成し、プログラム制御されるプロセッサ装置に、
（ａ）前記第１の符号列から第１の復号化方式により第１の復号音声を生成する処理と、
（ｂ）前記第１の符号列に含まれる情報を用いて前記第１の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第１の復号音声を第２の符号化方式により符号化して第２の符号列を生成する処理、
を実行させるための符号変換プログラム。
請求項９記載の符号変換プログラムにおいて、
前記第１の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第１の復号音声が音声信号か非音声信号かを区別する処理を前記処理装置に実行させる符号変換プログラム。
請求項９又は１０に記載の前記符号変換プログラムを記録した記録媒体。
ヘッダ及びペイロードを含み、第１の符号化方式にしたがって符号化された第１の符号列を一旦、復号した後、第２の符号化方式にしたがって符号化する符号変換方法において、前記第１の符号化列の復号の際、前記第１の符号列のヘッダ及び前記ペイロードとの少なくとも一方から、音声信号か非音声信号かの区別を行い、当該区別にしたがって、復号を行った後、前記第２の符号化方式にしたがって、符号化することを特徴とする符号変換方法。
請求項１２において、前記第１の符号化方式と前記第２の符号化方式は互いに異なることを特徴とする符号変換方法。
請求項１２において、前記第１の符号が方式と前記第２の符号化方式は同一であることを特徴とする符号変換方法。