JPWO2004095424A1 - 符号変換方法及び装置とプログラム並びに記録媒体 - Google Patents
符号変換方法及び装置とプログラム並びに記録媒体 Download PDFInfo
- Publication number
- JPWO2004095424A1 JPWO2004095424A1 JP2005505787A JP2005505787A JPWO2004095424A1 JP WO2004095424 A1 JPWO2004095424 A1 JP WO2004095424A1 JP 2005505787 A JP2005505787 A JP 2005505787A JP 2005505787 A JP2005505787 A JP 2005505787A JP WO2004095424 A1 JPWO2004095424 A1 JP WO2004095424A1
- Authority
- JP
- Japan
- Prior art keywords
- speech
- code
- encoding
- output
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000006243 chemical reaction Methods 0.000 title claims description 46
- 238000000605 extraction Methods 0.000 claims description 15
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
ところで、例えば、3G移動体網と有線パケット網間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題がある。これに対する解決手法として、タンデム接続が考えられている。
ここで、第5図を参照すると、第5図には、第1の音声符号化方式(方式1)を用いて音声を符号化して得た符号(第1の符号列)を、第2の方式(方式2)により復号可能な符号(第2の符号列)に変換する符号変換装置の構成の一例が示されている。タンデム接続に基づく従来の符号変換装置をより第5図を用いて具体的に説明する。なお、音声の符号化方法および復号方法に関しては、前述の非特許文献1または3GPP仕様書(3rd generation Party:Technical Specification)等に開示されている(非特許文献2:”AMR speech codec;Transcoding functions”3GPP TS 26.090 4章)。ここでは、符号列は、音声符号化復号の処理単位であるフレーム周期(例えば20msec周期)で入出力されるものとして説明する。
第5図に示された音声復号装置1Aは、入力端子3を介して入力される第1の符号列から符号化方式1に対応した第1の復号化方式により音声信号または雑音などの非音声信号を復号し、復号された信号を第1の復号信号として、音声符号化装置2Aと音声検出装置5へ出力する。
音声検出装置5は、音声復号装置1Aから出力される第1の復号信号を入力し、第1の復号信号が音声区間に相当するのか、非音声区間に相当するのかを区別し、その区別に応じた音声検出結果フラグを音声符号化装置2Aへ出力する。音声検出方法の詳細については、3GPP仕様書等が示されているので、ここでは、詳述しない(非特許文献3”AMR speech codec;Voice Activity Detector(VAD)”3GPP TS 26.094 3章)。
音声符号化装置2Aは、音声復号装置1Aから出力される第1の復号信号と音声検出装置5から出力される音声検出結果フラグとを入力する。音声検出結果フラグから第1の復号信号が音声区間に相当するのか非音声区間に相当するのか区別可能であり、音声符号化装置2Aは、この音声検出結果フラグに応じて音声信号または非音声信号を第2の符号化方法により符号化して得られる符号列を第2の符号列として出力端子4を介して出力する。以上により第5図の説明を終える。
なお、音声復号装置1Aに入力されるヘッダおよびフレームタイプ情報についても詳細が知られている(非特許文献4:”AMR speech codec;frame structure”3GPP TS 26.101 4章)。また、後述される雑音の符号化及び復号方法についても知られている(非特許文献5:”AMR speech codec;comfort noise aspects”3GPP TS 26.092 5章及び6章)。
しかしながら、上述した従来の符号変換装置は、第1の符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別するのに音声検出装置を用いているため、符号変換装置の規模が大きくなるという問題点を有している。換言すれば、第5図に示された符号変換装置に改善の可能性について、上記非特許文献1〜5は全く指摘していない。
上記課題を解決するため、本発明の一つのアスペクトに係る符号変換方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、前記第1の符号列から第1の復号化方式により第1の復号音声を生成する第1のステップと、前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する第2のステップを含む。
また、本発明に係る上記符号変換方法において、好ましくは、前記第2のステップにおいて、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する。
本発明の他のアスペクトに係る符号変換装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、前記第1の符号列から第1の復号化方式により第1の復号音声を生成する音声復号回路と、前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する音声符号化回路を含む。
また、本発明に係る上記符号変換装置において、好ましくは、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する。
本発明のさらに他のアスペクトに係る符号変換プログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列から第1の復号化方式により第1の復号音声を生成する処理と、
(b)前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する処理を実行させる。
また、本発明に係る上記符号変換プログラムにおいて、好ましくは、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する。
さらに、本発明のさらに他のアスペクトに係る記録媒体は、上記符号変換プログラムを記録保持している。
第2図は本発明に係る符号変換装置の第1の実施例の詳細な構成を示す図である。
第3図は本発明に係る符号変換装置の第1の実施例の処理手順を示す流れ図である。
第4図は本発明に係る符号変換装置の第2の実施例の構成を示す図である。
第5図は従来の符号変換装置の構成を示す図である。
音声復号装置1には、入力端子3を介して、第1の方式に準拠して、即ち、第1の方式にしたがって符号化された第1の符号列が与えられる。音声復号装置1は当該第1の符号列から第1の復号化方式により第1の復号音声を生成する。
音声符号化装置2は、第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する。
本発明に係る方法は以下のステップを有する。
ステップa:第1の符号列から第1の復号化方式により第1の復号音声を生成する。
ステップb:第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて、前記第1の復号音声を、第2の符号化方法により符号化して出力端子4を介して第2の符号列を生成する。
次に、本発明の作用効果を説明する。本発明によれば、第1の符号列に含まれるフレームタイプ情報を用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別する。このため、音声検出装置が不要となり符号変換装置の規模を縮小することができる。
更に、第1図を参照して、本発明の実施例に係る符号変換装置をより具体的に説明する。第1図に示された入力端子3、出力端子4、音声復号装置1、音声符号化装置2は、結線の仕方が一部で異なる他は、基本的に、第5図に示した要素と同じ構成とされる。第5図に示した構成との相違点は、音声検出装置5において、第1の復号信号が音声区間に相当するのか非音声区間に相当するのかを区別する代わりに、第1の符号列から得られるフレームタイプ情報を利用して該区別を行う構成としていることである。このため、本発明に係る符号変換装置では、第5図の音声検出装置5が不要となる。
音声復号装置1は、入力端子3を介して第1の符号列を受ける。当該第1の符号列は、ここでは、第1の符号方式によって符号化されているものとする。音声復号装置1は第1の符号方式に応じた方式1の復号化方式により音声信号または雑音などの非音声信号を復号し、復号された信号を、第1の復号信号として、音声符号化装置2へ出力する。一般的に、第1の符号列は、ヘッダとペイロードからなる。該ヘッダには、フレームタイプ情報が含まれており、これにより該符号列から復号される信号が音声区間に相当するのか非音声(無音や雑音)区間に相当するのか区別可能であり、音声復号装置1は、このフレームタイプ情報に応じて、音声信号または非音声信号(雑音信号)を生成する。
音声復号装置1は、フレームタイプ情報を、音声符号化装置2へ出力する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、上記特許文献4が参照できる。
ペイロードは、前記フレームタイプ情報が音声区間に相当するとき、音声信号を表すパラメータ(音声パラメータ)に対応する符号からなる。
一方、フレームタイプ情報が非音声区間に相当するときは、ペイロードは雑音信号を表すパラメータ(雑音パラメータ)に対応する符号からなるか、あるいは、ペイロードには何も含まれないか、のいずれかであることが多い。
このことから、音声区間と非音声区間とではペイロードの大きさが異なることになる。したがって、前記フレームタイプ情報の代わりに、ペイロードの大きさ、あるいは、第1の符号列の大きさを用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別することもできる。
音声符号化装置2は、音声復号装置1から出力される、第1の復号信号と、フレームタイプ情報とを入力する。第5図に示した構成における音声検出結果フラグと同様に、フレームタイプ情報から第1の復号信号が音声区間に相当するのか非音声区間に相当するのかを区別可能であり、音声符号化装置2は、このフレームタイプ情報に応じて、音声信号または雑音信号を第2の符号化方法により、符号化して得られる符号列を第2の符号列として出力端子4を介して出力する。
ここで、フレームタイプ情報における音声と非音声に対応する表現と、従来例の音声検出装置5で用いられる音声検出結果における音声と非音声に対応する表現とをあらかじめ関連付けておいてもよい。この場合、この関連付けに基づいて、音声復号装置1から出力されたフレームタイプ情報に対応する音声検出結果を音声符号化装置2は入力することになり、第5図の従来の符号変換装置を構成する音声復号装置1Aおよび音声符号化装置2Aに修正を加える必要がない。したがって、標準方式に準拠した音声復号装置1Aと音声符号化装置2Aを、そのまま、利用することができる。
次に、第2図を参照して、本実施例において、符号変換装置を構成する音声復号装置1と音声符号化装置2について詳細に説明する。音声復号装置1は、ヘッダ情報抽出回路11と、音声復号回路12と、雑音復号回路13と、第1の切替器14とを含んで構成される。
一方、音声符号化装置2は、第2の切替器21と、音声符号化回路22と、雑音符号化回路23と、ヘッダ情報付加回路24とを含んで構成される。
ヘッダ情報抽出回路11は、入力端子3を介して入力される第1の符号列からヘッダとペイロードとを分離する。この場合、当該ヘッダには、フレームタイプ情報が含まれているものとする。フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を音声復号回路12へ出力する。ここで、音声パラメータには、例えば、LP(線形予測)係数、ACB(適応コードブック)、FCB(固定コードブック)、ACBゲインおよびFCBゲインがあり、各々に対応する符号を第1のLP係数符号、第1のACB符号、第1のFCB符号、第1のゲイン符号とする。
一方、フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を雑音復号回路13へ出力する。ここで、雑音パラメータには、例えば、LP係数およびフレームエネルギーがあり、各々に対応する符号を第1のLP係数符号と第1のフレームエネルギー符号とする。
音声復号回路12は、ヘッダ情報抽出回路11から出力される第1のLP係数符号、第1のACB符号、第1のFCB符号、第1のゲイン符号を入力し、これらの符号から方式1の復号化方式により音声を復号し、復号された音声を第1の復号音声として第1の切替器14へ出力する。
雑音復号回路13は、ヘッダ情報抽出回路11から出力される第1のLP係数符号および第1のフレームエネルギー符号を入力し、これらの符号から方式1の復号化方式により雑音を復号し、復号された雑音を第1の復号雑音として第1の切替器14へ出力する。ここで、雑音の復号化方式の詳細については、例えば、上記非特許文献5の第6章が参照できる。
第1の切替器14は、ヘッダ情報抽出回路11から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声区間に対応するときは、音声復号回路1から出力される第1の復号音声を第2の切替器21へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音復号回路13から出力される第1の復号雑音を第2の切替器21へ出力する。
第2の切替器21は、ヘッダ情報抽出回路11から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声区間に対応するときは、第1の切替器14から出力される第1の復号音声を音声符号化回路22へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、第1の切替器14から出力される第1の復号雑音を雑音符号化回路23へ出力する。
音声符号化回路22は、第2の切替器21から出力される第1の復号音声を入力し、これを第2の符号化方法により符号化してLP係数符号、ACB符号、FCB符号、ゲイン符号を得る。そしてこれらの符号を第2のLP係数符号、第2のACB符号、第2のFCB符号、第2のゲイン符号として、ヘッダ情報付加回路24へ出力する。
雑音符号化回路23は、第2の切替器21から出力される第1の復号雑音を入力し、これを第2の符号化方法により符号化してLP係数符号、フレームエネルギー符号を得る。そしてこれらの符号を第2のLP係数符号、第2のフレームエネルギー符号として、ヘッダ情報付加回路24へ出力する。ここで、雑音の符号化方法の詳細については、例えば、上記非特許文献5の第5章等が参照できる。
ヘッダ情報付加回路24は、ヘッダ情報抽出回路11から出力されるフレームタイプ情報を入力し、該フレームタイプ情報が音声区間に対応するとき、音声符号化回路22から出力される第2のLP係数符号、第2のACB符号、第2のFCB符号、第2のゲイン符号をペイロードとし、これにヘッダを付加して得られる第2の符号列を出力端子4を介して出力する。一方、フレームタイプ情報が非音声区間に対応するときは、雑音符号化回路23から出力される第2のLP係数符号、第2のフレームエネルギー符号をペイロードとし、これにヘッダを付加して得られる第2の符号列を出力端子4を介して出力する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、上記非特許文献4等が参照できる。以上により第1の実施例の説明を終える。
第3図は、本発明の一実施例の符号変換方法を説明するフローチャートである。第3図と、第1図又は第2図を参照すると、本発明の一実施例の方法は以下のステップを有することが分る。
音声復号装置1は入力端子3より第1の符号列を入力する(ステップS1)。
音声復号装置1は、入力した第1の符号列から第1の復号化方式により第1の復号音声を生成する(ステップS2)。
より詳細には、音声復号装置1では、入力端子3から入力した第1の符号列からフレームタイプ情報が含まれているヘッダとペイロードとを分離し、フレームタイプ情報が音声区間に対応するとき、音声復号回路12で音声パラメータに対応する符号を第1の符号化方式に対応する第1の復号化方式により音声を復号し、復号された音声を第1の復号音声として出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を第1の符号化方式に対応する復号化方式により雑音を復号し復号された雑音を雑音復号回路13で第1の復号雑音として出力する。このように、音声復号装置1は、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するときは、前記第1の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を出力するように、第1の切替部14で切替制御する。
他方、音声符号化装置2は、第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを判別する(ステップS3)。
図示された音声符号化装置2は、音声復号装置1のヘッダ情報抽出回路11からフレームタイプ情報を受け、フレームタイプ情報から音声区間に対応するか非音声区間に対応するか判別する。
音声符号化装置2は、該判別結果に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する(ステップS4)。
フレームタイプ情報が音声区間に対応するときは、前記第1の復号音声を第2の符号化方法により音声符号化回路22で符号化して第2の符号列として出力し、他方、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を雑音符号化回路23で第2の符号化方法により符号化して第2の符号列として出力端子4を介して出力する(ステップS5)。
より詳細には、ヘッダ情報付加回路24において、フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するとき、音声復号装置1からの第1の復号音声を第2の符号化方法により符号化した第2の符号をペイロードとし、該ペイロードにヘッダを付加して得られる第2の符号列を出力端子から出力し、前記フレームタイプ情報が非音声区間に対応するときは、音声復号装置1からの第1の復号雑音を第2の符号化方法により符号化した第2の符号をペイロードとし、該ペイロードにヘッダを付加して得られる第2の符号列を出力端子4から出力する。
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御(プログラム制御方式)で実現するようにしてもよい。第4図は本発明の第2の実施例として、上記実施例の符号変換処理を、ディジタル信号処理プロセッサ等の処理装置(コンピュータ)で実現する場合の装置構成を模式的に示す図である。記録媒体36から読み出されたプログラムを実行するコンピュータ31において、第1の符号化復号装置により音声を符号化して得た第1の符号列を第2の符号化復号装置により復号可能な第2の符号列へ変換する符号変換処理を実行するにあたり、記録媒体36には、
(a)前記第1の符号列から第1の復号化方式により第1の復号音声を生成する処理と、
(b)前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する処理、
を実行させるためのプログラムが記録されている。記録媒体36から該プログラムを記録媒体読出装置35、記録媒体読出装置インタフェース34を介してメモリ33に読み出してCPU32は、当該プログラムを実行する。上記プログラムは、マスクROM等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、CD−ROM、FD、Digital Versatile Disk(DVD)、磁気テープ(MT)、可搬型HDD等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
以上本発明を上記実施例に即して説明したが、本発明は、上記実施例の構成にのみ限定されるものでなく、本発明の原理の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。例えば、本発明は第1及び第2の符号化方式は互いに異なっている場合に限らず、第1及び第2の符号化方式が同一の場合に適用して同様な効果を得ることができる。また、第1の符号列が音声信号か非音声信号かを区別する際、フレームタイプ情報及び第1の符号列の双方を用いて、区別しても良い。
発明の効果:
以上説明したように、本発明によれば、符号変換装置の規模を縮小することができる、という効果を奏する。その理由は、本発明においては、第1の符号列に含まれるフレームタイプ情報を用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別するように構成し、音声検出装置を不要としたためである。
Claims (14)
- 第1の符号化方式に準拠する第1の符号列を受け、前記第1の符号列を第2の符号化方式に準拠する第2の符号列へ変換して出力する符号変換方法において、
前記第1の符号列から第1の符号化方式に対応する第1の復号化方式により第1の復号音声を生成する第1のステップと、
前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて、前記第1の復号音声を第2の符号化方式により符号化して第2の符号列を生成する第2のステップと、
を含む、ことを特徴とする符号変換方法。 - 前記第2のステップは、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて、前記第1の復号音声が音声信号か非音声信号かを区別するステップを含むことを特徴とする請求項1記載の符号変換方法。
- 前記第1のステップは、前記第1の符号列からフレームタイプ情報が含まれているヘッダとペイロードとを分離するステップと、前記フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を第1の方式の復号化方式により音声を復号し、復号された音声を第1の復号音声として出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を第1の方式の復号化方式により雑音を復号し復号された雑音を第1の復号雑音として出力するステップとを有し、
前記第2のステップは、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するときは、前記第1の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を出力するように制御するステップ、
を含むことを特徴とする請求項1記載の符号変換方法。 - 前記第2のステップは、更に、前記フレームタイプ情報が音声区間に対応するときは、前記第1の復号音声を第2の符号化方式により符号化して第2の符号として出力するステップと、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を第2の符号化方式により符号化して第2の符号として出力するステップと、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するとき、前記第1の復号音声を第2の符号化方式により符号化した第2の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第2の符号列を出力端子から出力するステップと、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を第2の符号化方式により符号化した第2の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第2の符号列を出力端子から出力するステップ、を含むことを特徴とする請求項3記載の符号変換方法。
- 第1の符号化方式に準拠する第1の符号列を入力し、前記第1の符号列を第2の符号化方式に準拠する第2の符号列へ変換して出力する符号変換装置において、
前記第1の符号列から、前記第1の符号化方式に対応する第1の復号化方式により第1の復号音声を生成する音声復号回路と、
前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、前記区別に基づいて、前記第1の復号音声を第2の符号化方式により符号化して第2の符号列を生成する音声符号化回路と、
を含む、ことを特徴とする符号変換装置。 - 前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別することを特徴とする請求項5記載の符号変換装置。
- 前記音声復号装置は、
ヘッダ情報抽出回路と、音声復号回路と、雑音復号回路と、第1の切替器と、
を含み、
前記ヘッダ情報抽出回路は、前記第1の符号列から、フレームタイプ情報が含まれているヘッダとペイロードとを分離し、前記フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を音声復号回路へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を雑音復号回路へ出力し、
前記音声復号回路は、前記ヘッダ情報抽出回路から出力される第1の符号を受け、当該第1の符号から第1の符号化方式に対応した第1の復号化方式により音声を復号し、復号された音声を第1の復号音声として前記第1の切替器へ出力し、
前記雑音復号回路は、前記ヘッダ情報抽出回路から出力される第1の符号を受け、当該第1の符号から第1の符号化方式に対応する第1の復号化方式により雑音を復号し、復号された雑音を第1の復号雑音として前記第1の切替器へ出力し、
前記第1の切替器は、前記ヘッダ情報抽出回路から出力されるフレームタイプ情報を受け、前記フレームタイプ情報が音声区間に対応するときは、前記音声復号回路から出力される第1の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記雑音復号回路から出力される第1の復号雑音を出力する、
ことを特徴とする請求項5記載の符号変換装置。 - 前記音声符号化回路は、
第2の切替器と、音声符号化回路と、雑音符号化回路と、ヘッダ情報付加回路と、
を含み、
前記第2の切替器は、前記音声復号装置の前記ヘッダ情報抽出回路から出力されるフレームタイプ情報を受け、前記フレームタイプ情報が音声区間に対応するときは、前記第1の切替器から出力される第1の復号音声を前記音声符号化回路へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の切替器から出力される第1の復号雑音を前記雑音符号化回路へ出力し、
前記音声符号化回路は、前記第2の切替器から出力される第1の復号音声を受け、当該第1の復号音声を第2の符号化方式により符号化して第2の符号として、前記ヘッダ情報付加回路へ出力し、
前記雑音符号化回路は、前記第2の切替器から出力される第1の復号雑音を受け、当該第1の復号雑音を第2の符号化方式により符号化して第2の符号として、前記ヘッダ情報付加回路へ出力し、
前記ヘッダ情報付加回路は、前記音声復号装置の前記ヘッダ情報抽出回路から出力されるフレームタイプ情報を受け、該フレームタイプ情報が音声区間に対応するとき、前記音声符号化回路から出力される第2の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第2の符号列を出力端子を介して出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記雑音符号化回路から出力される第2の符号をペイロードとし、前記ペイロードにヘッダを付加して得られる第2の符号列を出力端子を介して出力する、
ことを特徴とする請求項7記載の符号変換装置。 - 第1の符号化方式に準拠する第1の符号列を受け、前記第1の符号列を第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成し、プログラム制御されるプロセッサ装置に、
(a)前記第1の符号列から第1の復号化方式により第1の復号音声を生成する処理と、
(b)前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方式により符号化して第2の符号列を生成する処理、
を実行させるための符号変換プログラム。 - 請求項9記載の符号変換プログラムにおいて、
前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する処理を前記処理装置に実行させる符号変換プログラム。 - 請求項9又は10に記載の前記符号変換プログラムを記録した記録媒体。
- ヘッダ及びペイロードを含み、第1の符号化方式にしたがって符号化された第1の符号列を一旦、復号した後、第2の符号化方式にしたがって符号化する符号変換方法において、前記第1の符号化列の復号の際、前記第1の符号列のヘッダ及び前記ペイロードとの少なくとも一方から、音声信号か非音声信号かの区別を行い、当該区別にしたがって、復号を行った後、前記第2の符号化方式にしたがって、符号化することを特徴とする符号変換方法。
- 請求項12において、前記第1の符号化方式と前記第2の符号化方式は互いに異なることを特徴とする符号変換方法。
- 請求項12において、前記第1の符号が方式と前記第2の符号化方式は同一であることを特徴とする符号変換方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005505787A JP4737416B2 (ja) | 2003-04-22 | 2004-04-22 | 符号変換方法及び装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003117421 | 2003-04-22 | ||
JP2003117421 | 2003-04-22 | ||
PCT/JP2004/005802 WO2004095424A1 (ja) | 2003-04-22 | 2004-04-22 | 符号変換方法及び装置とプログラム並びに記録媒体 |
JP2005505787A JP4737416B2 (ja) | 2003-04-22 | 2004-04-22 | 符号変換方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2004095424A1 true JPWO2004095424A1 (ja) | 2006-07-13 |
JP4737416B2 JP4737416B2 (ja) | 2011-08-03 |
Family
ID=33308035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005505787A Expired - Fee Related JP4737416B2 (ja) | 2003-04-22 | 2004-04-22 | 符号変換方法及び装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7747431B2 (ja) |
EP (1) | EP1617415B1 (ja) |
JP (1) | JP4737416B2 (ja) |
KR (1) | KR100749703B1 (ja) |
CN (1) | CN1774742B (ja) |
CA (1) | CA2522492A1 (ja) |
DE (1) | DE602004025688D1 (ja) |
WO (1) | WO2004095424A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004151123A (ja) * | 2002-10-23 | 2004-05-27 | Nec Corp | 符号変換方法、符号変換装置、プログラム及びその記憶媒体 |
JP4793539B2 (ja) * | 2005-03-29 | 2011-10-12 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びにその記憶媒体 |
US9953660B2 (en) * | 2014-08-19 | 2018-04-24 | Nuance Communications, Inc. | System and method for reducing tandeming effects in a communication system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62123843A (ja) * | 1985-11-25 | 1987-06-05 | Nippon Telegr & Teleph Corp <Ntt> | 通信方式 |
JPH08279811A (ja) * | 1995-04-07 | 1996-10-22 | Nec Corp | 音声データ変換装置 |
JP2000078274A (ja) * | 1998-08-18 | 2000-03-14 | Denso Corp | 可変レ―ト符号化システムのためのメッセ―ジ記録装置および可変レ―ト符号化システムにおいてサイズ縮小メッセ―ジを記録する方法 |
JP2001053869A (ja) * | 1999-08-13 | 2001-02-23 | Oki Electric Ind Co Ltd | 音声蓄積装置及び音声符号化装置 |
JP2002041091A (ja) * | 2000-07-21 | 2002-02-08 | Ntt Docomo Inc | 音声符号化信号変換装置 |
JP2003076394A (ja) * | 2001-08-31 | 2003-03-14 | Fujitsu Ltd | 音声符号変換方法及び装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61180299A (ja) | 1985-02-06 | 1986-08-12 | 日本電気株式会社 | コ−デツク変換装置 |
JP3199582B2 (ja) * | 1994-10-27 | 2001-08-20 | 松下電器産業株式会社 | ディジタル音声伝送装置 |
JPH08146997A (ja) | 1994-11-21 | 1996-06-07 | Hitachi Ltd | 符号変換装置および符号変換システム |
JP2757818B2 (ja) * | 1995-04-20 | 1998-05-25 | 日本電気株式会社 | 補助データ処理回路 |
JPH1011100A (ja) | 1996-06-19 | 1998-01-16 | Yamaha Corp | 音声発音装置 |
US5995923A (en) * | 1997-06-26 | 1999-11-30 | Nortel Networks Corporation | Method and apparatus for improving the voice quality of tandemed vocoders |
CN1239569A (zh) * | 1997-09-30 | 1999-12-22 | 西门子股份公司 | 一种编码语音信号的方法 |
US6044070A (en) * | 1997-10-15 | 2000-03-28 | Ericsson Inc. | Remote connection control using a tunneling protocol |
FI105635B (fi) * | 1998-09-01 | 2000-09-15 | Nokia Mobile Phones Ltd | Menetelmä taustakohinainformaation lähettämiseksi tietokehysmuotoisessa tiedonsiirrossa |
FI991605A (fi) | 1999-07-14 | 2001-01-15 | Nokia Networks Oy | Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti |
DE69931783T2 (de) * | 1999-10-18 | 2007-06-14 | Lucent Technologies Inc. | Verbesserung bei digitaler Kommunikationseinrichtung |
JP2002149196A (ja) | 2000-08-25 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 信号送信装置および信号送信方法 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
JP4370802B2 (ja) * | 2003-04-22 | 2009-11-25 | 富士通株式会社 | データ処理方法およびデータ処理装置 |
-
2004
- 2004-04-22 KR KR1020057019783A patent/KR100749703B1/ko not_active IP Right Cessation
- 2004-04-22 WO PCT/JP2004/005802 patent/WO2004095424A1/ja active Search and Examination
- 2004-04-22 EP EP04728951A patent/EP1617415B1/en not_active Expired - Fee Related
- 2004-04-22 CN CN2004800103356A patent/CN1774742B/zh not_active Expired - Fee Related
- 2004-04-22 CA CA002522492A patent/CA2522492A1/en not_active Abandoned
- 2004-04-22 JP JP2005505787A patent/JP4737416B2/ja not_active Expired - Fee Related
- 2004-04-22 US US10/553,700 patent/US7747431B2/en not_active Expired - Fee Related
- 2004-04-22 DE DE602004025688T patent/DE602004025688D1/de not_active Expired - Lifetime
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62123843A (ja) * | 1985-11-25 | 1987-06-05 | Nippon Telegr & Teleph Corp <Ntt> | 通信方式 |
JPH08279811A (ja) * | 1995-04-07 | 1996-10-22 | Nec Corp | 音声データ変換装置 |
JP2000078274A (ja) * | 1998-08-18 | 2000-03-14 | Denso Corp | 可変レ―ト符号化システムのためのメッセ―ジ記録装置および可変レ―ト符号化システムにおいてサイズ縮小メッセ―ジを記録する方法 |
JP2001053869A (ja) * | 1999-08-13 | 2001-02-23 | Oki Electric Ind Co Ltd | 音声蓄積装置及び音声符号化装置 |
JP2002041091A (ja) * | 2000-07-21 | 2002-02-08 | Ntt Docomo Inc | 音声符号化信号変換装置 |
JP2003076394A (ja) * | 2001-08-31 | 2003-03-14 | Fujitsu Ltd | 音声符号変換方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4737416B2 (ja) | 2011-08-03 |
US20060224389A1 (en) | 2006-10-05 |
WO2004095424A1 (ja) | 2004-11-04 |
KR100749703B1 (ko) | 2007-08-16 |
EP1617415B1 (en) | 2010-02-24 |
CN1774742A (zh) | 2006-05-17 |
KR20050122268A (ko) | 2005-12-28 |
CA2522492A1 (en) | 2004-11-04 |
EP1617415A4 (en) | 2007-04-04 |
CN1774742B (zh) | 2010-05-26 |
US7747431B2 (en) | 2010-06-29 |
EP1617415A1 (en) | 2006-01-18 |
DE602004025688D1 (de) | 2010-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4304360B2 (ja) | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 | |
TW521265B (en) | Relative pulse position in CELP vocoding | |
JP2002268696A (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP4793539B2 (ja) | 符号変換方法及び装置とプログラム並びにその記憶媒体 | |
JP4231987B2 (ja) | 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体 | |
JP3467469B2 (ja) | 音声復号装置および音声復号プログラムを記録した記録媒体 | |
JP2003280694A (ja) | 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム | |
JP4737416B2 (ja) | 符号変換方法及び装置 | |
JP4396524B2 (ja) | 符号変換方法及び装置 | |
US20050240400A1 (en) | Method and apparatus for transcoding between different speech encoding/ decoding systems and recording medium | |
JP2005532585A (ja) | オーディオコーディング | |
JP4983606B2 (ja) | 符号変換装置及びそれに用いる符号変換方法並びにそのプログラム | |
JP4238535B2 (ja) | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 | |
JP2002268700A (ja) | 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体 | |
WO2004038696A1 (ja) | 符号変換方法とそのための符号変換装置 | |
JP2004355020A (ja) | 音声符号化装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110308 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110419 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |