JP4737416B2 - 符号変換方法及び装置 - Google Patents

符号変換方法及び装置 Download PDF

Info

Publication number
JP4737416B2
JP4737416B2 JP2005505787A JP2005505787A JP4737416B2 JP 4737416 B2 JP4737416 B2 JP 4737416B2 JP 2005505787 A JP2005505787 A JP 2005505787A JP 2005505787 A JP2005505787 A JP 2005505787A JP 4737416 B2 JP4737416 B2 JP 4737416B2
Authority
JP
Japan
Prior art keywords
speech
code
code string
encoding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005505787A
Other languages
English (en)
Other versions
JPWO2004095424A1 (ja
Inventor
淳 村島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005505787A priority Critical patent/JP4737416B2/ja
Publication of JPWO2004095424A1 publication Critical patent/JPWO2004095424A1/ja
Application granted granted Critical
Publication of JP4737416B2 publication Critical patent/JP4737416B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声信号を低ビットレートで伝送あるいは蓄積するための符号化および復号方法に関し、特に、音声を、ある方式により符号化して得た符号を他の方式により復号可能な符号に変換する符号変換方法及び装置に関する。
音声信号を中、低ビットレートで高能率に符号化する方法として、音声信号を線形予測(Linear Prediction: LP)フィルタとそれを駆動する励振信号に分離して符号化する方法が広く用いられている。その代表的な方法の一つにCode Excited Linear Prediction(CELP)が知られている(非特許文献1)。CELPは、入力音声の周波数特性を表すLP係数が設定されたLPフィルタを、入力音声のピッチ周期を表す適応コードブック(Adaptive Codebook: ACB)と、乱数やパルスから成る固定コードブック(Fixed Codebook: FCB)との和で表される励振信号により駆動することで、合成音声信号を得る手法である。前記ACB成分と前記FCB成分には各々ゲイン(ACBゲインとFCBゲイン)を乗ずる演算が行われる。
ところで、例えば、3G移動体網と有線パケット網間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題がある。これに対する解決手法として、タンデム接続が考えられている。
ここで、第5図を参照すると、第5図には、第1の音声符号化方式(方式1)を用いて音声を符号化して得た符号(第1の符号列)を、第2の方式(方式2)により復号可能な符号(第2の符号列)に変換する符号変換装置の構成の一例が示されている。タンデム接続に基づく従来の符号変換装置をより第5図を用いて具体的に説明する。なお、音声の符号化方法および復号方法に関しては、前述の非特許文献1または3GPP仕様書(3rd generation Party :Technical Specification)等に開示されている(非特許文献2)。ここでは、符号列は、音声符号化復号の処理単位であるフレーム周期(例えば20 msec周期)で入出力されるものとして説明する。
第5図に示された音声復号装置1Aは、入力端子3を介して入力される第1の符号列から符号化方式1に対応した第1の復号化方式により音声信号または雑音などの非音声信号を復号し、復号された信号を第1の復号信号として、音声符号化装置2Aと音声検出装置5へ出力する。
音声検出装置5は、音声復号装置1Aから出力される第1の復号信号を入力し、第1の復号信号が音声区間に相当するのか、非音声区間に相当するのかを区別し、その区別に応じた音声検出結果フラグを音声符号化装置2Aへ出力する。音声検出方法の詳細については、3GPP仕様書等が示されているので、ここでは、詳述しない(非特許文献3)。
音声符号化装置2Aは、音声復号装置1Aから出力される第1の復号信号と音声検出装置5から出力される音声検出結果フラグとを入力する。音声検出結果フラグから第1の復号信号が音声区間に相当するのか非音声区間に相当するのか区別可能であり、音声符号化装置2Aは、この音声検出結果フラグに応じて音声信号または非音声信号を第2の符号化方法により符号化して得られる符号列を第2の符号列として出力端子4を介して出力する。以上により第5図の説明を終える。
なお、音声復号装置1Aに入力されるヘッダおよびフレームタイプ情報についても詳細が知られている(非特許文献4)。また、後述される雑音の符号化及び復号方法についても知られている(非特許文献5)。
しかしながら、上述した従来の符号変換装置は、第1の符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別するのに音声検出装置を用いているため、符号変換装置の規模が大きくなるという問題点を有している。換言すれば、第5図に示された符号変換装置に改善の可能性について、上記非特許文献1〜5は全く指摘していない。
M. R. Schroeder and B.S Atal:"Code excited linear prediction: High quality speech at very low bit rates," Proc. of IEEE Int. Conf. on Acoust., Speech and Signal Processing, pp.937-940, 1985 "AMR speech codec; Transcoding functions" 3GPP TS 26.090 4章 "AMR speech codec; Voice Activity Detector (VAD)" 3GPP TS 26.094 3章 "AMR speech codec; frame structure" 3GPP TS 26.101 4章 "AMR speech codec; comfort noise aspects" 3GPP TS 26.092 5章及び6章
本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、装置規模を縮小できる符号変換装置及び方法並びにそのプログラムを記録した記録媒体を提供することにある。これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には明らかとなるであろう。
上記課題を解決するため、本発明の一つのアスペクトに係る符号変換方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、前記第1の符号列から第1の復号化方式により第1の復号音声を生成する第1のステップと、前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する第2のステップを含む。
また、本発明に係る上記符号変換方法において、好ましくは、前記第2のステップにおいて、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する。
本発明の他のアスペクトに係る符号変換装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、前記第1の符号列から第1の復号化方式により第1の復号音声を生成する音声復号回路と、前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する音声符号化回路を含む。
また、本発明に係る上記符号変換装置において、好ましくは、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する。
本発明のさらに他のアスペクトに係る符号変換プログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列から第1の復号化方式により第1の復号音声を生成する処理と、
(b)前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する処理を実行させる。
また、本発明に係る上記符号変換プログラムにおいて、好ましくは、前記第1の符号列に含まれるフレームタイプ情報、該符号列の大きさのいずれかを用いて前記第1の復号音声が音声信号か非音声信号かを区別する。
さらに、本発明のさらに他のアスペクトに係る記録媒体は、上記符号変換プログラムを記録保持している。
以上説明したように、本発明によれば、符号変換装置の規模を縮小することができる、という効果を奏する。その理由は、本発明においては、第1の符号列に含まれるフレームタイプ情報を用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別するように構成し、音声検出装置を不要としたためである。
以下、本発明の実施の形態について説明する。まず、本発明の装置と方法の概要と原理を説明したあと、実施例について以下に詳細に説明する。第1図は本発明に係る符号変換装置の第1の実施例の構成を示す図であり、図示された符号変換装置は、音声復号装置1と、音声符号化装置2とによって構成されており、第5図に示された音声検出装置5を備えていない。
音声復号装置1には、入力端子3を介して、第1の方式に準拠して、即ち、第1の方式にしたがって符号化された第1の符号列が与えられる。音声復号装置1は当該第1の符号列から第1の復号化方式により第1の復号音声を生成する。
音声符号化装置2は、第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号か区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する。
本発明に係る方法は以下のステップを有する。
ステップa:第1の符号列から第1の復号化方式により第1の復号音声を生成する。
ステップb:第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて、前記第1の復号音声を、第2の符号化方法により符号化して出力端子4を介して第2の符号列を生成する。
次に、本発明の作用効果を説明する。本発明によれば、第1の符号列に含まれるフレームタイプ情報を用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別する。このため、音声検出装置が不要となり符号変換装置の規模を縮小することができる。
更に、第1図を参照して、本発明の実施例に係る符号変換装置をより具体的に説明する。第1図に示された入力端子3、出力端子4、音声復号装置1、音声符号化装置2は、結線の仕方が一部で異なる他は、基本的に、第5図に示した要素と同じ構成とされる。第5図に示した構成との相違点は、音声検出装置5において、第1の復号信号が音声区間に相当するのか非音声区間に相当するのかを区別する代わりに、第1の符号列から得られるフレームタイプ情報を利用して該区別を行う構成としていることである。このため、本発明に係る符号変換装置では、第5図の音声検出装置5が不要となる。
音声復号装置1は、入力端子3を介して第1の符号列を受ける。当該第1の符号列は、ここでは、第1の符号方式によって符号化されているものとする。音声復号装置1は第1の符号方式に応じた方式1の復号化方式により音声信号または雑音などの非音声信号を復号し、復号された信号を、第1の復号信号として、音声符号化装置2へ出力する。一般的に、第1の符号列は、ヘッダとペイロードからなる。該ヘッダには、フレームタイプ情報が含まれており、これにより該符号列から復号される信号が音声区間に相当するのか非音声(無音や雑音)区間に相当するのか区別可能であり、音声復号装置1は、このフレームタイプ情報に応じて、音声信号または非音声信号(雑音信号)を生成する。
音声復号装置1は、フレームタイプ情報を、音声符号化装置2へ出力する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、上記特許文献4が参照できる。
ペイロードは、前記フレームタイプ情報が音声区間に相当するとき、音声信号を表すパラメータ(音声パラメータ)に対応する符号からなる。
一方、フレームタイプ情報が非音声区間に相当するときは、ペイロードは雑音信号を表すパラメータ(雑音パラメータ)に対応する符号からなるか、あるいは、ペイロードには何も含まれないか、のいずれかであることが多い。
このことから、音声区間と非音声区間とではペイロードの大きさが異なることになる。したがって、前記フレームタイプ情報の代わりに、ペイロードの大きさ、あるいは、第1の符号列の大きさを用いることで、該符号列から復号される信号が音声区間に相当するのか非音声区間に相当するのかを区別することもできる。
音声符号化装置2は、音声復号装置1から出力される、第1の復号信号と、フレームタイプ情報とを入力する。第5図に示した構成における音声検出結果フラグと同様に、フレームタイプ情報から第1の復号信号が音声区間に相当するのか非音声区間に相当するのかを区別可能であり、音声符号化装置2は、このフレームタイプ情報に応じて、音声信号または雑音信号を第2の符号化方法により、符号化して得られる符号列を第2の符号列として出力端子4を介して出力する。
ここで、フレームタイプ情報における音声と非音声に対応する表現と、従来例の音声検出装置5で用いられる音声検出結果における音声と非音声に対応する表現とをあらかじめ関連付けておいてもよい。この場合、この関連付けに基づいて、音声復号装置1から出力されたフレームタイプ情報に対応する音声検出結果を音声符号化装置2は入力することになり、第5図の従来の符号変換装置を構成する音声復号装置1Aおよび音声符号化装置2Aに修正を加える必要がない。したがって、標準方式に準拠した音声復号装置1Aと音声符号化装置2Aを、そのまま、利用することができる。
次に、第2図を参照して、本実施例において、符号変換装置を構成する音声復号装置1と音声符号化装置2について詳細に説明する。音声復号装置1は、ヘッダ情報抽出回路11と、音声復号回路12と、雑音復号回路13と、第1の切替器14とを含んで構成される。
一方、音声符号化装置2は、第2の切替器21と、音声符号化回路22と、雑音符号化回路23と、ヘッダ情報付加回路24とを含んで構成される。
ヘッダ情報抽出回路11は、入力端子3を介して入力される第1の符号列からヘッダとペイロードとを分離する。この場合、当該ヘッダには、フレームタイプ情報が含まれているものとする。フレームタイプ情報が音声区間に対応するとき、音声パラメータに対応する符号を音声復号回路12へ出力する。ここで、音声パラメータには、例えば、LP(線形予測)係数、ACB(適応コードブック)、FCB(固定コードブック)、ACBゲインおよびFCBゲインがあり、各々に対応する符号を第1のLP係数符号、第1のACB符号、第1のFCB符号、第1のゲイン符号とする。
一方、フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を雑音復号回路13へ出力する。ここで、雑音パラメータには、例えば、LP係数およびフレームエネルギーがあり、各々に対応する符号を第1のLP係数符号と第1のフレームエネルギー符号とする。
音声復号回路12は、ヘッダ情報抽出回路11から出力される第1のLP係数符号、第1のACB符号、第1のFCB符号、第1のゲイン符号を入力し、これらの符号から方式1の復号化方式により音声を復号し、復号された音声を第1の復号音声として第1の切替器14へ出力する。
雑音復号回路13は、ヘッダ情報抽出回路11から出力される第1のLP係数符号および第1のフレームエネルギー符号を入力し、これらの符号から方式1の復号化方式により雑音を復号し、復号された雑音を第1の復号雑音として第1の切替器14へ出力する。ここで、雑音の復号化方式の詳細については、例えば、上記非特許文献5の第6章が参照できる。
第1の切替器14は、ヘッダ情報抽出回路11から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声区間に対応するときは、音声復号回路1から出力される第1の復号音声を第2の切替器21へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音復号回路13から出力される第1の復号雑音を第2の切替器21へ出力する。
第2の切替器21は、ヘッダ情報抽出回路11から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声区間に対応するときは、第1の切替器14から出力される第1の復号音声を音声符号化回路22へ出力し、前記フレームタイプ情報が非音声区間に対応するときは、第1の切替器14から出力される第1の復号雑音を雑音符号化回路23へ出力する。
音声符号化回路22は、第2の切替器21から出力される第1の復号音声を入力し、これを第2の符号化方法により符号化してLP係数符号、ACB符号、FCB符号、ゲイン符号を得る。そしてこれらの符号を第2のLP係数符号、第2のACB符号、第2のFCB符号、第2のゲイン符号として、ヘッダ情報付加回路24へ出力する。
雑音符号化回路23は、第2の切替器21から出力される第1の復号雑音を入力し、これを第2の符号化方法により符号化してLP係数符号、フレームエネルギー符号を得る。そしてこれらの符号を第2のLP係数符号、第2のフレームエネルギー符号として、ヘッダ情報付加回路24へ出力する。ここで、雑音の符号化方法の詳細については、例えば、上記非特許文献5の第5章等が参照できる。
ヘッダ情報付加回路24は、ヘッダ情報抽出回路11から出力されるフレームタイプ情報を入力し、該フレームタイプ情報が音声区間に対応するとき、音声符号化回路22から出力される第2のLP係数符号、第2のACB符号、第2のFCB符号、第2のゲイン符号をペイロードとし、これにヘッダを付加して得られる第2の符号列を出力端子4を介して出力する。一方、フレームタイプ情報が非音声区間に対応するときは、雑音符号化回路23から出力される第2のLP係数符号、第2のフレームエネルギー符号をペイロードとし、これにヘッダを付加して得られる第2の符号列を出力端子4を介して出力する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、上記非特許文献4等が参照できる。以上により第1の実施例の説明を終える。
第3図は、本発明の一実施例の符号変換方法を説明するフローチャートである。第3図と、第1図又は第2図を参照すると、本発明の一実施例の方法は以下のステップを有することが分る。
音声復号装置1は入力端子3より第1の符号列を入力する(ステップS1)。
音声復号装置1は、入力した第1の符号列から第1の復号化方式により第1の復号音声を生成する(ステップS2)。
より詳細には、音声復号装置1では、入力端子3から入力した第1の符号列からフレームタイプ情報が含まれているヘッダとペイロードとを分離し、フレームタイプ情報が音声区間に対応するとき、音声復号回路12で音声パラメータに対応する符号を第1の符号化方式に対応する第1の復号化方式により音声を復号し、復号された音声を第1の復号音声として出力し、前記フレームタイプ情報が非音声区間に対応するときは、雑音パラメータに対応する符号を第1の符号化方式に対応する復号化方式により雑音を復号し復号された雑音を雑音復号回路13で第1の復号雑音として出力する。このように、音声復号装置1は、前記フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するときは、前記第1の復号音声を出力し、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を出力するように、第1の切替部14で切替制御する。
他方、音声符号化装置2は、第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを判別する(ステップS3)。
図示された音声符号化装置2は、音声復号装置1のヘッダ情報抽出回路11からフレームタイプ情報を受け、フレームタイプ情報から音声区間に対応するか非音声区間に対応するか判別する。
音声符号化装置2は、該判別結果に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する(ステップS4)。
フレームタイプ情報が音声区間に対応するときは、前記第1の復号音声を第2の符号化方法により音声符号化回路22で符号化して第2の符号列として出力し、他方、前記フレームタイプ情報が非音声区間に対応するときは、前記第1の復号雑音を雑音符号化回路23で第2の符号化方法により符号化して第2の符号列として出力端子4を介して出力する(ステップS5)。
より詳細には、ヘッダ情報付加回路24において、フレームタイプ情報に基づき、前記フレームタイプ情報が音声区間に対応するとき、音声復号装置1からの第1の復号音声を第2の符号化方法により符号化した第2の符号をペイロードとし、該ペイロードにヘッダを付加して得られる第2の符号列を出力端子から出力し、前記フレームタイプ情報が非音声区間に対応するときは、音声復号装置1からの第1の復号雑音を第2の符号化方法により符号化した第2の符号をペイロードとし、該ペイロードにヘッダを付加して得られる第2の符号列を出力端子4から出力する。
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御(プログラム制御方式)で実現するようにしてもよい。第4図は本発明の第2の実施例として、上記実施例の符号変換処理を、ディジタル信号処理プロセッサ等の処理装置(コンピュータ)で実現する場合の装置構成を模式的に示す図である。記録媒体36から読み出されたプログラムを実行するコンピュータ31において、第1の符号化復号装置により音声を符号化して得た第1の符号列を第2の符号化復号装置により復号可能な第2の符号列へ変換する符号変換処理を実行するにあたり、記録媒体36には、
(a)前記第1の符号列から第1の復号化方式により第1の復号音声を生成する処理と、
(b)前記第1の符号列に含まれる情報を用いて前記第1の復号音声が音声信号か非音声信号かを区別し、該区別に基づいて前記第1の復号音声を第2の符号化方法により符号化して第2の符号列を生成する処理、
を実行させるためのプログラムが記録されている。記録媒体36から該プログラムを記録媒体読出装置35、記録媒体読出装置インタフェース34を介してメモリ33に読み出してCPU32は、当該プログラムを実行する。上記プログラムは、マスクROM等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、CD-ROM、FD、Digital Versatile Disk (DVD)、磁気テープ(MT)、可搬型HDD等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
以上本発明を上記実施例に即して説明したが、本発明は、上記実施例の構成にのみ限定されるものでなく、本発明の原理の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。例えば、本発明は第1及び第2の符号化方式は互いに異なっている場合に限らず、第1及び第2の符号化方式が同一の場合に適用して同様な効果を得ることができる。また、第1の符号列が音声信号か非音声信号かを区別する際、フレームタイプ情報及び第1の符号列の双方を用いて、区別しても良い。
本発明に係る符号変換装置の第1の実施例の構成を示す図である。 本発明に係る符号変換装置の第1の実施例の詳細な構成を示す図である。 本発明に係る符号変換装置の第1の実施例の処理手順を示す流れ図である。 本発明に係る符号変換装置の第2の実施例の構成を示す図である。 従来の符号変換装置の構成を示す図である。

Claims (8)

  1. 入力信号が音声であるか非音声であるかによって それぞれの符号列の大きさが変わって出力される符号化手段で生成された第1の符号列を、前記符号化手段の処理単位であるフレーム毎に、第2の符号列へ変換して出力する符号変換方法において、
    前記第1の符号列を復号して、第1の復号信号を生成する第1のステップと、
    フレーム毎の個々の第1の符号列の大きさを用いて第1の復号信号の各フレームが音声信号か非音声信号かを区別し、該区別に基づいて、前記第1の復号信号を符号化して第2の符号列を生成する第2のステップと、
    を含む、ことを特徴とする符号変換方法。
  2. 入力信号が音声であるか非音声であるかによって それぞれの符号列の大きさが変わって出力される符号化手段で生成された第1の符号列を、前記符号化手段の処理単位であるフレーム毎に、第2の符号列へ変換して出力する符号変換装置において、
    前記第1の符号列を復号して、第1の復号信号を生成する復号回路と、
    フレーム毎の個々の第1の符号列の大きさを用いて第1の復号信号の各フレームが音声信号か非音声信号か区別し、前記区別に基づいて、前記第1の復号信号を符号化して第2の符号列を生成する符号化回路と、
    を含む、ことを特徴とする符号変換装置。
  3. 入力信号が音声であるか非音声であるかによって それぞれの符号列の大きさが変わって出力される符号化手段で生成された第1の符号列を一旦、前記符号化手段の処理単位であるフレーム毎に復号した後、符号化する符号変換方法において、
    前記第1の符号列の復号の際、フレーム毎の個々の第1の符号列の大きさを用いて、それぞれ音声信号か非音声信号かの区別を行い、当該区別にしたがって、復号を行った後、符号化して第2の符号列を生成することを特徴とする符号変換方法。
  4. 請求項1または3において、前記第1及び第2の符号列は、互いに異なる符号化方式により符号化されていることを特徴とする符号変換方法。
  5. 請求項1または3において、前記第1及び第2の符号列は、同一の符号化方式で符号化されていることを特徴とする符号変換方法。
  6. 入力信号が音声であるか非音声であるかによって それぞれの符号列の大きさが変わって出力される符号化手段で生成された第1の符号列を一旦、前記符号化手段の処理単位であるフレーム毎に復号した後、符号化する符号変換装置において、
    前記第1の符号列の復号の際、フレーム毎の個々の第1の符号列の大きさを用いてそれぞれ音声信号か非音声信号かの区別を行い、当該区別にしたがって、復号を行う復号回路と、復号した後、符号化して第2の符号列を生成する符号化回路を有することを特徴とする符号変換装置。
  7. 請求項2または6において、前記第1及び第2の符号列は、互いに異なる符号化方式により符号化されていることを特徴とする符号変換装置。
  8. 請求項2または6において、前記第1及び第2の符号列は、同一の符号化方式で符号化されていることを特徴とする符号変換装置。
JP2005505787A 2003-04-22 2004-04-22 符号変換方法及び装置 Expired - Fee Related JP4737416B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005505787A JP4737416B2 (ja) 2003-04-22 2004-04-22 符号変換方法及び装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2003117421 2003-04-22
JP2003117421 2003-04-22
JP2005505787A JP4737416B2 (ja) 2003-04-22 2004-04-22 符号変換方法及び装置
PCT/JP2004/005802 WO2004095424A1 (ja) 2003-04-22 2004-04-22 符号変換方法及び装置とプログラム並びに記録媒体

Publications (2)

Publication Number Publication Date
JPWO2004095424A1 JPWO2004095424A1 (ja) 2006-07-13
JP4737416B2 true JP4737416B2 (ja) 2011-08-03

Family

ID=33308035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005505787A Expired - Fee Related JP4737416B2 (ja) 2003-04-22 2004-04-22 符号変換方法及び装置

Country Status (8)

Country Link
US (1) US7747431B2 (ja)
EP (1) EP1617415B1 (ja)
JP (1) JP4737416B2 (ja)
KR (1) KR100749703B1 (ja)
CN (1) CN1774742B (ja)
CA (1) CA2522492A1 (ja)
DE (1) DE602004025688D1 (ja)
WO (1) WO2004095424A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
JP4793539B2 (ja) * 2005-03-29 2011-10-12 日本電気株式会社 符号変換方法及び装置とプログラム並びにその記憶媒体
US9953660B2 (en) * 2014-08-19 2018-04-24 Nuance Communications, Inc. System and method for reducing tandeming effects in a communication system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62123843A (ja) * 1985-11-25 1987-06-05 Nippon Telegr & Teleph Corp <Ntt> 通信方式
JPH08279811A (ja) * 1995-04-07 1996-10-22 Nec Corp 音声データ変換装置
JP2000078274A (ja) * 1998-08-18 2000-03-14 Denso Corp 可変レ―ト符号化システムのためのメッセ―ジ記録装置および可変レ―ト符号化システムにおいてサイズ縮小メッセ―ジを記録する方法
JP2001053869A (ja) * 1999-08-13 2001-02-23 Oki Electric Ind Co Ltd 音声蓄積装置及び音声符号化装置
JP2002041091A (ja) * 2000-07-21 2002-02-08 Ntt Docomo Inc 音声符号化信号変換装置
JP2003076394A (ja) * 2001-08-31 2003-03-14 Fujitsu Ltd 音声符号変換方法及び装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61180299A (ja) * 1985-02-06 1986-08-12 日本電気株式会社 コ−デツク変換装置
JP3199582B2 (ja) * 1994-10-27 2001-08-20 松下電器産業株式会社 ディジタル音声伝送装置
JPH08146997A (ja) 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JP2757818B2 (ja) * 1995-04-20 1998-05-25 日本電気株式会社 補助データ処理回路
JPH1011100A (ja) * 1996-06-19 1998-01-16 Yamaha Corp 音声発音装置
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
CN1239569A (zh) * 1997-09-30 1999-12-22 西门子股份公司 一种编码语音信号的方法
US6044070A (en) * 1997-10-15 2000-03-28 Ericsson Inc. Remote connection control using a tunneling protocol
FI105635B (fi) * 1998-09-01 2000-09-15 Nokia Mobile Phones Ltd Menetelmä taustakohinainformaation lähettämiseksi tietokehysmuotoisessa tiedonsiirrossa
FI991605A (fi) 1999-07-14 2001-01-15 Nokia Networks Oy Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti
EP1094446B1 (en) * 1999-10-18 2006-06-07 Lucent Technologies Inc. Voice recording with silence compression and comfort noise generation for digital communication apparatus
JP2002149196A (ja) * 2000-08-25 2002-05-24 Matsushita Electric Ind Co Ltd 信号送信装置および信号送信方法
JP2002202799A (ja) 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
JP4370802B2 (ja) * 2003-04-22 2009-11-25 富士通株式会社 データ処理方法およびデータ処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62123843A (ja) * 1985-11-25 1987-06-05 Nippon Telegr & Teleph Corp <Ntt> 通信方式
JPH08279811A (ja) * 1995-04-07 1996-10-22 Nec Corp 音声データ変換装置
JP2000078274A (ja) * 1998-08-18 2000-03-14 Denso Corp 可変レ―ト符号化システムのためのメッセ―ジ記録装置および可変レ―ト符号化システムにおいてサイズ縮小メッセ―ジを記録する方法
JP2001053869A (ja) * 1999-08-13 2001-02-23 Oki Electric Ind Co Ltd 音声蓄積装置及び音声符号化装置
JP2002041091A (ja) * 2000-07-21 2002-02-08 Ntt Docomo Inc 音声符号化信号変換装置
JP2003076394A (ja) * 2001-08-31 2003-03-14 Fujitsu Ltd 音声符号変換方法及び装置

Also Published As

Publication number Publication date
CN1774742B (zh) 2010-05-26
DE602004025688D1 (de) 2010-04-08
JPWO2004095424A1 (ja) 2006-07-13
KR20050122268A (ko) 2005-12-28
CN1774742A (zh) 2006-05-17
WO2004095424A1 (ja) 2004-11-04
EP1617415B1 (en) 2010-02-24
EP1617415A1 (en) 2006-01-18
US20060224389A1 (en) 2006-10-05
CA2522492A1 (en) 2004-11-04
US7747431B2 (en) 2010-06-29
KR100749703B1 (ko) 2007-08-16
EP1617415A4 (en) 2007-04-04

Similar Documents

Publication Publication Date Title
JP4304360B2 (ja) 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
TW521265B (en) Relative pulse position in CELP vocoding
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP4793539B2 (ja) 符号変換方法及び装置とプログラム並びにその記憶媒体
JP4231987B2 (ja) 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
JP3467469B2 (ja) 音声復号装置および音声復号プログラムを記録した記録媒体
JP4737416B2 (ja) 符号変換方法及び装置
JP4396524B2 (ja) 符号変換方法及び装置
US8762136B2 (en) System and method of speech compression using an inter frame parameter correlation
JP2005532585A (ja) オーディオコーディング
JP4238535B2 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
KR101013642B1 (ko) 부호 변환 장치 및 이에 이용되는 부호 변환 방법 및 그 프로그램이 기록되어 있는 컴퓨터 판독 가능 기록 매체
JP2002268700A (ja) 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
WO2004038696A1 (ja) 符号変換方法とそのための符号変換装置
JP2000163097A (ja) 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004355020A (ja) 音声符号化装置及びその方法
JP2000276199A (ja) 音声符号化方法及び送信装置及び受信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110308

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110419

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees