JP4550289B2 - Celp符号変換 - Google Patents

Celp符号変換 Download PDF

Info

Publication number
JP4550289B2
JP4550289B2 JP2000599012A JP2000599012A JP4550289B2 JP 4550289 B2 JP4550289 B2 JP 4550289B2 JP 2000599012 A JP2000599012 A JP 2000599012A JP 2000599012 A JP2000599012 A JP 2000599012A JP 4550289 B2 JP4550289 B2 JP 4550289B2
Authority
JP
Japan
Prior art keywords
input
output
format
celp format
celp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000599012A
Other languages
English (en)
Other versions
JP2002541499A (ja
JP2002541499A5 (ja
Inventor
デジャコ、アンドリュー・ピー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2002541499A publication Critical patent/JP2002541499A/ja
Publication of JP2002541499A5 publication Critical patent/JP2002541499A5/ja
Application granted granted Critical
Publication of JP4550289B2 publication Critical patent/JP4550289B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Steroid Compounds (AREA)
  • Cephalosporin Compounds (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【0001】
発明の背景
発明の分野
本発明は符号励振型線形予測(CELP)音声処理に係わる。特に、本発明はディジタル音声パケットをあるCELPフォーマットから別のCELPフォーマットへ変換することに係わる。
【0002】
関連技術
ディジタル技術による音声の伝送は、特に長距離ディジタル無線電話分野において広く行きわたってきた。これはまた復元音声の知覚的品質を保持するとともに通信路(チャンネル)で送信できる最小量の情報を決定するという関心を引き起こしてきた。音声を単に標本化してディジタル化して伝送するならば毎秒64キロビット(kbps)の程度のデータ率が通常のアナログ電話の音質を得るのに必要である。しかしながら、音声分析を用いて、適当な符号化、伝送、および受信機での再合成を行うことにより、データ率を顕著に低減することが達成できる。
【0003】
人間の音声生成モデルに関するパラメータを取り出すことにより音声を圧縮する手法を使用する装置は一般にボコーダ(vocoder)と呼ばれている。この装置は、関連するパラメータを抽出するために入力音声を分析する符号器と、伝送通信路などの通信路で受信されるパラメータを用いて音声を再合成する復号器から構成される。音声は時間ブロック、または分析サブフレームに分割され、その間にパラメータが計算される。そしてパラメータは新サブフレーム毎に更新される。
【0004】
線形予測に基づく時間領域符号器は今日用いられている最も一般的な音声符号器である。これらの手法は入力音声標本から過去の多くの(音声)標本に対する相関関係を抽出し、信号の非相関部分だけを符号化する。この手法で使用される基本的な線形予測フィルタは過去の標本の線形結合として現在の標本を予測する。この特殊な種類の符号化アルゴリズムの一例が、移動衛星会議講演集(1998年)のトーマス イー トレメイン他の論文「4.8kbps符号励振型線形予測符号器」に記述されている。
【0005】
ボコーダの機能は、音声に固有の本来ある全ての冗長度を除去することによりディジタル化音声信号を低ビット率の信号に圧縮することである。一般に音声は唇と舌のフィルタ作用に主因する短期間の冗長度と、声帯の振動による長期間の冗長度を有する。CELP符号器において、これらの操作は二つのフィルタ、すなわち短期間フォルマント・フィルタおよび長期間ピッチ・フィルタ、によりモデル化される。これらの冗長度が除去されると、残余の信号は白色ガウス雑音としてモデル化され、これもまた符号化される。
【0006】
この手法の基本原理は二つのディジタル・フィルタのパラメータを計算することである。フォルマント・フィルタと呼ばれる(またLPC(線形予測係数)フィルタとして知られる)一方のフィルタは音声波形の短期間予測を行う。ピッチ・フィルタと呼ばれる他方のフィルタは音声波形の長期間予測を行う。最後に、これらのフィルタは励振されるが、これは波形が上述の二つのフィルタを励振するときコードブック中のいくつかの任意の励振波形のいずれかの一つが原音声に最も近く近似されるかを決定することにより行われる。かくして伝送パラメータは三つの条項、(1)LPCフィルタ、(2)ピッチ・フィルタ及び(3)コードブック励振に関係する。
【0007】
ディジタル音声符号化(coding)は二つの部分に分けることができる;符号化(encoding)と復号化(decoding)で、ときには分析(analysis)と合成(synthesis)ともいう。図1は、音声をディジタル符号化、伝送および復号化するためのシステム100のブロック図である。このシステムは符号器102、通信路(チャンネル)104、および復号器106を含む。通信路(チャンネル)104は通信チャンネル、記憶媒体、等々であってもよい。符号器102はディジタル化入力音声を受信し、音声の特徴を表すパラメータを抽出し、そして通信路104に送られる源ビット・ストリームにこれらのパラメータを量子化する。復号器106は通信路104からビット・ストリームを受信し、受信ビット・ストリーム内の量子化特性を用いて出力波形を再構成する。
【0008】
今日、多くのCELP符号化のいろいろなフォーマットが使用されている。CELP符号化音声を旨く復号するために、復号器106は、信号を生成する符号器102と同じCELP符号化モデル(“フォーマット”としても引用する)を使用しなければならない。異なるCELPフォーマットを使用する通信システムが音声データを共有しなければならないときは、音声信号をあるCELP符号化フォーマットから別のフォーマットに変換することが多くの場合望ましい。
【0009】
この変換の通常の仕方は“タンデム符号化”として知られている。図2は入力CELPフォーマットから出力CELPフォーマットに変換するためのタンデム符号化システム200である。このシステムは入力CELPフォーマット復号器206と出力CELPフォーマット符号器202を含む。入力CELPフォーマット復号器206は、あるCELPフォーマット(以下、“入力”フォーマットとして引用する)を用いて符号化された音声信号(以下、“入力”信号として引用する)を受信する。復号器206は音声信号を生成するために入力信号を復号する。出力CELPフォーマット符号器202は復号された音声信号を受信し、出力CELPフォーマット(以下、“出力”フォーマットとして引用する)を用いて出力フォーマットの出力信号を生成するために符号化を行う。この手法の主なる欠陥は多数の符号器および復号器を通る音声信号が知覚できる劣化を受けることである。
【0010】
発明の概要
本発明はCELPボコーダからCELPボコーダへのパケット変換のための方法および装置である。この装置は、出力フォルマント・フィルタ係数を生成するため音声パケットの入力フォルマント・フィルタ係数を入力CELPフォーマットから出力CELPフォーマットに変換するフォルマント・パラメータ変換器と、出力ピッチおよびコードブックのパラメータを生成するために音声パケットに対応する入力ピッチおよびコードブックのパラメータを入力CELPフォーマットから出力CELPフォーマットに変換する励振パラメータ変換器を含む。フォルマント・パラメータ変換器は、入力フォルマント・フィルタ係数のモデル順序(order)を入力CELPフォーマットのモデル順序から出力CELPフォーマットのモデル順序に変換するモデル順序変換器と、入力フォルマントフィルタ係数のタイム・ベースを入力CELPフォーマットのタイム・ベースから出力CELPフォーマットのタイム・ベースに変換するタイム・ベース変換器を含む。
【0011】
この方法は、入力パケットのフォルマント・フィルタ係数を入力CELPフォーマットから出力CELPフォーマットに変換するステップと、入力音声パケットのピッチおよびコードブックのパラメータを入力CELPフォーマットから出力CELPフォーマットに変換するステップを含む。フォルマント・フィルタ係数を変換するステップは、フォルマント・フィルタ係数を入力CELPフォーマットから反射係数CELPフォーマットへ変換するステップ、反射係数のモデル順序を入力CELPフォーマットのモデル順序から出力CELPフォーマットのモデル順序に変換するステップ、そこで得られた係数を線スペクトル対(LSP)CELPフォーマットに変換するステップ、得られた係数のタイム・ベースを入力CELPフォーマットのタイム・ベースから出力CELPフォーマットのタイム・ベースへ変換するステップ、および出力フォルマント・フィルタ係数を生成するために、得られた係数をLSPフォーマットから出力CELPフォーマットに変換するステップを含む。ピッチおよびコードブックのパラメータを変換するステップは、標的信号を生成するために入力ピッチおよびコードブックのパラメータを用いて音声を合成するステップと、標的信号と出力フォルマント・フィルタ係数を用いて出力ピッチおよびコードブックのパラメータを検索するステップを含む。
【0012】
この発明の長所はタンデム符号化変換により普通生じる知覚的音声品質の劣化を除去する点である。
【0013】
本発明の特徴、目的、及び長所は、同様な参照符号が全体にわたり対応して同一である図面と関連して取られる以下に始まる詳細な記述からさらに明らかになるであろう。
【0014】
好ましい実施例の詳細な説明
本発明の好ましい実施例を以下に詳細に論じる。特別な方法(ステップ)、構成および組合わせ方を論じるものの、これは例証の目的だけに行うものであることを理解すべきである。関連する技術分野に熟達する者は他の方法(ステップ)、構成および組合わせ方が本発明の精神および範囲から逸脱することなしに利用できることを認識するものである。本発明は、衛星および地上セルラ電話システムを含め、種々の情報および通信システムにおいて利用することができる。好ましき用途では、電話サービスのCDMA無線スペクトル拡散通信システムがある。
【0015】
本発明は二つの部分に分けて記述する。最初に、CELP符号器およびCELP復号器を含めて、CELPコーデックを述べる。次に、好ましい実施例によりパケット変換器について述べる。
【0016】
好ましい実施例を述べる前に、図1の典型的なCELPシステムの装置を最初に説明する。この装置では、CELP符号器102は音声信号を符号化するために分析・合成(analysis−by−synthesis)法を用いている。この方法により、いくつかの音声パラメータは開ループ法で計算され、別の音声パラメータは試行錯誤による閉ループ様式で決定される。特に、LPC係数は一組の方程式を解くことにより決定される。そしてLPC係数はフォルマント・フィルタに加えられる。その後、残りのパラメータ(コードブック・インデックス、コードブック利得、ピッチ・ラグ、およびピッチ利得)の推測値が音声信号を合成するためにフォルマント・フィルタとともに使用される。それから合成音声信号を実際の音声信号と比較して残りのパラメータのいずれの推測値が最も正確な音声信号を合成するかを決定する。
【0017】
符号励振型線形予測(CELP)復号器
音声復号手順はデータ・パケットを開いて、受信パラメータを逆量子化(unquantizing)し、そしてこれらのパラメータから音声信号を再構成することを含む。再構成は音声パラメータを用いて生成されたコードブック・ベクトルをフィルタ処理するものである。
【0018】
図3はCELP復号器106のブロック図である。CELP復号器106は、コードブック302、コードブック利得部304、ピッチ・フィルタ306、フォルマント・フィルタ308、および後フィルタ310からなる。各々のブロックの概要目的は以下に要約する。
【0019】
LPC合成フィルタとして引用されている、フォルマント・フィルタ308は音声器官の舌、歯および唇をモデル化するものと考えることができ、音声器官フィルタリングに起因する原音声の共振周波数近くに共振周波数を有する。フォルマント・フィルタ308は以下の式のディジタル・フィルタである。
【数1】
1/A(z)=1−a−1−・・・−a−n
フォルマント・フィルタ308の係数a・・・aはフォルマント・フィルタ係数またはLPC係数として引用される。
【0020】
ピッチ・フィルタ306は、有声音では声帯から来る周期的パルス列をモデル化するものとして考えられる。有声音は、声帯と肺からの空気の外力との間の複雑な非線形相互作用により生成される。有声音の例は“low”のOと“day”のAである。無声音では、ピッチ・フィルタは基本的には入力を出力にそのまま通過させる。無声音は音声器官のどこかの先端の狭窄部を通して空気を出すことにより生成される。無声音の例は、舌と上歯の間の狭窄部により作られる“these”のTH、及び下唇と上歯の狭窄部により作られる“shuffle”のFFである。ピッチ・フィルタ306は以下の式のディジタル・フィルタである。
【数2】
1/P(z)=1/(1−bz−L)=1+bz−L+b−2L+・・・ここに、bはフィルタのピッチ利得に関連し、そしてLはフィルタのピッチ・ラグである。
【0021】
コードブック302は、無声音における騒雑音と有声音における声帯への励振をモデル化するものとして考えられる。背景雑音と無音中では、コードブック出力はランダム雑音に置き換えられる。コードブック302はコードブック・ベクトルとして参照される多数のデータ語を記憶する。コードブック・ベクトルはコード・インデックスIにしたがって選択される。選択されたコードブック・ベクトルは、コードブック利得パラメータGにしたがって利得部304により定められる。コードブック302は利得部304を含めてもよい。コードブックの出力はまたコードブック・ベクトルとして参照される。利得部304は、例えば、掛け算器として実施することができる。
【0022】
後フィルタ310は、パラメータ量子化により付加された量子化雑音とコードブック内の欠陥を整形(shape)するために使用される。この雑音は小信号エネルギを有する周波数帯では目立つが、大信号エネルギを有する周波数帯では気がつかない。この性質を利用して、後フィルタ310は知覚的には取るに足らない周波数範囲にはより多くの量子化雑音を、そして知覚的に重要な周波数範囲にはより少ない雑音を置くようにする。この後フィルタ処理は、ICASSP会誌(1987)のジェイ−エイチ チェンとエー ガーショの論文“適応的後フィルタ処理による4800bpsでの実時間ベクトルAPC音声符号化”およびICASSP会誌829−32頁(東京、日本、1987.4)のエヌ エス ジェイヤントおよびヴィ ラマモーティの論文“音声の適応的後フィルタ処理”でさらに論じられている。
【0023】
一実施例においては、ディジタル化音声の各フレームは一またはそれ以上のサブフレームを含んでいる。各サブフレームについて、一組の音声パラメータが、合成音声・(n)の一サブフレームを生成するためにCELP復号器106に印加される。音声パラメータはコードブック・インデックスI、コードブック利得G、ピッチ・ラグL、ピッチ利得b、およびフォルマント・フィルタ係数a・・・aを含む。コードブック302の一ベクトルはインデックスIにしたがって選択され、利得Gにしたがって定められ、そしてピッチ・フィルタ306およびフォルマント・フィルタ308を励振するために使用される。ピッチ・フィルタ306はピッチ利得bおよびピッチ・ラグLにしたがって、選択されたコードブック・ベクトルに作動する。フォルマント・フィルタ308は、合成音声信号・(n)を生成するためにフォルマント・フィルタ係数a・・・aにしたがってピッチ・フィルタ306により生成された信号に作動する。
【0024】
符号励振型線形予測(CELP)符号器
CELP音声符号化の手順は、合成音声信号と入力ディジタル化音声信号の間の知覚される差異を最小にする復号器の入力パラメータを決定することからなる。パラメータの各組についての選択処理は次の小節に述べる。符号化手順は、関連技術分野に熟達した者には明らかなように、パラメータを量子化しそれらを伝送のためのデータ・パケットに束ねることを含む。
【0025】
図4はCELP符号器102のブロック図である。CELP符号器102はコードブック302、コードブック利得部304、ピッチ・フィルタ306、フォルマント・フィルタ308、知覚的重み付けフィルタ410、LPC発生器412、集計器(summer)414、および最小化部416を含む。CELP符号器102は多数のフレームおよびサブフレームに分割されたディジタル音声信号s(n)を受信する。各サブフレームについて、CELP符号器102はそのサブフレームにおける音声信号を記述する一組のパラメータを生成する。これらのパラメータは量子化され、そしてCELP復号器106に送信される。CELP復号器106は、上に述べたように、音声信号を合成するためにこれらのパラメータを使用する。
【0026】
図4を参照すると、LPC係数の生成は開ループ様式で実行される。入力音声標本s(n)の各サブフレームから、LPC発生器412は関連技術分野において周知の方法によりLPC係数を計算する。これらのLPC係数はフォルマント・フィルタ308に供給される。
【0027】
ピッチ・パラメータbおよびLとコードブック・パラメータIおよびGの計算は、しかしながら、分解・合成(analysis−by−synthesis)法としてしばしば引用される、閉ループ様式で実行される。この方法によれば、音声信号・(n)を合成するために、コードブックおよびピッチのパラメータの種々の仮定の候補値がCELP符号器に印加される。各推測の合成音声信号・(n)は集計器(summer)414で入力音声信号s(n)と比較される。この比較から生じる誤差信号r(n)は最小化部416に供給される。最小化部416はコードブックおよびピッチの推測パラメータの種々の組み合わせを選択し、誤差信号r(n)を最小にする組み合わせを決定する。これらのパラメータ、およびLPC発生器412により生成されたフォルマント・フィルタ係数は量子化され、伝送のためにパケット化される。
【0028】
図4に示した実施例において、入力音声標本s(n)は、知覚的重み付けフィルタ410により重み付けされ、それにより重み付けされた音声標本が加算器414の入力を集計するために供給される。知覚的重み付けは、少ない信号パワーしかない周波数における誤差を重み付けするのに利用される。雑音が知覚的に非常に目立つのはこれらの低信号パワーの周波数である。この知覚的重み付けはさらに“可変率ボコーダ”と題する米国特許第5,414,796号で論じられており、ここで全部そのまま引用文献として組み込まれる。
【0029】
最小化部416は二段階でコードブックとピッチのパラメータの検索を行う。最初に、最小化部416はピッチ・パラメータを検索する。ピッチ検索の間はコードブックからの寄与はない(G=0)。最小化部416においてはピッチ・ラグ・パラメータLおよびピッチ利得パラメータbの全ての可能な値がピッチ・フィルタ306に入力される。最小化部416は重み付けされた入力音声と合成音声の間の誤差r(n)を最小にするLおよびbの値を選択する。
【0030】
ピッチ・ラグLとピッチ利得bが見つかると、コードブック検索が同様に実行される。そして最小化部416はコードブック・インデックスIとコードブック利得Gを生成する。コードブック・インデックスIにしたがって選択された、コードブック302からの出力値は、ピッチ・フィルタ306で用いられる一連の値を生成するためコードブック利得部304においてコードブック利得Gで乗算される。最小化部416は誤差r(n)を最小にするコードブック・インデックスIおよびコードブック利得Gを選択する。
【0031】
一実施例においては、知覚的重み付けは、知覚的重み付けフィルタ410により入力音声と、フォルマント・フィルタ308内に組み込まれた重み付け関数により合成された音声の両方に適用される。別の実施例においては、知覚的重み付けフィルタ410は加算器414の後に置くことができる。
【0032】
CELPボコーダからCELPボコーダへのパケット変換
次の記述においては、変換される音声パケットは、“入力”されるコードブックとピッチのパラメータおよび“入力”フォルマント・フィルタ係数を指定する“入力”CELPフォーマットをもつ“入力”パケットとして引用する。同様に変換の結果は、“出力”されるコードブックとピッチのパラメータおよび“出力”フォルマント・フィルタ係数を指定する“出力”CELPフォーマットをもつ“出力”パケットとして引用する。このような変換の一つの有用な用途は音声信号を交換するためにインターネットに無線電話システムを接続することである。
【0033】
図5は好ましい実施例にしたがってこの方法を示すフローチャートである。変換は三つの段階で行われる。第一段階では、ステップ502で示すように、入力音声パケットのフォルマント・フィルタ係数は入力CELPフォーマットから出力CELPフォーマットに変換される。第二段階では、ステップ504で示すように、入力音声パケットのピッチとコードブックのパラメータが入力CELPフォーマットから出力CELPフォーマットに変換される。第三段階においては、出力パラメータが出力CELP量子化器で量子化される。
【0034】
図6は好ましい実施例によるパケット変換器600を示す。パケット変換器600はフォルマント・パラメータ変換器620および励振パラメータ変換器630を含む。フォルマント・パラメータ変換器620は出力フォルマント・フィルタ係数を生成するため入力フォルマント・フィルタ係数を出力CELPフォーマットに変換する。フォルマント・パラメータ変換器620はモデル順序変換器602、タイム・ベース変換器604、およびフォルマント・フィルタ係数変換器610A、B、Cを含む。励振パラメータ変換器630は出力するピッチとコードブックのパラメータを生成するため入力されたピッチとコードブックのパラメータを出力CELPフォーマットに変換する。励振パラメータ変換器630は音声合成器606および検索器608を含む。図7、8および9は好ましい実施例にしたがってフォルマント・パラメータ変換器の動作を示すフローチャートである。
【0035】
入力音声パケットは変換器610Aにより受信される。変換器610Aは各入力音声パケットのフォルマント・フィルタ係数を入力CELPフォーマットからモデル順序変換に適したCELPフォーマットに変換する。CELPフォーマットのモデル順序はそのフォーマットで用いられるフォルマント・フィルタ係数の数を記述する。好ましい実施例においては、ステップ702に示すように、入力フォルマント・フィルタ係数は反射係数フォーマットに変換される。反射係数フォーマットのモデル順序は入力フォルマント・フィルタ係数のモデル順序と同じになるように選択される。このような変換を行う方法は関連技術分野においては周知である。もちろん、入力CELPフォーマットが反射係数フォーマットのフォルマントフィルタ係数を用いていれば、この変換は不要である。
【0036】
モデル順序変換器602は変換器610Aから反射係数を受信し、ステップ704に示すように、反射係数数のモデル順序を入力CELPフォーマットのモデル順序から出力CELPフォーマットのモデル順序に変換する。モデル順序変換器602は補間器612およびデシメータ614を含む。入力CELPフォーマットのモデル順序が出力CELPフォーマットのモデル順序より低いときは、ステップ802に示すように、補間器612は付加係数を供給する補間動作を実行する。一実施例では、付加係数はゼロに設定される。入力CELPフォーマットのモデル順序が出力CELPフォーマットのモデル順序より高いときは、ステップ804に示すように、デシメータ614は係数の数を低減するためデシメーション(1/10にする)動作を実行する。一実施例においては、不要な係数は単にゼロに置き換える。このような補間およびデシメーション動作は関連技術分野においては周知である。係数反射領域モデルにおいては、順序変換は比較的簡単であり、適当な選択ができる。勿論、入力および出力CELPフォーマットのモデル順序が同じであれば、モデル順序変換は不要である。
【0037】
フォルマント・フィルタ係数変換器610Bはモデル順序変換器602から順序補正されたフォルマント・フィルタ係数を受信し、この係数を反射係数フォーマットからタイム・ベース変換に適したCELPフォーマットに変換する。CELPフォーマットのタイム・ベースはフォルマント合成パラメータが標本化される率、即ちフォルマント合成パラメータの毎秒当たりのベクトル数を表す。好ましい実施例においては、ステップ706に示すように、反射係数は線スペクトル対(LSP)フォーマットに変換される。このような変換を行う方法は関連技術分野においては周知である。
【0038】
タイム・ベース変換器604は変換器610BからLSP係数を受信し、ステップ708に示すように、LSP係数のタイム・ベースを入力CELPフォーマットのタイム・ベースから出力CELPフォーマットのタイム・ベースに変換する。タイム・ベース変換器604は補間器622およびデシメータ624を含む。入力CELPフォーマットのタイム・ベースが出力CELPフォーマットのタイム・ベースより低い(即ち、毎秒当たり少ない標本を用いる)ときは、ステップ902に示すように、補間器622は標本数を増やすために補間動作を実行する。入力CELPフォーマットのタイム・ベースが出力CELPフォーマットのタイム・ベースより高い(即ち、毎秒当たり多い標本を用いる)ときは、ステップ904に示すように、デシメータ624は標本数を低減するためにデシメーション動作を実行する。このような補間およびデシメーション動作は関連技術分野においては周知である。勿論、入力CELPフォーマットのタイム・ベースが出力CELPフォーマットのタイム・ベースと同じであれば、モデル順序変換は不要である。
【0039】
フォルマント・フィルタ係数変換器610Cはタイム・ベース変換器604からタイム・ベース補正されたフォルマント・フィルタ係数を受信し、ステップ710に示すように、この係数を、出力フォルマント・フィルタ係数を生成するために、LSPフォーマットから出力CELPフォーマットに変換する。勿論、出力CELPフォーマットがLSPフォーマットのフォルマント・フィルタ係数を用いていれば、この変換は不要である。量子化器611は変換器610Cから出力フォルマント・フィルタ係数を受信し、ステップ712に示すように、出力フォルマント・フィルタ係数を量子化する。
【0040】
変換の第二段階においては、入力音声パケットのピッチおよびコードブックのパラメータ(また、“励振”パラメータとして引用される)は、ステップ504に示すように、入力CELPフォーマットから出力CELPフォーマットに変換される。図10は本発明の好ましい実施例にしたがって励振パラメータ変換器630の動作を示すフローチャートである。
【0041】
図6を参照すると、音声合成器606は各入力音声パケットのピッチおよびコードブックのパラメータを受信する。音声合成器606は、ステップ1002に示すように、フォルマント・パラメータ変換器620、および入力コードブックおよびピッチの励振パラメータにより生成された、出力フォルマント・フィルタ係数を用いて、“標的信号”として引用される、音声信号を生成する。そしてステップ1004において、検索器608は、上述の、CELP復号器106により用いられるものと同じ検索ルーチンを用いて出力コードブックおよびピッチのパラメータを得る。検索器608はこの出力パラメータを量子化する。
【0042】
図11は本発明の好ましい実施例にしたがって検索器608の動作を示すフローチャートである。この検索において、検索器608は、ステップ1104に示すように、候補信号を生成するためにフォルマント・パラメータ変換器620により生成された出力フォルマント・フィルタ係数と、音声合成器606および候補コードブックおよびピッチのパラメータにより生成された標的信号を使用する。検索器608は、ステップ1106に示すように、誤差信号を発生するため標的信号と候補信号を比較する。そしてステップ1108に示すように、検索器608は誤差信号を最小化するため候補コードブックおよびピッチのパラメータを変更する。誤差信号を最小化するピッチとコードブックの組み合わせは出力励振パラメータとして選択される。これらの処理方法は以下により詳細に述べる。
【0043】
図12は励振パラメータ変換器630をより詳細に示すものである。上に述べたように、励振パラメータ変換器630は音声合成器606および検索器608を含む。図12を参照すると、音声合成器606はコードブック302A、利得部304A、ピッチ・フィルタ306A、およびフォルマント・フィルタ308Aを含む。音声合成器606は、復号器106について上に述べたように、励振パラメータおよびフォルマント・フィルタ係数に基づいて音声信号を生成する。特に、音声合成器606は入力励振パラメータおよび出力フォルマント・フィルタ係数を用いて標的信号s(n)を生成する。入力コードブック・インデックスIはコードブック・ベクトルを生成するためにコードブック302Aに適用される。コードブック・ベクトルは入力コードブック利得パラメータGを用いて利得部304Aにより定められる。ピッチ・フィルタ306Aは定められたコードブック・ベクトル、および入力ピッチ利得とピッチ・ラグのパラメータbとLを用いてピッチ信号を生成する。フォルマント・フィルタ308Aはピッチ信号と、フォルマント・パラメータ変換器620により生成された出力フォルマント・フィルタ係数a01・・・a0nとを用いて標的信号sを生成する。熟練者は、入力および出力励振パラメータのタイムベースが異なってもよいが、生成された励振信号は同じタイム・ベース(一実施例によれば、毎秒8000励振標本)であることを認めるであろう。かくして、励振パラメータのタイム・ベース補間はこの処理においては本質的なものである。
【0044】
検索器608は第二の音声合成器、集計器1202、および最小化部1216を含む。第二の音声合成器はコードブック302B、利得部304B、ピッチ・フィルタ306B、およびフォルマント・フィルタ308Bを含む。第二の音声合成器は、復号器106について上に述べたように、励振パラメータおよびフォルマント・フィルタ係数に基づいて音声信号を生成する。
【0045】
特に、音声合成器606は候補励振パラメータおよびフォルマント・パラメータ変換器620により生成された出力フォルマント・フィルタ係数を用いて標的信号s(n)を生成する。推定コードブック・インデックスIはコードブック・ベクトルを生成するためにコードブック302Bに適用される。コードブック・ベクトルは入力コードブック利得パラメータGを用いて利得部304Bにより定められる。ピッチ・フィルタ306Bは定められたコードブック・ベクトル、および入力ピッチ利得とピッチ・ラグのパラメータbとLを用いてピッチ信号を生成する。フォルマント・フィルタ308Bはピッチ信号と、出力フォルマント・フィルタ係数a01・・・a0nとを用いて推定信号s(n)を生成する。
【0046】
検索器608は候補および標的信号を比較して誤差信号r(n)を生成する。好ましい実施例においては、標的信号s(n)は集計器1202の和入力に与えられ、推定信号s(n)は集計器1202の差入力に与えられる。集計器1202の出力は誤差信号r(n)である。
【0047】
誤差信号r(n)は最小化部1216に供給される。最小化部1216はコードブックおよびピッチのパラメータの種々の組み合わせを選択し、CELP符号器102の最小化器416について上述したものと類似の仕方で誤差信号r(n)を最小化する組み合わせを決定する。この検索から生じるコードブックおよびピッチのパラメータは量子化され、出力CELPフォーマットにて音声パケットを生成するためにパケット変換器600のフォルマント・パラメータ変換器により生成され、そして量子化されるフォルマント・フィルタ係数とともに使用される。
【0048】
好ましい実施例の前述の記載は、この技術分野に熟達する者が本発明をなし、または利用することを可能ならしむるものである。これらの実施例に対する種々の変更はこの技術分野に熟達する者には直ちに明白であり、この中で限定されている一般原理は発明能力を用いることなく別の実施例に適用が可能である。かくして、本発明はこの中に示されている実施例に限定されるものではなく、ここに開示されている原理および新規な特徴と両立する広い範囲に合致するものである。
【図面の簡単な説明】
【図1】 音声をディジタル符号化し、伝送しおよび復号するためのシステムのブロック図である。
【図2】 入力CELPフォーマットから出力CELPフォーマットに変換するためのタンデム符号化システムのブロック図である。
【図3】 CELP復号器のブロック図である。
【図4】 CELP符号器のブロック図である。
【図5】 本発明の実施例によるCELPボコーダからCELPボコーダへのパッケット変換方法を示すフローチャートである。
【図6】 本発明の実施例によるCELPボコーダからCELPボコーダへのパッケット変換器を示す図である。
【図7】 本発明の実施例によるフォルマント・パラメータ変換器の動作を示すフローチャートである。
【図8】 本発明の実施例によるフォルマント・パラメータ変換器の動作を示すフローチャートである。
【図9】 本発明の実施例によるフォルマント・パラメータ変換器の動作を示すフローチャートである。
【図10】 本発明の実施例による励振パラメータ変換器の動作を示すフローチャートである。
【図11】 検索器の動作を示すフローチャートである。
【図12】 励振パラメータ変換器をさらに詳細に示す図である。
【符号の説明】
100…システム 102…CELP符号器 104…通信路 106…CELP復号器 200…タンデム符号化システム 202…CELPフォーマット符号器 206…CELPフォーマット復号器 302…コードブック 304…コードブック利得部 306…ピッチ・フィルタ 308…フォルマント・フィルタ 310…後フィルタ 412…LPC発生器 414…集計器 416…最小化部 600…パケット変換器 602…モデル順序変換器 604…タイム・ベース変換器 606…音声合成器 608…検索器 610A.B.C…フォルマント・フィルタ係数変換器 611…量子化器 612…補間器 614…デシメータ 620…フォルマント・パラメータ変換器 622…補間器 624…デシメータ 630…励振パラメータ変換器 1202…集計器 1216…最小化部

Claims (18)

  1. 圧縮された音声パケットをある符号励振型線形予測(CELP)フォーマットから別の符号励振型線形予測フォーマットに変換する装置であって、
    出力フォルマント・フィルタ係数を生成するために、入力CELPフォーマットを有し、音声パケットに対応する入力フォルマント・フィルタ係数を出力CELPフォーマットに変換するフォルマント・パラメータ変換器;および
    出力ピッチおよびコードブックのパラメータを生成するため、入力CELPフォーマットを有し、前記音声パケットに対応する入力ピッチおよびコードブックのパラメータを前記出力CELPフォーマットに変換する励振パラメータ変換器を含み、
    なお、前記フォルマント・パラメータ変換器は:
    前記入力フォルマント・フィルタ係数のモデル順序を前記入力CELPフォーマットのモデル順序から前記出力CELPフォーマットのモデル順序に変換するモデル順序変換器;および
    前記入力フォルマント・フィルタ係数のタイム・ベースを前記入力CELPフォーマットのタイム・ベースから前記出力CELPフォーマットのタイム・ベースに変換するタイム・ベース変換器を含む、
    前記励振パラメータ変換器は:
    前記入力ピッチおよびコードブックのパラメータおよび前記出力フォルマント・フィルタ係数を用いて標的信号を生成する音声合成器;および
    前記標的信号および前記出力フォルマント・フィルタ係数を用いて前記出力コードブックおよびピッチのパラメータのために検索を行う検索器を含む装置。
  2. 前記検索器が:
    推定励振パラメータおよび前記出力フォルマント・フィルタ係数を用いて推定信号を生成するさらなる音声合成器;
    前記推定信号および前記標的信号に基づいて誤差信号を生成する結合器;および
    前記誤差信号を最小化するため前記推定励振パラメータを変更する最小化部
    を含む請求項1の装置。
  3. 前記モデル順序変換器がさらに:
    第三の係数を生成するために前記音声合成器による使用に先立って前記入力フォルマント・フィルタ係数を第三のCELPフォーマットに変換するフォルマント・フィルタ係数変換器を含む請求項1の装置。
  4. 前記モデル順序変換器がさらに:
    前記入力CELPフォーマットの前記モデル順序が前記出力CELPフォーマットの前記モデル順序より小さいとき、順序補正係数を生成するため前記第三の係数を補間する補間器;および
    前記入力CELPフォーマットの前記モデル順序が前記出力CELPフォーマットの前記モデル順序より大きいとき、前記順序補正係数を生成するため第三の係数を十分の一にするデシメータを含む請求項の装置。
  5. 前記音声合成器が:
    コードブック・ベクトルを生成するため前記入力コードブック・パラメータを使用するコードブック;
    ピッチ信号を生成するため前記入力ピッチ・フィルタ・パラメータおよび前記コードブック・ベクトルを用いるピッチ・フィルタ;および
    前記標的信号を生成するため前記出力フォルマント・フィルタ係数と前記ピッチ信号を用いるフォルマント・フィルタを含む請求項1の装置。
  6. 前記推定励振パラメータが推定ピッチ・フィルタ・パラメータおよび推定コードブック・パラメータを含み、前記さらなる音声合成器が:
    さらなるコードブック・ベクトルを生成するため、前記推定コードブック・パラメータを使用するさらなるコードブック;
    さらなるピッチ信号を生成するため、前記推定ピッチ・フィルタ・パラメータおよび前記さらなるコードブック・ベクトルを用いるピッチ・フィルタ;および
    前記推定信号を生成するため、前記出力フォルマント・フィルタ係数と前記さらなるピッチ信号を用いるフォルマント・フィルタを含む請求項の装置。
  7. 前記タイム・ベース変換器による使用の前に、前記入力フォルマント・フィルタ係数を第四のCELPフォーマットに変換する第一のフォルマント・フィルタ係数変換器をさらに含む請求項の装置。
  8. 前記タイム・ベース変換器の出力を前記第四のCELPフォーマットから前記出力CELPフォーマットに変換する第二のフォルマント・フィルタ係数変換器をさらに含む請求項の装置。
  9. 前記第三のCELPフォーマットが反射係数CELPフォーマットである請求項の装置。
  10. 前記第四のCELPフォーマットが線スペクトル対CELPフォーマットである請求項の装置。
  11. 圧縮された音声パケットをある符号励振型線形予測(CELP)フォーマットから別の符号励振型線形予測フォーマットに変換する方法であって:
    (a)フォルマント・パラメータ変換器が出力フォルマント・フィルタ係数を生成するために、音声パケットに対応する入力フォルマント・フィルタ係数を入力CELPフォーマットから出力CELPフォーマットに変換し;および
    (b)励振パラメータ変換器が出力ピッチおよびコードブックのパラメータを生成するため、前記音声パケットに対応する入力ピッチおよびコードブックのパラメータを前記入力CELPフォーマットから前記出力CELPフォーマットに変換するステップを含み;ステップ(b)が:
    (i)音声合成器が標的信号を生成するため前記入力CELPフォーマット中の前記入力ピッチおよびコードブックのパラメータおよび前記出力フォルマント・フィルタ係数を用いて音声を合成し;および
    (ii)検索器が前記標的信号および前記出力フォルマント・フィルタ係数を用いて前記出力ピッチおよびコードブックのパラメータについて検索を行うことを含む方法。
  12. ステップ(a)が:
    (i)モデル順序変換器が前記入力フォルマント・フィルタ係数のモデル順序を前記入力CELPフォーマットのモデル順序から前記出力CELPフォーマットのモデル順序に変換し;および
    (ii)タイム・ベース変換器が前記入力フォルマント・フィルタ係数のタイム・ベースを前記入力CELPフォーマットのタイム・ベースから前記出力CELPフォーマットのタイム・ベースに変換するステップを含む請求項11の方法。
  13. ステップ(i)が:
    前記モデル順序変換器は、第三の係数を生成するために、前記入力フォルマント・フィルタ係数を前記入力CELPフォーマットから第三のCELPフォーマットに変換し;および
    前記モデル順序変換器は、順序補正係数を生成するために、前記第三の係数のモデル順序を前記入力CELPフォーマットのモデル順序から前記出力CELPフォーマットのモデル順序に変換するステップを含む請求項12の方法。
  14. ステップ(ii)が:
    前記タイム・ベース検索器は、第四の係数を生成するために、前記順序補正係数を第四のフォーマットに変換し;
    前記タイム・ベース検索器は、タイム・ベース補正係数を生成するために、前記第四の係数のタイム・ベースを前記入力CELPフォーマットのタイム・ベースから前記出力CELPフォーマットのタイム・ベースに変換し;および
    前記タイム・ベース検索器は、前記出力フォルマント・フィルタ係数を生成するために、前記タイム・ベース補正係数を前記第四のフォーマットから前記出力CELPフォーマットに変換するステップを含む請求項13の方法。
  15. 前記検索ステップ(ii)が:
    前記検索器は、推定コードブックおよびピッチのパラメータおよび前記出力フォルマント・フィルタ係数を用いて推定信号を生成し;
    前記検索器は、前記推定信号および前記標的信号に基づいて誤差信号を生成し;および
    前記検索器は、前記誤差信号を最小化するため前記推定コードブックおよびピッチのパラメータを変更するステップを含む請求項11の方法。
  16. ステップ(i)はさらに:
    前記モデル順序変換器内の補間器は、前記入力CELPフォーマットの前記モデル順序が前記出力CELPフォーマットの前記モデル順序より小さいとき、前記順序補正係数を生成するため前記第三の係数を補間し;および
    前記モデル順序変換器内のデシメータは、前記入力CELPフォーマットの前記モデル順序が前記出力CELPフォーマットの前記モデル順序より大きいとき、前記順序補正係数を生成するため前記第三の係数を十分の一にするステップを含む請求項14の方法。
  17. 前記モデル順序変換器の前記第三のCELPフォーマットが反射係数CELPフォーマットである請求項13の方法。
  18. 前記タイム・ベース変換器の前記第四のCELPフォーマットが線スペクトル対CELPフォーマットである請求項14の方法。
JP2000599012A 1999-02-12 2000-02-14 Celp符号変換 Expired - Fee Related JP4550289B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/249,060 1999-02-12
US09/249,060 US6260009B1 (en) 1999-02-12 1999-02-12 CELP-based to CELP-based vocoder packet translation
PCT/US2000/003855 WO2000048170A1 (en) 1999-02-12 2000-02-14 Celp transcoding

Publications (3)

Publication Number Publication Date
JP2002541499A JP2002541499A (ja) 2002-12-03
JP2002541499A5 JP2002541499A5 (ja) 2007-04-05
JP4550289B2 true JP4550289B2 (ja) 2010-09-22

Family

ID=22941896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000599012A Expired - Fee Related JP4550289B2 (ja) 1999-02-12 2000-02-14 Celp符号変換

Country Status (10)

Country Link
US (2) US6260009B1 (ja)
EP (1) EP1157375B1 (ja)
JP (1) JP4550289B2 (ja)
KR (2) KR100873836B1 (ja)
CN (1) CN1154086C (ja)
AT (1) ATE268045T1 (ja)
AU (1) AU3232600A (ja)
DE (1) DE60011051T2 (ja)
HK (1) HK1042979B (ja)
WO (1) WO2000048170A1 (ja)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US7392180B1 (en) * 1998-01-09 2008-06-24 At&T Corp. System and method of coding sound signals using sound enhancement
US7283961B2 (en) * 2000-08-09 2007-10-16 Sony Corporation High-quality speech synthesis device and method by classification and prediction processing of synthesized sound
DE60134861D1 (de) 2000-08-09 2008-08-28 Sony Corp Vorrichtung zur verarbeitung von sprachdaten und verfahren der verarbeitung
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP2002229599A (ja) * 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
US20030195745A1 (en) * 2001-04-02 2003-10-16 Zinser, Richard L. LPC-to-MELP transcoder
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US7526572B2 (en) * 2001-07-12 2009-04-28 Research In Motion Limited System and method for providing remote data access for a mobile communication device
JP4518714B2 (ja) 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
US6829579B2 (en) 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
CN100527225C (zh) * 2002-01-08 2009-08-12 迪里辛姆网络控股有限公司 基于celp的语音代码之间的代码转换方案
US6950799B2 (en) * 2002-02-19 2005-09-27 Qualcomm Inc. Speech converter utilizing preprogrammed voice profiles
CN1653521B (zh) * 2002-03-12 2010-05-26 迪里辛姆网络控股有限公司 用于音频代码转换中的自适应码本音调滞后计算的方法
AU2003217859A1 (en) * 2002-05-13 2003-12-02 Conexant Systems, Inc. Transcoding of speech in a packet network environment
JP4304360B2 (ja) 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
JP2004061646A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd Tfo機能を有する音声符号化器および方法
JP2004069963A (ja) * 2002-08-06 2004-03-04 Fujitsu Ltd 音声符号変換装置及び音声符号化装置
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
JP4438280B2 (ja) * 2002-10-31 2010-03-24 日本電気株式会社 トランスコーダ及び符号変換方法
KR100499047B1 (ko) * 2002-11-25 2005-07-04 한국전자통신연구원 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
WO2004064041A1 (en) 2003-01-09 2004-07-29 Dilithium Networks Pty Limited Method and apparatus for improved quality voice transcoding
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
KR100554164B1 (ko) * 2003-07-11 2006-02-22 학교법인연세대학교 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US20050258983A1 (en) * 2004-05-11 2005-11-24 Dilithium Holdings Pty Ltd. (An Australian Corporation) Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications
FR2880724A1 (fr) * 2005-01-11 2006-07-14 France Telecom Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
KR100703325B1 (ko) * 2005-01-14 2007-04-03 삼성전자주식회사 음성패킷 전송율 변환 장치 및 방법
KR100640468B1 (ko) * 2005-01-25 2006-10-31 삼성전자주식회사 디지털 통신 시스템에서 음성 패킷의 전송과 처리 장치 및방법
US8447592B2 (en) * 2005-09-13 2013-05-21 Nuance Communications, Inc. Methods and apparatus for formant-based voice systems
EP2276023A3 (en) 2005-11-30 2011-10-05 Telefonaktiebolaget LM Ericsson (publ) Efficient speech stream conversion
US7831420B2 (en) * 2006-04-04 2010-11-09 Qualcomm Incorporated Voice modifier for speech processing systems
WO2007124485A2 (en) * 2006-04-21 2007-11-01 Dilithium Networks Pty Ltd. Method and apparatus for audio transcoding
US7876959B2 (en) * 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
EP1903559A1 (en) * 2006-09-20 2008-03-26 Deutsche Thomson-Brandt Gmbh Method and device for transcoding audio signals
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
US10269375B2 (en) * 2016-04-22 2019-04-23 Conduent Business Services, Llc Methods and systems for classifying audio segments of an audio signal
CN111901384B (zh) * 2020-06-29 2023-10-24 成都质数斯达克科技有限公司 处理报文的系统、方法、电子设备以及可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE138073C (ja) *
JPS61180299A (ja) * 1985-02-06 1986-08-12 日本電気株式会社 コ−デツク変換装置
EP1675100A2 (en) 1991-06-11 2006-06-28 QUALCOMM Incorporated Variable rate vocoder
FR2700087B1 (fr) * 1992-12-30 1995-02-10 Alcatel Radiotelephone Procédé de positionnement adaptatif d'un codeur/décodeur de parole au sein d'une infrastructure de communication.
JPH08146997A (ja) 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
US6014622A (en) * 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US5995923A (en) 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
JP4132154B2 (ja) 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置

Also Published As

Publication number Publication date
KR20010102004A (ko) 2001-11-15
JP2002541499A (ja) 2002-12-03
WO2000048170A9 (en) 2001-09-07
KR100873836B1 (ko) 2008-12-15
KR20070086726A (ko) 2007-08-27
WO2000048170A1 (en) 2000-08-17
DE60011051T2 (de) 2005-06-02
CN1347550A (zh) 2002-05-01
HK1042979B (zh) 2005-03-24
AU3232600A (en) 2000-08-29
EP1157375A1 (en) 2001-11-28
CN1154086C (zh) 2004-06-16
US6260009B1 (en) 2001-07-10
KR100769508B1 (ko) 2007-10-23
US20010016817A1 (en) 2001-08-23
ATE268045T1 (de) 2004-06-15
HK1042979A1 (en) 2002-08-30
DE60011051D1 (de) 2004-07-01
EP1157375B1 (en) 2004-05-26

Similar Documents

Publication Publication Date Title
JP4550289B2 (ja) Celp符号変換
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
JP5373217B2 (ja) 可変レートスピーチ符号化
JP3653826B2 (ja) 音声復号化方法及び装置
JP4270866B2 (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
JP2004537739A (ja) 音声コーデックにおける擬似高帯域信号の推定方法およびシステム
JP3531780B2 (ja) 音声符号化方法および復号化方法
US20030055633A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JP3583945B2 (ja) 音声符号化方法
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP3510168B2 (ja) 音声符号化方法及び音声復号化方法
JP3232701B2 (ja) 音声符号化方法
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP2853170B2 (ja) 音声符号化復号化方式
JP3232728B2 (ja) 音声符号化方法
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
KR0156983B1 (ko) 음성 부호기
EP1212750A1 (en) Multimode vselp speech coder

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100708

R150 Certificate of patent or registration of utility model

Ref document number: 4550289

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees