JP2003044097A - 音声信号および音楽信号を符号化する方法 - Google Patents

音声信号および音楽信号を符号化する方法

Info

Publication number
JP2003044097A
JP2003044097A JP2002185213A JP2002185213A JP2003044097A JP 2003044097 A JP2003044097 A JP 2003044097A JP 2002185213 A JP2002185213 A JP 2002185213A JP 2002185213 A JP2002185213 A JP 2002185213A JP 2003044097 A JP2003044097 A JP 2003044097A
Authority
JP
Japan
Prior art keywords
signal
music
superframe
encoded
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002185213A
Other languages
English (en)
Inventor
Kazuhito Koishida
和人 小石田
Vladimir Cuperman
カッパーマン ウラジミール
Amir H Majidimehr
エイチ.マジディメア アミール
Allen Gersho
ガーショ アレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003044097A publication Critical patent/JP2003044097A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】 特に低ビットレート環境で使用するように適
合した、音声および音楽信号の両方を符号化する単純か
つ効率的なハイブリッド型の符号化アルゴリズムおよび
アーキテクチャを提供すること。 【解決手段】 本発明は、ハイブリッドコーデックで使
用するのに適した、音楽信号に効率的な変換符号化方法
を提供し、この方法では音声および音楽信号の両方に共
通の線形予測(LP)合成フィルタを用いる。LP合成
フィルタは、音声または音楽信号の符号化に応じて、そ
れぞれ音声励振ジェネレータと変換励振ジェネレータを
切り替える。音声信号の符号化には、従来のCELP技
術を使用することができ、一方、音楽信号の符号化に
は、新規の非対称重複加算変換技術を応用する。共通の
LP合成フィルタリングを行う際に、重複加算操作領域
の信号にLP係数の補間を行う。復号器が音声符号化モ
ードと音楽符号化モードを切り替えるときの滑らかな遷
移が可能になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般には信号を符
号化する方法および装置を対象とし、より詳細には音声
信号と音楽信号の両方を符号化する方法および装置を対
象とする。
【0002】
【従来の技術】本質的に音声と音楽は大きく異なる信号
によって表される。典型的なスペクトルの特徴から見る
と、声に出した音声(speech)のスペクトルは、
一般にピッチの倍音と関連する細かい周期的な構造を持
ち、倍音のピークが滑らかなスペクトル包絡線を描くの
に対して、音楽のスペクトルは通例はるかに複雑で、複
数のピッチの基本波と倍音を示す。スペクトル包絡線も
より複雑であると考えられる。この2つの信号モードの
符号化技術も非常に異なっており、音声の符号化には、
符号励振線形予測(CELP)や正弦波符号化などモデ
ルに基づく手法を主に使用し、音楽の符号化には、知覚
的なノイズマスキングと合わせて使用する変形重複変換
(Modified Lapped Transfor
mation)(MLT)などの変換符号化技術を主に
使用する。
【0003】近年、インターネットマルチメディア、T
V/ラジオ放送、テレビ会議、あるいは無線媒体といっ
たアプリケーションのために、音声信号と音楽信号の両
方を符号化することが増えている。しかし、この2種の
信号タイプ向けの符号器(coder)は、異なる技術に最
適な形で基づくものなので、音声信号と音楽信号の両方
を効率的かつ効果的に再生する汎用コーデックの生産は
容易に達成することができない。例えば、CELPのよ
うな線形予測ベースの技術は、音声信号については高品
質の再生を発揮することができるが、音楽信号の再生の
品質は受け入れがたいものである。一方、変換符号化に
基づく技術は、音楽信号には良質の再生を提供するが、
特に低ビットレートの符号化の場合に、音声信号につい
ての出力が著しく劣化する。
【0004】可能な方法の1つは、音声信号および音楽
信号どちらにも対応することのできるマルチモードの符
号器を設計することである。そのような符号器を提供し
ようとした以前の試みには、例えば、ハイブリッドAC
ELP/変換符号化励振符号器、およびマルチモード変
換予測符号器(MTPC)がある。残念なことに、これ
らの符号化アルゴリズムは、音声信号および音楽信号を
実用的に符号化するには、あまりにも複雑かつ/または
非効率的なものである。
【0005】
【発明が解決しようとする課題】特に低ビットレート環
境で使用するように適合した、音声信号および音楽信号
の両方を符号化する、単純かつ効率的なハイブリッド型
の符号化アルゴリズムおよびアーキテクチャを提供する
ことが望まれる。
【0006】
【課題を解決するための手段】本発明は、音楽信号を効
率的に符号化する変換符号化法を提供する。この変換符
号化法はハイブリッドコーデックで使用するのに適して
おり、音声信号および音楽信号両方の再生に、共通の線
形予測(LP)合成フィルタを用いる。LP合成フィル
タの入力は、音声信号または音楽信号の符号化に従っ
て、それぞれ音声励振ジェネレータと変換励振ジェネレ
ータに切り替える。好ましい実施形態では、LP合成フ
ィルタは、LP係数の補間を含む。音声信号の符号化に
は、従来のCELPまたはその他のLP技術を使用する
ことができ、一方、音楽信号の符号化には、非対称重複
加算変換技術を応用することが好ましい。本発明の潜在
的な利点は、コーデックが音声符号化と音楽符号化を切
り替える箇所で滑らかな出力推移を可能にすることであ
る。
【0007】本発明のこの他の特徴および利点は、添付
の図面を参照しながら進める以下の例示的実施形態の詳
細な説明から明らかになろう。
【0008】頭記の特許請求の範囲に本発明の特徴を詳
細に示すが、本発明とその目的および利点は、以下の詳
細な説明を添付の図面と合わせて読むことにより、最も
明瞭に理解することができよう。
【0009】
【発明の実施の形態】本発明は、音楽信号を符号化する
効率的な変換符号化法を提供し、この方法はハイブリッ
ドコーデックで使用するのに適しており、音声信号およ
び音楽信号の両方を再生するのに共通の線形予測(L
P)合成フィルタを利用する。概説すると、符号化音声
信号を受信したか、あるいは符号化音楽信号を受信した
かに応じて、LP合成フィルタの入力を、それぞれ音声
励振ジェネレータと変換励振ジェネレータとの間で動的
に切り替える。音声/音楽クラシファイアは、入力され
た音声/音楽信号が音声であるか音楽であるかを識別
し、識別した信号を適切に音声符号変換器(speech enc
oder)または音楽符号変換器(music encoder)に転送
する。音声信号を符号化する際には、従来のCELP技
術を使用することができる。しかし、音楽信号の符号化
には、新規の非対称重複加算変換技術を応用する。本発
明の好ましい実施形態では、共通LPフィルタはLP係
数の補間を含み、重複を介して励振が得られる領域の数
個のサンプルごとに補間を行う。合成フィルタの出力は
切り替えず、合成フィルタの入力だけを切り替えるの
で、可聴信号の不連続性の原因が回避される。
【0010】図1を参照して、本発明の一実施形態を実
施することが可能な例示的な音声/音楽コーデックの構
成を説明する。図示された環境は、雲形で表すネットワ
ーク100を介して相互に通信するコーデック110、
120を含む。ネットワーク100は、ルータ、ゲート
ウェイ、ハブなど多数の周知の構成要素を含むことがで
き、有線媒体および無線媒体のどちらか、または両方を
通じて通信を提供することができる。各コーデックは、
少なくとも、符号変換器111、121、復号器11
2、122、および音声/音楽クラシファイア113、
123を含む。
【0011】本発明の一実施形態では、共通の線形予測
合成フィルタを音楽信号および音声信号の両方に使用す
る。図2を参照すると、本発明を実施することが可能な
例示的音声および音楽コーデックの構造を示している。
詳細には、図2は、ハイブリッド音声/音楽符号変換器
の高レベル構造を示し、図2は、ハイブリッド音声/音
楽復号器の高レベル構造を示す。図2を参照すると、音
声/音楽符号変換器は、入力信号を音声信号または音楽
信号に分類する音声/音楽クラシファイア250を含
む。識別された信号は、識別結果に応じてそれぞれ音声
符号変換器260または音楽符号変換器270に送信さ
れ、入力信号の音声/音楽特性を特徴化するモードビッ
トが生成される。例えば、ゼロのモードビットは音声信
号を表し、1のモードビットは音楽信号を表す。音声符
号変換器260は、当業者に周知の線形予測の原理に基
づいて入力信号を符号化し、符号化した音声ビットスト
リームを出力する。使用する音声符号化は、例えば、当
業者に知られるコードブック励振線形予測(CELP)
技術である。これに対して、音楽符号変換器270は、
下記で説明する変換符号化法に従って入力音楽信号を符
号化し、符号化した音楽ビットストリームを出力する。
【0012】図2を参照すると、本発明の一実施形態に
よる音声/音楽復号器は、線形予測(LP)合成フィル
タ240と、音声励振ジェネレータ210と変換励振ジ
ェネレータ220を切り替える、フィルタ240の入力
部に接続された音声/音楽スイッチ230とを含む。音
声励振ジェネレータ210は、送信されてきた符号化音
声/音楽ビットストリームを受信し、音声励振信号を生
成する。音楽励振ジェネレータ220は、送信されてき
た符号化音声/音楽信号を受信し、音楽励振信号を生成
する。符号器には2つのモード、すなわち音声モードと
音楽モードがある。現在のフレームまたはスーパーフレ
ームに対する復号器のモードは、送信されるモードビッ
トによって決まる。音声/音楽スイッチ230は、モー
ドビットに従って励振信号ソースを選択し、したがって
音楽モードでは音楽励振信号を選択し、音声モードでは
音声励振信号を選択する。次いでスイッチ230は、適
切な再構築信号を生成するために、選択された励振信号
を線形予測合成フィルタ240に転送する。音声モード
における励振または残差は、コード励振線形予測(CE
LP)符号化などの音声最適化技術を使用して符号化
し、一方、音楽モードにおける励振は、例えば変換符号
化励振(TCX)などの変換符号化技術によって量子化
する。復号器のLP合成フィルタ240は、音楽信号と
音声信号の両方に共通である。
【0013】音声信号または音楽信号を符号化する従来
の符号器は、通例フレームと称される10ms〜40m
sのブロックまたは区分に対して作用する。一般に、変
換符号化はフレームサイズが大きい方が効率的なので、
一般にこのような10ms〜40msのフレームは、特
にビットレートが低い場合には、変換符号器(transfor
m coder)を整合して許容できる品質を得るには短すぎ
る。このため、本発明の一実施形態は、整数個の標準的
な20msのフレームで構成されるスーパーフレームに
対して作用する。一実施形態で使用する標準的なスーパ
ーフレームのサイズは60msである。この結果、音声
/音楽クラシファイアは、連続したスーパーフレーム1
つにつき1回の分類を行うことが好ましい。
【0014】音楽信号を符号化する現在の変換符号器と
異なり、本発明による符号化プロセスは励振領域で行わ
れる。これは、音声と音楽両タイプの信号の再生に、単
一のLP合成フィルタを使用することの結果である。図
3(a)を参照すると、本発明の一実施形態による変換
符号変換器を示している。線形予測(LP)解析フィル
タ310は、音声/音楽クラシファイア250から出力
される、分類済みの音楽スーパーフレームの音楽信号を
解析して、適切な線形予測係数(LPC)を得る。LP
量子化モジュール320は、計算されたLPC係数を量
子化する。次いでLPC係数およびスーパーフレームの
音楽信号を入力として音楽信号を得、出力として残差信
号を生成する逆フィルタ330にかける。
【0015】一般的なフレームではなくスーパーフレー
ムを使用することは、高品質の変換符号化を得る助けと
なる。しかし、スーパーフレームの境界におけるブロッ
キングひずみによって品質問題が生じる可能性がある。
ブロッキングひずみの影響を軽減する好ましい解決法
は、例えば、隣接フレームとの重複が50%の変形重複
変換(MLT)などの、重複加算ウィンドウ技術に見出
される。しかし、CELPでは音声符号化にゼロの重複
を利用するので、このような解決法をCELPベースの
ハイブリッドコーデックに組み込むことは難しいと思わ
れる。この難題を克服し、音楽モードにおけるシステム
の高品質の動作を保証するために、本発明の一実施形態
は、図3(a)の重複加算モジュール340によって実
施される非対称重複加算ウィンドウ法を提供する。図3
(b)は、非対称重複加算ウィンドウの動作および効果
を表す。図3(b)を参照すると、重複加算ウィンドウ
は、1つ前のスーパーフレームが、例えばそれぞれNp
およびLpで表すスーパーフレームの長さおよび重複の
長さに異なる値を有し得るという可能性を考慮したもの
になっている。符号(designator)Ncおよ
びLcはそれぞれ、現在のスーパーフレームのスーパー
フレーム長と重複の長さを表す。現在のスーパーフレー
ムの符号化ブロックは、現在のスーパーフレームのサン
プルと重複のサンプルを含む。重複加算のウィンドウ処
理は、現在の符号化ブロックの最初のNpサンプルおよ
び最後のLpサンプルで行われる。これに限定しない
が、例えば次のように、入力信号x(n)を重複加算ウ
ィンドウ関数w(n)で変換して、ウィンドウ処理した
信号y(n)を得る。 y(n)=x(n)w(n),0≦n≦Nc+Lc−1・・・・・・・(数式1) ウィンドウ関数w(n)は次のように定義される。
【0016】
【数1】
【0017】この場合、NcおよびLcは、それぞれ、現
在のスーパーフレームのスーパーフレーム長と重複の長
さである。
【0018】図3(b)の重複加算ウィンドウの形状か
ら、例えば、重複加算レンジ390、391が非対称形
であり、符号390の領域が符号391の領域と異な
り、また重複加算のウィンドウは相互にサイズが異なる
ことが見て取れる。このようなサイズが可変のウィンド
ウにより、ブロッキングの影響とプリエコーを克服す
る。また、MLT技術で利用する50%の重複と比較す
ると重複領域が小さいので、この非対称重複加算ウィン
ドウの方法は、下記で説明するように、CELPベース
の音声符号器(speech coder)に組み込むことのできる
変換符号器に効率的である。
【0019】再度図3(a)を参照すると、逆LPフィ
ルタ330から出力される残差信号は、非対称形の重複
加算ウィンドウ処理モジュール340によって処理し、
ウィンドウ処理した信号を生成する。ウィンドウ処理し
た信号は次いで離散コサイン変換(DCT)モジュール
350に入力され、ここでウィンドウ処理した信号を周
波数領域に変換し、DCT係数のセットを得る。DCT
変換は次のように定義され、
【0020】
【数2】
【0021】c(k)は次のように定義される。ただ
し、Kは変換サイズである。
【0022】
【数3】
【0023】DCT変換が好ましいが、変形離散コサイ
ン変換(MDCT)および高速フーリエ変換(FFT)
を含む技術など、他の変換技術も応用することができ
る。DCT係数を効率的に量子化するために、DCT係
数量子化の一部として動的ビット割り当て情報を利用す
る。動的ビット割り当て情報は、閾値マスキングモジュ
ール360で計算するマスキング閾値に従って、動的ビ
ット割り当てモジュール370から得るが、この閾値マ
スキングは、入力される信号か、またはLPC解析モジ
ュール310から出力されるLPC係数に基づく。動的
ビット割り当て情報は、入力音楽信号の解析から得るこ
ともできる。動的ビット割り当て情報を用いて、量子化
モジュール380でDCT係数を量子化し、次いで復号
器に送出する。
【0024】本発明の上記の実施形態で用いる符号化ア
ルゴリズムに沿い、変換復号器を図4に示す。図4を参
照すると、変換復号器は、逆動的ビット割り当てモジュ
ール(Inverse Dynamic bit allocation module)41
0、逆量子化モジュール420、DCT逆変換モジュー
ル430、非対称重複加算ウィンドウモジュール44
0、および重複加算モジュール450を含む。逆動的ビ
ット割り当てモジュール410は、図3(a)の動的ビ
ット割り当てモジュール370から出力され、送信され
るビット割り当て情報を受け取り、ビット割り当て情報
を逆量子化モジュール420に提供する。逆量子化モジ
ュール420は、送信されてきた音楽ビットストリーム
とビット割り当て情報を受け取り、ビットストリームに
逆量子化を適用して、符号化したDCT係数を得る。次
いでDCT逆変換モジュール430は、符号化したDC
T係数の逆DCT変換を実行し、時間領域の信号を生成
する。逆DCT変換は次のように示すことができ、
【0025】
【数4】
【0026】c(k)は次のように定義される。ただ
し、Kは変換サイズである。
【0027】
【数5】
【0028】重複加算ウィンドウ処理モジュール440
は、時間領域の信号に対し、例えば、
【0029】
【数6】
【0030】など、非対称の重複加算ウィンドウ処理操
作を行う。ここで
【0031】
【外1】
【0032】は時間領域の信号を表す。w(n)はウィ
ンドウ関数を表す。
【0033】
【外2】
【0034】はこの結果得られるウィンドウ処理後の信
号である。ウィンドウ処理を行った信号は次いで重複加
算モジュール450に送られ、ここで重複加算操作を行
うことにより励振信号が得られる。これに限定しない
が、例として、例示的な重複加算操作は次のようなもの
である。
【0035】
【数7】
【0036】
【外3】
【0037】1つ前と現在の時間領域信号である。関数
p(n)およびwc(n)はそれぞれ、以前のスーパー
フレームと現在のスーパーフレームについての重複加算
ウィンドウ関数である。値NpおよびNcは、それぞれ1
つ前のスーパーフレームと現在のスーパーフレームのサ
イズである。値Lpは、1つ前のスーパーフレームの重
複加算のサイズである。
【0038】
【外4】
【0039】図2に示すように、切り替え可能な形でL
P合成フィルタに送られ、元の音楽信号を再構築する。
【0040】励振信号の処理には、補間合成技術を応用
することが好ましい。LP係数は、0≦n≦Lp−1の
領域で数個のサンプルごとに補間し、重複加算操作を用
いて励振を得る。LP係数の補間は、線スペクトル対
(LSP)領域で行われ、補間するLSP係数の値は次
の式によって得られる。
【0041】
【数8】
【0042】
【外5】
【0043】それぞれ、1つ前のスーパーフレームおよ
び現在のスーパーフレームの量子化LSPパラメータで
ある。係数v(i)は補間重み係数であり、値MはLP
係数の次数である。補間技術を用いた後に、従来のLP
合成技術を励振信号に適用して、再構築された信号を得
る。
【0044】図5および図6を参照して、本発明の一実
施形態により、インタリーブした入力音声信号および音
楽信号を符号化する際に従う例示的ステップを説明す
る。ステップ501で、入力信号を受け取り、スーパー
フレームを形成する。ステップ503で、現在のスーパ
ーフレームのタイプ(すなわち音楽/音声)がそれまで
のスーパーフレームのタイプと異なるかどうかを判定す
る。スーパーフレームが異なる場合は、現在のスーパー
フレームの開始部で「スーパーフレーム遷移」を定義
し、動作の流れは分岐してステップ505に進む。ステ
ップ505で、例えば現在のスーパーフレームが音楽で
あるかどうかを判定することにより、1つ前のスーパー
フレームのシーケンスと現在のスーパーフレームを判定
する。したがって、例えば、1つ前のスーパーフレーム
が音声スーパーフレームであり、その後に現在の音楽ス
ーパーフレームが続く場合は、ステップ505の実行の
結果は「yes」になる。同様に、1つ前のスーパーフ
レームが音楽スーパーフレームであり、その後に現在の
音声スーパーフレームが続く場合、ステップ505の結
果は「no」になる。ステップ505から「yes」の
結果に分岐したステップ511で、1つ前の音声スーパ
ーフレームの重複の長さLpをゼロにセットし、現在の
符号化ブロックの開始部では重複加算ウィンドウを実行
しないことを表す。この理由は、CELPベースの音声
符号器が、隣接するフレームまたはスーパーフレームの
重複信号を提供または利用しないためである。ステップ
511に続き、ステップ513で音楽スーパーフレーム
に変換符号化手順を実行する。ステップ505の判定の
結果が「no」である場合、動作の流れは分岐してステ
ップ509に進み、ここで1つ前の音楽スーパーフレー
ムの重複サンプルを破棄する。続いて、ステップ515
で音声スーパーフレームにCELP符号化を実行する。
ステップ503から「no」の結果に分岐したステップ
507では、現在のスーパーフレームが音楽スーパーフ
レームか、音声スーパーフレームかを判定する。現在の
スーパーフレームが音楽スーパーフレームである場合
は、ステップ513で変換符号化を適用し、現在のスー
パーフレームが音声である場合は、ステップ515でC
ELP符号化の手順を適用する。ステップ513で変換
符号化が完了すると、符号化した音楽ビットストリーム
が生成される。同様に、ステップ515でCELP符号
化を実行すると、符号化した音声ビットストリームが生
成される。
【0045】ステップ513で行われる変換符号化は、
図6に示す一連のサブステップを含む。ステップ523
で、入力信号のLP係数を計算する。ステップ533
で、計算されたLPC係数を量子化する。ステップ54
3で、受け取ったスーパーフレームおよび計算したLP
C係数に逆フィルタをかけて残差信号x(n)を生成す
る。ステップ533で、次のようにx(n)にウィンド
ウ関数w(n)を乗算することにより、重複加算ウィン
ドウを残差信号x(n)に適用する。 y(n)=x(n)w(n) この場合、ウィンドウ関数w(n)は数式2と同様に定
義される。ステップ563で、ウィンドウ処理した信号
y(n)にDCT変換を行い、DCT係数を得る。ステ
ップ583で、ステップ573で得るマスキング閾値に
従って、動的ビット割り当て情報を得る。次いでステッ
プ593で、ビット割り当て情報を使用し、DCT係数
を量子化して音楽ビットストリームを生成する。
【0046】図5および図6に示す符号化ステップに沿
い、図7および図8は、本発明の一実施形態で合成した
信号を提供する際に復号のため採られるステップを示し
ている。図7を参照すると、ステップ601で、送信さ
れるビットストリームおよびモードビットを受信する。
ステップ603で、モードビットにより、現在のスーパ
ーフレームが音楽に対応するか、音声に対応するかを判
断する。その信号が音楽に対応する場合は、ステップ6
07で変換励振を生成する。ビットストリームが音声に
対応する場合は、ステップ605を実行して、CELP
解析の場合と同様に音声励振信号を生成する。ステップ
607と605はどちらもステップ609に合流する。
ステップ609で、LP合成フィルタが音楽励振信号ま
たは音声励振信号を適切に受け取るようにスイッチをセ
ットする。例えば0≦n≦Lp−1などの領域でスーパ
ーフレームを重複加算するときには、スーパーフレーム
のこの重複加算領域中の信号のLPC係数を補間するこ
とが好ましい。ステップ611で、LPC係数の補間を
実行する。LPC係数の補間を行うためには、例えば数
式6を用いることができる。続いてステップ613で、
当業者にはよく理解される方式で、LPC合成フィルタ
を介して元の信号を再構築、すなわち合成する。
【0047】本発明によると、音声励振ジェネレータ
は、音声合成に適した任意の励振ジェネレータでよい
が、変換励振ジェネレータは、図8に示すような特別に
適合した方法であることが好ましい。図8を参照する
と、送信されるビットストリームをステップ617で受
信した後に、ステップ627で逆ビット割り当てを実行
してビット割り当て情報を得る。ステップ637で、D
CT係数の逆DCT量子化を行うことにより、DCT係
数を得る。ステップ647で、数式4で定義する逆DC
T変換をDCT係数に行うことにより、予備的な時間領
域の励振信号を再構築する。ステップ657で、数式2
で定義される重複加算ウィンドウを適用することによ
り、再構築された励振信号をさらに処理する。ステップ
667で、重複加算操作を行って、数式5で定義する音
楽励振信号を得る。
【0048】これは必須ではないが、本発明は、コンピ
ュータで実行されるプログラムモジュールなどの命令を
使用して実施することができる。一般に、プログラムモ
ジュールには、特定のタスクを実行するか、または特定
の抽象データタイプを実施するルーチン、オブジェク
ト、コンポーネント、データ構造などが含まれる。ここ
で使用する用語「プログラム」は、1つ以上のプログラ
ムモジュールを含む。
【0049】本発明は、各種タイプのマシンで実施する
ことができるが、これには、携帯電話、パーソナルコン
ピュータ(PC)、ハンドヘルドデバイス、マルチプロ
セッサシステム、マイクロプロセッサベースのプログラ
マブル消費者家電製品、ネットワークPC、ミニコンピ
ュータ、メインフレームコンピュータなど、あるいは本
明細書に述べるようにオーディオ信号を符号化または復
号し、また信号の記憶、取り出し、送信、または受信に
使用することのできる任意の他のマシンが含まれる。本
発明は、通信ネットワークを通じてリンクした遠隔コン
ポーネントによってタスクを実行する分散型コンピュー
ティングシステムで使用することができる。
【0050】図9を参照すると、本発明の実施形態を実
施する例示的な一システムは、コンピューティングデバ
イス700などのコンピューティングデバイスを含む。
その最も基本的な構成では、コンピューティングデバイ
ス700は、通例少なくとも1つの処理装置702とメ
モリ704を含む。メモリ704は、コンピューティン
グデバイスの厳密な構成およびタイプに応じて、揮発性
(RAMなど)、不揮発性(ROM、フラッシュメモリ
など)、あるいはこの2つの組み合わせにすることがで
きる。この最も基本的な構成を、図9の線706の中に
示している。これに加えて、デバイス700は、追加の
装備/機能も有することができる。例えば、デバイス7
00は、これらに限定しないが磁気ディスクまたは光デ
ィスク、またはテープを含む、追加のストレージ(取り
外し可能/取り外し不能)も含むことができる。このよ
うな追加ストレージを、取り外し可能ストレージ708
および取り外し不能ストレージ710として図9に示し
ている。コンピュータ記憶媒体は、コンピュータ可読命
令、データ構造、プログラムモジュール、あるいはその
他のデータなどの情報を記憶するための任意の方法また
は技術に実施された揮発性および不揮発性、取り外し可
能および取り外し不能の媒体を含む。メモリ704、取
り外し可能ストレージ708、および取り外し不能スト
レージ710はすべて、コンピュータ記憶媒体の例であ
る。これらに限定しないが、コンピュータ記憶媒体に
は、RAM、ROM、EEPROM、フラッシュメモ
リ、あるいはその他のメモリ技術、CDROM、デジタ
ル多用途ディスク(DVD)、あるいはその他の光スト
レージ、磁気カセット、磁気テープ、磁気ディスクスト
レージ、あるいはその他の磁気ストレージデバイス、あ
るいは所望の情報を記憶するのに使用することができ、
デバイス700からアクセスすることのできる任意の他
の媒体が含まれる。このような任意のコンピュータ記憶
媒体を、デバイス700の一部とすることができる。
【0051】デバイス700は、デバイスが他のデバイ
スと通信することを可能にする1つ以上の通信接続71
2も含むことができる。通信接続712は、通信媒体の
一例である。通信媒体は通例、コンピュータ可読命令、
データ構造、プログラムモジュール、あるいはその他の
データを搬送波やその他の搬送機構などの変調データ信
号に実施し、また任意の情報伝達媒体を含む。用語「変
調データ信号」とは、情報を信号中に符号化するような
方式で、その特徴の1つ以上を設定または変更した信号
を意味する。例として、通信媒体には、有線ネットワー
クまたは直接配線接続などの有線媒体、および音響、R
F、赤外線およびその他の無線媒体などの無線媒体が含
まれるが、これらに限定しない。上記で述べたように、
本明細書で使用する用語「コンピュータ可読媒体」は、
記憶媒体および通信媒体の両方を含む。
【0052】デバイス700は、キーボード、マウス、
ペン、音声入力装置、接触式入力装置など、1つ以上の
入力装置714も有することができる。ディスプレイ、
スピーカ、プリンタなど、1つ以上の出力装置716も
含むことができる。こうした装置はいずれも当技術分野
で周知のものであり、ここでさらに論じる必要はない。
【0053】音楽信号を符号化するのに効率的であり、
かつ共通のLP合成フィルタを用いるハイブリッドコー
デックで使用するのに適した、新規で有用な変換符号化
方法を提供した。本発明の原理を応用することのできる
多数の可能な実施形態を考慮すると、図面の図柄と関連
して本明細書で説明した実施形態は、単に例示的なもの
に過ぎず、発明の範囲を制限するものと解釈すべきでな
いことは認識されよう。ここに説明した実施形態は、本
発明の精神から逸脱することなく、その構成および詳細
を変更できることは当業者に認識されよう。したがっ
て、本発明は、DCT変換を利用するものとして説明し
たが、フーリエ変換や、変形離散コサイン変換など他の
変換技術も本発明の範囲内で応用することができる。同
様に、ここに説明した他の詳細事項も、本発明の範囲か
ら逸脱せずに、変更または他のものに置き換えることが
できる。したがって、本明細書に記載した本発明は、そ
のような実施形態はすべて、頭記の特許請求の範囲およ
びその同等物の範囲内にあるものと企図する。
【図面の簡単な説明】
【図1】本発明の一実施形態によるネットワークでリン
クした例示的なハイブリッド型音声/音楽コーデックの
図である。
【図2】本発明の一実施形態によるハイブリッド型音声
/音楽符号変換器の簡略化したアーキテクチャ図であ
る。
【図3】本発明の一実施形態による変換符号化アルゴリ
ズムの論理図、および、本発明の一実施形態による非対
称型の重複加算ウィンドウ操作とその効果を表すタイミ
ング図である。
【図4】本発明の一実施形態による変換符号化アルゴリ
ズムのブロック図である。
【図5】本発明の一実施形態により、音声信号および音
楽信号の符号化に使用する例示的ステップを表す流れ図
である。
【図6】本発明の一実施形態により、音声信号および音
楽信号の符号化に使用する例示的ステップを表す流れ図
である。
【図7】本発明の一実施形態により、音声信号および音
楽信号の復号に使用する例示的ステップを表す流れ図で
ある。
【図8】本発明の一実施形態により、音声信号および音
楽信号の復号に使用する例示的ステップを表す流れ図で
ある。
【図9】本発明の一実施形態を実行することが可能な、
コンピューティングデバイスによって用いられるコンピ
ューティングデバイスのアーキテクチャを表す簡略図で
ある。
【符号の説明】
100 ネットワーク 110、120 コーデック 111、121 符号変換器 112、122 復号器 113、123、250 音声/音楽クラシファイア 210 音声励振ジェネレータ 220 変換励振ジェネレータ 230 音声/音楽スイッチ 240 線形予測合成フィルタ 260 音声符号変換器 270 音楽符号変換器 310 線形予測解析フィルタ(LPC解析モジュー
ル) 320 線形予測量子化モジュール 330 逆線形予測フィルタ 340 重複加算モジュール(重複加算ウィンドウ処理
モジュール) 350 離散コサイン変換モジュール 360 閾値マスキングモジュール 370 動的ビット割り当てモジュール 380 量子化モジュール 390、391 重複加算レンジ 410 逆動的ビット割り当てモジュール 420 逆量子化モジュール 430 DCT逆変換モジュール 440 非対称重複加算ウィンドウモジュール 450 重複加算モジュール 700 コンピューティングデバイス 702 処理装置 704 メモリ 708 取り外し可能ストレージ 710 取り外し不能ストレージ 712 通信接続 714 入力装置 716 出力装置
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 9/14 H (72)発明者 小石田 和人 アメリカ合衆国 98052 ワシントン州 レッドモンド 146 アベニュー ノース イースト 7507 (72)発明者 ウラジミール カッパーマン アメリカ合衆国 93117 カリフォルニア 州 ゴレタ シエロ アベニュー 5635 (72)発明者 アミール エイチ.マジディメア アメリカ合衆国 98072 ワシントン州 ウッドビル 164 プレイス ノースイー スト 14824 (72)発明者 アレン ガーショ アメリカ合衆国 93111 カリフォルニア 州 サンタ バーバラ ビア ジェニータ 4604 Fターム(参考) 5D045 CB01 DA02 DA11 5J064 AA02 BA16 BB04 BC01 BC02 BC08 BC11 BC16 BC22 BD02 BD03

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 符号化信号の一部分を復号する方法であ
    って、前記一部分は、符号化された音声信号または符号
    化された音楽信号を含み、前記方法は、 前記符号化信号の前記一部分が、符号化音声信号に対応
    するか、または符号化音楽信号に対応するかを判定する
    ステップと、 前記符号化信号の前記一部分が符号化音声信号に対応す
    ると判定された場合は、前記符号化信号の前記一部分を
    音声励振ジェネレータに提供するステップであって、線
    形予測の手順に従って励振信号が生成されるステップ
    と、 前記符号化信号の前記一部分が符号化音楽信号に対応す
    ると判定された場合は、前記符号化信号の前記一部分を
    変換励振ジェネレータに提供するステップであって、変
    換符号化の手順に従って励振信号が生成されるステップ
    と、 共通の線形予測合成フィルタの入力を、前記音声励振ジ
    ェネレータの出力と前記変換励振ジェネレータの出力の
    間で切り替え、それにより、前記共通の線形予測合成フ
    ィルタが、前記入力される励振に対応する再構築信号を
    出力として提供するステップとを有することを特徴とす
    る方法。
  2. 【請求項2】 入力音楽信号のシーケンスからなる音楽
    スーパーフレームを受信するステップと、 線形予測原理に従って、前記音楽スーパーフレームにつ
    いての残差信号および複数の線形予測係数を生成するス
    テップと、 前記スーパーフレームの前記残差信号に非対称重複加算
    ウィンドウを適用して、ウィンドウ処理した信号を生成
    するステップと、 前記ウィンドウ処理した信号に離散コサイン変換を実行
    して、離散コサイン変換係数のセットを得るステップ
    と、 前記入力音楽信号または前記線形予測係数に従って、動
    的ビット割り当て情報を計算するステップと、 前記動的ビット割り当て情報に従って、前記離散コサイ
    ン変換係数を量子化するステップとを含む非対称重複加
    算変換法に従って、前記符号化音楽信号を形成すること
    を特徴とする請求項1に記載の方法。
  3. 【請求項3】 前記符号化信号の前記一部分は、変換符
    号化のためにサイズが最適化された信号スーパーフレー
    ムを有することを特徴とする請求項1に記載の方法。
  4. 【請求項4】 前記スーパーフレームは一連のエレメン
    トで構成され、非対称重複加算ウィンドウを適用する前
    記ステップはさらに、 前のスーパーフレームエレメントの最後のサブシリーズ
    に従って、現在のスーパーフレームエレメントの最初の
    サブシリーズを修正すること、並びに、次のスーパーフ
    レームエレメントの最初のサブシリーズに従って、前記
    現在のスーパーフレームエレメントの最後のサブシリー
    ズを修正することによって前記非対称重複加算ウィンド
    ウを作成するステップと、 時間領域中の前記現在のスーパーフレームで、前記ウィ
    ンドウを乗算するステップとを含むことを特徴とする請
    求項2に記載の方法。
  5. 【請求項5】 線形予測係数のセットの補間を行うステ
    ップをさらに有することを特徴とする請求項4に記載の
    方法。
  6. 【請求項6】 符号化信号の一部分を復号するステップ
    を実行するための命令をその上に有するコンピュータ可
    読媒体であって、前記一部分は、符号化音声信号または
    符号化音楽信号を含み、前記ステップは、 前記符号化信号の前記一部分が、符号化音声信号に対応
    するか、または符号化音楽信号に対応するかを判定する
    ステップと、 前記符号化信号の前記一部分が符号化音声信号に対応す
    ると判定された場合は、前記符号化信号の前記一部分を
    音声励振ジェネレータに提供するステップであって、線
    形予測の手順に従って励振信号が生成されるステップ
    と、 前記符号化信号の前記一部分が符号化音楽信号に対応す
    ると判定された場合は、前記符号化信号の前記一部分を
    変換励振ジェネレータに提供するステップであって、変
    換符号化の手順に従って励振信号が生成されるステップ
    と、 共通の線形予測合成フィルタの入力を、前記音声励振ジ
    ェネレータの出力と前記変換励振ジェネレータの出力の
    間で切り替え、それにより、前記共通の線形予測合成フ
    ィルタが、前記入力される励振に対応する再構築信号を
    出力として提供するステップとを含むことを特徴とする
    コンピュータ可読媒体。
  7. 【請求項7】 入力音楽信号のシーケンスからなる音楽
    スーパーフレームを受信するステップと、 線形予測原理に従って、前記音楽スーパーフレームにつ
    いての残差信号および複数の線形予測係数を生成するス
    テップと、 前記スーパーフレームの前記残差信号に非対称重複加算
    ウィンドウを適用して、ウィンドウ処理した信号を生成
    するステップと、 前記ウィンドウ処理した信号に離散コサイン変換を実行
    して、離散コサイン変換係数のセットを得るステップ
    と、 前記入力音楽信号または前記線形予測係数に従って、動
    的ビット割り当て情報を計算するステップと、 前記動的ビット割り当て情報に従って、前記離散コサイ
    ン変換係数を量子化するステップとを含む非対称重複加
    算変換方法に従って、前記符号化音楽信号を形成するこ
    とを特徴とする請求項5に記載のコンピュータ可読媒
    体。
  8. 【請求項8】 前記符号化信号の前記一部分は、変換符
    号化のためにサイズが最適化された信号スーパーフレー
    ムを有することを特徴とする請求項6に記載のコンピュ
    ータ可読媒体。
  9. 【請求項9】 前記スーパーフレームは一連のエレメン
    トで構成され、非対称重複加算ウィンドウを適用する前
    記ステップはさらに、 前のスーパーフレームエレメントの最後のサブシリーズ
    に従って、現在のスーパーフレームエレメントの最初の
    サブシリーズを修正すること、並びに、次のスーパーフ
    レームエレメントの最初のサブシリーズに従って、前記
    現在のスーパーフレームエレメントの最後のサブシリー
    ズを修正することによって前記非対称重複加算ウィンド
    ウを作成するステップと、 時間領域中の前記現在のスーパーフレームで、前記ウィ
    ンドウを乗算するステップとを含むことを特徴とする請
    求項7に記載のコンピュータ可読媒体。
  10. 【請求項10】 線形予測係数セットの補間を行う前記
    ステップを実行させる(cause)ための命令をさら
    に含むことを特徴とする請求項8に記載のコンピュータ
    可読媒体。
  11. 【請求項11】 スーパーフレーム信号を符号化する装
    置であって、前記スーパーフレーム信号は音声信号また
    は音楽信号のシーケンスを含み、前記装置は、 前記スーパーフレームが音声スーパーフレームである
    か、または音楽スーパーフレームであるかを分類する音
    声/音楽クラシファイアと、 前記音声スーパーフレームまたは音楽スーパーフレーム
    を符号化し、複数の符号化信号を提供する音声/音楽符
    号変換器であって、線形予測合成フィルタを使用して前
    記音楽スーパーフレームを再構築するために、変換符号
    化法を用いて励振信号を生成する音楽符号変換器を含む
    音声/音楽符号変換器と、 前記符号化信号を復号する音声/音楽復号器であって、 前記変換符号化法の逆を実行して、前記符号化音楽信号
    を復号する変換復号器、並びに、 線形予測係数のセットに従って再構築信号を生成する線
    形予測合成フィルタであって、音楽信号および音声信号
    両方の再生に使用することができる線形予測合成フィル
    タを含む音声/音楽復号器とを備えたことを特徴とする
    装置。
  12. 【請求項12】 音声/音楽クラシファイアは、前記ス
    ーパーフレームが音楽であるかまたは音声であるかを表
    すモードビットを提供することを特徴とする請求項11
    に記載の装置。
  13. 【請求項13】 前記音声/音楽符号変換器は音声スー
    パーフレームを符号化する音声符号変換器をさらに含
    み、前記音声符号変換器は線形予測の原理に従って動作
    することを特徴とする請求項11に記載の装置。
  14. 【請求項14】 前記音楽符号変換器はさらに、 前記音楽スーパーフレームを解析し、線形予測係数のセ
    ットを生成する線形予測解析モジュールと、 前記線形予測係数を量子化する線形予測係数量子化モジ
    ュールと、 前記線形予測係数および前記音楽スーパーフレームを受
    け取り、残差信号を提供する逆線形予測フィルタと、 前記残差信号をウィンドウ処理し、ウィンドウ処理した
    信号を生成する非対称重複加算ウィンドウ処理モジュー
    ルと、 前記ウィンドウ処理した信号を離散コサイン変換係数の
    セットに変換する離散コサイン変換モジュールと、 前記入力信号または前記線形予測係数の少なくとも1つ
    に基づいて、ビット割り当て情報を提供する動的ビット
    割り当てモジュールと、 前記ビット割り当て情報に従って、前記離散コサイン変
    換係数を量子化する離散コサイン変換係数量子化モジュ
    ールとを備えたことを特徴とする請求項11に記載の装
    置。
  15. 【請求項15】 前記変換復号器はさらに、 ビット割り当て情報を提供する動的ビット割り当てモジ
    ュールと、 量子化した離散コサイン変換係数を、離散コサイン変換
    係数のセットに変換する逆量子化モジュールと、 前記離散コサイン変換係数を時間領域信号に変換する、
    離散コサイン逆変換モジュールと、 前記時間領域信号をウィンドウ処理し、ウィンドウ処理
    した信号を生成する非対称重複加算ウィンドウ処理モジ
    ュールと、 前記非対称ウィンドウに基づいて、前記ウィンドウ処理
    した信号を修正する重複加算モジュールとを備えたこと
    を特徴とする請求項11に記載の装置。
JP2002185213A 2001-06-26 2002-06-25 音声信号および音楽信号を符号化する方法 Pending JP2003044097A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/892,105 US6658383B2 (en) 2001-06-26 2001-06-26 Method for coding speech and music signals
US09/892,105 2001-06-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009245860A Division JP5208901B2 (ja) 2001-06-26 2009-10-26 音声信号および音楽信号を符号化する方法

Publications (1)

Publication Number Publication Date
JP2003044097A true JP2003044097A (ja) 2003-02-14

Family

ID=25399378

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002185213A Pending JP2003044097A (ja) 2001-06-26 2002-06-25 音声信号および音楽信号を符号化する方法
JP2009245860A Expired - Fee Related JP5208901B2 (ja) 2001-06-26 2009-10-26 音声信号および音楽信号を符号化する方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2009245860A Expired - Fee Related JP5208901B2 (ja) 2001-06-26 2009-10-26 音声信号および音楽信号を符号化する方法

Country Status (5)

Country Link
US (1) US6658383B2 (ja)
EP (1) EP1278184B1 (ja)
JP (2) JP2003044097A (ja)
AT (1) ATE388465T1 (ja)
DE (1) DE60225381T2 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008111991A (ja) * 2006-10-30 2008-05-15 Ntt Docomo Inc 復号装置、符号化装置、復号方法及び符号化方法
JP2009545780A (ja) * 2006-07-31 2009-12-24 クゥアルコム・インコーポレイテッド オーディオ信号に関連付けられるフレームを持つ窓を修正するためのシステムと方法
JP2010506239A (ja) * 2006-10-10 2010-02-25 クゥアルコム・インコーポレイテッド オーディオ信号を符号化及び復号化する方法及び装置
KR20100032843A (ko) * 2008-09-18 2010-03-26 한국전자통신연구원 Mdct 기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
WO2010101190A1 (ja) 2009-03-06 2010-09-10 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP2011509426A (ja) * 2008-01-04 2011-03-24 ドルビー・インターナショナル・アーベー オーディオエンコーダおよびデコーダ
JP2011518345A (ja) * 2008-03-14 2011-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング
JP2011133637A (ja) * 2009-12-24 2011-07-07 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置及びプログラム
JP2011527441A (ja) * 2008-07-10 2011-10-27 ヴォイスエイジ・コーポレーション スーパーフレームにおいてlpcフィルタの量子化および逆量子化を行うためのデバイスおよび方法
JP4819881B2 (ja) * 2005-04-28 2011-11-24 シーメンス アクチエンゲゼルシヤフト ノイズを抑制するための方法と装置
JP2012505423A (ja) * 2008-10-08 2012-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
RU2455709C2 (ru) * 2008-03-03 2012-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки аудиосигнала
JP2013508766A (ja) * 2009-10-20 2013-03-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム
JP2013530551A (ja) * 2010-03-22 2013-07-25 アンワイヤード テクノロジー,リミテッド ライアビリティ カンパニー デュアルモード符号化器、デュアルモード符号化器を備えるシステム、及び赤外線信号を生成する方法
US8990072B2 (en) 2008-07-14 2015-03-24 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding of integrated speech and audio utilizing a band expander to output the audio or speech to a frequency domain encoder or an LPC encoder
JP2015092254A (ja) * 2010-07-19 2015-05-14 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 帯域幅拡張のためのスペクトル平坦性制御
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
WO2001069938A1 (en) * 2000-03-15 2001-09-20 Digital Accelerator Corporation Coding of digital video with high motion content
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
JP4867076B2 (ja) * 2001-03-28 2012-02-01 日本電気株式会社 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
JP2005524450A (ja) * 2002-05-02 2005-08-18 フォーキッズ エンターテイメント ライセンシング, インク. ハンドヘルドデータ圧縮装置
JP4208533B2 (ja) * 2002-09-19 2009-01-14 キヤノン株式会社 画像処理装置及び画像処理方法
US20060106597A1 (en) * 2002-09-24 2006-05-18 Yaakov Stein System and method for low bit-rate compression of combined speech and music
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US20050154636A1 (en) * 2004-01-11 2005-07-14 Markus Hildinger Method and system for selling and/ or distributing digital audio files
US20050159942A1 (en) * 2004-01-15 2005-07-21 Manoj Singhal Classification of speech and music using linear predictive coding coefficients
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
JP2007538282A (ja) * 2004-05-17 2007-12-27 ノキア コーポレイション 各種の符号化フレーム長でのオーディオ符号化
US7739120B2 (en) * 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
WO2005112004A1 (en) * 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding models
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US20080215340A1 (en) * 2005-05-25 2008-09-04 Su Wen-Yu Compressing Method for Digital Audio Files
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
KR100715949B1 (ko) * 2005-11-11 2007-05-08 삼성전자주식회사 고속 음악 무드 분류 방법 및 그 장치
AU2007206167B8 (en) * 2006-01-18 2010-06-24 Industry-Academic Cooperation Foundation, Yonsei University Apparatus and method for encoding and decoding signal
KR100717387B1 (ko) * 2006-01-26 2007-05-11 삼성전자주식회사 유사곡 검색 방법 및 그 장치
KR100749045B1 (ko) * 2006-01-26 2007-08-13 삼성전자주식회사 음악 내용 요약본을 이용한 유사곡 검색 방법 및 그 장치
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8504376B2 (en) 2006-09-29 2013-08-06 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
US20090210239A1 (en) * 2006-11-24 2009-08-20 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
MY148913A (en) 2006-12-12 2013-06-14 Fraunhofer Ges Forschung Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CN101025918B (zh) * 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
EP2115739A4 (en) 2007-02-14 2010-01-20 Lg Electronics Inc METHODS AND APPARATUSES FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
CA2702669C (en) * 2007-10-15 2015-03-31 Lg Electronics Inc. A method and an apparatus for processing a signal
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
AU2012201692B2 (en) * 2008-01-04 2013-05-16 Dolby International Ab Audio Encoder and Decoder
KR101441896B1 (ko) * 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
EP2259254B1 (en) * 2008-03-04 2014-04-30 LG Electronics Inc. Method and apparatus for processing an audio signal
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2139000B1 (en) * 2008-06-25 2011-05-25 Thomson Licensing Method and apparatus for encoding or decoding a speech and/or non-speech audio input signal
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
CA2730200C (en) * 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
PL2352147T3 (pl) * 2008-07-11 2014-02-28 Fraunhofer Ges Forschung Urządzenie i sposób kodowania sygnału audio
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
RU2492530C2 (ru) * 2008-07-11 2013-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен
AU2009267394B2 (en) * 2008-07-11 2012-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder for encoding frames of sampled audio signals
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
PL2146344T3 (pl) 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
KR101649376B1 (ko) 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
WO2010044593A2 (ko) * 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
JP5519230B2 (ja) * 2009-09-30 2014-06-11 パナソニック株式会社 オーディオエンコーダ及び音信号処理システム
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
KR101397058B1 (ko) 2009-11-12 2014-05-20 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
ES2958392T3 (es) 2010-04-13 2024-02-08 Fraunhofer Ges Forschung Método de decodificación de audio para procesar señales de audio estéreo usando una dirección de predicción variable
KR102492622B1 (ko) 2010-07-02 2023-01-30 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
TWI421860B (zh) * 2010-10-28 2014-01-01 Pacific Tech Microelectronics Inc Dynamic sound quality control device
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
CN102074242B (zh) * 2010-12-27 2012-03-28 武汉大学 语音音频混合分级编码中核心层残差提取系统及方法
PL3244405T3 (pl) 2011-03-04 2019-12-31 Telefonaktiebolaget Lm Ericsson (Publ) Dekoder audio z korekcją wzmocnienia po kwantyzacji
US9542149B2 (en) 2011-11-10 2017-01-10 Nokia Technologies Oy Method and apparatus for detecting audio sampling rate
EP2830062B1 (en) 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
WO2014001182A1 (en) * 2012-06-28 2014-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based audio coding using improved probability distribution estimation
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
PL401346A1 (pl) * 2012-10-25 2014-04-28 Ivona Software Spółka Z Ograniczoną Odpowiedzialnością Generowanie spersonalizowanych programów audio z zawartości tekstowej
PL401371A1 (pl) * 2012-10-26 2014-04-28 Ivona Software Spółka Z Ograniczoną Odpowiedzialnością Opracowanie głosu dla zautomatyzowanej zamiany tekstu na mowę
PL401372A1 (pl) * 2012-10-26 2014-04-28 Ivona Software Spółka Z Ograniczoną Odpowiedzialnością Hybrydowa kompresja danych głosowych w systemach zamiany tekstu na mowę
EP4407616A3 (en) 2012-11-13 2024-10-02 Samsung Electronics Co., Ltd. Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals
KR101766802B1 (ko) * 2013-01-29 2017-08-09 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 코딩 모드 스위칭 보상을 위한 개념
PL2981958T3 (pl) * 2013-04-05 2018-07-31 Dolby International Ab Koder i dekoder audio
CN106409310B (zh) 2013-08-06 2019-11-19 华为技术有限公司 一种音频信号分类方法和装置
SG11201601298WA (en) * 2013-08-23 2016-03-30 Fraunhofer Ges Forschung Apparatus and method for processing an audio signal using an aliasing error signal
CN107424622B (zh) * 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
WO2017005296A1 (en) 2015-07-06 2017-01-12 Nokia Technologies Oy Bit error detector for an audio signal decoder
CN111916059B (zh) * 2020-07-01 2022-12-27 深圳大学 一种基于深度学习的平滑语音检测方法、装置及智能设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5734789A (en) 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5717823A (en) 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
TW271524B (ja) 1994-08-05 1996-03-01 Qualcomm Inc
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
WO1999050828A1 (en) * 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
JP4359949B2 (ja) * 1998-10-22 2009-11-11 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6310915B1 (en) 1998-11-20 2001-10-30 Harmonic Inc. Video transcoder with bitstream look ahead for rate control and statistical multiplexing
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4819881B2 (ja) * 2005-04-28 2011-11-24 シーメンス アクチエンゲゼルシヤフト ノイズを抑制するための方法と装置
JP2009545780A (ja) * 2006-07-31 2009-12-24 クゥアルコム・インコーポレイテッド オーディオ信号に関連付けられるフレームを持つ窓を修正するためのシステムと方法
JP2010506239A (ja) * 2006-10-10 2010-02-25 クゥアルコム・インコーポレイテッド オーディオ信号を符号化及び復号化する方法及び装置
US9583117B2 (en) 2006-10-10 2017-02-28 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
JP2008111991A (ja) * 2006-10-30 2008-05-15 Ntt Docomo Inc 復号装置、符号化装置、復号方法及び符号化方法
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8938387B2 (en) 2008-01-04 2015-01-20 Dolby Laboratories Licensing Corporation Audio encoder and decoder
US8924201B2 (en) 2008-01-04 2014-12-30 Dolby International Ab Audio encoder and decoder
JP2011509426A (ja) * 2008-01-04 2011-03-24 ドルビー・インターナショナル・アーベー オーディオエンコーダおよびデコーダ
US8484019B2 (en) 2008-01-04 2013-07-09 Dolby Laboratories Licensing Corporation Audio encoder and decoder
JP2014016625A (ja) * 2008-01-04 2014-01-30 Dolby International Ab オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法
US8494863B2 (en) 2008-01-04 2013-07-23 Dolby Laboratories Licensing Corporation Audio encoder and decoder with long term prediction
RU2455709C2 (ru) * 2008-03-03 2012-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки аудиосигнала
JP2011518345A (ja) * 2008-03-14 2011-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング
US8712764B2 (en) 2008-07-10 2014-04-29 Voiceage Corporation Device and method for quantizing and inverse quantizing LPC filters in a super-frame
JP2011527441A (ja) * 2008-07-10 2011-10-27 ヴォイスエイジ・コーポレーション スーパーフレームにおいてlpcフィルタの量子化および逆量子化を行うためのデバイスおよび方法
USRE49363E1 (en) 2008-07-10 2023-01-10 Voiceage Corporation Variable bit rate LPC filter quantizing and inverse quantizing device and method
US9245532B2 (en) 2008-07-10 2016-01-26 Voiceage Corporation Variable bit rate LPC filter quantizing and inverse quantizing device and method
US8990072B2 (en) 2008-07-14 2015-03-24 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding of integrated speech and audio utilizing a band expander to output the audio or speech to a frequency domain encoder or an LPC encoder
US10777212B2 (en) 2008-07-14 2020-09-15 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding of integrated speech and audio utilizing a band expander with a spectral band replication (SBR) to output the SBR to either time or transform domain encoding according to the input signal characteristic
US10121482B2 (en) 2008-07-14 2018-11-06 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding of integrated speech and audio utilizing a band expander with a spectral band replication (SBR) to output the SBR to either time or transform domain encoding according to the input signal characteristic
US11456002B2 (en) 2008-07-14 2022-09-27 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding of integrated speech and audio utilizing a band expander with a spectral band replication (SBR) to output the SBR to either time or transform domain encoding according to the input signal
US9711159B2 (en) 2008-07-14 2017-07-18 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding of integrated speech and audio utilizing a band expander with a spectral band replication to output the audio or speech to a frequency domain encoder or an LPC encoder
US11062718B2 (en) 2008-09-18 2021-07-13 Electronics And Telecommunications Research Institute Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and different coder
US9773505B2 (en) 2008-09-18 2017-09-26 Electronics And Telecommunications Research Institute Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and different coder
KR20100032843A (ko) * 2008-09-18 2010-03-26 한국전자통신연구원 Mdct 기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
KR101670063B1 (ko) * 2008-09-18 2016-10-28 한국전자통신연구원 Mdct 기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
JP2012505423A (ja) * 2008-10-08 2012-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
US8751245B2 (en) 2009-03-06 2014-06-10 Ntt Docomo, Inc Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program
US9214161B2 (en) 2009-03-06 2015-12-15 Ntt Docomo, Inc. Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program
WO2010101190A1 (ja) 2009-03-06 2010-09-10 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
US8666754B2 (en) 2009-03-06 2014-03-04 Ntt Docomo, Inc. Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program
EP2511906A1 (en) 2009-03-06 2012-10-17 NTT DoCoMo, Inc. Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program
EP2511907A1 (en) 2009-03-06 2012-10-17 NTT DoCoMo, Inc. Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program
JP2013508766A (ja) * 2009-10-20 2013-03-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム
JP2011133637A (ja) * 2009-12-24 2011-07-07 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置及びプログラム
US9167057B2 (en) 2010-03-22 2015-10-20 Unwired Technology Llc Dual-mode encoder, system including same, and method for generating infra-red signals
JP2013530551A (ja) * 2010-03-22 2013-07-25 アンワイヤード テクノロジー,リミテッド ライアビリティ カンパニー デュアルモード符号化器、デュアルモード符号化器を備えるシステム、及び赤外線信号を生成する方法
JP2015092254A (ja) * 2010-07-19 2015-05-14 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 帯域幅拡張のためのスペクトル平坦性制御
US10339938B2 (en) 2010-07-19 2019-07-02 Huawei Technologies Co., Ltd. Spectrum flatness control for bandwidth extension

Also Published As

Publication number Publication date
US6658383B2 (en) 2003-12-02
JP5208901B2 (ja) 2013-06-12
EP1278184A3 (en) 2004-08-18
EP1278184A2 (en) 2003-01-22
JP2010020346A (ja) 2010-01-28
DE60225381T2 (de) 2009-04-23
ATE388465T1 (de) 2008-03-15
DE60225381D1 (de) 2008-04-17
EP1278184B1 (en) 2008-03-05
US20030004711A1 (en) 2003-01-02

Similar Documents

Publication Publication Date Title
JP5208901B2 (ja) 音声信号および音楽信号を符号化する方法
US6829579B2 (en) Transcoding method and system between CELP-based speech codes
US11282530B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
KR100873836B1 (ko) Celp 트랜스코딩
KR100956623B1 (ko) 잔여분 변경에 의한 보코더 내부의 프레임들을 시간 와핑하는 시스템 및 방법
US8548801B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
JP2011503653A (ja) スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術
US20060277040A1 (en) Apparatus and method for coding and decoding residual signal
JP2006072026A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2005515486A (ja) Celpによる音声符号間のトランスコーディング・スキーム
KR20080092823A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090113

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090313

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091026

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20091027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20091027

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091124

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20091218