JP2006126826A - オーディオ信号符号化/復号化方法及びその装置 - Google Patents

オーディオ信号符号化/復号化方法及びその装置 Download PDF

Info

Publication number
JP2006126826A
JP2006126826A JP2005294095A JP2005294095A JP2006126826A JP 2006126826 A JP2006126826 A JP 2006126826A JP 2005294095 A JP2005294095 A JP 2005294095A JP 2005294095 A JP2005294095 A JP 2005294095A JP 2006126826 A JP2006126826 A JP 2006126826A
Authority
JP
Japan
Prior art keywords
time axis
frame
audio
encoding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005294095A
Other languages
English (en)
Inventor
Yoon-Hark Oh
潤 學 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2006126826A publication Critical patent/JP2006126826A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Abstract

【課題】 オーディオ信号に対して類似性を有するフレームを時間軸変更を通じて減らすことによって、高周波領域を損失せず、優れたオーディオ音質で再生できるオーディオ信号符号化/復号化方法及びその装置を提供する。
【解決手段】 入力オーディオ信号に対してフレーム別に類似度を判断して時間軸に圧縮し、フレーム時間軸変更フラグを発生させる符号化過程と、フレーム時間軸変更フラグによって圧縮されたオーディオ信号を時間軸伸長を通じてデコーディングする符号化過程とを含む。
【選択図】 図2A

Description

本発明は、オーディオコーデック(CODEC:Coder/Decoder)に係り、特に、時間軸圧縮/伸長を通じてオーディオ信号の高周波領域を損失せずに、高音質で再生するオーディオ符号化/復号化方法及び装置に関する。
通常、MPEG−1(Moving Picture Expert Group−1)は、デジタルビデオ及びデジタルオーディオ圧縮に関する標準を制定する動画専門家グループを称し、この機構は、世界標準化機構であるISO(International Standardization Organization)の後援を受けている。MPEG−1オーディオは、基本的に60分や72分ほどのCDに保存された44.1Khzのサンプリングレートのオーディオ信号を圧縮する時に使われるが、圧縮方法及びコーデックの複雑度によって3層のレイヤに分けられる。
そのうち、レイヤ3は、最も複雑な方法であって、レイヤ2に比べて顕著に多くのフィルタを使用し、ハフマンコーディングを使用する。また、レイヤ3は、エンコーディング時、ビット率(112Kbps、128Kbps、160Kbpsなど)によって音質性能が変わる。一般的に、MPEG−1レイヤ3オーディオをMP3オーディオと称す。
MP3オーディオは、フィルタバンクからなるDCT(Discrete Cosine Transform)と心理音響モデル2とを利用したビット割当及び量子化によってエンコーディングされる。
しかし、MP3オーディオは、圧縮するほど高周波数領域を損失する。例えば、96kbpsのMP3ファイルである場合、32個のフィルタバンク値のうち11.025kHz以上の周波数成分が損失される。128kbpsのMP3ファイルである場合、15kHzの32個のフィルターバンク値のうち、15kHz以上の周波数成分が損失される。人間の聴感は、一般的に、一部高周波成分にあまり敏感でないため、高周波数帯域は、時々オーディオ信号をMP3フォーマットに圧縮するために捨てられる。したがって、このような高周波領域が損失されたオーディオ信号は、損失によって音色が変わり、明瞭度が低下し、かつ押さえられるか、または濁っている音が出る。
韓国特許公開第2004−0044389号公報 日本特許公開2000−322099号公報
本発明が解決しようとする技術的課題は、時間軸圧縮/伸長を通じてオーディオ信号の高周波領域を損失せず、高音質で再生するオーディオ符号化及び復号化方法を提供することである。
本発明が解決しようとする他の技術的課題は、オーディオ符号化及び復号化方法を適用したオーディオ符号化及び復号化装置を提供することである。
前記課題を解決するために、本発明は、オーディオ符号化及び/または復号化方法において、入力オーディオ信号に対して、フレーム間の類似度を判断して時間軸に変換し、フレーム時間軸変更フラグを発生させる前処理過程と、前記前処理過程で時間軸に圧縮されたオーディオ信号を心理音響モデルに基づいてエンコーディングするエンコーディング過程と、前記エンコーディング過程でエンコーディングされたオーディオ信号に対してデコーディングする過程と、前記フレーム時間軸変更フラグがイネーブルされた場合、時間軸伸長を通じてオーディオ信号を再生する後処理過程と、を含むことを特徴とする。
前記他の課題を解決するために、本発明は、オーディオ符号化/復号化装置において、入力オーディオ信号に対してフレーム別に類似度によって時間軸に変更し、フレーム時間軸変更フラグを発生させる前処理手段と、前記前処理手段で時間軸に変更されたオーディオ信号を心理音響モデルに基づいてエンコーディングするエンコーディング手段と、前記エンコーディング手段でエンコーディングされたオーディオ信号に対してフィルタバンク成分を復元するデコーディング手段と、前記フレーム時間軸変更フラグがイネーブルされた場合、時間軸伸長を通じて前記デコーディング手段でデコーディングされたオーディオ信号を再生する後処理手段と、を備えることを特徴とする。
本発明によれば、オーディオ信号に対して類似性を有するフレームを時間軸変更を通じて減らすことによって、高周波領域を損失せず、優れたオーディオ音質で再生できる。
以下、添付された図面を参照して、本発明の望ましい実施形態を説明する。
図1は、本発明によるオーディオ符号化装置を示すブロック図である。
前処理部110は、入力オーディオ信号に対してフレーム間類似度を判別し、その類似度が大きい場合、当該フレームのオーディオ信号を時間軸に圧縮してフレーム時間軸変更フラグを発生させる。
エンコーダ120は、前処理部110で前処理されたオーディオ信号に対して心理音響モデルに基づいてエンコーディングする。
パッキング部130は、前処理110で生成されたフレーム時間軸変更フラグとエンコーダ120でエンコーディングされたビットストリームとを一つの出力ストリームで構成する。
図2Aは、図1の前処理部110の一実施形態である。図2Aを参照するに、フレーム類似度判断部210は、入力信号に対してフレーム別に周波数成分を分析し、その周波数成分間の差に基づいてフレーム間の類似度を判断する。そして、フレーム類似度判断部210は、以前フレームと現在フレームとの類似度が所定値以上である場合、フレーム時間軸変更フラグを発生させる。
時間軸変更部220は、フレーム類似度判断部210で発生する時間軸変更フラグによってフレームを時間軸に圧縮する。
図2Bは、図1の前処理部110の他の実施形態である。図2Bを参照するに、フレーム類似度判断部210は、以前フレームと現在フレームとの類似度が所定値以上である場合、フレームスキップフラグを発生させる。
フレームスキップ部220−1は、フレーム類似度判断部210で発生するフレームスキップフラグによって現在フレームをスキップする。
フレームスキップフラグは、フレームスキップ部220−1に、現在フレームが以前フレームと類似しているため、現在フレームが符号化されてはならないことを知らせる。フレームスキップフラグは、復号装置に符号化過程中に現在フレームがスキップされたことを知らせるために、復号されたオーディオデータと共にパッキング部(図1参照)によってビットストリームでパッキングされる。したがって、復号装置は、現在フレームのデータを推論するために、以前フレームのデータを使用できる。
図3は、図1のエンコーダ120の一実施形態である。図3を参照するに、フィルターバンク部310は、各グラニュール単位で入力されるPCMオーディオサンプルを多重位相バンクを利用して32サブ帯域に帯域分割する。付加的に、それぞれのサブバンドは、MDCT(Modified Discrete Cosine Transform)によって18スペクトル係数に変換される。
心理音響モデル部320は、音響心理学で明らかになったマスキング現象と可聴限界とを利用して、各バンド別に許容されるビット割当情報を決定する。人間の聴覚特性では、高いレベルの周波数成分が低いレベルの隣接周波数をマスクする効果がある。
ビット割当部330は、心理音響モデル部320の心理音響モデルから決定された各バンド別の割当情報を利用して、フィルタバンク部310から分割された各フィルターバンク帯域またはスペクトル係数にビットを割当する。
図4は、本発明によるオーディオ復号化装置のブロック図である。
アンパッキング部410は、入力ストリームからフレーム時間軸変更フラグ及びヘッダ情報、サイド情報及びメインデータビットを分離する。
デコーダ部420は、アンパッキング部410から分離されたメインデータビットに対してMDCT成分またはフィルタバンク成分を復元し、そのMDCT成分またはフィルタバンク成分に対して逆MDCTまたは逆フィルタリングを行って最終オーディオ信号を生成する。
後処理部320は、アンパッキング部410から受信されたフレーム時間軸変更フラグがイネーブルされた場合、時間軸伸長を通じてデコーダ部420でデコーディングされたオーディオ信号を元来のオーディオ信号に変更する。すなわち、フレーム時間軸変更フラグは、後処理部430に、当該フレームの復号されたオーディオ信号が以前符号化処理中に時間のフレーム変更(例えば、圧縮)された時を知らせる。
図5は、図4の後処理部320の一実施形態である。図5を参照するに、時間軸変更部550は、デコーダ部420でデコーディングされたオーディオ信号x(n)をフレーム時間軸変更フラグによって時間軸伸長を行って元来のオーディオ信号に伸長する。
図6は、図1のデコーダ部420の一実施形態である。図6を参照するに、逆量子化部610は、アンパッキングされたメインデータビットに対して逆量子化を通じてMDCT成分またはフィルタバンク成分を復元する。
逆フィルタバンク部620は、MDCT成分またはフィルタバンク成分に対して逆MDCTまたは逆フィルタリングを行って最終オーディオ信号を生成する。
図7は、図2のフレーム類似度判断部210の詳細フローチャートである。
まず、オーディオ信号を入力する(710過程)。
次いで、入力されたオーディオ信号に対してFFTを利用してフレーム別に周波数成分を分析する(720過程)。
次いで、以前フレームと現在フレームとの間に分析された周波数成分の差を計算する(730過程)。
次いで、周波数成分の差値が臨界値より小さいか、または同じであれば(740過程)、以前フレームと現在フレームとの間に類似性があると判断して、フレーム時間軸変更フラグを発生させ(750過程)、一方、周波数成分の差値が臨界値より大きければ、以前フレームと現在フレームとの間に類似性がないと判断してフレーム時間軸変更フラグを発生させない。
図8A乃至図8Cは、図1及び図4の前処理部110及び後処理部430で適用される時間軸変化方法を示す波形図である。
時間軸変換は、信号の再生速度の変更を意味する。この時間軸変換は、出力される信号のピッチを変えずに再生率を修正する。
時間軸変換は、2つの主要な動作である時間軸圧縮(再生速度の増加)、時間軸伸長(再生速度の減少)で構成される。前処理部110で適用される時間軸圧縮は、整数倍のピッチ区間を削除することによって行われ、後処理部430で適用される時間軸伸長は、追加的なピッチ区間を挿入することによって行われる。このピッチ区間は、入力フレーム内に必ずしも存在せねばならない。通常的に、時間軸変換は、色々な方法があるが、一般的に性能に優れたSOLA(Synchronized Over Lap Add)方式を良く使用する。
SOLAは、相互相関係数を利用するが、これは、フーリエ変換を行わずとも、時間次元で時間軸変換を行うことを可能にする。
SOLAは、信号のピッチに関係なく動作する。すなわち、入力信号は、固定された長さを有して、その入力信号を複数個のウィンドウに分けて伝える。このとき、固定された長さは、最小2〜3個のピッチ区間を有さねばならない。
出力される信号は、このような信号内のピッチ区間を重畳及び加算することによって合成される。
x(n)を入力信号、y(n)を時間軸変換された信号とすれば、長さがNであるフレームが与えられるとき、入力される信号のフレーム間の間隔をS、時間軸変換された信号のフレーム間の間隔をSという。このとき、S/Sは、変換率aとなる。ここで、aが1より大きければ、時間軸圧縮に該当し、aが1より小さければ、時間軸伸長に該当する。
まず、SOLAは、x(n)からy(n)に第1のフレームを複写する。そして、第mの入力信号x(mS+j)(0≦j≦N−1)は、フレーム別に隣接した時間軸変換信号y(mS+j)で同期が合わせられて加えられる。現在フレームと以前フレームとの相互相関を最大化させるために、現在フレームが移動する。したがってSOLAは、フレーム内で可変的な重畳領域を許容し、これは、入力信号のピッチに影響を与えず、入力信号の時間軸を変換する。フレームを重畳領域で合わせるとき、加重値関数を利用する。第mのフレームでSOLAの正規化された相互相関係数Rは、許容される範囲のフレーム配置オフセットkに対して式(2)のように求められる。
Figure 2006126826

ここで、x(n)は、時間軸変換のための入力信号を表し、y(n)は、時間軸変換された信号を表す。そして、mは、フレーム数を表し、Lは、x(n)とy(n)との重畳される領域の長さを表す。
したがって、Rが決定されれば、時間軸変換されたy(n)は、式(3)のように更新される。
Figure 2006126826
ここで、Lは、既定のRが含まれる2つの信号間の重畳領域を表し、f(j)は、0≦f(j)≦1にする加重関数を表す。
したがって、図8A乃至図8Cに示したように、SOLA方式を利用して元来の信号を時間軸圧縮及び伸長を行う。すなわち、(a)は、元来信号(solidで表示される)と第1、第2オーバラッピングセグメント(dottedで表示される)とを示している。(b)は、元来の信号を同期化されたセグメントオーバラップで時間軸拡張する波形図である。(c)は、元来の信号を同期化されたセグメントオーバラップで時間軸圧縮する波形図である。
本発明は、前述した実施形態に限定されず、本発明の思想内で当業者による変形が可能である。
本発明は、一般的に、デジタルTV、DVD、デジタル音楽放送(DAB:Digital Audio Broadcasting)及びMP3プレイヤに適用可能である。
本発明によるオーディオ符号化装置を示すブロック図である。 図1のオーディオ符号化装置の前処理部の一実施形態を示す図である。 図1のオーディオ符号化装置の前処理部の他の実施形態を示す図である。 図1のエンコーダの一実施形態を示す図である。 本発明によるオーディオ復号化装置を示すブロック図である。 図4の後処理部の一実施形態を示す図である。 図1のデコーダ部の一実施形態を示す図である。 図2のフレーム類似度判断部の詳細フローチャートである。 図1及び図4の前処理部及び後処理部で適用される時間軸変化方法を示す波形図である。 図1及び図4の前処理部及び後処理部で適用される時間軸変化方法を示す波形図である。 図1及び図4の前処理部及び後処理部で適用される時間軸変化方法を示す波形図である。
符号の説明
210 フレーム類似度判断部
220 時間軸変更部

Claims (22)

  1. オーディオ符号化及び/または復号化方法において、
    入力オーディオ信号に対してフレーム間の類似度を判断して時間軸に圧縮し、フレーム時間軸変更フラグを発生させる符号化過程と、
    前記符号化過程でフレーム時間軸変更フラグによって圧縮されたオーディオ信号を時間軸伸長を通じてデコーディングする復号化過程と、を含むオーディオ符号化/復号化方法。
  2. 前記符号化過程は、
    入力オーディオ信号に対してフレーム間の類似度を判断して時間軸に圧縮し、フレーム時間軸変更フラグを発生させる前処理過程と、
    前記前処理過程で時間軸に圧縮されたオーディオ信号を心理音響モデルに基づいてエンコーディングするエンコーディング過程と、
    前記前処理過程で発生したフレーム時間軸変更フラグと前記エンコーディング過程でエンコーディングされたオーディオデータとをビットストリームに変換するパッキング過程と、を含むことを特徴とする請求項1に記載のオーディオ符号化/復号化方法。
  3. 前記オーディオ信号の前処理過程は、下記の式による同期化された重畳及び加算処理を行う過程を含み、
    Figure 2006126826

    ここで、Rは、相互相関係数、x(n)は、入力信号を表し、y(n)は、時間軸変換された信号、Sは、入力される信号x(n)のフレーム間の間隔、Sは、時間軸変換された信号y(n)のフレーム間の間隔、Nは、フレームの長さ、mは、フレーム数、Lは、x(n)とy(n)との重畳される領域の長さであることを特徴とする請求項2に記載のオーディオ符号化/復号化方法。
  4. 前記前処理過程は、
    入力信号に対してフレーム間の類似度を判断して以前フレームと現在フレームとの類似度が所定値以上である場合、フレーム時間軸変更フラグを発生させる過程と、
    前記発生する時間軸変更フラグによって、フレームを時間軸に圧縮する過程と、を含むことを特徴とする請求項2に記載のオーディオ符号化/復号化方法。
  5. 前記類似度判定過程は、
    入力オーディオ信号の各フレームに対して周波数成分を分析する過程と、
    現在フレームと以前フレームとの間に前記分析された周波数成分の差を決定する過程と、
    前記周波数成分の差値が臨界値より小さければ、以前フレームと現在フレームとの間に類似性があると判断し、前記周波数成分の差値が臨界値より大きければ、以前フレームと現在フレームとの間に類似性がないと判定する過程と、を含むことを特徴とする請求項4に記載のオーディオ符号化/復号化方法。
  6. 前記前処理過程は、
    入力信号に対してフレーム間の類似度を判断する過程と、
    前記以前フレームと現在フレームとの類似度が所定値以上である場合、現在フレームをスキップする過程と、を含むことを特徴とする請求項2に記載のオーディオ符号化/復号化方法。
  7. 前記類似度判定過程は、
    オーディオ信号に対してフレームごとに周波数成分を分析する過程と、
    以前フレームと現在フレームとの間に前記分析された周波数成分の差を計算する過程と、
    前記周波数成分の差値が臨界値より小さければ、以前フレームと現在フレームとの間に類似性があると判断し、そうでなければ、以前フレームと現在フレームとの間に類似性がないと判定する過程と、であることを特徴とする請求項6に記載のオーディオ符号化/復号化方法。
  8. 前記入力オーディオ信号のエンコーディング過程は、
    入力されるオーディオサンプルを多重位相バンクを通じて複数個のサブバンドに分割する過程と、
    複数個のサブバンドの音響心理学のマスキング現象と可聴限界とによって、各サブバンドに対するビット割当情報を決定する過程と、
    前記過程で決定された各サブバンド別のビット割当情報に基づいて、前記複数個のサブバンドにビットを割当する過程と、を含むことを特徴とする請求項2に記載のオーディオ符号化/復号化方法。
  9. 前記復号化過程は、
    入力されるビットストリームからフレーム時間軸変更フラグ及びオーディオデータを分離するアンパッキング過程と、
    前記過程でオーディオデータを所定のデコーディングアルゴリズムに基づいてデコーディングするデコーディング過程と、
    前記過程でフレーム時間軸変更フラグがイネーブルされた場合、そのフレームで時間軸の伸長を通じてオーディオ信号を伸長する後処理過程と、を含むことを特徴とする請求項1に記載のオーディオ符号化/復号化方法。
  10. オーディオ符号化方法において、
    複数個の時間フレームに分けられたデータを有する入力信号を受信する過程と、
    前記入力信号の複数個フレームのうち、類似度を決定し、現在フレームの少なくとも一部のデータが符号化されないことを表すために、現在フレームが以前フレームと類似していると決定されれば、時間軸変更フラグを発生させる過程と、
    前記時間軸変更フラグの発生によって、時間軸に対して前記複数個フレームのデータを圧縮する過程と、
    前記圧縮されたデータ及び少なくとも一つ以上の前記時間軸変更フラグを含むビットストリームを形成する過程と、を含むオーディオ符号化方法。
  11. 前記複数個フレームのデータを圧縮する過程は、当該時間軸変更フラグが発生すれば、現在フレームをスキップする過程を含むことを特徴とする請求項10に記載のオーディオ符号化方法。
  12. 前記類似度決定過程は、入力信号の複数個の周波数サブバンドの周波数成分を比較する過程を含むことを特徴とする請求項10に記載のオーディオ符号化方法。
  13. 前記周波数成分の比較過程は、現在フレームと以前フレームとの周波数成分の差を計算し、前記計算された周波数成分の差と類似臨界値とを比較する過程を含むことを特徴とする請求項12に記載のオーディオ符号化方法。
  14. 前記ビットストリーム形成過程は、
    心理音響モデルによって前記圧縮されたデータを符号化する過程と、
    前記符号化されたデータ、前記少なくとも一つ以上の時間軸変更フラグの発生、ヘッダ情報、及び付加情報をビットストリームにパッキングする過程と、を含むことを特徴とする請求項10に記載のオーディオ符号化方法。
  15. 前記データ圧縮過程は、信号再生率を上昇させることであることを特徴とする請求項10に記載のオーディオ符号化方法。
  16. 前記複数個のフレームのデータ圧縮過程は、前記入力信号のピッチ区間を重畳し、かつ加算することであることを特徴とする請求項10に記載のオーディオ符号化方法。
  17. 時間軸に対してオーディオ信号を圧縮してオーディオ信号の信号再生率を向上させるために、オーディオ信号上で時間軸変更動作を行う過程と、
    心理音響モデルによってビットを割当して前記圧縮されたオーディオ信号を符号化する過程と、を含むオーディオデータの符号化方法。
  18. 入力ビットストリームを受信してオーディオデータと少なくとも一つ以上の時間軸変更フラグとを抽出する過程と、
    前記入力ビットストリームから前記オーディオデータを復号してオーディオ信号を獲得する過程と、
    前記オーディオデータと共に受信された前記少なくとも一つ以上の時間軸変更フラグによって、前記時間軸に対して前記復号されたオーディオ信号を伸長する過程と、を含むオーディオデータの復号化方法。
  19. 前記少なくとも一つ以上の時間軸変更フラグは、以前符号化動作中に時間軸に対して圧縮された少なくとも一つ以上のフレームのオーディオ信号を表すものであることを特徴とする請求項18に記載のオーディオデータの復号化方法。
  20. 前記少なくとも一つ以上の時間軸変更フラグは、以前符号化動作中にスキップされた少なくとも一つ以上のフレームのオーディオ信号を表すものであることを特徴とする請求項18に記載のオーディオデータの復号化方法。
  21. オーディオ符号化及び/または復号化装置において、
    入力オーディオ信号に対してフレーム間の類似度によって時間軸に圧縮し、フレーム時間軸変更フラグを発生させる前処理手段と、
    前記前処理手段で時間軸に圧縮されたオーディオ信号を心理音響モデルに基づいてエンコーディングするエンコーディング手段と、
    前記エンコーディング手段で発生したフレーム時間軸変更フラグと前記エンコーディング手段でエンコーディングされたオーディオデータとをビットストリームに変換するパッキング手段と、
    前記パッキング手段から受信されるビットストリームからフレーム時間軸変更フラグ及びオーディオデータを分離するアンパッキング手段と、
    前記アンパッキング手段から分離されたオーディオデータを所定のデコーディングアルゴリズムによって復元するデコーディング手段と、
    前記アンパッキング手段から分離されたフレーム時間軸変更フラグがイネーブルされた場合、時間軸の伸長を通じて前記デコーディング手段でデコーディングされたオーディオ信号を伸長する後処理手段と、を備えるオーディオ符号化/復号化装置。
  22. 前記前処理手段は、
    入力信号に対してフレーム別に周波数成分を分析して、その周波数成分間の差に基づいてフレーム間の類似度を判断し、以前フレームと現在フレームとの類似度が所定値以上である場合、フレーム時間軸変更フラグを発生させるフレーム類似度判断部と、
    前記フレーム類似度判断部で発生する時間軸変更フラグによって、フレームを時間軸に圧縮する時間軸変更部と、を備えることを特徴とする請求項21に記載のオーディオ符号化/復号化装置。
JP2005294095A 2004-10-26 2005-10-06 オーディオ信号符号化/復号化方法及びその装置 Pending JP2006126826A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040085806A KR100750115B1 (ko) 2004-10-26 2004-10-26 오디오 신호 부호화 및 복호화 방법 및 그 장치

Publications (1)

Publication Number Publication Date
JP2006126826A true JP2006126826A (ja) 2006-05-18

Family

ID=36317457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005294095A Pending JP2006126826A (ja) 2004-10-26 2005-10-06 オーディオ信号符号化/復号化方法及びその装置

Country Status (5)

Country Link
US (1) US20060100885A1 (ja)
JP (1) JP2006126826A (ja)
KR (1) KR100750115B1 (ja)
CN (1) CN1767394A (ja)
NL (1) NL1030280C2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070036228A1 (en) * 2005-08-12 2007-02-15 Via Technologies Inc. Method and apparatus for audio encoding and decoding
US8155972B2 (en) * 2005-10-05 2012-04-10 Texas Instruments Incorporated Seamless audio speed change based on time scale modification
KR20080072223A (ko) * 2007-02-01 2008-08-06 삼성전자주식회사 파라메트릭 부/복호화 방법 및 이를 위한 장치
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
US9275652B2 (en) * 2008-03-10 2016-03-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for manipulating an audio signal having a transient event
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
KR101211683B1 (ko) * 2008-12-31 2012-12-12 에스케이하이닉스 주식회사 반도체 집적회로
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR102422794B1 (ko) * 2015-09-04 2022-07-20 삼성전자주식회사 재생지연 조절 방법 및 장치와 시간축 변형방법 및 장치
CN107135443B (zh) * 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
CN107424620B (zh) * 2017-07-27 2020-12-01 苏州科达科技股份有限公司 一种音频解码方法和装置
US10854209B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Multi-stream audio coding
US11627361B2 (en) * 2019-10-14 2023-04-11 Meta Platforms, Inc. Method to acoustically detect a state of an external media device using an identification signal

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004519738A (ja) * 2001-04-05 2004-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 決定された信号型式に固有な技術を適用する信号の時間目盛修正

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
US5920840A (en) * 1995-02-28 1999-07-06 Motorola, Inc. Communication system and method using a speaker dependent time-scaling technique
TW419645B (en) * 1996-05-24 2001-01-21 Koninkl Philips Electronics Nv A method for coding Human speech and an apparatus for reproducing human speech so coded
KR100327969B1 (ko) * 1996-11-11 2002-04-17 모리시타 요이찌 음성재생속도변환장치및음성재생속도변환방법
JP3017715B2 (ja) * 1997-10-31 2000-03-13 松下電器産業株式会社 音声再生装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JP3430968B2 (ja) * 1999-05-06 2003-07-28 ヤマハ株式会社 ディジタル信号の時間軸圧伸方法及び装置
ES2298394T3 (es) * 2001-05-10 2008-05-16 Dolby Laboratories Licensing Corporation Mejora de sesiones transitorias de sistemas de codificacion de señales de audiofrecuencia a baja velocidad de transferencia de bits por reduccion de preruidos.
CN1288622C (zh) * 2001-11-02 2006-12-06 松下电器产业株式会社 编码设备和解码设备
US7065485B1 (en) * 2002-01-09 2006-06-20 At&T Corp Enhancing speech intelligibility using variable-rate time-scale modification
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
KR100501930B1 (ko) * 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US6982377B2 (en) * 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004519738A (ja) * 2001-04-05 2004-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 決定された信号型式に固有な技術を適用する信号の時間目盛修正

Also Published As

Publication number Publication date
KR20060036724A (ko) 2006-05-02
KR100750115B1 (ko) 2007-08-21
CN1767394A (zh) 2006-05-03
NL1030280C2 (nl) 2009-09-30
US20060100885A1 (en) 2006-05-11
NL1030280A1 (nl) 2006-04-27

Similar Documents

Publication Publication Date Title
JP2006126826A (ja) オーディオ信号符号化/復号化方法及びその装置
JP3926726B2 (ja) 符号化装置および復号化装置
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
KR101586317B1 (ko) 신호 처리 방법 및 장치
RU2491658C2 (ru) Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
EP1895511B1 (en) Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus
KR100818268B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
US20060004566A1 (en) Low-bitrate encoding/decoding method and system
EP1798724A1 (en) Encoder, decoder, encoding method, and decoding method
JP4800645B2 (ja) 音声符号化装置、及び音声符号化方法
JP2006048043A (ja) オーディオデータの高周波数の復元方法及びその装置
EP1441330B1 (en) Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method
US7466245B2 (en) Digital signal processing apparatus, digital signal processing method, digital signal processing program, digital signal reproduction apparatus and digital signal reproduction method
EP1386310A1 (en) Device to encode, decode and broadcast audio signal with reduced size spectral information
JP4308229B2 (ja) 符号化装置および復号化装置
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
KR100433984B1 (ko) 디지털 오디오 부호화/복호화 장치 및 방법
JP2005114813A (ja) オーディオ信号再生装置及び再生方法
JP3594829B2 (ja) Mpegオーディオの復号化方法
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111206