JP2009524846A - 適応的時間/周波数ベース符号化モード決定装置およびこのための符号化モード決定方法 - Google Patents
適応的時間/周波数ベース符号化モード決定装置およびこのための符号化モード決定方法 Download PDFInfo
- Publication number
- JP2009524846A JP2009524846A JP2008552210A JP2008552210A JP2009524846A JP 2009524846 A JP2009524846 A JP 2009524846A JP 2008552210 A JP2008552210 A JP 2008552210A JP 2008552210 A JP2008552210 A JP 2008552210A JP 2009524846 A JP2009524846 A JP 2009524846A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- time
- domain
- characteristic
- coding mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000005236 sound signal Effects 0.000 claims abstract description 94
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 238000001228 spectrum Methods 0.000 claims description 20
- 230000007774 longterm Effects 0.000 claims description 9
- 230000007704 transition Effects 0.000 claims description 9
- 230000002459 sustained effect Effects 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 2
- 230000006978 adaptation Effects 0.000 claims 2
- 238000007906 compression Methods 0.000 description 18
- 230000006835 compression Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
適応的時間/周波数ベース符号化モード決定装置および方法を提供する。本発明の一実施形態に係る適応的時間/周波数ベース符号化モード決定装置は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、入力オーディオ信号の周波数領域信号分析を実行して、入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、時間領域特性および周波数領域特性を用いて、周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器とを備えることを特徴とする。したがって、多様なオーディオコンテンツを効率的に圧縮することができる。
Description
本発明は、オーディオ符号化/復号化装置および方法に関し、より詳細には、入力オーディオデータの特性に応じて時間ベース符号化または周波数ベース符号化を適応的に選択して入力オーディオデータを符号化することで、2種類の符号化方式の符号化利得を最大限に用いて高圧縮効率を得ることができる適応的時間/周波数ベースオーディオ符号化装置および符号化モード決定方法に関する。
既存の音声/音楽圧縮方式は、オーディオコーデックと音声コーデックとに大別される。aacPlusなどのオーディオコーデックは、周波数領域上の信号を圧縮するアルゴリズムであって、心理音響モデルを適用するが、圧縮対象がオーディオ信号ではなく音声信号である場合には、同じ符号化データ量で考慮するときに、音声コーデック方式の圧縮結果物よりも音質が大きく低下し、特にアタック(attack)信号には音質低下がさらに大きい。この反面、AMR−WBなどのコーデックは、時間領域上の信号を圧縮するアルゴリズムであって、音声発声モデルを適用するが、圧縮対象が音声信号ではなくオーディオ信号の場合には、同じ符号化データ量で考慮するときに、オーディオコーデック方式の圧縮結果物よりも音質が大きく低下するという短所がある。
上述した特性を考慮し、音声/音楽圧縮を同時に効率的に実行するための従来の技術としてAMR−WB+方式(3GPP TS 26.290)があるが、これは音声圧縮方式としてACELP(Algebraic Code Excited Linear Prediction)を、オーディオ圧縮方式としてTCX(Transform Coded Excitation)を用いる。特に、このような方式は、時間軸上のフレーム別にACELP方式を適用するのかTCX方式を適用するかを決定して符号化し、圧縮対象が音声信号に近い場合には効率的に動作するが、オーディオ信号に近い場合には処理単位別の符号化過程による音質または圧縮率の劣化が発生するという問題点がある。
したがって、圧縮方式を選択的に適用して入力オーディオデータを符号化することにおいて、符号化モード決定単位をどのように決定するのか、どのような基準によって該当する決定単位に対する符号化モードを決定するのかは、符号化性能に大きい影響を及ぼす極めて重要な要素である。
本発明は、上述したような従来技術の問題点を解決するために案出されたものであって、入力オーディオ信号に対する符号化モードを周波数帯域別に判断して時間ベース符号化または周波数ベース符号化することで、2種類の符号化方式の符号化利得を効率的に用いて高圧縮性能を得られるようにすることを目的とする。
また、本発明は、入力オーディオ信号を時間領域および周波数領域別に長区間特性および短区間特性を抽出して周波数帯域別に適切な符号化モードを決定するようにし、適応的時間/周波数ベースオーディオ符号化の性能を最適化することを他の目的とする。
さらに、本発明は、開ループ(open loop)決定方式を用い、低い複雑度を有しながらも効果的に符号化モードを決定することをさらに他の目的とする。
上述した目的を達成し、従来技術の問題点を解決するために、本発明の適応的時間/周波数ベース符号化モード決定装置は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器とを備えることを特徴とする。
また、本発明の適応的時間/周波数ベースオーディオ符号化装置は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームの周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器と、前記周波数バンドそれぞれに対して前記決定された符号化モードで符号化する符号化部と、前記符号化されたデータに対するビットストリーム処理をし、処理されたビットストリームを出力するビットストリーム出力部とを備えることを特徴とする。
このとき、周波数領域特性抽出部が入力オーディオ信号の現在フレーム(current frame)の周波数領域信号分析を実行するときに、時間領域特性抽出部は、入力オーディオ信号の現在または次フレーム(next frame)の周波数領域信号に該当する時間領域信号分析を実行することができる。
このとき、時間領域特性は、入力オーディオ信号の時間領域短区間特性であり、周波数領域特性は、周波数バンドそれぞれに相応する周波数領域短区間特性であり、適応的時間/周波数ベースオーディオ符号化装置は、時間領域短区間特性および周波数領域短区間特性を分析して時間領域長区間特性および周波数領域長区間特性を生成する長区間特性抽出部をさらに備え、モード決定器は、時間領域長区間特性および周波数領域長区間特性をさらに用いて符号化モードを決定することができる。
また、本発明の適応的時間/周波数ベース符号化モード決定方法は、入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成するステップと、前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成するステップと、前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するステップとを含むことを特徴とする。
本発明において、時間ベース符号化方式は、CELP(Code Excited Linear Prediction)など時間軸上で圧縮を行う音声圧縮アルゴリズムを意味しており、周波数ベース符号化方式は、TCX、AAC(Advanced Audio Codec)など周波数軸上で圧縮を行うオーディオ圧縮アルゴリズムを意味する。
以下、本発明に係る好ましい実施形態を、添付の図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態に係る適応的時間/周波数ベースオーディオ符号化装置を示すブロック図である。図1を参照するに、適応的時間/周波数ベースオーディオ符号化装置は、変換/モード決定部110と、符号化部120と、ビットストリーム出力部130とを備える。
変換/モード決定部110は、入力オーディオ信号INをフレーム単位で周波数変換(frequency transform)し、変換した周波数領域を複数の周波数領域に分割して生成された周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定する。この過程を介して、変換/モード決定部110は、時間ベース符号化モードとして決定された周波数領域信号S1、周波数ベース符号化モードとして決定された周波数領域信号S2、周波数領域分割に関する情報S3、周波数バンドそれぞれの符号化モード情報S4を出力する。このとき、周波数領域を一貫して分割する場合であれば、復号化ステップにおいて分割情報を必要としない場合もあるため、周波数領域分割に関する情報S3は用いられない場合もある。
符号化部120は、時間ベース符号化モードとして決定された周波数領域信号S1を時間ベース符号化し、周波数ベース符号化モードとして決定された周波数領域信号S2を周波数ベース符号化し、時間ベース符号化されたデータS5および周波数ベース符号化されたデータS6を出力する。
ビットストリーム(bit stream)出力部130は、符号化されたデータS5、S6に対するビットストリーム処理をし、処理されたビットストリームを出力する。このとき、ビットストリーム出力部130は、周波数領域分割に関する情報S3および周波数バンドそれぞれの符号化モード情報S4を用いてビットストリーム処理を行うことができる。このとき、ビットストリームは、エントロピー符号化などのデータ圧縮過程を経ることもできる。
図2は、周波数領域変換した信号の分割および符号化モード決定過程を概念的に示す図である。図2を参照するに、入力オーディオ信号には、22000Hzの周波数成分まで含まれており、5つの周波数バンドに分割されている。分割された周波数バンドは、相応する符号化モードが低周波から高周波の順に時間ベース符号化モード、周波数ベース符号化モード、時間ベース符号化モード、周波数ベース符号化モード、および周波数ベース符号化モードとして決定されていることが分かる。このとき、入力オーディオ信号は、所定の時間(例えば、約20ms)の間のオーディオフレームであり、図2に示すグラフは、所定の時間の間のオーディオフレームに対して周波数変換したものである。図2に示すように、オーディオフレームは、sf1、sf2、sf3、sf4、およびsf5の5つの周波数帯域に分けられる。
図2に示すように、時間領域における1つのフレームに相応する周波数領域が分割された周波数バンドそれぞれに対して適切な符号化モードを割り当てることが極めて重要である。このとき、入力オーディオ信号の時間領域特性および周波数領域特性を用いて、それぞれの周波数バンド別に適切な符号化モード決定を実行することができる。それぞれの周波数バンド別に符号化モードを決定することについては、以下で詳述する。
図3は、図1に示す変換/モード決定部110の一例を示すブロック図である。図3を参照するに、変換/モード決定部は、周波数領域変換部310と、符号化モード判断部320と、出力部330とを備える。
周波数領域変換部310は、入力オーディオ信号INを図2に示す周波数スペクトラムのような周波数領域信号S7に変換する。例えば、周波数領域変換部310は、入力オーディオ信号INに対してMLT(Modulated Lapped Transform)を行うことができる。
特に、周波数領域変換部310は、入力オーディオ信号INに対する周波数可変(Frequency Varying)MLTを実行することができる。周波数可変MLTは、M.PuratとP.Nollが著述した「A New Orthonormal Wavelet Packet Decomposition for Audio Coding Using Frequency−Varying Modulated Lapped Transform,IEEE Workshop on Application of Signal Processing to Audio and Acoustics,Oct,1995」に詳細に記述されている。
周波数可変MLTを用いれば、周波数変換した周波数領域信号の一部周波数バンドに対しては周波数ベース符号化を実行し、他の周波数バンドに対しては逆MLT変換を実行して時間領域信号に変えた後、時間ベース符号化を実行することができる。この後に、時間ベース符号化した信号が再びMLT変換した後、周波数ベース符号化した周波数バンド信号と合わされば、すべての周波数帯域に対して符号化した信号が得られる。
符号化モード判断部320は、時間領域信号である入力オーディオ信号INおよび入力オーディオ信号INが周波数変換した周波数領域信号S7を信号分析し、それぞれの周波数バンド別に時間ベース符号化モードおよび周波数ベース符号化モードのうちの1つの符号化モードを決定する。このとき、符号化モード判断部320は、時間領域信号である入力オーディオ信号INの現在または次フレーム(next frame)の周波数領域信号分析を実行するときに、周波数領域信号S7の現在フレームの周波数領域信号分析を実行することができる。
現在フレームのモード決定時に次フレームの特性を反映することで、モードが1フレーム間隔に頻繁にスイッチングされることを抑制し、モード変化を緩和することができる。例えば、過去、現在、および次の特性値の平均値を用いたり、過去と現在の特徴として現在フレームのモードを決定した後、次フレームの特徴値に応じてスイッチングを保留し、判断を次フレームに繰り越す方式で符号化モード判断部320を実現することができる。
出力部330は、符号化モード判断部320の判断結果に応じて、周波数領域信号S7を時間ベース符号化モードとして決定された周波数領域信号S1、周波数ベース符号化モードとして決定された周波数領域信号S2、周波数領域分割に関する情報S3、および符号化モード情報S4を出力する。
図4は、本発明の一実施形態に係る適応的時間/周波数ベース符号化モード決定装置を示すブロック図である。図4を参照するに、適応的時間/周波数ベース符号化モード決定装置は、時間領域特性抽出部410と、周波数領域特性抽出部420と、モード決定器430と、長区間特性抽出部440と、フレーム特性バッファ450とを備える。
図4に示す適応的時間/周波数ベース符号化モード決定装置は、図3に示す符号化モード判断部320として用いることができる。
時間領域特性抽出部410は、入力オーディオ信号INの時間領域信号分析を実行して時間領域特性を生成する。このとき、時間領域特性は、特に、時間領域短区間特性(time domain short−term feature)であることができる。例えば、時間領域短区間特性は、遷移(transient)程度および短期/長期予測利得(prediction gain)の大きさ程度を含むことができる。
周波数領域特性抽出部420は、入力オーディオ信号INの周波数領域信号分析を実行して、入力オーディオ信号INの1つのフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する。このとき、周波数領域特性抽出部420は、図3に示す周波数領域変換部310から入力オーディオ信号INの周波数領域信号S7を受信して周波数分析を行うことができる。このとき、周波数領域特性は、周波数領域短区間特性であることができる。例えば、周波数領域短区間特性は、スペクトラムの自己相関度(auto correlation)を含むことができる。
このとき、周波数領域特性抽出部420が入力オーディオ信号INの現在フレームに対する周波数領域信号分析を実行するときに、時間領域特性抽出部410は、入力オーディオ信号INの現在または次フレームの周波数領域信号分析に該当する時間領域信号分析を実行することができる。このとき、周波数領域特性抽出部420は、現在フレームと共に以前フレーム(previous frame)の一部をウィンドウィング(windowing)することもできる。
長区間特性抽出部440は、時間領域短区間特性および周波数領域短区間特性を分析して時間領域長区間特性および周波数領域長区間特性を生成する。
このとき、時間領域長区間特性は、周期性(periodicity)の連続性(continuity)程度、周波数スペクトラムの傾斜(spectral tilt)程度、およびフレームエネルギー程度を含むことができる。このとき、周期性の連続性は、ピッチラグ(pitch lag)の変化が少なく、ピッチ相関度(pitch correlation)が高いフレームが一定の区間以上連続して持続する程度であることができる。また、周期性の連続性は、1番目のフォルマント周波数(1st formant frequency)が極めて低く、ピッチ相関度が高いフレームが一定の区間以上連続して持続する程度であることができる。
このとき、周波数領域長区間特性は、チャンネル間の相関度を含むことができる。
フレーム特性バッファ450は、時間領域特性抽出部410から時間領域短区間特性が提供されてこれを保存する。したがって、時間領域特性抽出部410が次フレームに相応する時間領域短区間特性を出力するときに、フレーム特性バッファ450は、現在フレームに相応する時間領域短区間特性を出力することができる。
モード決定器430は、時間領域短区間特性、周波数領域短区間特性、時間領域長区間特性、および周波数領域長区間特性を用いて、周波数バンドそれぞれに対する符号化モードを時間ベース符号化モードおよび周波数ベース符号化モードのうちの1つとして決定する。このとき、モード決定器430は、以前フレーム、現在フレーム、および次フレームの時間領域信号分析結果、および以前フレームおよび現在フレームの周波数領域信号分析結果を用いて、周波数バンド別に符号化モードを決定することができる。
時間ベース符号化方式が効果的である場合の例は、線形予測(Linear Prediction)で予測利得(Prediction Gain)が大きい場合、または音声信号のように高いピッチを有する信号(highly pitched signal)が入力オーディオ信号である場合を挙げることができる。これに反し、周波数ベース符号化方式が効果的である場合の例は、正弦波信号(sinusoidal signal)、入力オーディオ信号中に付随的な高周波信号が含まれた場合は、信号間の遮蔽現象(masking effect)が大きい場合を挙げることができる。
下記の表1は、周波数ベース符号化が効率的である入力オーディオ信号の特性の例を示すものである。
表 1
表 2
図5は、図4に示すモード決定器430の動作を説明するためのフローチャートである。図5を参照するに、モード決定器は、入力オーディオ信号のステレオ信号程度が所定のレベル以上であるか否かを判断するS510。
ステップS510の判断結果、入力オーディオ信号のチャンネル間の相関度が低くてステレオ信号程度が所定のレベル以上である場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
ステップS510の判断結果、入力オーディオ信号のチャンネル間の相関度が高くてステレオ信号程度が所定のレベル未満である場合に、モード決定器は、入力オーディオ信号の遷移程度が所定のレベル以上であるか否かを判断するS520。
ステップS520の判断結果、入力オーディオ信号の遷移程度が所定のレベル未満である場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
ステップS520の判断結果、入力オーディオ信号の遷移程度が所定のレベル以上である場合に、モード決定器は、入力オーディオ信号の長期/短期予測利得が所定のレベル以上であるか否かを判断するS530。
ステップS530の判断結果、入力オーディオ信号の長期/短期予測利得が所定のレベル未満である場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
ステップS530の判断結果、入力オーディオ信号の長期/短期予測利得が所定のレベル以上である場合に、モード決定器は、該当する周波数バンドに相応するスペクトラムの自己相関度が所定のレベル以上であるか否かを判断するS540。
ステップS540の判断結果、該当する周波数バンドに相応するスペクトラムの自己相関度が所定のレベル未満である場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
ステップS540の判断結果、該当する周波数バンドに相応するスペクトラムの自己相関度が所定のレベル以上である場合に、モード決定器は、入力オーディオ信号の周期性の連続性が所定の区間以上持続するか否かを判断するS550。このとき、ステップS550は、ピッチラグの変化が少なく、ピッチ相関度の高いフレームが一定の区間以上連続して持続するか否か、または1番目のフォルマント周波数が極めて低く、ピッチ相関度が高いフレームが一定の区間以上連続して持続するか否かを判断することもできる。
ステップS550の判断結果、入力オーディオ信号の周期性の連続性が所定の区間以上持続する場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
ステップS550の判断結果、入力オーディオ信号の周期性の連続性が所定の区間以上持続しない場合に、モード決定器は、周波数スペクトラムの傾斜が緩慢である上に、高いフレームエネルギーが一定の区間以上連続して持続する程度である音楽連続性(music continuity)が所定のレベル以上であるか否かを判断するS560。
ステップS560の判断結果、周波数スペクトラムの傾斜が緩慢である上に、高いフレームエネルギーが一定の区間以上連続して持続する程度が所定のレベル以上である場合に、モード決定器は、符号化モードを周波数ベース符号化モードとして決定するS570。
ステップS560の判断結果、周波数スペクトラムの傾斜が緩慢である上に、高いフレームエネルギーが一定の区間以上連続して持続する程度が所定のレベル未満である場合に、モード決定器は、符号化モードを時間ベース符号化モードとして決定するS580。
図6は、本発明の一実施形態に係る適応的時間/周波数ベース符号化モード決定方法を説明するためのフローチャートである。
図6を参照するに、本発明の一実施形態に係る適応的時間/周波数ベース符号化モード決定方法は、入力オーディオ信号の時間領域信号分析を実行して時間領域短区間特性を生成するS610。
このとき、時間領域短区間特性は、入力オーディオ信号の遷移程度および短期/長期予測利得の大きさ程度を含むことができる。
また、適応的時間/周波数ベース符号化モード決定方法は、入力オーディオ信号の周波数領域信号分析を実行して周波数バンドそれぞれに相応する周波数領域短区間特性を生成するS620。
このとき、周波数領域短区間特性は、スペクトラムの自己相関度を含むことができる。
このとき、ステップS620が入力オーディオ信号の現在フレームに対する周波数領域信号分析を実行するときに、ステップS610は、入力オーディオ信号の現在または次フレームの周波数領域信号に相応する時間領域信号分析を実行することができる。このとき、ステップS620は、現在フレームと共に以前フレームの一部をウィンドウィングすることもできる。
また、適応的時間/周波数ベース符号化モード決定方法は、時間領域短区間特性および周波数領域短区間特性を分析して時間領域長区間特性および周波数領域長区間特性を生成するS630。
このとき、時間領域長区間特性は、周期性の連続性程度、周波数スペクトラムの傾斜程度、およびフレームエネルギー程度を含むことができる。このとき、周期性の連続性は、ピッチラグの変化が少なく、ピッチ相関度が高いフレームが一定の区間以上連続して持続する程度であることができる。また、周期性の連続性は、1番目のフォルマント周波数が極めて低く、ピッチ相関度が高いフレームが一定の区間以上連続して持続する程度であることができる。
このとき、周波数領域長区間特性は、チャンネル間の相関度を含むことができる。
また、適応的時間/周波数ベース符号化モード決定方法は、時間領域特性および周波数領域特性を用い、周波数バンドそれぞれに対する符号化モードを時間ベース符号化モードおよび周波数ベース符号化モードのうちの1つとして決定するS640。
このような過程を介して適応的に時間ベース符号化モードおよび周波数ベース符号化モードのうちの1つを選択的に適用して符号化を実行することで、多様なオーディオコンテンツに対して効率的な符号化を実行することができる上に、開ループ方式で符号化モードを選択することで、閉ルーフ(closed loop)方式に比べて低い複雑度を有する符号化器を実現することができる。
図7は、本発明の一実施形態に係る適応的時間/周波数ベース複号化装置700を示す図である。図7を参照するに、適応的時間/周波数ベース複号化装置700は、ビットストリーム入力部710と、複号化部720とを備える。
適応的時間/周波数ベース複号化装置700は、符号化したビットストリームを効率的に複号化することができる。ビットストリーム入力部710は、時間ベース符号化データS5、周波数ベース符号化データS6、周波数領域分割情報S3、および符号化モード情報S4を生成することができる。ビットストリーム入力部710は、S5、S6、S3、およびS4を複号化部720に出力することができる。
複号化部720は、周波数領域分割情報S3および符号化モード情報S4を用いて時間ベース符号化データS5および周波数ベース符号化データS6を複号化することができる。このとき、符号化モード情報S4は、分割した周波数帯域それぞれの符号化モード情報を含むことができる。複合化部720は、分割した周波数帯域それぞれの符号化データを複号化することができる。
なお、本発明に係る適応的時間/周波数ベース符号化モード決定方法は、コンピュータにより実現される多様な動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成することができ、その逆もできる。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
本発明の適応的時間/周波数ベースオーディオ符号化装置および符号化モード決定方法は、入力オーディオ信号に対する符号化モードを周波数帯域別に判断して時間ベース符号化または周波数ベース符号化することで、2種類の符号化方式の符号化利得を効率的に用い、高圧縮性能を得ることができる。
また、本発明は、入力オーディオ信号を時間領域および周波数領域別に長区間特性および短区間特性を抽出して周波数帯域別に適切な符号化モードを決定するようにし、適応的時間/周波数ベースオーディオ符号化の性能を最適化することができる。
また、本発明は、開ループ決定方式を用い、低い複雑度を有しながらも効果的に符号化モードを決定することができる。
また、本発明は、現在フレームのモード決定時に次フレームの特性を反映することで、モードが1フレーム間隔で頻繁にスイッチングされることを抑制し、モード変化を緩和することができる。
Claims (29)
- 入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成する時間領域特性抽出部と、
前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成する周波数領域特性抽出部と、
前記時間領域特性および前記周波数領域特性に基づいて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するモード決定器と、
を備えることを特徴とする適応的時間/周波数ベース符号化モード決定装置。 - 前記周波数領域特性抽出部が前記入力オーディオ信号の現在フレームの周波数領域信号分析を実行するときに、前記時間領域特性抽出部は、前記入力オーディオ信号の現在フレームまたは次フレームの周波数領域信号に該当する時間領域信号分析を実行することを特徴とする請求項1に記載の適応的時間/周波数ベース符号化モード決定装置。
- 前記時間領域特性は、前記入力オーディオ信号の時間領域短区間特性であり、前記周波数領域特性は、前記周波数バンドそれぞれに相応する周波数領域短区間特性であり、
前記適応的時間/周波数ベース符号化モード決定装置は、
前記時間領域短区間特性および前記周波数領域短区間特性を分析して時間領域長区間特性および周波数領域長区間特性を生成する長区間特性抽出部をさらに備え、
前記モード決定器は、前記時間領域長区間特性および前記周波数領域長区間特性をさらに用いて符号化モードを決定することを特徴とする請求項2に記載の適応的時間/周波数ベース符号化モード決定装置。 - 前記モード決定器の現在フレームに対する符号化モード決定時に次フレームに対する時間領域分析を実行した結果を用い、フレーム特性バッファを介して以前、現在、または次フレームに対する短区間/長区間予測利得を計算することを特徴とする請求項3に記載の適応的時間/周波数ベース符号化モード決定装置。
- 前記時間領域短区間特性は、遷移程度および短期/長期予測利得の大きさ程度を含み、前記周波数領域短区間特性は、スペクトラムの自己相関度を含むことを特徴とする請求項3に記載の適応的時間/周波数ベース符号化モード決定装置。
- 前記時間領域長区間特性は、周期性の連続性程度、周波数スペクトラムの傾斜程度、またはフレームエネルギー程度を含み、前記周波数領域長区間特性は、チャンネル間の相関度を含むことを特徴とする請求項5に記載の適応的時間/周波数ベース符号化モード決定装置。
- 前記モード決定器は、
前記入力オーディオ信号のステレオ信号程度が所定のレベル以上であるという第1条件、前記入力オーディオ信号の遷移程度が所定のレベル未満であるという第2条件、短期/長期予測利得が所定のレベル未満であるという第3条件、前記周波数バンドに相応するスペクトラムの自己相関度が所定のレベル未満であるという第4条件のうちのいずれか1つ以上を満たす場合に、前記符号化モードを周波数ベース符号化モードとして決定することを特徴とする請求項6に記載の適応的時間/周波数ベース符号化モード決定装置。 - 前記モード決定器は、
前記第1〜第4条件をすべて満たさず、
前記入力オーディオ信号の周期性の連続性が所定の区間以上持続するという第5条件、および前記周波数スペクトラムの傾斜程度が緩慢であり、高いフレームエネルギーが一定の区間以上連続して持続する程度である音楽連続性が所定のレベル以上である第6条件をすべて満たさない場合に、符号化モードを時間ベース符号化モードとして決定し、
前記第5条件および第6条件のうちのいずれか1つ以上が満たされる場合に、符号化モードを周波数ベース符号化モードとして決定することを特徴とする請求項7に記載の適応的時間/周波数ベース符号化モード決定装置。 - 前記周波数領域特性抽出部は、時間領域の前記入力オーディオ信号を周波数可変MLT、MLT、およびFFTのうちのいずれか1つによって変換して前記周波数領域信号分析を実行することを特徴とする請求項1に記載の適応的時間/周波数ベース符号化モード決定装置。
- 前記周波数バンドそれぞれに対して前記決定された符号化モードに符号化する符号化部と、
前記符号化されたデータに対するビットストリーム処理をし、処理されたビットストリームを出力するビットストリーム出力部と、
を備えることを特徴とする請求項1に記載の適応的時間/周波数ベースオーディオ符号化装置。 - 前記周波数領域特性抽出部が前記入力オーディオ信号の現在フレームの周波数領域信号分析を実行するときに、前記時間領域特性抽出部は、前記入力オーディオ信号の現在または次フレームの周波数領域信号に該当する時間領域信号分析を実行することを特徴とする請求項10に記載の適応的時間/周波数ベースオーディオ符号化装置。
- 前記時間領域特性は、前記入力オーディオ信号の時間領域短区間特性であり、前記周波数領域特性は、前記周波数バンドそれぞれに相応する周波数領域短区間特性であり、
前記適応的時間/周波数ベースオーディオ符号化装置は、
前記時間領域短区間特性および前記周波数領域短区間特性を分析して時間領域長区間特性および周波数領域長区間特性を生成する長区間特性抽出部をさらに備え、
前記モード決定器は、前記時間領域長区間特性および前記周波数領域長区間特性をさらに用いて符号化モードを決定することを特徴とする請求項11に記載の適応的時間/周波数ベースオーディオ符号化装置。 - 入力オーディオ信号の時間領域信号分析を実行して時間領域特性を生成するステップと、
前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する周波数領域特性を生成するステップと、
前記時間領域特性および前記周波数領域特性を用いて、前記周波数バンドそれぞれに対して時間ベース符号化モードまたは周波数ベース符号化モードを決定するステップと、
を含むことを特徴とする適応的時間/周波数ベース符号化モード決定方法。 - 前記周波数領域特性を生成するステップが前記入力オーディオ信号の現在フレームの周波数領域信号分析を実行するときに、前記時間領域特性を抽出するステップは、前記入力オーディオ信号の現在または次フレームの周波数領域信号に該当する時間領域信号分析を実行することを特徴とする請求項13に記載の適応的時間/周波数ベース符号化モード決定方法。
- 前記時間領域特性は、前記入力オーディオ信号の時間領域短区間特性であり、前記周波数領域特性は、前記周波数バンドそれぞれに相応する周波数領域短区間特性であり、
前記適応的時間/周波数ベース符号化モード決定方法は、
前記時間領域短区間特性および前記周波数領域短区間特性を分析して時間領域長区間特性および周波数領域長区間特性を生成するステップ、
をさらに含み、
前記時間ベース符号化モードまたは周波数ベース符号化モードを決定するステップは、前記時間領域長区間特性および前記周波数領域長区間特性をさらに用いて符号化モードを決定することを特徴とする請求項14に記載の適応的時間/周波数ベース符号化モード決定方法。 - 前記周波数ベース符号化モードを決定するステップは、現在フレームに対するモード決定時に次フレームに対する時間領域分析を実行した結果がフレーム特性バッファを介して以前、現在、または次フレームに対する短区間/長区間予測利得に適用されることを特徴とする請求項15に記載の適応的時間/周波数ベース符号化モード決定方法。
- 前記時間領域短区間特性は、遷移程度および短期/長期予測利得の大きさ程度を含み、前記周波数領域短区間特性は、スペクトラムの自己相関度を含むことを特徴とする請求項16に記載の適応的時間/周波数ベース符号化モード決定方法。
- 前記時間領域長区間特性は、周期性の連続性程度、周波数スペクトラムの傾斜程度、およびフレームエネルギー程度を含み、前記周波数領域長区間特性は、チャンネル間の相関度を含むことを特徴とする請求項17に記載の適応的時間/周波数ベース符号化モード決定方法。
- 前記時間ベース符号化モードまたは周波数ベース符号化モードを決定するステップは、
前記入力オーディオ信号のステレオ信号程度が所定のレベル以上であったり、前記入力オーディオ信号の遷移程度が所定のレベル未満であったり、短期/長期予測利得が所定のレベル未満であったり、前記周波数バンドに相応するスペクトラムの自己相関度が所定のレベル未満であったりする場合に、前記符号化モードを周波数ベース符号化モードとして決定することを特徴とする請求項18に記載の適応的時間/周波数ベース符号化モード決定方法。 - 前記時間ベース符号化モードまたは周波数ベース符号化モードを決定するステップは、
前記入力オーディオ信号の周期性の連続性が所定の区間以上持続しないと同時に、前記周波数スペクトラムの傾斜程度が所定のレベル以上であったり、所定のレベル以上のフレームエネルギーが一定の区間以上連続して持続しなかったりする場合に、符号化モードを時間ベース符号化モードとして決定することを特徴とする請求項19に記載の適応的時間/周波数ベース符号化モード決定方法。 - 請求項13〜20のうちのいずれか一項の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
- 入力オーディオ信号のフレームの周波数バンドそれぞれに対して周波数領域特性および時間領域特性に基づいて、時間ベース符号化モードおよび周波数ベース符号化モードを符号化モードとして決定するモード決定器と、
前記時間ベース符号化モードおよび前記周波数ベース符号化モードのうちで前記符号化モードとして決定された符号化モードに基づいて、前記周波数バンドそれぞれに対して前記入力オーディオ信号を符号化する符号化器と、
を備えることを特徴とする適応的時間/周波数ベース符号化装置。 - 前記入力オーディオ信号の周波数領域信号分析を実行して、前記入力オーディオ信号のフレームに相応する周波数領域が複数の周波数領域に分割されて生成された周波数バンドそれぞれに相応する領域特性を生成する領域特性抽出部、
をさらに備えることを特徴とする請求項22に記載の適応的時間/周波数ベース符号化装置。 - 前記領域特性抽出部は、
前記入力オーディオ信号の現在フレームの周波数領域信号を分析する周波数領域特性抽出部と、
前記入力オーディオ信号の現在フレームまたは次フレームの前記周波数領域信号に相応する時間領域信号を分析する時間領域特性抽出部と、
を備えることを特徴とする請求項23に記載の適応的時間/周波数ベース符号化装置。 - 入力オーディオ信号の第1周波数バンドおよび第2周波数バンドに対して時間領域特性および周波数領域特性それぞれを抽出する領域特性抽出部と、
前記周波数領域特性および時間領域特性に基づいて、時間ベース符号化モードおよび周波数ベース符号化モードを決定するモード決定器と、
前記時間ベース符号化モードに基づいて前記第1周波数バンドを符号化し、前記周波数ベース符号化モードに基づいて前記第2周波数バンドを符号化する符号化器と、
を備えることを特徴とする適応的時間/周波数ベース符号化装置。 - 前記モード決定器は、
前記第1周波数バンドおよび前記第2周波数バンドの分割と関連した第1情報、および前記第1周波数バンドの前記時間ベース符号化モードおよび前記第2周波数バンドの前記周波数ベース符号化モードと関連した第2情報を生成することを特徴とする請求項25に記載の適応的時間/周波数ベース符号化装置。 - 前記時間ベース符号化された第1周波数バンド、前記周波数ベース符号化された第2周波数バンド、前記第1情報および前記第2情報を含むビットストリームを出力する出力部、
をさらに備えることを特徴とする請求項26に記載の適応的時間/周波数ベース符号化装置。 - 入力オーディオ信号のフレームの周波数バンドそれぞれに対して周波数領域特性および時間領域特性に基づいて、時間ベース符号化モードおよび周波数ベース符号化モードを符号化モードとして決定するモード決定器と、
前記時間ベース符号化モードおよび前記周波数ベース符号化モードのうちで前記符号化モードとして決定された符号化モードに基づいて、前記周波数バンドそれぞれに対して前記入力オーディオ信号を符号化する符号化器と、
ビットストリームを受信し、前記時間ベース符号化モードおよび前記周波数ベース符号化モードのうちで前記符号化モードとして決定された符号化モードに基づいて、前記ビットストリームの周波数バンドそれぞれを復号化する複号化器と、
を備えることを特徴とする符号化/復号化システム。 - 時間ベース符号化されたデータと、
周波数ベース符号化されたデータと、
周波数領域信号の周波数スペクトラムの個別的な周波数バンドへの分割と関連した情報と、
前記個別的な周波数バンドのモード決定に相応する符号化モード情報と、
を含む処理されたビットストリームを受信するビットストリーム入力部と、
前記個別的な周波数バンドそれぞれに対して前記時間ベース符号化されたデータおよび前記周波数ベース符号化されたデータを復号化して出力オーディオ信号を示す復号化したデータを生成する複号化部と、
を備えることを特徴とする適応的時間/周波数ベース復号化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060007341A KR20070077652A (ko) | 2006-01-24 | 2006-01-24 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
PCT/KR2006/005218 WO2007086646A1 (en) | 2006-01-24 | 2006-12-06 | Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009524846A true JP2009524846A (ja) | 2009-07-02 |
Family
ID=38286597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008552210A Pending JP2009524846A (ja) | 2006-01-24 | 2006-12-06 | 適応的時間/周波数ベース符号化モード決定装置およびこのための符号化モード決定方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8744841B2 (ja) |
EP (1) | EP1982329B1 (ja) |
JP (1) | JP2009524846A (ja) |
KR (1) | KR20070077652A (ja) |
WO (1) | WO2007086646A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011527459A (ja) * | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
CN103026407A (zh) * | 2010-05-25 | 2013-04-03 | 诺基亚公司 | 带宽扩展器 |
US9583117B2 (en) | 2006-10-10 | 2017-02-28 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
JP2017515154A (ja) * | 2014-04-29 | 2017-06-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 音声符号化方法および関連装置 |
US9818411B2 (en) | 2008-07-14 | 2017-11-14 | Electronics And Telecommunications Research Institute | Apparatus for encoding and decoding of integrated speech and audio |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
US8630863B2 (en) * | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
KR101455648B1 (ko) * | 2007-10-29 | 2014-10-30 | 삼성전자주식회사 | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101261677B1 (ko) * | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
CA3160488C (en) | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
US10004682B2 (en) | 2010-08-24 | 2018-06-26 | Rutgers, The State University Of New Jersey | Formulation and manufacture of pharmaceuticals by impregnation onto porous carriers |
CN103198834B (zh) * | 2012-01-04 | 2016-12-14 | 中国移动通信集团公司 | 一种音频信号处理方法、装置及终端 |
TWI615834B (zh) * | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
US6356639B1 (en) * | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6718036B1 (en) * | 1999-12-15 | 2004-04-06 | Nortel Networks Limited | Linear predictive coding based acoustic echo cancellation |
WO2003019527A1 (fr) * | 2001-08-31 | 2003-03-06 | Kabushiki Kaisha Kenwood | Procede et appareil de generation d'un signal affecte d'un pas et procede et appareil de compression/decompression et de synthese d'un signal vocal l'utilisant |
CN1288622C (zh) * | 2001-11-02 | 2006-12-06 | 松下电器产业株式会社 | 编码设备和解码设备 |
US6785645B2 (en) * | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
DE60307252T2 (de) * | 2002-04-11 | 2007-07-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Einrichtungen, verfahren und programme zur kodierung und dekodierung |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
-
2006
- 2006-01-24 KR KR1020060007341A patent/KR20070077652A/ko active Search and Examination
- 2006-09-21 US US11/524,274 patent/US8744841B2/en active Active
- 2006-12-06 WO PCT/KR2006/005218 patent/WO2007086646A1/en active Application Filing
- 2006-12-06 EP EP06823925.0A patent/EP1982329B1/en active Active
- 2006-12-06 JP JP2008552210A patent/JP2009524846A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9583117B2 (en) | 2006-10-10 | 2017-02-28 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
JP2011527459A (ja) * | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
US9818411B2 (en) | 2008-07-14 | 2017-11-14 | Electronics And Telecommunications Research Institute | Apparatus for encoding and decoding of integrated speech and audio |
US10403293B2 (en) | 2008-07-14 | 2019-09-03 | Electronics And Telecommunications Research Institute | Apparatus for encoding and decoding of integrated speech and audio |
US10714103B2 (en) | 2008-07-14 | 2020-07-14 | Electronics And Telecommunications Research Institute | Apparatus for encoding and decoding of integrated speech and audio |
US11705137B2 (en) | 2008-07-14 | 2023-07-18 | Electronics And Telecommunications Research Institute | Apparatus for encoding and decoding of integrated speech and audio |
CN103026407A (zh) * | 2010-05-25 | 2013-04-03 | 诺基亚公司 | 带宽扩展器 |
CN103026407B (zh) * | 2010-05-25 | 2015-08-26 | 诺基亚公司 | 带宽扩展器 |
JP2017515154A (ja) * | 2014-04-29 | 2017-06-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 音声符号化方法および関連装置 |
US10262671B2 (en) | 2014-04-29 | 2019-04-16 | Huawei Technologies Co., Ltd. | Audio coding method and related apparatus |
US10984811B2 (en) | 2014-04-29 | 2021-04-20 | Huawei Technologies Co., Ltd. | Audio coding method and related apparatus |
Also Published As
Publication number | Publication date |
---|---|
WO2007086646A1 (en) | 2007-08-02 |
KR20070077652A (ko) | 2007-07-27 |
EP1982329B1 (en) | 2017-02-15 |
US8744841B2 (en) | 2014-06-03 |
EP1982329A1 (en) | 2008-10-22 |
US20070174051A1 (en) | 2007-07-26 |
EP1982329A4 (en) | 2011-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009524846A (ja) | 適応的時間/周波数ベース符号化モード決定装置およびこのための符号化モード決定方法 | |
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
JP7427752B2 (ja) | 時間領域デコーダにおける量子化雑音を低減するためのデバイスおよび方法 | |
JP6546256B2 (ja) | フレームエラー隠匿方法及びその装置 | |
US9418666B2 (en) | Method and apparatus for encoding and decoding audio/speech signal | |
US8340962B2 (en) | Method and apparatus for adaptively encoding and decoding high frequency band | |
KR102063900B1 (ko) | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 | |
TWI626644B (zh) | 訊框錯誤隱藏的裝置 | |
US9847095B2 (en) | Method and apparatus for adaptively encoding and decoding high frequency band | |
KR20170003596A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
KR101377667B1 (ko) | 오디오/스피치 신호의 시간 도메인에서의 부호화 방법 | |
WO2012008330A1 (ja) | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 | |
KR20070106662A (ko) | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 | |
JP2001083996A (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
KR20120060033A (ko) | 분할된 음성 프레임의 디코딩을 위한 음성 디코더 및 그 방법 |