JP3977292B2 - 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 - Google Patents

少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 Download PDF

Info

Publication number
JP3977292B2
JP3977292B2 JP2003185828A JP2003185828A JP3977292B2 JP 3977292 B2 JP3977292 B2 JP 3977292B2 JP 2003185828 A JP2003185828 A JP 2003185828A JP 2003185828 A JP2003185828 A JP 2003185828A JP 3977292 B2 JP3977292 B2 JP 3977292B2
Authority
JP
Japan
Prior art keywords
channel
high frequency
frequency component
mode
mode information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003185828A
Other languages
English (en)
Other versions
JP2004046179A (ja
Inventor
潤学 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004046179A publication Critical patent/JP2004046179A/ja
Application granted granted Critical
Publication of JP3977292B2 publication Critical patent/JP3977292B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0091Means for obtaining special acoustic effects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ後処理において計算量を減らす方法及び装置に係り、具体的にはMPEG−1レイヤ3オーディオにおいてデコーダで検出されたステレオモード情報を利用し、2チャンネル間の信号差が小さい場合は一方のチャンネルの高周波数成分だけを復元してこの復元された高周波数成分を他方のチャンネルの高周波数成分復元に利用する第1モードと、2チャンネル間の信号差が大きい場合は左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は前後フレームの高周波数成分を補間して復元する第2モードとに分け、場合により前記モードを選択して高周波数成分を復元する方法及び装置に関する。
【0002】
【従来の技術】
MPEG−1レイヤ3のオーディオコーディング法において、さらに効率的にデータを圧縮するために心理音響モデルを利用して人の耳に聞こえない高周波数成分には少ないビットを割り当てる。それにより圧縮率は良くなるものの高周波数領域の成分は損失され、かような高周波数領域の損失により音色が変わって明瞭度が低下し、押さえ付けられるか鈍い音が出るようになる。従って、原音の音色を忠実に再生して明瞭度を高めるために、損失された高周波数成分を復元する後処理音質改善法が要求される。
【0003】
しかし、既存のさまざまな後処理音質改善法は音質改善効果にもかかわらず、後処理法を行う時に計算量が過度になる問題点がある。最もよく知らされた後処理音質改善法であるSBR(SubBand Replication)法はMPEG−1レイヤ3デコーダにて行われる計算量の2倍ほどの計算量が要求される。
【0004】
特許文献1では、非高周波と雑音結合を有した周波数スペクトルとから高周波分解能を得るためにタイムドメインにてデコーディングされた音声信号を提供する後処理法を開示している。
【0005】
このために、FFT(Fast Fourier Transform)によりデコーディングされたタイムドメイン信号を周波数ドメイン信号に変換する段階、前記周波数ドメイン信号から撹乱周波数成分を検出してエネルギー分布を分析する段階、前記撹乱周波数成分についての抑圧量を検出する段階、ポストフィルタリングを制御する段階及びポストフィルタリングにより変換されたデータを逆変換する段階を備える。
【0006】
しかし、先行技術は音声及びオーディオデコーディング時にデコーディングされた音声の知覚品質を向上させるための音声デコーダ用の後処理法に関するものであり、高周波成分の分解能を高めるためという目的は似ているが、周波数スペクトルを分析し、高周波解像度フィルタリングを使用して前記目的を実現するものであって本発明とは差がある。そして、前記後処理法を行う時に計算量が減る効果も得られない。
【0007】
【特許文献1】
韓国特許公開2000−75936号公報
【0008】
【発明が解決しようとする課題】
前記の問題を解決するために本発明では、従来の後処理法で要求される過度な計算量を減らすために、MPEG−1レイヤ3オーディオデータにて左側チャンネルと右側チャンネル信号間の類似性を示すモード情報を利用し、両チャンネル間の信号差が小さい場合は一方のチャンネルの高周波数成分だけを復元し、この復元された高周波数成分を他方のチャンネルの高周波数成分復元に利用する第1モードと、両チャンネル間の信号差が大きい場合は左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は前後フレームの高周波数成分を補間して復元する第2モードとに分け、場合により前記モードを選択して高周波数成分を復元する新しいオーディオデコーディング法及び装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
前記目的をなすために本発明では、エンコーディングされたオーディオデータデコーディング時に高周波数成分を生成する方法において、第1チャンネル信号及び第2チャンネル信号間の連関性についての情報を含んでいるモード情報を利用して高周波数成分を生成する高周波数成分生成法を提供する。
【0010】
前記目的をなすために本発明では、エンコーディングされたオーディオデータを入力されてデコーディングし、第1チャンネル及び第2チャンネルのオーディオ信号にして出力する段階と、前記オーディオデータにて第1チャンネル信号及び第2チャンネル信号間の連関性についての情報を含んでいるモード情報を求める段階と、前記求めたモード情報が前記第1チャンネル信号及び第2チャンネル信号間に連関性が大きいことを示すジョイントステレオモード値ならば、前記第1チャンネルまたは前記第2チャンネルのうち一つだけを選択して高周波数成分を生成し、選択していないチャンネルの高周波数成分は前記選択して生成した高周波数成分に所定の補正をして生成する段階と、前記選択して生成された一方のチャンネルの高周波数成分と選択したチャンネルの前記デコーディングされたオーディオ信号とを合わせて一方のチャンネルに出力し、他方のチャンネルには補正された前記高周波数成分と選択されていないデコーディングされたオーディオ信号とを合わせて出力する段階とを含む高周波数成分を復元したオーディオデコーディング法を提供する。
【0011】
前記目的をなすために本発明では、エンコーディングされたオーディオデータを入力されデコーディングしてオーディオ信号にして出力するオーディオデコーダと、前記入力されたエンコーディングオーディオデータを分析してモード情報値を捜し出すモード情報分析部と、前記モード情報値により各チャンネルについての高周波数成分を生成する高周波数成分生成部と、前記デコーディングされたオーディオ信号に前記生成された高周波数成分を合わせて出力するオーディオ合成部とを含む高周波数成分を復元したオーディオデコーディング装置を提供する。
【0012】
前記目的をなすために本発明では、前記方法をコンピュータにて実行するためのプログラムを記録したコンピュータ読取り可能な記録媒体を提供する。
【0013】
【発明の実施の形態】
以下、添付された図面を参照して本発明による望ましい一実施例を詳細に説明する。
図1は、MPEG−1レイヤ3デコーダにてデコーディングされたPCM信号を後処理する装置を示した図面である。
MPEG−1レイヤ3のフォーマットによりエンコーディングされたオーディオデータが入力されれば(test.mp3)、MPEG−1レイヤ3デコーダ110にて左側チャンネル成分と右側チャンネル成分とに分離してそれぞれPCM(Pulse Code Modulation)データ(test.pcm)にする。かように作り出されたPCMデータを高周波成分復元部120に入力すれば、左側及び右側チャンネルについての高周波数成分をそれぞれ復元し、復元されたPCMオーディオデータ(test_app.pcm)を出力する。
【0014】
前述の如く既存の後処理法では、MPEG−1レイヤ3デコーダを介して出力された左側チャンネル信号と右側チャンネル信号とについてそれぞれ後処理をして高周波数領域を復元する。
【0015】
しかし、ほとんどのオーディオの場合に左側チャンネル信号と右側チャンネル信号とは重複性が多くてMPEG−1レイヤ3エンコーディングアルゴリズムでもジョイントステレオモードである場合には、左側チャンネル信号と右側チャンネル信号とを独立的にそれぞれエンコーディングを行わない。
【0016】
従って、左側チャンネル信号と右側チャンネル信号の復元された高周波数成分は互いに似ていて重複性があるので、左側チャンネル信号と右側チャンネル信号とについてそれぞれ後処理をするのは不要な計算量を増やす短所がある。
【0017】
図2は、本発明の後処理装置の図面である。
MP3デコーダ210は、MPEG−1レイヤ3オーディオ信号を入力されてデコーディングしてPCM信号にして出力する。MP3オーディオ信号はモード情報を含んでいる。従って、モード情報分析部220は、入力されるMP3オーディオにてモード情報を分析してその値を高周波数成分生成部230に伝達する。
【0018】
高周波数成分生成部230は、前記モード情報値により各チャンネルについての高周波数成分を生成する。モード情報が左側チャンネル信号と右側チャンネル信号間の類似性の濃厚なジョイントステレオモード値であるのか、両チャンネル間の類似性がなくて差の大きいステレオモード値であるのかによりそれぞれ異なる方法を使用して高周波数成分を作り出す。高周波数成分の生成過程は従来の高周波数成分の生成過程による。
【0019】
もしモード値がジョイントステレオモード(以下、MODE1)ならば、左側チャンネル信号と右側チャンネル信号とが類似の場合であるので、一方のチャンネルの高周波数成分だけ生成し、他方のチャンネルの高周波数成分は前記生成された一方のチャンネルの高周波数成分を利用して作り出す。例えば、左側チャンネルにて復元した高周波数成分に両チャンネル間の類似度による補正値をかけて右側チャンネルの高周波数成分として適用する。類似性が互いに濃厚なのでかようにしても音質の低下がほとんどない。
【0020】
そして、もしモード値がステレオモード(以下、MODE2)ならば、左側チャンネル信号と右側チャンネル信号との差が大きいためにチャンネル間の連関性がないので、それぞれのチャンネルの高周波数成分を別々に生成して復元する。この場合、左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は左側チャンネルと右側チャンネル別に前後フレームの高周波数成分を補間して復元する。前記MODE2については図5を参照して後述する。
【0021】
オーディオ合成部240は、デコーディングされたPCM信号に復元された高周波数成分を合わせて出力する。
図3は、MPEG−1レイヤ3オーディオストリームのフォーマットである。
MPEG−1レイヤ3オーディオストリームは、オーディオ復号単位(AAU:Audio Access Unit)300より構成されているが、AAU300は、一つ一つ単独に復号化できる最小単位であって常に一定のサンプル数のデータを圧縮して載せている。AAU300は、ヘッダ310とエラーチェック(CRC:Cyclic Redundancy Check)320、オーディオデータ330及び補助データ340より構成される。
【0022】
ヘッダ310には同期ワードSYNCWORD、ID情報、階層情報、保護ビットの有無情報、ビット率インデックス情報、サンプリング周波数情報、パッディングビットの有無情報、個別用途ビット、モード情報、モード拡張情報、著作権情報、原本であるのか複写本であるのかの情報及びエンファシス情報が入っている。
【0023】
CRC320は選択事項であり、この有無はヘッダ310にて定義されて長さは16ビットである。
オーディオデータ330は、圧縮されたオーディオデータが入っていく部分である。
補助データ340は、オーディオデータ330の終わりが一つのAAUの端に達しない場合に残った部分をいい、MPEGオーディオ以外の任意データが挿入されうる。
【0024】
本発明の後処理法はそれらのうちからモード情報と左側チャンネル信号と右側チャンネル信号との差情報とを利用して各チャンネル間の連関性いかんを判断し、それにより高周波数成分を復元する。
【0025】
図4は、本発明の後処理法の図面である。
新しい後処理法はまず、MPEG−1レイヤ3オーディオをデコーディングしてPCM信号にして出力する(410)。そして、これと共にモード情報を得る(420)。前記モード情報が左側チャンネル信号と右側チャンネル信号間の類似性の濃厚なジョイントステレオモード値であるのか、両チャンネル間の類似性がなくて差の大きいステレオモード値であるのか判断する(430)。
【0026】
もし前記判断結果、MODE1ならば左側チャンネル信号と右側チャンネル信号とが類似の場合であるので、一方のチャンネルの高周波数成分だけ生成して(460)、他方のチャンネルの高周波数成分はこれを利用して作り出す(470)。例えば、左側チャンネルにて復元した高周波数成分を右側チャンネルの高周波数成分としてそのまま適用するか、左側チャンネル信号と右側チャンネル信号との差情報を利用して若干の修正値をかけて得る(470)。修正値は、例えば一定の定数でもありうる。類似性が互いに濃厚なので、かようにしても音質の低下がほとんどない。最後にデコーディングされたPCM信号に復元された高周波数成分を合わせて出力する(480)。
【0027】
前記判断の結果、MODE2ならば左側チャンネル信号と右側チャンネル信号との差が大きいためにチャンネル間の連関性がないので、それぞれのチャンネルの高周波数成分を別々に生成して復元する(440)。その場合、左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は左側チャンネルと右側チャンネル別に前後フレームの高周波数成分を補間して復元する。最後にデコーディングされたPCM信号に復元された高周波数成分を合わせて出力する(450)。
【0028】
一般的にほとんどのオーディオの場合、MODE1が適用される。すなわち、左側チャンネル信号と右側チャンネル信号とが似ているので、かような方式が適用される場合が多く、計算量が半分に減りうる。そして、128kbps以上の高い伝送率を有したオーディオ信号にて左側チャンネル信号と右側チャンネル信号との差が大きくてそれぞれコーディングしなければならない場合、すなわちMODE2の場合にはオーディオ後処理がチャンネル別にそれぞれ適用されねばならないが、かような場合にもMODE2を利用して計算量を減らせる。
【0029】
新しい後処理法は、MPEG−1レイヤ3デコーダにて検出されたモード情報を利用し、両チャンネル間の類似性の濃厚なMODE1の場合であるのか、両チャンネル間の差の大きいMODE2であるのかについて判断する。
かようにして復元された高周波数成分が左側チャンネル信号と右側チャンネル信号とに加えられて出力される。
【0030】
図5は、右側チャンネルの高周波数成分復元をする方法を示した図面である。
まず、左側チャンネルの高周波数成分を作り出し、もしモード情報がMODE1値ならば、生成した左側チャンネルの高周波数成分を右側チャンネルの高周波数成分生成に使用し、それとも右側チャンネルの高周波数成分は左側チャンネルの高周波数成分と関係なく別個に生成する。
【0031】
図6は、両チャンネル間の差が大きい場合(MODE2)の高周波数を復元する方法を示した図面である。
すなわち、図4にて左側及び右側チャンネルの高周波数成分をそれぞれ生成する段階(440)を説明した図面である。この場合、左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元する。すなわち、時間t1である時のフレームにて左側チャンネルの高周波数成分を復元し、時間t2である時のフレームにて右側チャンネルの高周波数成分を復元する。t3、t4、t5…である時もチャンネル別に前記方法を反復的に行う。
【0032】
この時、時間t1である時のフレームにて左側チャンネルの高周波数成分及び右側チャンネルの高周波数成分をそれぞれLt1、Rt1と言い、同じ方法で時間t2である時のフレームにて左側チャンネルの高周波数成分及び右側チャンネルの高周波数成分をそれぞれLt2、Rt2という。
【0033】
それにより、飛び越したフレームの高周波数成分、すなわち時間t2での左側チャンネルの高周波数成分Lt2は前後フレーム、すなわちt1とt3とでの左側チャンネルの高周波数成分を補間して復元する。すなわち、Lt2=(Lt1+Lt3)/2である。また、t3での右側チャンネルの高周波数成分Rt3はt2とt4での右側チャンネルの高周波数成分を補間して作る。すなわち、Rt3=(Rt2+Rt4)/2である。最後に、デコーディングされたPCM信号に前記復元された高周波数成分を合わせて出力する。
【0034】
一方、前述の本発明の実施例はコンピュータにて実行できるプログラムで作成可能であり、コンピュータ読取り可能な記録媒体を利用して前記プログラムを動作させる汎用ディジタルコンピュータにより具現されうる。
前記コンピュータ読取り可能な記録媒体は、マグネチック貯蔵媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CDROM、DVDなど)及びキャリアウエーブ(例えば、インターネットを通した伝送)のような貯蔵媒体を含む。
【0035】
これまで本発明についてその望ましい実施例を中心に説明した。本発明が属する技術分野にて当業者は本発明が本発明の本質的な特性から外れない範囲にて変形された形態に具現できることが理解できるであろう。従って、開示された実施例は限定的な観点でなくして説明的な観点で考慮さるべきである。本発明の範囲は前述した説明でなくして特許請求の範囲上に示され、それと同等な範囲内にある全ての差異点は本発明に含まれたものと解釈さるべきである。
【0036】
【発明の効果】
前述のように本発明は、既存の後処理法が音質改善効果にもかかわらず計算量の過剰により実際に製品に適用され難い問題点があったが、本発明により高周波数成分を復元するにおいて計算量が半分以下に減る効果がある。
【図面の簡単な説明】
【図1】 MPEG−1レイヤ3デコーダにてデコーディングされたPCM信号を後処理する装置を示した図面である。
【図2】 本発明の後処理装置の図面である。
【図3】 MPEG−1レイヤ3オーディオストリームのフォーマットである。
【図4】 本発明の後処理法の図面である。
【図5】 右側チャンネルの高周波数成分復元をする方法を示した図面である。
【図6】 2チャンネル間の差が大きい場合(MODE2)の高周波数を復元する方法を示した図面である。
【符号の説明】
210 MP3デコーダ
220 モード情報分析部
230 高周波数成分生成部
240 オーディオ発生部

Claims (11)

  1. 第1チャンネル信号及び第2チャンネル信号間の類似性に関する情報であるモード情報を含むエンコーディングされたオーディオデータで高周波数成分を復元する方法において、
    前記オーディオデータから、前記モード情報が、左右のチャンネルの信号の類似性が濃厚な一方のモードを示すか、左右のチャンネルの差が大きい他方のモード示すかを求める段階と、
    前記モード情報によって相異なる方式を適用して前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階を含み、
    前記一方のモードの場合は、一方のチャンネルの高周波数成分だけを生成して、他方のチャンネルは前記一方のチャンネルの高周波成分を利用して作り出し、前記他方のモードの場合は、それぞれのチャンネルの高周波数成分を別々に生成する
    ことを特徴とする高周波数成分復元方法。
  2. 前記モード情報によって前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階は、
    前記モード情報が両チャンネル間の差が大きいことを示す他方のモードである場合は、
    (a) 第1チャンネルと第2チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元する段階と、
    (b) 第1チャンネルと第2チャンネル別に前後フレームの高周波数成分を補間して前記飛び越したフレームの高周波数成分を復元する段階を含み、
    ことを特徴とする請求項1に記載の高周波数成分復元方法。
  3. 前記モード情報によって前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階は、
    前記モード情報が両チャンネル間の差が小さいことを示す一方のモードである場合には、
    (a) 第1チャンネルの高周波数成分を復元する段階と、
    (b) 前記第1チャンネルの高周波数成分をそのまま利用するか、あるいは前記第1チャンネルの高周波数成分に所定の修正値をかける補正をして、前記第2チャンネルの高周波数成分を復元する段階をさらに含むことを特徴とする請求項1または2に記載の高周波数成分復元方法。
  4. 前記エンコーディングされたオーディオデータは
    MPEG−1レイヤ3オーディオデータであり、前記モード情報は前記オーディオデータの両チャンネル間の類似性が大きいことを示すジョイントステレオモードまたは両チャンネル間の差が大きいことを示すステレオモード中の一つの値を有することを特徴とする請求項1に記載の高周波数成分復元方法。
  5. (a) 第1チャンネル信号及び第2チャンネル信号間の類似性に関する情報であるモード情報を含むエンコーディングされたオーディオデータをデコーディングして第1チャンネル及び第2チャンネルのオーディオ信号を生成する段階と、
    (b) 前記オーディオデータで前記モード情報を求める段階と、
    (c) 前記モード情報によって相異なる方式を適用して前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階と、
    (d) 前記第1チャンネルの高周波数成分と前記第1チャンネルのオーディオ信号を合わせて前記第1チャンネルに出力し、前記第2チャンネルの高周波数成分と前記第2チャンネルのオーディオ信号を合わせて前記第2チャンネルに出力する段階を含み、
    前記エンコーディングされたオーディオデータはMPEG-1レイヤ3オーディオデータであり、
    前記 (b) 段階は、前記モード情報が、左右のチャンネルの信号の類似性が濃厚な一方のモードを示すか、左右のチャンネルの差が大きい他方のモード示すかを求める段階を含み、
    前記 (c) 段階は、前記一方のモードの場合は、一方のチャンネルの高周波数成分だけを 生成して、他方のチャンネルは前記一方のチャンネルの高周波成分を利用して作り出し、前記他方のモードの場合は、それぞれのチャンネルの高周波数成分を別々に生成する
    オーディオデコーディング方法。
  6. 前記(c)段階は、
    前記求めたモード情報がジョイントステレオモード値を有する場合、前記第1チャンネルまたは前記第2チャンネルのうち一つだけを選択して高周波数成分を復元し、前記選択したチャンネルに対して復元した高周波数成分をそのまま使用するか、あるいは前記選択したチャンネルに対して復元した高周波数成分に所定の修正値をかける補正を行って選択していないチャンネルの高周波数成分を復元する段階を含むことを特徴とする請求項5に記載の高周波数成分を復元したオーディオデコーディング方法。
  7. 前記(c)段階は、
    前記求めたモード情報がステレオモード値を有する場合、
    第1チャンネルと第2チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元する段階と、
    第1チャンネルと第2チャンネル別に前後フレームの高周波数成分を補間して前記飛び越したフレームの高周波数成分を復元する段階をさらに含むことを特徴とする請求項5または6に記載の高周波数成分を復元したオーディオデコーディング方法。
  8. 第1チャンネル信号及び第2チャンネル信号間の類似性に関する情報であるモード情報を含むエンコーディングされたオーディオデータをデコーディングして第1チャンネル及び第2チャンネルのオーディオ信号を生成するオーディオデコーダと、
    前記エンコーディングされたオーディオデータを分析してモード情報値を探し出すモード情報分析部と、
    前記モード情報値により相異なる方式を適用して各チャンネルに対する高周波数成分を復元する高周波数成分生成部と、
    前記デコーディングされた各チャンネルのオーディオ信号に対応する高周波数成分を合わせて対応する各チャンネルに出力するオーディオ合成部を含み、
    前記モード情報は前記オーディオデータの両チャンネル間の類似性が濃厚なことを示す一方のモードまたは両チャンネル間の差が大きいことを示す他方のモードを示す値を有し、
    前記高周波成分生成部は、前記一方のモードの場合は、一方のチャンネルの高周波数成分だけを生成して、他方のチャンネルは前記一方のチャンネルの高周波成分を利用して作り出し、前記他方のモードの場合は、それぞれのチャンネルの高周波数成分を別々に生成する
    高周波数成分を復元したオーディオ デコーディング装置。
  9. 前記エンコーディングされたオーディオデータは、
    MPEG-1レイヤ3オーディオデータであり、前記モード情報は前記オーディオデータの両チャンネル間の類似性の大きいことを示すジョイントステレオモードまたは両チャンネル間の類似性の小さいことを示すステレオモード中の一つの値を有することを特徴とする請求項8に記載の高周波数成分を復元したオーディオデコーディング装置。
  10. 前記高周波数成分生成部は、
    前記探し出したモード情報値がステレオモード値ならば、前記第1チャンネルと前記第2チャンネル別にそれぞれ1フレームずつ飛び越しつつ高周波数成分を復元し飛び越したフレームの高周波数成分は前記第1チャンネルと前記第2チャンネル別に前後フレームの高周波数成分を補間して復元することにより前記第1チャンネルと前記第2チャンネルの高周波数成分をどちらも生成し、前記探し出したモード情報値がジョイントステレオモード値ならば、一方のチャンネルの高周波数成分だけを生成し、前記生成した高周波数成分をそのまま使用するか、あるいは所定の修正値をかける補正をして他方のチャンネルの高周波数成分を生成することを特徴とする請求項8または9に記載の高周波数成分を復元したオーディオデコーディング装置。
  11. 請求項5に記載された方法をコンピュータで実行するためのプログラムを記録したコンピュータで読取り可能な記録媒体。
JP2003185828A 2002-07-11 2003-06-27 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 Expired - Fee Related JP3977292B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0040402A KR100462615B1 (ko) 2002-07-11 2002-07-11 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치

Publications (2)

Publication Number Publication Date
JP2004046179A JP2004046179A (ja) 2004-02-12
JP3977292B2 true JP3977292B2 (ja) 2007-09-19

Family

ID=29728789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003185828A Expired - Fee Related JP3977292B2 (ja) 2002-07-11 2003-06-27 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置

Country Status (6)

Country Link
US (1) US7328161B2 (ja)
JP (1) JP3977292B2 (ja)
KR (1) KR100462615B1 (ja)
CN (1) CN1205755C (ja)
GB (1) GB2390788B (ja)
NL (1) NL1023560C2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
KR100501930B1 (ko) * 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
WO2005034089A1 (ja) * 2003-09-30 2005-04-14 Sony Corporation データ再生装置及び方法並びにプログラム
KR100750115B1 (ko) * 2004-10-26 2007-08-21 삼성전자주식회사 오디오 신호 부호화 및 복호화 방법 및 그 장치
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US8332216B2 (en) 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
KR100668927B1 (ko) 2006-01-18 2007-01-12 엘지전자 주식회사 스테레오 오디오 신호의 후처리 장치 및 방법
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
US7852742B2 (en) * 2006-12-01 2010-12-14 Infineon Technologies Ag Precompensation of crosstalk interference based on feedback error signal
JP4277234B2 (ja) * 2007-03-13 2009-06-10 ソニー株式会社 データ復元装置、データ復元方法及びデータ復元プログラム
US7822418B2 (en) * 2007-05-14 2010-10-26 Infineon Technologies Ag Device playback using radio transmission
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
WO2009084226A1 (ja) * 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
CN102625982B (zh) 2009-05-01 2015-03-18 尼尔森(美国)有限公司 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
JP4922427B2 (ja) * 2010-04-19 2012-04-25 株式会社東芝 信号補正装置
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US20150371643A1 (en) * 2012-04-18 2015-12-24 Nokia Corporation Stereo audio signal encoder
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
CN109688531B (zh) * 2017-10-18 2021-01-26 宏达国际电子股份有限公司 获取高音质音频变换信息的方法、电子装置及记录介质
CN112803828B (zh) * 2020-12-31 2023-09-01 上海艾为电子技术股份有限公司 一种马达控制方法、控制系统和控制芯片

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6025818B2 (ja) * 1977-11-21 1985-06-20 株式会社日立製作所 Pcm方式録音機
US5526431A (en) * 1992-06-25 1996-06-11 Kabushiki Kaisha Kawai Gakki Seisakusho Sound effect-creating device for creating ensemble effect
JPH0955634A (ja) * 1995-08-11 1997-02-25 Yamaha Corp 高調波付加回路
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3136995B2 (ja) * 1996-05-30 2001-02-19 日本ビクター株式会社 ラウドネス回路
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100336465B1 (ko) * 2000-05-27 2002-05-15 이경호 휴대용 노래방기기
JP3576941B2 (ja) * 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
WO2003019534A1 (en) 2001-08-31 2003-03-06 Koninklijke Philips Electronics N.V. Bandwidth extension of a sound signal

Also Published As

Publication number Publication date
US7328161B2 (en) 2008-02-05
KR20040007815A (ko) 2004-01-28
US20040008615A1 (en) 2004-01-15
CN1205755C (zh) 2005-06-08
GB2390788B (en) 2004-06-30
JP2004046179A (ja) 2004-02-12
KR100462615B1 (ko) 2004-12-20
NL1023560C2 (nl) 2005-10-20
NL1023560A1 (nl) 2004-01-13
CN1467703A (zh) 2004-01-14
GB2390788A (en) 2004-01-14

Similar Documents

Publication Publication Date Title
JP3977292B2 (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
KR101221918B1 (ko) 신호 처리 방법 및 장치
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
JP4345890B2 (ja) 不完全なスペクトルを持つオーディオ信号の周波数変換に基づくスペクトルの再構築
AU2002318813B2 (en) Audio signal decoding device and audio signal encoding device
US8355921B2 (en) Method, apparatus and computer program product for providing improved audio processing
JP6377110B2 (ja) 信号をインタリーブするためのオーディオ復号器
JP2006048043A (ja) オーディオデータの高周波数の復元方法及びその装置
CN102047336B (zh) 用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构
US20060100885A1 (en) Method and apparatus to encode and decode an audio signal
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
JP4022504B2 (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
US20040176961A1 (en) Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method
JP4359499B2 (ja) オーディオ信号の編集
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JP2000330592A (ja) 圧縮音響ストリーム内データ追加方法およびその装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070411

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130629

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees