JP3977292B2 - 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 - Google Patents
少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 Download PDFInfo
- Publication number
- JP3977292B2 JP3977292B2 JP2003185828A JP2003185828A JP3977292B2 JP 3977292 B2 JP3977292 B2 JP 3977292B2 JP 2003185828 A JP2003185828 A JP 2003185828A JP 2003185828 A JP2003185828 A JP 2003185828A JP 3977292 B2 JP3977292 B2 JP 3977292B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- high frequency
- frequency component
- mode
- mode information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000004364 calculation method Methods 0.000 title description 10
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000012805 post-processing Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
- G10H1/12—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
- G10H1/125—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0091—Means for obtaining special acoustic effects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00992—Circuits for stereophonic or quadraphonic recording or reproducing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
【発明の属する技術分野】
本発明は、オーディオ後処理において計算量を減らす方法及び装置に係り、具体的にはMPEG−1レイヤ3オーディオにおいてデコーダで検出されたステレオモード情報を利用し、2チャンネル間の信号差が小さい場合は一方のチャンネルの高周波数成分だけを復元してこの復元された高周波数成分を他方のチャンネルの高周波数成分復元に利用する第1モードと、2チャンネル間の信号差が大きい場合は左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は前後フレームの高周波数成分を補間して復元する第2モードとに分け、場合により前記モードを選択して高周波数成分を復元する方法及び装置に関する。
【0002】
【従来の技術】
MPEG−1レイヤ3のオーディオコーディング法において、さらに効率的にデータを圧縮するために心理音響モデルを利用して人の耳に聞こえない高周波数成分には少ないビットを割り当てる。それにより圧縮率は良くなるものの高周波数領域の成分は損失され、かような高周波数領域の損失により音色が変わって明瞭度が低下し、押さえ付けられるか鈍い音が出るようになる。従って、原音の音色を忠実に再生して明瞭度を高めるために、損失された高周波数成分を復元する後処理音質改善法が要求される。
【0003】
しかし、既存のさまざまな後処理音質改善法は音質改善効果にもかかわらず、後処理法を行う時に計算量が過度になる問題点がある。最もよく知らされた後処理音質改善法であるSBR(SubBand Replication)法はMPEG−1レイヤ3デコーダにて行われる計算量の2倍ほどの計算量が要求される。
【0004】
特許文献1では、非高周波と雑音結合を有した周波数スペクトルとから高周波分解能を得るためにタイムドメインにてデコーディングされた音声信号を提供する後処理法を開示している。
【0005】
このために、FFT(Fast Fourier Transform)によりデコーディングされたタイムドメイン信号を周波数ドメイン信号に変換する段階、前記周波数ドメイン信号から撹乱周波数成分を検出してエネルギー分布を分析する段階、前記撹乱周波数成分についての抑圧量を検出する段階、ポストフィルタリングを制御する段階及びポストフィルタリングにより変換されたデータを逆変換する段階を備える。
【0006】
しかし、先行技術は音声及びオーディオデコーディング時にデコーディングされた音声の知覚品質を向上させるための音声デコーダ用の後処理法に関するものであり、高周波成分の分解能を高めるためという目的は似ているが、周波数スペクトルを分析し、高周波解像度フィルタリングを使用して前記目的を実現するものであって本発明とは差がある。そして、前記後処理法を行う時に計算量が減る効果も得られない。
【0007】
【特許文献1】
韓国特許公開2000−75936号公報
【0008】
【発明が解決しようとする課題】
前記の問題を解決するために本発明では、従来の後処理法で要求される過度な計算量を減らすために、MPEG−1レイヤ3オーディオデータにて左側チャンネルと右側チャンネル信号間の類似性を示すモード情報を利用し、両チャンネル間の信号差が小さい場合は一方のチャンネルの高周波数成分だけを復元し、この復元された高周波数成分を他方のチャンネルの高周波数成分復元に利用する第1モードと、両チャンネル間の信号差が大きい場合は左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は前後フレームの高周波数成分を補間して復元する第2モードとに分け、場合により前記モードを選択して高周波数成分を復元する新しいオーディオデコーディング法及び装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
前記目的をなすために本発明では、エンコーディングされたオーディオデータデコーディング時に高周波数成分を生成する方法において、第1チャンネル信号及び第2チャンネル信号間の連関性についての情報を含んでいるモード情報を利用して高周波数成分を生成する高周波数成分生成法を提供する。
【0010】
前記目的をなすために本発明では、エンコーディングされたオーディオデータを入力されてデコーディングし、第1チャンネル及び第2チャンネルのオーディオ信号にして出力する段階と、前記オーディオデータにて第1チャンネル信号及び第2チャンネル信号間の連関性についての情報を含んでいるモード情報を求める段階と、前記求めたモード情報が前記第1チャンネル信号及び第2チャンネル信号間に連関性が大きいことを示すジョイントステレオモード値ならば、前記第1チャンネルまたは前記第2チャンネルのうち一つだけを選択して高周波数成分を生成し、選択していないチャンネルの高周波数成分は前記選択して生成した高周波数成分に所定の補正をして生成する段階と、前記選択して生成された一方のチャンネルの高周波数成分と選択したチャンネルの前記デコーディングされたオーディオ信号とを合わせて一方のチャンネルに出力し、他方のチャンネルには補正された前記高周波数成分と選択されていないデコーディングされたオーディオ信号とを合わせて出力する段階とを含む高周波数成分を復元したオーディオデコーディング法を提供する。
【0011】
前記目的をなすために本発明では、エンコーディングされたオーディオデータを入力されデコーディングしてオーディオ信号にして出力するオーディオデコーダと、前記入力されたエンコーディングオーディオデータを分析してモード情報値を捜し出すモード情報分析部と、前記モード情報値により各チャンネルについての高周波数成分を生成する高周波数成分生成部と、前記デコーディングされたオーディオ信号に前記生成された高周波数成分を合わせて出力するオーディオ合成部とを含む高周波数成分を復元したオーディオデコーディング装置を提供する。
【0012】
前記目的をなすために本発明では、前記方法をコンピュータにて実行するためのプログラムを記録したコンピュータ読取り可能な記録媒体を提供する。
【0013】
【発明の実施の形態】
以下、添付された図面を参照して本発明による望ましい一実施例を詳細に説明する。
図1は、MPEG−1レイヤ3デコーダにてデコーディングされたPCM信号を後処理する装置を示した図面である。
MPEG−1レイヤ3のフォーマットによりエンコーディングされたオーディオデータが入力されれば(test.mp3)、MPEG−1レイヤ3デコーダ110にて左側チャンネル成分と右側チャンネル成分とに分離してそれぞれPCM(Pulse Code Modulation)データ(test.pcm)にする。かように作り出されたPCMデータを高周波成分復元部120に入力すれば、左側及び右側チャンネルについての高周波数成分をそれぞれ復元し、復元されたPCMオーディオデータ(test_app.pcm)を出力する。
【0014】
前述の如く既存の後処理法では、MPEG−1レイヤ3デコーダを介して出力された左側チャンネル信号と右側チャンネル信号とについてそれぞれ後処理をして高周波数領域を復元する。
【0015】
しかし、ほとんどのオーディオの場合に左側チャンネル信号と右側チャンネル信号とは重複性が多くてMPEG−1レイヤ3エンコーディングアルゴリズムでもジョイントステレオモードである場合には、左側チャンネル信号と右側チャンネル信号とを独立的にそれぞれエンコーディングを行わない。
【0016】
従って、左側チャンネル信号と右側チャンネル信号の復元された高周波数成分は互いに似ていて重複性があるので、左側チャンネル信号と右側チャンネル信号とについてそれぞれ後処理をするのは不要な計算量を増やす短所がある。
【0017】
図2は、本発明の後処理装置の図面である。
MP3デコーダ210は、MPEG−1レイヤ3オーディオ信号を入力されてデコーディングしてPCM信号にして出力する。MP3オーディオ信号はモード情報を含んでいる。従って、モード情報分析部220は、入力されるMP3オーディオにてモード情報を分析してその値を高周波数成分生成部230に伝達する。
【0018】
高周波数成分生成部230は、前記モード情報値により各チャンネルについての高周波数成分を生成する。モード情報が左側チャンネル信号と右側チャンネル信号間の類似性の濃厚なジョイントステレオモード値であるのか、両チャンネル間の類似性がなくて差の大きいステレオモード値であるのかによりそれぞれ異なる方法を使用して高周波数成分を作り出す。高周波数成分の生成過程は従来の高周波数成分の生成過程による。
【0019】
もしモード値がジョイントステレオモード(以下、MODE1)ならば、左側チャンネル信号と右側チャンネル信号とが類似の場合であるので、一方のチャンネルの高周波数成分だけ生成し、他方のチャンネルの高周波数成分は前記生成された一方のチャンネルの高周波数成分を利用して作り出す。例えば、左側チャンネルにて復元した高周波数成分に両チャンネル間の類似度による補正値をかけて右側チャンネルの高周波数成分として適用する。類似性が互いに濃厚なのでかようにしても音質の低下がほとんどない。
【0020】
そして、もしモード値がステレオモード(以下、MODE2)ならば、左側チャンネル信号と右側チャンネル信号との差が大きいためにチャンネル間の連関性がないので、それぞれのチャンネルの高周波数成分を別々に生成して復元する。この場合、左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は左側チャンネルと右側チャンネル別に前後フレームの高周波数成分を補間して復元する。前記MODE2については図5を参照して後述する。
【0021】
オーディオ合成部240は、デコーディングされたPCM信号に復元された高周波数成分を合わせて出力する。
図3は、MPEG−1レイヤ3オーディオストリームのフォーマットである。
MPEG−1レイヤ3オーディオストリームは、オーディオ復号単位(AAU:Audio Access Unit)300より構成されているが、AAU300は、一つ一つ単独に復号化できる最小単位であって常に一定のサンプル数のデータを圧縮して載せている。AAU300は、ヘッダ310とエラーチェック(CRC:Cyclic Redundancy Check)320、オーディオデータ330及び補助データ340より構成される。
【0022】
ヘッダ310には同期ワードSYNCWORD、ID情報、階層情報、保護ビットの有無情報、ビット率インデックス情報、サンプリング周波数情報、パッディングビットの有無情報、個別用途ビット、モード情報、モード拡張情報、著作権情報、原本であるのか複写本であるのかの情報及びエンファシス情報が入っている。
【0023】
CRC320は選択事項であり、この有無はヘッダ310にて定義されて長さは16ビットである。
オーディオデータ330は、圧縮されたオーディオデータが入っていく部分である。
補助データ340は、オーディオデータ330の終わりが一つのAAUの端に達しない場合に残った部分をいい、MPEGオーディオ以外の任意データが挿入されうる。
【0024】
本発明の後処理法はそれらのうちからモード情報と左側チャンネル信号と右側チャンネル信号との差情報とを利用して各チャンネル間の連関性いかんを判断し、それにより高周波数成分を復元する。
【0025】
図4は、本発明の後処理法の図面である。
新しい後処理法はまず、MPEG−1レイヤ3オーディオをデコーディングしてPCM信号にして出力する(410)。そして、これと共にモード情報を得る(420)。前記モード情報が左側チャンネル信号と右側チャンネル信号間の類似性の濃厚なジョイントステレオモード値であるのか、両チャンネル間の類似性がなくて差の大きいステレオモード値であるのか判断する(430)。
【0026】
もし前記判断結果、MODE1ならば左側チャンネル信号と右側チャンネル信号とが類似の場合であるので、一方のチャンネルの高周波数成分だけ生成して(460)、他方のチャンネルの高周波数成分はこれを利用して作り出す(470)。例えば、左側チャンネルにて復元した高周波数成分を右側チャンネルの高周波数成分としてそのまま適用するか、左側チャンネル信号と右側チャンネル信号との差情報を利用して若干の修正値をかけて得る(470)。修正値は、例えば一定の定数でもありうる。類似性が互いに濃厚なので、かようにしても音質の低下がほとんどない。最後にデコーディングされたPCM信号に復元された高周波数成分を合わせて出力する(480)。
【0027】
前記判断の結果、MODE2ならば左側チャンネル信号と右側チャンネル信号との差が大きいためにチャンネル間の連関性がないので、それぞれのチャンネルの高周波数成分を別々に生成して復元する(440)。その場合、左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元し、飛び越したフレームの高周波数成分は左側チャンネルと右側チャンネル別に前後フレームの高周波数成分を補間して復元する。最後にデコーディングされたPCM信号に復元された高周波数成分を合わせて出力する(450)。
【0028】
一般的にほとんどのオーディオの場合、MODE1が適用される。すなわち、左側チャンネル信号と右側チャンネル信号とが似ているので、かような方式が適用される場合が多く、計算量が半分に減りうる。そして、128kbps以上の高い伝送率を有したオーディオ信号にて左側チャンネル信号と右側チャンネル信号との差が大きくてそれぞれコーディングしなければならない場合、すなわちMODE2の場合にはオーディオ後処理がチャンネル別にそれぞれ適用されねばならないが、かような場合にもMODE2を利用して計算量を減らせる。
【0029】
新しい後処理法は、MPEG−1レイヤ3デコーダにて検出されたモード情報を利用し、両チャンネル間の類似性の濃厚なMODE1の場合であるのか、両チャンネル間の差の大きいMODE2であるのかについて判断する。
かようにして復元された高周波数成分が左側チャンネル信号と右側チャンネル信号とに加えられて出力される。
【0030】
図5は、右側チャンネルの高周波数成分復元をする方法を示した図面である。
まず、左側チャンネルの高周波数成分を作り出し、もしモード情報がMODE1値ならば、生成した左側チャンネルの高周波数成分を右側チャンネルの高周波数成分生成に使用し、それとも右側チャンネルの高周波数成分は左側チャンネルの高周波数成分と関係なく別個に生成する。
【0031】
図6は、両チャンネル間の差が大きい場合(MODE2)の高周波数を復元する方法を示した図面である。
すなわち、図4にて左側及び右側チャンネルの高周波数成分をそれぞれ生成する段階(440)を説明した図面である。この場合、左側チャンネルと右側チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元する。すなわち、時間t1である時のフレームにて左側チャンネルの高周波数成分を復元し、時間t2である時のフレームにて右側チャンネルの高周波数成分を復元する。t3、t4、t5…である時もチャンネル別に前記方法を反復的に行う。
【0032】
この時、時間t1である時のフレームにて左側チャンネルの高周波数成分及び右側チャンネルの高周波数成分をそれぞれLt1、Rt1と言い、同じ方法で時間t2である時のフレームにて左側チャンネルの高周波数成分及び右側チャンネルの高周波数成分をそれぞれLt2、Rt2という。
【0033】
それにより、飛び越したフレームの高周波数成分、すなわち時間t2での左側チャンネルの高周波数成分Lt2は前後フレーム、すなわちt1とt3とでの左側チャンネルの高周波数成分を補間して復元する。すなわち、Lt2=(Lt1+Lt3)/2である。また、t3での右側チャンネルの高周波数成分Rt3はt2とt4での右側チャンネルの高周波数成分を補間して作る。すなわち、Rt3=(Rt2+Rt4)/2である。最後に、デコーディングされたPCM信号に前記復元された高周波数成分を合わせて出力する。
【0034】
一方、前述の本発明の実施例はコンピュータにて実行できるプログラムで作成可能であり、コンピュータ読取り可能な記録媒体を利用して前記プログラムを動作させる汎用ディジタルコンピュータにより具現されうる。
前記コンピュータ読取り可能な記録媒体は、マグネチック貯蔵媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CDROM、DVDなど)及びキャリアウエーブ(例えば、インターネットを通した伝送)のような貯蔵媒体を含む。
【0035】
これまで本発明についてその望ましい実施例を中心に説明した。本発明が属する技術分野にて当業者は本発明が本発明の本質的な特性から外れない範囲にて変形された形態に具現できることが理解できるであろう。従って、開示された実施例は限定的な観点でなくして説明的な観点で考慮さるべきである。本発明の範囲は前述した説明でなくして特許請求の範囲上に示され、それと同等な範囲内にある全ての差異点は本発明に含まれたものと解釈さるべきである。
【0036】
【発明の効果】
前述のように本発明は、既存の後処理法が音質改善効果にもかかわらず計算量の過剰により実際に製品に適用され難い問題点があったが、本発明により高周波数成分を復元するにおいて計算量が半分以下に減る効果がある。
【図面の簡単な説明】
【図1】 MPEG−1レイヤ3デコーダにてデコーディングされたPCM信号を後処理する装置を示した図面である。
【図2】 本発明の後処理装置の図面である。
【図3】 MPEG−1レイヤ3オーディオストリームのフォーマットである。
【図4】 本発明の後処理法の図面である。
【図5】 右側チャンネルの高周波数成分復元をする方法を示した図面である。
【図6】 2チャンネル間の差が大きい場合(MODE2)の高周波数を復元する方法を示した図面である。
【符号の説明】
210 MP3デコーダ
220 モード情報分析部
230 高周波数成分生成部
240 オーディオ発生部
Claims (11)
- 第1チャンネル信号及び第2チャンネル信号間の類似性に関する情報であるモード情報を含むエンコーディングされたオーディオデータで高周波数成分を復元する方法において、
前記オーディオデータから、前記モード情報が、左右のチャンネルの信号の類似性が濃厚な一方のモードを示すか、左右のチャンネルの差が大きい他方のモード示すかを求める段階と、
前記モード情報によって相異なる方式を適用して前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階を含み、
前記一方のモードの場合は、一方のチャンネルの高周波数成分だけを生成して、他方のチャンネルは前記一方のチャンネルの高周波成分を利用して作り出し、前記他方のモードの場合は、それぞれのチャンネルの高周波数成分を別々に生成する
ことを特徴とする高周波数成分復元方法。 - 前記モード情報によって前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階は、
前記モード情報が両チャンネル間の差が大きいことを示す他方のモードである場合は、
(a) 第1チャンネルと第2チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元する段階と、
(b) 第1チャンネルと第2チャンネル別に前後フレームの高周波数成分を補間して前記飛び越したフレームの高周波数成分を復元する段階を含み、
ことを特徴とする請求項1に記載の高周波数成分復元方法。 - 前記モード情報によって前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階は、
前記モード情報が両チャンネル間の差が小さいことを示す一方のモードである場合には、
(a) 第1チャンネルの高周波数成分を復元する段階と、
(b) 前記第1チャンネルの高周波数成分をそのまま利用するか、あるいは前記第1チャンネルの高周波数成分に所定の修正値をかける補正をして、前記第2チャンネルの高周波数成分を復元する段階をさらに含むことを特徴とする請求項1または2に記載の高周波数成分復元方法。 - 前記エンコーディングされたオーディオデータは
MPEG−1レイヤ3オーディオデータであり、前記モード情報は前記オーディオデータの両チャンネル間の類似性が大きいことを示すジョイントステレオモードまたは両チャンネル間の差が大きいことを示すステレオモード中の一つの値を有することを特徴とする請求項1に記載の高周波数成分復元方法。 - (a) 第1チャンネル信号及び第2チャンネル信号間の類似性に関する情報であるモード情報を含むエンコーディングされたオーディオデータをデコーディングして第1チャンネル及び第2チャンネルのオーディオ信号を生成する段階と、
(b) 前記オーディオデータで前記モード情報を求める段階と、
(c) 前記モード情報によって相異なる方式を適用して前記第1チャンネル及び第2チャンネルの高周波数成分を復元する段階と、
(d) 前記第1チャンネルの高周波数成分と前記第1チャンネルのオーディオ信号を合わせて前記第1チャンネルに出力し、前記第2チャンネルの高周波数成分と前記第2チャンネルのオーディオ信号を合わせて前記第2チャンネルに出力する段階を含み、
前記エンコーディングされたオーディオデータはMPEG-1レイヤ3オーディオデータであり、
前記 (b) 段階は、前記モード情報が、左右のチャンネルの信号の類似性が濃厚な一方のモードを示すか、左右のチャンネルの差が大きい他方のモード示すかを求める段階を含み、
前記 (c) 段階は、前記一方のモードの場合は、一方のチャンネルの高周波数成分だけを 生成して、他方のチャンネルは前記一方のチャンネルの高周波成分を利用して作り出し、前記他方のモードの場合は、それぞれのチャンネルの高周波数成分を別々に生成する
オーディオデコーディング方法。 - 前記(c)段階は、
前記求めたモード情報がジョイントステレオモード値を有する場合、前記第1チャンネルまたは前記第2チャンネルのうち一つだけを選択して高周波数成分を復元し、前記選択したチャンネルに対して復元した高周波数成分をそのまま使用するか、あるいは前記選択したチャンネルに対して復元した高周波数成分に所定の修正値をかける補正を行って選択していないチャンネルの高周波数成分を復元する段階を含むことを特徴とする請求項5に記載の高周波数成分を復元したオーディオデコーディング方法。 - 前記(c)段階は、
前記求めたモード情報がステレオモード値を有する場合、
第1チャンネルと第2チャンネル別に1フレームずつ飛び越しつつ高周波数成分を復元する段階と、
第1チャンネルと第2チャンネル別に前後フレームの高周波数成分を補間して前記飛び越したフレームの高周波数成分を復元する段階をさらに含むことを特徴とする請求項5または6に記載の高周波数成分を復元したオーディオデコーディング方法。 - 第1チャンネル信号及び第2チャンネル信号間の類似性に関する情報であるモード情報を含むエンコーディングされたオーディオデータをデコーディングして第1チャンネル及び第2チャンネルのオーディオ信号を生成するオーディオデコーダと、
前記エンコーディングされたオーディオデータを分析してモード情報値を探し出すモード情報分析部と、
前記モード情報値により相異なる方式を適用して各チャンネルに対する高周波数成分を復元する高周波数成分生成部と、
前記デコーディングされた各チャンネルのオーディオ信号に対応する高周波数成分を合わせて対応する各チャンネルに出力するオーディオ合成部を含み、
前記モード情報は前記オーディオデータの両チャンネル間の類似性が濃厚なことを示す一方のモードまたは両チャンネル間の差が大きいことを示す他方のモードを示す値を有し、
前記高周波成分生成部は、前記一方のモードの場合は、一方のチャンネルの高周波数成分だけを生成して、他方のチャンネルは前記一方のチャンネルの高周波成分を利用して作り出し、前記他方のモードの場合は、それぞれのチャンネルの高周波数成分を別々に生成する
高周波数成分を復元したオーディオ デコーディング装置。 - 前記エンコーディングされたオーディオデータは、
MPEG-1レイヤ3オーディオデータであり、前記モード情報は前記オーディオデータの両チャンネル間の類似性の大きいことを示すジョイントステレオモードまたは両チャンネル間の類似性の小さいことを示すステレオモード中の一つの値を有することを特徴とする請求項8に記載の高周波数成分を復元したオーディオデコーディング装置。 - 前記高周波数成分生成部は、
前記探し出したモード情報値がステレオモード値ならば、前記第1チャンネルと前記第2チャンネル別にそれぞれ1フレームずつ飛び越しつつ高周波数成分を復元し飛び越したフレームの高周波数成分は前記第1チャンネルと前記第2チャンネル別に前後フレームの高周波数成分を補間して復元することにより前記第1チャンネルと前記第2チャンネルの高周波数成分をどちらも生成し、前記探し出したモード情報値がジョイントステレオモード値ならば、一方のチャンネルの高周波数成分だけを生成し、前記生成した高周波数成分をそのまま使用するか、あるいは所定の修正値をかける補正をして他方のチャンネルの高周波数成分を生成することを特徴とする請求項8または9に記載の高周波数成分を復元したオーディオデコーディング装置。 - 請求項5に記載された方法をコンピュータで実行するためのプログラムを記録したコンピュータで読取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0040402A KR100462615B1 (ko) | 2002-07-11 | 2002-07-11 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004046179A JP2004046179A (ja) | 2004-02-12 |
JP3977292B2 true JP3977292B2 (ja) | 2007-09-19 |
Family
ID=29728789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003185828A Expired - Fee Related JP3977292B2 (ja) | 2002-07-11 | 2003-06-27 | 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7328161B2 (ja) |
JP (1) | JP3977292B2 (ja) |
KR (1) | KR100462615B1 (ja) |
CN (1) | CN1205755C (ja) |
GB (1) | GB2390788B (ja) |
NL (1) | NL1023560C2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
KR100501930B1 (ko) * | 2002-11-29 | 2005-07-18 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
WO2005034089A1 (ja) * | 2003-09-30 | 2005-04-14 | Sony Corporation | データ再生装置及び方法並びにプログラム |
KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
US8332216B2 (en) | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
KR100668927B1 (ko) | 2006-01-18 | 2007-01-12 | 엘지전자 주식회사 | 스테레오 오디오 신호의 후처리 장치 및 방법 |
JP2008076847A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | 復号器及び信号処理システム |
US7852742B2 (en) * | 2006-12-01 | 2010-12-14 | Infineon Technologies Ag | Precompensation of crosstalk interference based on feedback error signal |
JP4277234B2 (ja) * | 2007-03-13 | 2009-06-10 | ソニー株式会社 | データ復元装置、データ復元方法及びデータ復元プログラム |
US7822418B2 (en) * | 2007-05-14 | 2010-10-26 | Infineon Technologies Ag | Device playback using radio transmission |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
WO2009084226A1 (ja) * | 2007-12-28 | 2009-07-09 | Panasonic Corporation | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 |
US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
US8508357B2 (en) * | 2008-11-26 | 2013-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking |
CN102625982B (zh) | 2009-05-01 | 2015-03-18 | 尼尔森(美国)有限公司 | 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品 |
US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
JP4922427B2 (ja) * | 2010-04-19 | 2012-04-25 | 株式会社東芝 | 信号補正装置 |
CN103548077B (zh) | 2011-05-19 | 2016-02-10 | 杜比实验室特许公司 | 参数化音频编译码方案的取证检测 |
US20150371643A1 (en) * | 2012-04-18 | 2015-12-24 | Nokia Corporation | Stereo audio signal encoder |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP3382701A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3382700A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
CN109688531B (zh) * | 2017-10-18 | 2021-01-26 | 宏达国际电子股份有限公司 | 获取高音质音频变换信息的方法、电子装置及记录介质 |
CN112803828B (zh) * | 2020-12-31 | 2023-09-01 | 上海艾为电子技术股份有限公司 | 一种马达控制方法、控制系统和控制芯片 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6025818B2 (ja) * | 1977-11-21 | 1985-06-20 | 株式会社日立製作所 | Pcm方式録音機 |
US5526431A (en) * | 1992-06-25 | 1996-06-11 | Kabushiki Kaisha Kawai Gakki Seisakusho | Sound effect-creating device for creating ensemble effect |
JPH0955634A (ja) * | 1995-08-11 | 1997-02-25 | Yamaha Corp | 高調波付加回路 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3136995B2 (ja) * | 1996-05-30 | 2001-02-19 | 日本ビクター株式会社 | ラウドネス回路 |
SE9700772D0 (sv) | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
KR100335611B1 (ko) | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
KR100336465B1 (ko) * | 2000-05-27 | 2002-05-15 | 이경호 | 휴대용 노래방기기 |
JP3576941B2 (ja) * | 2000-08-25 | 2004-10-13 | 株式会社ケンウッド | 周波数間引き装置、周波数間引き方法及び記録媒体 |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
US7069208B2 (en) * | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
WO2003019534A1 (en) | 2001-08-31 | 2003-03-06 | Koninklijke Philips Electronics N.V. | Bandwidth extension of a sound signal |
-
2002
- 2002-07-11 KR KR10-2002-0040402A patent/KR100462615B1/ko not_active IP Right Cessation
-
2003
- 2003-04-24 GB GB0309407A patent/GB2390788B/en not_active Expired - Fee Related
- 2003-04-30 US US10/426,351 patent/US7328161B2/en not_active Expired - Fee Related
- 2003-05-28 NL NL1023560A patent/NL1023560C2/nl not_active IP Right Cessation
- 2003-06-02 CN CNB031409679A patent/CN1205755C/zh not_active Expired - Fee Related
- 2003-06-27 JP JP2003185828A patent/JP3977292B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7328161B2 (en) | 2008-02-05 |
KR20040007815A (ko) | 2004-01-28 |
US20040008615A1 (en) | 2004-01-15 |
CN1205755C (zh) | 2005-06-08 |
GB2390788B (en) | 2004-06-30 |
JP2004046179A (ja) | 2004-02-12 |
KR100462615B1 (ko) | 2004-12-20 |
NL1023560C2 (nl) | 2005-10-20 |
NL1023560A1 (nl) | 2004-01-13 |
CN1467703A (zh) | 2004-01-14 |
GB2390788A (en) | 2004-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3977292B2 (ja) | 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 | |
KR101221918B1 (ko) | 신호 처리 방법 및 장치 | |
KR100908081B1 (ko) | 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법 | |
JP4345890B2 (ja) | 不完全なスペクトルを持つオーディオ信号の周波数変換に基づくスペクトルの再構築 | |
AU2002318813B2 (en) | Audio signal decoding device and audio signal encoding device | |
US8355921B2 (en) | Method, apparatus and computer program product for providing improved audio processing | |
JP6377110B2 (ja) | 信号をインタリーブするためのオーディオ復号器 | |
JP2006048043A (ja) | オーディオデータの高周波数の復元方法及びその装置 | |
CN102047336B (zh) | 用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构 | |
US20060100885A1 (en) | Method and apparatus to encode and decode an audio signal | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
JP4022504B2 (ja) | 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 | |
US20040176961A1 (en) | Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method | |
JP4359499B2 (ja) | オーディオ信号の編集 | |
JP2004199075A (ja) | ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
JP4539180B2 (ja) | 音響復号装置及び音響復号方法 | |
JP2000330592A (ja) | 圧縮音響ストリーム内データ追加方法およびその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060808 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061212 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070411 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130629 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |