JP4022504B2 - 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 - Google Patents

少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 Download PDF

Info

Publication number
JP4022504B2
JP4022504B2 JP2003292364A JP2003292364A JP4022504B2 JP 4022504 B2 JP4022504 B2 JP 4022504B2 JP 2003292364 A JP2003292364 A JP 2003292364A JP 2003292364 A JP2003292364 A JP 2003292364A JP 4022504 B2 JP4022504 B2 JP 4022504B2
Authority
JP
Japan
Prior art keywords
channel
high frequency
frequency components
generated
channel signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003292364A
Other languages
English (en)
Other versions
JP2004184975A (ja
Inventor
潤學 呉
マシュー・マヌ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004184975A publication Critical patent/JP2004184975A/ja
Application granted granted Critical
Publication of JP4022504B2 publication Critical patent/JP4022504B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

本発明は、オーディオデコーディング方法及び装置に関し、より詳しくは、少ない計算量で高周波数成分を復元することにより、高音質のオーディオ信号を出力することができるオーディオデコーディング方法及び装置に関する。
一般に、オーディオのコーディング時に、より効率良くデータを圧縮するためには、心理音響モデル(psychoacoustic model)を利用して、人が感知できない高周波数成分には、少ないビットしか割り当てない。
このようにすると、データの圧縮率は良くなる反面、高周波数領域が損失されるようになる。この高周波数領域の損失により、データを再生したとき、音色が変わると共に音の明瞭度が低下し、抑えられたり、鈍い音を出すことになる。従って、原音の音色を充実に再生すると共に、音の明瞭度を高めるために、損失された高周波数成分を復元する後処理音質改善方法が求められている。
このようなオーディオ信号の音質を向上させるための手段として、図1に示すように、エンコーディングされた信号が入力すると、デコーダー110を介して左チャンネル信号と、右チャンネル信号とに分け、それぞれデコーディングした後、第1及び第2の高周波数成分生成部120及び130を介してデコーディングされた左右チャンネルの信号に対する高周波数成分をそれぞれ復元する後処理方法が開示されている。
然るに、大半のオーディオ信号の場合、左チャンネル信号と右チャンネル信号とは、お互いに類似であり、重複が多いため、エンコーディングアルゴリズムにおいて、左チャンネル信号と、右チャンネル信号とを独立にそれぞれエンコーディングを行わず、そのため、左チャンネル信号と右チャンネル信号とに対し、それぞれ高周波数成分を復元する従来の後処理方法は、チャンネル間の類似性を効率良く利用できず、不要な計算量が増えるという問題点があった。
本発明は、上記問題点に鑑みなされたものであり、少ない計算量でも高音質のオーディオ信号を復元できるオーディオデコーディング方法及び装置を提供することを目的とする。
上記の目的を達成するために、本発明に係るオーディオデコーディング方法においては、各チャンネルごとに1フレームずつスキップしながら高周波数成分を生成し、左右チャンネル信号が類似であると、一方のチャンネルで生成された高周波数成分をそれぞれ用いて、他方のチャンネルのスキップしたフレームの高周波数成分を生成し、左右チャンネル信号が類似でないと、各チャンネルごとに、以前のフレームの高周波数成分をそれぞれ用いて、スキップしたフレームの高周波数成分を生成することを特徴とする。
なお、本発明に係るオーディオデコーディング装置においては、エンコーディングされたオーディオデータを入力して、デコーディングし、第1のチャンネル及び第2のチャンネルのオーディオ信号として出力するオーディオデコーダーと、第1のチャンネル信号と第2のチャンネル信号との間に類似性があるか否かを判断するチャンネル類似判断部と、前記第1のチャンネル信号と第2のチャンネル信号との間に類似性があるか否かによって、各チャンネルに対する高周波数成分を生成する高周波数成分生成部と、前記デコーディングされたオーディオ信号に、前記生成された高周波数成分を合成して出力するオーディオ合成部とを備えていることを特徴とする。
上述した本発明によると、既存の後処理方法では、音質改善の効果にも関わらず、計算量が多すぎて、実際に製品化することが極めて難しかったが、本発明の高周波数成分を復元する方法により、計算量を30%ほど減らすことができるという効果が得られる。
以下、本発明の好ましい実施の形態を、添付図面に基づいて詳しく説明する。
図2は、本発明に係るオーディオデコーディング装置200の概略構成図である。図示のように、オーディオデコーディング装置200は、デコーダー210と、チャンネル類似判断部220と、高周波数成分生成部230と、オーディオ合成部240とを備え、オーディオビットストリームをデコーディングし、そのデコーディングされたオーディオ信号から各チャンネルに対する高周波数成分を復元するようになっている。
デコーダー210は、オーディオビットストリームが入力すると、これをデコーディングし、オーディオ信号にして出力するが、入力したオーディオビットストリームからオーディオデータを復号し、その復号されたデータを逆量子化して、エンコーディング過程で行われた量子化処理を還元することにより、元のオーディオ信号を出力する。
ここで、デコーダー210で行われるデコーディング方法は、スケールファクタコーディング(Scale factor coding)、AC−3、MPEG、ハフマン符号化(Huffman coding)など、オーディオ信号の圧縮時に行われたエンコーディングの種類によって異なるが、本実施例のデコーダー210は、オーディオ信号処理において広く用いられているデコーダーと、その構成及び動作が同様であるので、その詳細は省略する。
一方、オーディオ信号の低周波数領域から高周波数領域を復元するためのアルゴリズムとして、SBR(Spectral Band Replication)が、これまで提案されていた様々な後処理音質改善方法のなかで、最も性能に優れていると知られているが、SBR2の場合、MPEG-1レイヤ-3に従属的な後処理アルゴリズムであるので、種々のオーディオコデックに適用できず、SBR1の場合、SBR2に比べて種々のオーディオコデックに適用できるものの、各フレームごとに左チャンネル信号と右チャンネル信号とに対し、それぞれ後処理を行っており、チャンネル間の類似性を効率良く利用できず、計算量が多くなって実際に製品化するのは極めて難しいという問題があった。
従って、本発明においては、種々のオーディオコデックに適用できると共に、復元音質に優れているSBR1(以下、単にSBRと称する)の欠点として挙げられていた計算量を減らすために、後述するように、チャンネル類似判断部220及び高周波数成分生成部230を介してチャンネル間の類似性を効率良く利用することにより、少ない計算量でも高周波数成分を復元できるようにしている。
チャンネル類似判断部220は、デコーディングされたオーディオ信号が入力すると、そのオーディオ信号にモード情報が含まれているかを分析し、モード情報を含んでいると、そのモード情報に基づいて、左右チャンネル間の類似性を判断し、モード情報を含んでいないと、各チャンネル信号に対する和や差の情報から得られたSNR(Signal to Noise Ratio)に基づいて、各チャンネル信号間の類似性を判断する。
ここで、オーディオ信号にモード情報が含まれていないときに、各チャンネル信号間の類似性を判断するために、SNRを利用しているのは、一般的なオーディオコデックにおいて圧縮率が高い場合、各チャンネル信号に対する和や差の情報をコーディングしており、このような和や差の情報から得られたSNR値に基づいて左右チャンネル間の類似性を判断できるためである。
以下、本発明の理解のために、MPEG−1レイヤ3オーディオ信号を例にして、左右チャンネル間の類似性判断方法について説明する。
図3は、MPEG−1レイヤ3オーディオストリームのフォーマットである。
図3を参照して、エムペグ-1(MPEG−1)レイヤ3オーディオストリームは、オーディオ復号単位(Audio Access Unit、以下、AAUとも称す)300からなり、このオーディオ復号単位(AAU)300は、一つ一つ個別に復号できる最小単位として、常時一定のサンプル数のデータが圧縮されて、載せられている。
また、オーディオ復号単位(AAU)300は、ヘッダー(header)310とエラーチェック(Cyclic Redundancy Check、以下、CRCとも称する)320と、オーディオデータ(audio data)330及び補助データ(auxiliary data)340とから構成されている。
さらに、前記ヘッダー310には、同期ワード(syncword)、ID情報、階層情報、保護ビット(protection bit)の有無情報,ビット率インデックス(bitrate index)情報、サンプリング周波数情報、パディングビット(padding bit)の有無情報、個別の用度のビット、モード情報、モード拡張情報、著作権(copyright)情報、原本あるいは複写本であるかの情報及びエンファシス(emphasis)特性情報が含まれている。
また、CRC320は、選択的に備えており、この有無はヘッダー310にて定義され、その長さは16ビットとなる。
さらに、オーディオデータ330は、圧縮の音声データが挿入される部分であり、かつ、補助データ340は、オーディオデータ330の終わりが、一つのオーディオ復号単位(AAU)の終わりに到していない場合、残っている部分を表すものであり、エムペグオーディオの他に任意のデータが挿入されることも可能である。
図3に示すように、MP3オーディオビットストリームのヘッダー310には、チャンネル間の類似性を利用して圧縮しているか否かを表すモード情報が含まれており、入力されるMP3オーディオビットストリームからモード情報を分析することにより、各チャンネルに対する類似性を判断することが可能である。
従って、チャンネル類似判断部220は、前述したように、モード情報を含んでいるMPEG−1レイヤ3オーディオ信号が入力すると、MPEG−1レイヤ3オーディオ信号に含まれたモード情報を分析し、前記モード情報が左チャンネル信号と右チャンネル信号との間の類似性が大きいジョイントステレオモード(joint stereo mode)値であるか、あるいは、二つのチャンネルの間で類似性が無く差の大きいステレオモード(stereo mode)値であるかを判断し、二つのチャンネル間の類似性を判断する。
一方、チャンネル類似判断部220は、デコーディングされたオーディオ信号にモード情報が含まれていないと、オーディオ信号から得られた各チャンネル信号に対する和や差の情報に基づいてチャンネル間の類似度を表すパラメータSNRを計算し、算出されたSNR値がチャンネルの間の類似度しきい値よりも小さいときは、二つのチャンネルが類似であると判断し、算出されたSNR値がチャンネルの間の類似度しきい値よりも大きいときは、二つのチャンネルが類似でないと判断する。
すなわち、本発明においては、各チャンネル信号に対する和や差の情報から得られたSNR値をチャンネルの間の類似度を表すパラメータとして用いるが、各チャンネル信号に対する和や差の情報からSNRを計算する方法について、以下に具体的に述べる。
先ず、各チャンネル信号に対する和のエネルギーと、差のエネルギーとを計算した上、差のエネルギーの値を分子に置き、和のエネルギーと差のエネルギーを合計した値を分母に置いて除算を行った値にログ関数を適用した後、10を乗算して計算するが、このとき、エネルギーを求める計算量を減らすために、和や差の情報の大きさを利用することが好ましい。
上述において、チャンネル間での類似度しきい値は、実験的に求めた値として決めても良いが、本発明においては、チャンネル間での類似度しきい値として20dBを適用している。
従って、チャンネル類似判断部220は、前記したように、オーディオ信号にモード情報が含まれているかを分析し、モード情報を含んでいると、モード情報に基づいて左右チャンネル間の類似性を判断し、モード情報を含んでいないと、各チャンネル信号に対する和や差の情報から得られたSNRに基づいてチャンネル信号間の類似性を判断する。
ちなみに、前述の左右チャンネル間の類似性判断方法においては、当業界の通常の知識を有する者にとっては、他の多くの変更及び等しい実施の形態を有することが可能であるが、例えば、MPEG−1レイヤ3オーディオ信号の他にAC−3オーディオ信号のように、左チャンネル信号と、右チャンネル信号と差の情報が含まれていると、これに基づいて左右チャンネル間の類似性を判断することも可能であり、オーディオビットストリームに線型予測係数が存在すると、その線型予測係数を復号化した後、スペクトラムエンベロープ信号をモデリングして、左右チャンネル間の類似性を判断することも可能である。
一方、高周波数成分生成部230は、SBRを利用して左右チャンネル信号に対し、各チャンネルごとに1フレームずつスキップしながら高周波数成分を生成した後、左右チャンネル信号が類似であるときは、一方のチャンネルで生成された高周波数成分を用いて、他方のチャンネルのスキップしたフレームの高周波数成分を生成し、左右チャンネル信号が類似でないときは、各チャンネルごとに、以前のフレームの高周波数成分を用いて、スキップしたフレームの高周波数成分を生成する。これについては、図5〜図7を参照しながら後でより詳しく説明することにする。
前記高周波数成分生成部230を介して各チャンネルに対する高周波数成分が生成されると、オーディオ合成部240は、デコーディングされたオーディオ信号に、前記生成された高周波数成分を合成して出力する。このように、チャンネル間の類似性に基づいて高周波数成分を復元することにより、計算量を減らしながらもオーディオ信号の音質を向上することが可能となる。
以下、本発明に係るオーディオデコーディング方法について、図面を参照しながら詳しく説明する。
図4は、本発明に係るオーディオデコーディング方法の全体を示すフローチャートである。
先ず、デコーダー210は、オーディオビットストリームが入力すると、これをデコーディングし、オーディオ信号にして出力する(S10)。ここで、デコーディング方法は、AC−3、MPEG、ハフマン符号化などのオーディオ信号の圧縮のために行われたエンコーディング方法によって異なる。
その後、高周波数成分生成部230は、SBRを利用して左右チャンネル信号に対し、各チャンネルごとに1フレームずつスキップしながら高周波数成分を生成する(S20)。以下、図5を参照しながらより詳しく説明する。
図5は、本発明により各チャンネルごとに1フレームずつスキップしながら高周波数成分を生成する方法を示す図であり、図示のように、高周波数成分生成部230は、左チャンネルと右チャンネルごとに1フレームずつスキップしながら高周波数成分を生成する。
すなわち、時間t1のときのフレームで左チャンネルの高周波数成分(Lt1)を生成し、時間t2のときのフレームで右チャンネルの高周波数成分(Rt2)を生成する。時間t3、t4、t5...のときもチャンネルごとにこれらの方法を反復して行う。
その後、チャンネル類似判断部220は、左チャンネル信号と、右チャンネル信号との間の類似性を判断する(S30)が、各チャンネル信号間の類似性を判断する方法について、以下に簡単に説明する。
先ず、チャンネル類似判断部220は、デコーディングされたオーディオ信号にモード情報が含まれているかを分析し、モード情報を含んでいると、モード情報に基づいてチャンネル信号間の類似性を判断するが、このとき、前記モード情報が左チャンネル信号と右チャンネル信号との間の類似性が大きいジョイントステレオモード値であるか、あるいは、二つのチャンネル間の類似性が無く差の大きいステレオモード値であるかを判断し、二つのチャンネル間の類似性を判断する。
若し、デコーディングされたオーディオ信号にモード情報が含まれていないと、チャンネル類似判断部220は、オーディオ信号から得られた各チャンネル信号に対する和や差の情報に基づいて、チャンネル間の類似度を表すパラメータSNRを計算し、その算出されたSNR値がチャンネル類似度のしきい値よりも小さいと、二つのチャンネルが類似であると判断し、算出されたSNR値がチャンネル類似度しきい値よりも大きいと、二つのチャンネルが類似でないと判断する。すなわち、デコーディングされたオーディオ信号にモード情報が含まれていないと、各チャンネル信号に対する和や差の情報から得られたSNRをチャンネル間の類似度を表すパラメータとして、チャンネル間の類似度しきい値である20dBと比較してチャンネル間の類似性を判断する。
ここで、モード情報に基づく各チャンネル信号間の類似性判断方法については、図2及び図3に関連する説明で既に詳しく説明しており、さらに詳しい説明は省略する。
その後、前記チャンネル類似判断部220を介して左チャンネル信号と右チャンネル信号とが類似でないと判断された場合は、高周波数成分生成部230は、各チャンネルごとに、以前のフレームの高周波数成分をそれぞれ用いて、スキップしたフレームの高周波数成分を生成することにより、各チャンネルの高周波数成分を別々に生成する(S40)。以下、図6を参照しながらより詳しく説明する。
図6は、左右チャンネルが類似でない場合、各チャンネルに対する高周波数成分を生成する方法を示す図であり、図示のように、左右チャンネルが類似でない場合、高周波数成分生成部230は、左チャンネルや右チャンネルごとに以前のフレームの高周波数成分(1フレームずつスキップしながら生成された高周波数成分)をそのまま用いて、スキップしたフレームの高周波数成分を生成している。
つまり、スキップしたフレームの高周波数成分、すなわち、時間t2での左チャンネルの高周波数成分(Lt2)は、t1の高周波数成分(Lt1)をそのまま適用し、t3での右チャンネルの高周波数成分(Rt3)は、t2の高周波数成分(Rt2)をそのまま適用する。
一方、前記チャンネル類似判断部220を介して左チャンネル信号と右チャンネル信号とが類似であると判断された場合には、高周波数成分生成部230は、一方のチャンネルで生成された高周波数成分を用いて、他方のチャンネルの高周波数成分を生成する(S50)。以下、図7を参照しながらより詳しく説明する。
図7は、左右チャンネルが類似である場合、各チャンネルに対する高周波数成分を生成する方法を示す図であり、図示のように、左右チャンネルが類似であると判断されると、高周波数成分生成部230は、左チャンネルで生成された高周波数成分をそのまま右チャンネルの高周波数成分として用い、右チャンネルで生成された高周波数成分をそのまま左チャンネルの高周波数成分として用いる。このとき、各チャンネルで生成された高周波数成分に所定の補正値(例えば、一定の定数)を乗じて他のチャンネルの高周波数成分を生成することも可能である。
すなわち、時間t1での右チャンネルの高周波数成分(Rt1)は、時間t1での左チャンネルの高周波数成分(Lt1)をそのまま適用し、時間t2での左チャンネルの高周波数成分(Lt2)は、時間t2での右チャンネルの高周波数成分(Rt2)をそのまま適用する。
このとき、左右チャンネル信号間の類似性が高いため、前述のようにしても、音質の低下はほとんど生じなく、各チャンネルごとに1フレームずつスキップしながら、一方のチャンネルの高周波数成分のみを生成して、他方のチャンネルの高周波数成分として効率良く利用することにより、従来のSBR方式に比べて計算量が30%程度減らすことになる。
最後に、デコーディングされたオーディオ信号に、前記生成された高周波数成分を合成して出力する(S60)。
一般に、大半のオーディオ信号の場合、左チャンネル信号と右チャンネル信号とが類似であるため、本発明のデコーディング方法によりオーディオビットストリームをデコーディングすると、既存の方法に比べて、高周波数成分を復元する際に計算量を30%程度減少することが可能である。
本発明に係る音質改善性能を従来のSBR、MP3方式と比較した一例を図8に示している。実験では、64kbpsに圧縮されたJAZZ3曲、POP9曲、ROCK7曲、CLASSIC6曲のオーディオ信号に対する音質評価を14回行っており、このとき、音質評価プログラムとしては、デジタル音声/オーディオ圧縮信号の測定システムとして広く知られているオペラツール(Opera Tool)を用いているが、このオペラツールでは、測定値が0に近似するほど復元音質が優れていると判断される。
図8に示すように、本発明の高周波数成分復元方法によって高周波数成分を復元しても、従来のSBR、MP3方式と比べて音質がほぼ類似しているか、あるいは音質の低下が極めて少ないことが分かる。
従って、音質改善効果にも関わらず、計算量が多すぎて、実際に製品化することが難しかった従来のSBRに比べ、本発明による計算量を30%ほど減らしながらも復元音質に優れているオーディオ信号を出力することが可能となる。
一方、前述の本発明の実施の形態は、コンピュータで実行できるプログラムにより作成可能であり、コンピュータで読み取り可能な記録媒体を用いて前記プログラムを動作させる汎用デジタルコンピュータにより具現できる。
前記コンピュータで読み取り可能な記録媒体としては、磁気記憶媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的読み取り媒体(例えば、CD−ROM、DVDなど)及びキャリアウェーブ(例えば、インターネットを介する伝送)のような格納媒体を含む。
以上、本発明に対し、好ましい実施例を中心に述べて来たが、本発明は、前記添付図面や実施例に限定されるものではなく、このような本発明の基本的な技術思想を逸脱しない範囲内で、当業界の通常の知識を有する者にとっては、他の多くの変更が可能であろう。また、本発明は、添付の特許請求の範囲により解釈されるべきであることは言うまでもない。
従来の後処理アルゴリズムが適用されたオーディオデコーディング装置を示す図である。 本発明に係るオーディオデコーディング装置の概略構成図である。 MPEG−1レイヤ3オーディオストリームのフォーマットを示す図である。 本発明に係るオーディオデコーディング方法を示す全体フローチャートである。 本発明の各チャンネルごとに1フレームずつスキップしながら高周波数成分を生成する方法を示す図である。 左右チャンネル信号が類似でない場合、各チャンネルに対する高周波数成分を生成する方法を示す図である。 左右チャンネル信号が類似である場合、各チャンネルに対する高周波数成分を生成する方法を示す図である。 本発明のオーディオデコーディング方法によりオーディオ復元音質が改善されたことを示すグラフである。
符号の説明
200 オーディオデコーディング装置
210 デコーダー
220 チャンネル類似判断部
230 高周波数成分生成部
240 オーディオ合成部

Claims (12)

  1. オーディオデータのデコーディング時に高周波数成分を生成する方法において、
    第1のチャンネル信号と第2のチャンネル信号に対して各チャンネル別に一部フレームだけ高周波数成分を生成するステップと、
    上記第1のチャンネル信号および第2のチャンネル信号に対するスペクトラムを相関させ得られたチャンネル相関関係係数によってチャンネル信号間の類似性の可否を判断するステップ、および
    前記第1のチャンネル信号と第2のチャンネル信号とが類似でない場合、高周波数成分が生成されていない残りのフレームの高周波数成分は、各チャンネルごとに、前記高周波数成分が生成されている一部のフレームの高周波数成分を用いて生成するステップとを含み、
    前記第1のチャンネル信号と第2のチャンネル信号とが類似である場合、
    各チャンネルごとに一部のフレームのみに高周波数成分を生成するステップと、
    高周波数成分が生成されていない残りのフレームの高周波数成分は、高周波数成分が生成されている他のチャンネルの一部のフレームの高周波数成分を用いて生成するステップとを含むことを特徴とする高周波数成分の生成方法。
  2. 前記第1のチャンネル信号と第2のチャンネル信号に対する和や差の情報から得られたSNRに基づいて、チャンネル信号間の類似性を判断することを特徴とする請求項1に記載の高周波成分の生成方法。
  3. 前記残りのフレームの高周波数成分は、前記一部のフレームの高周波数成分に所定の補正を行って生成されることを特徴とする請求項1に記載の高周波数成分の生成方法。
  4. 前記第1のチャンネル信号と第2のチャンネル信号とが類似でない場合、
    各チャンネルごとに一部のフレームのみに高周波数成分を生成するステップと、
    高周波数成分が生成されていない残りのフレームの高周波数成分は、各チャンネルごとに、前記高周波数成分が生成されている一部のフレームの高周波数成分を用いて生成するステップとを含むことを特徴とする請求項1に記載の高周波数成分の生成方法。
  5. 前記残りのフレームの高周波数成分は、前記一部のフレームの高周波数成分に所定の補正を行って生成されることを特徴とする請求項4に記載の高周波数成分の生成方法。
  6. エンコーディングされたオーディオデータの入力を受け、デコーディングし、第1のチャンネル及び第2のチャンネルのオーディオ信号にして出力するステップと、
    前記第1のチャンネル及び第2のチャンネル信号に対し、各チャンネルごとに、一部フレームのみに高周波数成分を生成するステップと、
    前記第1のチャンネル信号と第2のチャンネル信号に対するスペクトラムを相関させ得られたチャンネル相関関係係数によってチャンネル信号間の類似性の可否を判断するステップと、
    前記第1のチャンネル信号と第2のチャンネル信号とが類似でない場合、高周波数成分が生成されていない残りのフレームの高周波数成分は、高周波数成分が生成されているチャンネルの一部のフレームの高周波数成分を用いて生成するステップと、
    前記デコーディングされたオーディオ信号に、前記生成された高周波数成分を合成して出力するステップとを含み、
    前記第1のチャンネル信号と第2のチャンネル信号とが類似である場合、
    各チャンネルごとに一部のフレームのみに高周波数成分を生成するステップと、
    高周波数成分が生成されていない残りのフレームの高周波数成分は、高周波数成分が生成されている他のチャンネルの一部のフレームの高周波数成分を用いて生成するステップとを含むことを特徴とする高周波数成分を復元するオーディオデコーディング方法。
  7. 前記チャンネル信号間の類似性を判断するステップは、
    前記第1のチャンネル信号と第2のチャンネル信号に対する和や差の情報から得られたSNRに基づいて、チャンネル信号間の類似性を判断するステップを含むことを特徴とする請求項6に記載の高周波数成分を復元するオーディオデコーディング方法。
  8. 前記第1のチャンネル信号と第2のチャンネル信号とが類似でないと判断された場合、
    前記高周波数成分が生成されていない残りのフレームの高周波数成分は、各チャンネルごとに、前記高周波数成分が生成されている一部のフレームの高周波数成分を用いて生成するステップをさらに含むことを特徴とする請求項6に記載の高周波数成分を復元するオーディオデコーディング方法。
  9. エンコーディングされたオーディオデータの入力を受け、デコーディングし、第1のチャンネル及び第2のチャンネルのオーディオ信号にして出力するオーディオデコーダーと、
    前記第1のチャンネル信号と第2のチャンネル信号に対して各チャンネル別に一部フレームだけ高周波数成分を生成し、上記第1のチャンネル信号および第2のチャンネル信号に対するスペクトラムを相関させ得られたチャンネル相関関係係数によってチャンネル信号間の類似性の可否を判断するチャンネル類似判断部と、
    前記第1のチャンネル信号と第2のチャンネル信号とが類似でない場合、高周波数成分が生成されていない残りのフレームの高周波数成分は、各チャンネルごとに、前記高周波数成分が生成されている一部のフレームの高周波数成分を用いて生成する高周波数成分生成部と、
    前記デコーディングされたオーディオ信号に、前記生成された高周波数成分を合成して出力するオーディオ合成部とを備え、
    前記チャンネル類似判断部の判断により、第1のチャンネル信号と第2のチャンネル信号とが類似である場合、
    各チャンネルごとに一部のフレームのみに高周波数成分を生成するステップと、
    高周波数成分が生成されていない残りのフレームの高周波数成分は、高周波数成分が生成されている他のチャンネルの一部のフレームの高周波数成分を用いて生成するステップとを含むことを特徴とする高周波数成分を復元するオーディオデコーディング装置。
  10. 前記高周波数成分生成部は、前記第1のチャンネル及び第2のチャンネルごとに、一部のフレームのみに高周波数成分を生成した後、前記第1のチャンネル信号と第2のチャンネル信号とが類似であるときは、前記高周波数成分が生成されていない残りのフレームの高周波数成分は、高周波数成分が生成されている他のチャンネルの一部のフレームの高周波数成分を用いて生成することを特徴とする請求項9に記載の高周波数成分を復元するオーディオデコーディング装置。
  11. 前記高周波数成分生成部は、前記第1のチャンネル及び第2のチャンネルごとに、一部のフレームのみに高周波数成分を生成した後、前記第1のチャンネル信号と第2のチャンネル信号とが類似でないときは、前記高周波数成分が生成されていない残りのフレームの高周波数成分は、各チャンネルごとに、前記高周波数成分が生成されている一部のフレームの高周波数成分を用いて生成することを特徴とする請求項9に記載の高周波数成分を復元するオーディオデコーディング装置。
  12. 請求項1乃至請求項8のいずれかに記載の方法が、コンピュータで実行することができるプログラムとして記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。
JP2003292364A 2002-11-29 2003-08-12 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 Expired - Fee Related JP4022504B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0075529A KR100501930B1 (ko) 2002-11-29 2002-11-29 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치

Publications (2)

Publication Number Publication Date
JP2004184975A JP2004184975A (ja) 2004-07-02
JP4022504B2 true JP4022504B2 (ja) 2007-12-19

Family

ID=32388286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003292364A Expired - Fee Related JP4022504B2 (ja) 2002-11-29 2003-08-12 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置

Country Status (4)

Country Link
US (1) US7444289B2 (ja)
JP (1) JP4022504B2 (ja)
KR (1) KR100501930B1 (ja)
CN (1) CN1266672C (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100750115B1 (ko) * 2004-10-26 2007-08-21 삼성전자주식회사 오디오 신호 부호화 및 복호화 방법 및 그 장치
WO2009084226A1 (ja) * 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
JP2010102042A (ja) * 2008-10-22 2010-05-06 Ntt Docomo Inc 音声信号出力装置、音声信号出力方法および音声信号出力プログラム
KR101589942B1 (ko) 2009-01-16 2016-01-29 돌비 인터네셔널 에이비 외적 향상 고조파 전치
WO2010111841A1 (zh) * 2009-04-03 2010-10-07 华为技术有限公司 频域脉冲解码的预测方法和预测装置及解码器
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN104299614B (zh) 2013-07-16 2017-12-29 华为技术有限公司 解码方法和解码装置
JP5744992B2 (ja) * 2013-09-17 2015-07-08 株式会社Nttドコモ 音声信号出力装置、音声信号出力方法および音声信号出力プログラム
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
CN111164682A (zh) * 2017-10-24 2020-05-15 三星电子株式会社 使用机器学习的音频重建方法和设备
CN109979486B (zh) * 2017-12-28 2021-07-09 中国移动通信集团北京有限公司 一种语音质量评估方法及装置
CN108231091B (zh) * 2018-01-24 2021-05-25 广州酷狗计算机科技有限公司 一种检测音频的左右声道是否一致的方法和装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5639646A (en) * 1979-09-07 1981-04-15 Pioneer Electronic Corp Processor for demodulation output of stereophonic signal
US6289308B1 (en) * 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
KR0134318B1 (ko) * 1994-01-28 1998-04-29 김광호 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JP3136995B2 (ja) * 1996-05-30 2001-02-19 日本ビクター株式会社 ラウドネス回路
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3484341B2 (ja) * 1998-03-30 2004-01-06 三菱電機株式会社 音声信号伝送装置
JP3596296B2 (ja) 1998-08-06 2004-12-02 松下電器産業株式会社 音場再生装置および方法
US7031474B1 (en) 1999-10-04 2006-04-18 Srs Labs, Inc. Acoustic correction apparatus
JP3894722B2 (ja) * 2000-10-27 2007-03-22 松下電器産業株式会社 ステレオオーディオ信号高能率符号化装置
JP2002168694A (ja) * 2000-12-04 2002-06-14 Inst Of Physical & Chemical Res 分光器
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
JP2002182699A (ja) * 2000-12-15 2002-06-26 Matsushita Electric Ind Co Ltd 音声符号化装置
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
JP3755739B2 (ja) 2001-02-15 2006-03-15 日本電信電話株式会社 ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치

Also Published As

Publication number Publication date
CN1504993A (zh) 2004-06-16
KR100501930B1 (ko) 2005-07-18
CN1266672C (zh) 2006-07-26
US20040107090A1 (en) 2004-06-03
KR20040047361A (ko) 2004-06-05
US7444289B2 (en) 2008-10-28
JP2004184975A (ja) 2004-07-02

Similar Documents

Publication Publication Date Title
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
JP6013646B2 (ja) オーディオ処理システム
KR101221918B1 (ko) 신호 처리 방법 및 장치
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
US20060031075A1 (en) Method and apparatus to recover a high frequency component of audio data
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
JP4022504B2 (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
US20060100885A1 (en) Method and apparatus to encode and decode an audio signal
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
US7466245B2 (en) Digital signal processing apparatus, digital signal processing method, digital signal processing program, digital signal reproduction apparatus and digital signal reproduction method
JP4359499B2 (ja) オーディオ信号の編集
JP2004198485A (ja) 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
US20030014241A1 (en) Method of and apparatus for converting an audio signal between data compression formats
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
JP4004525B1 (ja) 信号処理方法、信号処理装置及びコンピュータプログラム
JP4556866B2 (ja) 高能率符号化プログラム及び高能率符号化装置
JP4004526B1 (ja) 信号処理方法、信号処理装置及びコンピュータプログラム
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JP4004524B1 (ja) 信号処理方法、信号処理装置及びコンピュータプログラム
JP4539180B2 (ja) 音響復号装置及び音響復号方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20061003

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070104

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111005

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121005

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131005

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees