JP2007524124A - トランスコーダ及びそのための符号変換方法 - Google Patents

トランスコーダ及びそのための符号変換方法 Download PDF

Info

Publication number
JP2007524124A
JP2007524124A JP2006552729A JP2006552729A JP2007524124A JP 2007524124 A JP2007524124 A JP 2007524124A JP 2006552729 A JP2006552729 A JP 2006552729A JP 2006552729 A JP2006552729 A JP 2006552729A JP 2007524124 A JP2007524124 A JP 2007524124A
Authority
JP
Japan
Prior art keywords
data
transcoder
parametric
parametric extension
extension data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006552729A
Other languages
English (en)
Inventor
ウェー イェー オーメン,アルノルデュス
ヘー ペー スハイエルス,エリク
ミデリンク,マルク ウェー テー クレイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007524124A publication Critical patent/JP2007524124A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

トランスコーダは、符号化信号を表し、第1符号化データと第1パラメトリック拡張データとを有する入力データを表す受信機を有する。符号化データは、デコーダに供給される。デコーダの出力は、異なる符号化プロトコルに従って、又は異なる符号化パラメータにより第2符号化データを生成するエンコーダに供給される。第1パラメトリック拡張データは、第1パラメトリック拡張データから直接第2パラメトリック拡張データを生成する拡張データプロセッサに供給される。第2符号化データ及び第2パラメトリック拡張データは、個別に決定されたパラメトリック拡張データを有する符号変換信号を生成するため、出力プロセッサにおいて合成される。パラメトリック拡張データは、音声ビットストリームのSBR(Spectral Band Replication)又はPS(Parametric Stereo)拡張データであってもよい。品質の向上及び複雑さの低下は、パラメトリック拡張データの個別の符号変換によって達成される。

Description

本発明は、トランスコーダ及びそのための符号変換方法、特に音声信号の符号変換に関する。
近年、デジタル形式によるA/Vコンテンツの配布及び格納が実質的に増大している。このため、多数の符号化規格及びプロトコルが、MPEG−2音声及び映像符号化などを含め開発されてきた。
音声信号のデジタル符号化のための最も広く知られている符号化規格の1つは、MPEG−1レイヤ3規格であり、ISO/IEC JTC1/SC29/WG11 MPEG,IS11172−3,Information Technology−Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5 Mbit/s,Part3:Audio,MPEG−1,1992に記載され、一般にはMP3と呼ばれている。例えば、MP3は、楽曲の30又は40メガバイトデジタルPCM(Pulse Code Modulation)ステレオ音声記録が、例えば、3又は4メガバイトMP3ファイルに圧縮されることを可能にする。正確な圧縮レートは、MP3符号化音声の所望される品質に依存する。音声符号化規格の他の例は、AAC(Advanced Audio Coding)であり、ISO/IEC JTC1/SC29/WG11 MPEG,IS13818−7,Information Technology−Generic Coding of Moving Pictures and Associated Audio,Part7:Advanced Audio Coding,1997に記載されている。
MP3やAACなどの音声符号化及び圧縮技術は、比較的低いデータサイズであって高い品質の音声ファイルが、インターネットなどのデータネットワークを介し便利に配布されることを可能にする極めてビットレート効率的な音声変換を提供する。しかしながら、帯域幅要求を低減し、又は符号化された信号の品質を増大させるより効率的な技術が望まれる。例えば、ここ数年間のインターネットを介した音声ファイルの配布の増大は、ネットワークロードの蓄積をもたらした。さらに、より低い符号化データレートはさらに、ダウンロード時間を縮小させる。
このため、より効率的な符号化技術を提供するため、多くの研究がなされてきた。しかしながら、既存の符号化技術の広範な普及により、新たな技術はこれらの1以上と後方互換性を有することが好ましい。
音声信号の符号化のため近年開発された2つの技術は、SBR(Spectral Band Replication)とPS(Parametric Stereo)符号化として知られている。これらの技術は、後方互換的に何れかの音声符号化スキームに加えて適用することが可能である。具体的には、SBRとPSは、MP3やAACフォーマットなどにより音声信号を符号化するためのビットレートを低減するのに利用可能なエンハンスメントデータを生成する。このエンハンスメントデータは、MP3又はAACデータストリームの補助的なデータセクションに格納されてもよく、これにより、従来のデコーダが不可データを無視することを可能にする。
PSでは、ステレオ音声符号化は、MP3やAACなどを用いてシングルモノ信号のみを符号化することによって達成される。さらに、ステレオイメージングパラメータがエンコーダにおいて決定され、独立した拡張データとしてデータストリームに含められる。デコーダでは、モノ符号化チャネルが、ステレオイメージングパラメータに依存した2つのチャネルについて異なってモノ符号化信号を処理することによってステレオチャネルに拡張される。これらのパラメータは、IID(Inter−channel Intensity Difference)、ITD又はIPD(Inter−channel Time又はPhase Difference)及びICC(Inter−channel Cross−Correlation)から構成される。
SBRエンハンストエンコーダでは、符号化対象の音声信号の低周波数帯が抽出される。この低周波数帯は、その後、MP3やAACなどの適切な符号化技術を用いて符号化される。さらに、SBRエンコーダは、エンハンスメントデータとしてデータストリームに含まれる高周波数パラメータを生成する。従って、音声信号の高周波数帯は、低周波数帯と同様には符号化されず、パラメータ符号化される。具体的には、高帯域は、低周波数帯のトランスポジション(transposition)と共に、高周波数帯を生成するよう変換された信号がどのように処理されるべきか(例えば、エンベロープ変調(envelope modification)などによって)示すデータを有する高周波数パラメータによって生成される。SBRデコーダは、高周波数パラメータを抽出し、これらの高周波数パラメータに従って変換された低周波数帯を変調することによって高周波数帯を生成する。具体的には、SBR高周波数パラメータは、以下の情報を含む。
・トランスポジション情報(すなわち、低周波数帯サブバンドと高周波数帯サブバンドとの間のマッピングを示す情報)
・スペクトルエンベロープデータ スペクトルエンベロープデータは、SBR処理後のサブバンドのエネルギー値を示す。
・ノイズフロアデータ ノイズフロアデータは、変換された信号の推定されるエネルギーと共に(この推定は、SBRデコーダにおいて計算される)、高帯域信号に追加されるノイズ量を示す。
・任意的に、欠落した高周波数コンポーネントに関する情報(例えば、高帯域に存在するが、低帯域には存在しないハーモニックなど)
SBRエンハンスメントを有するMP3エンコーダは、mp3PROエンコーダとして知られ、SBRエンハンスメントを有するAACエンコーダは、aacPlus又はHE(High Efficiency)−AACエンコーダとして知られる。
SBRとPSの何れについても、エンハンスメントパラメータは、エンハンスメントパラメータのデータレートが補助的データセクションの利用可能なキャパシティを超えない限り、コア符号化スキームの補助的データ部分に効率的に符号化することが可能である。従来のデコーダは、この補助的データを処理せず、コア符号化データを復号化するのみである。SBRについて、これは帯域制限された信号であり、PSについては、フル帯域モノラル信号である。このように、音声信号は品質の低下はあるが、従来のデコーダによって生成可能であるため、後方互換性が維持される。
各種符号化規格及び技術により、同一の符号化規格の異なる符号化設定又は符号化規格の間の符号変換を行うことはしばしば便利である。従って、フォーマットAのビットストリームを異なる符号化パラメータ(ビットレート、サンプリングレートなど)による同一のフォーマットA又は異なるフォーマットBに変換するため、符号変換が利用される。従来、トランスコーダは、入力信号がまず、入力データのフォーマットに従って復号され、その後、出力されたデータストリームのフォーマットに従って再符号化されるように、デコーダとエンコーダのカスケードを実現する。
一般に、これは品質ロスを招くであろう。符号変換の問題は、符号化スキームがSBR及び/又はPSなどのパラメトリック拡張と組み合わされるとき、さらに複雑となる。これらの拡張は可能な限り忠実に波形を表現することと比較して、パラメータ形式により信号の部分を表現するため、符号変換の結果として、より大きな品質の劣化が予想される。
さらに、符号変換の複雑さは、デコーダが入力される拡張データを処理しなければならず、エンコーダが新しい拡張データを生成しなければならないため、パラメトリック拡張により増大するかもしれない。これは、コスト増大、計算要求、遅延などをもたらすであろう。
従って、改良された符号変換が好適であり、特に、パフォーマンスの向上、品質の増大、データレートの低下及び/又は複雑さの低下を提供する符号変換が効果的となるであろう。
従って、本発明は、好ましくは、上記問題点の1以上を単独で又は何れかの組み合わせにより軽減、緩和又は解消しようとするものである。
本発明の第1の特徴によると、符号化信号を表し、第1パラメトリック拡張データを有する入力データを受信する手段と、前記第1パラメトリック拡張データから第2パラメトリック拡張データを決定する手段と、前記第2パラメトリック拡張データを有する符号変換データを生成する手段とを有することを特徴とするトランスコーダが提供される。
本発明の発明者は、符号変換データのパラメトリック拡張データが、入力データのパラメトリック拡張データから直接生成されてもよいということを理解していた。従って、本発明は、パラメトリック拡張データが復号化及び再符号化処理に含まれることを要求することなく、トランスコーダのパラメトリック拡張データの改良された処理を提供するかもしれない。従って、本発明は、トランスコーダの複雑さを低減することを可能にするかもしれない。あるいは、又はさらに、トランスコーダは、向上した品質のパラメトリック拡張データが決定され、復号化及び再符号化処理に関する品質低下を軽減又は回避可能であるため、符号変換データの品質を向上させるかもしれない。
パラメトリック拡張データは、符号化信号の品質を向上させるため、パラメトリックデコーダによって使用可能なパラメータデータを有するものであってもよい。パラメトリック拡張データは、音声符号化について、音声信号の完全又は特定部分を記述する音声信号ソースモデルに従って、パラメータを表すかもしれない。
例えば、第1及び/又は第2パラメトリック拡張データは、SBR(Spectral Band Replication)プロセスなどの拡張データに対応し、例えば、トランスポジション情報(transposition information)、スペクトルエンベロープデータ(spectral envelope data)及び/又はノイズフロアデータ(noise floor data)を含むものであってもよい。他の例として、第1及び/又は第2パラメトリック拡張データは、PS(Parametric Stereo)プロセスなどの拡張データに対応し、例えば、IID(Inter−channel Intensity Difference)データ、ITD(Inter−channel Time Difference)又はIPD(Inter−channel Phase Difference)データ、及び/又はICC(Inter−channel Cross−Correction)データを含むようにしてもよい。第3の例として、第1及び/又は第2パラメトリック拡張データは、空間マルチチャネル拡張データに対応するかもしれない。例えば、符号化信号は後方互換的なステレオ信号であってもよく、パラメトリック拡張データは、センター及びリアチャネルなどのさらなる空間チャネルの生成を可能にするデータを有するものであってもよい。
入力データは入力データストリームであってもよく、符号変換データは符号変換データストリームであってもよい。
本発明の特徴によると、前記入力データはさらに、前記符号化信号に関する第1符号化データを有し、当該トランスコーダはさらに、第2符号化データを生成するため前記第1符号化データを符号変換する手段を有し、前記生成する手段は、前記第2符号化データと前記第2パラメトリック拡張データとを組み合わせることによって、前記符号変換データを生成するよう動作可能である。
第1符号化データは第1符号化規格に従って符号化されてもよく、第1符号化データのみに基づく独立した復号化を可能にするのに十分な情報を有するものであってもよい。第1パラメトリック拡張データは、符号化信号をエンハンスするのに適したデコーダによって利用可能なエンハンスメントデータであってもよい。第1符号化データとパラメトリック拡張データは、独立に符号変換されてもよく、これにより、符号変換プロセスの個別の最適化が可能となり、これによって、パフォーマンスの向上及び/又は複雑さの低減が可能となる。
本発明の異なる特徴によると、前記決定する手段は、前記第1パラメトリック拡張データの少なくともいくつかのデータ値をコピーすることによって、前記第2パラメトリックデータの少なくとも一部を決定するよう動作可能である。これにより、複雑さの小さな実現形態が可能となり、及び/又は符号変換データストリームの品質が向上するかもしれない。特に、少なくともいくつかのデータ値の複製は、符号変換の効果がこれらのデータ値に導入されることを回避するかもしれない。
本発明の異なる特徴によると、前記決定する手段は、前記第2パラメトリック拡張データのデータ値を量子化する手段を有する。当該決定する手段は、符号変換データストリームについて必要に応じてデータ値を再量子化するかもしれない。例えば、ビットレートは、第1パラメトリック拡張データについて使用されるものとは異なる(例えば、より粗い)量子化を第2パラメトリック拡張データの少なくとも1つのデータ値に利用することによって低減されるかもしれない。再量子化は、第1パラメトリック拡張データから第2パラメトリック拡張データにコピーされるデータ値に適用可能であり、あるいは、例えば、補間によって第1パラメトリック拡張データから導出されるデータ値に適用されてもよい。
本発明の異なる特徴によると、前記決定する手段は、前記第2パラメトリック拡張データのデータ値を符号化する手段を有する。当該決定する手段は、符号変換データストリームについて必要に応じてデータ値を再符号化するかもしれない。この再符号化は、第1パラメトリック拡張データから第2パラメトリック拡張データにコピーされるデータ値に適用可能であり、あるいは、例えば、補間によって第1パラメトリック拡張データから導出されるデータ値に適用されてもよい。
本発明の異なる特徴によると、前記決定する手段は、前記第1パラメトリック拡張データのパラメトリック拡張データ値の間の補間によって、前記第2パラメトリックデータの少なくとも一部を決定するよう動作可能である。これは、符号変換出力ストリームに適した第2パラメトリック拡張データを決定する複雑さの低い手段を提供する。「補間」という用語は、補間と外挿の両方を含むようここでは使用されている。
本発明の異なる特徴によると、前記決定する手段は、前記第1パラメトリック拡張データの一時的データを特定し、前記一時的データに応答して、前記第2パラメトリック拡張データを生成する手段を有する。決定された一時的データは、例えば、一時的データ値であってもよく、あるいは一時的データ位置であってもよい。これは、符号変換データの品質を向上させ、符号化信号と符号変換出力ストリームとの間のより密接な対応をもたらすかもしれない。一時的データ値は、符号化信号の突然の変化に対応した入力データに含まれてもよい。具体的には、第1パラメトリック拡張データは、符号化信号の特性に応じたランダムな期間に発生する一時的値に加えて、規則的に、実質的に定期的に発生するデータ値を有するかもしれない。一時的値は、例えば、補間などによって第2パラメトリック拡張データに含まれるデータ値を計算するのに利用されてもよい。
本発明の異なる特徴によると、前記決定する手段は、少なくとも1つの一時的データパラメータを前記第2パラメトリック拡張データに含めるよう動作可能である。これは、一時的値に構成される情報が、より高い品質をもたらす符号変換データに保持されることを可能にし、及び/又は一時的値を有するパラメトリック拡張データの低い複雑さの符号変換を提供するかもしれない。
本発明の異なる特徴によると、前記決定する手段は、前記第2パラメトリック拡張データを決定する前に、前記第1パラメトリック拡張データをフィルタリングする手段を有する。これは、符号変換データの品質を向上させ、補間処理に関するローパスフィルタリングを補償することによって、高周波数パフォーマンスを特に向上させるかもしれない。
本発明の異なる特徴によると、前記入力データ及び符号変換データは、非同期フレーム構成を有し、前記第2パラメトリック拡張データを決定する手段は、前記第1パラメトリック拡張データの第1フレームの第1データ値及び前記第1パラメトリック拡張データの第2フレームの第2データ値に応答して、前記符号変換データのフレームに関する少なくとも1つのデータ値を決定するよう動作可能である。これは、非同期フレーム構成を有する符号化フォーマット間の低い複雑さ、効率的及び/又は高い品質の符号変換を提供する。入力データと符号変換データの非同期フレーム構成は、特に異なるフレーム長を有するようにしてもよい。
本発明の異なる特徴によると、前記決定する手段は、少なくとも前記第1データ値と前記第2データ値との間の補間によって、前記少なくとも1つのデータ値を決定するよう動作可能である。これは、符号変換出力ストリームに適した第2パラメトリック拡張データを決定する低い複雑さの手段を提供する。「補間」という用語は、補間と外挿の両方を含むようここでは使用されている。
本発明の異なる特徴によると、前記第1データ値は、複数の第1周波数サブバンドに関する複数のサブ値を有し、前記第2データ値は、複数の第2周波数サブバンドに関する複数のサブ値を有し、前記決定する手段は、複数の第3周波数サブバンドに関する複数のサブ値を有するよう前記少なくとも1つのデータ値を決定するよう動作可能である。これは、符号変換出力ストリームに適した第2パラメトリック拡張データを決定する低い複雑さの手段を提供する。
本発明の異なる特徴によると、前記複数の第1、第2及び第3サブバンドは、同数の周波数サブバンドを有する。これは、符号変換出力ストリームに適した第2パラメトリック拡張データを決定する低い複雑さの手段を提供する。これは、符号変換出力ストリームに適した第2パラメトリック拡張データを決定する低い複雑さの手段を提供する。
本発明の異なる特徴によると、前記複数の第1サブバンドは、前記複数の第2サブバンドより多くの周波数サブバンドを有し、前記複数の第3サブバンドは、前記複数の第1サブ何度と同数の周波数サブバンドを有する。これは、符号変換出力ストリームに適した第2パラメトリック拡張データを決定する低い複雑さの手段を提供する。
第1及び/又は第2パラメトリック拡張データは、SBR(Spectral Band Replication)パラメトリック拡張データ及び/又はPS(Parametric Stereo)パラメトリック拡張データを有する。
本発明の異なる特徴によると、パラメトリック拡張データは、符号変換ビットストリームの補助的データセクションに含まれる。これは、後方互換性を提供するかもしれない。パラメトリック拡張データを利用することができない従来のデコーダは、補助的データセクションを無視することによって、符号変換ビットストリームを依然として復号するかもしれない。
好ましくは、前記符号化信号は、音声信号である。
本発明の第2の特徴によると、符号化信号を表し、第1パラメトリック拡張データを有する入力データを受信するステップと、前記第1パラメトリック拡張データから第2パラメトリック拡張データを決定するステップと、前記第2パラメトリック拡張データを有する符号変換データを生成するステップとを有することを特徴とする符号変換方法が提供される。
本発明の上記及び他の特徴、機能及び効果は、以降に記載される実施例を参照することにより明らかにされるであろう。
以下の説明は、音声トランスコーダに適用可能な本発明の実施例、特にSBR(Spectral Band Replication)又はPS(Parametric Stereo)パラメトリック拡張データを有する入出力信号間の符号変換のための音声トランスコーダに着目する。しかしながら、本発明はこれらの実施例に限定されるものではなく、他の多数のトランスコーダ及び拡張データに適用可能であるということは理解されるであろう。
図1は、本発明の実施例によるトランスコーダ100のブロック図を示す。
本実施例によると、パラメトリック拡張データの符号変換に関する品質劣化は、入力データのパラメトリック拡張データから出力符号変換されたデータのパラメトリック拡張データを直接生成することによって、軽減又は緩和されるかもしれない。当該実施例では、入力データはさらに、与えられた符号化プロトコルに従って符号化された信号に対応する符号化データを有する。本実施例では、パラメトリック拡張データは、復号された信号の品質を向上させるため、適切なエンコーダによって使用可能なエンハンスメントデータである。例えば、この符号化データは、MP3やAACなどの音声符号化規格に従って符号化された信号を有するかもしれず、パラメトリック拡張データは、SBR及び/又はPSエンハンスメントデータを有するかもしれない。
具体的には、トランスコーダ100は、符号化信号とパラメトリック拡張データとを有する入力データストリームを受信する受信機101を有する。受信機101は、入力データストリームを逆多重化し、入力パラメトリック拡張データと入力符号化データを分離するよう動作可能である。
受信機101は、入力符号化データが供給されるデコーダ103に接続される。本実施例では、デコーダ103は、適切な符号化規格に従って入力符号化データを復号し、元になる音声信号のパルスコード変調表現を生成する。
デコーダ103は、パルスコード変調データを受信し、出力符号化データを生成するよう当該信号を復号化するエンコーダ105に接続される。本実施例では、エンコーダ105の符号化プロトコル又は規格は、入力符号化データの符号化プロトコルとは異なる。例えば、入力信号は、MP3符号化規格に従って符号化されてもよく、エンコーダ105は、AAC規格に従って動作可能である。
一部の実施例では、同一の符号化プロトコル又は規格が、異なる符号化パラメータにより利用可能である。例えば、エンコーダ105は、同一の符号化規格を使用するが、デコーダ103と異なるビットレートにより使用するかもしれない。
デコーダ105は、出力符号化データが供給される出力プロセッサ107に接続される。出力プロセッサ107は、符号変換されたデータストリームに符号化データを含める。
受信機101はさらに、入力パラメトリック拡張データが供給される拡張データプロセッサ109に接続される。拡張データプロセッサ109は、入力パラメトリック拡張データから出力パラメトリック拡張データを決定する。出力パラメトリック拡張データは、パラメトリック拡張データとして出力符号化データと互換性を有し、適切なものとなるよう生成される。
拡張データプロセッサ109は、出力パラメトリック拡張データが供給される出力プロセッサ107に接続される。出力プロセッサ107は、符号変換されたデータストリームに出力パラメトリック拡張データを含める。
従って、説明された実施例では、符号化信号は、エンコーダとトランスコーダの従来のカスケードを用いることによって符号変換される。さらに、入力データのパラメトリック拡張データは、出力データストリームに適したパラメトリック拡張データを生成するよう個別に処理される。従って、パラメトリック拡張データは最適な処理が可能であり、符号変換されたデータストリームの品質向上が可能となる。さらに、出力パラメトリック拡張データの生成に要する処理は、典型的には比較的シンプルなモノであり、デコーダとエンコーダはこのパラメトリック拡張データを無視することが可能であるため、より低い複雑さのトランスコーダが典型的には実現されるかもしれない。
入力データストリームと出力データストリームのフレーム長が合わせられたシンプルな実施例では、データは典型的には、入力パラメトリック拡張データから出力パラメトリック拡張データに直接コピーされるかもしれない。例えば、PS拡張データを有する第1ビットレートのMP3データストリームを異なるビットレートの他のMP3データストリームに符号変換することは、デコーダとエンコーダによってMP3データを符号変換し、入力ストリームの補助的データセクションから出力データストリームの補助的データセクションにPS拡張データを直接コピーすることによって達成されるかもしれない。
一部の実施例では、拡張データプロセッサ109は、出力パラメトリック拡張データのデータ値を再符号化及び/又は再量子化する機能を有するようにしてもよい。例えば、IID(Inter−channel Intensity Difference)のデータ値が、PSパラメトリック拡張データのデータレートを低減するため、より粗い量子化により量子化されてもよい。同様に、当該データ値の異なる符号化が、例えば、より高いエラー耐性などの望ましい特性を提供するのに利用されてもよい。
典型的には、出力パラメトリック拡張データのデータ値の量子化及び符号化は、特にデータ値が入力パラメトリック拡張データのデータ値に基づく計算によって求められたときに効果的である。
一部の実施例では、パラメトリック拡張データのみがトランスコーダによって変調されるようにしてもよいということは理解されるであろう。例えば、この符号変換は、ビットストリームの補助的データセクションからパラメトリック拡張データを抽出し、与えられたアルゴリズムに従ってパラメトリック拡張データを変調し、この変調されたパラメトリック拡張データを補助的データセクションに再挿入する。
入力データストリームと出力データストリームのフレーム長が揃っていない一部の実施例では、出力パラメトリック拡張データのデータ値は、入力パラメトリック拡張データのデータ値からの補間(外挿を含む)によって決定されてもよい。このアプローチは、大部分のパラメトリック拡張データパラメータにとって、それらは経時的にゆっくりと変化する傾向があるため適切である。
以下の説明は、このような実施例をIIDデータ値を特に参照することにより詳細に説明したが、同じ原理が他の多くのパラメータに適用可能であるということは理解されるであろう。
図2は、本発明の実施例によるパラメトリック拡張データのデータ値の補間を示す。
この例では、入力パラメトリック拡張データは、hの実質的に規則的な時間間隔(すなわち、hのホップサイズ(又はフレームサイズ)による)に対するIID値を有する。入力パラメトリック拡張データのIID値は、図2の交差によって示され、それは、時間間隔t、t及びtの入力パラメトリック拡張データの3つのIID値を具体的に示す。
本例では、出力パラメトリック拡張データが、h未満であるhの実質的に規則的な時間間隔(すなわち、hのより小さなホップサイズ(又はフレームサイズ)による)におけるIID値を有することが要求される。入力パラメトリック拡張データのIID値は、図2において丸印によって示され、具体的にはそれは、時間期間t’、t’及びt’における出力パラメトリック拡張データの3つのIID値を示す。
本実施例では、拡張データプロセッサ109は、補間によって出力IID値を生成するよう動作可能である。具体的には、図2に示されるように、出力IID値は、周囲の入力IID値の間のシンプルな線形補間によって生成される。従って、t’及びt’における出力IID値は、t及びtにおける入力IID値から生成され、t’における出力IID値は、t及びtにおける入力IID値から生成される。
線形補間の代わりに、他の形式の補間又は外挿が利用されてもよいということは理解されるであろう。
一部のパラメータ音声符号化スキームでは、追加的なパラメトリック拡張データパラメータが、一時的な位置において生成される。例えば、PSパラメトリック拡張データは、典型的には、実質的に規則的な間隔に置けるIIDデータ値と、IID信号に大きく急速な遷移が検出される際に含まれる一時的IID値を有する。
図3は、本発明の実施例によるパラメトリック拡張データのデータ値の補間を示す。図3の例は、追加的な一時的IID値が時点tにおける入力パラメトリック拡張データに含まれることを除き、図2の例に対応している。
におけるIID値に含まれる情報を維持するため、拡張データプロセッサ109は、tにおける追加的な一時的出力IID値を生成するよう動作可能である。具体的には、拡張データプロセッサ109は、tにおけるIID値を第2のパラメトリック拡張データに直接コピーする。
さらに、一時的な入力IID値が、必要に応じて補間に使用される。従って、図3に示されるように、t’における出力IID値がここで、t及びtにおける入力IID値から生成される。
線形補間は、迅速に変化するパラメータが平滑化されるように、基礎となる信号のローパスフィルタリングをもたらす。PS IIDパラメータでは、これは、減縮されたステレオ画像を生じさせることとなる。この効果を補償するため、IIDパラメータは、それらが量子化される前にフィルタリングされてもよい。
MP3(PRO)+PSビットストリームのPS拡張データが、aac(Plus)+PSビットストリームのPS拡張データに変換される具体例が、以下において説明される。これらのビットストリームのPSパラメータについて44.1kHzのサンプリング周波数における典型的なホップサイズは、それぞれ1152サンプル(MP3データの2グラニュール(granule)又は1フレーム)と1024サンプル(AACデータの1フレーム)である。
線形補間を用いたPSパラメータ変換は、図4に示されるように補間することが可能である。図4は、線形補間装置400の原理図を示す。
線形補間装置401は、9のファクタによりIIDパラメータをアップサンプリングするアップサンプラ401を有する。結果として得られる信号は、三角窓インパルス応答(triangular impulse response)を有するフィルタ403によって補間(フィルタリング)される。最終的に、信号は8のファクタのダウンサンプラ405によってダウンサンプリングされる。
図5は、図4のフィルタの周波数応答を示す。三角窓インパルス応答がローパスフィルタリングを生じさせることが明らかに確認できる。
線形補間によって生じる平滑化を補償するため、IID値x(n)が、以下のFIR(Finite Impulse Response)フィルタによってフィルタリングされるかもしれない。
Figure 2007524124
ここで、aは、好ましくは、線形フェーズインパルス応答である、すなわち、a=aK−k−1である。再量子化に必要とされる最終的なIID値は、遅延補償されてもよく、
Figure 2007524124
から計算することが可能である。
ここで、cは、z(n)の冪乗がx(n)のものと等しくなるように設定可能な冪乗補償定数である。
より高機能であって、そのためより計算量の大きな実施例では、図4に示される実際のアップ及びダウンサンプリングが実行されてもよく、非三角窓インパルス応答が、リサンプリング再構成をさらに向上させるのに使用されてもよい。
以下において、入力データ及び符号変換されたデータが非同期フレーム構成を有する実施例が説明される。具体的には、符号化データを第1符号化プロトコルから異なるフレーム長を有する第2符号化プロトコルに符号変換するトランスコーダが、説明される。この説明は、SBR拡張データによるMP3ビットストリーム(mp3PROビットストリーム)をSBR拡張データによるAACビットストリーム(aacPlusビットストリーム)に符号化する実施例に着目している。
当該実施例では、MP3符号化及びAAC符号化の帯域幅は実質的に同一であると仮定される。具体的には、トランスコーダは、入力ビットストリームからMP3符号化の帯域幅を決定し、AACエンコーダを同一の帯域幅を有するよう設定するかもしれない。
SBR拡張データのノイズフロアデータ値及びエンベロープは、それらがフレーム内で発生する時点及び頻度に関する制約を有する。SBRデコーダは、典型的には、コア音声フレーム毎にいくつかのサブバンドサンプルを生じさせるサブバンド解析を実行する(例えば、mp3PROについてN=18、aacPlusについてN=32など)。タイムクリティカル信号を処理するため、フレームの第1エンベロープのスタートボーダと最後のエンベロープのストップボーダは、それぞれ[0,6](スタートボーダ第1エンベロープ)と[N−1,N−1+6](ストップボーダ最終エンベロープ)との間で変化する。この結果、Nが入力符号化プロトコルと出力符号化プロトコルについて異なる場合、エンベロープ又はノイズフロアデータ値を入力ビットストリームから符号変換されたビットストリームに単にコピーすることが常に可能とは限らない。
図6は、mp3PRO入力ストリームとaacPlus符号変換されたデータストリームとの間のエンベロープデータ値のための一例となる時間整列を示す。この例では、mp3PROフレーム1、2及び3からのエンベロープデータ値は、aacPlusビットストリームの対応するフレームに直接コピーすることが可能であるということが確認できる。しかしながら、MP3PROフレーム4のエンベロープデータ値については、いくつかのデータはaacPlusビットストリームの1つのフレームに関連し、他のデータはaacPlusビットストリームの異なるフレームに関連する。図6は、エンベロープデータを具体的に示しているが、本原理はノイズフロア値を含む他のデータ値に適用されることは理解されるであろう。
エンベロープ及びノイズフロアデータは、aacPlusビットストリームの制約に違反しない限り、単にコピーすることが可能である。しかしながら、このようなコピーが可能でない場合、エンベロープ及びノイズフロアデータ値(の一部)は、1つのエンベロープ及びノイズフロアデータ値に合成される必要がある。
図7は、入力データストリームのエンベロープデータ値のタイミングの一例を示す。具体的には、図7は、MP3PROビットストリームの2つのエンベロープデータ値を示す。第1エンベロープデータ値Eは、tからtまでの時間期間をカバーし、第2エンベロープデータ値Eは、tからtまでの時間期間をカバーする。各エンベロープデータ値E及びEは、各々が当該具体例において、特定の周波数帯のスケールファクタであるいくつかのサブ値E1,1,E1,2,E1,3,E1,4,E2,1,E2,2,E2,3,E2,4を有する。従って、サブ値の個数は当該フレームの周波数解像度に依存する。
図7の例では、AACPlus符号変換されたデータストリームは、MP3PROデータストリームの2つの時間期間と重複する時間期間t’−t’におけるフレームを有する。従って、新しいエンベロープデータ値が、時間期間t’−t’について生成される必要があり、具体的には、拡張データプロセッサ109は、エンベロープデータ値EとEのスケールファクタの間の補間
Figure 2007524124
によって決定されるスケールファクタを有するエンベロープデータ値を生成するようにしてもよい。
同様の式が、その他のスケールファクタ値E1,2’、E1,3’及びE1,4’を生成するのに適用されてもよい。
SBRでは、エンベロープデータ値について2つの可能な周波数解像度が存在する(ノイズフロアは、1つの可能な周波数解像度しか有しない)。従って、異なる周波数解像度によるエンベロープ(の一部)が合成される必要があるということが発生する可能性がある。この場合、拡張データプロセッサ109は、好ましくは、最も高い周波数解像度に従ってエンベロープデータ値を生成する。これは、図8に示される例により示される。
図8は、MP3PROビットストリームの2つのエンベロープデータ値EとEを示す。この例は、第2エンベロープデータ値Eが2つのサブ値E2,1とE2,2のみを有するということを除いて、図7のものと同一である。AACPlus符号変換データストリームの時間期間t’−t’のエンベロープデータ値は、例えば、
Figure 2007524124
に従う補間によって決定されてもよい。
同様の式が、その他のスケールファクタ値E1,2’、E1,3’及びE1,4’を生成するのに適用されてもよい。
任意の適切な拡張データが使用可能であるということは理解されるであろう。例えば、パラメトリック拡張データは、空間音声符号化データであってもよい。例えば、ステレオ画像データを含むだけでなく、マルチチャネル画像がパラメータ化され、拡張データに含まれてもよい。そのような実施例によると、ステレオ符号化信号は、後方互換的コンポーネントとして含まれてもよく、パラメトリック拡張データは、これらをマルチチャネル表現に変換可能なデータを含むものであってもよい(例えば、2〜5チャネルなど)。もちろん、1〜5チャネル、2〜4チャネルなどの他のシナリオも可能である。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらの何れかの組み合わせを含む任意の適切な形式により実現可能である。しかしながら、好ましくは、本発明は、1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして実現される。本発明の実施例の要素及びコンポーネントは、何れか適切な方法により物理的、機能的及び論理的に実現されてもよい。実際、当該機能は、単独のユニット、複数のユニット又は他の機能ユニットの一部として実現されてもよい。また、本発明は、単独のユニットにより実現されてもよいし、又は異なるユニット及びプロセッサ間に物理的かつ機能的に分散されていてもよい。
本発明が好適な実施例について説明されたが、それは、ここで与えられた特定の形式に限定されることを意図したものではない。本発明の範囲は、添付した請求項によってのみ限定される。請求項では、「有する」という用語は、他の要素又はステップの存在を排除するものではない。さらに、個別に列挙されるが、複数の手段、要素又は方法ステップが、単独のユニット又はプロセッサなどによって実現されてもよい。さらに、各特徴が異なる請求項に含まれるかもしれないが、これらはおそらく効果的に組み合わされるかもしれず、異なる請求項に含まれることは、各特徴の組み合わせが実現可能及び/又は効果的ではないことを意味するものではない。さらに、単数形による言及は、複数であることを排除するものではない。従って、「ある」、「第1の」、「第2の」などの表現は複数を排除するものではない。
図1は、本発明の実施例によるトランスコーダのブロック図を示す。 図2は、本発明の実施例によるパラメトリック拡張データのデータ値の補間を示す。 図3は、本発明の実施例によるパラメトリック拡張データのデータ値の補間を示す。 図4は、本発明の実施例による線形補間の原理図を示す。 図5は、本発明の実施例による線形補間装置のフィルタの周波数応答を示す。 図6は、mp3PRO入力ストリームとaacPlus符号変換データストリームとの間の一例となる時間整列を示す。 図7は、入力データストリームのエンベロープデータ値のタイミングの一例を示す。 図8は、入力データストリームのエンベロープデータ値のタイミングの他の例を示す。

Claims (20)

  1. 符号化信号を表し、第1パラメトリック拡張データを有する入力データを受信する手段と、
    前記第1パラメトリック拡張データから第2パラメトリック拡張データを決定する手段と、
    前記第2パラメトリック拡張データを有する符号変換データを生成する手段と、
    を有することを特徴とするトランスコーダ。
  2. 請求項1記載のトランスコーダであって、
    前記入力データはさらに、前記符号化信号に関する第1符号化データを有し、
    当該トランスコーダはさらに、第2符号化データを生成するため前記第1符号化データを符号変換する手段を有し、
    前記生成する手段は、前記第2符号化データと前記第2パラメトリック拡張データとを組み合わせることによって、前記符号変換データを生成するよう動作可能である、
    ことを特徴とするトランスコーダ。
  3. 請求項1記載のトランスコーダであって、
    前記決定する手段は、前記第1パラメトリック拡張データの少なくともいくつかのデータ値をコピーすることによって、前記第2パラメトリックデータの少なくとも一部を決定するよう動作可能であることを特徴とするトランスコーダ。
  4. 請求項1記載のトランスコーダであって、
    前記決定する手段は、前記第2パラメトリック拡張データのデータ値を量子化する手段を有することを特徴とするトランスコーダ。
  5. 請求項1記載のトランスコーダであって、
    前記決定する手段は、前記第2パラメトリック拡張データのデータ値を符号化する手段を有することを特徴とするトランスコーダ。
  6. 請求項1記載のトランスコーダであって、
    前記決定する手段は、前記第1パラメトリック拡張データのパラメトリック拡張データ値の間の補間によって、前記第2パラメトリックデータの少なくとも一部を決定するよう動作可能であることを特徴とするトランスコーダ。
  7. 請求項1記載のトランスコーダであって、
    前記決定する手段は、前記第1パラメトリック拡張データの一時的データを特定し、前記一時的データに応答して、前記第2パラメトリック拡張データを生成する手段を有することを特徴とするトランスコーダ。
  8. 請求項7記載のトランスコーダであって、
    前記決定する手段は、少なくとも1つの一時的データパラメータを前記第2パラメトリック拡張データに含めるよう動作可能であることを特徴とするトランスコーダ。
  9. 請求項1記載のトランスコーダであって、
    前記決定する手段は、前記第2パラメトリック拡張データを決定する前に、前記第1パラメトリック拡張データをフィルタリングする手段を有することを特徴とするトランスコーダ。
  10. 請求項1記載のトランスコーダであって、
    前記入力データ及び符号変換データは、非同期フレーム構成を有し、
    前記第2パラメトリック拡張データを決定する手段は、前記第1パラメトリック拡張データの第1フレームの第1データ値及び前記第1パラメトリック拡張データの第2フレームの第2データ値に応答して、前記符号変換データのフレームに関する少なくとも1つのデータ値を決定するよう動作可能である、
    ことを特徴とするトランスコーダ。
  11. 請求項10記載のトランスコーダであって、
    前記決定する手段は、少なくとも前記第1データ値と前記第2データ値との間の補間によって、前記少なくとも1つのデータ値を決定するよう動作可能であることを特徴とするトランスコーダ。
  12. 請求項10記載のトランスコーダであって、
    前記第1データ値は、複数の第1周波数サブバンドに関する複数のサブ値を有し、
    前記第2データ値は、複数の第2周波数サブバンドに関する複数のサブ値を有し、
    前記決定する手段は、複数の第3周波数サブバンドに関する複数のサブ値を有するよう前記少なくとも1つのデータ値を決定するよう動作可能である、
    ことを特徴とするトランスコーダ。
  13. 請求項12記載のトランスコーダであって、
    前記複数の第1、第2及び第3サブバンドは、同数の周波数サブバンドを有することを特徴とするトランスコーダ。
  14. 請求項12記載のトランスコーダであって、
    前記複数の第1サブバンドは、前記複数の第2サブバンドより多くの周波数サブバンドを有し、
    前記複数の第3サブバンドは、前記複数の第1サブ何度と同数の周波数サブバンドを有する、
    ことを特徴とするトランスコーダ。
  15. 請求項1記載のトランスコーダであって、
    前記第2パラメトリック拡張データは、SBR(Spectral Band Replication)パラメトリック拡張データであることを特徴とするトランスコーダ。
  16. 請求項1記載のトランスコーダであって、
    前記第2パラメトリック拡張データは、PS(Parametric Stereo)パラメトリック拡張データであることを特徴とするトランスコーダ。
  17. 請求項1記載のトランスコーダであって、
    前記符号化信号は、音声信号であることを特徴とするトランスコーダ。
  18. 符号化信号を表し、第1パラメトリック拡張データを有する入力データを受信するステップと、
    前記第1パラメトリック拡張データから第2パラメトリック拡張データを決定するステップと、
    前記第2パラメトリック拡張データを有する符号変換データを生成するステップと、
    を有することを特徴とする符号変換方法。
  19. 請求項18記載の方法の実行を可能にするコンピュータプログラム。
  20. 請求項19記載のコンピュータプログラムを有する記録キャリア。
JP2006552729A 2004-02-16 2005-01-31 トランスコーダ及びそのための符号変換方法 Pending JP2007524124A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04100607 2004-02-16
PCT/IB2005/050394 WO2005078707A1 (en) 2004-02-16 2005-01-31 A transcoder and method of transcoding therefore

Publications (1)

Publication Number Publication Date
JP2007524124A true JP2007524124A (ja) 2007-08-23

Family

ID=34854699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006552729A Pending JP2007524124A (ja) 2004-02-16 2005-01-31 トランスコーダ及びそのための符号変換方法

Country Status (7)

Country Link
US (1) US20080260048A1 (ja)
EP (1) EP1719117A1 (ja)
JP (1) JP2007524124A (ja)
KR (1) KR20060132697A (ja)
CN (1) CN1918634A (ja)
TW (1) TW200531554A (ja)
WO (1) WO2005078707A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113153A (ja) * 2004-10-12 2006-04-27 Sharp Corp 1ビット信号のダウンサンプリング装置、ダウンサンプリング方法、マルチチャンネルオーディオ装置、及びマルチチャンネルオーディオ装置の音声再生方法
JP2011527448A (ja) * 2008-07-11 2011-10-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 帯域幅拡張出力データを生成するための装置および方法
JP2012507059A (ja) * 2008-10-29 2012-03-22 ドルビー インターナショナル アーベー 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
JP2012528344A (ja) * 2009-05-27 2012-11-12 ドルビー インターナショナル アーベー オーディオ信号の高周波成分を生成するシステム及び方法
US8326608B2 (en) 2009-07-31 2012-12-04 Huawei Technologies Co., Ltd. Transcoding method, apparatus, device and system
US8818539B2 (en) 2009-07-03 2014-08-26 Fujitsu Limited Audio encoding device, audio encoding method, and video transmission device
JP2017138610A (ja) * 2012-11-07 2017-08-10 ドルビー・インターナショナル・アーベー 軽減された計算量の変換器snr計算
US11100939B2 (en) 2015-12-14 2021-08-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an encoded audio signal by a mapping drived by SBR from QMF onto MCLT
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
JP2006243043A (ja) * 2005-02-28 2006-09-14 Sanyo Electric Co Ltd 高域補間装置及び再生装置
WO2007004186A2 (en) * 2005-07-06 2007-01-11 Koninklijke Philips Electronics N.V. Parametric multi-channel decoding
KR100878766B1 (ko) * 2006-01-11 2009-01-14 삼성전자주식회사 오디오 데이터 부호화 및 복호화 방법과 장치
TWI309531B (en) * 2006-01-19 2009-05-01 Realtek Semiconductor Corp Waveform generator and related method thereof
KR100923156B1 (ko) * 2006-05-02 2009-10-23 한국전자통신연구원 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
EP1855271A1 (en) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for re-encoding signals
DE602006009927D1 (de) * 2006-08-22 2009-12-03 Harman Becker Automotive Sys Verfahren und System zur Bereitstellung eines Tonsignals mit erweiterter Bandbreite
EP1903559A1 (en) * 2006-09-20 2008-03-26 Deutsche Thomson-Brandt Gmbh Method and device for transcoding audio signals
US7725311B2 (en) * 2006-09-28 2010-05-25 Ericsson Ab Method and apparatus for rate reduction of coded voice traffic
KR101149448B1 (ko) 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
TW200921643A (en) * 2007-06-27 2009-05-16 Koninkl Philips Electronics Nv A method of merging at least two input object-oriented audio parameter streams into an output object-oriented audio parameter stream
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
RU2488896C2 (ru) 2008-03-04 2013-07-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Микширование входящих информационных потоков и генерация выходящего информационного потока
AU2012202581B2 (en) * 2008-03-04 2012-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Mixing of input data streams and generation of an output data stream therefrom
RU2497204C2 (ru) * 2008-05-23 2013-10-27 Конинклейке Филипс Электроникс Н.В. Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер
PL3985666T3 (pl) 2009-01-28 2023-05-08 Dolby International Ab Ulepszona transpozycja harmonicznych
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
KR101697497B1 (ko) 2009-09-18 2017-01-18 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
US8300703B2 (en) * 2009-09-22 2012-10-30 Texas Instruments Incorporated System and method for adaptively allocating resources in a transcoder
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
US8521520B2 (en) * 2010-02-03 2013-08-27 General Electric Company Handoffs between different voice encoder systems
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US20120035940A1 (en) * 2010-08-06 2012-02-09 Samsung Electronics Co., Ltd. Audio signal processing method, encoding apparatus therefor, and decoding apparatus therefor
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
CN110223703B (zh) 2013-04-05 2023-06-02 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
US10541979B2 (en) * 2015-02-17 2020-01-21 Synopsys, Inc. Multiport content encryption engine
JP6648431B2 (ja) * 2015-07-13 2020-02-14 富士通株式会社 照合プログラム、照合方法および照合装置
AU2017249291B2 (en) 2016-04-12 2020-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
CN107742521B (zh) * 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN113689864B (zh) * 2021-10-27 2022-01-18 北京百瑞互联技术有限公司 一种音频数据处理方法、装置及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283200B2 (ja) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
US6961432B1 (en) * 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
US6526357B1 (en) * 1999-08-09 2003-02-25 Gambro, Inc. Associated parameter measuring and/or monitoring such as in the evaluation of pressure differences
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
GB0003954D0 (en) * 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113153A (ja) * 2004-10-12 2006-04-27 Sharp Corp 1ビット信号のダウンサンプリング装置、ダウンサンプリング方法、マルチチャンネルオーディオ装置、及びマルチチャンネルオーディオ装置の音声再生方法
US8612214B2 (en) 2008-07-11 2013-12-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and a method for generating bandwidth extension output data
JP2011527448A (ja) * 2008-07-11 2011-10-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 帯域幅拡張出力データを生成するための装置および方法
JP2012507059A (ja) * 2008-10-29 2012-03-22 ドルビー インターナショナル アーベー 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
US10304431B2 (en) 2009-05-27 2019-05-28 Dolby International Ab Efficient combined harmonic transposition
US9881597B2 (en) 2009-05-27 2018-01-30 Dolby International Ab Efficient combined harmonic transposition
US11935508B2 (en) 2009-05-27 2024-03-19 Dolby International Ab Efficient combined harmonic transposition
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
US8983852B2 (en) 2009-05-27 2015-03-17 Dolby International Ab Efficient combined harmonic transposition
US9190067B2 (en) 2009-05-27 2015-11-17 Dolby International Ab Efficient combined harmonic transposition
US11200874B2 (en) 2009-05-27 2021-12-14 Dolby International Ab Efficient combined harmonic transposition
US10657937B2 (en) 2009-05-27 2020-05-19 Dolby International Ab Efficient combined harmonic transposition
JP2012528344A (ja) * 2009-05-27 2012-11-12 ドルビー インターナショナル アーベー オーディオ信号の高周波成分を生成するシステム及び方法
US8818539B2 (en) 2009-07-03 2014-08-26 Fujitsu Limited Audio encoding device, audio encoding method, and video transmission device
JP2013501246A (ja) * 2009-07-31 2013-01-10 華為技術有限公司 トランスコーディングの方法、装置、機器、およびシステム
US8326608B2 (en) 2009-07-31 2012-12-04 Huawei Technologies Co., Ltd. Transcoding method, apparatus, device and system
JP2017138610A (ja) * 2012-11-07 2017-08-10 ドルビー・インターナショナル・アーベー 軽減された計算量の変換器snr計算
US11100939B2 (en) 2015-12-14 2021-08-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an encoded audio signal by a mapping drived by SBR from QMF onto MCLT
US11862184B2 (en) 2015-12-14 2024-01-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an encoded audio signal by upsampling a core audio signal to upsampled spectra with higher frequencies and spectral width

Also Published As

Publication number Publication date
TW200531554A (en) 2005-09-16
CN1918634A (zh) 2007-02-21
EP1719117A1 (en) 2006-11-08
US20080260048A1 (en) 2008-10-23
KR20060132697A (ko) 2006-12-21
WO2005078707A1 (en) 2005-08-25

Similar Documents

Publication Publication Date Title
JP2007524124A (ja) トランスコーダ及びそのための符号変換方法
JP6407928B2 (ja) オーディオ処理システム
TWI441162B (zh) 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式
JP5302980B2 (ja) 複数の入力データストリームのミキシングのための装置
JP5542306B2 (ja) オーディオ信号のスケーラブル符号化及び復号
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
US6122619A (en) Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
JP5265358B2 (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
TWI447707B (zh) 音頻訊號之處理方法及其裝置
US20070061577A1 (en) Signal encoding
JP6133408B2 (ja) 複数サブストリームをもつマルチチャネル・オーディオ信号の効率的なエンコードおよびデコード
JP5508464B2 (ja) He−aacデコーダ及びmpegサラウンドデコーダを用いてマルチチャネルオーディオ信号を復元する装置
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
JP6474845B2 (ja) 軽減された計算量の変換器snr計算
CA2690885A1 (en) Fidelity-optimised variable frame length encoding
JP2010515099A5 (ja)
JP2007528025A (ja) オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
JP2024020349A (ja) オーディオ信号の高周波再構成を行う方法及びオーディオ処理ユニット
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
JP2003099095A (ja) オーディオ符号化装置、方法、記録媒体及びプログラム
JP2003058195A (ja) 再生装置、再生システム、再生方法、記憶媒体、及びプログラム