JP6663996B2 - 符号化されたオーディオ信号を処理するための装置および方法 - Google Patents
符号化されたオーディオ信号を処理するための装置および方法 Download PDFInfo
- Publication number
- JP6663996B2 JP6663996B2 JP2018531150A JP2018531150A JP6663996B2 JP 6663996 B2 JP6663996 B2 JP 6663996B2 JP 2018531150 A JP2018531150 A JP 2018531150A JP 2018531150 A JP2018531150 A JP 2018531150A JP 6663996 B2 JP6663996 B2 JP 6663996B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- signal
- upsampled
- access unit
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 105
- 238000000034 method Methods 0.000 title claims description 41
- 238000012545 processing Methods 0.000 title claims description 17
- 238000001228 spectrum Methods 0.000 claims description 148
- 230000003595 spectral effect Effects 0.000 claims description 44
- 230000009466 transformation Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000013507 mapping Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000002087 whitening effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/69—Spread spectrum techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
・符号化されたオーディオ信号のアクセスユニットから、コア信号とパラメータセットとを生成するためのデマルチプレクサ。すなわち、デマルチプレクサは、符号化されたオーディオ信号のアクセスユニットから、コア信号と、コア信号に対応するスペクトルよりも上の欠落したスペクトルを再構成することを可能にするパラメータとを抽出する。
・アクセスユニットのコア信号をアップサンプリングし、第1のアップサンプリングされたスペクトルと時間的に連続した第2のアップサンプリングされたスペクトルを出力するアップサンプラ。第1のアップサンプリングされたスペクトルと第2のアップサンプリングされたスペクトルは両方とも、コア信号と同じコンテンツを有し、コアスペクトルの第1のスペクトル幅よりも大きい第2のスペクトル幅を有する。換言すれば、アップサンプラはコア信号をアップサンプリングし、少なくとも2つのアップサンプリングされたスペクトルを出力する。アップサンプリングされたスペクトルは時間的に連続しており、コア信号と同じ情報をカバーし、コア信号のスペクトル幅よりも大きなスペクトル幅を有する。
・アクセスユニットのパラメータセットのパラメータを変換して、変換されたパラメータを取得するためのパラメータ変換器。換言すれば、符号化されたオーディオ信号内のパラメータは、アップサンプリングされたスペクトルに適用することができるパラメータに変換される。
・変換されたパラメータを用いて、第1のアップサンプリングされたスペクトルと、第2のアップサンプリングされたスペクトルとを処理するためのスペクトル・ギャップ・フィリング・プロセッサ。換言すれば、スペクトル・ギャップ・フィリング・プロセッサは、アップサンプリングされたスペクトルと変換されたパラメータとを結合する。その結果は、実施形態に応じて、元のまたは入力された符号化されたオーディオ信号とは異なる技術により符号化されたオーディオ信号である、トランスコードされたオーディオ信号となることができ、またはその結果がオーディオ信号となることができる。
・アップサンプラは、先行するアクセスユニットのコア信号のスペクトルをゼロで満たすように構成される。
・アップサンプラは、アクセスユニットのコア信号のスペクトルをゼロで満たすように構成される。
・アップサンプラは、アクセスユニットの満たされたスペクトルおよび先行するアクセスユニットの満たされたスペクトルの逆変換を実行するように構成される。
・最後に、アップサンプラは、先行するアクセスユニットの満たされたスペクトルに対する時間領域信号と、アクセスユニットの満たされたスペクトルに対する時間領域信号とのオーバーラップ加算を実行して、中間時間信号を取得するように構成される。
・符号化されたオーディオ信号の現アクセスユニットと呼ばれ得るこのアクセスユニットから、コア信号およびパラメータセットを生成するステップ。
・アクセスユニットのコア信号をアップサンプリングし、第1のアップサンプリングされたスペクトルと時間的に連続した第2のアップサンプリングされたスペクトルを出力するステップ。第1のアップサンプリングされたスペクトルと第2のアップサンプリングされたスペクトルは両方とも、コア信号と同じコンテンツを有し、コアスペクトルの第1のスペクトル幅よりも大きい第2のスペクトル幅を有する。
・アクセスユニットのパラメータセットのパラメータを変換して、変換されたパラメータを取得するためステップ。
・変換されたパラメータを用いて、第1のアップサンプリングされたスペクトルと、第2のアップサンプリングされたスペクトルとを処理するステップ。
・SBRコピーアップコンテンツのIGF準拠のコピーアップ素材による置換。
・データ同期のための、MDCTに対するQMFの遅延補償の挿入。
・(QMFベースのエネルギー測定により)SBRによって得られたスペクトル高域包絡線のMCLT表現へのマッピング。
・基礎となるSBR時間周波数グリッドのIGF時間周波数グリッドへのマッピング。マッピング関数は、様々なタイプのウィンドウ化方式に従って適合されて、QMFエネルギーからMCLTエネルギーが導出される。
・好ましくは、あらゆるバイアスを除去し残余誤差を最小化するための、エネルギー補正係数の適用。
・好ましくは、残りのSBRサイドインフォメーション(例えば、雑音レベル、逆フィルタリングレベルとも言われる音調、他)の適切なIGFパラメータへの変換。例えば、SBRの逆フィルタリングレベルは、IGFの適切なホワイトニングレベルにマッピングされて、最適な知覚品質を提供する。
が得られる。ここで、tは変換のスタートサンプル、lはタイムスロットインデックスであり、k=0,1,...,m−1はmまでの周波数ライン、すなわちナイキスト周波数ラインである。
である。ここでスケール係数sは、
で与えられ、Bは測定されたブロックの総数である。一実施形態では、全ての外れ値を10%信頼区間にクリッピングすることによって、平均オフセット
が全てのブロックに対して存在する。
が20未満の値をとることが示された。平均オフセット
は、16と17の間にあり、ある場合には約7の値をとることが判明した。従って、平均オフセット
は7〜17の値をとる。
Claims (22)
- 符号化されたオーディオ信号(100)を処理するための装置であって、
前記符号化されたオーディオ信号(100)は、一連のアクセスユニット(100’)を含み、前記アクセスユニットの各々は、第1のスペクトル幅を有するコア信号(101)と、前記第1のスペクトル幅よりも上のスペクトルを記述するパラメータとを含み、
前記装置は、
前記符号化されたオーディオ信号(100)のアクセスユニット(100’)から、前記コア信号(101)および前記パラメータのセット(102)を生成するためのデマルチプレクサ(1)と、
前記アクセスユニット(100’)の前記コア信号(101)をアップサンプリングし、第1のアップサンプリングされたスペクトル(103)および時間的に連続した第2のアップサンプリングされたスペクトル(103’)を出力するアップサンプラ(2)であって、前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)は両方とも、前記コア信号(101)と同じコンテンツを有し、前記コア信号(101)の前記第1のスペクトル幅よりも大きい第2のスペクトル幅を有する、アップサンプラ(2)と、
前記アクセスユニット(100’)の前記パラメータセット(102)のパラメータを変換して、前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)に適用可能である変換されたパラメータ(104、104’)を取得するためのパラメータ変換器(3)と、
前記変換されたパラメータ(104)を用いて、前記第1のアップサンプリングされたスペクトル(103)と、前記第2のアップサンプリングされたスペクトル(103’)とを処理するためのスペクトル・ギャップ・フィリング・プロセッサ(4)と、を含む装置。 - 前記アップサンプラ(2)は、前記コア信号(101)のスペクトルの上側をゼロで満たし、前記コア信号(101)の前記満たされたスペクトル(110)から、前記第1のアップサンプリングされたスペクトル(103’)および前記第2のアップサンプリングされたスペクトル(103’)を導出するように構成される、請求項1に記載の装置。
- 前記アップサンプラ(2)は、前記アクセスユニット(100’)に直接先行するアクセスユニット(100’’)のコア信号を追加的に用いて、前記アクセスユニット(100’)の前記コア信号(101)をアップサンプリングするように構成される、請求項1または2に記載の装置。
- 前記アップサンプラ(2)は、時間的に連続した第1の数のアクセスユニット(100’、100’’、100’’’)のコア信号(101)を収集し、前記コア信号(101)から非整数のアップサンプリング比率で第2の数のアップサンプリングされたスペクトル(103)を処理するように構成され、前記第1の数が比率の分母であり前記第2の数が比率の分子である、請求項1〜3のいずれかに記載の装置。
- 前記パラメータ変換器(3)は、時間的に連続したタイムスロットの第1の部分を参照して、前記パラメータセット(102)のパラメータの第1のサブセットを変換し、タイムスロットの前記第1の部分に時間的に連続した前記タイムスロットの第2の部分を参照して、前記パラメータセット(102)のパラメータの第2のサブセットを変換するように構成され、
前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、前記第1のアップサンプリングされたスペクトル(103)と共に第1の変換されたパラメータのサブセット(104)を処理し、前記第2のアップサンプリングされたスペクトル(103’)と共に第2の変換されたパラメータのサブセット(104’)を処理するように構成される、請求項1〜4のいずれかに記載の装置。 - 前記変換器(3)は、前記パラメータセット(102)のエネルギー値を参照するパラメータを、前記エネルギー値を所定のスケール係数でスケーリングすることにより、前記スペクトル・ギャップ・フィリング・プロセッサ(4)によって使用可能なエネルギー値に変換するように構成される、請求項1〜5のいずれかに記載の装置。
- 前記変換器(3)は、前記アクセスユニット(100’)に関連する窓関数に関する情報を抽出するように構成され、
前記変換器(3)は前記窓関数に従って前記スケール係数を適合させるように構成される、請求項6に記載の装置。 - 前記変換器(3)は、遅延補償を挿入することによって、前記パラメータセット(102)のパラメータをシフトするように構成される、請求項1〜7のいずれかに記載の装置。
- 前記アップサンプラ(2)は、前記コア信号(101)の値を補間することによって前記コア信号(101)をアップサンプリング(20)するように構成される、請求項1〜8のいずれかに記載の装置。
- 前記アップサンプラ(2)は、先行するアクセスユニット(100’’)の前記コア信号のスペクトルの上側をゼロで満たすように構成され、
前記アップサンプラ(2)は、前記アクセスユニット(100’)の前記コア信号(101)のスペクトルの上側をゼロで満たすように構成され、
前記アップサンプラ(2)は、前記アクセスユニット(100’)の前記満たされたスペクトル、および先行する前記アクセスユニット(100’’)の前記満たされたスペクトルの逆変換(21)を実行するように構成され、
前記アップサンプラ(2)は、前記先行するアクセスユニット(100’’)の前記満たされたスペクトルに対する時間領域信号と、前記アクセスユニット(100’)の前記満たされたスペクトルに対する時間領域信号とのオーバーラップ加算を実行して、中間時間信号(111)を取得するように構成される、請求項1〜9のいずれかに記載の装置。 - 前記アップサンプラ(2)は、前記中間時間信号(111)の第1の部分を用いてフォワード変換を実行して、前記第1のアップサンプリングされたスペクトル(103)を取得するように構成され、
前記アップサンプラ(2)は、前記中間時間信号(111)の第2の部分を用いてフォワード変換を実行して、前記第2のアップサンプリングされたスペクトル(103’)を取得するように構成され、かつ
前記第1の部分は前記第2の部分とオーバーラップする、請求項10に記載の装置。 - 前記アップサンプラ(2)は、前記コア信号(101)をアップサンプリング(20)して、アップサンプリングされたコア信号(110)を取得するように構成され、
前記アップサンプラ(2)は、前記アップサンプリングされたコア信号(110)に対して逆変換(21)を実行して、時間領域信号(111)を取得するように構成され、
前記アップサンプラ(2)は、変換(22、23)を適用することにより、前記時間領域信号(111)を処理して、前記第1のアップサンプリングされたスペクトル(103)と前記時間的に連続する第2のアップサンプリングされたスペクトル(103’)とを取得するように構成され、かつ
前記逆変換(21)は前記変換の逆変換である、請求項1〜11のいずれかに記載の装置。 - 前記逆変換は逆変形離散コサイン変換であり、前記変換は変形離散コサイン変換である、請求項12に記載の装置。
- 前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、前記変換されたパラメータ(104、104’)を用いて前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)とを復号化して、時間領域出力信号(300)を取得するように構成される、請求項1〜13のいずれかに記載の装置。
- 前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、前記変換されたパラメータの第1の部分(104)を前記第1のアップサンプリングされたスペクトル(103)に適用して第1の処理されたスペクトルを取得し、前記変換されたパラメータの第2の部分(104’)を前記第2のアップサンプリングされたスペクトル(103’)に適用して第2の処理されたスペクトルを取得するように構成される、請求項14に記載の装置。
- 前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、前記第1の処理されたスペクトルと前記第2の処理されたスペクトルとを時間領域に変換するためのスペクトル変換器(7)を含むように構成され、
前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、少なくとも2つの出力時間信号をオーバーラップ加算してオーディオ信号(300)を取得するように構成されたオーディオ加算器(9)を含むように構成される、請求項15に記載の装置。 - 前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、第1のアクセスユニットおよび第2のアクセスユニットを有する、スペクトル・ギャップ・フィリングにより符号化された信号を生成するように構成され、前記第1のアクセスユニットは、前記第1のアップサンプリングされたスペクトルの変換されたバージョンおよび前記変換されたパラメータの第1の部分を含み、前記第2のアクセスユニットは、前記第2のアップサンプリングされたスペクトルの変換されたバージョンおよび前記変換されたパラメータの第2の部分を含む、請求項1〜16のいずれかに記載の装置。
- 前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、第1のアクセスユニットおよび第2のアクセスユニットを有する出力データストリームを生成するように構成され、請求項1〜13のいずれかに記載の装置。
- 前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、前記変換されたパラメータ(104、104’)を用いて、前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)とを処理して、2つのトランスコードされたアクセスユニットを取得するように構成され、
前記スペクトル・ギャップ・フィリング・プロセッサ(4)は、前記2つのトランスコードされたアクセスユニットを加算(5)して、トランスコードされたオーディオ信号(200)を取得するように構成される、請求項1〜18のいずれかに記載の装置。 - 前記トランスコードされたオーディオ信号(200)はIGF符号化されたオーディオ信号(200)である、請求項19に記載の装置。
- 前記符号化されたオーディオ信号(100)はSBR符号化されたオーディオ信号(100)である、請求項1〜20のいずれかに記載の装置。
- 符号化されたオーディオ信号(100)を処理する方法であって、
前記符号化されたオーディオ信号(100)は、一連のアクセスユニット(100’)を含み、前記アクセスユニットの各々は、第1のスペクトル幅を有するコア信号と、前記第1のスペクトル幅よりも上のスペクトルを記述するパラメータとを含み、
前記方法は、
前記符号化されたオーディオ信号(100)のアクセスユニット(100’)から、前記コア信号(101)および前記パラメータのセット(102)を生成することと、
前記アクセスユニット(100’)の前記コア信号(101)をアップサンプリングし、第1のアップサンプリングされたスペクトル(103)および時間的に連続した第2のアップサンプリングされたスペクトル(103’)を出力することであって、前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)は両方とも、前記コア信号(101)と同じコンテンツを有し、前記コア信号(101)の前記第1のスペクトル幅よりも大きい第2のスペクトル幅を有する、ことと、
前記アクセスユニット(100’)の前記パラメータセット(102)のパラメータを変換して、前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)に適用可能である変換されたパラメータ(104)を取得することと、
前記変換されたパラメータ(104)を用いて、前記第1のアップサンプリングされたスペクトル(103)と前記第2のアップサンプリングされたスペクトル(103’)とを処理することと、を含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15199851.5A EP3182411A1 (en) | 2015-12-14 | 2015-12-14 | Apparatus and method for processing an encoded audio signal |
EP15199851.5 | 2015-12-14 | ||
PCT/EP2016/080331 WO2017102560A1 (en) | 2015-12-14 | 2016-12-08 | Apparatus and method for processing an encoded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019502948A JP2019502948A (ja) | 2019-01-31 |
JP6663996B2 true JP6663996B2 (ja) | 2020-03-13 |
Family
ID=55024778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531150A Active JP6663996B2 (ja) | 2015-12-14 | 2016-12-08 | 符号化されたオーディオ信号を処理するための装置および方法 |
Country Status (17)
Country | Link |
---|---|
US (2) | US11100939B2 (ja) |
EP (2) | EP3182411A1 (ja) |
JP (1) | JP6663996B2 (ja) |
KR (2) | KR20180095863A (ja) |
CN (1) | CN108701467B (ja) |
AR (1) | AR106970A1 (ja) |
AU (1) | AU2016373990B2 (ja) |
BR (1) | BR112018012007B1 (ja) |
CA (1) | CA3008388C (ja) |
ES (1) | ES2960963T3 (ja) |
MX (1) | MX2018007197A (ja) |
MY (1) | MY191239A (ja) |
RU (1) | RU2687872C1 (ja) |
SG (1) | SG11201805008YA (ja) |
TW (1) | TWI625722B (ja) |
WO (1) | WO2017102560A1 (ja) |
ZA (1) | ZA201804512B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10418957B1 (en) * | 2018-06-29 | 2019-09-17 | Amazon Technologies, Inc. | Audio event detection |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CA2236649A1 (en) * | 1998-05-05 | 1999-11-05 | Tet Hin Yeap | Method and apparatus for encoding of digital signals for transmission and/or storage, and decoding such encoded signals following such transmission and/or storage |
US6778953B1 (en) | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US7206359B2 (en) * | 2002-03-29 | 2007-04-17 | Scientific Research Corporation | System and method for orthogonally multiplexed signal transmission and reception |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
US7486719B2 (en) * | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
US20080260048A1 (en) * | 2004-02-16 | 2008-10-23 | Koninklijke Philips Electronics, N.V. | Transcoder and Method of Transcoding Therefore |
FR2875351A1 (fr) * | 2004-09-16 | 2006-03-17 | France Telecom | Procede de traitement de donnees par passage entre domaines differents de sous-bandes |
ES2705589T3 (es) * | 2005-04-22 | 2019-03-26 | Qualcomm Inc | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia |
EP1926083A4 (en) * | 2005-09-30 | 2011-01-26 | Panasonic Corp | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
HUE047607T2 (hu) * | 2007-08-27 | 2020-05-28 | Ericsson Telefon Ab L M | Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
MX2010009307A (es) * | 2008-03-14 | 2010-09-24 | Panasonic Corp | Dispositivo de codificacion, dispositivo de decodificacion y metodo de los mismos. |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8463603B2 (en) * | 2008-09-06 | 2013-06-11 | Huawei Technologies Co., Ltd. | Spectral envelope coding of energy attack signal |
MX2011003824A (es) * | 2008-10-08 | 2011-05-02 | Fraunhofer Ges Forschung | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. |
PL4231295T3 (pl) | 2008-12-15 | 2024-05-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania powiększania szerokości pasma audio oraz program komputerowy |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
US8515768B2 (en) | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
CA2780971A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget L M Ericsson (Publ) | Improved excitation signal bandwidth extension |
CA2792452C (en) * | 2010-03-09 | 2018-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an input audio signal using cascaded filterbanks |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
SG189277A1 (en) * | 2010-10-06 | 2013-05-31 | Fraunhofer Ges Forschung | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) |
EP2777042B1 (en) * | 2011-11-11 | 2019-08-14 | Dolby International AB | Upsampling using oversampled sbr |
CN104025166B (zh) * | 2011-12-28 | 2016-10-12 | 三菱电机株式会社 | 中心侧系统及车辆侧系统 |
CN103366750B (zh) * | 2012-03-28 | 2015-10-21 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
EP2950308B1 (en) * | 2013-01-22 | 2020-02-19 | Panasonic Corporation | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method |
SG11201506543WA (en) | 2013-02-20 | 2015-09-29 | Fraunhofer Ges Forschung | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
US9489959B2 (en) * | 2013-06-11 | 2016-11-08 | Panasonic Intellectual Property Corporation Of America | Device and method for bandwidth extension for audio signals |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830056A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
-
2015
- 2015-12-14 EP EP15199851.5A patent/EP3182411A1/en not_active Withdrawn
-
2016
- 2016-12-08 CA CA3008388A patent/CA3008388C/en active Active
- 2016-12-08 CN CN201680081799.9A patent/CN108701467B/zh active Active
- 2016-12-08 EP EP16809784.8A patent/EP3391373B1/en active Active
- 2016-12-08 KR KR1020187020092A patent/KR20180095863A/ko active Application Filing
- 2016-12-08 JP JP2018531150A patent/JP6663996B2/ja active Active
- 2016-12-08 MX MX2018007197A patent/MX2018007197A/es unknown
- 2016-12-08 KR KR1020217013427A patent/KR102625047B1/ko active IP Right Grant
- 2016-12-08 AU AU2016373990A patent/AU2016373990B2/en active Active
- 2016-12-08 ES ES16809784T patent/ES2960963T3/es active Active
- 2016-12-08 BR BR112018012007-3A patent/BR112018012007B1/pt active IP Right Grant
- 2016-12-08 MY MYPI2018000895A patent/MY191239A/en unknown
- 2016-12-08 WO PCT/EP2016/080331 patent/WO2017102560A1/en active Application Filing
- 2016-12-08 RU RU2018125879A patent/RU2687872C1/ru active
- 2016-12-08 SG SG11201805008YA patent/SG11201805008YA/en unknown
- 2016-12-09 TW TW105140923A patent/TWI625722B/zh active
- 2016-12-13 AR ARP160103811A patent/AR106970A1/es active IP Right Grant
-
2018
- 2018-06-14 US US16/008,323 patent/US11100939B2/en active Active
- 2018-07-06 ZA ZA2018/04512A patent/ZA201804512B/en unknown
-
2021
- 2021-08-19 US US17/407,008 patent/US11862184B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CA3008388A1 (en) | 2017-06-22 |
CA3008388C (en) | 2020-09-08 |
US20210383818A1 (en) | 2021-12-09 |
MY191239A (en) | 2022-06-10 |
BR112018012007B1 (pt) | 2023-12-05 |
JP2019502948A (ja) | 2019-01-31 |
AU2016373990A1 (en) | 2018-07-05 |
EP3182411A1 (en) | 2017-06-21 |
EP3391373C0 (en) | 2023-09-27 |
AR106970A1 (es) | 2018-03-07 |
CN108701467B (zh) | 2023-12-08 |
EP3391373A1 (en) | 2018-10-24 |
SG11201805008YA (en) | 2018-07-30 |
MX2018007197A (es) | 2018-11-09 |
US11862184B2 (en) | 2024-01-02 |
RU2687872C1 (ru) | 2019-05-16 |
EP3391373B1 (en) | 2023-09-27 |
KR102625047B1 (ko) | 2024-01-16 |
CN108701467A (zh) | 2018-10-23 |
ZA201804512B (en) | 2019-05-29 |
ES2960963T3 (es) | 2024-03-07 |
BR112018012007A2 (pt) | 2018-12-04 |
KR20210054052A (ko) | 2021-05-12 |
TW201730876A (zh) | 2017-09-01 |
US11100939B2 (en) | 2021-08-24 |
TWI625722B (zh) | 2018-06-01 |
US20180293994A1 (en) | 2018-10-11 |
KR20180095863A (ko) | 2018-08-28 |
WO2017102560A1 (en) | 2017-06-22 |
AU2016373990B2 (en) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7271616B2 (ja) | 高調波転換 | |
US9236061B2 (en) | Harmonic transposition in an audio coding method and system | |
KR102649124B1 (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
US11562755B2 (en) | Harmonic transposition in an audio coding method and system | |
US11862184B2 (en) | Apparatus and method for processing an encoded audio signal by upsampling a core audio signal to upsampled spectra with higher frequencies and spectral width | |
AU2021204779B2 (en) | Improved Harmonic Transposition | |
AU2023282303B2 (en) | Improved Harmonic Transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180802 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6663996 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |