JP2014513819A - パラメトリックオーディオコーディング方式の鑑識検出 - Google Patents
パラメトリックオーディオコーディング方式の鑑識検出 Download PDFInfo
- Publication number
- JP2014513819A JP2014513819A JP2014511380A JP2014511380A JP2014513819A JP 2014513819 A JP2014513819 A JP 2014513819A JP 2014511380 A JP2014511380 A JP 2014511380A JP 2014511380 A JP2014511380 A JP 2014511380A JP 2014513819 A JP2014513819 A JP 2014513819A
- Authority
- JP
- Japan
- Prior art keywords
- subband
- frequency
- correlation
- signals
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 143
- 238000000034 method Methods 0.000 claims abstract description 122
- 239000011159 matrix material Substances 0.000 claims description 96
- 239000013598 vector Substances 0.000 claims description 70
- 239000000203 mixture Substances 0.000 claims description 27
- 230000008878 coupling Effects 0.000 claims description 25
- 238000010168 coupling process Methods 0.000 claims description 25
- 238000005859 coupling reaction Methods 0.000 claims description 25
- 238000001228 spectrum Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 230000005484 gravity Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000010355 oscillation Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 37
- 238000004458 analytical method Methods 0.000 description 68
- 230000003595 spectral effect Effects 0.000 description 34
- 230000000875 corresponding effect Effects 0.000 description 24
- 230000006870 function Effects 0.000 description 16
- 230000010076 replication Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000013459 approach Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013179 statistical model Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000010183 spectrum analysis Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
[関連出願との相互参照]
この出願は、2011年5月19日に出願された米国仮特許出願第61/488,122号の優先権を主張するものである。この文献はここにその全体を参照援用する。
留意点として、DD+で用いられる帯域幅拡張の基本原理はMPEG SBRに似ている。その結果、MPEG SBR符号化オーディオ信号のコンテキストで本文献で概説する分析手法は、以前DD+符号化されたオーディオ信号にも等しく適用可能である。すなわち、分析方法をHE−AACのコンテキストで概説するが、この方法はその他のDD+などの帯域幅拡張ベースの符号化器にも適用できる。
− (例えば、選択性が高いフィルタ302を用いて)QMFドメインの位相のみベースの自己類似性マトリックス410を比較するステップ;
− 主対角線に平行なすべてのラインが垂直ラインにより表されるように、類似性マトリックス410をチルト(tilt)する;結果として、x軸が、対応するターゲットQMF帯域を決定するためにソースQMF帯域(y軸)に適用される(複数のサブバンドとして)周波数シフトに対応する;
− パッチ同士の類似性を示すラインを削除するステップ;これはソース帯域のレンジに関する知識を用いることにより達成できる;
−オーディオ帯域幅の外側のラインを削除する;これは例えばパワースペクトル分析を用いて、オーディオ信号の帯域幅を決定することにより達成できる;
−主対角線(すなわち、自己相関)を削除する;類似性マトリックス410をチルトした後、主対角線はx=0における垂直ラインに、すなわち周波数シフトがないことに対応する。
−水平方向の一または複数の極大を検出し、チルトされたマトリックス内の他の相関値をすべてゼロに設定する;
−すべての相関値を(適応的)閾値より低いゼロに設定する;
−垂直ライン(すなわち、相関値が閾値より大きく、1帯域より長い)を検出する。
−(復号された)オーディオ信号の両チャンネルの複素64帯域QMF分析を行うステップ;
−各QMFビンの左右位相角差を計算するステップ;
言い換えると、QMFビン中の複素サンプルの位相を評価するステップ;
具体的には、左右チャンネルの対応するサンプルの位相差を決定する;
−すべてのQMFフレームにわたる平均位相角差を決定するステップ;
異なる符号化をされた信号の平均位相角差例1000を図10aに示した;
−PSは高周波で特徴的な周期的構造1001を示す;
例えば、ピークフィルタリングとえネルぎー計算により、この特徴的構造を検出できる。
−(復号された)オーディオ信号の両チャンネルの複素64帯域QMF分析を行うステップ;
−各QMFビンの左右位相角差を計算するステップ;
−QMFビンごとに位相角差が小さいサンプルの数を計算する、すなわち各QMF帯域について位相角差が所定閾値未満(一般的には、位相角差<π/100)のサンプルを計算するステップ;
異なる符号化をした信号の位相角差1010が小さいサブバンドサンプルの割合/パーセンテージ1010を図10bに示した;
−図10bのグラフ1011に示したように、QMF帯域に沿った大きな増加はカップリングの利用を示す。
入力された広帯域スペクトルベクトル(u)を2つの部分u=[ux uhi]に分割する。uxは帯域スペクトルベクトルに対応し、uhiは、帯域幅複製方法により生成されたまたはされていないオーディオ信号のスペクトルの高周波部分に対応する。
Claims (38)
- オーディオ信号のコーディング履歴における周波数拡張コーディングを検出する方法であって、
低周波サブバンドと高周波サブバンドを含む対応する複数のサブバンドの複数のサブバンド信号を提供するステップであって、
前記複数のサブバンド信号は前記オーディオ信号の時間/周波数ドメイン表現に対応するステップと、
前記低周波サブバンドのサブバンド信号と前記高周波サブバンドのサブバンド信号との間の関係度を決定するステップであって、
前記関係度は前記複数のサブバンド信号に基づき決まるステップと、
前記関係度が関係閾値より大きいとき、周波数拡張コーディング履歴を決定するステップとを有する、方法。 - 前記複数のサブバンド信号は、
複素値擬似二次ミラーフィルタバンク、
修正離散余弦変換、
修正離散正弦変換、
離散フーリエ変換、
変調重複変換、
複素変調重複変換、または
高速フーリエ変換、のうちの一を用いて生成される、
請求項1に記載の方法。 - 前記複数のサブバンド信号は複数のフィルタを含むフィルタバンクを用いて生成され、各フィルタはその停止帯域内にある周波数所定のロールオフ閾値を越えるロールオフを有する、
請求項1または2に記載の方法。 - 前記複数のフィルタは、M個のフィルタ係数を有し、Mは検出すべき前記周波数拡張コーディングにより用いられたフィルタ係数の数より大きい、
請求項3に記載の方法。 - 前記オーディオ信号は複数のオーディオチャンネルを有し、
前記方法は、前記複数のオーディオチャンネルをダウンミックスして、ダウンミックスされた時間ドメインオーディオ信号を決定するステップを有し、
前記複数のサブバンド信号は前記ダウンミックスされた時間ドメインオーディオ信号から生成される、
請求項1ないし4いずれか一項に記載の方法。 - 前記オーディオ信号の最大周波数を決定するステップをさらに有し、
前記複数のサブバンド信号は前記最大周波数のまたはそれ未満の周波数のみを含む、
請求項1ないし5いずれか一項に記載の方法。 - 最大周波数を決定するステップは、
前記周波数ドメインのオーディオ信号のパワースペクトルを分析するステップと、
最大周波数より高いすべての周波数において前記パワースペクトルがパワー閾値未満であるように、前記最大周波数を決定するステップとを有する、
請求項6に記載の方法。 - 前記複数のサブバンド信号は、複数の位相信号とそれに対応する複数の強さ信号を含む複数の複素サブバンド信号であり、
前記関係度は、前記複数の強さ信号ではなく、前記複数の位相信号に基づき決定される、
請求項1ないし7いずれか一項に記載の方法。 - 関係度を決定するステップは、前記低周波サブバンドの一群のサブバンド信号から生成された高周波サブバンドの一群のサブバンドを決定するステップを有する、
請求項1ないし8いずれか一項に記載の方法。 - 関係度を決定するステップは、前記複数のサブバンド信号間の一組の相互相関値を決定するステップを有する、
請求項1ないし9いずれか一項に記載の方法。 - 第1と第2のサブバンド信号間の相関値を決定するステップは、ゼロ時間遅れにおける第1と第2のサブバンド信号の対応するサンプルの積の時間的平均を決定するステップを有する、
請求項10に記載の方法。 - 前記複数のサブバンド信号はK個のサブバンド信号を有し、
前記一組の相互相関値は、前記複数のサブバンド信号の異なるサブバンド信号のすべての組合せに対応する(K−1)!個の相互相関値を含む、
請求項10または11に記載の方法。 - 周波数拡張コーディング履歴を決定するステップは、前記一組の相互相関値から少なくとも一の最大相互相関値を決定するステップを有する、
請求項10ないし12いずれか一項に記載の方法。 - 前記一組の相互相関値は、主対角線が任意の値、例えばゼロまたは前記複数のサブバンド信号の自己相関値に対応する値を有する対称K×K相関マトリックスで構成される、
請求項12または13に記載の方法。 - 前記相関マトリックスの相互相関値が極大になる一または複数の対角線を強調するため、前記相関マトリックスにラインエンハンスメントを適用するステップをさらに有する、
請求項14に記載の方法。 - 周波数拡張コーディング履歴を決定するステップは、前記主対角線を除く、前記エンハンスされた相関マトリックスのうち少なくとも一の最大相互相関値が前記関係閾値を越えると決定するステップを有する、
請求項16に記載の方法。 - 前記相関マトリックスを分析して、相互相関値が極大になる一または複数の対角線を検出するステップをさらに有し、
相互相関値が極大になる対角線は前記相関マトリックスの主対角線上にはなく、
相互相関値が極大になる対角線は二以上の極大相互相関値を有し、
前記二以上の極大相互相関値の各々は最小相関閾値より大きく、
前記二以上の極大相互相関は、前記相関マトリックスの主対角線に平行な対角線状にあり、
前記相関マトリックスの行の前記二以上の極大相互相関値の各々について、同じ行かつすぐ隣接する左側の列の相互相関値は前記最小相関閾値以下であり、及び/または同じ行かつすぐ隣する右側の列の相互相関値は前記最小相関閾値以下である、
請求項14ないし17いずれか一項に記載の方法。 - 前記主対角線の上または下に相互相関値が極大になる三以上の対角線を検出し、
前記相関マトリックスの行はソースサブバンドを示し、前記相関マトリックスの列はターゲットサブバンドを示し、
前記方法は、さらに、
前記相関マトリックスの同じソースサブバンドの極大相互相関値を有する少なくとも2つの冗長な対角線を検出するステップと、
最低のターゲットサブバンドを有する少なくとも2つの冗長な対角線を、複数のソースサブバンドから複数のターゲットサブバンドへのコピーアップパッチとして特定するステップとを有する、
請求項18に記載の方法。 - 検出された対角線の始め及び/または終わりの前記検出された対角線の極大相互相関値がぼやけ閾値より小さいことを検出するステップと、
前記変換ステップのパラメータを、複数の周波数拡張コーディング方式に用いた変換ステップのパラメータと比較するステップと、
前記比較するステップに基づき、前記オーディオ信号に適用された前記複数の周波数拡張コーディング方式のうち周波数拡張コーディング方式を決定するステップとを有する、
請求項18または19に記載の方法。 - 前記一組の相互相関値のうち最大相互相関値が復号モード閾値より低いか高いか判断するステップであって、それにより前記オーディオ信号に適用された周波数拡張コーディング方式の復号モードを検出するステップをさらに有する、
請求項10ないし20いずれか一項に記載の方法。 - 前記オーディオ信号は第1と第2のチャンネルを有するマルチチャンネル信号であり、
前記方法は、さらに、
前記第1と第2のチャンネルを周波数ドメインに変換して、それにより複数の第1のサブバンド信号と複数の第2のサブバンド信号を生成するステップであって、
前記第1と第2のサブバンド信号は複素値であり、第1と第2の位相信号を含むステップと、
複数の位相差サブバンド信号を、対応する第1と第2のサブバンド信号の差として決定するステップとを有する、
請求項1ないし21いずれか一項に記載の方法。 - 複数の位相差値を決定するステップであって、各位相差値は前記対応する位相差サブバンド信号のサンプルの時間的平均として決定するステップと、
前記複数の位相差値の周期構造を検出し、それにより前記オーディオ信号のコーディング履歴中のパラメトリックステレオ符号化を検出するステップとを有する、
請求項22に記載の方法。 - 前記周期構造は正と負の位相差値の間の隣接サブバンドの位相差値の振動を含み、
前記振動する位相差値の強さは振動閾値より大きい、
請求項23に記載の方法。 - 各位相差サブバンド信号について、サンプルの一部が位相差閾値より小さい位相差を有すると判断するステップと、
前記一部が前記高周波サブバンドのうちのサブバンドの一部閾値を越えることを検出し、それにより前記オーディオ信号のコーディング履歴中の前記第1と第2のチャンネルのカップリングを検出するステップとを有する、
請求項22ないし24いずれか一項に記載の方法。 - 前記関係度を決定するステップは、
周波数拡張コーディング履歴を有するトレーニングオーディオ信号から求めた一組のトレーニングベクトルから決定した確率モデルを設ける段階であって、
前記確率モデルは前記複数の高周波サブバンドと前記低周波サブバンドにより張られたベクトル空間のベクトル間の確率的関係を記述するステップと、
前記低周波サブバンドのサブバンド信号が与えられたとき、前記高周波サブバンドの複数のサブバンド信号の推定を設けるステップであって、
前記推定は前記確率モデルに基づいて決定されるステップと、
前記高周波サブバンドの複数のサブバンド信号の推定と、前記高周波サブバンドの複数のサブバンド信号とから求めた推定誤差に基づき関係度を決定するステップとを有する、
請求項1ないし9いずれか一項に記載の方法。 - 前記確率モデルは前記複数のサブバンドと前記低周波サブバンドとにより張られたベクトル空間のベクトル間の確率的関係を記述するし、
前記低周波サブバンドのサブバンド信号が与えられたとき、前記複数のサブバンド信号の推定を設け、
関係度は前記複数のサブバンド信号の推定と、前記複数のサブバンド信号との間の推定誤差に基づき決定される、
請求項26に記載の方法。 - 前記確率的モデルはガウシアンミクスチャモデルである、
請求項27に記載の方法。 - 前記確率モデルは複数のミクスチャ成分を有し、各ミクスチャ成分は前記ベクトル空間の平均ベクトルと、前記ベクトル空間の共分散マトリックスCとを有する、
請求項28に記載の方法。 - i番目のミクスチャ成分の平均ベクトルμiは前記ベクトル空間のクラスタの重心を表し、
前記i番目のミクスチャ成分の共分散マトリックスCiは前記ベクトル空間の異なる次元間の相関を表す、
請求項29に記載の方法。 - オーディオ信号のコーディング履歴において、パラメトリックオーディオコーディングツールの使用を検出する方法であって、前記オーディオ信号は第1のチャンネルと第2のチャンネルを含むマルチチャンネル信号であり、前記方法は、
複数の第1のサブバンド信号と複数の第2のサブバンド信号とを提供するステップであって、前記複数の第1のサブバンド信号は前記マルチチャンネル信号の第1のチャンネルの時間/周波数ドメイン表現に対応し、前記複数の第2のサブバンド信号は前記マルチチャンネル信号の第2のチャンネルの時間/周波数ドメイン表現に対応し、前記複数の第1と第2のサブバンド信号は複素値であり複数の第1と第2の位相信号を含むステップと、
対応する第1と第2の位相信号の、前記複数の第1と第2の位相信号との差として、複数の位相差サブバンド信号を決定するステップと、
前記複数の位相差サブバンド信号から前記オーディオ信号のコーディング履歴におけるパラメトリックオーディオコーディングツールの使用を検出するステップとを有する、方法。 - 複数の位相差値を決定するステップであって、各位相差値は前記対応する位相差サブバンド信号のサンプルの時間的平均として決定するステップと、
前記複数の位相差値の周期構造を検出し、それにより前記オーディオ信号のコーディング履歴中のパラメトリックステレオ符号化を検出するステップとを有する、
請求項33に記載の方法。 - 各位相差サブバンド信号について、サンプルの一部が位相差閾値より小さい位相差を有すると判断するステップと、
前記一部が、クロスオーバ周波数より高い周波数において、サブバンド信号の一部閾値を越えることを検出し、それにより前記オーディオ信号のコーディング履歴中の前記第1と第2のチャンネルのカップリングを検出するステップとを有する、
請求項33ないし34いずれか一項に記載の方法。 - プロセッサで実行するために構成され、計算デバイスで実行されると、請求項1ないし35いずれか一項の方法ステップを実行するソフトウェアプログラム。
- プロセッサで実行するために構成され、計算デバイスで実行されると、請求項1ないし35いずれか一項の方法ステップを実行するソフトウェアプログラムを有する記憶媒体。
- コンピュータで実行されると、請求項1ないし35いずれか一項に記載の方法を実行する実行可能命令を有するコンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161488122P | 2011-05-19 | 2011-05-19 | |
US61/488,122 | 2011-05-19 | ||
PCT/US2012/035785 WO2012158333A1 (en) | 2011-05-19 | 2012-04-30 | Forensic detection of parametric audio coding schemes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014513819A true JP2014513819A (ja) | 2014-06-05 |
JP5714180B2 JP5714180B2 (ja) | 2015-05-07 |
Family
ID=46149720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014511380A Expired - Fee Related JP5714180B2 (ja) | 2011-05-19 | 2012-04-30 | パラメトリックオーディオコーディング方式の鑑識検出 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9117440B2 (ja) |
EP (1) | EP2710588B1 (ja) |
JP (1) | JP5714180B2 (ja) |
KR (1) | KR101572034B1 (ja) |
CN (1) | CN103548077B (ja) |
WO (1) | WO2012158333A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020512593A (ja) * | 2017-03-31 | 2020-04-23 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2549953T3 (es) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
KR101632238B1 (ko) | 2013-04-05 | 2016-06-21 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
KR102329309B1 (ko) | 2013-09-12 | 2021-11-19 | 돌비 인터네셔널 에이비 | Qmf 기반 처리 데이터의 시간 정렬 |
WO2015041478A1 (ko) | 2013-09-17 | 2015-03-26 | 주식회사 윌러스표준기술연구소 | 멀티미디어 신호 처리 방법 및 장치 |
CN108347689B (zh) | 2013-10-22 | 2021-01-01 | 延世大学工业学术合作社 | 用于处理音频信号的方法和设备 |
KR102157118B1 (ko) | 2013-12-23 | 2020-09-17 | 주식회사 윌러스표준기술연구소 | 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치 |
US9832585B2 (en) | 2014-03-19 | 2017-11-28 | Wilus Institute Of Standards And Technology Inc. | Audio signal processing method and apparatus |
US9542955B2 (en) | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
US9848275B2 (en) | 2014-04-02 | 2017-12-19 | Wilus Institute Of Standards And Technology Inc. | Audio signal processing method and device |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3271918B1 (en) * | 2015-04-30 | 2019-03-13 | Huawei Technologies Co., Ltd. | Audio signal processing apparatuses and methods |
EP3223279B1 (en) * | 2016-03-21 | 2019-01-09 | Nxp B.V. | A speech signal processing circuit |
CN106097317A (zh) * | 2016-06-02 | 2016-11-09 | 南京康尼机电股份有限公司 | 一种基于离散余弦相位信息的多光斑检测和定位方法 |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107767860B (zh) * | 2016-08-15 | 2023-01-13 | 中兴通讯股份有限公司 | 一种语音信息处理方法和装置 |
US10803119B2 (en) * | 2017-01-02 | 2020-10-13 | Gracenote, Inc. | Automated cover song identification |
US10733998B2 (en) | 2017-10-25 | 2020-08-04 | The Nielsen Company (Us), Llc | Methods, apparatus and articles of manufacture to identify sources of network streaming services |
US11049507B2 (en) | 2017-10-25 | 2021-06-29 | Gracenote, Inc. | Methods, apparatus, and articles of manufacture to identify sources of network streaming services |
US10629213B2 (en) | 2017-10-25 | 2020-04-21 | The Nielsen Company (Us), Llc | Methods and apparatus to perform windowed sliding transforms |
CN108074238B (zh) * | 2017-12-29 | 2020-07-24 | 惠州市华星光电技术有限公司 | 基于霍夫变换及高斯拟合的面内mura检测方法及检测系统 |
US10740889B2 (en) * | 2017-12-29 | 2020-08-11 | Huizhou China Star Optoelectronics Technology Co., Ltd. | Method and system for detection of in-panel mura based on hough transform and gaussian fitting |
US20200042825A1 (en) * | 2018-08-02 | 2020-02-06 | Veritone, Inc. | Neural network orchestration |
CN109584890A (zh) * | 2018-12-18 | 2019-04-05 | 中央电视台 | 音频水印嵌入、提取、电视节目互动方法及装置 |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
CN113409804B (zh) * | 2020-12-22 | 2024-08-09 | 声耕智能科技(西安)研究院有限公司 | 一种基于变张成广义子空间的多通道频域语音增强算法 |
US11568884B2 (en) * | 2021-05-24 | 2023-01-31 | Invictumtech, Inc. | Analysis filter bank and computing procedure thereof, audio frequency shifting system, and audio frequency shifting procedure |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081033A (ja) * | 2009-10-02 | 2011-04-21 | Toshiba Corp | 信号処理装置、及び携帯端末装置 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0149759B1 (ko) | 1995-11-20 | 1998-11-02 | 김광호 | 디지탈신호 처리칩을 이용한 디티엠프 검출기 및 구현방법 |
DE10000934C1 (de) * | 2000-01-12 | 2001-09-27 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals |
JP3511502B2 (ja) | 2000-09-05 | 2004-03-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ加工検出システム、付加情報埋め込み装置、付加情報検出装置、デジタルコンテンツ、音楽コンテンツ処理装置、付加データ埋め込み方法、コンテンツ加工検出方法、記憶媒体及びプログラム伝送装置 |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004818D0 (sv) | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
CN1279512C (zh) | 2001-11-29 | 2006-10-11 | 编码技术股份公司 | 用于改善高频重建的方法和装置 |
EP1318611A1 (en) | 2001-12-06 | 2003-06-11 | Deutsche Thomson-Brandt Gmbh | Method for retrieving a sensitive criterion for quantized spectra detection |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
KR100462615B1 (ko) | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
CA2453814C (en) | 2002-07-19 | 2010-03-09 | Nec Corporation | Audio decoding apparatus and decoding method and program |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
EP1621047B1 (en) | 2003-04-17 | 2007-04-11 | Koninklijke Philips Electronics N.V. | Audio signal generation |
CN100546233C (zh) | 2003-04-30 | 2009-09-30 | 诺基亚公司 | 用于支持多声道音频扩展的方法和设备 |
EP1672618B1 (en) | 2003-10-07 | 2010-12-15 | Panasonic Corporation | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
EP1719117A1 (en) | 2004-02-16 | 2006-11-08 | Koninklijke Philips Electronics N.V. | A transcoder and method of transcoding therefore |
TWI393121B (zh) | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
WO2006075563A1 (ja) | 2005-01-11 | 2006-07-20 | Nec Corporation | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
KR101194902B1 (ko) | 2005-02-24 | 2012-10-25 | 파나소닉 주식회사 | 데이터 재생장치 |
KR100818268B1 (ko) | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
EP1949369B1 (en) | 2005-10-12 | 2012-09-26 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio data and extension data |
AU2006300103B2 (en) | 2005-10-13 | 2010-09-09 | Lg Electronics Inc. | Method and apparatus for signal processing |
US8199828B2 (en) | 2005-10-13 | 2012-06-12 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
KR100717058B1 (ko) | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US20080243518A1 (en) | 2006-11-16 | 2008-10-02 | Alexey Oraevsky | System And Method For Compressing And Reconstructing Audio Files |
JP4967618B2 (ja) | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
JP5377974B2 (ja) | 2006-11-30 | 2013-12-25 | パナソニック株式会社 | 信号処理装置 |
US8015368B2 (en) | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
EP2220646A1 (en) | 2007-11-06 | 2010-08-25 | Nokia Corporation | Audio coding apparatus and method thereof |
AU2008326957B2 (en) * | 2007-11-21 | 2011-06-30 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
CN101471072B (zh) | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
CA2729971C (en) | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | An apparatus and a method for calculating a number of spectral envelopes |
JP5010743B2 (ja) | 2008-07-11 | 2012-08-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
AU2009267525B2 (en) | 2008-07-11 | 2012-12-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio signal synthesizer and audio signal encoder |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
EP2224433B1 (en) | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
KR101424944B1 (ko) | 2008-12-15 | 2014-08-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더 및 대역폭 확장 디코더 |
-
2012
- 2012-04-30 EP EP12723553.9A patent/EP2710588B1/en not_active Not-in-force
- 2012-04-30 KR KR1020137033678A patent/KR101572034B1/ko not_active IP Right Cessation
- 2012-04-30 JP JP2014511380A patent/JP5714180B2/ja not_active Expired - Fee Related
- 2012-04-30 US US14/116,113 patent/US9117440B2/en not_active Expired - Fee Related
- 2012-04-30 WO PCT/US2012/035785 patent/WO2012158333A1/en active Application Filing
- 2012-04-30 CN CN201280024357.2A patent/CN103548077B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081033A (ja) * | 2009-10-02 | 2011-04-21 | Toshiba Corp | 信号処理装置、及び携帯端末装置 |
Non-Patent Citations (1)
Title |
---|
JPN7014001986; Jurgen Herre, Michael Schug: 'Analysis of Decompressed Audio- The "Inverse Decoder"' AES 109th Convention * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020512593A (ja) * | 2017-03-31 | 2020-04-23 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
JP2020512591A (ja) * | 2017-03-31 | 2020-04-23 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 音響信号を処理するための装置および方法 |
JP2020512594A (ja) * | 2017-03-31 | 2020-04-23 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 音響信号のスペクトル強調処理に関する所定の特性を決定するための装置および方法 |
US11170794B2 (en) | 2017-03-31 | 2021-11-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
JP7059301B2 (ja) | 2017-03-31 | 2022-04-25 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
US12067995B2 (en) | 2017-03-31 | 2024-08-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal |
Also Published As
Publication number | Publication date |
---|---|
US9117440B2 (en) | 2015-08-25 |
JP5714180B2 (ja) | 2015-05-07 |
CN103548077B (zh) | 2016-02-10 |
EP2710588A1 (en) | 2014-03-26 |
KR101572034B1 (ko) | 2015-11-26 |
KR20140023389A (ko) | 2014-02-26 |
CN103548077A (zh) | 2014-01-29 |
WO2012158333A1 (en) | 2012-11-22 |
US20140088978A1 (en) | 2014-03-27 |
EP2710588B1 (en) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5714180B2 (ja) | パラメトリックオーディオコーディング方式の鑑識検出 | |
JP7383067B2 (ja) | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 | |
JP5826291B2 (ja) | 音声信号からの特徴フィンガープリントの抽出及びマッチング方法 | |
RU2536679C2 (ru) | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы | |
US9697840B2 (en) | Enhanced chroma extraction from an audio codec | |
US7707030B2 (en) | Device and method for generating a complex spectral representation of a discrete-time signal | |
RU2680352C1 (ru) | Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов | |
RU2719543C1 (ru) | Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке искусственного ограничения частотной полосы аудиосигнала | |
RU2568278C2 (ru) | Расширение полосы пропускания звукового сигнала нижней полосы | |
Umapathy et al. | Audio signal processing using time-frequency approaches: coding, classification, fingerprinting, and watermarking | |
JP6790114B2 (ja) | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング | |
CN107221334B (zh) | 一种音频带宽扩展的方法及扩展装置 | |
RU2409874C9 (ru) | Сжатие звуковых сигналов | |
Wang et al. | Speech Watermarking Based on Source-filter Model of Speech Production. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20131118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5714180 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |