JP6527536B2 - オーディオプロセッサおよび水平位相訂正を用いたオーディオ信号処理方法 - Google Patents
オーディオプロセッサおよび水平位相訂正を用いたオーディオ信号処理方法 Download PDFInfo
- Publication number
- JP6527536B2 JP6527536B2 JP2016575800A JP2016575800A JP6527536B2 JP 6527536 B2 JP6527536 B2 JP 6527536B2 JP 2016575800 A JP2016575800 A JP 2016575800A JP 2016575800 A JP2016575800 A JP 2016575800A JP 6527536 B2 JP6527536 B2 JP 6527536B2
- Authority
- JP
- Japan
- Prior art keywords
- phase
- audio signal
- signal
- sub
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 416
- 238000012937 correction Methods 0.000 title claims description 233
- 238000003672 processing method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims description 113
- 238000012545 processing Methods 0.000 claims description 46
- 230000002123 temporal effect Effects 0.000 claims description 41
- 239000013598 vector Substances 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 16
- 238000009499 grossing Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 description 107
- 238000010586 diagram Methods 0.000 description 50
- 230000001052 transient effect Effects 0.000 description 33
- 238000004422 calculation algorithm Methods 0.000 description 28
- 230000000694 effects Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 15
- 230000004913 activation Effects 0.000 description 12
- 230000008447 perception Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 241000282412 Homo Species 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004321 preservation Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 229910001369 Brass Inorganic materials 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Amplifiers (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Receiver Circuits (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Description
年代に見られる知覚オーディオ符号化は、知覚の効果の公言された利用を通して、時間/周波数領域処理と冗長性縮小(エントロピー符号化)と不適切除去との使用を含む、いくつかの共通のテーマに続いている[非特許文献1]。一般に、入力信号は、時間領域信号をスペクトル(時間/周波数)表現に変換する分析フィルタバンクによって分析される。スペクトル係数への変換は、それらの周波数内容に依存している信号コンポーネント(例えば、それらの個々の倍音構造を有する種々の器具)を選択的に処理することを許す。
フィルタバンクに基づく知覚オーディオ符号化において、消費されたビット転送速度の大部分は、通常、量子化されたスペクトル係数に費やされる。従って、非常に低いビット転送速度では、十分なビットが、知覚的に損なわれていない再生を達成するために必要な
精度において、全ての係数を表現するように入手できない。従って、低いビット転送速度要件は、知覚オーディオ符号化によって得られるオーディオバンド幅に対して、有効に制限する。バンド幅拡張[非特許文献2]は、この長年の根本的制限を取り除く。バンド幅拡張の中心的アイデアは、コンパクトなパラメータ形式において、失った高周波数の内容を伝送して修復させる追加の高周波プロセッサによって、バンドを制限された知覚符号器を補足することである。高周波数の内容は、ベースバンド信号の1つのサイドバンド変調に基づいて、または、スペクトルバンド複製(SBR)[非特許文献3]において使われたようなコピーアップ技術に基づいて、または、例えばボコーダー[非特許文献4]のようなピッチシフト技術の応用に基づいて生成される。
時間伸長化またはピッチシフト化効果は、通常、同期したオーバーラップ加算(SOLA)のような時間領域技術または周波数領域技術(ボコーダー)を適用することによって得られる。また、ハイブリッドシステムは、サブバンドにおいて処理しているSOLAを適用することを提案している。ボコーダーおよびハイブリッドシステムは、通常、垂直位相コヒーレンスの損失に帰される位相性(フェージネス、[非特許文献8])と呼ばれる人工物から損害を被る。いくつかの出版物は、重要な垂直位相コヒーレンスを守ることによる時間伸長化アルゴリズムの音質についての改良に関係する([非特許文献7]、[非特許文献6])。
る。
位相尺度とを決定する。さらに、位相エラー計算器は、位相エラーのベクトルを形成する。ベクトルの第1要素は、第1サブバンド信号の位相および第1目標位相尺度の第1偏差と呼ぶ。ベクトルの第2要素は、第2サブバンド信号の位相および第2目標位相尺度の第2偏差と呼ぶ。さらに、この実施の形態のオーディオプロセッサは、訂正第1サブバンド信号および訂正第2サブバンド信号を使って、訂正オーディオ信号を合成するためのオーディオ信号シンセサイザーを含む。この位相訂正は、平均の訂正位相値を作成する。
目標スペクトルとの間の差を減らして実行される。付加的に、デコーダは、時間フレームのための訂正位相を使って、第1時間フレームのためのオーディオサブバンド信号を計算すると共に、第2時間フレームの中のサブバンド信号の尺度を使うか、または前記位相訂正アルゴリズムと異なる別の位相訂正アルゴリズムに従って訂正位相計算を使って、第1時間フレームと異なる第2時間フレームのためのオーディオサブバンド信号を計算するためのオーディオサブバンド信号計算器を含む。
知覚オーディオ符号化は、制限された容量で、送信または格納チャンネルを使って、顧客にオーディオおよびマルチメディアを提供する応用の全てのタイプのためにデジタル技術をもたらす主流として急増した。現代知覚オーディオ符号器は、ますます低いビット転送速度で、満足するオーディオの品質を派生することが必要とされる。それは、次々と、多数の聴衆によって殆んど耐えられる特定の符号化人工物を我慢する必要がある。オーディオバンド幅拡張(BWE)は、特定の人工物を導入する価格で、送信された低バンド信号部分のスペクトル変換または交換によって、オーディオ符号器の周波数範囲を高バンドに人工的に拡張する技術である。
ピーすることによって得られる。処理は、複雑に組み立てられた求積法鏡フィルタバンク(QMF)[非特許文献10]領域で通常実行される。それは、以下においても推定される。コピーアップされた信号は、送信されたパラメータに基づいて、最適ゲインでそれのマグニチュードスペクトルを乗算することによって処理される。目的は、オリジナル信号のそれとして、同様のマグニチュードスペクトルを得ることである。それどころか、コピーアップされた信号の位相スペクトルは一般に全然処理されないけれども、代わりに、コピーアップされた位相スペクトルは直接に使われる。
1.位相デリバティブ訂正の「重要性」の定量化
2.垂直(「周波数」)位相デリバティブ訂正または水平(「時間」)位相デリバティブ訂正の信号依存優先度付け
3.訂正方向(「周波数」または「時間」)の信号依存切り替え
4.トランジェントのための専念された垂直位相デリバティブ訂正モード
5.平滑な訂正のための安定したパラメータの取得
6.訂正パラメータのコンパクトなサイド情報送信形式
mが離散的な時間である時間領域信号x(m)は、例えば複雑に組み立てられた求積法鏡フィルタバンク(QMF)を使って、時間周波数領域の中で提示される。結果として生じる信号は、X(k,n)である。kは周波数バンドインデックスであり、nは時間的(temporal)フレームインデックスである。64個のバンドのQMFおよび48kHzのサンプリング周波数fsは、視覚化および実施の形態のために推定される。従って
、個々の周波数バンドのバンド幅fBWは375Hzであり、時間的ホップサイズthop(
図2の中の17)は1.33ミリ秒である。しかし、処理はそのような変換に制限されない。代わりに、MDCT(修正された離散コサイン変換)またはDFT(離散フーリエ変換)が使われてもよい。
トXpha(k,n)と、を使って提示もできる。
Bは、対応する位相スペクトルXpha(k,n)を示す。両者は、QMF領域内である。
さらに、図1Cは、トロンボーン信号のマグニチュードスペクトルXmag(k,n)を示
す。図1Dは、また、対応するQMF領域内の、対応する位相スペクトルを示す。図1Aおよび図1Cのマグニチュードスペクトルについて、色勾配は、赤色=0dBから青色=−80dBまでのマグニチュードを示す。さらに、図1Bおよび図1Dの位相スペクトルに対して、色勾配は、赤色=πから青色=−πまでの位相を示す。
説明されるオーディオ処理の効果を示すために用いられるオーディオデータは、トロンボーンのオーディオ信号に対して「トロンボーン」と名付けられ、バイオリンのオーディオ信号に対して「バイオリン」と名付けられ、そして、途中で追加された拍手を伴うバイオリン信号に対して「バイオリン+拍手」と名付けられる。
図2は、時間フレーム15とサブバンド20とにより定義された時間周波数タイル10(例えば、QMFビン、求積法鏡フィルタバンクビン)を含む時間周波数グラフ5を示す。オーディオ信号は、QMF(求積法鏡フィルタバンク)変換、または、MDCT(修正された離散コサイン変換)、または、DFT(離散フーリエ変換)を使って、時間周波数表現に変換される。時間フレームの中のオーディオ信号の分割は、オーディオ信号のオーバーラップしている部分から成る。図2の下の部分において、時間フレーム15の1つのオーバーラップが示される。最大2つの時間フレームが同時にオーバーラップする。さらに、仮により多くの冗長性が必要であるならば、オーディオ信号は、さらに複数のオーバーラップを使って分割される。複数のオーバーラップアルゴリズムにおいて、3つ以上の時間フレームは、特定の時間ポイントにてオーディオ信号の同じ部分を含む。オーバーラップの期間はホップサイズthop17である。
のために、たとえ別の処理が、推定された場合に制限されないと見える必要があっても、符号化は、どのような点においても信号を修正しないと推定される。
ここで、Yraw(k,n,i)は、周波数パッチiのための複雑なQMF信号である。
生の周波数パッチ信号は、送信されたメタデータに従って、ゲインg(k,n,i)とそれらを乗算させることによって処理される。
)25を反映する。ベースバンドXbase(k,n)30は、そこから、2番目から7番目までのサブバンドを選択することによって引き出される。図3Aは、オリジナルのオーディオ信号、すなわち送信または符号化の前のオーディオ信号を示す。図3Bは、受信後、例えば中間的なステップで復号プロセス中のオーディオ信号の例示的な周波数表現を示す。オーディオ信号の周波数スペクトルは、送信された周波数バンド25と、ベースバンドの周波数より高い周波数を構成するオーディオ信号32を形成している周波数スペクトルのより高いサブバンドにコピーされた7個のベースバンド信号30と、を含む。完全なベースバンド信号は、周波数パッチとも呼ばれる。図3Cは、再構成されたオーディオ信号Z(k,n)35を示す。図3Bに比べて、ベースバンド信号のパッチは、ゲインファクターによって個々に増加される。従って、オーディオ信号の周波数スペクトルは、主要な周波数スペクトル25と、複数のマグニチュード訂正パッチY(k,n,1)40と、を含む。このパッチ化方法は、直接コピーアップパッチ化と呼ばれる。たとえ本発明がそのようなパッチ化アルゴリズムに制限されなくても、直接コピーアップパッチは、本発明を説明するために例示的に用いられる。使われる別のパッチ化アルゴリズムは、例えば高調波パッチ化アルゴリズムである。
いて示される。図4Bは、対応する位相スペクトルZpha(k,n)を示す。図4Cおよ
び図4Dは、トロンボーン信号のための対応するスペクトルを示す。全ての信号はQMF領域の中で提供される。図1において既に示されているように、色勾配は、赤色=0dBから青色=−80dBまでのマグニチュードと、赤色=πから青色=−πまでの位相を示す。それらの位相スペクトルが、オリジナル信号のスペクトルと異なる、ことが認められる(図1を参照のこと)。SBRのため、バイオリンは不調和性を含むことに気づかれ、トロンボーンはクロスオーバー周波数で組み立てられる雑音を含むことに気づかれる。しかし、位相プロットは全くランダムに見え、それらがどれほど違うか、および、違いの知覚的効果が何であるか、を言うことは本当に難しい。さらに、この種類のランダムなデータのために送られる訂正データは、低いビット転送速度を必要とする符号化応用において、適さない。従って、位相スペクトルの知覚的効果を理解すること、および、それらを説明することに対する利点を見付けることが必要である。これらの話題は、以下の節で議論される。
しばしば、周波数バンドのインデックスが単一のト−ンコンポーネントの周波数を定義し、マグニチュードがそれのレベルを定義し、位相がそれの「タイミング」を定義することが考えられる。しかし、QMFバンドのバンド幅は相対的に大きく、データは過剰にサンプリングされる。従って、時間周波数タイル(すなわち、QMFビン)間の相互作用は、実際、これらの特性の全てを定義する。
(3,1)=1およびXpha(3,1)=0またはπ/2またはπは、図5において記載
される。結果は、13.3ミリ秒の長さを有する正弦状関数である。関数の正確な形は、位相パラメータによって定義される。
によって、正弦曲線が作成される。結果として生じる信号(すなわち、逆QMF変換の後の時間領域信号)は、α=π/4(上方)と3π/4(下方)の値によって、図6において示される。正弦曲線の周波数は、位相変化により影響されることが認められる。信号の周波数領域は図6の右側に示される。信号の時間領域は図6の左側に示される。
によって、トランジェントが作成される。結果として生じる信号(すなわち、逆QMF変換の後の時間領域信号)は、α=π/4(上方)と3π/4(下方)の値によって図9において示される。トランジェントの時間的位置は、位相変化により影響されることが認められる。周波数領域は図9の右側に示される。信号の時間領域は図9の左側に示される。
4節で議論されたように、位相スペクトルそれ自体は、全く乱雑に見え、その知覚への効果が何であるかを直接見ることは難しい。5節は、QMF領域の位相スペクトルを処理することによって引き起こされる2つの効果を提示した:(a)時間上の一定の位相変化は正弦曲線を作り出し、位相変化の量は正弦曲線の周波数を制御する、そして、(b)周波数上の一定の位相変化はトランジェントを生み出し、位相変化の量はトランジェントの時間的位置を制御する。
そして、周波数上の位相デリバティブ(PDF)を計算すること、
によって推定される。
される。
波数上の位相デリバティブXpdf(k,n)を示す。図12Cおよび図12Dは、それぞ
れ、トロンボーン信号のための時間上の位相デリバティブおよび周波数上の位相デリバティブを示す。色勾配は、赤色=πから青色=−πまでの位相値を示す。バイオリンに対して、マグニチュードスペクトルは、基本的に約0.13秒までの雑音(図1を参照のこと)であり、それゆえ、デリバティブも雑音的である。約0.13秒のXpdtからの開始は
、時間上の相対的に安定した値を有するように見える。これは、信号が、強く、相対的に安定した正弦曲線を含むことを意味する。これらの正弦曲線の周波数は、Xpdt値によっ
て決定される。それどころか、Xpdfプロットは相対的に騒々しく見える。従って、関連
したデータは、バイオリンに対して、それを使って全然見つけられない。
音は、2つのカテゴリー:高調波信号と雑音状信号とに、粗く分けられる。雑音状信号は、既に定義によって雑音的な位相特性を有する。従って、SBRにより引き起こされた位相エラーは、それらによって知覚的に重要でないと推定される。代わりに、それは高調波信号に集中される。殆どの楽器とスピーチが、信号に対して高調波構造を作成する。すなわち、トーンは、基本周波数によって、周波数の中で間隔をおいて配置された強い正弦曲線コンポーネントを含む。
ここで、fcは、バンド(kHzにおいて)の中心周波数である。4節で議論されたよ
うに、ベースバンドとSBRパッチとの間のクロスオーバー周波数は、約3kHzである。これらの周波数で、ERBは約350Hzである。QMF周波数バンドのバンド幅は、実際、これに相対的に近く、375Hzである。ここに、QMF周波数バンドのバンド幅は、興味ある周波数でERBに続くように推定される。
7節において、人間は解決された高調波の周波数の中のエラーに敏感である、ことに注目された。さらに、仮に基本周波数が低く、高調波が周波数上で位置合わせされるならば、人間は高調波の時間的位置の中のエラーに敏感である。SBRは、6節で議論されたように、これらのエラーの両方を引き起こす。従って、知覚の品質は、それらを訂正することによって改良される。そうする方法が、この節において提案される。
7節で議論されたように、1つのERBの内側に唯一の高調波が存在するとき、人間は、たいてい高調波の周波数の中のエラーを知覚できる。さらに、QMF周波数バンドのバンド幅は、最初のクロスオーバーでERBを推定するために用いられる。ここに、1つの周波数バンドの内側に1つの高調波が存在するときだけ、周波数は訂正される必要がある
。5節が、仮に1つのバンド当たり1つの高調波が存在するならば、生み出されたPDT値は安定しているか、または、時間上ゆっくり変化し、低いビット転送速度を使って潜在的に訂正されることを示したので、これは非常に便利である。
バンド95aのための第1偏差105aと呼ばれる。ベクトルの第2要素は、前の時間フレーム75aから現在の時間フレーム75bまでの、複数のサブバンドの第2サブバンド95bのための第2偏差105bと呼ばれる。さらに、位相訂正器70は、偏差105のベクトルを、オーディオ信号55の位相45に適用できる。ベクトルの第1要素は、オーディオ信号55の複数のサブバンドの第1サブバンド95aの中のオーディオ信号55の位相45aに適用される。ベクトルの第2要素は、オーディオ信号55の複数のサブバンドの第2サブバンド95bの中のオーディオ信号55の位相45bに適用される。
ータ応用器125によって、オーディオ信号のマグニチュード訂正をさらに含む。さらに、オーディオプロセッサは、正規のオーディオファイルを得るために、オーディオ信号のサブバンドを組み合わせるための、すなわち合成するためのシンセサイザー100(例えば、合成フィルタバンク)を含む。
前述したように、仮に高調波が周波数上で同期し、かつ、基本周波数が低いならば、人間は、高調波の時間的位置の中のエラーを知覚することができる。5節では、仮に周波数上の位相デリバティブが、QMF領域において一定であるならば、高調波が同期することが示された。従って、個々の周波数バンドの中に、少なくともに1つの高調波を有するこ
とは、有利である。さもなければ、「空の」周波数バンドは、ランダムな位相を有し、この尺度を妨害する。幸運にも、人間は、基本周波数が低い時にだけ、高調波の時間的な位置に敏感である(7節を参照のこと)。従って、周波数上の位相デリバティブは、高調波の時間的な動きのため、知覚的に重要な効果を決定するための尺度として使われる。
50´を含み、受信された位相デリバティブまたは周波数を使って、オーディオ信号32の中のトランジェントを訂正する。さらに、図31のデコーダ110´は、図19のデコーダ110と同様であることに注目する必要がある。その結果、主要な要素についての説明が、オーディオプロセッサ50とオーディオプロセッサ50´との違いに関連しないこれらの場合において、相互に交換可能である。
の点で、目標位相スペクトルは、入力信号のそれに等しいと推定される。
8.1節および8.2節は、SBR−引き起こされた位相エラーが、PDT訂正をバイオリンに適用すると共にPDF訂正をトロンボーンに適用することによって訂正できることを示した。しかし、それは、どのように、訂正のうちの1つが未知の信号に適用されるべきであるか、または、それらのうちのどれが適用されるべきであるかを知る方法は、考慮されなかった。この節は、訂正方向を自動的に選択するための方法を提案する。訂正方向(水平/垂直)は、入力信号の位相デリバティブのバリエーションに基づいて決められる。
は、対応する時間フレームと窓化関数とを使って計算される。さらに、バリエーション決定器275は、第2バリエーション290bを決定するとき、現在の、複数の前のおよび複数の未来の時間フレーム75に亘って標準偏差尺度を平滑化するように構成される。平滑化は、対応する時間フレーム75と窓化関数とを使って計算されたエネルギーに従って、重み付けされる。従って、バリエーション比較器280は、平滑化された平均標準偏差尺度を、第1バリエーションモードを使って決定された第1バリエーション290aと比較すると共に、平滑化された標準偏差尺度を、第2バリエーションモードを使って決定された第2バリエーション290bと比較する。
、第1バリエーションモードにおいて決定された第1バリエーション290aが、第2バリエーションモードにおいて決定された第2バリエーション290bより小さいかまたは等しいならば、第1バリエーションモードに従って位相訂正データ295を計算する。従って、位相訂正データ295は、仮にトランジェントの不在が検出され、かつ、第2バリエーションモードにおいて決定された第2バリエーション290bが、第1バリエーションモードにおいて決定された第1バリエーション290aより小さいならば、第2バリエーションモードに従って計算される。
そして、周波数上の位相デリバティブのSTDは、式(28)として計算できる。
ここで、circstd{}は、円STDを計算すること示す(角度値は、雑音の低エネルギービンのため、高いSTDを避けるために、エネルギーによって潜在的に重み付けされる。または、STD計算は、十分なエネルギーによってビンに限定される)。バイオリンのSTDは図43Aと図43Bとにおいて示され、トロンボーンのSTDは図43Cと図43Dとにおいて示される。図43Aと図43Cとは、QMF領域の中の時間上の位相デリバティブの標準偏差Xstdt(k,n)を示す。図43Bと図43Dとは、位相訂正無しで、対応する周波数上の標準偏差Xstdf(n)を示す。色勾配は、赤色=1から青色=0までの値を示す。PDFのSTDが、トロンボーンに対して、より低いのに対して、PDTのSTDが、バイオリンに対して、より低いこと、が認められる(特に、高いエネルギーを有する時間周波数タイルに対して)。
途中で加えられた拍手を有するバイオリン信号は、図44において提供される。QMF領域のバイオリン+拍手信号のマグニチュードXmag(k,n)は、図44Aにおいて示
される。対応する位相スペクトルXpha(k,n)は、図44Bにおいて示される。図4
4Aに関して、色勾配は、赤色=0dBから青色=−80dBまでのマグニチュード値を示す。従って、図44Bに対して、位相勾配は、赤色=πから青色=−πまでの位相値を示す。時間上および周波数上の位相デリバティブは、図45において提供される。QMF領域のバイオリン+拍手信号の時間上の位相デリバティブXpdt(k,n)は、図45A
において示される。対応する周波数上の位相デリバティブXpdf(k,n)は、図45B
において示される。色勾配は、赤色=πから青色=−πまでの位相値を示す。PDTは拍手のために雑音的であるけれども、PDFは少なくとも高周波数で多少平滑である、と認められる。従って、PDF訂正は、その鋭さを維持するために、拍手に対して適用されるべきである。しかし、バイオリン音が、低周波数にてデリバティブを妨害しているので、8.2節の中で提案された訂正方法は、この信号によって適切に働かない。結果として、ベースバンドの位相スペクトルは高周波数を反映せず、従って、単一の値を使う周波数パッチの位相訂正は働かない。さらに、PDF値(8.3節を参照のこと)のバリエーションに基づいてトランジェントを検出することは、低周波数にて雑音的なPDF値のため困難である。
計算される。
れる。図47Bは、対応する周波数上の位相デリバティブXpdf(k,n)を示す。また
、色勾配は、赤色=πから青色=−πまでの位相値を示す。直接コピーアップに比較された差は、大きくないけれども、位相訂正拍手は、オリジナル信号と同じ鋭さ有することが知覚される。ゆえに、トランジェント訂正は、直接コピーアップだけが可能である全ての場合に、必ずしも必要であるわけではない。それどころか、仮にPDT訂正が可能ならば、PDT訂正が、トランジェントを違った形で厳しく不鮮明にするので、トランジェント処理を有することは重要である。
8節は、位相エラーが訂正できることを示したけれども、訂正のために適正なビット転送速度は全然考慮されなかった。この節は、低いビット転送速度によって訂正データを表現する方法を提案する。
5節で議論されたように、時間上の位相デリバティブは、基本的に、作成された正弦曲線の周波数を意味する。適用された64バンド複合QMFのPDTは、以下の式(34)を使って周波数に変えられる。
内側にある。fc(k)は周波数バンドkの中心周波数であり、fBWは375Hzである
。結果は、バイオリン信号のためのQMFバンドの周波数Xfreq(k,n)の時間周波数表現において、図47に示される。周波数は、ト−ンの基本周波数の倍数に続いているように見え、従って、高調波は、基本周波数によって、周波数の中に間隔をおいて配置されていることが認められる。さらに、ビブラートは周波数変調を引き起こすように見える。
ピークの位置は、成功したPDF訂正を実行するために推定される必要がある。1つの解決策は、式(34)と同様に、PDF値を使ってピークの位置を計算し、推定された基本周波数を使って、間のピークの位置を推定することである。しかし、このアプローチは、相対的に安定した基本的周波数推定を必要とする。実施の形態は、提案された圧縮アプローチが可能であることを示す、簡単に速く実施する、代わりの方法を示す。
51Bの信号は、例えば図30に関して説明されたパルス列265である。アルゴリズムは、波形の中のピークの位置を分析することによって開始する。これは、局部的な最大を検索することによって実行される。個々の27ミリ秒に対して(すなわち、個々の20個のQMFフレームに対して)、フレームの中心点に最も近いピークの位置が送信される。送信されたピーク位置の間において、ピークは時間内に均等に間隔をおいて配置されると推定される。従って、基本周波数を知ることによって、ピークの位置が推定される。この実施の形態において、検出されたピークの数が送信される。(これが、全てのピークの成功した検出を必要とすることは注目するべきである。基本的周波数に基づく推定は、たぶん、より頑強な結果を産む。)結果として生じるビット転送速度は、約0.5kbpsである(エントロピー符号化のように、どんな圧縮も無しで)。それは、9ビットを使って、全ての27ミリ秒に対して、ピークの位置を送信すること、および、4ビットを使って、間のトランジェントの数を送信すること、を含む。この精度は、非量子化と等しい知覚された品質を生むために見付けられた。しかし、重要なことに、より低いビット転送速度が、たぶん、十分に良好な知覚された品質を生む多くの場合に使われる。
するべきである。従って、基本周波数は相対的に低いビット転送速度によって送信される。
第1位相訂正器
70aは、位相訂正アルゴリズムによって決定されたオーディオ信号32の第1時間フレームの中のサブバンド信号の位相45を訂正する。訂正は、オーディオ信号32の第1時間フレームのサブバンド信号の尺度と、目標スペクトル85´´との間の差を、減らすことによって実行される。オーディオサブバンド信号計算器350は、時間フレームのための訂正位相91aを使って、第1時間フレームのためのオーディオサブバンド信号355を計算する。あるいは、オーディオサブバンド信号計算器350は、第2時間フレームの中のサブバンド信号の尺度85a´´を使うか、または、前記位相訂正アルゴリズムとは異なる別の位相訂正アルゴリズムに従って訂正位相計算を使って、第1時間フレームとは異なる第2時間フレームのためのオーディオサブバンド信号355を計算する。図53は
、さらに、マグニチュード47および位相45に関して、オーディオ信号32を任意に分析する分析器360を示す。別の位相訂正アルゴリズムは、第2位相訂正器70bまたは第3位相訂正器70cにおいて実行される。これらの別の位相訂正器は、図54に関して説明されるだろう。オーディオサブバンド信号計算器250は、第1時間フレームのための訂正位相91と第1時間フレームのオーディオサブバンド信号のマグニチュード値47とを使って、第1時間フレームのためのオーディオサブバンド信号を計算する。マグニチュード値47は、第1時間フレームの中のオーディオ信号32のマグニチュード、または、第1時間フレームの中のオーディオ信号35の処理されたマグニチュードである。
る。活性化データに基づいて、目標スペクトルの計算は、正しい訂正モードに対して活性化される(他の訂正モードは待機する)。目標スペクトルを使って、位相訂正は、要求された訂正モードを使って、受信されたBWE信号に対して実行される。水平訂正70aが、再帰的に(すなわち、前の信号フレームに依存して)実行されると、それは、別の訂正モード70bおよび70cから、前の訂正マトリクスも受信する、ことは注目するべきである。最後に、訂正信号、または、無処理の信号が、活性化データに基づいて出力に設定される。
をコア符号化する。パラメータ抽出器165は、コア符号化されたオーディオ信号に含まれないサブバンドの第2セットのための低解像度パラメータ表現を得るために、パラメータ190を、オーディオ信号55から取り出す。出力信号形成器170は、パラメータ190と、コア符号化されたオーディオ信号145と、位相訂正データ295´と、を含む出力信号135を形成する。任意に、エンコーダ155´´は、オーディオ信号55をコア符号化する前のローパスフィルタ180と、パラメータ190をオーディオ信号55から取り出す前のハイパスフィルタ185とを含む。あるいは、オーディオ信号55をローパスフィルタまたはハイパスフィルタする代わりに、ギャップを満たすアルゴリズムが使われる。コアエンコーダ160は、数が減らされたサブバンドをコア符号化する。サブバンドのセット内の少なくとも1つのサブバンドが、コア符号化されない。さらに、パラメータ抽出器165は、パラメータ190を、コアエンコーダ160によって符号化されなかった少なくとも1つのサブバンドから取り出す。
。
、または、ベースバンド信号Xbase(k,n)30、または、オリジナルのオーディオ信号と比較されるときに、より高い周波数32を含む処理されたオーディオ信号、または、再構成されたオーディオ信号35、または、マグニチュード訂正周波数パッチY(k,n,i)40、または、オーディオ信号の位相45、または、オーディオ信号のマグニチュード47に対して、一般用語として使われる、ことに注目する必要がある。従って、異なるオーディオ信号は、実施の形態の文脈のために、相互に交換される。
た面も、対応するブロックの説明または対応する装置のアイテムまたは特徴を表している。方法ステップのうちのいくつかまたは全てが、例えばマイクロプロセッサまたはプログラム可能なコンピュータまたは電子回路のような、ハードウェア装置によって(を使って)実行される。いくつかの実施の形態において、最も重要な方法ステップのうちの1つ以上は、そのような装置によって実行される。
ンピュータプログラムをインストールしているコンピュータを含む。
Claims (18)
- 時間フレーム(75a)のためのオーディオ信号の位相尺度(80)を計算するように構成されたオーディオ信号位相尺度計算器(60)と、
前記時間フレーム(75a)のための目標位相尺度(85)を決定する目標位相尺度決定器(65)と、
処理されたオーディオ信号(90)を得るために、前記計算された位相尺度(80)および前記目標位相尺度(85)を使用して、前記時間フレーム(75a)のためのオーディオ信号(55)の位相(45)を訂正するように構成された位相訂正器(70)と、を含む、オーディオ信号(55)を処理するためのオーディオプロセッサ(50)。
- 前記オーディオ信号(55)は、前記時間フレーム(75a)のための複数のサブバンド信号(95a、95b)を含み、
前記目標位相尺度決定器は、第1サブバンド信号(95a)のための第1目標位相尺度(85a)と、第2サブバンド信号(95b)のための第2目標位相尺度(85b)と、を決定するように構成され、
前記オーディオ信号位相尺度計算器(60)は、前記第1サブバンド信号(95a)のための第1位相尺度(80a)と、前記第2サブバンド信号(95b)のための第2位相尺度(85b)と、を決定するように構成され、
前記位相訂正器(70)は、処理された第1のサブバンド信号(90a)を得るために、前記オーディオ信号(55)の前記第1位相尺度(80a)および前記第1目標位相尺度(85a)を使って、前記第1サブバンド信号(95a)の第1位相(45a)を訂正するように、そして、処理された第2のサブバンド信号(90b)を得るために、前記オーディオ信号(55)の前記第2位相尺度(80b)および前記第2目標位相尺度(85b)を使って、前記第2サブバンド信号(95b)の第2位相(45b)を訂正するように構成され、
前記オーディオプロセッサ(50)は、前記処理された第1サブバンド信号(90a)および前記処理された第2サブバンド信号(90b)を使って、前記処理されたオーディオ信号(90)を合成するためのオーディオ信号シンセサイザー(100)を含む、請求項1に記載のオーディオプロセッサ(50)。
- 前記位相尺度(80)は、時間上の位相デリバティブであり、
前記オーディオ信号位相尺度計算器(60)は、複数のサブバンドのうちの個々のサブバンド(95)について、現在の時間フレーム(75b)の位相値と未来の時間フレーム(75c)の位相値との前記位相デリバティブを計算するように構成され、
前記位相訂正器(70)は、前記現在の時間フレーム(75b)の前記複数のサブバンド(95)のうちの個々のサブバンド(95)について、目標位相デリバティブ(85)と時間上位相デリバティブ(80)との間の偏差(105)を計算するように構成され、
前記位相訂正器70により実行される訂正は、前記偏差を使って実行される、請求項1または請求項2のいずれか1項に記載のオーディオプロセッサ(50)。
- 前記位相訂正器(70)は、訂正サブバンド信号(90a,90b)の周波数が、前記オーディオ信号(55)の基本周波数に高調波的に割り当てられている周波数値を有するように、前記時間フレーム(75)内の前記オーディオ信号(55)の種々のサブバンドのサブバンド信号(95)を訂正するように構成されている、請求項1〜請求項3のいずれか1項に記載のオーディオプロセッサ(50)。
- 前記位相訂正器(70)は、前の時間フレーム(75a)、前記現在の時間フレーム(75b)および未来の時間フレーム(75c)にわたる複数のサブバンドのうちの個々のサブバンド(95)について偏差(105)を平滑化するように構成され、且つ、サブバンド(95)内の前記偏差(105)の急速な変化を減らすように構成される、請求項3に記載のオーディオプロセッサ(50)。
- 前記平滑化は、重み付け平均であり、
前記位相訂正器(70)は、前記前の時間フレーム(75a)、前記現在の時間フレーム(75b)および前記未来の時間フレーム(75c)における前記オーディオ信号(55)のマグニチュード(47)によって重み付けされた、前記前の時間フレーム(75a)、前記現在の時間フレーム(75b)および前記未来の時間フレーム(75c)にわたる、前記重み付け平均を計算するように構成される、請求項5に記載のオーディオプロセッサ(50)。
- 前記複数のサブバンドは、第1サブバンドおよび第2サブバンドを含み、
前記位相訂正器(70)は、前記偏差(105)のベクトルを形成するように構成され、前記ベクトルの第1要素は、前の時間フレーム(75a)から現在の時間フレーム(75b)までの、前記複数のサブバンドの前記第1サブバンド(95a)のための第1偏差(105a)のことであり、前記ベクトルの第2要素は、前の時間フレーム(75a)から現在の時間フレーム(75b)までの、前記複数のサブバンドの前記第2サブバンド(95b)のための第2偏差(105b)のことであり、
前記位相訂正器(70)は、前記オーディオ信号(55)の前記位相(45)に前記偏差(105)のベクトルを適用するように構成され、前記ベクトルの前記第1要素は、前記オーディオ信号(55)の前記複数のサブバンドの前記第1サブバンド(95a)の中の前記オーディオ信号(55)の位相(45a)に適用され、前記ベクトルの前記第2要素は、前記オーディオ信号(55)の前記複数のサブバンドの前記第2サブバンド(95b)の中の前記オーディオ信号(55)の位相(45b)に適用するように構成される、請求項3に記載のオーディオプロセッサ(50)。
- 前記目標位相尺度決定器(65)は、時間フレーム(75)のための基本周波数推定(85b)を得るように構成され、
前記目標位相尺度決定器(65)は、前記時間フレーム(75)のための前記基本周波数推定を使って、前記時間フレーム(75)の複数のサブバンドのうちの個々のサブバンド(95)のための周波数推定(85)を計算するように構成される、請求項1に記載のオーディオプロセッサ(50)。
- 前記目標位相尺度決定器(65)は、サブバンド(95)の総数および前記オーディオ信号(55)のサンプリング周波数を使って、複数のサブバンドのうちの個々のサブバンド(95)について、前記周波数推定(85)を、時間上の位相デリバティブに転換するように構成される、請求項8に記載のオーディオプロセッサ(50)。
- 前記目標位相尺度決定器(65)は、前記複数のサブバンドのうちの個々のサブバンド(95)のための周波数推定(85)のベクトルを形成するように構成され、前記ベクトルの第1要素は、第1サブバンド(95a)のための周波数推定(85a)のことであり、前記ベクトルの第2要素は、第2サブバンド(95b)のための周波数推定(85b)のことであり、
前記目標位相尺度決定器(65)は、前記基本周波数推定の倍数を使って、前記周波数推定(85)を計算するように構成され、現在のサブバンド(95)の周波数推定(85)は、前記サブバンド(95)の中心に最も近い前記基本周波数推定の倍数であるか、または、仮に前記基本周波数推定の倍数が前記現在のサブバンド(95)内に無いならば、前記現在のサブバンド(95)の前記周波数推定(85)は、前記現在のサブバンド(95)の境界周波数である、請求項8または請求項9に記載のオーディオプロセッサ(50)。
- オーディオ信号(55)を復号するためのデコーダ(110)であって、
前記デコーダ(110)は、
請求項1〜請求項10のいずれか1項に記載のオーディオプロセッサ(50)と、
時間フレーム(75)の中のオーディオ信号(25)を、前記オーディオ信号(55)に対して少ないサブバンド数でコア復号するように構成されたコアデコーダ(115)と、
前記少ないサブバンド数でコア復号されたオーディオ信号(25)のサブバンド(95)のセットをパッチするように構成されたパッチ器(120)であって、前記サブバンドのセットは、正規の数のサブバンドを有するオーディオ信号(55)を得るために、第1パッチ(30a)を、前記少ない数のサブバンドに隣接する前記時間フレーム(75)の中の別のサブバンドに形成する、パッチ器(120)と、を含み、
前記オーディオプロセッサ(50)は、目標関数(85)に従って、前記第1パッチ(30a)の前記サブバンドのセット内の位相(45)を訂正するように構成される、デコーダ(110)。
- 前記パッチ器(120)は、前記コア復号されたオーディオ信号(25)の前記サブバンド(95)のセットをパッチするように構成され、前記サブバンドのセットは、前記第1パッチに隣接する前記時間フレーム(75)の別のサブバンドに、第2パッチを形成し、
前記オーディオプロセッサ(50)は、前記第2のパッチの前記サブバンド(95)内の前記位相(45)を訂正するように構成され、あるいは
前記パッチ器(120)は、前記第1パッチに隣接する前記時間フレームの別のサブバンドに訂正された第1パッチをパッチするように構成される、請求項11に記載のデコーダ(110)。
- 前記デコーダは、
前記オーディオ信号(55)の現在の時間フレーム(75)の基本周波数推定(140)を、データストリーム(135)から取り出すように構成されたデータストリーム抽出器(130)を含み、前記データストリームは、前記少ない数のサブバンドによって符号化されたオーディオ信号(145)をさらに含み、あるいは
基本周波数推定(140)を計算するために、前記コア復号されたオーディオ信号(25)を分析するように構成された基本周波数分析器150を含む、請求項11または請求項12に記載のデコーダ(110)。
- オーディオ信号(55)を符号化するエンコーダ(155)であって、
前記エンコーダ(155)は、
前記オーディオ信号(55)をコア符号化して、前記オーディオ信号(55)に対して少ない数のサブバンドを有するコア符号化されたオーディオ信号(145)を得るように構成されたコアエンコーダ(160)、
前記オーディオ信号(55)、または、前記オーディオ信号のローパスフィルタされたバージョンを分析して、前記オーディオ信号(55)の基本周波数推定(140)を得るための基本周波数分析器(175)、
前記オーディオ信号(55)の特定のサブバンドのパラメータを取り出すように構成されたパラメータ抽出器(165)であって、前記オーディオ信号(55)の前記特定のサブバンドは前記コア符号化されたオーディオ信号(145)に含まれない、パラメータ抽出器(165)、および
前記コア符号化されたオーディオ信号(145)、前記パラメータ(190)及び前記基本周波数推定(140)を含む出力信号(135)を形成するように構成された出力信号形成器(170)
を含む、エンコーダ(155)。
- オーディオ信号(55)を処理する方法(2300)であって、
時間フレームのためのオーディオ信号(55)の位相尺度を計算するステップと、
前記時間フレームのための目標位相尺度を決定するステップと、
処理されたオーディオ信号(90)を得るために、計算された位相尺度および目標位相尺度を使って、前記時間フレームのための前記オーディオ信号(55)の位相を訂正するステップと、を含む、方法。
- オーディオ信号(55)を復号するための方法(2400)であって、
請求項15に記載の処理する方法と、
前記オーディオ信号(55)に対して少ないサブバンド数で、時間フレームの中のオーディオ信号(25)を復号するステップと、
前記少ないサブバンド数の前記復号されたオーディオ信号(25)のサブバンドのセットをパッチするステップであって、前記サブバンドのセットは、正規のサブバンド数のオーディオ信号(55)を得るために、第1パッチを、前記少ない数のサブバンドに隣接する前記時間フレームの中の別のサブバンドに形成するステップと、
請求項15に記載の方法によって、目標関数に従って、前記第1パッチのサブバンド内の位相を訂正するステップと、を含む、方法。
- オーディオ信号(55)を符号化するための方法であって、
前記オーディオ信号(55)に対して少ない数のサブバンドを有するコア符号化されたオーディオ信号を得るために、前記オーディオ信号をコア符号化するステップと、
前記オーディオ信号の基本周波数推定(140)を得るために、前記オーディオ信号(55)または前記オーディオ信号のローパスフィルタされたバージョンを分析するステップと、
前記オーディオ信号(55)の特定のサブバンドのパラメータを引き出すステップであって、前記オーディオ信号(55)の前記特定のサブバンドはコア符号化されたオーディオ信号(145)の中に含まれない、ステップと、
前記コア符号化されたオーディオ信号(145)と前記パラメータ(190)と前記基本周波数推定(140)とを含む出力信号(135)を形成するステップと、を含む、方法。
- コンピュータプログラムがコンピュータ上で実行されるとき、請求項16〜請求項17のいずれか1項に記載の方法を実行するプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14175202.2 | 2014-07-01 | ||
EP14175202 | 2014-07-01 | ||
EP15151478.3A EP2963649A1 (en) | 2014-07-01 | 2015-01-16 | Audio processor and method for processing an audio signal using horizontal phase correction |
EP15151478.3 | 2015-01-16 | ||
PCT/EP2015/064443 WO2016001069A1 (en) | 2014-07-01 | 2015-06-25 | Audio processor and method for processing an audio signal using horizontal phase correction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017525994A JP2017525994A (ja) | 2017-09-07 |
JP6527536B2 true JP6527536B2 (ja) | 2019-06-05 |
Family
ID=52449941
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575802A Active JP6553657B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオプロセッサおよび垂直位相訂正を用いたオーディオ信号を処理する方法 |
JP2016575797A Active JP6535037B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号を復号するためのデコーダおよび方法、並びにオーディオ信号を符号化するためのエンコーダおよび方法 |
JP2016575785A Active JP6458060B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号のための位相訂正データを決定するための計算器および方法 |
JP2016575800A Active JP6527536B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオプロセッサおよび水平位相訂正を用いたオーディオ信号処理方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575802A Active JP6553657B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオプロセッサおよび垂直位相訂正を用いたオーディオ信号を処理する方法 |
JP2016575797A Active JP6535037B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号を復号するためのデコーダおよび方法、並びにオーディオ信号を符号化するためのエンコーダおよび方法 |
JP2016575785A Active JP6458060B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号のための位相訂正データを決定するための計算器および方法 |
Country Status (19)
Country | Link |
---|---|
US (6) | US10529346B2 (ja) |
EP (8) | EP2963646A1 (ja) |
JP (4) | JP6553657B2 (ja) |
KR (4) | KR101944386B1 (ja) |
CN (4) | CN106663439B (ja) |
AR (4) | AR101082A1 (ja) |
AU (7) | AU2015282748B2 (ja) |
BR (3) | BR112016029895A2 (ja) |
CA (6) | CA2953426C (ja) |
ES (4) | ES2677250T3 (ja) |
MX (4) | MX356672B (ja) |
MY (3) | MY182904A (ja) |
PL (3) | PL3164873T3 (ja) |
PT (3) | PT3164873T (ja) |
RU (4) | RU2676414C2 (ja) |
SG (4) | SG11201610837XA (ja) |
TR (2) | TR201810148T4 (ja) |
TW (4) | TWI591619B (ja) |
WO (4) | WO2016001067A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
ES2933287T3 (es) | 2016-04-12 | 2023-02-03 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior |
US10277440B1 (en) * | 2016-10-24 | 2019-04-30 | Marvell International Ltd. | Determining common phase error |
KR102590519B1 (ko) * | 2017-03-03 | 2023-10-17 | 다케다 야쿠힌 고교 가부시키가이샤 | 아데노-연관 바이러스 제제의 효력을 결정하는 방법 |
KR20180104872A (ko) | 2017-03-14 | 2018-09-27 | 현대자동차주식회사 | 주행 상황을 반영하는 주행 제어 시스템에서의 변속 장치 및 방법 |
CN107071689B (zh) * | 2017-04-19 | 2018-12-14 | 音曼(北京)科技有限公司 | 一种方向自适应的空间音频处理方法及系统 |
EP4354984A3 (en) * | 2017-06-16 | 2024-05-08 | Innovative Technology Lab Co., Ltd. | Method and apparatus for indication of synchronization signal block |
WO2019014074A1 (en) * | 2017-07-09 | 2019-01-17 | Selene Photonics, Inc. | ANTIVAL DISTRIBUTION SYSTEMS AND METHODS |
CN107798048A (zh) * | 2017-07-28 | 2018-03-13 | 昆明理工大学 | 一种用于射电日像仪海量数据管理的负数据库管理方法 |
CN107424616B (zh) * | 2017-08-21 | 2020-09-11 | 广东工业大学 | 一种相位谱去除掩模的方法与装置 |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
TWI702594B (zh) | 2018-01-26 | 2020-08-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建技術之回溯相容整合 |
CN110827206B (zh) * | 2018-08-14 | 2024-05-28 | 钰创科技股份有限公司 | 过滤信号的数位滤波器 |
CN111077371B (zh) * | 2018-10-19 | 2021-02-05 | 大唐移动通信设备有限公司 | 一种提高相位测量精度的方法和装置 |
WO2020118123A1 (en) * | 2018-12-05 | 2020-06-11 | Black Lattice Technologies, Inc. | Stochastic linear detection |
WO2020146827A1 (en) * | 2019-01-11 | 2020-07-16 | Boomcloud 360, Inc. | Soundstage-conserving audio channel summation |
CN112532208B (zh) * | 2019-09-18 | 2024-04-05 | 惠州迪芬尼声学科技股份有限公司 | 谐波发生器及用于生成谐波的方法 |
US11158297B2 (en) * | 2020-01-13 | 2021-10-26 | International Business Machines Corporation | Timbre creation system |
CN115552204A (zh) * | 2020-02-20 | 2022-12-30 | 日产自动车株式会社 | 图像处理装置及图像处理方法 |
CN111405419B (zh) * | 2020-03-26 | 2022-02-15 | 海信视像科技股份有限公司 | 音频信号处理方法、装置及可读存储介质 |
CN113259083B (zh) * | 2021-07-13 | 2021-09-28 | 成都德芯数字科技股份有限公司 | 一种调频同步网相位同步方法 |
Family Cites Families (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2631906A (en) * | 1945-01-12 | 1953-03-17 | Automotive Prod Co Ltd | Sealing device for fluid pressure apparatus |
US4802225A (en) * | 1985-01-02 | 1989-01-31 | Medical Research Council | Analysis of non-sinusoidal waveforms |
DE3683767D1 (de) * | 1986-04-30 | 1992-03-12 | Ibm | Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens. |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
US5602959A (en) | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
US5894473A (en) | 1996-02-29 | 1999-04-13 | Ericsson Inc. | Multiple access communications system and method using code and time division |
US5809459A (en) * | 1996-05-21 | 1998-09-15 | Motorola, Inc. | Method and apparatus for speech excitation waveform coding using multiple error waveforms |
GB2319379A (en) * | 1996-11-18 | 1998-05-20 | Secr Defence | Speech processing system |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6226661B1 (en) * | 1998-11-13 | 2001-05-01 | Creative Technology Ltd. | Generation and application of sample rate conversion ratios using distributed jitter |
JP4639441B2 (ja) * | 1999-09-01 | 2011-02-23 | ソニー株式会社 | ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法 |
NL1013500C2 (nl) | 1999-11-05 | 2001-05-08 | Huq Speech Technologies B V | Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. |
GB0001585D0 (en) * | 2000-01-24 | 2000-03-15 | Radioscape Ltd | Method of designing,modelling or fabricating a communications baseband stack |
EP1259955B1 (en) * | 2000-02-29 | 2006-01-11 | QUALCOMM Incorporated | Method and apparatus for tracking the phase of a quasi-periodic signal |
US6701297B2 (en) * | 2001-03-02 | 2004-03-02 | Geoffrey Layton Main | Direct intermediate frequency sampling wavelet-based analog-to-digital and digital-to-analog converter |
US7146503B1 (en) * | 2001-06-04 | 2006-12-05 | At&T Corp. | System and method of watermarking signal |
DE60214027T2 (de) | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
EP1523863A1 (en) | 2002-07-16 | 2005-04-20 | Koninklijke Philips Electronics N.V. | Audio coding |
DE60327039D1 (de) | 2002-07-19 | 2009-05-20 | Nec Corp | Audiodekodierungseinrichtung, dekodierungsverfahren und programm |
JP4227772B2 (ja) * | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
JP4380174B2 (ja) * | 2003-02-27 | 2009-12-09 | 沖電気工業株式会社 | 帯域補正装置 |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
KR20060083202A (ko) * | 2003-09-05 | 2006-07-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 낮은 비트율 오디오 인코딩 |
RU2374703C2 (ru) * | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
FR2865310A1 (fr) * | 2004-01-20 | 2005-07-22 | France Telecom | Procede de restauration de partiels d'un signal sonore |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
US20090299756A1 (en) | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
US20060014299A1 (en) | 2004-04-12 | 2006-01-19 | Troup Jan M | Method for analyzing blood for cholesterol components |
DE102004021404B4 (de) | 2004-04-30 | 2007-05-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wasserzeicheneinbettung |
DE102004021403A1 (de) * | 2004-04-30 | 2005-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung |
US7672835B2 (en) * | 2004-12-24 | 2010-03-02 | Casio Computer Co., Ltd. | Voice analysis/synthesis apparatus and program |
TW200627999A (en) * | 2005-01-05 | 2006-08-01 | Srs Labs Inc | Phase compensation techniques to adjust for speaker deficiencies |
EP1839297B1 (en) | 2005-01-11 | 2018-11-14 | Koninklijke Philips N.V. | Scalable encoding/decoding of audio signals |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7693225B2 (en) | 2005-07-21 | 2010-04-06 | Realtek Semiconductor Corp. | Inter-symbol and inter-carrier interference canceller for multi-carrier modulation receivers |
CN101091209B (zh) * | 2005-09-02 | 2010-06-09 | 日本电气株式会社 | 抑制噪声的方法及装置 |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
US8259840B2 (en) | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
WO2007068861A2 (fr) * | 2005-12-15 | 2007-06-21 | France Telecom | Procede d'estimation de phase pour la modelisation sinusoidale d'un signal numerique |
EP1979899B1 (de) * | 2006-01-31 | 2015-03-11 | Unify GmbH & Co. KG | Verfahren und anordnungen zur audiosignalkodierung |
US7676374B2 (en) * | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
ATE448638T1 (de) * | 2006-04-13 | 2009-11-15 | Fraunhofer Ges Forschung | Audiosignaldekorrelator |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
US7761078B2 (en) * | 2006-07-28 | 2010-07-20 | Qualcomm Incorporated | Dual inductor circuit for multi-band wireless communication device |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
RU2009116279A (ru) * | 2006-09-29 | 2010-11-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) | Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов |
US7831001B2 (en) * | 2006-12-19 | 2010-11-09 | Sigmatel, Inc. | Digital audio processing system and method |
CN101051456B (zh) * | 2007-01-31 | 2010-12-01 | 张建平 | 音频相位检测和自动校正设备 |
KR101131880B1 (ko) | 2007-03-23 | 2012-04-03 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009008068A1 (ja) | 2007-07-11 | 2009-01-15 | Pioneer Corporation | 自動音場補正装置 |
CN101373594A (zh) * | 2007-08-21 | 2009-02-25 | 华为技术有限公司 | 修正音频信号的方法及装置 |
WO2009027886A2 (en) * | 2007-08-28 | 2009-03-05 | Nxp B.V. | A device for and method of processing audio signals |
EP2099027A1 (en) | 2008-03-05 | 2009-09-09 | Deutsche Thomson OHG | Method and apparatus for transforming between different filter bank domains |
KR101230479B1 (ko) * | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
US8036891B2 (en) * | 2008-06-26 | 2011-10-11 | California State University, Fresno | Methods of identification using voice sound analysis |
ES2796552T3 (es) * | 2008-07-11 | 2020-11-27 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
EP2144229A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
EP2345026A1 (en) | 2008-10-03 | 2011-07-20 | Nokia Corporation | Apparatus for binaural audio coding |
WO2010037426A1 (en) | 2008-10-03 | 2010-04-08 | Nokia Corporation | An apparatus |
PL4231290T3 (pl) | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
UA99878C2 (ru) | 2009-01-16 | 2012-10-10 | Долби Интернешнл Аб | Гармоническое преобразование, усовершенствованное перекрестным произведением |
EP2214162A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
EP2234103B1 (en) * | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
RU2452044C1 (ru) * | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
KR101613975B1 (ko) | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
EP2502230B1 (en) | 2009-11-19 | 2014-05-21 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved excitation signal bandwidth extension |
JP5651945B2 (ja) * | 2009-12-04 | 2015-01-14 | ヤマハ株式会社 | 音響処理装置 |
KR102020334B1 (ko) | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
CN102194457B (zh) * | 2010-03-02 | 2013-02-27 | 中兴通讯股份有限公司 | 音频编解码方法、系统及噪声水平估计方法 |
PL2545551T3 (pl) | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
ES2522171T3 (es) | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
KR101412117B1 (ko) * | 2010-03-09 | 2014-06-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 재생 속도 또는 피치를 변경할 때 오디오 신호에서 과도 사운드 이벤트를 처리하기 위한 장치 및 방법 |
CN102214464B (zh) | 2010-04-02 | 2015-02-18 | 飞思卡尔半导体公司 | 音频信号的瞬态检测方法以及基于该方法的时长调整方法 |
CN102314882B (zh) | 2010-06-30 | 2012-10-17 | 华为技术有限公司 | 声音信号通道间延时估计的方法及装置 |
BR112013004362B1 (pt) | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
EP2477188A1 (en) * | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
WO2012131438A1 (en) * | 2011-03-31 | 2012-10-04 | Nokia Corporation | A low band bandwidth extender |
US9031268B2 (en) | 2011-05-09 | 2015-05-12 | Dts, Inc. | Room characterization and correction for multi-channel audio |
US9117440B2 (en) | 2011-05-19 | 2015-08-25 | Dolby International Ab | Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal |
US8990074B2 (en) | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
CN102800317B (zh) | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
US10453479B2 (en) * | 2011-09-23 | 2019-10-22 | Lessac Technologies, Inc. | Methods for aligning expressive speech utterances with text and systems therefor |
JP6051505B2 (ja) | 2011-10-07 | 2016-12-27 | ソニー株式会社 | 音声処理装置および音声処理方法、記録媒体、並びにプログラム |
JP5810903B2 (ja) | 2011-12-27 | 2015-11-11 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
CN103258539B (zh) * | 2012-02-15 | 2015-09-23 | 展讯通信(上海)有限公司 | 一种语音信号特性的变换方法和装置 |
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
WO2014106034A1 (en) | 2012-12-27 | 2014-07-03 | The Regents Of The University Of California | Method for data compression and time-bandwidth product engineering |
WO2014115225A1 (ja) | 2013-01-22 | 2014-07-31 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9881624B2 (en) | 2013-05-15 | 2018-01-30 | Samsung Electronics Co., Ltd. | Method and device for encoding and decoding audio signal |
JP6216553B2 (ja) | 2013-06-27 | 2017-10-18 | クラリオン株式会社 | 伝搬遅延補正装置及び伝搬遅延補正方法 |
US9449594B2 (en) | 2013-09-17 | 2016-09-20 | Intel Corporation | Adaptive phase difference based noise reduction for automatic speech recognition (ASR) |
CN103490678B (zh) * | 2013-10-17 | 2016-06-22 | 双峰格雷斯海姆医药玻璃(丹阳)有限公司 | 主从机同步控制方法及系统 |
KR20160087827A (ko) | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
US9990928B2 (en) * | 2014-05-01 | 2018-06-05 | Digital Voice Systems, Inc. | Audio watermarking via phase modification |
EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
US9933458B2 (en) | 2015-03-31 | 2018-04-03 | Tektronix, Inc. | Band overlay separator |
-
2015
- 2015-01-16 EP EP15151463.5A patent/EP2963646A1/en not_active Withdrawn
- 2015-01-16 EP EP15151478.3A patent/EP2963649A1/en not_active Withdrawn
- 2015-01-16 EP EP15151476.7A patent/EP2963648A1/en not_active Withdrawn
- 2015-01-16 EP EP15151465.0A patent/EP2963645A1/en not_active Withdrawn
- 2015-06-25 JP JP2016575802A patent/JP6553657B2/ja active Active
- 2015-06-25 PT PT15734098T patent/PT3164873T/pt unknown
- 2015-06-25 MY MYPI2016002276A patent/MY182904A/en unknown
- 2015-06-25 WO PCT/EP2015/064436 patent/WO2016001067A1/en active Application Filing
- 2015-06-25 CN CN201580036479.7A patent/CN106663439B/zh active Active
- 2015-06-25 ES ES15731358.6T patent/ES2677250T3/es active Active
- 2015-06-25 CA CA2953426A patent/CA2953426C/en active Active
- 2015-06-25 SG SG11201610837XA patent/SG11201610837XA/en unknown
- 2015-06-25 EP EP15732633.1A patent/EP3164870B1/en active Active
- 2015-06-25 AU AU2015282748A patent/AU2015282748B2/en active Active
- 2015-06-25 CA CA2998044A patent/CA2998044C/en active Active
- 2015-06-25 KR KR1020177002926A patent/KR101944386B1/ko active IP Right Grant
- 2015-06-25 MY MYPI2016002277A patent/MY192221A/en unknown
- 2015-06-25 ES ES15734098.5T patent/ES2683870T3/es active Active
- 2015-06-25 TR TR2018/10148T patent/TR201810148T4/tr unknown
- 2015-06-25 EP EP15734098.5A patent/EP3164873B1/en active Active
- 2015-06-25 JP JP2016575797A patent/JP6535037B2/ja active Active
- 2015-06-25 WO PCT/EP2015/064428 patent/WO2016001066A1/en active Application Filing
- 2015-06-25 CN CN201580036493.7A patent/CN106575510B/zh active Active
- 2015-06-25 SG SG11201610732WA patent/SG11201610732WA/en unknown
- 2015-06-25 KR KR1020177002928A patent/KR101978671B1/ko active IP Right Grant
- 2015-06-25 KR KR1020177002927A patent/KR101958361B1/ko active IP Right Grant
- 2015-06-25 CA CA2999327A patent/CA2999327C/en active Active
- 2015-06-25 KR KR1020177002929A patent/KR102025164B1/ko active IP Right Grant
- 2015-06-25 AU AU2015282746A patent/AU2015282746B2/en active Active
- 2015-06-25 BR BR112016029895A patent/BR112016029895A2/pt not_active Application Discontinuation
- 2015-06-25 CN CN201580036465.5A patent/CN106537498B/zh active Active
- 2015-06-25 CN CN201580036475.9A patent/CN106663438B/zh active Active
- 2015-06-25 CA CA2953421A patent/CA2953421C/en active Active
- 2015-06-25 MX MX2016016758A patent/MX356672B/es active IP Right Grant
- 2015-06-25 WO PCT/EP2015/064439 patent/WO2016001068A1/en active Application Filing
- 2015-06-25 MY MYPI2016002294A patent/MY182840A/en unknown
- 2015-06-25 AU AU2015282749A patent/AU2015282749B2/en active Active
- 2015-06-25 MX MX2016016770A patent/MX354659B/es active IP Right Grant
- 2015-06-25 SG SG11201610704VA patent/SG11201610704VA/en unknown
- 2015-06-25 EP EP15731358.6A patent/EP3164869B1/en active Active
- 2015-06-25 ES ES15732633.1T patent/ES2677524T3/es active Active
- 2015-06-25 BR BR112016030343-1A patent/BR112016030343B1/pt active IP Right Grant
- 2015-06-25 MX MX2016017286A patent/MX364198B/es active IP Right Grant
- 2015-06-25 WO PCT/EP2015/064443 patent/WO2016001069A1/en active Application Filing
- 2015-06-25 RU RU2017103107A patent/RU2676414C2/ru active
- 2015-06-25 RU RU2017103102A patent/RU2676416C2/ru active
- 2015-06-25 CA CA2953413A patent/CA2953413C/en active Active
- 2015-06-25 SG SG11201610836TA patent/SG11201610836TA/en unknown
- 2015-06-25 EP EP15732231.4A patent/EP3164872B1/en active Active
- 2015-06-25 PT PT157326331T patent/PT3164870T/pt unknown
- 2015-06-25 TR TR2018/09988T patent/TR201809988T4/tr unknown
- 2015-06-25 ES ES15732231.4T patent/ES2678894T3/es active Active
- 2015-06-25 PL PL15734098T patent/PL3164873T3/pl unknown
- 2015-06-25 MX MX2016016897A patent/MX359035B/es active IP Right Grant
- 2015-06-25 BR BR112016030149-8A patent/BR112016030149B1/pt active IP Right Grant
- 2015-06-25 AU AU2015282747A patent/AU2015282747B2/en active Active
- 2015-06-25 PT PT157313586T patent/PT3164869T/pt unknown
- 2015-06-25 PL PL15731358T patent/PL3164869T3/pl unknown
- 2015-06-25 PL PL15732633T patent/PL3164870T3/pl unknown
- 2015-06-25 JP JP2016575785A patent/JP6458060B2/ja active Active
- 2015-06-25 JP JP2016575800A patent/JP6527536B2/ja active Active
- 2015-06-25 CA CA2953427A patent/CA2953427C/en active Active
- 2015-06-25 RU RU2017103101A patent/RU2676899C2/ru active
- 2015-06-25 RU RU2017103100A patent/RU2675151C2/ru active
- 2015-06-26 TW TW104120798A patent/TWI591619B/zh active
- 2015-06-26 TW TW104120801A patent/TWI587289B/zh active
- 2015-06-26 TW TW104120799A patent/TWI587292B/zh active
- 2015-06-26 TW TW104120800A patent/TWI587288B/zh active
- 2015-07-01 AR ARP150102110A patent/AR101082A1/es active IP Right Grant
- 2015-07-01 AR ARP150102109A patent/AR101044A1/es active IP Right Grant
- 2015-07-01 AR ARP150102112A patent/AR101084A1/es active IP Right Grant
- 2015-07-01 AR ARP150102111A patent/AR101083A1/es unknown
-
2016
- 2016-12-28 US US15/392,459 patent/US10529346B2/en active Active
- 2016-12-28 US US15/392,425 patent/US10140997B2/en active Active
- 2016-12-28 US US15/392,776 patent/US10192561B2/en active Active
- 2016-12-28 US US15/392,485 patent/US10283130B2/en active Active
-
2017
- 2017-11-15 AU AU2017261514A patent/AU2017261514B2/en active Active
-
2018
- 2018-05-16 AU AU2018203475A patent/AU2018203475B2/en active Active
- 2018-06-29 AU AU2018204782A patent/AU2018204782B2/en active Active
- 2018-12-04 US US16/209,571 patent/US10770083B2/en active Active
-
2019
- 2019-01-27 US US16/258,604 patent/US10930292B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6527536B2 (ja) | オーディオプロセッサおよび水平位相訂正を用いたオーディオ信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180502 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180925 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190402 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190510 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6527536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |