JP6553657B2 - オーディオプロセッサおよび垂直位相訂正を用いたオーディオ信号を処理する方法 - Google Patents
オーディオプロセッサおよび垂直位相訂正を用いたオーディオ信号を処理する方法 Download PDFInfo
- Publication number
- JP6553657B2 JP6553657B2 JP2016575802A JP2016575802A JP6553657B2 JP 6553657 B2 JP6553657 B2 JP 6553657B2 JP 2016575802 A JP2016575802 A JP 2016575802A JP 2016575802 A JP2016575802 A JP 2016575802A JP 6553657 B2 JP6553657 B2 JP 6553657B2
- Authority
- JP
- Japan
- Prior art keywords
- phase
- signal
- frequency
- audio signal
- patch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 403
- 238000012937 correction Methods 0.000 title claims description 232
- 238000000034 method Methods 0.000 title claims description 122
- 238000012545 processing Methods 0.000 title claims description 47
- 238000001228 spectrum Methods 0.000 claims description 112
- 230000001052 transient effect Effects 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 29
- 230000002829 reductive effect Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 16
- 230000002194 synthesizing effect Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 50
- 230000002123 temporal effect Effects 0.000 description 41
- 238000004422 calculation algorithm Methods 0.000 description 28
- 230000000694 effects Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 15
- 230000004913 activation Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000013459 approach Methods 0.000 description 10
- 230000008447 perception Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000036961 partial effect Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 241000282412 Homo Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004321 preservation Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 229910001369 Brass Inorganic materials 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Amplifiers (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Television Receiver Circuits (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
年代に見られる知覚オーディオ符号化は、知覚の効果の公言された利用を通して、時間/周波数領域処理と冗長性縮小(エントロピー符号化)と不適切除去との使用を含む、いくつかの共通のテーマに続いている[非特許文献1]。一般に、入力信号は、時間領域信号をスペクトル(時間/周波数)表現に変換する分析フィルタバンクによって分析される。スペクトル係数への変換は、それらの周波数内容に依存している信号コンポーネント(例えば、それらの個々の倍音構造を有する種々の器具)を選択的に処理することを許す。
フィルタバンクに基づく知覚オーディオ符号化において、消費されたビット転送速度の大部分は、通常、量子化されたスペクトル係数に費やされる。従って、非常に低いビット転送速度では、十分なビットが、知覚的に損なわれていない再生を達成するために必要な
精度において、全ての係数を表現するように入手できない。従って、低いビット転送速度要件は、知覚オーディオ符号化によって得られるオーディオバンド幅に対して、有効に制限する。バンド幅拡張[非特許文献2]は、この長年の根本的制限を取り除く。バンド幅拡張の中心的アイデアは、コンパクトなパラメータ形式において、失った高周波数の内容を伝送して修復させる追加の高周波プロセッサによって、バンドを制限された知覚符号器を補足することである。高周波数の内容は、ベースバンド信号の1つのサイドバンド変調に基づいて、または、スペクトルバンド複製(SBR)[非特許文献3]において使われたようなコピーアップ技術に基づいて、または、例えばボコーダー[非特許文献4]のようなピッチシフト技術の応用に基づいて生成される。
時間伸長化またはピッチシフト化効果は、通常、同期したオーバーラップ加算(SOLA)のような時間領域技術または周波数領域技術(ボコーダー)を適用することによって得られる。また、ハイブリッドシステムは、サブバンドにおいて処理しているSOLAを適用することを提案している。ボコーダーおよびハイブリッドシステムは、通常、垂直位相コヒーレンスの損失に帰される位相性(フェージネス、[非特許文献8])と呼ばれる人工物から損害を被る。いくつかの出版物は、重要な垂直位相コヒーレンスを守ることによる時間伸長化アルゴリズムの音質についての改良に関係する([非特許文献7]、[非特許文献6])。
る。
位相尺度とを決定する。さらに、位相エラー計算器は、位相エラーのベクトルを形成する。ベクトルの第1要素は、第1サブバンド信号の位相および第1目標位相尺度の第1偏差と呼ぶ。ベクトルの第2要素は、第2サブバンド信号の位相および第2目標位相尺度の第2偏差と呼ぶ。さらに、この実施の形態のオーディオプロセッサは、訂正第1サブバンド信号および訂正第2サブバンド信号を使って、訂正オーディオ信号を合成するためのオーディオ信号シンセサイザーを含む。この位相訂正は、平均の訂正位相値を作成する。
目標スペクトルとの間の差を減らして実行される。付加的に、デコーダは、時間フレームのための訂正位相を使って、第1時間フレームのためのオーディオサブバンド信号を計算すると共に、第2時間フレームの中のサブバンド信号の尺度を使うか、または前記位相訂正アルゴリズムと異なる別の位相訂正アルゴリズムに従って訂正位相計算を使って、第1時間フレームと異なる第2時間フレームのためのオーディオサブバンド信号を計算するためのオーディオサブバンド信号計算器を含む。
知覚オーディオ符号化は、制限された容量で、送信または格納チャンネルを使って、顧客にオーディオおよびマルチメディアを提供する応用の全てのタイプのためにデジタル技術をもたらす主流として急増した。現代知覚オーディオ符号器は、ますます低いビット転送速度で、満足するオーディオの品質を派生することが必要とされる。それは、次々と、多数の聴衆によって殆んど耐えられる特定の符号化人工物を我慢する必要がある。オーディオバンド幅拡張(BWE)は、特定の人工物を導入する価格で、送信された低バンド信号部分のスペクトル変換または交換によって、オーディオ符号器の周波数範囲を高バンドに人工的に拡張する技術である。
ピーすることによって得られる。処理は、複雑に組み立てられた求積法鏡フィルタバンク(QMF)[非特許文献10]領域で通常実行される。それは、以下においても推定される。コピーアップされた信号は、送信されたパラメータに基づいて、最適ゲインでそれのマグニチュードスペクトルを乗算することによって処理される。目的は、オリジナル信号のそれとして、同様のマグニチュードスペクトルを得ることである。それどころか、コピーアップされた信号の位相スペクトルは一般に全然処理されないけれども、代わりに、コピーアップされた位相スペクトルは直接に使われる。
1.位相デリバティブ訂正の「重要性」の定量化
2.垂直(「周波数」)位相デリバティブ訂正または水平(「時間」)位相デリバティブ訂正の信号依存優先度付け
3.訂正方向(「周波数」または「時間」)の信号依存切り替え
4.トランジェントのための専念された垂直位相デリバティブ訂正モード
5.平滑な訂正のための安定したパラメータの取得
6.訂正パラメータのコンパクトなサイド情報送信形式
mが離散的な時間である時間領域信号x(m)は、例えば複雑に組み立てられた求積法鏡フィルタバンク(QMF)を使って、時間周波数領域の中で提示される。結果として生じる信号は、X(k,n)である。kは周波数バンドインデックスであり、nは時間的(temporal)フレームインデックスである。64個のバンドのQMFおよび48kHzのサンプリング周波数fsは、視覚化および実施の形態のために推定される。従って
、個々の周波数バンドのバンド幅fBWは375Hzであり、時間的ホップサイズthop(
図2の中の17)は1.33ミリ秒である。しかし、処理はそのような変換に制限されない。代わりに、MDCT(修正された離散コサイン変換)またはDFT(離散フーリエ変換)が使われてもよい。
トXpha(k,n)と、を使って提示もできる。
Bは、対応する位相スペクトルXpha(k,n)を示す。両者は、QMF領域内である。
さらに、図1Cは、トロンボーン信号のマグニチュードスペクトルXmag(k,n)を示
す。図1Dは、また、対応するQMF領域内の、対応する位相スペクトルを示す。図1Aおよび図1Cのマグニチュードスペクトルについて、色勾配は、赤色=0dBから青色=−80dBまでのマグニチュードを示す。さらに、図1Bおよび図1Dの位相スペクトルに対して、色勾配は、赤色=πから青色=−πまでの位相を示す。
説明されるオーディオ処理の効果を示すために用いられるオーディオデータは、トロンボーンのオーディオ信号に対して「トロンボーン」と名付けられ、バイオリンのオーディオ信号に対して「バイオリン」と名付けられ、そして、途中で追加された拍手を伴うバイオリン信号に対して「バイオリン+拍手」と名付けられる。
図2は、時間フレーム15とサブバンド20とにより定義された時間周波数タイル10(例えば、QMFビン、求積法鏡フィルタバンクビン)を含む時間周波数グラフ5を示す。オーディオ信号は、QMF(求積法鏡フィルタバンク)変換、または、MDCT(修正された離散コサイン変換)、または、DFT(離散フーリエ変換)を使って、時間周波数表現に変換される。時間フレームの中のオーディオ信号の分割は、オーディオ信号のオーバーラップしている部分から成る。図2の下の部分において、時間フレーム15の1つのオーバーラップが示される。最大2つの時間フレームが同時にオーバーラップする。さらに、仮により多くの冗長性が必要であるならば、オーディオ信号は、さらに複数のオーバーラップを使って分割される。複数のオーバーラップアルゴリズムにおいて、3つ以上の時間フレームは、特定の時間ポイントにてオーディオ信号の同じ部分を含む。オーバーラップの期間はホップサイズthop17である。
のために、たとえ別の処理が、推定された場合に制限されないと見える必要があっても、符号化は、どのような点においても信号を修正しないと推定される。
ここで、Yraw(k,n,i)は、周波数パッチiのための複雑なQMF信号である。
生の周波数パッチ信号は、送信されたメタデータに従って、ゲインg(k,n,i)とそれらを乗算させることによって処理される。
)25を反映する。ベースバンドXbase(k,n)30は、そこから、2番目から7番目までのサブバンドを選択することによって引き出される。図3Aは、オリジナルのオーディオ信号、すなわち送信または符号化の前のオーディオ信号を示す。図3Bは、受信後、例えば中間的なステップで復号プロセス中のオーディオ信号の例示的な周波数表現を示す。オーディオ信号の周波数スペクトルは、送信された周波数バンド25と、ベースバンドの周波数より高い周波数を構成するオーディオ信号32を形成している周波数スペクトルのより高いサブバンドにコピーされた7個のベースバンド信号30と、を含む。完全なベースバンド信号は、周波数パッチとも呼ばれる。図3Cは、再構成されたオーディオ信号Z(k,n)35を示す。図3Bに比べて、ベースバンド信号のパッチは、ゲインファクターによって個々に増加される。従って、オーディオ信号の周波数スペクトルは、主要な周波数スペクトル25と、複数のマグニチュード訂正パッチY(k,n,1)40と、を含む。このパッチ化方法は、直接コピーアップパッチ化と呼ばれる。たとえ本発明がそのようなパッチ化アルゴリズムに制限されなくても、直接コピーアップパッチは、本発明を説明するために例示的に用いられる。使われる別のパッチ化アルゴリズムは、例えば高調波パッチ化アルゴリズムである。
いて示される。図4Bは、対応する位相スペクトルZpha(k,n)を示す。図4Cおよ
び図4Dは、トロンボーン信号のための対応するスペクトルを示す。全ての信号はQMF領域の中で提供される。図1において既に示されているように、色勾配は、赤色=0dBから青色=−80dBまでのマグニチュードと、赤色=πから青色=−πまでの位相を示す。それらの位相スペクトルが、オリジナル信号のスペクトルと異なる、ことが認められる(図1を参照のこと)。SBRのため、バイオリンは不調和性を含むことに気づかれ、トロンボーンはクロスオーバー周波数で組み立てられる雑音を含むことに気づかれる。しかし、位相プロットは全くランダムに見え、それらがどれほど違うか、および、違いの知覚的効果が何であるか、を言うことは本当に難しい。さらに、この種類のランダムなデータのために送られる訂正データは、低いビット転送速度を必要とする符号化応用において、適さない。従って、位相スペクトルの知覚的効果を理解すること、および、それらを説明することに対する利点を見付けることが必要である。これらの話題は、以下の節で議論される。
しばしば、周波数バンドのインデックスが単一のト−ンコンポーネントの周波数を定義し、マグニチュードがそれのレベルを定義し、位相がそれの「タイミング」を定義することが考えられる。しかし、QMFバンドのバンド幅は相対的に大きく、データは過剰にサンプリングされる。従って、時間周波数タイル(すなわち、QMFビン)間の相互作用は、実際、これらの特性の全てを定義する。
(3,1)=1およびXpha(3,1)=0またはπ/2またはπは、図5において記載
される。結果は、13.3ミリ秒の長さを有する正弦状関数である。関数の正確な形は、位相パラメータによって定義される。
によって、正弦曲線が作成される。結果として生じる信号(すなわち、逆QMF変換の後の時間領域信号)は、α=π/4(上方)と3π/4(下方)の値によって、図6において示される。正弦曲線の周波数は、位相変化により影響されることが認められる。信号の周波数領域は図6の右側に示される。信号の時間領域は図6の左側に示される。
によって、トランジェントが作成される。結果として生じる信号(すなわち、逆QMF変換の後の時間領域信号)は、α=π/4(上方)と3π/4(下方)の値によって図9において示される。トランジェントの時間的位置は、位相変化により影響されることが認められる。周波数領域は図9の右側に示される。信号の時間領域は図9の左側に示される。
4節で議論されたように、位相スペクトルそれ自体は、全く乱雑に見え、その知覚への効果が何であるかを直接見ることは難しい。5節は、QMF領域の位相スペクトルを処理することによって引き起こされる2つの効果を提示した:(a)時間上の一定の位相変化は正弦曲線を作り出し、位相変化の量は正弦曲線の周波数を制御する、そして、(b)周波数上の一定の位相変化はトランジェントを生み出し、位相変化の量はトランジェントの時間的位置を制御する。
そして、周波数上の位相デリバティブ(PDF)を計算すること、
によって推定される。
される。
波数上の位相デリバティブXpdf(k,n)を示す。図12Cおよび図12Dは、それぞ
れ、トロンボーン信号のための時間上の位相デリバティブおよび周波数上の位相デリバティブを示す。色勾配は、赤色=πから青色=−πまでの位相値を示す。バイオリンに対して、マグニチュードスペクトルは、基本的に約0.13秒までの雑音(図1を参照のこと)であり、それゆえ、デリバティブも雑音的である。約0.13秒のXpdtからの開始は
、時間上の相対的に安定した値を有するように見える。これは、信号が、強く、相対的に安定した正弦曲線を含むことを意味する。これらの正弦曲線の周波数は、Xpdt値によっ
て決定される。それどころか、Xpdfプロットは相対的に騒々しく見える。従って、関連
したデータは、バイオリンに対して、それを使って全然見つけられない。
音は、2つのカテゴリー:高調波信号と雑音状信号とに、粗く分けられる。雑音状信号は、既に定義によって雑音的な位相特性を有する。従って、SBRにより引き起こされた位相エラーは、それらによって知覚的に重要でないと推定される。代わりに、それは高調波信号に集中される。殆どの楽器とスピーチが、信号に対して高調波構造を作成する。すなわち、トーンは、基本周波数によって、周波数の中で間隔をおいて配置された強い正弦曲線コンポーネントを含む。
ここで、fcは、バンド(kHzにおいて)の中心周波数である。4節で議論されたよ
うに、ベースバンドとSBRパッチとの間のクロスオーバー周波数は、約3kHzである。これらの周波数で、ERBは約350Hzである。QMF周波数バンドのバンド幅は、実際、これに相対的に近く、375Hzである。ここに、QMF周波数バンドのバンド幅は、興味ある周波数でERBに続くように推定される。
7節において、人間は解決された高調波の周波数の中のエラーに敏感である、ことに注目された。さらに、仮に基本周波数が低く、高調波が周波数上で位置合わせされるならば、人間は高調波の時間的位置の中のエラーに敏感である。SBRは、6節で議論されたように、これらのエラーの両方を引き起こす。従って、知覚の品質は、それらを訂正することによって改良される。そうする方法が、この節において提案される。
7節で議論されたように、1つのERBの内側に唯一の高調波が存在するとき、人間は、たいてい高調波の周波数の中のエラーを知覚できる。さらに、QMF周波数バンドのバンド幅は、最初のクロスオーバーでERBを推定するために用いられる。ここに、1つの周波数バンドの内側に1つの高調波が存在するときだけ、周波数は訂正される必要がある
。5節が、仮に1つのバンド当たり1つの高調波が存在するならば、生み出されたPDT値は安定しているか、または、時間上ゆっくり変化し、低いビット転送速度を使って潜在的に訂正されることを示したので、これは非常に便利である。
バンド95aのための第1偏差105aと呼ばれる。ベクトルの第2要素は、前の時間フレーム75aから現在の時間フレーム75bまでの、複数のサブバンドの第2サブバンド95bのための第2偏差105bと呼ばれる。さらに、位相訂正器70は、偏差105のベクトルを、オーディオ信号55の位相45に適用できる。ベクトルの第1要素は、オーディオ信号55の複数のサブバンドの第1サブバンド95aの中のオーディオ信号55の位相45aに適用される。ベクトルの第2要素は、オーディオ信号55の複数のサブバンドの第2サブバンド95bの中のオーディオ信号55の位相45bに適用される。
ータ応用器125によって、オーディオ信号のマグニチュード訂正をさらに含む。さらに、オーディオプロセッサは、正規のオーディオファイルを得るために、オーディオ信号のサブバンドを組み合わせるための、すなわち合成するためのシンセサイザー100(例えば、合成フィルタバンク)を含む。
前述したように、仮に高調波が周波数上で同期し、かつ、基本周波数が低いならば、人間は、高調波の時間的位置の中のエラーを知覚することができる。5節では、仮に周波数上の位相デリバティブが、QMF領域において一定であるならば、高調波が同期することが示された。従って、個々の周波数バンドの中に、少なくともに1つの高調波を有するこ
とは、有利である。さもなければ、「空の」周波数バンドは、ランダムな位相を有し、この尺度を妨害する。幸運にも、人間は、基本周波数が低い時にだけ、高調波の時間的な位置に敏感である(7節を参照のこと)。従って、周波数上の位相デリバティブは、高調波の時間的な動きのため、知覚的に重要な効果を決定するための尺度として使われる。
50´を含み、受信された位相デリバティブまたは周波数を使って、オーディオ信号32の中のトランジェントを訂正する。さらに、図31のデコーダ110´は、図19のデコーダ110と同様であることに注目する必要がある。その結果、主要な要素についての説明が、オーディオプロセッサ50とオーディオプロセッサ50´との違いに関連しないこれらの場合において、相互に交換可能である。
の点で、目標位相スペクトルは、入力信号のそれに等しいと推定される。
8.1節および8.2節は、SBR−引き起こされた位相エラーが、PDT訂正をバイオリンに適用すると共にPDF訂正をトロンボーンに適用することによって訂正できることを示した。しかし、それは、どのように、訂正のうちの1つが未知の信号に適用されるべきであるか、または、それらのうちのどれが適用されるべきであるかを知る方法は、考慮されなかった。この節は、訂正方向を自動的に選択するための方法を提案する。訂正方向(水平/垂直)は、入力信号の位相デリバティブのバリエーションに基づいて決められる。
は、対応する時間フレームと窓化関数とを使って計算される。さらに、バリエーション決定器275は、第2バリエーション290bを決定するとき、現在の、複数の前のおよび複数の未来の時間フレーム75に亘って標準偏差尺度を平滑化するように構成される。平滑化は、対応する時間フレーム75と窓化関数とを使って計算されたエネルギーに従って、重み付けされる。従って、バリエーション比較器280は、平滑化された平均標準偏差尺度を、第1バリエーションモードを使って決定された第1バリエーション290aと比較すると共に、平滑化された標準偏差尺度を、第2バリエーションモードを使って決定された第2バリエーション290bと比較する。
、第1バリエーションモードにおいて決定された第1バリエーション290aが、第2バリエーションモードにおいて決定された第2バリエーション290bより小さいかまたは等しいならば、第1バリエーションモードに従って位相訂正データ295を計算する。従って、位相訂正データ295は、仮にトランジェントの不在が検出され、かつ、第2バリエーションモードにおいて決定された第2バリエーション290bが、第1バリエーションモードにおいて決定された第1バリエーション290aより小さいならば、第2バリエーションモードに従って計算される。
そして、周波数上の位相デリバティブのSTDは、式(28)として計算できる。
ここで、circstd{}は、円STDを計算すること示す(角度値は、雑音の低エネルギービンのため、高いSTDを避けるために、エネルギーによって潜在的に重み付けされる。または、STD計算は、十分なエネルギーによってビンに限定される)。バイオリンのSTDは図43Aと図43Bとにおいて示され、トロンボーンのSTDは図43Cと図43Dとにおいて示される。図43Aと図43Cとは、QMF領域の中の時間上の位相デリバティブの標準偏差Xstdt(k,n)を示す。図43Bと図43Dとは、位相訂正無しで、対応する周波数上の標準偏差Xstdf(n)を示す。色勾配は、赤色=1から青色=0までの値を示す。PDFのSTDが、トロンボーンに対して、より低いのに対して、PDTのSTDが、バイオリンに対して、より低いこと、が認められる(特に、高いエネルギーを有する時間周波数タイルに対して)。
途中で加えられた拍手を有するバイオリン信号は、図44において提供される。QMF領域のバイオリン+拍手信号のマグニチュードXmag(k,n)は、図44Aにおいて示
される。対応する位相スペクトルXpha(k,n)は、図44Bにおいて示される。図4
4Aに関して、色勾配は、赤色=0dBから青色=−80dBまでのマグニチュード値を示す。従って、図44Bに対して、位相勾配は、赤色=πから青色=−πまでの位相値を示す。時間上および周波数上の位相デリバティブは、図45において提供される。QMF領域のバイオリン+拍手信号の時間上の位相デリバティブXpdt(k,n)は、図45A
において示される。対応する周波数上の位相デリバティブXpdf(k,n)は、図45B
において示される。色勾配は、赤色=πから青色=−πまでの位相値を示す。PDTは拍手のために雑音的であるけれども、PDFは少なくとも高周波数で多少平滑である、と認められる。従って、PDF訂正は、その鋭さを維持するために、拍手に対して適用されるべきである。しかし、バイオリン音が、低周波数にてデリバティブを妨害しているので、8.2節の中で提案された訂正方法は、この信号によって適切に働かない。結果として、ベースバンドの位相スペクトルは高周波数を反映せず、従って、単一の値を使う周波数パッチの位相訂正は働かない。さらに、PDF値(8.3節を参照のこと)のバリエーションに基づいてトランジェントを検出することは、低周波数にて雑音的なPDF値のため困難である。
計算される。
れる。図47Bは、対応する周波数上の位相デリバティブXpdf(k,n)を示す。また
、色勾配は、赤色=πから青色=−πまでの位相値を示す。直接コピーアップに比較された差は、大きくないけれども、位相訂正拍手は、オリジナル信号と同じ鋭さ有することが知覚される。ゆえに、トランジェント訂正は、直接コピーアップだけが可能である全ての場合に、必ずしも必要であるわけではない。それどころか、仮にPDT訂正が可能ならば、PDT訂正が、トランジェントを違った形で厳しく不鮮明にするので、トランジェント処理を有することは重要である。
8節は、位相エラーが訂正できることを示したけれども、訂正のために適正なビット転送速度は全然考慮されなかった。この節は、低いビット転送速度によって訂正データを表現する方法を提案する。
5節で議論されたように、時間上の位相デリバティブは、基本的に、作成された正弦曲線の周波数を意味する。適用された64バンド複合QMFのPDTは、以下の式(34)を使って周波数に変えられる。
内側にある。fc(k)は周波数バンドkの中心周波数であり、fBWは375Hzである
。結果は、バイオリン信号のためのQMFバンドの周波数Xfreq(k,n)の時間周波数表現において、図47に示される。周波数は、ト−ンの基本周波数の倍数に続いているように見え、従って、高調波は、基本周波数によって、周波数の中に間隔をおいて配置されていることが認められる。さらに、ビブラートは周波数変調を引き起こすように見える。
ピークの位置は、成功したPDF訂正を実行するために推定される必要がある。1つの解決策は、式(34)と同様に、PDF値を使ってピークの位置を計算し、推定された基本周波数を使って、間のピークの位置を推定することである。しかし、このアプローチは、相対的に安定した基本的周波数推定を必要とする。実施の形態は、提案された圧縮アプローチが可能であることを示す、簡単に速く実施する、代わりの方法を示す。
51Bの信号は、例えば図30に関して説明されたパルス列265である。アルゴリズムは、波形の中のピークの位置を分析することによって開始する。これは、局部的な最大を検索することによって実行される。個々の27ミリ秒に対して(すなわち、個々の20個のQMFフレームに対して)、フレームの中心点に最も近いピークの位置が送信される。送信されたピーク位置の間において、ピークは時間内に均等に間隔をおいて配置されると推定される。従って、基本周波数を知ることによって、ピークの位置が推定される。この実施の形態において、検出されたピークの数が送信される。(これが、全てのピークの成功した検出を必要とすることは注目するべきである。基本的周波数に基づく推定は、たぶん、より頑強な結果を産む。)結果として生じるビット転送速度は、約0.5kbpsである(エントロピー符号化のように、どんな圧縮も無しで)。それは、9ビットを使って、全ての27ミリ秒に対して、ピークの位置を送信すること、および、4ビットを使って、間のトランジェントの数を送信すること、を含む。この精度は、非量子化と等しい知覚された品質を生むために見付けられた。しかし、重要なことに、より低いビット転送速度が、たぶん、十分に良好な知覚された品質を生む多くの場合に使われる。
するべきである。従って、基本周波数は相対的に低いビット転送速度によって送信される。
第1位相訂正器
70aは、位相訂正アルゴリズムによって決定されたオーディオ信号32の第1時間フレームの中のサブバンド信号の位相45を訂正する。訂正は、オーディオ信号32の第1時間フレームのサブバンド信号の尺度と、目標スペクトル85´´との間の差を、減らすことによって実行される。オーディオサブバンド信号計算器350は、時間フレームのための訂正位相91aを使って、第1時間フレームのためのオーディオサブバンド信号355を計算する。あるいは、オーディオサブバンド信号計算器350は、第2時間フレームの中のサブバンド信号の尺度85a´´を使うか、または、前記位相訂正アルゴリズムとは異なる別の位相訂正アルゴリズムに従って訂正位相計算を使って、第1時間フレームとは異なる第2時間フレームのためのオーディオサブバンド信号355を計算する。図53は
、さらに、マグニチュード47および位相45に関して、オーディオ信号32を任意に分析する分析器360を示す。別の位相訂正アルゴリズムは、第2位相訂正器70bまたは第3位相訂正器70cにおいて実行される。これらの別の位相訂正器は、図54に関して説明されるだろう。オーディオサブバンド信号計算器250は、第1時間フレームのための訂正位相91と第1時間フレームのオーディオサブバンド信号のマグニチュード値47とを使って、第1時間フレームのためのオーディオサブバンド信号を計算する。マグニチュード値47は、第1時間フレームの中のオーディオ信号32のマグニチュード、または、第1時間フレームの中のオーディオ信号35の処理されたマグニチュードである。
る。活性化データに基づいて、目標スペクトルの計算は、正しい訂正モードに対して活性化される(他の訂正モードは待機する)。目標スペクトルを使って、位相訂正は、要求された訂正モードを使って、受信されたBWE信号に対して実行される。水平訂正70aが、再帰的に(すなわち、前の信号フレームに依存して)実行されると、それは、別の訂正モード70bおよび70cから、前の訂正マトリクスも受信する、ことは注目するべきである。最後に、訂正信号、または、無処理の信号が、活性化データに基づいて出力に設定される。
をコア符号化する。パラメータ抽出器165は、コア符号化されたオーディオ信号に含まれないサブバンドの第2セットのための低解像度パラメータ表現を得るために、パラメータ190を、オーディオ信号55から取り出す。出力信号形成器170は、パラメータ190と、コア符号化されたオーディオ信号145と、位相訂正データ295´と、を含む出力信号135を形成する。任意に、エンコーダ155´´は、オーディオ信号55をコア符号化する前のローパスフィルタ180と、パラメータ190をオーディオ信号55から取り出す前のハイパスフィルタ185とを含む。あるいは、オーディオ信号55をローパスフィルタまたはハイパスフィルタする代わりに、ギャップを満たすアルゴリズムが使われる。コアエンコーダ160は、数が減らされたサブバンドをコア符号化する。サブバンドのセット内の少なくとも1つのサブバンドが、コア符号化されない。さらに、パラメータ抽出器165は、パラメータ190を、コアエンコーダ160によって符号化されなかった少なくとも1つのサブバンドから取り出す。
。
、または、ベースバンド信号Xbase(k,n)30、または、オリジナルのオーディオ信号と比較されるときに、より高い周波数32を含む処理されたオーディオ信号、または、再構成されたオーディオ信号35、または、マグニチュード訂正周波数パッチY(k,n,i)40、または、オーディオ信号の位相45、または、オーディオ信号のマグニチュード47に対して、一般用語として使われる、ことに注目する必要がある。従って、異なるオーディオ信号は、実施の形態の文脈のために、相互に交換される。
た面も、対応するブロックの説明または対応する装置のアイテムまたは特徴を表している。方法ステップのうちのいくつかまたは全てが、例えばマイクロプロセッサまたはプログラム可能なコンピュータまたは電子回路のような、ハードウェア装置によって(を使って)実行される。いくつかの実施の形態において、最も重要な方法ステップのうちの1つ以上は、そのような装置によって実行される。
ンピュータプログラムをインストールしているコンピュータを含む。
Claims (20)
- オーディオ信号(55)を処理するためのオーディオプロセッサ(50´)であって、
時間フレーム(75)の中の前記オーディオ信号(55)のための目標位相尺度(85´)を決定するための目標位相尺度決定器(65´)と、
前記時間フレーム(75)の中の前記オーディオ信号(55)の位相と前記目標位相尺度(85´)とを使って、位相エラー(105´)を計算するための位相エラー計算器(200)と、
前記位相エラー(105´)を使って、前記時間フレームの中の前記オーディオ信号(55)の前記位相を訂正するように構成される、位相訂正器(70´)と、
を含む、オーディオプロセッサ。 - 前記オーディオ信号(55)は、前記時間フレーム(75)のための複数のサブバンド(95)を含み、
前記目標位相尺度決定器(65´)は、第1サブバンド信号(95a)のための第1目標位相尺度(85a´)と、第2サブバンド信号(95b)のための第2目標位相尺度(85b´)とを決定するように構成され、
前記位相エラー計算器(200)は、位相エラー(105´)のベクトルを形成するように構成され、前記ベクトルの第1要素は、前記第1サブバンド信号(95a)の前記位相と前記第1目標位相尺度(85a´)との第1偏差(105a´)を参照し、前記ベクトルの第2要素は、前記第2サブバンド信号(95b)の前記位相と前記第2目標位相尺度(85b´)との第2偏差(105b´)を参照し、
訂正第1サブバンド信号(90a´)および訂正第2サブバンド信号(90b´)を使って、訂正オーディオ信号(90´)を合成するためのオーディオ信号シンセサイザー(100)を含む、請求項1に記載のオーディオプロセッサ。 - 複数のサブバンド(95)は、ベースバンド(30)と周波数パッチ(40)のセットにグループ化され、前記ベースバンド(30)は、前記オーディオ信号(55)の1つのサブバンド(95)を含み、そして、周波数パッチ(40)の前記セットは、前記ベースバンドの前記サブバンド(95)の周波数より高い周波数で、前記ベースバンド(30)の少なくとも1つのサブバンドを含み、
前記位相エラー計算器(200)は、平均位相エラー(105´´)を得るために、周波数パッチ(40)の前記セットの第1パッチ(40a)を参照する位相エラー(105´)のベクトルの要素の平均を計算するように構成され、
前記位相訂正器(70´)は、重み付けされた平均位相エラーを使って、周波数パッチの前記セットの最初および次の周波数パッチ(40)の中のサブバンド信号の位相を訂正するように構成され、前記平均位相エラー(105´´)は、修正されたパッチ信号(40´)を得るために、前記周波数パッチ(40)のインデックスに従って重み付けされる、請求項1に記載のオーディオプロセッサ。 - 前記オーディオプロセッサ(50´)は、さらに、ベースバンド(30)のための周波数上の位相デリバティブ(PDF)の平均(215)を計算するように構成されるオーディオ信号位相デリバティブ計算器(210)を含み、
前記位相訂正器(70´)は、現在のサブバンドインデックスによって重み付けされた周波数上の前記位相デリバティブの平均(215)を、前記オーディオ信号(55)の前記ベースバンド(30)の中で最も高いサブバンドインデックスを有する前記サブバンド信号の位相に追加することによって、最適化された第1周波数パッチによって別の修正されたパッチ信号(40´´)を計算するように構成される、請求項3に記載のオーディオプロセッサ。 - オーディオ信号位相デリバティブ計算器(210)は、サブバンド信号(95)の中のトランジェントを検出するために、ベースバンド信号(30)より高い周波数を含む複数のサブバンド信号のための周波数上の位相デリバティブ(PDF)の平均(215)を計算するように構成され、
前記位相訂正器(70´)は、現在のサブバンドインデックスによって重み付けされた周波数上の前記位相デリバティブの平均(215)を、前記オーディオ信号(55)の前記ベースバンド(30)の中で最も高いサブバンドインデックスを有する前記サブバンド信号の位相に追加することによって、最適化された第1周波数パッチによって別の修正されたパッチ信号(40´´)を計算するように構成される、請求項1ないし請求項3のいずれかに記載のオーディオプロセッサ。 - 前記位相訂正器(70´)は、前記周波数パッチ(40)に基づいて、現在のサブバンドの前記サブバンドインデックスによって重み付けされた周波数上の位相デリバティブの平均(215)を、前の周波数パッチの中で最も高いサブバンドインデックスを有するサブバンド信号の位相に追加されることによって別の修正されたパッチ信号(40´´)を再帰的に更新するように構成される、請求項4または請求項5に記載のオーディオプロセッサ。
- 前記位相訂正器(70´)は、結合され修正されたパッチ信号(40´´´)を得るために、前記修正されたパッチ信号(40´)と前記別の修正されたパッチ信号(40´´)との重み付けされた平均を計算するように構成され、
前記位相訂正器(70´)は、前記周波数パッチ(40)に基づいて、前記現在のサブバンド(95)の前記サブバンドインデックスによって重み付けされた周波数上の前記位相デリバティブの前記平均(215)を、前記結合され修正されたパッチ信号(40´´´)の前記前の周波数パッチの中で前記最も高いサブバンドインデックスを有する前記サブバンド信号の前記位相に追加することによって、前記結合され修正されたパッチ信号(40´´´)を再帰的に更新するように構成される、請求項6に記載のオーディオプロセッサ。 - 前記位相訂正器(70´)は、第1特定重み付け関数によって重み付けされた現在の周波数パッチの中のパッチ信号(40´)と第2特定重み付け関数によって重み付けされた前記現在の周波数パッチの中の修正されたパッチ信号(40´´)との円平均を使って、前記パッチ信号(40´)と前記修正されたパッチ信号(40´´)との重み付けされた平均を計算するように構成される、請求項1ないし請求項7のいずれかに記載のオーディオプロセッサ。
- 前記位相訂正器(70´)は、位相偏差のベクトルを形成するように構成され、前記位相訂正器(70´)は、結合され修正されたパッチ信号(40´´´)と前記オーディオ信号(55)とを使って、前記位相偏差を計算するように構成される、請求項1ないし請求項8のいずれかに記載のオーディオプロセッサ。
- 前記目標位相尺度決定器(65´)は、
前記オーディオ信号(55)の現在の時間フレームの中のピーク位置(230)およびピーク位置の基本周波数(235)を、データストリーム(135)から取り出すように構成される、データストリーム抽出器(130´)、または、
前記現在の時間フレームの中のピーク位置(230)およびピーク位置の基本周波数(235)を計算するために、前記現在の時間フレームの中の前記オーディオ信号(55)を分析するように構成されるオーディオ信号分析器(225)と、
前記ピーク位置(230)およびピーク位置の前記基本周波数(235)を使って、前記現在の時間フレームの中の別のピーク位置を推定するための目標スペクトル生成器(240)と、
を含む、請求項1ないし請求項9のいずれかに記載のオーディオプロセッサ。 - 前記目標スペクトル生成器(240)は、
時間上のパルス列(265)を生成するためのピーク生成器(245)と、
ピーク位置の前記基本周波数(235)に従って、前記パルス列(265)の周波数を調整するための信号形成器(250)と、
前記ピーク位置(230)に従って、前記パルス列(265)の位相を調整するためのパルス位置器(255)と、
前記調整されたパルス列の位相スペクトルを生成するためのスペクトル分析器(260)であって、時間領域信号の前記位相スペクトルは、前記目標位相尺度(85´)である、前記スペクトル分析器(260)と、
を含む、請求項10に記載のオーディオプロセッサ。 - オーディオ信号(25)を復号するためのデコーダ(110´)であって、前記デコーダは、
ベースバンドのサブバンド(95)のセットを得るために、時間フレームの中のオーディオ信号(25)を復号するように構成されるコアデコーダ(115)と、
前記ベースバンドのサブバンド(95)の前記セットをパッチするように構成されるパッチ器(120)であって、サブバンドの前記セットは、前記ベースバンドの前記周波数より高い周波数を含むオーディオ信号(32)を得るために、前記ベースバンドに隣接する前記時間フレームの中の別のサブバンドに、パッチを形成する、パッチ器(120)と、
請求項1ないし請求項11のいずれかに記載のオーディオプロセッサ(50´)であって、前記オーディオプロセッサ(50´)は、目標位相尺度に従って前記パッチの前記サブバンドの位相を訂正するように構成される、オーディオプロセッサ(50´)と、
を含む、デコーダ。 - 前記パッチ器(120)は、前記オーディオ信号(25)のサブバンド(95)の前記セットをパッチするように構成され、サブバンドの前記セットは、前記パッチに隣接する前記時間フレームの別のサブバンドに、別のパッチを形成し、
前記オーディオプロセッサ(50´)は、前記別のパッチの前記サブバンド内の前記位相を訂正するように構成されるか、または
前記パッチ器(120)は、前記パッチに隣接する前記時間フレームの別のサブバンドに、前記訂正パッチをパッチするように構成される、請求項12に記載のデコーダ。 - 前記デコーダ(110´)は、請求項1ないし請求項11のいずれかに記載の別のオーディオプロセッサ(50)を含み、前記別のオーディオプロセッサ(50)は、周波数上の別の位相デリバティブを受信するように構成され、そして、周波数上の前記受信された位相デリバティブを使って、前記オーディオ信号(32)の中のトランジェントを訂正するように構成される、請求項12または請求項13に記載のデコーダ。
- オーディオ信号(55)を符号化するためのエンコーダ(155´)であって、
前記オーティオ信号(55)について、数が減らされたサブバンドを有するコア符号化されたオーディオ信号(145)を得るために、前記オーディオ信号(55)をコア符号化するように構成されるコアエンコーダ(160)と、
前記オーディオ信号の中のピーク位置の基本周波数推定(235)を得るために、前記オーディオ信号(55)または前記オーディオ信号のローパスフィルタされたバージョンの中のピーク位置(230)を分析するための基本周波数分析器(175)と、
前記コア符号化されたオーディオ信号(145)に含まれない前記オーディオ信号(55)のサブバンドのパラメータ(190)を引き出すように構成されるパラメータ抽出器(165)と、
出力信号(135)を形成するように構成される出力信号形成器(170)であって、前記出力信号は前記コア符号化されたオーディオ信号(145)を含み、前記出力信号は前記パラメータ(190)をさらに含み、前記出力信号はピーク位置の前記基本周波数推定(235)をさらに含み、かつ、前記出力信号は前記ピーク位置(230)のうちの少なくとも1つを含む、出力信号形成器(170)と、
を含む、エンコーダ。 - 前記出力信号形成器(170)は、前記出力信号(135)を、一連のフレームの中に形成するように構成され、個々のフレームは、前記コア符号化されたオーディオ信号(145)とパラメータ(190)とを含み、N−1個おきのフレームがすべて、ピーク位置の前記基本周波数推定(235)と前記ピーク位置(230)とを含み、Nは、2以上の整数である、請求項15に記載のエンコーダ。
- オーディオ信号(55)を処理するための方法(3400)であって、
時間フレーム(75)の中の前記オーディオ信号のための目標位相尺度(85´)を決定するステップと、
前記時間フレーム(75)の中の前記オーディオ信号(55)の位相と前記目標位相尺度(85´)とを使って、位相エラー(105´)を計算するステップと、
前記位相エラー(105´)を使って、前記時間フレーム(75)の中の前記オーディオ信号(55)の前記位相を訂正するステップと、
を含む、方法。 - オーディオ信号(25)を復号するための方法(3500)であって、前記方法は、
ベースバンドの中のサブバンドのセットを得るために、前記ベースバンドの時間フレームの中のオーディオ信号(25)を復号するステップと、
前記ベースバンドの中のサブバンドの前記セットをパッチするステップであって、サブバンド(95)の前記セットは、前記ベースバンドの前記周波数より高い周波数を含むオーディオ信号(32)を得るために、前記ベースバンドに隣接する前記時間フレームの中の別のサブバンドに、パッチを形成する、パッチするステップと、
目標位相尺度に従って、請求項17に記載の処理するための方法(3400)によって、前記パッチの前記サブバンドの位相を訂正するステップと、
を含む、方法。 - オーディオ信号(55)を符号化するための方法(3600)であって、前記方法は、
前記オーディオ信号(55)に関して、数が減らされたサブバンドを有するコア符号化されたオーディオ信号(145)を得るために、前記オーディオ信号をコア符号化するステップと、
前記オーディオ信号(55)の中のピーク位置の基本周波数推定を得るために、前記オーディオ信号(55)または前記オーディオ信号(55)のローパスフィルタされたバージョンを分析するステップと、
前記オーディオ信号(55)の特定のサブバンドのパラメータ(150)を引き出すステップであって、前記特定のサブバンドは、前記コア符号化されたオーディオ信号に含まれない、引き出すステップと、
出力信号(135)を形成するステップであって、前記出力信号は前記コア符号化されたオーディオ信号(145)を含み、前記出力信号は前記パラメータ(190)をさらに含み、前記出力信号はピーク位置の前記基本周波数推定(235)をさらに含み、前記出力信号は前記ピーク位置(230)のうちの少なくとも1つをさらに含む、形成するステップと、
を含む、方法。 - コンピュータプログラムがコンピュータ上で実行されるとき、請求項17ないし請求項19のいずれかに記載の方法を実行するプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14175202.2 | 2014-07-01 | ||
EP14175202 | 2014-07-01 | ||
EP15151476.7 | 2015-01-16 | ||
EP15151476.7A EP2963648A1 (en) | 2014-07-01 | 2015-01-16 | Audio processor and method for processing an audio signal using vertical phase correction |
PCT/EP2015/064439 WO2016001068A1 (en) | 2014-07-01 | 2015-06-25 | Audio processor and method for processing an audio signal using vertical phase correction |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017525995A JP2017525995A (ja) | 2017-09-07 |
JP2017525995A5 JP2017525995A5 (ja) | 2018-09-20 |
JP6553657B2 true JP6553657B2 (ja) | 2019-07-31 |
Family
ID=52449941
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575797A Active JP6535037B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号を復号するためのデコーダおよび方法、並びにオーディオ信号を符号化するためのエンコーダおよび方法 |
JP2016575800A Active JP6527536B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオプロセッサおよび水平位相訂正を用いたオーディオ信号処理方法 |
JP2016575802A Active JP6553657B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオプロセッサおよび垂直位相訂正を用いたオーディオ信号を処理する方法 |
JP2016575785A Active JP6458060B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号のための位相訂正データを決定するための計算器および方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575797A Active JP6535037B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号を復号するためのデコーダおよび方法、並びにオーディオ信号を符号化するためのエンコーダおよび方法 |
JP2016575800A Active JP6527536B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオプロセッサおよび水平位相訂正を用いたオーディオ信号処理方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575785A Active JP6458060B2 (ja) | 2014-07-01 | 2015-06-25 | オーディオ信号のための位相訂正データを決定するための計算器および方法 |
Country Status (19)
Country | Link |
---|---|
US (6) | US10140997B2 (ja) |
EP (8) | EP2963649A1 (ja) |
JP (4) | JP6535037B2 (ja) |
KR (4) | KR101958361B1 (ja) |
CN (4) | CN106663439B (ja) |
AR (4) | AR101044A1 (ja) |
AU (7) | AU2015282747B2 (ja) |
BR (3) | BR112016029895A2 (ja) |
CA (6) | CA2953427C (ja) |
ES (4) | ES2677524T3 (ja) |
MX (4) | MX364198B (ja) |
MY (3) | MY192221A (ja) |
PL (3) | PL3164870T3 (ja) |
PT (3) | PT3164869T (ja) |
RU (4) | RU2676416C2 (ja) |
SG (4) | SG11201610732WA (ja) |
TR (2) | TR201809988T4 (ja) |
TW (4) | TWI587289B (ja) |
WO (4) | WO2016001066A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
EP4134953A1 (en) * | 2016-04-12 | 2023-02-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
US10277440B1 (en) * | 2016-10-24 | 2019-04-30 | Marvell International Ltd. | Determining common phase error |
US20200018752A1 (en) * | 2017-03-03 | 2020-01-16 | Baxalta Incorporated | Methods for determining potency of adeno-associated virus preparations |
KR20180104872A (ko) | 2017-03-14 | 2018-09-27 | 현대자동차주식회사 | 주행 상황을 반영하는 주행 제어 시스템에서의 변속 장치 및 방법 |
CN107071689B (zh) * | 2017-04-19 | 2018-12-14 | 音曼(北京)科技有限公司 | 一种方向自适应的空间音频处理方法及系统 |
CN115175299B (zh) * | 2017-06-16 | 2023-10-10 | 创新技术实验室株式会社 | 指示同步信号块的方法和装置 |
WO2019014074A1 (en) * | 2017-07-09 | 2019-01-17 | Selene Photonics, Inc. | ANTIVAL DISTRIBUTION SYSTEMS AND METHODS |
CN107798048A (zh) * | 2017-07-28 | 2018-03-13 | 昆明理工大学 | 一种用于射电日像仪海量数据管理的负数据库管理方法 |
CN107424616B (zh) * | 2017-08-21 | 2020-09-11 | 广东工业大学 | 一种相位谱去除掩模的方法与装置 |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
TWI834582B (zh) * | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
TWI692939B (zh) * | 2018-08-14 | 2020-05-01 | 鈺創科技股份有限公司 | 過濾訊號的數位濾波器 |
CN111077371B (zh) * | 2018-10-19 | 2021-02-05 | 大唐移动通信设备有限公司 | 一种提高相位测量精度的方法和装置 |
WO2020118123A1 (en) * | 2018-12-05 | 2020-06-11 | Black Lattice Technologies, Inc. | Stochastic linear detection |
US10993061B2 (en) | 2019-01-11 | 2021-04-27 | Boomcloud 360, Inc. | Soundstage-conserving audio channel summation |
CN112532208B (zh) * | 2019-09-18 | 2024-04-05 | 惠州迪芬尼声学科技股份有限公司 | 谐波发生器及用于生成谐波的方法 |
US11158297B2 (en) * | 2020-01-13 | 2021-10-26 | International Business Machines Corporation | Timbre creation system |
JP7425421B2 (ja) | 2020-02-20 | 2024-01-31 | 日産自動車株式会社 | 画像処理装置及び画像処理方法 |
CN111405419B (zh) * | 2020-03-26 | 2022-02-15 | 海信视像科技股份有限公司 | 音频信号处理方法、装置及可读存储介质 |
CN113259083B (zh) * | 2021-07-13 | 2021-09-28 | 成都德芯数字科技股份有限公司 | 一种调频同步网相位同步方法 |
Family Cites Families (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2631906A (en) * | 1945-01-12 | 1953-03-17 | Automotive Prod Co Ltd | Sealing device for fluid pressure apparatus |
US4802225A (en) | 1985-01-02 | 1989-01-31 | Medical Research Council | Analysis of non-sinusoidal waveforms |
EP0243562B1 (en) * | 1986-04-30 | 1992-01-29 | International Business Machines Corporation | Improved voice coding process and device for implementing said process |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
US5602959A (en) | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
US5894473A (en) * | 1996-02-29 | 1999-04-13 | Ericsson Inc. | Multiple access communications system and method using code and time division |
US5809459A (en) * | 1996-05-21 | 1998-09-15 | Motorola, Inc. | Method and apparatus for speech excitation waveform coding using multiple error waveforms |
GB2319379A (en) | 1996-11-18 | 1998-05-20 | Secr Defence | Speech processing system |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6226661B1 (en) * | 1998-11-13 | 2001-05-01 | Creative Technology Ltd. | Generation and application of sample rate conversion ratios using distributed jitter |
JP4639441B2 (ja) * | 1999-09-01 | 2011-02-23 | ソニー株式会社 | ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法 |
NL1013500C2 (nl) | 1999-11-05 | 2001-05-08 | Huq Speech Technologies B V | Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. |
GB0001585D0 (en) * | 2000-01-24 | 2000-03-15 | Radioscape Ltd | Method of designing,modelling or fabricating a communications baseband stack |
JP4567289B2 (ja) * | 2000-02-29 | 2010-10-20 | クゥアルコム・インコーポレイテッド | 準周期信号の位相を追跡するための方法および装置 |
US6701297B2 (en) * | 2001-03-02 | 2004-03-02 | Geoffrey Layton Main | Direct intermediate frequency sampling wavelet-based analog-to-digital and digital-to-analog converter |
US7146503B1 (en) * | 2001-06-04 | 2006-12-05 | At&T Corp. | System and method of watermarking signal |
CN100395817C (zh) | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
ES2323294T3 (es) | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
WO2004008806A1 (en) | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US7555434B2 (en) * | 2002-07-19 | 2009-06-30 | Nec Corporation | Audio decoding device, decoding method, and program |
JP4227772B2 (ja) * | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
JP4380174B2 (ja) * | 2003-02-27 | 2009-12-09 | 沖電気工業株式会社 | 帯域補正装置 |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
KR20060083202A (ko) * | 2003-09-05 | 2006-07-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 낮은 비트율 오디오 인코딩 |
KR101106026B1 (ko) * | 2003-10-30 | 2012-01-17 | 돌비 인터네셔널 에이비 | 오디오 신호 인코딩 또는 디코딩 |
FR2865310A1 (fr) * | 2004-01-20 | 2005-07-22 | France Telecom | Procede de restauration de partiels d'un signal sonore |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
US20060014299A1 (en) | 2004-04-12 | 2006-01-19 | Troup Jan M | Method for analyzing blood for cholesterol components |
DE102004021403A1 (de) | 2004-04-30 | 2005-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung |
DE102004021404B4 (de) | 2004-04-30 | 2007-05-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wasserzeicheneinbettung |
US7672835B2 (en) * | 2004-12-24 | 2010-03-02 | Casio Computer Co., Ltd. | Voice analysis/synthesis apparatus and program |
TW200627999A (en) * | 2005-01-05 | 2006-08-01 | Srs Labs Inc | Phase compensation techniques to adjust for speaker deficiencies |
PL1839297T3 (pl) | 2005-01-11 | 2019-05-31 | Koninklijke Philips Nv | Skalowalne kodowanie/dekodowanie sygnałów audio |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7693225B2 (en) * | 2005-07-21 | 2010-04-06 | Realtek Semiconductor Corp. | Inter-symbol and inter-carrier interference canceller for multi-carrier modulation receivers |
KR100927897B1 (ko) * | 2005-09-02 | 2009-11-23 | 닛본 덴끼 가부시끼가이샤 | 잡음억제방법과 장치, 및 컴퓨터프로그램 |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
US8259840B2 (en) | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
WO2007068861A2 (fr) * | 2005-12-15 | 2007-06-21 | France Telecom | Procede d'estimation de phase pour la modelisation sinusoidale d'un signal numerique |
EP1979899B1 (de) | 2006-01-31 | 2015-03-11 | Unify GmbH & Co. KG | Verfahren und anordnungen zur audiosignalkodierung |
US7676374B2 (en) | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
ATE448638T1 (de) | 2006-04-13 | 2009-11-15 | Fraunhofer Ges Forschung | Audiosignaldekorrelator |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
US7761078B2 (en) * | 2006-07-28 | 2010-07-20 | Qualcomm Incorporated | Dual inductor circuit for multi-band wireless communication device |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
RU2407072C1 (ru) * | 2006-09-29 | 2010-12-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов |
US7831001B2 (en) * | 2006-12-19 | 2010-11-09 | Sigmatel, Inc. | Digital audio processing system and method |
CN101051456B (zh) * | 2007-01-31 | 2010-12-01 | 张建平 | 音频相位检测和自动校正设备 |
KR101131880B1 (ko) | 2007-03-23 | 2012-04-03 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
JPWO2009008068A1 (ja) | 2007-07-11 | 2010-09-02 | パイオニア株式会社 | 自動音場補正装置 |
CN101373594A (zh) * | 2007-08-21 | 2009-02-25 | 华为技术有限公司 | 修正音频信号的方法及装置 |
US20110280421A1 (en) | 2007-08-28 | 2011-11-17 | Nxp B.V. | Device for and a method of processing audio signals |
EP2099027A1 (en) | 2008-03-05 | 2009-09-09 | Deutsche Thomson OHG | Method and apparatus for transforming between different filter bank domains |
EP2296145B1 (en) * | 2008-03-10 | 2019-05-22 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Device and method for manipulating an audio signal having a transient event |
US8036891B2 (en) | 2008-06-26 | 2011-10-11 | California State University, Fresno | Methods of identification using voice sound analysis |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
EP2144229A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
RU2491658C2 (ru) | 2008-07-11 | 2013-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Синтезатор аудиосигнала и кодирующее устройство аудиосигнала |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
EP2345026A1 (en) | 2008-10-03 | 2011-07-20 | Nokia Corporation | Apparatus for binaural audio coding |
EP2353160A1 (en) * | 2008-10-03 | 2011-08-10 | Nokia Corporation | An apparatus |
PL4231291T3 (pl) | 2008-12-15 | 2024-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
EP2214162A1 (en) | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
EP2234103B1 (en) * | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
RU2452044C1 (ru) * | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
KR101613975B1 (ko) | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
US8856011B2 (en) | 2009-11-19 | 2014-10-07 | Telefonaktiebolaget L M Ericsson (Publ) | Excitation signal bandwidth extension |
JP5651945B2 (ja) * | 2009-12-04 | 2015-01-14 | ヤマハ株式会社 | 音響処理装置 |
PL3564954T3 (pl) | 2010-01-19 | 2021-04-06 | Dolby International Ab | Ulepszona transpozycja harmonicznych oparta na bloku podpasma |
CN102194457B (zh) * | 2010-03-02 | 2013-02-27 | 中兴通讯股份有限公司 | 音频编解码方法、系统及噪声水平估计方法 |
PL2545551T3 (pl) * | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
RU2591012C2 (ru) * | 2010-03-09 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона |
CA2792452C (en) | 2010-03-09 | 2018-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an input audio signal using cascaded filterbanks |
CN102214464B (zh) | 2010-04-02 | 2015-02-18 | 飞思卡尔半导体公司 | 音频信号的瞬态检测方法以及基于该方法的时长调整方法 |
CN102314882B (zh) | 2010-06-30 | 2012-10-17 | 华为技术有限公司 | 声音信号通道间延时估计的方法及装置 |
RU2573774C2 (ru) | 2010-08-25 | 2016-01-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер |
EP2477188A1 (en) * | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
US20140019125A1 (en) * | 2011-03-31 | 2014-01-16 | Nokia Corporation | Low band bandwidth extended |
US9031268B2 (en) * | 2011-05-09 | 2015-05-12 | Dts, Inc. | Room characterization and correction for multi-channel audio |
CN103548077B (zh) * | 2011-05-19 | 2016-02-10 | 杜比实验室特许公司 | 参数化音频编译码方案的取证检测 |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
CN102800317B (zh) | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
US10453479B2 (en) | 2011-09-23 | 2019-10-22 | Lessac Technologies, Inc. | Methods for aligning expressive speech utterances with text and systems therefor |
JP6051505B2 (ja) | 2011-10-07 | 2016-12-27 | ソニー株式会社 | 音声処理装置および音声処理方法、記録媒体、並びにプログラム |
JP5810903B2 (ja) | 2011-12-27 | 2015-11-11 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
CN103258539B (zh) * | 2012-02-15 | 2015-09-23 | 展讯通信(上海)有限公司 | 一种语音信号特性的变换方法和装置 |
KR101816506B1 (ko) * | 2012-02-23 | 2018-01-09 | 돌비 인터네셔널 에이비 | 고 주파수 오디오 콘텐트의 효율적인 복구를 위한 방법들 및 시스템들 |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
WO2014106034A1 (en) | 2012-12-27 | 2014-07-03 | The Regents Of The University Of California | Method for data compression and time-bandwidth product engineering |
EP2950308B1 (en) | 2013-01-22 | 2020-02-19 | Panasonic Corporation | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9881624B2 (en) | 2013-05-15 | 2018-01-30 | Samsung Electronics Co., Ltd. | Method and device for encoding and decoding audio signal |
JP6216553B2 (ja) | 2013-06-27 | 2017-10-18 | クラリオン株式会社 | 伝搬遅延補正装置及び伝搬遅延補正方法 |
WO2015041549A1 (en) | 2013-09-17 | 2015-03-26 | Intel Corporation | Adaptive phase difference based noise reduction for automatic speech recognition (asr) |
CN103490678B (zh) * | 2013-10-17 | 2016-06-22 | 双峰格雷斯海姆医药玻璃(丹阳)有限公司 | 主从机同步控制方法及系统 |
KR20160087827A (ko) | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
US9990928B2 (en) | 2014-05-01 | 2018-06-05 | Digital Voice Systems, Inc. | Audio watermarking via phase modification |
EP2963649A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
US9933458B2 (en) | 2015-03-31 | 2018-04-03 | Tektronix, Inc. | Band overlay separator |
-
2015
- 2015-01-16 EP EP15151478.3A patent/EP2963649A1/en not_active Withdrawn
- 2015-01-16 EP EP15151463.5A patent/EP2963646A1/en not_active Withdrawn
- 2015-01-16 EP EP15151465.0A patent/EP2963645A1/en not_active Withdrawn
- 2015-01-16 EP EP15151476.7A patent/EP2963648A1/en not_active Withdrawn
- 2015-06-25 PL PL15732633T patent/PL3164870T3/pl unknown
- 2015-06-25 SG SG11201610732WA patent/SG11201610732WA/en unknown
- 2015-06-25 AU AU2015282747A patent/AU2015282747B2/en active Active
- 2015-06-25 CN CN201580036479.7A patent/CN106663439B/zh active Active
- 2015-06-25 KR KR1020177002927A patent/KR101958361B1/ko active IP Right Grant
- 2015-06-25 SG SG11201610836TA patent/SG11201610836TA/en unknown
- 2015-06-25 BR BR112016029895A patent/BR112016029895A2/pt not_active Application Discontinuation
- 2015-06-25 ES ES15732633.1T patent/ES2677524T3/es active Active
- 2015-06-25 RU RU2017103102A patent/RU2676416C2/ru active
- 2015-06-25 WO PCT/EP2015/064428 patent/WO2016001066A1/en active Application Filing
- 2015-06-25 KR KR1020177002926A patent/KR101944386B1/ko active IP Right Grant
- 2015-06-25 RU RU2017103101A patent/RU2676899C2/ru active
- 2015-06-25 SG SG11201610704VA patent/SG11201610704VA/en unknown
- 2015-06-25 JP JP2016575797A patent/JP6535037B2/ja active Active
- 2015-06-25 CA CA2953427A patent/CA2953427C/en active Active
- 2015-06-25 SG SG11201610837XA patent/SG11201610837XA/en unknown
- 2015-06-25 MX MX2016017286A patent/MX364198B/es active IP Right Grant
- 2015-06-25 WO PCT/EP2015/064436 patent/WO2016001067A1/en active Application Filing
- 2015-06-25 RU RU2017103107A patent/RU2676414C2/ru active
- 2015-06-25 MY MYPI2016002277A patent/MY192221A/en unknown
- 2015-06-25 ES ES15731358.6T patent/ES2677250T3/es active Active
- 2015-06-25 CN CN201580036475.9A patent/CN106663438B/zh active Active
- 2015-06-25 PT PT157313586T patent/PT3164869T/pt unknown
- 2015-06-25 JP JP2016575800A patent/JP6527536B2/ja active Active
- 2015-06-25 PL PL15731358T patent/PL3164869T3/pl unknown
- 2015-06-25 PL PL15734098T patent/PL3164873T3/pl unknown
- 2015-06-25 EP EP15731358.6A patent/EP3164869B1/en active Active
- 2015-06-25 JP JP2016575802A patent/JP6553657B2/ja active Active
- 2015-06-25 BR BR112016030149-8A patent/BR112016030149B1/pt active IP Right Grant
- 2015-06-25 MY MYPI2016002294A patent/MY182840A/en unknown
- 2015-06-25 WO PCT/EP2015/064439 patent/WO2016001068A1/en active Application Filing
- 2015-06-25 ES ES15732231.4T patent/ES2678894T3/es active Active
- 2015-06-25 MX MX2016016758A patent/MX356672B/es active IP Right Grant
- 2015-06-25 MX MX2016016897A patent/MX359035B/es active IP Right Grant
- 2015-06-25 MY MYPI2016002276A patent/MY182904A/en unknown
- 2015-06-25 CA CA2953413A patent/CA2953413C/en active Active
- 2015-06-25 EP EP15734098.5A patent/EP3164873B1/en active Active
- 2015-06-25 AU AU2015282746A patent/AU2015282746B2/en active Active
- 2015-06-25 ES ES15734098.5T patent/ES2683870T3/es active Active
- 2015-06-25 CN CN201580036465.5A patent/CN106537498B/zh active Active
- 2015-06-25 EP EP15732231.4A patent/EP3164872B1/en active Active
- 2015-06-25 TR TR2018/09988T patent/TR201809988T4/tr unknown
- 2015-06-25 AU AU2015282749A patent/AU2015282749B2/en active Active
- 2015-06-25 TR TR2018/10148T patent/TR201810148T4/tr unknown
- 2015-06-25 AU AU2015282748A patent/AU2015282748B2/en active Active
- 2015-06-25 EP EP15732633.1A patent/EP3164870B1/en active Active
- 2015-06-25 MX MX2016016770A patent/MX354659B/es active IP Right Grant
- 2015-06-25 PT PT157326331T patent/PT3164870T/pt unknown
- 2015-06-25 CA CA2998044A patent/CA2998044C/en active Active
- 2015-06-25 PT PT15734098T patent/PT3164873T/pt unknown
- 2015-06-25 KR KR1020177002929A patent/KR102025164B1/ko active IP Right Grant
- 2015-06-25 CA CA2999327A patent/CA2999327C/en active Active
- 2015-06-25 CA CA2953426A patent/CA2953426C/en active Active
- 2015-06-25 RU RU2017103100A patent/RU2675151C2/ru active
- 2015-06-25 CN CN201580036493.7A patent/CN106575510B/zh active Active
- 2015-06-25 WO PCT/EP2015/064443 patent/WO2016001069A1/en active Application Filing
- 2015-06-25 BR BR112016030343-1A patent/BR112016030343B1/pt active IP Right Grant
- 2015-06-25 JP JP2016575785A patent/JP6458060B2/ja active Active
- 2015-06-25 KR KR1020177002928A patent/KR101978671B1/ko active IP Right Grant
- 2015-06-25 CA CA2953421A patent/CA2953421C/en active Active
- 2015-06-26 TW TW104120801A patent/TWI587289B/zh active
- 2015-06-26 TW TW104120800A patent/TWI587288B/zh active
- 2015-06-26 TW TW104120799A patent/TWI587292B/zh active
- 2015-06-26 TW TW104120798A patent/TWI591619B/zh active
- 2015-07-01 AR ARP150102109A patent/AR101044A1/es active IP Right Grant
- 2015-07-01 AR ARP150102111A patent/AR101083A1/es unknown
- 2015-07-01 AR ARP150102112A patent/AR101084A1/es active IP Right Grant
- 2015-07-01 AR ARP150102110A patent/AR101082A1/es active IP Right Grant
-
2016
- 2016-12-28 US US15/392,425 patent/US10140997B2/en active Active
- 2016-12-28 US US15/392,485 patent/US10283130B2/en active Active
- 2016-12-28 US US15/392,459 patent/US10529346B2/en active Active
- 2016-12-28 US US15/392,776 patent/US10192561B2/en active Active
-
2017
- 2017-11-15 AU AU2017261514A patent/AU2017261514B2/en active Active
-
2018
- 2018-05-16 AU AU2018203475A patent/AU2018203475B2/en active Active
- 2018-06-29 AU AU2018204782A patent/AU2018204782B2/en active Active
- 2018-12-04 US US16/209,571 patent/US10770083B2/en active Active
-
2019
- 2019-01-27 US US16/258,604 patent/US10930292B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6553657B2 (ja) | オーディオプロセッサおよび垂直位相訂正を用いたオーディオ信号を処理する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180502 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180704 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20180806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190301 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6553657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |