JP6212567B2 - 圧縮されたオーディオ信号を修復するシステム、コンピュータ可読記憶媒体、および方法 - Google Patents
圧縮されたオーディオ信号を修復するシステム、コンピュータ可読記憶媒体、および方法 Download PDFInfo
- Publication number
- JP6212567B2 JP6212567B2 JP2015544075A JP2015544075A JP6212567B2 JP 6212567 B2 JP6212567 B2 JP 6212567B2 JP 2015544075 A JP2015544075 A JP 2015544075A JP 2015544075 A JP2015544075 A JP 2015544075A JP 6212567 B2 JP6212567 B2 JP 6212567B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- component
- processor
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 200
- 238000000034 method Methods 0.000 title claims description 35
- 238000012545 processing Methods 0.000 claims description 155
- 239000003623 enhancer Substances 0.000 claims description 58
- 230000001052 transient effect Effects 0.000 claims description 49
- 230000004044 response Effects 0.000 claims description 30
- 230000009469 supplementation Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 17
- 230000000873 masking effect Effects 0.000 description 15
- 239000013589 supplement Substances 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 7
- 238000000354 decomposition reaction Methods 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000008447 perception Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005355 Hall effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
本出願は、2012年11月26日出願の米国仮出願第61/730,053号の受益を主張し、および2013年3月15日出願の米国出願第13/842,479号の優先権を主張し、それらの開示はこれによって全体が参照により組み込まれる。
本発明は、オーディオ信号処理に関し、とりわけオーディオ信号の増強および修復に関する。
本明細書は、例えば、以下の項目も提供する。
(項目1)
プロセッサと、
一連のシーケンシャルサンプルにオーディオ信号を分割するようプロセッサにより実行可能なサンプラモジュールと、
前記オーディオ信号の1つまたは複数のサンプル成分を順次受信および分析して、それぞれのシーケンシャルサンプルの前記1つまたは複数のサンプル成分内の前記オーディオ信号の失われた部分を識別するよう前記プロセッサにより実行可能な信号エンハンサモジュールと
を備え、
前記信号エンハンサモジュールは、対応する識別された失われた部分があるそれぞれのシーケンシャルサンプルの前記1つまたは複数のサンプル成分のそれぞれについて、対応する信号処理を生成するようプロセッサによりさらに実行可能である、
圧縮されたオーディオ信号の修復システム。
(項目2)
前記サンプル成分が周波数成分であり、前記対応する信号処理が、カットオフ周波数の閾値を超える、なくなった周波数成分を有するサンプル成分に適用される周波数成分である、項目1に記載のシステム。
(項目3)
前記サンプル成分がトランジェント成分であり、前記対応する信号処理が、オーディオ信号内に存在する既存のトランジェントの出だしを増強するように、なくなったトランジェントを有するサンプル成分に適用されるトランジェント成分である、項目1に記載のシステム。
(項目4)
前記サンプル成分が残響成分であり、前記対応する信号処理が、前記オーディオ信号の減衰速度を減少するように、なくなった残響を有するサンプル成分に適用される、項目1に記載のシステム。
(項目5)
前記信号エンハンサモジュールが、前記オーディオ信号とともに受信されたサイドチェーンデータに基づき前記1つまたは複数のサンプル成分を分析するよう構成される、項目1に記載のシステム。
(項目6)
前記対応する信号処理が、帯域幅拡張処理、トランジェント増強処理および残響補充処理を含む複数の信号処理である、項目1に記載のシステム。
(項目7)
前記信号エンハンサモジュールが複数の信号エンハンサモジュールであり、それぞれの前記信号エンハンサモジュールが、少なくとも1つの信号処理を追加するよう聴取者に知覚されるサウンドステージの空間スライスに独立して作動し、前記聴取者に知覚されるサウンドステージが、前記オーディオ信号の再生の間聴取者により知覚される、項目1に記載のシステム。
(項目8)
前記信号エンハンサモジュールが複数の対応する信号処理を生成するよう構成され、前記対応する信号処理が前記オーディオ信号に追加される、項目1に記載のシステム。
(項目9)
圧縮されたオーディオ信号を修復するように、プロセッサにより実行可能なコンピュータ可読命令を格納するコンピュータ可読記憶媒体であって、前記コンピュータ可読媒体が
オーディオ信号のサンプルのシーケンスを生成するように前記プロセッサにより実行可能な命令と、
前記シーケンス内のそれぞれのサンプルを、前記オーディオ信号の異なる特性に関連するサンプル成分に分割するように前記プロセッサにより実行可能な命令と、
前記サンプルのシーケンス内の一連のサンプル成分内に含まれるサンプル成分内の前記オーディオ信号のなくなった部分を識別するように前記プロセッサにより実行可能な命令と、
前記サンプル成分内の前記オーディオ信号の前記なくなった部分の識別に応答して、前記一連のサンプル成分内に含まれる前記サンプル成分の信号処理を生成しかつ前記オーディオ信号に適用するように前記プロセッサにより実行可能な命令と
を備える、コンピュータ可読記憶媒体。
(項目10)
前記サンプル成分が第1のサンプル成分であり、前記コンピュータ可読記憶媒体が、第2のサンプル成分内の前記オーディオ信号のなくなった部分の識別がないことに応答して、前記一連のサンプル成分内に含まれる前記第2のサンプル成分へ前記信号処理をその後適用しないよう、前記プロセッサにより実行可能な命令をさらに備える、項目9に記載のコンピュータ可読記憶媒体。
(項目11)
前記オーディオ信号に関連するパラメータに基づき、前記オーディオ信号の品質を判断するよう前記プロセッサにより実行可能な命令と、前記オーディオ信号の前記判断された品質に従って、前記信号処理のゲインを調整する命令と、をさらに備える、項目9に記載のコンピュータ可読記憶媒体。
(項目12)
前記オーディオ信号の前記異なる特性が、周波数範囲特性、トランジェント特性および残響特性を含む、項目9に記載のコンピュータ可読記憶媒体。
(項目13)
前記オーディオ信号の前記サンプルのシーケンス内のそれぞれのサンプルが一定時間内に連続して受信され、前記サンプル成分がそれぞれの前記シーケンシャルサンプル内に含まれる、項目9に記載のコンピュータ可読記憶媒体。
(項目14)
サンプル成分内の前記オーディオ信号のなくなった部分を識別するよう前記プロセッサにより実行可能な前記命令が、周波数カットオフを超える、なくなった周波数成分を識別する命令を含み、前記信号処理を生成しおよび前記オーディオ信号に適用するように前記プロセッサにより実行可能な前記命令が、前記周波数カットオフを超える周波数成分を生成する命令、および前記オーディオ信号に前記周波数成分を適用する命令を含む、項目9に記載のコンピュータ可読記憶媒体。
(項目15)
前記サンプル成分内の前記オーディオ信号のなくなった部分を識別するよう前記プロセッサにより実行可能な前記命令が、前記サンプル成分内のなくなったトランジェント成分を識別する命令を含み、前記信号処理を生成しおよび前記オーディオ信号に適用するように前記プロセッサにより実行可能な前記命令が、トランジェント成分を生成する命令と、前記トランジェント成分を前記オーディオ信号に適用する命令を含む、項目9に記載のコンピュータ可読記憶媒体。
(項目16)
前記サンプル成分内の前記オーディオ信号のなくなった部分を識別するよう前記プロセッサにより実行可能な前記命令が、前記オーディオ信号の最大減衰速度に基づき、なくなった残響成分を識別する命令を含み、前記信号処理を生成しおよび前記オーディオ信号に適用するように前記プロセッサにより実行可能な前記命令が、残響成分を生成する命令と、前記残響成分を前記オーディオ信号に適用する命令を含む、項目9に記載のコンピュータ可読記憶媒体。
(項目17)
前記オーディオ信号のなくなった部分がある前記一連のサンプル成分内のそれらのサンプル成分にのみ前記信号処理を加えるように前記プロセッサで実行可能な命令をさらに備える、項目9に記載のコンピュータ可読記憶媒体。
(項目18)
前記オーディオ信号の品質の表示、および加えられている前記信号処理のレベルの表示をディスプレイ上に出力するよう前記コンピュータで実行可能な命令をさらに備える、項目9に記載のコンピュータ可読記憶媒体。
(項目19)
プロセッサを用いてオーディオ信号をサンプルに分離することと、
前記プロセッサでそれぞれの前記サンプルをサンプル成分に分割し、前記サンプル成分は前記オーディオ信号の特性の表現であることと、
前記プロセッサで前記オーディオ信号の特性の一連のサンプル成分を順次分析し、前記オーディオ信号の失われた部分があるサンプル成分を識別することと、
前記プロセッサが、前記オーディオ信号の失われた部分があると識別された前記一連のサンプル成分内のそれらのサンプル成分にのみ信号処理を適用することと
を含む、圧縮されたオーディオ信号の修復方法。
(項目20)
前記プロセッサが、前記信号処理で前記オーディオ信号の前記失われた部分内にエネルギーを補充することをさらに含む、項目19に記載の方法。
(項目21)
前記プロセッサが、前記オーディオ信号の失われた部分がないと識別された前記一連のサンプル成分内のそれらのサンプル成分に信号処理を加えないことをさらに含む、項目19に記載の方法。
(項目22)
前記プロセッサで前記オーディオ信号の品質を判断し、前記プロセッサが前記判断された品質に基づき信号処理のレベルを変えることをさらに含む、項目19に記載の方法。
(項目23)
前記オーディオ信号の前記品質および前記信号処理のレベルの表示をディスプレイに出力することをさらに含む、項目22に記載の方法。
Claims (21)
- 圧縮されたオーディオ信号の修復のためのシステムであって、前記システムは、
プロセッサと、
一連のシーケンシャルサンプルにオーディオ信号を分割するように前記プロセッサにより実行可能なサンプラモジュールと、
前記オーディオ信号の1つまたは複数のサンプル成分を順次受信および分析して、それぞれのシーケンシャルサンプルの前記1つまたは複数のサンプル成分内の前記オーディオ信号の失われた部分を識別するように前記プロセッサにより実行可能な信号エンハンサモジュールと
を備え、
前記信号エンハンサモジュールは、対応する信号処理を生成し、対応する識別された失われた部分があるそれぞれのシーケンシャルサンプルの前記1つまたは複数のサンプル成分のそれぞれに対して前記対応する信号処理を適用するように前記プロセッサによりさらに実行可能であり、
前記プロセッサは、前記オーディオ信号の品質を判断し、前記判断された品質に基づいて、前記対応する識別された失われた部分がある前記それぞれのシーケンシャルサンプルに適用される各対応する信号処理に対するゲインを調整するように構成される、システム。 - 前記サンプル成分が周波数成分であり、前記対応する信号処理が、カットオフ周波数の閾値を超える、なくなった周波数成分を有するサンプル成分に適用される周波数成分である、請求項1に記載のシステム。
- 前記サンプル成分がトランジェント成分であり、前記対応する信号処理が、前記オーディオ信号内に存在する既存のトランジェントの出だしを増強するように、なくなったトランジェントを有するサンプル成分に適用されるトランジェント成分である、請求項1に記載のシステム。
- 前記サンプル成分が残響成分であり、前記対応する信号処理が、前記オーディオ信号の減衰速度を減少するように、なくなった残響を有するサンプル成分に適用される、請求項1に記載のシステム。
- 前記信号エンハンサモジュールが、前記オーディオ信号とともに受信されたサイドチェーンデータに基づき前記1つまたは複数のサンプル成分を分析するように構成される、請求項1に記載のシステム。
- 前記対応する信号処理が、帯域幅拡張処理、トランジェント増強処理および残響補充処理を含む複数の信号処理である、請求項1に記載のシステム。
- 前記信号エンハンサモジュールが複数の信号エンハンサモジュールであり、それぞれの前記信号エンハンサモジュールが、少なくとも1つの信号処理を追加するように聴取者に知覚されるサウンドステージの空間スライスに独立して作動し、前記聴取者に知覚されるサウンドステージが、前記オーディオ信号の再生の間聴取者により知覚される、請求項1に記載のシステム。
- 前記信号エンハンサモジュールが複数の対応する信号処理を生成するように構成され、前記対応する信号処理が前記オーディオ信号に追加される、請求項1に記載のシステム。
- 圧縮されたオーディオ信号を修復するように、プロセッサにより実行可能なコンピュータ可読命令を格納するコンピュータ可読記憶媒体であって、前記コンピュータ可読媒体が
オーディオ信号のサンプルのシーケンスを生成するように前記プロセッサにより実行可能な命令と、
前記シーケンス内のそれぞれのサンプルを、前記オーディオ信号の異なる特性に関連するサンプル成分に分割するように前記プロセッサにより実行可能な命令と、
前記サンプルのシーケンス内の一連のサンプル成分内に含まれるサンプル成分内の前記オーディオ信号のなくなった部分を識別するように前記プロセッサにより実行可能な命令と、
前記サンプル成分内の前記オーディオ信号の前記なくなった部分の識別に応答して、前記一連のサンプル成分内に含まれる前記サンプル成分に対する信号処理を生成しかつ前記オーディオ信号に適用するように前記プロセッサにより実行可能な命令と、
前記オーディオ信号に関連するパラメータに基づいて前記オーディオ信号の品質を判断するように前記プロセッサにより実行可能な命令と、
前記オーディオ信号の前記判断された品質に従って、前記オーディオ信号の前記なくなった部分に適用される前記信号処理のゲインを調整するように前記プロセッサにより実行可能な命令と
を備える、コンピュータ可読記憶媒体。 - 前記サンプル成分が第1のサンプル成分であり、前記コンピュータ可読記憶媒体が、前記一連のサンプル成分内に含まれる第2のサンプル成分内の前記オーディオ信号のなくなった部分の識別がないことに応答して、前記第2のサンプル成分へ前記信号処理をその後適用しないように前記プロセッサにより実行可能な命令をさらに備える、請求項9に記載のコンピュータ可読記憶媒体。
- 前記オーディオ信号の前記異なる特性が、周波数範囲特性、トランジェント特性および残響特性を含む、請求項9に記載のコンピュータ可読記憶媒体。
- 前記オーディオ信号の前記サンプルのシーケンス内のそれぞれのサンプルが一定時間内に連続して受信され、前記サンプル成分がそれぞれの前記シーケンシャルサンプル内に含まれる、請求項9に記載のコンピュータ可読記憶媒体。
- サンプル成分内の前記オーディオ信号のなくなった部分を識別するように前記プロセッサにより実行可能な前記命令が、周波数カットオフを超える、なくなった周波数成分を識別する命令を含み、前記信号処理を生成しかつ前記オーディオ信号に適用するように前記プロセッサにより実行可能な前記命令が、前記周波数カットオフを超える周波数成分を生成する命令、および前記オーディオ信号に前記周波数成分を適用する命令を含む、請求項9に記載のコンピュータ可読記憶媒体。
- 前記サンプル成分内の前記オーディオ信号のなくなった部分を識別するように前記プロセッサにより実行可能な前記命令が、前記サンプル成分内のなくなったトランジェント成分を識別する命令を含み、前記信号処理を生成しかつ前記オーディオ信号に適用するように前記プロセッサにより実行可能な前記命令が、トランジェント成分を生成する命令と、前記トランジェント成分を前記オーディオ信号に適用する命令を含む、請求項9に記載のコンピュータ可読記憶媒体。
- 前記サンプル成分内の前記オーディオ信号のなくなった部分を識別するように前記プロセッサにより実行可能な前記命令が、前記オーディオ信号の最大減衰速度に基づき、なくなった残響成分を識別する命令を含み、前記信号処理を生成しかつ前記オーディオ信号に適用するように前記プロセッサにより実行可能な前記命令が、残響成分を生成する命令と、前記残響成分を前記オーディオ信号に適用する命令を含む、請求項9に記載のコンピュータ可読記憶媒体。
- 前記オーディオ信号のなくなった部分がある前記一連のサンプル成分内のそれらのサンプル成分にのみ前記信号処理を適用するように前記プロセッサで実行可能な命令をさらに備える、請求項9に記載のコンピュータ可読記憶媒体。
- 前記オーディオ信号の品質の表示、および適用されている前記信号処理のレベルの表示をディスプレイ上に出力するように前記コンピュータで実行可能な命令をさらに備える、請求項9に記載のコンピュータ可読記憶媒体。
- 圧縮されたオーディオ信号の修復の方法であって、前記方法は、
プロセッサを用いてオーディオ信号をサンプルに分離することと、
前記プロセッサでそれぞれの前記サンプルをサンプル成分に分割することであって、前記サンプル成分は前記オーディオ信号の特性の表現である、ことと、
前記プロセッサで前記オーディオ信号の特性の一連のサンプル成分を順次分析して、前記オーディオ信号の失われた部分があるサンプル成分を識別することと、
前記プロセッサで、前記オーディオ信号の失われた部分があると識別された前記一連のサンプル成分内のそれらのサンプル成分にのみ信号処理を適用することと、
前記プロセッサで、前記オーディオ信号の品質を判断することと、
前記プロセッサで、前記判断された品質に基づいて前記オーディオ信号の前記失われた部分に適用される前記信号処理のゲインを調整することと
を含む、方法。 - 前記プロセッサが、前記信号処理で前記オーディオ信号の前記失われた部分内にエネルギーを補充することをさらに含む、請求項18に記載の方法。
- 前記プロセッサが、前記オーディオ信号の失われた部分がないと識別された前記一連のサンプル成分内のそれらのサンプル成分に信号処理を適用しないことをさらに含む、請求項18に記載の方法。
- 前記オーディオ信号の前記品質および前記信号処理のレベルの表示をディスプレイに出力することをさらに含む、請求項18に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261730053P | 2012-11-26 | 2012-11-26 | |
US61/730,053 | 2012-11-26 | ||
US13/842,479 US9135920B2 (en) | 2012-11-26 | 2013-03-15 | System for perceived enhancement and restoration of compressed audio signals |
US13/842,479 | 2013-03-15 | ||
PCT/US2013/067981 WO2014081548A1 (en) | 2012-11-26 | 2013-11-01 | System, computer-readable storage medium and method for repair of compressed audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016502139A JP2016502139A (ja) | 2016-01-21 |
JP6212567B2 true JP6212567B2 (ja) | 2017-10-11 |
Family
ID=50774017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015544075A Active JP6212567B2 (ja) | 2012-11-26 | 2013-11-01 | 圧縮されたオーディオ信号を修復するシステム、コンピュータ可読記憶媒体、および方法 |
Country Status (7)
Country | Link |
---|---|
US (3) | US9135920B2 (ja) |
EP (1) | EP2923355B1 (ja) |
JP (1) | JP6212567B2 (ja) |
KR (1) | KR101825507B1 (ja) |
CN (1) | CN104823237B (ja) |
BR (1) | BR112015011820B1 (ja) |
WO (1) | WO2014081548A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9135920B2 (en) * | 2012-11-26 | 2015-09-15 | Harman International Industries, Incorporated | System for perceived enhancement and restoration of compressed audio signals |
EP2830065A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
KR101862356B1 (ko) * | 2014-01-03 | 2018-06-29 | 삼성전자주식회사 | 개선된 앰비소닉 디코딩을 수행하는 방법 및 장치 |
WO2015105775A1 (en) * | 2014-01-07 | 2015-07-16 | Harman International Industries, Incorporated | Signal quality-based enhancement and compensation of compressed audio signals |
US9782672B2 (en) | 2014-09-12 | 2017-10-10 | Voyetra Turtle Beach, Inc. | Gaming headset with enhanced off-screen awareness |
US10057705B2 (en) | 2015-01-13 | 2018-08-21 | Harman International Industries, Incorporated | System and method for transitioning between audio system modes |
CN108604454B (zh) | 2016-03-16 | 2020-12-15 | 华为技术有限公司 | 音频信号处理装置和输入音频信号处理方法 |
CA3018039C (en) * | 2016-03-24 | 2023-08-29 | Harman International Industries, Incorporated | Signal quality-based enhancement and compensation of compressed audio signals |
CN109643555B (zh) | 2016-07-04 | 2024-01-30 | 哈曼贝克自动系统股份有限公司 | 自动校正包含语音信号的音频信号中的响度级 |
DE102017204181A1 (de) | 2017-03-14 | 2018-09-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sender zum Emittieren von Signalen und Empfänger zum Empfangen von Signalen |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
CN107452398B (zh) * | 2017-08-09 | 2021-03-16 | 深圳创维数字技术有限公司 | 回声获取方法、电子设备及计算机可读存储介质 |
KR102551359B1 (ko) | 2017-10-24 | 2023-07-04 | 삼성전자주식회사 | 기계학습을 이용한 오디오 복원 방법 및 장치 |
CN111201569B (zh) | 2017-10-25 | 2023-10-20 | 三星电子株式会社 | 电子装置及其控制方法 |
CN110033781B (zh) * | 2018-01-10 | 2021-06-01 | 盛微先进科技股份有限公司 | 音频处理方法、装置及非暂时性电脑可读媒体 |
CN109767760A (zh) * | 2019-02-23 | 2019-05-17 | 天津大学 | 基于振幅和相位信息的多目标学习的远场语音识别方法 |
US11264017B2 (en) * | 2020-06-12 | 2022-03-01 | Synaptics Incorporated | Robust speaker localization in presence of strong noise interference systems and methods |
CN112735454A (zh) * | 2020-12-30 | 2021-04-30 | 北京大米科技有限公司 | 音频处理方法、装置、电子设备和可读存储介质 |
CN112565124B (zh) * | 2021-03-01 | 2021-04-23 | 中国人民解放军国防科技大学 | 基于重叠加窗的无失真信号处理方法、存储介质和系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60217522T2 (de) * | 2001-08-17 | 2007-10-18 | Broadcom Corp., Irvine | Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US8180067B2 (en) | 2006-04-28 | 2012-05-15 | Harman International Industries, Incorporated | System for selectively extracting components of an audio input signal |
CN101518100B (zh) * | 2006-09-14 | 2011-12-07 | Lg电子株式会社 | 对话增强技术 |
US8036767B2 (en) | 2006-09-20 | 2011-10-11 | Harman International Industries, Incorporated | System for extracting and changing the reverberant content of an audio input signal |
JP2008158302A (ja) * | 2006-12-25 | 2008-07-10 | Sony Corp | 信号処理装置、信号処理方法、再生装置、再生方法、電子機器 |
EP1947642B1 (en) * | 2007-01-16 | 2018-06-13 | Apple Inc. | Active noise control system |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101597375B1 (ko) * | 2007-12-21 | 2016-02-24 | 디티에스 엘엘씨 | 오디오 신호의 인지된 음량을 조절하기 위한 시스템 |
JP4940158B2 (ja) * | 2008-01-24 | 2012-05-30 | 株式会社東芝 | 音補正装置 |
JP5341983B2 (ja) | 2008-04-18 | 2013-11-13 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 |
EP2226794B1 (en) * | 2009-03-06 | 2017-11-08 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN102422531B (zh) * | 2009-06-29 | 2014-09-03 | 三菱电机株式会社 | 音频信号处理装置 |
JP5400225B2 (ja) * | 2009-10-05 | 2014-01-29 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | オーディオ信号の空間的抽出のためのシステム |
US20110317841A1 (en) | 2010-06-25 | 2011-12-29 | Lloyd Trammell | Method and device for optimizing audio quality |
US9135920B2 (en) * | 2012-11-26 | 2015-09-15 | Harman International Industries, Incorporated | System for perceived enhancement and restoration of compressed audio signals |
-
2013
- 2013-03-15 US US13/842,479 patent/US9135920B2/en active Active
- 2013-11-01 BR BR112015011820-8A patent/BR112015011820B1/pt active IP Right Grant
- 2013-11-01 EP EP13795624.9A patent/EP2923355B1/en active Active
- 2013-11-01 CN CN201380061356.XA patent/CN104823237B/zh active Active
- 2013-11-01 WO PCT/US2013/067981 patent/WO2014081548A1/en active Application Filing
- 2013-11-01 KR KR1020157013233A patent/KR101825507B1/ko not_active Application Discontinuation
- 2013-11-01 JP JP2015544075A patent/JP6212567B2/ja active Active
-
2015
- 2015-09-03 US US14/844,425 patent/US9576584B2/en active Active
-
2017
- 2017-02-17 US US15/435,729 patent/US10311880B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9576584B2 (en) | 2017-02-21 |
CN104823237A (zh) | 2015-08-05 |
KR20150088253A (ko) | 2015-07-31 |
EP2923355B1 (en) | 2018-07-04 |
US9135920B2 (en) | 2015-09-15 |
US20170162208A1 (en) | 2017-06-08 |
US20150379999A1 (en) | 2015-12-31 |
US20140149126A1 (en) | 2014-05-29 |
BR112015011820B1 (pt) | 2021-11-09 |
EP2923355A1 (en) | 2015-09-30 |
US10311880B2 (en) | 2019-06-04 |
JP2016502139A (ja) | 2016-01-21 |
KR101825507B1 (ko) | 2018-02-05 |
WO2014081548A1 (en) | 2014-05-30 |
BR112015011820A2 (pt) | 2017-07-11 |
CN104823237B (zh) | 2019-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6212567B2 (ja) | 圧縮されたオーディオ信号を修復するシステム、コンピュータ可読記憶媒体、および方法 | |
JP6576934B2 (ja) | 圧縮済みオーディオ信号の信号品質ベース強調及び補償 | |
US10573328B2 (en) | Determining the inter-channel time difference of a multi-channel audio signal | |
JP7443423B2 (ja) | マルチチャネル信号の符号化方法およびエンコーダ | |
CN109903776B (zh) | 用于各种回放环境的动态范围控制 | |
US10741196B2 (en) | Signal quality-based enhancement and compensation of compressed audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170818 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6212567 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |