JP5674827B2 - 多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム - Google Patents
多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム Download PDFInfo
- Publication number
- JP5674827B2 JP5674827B2 JP2012557079A JP2012557079A JP5674827B2 JP 5674827 B2 JP5674827 B2 JP 5674827B2 JP 2012557079 A JP2012557079 A JP 2012557079A JP 2012557079 A JP2012557079 A JP 2012557079A JP 5674827 B2 JP5674827 B2 JP 5674827B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- speech
- utterance
- attenuation
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 158
- 238000000034 method Methods 0.000 title claims description 156
- 238000012545 processing Methods 0.000 claims description 87
- 230000008569 process Effects 0.000 claims description 54
- 230000004044 response Effects 0.000 claims description 48
- 238000001228 spectrum Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000002238 attenuated effect Effects 0.000 claims description 18
- 238000001914 filtration Methods 0.000 claims description 18
- 238000013016 damping Methods 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010036626 Presbyacusis Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/09—Electronic reduction of distortion of stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Mueschを発明者とし、出願に係る権利がDolby Laboratories Licensing社に譲渡された下記の特許文献1(公開日:2008年1月28日)は、発話内容の所望される明瞭度がこれ以上充足され得ない所まで、多重チャネル音声信号内の非発話チャネル(例えば、左側と右側のチャネル)が当該音声信号の発話チャネル(例えば、中心チャネル)内の発話内容を覆い隠すことが可能であることを開示している。特許文献1は、ダッキング処理回路によって非発話チャネルに対して適用される減衰関数をどのように決定すればよいかを記述している。これは、コンテンツ製作者の意図を最大限に維持しながら、発話チャネル内において発話内容からのマスキング(競合音による覆い隠し)の除去を試みるものである。特許文献1中に開示された技術は、非発話チャネル内のコンテンツが、発話チャネルから判定される発話内容の明瞭度(またはその他の知覚される品質)を決して強化することはないという仮定に基づいている。
当該多重チャネル音声信号の発話チャネルから判定される発話内容の明瞭度または知覚される品質を高める情報内容である。非発話チャネルが「発話内容の強化コンテンツ」を含んでいない時には非発話チャネルに対して従来技術が開示する通常の方法で減衰処理がなされる(即ち、減衰処理は一時的に中断されたり修正されたりしない)。あるいは、非発話チャネルが既定の評価基準を満たすような「発話内容の強化コンテンツ」を含んでいない時に、減衰処理の一時的な中断や修正を行わないようにすることも可能である。
Claims (66)
- 一つの発話チャネルと少なくとも一つの非発話チャネルを有する多重チャネル音声信号をフィルタリングし、当該多重チャネル音声信号から判定される発話内容の明瞭度を改善する方法であって、
(a):前記発話チャネルから判定される発話に関係する情報内容と、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す少なくとも一つの減衰制御値を決定するステップ、および、
(b):前記少なくとも一つの減衰制御値に応じて、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させるステップ、
を備える方法。 - 前記決定するステップにおいて決定される前記減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、当該多重チャネル音声信号内の少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表し、
前記減衰させるステップは、前記少なくとも一つの減衰制御値に応じて、前記少なくとも一つの非発話チャネルを減衰させるステップを含む、請求項1記載の方法。 - 前記決定するステップは、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから、一つの導出された非発話チャネルを導出するステップを含み、
前記少なくとも一つの減衰制御値は、発話チャネルから判定される発話に関係する情報内容と、前記導出された非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す、請求項1記載の方法。 - 前記導出された非発話チャネルは、前記多重チャネル音声信号の第1の非発話チャネルと、前記多重チャネル音声信号の第2の非発話チャネルとを合成することによって導出される、請求項3記載の方法。
- 前記多重チャネル音声信号は、少なくとも2つの非発話チャネルを有し、前記減衰させるステップは、前記少なくとも一つの減衰制御値に応じて、全てではないが幾つかの前記非発話チャネルを減衰させるステップを含む、請求項3記載の方法。
- 前記多重チャネル音声信号は、少なくとも2つの非発話チャネルを有し、前記減衰させるステップは、前記少なくとも一つの減衰制御値に応じて、全ての前記非発話チャネルを減衰させるステップを含む、請求項3記載の方法。
- 前記減衰させるステップは、前記少なくとも一つの減衰制御値に応じて、前記非発話チャネルに関する未加工の減衰制御信号をスケーリングするステップを備える、請求項1記載の方法。
- 前記決定するステップは、一連の減衰制御値から成る単一の系列を表す減衰制御信号を生成するステップを含み、複数の減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の互いに異なる時刻における類似度の尺度を表し、前記減衰させるステップは、
前記減衰制御信号に応じて、ダッキング利得制御信号をスケーリングして、スケーリングされた利得制御信号を生成するステップ;および、
前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させるために、前記スケーリングされた利得制御信号を適用するステップ、
を備える、請求項1記載の方法。 - 前記決定するステップは、前記発話チャネルから判定される発話に関連した情報内容を表す発話に関連した第1の特性値の系列を、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルから判定される発話に関連した情報内容を表す発話に関連した第2の特性値の系列と比較して、減衰制御信号を生成するステップを備え、
前記減衰制御信号によって表される複数の減衰制御値の各々は、前記発話に関連した特性値の第1の系列および前記発話に関連した特性値の第2の系列の両者の間の互いに異なる時刻における類似度の尺度を表す、請求項8記載の方法。 - 前記減衰制御値の各々は、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルが、前記発話チャネルから判定される発話内容の知覚される品質を高める発話内容の強化コンテンツを表している可能性の高さを表す尤度と単調に関係付けられる、請求項1記載の方法。
- 一つの発話チャネルと少なくとも一つの非発話チャネルを有する多重チャネル音声信号をフィルタリングし、当該多重チャネル音声信号から判定される発話内容の明瞭度を改善する方法であって、
(a):前記発話チャネルから判定される発話に関係する情報内容と、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す少なくとも一つの減衰制御値を決定するステップ、および、
(b):前記少なくとも一つの減衰制御値に応じて、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させるステップ、
を備える方法。 - 前記減衰させるステップは、前記少なくとも一つの減衰制御値に応じて、前記非発話チャネルに関する未加工の減衰制御信号をスケーリングするステップを備える、請求項11記載の方法。
- 前記決定するステップは、一連の減衰制御値から成る単一の系列を表す減衰制御信号を生成するステップを含み、複数の減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の互いに異なる時刻における類似度の尺度を表し、前記減衰させるステップは、
前記減衰制御信号に応じて、ダッキング利得制御信号をスケーリングして、スケーリングされた利得制御信号を生成するステップ;および、
前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させるために、前記スケーリングされた利得制御信号を適用するステップ、
を備える、請求項11記載の方法。 - 前記決定するステップは、前記発話チャネルから判定される発話に関連した情報内容を表す発話に関連した特性値の第1の系列を、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルから判定される発話に関連した情報内容を表す発話に関連した特性値の第2の系列と比較して、減衰制御信号を生成するステップを備え、
前記減衰制御信号によって表される複数の減衰制御値の各々は、前記発話に関連した特性値の第1の系列および前記発話に関連した特性値の第2の系列の両者の間の互いに異なる時刻における類似度の尺度を表す、請求項13記載の方法。 - 前記発話に関連した特性値の第1の系列は、一連の発話尤度値から成る系列であり、前記発話尤度値の各々は、異なる時刻において、前記発話チャネルが発話内容を表している可能性の高さを示す尤度を表し、
前記発話に関連した特性値の第2の系列は、一連の発話尤度値から成るもう一つの系列であり、前記発話尤度値の各々は、異なる時刻において、前記少なくとも一つの非発話チャネルが発話内容を表している可能性の高さを示す尤度を表す、請求項14記載の方法。 - 前記減衰制御値の各々は、利得制御値である、請求項13記載の方法。
- 前記減衰制御値の各々は、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルが、前記発話チャネルから判定される発話内容の知覚される品質を高める発話内容の強化コンテンツを表している可能性の高さを表す尤度と単調に関係付けられる、請求項11記載の方法。
- 一つの発話チャネルおよび少なくとも2つの非発話チャネルを有する多重チャネル音声信号をフィルタリングする方法であって、
(a):前記発話チャネルから判定される発話に関係する第1の情報内容と、前記多重チャネル音声信号内の第1の非発話チャネルから判定される発話に関係する第2の情報内容との間の類似度の尺度を表す少なくとも一つの第1の減衰制御値を決定するステップ;および、
(b):前記発話チャネルから判定される発話に関係する前記第1の情報内容と、前記多重チャネル音声信号内の第2の非発話チャネルから判定される発話に関係する第3の情報内容との間の類似度の尺度を表す少なくとも一つの第2の減衰制御値を決定するステップ、
を備える方法。 - 前記第1の減衰制御値を決定するステップは、前記発話チャネルから判定される発話に関係する前記第1の情報内容を表す発話に関係する特性値の第1の系列を発話に関係する第2の情報内容を表す発話に関係する特性値の第2の系列と比較するステップを含み、
前記第2の減衰制御値を決定するステップは、前記発話に関係する特性値の第1の系列を前記発話に関係する第3の情報内容を表す発話に関係する特性値の第3の系列と比較するステップを含む、請求項18記載の方法。 - 前記少なくとも一つの第1の減衰制御値に応じて、前記第1の非発話チャネルを減衰するステップ;および、
前記少なくとも一つの第2の減衰制御値に応じて、前記第2の非発話チャネルを減衰するステップ、
をさらに備えた請求項18記載の方法。 - 前記第1の非発話チャネルを減衰するステップは、前記少なくとも一つの第1の減衰制御値に応じて、第1の非発話チャネルの減衰率をスケーリングするステップを含み、
前記第2の非発話チャネルを減衰するステップは、前記少なくとも一つの第2の減衰制御値に応じて、第2の非発話チャネルの減衰率をスケーリングするステップを含む、請求項20記載の方法。 - 前記第1の減衰制御値を決定するステップにおいて決定された前記少なくとも一つの第1の減衰制御値は、一連の減衰制御値から成る単一の系列であり、当該減衰制御値の各々は、第1の非発話チャネルに対して適用されるダッキング利得の大きさをスケーリングする利得制御値であり、前記利得制御値の前記適用は、前記発話チャネルから判定される発話内容の明瞭度を改善すると同時に、前記第1の非発話チャネルから判定される発話内容の強化コンテンツに対する望ましくない減衰を生じないように実行され、
前記第2の減衰制御値を決定するステップにおいて決定された前記少なくとも一つの第2の減衰制御値は、一連の第2の減衰制御値から成る単一の系列であり、当該第2の減衰制御値の各々は、第2の非発話チャネルに対して適用されるダッキング利得の大きさをスケーリングする利得制御値であり、前記利得制御値の前記適用は、前記発話チャネルから判定される発話内容の明瞭度を改善すると同時に、前記第2の非発話チャネルから判定される発話内容の強化コンテンツに対する望ましくない減衰を生じないように実行される、請求項18記載の方法。 - 一つの発話チャネルと少なくとも一つの非発話チャネルを有する多重チャネル音声信号をフィルタリングし、前記多重チャネル音声信号から判定される発話内容の明瞭度を改善する方法であって、
(a):前記発話チャネルの特性と前記非発話チャネルの特性とを比較して、前記発話チャネルと比較した場合の前記非発話チャネルの相対的な減衰率を制御するための少なくとも一つの減衰値を生成するステップ;および、
(b):少なくとも一つの発話内容強化尤度値に応じて前記少なくとも一つの減衰値を調節し、前記発話チャネルと比較した場合の前記非発話チャネルの相対的な減衰率を制御するための少なくとも一つの調節された減衰値を生成するステップ、
を備える方法。 - 前記調節された減衰値を生成するステップは、一つの前記発話内容強化尤度値に応じて前記減衰値の各々をスケーリングし、一つの前記調節された減衰値を生成するステップを含む、請求項23記載の方法。
- 発話内容強化尤度値の各々は、非発話チャネルが発話チャネルから判定された発話内容の知覚される品質を高める発話内容の強化コンテンツを表している可能性の高さを示す尤度と単調に関係付けされている、請求項23記載の方法。
- 前記少なくとも一つの発話内容強化尤度値は、一連の比較値から成る単一の系列であり、
前記発話チャネルから判定された発話に関係する情報内容を表す発話内容に関係した特性値の第1の系列を非発話チャネルから判定された発話に関係する情報内容を表す発話内容に関係した特性値の第2の系列と比較することにより、一連の比較値から成る単一の系列を決定するステップを含む、請求項23記載の方法であって、
比較値の各々は、前記発話内容に関係した特性値の第1の系列と前記発話内容に関係した特性値の第2の系列との間の互いに異なる時刻における類似度の尺度である、方法。 - 前記少なくとも一つの調節された減衰値に応じて、前記非発話チャネルを減衰するステップをさらに含む、請求項23記載の方法。
- 前記調節された減衰値を生成するステップは、一つの前記発話内容強化尤度値に応じて前記減衰値の各々をスケーリングし、一つの前記調節された減衰値を生成するステップを含む、請求項23記載の方法。
- 前記少なくとも一つの減衰値を生成するステップにおいて生成された前記減衰値の各々は、前記非発話チャネルの減衰率の大きさを表す第1の係数であり、
前記減衰率の大きさは、前記発話チャネルにおける信号電力に対する前記非発話チャネルにおける信号電力の比率が所定の閾値を超えないように制限するのに必要な大きさであり、発話チャネルが発話内容を表している可能性の高さを示す尤度と単調に関係付けられる第2の係数によってスケーリングされる、請求項23記載の方法。 - 前記少なくとも一つの減衰値を生成するステップにおいて生成された前記減衰値の各々は、前記非発話チャネルの減衰率の大きさを表す第1の係数であり、
前記減衰率の大きさは、前記非発話チャネルから判定された情報内容の存在下で、前記発話チャネルから判定された発話内容の予測される明瞭度が所定の閾値を超えるようにするのに充分な大きさであり、前記発話チャネルが発話内容を表している可能性の高さを示す尤度と単調に関係付けられる第2の係数によってスケーリングされる、請求項23記載の方法。 - 前記少なくとも一つの減衰値を生成するステップにおいて、前記減衰値の各々を生成する動作は、
前記発話チャネルの周波数の関数としての電力分布を表す第1の電力スペクトル、および前記非発話チャネルの周波数の関数としての電力分布を表す第2の電力スペクトルを決定するステップ;および、
前記第1の電力スペクトルおよび前記第2の電力スペクトルに応じて、前記減衰値の周波数領域判定を実行するステップ、
を備える、請求項23記載の方法。 - 一つの発話チャネルと少なくとも一つの非発話チャネルを有する入力された多重チャネル音声信号から判定された発話内容を強化するシステムであって、
入力された多重チャネル音声信号を解析して複数の減衰制御値を生成するように構成された解析サブシステムであって、前記複数の減衰制御値の各々は、前記発話チャネルから判定される発話に関係する情報内容と、前記入力された多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す、解析サブシステム;および、
前記複数の減衰制御値の中の少なくとも幾つかによる動作制御の下で、前記入力された多重チャネル音声信号に関する前記非発話チャネルの各々に対してダッキング減衰処理を適用し、フィルタリングされた音声出力信号を生成するように構成されている減衰処理サブシステム、
を備えるシステム。 - 前記減衰処理サブシステムは、前記複数の減衰制御値の中の少なくとも一部を含む集合に応じて前記少なくとも一つの非発話チャネルに関する未加工の減衰制御値をスケーリングするように構成されている、請求項32記載のシステム。
- 前記解析サブシステムは、一連の減衰制御値から成る単一の系列を表す減衰制御信号を生成するように構成され、
複数の減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の互いに異なる時刻における類似度の尺度を表し、
前記減衰処理サブシステムは、
前記減衰制御信号に応じて、ダッキング利得制御信号をスケーリングして、スケーリングされた利得制御信号を生成し、
前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させるために、前記スケーリングされた利得制御信号を適用するように構成された、
請求項32記載のシステム。 - 前記解析サブシステムは、前記発話チャネルから判定される発話に関連した情報内容を表す発話に関連した特性値の第1の系列を、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルから判定される発話に関連した情報内容を表す発話に関連した特性値の第2の系列と比較して、減衰制御信号を生成するように構成され、
前記減衰制御信号によって表される複数の減衰制御値の各々は、互いに異なる時刻における前記発話に関連した特性値の第1の系列および前記発話に関連した特性値の第2の系列の両者の間の類似度の尺度を表す、請求項34記載のシステム。 - 前記発話に関連した特性値の第1の系列は、一連の発話尤度値から成る系列であり、前記発話尤度値の各々は、異なる時刻において、前記発話チャネルが発話内容を表している可能性の高さを示す尤度を表し、
前記発話に関連した特性値の第2の系列は、一連の発話尤度値から成るもう一つの系列であり、前記発話尤度値の各々は、異なる時刻において、前記少なくとも一つの非発話チャネルが発話内容を表している可能性の高さを示す尤度を表す、請求項35記載のシステム。 - 前記システムは、前記入力された多重チャネル音声信号を解析して前記複数の減衰制御値を生成する解析ソフトウェアによってプログラミングされたプロセッサを含む、請求項32記載のシステム。
- 前記システムは、前記非発話チャネルの各々に対して前記ダッキング減衰処理を適用し、前記フィルタリングされた音声出力信号を生成する減衰処理ソフトウェアによってプログラミングされたプロセッサを含む、請求項32記載のシステム。
- 前記システムは、前記入力された多重チャネル音声信号を解析して前記複数の減衰制御値を生成し、前記非発話チャネルの各々に対して前記ダッキング減衰処理を適用し、前記フィルタリングされた音声出力信号を生成するように構成されたプロセッサを含む、請求項32記載のシステム。
- 前記システムは、前記入力された多重チャネル音声信号を解析して前記複数の減衰制御値を生成し、前記非発話チャネルの各々に対して前記ダッキング減衰処理を適用し、前記フィルタリングされた音声出力信号を生成するように構成されているデジタル信号プロセッサである、請求項32記載のシステム。
- 前記システムは、前記解析サブシステムを実装するように構成された第1の回路、および前記第1の回路と接続され、前記減衰処理サブシステムを実装するように構成された追加の回路を含む、請求項32記載のシステム。
- 前記システムは、前記解析サブシステムを実装するように構成された第1の回路、および前記第1の回路と接続され、前記減衰処理サブシステムを実装するように構成された追加の回路を含む音声処理向けデジタル信号プロセッサである、請求項32記載のシステム。
- 前記システムは、前記解析サブシステムと前記減衰処理サブシステムとを実装するように構成されたデータ処理システムである、請求項32記載のシステム。
- 一つの発話チャネルと少なくとも一つの非発話チャネルを有する入力された多重チャネル音声信号から判定された発話内容を強化するシステムであって、
入力された多重チャネル音声信号を解析して複数の減衰制御値を生成するように構成された解析サブシステムであって、前記複数の減衰制御値の各々は、前記発話チャネルから判定される発話に関係する情報内容と、前記入力された多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す、解析サブシステム;および、
前記複数の減衰制御値の中の少なくとも幾つかによる動作制御の下で、前記入力された多重チャネル音声信号に関する前記非発話チャネルの各々に対してダッキング減衰処理を適用し、フィルタリングされた音声出力信号を生成するように構成されている減衰処理サブシステム、
を備えるシステム。 - 前記解析サブシステムは、複数の減衰制御値の各々を生成するように構成され、複数の減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表し、
前記減衰処理サブシステムは、前記複数の減衰制御値に応じて、前記少なくとも一つの非発話チャネルに対して、ダッキング減衰処理を適用するように構成された、
請求項44記載のシステム。 - 前記解析サブシステムは、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから、一つの導出された非発話チャネルを導出して、前記少なくとも幾つかの減衰制御値の各々を生成するように構成され、
前記減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、前記導出された非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す、
請求項44記載のシステム。 - プロセッサにより実行されるプログラムを含むコンピュータ可読記録媒体であって、前記プログラムは、多重チャネル音声信号から判定される発話内容の明瞭度を改善するために、一つの発話チャネルと少なくとも一つの非発話チャネルを有する前記多重チャネル音声信号を表すデータを処理する動作を前記プロセッサに実行させるステップとして:
(a):前記発話チャネルから判定される発話に関係する情報内容と、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す少なくとも一つの減衰制御値を決定する動作を前記プロセッサに実行させるステップ、および、
(b):前記少なくとも一つの減衰制御値に応じて、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させる動作を前記プロセッサに実行させるステップ、
を含むことを特徴とする、コンピュータ可読記録媒体。 - 前記少なくとも一つの減衰制御値に応じて、前記非発話チャネルに関する未加工の減衰制御信号をスケーリングする動作を前記プロセッサに実行させるステップを前記プログラムが含んでいる、請求項47記載のコンピュータ可読記録媒体。
- 前記減衰制御値に応じて、ダッキング利得制御信号をスケーリングして、スケーリングされた利得制御信号を生成する動作を前記プロセッサに実行させるステップであって、複数の前記減衰制御値の各々は、発話チャネルから判定される発話に関係する情報内容と、前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の互いに異なる時刻における類似度の尺度を表す、ステップ;および、
前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルを減衰させるために、前記スケーリングされた利得制御信号を適用する動作を前記プロセッサに実行させるステップ、
を前記プログラムが含んでいる、請求項47記載のコンピュータ可読記録媒体。 - 前記発話チャネルから判定される発話に関連した情報内容を表す発話に関連した特性値の第1の系列を、前記多重チャネル音声信号の前記少なくとも一つの非発話チャネルから判定される発話に関連した情報内容を表す発話に関連した特性値の第2の系列と比較して、減衰制御信号を生成する動作を前記プロセッサに実行させるステップを前記プログラムが含んでいる、請求項49記載のコンピュータ可読記録媒体であって、
前記減衰制御信号によって表される複数の減衰制御値の各々は、前記発話に関連した特性値の第1の系列および前記発話に関連した特性値の第2の系列の両者の間の互いに異なる時刻における類似度の尺度を表す、コンピュータ可読記録媒体。 - 前記発話に関連した特性値の第1の系列は、一連の発話尤度値から成る系列であり、前記発話尤度値の各々は、異なる時刻において、前記発話チャネルが発話内容を表している可能性の高さを示す尤度を表し、
前記発話に関連した特性値の第2の系列は、一連の発話尤度値から成るもう一つの系列であり、前記発話尤度値の各々は、異なる時刻において、前記少なくとも一つの非発話チャネルが発話内容を表している可能性の高さを示す尤度を表す、請求項49記載のコンピュータ可読記録媒体。 - 前記減衰制御値の各々は、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルが、前記発話チャネルから判定される発話内容の知覚される品質を高める発話内容の強化コンテンツを表している可能性の高さを表す尤度と単調に関係付けられる、請求項47記載のコンピュータ可読記録媒体。
- プロセッサにより実行されるプログラムを含むコンピュータ可読記録媒体であって、前記プログラムは、一つの発話チャネルと少なくとも一つの非発話チャネルを有する多重チャネル音声信号を表すデータを処理する動作を前記プロセッサに実行させるステップとして:
(a):前記発話チャネルから判定される発話に関係する第1の情報内容と、前記多重チャネル音声信号内の第1の非発話チャネルから判定される発話に関係する第2の情報内容との間の類似度の尺度を表す少なくとも一つの第1の減衰制御値を決定する動作を前記プロセッサに実行させるステップ;および、
(b):前記発話チャネルから判定される発話に関係する前記第1の情報内容と、前記多重チャネル音声信号内の第2の非発話チャネルから判定される発話に関係する第3の情報内容との間の類似度の尺度を表す少なくとも一つの第2の減衰制御値を決定する動作を前記プロセッサに実行させるステップ、
を含むことを特徴とする、コンピュータ可読記録媒体。 - 前記発話チャネルから判定される発話に関係する前記第1の情報内容を表す発話に関係する特性値の第1の系列を発話に関係する第2の情報内容を表す発話に関係する特性値の第2の系列と比較する動作を前記プロセッサに実行させるステップ;および、
前記第2の減衰制御値を決定するステップは、前記発話に関係する特性値の第1の系列を前記発話に関係する第3の情報内容を表す発話に関係する特性値の第3の系列と比較する動作を前記プロセッサに実行させるステップ、
を前記プログラムが含んでいる、請求項53記載のコンピュータ可読記録媒体。 - 前記少なくとも一つの第1の減衰制御値に応じて、少なくとも一つの前記第1の非発話チャネルを減衰するステップ;および、前記少なくとも一つの第2の減衰制御値に応じて、前記第2の非発話チャネルを減衰する動作を前記プロセッサに実行させるステップ、
を前記プログラムが含んでいる、請求項53記載のコンピュータ可読記録媒体。 - 前記少なくとも一つの第1の減衰制御値は、一連の減衰制御値から成る単一の系列であり、
前記第1の非発話チャネルに対して適用されるダッキング利得の大きさをスケーリングする動作を前記プロセッサに実行させるステップを前記プログラムが含んでいる、請求項53記載のコンピュータ可読記録媒体であって、前記利得の前記適用は、前記発話チャネルから判定される発話内容の明瞭度を改善すると同時に、前記第1の非発話チャネルから判定される発話内容の強化コンテンツに対する望ましくない減衰を生じないように実行される、コンピュータ可読記録媒体。 - プロセッサにより実行されるプログラムを含むコンピュータ可読記録媒体であって、前記プログラムは、一つの発話チャネルと少なくとも一つの非発話チャネルを有する多重チャネル音声信号を表すデータを処理する動作を前記プロセッサに実行させるステップとして:
(a):前記発話チャネルの特性と前記非発話チャネルの特性とを比較して、前記発話チャネルと比較した場合の前記非発話チャネルの相対的な減衰率を制御するための少なくとも一つの減衰値を生成する動作を前記プロセッサに実行させるステップ;および、
(b):少なくとも一つの発話内容強化尤度値に応じて前記少なくとも一つの減衰値を調節し、前記発話チャネルと比較した場合の前記非発話チャネルの相対的な減衰率を制御するための少なくとも一つの調節された減衰値を生成する動作を前記プロセッサに実行させるステップ、
を含むことを特徴とする、コンピュータ可読記録媒体。 - 一つの前記発話内容強化尤度値に応じて前記減衰値の各々をスケーリングし、一つの前記調節された減衰値を生成する動作を前記プロセッサに実行させるステップを前記プログラムが含んでいる、請求項57記載のコンピュータ可読記録媒体。
- 前記発話内容強化尤度値の各々は、非発話チャネルが発話チャネルから判定された発話内容の知覚される品質を高める発話内容の強化コンテンツを表している可能性の高さを示す尤度と単調に関係付けされている、請求項57記載のコンピュータ可読記録媒体。
- 前記少なくとも一つの発話内容強化尤度値は、一連の比較値から成る単一の系列であり、
前記発話チャネルから判定された発話に関係する情報内容を表す発話内容に関係した特性値の第1の系列を非発話チャネルから判定された発話に関係する情報内容を表す発話内容に関係した特性値の第2の系列と比較することにより、一連の比較値から成る単一の系列を決定する動作を前記プロセッサに実行させるステップを前記プログラムが含んでいる、請求項57記載のコンピュータ可読記録媒体であって、
比較値の各々は、前記発話内容に関係した特性値の第1の系列と前記発話内容に関係した特性値の第2の系列との間の互いに異なる時刻における類似度の尺度である、コンピュータ可読記録媒体。 - 前記減衰値の各々は、前記非発話チャネルの減衰率の大きさを表す第1の係数であり、
前記減衰率の大きさは、前記発話チャネルにおける信号電力に対する前記非発話チャネルにおける信号電力の比率が所定の閾値を超えないように制限するのに必要な大きさであり、発話チャネルが発話内容を表している可能性の高さを示す尤度と単調に関係付けられる第2の係数によってスケーリングされる、請求項57記載のコンピュータ可読記録媒体。 - 前記減衰値の各々は、前記非発話チャネルの減衰率の大きさを表す第1の係数であり、
前記減衰率の大きさは、前記非発話チャネルから判定された情報内容の存在下で、前記発話チャネルから判定された発話内容の予測される明瞭度が所定の閾値を超えるようにするのに充分な大きさであり、前記発話チャネルが発話内容を表している可能性の高さを示す尤度と単調に関係付けられる第2の係数によってスケーリングされる、請求項57記載のコンピュータ可読記録媒体。 - 前記発話チャネルの周波数の関数としての電力分布を表す第1の電力スペクトル、および前記非発話チャネルの周波数の関数としての電力分布を表す第2の電力スペクトルを決定する動作を前記プロセッサに実行させるステップ;および、
前記第1の電力スペクトルおよび前記第2の電力スペクトルに応じて、前記減衰値の周波数領域判定を前記プロセッサに実行させるステップ、
を前記プログラムが含んでいる、請求項57記載のコンピュータ可読記録媒体。 - プロセッサにより実行されるプログラムを含むコンピュータ可読記録媒体であって、前記プログラムは、一つの発話チャネルと少なくとも一つの非発話チャネルを有する多重チャネル音声信号を表すデータを処理する動作を前記プロセッサに実行させるステップとして:
前記発話チャネルから判定される発話に関係する情報内容と、前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す少なくとも一つの減衰制御値を決定するステップ;および、
前記少なくとも一つの減衰制御値に応じて、前記多重チャネル音声信号中の少なくとも一つの減衰された非発話チャネルを表すデータを生成するステップであって、前記少なくとも一つの減衰された非発話チャネルの各々は、前記少なくとも一つの減衰制御値に応じた減衰過程を経て伝わる、ステップ、
を含むことを特徴とするコンピュータ可読記録媒体。 - 前記減衰制御値の各々は、前記発話チャネルから判定される発話に関係する情報内容と、前記多重チャネル音声信号内の一つの前記非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表す、請求項64記載のコンピュータ可読記録媒体。
- 前記多重チャネル音声信号を表すデータをさらに処理する動作を前記プロセッサに実行させるステップとして:
前記多重チャネル音声信号内の前記少なくとも一つの非発話チャネルからの導出された非発話チャネルを表すデータを生成し、前記少なくとも一つの減衰制御値を決定する動作を前記プロセッサに実行させるステップ;を前記プログラムがさらに含んでおり、
前記少なくとも一つの減衰制御値は、発話チャネルから判定される発話に関係する情報内容と、前記導出された非発話チャネルから判定される発話に関係する情報内容との間の類似度の尺度を表すことを特徴とする、請求項64記載のコンピュータ可読記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31143710P | 2010-03-08 | 2010-03-08 | |
US61/311,437 | 2010-03-08 | ||
PCT/US2011/026505 WO2011112382A1 (en) | 2010-03-08 | 2011-02-28 | Method and system for scaling ducking of speech-relevant channels in multi-channel audio |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013521541A JP2013521541A (ja) | 2013-06-10 |
JP5674827B2 true JP5674827B2 (ja) | 2015-02-25 |
Family
ID=43919902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012557079A Active JP5674827B2 (ja) | 2010-03-08 | 2011-02-28 | 多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム |
Country Status (9)
Country | Link |
---|---|
US (2) | US9219973B2 (ja) |
EP (1) | EP2545552B1 (ja) |
JP (1) | JP5674827B2 (ja) |
CN (2) | CN104811891B (ja) |
BR (2) | BR112012022571B1 (ja) |
ES (1) | ES2709523T3 (ja) |
RU (1) | RU2520420C2 (ja) |
TW (1) | TWI459828B (ja) |
WO (1) | WO2011112382A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI672693B (zh) * | 2017-05-10 | 2019-09-21 | 英商思睿邏輯國際半導體有限公司 | 用於聲學迴聲消除的組合參考信號 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2586874C1 (ru) * | 2011-12-15 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения |
US9781529B2 (en) | 2012-03-27 | 2017-10-03 | Htc Corporation | Electronic apparatus and method for activating specified function thereof |
WO2013150340A1 (en) * | 2012-04-05 | 2013-10-10 | Nokia Corporation | Adaptive audio signal filtering |
US9886794B2 (en) | 2012-06-05 | 2018-02-06 | Apple Inc. | Problem reporting in maps |
US9230556B2 (en) | 2012-06-05 | 2016-01-05 | Apple Inc. | Voice instructions during navigation |
US9516418B2 (en) * | 2013-01-29 | 2016-12-06 | 2236008 Ontario Inc. | Sound field spatial stabilizer |
EP2760021B1 (en) * | 2013-01-29 | 2018-01-17 | 2236008 Ontario Inc. | Sound field spatial stabilizer |
MY179136A (en) | 2013-03-05 | 2020-10-28 | Fraunhofer Ges Forschung | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
JP6026678B2 (ja) * | 2013-04-05 | 2016-11-16 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
US9106196B2 (en) | 2013-06-20 | 2015-08-11 | 2236008 Ontario Inc. | Sound field spatial stabilizer with echo spectral coherence compensation |
US9099973B2 (en) | 2013-06-20 | 2015-08-04 | 2236008 Ontario Inc. | Sound field spatial stabilizer with structured noise compensation |
US9271100B2 (en) | 2013-06-20 | 2016-02-23 | 2236008 Ontario Inc. | Sound field spatial stabilizer with spectral coherence compensation |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
WO2015116687A1 (en) * | 2014-01-28 | 2015-08-06 | St. Jude Medical, Cardiology Division, Inc. | Elongate medical devices incorporating a flexible substrate, a sensor, and electrically-conductive traces |
US9654076B2 (en) * | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US8874448B1 (en) * | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
US9615170B2 (en) * | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
BR112017006325B1 (pt) * | 2014-10-02 | 2023-12-26 | Dolby International Ab | Método de decodificação e decodificador para o realce de diálogo |
CN107004427B (zh) * | 2014-12-12 | 2020-04-14 | 华为技术有限公司 | 增强多声道音频信号内语音分量的信号处理装置 |
US10238546B2 (en) | 2015-01-22 | 2019-03-26 | Eers Global Technologies Inc. | Active hearing protection device and method therefore |
US9747923B2 (en) * | 2015-04-17 | 2017-08-29 | Zvox Audio, LLC | Voice audio rendering augmentation |
US9947364B2 (en) | 2015-09-16 | 2018-04-17 | Google Llc | Enhancing audio using multiple recording devices |
JP6567479B2 (ja) * | 2016-08-31 | 2019-08-28 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
EP3566229B1 (en) * | 2017-01-23 | 2020-11-25 | Huawei Technologies Co., Ltd. | An apparatus and method for enhancing a wanted component in a signal |
US11335357B2 (en) * | 2018-08-14 | 2022-05-17 | Bose Corporation | Playback enhancement in audio systems |
CN111354356B (zh) * | 2018-12-24 | 2024-04-30 | 北京搜狗科技发展有限公司 | 一种语音数据处理方法及装置 |
US11335361B2 (en) * | 2020-04-24 | 2022-05-17 | Universal Electronics Inc. | Method and apparatus for providing noise suppression to an intelligent personal assistant |
JP2023530225A (ja) | 2020-05-29 | 2023-07-14 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 初期オーディオ信号を処理するための方法および装置 |
CN115881146A (zh) * | 2021-08-05 | 2023-03-31 | 哈曼国际工业有限公司 | 用于动态语音增强的方法及系统 |
WO2023208342A1 (en) * | 2022-04-27 | 2023-11-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for scaling of ducking gains for spatial, immersive, single- or multi-channel reproduction layouts |
Family Cites Families (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5666429A (en) * | 1994-07-18 | 1997-09-09 | Motorola, Inc. | Energy estimator and method therefor |
JPH08222979A (ja) * | 1995-02-13 | 1996-08-30 | Sony Corp | オーディオ信号処理装置、およびオーディオ信号処理方法、並びにテレビジョン受像機 |
US5920834A (en) * | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
US5983183A (en) * | 1997-07-07 | 1999-11-09 | General Data Comm, Inc. | Audio automatic gain control system |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
US6226321B1 (en) * | 1998-05-08 | 2001-05-01 | The United States Of America As Represented By The Secretary Of The Air Force | Multichannel parametric adaptive matched filter receiver |
AU2408500A (en) * | 1999-01-07 | 2000-07-24 | Tellabs Operations, Inc. | Method and apparatus for adaptively suppressing noise |
US6442278B1 (en) * | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
KR100304666B1 (ko) * | 1999-08-28 | 2001-11-01 | 윤종용 | 음성 향상 방법 |
EP1103420B1 (en) * | 1999-11-24 | 2006-06-21 | Donnelly Corporation | Rearview mirror assembly with utility functions |
US6615162B2 (en) * | 1999-12-06 | 2003-09-02 | Dmi Biosciences, Inc. | Noise reducing/resolution enhancing signal processing method and system |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
JP2001268700A (ja) * | 2000-03-17 | 2001-09-28 | Fujitsu Ten Ltd | 音響装置 |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6766292B1 (en) * | 2000-03-28 | 2004-07-20 | Tellabs Operations, Inc. | Relative noise ratio weighting techniques for adaptive noise cancellation |
US20040096065A1 (en) * | 2000-05-26 | 2004-05-20 | Vaudrey Michael A. | Voice-to-remaining audio (VRA) interactive center channel downmix |
US20070233479A1 (en) * | 2002-05-30 | 2007-10-04 | Burnett Gregory C | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US20020159434A1 (en) * | 2001-02-12 | 2002-10-31 | Eleven Engineering Inc. | Multipoint short range radio frequency system |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US20040148166A1 (en) * | 2001-06-22 | 2004-07-29 | Huimin Zheng | Noise-stripping device |
CN1552171A (zh) * | 2001-09-06 | 2004-12-01 | �ʼҷ����ֵ��ӹɷ�����˾ | 音频再现设备 |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
WO2007106399A2 (en) * | 2006-03-10 | 2007-09-20 | Mh Acoustics, Llc | Noise-reducing directional microphone array |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
JP3810004B2 (ja) | 2002-03-15 | 2006-08-16 | 日本電信電話株式会社 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
CN100477705C (zh) * | 2002-07-01 | 2009-04-08 | 皇家飞利浦电子股份有限公司 | 音频增强系统、配有该系统的系统、失真信号增强方法 |
WO2004040555A1 (ja) * | 2002-10-31 | 2004-05-13 | Fujitsu Limited | 音声強調装置 |
US7305097B2 (en) * | 2003-02-14 | 2007-12-04 | Bose Corporation | Controlling fading and surround signal level |
US8271279B2 (en) * | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7127076B2 (en) * | 2003-03-03 | 2006-10-24 | Phonak Ag | Method for manufacturing acoustical devices and for reducing especially wind disturbances |
US8724822B2 (en) * | 2003-05-09 | 2014-05-13 | Nuance Communications, Inc. | Noisy environment communication enhancement system |
DK1509065T3 (da) * | 2003-08-21 | 2006-08-07 | Bernafon Ag | Fremgangsmåde til behandling af audiosignaler |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
KR100679044B1 (ko) * | 2005-03-07 | 2007-02-06 | 삼성전자주식회사 | 사용자 적응형 음성 인식 방법 및 장치 |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
WO2007029536A1 (ja) * | 2005-09-02 | 2007-03-15 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
US20070053522A1 (en) * | 2005-09-08 | 2007-03-08 | Murray Daniel J | Method and apparatus for directional enhancement of speech elements in noisy environments |
JP4356670B2 (ja) * | 2005-09-12 | 2009-11-04 | ソニー株式会社 | 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置 |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
WO2007098258A1 (en) * | 2006-02-24 | 2007-08-30 | Neural Audio Corporation | Audio codec conditioning system and method |
JP4738213B2 (ja) * | 2006-03-09 | 2011-08-03 | 富士通株式会社 | 利得調整方法及び利得調整装置 |
US7555075B2 (en) * | 2006-04-07 | 2009-06-30 | Freescale Semiconductor, Inc. | Adjustable noise suppression system |
KR101137359B1 (ko) * | 2006-09-14 | 2012-04-25 | 엘지전자 주식회사 | 다이알로그 증폭 기술 |
US20080082320A1 (en) * | 2006-09-29 | 2008-04-03 | Nokia Corporation | Apparatus, method and computer program product for advanced voice conversion |
EP1918910B1 (en) * | 2006-10-31 | 2009-03-11 | Harman Becker Automotive Systems GmbH | Model-based enhancement of speech signals |
US8615393B2 (en) * | 2006-11-15 | 2013-12-24 | Microsoft Corporation | Noise suppressor for speech recognition |
EP2092789A4 (en) * | 2006-12-12 | 2009-12-23 | Thx Ltd | DYNAMIC SURROUND CHANNEL VOLUME CONTROL |
JP2008148179A (ja) * | 2006-12-13 | 2008-06-26 | Fujitsu Ltd | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 |
WO2008100503A2 (en) * | 2007-02-12 | 2008-08-21 | Dolby Laboratories Licensing Corporation | Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
ES2391228T3 (es) * | 2007-02-26 | 2012-11-22 | Dolby Laboratories Licensing Corporation | Realce de voz en audio de entretenimiento |
JP2008216720A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 信号処理の方法、装置、及びプログラム |
US20090010453A1 (en) * | 2007-07-02 | 2009-01-08 | Motorola, Inc. | Intelligent gradient noise reduction system |
GB2450886B (en) * | 2007-07-10 | 2009-12-16 | Motorola Inc | Voice activity detector and a method of operation |
US8600516B2 (en) * | 2007-07-17 | 2013-12-03 | Advanced Bionics Ag | Spectral contrast enhancement in a cochlear implant speech processor |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8326617B2 (en) * | 2007-10-24 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement with minimum gating |
US8296136B2 (en) * | 2007-11-15 | 2012-10-23 | Qnx Software Systems Limited | Dynamic controller for improving speech intelligibility |
KR101444100B1 (ko) * | 2007-11-15 | 2014-09-26 | 삼성전자주식회사 | 혼합 사운드로부터 잡음을 제거하는 방법 및 장치 |
US8315398B2 (en) * | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
WO2009084919A1 (en) * | 2008-01-01 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2009084916A1 (en) * | 2008-01-01 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
SG189747A1 (en) | 2008-04-18 | 2013-05-31 | Dolby Lab Licensing Corp | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
US8645129B2 (en) * | 2008-05-12 | 2014-02-04 | Broadcom Corporation | Integrated speech intelligibility enhancement system and acoustic echo canceller |
US8321214B2 (en) * | 2008-06-02 | 2012-11-27 | Qualcomm Incorporated | Systems, methods, and apparatus for multichannel signal amplitude balancing |
WO2010003068A1 (en) | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
EP2144233A3 (en) * | 2008-07-09 | 2013-09-11 | Yamaha Corporation | Noise supression estimation device and noise supression device |
US8670575B2 (en) * | 2008-12-05 | 2014-03-11 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8185389B2 (en) * | 2008-12-16 | 2012-05-22 | Microsoft Corporation | Noise suppressor for robust speech recognition |
WO2010068997A1 (en) * | 2008-12-19 | 2010-06-24 | Cochlear Limited | Music pre-processing for hearing prostheses |
US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
US8620008B2 (en) * | 2009-01-20 | 2013-12-31 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
DK2389773T3 (en) * | 2009-01-20 | 2017-06-19 | Widex As | HEARING AND A PROCEDURE TO DETECT AND MUTE TRANSIENTS |
US8428758B2 (en) * | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
US8538043B2 (en) * | 2009-03-08 | 2013-09-17 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US8644517B2 (en) * | 2009-08-17 | 2014-02-04 | Broadcom Corporation | System and method for automatic disabling and enabling of an acoustic beamformer |
EP2475423B1 (en) * | 2009-09-11 | 2016-12-14 | Advanced Bionics AG | Dynamic noise reduction in auditory prosthesis systems |
US8204742B2 (en) * | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
US9552845B2 (en) * | 2009-10-09 | 2017-01-24 | Dolby Laboratories Licensing Corporation | Automatic generation of metadata for audio dominance effects |
US20110099596A1 (en) * | 2009-10-26 | 2011-04-28 | Ure Michael J | System and method for interactive communication with a media device user such as a television viewer |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
US20110125494A1 (en) * | 2009-11-23 | 2011-05-26 | Cambridge Silicon Radio Limited | Speech Intelligibility |
KR101341536B1 (ko) * | 2010-01-06 | 2013-12-16 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8553892B2 (en) * | 2010-01-06 | 2013-10-08 | Apple Inc. | Processing a multi-channel signal for output to a mono speaker |
US20110178800A1 (en) * | 2010-01-19 | 2011-07-21 | Lloyd Watts | Distortion Measurement for Noise Suppression System |
-
2011
- 2011-02-18 TW TW100105440A patent/TWI459828B/zh active
- 2011-02-28 CN CN201410830734.2A patent/CN104811891B/zh active Active
- 2011-02-28 BR BR112012022571-5A patent/BR112012022571B1/pt active IP Right Grant
- 2011-02-28 US US13/583,204 patent/US9219973B2/en active Active
- 2011-02-28 BR BR122019024041-8A patent/BR122019024041B1/pt active IP Right Grant
- 2011-02-28 WO PCT/US2011/026505 patent/WO2011112382A1/en active Application Filing
- 2011-02-28 CN CN201180012782.5A patent/CN102792374B/zh active Active
- 2011-02-28 JP JP2012557079A patent/JP5674827B2/ja active Active
- 2011-02-28 EP EP11707537.4A patent/EP2545552B1/en active Active
- 2011-02-28 RU RU2012141463/08A patent/RU2520420C2/ru active
- 2011-02-28 ES ES11707537T patent/ES2709523T3/es active Active
-
2015
- 2015-11-16 US US14/942,706 patent/US9881635B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI672693B (zh) * | 2017-05-10 | 2019-09-21 | 英商思睿邏輯國際半導體有限公司 | 用於聲學迴聲消除的組合參考信號 |
Also Published As
Publication number | Publication date |
---|---|
JP2013521541A (ja) | 2013-06-10 |
WO2011112382A1 (en) | 2011-09-15 |
ES2709523T3 (es) | 2019-04-16 |
EP2545552B1 (en) | 2018-12-12 |
RU2520420C2 (ru) | 2014-06-27 |
BR112012022571B1 (pt) | 2020-11-17 |
BR122019024041B1 (pt) | 2020-08-11 |
RU2012141463A (ru) | 2014-04-20 |
BR112012022571A2 (pt) | 2016-08-30 |
CN104811891A (zh) | 2015-07-29 |
CN104811891B (zh) | 2017-06-27 |
EP2545552A1 (en) | 2013-01-16 |
TW201215177A (en) | 2012-04-01 |
TWI459828B (zh) | 2014-11-01 |
CN102792374A (zh) | 2012-11-21 |
CN102792374B (zh) | 2015-05-27 |
US9219973B2 (en) | 2015-12-22 |
US9881635B2 (en) | 2018-01-30 |
US20160071527A1 (en) | 2016-03-10 |
US20130006619A1 (en) | 2013-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5674827B2 (ja) | 多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム | |
JP5259759B2 (ja) | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 | |
TWI639347B (zh) | 用於音訊信號處理之多聲道直接-周圍分解之裝置及方法 | |
RU2461144C2 (ru) | Устройство и способ для генерации многоканального сигнала, использующие обработку голосового сигнала | |
EP2210427B1 (en) | Apparatus, method and computer program for extracting an ambient signal | |
US20130163781A1 (en) | Breathing noise suppression for audio signals | |
Li et al. | Joint Noise Reduction and Listening Enhancement for Full-End Speech Enhancement | |
JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 | |
RU2782364C1 (ru) | Устройство и способ отделения источников с использованием оценки и управления качеством звука |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5674827 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |