JP2019204081A - ドライ音と環境音の分離 - Google Patents

ドライ音と環境音の分離 Download PDF

Info

Publication number
JP2019204081A
JP2019204081A JP2019092015A JP2019092015A JP2019204081A JP 2019204081 A JP2019204081 A JP 2019204081A JP 2019092015 A JP2019092015 A JP 2019092015A JP 2019092015 A JP2019092015 A JP 2019092015A JP 2019204081 A JP2019204081 A JP 2019204081A
Authority
JP
Japan
Prior art keywords
signal
input signal
audio input
signal component
dry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019092015A
Other languages
English (en)
Inventor
フィナウア シュテファン
Finauer Stefan
フィナウア シュテファン
フォン テュルクハイム フリードリヒ
Von Turckheim Friedrich
フォン テュルクハイム フリードリヒ
ミュンヒ トビアス
Tobias Muench
ミュンヒ トビアス
リー クリストファー
Lee Christopher
リー クリストファー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman Becker Automotive Systems GmbH
Original Assignee
Harman Becker Automotive Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman Becker Automotive Systems GmbH filed Critical Harman Becker Automotive Systems GmbH
Publication of JP2019204081A publication Critical patent/JP2019204081A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H7/00Measuring reverberation time ; room acoustic measurements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

【課題】ドライ音と環境音の分離の提供。【解決手段】本発明は、音声入力信号をドライ信号成分と環境信号成分とに分離する方法に関し、方法は、音声入力信号を周波数空間に変換することを含む、変換入力信号を生成することと、推定環境信号成分を生成するために、変換入力信号に平滑化フィルタを適用することと、推定環境信号成分に基づいて、ドライ信号成分を特定することと、特定したドライ信号成分及び音声入力信号に基づいて、環境信号成分を特定することとを含む。【選択図】図2

Description

本開示は、音声入力信号を、ドライ信号成分と環境信号成分とに分離する方法、及び方法を実行するのに使用される対応音声モジュールに関する。さらに、コンピュータプログラム、及びコンピュータプログラムを含むキャリアが提供される。
異なるソースから再生される音声信号は、ドライ信号成分と、音声信号を録音した部屋とドライ信号成分が相互に作用した時に生成された間接信号成分を含む環境信号成分とを含む。オーディオ業界では、主にドライ信号成分を必要とする、または環境信号成分のみを必要とするアプリケーションが知られている。例として、5.1システムで出力されるべきステレオ入力信号において、ドライ信号成分は実質的に前方スピーカで出力され、環境信号成分は後方スピーカで出力されることが望ましい。別のアプリケーションは、音声信号内の環境信号成分を増幅する。
従って、ドライ信号成分と環境信号成分の両成分を含む音声入力信号において、ドライ信号成分または環境信号成分を効果的に特定できる必要がある。
この要望は、独立した特許請求の範囲の特徴により満たされる。さらなる態様が、従属した特許請求の範囲に記載される。
第1の態様によれば、音声入力信号をドライ信号成分と環境信号成分とに分離する方法が提供され、この方法では変換入力信号が生成され、これは音声入力信号を周波数空間に変換することを含む。推定環境信号成分を生成するために、周波数空間において変換入力信号に平滑化フィルタが適用される。推定環境信号成分に基づいて、ドライ信号成分が特定され、次いで特定されたドライ信号成分及び音声入力信号に基づいて、環境信号成分が特定される。
環境信号成分に起因する音声入力信号の振幅変化の速度は遅いため、平滑化フィルタを用いて環境信号成分を抽出することが可能である。平滑化フィルタを適用すると、ドライ信号成分を抑制することができ、推定環境信号成分が生成され得る。推定環境信号成分に基づいてドライ信号成分を特定することが可能であり、次いで特定されたドライ信号成分及び音声入力信号を用いて、例えば特定されたドライ信号成分を音声入力から減算すると、環境信号成分が特定され得る。この減算は周波数空間で実行されてもよいが、この特定は時間領域で行うことが可能であることを理解されたい。
さらに、音声入力信号をドライ信号成分と環境信号成分とに分離するように構成された音声モジュールが提供され、音声モジュールは、メモリと、少なくとも1つの処理装置とを備え、メモリは、少なくとも1つの処理装置により実行可能な命令を含む。次いで音声モジュールは、上記で述べられたステップ、または下記でさらに詳しく論述されるステップを実行するように動作可能である。
さらに、プログラムコードを含むコンピュータプログラムが提供され、プログラムコードの実行に起因して、少なくとも1つの処理装置は、上記で論述されるまたは下記でさらに詳しく説明される方法を実行する。
コンピュータプログラムを含むキャリアが提供され、キャリアは、電子信号、光信号、無線信号、またはコンピュータ可読記憶媒体のうちの1つである。
上記で述べられた特徴、及び下記でこれから説明される特徴は、示されるそれぞれの組み合わせだけでなく、他の組み合わせまたは単独で、本発明の範囲から逸脱することなく使用できることを理解されたい。下記に説明される態様及び実施形態で述べられる上記及び下記の特徴は、別段の明記がない限り、他の実施形態において互いに組み合わせることができる。
例えば、本願は以下の項目を提供する。
(項目1)
音声入力信号(10)をドライ信号成分(11)と環境信号成分(12)とに分離する方法であって、
上記音声入力信号を周波数空間に変換することを含む、変換入力信号を生成することと、
推定環境信号成分を生成するために、上記変換入力信号に平滑化フィルタ(130)を適用することと、
上記推定環境信号成分に基づいて、上記ドライ信号成分(11)を特定することと、
上記特定したドライ信号成分(11)及び上記音声入力信号(10)に基づいて、上記環境信号成分(12)を特定することと
を含む、上記方法。
(項目2)
上記音声入力信号(10)は、上記環境信号成分(12)及び上記ドライ信号成分(11)が存在する複合信号期間(15)と、実質的に上記環境信号のみが存在する、上記複合信号期間(15)に続くリバーブ信号期間(16)とを含み、
上記方法は、
上記音声入力信号内に上記リバーブ信号期間(16)を検出することと、
上記リバーブ信号期間の上記推定環境信号成分内において、推定リバーブ信号成分を特定することと、
上記推定環境信号成分を生成するための上記平滑化フィルタにおいて使用される平滑化係数を決定するために、上記推定リバーブ信号成分を、上記リバーブ信号期間の上記音声入力信号と比較することと
を含む、上記項目に記載の方法。
(項目3)
上記平滑化フィルタ(130)は一次再帰フィルタを含む、上記項目のいずれか一項に記載の方法。
(項目4)
上記変換入力信号の振幅を特定することと、
上記平滑化フィルタ(130)を適用する前に、上記変換入力信号の上記特定された振幅を減衰させることと、
をさらに含む、上記項目のいずれか一項に記載の方法。
(項目5)
上記環境信号成分(12)対上記音声入力信号(10)の比が特定され、
上記特定された振幅は、上記特定された比に基づいて減衰される、上記項目のいずれか一項に記載の方法。
(項目6)
相当量の上記ドライ信号成分(11)が上記音声入力信号(10)内に存在し始めるオンセット(17)を、上記音声入力信号(10)内で特定するステップと、
上記相当量の上記ドライ信号成分(11)が上記音声入力信号内に存在しなくなるオフセット(18)を、上記音声入力信号内で特定するステップと
を含む、上記項目のいずれか一項に記載の方法。
(項目7)
相当量の上記ドライ信号成分(11)が上記音声入力信号(10)内に存在し始めるオンセット(17)を、上記音声入力信号(10)内で特定するステップと、
上記相当量の上記ドライ信号成分(11)が上記音声入力信号内に存在しなくなるオフセット(18)を、上記音声入力信号内で特定するステップと
を含み、
上記オフセット(18)後に開始し、上記平滑化フィルタの出力が所定の基準を満たす時に終了する上記リバーブ信号期間(16)が特定され、
上記推定リバーブ信号成分を上記リバーブ信号期間の上記音声入力信号と比較することは、上記特定されたオフセット(18)後の上記音声入力信号の一部において実行される、上記項目のいずれか一項に記載の方法。
(項目8)
相当量の上記ドライ信号成分(11)が上記音声入力信号(10)内に存在し始めるオンセット(17)を、上記音声入力信号(10)内で特定するステップと、
上記相当量の上記ドライ信号成分(11)が上記音声入力信号内に存在しなくなるオフセット(18)を、上記音声入力信号内で特定するステップと
を含み、
上記環境信号成分(12)対上記音声入力信号(10)の上記比を特定することは、
上記オフセット前の上記音声入力信号の最後のサンプルにおける上記音声入力信号(10)の振幅を特定することと、
上記オフセット後の上記音声入力信号の最初のサンプルにおける上記音声入力信号(10)の振幅を特定することと、
上記最後のサンプルにおける上記振幅と、上記最初のサンプルにおける上記振幅を考慮して、上記比を特定することと
を含む、上記項目のいずれか一項に記載の方法。
(項目9)
上記変換入力信号の上記振幅を減衰させるために使用される平均比を決定するために、
上記最後のサンプル及び上記最初のサンプルを考慮して上記比を特定する上記ステップが、上記音声入力信号内の異なるオフセットに対し数回繰り返され、
上記異なるオフセットに対して上記ドライ信号成分の長さが特定され、
上記特定されたドライ信号成分の上記長さが長いほど、上記対応する比が上記平均比に大きく寄与する、上記項目のいずれか一項に記載の方法。
(項目10)
上記音声入力信号(10)内に上記リバーブ信号期間(16)が現在存在するか否かが特定され、存在する場合は、上記推定環境信号成分に上記リバーブ信号期間の上記音声入力が使用され、存在しない場合は、上記推定環境信号成分に上記平滑化フィルタの出力が使用される、上記項目のいずれか一項に記載の方法。
(項目11)
上記変換入力信号の上記減衰された振幅から、変動を抽出することと、
上記推定環境信号成分を特定するために、上記平滑化フィルタの出力に、上記抽出した変動を加えることと、
をさらに含む、上記項目のいずれか一項に記載の方法。
(項目12)
上記方法は、上記変換入力信号から、指数関数的に減少するピーク後続信号を特定することであって、上記ピーク後続信号はその後1未満の係数で減衰される、上記特定することをさらに含み、
上記減衰されたピーク後続信号と上記音声入力信号が交差する時、上記入力信号が減少する点で上記オフセット(18)が検出される、上記項目のいずれか一項に記載の方法。
(項目13)
上記推定リバーブ信号成分が上記リバーブ信号期間の上記音声入力信号に対応するように、上記平滑化係数は決定される、上記項目のいずれか一項に記載の方法。
(項目14)
上記ドライ信号成分を特定するために、上記平滑化フィルタの出力から生成された上記推定環境信号成分は、上記音声入力信号から減算される、上記項目のいずれか一項に記載の方法。
(項目15)
音声入力信号をドライ信号成分と環境信号成分とに分離するように構成された音声モジュール(100)であって、上記音声モジュールは、メモリと、少なくとも1つの処理装置とを備え、上記メモリは、上記少なくとも1つの処理装置により実行可能な命令を含み、上記音声モジュールは、
上記音声入力信号を周波数空間に変換することを含む、変換入力信号を生成することと、
推定環境信号成分を生成するために、上記変換入力信号に平滑化フィルタを適用することと、
上記推定環境信号成分に基づいて、上記ドライ信号成分を特定することと、
上記特定したドライ信号成分及び上記音声入力信号に基づいて、上記環境信号成分を特定することと
を動作可能である、上記音声モジュール。
(摘要)
本発明は、音声入力信号をドライ信号成分と環境信号成分とに分離する方法に関し、方法は、音声入力信号を周波数空間に変換することを含む、変換入力信号を生成することと、推定環境信号成分を生成するために、変換入力信号に平滑化フィルタを適用することと、推定環境信号成分に基づいて、ドライ信号成分を特定することと、特定したドライ信号成分及び音声入力信号に基づいて、環境信号成分を特定することとを含む。
本出願の前述及び追加の特徴及び効果は、下記の発明を実施するための形態を添付図面と併せて読むことにより、明らかになるであろう。添付図面において、類似参照番号は類似要素を指すものとする。
単一の周波数ビンにおける環境振幅を含む音声入力信号の経時的な概略図を示す。 音声入力信号内のドライ信号成分を環境信号成分から分離させるのに必要な構成要素を有するモジュールの概要を示す。 図2で実行されるリバーブ特性推定の詳細図を示す。 図2で行われる環境振幅の計算のさらなる詳細図を示す。 音声入力信号をドライ信号成分と環境信号成分とに分離するのに使用される平滑化再帰フィルタの概略図を示す。 ドライ信号成分及び環境信号成分を特定するために、音声入力信号を処理するのに使用される方法の例示的フローチャートを示す。 ドライ信号成分及び環境信号成分を特定するために、音声信号において実行される処理ステップの方法の別の例示的フローチャートを示す。 環境音信号成分内に存在するリバーブ成分を処理するステップを含む方法の例示的フローチャートを示す。 入力信号をドライ信号成分と環境信号成分とに分離するために実行される方法の例示的フローチャートを示す。 図1〜図9に関連して論述されるように音声信号を異なる成分に分離するように構成された音声モジュールの例示的構造表示を示す。
下記において、本発明の実施形態が、添付図面を参照して詳細に説明される。下記の実施形態の説明は、限定的な意味で解釈されるべきではないことを理解されたい。本発明の範囲は、下記に説明される実施形態または図面に限定される意図はなく、実施形態または図面は例示にすぎない。
図面は、概略的な表現であるとみなされるべきであり、図面に例示される要素は、必ずしも縮尺通りに示されてはいない。むしろ、様々な要素は、それらの機能及び一般的目的が当業者に明らかになるように表現されている。図面に示され、下記において説明される機能ブロック、デバイス、物理または機能ユニットの構成要素の間の任意の接続すなわち結合は、間接的な接続すなわち結合によっても実施され得る。構成要素間の結合は、有線または無線接続により確立され得る。機能ブロックは、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせで実施され得る。
図1は、周波数空間に変換され異なるビンに分離された音声入力信号10の概略図を示し、1つの周波数ビンの信号が経時的に示され、これには、環境振幅12を含む入力振幅10が含まれる。入力信号内に音が存在し始める時にオンセット17が存在し、音が止まる時にオフセット18が存在する。明らかなように、オンセットとオフセットの間の期間に、入力信号は、把握されておらず図示されていないドライ信号成分と、環境信号成分12とを含む。この複合信号期間15の後に、主に環境信号が存在するリバーブ信号期間16が続く。リバーブ信号期間の一部は、リバーブテールとも呼ばれ、大抵の室内でこのリバーブテールは、指数関数的減少特性を有する。同様に、音響エネルギーが連続的に室内に供給されると、図1に示されるように、リバーブ振幅は指数関数的に増大する。楽器によりまたはスピーカを介して音が演奏されると、音がオフセット18で止まるまで直接音と環境音は重なり、リバーブ部分で環境信号成分が明らかとなる。ドライ信号成分及び環境信号成分の両方を含む録音において、実際の部屋の中の音響による指数関数的増大及び減少を得るために、例えば一次再帰フィルタを用いて、全ての周波数ビンの振幅変化の速度を制限することにより、環境成分が抽出され得る。
図2は、音声入力信号10内の環境信号成分をドライ信号成分から分離するために、音声入力信号の信号処理中に実行される主なステップに関する概略図を示す。
図2に示されるように、音声入力信号10は、図2に示されるいくつかの処理モジュールで処理され、この処理は、入力信号のチャネルごとに個別に実行される。従って、提案される方法は、モノラルを含む任意の数の音声チャネルに対応する。モジュール50にて、短時間フーリエ変換(STFT)を用いて音声入力信号をフーリエ変換で周波数領域に変換した後、モジュール60にて、時間フレームごとに振幅が計算され、推定モジュール200にて推定された入力信号の分析から得られるパラメータに基づいて、モジュール100にて振幅が平滑化される。このために、時間信号の重複ウィンドウが使用され得る。モジュール100では、下記でさらに詳しく説明されるように、平滑化フィルタが信号に適用され、これによりドライ信号成分が抑制され、その結果、出力は信号の環境部分を表す。加算器75において入力信号から環境部分を減算することにより、推定ドライ振幅が加算器75の出力に存在する。モジュール70にて、ドライ信号コンテンツの振幅が抽出され周波数領域の入力信号に適用されるように振幅調整が信号に適用され、次にモジュール80にて時間領域に変換し戻される。従って、モジュール80の出力には、N個のドライ出力信号成分が存在する。ドライ成分が判明すると、図2に示されるようにN個の環境出力チャネル12を得るために、入力信号からドライ信号成分を減算することにより、環境成分が生成され得る。
下記では、異なるモジュールの信号の流れが、より詳しく説明される。モジュール50では、短時間フーリエ変換STFTが行われ、入力信号は時間領域から周波数領域に変換される。計算効率のために高速フーリエ変換が使用され得るが、デジタルフーリエ変換の他の実施態様、ウェーブレット変換のコサイン変換といった他の種類の変換も適用することができる。時間領域の入力は、長さN/2のサンプルのブロックに分割され得る。ウィンドウ作成、任意でゼロパディング、及び実際の高速フーリエ変換動作が実行される。N個の入力サンプルのうちの1つの変換の出力は、ゼロパディングが適用されない場合、実数/虚数表現のN個の複素スペクトルビンのブロックである。
モジュール60にて、実数及び虚数表現の複素入力スペクトルからの時間周波数ビンごとに、振幅が計算される。
モジュール200にて、環境信号成分を推定するために、モジュール100で使用されるいくつかのパラメータが決定される。図3に示されるように、オンセット検出モジュール210及びオフセット検出モジュール220に、モジュール60からの出力である入力振幅が使用される。オフセット検出モジュール220にて、入力振幅に基づいて、周波数ごとに、指数関数的減少を有するピーク後続曲線が計算される。ピーク後続曲線は、0.4など、調整可能な係数apf(k)により、0〜1の範囲で減衰される。図1に示されるように、ピーク後続曲線の減少時間は、現在の推定リバーブ時間もしくは調整可能な係数、またはこれらの組み合わせに対応する。図1に示されるように、入力振幅が減衰されたピーク後続曲線を下方向に交差する時、オフセットが検出される。
オンセット検出モジュール210にて、平滑化された実際の入力振幅が調整可能閾値より急勾配で増大する時、例えば2つの連続するサンプル間の比がある限度を超えた時、オンセットが観察され、図1に示されるオンセット17が検出される。閾値は、現在の推定減少率に基づいて、自動的に調整され得る。閾値は、周波数にも依存し得る。閾値は、1より大きくなければならない。
モジュール230にて、音及びリバーブテール検出が実行される。リバーブテールすなわちリバーブ信号期間16は、オフセット後に始まり、平滑化された振幅が再び増大し始めるまで続く。これは、平滑化された振幅の新しい値が、前の値よりも大きい場合に当てはまる。入力振幅は、リバーブ信号期間16の終了を特定するのにも使用され得るが、これはさらに難しい。なぜなら、リバーブ信号期間16の振幅は、明確な指数関数的減少を有さず、いくつかの変動を有し、この変動は、リバーブ信号期間の終了を検出することをより困難にするからである。オンセット17とオフセット18の間に、音が検出される。観察方法の性質に基づいて、いくつかのオンセットが、間にオフセットがない状態で検出され得る。この場合、音期間もリバーブ信号期間も検出されない。下記では、音期間は、環境信号成分及びドライ信号成分が存在する複合信号期間とも称される。最新のオンセットと後続のオンセットの間のいくつかのSTFTブロックを使用して、音の長さが測定される。
モジュール240にて、モジュール100に含まれる平滑化フィルタにおいて後で使用される平滑化係数が更新される。このために、モジュール100内の平滑フィルタから出力された推定振幅と、音声入力振幅との偏差は、リバーブ信号期間16の間の周波数ビンごとに個別に評価される。オフセット検出220によりリバーブ信号期間すなわちリバーブテールの始まりが一旦示されると、推定リバーブテールと平滑化された実際のリバーブテールの推移は、両方ともバッファに記録される。これは、以下の基準のうちの1つが満たされるまで、全ての変換信号ブロックに対して行われる。
‐リバーブテールすなわちリバーブ信号期間の終わりが検出されること。
‐推定リバーブテール及び平滑化された実際のリバーブテールの両方が、オフセット検出後の第1のビンと比べて、例えば10dBなど定義された閾値を超えて減少すること。部屋のリバーブの初期減衰時間を特定するために10dB減少が使用され得、10dBは好適な値であり得るが、他の値が使用されてもよい。
‐サンプルが最大数に達することであり、これはバッファがいっぱいになったことを意味する。
上記の基準の少なくとも1つが満たされると、リバーブ信号期間の第1のサンプルが、平滑化された実際のリバーブテールと同じ振幅を有するように、補正係数が推定環境信号成分に適用される。次に、2つのリバーブテールが比較され、これはつまり、リバーブ信号期間において、モジュール100で平滑化フィルタにより計算された推定リバーブ信号成分と、音声入力信号とが、現在の周波数ビン内の時間フレームごとに差を計算することにより、比較される。差の平均には、急激な変化を避けるために、調整可能なスケーリング係数がかけられ、経時的に平滑化され得る。次に、結果得られた値を補正値として現在の再帰係数に追加することで、現在の再帰係数が更新され得る。
従って、モジュール240の出力は、図5に関連してより詳しく論述される振幅平滑化係数αである。
モジュール250にて、環境対入力比が決定され、更新される。特に長い音の後は、環境対入力比は、音のオフセット18における振幅減少を調べることにより推定され得る。ドライ信号が停止した後は、環境信号成分のみが存在する。オフセット18前の最後のサンプルと、オフセットが検出された時のサンプルとの差が、環境対入力比の概算に使用され得る。音がより長く演奏されるほど、室内の環境エネルギーが指数関数的に増大し飽和状態に近づくため、この概算はより正確になる。最後の音の長さを記録し、音の長さに応じて、平均環境対入力比の決定に対する最新測定値の寄与を重み付けすることで、これは考慮される。寄与の重み付けは、音の長さに依存する再帰係数を有する再帰フィルタを環境対入力比推定に適用することにより、行われ得る。音が長いほど、最新測定値の影響は大きくなり、逆もまた同様である。さらに、非常に短い音に基づく推定更新を避けるために、環境対入力比の推定の更新には、最低所要音長が使用され得る。
従って、モジュール250の出力は、平均環境対入力比であり、モジュール230の出力は、リバーブ信号期間16が始まる時の情報である。
図4に関連してさらに詳しく説明されるように、これらの3つの情報は、図4に関連してさらに詳しく論述される環境振幅の計算100において使用される。
図4に示されるように、平滑化のために再帰フィルタ130が使用される。しかし、元の入力振幅は、平滑化フィルタ130に投入される前に、図3に関連して前述されたように推定された環境対入力比により減衰される。あるいは、長い音の場合、平滑化フィルタの出力は、元の入力振幅に収束する。しかし実際の部屋では、環境エネルギーは通常、壁により吸収されるため、入力エネルギーよりも大幅に低い。
しかし実際の部屋の中の環境コンテンツは、明確な指数関数的な増大または減少を示すことはないが、ランダムな位相の重畳によるノイズのような小さい変動を有する。従って、モジュール120にて、減衰された振幅から小さい変動が抽出され、より自然な音を作り出すために、抽出された小さい変動は、フィルタによる平滑化130の後に加えられる。例えば移動平均フィルタまたは短時定数を有する別の再帰フィルタで振幅を平滑化し、入力信号からフィルタ処理された信号を減算することにより、変動は抽出され得る。検出されたリバーブ信号期間16の間、環境振幅の推定に、元の振幅が使用され得る、あるいは、平滑化され減衰された振幅に変動が加えられたものが使用されるが、これは特に音が存在する期間に関連する。
分離の重要な一態様は、再帰フィルタ130による平滑化である。この平滑化は、全ての振幅に個別に適用される。これにより、リバーブ特性推定段階の平滑化された最新の推定に従って増大時間及び減少時間が限定され、室内の実際のリバーブに応じた指数関数的形状及び個々の時間定数で増大及び減少する振幅が生成される。従って、再帰フィルタ130の出力は、図1に示される信号12に類似する信号である。
図5に示されるように、0〜1の間のフィードバックまたは平滑化係数αを有する一次再帰ローパスフィルタが使用され得、指数関数的増大及び減少を提供し低処理コストで実施できるフォワード係数1−αが使用され得る。図5に、漏洩積分器とも称される再帰フィルタの図が示される。
対応する式は以下のとおりである。
y(n)=(1−α)・x(n)+α・y(n−1)
漏洩積分器は振幅平滑化演算を実行するのに好適かつ効率的な方法ではあるが、制御された方法で振幅を平滑化することができる他の種類のフィルタを使用することも可能である。
最後に、モジュール150にて、推定環境振幅が、元の入力振幅よりも決して大きくなり得ないように、限定される。信号内の環境コンテンツが入力より大きくなり得ないことから、これは安全対策であるといえる。
再び図2に戻ると、モジュール100の出力は、図4に関連して前述されたように、推定環境振幅である。加算器75にて入力振幅から環境振幅が減算されると、加算器75の後にドライ振幅が存在する。
周波数領域の入力信号の位相値は、振幅成形ブロックの出力と組み合わせることができる。しかし、モジュール70にて、実数及び虚数表現の複素入力スペクトルの実数及び虚数部分に、ドライ振幅と元の入力振幅の比を乗算することのほうが、計算上より効率的である。最後に、モジュール180にて、逆短時間フーリエ変換が実行され、信号は時間領域に変換し戻される。逆フーリエ変換IFFTも使用されてもよいが、他の変換実施態様が使用され得る。実数及び虚数表現のN個の複素周波数スペクトルビンは、時間領域に変換される。このモジュール80はまた、時間領域信号を正しく再構築するのに必要な重畳加算機能を包含することができる。米国特許第2013/0208895A1号にさらに詳しく開示されるように、デジタルフィルタリングの重畳加算法は、入力波形の一連の重畳ハニング窓セグメントを使用し、周波数領域において各セグメントを個別にフィルタリングすることを含み得る。フィルタリング後、重畳部分を一緒に合わせることにより、セグメントは再結合され得る。重畳加算法により、過度のメモリ要件なしに、連続信号に対し周波数領域のフィルタリングをリアルタイムで実行することが可能になり得る。
図6は、図2の左側の入力チャネル10から、図2の右側のドライ出力チャネル11のみ及びN個の環境出力チャネル12までの概要及びより詳しい信号のフロー図を示す。図2に関連して前述されたように、ステップS61にて信号は周波数空間に変換され、ステップS62にて振幅が計算される。計算された振幅は次に、ステップS63のオフセット検出及びステップS64のオンセット検出に使用される。オフセット及びオンセットが判明すると、音声入力信号を、音が存在する複合信号期間15と、環境信号が主に存在するリバーブ信号期間16とに分離することが可能となる。複合信号期間15の場合、ステップS66にて音の長さが特定され、モジュール250に関連して前述されたように、ステップS67にて環境対入力比推定が更新される。ステップS68にて、環境対入力比の平滑化が実行され、これによりステップS68後の出力は、ステップS70にて入力振幅を減衰させるのに使用される環境対入力比となる。リバーブ信号期間の場合、ステップS71にて減少率推定が実行され、これによりこのステップの後に減少率が取得される。ステップS72にて、減少率の平滑化が行われ、これにより、平滑化フィルタで使用される再帰係数αが提供される。これに応じて、ステップS73にて、再帰係数または平滑化係数αを用いて、一次再帰フィルタリングが行われる。さらに、図4に関連して前述されたように、変動が抽出され、平滑化された信号に加えられる。ステップS75にて、音声信号が複合信号期間であるか、リバーブ信号期間16であるかという事実に基づいて、入力信号から元の入力振幅または平滑化された振幅が選択される。図7に関連して説明されるように、ステップS75にて、信号がリバーブ信号期間内にある場合、元の入力振幅が使用され、一方信号が複合信号期間内にある場合は、平滑化された振幅の信号が使用される。この情報に基づいて、モジュール100から出力された推定環境信号成分を、入力信号から減算することにより、ドライ振幅を計算することが可能になる(S76)。図2に関連して上記で説明されたように、ステップS77にて振幅調整が実行され、その時間空間へ変換し戻された後、信号内にはドライ信号成分が存在し、ドライ信号成分を入力信号から減算することにより、環境信号成分が特定され得る。
図7は、実際の音声処理ステップのみを含むフローチャートを示す。方法の開始後、ステップS81にて信号は周波数領域に変換され、ステップS82にて、例えば図2に関連して論述されたモジュール60において、入力振幅が計算される。図4に関連して論述されたように、ステップS83にて環境対入力比により信号は減衰され、ステップS84にて小さい変動が特定される。ステップS85にて、図4に関連して論述されたように、再帰フィルタによる平滑化が実行され、ステップS86にて小さい変動が加えられる。次に、ステップS87にて、現在の信号がリバーブ信号期間16内にあるか、複合信号期間15内にあるかが調べられる。ドライ信号と環境信号が存在する複合信号期間15内にある場合、ステップS88にて平滑化された振幅が使用される。しかし、信号がリバーブテール内にある場合、ステップS89にて元の入力信号が使用される。従って、ステップS88及びS89の後には推定環境音信号が存在し、ステップS90にて、環境対入力比及び振幅平滑化係数などのリバーブパラメータの推定を更新することが可能である。図2に関連して論述されたモジュー70において実行される調整に対応して、ステップS91にてドライ振幅が計算され、ステップS92にて振幅変化が適用される。
ステップS93の逆フーリエ変換の後、ドライ出力信号に加えて、図2に関連して論述されたように、加算器85にて環境信号を計算することが可能となる。
図8は、リバーブパラメータの処理のより詳しいフローチャートを示す。ステップS101にて、図3に関連して前述されたようにモジュール220において、オフセット検出が実行される。さらに、ステップS102にて、オンセット検出が実行される。ステップS103にて、オフセットが検出され得たか否かが調べられる。オフセットが検出された場合、ステップS104にて実際の信号はリバーブ信号期間内にあると判断され得、よってステップS105にて信号のバッファリングが実行されるべきであると判断され得る。推定リバーブテール及び実際のリバーブテールを記憶するために、ステップS106にてバッファがリセットされ、振幅がバッファに保存される。ステップS108にて、環境対入力比が更新される。
ステップS103における判定に戻って、オフセットが検出できなかった場合、ステップS109にてバッファリングが実行されたか否かが調べられる。バッファリングが実行されていた場合、ステップS110にて平滑化された振幅が増大しているか否かが調べられる。平滑化された振幅が増大している場合、ステップS111にて、信号はリバーブテール内にないと判断され得、よってステップS112にてバッファリングを実行する必要はないと判断され得る。ステップS113にて、振幅が適宜更新される。ステップS110に再び戻って、振幅が増大していないと判断された場合、ステップS114にて、バッファが一杯であるか、または振幅が10dBを超えて減少しているか、判断される。バッファは一杯ではなく、振幅が10dBを超えて減少していない場合、信号はまだリバーブテール内にあると推測され得るため、ステップS115にて、現在の元の振幅及び平滑化された振幅がバッファに保存され得る。図2及び図3に関連して論述されたように、次に、タイムフレームごとに実際のリバーブテールと推定リバーブテールとの差を計算することにより、2つのリバーブテールが比較される。
ステップS109に戻って、バッファリングが行われていない場合、ステップS116にて、音声入力信号内にオンセットが検出されたか否かが判定される。オンセットが検出された場合、ステップS117にて音の長さがリセットされ、オンセットが検出されなかった場合、ステップS118にて音の長さが増分される。
図9は、音声入力信号に対して行われる主なステップのうちのいくつかをまとめたものである。ステップS121にて、音声入力信号から変換入力信号が生成される。ステップS122にて、推定環境信号成分を生成するために、平滑化フィルタが適用される。推定環境信号成分は、図2に示されるモジュール100の後に存在する成分である。次に、ステップS123にて、例えば入力信号から推定環境成分を減算することにより、ドライ信号成分を特定することが可能である。ドライ信号成分が判明すると、ステップS124にて、例えば図2に示される加算器85で入力信号からドライ信号成分を減算することにより、実際の環境信号成分が特定され得る。
図10は、図2〜図8に関連して前述された処理ステップを実行することができる音声モジュールの概略的構成図を示す。音声モジュールは、前述の分離を実行することができ、N個の入力チャネルを受信してN個のドライ出力チャネル11及びN個の環境出力チャネル12を出力する入出力モジュール110を備える。モジュール100は、1つ以上のプロセッサを備える処理装置120を備え、メモリ130に記憶されている命令を実行することができ、メモリには、読み出し専用メモリ、ランダムアクセスメモリ、大容量記憶装置、またはハードディスクなどが含まれ得る。メモリはさらに、音声入力信号をドライ信号成分と環境信号成分に分離する前述の機能を実施するために、処理装置120により実行される好適なプログラムコードを含み得る。
上記から、いくつかの一般的な結論が引き出され得る。音声入力信号は、図2に示される両成分を含む複合信号期間15と、複合信号期間15に続くリバーブ信号期間16とを含み得る。音声入力信号内にリバーブ信号期間16を検出することは可能である。次に、推定環境信号成分を生成するための平滑化フィルタにおいて使用される平滑化係数を決定するために、フィルタから出力されたリバーブ信号期間の推定環境信号成分内において、推定リバーブ信号成分が特定され、推定リバーブ信号成分は、リバーブ信号期間の音声入力信号と比較される。
前述のように、推定環境信号成分に対応するフィルタ出力は、期間16の入力信号と比較され、この比較に基づいて、平滑化係数が決定され得る。この平滑化係数は、0〜1の間であり得、平滑化フィルタの上記の式から推測され得るように、高い平滑化係数αは、大きな平滑化が適用されることを意味する。図5に示されるように、再帰フィルタにおいて高いαは、古い信号の高部分が使用され、新しい信号の低部分のみが使用されることを意味する。
平滑化フィルタは、一次再帰フィルタであり得るが、他のフィルタが使用されてもよい。
さらに、変換入力信号の振幅が特定され、特定された振幅は、平滑化フィルタを適用する前に減衰される。平滑化フィルタを用いて特定された推定環境信号成分は、入力信号より大きくなることは決してないため、減衰が実行される。減衰は、環境対入力比の推定を用いて実行され得る。
さらに、音声入力信号内に相当量のドライ信号成分が存在し始める、言い換えると、音声入力信号内に音が存在する音声信号内のオンセット17を特定することが可能である。さらに、音声入力信号内に相当量のドライ信号成分が存在しなくなるオフセット18を特定することができる。
次に、オフセット18後に始まり、平滑化フィルタの出力が再び増大し始める時など平滑化フィルタの出力が所定の基準を満たす時に終わる、リバーブ信号期間が特定され得る。次に、特定されたオフセット後すなわちリバーブ信号期間の音声信号の部分において、推定リバーブ信号成分をリバーブ信号期間の音声入力信号と比較することが実行される。
さらに、オフセット前の音声入力の最後のサンプルにおける音声入力信号の振幅と、オフセット後の最初のサンプルにおける音声入力信号の振幅とを、特定することが可能である。次に、環境信号成分対音声入力信号の比は、最初のサンプルの振幅及び最後のサンプルの振幅に基づいて決定される。
変換入力信号の振幅を減衰させるのに使用される平均比を決定するために、最後のサンプル及び最初のサンプルに基づくこの比の決定は、入力信号内の異なるオフセットに対し数回繰り返すことができる。さらに、ドライ信号成分の長さは、異なるオフセットから特定され、特定されたドライ信号成分が長いほど、対応する比は平均比により大きく寄与する。
前述のように、演奏される音が長いほど、環境対入力比の決定はより正確になる。
さらに、音声入力信号内にリバーブ信号期間が現在存在するか否かが判定され得る。存在する場合は、推定環境信号成分にリバーブ信号期間の音声入力が使用され、存在しない場合は、推定環境信号成分に平滑化フィルタの出力が使用される。
さらに、推定環境信号成分を特定するために、変換入力信号の減衰された振幅から変動を抽出し、抽出された変動を平滑化フィルタの出力に加えることが可能である。
さらに、入力信号から、指数関数的に減少するピーク後続信号を特定することが可能であり、ピーク後続信号はその後0〜1の係数で減衰され、減衰されたピーク後続信号と音声入力信号が交差する時、入力信号が減少する点でオフセットが検出される。
図3に関連して論述されたように検出された平滑化係数は、推定リバーブ信号成分がリバーブテールの音声入力信号に対応するように、決定され得る。
推定環境信号成分は、平滑化フィルタ後の出力に基づいて特定され得、すなわち加算器75で行われる減算の後にドライ出力チャネルが提供され、次に音声入力信号内に存在する環境信号成分を特定するために、ドライ出力チャネルは入力信号から減算される。
まとめると、上記の方法を用いて、音声入力信号内のドライ信号成分と環境信号成分との効果的な分離が可能である。

Claims (15)

  1. 音声入力信号(10)をドライ信号成分(11)と環境信号成分(12)とに分離する方法であって、
    前記音声入力信号を周波数空間に変換することを含む、変換入力信号を生成することと、
    推定環境信号成分を生成するために、前記変換入力信号に平滑化フィルタ(130)を適用することと、
    前記推定環境信号成分に基づいて、前記ドライ信号成分(11)を特定することと、
    前記特定したドライ信号成分(11)及び前記音声入力信号(10)に基づいて、前記環境信号成分(12)を特定することと
    を含む、前記方法。
  2. 前記音声入力信号(10)は、前記環境信号成分(12)及び前記ドライ信号成分(11)が存在する複合信号期間(15)と、実質的に前記環境信号のみが存在する、前記複合信号期間(15)に続くリバーブ信号期間(16)とを含み、
    前記方法は、
    前記音声入力信号内に前記リバーブ信号期間(16)を検出することと、
    前記リバーブ信号期間の前記推定環境信号成分内において、推定リバーブ信号成分を特定することと、
    前記推定環境信号成分を生成するための前記平滑化フィルタにおいて使用される平滑化係数を決定するために、前記推定リバーブ信号成分を、前記リバーブ信号期間の前記音声入力信号と比較することと
    を含む、請求項1に記載の方法。
  3. 前記平滑化フィルタ(130)は一次再帰フィルタを含む、請求項1に記載の方法。
  4. 前記変換入力信号の振幅を特定することと、
    前記平滑化フィルタ(130)を適用する前に、前記変換入力信号の前記特定された振幅を減衰させることと、
    をさらに含む、請求項1に記載の方法。
  5. 前記環境信号成分(12)対前記音声入力信号(10)の比が特定され、
    前記特定された振幅は、前記特定された比に基づいて減衰される、請求項4に記載の方法。
  6. 相当量の前記ドライ信号成分(11)が前記音声入力信号(10)内に存在し始めるオンセット(17)を、前記音声入力信号(10)内で特定するステップと、
    前記相当量の前記ドライ信号成分(11)が前記音声入力信号内に存在しなくなるオフセット(18)を、前記音声入力信号内で特定するステップと
    を含む、請求項1に記載の方法。
  7. 相当量の前記ドライ信号成分(11)が前記音声入力信号(10)内に存在し始めるオンセット(17)を、前記音声入力信号(10)内で特定するステップと、
    前記相当量の前記ドライ信号成分(11)が前記音声入力信号内に存在しなくなるオフセット(18)を、前記音声入力信号内で特定するステップと
    を含み、
    前記オフセット(18)後に開始し、前記平滑化フィルタの出力が所定の基準を満たす時に終了する前記リバーブ信号期間(16)が特定され、
    前記推定リバーブ信号成分を前記リバーブ信号期間の前記音声入力信号と比較することは、前記特定されたオフセット(18)後の前記音声入力信号の一部において実行される、請求項2に記載の方法。
  8. 相当量の前記ドライ信号成分(11)が前記音声入力信号(10)内に存在し始めるオンセット(17)を、前記音声入力信号(10)内で特定するステップと、
    前記相当量の前記ドライ信号成分(11)が前記音声入力信号内に存在しなくなるオフセット(18)を、前記音声入力信号内で特定するステップと
    を含み、
    前記環境信号成分(12)対前記音声入力信号(10)の前記比を特定することは、
    前記オフセット前の前記音声入力信号の最後のサンプルにおける前記音声入力信号(10)の振幅を特定することと、
    前記オフセット後の前記音声入力信号の最初のサンプルにおける前記音声入力信号(10)の振幅を特定することと、
    前記最後のサンプルにおける前記振幅と、前記最初のサンプルにおける前記振幅を考慮して、前記比を特定することと
    を含む、請求項5に記載の方法。
  9. 前記変換入力信号の前記振幅を減衰させるために使用される平均比を決定するために、
    前記最後のサンプル及び前記最初のサンプルを考慮して前記比を特定する前記ステップが、前記音声入力信号内の異なるオフセットに対し数回繰り返され、
    前記異なるオフセットに対して前記ドライ信号成分の長さが特定され、
    前記特定されたドライ信号成分の前記長さが長いほど、前記対応する比が前記平均比に大きく寄与する、請求項8に記載の方法。
  10. 前記音声入力信号(10)内に前記リバーブ信号期間(16)が現在存在するか否かが特定され、存在する場合は、前記推定環境信号成分に前記リバーブ信号期間の前記音声入力が使用され、存在しない場合は、前記推定環境信号成分に前記平滑化フィルタの出力が使用される、請求項7に記載の方法。
  11. 前記変換入力信号の前記減衰された振幅から、変動を抽出することと、
    前記推定環境信号成分を特定するために、前記平滑化フィルタの出力に、前記抽出した変動を加えることと、
    をさらに含む、請求項4に記載の方法。
  12. 前記方法は、前記変換入力信号から、指数関数的に減少するピーク後続信号を特定することであって、前記ピーク後続信号はその後1未満の係数で減衰される、前記特定することをさらに含み、
    前記減衰されたピーク後続信号と前記音声入力信号が交差する時、前記入力信号が減少する点で前記オフセット(18)が検出される、請求項6に記載の方法。
  13. 前記推定リバーブ信号成分が前記リバーブ信号期間の前記音声入力信号に対応するように、前記平滑化係数は決定される、請求項2に記載の方法。
  14. 前記ドライ信号成分を特定するために、前記平滑化フィルタの出力から生成された前記推定環境信号成分は、前記音声入力信号から減算される、請求項1に記載の方法。
  15. 音声入力信号をドライ信号成分と環境信号成分とに分離するように構成された音声モジュール(100)であって、前記音声モジュールは、メモリと、少なくとも1つの処理装置とを備え、前記メモリは、前記少なくとも1つの処理装置により実行可能な命令を含み、前記音声モジュールは、
    前記音声入力信号を周波数空間に変換することを含む、変換入力信号を生成することと、
    推定環境信号成分を生成するために、前記変換入力信号に平滑化フィルタを適用することと、
    前記推定環境信号成分に基づいて、前記ドライ信号成分を特定することと、
    前記特定したドライ信号成分及び前記音声入力信号に基づいて、前記環境信号成分を特定することと
    を動作可能である、前記音声モジュール。
JP2019092015A 2018-05-23 2019-05-15 ドライ音と環境音の分離 Pending JP2019204081A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP18173855.0 2018-05-23
EP18173855.0A EP3573058B1 (en) 2018-05-23 2018-05-23 Dry sound and ambient sound separation

Publications (1)

Publication Number Publication Date
JP2019204081A true JP2019204081A (ja) 2019-11-28

Family

ID=62244316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019092015A Pending JP2019204081A (ja) 2018-05-23 2019-05-15 ドライ音と環境音の分離

Country Status (5)

Country Link
US (1) US11238882B2 (ja)
EP (1) EP3573058B1 (ja)
JP (1) JP2019204081A (ja)
KR (1) KR102651085B1 (ja)
CN (1) CN110534129A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3671739A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Apparatus and method for source separation using an estimation and control of sound quality
DE102020108958A1 (de) 2020-03-31 2021-09-30 Harman Becker Automotive Systems Gmbh Verfahren zum Darbieten eines ersten Audiosignals während der Darbietung eines zweiten Audiosignals
CN111669697B (zh) * 2020-05-25 2021-05-18 中国科学院声学研究所 一种多通道信号的相干声与环境声提取方法及系统
CN111711918B (zh) * 2020-05-25 2021-05-18 中国科学院声学研究所 一种多通道信号的相干声与环境声提取方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065204A (ja) * 2005-08-30 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> 残響除去装置、残響除去方法、残響除去プログラム及びその記録媒体
JP2016054421A (ja) * 2014-09-03 2016-04-14 リオン株式会社 残響抑制装置
JP2016513814A (ja) * 2013-03-05 2016-05-16 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法
US20160210976A1 (en) * 2013-07-23 2016-07-21 Arkamys Method for suppressing the late reverberation of an audio signal

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3948783B2 (ja) * 1997-04-28 2007-07-25 富士通株式会社 音再生装置及び音データ作成装置
US20030007648A1 (en) * 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
US8036767B2 (en) * 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
GB0703275D0 (en) * 2007-02-20 2007-03-28 Skype Ltd Method of estimating noise levels in a communication system
KR101141033B1 (ko) * 2007-03-19 2012-05-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 스피치 개선을 위한 노이즈 분산 추정기
DE102007030209A1 (de) * 2007-06-27 2009-01-08 Siemens Audiologische Technik Gmbh Glättungsverfahren
EP2210427B1 (en) * 2007-09-26 2015-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for extracting an ambient signal
US8107631B2 (en) * 2007-10-04 2012-01-31 Creative Technology Ltd Correlation-based method for ambience extraction from two-channel audio signals
JPWO2009150894A1 (ja) * 2008-06-10 2011-11-10 日本電気株式会社 音声認識システム、音声認識方法および音声認識用プログラム
US20110058676A1 (en) * 2009-09-07 2011-03-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
JP2011203414A (ja) * 2010-03-25 2011-10-13 Toyota Motor Corp 雑音及び残響抑圧装置及びその方法
US9111526B2 (en) * 2010-10-25 2015-08-18 Qualcomm Incorporated Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
CN103168479B (zh) * 2011-10-14 2016-11-23 松下知识产权经营株式会社 振鸣抑制装置、助听器、振鸣抑制方法和集成电路
US9986356B2 (en) 2012-02-15 2018-05-29 Harman International Industries, Incorporated Audio surround processing system
TWI618050B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
CN105324982B (zh) * 2013-05-06 2018-10-12 波音频有限公司 用于抑制不需要的音频信号的方法和设备
EP2884491A1 (en) * 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
FR3031225B1 (fr) * 2014-12-31 2018-02-02 Audionamix Procede de separation ameliore et produit programme d'ordinateur
US10403300B2 (en) * 2016-03-17 2019-09-03 Nuance Communications, Inc. Spectral estimation of room acoustic parameters
EP3337190B1 (en) * 2016-12-13 2021-03-10 Oticon A/s A method of reducing noise in an audio processing device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065204A (ja) * 2005-08-30 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> 残響除去装置、残響除去方法、残響除去プログラム及びその記録媒体
JP2016513814A (ja) * 2013-03-05 2016-05-16 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法
US20160210976A1 (en) * 2013-07-23 2016-07-21 Arkamys Method for suppressing the late reverberation of an audio signal
JP2016054421A (ja) * 2014-09-03 2016-04-14 リオン株式会社 残響抑制装置

Also Published As

Publication number Publication date
US11238882B2 (en) 2022-02-01
KR102651085B1 (ko) 2024-03-25
EP3573058B1 (en) 2021-02-24
EP3573058A1 (en) 2019-11-27
US20190362736A1 (en) 2019-11-28
KR20190133618A (ko) 2019-12-03
CN110534129A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
KR102651085B1 (ko) 드라이 사운드 및 주변 사운드 분리
KR101149591B1 (ko) 오디오 신호 반향 억제
JP6019969B2 (ja) 音響処理装置
KR101803293B1 (ko) 입체 음향 효과를 제공하는 신호 처리 장치 및 신호 처리 방법
US9538288B2 (en) Sound field correction apparatus, control method thereof, and computer-readable storage medium
US11483651B2 (en) Processing audio signals
KR20190085988A (ko) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
CN102610232B (zh) 一种自适应音频感知响度调整方法
JP5645419B2 (ja) 残響除去装置
JP6371167B2 (ja) 残響抑制装置
JP6087762B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
US8635077B2 (en) Apparatus and method for expanding/compressing audio signal
JP5975290B2 (ja) ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路
JP5915281B2 (ja) 音響処理装置
JP4662912B2 (ja) 反響のある環境での音源定位に適当な測定ウィンドウの決定
JP4367328B2 (ja) ハウリングキャンセラ
JP5958378B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
JP3831220B2 (ja) 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体
JP6226465B2 (ja) オーディオ信号処理装置、録音再生装置およびプログラム
JP2015004959A (ja) 音響処理装置
JP6102053B2 (ja) 音響処理装置および音響処理方法
CN117499838A (zh) 音频的处理方法、装置和非易失性计算机可读存储介质
Ellwart et al. Corrupted Speech Intelligibility Improvement Using Adaptive Filter-Based Algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240220

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240229

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20240412