JP5329655B2 - マルチチャネル信号のバランスをとるためのシステム、方法及び装置 - Google Patents
マルチチャネル信号のバランスをとるためのシステム、方法及び装置 Download PDFInfo
- Publication number
- JP5329655B2 JP5329655B2 JP2011512595A JP2011512595A JP5329655B2 JP 5329655 B2 JP5329655 B2 JP 5329655B2 JP 2011512595 A JP2011512595 A JP 2011512595A JP 2011512595 A JP2011512595 A JP 2011512595A JP 5329655 B2 JP5329655 B2 JP 5329655B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- segment
- level
- series
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 149
- 230000005236 sound signal Effects 0.000 claims abstract description 154
- 238000012545 processing Methods 0.000 claims abstract description 85
- 238000001514 detection method Methods 0.000 claims description 59
- 238000004891 communication Methods 0.000 claims description 50
- 230000004044 response Effects 0.000 claims description 30
- 238000010586 diagram Methods 0.000 description 42
- 238000009499 grossing Methods 0.000 description 33
- 238000003860 storage Methods 0.000 description 15
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 238000003491 array Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 7
- RXKGHZCQFXXWFQ-UHFFFAOYSA-N 4-ho-mipt Chemical compound C1=CC(O)=C2C(CCN(C)C(C)C)=CNC2=C1 RXKGHZCQFXXWFQ-UHFFFAOYSA-N 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000005534 acoustic noise Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- XECAHXYUAAWDEL-UHFFFAOYSA-N acrylonitrile butadiene styrene Chemical compound C=CC=C.C=CC#N.C=CC1=CC=CC=C1 XECAHXYUAAWDEL-UHFFFAOYSA-N 0.000 description 2
- 229920000122 acrylonitrile butadiene styrene Polymers 0.000 description 2
- 239000004676 acrylonitrile butadiene styrene Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100229939 Mus musculus Gpsm1 gene Proteins 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229920006026 co-polymeric resin Polymers 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002991 molded plastic Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/25—Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
本特許出願は、2008年6月2日付け提出され、本願の譲受人に譲渡され、「SYSTEM AND METHOD FOR AUTOMATIC GAIN MATCHING OF A PAIR OF MICROPHONES」と題された米国仮出願第61/058,132号(Attorney Docket No. 081747P1)の優先権を主張する。
本特許出願は、以下の同時継続の米国特許出願に関係する:
2008年8月25日付け提出され、本願の譲受人に譲渡され、「SYSTEMS, METHODS, AND APPARATUS FOR SIGNAL SEPARATION」と題された米国特許出願第12/197,924号;及び
2008年12月12日付け提出され、本願の譲受人に譲渡され、「SYSTEMS, METHODS, AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECH ENHANCEMENT」と題された米国特許出願第12/334,246号(Attorney Docket No. 080426)。
この開示は、2又はそれ以上のチャネルを有するオーディオ信号のバランスをとることに関係する。
isc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタルバーサタイルディスク(DVD)、フロッピー(登録商標)ディスク及びブルーレイディスク(登録商標)(Blu-Ray Disc Association, Universal City, CA)を含む。ここで、ディスク(disks)は、通常、磁気的にデータを再生(reproduce)し、一方、ディスク(discs)は、レーザーを使って光学的にデータを再生する。上記の組み合わせはまた、コンピュータ読み取り可能な媒体の範囲の中に含まれるべきである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
〔1〕
マルチチャネル・オーディオ信号を処理する方法において、前記方法は、
時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算することと、
時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算することと、
前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算することと、
前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御することを含み、
前記方法は、前記オーディオ信号のセグメントが情報セグメントであることを指示することを含み、
時間にわたってゲイン・ファクタの値の系列を計算することは、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つについて且つ前記指示することに応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタ値を計算することを含み、
前記バイアス・ファクタは、指向性情報ソースに対する音声検出装置の標準的な方向に基づくものである方法。
〔2〕
セグメントが情報セグメントであることを前記指示することは、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づくものである〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔3〕
セグメントが情報セグメントであることを前記指示することは、アレイ・アンバランス推定を含む関係に基づくものであり、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔4〕
前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔5〕
前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔6〕
前記バイアス・ファクタ値を前記計算することは、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用することを含み、
前記バイアス・ファクタ値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔7〕
前記方法は、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示することを含む〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔8〕
前記方法は、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示することを含む〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔9〕
前記方法は、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示することを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔1〕のマルチチャネル・オーディオ信号を処理する方法。
〔10〕
少なくとも一つのプロセッサにより実行されるときに、前記少なくとも一つのプロセッサに、マルチチャネル・オーディオ信号を処理する方法を実行させるインストラクションを含むコンピュータ読み取り可能な媒体において、前記インストラクションは、
前記プロセッサにより実行されるときに、前記プロセッサに、時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算させるインストラクションと、
前記プロセッサにより実行されるときに、前記プロセッサに、時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算させるインストラクションと、
前記プロセッサにより実行されるときに、前記プロセッサに、前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算させるインストラクションと、
前記プロセッサにより実行されるときに、前記プロセッサに、前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御させるインストラクションとを含み、
前記媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、前記オーディオ信号のセグメントが情報セグメントであることを指示させるインストラクションを含み、
前記プロセッサにより実行されるときに、前記プロセッサに、時間にわたってゲイン・ファクタの値の系列を計算させる前記インストラクションは、前記指示に応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つを計算することを含み、
前記バイアス・ファクタは、指向性情報ソースに対する音声検出装置の標準的な方向に基づくものであるコンピュータ読み取り可能な媒体。
〔11〕
前記プロセッサにより実行されるときに、前記プロセッサに、セグメントが情報セグメントであることを指示させる前記インストラクションは、前記プロセッサにより実行されるときに、前記プロセッサに、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づいて、セグメントが情報セグメントであることを指示させるインストラクションを含む〔10〕のコンピュータ読み取り可能な媒体。
〔12〕
前記プロセッサにより実行されるときに、前記プロセッサに、セグメントが情報セグメントであることを指示させる前記インストラクションは、前記プロセッサにより実行されるときに、前記プロセッサに、アレイ・アンバランス推定を含む関係に基づいて、セグメントが情報セグメントであることを指示させるインストラクションを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔10〕のコンピュータ読み取り可能な媒体。
〔13〕
前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである〔10〕のコンピュータ読み取り可能な媒体。
〔14〕
前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している〔10〕のコンピュータ読み取り可能な媒体。
〔15〕
前記プロセッサにより実行されるときに、前記プロセッサに、前記ゲイン・ファクタ値を計算させる前記インストラクションは、前記プロセッサにより実行されるときに、前記プロセッサに、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用させるインストラクションを含み、
前記バイアス・ファクタ値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである〔10〕のコンピュータ読み取り可能な媒体。
〔16〕
前記媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示させるインストラクションを含む〔10〕のコンピュータ読み取り可能な媒体。
〔17〕
前記媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示させるインストラクションを含む〔10〕のコンピュータ読み取り可能な媒体。
〔18〕
前記媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示させるインストラクションを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔10〕のコンピュータ読み取り可能な媒体。
〔19〕
マルチチャネル・オーディオ信号を処理するための装置において、前記装置は、
時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算するための手段と、
時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算するための手段と、
前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算するための手段と、
前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御するための手段を含み、
前記装置は、前記オーディオ信号のセグメントが情報セグメントであることを指示するための手段を含み、
時間にわたってゲイン・ファクタの値の系列を計算するための前記手段は、前記インジケーションに応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つを計算するように構成され、
前記バイアス・ファクタは、指向性情報ソースに対する音声検出装置の標準的な方向に基づくものである装置。
〔20〕
セグメントが情報セグメントであることを指示するための前記手段は、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づいて、セグメントが情報セグメントであることを指示するように構成される〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔21〕
セグメントが情報セグメントであることを指示するための前記手段は、アレイ・アンバランス推定を含む関係に基づいて、セグメントが情報セグメントであることを指示するように構成され、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔22〕
前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔23〕
前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔24〕
前記バイアス・ファクタ値を計算するための前記手段は、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用して、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つの各々のを計算するように構成され、
前記バイアス・ファクタ値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔25〕
前記装置は、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示するための手段を含む〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔26〕
前記装置は、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するための手段を含む〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔27〕
前記装置は、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するための手段を含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔28〕
前記装置は、第1のチャネルのレベルの値の系列を計算するための前記手段と、第2のチャネルのレベルの値の系列を計算するための前記手段と、ゲイン・ファクタの値の系列を計算するための前記手段と、前記第2のチャネルの振幅を制御するための前記手段と、
前記音声信号のセグメントが情報セグメントであることを指示するための前記手段とを含む通信デバイスを含み、
前記通信デバイスは、前記マルチチャネル・オーディオ信号を生成ように構成されたマイク・アレイを含む〔19〕のマルチチャネル・オーディオ信号を処理するための装置。
〔29〕
マルチチャネル・オーディオ信号を処理するための装置において、前記装置は、
時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算するように構成された第1レベル計算機と、
時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算するように構成された第2レベル計算機と、
前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算するように構成されたゲイン・ファクタ計算機と、
前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御するように構成された振幅制御エレメントと、
前記オーディオ信号のセグメントが情報セグメントであることを指示するように構成された情報セグメント・インジケータとを含み、
前記ゲイン・ファクタ計算機は、前記インジケーションに応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つを計算するように構成され、
前記バイアス・ファクタは、指向性アコースティック情報ソースに対する音声検出装置の標準的な方向に基づくものである装置。
〔30〕
前記情報セグメント・インジケータは、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づいて、セグメントが情報セグメントであることを指示するように構成される〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔31〕
前記情報セグメント・インジケータは、アレイ・アンバランス推定を含む関係に基づいて、セグメントが情報セグメントであることを指示するように構成され、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔32〕
前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔33〕
前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔34〕
前記ゲイン・ファクタ計算機は、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用して、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つの各々のを計算するように構成され、
前記バイアス・ファクタ値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔35〕
前記装置は、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示するように構成されたバックグラウンド・セグメント・インジケータを含む〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔36〕
前記装置は、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するように構成されたバランス・ノイズ・セグメント・インジケータを含む〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔37〕
前記装置は、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するように構成されたバランス・ノイズ・セグメント・インジケータを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
〔38〕
前記装置は、前記第1レベル計算機と、前記第2レベル計算機と、前記ゲイン・ファクタ計算機と、前記振幅制御エレメントと、前記情報セグメント・インジケータとを含む通信デバイスを含み、
前記通信デバイスは、前記マルチチャネル・オーディオ信号を生成ように構成されたマイク・アレイを含む〔29〕のマルチチャネル・オーディオ信号を処理するための装置。
Claims (38)
- マルチチャネル・オーディオ信号を処理する方法において、前記方法は、
時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算することと、
時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算することと、
前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算することと、
前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御することを含み、
前記方法は、プロセッサにより、前記オーディオ信号のセグメントが情報セグメントであることを指示することを含み、
時間にわたってゲイン・ファクタの値の系列を計算することは、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つについて且つ前記指示することに応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値を計算することを含み、
前記バイアス・ファクタは、指向性情報ソースに対する音声検出装置の標準的な方向に基づくものである方法。 - セグメントが情報セグメントであることを前記指示することは、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づくものである請求項1のマルチチャネル・オーディオ信号を処理する方法。
- セグメントが情報セグメントであることを前記指示することは、アレイ・アンバランス推定を含む関係に基づくものであり、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項1のマルチチャネル・オーディオ信号を処理する方法。 - 前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである請求項1のマルチチャネル・オーディオ信号を処理する方法。
- 前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している請求項1のマルチチャネル・オーディオ信号を処理する方法。
- 前記ゲイン・ファクタの値を前記計算することは、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用することを含み、
前記ゲイン・ファクタの値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた前記第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである請求項1のマルチチャネル・オーディオ信号を処理する方法。 - 前記方法は、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示することを含む請求項1のマルチチャネル・オーディオ信号を処理する方法。
- 前記方法は、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示することを含む請求項1のマルチチャネル・オーディオ信号を処理する方法。
- 前記方法は、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示することを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項1のマルチチャネル・オーディオ信号を処理する方法。 - 少なくとも一つのプロセッサにより実行されるときに、前記少なくとも一つのプロセッサに、マルチチャネル・オーディオ信号を処理する方法を実行させるインストラクションを含むコンピュータ読み取り可能な記録媒体において、前記インストラクションは、
前記プロセッサにより実行されるときに、前記プロセッサに、時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算させるインストラクションと、
前記プロセッサにより実行されるときに、前記プロセッサに、時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算させるインストラクションと、
前記プロセッサにより実行されるときに、前記プロセッサに、前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算させるインストラクションと、
前記プロセッサにより実行されるときに、前記プロセッサに、前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御させるインストラクションとを含み、
前記記録媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、前記オーディオ信号のセグメントが情報セグメントであることを指示させるインストラクションを含み、
前記プロセッサにより実行されるときに、前記プロセッサに、時間にわたってゲイン・ファクタの値の系列を計算させる前記インストラクションは、前記指示に応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つを計算することを含み、
前記バイアス・ファクタは、指向性情報ソースに対する音声検出装置の標準的な方向に基づくものであるコンピュータ読み取り可能な記録媒体。 - 前記プロセッサにより実行されるときに、前記プロセッサに、セグメントが情報セグメントであることを指示させる前記インストラクションは、前記プロセッサにより実行されるときに、前記プロセッサに、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づいて、セグメントが情報セグメントであることを指示させるインストラクションを含む請求項10のコンピュータ読み取り可能な記録媒体。
- 前記プロセッサにより実行されるときに、前記プロセッサに、セグメントが情報セグメントであることを指示させる前記インストラクションは、前記プロセッサにより実行されるときに、前記プロセッサに、アレイ・アンバランス推定を含む関係に基づいて、セグメントが情報セグメントであることを指示させるインストラクションを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項10のコンピュータ読み取り可能な記録媒体。 - 前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである請求項10のコンピュータ読み取り可能な記録媒体。
- 前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している請求項10のコンピュータ読み取り可能な記録媒体。
- 前記プロセッサにより実行されるときに、前記プロセッサに、前記ゲイン・ファクタの値を計算させる前記インストラクションは、前記プロセッサにより実行されるときに、前記プロセッサに、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用させるインストラクションを含み、
前記ゲイン・ファクタの値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた前記第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである請求項10のコンピュータ読み取り可能な記録媒体。 - 前記記録媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示させるインストラクションを含む請求項10のコンピュータ読み取り可能な記録媒体。
- 前記記録媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示させるインストラクションを含む請求項10のコンピュータ読み取り可能な記録媒体。
- 前記記録媒体は、前記プロセッサにより実行されるときに、前記プロセッサに、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示させるインストラクションを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項10のコンピュータ読み取り可能な記録媒体。 - マルチチャネル・オーディオ信号を処理するための装置において、前記装置は、
時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算するための手段と、
時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算するための手段と、
前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算するための手段と、
前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御するための手段を含み、
前記装置は、前記オーディオ信号のセグメントが情報セグメントであることを指示するための手段を含み、
時間にわたってゲイン・ファクタの値の系列を計算するための前記手段は、前記インジケーションに応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つを計算するように構成され、
前記バイアス・ファクタは、指向性情報ソースに対する音声検出装置の標準的な方向に基づくものである装置。 - セグメントが情報セグメントであることを指示するための前記手段は、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づいて、セグメントが情報セグメントであることを指示するように構成される請求項19のマルチチャネル・オーディオ信号を処理するための装置。
- セグメントが情報セグメントであることを指示するための前記手段は、アレイ・アンバランス推定を含む関係に基づいて、セグメントが情報セグメントであることを指示するように構成され、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項19のマルチチャネル・オーディオ信号を処理するための装置。 - 前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである請求項19のマルチチャネル・オーディオ信号を処理するための装置。
- 前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している請求項19のマルチチャネル・オーディオ信号を処理するための装置。
- 前記ゲイン・ファクタの値を計算するための前記手段は、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用して、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つの各々を計算するように構成され、
前記ゲイン・ファクタの値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた前記第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである請求項19のマルチチャネル・オーディオ信号を処理するための装置。 - 前記装置は、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示するための手段を含む請求項19のマルチチャネル・オーディオ信号を処理するための装置。
- 前記装置は、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するための手段を含む請求項19のマルチチャネル・オーディオ信号を処理するための装置。
- 前記装置は、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するための手段を含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項19のマルチチャネル・オーディオ信号を処理するための装置。 - 前記装置は、第1のチャネルのレベルの値の系列を計算するための前記手段と、第2のチャネルのレベルの値の系列を計算するための前記手段と、ゲイン・ファクタの値の系列を計算するための前記手段と、前記第2のチャネルの振幅を制御するための前記手段と、
前記音声信号のセグメントが情報セグメントであることを指示するための前記手段とを含む通信デバイスを含み、
前記通信デバイスは、前記マルチチャネル・オーディオ信号を生成ように構成されたマイク・アレイを含む請求項19のマルチチャネル・オーディオ信号を処理するための装置。 - マルチチャネル・オーディオ信号を処理するための装置において、前記装置は、
時間にわたって前記オーディオ信号の第1のチャネルのレベルの値の系列を計算するように構成された第1レベル計算機と、
時間にわたって前記オーディオ信号の第2のチャネルのレベルの値の系列を計算するように構成された第2レベル計算機と、
前記第1のチャネルのレベルの値の前記系列及び前記第2のチャネルのレベルの値の前記系列に基づいて、時間にわたってゲイン・ファクタの値の系列を計算するように構成されたゲイン・ファクタ計算機と、
前記ゲイン・ファクタの値の前記系列に従って、時間にわたって前記第1のチャネルの振幅に対して前記第2のチャネルの振幅を制御するように構成された振幅制御エレメントと、
前記オーディオ信号のセグメントが情報セグメントであることを指示するように構成された情報セグメント・インジケータとを含み、
前記ゲイン・ファクタ計算機は、前記インジケーションに応答して、前記第1のチャネルの前記レベルの対応する値、前記第2のチャネルの前記レベルの対応する値及びバイアス・ファクタに基づいて、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つを計算するように構成され、
前記バイアス・ファクタは、指向性アコースティック情報ソースに対する音声検出装置の標準的な方向に基づくものである装置。 - 前記情報セグメント・インジケータは、前記第1のチャネルの前記レベルの対応する値及び前記第2のチャネルの前記レベルの対応する値に基づいて、セグメントが情報セグメントであることを指示するように構成される請求項29のマルチチャネル・オーディオ信号を処理するための装置。
- 前記情報セグメント・インジケータは、アレイ・アンバランス推定を含む関係に基づいて、セグメントが情報セグメントであることを指示するように構成され、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項29のマルチチャネル・オーディオ信号を処理するための装置。 - 前記ゲイン・ファクタの値の系列の各々は、前記第1のチャネルのレベルの値の前記系列のうちの一つ対前記第2のチャネルのレベルの値の前記系列のうちの一つの比率に基づくものである請求項29のマルチチャネル・オーディオ信号を処理するための装置。
- 前記バイアス・ファクタは、前記第1のチャネルの前記レベルの前記対応する値と前記第2のチャネルの前記レベルの前記対応する値との間の比率から独立している請求項29のマルチチャネル・オーディオ信号を処理するための装置。
- 前記ゲイン・ファクタ計算機は、前記第2のチャネルの前記レベルの前記対応する値を重み付けするために前記バイアス・ファクタを使用して、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つの各々を計算するように構成され、
前記ゲイン・ファクタの値は、前記第1のチャネルの前記レベルの前記対応する値対前記重み付けされた前記第2のチャネルの前記レベルの前記対応する値との間の比率に基づくものである請求項29のマルチチャネル・オーディオ信号を処理するための装置。 - 前記装置は、前記セグメントのレベルとバックグラウンド・レベル値との関係に基づいて、前記オーディオ信号のセグメントが、バックグラウンド・セグメントであることを指示するように構成されたバックグラウンド・セグメント・インジケータを含む請求項29のマルチチャネル・オーディオ信号を処理するための装置。
- 前記装置は、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するように構成されたバランス・ノイズ・セグメント・インジケータを含む請求項29のマルチチャネル・オーディオ信号を処理するための装置。
- 前記装置は、アレイ・アンバランス推定を含む関係に基づいて、バックグラウンド・セグメントでない前記オーディオ信号のセグメントが、バランス・ノイズ・セグメントであることを指示するように構成されたバランス・ノイズ・セグメント・インジケータを含み、
前記アレイ・アンバランス推定は、前記ゲイン・ファクタの値の前記系列のうちの少なくとも一つに基づくものである請求項29のマルチチャネル・オーディオ信号を処理するための装置。 - 前記装置は、前記第1レベル計算機と、前記第2レベル計算機と、前記ゲイン・ファクタ計算機と、前記振幅制御エレメントと、前記情報セグメント・インジケータとを含む通信デバイスを含み、
前記通信デバイスは、前記マルチチャネル・オーディオ信号を生成ように構成されたマイク・アレイを含む請求項29のマルチチャネル・オーディオ信号を処理するための装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US5813208P | 2008-06-02 | 2008-06-02 | |
US61/058,132 | 2008-06-02 | ||
US12/473,930 | 2009-05-28 | ||
US12/473,930 US8321214B2 (en) | 2008-06-02 | 2009-05-28 | Systems, methods, and apparatus for multichannel signal amplitude balancing |
PCT/US2009/046021 WO2009149119A1 (en) | 2008-06-02 | 2009-06-02 | Systems, methods, and apparatus for multichannel signal balancing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011523836A JP2011523836A (ja) | 2011-08-18 |
JP5329655B2 true JP5329655B2 (ja) | 2013-10-30 |
Family
ID=41380869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011512595A Expired - Fee Related JP5329655B2 (ja) | 2008-06-02 | 2009-06-02 | マルチチャネル信号のバランスをとるためのシステム、方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8321214B2 (ja) |
EP (1) | EP2301258A1 (ja) |
JP (1) | JP5329655B2 (ja) |
KR (1) | KR101217970B1 (ja) |
CN (1) | CN102047688B (ja) |
TW (1) | TW201012244A (ja) |
WO (1) | WO2009149119A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
US8898056B2 (en) | 2006-03-01 | 2014-11-25 | Qualcomm Incorporated | System and method for generating a separated signal by reordering frequency components |
US8077893B2 (en) * | 2007-05-31 | 2011-12-13 | Ecole Polytechnique Federale De Lausanne | Distributed audio coding for wireless hearing aids |
CN101847412B (zh) * | 2009-03-27 | 2012-02-15 | 华为技术有限公司 | 音频信号的分类方法及装置 |
WO2011045506A1 (fr) * | 2009-10-12 | 2011-04-21 | France Telecom | Traitement de donnees sonores encodees dans un domaine de sous-bandes |
WO2011055410A1 (ja) * | 2009-11-06 | 2011-05-12 | 株式会社 東芝 | 音声認識装置 |
US9031221B2 (en) * | 2009-12-22 | 2015-05-12 | Cyara Solutions Pty Ltd | System and method for automated voice quality testing |
TWI459828B (zh) * | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
TWI423688B (zh) * | 2010-04-14 | 2014-01-11 | Alcor Micro Corp | 具有電磁波接收器之聲音感測器 |
CN203435060U (zh) * | 2010-07-15 | 2014-02-12 | 艾利佛有限公司 | 无线电话会议的电话系统和电话网关 |
JP5926490B2 (ja) * | 2011-02-10 | 2016-05-25 | キヤノン株式会社 | 音声処理装置 |
US9549251B2 (en) | 2011-03-25 | 2017-01-17 | Invensense, Inc. | Distributed automatic level control for a microphone array |
TWI449440B (zh) * | 2011-12-21 | 2014-08-11 | Wistron Neweb Corp | 電子裝置以及播放方法 |
US20130253923A1 (en) * | 2012-03-21 | 2013-09-26 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry | Multichannel enhancement system for preserving spatial cues |
FR2992459B1 (fr) * | 2012-06-26 | 2014-08-15 | Parrot | Procede de debruitage d'un signal acoustique pour un dispositif audio multi-microphone operant dans un milieu bruite. |
CN103929557B (zh) * | 2013-01-11 | 2016-04-13 | 华为技术有限公司 | 语音会议噪声处理方法及装置 |
US10306389B2 (en) | 2013-03-13 | 2019-05-28 | Kopin Corporation | Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
US9570093B2 (en) | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
US9363598B1 (en) * | 2014-02-10 | 2016-06-07 | Amazon Technologies, Inc. | Adaptive microphone array compensation |
TWI579835B (zh) * | 2015-03-19 | 2017-04-21 | 絡達科技股份有限公司 | 音效增益方法 |
US10225814B2 (en) * | 2015-04-05 | 2019-03-05 | Qualcomm Incorporated | Conference audio management |
US9734845B1 (en) * | 2015-06-26 | 2017-08-15 | Amazon Technologies, Inc. | Mitigating effects of electronic audio sources in expression detection |
US11631421B2 (en) * | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
US10070220B2 (en) | 2015-10-30 | 2018-09-04 | Dialog Semiconductor (Uk) Limited | Method for equalization of microphone sensitivities |
EP3566464B1 (en) | 2017-01-03 | 2021-10-20 | Dolby Laboratories Licensing Corporation | Sound leveling in multi-channel sound capture system |
US10657981B1 (en) * | 2018-01-19 | 2020-05-19 | Amazon Technologies, Inc. | Acoustic echo cancellation with loudspeaker canceling beamformer |
WO2019188388A1 (ja) | 2018-03-29 | 2019-10-03 | ソニー株式会社 | 音声処理装置、音声処理方法、及びプログラム |
JP6992713B2 (ja) * | 2018-09-11 | 2022-01-13 | 日本電信電話株式会社 | 連続発話推定装置、連続発話推定方法、およびプログラム |
JP7001029B2 (ja) * | 2018-09-11 | 2022-01-19 | 日本電信電話株式会社 | キーワード検出装置、キーワード検出方法、およびプログラム |
EP3629602A1 (en) * | 2018-09-27 | 2020-04-01 | Oticon A/s | A hearing device and a hearing system comprising a multitude of adaptive two channel beamformers |
KR102088056B1 (ko) | 2019-08-08 | 2020-03-11 | 남정덕 | 태양광 발전 수배전반 시스템 |
CN113301329B (zh) * | 2021-05-21 | 2022-08-05 | 康佳集团股份有限公司 | 基于图像识别的电视声场校正方法、装置及显示设备 |
Family Cites Families (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4649505A (en) | 1984-07-02 | 1987-03-10 | General Electric Company | Two-input crosstalk-resistant adaptive noise canceller |
US5742735A (en) | 1987-10-06 | 1998-04-21 | Fraunhofer Gesellschaft Zur Forderung Der Angewanten Forschung E.V. | Digital adaptive transformation coding method |
US4912767A (en) | 1988-03-14 | 1990-03-27 | International Business Machines Corporation | Distributed noise cancellation system |
JP2962572B2 (ja) * | 1990-11-19 | 1999-10-12 | 日本電信電話株式会社 | 雑音除去装置 |
US5327178A (en) | 1991-06-17 | 1994-07-05 | Mcmanigal Scott P | Stereo speakers mounted on head |
US5208786A (en) | 1991-08-28 | 1993-05-04 | Massachusetts Institute Of Technology | Multi-channel signal separation |
JPH05316587A (ja) | 1992-05-08 | 1993-11-26 | Sony Corp | マイクロホン装置 |
US5251263A (en) | 1992-05-22 | 1993-10-05 | Andrea Electronics Corporation | Adaptive noise cancellation and speech enhancement system and apparatus therefor |
US5732143A (en) | 1992-10-29 | 1998-03-24 | Andrea Electronics Corp. | Noise cancellation apparatus |
US5383164A (en) | 1993-06-10 | 1995-01-17 | The Salk Institute For Biological Studies | Adaptive system for broadband multisignal discrimination in a channel with reverberation |
US5375174A (en) | 1993-07-28 | 1994-12-20 | Noise Cancellation Technologies, Inc. | Remote siren headset |
JP3146804B2 (ja) | 1993-11-05 | 2001-03-19 | 松下電器産業株式会社 | アレイマイクロホンおよびその感度補正装置 |
US5706402A (en) | 1994-11-29 | 1998-01-06 | The Salk Institute For Biological Studies | Blind signal processing system employing information maximization to recover unknown signals through unsupervised minimization of output redundancy |
US6002776A (en) | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5770841A (en) | 1995-09-29 | 1998-06-23 | United Parcel Service Of America, Inc. | System and method for reading package information |
US5675659A (en) | 1995-12-12 | 1997-10-07 | Motorola | Methods and apparatus for blind separation of delayed and filtered sources |
US6130949A (en) | 1996-09-18 | 2000-10-10 | Nippon Telegraph And Telephone Corporation | Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor |
CA2269027A1 (en) | 1996-10-17 | 1998-04-23 | Andrea Electronics Corporation | Noise cancelling acoustical improvement to wireless telephone or cellular phone |
US5999567A (en) | 1996-10-31 | 1999-12-07 | Motorola, Inc. | Method for recovering a source signal from a composite signal and apparatus therefor |
US7072476B2 (en) | 1997-02-18 | 2006-07-04 | Matech, Inc. | Audio headset |
FR2759824A1 (fr) | 1997-02-18 | 1998-08-21 | Philips Electronics Nv | Systeme de separation de sources non stationnaires |
US6496581B1 (en) | 1997-09-11 | 2002-12-17 | Digisonix, Inc. | Coupled acoustic echo cancellation system |
US6167417A (en) | 1998-04-08 | 2000-12-26 | Sarnoff Corporation | Convolutive blind source separation using a multiple decorrelation method |
DE19822021C2 (de) | 1998-05-15 | 2000-12-14 | Siemens Audiologische Technik | Hörgerät mit automatischem Mikrofonabgleich sowie Verfahren zum Betrieb eines Hörgerätes mit automatischem Mikrofonabgleich |
US6654468B1 (en) | 1998-08-25 | 2003-11-25 | Knowles Electronics, Llc | Apparatus and method for matching the response of microphones in magnitude and phase |
DE19849739C2 (de) | 1998-10-28 | 2001-05-31 | Siemens Audiologische Technik | Adaptives Verfahren zur Korrektur der Mikrofone eines Richtmikrofonsystems in einem Hörgerät sowie Hörgerät |
US6898612B1 (en) | 1998-11-12 | 2005-05-24 | Sarnoff Corporation | Method and system for on-line blind source separation |
US6606506B1 (en) | 1998-11-19 | 2003-08-12 | Albert C. Jones | Personal entertainment and communication device |
US6343268B1 (en) | 1998-12-01 | 2002-01-29 | Siemens Corporation Research, Inc. | Estimator of independent sources from degenerate mixtures |
DE19859174C1 (de) | 1998-12-21 | 2000-05-04 | Max Planck Gesellschaft | Verfahren und Vorrichtung zur Verarbeitung rauschbehafteter Schallsignale |
US6381570B2 (en) | 1999-02-12 | 2002-04-30 | Telogy Networks, Inc. | Adaptive two-threshold method for discriminating noise from speech in a communication signal |
AU4284600A (en) | 1999-03-19 | 2000-10-09 | Siemens Aktiengesellschaft | Method and device for receiving and treating audiosignals in surroundings affected by noise |
US6526148B1 (en) | 1999-05-18 | 2003-02-25 | Siemens Corporate Research, Inc. | Device and method for demixing signal mixtures using fast blind source separation technique based on delay and attenuation compensation, and for selecting channels for the demixed signals |
US6424960B1 (en) | 1999-10-14 | 2002-07-23 | The Salk Institute For Biological Studies | Unsupervised adaptation and classification of multiple classes and sources in blind signal separation |
US6594367B1 (en) | 1999-10-25 | 2003-07-15 | Andrea Electronics Corporation | Super directional beamforming design and implementation |
JP4277400B2 (ja) * | 1999-12-17 | 2009-06-10 | ソニー株式会社 | 音声信号記録装置 |
US6549630B1 (en) | 2000-02-04 | 2003-04-15 | Plantronics, Inc. | Signal expander with discrimination between close and distant acoustic source |
US6654719B1 (en) | 2000-03-14 | 2003-11-25 | Lucent Technologies Inc. | Method and system for blind separation of independent source signals |
AU4574001A (en) | 2000-03-14 | 2001-09-24 | Audia Technology Inc | Adaptive microphone matching in multi-microphone directional system |
US20010038699A1 (en) | 2000-03-20 | 2001-11-08 | Audia Technology, Inc. | Automatic directional processing control for multi-microphone system |
US8903737B2 (en) | 2000-04-25 | 2014-12-02 | Accenture Global Service Limited | Method and system for a wireless universal mobile product interface |
US6879952B2 (en) | 2000-04-26 | 2005-04-12 | Microsoft Corporation | Sound source separation using convolutional mixing and a priori sound source knowledge |
US20030179888A1 (en) | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US7027607B2 (en) | 2000-09-22 | 2006-04-11 | Gn Resound A/S | Hearing aid with adaptive microphone matching |
US7471798B2 (en) | 2000-09-29 | 2008-12-30 | Knowles Electronics, Llc | Microphone array having a second order directional pattern |
EP2348752A1 (en) | 2000-09-29 | 2011-07-27 | Knowles Electronics, LLC | Second order microphone array |
JP4028680B2 (ja) | 2000-11-01 | 2007-12-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体 |
US6462664B1 (en) | 2000-11-20 | 2002-10-08 | Koninklijke Philips Electronics N.V. | Baby monitor, system, and method and control of remote devices |
US7206418B2 (en) | 2001-02-12 | 2007-04-17 | Fortemedia, Inc. | Noise suppression for a wireless communication device |
MXPA03007128A (es) | 2001-02-14 | 2003-11-18 | Gentex Corp | Microfono para accesorio de vehiculo. |
AU2001258132A1 (en) | 2001-05-23 | 2001-08-20 | Phonak Ag | Method of generating an electrical output signal and acoustical/electrical conversion system |
US7123727B2 (en) | 2001-07-18 | 2006-10-17 | Agere Systems Inc. | Adaptive close-talking differential microphone array |
US8098844B2 (en) | 2002-02-05 | 2012-01-17 | Mh Acoustics, Llc | Dual-microphone spatial noise suppression |
WO2003107591A1 (en) | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
AU2003250464A1 (en) | 2002-09-13 | 2004-04-30 | Koninklijke Philips Electronics N.V. | Calibrating a first and a second microphone |
US7383178B2 (en) | 2002-12-11 | 2008-06-03 | Softmax, Inc. | System and method for speech processing using independent component analysis under stability constraints |
US7142682B2 (en) | 2002-12-20 | 2006-11-28 | Sonion Mems A/S | Silicon-based transducer for use in hearing instruments and listening devices |
KR100480789B1 (ko) | 2003-01-17 | 2005-04-06 | 삼성전자주식회사 | 피드백 구조를 이용한 적응적 빔 형성방법 및 장치 |
US7716044B2 (en) * | 2003-02-07 | 2010-05-11 | Nippon Telegraph And Telephone Corporation | Sound collecting method and sound collecting device |
EP1453348A1 (de) | 2003-02-25 | 2004-09-01 | AKG Acoustics GmbH | Selbstkalibrierung von Arraymikrofonen |
US7039546B2 (en) | 2003-03-04 | 2006-05-02 | Nippon Telegraph And Telephone Corporation | Position information estimation device, method thereof, and program |
DE10310579B4 (de) | 2003-03-11 | 2005-06-16 | Siemens Audiologische Technik Gmbh | Automatischer Mikrofonabgleich bei einem Richtmikrofonsystem mit wenigstens drei Mikrofonen |
KR100486736B1 (ko) | 2003-03-31 | 2005-05-03 | 삼성전자주식회사 | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 |
US7203323B2 (en) | 2003-07-25 | 2007-04-10 | Microsoft Corporation | System and process for calibrating a microphone array |
US7424119B2 (en) | 2003-08-29 | 2008-09-09 | Audio-Technica, U.S., Inc. | Voice matching system for audio transducers |
DE602004027774D1 (de) | 2003-09-02 | 2010-07-29 | Nippon Telegraph & Telephone | Signaltrennverfahren, Signaltrenneinrichtung,und Signaltrennprogramm |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US7515721B2 (en) | 2004-02-09 | 2009-04-07 | Microsoft Corporation | Self-descriptive microphone array |
KR100600313B1 (ko) | 2004-02-26 | 2006-07-14 | 남승현 | 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치 |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
US7688985B2 (en) | 2004-04-30 | 2010-03-30 | Phonak Ag | Automatic microphone matching |
US7190308B2 (en) | 2004-09-23 | 2007-03-13 | Interdigital Technology Corporation | Blind signal separation using signal path selection |
ATE405925T1 (de) | 2004-09-23 | 2008-09-15 | Harman Becker Automotive Sys | Mehrkanalige adaptive sprachsignalverarbeitung mit rauschunterdrückung |
US7826624B2 (en) | 2004-10-15 | 2010-11-02 | Lifesize Communications, Inc. | Speakerphone self calibration and beam forming |
US7464029B2 (en) | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
JP4701931B2 (ja) | 2005-09-02 | 2011-06-15 | 日本電気株式会社 | 信号処理の方法及び装置並びにコンピュータプログラム |
US7342536B2 (en) * | 2005-09-12 | 2008-03-11 | Lockheed Martin Corporation | System and method for determining the location of emitters having well-behaved timing features |
DE102005047047A1 (de) | 2005-09-30 | 2007-04-12 | Siemens Audiologische Technik Gmbh | Mikrofonkalibrierung bei einem RGSC-Beamformer |
US7813923B2 (en) | 2005-10-14 | 2010-10-12 | Microsoft Corporation | Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset |
KR100636368B1 (ko) | 2005-11-09 | 2006-10-19 | 한국전자통신연구원 | 상대 최적화를 이용한 다중경로 혼합신호 분리 방법 및 그장치 |
JP2007156300A (ja) | 2005-12-08 | 2007-06-21 | Kobe Steel Ltd | 音源分離装置、音源分離プログラム及び音源分離方法 |
JP4863713B2 (ja) | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
CN1809105B (zh) * | 2006-01-13 | 2010-05-12 | 北京中星微电子有限公司 | 适用于小型移动通信设备的双麦克语音增强方法及系统 |
WO2007100330A1 (en) | 2006-03-01 | 2007-09-07 | The Regents Of The University Of California | Systems and methods for blind source signal separation |
US8898056B2 (en) | 2006-03-01 | 2014-11-25 | Qualcomm Incorporated | System and method for generating a separated signal by reordering frequency components |
US20070244698A1 (en) | 2006-04-18 | 2007-10-18 | Dugger Jeffery D | Response-select null steering circuit |
JP2008057926A (ja) | 2006-09-01 | 2008-03-13 | Sanyo Electric Co Ltd | タンクユニット |
US20080175407A1 (en) | 2007-01-23 | 2008-07-24 | Fortemedia, Inc. | System and method for calibrating phase and gain mismatches of an array microphone |
US8160273B2 (en) | 2007-02-26 | 2012-04-17 | Erik Visser | Systems, methods, and apparatus for signal separation using data driven techniques |
JP2010519602A (ja) | 2007-02-26 | 2010-06-03 | クゥアルコム・インコーポレイテッド | 信号分離のためのシステム、方法、および装置 |
US8175291B2 (en) | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
-
2009
- 2009-05-28 US US12/473,930 patent/US8321214B2/en active Active
- 2009-06-02 CN CN200980119649.2A patent/CN102047688B/zh not_active Expired - Fee Related
- 2009-06-02 EP EP09759278A patent/EP2301258A1/en not_active Withdrawn
- 2009-06-02 KR KR1020107029919A patent/KR101217970B1/ko active IP Right Grant
- 2009-06-02 WO PCT/US2009/046021 patent/WO2009149119A1/en active Application Filing
- 2009-06-02 JP JP2011512595A patent/JP5329655B2/ja not_active Expired - Fee Related
- 2009-06-02 TW TW098118313A patent/TW201012244A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
JP2011523836A (ja) | 2011-08-18 |
TW201012244A (en) | 2010-03-16 |
US8321214B2 (en) | 2012-11-27 |
CN102047688B (zh) | 2014-06-25 |
US20090299739A1 (en) | 2009-12-03 |
EP2301258A1 (en) | 2011-03-30 |
CN102047688A (zh) | 2011-05-04 |
WO2009149119A1 (en) | 2009-12-10 |
KR101217970B1 (ko) | 2013-01-02 |
KR20110025677A (ko) | 2011-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5329655B2 (ja) | マルチチャネル信号のバランスをとるためのシステム、方法及び装置 | |
KR101275442B1 (ko) | 멀티채널 신호의 위상 기반 프로세싱을 위한 시스템들, 방법들, 장치들, 및 컴퓨터 판독가능한 매체 | |
EP2572353B1 (en) | Methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair | |
KR101470262B1 (ko) | 다중-마이크로폰 위치 선택적 프로세싱을 위한 시스템들, 방법들, 장치, 및 컴퓨터 판독가능 매체 | |
JP5038550B1 (ja) | ロバストな雑音低減のためのマイクロフォンアレイサブセット選択 | |
JP5575977B2 (ja) | ボイスアクティビティ検出 | |
US8831936B2 (en) | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement | |
US8175291B2 (en) | Systems, methods, and apparatus for multi-microphone based speech enhancement | |
TW201032220A (en) | Systems, methods, apparatus, and computer-readable media for coherence detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120828 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130724 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5329655 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |