JPWO2017002525A1 - 信号処理装置、信号処理方法、および信号処理プログラム - Google Patents
信号処理装置、信号処理方法、および信号処理プログラム Download PDFInfo
- Publication number
- JPWO2017002525A1 JPWO2017002525A1 JP2017526240A JP2017526240A JPWO2017002525A1 JP WO2017002525 A1 JPWO2017002525 A1 JP WO2017002525A1 JP 2017526240 A JP2017526240 A JP 2017526240A JP 2017526240 A JP2017526240 A JP 2017526240A JP WO2017002525 A1 JPWO2017002525 A1 JP WO2017002525A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- input
- phase difference
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 118
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000005236 sound signal Effects 0.000 claims abstract description 34
- 230000002452 interceptive effect Effects 0.000 claims abstract description 21
- 238000012937 correction Methods 0.000 claims description 57
- 230000001629 suppression Effects 0.000 claims description 38
- 238000009499 grossing Methods 0.000 claims description 33
- 238000000034 method Methods 0.000 abstract description 78
- 230000008569 process Effects 0.000 abstract description 5
- 238000001228 spectrum Methods 0.000 description 129
- 238000006243 chemical reaction Methods 0.000 description 46
- 238000010586 diagram Methods 0.000 description 46
- 238000004364 calculation method Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 39
- 230000000694 effects Effects 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 230000010354 integration Effects 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 206010013142 Disinhibition Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101000704905 Saponaria officinalis Ribosome-inactivating protein saporin-5 Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/07—Mechanical or electrical reduction of wind noise generated by wind passing a microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力する位相差出力手段と、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成する生成手段と、
を備えた。
目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力するステップと、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成するステップと、
を含む。
目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力するステップと、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成するステップと、
を、コンピュータに実行させる。
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。図1に示すように、信号処理装置100は、位相差出力部101と生成部102とを備える。位相差出力部101は、目的音110と妨害音120とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号131と、同環境において入力した第2入力音に基づいて生成された第2入力信号132と、の位相差133を出力する。生成部102は、位相差133と第1入力信号131とに基づいて、推定妨害音信号134を生成する。
次に本発明の第2実施形態に係る信号処理装置について、図2乃至図7Bを用いて説明する。図2は、本実施形態に係る信号処理装置の構成を説明するためのブロック図である。本実施形態の信号処理装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能する。しかし、本発明はこれに限定されるものではなく、目的音と妨害音とが混在する環境において取得した入力信号から妨害音の成分除去を要求されるあらゆる信号処理装置に適用可能である。
図3は、変換部203、204の構成を示すブロック図である。図3に示すように、変換部203、204はフレーム分割部301、窓がけ処理部(windowing unit)302、およびフーリエ変換部303を含む。
図4は、逆変換部207の構成を示すブロック図である。図4に示すように、逆変換部207は逆フーリエ変換部401、窓がけ処理部402、およびフレーム合成部403を含む。
図5は、抑圧部206の構成を示すブロック図である。図5に示すように、抑圧部206はゲイン計算部501、および乗算部502を含む。
図6Aは、推定部205の構成を示すブロック図である。図6Aに示すように、推定部205は、位相差出力部251と生成部252とを有する。さらに、生成部252は、抑圧部602、および補正部603を含む。
本実施形態によれば、仮推定第2信号成分を補正して推定第2信号成分N(k,n)を生成する。これにより、混在信号スペクトルX1(k,n)、X2(k,n)の位相差Δθ(k,n)が小さくなる周波数において、推定第2信号成分N(k,n)のパワーが小さくなりすぎること(過小推定)を回避できる。このため、第2信号成分(妨害音成分)を高精度に推定でき、第2信号成分の抑圧不足を回避でき、従来よりも強調信号の品質が向上する。
次に本発明の第3実施形態に係る信号処理装置について、図8A、図8Bを用いて説明する。図8Aは、本実施形態に係る信号処理装置の推定部805の構成を説明するための図である。本実施形態に係る補正部853は、第2実施形態に係る補正部603と比べると、第1入力信号を入力する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第4実施形態に係る信号処理装置について、図9を用いて説明する。図9は、本実施形態に係る信号処理装置の推定部905の構成を説明するための図である。本実施形態に係る補正部953は、第2実施形態に係る補正部603と比べると、第1入力信号と第2入力信号とを入力する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
ただし、c(k,n)とd(k,n)は実数である。混合に伴うパワーの大幅な変化を防止するため、c(k,n)とd(k,n)の和は1であることが望ましい。そして、Nbar(k,n)とPX3(k,n)を比較し、値が小さい方を推定第2信号成分N(k,n)とする。
次に本発明の第5実施形態に係る信号処理装置について、図10Aを用いて説明する。図10Aは、本実施形態に係る信号処理装置の推定部1005の構成を説明するための図である。本実施形態に係る生成部1052は、第2実施形態に係る生成部252と比べると、存在確率計算部1054と補正部1055とを備えた点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
ただし、exp(・)とlog(・)はそれぞれ指数関数、対数関数である。対数領域で重み付き和を計算することで、聴覚的に優れた混合を実現できる。その他にも、高次の多項式関数や非線形関数など、他の形で表される関数を用いることも可能である。
次に本発明の第6実施形態に係る信号処理装置について、図11を用いて説明する。図11は、本実施形態に係る信号処理装置の推定部1105の構成を説明するための図である。本実施形態に係る存在確率計算部1154は、第5実施形態に係る存在確率計算部1054と比べると、第1入力信号と第2入力信号とを入力する点で異なる。その他の構成および動作は、第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第7実施形態に係る信号処理装置について、図12を用いて説明する。図12は、本実施形態に係る信号処理装置の推定部1205の構成を説明するための図である。本実施形態に係る補正部1255は、第5実施形態に係る補正部1055と比べると、第1入力信号を入力する点で異なる。その他の構成および動作は、第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第8実施形態に係る信号処理装置について、図13を用いて説明する。図13は、本実施形態に係る信号処理装置の推定部1305の構成を説明するための図である。本実施形態に係る補正部1355は、第6実施形態に係る補正部1055と比べると、第1入力信号と第2入力信号とを入力する点で異なる。その他の構成および動作は、第6実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第9実施形態に係る信号処理装置について、図14を用いて説明する。図14は、本実施形態に係る信号処理装置の推定部1405の構成を説明するための図である。本実施形態に係る推定部1405に含まれる位相差出力部1451は、第2実施形態に係る位相差出力部251と比べると、仮位相差算出部1452と仮位相差補正部1453とを有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第10実施形態に係る信号処理装置について、図15を用いて説明する。図15は、本実施形態に係る信号処理装置の推定部1505の構成を説明するための図である。本実施形態に係る推定部1505は、第9実施形態に係る推定部1405と比べると、位相差出力部1551が、存在確率計算部1054を有する点で異なる。その他の構成および動作は、第9実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第11実施形態に係る信号処理装置について、図16を用いて説明する。図16は、本実施形態に係る信号処理装置の推定部1605の構成を説明するための図である。本実施形態に係る推定部1605は、第2実施形態に係る推定部205と比べると、仮ゲイン計算部1653、仮ゲイン補正部1654、および乗算器1655を有する推定妨害音生成部1652を備えた点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第12実施形態に係る信号処理装置について、図17を用いて説明する。図17は、本実施形態に係る信号処理装置の推定部1705の構成を説明するための図である。本実施形態に係る推定部1705は、第11実施形態に係る推定部1605と比べると、存在確率計算部1054と仮ゲイン補正部1751を有する推定妨害音生成部1752を備えた点で異なる。その他の構成および動作は、第11実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第13実施形態に係る信号処理装置について、図18を用いて説明する。図18は、本実施形態に係る信号処理装置1800の構成を説明するための図である。本実施形態に係る信号処理装置1800は、第2実施形態に係る信号処理装置200と比べると、位相調整部1809を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第14実施形態に係る信号処理装置について、図19を用いて説明する。図19は、本実施形態に係る信号処理装置1900の構成を説明するための図である。本実施形態に係る信号処理装置1900は、第2実施形態に係る信号処理装置200と比べると、センサ1901、変換部1902、および推定部1903を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第15実施形態に係る信号処理装置について、図21を用いて説明する。図21は、本実施形態に係る信号処理装置2100の構成を説明するための図である。本実施形態に係る信号処理装置2100は、第2実施形態に係る信号処理装置200と比べると、推定部、抑圧部、および逆変換部の組を変換部ごとに一組ずつ有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第16実施形態に係る信号処理装置について、図22を用いて説明する。図22は、本実施形態に係る信号処理装置2200のハードウェア構成を説明するための図である。
以上説明してきた第1乃至第16実施形態では、それぞれ別々の特徴を持つ信号処理装置について説明したが、それらの特徴を如何様に組み合わせた信号処理装置も、本発明の範疇に含まれる。また、本発明は、複数の機器から構成されるシステムに適用してもよいし、単体の装置に適用してもよい。さらに、本発明は、実施形態の機能を実現するソフトウェアの信号処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWWサーバも、本発明の範疇に含まれる。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力する位相差出力手段と、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成する生成手段と、
を備えた信号処理装置。
(付記2)
前記推定妨害音信号に基づき、前記第1入力信号における前記妨害音の成分を抑圧した強調信号を生成する第1抑圧手段をさらに備えた付記1に記載の信号処理装置。
(付記3)
前記生成手段は、
前記位相差を用いて、前記第1入力信号に含まれる目的音成分を抑圧して仮推定妨害音信号を生成する目的音抑圧手段と、
前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する補正手段と、
を備えた、付記1または2に記載の信号処理装置。
(付記4)
前記補正手段は、前記第1入力信号に基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、付記3に記載の信号処理装置。
(付記5)
前記補正手段は、前記第1入力信号と前記第2入力信号とに基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、付記4に記載の信号処理装置。
(付記6)
前記生成手段は、前記第1入力信号における前記目的音成分の存在確率を計算する存在確率計算手段をさらに備え、
前記補正手段は、前記目的音成分の存在確率に基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、付記3に記載の信号処理装置。
(付記7)
前記補正手段は、前記仮推定妨害音信号を時間方向または周波数方向に平滑化した後の平滑化妨害音信号と、平滑化する前の前記仮推定妨害音信号とを混合して前記推定妨害音信号を生成する、付記3乃至6のいずれか1項に記載の信号処理装置。
(付記8)
前記存在確率計算手段は、前記第1入力信号と前記第2入力信号とに基づいて、前記第1入力信号における前記目的音成分の存在確率を計算する、付記6に記載の信号処理装置。
(付記9)
前記補正手段は、前記第1入力信号と前記存在確率とに基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、付記6、7または8に記載の信号処理装置。
(付記10)
前記補正手段は、前記第1入力信号と前記第2入力信号と前記存在確率とに基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、付記6、7または8に記載の信号処理装置。
(付記11)
前記位相差出力手段は、
前記第1入力信号の位相と前記第2入力信号の位相との仮位相差を求める仮位相差算出手段と、
前記仮位相差を補正して前記位相差を生成する仮位相差補正手段と、
をさらに備えた、付記1乃至10のいずれか1項に記載の信号処理装置。
(付記12)
前記仮位相差補正手段は、前記第1入力信号における前記目的音成分の存在確率に基づいて、前記仮位相差を補正して前記位相差を生成する、付記11に記載の信号処理装置。
(付記13)
前記生成手段は、
前記第1入力信号と前記位相差とに基づいて仮ゲインを求める仮ゲイン計算手段と、
前記仮ゲインを補正してゲインを生成する仮ゲイン補正手段と、
前記第1入力信号と前記ゲインとを乗算して前記推定妨害音信号を生成する乗算手段と、
を備えた、付記1乃至12のいずれか1項に記載の信号処理装置。
(付記14)
前記仮ゲイン補正手段は、前記第1入力信号における前記目的音成分の存在確率に基づいて、前記仮ゲインを補正して前記ゲインを生成する、付記13に記載の信号処理装置。
(付記15)
前記第1入力信号の位相と前記第2入力信号の位相とを調整した第1位相調整信号と第2位相調整信号とを生成する位相調整手段をさらに備え、
前記第1入力信号と前記第2入力信号とに代えて前記第1位相調整信号と前記第2位相調整信号とを用いる、付記1乃至14のいずれか1項に記載の信号処理装置。
(付記16)
前記位相差出力手段は、目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、前記環境において入力した第3入力音に基づいて生成された第3入力信号と、の位相差を出力する、付記1乃至15のいずれか1項に記載の信号処理装置。
(付記17)
前記推定妨害音信号に基づいて、前記第2入力信号に含まれる前記妨害音の成分を抑圧する第2抑圧手段をさらに備えた、付記1乃至16のいずれか1項に記載の信号処理装置。
(付記18)
目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力するステップと、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成するステップと、
を含む信号処理方法。
(付記19)
目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力するステップと、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成するステップと、
を、コンピュータに実行させる信号処理プログラム。
Claims (10)
- 目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力する位相差出力手段と、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成する生成手段と、
を備えた信号処理装置。 - 前記推定妨害音信号に基づき、前記第1入力信号における前記妨害音の成分を抑圧した強調信号を生成する第1抑圧手段をさらに備えた請求項1に記載の信号処理装置。
- 前記生成手段は、
前記位相差を用いて、前記第1入力信号に含まれる目的音成分を抑圧して仮推定妨害音信号を生成する目的音抑圧手段と、
前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する補正手段と、
を備えた、請求項1または2に記載の信号処理装置。 - 前記補正手段は、前記第1入力信号に基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、請求項3に記載の信号処理装置。
- 前記補正手段は、前記第1入力信号と前記第2入力信号とに基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、請求項4に記載の信号処理装置。
- 前記生成手段は、前記第1入力信号における前記目的音成分の存在確率を計算する存在確率計算手段をさらに備え、
前記補正手段は、前記目的音成分の存在確率に基づいて、前記仮推定妨害音信号を補正して前記推定妨害音信号を生成する、請求項3に記載の信号処理装置。 - 前記補正手段は、前記仮推定妨害音信号を時間方向または周波数方向に平滑化した後の平滑化妨害音信号と、平滑化する前の前記仮推定妨害音信号とを混合して前記推定妨害音信号を生成する、請求項3乃至6のいずれか1項に記載の信号処理装置。
- 前記存在確率計算手段は、前記第1入力信号と前記第2入力信号とに基づいて、前記第1入力信号における前記目的音成分の存在確率を計算する、請求項6に記載の信号処理装置。
- 目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力するステップと、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成するステップと、
を含む信号処理方法。 - 目的音と妨害音とが混在する環境において入力した第1入力音に基づいて生成された第1入力信号と、前記環境において入力した第2入力音に基づいて生成された第2入力信号と、の位相差を出力するステップと、
前記位相差と前記第1入力信号とに基づいて、推定妨害音信号を生成するステップと、
を、コンピュータに実行させる信号処理プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015131978 | 2015-06-30 | ||
JP2015131978 | 2015-06-30 | ||
PCT/JP2016/066481 WO2017002525A1 (ja) | 2015-06-30 | 2016-06-02 | 信号処理装置、信号処理方法、および信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017002525A1 true JPWO2017002525A1 (ja) | 2018-04-26 |
JP6780644B2 JP6780644B2 (ja) | 2020-11-04 |
Family
ID=57609480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017526240A Active JP6780644B2 (ja) | 2015-06-30 | 2016-06-02 | 信号処理装置、信号処理方法、および信号処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10515650B2 (ja) |
JP (1) | JP6780644B2 (ja) |
WO (1) | WO2017002525A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11553692B2 (en) | 2011-12-05 | 2023-01-17 | Radio Systems Corporation | Piezoelectric detection coupling of a bark collar |
US11470814B2 (en) | 2011-12-05 | 2022-10-18 | Radio Systems Corporation | Piezoelectric detection coupling of a bark collar |
CA3053643A1 (en) | 2017-02-27 | 2018-08-30 | Radio Systems Corporation | Threshold barrier system |
US11394196B2 (en) | 2017-11-10 | 2022-07-19 | Radio Systems Corporation | Interactive application to protect pet containment systems from external surge damage |
US11372077B2 (en) | 2017-12-15 | 2022-06-28 | Radio Systems Corporation | Location based wireless pet containment system using single base unit |
JP7042169B2 (ja) * | 2018-06-21 | 2022-03-25 | 日清紡マイクロデバイス株式会社 | 音声認識支援システム |
JP7027365B2 (ja) * | 2019-03-13 | 2022-03-01 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
CN110111806B (zh) * | 2019-03-26 | 2021-03-30 | 广东工业大学 | 一种移动源信号混叠的盲分离方法 |
US11238889B2 (en) * | 2019-07-25 | 2022-02-01 | Radio Systems Corporation | Systems and methods for remote multi-directional bark deterrence |
US11490597B2 (en) | 2020-07-04 | 2022-11-08 | Radio Systems Corporation | Systems, methods, and apparatus for establishing keep out zones within wireless containment regions |
CN112485761B (zh) * | 2021-02-03 | 2021-04-09 | 成都启英泰伦科技有限公司 | 一种基于双麦克风的声源定位方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
JP2011244232A (ja) * | 2010-05-19 | 2011-12-01 | Fujitsu Ltd | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム |
JP2012037603A (ja) * | 2010-08-04 | 2012-02-23 | Fujitsu Ltd | 雑音推定装置、雑音推定方法および雑音推定プログラム |
JP2015025913A (ja) * | 2013-07-25 | 2015-02-05 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101418023B1 (ko) * | 2008-03-14 | 2014-07-09 | 삼성전자주식회사 | 위상정보를 이용한 자동 이득 조절 장치 및 방법 |
JP4545233B2 (ja) * | 2008-09-30 | 2010-09-15 | パナソニック株式会社 | 音判定装置、音判定方法、及び、音判定プログラム |
JP5516169B2 (ja) * | 2010-07-14 | 2014-06-11 | ヤマハ株式会社 | 音響処理装置およびプログラム |
US8682006B1 (en) * | 2010-10-20 | 2014-03-25 | Audience, Inc. | Noise suppression based on null coherence |
JP6179081B2 (ja) * | 2011-09-15 | 2017-08-16 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
-
2016
- 2016-06-02 JP JP2017526240A patent/JP6780644B2/ja active Active
- 2016-06-02 WO PCT/JP2016/066481 patent/WO2017002525A1/ja active Application Filing
- 2016-06-02 US US15/740,413 patent/US10515650B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
JP2011244232A (ja) * | 2010-05-19 | 2011-12-01 | Fujitsu Ltd | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム |
JP2012037603A (ja) * | 2010-08-04 | 2012-02-23 | Fujitsu Ltd | 雑音推定装置、雑音推定方法および雑音推定プログラム |
JP2015025913A (ja) * | 2013-07-25 | 2015-02-05 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US10515650B2 (en) | 2019-12-24 |
WO2017002525A1 (ja) | 2017-01-05 |
US20180190311A1 (en) | 2018-07-05 |
JP6780644B2 (ja) | 2020-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6780644B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
CN105590631B (zh) | 信号处理的方法及装置 | |
JP6279181B2 (ja) | 音響信号強調装置 | |
WO2015196729A1 (zh) | 一种麦克风阵列语音增强方法及装置 | |
JP4910568B2 (ja) | 紙擦れ音除去装置 | |
CN109285557B (zh) | 一种定向拾音方法、装置及电子设备 | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
JP2011124872A (ja) | 音源分離装置、方法及びプログラム | |
WO2014168021A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
Li et al. | Online Directional Speech Enhancement Using Geometrically Constrained Independent Vector Analysis. | |
WO2020110228A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
Karimian-Azari et al. | Fast joint DOA and pitch estimation using a broadband MVDR beamformer | |
JP2010210728A (ja) | 音響信号処理方法及び装置 | |
CN113362808B (zh) | 一种目标方向语音提取方法、装置、电子设备和存储介质 | |
JP2018136509A (ja) | 信号処理装置、プログラム及び方法 | |
CN112017684B (zh) | 一种基于麦克风阵列的密闭空间混响消除方法 | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム | |
Okuma et al. | Two-channel microphone system with variable arbitrary directional pattern | |
Stolbov et al. | Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise | |
CN115665606B (zh) | 基于四麦克风的收音方法和收音装置 | |
JP2018142822A (ja) | 音響信号処理装置、方法及びプログラム | |
WO2021124537A1 (ja) | 情報処理装置、算出方法、及び算出プログラム | |
Ibarrola et al. | Blind speech dereverberation using convolutive nonnegative matrix factorization with mixed penalization | |
Mergu et al. | Empirical evaluation of hybrid filtering: An approach for speech enhancement | |
Suyama et al. | Target sound extraction utilizing similarity between signals as index for learning of linear filter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6780644 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |