JP2021036297A - 信号処理装置、信号処理方法、及びプログラム - Google Patents
信号処理装置、信号処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2021036297A JP2021036297A JP2019158133A JP2019158133A JP2021036297A JP 2021036297 A JP2021036297 A JP 2021036297A JP 2019158133 A JP2019158133 A JP 2019158133A JP 2019158133 A JP2019158133 A JP 2019158133A JP 2021036297 A JP2021036297 A JP 2021036297A
- Authority
- JP
- Japan
- Prior art keywords
- detection signal
- unit
- correlation matrix
- spatial correlation
- spatial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 5
- 239000011159 matrix material Substances 0.000 claims abstract description 76
- 238000001514 detection method Methods 0.000 claims abstract description 65
- 238000004364 calculation method Methods 0.000 claims abstract description 41
- 238000006243 chemical reaction Methods 0.000 claims abstract description 19
- 238000001228 spectrum Methods 0.000 claims description 90
- 230000003111 delayed effect Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 16
- 230000015654 memory Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 108091006146 Channels Proteins 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】一実施形態に係る信号処理装置は、変換部、第1の算出部、第2の算出部、及び空間フィルタ部を備える。変換部は、異なる位置で音を検出することで得られる第1の検出信号を時間周波数領域に変換して第2の検出信号を得る。第1の算出部は、前記第2の検出信号に基づいて第1の空間相関行列を算出する。第2の算出部は、前記第2の検出信号を所定の時間だけ遅延した第3の検出信号に基づいて第2の空間相関行列を算出する。空間フィルタ部は、前記第1の空間相関行列及び前記第2の空間相関行列に基づいて空間フィルタを生成し、前記空間フィルタを用いて前記第2の検出信号をフィルタリングする。
【選択図】図4
Description
図1は、第1の実施形態に係る信号処理装置を備えるリモコン装置100を概略的に示すブロック図であり、図2は、リモコン装置100の外観を概略的に示す斜視図である。
第2の実施形態は、スペクトル強調部の構成が第1の実施形態と異なり、スペクトル強調部以外の要素については第1の実施形態と同じである。このため、スペクトル強調部以外の要素についての説明を省略する。第2の実施形態では、空間相関行列ΦS(f,n)は、周波数スペクトルX(f,n)にマスクを乗じることにより求められる。マスクとは、各時間周波数点における検出信号に占める目的信号の割合、すなわち、各時間フレーム及び各周波数ビンの周波数スペクトルが強調すべき音声を含む割合を表す。マスクを適切に推定することが可能であれば、空間相関行列ΦS(f,n)から雑音成分が取り除かれて、空間フィルタの性能改善が期待できる。
第3の実施形態に係る信号処理装置は、遅延時間を設定する設定部を第1の実施形態に係る信号処理装置に追加したものに相当する。
第4の実施形態は、第3の実施形態で説明したスイッチが“Multi”側に切り替えられたときの動作の変形例に関する。第3の実施形態では、スイッチが“Multi”側に切り替えられた場合に、すべてのコマンドワードの先頭に「エアコン」が挿入される。第4の実施形態では、スイッチが“Multi”側に切り替えられた場合に、「エアコン」という1つのコマンドワードが追加される。
Claims (10)
- 異なる位置で音を検出することで得られる第1の検出信号を時間周波数領域に変換して第2の検出信号を得る変換部と、
前記第2の検出信号に基づいて第1の空間相関行列を算出する第1の算出部と、
前記第2の検出信号を所定の時間だけ遅延した第3の検出信号に基づいて第2の空間相関行列を算出する第2の算出部と、
前記第1の空間相関行列及び前記第2の空間相関行列に基づいて空間フィルタを生成し、前記空間フィルタを用いて前記第2の検出信号をフィルタリングする空間フィルタ部と、
を備える信号処理装置。 - 前記第1の算出部は、第1の時刻までの前記第2の検出信号を使用して、前記第1の時刻より前記所定の時間だけ前の時刻である第2の時刻から前記第1の時刻までの前記第2の検出信号の寄与が前記第1の時刻までの前記第2の検出信号の寄与よりも大きくなるように、前記第1の空間相関行列を算出する、
請求項1に記載の信号処理装置。 - 前記第2の検出信号に基づいて、各時間周波数点における第1の検出信号に占める目的信号の割合を表すマスクを推定するマスク推定部をさらに備え、
前記第1の算出部は、前記第2の検出信号と前記マスクとに基づいて前記第1の空間相関行列を算出する、
請求項1又は2に記載の信号処理装置。 - 前記マスク推定部は、前記第2の検出信号と前記第2の空間相関行列とに基づいて雑音と目的信号との到来方向の違いを推定することにより、前記マスクを推定する、
請求項3に記載の信号処理装置。 - 前記マスク推定部は、前記第2の検出信号に基づいて雑音と目的信号とのスペクトルの違いを推定することにより、前記マスクを推定する、
請求項3に記載の信号処理装置。 - 前記所定の時間を設定する設定部をさらに備える、
請求項1乃至5のいずれか1項に記載の信号処理装置。 - 前記空間フィルタは、前記第1の空間相関行列を信号の空間相関行列とし、前記第2の空間相関行列を雑音の空間相関行列とした信号対雑音比最大化ビームフォーマである、
請求項1乃至6のいずれか1項に記載の信号処理装置。 - 前記空間フィルタ部の出力に対して、あらかじめ登録されたキーワードの検出を行う音声認識部と、
前記空間フィルタを形成する空間フィルタ係数と、前記第1の空間相関行列と、前記第2の空間相関行列と、の少なくとも1つに関する情報を記憶する記憶部と、
をさらに備え、
前記空間フィルタ部は,前記音声認識部が前記キーワードを検出した場合に、前記記憶部に記憶された前記情報に基づいて前記空間フィルタを生成する、
請求項1乃至7のいずれか1項に記載の信号処理装置。 - 信号処理装置により実行される信号処理方法であって、
異なる位置で音を検出することで得られる第1の検出信号を時間周波数領域に変換して第2の検出信号を得ることと、
前記第2の検出信号に基づいて第1の空間相関行列を算出することと、
前記第2の検出信号を所定の時間だけ遅延した第3の検出信号に基づいて第2の空間相関行列を算出することと、
前記第1の空間相関行列及び前記第2の空間相関行列に基づいて空間フィルタを生成することと、
前記空間フィルタを用いて前記第2の検出信号をフィルタリングすることと、
を備える信号処理方法。 - 異なる位置で音を検出することで得られる第1の検出信号を時間周波数領域に変換して第2の検出信号を得る手段、
前記第2の検出信号に基づいて第1の空間相関行列を算出する手段、
前記第2の検出信号を所定の時間だけ遅延した第3の検出信号に基づいて第2の空間相関行列を算出する手段、
前記第1の空間相関行列及び前記第2の空間相関行列に基づいて空間フィルタを生成する手段、及び
前記空間フィルタを用いて前記第2の検出信号をフィルタリングする手段、
としてコンピュータを機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019158133A JP7191793B2 (ja) | 2019-08-30 | 2019-08-30 | 信号処理装置、信号処理方法、及びプログラム |
US16/795,799 US11395061B2 (en) | 2019-08-30 | 2020-02-20 | Signal processing apparatus and signal processing method |
CN202010126904.4A CN112447191B (zh) | 2019-08-30 | 2020-02-28 | 信号处理装置以及信号处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019158133A JP7191793B2 (ja) | 2019-08-30 | 2019-08-30 | 信号処理装置、信号処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021036297A true JP2021036297A (ja) | 2021-03-04 |
JP7191793B2 JP7191793B2 (ja) | 2022-12-19 |
Family
ID=74680355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019158133A Active JP7191793B2 (ja) | 2019-08-30 | 2019-08-30 | 信号処理装置、信号処理方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11395061B2 (ja) |
JP (1) | JP7191793B2 (ja) |
CN (1) | CN112447191B (ja) |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10743101B2 (en) | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
JP7191793B2 (ja) * | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11328722B2 (en) * | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11798533B2 (en) * | 2021-04-02 | 2023-10-24 | Google Llc | Context aware beamforming of audio data |
CN113270108B (zh) * | 2021-04-27 | 2024-04-02 | 维沃移动通信有限公司 | 语音活动检测方法、装置、电子设备及介质 |
CN114089141A (zh) * | 2022-01-24 | 2022-02-25 | 杭州兆华电子股份有限公司 | 一种局部放电检测方法及局部放电检测装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014056181A (ja) * | 2012-09-13 | 2014-03-27 | Honda Motor Co Ltd | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
JP2015064554A (ja) * | 2013-08-30 | 2015-04-09 | 本田技研工業株式会社 | 音声処理装置、音声処理方法、及び音声処理プログラム |
JP2015179243A (ja) * | 2014-02-27 | 2015-10-08 | 株式会社Jvcケンウッド | オーディオ信号処理装置 |
WO2016152511A1 (ja) * | 2015-03-23 | 2016-09-29 | ソニー株式会社 | 音源分離装置および方法、並びにプログラム |
JP2019045576A (ja) * | 2017-08-30 | 2019-03-22 | 日本電信電話株式会社 | 目的音声抽出方法、目的音声抽出装置及び目的音声抽出プログラム |
JP2019095551A (ja) * | 2017-11-21 | 2019-06-20 | ヤフー株式会社 | 生成装置、生成方法、および生成プログラム |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE524784T1 (de) * | 2005-09-30 | 2011-09-15 | Irobot Corp | Begleitroboter für persönliche interaktion |
WO2007129731A1 (ja) * | 2006-05-10 | 2007-11-15 | Honda Motor Co., Ltd. | 音源追跡システム、方法、およびロボット |
US8525868B2 (en) * | 2011-01-13 | 2013-09-03 | Qualcomm Incorporated | Variable beamforming with a mobile platform |
JP5691804B2 (ja) * | 2011-04-28 | 2015-04-01 | 富士通株式会社 | マイクロホンアレイ装置及び音信号処理プログラム |
US8885882B1 (en) * | 2011-07-14 | 2014-11-11 | The Research Foundation For The State University Of New York | Real time eye tracking for human computer interaction |
US9516412B2 (en) * | 2014-03-28 | 2016-12-06 | Panasonic Intellectual Property Management Co., Ltd. | Directivity control apparatus, directivity control method, storage medium and directivity control system |
EP2933067B1 (en) * | 2014-04-17 | 2019-09-18 | Softbank Robotics Europe | Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method |
US9838646B2 (en) * | 2015-09-24 | 2017-12-05 | Cisco Technology, Inc. | Attenuation of loudspeaker in microphone array |
US9621984B1 (en) * | 2015-10-14 | 2017-04-11 | Amazon Technologies, Inc. | Methods to process direction data of an audio input device using azimuth values |
US10643633B2 (en) * | 2015-12-02 | 2020-05-05 | Nippon Telegraph And Telephone Corporation | Spatial correlation matrix estimation device, spatial correlation matrix estimation method, and spatial correlation matrix estimation program |
CN107121669B (zh) * | 2016-02-25 | 2021-08-20 | 松下电器(美国)知识产权公司 | 声源探测装置、声源探测方法及非瞬时性记录介质 |
EP3381033B1 (en) * | 2016-03-23 | 2020-08-12 | Google LLC | Adaptive audio enhancement for multichannel speech recognition |
US10375498B2 (en) * | 2016-11-16 | 2019-08-06 | Dts, Inc. | Graphical user interface for calibrating a surround sound system |
JP6636973B2 (ja) | 2017-03-01 | 2020-01-29 | 日本電信電話株式会社 | マスク推定装置、マスク推定方法およびマスク推定プログラム |
US10264350B2 (en) * | 2017-03-03 | 2019-04-16 | Panasonic Intellectual Property Corporation Of America | Sound source probing apparatus, sound source probing method, and storage medium storing program therefor |
US11151992B2 (en) * | 2017-04-06 | 2021-10-19 | AIBrain Corporation | Context aware interactive robot |
JP6686977B2 (ja) * | 2017-06-23 | 2020-04-22 | カシオ計算機株式会社 | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム |
US10649060B2 (en) * | 2017-07-24 | 2020-05-12 | Microsoft Technology Licensing, Llc | Sound source localization confidence estimation using machine learning |
US10839822B2 (en) * | 2017-11-06 | 2020-11-17 | Microsoft Technology Licensing, Llc | Multi-channel speech separation |
US10885907B2 (en) * | 2018-02-14 | 2021-01-05 | Cirrus Logic, Inc. | Noise reduction system and method for audio device with multiple microphones |
US10524051B2 (en) * | 2018-03-29 | 2019-12-31 | Panasonic Corporation | Sound source direction estimation device, sound source direction estimation method, and recording medium therefor |
JP6587199B1 (ja) * | 2018-07-03 | 2019-10-09 | パナソニックIpマネジメント株式会社 | 推定装置および推定方法 |
JP7027283B2 (ja) * | 2018-08-31 | 2022-03-01 | 本田技研工業株式会社 | 伝達関数生成装置、伝達関数生成方法、およびプログラム |
US10629226B1 (en) * | 2018-10-29 | 2020-04-21 | Bestechnic (Shanghai) Co., Ltd. | Acoustic signal processing with voice activity detector having processor in an idle state |
KR102174598B1 (ko) * | 2019-01-14 | 2020-11-05 | 한국과학기술원 | 회절 인지를 통한 비가시선 음원 위치 추적 방법 및 시스템 |
CN110072177B (zh) * | 2019-04-30 | 2022-04-08 | 北京小米智能科技有限公司 | 空间划分信息获取方法、装置及存储介质 |
JP7191793B2 (ja) * | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
-
2019
- 2019-08-30 JP JP2019158133A patent/JP7191793B2/ja active Active
-
2020
- 2020-02-20 US US16/795,799 patent/US11395061B2/en active Active
- 2020-02-28 CN CN202010126904.4A patent/CN112447191B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014056181A (ja) * | 2012-09-13 | 2014-03-27 | Honda Motor Co Ltd | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
JP2015064554A (ja) * | 2013-08-30 | 2015-04-09 | 本田技研工業株式会社 | 音声処理装置、音声処理方法、及び音声処理プログラム |
JP2015179243A (ja) * | 2014-02-27 | 2015-10-08 | 株式会社Jvcケンウッド | オーディオ信号処理装置 |
WO2016152511A1 (ja) * | 2015-03-23 | 2016-09-29 | ソニー株式会社 | 音源分離装置および方法、並びにプログラム |
JP2019045576A (ja) * | 2017-08-30 | 2019-03-22 | 日本電信電話株式会社 | 目的音声抽出方法、目的音声抽出装置及び目的音声抽出プログラム |
JP2019095551A (ja) * | 2017-11-21 | 2019-06-20 | ヤフー株式会社 | 生成装置、生成方法、および生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
US11395061B2 (en) | 2022-07-19 |
US20210067867A1 (en) | 2021-03-04 |
JP7191793B2 (ja) | 2022-12-19 |
CN112447191A (zh) | 2021-03-05 |
CN112447191B (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7191793B2 (ja) | 信号処理装置、信号処理方法、及びプログラム | |
US9208782B2 (en) | Speech processing device, speech processing method, and speech processing program | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
JP4880036B2 (ja) | 音源と室内音響の確率モデルに基づく音声残響除去のための方法及び装置 | |
US8867755B2 (en) | Sound source separation apparatus and sound source separation method | |
JP6584930B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP4950930B2 (ja) | 音声/非音声を判定する装置、方法およびプログラム | |
US8849657B2 (en) | Apparatus and method for isolating multi-channel sound source | |
US11894010B2 (en) | Signal processing apparatus, signal processing method, and program | |
JP2005249816A (ja) | 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム | |
JP5566846B2 (ja) | ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法 | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
KR102410850B1 (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
JP4960933B2 (ja) | 音響信号強調装置とその方法と、プログラムと記録媒体 | |
JP5406866B2 (ja) | 音源分離装置、その方法及びプログラム | |
WO2021193093A1 (ja) | 信号処理装置、信号処理方法およびプログラム | |
JP6142402B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
JP2005521091A (ja) | 音声相関構造に基づくブラインド伝送路推定方法および装置 | |
JP6439174B2 (ja) | 音声強調装置、および音声強調方法 | |
CN110675890B (zh) | 声音信号处理装置以及声音信号处理方法 | |
JP5044581B2 (ja) | 複数信号強調装置とその方法と、プログラム | |
WO2022190615A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP4242320B2 (ja) | 音声認識方法、その装置およびプログラム、その記録媒体 | |
WO2023228785A1 (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
US20230419980A1 (en) | Information processing device, and output method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210901 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221207 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7191793 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |