JPWO2019073803A1 - 音声入力装置および方法、並びにプログラム - Google Patents
音声入力装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JPWO2019073803A1 JPWO2019073803A1 JP2019548109A JP2019548109A JPWO2019073803A1 JP WO2019073803 A1 JPWO2019073803 A1 JP WO2019073803A1 JP 2019548109 A JP2019548109 A JP 2019548109A JP 2019548109 A JP2019548109 A JP 2019548109A JP WO2019073803 A1 JPWO2019073803 A1 JP WO2019073803A1
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- voice input
- microphone array
- input device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000004044 response Effects 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 36
- 238000005516 engineering process Methods 0.000 abstract description 14
- 238000001228 spectrum Methods 0.000 description 56
- 239000011159 matrix material Substances 0.000 description 39
- 238000004364 calculation method Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 33
- 230000006870 function Effects 0.000 description 15
- 238000012546 transfer Methods 0.000 description 14
- 238000000354 decomposition reaction Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000010354 integration Effects 0.000 description 8
- 230000001629 suppression Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/8006—Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/028—Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/323—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/02—Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
- H04R2201/025—Transducer mountings or cabinet supports enabling variable orientation of transducer of cabinet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/02—Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
- H04R2201/028—Structural combinations of loudspeakers with built-in power amplifiers, e.g. in the same acoustic enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
1.音声入力装置の物理的構成(図1乃至図3)
2.音声入力装置の電気的構成(図4、図5)
3.音声入力装置の動作(図6乃至図11)
4.空間スペクトルの特性(図12乃至図14)
5.コンピュータ(図15)
6.その他
(図1乃至図3)
最初に、図1乃至図3を参照して、音声入力装置の物理的構成について説明する。図1は、音声入力装置の一実施の形態の物理的構成を示す斜視図であり、図2は、マイクロフォンアレイの構成を示す図である。
(図4、図5)
次に図4を参照して、音声入力装置の電気的構成について説明する。図4は、音声入力装置の電気的構成を示すブロック図である。
(図6乃至図11)
(図12乃至図14)
次に、図12乃至図14を参照して、空間スペクトルの特性について説明する。図12乃至図14は、空間スペクトルの特性を示す図である。
(図15)
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、各装置は、図15に示されるようなパーソナルコンピュータにより構成される。図15は、パーソナルコンピュータの構成例を示すブロック図である。
本技術は、以下のような構成もとることができる。
(1)
所定の位置に配置される固定部と、
前記固定部に対して可動する可動部と、
前記固定部に取り付けられたマイクロフォンアレイと、
前記マイクロフォンアレイから入力された、発話者からの音声に基づいて、発話方向を推定する発話方向推定部と、
推定された前記発話方向に対応して前記可動部を駆動する駆動部と
を備える音声入力装置。
(2)
前記マイクロフォンアレイから入力された、前記発話者からの前記音声を認識し、その認識結果に基づいて、前駆動部を制御する制御部をさらに備える
前記(1)に記載の音声入力装置。
(3)
前記制御部は、内部または外部に、前記発話者からの前記音声を認識する音声認識エンジンを備える
前記(1)または(2)に記載の音声入力装置。
(4)
前記マイクロフォンアレイにおいては、複数のマイクロフォンが平面的に配置されている
前記(1)乃至(3)のいずれかに記載の音声入力装置。
(5)
前記可動部は、回転中心に対して対称である
前記(1)乃至(4)のいずれかに記載の音声入力装置。
(6)
前記発話方向推定部は、
前記発話者からの前記音声の信号から前記発話方向の水平角である第1の水平角を推定する第1の推定部と、
前記第1の水平角を基準として、前記第1の水平角の近傍の所定の範囲において、前記発話方向の前記水平角である第2の水平角と仰角を推定する第2の推定部と
を備える
前記(1)乃至(5)のいずれかに記載の音声入力装置。
(7)
所定の位置に配置される固定部と、
前記固定部に対して可動する可動部と、
前記固定部に取り付けられたマイクロフォンアレイと
を備える音声入力装置の音声入力方法において、
前記固定部に取り付けられた前記マイクロフォンアレイから入力された、発話者からの音声に基づいて、発話方向を推定するステップと、
推定された前記発話方向に対応して前記可動部を駆動するステップと
を含む音声入力方法。
(8)
コンピュータに、
所定の位置に配置される固定部と、
前記固定部に対して可動する可動部と、
前記固定部に取り付けられたマイクロフォンアレイと
を備える音声入力装置の音声入力処理を実行させるプログラムにおいて、
前記固定部に取り付けられた前記マイクロフォンアレイから入力された、発話者からの音声に基づいて、発話方向を推定するステップと、
推定された前記発話方向に対応して前記可動部を駆動するステップと
を含むプログラム。
Claims (8)
- 所定の位置に配置される固定部と、
前記固定部に対して可動する可動部と、
前記固定部に取り付けられたマイクロフォンアレイと、
前記マイクロフォンアレイから入力された、発話者からの音声に基づいて、発話方向を推定する発話方向推定部と、
推定された前記発話方向に対応して前記可動部を駆動する駆動部と
を備える音声入力装置。 - 前記マイクロフォンアレイから入力された、前記発話者からの前記音声を認識し、その認識結果に基づいて、前駆動部を制御する制御部をさらに備える
請求項1に記載の音声入力装置。 - 前記制御部は、内部または外部に、前記発話者からの前記音声を認識する音声認識エンジンを備える
請求項2に記載の音声入力装置。 - 前記マイクロフォンアレイにおいては、複数のマイクロフォンが平面的に配置されている
請求項3に記載の音声入力装置。 - 前記可動部は、回転中心に対して対称である
請求項4に記載の音声入力装置。 - 前記発話方向推定部は、
前記発話者からの前記音声の信号から前記発話方向の水平角である第1の水平角を推定する第1の推定部と、
前記第1の水平角を基準として、前記第1の水平角の近傍の所定の範囲において、前記発話方向の前記水平角である第2の水平角と仰角を推定する第2の推定部と
を備える
請求項1に記載の音声入力装置。 - 所定の位置に配置される固定部と、
前記固定部に対して可動する可動部と、
前記固定部に取り付けられたマイクロフォンアレイと
を備える音声入力装置の音声入力方法において、
前記固定部に取り付けられた前記マイクロフォンアレイから入力された、発話者からの音声に基づいて、発話方向を推定するステップと、
推定された前記発話方向に対応して前記可動部を駆動するステップと
を含む音声入力方法。 - コンピュータに、
所定の位置に配置される固定部と、
前記固定部に対して可動する可動部と、
前記固定部に取り付けられたマイクロフォンアレイと
を備える音声入力装置の音声入力処理を実行させるプログラムにおいて、
前記固定部に取り付けられた前記マイクロフォンアレイから入力された、発話者からの音声に基づいて、発話方向を推定するステップと、
推定された前記発話方向に対応して前記可動部を駆動するステップと
を含むプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017197869 | 2017-10-11 | ||
JP2017197869 | 2017-10-11 | ||
PCT/JP2018/035842 WO2019073803A1 (ja) | 2017-10-11 | 2018-09-27 | 音声入力装置および方法、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2019073803A1 true JPWO2019073803A1 (ja) | 2020-11-05 |
Family
ID=66100726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019548109A Ceased JPWO2019073803A1 (ja) | 2017-10-11 | 2018-09-27 | 音声入力装置および方法、並びにプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11310593B2 (ja) |
EP (1) | EP3696811A4 (ja) |
JP (1) | JPWO2019073803A1 (ja) |
CN (1) | CN111194464A (ja) |
WO (1) | WO2019073803A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112075088B (zh) * | 2018-05-18 | 2022-06-28 | 索尼公司 | 信号处理装置、信号处理方法和计算机可读介质 |
CN109068234A (zh) * | 2018-10-29 | 2018-12-21 | 歌尔科技有限公司 | 一种音频设备定向发声方法、装置、音频设备 |
WO2019160396A2 (ko) * | 2019-04-11 | 2019-08-22 | 엘지전자 주식회사 | 안내 로봇 및 안내 로봇의 동작 방법 |
WO2021087377A1 (en) * | 2019-11-01 | 2021-05-06 | Shure Acquisition Holdings, Inc. | Proximity microphone |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6456428A (en) * | 1987-08-27 | 1989-03-03 | Oki Electric Ind Co Ltd | Control system for camera by sound |
JP2009086055A (ja) * | 2007-09-27 | 2009-04-23 | Sony Corp | 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ |
JP2011053828A (ja) * | 2009-08-31 | 2011-03-17 | Toshiba Tec Corp | 画像処理装置及びプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001337694A (ja) | 2000-03-24 | 2001-12-07 | Akira Kurematsu | 音源位置推定方法、音声認識方法および音声強調方法 |
US20070183618A1 (en) | 2004-02-10 | 2007-08-09 | Masamitsu Ishii | Moving object equipped with ultra-directional speaker |
EP1941411B1 (en) * | 2005-09-30 | 2011-09-14 | iRobot Corporation | Companion robot for personal interaction |
JP2007221300A (ja) | 2006-02-15 | 2007-08-30 | Fujitsu Ltd | ロボット及びロボットの制御方法 |
US8155331B2 (en) * | 2006-05-10 | 2012-04-10 | Honda Motor Co., Ltd. | Sound source tracking system, method and robot |
JP5253278B2 (ja) | 2009-04-08 | 2013-07-31 | 株式会社東芝 | 多次元データ識別装置、多次元データ識別方法、及び信号到来方向推定装置 |
US8885882B1 (en) * | 2011-07-14 | 2014-11-11 | The Research Foundation For The State University Of New York | Real time eye tracking for human computer interaction |
WO2013015461A1 (ko) | 2011-07-22 | 2013-01-31 | 엘지전자 주식회사 | 음원 방향 탐지 장치 및 이를 포함하는 감시 카메라 |
US9516412B2 (en) * | 2014-03-28 | 2016-12-06 | Panasonic Intellectual Property Management Co., Ltd. | Directivity control apparatus, directivity control method, storage medium and directivity control system |
EP2933067B1 (en) * | 2014-04-17 | 2019-09-18 | Softbank Robotics Europe | Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method |
US9621984B1 (en) * | 2015-10-14 | 2017-04-11 | Amazon Technologies, Inc. | Methods to process direction data of an audio input device using azimuth values |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
US11151992B2 (en) * | 2017-04-06 | 2021-10-19 | AIBrain Corporation | Context aware interactive robot |
CN107199572B (zh) | 2017-06-16 | 2020-02-14 | 山东大学 | 一种基于智能声源定位与语音控制的机器人系统及方法 |
JP6686977B2 (ja) * | 2017-06-23 | 2020-04-22 | カシオ計算機株式会社 | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム |
US10649060B2 (en) * | 2017-07-24 | 2020-05-12 | Microsoft Technology Licensing, Llc | Sound source localization confidence estimation using machine learning |
KR102174598B1 (ko) * | 2019-01-14 | 2020-11-05 | 한국과학기술원 | 회절 인지를 통한 비가시선 음원 위치 추적 방법 및 시스템 |
-
2018
- 2018-09-27 WO PCT/JP2018/035842 patent/WO2019073803A1/ja unknown
- 2018-09-27 JP JP2019548109A patent/JPWO2019073803A1/ja not_active Ceased
- 2018-09-27 CN CN201880065077.3A patent/CN111194464A/zh not_active Withdrawn
- 2018-09-27 EP EP18866426.2A patent/EP3696811A4/en not_active Withdrawn
- 2018-09-27 US US16/753,236 patent/US11310593B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6456428A (en) * | 1987-08-27 | 1989-03-03 | Oki Electric Ind Co Ltd | Control system for camera by sound |
JP2009086055A (ja) * | 2007-09-27 | 2009-04-23 | Sony Corp | 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ |
JP2011053828A (ja) * | 2009-08-31 | 2011-03-17 | Toshiba Tec Corp | 画像処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN111194464A (zh) | 2020-05-22 |
EP3696811A4 (en) | 2020-11-25 |
EP3696811A1 (en) | 2020-08-19 |
WO2019073803A1 (ja) | 2019-04-18 |
US20200329308A1 (en) | 2020-10-15 |
US11310593B2 (en) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110491403B (zh) | 音频信号的处理方法、装置、介质和音频交互设备 | |
US10522167B1 (en) | Multichannel noise cancellation using deep neural network masking | |
JPWO2019073803A1 (ja) | 音声入力装置および方法、並びにプログラム | |
WO2020103703A1 (zh) | 一种音频数据处理方法、装置、设备及存储介质 | |
JP5587396B2 (ja) | 信号分離のためのシステム、方法、および装置 | |
JP2019008134A (ja) | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム | |
JP7041157B2 (ja) | ビームフォーミングを使用するオーディオキャプチャ | |
JP2012088390A (ja) | 音声認識装置及び音声認識方法 | |
Nesta et al. | A flexible spatial blind source extraction framework for robust speech recognition in noisy environments | |
Tezuka et al. | Ego-motion noise suppression for robots based on semi-blind infinite non-negative matrix factorization | |
Asano et al. | Detection and separation of speech event using audio and video information fusion and its application to robust speech interface | |
JP6888627B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Diaz et al. | Assessing the effect of visual servoing on the performance of linear microphone arrays in moving human-robot interaction scenarios | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
Li et al. | Local relative transfer function for sound source localization | |
US11769486B2 (en) | System and method for data augmentation and speech processing in dynamic acoustic environments | |
US20220262342A1 (en) | System and method for data augmentation and speech processing in dynamic acoustic environments | |
Gomez et al. | Dereverberation robust to speaker's azimuthal orientation in multi-channel human-robot communication | |
Pasha et al. | Clustered multi-channel dereverberation for ad-hoc microphone arrays | |
US11425495B1 (en) | Sound source localization using wave decomposition | |
CN117037836B (zh) | 基于信号协方差矩阵重构的实时声源分离方法和装置 | |
Zaken et al. | Neural-Network-Based Direction-of-Arrival Estimation for Reverberant Speech-the Importance of Energetic, Temporal and Spatial Information | |
Ogawa et al. | Speech enhancement using a square microphone array in the presence of directional and diffuse noise | |
Gomez et al. | Speech-based human-robot interaction robust to acoustic reflections in real environment | |
US11783826B2 (en) | System and method for data augmentation and speech processing in dynamic acoustic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220908 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230110 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20230530 |