JP7411422B2 - 音声入力方法、プログラム及び音声入力装置 - Google Patents
音声入力方法、プログラム及び音声入力装置 Download PDFInfo
- Publication number
- JP7411422B2 JP7411422B2 JP2020006980A JP2020006980A JP7411422B2 JP 7411422 B2 JP7411422 B2 JP 7411422B2 JP 2020006980 A JP2020006980 A JP 2020006980A JP 2020006980 A JP2020006980 A JP 2020006980A JP 7411422 B2 JP7411422 B2 JP 7411422B2
- Authority
- JP
- Japan
- Prior art keywords
- input device
- user
- face
- voice input
- close
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 60
- 230000005236 sound signal Effects 0.000 claims description 70
- 238000012937 correction Methods 0.000 claims description 60
- 238000001514 detection method Methods 0.000 claims description 57
- 230000001133 acceleration Effects 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 29
- 230000008859 change Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 18
- 230000000694 effects Effects 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000006866 deterioration Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 9
- 230000009471 action Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
まず、本開示の一態様を得るに至った経緯について、図1を用いて説明する。
以下、図2から図5Bを用いて実施の形態について説明する。
以上、本開示の一つ又は複数の態様に係る音声入力方法及び音声入力装置100について、実施の形態に基づいて説明したが、本開示は、これらの実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を各実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の一つ又は複数の態様の範囲内に含まれてもよい。
20 検知部
30 3軸加速度センサ
31 比較部
32 パターンデータ
40 カメラ
41 顔検出部
42 顔大きさ測定部
50 ADC
60 補正部
61 増幅回路
62 指向性合成部
63 近接効果補正部
100 音声入力装置
200 ユーザ
Claims (11)
- ユーザの顔と、少なくとも1つのマイクを備える音声入力装置とが近接しているか否かを検知する検知ステップと、
前記ユーザの顔と前記音声入力装置とが近接していると検知された場合に、前記少なくとも1つのマイクで収音された音声信号に対して補正処理を行う補正ステップと、を含み、
前記少なくとも1つのマイクは、少なくとも2つのマイクであり、
前記音声信号は、前記少なくとも2つのマイクで収音された単一指向性を有する音声信号であり、
前記補正処理は、単一指向性を無指向性に変換する処理を含む、
音声入力方法。 - 前記補正処理は、ゲインを下げる処理を含む、
請求項1に記載の音声入力方法。 - 前記補正処理は、所定の周波数以下の成分のゲインを下げる処理を含む、
請求項1又は2に記載の音声入力方法。 - 前記音声入力装置は、3軸加速度センサを備え、
前記検知ステップでは、前記3軸加速度センサの出力の時間変化のパターンと、予め計測されたパターンとの比較結果に応じて、前記ユーザの顔と前記音声入力装置とが近接しているか否かを検知する、
請求項1~3のいずれか1項に記載の音声入力方法。 - 前記音声入力装置は、カメラを備え、
前記検知ステップでは、前記カメラでの撮影により取得される画像に含まれる前記ユーザの顔の大きさの変化に応じて、前記ユーザの顔と前記音声入力装置とが近接しているか否かを検知する、
請求項1~4のいずれか1項に記載の音声入力方法。 - 前記検知ステップでは、収音された前記音声信号のゲインの変化に応じて、前記ユーザの顔と前記音声入力装置とが近接しているか否かを検知する、
請求項1~5のいずれか1項に記載の音声入力方法。 - 前記検知ステップでは、第1期間において収音された前記音声信号のゲインの平均値に対する、前記第1期間の後の第2期間において収音された前記音声信号のゲインの平均値の変化に応じて、前記ユーザの顔と前記音声入力装置とが近接しているか否かを検知する、
請求項6に記載の音声入力方法。 - 前記検知ステップでは、収音された前記音声信号の所定の周波数以下の成分のゲインの変化に応じて、前記ユーザの顔と前記音声入力装置とが近接しているか否かを検知する、
請求項1~7のいずれか1項に記載の音声入力方法。 - 前記検知ステップでは、第3期間において収音された前記音声信号の前記所定の周波数以下の成分のゲインの平均値に対する、前記第3期間の後の第4期間において収音された前記音声信号の前記所定の周波数以下の成分のゲインの平均値の変化に応じて、前記ユーザの顔と前記音声入力装置とが近接しているか否かを検知する、
請求項8に記載の音声入力方法。 - 請求項1~9のいずれか1項に記載の音声入力方法をコンピュータに実行させるためのプログラム。
- 少なくとも1つのマイクを備える音声入力装置であって、
ユーザの顔と、前記音声入力装置とが近接しているか否かを検知する検知部と、
前記ユーザの顔と前記音声入力装置とが近接していると検知された場合に、前記少なくとも1つのマイクで収音された音声信号に対して補正処理を行う補正部と、を備え、
前記少なくとも1つのマイクは、少なくとも2つのマイクであり、
前記音声信号は、前記少なくとも2つのマイクで収音された単一指向性を有する音声信号であり、
前記補正処理は、単一指向性を無指向性に変換する処理を含む、
音声入力装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/828,118 US11277692B2 (en) | 2019-03-27 | 2020-03-24 | Speech input method, recording medium, and speech input device |
CN202010211028.5A CN111757217B (zh) | 2019-03-27 | 2020-03-24 | 语音输入方法、记录介质以及语音输入装置 |
EP20166375.4A EP3716269A1 (en) | 2019-03-27 | 2020-03-27 | Speech input method, program, and speech input device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962824608P | 2019-03-27 | 2019-03-27 | |
US62/824,608 | 2019-03-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020162112A JP2020162112A (ja) | 2020-10-01 |
JP7411422B2 true JP7411422B2 (ja) | 2024-01-11 |
Family
ID=72640081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020006980A Active JP7411422B2 (ja) | 2019-03-27 | 2020-01-20 | 音声入力方法、プログラム及び音声入力装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7411422B2 (ja) |
CN (1) | CN111757217B (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002111801A (ja) | 2000-09-28 | 2002-04-12 | Casio Comput Co Ltd | 携帯電話装置 |
JP2009164747A (ja) | 2007-12-28 | 2009-07-23 | Yamaha Corp | マイクロフォン装置、電話機、音声信号処理装置および音声信号処理方法 |
JP2010206451A (ja) | 2009-03-03 | 2010-09-16 | Panasonic Corp | カメラ付きスピーカ、信号処理装置、およびavシステム |
WO2018217194A1 (en) | 2017-05-24 | 2018-11-29 | Rovi Guides, Inc. | Methods and systems for correcting, based on speech, input generated using automatic speech recognition |
JP7240989B2 (ja) | 2019-08-19 | 2023-03-16 | 日本化薬株式会社 | 硬化性樹脂組成物およびその硬化物 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3141674B2 (ja) * | 1994-02-25 | 2001-03-05 | ソニー株式会社 | 騒音低減ヘッドホン装置 |
JP2002218583A (ja) * | 2001-01-17 | 2002-08-02 | Sony Corp | 音場合成演算方法及び装置 |
KR100580758B1 (ko) * | 2004-12-23 | 2006-05-15 | 주식회사 팬택앤큐리텔 | 이동통신단말기의 마이크로폰 제어장치 |
JP4746498B2 (ja) * | 2006-08-31 | 2011-08-10 | 日本放送協会 | 単一指向性マイクロホン |
JP5087514B2 (ja) * | 2008-09-29 | 2012-12-05 | 京セラ株式会社 | 携帯通信端末 |
US9274744B2 (en) * | 2010-09-10 | 2016-03-01 | Amazon Technologies, Inc. | Relative position-inclusive device interfaces |
JP2012104871A (ja) * | 2010-11-05 | 2012-05-31 | Sony Corp | 音響制御装置及び音響制御方法 |
CN104519212B (zh) * | 2013-09-27 | 2017-06-20 | 华为技术有限公司 | 一种消除回声的方法及装置 |
WO2016093834A1 (en) * | 2014-12-11 | 2016-06-16 | Nuance Communications, Inc. | Speech enhancement using a portable electronic device |
US10396741B2 (en) * | 2015-05-14 | 2019-08-27 | Voyetra Turtle Beach, Inc. | Headset with programmable microphone modes |
JP2017034519A (ja) * | 2015-08-03 | 2017-02-09 | 独立行政法人国立高等専門学校機構 | 音声処理装置、音声処理システム及び音声処理方法 |
CN107577449B (zh) * | 2017-09-04 | 2023-06-23 | 百度在线网络技术(北京)有限公司 | 唤醒语音的拾取方法、装置、设备及存储介质 |
-
2020
- 2020-01-20 JP JP2020006980A patent/JP7411422B2/ja active Active
- 2020-03-24 CN CN202010211028.5A patent/CN111757217B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002111801A (ja) | 2000-09-28 | 2002-04-12 | Casio Comput Co Ltd | 携帯電話装置 |
JP2009164747A (ja) | 2007-12-28 | 2009-07-23 | Yamaha Corp | マイクロフォン装置、電話機、音声信号処理装置および音声信号処理方法 |
JP2010206451A (ja) | 2009-03-03 | 2010-09-16 | Panasonic Corp | カメラ付きスピーカ、信号処理装置、およびavシステム |
WO2018217194A1 (en) | 2017-05-24 | 2018-11-29 | Rovi Guides, Inc. | Methods and systems for correcting, based on speech, input generated using automatic speech recognition |
JP2020522733A (ja) | 2017-05-24 | 2020-07-30 | ロヴィ ガイズ, インコーポレイテッド | 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム |
JP7240989B2 (ja) | 2019-08-19 | 2023-03-16 | 日本化薬株式会社 | 硬化性樹脂組成物およびその硬化物 |
Also Published As
Publication number | Publication date |
---|---|
CN111757217B (zh) | 2024-06-21 |
JP2020162112A (ja) | 2020-10-01 |
CN111757217A (zh) | 2020-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9913022B2 (en) | System and method of improving voice quality in a wireless headset with untethered earbuds of a mobile device | |
KR102512311B1 (ko) | 이어버드 스피치 추정 | |
US9438985B2 (en) | System and method of detecting a user's voice activity using an accelerometer | |
US9313572B2 (en) | System and method of detecting a user's voice activity using an accelerometer | |
US20080175408A1 (en) | Proximity filter | |
US10469944B2 (en) | Noise reduction in multi-microphone systems | |
US20100098266A1 (en) | Multi-channel audio device | |
WO2020120944A1 (en) | Methods and systems for speech detection | |
KR20210017229A (ko) | 오디오 줌 기능을 갖는 전자 장치 및 이의 동작 방법 | |
JP2009005071A (ja) | 音声入出力装置及び通話装置 | |
US10638217B2 (en) | Pressure-responsive sensors and related systems and methods | |
JP6374936B2 (ja) | 音声認識方法、音声認識装置及びプログラム | |
CN111627456B (zh) | 噪音排除方法、装置、设备及可读存储介质 | |
JP2009239631A (ja) | マイクロフォンユニット、接話型の音声入力装置、情報処理システム、及びマイクロフォンユニットの製造方法 | |
JP2009130619A (ja) | マイクロフォンシステム、音声入力装置及びこれらの製造方法 | |
JP7411422B2 (ja) | 音声入力方法、プログラム及び音声入力装置 | |
US9998610B2 (en) | Control apparatus, control method, and computer-readable medium | |
US11277692B2 (en) | Speech input method, recording medium, and speech input device | |
CN113923294B (zh) | 音频变焦的方法、装置、折叠屏设备及存储介质 | |
WO2019034154A1 (zh) | 移动终端的降噪方法、装置和计算机存储介质 | |
JP2010056762A (ja) | マイクロホンアレー | |
US10360922B2 (en) | Noise reduction device and method for reducing noise | |
US11363374B2 (en) | Signal processing apparatus, method of controlling signal processing apparatus, and non-transitory computer-readable storage medium | |
JP2016046769A (ja) | 集音装置 | |
US11955133B2 (en) | Audio signal processing method and system for noise mitigation of a voice signal measured by an audio sensor in an ear canal of a user |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221027 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7411422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |