JP6731581B2 - 音声認識システム、音声認識装置、音声認識方法、および制御プログラム - Google Patents
音声認識システム、音声認識装置、音声認識方法、および制御プログラム Download PDFInfo
- Publication number
- JP6731581B2 JP6731581B2 JP2017509245A JP2017509245A JP6731581B2 JP 6731581 B2 JP6731581 B2 JP 6731581B2 JP 2017509245 A JP2017509245 A JP 2017509245A JP 2017509245 A JP2017509245 A JP 2017509245A JP 6731581 B2 JP6731581 B2 JP 6731581B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice recognition
- target word
- input
- rejection information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 95
- 230000008569 process Effects 0.000 claims description 61
- 230000006870 function Effects 0.000 description 45
- 238000004891 communication Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 21
- 230000015654 memory Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 239000000470 constituent Substances 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 206010041308 Soliloquy Diseases 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
実施の形態1では、主に、音声認識装置を含む音声認識システム1について説明する。音声認識装置は、ユーザ90が発声した音声(以下、「入力音声」という)に基づいて、棄却情報を定めることができる。棄却情報は、音声認識用の辞書で定められた1以上の認識対象のワードが誤認識されることを防止するための情報である。
図1は、実施の形態1における音声認識システム1の概略図である。
以下、上述の構成を備える音声認識システム1における音声認識機能に関する動作について説明する。
テレビジョン受信機10は、電力の供給を受けると、まず待機状態(スタンバイ状態)になり、音声入力対応処理を開始する。ユーザ90は、テレビジョン受信機10を、リモートコントローラ等で操作することも可能である。しかし、ここでは、ユーザ90が、音声入力によってテレビジョン受信機10を操作(音声操作)する動作例を説明する。
音声認識装置100は、上述した音声入力対応処理とは別に、棄却情報送信処理を実行する。
以上のように、本実施の形態において、音声認識装置は、入力音声を対象ワードと認識する音声認識装置である。音声認識装置は、記憶部と、音声認識部と、棄却情報生成部と、を備える。記憶部は、音声の特定に用いられる棄却情報を記憶する。音声認識部は、当該棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、当該入力音声を対象ワードと認識する。棄却情報生成部は、所定状態において音声認識部が入力音声を対象ワードと認識した場合に、当該入力音声に基づいて棄却情報を定め、その棄却情報を記憶部に記憶する。
以上のように、本出願において開示する技術の例示として、実施の形態1を説明した。しかしながら、本開示における技術は、これに限定されず、変更、置き換え、付加、省略等を行った実施の形態にも適用できる。また、上記実施の形態1で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
10 テレビジョン受信機
40 ネットワーク
50 音声認識サーバ
51 音声認識部
52 記憶部
90 ユーザ
100 音声認識装置
101 音声認識部
102 記憶部
103 棄却情報生成部
104 制御部
105 出力部
130 マイク
140 ディスプレイ
141 メッセージ
150 通信部
160 チューナ
170 記憶部
Claims (14)
- 入力音声を対象ワードと認識する音声認識装置であって、
音声の特定に用いられる棄却情報を記憶する記憶部と、
前記棄却情報により特定される音声と前記入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を前記対象ワードと認識する音声認識部と、
所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶する棄却情報生成部と、
前記所定状態ではない状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合には、あらかじめ定められた制御処理を実行し、前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合には、前記制御処理を実行しない制御部と、を備える、
音声認識装置。 - 前記棄却情報生成部は、前記入力音声に基づいて、前記音声認識部に依らずに認識されるワードを表す音声に係る情報を、前記棄却情報として定める、
請求項1に記載の音声認識装置。 - 前記棄却情報生成部は、前記入力音声に基づく音声認識を外部装置に行わせた結果としてのワードを表す音声に係る情報を、前記外部装置から取得し、当該ワードを表す音声に係る情報を前記棄却情報として定める、
請求項2に記載の音声認識装置。 - 前記棄却情報生成部は、前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合、所定入力を受けたときに前記棄却情報を前記記憶部に記憶する、
請求項1に記載の音声認識装置。 - 前記音声認識装置は、ディスプレイを有するテレビジョン受信機に備えられ、
前記制御処理は、前記ディスプレイへ電力を供給する処理であり、
前記所定状態は、前記ディスプレイへ電力を供給している状態である、
請求項1に記載の音声認識装置。 - 入力音声を対象ワードと認識する音声認識装置であって、
音声の特定に用いられる棄却情報を記憶する記憶部と、
前記棄却情報により特定される音声と前記入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を前記対象ワードと認識する音声認識部と、
所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶する棄却情報生成部と、を備え、
前記対象ワードの入力待ちでない状態または前記対象ワードが認識されるべきでない状態を、前記所定状態とする、
音声認識装置。 - 入力音声を対象ワードと認識する音声認識装置であって、
音声の特定に用いられる棄却情報を記憶する記憶部と、
前記棄却情報により特定される音声と前記入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を前記対象ワードと認識する音声認識部と、
所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶する棄却情報生成部と、を備え、
前記音声認識装置は、ディスプレイを有するテレビジョン受信機に備えられ、
前記対象ワードが前記ディスプレイへ電力を供給する指示を表すワードである場合、前記ディスプレイへ電力が供給されている状態を前記所定状態とする、
音声認識装置。 - 入力音声を対象ワードと認識する第1音声認識装置と、入力音声に対応するワードを認識する第2音声認識装置と、を備え、
前記第1音声認識装置は、
音声の特定に用いられる棄却情報を記憶する記憶部と、
前記棄却情報により特定される音声と前記入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を前記対象ワードと認識する第1音声認識部と、
所定状態において前記第1音声認識部が前記入力音声を前記対象ワードと認識した場合に、前記入力音声を前記第2音声認識装置に送信し、前記入力音声に基づいて前記第2音声認識装置により認識されたワードを表す音声に係る情報を前記第2音声認識装置から受信し、受信した前記情報を前記棄却情報として定め、前記棄却情報を前記記憶部に記憶する棄却情報生成部と、を有し、
前記第2音声認識装置は、前記第1音声認識装置から受信した前記入力音声に基づいて前記入力音声に対応するワードを認識し、当該ワードを前記第1音声認識装置に送信する第2音声認識部、を有する、
音声認識システム。 - 音声の特定に用いられる棄却情報を記憶する記憶部と、前記棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を対象ワードと認識する音声認識部と、を備える音声認識装置で用いられる音声認識方法であって、
前記対象ワードが認識されるべきでない所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したか否かを判定するステップと、
前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したと判定された場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶するステップと、
前記所定状態ではない状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合には、あらかじめ定められた制御処理を実行し、前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合には、前記制御処理を実行しないステップと、を含む、
音声認識方法。 - 音声の特定に用いられる棄却情報を記憶する記憶部と、前記棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を対象ワードと認識する音声認識部と、を備える音声認識装置で用いられる音声認識方法であって、
前記対象ワードが認識されるべきでない所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したか否かを判定するステップと、
前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したと判定された場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶するステップと、を含み、
前記対象ワードの入力待ちでない状態または前記対象ワードが認識されるべきでない状態を、前記所定状態とする、
音声認識方法。 - 音声の特定に用いられる棄却情報を記憶する記憶部と、前記棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を対象ワードと認識する音声認識部と、を備える音声認識装置で用いられる音声認識方法であって、
前記対象ワードが認識されるべきでない所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したか否かを判定するステップと、
前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したと判定された場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶するステップと、を含み、
前記音声認識装置は、ディスプレイを有するテレビジョン受信機に備えられ、
前記対象ワードが前記ディスプレイへ電力を供給する指示を表すワードである場合、前記ディスプレイへ電力が供給されている状態を前記所定状態とする、
音声認識方法。 - 音声の特定に用いられる棄却情報を記憶する記憶部と、前記棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を対象ワードと認識する音声認識部と、を備える音声認識装置のプロセッサに音声認識処理を実行させるための制御プログラムであって、
前記音声認識処理は、
前記対象ワードが認識されるべきでない所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したか否かを判定するステップと、
前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したと判定された場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶するステップと、
前記所定状態ではない状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合には、あらかじめ定められた制御処理を実行し、前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識した場合には、前記制御処理を実行しないステップと、を含む、
制御プログラム。 - 音声の特定に用いられる棄却情報を記憶する記憶部と、前記棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を対象ワードと認識する音声認識部と、を備える音声認識装置のプロセッサに音声認識処理を実行させるための制御プログラムであって、
前記音声認識処理は、
前記対象ワードが認識されるべきでない所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したか否かを判定するステップと、
前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したと判定された場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶するステップと、を含み、
前記対象ワードの入力待ちでない状態または前記対象ワードが認識されるべきでない状態を、前記所定状態とする、
制御プログラム。 - 音声の特定に用いられる棄却情報を記憶する記憶部と、前記棄却情報により特定される音声と入力音声との類似度があらかじめ定められた閾値より低いことを条件の1つとして、前記入力音声を対象ワードと認識する音声認識部と、を備える音声認識装置のプロセッサに音声認識処理を実行させるための制御プログラムであって、
前記音声認識処理は、
前記対象ワードが認識されるべきでない所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したか否かを判定するステップと、
前記所定状態において前記音声認識部が前記入力音声を前記対象ワードと認識したと判定された場合に、前記入力音声に基づいて前記棄却情報を定め、前記棄却情報を前記記憶部に記憶するステップと、を含み、
前記音声認識装置は、ディスプレイを有するテレビジョン受信機に備えられ、
前記対象ワードが前記ディスプレイへ電力を供給する指示を表すワードである場合、前記ディスプレイへ電力が供給されている状態を前記所定状態とする、
制御プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015067513 | 2015-03-27 | ||
JP2015067513 | 2015-03-27 | ||
PCT/JP2016/001496 WO2016157782A1 (ja) | 2015-03-27 | 2016-03-16 | 音声認識システム、音声認識装置、音声認識方法、および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016157782A1 JPWO2016157782A1 (ja) | 2018-01-25 |
JP6731581B2 true JP6731581B2 (ja) | 2020-07-29 |
Family
ID=57004418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017509245A Active JP6731581B2 (ja) | 2015-03-27 | 2016-03-16 | 音声認識システム、音声認識装置、音声認識方法、および制御プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10304449B2 (ja) |
EP (1) | EP3276616A4 (ja) |
JP (1) | JP6731581B2 (ja) |
WO (1) | WO2016157782A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10271093B1 (en) * | 2016-06-27 | 2019-04-23 | Amazon Technologies, Inc. | Systems and methods for routing content to an associated output device |
WO2019176252A1 (ja) * | 2018-03-13 | 2019-09-19 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
CN108665892A (zh) * | 2018-03-21 | 2018-10-16 | 肇庆益晟商贸有限公司 | 一种新能源汽车的语音控制装置 |
US10811007B2 (en) * | 2018-06-08 | 2020-10-20 | International Business Machines Corporation | Filtering audio-based interference from voice commands using natural language processing |
US10832678B2 (en) * | 2018-06-08 | 2020-11-10 | International Business Machines Corporation | Filtering audio-based interference from voice commands using interference information |
KR20200063521A (ko) * | 2018-11-28 | 2020-06-05 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11019402B2 (en) | 2019-09-26 | 2021-05-25 | Dish Network L.L.C. | Method and system for implementing an elastic cloud-based voice search utilized by set-top box (STB) clients |
JP6784859B1 (ja) * | 2020-03-02 | 2020-11-11 | 菱洋エレクトロ株式会社 | 音声認識システム、及び音声認識装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01158498A (ja) | 1987-12-16 | 1989-06-21 | Hitachi Ltd | 音声認識方式 |
JP3477751B2 (ja) | 1993-09-07 | 2003-12-10 | 株式会社デンソー | 連続単語音声認識装置 |
JP3501489B2 (ja) * | 1994-01-28 | 2004-03-02 | キヤノン株式会社 | 音声処理装置及び方法 |
US5577164A (en) | 1994-01-28 | 1996-11-19 | Canon Kabushiki Kaisha | Incorrect voice command recognition prevention and recovery processing method and apparatus |
US5930751A (en) * | 1997-05-30 | 1999-07-27 | Lucent Technologies Inc. | Method of implicit confirmation for automatic speech recognition |
US20020128847A1 (en) * | 2001-03-12 | 2002-09-12 | Anthony Ancona | Voice activated visual representation display system |
US7102485B2 (en) * | 2001-05-08 | 2006-09-05 | Gene Williams | Motion activated communication device |
US6985865B1 (en) * | 2001-09-26 | 2006-01-10 | Sprint Spectrum L.P. | Method and system for enhanced response to voice commands in a voice command platform |
JP4236597B2 (ja) * | 2004-02-16 | 2009-03-11 | シャープ株式会社 | 音声認識装置、音声認識プログラムおよび記録媒体。 |
US7865364B2 (en) * | 2005-05-05 | 2011-01-04 | Nuance Communications, Inc. | Avoiding repeated misunderstandings in spoken dialog system |
TWI270850B (en) * | 2005-06-14 | 2007-01-11 | Universal Scient Ind Co Ltd | Voice-controlled vehicle control method and system with restricted condition for assisting recognition |
JP2008033198A (ja) * | 2006-08-01 | 2008-02-14 | Nec System Technologies Ltd | 音声対話システム、音声対話方法、音声入力装置、プログラム |
JP5824829B2 (ja) * | 2011-03-15 | 2015-12-02 | 富士通株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
CA2869530A1 (en) | 2012-04-27 | 2013-10-31 | Aravind GANAPATHIRAJU | Negative example (anti-word) based performance improvement for speech recognition |
EP3089158B1 (en) * | 2013-12-26 | 2018-08-08 | Panasonic Intellectual Property Management Co., Ltd. | Speech recognition processing |
-
2016
- 2016-03-16 WO PCT/JP2016/001496 patent/WO2016157782A1/ja active Application Filing
- 2016-03-16 US US15/557,862 patent/US10304449B2/en active Active
- 2016-03-16 EP EP16771676.0A patent/EP3276616A4/en not_active Ceased
- 2016-03-16 JP JP2017509245A patent/JP6731581B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
EP3276616A1 (en) | 2018-01-31 |
WO2016157782A1 (ja) | 2016-10-06 |
US10304449B2 (en) | 2019-05-28 |
US20180053506A1 (en) | 2018-02-22 |
EP3276616A4 (en) | 2018-03-21 |
JPWO2016157782A1 (ja) | 2018-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6731581B2 (ja) | 音声認識システム、音声認識装置、音声認識方法、および制御プログラム | |
US9880808B2 (en) | Display apparatus and method of controlling a display apparatus in a voice recognition system | |
US10950230B2 (en) | Information processing device and information processing method | |
EP3062309B1 (en) | Low power detection of an activation phrase | |
CN106663430B (zh) | 使用用户指定关键词的说话者不相依关键词模型的关键词检测 | |
KR101770358B1 (ko) | 내장형 및 네트워크 음성 인식기들의 통합 | |
US11004453B2 (en) | Avoiding wake word self-triggering | |
US11790912B2 (en) | Phoneme recognizer customizable keyword spotting system with keyword adaptation | |
US9916832B2 (en) | Using combined audio and vision-based cues for voice command-and-control | |
CN110494841B (zh) | 语境语言翻译 | |
JP6244560B2 (ja) | 音声認識処理装置、音声認識処理方法、および表示装置 | |
US11076219B2 (en) | Automated control of noise reduction or noise masking | |
US10170122B2 (en) | Speech recognition method, electronic device and speech recognition system | |
CN107622768B (zh) | 音频截剪器 | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
US20210074302A1 (en) | Electronic apparatus and control method thereof | |
US20190147887A1 (en) | Audio processing | |
KR102662571B1 (ko) | 전자 장치, 제어 방법 및 컴퓨터 판독 가능 매체 | |
KR102449181B1 (ko) | 전자장치 및 그 제어방법 | |
KR20210054246A (ko) | 전자장치 및 그 제어방법 | |
JP2020091435A (ja) | 音声認識システム、音声認識システムの通知方法、プログラム、及び移動体搭載機器 | |
TWI574255B (zh) | 語音辨識方法、電子裝置及語音辨識系統 | |
KR20180048510A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR20170055466A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170921 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181115 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20190123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200601 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6731581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |