JP7055722B2 - 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム - Google Patents
音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム Download PDFInfo
- Publication number
- JP7055722B2 JP7055722B2 JP2018158309A JP2018158309A JP7055722B2 JP 7055722 B2 JP7055722 B2 JP 7055722B2 JP 2018158309 A JP2018158309 A JP 2018158309A JP 2018158309 A JP2018158309 A JP 2018158309A JP 7055722 B2 JP7055722 B2 JP 7055722B2
- Authority
- JP
- Japan
- Prior art keywords
- electronic device
- voice
- voice command
- state
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 108
- 230000006870 function Effects 0.000 title description 22
- 230000008569 process Effects 0.000 claims description 95
- 238000001514 detection method Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 15
- 238000004891 communication Methods 0.000 description 22
- 230000014509 gene expression Effects 0.000 description 9
- 230000001133 acceleration Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical compound C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- SAZUGELZHZOXHB-UHFFFAOYSA-N acecarbromal Chemical compound CCC(Br)(CC)C(=O)NC(=O)NC(C)=O SAZUGELZHZOXHB-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
Description
11 マイク
12 スピーカ
13 タッチパネル
13a ディスプレイ
13b タッチセンサ
14 通信インタフェース
15 状態センサ
16 測位センサ
17 ストレージ
17a プログラム
17b データ
18 プロセッサ
Claims (13)
- 音声を入力するマイクと、前記マイクに入力された前記音声を認識するプロセッサとを備えた電子機器であって、
前記プロセッサは、
通話処理を実行中でないことを条件に、前記マイクに入力された前記音声に基づき音声コマンドを認識したときに、前記電子機器が所定状態であるか否かを判定し、
前記電子機器が前記所定状態であると判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させずに前記ディスプレイに画像を表示させる処理を含む第1処理を実行し、
前記電子機器が前記所定状態でないと判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させる処理を含む第2処理を実行し、
通話処理を実行中であっても物体の近接が検知されない場合に前記音声コマンドを認識すると、前記第1処理を実行する
電子機器。 - 請求項1に記載の電子機器であって、
前記音声コマンドは第1音声コマンドを含み、
前記プロセッサは、前記認識した音声コマンドが前記第1音声コマンドである場合、前記電子機器の状態にかかわらず、前記第2処理を実行する
電子機器。 - 請求項2に記載の電子機器であって、
前記音声コマンドはさらに第2音声コマンドを含み、
前記プロセッサは、前記電子機器が前記所定状態でないと判定した場合でも、前記認識した音声が前記第2音声コマンドである場合は、前記第1処理を実行する
電子機器。 - 請求項3に記載の電子機器であって、
前記プロセッサは、前記電子機器が前記所定状態でないと判定し、かつ前記音声が前記第2音声コマンドでない場合に、前記第2処理を実行する
電子機器。 - 請求項4に記載の電子機器であって、
前記第1処理は、前記ディスプレイに画像を表示させかつ前記スピーカに音声を出力させない処理を含む
電子機器。 - 請求項1から5のいずれか一項に記載の電子機器であって、
前記所定状態は、前記電子機器がマナーモードである状態を含む
電子機器。 - 請求項2から6のいずれか一項に記載の電子機器であって、
前記第1音声コマンドは、前記電子機器の位置を問う音声を含む
電子機器。 - 請求項3又は4に記載の電子機器であって、
前記第2音声コマンドは、前記電子機器に文字列の出力を要求しない
電子機器。 - 請求項6に記載の電子機器であって、
前記電子機器の動きを検出する状態センサをさらに備え、
前記プロセッサは、
前記状態センサの検出結果に基づいて前記電子機器を携帯しているユーザの移動状態を判定し、
前記電子機器がマナーモードであると判定しても、ユーザの移動状態が所定の条件を満たすと判定した場合、前記音声コマンドを認識したときに、前記音声コマンドに応じた前記第2処理を実行する
電子機器。 - 請求項6に記載の電子機器であって、
前記電子機器の位置情報を取得する測位センサをさらに備え、
前記プロセッサは、
前記電子機器がマナーモードであると判定しても、前記測位センサの取得結果に基づき、前記電子機器の位置が所定の条件を満たすと判定した場合、前記音声コマンドを認識したときに、前記音声コマンドに応じた前記第2処理を実行する
電子機器。 - 請求項1から10のいずれか一項に記載の電子機器であって、
前記所定状態は、音声出力先の設定に関する前記電子機器の状態を含まない
電子機器。 - 音声を入力するマイクを備える電子機器の制御方法であって、
通話処理を実行中でないことを条件に、前記マイクに入力された前記音声に基づき音声コマンドを認識したときに、前記電子機器が所定状態であるか否かを判定し、
前記電子機器が前記所定状態であると判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させずに前記ディスプレイに画像を表示させる処理を含む第1処理を実行し、
前記電子機器が前記所定状態でないと判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させる処理を含む第2処理を実行し、
通話処理を実行中であっても物体の近接が検知されない場合に前記音声コマンドを認識すると、前記第1処理を実行する
制御方法。 - 音声を入力するマイクを備える電子機器で用いられるプログラムであって、
通話処理を実行中でないことを条件に、前記マイクに入力された前記音声に基づき音声コマンドが認識されたときに、前記電子機器が所定状態であるか否かを判定させ、
前記電子機器が前記所定状態であると判定された場合、前記音声コマンドに応じて前記スピーカに音声を出力させずに前記ディスプレイに画像を表示させる処理を含む第1処理を実行させ、
前記電子機器が前記所定状態でないと判定された場合、前記音声コマンドに応じて前記スピーカに音声を出力させる処理を含む第2処理を実行させ、
通話処理を実行中であっても物体の近接が検知されない場合に前記音声コマンドを認識すると、前記第1処理を実行させる
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158309A JP7055722B2 (ja) | 2018-08-27 | 2018-08-27 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
US16/551,342 US11227595B2 (en) | 2018-08-27 | 2019-08-26 | Electronic device with speech recognition function, control method of electronic device with speech recognition function, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158309A JP7055722B2 (ja) | 2018-08-27 | 2018-08-27 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020034988A JP2020034988A (ja) | 2020-03-05 |
JP7055722B2 true JP7055722B2 (ja) | 2022-04-18 |
Family
ID=69583592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018158309A Active JP7055722B2 (ja) | 2018-08-27 | 2018-08-27 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11227595B2 (ja) |
JP (1) | JP7055722B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019163503A1 (ja) * | 2018-02-22 | 2019-08-29 | 京セラ株式会社 | 電子機器、制御方法およびプログラム |
CN115171678A (zh) * | 2022-06-01 | 2022-10-11 | 合众新能源汽车有限公司 | 语音识别方法、装置、电子设备、存储介质及产品 |
CN117707404A (zh) * | 2023-05-31 | 2024-03-15 | 荣耀终端有限公司 | 场景处理方法、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003244314A (ja) | 2002-02-19 | 2003-08-29 | Ricoh Co Ltd | 携帯移動電話装置 |
WO2011083571A1 (ja) | 2010-01-06 | 2011-07-14 | 株式会社東芝 | 情報検索装置、情報検索方法、および情報検索プログラム |
US20160011768A1 (en) | 2014-07-09 | 2016-01-14 | Lg Electronics Inc. | Mobile terminal and method of controlling the same |
WO2016157658A1 (ja) | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
US20170161319A1 (en) | 2015-12-08 | 2017-06-08 | Rovi Guides, Inc. | Systems and methods for generating smart responses for natural language queries |
WO2017095560A1 (en) | 2015-12-01 | 2017-06-08 | Qualcomm Incorporated | Electronic device generating notification based on context data in response to speech phrase from user |
JP2018093461A (ja) | 2016-11-25 | 2018-06-14 | 京セラ株式会社 | 電子機器、制御装置、制御プログラム及び電子機器の動作方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006221270A (ja) | 2005-02-08 | 2006-08-24 | Nec Saitama Ltd | 音声認識機能を備えた携帯端末装置のマルチタスクシステム及び方法 |
GB2533400A (en) * | 2014-12-19 | 2016-06-22 | Ibm | Mobile phone call handling |
KR20170086814A (ko) * | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
KR102434104B1 (ko) * | 2016-05-03 | 2022-08-19 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
JP2018037819A (ja) * | 2016-08-31 | 2018-03-08 | 京セラ株式会社 | 電子機器、制御方法及びプログラム |
-
2018
- 2018-08-27 JP JP2018158309A patent/JP7055722B2/ja active Active
-
2019
- 2019-08-26 US US16/551,342 patent/US11227595B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003244314A (ja) | 2002-02-19 | 2003-08-29 | Ricoh Co Ltd | 携帯移動電話装置 |
WO2011083571A1 (ja) | 2010-01-06 | 2011-07-14 | 株式会社東芝 | 情報検索装置、情報検索方法、および情報検索プログラム |
US20160011768A1 (en) | 2014-07-09 | 2016-01-14 | Lg Electronics Inc. | Mobile terminal and method of controlling the same |
WO2016157658A1 (ja) | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
WO2017095560A1 (en) | 2015-12-01 | 2017-06-08 | Qualcomm Incorporated | Electronic device generating notification based on context data in response to speech phrase from user |
US20170161319A1 (en) | 2015-12-08 | 2017-06-08 | Rovi Guides, Inc. | Systems and methods for generating smart responses for natural language queries |
JP2018093461A (ja) | 2016-11-25 | 2018-06-14 | 京セラ株式会社 | 電子機器、制御装置、制御プログラム及び電子機器の動作方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200066272A1 (en) | 2020-02-27 |
US11227595B2 (en) | 2022-01-18 |
JP2020034988A (ja) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7055721B2 (ja) | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム | |
JP6393021B2 (ja) | 電子機器、制御方法、及び制御プログラム | |
US10379809B2 (en) | Method for providing a voice-speech service and mobile terminal implementing the same | |
US9596340B2 (en) | Mobile electronic device, control method, and computer program product | |
JP2018074366A (ja) | 電子機器、制御方法およびプログラム | |
KR101718026B1 (ko) | 사용자 인터페이스 제공 방법 및 이를 이용하는 이동 단말기 | |
JP7055722B2 (ja) | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム | |
AU2013204564A1 (en) | Method and apparatus for processing multiple inputs | |
US8620392B2 (en) | Electronic device capable of continuing a telephone call when charging | |
CN111147660B (zh) | 一种控件的操作方法及电子设备 | |
KR101954774B1 (ko) | 문자 데이터를 이용한 음성 통화를 제공하기 위한 전자 장치 및 방법 | |
US10241601B2 (en) | Mobile electronic device, control method, and non-transitory storage medium that stores control program | |
JP4056518B2 (ja) | 携帯情報端末、その表示制御方法およびプログラム | |
KR20130111749A (ko) | 더미 장치와의 연동 방법 및 그 전자 장치 | |
US11086595B2 (en) | Electronic device having character input function, and method of control thereof | |
JP6016134B2 (ja) | 音声入力装置、音声入力方法及びプログラム | |
US20130222268A1 (en) | Method and Apparatus Pertaining to Processing Incoming Calls | |
WO2015114898A1 (ja) | 携帯電子機器、表示制御方法及び記憶媒体 | |
US20160150355A1 (en) | Method of controlling operation mode and electronic device therefor | |
CN110944056A (zh) | 交互方法、移动终端及可读存储介质 | |
JP6235175B1 (ja) | 電子機器、プログラムおよび制御方法 | |
JP2014103536A (ja) | 携帯端末装置 | |
JP2013156768A (ja) | 入力インターフェース装置、電子機器、携帯端末機器、プログラムおよび記録媒体 | |
JP2018110370A (ja) | 電子機器、プログラムおよび制御方法 | |
US20240078079A1 (en) | Devices, Methods, and User Interfaces for Controlling Operation of Wireless Electronic Accessories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190204 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201012 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220406 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7055722 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |