JP6814871B2 - 電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体 - Google Patents
電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体 Download PDFInfo
- Publication number
- JP6814871B2 JP6814871B2 JP2019236057A JP2019236057A JP6814871B2 JP 6814871 B2 JP6814871 B2 JP 6814871B2 JP 2019236057 A JP2019236057 A JP 2019236057A JP 2019236057 A JP2019236057 A JP 2019236057A JP 6814871 B2 JP6814871 B2 JP 6814871B2
- Authority
- JP
- Japan
- Prior art keywords
- type
- user
- user instruction
- electronic device
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 43
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 12
- 230000000977 initiatory effect Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000001902 propagating effect Effects 0.000 description 3
- 235000018958 Gardenia augusta Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000033748 Device issues Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Description
ステップ101では、ユーザの第1の音声命令を受信し、第1の音声命令に従って音楽モードに入る。
第1の例では、電子デバイスの現在再生中の音声情報を取得し、現在再生中の音声情報に基づいてユーザの音声情報を現在の音声情報から分離し、ユーザの音声情報を認識して第1のタイプのユーザ命令を取得する。
ステップ201では、ユーザの第1の音声命令を受信し、第1の音声命令に従って音楽モードに入る。
第1の例では、第1のタイプのユーザ命令が音楽モードに関する命令である場合、第1のフォント色で第1のタイプのユーザ命令を表示し、第1のタイプのユーザ命令が音楽モードに関する命令でない場合、第2のフォント色で第1のタイプのユーザ命令を表示し、第1のフォント色は第2のフォント色より濃い。図3に示されるように、音楽モードに関する第1のタイプのユーザ命令である場合、フォントは、青色になり、音楽モードに関する第1のタイプのユーザ命令でない場合、フォントは、グレーになる。
図4に示されるように、電子デバイスの音声制御装置は、受信モジュール401と、開始モジュール402と、取得モジュール403と、認識モジュール404と、処理モジュール405と、終了モジュール406とを備えている。
Claims (14)
- 電子デバイスの音声制御方法であって、
ユーザの第1の音声命令を受信し、該第1の音声命令に従って音楽モードに入るステップと、
前記音楽モードに入った後の所定の期間内に、前記電子デバイスの全二重リスニング状態を開始するステップであって、前記全二重リスニング状態では、前記電子デバイスが第1のタイプのユーザ命令を認識し、前記第1のタイプのユーザ命令にはウェイクアップワードを有しないステップと、
前記全二重リスニング状態で、前記第1のタイプのユーザ命令を取得し、前記第1のタイプのユーザ命令を認識するステップと、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令である場合、前記第1のタイプのユーザ命令を実行するステップと、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令でない場合、前記第1のタイプのユーザ命令を実行しないステップと、
前記所定の期間後に、前記全二重リスニング状態を終了するステップとを含む電子デバイスの音声制御方法。 - 前記全二重リスニング状態を終了するステップの後に、
ウェイクアップワードを有する第2のタイプのユーザ命令を取得し、前記第2のタイプのユーザ命令を認識するステップと、
前記第2のタイプのユーザ命令を実行するステップとをさらに含む請求項1に記載の電子デバイスの音声制御方法。 - 前記第1のタイプのユーザ命令を認識するステップの後に、
前記電子デバイスのディスプレイスクリーンに前記第1のタイプのユーザ命令を表示するステップをさらに含む請求項1に記載の電子デバイスの音声制御方法。 - 前記電子デバイスの前記ディスプレイスクリーンに前記第1のタイプのユーザ命令を表示するステップは、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令である場合、第1のフォント色で前記第1のタイプのユーザ命令を表示するステップと、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令でない場合、第2のフォント色で前記第1のタイプのユーザ命令を表示するステップとを含み、
前記第1のフォント色が前記第2のフォント色より濃い請求項3に記載の電子デバイスの音声制御方法。 - 前記全二重リスニング状態で、前記第1のタイプのユーザ命令を取得するステップは、
ユーザの音声情報と現在再生中の音声情報とを含む現在の音声情報を収集するステップと、
前記電子デバイスの前記現在再生中の音声情報を取得するステップと、
前記現在再生中の音声情報に基づいて前記ユーザの音声情報を前記現在の音声情報から分離するステップと、
前記ユーザの音声情報を認識して前記第1のタイプのユーザ命令を取得するステップとを含む請求項1に記載の電子デバイスの音声制御方法。 - 前記所定の期間が20秒〜40秒である請求項1に記載の電子デバイスの音声制御方法。
- 電子デバイスの音声制御装置であって、
ユーザの第1の音声命令を受信し、該第1の音声命令に従って音楽モードに入る受信モジュールと、
前記音楽モードに入った後の所定の期間内に、前記電子デバイスの全二重リスニング状態を開始する開始モジュールであって、前記全二重リスニング状態では、前記電子デバイスが第1のタイプのユーザ命令を認識し、前記第1のタイプのユーザ命令にはウェイクアップワードを有しない開始モジュールと、
前記全二重リスニング状態で、前記第1のタイプのユーザ命令を取得する取得モジュールと、
前記第1のタイプのユーザ命令を認識する認識モジュールと、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令である場合、前記第1のタイプのユーザ命令を実行し、前記第1のタイプのユーザ命令が前記音楽モードに関する命令でない場合、前記第1のタイプのユーザ命令を実行しない処理モジュールと、
前記所定の期間後に、前記全二重リスニング状態を終了する終了モジュールとを備える電子デバイスの音声制御装置。 - ウェイクアップワードを有する第2のタイプのユーザ命令を取得し、前記第2のタイプのユーザ命令を認識する取得認識モジュールと、
前記第2のタイプのユーザ命令を実行する実行モジュールとをさらに備える請求項7に記載の電子デバイスの音声制御装置。 - 前記電子デバイスのディスプレイスクリーンに前記第1のタイプのユーザ命令を表示する表示モジュールをさらに備える請求項7に記載の電子デバイスの音声制御装置。
- 前記表示モジュールは、具体的には、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令である場合、第1のフォント色で前記第1のタイプのユーザ命令を表示し、
前記第1のタイプのユーザ命令が前記音楽モードに関する命令でない場合、第2のフォント色で前記第1のタイプのユーザ命令を表示し、
前記第1のフォント色が前記第2のフォント色より濃い請求項9に記載の電子デバイスの音声制御装置。 - 前記取得モジュールは、具体的には、
ユーザの音声情報と現在再生中の音声情報とを含む現在の音声情報を収集し、
前記電子デバイスの前記現在再生中の音声情報を取得し、
前記現在再生中の音声情報に基づいて前記ユーザの音声情報を前記現在の音声情報から分離し、
前記ユーザの音声情報を認識して前記第1のタイプのユーザ命令を取得する請求項7に記載の電子デバイスの音声制御装置。 - 前記所定の期間が20秒〜40秒である請求項7に記載の電子デバイスの音声制御装置。
- プロセッサとメモリとを備えるコンピュータ機器であって、
前記プロセッサが前記メモリに記憶されている実行可能なプログラムコードを読み出して前記実行可能なプログラムコードに対応するプログラムを実行することにより、請求項1から請求項6のいずれかに記載の電子デバイスの音声制御方法を実現するコンピュータ機器。 - コンピュータプログラムが記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータプログラムがプロセッサにより実行される場合に、請求項1から請求項6のいずれかに記載の電子デバイスの音声制御方法が実現される非一時的なコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910468915.8A CN112017650A (zh) | 2019-05-31 | 2019-05-31 | 电子设备的语音控制方法、装置、计算机设备和存储介质 |
CN201910468915.8 | 2019-05-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020197695A JP2020197695A (ja) | 2020-12-10 |
JP6814871B2 true JP6814871B2 (ja) | 2021-01-20 |
Family
ID=69055851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019236057A Active JP6814871B2 (ja) | 2019-05-31 | 2019-12-26 | 電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200380994A1 (ja) |
EP (1) | EP3745253B1 (ja) |
JP (1) | JP6814871B2 (ja) |
KR (1) | KR102331660B1 (ja) |
CN (1) | CN112017650A (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112732340B (zh) * | 2019-10-14 | 2022-03-15 | 思必驰科技股份有限公司 | 人机对话处理方法及装置 |
US11735181B2 (en) * | 2020-02-05 | 2023-08-22 | Canon Kabushiki Kaisha | Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction |
CN112700775A (zh) * | 2020-12-29 | 2021-04-23 | 维沃移动通信有限公司 | 语音接收周期的更新方法、装置和电子设备 |
CN113066493B (zh) * | 2021-03-30 | 2023-01-06 | 联想(北京)有限公司 | 一种设备控制方法、系统及第一电子设备 |
CN114038468B (zh) * | 2022-01-07 | 2022-04-15 | 深圳市声扬科技有限公司 | 语音数据比对处理方法、装置、电子设备和存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6744452B1 (en) * | 2000-05-04 | 2004-06-01 | International Business Machines Corporation | Indicator to show that a cached web page is being displayed |
JP4285371B2 (ja) * | 2003-11-14 | 2009-06-24 | 株式会社デンソー | 音場制御システム |
CN103593348B (zh) * | 2012-08-14 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 浏览器标签的显示方法及装置 |
CN102915732A (zh) * | 2012-10-31 | 2013-02-06 | 黑龙江省电力有限公司信息通信分公司 | 抑制背景广播的语音指令识别方法与装置 |
CN103870155B (zh) * | 2014-02-21 | 2017-08-25 | 联想(北京)有限公司 | 信息处理的方法及电子设备 |
CN105810211B (zh) * | 2015-07-13 | 2019-11-29 | 维沃移动通信有限公司 | 一种音频数据的处理方法及终端 |
US20170125016A1 (en) * | 2015-11-02 | 2017-05-04 | Le Holdings (Beijing) Co., Ltd. | Method and electronic device for processing voice messages |
CN106855797A (zh) * | 2015-12-09 | 2017-06-16 | 阿里巴巴集团控股有限公司 | 一种界面元素颜色的设置方法及装置 |
US10743101B2 (en) * | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
KR101889279B1 (ko) * | 2017-01-16 | 2018-08-21 | 주식회사 케이티 | 음성 명령에 기반하여 서비스를 제공하는 시스템 및 방법 |
KR20180084392A (ko) * | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
CN107122160A (zh) * | 2017-04-26 | 2017-09-01 | 海信集团有限公司 | 用于语音输入控制指令的显示方法、装置和终端 |
KR102098633B1 (ko) * | 2017-08-22 | 2020-04-08 | 네이버 주식회사 | 인공지능 기기에서의 연속 대화 기능 |
-
2019
- 2019-05-31 CN CN201910468915.8A patent/CN112017650A/zh active Pending
- 2019-12-26 JP JP2019236057A patent/JP6814871B2/ja active Active
- 2019-12-27 US US16/728,249 patent/US20200380994A1/en not_active Abandoned
- 2019-12-27 KR KR1020190176009A patent/KR102331660B1/ko active IP Right Grant
- 2019-12-30 EP EP19220036.8A patent/EP3745253B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3745253A1 (en) | 2020-12-02 |
KR102331660B1 (ko) | 2021-11-26 |
KR20200138644A (ko) | 2020-12-10 |
CN112017650A (zh) | 2020-12-01 |
US20200380994A1 (en) | 2020-12-03 |
EP3745253B1 (en) | 2023-10-04 |
JP2020197695A (ja) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6814871B2 (ja) | 電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体 | |
CN108520743B (zh) | 智能设备的语音控制方法、智能设备及计算机可读介质 | |
CN108133707B (zh) | 一种内容分享方法及系统 | |
US11502859B2 (en) | Method and apparatus for waking up via speech | |
JP6848147B2 (ja) | 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム | |
CN107340991A (zh) | 语音角色的切换方法、装置、设备以及存储介质 | |
JP2019185011A (ja) | アプリケーションプログラムをウェイクアップする処理方法、装置及び記憶媒体 | |
CN107256707B (zh) | 一种语音识别方法、系统及终端设备 | |
JP7158217B2 (ja) | 音声認識方法、装置及びサーバ | |
CN103197571A (zh) | 一种控制方法及装置、系统 | |
EP3647914B1 (en) | Electronic apparatus and controlling method thereof | |
JP2019015951A (ja) | 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体 | |
JP7308335B2 (ja) | 車載音声機器のテスト方法、装置、電子機器及び記憶媒体 | |
JP7152384B2 (ja) | 電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体 | |
WO2022228377A1 (zh) | 录音方法、装置、电子设备和可读存储介质 | |
US20230054740A1 (en) | Audio generation method, related apparatus, and storage medium | |
KR102380717B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법 | |
CN113157240A (zh) | 语音处理方法、装置、设备、存储介质及计算机程序产品 | |
CN113611316A (zh) | 人机交互方法、装置、设备以及存储介质 | |
CN113066491A (zh) | 显示设备及语音交互方法 | |
CN109616117A (zh) | 一种基于语音识别技术的手机游戏控制系统及方法 | |
CN115136233B (zh) | 一种基于自建模板的多模态快速转写及标注系统 | |
CN213024346U (zh) | 一种智能交互设备 | |
CN117373437A (zh) | 一种配置表情的方法、装置、车辆和存储介质 | |
CN112037779A (zh) | 智能家电及语音交互方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6814871 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |