JP2022045262A - 音声処理システム、音声処理方法、及び音声処理プログラム - Google Patents
音声処理システム、音声処理方法、及び音声処理プログラム Download PDFInfo
- Publication number
- JP2022045262A JP2022045262A JP2020150854A JP2020150854A JP2022045262A JP 2022045262 A JP2022045262 A JP 2022045262A JP 2020150854 A JP2020150854 A JP 2020150854A JP 2020150854 A JP2020150854 A JP 2020150854A JP 2022045262 A JP2022045262 A JP 2022045262A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- command
- unit
- support information
- target application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 239000000463 material Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
Description
図1は、本発明の実施形態に係る音声処理システムの概略構成を示す図である。音声処理システム100は、音声処理装置1と、クラウドサーバ2と、表示装置3とを含んでいる。音声処理装置1は、スピーカ13及びマイク14を備えたマイクスピーカ装置であり、例えばAIスピーカ、スマートスピーカなどである。音声処理装置1と、クラウドサーバ2と、表示装置3とは、ネットワークN1を介して互いに接続されている。ネットワークN1は、インターネット、LAN、WAN、又は公衆電話回線などの通信網である。クラウドサーバ2は、例えば1台又は複数台のデータサーバ(仮想サーバ)で構築される。なお、クラウドサーバ2は、1台の物理サーバに置き換えられてもよい。音声処理システム100は、ユーザの音声に基づいて所定のコマンドを実行することが可能である。
図1に示すように、音声処理装置1は、制御部11、記憶部12、スピーカ13、マイク14、及び通信インターフェース15などを備える。音声処理装置1は、例えば卓上に配置され、ユーザの音声をマイク14を介して取得したり、当該ユーザに対してスピーカ13から音声を出力したりする。
図1に示すように、クラウドサーバ2は、制御部21、記憶部22、通信インターフェース23などを備える。
図2に示すように、表示装置3は、制御部31、記憶部32、操作部33、表示部34、通信インターフェース35などを備える。
以下、図6を参照しつつ、音声処理装置1の制御部11、クラウドサーバ2の制御部21、及び表示装置3の制御部31によって実行される音声処理の手順の一例について説明する。
2 :クラウドサーバ
3 :表示装置
100 :音声処理システム
111 :音声受信部
112 :音声判定部
113 :音声送信部
211 :音声受信部
212 :コマンド特定部
213 :コマンド処理部
311 :操作受付部
312 :表示処理部
313 :コマンド取得部
314 :コマンド実行部
315 :支援情報提示部
AP1 :操作対象アプリケーション
AP2 :操作対象アプリケーション
AP3 :操作対象アプリケーション
B1 :操作ボタン
H1 :操作支援情報
H2 :操作支援情報
H3 :操作支援情報
Claims (11)
- ユーザの音声に基づいて所定のコマンドを実行する音声処理システムであって、
前記ユーザの操作対象である操作対象アプリケーションの操作画面を表示させる表示処理部と、
前記操作対象アプリケーションに対する操作支援情報を前記操作画面に対応付けて提示する支援情報提示部と、
前記ユーザの音声を受信する音声受信部と、
前記音声受信部より受信される前記音声に基づいて前記操作対象アプリケーションに対する第1コマンドを特定するコマンド特定部と、
前記操作対象アプリケーションに対して前記コマンド特定部により特定される前記第1コマンドを実行するコマンド実行部と、
を備える音声処理システム。 - 前記支援情報提示部は、前記操作対象アプリケーションに対する一又は複数のコマンドに対応する前記操作支援情報を前記操作画面に対応付けて提示し、
前記コマンド特定部は、前記一又は複数のコマンドのうち、前記音声受信部より受信される前記音声に基づいて前記第1コマンドを特定し、
前記コマンド実行部は、前記コマンド特定部により特定される前記第1コマンドを実行する、
請求項1に記載の音声処理システム。 - 前記支援情報提示部は、前記一又は複数のコマンドのそれぞれに対応する一又は複数の特定ワードのテキスト情報を、前記操作画面に対応付けて提示する、
請求項2に記載の音声処理システム。 - 前記支援情報提示部は、前記一又は複数のコマンドのうち前記コマンド実行部が現時点で実行可能なコマンドに対応する前記テキスト情報を識別可能に前記操作画面に対応付けて提示する、
請求項3に記載の音声処理システム。 - 前記支援情報提示部は、前記一又は複数のコマンドのうち前記コマンド実行部が現時点で実行可能なコマンドに対応する前記テキスト情報のみを前記操作画面に対応付けて提示する、
請求項4に記載の音声処理システム。 - 前記表示処理部が、同一の前記操作対象アプリケーションに対応する複数の前記操作画面を表示させる場合において、
前記支援情報提示部は、複数の前記操作画面を識別可能な画面識別情報を、それぞれの前記操作画面に対応付けて提示する、
請求項2から請求項5のいずれか1項に記載の音声処理システム。 - 前記表示処理部は、同一の前記操作対象アプリケーションに対応する複数の前記操作画面を、ネットワークを介して互いに通信可能に接続された第1表示装置及び第2表示装置のそれぞれに表示させ、
前記支援情報提示部は、前記第1表示装置及び前記第2表示装置のそれぞれにおいて、複数の前記操作画面を識別可能な画面識別情報を、それぞれの前記操作画面に対応付けて提示する、
請求項2から請求項5のいずれか1項に記載の音声処理システム。 - 前記ユーザの所定の操作を受け付ける操作受付部をさらに備え、
前記支援情報提示部は、前記操作受付部が前記ユーザから前記操作支援情報の提示を要求する操作を受け付けた場合に、前記操作支援情報を提示する、
請求項2から請求項7のいずれか1項に記載の音声処理システム。 - 前記支援情報提示部は、前記音声受信部より前記ユーザの音声が受信された場合に、前記操作支援情報を提示する、
請求項2から請求項7のいずれか1項に記載の音声処理システム。 - ユーザの音声に基づいて所定のコマンドを実行する音声処理方法であって、
前記ユーザの操作対象である操作対象アプリケーションの操作画面を表示させる表示ステップと、
前記操作対象アプリケーションに対する操作支援情報を前記操作画面に対応付けて提示する支援情報提示ステップと、
前記ユーザの音声を受信する音声受信ステップと、
前記音声受信ステップより受信される前記音声に基づいて前記操作対象アプリケーションに対する第1コマンドを特定するコマンド特定ステップと、
前記操作対象アプリケーションに対して前記コマンド特定ステップにより特定される前記第1コマンドを実行するコマンド実行ステップと、
一又は複数のプロセッサが実行する音声処理方法。 - ユーザの音声に基づいて所定のコマンドを実行する音声処理プログラムであって、
前記ユーザの操作対象である操作対象アプリケーションの操作画面を表示させる表示ステップと、
前記操作対象アプリケーションに対する操作支援情報を前記操作画面に対応付けて提示する支援情報提示ステップと、
前記ユーザの音声を受信する音声受信ステップと、
前記音声受信ステップより受信される前記音声に基づいて前記操作対象アプリケーションに対する第1コマンドを特定するコマンド特定ステップと、
前記操作対象アプリケーションに対して前記コマンド特定ステップにより特定される前記第1コマンドを実行するコマンド実行ステップと、
を一又は複数のプロセッサにより実行させるための音声処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020150854A JP2022045262A (ja) | 2020-09-08 | 2020-09-08 | 音声処理システム、音声処理方法、及び音声処理プログラム |
CN202110977193.6A CN114155847A (zh) | 2020-09-08 | 2021-08-24 | 声音处理系统以及声音处理方法 |
US17/462,502 US20220075592A1 (en) | 2020-09-08 | 2021-08-31 | Voice processing system, voice processing method and recording medium recording voice processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020150854A JP2022045262A (ja) | 2020-09-08 | 2020-09-08 | 音声処理システム、音声処理方法、及び音声処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022045262A true JP2022045262A (ja) | 2022-03-18 |
Family
ID=80460683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020150854A Pending JP2022045262A (ja) | 2020-09-08 | 2020-09-08 | 音声処理システム、音声処理方法、及び音声処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220075592A1 (ja) |
JP (1) | JP2022045262A (ja) |
CN (1) | CN114155847A (ja) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06149528A (ja) * | 1992-10-30 | 1994-05-27 | Oki Electric Ind Co Ltd | ウィンドウ管理方法 |
JPH07200235A (ja) * | 1993-12-28 | 1995-08-04 | Matsushita Electric Ind Co Ltd | マルチウィンドウ表示制御装置 |
JPH09200352A (ja) * | 1996-01-18 | 1997-07-31 | Canon Inc | テレビ会議システム |
US20050114140A1 (en) * | 2003-11-26 | 2005-05-26 | Brackett Charles C. | Method and apparatus for contextual voice cues |
US20120110456A1 (en) * | 2010-11-01 | 2012-05-03 | Microsoft Corporation | Integrated voice command modal user interface |
JP2013143151A (ja) * | 2012-01-11 | 2013-07-22 | Samsung Electronics Co Ltd | 音声認識を使用してユーザ機能を行う方法及び装置 |
JP2016508271A (ja) * | 2013-01-04 | 2016-03-17 | コピン コーポレーション | 制御可能なヘッドセットコンピュータディスプレイ |
JP2016519351A (ja) * | 2013-03-15 | 2016-06-30 | グーグル インコーポレイテッド | ユーザ通知及び制御のためのタブレベルでの音声管理 |
JP2017033291A (ja) * | 2015-07-31 | 2017-02-09 | キヤノン株式会社 | 情報処理装置及びその制御方法、情報処理システム、コンピュータプログラム |
JP2020047020A (ja) * | 2018-09-20 | 2020-03-26 | Dynabook株式会社 | 電子機器、音声認識方法及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5897618A (en) * | 1997-03-10 | 1999-04-27 | International Business Machines Corporation | Data processing system and method for switching between programs having a same title using a voice command |
US6906741B2 (en) * | 2002-01-29 | 2005-06-14 | Palm, Inc. | System for and method of conferencing with a handheld computer using multiple media types |
US20040260438A1 (en) * | 2003-06-17 | 2004-12-23 | Chernetsky Victor V. | Synchronous voice user interface/graphical user interface |
US10013976B2 (en) * | 2010-09-20 | 2018-07-03 | Kopin Corporation | Context sensitive overlays in voice controlled headset computer displays |
US20140372892A1 (en) * | 2013-06-18 | 2014-12-18 | Microsoft Corporation | On-demand interface registration with a voice control system |
US11132174B2 (en) * | 2019-03-15 | 2021-09-28 | Adobe Inc. | Facilitating discovery of verbal commands using multimodal interfaces |
-
2020
- 2020-09-08 JP JP2020150854A patent/JP2022045262A/ja active Pending
-
2021
- 2021-08-24 CN CN202110977193.6A patent/CN114155847A/zh active Pending
- 2021-08-31 US US17/462,502 patent/US20220075592A1/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06149528A (ja) * | 1992-10-30 | 1994-05-27 | Oki Electric Ind Co Ltd | ウィンドウ管理方法 |
JPH07200235A (ja) * | 1993-12-28 | 1995-08-04 | Matsushita Electric Ind Co Ltd | マルチウィンドウ表示制御装置 |
JPH09200352A (ja) * | 1996-01-18 | 1997-07-31 | Canon Inc | テレビ会議システム |
US20050114140A1 (en) * | 2003-11-26 | 2005-05-26 | Brackett Charles C. | Method and apparatus for contextual voice cues |
US20120110456A1 (en) * | 2010-11-01 | 2012-05-03 | Microsoft Corporation | Integrated voice command modal user interface |
JP2013143151A (ja) * | 2012-01-11 | 2013-07-22 | Samsung Electronics Co Ltd | 音声認識を使用してユーザ機能を行う方法及び装置 |
JP2016508271A (ja) * | 2013-01-04 | 2016-03-17 | コピン コーポレーション | 制御可能なヘッドセットコンピュータディスプレイ |
JP2016519351A (ja) * | 2013-03-15 | 2016-06-30 | グーグル インコーポレイテッド | ユーザ通知及び制御のためのタブレベルでの音声管理 |
JP2017033291A (ja) * | 2015-07-31 | 2017-02-09 | キヤノン株式会社 | 情報処理装置及びその制御方法、情報処理システム、コンピュータプログラム |
JP2020047020A (ja) * | 2018-09-20 | 2020-03-26 | Dynabook株式会社 | 電子機器、音声認識方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20220075592A1 (en) | 2022-03-10 |
CN114155847A (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10218939B2 (en) | Methods and systems for employing virtual support representatives in connection with mutli-pane video communications | |
US20180232203A1 (en) | Method for user training of information dialogue system | |
EP3214542A1 (en) | Voice control of interactive whiteboard appliances | |
JP5653392B2 (ja) | 音声翻訳装置、方法およびプログラム | |
US20160328205A1 (en) | Method and Apparatus for Voice Operation of Mobile Applications Having Unnamed View Elements | |
JP4942970B2 (ja) | 音声認識における動詞誤りの回復 | |
US8600763B2 (en) | System-initiated speech interaction | |
US9691381B2 (en) | Voice command recognition method and related electronic device and computer-readable medium | |
US20130033649A1 (en) | Method for controlling electronic apparatus based on motion recognition, and electronic apparatus applying the same | |
US20130035942A1 (en) | Electronic apparatus and method for providing user interface thereof | |
US9335965B2 (en) | System and method for excerpt creation by designating a text segment using speech | |
JP2002169588A (ja) | テキスト表示装置、テキスト表示制御方法、記憶媒体、プログラム伝送装置及び応対支援方法 | |
JP2013143151A (ja) | 音声認識を使用してユーザ機能を行う方法及び装置 | |
JP2016502302A (ja) | 音声によるバックグラウンド制御方法、移動体端末、及び非一時的なコンピュータ読み取り可能な記憶媒体 | |
EP3602330B1 (en) | Automatically generating documents | |
KR20150077580A (ko) | 음성 인식 기반 서비스 제공 방법 및 그 장치 | |
US11922929B2 (en) | Presentation support system | |
JP7200533B2 (ja) | 情報処理装置およびプログラム | |
US10810273B2 (en) | Auto identification and mapping of functional attributes from visual representation | |
JP2022045262A (ja) | 音声処理システム、音声処理方法、及び音声処理プログラム | |
US20130179165A1 (en) | Dynamic presentation aid | |
KR20140111574A (ko) | 오디오 명령에 따른 동작을 수행하는 장치 및 방법 | |
US20210287672A1 (en) | Voice processing system, voice processing method, and storage medium storing voice processing program | |
JP2009258914A (ja) | 情報処理装置及びプログラム、情報処理システム | |
US7970617B2 (en) | Image processing apparatus and image processing method with speech registration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240416 |