JP4842114B2 - 自動音声認識システムにおける孤立語句コマンド認識及び接続語句コマンド認識の同時対応 - Google Patents
自動音声認識システムにおける孤立語句コマンド認識及び接続語句コマンド認識の同時対応 Download PDFInfo
- Publication number
- JP4842114B2 JP4842114B2 JP2006341879A JP2006341879A JP4842114B2 JP 4842114 B2 JP4842114 B2 JP 4842114B2 JP 2006341879 A JP2006341879 A JP 2006341879A JP 2006341879 A JP2006341879 A JP 2006341879A JP 4842114 B2 JP4842114 B2 JP 4842114B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- active
- active command
- menu
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
104 受信器
106 音響信号
108 制御器
110 言語モデル
Claims (24)
- 音声入力を用いて1つ以上の装置を動作するためのシステムであって、
音声入力を受信するための受信器と、
前記受信器と通信する制御器と、
前記音声入力をコンピュータ読取可能なデータに変換するための前記制御器上で実行されるソフトウェアと、
アクティブコマンドテーブルを生成するための前記制御器上で実行されるソフトウェアであって、前記テーブルは、コマンドメニューの少なくとも2つの異なるレベルから選択されたアクティブコマンドを含む、ソフトウェアと、
前記データによって示された少なくとも1つのアクティブコマンドを識別するための前記制御器上で実行されるソフトウェアと、
前記システムによって動作可能な1つ以上の装置に前記少なくとも1つのアクティブコマンドを送信するための前記制御器上で実行されるソフトウェアと
を具備し、
1組のアクティブコマンドは、現在のコマンドメニュー位置およびデプスパラメータに基づき使用中に動的に生成および更新されることを特徴とするシステム。 - 前記少なくとも1つのアクティブコマンドは、孤立コマンドであることを特徴とする請求項1に記載のシステム。
- 少なくとも1つのアクティブコマンドを識別するための前記ソフトウェアは、順番に少なくとも1つの他のアクティブコマンドを識別することを特徴とする請求項1に記載のシステム。
- 前記少なくとも1つのアクティブコマンド及び少なくとも1つの他のアクティブコマンドの各々は、前記コマンドメニューの異なるレベルからそれぞれ提供された順次コマンドであることを特徴とする請求項3に記載のシステム。
- 前記アクティブコマンドテーブルは、少なくとも1つのグローバルコマンドを含むことを特徴とする請求項1に記載のシステム。
- 前記データによって示されたグローバルコマンドを識別するための前記制御器上で実行されるソフトウェアと、
前記グローバルコマンドを実行するための前記制御器上で実行されるソフトウェアと
をさらに具備することを特徴とする請求項5に記載のシステム。 - 前記システムによって動作可能な前記1つ以上の装置は、医療装置であることを特徴とする請求項1に記載のシステム。
- 前記音声入力は、孤立音声を含むことを特徴とする請求項1に記載のシステム。
- 前記音声入力は、連続音声を含むことを特徴とする請求項1に記載のシステム。
- 前記音声入力は、孤立音声及び連続音声を含むことを特徴とする請求項1に記載のシステム。
- 前記アクティブコマンドテーブルは、少なくとも1つの孤立コマンド語句及び少なくとも1つの連結コマンド語句を含むことを特徴とする請求項1に記載のシステム。
- 前記アクティブコマンドは、デプスパラメータに基づき前記コマンドメニューから選択されることを特徴とする請求項1に記載のシステム。
- 前記デプスパラメータは、現在のメニュー位置からの偏差を示すことを特徴とする請求項12に記載のシステム。
- 前記デプスパラメータは、メニューレベルの数を示すことを特徴とする請求項13に記載のシステム。
- 少なくとも1つのアクティブコマンドを識別するための前記ソフトウェアは、前記データを1つ以上の潜在的コマンドへ構文解析することを特徴とする請求項1に記載のシステム。
- 少なくとも1つのアクティブコマンドを識別するための前記ソフトウェアは、前記アクティブコマンドテーブルを問合せることを含むことを特徴とする請求項1に記載のシステム。
- 少なくとも1つのアクティブコマンドを識別するための前記ソフトウェアは、コマンド相当語句テーブルを問合せることを含むことを特徴とする請求項1に記載のシステム。
- 音声入力を用いる装置を制御する方法であって、
コマンドメニューから提供されたシステムの各装置に関連付けられたコマンドを判断する段階と、
アクティブコマンドテーブルを生成する段階であって、前記テーブルは、前記コマンドメニューの少なくとも2つの異なるレベルから選択されたアクティブコマンドを含む、段階と、
音声入力を受信する段階と、
前記音声入力をコンピュータ読取可能なデータに変換する段階と、
前記データによって示された少なくとも1つのアクティブコマンドを識別する段階と、
前記アクティブコマンドが関連する少なくとも1つの装置に前記アクティブコマンドを送信する段階と
を具備し、
1組のアクティブコマンドは、現在のコマンドメニュー位置およびデプスパラメータに基づき使用中に動的に生成および更新されることを特徴とする方法。 - 前記アクティブコマンドテーブルを生成する段階は、前記識別された最後のアクティブコマンドを判断することを含むことを含むことを特徴とする請求項18に記載の方法。
- 前記アクティブコマンドテーブルを生成する段階は、デプスパラメータを利用することを含み、前記デプスは、メニューレベルの数を示すことを特徴とする請求項18に記載の方法。
- 少なくとも1つのアクティブコマンドを識別する段階は、前記データを1つ以上の潜在的コマンドへ構文解析することを含むことを特徴とする請求項18に記載の方法。
- 前記識別された少なくとも1つのアクティブコマンドを表示する段階をさらに具備することを特徴とする請求項18に記載の方法。
- 前記少なくとも1つのアクティブコマンドを識別する段階は、前記システムの使用者への促しを生成することを含むことを特徴とする請求項18に記載の方法。
- 前記アクティブコマンドテーブルは、少なくとも1つの孤立コマンド及び少なくとも1つのコマンドシーケンスを含むことを特徴とする請求項18に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/312,785 | 2005-12-20 | ||
US11/312,785 US7620553B2 (en) | 2005-12-20 | 2005-12-20 | Simultaneous support of isolated and connected phrase command recognition in automatic speech recognition systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007171963A JP2007171963A (ja) | 2007-07-05 |
JP4842114B2 true JP4842114B2 (ja) | 2011-12-21 |
Family
ID=37891749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006341879A Active JP4842114B2 (ja) | 2005-12-20 | 2006-12-19 | 自動音声認識システムにおける孤立語句コマンド認識及び接続語句コマンド認識の同時対応 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7620553B2 (ja) |
EP (1) | EP1801780B1 (ja) |
JP (1) | JP4842114B2 (ja) |
CA (1) | CA2570767C (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7624019B2 (en) * | 2005-10-17 | 2009-11-24 | Microsoft Corporation | Raising the visibility of a voice-activated user interface |
US7620553B2 (en) | 2005-12-20 | 2009-11-17 | Storz Endoskop Produktions Gmbh | Simultaneous support of isolated and connected phrase command recognition in automatic speech recognition systems |
US20080097176A1 (en) * | 2006-09-29 | 2008-04-24 | Doug Music | User interface and identification in a medical device systems and methods |
US8005237B2 (en) * | 2007-05-17 | 2011-08-23 | Microsoft Corp. | Sensor array beamformer post-processor |
US20090210233A1 (en) * | 2008-02-15 | 2009-08-20 | Microsoft Corporation | Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns |
US8515763B2 (en) * | 2009-11-24 | 2013-08-20 | Honeywell International Inc. | Methods and systems for utilizing voice commands onboard an aircraft |
US20130041662A1 (en) * | 2011-08-08 | 2013-02-14 | Sony Corporation | System and method of controlling services on a device using voice data |
KR20130133629A (ko) | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
US9189465B2 (en) * | 2012-09-28 | 2015-11-17 | International Business Machines Corporation | Documentation of system monitoring and analysis procedures |
US9584642B2 (en) * | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10304465B2 (en) * | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
US10381002B2 (en) * | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US10373615B2 (en) * | 2012-10-30 | 2019-08-06 | Google Technology Holdings LLC | Voice control user interface during low power mode |
TWI519122B (zh) * | 2012-11-12 | 2016-01-21 | 輝達公司 | 行動資訊裝置與利用語音控制行動資訊裝置的方法 |
US9264801B2 (en) | 2012-12-04 | 2016-02-16 | Storz Endoskop Produktions Gmbh | System and method for pairing a command device incorporating a microphone to a remotely controlled medical system |
KR101433506B1 (ko) * | 2013-01-29 | 2014-08-22 | 엘에스산전 주식회사 | 고립어 음성 인식을 이용한 에너지 관리 시스템의 운전 방법 |
US10585568B1 (en) | 2013-02-22 | 2020-03-10 | The Directv Group, Inc. | Method and system of bookmarking content in a mobile device |
JP2015011170A (ja) * | 2013-06-28 | 2015-01-19 | 株式会社ATR−Trek | ローカルな音声認識を行なう音声認識クライアント装置 |
US10186262B2 (en) * | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
US8768712B1 (en) * | 2013-12-04 | 2014-07-01 | Google Inc. | Initiating actions based on partial hotwords |
US20160078864A1 (en) * | 2014-09-15 | 2016-03-17 | Honeywell International Inc. | Identifying un-stored voice commands |
US11062707B2 (en) * | 2018-06-28 | 2021-07-13 | Hill-Rom Services, Inc. | Voice recognition for patient care environment |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2688413B2 (ja) * | 1987-10-06 | 1997-12-10 | 株式会社日立製作所 | プラント運転監視装置 |
WO1991013431A1 (en) * | 1990-02-26 | 1991-09-05 | Motorola, Inc | Method and apparatus for recognizing string of word commands in a hierarchical command structure |
US6646541B1 (en) | 1996-06-24 | 2003-11-11 | Computer Motion, Inc. | General purpose distributed operating room control system |
US6463361B1 (en) * | 1994-09-22 | 2002-10-08 | Computer Motion, Inc. | Speech interface for an automated endoscopic system |
US7053752B2 (en) | 1996-08-06 | 2006-05-30 | Intuitive Surgical | General purpose distributed operating room control system |
US5794196A (en) * | 1995-06-30 | 1998-08-11 | Kurzweil Applied Intelligence, Inc. | Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules |
US5970457A (en) | 1995-10-25 | 1999-10-19 | Johns Hopkins University | Voice command and control medical care system |
US6496099B2 (en) | 1996-06-24 | 2002-12-17 | Computer Motion, Inc. | General purpose distributed operating room control system |
US6642836B1 (en) | 1996-08-06 | 2003-11-04 | Computer Motion, Inc. | General purpose distributed operating room control system |
US6301560B1 (en) * | 1998-01-05 | 2001-10-09 | Microsoft Corporation | Discrete speech recognition system with ballooning active grammar |
US6182046B1 (en) * | 1998-03-26 | 2001-01-30 | International Business Machines Corp. | Managing voice commands in speech applications |
ATE245845T1 (de) * | 1998-09-30 | 2003-08-15 | Lernout & Hauspie Speechprod | Graphische benutzerschnittstelle zur navigation in grammatiken eines spracherkennungssystems |
JP2000194391A (ja) * | 1998-12-25 | 2000-07-14 | Kojima Press Co Ltd | 音声認識制御装置 |
US6266635B1 (en) | 1999-07-08 | 2001-07-24 | Contec Medical Ltd. | Multitasking interactive voice user interface |
US6601026B2 (en) | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US6587818B2 (en) | 1999-10-28 | 2003-07-01 | International Business Machines Corporation | System and method for resolving decoding ambiguity via dialog |
US6591239B1 (en) | 1999-12-09 | 2003-07-08 | Steris Inc. | Voice controlled surgical suite |
WO2002050816A1 (en) * | 2000-12-18 | 2002-06-27 | Koninklijke Philips Electronics N.V. | Store speech, select vocabulary to recognize word |
JP3997459B2 (ja) * | 2001-10-02 | 2007-10-24 | 株式会社日立製作所 | 音声入力システムおよび音声ポータルサーバおよび音声入力端末 |
JP2003241784A (ja) * | 2002-02-21 | 2003-08-29 | Nissan Motor Co Ltd | 音声入出力装置 |
US7149983B1 (en) * | 2002-05-08 | 2006-12-12 | Microsoft Corporation | User interface and method to facilitate hierarchical specification of queries using an information taxonomy |
JP4107093B2 (ja) * | 2003-01-30 | 2008-06-25 | 株式会社日立製作所 | 対話型端末装置及び対話アプリケーション提供方法 |
US7620553B2 (en) | 2005-12-20 | 2009-11-17 | Storz Endoskop Produktions Gmbh | Simultaneous support of isolated and connected phrase command recognition in automatic speech recognition systems |
-
2005
- 2005-12-20 US US11/312,785 patent/US7620553B2/en active Active
-
2006
- 2006-12-08 EP EP06256273A patent/EP1801780B1/en active Active
- 2006-12-11 CA CA2570767A patent/CA2570767C/en active Active
- 2006-12-19 JP JP2006341879A patent/JP4842114B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20070150288A1 (en) | 2007-06-28 |
EP1801780B1 (en) | 2011-09-14 |
CA2570767A1 (en) | 2007-06-20 |
CA2570767C (en) | 2010-10-19 |
JP2007171963A (ja) | 2007-07-05 |
EP1801780A1 (en) | 2007-06-27 |
US7620553B2 (en) | 2009-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4842114B2 (ja) | 自動音声認識システムにおける孤立語句コマンド認識及び接続語句コマンド認識の同時対応 | |
JP4699411B2 (ja) | ユーザプロファイル管理コンポーネントを備えた音声認識システム | |
US11887604B1 (en) | Speech interface device with caching component | |
JP6887031B2 (ja) | 方法、電子装置、家庭用機器ネットワークおよび記憶媒体 | |
CN107644638B (zh) | 语音识别方法、装置、终端和计算机可读存储介质 | |
KR102429436B1 (ko) | 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법 | |
JP5335051B2 (ja) | 音声駆動式のコントロールアプリケーションにおいて危険を軽減するためのシステムおよび方法 | |
JPWO2018100743A1 (ja) | 制御装置および機器制御システム | |
JP2008268517A (ja) | 音声認識機能付き操作器 | |
KR102584324B1 (ko) | 음성 인식 서비스 제공 방법 및 이를 위한 장치 | |
KR100529950B1 (ko) | 음성 대화형 에어컨 시스템 및 그 동작방법 | |
WO2020033187A1 (en) | Systems and devices for controlling network applications | |
KR102124396B1 (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR102089593B1 (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR102051480B1 (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR102045539B1 (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
JP2021033083A (ja) | カラオケ用入力装置 | |
KR100384330B1 (ko) | 오류범위 가변 및 사용자 선택이 가능한 음성인식 처리장치 및 방법 | |
KR20050060910A (ko) | 차량의 음성 명령 인식 방법 및 장치 | |
JP2021021848A (ja) | カラオケ用入力装置 | |
JP2020085942A (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100513 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110526 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110906 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111005 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4842114 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |