KR20050061571A - 핸드헬드 전자 장치에서 텍스트를 편집하는 방법 및 시스템 - Google Patents
핸드헬드 전자 장치에서 텍스트를 편집하는 방법 및 시스템 Download PDFInfo
- Publication number
- KR20050061571A KR20050061571A KR1020057007289A KR20057007289A KR20050061571A KR 20050061571 A KR20050061571 A KR 20050061571A KR 1020057007289 A KR1020057007289 A KR 1020057007289A KR 20057007289 A KR20057007289 A KR 20057007289A KR 20050061571 A KR20050061571 A KR 20050061571A
- Authority
- KR
- South Korea
- Prior art keywords
- words
- text
- grammar
- command
- class
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- Telephonic Communication Services (AREA)
- Stored Programmes (AREA)
Abstract
Description
Claims (23)
- 핸드헬드 전자 장치(10)의 편집 세션에서 복수의 제3 단어들을 포함하는 텍스트(140)를 수정하는 방법으로서, 상기 텍스트 중 적어도 일부가 복수의 제1 단어들을 포함하는 제1 문법(130)을 사용하여 딕테이션되고, 상기 핸드헬드 전자 장치가 상기 제1 문법보다 작은 제2 문법(150)을 포함하며, 상기 제2 문법이 편집을 위해 복수의 제2 단어들을 포함하는 텍스트 수정 방법에 있어서,상기 제2 단어들이 상기 제3 단어들 중 일부 또는 모두를 포함하도록 상기 제3 단어들을 상기 제2 문법에 제공하는 단계를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하고, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하도록 활성화될 수 있으며, 상기 텍스트 수정 방법은,상기 활성화된 보이스 인식가능 커맨드가 상기 텍스트의 수정을 위해 텍스트 수정 단어를 규정할 경우, 만일 상기 텍스트 수정 단어가 상기 제2 단어들 중 하나이라면 상기 텍스트 수정 단어가 상기 제2 문법으로부터 획득되고, 만일 상기 텍스트 수정 단어가 상기 제2 단어들 중 어떠한 것도 아니라면 상기 텍스트 수정 단어가 상기 제1 문법 내의 제1 단어들로부터 획득되는 것을 특징으로 하는 텍스트 수정 방법.
- 제2항에 있어서,상기 텍스트 수정 방법은,상기 제2 단어들이 부가적인 사용을 위해 상기 획득된 단어를 더 포함하도록 상기 제1 단어들로부터 획득된 텍스트 수정 단어를 상기 제2 문법에 포함하는 단계를 더 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하며, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하기 위해 활성화될 수 있고, 상기 텍스트 수정 방법은,상기 제1 단어들이 복수의 부류들과 관련된 단어들의 복수의 부분 집합들을 포함하며, 상기 보이스 인식가능 커맨드들은 상기 부류들 중 적어도 하나의 부류를 규정하기 위한 적어도 하나의 부류 커맨드를 포함하고, 상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드를 포함할 경우, 상기 부류 커맨드에서 규정된 부류와 관련된 단어들의 부분 집합은 상기 제2 단어들이 상기 단어들의 부분 집합을 더 포함할 수 있게 하도록 상기 제2 문법에 제공되는 것을 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하고, 상기 보이스 인식가능 커맨드들 중 적어도 하나가 상기 텍스트를 수정하기 위해 활성화될 수 있으며, 상기 텍스트 수정 방법은,상기 제1 단어들이 복수의 부류들과 관련된 단어들의 복수의 부분 집합들을 포함하고, 상기 보이스 인식가능 커맨드들이 상기 부류들을 규정하기 위한 복수의 부류 커맨드들을 포함하며,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드들 중 하나의 부류 커맨드를 포함할 경우, 상기 하나의 부류 커맨드에서 규정된 부류와 관련된 단어들의 부분 집합은 상기 제2 단어들이 상기 단어들의 부분 집합을 더 포함할 수 있게 하도록 상기 제2 문법에 제공되고,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드들 중 다른 하나의 부류 커맨드를 더 포함할 경우, 상기 다른 하나의 부류 커맨드에서 규정된 부류와 관련된 단어들의 다른 부분 집합은 상기 제2 단어들이 상기 단어들의 다른 부분 집합을 더 포함할 수 있게 하도록 상기 제2 문법에 제공되는 것을 특징으로 하는 텍스트 수정 방법.
- 제5항에 있어서,상기 텍스트 수정 방법은,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드들 중 다른 하나의 부류 커맨드를 더 포함할 경우, 상기 단어들의 부분 집합이 상기 제2 문법의 크기를 감소시키도록 상기 제2 문법으로부터 제거되는 것을 또한 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 핸드헬드 전자 장치(10)는 원격 사이트(20)에 동작가능하게 접속되며, 상기 텍스트 수정 방법은,상기 제1 문법이 상기 원격 사이트에 위치해 있는 것을 또한 특징으로 하는 텍스트 수정 방법.
- 제7항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하며, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하도록 활성화될 수 있고, 상기 텍스트 수정 방법은,상기 핸드헬드 전자 장치(10)가 복수의 부류들과 관련된 단어들의 복수의 부분 집합들을 포함하는 제3 문법(160)을 더 포함하며, 상기 보이스 인식가능 커맨드들이 상기 부류들에 적어도 하나의 단어를 규정하기 위한 적어도 하나의 부류 커맨드를 포함하고, 상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드를 포함할 경우, 상기 부류 커맨드 내의 부류와 관련된 단어들의 부분 집합은 상기 제2 단어들이 상기 단어들의 부분 집합을 더 포함하도록 상기 제2 문법에 제공되는 것을 특징으로 하는 텍스트 수정 방법.
- 제7항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하고, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하기 위해 활성화될 수 있으며, 상기 텍스트 수정 방법은,상기 핸드헬드 전자 장치(10)가 복수의 부류들과 관련된 단어들의 복수의 부분 집합들을 포함하는 제3 문법(160)을 더 포함하며, 상기 보이스 인식가능 커맨드들은 상기 부류들을 규정하기 위한 복수의 부류 커맨드들을 포함하고,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드들 중 하나의 부류 커맨드를 포함할 경우, 상기 하나의 부류 커맨드에서 규정된 부류와 관련된 단어들의 부분 집합은 상기 제2 단어들이 상기 단어들의 부분 집합을 더 포함하도록 상기 제2 문법에 제공되며,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드들 중 다른 한 부류 커맨드를 더 포함할 경우, 상기 다른 한 부류 커맨드에서 규정된 부류와 관련된 단어들의 다른 부분 집합은 상기 제2 단어들이 상기 단어들의 다른 부분 집합을 더 포함하도록 상기 제2 문법에 제공되는 것을 특징으로 하는 텍스트 수정 방법.
- 제9항에 있어서,상기 텍스트 수정 방법은,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드들 중 다른 하나의 부류 커맨드를 더 포함할 경우, 상기 단어들의 부분 집합은 상기 제2 문법의 크기를 감소시키도록 상기 제2 문법으로부터 제거되는 것을 또한 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하고, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하기 위해 활성화될 수 있으며, 상기 텍스트 수정 방법은,상기 제3 단어들이 복수의 단어 위치들과 관련되어 있으며,상기 보이스 인식가능 커맨드들이 단어 위치를 규정하기 위한 적어도 하나의 위치 커맨드를 포함하고,상기 적어도 하나의 활성화된 보이스 인식가능 커맨드가 상기 위치 커맨드를 포함하며 대체될 제3 단어들 중 적어도 하나를 식별할 경우, 상기 텍스트 수정 단어는 상기 규정된 단어 위치를 기초로 하여 상기 적어도 하나의 식별된 제3 단어를 대체하는 것을 특징으로 하는 텍스트 수정 방법.
- 제2항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하고, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하기 위해 활성화될 수 있으며, 상기 텍스트 수정 방법은,상기 제3 단어들이 복수의 단어 위치들과 관련되어 있으며,상기 보이스 인식가능 커맨드들이 상기 활성화된 보이스 인식가능 커맨드에 응답하여 규정된 단어 위치에서 상기 텍스트 수정 단어를 사용하여 상기 텍스트를 수정하도록 상기 단어 위치를 규정하기 위한 적어도 하나의 위치 커맨드를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 제2 문법은 복수의 보이스 인식가능 커맨드들을 포함하며, 상기 보이스 인식가능 커맨드들 중 적어도 하나는 상기 텍스트를 수정하기 위해 활성화될 수 있고, 상기 텍스트 수정 방법은,상기 제3 단어들이 복수의 단어 위치들과 관련되어 있으며,상기 보이스 인식가능 커맨드들이 상기 활성화된 보이스 인식가능 커맨드에 응답하여 규정된 단어 위치에서 상기 제3 단어들 중 적어도 하나를 삭제하도록 상기 단어 위치를 규정하기 위한 적어도 하나의 위치 커맨드를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제1항에 있어서,상기 편집 세션을 종결하는 단계를 포함하며, 상기 텍스트 수정 방법은,상기 종결 단계 이후에 상기 제2 문법으로부터 상기 제3 단어들을 제거하는 단계를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제3항에 있어서,상기 편집 세션을 종결하는 단계를 포함하며, 상기 텍스트 수정 방법은,상기 종결 단계 이후에 상기 제2 문법으로부터 상기 획득된 텍스트 수정 단어를 제거하는 단계를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제4항에 있어서,상기 편집 세션을 종결하는 단계를 포함하며, 상기 텍스트 수정 방법은,상기 종결 단계 이후에 상기 제2 문법으로부터 상기 단어들의 부분 집합을 제거하는 단계를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 제8항에 있어서,상기 편집 세션을 종결하는 단계를 포함하며, 상기 텍스트 수정 방법은,상기 종결 단계 이후에 상기 제2 문법으로부터 상기 단어들의 부분 집합을 제거하는 단계를 포함하는 것을 특징으로 하는 텍스트 수정 방법.
- 복수의 제3 단어들을 포함하는 수정가능한 텍스트(140)를 지니는 핸드헬드 전자 장치(10)로서, 상기 텍스트 중 적어도 일부가 복수의 제1 단어들을 포함하는 제1 문법(130)을 사용하여 딕테이션되는 핸드헬드 전자 장치에 있어서,보이스 입력 모듈; 및상기 보이스 입력 모듈에 동작가능하게 접속된 메모리 모듈로서,복수의 제2 단어들 및 상기 제3 단어들 중 적어도 하나를 포함하며, 상기 제1 문법보다 작은 제2 문법을 포함하는 메모리 모듈을 포함하는 것을 특징으로 하는 핸드헬드 전자 장치.
- 제18항에 있어서,상기 제1 문법은 상기 메모리 모듈에 포함되어 있는 것을 특징으로 하는 핸드헬드 전자 장치.
- 제18항에 있어서,상기 메모리 모듈은 상기 텍스트를 수정하기 위해 상기 보이스 입력 모듈을 통해 활성화될 수 있는 복수의 보이스 인식가능 커맨드들을 더 포함하며,상기 활성화된 보이스 인식가능 커맨드가 상기 텍스트를 수정하기 위해 텍스트 수정 단어를 규정할 경우, 만일 상기 텍스트 수정 단어가 상기 제2 단어들 중 하나이라면, 상기 텍스트 수정 단어가 상기 제2 문법으로부터 획득되고, 만일 상기 텍스트 수정 단어가 상기 제2 단어들 중 어떠한 것도 아니라면, 상기 텍스트 수정 단어가 상기 제1 문법 내의 제1 단어들로부터 획득되는 것을 특징으로 하는 핸드헬드 전자 장치.
- 제20항에 있어서,상기 제2 단어들은 부가적인 사용을 위해 상기 제1 단어들로부터 획득되는 텍스트 수정 단어를 더 포함하는 것을 특징으로 하는 핸드헬드 전자 장치.
- 제20항에 있어서,상기 제1 문법은 원격 사이트에 위치해 있으며, 상기 원격 사이트는 상기 텍스트 수정 단어가 상기 제1 문법 내의 제1 단어들로부터 획득될 수 있게 하도록 상기 핸드헬드 전자 장치에 동작가능하게 접속되는 것을 특징으로 하는 핸드헬드 전자 장치.
- 제22항에 있어서,상기 핸드헬드 전자 장치는,복수의 부류들과 관련된 단어들의 복수의 부분 집합들을 포함하는 제3 문법(160)을 더 포함하며,상기 보이스 인식가능 커맨드들은 상기 부류들 중 적어도 하나를 규정하기 위한 적어도 하나의 부류 커맨드를 포함하고,상기 활성화된 보이스 인식가능 커맨드가 상기 부류 커맨드를 포함할 경우, 상기 부류 커맨드에서 규정된 부류와 관련된 단어들의 부분 집합은 상기 제2 단어들이 상기 단어의 부분 집합을 더 포함하도록 상기 제2 문법에 제공되는 것을 특징으로 하는 핸드헬드 전자 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/284,997 US7003457B2 (en) | 2002-10-29 | 2002-10-29 | Method and system for text editing in hand-held electronic device |
US10/284,997 | 2002-10-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050061571A true KR20050061571A (ko) | 2005-06-22 |
KR100734409B1 KR100734409B1 (ko) | 2007-07-03 |
Family
ID=32107600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057007289A KR100734409B1 (ko) | 2002-10-29 | 2003-10-24 | 핸드헬드 전자 장치에서 텍스트를 편집하는 방법 및 시스템 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7003457B2 (ko) |
EP (1) | EP1556855B1 (ko) |
KR (1) | KR100734409B1 (ko) |
CN (1) | CN1708784B (ko) |
AT (1) | ATE452399T1 (ko) |
DE (1) | DE60330591D1 (ko) |
ES (1) | ES2334907T3 (ko) |
WO (1) | WO2004040551A1 (ko) |
Families Citing this family (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003463B1 (en) | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US7366673B2 (en) | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
EP1611504B1 (en) * | 2003-04-07 | 2009-01-14 | Nokia Corporation | Method and device for providing speech-enabled input in an electronic device having a user interface |
JP4466564B2 (ja) * | 2003-09-08 | 2010-05-26 | 日本電気株式会社 | 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム |
US9083798B2 (en) * | 2004-12-22 | 2015-07-14 | Nuance Communications, Inc. | Enabling voice selection of user preferences |
US7917365B2 (en) * | 2005-06-16 | 2011-03-29 | Nuance Communications, Inc. | Synchronizing visual and speech events in a multimodal application |
US20060287865A1 (en) * | 2005-06-16 | 2006-12-21 | Cross Charles W Jr | Establishing a multimodal application voice |
US8090584B2 (en) * | 2005-06-16 | 2012-01-03 | Nuance Communications, Inc. | Modifying a grammar of a hierarchical multimodal menu in dependence upon speech command frequency |
US20060287858A1 (en) * | 2005-06-16 | 2006-12-21 | Cross Charles W Jr | Modifying a grammar of a hierarchical multimodal menu with keywords sold to customers |
US8073700B2 (en) | 2005-09-12 | 2011-12-06 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
US8719034B2 (en) | 2005-09-13 | 2014-05-06 | Nuance Communications, Inc. | Displaying speech command input state information in a multimodal browser |
JP4846734B2 (ja) * | 2005-12-07 | 2011-12-28 | 三菱電機株式会社 | 音声認識装置 |
US7848314B2 (en) * | 2006-05-10 | 2010-12-07 | Nuance Communications, Inc. | VOIP barge-in support for half-duplex DSR client on a full-duplex network |
US9208785B2 (en) * | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US20070274297A1 (en) * | 2006-05-10 | 2007-11-29 | Cross Charles W Jr | Streaming audio from a full-duplex network through a half-duplex device |
US7676371B2 (en) | 2006-06-13 | 2010-03-09 | Nuance Communications, Inc. | Oral modification of an ASR lexicon of an ASR engine |
US8332218B2 (en) * | 2006-06-13 | 2012-12-11 | Nuance Communications, Inc. | Context-based grammars for automated speech recognition |
US8374874B2 (en) | 2006-09-11 | 2013-02-12 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction |
US8145493B2 (en) | 2006-09-11 | 2012-03-27 | Nuance Communications, Inc. | Establishing a preferred mode of interaction between a user and a multimodal application |
US7957976B2 (en) | 2006-09-12 | 2011-06-07 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
US8073697B2 (en) * | 2006-09-12 | 2011-12-06 | International Business Machines Corporation | Establishing a multimodal personality for a multimodal application |
US8086463B2 (en) | 2006-09-12 | 2011-12-27 | Nuance Communications, Inc. | Dynamically generating a vocal help prompt in a multimodal application |
US9830912B2 (en) | 2006-11-30 | 2017-11-28 | Ashwin P Rao | Speak and touch auto correction interface |
WO2008067562A2 (en) * | 2006-11-30 | 2008-06-05 | Rao Ashwin P | Multimodal speech recognition system |
US7827033B2 (en) | 2006-12-06 | 2010-11-02 | Nuance Communications, Inc. | Enabling grammars in web page frames |
US20080154604A1 (en) * | 2006-12-22 | 2008-06-26 | Nokia Corporation | System and method for providing context-based dynamic speech grammar generation for use in search applications |
US8069047B2 (en) * | 2007-02-12 | 2011-11-29 | Nuance Communications, Inc. | Dynamically defining a VoiceXML grammar in an X+V page of a multimodal application |
US7801728B2 (en) | 2007-02-26 | 2010-09-21 | Nuance Communications, Inc. | Document session replay for multimodal applications |
US8150698B2 (en) * | 2007-02-26 | 2012-04-03 | Nuance Communications, Inc. | Invoking tapered prompts in a multimodal application |
US7809575B2 (en) * | 2007-02-27 | 2010-10-05 | Nuance Communications, Inc. | Enabling global grammars for a particular multimodal application |
US8713542B2 (en) * | 2007-02-27 | 2014-04-29 | Nuance Communications, Inc. | Pausing a VoiceXML dialog of a multimodal application |
US8938392B2 (en) * | 2007-02-27 | 2015-01-20 | Nuance Communications, Inc. | Configuring a speech engine for a multimodal application based on location |
US7822608B2 (en) * | 2007-02-27 | 2010-10-26 | Nuance Communications, Inc. | Disambiguating a speech recognition grammar in a multimodal application |
US7840409B2 (en) * | 2007-02-27 | 2010-11-23 | Nuance Communications, Inc. | Ordering recognition results produced by an automatic speech recognition engine for a multimodal application |
US9208783B2 (en) * | 2007-02-27 | 2015-12-08 | Nuance Communications, Inc. | Altering behavior of a multimodal application based on location |
US20080208586A1 (en) * | 2007-02-27 | 2008-08-28 | Soonthorn Ativanichayaphong | Enabling Natural Language Understanding In An X+V Page Of A Multimodal Application |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8949266B2 (en) | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Multiple web-based content category searching in mobile search application |
US10056077B2 (en) * | 2007-03-07 | 2018-08-21 | Nuance Communications, Inc. | Using speech recognition results based on an unstructured language model with a music system |
US8843376B2 (en) * | 2007-03-13 | 2014-09-23 | Nuance Communications, Inc. | Speech-enabled web content searching using a multimodal browser |
US7945851B2 (en) * | 2007-03-14 | 2011-05-17 | Nuance Communications, Inc. | Enabling dynamic voiceXML in an X+V page of a multimodal application |
US8515757B2 (en) * | 2007-03-20 | 2013-08-20 | Nuance Communications, Inc. | Indexing digitized speech with words represented in the digitized speech |
US8670987B2 (en) * | 2007-03-20 | 2014-03-11 | Nuance Communications, Inc. | Automatic speech recognition with dynamic grammar rules |
US8909532B2 (en) * | 2007-03-23 | 2014-12-09 | Nuance Communications, Inc. | Supporting multi-lingual user interaction with a multimodal application |
US20080235029A1 (en) * | 2007-03-23 | 2008-09-25 | Cross Charles W | Speech-Enabled Predictive Text Selection For A Multimodal Application |
US8788620B2 (en) * | 2007-04-04 | 2014-07-22 | International Business Machines Corporation | Web service support for a multimodal client processing a multimodal application |
US8725513B2 (en) * | 2007-04-12 | 2014-05-13 | Nuance Communications, Inc. | Providing expressive user interaction with a multimodal application |
US8862475B2 (en) * | 2007-04-12 | 2014-10-14 | Nuance Communications, Inc. | Speech-enabled content navigation and control of a distributed multimodal browser |
US8457946B2 (en) * | 2007-04-26 | 2013-06-04 | Microsoft Corporation | Recognition architecture for generating Asian characters |
KR20090020265A (ko) * | 2007-08-23 | 2009-02-26 | 삼성전자주식회사 | 휴대 단말기 및 그 메시지 작성 방법 |
US8082148B2 (en) | 2008-04-24 | 2011-12-20 | Nuance Communications, Inc. | Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise |
US8214242B2 (en) * | 2008-04-24 | 2012-07-03 | International Business Machines Corporation | Signaling correspondence between a meeting agenda and a meeting discussion |
US9349367B2 (en) * | 2008-04-24 | 2016-05-24 | Nuance Communications, Inc. | Records disambiguation in a multimodal application operating on a multimodal device |
US8229081B2 (en) * | 2008-04-24 | 2012-07-24 | International Business Machines Corporation | Dynamically publishing directory information for a plurality of interactive voice response systems |
US8121837B2 (en) | 2008-04-24 | 2012-02-21 | Nuance Communications, Inc. | Adjusting a speech engine for a mobile computing device based on background noise |
US9922640B2 (en) | 2008-10-17 | 2018-03-20 | Ashwin P Rao | System and method for multimodal utterance detection |
US8380513B2 (en) * | 2009-05-19 | 2013-02-19 | International Business Machines Corporation | Improving speech capabilities of a multimodal application |
US8290780B2 (en) | 2009-06-24 | 2012-10-16 | International Business Machines Corporation | Dynamically extending the speech prompts of a multimodal application |
US8510117B2 (en) * | 2009-07-09 | 2013-08-13 | Nuance Communications, Inc. | Speech enabled media sharing in a multimodal application |
US8416714B2 (en) * | 2009-08-05 | 2013-04-09 | International Business Machines Corporation | Multimodal teleconferencing |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US8704783B2 (en) | 2010-03-24 | 2014-04-22 | Microsoft Corporation | Easy word selection and selection ahead of finger |
US9292161B2 (en) * | 2010-03-24 | 2016-03-22 | Microsoft Technology Licensing, Llc | Pointer tool with touch-enabled precise placement |
US8898065B2 (en) | 2011-01-07 | 2014-11-25 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
WO2012161359A1 (ko) * | 2011-05-24 | 2012-11-29 | 엘지전자 주식회사 | 사용자 인터페이스 방법 및 장치 |
US9317196B2 (en) | 2011-08-10 | 2016-04-19 | Microsoft Technology Licensing, Llc | Automatic zooming for text selection/cursor placement |
CN103186523B (zh) * | 2011-12-30 | 2017-05-10 | 富泰华工业(深圳)有限公司 | 电子设备及其自然语言分析方法 |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
CN103714048B (zh) * | 2012-09-29 | 2017-07-21 | 国际商业机器公司 | 用于校正文本的方法和系统 |
WO2014055076A1 (en) | 2012-10-04 | 2014-04-10 | Nuance Communications, Inc. | Improved hybrid controller for asr |
US9190057B2 (en) | 2012-12-12 | 2015-11-17 | Amazon Technologies, Inc. | Speech model retrieval in distributed speech recognition systems |
CN103177724A (zh) * | 2013-03-19 | 2013-06-26 | 华为终端有限公司 | 语音控制文本操作的方法、装置及终端 |
US9390079B1 (en) | 2013-05-10 | 2016-07-12 | D.R. Systems, Inc. | Voice commands for report editing |
WO2015093655A1 (ko) * | 2013-12-19 | 2015-06-25 | 주식회사 큐키 | 전자 장치, 문자 수정 방법 및 이를 수행하기 위한 프로그램을 포함하는 컴퓨터로 판독 가능한 기록매체 |
WO2015093656A1 (ko) * | 2013-12-19 | 2015-06-25 | 주식회사 큐키 | 전자 장치, 오타 수정 방법 및 이를 수행하기 위한 프로그램을 포함하는 컴퓨터로 판독 가능한 기록매체 |
US9448991B2 (en) * | 2014-03-18 | 2016-09-20 | Bayerische Motoren Werke Aktiengesellschaft | Method for providing context-based correction of voice recognition results |
CN105869632A (zh) * | 2015-01-22 | 2016-08-17 | 北京三星通信技术研究有限公司 | 基于语音识别的文本修订方法和装置 |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
JP2016181018A (ja) * | 2015-03-23 | 2016-10-13 | ソニー株式会社 | 情報処理システムおよび情報処理方法 |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10971157B2 (en) | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN110321534B (zh) * | 2018-03-28 | 2023-11-24 | 科大讯飞股份有限公司 | 一种文本编辑方法、装置、设备及可读存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
DE4412930A1 (de) * | 1994-04-15 | 1995-10-19 | Philips Patentverwaltung | Verfahren zum Ermitteln einer Folge von Wörtern |
US5875448A (en) * | 1996-10-08 | 1999-02-23 | Boys; Donald R. | Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator |
US6665639B2 (en) * | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US5909667A (en) * | 1997-03-05 | 1999-06-01 | International Business Machines Corporation | Method and apparatus for fast voice selection of error words in dictated text |
CN1163869C (zh) * | 1997-05-06 | 2004-08-25 | 语音工程国际公司 | 用于开发交互式语音应用程序的系统和方法 |
US6301560B1 (en) * | 1998-01-05 | 2001-10-09 | Microsoft Corporation | Discrete speech recognition system with ballooning active grammar |
KR100308274B1 (ko) * | 1998-09-22 | 2001-11-15 | 구자홍 | 가변어휘인식시스템 |
KR20010085219A (ko) * | 1999-01-05 | 2001-09-07 | 요트.게.아. 롤페즈 | 서브단어 메모리를 포함하는 음성인식 장치 |
EP1088299A2 (en) * | 1999-03-26 | 2001-04-04 | Scansoft, Inc. | Client-server speech recognition |
US6360201B1 (en) * | 1999-06-08 | 2002-03-19 | International Business Machines Corp. | Method and apparatus for activating and deactivating auxiliary topic libraries in a speech dictation system |
CN1315721A (zh) * | 2000-03-23 | 2001-10-03 | 韦尔博泰克有限公司 | 客户服务器语音信息传送系统与方法 |
WO2001084535A2 (en) * | 2000-05-02 | 2001-11-08 | Dragon Systems, Inc. | Error correction in speech recognition |
KR100427681B1 (ko) * | 2000-06-19 | 2004-04-27 | 인터내셔널 비지네스 머신즈 코포레이션 | 분산 데이터 처리 시스템에 있어서 동적 문서 생성용콤포넌트 모델 정의 장치 및 방법 |
-
2002
- 2002-10-29 US US10/284,997 patent/US7003457B2/en not_active Expired - Lifetime
-
2003
- 2003-10-21 WO PCT/IB2003/004715 patent/WO2004040551A1/en not_active Application Discontinuation
- 2003-10-21 AT AT03758410T patent/ATE452399T1/de not_active IP Right Cessation
- 2003-10-21 DE DE60330591T patent/DE60330591D1/de not_active Expired - Lifetime
- 2003-10-21 ES ES03758410T patent/ES2334907T3/es not_active Expired - Lifetime
- 2003-10-21 EP EP03758410A patent/EP1556855B1/en not_active Expired - Lifetime
- 2003-10-24 CN CN2003801024751A patent/CN1708784B/zh not_active Expired - Lifetime
- 2003-10-24 KR KR1020057007289A patent/KR100734409B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
ATE452399T1 (de) | 2010-01-15 |
CN1708784B (zh) | 2012-05-30 |
EP1556855B1 (en) | 2009-12-16 |
US7003457B2 (en) | 2006-02-21 |
EP1556855A4 (en) | 2006-01-18 |
WO2004040551A8 (en) | 2004-08-26 |
KR100734409B1 (ko) | 2007-07-03 |
US20040083109A1 (en) | 2004-04-29 |
CN1708784A (zh) | 2005-12-14 |
EP1556855A1 (en) | 2005-07-27 |
WO2004040551A1 (en) | 2004-05-13 |
DE60330591D1 (de) | 2010-01-28 |
ES2334907T3 (es) | 2010-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100734409B1 (ko) | 핸드헬드 전자 장치에서 텍스트를 편집하는 방법 및 시스템 | |
US8812316B1 (en) | Speech recognition repair using contextual information | |
US7444286B2 (en) | Speech recognition using re-utterance recognition | |
US7467089B2 (en) | Combined speech and handwriting recognition | |
US7526431B2 (en) | Speech recognition using ambiguous or phone key spelling and/or filtering | |
US7505911B2 (en) | Combined speech recognition and sound recording | |
US7577569B2 (en) | Combined speech recognition and text-to-speech generation | |
US7313526B2 (en) | Speech recognition using selectable recognition modes | |
US9111538B2 (en) | Genius button secondary commands | |
US7809574B2 (en) | Word recognition using choice lists | |
US7634403B2 (en) | Word recognition using word transformation commands | |
US7716058B2 (en) | Speech recognition using automatic recognition turn off | |
EP1240642A1 (en) | Learning of dialogue states and language model of spoken information system | |
US7552221B2 (en) | System for communicating with a server through a mobile communication device | |
Primorac et al. | Android application for sending SMS messages with speech recognition interface | |
CN111325039A (zh) | 基于实时通话的语言翻译方法、系统、程序和手持终端 | |
US7460999B2 (en) | Method and apparatus for executing tasks in voice-activated command systems | |
EP1681830A1 (fr) | Procédé et dispositif d'obtention d'informations relatives à la présence et/ou la disponibilité d'un utilisateur | |
JP2007509418A (ja) | 手書き認識をパーソナル化するシステムと方法 | |
JP2015052745A (ja) | 情報処理装置、制御方法、及びプログラム | |
EP1635328B1 (en) | Speech recognition method constrained with a grammar received from a remote system. | |
CN111274828B (zh) | 基于留言的语言翻译方法、系统、计算机程序和手持终端 | |
JP2003202890A (ja) | 音声認識装置及びその方法、プログラム | |
KR101228038B1 (ko) | 무선 단말에서 빠른 타자 수단을 제공하는 시스템, 장치 및방법 | |
CN112256846A (zh) | 一种人机对话交互方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130603 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140605 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150602 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160527 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170601 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180529 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20190530 Year of fee payment: 13 |