KR100586286B1 - 구술 및 명령 구별을 향상하는 방법 - Google Patents
구술 및 명령 구별을 향상하는 방법 Download PDFInfo
- Publication number
- KR100586286B1 KR100586286B1 KR1020037003790A KR20037003790A KR100586286B1 KR 100586286 B1 KR100586286 B1 KR 100586286B1 KR 1020037003790 A KR1020037003790 A KR 1020037003790A KR 20037003790 A KR20037003790 A KR 20037003790A KR 100586286 B1 KR100586286 B1 KR 100586286B1
- Authority
- KR
- South Korea
- Prior art keywords
- text
- user interface
- speech
- peripheral area
- voice
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Abstract
Description
Claims (15)
- 전자 문서 내의 매칭(matching) 텍스트를 검색하는 방법에 있어서,사용자 인터페이스 내의 초점을 식별하는 단계;상기 초점 주위의 주변 영역을 정의하는 단계로서, 상기 주변 영역은 음성 구술된 텍스트를 받도록 구성된 사용자 인터페이스 객체 내의 텍스트의 바디(body)를 포함하고, 상기 텍스트의 바디는 상기 전자 문서내에 포함되어 디스플레이되는 텍스트의 서브 세트인, 상기 주변 영역 정의 단계;상기 전자 문서 내의 특정한 텍스트를 선택하는 음성 명령을 수신하는 단계; 및상기 특정한 텍스트에 대한 매치를 위해 상기 주변 영역 내에 포함된 상기 텍스트의 바디를 검색하는 단계로서, 상기 검색은 상기 주변 영역 내의 상기 텍스트의 바디로 제한되는, 상기 텍스트 바디 검색 단계를 포함하는 매칭 텍스트 검색 방법.
- 제1항에 있어서, 만약 상기 검색 단계에서 상기 텍스트의 바디 내에서 상기 특정한 텍스트에 대한 매치가 발견되지 않는다면, 상기 사용자 인터페이스의 추가적인 영역을 포함하도록 상기 주변 영역을 확장하는 단계로서, 상기 추가적인 영역은 추가적인 텍스트를 포함하는, 상기 주변 영역 확장 단계; 및상기 특정한 텍스트에 대한 매치를 위해 상기 추가적인 텍스트를 검색하는 단계로서, 상기 검색은 상기 텍스트의 바디 및 상기 추가적인 텍스트로 제한되는, 상기 추가적인 텍스트 검색 단계를 더 포함하는 매칭 텍스트 검색 방법.
- 제2항에 있어서, 상기 확장 단계는 고정된 증분만큼 상기 초점으로부터 외측으로 상기 주변 영역을 확장하는 단계를 포함하는, 매칭 텍스트 검색 방법.
- 제2항에 있어서, 상기 확장 단계는 상기 텍스트의 바디에 인접한 텍스트의 고정된 양만큼 상기 주변 영역을 확장하는 단계를 포함하는, 매칭 텍스트 검색 방법.
- 제2항에 있어서, 상기 확장 단계는 가변 증분만큼 상기 초점으로부터 외측으로 상기 주변 영역을 확장하는 단계를 포함하는, 매칭 텍스트 검색 방법.
- 음성 명령의 경우와 음성 구술의 경우 사이를 구별하는 방법에 있어서,사용자 인터페이스 내의 초점을 식별하는 단계;상기 초점 주위의 주변 영역을 정의하는 단계;상기 주변 영역 내의 사용자 인터페이스 객체들을 식별하는 단계;상기 식별된 사용자 인터페이스 객체들 중에서, 음성 구술된 텍스트를 받도록 구성되는 사용자 인터페이스 객체들과, 음성 구술된 텍스트를 받도록 구성되지 않은 사용자 인터페이스 객체들을 더 식별하는 단계;음성 구술된 텍스트를 받도록 구성되는 것으로 더 식별되었던 상기 사용자 인터페이스 객체들과, 음성 구술된 텍스트를 받도록 구성되지 않은 것으로 더 식별되었던 상기 사용자 인터페이스 객체들에 기초하여 확률을 계산하는 단계;음성 입력을 수신하는 단계; 및상기 계산된 확률에 기초하여 상기 음성 입력이 음성 명령인지 혹은 음성 구술인지의 판정을 바이어스하는 단계를 포함하는 구별 방법.
- 제6항에 있어서, 상기 사용자 인터페이스 외측의 초점을 식별하는 단계; 및디폴트 확률에 기초하여 상기 음성 입력이 음성 명령인지 혹은 음성 구술인지의 판정을 바이어스하는 단계를 더 포함하는 구별 방법.
- 전자 문서 내의 매칭 텍스트를 검색하며 기기가 실행 가능한 복수의 코드 섹션들을 구비한 컴퓨터 프로그램이 저장된 컴퓨터가 읽기 가능한 기록매체에 있어서,사용자 인터페이스 내의 초점을 식별하는 단계;상기 초점 주위의 주변 영역을 정의하는 단계로서, 상기 주변 영역은 음성 구술된 텍스트를 받도록 구성되는 사용자 인터페이스 객체 내의 텍스트의 바디를 포함하고, 상기 텍스트의 바디는 상기 전자 문서내에 포함되어 디스플레이되는 텍스트의 서브 세트인, 상기 주변 영역 정의 단계;상기 전자 문서 내의 특정한 텍스트를 선택하는 음성 명령을 수신하는 단계; 및상기 특정한 텍스트에 대한 매치를 위해 상기 주변 영역 내에 포함된 상기 텍스트의 바디를 검색하는 단계로서, 상기 검색은 상기 주변 영역 내의 상기 텍스트의 바디로 제한되는, 상기 텍스트 바디 검색 단계를 포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 제8항에 있어서, 만약 상기 검색 단계에서 상기 텍스트의 바디 내에서 상기 특정한 텍스트에 대한 매치가 발견되지 않는다면, 상기 사용자 인터페이스의 추가적인 영역을 포함하도록 상기 주변 영역을 확장하는 단계로서, 상기 추가적인 영역은 추가적인 텍스트를 포함하는, 상기 주변 영역 확장 단계; 및상기 특정한 텍스트에 대한 매치를 위해 상기 추가적인 텍스트를 검색하는 단계로서, 상기 검색은 상기 텍스트의 바디 및 상기 추가적인 텍스트로 제한되는, 상기 추가적인 텍스트 검색 단계를 더 포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 제9항에 있어서, 상기 확장 단계는 고정된 증분만큼 상기 초점으로부터 외측으로 상기 주변 영역을 확장하는 단계를 포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 제9항에 있어서, 상기 확장 단계는 상기 텍스트의 바디에 인접한 텍스트의 고정된 양만큼 상기 주변 영역을 확장하는 단계를 포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 제9항에 있어서, 상기 확장 단계는 가변 증분만큼 상기 초점으로부터 외측으로 상기 주변 영역을 확장하는 단계를 포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 음성 명령의 경우와 음성 구술의 경우 사이를 구별하며 기기에 의해 실행 가능한 복수의 코드 섹션을 구비하는 컴퓨터 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체에 있어서,사용자 인터페이스 내의 초점을 식별하는 단계;상기 초점 주위의 주변 영역을 정의하는 단계;상기 주변 영역 내의 사용자 인터페이스 객체들을 식별하는 단계;상기 식별된 사용자 인터페이스 객체들 중에서, 음성 구술된 텍스트를 받도록 구성되는 사용자 인터페이스 객체들과, 음성 구술된 텍스트를 받도록 구성되지 않은 사용자 인터페이스 객체들을 더 식별하는 단계;음성 구술된 텍스트를 받도록 구성되는 것으로 더 식별되었던 상기 사용자 인터페이스 객체들과, 음성 구술된 텍스트를 받도록 구성되지 않은 것으로 더 식별되었던 상기 사용자 인터페이스 객체를 기초로 하여 확률을 계산하는 단계;음성 입력을 수신하는 단계; 및상기 계산된 확률에 기초하여 상기 음성 입력이 음성 명령인지 혹은 음성 구술인지의 판정을 바이어스하는 단계를포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 제13항에 있어서, 상기 사용자 인터페이스의 외측의 초점을 식별하는 단계; 및디폴트 확률에 기초하여 상기 음성 입력이 음성 명령인지 혹은 음성 구술인지의 판정을 바이어스하는 단계를 더 포함하는 프로그램이 기록된 컴퓨터가 읽기 가능한 기록 매체.
- 제1항 내지 제7항중 어느 하나의 항에 따른 방법을 수행하는 컴퓨터 프로그램 코드가 기록된 컴퓨터가 읽기 가능한 기록매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/665,939 US6795806B1 (en) | 2000-09-20 | 2000-09-20 | Method for enhancing dictation and command discrimination |
US09/665,939 | 2000-09-20 | ||
PCT/GB2001/004092 WO2002025637A1 (en) | 2000-09-20 | 2001-09-13 | Eye gaze for contextual speech recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030046453A KR20030046453A (ko) | 2003-06-12 |
KR100586286B1 true KR100586286B1 (ko) | 2006-06-07 |
Family
ID=24672168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037003790A KR100586286B1 (ko) | 2000-09-20 | 2001-09-13 | 구술 및 명령 구별을 향상하는 방법 |
Country Status (14)
Country | Link |
---|---|
US (2) | US6795806B1 (ko) |
EP (1) | EP1320848B1 (ko) |
JP (1) | JP3943492B2 (ko) |
KR (1) | KR100586286B1 (ko) |
CN (1) | CN1205602C (ko) |
AT (1) | ATE336779T1 (ko) |
AU (1) | AU2001286090A1 (ko) |
CA (1) | CA2420093A1 (ko) |
DE (1) | DE60122352T2 (ko) |
ES (1) | ES2269449T3 (ko) |
HK (1) | HK1057940A1 (ko) |
IL (1) | IL154852A0 (ko) |
TW (1) | TW521262B (ko) |
WO (1) | WO2002025637A1 (ko) |
Families Citing this family (168)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7225229B1 (en) | 1998-12-18 | 2007-05-29 | Tangis Corporation | Automated pushing of computer user's context data to clients |
US6920616B1 (en) * | 1998-12-18 | 2005-07-19 | Tangis Corporation | Interface for exchanging context data |
US6842877B2 (en) | 1998-12-18 | 2005-01-11 | Tangis Corporation | Contextual responses based on automated learning techniques |
US6791580B1 (en) | 1998-12-18 | 2004-09-14 | Tangis Corporation | Supplying notifications related to supply and consumption of user context data |
US7046263B1 (en) | 1998-12-18 | 2006-05-16 | Tangis Corporation | Requesting computer user's context data |
US8181113B2 (en) | 1998-12-18 | 2012-05-15 | Microsoft Corporation | Mediating conflicts in computer users context data |
US9183306B2 (en) | 1998-12-18 | 2015-11-10 | Microsoft Technology Licensing, Llc | Automated selection of appropriate information based on a computer user's context |
US7231439B1 (en) | 2000-04-02 | 2007-06-12 | Tangis Corporation | Dynamically swapping modules for determining a computer user's context |
US6513046B1 (en) | 1999-12-15 | 2003-01-28 | Tangis Corporation | Storing and recalling information to augment human memories |
US6801223B1 (en) | 1998-12-18 | 2004-10-05 | Tangis Corporation | Managing interactions between computer users' context models |
US7779015B2 (en) * | 1998-12-18 | 2010-08-17 | Microsoft Corporation | Logging and analyzing context attributes |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
WO2001075676A2 (en) | 2000-04-02 | 2001-10-11 | Tangis Corporation | Soliciting information based on a computer user's context |
US7464153B1 (en) | 2000-04-02 | 2008-12-09 | Microsoft Corporation | Generating and supplying user context data |
US20020054130A1 (en) * | 2000-10-16 | 2002-05-09 | Abbott Kenneth H. | Dynamically displaying current status of tasks |
EP1215658A3 (en) * | 2000-12-05 | 2002-08-14 | Hewlett-Packard Company | Visual activation of voice controlled apparatus |
GB2388209C (en) | 2001-12-20 | 2005-08-23 | Canon Kk | Control apparatus |
US7881493B1 (en) * | 2003-04-11 | 2011-02-01 | Eyetools, Inc. | Methods and apparatuses for use of eye interpretation information |
US20040268216A1 (en) * | 2003-06-24 | 2004-12-30 | Jacobs Paul E | Method and apparatus for transferring a document into a folder |
US7629989B2 (en) * | 2004-04-02 | 2009-12-08 | K-Nfb Reading Technology, Inc. | Reducing processing latency in optical character recognition for portable reading machine |
KR100716438B1 (ko) * | 2004-07-27 | 2007-05-10 | 주식회사 현대오토넷 | 차량용 텔레매틱스 시스템에서 음성 사용자 인터페이스를제공하는 장치 및 방법 |
US7580837B2 (en) | 2004-08-12 | 2009-08-25 | At&T Intellectual Property I, L.P. | System and method for targeted tuning module of a speech recognition system |
US7844464B2 (en) * | 2005-07-22 | 2010-11-30 | Multimodal Technologies, Inc. | Content-based audio playback emphasis |
US7242751B2 (en) | 2004-12-06 | 2007-07-10 | Sbc Knowledge Ventures, L.P. | System and method for speech recognition-enabled automatic call routing |
US7751551B2 (en) | 2005-01-10 | 2010-07-06 | At&T Intellectual Property I, L.P. | System and method for speech-enabled call routing |
US7657020B2 (en) | 2005-06-03 | 2010-02-02 | At&T Intellectual Property I, Lp | Call routing system and method of using the same |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
US20070150916A1 (en) * | 2005-12-28 | 2007-06-28 | James Begole | Using sensors to provide feedback on the access of digital content |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8036917B2 (en) * | 2006-11-22 | 2011-10-11 | General Electric Company | Methods and systems for creation of hanging protocols using eye tracking and voice command and control |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8689203B2 (en) * | 2008-02-19 | 2014-04-01 | Microsoft Corporation | Software update techniques based on ascertained identities |
US20090248397A1 (en) * | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US8416715B2 (en) * | 2009-06-15 | 2013-04-09 | Microsoft Corporation | Interest determination for auditory enhancement |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8600732B2 (en) * | 2010-11-08 | 2013-12-03 | Sling Media Pvt Ltd | Translating programming content to match received voice command language |
US20120124467A1 (en) * | 2010-11-15 | 2012-05-17 | Xerox Corporation | Method for automatically generating descriptive headings for a text element |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20120310642A1 (en) * | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
KR101754750B1 (ko) * | 2011-09-08 | 2017-07-10 | 인텔 코포레이션 | 상호작용 스크린 보기를 위한 장치, 매체 및 방법 |
US9691381B2 (en) | 2012-02-21 | 2017-06-27 | Mediatek Inc. | Voice command recognition method and related electronic device and computer-readable medium |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9423870B2 (en) * | 2012-05-08 | 2016-08-23 | Google Inc. | Input determination method |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9443510B2 (en) * | 2012-07-09 | 2016-09-13 | Lg Electronics Inc. | Speech recognition apparatus and method |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9265458B2 (en) | 2012-12-04 | 2016-02-23 | Sync-Think, Inc. | Application of smooth pursuit cognitive testing paradigms to clinical drug development |
CN103885743A (zh) * | 2012-12-24 | 2014-06-25 | 大陆汽车投资(上海)有限公司 | 结合注视跟踪技术的语音文本输入方法和系统 |
US9380976B2 (en) | 2013-03-11 | 2016-07-05 | Sync-Think, Inc. | Optical neuroinformatics |
US9436287B2 (en) * | 2013-03-15 | 2016-09-06 | Qualcomm Incorporated | Systems and methods for switching processing modes using gestures |
KR20140132246A (ko) * | 2013-05-07 | 2014-11-17 | 삼성전자주식회사 | 오브젝트 선택 방법 및 오브젝트 선택 장치 |
US20140350942A1 (en) * | 2013-05-23 | 2014-11-27 | Delphi Technologies, Inc. | Vehicle human machine interface with gaze direction and voice recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN103729059A (zh) * | 2013-12-27 | 2014-04-16 | 北京智谷睿拓技术服务有限公司 | 交互方法及装置 |
US9412363B2 (en) | 2014-03-03 | 2016-08-09 | Microsoft Technology Licensing, Llc | Model based approach for on-screen item selection and disambiguation |
US9966079B2 (en) * | 2014-03-24 | 2018-05-08 | Lenovo (Singapore) Pte. Ltd. | Directing voice input based on eye tracking |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US20150364140A1 (en) * | 2014-06-13 | 2015-12-17 | Sony Corporation | Portable Electronic Equipment and Method of Operating a User Interface |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10317992B2 (en) | 2014-09-25 | 2019-06-11 | Microsoft Technology Licensing, Llc | Eye gaze for spoken language understanding in multi-modal conversational interactions |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
WO2016151396A1 (en) * | 2015-03-20 | 2016-09-29 | The Eye Tribe | Method for refining control by combining eye tracking and voice recognition |
US20170262051A1 (en) * | 2015-03-20 | 2017-09-14 | The Eye Tribe | Method for refining control by combining eye tracking and voice recognition |
FR3034215B1 (fr) * | 2015-03-27 | 2018-06-15 | Valeo Comfort And Driving Assistance | Procede de commande, dispositif de commande, systeme et vehicule automobile comprenant un tel dispositif de commande |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
DE102015210430A1 (de) * | 2015-06-08 | 2016-12-08 | Robert Bosch Gmbh | Verfahren zum Erkennen eines Sprachkontexts für eine Sprachsteuerung, Verfahren zum Ermitteln eines Sprachsteuersignals für eine Sprachsteuerung und Vorrichtung zum Ausführen der Verfahren |
JP6553418B2 (ja) * | 2015-06-12 | 2019-07-31 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 表示制御方法、表示制御装置及び制御プログラム |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9934782B2 (en) * | 2015-09-22 | 2018-04-03 | Meshrose Ltd. | Automatic performance of user interaction operations on a computing device |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US9886958B2 (en) | 2015-12-11 | 2018-02-06 | Microsoft Technology Licensing, Llc | Language and domain independent model based approach for on-screen item selection |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US20170345410A1 (en) * | 2016-05-26 | 2017-11-30 | Tyler Murray Smith | Text to speech system with real-time amendment capability |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10223067B2 (en) | 2016-07-15 | 2019-03-05 | Microsoft Technology Licensing, Llc | Leveraging environmental context for enhanced communication throughput |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
CN106527729A (zh) * | 2016-11-17 | 2017-03-22 | 科大讯飞股份有限公司 | 非接触式输入方法和装置 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10142686B2 (en) * | 2017-03-30 | 2018-11-27 | Rovi Guides, Inc. | System and methods for disambiguating an ambiguous entity in a search query based on the gaze of a user |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10366691B2 (en) * | 2017-07-11 | 2019-07-30 | Samsung Electronics Co., Ltd. | System and method for voice command context |
US10795671B2 (en) * | 2017-11-21 | 2020-10-06 | International Business Machines Corporation | Audiovisual source code documentation |
CN107957779A (zh) * | 2017-11-27 | 2018-04-24 | 海尔优家智能科技(北京)有限公司 | 一种利用眼部动作控制信息搜索的方法及装置 |
WO2019118089A1 (en) | 2017-12-11 | 2019-06-20 | Analog Devices, Inc. | Multi-modal far field user interfaces and vision-assisted audio processing |
US10657954B2 (en) * | 2018-02-20 | 2020-05-19 | Dropbox, Inc. | Meeting audio capture and transcription in a collaborative document context |
US11488602B2 (en) | 2018-02-20 | 2022-11-01 | Dropbox, Inc. | Meeting transcription using custom lexicons based on document history |
US10467335B2 (en) | 2018-02-20 | 2019-11-05 | Dropbox, Inc. | Automated outline generation of captured meeting audio in a collaborative document context |
US11157075B2 (en) * | 2018-05-01 | 2021-10-26 | Dell Products, L.P. | Gaze-activated voice services for interactive workspaces |
CN111833846B (zh) * | 2019-04-12 | 2023-06-02 | 广东小天才科技有限公司 | 一种根据意图启动听写状态的方法和装置,及存储介质 |
US11689379B2 (en) | 2019-06-24 | 2023-06-27 | Dropbox, Inc. | Generating customized meeting insights based on user interactions and meeting media |
CN111090473A (zh) * | 2019-07-29 | 2020-05-01 | 广东小天才科技有限公司 | 一种基于电子设备的听写启动方法及电子设备 |
WO2021230048A1 (ja) * | 2020-05-15 | 2021-11-18 | 株式会社Nttドコモ | 情報処理システム |
US20230065847A1 (en) * | 2021-08-31 | 2023-03-02 | International Business Machines Corporation | Network bandwidth conservation during video conferencing |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3530591B2 (ja) | 1994-09-14 | 2004-05-24 | キヤノン株式会社 | 音声認識装置及びこれを用いた情報処理装置とそれらの方法 |
US5777614A (en) * | 1994-10-14 | 1998-07-07 | Hitachi, Ltd. | Editing support system including an interactive interface |
EP0718823B1 (de) | 1994-12-23 | 2000-09-20 | Siemens Aktiengesellschaft | Verfahren zur Umwandlung von sprachlich eingegebenen Informationen in maschinenlesbare Daten |
US5799279A (en) | 1995-11-13 | 1998-08-25 | Dragon Systems, Inc. | Continuous speech recognition of text and commands |
US6078310A (en) * | 1996-06-26 | 2000-06-20 | Sun Microsystems, Inc. | Eyetracked alert messages |
US6351273B1 (en) * | 1997-04-30 | 2002-02-26 | Jerome H. Lemelson | System and methods for controlling automatic scrolling of information on a display or screen |
US6393136B1 (en) * | 1999-01-04 | 2002-05-21 | International Business Machines Corporation | Method and apparatus for determining eye contact |
ES2231448T3 (es) | 2000-01-27 | 2005-05-16 | Siemens Aktiengesellschaft | Sistema y procedimiento para el procesamiento de voz enfocado a la vision. |
-
2000
- 2000-09-20 US US09/665,939 patent/US6795806B1/en not_active Expired - Lifetime
-
2001
- 2001-08-14 TW TW90119955A patent/TW521262B/zh not_active IP Right Cessation
- 2001-09-13 JP JP2002529757A patent/JP3943492B2/ja not_active Expired - Lifetime
- 2001-09-13 CA CA 2420093 patent/CA2420093A1/en not_active Abandoned
- 2001-09-13 WO PCT/GB2001/004092 patent/WO2002025637A1/en active IP Right Grant
- 2001-09-13 IL IL15485201A patent/IL154852A0/xx unknown
- 2001-09-13 AT AT01965449T patent/ATE336779T1/de not_active IP Right Cessation
- 2001-09-13 KR KR1020037003790A patent/KR100586286B1/ko not_active IP Right Cessation
- 2001-09-13 EP EP01965449A patent/EP1320848B1/en not_active Expired - Lifetime
- 2001-09-13 CN CNB018146899A patent/CN1205602C/zh not_active Expired - Lifetime
- 2001-09-13 ES ES01965449T patent/ES2269449T3/es not_active Expired - Lifetime
- 2001-09-13 DE DE2001622352 patent/DE60122352T2/de not_active Expired - Lifetime
- 2001-09-13 AU AU2001286090A patent/AU2001286090A1/en not_active Abandoned
-
2004
- 2004-01-31 HK HK04100682A patent/HK1057940A1/xx not_active IP Right Cessation
- 2004-05-20 US US10/849,663 patent/US20040216049A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CN1205602C (zh) | 2005-06-08 |
ATE336779T1 (de) | 2006-09-15 |
DE60122352D1 (de) | 2006-09-28 |
JP2004510239A (ja) | 2004-04-02 |
WO2002025637A1 (en) | 2002-03-28 |
JP3943492B2 (ja) | 2007-07-11 |
CA2420093A1 (en) | 2002-03-28 |
ES2269449T3 (es) | 2007-04-01 |
TW521262B (en) | 2003-02-21 |
DE60122352T2 (de) | 2007-09-06 |
US20040216049A1 (en) | 2004-10-28 |
US6795806B1 (en) | 2004-09-21 |
IL154852A0 (en) | 2003-10-31 |
CN1449558A (zh) | 2003-10-15 |
KR20030046453A (ko) | 2003-06-12 |
EP1320848A1 (en) | 2003-06-25 |
AU2001286090A1 (en) | 2002-04-02 |
HK1057940A1 (en) | 2004-04-23 |
EP1320848B1 (en) | 2006-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100586286B1 (ko) | 구술 및 명령 구별을 향상하는 방법 | |
US7720683B1 (en) | Method and apparatus of specifying and performing speech recognition operations | |
EP2261893B1 (en) | Audio playback for text edition in a speech recognition system | |
JP4570176B2 (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
JP4444396B2 (ja) | 音声認識におけるポジション操作 | |
US5950160A (en) | Method and system for displaying a variable number of alternative words during speech recognition | |
JP3414735B2 (ja) | 複合ワードを有する言語のための音声認識装置 | |
US6314397B1 (en) | Method and apparatus for propagating corrections in speech recognition software | |
EP0840288B1 (en) | Method and system for editing phrases during continuous speech recognition | |
EP0867857A2 (en) | Enrolment in speech recognition | |
US5787231A (en) | Method and system for improving pronunciation in a voice control system | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
CN104715005B (zh) | 信息处理设备以及方法 | |
US6591236B2 (en) | Method and system for determining available and alternative speech commands | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
JP4634156B2 (ja) | 音声対話方法および音声対話装置 | |
EP1316944B1 (en) | Sound signal recognition system and method, and dialog control system and method using it | |
KR102392992B1 (ko) | 음성 인식 기능을 활성화시키는 호출 명령어 설정에 관한 사용자 인터페이싱 장치 및 방법 | |
KR101830210B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
KR101704501B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
JP6221267B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP2000010588A (ja) | 音声認識方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130502 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140508 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150430 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160427 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170517 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180516 Year of fee payment: 13 |
|
LAPS | Lapse due to unpaid annual fee |