KR100668297B1 - 음성인식방법 및 장치 - Google Patents
음성인식방법 및 장치 Download PDFInfo
- Publication number
- KR100668297B1 KR100668297B1 KR1020020087943A KR20020087943A KR100668297B1 KR 100668297 B1 KR100668297 B1 KR 100668297B1 KR 1020020087943 A KR1020020087943 A KR 1020020087943A KR 20020087943 A KR20020087943 A KR 20020087943A KR 100668297 B1 KR100668297 B1 KR 100668297B1
- Authority
- KR
- South Korea
- Prior art keywords
- alternative
- recognition
- word
- user
- selection
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000008859 change Effects 0.000 claims abstract description 45
- 238000012805 post-processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 abstract description 15
- 238000005516 engineering process Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
Description
인식결과 | 스코어 |
황길두 | 10 |
홍기수 | 9 |
홍길동 | 8 |
인식결과 | 스코어 |
황길두 | 10 |
홍길동 | 9.2 |
홍기수 | 9 |
대안의 제시방식 | 90% 인식환경 | 70% 인식환경 | ||||||
부가작업 0회 | 부가작업 1회 | 부가작업 2회 | 계 | 부가작업 0회 | 부가작업 1회 | 부가작업 2회 | 계 | |
기존방식1 | 90% | 0% | 0% | 90% | 70% | 0% | 0% | 70% |
기존방식2 | 0% | 90% | 0% | 90% | 0% | 70% | 0% | 70% |
기존방식3 | 0% | 99.9% | 0% | 99.9% | 0% | 97.3% | 0% | 97.3% |
본 발명 | 90% | 9% | 0.9% | 99.9% | 70% | 21% | 6.3% | 97.3% |
그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
Claims (27)
- (a) 사용자가 발화한 음성을 입력하는 단계;(b) 상기 입력되는 음성을 인식하여 유사도 순서에 따라 소정 갯수의 인식단어를 생성하는 단계;(c) 상기 소정 갯수의 인식단어가 소정의 순서에 따라서 나열된 대안목록을 디스플레이시키는 단계;(d) 상기 디스플레이된 대안목록에 대하여 소정의 대기시간동안 사용자의 선택변경이 있는지를 판단하는 단계;(e) 상기 대기시간동안 상기 사용자의 선택변경이 없는 경우 현재 커서가 위치한 대안단어를 최종 인식단어로 결정하는 단계; 및(f) 상기 사용자의 숙련도에 따라 상기 대기시간을 재조정하는 단계를 포함하는 음성인식방법.
- 제1 항에 있어서, 상기 방법은(g) 상기 소정의 대기시간동안 사용자의 선택변경이 있는 경우, 상기 대기시간을 재조정하는 단계를 더 포함하는 음성인식방법.
- 제1 항에 있어서, 상기 방법은(g) 상기 소정의 대기시간동안 사용자의 선택변경이 있는 경우, 사용자가 선택한 대안단어를 최종 인식단어로 결정하는 단계를 더 포함하는 음성인식방법.
- 제1 항 내지 제3 항 중 어느 한 항에 있어서, 상기 (c) 단계는(c1) 상기 음성인식결과에 따른 첫 번째대안 인식단어와 최종 인식단어의 조합을 이용하여 오류패턴을 업데이트시키는 단계; 및(c2) 상기 오류패턴을 이용하여 상기 대안목록의 나열순서를 재조정하는 단계를 더 포함하는 음성인식방법.
- 제4 항에 있어서, 상기 (c1) 단계는(c11) 상기 음성인식결과에 따른 첫 번째대안 인식단어와 최종 인식단어의 조합이 소정의 오류패턴 데이터베이스에 포함되어 있는 경우 적어도 하나의 발화특징 차이값을 산출하는 단계;(c12) 상기 (c11) 단계에서 얻어진 발화특징 차이값과 소정의 제1 문턱치를 비교하는 단계; 및(c13) 상기 (c12) 단계에서의 비교결과, 상기 발화특징 차이값이 제1 문턱치보다 작은 경우 현재 입력된 음성의 발화특징을 포함하여 각 발화특징의 평균치를 산출하여 발화성향을 업데이트시키고, 해당 패턴의 히스토리의 값을 1 증가시켜 히스토리를 업데이트시키는 단계를 포함하는 음성인식방법.
- 제4 항에 있어서, 상기 (c2) 단계는(c21) 상기 음성인식결과에 따른 첫 번째대안 단어와 두 번째대안 단어의 조합과 첫 번째대안 단어와 세 번째대안 단어의 조합 중 적어도 하나가 소정의 오류패턴 데이터베이스에 포함되어 있는 경우, 각 조합에 대하여 적어도 하나의 발화특징 차이값을 산출하는 단계;(c22) 상기 (c21) 단계에서 얻어진 각 조합의 발화특징 차이값을 소정의 제2 문턱치와 비교하는 단계; 및(c23) 상기 (c22) 단계에서의 비교결과, 각 조합의 상기 발화특징 차이값이 제2 문턱치보다 작은 경우, 해당 조합에 포함된 대안 단어의 스코어를 수정하는 단계를 포함하는 음성인식방법.
- 제6 항에 있어서, 상기 수정된 스코어는 원래의 스코어에 소정의 가중치와 해당 패턴의 히스토리를 곱한 값을 더함으로써 산출되는 음성인식방법.
- 삭제
- 제1 항에 있어서, 상기 (f) 단계는(f1) 소정의 숙련도 데이터베이스에 저장된 소정 선택시간에서 현재의 최종인식단어 결정에 소요된 시간을 뺀 값으로 선택시간 차이값을 산출하는 단계;(f2) 상기 (f1) 단계에서 얻어진 선택시간 차이값을 소정의 제3 문턱치와 비교하는 단계;(f3) 상기 (f2) 단계에서의 비교결과, 선택시간 차이값이 제3 문턱치보다 큰 경우 선택시간을 수정하는 단계;(f4) 상기 (f2) 단계에서의 비교결과, 선택시간 차이값이 제3 문턱치보다 작거나 같은 경우 선택시간 차이값을 소정의 여유시간과 비교하는 단계;(f5) 상기 (f4) 단계에서의 비교결과, 선택시간 차이값이 여유시간보다 작은 경우 선택시간을 수정하는 단계; 및(f6) 상기 (f3) 단계 또는 상기 (f5) 단계에서 수정된 선택시간에 소정의 여유시간을 가산함으로써 사용자의 대기시간을 산출하는 단계를 포함하는 음성인식방법.
- 제9 항에 있어서, 상기 (f3) 단계에서는 상기 숙련도 데이터베이스에 저장되어 있던 선택시간에서 선택시간 차이값에 소정의 가중치를 곱한 값을 감산함으로써 수정된 선택시간을 산출하는 음성인식방법.
- 제9 항에 있어서, 상기 (f5) 단계에서는 상기 숙련도 데이터베이스에 저장되어 있던 선택시간에 소정의 부가시간을 가산함으로써 수정된 선택시간을 산출하는 음성인식방법.
- 제1 항 내지 제3 항 중 어느 한 항에 있어서, 상기 대기시간은 상기 대안목록에 나열된 모든 대안단어에 대하여 동일한 값으로 부여되는 음성인식방법.
- 제1 항 내지 제3 항 중 어느 한 항에 있어서, 상기 대기시간은 상기 대안목록에 나열된 대안단어의 순서에 따라서 차등적인 값으로 부여되는 음성인식방법.
- 사용자가 발화한 음성을 입력하고, 상기 입력되는 음성을 인식하여 유사도 순서에 따라 소정 갯수의 인식단어를 생성하고, 상기 소정 갯수의 인식단어가 소정의 순서에 따라서 나열된 대안목록을 디스플레이하고, 상기 음성인식결과에 따른 첫 번째대안 인식단어와 최종 인식단어의 조합을 이용하여 오류패턴을 업데이트시키고, 상기 오류패턴을 이용하여 상기 대안목록의 나열순서를 재조정하는 제1 프로그램; 및소정의 대기시간동안 상기 디스플레이된 대안목록에 대한 사용자의 선택변경이 있는지를 판단하고, 상기 소정의 대기시간동안 사용자의 선택변경이 없는 경우, 상기 대안목록 중 현재 커서가 위치한 대안단어를 최종 인식단어로 결정하는 제2 프로그램을 기록한 컴퓨터가 읽을 수 있는 기록매체.
- 제14 항에 있어서, 상기 제2 프로그램은 상기 소정의 대기시간동안 사용자의 선택변경이 있는 경우 상기 대기시간을 재조정한 다음, 재조정된 대기시간동안 재차 사용자의 선택변경이 있는지를 판단하여 사용자의 선택변경이 없는 경우 사용자가 선택한 대안단어를 최종 인식단어로 결정하는 기능을 더 구비하는 컴퓨터가 읽을 수 있는 기록매체.
- 제14 항에 있어서, 상기 제2 프로그램은 상기 소정의 대기시간동안 사용자의 선택변경이 있는 경우, 사용자가 선택한 대안단어를 최종 인식단어로 결정하는 기능을 더 구비하는 컴퓨터가 읽을 수 있는 기록매체.
- 사용자가 발화한 음성을 입력하는 음성입력부;상기 입력되는 음성을 인식하여 유사도 순서에 따라 소정 갯수의 인식단어를 생성하는 음성인식부; 및상기 소정 갯수의 인식단어가 소정의 순서에 따라서 나열된 대안목록을 디스플레이시키고, 상기 디스플레이된 대안목록에 대하여 소정의 대기시간동안 사용자의 선택변경이 있는지를 판단하여 상기 대기시간동안 사용자의 선택변경이 없는 경우 현재 커서가 위치한 대안단어를 최종 인식단어로 결정하고, 상기 음성인식결과에 따른 첫 번째대안 인식단어와 최종 인식단어의 조합을 이용하여 오류패턴을 업데이트시키고, 상기 업데이트된 오류패턴을 이용하여 상기 대안목록의 나열순서를 재조정하는 후처리부를 포함하는 음성인식장치.
- 제17 항에 있어서, 상기 후처리부는상기 음성인식부에서 생성된 소정 갯수의 인식단어를 소정의 순서에 따라서 나열된 대안목록이 포함된 그래픽 사용자 인터페이스용 윈도우를 생성하는 윈도우 생성부;상기 그래픽 사용자 인터페이스용 윈도우가 디스플레이된 후 현재 커서가 이동되어 있는 대안단어를 최종 인식단어로 결정하기까지의 대기시간을 설정하는 대기시간 설정부; 및소정의 대기시간동안 상기 디스플레이된 대안목록에 대한 사용자의 선택변경이 없는 경우, 상기 대안목록 중 현재 커서가 위치한 첫번째 대안단어를 최종 인식단어로 결정하고, 상기 소정의 대기시간동안 사용자의 선택변경이 있는 경우, 상기 대기시간을 재조정하여 재조정된 대기시간동안 재차 사용자의 선택변경이 없는 경우 사용자가 선택한 대안단어를 최종 인식단어로 결정하는 최종 인식단어 결정부를 구비하는 음성인식장치.
- 제17 항에 있어서, 상기 후처리부는상기 음성인식부에서 생성된 소정 갯수의 인식단어를 소정의 순서에 따라서 나열된 대안목록이 포함된 그래픽 사용자 인터페이스용 윈도우를 생성하는 윈도우 생성부;상기 그래픽 사용자 인터페이스용 윈도우가 디스플레이된 후 현재 커서가 이동되어 있는 대안단어를 최종 인식단어로 결정하기까지의 대기시간을 설정하는 대기시간 설정부; 및소정의 대기시간동안 상기 디스플레이된 대안목록에 대한 사용자의 선택변경이 없는 경우, 상기 대안목록 중 현재 커서가 위치한 첫번째 대안단어를 최종 인식단어로 결정하고, 상기 소정의 대기시간동안 사용자의 선택변경이 있는 경우, 사용자가 선택한 대안단어를 최종 인식단어로 결정하는 최종 인식단어 결정부를 구비하는 음성인식장치.
- 제18 항 또는 제19 항에 있어서, 상기 후처리부는상기 음성인식부에서 첫번째 대안으로 채택되었던 인식단어, 상기 최종 인식단어 결정부로부터 제공되는 최종인식단어, 적어도 하나 이상의 사용자 발화특징, 발화성향, 및 히스토리를 데이터베이스화한 오류패턴 데이터베이스; 및상기 음성인식부로부터 제공되는 음성인식결과 및 스코어를 입력으로 하고, 상기 오류패턴 데이터베이스를 참조하여 상기 오류패턴에 해당하는 인식단어의 스코어를 조정하고, 상기 대안목록의 나열순서를 변경하여 상기 윈도우 생성부로 제공하는 오류패턴 관리부를 더 포함하는 음성인식장치.
- 제18 항 또는 제19 항에 있어서, 상기 후처리부는숙련도에 따라서 서로 다른 선택시간을 대응시켜 데이터베이스화한 숙련도 데이터베이스; 및상기 숙련도 데이터베이스에 저장된 숙련도에 따른 선택시간에 소정의 여유시간을 부가한 값을 대기시간으로 재조정하여 상기 대기시간 설정부로 공급하는 숙련도 관리부를 더 포함하는 음성인식장치.
- 제20 항에 있어서, 상기 후처리부는숙련도에 따라서 서로 다른 선택시간을 대응시켜 데이터베이스화한 숙련도 데이터베이스; 및상기 숙련도 데이터베이스에 저장된 숙련도에 따른 선택시간에 소정의 여유시간을 부가한 값을 대기시간으로 재조정하여 상기 대기시간 설정부로 공급하는 숙련도 관리부를 더 포함하는 음성인식장치.
- 제18 항 또는 제19 항에 있어서, 상기 대기시간은 사용자의 숙련도에 따라 결정되는 음성인식장치.
- 제18 항에 있어서, 상기 재조정된 대기시간은 상기 대안목록에 나열된 모든 대안단어에 대하여 동일한 값으로 부여되는 음성인식장치.
- 제18 항에 있어서, 상기 재조정된 대기시간은 상기 대안목록에 나열된 대안단어의 순서에 따라서 차등적인 값으로 부여되는 음성인식장치.
- (a) 사용자가 발화한 음성을 입력하는 단계;(b) 상기 입력되는 음성을 인식하여 유사도 순서에 따라 소정 갯수의 인식단어를 생성하는 단계;(c) 상기 음성인식결과에 따른 첫 번째대안 인식단어와 최종 인식단어의 조합을 이용하여 업데이트되는 오류패턴에 기초하여 조정되는 순서에 따라서, 상기 소정 갯수의 인식단어들이 나열된 대안목록을 디스플레이시키는 단계; 및(d) 상기 디스플레이된 대안목록에 대한 사용자의 선택에 따라서 최종 인식단어를 결정하는 단계를 포함하는 음성인식방법.
- (a) 사용자가 발화한 음성을 입력하는 단계;(b) 상기 입력되는 음성을 인식하여 유사도 순서에 따라 소정 갯수의 인식단어를 생성하는 단계;(c) 상기 음성인식결과에 따른 첫 번째대안 인식단어와 최종 인식단어의 조합을 이용하여 업데이트되는 오류패턴에 기초하여 조정되는 순서에 따라서, 상기 소정 갯수의 인식단어들이 나열된 대안목록을 디스플레이시키는 단계;(d) 상기 디스플레이된 대안목록에 대하여 소정의 대기시간동안 사용자의 선택변경이 있는지를 판단하는 단계; 및(e) 상기 대기시간동안 사용자의 선택변경이 없는 경우 현재 커서가 위치한 대안단어를 최종 인식단어로 결정하는 단계를 포함하는 음성인식방법.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020087943A KR100668297B1 (ko) | 2002-12-31 | 2002-12-31 | 음성인식방법 및 장치 |
EP03258236A EP1435605B1 (en) | 2002-12-31 | 2003-12-30 | Method and apparatus for speech recognition |
DE60309822T DE60309822T2 (de) | 2002-12-31 | 2003-12-30 | Verfahren und Vorrichtung zur Spracherkennung |
US10/748,105 US7680658B2 (en) | 2002-12-31 | 2003-12-31 | Method and apparatus for speech recognition |
JP2004000411A JP4643911B2 (ja) | 2002-12-31 | 2004-01-05 | 音声認識方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020087943A KR100668297B1 (ko) | 2002-12-31 | 2002-12-31 | 음성인식방법 및 장치 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060099068A Division KR20060109865A (ko) | 2006-10-11 | 2006-10-11 | 음성인식방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040061659A KR20040061659A (ko) | 2004-07-07 |
KR100668297B1 true KR100668297B1 (ko) | 2007-01-12 |
Family
ID=32501464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020020087943A KR100668297B1 (ko) | 2002-12-31 | 2002-12-31 | 음성인식방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7680658B2 (ko) |
EP (1) | EP1435605B1 (ko) |
JP (1) | JP4643911B2 (ko) |
KR (1) | KR100668297B1 (ko) |
DE (1) | DE60309822T2 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10140974B2 (en) | 2014-12-29 | 2018-11-27 | Samsung Electronics Co., Ltd. | Method and apparatus for speech recognition |
US11567367B2 (en) | 2017-08-01 | 2023-01-31 | Samsung Display Co., Ltd. | Color conversion panel and display device including the same |
Families Citing this family (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7346509B2 (en) * | 2002-09-27 | 2008-03-18 | Callminer, Inc. | Software for statistical analysis of speech |
CN1993732A (zh) * | 2004-08-06 | 2007-07-04 | 皇家飞利浦电子股份有限公司 | 用于与用户执行对话通信的系统的方法 |
US8725505B2 (en) * | 2004-10-22 | 2014-05-13 | Microsoft Corporation | Verb error recovery in speech recognition |
JP2006201749A (ja) * | 2004-12-21 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声による選択装置、及び選択方法 |
US7590536B2 (en) * | 2005-10-07 | 2009-09-15 | Nuance Communications, Inc. | Voice language model adjustment based on user affinity |
US7941316B2 (en) * | 2005-10-28 | 2011-05-10 | Microsoft Corporation | Combined speech and alternate input modality to a mobile device |
US7831425B2 (en) * | 2005-12-15 | 2010-11-09 | Microsoft Corporation | Time-anchored posterior indexing of speech |
KR100717385B1 (ko) * | 2006-02-09 | 2007-05-11 | 삼성전자주식회사 | 인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템 |
US7580377B2 (en) * | 2006-02-16 | 2009-08-25 | Honeywell International Inc. | Systems and method of datalink auditory communications for air traffic control |
JP2007286356A (ja) * | 2006-04-17 | 2007-11-01 | Funai Electric Co Ltd | 電子機器 |
JP2007293595A (ja) * | 2006-04-25 | 2007-11-08 | Canon Inc | 情報処理装置及び情報処理方法 |
US20080091426A1 (en) * | 2006-10-12 | 2008-04-17 | Rod Rempel | Adaptive context for automatic speech recognition systems |
US8355913B2 (en) | 2006-11-03 | 2013-01-15 | Nokia Corporation | Speech recognition with adjustable timeout period |
US20080114597A1 (en) * | 2006-11-14 | 2008-05-15 | Evgeny Karpov | Method and apparatus |
KR101422020B1 (ko) * | 2007-11-27 | 2014-07-23 | 엘지전자 주식회사 | 음성 인식 방법 및 장치 |
US8468019B2 (en) * | 2008-01-31 | 2013-06-18 | Qnx Software Systems Limited | Adaptive noise modeling speech recognition system |
DE102008021954A1 (de) * | 2008-02-29 | 2009-09-03 | Navigon Ag | Verfahren zum Betrieb eines elektronischen Assistenzsystems |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
DE102009025530B4 (de) | 2009-06-19 | 2019-05-23 | Volkswagen Ag | Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug |
KR20110010939A (ko) * | 2009-07-27 | 2011-02-08 | 삼성전자주식회사 | 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법 |
DE102009058151B4 (de) | 2009-12-12 | 2020-08-20 | Volkswagen Ag | Verfahren zum Betreiben eines Sprachdialogsystems mit semantischer Bewertung und Sprachdialogsystem dazu |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US20110184736A1 (en) * | 2010-01-26 | 2011-07-28 | Benjamin Slotznick | Automated method of recognizing inputted information items and selecting information items |
JP2011232668A (ja) * | 2010-04-30 | 2011-11-17 | Clarion Co Ltd | 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法 |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
KR101897492B1 (ko) * | 2011-06-07 | 2018-09-13 | 삼성전자주식회사 | 디스플레이 장치 및 이의 하이퍼링크 실행 방법 및 음성 인식 방법 |
DE102011106271B4 (de) * | 2011-07-01 | 2013-05-08 | Volkswagen Aktiengesellschaft | Verfahren und Vorrichtung zum Bereitstellen einer Sprachschnittstelle, insbesondere in einem Fahrzeug |
US8825493B2 (en) * | 2011-07-18 | 2014-09-02 | At&T Intellectual Property I, L.P. | Method and apparatus for social network communication over a media network |
CN102323858B (zh) * | 2011-08-29 | 2016-04-13 | 上海量明科技发展有限公司 | 识别输入时修改项的输入方法、终端及系统 |
US20130132079A1 (en) * | 2011-11-17 | 2013-05-23 | Microsoft Corporation | Interactive speech recognition |
KR101732137B1 (ko) * | 2013-01-07 | 2017-05-02 | 삼성전자주식회사 | 원격 제어 장치 및 전력 제어 방법 |
KR102057284B1 (ko) | 2013-01-23 | 2020-01-22 | 엘지전자 주식회사 | 전자 기기 및 전자 기기의 제어 방법 |
US10055681B2 (en) * | 2013-10-31 | 2018-08-21 | Verint Americas Inc. | Mapping actions and objects to tasks |
WO2015105994A1 (en) | 2014-01-08 | 2015-07-16 | Callminer, Inc. | Real-time conversational analytics facility |
KR102396983B1 (ko) | 2015-01-02 | 2022-05-12 | 삼성전자주식회사 | 문법 교정 방법 및 장치 |
EP3089159B1 (en) | 2015-04-28 | 2019-08-28 | Google LLC | Correcting voice recognition using selective re-speak |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10743101B2 (en) | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
JP2018116206A (ja) * | 2017-01-20 | 2018-07-26 | アルパイン株式会社 | 音声認識装置、音声認識方法及び音声認識システム |
KR102391298B1 (ko) * | 2017-04-24 | 2022-04-28 | 삼성전자주식회사 | 음성 인식 서비스를 제공하는 전자 장치 및 그 방법 |
KR102406718B1 (ko) | 2017-07-19 | 2022-06-10 | 삼성전자주식회사 | 컨텍스트 정보에 기반하여 음성 입력을 수신하는 지속 기간을 결정하는 전자 장치 및 시스템 |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
KR102550932B1 (ko) | 2017-12-29 | 2023-07-04 | 삼성전자주식회사 | 음성 인식 모델의 개인화 방법 및 장치 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) * | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
CN110347996B (zh) * | 2019-07-15 | 2023-06-20 | 北京百度网讯科技有限公司 | 文字的修改方法、装置、电子设备及存储介质 |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
CN111028830B (zh) * | 2019-12-26 | 2022-07-15 | 大众问问(北京)信息科技有限公司 | 一种本地热词库更新方法、装置及设备 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
KR102309505B1 (ko) * | 2021-02-10 | 2021-10-06 | 김재성 | 음성인식 및 인공지능의 학습을 이용한 개인별 맞춤형 보완대체 의사소통 장치 및 그 방법 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US486678A (en) * | 1892-11-22 | Child s carriage | ||
US4866778A (en) * | 1986-08-11 | 1989-09-12 | Dragon Systems, Inc. | Interactive speech recognition apparatus |
US5027406A (en) | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5329609A (en) * | 1990-07-31 | 1994-07-12 | Fujitsu Limited | Recognition apparatus with function of displaying plural recognition candidates |
JPH0535293A (ja) * | 1991-08-01 | 1993-02-12 | Fujitsu Ltd | 音声認識装置における認識候補数設定方式 |
GB2292500A (en) * | 1994-08-19 | 1996-02-21 | Ibm | Voice response system |
JPH0950291A (ja) * | 1995-08-04 | 1997-02-18 | Sony Corp | 音声認識装置及びナビゲーシヨン装置 |
US5754176A (en) * | 1995-10-02 | 1998-05-19 | Ast Research, Inc. | Pop-up help system for a computer graphical user interface |
JPH1091309A (ja) * | 1996-09-12 | 1998-04-10 | Toshiba Corp | 情報入出力装置及び情報入出力方法 |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
US5884258A (en) | 1996-10-31 | 1999-03-16 | Microsoft Corporation | Method and system for editing phrases during continuous speech recognition |
US5864805A (en) * | 1996-12-20 | 1999-01-26 | International Business Machines Corporation | Method and apparatus for error correction in a continuous dictation system |
US5909667A (en) * | 1997-03-05 | 1999-06-01 | International Business Machines Corporation | Method and apparatus for fast voice selection of error words in dictated text |
US6233560B1 (en) | 1998-12-16 | 2001-05-15 | International Business Machines Corporation | Method and apparatus for presenting proximal feedback in voice command systems |
US6314397B1 (en) | 1999-04-13 | 2001-11-06 | International Business Machines Corp. | Method and apparatus for propagating corrections in speech recognition software |
JP2000348141A (ja) * | 1999-06-08 | 2000-12-15 | Toshiba Corp | 入力情報の予測方法と装置、ならびにプログラム記憶媒体 |
US6347296B1 (en) | 1999-06-23 | 2002-02-12 | International Business Machines Corp. | Correcting speech recognition without first presenting alternatives |
AU2001241966A1 (en) * | 2000-03-06 | 2001-10-15 | Conita Technologies, Inc. | Personal virtual assistant |
KR100330504B1 (ko) | 2000-04-29 | 2002-04-03 | 정명식 | 위치 지시자 자동 이동 제어 방법 |
JP5093966B2 (ja) * | 2001-03-29 | 2012-12-12 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 編集中における音声カーソルとテキストカーソルの位置合わせ |
US6839667B2 (en) * | 2001-05-16 | 2005-01-04 | International Business Machines Corporation | Method of speech recognition by presenting N-best word candidates |
US20030191629A1 (en) * | 2002-02-04 | 2003-10-09 | Shinichi Yoshizawa | Interface apparatus and task control method for assisting in the operation of a device using recognition technology |
-
2002
- 2002-12-31 KR KR1020020087943A patent/KR100668297B1/ko active IP Right Grant
-
2003
- 2003-12-30 EP EP03258236A patent/EP1435605B1/en not_active Expired - Fee Related
- 2003-12-30 DE DE60309822T patent/DE60309822T2/de not_active Expired - Lifetime
- 2003-12-31 US US10/748,105 patent/US7680658B2/en not_active Expired - Fee Related
-
2004
- 2004-01-05 JP JP2004000411A patent/JP4643911B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10140974B2 (en) | 2014-12-29 | 2018-11-27 | Samsung Electronics Co., Ltd. | Method and apparatus for speech recognition |
US11567367B2 (en) | 2017-08-01 | 2023-01-31 | Samsung Display Co., Ltd. | Color conversion panel and display device including the same |
Also Published As
Publication number | Publication date |
---|---|
US20040153321A1 (en) | 2004-08-05 |
EP1435605A2 (en) | 2004-07-07 |
DE60309822T2 (de) | 2007-10-11 |
JP4643911B2 (ja) | 2011-03-02 |
JP2004213016A (ja) | 2004-07-29 |
KR20040061659A (ko) | 2004-07-07 |
EP1435605B1 (en) | 2006-11-22 |
DE60309822D1 (de) | 2007-01-04 |
EP1435605A3 (en) | 2005-05-04 |
US7680658B2 (en) | 2010-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100668297B1 (ko) | 음성인식방법 및 장치 | |
US7848926B2 (en) | System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words | |
US7386454B2 (en) | Natural error handling in speech recognition | |
CN105283914B (zh) | 用于识别语音的系统和方法 | |
US5995928A (en) | Method and apparatus for continuous spelling speech recognition with early identification | |
US5027406A (en) | Method for interactive speech recognition and training | |
CN1280782C (zh) | 给用户提供声音反馈的可扩展语音识别系统 | |
US6363347B1 (en) | Method and system for displaying a variable number of alternative words during speech recognition | |
US7676365B2 (en) | Method and apparatus for constructing and using syllable-like unit language models | |
US8346553B2 (en) | Speech recognition system and method for speech recognition | |
JP3282075B2 (ja) | 連続音声認識において句読点を自動的に生成する装置および方法 | |
EP0965978A1 (en) | Non-interactive enrollment in speech recognition | |
EP1341156A1 (en) | Continuous speech recognition | |
US20070239455A1 (en) | Method and system for managing pronunciation dictionaries in a speech application | |
KR20050076697A (ko) | 컴퓨터 구현 음성 인식 시스템 및 이 시스템으로 학습하는방법 | |
JP2004523004A (ja) | 階層言語モデル | |
KR101819459B1 (ko) | 음성 인식 오류 수정을 지원하는 음성 인식 시스템 및 장치 | |
JP2015158582A (ja) | 音声認識装置、及びプログラム | |
KR20060109865A (ko) | 음성인식방법 및 장치 | |
CA2597826C (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
Huang et al. | Dialogue management for multimodal user registration. | |
JP2005108079A (ja) | かな文字入力装置、かな文字入力方法、プログラムおよび記録媒体 | |
JPH06250689A (ja) | 音声認識装置 | |
McMillian | Distributed Listening in Automatic Speech Recognition | |
EP1594120A1 (en) | Method for building hidden Markov speech models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
A107 | Divisional application of patent | ||
AMND | Amendment | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121228 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131230 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20141223 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151229 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20161228 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20171228 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20181227 Year of fee payment: 13 |