KR20110126058A - 음성 인식 에러 예측자로서의 문법 적합성 평가를 위한 방법들 및 시스템 - Google Patents
음성 인식 에러 예측자로서의 문법 적합성 평가를 위한 방법들 및 시스템 Download PDFInfo
- Publication number
- KR20110126058A KR20110126058A KR1020110044933A KR20110044933A KR20110126058A KR 20110126058 A KR20110126058 A KR 20110126058A KR 1020110044933 A KR1020110044933 A KR 1020110044933A KR 20110044933 A KR20110044933 A KR 20110044933A KR 20110126058 A KR20110126058 A KR 20110126058A
- Authority
- KR
- South Korea
- Prior art keywords
- statements
- confusion
- words
- phoneme
- alignment
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 116
- 230000008569 process Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 8
- 230000000739 chaotic effect Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
Description
도 1b는 본 발명의 일 실시예에 따라 명령문들(statements)을 특정하는 대체 가능하고 다양한 표현들(representations)을 사용하여 정의된 도 1a의 입력 텍스트 파일을 도시한다.
도 2는 본 발명의 일 실시예에 따른 도 1a 및 1b의 입력 텍스트 파일에 대응하는 GnD 파일을 도시한다.
도 3은 본 발명의 일 실시예에 따른 도 2의 GnD 파일에 정의된 명령문들 중 두 개의 명령문들에 대한 문법으로 이어진 경로 네트워크(path network through the grammar)를 도시한다.
도 4는 본 발명의 일 실시예에 따라 문법 적합성 평가(grammar fitness evaluation; GFE) 절차의 흐름도(operational diagram)를 도시한다.
도 5는 본 발명의 일 실시예에 따라 도 2의 예시적 문법 입력을 대상으로 GFE를 수행하여 생성된 문법 적합성 리포트(grammar fitness report)로부터 발췌된 내용을 도시한다.
도 6은 본 발명의 일 실시예에 따라 GnD 파일을 구성하고 GnD 파일에 대응하는 문법 적합성을 평가하기 위한 절차의 흐름도를 도시한다.
도 7은 본 발명의 일 실시예를 따라 연산 이벤트 중에 음성 인식을 위해 사용될 명령문들의 일군에 대한 문법 구조에 있는 잠재적 혼란을 평가하는, 컴퓨터에서 구현되는 방법의 흐름도를 도시한다.
도 8은 본 발명의 일 실시예에 따라 연산 이벤트 중에 음성 인식에서 사용될 명령문들의 일군에 대한 문법 구조에 있는 잠재적 혼란을 평가하는 시스템의 블록도를 도시한다.
Claims (20)
- 연산 이벤트 중에 음성 인식에서 사용될 명령문들의 일군에 대한 문법 구조에 있는 잠재적 혼란을 평가하는 컴퓨터에서 구현되는 방법으로,
문법 구조에 포함된, 다수의 단어 일군들로 각각 형성된 복수의 명령문들을 수신하는 과정;
상기 복수의 명령문들을 단어 일군 별로 정렬하여 상기 복수의 명령문들에 걸쳐 다수의 정렬 영역들을 식별하는 과정;
상기 복수의 명령문들에 걸쳐, 상기 다수의 상기 정렬 영역들 밖의 대응하는 위치들에서 상기 복수의 명령문들 중 두 개 이상의 명령문들로부터의 단어들에 의해 각각 정의되는 다수의 잠재적 혼란 구역들을 식별하는 과정;
상기 연산 이벤트 중 음성 인식 시스템에 의해 청각적으로 처리될 때 상기 단어들 사이의 혼란 확률의 정도를 판단하기 위해, 상기 식별된 잠재적 혼란 구역들 각각에 대하여 상기 잠재적 혼란 구역에 포함된 상기 단어들의 음소 발음들을 분석하는 과정; 및
상기 복수의 명령문들에 걸쳐 상기 잠재적 혼란 구역들의 정체와 상기 잠재적 혼란 구역들에 대응하는 혼란 확률의 정도를 시사하는 보고서를 생성하는 과정을 포함하는 것을 특징으로 하는 방법. - 제 1항에 있어서,
상기 컴퓨터에서 구현되는 방법은, 청각적 입력 없이도 수행되는 것을 특징으로 하는 방법. - 제 1항에 있어서,
상기 단어 일군들 각각은, 하나 이상의 단어들을 포함하는 것을 특징으로 하는 방법. - 제 1항에 있어서,
상기 복수의 명령문들에 걸쳐 상기 다수의 정렬 영역들을 식별하는 과정은, 상기 복수의 명령문들에 걸쳐 동일한 단어 일군들의 최고의 정렬을 판단하는 과정을 포함하는 것을 특징으로 하는 방법. - 제 1항에 있어서,
상기 잠재적 혼란 구역에 포함된 상기 단어들의 음소 발음들을 분석하는 과정은,
상기 잠재적 혼란 구역에 포함된 상기 복수의 명령문들의 상기 단어들의 음소들에 걸쳐 음소 수준의 정렬을 수행하는 과정; 및
상기 음소 수준의 정렬에 기초하여 상기 잠재적 혼란 구역에 대한 음소 정확도 값을 연산하는 과정을 포함하고,
상기 음소 정확도 값은, 상기 연산 이벤트 중에 상기 음성 인식 시스템에 의해 청각적으로 처리될 때 상기 잠재적 혼란 구역에 포함된 상기 복수의 명령문들의 상기 단어들 사이의 상기 혼란 확률의 정도에 대응하는 것을 특징으로 하는 방법. - 제 5항에 있어서,
음소는, 언어의 음향 시스템에서 구별되는 최소한의 단위인 것을 특징으로 하는 방법. - 제 6항에 있어서,
상기 음소 수준의 정렬을 수행하는 과정은, 상기 복수의 명령문들에 걸쳐 상기 잠재적 혼란 구역에 포함된 상기 단어들의 동일한 음소들의 최고의 정렬을 판단하는 과정을 포함하는 것을 특징으로 하는 방법. - 제 1항에 있어서,
혼란 확률 임계치의 이상인 혼란 확률의 정도를 가진 잠재적 혼란 구역들만 상기 보고서에 식별되도록 상기 보고서를 생성할 때 상기 혼란 확률 임계치를 적용하는 과정을 더 포함하는 것을 특징으로 하는 방법. - 제 1항에 있어서,
상기 복수의 명령문들에 걸쳐 정렬 영역들의 상기 수가 '0'일 때 상기 컴퓨터에서 구현되는 방법 중에 상기 복수의 명령문들을 처리하는 과정을 종료하는 과정을 더 포함하는 것을 특징으로 하는 방법. - 제 1항에 있어서,
상기 복수의 명령문들이 서로 동일할 때 상기 컴퓨터에서 구현되는 방법 중에 상기 복수의 명령문들을 처리하는 과정을 종료하는 과정을 더 포함하는 것을 특징으로 하는 방법. - 연산 이벤트 중에 음성 인식에서 사용될 명령문들의 일군에 대한 문법 구조에 있는 잠재적 혼란을 평가하는 시스템으로,
문법 구조에 포함된, 다수의 단어 일군들로 각각 형성된 복수의 명령문들을 수신하도록 정의된 입력 모듈;
상기 입력 모듈에 의해 수신된 상기 복수의 명령문들에 걸쳐 다수의 정렬 영역들을 식별하도록 정의된 단어 수준의 정렬 모듈;
상기 복수의 명령문들에 걸쳐, 상기 다수의 상기 정렬 영역들 밖의 대응하는 위치들에서 상기 복수의 명령문들 중 두 개 이상의 명령문들로부터의 단어들에 의해 각각 정의되는 다수의 잠재적 혼란 구역들을 식별하도록 정의된 혼란 구역 식별 모듈; 및
상기 연산 이벤트 중 음성 인식 시스템에 의해 청각적으로 처리될 때 상기 혼란 구역 식별 모듈에 의해 식별된 특정 잠재적 혼란 구역에 포함된 상기 단어들 사이의 혼란 확률의 정도를 판단하기 위해, 상기 특정 잠재적 혼란 구역에 포함된 상기 단어들의 음소 발음들을 분석하도록 정의된 혼란 확률 분석 모듈을 포함하고,
정렬 영역은, 상기 복수의 명령문들에 걸쳐 정렬된 동일한 단어 일군들에 대응하는 것을 특징으로 하는 시스템. - 제 11항에 있어서,
상기 단어 일군들 각각은, 하나 이상의 단어들을 포함하는 것을 특징으로 하는 시스템. - 제 11항에 있어서,
상기 단어 수준의 정렬 모듈은, 상기 복수의 명령문들에 걸쳐 동일한 단어 일군들의 최고의 정렬을 판단하도록 정의된 것을 특징으로 하는 시스템. - 제 11항에 있어서,
상기 혼란 확률 분석 모듈은,
상기 특정 잠재적 혼란 구역에 포함된 상기 복수의 명령문들의 상기 단어들의 음소들에 걸쳐 음소 수준의 정렬을 수행하도록 정의되고,
상기 음소 수준의 정렬에 기초하여 음소 정확도 값을 연산하고,
상기 음소 정확도 값은, 상기 연산 이벤트 중에 상기 음성 인식 시스템에 의해 청각적으로 처리될 때 상기 특정 혼란 구역에 포함된 상기 단어들 사이의 혼란 확률의 정도에 대응하는 것을 특징으로 하는 시스템. - 제 14항에 있어서,
음소는, 언어의 음향 시스템에서 구별되는 최소한의 단위인 것을 특징으로 하는 시스템. - 제 15항에 있어서,
상기 혼란 확률 분석 모듈은, 상기 음소 수준의 정렬을 수행할 때, 상기 복수의 명령문들에 걸쳐 상기 특정 잠재적 혼란 구역에 포함된 상기 단어들의 동일한 음소들의 최고의 정렬을 판단하도록 정의된 것을 특징으로 하는 시스템. - 제 11항에 있어서,
상기 복수의 명령문들에 걸쳐 상기 잠재적 혼란 구역들의 정체와 상기 잠재적 혼란 구역들에 대응하는 혼란 확률의 정도를 시사하는 보고서를 생성하도록 정의된 출력 모듈을 더 포함하는 것을 특징으로 하는 시스템. - 제 17항에 있어서,
상기 출력 모듈은, 혼란 확률 임계치의 이상인 혼란 확률의 정도를 가진 잠재적 혼란 구역들만 상기 보고서에 식별되도록 상기 보고서를 생성할 때 상기 혼란 확률 임계치를 적용하도록 정의된 것을 특징으로 하는 시스템. - 연산 이벤트 중에 음성 인식에서 사용될 명령문들의 일군에 대한 문법 구조에 있는 잠재적 혼란을 평가하는 프로그램 명령어들을 포함하는 컴퓨터 판독 가능한 매체로,
문법 구조에 포함된, 다수의 단어 일군들로 각각 형성된 복수의 명령문들을 수신하기 위한 프로그램 명령어들;
상기 복수의 명령문들을 단어 일군 별로 정렬하여 상기 복수의 명령문들에 걸쳐, 상기 정렬된 단어 일군들로 각각 표현되는 다수의 정렬 영역들을 식별하기 위한 프로그램 명령어들;
상기 복수의 명령문들에 걸쳐, 상기 다수의 상기 정렬 영역들 밖의 대응하는 위치들에서 상기 복수의 명령문들 중 두 개 이상의 명령문들로부터의 단어들에 의해 각각 정의되는 다수의 잠재적 혼란 구역들을 식별하기 위한 프로그램 명령어들; 및
상기 연산 이벤트 중 음성 인식 시스템에 의해 청각적으로 처리될 때 상기 잠재적 혼란 구역들 각각에 포함된 상기 단어들 사이의 혼란 확률의 정도를 판단하기 위해, 상기 잠재적 혼란 구역들 각각에 포함된 상기 단어들의 음소 발음들을 분석하기 위한 프로그램 명령어들을 포함하는 것을 특징으로 하는 컴퓨터 판독 가능한 매체. - 제 19항에 있어서,
상기 복수의 명령문들에 걸쳐 상기 잠재적 혼란 구역들의 정체와 상기 잠재적 혼란 구역들에 대응하는 혼란 확률의 정도를 시사하는 보고서를 생성하기 위한 프로그램 명령어들을 더 포함하는 것을 특징으로 하는 컴퓨터 판독 가능한 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/780,818 | 2010-05-14 | ||
US12/780,818 US8560318B2 (en) | 2010-05-14 | 2010-05-14 | Methods and system for evaluating potential confusion within grammar structure for set of statements to be used in speech recognition during computing event |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110126058A true KR20110126058A (ko) | 2011-11-22 |
KR101262812B1 KR101262812B1 (ko) | 2013-05-10 |
Family
ID=44358156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110044933A KR101262812B1 (ko) | 2010-05-14 | 2011-05-13 | 음성 인식 에러 예측자로서의 문법 적합성 평가를 위한 방법들 및 시스템 |
Country Status (5)
Country | Link |
---|---|
US (2) | US8560318B2 (ko) |
EP (1) | EP2387031B1 (ko) |
JP (1) | JP5150747B2 (ko) |
KR (1) | KR101262812B1 (ko) |
CN (1) | CN102243871B (ko) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10544677B2 (en) * | 2017-09-01 | 2020-01-28 | United Technologies Corporation | Turbine disk |
US8219407B1 (en) * | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US9262397B2 (en) * | 2010-10-08 | 2016-02-16 | Microsoft Technology Licensing, Llc | General purpose correction of grammatical and word usage errors |
US8855997B2 (en) | 2011-07-28 | 2014-10-07 | Microsoft Corporation | Linguistic error detection |
DE102012202407B4 (de) * | 2012-02-16 | 2018-10-11 | Continental Automotive Gmbh | Verfahren zum Phonetisieren einer Datenliste und sprachgesteuerte Benutzerschnittstelle |
US9536528B2 (en) * | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US20140067394A1 (en) * | 2012-08-28 | 2014-03-06 | King Abdulaziz City For Science And Technology | System and method for decoding speech |
US9384731B2 (en) * | 2013-11-06 | 2016-07-05 | Microsoft Technology Licensing, Llc | Detecting speech input phrase confusion risk |
GB201322377D0 (en) | 2013-12-18 | 2014-02-05 | Isis Innovation | Method and apparatus for automatic speech recognition |
US10002543B2 (en) * | 2014-11-04 | 2018-06-19 | Knotbird LLC | System and methods for transforming language into interactive elements |
KR102167719B1 (ko) | 2014-12-08 | 2020-10-19 | 삼성전자주식회사 | 언어 모델 학습 방법 및 장치, 음성 인식 방법 및 장치 |
US9966073B2 (en) | 2015-05-27 | 2018-05-08 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
US20170337923A1 (en) * | 2016-05-19 | 2017-11-23 | Julia Komissarchik | System and methods for creating robust voice-based user interface |
CN106847273B (zh) * | 2016-12-23 | 2020-05-05 | 北京云知声信息技术有限公司 | 语音识别的唤醒词选择方法及装置 |
CN107610695B (zh) * | 2017-08-08 | 2021-07-06 | 大众问问(北京)信息科技有限公司 | 驾驶人语音唤醒指令词权重的动态调整方法 |
CN108197107A (zh) * | 2017-12-29 | 2018-06-22 | 秦男 | 数据处理方法 |
CN110111779B (zh) * | 2018-01-29 | 2023-12-26 | 阿里巴巴集团控股有限公司 | 语法模型生成方法及装置、语音识别方法及装置 |
CN109887507B (zh) * | 2019-04-22 | 2021-03-12 | 成都启英泰伦科技有限公司 | 一种降低相似语音命令词误识别率的方法 |
CN112562675B (zh) * | 2019-09-09 | 2024-05-24 | 北京小米移动软件有限公司 | 语音信息处理方法、装置及存储介质 |
CN111128238B (zh) * | 2019-12-31 | 2022-06-24 | 云知声智能科技股份有限公司 | 普通话评测方法及装置 |
JP2021177598A (ja) * | 2020-05-08 | 2021-11-11 | シャープ株式会社 | 音声処理システム、音声処理方法、及び音声処理プログラム |
US12067978B2 (en) * | 2020-06-02 | 2024-08-20 | Samsung Electronics Co., Ltd. | Methods and systems for confusion reduction for compressed acoustic models |
US11875780B2 (en) * | 2021-02-16 | 2024-01-16 | Vocollect, Inc. | Voice recognition performance constellation graph |
CN112802494B (zh) * | 2021-04-12 | 2021-07-16 | 北京世纪好未来教育科技有限公司 | 语音评测方法、装置、计算机设备和介质 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
ES2128390T3 (es) * | 1992-03-02 | 1999-05-16 | At & T Corp | Metodo de adiestramiento y dispositivo para reconocimiento de voz. |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
JPH09138695A (ja) * | 1995-11-15 | 1997-05-27 | Nec Corp | 音声認識装置 |
US5768498A (en) | 1996-01-23 | 1998-06-16 | Lucent Technologies | Protocol verification using symbolic representations of queues |
US5999896A (en) * | 1996-06-25 | 1999-12-07 | Microsoft Corporation | Method and system for identifying and resolving commonly confused words in a natural language parser |
CA2226233C (en) | 1997-01-21 | 2006-05-09 | At&T Corp. | Systems and methods for determinizing and minimizing a finite state transducer for speech recognition |
US5995918A (en) | 1997-09-17 | 1999-11-30 | Unisys Corporation | System and method for creating a language grammar using a spreadsheet or table interface |
US6961954B1 (en) | 1997-10-27 | 2005-11-01 | The Mitre Corporation | Automated segmentation, information extraction, summarization, and presentation of broadcast news |
US6397179B2 (en) | 1997-12-24 | 2002-05-28 | Nortel Networks Limited | Search optimization system and method for continuous speech recognition |
US6059837A (en) | 1997-12-30 | 2000-05-09 | Synopsys, Inc. | Method and system for automata-based approach to state reachability of interacting extended finite state machines |
GB9802836D0 (en) * | 1998-02-10 | 1998-04-08 | Canon Kk | Pattern matching method and apparatus |
US6182039B1 (en) * | 1998-03-24 | 2001-01-30 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus using probabilistic language model based on confusable sets for speech recognition |
US20020032564A1 (en) | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
US6691078B1 (en) | 1999-07-29 | 2004-02-10 | International Business Machines Corporation | Target design model behavior explorer |
EP1109152A1 (en) | 1999-12-13 | 2001-06-20 | Sony International (Europe) GmbH | Method for speech recognition using semantic and pragmatic informations |
US6964023B2 (en) * | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
US7092883B1 (en) * | 2002-03-29 | 2006-08-15 | At&T | Generating confidence scores from word lattices |
US7169996B2 (en) | 2002-11-12 | 2007-01-30 | Medialab Solutions Llc | Systems and methods for generating music using data/music data file transmitted/received via a network |
US7552051B2 (en) | 2002-12-13 | 2009-06-23 | Xerox Corporation | Method and apparatus for mapping multiword expressions to identifiers using finite-state networks |
US7146319B2 (en) * | 2003-03-31 | 2006-12-05 | Novauris Technologies Ltd. | Phonetically based speech recognition system and method |
JP4236597B2 (ja) * | 2004-02-16 | 2009-03-11 | シャープ株式会社 | 音声認識装置、音声認識プログラムおよび記録媒体。 |
US20060031071A1 (en) | 2004-08-03 | 2006-02-09 | Sony Corporation | System and method for automatically implementing a finite state automaton for speech recognition |
US7636657B2 (en) | 2004-12-09 | 2009-12-22 | Microsoft Corporation | Method and apparatus for automatic grammar generation from data entries |
US7711551B2 (en) | 2005-06-13 | 2010-05-04 | Microsoft Corporation | Static analysis to identify defects in grammars |
US7784008B1 (en) | 2006-01-11 | 2010-08-24 | Altera Corporation | Performance visualization system |
US7844456B2 (en) | 2007-03-09 | 2010-11-30 | Microsoft Corporation | Grammar confusability metric for speech recognition |
JP4829910B2 (ja) * | 2008-02-20 | 2011-12-07 | 日本電信電話株式会社 | 音声認識誤り分析装置、方法、プログラム及びその記録媒体 |
US7472061B1 (en) * | 2008-03-31 | 2008-12-30 | International Business Machines Corporation | Systems and methods for building a native language phoneme lexicon having native pronunciations of non-native words derived from non-native pronunciations |
-
2010
- 2010-05-14 US US12/780,818 patent/US8560318B2/en active Active
-
2011
- 2011-03-28 EP EP11159963.5A patent/EP2387031B1/en active Active
- 2011-05-13 KR KR1020110044933A patent/KR101262812B1/ko active IP Right Grant
- 2011-05-16 JP JP2011109538A patent/JP5150747B2/ja active Active
- 2011-05-16 CN CN2011101259236A patent/CN102243871B/zh active Active
-
2013
- 2013-10-04 US US14/046,765 patent/US8818813B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8560318B2 (en) | 2013-10-15 |
CN102243871B (zh) | 2013-06-05 |
US20140039896A1 (en) | 2014-02-06 |
JP2011242775A (ja) | 2011-12-01 |
JP5150747B2 (ja) | 2013-02-27 |
EP2387031A1 (en) | 2011-11-16 |
KR101262812B1 (ko) | 2013-05-10 |
CN102243871A (zh) | 2011-11-16 |
US20110282667A1 (en) | 2011-11-17 |
US8818813B2 (en) | 2014-08-26 |
EP2387031B1 (en) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101262812B1 (ko) | 음성 인식 에러 예측자로서의 문법 적합성 평가를 위한 방법들 및 시스템 | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
CN106297800B (zh) | 一种自适应的语音识别的方法和设备 | |
CN105185373B (zh) | 韵律层级预测模型的生成及韵律层级预测方法和装置 | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
CN107086040B (zh) | 语音识别能力测试方法和装置 | |
US9613638B2 (en) | Computer-implemented systems and methods for determining an intelligibility score for speech | |
KR101587866B1 (ko) | 음성 인식용 발음사전 확장 장치 및 방법 | |
CN110415725B (zh) | 使用第一语言数据评估第二语言发音质量的方法及系统 | |
KR102296878B1 (ko) | 외국어 학습평가장치 | |
KR20210130024A (ko) | 대화 시스템 및 그 제어 방법 | |
KR20160059265A (ko) | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 | |
CN114783424A (zh) | 文本语料筛选方法、装置、设备及存储介质 | |
CN118173118A (zh) | 口语问答评分方法、装置、设备、存储介质及程序产品 | |
Marie-Sainte et al. | A new system for Arabic recitation using speech recognition and Jaro Winkler algorithm | |
CN109697975A (zh) | 一种语音评价方法及装置 | |
CN115132174A (zh) | 一种语音数据处理方法、装置、计算机设备及存储介质 | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
CN114627896A (zh) | 语音评测方法、装置、设备及存储介质 | |
JP5544575B2 (ja) | 音声言語評価装置、方法、及びプログラム | |
JP2005275348A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
KR102386635B1 (ko) | 음소의 특성에 관한 통계적 분석에 기초하여 자동적으로 음성 합성 데이터를 평가하는 방법 및 장치 | |
KR100890404B1 (ko) | 음성 인식을 이용한 자동 번역 방법 및 장치 | |
KR102405547B1 (ko) | 딥러닝 기반의 발음 평가 시스템 | |
CN114708860B (zh) | 语音命令识别方法、装置、计算机设备及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20110513 |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20110601 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20110513 Comment text: Patent Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20120711 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20130218 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20130503 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20130506 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20160422 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20160422 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170424 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20170424 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180424 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20180424 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190423 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20190423 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20200428 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20210427 Start annual number: 9 End annual number: 9 |