RU2009102507A - Способ и устройство для естественно-речевого распознавания речевого высказывания - Google Patents
Способ и устройство для естественно-речевого распознавания речевого высказывания Download PDFInfo
- Publication number
- RU2009102507A RU2009102507A RU2009102507/09A RU2009102507A RU2009102507A RU 2009102507 A RU2009102507 A RU 2009102507A RU 2009102507/09 A RU2009102507/09 A RU 2009102507/09A RU 2009102507 A RU2009102507 A RU 2009102507A RU 2009102507 A RU2009102507 A RU 2009102507A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- recognition
- grammar
- case
- utterance
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Abstract
1. Способ естественно-речевого распознавания речевого высказывания, включающий в себя следующие этапы: ! распознавание речевого высказывания и его преобразование в обрабатываемый в устройстве распознавания речи речевой сигнал (10); ! анализ речевого сигнала (10) последовательно в нескольких ветвях устройства распознавания речи с использованием нескольких грамматик (12, 14, 26); ! успешное завершение процесса распознавания речевого высказывания, если анализ речевого сигнала, по меньшей мере, в одной ветви распознавания речи даст положительный результат, ! отличающийся тем, что включает в себя следующие этапы: ! а) подачу речевого сигнала (10) к первой ветви распознавания речи, включающей в себя первую грамматику (12) для анализа речевого сигнала; ! б) анализ речевого сигнала (10) посредством первой грамматики (12), причем в случае распознавания речевого высказывания получают первый положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - первый отрицательный результат распознавания; ! в) причем в случае отрицательного результата распознавания речевой сигнал подают к дополнительной ветви распознавания речи, включающей в себя дополнительную грамматику (14); ! г) анализ речевого сигнала (10) посредством дополнительной грамматики (14), причем в случае распознавания речевого высказывания получают положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - отрицательный результат распознавания; ! д) причем в случае отрицательного результата распознавания продолжают этап в) до тех пор, пока не
Claims (6)
1. Способ естественно-речевого распознавания речевого высказывания, включающий в себя следующие этапы:
распознавание речевого высказывания и его преобразование в обрабатываемый в устройстве распознавания речи речевой сигнал (10);
анализ речевого сигнала (10) последовательно в нескольких ветвях устройства распознавания речи с использованием нескольких грамматик (12, 14, 26);
успешное завершение процесса распознавания речевого высказывания, если анализ речевого сигнала, по меньшей мере, в одной ветви распознавания речи даст положительный результат,
отличающийся тем, что включает в себя следующие этапы:
а) подачу речевого сигнала (10) к первой ветви распознавания речи, включающей в себя первую грамматику (12) для анализа речевого сигнала;
б) анализ речевого сигнала (10) посредством первой грамматики (12), причем в случае распознавания речевого высказывания получают первый положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - первый отрицательный результат распознавания;
в) причем в случае отрицательного результата распознавания речевой сигнал подают к дополнительной ветви распознавания речи, включающей в себя дополнительную грамматику (14);
г) анализ речевого сигнала (10) посредством дополнительной грамматики (14), причем в случае распознавания речевого высказывания получают положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - отрицательный результат распознавания;
д) причем в случае отрицательного результата распознавания продолжают этап в) до тех пор, пока не будут пройдены грамматики (26) всех имеющихся ветвей распознавания речи.
2. Способ по п.1, отличающийся тем, что правила грамматик (12, 14, 26) не пересекаются.
3. Способ по одному из пп.1 или 2, отличающийся тем, что посредством первой грамматики (12), анализируют часто встречающиеся речевые высказывания, посредством второй грамматики (14) - реже встречающиеся речевые высказывания, а посредством каждой дополнительной грамматики (26) - еще реже встречающиеся речевые высказывания.
4. Способ по п.1, отличающийся тем, что в случае положительных первого и второго результатов распознавания используют выданный первой грамматикой (12) результат распознавания.
5. Способ по п.1, отличающийся тем, что в случае положительных первого и второго результатов распознавания используют результат распознавания с наибольшей надежностью распознавания.
6. Устройство для естественно-речевого распознавания речевого высказывания, содержащее средства (10) для регистрации речевого высказывания и для его преобразования в обрабатываемый в устройстве распознавания речи речевой сигнал, устройство распознавания речи с несколькими ветвями распознавания речи, причем каждая ветвь распознавания речи содержит грамматику (12; 14; 26) для анализа речевого сигнала (10), причем речевой сигнал подается к ветвям распознавания речи последовательно, и средства (20; 22; 24) для управления и оценки процесса распознавания в зависимости от результата распознавания, по меньшей мере, в одной ветви распознавания речи.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102006029755.5 | 2006-06-27 | ||
DE102006029755A DE102006029755A1 (de) | 2006-06-27 | 2006-06-27 | Verfahren und Vorrichtung zur natürlichsprachlichen Erkennung einer Sprachäußerung |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2009102507A true RU2009102507A (ru) | 2010-08-10 |
RU2432623C2 RU2432623C2 (ru) | 2011-10-27 |
Family
ID=38543007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009102507/09A RU2432623C2 (ru) | 2006-06-27 | 2007-06-14 | Способ и устройство для естественно-речевого распознавания речевого высказывания |
Country Status (9)
Country | Link |
---|---|
US (1) | US9208787B2 (ru) |
EP (1) | EP2036078A1 (ru) |
KR (1) | KR20090033459A (ru) |
CN (1) | CN101484934B (ru) |
BR (1) | BRPI0713987A2 (ru) |
CA (1) | CA2656114C (ru) |
DE (1) | DE102006029755A1 (ru) |
RU (1) | RU2432623C2 (ru) |
WO (1) | WO2008000353A1 (ru) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112007002665B4 (de) * | 2006-12-15 | 2017-12-28 | Mitsubishi Electric Corp. | Spracherkennungssystem |
DE102008025532B4 (de) * | 2008-05-28 | 2014-01-09 | Audi Ag | Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung |
DE102010040553A1 (de) * | 2010-09-10 | 2012-03-15 | Siemens Aktiengesellschaft | Spracherkennungsverfahren |
DE102010049869B4 (de) * | 2010-10-28 | 2023-03-16 | Volkswagen Ag | Verfahren zum Bereitstellen einer Sprachschnittstelle in einem Fahrzeug und Vorrichtung dazu |
US9431012B2 (en) | 2012-04-30 | 2016-08-30 | 2236008 Ontario Inc. | Post processing of natural language automatic speech recognition |
US9093076B2 (en) * | 2012-04-30 | 2015-07-28 | 2236008 Ontario Inc. | Multipass ASR controlling multiple applications |
US9601111B2 (en) * | 2012-11-13 | 2017-03-21 | GM Global Technology Operations LLC | Methods and systems for adapting speech systems |
EP2733697A1 (en) * | 2012-11-16 | 2014-05-21 | QNX Software Systems Limited | Application services interface to ASR |
US9135916B2 (en) * | 2013-02-26 | 2015-09-15 | Honeywell International Inc. | System and method for correcting accent induced speech transmission problems |
KR101370539B1 (ko) | 2013-03-15 | 2014-03-06 | 포항공과대학교 산학협력단 | 지시 표현 처리에 기반한 대화 처리 방법 및 장치 |
US10186262B2 (en) * | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
US10885918B2 (en) | 2013-09-19 | 2021-01-05 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
US9601108B2 (en) | 2014-01-17 | 2017-03-21 | Microsoft Technology Licensing, Llc | Incorporating an exogenous large-vocabulary model into rule-based speech recognition |
US9552817B2 (en) * | 2014-03-19 | 2017-01-24 | Microsoft Technology Licensing, Llc | Incremental utterance decoder combination for efficient and accurate decoding |
US10749989B2 (en) | 2014-04-01 | 2020-08-18 | Microsoft Technology Licensing Llc | Hybrid client/server architecture for parallel processing |
CN113259736B (zh) * | 2021-05-08 | 2022-08-09 | 深圳市康意数码科技有限公司 | 一种语音控制电视机的方法及电视机 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6249761B1 (en) * | 1997-09-30 | 2001-06-19 | At&T Corp. | Assigning and processing states and arcs of a speech recognition model in parallel processors |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
DE19910234A1 (de) * | 1999-03-09 | 2000-09-21 | Philips Corp Intellectual Pty | Verfahren mit mehreren Spracherkennern |
US6526380B1 (en) | 1999-03-26 | 2003-02-25 | Koninklijke Philips Electronics N.V. | Speech recognition system having parallel large vocabulary recognition engines |
US7058573B1 (en) * | 1999-04-20 | 2006-06-06 | Nuance Communications Inc. | Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes |
JP4465564B2 (ja) * | 2000-02-28 | 2010-05-19 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
CA2408584A1 (en) * | 2000-04-06 | 2001-10-18 | One Voice Technologies, Inc. | Natural language and dialogue generation processing |
WO2001084535A2 (en) * | 2000-05-02 | 2001-11-08 | Dragon Systems, Inc. | Error correction in speech recognition |
US7464033B2 (en) * | 2000-07-31 | 2008-12-09 | Texas Instruments Incorporated | Decoding multiple HMM sets using a single sentence grammar |
JP2002116796A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
US20020107695A1 (en) * | 2001-02-08 | 2002-08-08 | Roth Daniel L. | Feedback for unrecognized speech |
US6964020B1 (en) * | 2001-02-22 | 2005-11-08 | Sprint Communications Company L.P. | Method and system for facilitating construction of a canned message in a microbrowser environment |
US7072837B2 (en) * | 2001-03-16 | 2006-07-04 | International Business Machines Corporation | Method for processing initially recognized speech in a speech recognition session |
FR2832524A1 (fr) * | 2001-11-22 | 2003-05-23 | Cegetel Groupe | Procede de gestion d'un document principal |
US6898567B2 (en) * | 2001-12-29 | 2005-05-24 | Motorola, Inc. | Method and apparatus for multi-level distributed speech recognition |
US7177814B2 (en) * | 2002-02-07 | 2007-02-13 | Sap Aktiengesellschaft | Dynamic grammar for voice-enabled applications |
US7016849B2 (en) * | 2002-03-25 | 2006-03-21 | Sri International | Method and apparatus for providing speech-driven routing between spoken language applications |
US7184957B2 (en) * | 2002-09-25 | 2007-02-27 | Toyota Infotechnology Center Co., Ltd. | Multiple pass speech recognition method and system |
US20040158468A1 (en) * | 2003-02-12 | 2004-08-12 | Aurilab, Llc | Speech recognition with soft pruning |
DE602004011753T2 (de) * | 2003-03-01 | 2009-02-05 | Coifman, Robert E. | Verfahren und Vorrichtung zum Verbessern der Transkriptionsgenauigkeit bei der Spracherkennung |
US7603267B2 (en) * | 2003-05-01 | 2009-10-13 | Microsoft Corporation | Rules-based grammar for slots and statistical model for preterminals in natural language understanding system |
US7647645B2 (en) * | 2003-07-23 | 2010-01-12 | Omon Ayodele Edeki | System and method for securing computer system against unauthorized access |
NZ589653A (en) * | 2004-06-04 | 2012-10-26 | Keyless Systems Ltd | System to enhance data entry in mobile and fixed environment |
JP4574390B2 (ja) * | 2005-02-22 | 2010-11-04 | キヤノン株式会社 | 音声認識方法 |
DE102005030967B4 (de) * | 2005-06-30 | 2007-08-09 | Daimlerchrysler Ag | Verfahren und Vorrichtung zur Interaktion mit einem Spracherkennungssystem zur Auswahl von Elementen aus Listen |
JP2007057844A (ja) * | 2005-08-24 | 2007-03-08 | Fujitsu Ltd | 音声認識システムおよび音声処理システム |
US8688451B2 (en) * | 2006-05-11 | 2014-04-01 | General Motors Llc | Distinguishing out-of-vocabulary speech from in-vocabulary speech |
-
2006
- 2006-06-27 DE DE102006029755A patent/DE102006029755A1/de not_active Ceased
-
2007
- 2007-06-14 US US12/306,350 patent/US9208787B2/en not_active Expired - Fee Related
- 2007-06-14 CA CA2656114A patent/CA2656114C/en not_active Expired - Fee Related
- 2007-06-14 KR KR1020097001732A patent/KR20090033459A/ko not_active Application Discontinuation
- 2007-06-14 RU RU2009102507/09A patent/RU2432623C2/ru active
- 2007-06-14 EP EP07764643A patent/EP2036078A1/de not_active Withdrawn
- 2007-06-14 CN CN2007800246599A patent/CN101484934B/zh not_active Expired - Fee Related
- 2007-06-14 BR BRPI0713987-0A patent/BRPI0713987A2/pt not_active Application Discontinuation
- 2007-06-14 WO PCT/EP2007/005224 patent/WO2008000353A1/de active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2008000353A1 (de) | 2008-01-03 |
CA2656114C (en) | 2016-02-09 |
US9208787B2 (en) | 2015-12-08 |
EP2036078A1 (de) | 2009-03-18 |
CN101484934A (zh) | 2009-07-15 |
KR20090033459A (ko) | 2009-04-03 |
CN101484934B (zh) | 2013-01-02 |
BRPI0713987A2 (pt) | 2012-11-20 |
US20100114577A1 (en) | 2010-05-06 |
DE102006029755A1 (de) | 2008-01-03 |
CA2656114A1 (en) | 2008-01-03 |
RU2432623C2 (ru) | 2011-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2009102507A (ru) | Способ и устройство для естественно-речевого распознавания речевого высказывания | |
TWI253056B (en) | Combined engine system and method for voice recognition | |
US10540979B2 (en) | User interface for secure access to a device using speaker verification | |
TW200601263A (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
JPH0968994A (ja) | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 | |
ATE421748T1 (de) | Verfahren und anordnung zur spracherkennung | |
CN108091340B (zh) | 声纹识别方法、声纹识别系统和计算机可读存储介质 | |
Chuangsuwanich et al. | Robust Voice Activity Detector for Real World Applications Using Harmonicity and Modulation Frequency. | |
CN111261145B (zh) | 语音处理装置、设备及其训练方法 | |
US20040073425A1 (en) | Arrangement for real-time automatic recognition of accented speech | |
Ullmann et al. | Objective intelligibility assessment of text-to-speech systems through utterance verification | |
Tian et al. | Tone recognition with fractionized models and outlined features | |
EP2538407A3 (en) | Framing method and apparatus | |
DE60014583D1 (de) | Verfahren und vorrichtung zur integritätsprüfung von benutzeroberflächen sprachgesteuerter geräte | |
CN1249665C (zh) | 语音识别系统 | |
Vlaj et al. | Voice activity detection algorithm using nonlinear spectral weights, hangover and hangbefore criteria | |
EP4360087A1 (en) | Multi-encoder end-to-end automatic speech recognition (asr) for joint modeling of multiple input devices | |
CN108986844A (zh) | 一种基于说话人语音特征的语音端点检测方法 | |
RU2296376C2 (ru) | Способ распознавания слов речи | |
CN1835077A (zh) | 中文人名自动语音辨识输入方法及系统 | |
KR101578766B1 (ko) | 음성 인식용 탐색 공간 생성 장치 및 방법 | |
Rahman et al. | Speech recognition front-end for segmenting and clustering continuous bangla speech | |
Wand et al. | Impact of different speaking modes on EMG-based speech recognition. | |
CN1825430A (zh) | 可调适韵律的语音合成方法、装置及其对话系统 | |
Rahman et al. | Development of isolated speech recognition system for bangla words |