RU2009102507A - Способ и устройство для естественно-речевого распознавания речевого высказывания - Google Patents

Способ и устройство для естественно-речевого распознавания речевого высказывания Download PDF

Info

Publication number
RU2009102507A
RU2009102507A RU2009102507/09A RU2009102507A RU2009102507A RU 2009102507 A RU2009102507 A RU 2009102507A RU 2009102507/09 A RU2009102507/09 A RU 2009102507/09A RU 2009102507 A RU2009102507 A RU 2009102507A RU 2009102507 A RU2009102507 A RU 2009102507A
Authority
RU
Russia
Prior art keywords
speech
recognition
grammar
case
utterance
Prior art date
Application number
RU2009102507/09A
Other languages
English (en)
Other versions
RU2432623C2 (ru
Inventor
Эккехард ХАЙН (DE)
Эккехард ХАЙН
Клаус-Дитер ЛИДТКЕ (DE)
Клаус-Дитер ЛИДТКЕ
Гунтберт МАРКЕФКА (DE)
Гунтберт МАРКЕФКА
Original Assignee
Дойче Телеком Аг (De)
Дойче Телеком Аг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Дойче Телеком Аг (De), Дойче Телеком Аг filed Critical Дойче Телеком Аг (De)
Publication of RU2009102507A publication Critical patent/RU2009102507A/ru
Application granted granted Critical
Publication of RU2432623C2 publication Critical patent/RU2432623C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Abstract

1. Способ естественно-речевого распознавания речевого высказывания, включающий в себя следующие этапы: ! распознавание речевого высказывания и его преобразование в обрабатываемый в устройстве распознавания речи речевой сигнал (10); ! анализ речевого сигнала (10) последовательно в нескольких ветвях устройства распознавания речи с использованием нескольких грамматик (12, 14, 26); ! успешное завершение процесса распознавания речевого высказывания, если анализ речевого сигнала, по меньшей мере, в одной ветви распознавания речи даст положительный результат, ! отличающийся тем, что включает в себя следующие этапы: ! а) подачу речевого сигнала (10) к первой ветви распознавания речи, включающей в себя первую грамматику (12) для анализа речевого сигнала; ! б) анализ речевого сигнала (10) посредством первой грамматики (12), причем в случае распознавания речевого высказывания получают первый положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - первый отрицательный результат распознавания; ! в) причем в случае отрицательного результата распознавания речевой сигнал подают к дополнительной ветви распознавания речи, включающей в себя дополнительную грамматику (14); ! г) анализ речевого сигнала (10) посредством дополнительной грамматики (14), причем в случае распознавания речевого высказывания получают положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - отрицательный результат распознавания; ! д) причем в случае отрицательного результата распознавания продолжают этап в) до тех пор, пока не

Claims (6)

1. Способ естественно-речевого распознавания речевого высказывания, включающий в себя следующие этапы:
распознавание речевого высказывания и его преобразование в обрабатываемый в устройстве распознавания речи речевой сигнал (10);
анализ речевого сигнала (10) последовательно в нескольких ветвях устройства распознавания речи с использованием нескольких грамматик (12, 14, 26);
успешное завершение процесса распознавания речевого высказывания, если анализ речевого сигнала, по меньшей мере, в одной ветви распознавания речи даст положительный результат,
отличающийся тем, что включает в себя следующие этапы:
а) подачу речевого сигнала (10) к первой ветви распознавания речи, включающей в себя первую грамматику (12) для анализа речевого сигнала;
б) анализ речевого сигнала (10) посредством первой грамматики (12), причем в случае распознавания речевого высказывания получают первый положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - первый отрицательный результат распознавания;
в) причем в случае отрицательного результата распознавания речевой сигнал подают к дополнительной ветви распознавания речи, включающей в себя дополнительную грамматику (14);
г) анализ речевого сигнала (10) посредством дополнительной грамматики (14), причем в случае распознавания речевого высказывания получают положительный результат распознавания и процесс распознавания завершают, а в случае нераспознавания речевого высказывания - отрицательный результат распознавания;
д) причем в случае отрицательного результата распознавания продолжают этап в) до тех пор, пока не будут пройдены грамматики (26) всех имеющихся ветвей распознавания речи.
2. Способ по п.1, отличающийся тем, что правила грамматик (12, 14, 26) не пересекаются.
3. Способ по одному из пп.1 или 2, отличающийся тем, что посредством первой грамматики (12), анализируют часто встречающиеся речевые высказывания, посредством второй грамматики (14) - реже встречающиеся речевые высказывания, а посредством каждой дополнительной грамматики (26) - еще реже встречающиеся речевые высказывания.
4. Способ по п.1, отличающийся тем, что в случае положительных первого и второго результатов распознавания используют выданный первой грамматикой (12) результат распознавания.
5. Способ по п.1, отличающийся тем, что в случае положительных первого и второго результатов распознавания используют результат распознавания с наибольшей надежностью распознавания.
6. Устройство для естественно-речевого распознавания речевого высказывания, содержащее средства (10) для регистрации речевого высказывания и для его преобразования в обрабатываемый в устройстве распознавания речи речевой сигнал, устройство распознавания речи с несколькими ветвями распознавания речи, причем каждая ветвь распознавания речи содержит грамматику (12; 14; 26) для анализа речевого сигнала (10), причем речевой сигнал подается к ветвям распознавания речи последовательно, и средства (20; 22; 24) для управления и оценки процесса распознавания в зависимости от результата распознавания, по меньшей мере, в одной ветви распознавания речи.
RU2009102507/09A 2006-06-27 2007-06-14 Способ и устройство для естественно-речевого распознавания речевого высказывания RU2432623C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102006029755.5 2006-06-27
DE102006029755A DE102006029755A1 (de) 2006-06-27 2006-06-27 Verfahren und Vorrichtung zur natürlichsprachlichen Erkennung einer Sprachäußerung

Publications (2)

Publication Number Publication Date
RU2009102507A true RU2009102507A (ru) 2010-08-10
RU2432623C2 RU2432623C2 (ru) 2011-10-27

Family

ID=38543007

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009102507/09A RU2432623C2 (ru) 2006-06-27 2007-06-14 Способ и устройство для естественно-речевого распознавания речевого высказывания

Country Status (9)

Country Link
US (1) US9208787B2 (ru)
EP (1) EP2036078A1 (ru)
KR (1) KR20090033459A (ru)
CN (1) CN101484934B (ru)
BR (1) BRPI0713987A2 (ru)
CA (1) CA2656114C (ru)
DE (1) DE102006029755A1 (ru)
RU (1) RU2432623C2 (ru)
WO (1) WO2008000353A1 (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112007002665B4 (de) * 2006-12-15 2017-12-28 Mitsubishi Electric Corp. Spracherkennungssystem
DE102008025532B4 (de) * 2008-05-28 2014-01-09 Audi Ag Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung
DE102010040553A1 (de) * 2010-09-10 2012-03-15 Siemens Aktiengesellschaft Spracherkennungsverfahren
DE102010049869B4 (de) * 2010-10-28 2023-03-16 Volkswagen Ag Verfahren zum Bereitstellen einer Sprachschnittstelle in einem Fahrzeug und Vorrichtung dazu
US9431012B2 (en) 2012-04-30 2016-08-30 2236008 Ontario Inc. Post processing of natural language automatic speech recognition
US9093076B2 (en) * 2012-04-30 2015-07-28 2236008 Ontario Inc. Multipass ASR controlling multiple applications
US9601111B2 (en) * 2012-11-13 2017-03-21 GM Global Technology Operations LLC Methods and systems for adapting speech systems
EP2733697A1 (en) * 2012-11-16 2014-05-21 QNX Software Systems Limited Application services interface to ASR
US9135916B2 (en) * 2013-02-26 2015-09-15 Honeywell International Inc. System and method for correcting accent induced speech transmission problems
KR101370539B1 (ko) 2013-03-15 2014-03-06 포항공과대학교 산학협력단 지시 표현 처리에 기반한 대화 처리 방법 및 장치
US10186262B2 (en) * 2013-07-31 2019-01-22 Microsoft Technology Licensing, Llc System with multiple simultaneous speech recognizers
US10885918B2 (en) 2013-09-19 2021-01-05 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
US9698999B2 (en) 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9601108B2 (en) 2014-01-17 2017-03-21 Microsoft Technology Licensing, Llc Incorporating an exogenous large-vocabulary model into rule-based speech recognition
US9552817B2 (en) * 2014-03-19 2017-01-24 Microsoft Technology Licensing, Llc Incremental utterance decoder combination for efficient and accurate decoding
US10749989B2 (en) 2014-04-01 2020-08-18 Microsoft Technology Licensing Llc Hybrid client/server architecture for parallel processing
CN113259736B (zh) * 2021-05-08 2022-08-09 深圳市康意数码科技有限公司 一种语音控制电视机的方法及电视机

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6249761B1 (en) * 1997-09-30 2001-06-19 At&T Corp. Assigning and processing states and arcs of a speech recognition model in parallel processors
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
DE19910234A1 (de) * 1999-03-09 2000-09-21 Philips Corp Intellectual Pty Verfahren mit mehreren Spracherkennern
US6526380B1 (en) 1999-03-26 2003-02-25 Koninklijke Philips Electronics N.V. Speech recognition system having parallel large vocabulary recognition engines
US7058573B1 (en) * 1999-04-20 2006-06-06 Nuance Communications Inc. Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
JP4465564B2 (ja) * 2000-02-28 2010-05-19 ソニー株式会社 音声認識装置および音声認識方法、並びに記録媒体
CA2408584A1 (en) * 2000-04-06 2001-10-18 One Voice Technologies, Inc. Natural language and dialogue generation processing
WO2001084535A2 (en) * 2000-05-02 2001-11-08 Dragon Systems, Inc. Error correction in speech recognition
US7464033B2 (en) * 2000-07-31 2008-12-09 Texas Instruments Incorporated Decoding multiple HMM sets using a single sentence grammar
JP2002116796A (ja) * 2000-10-11 2002-04-19 Canon Inc 音声処理装置、音声処理方法及び記憶媒体
US20020107695A1 (en) * 2001-02-08 2002-08-08 Roth Daniel L. Feedback for unrecognized speech
US6964020B1 (en) * 2001-02-22 2005-11-08 Sprint Communications Company L.P. Method and system for facilitating construction of a canned message in a microbrowser environment
US7072837B2 (en) * 2001-03-16 2006-07-04 International Business Machines Corporation Method for processing initially recognized speech in a speech recognition session
FR2832524A1 (fr) * 2001-11-22 2003-05-23 Cegetel Groupe Procede de gestion d'un document principal
US6898567B2 (en) * 2001-12-29 2005-05-24 Motorola, Inc. Method and apparatus for multi-level distributed speech recognition
US7177814B2 (en) * 2002-02-07 2007-02-13 Sap Aktiengesellschaft Dynamic grammar for voice-enabled applications
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US7184957B2 (en) * 2002-09-25 2007-02-27 Toyota Infotechnology Center Co., Ltd. Multiple pass speech recognition method and system
US20040158468A1 (en) * 2003-02-12 2004-08-12 Aurilab, Llc Speech recognition with soft pruning
DE602004011753T2 (de) * 2003-03-01 2009-02-05 Coifman, Robert E. Verfahren und Vorrichtung zum Verbessern der Transkriptionsgenauigkeit bei der Spracherkennung
US7603267B2 (en) * 2003-05-01 2009-10-13 Microsoft Corporation Rules-based grammar for slots and statistical model for preterminals in natural language understanding system
US7647645B2 (en) * 2003-07-23 2010-01-12 Omon Ayodele Edeki System and method for securing computer system against unauthorized access
NZ589653A (en) * 2004-06-04 2012-10-26 Keyless Systems Ltd System to enhance data entry in mobile and fixed environment
JP4574390B2 (ja) * 2005-02-22 2010-11-04 キヤノン株式会社 音声認識方法
DE102005030967B4 (de) * 2005-06-30 2007-08-09 Daimlerchrysler Ag Verfahren und Vorrichtung zur Interaktion mit einem Spracherkennungssystem zur Auswahl von Elementen aus Listen
JP2007057844A (ja) * 2005-08-24 2007-03-08 Fujitsu Ltd 音声認識システムおよび音声処理システム
US8688451B2 (en) * 2006-05-11 2014-04-01 General Motors Llc Distinguishing out-of-vocabulary speech from in-vocabulary speech

Also Published As

Publication number Publication date
WO2008000353A1 (de) 2008-01-03
CA2656114C (en) 2016-02-09
US9208787B2 (en) 2015-12-08
EP2036078A1 (de) 2009-03-18
CN101484934A (zh) 2009-07-15
KR20090033459A (ko) 2009-04-03
CN101484934B (zh) 2013-01-02
BRPI0713987A2 (pt) 2012-11-20
US20100114577A1 (en) 2010-05-06
DE102006029755A1 (de) 2008-01-03
CA2656114A1 (en) 2008-01-03
RU2432623C2 (ru) 2011-10-27

Similar Documents

Publication Publication Date Title
RU2009102507A (ru) Способ и устройство для естественно-речевого распознавания речевого высказывания
TWI253056B (en) Combined engine system and method for voice recognition
US10540979B2 (en) User interface for secure access to a device using speaker verification
TW200601263A (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
JPH0968994A (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
ATE421748T1 (de) Verfahren und anordnung zur spracherkennung
CN108091340B (zh) 声纹识别方法、声纹识别系统和计算机可读存储介质
Chuangsuwanich et al. Robust Voice Activity Detector for Real World Applications Using Harmonicity and Modulation Frequency.
CN111261145B (zh) 语音处理装置、设备及其训练方法
US20040073425A1 (en) Arrangement for real-time automatic recognition of accented speech
Ullmann et al. Objective intelligibility assessment of text-to-speech systems through utterance verification
Tian et al. Tone recognition with fractionized models and outlined features
EP2538407A3 (en) Framing method and apparatus
DE60014583D1 (de) Verfahren und vorrichtung zur integritätsprüfung von benutzeroberflächen sprachgesteuerter geräte
CN1249665C (zh) 语音识别系统
Vlaj et al. Voice activity detection algorithm using nonlinear spectral weights, hangover and hangbefore criteria
EP4360087A1 (en) Multi-encoder end-to-end automatic speech recognition (asr) for joint modeling of multiple input devices
CN108986844A (zh) 一种基于说话人语音特征的语音端点检测方法
RU2296376C2 (ru) Способ распознавания слов речи
CN1835077A (zh) 中文人名自动语音辨识输入方法及系统
KR101578766B1 (ko) 음성 인식용 탐색 공간 생성 장치 및 방법
Rahman et al. Speech recognition front-end for segmenting and clustering continuous bangla speech
Wand et al. Impact of different speaking modes on EMG-based speech recognition.
CN1825430A (zh) 可调适韵律的语音合成方法、装置及其对话系统
Rahman et al. Development of isolated speech recognition system for bangla words