RU96108879A - Способ распознавания слов в слитной речи и система для его реализации - Google Patents

Способ распознавания слов в слитной речи и система для его реализации

Info

Publication number
RU96108879A
RU96108879A RU96108879/09A RU96108879A RU96108879A RU 96108879 A RU96108879 A RU 96108879A RU 96108879/09 A RU96108879/09 A RU 96108879/09A RU 96108879 A RU96108879 A RU 96108879A RU 96108879 A RU96108879 A RU 96108879A
Authority
RU
Russia
Prior art keywords
output
input
vertex
acoustic
control unit
Prior art date
Application number
RU96108879/09A
Other languages
English (en)
Other versions
RU2101782C1 (ru
Inventor
Я.Ю. Изилов
Б.И. Морозов
А.И. Федотов
Ю.Р. Изилов
Original Assignee
Акционерное общество НПФ "СИСТЕМА"
Filing date
Publication date
Application filed by Акционерное общество НПФ "СИСТЕМА" filed Critical Акционерное общество НПФ "СИСТЕМА"
Priority to RU96108879A priority Critical patent/RU2101782C1/ru
Priority claimed from RU96108879A external-priority patent/RU2101782C1/ru
Application granted granted Critical
Publication of RU2101782C1 publication Critical patent/RU2101782C1/ru
Publication of RU96108879A publication Critical patent/RU96108879A/ru

Links

Claims (2)

1. Способ распознавания слов в слитной речи и система для его реализации, состоящий в том, что периодически с произнесением речевого высказывания берут выборки акустического оцифрованного сигнала этого высказывания через фиксированные интервалы времени с заданной частотой квантования в этом интервале и по совокупности этих выборок вычисляют функционал, определяющий текущее акустическое состояние, сравнивают полученные значения функционала с данными, предварительно сформированными сетью лексического декодирования, и по результатам сравнения строят гипотезы о возможных словах в высказывании, отличающийся тем, что на основе сети лексического декодирования, по вычисленным значениям функционала и результатам сравнения формируют последовательность эталонных функционалов, которую преобразуют в наиболее вероятную последовательность слов, при этом сеть лексического декодирования представляет собой интегрированную базу знаний, содержащую все ожидаемые акустические представления заданного набора слов в виде последовательностей эталонных функционалов, определяющих акустические состояния и объединяющую фонетическую транскрипцию, фонологические правила и лексику для заданного набора слов.
2. Система, реализующая способ по п. 1, содержащая последовательно соединенные акустический анализатор, включающий в себя частотный анализатор спектра, буфер хранения значений спектра, лексический анализатор, отличающаяся тем, что в акустический анализатор введены вычислители весового коэффициента и текущего акустического состояния, а в лексический анализатор введены определитель вершин сети лексического декодирования, блок хранения базы данных эталонных акустических состояний, блок сравнения текущего акустического состояния с эталоном, буфер памяти оценок сравнения, блок управления, селектор наилучшей оценки, блок проверки граничной вершины, буфер памяти предыдущих вершин, блок проверки паузы, блок проверки последовательности вершин, буфер памяти распознанных последовательностей вершин, устройство вывода, при этом первые входы вычислителей весового коэффициента и текущего акустического состояния соединены с выходом буфера хранения значений спектра, первый выход вычислителя весового коэффициента подключен к управляющему входу вычислителя текущего акустического состояния, второй выход вычислителя весового коэффициента подключен к первому входу определителя вершин сети лексического декодирования, первый выход которого соединен с входом блока хранения базы данных эталонных акустических состояний, второй выход определителя вершин сети лексического декодирования подключен к управляющему входу вычислителя весового коэффициента, выходы вычислителя текущего акустического состояния и блока хранения базы данных эталонных акустических состояний соединены соответственно с первым и вторым входами блока сравнения текущего акустического состояния с эталоном, выход которого подключен к буферу памяти оценок сравнения, выход которого подключен к первому входу блока управления, первый выход блока управления подключен к управляющему входу определителя вершин сети лексического декодирования, второй выход блока управления подключен к входу селектора наилучшей оценки, первый выход которого соединен с входом блока проверки граничной вершины, первый выход блока проверки граничной вершины подключен к входу блока проверки паузы, второй выход блока проверки граничной вершины подключен к первому входу буфера памяти предыдущих вершин, второй выход селектора наилучшей оценки подключен к второму входу буфера памяти предыдущих вершин, третий выход селектора наилучшей оценки подключен к второму входу блока управления, третий выход блока управления подключен к управляющему входу буфера памяти предыдущих вершин, первый выход которого соединен с входом блока проверки последовательности вершин, второй выход буфера памяти предыдущих вершин соединен с третьим входом блока управления, выход блока проверки последовательности вершин соединен с входом буфера памяти распознанных последовательностей вершин, первый выход которого соединен с первым входом устройства вывода, первый выход блока проверки паузы подключен к второму входу устройства вывода, второй выход блока проверки паузы подключен к управляющему входу блока проверки последовательности вершин, второй выход буфера памяти распознанных последовательностей вершин соединен с четвертым входом блока управления, четвертый выход блока управления подключен к управляющему входу буфера памяти оценок сравнения, пятый выход блока управления подключен к третьему входу устройства вывода.
RU96108879A 1996-05-06 1996-05-06 Способ распознавания слов в слитной речи и система для его реализации RU2101782C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU96108879A RU2101782C1 (ru) 1996-05-06 1996-05-06 Способ распознавания слов в слитной речи и система для его реализации

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU96108879A RU2101782C1 (ru) 1996-05-06 1996-05-06 Способ распознавания слов в слитной речи и система для его реализации

Publications (2)

Publication Number Publication Date
RU2101782C1 RU2101782C1 (ru) 1998-01-10
RU96108879A true RU96108879A (ru) 1998-05-20

Family

ID=20180188

Family Applications (1)

Application Number Title Priority Date Filing Date
RU96108879A RU2101782C1 (ru) 1996-05-06 1996-05-06 Способ распознавания слов в слитной речи и система для его реализации

Country Status (1)

Country Link
RU (1) RU2101782C1 (ru)

Similar Documents

Publication Publication Date Title
EP1610301B1 (en) Speech recognition method based on word duration modelling
EP0907949B1 (en) Method and system for dynamically adjusted training for speech recognition
US6571210B2 (en) Confidence measure system using a near-miss pattern
US5729656A (en) Reduction of search space in speech recognition using phone boundaries and phone ranking
US5794196A (en) Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules
US6076053A (en) Methods and apparatus for discriminative training and adaptation of pronunciation networks
EP0805434B1 (en) Method and system for speech recognition using continuous density hidden Markov models
KR100312920B1 (ko) 연결된음성인식의방법및장치
KR0123934B1 (ko) 저렴한 음성 인식 시스템 및 방법
US20050021330A1 (en) Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes
US5528725A (en) Method and apparatus for recognizing speech by using wavelet transform and transient response therefrom
KR20000004972A (ko) 음성 반응 장치에서 사용하기 위한 특징 발생 방법과 장치 및음성 인식 방법과 장치
WO2001022400A1 (en) Iterative speech recognition from multiple feature vectors
WO1998000834A9 (en) Method and system for dynamically adjusted training for speech recognition
US7769580B2 (en) Method of optimising the execution of a neural network in a speech recognition system through conditionally skipping a variable number of frames
EP0475759B1 (en) Phoneme discrimination method
CA2051602C (en) Method and apparatus for generating models of spoken words based on a small number of utterances
US4477925A (en) Clipped speech-linear predictive coding speech processor
Rao et al. Glottal excitation feature based gender identification system using ergodic HMM
RU96108879A (ru) Способ распознавания слов в слитной речи и система для его реализации
RU97117246A (ru) Способ лексической интерпретации слитной речи и система для его реализации
KR0176788B1 (ko) 음성인식의 자동모델 결정방법
Fotinea et al. Emotion in speech: Towards an integration of linguistic, paralinguistic, and psychological analysis
Mayora-Ibarra et al. Time-domain segmentation and labelling of speech with fuzzy-logic post-correction rules
RU2101782C1 (ru) Способ распознавания слов в слитной речи и система для его реализации