RU96108879A - Способ распознавания слов в слитной речи и система для его реализации - Google Patents
Способ распознавания слов в слитной речи и система для его реализацииInfo
- Publication number
- RU96108879A RU96108879A RU96108879/09A RU96108879A RU96108879A RU 96108879 A RU96108879 A RU 96108879A RU 96108879/09 A RU96108879/09 A RU 96108879/09A RU 96108879 A RU96108879 A RU 96108879A RU 96108879 A RU96108879 A RU 96108879A
- Authority
- RU
- Russia
- Prior art keywords
- output
- input
- vertex
- acoustic
- control unit
- Prior art date
Links
- UIIMBOGNXHQVGW-UHFFFAOYSA-M buffer Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 claims 10
- 238000001228 spectrum Methods 0.000 claims 3
- 238000011156 evaluation Methods 0.000 claims 1
- 239000012536 storage buffer Substances 0.000 claims 1
- 230000035897 transcription Effects 0.000 claims 1
Claims (2)
1. Способ распознавания слов в слитной речи и система для его реализации, состоящий в том, что периодически с произнесением речевого высказывания берут выборки акустического оцифрованного сигнала этого высказывания через фиксированные интервалы времени с заданной частотой квантования в этом интервале и по совокупности этих выборок вычисляют функционал, определяющий текущее акустическое состояние, сравнивают полученные значения функционала с данными, предварительно сформированными сетью лексического декодирования, и по результатам сравнения строят гипотезы о возможных словах в высказывании, отличающийся тем, что на основе сети лексического декодирования, по вычисленным значениям функционала и результатам сравнения формируют последовательность эталонных функционалов, которую преобразуют в наиболее вероятную последовательность слов, при этом сеть лексического декодирования представляет собой интегрированную базу знаний, содержащую все ожидаемые акустические представления заданного набора слов в виде последовательностей эталонных функционалов, определяющих акустические состояния и объединяющую фонетическую транскрипцию, фонологические правила и лексику для заданного набора слов.
2. Система, реализующая способ по п. 1, содержащая последовательно соединенные акустический анализатор, включающий в себя частотный анализатор спектра, буфер хранения значений спектра, лексический анализатор, отличающаяся тем, что в акустический анализатор введены вычислители весового коэффициента и текущего акустического состояния, а в лексический анализатор введены определитель вершин сети лексического декодирования, блок хранения базы данных эталонных акустических состояний, блок сравнения текущего акустического состояния с эталоном, буфер памяти оценок сравнения, блок управления, селектор наилучшей оценки, блок проверки граничной вершины, буфер памяти предыдущих вершин, блок проверки паузы, блок проверки последовательности вершин, буфер памяти распознанных последовательностей вершин, устройство вывода, при этом первые входы вычислителей весового коэффициента и текущего акустического состояния соединены с выходом буфера хранения значений спектра, первый выход вычислителя весового коэффициента подключен к управляющему входу вычислителя текущего акустического состояния, второй выход вычислителя весового коэффициента подключен к первому входу определителя вершин сети лексического декодирования, первый выход которого соединен с входом блока хранения базы данных эталонных акустических состояний, второй выход определителя вершин сети лексического декодирования подключен к управляющему входу вычислителя весового коэффициента, выходы вычислителя текущего акустического состояния и блока хранения базы данных эталонных акустических состояний соединены соответственно с первым и вторым входами блока сравнения текущего акустического состояния с эталоном, выход которого подключен к буферу памяти оценок сравнения, выход которого подключен к первому входу блока управления, первый выход блока управления подключен к управляющему входу определителя вершин сети лексического декодирования, второй выход блока управления подключен к входу селектора наилучшей оценки, первый выход которого соединен с входом блока проверки граничной вершины, первый выход блока проверки граничной вершины подключен к входу блока проверки паузы, второй выход блока проверки граничной вершины подключен к первому входу буфера памяти предыдущих вершин, второй выход селектора наилучшей оценки подключен к второму входу буфера памяти предыдущих вершин, третий выход селектора наилучшей оценки подключен к второму входу блока управления, третий выход блока управления подключен к управляющему входу буфера памяти предыдущих вершин, первый выход которого соединен с входом блока проверки последовательности вершин, второй выход буфера памяти предыдущих вершин соединен с третьим входом блока управления, выход блока проверки последовательности вершин соединен с входом буфера памяти распознанных последовательностей вершин, первый выход которого соединен с первым входом устройства вывода, первый выход блока проверки паузы подключен к второму входу устройства вывода, второй выход блока проверки паузы подключен к управляющему входу блока проверки последовательности вершин, второй выход буфера памяти распознанных последовательностей вершин соединен с четвертым входом блока управления, четвертый выход блока управления подключен к управляющему входу буфера памяти оценок сравнения, пятый выход блока управления подключен к третьему входу устройства вывода.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU96108879A RU2101782C1 (ru) | 1996-05-06 | 1996-05-06 | Способ распознавания слов в слитной речи и система для его реализации |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU96108879A RU2101782C1 (ru) | 1996-05-06 | 1996-05-06 | Способ распознавания слов в слитной речи и система для его реализации |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2101782C1 RU2101782C1 (ru) | 1998-01-10 |
RU96108879A true RU96108879A (ru) | 1998-05-20 |
Family
ID=20180188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU96108879A RU2101782C1 (ru) | 1996-05-06 | 1996-05-06 | Способ распознавания слов в слитной речи и система для его реализации |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2101782C1 (ru) |
-
1996
- 1996-05-06 RU RU96108879A patent/RU2101782C1/ru active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1610301B1 (en) | Speech recognition method based on word duration modelling | |
EP0907949B1 (en) | Method and system for dynamically adjusted training for speech recognition | |
US6571210B2 (en) | Confidence measure system using a near-miss pattern | |
US5729656A (en) | Reduction of search space in speech recognition using phone boundaries and phone ranking | |
US5794196A (en) | Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules | |
US6076053A (en) | Methods and apparatus for discriminative training and adaptation of pronunciation networks | |
EP0805434B1 (en) | Method and system for speech recognition using continuous density hidden Markov models | |
KR100312920B1 (ko) | 연결된음성인식의방법및장치 | |
KR0123934B1 (ko) | 저렴한 음성 인식 시스템 및 방법 | |
US20050021330A1 (en) | Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes | |
US5528725A (en) | Method and apparatus for recognizing speech by using wavelet transform and transient response therefrom | |
KR20000004972A (ko) | 음성 반응 장치에서 사용하기 위한 특징 발생 방법과 장치 및음성 인식 방법과 장치 | |
WO2001022400A1 (en) | Iterative speech recognition from multiple feature vectors | |
WO1998000834A9 (en) | Method and system for dynamically adjusted training for speech recognition | |
US7769580B2 (en) | Method of optimising the execution of a neural network in a speech recognition system through conditionally skipping a variable number of frames | |
EP0475759B1 (en) | Phoneme discrimination method | |
CA2051602C (en) | Method and apparatus for generating models of spoken words based on a small number of utterances | |
US4477925A (en) | Clipped speech-linear predictive coding speech processor | |
Rao et al. | Glottal excitation feature based gender identification system using ergodic HMM | |
RU96108879A (ru) | Способ распознавания слов в слитной речи и система для его реализации | |
RU97117246A (ru) | Способ лексической интерпретации слитной речи и система для его реализации | |
KR0176788B1 (ko) | 음성인식의 자동모델 결정방법 | |
Fotinea et al. | Emotion in speech: Towards an integration of linguistic, paralinguistic, and psychological analysis | |
Mayora-Ibarra et al. | Time-domain segmentation and labelling of speech with fuzzy-logic post-correction rules | |
RU2101782C1 (ru) | Способ распознавания слов в слитной речи и система для его реализации |