SU1037292A1 - Способ селекции признаков дл распознавани речевых сигналов - Google Patents

Способ селекции признаков дл распознавани речевых сигналов Download PDF

Info

Publication number
SU1037292A1
SU1037292A1 SU823435440A SU3435440A SU1037292A1 SU 1037292 A1 SU1037292 A1 SU 1037292A1 SU 823435440 A SU823435440 A SU 823435440A SU 3435440 A SU3435440 A SU 3435440A SU 1037292 A1 SU1037292 A1 SU 1037292A1
Authority
SU
USSR - Soviet Union
Prior art keywords
time interval
threshold time
pulses
speech signals
reference sequences
Prior art date
Application number
SU823435440A
Other languages
English (en)
Inventor
Петр Григорьевич Кузнецов
Вадим Евгеньевич Лялин
Владимир Степанович Поздеев
Original Assignee
Ижевский механический институт
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ижевский механический институт filed Critical Ижевский механический институт
Priority to SU823435440A priority Critical patent/SU1037292A1/ru
Application granted granted Critical
Publication of SU1037292A1 publication Critical patent/SU1037292A1/ru

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

СПОСОБ СЕЛЕКЦИИ ПРИЗНАКОВ ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ, основанный на выделении огибающей речевого сигнала, сравнении ее ампли туды с амплитудой порюгового напр жени  и формировании порогового временного интервала, опорных последовательностей речевых сигналов и импульсов,.отличающийс  тем, что, с целью повышени  надежности селекции признаков, инве1 тируют амплитуды опорных речевых сигналов, последовательно суммируют их с амплитудой огибающей речевого сигнала и в моменты формировани  порогового временного интервала преобразуют амплитуду полученного суммарного сигнала в последовательность сигналов признаков путем временной Кюдул ции опорной последовательности импульсов длительностью соответствующео в го порогового временного интервала.

Description

Изобретение относитс  к технической кибернетике, в частности к способам распознавани  образцов, и может быть использовано при идентификации личности по полосу.
Известен способ селекции приэнаков дл  распознавани  речевых сигналов , основанный на преобразовании речевого сигнала в последовательност опорных сигналов, измерении амплитуд этих .сигналов и их сравнении с амплитудами пороговых сигналов Г1.3 ; Наиболее близким к изобретению по; технической сущности  вл етс  способ основанный на преобразовании речевого сигнала в последовательность опорных сигналов, выделении спектральных характеристик сигналов и сравнении их с эталонными характеристикаг м образцов t23.
Недостаток известных устройств состоит в невысокой надежности селекции признаков,
Цель изобретени  состоит в повышении надежности селекции признаков
Поставленна  цель достигаетс  тем что согласно способу, основанному на выделении огибающей речевого сигнала сравнении ее амплитуды с амплитудой порогового напр жени  и формировании порогового временного интервала, опорных последовательностей речевых сигналов и имйульсов, инвертируют амплитуды опорных речевых сигналов, последовательно суммируют их с амплитудой огибающей речевого сиг- . нала и в моменты формировани  порегового Временного интервала преобразуют амплитуду полученного суммарного сигнала, в последовательность сйгналовттризнаков путем временной модул ции опорной последовательности импульсов длительностью соответствующего порогового временного интервала .
На чертеже представлена предлагае ма  блок-схема устройства.
Речевой сигнал поступает на вход усилител  1, с выхода которого подаетс  на формантные фильтры 2-4 с детекторами огибающей, выдел ющие амплитуды Aj опорных сигналов. Амплитуда огибающей речевого сигнала выдел етс  детектором 5 и подаетс . на блоки б-в последовательного вычитани . Блок 9 формирует пороговый интервал, начало которого определ етс  по превышению амплитуды речевого сизгнала над амплитудой эталонного сигнала, а конец, наоборот по превышению амплитуды эталонного сигнала над амплитудой речевого сигнала.. Выход блока 9 подаетс  на управл ющий вход генератора 10 импульсов , который через схе№а совпадени  11-13 осуществл ет ввод разностных сигналов в блок 14 прин ти  решени .
Импульсы основного тона выдел ютс  блоком 15 и через схему 16 совпадени  подаютс  на счетчик 17. Врем  счета определ етс  длительностью временного интервала, вырабатыва мого блоком 18.
Дл  управлени  работой блока 14 прин ти  решени , блока 19 пам ти и с 1етчика 17 служит блок 20 управлени- .
Речёврй сигнал усиливаетс  усилителем 1 и раздел етс  на формантные .области спектра, фильтрами 2-4, на выходах которых получаютс  амплитуды опорных сигналов А - А.. На выходе детектора 5 выдел етс  амплитуда речевого сигнала. На выходах блоков 6-8 последовательного вычитани  из опорных сигналов А - А$ формируютс  разностные сигналы. Врем  анализа определ етс  длительностью временного интервала, вырабатываемого блоком 9. В течение этого времени интервала генератор 10 импульсов вырабатывает последовательность импульсов, которые через схемы 11-13 совпадени  осуществл ют ввод разностных сигналов в блок 14 прин ти  решени .
Дл  выделени  импульсов основного тона используетс  блок 15, средн   частота основного тона пропорционгшьна числу импульсов, прошедших через схему 16 совпадени , и подсчитываетс счетчиком .17. Врем  счета определ етс  длительностью заданного временного интервала, формируемого блоком .18. Эталонные характеристики образов хран тс  в блоке 19 пам ти. Блок 20 управлени  вырабатывает необходимые управл ющие .сигналы дл  начальной установки счетчика 17, запуска блока 14 прин ти  решени  и выдачи эталонных характеристик образов из блока 19 пам ти.
Проводились экспериментальные исследовани  предлагаемого способа. В качестве речевого материала использовались 1200 произнесений слова Аэлита дл  60 мужских и женских голосов, по 20 произнесений на одного диктора. Граничные частоты формант .ных фильтров 2-4 бьши равны соответственно 200-850, 850-2200, 2200-3400 Гц. Временной интервал соответствовал участку слова Аэли. За это врем  в блок 14, в качестве которого использовалась ЭВМ Наири-3-1, оснащенна  устройством вёода аналоговых сигналов, вводилось в.среднем, 30 отсчетов разностных сигналов. Программным путем формировалось дл  любого произнесени  10 отсчетов, нормализованных по времени Средн   частота основного тона под

Claims (1)

  1. СПОСОБ СЕЛЕКЦИИ ПРИЗНАКОВ ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ, основанный на выделении огибающей речевого сигнала, сравнении ее ампли туды с амплитудой порогового напря жения и формировании порогового временного интервала, опорных последовательностей речевых сигналов и импульсов, отличающийся тем, что, с целью повышения надежности селекции признаков, инвертируют амплитуды опорных речевых сигналов, последовательно суммируют их с амплитудой огибающей речевого сигнала и в моменты формирования порогового временного интервала преобразуют амплитуду полученного суммарного сигнала в последовательность сигналов признаков путем временной Модуляции опорной последовательности импульсов длительностью соответствующего порогового временного интервала.
SU823435440A 1982-05-06 1982-05-06 Способ селекции признаков дл распознавани речевых сигналов SU1037292A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU823435440A SU1037292A1 (ru) 1982-05-06 1982-05-06 Способ селекции признаков дл распознавани речевых сигналов

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU823435440A SU1037292A1 (ru) 1982-05-06 1982-05-06 Способ селекции признаков дл распознавани речевых сигналов

Publications (1)

Publication Number Publication Date
SU1037292A1 true SU1037292A1 (ru) 1983-08-23

Family

ID=21010862

Family Applications (1)

Application Number Title Priority Date Filing Date
SU823435440A SU1037292A1 (ru) 1982-05-06 1982-05-06 Способ селекции признаков дл распознавани речевых сигналов

Country Status (1)

Country Link
SU (1) SU1037292A1 (ru)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1. Патент US 36637.58, кл. 179-1, опублик. 1972. 2. Патент US 3770892, кл. 179-1, опублик. 1973 (прототип). *

Similar Documents

Publication Publication Date Title
US3416080A (en) Apparatus for the analysis of waveforms
US3553372A (en) Speech recognition apparatus
US3770892A (en) Connected word recognition system
Seneff Pitch and spectral estimation of speech based on auditory synchrony model
FR2372486B1 (ru)
EP0074822B1 (en) Recognition of speech or speech-like sounds
EP0182989B1 (en) Normalization of speech signals
US4829572A (en) Speech recognition system
JPS5648686A (en) Sound pitch period extractor
CA1193731A (en) Speech analysis system
US3755627A (en) Programmable feature extractor and speech recognizer
GB1261385A (en) Speech analyzing apparatus
SU1037292A1 (ru) Способ селекции признаков дл распознавани речевых сигналов
GB981153A (en) Improved phonetic typewriter system
Herscher et al. An adaptive isolated-word speech recognition system
EP0157497A1 (en) Improved phonemic classification in speech recognition system
US3846586A (en) Single oral input real time analyzer with written print-out
JPS58108590A (ja) 音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
IT1007572B (it) Apparecchiatura per il riconoscimen to della parola
SU762031A1 (ru) УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι .
Purton Speech recognition using autocorrelation analysis
SU594519A1 (ru) Способ обработки речевого сигнала
JPS5936759B2 (ja) 音声認識方法
DE173986T1 (de) Verfahren und vorrichtung zur erkennung von wortfolgen, die zu kleinen vokabularien gehoeren, ohne vorausgehendes training.