SU762031A1 - УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι . - Google Patents

УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι . Download PDF

Info

Publication number
SU762031A1
SU762031A1 SU752190038A SU2190038A SU762031A1 SU 762031 A1 SU762031 A1 SU 762031A1 SU 752190038 A SU752190038 A SU 752190038A SU 2190038 A SU2190038 A SU 2190038A SU 762031 A1 SU762031 A1 SU 762031A1
Authority
SU
USSR - Soviet Union
Prior art keywords
speech
blocks
invariants
outputs
signals
Prior art date
Application number
SU752190038A
Other languages
English (en)
Inventor
Oleg F Menshikh
Original Assignee
Oleg F Menshikh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oleg F Menshikh filed Critical Oleg F Menshikh
Priority to SU752190038A priority Critical patent/SU762031A1/ru
Application granted granted Critical
Publication of SU762031A1 publication Critical patent/SU762031A1/ru

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Изобретение относится к области приборостроения и может быть использовано· для распознавания речевых команд, найрййёр4;"' при построении кибернетических систем. ί
Известны фонетические печатающие Машины, в .которых используются в разных модификациях блоки частотного разделения и формирования частотно-временных рас- ’ пределений для отдельных фонем, блоки сопоставления признаков фонем, записанных в, блоках .памяти, с текущими частотновременными распределениями и управляющие системы печатающих автоматов [1].
Недостаток этих устройств заключается в сравнительно невысокой достоверности распознавания речевых сингалов? .....’
•Наиболее близким к описываемому является устройство' для .рас1Гоз:наТ^^й'йЯ$й€^'· ,вы.\» сигналов, содержащее последователь-, но соединенные многоканальный .полосовой фильтр формантных участков спектра, логическую схему выделения речевых инвариантов, блоки сравнения текущей _и эталонных последовательностей речевых' цмвариантбв' с подключенным к ним блоком хранения эталонных последовательностей речевых инвариантов, а также пороговые схемы, включенные между блоком кодирования опознаваемых слов и'блоком сравнениятё2
кущей и эталонных последовательностей речевых инвариантов {2]. *
...../ Недостатком этого устройства является
сравнительно .невысокая· достоверность распознавания речевых бигналав.
В этом устройстве распознавания схема выделения речевых' инвариантов содержит детекторы Огибающих,' что снижает достоверность и однозначность распознавания речевых стимулов: Кроме того, использова’ ни'е такой схемы в устройствах расйознава' пня целых звукосочетаний (слов) также снижает надежность правильного распознавания из-за ограниченного набора фонем ' 1 данного языка и сильного' влияния вариа" ции характеристик речи (громкости, основ.ного тона и темпа) на форму нормирован‘ ных ' огибающих продетектированных: вре' .менных реализаций речевых сигналов при 1 их полосовом анализе. ' "
Цель 'изобретения заключается .в .повышений достоверности' распознавания речевых сига а лав.
, Поставленная цель достигается за счет ’ того, что логическая схема выделения речевых инвариантов выполнена в виде последовательно соединенных- преобразователей Фурье, анализаторов и нормализаторов
'спектральной плотности и спектрального· ® положения, функциональных преобразова
**ϊ ·χ Л Ч'-^ίίίί?· -^870:½ - 1
762031
,*л~
«βΜ»^ν4Μ»»Β^'>ίβ *.*·* ΰ’β-Γ*'·
-^Зил-" ££ ?. *£ ζ- - -, |
телей, блоков записи,
•’Λιίί «ϊ^“·*χ<ί&ΐίΑϊΜίβ,ν ι т.глк*иЪ5**.*ва^^иЬ»*^л
10
Μ н огоу СТО ИЧИВЫ X запоминающих элементов и блоков вос' .произведения, а’ также старт-стонного ’бло1 ка, входы которого подключены к допоЛни' тельным выходам функциональных преобразователей’ а выходы — к , управляющим входам блоков воспроизведения/ '; ”
'На .чертеже представлена · функциональная схема предлагаем;ого устройства;
Устройство ' содержит £ полосовых фильтров У формантных участков спектра,
связанных с У. преобразователями Фурье 2. '. Каждый из преобразователей Фурье связан с‘.двумя труппами анализаторов: анализатор а ми 3 спектр альной пл отнести 'и ал а л и - У 5 Заторами 4 спектрал£йотЬ по'ДоЯе'ййя спёкт’ ральных функций, для ‘неэквидисталтной х ' временной* последовательности К нсстациопарных участков. Выходы анализаторов спектральной плотности соединены с'норма^-. 20
.....лизатором спектральной плотности 5, а вы" ходы анализаторов 4 — с нормализатором,
' 6 спектрального. положения. В каждом из.
этих нормализаторов осуществляется рдно. моментное «ормирое.ание сигналов между 25 . всеми У, каналами взаимно, так ,что текущая сумма верх К нормирован,ных компо. ' лрнт сигналов н'а Ь выходах Нормализаторов .всегда постоянна н равна, например,
У ” единице. ·'·"· 1 ·'· у ’ 30
.....Одноймен ные по Δ капала'м выходы уха -. ,у.
занных' нормализаторов по)п'арЛо“'‘с'оё'ДЛнёны с Λ функциональными преобразователями 7 двумерных (последовательностей, аналого' вых' сигналов В .мономер'ны'е ' дискретные 35 ’ Цбследо'в’ательНосЬп сигналов. """ "‘ ' ; :
Выходы функциональных преобразователей подключены к £ блокам записи 8 . дискретных #-з’ЙйкНЙд‘~Ч№
'тей сигналов. Каждый из этих блоков заци- 40 си имеет Ктах ’вЫходо! записи 7?-з,начных .....'чисел' (где λ™* —
ний чисел К для заданного словаря) ; нод- ·"· "“Иоёдйнёнлых” к ; мнбгбустойчЙЙЙМ'®*'з'апб'минающим элементам Р. Запись^ на 'эти 45 ' элементы ' осуществляется поочерёдно Ио
мере возникновения дискретных Я-знйч- ных сообщений на выходах функ'циональ; н’ых преобразователей,' 'причем ' по ' "всем·.
.....имеющимся в системе Ь каналам. По мере 50
г окончания 'Зв^осбчётанйй'нрйзнакп устойчивых ' состояний в многоустойчивых элементах в той же п'бблед'бватсльности, что и при записи, сипхр'бПйо'ДкВрёмя-эквидистаптно (то есть с постоянным .периодом) воспроизводятся с помощью У- блоков воспроизведения 10, управление Воспроизведением в ‘йбТбфй'Х’"'исущеёкёляствгввпхрФкй^О^йй,· у ; вырабатываемыми" в.старт-стопном блоке , 11, '^ТблЫ'" НоторОгб 'Связаны' с выходами 60 функциональных преобразователей. Йрй этом на выходах . блоков .воспроизведения ' образуются в Целом матрица фёчерытонн-_. вариантов, состоящая из £ строк ή К столбцов (по' числу фонемных. переходов для 65
55
опознаваемого слова). Причем каждое значение. элемента . · матрицы задается Рдискретами (уровнями или' какими-либо другими признаками устойчивых состояний многоустойчивых элементов).·.
Выходы Ь блоков воспроизведения подключены ко входам к блоков сравнения текущей и эталонных· последовательностей речевых инвариантов 12, выполненных; на-, пример, в вйдё оптико-акустических корреляторов с голографическими ЛС-каналЬны",Мй транспарантами эталонных одностроч-> ных'" последовательностей речевых ННвариантов (при этом Ь односторонних по- следоватёльноетей составляют по .каждому 'из! N одноименных каналов транспаранта соответствующую эталонную матрицу речевые инвариантов; , число таких матриц-эталонов ’ соответственно равно Ν). Эталонная’последовательность речевых •инвариантов для заданного словаря хранится, в бло-, ке 13 хранения’ эталонных последовательностей. инвариантов. На N выходах корреляторов образуются в процессе сравнения матрир: текущей и эталонных, сигналыфункции правдоподобия,' сопоставление значений которых, в Ь пороговых схемах 14 раздельно по веем А каналам корреляторов позволяет найти ту из них для каждого из корреляторов, которая соответствует (с наибольшим, значением апюстерйо.рной вероятности) номеру 7г. опознав а еморо звукосочетания (слова)где η = 1, 2, 3,... Ν, а N — число слов в словаре распознающего устройства. Выходы £/пороговых схем (чис'ло'выходов в каждом' из них равно 'Ν) соединены с 7-зходовым ... У-канальным устройством 15 кодирования”' опознаваемых" слов; например конъюнктором или схемой взвешенного 'суммирования, содержащими N кодирующих слова выходов. На выходах нормализаторов 5 и 6 образуется две равномо.щные матрицы чисел (значения . каждого " из 'которых йепьше единицы и ’.; дробно), содержащие по'АС строк каждая. •Послёдовател^ность чисел этих матриц отвечает усредненным .спектральным характери'стикам речевого сигнала и является Вн'вари'аи'гной по отношению к' интенсивности .речевого: сигнала (благодаря’ операции нормализации)' и к 'основному тону его. (также благодаря нормализации в 'блоке б) .·,·’ 'Указанные последовательности дробных чи” сСд поступают затем на парные входы £ функциональных преобразователей 7 двумерных последовательностей указанных дробных чисел в мономерный ряд целых·, Чисел. //Тор—- 777717: 7'-и · '
(, На £ выходах' функциональных лреобразователеи 7 образуется так .называемая ядерная матрица, мономерно и однозначно отображающая векторные характеристики усредненных и нормированных значении · спектральной'’ плотности и спектрального, положения для последовательности К фо-"
Λ 762031
А' немных переходов з каждом' из А формантных каналов для |рассмат.рива'емдго речевого сигнала.(слова). ‘ А
; , 1 Анализируемый речевой сигнал поступает на входы £ полосовых «фильтров 1
. " " формантных участков спектра, где подвергается разделению по "спектру на А лоддиа,, . пазонов рпектра. «С выходом этих полосовых фильтров отфильтрованные Иаст.и сигнала поступают .на Ь преобразователей Фурье 2, каждый из .которых связан с парой ’ анализаторов: анализаторами спектральной плот. ности 3 и анализаторами спектрального положения 4. работающих ''дискретно раз1' д'ельно по каждому из К нестационарных участков речевого сигл1аДа (данного слова),
’ соответствующих Переходам между сАеж1 ными фонемами., Действие анализаторов 3, ή4 сводится к выработке Ь пар. электриче- ‘
' ских сигналов (по числу формантных фильтров /), отображающих средние мгновенные значения, кусочных спектров речевого .сигнала. В блоках 5 и 6 осуществляется нор-миА'А’ рование посредством суммирования' чисел'
по .всем'каналам· анализаторов 3 и 4 м вьг- ' р'г ’ числения отношений., .каждого из зходящих ' в нормализатор чисел к .образованной сумме. Сумма полученных отношений входя-: щйх чисел на выходах нормализаторов 5 и:
. · , - 6 будет равна единице на каждом из них. *;.
' А ..ВблокезаписиЯосуществляетс^оиера< щия л'осЛёД'с)1вательного распределения ядер')
• данной строки ядерной матрицы пб после.у'.:"'’·· довательности К многозначных элементов
• ' в соответствии с номерами столбцов ядёр-.
ной матрицы и операции'возбуждения. в А-значных элементах памяти соответствующих устойчивых состояний, отвечаю-, щйх значениям ядер (величины, отображающие ядра, принимают значения от } до/
' В и Являются целбчисленйымн). Эти опера-’'
• Ции возбуждения устойчивых состояний >в Д-зн'ачных элементах памяти по. своей
' > технической сущности определяются структурой применяемых для записи ^-злачных запоминающих устройств. В качестве
• · А ' последних могут быть нспользорань! раз’личные многозначные элементы.. Воспроиз. ’· ведение состояний А-значны'х элементов,
. связанных, с записью одной из А яДерных цепей (строк ядерной мвтрицы), осуществляется с Помощью соот.ветству(ощегб блока
·« У воспроизведения, число которых в устройстве равно А. Работой ' блоков воспроизведения управляет старт-стоп,ный . блок 11,
который выдает команду на воспроизведение по мере того, как будет’ установлено,
> что· анализируемый речевой сигнал окончил,.. . . 1ёя (например, по паузе между послёДова-’
тельностью речевых'сигналов, как ,в известАйнТХ^айТомаДах). Для определения оконча1'А ' АнИЯ речевого ‘сигнала блок 44 связан своиг
йьк.-еАв.'' мН 'входами с выходами функциона'льных дийюуиам^ преобразователей 7, при этом отсутствие в ^^^^Я8’’^йИТё‘‘1(ЗДЖйбТб~''й.нтерва ла врёмейи’ (вре’ мёни, соизмеримом с Длительностью паузы, между словами, .произносимыми диктором) поступления’ ядер с выходов функциональных преобразователей 7 указывает на факт
5 окончания данного распознаваемого рече-’ вого сигнала (слова)’ Интервал времени,
, .'соответствующий паузе между словами, по·.· следовательно произносимыми. диктором,
определяется статистически и, в соответ- ' > •в ствии с рекомендациями,'’ ' сообщаемыми' А
диктору для .производства правильного чтения. Этот интервал задается в блоке 11 соответствующей ' уставкой,, регулируемой в некоторых пределах’ в, зависимости, от
15, темпа чтения диктора. Для того, чтобы'
. воспроизведение состояний и,з совокупности
’ всех многоустойчивых запоминающих эле, 'ментов/было произведено до привода новых '
:записей в этй'элементы от Действия’ нового А 20 речевого сигнала, процесс воспроизведений’
'осуществляется’ за Интервал времени, со- ставляющйй некоторую часть паузы между у последовательными речевыми сигналами.
- Значение тактовой частоты формируется в '· '
25 блоке 14. При этом блоки воспроизведения : АА 10 'работают в режиме' информационных . " ;.
регистров сдвига/управляемых тактовыми у синхроимпульсами с. выходов блока 14 и
/.. транслирующих ’ на выходы блоков вос30 произведения радиоимпульсы 'яосЛедб’ва’’ тельно с каждого йз опрашиваемых многоустойчивых элементов, частоты заполнения которых равны' частотам устойчивых состоя-,
' ний. Опрос многозначных элементов в каж- . . ...у
35 дой из А строк матрицы ядер производится только по К записанным данным речевым
' сигналом многозначным элементам, но не ' ’
• по всем Атах элементам, принадлежащим - данной строке, максимально возможной по у 40- размеру ядерной матрицы. Обрыв .в опросе ‘‘А МНОГОЗНаЧНЫХ ЭЛемеНТОВ ИЗ Атах возможных элементов происходит на* основе подсчета числа^дер А при записи даннбго .
/ речевого "сигнала, в блоке 11, в котором 45 формируется пакет тактовых синхроимПуль? ’ Асов с числом импульсов в пакете, равным .
·. ι А.. Кроме того, запись и воспроизведение
значений ядер в многозначных ' элементах . .·
всегда '.происходит от первого элемента по
50 каждому из А каналов записи (число каналов равно А). Таким образом, на выходах .
блоков' воспроизведения в процессе воспроповедения (время-эквидистантной «сшив- . .
ки») преобразованных ядер' ядерной матри55 цы и при использовании в .качестве многозначных элементов памяти спектротронов образуется частотно-ядерная матрица с эк, '©вдистрнтным.. во ' времени ' распределением У
" . ядер вдоль строк такой матрицы, причем яд-
60 ра ее задаются .значениями фиксированных
частот несущих колебаний в радиоимпульусах, длительность которых определяется периодом такта считывания. Совокупность из А
частотно-маннпулированных сигналов пр'ед65 стреляет собой рёчевой инвариант, подле1 /
4 762031
-φ..,,- '. ' . 7 / / /
жащий распозиаваипю на основе многоканальной' корреляции N эталонными записями-транспарантами пространственно пре- образованных частотно-манипулированных Ν-совокупностей' сигналов,/ -полученных^ 5 на этапе обучения автомата для решения задачи распознавания N слов, составляющих ‘заданный словарный запас для рассматриваем οιτο устройства. На выходах блоков во-спроизврдения образуется после- 10 дёвательнОсть речевых инвариантов.
Указанные -выходы речевых инвариантов соединены, соответственно с £ входами А-каналЬных корреляторов 12, которые удобно выполнять в виде-оптико-акустических кор- 15 рёляторов (используя фактор д-ву-мёрности преобразования для оптического поля), в которых применены У-канальныеопорные транспаранты, с записанными на них последовательностями речевых инвариантов для 20 всех N слов заданного словарного запаса.
Роль устройств памяти эталонных последовательностей речевых, инвариантов для за- , данного'словаря из N -слов выполняет блок- , 13. ; г . -' ' 25
(Корреляционная обработка текущей совокупности £ частотно-манипулированных сигналов ,в блоках 12 с транспарантами из блока 13 приводит к появлению/на выходах .. корреляторов (число таких выходов равно 30 пр опзв сд еип ю чис ла') з ап и с а нН ы х и а транспара-птахN -слов -на число формантных каналов £) соответствующих кроссчкоррёляци- очных 'функций в форме радиочастотных сигналов, огибающие которых характери- 35
' зуют степень совпадения текущего раёпре- '·· деления исследуемой частотно-,манипулированной последовательности в N каналах коррелятрров для данного речевого сигнала' с -одной из £ групп записей на £ опорных ад транспарантах блока 13, каждый'из которых имеет А опорных записей ' пространственногораспределения 'частотно-мапппу- "·· лированных сигналов, -поЛученных на этапе обучения авто-мата распознавания, в кото- 45 ром бйл достигнут макснму'м'-'максйм'орум ' огибающей кросс-коррёляционной функции. Операция индикации такого канала осуществляется на основе порогового ограничения п-о минимуму в £ пороговых схемах 50 14 раздельно по всем N выходным каналам коррелятора. Поскольку записи опорных сигналов .на £ транспарантах при обучении осуществляются на одноименных каналах транспарантов (для Одного'и того же ело- 55 ва), на £ одноименных выходах корреляторов огибающие кро-сс-корреляционных функ- цйй'достигнут, максимума-макснморума при корреляционной обработке £ -частотно-ма.ни-пули-р-о,ванных -сигналов, ,отображающих 60 речевые инварианты распориаваемото речевого сигнала (слова). Следовательно, толь- ко на £ одноименных выходах .пороговых · схем /-'/появятся компа,рисованные -сигналы уровня «1», а на остальных выходах этих 65
_ 8
пороговых схем будут регистрироваться сигналы уровня «О» (то есть будут отсутствовать корреляционные отклики).
Выходные сигналы уровня «1» с одноименных выходов пороговых схем поступают на блок 15, .представляющий собой либо £-входовой А-канальный конъюнктор с N выходами кодов, отображающих* распознаваемые слова, либо схему взвешенного суммирования. В блоке 15 осуществляется преобразование номера канала с / уровнем действующего ,в нем сигнала, равным «1», из общего числа номеров А зциф,ровой код, например двоичный, который является -наиболее удобным для овязи преобразователя «слово—-код» -с уст-рой-ства-ми переработки и восприятия информации распознавания речевых сигналов.
Изобретение .может быть '.использовано' в буквопечатающих автоматах, работающих с ,гол-оса, в различного -рода .кибернетиче- . скйх устройствах управления Движением, *а также в робототехнике при -создании роботов'с элемента-ми развитого и-скусствённо-го интеллекта, воспринимающих человеческую речь, и в вычислительной технике.

Claims (1)

  1. Формула изобретения
    Устройство для распознавания речевых . сигналов, содержащее соединенные последовательно .многоканальный' полосовой фильтр формантных'участков спектра, логическую схему выделения речевых инвариантов, блоки сравнения текущей и эталонных -последовательностей речевых инвариантов с подключенным ικ ним блоком хранения эталонных последовательностей -речевых ин- вариантов, а также пороговые .схемы, вклю- \ ченньш'между блоком кодирования опозна- / ваемых слов, и блоками сравнения текущей и эталонных последовательностей речевых ,, инвариантов, о т л йч а ю щ-е с с я тем, что, с -целью повышения -достоверности распознавания речевых сигналов, -логическая -схе-, ма выделения речевых инвариантов выполнена' ,в виде последовательно соединенных -преобразователей Фурье, анализаторов и нормализаторов спектральной плотности и -спектрального положения, функциональных преобразователей, ёлоко-в записи, многоустойчивых -запоминающих элементов и блоков воспроизведения, а также старт-стопного блока, входы которого подключены к -соответствующим выходам функциональных 'преобразователей, а выходы— к управляющим входам блоков" воспроизведения.,
    ,
SU752190038A 1975-11-17 1975-11-17 УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι . SU762031A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU752190038A SU762031A1 (ru) 1975-11-17 1975-11-17 УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι .

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU752190038A SU762031A1 (ru) 1975-11-17 1975-11-17 УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι .

Publications (1)

Publication Number Publication Date
SU762031A1 true SU762031A1 (ru) 1980-09-07

Family

ID=20637468

Family Applications (1)

Application Number Title Priority Date Filing Date
SU752190038A SU762031A1 (ru) 1975-11-17 1975-11-17 УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι .

Country Status (1)

Country Link
SU (1) SU762031A1 (ru)

Similar Documents

Publication Publication Date Title
Dubnowski et al. Real-time digital hardware pitch detector
US4761815A (en) Speech recognition system based on word state duration and/or weight
US4336421A (en) Apparatus and method for recognizing spoken words
US4181813A (en) System and method for speech recognition
US3416080A (en) Apparatus for the analysis of waveforms
US3812291A (en) Signal pattern encoder and classifier
GB1591996A (en) Apparatus for recognising words from among continuous speech
US4319085A (en) Speech recognition apparatus and method
EP0065829B1 (en) Speech recognition system
JPS53105103A (en) Voice identifying system
JPH0736475A (ja) 音声分析における基準パターン形成方法
EP0112717B1 (en) Continuous speech recognition apparatus
US3037077A (en) Speech-to-digital converter
US3198884A (en) Sound analyzing system
SU762031A1 (ru) УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ ι .
CA1232686A (en) Speech recognition
Teacher et al. Experimental, limited vocabulary, speech recognizer
Herscher et al. An adaptive isolated-word speech recognition system
GB981153A (en) Improved phonetic typewriter system
IT1007572B (it) Apparecchiatura per il riconoscimen to della parola
SU1037292A1 (ru) Способ селекции признаков дл распознавани речевых сигналов
Purton Speech recognition using autocorrelation analysis
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
Elder On the feasibility of voice input to an on-line computer processing system
JPS59111699A (ja) 話者認識方式