SU758238A1

SU758238A1 - Устройство для распознавания речевой'’1. информации / 1

Info

Publication number: SU758238A1
Application number: SU772552429A
Authority: SU
Inventors: Boris V Bolotov; Konstantin P Majstrenko; Galina G Chub
Original assignee: Uk Nii Tsellyulozno Bumazhnoj
Priority date: 1977-12-12
Filing date: 1977-12-12
Publication date: 1980-08-23

Description

Изобретение относится к областиприборостроения и может быть использовано в акустике при распознавании речевой информации.

Известно устройство, включающее 5 источник речевых .образов, блок преобразования речевых образов в электрический сигнал, усилитель, динамический· спектроанализатор, блок нормировки, источник эталонного сигна- 10 ла, блоки сравнения масштабных преобразований, управления и принятия решений [1].

Блок эталонных сигналов содержит набор генераторов степенных функций, 15 у которых фиксированы показатели степени, либо фильтры с фиксированными степенными характеристиками. Эталонный сигнал моделируется в виде суммы степенных функций, что позво- 20 ляет осуществлять нормализацию темпа речи. Компенсация вариации уровня речи в этом устройстве осуществляется изменением коэффициентов усиления усилителей, составляющих эталонного 25 сигнала в блоке масштабных преобразований.

Недостатком данного устройства является низкая точность и скорость распознавания речевых образов, так

как нельзя получить точную аппроксимацию речевых сигналов степенными функциями, которые получаются точеными лишь с помощью идеальных множительных устройств.

Из известных устройств наиболее близким к описываемому изобретению является устройство для распознавания речевой информации, содержащее микрофон, подключенный к усилителю, блок эталонных сигналов, схему сравнения, блок управления,- нормализатор частоты, регистратор и синтезатор [2] .

• 'Недостаток этого устройства - низкая точность и скорость распознавания речевой информации.

Целью изобретения является повышение точности и скорости распознавания речевой информации.

Поставленная цель достигается тем, что устройство снабжено стандартизато 'ром продолжительности звуков,содержащим электронный ключ, генератор длительности звуков и блок квантования длительности звуков, :инвариатором длительности звуков, формирователем коротких импульсов, содержащим соединенные последовательно усилитель-ограничитель, триггер Шмид3

758238

4

та и формирователь импульсов, интегратором, генератором пилообразного напряжения и генератором импульсов, причем блок эталонных сигналов выполнен в виде соединенных последовательно генератора эталонных фун-, кций, преобразователя'код-аналог и -дешифратора, блок управления - в /виде нуль-органа7 нормализатор ча стоты * ввиде инвариатора частоты,

регистратор - в виде' печатавающего блока и ЭЦВМ, один, выход усилителя подключен ко входу электронного ключа непосредственно, а другой его выход подключён через соединенные последовательно генератор Длитель·/' ности звуков и блок квантования длительности звуков ко второму входу

электронного ключа, выход которого Перез соединённые последовательно инвариатор частоты и инвариатор амплитуды частоты и инвариатор ампли/ Туда подключен ко 'входу усилителя/'ограничителя, выход формирователя . импульсов через соединенные последовательно интегратор и инвариатор

' длительности звуков' соединён од, ндврбменно с одним входом/схемы

сравнения и входом генератора

^; пилообразного напряжения, выход которого Через генератор' эталонных

функций соединен со вторым входом схемы сравнения, выход которой -через соединенные последовательно нуль-орган'и /генератор импульсов соединен со входом дешифратора, выходы которого одновременно соединены с соответствующими входами ЭЦВМ и печатающего блока, управляющие входы которых соединены между' собой со Вторым выходом нуль-органа, выход

.ЭЦВМ подключен к синтезатору, а второй выход блока квантования длительности В буков соединен одновременно со вторыми входами интегратора и инварйатора длительности звуков.

Сущность изобретения поясняется чертежом, на котором изображена блок-схема описываемого устройства, где' последовательно соединены микрофон 1, усилитель 2, электронный ключ 3, инвариатор частоты 4, инвариатор амплитуды 5, усилитель-ограничитель 6, триггер.имидта 7, формирователь импульсов 8, интегратор 9,~йнвёриатор длительности звуков 10} усилитель 1 соединен также с генератором длительности звуков'11,

Выход которого соединен с входом блока квантования длительности звуков 12, Подключенного одним выходом к управляющему входу электронного/ ключа 3, другим выходом - на другой вход интегратора 9 и другой вход инвариатора длительности звуков 10.

К выходу инвариатора длительности звуков Ю подключены параллельно" вход генератора пилообразного на- .ι пряжения 13 и один вход блока сравнения 14, на другой вход которого подключен выход генератора эталонных функций 15, а'на один вход генератора эталонных функций 15 подключен выход генератора пилообразного

$ напряжения 13. Выход блока сравнения 14 подключен к нуль-органу 16, один выход которого подключен -ко входу генератора импульсов 17, другой - одновременно к одному входу

Ιθ печатающего блока .18 и другому входу ЭЦВМ 19. Нуль-орган 16 выполняет функции блока управления. Выход генератора /импульсов 17 соединен со входом дешифратора 20, выходы которого соединены непосредственно и

'5 одновременно с'остальными входами печатающего блока'18 и ЭЦВМ 19, а с остальными· входами генератора эталонных функций 15 посредством преобразователя код-аналога 21.При этом

20 число функционально связанных выходов дешифратора 19, входов печатающего блока 18, ЭЦВМ 19, входов и выходов преобразователя код-аналог 21, а также входов генератора эталонных

25 функций 15 - одинаково.

Элементы 3, 11, 12 образуют.стандартизатор Продолжительности звуков 22. Элементы 6, 7, 8 образуют, формирователь коротких импульсов 23.

Элементы 15, 20 и.21 образуют блок эталонных сигналов 24, элементы 18 и 19 образуют регистратор 25. Выход ЭЦВМ 19 подключен на вход синтезатора 26.

Устройство, работает следующим обЭ·’ разом. Речь диктора преобразуется

микрофоном 1 в электрические сигна0.лы, которые усиливаются усилителем

2 и поступают на электронный ключ 3 и генератор длительности звуков 11

40 стаидартизатора продолжительности звуков 22. Так как информативная часть элементарного звука находится в самом'его начале, то эти устройства обеспечивают нормальное про45 хождение начальной энергии, звука в течение примерно 0,1 с, а затем канал отключается до появления ново-, го импульса звуковой энергии. Квантованные импульсы поступают на инвариатор частоты 4.. Это устройство производит динамический спектральный анализ' речевого сигнала и преобразует . спектр сигнала, голоса диктора таким образом, что голос -синтезированных звуков' становится не Завися55 щим от высоты тона голоса диктора.

На выходе Инвариатора частоты 4 всегда будет 'прослушиваться нормальный голоснезависимо от диктора. Искусственный голос инвариатора

ЙО частоты 4 поступает на инвариатор

амплитуды 5который преобразует речевой сигнал таким образом, что сигнал на еговыходе перестает быть, зависимым от амплитуды при полном сохранении'основных характеристик

<-:-*ГЛЙЙ!

758238

звуковой информации. Это достигается тем, что в инвариаторе амплитуда 5 путем функционального, преобразования обеспечивается выборка всех слабых сигналов, существующих самостоятельно или в смеси с большими сигналами 5

во всем динамическом спектре, усиление их до нормализованного уровня по амплитуде и сравнение друг с другом с последующим суммированием.

В результате этого разные звуковые «л сигналы оказываются одинаковыми по амплитуде, а выходной сигнал напоминает клиппированный сигнал, однако более качественный.. Сиг- . нал с выхода инвариатора ампли- , _ туда 5 с помощью усилителя-ограничителя 6 триггера Шмидта. 7 и формирователя импульсов 8 формируется в серию ^: узких импульсов длительностью 1 мк с. Сигнал с по- мощью усилителя-ограничителя 6 и 20

триггера Шмидта 7 клиппируется, полностью устраняется амплитудная' зависимость выходного, сигнала блока инвариатора амплитуды 5, затем дифференцируется и формируется в виде' 25 пакета микросекундных импульсов.

После формирования в формирователе импульсов 8 импульсы интегрируются в интеграторе 9, затем интегрированные импульсы поступают на инва- 30 риатор длительности звуков 10, предназначенный для запоминания функций интегрирования и сжатия ее во времени для воспроизведения функции интегрирования с более высокой 35 частотой.. йнвариатор длительности 10 позволяет записать функцию интегрирования продолжительностью до 0,1 с в 100 дискретных точках' с ТОЧНОСТЬЮ порядка +% И воспроизводить эту функцию, периодически ее ' повторяя на выходе с частотой 200 кГц, что позволяет с высокой частотой произвести сравнение функции интегрирования в схеме сравнения 14 с эталонными' функциями генератора эталонных функций 15 блока эталонных сигналов 24 и осуществлять распознавание в короткие промежутки времени.

В качестве генератора эталонных \ __

‘ функций 15'может быть.использован одноаргументный функциональный преобразователь, обученный'заранее на интегрированные функции элементарных. речевых сигналов. Перебор имеющихся в генераторе эталонных функций 55 осуществляется в соответствии с сигналом на выходе генератора пилообразного напряжения 13. Эталонные функции последовательно, с большой скоростью подаются с выхода-гене- 60 ратора эталонных функции 15 в схему сравнения 14, в случае несовпадения эталонной' функции и функции распознаваемого звукового образа, поступающего инвариатора длитель6’

ности звуков 10 на выходе схе№Л сравнения 14 появляется сигнал, поступающий на вход нуль-органа 16, который запускает генератор импульсов 17, который, в свою очередь, запускает дешифратор 20. Спектры масштабных коэффициентов увязываются с кодами дешифратора 20 посредством преобразователя коданалог 21. Если выбранный спектр масштабных коэффициентов обеспечивает при опросе генератора эталонных функций 15 схожесть сравниваемых функций в схеме сравнения 14, то нуль-орган 16 выдает сигнал на’ отключение генератора импульсов 17 и на фиксирование кода в виде буквенной записи, соответствующей распознанному звуку в печатающем блоке 18, а также запоминается в устройстве памяти ЭЦВМ и подается в синтезатор 26. После этого устройство' очищается й готовится к распознаванию следующего звукового образа.'

Формирование эталонных функций в генераторе эталонных функций 15 осуществляется следующим образом. Перед микрофоном 1 раздельно ..произносятся'тестовые речевые Образы. :' ·"

В этом режиме нуль-орган 16 управляет системой настройки масштабных коэффициентов, состоящей из генератора импульсов 17, дешифратора 20, преобразователя код-аналог 21.· Найденные спектры масштабных коэффициентов перед диктованием тестовых речевых образов предварительно записываются, а потом вводятся в преобразователь код-аналог 21. Если же при -настройке генератора эталонных функций 15 масштабные коэффициенты могут изменяться плавно, то после" введения данных в преобразователь ' код-аналог 21. масштабные коэффициенты мгновенно принимают значение,при которых будет воспроизведена обученная кривая.. Общее число вариаций спектров масштабных коэффициентов равно числу кодовых комбинаций. Для · описываемого устройства дешифратор рассчитан на десятиразрядный двоичный код, при котором число комбинаций дешифратора составляет 1024.

. Описываемое устройство: просто в настройке, обучении и реализации, обладает высокой точностью распознавания речевых сигналов и обеспечивает устройству использование в системах' общения человека с .машиной при созданий роботов типа '’ухо-интеллект*’ и в других областях техники.

Claims

Формула изобретения

Устройство для распознавания речевой информации, содержащее микро75:

фон,'подключенный к усилителю, блок эталонных сигналов, схему сравнения, ' блох управления, нормализатор частоты, регистратор и Ъинтезатор, о тл и ч а ю щ е е с я тем, что, с целью" повышения точности и скорости распознавания речевой информации,оно снабжено стандартизатором продолжительности звуков, содержащим электронный ключ, генератор длительности звуков и блок квантования длительности звуков, инвариатором амплиту• дн, инвариатором длительности звуков, формирователем коротких импульсов, ' сддерЖащим соединенные последова- \

^? теПЬно уби'лйтель-ограничитель /Триггер Шмидта и формирователь импульсов, интегратором, генератором пилообразного напряжения, и генератором импульсов, причем блок эталонных Сигналов выполнен в виде соединенных 'последовательно генератора эталонных функций, преобразователя код-аналог и дешифратора, блок управления - в Эйде нуль-органа, нормализатор частоты - в виде инвариатора частоты, регистратор - в Еидё печатающего блока.и ЭЦВМ, один выход усилителя подключен ко входу электронного ключа непосредственно, а другой его выхбд подключен через соединенные последовательно генератор длительности звуков. й блок "квантования длительности звуков ко' второму входу электронного

⁸ . ⁸ ···:··,

ключа, выход которого через соединенные последовательно йнвариатор часто· ты й инвариатор амплитуды подключен ко входу усилителя-ограничителя,вы'ход формирователя импульсов через соединенные последовательно интегратор и инвариатор длительности Звуков соединен одновременно с бдним входом схемы сравнения и выходом генератора пилообразного напряже«θ ния, выход которого через генератор эталонных функций соединен со вторым входом схемы сравнения, выход которой через соединенные последовательно нуль-орган и генератор импу льсов соединен со входом дешифратора ра, выходы которого одновременно

соединены с соответствующими входами ЭЦВМ и печатающего, блока, управляющие входы которых соединены между собой и со вторым выходом нуль—ор—

20 гана, выход ЭЦВМ подключен к синтезатору, а второй выход блока квантования длительности звуков соединен. Одновременно со вторыми входами интегратора и инвариатора и инвариато25 ра длительности звуков.