SU758238A1 - Устройство для распознавания речевой'’1. информации / 1 - Google Patents

Устройство для распознавания речевой'’1. информации / 1 Download PDF

Info

Publication number
SU758238A1
SU758238A1 SU772552429A SU2552429A SU758238A1 SU 758238 A1 SU758238 A1 SU 758238A1 SU 772552429 A SU772552429 A SU 772552429A SU 2552429 A SU2552429 A SU 2552429A SU 758238 A1 SU758238 A1 SU 758238A1
Authority
SU
USSR - Soviet Union
Prior art keywords
output
duration
generator
sounds
input
Prior art date
Application number
SU772552429A
Other languages
English (en)
Inventor
Boris V Bolotov
Konstantin P Majstrenko
Galina G Chub
Original Assignee
Uk Nii Tsellyulozno Bumazhnoj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uk Nii Tsellyulozno Bumazhnoj filed Critical Uk Nii Tsellyulozno Bumazhnoj
Priority to SU772552429A priority Critical patent/SU758238A1/ru
Application granted granted Critical
Publication of SU758238A1 publication Critical patent/SU758238A1/ru

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

Изобретение относится к областиприборостроения и может быть использовано в акустике при распознавании речевой информации.
Известно устройство, включающее 5 источник речевых .образов, блок преобразования речевых образов в электрический сигнал, усилитель, динамический· спектроанализатор, блок нормировки, источник эталонного сигна- 10 ла, блоки сравнения масштабных преобразований, управления и принятия решений [1].
Блок эталонных сигналов содержит набор генераторов степенных функций, 15 у которых фиксированы показатели степени, либо фильтры с фиксированными степенными характеристиками. Эталонный сигнал моделируется в виде суммы степенных функций, что позво- 20 ляет осуществлять нормализацию темпа речи. Компенсация вариации уровня речи в этом устройстве осуществляется изменением коэффициентов усиления усилителей, составляющих эталонного 25 сигнала в блоке масштабных преобразований.
Недостатком данного устройства является низкая точность и скорость распознавания речевых образов, так
как нельзя получить точную аппроксимацию речевых сигналов степенными функциями, которые получаются точеными лишь с помощью идеальных множительных устройств.
Из известных устройств наиболее близким к описываемому изобретению является устройство для распознавания речевой информации, содержащее микрофон, подключенный к усилителю, блок эталонных сигналов, схему сравнения, блок управления,- нормализатор частоты, регистратор и синтезатор [2] .
• 'Недостаток этого устройства - низкая точность и скорость распознавания речевой информации.
Целью изобретения является повышение точности и скорости распознавания речевой информации.
Поставленная цель достигается тем, что устройство снабжено стандартизато 'ром продолжительности звуков,содержащим электронный ключ, генератор длительности звуков и блок квантования длительности звуков, :инвариатором длительности звуков, формирователем коротких импульсов, содержащим соединенные последовательно усилитель-ограничитель, триггер Шмид3
758238
4
та и формирователь импульсов, интегратором, генератором пилообразного напряжения и генератором импульсов, причем блок эталонных сигналов выполнен в виде соединенных последовательно генератора эталонных фун-, кций, преобразователя'код-аналог и -дешифратора, блок управления - в /виде нуль-органа7 нормализатор ча стоты * ввиде инвариатора частоты,
регистратор - в виде' печатавающего блока и ЭЦВМ, один, выход усилителя подключен ко входу электронного ключа непосредственно, а другой его выход подключён через соединенные последовательно генератор Длитель·/' ности звуков и блок квантования длительности звуков ко второму входу
электронного ключа, выход которого Перез соединённые последовательно инвариатор частоты и инвариатор амплитуды частоты и инвариатор ампли/ Туда подключен ко 'входу усилителя/'ограничителя, выход формирователя . импульсов через соединенные последовательно интегратор и инвариатор
' длительности звуков' соединён од, ндврбменно с одним входом/схемы
сравнения и входом генератора
; пилообразного напряжения, выход которого Через генератор' эталонных
функций соединен со вторым входом схемы сравнения, выход которой -через соединенные последовательно нуль-орган'и /генератор импульсов соединен со входом дешифратора, выходы которого одновременно соединены с соответствующими входами ЭЦВМ и печатающего блока, управляющие входы которых соединены между' собой со Вторым выходом нуль-органа, выход
.ЭЦВМ подключен к синтезатору, а второй выход блока квантования длительности В буков соединен одновременно со вторыми входами интегратора и инварйатора длительности звуков.
Сущность изобретения поясняется чертежом, на котором изображена блок-схема описываемого устройства, где' последовательно соединены микрофон 1, усилитель 2, электронный ключ 3, инвариатор частоты 4, инвариатор амплитуды 5, усилитель-ограничитель 6, триггер.имидта 7, формирователь импульсов 8, интегратор 9,~йнвёриатор длительности звуков 10} усилитель 1 соединен также с генератором длительности звуков'11,
Выход которого соединен с входом блока квантования длительности звуков 12, Подключенного одним выходом к управляющему входу электронного/ ключа 3, другим выходом - на другой вход интегратора 9 и другой вход инвариатора длительности звуков 10.
К выходу инвариатора длительности звуков Ю подключены параллельно" вход генератора пилообразного на- .ι пряжения 13 и один вход блока сравнения 14, на другой вход которого подключен выход генератора эталонных функций 15, а'на один вход генератора эталонных функций 15 подключен выход генератора пилообразного
$ напряжения 13. Выход блока сравнения 14 подключен к нуль-органу 16, один выход которого подключен -ко входу генератора импульсов 17, другой - одновременно к одному входу
Ιθ печатающего блока .18 и другому входу ЭЦВМ 19. Нуль-орган 16 выполняет функции блока управления. Выход генератора /импульсов 17 соединен со входом дешифратора 20, выходы которого соединены непосредственно и
'5 одновременно с'остальными входами печатающего блока'18 и ЭЦВМ 19, а с остальными· входами генератора эталонных функций 15 посредством преобразователя код-аналога 21.При этом
20 число функционально связанных выходов дешифратора 19, входов печатающего блока 18, ЭЦВМ 19, входов и выходов преобразователя код-аналог 21, а также входов генератора эталонных
25 функций 15 - одинаково.
Элементы 3, 11, 12 образуют.стандартизатор Продолжительности звуков 22. Элементы 6, 7, 8 образуют, формирователь коротких импульсов 23.
Элементы 15, 20 и.21 образуют блок эталонных сигналов 24, элементы 18 и 19 образуют регистратор 25. Выход ЭЦВМ 19 подключен на вход синтезатора 26.
Устройство, работает следующим обЭ·’ разом. Речь диктора преобразуется
микрофоном 1 в электрические сигна0.лы, которые усиливаются усилителем
2 и поступают на электронный ключ 3 и генератор длительности звуков 11
40 стаидартизатора продолжительности звуков 22. Так как информативная часть элементарного звука находится в самом'его начале, то эти устройства обеспечивают нормальное про45 хождение начальной энергии, звука в течение примерно 0,1 с, а затем канал отключается до появления ново-, го импульса звуковой энергии. Квантованные импульсы поступают на инвариатор частоты 4.. Это устройство производит динамический спектральный анализ' речевого сигнала и преобразует . спектр сигнала, голоса диктора таким образом, что голос -синтезированных звуков' становится не Завися55 щим от высоты тона голоса диктора.
На выходе Инвариатора частоты 4 всегда будет 'прослушиваться нормальный голоснезависимо от диктора. Искусственный голос инвариатора
ЙО частоты 4 поступает на инвариатор
амплитуды 5который преобразует речевой сигнал таким образом, что сигнал на еговыходе перестает быть, зависимым от амплитуды при полном сохранении'основных характеристик
<-:-*ГЛЙЙ!
758238
звуковой информации. Это достигается тем, что в инвариаторе амплитуда 5 путем функционального, преобразования обеспечивается выборка всех слабых сигналов, существующих самостоятельно или в смеси с большими сигналами 5
во всем динамическом спектре, усиление их до нормализованного уровня по амплитуде и сравнение друг с другом с последующим суммированием.
В результате этого разные звуковые «л сигналы оказываются одинаковыми по амплитуде, а выходной сигнал напоминает клиппированный сигнал, однако более качественный.. Сиг- . нал с выхода инвариатора ампли- , _ туда 5 с помощью усилителя-ограничителя 6 триггера Шмидта. 7 и формирователя импульсов 8 формируется в серию : узких импульсов длительностью 1 мк с. Сигнал с по- мощью усилителя-ограничителя 6 и 20
триггера Шмидта 7 клиппируется, полностью устраняется амплитудная' зависимость выходного, сигнала блока инвариатора амплитуды 5, затем дифференцируется и формируется в виде' 25 пакета микросекундных импульсов.
После формирования в формирователе импульсов 8 импульсы интегрируются в интеграторе 9, затем интегрированные импульсы поступают на инва- 30 риатор длительности звуков 10, предназначенный для запоминания функций интегрирования и сжатия ее во времени для воспроизведения функции интегрирования с более высокой 35 частотой.. йнвариатор длительности 10 позволяет записать функцию интегрирования продолжительностью до 0,1 с в 100 дискретных точках' с ТОЧНОСТЬЮ порядка +% И воспроизводить эту функцию, периодически ее ' повторяя на выходе с частотой 200 кГц, что позволяет с высокой частотой произвести сравнение функции интегрирования в схеме сравнения 14 с эталонными' функциями генератора эталонных функций 15 блока эталонных сигналов 24 и осуществлять распознавание в короткие промежутки времени.
В качестве генератора эталонных \ __
‘ функций 15'может быть.использован одноаргументный функциональный преобразователь, обученный'заранее на интегрированные функции элементарных. речевых сигналов. Перебор имеющихся в генераторе эталонных функций 55 осуществляется в соответствии с сигналом на выходе генератора пилообразного напряжения 13. Эталонные функции последовательно, с большой скоростью подаются с выхода-гене- 60 ратора эталонных функции 15 в схему сравнения 14, в случае несовпадения эталонной' функции и функции распознаваемого звукового образа, поступающего инвариатора длитель6’
ности звуков 10 на выходе схе№Л сравнения 14 появляется сигнал, поступающий на вход нуль-органа 16, который запускает генератор импульсов 17, который, в свою очередь, запускает дешифратор 20. Спектры масштабных коэффициентов увязываются с кодами дешифратора 20 посредством преобразователя коданалог 21. Если выбранный спектр масштабных коэффициентов обеспечивает при опросе генератора эталонных функций 15 схожесть сравниваемых функций в схеме сравнения 14, то нуль-орган 16 выдает сигнал на’ отключение генератора импульсов 17 и на фиксирование кода в виде буквенной записи, соответствующей распознанному звуку в печатающем блоке 18, а также запоминается в устройстве памяти ЭЦВМ и подается в синтезатор 26. После этого устройство' очищается й готовится к распознаванию следующего звукового образа.'
Формирование эталонных функций в генераторе эталонных функций 15 осуществляется следующим образом. Перед микрофоном 1 раздельно ..произносятся'тестовые речевые Образы. :' ·"
В этом режиме нуль-орган 16 управляет системой настройки масштабных коэффициентов, состоящей из генератора импульсов 17, дешифратора 20, преобразователя код-аналог 21.· Найденные спектры масштабных коэффициентов перед диктованием тестовых речевых образов предварительно записываются, а потом вводятся в преобразователь код-аналог 21. Если же при -настройке генератора эталонных функций 15 масштабные коэффициенты могут изменяться плавно, то после" введения данных в преобразователь ' код-аналог 21. масштабные коэффициенты мгновенно принимают значение,при которых будет воспроизведена обученная кривая.. Общее число вариаций спектров масштабных коэффициентов равно числу кодовых комбинаций. Для · описываемого устройства дешифратор рассчитан на десятиразрядный двоичный код, при котором число комбинаций дешифратора составляет 1024.
. Описываемое устройство: просто в настройке, обучении и реализации, обладает высокой точностью распознавания речевых сигналов и обеспечивает устройству использование в системах' общения человека с .машиной при созданий роботов типа '’ухо-интеллект*’ и в других областях техники.

Claims (1)

  1. Формула изобретения
    Устройство для распознавания речевой информации, содержащее микро75:
    фон,'подключенный к усилителю, блок эталонных сигналов, схему сравнения, ' блох управления, нормализатор частоты, регистратор и Ъинтезатор, о тл и ч а ю щ е е с я тем, что, с целью" повышения точности и скорости распознавания речевой информации,оно снабжено стандартизатором продолжительности звуков, содержащим электронный ключ, генератор длительности звуков и блок квантования длительности звуков, инвариатором амплиту• дн, инвариатором длительности звуков, формирователем коротких импульсов, ' сддерЖащим соединенные последова- \
    ? теПЬно уби'лйтель-ограничитель /Триггер Шмидта и формирователь импульсов, интегратором, генератором пилообразного напряжения, и генератором импульсов, причем блок эталонных Сигналов выполнен в виде соединенных 'последовательно генератора эталонных функций, преобразователя код-аналог и дешифратора, блок управления - в Эйде нуль-органа, нормализатор частоты - в виде инвариатора частоты, регистратор - в Еидё печатающего блока.и ЭЦВМ, один выход усилителя подключен ко входу электронного ключа непосредственно, а другой его выхбд подключен через соединенные последовательно генератор длительности звуков. й блок "квантования длительности звуков ко' второму входу электронного
    8 . 8 ···:··,
    ключа, выход которого через соединенные последовательно йнвариатор часто· ты й инвариатор амплитуды подключен ко входу усилителя-ограничителя,вы'ход формирователя импульсов через соединенные последовательно интегратор и инвариатор длительности Звуков соединен одновременно с бдним входом схемы сравнения и выходом генератора пилообразного напряже«θ ния, выход которого через генератор эталонных функций соединен со вторым входом схемы сравнения, выход которой через соединенные последовательно нуль-орган и генератор импу льсов соединен со входом дешифратора ра, выходы которого одновременно
    соединены с соответствующими входами ЭЦВМ и печатающего, блока, управляющие входы которых соединены между собой и со вторым выходом нуль—ор—
    20 гана, выход ЭЦВМ подключен к синтезатору, а второй выход блока квантования длительности звуков соединен. Одновременно со вторыми входами интегратора и инвариатора и инвариато25 ра длительности звуков.
SU772552429A 1977-12-12 1977-12-12 Устройство для распознавания речевой'’1. информации / 1 SU758238A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU772552429A SU758238A1 (ru) 1977-12-12 1977-12-12 Устройство для распознавания речевой'’1. информации / 1

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU772552429A SU758238A1 (ru) 1977-12-12 1977-12-12 Устройство для распознавания речевой'’1. информации / 1

Publications (1)

Publication Number Publication Date
SU758238A1 true SU758238A1 (ru) 1980-08-23

Family

ID=20736917

Family Applications (1)

Application Number Title Priority Date Filing Date
SU772552429A SU758238A1 (ru) 1977-12-12 1977-12-12 Устройство для распознавания речевой'’1. информации / 1

Country Status (1)

Country Link
SU (1) SU758238A1 (ru)

Similar Documents

Publication Publication Date Title
US4720863A (en) Method and apparatus for text-independent speaker recognition
US4661915A (en) Allophone vocoder
US4181813A (en) System and method for speech recognition
US4432096A (en) Arrangement for recognizing sounds
US4343969A (en) Apparatus and method for articulatory speech recognition
GB1435779A (en) Word recognition
US4424415A (en) Formant tracker
EP0361788A3 (en) A speech recognition system
CN1013525B (zh) 认人与不认人实时语音识别的方法和装置
GB1592473A (en) Method and apparatus for synthesis of speech
US4461023A (en) Registration method of registered words for use in a speech recognition system
US3509280A (en) Adaptive speech pattern recognition system
Licklider The Intelligibility of Amplitude‐Dichotomized, Time‐Quantized Speech Waves
US3236947A (en) Word code generator
US3037077A (en) Speech-to-digital converter
US4831653A (en) System for registering speech information to make a voice dictionary
US3304369A (en) Sound actuated devices
JPH0576040B2 (ru)
SU758238A1 (ru) Устройство для распознавания речевой&#39;’1. информации / 1
US3539726A (en) System for storing cochlear profiles
US3319002A (en) Electronic formant speech synthesizer
US3076932A (en) Amplifier
Clapper Automatic word recognition
US3067288A (en) Phonetic typewriter of speech
Tosi A method for acoustic segmentation of continuous sound into pauses and signals and measurement of segment durations