SU758238A1 - Устройство для распознавания речевой'’1. информации / 1 - Google Patents
Устройство для распознавания речевой'’1. информации / 1 Download PDFInfo
- Publication number
- SU758238A1 SU758238A1 SU772552429A SU2552429A SU758238A1 SU 758238 A1 SU758238 A1 SU 758238A1 SU 772552429 A SU772552429 A SU 772552429A SU 2552429 A SU2552429 A SU 2552429A SU 758238 A1 SU758238 A1 SU 758238A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- output
- duration
- generator
- sounds
- input
- Prior art date
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
Изобретение относится к областиприборостроения и может быть использовано в акустике при распознавании речевой информации.
Известно устройство, включающее 5 источник речевых .образов, блок преобразования речевых образов в электрический сигнал, усилитель, динамический· спектроанализатор, блок нормировки, источник эталонного сигна- 10 ла, блоки сравнения масштабных преобразований, управления и принятия решений [1].
Блок эталонных сигналов содержит набор генераторов степенных функций, 15 у которых фиксированы показатели степени, либо фильтры с фиксированными степенными характеристиками. Эталонный сигнал моделируется в виде суммы степенных функций, что позво- 20 ляет осуществлять нормализацию темпа речи. Компенсация вариации уровня речи в этом устройстве осуществляется изменением коэффициентов усиления усилителей, составляющих эталонного 25 сигнала в блоке масштабных преобразований.
Недостатком данного устройства является низкая точность и скорость распознавания речевых образов, так
как нельзя получить точную аппроксимацию речевых сигналов степенными функциями, которые получаются точеными лишь с помощью идеальных множительных устройств.
Из известных устройств наиболее близким к описываемому изобретению является устройство для распознавания речевой информации, содержащее микрофон, подключенный к усилителю, блок эталонных сигналов, схему сравнения, блок управления,- нормализатор частоты, регистратор и синтезатор [2] .
• 'Недостаток этого устройства - низкая точность и скорость распознавания речевой информации.
Целью изобретения является повышение точности и скорости распознавания речевой информации.
Поставленная цель достигается тем, что устройство снабжено стандартизато 'ром продолжительности звуков,содержащим электронный ключ, генератор длительности звуков и блок квантования длительности звуков, :инвариатором длительности звуков, формирователем коротких импульсов, содержащим соединенные последовательно усилитель-ограничитель, триггер Шмид3
758238
4
та и формирователь импульсов, интегратором, генератором пилообразного напряжения и генератором импульсов, причем блок эталонных сигналов выполнен в виде соединенных последовательно генератора эталонных фун-, кций, преобразователя'код-аналог и -дешифратора, блок управления - в /виде нуль-органа7 нормализатор ча стоты * ввиде инвариатора частоты,
регистратор - в виде' печатавающего блока и ЭЦВМ, один, выход усилителя подключен ко входу электронного ключа непосредственно, а другой его выход подключён через соединенные последовательно генератор Длитель·/' ности звуков и блок квантования длительности звуков ко второму входу
электронного ключа, выход которого Перез соединённые последовательно инвариатор частоты и инвариатор амплитуды частоты и инвариатор ампли/ Туда подключен ко 'входу усилителя/'ограничителя, выход формирователя . импульсов через соединенные последовательно интегратор и инвариатор
' длительности звуков' соединён од, ндврбменно с одним входом/схемы
сравнения и входом генератора
; пилообразного напряжения, выход которого Через генератор' эталонных
функций соединен со вторым входом схемы сравнения, выход которой -через соединенные последовательно нуль-орган'и /генератор импульсов соединен со входом дешифратора, выходы которого одновременно соединены с соответствующими входами ЭЦВМ и печатающего блока, управляющие входы которых соединены между' собой со Вторым выходом нуль-органа, выход
.ЭЦВМ подключен к синтезатору, а второй выход блока квантования длительности В буков соединен одновременно со вторыми входами интегратора и инварйатора длительности звуков.
Сущность изобретения поясняется чертежом, на котором изображена блок-схема описываемого устройства, где' последовательно соединены микрофон 1, усилитель 2, электронный ключ 3, инвариатор частоты 4, инвариатор амплитуды 5, усилитель-ограничитель 6, триггер.имидта 7, формирователь импульсов 8, интегратор 9,~йнвёриатор длительности звуков 10} усилитель 1 соединен также с генератором длительности звуков'11,
Выход которого соединен с входом блока квантования длительности звуков 12, Подключенного одним выходом к управляющему входу электронного/ ключа 3, другим выходом - на другой вход интегратора 9 и другой вход инвариатора длительности звуков 10.
К выходу инвариатора длительности звуков Ю подключены параллельно" вход генератора пилообразного на- .ι пряжения 13 и один вход блока сравнения 14, на другой вход которого подключен выход генератора эталонных функций 15, а'на один вход генератора эталонных функций 15 подключен выход генератора пилообразного
$ напряжения 13. Выход блока сравнения 14 подключен к нуль-органу 16, один выход которого подключен -ко входу генератора импульсов 17, другой - одновременно к одному входу
Ιθ печатающего блока .18 и другому входу ЭЦВМ 19. Нуль-орган 16 выполняет функции блока управления. Выход генератора /импульсов 17 соединен со входом дешифратора 20, выходы которого соединены непосредственно и
'5 одновременно с'остальными входами печатающего блока'18 и ЭЦВМ 19, а с остальными· входами генератора эталонных функций 15 посредством преобразователя код-аналога 21.При этом
20 число функционально связанных выходов дешифратора 19, входов печатающего блока 18, ЭЦВМ 19, входов и выходов преобразователя код-аналог 21, а также входов генератора эталонных
25 функций 15 - одинаково.
Элементы 3, 11, 12 образуют.стандартизатор Продолжительности звуков 22. Элементы 6, 7, 8 образуют, формирователь коротких импульсов 23.
Элементы 15, 20 и.21 образуют блок эталонных сигналов 24, элементы 18 и 19 образуют регистратор 25. Выход ЭЦВМ 19 подключен на вход синтезатора 26.
Устройство, работает следующим обЭ·’ разом. Речь диктора преобразуется
микрофоном 1 в электрические сигна0.лы, которые усиливаются усилителем
2 и поступают на электронный ключ 3 и генератор длительности звуков 11
40 стаидартизатора продолжительности звуков 22. Так как информативная часть элементарного звука находится в самом'его начале, то эти устройства обеспечивают нормальное про45 хождение начальной энергии, звука в течение примерно 0,1 с, а затем канал отключается до появления ново-, го импульса звуковой энергии. Квантованные импульсы поступают на инвариатор частоты 4.. Это устройство производит динамический спектральный анализ' речевого сигнала и преобразует . спектр сигнала, голоса диктора таким образом, что голос -синтезированных звуков' становится не Завися55 щим от высоты тона голоса диктора.
На выходе Инвариатора частоты 4 всегда будет 'прослушиваться нормальный голоснезависимо от диктора. Искусственный голос инвариатора
ЙО частоты 4 поступает на инвариатор
амплитуды 5который преобразует речевой сигнал таким образом, что сигнал на еговыходе перестает быть, зависимым от амплитуды при полном сохранении'основных характеристик
<-:-*ГЛЙЙ!
758238
звуковой информации. Это достигается тем, что в инвариаторе амплитуда 5 путем функционального, преобразования обеспечивается выборка всех слабых сигналов, существующих самостоятельно или в смеси с большими сигналами 5
во всем динамическом спектре, усиление их до нормализованного уровня по амплитуде и сравнение друг с другом с последующим суммированием.
В результате этого разные звуковые «л сигналы оказываются одинаковыми по амплитуде, а выходной сигнал напоминает клиппированный сигнал, однако более качественный.. Сиг- . нал с выхода инвариатора ампли- , _ туда 5 с помощью усилителя-ограничителя 6 триггера Шмидта. 7 и формирователя импульсов 8 формируется в серию : узких импульсов длительностью 1 мк с. Сигнал с по- мощью усилителя-ограничителя 6 и 20
триггера Шмидта 7 клиппируется, полностью устраняется амплитудная' зависимость выходного, сигнала блока инвариатора амплитуды 5, затем дифференцируется и формируется в виде' 25 пакета микросекундных импульсов.
После формирования в формирователе импульсов 8 импульсы интегрируются в интеграторе 9, затем интегрированные импульсы поступают на инва- 30 риатор длительности звуков 10, предназначенный для запоминания функций интегрирования и сжатия ее во времени для воспроизведения функции интегрирования с более высокой 35 частотой.. йнвариатор длительности 10 позволяет записать функцию интегрирования продолжительностью до 0,1 с в 100 дискретных точках' с ТОЧНОСТЬЮ порядка +% И воспроизводить эту функцию, периодически ее ' повторяя на выходе с частотой 200 кГц, что позволяет с высокой частотой произвести сравнение функции интегрирования в схеме сравнения 14 с эталонными' функциями генератора эталонных функций 15 блока эталонных сигналов 24 и осуществлять распознавание в короткие промежутки времени.
В качестве генератора эталонных \ __
‘ функций 15'может быть.использован одноаргументный функциональный преобразователь, обученный'заранее на интегрированные функции элементарных. речевых сигналов. Перебор имеющихся в генераторе эталонных функций 55 осуществляется в соответствии с сигналом на выходе генератора пилообразного напряжения 13. Эталонные функции последовательно, с большой скоростью подаются с выхода-гене- 60 ратора эталонных функции 15 в схему сравнения 14, в случае несовпадения эталонной' функции и функции распознаваемого звукового образа, поступающего инвариатора длитель6’
ности звуков 10 на выходе схе№Л сравнения 14 появляется сигнал, поступающий на вход нуль-органа 16, который запускает генератор импульсов 17, который, в свою очередь, запускает дешифратор 20. Спектры масштабных коэффициентов увязываются с кодами дешифратора 20 посредством преобразователя коданалог 21. Если выбранный спектр масштабных коэффициентов обеспечивает при опросе генератора эталонных функций 15 схожесть сравниваемых функций в схеме сравнения 14, то нуль-орган 16 выдает сигнал на’ отключение генератора импульсов 17 и на фиксирование кода в виде буквенной записи, соответствующей распознанному звуку в печатающем блоке 18, а также запоминается в устройстве памяти ЭЦВМ и подается в синтезатор 26. После этого устройство' очищается й готовится к распознаванию следующего звукового образа.'
Формирование эталонных функций в генераторе эталонных функций 15 осуществляется следующим образом. Перед микрофоном 1 раздельно ..произносятся'тестовые речевые Образы. :' ·"
В этом режиме нуль-орган 16 управляет системой настройки масштабных коэффициентов, состоящей из генератора импульсов 17, дешифратора 20, преобразователя код-аналог 21.· Найденные спектры масштабных коэффициентов перед диктованием тестовых речевых образов предварительно записываются, а потом вводятся в преобразователь код-аналог 21. Если же при -настройке генератора эталонных функций 15 масштабные коэффициенты могут изменяться плавно, то после" введения данных в преобразователь ' код-аналог 21. масштабные коэффициенты мгновенно принимают значение,при которых будет воспроизведена обученная кривая.. Общее число вариаций спектров масштабных коэффициентов равно числу кодовых комбинаций. Для · описываемого устройства дешифратор рассчитан на десятиразрядный двоичный код, при котором число комбинаций дешифратора составляет 1024.
. Описываемое устройство: просто в настройке, обучении и реализации, обладает высокой точностью распознавания речевых сигналов и обеспечивает устройству использование в системах' общения человека с .машиной при созданий роботов типа '’ухо-интеллект*’ и в других областях техники.
Claims (1)
- Формула изобретенияУстройство для распознавания речевой информации, содержащее микро75:фон,'подключенный к усилителю, блок эталонных сигналов, схему сравнения, ' блох управления, нормализатор частоты, регистратор и Ъинтезатор, о тл и ч а ю щ е е с я тем, что, с целью" повышения точности и скорости распознавания речевой информации,оно снабжено стандартизатором продолжительности звуков, содержащим электронный ключ, генератор длительности звуков и блок квантования длительности звуков, инвариатором амплиту• дн, инвариатором длительности звуков, формирователем коротких импульсов, ' сддерЖащим соединенные последова- \? теПЬно уби'лйтель-ограничитель /Триггер Шмидта и формирователь импульсов, интегратором, генератором пилообразного напряжения, и генератором импульсов, причем блок эталонных Сигналов выполнен в виде соединенных 'последовательно генератора эталонных функций, преобразователя код-аналог и дешифратора, блок управления - в Эйде нуль-органа, нормализатор частоты - в виде инвариатора частоты, регистратор - в Еидё печатающего блока.и ЭЦВМ, один выход усилителя подключен ко входу электронного ключа непосредственно, а другой его выхбд подключен через соединенные последовательно генератор длительности звуков. й блок "квантования длительности звуков ко' второму входу электронного8 . 8 ···:··,ключа, выход которого через соединенные последовательно йнвариатор часто· ты й инвариатор амплитуды подключен ко входу усилителя-ограничителя,вы'ход формирователя импульсов через соединенные последовательно интегратор и инвариатор длительности Звуков соединен одновременно с бдним входом схемы сравнения и выходом генератора пилообразного напряже«θ ния, выход которого через генератор эталонных функций соединен со вторым входом схемы сравнения, выход которой через соединенные последовательно нуль-орган и генератор импу льсов соединен со входом дешифратора ра, выходы которого одновременносоединены с соответствующими входами ЭЦВМ и печатающего, блока, управляющие входы которых соединены между собой и со вторым выходом нуль—ор—20 гана, выход ЭЦВМ подключен к синтезатору, а второй выход блока квантования длительности звуков соединен. Одновременно со вторыми входами интегратора и инвариатора и инвариато25 ра длительности звуков.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU772552429A SU758238A1 (ru) | 1977-12-12 | 1977-12-12 | Устройство для распознавания речевой'’1. информации / 1 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU772552429A SU758238A1 (ru) | 1977-12-12 | 1977-12-12 | Устройство для распознавания речевой'’1. информации / 1 |
Publications (1)
Publication Number | Publication Date |
---|---|
SU758238A1 true SU758238A1 (ru) | 1980-08-23 |
Family
ID=20736917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU772552429A SU758238A1 (ru) | 1977-12-12 | 1977-12-12 | Устройство для распознавания речевой'’1. информации / 1 |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU758238A1 (ru) |
-
1977
- 1977-12-12 SU SU772552429A patent/SU758238A1/ru active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4720863A (en) | Method and apparatus for text-independent speaker recognition | |
US4661915A (en) | Allophone vocoder | |
US4181813A (en) | System and method for speech recognition | |
US4432096A (en) | Arrangement for recognizing sounds | |
US4343969A (en) | Apparatus and method for articulatory speech recognition | |
GB1435779A (en) | Word recognition | |
US4424415A (en) | Formant tracker | |
EP0361788A3 (en) | A speech recognition system | |
CN1013525B (zh) | 认人与不认人实时语音识别的方法和装置 | |
GB1592473A (en) | Method and apparatus for synthesis of speech | |
US4461023A (en) | Registration method of registered words for use in a speech recognition system | |
US3509280A (en) | Adaptive speech pattern recognition system | |
Licklider | The Intelligibility of Amplitude‐Dichotomized, Time‐Quantized Speech Waves | |
US3236947A (en) | Word code generator | |
US3037077A (en) | Speech-to-digital converter | |
US4831653A (en) | System for registering speech information to make a voice dictionary | |
US3304369A (en) | Sound actuated devices | |
JPH0576040B2 (ru) | ||
SU758238A1 (ru) | Устройство для распознавания речевой'’1. информации / 1 | |
US3539726A (en) | System for storing cochlear profiles | |
US3319002A (en) | Electronic formant speech synthesizer | |
US3076932A (en) | Amplifier | |
Clapper | Automatic word recognition | |
US3067288A (en) | Phonetic typewriter of speech | |
Tosi | A method for acoustic segmentation of continuous sound into pauses and signals and measurement of segment durations |