RU75074U1 - Комплексная система автоматического распознавания речевых сигналов - Google Patents

Комплексная система автоматического распознавания речевых сигналов Download PDF

Info

Publication number
RU75074U1
RU75074U1 RU2008102954/22U RU2008102954U RU75074U1 RU 75074 U1 RU75074 U1 RU 75074U1 RU 2008102954/22 U RU2008102954/22 U RU 2008102954/22U RU 2008102954 U RU2008102954 U RU 2008102954U RU 75074 U1 RU75074 U1 RU 75074U1
Authority
RU
Russia
Prior art keywords
output
switch
standards
key
recognition
Prior art date
Application number
RU2008102954/22U
Other languages
English (en)
Inventor
Андрей Андреевич Катанович (RU)
Андрей Андреевич Катанович
Сергей Иванович Беда (RU)
Сергей Иванович Беда
Валерий Сергеевич Никитин (RU)
Валерий Сергеевич Никитин
Лидия Алексеевна Пашкевич (RU)
Лидия Алексеевна Пашкевич
Андрей Геннадиевич Скворцов (RU)
Андрей Геннадиевич Скворцов
Original Assignee
24 Центральный научно-исследовательский институт Министерства обороны РФ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 24 Центральный научно-исследовательский институт Министерства обороны РФ filed Critical 24 Центральный научно-исследовательский институт Министерства обороны РФ
Priority to RU2008102954/22U priority Critical patent/RU75074U1/ru
Application granted granted Critical
Publication of RU75074U1 publication Critical patent/RU75074U1/ru

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

Комплексная система автоматического распознавания речевых сигналов, состоящая из аналого-цифрового блока обработки речевого сигнала, который состоит из детектора огибающей, параллельно соединенного с детектором основного тона и нормализатором уровня, который в свою очередь соединен со спектрально-полосовым анализатором, причем выходы детектора огибающей, детектора основного тона и спектрально-полосового анализатора соединены с аналого-цифровым преобразователем (АЦП), отличающаяся тем, что в нее дополнительно введен исполнительный блок, состоящий из переключателя, устройств описания и верификации голосов, формирования эталонов, нормализации эталонов команд, распознавания команд и ключа, при этом АЦП посредством переключателя соединен с устройством описания и верификации голосов, выход которого соединен с устройством формирования эталонов, которое своим выходом соединено с переключателем, а выход соединен с устройством нормализации эталонов команд, выход которого соединен с ключом и устройством описания и верификации голосов, причем ключ своим входом соединен с переключателем, а выход соединен с устройством распознавания команд.

Description

Полезная модель относится к области электрорадиотехники, а именно к системам распознавания речевые сигналов и может быть использована на стационарных и подвижных объектах.
Комплексная система автоматического распознавания речевых сигналов эта система, которая с одной стороны, способна учитывать индивидуальные различия говорящих (ИРГ) при распознавании речевых команд, а с другой стороны - использовать эти различия для автоматической верификации голосов с целью контроля за личностью оператора.
Известен Патент США. Система распознавать речи. Кл. 338-18 №3292116. В этой системе предлагается корректор, имеющий набор частотных характеристик с крутизной подъема в сторону высоких частот, равной 6, 12, 18 и 24 дБ/окт.В зависимости от соотношения уровней входного сигнала в полосах 100-500 Гц и 500-5000 Гц включается управляющая цепь с соответствующей корректирующей характеристикой.
Наиболее близкой к заявляемой системе является Автоматическая система распознования голосов. (Протопип). Skarr R.W. NorMalization and adaption of speech data for automatic recognition. - Int. S. Mach. Stud, 1970, v2, №1.
Система состоит из блока обработки речевого сигнала в который входят; детектор огибающей, детектор основного тона, нормализатор уровня и спектрального полосового анализатора, а также аналого-цифровой преобразователь (АЦП).
В системе помимо выравнивания крутизны наклона спектра, производится и нормализация вариаций общего уровня сигнала. Что приводит к отслеживанию движения формант, для чего применены фильтры с переменной полосой пропускания. Полоса фильтра управляется сигналами, пропорциональными предыдущим значениям формант. Таким образом достигается определение частоты форманты по сравнению со способами, использующими формантные фильтры с постоянными xapaктеристиками, т.е. индивидуальных эталонных изображений звука.
Однако, как аналог, так и прототип не способны учитывать индивидуальные различия говорящих при распознавании речевых команд и автоматическую верификацию голосов с целью контроля за личностью оператора
Целью полезной модели является повышения надежности распознавания команд за счет нормализации индивидуальных различий говорящих.
Поставленная цель достигается тем, что комплексная система автоматического распознавания речевых сигналов состоящая из аналого-цифрового блока обработки речевого сигнала состоящего из детектора огибающей параллельно соединенного с детектором основного тона и нормализатором уровня, который в свою очередь соединен со спектрально-полосовым анализатором, причем выходы детектора огибающей, детектора основного тона и спектрально-полосового анализаторов соединены с аналого-цифровым преобразователем (АЦП), дополнительно введен исполнительный блок состоящий из переключателя, устройств описания и верификации голосов, формирования эталонов, нормализации эталонов команд, распознавания команд и ключа, при этом АЦП пoсредством переключателя связан с устройством описания и верификации голосов выход которого соединен с устройством формирования эталонов, которое своим входом соединено с переключателем, а выход соединен с устройством нормализации эталонов команд выход которого соединен с ключом и устройством описания и газификации голосов, причем ключ своим входом соединен с переключателем, а выход соединен с устройством распознавания команд.
На Фиг. показана блок-схема системы, она состоит из следующих элементов:
1 - детектора щгибающей;
2 - детектора основного тона;
3 - норализатора уровня;
4 - спектрально-полосового анализатора;
5 - аналого-цифрового преобразователя (АЦП);
6 - блока формирования эталонов;
7 - блока описания и верификации голосов;
8 - блока нормализации эталонов команд;
9 - блока распознавания команд;
10 - ключа К
Аналого-цифровой преобразователь 5 осуществляет связь выделенных параметров сигнала с исполнительным блоком.
Спектрально-полосовой анализатор 4 выполнен с помощью 24 четвертьоктавных фильтров, накрывающих полосу от 100 до 6400 Гц. Полученные на выходе анализатора сигналы далее выпрямляются, сглаживаются с помощью фильтров и подаются вместе с огибающей 1 исходного сигнала и значением основного тона 2 на преобразователь 5.
Работа системы заключается в следующем.
Речевой сигнал поступает параллельно на входы детекторов огибающей 1 и
Основного тона 2, нормализатора уровня 3 и спектрально-полосового анализатора 3 и спектрально-полосового анализатора 4, а затем через аналого-цифровой преобразователь 5 - в исполнительную часть системы. Устройство формирования эталонов 6 производит описание голосов верифицируемых операторов и распознаваемых команд. В режиме верификации устройство описания и верификации голосов 7 устанавливает принадлежность голосов оператора к классу «Свой» или «Чужой» и в случае первого исхода передает информацию об индивидуальных различий говорящих (ИРГ) в устройство нормализации эталонов команд 8. Одновременно через ключ (К) выдается разрешение на распознавание команд, произносимых вслед за парольной фразой. Это процедура осуществляется устройством распознавания команд 9 с использованием скорректированных эталонов, выдаваемых устройством нормализации эталонов команд 9.
Предложенная система позволяет существенно сократить объем запоминаемой информации об ИРГ в 6-10 раз по сравнению с использованием индивидуальных эталонных изображений звуков.
В режиме верификации, на материале 100 парольных фраз, произнесенных 10 дикторами, надежность системы автоматического подтверждения личности оператора составила 96%.

Claims (1)

  1. Комплексная система автоматического распознавания речевых сигналов, состоящая из аналого-цифрового блока обработки речевого сигнала, который состоит из детектора огибающей, параллельно соединенного с детектором основного тона и нормализатором уровня, который в свою очередь соединен со спектрально-полосовым анализатором, причем выходы детектора огибающей, детектора основного тона и спектрально-полосового анализатора соединены с аналого-цифровым преобразователем (АЦП), отличающаяся тем, что в нее дополнительно введен исполнительный блок, состоящий из переключателя, устройств описания и верификации голосов, формирования эталонов, нормализации эталонов команд, распознавания команд и ключа, при этом АЦП посредством переключателя соединен с устройством описания и верификации голосов, выход которого соединен с устройством формирования эталонов, которое своим выходом соединено с переключателем, а выход соединен с устройством нормализации эталонов команд, выход которого соединен с ключом и устройством описания и верификации голосов, причем ключ своим входом соединен с переключателем, а выход соединен с устройством распознавания команд.
    Figure 00000001
RU2008102954/22U 2008-01-25 2008-01-25 Комплексная система автоматического распознавания речевых сигналов RU75074U1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008102954/22U RU75074U1 (ru) 2008-01-25 2008-01-25 Комплексная система автоматического распознавания речевых сигналов

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008102954/22U RU75074U1 (ru) 2008-01-25 2008-01-25 Комплексная система автоматического распознавания речевых сигналов

Publications (1)

Publication Number Publication Date
RU75074U1 true RU75074U1 (ru) 2008-07-20

Family

ID=48232616

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008102954/22U RU75074U1 (ru) 2008-01-25 2008-01-25 Комплексная система автоматического распознавания речевых сигналов

Country Status (1)

Country Link
RU (1) RU75074U1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2701120C1 (ru) * 2018-05-14 2019-09-24 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для обработки речевого сигнала
RU2774095C1 (ru) * 2021-07-29 2022-06-15 Харман Интернэшнл Индастриз, Инкорпорейтид Способ и система для мониторинга работы системы помощи с распознаванием голоса в чувствительной к данным среде

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2701120C1 (ru) * 2018-05-14 2019-09-24 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для обработки речевого сигнала
RU2774095C1 (ru) * 2021-07-29 2022-06-15 Харман Интернэшнл Индастриз, Инкорпорейтид Способ и система для мониторинга работы системы помощи с распознаванием голоса в чувствительной к данным среде

Similar Documents

Publication Publication Date Title
KR950011963B1 (ko) 음성처리장치, 그 장치를 이용한 셀룰러 무선단말장치 및 음성처리방법
US20210192033A1 (en) Detection of replay attack
US9047878B2 (en) Speech determination apparatus and speech determination method
EP2592546B1 (en) Automatic Gain Control in a multi-talker audio system
US5146504A (en) Speech selective automatic gain control
CN108630202B (zh) 语音识别装置、语音识别方法以及记录介质
US8369549B2 (en) Hearing aid system adapted to selectively amplify audio signals
US9524735B2 (en) Threshold adaptation in two-channel noise estimation and voice activity detection
MX2008013753A (es) Control de ganancia de audio que utiliza deteccion de evento auditivo basado en intensidad acustica especifica.
CN103915103A (zh) 语音质量增强系统
KR20070061360A (ko) 고주파수 압축을 통한 음성 인식 향상 시스템
RU75074U1 (ru) Комплексная система автоматического распознавания речевых сигналов
US5897614A (en) Method and apparatus for sibilant classification in a speech recognition system
US11024318B2 (en) Speaker verification
JPS6257040B2 (ru)
DE112020005717T5 (de) Erkennung von live-sprache
CN112133320A (zh) 语音处理装置及语音处理方法
US3737580A (en) Speaker authentication utilizing a plurality of words as a speech sample input
RU102408U1 (ru) Устройство автоматического распознавания говорящего по голосу
US20230253010A1 (en) Voice activity detection (vad) based on multiple indicia
EP4303874A1 (en) Providing a measure of intelligibility of an audio signal
WO1991011696A1 (en) Method and apparatus for recognizing command words in noisy environments
JPH03160499A (ja) 音声認識装置
RU2701120C1 (ru) Устройство для обработки речевого сигнала
SU847317A1 (ru) Устройство дл ввода речевойиНфОРМАции

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20080817