RU2676022C1 - Способ повышения разборчивости речи - Google Patents

Способ повышения разборчивости речи Download PDF

Info

Publication number
RU2676022C1
RU2676022C1 RU2016128504A RU2016128504A RU2676022C1 RU 2676022 C1 RU2676022 C1 RU 2676022C1 RU 2016128504 A RU2016128504 A RU 2016128504A RU 2016128504 A RU2016128504 A RU 2016128504A RU 2676022 C1 RU2676022 C1 RU 2676022C1
Authority
RU
Russia
Prior art keywords
speech
intelligibility
speech signal
band
increasing
Prior art date
Application number
RU2016128504A
Other languages
English (en)
Inventor
Николай Васильевич Мулюкин
Татьяна Борисовна Ясинская
Original Assignee
Общество с ограниченной ответственностью "Речевая аппаратура "Унитон"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" filed Critical Общество с ограниченной ответственностью "Речевая аппаратура "Унитон"
Priority to RU2016128504A priority Critical patent/RU2676022C1/ru
Application granted granted Critical
Publication of RU2676022C1 publication Critical patent/RU2676022C1/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Abstract

Изобретение относится к средствам для разборчивости речи. Технический результат заключается в повышение разборчивости речи. Речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик. При этом обеспечивается возможность отключения полосовых фильтров в различных комбинациях. Полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи. 1 з.п. ф-лы.

Description

Изобретение относится к области речевых технологий и может быть использовано при передаче речевого сигнала по каналам связи и оптимизации его восприятия при аудировании.
Технический результат - повышение разборчивости речи в разнообразных окружающих условиях.
Из уровня техники известны:
- Эквалайзеры, позволяющие вручную или автоматически регулировать спектральный состав воспроизводимого речевого звука.
- Способы подавление шумовых помех за счет моделирования шума из набора типовых вариантов, однако, трудно построить адекватную на каждый случай комбинацию.
- Оценка реального шума (помехи) в исходном сигнале и, затем, вычитание его из речевого сигнала с шумами. Обычно оценивают шум из предыдущих интервалов исходного сигнала, однако при динамичном изменении шума во времени оценка будет не точной.
- Традиционная система подавления эхо-сигналов, используемая в конференц-связи.
Большинство известных способов повышения разборчивости речи строятся на принципах анализа фонового шума, присутствующего в окружающем пространстве и уменьшения взаимных помех между фоном и речевым сигналом.
Принципиальной особенностью подхода в предлагаемом способе является его независимость от фоновых условий, так как повышение разборчивости речевого сигнала в данном случае производится за счет усиления устойчивых спектрально-фонетических признаков исходного речевого сигнала.
Это достигается посредством воздействия на речевой сигнал системой специально настроенных полосовых фильтров, которые усиливают в исходном сигнале фонетически значимые спектральные области и, тем самым, помогают при аудировании членить речь и распознавать ее сегменты. При этом снижается маскирующее воздействие фонового шума и облегчается опознавание речи при эффектах «недослышания».
Универсальный характер специальной настройки полосовых фильтров обусловлен анатомически заданными резонансными полостями речевого тракта, который выступает в качестве динамично меняющегося фильтрующего устройства. Для определенных совокупностей речевых звуков перемещение резонансных областей (формант) в процессе артикуляции происходит в определенных полосах частот. Набор таких полос определяется статистически, вариативные нюансы при этом размываются именно за счет статистического характера частотных полос, в результате полосы становятся более устойчивыми. Прохождение речевого сигнала в процессе коррекции через подъемы амплитудно-частотных характеристик системы фильтров, перекрывающих зоны унифицированных частотных полос, и создает эффект подчеркнутой артикулированности, отчетливости речевых сегментов. При прослушивании речи различными аудиторами в различных условиях оптимальными могут быть различные комбинации включенных полосовых фильтров.
Практическая реализация предлагаемого способа может быть решена как схематически на базе серийно выпускаемых микросхем, так и на программном уровне с использованием компьютера.
Макет устройства для испытаний эффективности предлагаемого способа был создан на базе операционных усилителей по известным схемным структурам полосовых фильтров. В макет входило четыре полосовых фильтра, настроенных:
1. на интонационно-ритмические компоненты и «носовую» форманту речи;
2. на основные форманты гласных (первую и второю);
3. на третьи форманты гласных и сонорных звуков;
4. на тембральные компоненты шипящих-свистящих звуков.
Устройство работает следующим образом. Речевой сигнал, поступающий с выхода микрофона, усиливается, фильтруется системой полосовых фильтров, любой из которых может быть отключен или включен, суммируется с исходным речевым сигналом и подается на головные телефоны для прослушивания.
При испытании макетного устройства, реализующего рассмотренный способ, использовались речевые записи различного качества, в том числе зашумленные.
Прослушивание проводилось группой экспертов-аудиторов. В качестве критерия служило более отчетливое восприятие обработанного речевого сигнала в сравнении с исходным.
Испытания макета показали однозначно положительный результат, при этом различные аудиторы в зависимости от условий и характера речевого материала задавали различные комбинации включения полосовых фильтров.

Claims (2)

1. Способ повышения разборчивости речи, заключающийся в том, что речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик, отличающийся возможностью отключения полосовых фильтров в различных комбинациях и тем, что полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи.
2. Способ по п. 1, отличающийся тем, что речевой сигнал, отфильтрованный системой полосовых фильтров, суммируется с исходным речевым сигналом.
RU2016128504A 2016-07-13 2016-07-13 Способ повышения разборчивости речи RU2676022C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2016128504A RU2676022C1 (ru) 2016-07-13 2016-07-13 Способ повышения разборчивости речи

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2016128504A RU2676022C1 (ru) 2016-07-13 2016-07-13 Способ повышения разборчивости речи

Publications (1)

Publication Number Publication Date
RU2676022C1 true RU2676022C1 (ru) 2018-12-25

Family

ID=64753580

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016128504A RU2676022C1 (ru) 2016-07-13 2016-07-13 Способ повышения разборчивости речи

Country Status (1)

Country Link
RU (1) RU2676022C1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2726326C1 (ru) * 2019-11-26 2020-07-13 Акционерное общество "ЗАСЛОН" Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU27259U1 (ru) * 2000-09-07 2003-01-10 Железняк Владимир Кириллович Устройство для измерения разборчивости речи
RU2327230C2 (ru) * 2002-05-31 2008-06-20 Войсэйдж Корпорейшн Способ и устройство для частотно-избирательного выделения основного тона синтезированной речи
RU2347282C2 (ru) * 2003-07-07 2009-02-20 Конинклейке Филипс Электроникс Н.В. Система и способ обработки звукового сигнала
RU2440627C2 (ru) * 2007-02-26 2012-01-20 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи в звукозаписи развлекательных программ
US8296136B2 (en) * 2007-11-15 2012-10-23 Qnx Software Systems Limited Dynamic controller for improving speech intelligibility
RU2469423C2 (ru) * 2007-09-12 2012-12-10 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи с помощью четкости голоса
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU27259U1 (ru) * 2000-09-07 2003-01-10 Железняк Владимир Кириллович Устройство для измерения разборчивости речи
RU2327230C2 (ru) * 2002-05-31 2008-06-20 Войсэйдж Корпорейшн Способ и устройство для частотно-избирательного выделения основного тона синтезированной речи
RU2347282C2 (ru) * 2003-07-07 2009-02-20 Конинклейке Филипс Электроникс Н.В. Система и способ обработки звукового сигнала
RU2440627C2 (ru) * 2007-02-26 2012-01-20 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи в звукозаписи развлекательных программ
RU2469423C2 (ru) * 2007-09-12 2012-12-10 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи с помощью четкости голоса
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8296136B2 (en) * 2007-11-15 2012-10-23 Qnx Software Systems Limited Dynamic controller for improving speech intelligibility

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2726326C1 (ru) * 2019-11-26 2020-07-13 Акционерное общество "ЗАСЛОН" Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники

Similar Documents

Publication Publication Date Title
US7243060B2 (en) Single channel sound separation
CN109065067A (zh) 一种基于神经网络模型的会议终端语音降噪方法
US10803857B2 (en) System and method for relative enhancement of vocal utterances in an acoustically cluttered environment
CN112767963B (zh) 一种语音增强方法、装置、系统及计算机可读存储介质
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
Rämö et al. Perceptual headphone equalization for mitigation of ambient noise
CN110191397B (zh) 一种降噪方法及蓝牙耳机
TWI543634B (zh) 處理聲音段之方法及其電腦程式產品及助聽器
RU2676022C1 (ru) Способ повышения разборчивости речи
KR101850693B1 (ko) 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법
Tu et al. Optimising hearing aid fittings for speech in noise with a differentiable hearing loss model
JP6524463B2 (ja) 自動ミキシング装置およびプログラム
Sun et al. An RNN-based speech enhancement method for a binaural hearing aid system
CN102222507B (zh) 一种适用于汉语语言的听力损失补偿方法及设备
Halawani et al. Speech enhancement techniques for hearing impaired people: Digital signal processing based approach
US20140372111A1 (en) Voice recognition enhancement
Xiong et al. Deep subband network for joint suppression of echo, noise and reverberation in real-time fullband speech communication
Premananda et al. Uma BV Incorporating Auditory Masking Properties for Speech Enhancement in presence of Near-end Noise
WO2023104215A1 (en) Methods for synthesis-based clear hearing under noisy conditions
Shinde et al. Quality evaluation of combined temporal and spectral processing for hearing impaired
Lazim et al. A Bandpass Filter With Multi Deep Denoising Autoencoder for Hearing Applications
Shin et al. Speech reinforcement based on partial specific loudness
RU2111732C1 (ru) Способ адаптивной фильтрации речевых сигналов в слуховых аппаратах
WO2017036486A2 (en) Enhancement of temporal information
Kaur et al. Overlapping frame approach to estimate and reduce noise from single channel speech