RU2676022C1 - Способ повышения разборчивости речи - Google Patents
Способ повышения разборчивости речи Download PDFInfo
- Publication number
- RU2676022C1 RU2676022C1 RU2016128504A RU2016128504A RU2676022C1 RU 2676022 C1 RU2676022 C1 RU 2676022C1 RU 2016128504 A RU2016128504 A RU 2016128504A RU 2016128504 A RU2016128504 A RU 2016128504A RU 2676022 C1 RU2676022 C1 RU 2676022C1
- Authority
- RU
- Russia
- Prior art keywords
- speech
- intelligibility
- speech signal
- band
- increasing
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Abstract
Изобретение относится к средствам для разборчивости речи. Технический результат заключается в повышение разборчивости речи. Речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик. При этом обеспечивается возможность отключения полосовых фильтров в различных комбинациях. Полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи. 1 з.п. ф-лы.
Description
Изобретение относится к области речевых технологий и может быть использовано при передаче речевого сигнала по каналам связи и оптимизации его восприятия при аудировании.
Технический результат - повышение разборчивости речи в разнообразных окружающих условиях.
Из уровня техники известны:
- Эквалайзеры, позволяющие вручную или автоматически регулировать спектральный состав воспроизводимого речевого звука.
- Способы подавление шумовых помех за счет моделирования шума из набора типовых вариантов, однако, трудно построить адекватную на каждый случай комбинацию.
- Оценка реального шума (помехи) в исходном сигнале и, затем, вычитание его из речевого сигнала с шумами. Обычно оценивают шум из предыдущих интервалов исходного сигнала, однако при динамичном изменении шума во времени оценка будет не точной.
- Традиционная система подавления эхо-сигналов, используемая в конференц-связи.
Большинство известных способов повышения разборчивости речи строятся на принципах анализа фонового шума, присутствующего в окружающем пространстве и уменьшения взаимных помех между фоном и речевым сигналом.
Принципиальной особенностью подхода в предлагаемом способе является его независимость от фоновых условий, так как повышение разборчивости речевого сигнала в данном случае производится за счет усиления устойчивых спектрально-фонетических признаков исходного речевого сигнала.
Это достигается посредством воздействия на речевой сигнал системой специально настроенных полосовых фильтров, которые усиливают в исходном сигнале фонетически значимые спектральные области и, тем самым, помогают при аудировании членить речь и распознавать ее сегменты. При этом снижается маскирующее воздействие фонового шума и облегчается опознавание речи при эффектах «недослышания».
Универсальный характер специальной настройки полосовых фильтров обусловлен анатомически заданными резонансными полостями речевого тракта, который выступает в качестве динамично меняющегося фильтрующего устройства. Для определенных совокупностей речевых звуков перемещение резонансных областей (формант) в процессе артикуляции происходит в определенных полосах частот. Набор таких полос определяется статистически, вариативные нюансы при этом размываются именно за счет статистического характера частотных полос, в результате полосы становятся более устойчивыми. Прохождение речевого сигнала в процессе коррекции через подъемы амплитудно-частотных характеристик системы фильтров, перекрывающих зоны унифицированных частотных полос, и создает эффект подчеркнутой артикулированности, отчетливости речевых сегментов. При прослушивании речи различными аудиторами в различных условиях оптимальными могут быть различные комбинации включенных полосовых фильтров.
Практическая реализация предлагаемого способа может быть решена как схематически на базе серийно выпускаемых микросхем, так и на программном уровне с использованием компьютера.
Макет устройства для испытаний эффективности предлагаемого способа был создан на базе операционных усилителей по известным схемным структурам полосовых фильтров. В макет входило четыре полосовых фильтра, настроенных:
1. на интонационно-ритмические компоненты и «носовую» форманту речи;
2. на основные форманты гласных (первую и второю);
3. на третьи форманты гласных и сонорных звуков;
4. на тембральные компоненты шипящих-свистящих звуков.
Устройство работает следующим образом. Речевой сигнал, поступающий с выхода микрофона, усиливается, фильтруется системой полосовых фильтров, любой из которых может быть отключен или включен, суммируется с исходным речевым сигналом и подается на головные телефоны для прослушивания.
При испытании макетного устройства, реализующего рассмотренный способ, использовались речевые записи различного качества, в том числе зашумленные.
Прослушивание проводилось группой экспертов-аудиторов. В качестве критерия служило более отчетливое восприятие обработанного речевого сигнала в сравнении с исходным.
Испытания макета показали однозначно положительный результат, при этом различные аудиторы в зависимости от условий и характера речевого материала задавали различные комбинации включения полосовых фильтров.
Claims (2)
1. Способ повышения разборчивости речи, заключающийся в том, что речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик, отличающийся возможностью отключения полосовых фильтров в различных комбинациях и тем, что полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи.
2. Способ по п. 1, отличающийся тем, что речевой сигнал, отфильтрованный системой полосовых фильтров, суммируется с исходным речевым сигналом.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2016128504A RU2676022C1 (ru) | 2016-07-13 | 2016-07-13 | Способ повышения разборчивости речи |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2016128504A RU2676022C1 (ru) | 2016-07-13 | 2016-07-13 | Способ повышения разборчивости речи |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2676022C1 true RU2676022C1 (ru) | 2018-12-25 |
Family
ID=64753580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016128504A RU2676022C1 (ru) | 2016-07-13 | 2016-07-13 | Способ повышения разборчивости речи |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2676022C1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2726326C1 (ru) * | 2019-11-26 | 2020-07-13 | Акционерное общество "ЗАСЛОН" | Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU27259U1 (ru) * | 2000-09-07 | 2003-01-10 | Железняк Владимир Кириллович | Устройство для измерения разборчивости речи |
RU2327230C2 (ru) * | 2002-05-31 | 2008-06-20 | Войсэйдж Корпорейшн | Способ и устройство для частотно-избирательного выделения основного тона синтезированной речи |
RU2347282C2 (ru) * | 2003-07-07 | 2009-02-20 | Конинклейке Филипс Электроникс Н.В. | Система и способ обработки звукового сигнала |
RU2440627C2 (ru) * | 2007-02-26 | 2012-01-20 | Долби Лэборетериз Лайсенсинг Корпорейшн | Повышение разборчивости речи в звукозаписи развлекательных программ |
US8296136B2 (en) * | 2007-11-15 | 2012-10-23 | Qnx Software Systems Limited | Dynamic controller for improving speech intelligibility |
RU2469423C2 (ru) * | 2007-09-12 | 2012-12-10 | Долби Лэборетериз Лайсенсинг Корпорейшн | Повышение разборчивости речи с помощью четкости голоса |
US8606566B2 (en) * | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
-
2016
- 2016-07-13 RU RU2016128504A patent/RU2676022C1/ru active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU27259U1 (ru) * | 2000-09-07 | 2003-01-10 | Железняк Владимир Кириллович | Устройство для измерения разборчивости речи |
RU2327230C2 (ru) * | 2002-05-31 | 2008-06-20 | Войсэйдж Корпорейшн | Способ и устройство для частотно-избирательного выделения основного тона синтезированной речи |
RU2347282C2 (ru) * | 2003-07-07 | 2009-02-20 | Конинклейке Филипс Электроникс Н.В. | Система и способ обработки звукового сигнала |
RU2440627C2 (ru) * | 2007-02-26 | 2012-01-20 | Долби Лэборетериз Лайсенсинг Корпорейшн | Повышение разборчивости речи в звукозаписи развлекательных программ |
RU2469423C2 (ru) * | 2007-09-12 | 2012-12-10 | Долби Лэборетериз Лайсенсинг Корпорейшн | Повышение разборчивости речи с помощью четкости голоса |
US8606566B2 (en) * | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
US8296136B2 (en) * | 2007-11-15 | 2012-10-23 | Qnx Software Systems Limited | Dynamic controller for improving speech intelligibility |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2726326C1 (ru) * | 2019-11-26 | 2020-07-13 | Акционерное общество "ЗАСЛОН" | Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7243060B2 (en) | Single channel sound separation | |
CN109065067A (zh) | 一种基于神经网络模型的会议终端语音降噪方法 | |
US10803857B2 (en) | System and method for relative enhancement of vocal utterances in an acoustically cluttered environment | |
CN112767963B (zh) | 一种语音增强方法、装置、系统及计算机可读存储介质 | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
Rämö et al. | Perceptual headphone equalization for mitigation of ambient noise | |
CN110191397B (zh) | 一种降噪方法及蓝牙耳机 | |
TWI543634B (zh) | 處理聲音段之方法及其電腦程式產品及助聽器 | |
RU2676022C1 (ru) | Способ повышения разборчивости речи | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
Tu et al. | Optimising hearing aid fittings for speech in noise with a differentiable hearing loss model | |
JP6524463B2 (ja) | 自動ミキシング装置およびプログラム | |
Sun et al. | An RNN-based speech enhancement method for a binaural hearing aid system | |
CN102222507B (zh) | 一种适用于汉语语言的听力损失补偿方法及设备 | |
Halawani et al. | Speech enhancement techniques for hearing impaired people: Digital signal processing based approach | |
US20140372111A1 (en) | Voice recognition enhancement | |
Xiong et al. | Deep subband network for joint suppression of echo, noise and reverberation in real-time fullband speech communication | |
Premananda et al. | Uma BV Incorporating Auditory Masking Properties for Speech Enhancement in presence of Near-end Noise | |
WO2023104215A1 (en) | Methods for synthesis-based clear hearing under noisy conditions | |
Shinde et al. | Quality evaluation of combined temporal and spectral processing for hearing impaired | |
Lazim et al. | A Bandpass Filter With Multi Deep Denoising Autoencoder for Hearing Applications | |
Shin et al. | Speech reinforcement based on partial specific loudness | |
RU2111732C1 (ru) | Способ адаптивной фильтрации речевых сигналов в слуховых аппаратах | |
WO2017036486A2 (en) | Enhancement of temporal information | |
Kaur et al. | Overlapping frame approach to estimate and reduce noise from single channel speech |