RU2163032C2 - Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума - Google Patents

Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума Download PDF

Info

Publication number
RU2163032C2
RU2163032C2 RU98107313/09A RU98107313A RU2163032C2 RU 2163032 C2 RU2163032 C2 RU 2163032C2 RU 98107313/09 A RU98107313/09 A RU 98107313/09A RU 98107313 A RU98107313 A RU 98107313A RU 2163032 C2 RU2163032 C2 RU 2163032C2
Authority
RU
Russia
Prior art keywords
noise
filter
speech
digital signal
frame
Prior art date
Application number
RU98107313/09A
Other languages
English (en)
Other versions
RU98107313A (ru
Inventor
В. СЕЛЬВЕ Торбьерн
Original Assignee
Эрикссон Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Эрикссон Инк. filed Critical Эрикссон Инк.
Publication of RU98107313A publication Critical patent/RU98107313A/ru
Application granted granted Critical
Publication of RU2163032C2 publication Critical patent/RU2163032C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Abstract

Изобретение относится к передаче речи. Его использование в переносных цифровых радиотелефонах позволяет получить технический результат в виде повышения разборчивости речи. Способ реализуется в устройстве для селективного видоизменения кадра цифрового сигнала, образованного множеством последовательных кадров, когда цифровой сигнал представляет поступивший на передатчик аудиосигнал, образованный речевой и/или шумовой составляющими. Технический результат достигается благодаря тому, что в устройстве для селективного видоизменения кадра цифрового сигнала введены: устройство оценки уровня энергии, детектор речевой составляющей, устройство оценки шума, работающее, когда детектор речевой составляющей определяет, что речевая составляющая не формирует части кадра, справочную таблицу, содержащую множество вводов, при этом каждый ввод снабжен индексом, указывающим на уровень оценок шума, и фильтр для приема кадра цифрового сигнала, характеристики которого могут отбираться по вводу справочной таблицы, к которой было обращение, а ввод соответствует обновленной оценке шума, полученной устройством оценки шума. 2 с. и 8 з.п.ф-лы, 12 ил.

Description

Изобретение касается систем шумопонижения, а конкретно, адаптивной системы повышения разборчивости речи для использования в переносных цифровых радиотелефонах.
УРОВЕНЬ ТЕХНИКИ
Индустрия сотовых телефонов достигла феноменального успеха в области их коммерческой эксплуатации как в США, так и в остальном мире. Для услуг сотовой связи в областях крупных мегаполисов требуется увеличение пропускной способности существующих систем. Если предположить, что тенденция к увеличению пропускной способности будет сохраняться, тогда сотовая связь сможет достигнуть даже самых маленьких сельских уголков.
Следовательно, требуется увеличение пропускной способности систем сотовой связи при сохранении высокого качества услуг по приемлемой цене. Один из важных этапов в направлении увеличения пропускной способности системы заключается в преобразовании системы сотовой связи из системы с передачей аналоговых сигналов в систему передачи цифровых сигналов. Это преобразование также важно и по той причине, что первое поколение персональных коммуникационных сетей (ПКС), использующих дешевые, карманного размера радиотелефоны, которые можно легко переносить и использовать для отправления вызовов или приема вызовов дома, в офисе, на улице, в автомобиле и т. д., вероятно будут снабжены носителями сотовой связи, использующими инфраструктуру следующего поколения сотовой связи - цифровой.
Системы цифровой связи обладают преимуществом в том, что имеются общие технологии по обработке цифровых сигналов. Обработка цифровых сигналов сводится в основном к математическим и другим манипуляциям с сигналами, преобразованными в цифровой вид. Например, после преобразования (представления в цифровом виде) аналогового сигнала в цифровой вид этот цифровой сигнал может быть подвергнут фильтрации, усилен и ослаблен с помощью простых математических программ в процессоре цифровых сигналов (ПЦС). Обычно ПЦС изготовляются в виде высокоскоростных интегральных схем, которые позволяют выполнять операции по обработке данных, по существу, в реальном масштабе времени. ПЦС могут также использоваться для снижения скорости передачи двоичных данных, соответствующих речи, преобразованной в цифровой вид, что обеспечивает пониженное спектральное заполнение передаваемых радиосигналов и повышенную пропускную способность системы. Например, если речевые сигналы преобразуются в цифровой вид с помощью 14-битовой линейной импульсно-кодовой модуляции (ИКМ) и стробируются с частотой 8 кГц, то получается скорость передачи последовательных двоичных данных 112 кбит/с. Более того, за счет использования математической возможности по выявлению дублирований (избыточностей) и других характеристик человеческой речи, которые могут быть предсказаны, методы кодирования голоса могут использоваться для сжатия скорости передачи последовательных двоичных данных от 112 кбит/с до 7,95 кбит/с, т.е. для получения снижения скорости передачи двоичных данных в соотношении 14:1. Пониженные скорости передачи преобразуются в более подходящую частотную полосу.
Один из известных методов сжатия речи, адаптированный в США TIA для использования в качестве цифрового стандарта для второго поколения сотовых телефонных систем (т.е. IS-54), - это кодирование с возбуждаемым линейным предсказанием с вектором из справочного указателя (КВЛПВС). К сожалению, когда аудиосигналы, содержащие речь, смешенную с окружающим шумом, имеющим высокий уровень (особенно "цветной шум"), закодированы/сжаты с использованием КВЛПВС, частью полученного результата могут оказаться нежелательные характеристики аудиосигнала. Например, если цифровой мобильный телефон используется при наличии окружающего шума (например, в движущемся автомобиле), окружающий шум и сама речь сжимаются с помощью алгоритма кодирования КВЛПВС и передаются на базовую станцию, где сжатый сигнал декодируется и восстанавливается в звуковую речь. Когда фоновый шум восстанавливается в аналоговый формат, то в речь время от времени вводится нежелательное, звуковое искажение из-за шума. Это искажение очень раздражает обычного слушателя.
Это искажение вызвано в основном окружающей средой, в которой используются мобильные телефоны. Мобильные телефоны, как правило, используются внутри транспортного средства, где часто окружающий шум производится двигателем автомобиля и окружающими транспортными средствами. Этот окружающий шум внутри автомобиля обычно сосредотачивается в диапазоне низких звуковых частот, а величина шума может изменяться вследствие таких факторов, как скорость и ускорение автомобиля, а также количество транспорта вокруг автомобиля. Этот тип низкочастотного шума также оказывает значительное влияние на снижение разборчивости речи, когда говорящий человек находится в автомобиле. Снижение разборчивости речи, обусловленное низкочастотным шумом, может быть особенно значительным в системах связи, содержащих вокодер КВЛПВС, но оно также может возникнуть и в системах связи, которые не содержат вокодер КВЛПВС.
Степень влияния окружающего шума на мобильный телефон может также зависеть от того, каким образом используется мобильный телефон. В частности, мобильный телефон может использоваться в режиме "свободных рук", когда пользователь телефона говорит по телефону, а мобильный телефон находится в подвешенном состоянии. В этом случае пользователь телефона свободными руками может управлять машиной, но при этом увеличивается расстояние, которое должны преодолеть звуки, соответствующие словам пользователя телефона, для того чтобы достигнуть входа микрофона мобильного телефона. Это увеличенное расстояние между пользователем и мобильным телефоном наряду с изменяющимся окружающим шумом может привести к тому, что на шум будет приходится значительная часть спектральной энергии от полной мощности аудиосигнала, поступающего на вход мобильного телефона.
Известные из уровня техники решения, раскрытые в патентных заявках EP 0645756, EP 0558312, EP 0665530, DE 4012349, в патентах США 4811404, 4461025 и 5251263, - все они предлагают использовать метод фильтрации нежелательных составляющих сигнала.
Теоретически для фильтрации фонового шума, закодированного методом КВЛПВС, могут быть применены различные алгоритмы обработки сигнала с помощью использования процессоров цифровых сигналов. Однако такие решения часто требуют огромных объемов обработки цифровых сигналов, измеряемых в единицах миллионов операций в секунду (млн. оп./с - МОС), на что потребляются дорогие по стоимости время обработки, объем памяти и энергетические затраты. Однако каждое из этих средств, требующихся для обработки сигналов, в портативных радиотелефонах ограничено. Следовательно, простое увеличение нагрузки по обработке сигналов в ПЦС не является оптимальным решением для сведения к минимуму фонового шума, закодированного методом КВЛПВС или другим образом.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В настоящем изобретении предложена адаптивная система снижения шума, которая уменьшает нежелательное присутствие закодированного фонового шума, при этом оказывая минимальное отрицательное влияние на качество закодированной речи и минимально увеличивается потребление ресурсов процессора цифровых сигналов. Способ и система, предложенные в настоящем изобретении, увеличивают разборчивость речи в аудиосигнале, имеющем цифровой вид, за счет пропускания кадров аудиосигнала, преобразованного в цифровой вид, через схему фильтра. Схема фильтра функционирует как регулируемый высокочастотный фильтр, который фильтрует участок цифрового сигнала в области низких звуковых частот и пропускает участок цифрового сигнала, попадающий в области более высоких частот. Поскольку шум в автомобиле преимущественно соответствует диапазону низких звуковых частот и только относительно небольшая часть разборчивой речи попадает в этот низкочастотный диапазон, схема фильтра отфильтровывает большой сегмент шума в цифровом аудиосигнале и при этом отфильтровываются только мало значимые сегменты самой речи. Это приводит к тому, что удаляется относительно большая часть энергии шума по сравнению с удаляемой частью энергии речи. За счет адаптивной регулировки схемы фильтра и отбора ее частотной характеристики ограничивается объем отфильтрованной речи и в результате имеется минимальное отрицательное влияние фильтрации на разборчивость речи, полученной при передаче ее по радио(телефону).
Схема управления фильтром используется для регулировки схемы фильтра таким образом, чтобы схема фильтра имела различные частотные характеристики в зависимости от оценки шума и/или спектрального профиля, соответствующего шуму в аудиосигнале. Оценка шума и/или спектральный профиль подстраиваются для цифрового сигнала последовательно от кадра к кадру, и их величины зависят от выявления речи. Если речь не выявлена, то оценка шума и/или спектральный профиль обновляются для текущего кадра. Если речь выявлена, то оценка шума и/или спектральный профиль остаются не подстроенными.
В первом варианте осуществления изобретения схема фильтра вычисляет оценки шума для кадров аудиосигналов, имеющих цифровой вид (цифровых аудиосигналов). Оценки шума соответствуют количеству фонового шума в кадрах цифровых аудиосигналов. Оценки шума возрастают по мере возрастания относительной величины (уровня) фонового шума к (уровню) речи в низкочастотном диапазоне речи. Схема управления фильтром использует оценки шума для регулировки схемы фильтра так, чтобы она фильтровала большие части низкочастотного диапазона речи при увеличении относительной величины (уровня) фонового шума к (уровню) речи в низкочастотном диапазоне речи. Когда фоновый шум отсутствует, то никакая часть речевого сигнала не фильтруется. Когда имеется более высокий уровень фонового шума, то выделяются большие части шума и речевой информации. Поскольку шум преимущественно соответствует низкочастотному диапазону и только относительно небольшая часть разборчивой речи попадает в этот низкочастотный диапазон, разборчивость аудиосигнала в целом может быть улучшена, если при увеличении оценок шума будет увеличиваться отфильтровываемая часть низкочастотной энергии.
Во втором варианте осуществления изобретения используется модифицированная схема управления фильтром для регулировки схемы фильтра. Регулировка осуществляется так, чтобы схема фильтра проявляла различные частотные характеристики в зависимости от профиля шума оценки шума в отобранном частотном диапазоне в аудиосигнале. Схема управления фильтром включает спектральный анализатор для определения оценки профиля шума в зависимости от выявления речи. Оценка профиля шума определяется для текущего кадра и сравнивается с эталонным профилем шума. На основе этого сравнения схема фильтра адаптивно регулируется так, чтобы она выделяла различные количества низкочастотной энергии из текущего кадра.
Адаптивная система снижения шума согласно настоящему изобретению может с успехом применяться в телекоммуникационных системах, в которых портативные/мобильные радиоприемопередатчики связываются по РЧ каналам с любыми другими приемопередатчиками или с абонентами конкретной телефонной линии. Каждый приемопередатчик включает антенну, приемник для преобразования радиосигналов, принимаемых по РЧ каналу через антенну, в аналоговый аудиосигнал и передатчик. Передатчик включает кодер-декодер (кодек) для преобразования в цифровой вид аналоговых аудиосигналов, которые должны быть переданы в виде кадров цифровой речевой информации, при этом речевая информация содержит речь и фоновый шум. Для того, чтобы свести к минимуму фоновый шум, процессор цифровых сигналов обрабатывает текущий кадр, исходя из оценки фонового шума в текущем кадре и выявления в нем речи (речевой составляющей). Модулятор модулирует РЧ несущую с обработанным кадром речевой информации, имеющей цифровой вид, для последующей передачи через антенну.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Эти и другие особенности и достоинства настоящего изобретения станут очевидными для среднего специалиста в данной области техники из последующего описания с учетом чертежей, на которых:
фиг. 1 представляет общую функциональную блок-схему настоящего изобретения;
фиг. 2 иллюстрирует кадр и структуру временных интервалов цифрового стандарта США IS-54 для сотовой радиосвязи;
фиг. 3 представляет блок-схему первого предпочтительного варианта настоящего изобретения, выполненного с использованием процессора цифровых сигналов;
фиг. 4 представляет функциональную блок-схему примерного варианта настоящего изобретения в одном из многочисленных портативных (переносных) радиоприемопередатчиков, входящих в телекоммуникационную систему;
фиг. 5A и 5B представляют последовательность выполнения операций (алгоритм), которая иллюстрирует фракции/операции, выполняемые процессором цифровых сигналов при осуществлении первого предпочтительного варианта настоящего изобретения;
фиг. 6A представляет график, иллюстрирующий первый пример характерной зависимости ослабления сигнала от частоты для схемы фильтра согласно первому предпочтительному варианту настоящего изобретения;
фиг. 6B представляет график, иллюстрирующий второй пример характерной зависимости ослабления сигнала от частоты для схемы фильтра согласно первому предпочтительному варианту настоящего изобретения;
фиг. 7 - пример справочной таблицы, к которой обращается схема управления фильтром согласно первому предпочтительному варианту настоящего изобретения;
фиг. 8A и 8B - графики, иллюстрирующие примерные характерные зависимости амплитуды от частоты входных аудиосигналов;
фиг. 9A и 9B - графики, иллюстрирующие характерные зависимости амплитуды от частоты входных аудиосигналов, показанных на фиг. 8A и 8B соответственно, после того, как они прошли фильтрацию схемой фильтра, выполненной согласно настоящему изобретению;
фиг. 10 - блок-схема второго предпочтительного варианта настоящего изобретения, выполненного с использованием процессора цифровых сигналов;
фиг. 11 - последовательность выполнения операций (алгоритм), соответствующая последовательности, показанной на фиг. 5B, которая иллюстрирует функции/операции, выполняемые процессором цифровых сигналов при осуществлении второго предпочтительного варианта настоящего изобретения; и
фиг. 12 - пример справочной таблицы, к которой может обращаться схема управления фильтром, согласно второму предпочтительному варианту настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
В последующем описании с целью пояснения изобретения, но не ограничения его, приводятся определенные подробности, например, такие как конкретные схемы, элементы схем, методики, алгоритмы и т.д., они приведены для того, чтобы обеспечить глубокое понимание изобретения. Однако специалистам в данной области техники будет очевидно, что настоящее изобретение может быть реализовано на практике и в других вариантах, которые выходят за рамки этих указанных конкретных деталей. С другой стороны, опущены подробные описания хорошо известных методов, устройств и схем, чтобы не загромождать описание настоящего изобретения несущественными подробностями.
На фиг. 1 представлена общая блок-схема адаптивной системы 100 снижения шума согласно настоящему изобретению. Адаптивная система 100 снижения шума включает схему 105 управления фильтром, соединенную со схемой 115 фильтра. Схема 105 управления фильтром генерирует сигнал управления фильтром для текущего кадра аудиосигнала, преобразованного в цифровой вид. Сигнал управления фильтром подается на схему 115 фильтра, а схема 115 фильтра настраивается в ответ на сигнал управления фильтром так, чтобы она имела частотную характеристику с пропусканием высоких частот, отобранную на основе сигнала управления фильтром. Настроенная схема 115 фильтра фильтрует текущий кадр аудиосигнала, преобразованного в цифровой вид. Сигнал после фильтрации обрабатывается вокодером 120 для получения закодированного сигнала, представляющего аудиосигнал в цифровом виде.
Для варианта изобретения, показанного в качестве примера, применяемого для портативных (переносных)/мобильных радиотелефонных приемопередатчиков в системе сотовой связи, на фиг. 2 проиллюстрирована структура кадра с многостанционным доступом с временным разделением каналов (МДВРК), используемая в стандарте IS-54 для цифровой сотовой связи. "Кадр" представляет собой временной интервал в двадцать миллисекунд, который включает один блок TX передачи, один блок RX приема и блок измерения длины сигнала, используемый для мобильного перераспределения каналов (МПК). Два последовательных кадра, показанных на фиг. 2, передаются за временной интервал в сорок миллисекунд. Преобразованная в цифровой вид информация, содержащая речь и фоновый шум, обрабатывается и фильтруется последовательно кадр за кадром, как будет описано ниже.
Предпочтительно, чтобы функции схемы 105 управления фильтром, схемы 115, фильтра и вокодера 120, показанных на фиг. 1, выполнялись с помощью высокоскоростного процессора цифровых сигналов. Одним из подходящих процессоров цифровых сигналов является ПЦС TMS320C53, изготовляемый Texac Instruments. ПЦС TMS320C53 включает шестнадцатибитовый микропроцессор в виде одной интегральной схемы, ОЗУ на ИС для хранения данных, таких как речевые кадры, которые должны быть обработаны, ПЗУ для хранения различных алгоритмов для обработки данных, включая алгоритм сжатия речи КВЛПВС и другие алгоритмы, которые будут описаны ниже, для осуществления функций, выполняемых схемой 105 управления фильтром и схемой 115 фильтра.
Первый вариант настоящего изобретения показан на фиг. 3. В первом варианте схема 115 фильтра настраивается в зависимости от оценок фонового шума, определенных с помощью схемы управления фильтром. Кадры, полученные при импульсно-кодовой модуляции аудиоинформации (ИКМ кадры), последовательно запоминаются в ОЗУ на ИС в ПЦС. Аудиоинформация может быть преобразована в цифровой вид с использованием также и других методов преобразования в цифровой вид. Каждый ИКМ кадр извлекается из ОЗУ на ИС ПЦС и обрабатывается в устройстве 210 оценки энергии кадра, а также временно запоминается в устройстве 220 временного хранения кадра. Данные по энергии текущего кадра, определенные с помощью устройства 210 оценки энергии кадра, передаются в функциональные блоки: устройство 230 оценки шума и детектор 240 речи. Детектор речевой составляющей 240 указывает, что в текущем кадре содержится речь, если оценка энергии кадра превышает сумму величин предыдущей оценки шума и порогового уровня речи. Если детектор речевой составляющей 240 устанавливает, что речь отсутствует, тогда процессор 200 цифровых сигналов вычисляет новую оценку шума в зависимости от предыдущей оценки шума и энергии текущего кадра (блок 230).
Обновленная оценка шума подается в селектор 235 фильтра. Селектор 235 фильтра генерирует сигнал управления фильтром, исходя из оценки шума. В предпочтительном варианте селектор 235 фильтра при формировании сигнала управления фильтром обращается к справочной таблице. Справочная таблица включает группы значений управления фильтром, каждая из которых соответствует величине оценки шума или диапазону уровней оценки шума (вводу). Величина управления фильтром отбирается из справочной таблицы исходя из обновленной оценки шума, и эта величина управления фильтром представляется в виде сигнала управления фильтром, поступающего в банк 265 фильтров для схемы 115 фильтра. Для стабилизации процесса и для того, чтобы не допустить чрезмерно большого числа переключений между различными фильтрами, при отборе нового фильтра устанавливается отложенное время, соответствующее N кадрам. Новый фильтр может быть отобран только один на N кадров, где N - целое число больше 1 и предпочтительно больше 10.
Схема 115 фильтра настраивается в ответ на сигнал управления фильтром так, чтобы она имела частотную характеристику, пропускающую высокие частоты, которая соответствовала бы сигналу управления фильтром и оценке шума, подаваемым на вход схемы 115. Из уровня техники хорошо известны многочисленные различные виды схем фильтров, которые могут быть использованы для получения отобранных частотных характеристик в ответ на сигнал управления фильтром. Эти известные из уровня техники фильтры включают БИХ-фильтры (фильтры с бесконечной импульсивной характеристикой), такие как фильтр Баттерворта, фильтр Чебышева или эллиптический фильтр. БИХ-фильтры являются предпочтительными по отношению к КИХ-фильтрам (фильтрам с конечной импульсной характеристикой), которые также могут быть использованы вследствие того, что у них более низкие требования к обработке данных.
Фильтрованный сигнал обрабатывается вокодером 120, который используется для сжатия (уменьшения) скорости передачи двоичных данных фильтрованного сигнала. В предпочтительных вариантах вокодер 120 использует для кодирования аудиосигнала КВЛПВС. Могут быть также использованы и другие методы и алгоритмы кодирования голоса, например кодирование с линейным предсказанием, возбуждаемым кодом (CELP), кодирование с линейным предсказанием, возбуждаемым оставшимся импульсом (RPE-LTP), улучшенное возбуждаемое многополосное кодирование (IMBE). За счет фильтрации кадров аудиосигналов согласно настоящему изобретению до выполнения голосового кодирования фоновый шум снижается до минимума, что, по существу, уменьшает любые нежелательные шумовые эффекты в речи, когда она будет восстанавливаться. Это также защищает речь от того, чтобы она не "утонула" в низкочастотном шуме.
Процессор 200 цифровых сигналов, описанный со ссылкой на фиг. 3, может быть использован, например, в приемопередатчике цифрового портативного (переносного)/мобильного радиотелефона, используемого в системе радиосвязи. На фиг. 4 представлен один такой цифровой радиоприемопередатчик, который может быть использован в сотовой телекоммуникационной сети.
Аудиосигналы, содержащие речь и фоновый шум, поступают на вход микрофона 400 для ввода в кодер-декодер (кодек) 402, который предпочтительно представляет собой интегральную схему специального приложения (ИССП). Полоса (частотная), ограниченная аудиосигналами, детектируемыми в микрофоне 400, стробируется кодеком 402 с частотой 8000 выборок в секунду, и выборки блокируются в кадры. Таким образом, каждый двадцатимиллисекундный кадр включает 160 речевых выборок (дискретных значений). Эти выборки квантуются и преобразовываются в закодированный цифровой формат, например, 14-битовой линейной ИКМ. Как только 160 выборок речи, преобразованной в цифровой вид, для текущего кадра запоминаются в ОЗУ 202 на ИС в передающем ПЦС 200, передающий ПЦС 200 выполняет операции по кодированию канала, оценку энергии кадра, оценку шума, детектирование (выявление) речи, БПФ (быстрое преобразование Фурье), функции фильтра и кодирование/сжатие цифровой речи в соответствии с алгоритмом КВЛПВС, как описано выше при ссылке на фиг. 3.
Контролирующий микропроцессор 432 управляет всей работой всех элементов в приемопередатчике, показанном на фиг. 4. Поток фильтрованных ИКМ данных, генерируемый передающим ПЦС 200, предназначен для квадратурной модуляции и передачи. Для этого матрица 404 логических элементов ИССП формирует каналы информации, синфазный (I) и квадратурный (Q), на основе потока фильтрованных ИКМ данных из ПЦС 200. Потоки I и Q двоичных данных обрабатываются согласованно с помощью низкочастотных фильтров 406 и 408 и поступают в смесители IQ в балансном модуляторе 410. Генератор 412 опорной частоты и умножитель 414 обеспечивают передающую промежуточную частоту (ПЧ). I-сигнал смешивается с синфазной ПЧ, а Q-сигнал смешивается с квадратурной ПЧ (т.е. с помощью фазовращателя 416 синфазная ПЧ отстает на 90 градусов). Смешенные I- и Q-сигналы суммируются, преобразуются "до" частоты РЧ канала, отобранного с помощью синтезатора 430 каналов, и передаются через дуплексор 420 и антенну 422 по отобранному радиочастотному каналу.
Со стороны приема сигналы, принятые через антенну 422 и дуплексор 420, преобразуются с частоты отобранного канала приема в смесителе 424 к первой ПЧ частоте, используя сигнал гетеродина, синтезированный синтезатором 430 каналов на основе выходного сигнала генератора 428 опорной частоты. Выходной сигнал смесителя 424 первой ПЧ фильтруется и преобразовывается в частоту второй ПЧ на основе другого выходного сигнала из синтезатора 430 каналов и демодулятора 426. Матрица 434 логических элементов приема затем преобразует сигнал второй ПЧ в группы фазовых выборок и группы частотных выборок. ПЦС 436 приема выполняет демодуляцию, фильтрацию, усиление/ослабление, декодирование канала и растягивание речи в принятых сигналах. Обработанные речевые данные затем передаются в кодек 402 и преобразуются до базовой (основной) частотной полосы аудиосигналов для приведения в действие громкоговорителя 438.
Операции, выполняемые процессором 200 цифровых сигналов для осуществления функции схемы 105 управления фильтром, схемы 115 фильтра и кодера 120, теперь будут раскрыты со ссылкой на последовательность выполнения операций (алгоритм), представленную на фиг. 5A и 5B. Устройство 210 оценки энергии кадра определяет энергию в каждом кадре аудиосигналов. Устройство 210 оценки энергии кадра определяет энергию текущего кадра путем вычисления суммы квадратов величин каждой ИКМ выборки в кадре (шаг 505). Поскольку при частоте стробирования 8000 выборок в секунду на двадцатимиллисекундный кадр приходится 160 выборок (дискретных значений), то суммируются 160 ИКМ выборок, значения которых возведены в квадрат. В математическом виде оценка энергии кадра определяется согласно следующему уравнению:
Figure 00000002

Величина энергии кадра, вычисленная для текущего кадра, запоминается в ОЗУ 202 на ИС ПЦС 200 (шаг 510).
В функции речевого детектора 240 входит вызов из ОЗУ на ИС ПЦС 200 оценки шума, ранее определенной устройством 230 оценки шума (шаг 515). Конечно, когда приемопередатчик в начальный момент включается, то никакой оценки шума не будет существовать. Блок 520 принятия решения предусматривает эту ситуацию и присваивает значение оценки шума на шаге 525. Предпочтительно, в качестве оценки шума присваивается произвольная высокая величина, например на 20 дБ выше нормальных уровней речи, для того чтобы пришлось обновлять величину оценки шума, как это будет показано ниже. Энергия кадра, определенная с помощью устройства 210 оценки энергии кадра, извлекается из ОЗУ 202 на ИС ПЦС 200 (блок 530). В блоке 535 принимается решение: превышает ли оценка энергии кадра сумму величины извлеченной оценки шума и заданной величины речевого порога, как показано в следующем уравнении 2:
оценка энергии кадра > (оценка шума + речевой порог)
Величина речевого порога может быть фиксированной величиной, определенной эмпирически; она должна быть больше, чем изменения энергии за короткие промежутки времени (флуктуации энергии) типичного фонового шума, и может быть, например, установлена в 9 дБ. Кроме того, величина речевого порога может быть адаптивно модифицирована, чтобы она отражала изменяющиеся условия речи, например, когда говорящий попадает в более шумную или более тихую обстановку. Если оценка энергии кадра превышает сумму в уравнении 2, то в блоке 570 устанавливается признак, что речь существует. Если детектор речевой составляющей 240 выявляет, что речь существует, тогда устройство 230 оценки шума обходится и извлекается (из ОЗУ) оценка шума, вычисленная для предыдущего кадра в аудиосигнале, преобразованном в цифровой вид, и она используется в качестве текущей оценки шума. В противном случае, если оценка энергии кадра меньше, чем сумма в уравнении 2, тогда признак речи в блоке 540 возвращается в исходное состояние.
Другие системы для детектирования речи в текущем кадре также могут быть использованы. Например, Европейский институт телекоммуникационных стандартов (ЕИТС) разработал стандарт детектирования голосовой активности (ДГА) в системе Глобальная Система для Мобильной связи (GSM) и описал его в Стандартах ЕИТС: RE/SMG-020632P; в описание изобретения он включен в качестве ссылки на источник информации. Этот стандарт мог бы использоваться для детектирования речи в настоящем изобретении, и он включен в качестве ссылки.
Если речь не выявлена, тогда устройство оценки шума 230 выполняет стандартную последовательность операций по обновлению оценки шума. По сути, оценка шума представляет собой среднюю величину энергии кадра за временные интервалы, когда нет речи. Как было описано выше, если оценка шума в момент начала работы выбирается достаточно высокой, то речь не выявляется и признак речи будет в исходном состоянии, вследствие чего потребуется выполнять операции по обновлению оценки шума.
В последовательности операций (подпрограмме) по оценке шума, выполняемой устройством 230 оценки шума, дельта (Δ) разности/ошибки определяется в блоке 545 между энергией шума кадра, полученной устройством 210 оценки энергии кадра, и оценкой шума, ранее вычисленной устройством 230 оценки шума, в соответствии со следующим уравнением:
Δ = энергий текущего кадра - предыдущая оценка шума
(уравнение 3)
В блоке 550 принятия решения определяется, превышает ли Δ нуль. Если Δ - отрицательная, что имеет место при высоких величинах оценки шума, тогда оценка шума повторно вычисляется в блоке 560 в соответствии со следующим уравнением:
оценка шума = предыдущая оценка шума + Δ/2
(уравнение 4)
Поскольку Δ - отрицательная величина, то это приводит к понижающей корректировке оценки шума. Относительно большой размер шага, Δ/2, выбирается для того, чтобы резко (быстро) осуществлять коррекцию для понижающихся шумовых уровней. Однако, если энергия кадра превышает оценку шума, обеспечивая Δ большую, чем нуль, тогда оценка шума обновляется в блоке 555 в соответствии со следующим уравнением:
оценка шума = предыдущая оценка шума + Δ/256
(уравнение 5)
Поскольку Δ - положительная величина, то оценка шума должна быть увеличена. Однако небольшой размер шага, Δ/256 (по сравнению с Δ/2), выбирается для постепенного увеличения оценки шума и обеспечения, в значительной степени, невосприимчивости к проходящему шуму.
Оценка шума, вычисленная для текущего кадра, подается на селектор 235 фильтра. В первом предпочтительном варианте селектор 235 фильтра обращается к справочной таблице и использует текущую оценку шума для отбора величины управления фильтром (шаг 572). Схема 115 фильтра (на шаге 574) настраивается в зависимости от выбранной величины управления фильтром так, чтобы ее частотная характеристика обеспечивала увеличение количества фильтрованного шума при увеличении оценки шума и фонового шума. ИКМ выборки, хранящиеся в ОЗУ ПЦС, затем пропускаются через настроенную схему 265 фильтра, чтобы она фильтровала ИКМ выборки для устранения шума (шаг 576). Фильтрованные ИКМ выборки затем обрабатываются вокодером 120 (шаг 578), и закодированные выборки затем подаются на схемы РЧ-передачи (шаг 580).
На фиг. 6A и 6B показаны примеры того, как настраивается схема 115 фильтра, для того чтобы она имела различные частотные характеристики F1 - F4 для различных сигналов управления фильтром, поступающих на вход схемы 115 фильтра. Как показано на фиг. 6A, схема 115 фильтра может быть отобрана такой, чтобы она проявляла группу различных частотных характеристик, причем эти частотные характеристики F1 - F4 имеют частоты отсечки F1c - F4c соответственно. Частоты отсечки схемы 115 фильтра могут быть в предпочтительном варианте в диапазоне от 300 Гц до 800 Гц. При увеличении оценки шума схема 115 фильтра выполняется так, чтобы она проявляла частотные характеристики, имеющие более высокие частоты отсечки. Более высокие частоты отсечки приводят к тому, что большая часть энергии кадра попадает в низкочастотный речевой диапазон, который выделяется с помощью схемы 115 фильтра.
Таким же образом, как показано на фиг. 6B, схема 115 фильтра может быть отобрана так, чтобы она проявляла группу различных частотных характеристик F1 - F4, причем каждая из этих частотных характеристик имела бы различный наклон и одну и ту же частоту отсечки. Частота отсечки для частотных характеристик F1 - F4 находится в вышеупомянутом диапазоне. Схема 115 фильтра настраивается так, чтобы при увеличении оценки шума она имела частотные характеристики с более крутыми наклонами. Более крутые наклоны приводят к тому, что большая часть энергии кадра попадает в низкочастотный речевой диапазон, который выделяется с помощью схемы 115 фильтра.
Схема 115 фильтра фильтрует текущие кадры в зависимости от оценки шума, вычисленной для текущего кадра. Текущий кадр фильтруется так, чтобы шум был уменьшен (подавлен), а основная часть речи прошла (через фильтр). Основная часть речи, которая проходит не отфильтрованной, дает выходной сигнал распознаваемой речи лишь с минимальным снижением качества речевого сигнала. Комбинирование различных частот отсечки и различных наклонов может быть использовано для адаптивного выделения отобранных частей энергии кадра, попадающих в низкочастотный речевой диапазон.
На фиг. 7 показан пример справочной таблицы, к которой обращается селектор 235 фильтра, для того чтобы отобрать одну из частотных характеристик F1 - F4 для схемы 115 фильтра. Справочная таблица включает группы потенциальных (возможных) оценок (вводов) N1 - Nn шумов и величин F1 - Fn управления фильтром, соответствующих потенциальным частотным характеристикам, которые может иметь схема 115 фильтра. Каждая из оценок N1 - Nn шума может представлять диапазон оценок шума и каждая из них согласуется с конкретной величиной F1 - F4 управления фильтром. Схема 105 управления фильтром генерирует сигнал управления фильтром путем вычисления оценки шума и извлечения из справочной таблицы величины управления фильтром, соответствующей этой оценке.
На фиг. 8A, 8B и 9A, 9B показано, как адаптивно фильтруется аудиосигнал для каждого из двух кадров для получения улучшенного аудиосигнала, поступающего на РЧ передатчик. На фиг. 8A и 8B показаны первый кадр и второй кадр аудиосигнала, содержащего речевые компоненты s1 и s2 и шумовые компоненты n1 и n2 соответственно. Как показано, шумовая энергия n1 и n2 в обоих кадрах сосредоточена в низкочастотном звуковом диапазоне, а речевая энергия s1 и s2 сосредоточена в более высокочастотном звуковом диапазоне. На фиг. 9A показаны шумовой сигнал n1 и речевой сигнал s1 для первого кадра после фильтрации. На фиг. 9B показаны шумовой сигнал n2 и речевой сигнал s2 для второго кадра после фильтрации.
Как уже указывалось, адаптивная система 100 снижения звукового шума выполняется с учетом разности в уровнях шума между первым кадром и вторым кадром путем регулировки схемы 105 управления фильтром на основе вычисленной оценки шума для текущего кадра. Например, схемой 105 управления фильтром вычисляются оценка N1 шума и спектральный профиль S1 и для первого кадра отбирается величина F1 управления фильтром. В предпочтительном варианте схема 115 фильтра регулируется исходя из величины F1 управления фильтром, и в результате схема 115 фильтра приобретает частотную характеристику F1 с частотой F1c отсечки, как показано на фиг. 6A. Первый кадр проходит через эту отрегулированную схему 115 фильтра. Схема 115 фильтра отбирается так, чтобы большая часть шума n1 и лишь небольшая часть речи s1 попадали ниже частоты F1c отсечки частотной характеристики F1. Это приводит к тому, что шум n1 эффективно фильтруется, а в речи s1 фильтруется только относительно незначительная ее часть. Фильтрованный аудиосигнал первого кадра показан на фиг. 9A.
Во втором кадре, показанном на фиг. 8B, фоновый шум имеет более высокий уровень. Предполагая, что речь не выявлена, схемой 105 управления фильтром вычисляется более высокая оценка n2 шума. Для второго кадра исходя из более высокой оценки шума определяется более высокая величина F2 управления фильтром. В первом предпочтительном варианте схема 115 фильтра регулируется в ответ на более высокую величину F2 управления фильтром так, чтобы ее частотная характеристика имела более высокую частоту F2с отсечки, как показано на фиг. 6A. Следующий (второй) кадр аудиосигнала проходит через отрегулированную схему 115 фильтра. Поскольку частота F2c отсечки частотной характеристики F2 выше для последующего (второго) кадра, то фильтруется большая часть шума n2 и речи s2. Фильтрованная часть речи s2 остается все еще относительно незначительной для того, чтобы повлиять на разборчивость информации, содержащейся в кадре, поэтому на речь оказывается лишь минимальное отрицательное влияние. Недостаток, возникающий из-за фильтрации большей части речи s2, находится в противовесе с достоинством, обусловленным устранением шума n2 из второго кадра. Фильтрованный участок спектра речи не вносит значительного вклада в разборчивость речи. Аудиосигнал второго кадра, прошедший фильтрацию, показан на фиг. 9B.
Второй предпочтительный вариант адаптивной системы 100 снижения шума показан на фиг. 10-12. Во втором предпочтительном варианте схема 105 управления фильтром регулирует схему 115 фильтра в зависимости от оценок (спектрального) профиля шума. Оценка профиля шума вычисляется для каждого кадра и сравнивается с эталонным профилем шума. На основе этого сравнения схема 115 фильтра адаптивно регулируется так, чтобы она выделяла (убирала) из текущего кадра различные количества низкочастотной энергии.
На фиг. 10 показана конфигурация ПЦС 200 согласно второму предпочтительному варианту изобретения. Как показано, схема 105 управления фильтром включает спектральный анализатор 270, помимо устройства 210 оценки энергии кадра устройство 230 оценки шума, детектор речевой составляющей 240 и селектора 235 фильтра, которые описаны при раскрытии первого варианта изобретения. Схема 105 управления фильтром определяет оценки шума и выявляет речь для принятых кадров, как это описано для первого варианта изобретения и показано в виде последовательностей выполнения операций (алгоритмов), представленных на фиг. 5A и 5B. Если для текущего кадра речь выявлена, тогда спектральный анализатор 270 обновляет оценку профиля шума и использует эту оценку профиля шума для регулировки схемы 115 фильтра.
На фиг. 11 показаны шаги, выполняемые при обновлении оценки профиля шума и регулировке схемы 115 фильтра. На фиг. 11 показаны шаги, выполняемые спектральным анализатором 270, которые включены в полный процесс обработки данных, ранее описанный в алгоритмах на фиг. 5A и 5B для первого предпочтительного варианта.
Если для текущего кадра речь не выявлена, спектральный анализатор 270 сначала определяет профиль шума для текущего кадра (шаг 600). Определенный для текущего кадра профиль шума включает (результаты) вычисления энергии для различных частот (т.е. элементов разрешения по частоте) в пределах отобранного для текущего кадра низкочастотного речевого диапазона. В предпочтительном варианте отобранный частотный диапазон составляет примерно от 300 до 800 герц. Профиль шума текущего кадра может быть определен путем обработки текущего кадра с использованием быстрого преобразования Фурье (БПФ) с N элементами разрешения по частоте. Обработка цифровых сигналов с помощью БПФ хорошо известна в данной области техники и привлекательна она тем, что для нее требуется очень маленькая мощность обработки там, где БПФ ограничивается относительно небольшим числом элементов разрешения по частоте, например 32. БПФ с N элементами разрешения по частоте дает рассчитанные значения (уровни) энергии на N различных частотах. Вычисленные значения (уровни) энергии для элементов разрешения по частоте, попадающие в отобранный частотный диапазон, образуют профиль шума для текущего кадра.
Для того, чтобы определить оценку профиля шума для текущего кадра (шаг 604), профиль шума для текущего кадра усредняется с оценкой профиля шума, определенной для предыдущего кадра аудиосигнала. В том случае, если предыдущая оценка профиля шума отсутствует, например, после приведения системы в исходное состояние, тогда может быть использована первоначальная оценка профиля шума, хранящаяся в памяти. Оценка профиля шума включает оценки ei энергии шума (где i = 1, 2, ...), расположенные последовательно в порядке уменьшения частот (т.е. e1 - оценка энергии шума для наиболее высокой частоты, а en - оценка энергии шума для наиболее низкой частоты в отобранном частотном диапазоне). В предпочтительном варианте каждая оценка ei энергии шума соответствует среднему значению результатов расчета уровня энергии при конкретной частоте в отобранном частотном диапазоне для множества последовательных кадров, в которых речь не была выявлена. За счет использования множества кадров при определении оценки профиля шума схема 115 фильтра регулируется более постепенно. В других вариантах оценка профиля шума может быть приравнена к профилю шума текущего кадра.
Оценки ei энергии в оценке профиля шума затем сравниваются с эталонным профилем шума (шаг 604). Эталонный профиль шума включает эталонные пороговые уровни eri энергии (где i - 1, 2, ... n) на частотах, соответствующих частотам для оценок ei энергии шума в оценке профиля шума. Эталонные пороговые уровни eri энергии могут быть определены эмпирически. Оценки ei энергии шума последовательно сравниваются с соответствующими эталонными пороговыми уровнями eri энергии, начиная с оценки e1 энергии на самой высокой частоте до оценки en энергии на самой низкой частоте.
А более конкретно: оценка e1 энергии шума сначала сравнивается с эталонным пороговым уровнем er1 шума. Если e1 больше, чем эталонный пороговый уровень er1 шума, тогда отбирается величина c1 сравнения и подается на вход селектора 235 фильтра. Если оценка e1 энергии шума меньше, чем эталонный пороговый уровень er1 шума, тогда оценка e2 энергии шума (которая является оценкой энергии шума при более низкой частоте, чем e1) сравнивается с эталонным пороговым уровнем er2 шума. Если оценка e2 энергии шума больше, чем эталонный пороговый уровень er2 шума, тогда отбирается величина c2 сравнения и подается на вход селектора 235 фильтра. Этот процесс сравнения продолжается до тех пор, пока не будет отобрана величина ci сравнения (где i = 1, 2, ... n).
Схема 235 фильтра использует определенные величины ci сравнения для того, чтобы определить величину управления фильтром. Величина управления фильтром отбирается из справочной таблицы так, как показано на фиг. 12. Справочная таблица включает группы из величин ci сравнения и соответствующих величин Fi управления фильтром. Схема 115 фильтра регулируется в зависимости от отобранной величины управления фильтром. Схема 115 фильтра регулируется так, чтобы ее частотная характеристика выделяла из текущего кадра низкочастотную энергию. Схема 115 фильтра регулируется так, чтобы она выделяла возрастающее количество низкочастотной энергии по мере того, как оценки энергии шума при последовательно повышающихся частотах превышают соответствующие эталонные пороговые уровни энергии. На фиг. 6A и 6B показан пример частотных характеристик для отобранных величин управления фильтром.
Использование оценок профиля шума способствует тому, чтобы улучшить способность схемы фильтра к адаптивной регулировке, чтобы выделение низкочастотной энергии приводило к улучшению в целом качества речи. Поскольку мобильные средства связи используются не только в автомобилях и, таким образом, в определенных ситуациях профиль шума может быть смещен в сторону более высоких частот, спектральный анализатор 270 может оказаться селективно непригодным, когда энергия шума на низких частотах будет мала. Кроме того, если значительная часть частотного спектра шума находится в более низких частотах, тогда может быть применен более крутой фильтрующий наклон, даже если возможно придется пожертвовать некоторой вычислительной мощностью. Эти дополнительные требования к вычислительным возможностям все еще довольно небольшие.
Из вышеприведенного описания очевидно, что адаптивная система фильтрации шума согласно настоящему изобретению выполняется легко и без значительного увеличения объема вычислений ПЦС. Более сложные методы снижения шума, такие как "спектральное вычитание", требуют использования вычислительных средств, производящих несколько миллионов операций в секунду (МОС), а также имеющих большой объем памяти для хранения данных и программ кодирования. Для сравнения, настоящее изобретение может быть реализовано при использовании только доли от МОС и объема памяти, требующейся для алгоритма "спектрального вычитания", который, кроме того, вносит большие речевые искажения. За счет снижения объема памяти снижается размер интегральных схем ПЦС; пониженный объем выполняемых операций (МОС) обеспечивает снижение затрат на энергию. Оба эти достоинства требуются для портативных (переносных)/мобильных радиотелефонов, запитываемых от батареек.
Несмотря на то, что изобретение было конкретно показано и описано со ссылкой на его предпочтительные варианты выполнения, оно не ограничивается этими вариантами. Например, хотя ПЦС описан как выполняющий функции устройства 210 оценки энергии кадра, устройства 230 оценки шума, детектора речевой составляющей 240, селектора 235 фильтра и схемы 265 фильтра, эти функции могу быть реализованы с использованием других цифровых и/или аналоговых элементов. Кроме того, адаптивная система 100 фильтрации может быть реализована и в таком варианте, когда схема 115 фильтра регулируется в зависимости и от оценок шума, и от оценок профиля шума.

Claims (10)

1. Способ селективного видоизменения кадра цифрового сигнала, образованного множеством последовательных кадров, при этом цифровой сигнал представляет аудиосигнал, принятый на передатчике, причем аудиосигнал образован чередующимися речевой составляющей, шумовой составляющей, а также речевой составляющей вместе с шумовой составляющей, отличающийся тем, что включает следующие итеративные шаги, выполняемые последовательно шаг за шагом: оценка уровня энергии (505) кадра цифрового сигнала, определение (535) в ответ на оценку, полученную на упомянутом шаге оценки, содержит ли кадр цифрового сигнала речевую составляющую, обновление оценки шума в функции от предыдущей оценки шума и уровня энергии, оцененного на упомянутом шаге оценки, когда определяют, что речевая составляющая на упомянутом шаге определения не формирует части кадра, обращение (572) к вводу в справочной таблице, имеющей характеристики фильтра, которым приписаны индексы, соответствующие уровням оценок шума, при этом ввод, к которому обращаются, соответствует величине оценки шума, обновленной на упомянутом шаге обновления, отбор (574) характеристик фильтра схемы-фильтра, которыми должен обладать фильтр, при этом отбирают характеристику фильтра из хранящихся в памяти характеристик фильтра, которая соответствует вводу, к которому было обращение на шаге обращения, и фильтрация (576) кадра цифрового сигнала с помощью фильтра, который имеет характеристики фильтра схемы-фильтра, вследствие чего видоизменяется кадр цифрового сигнала, реагируя на характеристики фильтра схемы-фильтра.
2. Способ по п.1, отличающийся тем, что дополнительно включает дополнительный промежуточный шаг по определению (600) оценки профиля шума кадра цифрового сигнала, если определено, что кадр цифрового сигнала, для которого определяется оценка, не содержит речевой составляющей.
3. Способ по п.2, отличающийся тем, что оценку профиля шума, определенную на упомянутом шаге определения (600) оценки профиля шума, используют на упомянутом шаге обновления для обновления оценки шума.
4. Способ по п.1, отличающийся тем, что справочная таблица, к которой происходит обращение на упомянутом шаге обращения, содержит множество вводов (C1 - CN, F1 - FN), причем каждый ввод из этого множества включает отдельную характеристику фильтра.
5. Способ по п. 4, отличающийся тем, что отдельные характеристики фильтра, относящиеся к множеству элементов справочной таблицы, содержат отдельные характеристики высокочастотного фильтра, причем для каждой характеристики высокочастотного фильтра установлена отдельная частота отсечки (F1c, F2c, F3c, F4c).
6. Способ по п. 4, отличающийся тем, что отдельные характеристики фильтра, относящиеся к множеству элементов справочной таблицы, содержат отдельные характеристики высокочастотного фильтра, причем для каждой характеристики высокочастотного фильтра установлен отдельный наклон частотной характеристики (F1, F2, F3, F4).
7. Способ по п.1, отличающийся тем, что включает дополнительный шаг по приращению значения счетчика, чтобы считать каждый кадр, для которого уровень энергии оценивают на упомянутом шаге оценки.
8. Способ по п.7, отличающийся тем, что упомянутый шаг по отбору характеристик фильтра схемы-фильтра выполняют, когда значение счетчика увеличивается каждый N-й раз, где N - целое число, больше единицы.
9. Устройство (100, 200) для селективного видоизменения кадра цифрового сигнала, образованного множеством последовательных кадров, при этом цифровой сигнал представляет аудиосигнал, поступивший на передатчик, причем аудиосигнал образован чередующимися речевой составляющей, шумовой составляющей, а также речевой составляющей вместе с шумовой составляющей, отличающееся тем, что содержит устройство (210) оценки уровня энергии, подключенное для приема указателей кадра цифрового сигнала, упомянутое устройство оценки уровня энергии предназначено для оценки уровня энергии кадра цифрового сигнала, детектор речевой составляющей (240), связанный с упомянутым устройством оценки уровня энергии, упомянутый детектор речевой составляющей предназначен для определения, содержит ли кадр цифрового сигнала речевую составляющую, устройство оценки шума (230), работающее, когда детектор речевой составляющей (240) определяет, что речевая составляющая не формирует части кадра, при этом упомянутое устройство оценки шума предназначено для обновления оценки шума в зависимости от предыдущей оценки шума и от уровня энергии, оцененного упомянутым устройством оценки, справочную таблицу, содержащую множество вводов, при этом каждый ввод снабжен индексом, указывающим на уровень оценок шума, причем ввод из упомянутой справочной таблицы, к которой обращаются, соответствует оценке шума, полученной упомянутым устройством оценки шума, и фильтр (265), подключенный для приема кадра цифрового сигнала, упомянутый фильтр проявляет характеристики фильтра схемы-фильтра, которые могут отбираться, причем для этого фильтра отбор характеристик фильтра схемы-фильтра определяется по вводу справочной таблицы, к которой было обращение, а ввод соответствует обновленной оценке шума, полученной упомянутым устройством оценки шума.
10. Устройство (100, 200) по п.9, отличающееся тем, что дополнительно содержит устройство (270) оценки профиля шума для определения оценки профиля шума кадра цифрового сигнала, если упомянутый детектор речевой составляющей определил, что этот кадр цифрового сигнала не содержит речевую составляющую.
RU98107313/09A 1995-09-14 1996-09-13 Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума RU2163032C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US52800595A 1995-09-14 1995-09-14
US08/528,005 1995-09-14

Publications (2)

Publication Number Publication Date
RU98107313A RU98107313A (ru) 2000-02-10
RU2163032C2 true RU2163032C2 (ru) 2001-02-10

Family

ID=24103874

Family Applications (1)

Application Number Title Priority Date Filing Date
RU98107313/09A RU2163032C2 (ru) 1995-09-14 1996-09-13 Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума

Country Status (15)

Country Link
EP (1) EP0852052B1 (ru)
JP (1) JPH11514453A (ru)
KR (1) KR100423029B1 (ru)
CN (1) CN1121684C (ru)
AU (1) AU724111B2 (ru)
BR (1) BR9610290A (ru)
CA (1) CA2231107A1 (ru)
DE (1) DE69613380D1 (ru)
EE (1) EE03456B1 (ru)
MX (1) MX9801857A (ru)
NO (1) NO981074L (ru)
PL (1) PL185513B1 (ru)
RU (1) RU2163032C2 (ru)
TR (1) TR199800475T1 (ru)
WO (1) WO1997010586A1 (ru)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2467406C2 (ru) * 2008-04-18 2012-11-20 Долби Лэборетериз Лайсенсинг Корпорейшн Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
RU2469423C2 (ru) * 2007-09-12 2012-12-10 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи с помощью четкости голоса
RU2507678C2 (ru) * 2006-01-27 2014-02-20 Долби Интернэшнл Аб Эффективная фильтрация банком комплексно-модулированных фильтров
RU2589298C1 (ru) * 2014-12-29 2016-07-10 Александр Юрьевич Бредихин Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
RU2666474C2 (ru) * 2014-07-28 2018-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ оценки шума в аудиосигнале, средство оценки шума, аудиокодер, аудиодекодер и система для передачи аудиосигналов
RU2680735C1 (ru) * 2018-10-15 2019-02-26 Акционерное общество "Концерн "Созвездие" Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала

Families Citing this family (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19747885B4 (de) 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
KR20000069831A (ko) * 1997-10-31 2000-11-25 요트.게.아. 롤페즈 구성 신호에 대한 잡음 추가를 통한 엘피씨 원칙에 따라 인코딩된 음성의 오디오 표현을 위한 방법 및 장치
KR20000074236A (ko) * 1999-05-19 2000-12-15 정몽규 오토 오디오 볼륨 제어장치
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP2001318694A (ja) * 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
KR20030010432A (ko) * 2001-07-28 2003-02-05 주식회사 엑스텔테크놀러지 잡음환경에서의 음성인식장치
IL148592A0 (en) 2002-03-10 2002-09-12 Ycd Multimedia Ltd Dynamic normalizing
ATE419709T1 (de) * 2002-07-01 2009-01-15 Koninkl Philips Electronics Nv Von der stationären spektralleistung abhängiges audioverbesserungssystem
KR100978015B1 (ko) * 2002-07-01 2010-08-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 고정 스펙트럼 전력 의존 오디오 강화 시스템
WO2004008801A1 (en) * 2002-07-12 2004-01-22 Widex A/S Hearing aid and a method for enhancing speech intelligibility
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
DE10305369B4 (de) * 2003-02-10 2005-05-19 Siemens Ag Benutzeradaptives Verfahren zur Geräuschmodellierung
EP2254349A3 (en) * 2003-03-03 2014-08-13 Phonak AG Method for manufacturing acoustical devices and for reducing wind disturbances
US7127076B2 (en) 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
WO2006026635A2 (en) 2004-08-30 2006-03-09 Qualcomm Incorporated Adaptive de-jitter buffer for voice over ip
KR100640865B1 (ko) 2004-09-07 2006-11-02 엘지전자 주식회사 음성 품질 향상 방법 및 장치
US8085678B2 (en) 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8082156B2 (en) 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
GB2429139B (en) * 2005-08-10 2010-06-16 Zarlink Semiconductor Inc A low complexity noise reduction method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR101414233B1 (ko) 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
KR100883896B1 (ko) * 2007-01-19 2009-02-17 엘지전자 주식회사 음성명료도 향상장치 및 방법
KR100876794B1 (ko) 2007-04-03 2009-01-09 삼성전자주식회사 이동 단말에서 음성의 명료도 향상 장치 및 방법
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
CN101904098B (zh) * 2007-12-20 2014-10-22 艾利森电话股份有限公司 噪声抑制方法和设备
WO2009082299A1 (en) 2007-12-20 2009-07-02 Telefonaktiebolaget L M Ericsson (Publ) Noise suppression method and apparatus
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
CN101221767B (zh) * 2008-01-23 2012-05-30 晨星半导体股份有限公司 人声语音加强装置与应用于其上的方法
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
DE102009011583A1 (de) 2009-03-06 2010-09-09 Krones Ag Verfahren und Vorrichtung zum Herstellen und Befüllen von dünnwandigen Getränkebehältern
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
CN102202038B (zh) * 2010-03-24 2015-05-06 华为技术有限公司 一种实现语音能量显示的方法、系统、会议服务器和终端
CN102906813A (zh) 2010-05-24 2013-01-30 日本电气株式会社 信号处理方法、信息处理装置和信号处理程序
CN101859569B (zh) * 2010-05-27 2012-08-15 上海朗谷电子科技有限公司 数字音频信号处理降噪的方法
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
CN102128976B (zh) * 2011-01-07 2013-05-15 钜泉光电科技(上海)股份有限公司 电能表的能量脉冲输出方法、装置及电能表
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
GB2495222B (en) * 2011-09-30 2016-10-26 Apple Inc Using context information to facilitate processing of commands in a virtual assistant
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
CN102737646A (zh) * 2012-06-21 2012-10-17 佛山市瀚芯电子科技有限公司 单一麦克风的实时动态语音降噪方法
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
CN104095640A (zh) * 2013-04-03 2014-10-15 达尔生技股份有限公司 血氧饱和度检测方法及装置
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
EP2816557B1 (en) * 2013-06-20 2015-11-04 Harman Becker Automotive Systems GmbH Identifying spurious signals in audio signals
US9697831B2 (en) * 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
DK3374990T3 (da) 2015-11-09 2019-11-04 Nextlink Ipr Ab Fremgangsmåde og system til støjundertrykkelse
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105869650B (zh) * 2015-12-28 2020-03-06 乐融致新电子科技(天津)有限公司 数字音频数据播放方法及装置
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
CN106060717A (zh) * 2016-05-26 2016-10-26 广东睿盟计算机科技有限公司 一种高清晰度动态降噪拾音器
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US9748929B1 (en) * 2016-10-24 2017-08-29 Analog Devices, Inc. Envelope-dependent order-varying filter control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
CN107039044B (zh) * 2017-03-08 2020-04-21 Oppo广东移动通信有限公司 一种语音信号处理方法及移动终端
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10157627B1 (en) * 2017-06-02 2018-12-18 Bose Corporation Dynamic spectral filtering
JP6948609B2 (ja) * 2018-03-30 2021-10-13 パナソニックIpマネジメント株式会社 騒音低減装置
CN109643554B (zh) * 2018-11-28 2023-07-21 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
US11501758B2 (en) 2019-09-27 2022-11-15 Apple Inc. Environment aware voice-assistant devices, and related systems and methods
CN111370033B (zh) * 2020-03-13 2023-09-22 北京字节跳动网络技术有限公司 键盘声处理方法、装置、终端设备及存储介质
WO2021179045A1 (en) * 2020-03-13 2021-09-16 University Of South Australia A data processing method
CN111402916B (zh) * 2020-03-24 2023-08-04 青岛罗博智慧教育技术有限公司 一种语音增强系统、方法及手写板
CN111916106B (zh) * 2020-08-17 2021-06-15 牡丹江医学院 一种提高英语教学中发音质量的方法
CN112927715A (zh) * 2021-02-26 2021-06-08 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及计算机可读存储介质
CN114550740B (zh) * 2022-04-26 2022-07-15 天津市北海通信技术有限公司 噪声下的语音清晰度算法及其列车音频播放方法、系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4461025A (en) * 1982-06-22 1984-07-17 Audiological Engineering Corporation Automatic background noise suppressor
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
DE4012349A1 (de) * 1989-04-19 1990-10-25 Ricoh Kk Einrichtung zum beseitigen von geraeuschen
JP3065739B2 (ja) * 1991-10-14 2000-07-17 三菱電機株式会社 音声区間検出装置
US5412735A (en) * 1992-02-27 1995-05-02 Central Institute For The Deaf Adaptive noise reduction circuit for a sound reproduction system
JPH05259928A (ja) * 1992-03-09 1993-10-08 Oki Electric Ind Co Ltd 適応制御ノイズキャンセラ装置及び適応制御ノイズキャンセル方法
US5251263A (en) * 1992-05-22 1993-10-05 Andrea Electronics Corporation Adaptive noise cancellation and speech enhancement system and apparatus therefor
JPH0695693A (ja) * 1992-09-09 1994-04-08 Fujitsu Ten Ltd 音声認識装置用騒音低減回路
JP3270866B2 (ja) * 1993-03-23 2002-04-02 ソニー株式会社 雑音除去方法および雑音除去装置
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2507678C2 (ru) * 2006-01-27 2014-02-20 Долби Интернэшнл Аб Эффективная фильтрация банком комплексно-модулированных фильтров
RU2469423C2 (ru) * 2007-09-12 2012-12-10 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи с помощью четкости голоса
US8583426B2 (en) 2007-09-12 2013-11-12 Dolby Laboratories Licensing Corporation Speech enhancement with voice clarity
RU2467406C2 (ru) * 2008-04-18 2012-11-20 Долби Лэборетериз Лайсенсинг Корпорейшн Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
US8577676B2 (en) 2008-04-18 2013-11-05 Dolby Laboratories Licensing Corporation Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
RU2666474C2 (ru) * 2014-07-28 2018-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ оценки шума в аудиосигнале, средство оценки шума, аудиокодер, аудиодекодер и система для передачи аудиосигналов
US10249317B2 (en) 2014-07-28 2019-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Estimating noise of an audio signal in a LOG2-domain
US10762912B2 (en) 2014-07-28 2020-09-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Estimating noise in an audio signal in the LOG2-domain
US11335355B2 (en) 2014-07-28 2022-05-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Estimating noise of an audio signal in the log2-domain
RU2589298C1 (ru) * 2014-12-29 2016-07-10 Александр Юрьевич Бредихин Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
RU2680735C1 (ru) * 2018-10-15 2019-02-26 Акционерное общество "Концерн "Созвездие" Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала

Also Published As

Publication number Publication date
CN1121684C (zh) 2003-09-17
NO981074D0 (no) 1998-03-11
JPH11514453A (ja) 1999-12-07
EP0852052B1 (en) 2001-06-13
KR100423029B1 (ko) 2004-07-01
KR19990044659A (ko) 1999-06-25
WO1997010586A1 (en) 1997-03-20
MX9801857A (es) 1998-11-29
AU724111B2 (en) 2000-09-14
PL185513B1 (pl) 2003-05-30
EE03456B1 (et) 2001-06-15
CN1201547A (zh) 1998-12-09
AU7078496A (en) 1997-04-01
BR9610290A (pt) 1999-03-16
CA2231107A1 (en) 1997-03-20
PL325532A1 (en) 1998-08-03
EE9800068A (et) 1998-08-17
EP0852052A1 (en) 1998-07-08
TR199800475T1 (xx) 1998-06-22
DE69613380D1 (de) 2001-07-19
NO981074L (no) 1998-05-13

Similar Documents

Publication Publication Date Title
RU2163032C2 (ru) Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума
EP0645756B1 (en) System for adaptively reducing noise in speech signals
CN1218506C (zh) 采用状态判断来控制数字电话系统中的功能元件的方法和装置
RU2151430C1 (ru) Имитатор шума, управляемый детектированием активности речи
KR100289359B1 (ko) 화자종속시간스케일링기법을이용하는통신시스템
RU2129737C1 (ru) Способ группового кодирования сигналов и устройство для осуществления способа
FI116643B (fi) Kohinan vaimennus
US6081732A (en) Acoustic echo elimination in a digital mobile communications system
JPH1097292A (ja) 音声信号伝送方法および不連続伝送システム
US6122531A (en) Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
KR100250561B1 (ko) 잡음소거기 및 이 잡음소거기를 사용한 통신장치
WO2002056511A1 (en) Suppression of periodic interference in a communications system
WO2004012097A1 (en) Method for fast dynamic estimation of background noise
CN1042185C (zh) 检测信号处理器中噪涌的方法和装置
KR19980018471A (ko) 디지탈 수신기에 잡음을 발생하기 위한 장치 및 방법
JP2002169599A (ja) ノイズ抑制方法及び電子機器
US5602913A (en) Robust double-talk detection
US6496686B1 (en) Mitigation of interference associated to the frequency of the burst in a burst transmitter
JP4533517B2 (ja) 信号処理方法および信号処理装置
JPH10285083A (ja) 音声通信装置
JPH0946268A (ja) ディジタル音声通信装置
JPH09148963A (ja) ノイズキャンセラおよびこのノイズキャンセラを使用した通信装置
JPH11122143A (ja) ノイズキャンセラとこのノイズキャンセラを備えた通信装置
JP2003223194A (ja) 移動無線端末装置および誤り補償回路

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20060914