RU2347282C2 - Система и способ обработки звукового сигнала - Google Patents

Система и способ обработки звукового сигнала Download PDF

Info

Publication number
RU2347282C2
RU2347282C2 RU2006122948/09A RU2006122948A RU2347282C2 RU 2347282 C2 RU2347282 C2 RU 2347282C2 RU 2006122948/09 A RU2006122948/09 A RU 2006122948/09A RU 2006122948 A RU2006122948 A RU 2006122948A RU 2347282 C2 RU2347282 C2 RU 2347282C2
Authority
RU
Russia
Prior art keywords
signal
pass filter
gain
frequency
sound reproduction
Prior art date
Application number
RU2006122948/09A
Other languages
English (en)
Other versions
RU2006122948A (ru
Inventor
Бруно К.Р. ТАУРВЕ (NL)
Бруно К.Р. ТАУРВЕ
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2006122948A publication Critical patent/RU2006122948A/ru
Application granted granted Critical
Publication of RU2347282C2 publication Critical patent/RU2347282C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/005Tone control or bandwidth control in amplifiers of digital signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Selective Calling Equipment (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

Изобретение относится к цифровой обработке аудиосигнала. Система звуковоспроизведения содержит устройство (1) ввода цифрового аудиосигнала, процессор (2, DSP) цифрового аудиосигнала и устройство (3) вывода цифрового аудиосигнала, причем процессор (2, DSP) цифрового аудиосигнала содержит фильтр (21) верхних частот с полосой пропускания (f) между первой и второй частотами, например между 300 Гц и 2 кГц, сжимающий усилитель (22) для сжатия и усиления сигнала до необходимых пределов амплитуды, и ограничитель для ограничения сигнала, превышающего уровень ограничения и предпочтительно фильтр (23) нижних частот для фильтрации сигнала, предоставляемого сжимающим усилителем, и для предоставления выходного сигнала, причем полоса пропускания (f) фильтра нижних частот находится в пределах 2 кГц - Fs/2, где Fs - частота выборки, причем 10 Fs/2 может составлять, например, 4 кГц. Параметры различных элементов, например частота отсечки, порядок полосового фильтра, усиление и т.п., предпочтительно зависят от измеряемого уровня шума. Технический результат - создание системы и способа звуковоспроизведения с улучшенной разборчивостью. 3 н. и 20 з.п. ф-лы, 1 табл., 14 ил.

Description

Изобретение относится к воспроизведению звука, а более конкретно - к цифровой обработке аудиосигнала.
Изобретение относится к системе воспроизведения звука, содержащей устройство ввода цифрового аудиосигнала, процессор цифрового аудиосигнала и устройство вывода цифрового аудиосигнала.
Изобретение относится также к процессору аудиосигнала для обработки поступающего аудиосигнала для получения выходного аудиосигнала. В частности, изобретение относится к схеме процессора цифрового сигнала (DSP) или соответствующей программе.
Изобретение относится также к способу обработки цифрового аудиосигнала.
Звуковоспроизводящая система, такая, например, как громкоговорящая телефонная система, включает в себя выходной преобразователь, часто называемый громкоговорителем, и устройство ввода для аудиосигнала. Громкоговоритель производит волны звукового давления в соответствии с входным аудиосигналом, который представляет требуемую волну звукового давления.
Очень важна разборчивость звука, воспринимаемого слушателем, особенно при шумовом окружении. Простейший способ увеличения разборчивости - увеличение среднего SPL (уровень звукового давления), т.е. увеличение уровня громкости. Однако простое увеличение уровня громкости не всегда приводит к увеличению разборчивости звуков. Кроме того, слишком большой выходной сигнал может привести к перегрузке громкоговорителя и к дальнейшему снижению разборчивости.
Для увеличения разборчивости звуков предлагались различные методики. Например, в патентной заявке US 2002/0015503 предлагается увеличить разборчивость раздельным ограничением коэффициентов усиления для различных частотных диапазонов.
Существующие системы и способы, однако, либо слишком сложны, требуя сложных вычислений и, соответственно, сложной схемы (аппаратный случай), либо, в случае использования программного обеспечения (программный вариант) - требуют сложную программу, либо все они предоставляют ограниченные преимущества.
Несмотря на приведенные ссылки, сохраняется необходимость в создании усовершенствованных систем и способов для повышения разборчивости.
Задача настоящего изобретения заключается именно в предоставлении системы и способа звуковоспроизведения с улучшенной разборчивостью.
С этой целью система звуковоспроизведения согласно изобретению отличается тем, что содержит цифровой сигнальный процессор, содержащий фильтр верхних частот (HP) с полосой пропускания между первой и второй частотами, предпочтительно между 300 Гц и 2 кГц, сжимающий усилитель (22) для сжатия и усиления сигнала, причем, по меньшей мере, усиление осуществляется после HP фильтрации, а также ограничитель, для ограничения HP отфильтрованного, сжатого и усиленного сигнала, превышающего уровень ограничения.
Система по изобретению основана на следующих положениях:
1. Входящий сигнал усиливается для повышения громкости.
2. Повышение уровня входящего сигнала может привести к превышению максимального уровня цифрового сигнала, и в этом случае сигнал в цифровой форме должен многократно ограничиваться, приводя к искажению исходного сигнала.
3. Низкочастотные составляющие сигнала удаляются, и это позволяет оставшиеся составляющие сигнала усиливать в среднем с большим коэффициентом усиления. Это выполняется с помощью НР фильтра, расположенного перед усилителем. Наиболее низкочастотные составляющие в отношении разборчивости относительно мало важны. Низшие частоты дают наибольший вклад в амплитуду сигнала, и их удаление значительно снижает эту амплитуду, увеличивая верхний предел усиления, т.е. предоставляя возможность большего усиления оставшихся составляющих. Особенно значителен вклад низших частот в речевой сигнал, и их ослабление позволяет значительно расширить верхний предел (т.е. усиление без достижения верхнего уровня ограничения).
Просто отсечка низших частот и увеличение выходного сигнала даст увеличение громкости до уровня наиболее приглушенных звуков. Хотя это и приводит к улучшению разборчивости, но не всегда легко воспринимаемой, особенно при больших пределах изменения громкости, т.е. сжатый динамический диапазон оказывается все же значительным. Для дальнейшего повышения разборчивости устройство содержит сжимающий усилитель для усиления и сжатия сигнала. Таким образом, динамический диапазон оказывается сжатым (при одновременном усилении). Ограничитель ограничивает сигнал, превышающий уровень ограничения, причем уровень ограничения находится в переделах сжатого динамического диапазона и тем самым понижается среднее различие громкости. Более приглушенные звуки подвергаются большему усилению, нежели громкие звуки (приводя к сжатию сигнала до пределов сжатого динамического диапазона), что улучшает разборчивость, поскольку наиболее приглушенный звук становится лучше различимым. Это выполняется с помощью сжимающего усилителя. Любой тип связи амплитуды входного сигнала с амплитудой выходного сигнала может быть выбран в виде варианта сжатия, например, с помощью соответствующей таблицы. Наиболее громкие звуки ограничиваются установкой уровня ограничения в пределах сжатого динамического диапазона, дополнительно улучшая разборчивость. Это выполняется с помощью ограничителя. Сигнал ограничивается при некоторой амплитуде (уровень ограничения) в пределах сжатого динамического диапазона, пределы которого, в частности верхний предел, могут быть установлены во время инициализации. Операция сжатия может быть осуществлена, по меньшей мере, отчасти, до или после НР фильтрации, усиление как таковое (т.е. основная часть усиления) выполняется после НР фильтрации, поскольку при этом удаляются компоненты низших частот, позволяя в среднем получить большее усиление оставшихся компонент (т.е. больший верхний предел усиления).
Идею ограничения не следует понимать как жесткое требование (т.е. как будто бы все значения, превышающие заранее определенное значение С, устанавливаются равными С), но как содержащую также и возможность мягкого ограничения, при котором на подынтервале вплоть до верхнего предела сжатого динамического диапазона используется другое, заранее определенное соотношение амплитуд входного/выходного сигналов.
Предпочтительно сжимающий усилитель отрегулирован так, чтобы не усиливать сигнал с интенсивностью ниже порогового значения.
Ниже порогового значения (некоторая минимальная амплитуда) сигнал вероятнее всего обусловлен шумом. Не будучи усиленными, такие сигналы улучшают разборчивость, поскольку шум при этом снижается. Кроме того, различие между молчанием и речью лучше различимо, что также увеличивает разборчивость. Порог может быть установлен во время инициациализации.
Предпочтительно процессор цифрового звукового сигнала содержит фильтр нижних частот для фильтрации сигнала, предоставляемого сжимающим усилителем, и предоставления выходного сигнала, причем полоса пропускания фильтра нижних частот лежит в диапазоне 2 кГц - Fs/2, где Fs - частота выборки.
Операция сжатия, а в частности и операция ограничения, могут привнести возмущающие обертоны, понижающие естественность и разборчивость излучаемого звука. Кроме того, вследствие использования фильтра верхних частот сигнал уже имеет относительно высокое содержание высокочастотных гармоник. Фильтр нижних частот отсекает или, по меньшей мере, снижает содержание обертонов, возникающих в сжимающем усилителе, тем самым делая звук более естественным и увеличивая разборчивость.
Фильтр верхних частот предпочтительно представляет собой фильтр первого или второго порядка, т.е. фильтр с относительно плавным спадом характеристики. Выгодно удалить большую часть низкочастотных компонент входящего сигнала для предоставления больших возможностей по усилению. Вместе с тем фильтр с относительно крутой характеристикой (ступенчатый фильтр - крайний вариант такого фильтра) удаляет настолько много низкочастотных компонент, что это может привести к неестественному звучанию. Предпочтительно устройство содержит средство, разрешающее пользователю изменять порядок фильтра и/или частоту отсечки. Использование фильтра верхних частот 2-го порядка дает хорошую речевую разборчивость и/или громкость, тогда как использование фильтра верхних частот 1-го порядка позволяет сохранить наиболее естественное воспроизведение исходного звука.
Предпочтительно система и/или программа содержат средство для активизации и/или установки частотной зависимости фильтра нижних частот и/или фильтра верхних частот в зависимости от среднего усиления на стадии регулировки усиления. Среднее усиление есть мера среднего уровня сигнала и, соответственно, уровня громкости излучаемого звукового сигнала. Выгодно, чтобы частота отсечки фильтра верхних частот увеличивалась с увеличением среднего уровня громкости излучаемого сигнала, а частота отсечки фильтра нижних частот снижалась с увеличением уровня громкости.
При очень высоких уровнях усиления (как это может быть при использовании устройства в зашумленной среде) регулирующее действие относительно велико, причем это относительно большое регулирующее действие привносит относительно большое искажение сигнала, т.е. большая часть энергии содержится в нежелательных, неестественных обертонах сигнала. Это приводит к резкому звучанию. Резкость звучания иногда, и даже часто, как это осознали изобретатели, приводит к тому, что слушатель держит громкоговоритель, особенно мобильного телефона, на некотором расстоянии от уха. Помимо поддержания громкоговорителя на некотором расстоянии, в нем самом значительно снижается отношение сигнал-шум, поскольку уровень сигнала снижается, а шума - увеличивается, т.е. просто то, что сам звук воспринимается как резкий, фактически означает снижение разборчивости данного сообщения. Для голосового сообщения резкость голоса часто является неотъемлемой частью сообщения, которую собеседник желает донести до слушателя, причем иногда это даже более важно, нежели конкретные слова сообщения. Таким образом, для разборчивости сообщения важно, чтобы не только сами слова были понятны, но чтобы достигалась и передача ясного, "естественного" голоса. При низких уровнях усиления эффект "резкого звучания" намного слабее. Избирательное включение или установка относительно низкой частоты отсечки фильтра нижних частот, при высоких уровнях усиления, понижает "эффект резкости звучания", а при низких уровнях усиления использование фильтра верхних частот менее необходимо и без включения фильтра верхних частот фактически можно получить более естественное звучание. Итак, при высоких уровнях усиления и сильном регулировании относительно большая часть амплитуды сигнала на высоких частотах обусловлена искусственными артефактами из-за этой регулировки, и удаление (полностью или отчасти) высших частот удаляет артефакты, делая звучание более естественным, при относительно низких уровнях усиления и относительно умеренном регулировании значительно большая часть амплитуды сигнала на высоких частотах имеет естественное происхождение и значительно в меньшей степени обусловлена искусственными артефактами, и отказ от использования фильтра нижних частот (или установки относительно высокой частоты отсечки) оказывается предпочтительным. Избирательным включением фильтра верхних частот в зависимости от усиления оказывается возможным получить улучшенное звуковоспроизведение. Вместо включения/выключения фильтра нижних частот (т.е. выбора on/off) можно сделать характеристику фильтра нижних частот зависящей от усиления, например сделать частоту отсечки 2 кГц для большого усиления (большой шум окружающей среды) и Fs/2, или, например, 4 кГц для малого усиления, или для случая отсутствия окружающего шума, или, другими словами, сделать такую характеристику, в которой частота отсечки снижается при увеличении уровня громкости.
В другом варианте устройство может иметь средство ручной установки характеристик фильтра нижних частот, например переключатель, позволяющий пользователю устанавливать частоты отсечки фильтра 2, 3 и 4 кГц в зависимости от разборчивости (плохой) или от персонального предпочтения. Подобные соображения справедливы и для фильтра верхних частот - при низких уровнях усиления необходимость в использовании фильтра верхних частот меньше, чем при высоких уровнях усиления, и при низких уровнях усиления фильтр высших частот может быть отключен или переведен на уровень низкой частоты отсечки, тогда как при высоком уровне усиления (большая громкость) фильтр верхних частот может быть включен или его частота отсечки установлена относительно высокой, или, другими словами, частота отсечки фильтра высших частот повышается при увеличении уровня громкости.
В первом варианте реализации изобретения система содержит фильтр верхних частот с последующим AGC (автоматическая регулировка усиления), с последующим ограничителем/отсекателем и предпочтительно с последующим фильтром нижних частот. Этот вариант реализации предпочтителен в случае первоочередной важности громкости сигнала. Ограничитель сканирует аудиосигнал на предмет максимумов и ослабляет часть звукового сигнала в окрестности максимума, если ослабление необходимо для установления такого предела ограничения, при котором допустимо ограничение очень громких сигналов.
Во втором варианте реализации изобретения система содержит автоматический регулятор громкости, предваряющий или предпочтительно следующий за фильтром верхних частот, обеспечивающий отрегулированный сигнал, и следующий за усилителем и ограничителем, предпочтительно следующий за фильтром нижних частот. Этот вариант реализации предпочтителен, если желательны малые вычислительные нагрузки.
(Жесткое) ограничение представляет собой простую операцию, при которой любой сигнал, превышающий пороговую интенсивность, ослабляется до упомянутой пороговой интенсивности, т.е. задается максимальная интенсивность сигнала. Преимущество такого варианта реализации заключается в том, что используется простое устройство, а недостаток - в том, что сигнал в большей степени искажен, поскольку теряются все особенности сигнала, находящиеся выше порога.
В предпочтительных вариантах реализации содержится измерительное устройство, такое как микрофон, для измерения уровня фоновых шумов. Устройство содержит адаптер для согласования одного или более параметров в зависимости от измеренного уровня фонового шума. Такими параметрами являются, например, частота отсечки и порядок фильтра верхних частот, коэффициент усиления, уровень ограничения. Предпочтительно для одного или более параметров зависимость от измеренного уровня шума нелинейная.
В рамках идеи изобретения "ограничитель", "устройство сжатия", "усилитель", "фильтр", "преобразователь", "компаратор" и т.п. понимаются в широком смысле и могут содержать любые аппаратные составляющие (такие как ограничитель, устройство сжатия, усилитель и т.п.), любые схемы или подсхемы, собранные для выполнения ограничения, сжатия, усиления и т.п. описанных функций, так же как и любые программные составляющие (компьютерную программу или подпрограмму, или набор компьютерных программ, или программный код(-ы), разработанные или программируемые для выполнения ограничения, сжатия, фильтрации и т.п. операций согласно изобретению, так же как и любая комбинация аппаратных и программных составляющих, функционирующих порознь или совместно, без ограничений в связи с приведенными ниже примерными вариантами реализации. Одна программа может объединять несколько функций.
Изобретение реализуется также в любой компьютерной программе, содержащей средство программного кода для осуществления способа согласно изобретению, когда упомянутая программа запускается на компьютере, так же как и в любом компьютерном программном продукте, содержащем средство программного кода, сохраняемом на машиночитаемом носителе для осуществления способа согласно изобретению, когда упомянутая программа запускается на компьютере, так же как и любой программный продукт, содержащий средство в программном коде для использования в телефонной системе согласно изобретению, для осуществления функций, определяемых изобретением.
Эти и другие объекты изобретения рассматриваются более подробно на примере и в связи с соответствующими чертежами, на которых:
Фиг.1 изображает блок-схему системы, включающей в себя громкоговоритель и DSP.
Фиг.2 - схема DSP согласно изобретению.
Фиг.3 - два примера фильтра верхних частот, которые могут быть использованы в изобретении.
Фиг.4 - форма колебания типичного речевого сигнала.
Фиг.5 - форма колебания после фильтрации фильтром верхних частот.
Фиг.6 - спектр колебания, приведенного на Фиг.4 и 5.
Фиг.7 - один из вариантов реализации изобретения.
Фиг.8 - функциональная блок-схема примерного AGC, обозначенного на Фиг.7.
Фиг.9 - другой вариант реализации изобретения.
Фиг.10 - более подробная схема примерного элемента AVL, обозначенного на Фиг.9.
Фиг.11 - характеристика AVL элемента на Фиг.10.
Фиг.12 - пример функциональной зависимости при сжатии.
Фиг.13 - предпочтительный вариант реализации, параметры которого согласованы в зависимости от измеренного уровня шума.
Фиг.14 -зависимость первого, второго и третьего порядка параметра Р от уровня S шума.
Настоящее изобретение описывается ниже более подробно в связи с сопровождающими чертежами, на которых показаны предпочтительные варианты реализации. Излагаемые ниже варианты реализации не следует понимать, как ограничение изобретения, которое может быть реализовано и во многих других вариантах; а представленные варианты реализации в значительной степени служат для более полного и ясного понимания изобретения и для обозначения области его применения специалистам в данной области техники. Подобные цифровые обозначения при этом относятся к подобным рассматриваемым элементам.
На Фиг.1 схематически показана звуковоспроизводящая система. Это может быть, например, сотовый радиотелефон громкой связи в режиме “ hands-free” для использования в автомобиле. В случае такого сотового радиотелефона речевые сигналы, принимаемые издалека, т.е. от удаленного абонента, передаются от сотовой базовой станции (не показана) принимаются приемопередатчиком сотового телефона (не показан) и подаются на вход 1 входящего сигнала от удаленной стороны в виде входного колебания W. В этом примере предполагается, что передача осуществляется вперед и назад между системами, в этом примере телефонными системами, и сигнал принимается в цифровом виде. Если исходные сигналы - аналоговые, то система содержит A-D преобразователь для получения цифрового сигнала приема, который затем подается на вход 1.
На Фиг.1 показано, что колебательный сигнал в цифровой форме подается на вход 1, соединенный с DSP 2 (цифровой процессор звука), который соединяется с цифровым выходом 3, или который его содержит. Выходной цифровой сигнал подается и преобразуется затем в аналоговую форму D-A преобразователем 4 и усиливается усилителем 5 для использования громкоговорителем 6. Звуковая волна давления W1, отображающая речь удаленного абонента, излучается громкоговорителем 6. Соответственно, пользователь радиотелефона воспринимает звуковые колебательные сигналы давления, отображающие речь удаленного абонента.
Однако слушатель слышит не только звук, создаваемый громкоговорителем, но также и другие звуки, делающие трудно различаемым звук громкоговорителя, т.е. получается низкая разборчивость.
Повышение громкости представляется первым и очевидным способом увеличения разборчивости. Однако максимальный выходной уровень громкоговорителя часто ограничен, и простое повышение громкости часто приводит к большему шуму, а не обязательно к увеличению разборчивости сигнала.
Для улучшения разборчивости в устройстве применяется ряд совместных измерений по способу согласно изобретению.
На Фиг.2 очень схематично показан DSP (цифровой процессор звука) для использования в устройстве согласно изобретению. DSP содержит фильтр верхних частот 21 с частотой отсечки между 300 Гц и 2 кГц, предпочтительно между 500 Гц и 1500 Гц, более предпочтительно между 800 Гц и 1200 Гц. Фильтр верхних частот удаляет или снижает содержание частотных компонент ниже частоты отсечки f.
Тем самым устраняется большая часть интенсивности сигнала. Это дает возможность больше усиливать оставшийся сигнал (до появления проблем в связи с цифровым ограничением, т.е. до значения, большего максимального). Усиление выполняется сжимающим усилителем. В рамках идеи изобретения сжимающий усилитель представляет собой усилитель, усиливающий сигнал, но также и регулирующий средний уровень звука, т.е. звуки с меньшей амплитудой усиливаются больше, чем звуки большого уровня, чем уменьшается динамический диапазон. Это может быть выполнено различным образом, например устройством ограничения/отсечки, ограничителем/устройством сжатия, или с помощью AVL (автоматический регулятор напряжения) с последующим усилением и ограничением. Может быть использован ряд различных методик, включая использование табличного метода, для выполнения усиления и сжатия. Динамический диапазон, в частности его верхний предел, может быть установлен производителем или задан пользователем, например, регулятором громкости (ручкой регулировки громкости). Ниже приводятся различные примеры. По сравнению с прямым, линейным усилением сигнала (т.е. для всех уровней звука одинаковый коэффициент усиления) усиление со сжатием обуславливает большую разборчивость звука. Слова различаются легче и, таким образом, улучшается разборчивость звука. Вместе с тем при этом образуется искажение звука, поскольку нелинейное усиление звука привносит обертоны (высокочастотные компоненты на удвоенной, утроенной и т.д. частотах относительно исходной), что приводит к увеличению резкости звука. Этот звук воспринимается слушателем как неприятный и фактически существенно понижается разборчивость голосового сообщения в широком смысле, поскольку резкость произносимых слов часто оказывается важным аспектом голосового сообщения. Этот эффект присутствует даже без эффекта ограничения, которое и само привносит обертоны. Разборчивость в широком смысле имеет отношение не только к словам как таковым, но также и к сообщению, адресованному слушателю. Резкость звука, особенно при высоком среднем усилении, делает всякий звук сердитым, тем самым сильно снижая эмоциональную выразительность, которую желает донести говорящий. Применение фильтра нижних частот, как в предпочтительном варианте реализации на Фиг.2, после усилителя со сжатием снижает воспринимаемую резкость голоса, сохраняя, по меньшей мере, до некоторой степени, изначально эмоциональное содержание произносимых слов, т.е. предоставляя намного более естественный звук. Известно, что в большинстве западных языков тональность слова влияет на эмоциональное воздействие, но не на значение самого слова. Вместе с тем, имеются языки, в которых тональность слова играет более важную роль, обуславливая полностью различающиеся значения одного и того же "слова" в зависимости от тональности его произнесения. В случае использования таких языков (чего нельзя исключить) применение фильтра нижних частот становится еще более полезным. Изобретение особенно полезно при его применении совместно с системами автоматического распознавания речи, или использования в них самих, особенно в случае тех языков, для которых от тональности произнесенного слова зависит его значение. То, что сказано выше в связи с произносимыми словами, т.е. с голосом, одинаково применимо и к случаю использования звуковоспроизводящей системы для воспроизведения музыки. Для восприятия музыки помимо прослушивания нот очень важна резкость звучания. Таким образом, хотя данное изобретение наиболее важно для систем голосовых сообщений, таких как телефонные системы, оно не ограничивается такими системами, а может быть одинаково полезно для систем воспроизведения музыки.
Регулировка уровня или выполнение сжатия может быть выполнено до НР фильтрации входящего сигнала или после такой фильтрации. Усиление фактически выполняется после НР фильтрации. Ограничение выполняется после усиления или одновременно с ним. Если используется фильтр нижних частот, то он располагается после ограничителя.
На Фиг.3 приведены два примера фильтров верхних частот, используемых в системе согласно изобретению.
На левой стороне чертежа показан фильтр 1-го порядка, а на правой - фильтр второго порядка. Показанный фильтр верхних частот имеет частоту f отсечки приблизительно 1 кГц. Фильтры верхних частот первого или второго порядка (имеющие относительно умеренные наклоны в 5 -15 дБ на октаву) являются предпочтительными. Слишком большое устранение низкочастотных компонент приводит к очень неестественному голосовому звучанию (или к неестественно и неправильно звучащей музыке). Поэтому порядок фильтра верхних частот предпочтительно ограничивается значением 2. Это понижает также требуемую вычислительную мощность. Предпочтительно пользователь может изменять порядок фильтра верхних частот от 1-го до 2-го порядка и наоборот, или же система содержит автоматическое переключающее устройство в зависимости от входящего сигнала. Использование 2-го порядка приводит к высокой речевой разборчивости (в ограниченном смысле, т.е. только слова) и/или громкости сигнала, тогда как НР фильтр 1-го порядка лучше сохраняет естественный звук исходного сигнала.
НР фильтр может быть, например, биквадратным, значение частотного отклика которого показано на Фиг.3 и коэффициенты для которого приведены в таблице 1 в соответствии с выражением
Figure 00000001
Таблица 1
Коэффициенты фильтрации НР фильтра, приведенного на Фиг.3
1-го порядка 2-го порядка
b0 0,70710678118655 0,56903559372885
b1 -0,70710678118655 -1,13807118745770
b2 0,00000000000000 0,56903559372885
a1 -0,41421356237310 -0,94280904158206
a2 0,00000000000000 0,33333333333333
Эффект от применения фильтра верхних частот можно видеть из Фиг.4, 5 и 6. На Фиг.4 показана форма колебаний типичного речевого сигнала, на Фиг.5 - форма колебаний после фильтрации фильтром верхних частот (обработано НР фильтром верхних частот первого порядка, частота отсечки 1 кГц).
На Фиг.6 показан спектр сигнала по Фиг.4 и 5, причем энергия сигнала с Фиг.4 изображена верхней кривой, а энергия сигнала после фильтра верхних частот изображена нижней кривой. Из Фиг.6 можно видеть, что энергия сигнала по Фиг.4 главным образом концентрируется на низких частотах (ниже 1 кГц).
Эти частоты дают главный вклад в специфику звучания голоса, а в речевую разборчивость - в меньшей степени. Это свойство составляет один объект изобретения.
Ослаблением низших частот амплитуда сигнала значительно понижается, как это видно из Фиг.6, образуя верхний предел для усиления оставшейся части сигнала, содержащей больше тех частот, которые дают вклад в речевую разборчивость, что также видно из Фиг.6.
Последующее сжатие и усиление речевого сигнала, даже при его ограничении, делает речевую разборчивость лучше, чем без использования НР фильтра, причем главным образом по двум причинам:
сигнал содержит относительно больше частот, дающих вклад в речевую разборчивость;
низкие частоты подвергаются менее жесткому ограничению и дают меньше ухудшающих речевую разборчивость гармоник (вызванных ограничением).
Вместе с тем устранение слишком большого количества низкочастотных компонент может привести к слишком неестественному голосовому звучанию. Поэтому НР фильтр предпочтительно представляет собой фильтр только первого порядка, например это может быть фильтр Баттерворта (первого порядка НР). Это дает преимущество в низкой потребляемой вычислительной мощности.
На Фиг.7 показаны детали системы в соответствии с вариантом реализации изобретения.
Устройство DSP содержит HP фильтр (например, такой, как показан на Фиг.3, в этом примере фильтр Баттерворта 1-го или 2-го порядка с частотой отсечки, например, 1 кГц), с последующим AGC, с последующим ограничителем, с последующим фильтром нижних частот (LP).
В этом примере все аудиопотоки могут быть монофоническими. Частота выборки может быть, например, одной из следующих: 8 кГц, 11,025 кГц, 16 кГц, 22,05 кГц, 32 кГц, 44,1 кГц или 48 кГц.
В этом примере AGC (Автоматический Контроль Усиления) действует по блокам, т.е. коэффициент усиления изменяется только по блокам. В этом случае вычислительная мощность поддерживается на минимуме.
На Фиг.8 показана функциональная блок-схема AGC. Усиление рассчитывается так, что RMS для AGC выходного блока приблизительно равно RMS для AGC входного блока. Поэтому отношение входного и выходного (это есть целевое значение) RMS сравнивается с реальным усилением, и это усиление регулируется до целевого значения. Изменения усиления, должны сглаживаться для избежания слишком сильного искажения сигнала вследствие локальных разрывов колебательного сигнала на краях блоков.
Ограничитель/отсекатель увеличивает уровень громкости при поддержании искажения сигнала в пределах границ, предпочтительно настолько малым, насколько это возможно.
В этом примере ограничитель/отсекатель основан на выборочном усилении по выборкам. В обычной методике сжатия усиление зависит от допустимого верхнего предела сигнала.
Ограничитель/отсекатель может использовать так называемый амплитудный коэффициент для вычисления допустимого усиления. Амплитудный коэффициент фактически представляет собой отношение пикового значения и текущего значения RMS сигналов. В ограничителе/отсекателе сигналы с большим амплитудным коэффициентом, например барабанный бой, отсекаются без сильного слышимого искажения. Вследствие этого усиление может оставаться на высшем уровне, снижая "накачивающий эффект" обычных устройств сжатия.
Усиление в этом примерном варианте реализации рассчитывается следующим образом:
прежде всего, рассчитывается текущее RMS значение (среднеквадратичное значение) входного сигнала. Это RMS значение сглаживается усреднением по недавней "истории" колебательного сигнала. Затем пиковое значение рассчитывается, упреждая ожидаемые амплитудные значения сигнала.
С RMS значением и пиковым (амплитудным) значением рассчитывается амплитудный коэффициент. Так называемый "депиковый" коэффициент используется для указания того, насколько жестко алгоритм способен отсекать острые сигналы (высокие значения соответствуют большей отсечке). Затем усиление рассчитывается и сравнивается с максимально дозволенным усилением, которое может быть установлено пользователем, и выбирается минимальное значение из двух. Хотя это здесь и не показано, но установка максимально дозволенного усиления может быть входным сигналом для фильтра верхних частот, причем частота отсечки (или, в общем случае, одна или несколько характеристик фильтра, отличных от частоты отсечки, а также, например, переключение фильтра от первого порядка ко второму) есть функция от установки максимально допустимого усиления.
Фильтр нижних частот LP фильтрует высокие частоты, как следствие, с более естественным звучанием. Хотя это здесь и не показано, но установка максимально дозволенного усиления может быть входным сигналом для фильтра верхних частот, причем частота отсечки (или, в общем случае, одна или несколько характеристик фильтра, отличных от частоты отсечки, а также, например, переключение фильтра от первого порядка ко второму) есть функция установки максимально дозволенного усиления.
На Фиг.7 и 8 показан вариант реализации изобретения одного типа, а Фиг.9 и 10 - другого типа.
По существу эти варианты реализации содержат 4 предпочтительно 5 элементов или этапов:
1. Блок AVL (Автоматический Регулятор Громкости): AVL - это блок обработки сигнала, поддерживающий громкость входящего сигнала на приблизительно постоянном уровне.
2. Фильтр первого порядка НР (верхних частот): этот фильтр устраняет часть нижних частот, определяя верхний предел усиления.
3. Усилитель: увеличивает SPL (Уровень Звукового Давления) сигнала.
4. Ограничитель, предпочтительно жесткий ограничитель, если предпочитается простое устройство: сигнал отсекается при некоторой амплитуде для надежного линейного функционирования аналогового усилителя (после D/A преобразования). Вместо жесткого ограничителя, который просто отсекает сигнал выше уровня отсечки, может также использоваться мягкий ограничитель, который отсекает сигнал выше уровня отсечки, но также ослабляет сигнал по уровню, близкому к уровню отсечки. Использование мягкого ограничителя до некоторой степени восстанавливает динамические параметры сигнала, увеличивая разборчивость.
5. (Предпочтительно) фильтр первого порядка LP (нижних частот): фильтр восстанавливает или, по меньшей мере, улучшает баланс между средними частотами и высокими частотами, без чего звук неестественный и звучание сигнала резкое; этот фильтр делает обрабатываемый звук более приятным для прослушивания.
В этом примере входной сигнал представляет собой речевой сигнал, но он может быть и любым звуковым сигналом.
На Фиг.10 более подробно показан элемент AVL.
На Фиг.10 показана блок-схема AVL. Деление максимальной выходной амплитуды (обозначенной на Фиг.10 как “Reference-Clipping-Lin”; "Задание уровня ограничения") на абсолютное значение максимальной амплитуды сигнала в пределах всего входного блока дает усиление, которое может быть применено к блоку без какого-либо ограничения (обозначенное как "Мгновенное усиление"). Параметр “GainUpdate”; "Коррекция усиления" составляет обычно 1/1000. Таким образом, сигнал после суммирования увеличивается в каждом блоке на величину, зависящую от "Мгновенного усиления". Таким образом, AVL усиление увеличивается быстрее для более высоких значений "Мгновенного усиления".
Поскольку возможное усиление, применяемое к входному сигналу ("AVL усиление"), должно быть не выше, чем ("Мгновенное усиление"), то минимальное значение обоих принято как ("Мин."). Минимальный блок гарантирует также то, что AVL усиление снижается немедленно, если амплитуда входящего сигнала увеличивается. Для предотвращения слишком большого усиления тихой части входного сигнала сигнал после минимального блока ограничивается (обычно 12 дБ). Следует отметить, что поскольку максимальная выходная амплитуда не обязательно равна линейному уровню в 0 дБ, то AVL усиление может быть меньше 1.
Далее, если амплитуда входного сигнала меньше некоторого значения, например меньше нижнего предела шума сигнала, то усиление не применяется. Это еще одна функциональная возможность в предпочтительных вариантах реализации, которая может быть использована также и в других типах сжимающих усилителей для предотвращения усиления малых входных сигналов, когда и шум не усиливается, что повышает разборчивость звука.
Численный пример:
Скорость выборки 8 кГц
Длина блока 80 выборок
Длина слова 16 бит
Максимальная выходная амплитуда 32768 (0 дБ)
Входной сигнал синусоидальный с амплитудой 32768 (0 дБ), частотой ≥100 Гц (по меньшей мере один синусоидальный период на блок)
Текущее AVL усиление составляет 1 (0 дБ)
Коррекция усиления = 0,001
AVL усиление ("Старое значение") ограничено 12 дБ
Итак, амплитуда входного сигнала понижается на 40 дБ (в 100 раз по линейной шкале). В приведенной ниже таблице показано изменение во времени различных сигналов внутри AVL.
Входной блок Время (мс) Входная амплитуда Мгновенное усиление Сумма Старое значение AVL усиление
-2 -20 32768,00 1 1 1,00
-1 -10 32768,00 1 1,00 1,00 1,00
0 0 327,68 100 1,10 1,10 1,10
1 10 327,68 100 1,20 1,20 1,20
2 20 327,68 100 1,30 1,30 1,30
3 30 327,68 100 1,40 1,40 1,40
4 40 327,68 100 1,51 1,51 1,51
25 250 327,68 100 3,66 3,66 3,66
26 260 327,68 100 3,76 3,76 3,76
27 270 327,68 100 3,87 3,87 3,87
28 280 327,68 100 3,97 3,97 3,97
29 290 327,68 100 4,07 4,00 4,00
30 300 327,68 100 4,10 4,00 4,00
Поведение AVL показано также на Фиг.11.
Левый график показывает ступенчатое изменение амплитуды трех входных сигналов. Правый график показывает, что AVL усиление растет быстрее для больших изменений амплитуды. Это предпочтительный вариант реализации, дополнительно улучшающий разборчивость.
На Фиг.12 показан пример выполнения сжатия. До некоторого значения сигнал остается необработан (умножен на единицу), а выше этого значения амплитуда выходного сигнала меньше амплитуды входного сигнала, т.е. сигнал сжат. Функциональная характеристика, соответствующая применению сжатия только верхних областей, как на Фиг.12, может быть использована для ограничителя, тогда как функциональная характеристика, которая обеспечивает сжатие, применяется по большей области (например, по всему диапазону входного сигнала), может быть использована в сжимающем усилителе.
Изобретение может быть использовано в различных устройствах. В частности, изобретение полезно для мобильных телефонов с функцией громкоговорящей связи. В то же время оно применимо во всех звуковоспроизводящих системах, особенно в тех, которые работают в устройствах с ограниченным источником напряжения и/или малым громкоговорителем. Вот список возможных применений:
телефонные трубки (мобильные телефоны, DECT, и.т.п.);
PDA'S портативные устройства, например портативные DVD плееры;
автомобильное оборудование;
телевизоры; компьютеры;
веб-терминалы;
автоответчики.
Специалистам в данной области техники должно быть ясно, что изобретение не ограничивается частными приведенными примерами. Изобретение состоит во всех своих характерных новых особенностях и во всех своих комбинациях характерных особенностей. Ссылочные позиции, приведенные в формуле изобретения, не ограничивают ее объем защиты. Использование глагола "содержать" и его спряжений не исключает наличия элементов, отличных от тех, что представлены в формуле изобретения. Использование определенных артиклей в тексте перед элементами не исключает наличия множества таких элементов.
Настоящее изобретение представлено в виде примеров отдельных вариантов реализации, которые служат иллюстрацией изобретения и не являются его ограничениями. Изобретение может быть воплощено аппаратным образом, аппаратно-программным образом или программно, или же при соответствующем сочетании этого. Другие варианты реализации охвачены нижеследующей формулой изобретения.
Например, в приведенных примерах все или большинство данных и установок для различных элементов фиксированы. Вместе с тем для предпочтительных вариантов реализации изобретения установки различных элементов адаптируются к измерению окружающего шума. Пример этого приведен на Фиг.13. С помощью измерительного устройства 130 для измерения фонового шума, такого как, например, отдельный микрофон и адаптер 131 (согласующее устройство), могут быть адаптированы установки одного или нескольких различных элементов - AVL (усиление), НР фильтр (частота отсечки), усилитель (коэффициент усиления G), жесткий ограничитель (уровень ограничения), LP фильтр (частота отсечки).
Различные адаптации обозначены как 132-136.
Измерение шума может дать единственные данные о шуме, выражающие общий шум S, или может дать шумовые параметры для различных шумовых диапазонов - Sf1, Sf2, Sf3 и.т.д. Если параметры шума измерены для различных шумовых диапазонов, то средний или общий шум может быть вычислен, например, как Sav = ΣSfi, или взвешен в соответствии со шкалой дБ(А), например, как Sav = ΣwiSfi, где wi - весовые коэффициенты дБ(А) шкалы. Уровень шума измеряется по измерению амплитуды.
Различные адаптации рассматриваются на примерах.
132: Адаптация установок (установочных параметров)AVL:
в устройстве AVL усиление ограничено (см. Фиг.10, предел AVL усиления) и ниже некоторого уровня усиление не применяется (см. Фиг.10, блок, ниже которого обозначено "отказ от усиления", что определяет шумовой порог переключения). В зависимости от измеренного шума S шумовой порог переключения повышается и предел AVL усиления увеличивается.
133: Адаптация НР фильтра:
Частота отсечки адаптируется к измеренному шуму. Чем выше уровень шума, тем выше частота отсечки. Для адаптивных вариантов реализации частота отсечки может преимущественно различаться в более широких пределах, чем для неадаптивных вариантов реализации. Тогда как для неадаптивных вариантов реализации частота отсечки преимущественно изменяется от 300 Гц до 2 кГц, для адаптивных вариантов реализации частота отсечки преимущественно изменяется между 50Гц (в случаях отсутствия существенного шума) вплоть до обычно 2кГц для случаев высокого уровня шума.
В адаптивном варианте обработки частота отсечки фильтра обновляется, таким образом, в соответствии со значением окружающего шума, и изменяется обычно от очень низкого значения, например 50 Гц (отсутствие окружающего шума), до 2 кГц (громкий окружающий шум). Более низкие частоты устраняются при громком шумовом окружении для создания большего верхнего предела последующего усиления. Максимум в 2 кГц рекомендуется для избежания устранения частот, дающих вклад в речевую разборчивость. Коэффициенты фильтрации вычисляются в реальном времени.
Отношение между частотой отсечки и уровнем шума предпочтительно устанавливается как fотс = fo + Δf(s), где fo - нижний предел шума (например, 50, 100 или 300 Гц), а Δf выше линейной (пропорциональной Si, где i больше 1) функции уровня шума.
В более сложных вариантах реализации не только частота отсечки может зависеть от измеренного уровня шума, но также и форма характеристики фильтра, например характеристика фильтра может быть первого или второго порядка.
134: Адаптация коэффициента усиления G.
Коэффициент усиления G увеличивается с увеличением уровня шума. Вместе с тем предпочтительно усиление не увеличивается линейно с уровнем шума, но вместо этого по формуле: GS = Go + cSi, где i больше 1, например 2 или 3, а с - константа, причем с может быть нулевым ниже порогового значения. Простое соотношение имеет, например, вид GS = Go + cS2, т.е. усиление не зависит линейно от шума, но остается на уровне номинального значения или близко к нему, для быстрого увеличения при высоком уровне шумов.
Увеличение усиления имеет положительный эффект, но и отрицательный - тоже. Нелинейным увеличением усиления, как нелинейная функция шума, может быть получен лучший баланс между позитивным и негативным эффектами.
Значение усиления таким образом адаптировано, например, к величине окружающего шума (при адаптивном варианте обработки), изменяясь от 0 дБ до +18 дБ.
135: Адаптация ограничения.
Ограничивающее действие увеличивается при увеличении уровня шума. Предпочтительно это нелинейным образом зависит от шума. Максимальное значение, выше которого сигнал ограничивается, может быть понижено на 12 дБ для высоких уровней шума. Например, в отсутствие шума уровень цифрового ограничения может быть 0 дБ, тогда как при больших уровнях шума ограничение устанавливается в -12 дБ.
136: Адаптация фильтра низких частот.
В отсутствие шума частота отсечки устанавливается на верхний предел, например на Fs/2. При максимальном шуме частота отсечки устанавливается на нижнем пределе, например 2 кГц.
В адаптивном варианте обработки частота отсечки фильтра обновляется в соответствии с уровнем окружающего шума и изменяется, например, от 3,900кГц (отсутствие окружающего шума) до 2 кГц (громкий окружающий шум) для узкополосных речевых приложений (частота выборки 8 кГц). Коэффициенты фильтра рассчитываются в реальном времени.
Предпочтительно функциональное соотношение между измеренным уровнем шума и частотой отсечки есть - fcut-offLP = fOLP - ΔfLP, где ΔfLP - есть нелинейная функция от измеренного уровня шума, например, пропорциональность квадрату уровня шума.
В этих вариантах реализации использованный алгоритм разработан для функционирования адаптивно, управляясь уровнем окружающего (ближнего) шума. Это обеспечивает удобную для пользователя особенность, позволяющую ему использовать его устройство (например, GSM) в различных условиях касательно окружающего шума, без необходимости какого-либо дополнительного взаимодействия для управления уровнем громкости сигнала GSM.
При использовании в адаптивном варианте обработки параметры обрабатываемых блоков адаптируются для входящих выборок в соответствии с окружающим шумом. Алгоритм адаптирует параметры в соответствии с окружающим шумом. Уровень шума может быть измерен отдельным микрофоном или оценен с помощью микрофонного (GSM) устройства (для приложения с единственным микрофоном).
Главная задача изобретения заключается в улучшении речевой разборчивости. Это более важно, нежели естественность и теплота голоса. Если уровень окружающего шума снижается (при работе в варианте адаптивной обработки), то параметры предпочтительно адаптируются очень быстро так, что естественность и теплота входящего сигнала сохраняются.
В адаптивном режиме уровень окружающего шума влияет на различные параметры блока обработки. Шум может изменяться в диапазоне от "нет окружающего шума" до "громкий окружающий шум".
Термин "нет окружающего шума" не означает полную тишину, а означает, например, постоянный шум, такой как шум вентилятора, фоновую музыку и т.п. В типичном окружении фоновый шум обычно составляет около 50 дБ(А). Термин "громкий окружающий шум" относится к шуму проходящего поезда или метро, шум внутри танцевального клуба и т.п. Эти шумы могут быть измерены вплоть до 100 дБ(А).
Шум может быть оценен посредством измерений амплитудно-частотной характеристики окружающего шума и расчета единственной величины, отражающей уровень шума. Один или несколько, предпочтительно больше, более предпочтительно все параметры различных элементов (AVL, HPфильтр, ограничитель, LPфильтр) адаптируются в соответствии с этим единственным оцениваемым параметром посредством интерполяции между его минимальным и максимальным значениями.
Как объяснялось выше, эта интерполяция не обязательно линейная. Тестирование с помощью линейной интерполяции показывает, что для "средних" окружающих шумов алгоритм дает слишком большой эффект.
Использование более высокой, например, интерполяции второго или третьего порядка дает меньший эффект по сравнению с линейной интерполяцией для того же самого окружающего шума. Для громкого окружающего шума достигаемый эффект оказывается на должной высоте.
На Фиг.14 показано адаптивное поведение параметра (например, коэффициента усиления G, частоты отсечки, уровня отсечки). Параметр P изменяется в этом примере между нижним предельным значением Pниж, в этом примере 2, до верхнего предельного значения Pверх, в этом примере 7, как функция от измеренного уровня шума, в этом примере от средней амплитуды S шума. Различные кривые, обозначенные 1, 2 и 3, дают первого (линейная), второго (квадратичная) и третьего порядка зависимость параметра от измеренного уровня шума. Высокий порядок дает более отчетливый адаптивный эффект при высоких уровнях шума.
Вкратце изобретение может быть описано так:
система звуковоспроизведения, содержащая входное устройство (1) ввода цифрового аудиосигнала, процессор (2, DSP) цифрового аудиосигнала и устройство (3) вывода цифрового аудиосигнала, причем процессор (2, DSP) цифрового аудиосигнала содержит фильтр (21) верхних частот (HP) с полосой пропускания (f) между 300 Гц и 2кГц, сжимающий усилитель (22) для сжатия и усиления сигнала в пределах динамического диапазона сигнала и ограничитель для ограничения сигнала, превышающего уровень ограничения, и предпочтительно фильтр нижних частот (23) для фильтрации сигнала после сжимающего усилителя и для предоставления выходного сигнала, причем полоса пропускания (f')фильтра низких частот находится в диапазоне 2 кГц - Fs/2, где Fs - частота выборки, Fs/2 может составлять, например, 4 кГц.
Множество дополнительных вариаций возможны в рамках идеи настоящего изобретения.

Claims (23)

1. Система звуковоспроизведения, содержащая устройство (1) ввода цифрового аудиосигнала, процессор (2, DSP) цифрового аудиосигнала и устройство (3) вывода цифрового аудиосигнала, в которой процессор (2, DSP) цифрового аудиосигнала содержит фильтр (21) верхних частот (HP) с полосой пропускания (f) между первой и второй частотами, сжимающий усилитель (22) для сжатия и усиления сигнала, причем, по меньшей мере, усиление осуществляется после HP фильтрации, и ограничитель для ограничения HP отфильтрованного, сжатого и усиленного сигнала, превышающего уровень ограничения.
2. Система звуковоспроизведения по п.1, в которой полоса пропускания (f) находится между 300 Гц и 2 кГц.
3. Система звуковоспроизведения по п.1, в которой фильтр верхних частот представляет собой фильтр первого или второго порядка.
4. Система звуковоспроизведения по п.1, устройство которой содержит измерительное устройство (130) для измерения фонового шума и согласующее устройство 131 для согласования одного или более параметров (f, порядок) для фильтра верхних частот (HP).
5. Система звуковоспроизведения по п.4, в которой полоса пропускания частот (f) находится между 50 Гц и 2 кГц.
6. Система звуковоспроизведения по п.1, в которой сжимающий усилитель выполнен с возможностью не усиливать сигнал с интенсивностью ниже порогового значения.
7. Система звуковоспроизведения по п.1, устройство которой содержит измерительное устройство (130) для измерения фонового шума и согласующее устройство 131 для согласования одного или более параметров для сжимающего усилителя (22).
8. Система звуковоспроизведения по п.1, в которой процессор цифрового аудиосигнала содержит фильтр (23) нижних частот для фильтрации сигнала, предоставляемого сжимающим усилителем, и для предоставления выходного сигнала, причем полоса (f) пропускания фильтра нижних частот находится в пределах 2 кГц - Fs/2, где Fs - частота выборки.
9. Система звуковоспроизведения по п.8, устройство которой содержит измерительное устройство (130) для измерения фонового шума и согласующее устройство 131 для согласования одного или более параметров (f′′) для фильтра нижних частот.
10. Система звуковоспроизведения по п.9, которая содержит средство для активации и/или установки частотной зависимости фильтра нижних частот в зависимости от усиления в сжимающем усилителе.
11. Система звуковоспроизведения по любому из пп.4, 7 или 9, в которой один или более упомянутых параметров представляют собой нелинейные функции измеренного уровня шума.
12. Система звуковоспроизведения по п.1, которая содержит фильтр верхних частот с последующим блоком AGC (автоматической регулировкой усиления) и с последующим ограничителем/отсекателем.
13. Система звуковоспроизведения по п.1, которая содержит автоматический регулятор громкости после или предпочтительно перед фильтром верхних частот, обеспечивающий регулируемый сигнал для последующего его усиления и ограничения.
14. Способ обработки цифровых звуковых сигналов, в котором компоненты звукового сигнала с частотой ниже частоты отсечки (f) между первой и второй частотами ослабляются, звуковые сигналы усиливаются и сжимаются до пределов ширины полосы частот сигнала и ограничиваются по уровню ограничения в пределах полосы частот сигнала.
15. Способ по п.14, в котором частота отсечки находится между 300 Гц и 2 кГц.
16. Способ по п.14, в котором уровень шума измеряется и частота (f) отсечки определяется в зависимости от измеренного уровня (S) шума.
17. Способ по п.16, в котором частота отсечки определяется нелинейной функцией уровня (S) шума.
18. Способ по п.16, в котором частота отсечки находится между 50 Гц и 2 кГц.
19. Способ по п.14, в котором после сжатия и ограничения частотные компоненты результирующего цифрового сигнала ниже частоты f′ отсечки между 2 и 4 кГц ослабляются.
20. Способ по п.19, в котором уровень шума измеряется и частота (f′′) отсечки определяется в зависимости от измененного уровня (S) шума.
21. Способ по п.20, в котором частота (f′′) отсечки определяется нелинейной функцией уровня (S) шума.
22. Способ по п.14, в котором активация и/или установка частотной зависимости фильтра нижних частот осуществляется в зависимости от усиления на этапе регулировки усиления.
23. Компьютерный программный продукт, содержащий средство программных кодов, сохраняемое на машиночитаемом носителе, для осуществления способа по любому из пп.14-22.
RU2006122948/09A 2003-07-07 2004-07-05 Система и способ обработки звукового сигнала RU2347282C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP03102031.6 2003-07-07
EP03102031 2003-07-07
EP04100148 2004-01-19
EP04100148.8 2004-01-19

Publications (2)

Publication Number Publication Date
RU2006122948A RU2006122948A (ru) 2008-01-10
RU2347282C2 true RU2347282C2 (ru) 2009-02-20

Family

ID=33566327

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006122948/09A RU2347282C2 (ru) 2003-07-07 2004-07-05 Система и способ обработки звукового сигнала

Country Status (7)

Country Link
US (1) US20070136050A1 (ru)
EP (1) EP1680781B1 (ru)
AT (1) ATE356405T1 (ru)
DE (1) DE602004005234T2 (ru)
ES (1) ES2281816T3 (ru)
RU (1) RU2347282C2 (ru)
WO (1) WO2005004114A1 (ru)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8867750B2 (en) 2008-12-15 2014-10-21 Dolby Laboratories Licensing Corporation Surround sound virtualizer and method with dynamic range compression
RU2600527C1 (ru) * 2013-04-05 2016-10-20 Долби Лабораторис Лайсэнзин Корпорейшн Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
RU2676022C1 (ru) * 2016-07-13 2018-12-25 Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" Способ повышения разборчивости речи
RU2685999C1 (ru) * 2015-06-17 2019-04-23 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Управление громкостью для пользовательской интерактивности в системах аудиокодирования
US10904692B2 (en) 2011-07-01 2021-01-26 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0518278B1 (pt) 2004-10-26 2018-04-24 Dolby Laboratories Licensing Corporation Método e aparelho para controlar uma característica de sonoridade particular de um sinal de áudio
JP2007259143A (ja) * 2006-03-23 2007-10-04 Fujitsu Ltd 音声データ処理装置及び方法
JP5179578B2 (ja) * 2007-07-06 2013-04-10 フランス・テレコム ディジタル信号の復号中に後処理ステップによってもたらされるひずみの制限
US20090129363A1 (en) * 2007-11-21 2009-05-21 Lindsey Steven R Automatic Volume Restoration in a Distributed Communication System
GB0725112D0 (en) * 2007-12-21 2008-01-30 Wolfson Microelectronics Plc Adapting cut-off frequency
GB0725111D0 (en) * 2007-12-21 2008-01-30 Wolfson Microelectronics Plc Lower rate emulation
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8645144B2 (en) * 2008-04-24 2014-02-04 Broadcom Corporation Audio signal shaping for playback by audio devices
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8645129B2 (en) 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
EP2211339B1 (en) 2009-01-23 2017-05-31 Oticon A/s Listening system
JP2010244602A (ja) * 2009-04-03 2010-10-28 Sony Corp 信号処理装置及び方法、並びにプログラム
CN101605111B (zh) * 2009-06-25 2012-07-04 华为技术有限公司 一种削波控制的方法和装置
US8324953B1 (en) * 2009-10-21 2012-12-04 Vyycore Ltd. Method and a system for signal processing
KR20110064823A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 휴대용 단말기에서 음량 증가 장치 및 방법
EP2348750B1 (en) * 2010-01-25 2012-09-12 Nxp B.V. Control of a loudspeaker output
ES2392306B1 (es) * 2010-02-03 2013-10-02 Sergio CÓRDOBA SOLANO Gestión psicoacústica del sonido para su optimización en sistemas de audio de instalaciones fijas y eventuales.
EP2355542B1 (en) 2010-02-04 2012-09-12 Nxp B.V. Control of a loudspeaker output
JPWO2011105365A1 (ja) * 2010-02-26 2013-06-20 シャープ株式会社 画像処理装置およびこれを備えた表示装置並びに画像処理方法
DE102010040689A1 (de) * 2010-09-14 2012-03-15 Bayerische Motoren Werke Aktiengesellschaft Audiosystem und Verfahren zum Durchführen eines Audioquellenwechsels
US9498658B2 (en) * 2013-02-01 2016-11-22 3M Innovative Properties Company Respirator mask speech enhancement apparatus and method
US9517366B2 (en) 2013-02-01 2016-12-13 3M Innovative Properties Company Respirator mask speech enhancement apparatus and method
RU2559710C2 (ru) * 2013-02-04 2015-08-10 Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук Способ обработки функции автокорреляции для измерения основного тона речевого сигнала
JP6108392B2 (ja) * 2013-06-24 2017-04-05 株式会社オーディオテクニカ ハンドヘルドマイクロホン
US9260123B2 (en) 2013-08-23 2016-02-16 Electro-Motive Diesel, Inc. System and method for determining locomotive position in a consist
US9270335B2 (en) 2013-08-23 2016-02-23 Electro-Motive Diesel, Inc. Receive attenuation system for trainline communication networks
US9463816B2 (en) 2013-08-23 2016-10-11 Electro-Motive Diesel, Inc. Trainline communication network access point including filter
US9688295B2 (en) 2013-08-23 2017-06-27 Electro-Motive Diesel, Inc. Trainline network access point for parallel communication
US9525953B2 (en) * 2013-10-03 2016-12-20 Russell Louis Storms, Sr. Method and apparatus for transit system annunciators
US9744979B2 (en) 2014-04-11 2017-08-29 Electro-Motive Diesel, Inc. Train communication network
US9560139B2 (en) 2014-04-11 2017-01-31 Electro-Motive Diesel, Inc. Train communication network
CN107277683B (zh) * 2016-04-07 2023-07-04 深圳市三诺数字科技有限公司 一种音频放大系统及方法
US9980028B2 (en) * 2016-06-22 2018-05-22 Plantronics, Inc. Sound exposure limiter
US10614790B2 (en) * 2017-03-30 2020-04-07 Bose Corporation Automatic gain control in an active noise reduction (ANR) signal flow path
US10553195B2 (en) 2017-03-30 2020-02-04 Bose Corporation Dynamic compensation in active noise reduction devices
US10580398B2 (en) 2017-03-30 2020-03-03 Bose Corporation Parallel compensation in active noise reduction devices
US10157627B1 (en) 2017-06-02 2018-12-18 Bose Corporation Dynamic spectral filtering
CN110265042B (zh) * 2019-05-31 2021-07-23 歌尔科技有限公司 声音信号处理方法、装置及设备
CN111885460B (zh) * 2020-07-29 2022-09-13 歌尔科技有限公司 一种无线耳机的通透模式调节装置、方法及无线耳机

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4792977A (en) * 1986-03-12 1988-12-20 Beltone Electronics Corporation Hearing aid circuit
US5363147A (en) * 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
EP0676909A1 (de) * 1994-03-31 1995-10-11 Siemens Audiologische Technik GmbH Programmierbares Hörgerät
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US20020071573A1 (en) * 1997-09-11 2002-06-13 Finn Brian M. DVE system with customized equalization
JP3618208B2 (ja) * 1997-11-12 2005-02-09 パイオニア株式会社 雑音低減装置
US6201875B1 (en) * 1998-03-17 2001-03-13 Sonic Innovations, Inc. Hearing aid fitting system
US6868163B1 (en) * 1998-09-22 2005-03-15 Becs Technology, Inc. Hearing aids based on models of cochlear compression
DK1192838T4 (da) * 1999-06-02 2013-12-16 Siemens Audiologische Technik Høreapparat med retningsmikrofonsystem samt fremgangsmåde til drift af et høreapparat
CN1470147A (zh) * 2000-08-07 2004-01-21 �µ��ǿƼ��ɷ��������޹�˾ 声音信号过滤和压缩的方法与装置
US6594368B2 (en) * 2001-02-21 2003-07-15 Digisonix, Llc DVE system with dynamic range processing

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8867750B2 (en) 2008-12-15 2014-10-21 Dolby Laboratories Licensing Corporation Surround sound virtualizer and method with dynamic range compression
US11962997B2 (en) 2011-07-01 2024-04-16 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
US11412342B2 (en) 2011-07-01 2022-08-09 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
RU2741738C1 (ru) * 2011-07-01 2021-01-28 Долби Лабораторис Лайсэнзин Корпорейшн Система, способ и постоянный машиночитаемый носитель данных для генерирования, кодирования и представления данных адаптивного звукового сигнала
US10904692B2 (en) 2011-07-01 2021-01-26 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
US10679639B2 (en) 2013-04-05 2020-06-09 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
US10373627B2 (en) 2013-04-05 2019-08-06 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
US10217476B2 (en) 2013-04-05 2019-02-26 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
US9947335B2 (en) 2013-04-05 2018-04-17 Dolby Laboratories Licensing Corporation Companding apparatus and method to reduce quantization noise using advanced spectral extension
US11423923B2 (en) 2013-04-05 2022-08-23 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
RU2600527C1 (ru) * 2013-04-05 2016-10-20 Долби Лабораторис Лайсэнзин Корпорейшн Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
US10394520B2 (en) 2015-06-17 2019-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
RU2685999C1 (ru) * 2015-06-17 2019-04-23 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Управление громкостью для пользовательской интерактивности в системах аудиокодирования
US10838687B2 (en) 2015-06-17 2020-11-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US11379178B2 (en) 2015-06-17 2022-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
RU2676022C1 (ru) * 2016-07-13 2018-12-25 Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" Способ повышения разборчивости речи

Also Published As

Publication number Publication date
ATE356405T1 (de) 2007-03-15
US20070136050A1 (en) 2007-06-14
RU2006122948A (ru) 2008-01-10
ES2281816T3 (es) 2007-10-01
DE602004005234T2 (de) 2007-11-08
DE602004005234D1 (de) 2007-04-19
WO2005004114A1 (en) 2005-01-13
EP1680781A1 (en) 2006-07-19
EP1680781B1 (en) 2007-03-07

Similar Documents

Publication Publication Date Title
RU2347282C2 (ru) Система и способ обработки звукового сигнала
EP1709734B1 (en) System for audio signal processing
ES2286017T3 (es) Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil.
US9197181B2 (en) Loudness enhancement system and method
AU2009242464B2 (en) System and method for dynamic sound delivery
US6766176B1 (en) Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
US9196258B2 (en) Spectral shaping for speech intelligibility enhancement
US20060126865A1 (en) Method and apparatus for adaptive sound processing parameters
US8645144B2 (en) Audio signal shaping for playback by audio devices
US7835773B2 (en) Systems and methods for adjustable audio operation in a mobile communication device
JP2004061617A (ja) 受話音声処理装置
JP2010109992A (ja) 移動電話内のスピーカ利得およびマイクロフォン利得を自動的に調整するための方法および装置
JP2008522511A (ja) 適応可能な音声処理パラメータ用の方法及び装置
JPH09311696A (ja) 自動利得調整装置
WO2006055354A2 (en) Adaptive time-based noise suppression
KR20070022206A (ko) 오디오 신호 처리를 위한 시스템
JP2003070097A (ja) デジタル補聴装置
JP2002218045A (ja) 携帯型無線機器の補聴処理装置および携帯型無線機器

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20100706