RU2438197C2 - Обработка звуковых сигналов с использованием анализа слуховой сцены и спектральной асимметрии - Google Patents

Обработка звуковых сигналов с использованием анализа слуховой сцены и спектральной асимметрии Download PDF

Info

Publication number
RU2438197C2
RU2438197C2 RU2010105052/08A RU2010105052A RU2438197C2 RU 2438197 C2 RU2438197 C2 RU 2438197C2 RU 2010105052/08 A RU2010105052/08 A RU 2010105052/08A RU 2010105052 A RU2010105052 A RU 2010105052A RU 2438197 C2 RU2438197 C2 RU 2438197C2
Authority
RU
Russia
Prior art keywords
signal
audio signal
auditory
asymmetry
spectral
Prior art date
Application number
RU2010105052/08A
Other languages
English (en)
Other versions
RU2010105052A (ru
Inventor
Алан Джеффри СИФЕЛЬДТ (US)
Алан Джеффри Сифельдт
Майкл Джон СМИТЕРС (US)
Майкл Джон СМИТЕРС
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39776994&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2438197(C2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2010105052A publication Critical patent/RU2010105052A/ru
Application granted granted Critical
Publication of RU2438197C2 publication Critical patent/RU2438197C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Holo Graphy (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

Изобретение относится к обработке звуковых сигналов, в частности к анализу слуховой сцены и спектральной асимметрии. Техническим результатом является создание способа регулирования громкости слуховых событий в звуковом сигнале, позволяющего различать или обнаруживать звуковые сигналы, воспринимаемые как более тихие, независимо от абсолютного уровня звукового сигнала. Указанный результат достигается тем, что разделяют звуковой сигнал на слуховые события, каждое из которых воспринимают как отдельное и отличное, посредством обнаружения изменений в спектральном составе относительно времени. Разделение включает в себя этап, на котором обнаруживают местоположение и силу границ слуховых событий в звуковом сигнале, получают динамически изменяющуюся меру спектральной асимметрии звукового сигнала. При этом спектральная асимметрия является статистической мерой асимметрии распределения вероятности спектра звукового сигнала. Затем изменяют силу границ слуховых событий в зависимости от упомянутой меры таким образом, что чем меньше асимметричен спектр на местоположении границы слухового события, тем больше уменьшают силу границы слухового события. Сигнальной обработкой сигнала управляют в зависимости от местоположения и измененной на основании асимметрии силы границ слуховых событий. 4 н. и 6 з.п. ф-лы, 5 ил.

Description

Область техники, к которой относится изобретение
Изобретение относится к обработке звуковых сигналов в общем и к анализу слуховой сцены и спектральной асимметрии в частности.
Ссылки на известные аналоги:
Следующие документы включены в данное описание для сведения в полном объеме:
Crockett and Seefeldt, международная заявка PCT/US2007/008313 на изобретение "Controlling Dynamic Gain Parameters of Audio using Auditory Scene Analysis and Specific-Loudness-Based Detection of Auditory Events" (Регулирование динамических параметров усиления звука с использованием анализа по слуховым сценам и обнаружения слуховых событий на основе удельной громкости), авторы Brett Graham Crockett и Alan Jeffrey Seefeldt, дата подачи 30 марта 2007 г., досье DOLl 86 PCT, опубликована 8 ноября 2007 г. как WO 2007/127023;
Seefeldt et al., международная заявка PCT/US 2004/016964, на изобретение "Method, Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal" (Способ, устройство и компьютерная программа для вычисления и коррекции воспринимаемой громкости звукового сигнала), авторы Alan Jeffrey Seefeldt et al., дата подачи 27 мая 2004, досье No.DOLl 19 PCT, опубликована 23 декабря 2004 как WO 2004/111994 A2;
Seefeldt, международная заявка PCT/US2005/038579 на изобретение "Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal" (Вычисление и корректировка воспринимаемой громкости и/или воспринимаемого спектрального баланса звукового сигнала), автор Alan Jeffrey Seefeldt, дата подачи 25 октября 2005 г., дело № DOLl 5202 PCT, опубликована 4 мая 2006 г. как WO 2006/047600;
Crockett, заявка на патент США 10/474,387 на изобретение "High Quality Time-Scaling and Pitch-Scaling of Audio Signals" (Высококачественное масштабирование звуковых сигналов по времени и основному тону), автор Brett Graham Crockett, дата подачи 10 октября 2003 г., дело № DOL07503, опубликована 24 июня 2004 г. как US 2004/0122662 Al;
Crockett et al., заявка на патент США 10/478,398 на изобретение "Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events" (Способ согласования звуковых сигналов по времени с использованием определения характеристик на основании слуховых событий), авторы Brett G. Crockett et al., дата подачи 20 ноября 2003 г., дело № DOL09201, опубликована 29 июля 2004 г. как US 2004/0148159 Al;
Crockett, заявка на патент США 10/478,538 на изобретение "Segmenting Audio Signals Into Auditory Events" (Сегментация звуковых сигналов на слуховые события), автор Brett G. Crockett, дата подачи 20 ноября 2003 г., дело № DOL098, опубликована 26 августа 2004 г. как US 2004/0165730 Al;
Crockett et al., заявка на патент США 10/478,397 на изобретение "Comparing Audio Using Characterizations Based on Auditory Events" (Сравнение звуковых сигналов с использованием определения характеристик на основании слуховых событий), авторы Brett G. Crockett et al., дата подачи 20 ноября 2003 г., дело № DOL092, опубликована 2 сентября 2004 г. как US 2004/0172240 Al;
Smithers, международная заявка PCT/US 05/24630 на изобретение "Method for Combining Audio Signals Using Auditory Scene Analysis" (Способ комбинирования звуковых сигналов с использованием анализа по слуховым сценам), автор Michael John Smithers, дата подачи 13 июля 2005 г., дело № DOL148 PCT, опубликована 9 марта 2006 г. как WO 2006/026161;
Crockett, B. and Smithers, M., "A Method for Characterizing and Identifying Audio Based on Auditory Scene Analysis" (Способ определения характеристик и идентификации звука на основании анализа по слуховым сценам), Audio Engineering Society Convention Paper 6416, 18th Convention, Barcelona, May 28-31, 2005;
Crockett, B., "High Quality Multichannel Time Scaling and Pitch-Shifting using Auditory Scene Analysis" (Высококачественное многоканальное масштабирование по времени и сдвиг основного тона с использованием анализа по слуховым сценам), Audio Engineering Society Convention Paper 5948, New York, October 2003; and
Seefeldt et al., "A New Objective Measure of Perceived Loudness" (Новая объективная мера воспринимаемой громкости), Audio Engineering Society Convention Paper 6236, San Francisco, October 28, 2004.
Уровень техники
Слуховые события и обнаружение слухового события
Деление звуков на единицы или сегменты, воспринимаемые как отдельные и отличные друг от друга, иногда называют "анализом по слуховым событиям" или "анализом по слуховым сценам" (АСС). Эти сегменты иногда называют "слуховыми событиями" или "звуковыми событиями". В работе Albert S. Bregman, "Auditory Scene Analysis - The Perceptual Organization of Sound" (Анализ по слуховым сценам. - Воспринимаемая организация звука) (Massachusetts Institute of Technology, 1991, Fourth printing, 2001, Second MIT Press paperback edition) широко обсуждается анализ по слуховым сценам. Кроме того, в патенте США № 6,002,776 (Bhadkamkar et al., 14 декабря 1999) цитируются публикации, начиная с 1976 г., как "известные работы, относящиеся к разделению звука способом анализа по слуховым сценам." Однако Bhadkamkar et al. не признали возможность практического использования анализа по слуховым сценам и пришли к заключению, что "способы, включающие в себя анализ по слуховым сценам, хотя и представляют интерес с научной точки зрения как модели обработки слухового восприятия звука человеком, еще до сих пор нуждаются в слишком большой вычислительной обработке и специализации, чтобы их можно было рассматривать как практические способы разделения звука до тех пор, пока не будет достигнут значительный прогресс."
Crockett and Crocket et al. идентифицировали слуховые события в различных патентных публикациях и работах. В этих документах описано разделение звукового сигнала на слуховые события (каждое из которых, как правило, воспринимается как отдельное и отличное от других) путем обнаружения изменений спектрального состава (амплитуды как функции частоты) относительно времени. Это можно реализовать, например, путем вычисления спектрального состава последовательных временных блоков звукового сигнала, сравнения спектрального состава в последовательных временных блоках и идентификации границы слухового события как границы между блоками, на которой разность спектрального состава превышает некоторый порог. Альтернативно, вместо изменений спектрального состава относительно времени или дополнительно к ним можно вычислять изменения амплитуды относительно времени.
Часто во временной сигнал регулирования вводятся маркеры границ слуховых событий, диапазон которых, обычно между нулем и единицей, показывает силу границы события. Кроме того, этот сигнал регулирования часто фильтруется, чтобы оставить силу границы события, а интервалы времени между границами событий вычисляются как затухающие значения предыдущей границы события. Затем эта отфильтрованная сила слухового события используется в других способах обработки звука, включая автоматическую регулировку усиления и регулировку динамического диапазона.
Динамическая обработка звукового сигнала
Методики автоматической регулировки усиления (АРУ) и регулировки динамического диапазона (РДД) хорошо известны и применяются во многих трактах прохождения звукового сигнала. В абстрактном смысле обе методики измеряют уровень звукового сигнала, а затем изменяют усиление сигнала на величину, зависящую от измеренного уровня. В линейной динамической системе обработки с отношением 1:1 входной звуковой сигнал не обрабатывается и выходной звуковой сигнал идеально соответствует входному звуковому сигналу. Кроме того, представим систему динамической обработки звукового сигнала, которая автоматически измеряет входной сигнал и регулирует выходной сигнал в соответствии с этим измерением. Если уровень входного сигнала повышается на 6 dB, а уровень обработанного выходного сигнала всего на 3 dB, то выходной сигнал сжимается в отношении 2:1 к входному сигналу.
В работе Crockett and Seefeldt анализ по слуховым сценам повышает эффективность способов АРУ и РДД за счет минимизации изменения усиления между границами событий и ограничения большей части изменения усиления областью вблизи границы события. Это реализуется путем изменения характера выдаваемого звука с динамической обработкой. При этом слуховые события звучат целостно и естественно.
Примером могут служить ноты, играемые на пианино. При обычных способах АРУ или РДД усиление, применяемое к звуковому сигналу, нарастает во время конечной части каждой ноты, вызывая неестественное нарастание каждой ноты. При использовании анализа по слуховым сценам усиление АРУ или РДД остается постоянным внутри каждой ноты и изменяется только у начала каждой ноты, где обнаружена граница слухового события. Результирующий звуковой сигнал со скорректированным усилением звучит естественно, так как конец каждой ноты затухает.
В известных реализациях анализа по слуховым сценам (в упомянутых выше источниках информации) уровень преднамеренно остается неизменным. Это означает, что в них определяются границы слуховых событий независимо от абсолютного уровня сигнала. Хотя неизменность уровня полезна во многих применениях, для некоторых случаев анализа по слуховым сценам целесообразно предусмотреть некоторую зависимость от уровня.
Одним таким случаем является способ, описанный в работе Crockett и Seefeldt. В нем регулировка АРУ и РДД с помощью АСС предотвращает большие изменения усиления между границами событий. Однако более долговременные изменения усиления могут быть все же нежелательными на некоторых видах звуковых сигналов. Когда звуковой сигнал идет от более громкой к более тихой части, усиление АРУ или РДД, изменение которого ограничено только областью вблизи границ, может позволить уровню обработанного звукового сигнала нежелательно и неестественно возрасти во время тихой части. Такая ситуация часто встречается в фильмах, где случайный диалог чередуется с тихими фоновыми звуками. Поскольку тихий фоновый звуковой сигнал также содержит слуховые события, усиление АРУ или РДД изменяется вблизи границ этих событий и весь уровень звукового сигнала возрастает.
Простое присвоение весовых коэффициентов важности слуховых событий мерой уровня звукового сигнала, мощности или громкости нежелательно. Во многих ситуациях соотношение между мерой сигнала и абсолютным уровнем воспроизведения неизвестно. В идеальном случае было бы полезно иметь меру, позволяющую различать или обнаруживать звуковые сигналы, воспринимаемые как более тихие, независимо от абсолютного уровня звукового сигнала.
В данном контексте "воспринимаемые как более тихие" означает более тихий не по объективной мере громкости (как в работе Seefeldt, et al. и Seefeldt), а более тихий на основании ожидаемой громкости содержания. Например, опыт человека показывает, что шепот является тихим звуком. Если система динамической обработки измеряет его как тихий и затем увеличивает усиление АРУ для достижения некоторой номинальной выходной громкости или уровня, то результирующий шепот со скорректированным усилением будет громче, чем ожидается на основании опыта.
Сущность изобретения
Предложены способы и устройство для сигнальной обработки звукового сигнала. В одном варианте способ включает в себя разделение звукового сигнала на слуховые события, причем каждое из которых воспринимают как отдельное и отличное, посредством обнаружения изменений в спектральном составе относительно времени, причем упомянутое разделение включает в себя обнаружение местоположения и силы границ слуховых событий в звуковом сигнале, получение динамически изменяющейся меры спектральной асимметрии звукового сигнала, причем спектральная асимметрия является статистической мерой асимметрии распределения вероятности спектра звукового сигнала, изменение силы границ слуховых событий в зависимости от упомянутой меры таким образом, что чем меньше асимметричен спектр на местоположении границы слухового события, тем больше уменьшают силу границы слухового события, и управление сигнальной обработкой сигнала в зависимости от местоположения и измененной на основании асимметрии силы границ слуховых событий. Другие варианты изобретения предусматривают следующее: разделение включает в себя анализ спектра звукового сигнала; получение включает в себя вычисление асимметрии из спектрального представления звукового сигнала; вычисление включает в себя вычисление сигнала возбуждения, аппроксимирующего распределение энергии вдоль базилярной мембраны внутреннего уха; разделение включает в себя преобразование звукового сигнала в область воспринимаемой громкости, причем упомянутое преобразование включает в себя вычисление сигнала возбуждения, аппроксимирующего распределение энергии вдоль базилярной мембраны внутреннего уха; получение включает в себя вычисление асимметрии из сигнала возбуждения; и мера спектральной асимметрии является сглаженной мерой.
В других вариантах осуществления изобретения предложено машиночитаемое запоминающее устройство, содержащее компьютерную программу для выполнения любого из упомянутых способов.
В следующих вариантах осуществления изобретения предложена вычислительная система для управления сигнальной обработкой звукового сигнала, содержащая центральное процессорное устройство (ЦПУ), упомянутое запоминающее устройство и шину, соединяющую ЦПУ и запоминающее устройство с возможностью обмена данными.
В еще одном варианте осуществления изобретения предложено устройство для управления сигнальной обработкой звукового сигнала, содержащее средство, выполненное с возможностью осуществления любого из упомянутых способов.
Различные существенные признаки настоящего изобретения и его предпочтительные варианты станут более понятными из следующего описания и прилагаемых чертежей, на которых одинаковые элементы обозначены одинаковыми ссылочными номерами.
Описание чертежей
фиг.1 иллюстрирует устройство для осуществления двух способов анализа по слуховым сценам и регулировки параметров динамического усиления в соответствии с Crockett и Seefeldt.
Фиг.2 иллюстрирует процессор звуковых сигналов для идентификации слуховых событий и вычисления асимметрии для модификации слуховых событий, которые, в свою очередь, изменяют параметры динамической обработки, в соответствии с вариантом настоящего изобретения.
Фиг.3 изображает ряд графиков, иллюстрирующих использование слуховых событий для регулировки времени выдачи звука в цифровой реализации регулятора динамического диапазона (РДД), в соответствии с вариантом настоящего изобретения.
Фиг.4 изображает идеализированный отклик характеристик линейного фильтра, пригодного в качестве пропускающего фильтра, в соответствии с вариантом настоящего изобретения.
Фиг.5 изображает ряд идеализированных откликов характеристик звукового фильтра, которые аппроксимируют критическую полосатость на шкале ERB.
Описание предпочтительного варианта осуществления изобретения
На фиг.1 изображено устройство 1 для анализа по слуховым сценам и регулировки параметров динамического усиления по способу Crockett и Seefeldt. Устройство содержит модуль 10 идентификации слуховых событий, необязательный модуль 11 идентификации характеристик слуховых событий и модуль 12 изменения динамических параметров. Модуль 10 идентификации слуховых событий принимает звуковой сигнал в качестве входного и формирует входной сигнал для модуля 12 изменения динамических параметров (и входной сигнал для модуля 11 идентификации характеристик слуховых событий, если он имеется). Модуль 12 изменения динамических параметров принимает выходной сигнал модуля 10 идентификации слуховых событий (и модуля 11 идентификации характеристик слуховых событий, если он имеется) и формирует выходной сигнал.
Модуль 10 идентификации слуховых событий анализирует спектр и по результатам идентифицирует местоположение воспринимаемых слуховых событий, которые должны регулировать параметры динамического усиления. Альтернативно, модуль 10 идентификации слуховых событий преобразует звуковой сигнал в область воспринимаемой громкости (которая может обеспечить более психоакустически релевантную информацию, чем первый способ) и в этой области воспринимаемой громкости идентифицирует местоположение слуховых событий, которые должны регулировать параметры динамического усиления. (В этой альтернативе для обработки звукового сигнала известны абсолютные уровни воспроизведения звука).
Модуль 12 изменения динамических параметров изменяет динамические параметры на основании выходного сигнала модуля 10 идентификации слуховых событий (и модуля 11 идентификации характеристик слуховых событий, если он имеется).
В обеих альтернативах цифровой звуковой сигнал x[n] разбит на блоки, и для каждого блока t D[t] представляет спектральную разность между текущим блоком и предыдущим блоком.
Для первой альтернативы D[t] представляет сумму, на всех спектральных коэффициентах, величины разности между нормированными логарифмическими спектральными коэффициентами (в дБ) для текущего блока t и для предыдущего блока t-1. В этой альтернативе D[t] пропорциональна абсолютным разностям спектров (в дБ). Для второй альтернативы D[t] является суммой, на всех коэффициентах удельной громкости, величины разности между нормированными коэффициентами удельной громкости для текущего блока t и предыдущего блока t-1. В этой альтернативе D[t] пропорциональна абсолютным разностям удельной громкости (в сонах).
В обеих альтернативах, если D[t] превосходит порог Dmin, событие считается случившимся. Это событие может иметь силу в интервале между нулем и единицей, на основании отношения D[t] минус Dmin к разности между Dmax and Dmin. Силу A[t] можно вычислить как
Figure 00000001
Максимальный и минимальный пределы различны для каждой альтернативы из-за различия их единиц. Однако результат обеих альтернатив представляет собой силу события в интервале между 0 и 1. Существуют и другие альтернативы вычисления силы события, но альтернатива, представленная Уравнением (1), хорошо зарекомендовала себя в ряде областей, включая регулирование динамической обработкой. Присвоение силы (пропорциональной величине спектрального изменения, связанного с данным событием) звуковому событию позволяет лучше контролировать динамическую обработку, чем с помощью бинарного решения события. Оно допускает более значительные изменения усиления во время более сильных событий, и сигнал в Уравнении (1) позволяет осуществлять такой переменный контроль.
Сигнал A[t] является импульсным сигналом, импульс которого возникает на местоположении границы события. Для целей регулирования временем выдачи звука можно дополнительно сгладить сигнал A[t], чтобы он плавно затухал до нуля после обнаружения границы события. Сглаженный сигнал регулирования событием
Figure 00000002
можно вычислить из A[t]:
Figure 00000003
Здесь αevent регулирует время спада сигнала регулирования событием.
На фиг.3 представлена последовательность графиков, иллюстрирующая рабочие характеристики и технический результат согласно одному варианту изобретения. График "b)" на фиг.3 показывает сигнал регулирования событием
Figure 00000004
для соответствующего звукового сигнала "a)" на фиг.3, в котором время полуспада в схеме сглаживания установлено на 250 мс. Звуковой сигнал содержит три пачки импульсов диалога, перемежающихся тихими фоновыми звуками потрескивания костра. Сигнал регулирования событием показывает множество слуховых событий как в диалоге, так и в фоновых звуках.
На фиг.3 график "c)" показывает сигнал усиления РДД, где используется сигнал регулирования событием
Figure 00000004
для изменения постоянной времени выдачи для сглаживания усиления РДД. Как описано в работе Crocket и Seefeldt, когда сигнал регулирования равен единице, коэффициент сглаживания выдачи не затрагивается, и сглаженное усиление изменяется в зависимости от значения постоянной времени. Когда сигнал регулирования равен нулю, сглаженному усилению не дают изменяться. Когда сигнал регулирования находится в интервале между нулем и единицей, сглаженному усилению дают возможность изменяться, но с меньшей скоростью пропорционально сигналу регулирования.
На графике "c" на фиг.3 усиление РДД возрастает во время тихих фоновых звуков из-за количества событий, обнаруженных в фоне. Результирующий звуковой сигнал, измененный РДД на графике "d)" фиг.3, имеет слуховое нежелательное нарастание фонового шума между пачками диалога.
Для уменьшения изменения усиления во время тихих фоновых звуков в одном варианте изобретения изменяют или присваивают весовые коэффициенты силе A[t] звука с использованием меры асимметрии спектра звукового сигнала. В одном варианте изобретения вычисляется спектральная асимметрия возбуждения звукового сигнала.
Под асимметрией понимается статистическая мера асимметрии распределения вероятности. Распределение, симметричное относительно среднего, имеет нулевую асимметрию. Распределение, основная часть или масса которого сконцентрирована над средним и имеется длинный хвост ниже среднего, имеет отрицательную асимметрию. Распределение, сконцентрированное под средним и имеющее длинный хвост выше среднего, имеет положительную асимметрию. Спектр величины или мощности типичного звукового сигнала имеет положительную асимметрию. То есть масса энергии спектра сконцентрирована ниже в спектре, и спектр имеет длинный хвост по направлению к верхней части спектра.
На фиг.2 показан процессор 2 звуковых сигналов, выполненный в соответствии с настоящим изобретением. Процессор 2 звуковых сигналов содержит модуль 12 изменения динамических параметров и необязательный модуль 11 идентификации характеристик слуховых событий как на фиг.1, а также модуль 20 идентификации слуховых событий и вычислитель 21 асимметрии. Вычислитель 21 асимметрии и модуль 20 идентификации слуховых событий принимают звуковой сигнал 13, и вычислитель 21 асимметрии формирует входной сигнал для модуля 20 идентификации слуховых событий. Модуль 20 идентификации слуховых событий, модуль 11 идентификации характеристик слуховых событий и модуль 12 изменения динамических параметров могут быть соединены так же, как их аналоги на фиг.1.
На фиг.2 вычислитель 21 асимметрии вычисляет асимметрию из спектрального представления звукового сигнала 13, и модуль 20 идентификации слуховых событий производит вычисление для анализа по слуховым сценам по тому же самому спектральному представлению. Звуковой сигнал 13 можно сгруппировать в 50 процентах перекрывающихся блоков M выборок, и можно вычислить дискретное преобразование Фурье следующим образом:
Figure 00000005
где M=2*N выборок и x[n,t] обозначает блок выборок.
Предполагается, что размер блока для этого преобразования такой же, как размер блока для вычисления сигнала слухового события. Однако это не обязательно. Если существуют различные скорости блоков, то сигналы на одной скорости блоков можно интерполировать или преобразовать по скорости на ту же самую шкалу времени, что и сигналы на другой скорости блоков.
Сигнал возбуждения E[b,t], аппроксимирующий распределение энергии вдоль базилярной мембраны внутреннего уха на критической полосе b во время блока t времени, вычисляется как:
Figure 00000006
где T[k] представляет частотный отклик фильтра, моделирующего передачу звука через наружное и среднее ухо, и Cb[k] представляет частотный отклик базилярной мембраны на местоположении, соответствующем критической полосе b.
На фиг.4 показан частотный отклик подходящего фильтра пропускания T[k]. На фиг.5 показан подходящий набор откликов фильтра критической полосы, соответствующий Cb[k], в котором 40 полос равномерно разнесены по шкале ERB (Moore and Glasberg Equivalent Rectangular Bandwidth, эквивалентная прямоугольная ширина полосы), для примерной частоты 48 кГц и размера преобразования M=2048. Округленная экспоненциальная функция описывает каждую форму фильтра, и полосы разделены на 1 ERB.
Если границы слухового события вычисляются из спектра удельной громкости по Crocket и Seefeldt, то сигнал возбуждения E[b,t] уже существует как часть вычисления удельной громкости.
И наконец, вычисляется спектральная асимметрия из сигнала возбуждения E[b,t] как:
Figure 00000007
,
где µ - среднее арифметическое возбуждения:
и σ - изменчивость сигнала возбуждения:
Figure 00000009
Сигнал асимметрии SK[t] Уравнения (5) значительно флуктуирует и требует сглаживания, чтобы избежать артефактов при изменении сигнала регулирования событием и последующих параметров динамической обработки. В одном варианте используется однополюсная схема сглаживания с постоянной затухания α, имеющей время полуспада приблизительно 6,5 мс:
SK'[t]=αSKSK'[t-1]+(1-αSK)SK[t] (8)
Может быть полезным ограничить асимметрию максимумом и минимумом, SKmax and SKmin, соответственно. Значительную асимметрию SK"[t] можно вычислить как:
Figure 00000010
Низкие значения (близкие к 0,0) сигнала асимметрии SK"[t] обычно соответствуют характеристически более тихим сигналам, а высокие значения асимметрии (близкие к 1,0) обычно соответствуют более характеристически громким сигналам. На фиг.3 график "e)" изображает сигнал асимметрии, который соответствует звуковому сигналу на графике "a)" фиг.3. Эта асимметрия высокая для более громких пачек диалога и низкая для фоновых звуков.
Сигнал асимметрии SK"[t] поступает в модуль 20 идентификации слуховых событий на фиг.2, который присваивает весовой коэффициент мере спектральной разности D[t] как:
DSK[t]=SK"[t]D[t] (8)
Сигнал силы A[t], измененный по асимметрии, вычисляется так же, как A[t] в Уравнении (1):
Figure 00000011
Сигнал силы A[t], измененный по асимметрии, сглаживается так же, как A[t], в Уравнении (2):
Figure 00000012
На фиг.3, график "f)" показывает сигнал регулирования событием
Figure 00000013
, измененный по асимметрии, для соответствующего звукового сигнала графика "a)" фиг.3. Меньшее количество слуховых событий происходит во время фоновых звуков, тогда как события, соответствующие более громкому диалогу, остаются.
На фиг.3 график "g)" изображает сигнал РДД, контролируемый событиями с изменением по асимметрии. При меньшем количестве событий в звуках фона усиление РДД остается относительно постоянным и перемещается только для более громких секций диалога. График "h)" на фиг.3 показывает результирующий звуковой сигнал, измененный посредством РДД.
Измененный посредством РДД звуковой сигнал вообще не имеет нежелательных нарастаний уровня во время фоновых звуков.
Сигнал асимметрии SK"[t] иногда понижается для сигналов, воспринимаемых как более громкие. Для этих громких сигналов значение меры спектральной разности D[t] достаточно велико, чтобы даже после присвоения весовых коэффициентов сигналом асимметрии SK"[t] в Уравнении 8 мера с присвоенным весовым коэффициентом спектральной разности D[t] была все же достаточно большой, чтобы указывать границу слухового события. Сигнал регулирования событием
Figure 00000014
не подвергается никакому отрицательному воздействию.

Claims (10)

1. Способ управления сигнальной обработкой звукового сигнала, содержащий этапы, на которых
разделяют звуковой сигнал на слуховые события, причем каждое из которых воспринимают как отдельное и отличное, посредством обнаружения изменений в спектральном составе относительно времени, причем упомянутое разделение включает в себя этап, на котором обнаруживают местоположение и силу границ слуховых событий в звуковом сигнале,
получают динамически изменяющуюся меру спектральной асимметрии звукового сигнала, причем спектральная асимметрия является статистической мерой асимметрии распределения вероятности спектра звукового сигнала,
изменяют силу границ слуховых событий в зависимости от упомянутой меры таким образом, что чем меньше асимметричен спектр на местоположении границы слухового события, тем больше уменьшают силу границы слухового события, и
управляют сигнальной обработкой сигнала в зависимости от местоположения и измененной на основании асимметрии силы границ слуховых событий.
2. Способ по п.1, в котором этап разделения звукового сигнала на слуховые события включает в себя этап, на котором анализируют спектр звукового сигнала.
3. Способ по п.2, в котором этап получения динамически изменяющейся меры спектральной асимметрии звукового сигнала включает в себя этап, на котором вычисляют асимметрию из спектрального представления звукового сигнала.
4. Способ по п.3, в котором этап вычисления асимметрии включает в себя этап, на котором вычисляют сигнал возбуждения, аппроксимирующий распределение энергии вдоль базилярной мембраны внутреннего уха.
5. Способ по п.1, в котором этап разделения звукового сигнала на слуховые события включает в себя этап, на котором преобразуют звуковой сигнал в область воспринимаемой громкости, причем упомянутое преобразование включает в себя этап, на котором вычисляют сигнал возбуждения, аппроксимирующий распределение энергии вдоль базилярной мембраны внутреннего уха.
6. Способ по п.5, в котором этап получения динамически изменяющейся меры спектральной асимметрии звукового сигнала включает в себя этап, на котором вычисляют асимметрию из сигнала возбуждения.
7. Способ по любому из пп.1-6, в котором упомянутая мера спектральной асимметрии является сглаженной мерой.
8. Машиночитаемое запоминающее устройство, содержащее программу для вычислительной машины для выполнения способа по любому из пп.1-7.
9. Вычислительная система для управления сигнальной обработкой звукового сигнала, содержащая
центральное процессорное устройство (ЦПУ),
запоминающее устройство по п.8 и
шину, соединяющую с возможностью обмена данными ЦПУ и запоминающее устройство.
10. Устройство для управления сигнальной обработкой звукового сигнала, содержащее средство, выполненное с возможностью выполнения способа по любому из пп.1-7.
RU2010105052/08A 2007-07-13 2008-07-11 Обработка звуковых сигналов с использованием анализа слуховой сцены и спектральной асимметрии RU2438197C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US95946307P 2007-07-13 2007-07-13
US60/959,463 2007-07-13

Publications (2)

Publication Number Publication Date
RU2010105052A RU2010105052A (ru) 2011-08-20
RU2438197C2 true RU2438197C2 (ru) 2011-12-27

Family

ID=39776994

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010105052/08A RU2438197C2 (ru) 2007-07-13 2008-07-11 Обработка звуковых сигналов с использованием анализа слуховой сцены и спектральной асимметрии

Country Status (10)

Country Link
US (1) US8396574B2 (ru)
EP (1) EP2168122B1 (ru)
JP (1) JP5192544B2 (ru)
CN (1) CN101790758B (ru)
AT (1) ATE535906T1 (ru)
BR (1) BRPI0813723B1 (ru)
ES (1) ES2377719T3 (ru)
RU (1) RU2438197C2 (ru)
TW (1) TWI464735B (ru)
WO (1) WO2009011827A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2600527C1 (ru) * 2013-04-05 2016-10-20 Долби Лабораторис Лайсэнзин Корпорейшн Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2232700B1 (en) 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8510361B2 (en) * 2010-05-28 2013-08-13 George Massenburg Variable exponent averaging detector and dynamic range controller
KR102185941B1 (ko) 2011-07-01 2020-12-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법
US9633667B2 (en) 2012-04-05 2017-04-25 Nokia Technologies Oy Adaptive audio signal filtering
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP2898510B1 (en) * 2012-09-19 2016-07-13 Dolby Laboratories Licensing Corporation Method, system and computer program for adaptive control of gain applied to an audio signal
US9979829B2 (en) 2013-03-15 2018-05-22 Dolby Laboratories Licensing Corporation Normalization of soundfield orientations based on auditory scene analysis
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104079247B (zh) 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
US9876913B2 (en) 2014-02-28 2018-01-23 Dolby Laboratories Licensing Corporation Perceptual continuity using change blindness in conferencing
US10306392B2 (en) 2015-11-03 2019-05-28 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
US9372881B1 (en) 2015-12-29 2016-06-21 International Business Machines Corporation System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset
WO2017147325A1 (en) 2016-02-25 2017-08-31 Dolby Laboratories Licensing Corporation Multitalker optimised beamforming system and method
US11894006B2 (en) 2018-07-25 2024-02-06 Dolby Laboratories Licensing Corporation Compressor target curve to avoid boosting noise
CN113015059B (zh) * 2021-02-23 2022-10-18 歌尔科技有限公司 音频优化方法、装置、设备及可读存储介质

Family Cites Families (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4624009A (en) 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4594561A (en) * 1984-10-26 1986-06-10 Rg Dynamics, Inc. Audio amplifier with resistive damping for minimizing time displacement distortion
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (ru) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
WO1992012607A1 (en) 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE69214882T2 (de) 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
JPH0566795A (ja) * 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (ru) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
DE59510501D1 (de) 1995-03-13 2003-01-23 Phonak Ag Staefa Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
WO1996032710A1 (en) 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
DE59713033D1 (de) 1996-07-19 2010-06-02 Bernafon Ag Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
JP3367592B2 (ja) * 1996-09-24 2003-01-14 日本電信電話株式会社 自動利得調整装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
WO1999065276A1 (en) 1998-06-08 1999-12-16 Cochlear Limited Hearing instrument
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
WO2000065872A1 (en) 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US7027981B2 (en) 1999-11-29 2006-04-11 Bizjak Karl M System output control method and apparatus
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7058572B1 (en) 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
ATE333751T1 (de) 2000-11-09 2006-08-15 Koninkl Kpn Nv Messen einer übertragungsqualität einer telefonverbindung in einem fernmeldenetz
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
WO2001049068A2 (de) 2001-04-10 2001-07-05 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
EP1251715B2 (en) 2001-04-18 2010-12-01 Sound Design Technologies Ltd. Multi-channel hearing instrument with inter-channel communication
KR100400226B1 (ko) * 2001-10-15 2003-10-01 삼성전자주식회사 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
FR2842576B1 (fr) 2002-07-17 2004-10-08 Skf Ab Dispositif de palier a roue libre et poulie a roue libre
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
JP4321049B2 (ja) 2002-07-29 2009-08-26 パナソニック電工株式会社 自動利得制御装置
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
MXPA05008317A (es) 2003-02-06 2005-11-04 Dolby Lab Licensing Corp Audio con respaldo continuo.
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
BRPI0410740A (pt) 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
US20050071154A1 (en) * 2003-09-30 2005-03-31 Walter Etter Method and apparatus for estimating noise in speech signals
US6923684B2 (en) 2003-10-10 2005-08-02 O'sullivan Industries, Inc. Power harness having multiple upstream USB ports
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
ATE405922T1 (de) * 2004-09-20 2008-09-15 Tno Frequenzkompensation für die wahrnehmungsbezogene sprachanalyse
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI397901B (zh) * 2004-12-21 2013-06-01 Dolby Lab Licensing Corp 控制音訊信號比響度特性之方法及其相關裝置與電腦程式
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
GB2428168A (en) 2005-07-06 2007-01-17 Motorola Inc A transmitter splits a signal into a plurality of sub-signals, each containing a plurality of sub-carriers, and amplifies each sub-signal separately.
EP2002426B1 (en) 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
PL2002429T3 (pl) 2006-04-04 2013-03-29 Dolby Laboratories Licensing Corp Kontrola słyszalnej charakterystyki głośności sygnału audio
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
DE602007011594D1 (de) 2006-04-27 2011-02-10 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
MY144271A (en) 2006-10-20 2011-08-29 Dolby Lab Licensing Corp Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP2122828B1 (en) 2007-01-03 2018-08-22 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
US8560320B2 (en) 2007-03-19 2013-10-15 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
CA2679953C (en) 2007-06-19 2014-01-21 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2600527C1 (ru) * 2013-04-05 2016-10-20 Долби Лабораторис Лайсэнзин Корпорейшн Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
US9947335B2 (en) 2013-04-05 2018-04-17 Dolby Laboratories Licensing Corporation Companding apparatus and method to reduce quantization noise using advanced spectral extension
US10217476B2 (en) 2013-04-05 2019-02-26 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
US10373627B2 (en) 2013-04-05 2019-08-06 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
US10679639B2 (en) 2013-04-05 2020-06-09 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
US11423923B2 (en) 2013-04-05 2022-08-23 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension

Also Published As

Publication number Publication date
JP5192544B2 (ja) 2013-05-08
TWI464735B (zh) 2014-12-11
TW200915301A (en) 2009-04-01
US8396574B2 (en) 2013-03-12
EP2168122B1 (en) 2011-11-30
ATE535906T1 (de) 2011-12-15
BRPI0813723A2 (pt) 2017-07-04
BRPI0813723B1 (pt) 2020-02-04
EP2168122A1 (en) 2010-03-31
WO2009011827A1 (en) 2009-01-22
CN101790758B (zh) 2013-01-09
JP2010534030A (ja) 2010-10-28
RU2010105052A (ru) 2011-08-20
CN101790758A (zh) 2010-07-28
ES2377719T3 (es) 2012-03-30
US20100198378A1 (en) 2010-08-05

Similar Documents

Publication Publication Date Title
RU2438197C2 (ru) Обработка звуковых сигналов с использованием анализа слуховой сцены и спектральной асимметрии
US9768749B2 (en) Audio control using auditory event detection
JP5911852B2 (ja) 可変指数平均検出器およびダイナミックレンジ制御器
CN112640301A (zh) 具有基于场景切换分析器引导的失真可听度模型的动态阈值的减少失真的多带压缩器