RU2413357C2 - Обработка динамических свойств аудио с использованием перенастройки - Google Patents
Обработка динамических свойств аудио с использованием перенастройки Download PDFInfo
- Publication number
- RU2413357C2 RU2413357C2 RU2009118955/09A RU2009118955A RU2413357C2 RU 2413357 C2 RU2413357 C2 RU 2413357C2 RU 2009118955/09 A RU2009118955/09 A RU 2009118955/09A RU 2009118955 A RU2009118955 A RU 2009118955A RU 2413357 C2 RU2413357 C2 RU 2413357C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- level
- audio
- dynamic properties
- sequence
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 28
- 230000005236 sound signal Effects 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000008859 change Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 27
- 230000009471 action Effects 0.000 claims description 13
- 230000007423 decrease Effects 0.000 claims description 12
- 230000001960 triggered effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000006978 adaptation Effects 0.000 abstract description 22
- 230000007246 mechanism Effects 0.000 abstract description 9
- 230000000694 effects Effects 0.000 abstract description 2
- 230000003213 activating effect Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000004048 modification Effects 0.000 description 26
- 238000012986 modification Methods 0.000 description 26
- 230000005012 migration Effects 0.000 description 25
- 238000013508 migration Methods 0.000 description 25
- 238000009499 grossing Methods 0.000 description 15
- 238000005259 measurement Methods 0.000 description 14
- 230000036962 time dependent Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 210000000721 basilar membrane Anatomy 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/005—Control by a pilot signal
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H40/00—Arrangements specially adapted for receiving broadcast information
- H04H40/18—Arrangements characterised by circuits or components specially adapted for receiving
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/09—Arrangements for device control with a direct linkage to broadcast information or to broadcast space-time; Arrangements for control of broadcast-related services
- H04H60/11—Arrangements for counter-measures when a portion of broadcast information is unavailable
- H04H60/12—Arrangements for counter-measures when a portion of broadcast information is unavailable wherein another information is substituted for the portion of broadcast information
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Control Of Amplification And Gain Control (AREA)
- Circuits Of Receivers In General (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Изобретение относится к обработке звуковых сигналов и предназначено для перенастройки при обработке динамических свойств аудио для быстрой адаптации к изменениям контента в звуковом сигнале. Технический результат - обеспечение адаптации к изменениям контента в звуковом сигнале. В процессоре или способе обработки динамических свойств аудио используют механизм или последовательность операций перенастройки, для того чтобы быстро адаптироваться к изменениям контента в звуковом сигнале. Сигнал перенастройки может формироваться посредством анализа самого звукового сигнала, или перенастройка может запускаться от внешнего события, такого как изменение канала на телевизионном приемнике или изменение выбора входа на аудио/видеоприемнике. В случае внешнего пускового сигнала один или более признаков состояния процессора динамических свойств для текущего источника звука могут сохраняться и ассоциативно связываться с таким источником звука перед переключением на новый источник звука. Затем, если система переключается обратно на первый источник звука, процессор динамических свойств может быть перенастроен на состояние, сохраненное ранее, или его приближение. 2 н. и 12 з.п.ф-лы, 6 ил.
Description
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Изобретение относится к обработке звуковых сигналов. В частности, изобретение относится к процессору или способу обработки динамических свойств аудио, который использует механизм или последовательность операций перенастройки, для того чтобы быстро адаптироваться к изменениям контента в звуковом сигнале. Сигнал перенастройки может формироваться посредством анализа самого звукового сигнала, или перенастройка может запускаться от внешнего события, такого как изменение канала на телевизионном приемнике или изменение выбора входа на аудио/видеоприемнике. В случае внешнего пускового сигнала один или более признаков состояния процессора динамических свойств для текущего источника звука могут сохраняться и ассоциативно связываться с таким источником звука перед переключением на новый источник звука. Затем, если система переключается обратно на первый источник звука, процессор динамических свойств может быть перенастроен на состояние, сохраненное ранее, или его приближение. Изобретение также относится к компьютерным программам для осуществления таких способов на практике или управления таким устройством.
УРОВЕНЬ ТЕХНИКИ
Цель обработки динамических свойств аудио состоит в том, чтобы менять уровень или динамические свойства звукового сигнала, чтобы были в пределах некоторых желательных пределов. Это в целом достигается созданием зависящего от времени измерения уровня звукового сигнала (например, среднеквадратического уровня или пикового уровня), а затем вычислением и применением зависящей от времени модификации сигнала (например, изменения коэффициента усиления), которая является функцией оценки уровня. Процессоры динамических свойств, применяющие такой режим работы, включают в себя автоматическую регулировку усиления (АРУ, AGC), регулировку динамического диапазона (УДД, DRC), расширители, ограничители, шумовые заслоны и т.д. Различные типы обработки динамических свойств сигналов изложены в заявке PCT/US 2005/038579 на выдачу международного патента Алана Джеффри Шифельда, опубликованной в качестве WO 2006/047600 4 мая 2006 года. Заявка указывает Соединенные Штаты среди других субъектов права. Заявка настоящим включена в состав посредством ссылки во всей своей полноте.
Фиг.1 изображает высокоуровневую структурную схему типового процессора динамических свойств аудио. Может считаться, что процессор должен иметь два тракта, верхний «сигнальный» тракт 2 и нижний тракт 4 «управления». В нижнем тракте последовательность операций управления или контроллер 6 динамических свойств («Элемент регулировки динамических свойств») измеряет уровень звукового сигнала и формирует один или более зависящих от времени параметров модификации в качестве функции измерения уровня. Как показано, параметры модификации выводятся из входного звукового сигнала. В качестве альтернативы параметры модификации могут выводиться из обработанного (выходного) аудио или из комбинации входного и выходного звуковых сигналов. В верхнем звуковом тракте 2 параметры модификации, сформированные элементом 6 регулировки динамических свойств, применяются к аудио для формирования обработанного аудио. Применение параметров модификации к звуковому сигналу может выполняться многими известными способами и, в общем, показано символом 8 умножителя. Например, в случае устройства или последовательности операций автоматической регулировки усиления может быть единственный параметр модификации широкополосного коэффициента усиления, который регулирует коэффициент усиления устройства или последовательности операций переменного усиления/ослабления в основном тракте. На практике аудио также может задерживаться перед применением параметров модификации, для того чтобы компенсировать любую задержку, ассоциативно связанную с вычислением параметров модификации в последовательности операций регулировки динамических свойств. Для простоты в представлении задержка не показана на фиг.1 или других фигурах в материалах настоящей заявки.
В последовательности операций регулировки динамических свойств типично, что как измерение уровня сигнала, так и результирующие параметры модификации, вычисляются непрерывно во времени. В дополнение любое или оба измерения уровня сигнала и параметров модификации обычно сглаживаются по времени, чтобы минимизировать воспринимаемые артефакты от внесения в обработанный звук. Сглаживание, чаще всего, выполняется с использованием «быстрого нарастания» и «медленного спада», означающих, что параметры модификации изменяются относительно быстро в ответ на увеличение уровня сигнала и медленно реагируют, в то время как уровень сигнала уменьшается. Такое сглаживание происходит в соответствии с динамическими свойствами естественных звуков и способом, которым люди воспринимают изменения громкости во времени. Следовательно, такое временное сглаживание является почти универсальным в процессорах динамических свойств аудио.
Для некоторых приложений обработки динамических свойств постоянные времени, ассоциативно связанные с таким сглаживанием, могут быть довольно большими, порядка одной или более секунд. Например, АРУ может вычислять оценку долговременного среднего уровня сигнала с использованием больших постоянных времени, а затем использовать результирующую оценку для формирования медленно меняющихся параметров модификации, которые перемещают средний уровень звука ближе к требуемому целевому уровню. В этом случае большие постоянные времени могут быть желательны для того, чтобы сохранять кратковременные динамические свойства звукового сигнала. Предположим, что такое АРУ оперирует со звуком телевизионного приемника с целью поддержания согласующегося среднего уровня по программам и по различным каналам. В такой ситуации контент звукового сигнала, обрабатываемого АРУ, может внезапно изменяться или содержать скачок, например, когда меняется канал, а потому ассоциативно связанный средний уровень звукового сигнала также может внезапно изменяться или содержать скачок. Со своими большими постоянными времени, однако, АРУ требует значительного количества времени для схождения к новому уровню и приведения модифицированного уровня обработанного звука в соответствие с требуемым целевым уровнем. В течение такого времени адаптации зритель телевидения может воспринимать уровень звука слишком громким или слишком приглушенным. Как результат, зритель может быстро доставать пульт дистанционного управления для настройки только уровня громкости, чтобы оказаться борющимся с АРУ, в то время как она стремится к пределу.
Типичное решение предшествующего уровня техники для только что описанной проблемы включает в себя использование постоянных времени, которые приспосабливаются на основании динамических свойств сигнала. Например, если кратковременный уровень сигнала является значительно большим или меньшим, чем сглаженный уровень, как определено несколькими границами пороговых значений вокруг сглаженного уровня, то операция сглаживания переключается на более быстрые постоянные времени нарастания и/или спада соответственно до тех пор, пока кратковременный уровень не отступает в пределы границ пороговых значений вокруг сглаженного уровня. Следовательно, система переключается обратно на исходные, более медленные постоянные времени. Такая система может сокращать время адаптации АРУ, но пороговые значения и более короткие постоянные времени должны тщательно выбираться. Вообще, для любых приемлемых пороговых значений могут существовать сигналы, в которых исходные требуемые динамические свойства сигнала отклоняются за пределы границ пороговых значений вокруг среднего уровня, таким образом заставляя последовательность операций сглаживания ложно переключаться в режим быстрого нарастания или спада. Вследствие возможно частого возникновения такого ложного переключения постоянные времени режима быстрого нарастания и спада не должны выбираться слишком короткими, для того чтобы избежать нестабильности АРУ во время нормального программного материала. Как результат, схождение АРУ во время внезапных переходных процессов или скачков в звуковом контенте все же может не быть настолько быстрым, насколько требуется.
Поэтому цель настоящего изобретения состоит в том, чтобы предложить лучшее решение для проблемы времени адаптации обработки динамических свойств в течение изменений звукового контента.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Согласно аспекту изобретения способ обработки звукового сигнала (или устройство, осуществляющее способ на практике) включает в себя изменение динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств, обнаружение изменения в контенте звукового сигнала и перенастройку последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения. Обнаружение изменения в контенте звукового сигнала может содержать одно или оба из (1) обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, L silence, на всем протяжении временного интервала, не меньшего чем первое пороговое значение времени, t silence, и (2) обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, L drop, в пределах временного интервала, не большего чем второе пороговое значение времени, t drop.
Согласно еще одному аспекту изобретения способ обработки звукового сигнала (или устройство, осуществляющее способ на практике) включает в себя изменение динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств, прием подаваемого снаружи сигнала запуска перенастройки, указывающего изменение в звуковом сигнале, и перенастройку последовательности операций регулировки динамических свойств в ответ на сигнал запуска перенастройки. Сигнал запуска перенастройки может указывать одно или более из (1) действия пользователя, изменяющего канал, (2) действия пользователя, изменяющего источники входного сигнала, (3) действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед, (4) переключения с одного файла на другой, (5) изменения программы, (6) переключения с одного формата кодирования звука на другой и (7) изменения параметров кодирования.
Согласно любому из вышеприведенных аспектов перенастройка последовательности операций регулировки динамических свойств может убыстрять скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале. Перенастройка последовательности операций регулировки динамических свойств устанавливает значение одного или более параметров управления последовательностью операций или сигнал, функцией которого являются такие один или более параметров управления последовательностью операций, в хранимое значение или значение по умолчанию. Перенастройка последовательности операций регулировки динамических свойств может уменьшать значение одной или более постоянных времени, применяемых при определении одного или более параметров управления последовательностью операций, или сигнала, функцией которого являются такие один или более параметров управления последовательностью операций.
Хотя подход с адаптивными постоянными времени, описанный выше, может быть до некоторой степени полезным в сокращении времени адаптации процессора или последовательности операций динамических свойств аудио и может использоваться наряду с аспектами настоящего изобретения, такие процессор или последовательность операций могут быть значительно улучшены их наращиванием явными механизмом или последовательностью операций перенастройки, которые приводятся в действие при возникновении некоторых внезапных изменений или скачков в контенте звукового сигнала, являющегося обрабатываемым. Фиг.2 изображает настоящее изобретение в обобщенном виде, в котором дополнительный тракт управления, тракт 10 управления перенастройкой, добавлен в исходный процессор динамических свойств по фиг.1. Механизм или последовательность 12 операций управления перенастройкой («Элемент управления перенастройкой») может реагировать на один или оба из самого звукового сигнала (входного звукового сигнала или комбинации входного и выходного звуковых сигналов) и внешнего сигнала запуска. Таким образом, есть три возможные конфигурации: (1) сам звуковой сигнал (который, в свою очередь, может содержать входной звуковой сигнал или комбинацию входного и выходного звуковых сигналов), (2) внешний сигнал запуска и (3) оба, сам звуковой сигнал и внешний сигнал запуска. Если элемент 12 управления перенастройкой, механизм или последовательность операций управления перенастройкой, отправляет сообщение перенастройки в элемент 6 регулировки динамических свойств, давая ему указание перенастроить определенные аспекты его состояния регулировки динамических свойств некоторым образом, который предоставляет обработке динамических свойств аудио возможность быстро адаптироваться к новому уровню поступающего звукового сигнала. Перенастройка некоторых аспектов состояния регулировки динамических свойств, например, может (1) устанавливать одну или более постоянных времени в меньшее значение на короткий период времени (тем самым убыстряя скорость адаптации обработки звука) и/или (2) устанавливать сглаженное измерение уровня звукового сигнала либо одного или более параметров модификации в сохраненное значение либо в среднее значение или значение по умолчанию.
Анализ звукового сигнала для определения события внезапного изменения или скачка в контенте сигнала
Решение о перенастройке может инициироваться элементом 12 управления перенастройкой некоторым количеством способов, например, посредством анализа самого поступающего звукового сигнала или посредством приема внешнего сигнала запуска перенастройки. При анализе звукового сигнала элемент 12 управления перенастройкой пытается обнаружить условия в сигнале, указывающие на внезапное изменение или скачок в контенте. При обнаружении такого условия с определенной степенью достоверности элемент 12 управления перенастройкой принимает решение о перенастройке и впоследствии дает элементу 6 регулировки динамических свойств указание перенастроить один или более аспектов его состояния регулировки динамических свойств. Хотя другие технологии могут использоваться для обнаружения внезапных изменений или скачков в контенте сигнала, ниже описаны два практических и эффективных примера для выполнения этого.
Использование внешнего пускового сигнала для определения события внезапного изменения или скачка в контенте сигнала
Во многих применениях высоконадежная внешняя информация может быть имеющейся в распоряжении для запуска перенастройки. Например, в телевизионном приемнике или кабельной «телевизионной абонентской приставке» действие пользователя, изменяющего канал, может служить в качестве внешнего пускового сигнала перенастройки. К тому же в телевизионном или аудио/видеоприемнике действие пользователя, изменяющего источники входного сигнала, например, с «Видео 1» на «Видео 2», может служить для запуска перенастройки. Другие примеры включают в себя основанный на файлах медиаплеер, например портативное звуковое устройство или цифровой видеомагнитофон. В таком случае перенастройка может запускаться извне, когда система завершает воспроизведение одного файла и переключается на другой. Перенастройка также могла бы запускаться, когда пользователь сам или сама явным образом изменяет файл, нажимает воспроизведение либо быструю перемотку вперед или перемотку назад в новое местоположение на участке контента. В случае, в котором звук, являющийся обрабатываемым, был декодирован из сжатого потока цифровых данных, например звука в формате Dolby Digital, могут существовать другие источники внешнего сигнала запуска перенастройки. «Dolby» и «Dolby Digital» являются торговыми марками корпорации Dolby Laboratories Licensing. Например, система кодирования звука формата Dolby Digital является обязательным стандартом записи звука для телевидения высокой четкости в Соединенных Штатах. На заданном канале программирования звук отправляется непрерывно, но формат Dolby Digital может изменяться на границах программы. Например, основная программа может кодироваться в формате канала 5.1, но коммерческая может кодироваться в стереофоническом формате. Декодер Dolby Digital обязательно обнаруживает такие изменения и может пересылать информацию в процессор динамических свойств аудио по настоящему изобретению в качестве пускового сигнала перенастройки. Также могут применяться другие изменения в параметрах кодир, например изменения в параметре нормализации диалога Dolby Digital, «DIALNORM», который обычно сохраняется постоянным для одиночного участка контента. Подобный внешний пусковой сигнал перенастройки может формироваться также из других форматов кодирования, таких как формат MP3 и AAC. В дополнение к только что перечисленным источникам внешних пусковых сигналов перенастройки возможны другие, и изобретение не подразумевается ограниченным перечисленными таковыми.
В случае, когда изобретение используется в устройстве, в котором аудио может возникать из набора известных источников, изобретение может быть дополнительно улучшено, как показано на фиг.3. По низу фигуры изображены N источников с 14-1 по 14-N звука (с «Источника 1 звука» по «Источник N звука»), где предполагается, что один из N источников звука выбирается для воспроизведения через систему обработки динамических свойств посредством устройства или последовательности 16 операций выбора источника («Элемента выбора источника»). Такие источники звука могли бы представлять, но не в качестве ограничения, различные каналы на телевизоре или телевизионной абонентской приставке, различные входы на аудио/видеоприемнике или различные файлы в портативном медиаплеере. С каждым источником звука хранятся признаки состояния одного или более аспектов последовательности операций регулировки динамических свойств, как они имели место в последний раз, когда воспроизводился конкретный источник звука. Такие аспекты состояния регулировки динамических свойств, например, могут включать в себя одно или более из (1) сглаженного измерения уровня звукового сигнала, (2) одного или более параметров модификации, являющихся результатом сглаженного измерения уровня звукового сигнала, и (3) одной или более из постоянных времени, применяемых при получении сглаженного измерения уровня звукового сигнала. В примерном варианте осуществления, описанном ниже, применяется сглаженное измерение уровня звукового сигнала, которое опосредованно оказывает воздействие на параметр модификации коэффициента усиления (в примере коэффициент усиления является функцией сглаженного уровня звукового сигнала). Когда другой источник звука выбирается благодаря последовательности операций выбора источника, перед фактическим переключением на новый источник звука, элемент 16 выбора источника отправляет внешний пусковой сигнал перенастройки на элемент 12' управления перенастройкой. Это, в свою очередь, побуждает элемент 12' управления перенастройкой фиксировать признаки текущего состояния последовательности операций регулировки динамических свойств для текущего воспроизведения источника звука. Элемент 12' управления перенастройкой затем сохраняет признаки состояния регулировки динамических свойств в N местах с 18-1 по 18-N хранения состояния регулировки динамических свойств, ассоциативно связанных с текущим выбором аудио (запоминающих устройствах с 1 по N состояния регулировки динамических свойств). Затем элемент 16 выбора источника переключается на новый источник звука и отправляет ассоциативно связанные хранимые признаки состояния регулировки динамических свойств в последовательность операций регулировки перенастройки, которые, в свою очередь, перенастраивают последовательность операций регулировки динамических свойств с использованием хранимых признаков состояния.
Посредством использования аспектов последнего состояния регулировки динамических свойств источника звука для перенастройки последовательности операций регулировки динамических свойств при переключении на такой источник могут достигаться лучшие эксплуатационные качества, чем в отсутствие применения такого начального состояния. Без такой информации последовательность операций регулировки динамических свойств полагается на поступающий звуковой сигнал после перенастройки, в то время как адаптируется к новому источнику звука. На кратковременной основе уровень звука может быстро флуктуировать, а потому параметры модификации также могут быстро флуктуировать по мере того, как последовательность операций регулировки динамических свойств пытается быстро адаптироваться к новому аудио. Посредством использования аспектов последнего состояния процессора динамических свойств, ассоциативно связанного с источником звука, для перенастройки процессора динамических свойств вероятно, что процессор динамических свойств будет начинать с состояния, которое ближе к состоянию, к которому он будет стремиться в конечном счете для такого источника звука. Как результат, быстрым постоянным времени адаптации после перенастройки не нужно уменьшаться настолько, насколько могло бы потребоваться в ином случае, тем самым, с предоставлением улучшенной устойчивости без принесения в жертву общего времени адаптации. В качестве примера рассмотрим переключение между двумя телевизионными станциями, первой, со звуком на среднем уровне в -15 дБ относительно цифрового значения полной шкалы, и второй, со звуком на среднем уровне в -30 дБ, обе с диапазоном плюс или минус 5 дБ вокруг своих соответственных средних значений. Допустим, что как раз перед переключением на вторую станцию средний уровень первой станции находится на -13 дБ. Кроме того, допустим, что средний уровень второй станции находится на -33 дБ после переключения. Это перепад в -20 дБ. Если кому-то требуется, чтобы система обработки динамических свойств адаптировалась за половину секунды, например, скорость адаптации в -40 дБ в секунду требуется при отсутствии любой другой информации. Такая скорость довольно быстра и может привносить неустойчивость в обработанный звук. С другой стороны, предположим, что последнее состояние обработки динамических свойств, сохраненное у второй станции, соответствует уровню в -28 дБ. Затем, после перенастройки, последовательность операций регулировки динамических свойств может перенастраиваться этим состоянием и существует перепад всего лишь в -33 дБ - (-28 дБ) = -5 дБ. Таким образом, для приближения к требуемому уровню за половину секунды требуется скорость адаптации всего лишь в -10 дБ в секунду (требуя меньшего сокращения постоянной времени). Этот пример иллюстрирует преимущества в сохранении последнего состояния последовательности операций регулировки динамических свойств у источника звука, который давал в результате такое состояние.
Результат, когда запускается перенастройка
Запуск перенастройки убыстряет скорость адаптации обработки динамических свойств аудио (скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале). Например, когда запускается перенастройка, одна или более постоянных времени, ассоциативно связанных со скоростью адаптации, могут быстро переключаться на значительно меньшие значения, а затем плавно возвращаться к своим исходным большим значениям через заданный период времени. В качестве альтернативы одна или более постоянных времени могут переключаться на значительно меньшие значения и оставаться в таких значениях в течение заданного периода времени. В компоновке АРУ сигнал c[t] регулировки постоянной времени может моментально уменьшать постоянные времени, используемые при вычислении сглаженного среднего уровня. Например, постоянные времени сглаживания могут быть уменьшены в течение продолжительности приблизительно в одну секунду, следующую за перенастройкой. В примерном варианте осуществления сигнал c[t] регулировки постоянной времени может начинаться со значения в «1» (указывая воздействие максимального изменения на одну или более постоянных времени) при возникновении пускового сигнала перенастройки; когда он равен «1», коэффициенты возрастания и спада устанавливаются в значения, значительно меньшие, чем их номинальные значения. Так как c[t] затухает до нуля через короткий период времени, такой как одна секунда (длительность периода времени не является критической), коэффициенты видоизменяются обратно в свои номинальные обычные (неперенастроенные) значения. В качестве альтернативы или в дополнение при возникновении пускового сигнала перенастройки значение сглаженного среднего уровня, вычисленного последовательностью операций регулировки динамических свойств, может перенастраиваться на состояние, хранимое с конкретным источником звука, или на значение по умолчанию.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 - схематическая функциональная структурная схема, показывающая, на высоком уровне, исходный процессор динамических свойств аудио.
Фиг.2 - схематическая функциональная структурная схема, показывающая в соответствии с аспектами настоящего изобретения пример варианта осуществления настоящего изобретения, в котором, в общем виде, дополнительный тракт управления, тракт управления перенастройкой, добавлен в исходный процессор динамических свойств по фиг.1.
Фиг.3 - схематическая функциональная структурная схема, показывающая в соответствии с аспектами настоящего изобретения пример варианта осуществления настоящего изобретения, в котором процессор динамических свойств аудио дополнительно улучшен.
Фиг.4 показывает примерную функцию входа/выхода для типичной автоматической регулировки усиления (АРУ).
Фиг.5 показывает набор частотных характеристик полос пропускания, выбранный для имитации критической полосовой фильтрации, наблюдаемой по базилярной мембране в человеческом ухе.
Фиг.6 - схематическая функциональная структурная схема, показывающая в соответствии с аспектами настоящего изобретения пример варианта осуществления АРУ по настоящему изобретению.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Описанное изобретение применимо к широкому многообразию приложений обработки динамических свойств, таких как регулировка динамического диапазона, компрессоры, ограничители, расширители и т. д. Однако оно особенно полезно, когда применяется к АРУ, в котором типично большие постоянные времени имеют следствием медленную адаптацию в отсутствие настоящего изобретения. Таким образом, предпочтительные варианты осуществления описывают, в качестве примера, применение изобретения к АРУ.
Базовая реализация АРУ
Базовая реализация АРУ вычисляет зависящую от времени оценку среднего уровня сигнала и вычисляет требуемый модифицированный выходной уровень, который является функцией входного уровня и требуемого целевого уровня. Зависящая от времени модификация сигнала затем может вычисляться в качестве функции перепада между входным уровнем и требуемым выходным уровнем. Функция, отображающая вход в выход, предназначена для приведения уровня модифицированного звука ближе к требуемому целевому уровню, а фиг.4 изображает такую функцию входа/выхода. Для входного сигнала выше целевого уровня АРУ требует ослабления сигнала, а для входного сигнала ниже целевого уровня АРУ требует усиления сигнала. Степень ослабления или усиления может управляться изменением наклона линии на фиг.4.
Теоретически, измерение, используемое для вычисления среднего уровня звука, должно коррелировать с человеческим восприятием громкости. Это может достигаться многими способами, например взвешенным измерением среднеквадратической мощности или измерением психоакустической громкости. Простое невзвешенное измерение среднеквадратической мощности является слегка менее точным, чем два только что упомянутых способа, но по-прежнему демонстрирует высокую степень корреляции с человеческим восприятием громкости для большинства звуковых сигналов реального мира. Вследствие своей вычислительной простоты невзвешенное измерение среднеквадратической мощности используется в предпочтительном варианте осуществления, но не должно рассматриваться в качестве ограничивающего изобретение.
Хотя, в принципе, аспекты изобретения могут быть реализованы аналоговой и/или цифровой областях, насколько можно ожидать, практические реализации должны быть реализованы в цифровой области, в которой каждый из звуковых сигналов представлен отдельными отсчетами или отсчетами внутри блоков данных. Оценка входного уровня и соответствующего требуемого выходного уровня и параметры модификации сигнала могут вычисляться непрерывно для аналогового звукового сигнала либо на основе отсчет за отсчетом у цифрового сигнала, но для этого примерного варианта осуществления, взамен, желательно вычислять такие величины для следующих друг за другом перекрывающихся блоков отсчетов цифрового звукового сигнала. Это главным образом происходит вследствие того обстоятельства, что цифровая блочная обработка полезна для обнаружения условий перенастройки из самого сигнала, как описано позже. Давая возможность цифровому звуковому сигналу быть представленным посредством x[n], перекрывающиеся блоки звукового сигнала могут быть вычислены в качестве
где N - длина блока, N/2 - степень перекрытия между следующими друг за другом блоками, t - индекс блока, а w[n] - оконная функция, такая как синусное окно. Для сигналов, подвергаемых выборке на 44100 Гц, хорошо работает настройка N=512 или N=1024. Дополнительные подробности о компоновке обработки цифрового звука с применением перекрывающихся блоков отсчетов изложены в патенте 5899969 США Филдера и других («Frame-based audio with gain-control words» («Основанное на блоках аудио со словами регулировки усиления»)), каковой патент настоящим включен в состав посредством ссылки во всей своей полноте. Как описано ниже, АРУ вычисляет зависящий от времени коэффициент G[t] усиления, который затем перемножается с каждым блоком сигнала. Каждый из этих модифицированных блоков затем прибавляется с перекрытием, чтобы создать заключительный модифицированный звуковой сигнал y[n + tN/2]:
В качестве первого этапа при вычислении коэффициента G[t] усиления изменяющийся во времени мгновенный уровень сигнала L[t] вычисляется в качестве среднеквадратической мощности каждого блока x[n, t]. В децибелах уровень вычисляется как
где 0 дБ соответствует уровню цифровой прямоугольной волны полной шкалы.
Затем мгновенный уровень может сглаживаться с быстрым нарастанием и медленным спадом для формирования сглаженного среднего уровня звукового сигнала L[t]:
где
и
Коэффициенты α attack и α release сглаживания выбираются, чтобы давать требуемые времена нарастания и спада. Одним из способов задать это является время половинного затухания сглаживающего фильтра, то есть время, которое отнимается, чтобы импульсная характеристика временного сглаживающего фильтра затухала до половины своего исходного значения. Хотя выбор α attack, соответствующей времени половинного затухания в 1 секунду, и α release, соответствующей времени половинного затухания в 4 секунды, хорошо работает для АРУ, значения не являются критическими. Значение L min в уравнении 4a представляет минимальный уровень, выше которого должен быть мгновенный уровень L[t] сигнала, для того чтобы обновлялся сглаженный уровень. Это предохраняет сглаженный средний уровень от падения слишком низко, а соответствующий коэффициент усиления от возрастания слишком высоко, когда сигнал попадает в относительную тишину. При условии, что 0 dB представляет уровень цифровой прямоугольной волны полной шкалы, настройка L min = -60 dB является приемлемым выбором, хотя уровень не является критическим.
Из сглаженного среднего уровня [t] и функции F AGC входа/выхода, как показано на фиг.4, вычисляется требуемый выходной уровень out[t]
В заключение коэффициент G[t] усиления вычисляется по перепаду между выходным уровнем out[t] и входным уровнем [t]:
Когда out[t] > [t], коэффициент усиления является большим, чем единица, означая, что сигнал усиливается, а когда out[t] < [t], коэффициент усиления является меньшим чем единица, означая, что сигнал ослабляется.
АРУ с перенастройкой
Как упомянуто выше, механизм или функция перенастройки может вызывать одно из двух или оба из двух действий: (1) установку одной или более постоянных времени в меньшее значение на короткий период времени (тем самым убыстрение скорости адаптации обработки звука) и (2) установку сглаженного измерения уровня звукового сигнала либо одного или более параметров модификации в сохраненное значение либо в среднее значение или значение по умолчанию, которое может быть выражено в качестве init (см. уравнение 8a, приведенное ниже и описания перед и после такого уравнения). Прежде всего, описана перенастройка одной или более постоянных времени.
Так как параметр модификации, коэффициент G[t] усиления, является функцией сглаженного среднего уровня [t], скорость, с которой описанная АРУ адаптируется к звуку, обусловлена временами нарастания и спада, используемыми при вычислении L[t]. Как установлено выше, такие постоянные времени сглаживания выбираются, чтобы быть относительно большими, порядка нескольких секунд, так что АРУ не изменяет уровень звука слишком быстро в течение временного развития нормального звукового контента. Однако если звуковой контент изменяется внезапно или содержит скачок, АРУ может использовать слишком долгое время для адаптации, особенно если новый контент находится на значительно ином уровне, чем предыдущий контент. Чтобы ускорить адаптацию, сигнал перенастройки, описанный ранее, может использоваться для запуска модификации одной или более постоянных времени, ассоциативно связанных со сглаживанием уровня. В этом случае, когда запускается перенастройка, одна или более постоянных времени, ассоциативно связанных со скоростью адаптации, могут быстро переключаться на значительно меньшие значения, а затем плавно возвращаться к своим исходным большим значениям (или их приближениям) через заданный период времени. Возможны другие способы для убыстрения скорости адаптации после того, как запущена перенастройка. Например, вместо плавного возврата к своим исходным значениям или их приближениям, постоянные времени могут сохраняться на своих меньших значениях через заданный период времени, а затем возвращаться непосредственно к своим исходным значениям или их приближениям. Еще одна возможность состоит в том, чтобы обеспечивать скачкообразный возврат постоянных времени через заданный период времени. Не подразумевается, что изобретение должно быть ограниченным способом, которым постоянные времени возвращаются к своим исходным значениям или их приближению.
Для запуска перенастройки может существовать двоичный сигнал R[t] перенастройки, такой R[t] = 0 во время нормальной работы, и R[t] = 1, когда перенастройка требуется на временном блоке t. Перенастройка может запускаться согласно анализу звукового сигнала или внешним источником, как описано ранее. Подробности примеров запуска перенастройки посредством анализа сигнала описаны ниже. В случае внешнего пускового сигнала может существовать сохраненное состояние, которым может перенастраиваться последовательность операций динамических свойств, как показано на фиг.3. Для описанного предпочтительного варианта осуществления такое сохраненное состояние может состоять из значения сглаженного среднего уровня [t] в последнем временно блоке, в котором обрабатывался конкретный источник звука. Начальное состояние, извлеченное из запоминающего устройства во время запущенной извне перенастройки (или, в качестве альтернативы, начальное состояние может быть значением по умолчанию, применяется или нет запускаемая извне перенастройка), может быть представлено значением init.
По двоичному сигналу R[t] перенастройки может формироваться сигнал регулировки постоянной времени и впоследствии использоваться для мгновенного сокращения постоянных времени, используемых при вычислении сглаженного среднего уровня [t], тем самым убыстряя скорость адаптации обработки. Сигнал c[t] регулировки постоянной времени может вычисляться, так что он равен «1» в момент, когда происходит перенастройка (R[t] = 1), а затем экспоненциально затухает до «0» со скоростью, управляемой коэффициентом затухания λ < 1:
иначе,
Коэффициент затухания λ может быть выбран, чтобы давать время половинного затухания, например, в одну секунду, каковое означает, что постоянные времени сглаживания уменьшены в течение продолжительности в приблизительно одну секунду, следующую за перенастройкой. Отметим также, что сигнал управления может обновляться, только если уровень L[t] ≥ L min, для того чтобы предохранять быструю адаптацию от появления во время относительной тишины.
Лучше чем использование постоянных коэффициентов нарастания и спада для сглаживания уровня сигнала, как показано в уравнении 4b, коэффициенты теперь могут меняться со временем в качестве функции сигнала c[t] регулировки постоянной времени. Когда c[t] = 1, означая, что только что произошла перенастройка, коэффициенты нарастания и спада могут устанавливаться равными значениям, значительно меньшим, чем значения λ attack и λ release по уравнению 4b (например, около десяти процентов исходных значений или менее). По мере того как c[t] затем затухает до «0», коэффициенты могут интерполироваться обратно в свои номинальные значения λ attack и λ release . По выбору, в дополнение, небольшие значения коэффициентов, используемые непосредственно после перенастройки, также могут меняться в зависимости от того, существует ли значение init начального состояния. Если никакого сохраненного начального состояния не существует, то могут использоваться очень маленькие значения коэффициентов, а если сохраненное начальное состояние существует, то могут использоваться слегка большие значения коэффициентов. В последнем случае предполагается, что инициализация [t] значением init начинает [t] со значения, более близкого к значению, к которому он сойдется в конечном счете. Следовательно, может использоваться слегка меньшее время адаптации, соответствующее большим коэффициентам, по сравнению со случаем, где не доступно никакое начальное состояние. Последовательность операций адаптивного сглаживания может быть выражена в качестве
иначе,
где
и
Значения β afast и β rfast представляют начальные коэффициенты сглаживания нарастания и спада непосредственно после перенастройки, когда не предусмотрено никакого начального состояния, init. Значения, соответствующие временам половинного затухания в 50 миллисекунд и 200 миллисекунд соответственно, были найдены пригодными к употреблению. Конкретные значения не являются критическими. Значения β aslow и β rslow представляют большие начальные коэффициенты сглаживания нарастания и спада непосредственно после перенастройки, когда предусмотрено начальное состояние, init. В этом случае были найдены пригодными к употреблению значения, соответствующие временам половинного затухания, равным удвоенным таковым у их более быстрых аналогов, 100 миллисекунд и 400 миллисекунд соответственно. В этом случае также конкретные значения не являются критическими.
Обнаружение перенастройки посредством анализа сигнала
Наиболее надежный способ для запуска перенастройки в раскрытом изобретении состоит в том, чтобы принимать пусковой сигнал внешним образом, из механизма или последовательности операций, которые известны непосредственно привязанными к изменению звукового контента. Несколько таких механизмов были обсуждены ранее, например изменение канала на телевизионном приемнике или изменение выбора входа на аудио/видеоприемнике. Во многих случаях, однако, никакие такие внешние механизмы могут не быть в распоряжении, а потому система должна полагаться на анализ самого звукового сигнала, если должна запускаться перенастройка. Например, предположим, что раскрытое изобретение находится в телевизионном приемнике, к которому пользователь подключил внешнюю кабельную телевизионную абонентскую приставку. Кабельная телевизионная абонентская приставка ответственна за подстройку и изменение каналов, и декодированный звук пересылается в телевизор только в качестве непрерывного аудиопотока. Телевизор поэтому не принимает никакой явной информации о том, когда выбран новый канал. Единственной имеющейся в распоряжении информацией является та, которая может логически выводиться из аудиопотока, который он принимает.
Относительно простой, но эффективный способ запуска перенастройки посредством анализа сигнала состоит в том, чтобы обнаруживать событие во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, L silence, на всем протяжении минимального периода времени (временного интервала, не меньшего чем пороговое значение времени, t silence). Другими словами, для обнаружения периода относительно тишины, имеющего продолжительность по меньшей мере такой же длительности, как заданный пороговый временной интервал. Такое событие, насколько можно ожидать, должно указывать внезапное изменение или скачок в контенте аудио. Многие устройства, в частности телевизионные абонентские приставки, приглушают звуковой сигнал на короткий период времени, когда изменяется источник звука. Действие приглушения снижает звуковой сигнал до уровня, гораздо меньшего, чем обычно встречается в нормальном звуковом контенте. В случае цифрового звука, например, оно может уменьшать отсчеты сигнала до нуля. Такие условия во временном развитии сигнала могут обнаруживаться посредством анализа кратковременного уровня L[t], обсужденного ранее. Если L[t] остается ниже, чем пороговое значение L silense на всем протяжении временного интервала в по меньшей мере t silence, то может запускаться перенастройка. Этот подход может быть выражен как
где сигнал s[t] вычисления паузы обновляется согласно
Если 0 дБ соответствует уровню цифровой прямоугольной волны полной шкалы, то настройка L silence, например, равная -90 дБ, хорошо работает на практике, хотя уровень не является критическим. Настройка t silence на время, например, в 0,25 секунд является приемлемым выбором для многих применений, хотя период времени не является критичным.
В некоторых ситуациях промежуток относительной тишины может не привноситься, когда звуковой контент внезапно изменяется или содержит скачок, а потому вышеприведенная технология может не быть эффективной при запуске перенастройки. Поэтому желательно альтернативное событие запуска перенастройки, чтобы иметь дело с дополнительными случаями. В любой ситуации, в которой звуковой контент внезапно изменяется или содержит разрыв, уровень нового аудио будет либо большим чем, равным либо меньшим чем уровень предыдущего звукового контента. Так как большинство процессоров динамических свойств применяют нарастание, которое значительно быстрее, чем его спад, случай, в котором уровень нового звукового контента является большим чем или равным старому, является менее проблематичным, чем когда новый звуковой контент является значительно более низким, чем старый. В последнем случае время медленного спада может иметь следствием неприемлемо длительное время адаптации. Поэтому запуск перенастройки, когда новый звуковой контент значительно ниже, чем старый, может считаться особенно желательным. Чтобы делать так, можно применять признак, общий для большинства звуковых сигналов, состоящих из естественных звуков. Естественные звуки могут проявлять внезапные повышения уровня, но они обычно демонстрируют более постепенное затухание. Звуки, которые внезапно прерываются, не являются самыми распространенными в большинстве звуковых записей. Однако если звуковой контент внезапно переключается, например, благодаря изменению выбора входа и уровень нового звукового входа является значительно меньшим, чем старый, то результирующий аудиопоток демонстрирует радикальное неестественное мгновенное падение уровня. Такое падение уровня может обнаруживаться по кратковременному уровню L[t] и использоваться для запуска перенастройки.
Таким образом, еще один эффективный способ запуска перенастройки посредством анализа сигнала состоит в том, чтобы обнаруживать событие во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, L drop, в пределах временного интервала, не большего чем второе пороговое значение времени, t drop. Более точно, если перепад между L[t] и L[t - 1] является большим чем заданное пороговое значение, L drop, в пределах временного интервала t drop, то запускается перенастройка
Подходящей разновременностью t drop является время одного блока цифровой обработки. Например, с перекрытием блока в половину время одного блока соответствует N/2 отсчетам. Если N=512, а частотой выборки является 48000 Гц, t drop приблизительно равно 5 миллисекундам. Если N=1024, t drop равно приблизительно 10 миллисекундам. Перепад уровней, L drop, в приблизительно от -10 дБ до -20 дБ был найден подходящим, хотя перепад уровней не является критичным.
Вышеприведенная технология эффективна при запуске перенастройки, когда уровень нового звукового контента значительно ниже, чем старого, но она иногда может быть чувствительной к ложному запуску перенастройки во время нормального звукового контента. Описанная технология ищет падение в суммарном уровне сигнала, и иногда доминирующая часть звукового сигнала, например удар в барабан, может демонстрировать такое поведение, в то время как оставшаяся часть сигнала не может. Доминирующая сигнальная составляющая, однако, осуществляет наиболее значительный вклад в общий уровень, а потому может заставлять запускаться перенастройку. Чтобы справляться с таким непредусмотренным запуском, схема обнаружения может быть улучшена обнаружением перенастройки, когда уровень сигнала демонстрирует значительное падение уровня одновременно по множеству полос частот (например, всем полосам частот) в пределах порогового периода времени. Этим способом все такие полосы частот осуществляют равный вклад в процесс обнаружения перенастройки, независимо от абсолютного уровня в любой данной полосе. Для реализации такой технологии сначала вычисляется мгновенный уровень в пределах множества полос частот. Этот уровень представлен в качестве L[b, t], где b указывает индекс полосы. Он может эффективно формироваться вычислением дискретного преобразования Фурье (ДПФ, DFT) каждого блока x[n, t] аудио и перемножением ДПФ с частотной характеристикой C h[k] полосы пропускания для каждой полосы b:
где X[k, t], ДПФ от x[n, t], вычисляется в качестве
Набор частотных характеристик C h [k] полос пропускания преимущественно может выбираться для имитации критической полосовой фильтрации, наблюдаемой по базилярной мембране в человеческом ухе. Как предложено Муром и Гласбергом («A Model for the Prediction of Thresholds, Loudness, and Partial Loudness» («Модель для предсказания пороговых значений, громкости и частичной громкости»), Brian Moore, Brian Glasberg, and Thomas Baer, J. Audio Eng. Soc, Vol. 45, No. 4, 1997 April), такие фильтры демонстрируют приблизительно округлую экспоненциальную форму и равномерно разнесены по шкале эквивалентных прямоугольных полос пропускания (ERB). Фиг.5 изображает пригодный набор фильтров с разнесением в 1 ERB, дающий в результате итоговую сумму в 40 полос.
По мгновенному уровню для каждой полосы, L[b, t], может быть вычислен перепад между следующими друг за другом временными блоками, усредненными по всем полосам
Для звуковых сигналов реального мира, D[t] является крайне малым, только если уровень сигнала значительно падает в большинстве полос b. Если перепад является меньшим, чем некоторое пороговое значение, D drop, то обнаружена перенастройка
На практике хорошо работает настройка D drop между -10 и -20 дБ, хотя настройка не является критической. Получающаяся в результате многополосная технология является менее чувствительной к ложному запуску перенастройки, чем более простая технология, которая проверяет только перепад в общем уровне сигнала.
Фиг.6 показывает структурную схему АРУ, воплощающей аспекты настоящего изобретения. Цифровой звуковой входной сигнал x[n, t] (см. фиг.1) подается в два тракта устройства или последовательности операций АРУ. В тракте управления устройство или последовательность 20 операций «Вычислить уровень» вычисляет измерение звука, которое может быть зависящим от времени мгновенным уровнем сигнала L[t], вычисленным в качестве среднеквадратической мощности каждого блока входного сигнала x[n, t] (см. уравнение 3). Затем мгновенный уровень L[t] сглаживается по времени в устройстве или последовательности 22 операций «Сгладить уровень» для формирования сглаженного среднего уровня звукового сигнала [t] (см. уравнение 4a). В отсутствие перенастройки временное сглаживание может иметь характеристику быстрого нарастания и медленного спада. Сгладить уровень 22 может управляться входом «Сигнала c[t] регулировки постоянной времени» и входом «Инициализировать [t]». Вход сигнала c[t] регулировки постоянной времени может заставлять одну или более из постоянных времени, применяемых в Сгладить уровень 22, изменяться при возникновении перенастройки, как описано выше. Вход инициализировать L[t] может заставлять выход у Сгладить уровень 22 принимать хранимое значение или значение по умолчанию init при возникновении перенастройки, как описано выше. Выход [t] у Сгладить уровень 22 подается в устройство или функцию 24 «Применить функцию F AGC входа/выхода» и в устройство или функцию 26 «Вычислить коэффициент усиления». Устройство или функция 24 применяет функцию, описанную в связи с фиг.4 для выдачи требуемого выходного уровня out[t] (см. уравнение 5). Вычислить коэффициент усиления 26 вычисляет коэффициент G[t] усиления по перепаду между выходным уровнем out[t] и входным уровнем [t] (см. уравнение 6). Когда out[t]>[t], коэффициент усиления является большим чем единица, означая, что сигнал усиливается, а когда out[t]< [t], коэффициент усиления является меньшим чем единица, означая, что сигнал ослабляется. Зависящий от времени коэффициент G[t] усиления, параметр модификации, затем подается в устройство или последовательность 28 операций «Умножить», где он затем перемножается с каждым блоком сигнала x[n,t] для создания модифицированного звукового сигнала y[n+tN/2] (см. уравнение 2). Хотя, как описано, параметр G[t] модификации коэффициента усиления является независящим от частоты, может вычислять зависящий от частоты параметр G[b, t] модификации коэффициента усиления, в котором b является индексом полосы. В этом случае Вычислить уровень 20 может вычислять зависящий от частоты мгновенный уровень L[b,t] сигнала, Сгладить уровень 22 может выдавать зависящий от частоты выходной сигнал [b,t] (его входы управления Сигнал c[t] регулировки постоянной времени и Инициализировать L[t] также могут быть зависящими от частоты), Применить функцию F AGC может применять зависящую от частоты функцию, а Вычислить коэффициент усиления 26 выдает зависящий от частоты изменяющийся во времени коэффициент G[b,t] усиления.
Реализация
Изобретение может быть реализовано в аппаратных средствах или программном обеспечении либо сочетании обоих (например, программируемых логических матрицах). Если не указан иной способ действий, алгоритмы, включенные в состав в качестве части изобретения, по своей природе, не имеют отношения к какому бы то ни было конкретному компьютеру или другому устройству. В частности, различные машины общего применения могут использоваться с программами, написанными в соответствии с доктринами, приведенными в материалах настоящей заявки, или может быть более удобным сконструировать более специализированное устройство (например, интегральные схемы) для выполнения требуемых этапов способа. Таким образом, изобретение может быть реализовано в одной или более компьютерных программах, выполняющихся в одной или более программируемых компьютерных системах, каждая из которых содержит по меньшей мере один процессор, по меньшей мере одну систему хранения данных (в том числе энергозависимую и энергонезависимую память и/или запоминающие элементы), по меньшей мере одно устройство или порт ввода и по меньшей мере одно устройство или порт вывода. Управляющая программа применяется к входным данным для выполнения функций, описанных в материалах настоящей заявки, и формирует выходную информацию. Выходная информация подводится в одно или более устройств вывода известным образом.
Каждая такая программа может быть реализована на любом желательном компьютерном языке (включая машинные, компоновочные или высокоуровневые процедурные, логические или объектно-ориентированные языки программирования) для общения с компьютерной системой. В любом случае язык может быть компилируемым или интерпретируемым языком.
Каждая такая компьютерная программа предпочтительно хранится на или загружается в запоминающие носители или устройство (например, твердотельную память или носители либо магнитные или оптические носители), удобочитаемые программируемым компьютером общего применения или специального назначения, для конфигурирования и управления компьютером, когда запоминающие носители или устройства считываются компьютерной системой, чтобы выполнять процедуры, описанные в материалах настоящей заявки. Обладающая признаками изобретения система также может считаться реализуемой в качестве машиночитаемого запоминающего носителя, сконфигурированного компьютерной программой, где запоминающий носитель, сконфигурированный таким образом, побуждает компьютерную систему работать специальным и предопределенным образом для выполнения функций, описанных в материалах настоящей заявки.
Было описано некоторое количество вариантов осуществления изобретения. Тем не менее, будет понятно, что различные модификации могут быть произведены не выходя из сущности и объема изобретения. Например, некоторые из этапов, описанных в материалах настоящей заявки, могут быть независящими от очередности и таким образом могут выполняться в очередности, отличной от той, которая описана.
Claims (14)
1. Способ обработки звукового сигнала, состоящий в том, что:
меняют динамические свойства звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств,
обнаруживают первый тип события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Ldrop, в пределах временного интервала, не большего чем пороговое значение времени, tdrop, при этом упомянутое обнаружение обнаруживает снижение уровня звукового сигнала во множестве полос частот, и
перенастраивают последовательность операций регулировки динамических свойств в ответ на обнаружение такого первого типа изменения.
меняют динамические свойства звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств,
обнаруживают первый тип события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Ldrop, в пределах временного интервала, не большего чем пороговое значение времени, tdrop, при этом упомянутое обнаружение обнаруживает снижение уровня звукового сигнала во множестве полос частот, и
перенастраивают последовательность операций регулировки динамических свойств в ответ на обнаружение такого первого типа изменения.
2. Способ по п.1, дополнительно содержащий этапы, на которых обнаруживают второй тип события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, Lsilence, на всем протяжении временного интервала, не меньшего чем другое пороговое значение времени, tsilence, и
перенастраивают последовательность операций регулировки динамических свойств в ответ на обнаружение такого второго типа изменения.
перенастраивают последовательность операций регулировки динамических свойств в ответ на обнаружение такого второго типа изменения.
3. Способ по п.1, в котором перенастройка последовательности операций регулировки динамических свойств убыстряет скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале.
4. Способ по п.1, в котором перенастройка последовательности операций регулировки динамических свойств устанавливает значение одного или более параметров управления последовательностью операций или сигнал, функцией которого являются такие один или более параметров управления последовательностью операций, в хранимое значение или значение по умолчанию.
5. Способ по п.1, в котором перенастройка последовательности операций регулировки динамических свойств уменьшает значение одной или более постоянных времени, применяемых при определении одного или более параметров управления последовательностью операций, или сигнала, функцией которого являются такие один или более параметров управления последовательностью операций.
6. Способ по п.1, дополнительно содержащий этапы, на которых
принимают подаваемый извне сигнал запуска перенастройки, указывающий изменение в звуковом сигнале, и перенастраивают последовательность операций регулировки динамических свойств в ответ на сигнал запуска перенастройки.
принимают подаваемый извне сигнал запуска перенастройки, указывающий изменение в звуковом сигнале, и перенастраивают последовательность операций регулировки динамических свойств в ответ на сигнал запуска перенастройки.
7. Способ по п.6, в котором сигнал запуска перенастройки указывает одно или более из
действия пользователя, изменяющего канал,
действия пользователя, изменяющего источники входного сигнала,
действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед,
переключения с одного файла на другой,
изменения программы,
переключения с одного формата кодирования звука на другой, и
изменения параметров кодирования.
действия пользователя, изменяющего канал,
действия пользователя, изменяющего источники входного сигнала,
действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед,
переключения с одного файла на другой,
изменения программы,
переключения с одного формата кодирования звука на другой, и
изменения параметров кодирования.
8. Устройство обработки звукового сигнала, содержащее
средство изменения динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств,
средство обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Ldrop, в пределах временного интервала, не большего чем пороговое значение времени, tdrop, при этом упомянутое средство обнаружения обнаруживает снижение уровня звукового сигнала во множестве полос частот, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения.
средство изменения динамических свойств звукового сигнала в соответствии с последовательностью операций регулировки динамических свойств,
средство обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала снижается на величину, большую чем порог различимости, Ldrop, в пределах временного интервала, не большего чем пороговое значение времени, tdrop, при этом упомянутое средство обнаружения обнаруживает снижение уровня звукового сигнала во множестве полос частот, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения.
9. Устройство по п.8, дополнительно содержащее
средство обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, Lsilence, на всем протяжении временного интервала, не меньшего чем другое пороговое значение времени, tsilence, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения.
средство обнаружения события во временном развитии звукового сигнала, при котором уровень звукового сигнала остается ниже порогового значения, Lsilence, на всем протяжении временного интервала, не меньшего чем другое пороговое значение времени, tsilence, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на обнаружение такого изменения.
10. Устройство по п.8, в котором упомянутое средство перенастройки последовательности операций регулировки динамических свойств убыстряет скорость, с которой обработка динамических свойств адаптируется к изменениям во входном сигнале.
11. Устройство по п.8, в котором упомянутое средство для перенастройки последовательности операций регулировки динамических свойств устанавливает значение одного или более параметров управления последовательностью операций или сигнал, функцией которого являются такие один или более параметров управления последовательностью операций, в хранимое значение или значение по умолчанию.
12. Устройство по п.8, в котором упомянутое средство перенастройки последовательности операций регулировки динамических свойств уменьшает значение одной или более постоянных времени, применяемых при определении одного или более параметров управления последовательностью операций, или сигнала, функцией которого являются такие один или более параметров управления последовательностью операций.
13. Устройство по п.8, дополнительно содержащее
средство приема подаваемого извне сигнала запуска перенастройки, указывающего изменение в звуковом сигнале, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на сигнал запуска перенастройки.
средство приема подаваемого извне сигнала запуска перенастройки, указывающего изменение в звуковом сигнале, и
средство перенастройки последовательности операций регулировки динамических свойств в ответ на сигнал запуска перенастройки.
14. Устройство по п.13, в котором сигнал запуска перенастройки указывает одно или более из
действия пользователя, изменяющего канал, действия пользователя, изменяющего источники входного сигнала,
действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед,
переключения с одного файла на другой,
изменения программы,
переключения с одного формата кодирования звука на другой, и
изменения параметров кодирования.
действия пользователя, изменяющего канал, действия пользователя, изменяющего источники входного сигнала,
действия пользователя, выбирающего функцию воспроизведения, перемотки назад или перемотки вперед,
переключения с одного файла на другой,
изменения программы,
переключения с одного формата кодирования звука на другой, и
изменения параметров кодирования.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US85312706P | 2006-10-20 | 2006-10-20 | |
US60/853,127 | 2006-10-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2009118955A RU2009118955A (ru) | 2010-11-27 |
RU2413357C2 true RU2413357C2 (ru) | 2011-02-27 |
Family
ID=38961076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009118955/09A RU2413357C2 (ru) | 2006-10-20 | 2007-09-25 | Обработка динамических свойств аудио с использованием перенастройки |
Country Status (16)
Country | Link |
---|---|
US (1) | US8849433B2 (ru) |
EP (1) | EP2082480B1 (ru) |
JP (1) | JP4940308B2 (ru) |
KR (1) | KR101137715B1 (ru) |
CN (1) | CN101529721B (ru) |
AU (1) | AU2007309691B2 (ru) |
BR (1) | BRPI0717484B1 (ru) |
CA (1) | CA2665153C (ru) |
IL (1) | IL197856A (ru) |
MX (1) | MX2009004175A (ru) |
MY (1) | MY144271A (ru) |
NO (1) | NO342161B1 (ru) |
RU (1) | RU2413357C2 (ru) |
TW (1) | TWI415481B (ru) |
UA (1) | UA94968C2 (ru) |
WO (1) | WO2008051347A2 (ru) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
DE602007011594D1 (de) | 2006-04-27 | 2011-02-10 | Dolby Lab Licensing Corp | Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke |
JP4940308B2 (ja) | 2006-10-20 | 2012-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | リセットを用いるオーディオダイナミクス処理 |
US9009032B2 (en) * | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
US8396574B2 (en) | 2007-07-13 | 2013-03-12 | Dolby Laboratories Licensing Corporation | Audio processing using auditory scene analysis and spectral skewness |
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
CN101608947B (zh) * | 2008-06-19 | 2012-05-16 | 鸿富锦精密工业(深圳)有限公司 | 声音测试方法 |
US20090323985A1 (en) * | 2008-06-30 | 2009-12-31 | Qualcomm Incorporated | System and method of controlling power consumption in response to volume control |
US8761415B2 (en) | 2009-04-30 | 2014-06-24 | Dolby Laboratories Corporation | Controlling the loudness of an audio signal in response to spectral localization |
EP2425426B1 (en) | 2009-04-30 | 2013-03-13 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
TWI503816B (zh) | 2009-05-06 | 2015-10-11 | Dolby Lab Licensing Corp | 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術 |
JPWO2010131470A1 (ja) * | 2009-05-14 | 2012-11-01 | シャープ株式会社 | ゲイン制御装置及びゲイン制御方法、音声出力装置 |
US8406431B2 (en) * | 2009-07-23 | 2013-03-26 | Sling Media Pvt. Ltd. | Adaptive gain control for digital audio samples in a media stream |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
GB0919672D0 (en) * | 2009-11-10 | 2009-12-23 | Skype Ltd | Noise suppression |
GB0919673D0 (en) * | 2009-11-10 | 2009-12-23 | Skype Ltd | Gain control for an audio signal |
KR20110065095A (ko) * | 2009-12-09 | 2011-06-15 | 삼성전자주식회사 | 디바이스를 제어하는 방법 및 그 장치 |
CN102098606A (zh) * | 2009-12-10 | 2011-06-15 | 腾讯科技(深圳)有限公司 | 一种音量动态调节的方法及装置 |
JP5650227B2 (ja) * | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP5707219B2 (ja) * | 2011-05-13 | 2015-04-22 | 富士通テン株式会社 | 音響制御装置 |
JP5702666B2 (ja) * | 2011-05-16 | 2015-04-15 | 富士通テン株式会社 | 音響装置および音量補正方法 |
US20120294459A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function |
US20120294457A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function |
EP2714184B1 (en) * | 2011-05-26 | 2017-05-10 | Advanced Bionics AG | Systems for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels |
FR2976748B1 (fr) * | 2011-06-17 | 2013-12-27 | Arkamys | Procede de normalisation de la puissance d'un signal sonore et dispositif de traitement associe. |
EP2624449B1 (en) * | 2012-02-01 | 2016-12-07 | Harman Becker Automotive Systems GmbH | Peak detection when adapting a signal gain based on signal loudness |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US10027303B2 (en) * | 2012-11-13 | 2018-07-17 | Snell Advanced Media Limited | Management of broadcast audio loudness |
TWI528777B (zh) | 2012-12-28 | 2016-04-01 | 鴻海精密工業股份有限公司 | 音量調節方法與系統 |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
CN103745734B (zh) * | 2014-01-02 | 2017-01-11 | 青岛海信电器股份有限公司 | 一种设置声音曲线的设备及方法 |
WO2018231185A1 (ru) * | 2017-06-16 | 2018-12-20 | Василий Васильевич ДУМА | Способ синхронизации звуковых сигналов |
CN113037428B (zh) * | 2019-12-09 | 2022-01-25 | 大唐移动通信设备有限公司 | 一种对数据流程的处理方法及装置 |
Family Cites Families (146)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2808475A (en) | 1954-10-05 | 1957-10-01 | Bell Telephone Labor Inc | Loudness indicator |
US4281218A (en) | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
DE3314570A1 (de) | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
US4739514A (en) | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
US4887299A (en) | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
GB2215927A (en) | 1988-03-16 | 1989-09-27 | British Broadcasting Corp | Improvements to RDS radio receivers |
US4953112A (en) * | 1988-05-10 | 1990-08-28 | Minnesota Mining And Manufacturing Company | Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model |
US5027410A (en) | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
JPH02118322U (ru) | 1989-03-08 | 1990-09-21 | ||
US5097510A (en) | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
US5369711A (en) * | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
WO1992012607A1 (en) | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
EP0517233B1 (en) | 1991-06-06 | 1996-10-30 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
US5278912A (en) | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
JPH0590857A (ja) | 1991-09-28 | 1993-04-09 | Victor Co Of Japan Ltd | 音響効果装置 |
US5363147A (en) | 1992-06-01 | 1994-11-08 | North American Philips Corporation | Automatic volume leveler |
JPH065212U (ja) * | 1992-06-15 | 1994-01-21 | 国際電気株式会社 | Am・fm用受信機のagc回路 |
JP2727883B2 (ja) * | 1992-08-20 | 1998-03-18 | ヤマハ株式会社 | 楽音合成装置 |
DE4335739A1 (de) | 1992-11-17 | 1994-05-19 | Rudolf Prof Dr Bisping | Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen |
GB2272615A (en) * | 1992-11-17 | 1994-05-18 | Rudolf Bisping | Controlling signal-to-noise ratio in noisy recordings |
US5548638A (en) | 1992-12-21 | 1996-08-20 | Iwatsu Electric Co., Ltd. | Audio teleconferencing apparatus |
US5457769A (en) | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5706352A (en) | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
US5434922A (en) | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
BE1007355A3 (nl) | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
IN184794B (ru) | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP2986345B2 (ja) | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
ZA95605B (en) * | 1994-04-28 | 1995-12-20 | Qualcomm Inc | Method and apparatus for automatic gain control and dc offset cancellation in quadrature receiver |
TW247390B (en) | 1994-04-29 | 1995-05-11 | Audio Products Int Corp | Apparatus and method for adjusting levels between channels of a sound system |
JPH07307058A (ja) | 1994-05-10 | 1995-11-21 | Sony Corp | レベルコントロール回路及び録音装置 |
US5422602A (en) * | 1994-06-20 | 1995-06-06 | Aphex Systems, Ltd. | Frequency discriminate leveler |
US5500902A (en) | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
GB9419388D0 (en) | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
US5682463A (en) | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
CA2167748A1 (en) | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
DK0661905T3 (da) | 1995-03-13 | 2003-04-07 | Phonak Ag | Fremgangsmåde til tilpasnning af et høreapparat, anordning hertil og høreapparat |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US6301555B2 (en) | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
AU5663296A (en) | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
US5601617A (en) | 1995-04-26 | 1997-02-11 | Advanced Bionics Corporation | Multichannel cochlear prosthesis with flexible control of stimulus waveforms |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5663727A (en) | 1995-06-23 | 1997-09-02 | Hearing Innovations Incorporated | Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same |
US5712954A (en) | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
US6002776A (en) | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5907622A (en) | 1995-09-21 | 1999-05-25 | Dougherty; A. Michael | Automatic noise compensation system for audio reproduction equipment |
US5642075A (en) * | 1995-12-21 | 1997-06-24 | Itt Corporation | Sampled data automatic gain control |
US6108431A (en) | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
US6327366B1 (en) | 1996-05-01 | 2001-12-04 | Phonak Ag | Method for the adjustment of a hearing device, apparatus to do it and a hearing device |
US6430533B1 (en) | 1996-05-03 | 2002-08-06 | Lsi Logic Corporation | Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation |
JPH09312540A (ja) | 1996-05-23 | 1997-12-02 | Pioneer Electron Corp | ラウドネスボリュームコントロール装置 |
JP3765622B2 (ja) | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
EP0820212B1 (de) | 1996-07-19 | 2010-04-21 | Bernafon AG | Lautheitsgesteuerte Verarbeitung akustischer Signale |
US5832444A (en) * | 1996-09-10 | 1998-11-03 | Schmidt; Jon C. | Apparatus for dynamic range compression of an audio signal |
JP2953397B2 (ja) | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
US5903655A (en) * | 1996-10-23 | 1999-05-11 | Telex Communications, Inc. | Compression systems for hearing aids |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US5923710A (en) * | 1997-02-05 | 1999-07-13 | Tektronix, Inc. | Synchronous switching of digital audio while maintaining block alignment |
US5862228A (en) | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
US6535846B1 (en) * | 1997-03-19 | 2003-03-18 | K.S. Waves Ltd. | Dynamic range compressor-limiter and low-level expander with look-ahead for maximizing and stabilizing voice level in telecommunication applications |
DE19713862A1 (de) * | 1997-04-04 | 1998-10-08 | Bosch Gmbh Robert | Verfahren zur automatischen Lautstärkesteuerung in einer Audiosignal-Wiedergabevorrichtung und Anordnung dazu |
US6792119B1 (en) * | 1997-05-05 | 2004-09-14 | Koninklijke Philips Electronics N.V. | Audio system |
US6125343A (en) | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
US6272360B1 (en) | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
US6185309B1 (en) * | 1997-07-11 | 2001-02-06 | The Regents Of The University Of California | Method and apparatus for blind separation of mixed and convolved sources |
KR100261904B1 (ko) | 1997-08-29 | 2000-07-15 | 윤종용 | 헤드폰 사운드 출력장치 |
US6088461A (en) | 1997-09-26 | 2000-07-11 | Crystal Semiconductor Corporation | Dynamic volume control system |
US6233554B1 (en) | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6298139B1 (en) | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US6353671B1 (en) | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6311155B1 (en) | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US6498855B1 (en) | 1998-04-17 | 2002-12-24 | International Business Machines Corporation | Method and system for selectively and variably attenuating audio data |
EP1086607B2 (en) | 1998-06-08 | 2012-04-11 | Cochlear Limited | Hearing instrument |
EP0980064A1 (de) | 1998-06-26 | 2000-02-16 | Ascom AG | Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen |
GB2340351B (en) | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6823303B1 (en) | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6411927B1 (en) | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
FI113935B (fi) | 1998-09-25 | 2004-06-30 | Nokia Corp | Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä |
DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
US6314396B1 (en) | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
EP1089242B1 (en) | 1999-04-09 | 2006-11-08 | Texas Instruments Incorporated | Supply of digital audio and video products |
AU4278300A (en) | 1999-04-26 | 2000-11-10 | Dspfactory Ltd. | Loudness normalization control for a digital hearing aid |
US6263371B1 (en) | 1999-06-10 | 2001-07-17 | Cacheflow, Inc. | Method and apparatus for seaming of streaming content |
US6442278B1 (en) | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
US6985594B1 (en) | 1999-06-15 | 2006-01-10 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment |
US6675125B2 (en) * | 1999-11-29 | 2004-01-06 | Syfx | Statistics generator system and method |
FR2802329B1 (fr) | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
US6351733B1 (en) | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
DE10018666A1 (de) | 2000-04-14 | 2001-10-18 | Harman Audio Electronic Sys | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
US6889186B1 (en) | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
AUPQ952700A0 (en) * | 2000-08-21 | 2000-09-14 | University Of Melbourne, The | Sound-processing strategy for cochlear implants |
JP3448586B2 (ja) | 2000-08-29 | 2003-09-22 | 独立行政法人産業技術総合研究所 | 聴覚障害を考慮した音の測定方法およびシステム |
US6625433B1 (en) | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
US6807525B1 (en) | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
EP1206104B1 (en) | 2000-11-09 | 2006-07-19 | Koninklijke KPN N.V. | Measuring a talking quality of a telephone link in a telecommunications network |
US7457422B2 (en) | 2000-11-29 | 2008-11-25 | Ford Global Technologies, Llc | Method and implementation for detecting and characterizing audible transients in noise |
FR2820573B1 (fr) | 2001-02-02 | 2003-03-28 | France Telecom | Methode et dispositif de traitement d'une pluralite de flux binaires audio |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
DE10107385A1 (de) | 2001-02-16 | 2002-09-05 | Harman Audio Electronic Sys | Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken |
US6915264B2 (en) | 2001-02-22 | 2005-07-05 | Lucent Technologies Inc. | Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding |
US7194100B2 (en) | 2001-04-10 | 2007-03-20 | Phonak Ag | Method for individualizing a hearing aid |
US7610205B2 (en) | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7461002B2 (en) | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7283954B2 (en) | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
ATE318062T1 (de) | 2001-04-18 | 2006-03-15 | Gennum Corp | Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7242784B2 (en) * | 2001-09-04 | 2007-07-10 | Motorola Inc. | Dynamic gain control of audio in a communication device |
US7177803B2 (en) | 2001-10-22 | 2007-02-13 | Motorola, Inc. | Method and apparatus for enhancing loudness of an audio signal |
JP3899904B2 (ja) | 2001-11-16 | 2007-03-28 | 日本ビクター株式会社 | オートマチックレベルコントロール回路 |
US20040037421A1 (en) | 2001-12-17 | 2004-02-26 | Truman Michael Mead | Parital encryption of assembled bitstreams |
US7068723B2 (en) | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
EP1500084B1 (en) | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP4257079B2 (ja) | 2002-07-19 | 2009-04-22 | パイオニア株式会社 | 周波数特性調整装置および周波数特性調整方法 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
JP2004133051A (ja) * | 2002-10-08 | 2004-04-30 | Wave Come:Kk | 音声入力装置 |
DE602004023917D1 (de) | 2003-02-06 | 2009-12-17 | Dolby Lab Licensing Corp | Kontinuierliche audiodatensicherung |
DE10308483A1 (de) | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
US7590251B2 (en) * | 2003-03-21 | 2009-09-15 | D2Audio Corporation | Clip detection in PWM amplifier |
US7551745B2 (en) | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
KR101164937B1 (ko) | 2003-05-28 | 2012-07-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램 |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
GB2413906A (en) | 2004-04-21 | 2005-11-09 | Imagination Tech Ltd | Radio volume control system |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8265295B2 (en) | 2005-03-11 | 2012-09-11 | Rane Corporation | Method and apparatus for identifying feedback in a circuit |
US7844059B2 (en) * | 2005-03-16 | 2010-11-30 | Microsoft Corporation | Dereverberation of multi-channel audio streams |
DK1869948T3 (en) * | 2005-03-29 | 2016-05-02 | Gn Resound As | Hearing aid with adaptive compressor time constants |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
JP4981123B2 (ja) | 2006-04-04 | 2012-07-18 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整 |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
CN101410892B (zh) | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
DE602007011594D1 (de) | 2006-04-27 | 2011-02-10 | Dolby Lab Licensing Corp | Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke |
US7813825B2 (en) * | 2006-07-10 | 2010-10-12 | Apple Inc. | Multiband dynamic range control graphical interface |
JP4940308B2 (ja) | 2006-10-20 | 2012-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | リセットを用いるオーディオダイナミクス処理 |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
JP4938862B2 (ja) | 2007-01-03 | 2012-05-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ハイブリッドデジタル/アナログラウドネス補償音量調節 |
EP2130019B1 (en) | 2007-03-19 | 2013-01-02 | Dolby Laboratories Licensing Corporation | Speech enhancement employing a perceptual model |
EP2162879B1 (en) | 2007-06-19 | 2013-06-05 | Dolby Laboratories Licensing Corporation | Loudness measurement with spectral modifications |
EP2009786B1 (en) * | 2007-06-25 | 2015-02-25 | Harman Becker Automotive Systems GmbH | Feedback limiter with adaptive control of time constants |
-
2007
- 2007-09-25 JP JP2009533304A patent/JP4940308B2/ja active Active
- 2007-09-25 US US12/442,359 patent/US8849433B2/en active Active
- 2007-09-25 EP EP07838861.8A patent/EP2082480B1/en active Active
- 2007-09-25 WO PCT/US2007/020747 patent/WO2008051347A2/en active Application Filing
- 2007-09-25 AU AU2007309691A patent/AU2007309691B2/en active Active
- 2007-09-25 MY MYPI20091346A patent/MY144271A/en unknown
- 2007-09-25 KR KR1020097010325A patent/KR101137715B1/ko active IP Right Grant
- 2007-09-25 BR BRPI0717484-5A patent/BRPI0717484B1/pt active IP Right Grant
- 2007-09-25 CA CA2665153A patent/CA2665153C/en active Active
- 2007-09-25 CN CN2007800385943A patent/CN101529721B/zh active Active
- 2007-09-25 MX MX2009004175A patent/MX2009004175A/es active IP Right Grant
- 2007-09-25 UA UAA200904964A patent/UA94968C2/ru unknown
- 2007-09-25 RU RU2009118955/09A patent/RU2413357C2/ru active
- 2007-09-29 TW TW096136545A patent/TWI415481B/zh active
-
2009
- 2009-03-26 IL IL197856A patent/IL197856A/en active IP Right Grant
- 2009-04-17 NO NO20091518A patent/NO342161B1/no unknown
Also Published As
Publication number | Publication date |
---|---|
BRPI0717484A2 (pt) | 2013-10-15 |
NO20091518L (no) | 2009-05-18 |
JP2010507330A (ja) | 2010-03-04 |
IL197856A (en) | 2014-03-31 |
EP2082480A2 (en) | 2009-07-29 |
CN101529721B (zh) | 2012-05-23 |
NO342161B1 (no) | 2018-04-09 |
KR20090078834A (ko) | 2009-07-20 |
AU2007309691A1 (en) | 2008-05-02 |
UA94968C2 (ru) | 2011-06-25 |
TWI415481B (zh) | 2013-11-11 |
MX2009004175A (es) | 2009-04-30 |
TW200830890A (en) | 2008-07-16 |
JP4940308B2 (ja) | 2012-05-30 |
EP2082480B1 (en) | 2019-07-24 |
AU2007309691B2 (en) | 2011-03-10 |
WO2008051347A3 (en) | 2008-07-17 |
US20100198377A1 (en) | 2010-08-05 |
RU2009118955A (ru) | 2010-11-27 |
CA2665153A1 (en) | 2008-05-02 |
CA2665153C (en) | 2015-05-19 |
BRPI0717484B1 (pt) | 2019-05-21 |
MY144271A (en) | 2011-08-29 |
KR101137715B1 (ko) | 2012-04-25 |
US8849433B2 (en) | 2014-09-30 |
CN101529721A (zh) | 2009-09-09 |
WO2008051347A2 (en) | 2008-05-02 |
IL197856A0 (en) | 2009-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2413357C2 (ru) | Обработка динамических свойств аудио с использованием перенастройки | |
TWI600273B (zh) | 即時調整音訊訊號之響度的系統與方法 | |
KR101735416B1 (ko) | 오디오 라우드니스 제어 시스템 | |
AU2003263845B2 (en) | Controlling loudness of speech in signals that contain speech and other types of audio material | |
US8615095B2 (en) | Automatic volume control for audio signals | |
US10355657B1 (en) | Loudness level and range processing | |
EP3092640B1 (en) | Signal quality-based enhancement and compensation of compressed audio signals | |
US10594284B2 (en) | System and method for controlling volume | |
CN114902560B (zh) | 具有环境噪音补偿的用于自动音量控制的设备和方法 | |
US10741196B2 (en) | Signal quality-based enhancement and compensation of compressed audio signals | |
EP3379847B1 (en) | Audio device, speaker device, and audio signal processing method | |
US11792487B2 (en) | Audio device with learning and adaptive quiet mode capabilities | |
GB2559858A (en) | Audio processing apparatus and method of controlling same |