RU2124272C1 - Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов - Google Patents

Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов Download PDF

Info

Publication number
RU2124272C1
RU2124272C1 RU96107254A RU96107254A RU2124272C1 RU 2124272 C1 RU2124272 C1 RU 2124272C1 RU 96107254 A RU96107254 A RU 96107254A RU 96107254 A RU96107254 A RU 96107254A RU 2124272 C1 RU2124272 C1 RU 2124272C1
Authority
RU
Russia
Prior art keywords
encoding
signal
coding
error
signals
Prior art date
Application number
RU96107254A
Other languages
English (en)
Other versions
RU96107254A (ru
Inventor
Херре Юрген
Грилл Бернхард
Эберлайн Эрнст
Бранденбург Карлхайнц
Зайтцер Дитер
Original Assignee
Фраунхофер-Гезельшафт цур Фердерунг дер Ангевандтен Форшунг Е.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE4345171A external-priority patent/DE4345171C2/de
Application filed by Фраунхофер-Гезельшафт цур Фердерунг дер Ангевандтен Форшунг Е.В. filed Critical Фраунхофер-Гезельшафт цур Фердерунг дер Ангевандтен Форшунг Е.В.
Publication of RU96107254A publication Critical patent/RU96107254A/ru
Application granted granted Critical
Publication of RU2124272C1 publication Critical patent/RU2124272C1/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

При кодировании нескольких сигналов (k1 k2), которые не являются независимыми друг от друга, выбор пригодного вида кодирования зависит от степени подобия. Согласно одному аспекту изобретения степень подобия определяется таким образом, что один из сигналов (k1, k2) сначала кодируется, а затем декодируется по способу "Интенсити-стерео" для того, чтобы создать содержащий ошибку кодирования сигнал (k1, k2), после чего этот и принадлежащий ему некодированный сигнал преобразуются в частотную область. В частотной области производится отбор или оценка фактически слышимых спектральных компонентов как содержащего ошибку кодирования сигнала (k1, k2), так и принадлежащего ему не содержащего ошибку кодирования сигнала (k1, k2) с применением прослушивательного порога, который найден путем психоакустического расчета. При высокой степени подобия производится кодирование методом "Интенсити-стерео", а в остальных случаях осуществляется раздельное кодирование каналов. Технический результат заключается в повышении качества кодированных данных и достижении уплотнения данных. 3 с. и 6 з.п.ф-лы, 7 ил.

Description

Изобретение относится к способу определения того вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов, при котором каждый сигнал преобразуется в частотную область и, исходя из спектральных значений, вычисляется степень подобия для по меньшей мере двух сигналов друг относительно друга согласно ограничительной части пунктов 1 и 2 формулы изобретения.
В частности, изобретение относится к оптимизированному выбору кодирования двух или нескольких сигналов, из которых по меньшей мере два не являются независимыми друг от друга, а содержат по меньшей мере частично избыточную или несущественную информацию.
Вообще при данном способе уплотненного кодирования цифровых аудиосигналов сигналы преобразуются из области времени сначала в частотную область. Если речь идет о сигналах, которые не являются независимыми друг от друга, то обычно используется уплотненное кодирования, которое учитывает избыточность между обоими или несколькими сигналами.
Кодирование такого рода известно под названием "средне-бокового" кодирования (J.D.Johnston, "Perceptual" Transform Coding of Wideband Stereo Signal, ICASPP, 1989, p. 1993-1996). При таком "средне-боковом" кодировании на базе левого и правого каналов кодируется, с одной стороны, сумма или середина, а с другой стороны, разность или разнобокость стереосигнала.
Другим применяемым в настоящее время способом кодирования является метод "Интенсити-стерео", который описан в публикации "Subband Coding of Stertophone Digital Audio Signal" Proc. of the ICASPP, 1991, IEEE, Toronto. p. 3601-3604. При этом методе на базе обоих сигналов образуется моносигнал и с дополнительной информацией передается через лево-правое распределение сигнала.
Уже в германском патенте DE 4136825 C1 указано, что при таком способе могут возникнуть сильные искажения, если сигналы имеют лишь сравнительно малое сходство или почти полностью независимы друг от друга. Так, например, известно, что сильно различающийся состав сигналов в левом и правом каналах при "средне-боковом" кодировании приводит к искажениям, которые нельзя подавить фактически имеющимся в канале сигналом. При применении метода "Интенсити-стерео" может произойти разрушение пространственного звучания, если левый и правый каналы имеют заметно различающиеся между собой спектральные значения.
Для того, чтобы решить эту проблему, в этом патенте предлагается на базе спектральных значений сигналов, преобразованных в частотную область, определить степень подобия, на основании которой производится переключение от одного вида кодирования к другому.
Если спектральные значения характеризуются высокой степенью подобия, то при описанном там способе применяется "средне-боковое" кодирование, тогда как в случае малой степени подобия и следовательно при малом спектральном подобии рассматриваемых каналов производится раздельное кодирование каналов. Также из этого патента известно вычисление на базе кодируемых сигналов психоакустический модели маскировочного порога, при помощи которого подается команда в ступень уплотнения данных, расположенную после ступени "средне-бокового" кодирования и приводящую к уплотнению данных с учетом маскировки.
В патенте DE 4136825 C1 в пункте 3 формулы изобретения, ссылающемся непосредственно на пункт 8, указано лишь, при определении спектрального значения, приводимого к нулю, надо применять маскировочный порог.
Хотя при помощи способа, известного из германского патента 4136825, уже достигается заметное повышение качества по сравнению с неизменным способом "средне-бокового" кодирования, а также неизменным методом "Интенсити-стерео", желательным является дальнейшее повышение качества передаваемых данных при дальнейшем уплотнении скорости передачи данных.
Исходя из этого состояния техники, в основу изобретения положена задача усовершенствовать способ определения того способа кодирования, который следует выбирать при кодировании по меньшей мере двух сигналов таким образом, чтобы при повышении качества кодированных данных или повышении качества сигналов, декодированных на базе этих данных, достигнуть дальнейшего уплотнения данных.
Эта задача решается способом согласно пп. 1, 2 и 3 формулы изобретения.
Согласно первому аспекту изобретения производится не только частотное преобразование обоих сигналов, кодируемых по одному из двух видов кодирования для образования соответствующих спектральных значений, но одновременно по меньшей мере один из сигналов подвергается такому виду кодирования, который применяется в случае выявления высокой степени подобия, и затем опять декодируется для того, чтобы создать по меньшей мере один содержащий ошибки кодирования сигнал, который затем тоже преобразуется в частотную область.
После этого при помощи прослушивательного порога, определенного путем психоакустического расчета, отбираются или оцениваются конкретные фактически слышимые спектральные компоненты, исходя как из спектральных значений сигнала, содержащего ошибки кодирования, так и из спектральных значений сигнала, принадлежащего к этому содержащему ошибки кодирования сигналу.
В заключение степень подобия, на основании которой выбирается один из по меньшей мере двух видов кодирования, рассчитывается на основании отобранных таким образом слышимых спектральных компонентов по меньшей мере сигнала, содержащего ошибку кодирования, и принадлежащего ему сигнала.
Согласно второму аспекту изобретения производится не только частотное преобразование обоих сигналов, кодируемых по одному из двух видов кодирования, для образования соответствующих спектральных значений, но одновременно по меньшей мере один из сигналов после преобразования в частотную область подвергается такому виду кодирования, который применяется в случае выявления высокой степени подобия, и после этого снова декодируется для того, чтобы создать по меньшей мере один содержащий ошибку кодирования сигнал.
Затем при помощи прослушивательного порога, определенного путем психоакустического расчета, отбираются или оцениваются конкретные фактически слышимые спектральные компоненты, исходя как из спектральных значений содержащего ошибку кодирования сигнала, так и из спектральных значений сигнала, принадлежащего к этому содержащему ошибки кодирования сигналу.
В заключение степень подобия, на основании которой выбирается один из по меньшей мере двух видов кодирования, вычисляется на основании отобранных или оцененных таким образом слышимых спектральных компонентов по меньшей мере сигнала, содержащего ошибку кодирования, и принадлежащего ему сигнала.
Тем самым изобретение в отличие от состояния техники использует психоакустическую оценку спектральных компонентов как некоторого сигнала, так и спектральных компонентов соответствующего сигнала, содержащего ошибку кодирования, которая возникает при виде кодирования, уплотняющем данные, для того, чтобы осуществить выбор одного из по меньшей мере двух видов кодирования.
Согласно третьему аспекту изобретения, исходя из спектральных значений двух сигналов, которые соответствуют, например, двум различным каналам, производится отбор или оценка фактически слышимых спектральных компонентов с применением прослушивательного порога, определенного путем психоакустического расчета, после чего степень подобия, с помощью которой выбирается один из по меньшей мере двух видов кодирования, вычисляется на основании выбранных или оцененных таким образом слышимых спектральных компонентов по меньшей мере двух сигналов.
Этот признак изобретения тоже в отличие от состояния техники использует найденный путем психоакустического расчета прослушивательный порог не для уплотнения данных кодированного сигнала или по меньшей мере не только для такого уплотнения, а для определения степени подобия, при помощи которой производится выбор вида кодирования. Эта концепция, которая является общей для трех аспектов изобретения, выражает ясное отличие от существующего состояния техники и позволяет выбирать вид кодирования с психоакустических точек зрения.
Предпочтительные дальнейшие признаки патентуемого способа изложены в дополнительных пунктах формулы изобретения.
Ниже со ссылками на прилагаемые чертежи подробнее объяснены предпочтительные примеры исполнения аппаратуры для осуществления способов согласно данному изобретению.
На фиг. 1а представлен первый пример исполнения аппаратуры для осуществления основных частей способа определения того вида кодирования, который следует выбирать;
на фиг. 1б - второй, лишь незначительно отличающийся от первого, пример исполнения аппаратуры для осуществления основных частей способа определения того вида кодирования, который следует выбирать;
на фиг. 2 -третий пример исполнения аппаратуры для осуществления основных частей патентуемого способа определения того вида кодирования, который следует выбирать;
на фиг. 3 - блок-схема аппаратуры для определения степени подобия на основании выходных сигналов аппаратуры согласно фиг. 1;
на фиг. 4 - блок-схема аппаратуры для определения степени подобия на основании выходных сигналов аппаратуры согласно фиг. 2;
на фиг 5 - отличающаяся от фиг. 3 блок-схема аппаратуры для определения степени подобия на основании выходных сигналов аппаратуры согласно фиг. 1;
на фиг. 6 - блок-схема для наглядного изображения структуры двух первых блоков для каждого сигнала в аппаратуре согласно фиг. 1 и 2 для осуществления преобразования "время-частота" и определения кратковременной энергии;
на фиг. 7 - таблица для более наглядного отображения функций и структуры гибридного или полифазного фильтровального банка для осуществления преобразования, приспособленного к характеристике человеческого слуха с неодинаковой разрешающей способностью по времени и частоте.
На фиг. 1а показана блок-схема аппаратуры для осуществления основных частей способа согласно первому аспекту изобретения для определения того вида кодирования, который следует выбирать. Показанный здесь пример исполнения пригоден для управления переключением от раздельного кодирования двух стереоканалов k1 и k2 к кодированию по методу "Интенсити-стерео", который описан в публикации, указанной ранее.
Здесь следует, однако, отметить, что способ согласно данному изобретению пригоден не только для выбора раздельного кодирования двух стереоканалов k1, k2 или кодирования по методу "Интенсити-стерео", но и для выбора вида кодирования по меньшей мере двух любых видов кодирования, из которых один лучше пригоден по сравнению с невыбранным другим способом для кодирования сигналов, обладающих определенным подобием, благодаря чему достигается более высокое уплотнение битов.
Применение способа согласно данному изобретению, как оно в дальнейшем объяснено в подробностях, ограничивается не только кодированием стереосигналов, например, согласно ISO/MPEG, Layer 1-3, но, например, и для мультиканального кодирования, как оно, например, может быть осуществлено согласно MPEG 2.
Как показано на фиг. 1а, изображенная аппаратура содержит четыре ветви обработки сигналов z1, z2, z3, z4, каждая из которых содержит три совпадающих блока b1, b2, b3.
Блок b1 служит для преобразования "время-частота" на выходной стороне дискретного сигнала времени k1, k2, ki1, ki2. Здесь имеются в виду любые известные способы частотного преобразования для превращения на входной стороне аудиоданных из области времени в частотную или спектральную область. Речь идет о таких, например, способах, как FFT, DCT, MDCT и применении полифазного фильтровального банка или гибридного фильтровального банка.
Однако, как будет подробнее показано ниже, изобретение предпочтительно пользуется способом преобразования с неодинаковой разрешающей способностью по времени и частоте, которая приспособлена к характеристике человеческого слуха. При таких способах, которые сами по себе известны в области психоакустики, только нижние частотные группы имеют совпадающую частоту, а начиная с определенной частоты ширина частотных групп возрастает, как это подробнее показано в таблице на фиг. 7. В соответствии с границей Хейзенберга 0,5 для произведения ширины частотной группы на разрешающую способность последняя с увеличением ширины частотной группы уменьшается.
Во втором блоке b2 полученные в результате преобразования спектральные значения превращаются, например, путем квадрирования и суммирования по соответствующим периодам времени в значения кратковременной энергии для отдельных частотных групповых полос.
Полученные таким образом значения кратковременной энергии для отдельных широт частотных групп отбираются или оцениваются в третьем блоке b3 с применением прослушивательного порога, который получен из психоакустического расчета для данного сигнала, для того, чтобы из реальных значений энергии извлечь только фактически слышимые компоненты, учитывая психоакустический маскировочный эффект.
В блоке b3 можно, хотя это для целей изобретения не является обязательным, осуществить далее внутреннее или дальнейшее отображение для моделирования человеческого внутреннего уха, которое описывает нелинейности человеческого внутреннего уха. Для этого можно, например, применить функции типа (xα), где показатель степени находится в пределах: 0,1 < α < 10.
Описанный расчет производится не только для обоих первичных каналов k1, k2 стереосигнала в двух первых ветвях z1, z2 для того, чтобы получить значения x1, x2. Одновременно эти вычисления производятся для двух содержащих ошибки кодирования сигналов ki1, ki2 с целью образования выходных значений xi1, xi2, причем значения, содержащие ошибки кодирования, из обоих первичных каналов k1, k2 получаются таким образом, что их сначала кодируют при помощи того вид кодирования, который применяется в случае большего подобия, причем этим видом кодирования в предпочтительном примере исполнения является метод "Интенсити-стерео".
Полученные таким образом путем общего кодирования кодированные сигналы декодируются известным образом по методу "Интенсити-стерео" для того, чтобы получить содержащие ошибки кодирования сигналы ki1, ki2.
Определение степени подобия для выбора более целесообразного в каждом конкретном случае вида кодирования на основе выходных сигналов x1, x2, xi1, xi2 может производиться различным образом, как видно из последующего описания с учетом фиг. 3 и 5.
Однако достаточно оценивать только подобие одного из содержащих ошибки кодирования выходных сигналов xi1 или xi2 относительно принадлежащего ему, не содержащего ошибки кодирования сигнала x1 или x2. Величину ошибки между этими спектральными значениями на выходной стороне, на основании которой можно получить степени подобия, можно определить в простейшем случае путем образования разности, хотя этот вид вычисления не является единственно возможным.
На фиг. 1b показан второй, лишь незначительно отличающийся от первого, пример исполнения аппаратуры для осуществления основной части способа для определения того вида кодирования, который следует применять.
В этом примере исполнения изобретения сигналы k1, k2 в третьей и четвертой ветвях z3, z4 сначала преобразуются в блоках b1 в частотную область и только после их преобразования в частотную область подвергаются тому виду кодирования, который применяется в случае выявления высокой степени подобия, а затем снова декодируются для того, чтобы создать два содержащих ошибку кодирования сигнала ki1, ki2.
После этого с помощью прослушивательного порога, полученного путем психоакустического расчета, отбираются или оцениваются конкретные фактически слышимые спектральные компоненты исходя как из спектральных значений xi1, xi2, содержащих ошибку кодирования сигналов ki1, ki2, так и из спектральных значений сигналов, принадлежащих к этим содержащим ошибку кодирования сигналам.
В заключение степень подобия, на основании которой выбирается один из по меньшей мере двух видов кодирования, вычисляется на основании выбранных или оцененных таким образом слышимых спектральных компонентов по меньшей мере сигнала, содержащего ошибки кодирования, и принадлежащего ему сигнала.
Аппаратура для определения степени подобия с целью выбора каждый раз наиболее пригодного способа кодирования по третьему из названных выше патентуемых способов изображена на фиг. 2. Из сравнения с фиг. 1а и фиг. 1б можно увидеть, что аппаратура согласно фиг. 2 полностью соответствует первым двум ветвям z1, z2 согласно фиг. 1а и фиг. 1b.
Третья и четвертая ветвь z3, z4 здесь могут отпасть. Ввиду идентичности первых обеих ветвей z1, z2 не требуется снова объяснять обработку сигналов, производимую блоками этих ветвей. Следовательно, в аппаратуре согласно фиг. 2 на основании обоих первичных каналов k1, k2 путем преобразования "время-частота", образования значений кратковременной энергии и их отбора или оценки получаются фактически слышимые спектральные компоненты x1, x2 первичных каналов k1, k2, причем степень подобия этих фактически слышимых, отобранных или оцененных спектральных компонентов x1, x2 сравнивается с пороговым значением "k".
Если степень подобия превышает пороговое значение "k", выбирается тот вид кодирования, который ввиду более высокого уплотнения данных лучше пригоден для кодирования приблизительно совпадающих стереосигналов. В предпочтительном примере исполнения таким способом может быть метод "Интенсити-стерео". Если степень подобия оказывается ниже порогового значения k, то каналы в предпочтительном примере исполнения кодируются раздельно.
Возможное устройство для обработки выходного сигнала в аппаратуре, изображенной на фиг. 1а и фиг. 1б для осуществления патентуемого способа определения того вида кодирования, который следует выбирать, показано на фиг. 3. Здесь каждый раз спектральные ошибки x1 минут xi1 или x2 или xi2 сравниваются с пороговым значением "k".
Если оба значения ошибок x1 минус xi1 или x2 минус xi2 оказываются ниже порогового значения "k", то применяется более сильно уплотненный данными способ, которым в предпочтительном примере исполнения является метод "Интенсити-стерео".
На фиг. 5 показан измененный пример исполнения аппаратуры для определения степени подобия согласно фиг. 3 на основе выходных сигналов в показанной на фиг. 1а и фиг. 1б аппаратуре для определения того вида кодирования, который следует применять. Оба совпадающих участка схемы содержат каждый раз узловую точку, с которой образуется разность xi1 минус x1 или xi2 минус x2 для создания сигнала ошибки кодирования, а также два блока b4, b5 для суммирования сигналов об ошибке xi1 минус x1 или xi2 минус x2, а также соответствующие используемые сигналы x1 и x2 для каждого сигнального блока.
После абсолютного суммирования по блокам этих ошибок и используемых сигнальных компонентов в следующем блоке b6 образуется частное путем деления суммированного абсолютного сигнала ошибки на суммированный абсолютный используемый сигнал и сравнивается с пороговым значением "k". Если относительная величина ошибки в одном из обоих каналов превосходит порог "k", то нельзя производить кодирование по способу "Интенсити-стерео", а надо применять раздельное кодирование.
На фиг. 6 показана возможная форма исполнения блоков b1 и b2 ветви z1, z2 или z1-z4 согласно фиг. 1а, 1б и 2. Следует, однако, отметить, что как преобразование "время-частота" дискретных аудиосигналов, так и образование значений кратковременной энергии являются мерами, которые известны специалистам в области кодирования, но не в области выбора вида кодирования.
Как показано на фиг. 6, дискретные входные сигналы подводятся в полифазный фильтровальный банк PF, который производит преобразование "время-частота" дискретного во времени входного сигнала в 32 (от 0 до 31) "поли-полосах". К этим полосам на фиг. 7 относятся левый и средний столбцы правого сектора "Полифазная реализация".
Как специалист поймет из фиг. 7, ширина полосы для каждой полосы с коэффициентом масштабирования при нижних частотах остается одинаковой и возрастает только, начиная с некоторой граничной частоты, чтобы смоделировать ширину частотных групп и соответствующую разрешающую способность по времени, характеризующую человеческий слух.
Спектральные значения 32 "полиполос" (от 0 до 31) квадрируются в блоке b2a, находящемся после полифазного фильтровального банка b1, для образования энергетических значений. В следующем блоке происходит, с одной стороны, суммирование для образования кратковременной энергии для каждой полосы с коэффициентом масштабирования по разным каждый раз длинам суммирования (сравни фиг. 7, правый столбец), причем длинами суммирования (sum. length) каждый раз обозначено количество следующих друг за другом суммируемых значений.
Далее 32 "полиполосы" объединены в сокращенное количество полос с коэффициентами масштабирования путем объединения соответствующих частотных полос. В случае ISO Layer III выбрана общим числом 21 полоса с коэффициентом масштабирования, причем образование кратковременных энергий для каждой полосы с коэффициентом масштабирования реализовано путем суммирования следующих один за другим значений, начиная с SB N 10.
На фиг. 6 не представлена более подробная форма исполнения блока b3 согласно фиг. 1 или 2, так как взвешивание отдельных спектральных значений по слышимости с применением психоакустически вычисленного прослушивательного порога является общеизвестной операцией.
Для вычисления прослушивательного порога можно сослаться на следующую публикацию: ISO/IEC 11172 International Standard "Coding of moving pictures and accociated audio for digital storage media up to 1,5 Mbit/s", Pat 3: Audio, ANNEX D:Psychoacustic Models.
Что касается взвешивания спектральных компонентов по слышимости и по внутреннему изображению, то можно сослаться на следующую литературу:
John G. Beerends, Jan A. Stemerdink: "A. Perceptual Audio Quality Measure based on a psychoacoustic Sound representation", J.Audio Eng. Soc., Bd. 40, Nr 12, Dezember 1992.
E. Zwicker, H. Fastl: "Psychoacoustics", Springer Verlag Berlin Heidelberg, 1990, Kap. 8.7.1" Specific Loudess.
Надписи на фигурах
Фиг. 1а.
1 - кодирование
2 - декодирование
3 - кратковременная энергия
4 - прослушивательный порог
5 - взвешивание по слышимости и внутреннее изображение
Фиг. 1б
1 - кодирование
2 - декодирование
3 - кратковременная энергия
4 - прослушивательный порог
5 - взвешивание по слышимости и внутреннее изображение
Фиг. 2
1 - кратковременная энергия
2 - прослушивательный порог
3 - взвешивание по слышимости и внутреннее изображение
Фиг. 4
1 - степень подобия
Фиг. 5
1 - блок
2 - числитель
3 - знаменатель
Фиг. 6
1 - полифазный фильтровальный банк
2 - суммирование значений кратковременной энергии для каждой полосы с коэффициентом масштабирования (в стоп-стартовых) полифазных полосах и последовательных (SUM-LENGTH) значений
Фиг. 7
1 - анализ t/f с высокой разрешающей способностью при помощи гибридного полифазного фильтровального банка
2 - гибрид
3 - линия
4 - пуск
5 - частота пуска
6 - частота останова
7 - ширина полосы
8 - полуфазная реализация
9 - пуск "поли-полосы"
10 - стоп "поли-полосы"
11 - суммарная длина
12 - анализ t/fц

Claims (9)

1. Способ определения вида кодирования, который следует выбирать при кодировании по меньшей мере двух сигналов (k1, k2), при котором производят преобразование сигналов в частотную область и исходя из спектральных значений, вычисляют степень подобия, на основании которой выбирают один из по меньшей мере двух видов кодирования, отличающийся тем, что по меньшей мере один из сигналов (k1, k2) кодируют, а затем декодируют при помощи того вида кодирования, который применяют в случае выявления высокой степени подобия, для образования по меньшей мере одного содержащего ошибку кодирования сигнала (ki1, ki2); содержащий ошибку кодирования сигнал (ki1, ki2) и принадлежащий ему не содержащий ошибку кодирования сигнал (k1, k2) преобразуют в частотную область; выбор или оценку каждый раз фактически слышимых спектральных компонентов производят исходя как из спектральных значений содержащего ошибку кодирования сигнала, так и из спектральных значений принадлежащего ему не содержащего ошибку кодирования сигнала с применением прослушивательного порога, найденного путем психоакустического расчета; степень подобия вычисляют на основании отобранных или оцененных таким образом слышимых спектральных компонентов по меньшей мере содержащего ошибку кодирования сигнала и принадлежащего ему сигнала, не содержащего ошибку кодирования.
2. Способ определения вида кодирования, который следует выбирать при кодировании по меньшей мере двух сигналов (k1, k2), при котором производят преобразование сигналов в частотную область и исходя из спектральных значений вычисляют степень подобия, на основании которой выбирают один из по меньшей мере двух видов кодирования, отличающийся тем, что по меньшей мере один из сигналов (k1, k2) после его преобразования в частотную область кодируют, а затем декодируют при помощи того вида кодирования, который применяют в случае выявления высокой степени подобия, для образования по меньшей мере одного содержащего ошибку кодирования сигнала (k1, k2); выбор или оценку каждый раз фактически слышимых спектральных компонентов производят исходя как из спектральных значений содержащего ошибку кодирования сигнала, так и из спектральных значений принадлежащего ему не содержащего ошибку кодирования сигнала с применением прослушивательного порога, найденного путем психоакустического расчета; степень подобия вычисляют на основании отобранных или оцененных таким образом слышимых спектральных компонентов по меньшей мере содержащего ошибку кодирования сигнала и принадлежащего ему сигнала, не содержащего ошибку кодирования.
3. Способ определения вида кодирования, который следует выбирать при кодировании по меньшей мере двух сигналов (k1, k2), при котором производят преобразование по меньшей мере двух сигналов в частотную область и исходя из спектральных значений вычисляют степень подобия этих сигналов друг относительно друга, на основании которой выбирают один из по меньшей мере двух видов кодирования, отличающийся тем, что исходя из спектральных значений конкретного сигнала (k1, k2) производят выбор или оценку каждый раз фактически слышимых спектральных компонентов с применением прослушивательного порога, найденного путем психоакустического расчета; степень подобия вычисляют на основании отобранных или оцененных таким образом слышимых спектральных компонентов по меньшей мере двух (k1, k2) сигналов для выбора вида кодирования.
4. Способ по одному из пп.1 - 3, отличающийся тем, что для отбора и оценки фактически слышимых спектральных компонентов каждого сигнала (k1, k2) сначала определяют значения кратковременной энергии внутри тех частотных областей, которые выбраны в зависимости от ширины частотных групп, из этих значений кратковременной энергии отбирают или оценивают слышимые значения энергии путем сравнения с расчетным прослушивательным порогом.
5. Способ по п.4, отличающийся тем, что значения кратковременной энергии определяют в пределах периода времени, который в соответствии с разрешающей способностью по времени человеческого уха для данной частотной области уменьшается с увеличением ширины частотной группы.
6. Способ по п. 4 или 5, отличающийся тем, что для отбора или оценки фактически слышимых спектральных значений к отобранным или оцененным спектральным компонентам применяют функцию, описывающую нелинейность человеческого внутреннего уха.
7. Способ по п.6, отличающийся тем, что функция для описания нелинейности человеческого уха имеет вид (xα), причем показатель степени находится в пределах 0,1 < α < 10,0.
8. Способ по п.1 или 2, отличающийся тем, что преобразование и отбор фактически слышимых спектральных компонентов (xi1, xi2), каждого содержащего ошибку кодирования сигнала (ki1, ki2), а также спектральных компонентов (x1, x2) каждого принадлежащего им сигнала (k1, k2) производят для каждого из каналов; степень подобия вычисляют на основании конкретной величины ошибки для каждого канала, причем величину ошибки определяют каждый раз на основании слышимых спектральных компонентов (xi1, x1, xi2, x2) как в отношении содержащих ошибку кодирования сигналов (ki1, ki2), так и принадлежащих им не содержащих ошибку кодирования сигналов (х1, х2) для каждого канала.
9. Способ по одному из пп.1 - 8, отличающийся тем, что степень подобия сравнивают с пороговым значение (k) и в том случае, если степень подобия превышает пороговое значение, производят раздельное кодирование каналов, а в противном случае производят кодирование каналов по методу "Интенсити-стерео".
RU96107254A 1993-09-15 1994-07-08 Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов RU2124272C1 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE4345171A DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DEP4345171.3 1993-09-15
DE4331376A DE4331376C1 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DEP4331376.0 1993-09-15

Publications (2)

Publication Number Publication Date
RU96107254A RU96107254A (ru) 1998-07-27
RU2124272C1 true RU2124272C1 (ru) 1998-12-27

Family

ID=25929591

Family Applications (1)

Application Number Title Priority Date Filing Date
RU96107254A RU2124272C1 (ru) 1993-09-15 1994-07-08 Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов

Country Status (11)

Country Link
US (1) US5736943A (ru)
EP (1) EP0719483B1 (ru)
JP (1) JP2800068B2 (ru)
KR (1) KR0171100B1 (ru)
AT (1) ATE152871T1 (ru)
AU (1) AU678270B2 (ru)
CA (1) CA2161263C (ru)
DE (1) DE4331376C1 (ru)
DK (1) DK0719483T3 (ru)
RU (1) RU2124272C1 (ru)
WO (1) WO1995008227A1 (ru)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2443074C2 (ru) * 2006-07-06 2012-02-20 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
RU2457632C2 (ru) * 2006-01-09 2012-07-27 Томсон Лайсенсинг Способ и устройство для предоставления режима изменения уменьшенного разрешения для многовидового кодирования видеосигнала
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
RU2475868C2 (ru) * 2008-06-13 2013-02-20 Нокиа Корпорейшн Способ и устройство для маскирования ошибок кодированных аудиоданных
RU2488973C2 (ru) * 2006-03-29 2013-07-27 Томсон Лайсенсинг Способы и устройство для использования в системе кодирования многовидового видео
US10244231B2 (en) 2006-07-06 2019-03-26 Interdigital Vc Holdings, Inc. Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4437287C2 (de) * 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) * 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE19706268A1 (de) * 1997-02-18 1998-08-20 Christian Wenz Dateiformatspezifisches Packverfahren
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6012025A (en) * 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
JP4835641B2 (ja) * 1998-10-13 2011-12-14 日本ビクター株式会社 音声符号化方法及び音声復号方法
DE60132853D1 (de) * 2000-07-07 2008-04-03 Nokia Siemens Networks Oy Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation
JP4618873B2 (ja) * 2000-11-24 2011-01-26 パナソニック株式会社 オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
US6654827B2 (en) 2000-12-29 2003-11-25 Hewlett-Packard Development Company, L.P. Portable computer system with an operating system-independent digital data player
DE60029147T2 (de) * 2000-12-29 2007-05-31 Nokia Corp. Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
EP1611772A1 (en) * 2003-03-04 2006-01-04 Nokia Corporation Support of a multichannel audio extension
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8620643B1 (en) 2009-07-31 2013-12-31 Lester F. Ludwig Auditory eigenfunction systems and methods
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2987166A4 (en) * 2013-04-15 2016-12-21 Nokia Technologies Oy BESTIMMER FOR MULTI-CHANNEL AUDIOSIGNAL CODIER MODE
CN105741835B (zh) * 2016-03-18 2019-04-16 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
DE4136825C1 (ru) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE4217276C1 (ru) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Банк М.У., Электрические и акустические параметры радиоприемных устройств. - М.: Связь, 1974, с. 125 - 130. Беллами Дж. Цифровая телефония. - М.: Радио и связь, 1986, с. 160 - 170. *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8902977B2 (en) 2006-01-09 2014-12-02 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multi-view video coding
RU2457632C2 (ru) * 2006-01-09 2012-07-27 Томсон Лайсенсинг Способ и устройство для предоставления режима изменения уменьшенного разрешения для многовидового кодирования видеосигнала
US9838694B2 (en) 2006-01-09 2017-12-05 Dolby Laboratories Licensing Corporation Methods and apparatus for illumination and color compensation for multi-view video coding
US9241168B2 (en) 2006-01-09 2016-01-19 Thomson Licensing Methods and apparatus for illumination and color compensation for multi-view video coding
US9237353B2 (en) 2006-01-09 2016-01-12 Thomson Licensing Methods and apparatus for illumination and color compensation for multi-view video coding
RU2529881C2 (ru) * 2006-03-29 2014-10-10 Томсон Лайсенсинг Способы и устройство для использования в системе кодирования многовидового видео
RU2488973C2 (ru) * 2006-03-29 2013-07-27 Томсон Лайсенсинг Способы и устройство для использования в системе кодирования многовидового видео
US9100659B2 (en) 2006-03-29 2015-08-04 Thomson Licensing Multi-view video coding method and device using a base view
RU2443074C2 (ru) * 2006-07-06 2012-02-20 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
RU2480942C2 (ru) * 2006-07-06 2013-04-27 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
US9641842B2 (en) 2006-07-06 2017-05-02 Thomson Licensing Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding
US10244231B2 (en) 2006-07-06 2019-03-26 Interdigital Vc Holdings, Inc. Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
RU2475868C2 (ru) * 2008-06-13 2013-02-20 Нокиа Корпорейшн Способ и устройство для маскирования ошибок кодированных аудиоданных

Also Published As

Publication number Publication date
AU7187994A (en) 1995-04-03
DE4331376C1 (de) 1994-11-10
WO1995008227A1 (de) 1995-03-23
AU678270B2 (en) 1997-05-22
KR0171100B1 (ko) 1999-03-30
JP2800068B2 (ja) 1998-09-21
JPH08507424A (ja) 1996-08-06
DK0719483T3 (da) 1997-08-25
ATE152871T1 (de) 1997-05-15
CA2161263A1 (en) 1995-03-23
CA2161263C (en) 1999-06-15
EP0719483A1 (de) 1996-07-03
US5736943A (en) 1998-04-07
EP0719483B1 (de) 1997-05-07

Similar Documents

Publication Publication Date Title
RU2124272C1 (ru) Способ определения вида кодирования, который следует выбирать для кодирования по меньшей мере двух сигналов
RU2376654C2 (ru) Параметрическое совместное кодирование аудиоисточников
EP1881486B1 (en) Decoding apparatus with decorrelator unit
US8843378B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
RU2384014C2 (ru) Формирование рассеянного звука для схем бинаурального кодирования с использованием ключевой информации (всс)
KR100803344B1 (ko) 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법
CN103765509B (zh) 编码装置及方法、解码装置及方法
CA2540851C (en) Compatible multi-channel coding/decoding
Musmann Genesis of the MP3 audio coding standard
CN102138177B (zh) 多通道音频数据的重构
TWI288915B (en) Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP3421726B2 (ja) 複数の依存し合うチャネルのデジタル信号を伝達及び/又は記憶する際にデータを減少させる方法
JP2000506631A (ja) オーディオ信号の聴覚に適応した品質評価方法および装置
Thiagarajan et al. Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB
US20080033729A1 (en) Method, medium, and apparatus decoding an input signal including compressed multi-channel signals as a mono or stereo signal into 2-channel binaural signals
Brandenburg Introduction to perceptual coding
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
JP2006323314A (ja) マルチチャネル音声信号をバイノーラルキュー符号化する装置
Bosi High-quality multichannel audio coding: Trends and challenges
CN101097716A (zh) 数字信号处理设备、处理方法和再现设备
Herre et al. Evaluation of concealment techniques for compressed digital audio
Spanias et al. Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB
Sablatash et al. Compression of high-quality audio signals, including recent methods using wavelet packets
Suresh et al. MDCT domain analysis and synthesis of reverberation for parametric stereo audio
Malmelöv Implementation and Evaluation of Encoder Tools for Multi-Channel Audio