RU135471U1 - Устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания - Google Patents
Устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания Download PDFInfo
- Publication number
- RU135471U1 RU135471U1 RU2013111618/08U RU2013111618U RU135471U1 RU 135471 U1 RU135471 U1 RU 135471U1 RU 2013111618/08 U RU2013111618/08 U RU 2013111618/08U RU 2013111618 U RU2013111618 U RU 2013111618U RU 135471 U1 RU135471 U1 RU 135471U1
- Authority
- RU
- Russia
- Prior art keywords
- unit
- outputs
- inputs
- signal
- calculation unit
- Prior art date
Links
Images
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
1. Устройство оценки качества цифровых каналов для передачи аудиоданных в трактах звукового вещания, содержащее источник эталонного сигнала, источник исследуемого сигнала, полученного путем пропускания эталонного сигнала через оцениваемый канал или же его отдельные звенья; блок вычисления спектров; устройство психоакустического анализа, в котором имеется блок вычисления возбуждения, блок вычисления вероятности обнаружения искажений, связанный входами с соответствующими выходами блока вычисления возбуждения, являющимися выходами устройства психоакустического анализа, отличающееся тем, что дополнительно содержит блок разделения сигналов на временные участки, соответствующие входы которого соединены с источниками эталонного и исследуемого сигналов, а его выходы подключены к соответствующим входам блока вычисления спектров; блок масштабирования спектров по уровню воспроизведения, входы которого связаны с соответствующими выходами блока вычисления спектров, а выходы связаны с соответствующими входами устройства психоакустического анализа, дополнительно содержащего последовательно соединенные блок учета передаточной функции наружного и среднего уха, входы которого являются входами устройства психоакустического анализа, блок перехода к масштабу критических полос слуха и блок учета собственных шумов слуховой системы, выходами связанного с соответствующими входами блока вычисления возбуждения, выходы блока масштабирования спектров по уровню воспроизведения подключены также к соответствующим входам введенных блока вычисления сигнала искажений, блока оценки гармонической структуры искаж
Description
Предлагаемая полезная модель относится к технике электросвязи и предназначена для оценки параметров цифровых каналов для передачи аудиоданных.
Известны методы объективной оценки качества трактов звукового вещания, которые были разработаны для оценки искажений, возникающих в аналоговых каналах доставки звуковых сигналов (см. ГОСТ 52742-2007), которые нашли отражение в системах оценки соответствующих искажений.
Известна система, которая в отличие от систем оценки, реализующих упомянутый ГОСТ, оценивает качество цифровых каналов. Эта система реализует метод комплексного статистического оценивания (МКСО) качества передачи сигналов звукового вещания (см. О.Б.Попов, C.Г.Рихтер «Цифровая обработка сигналов в трактах звукового вещания», учебное пособие для высших учебных заведений, изд. Москва, Горячая линия - Телеком, 2007). В ней оценивается различие статистических распределений нескольких параметров реальных широкополосных звуковых сигналов, формируемых за время, соответствующее интервалу интеграции слухового анализатора по громкости (200 мс), частоте (20 мс) и пороговой чувствительности слуха к изменению огибающей звукового сигнала (2 мс). В качестве параметров, для которых оцениваются статистические распределения, используются:
- относительная средняя мощность (ОСМ), определяемая как отношение мощности сигнала на интервале анализа (200 мс) к мощности синусоиды с амплитудой, равной максимальному мгновенному значению сигнала на интервале анализа (сигнальная ОСМ - ОСМс) или значению, превышающему в течение 1% времени от общей длительности звукового фрагмента (канальная ОСМ - ОСМк);
- крутизна изменения огибающей сигнала на интервалах ее нарастания и спада (т.е. атаках и спадах звуковых объектов);
- среднеквадратичное отклонение АЧХ тракта передачи и пик-фактор кепстра (параметра оценки степени гармоничности сигнала).
Для оценки этих параметров система содержит два ЛЦП, первый - для преобразования исходного, а второй - для преобразования искаженного (прошедшего через канал передачи) сигналов, выходы обоих АЦП подключены ко входам соответствующих блоков нормализации сигналов, выходами подключенных к соответствующим входам блока синхронизации сигналов, выходы которого соединены с соответствующими входами блока анализа сигналов по методу МКСО, выход которого подключен ко входу блока формирования комплексной оценки изменения сигнала в процессе передачи, выходы которого подключены соответственно к устройству отображения, устройству печати данных и к блоку памяти.
При этом в блоке анализа сигналов по методу МКСО для оценки энергетических параметров (ОСМ) имеются блок сегментации сигнала на интервале, соответствующем времени интеграции слуха (200 мс), блок нормализации средней мощности к квадрату значения номинального уровня (ОСМк) или квадрату значения уровня, максимального на интервале (ОСМс), блок выделения интервалов значений сигналов, в котором разбивают полученный вариационный ряд значений ОСМ на N интервалов, где N>100, блок определения нормированных статистических частот появления значений параметра НЧПЗ ОСМ в каждом из N интервалов, блок формирования интегральных отклонений (ИО НЧПЗ ОСМ) на всем диапазоне появления значений и блок сравнения статистических характеристик ОСМ исходного и обработанного сигналов, причем чем больше разница, тем хуже качество исследуемого сигнала.
В блоке анализа сигналов по методу МКСО оценка параметров формы сигнала (ФОС) осуществляется на основе преобразования Гильберта, для чего вычисляют огибающую сигнала, производят ее низкочастотную фильтрацию и сегментацию на интервалы, соответствующие атакам и спадам сигнала, вычисляют крутизну огибающей на интервалах нарастания и спада и разбивают диапазон значений крутизны на N интервалов, после чего определяют НЧПЗ крутизны в каждом из N интервалов, далее рассчитывают ИО НЧПЗ крутизны атак и спадов на всем диапазоне появления значений исходя из статистических данных исходного и искаженного сигналов и сравнивают статистические характеристики формы огибающей для обработанного и исходного сигналов.
В блоке анализа сигналов по методу МКСО определяют также спектральные и кепстральные параметры, путем формирования оценок мгновенного амплитудного спектра (МАС) сигнала вещания. Для этого в блоке маскирования осуществляют наложение оконной функции на исходный сигнал, с помощью перемножителя умножают полученное колебание на набор комплексных синусоид, получая, таким образом, промежуточные оценки спектра (формирование транспонированных по частоте сегментов сигнала). Полученные последовательности в блоке анализа подвергают быстрому преобразованию Фурье (БПФ) и в блоке формирования суммарной оценки MAC получают суммарную оценку мгновенного спектра, которую прореживают по локальным максимумам амплитуд спектра в блоке выбора максимумов амплитудного спектра.
Таким образом, анализ спектральных параметров сводится к:
- вычислению МЛС на интервалах, соответствующих времени интеграции периферического слухового анализатора, по заметности изменения спектрального состава сигнала;
- вычислению среднестатистической тенденции изменения мгновенных спектров сигнала после обработки «средней АЧХ»;
- вычислению среднеквадратического отклонения (СКО) «средней ЛЧХ» от идеальной ЛЧХ канала;
- вычислению квантилей (от 0,1 до 0,9 с шагом 0,1) и дисперсии изменения мгновенных спектров сигнала после обработки;
- вычислению кепстра по имеющемуся амплитудному спектру путем логарифмирования и повторного БПФ анализа и получению вариационного ряда значений кепстра, распределенных по длительности звукового сигнала;
- вычислению вариационного ряда пик-фактора кепстра;
- вычислению НЧПЗ пик-фактора кепстра;
- расчету ИО НЧПЗ пик-фактора кепстра;
- сравнению спектральных статистических характеристик для обработанного и исходного сигналов.
Полученные оценки отображаются на дисплее (устройстве отображения), куда также вводится оценка коэффициента передачи канала, сформированная по реальному сигналу, а также записываются в блок памяти, а в случае необходимости, распечатываются с помощью устройства печати данных.
К сожалению, в данном устройстве выбор параметров и методов их измерения не имеет четкого обоснования, связанного с механизмом возникновения и характером проявления искажений в современных каналах доставки звуковых сигналов, т.е. в устройствах компрессии цифровых аудиоданных.
Из большой совокупности особенностей сложного психофизического процесса восприятия человеком искажений использованы только интервал интеграции слухового анализатора по громкости (200 мс), частоте (20 мс) и пороговая чувствительность слуха к изменению огибающей звукового сигнала (2 мс). В то время, как основной особенностью слухового аппарата являются эффекты маскировки, которые сложным образом связаны с остальными параметрами слуховой системы, как с использованными в известном устройстве (интервал интеграции слухового анализатора по громкости, частоте), так и с многими другими, такими как разрешающая способность по частоте и уровню, порог слышимости и др.
В то же время, современные устройства компрессии цифровых аудиоданных построены на основе сложных психоакустических моделей, позволяющих учесть множество особенностей восприятия человеком звуковых сигналов, и искажения, вносимые данными устройствами в сигнал, непосредственно связаны с точностью и достоверностью используемых в них психоакустических моделей.
Кроме того, испытанию согласно МКСО в известной системе подвергались несколько радиостанций, при этом результаты испытаний сопоставлялись не с результатами субъективно-статистической экспертизы (ССЭ), а с рейтингом станций, который включает в себя не только качество звучания, но в первую очередь, содержание программ.
Известны способ и устройство для согласованной со слухом оценки качества аудиосигнала (см. заявку РФ на изобретение №99112567, М. кл. H04S 1/00, H04R 29/00, опубл. 27.04.2001 г.), в которых учитывается ряд особенностей восприятия человеком аудиосигнала, полученного из опорного аудиосигнала путем кодирования и декодирования.
Данное устройство содержит источник опорного сигнала, с которого последний поступает на кодер/декодер, с выхода которого полученный сигнал поступает на первую гребенку фильтров, предназначенную для разложения тестируемого аудиосигнала в соответствии с его спектральным составом на составляющие, причем первая гребенка фильтров состоит из фильтров, спектральные зоны которых перекрываются друг с другом по частоте и которые имеют отличающиеся друг от друга характеристики передачи, которые соответственно определены на основе характеристик возбуждения человеческого уха на соответствующей средней частоте фильтра, причем характеристика возбуждения человеческого уха зависит от уровня звукового давления подведенного к уху аудиосигнала, вторую гребенку фильтров, аналогичную первой гребенке фильтров и предназначенную для разложения опорного аудиосигнала в соответствии с его спектральным составом на составляющие, вычислительное устройство для образования по зонам спектра разности уровней между уровнями, принадлежащими одинаковым спектральным зонам составляющих тестируемого аудиосигнала и составляющих опорного аудиосигнала, и определяющее устройство предназначенное для определения по спектральным зонам вероятности обнаружения для выявления ошибки кодирования тестируемого аудиосигнала в соответствующей спектральной зоне на основе соответствующей разности уровней, причем вероятность обнаружения моделирует вероятность того, что различие между уровнем составляющей опорного аудиосигнала и уровнем составляющей тестируемого аудиосигнала воспринимается человеческим мозгом.
Данное устройство содержит также моделирующее устройство для моделирования по спектральным зонам временной маскировки тестируемого и опорного аудиосигналов, причем моделирующее устройство имеет интегрирующее устройство для интегрирования по спектральным зонам составляющей опорного аудиосигнала или составляющей тестируемого аудиосигнала для учета предмаскировки и сглаживающее устройство для экспоненциального сглаживания по спектральным зонам составляющей опорного аудиосигнала или составляющей тестируемого аудиосигнала для учета остаточной маскировки.
В данном устройстве также имеется некоторое количество устройств групповой оценки для обобщенной оценки расположенных рядом друг с другом спектральных зон, для того, чтобы обеспечить субъективное восприятие ошибки кодирования тестируемого аудиосигнала, причем количество расположенных рядом друг с другом совместно оцениваемых спектральных зон выбрано таким образом, что ширина полосы, образованная совместно оцениваемыми спектральными зонами, меньше или равна психоакустической частотной группе.
Данное устройство также содержит устройство глобальной оценки для обобщенной оценки всех спектральных зон, для того, чтобы получить глобальную опенку ошибки кодирования тестируемого аудиосигнала.
В данном устройстве качество тестируемого аудиосигнала оценивается после его кодирования и декодирования, и не дается оценка прохождения этого сигнала через весь капал связи, в том числе через его отдельные звенья, что снижает достоверность оценки.
Кроме того, не учитывается особенность того, что при оценке качества аудиосигнала человеком более ранние по времени искажения сигнала являются менее существенными, поскольку забываются быстрее, чем искажения, которые произошли к конце испытательного сигнала, а также то, что кратковременные искажения являются слабо заметными.
Не является в полной мере соответствующим механизму восприятия человеком звукового сигнала предлагаемое к известном устройстве вычисление вероятности обнаружения искажений, при котором вначале осуществляют некоторое усреднение по времени значений вероятности, полученных для отдельных частот, а затем вычисляют вероятность обнаружения для всех частот к целом, что также снижает достоверность оценки.
Формат представления оценки качества, используемый в известном устройстве, в виде вероятности обнаружения искажений является малоинформативным и плохо сопоставим с общепринятой пятибалльной шкалой деградации качества, используемой при проведении субъективно-статистических экспертиз.
В заключение следует отметить, что в известном устройстве, по сути, определяется только один параметр - вероятность обнаружения искажений, на основе которого делается вывод о качестве исследуемого аудиосигнала и устройства кодирования/декодирования соответственно. Хотя при передаче аудиосигнала могут возникать и другие виды искажений, которые должны быть учтены при общей оценке качества исследуемого аудиосигнала.
Таким образом, известное устройство не позволяет дать достоверную и полную оценку искажений, которые могут иметь место при передаче аудиосигнала в трактах звукового вешания в соответствии со шкалой субъективно-статистической экспертизы.
Техническим результатом предлагаемой полезной модели является обеспечение возможности более полной и достоверной оценки качества передаваемого по тракту звукового вещания аудиосигнала, путем учета различных видов искажений, которые могут возникать в канале при передаче аудиоданных, а также посредством учета особенностей восприятия человеком звукового сигнала.
Достижение указанного технического результата обеспечивается в предлагаемом устройстве оценки качества цифровых каналов для передачи аудиоданных в трактах звукового вещания, содержащем: источник эталонного сигнала, источник исследуемого сигнала, полученного путем пропускания эталонного сигнала через оцениваемый канал или же его отдельные звенья; блок вычисления спектров; устройство психоакустического анализа, в котором имеется блок вычисления возбуждения, блок вычисления вероятности обнаружения искажений, связанный входами с соответствующими выходами блока вычисления возбуждения, являющимися выходами устройства психоакустического анализа, отличающемся тем, что дополнительно содержит: блок разделения сигналов на временные участки, соответствующие входы которого соединены с источниками эталонного и исследуемого сигналов, а его выходы подключены к соответствующим входам блока вычисления спектров; блок масштабирования спектров по уровню воспроизведения, входы которого связаны с соответствующими выходами блока вычисления спектров, а выходы связаны с соответствующими входами устройства психоакустического анализа, дополнительно содержащего последовательно соединенные блок учета передаточной функции наружного и среднего уха, входы которого являются входами устройства психоакустического анализа, блок перехода к масштабу критических полос слуха и блок учета собственных шумов слуховой системы, выходами связанного с соответствующими входами блока вычисления возбуждения, выходы блока масштабирования спектров по уровню воспроизведения подключены также к соответствующим входам введенных блока вычисления сигнала искажений, блока оценки гармонической структуры искажений и блока оценки ширины полос частот эталонного и исследуемого сигналов; выходы блока вычисления возбуждения, соединены с соответствующими входами введенных блока сравнения модуляции эталонного и исследуемого сигналов, блока вычисления громкости аддитивных шумов и блока вычисления отношения шум-маска, выходы которых, а также выход блока вычисления вероятности обнаружения искажений подключены к соответствующим входам введенного блока усреднения по частоте; выходы которого, а также выходы блока оценки гармонической структуры искажений и блока оценки ширины полос частот эталонного и исследуемого сигналов подключены к соответствующим входам введенного блока усреднения по времени, при этом выход блока вычисления сигнала искажений соединен со вторым входом блока вычисления отношения шум-маска, а выходы блока усреднения по времени связаны с соответствующими входами блока отображения, выполненного в виде обученной по результатам субъективно-статистических экспертиз искусственной нейронной сети, выход которой соединен со входом устройства вывода оценки качества.
Кроме того, для отображения более детальной информации о величине отдельных типов искажений предлагаемое устройство может содержать блок вывода многомерного показателя качества, входами подключенного к соответствующим выходам блока усреднения по времени, при этом блок вывода многомерного показателя качества может включать: блок вывода ширины полос частот, блок вывода гармонической структуры искажений, блок вывода отношения шум/маска, блок вывода громкости аддитивных шумов, блок вывода отличия модуляции и блок вывода вероятности обнаружения искажений.
В прототипе реализован механизм вычисления вероятности обнаружения искажений, возникающих в процессе кодирования и декодирования звуковых сигналов. При этом осуществляется переход от воздействия к возбуждению, при котором учитываются основные свойства слуховой системы человека - это эффекты временной и частотной маскировок.
В отличие от прототипа, в котором вычисляется только один показатель качества вероятность обнаружения искажений, в предложенном методе оценки качества кроме вероятности обнаружения искажений рассчитывается целый набор показателей качества: ширина полос частот эталонного и исследуемого сигналов, гармоническая структура искажений, отношение шум-маска, громкость аддитивных шумов, отличие модуляции эталонного и исследуемого сигналов. При вычислении данных величин учитываются не только психоакустические свойства слуховой системы человека, но и особенности возникновения и проявления различных типов искажений в современных каналах доставки звуковых сигналов. Все эти величины образуют так называемый многомерный показатель качества, который более детально и разносторонне количественно описывает все типы искажений, которые могут возникать при передаче по каналу звуковых сигналов.
Кроме этого в предложенном методе оценки качества используется искусственная нейронная сеть, позволяющая отобразить многомерный показатель качества к общей (интегральной) оценке качества, представленной в пятибалльной шкале деградации качества, традиционно используемой при проведении субъективно-статистических экспертиз.
Использование в качестве испытательных сигналов (эталонного сигнала) реальных вещательных широкополосных сигналов в совокупности с быстрым преобразованием Фурье (БПФ) (в блоке вычисления спектров) позволяет осуществлять оперативную опенку качества канала, т.е. проводить измерения в режиме реального времени и без вывода канала из эксплуатации.
Введение в предлагаемое устройство блока временного разделения сигналов на участки обеспечивает учет в процессе вычисления разрешающей способности слуховой системы человека во времени, что, в конечном счете, позволяет получать более достоверные и более точные результаты оценки качества.
Реализация в предлагаемом устройстве блока вычисления спектров, на основе быстрого преобразования Фурье, позволяет осуществить частотный анализ отдельных участков эталонного и исследуемого сигналов примерно так же, как это происходит в слуховой системе человека, что позволяет получать более достоверные и более точные результаты оценки качества.
Введение к устройство психоакустического анализа дополнительных блоков позволяет осуществить переход от «воздействия», оказываемого на слуховой аппарат звуковым сигналом, к «возбуждению» - величине, характеризующей состояние органа слуха, обусловленное звуковым воздействием. При этом учитываются такие свойства слухового аппарата человека как передаточная функция слуха, собственные шумы слуховой системы, разрешающая способность слуха а также, как и в прототипе, эффекты временной и частотной маскировки. Все это позволяет более точно оценить степень заметности присутствующих в исследуемом сигнале искажений, т.е. повысить точность получаемых результатов.
Введение блока вычисления сигнала искажений позволяет оценить спектр искажений, внесенных в исследуемый сигнал. Последующее сравнение его с порогом маскировки, вычисленным в устройстве психоакустического анализа, позволяет оцепить отношение шум-маска для различных полос частот и моментов времени. Отношение шум-маска традиционно используется как один из наиболее достоверных критериев оценки заметности искажений, позволяющий улучшить достоверность получаемых оценок качества.
Введение блока оценки гармонической структуры искажений позволяет осуществить гармонический анализ спектра сигнала искажений, который заключается в поиске доминирующей частоты в спектре автокорреляционной функции, вычисленной для спектра сигнала искажений. Полученные в ходе этого значения гармонической составляющей искажений позволяют более точно количественно оценить величину тональных искажений, которые характеризуются высокой степенью заметности на слух, и, как следствие, более точно оценить качество самого сигнала.
Введение блока оценки ширины полос частот эталонного и исследуемого сигналов позволяет более точно количественно оценить искажения, вносимые в исследуемый сигнал за счет ограничения ширины полосы частот. Это позволяет дополнительно оценить отличие эталонного и исследуемого сигналов, что приводит к повышению достоверности получаемых опенок качества сигнала.
Блок вычисления вероятности обнаружения искажений позволяет за счет сравнения величины возбуждений, вызываемых эталонным и исследуемым сигналами, оценить вероятность обнаружения слушателем на слух отличия эталонного и исследуемого сигналов. При этом выстроенная на основе результатов психоакустических экспериментов процедура оценки вероятности обнаружения искажений в предлагаемом устройстве позволяет более точно оценить качество исследуемого сигнала с позиции его отличия от эталонного.
Введенный блок сравнения модуляции эталонного и исследуемого сигналов осуществляет анализ временной огибающей сигналов возбуждения, приходящихся на отдельные критические полосы слуха. На основе упрощенной модели обнаружения аддитивных искажений в установившихся сигналах в данном блоке оценивается величина модуляции, как некоторая оценка формы временных огибающих. Различие модуляции эталонного и исследуемого сигнала позволяют более точно оценить величину заметности целого ряда специфических аддитивных искажений и за счет этого улучшить достоверность получаемых результатов.
Введение блока вычисления громкости аддитивных шумов, построенного на основе модели, предложенной Э.Цвикером, позволяет более точно оценить громкость аддитивных шумов, присутствующих в исследуемом сигнале и маскируемых эталонном сигналом. Полученные в данном блоке величины громкости частично маскированных аддитивных шумов позволяют более точно оценить качество исследуемого сигнала.
В блоке вычисления отношения шум-маска в предлагаемом устройстве на основе вычисленного как разность амплитудных спектров эталонного и исследуемого сигналов сигнала искажений (шум) рассчитывается отношение шум-маска. При этом маска находится в соответствии с общей психоакустической моделью, предложенной Э.Цвикером, как произведение возбуждения эталонного сигнала и линейно-ломанной аппроксимации коэффициента маскировки, что дает более точные результаты оценки качества исследуемого сигнала.
Введенный блок усреднения по частоте позволяет путем использования различных способов усреднения величин, количественно характеризующих заметность искажений к отдельных критических полосах слуха, перейти от их спектральных плотностей к средним по частоте значениям. На данном этане моделируется процесс интегрального восприятия человеком искажений, распределенных по частоте, что позволяет улучшить достоверность оценок качества.
Введение блока усреднения по времени позволяет путем использования различных способов усреднения величин, количественно характеризующих заметность искажений в отдельные моменты времени, перейти от их распределения во времени к средним значениям. Па данном этапе моделируется процесс запоминания и интегрального восприятия человеком искажений, распределенных во времени. Посредством этого учитываются такие особенности восприятия человеком искажений звуковых сигналов, как акцентирование внимания на последних (по времени) искажениях и забывание искажений, приходящихся на начало исследуемого сигнала, а также слабая заметность на слух кратковременных искажений. Все это позволяет получать более точные оценки качества, которые лучше согласуются с результатами субъективно-статистических экспертиз.
Введенный блок отображения, представляющий собой искусственную нейронную сеть, обученную по результатам субъективно-статистических экспертиз, позволяет осуществить переход от набора отдельных численных характеристик искажений к обобщенной оценке качества. Получаемая оценка соответствует пятибалльной шкале деградации качества, которая применяется в субъективно-статистических экспертизах. На данном этапе моделируется психические процессы, протекающие в слуховом аппарате человека, при интегральной оценке им качества исследуемого сигнала. Все это позволяет получать достоверные объективные оценки качества исследуемого сигнала, которые с точностью до доверительного интервала совпадают с результатами субъективно-статистических экспертиз.
Предлагаемое устройство поясняется чертежами, где на фиг.1 приведена структурная схема предлагаемого устройства, а на фиг.2 приведена блок-схема алгоритма оценки качества в предлагаемом устройстве.
Согласно фиг.1 предлагаемое устройство содержит источник 1 эталонного сигнала, источник 2 исследуемого сигнала, подключенные к входам блока 3 разделения сигналов на временные участки, выходы которого подключены к последовательно соединенным блоку 4 вычисления спектров, блоку 5 масштабирования спектров по уровню воспроизведения и устройству 6 психоакустического анализа, включающем последовательно соединенные блок 6.1 учета передаточной функции наружного и среднего уха, блок 6.2 перехода к масштабу критических полос слуха, блок 6.3 учета собственных шумов слуховой системы и блок 6.4 вычисления возбуждения (учета временной и частотной маскировки), блок 7 вычисления сигнала искажений, блок 8 оценки гармонической структуры искажений, блок 9 оценки ширины полос частот эталонного и исследуемого сигналов, причем входы блоков 7, 8 и 9 соединены с соответствующими выходами блока 5 масштабирования спектров по уровню воспроизведения, блок 10 вычисления вероятности обнаружения искажений, блок 11 сравнения модуляции эталонного и исследуемого сигналов, блок 12 вычисления громкости аддитивных шумов, блок 13 вычисления отношения шум/маска, при этом входы блоков 10, 11, 12, 13 соединены с соответствующими выходами блока 6.4 вычисления возбуждения (учета временной и частотной маскировки), являющимися выходами устройства 6 психоакустического анализа, а другой вход блока 13 соединен с выходом блока 7 вычисления сигнала искажений, выходы блоков 10, 11, 12, 13 подключены к соответствующим входам блока 14 усреднения по частоте, выходы которого и выходы блоков 8 и 9 соединены с соответствующими входами блока 15 усреднения по времени, выходы которого подключены к соответствующим входам блока 16 отображения, выход которого соединен со входом устройства 17 вывода оценки качества.
Предлагаемое устройство может также содержать блок 18 вывода многомерного показателя качества, к соответствующим входам которого подключаются выходы блока 15 усреднения по времени. При этом блок 18 может включать блок 18.1 вывода ширины полос частот, блок 18.2 вывода гармонической структуры искажений, блок 18.3 вывода отношения шум/маска, блок 18.4 вывода громкости аддитивных шумов, блок 18.5 вывода отличия модуляции и блок 18.6 вывода вероятности обнаружения искажений.
Рассмотрим работу предлагаемого устройства с использованием фиг.1 и фиг.2.
Используемые испытательные сигналы, как правило, выбираются из числа широкополосных звуковых сигналов, рекомендованных для проведения субъективно-статистических экспертиз. При этом предполагается, что исследуемый сигнал получен посредством пропускания эталонного сигнала через тестируемое устройство, например, через канал доставки радиовещательных сигналов в целом или же через одну из его составных частей.
Эталонный и исследуемый сигналы должны быть синхронизироваными по времени и представлены в формате ИКМ с частотой дискретизации 48 кГц и разрядностью 16 бит/отсчет.
Программа оценки качества осуществляет проверку окончания данных в источниках эталонного и исследуемого сигналов (фиг.2). При наличии данных в блоке 3 разделения сигналов на временные участки (фиг.1) осуществляется считывание выборок эталонного и исследуемого сигнала по указателям на источники эталонного и исследуемого сигналов (фиг.2).
При этом эталонный и исследуемый сигналы разбиваются па выборки длительностью 42 мс (2048 отсчетов), взятые с 50% перекрытием смежных выборок.
С помощью программно-реализованного алгоритма быстрого преобразования Фурье в блоке 4 вычисления спектров эталонного и исследуемого сигналов осуществляется расчет кратковременных спектров для каждой выборки входных сигналов.
Оценка качества исследуемого сигнала в значительной степени зависит от уровня воспроизведения эталонного и исследуемого сигнала. В связи с этим к блоке 5 масштабирования спектров по уровню воспроизведения осуществляется масштабирование кратковременных спектров, исходя из предполагаемого уровня воспроизведения.
Все дальнейшие вычисления осуществляются на основе полученных дискретных спектров выборок эталонного и исследуемого сигналов (фиг.2).
С выходов блока 5 масштабирования спектров по уровню воспроизведения дискретные выборки эталонного и исследуемого сигналов поступают на соответствующие входы блока 6.1 учета передаточной функции наружного и среднего уха, входящего в устройство 6 психоакустического анализа, блока 7 вычисления сигнала искажений, блока 8 гармонической структуры искажений и блока 9 оценки ширины полос частот эталонного и исследуемого сигналов.
В блоке 9 оценки ширины полос частот эталонного и исследуемого сигналов осуществляется оценка ширины полосы частот каждого из входных сигналов. Это позволяет оценить искажения, вызванные ограничением полосы частот сигнала в тестируемом устройстве. Полоса частот входного сигнала оценивается как относительное значение ширины низкочастотной области его спектра. Верхняя граница данной области определяется при переборе спектральных составляющих в сторону уменьшения частоты, как индекс первой составляющей, значение которой превышает заданный порог.
В блоке 8 оценки гармонической структуры искажений осуществляется оценка гармонической составляющей сигнала искажений. Она позволяет оценить величину тональных искажений, вносимых в исследуемый сигнал тестируемым устройством и характеризующихся высокой степенью заметности на слух. Процедура анализа гармонической составляющей сигнала искажений включает в себя вычисление спектра искажений, расчет для него автокорреляционной функции и поиск первого максимума в спектре автокорреляционной функции. Значение данного максимума характеризует величину гармонической составляющей искажений.
В блоке 7 вычисления сигнала искажений вычисляется сигнал искажений, как разность амплитудных спектров эталонного и исследуемого сигналов.
В блоке 6.1 учета передаточной (функции наружного и среднего уха, входящем в устройство 6 психоакустического анализа, кратковременные спектры эталонного и исследуемого сигналов умножаются на зависящий от частоты коэффициент. Посредством этого моделируется воздействие, оказываемое на звуковые колебания при прохождении ими наружнего и среднего уха, т.е. учитывается частотная зависимость порога слышимости.
В блоке 6.2 перехода к масштабу критических полос слуха, также входящем в устройство 6 психоакустического анализа, осуществляется расчет энергии сигнала, приходящейся на четверть критической полосы слуха. Таким образом, осуществляется переход от масштаба частоты в Гц к масштабу, соответствующему частотной избирательности слуховой системы.
В блоке 6.3 учета собственных шумов слуховой системы, также входящему в устройство 6 психоакустического анализа, осуществляется учет внутренних шумов слуховой системы. Происходит это посредством добавления к полученным распределениям энергии эталонного и исследуемого сигналов по полосам частот частотнозависимого смещения, характеризующего распределение энергии собственных шумов слуховой системы по частоте.
В блоке 6.4 вычисления возбуждения (учет временной и частотной маскировок), входящем и устройство 6 психоакустического анализа, осуществляется расчет «внутренних представлений» для эталонного и исследуемого сигналов. В качестве «внутреннего представления» в разработанном методе используется распределение «возбуждения» по высоте тона. Величина возбуждения вычисляется в соответствии с алгоритмом, предложенным Э.Цвикером. Понятие возбуждение является (фундаментальным в психоакустической модели, сформулированной Э.Цвикером, и определяется как величина, характеризующая состояние органа слуха, обусловленное звуковым воздействием.
Расчет распределения возбуждения по высоте тона, осуществляется в несколько этапов, на каждом из которых учитываются различные свойства слуха человека: передаточная функция слуха, разрешение слуха по частоте, собственные шумы слуховой системы и т.п. На заключительном этане расчета возбуждения осуществляется учет временной и частотной маскировок.
Частотная (одновременная) маскировка учитывается посредством процедуры свертки спектральных составляющих входного сигнала и развертывающей функции, которая представляет собой аппроксимацию порогов маскировки.
Временная маскировка моделируется с помощью фильтра нижних частот, параметры которого получены в результате психоакустических экспериментов.
На основе распределений возбуждения по высоте тона, вычисленных для каждого из входных сигналов, рассчитывается ряд величин, характеризующих слуховую заметность искажений.
Одной из характеристик заметности искажений является их громкость. Поскольку искажения, как правило, находятся вблизи порога слышимости при маскировке, то они являются частично маскированными эталонным сигналом. В связи с этим в программе оценки качества используется процедура оценки громкости частично маскированного аддитивного шума, которая построена на основе общей схемы вычисления громкости, предложенной Э.Цвикером.
С выходов блока 6.4 вычисления возбуждения, являющихся выходами устройства 6 психоакустического анализа, сигналы поступают на соответствующие входы блока 10 вычисления вероятности обнаружения искажений, блока 11 сравнения модуляции эталонного и исследуемого сигналов, блока 12 вычисления громкости аддитивных шумов и блока 13 вычисления отношения шум/маска, на другой вход которого поступает сигнал с соответствующего выхода блока 7 вычисления сигнала искажений.
В блоке 12 вычисления громкости аддитивных шумов на основе возбуждений, вычисленных для эталонного и исследуемого сигналов, и полученных для них коэффициентов маскировки, рассчитывается удельная громкость частично маскированных шумов.
В блоке 11 сравнения модуляции эталонного и исследуемого сигналов в отдельных полосах частот на первом этане осуществляется расчет относительного изменения уровня возбуждения от одной выборки сигнала к другой (модуляция). В свою очередь, отличие модуляции эталонного и исследуемого сигналов определяется как относительная разница величин модуляции, полученных для эталонного и исследуемого сигналов.
В блоке 10 вычисления вероятности обнаружения искажений на основе сравнения разности уровней возбуждений эталонного и исследуемого сигналов с порогом различимости слуха по амплитуде (just noticeable difference (JND)) рассчитывается вероятность обнаружения искажений. При этом коэффициенты в формуле, используемой для расчета вероятности, задаются таким образом, чтобы при равенстве разности уровней возбуждения входных сигналов порогу различимости слуха по амплитуде вероятность обнаружения была равна 0.5. Кроме вероятности обнаружения в данном блоке рассчитывается дополнительная величина, называемая общее количество ступеней превышения порога. Данная величина показывает во сколько раз искажения в данной полосе частот превышают порог различимости слуха по амплитуде.
В блоке 13 вычисления отношения шум-маска на основе вычисленного как разность амплитудных спектров эталонного и исследуемого сигналов сигнала искажений (шум) рассчитывается отношение шум-маска. При этом маска находится в соответствии с общей психоакустической моделью, предложенной Э.Цвикером, как произведение возбуждения эталонного сигнала и линейно-ломанной аппроксимации коэффициента маскировки.
С выходов блоков 10, 11, 12, 13 сигналы поступают на соответствующие входы блока 14 усреднения по частоте, где на основе величии, полученных для отдельных полос частот, осуществляется вычисление параметров качества, характеризующих величину искажений для отдельной выборки сигнала. При этом используются различные подходы усреднения по частоте для различных выходных величин.
При оценке громкости аддитивных шумов используется линейное усреднение удельной громкости по всем полосам частот. В результате этого получают «полную громкость аддитивных шумов для отдельной выборки сигнала.
При оценке отличия модуляции эталонного и исследуемого сигналов используется линейное усреднение величин отличия модуляции по частоте.
При оценке вероятности обнаружения для отдельной выборки сигнала осуществляется ее расчет в соответствии с теорией вероятности. На первом этане по уже известным вероятностям обнаружения искажений в отдельных полосах частот вычисляются вероятности их необнаружения. Далее путем перемножения вероятностей необнаружения искажений в отдельных полосах частот находится вероятность необнаружения искажений для всей выборки сигнала. И уже на основе данной величины находится вероятность обнаружения искажений для всей выборки сигнала.
В свою очередь, общее количество ступеней превышения порога для всей выборки сигнала находится путем простого суммирования данных величин, полученных для отдельных полос частот.
При оценке отношения шум-маска для всей выборки сигнала используется линейное усреднение по всем полосам частот.
После усреднения по частоте осуществляется сохранение полученных для отдельной выборки входных сигналов величин в памяти (фиг.2).
При окончании эталонного и исследуемого сигналов программа оценки качества переходит к обработке полученных для отдельных выборок сигнала данных (фиг.2).
С выходов блока 14 усреднения по частоте, а также с выходов блока 8 оценки гармонической структуры искажений и блока 9 оценки ширины полос частот эталонного и исследуемого сигналов соответствующие сигналы поступают в блок 15 усреднения по времени, где на основе величин, полученных для отдельных выборок сигнала, осуществляется вычисление параметров качества, характеризующих величину искажений для всего сигнала. При этом используются различные способы усреднения по времени при вычислении различных выходных величин.
При оценке ширин полос частот эталонного и исследуемого сигналов используется линейное усреднение во времени. В результате получают две выходные величины: ширина полосы частот эталонного сигнала; ширина полосы частот исследуемого сигнала.
При оценке гармонической структуры искажений используется линейное усреднение во времени. В результате этого получают одну выходную величину - гармоническая структура искажений.
При оценке громкости аддитивных шумов используется среднеквадратичное усреднение во времени. В результате этого получают одну выходную величину - громкость аддитивных шумов.
При оценке отличия модуляции эталонного и исследуемого сигналов учитывается тот факт, что на восприятие отличия модуляции влияет уровень громкости испытательного сигнала. Таким образом, отличие модуляции, приходящееся на более громкие участки испытательного сигнала, оказывает большее влияние на воспринимаемое качество, чем отличие, приходящееся на более тихие участки.
В связи с этим используются два варианта усреднения отличия модуляции во времени: линейное усреднение и оконное усреднение, которое подразумевает взвешивание локальных значений отличия модуляции эталонного и исследуемого сигналов. При этом весовой коэффициент рассчитывается на основе соотношения громкости эталонного сигнала и громкости, соответствующей порогу слышимости в покое.
В результате этого получают три выходные величины: отличие модуляции при оконном усреднении во времени, отличие модуляции при линейном усреднении во времени; отличие модуляции при линейном усреднении по времени, но с другими масштабными коэффициентами.
При оценке вероятности обнаружения искажений в процессе усреднения во времени осуществляют выбор наибольшего значения вероятности из полученных для отдельных выборок. Кроме этого при усреднении во времени общего количества ступеней превышения порога осуществляется его линейное усреднение во времени, но только по тем выборкам сигнала, для которых значение вероятности обнаружения превысило значение 0,5.
В результате получают две выходные величины: вероятность обнаружения искажений; общее количество ступеней превышения порога.
При оценке отношения шум-маска используют линейное усреднение во времени. В одном случае линейному усреднению подвергаются отношения шум-маска, взятые в разах (суммарное отношение), а в другом эти же отношения, но выраженные в дБ (сегментальное отношение). Кроме этого в качестве дополнительной величины вычисляется относительное количество искаженных выборок. Выборка считается искаженной, если хотя бы и одной из полос частот отношение шум-маска превысило значение в 1,5 дБ.
В результате получают три выходные величины: суммарное отношение шум к маске, сегментальное отношение шум к маске, относительное количество искаженных фреймов.
Двенадцать усредненных значений выходных величин, характеризующих различные виды искажений, образуют собой многомерный показатель качества, который отображается с помощью блока 16 отображения.
Отдельные показатели качества могут быть отображены с помощью дополнительного блока 18 вывода многомерного показателя качества.
В блоке 16 отображения (ИНС) полученный многомерный показатель качества используется как входной сигнал для искусственной нейронной сети (ИНС), обученной по результатам субъективно-статистических экспертиз. Она имеет 12 входов, три узла в скрытом уровне, а в качестве активационной функции в ней используется сигмоидальная функция (гиперболический тангенс). Задается искусственная нейронная сеть набором входных и выходных масштабных и весовых коэффициентов. С помощью искусственной нейронной сети осуществляется отображение многомерного показателя качества к оценке качества, представленной в формате, который используется при проведении субъективно-статистических экспертиз, - пятибалльная шкала деградации качества.
Реализованное в виде программного приложения для ОС Windows устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания размещается на вещательной станции записи эфира (СЗЭ), расположенной, например, в вещательной аппаратной аппаратно-студийного комплекса (ЛСК) радиостанции. К аналоговому линейному стерео входу встроенной звуковой карты СЗЭ подключается профессиональный AM/FM RDS тюнер (приемник радиосигналов) (фиг.1). С помощью данного источника 2 исследуемого сигнала (тюнер) с выхода канала доставки вещательных сигналов получают исследуемый сигнал, который используется как один из входных сигналов для устройства оценки качества (фиг.1). В свою очередь, эталонный сигнал, используемый в качестве второго входного сигнала (фиг.1) считывается с жесткого диска СЗЭ (фиг.1). В качестве источника 1 эталонного сигнала может использоваться любой вещательный сигнал, передаваемый радиостанцией во время эфира, например заставка радиостанции, звучащая к эфире, например, четыре раза в течение одного часа. Таким образом, четыре раза в течение одного часа размещенная на СЗЭ программа оценки качества будет осуществлять оперативный контроль качества канала доставки звуковых сигналов.
Результаты оценки качества сохраняются и демонстрируются обслуживающему персоналу с помощью общей автоматизированной системы мониторинга всего оборудования радиостанции. Для этого СЗЭ подключается к локальной сети, по которой осуществляется передача полученных оценок качества на компьютерную станцию, монитор которой используется для отображения полученных опенок качества. Этот же монитор может использоваться в качестве блока 18 вывода многомерного показателя качества (фиг.1).
Таким образом, обслуживающий персонал радиостанции получает возможность не только наблюдать факт ухудшения качества канала доставки радиопрограмм, но и соответствующим образом его регистрировать, т.е. осуществлять автоматический оперативный мониторинг качества канала доставки радиопрограмм.
Приведенный выше пример использования предлагаемо устройства оценки качества канала с профессиональным AM/FM RDS тюнером (приемником радиосигналов) и вещательной станцией записи эфира для получения, отображения и регистрации результатов оценки качества всего канала является одним из возможных вариантов применения данного устройства оценки качества. При этом предлагаемое устройство оценки качества может быть использовано для оценки качества как отдельных устройств, входящих в состав канала, так и его отдельных звеньев. В этом случае исследуемый сигнал может быть получен с выходов соответствующих устройств или звеньев канала, а эталонный сигнал - с соответствующих входов устройств или звеньев канала.
Пример выполнения аппаратных блоков данного устройства можно пояснить следующим образом:
- станцией записи эфира может быть вещательная станция DIGILINE DRC.100 (см. http://digiton.ru/catalog/broadcast__station_753);
- источником исследуемого сигнала может быть приемник APart PR1000R (см. http://www.audio-apart.ru);
- источником эталонного сигнала может быть жесткий диск вещательная станция DIGILINE DRC.100 (см. http://digiton.ru/catalog/broadcast_station_753);
- компьютерной станцией, монитор которой используется для отображения полученных оценок качества, а также для вывода многомерного показа-геля качества, может быть вещательная станция DIGILINE DRC.100 (см. http://digiton.ru/catalog/broadcast_station_753).
Программная реализация блоков данного устройства осуществляется в соответствии с блок-схемой алгоритма программы, приведенной на фиг.2.
Claims (2)
1. Устройство оценки качества цифровых каналов для передачи аудиоданных в трактах звукового вещания, содержащее источник эталонного сигнала, источник исследуемого сигнала, полученного путем пропускания эталонного сигнала через оцениваемый канал или же его отдельные звенья; блок вычисления спектров; устройство психоакустического анализа, в котором имеется блок вычисления возбуждения, блок вычисления вероятности обнаружения искажений, связанный входами с соответствующими выходами блока вычисления возбуждения, являющимися выходами устройства психоакустического анализа, отличающееся тем, что дополнительно содержит блок разделения сигналов на временные участки, соответствующие входы которого соединены с источниками эталонного и исследуемого сигналов, а его выходы подключены к соответствующим входам блока вычисления спектров; блок масштабирования спектров по уровню воспроизведения, входы которого связаны с соответствующими выходами блока вычисления спектров, а выходы связаны с соответствующими входами устройства психоакустического анализа, дополнительно содержащего последовательно соединенные блок учета передаточной функции наружного и среднего уха, входы которого являются входами устройства психоакустического анализа, блок перехода к масштабу критических полос слуха и блок учета собственных шумов слуховой системы, выходами связанного с соответствующими входами блока вычисления возбуждения, выходы блока масштабирования спектров по уровню воспроизведения подключены также к соответствующим входам введенных блока вычисления сигнала искажений, блока оценки гармонической структуры искажений и блока оценки ширины полос частот эталонного и исследуемого сигналов; выходы блока вычисления возбуждения, соединены с соответствующими входами введенных блока сравнения модуляции эталонного и исследуемого сигналов, блока вычисления громкости аддитивных шумов и блока вычисления отношения шум-маска, выходы которых, а также выход блока вычисления вероятности обнаружения искажений подключены к соответствующим входам введенного блока усреднения по частоте; выходы которого, а также выходы блока оценки гармонической структуры искажений и блока оценки ширины полос частот эталонного и исследуемого сигналов подключены к соответствующим входам введенного блока усреднения по времени, при этом выход блока вычисления сигнала искажений соединен со вторым входом блока вычисления отношения шум-маска, а выходы блока усреднения по времени связаны с соответствующими входами блока отображения, выполненного в виде обученной по результатам субъективно-статистических экспертиз искусственной нейронной сети, выход которой соединен со входом устройства вывода оценки качества.
2. Устройство по п.1, отличающееся тем, что содержит блок вывода многомерного показателя качества, входами подключенного к соответствующим выходам блока усреднения по времени и содержащего блок вывода ширины полос частот, блок вывода гармонической структуры искажений, блок вывода отношения шум/маска, блок вывода громкости аддитивных шумов, блок вывода отличия модуляции и блок вывода вероятности обнаружения искажений.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013111618/08U RU135471U1 (ru) | 2013-03-14 | 2013-03-14 | Устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013111618/08U RU135471U1 (ru) | 2013-03-14 | 2013-03-14 | Устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания |
Publications (1)
Publication Number | Publication Date |
---|---|
RU135471U1 true RU135471U1 (ru) | 2013-12-10 |
Family
ID=49682418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013111618/08U RU135471U1 (ru) | 2013-03-14 | 2013-03-14 | Устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU135471U1 (ru) |
-
2013
- 2013-03-14 RU RU2013111618/08U patent/RU135471U1/ru active IP Right Revival
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Emiya et al. | Subjective and objective quality assessment of audio source separation | |
Qi et al. | Temporal and spectral estimations of harmonics-to-noise ratio in human voice signals | |
US8818798B2 (en) | Method and system for determining a perceived quality of an audio system | |
EP2048657A1 (en) | Method and system for speech intelligibility measurement of an audio transmission system | |
US6675114B2 (en) | Method for evaluating sound and system for carrying out the same | |
US8566082B2 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
KR20000053311A (ko) | 오디오 신호의 청취하기 적합한 음질 평가 | |
CN107221342A (zh) | 话音信号处理电路 | |
Abramov et al. | On-board Transmission Quality Assessment Using Short Audio Signal | |
US5799133A (en) | Training process | |
KR960009936B1 (ko) | 오디오 신호의 왜곡 측정장치 및 방법 | |
CN104036785A (zh) | 语音信号的处理方法和装置、以及语音信号的分析系统 | |
Kressner et al. | Robustness of the hearing aid speech quality index (HASQI) | |
RU135471U1 (ru) | Устройство оценки качества цифровых каналов для передачи аудиосигналов в трактах звукового вещания | |
JPH04345327A (ja) | 通話品質客観測定方法 | |
Hansen | Assessment and prediction of speech transmission quality with an auditory processing model. | |
Popov et al. | Recognizability of the Substitution of a Continuous Sound Signal by a Discretely Changing Sound Signal | |
Sottek | Sound quality evaluation of noises with spectro-temporal patterns | |
Chernysheva et al. | Noticeability of Phase Distortions in Consonanse | |
Schäfer | A system for instrumental evaluation of audio quality | |
Sottek | Improvements in calculating the loudness of time varying sounds | |
US20230419984A1 (en) | Apparatus and method for clean dialogue loudness estimates based on deep neural networks | |
Zhou et al. | A new noise annoyance measurement metric for urban noise sensing and evaluation | |
Ullmann et al. | Predicting the intrusiveness of noise through sparse coding with auditory kernels | |
Alghamdi | Objective Methods for Speech Intelligibility Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM9K | Utility model has become invalid (non-payment of fees) |
Effective date: 20180315 |
|
NF9K | Utility model reinstated |
Effective date: 20210405 |