RU99112567A - METHOD AND DEVICE FOR A HEARING AUDIO QUALITY ASSESSMENT IN A HEARING - Google Patents

METHOD AND DEVICE FOR A HEARING AUDIO QUALITY ASSESSMENT IN A HEARING

Info

Publication number
RU99112567A
RU99112567A RU99112567/09A RU99112567A RU99112567A RU 99112567 A RU99112567 A RU 99112567A RU 99112567/09 A RU99112567/09 A RU 99112567/09A RU 99112567 A RU99112567 A RU 99112567A RU 99112567 A RU99112567 A RU 99112567A
Authority
RU
Russia
Prior art keywords
audio signal
spectral
components
zones
reference audio
Prior art date
Application number
RU99112567/09A
Other languages
Russian (ru)
Inventor
Дитер ЗАЙТЦЕР
Томас ШПОРЕР
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU99112567A publication Critical patent/RU99112567A/en

Links

Claims (22)

1. Способ согласованной со слухом оценки качества аудиосигнала, полученного из опорного аудиосигнала путем кодирования и декодирования, содержащий разложение тестируемого аудиосигнала согласно его спектральному составу на составляющие при помощи первой гребенки фильтров, состоящей из фильтров, спектральные зоны которых перекрываются по частоте, а отличающиеся друг от друга характеристики передачи определяются, соответственно, на основе характеристик возбуждения человеческого уха на соответствующей средней частоте фильтра (fm), причем характеристика возбуждения человеческого уха при средней частоте фильтра зависит от уровня звукового давления подведенного к уху аудиосигнала, разложение опорного аудиосигнала согласно его спектральному составу на составляющие при помощи совпадающей с первой гребенкой фильтров второй гребенки фильтров, образование по спектральным зонам разности уровней между уровнями относящихся к одинаковым спектральным зонам составляющих тестируемого аудиосигнала и составляющих опорного аудиосигнала, и определение по спектральным зонам вероятности обнаружения ошибки кодирования тестируемого аудиосигнала в соответствующей спектральной зоне на основе соответствующей разности уровней, причем вероятность обнаружения моделирует вероятность того, что разность уровней между уровнем опорного аудиосигнала и уровнем тестируемого аудиосигнала воспринимается человеческим мозгом.1. A method of hearing-quality assessment of the quality of an audio signal obtained from a reference audio signal by encoding and decoding, comprising decomposing the tested audio signal according to its spectral composition into components using the first filter bank consisting of filters whose spectral zones are overlapped in frequency and differing from other transmission characteristics are determined, respectively, based on the characteristics of the excitation of the human ear at the corresponding average filter frequency (fm), m, the characteristic of the excitation of the human ear at an average filter frequency depends on the sound pressure level of the audio signal brought to the ear, the decomposition of the reference audio signal according to its spectral composition into components using the second filter comb coinciding with the first filter bank, the formation of spectral zones of the difference in levels between levels related to the same the spectral zones of the components of the test audio signal and the components of the reference audio signal, and the determination of the spectral zones ver The probability of detecting the encoding error of the test audio signal in the corresponding spectral region based on the corresponding level difference, the detection probability simulating the probability that the level difference between the level of the reference audio signal and the level of the tested audio signal is perceived by the human brain. 2. Способ по п.1, отличающийся тем, что характеристика возбуждения учитывает передаточные функции наружного и среднего уха и внутренние шумы человеческого уха. 2. The method according to claim 1, characterized in that the excitation characteristic takes into account the transfer functions of the outer and middle ear and the internal noise of the human ear. 3. Способ по п.1 или 2, отличающийся тем, что характеристики возбуждения фильтров первой и второй гребенки определяются в соответствии со средней частотой фильтров, для того чтобы привести их в соответствие с убывающей по мере повышения частот разрешающей способностью человеческого уха по частоте. 3. The method according to claim 1 or 2, characterized in that the excitation characteristics of the filters of the first and second comb are determined in accordance with the average frequency of the filters in order to bring them into line with the decreasing frequency resolution of the human ear with increasing frequency. 4. Способ по любому из пп.1-3, отличающийся тем, что характеристики возбуждения фильтров первой и второй гребенки определяются в соответствии с уровнем звукового давления тестируемого аудиосигнала и, соответственно, опорного аудиосигнала, для того чтобы при повышенных уровнях звукового давления получить более пологие края характеристики фильтра и более низкие пороги слышимости покоя, чем при низких уровнях звукового давления. 4. The method according to any one of claims 1 to 3, characterized in that the excitation characteristics of the filters of the first and second comb are determined in accordance with the sound pressure level of the tested audio signal and, accordingly, the reference audio signal, in order to obtain more gentle at higher sound pressure levels edges of the filter characteristic and lower thresholds for audibility of rest than at low sound pressure levels. 5. Способ по любому из пп.1-3, отличающийся тем, что характеристики возбуждения фильтров первой и второй гребенки определяют в соответствии с уровнем звукового давления тестируемого аудиосигнала и, соответственно, опорного аудиосигнала, для того чтобы получить, соответственно, характеристику фильтра с минимальными значениями затухания в области определенного уровня звукового давления. 5. The method according to any one of claims 1 to 3, characterized in that the excitation characteristics of the filters of the first and second comb are determined in accordance with the sound pressure level of the tested audio signal and, accordingly, the reference audio signal, in order to obtain, respectively, a filter characteristic with minimal attenuation values in the region of a certain sound pressure level. 6. Способ по любому из пп.1-5, отличающийся тем, что перед шагом образования по спектральным зонам разности уровней предусмотрены шаги моделирования по спектральным зонам временной маскировки тестируемого аудиосигнала и опорного аудиосигнала. 6. The method according to any one of claims 1 to 5, characterized in that before the step of forming the spectral zones of the level difference, modeling steps are provided for the spectral zones of the temporary masking of the tested audio signal and the reference audio signal. 7. Способ по п.6, отличающийся тем, что шаг моделирования по спектральным зонам временной маскировки предполагает интегрирование по спектральным зонам опорного аудиосигнала или тестируемого аудиосигнала для учета предмаскировки и экспоненциальное сглаживание по спектральным зонам опорного аудиосигнала или тестируемого аудиосигнала для учета остаточной маскировки. 7. The method according to claim 6, characterized in that the modeling step for the spectral zones of temporal masking involves integration over the spectral zones of the reference audio signal or test audio signal to account for pre-masking and exponential smoothing over the spectral zones of the reference audio signal or test audio signal for accounting for residual masking. 8. Способ по любому из пп.1-7, отличающийся тем, что фильтры первой и второй гребенки имеют различные частоты считывания, причем частоту считывания определяют в точке пересечения края характеристики фильтра, расположенного по частоте выше средней частоты (fm) фильтра, с предварительно заданным затуханием фильтра. 8. The method according to any one of claims 1 to 7, characterized in that the filters of the first and second comb have different read frequencies, and the read frequency is determined at the point of intersection of the edge of the filter characteristic located at a frequency higher than the average frequency (fm) of the filter, with preset filter attenuation. 9. Способ по п.8, отличающийся тем, что шаг разложения предусматривает группировку соседних фильтров в звенья с одинаковыми частотами считывания, которые определяют как частное от деления изначальной частоты считывания, с которой были дискретизированы тестируемый аудиосигнал и опорный аудиосигнал, и степени числа 2. 9. The method of claim 8, wherein the decomposition step comprises grouping adjacent filters into units with the same read frequencies, which are defined as the quotient of the division of the original read frequency with which the test audio signal and the reference audio signal were sampled, and the power of 2. 10. Способ по любому из пп.1-9, отличающийся тем, что перед шагом образования по спектральным зонам разности уровней определяют и компенсируют задержку между опорным аудиосигналом и тестируемым аудиосигналом. 10. The method according to any one of claims 1 to 9, characterized in that before the step of forming spectral zones, level differences determine and compensate for the delay between the reference audio signal and the tested audio signal. 11. Способ по любому из пп.1-10, отличающийся тем, что шаг определения вероятности обнаружения по спектральным участкам предусматривает присвоение вероятности обнаружения 0,5 для определенной разности пороговых уровней, присвоение вероятности обнаружения меньшей 0,5 для разности уровней, которая меньше, чем определенная разность пороговых уровней, и присвоение вероятности обнаружения большей 0,5 для разности уровней, которая больше чем определенная разность пороговых уровней. 11. The method according to any one of claims 1 to 10, characterized in that the step of determining the probability of detection by spectral sections provides for assigning a probability of detection of 0.5 for a certain difference in threshold levels, assigning a probability of detection of less than 0.5 for a difference of levels that is less, than a specific difference in threshold levels, and assigning a probability of detection greater than 0.5 for a difference in levels that is greater than a specific difference in threshold levels. 12. Способ по любому из пп.1-11, отличающийся тем, что вероятности обнаружения, соответствующие расположенным рядом друг с другом спектральным зонам, оценивают совместно в спектральной области, которая меньше или равна психоакустической частотной группе, благодаря чему моделируют субъективное восприятие ошибок кодирования тестируемого аудиосигнала. 12. The method according to any one of claims 1 to 11, characterized in that the detection probabilities corresponding to adjacent spectral zones are evaluated jointly in a spectral region that is less than or equal to the psychoacoustic frequency group, whereby subjective perception of coding errors of the test person is modeled audio signal. 13. Способ по любому из пп.1-12, отличающийся тем, что несколько следующих друг за другом по времени вероятностей обнаружения собирают в одном временном окне, и несколько по времени следующих друг за другом вероятностей обнаружения объединяют, для того чтобы получить обобщенную вероятность обнаружения для временного окна. 13. The method according to any one of claims 1 to 12, characterized in that several successive detection probabilities are collected in a single time window, and several times in succession of detection probabilities are combined in order to obtain a generalized detection probability for the time window. 14. Способ по любому из пп.1-13, отличающийся тем, что в спектральной зоне рассчитывают усредненные за короткое время значения вероятностей обнаружения, и некоторое количество усредненных за короткое время значений, относящихся к тестируемому аудиосигналу, сохраняют, причем обобщенное среднее значение всех усредненных за короткое время значений совместно с сохраненными усредненными за короткое время значениями характеризуют общее слуховое восприятие соответствующей спектральной зоны тестируемого аудиосигнала. 14. The method according to any one of claims 1 to 13, characterized in that the detection probabilities averaged over a short time are calculated in the spectral zone, and a number of values averaged over a short time related to the test audio signal are stored, and the generalized average value of all averaged in a short time the values together with the stored values averaged in a short time characterize the overall auditory perception of the corresponding spectral zone of the tested audio signal. 15. Способ по любому из пп.1-14, отличающийся тем, что тестируемый аудиосигнал и опорный аудиосигнал представляют собой стереосигналы с правым и левым каналом, шаги разложения тестируемого аудиосигнала и опорного аудиосигнала предусматривают раздельное разложение левого и правого канала сигналов при помощи нелинейного элемента, который избирательно по частоте подчеркивает переходные составляющие и уменьшает стационарные сигналы, для того чтобы получить модифицированный тестируемый аудиосигнал с правым и левым каналом и модифицированный опорный аудиосигнал с левым и правым каналом, а образование по спектральным зонам разности уровней представляет собой образование разности уровней между уровнями принадлежащих к одним и тем же спектральным зонам составляющих тестируемого аудиосигнала левого канала и составляющих опорного аудиосигнала левого канала, составляющих тестируемого аудиосигнала правого канала и составляющих опорного аудиосигнала правого канала; составляющих модифицированного тестируемого аудиосигнала левого канала и составляющих модифицированного опорного аудиосигнала левого канала, и составляющих модифицированного тестируемого аудиосигнала правого канала и составляющих модифицированного опорного аудиосигнала правого канала. 15. The method according to any one of claims 1 to 14, characterized in that the test audio signal and the reference audio signal are stereo signals with a right and left channel, the decomposition steps of the tested audio signal and the reference audio signal provide for separate decomposition of the left and right channel signals using a non-linear element, which selectively emphasizes the transition components in frequency and reduces stationary signals in order to obtain a modified test audio signal with left and right channels and modified the reference audio signal with the left and right channels, and the formation of the spectral zones of the level difference is the formation of the difference of levels between the levels of the components of the test audio signal of the left channel and the components of the reference audio signal of the left channel, components of the test audio signal of the right channel and the components belonging to the same spectral zones reference audio signal of the right channel; components of the modified test audio signal of the left channel and components of the modified test audio signal of the left channel, and components of the modified test audio signal of the left channel and components of the modified reference audio signal of the right channel. 16. Способ по п.15, отличающийся тем, что из разностей уровней сигналов для левого и правого канала по спектральным зонам определяют наибольшую разность уровней; из разностей уровней модифицированных сигналов для левого и правого канала по спектральным зонам определяют наибольшую разность уровней, и наибольшую разность уровней для тестируемого аудиосигнала и наибольшую разность уровней для модифицированного тестируемого аудиосигнала объединяют во взвешенное среднее значение, для того чтобы обеспечить обнаружение ошибки кодирования стереофонического тестируемого аудиосигнала. 16. The method according to p. 15, characterized in that from the difference in signal levels for the left and right channel, the largest level difference is determined from the spectral zones; From the level differences of the modified signals for the left and right channels, the largest level difference is determined from the spectral zones, and the largest level difference for the tested audio signal and the largest level difference for the modified tested audio signal are combined into a weighted average value in order to ensure the detection of the encoding error of the stereo test audio signal. 17. Способ по любому из пп.1-16, отличающийся тем, что в качестве первой и второй гребенки фильтров используют одну гребенку фильтров, причем во время разложения тестируемого аудиосигнала или опорного аудиосигнала составляющие опорного аудиосигнала или, соответственно, составляющие тестируемого аудиосигнала промежуточно запоминают. 17. The method according to any one of claims 1 to 16, characterized in that one filter bank is used as the first and second filter banks, and during the decomposition of the test audio signal or reference audio signal, the components of the reference audio signal or, accordingly, the components of the tested audio signal are intermediate stored. 18. Устройство для согласованной со слухом оценки качества аудиосигнала, полученного из опорного аудиосигнала путем кодирования и декодирования, содержащее первую гребенку фильтров, предназначенную для разложения тестируемого аудиосигнала в соответствии с его спектральным составом на составляющие, причем первая гребенка фильтров состоит из фильтров, спектральные зоны которых перекрываются друг с другом по частоте, и которые имеют отличающиеся друг от друга характеристики передачи, которые, соответственно, определены на основе характеристик возбуждения человеческого уха на соответствующей средней частоте фильтра, причем характеристика возбуждения человеческого уха зависит от уровня звукового давления подведенного к уху аудиосигнала, вторую гребенку фильтров, аналогичную первой гребенке фильтров, и предназначенную для разложения опорного аудиосигнала в соответствии с его спектральным составом на составляющие: вычислительное устройство для образования по зонам спектра разности уровней между уровнями принадлежащих одинаковым спектральным зонам составляющих тестируемого аудиосигнала и составляющих опорного аудиосигнала, и определяющее устройство для определения по спектральным зонам вероятности обнаружения для выявления ошибки кодирования тестируемого аудиосигнала в соответствующей спектральной зоне на основе соответствующей разности уровней, причем вероятность обнаружения моделирует вероятность того, что различие между уровнем составляющей опорного аудиосигнала и уровнем составляющей тестируемого аудиосигнала воспринимается человеческим мозгом. 18. A device for a hearing-compatible assessment of the quality of an audio signal obtained from a reference audio signal by encoding and decoding, comprising a first filter bank for decomposing the tested audio signal in accordance with its spectral composition, the first filter bank consisting of filters whose spectral zones overlap with each other in frequency, and which have different transmission characteristics, which, respectively, are determined based on the nature of a veristik of the excitation of the human ear at the corresponding average frequency of the filter, and the characteristic of the excitation of the human ear depends on the sound pressure level of the audio signal supplied to the ear, a second filter comb, similar to the first filter comb, and designed to decompose the reference audio signal in accordance with its spectral composition into components: computational a device for the formation of zones of the spectrum of the difference in levels between the levels belonging to the same spectral zones of components t the audible audio signal and the components of the reference audio signal, and a determining device for determining the detection probability from the spectral zones to detect an encoding error of the tested audio signal in the corresponding spectral region based on the corresponding level difference, the detection probability simulating the probability that the difference between the level of the component of the reference audio signal and the level of the component The test audio signal is perceived by the human brain. 19. Устройство по п.18, отличающееся тем, что содержит моделирующее устройство для моделирования по спектральным зонам временной маскировки тестируемого аудиосигнала и опорного аудиосигнала. 19. The device according to p. 18, characterized in that it contains a modeling device for modeling the spectral zones of the temporary masking of the test audio signal and the reference audio signal. 20. Устройство по п.19, отличающееся тем, что моделирующее устройство имеет интегрирующее устройство для интегрирования по спектральным зонам составляющей опорного аудиосигнала или составляющей тестируемого аудиосигнала для учета предмаскировки и сглаживающее устройство для экспоненциального сглаживания по спектральным зонам составляющей опорного аудиосигнала или составляющей тестируемого аудиосигнала для учета остаточной маскировки. 20. The device according to claim 19, characterized in that the simulating device has an integrating device for integrating over the spectral zones of the component of the reference audio signal or component of the test audio signal to account for pre-masking and a smoothing device for exponentially smoothing over the spectral zones of the component of the reference audio signal or component of the test audio signal for accounting residual masking. 21. Устройство по любому из пп.18-20, отличающееся чем, что содержит некоторое количество устройств групповой оценки для обобщенной оценки расположенных рядом друг с другом спектральных зон, для того чтобы обеспечить субъективное восприятие ошибки кодирования тестируемого аудиосигнала, причем количество расположенных рядом друг с другом совместно оцениваемых спектральных зон выбрано таким образом, что ширина полосы, образованная совместно оцениваемыми спектральными зонами, меньше или равна психоакустической частотной группе. 21. The device according to any one of claims 18 to 20, characterized in that it contains a number of group evaluation devices for the generalized assessment of spectral zones located next to each other, in order to provide a subjective perception of the encoding error of the tested audio signal, the number of adjacent to each other the other jointly evaluated spectral zones are selected so that the bandwidth formed by the jointly evaluated spectral zones is less than or equal to the psychoacoustic frequency group. 22. Устройство по любому из пп.18-20, отличающееся тем, что содержит устройство глобальной оценки для обобщенной оценки всех спектральных зон, для того чтобы получить глобальную оценку ошибки кодирования тестируемого аудиосигнала. 22. The device according to any one of claims 18 to 20, characterized in that it comprises a global estimation device for the generalized estimation of all spectral zones in order to obtain a global estimate of the encoding error of the tested audio signal.
RU99112567/09A 1996-11-15 1997-10-02 METHOD AND DEVICE FOR A HEARING AUDIO QUALITY ASSESSMENT IN A HEARING RU99112567A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19647399.3 1996-11-15

Publications (1)

Publication Number Publication Date
RU99112567A true RU99112567A (en) 2001-04-27

Family

ID=

Similar Documents

Publication Publication Date Title
JP3418198B2 (en) Quality evaluation method and apparatus adapted to hearing of audio signal
AU666161B2 (en) Noise attenuation system for voice signals
KR950012980B1 (en) Audio signal transmission method
Van De Par et al. A new psychoacoustical masking model for audio coding applications
US20020147595A1 (en) Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
JPH08272399A (en) Perception speech compression based on loudness uncertainty
EP3598441B1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
KR20010086277A (en) Method for making a machine-aided assessment of the transmission quality of audio signals
JP4551215B2 (en) How to perform auditory intelligibility analysis of speech
JPS62204652A (en) Audible frequency signal identification system
US7194093B1 (en) Measurement method for perceptually adapted quality evaluation of audio signals
EP1398761A1 (en) Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking
Hant et al. A psychoacoustic-masking model to predict the perception of speech-like stimuli in noise
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
Chen et al. Telephony speech enhancement by data hiding
RU99112567A (en) METHOD AND DEVICE FOR A HEARING AUDIO QUALITY ASSESSMENT IN A HEARING
Lokhoff Precision adaptive subband coding (PASC) for the digital compact cassette (DCC)
EP3718476B1 (en) Systems and methods for evaluating hearing health
Taghipour et al. Masked threshold for noise bands masked by narrower bands of noise: Effects of masker bandwidth and center frequency
Hant et al. A psychoacoustic model for the noise masking of plosive bursts
Dai et al. A two-filter model for frequency discrimination
US6895374B1 (en) Method for utilizing temporal masking in digital audio coding
Luo et al. High quality wavelet-packet based audio coder with adaptive quantization
Tarraf et al. Neural network-based voice quality measurement technique
Taghipour et al. Durations required to distinguish noise and tone: Effects of noise bandwidth and frequency