RU2446741C1 - Method of estimating disturbances of aural perception of speech signals - Google Patents

Method of estimating disturbances of aural perception of speech signals Download PDF

Info

Publication number
RU2446741C1
RU2446741C1 RU2010142084/14A RU2010142084A RU2446741C1 RU 2446741 C1 RU2446741 C1 RU 2446741C1 RU 2010142084/14 A RU2010142084/14 A RU 2010142084/14A RU 2010142084 A RU2010142084 A RU 2010142084A RU 2446741 C1 RU2446741 C1 RU 2446741C1
Authority
RU
Russia
Prior art keywords
speech signals
test
level
probability
speech
Prior art date
Application number
RU2010142084/14A
Other languages
Russian (ru)
Inventor
Евгений Константинович Айдаркин (RU)
Евгений Константинович Айдаркин
Олег Марксович Бахтин (RU)
Олег Марксович Бахтин
Сергей Николаевич Кульба (RU)
Сергей Николаевич Кульба
Original Assignee
Федеральное государственное автономное образовательное учреждение высшего профессионального образования "ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное автономное образовательное учреждение высшего профессионального образования "ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ" filed Critical Федеральное государственное автономное образовательное учреждение высшего профессионального образования "ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ"
Priority to RU2010142084/14A priority Critical patent/RU2446741C1/en
Application granted granted Critical
Publication of RU2446741C1 publication Critical patent/RU2446741C1/en

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

FIELD: medicine.
SUBSTANCE: invention relates to field of medicine, namely to otholaryngology. Set of test acoustic speech signals with individual level of loudness is presented and probability of correctly recognised words is calculated. Test speech signals are preliminarily subjected to non-linear frequency distortions of such level which is determined at the stage of preliminary examination of group of people with otologically normal and diminished hearing. For this purpose sum of probabilities of unrecognised test speech stimuli in group of people with otologically normal hearing and correctly recognised test speech stimuli in group of people with diminished hearing is calculated at different levels of nonlinear frequency distortions. Level of nonlinear frequency distortions at which sum of said probabilities is minimal is selected and individual level of loudness is set above the level of threshold of examined person's audibility. If probability of correctly recognised words is lower than probability of correct recognition of set of test acoustic speech signals for examined people with otologically normal hearing, disturbance of auditory perception of speech signals is diagnosed.
EFFECT: method makes it possible to increase reliability of estimation of disturbances of speech signal auditory perception.
5 dwg, 3 ex

Description

Изобретение относится к медицине, точнее к оториноларингологии, и может быть использовано для ранней диагностики нейросенсорной тугоухости и определения состояния слуха при профотборе.The invention relates to medicine, more specifically to otorhinolaryngology, and can be used for early diagnosis of sensorineural hearing loss and determining the state of hearing during occupational selection.

Из предшествующего уровня техники известны способы оценки нарушений слухового восприятия речевых сигналов, основанные на изменении громкости, фонемных составляющих, соотношения сигнал/шум речевых сигналов, предъявляемых испытуемому, а также способы, основанные на оценке межполушарной когерентности электроэнцефалограммы (ЭЭГ).From the prior art, methods are known for assessing violations of auditory perception of speech signals based on changes in volume, phonemic components, signal-to-noise ratio of speech signals presented to a test subject, as well as methods based on assessing interhemispheric coherence of an electroencephalogram (EEG).

Способ оценки нарушений слухового восприятия речевых сигналов, основанный на изменении громкости, реализован в способе определения уровня разборчивости речи, который заключается в расчете процента правильно распознанных слов при разных уровнях громкости предъявляемых наборов речевых сигналов, и по снижению доли правильно распознанных слов диагностируют нарушения слуха (Сагалович Б.М. Методы исследования слуха в клинической аудиологии. В кн.: Тугоухость (под редакцией Преображенского Н.А.). М: Медицина. 1978. С.10-167), (Благовещенская Н.С. Отоневрологические симптомы и синдромы. - М.: Медицина. 1990. С.24-47), [2], (US 7143031, МПК G10L 11/00, НКИ 704/224, 28.11.2006) [3]. Обследование при данном способе выполняется длительное время, что связано с определением как минимум трех значений уровней громкости. Кроме того, способ эффективен при высокой степени тугоухости и не позволяет выявлять ранние нарушения слуха.A method for assessing violations of auditory perception of speech signals based on a change in volume is implemented in a method for determining the level of speech intelligibility, which consists in calculating the percentage of correctly recognized words at different volume levels of the presented sets of speech signals, and hearing impairment is diagnosed by reducing the proportion of correctly recognized words (Sagalovich BM Methods of hearing research in clinical audiology. In the book: Hearing loss (edited by Preobrazhensky NA). M: Medicine. 1978. S.10-167), (Blagoveshchenskaya NS Oto evrologicheskie symptoms and syndromes -.. M .: Meditsina, 1990. S.24-47), [2], (US 7143031, IPC G10L 11/00, 704/224 NKI, 28.11.2006) [3]. Inspection with this method takes a long time, which is associated with the determination of at least three values of volume levels. In addition, the method is effective with a high degree of hearing loss and does not allow to detect early hearing impairment.

Способ оценки нарушений слухового восприятия речевых сигналов, основанный на изменении фонемных составляющих тестовых сигналов, реализован в способе раннего выявления дислексии и дисграфии и группы риска по заболеванию у детей, при котором в виде дихотической пары предъявляют слова, в одном из которых заменяют фонему на неречевой сигнал. При выявлении не более 10% правильных ответов диагностируют дислексию или дисграфию или предрасположенность к их возникновению (RU 2138987 С1, 6 МПК А61В 5/16, опубл. 10.10.1999). Способ направлен на выявление нарушений речевых функций, обусловленных прежде всего дисфункцией когнитивных корковых процессов, и поэтому не позволяет дифференцировать снижение слуха от корковых нарушений, затрудняющих понимание речи, что необходимо для выбора метода лечения.A method for assessing violations of auditory perception of speech signals based on a change in the phonemic components of test signals is implemented in a method for early detection of dyslexia and dysgraphia and a risk group for a disease in children, in which words are presented in the form of a dichotic pair, in one of which the phoneme is replaced by a non-speech signal . When identifying no more than 10% of the correct answers, dyslexia or dysgraphia or a predisposition to their occurrence is diagnosed (RU 2138987 C1, 6 IPC АВВ 5/16, publ. 10.10.1999). The method is aimed at identifying impaired speech functions, caused primarily by dysfunction of cognitive cortical processes, and therefore does not allow to differentiate hearing loss from cortical impairment, which makes it difficult to understand speech, which is necessary for choosing a treatment method.

Способ оценки нарушений слухового восприятия речевых сигналов, основанный на изменении соотношении сигнал/шум, реализован в способе объективной оценки глухоты и высокой степени тугоухости с помощью компьютерной фонографии, при котором производят сравнение амплитуды фонограммы читаемого обследуемым произвольного текста в тишине и на фоне шума, подаваемого в ухо. Если амплитуда фонограммы читаемого текста на фоне шума не изменилась, то делают вывод о глухоте на исследуемое ухо или о высокой степени тугоухости. (RU 2234245 С2, 6 МПК А61В 5/12, опубл. 20.08.2004). Однако известный способ эффективен только при высокой степени тугоухости и не позволяет выявлять ранние нарушения слуха.A method for assessing violations of auditory perception of speech signals, based on a change in the signal-to-noise ratio, is implemented in a method for objectively evaluating deafness and a high degree of hearing loss using computer phonography, which compares the phonogram amplitude of an arbitrary text read by the subject in silence and against the background of noise an ear. If the amplitude of the phonogram of the text being read against the background of the noise has not changed, then a conclusion is made about deafness in the studied ear or about a high degree of hearing loss. (RU 2234245 C2, 6 IPK А61В 5/12, publ. 08/20/2004). However, the known method is effective only with a high degree of hearing loss and does not allow to detect early hearing impairment.

Способ, основанный на оценке межполушарной когерентности ЭЭГ, использован для ранней диагностики профессиональной нейросенсорной тугоухости, при котором вычисляют средние показатели межполушарной когерентности ЭЭГ-активности (RU 2394481, 8 МПК А61В 5/0476, опубл. 20.07.2010). Начальное развитие тугоухости определяется, если значение межполушарной когерентности ЭЭГ отличается от нормативных значений для группы лиц с соответствующим стажем. Наличие высокой индивидуальной и межиндивидуальной вариабельности межполушарной когерентности ЭЭГ может привести к ошибочной диагностике нейросенсорной тугоухости.A method based on the assessment of interhemispheric coherence of EEG is used for early diagnosis of occupational sensorineural hearing loss, in which average values of interhemispheric coherence of EEG activity are calculated (RU 2394481, 8 IPC А61В 5/0476, published on July 20, 2010). The initial development of hearing loss is determined if the value of the interhemispheric coherence of the EEG differs from the normative values for a group of people with the corresponding experience. The presence of high individual and interindividual variability of interhemispheric EEG coherence can lead to an erroneous diagnosis of sensorineural hearing loss.

Наиболее близким по технической сущности к заявляемому изобретению является способ оценки помехоустойчивости восприятия речевых сигналов, при котором оценивают способность правильной идентификации слов, предъявляемых на фоне маскирующего шума при определенном соотношении интенсивностей тестового сигнала и помехи. (RU 2147833, 6 МПК А61В 5/12, опубл. 27.04.2000), принимаемый за прототип.Closest to the technical nature of the claimed invention is a method for evaluating noise immunity of the perception of speech signals, in which they evaluate the ability to correctly identify words presented against the background of masking noise at a certain ratio of the intensities of the test signal and interference. (RU 2147833, 6 IPC А61В 5/12, publ. 04/27/2000), taken as a prototype.

На предварительном этапе обследования определяют индивидуально для каждого отдельного обследуемого эффективный уровень громкости предъявления нескольких наборов слов, при котором фиксируют наибольшую вероятность правильного опознания слов. Затем тестовые речевые сигналы предъявляют вместе с акустическими помехами, увеличивая при этом отношение сигнал/помеха от нуля до величины, при которой вероятность правильного распознавания тестовых сигналов достигает значения на 20% ниже от исходного, с учетом эффективного уровня громкости определяют отношение сигнал/помеха и при его значении менее 7 дБ принимают его за помехоустойчивость для пациентов с отсутствием сенсоневральной тугоухости, а при значении, равном или более -7 дБ, для пациентов с признаками сенсоневральной тугоухоости.At the preliminary stage of the examination, individually for each individual subject the effective level of presentation of several sets of words is determined, at which the greatest probability of the correct recognition of the words is recorded. Then, test speech signals are presented together with acoustic noise, while increasing the signal-to-noise ratio from zero to a value at which the probability of correct recognition of test signals reaches a value 20% lower than the initial one, taking into account the effective volume level, the signal-to-noise ratio is determined and at its value less than 7 dB is taken as noise immunity for patients with a lack of sensorineural hearing loss, and with a value equal to or more than -7 dB for patients with signs of sensorineural hearing loss tee.

Существенным недостатком способа-прототипа является длительная многоэтапная процедура обследования. Этап предварительного обследования, на котором выбирают эффективный уровень громкости, требует предъявления нескольких наборов слов, каждый из которых включает 50 слов. Процедура основного обследования также включает в себя использование нескольких аналогичных по размеру наборов слов. Таким образом, суммарное время обследования одного человека составляет несколько десятков минут, что неприемлемо при массовых обследованиях населения (скрининге).A significant disadvantage of the prototype method is a lengthy multi-stage examination procedure. The preliminary examination stage, at which the effective volume level is selected, requires the presentation of several sets of words, each of which includes 50 words. The main examination procedure also involves the use of several similar-sized sets of words. Thus, the total examination time for one person is several tens of minutes, which is unacceptable for mass screening of the population (screening).

Способ-прототип не позволяет выявлять те слуховые расстройства, которые обусловлены снижением слуховой чувствительности в отдельных частотных диапазонах, которое приводит к нарушениям слухового восприятия речевых сигналов. При этом отношение сигнал/помеха определяют для усредненного спектра речи с максимумом в зоне 400-700 Гц и спадом в сторону высоких частот с крутизной 6 дБ/окт., что реализовано в устройстве для измерения помехоустойчивости восприятия речи человеком тех же авторов и заявителя (RU 2148391, 6 МПК А61В 5/12, опубл. 10.05.2000). Таким образом, усредненный спектр помехи не соответствует реальному спектру конкретного тестового акустического речевого сигнала и помеха не в равной степени маскирует отдельные частотные составляющие используемого тестового сигнала. Это приводит к снижению достоверности оценки нарушений слухового восприятия, которые могут быть вызваны снижением слуховой чувствительности в отдельных узких диапазонах частот.The prototype method does not allow to identify those auditory disorders that are caused by a decrease in auditory sensitivity in certain frequency ranges, which leads to impaired auditory perception of speech signals. In this case, the signal-to-noise ratio is determined for an average speech spectrum with a maximum in the region of 400-700 Hz and a decrease towards high frequencies with a slope of 6 dB / oct., Which is implemented in a device for measuring noise immunity of speech perception by a person of the same authors and applicant (RU 2148391, 6 IPC А61В 5/12, publ. 10.05.2000). Thus, the averaged interference spectrum does not correspond to the real spectrum of a particular test acoustic speech signal and the interference does not equally mask the individual frequency components of the test signal used. This leads to a decrease in the reliability of the assessment of impaired auditory perception, which can be caused by a decrease in auditory sensitivity in certain narrow frequency ranges.

Техническим результатом настоящего изобретения является повышение достоверности оценки нарушений слухового восприятия речевых сигналов при снижении слуховой чувствительности в отдельных узких частотных областях за счет распределения частотных искажений речевого сигнала по всему спектру речевого сигнала, а также сокращение времени процедуры обследования пациента за счет уменьшения количества предъявляемых тестовых речевых сигналов.The technical result of the present invention is to increase the reliability of the assessment of impaired auditory perception of speech signals while reducing auditory sensitivity in individual narrow frequency regions due to the distribution of frequency distortions of the speech signal over the entire spectrum of the speech signal, as well as reducing the time of examination of the patient by reducing the number of test speech signals .

Указанный технический результат достигается тем, что способ оценки нарушений слухового восприятия речевых сигналов включает предъявление обследуемому набора тестовых акустических речевых сигналов с индивидуальным уровнем громкости и вычисление вероятности правильно распознанных слов.The specified technical result is achieved in that the method for assessing violations of the auditory perception of speech signals includes presenting the subject with a set of test acoustic speech signals with an individual volume level and calculating the probability of correctly recognized words.

Согласно изобретению тестовые речевые сигналы предварительно подвергают нелинейным частотным искажениям такого уровня, который определяют на этапе предварительного обследования групп лиц с отологически нормальным и со сниженным слухом, для которых вычисляют сумму вероятностей нераспознанных тестовых речевых стимулов в группе лиц с отологически нормальным слухом и правильно распознанных тестовых речевых стимулов в группе лиц со сниженным слухом при различных уровнях нелинейных частотных искажений и выбирают уровень нелинейных частотных искажений, при котором сумма этих вероятностей минимальна, а индивидуальный уровень громкости устанавливают выше порога слышимости обследуемого, и при вероятности правильно распознанных слов менее вероятности правильного распознавания набора тестовых акустических речевых сигналов для обследуемых с отологически нормальным слухом диагностируют нарушение слухового восприятия речевых сигналов.According to the invention, test speech signals are preliminarily subjected to nonlinear frequency distortion of a level determined at the stage of preliminary examination of groups of people with otologically normal and hearing impairment, for which the sum of the probabilities of unrecognized test speech stimuli in a group of people with otologically normal hearing and correctly recognized test speech is calculated stimuli in the group of persons with hearing loss at various levels of nonlinear frequency distortion and choose the level of nonlinear frequencies distortion-frequency at which the sum of these probabilities is minimal, and the individual volume level is set higher than the auditory threshold of the subject, and the probability of correctly recognized words less probability of correct recognition of a set of test of acoustic speech signals for subjects with normal hearing otologic diagnose a violation of auditory perception of speech signals.

В частном случае выполнения способа:In the particular case of the method:

- индивидуальный уровень громкости устанавливают на 30-40 дБ выше порога слышимости обследуемого;- the individual volume level is set to 30-40 dB above the threshold of audibility of the subject;

- уровень нелинейных частотных искажений составляет 1/12 октавы;- the level of nonlinear frequency distortion is 1/12 octave;

- вероятность правильного распознавания набора тестовых акустических речевых сигналов для обследуемых с отологически нормальным слухом составляет 0.9.- the probability of correct recognition of a set of test acoustic speech signals for subjects with otologically normal hearing is 0.9.

Введение нелинейных частотных искажений, которые распределены по всему спектру тестового речевого сигнала, позволяет выявить снижение слуха для всех составляющих спектра, что приводит к повышению достоверности оценки нарушений слухового восприятия, которые могут быть вызваны снижением слуховой чувствительности в отдельных узких диапазонах частот.The introduction of nonlinear frequency distortions, which are distributed throughout the spectrum of the test speech signal, allows us to detect hearing loss for all components of the spectrum, which leads to an increase in the reliability of the assessment of auditory perception disorders, which can be caused by a decrease in auditory sensitivity in individual narrow frequency ranges.

Использование предварительного обследования групп лиц с отологически нормальным и со сниженным слухом для формирования набора тестовых речевых сигналов позволяет при индивидуальном обследовании, в отличие от прототипа, в котором обследуемому предъявляют несколько наборов тестовых речевых сигналов, предъявить только один набор тестовых речевых сигналов, что приводит к уменьшению в несколько раз времени индивидуального обследования.Using a preliminary examination of groups of people with otologically normal and hearing impaired to form a set of test speech signals allows for an individual examination, in contrast to the prototype, in which the subject is presented with several sets of test speech signals, only one set of test speech signals is presented, which leads to a decrease several times the time of an individual examination.

Увеличение громкости тестового речевого сигнала на 30-40 дБ выше порога слышимости обследуемого обеспечивает 100% разборчивости речи у лиц отологически нормальным слухом.An increase in the volume of the test speech signal by 30–40 dB above the hearing threshold of the subject provides 100% speech intelligibility in individuals with an otologically normal hearing.

Уровень нелинейных частотных искажений тестовых речевых сигналов в 1/12 октавы обеспечивает минимальное значение суммы вероятностей ложноположительных и ложноотрицательных ошибок диагностики нарушений слухового восприятия речевых сигналов.The level of nonlinear frequency distortion of test speech signals of 1/12 octave provides the minimum value of the sum of the probabilities of false positive and false negative errors in the diagnosis of auditory disturbances in speech signals.

Вероятность правильного распознавания набора тестовых акустических речевых сигналов для обследуемых с отологически нормальным слухом, равная 0.9, получена экспериментально и обеспечивает разделение лиц с нормальным и сниженным слухом при минимальной сумме вероятностей ложноположительных и ложноотрицательных ошибок диагностики нарушений слухового восприятия речевых сигналов.The probability of correct recognition of a set of test acoustic speech signals for subjects with otologically normal hearing, equal to 0.9, was obtained experimentally and ensures the separation of people with normal and reduced hearing with a minimum sum of the probabilities of false-positive and false-negative errors in the diagnosis of auditory perception of speech signals.

Операции способа поясняются чертежами.The operation of the method is illustrated by drawings.

На фиг.1 приведена функциональная блок-схема реализации заявляемого способа оценки нарушений слухового восприятия речевых сигналов.Figure 1 shows the functional block diagram of the implementation of the proposed method for assessing violations of auditory perception of speech signals.

На фиг.2 приведен амплитудный спектр тестового речевого сигнала.Figure 2 shows the amplitude spectrum of the test speech signal.

На фиг.3 приведен амплитудный спектр тестового речевого сигнала с нелинейными частотными искажениями.Figure 3 shows the amplitude spectrum of the test speech signal with non-linear frequency distortion.

На фиг.4 приведены гистограммы относительных частот правильно распознанных слов обследуемыми с отологически нормальным слухом и нейросенсорной тугоухостью от уровня нелинейных частотных искажений, где темные столбики соответствуют относительным частотам правильно распознанных слов обследуемыми с отологически нормальным слухом, заштрихованные столбики - относительным частотам правильно распознанных слов обследуемыми с нейросенсорной тугоухостью.Figure 4 shows histograms of the relative frequencies of correctly recognized words by the examined with otologically normal hearing and sensorineural hearing loss from the level of nonlinear frequency distortion, where the dark bars correspond to the relative frequencies of correctly recognized words by the examined with otologically normal hearing, the shaded bars correspond to the relative frequencies of correctly recognized words by the examined with sensorineural hearing loss.

На фиг.5 приведена зависимость накопленных относительных частот правильно распознанных слов обследуемыми с отологически нормальным слухом и нейросенсорной тугоухостью от уровня нелинейных частотных искажений, где кривая 1, обозначенная штриховой линией, соответствует относительным частотам правильно распознанных слов обследуемыми с отологически нормальным слухом, а кривая 2, обозначенная сплошной линией, соответствует относительным частотам правильно распознанных слов обследуемыми с нейросенсорной тугоухостью.Figure 5 shows the dependence of the accumulated relative frequencies of correctly recognized words by the examined with otologically normal hearing and sensorineural hearing loss on the level of nonlinear frequency distortions, where curve 1, indicated by the dashed line, corresponds to the relative frequencies of correctly recognized words, examined by the otologically normal hearing, and curve 2, denoted by a solid line, corresponds to the relative frequencies of correctly recognized words being examined with sensorineural hearing loss.

На фиг.6 приведена зависимость вероятности ложноотрицательных ошибок диагностики нарушений слухового восприятия речевых сигналов, соответствующая вероятности правильно распознанных слов у лиц с нарушениями слухового восприятия речевых сигналов, вероятности ложноположительных ошибок диагностики нарушений слухового восприятия речевых сигналов, соответствующая дополнению до единицы вероятности распознанных слов у лиц с отологически нормальным слухом, и их суммы от уровня нелинейных частотных искажений, где кривая 1 соответствует вероятности ложноотрицательных ошибок диагностики нарушений слухового восприятия речевых сигналов, кривая 2 соответствует вероятности ложноположительных ошибок диагностики нарушений слухового восприятия речевых сигналов, а кривая 3 - сумме вероятностей ложноотрицательных ошибок и ложноположительных ошибок диагностики нарушений слухового восприятия речевых сигналов.Figure 6 shows the dependence of the probability of false-negative errors in the diagnosis of disorders of auditory perception of speech signals, corresponding to the probability of correctly recognized words in people with impaired auditory perception of speech signals, the probability of false-positive errors in the diagnosis of violations of auditory perception of speech signals, corresponding to the addition to a unit of probability of recognized words in people with otologically normal hearing, and their sums from the level of nonlinear frequency distortion, where curve 1 corresponds to the number of false negative errors and false positive errors in the diagnosis of auditory perception of speech signals, curve 2 corresponds to the probability of false positive errors in the diagnosis of auditory perception of speech signals, and curve 3 corresponds to the sum of the probabilities of false negative errors and false positive errors in the diagnosis of auditory perception of speech signals.

Блок-схема заявляемого способа оценки нарушений слухового восприятия речевых сигналов (фиг.1) реализована программно на персональном компьютере типа PC и содержит блок запоминания тестовых сигналов 1, блок выборки тестовых сигналов 2, блок усиления тестовых сигналов 3, головные телефоны 4, обследуемый (пациент) 5, оператор (врач) 6, блок регистрации ответа 7, блок определения вероятности правильных ответов 8, блок принятия решения 9, блок управления 10, блок отображения результатов обследования 11. В качестве головных телефонов 4 использованы аудиометрические головные телефоны TDH-39P фирмы «Telephonics». Обследуемый 5 располагается в положении сидя с надетыми головными телефонами 4, которые подключены к блоку усиления тестовых сигналов 3.The block diagram of the proposed method for assessing violations of auditory perception of speech signals (Fig. 1) is implemented programmatically on a personal computer of type PC and contains a block for storing test signals 1, a block for sampling test signals 2, an amplification block for test signals 3, headphones 4, and the patient ) 5, operator (doctor) 6, response registration unit 7, probability determination unit for correct answers 8, decision making unit 9, control unit 10, examination results display unit 11. Audi was used as head phones 4 Metric headphones TDH-39P firm «Telephonics». The subject 5 is located in a sitting position with the head phones 4 on, which are connected to the test signal amplification unit 3.

Предварительно сформированный набор тестовых акустических речевых сигналов вводят в блок запоминания тестовых сигналов 1.A pre-formed set of test acoustic speech signals is introduced into the test signal storage unit 1.

Процедура формирования набора тестовых акустических речевых сигналов состояла в следующем. В качестве исходных тестовых акустически речевых сигналов использовали 50 слов, взятых из артикуляционных таблиц фонетически сбалансированных многосложных слов Гринберга-Зиндера (Гринберг Г.И., Зиндер Л.Р. Таблицы слов для речевой аудиометрии в клинической практике. // Труды Ленинградского НИИ по болезням уха, горла, носа иречи. - Л. - 1957 - т.2. - С.45-47), записанных профессиональным диктором-мужчиной на магнитный носитель. Эти аналоговые сигналы преобразовывались в цифровые сигналы и нормировались по уровню среднеквадратичной мощности частотного спектра, затем подвергались градуальным нелинейным частотным искажениям в пределах одной октавы известным методом Pitch Band равномерного сдвига частот по всему спектру сигнала с помощью звукового редактора Sony Sound Forge 7.0 фирмы Sonic Foundary Inc. Для каждого исходного сигнала получали набор из 24 градаций искажений. Полученные таким образом 50×24=1200 тестовых акустических речевых сигналов сохранялись в памяти компьютера, а затем предъявлялись для распознавания группе из 96 лиц в возрасте от 20 до 25 лет с отологически нормальным слухом и группе из 48 лиц того же возраста с диагнозом нейросенсорная тугоухость. Для каждого из 50 наборов по 24 градации искажений исходного сигнала определяли тот максимальный уровень искажений, при котором обследуемые правильно распознавали слово. Сигналы предъявлялись на надпороговом уровне громкости, который превышал индивидуальный порог их обнаружения на 30 дБ в последовательности от максимального уровня искажений (24 уровень), что соответствует изменению частоты на одну октаву, до нулевого уровня, что соответствует отсутствию искажений. По результатам обследования методом статистических вычислений (Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных. Изд-во «Мир», Москва, 1980, С.26-29.) вычислялись относительные частоты правильно распознанных слов (фиг.4) и строились накопительные полигоны частот (фиг.5). Для минимизации ложноотрицательных и ложноположительных ошибок диагностики нарушений слухового восприятия речевых сигналов вычисляли сумму вероятности правильных ответов лиц с нейросенсорной тугоухостью при заданном уровне искажений (вероятность ложноотрицательных ошибок диагностики нарушений слухового восприятия речевых сигналов) и вероятности отсутствия правильных ответов у лиц нормальным слухом (вероятность ложноположительных ошибок диагностики нарушений слухового восприятия речевых сигналов) (фиг.6, кривая 3). Из графика на фиг.6 следует, что минимальной сумме ошибок (кривая 3) соответствует предъявление сигналов с уровнем 2 нелинейных частотных искажений.The procedure for forming a set of test acoustic speech signals was as follows. As the initial test acoustic speech signals, 50 words were used, taken from articulation tables of phonetically balanced polysyllabic words of Greenberg-Zinder (Grinberg G.I., Zinder L.R. Word tables for speech audiometry in clinical practice. // Proceedings of the Leningrad Scientific Research Institute for Diseases ear, throat, nose, nose. - L. - 1957 - v. 2. - P.45-47), recorded by a professional male speaker on magnetic media. These analog signals were converted to digital signals and normalized by the level of the rms power of the frequency spectrum, then subjected to degree nonlinear frequency distortion within one octave by the well-known Pitch Band method of uniform frequency shift across the entire spectrum of the signal using the Sony Sound Forge 7.0 sound editor from Sonic Foundary Inc. For each source signal, a set of 24 gradations of distortion was obtained. Thus obtained 50 × 24 = 1200 test acoustic speech signals were stored in the computer memory and then presented for recognition to a group of 96 persons aged 20 to 25 years with otologically normal hearing and a group of 48 persons of the same age with a diagnosis of sensorineural hearing loss. For each of 50 sets of 24 gradations of distortions of the source signal, the maximum distortion level was determined at which the subjects correctly recognized the word. The signals were presented at an above-threshold volume level, which exceeded the individual detection threshold by 30 dB in sequence from the maximum distortion level (24 level), which corresponds to a frequency change of one octave to zero level, which corresponds to the absence of distortion. According to the results of the survey using statistical calculations (Johnson N., Lyon F. Statistics and experimental design in engineering and science. Data processing methods. Mir Publishing House, Moscow, 1980, p. 26-29.), The relative frequencies of correctly recognized words (figure 4) and built storage frequency polygons (figure 5). To minimize false-negative and false-positive errors in the diagnosis of auditory perception of speech signals, we calculated the sum of the probability of correct answers of people with sensorineural hearing loss at a given level of distortion (the probability of false negative errors in the diagnosis of auditory perception of speech signals) and the probability of the absence of correct answers in people with normal hearing (the probability of false positive diagnostic errors violations of auditory perception of speech signals) (Fig.6, curve 3). From the graph in Fig.6 it follows that the minimum sum of errors (curve 3) corresponds to the presentation of signals with level 2 of nonlinear frequency distortion.

Как следует из графика на фиг.5 (кривая 1 для группы обследуемых с отологически нормальным слухом), вероятность правильно распознанных слов составляет 0.9 на уровне нелинейных частотных искажений 2.As follows from the graph in Fig. 5 (curve 1 for a group of subjects with an otologically normal hearing), the probability of correctly recognized words is 0.9 at the level of non-linear frequency distortions 2.

Из набора 1200 тестовых речевых сигналов выбирают сигналы с найденным уровнем искажений и формируют окончательный набор из 50 тестовых речевых сигналов, которые вводят в блок запоминания тестовых сигналов и используют при оценке нарушений слухового восприятия речевых сигналов.From a set of 1200 test speech signals, signals with a found distortion level are selected and a final set of 50 test speech signals is formed, which are input into the test signal storage unit and used in assessing auditory disturbances in speech signals.

По команде блока управления 10, поступающей в блок выборки тестовых сигналов 2, сигнал заданного номера считывается из блока запоминания тестовых сигналов 1 и поступает в блок усиления тестовых сигналов 3, где усиливается в соответствии с командой, полученной от блока управления 10.At the command of the control unit 10, which enters the block of sampling test signals 2, the signal of a given number is read from the memory block of the test signals 1 and enters the block amplification of test signals 3, where it is amplified in accordance with the command received from the control unit 10.

Интенсивность тестовых речевых сигналов в блоке усиления тестовых сигналов 3 устанавливают на 30 дБ выше порога их обнаружения. Порог обнаружения определяют перед процедурой диагностического обследования известным методом постоянных стимулов (Сагалович Б.М. Методы исследования слуха в клинической аудиологии. В кн.: Тугоухость (под редакцией Преображенского Н.А.). М: Медицина. 1978. С.61). Требуемый уровень усиления сохраняется в блоке управления 10 и используется для задания усиления в блоке усиления тестовых сигналов 3, с выхода которого тестовый речевой сигнал поступает на головные телефоны 4. Обследуемый 5 в ответ на услышанный сигнал называет оператору 6 слово, которое он услышал или сообщает о невозможности распознать тестовый сигнал. Оператор 6 сравнивает слово, названное обследуемым 5 с правильным вариантом ответа, хранящимся в блоке запоминания 1, и регистрирует нажатием клавишей правильность ответа с помощью блока регистрации ответа 7. После регистрации ответа обследуемого 5 в блоке определения вероятности правильных ответов 8 вычисляется вероятность правильных ответов обследуемого 5, а в блоке управления 10 формируется команда на подачу следующего тестового сигнала. Когда число ответов обследуемого 5 сравняется с заданным в блоке управления 10 числом тестовых сигналов, из блока управления 10 в блок определения вероятности правильных ответов 8 подается команда о передаче вероятности правильных ответов обследуемого в блок принятия решения 9. Вероятность правильных ответов обследуемого 5 и результат принятия решения о наличии нарушений слухового восприятия речевых сигналов отображается в блоке отображения результатов обследования 11. Нарушения слухового восприятия речевых сигналов диагностируют при вероятности правильного распознавания слов из предъявляемого набора менее 0.9.The intensity of the test speech signals in the amplification unit of the test signals 3 is set 30 dB above the threshold for their detection. The detection threshold is determined before the diagnostic examination procedure by the known method of constant stimuli (Sagalovich BM Methods of hearing research in clinical audiology. In the book: Hearing loss (edited by Preobrazhensky NA). M: Medicine. 1978. S. 61). The required gain level is stored in the control unit 10 and is used to set the gain in the amplification unit of test signals 3, from the output of which the test speech signal is sent to the headphones 4. Surveyed 5 in response to the heard signal calls the operator 6 the word that he heard or reports about inability to recognize the test signal. Operator 6 compares the word named by examinee 5 with the correct answer option stored in the memorizing unit 1 and registers the correct answer by pressing the key using the response recording unit 7. After registering the answer of the examined 5 in the probability determination block of correct answers 8, the probability of the correct answers of the examined 5 is calculated , and in the control unit 10, a command is generated to supply the next test signal. When the number of responses of examinee 5 is equal to the number of test signals specified in the control unit 10, a command is sent from control unit 10 to the unit for determining the probability of correct answers 8 to transmit the probability of correct answers of the examinee to decision block 9. The probability of correct answers of examinee 5 and the result of decision making the presence of violations of the auditory perception of speech signals is displayed in the display unit 11. The auditory disturbances in speech signals are diagnosed when The probability of correct recognition of words from the presented set is less than 0.9.

Пример 1.Example 1

Обследуемый К.С., 21 год. Речевая аудиометрия, выполненная посредством аудиометра МА-31, показала 100% разборчивости речи при уровне громкости 20 дБ выше порога слышимости, что соответствует норме. Время обследования составило 11 минут. Для проверки заявляемого способа через головные телефоны бинаурально испытуемому предъявлялся набор из 50 слов с нелинейными частотными искажениями. При этом вероятность правильного распознавания слов составила 0.92 (разборчивость речи 92%), что подтверждает нормальное состояние слуха. Время обследования заявляемым способом составило 3 минуты.Surveyed K.S., 21 years old. Speech audiometry performed using the MA-31 audiometer showed 100% speech intelligibility at a volume level of 20 dB above the hearing threshold, which is normal. The examination time was 11 minutes. To test the proposed method through headphones, the test subject was presented with a set of 50 words with non-linear frequency distortions. The probability of correct word recognition was 0.92 (speech intelligibility 92%), which confirms the normal state of hearing. The examination time by the claimed method was 3 minutes.

Пример 2.Example 2

Обследуемый С.О., 52 года. Речевая аудиометрия, выполненная посредством аудиометра МА-31, показала 100% разборчивость речи при уровне громкости 22 дБ выше порога слышимости, что соответствует норме. Время обследования составило 14 минут. Разборчивость речи, определенная заявляемым способом, составила 82%, что соответствует нарушению восприятию речевых сигналов. Дополнительно проведенная тональная аудиометрия выявила значительное снижение слуха в правом ухе для частоты 6000 Гц на 45 дБ, что свидетельствует о начальных стадиях развития нейросенсорной тугоухости. Время обследования заявляемым способом составило 3 минуты.Examined S.O., 52 years old. Speech audiometry performed using the MA-31 audiometer showed 100% speech intelligibility at a volume level of 22 dB above the hearing threshold, which is normal. The examination time was 14 minutes. Speech intelligibility, determined by the claimed method, was 82%, which corresponds to impaired perception of speech signals. Additionally, tonal audiometry revealed a significant decrease in hearing in the right ear for a frequency of 6000 Hz by 45 dB, which indicates the initial stages of the development of sensorineural hearing loss. The examination time by the claimed method was 3 minutes.

Пример 3.Example 3

Обследуемый Д.В., 65 лет. Речевая аудиометрия, выполненная посредством аудиометра МА-31, показала 100% разборчивость речи при уровне громкости 25 дБ выше порога слышимости, что соответствует норме. Время обследования составило 12 минут. Разборчивость речи согласно заявляемому способу составила 74%, что соответствует нарушению слуха. Дополнительно проведенная тональная аудиометрия выявила в правом ухе снижение слуха для частоты 3000 Гц на 40 дБ и в левом ухе для частоты 4000 Гц на 50 дБ, что подтвердило развитии нейросенсорной тугоухости у обследуемого. Время обследования заявляемым способом составило 4 минуты.Examined D.V., 65 years old. Speech audiometry performed using the MA-31 audiometer showed 100% speech intelligibility at a volume level of 25 dB above the hearing threshold, which is normal. The examination time was 12 minutes. Speech intelligibility according to the claimed method was 74%, which corresponds to hearing impairment. Additionally, tonal audiometry revealed hearing loss in the right ear for a frequency of 3000 Hz by 40 dB and in the left ear for a frequency of 4000 Hz by 50 dB, which confirmed the development of sensorineural hearing loss in the subject. The examination time by the claimed method was 4 minutes.

Заявляемый способ успешно апробирован на группе из 126 студентов, у 5 человек были выявлено нарушение слухового восприятие речевых сигналов, подтвержденное при последующих клинических обследованиях.The inventive method was successfully tested on a group of 126 students, 5 people had a violation of auditory perception of speech signals, confirmed by subsequent clinical examinations.

Источники информацииInformation sources

1. Благовещенская Н.С. Отоневрологические симптомы и синдромы. - М.: Медицина. 1990. С.270-271.1. Blagoveshchenskaya N.S. Otoneurological symptoms and syndromes. - M.: Medicine. 1990. S. 270-271.

2. Сагалович Б.М. Методы исследования слуха в клинической аудиологии. В кн.: Тугоухость (под редакцией Преображенского Н.А.). М.: Медицина. 1978. С.61-69.2. Sagalovich B.M. Methods of hearing research in clinical audiology. In the book: Hearing loss (edited by Preobrazhensky N.A.). M .: Medicine. 1978. S. 61-69.

3. RU 2138987 C1, 10.10.1999, 6 A61B 5/16.3. RU 2138987 C1, 10.10.1999, 6 A61B 5/16.

4. RU 2234245 C2, 20-08-2004, A61B 5/12.4. RU 2234245 C2, 20-08-2004, A61B 5/12.

5. RU 2394481 C1, 20.07.2010, A61B, 5/0476.5. RU 2394481 C1, 07.20.2010, A61B, 5/0476.

6. US 7143031, МПК G10L 11/00, НКИ 704/224, 28.11.2006.6. US 7143031, IPC G10L 11/00, NCI 704/224, 11.28.2006.

7. RU 2147833 С1, 27.04.2000, A61B 5/12 - прототип.7. RU 2147833 C1, 04/27/2000, A61B 5/12 - prototype.

8. RU 2148391 C1, 10.05.2000, A61B 5/12.8. RU 2148391 C1, 05/10/2000, A61B 5/12.

9. Гринберг Г.И., Зиндер Л.Р. Таблицы слов для речевой аудиометрии в клинической практике. // Труды Ленинградского НИИ по болезням уха, горла, носа иречи. - Л. - 1957 - т.2. - Стр.45-47.9. Greenberg G.I., Zinder L.R. Word tables for speech audiometry in clinical practice. // Proceedings of the Leningrad Scientific Research Institute on diseases of the ear, throat, nose and nose. - L. - 1957 - v. 2. - Pages 45-47.

10. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных. Изд-во «Мир», Москва, 1980, С.26-29.10. Johnson N., Lyon F. Statistics and experimental design in engineering and science. Data processing methods. Publishing house "Mir", Moscow, 1980, S. 26-29.

Claims (4)

1. Способ оценки нарушений слухового восприятия речевых сигналов, включающий предъявление обследуемому набора тестовых акустических речевых сигналов с индивидуальным уровнем громкости и вычисление вероятности правильно распознанных слов, отличающийся тем, что тестовые речевые сигналы предварительно подвергают нелинейным частотным искажениям такого уровня, который определяют на этапе предварительного обследования групп лиц с отологически нормальным и со сниженным слухом, для которых вычисляют сумму вероятностей нераспознанных тестовых речевых стимулов в группе лиц с отологически нормальным слухом и правильно распознанных тестовых речевых стимулов в группе лиц со сниженным слухом при различных уровнях нелинейных частотных искажений, и выбирают уровень нелинейных частотных искажений, при котором сумма этих вероятностей минимальна, а индивидуальный уровень громкости устанавливают выше порога слышимости обследуемого, и при вероятности правильно распознанных слов менее вероятности правильного распознавания набора тестовых акустических речевых сигналов для обследуемых с отологически нормальным слухом диагностируют нарушение слухового восприятия речевых сигналов.1. A method for assessing violations of auditory perception of speech signals, comprising presenting the subject with a set of test acoustic speech signals with an individual volume level and calculating the probability of correctly recognized words, characterized in that the test speech signals are preliminarily subjected to nonlinear frequency distortions of the level determined at the preliminary examination stage groups of individuals with otologically normal and hearing impairment, for which the sum of the probabilities of unrecognized speech stimuli in the group of people with otologically normal hearing and correctly recognized test speech stimuli in the group of people with hearing loss at different levels of nonlinear frequency distortion, and choose the level of nonlinear frequency distortion at which the sum of these probabilities is minimal and the individual volume level is set above the threshold the audibility of the subject, and when the probability of correctly recognized words is less than the probability of correct recognition of a set of test acoustic speech signals for those with otologically normal hearing are diagnosed with impaired auditory perception of speech signals. 2. Способ по п.1, отличающийся тем, что индивидуальный уровень громкости устанавливают на 30-40 дБ выше порога слышимости обследуемого.2. The method according to claim 1, characterized in that the individual volume level is set to 30-40 dB above the audibility threshold of the subject. 3. Способ по п.1, отличающийся тем, что уровень нелинейных частотных искажений составляет 1/12 октавы.3. The method according to claim 1, characterized in that the level of non-linear frequency distortion is 1/12 octave. 4. Способ по п.1, отличающийся тем, что вероятность правильного распознавания набора тестовых акустических речевых сигналов для обследуемых с отологически нормальным слухом составляет 0,9. 4. The method according to claim 1, characterized in that the probability of correct recognition of a set of test acoustic speech signals for subjects with otologically normal hearing is 0.9.
RU2010142084/14A 2010-10-13 2010-10-13 Method of estimating disturbances of aural perception of speech signals RU2446741C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2010142084/14A RU2446741C1 (en) 2010-10-13 2010-10-13 Method of estimating disturbances of aural perception of speech signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2010142084/14A RU2446741C1 (en) 2010-10-13 2010-10-13 Method of estimating disturbances of aural perception of speech signals

Publications (1)

Publication Number Publication Date
RU2446741C1 true RU2446741C1 (en) 2012-04-10

Family

ID=46031538

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010142084/14A RU2446741C1 (en) 2010-10-13 2010-10-13 Method of estimating disturbances of aural perception of speech signals

Country Status (1)

Country Link
RU (1) RU2446741C1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2611909C1 (en) * 2015-12-28 2017-03-01 государственное бюджетное образовательное учреждение высшего профессионального образования "Первый Санкт-Петербургский государственный медицинский университет имени академика И.П. Павлова" Министерства здравоохранения Российской Федерации Method for rhythmic stimuli perception testing
RU2639856C1 (en) * 2017-01-10 2017-12-22 Федеральное государственное бюджетное образовательное учреждение высшего образования "Кубанский государственный медицинский университет" Министерства здравоохранения Российской Федерации, ФГБОУ ВО КубГМУ Минздрава России Method for screening diagnostics of sensoneural hearing function disorders in adults

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2147833C1 (en) * 1998-05-19 2000-04-27 Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи МЗ РФ Method for evaluating noise immunity in speech signals perception
RU2219839C2 (en) * 2001-09-14 2003-12-27 Асламазова Валентина Ивановна Method for evaluating functional adaptation capabilities of hearing system
WO2010092566A1 (en) * 2009-02-02 2010-08-19 Carmel - Haifa University Economic Corp Ltd. Auditory diagnosis and training system apparatus and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2147833C1 (en) * 1998-05-19 2000-04-27 Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи МЗ РФ Method for evaluating noise immunity in speech signals perception
RU2219839C2 (en) * 2001-09-14 2003-12-27 Асламазова Валентина Ивановна Method for evaluating functional adaptation capabilities of hearing system
WO2010092566A1 (en) * 2009-02-02 2010-08-19 Carmel - Haifa University Economic Corp Ltd. Auditory diagnosis and training system apparatus and method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
КОРОТКОВ Ю.В. Речевые технологии в аудиологической практике. Автореф. дисс. - СПб., 2008, с.7-21. JERGER J. New horizons in speech audiometry? J Am Acad Audiol. 2010 Jul-Aug; 21(7):424-5. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2611909C1 (en) * 2015-12-28 2017-03-01 государственное бюджетное образовательное учреждение высшего профессионального образования "Первый Санкт-Петербургский государственный медицинский университет имени академика И.П. Павлова" Министерства здравоохранения Российской Федерации Method for rhythmic stimuli perception testing
RU2639856C1 (en) * 2017-01-10 2017-12-22 Федеральное государственное бюджетное образовательное учреждение высшего образования "Кубанский государственный медицинский университет" Министерства здравоохранения Российской Федерации, ФГБОУ ВО КубГМУ Минздрава России Method for screening diagnostics of sensoneural hearing function disorders in adults

Similar Documents

Publication Publication Date Title
US20080045805A1 (en) Method and System of Indicating a Condition of an Individual
KR20190114303A (en) Method and system for cognitive function test
Rennoll et al. Electronic stethoscope filtering mimics the perceived sound characteristics of acoustic stethoscope
Brännström et al. Acceptance of background noise, working memory capacity, and auditory evoked potentials in subjects with normal hearing
Kamerer et al. Examining physiological and perceptual consequences of noise exposure
RU2446741C1 (en) Method of estimating disturbances of aural perception of speech signals
Ching et al. Acoustic change complex for assessing speech discrimination in normal-hearing and hearing-impaired infants
Zhao et al. Pure tone audiometry and speech audiometry
Roberts et al. Hearing levels of children by age and sex: United States.
Vance et al. Auditory processing deficits in a teenager with Landau-Kleffner syndrome
Ma Beyond conventional audiograms: Thresholds in quiet and noise and their diagnostic potential for noise-induced cochlear synaptopathy
Jorgensen The potential impact of undiagnosed hearing loss on the diagnosis of dementia
Sheehan et al. Acceptability of background noise amongst children diagnosed with an auditory processing disorder
RU2748409C1 (en) Method of express diagnostics of hearing level
Lucker Auditory processing testing: In the booth versus outside the booth
Caldwell et al. Effect of probe tube insertion depth on spectral measures of speech
Lima et al. Performance of adults with hearing loss on speech recognition index with recorded and live voice material
Shao Evaluation of Digits-in-Noise Test and Hearing Handicap Inventory for Adults Screening in Patients with Occupational Noise-Induced Hearing Loss
Kondraciuk Impact of Masker Type and Reverberation on Pupillary Response and Listening Effort
Lovett et al. The impact of presentation level on SCAN-A test performance
Zhang et al. Effect of Titrated Exposure to Non-Traumatic Noise on Unvoiced Speech Recognition in Human Listeners with Normal Audiological Profiles
Burgdorf Ling-6 sounds as a hearing screening tool
Martin Considering Extended High-Frequency Audiometry as a Screening Tool for Auditory Processing Disorder
CN114521892A (en) Method and device for high octave hearing test
Deoisres Auditory cortical responses as an objective predictor of speech-in-noise performance

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20161014