RU2313280C1 - Method for studying vocal cords functional state - Google Patents

Method for studying vocal cords functional state Download PDF

Info

Publication number
RU2313280C1
RU2313280C1 RU2006116845/14A RU2006116845A RU2313280C1 RU 2313280 C1 RU2313280 C1 RU 2313280C1 RU 2006116845/14 A RU2006116845/14 A RU 2006116845/14A RU 2006116845 A RU2006116845 A RU 2006116845A RU 2313280 C1 RU2313280 C1 RU 2313280C1
Authority
RU
Russia
Prior art keywords
phoneme
state
test
voice
wavelet
Prior art date
Application number
RU2006116845/14A
Other languages
Russian (ru)
Inventor
Игорь Валентинович Плешков (RU)
Игорь Валентинович Плешков
Сергей Алексеевич Филист (RU)
Сергей Алексеевич Филист
Надежда Валерьевна Краснова (RU)
Надежда Валерьевна Краснова
Юрий Андреевич Блинков (RU)
Юрий Андреевич Блинков
Original Assignee
Государственное образовательное учреждение высшего профессионального образования "Курский государственный технический университет"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования "Курский государственный технический университет" filed Critical Государственное образовательное учреждение высшего профессионального образования "Курский государственный технический университет"
Priority to RU2006116845/14A priority Critical patent/RU2313280C1/en
Application granted granted Critical
Publication of RU2313280C1 publication Critical patent/RU2313280C1/en

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

FIELD: medicine.
SUBSTANCE: method involves transforming voice signal of vocalized test phoneme into electric signal by means of acoustic transducer and recording it as discrete readings sequence on magnetic carrier. The so produced discrete sequence is reproduced as wavelet-plane segmented in a way that each segment represents spectral structure of the test phoneme. Characteristic attribute correlating to vocal cord state is selected in each interval. Its value is estimated by expert. Machalanobis distance from a point corresponding to attribute vector to class centroids is determined on the so built attribute space. The centroids have been defined a priory for given learning samples in the same attribute space. Vocal cords state is considered to belong to the class on which the Machalanobis distance reaches minimum.
EFFECT: higher specificity of functional state analysis.
4 dwg, 1 tbl

Description

Изобретение относится к медицине, а именно к способам качественно-количественного анализа функционального состояния голосовых складок.The invention relates to medicine, namely to methods for qualitatively-quantitative analysis of the functional state of the vocal folds.

Известен способ оценки фонаторных колебаний голосовых складок, в котором на основе экспертной бальной оценки пяти качественных характеристик колебаний голосовых складок определяется индекс вибраторных нарушений, по величине которого делается заключение о наличие голосовых нарушений (см. Использование видеоларингостробоскопии в фониатрической практике - пособие для врача. Московский научно-исследовательский институт уха, горла и носа. Москва. 1997. 22 с.).There is a method for assessing phonator vibrations of the vocal folds, in which, based on an expert ball score of five qualitative characteristics of the vibrations of the vocal folds, the index of vibratory disorders is determined, the magnitude of which makes a conclusion about the presence of voice disorders (see Using video laryngostroboscopy in phoniatric practice - a manual for a doctor. Moscow Scientific - Research Institute of the Ear, Throat and Nose. Moscow. 1997.22 p.).

Однако этот способ диагностики недостаточно эффективен в силу интегрального характера индекса вибраторных нарушений, что не позволяет дифференцировать голосовые нарушения; ограниченности динамического диапазона экспертной оценки (от одного до трех баллов), что снижает как чувствительность, так и специфичность способа; частого отсутствия возможности определения индекса вибраторных нарушений на основании всех пяти характеристик и отсутствия полной идентичности условий при постановке эксперимента, что затрудняет сопоставимость типа голосовых нарушений и численного значения индексов вибраторных нарушений; и отсутствия возможности ретроспективного анализа.However, this diagnostic method is not effective enough due to the integral nature of the index of vibratory disturbances, which does not allow to differentiate voice disturbances; the limited dynamic range of the expert assessment (from one to three points), which reduces both the sensitivity and the specificity of the method; the frequent lack of the ability to determine the index of vibratory disturbances on the basis of all five characteristics and the lack of complete identical conditions when setting up the experiment, which complicates the comparability of the type of voice disturbances and the numerical value of the indices of vibratory disturbances; and the lack of retrospective analysis.

Наиболее близким к изобретению является способ исследования голоса, при котором определяют особенности способности голосовоспроизводящего аппарата к речеобразованию (см. А.А.Скоромец, Т.А.Скоромец "Топическая диагностика заболеваний нервной системы". Политехника, издательство Санкт-Петербург, 2000 г., стр.141). При этом для записи исследуемых звуков речи используют устройства, в которых посредством акустических датчиков звуки речи преобразуются в электрические колебания, которые затем усиливаются и могут быть представлены в виде записи, например, на магнитную ленту или в виде кривой на бумагу (см. Н.М.Ливенцев. "Курс физики". М.: Высшая школа, 1974 г., стр.114-115).Closest to the invention is a method of voice research, which determines the characteristics of the ability of the voice-reproducing apparatus for speech formation (see A.A. Skoromets, T.A. Skoromets "Topical Diagnosis of Nervous System Diseases. Polytechnic, St. Petersburg, 2000). p. 141). At the same time, devices are used to record the studied speech sounds, in which, through acoustic sensors, speech sounds are converted into electrical vibrations, which are then amplified and can be represented as recordings, for example, on magnetic tape or in the form of a curve on paper (see N.M Liventsev. "The course of physics." M.: Higher School, 1974, pp. 114-115).

Недостатками этого способа, так же как и предыдущего, являются низкая специфичность и требование высокой квалификация эксперта для принятия решения о наличие или отсутствие патологии голосового аппарата.The disadvantages of this method, as well as the previous one, are the low specificity and the requirement for a highly qualified expert to decide on the presence or absence of pathology of the vocal apparatus.

Задачей изобретения является повышение специфичности анализа функционального состояния голосовых складок, что позволит сократить сроки лечения и увеличить время ремиссии.The objective of the invention is to increase the specificity of the analysis of the functional state of the vocal folds, which will reduce the treatment time and increase the time of remission.

Для этого в известном способе исследования голоса, включающем преобразование с помощью акустического датчика сигнала вокализированной тестовой фонемы в электрический сигнал и запись его на магнитный носитель в виде последовательности дискретных отсчетов, полученная дискретная последовательность представляется в виде вейвлет-плоскости, которая сегментируется на сегменты, каждый из которых отражает спектральную структуру тестовой фонемы, в каждом сегменте выбирается характерный признак, который коррелирован с состоянием голосовых складок, его количественная величина оценивается экспертом, и в полученном таким образом признаковом пространстве определяются расстояния Махаланобиса от точки, соответствующей вектору признаков, до центроид классов, априорно определенных для конкретных обучающих выборок в том же признаковом пространстве; и состояние голосовых складок относят к тому классу, расстояние Махаланобиса для которого наименьшее.To do this, in the known method of voice research, which includes converting a vocalized test phoneme signal into an electrical signal using an acoustic sensor and recording it onto a magnetic medium as a sequence of discrete samples, the resulting discrete sequence is represented as a wavelet plane that is segmented into segments, each of which reflects the spectral structure of the test phoneme, a characteristic feature is selected in each segment, which is correlated with the state of voice folds, its quantitative value is estimated by an expert, and in the attribute space thus obtained, the distances of the Mahalanobis from the point corresponding to the attribute vector to the centroid classes determined a priori for specific training samples in the same attribute space are determined; and the state of the vocal folds is assigned to the class for which the Mahalanobis distance is the smallest.

На фиг.1 изображена структурная схема автоматизированной системы, предназначенной для реализации предлагаемого способа. Она включает стереогарнитуру 3, предназначенную для подключения к пациенту 2; аналоговый интерфейс 4, входы которого подключены к выходу стереогарнитуры 3; ЭВМ 5, подключенную к выходу аналогового интерфеса 4; монитор 6, подключенный к ЭВМ 5 и предназначенный для реализации взаимодействия между врачом 1, пациентом 2 и модулем оцифровки сигнала ЭВМ 5.Figure 1 shows the structural diagram of an automated system designed to implement the proposed method. It includes a stereo headset 3, designed to connect to patient 2; analog interface 4, the inputs of which are connected to the output of the stereo headset 3; A computer 5 connected to the output of the analog interface 4; monitor 6 connected to the computer 5 and designed to implement the interaction between the doctor 1, patient 2 and the module for digitizing the signal of the computer 5.

На фиг.2, а представлен сегментированный спектр Фурье сигнала голоса (в качестве иллюстрации выбрана фонема И), а на фиг.2, б - сегментированное вейвлет-преобразование того же сигнала.Figure 2a shows a segmented Fourier spectrum of the voice signal (the phoneme And is selected as an illustration), and figure 2b shows a segmented wavelet transform of the same signal.

На фиг.3 показаны три сегмента А вейвлет-плоскостей фонемы И: с высокой степенью регулярности частот (X1=4,5) вверху; со средней степенью (Х1=2,5) в центре; с низкой регулярностью частот (Х1=1,5) внизу.Figure 3 shows three segments A of the wavelet planes of the phoneme And: with a high degree of frequency regularity (X1 = 4,5) at the top; with an average degree (X1 = 2.5) in the center; with low frequency regularity (X1 = 1.5) below.

На фиг.4, а показан фрагмент таблицы экспериментальных данных для обучающих выборок трех классов, а на фиг.4, б - фрагмент таблицы с расстояниями Махаланобиса, полученных в пакете STATISTICA 6, для обучающей и контрольной выборок тех же классов.Figure 4a shows a fragment of the experimental data table for training samples of three classes, and figure 4b shows a fragment of a table with Mahalanobis distances obtained in STATISTICA 6 for training and control samples of the same classes.

Способ осуществляется следующим образом.The method is as follows.

К пациенту 2 подключают стереогарнитуру 3. После этого врач 1 предлагает ему фонировать одну из гласных, например И. Команды начала фонирования, времени фонации, установки частоты дискретизации сигнала голоса задаются врачом 1 через интерфейсный модуль ЭВМ 5 и являются входными параметрами модуля оцифровки сигнала, который входит в программное обеспечение ЭВМ 5. Время фонации составляет 5 с. Частота дискретизации сигнала голоса - 11000 Гц. Обратная связь по моменту начала фонации и по времени фонации осуществляется между врачом 1, пациентом 2 и модулем оцифровки сигнала ЭВМ 5 через монитор 6 (см. фиг.1). В результате такого взаимодействия в памяти ЭВМ 5 записывается сигнал голоса длиною 5 с.A stereo headset 3 is connected to patient 2. After this, doctor 1 offers him to phonate one of the vowels, for example I. The commands for starting the phoning, phonation time, and setting the sampling frequency of the voice signal are set by doctor 1 through the computer interface module 5 and are the input parameters of the signal digitizing module, which included in computer software 5. The phonation time is 5 s. The sampling frequency of the voice signal is 11000 Hz. Feedback on the moment of the start of phonation and on the time of phonation is carried out between the doctor 1, patient 2 and the module for digitizing the signal of the computer 5 through the monitor 6 (see figure 1). As a result of this interaction, a voice signal with a length of 5 s is recorded in the memory of the computer 5.

Затем посредством визуального анализа записанного сигнала с помощью интерфейсного модуля и модуля оцифровки сигнала ЭВМ 5 из полученного массива отсчетов сигнала голоса выбирают отрезок длиной в 0,15 с, наименее подверженный артефактам и помехам, и получают его вейвлет-преобразование. Указанные процедуры могут быть выполнены в пакете Matlab 6.1 (см. Дьяконов В.П. Вейвлеты. От теории к практике. «Солон». 2004. 448 с.).Then, by visual analysis of the recorded signal using the interface module and the computer signal digitization module 5, from the obtained array of samples of the voice signal, a length of 0.15 s is selected that is least susceptible to artifacts and interference, and its wavelet transform is obtained. The indicated procedures can be performed in the Matlab 6.1 package (see Dyakonov VP Wavelets. From theory to practice. Solon. 2004. 448 pp.).

На фиг.2, б представлена вейвлет-плоскость сигнала голоса, записанного с вышеуказанными параметрами при фонации звука И женщиной со здоровым голосовым аппаратом. Для диагностики состояния голосового аппарата по вейвлет-плоскости необходимо синтезировать признаковое пространство, для чего вейвлет-плоскость фиг.2, б разбивается на пять сегментов: А, В, С, D, и Е, дислокации которых показаны соответствующими стрелками. Принцип этого деления определяется спектральной структурой тестовой фонемы.Figure 2, b shows the wavelet plane of the voice signal recorded with the above parameters during sound phonation AND by a woman with a healthy voice apparatus. To diagnose the state of the vocal apparatus along the wavelet plane, it is necessary to synthesize the feature space, for which the wavelet plane of FIG. 2, b is divided into five segments: A, B, C, D, and E, the dislocations of which are shown by the corresponding arrows. The principle of this division is determined by the spectral structure of the test phoneme.

На фиг.2, а показан типичный спектр Фурье сигнала голоса фонемы И и его сегменты, соответствующие сегментам вейвлет-плоскости фиг.2, б. Сегмент А включает высокочастотную область вейвлет-плоскости - зону обертонов, сегмент В соответствует области второй форманты, сегмент С - это пограничная область между второй и первой формантой, сегмент D - это зона первой форманты, сегмент Е - это низкочастотная область, к которой относятся все частоты вейвлет-плоскости, лежащие ниже частоты основного тона. Признаковое пространство синтезируется, используя эту сегментацию, следующим образом.Figure 2, a shows a typical Fourier spectrum of the voice signal of the phoneme And and its segments corresponding to the segments of the wavelet plane of figure 2, b. Segment A includes the high-frequency region of the wavelet plane — the overtone zone, segment B corresponds to the region of the second formant, segment C is the boundary region between the second and first formant, segment D is the region of the first formant, segment E is the low-frequency region, to which all wavelet plane frequencies below the fundamental frequency. The attribute space is synthesized using this segmentation as follows.

Первый информативный признак X1 характеризует регулярность частоты по времени в сегменте А и оценивается по пятибалльной системе на основе экспертной оценки. На фиг.3 приведены три сегмента А для трех пациентов с различной регулярностью вейвлет-коэффициентов: от 1,5 до 4,5.The first informative feature X1 characterizes the frequency regularity in time in segment A and is estimated using a five-point system based on expert judgment. Figure 3 shows three segments A for three patients with different regularity of wavelet coefficients: from 1.5 to 4.5.

Второй признак Х2 характеризует степень вариабельности величин вейвлет-коэффициентов вдоль осей времени и частоты в сегментах В и D, соответствующих зонам дислокации второй и первой формантам фонемы И. Он также оценивается по пятибалльной системе на основе экспертной оценки.The second attribute X2 characterizes the degree of variability of the values of the wavelet coefficients along the time and frequency axes in segments B and D corresponding to the dislocation zones of the second and first phoneme formants I. It is also evaluated using a five-point system based on expert judgment.

Третий информативный признак Х3 характеризуется отношением энергий в сегментах В и D и приблизительно может быть рассчитан как отношение площадей этих сегментов.The third informative feature X3 is characterized by the ratio of energies in segments B and D and can approximately be calculated as the ratio of the areas of these segments.

Четвертый и пятый информативные признаки Х4 и Х5 характеризуют степень локализации формант и определяются расстоянием (по оси частот) между верхней и нижней границами сегментов В и D соответственно. Чтобы эти признаки не зависели от параметров вейвлет-преобразования, их целесообразно нормировать по частотному диапазону, который занимает вейвлет-плоскость.The fourth and fifth informative features X4 and X5 characterize the degree of localization of formants and are determined by the distance (along the frequency axis) between the upper and lower boundaries of segments B and D, respectively. So that these signs do not depend on the parameters of the wavelet transform, it is advisable to normalize them over the frequency range that the wavelet plane occupies.

Для получения диапазонов изменения этих признаков нами проведены статистические исследования вейвлет-плоскостей пациентов в норме и с характерными патологиями. В таблице представлены результаты исследования для функциональных и органических дисфоний.To obtain ranges of changes in these signs, we conducted statistical studies of the wavelet planes of patients in normal conditions and with characteristic pathologies. The table presents the results of a study for functional and organic dysphonias.

ТаблицаTable Вейвлет-описания информативных признаков фонемы И для некоторых классов заболеваний голосового трактаWavelet descriptions of informative signs of the phoneme AND for some classes of diseases of the vocal tract ПоказательIndicator НормаNorm Функциональная дисфонияFunctional dysphonia Органическая дисфонияOrganic dysphonia Воспалительные заболевания гортаниInflammatory diseases of the larynx X1X1 4...54 ... 5 3...43 ... 4 1...21 ... 2 0...10 ... 1 Х2X2 0...10 ... 1 1...21 ... 2 2...32 ... 3 3...53 ... 5 Х3X3 0,35...0,440.35 ... 0.44 0,1...0,150,1 ... 0,15 0,01...0,10.01 ... 0.1 0...0,10 ... 0.1 Х4X4 0,05...0,10.05 ... 0.1 0,04...0,080.04 ... 0.08 0,02...0,040.02 ... 0.04 0...0,020 ... 0.02 Х5X5 0,1...0,150,1 ... 0,15 0,1...0,120,1 ... 0,12 0,12...0,150.12 ... 0.15 0,1...0,150,1 ... 0,15

Полученные вейвлет-описания информативных признаков класса «норма» иллюстрирует фиг.2, б.Received wavelet descriptions of informative features of the class "norm" illustrates figure 2, b.

На фиг.2, б видим, что в области обертонов наблюдается высокая регулярность, которая может быть оценена 4...5 баллами. Наиболее низкая вариабельность Х2 в первой форманте (сегмент D), которая может быть оценена 0...1 баллом. Среднестатистическое соотношение энергий сегментов В и D лежит в пределах 0,35...0,44. Показатели локализации формант составляют 0,05...0,1 и 0,1...0,15.In figure 2, b we see that in the region of overtones there is a high regularity, which can be estimated 4 ... 5 points. The lowest X2 variability in the first formant (segment D), which can be rated 0 ... 1 points. The average ratio of the energies of segments B and D lies in the range 0.35 ... 0.44. The localization indicators of formants are 0.05 ... 0.1 and 0.1 ... 0.15.

Для классификации нарушений голосового аппарата в выбранном признаковом пространстве используем дискриминантный анализ в пакете STATISTICA 6 (см. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. (+CD). - СПб.: Питер, 2003. 688 с.).To classify violations of the vocal apparatus in the selected feature space, we use discriminant analysis in the STATISTICA 6 package (see Borovikov V. STATISTICA. The Art of Computer Data Analysis: For Professionals. 2nd ed. (+ CD). - St. Petersburg: Peter, 2003 .688 p.).

Для каждой совокупности объектов определенного класса (выборке) можно определить точку, координаты которой представляют средние для всех переменных в многомерном пространстве, определенных в рассматриваемой модели. Эти точки называются центроидами классов. Для каждого наблюдения можно затем вычислить его расстояние Махаланобиса до каждой центроиды (до каждого класса). Наблюдение признается принадлежащем к тому классу, к которому оно ближе, т.е. для которого расстояние Махаланобиса минимально (см. Боровиков В. STISTICA. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. (+CD). - СПб.: Питер, 2003. 688 с. CD, раздел «Дискриминантный анализ»).For each set of objects of a certain class (sample), you can define a point whose coordinates represent the averages for all variables in the multidimensional space defined in the model under consideration. These points are called class centroids. For each observation, you can then calculate its Mahalanobis distance to each centroid (to each class). An observation is recognized as belonging to the class to which it is closer, i.e. for which the distance of Mahalanobis is minimal (see Borovikov V. STISTICA. The Art of Computer Data Analysis: For Professionals. 2nd ed. (+ CD). - St. Petersburg: Peter, 2003. 688 pp. CD, section “Discriminant Analysis” )

Фрагмент таблицы с обучающей выборкой в пакете STATISTICA 6 приведен на фиг.4, а. На фиг.4, б показана таблица с расстояниями Махаланобиса для обучающей и контрольной выборок.A fragment of a table with a training set in the STATISTICA 6 package is shown in Fig. 4, a. Figure 4, b shows a table with the distances of Mahalanobis for training and control samples.

В общем случае пациент считается принадлежащим к тому классу, для которого расстояние Махаланобиса минимально. Однако врач, анализируя числовые значения расстояний Махаланобиса, может вводить свои критерии и отнести пациента к другому классу с близким, но не минимальным значением расстояния Махаланобиса.In general, a patient is considered to belong to the class for which the Mahalanobis distance is minimal. However, the doctor, analyzing the numerical values of the distances of the Mahalanobis, can introduce his own criteria and assign the patient to another class with a close, but not minimum value of the distance of the Mahalanobis.

Предлагаемый способ был апробирован более чем на 300 больных с заболеваниями голосового аппарата разной степени тяжести и разных возрастов.The proposed method has been tested on more than 300 patients with diseases of the vocal apparatus of varying severity and different ages.

Конкретные примерыCase studies

Пример 1. Больная Н., 12 лет, предъявляет жалобы на быструю голосовую утомляемость, ощущение «кома» в горле. Голос тихий, слабый, тусклый, при длительной голосовой нагрузке охриплый.Example 1. Patient N., 12 years old, complains of rapid voice fatigue, a sensation of "coma" in the throat. The voice is quiet, weak, dull, with a long voice load hoarse.

Вейвлет-диагноз: Х1=2,5; Х2=2; Х3=0,1; Х4=0,05; Х5=0,12.Wavelet diagnosis: X1 = 2.5; X2 = 2; X3 = 0.1; X4 = 0.05; X5 = 0.12.

Компьютерный диагноз: функциональная дисфония.Computer diagnosis: functional dysphonia.

Непрямая ларингоскопия: голосовые складки обычной окраски. При фонации отмечается их неполное смыкание с образованием голосовой щели овальной формы.Indirect laryngoscopy: vocal folds of normal color. With phonation, their incomplete closure with the formation of a glottis of the oval shape is noted.

Микроларингоскопия: незначительное усиление сосудистого рисунка слизистой голосовых складок.Microlaryngoscopy: a slight increase in the vascular pattern of the mucous membrane of the vocal folds.

Ларингостробоскопия: амплитуда колебательных движений голосовых складок снижена, время фонации укорочено.Laryngostroboscopy: the amplitude of the oscillatory movements of the vocal folds is reduced, the phonation time is shortened.

Диагноз: Гипотонусная дисфония.Diagnosis: Hypotonic dysphonia.

Пример 2. Больной В., 14 лет, беспокоит чувство дискомфорта в гортани. Голос охриплый, часто срывается с грудного звучания на фальцет.Example 2. Patient C., 14 years old, worried about a feeling of discomfort in the larynx. The voice is hoarse, often breaking from the chest sound to falsetto.

Вейвлет-диагноз: Х1=3; Х2=2; Х3=0,12; Х4=0,05; Х5=0,11.Wavelet diagnosis: X1 = 3; X2 = 2; X3 = 0.12; X4 = 0.05; X5 = 0.11.

Компьютерный диагноз: функциональная дисфония. Непрямая ларингоскопия: гиперемия и отечность слизистой голосовых складок. При фонации отмечается их не полное смыкание с образованием в межчерпаловидном пространстве мутационного треугольника.Computer diagnosis: functional dysphonia. Indirect laryngoscopy: hyperemia and swelling of the mucous membrane of the vocal folds. During phonation, their incomplete closure is noted with the formation of a mutation triangle in the interchaloid space.

Микроларингоскопия: инъецированность мелких кровеносных сосудов слизистой оболочки гортани.Microlaryngoscopy: injection of small blood vessels of the laryngeal mucosa.

Ларингостробоскопия: фонаторные колебания голосовых складок асинхронные.Laryngostroboscopy: asynchronous phonatory vibrations of the vocal folds.

Диагноз: Мутационная дисфония.Diagnosis: Mutational dysphonia.

Пример 3. Больной Е., 10 лет, жалуется на навязчивое откашливание и неприятные, болевые ощущения в области глотки, гортани, шеи, быструю голосовую утомляемость. Голос хриплый, звучит напряженно.Example 3. Patient E., 10 years old, complains of obsessive coughing and unpleasant, pain in the throat, larynx, neck, rapid voice fatigue. The voice is hoarse, it sounds intense.

Вейвлет-диагноз: X1=3,5; Х2=1,5; Х3=0,12; Х4=0,05; Х5=0,11.Wavelet diagnosis: X1 = 3.5; X2 = 1.5; X3 = 0.12; X4 = 0.05; X5 = 0.11.

Компьютерный диагноз: функциональная дисфония.Computer diagnosis: functional dysphonia.

Непрямая ларингоскопия: плотное соприкосновение голосовых складок во время фонации, гиперемия и небольшая отечность их свободного края.Indirect laryngoscopy: tight contact of the vocal folds during phonation, hyperemia and slight swelling of their free edge.

Ларингостробоскопия: голосовые складки выглядят неподвижными, находятся в напряженном сомкнутом состоянии в сочетании с кратковременными периодами быстрозатухающих колебаний малой амплитуды.Laryngostroboscopy: the vocal folds look motionless, are in a tense closed state in combination with short-term periods of rapidly decaying oscillations of small amplitude.

Диагноз: гипертонусная дисфония.Diagnosis: hypertonic dysphonia.

Пример 4. Больной А., 9 лет, предъявляет жалобы на чувство упорного першения, дискомфорта в горле, кашель. Голос тихий, слабый, более охриплый по утрам. Днем голос становится чище и снова грубеет к вечеру. Вейвлет-диагноз: Х1=2,4; Х2=2,4; Х3=0,12; Х4=0,05; Х5=0,15.Example 4. Patient A., 9 years old, complains of a feeling of persistent perspiration, discomfort in the throat, cough. The voice is quiet, weak, more hoarse in the morning. In the afternoon, the voice becomes cleaner and coarser again in the evening. Wavelet diagnosis: X1 = 2.4; X2 = 2.4; X3 = 0.12; X4 = 0.05; X5 = 0.15.

Компьютерный диагноз: органическая дисфония - стадия неполной ремиссии.Computer diagnosis: organic dysphonia is a stage of incomplete remission.

Непрямая ларингоскопия: голосовые складки гиперемированы, утолщены, при фонации смыкаются не полностью. Вестибулярные складки уплотнены, гиперемированы, отечны.Indirect laryngoscopy: vocal folds are hyperemic, thickened, with phonation they do not close completely. The vestibular folds are compacted, hyperemic, swollen.

Микроларингоскопия: инъецированность кровеносных сосудов голосовых складок и скопление слизи на их поверхности.Microlaryngoscopy: injection of blood vessels of the vocal folds and accumulation of mucus on their surface.

Ларингостробоскопия: фонаторные колебания голосовых складок асинхронные, ослабленные.Laryngostroboscopy: phonator oscillations of the vocal folds are asynchronous, weakened.

Диагноз: Хронический ларингит - стадия неполной ремиссии.Diagnosis: Chronic laryngitis - stage of incomplete remission.

Пример 5. Больная Ю., 7 лет, голос слабый, охриплый. Больна в течение 1,5 мес после перенесенного в тяжелой форме инфекционного заболевания (гриппа).Example 5. Patient Yu., 7 years old, weak voice, hoarse. Sick for 1.5 months after suffering a severe form of an infectious disease (flu).

Вейвлет-диагноз: Х1=2,5; Х2=1,5; Х3=0,15; X4=0,1; X5=0,11.Wavelet diagnosis: X1 = 2.5; X2 = 1.5; X3 = 0.15; X4 = 0.1; X5 = 0.11.

Компьютерный диагноз: функциональная дисфония.Computer diagnosis: functional dysphonia.

Непрямая ларингоскопия, микроларингоскопия: правая голосовая складка находится в парамедиальном положении, движения левой половины гортани в полном объеме.Indirect laryngoscopy, microlaryngoscopy: the right vocal fold is in the paramedial position, the movement of the left half of the larynx is in full.

Ларингостробоскопия: колебания голосовой складки на стороне поражения, ослабленные, вялые с малой амплитудой.Laryngostroboscopy: vibrations of the vocal fold on the affected side, weakened, lethargic with small amplitude.

Диагноз: Инфекционный парез гортани.Diagnosis: Infectious paresis of the larynx.

Таким образом, выбрав соответствующую тестовую фонему и определив соответствующие обучающие выборки, получаем решающее правило, позволяющее разделить пациентов по функциональному состоянию голосовых складок на классы, соответствующие обучающим выборкам. При этом предлагаемый способ позволяет провести как объективное тестирование, так и интерактивный режим, при котором эксперт (врач) анализирует расположение объекта исследования (пациента) в пространстве признаков и при принятии решения руководствуется данными как компьютерной диагностики, так и результатами традиционных исследований.Thus, choosing the appropriate test phoneme and determining the appropriate training samples, we obtain a decisive rule that allows us to divide patients according to the functional state of the vocal folds into classes corresponding to the training samples. Moreover, the proposed method allows both objective testing and an interactive mode in which the expert (doctor) analyzes the location of the research object (patient) in the space of signs and, when making a decision, is guided by the data of both computer diagnostics and the results of traditional studies.

Claims (1)

Способ исследования функционального состояния голосовых складок, включающий преобразование с помощью акустического датчика сигнала голоса вокализированной тестовой фонемы в электрический сигнал и запись его на магнитный носитель в виде последовательности дискретных отсчетов, отличающийся тем, что полученную дискретную последовательность представляют в виде вейвлет-плоскости, которую сегментируют на сегменты, каждый из которых отражает спектральную структуру тестовой фонемы, в каждом сегменте выбирают характерный признак, который коррелирован с состоянием голосовых складок, его величину оценивает эксперт, и в полученном таким образом признаковом пространстве определяют расстояния Махаланобиса от точки, соответствующей вектору признаков, до центроид классов, априорно определенных для конкретных обучающих выборок в том же признаковом пространстве, и состояние голосовых складок относят к тому классу, расстояние Махаланобиса для которого наименьшее.A method for studying the functional state of voice folds, including converting a vocalized test phoneme voice signal into an electrical signal using an acoustic sensor and recording it onto a magnetic medium in the form of a sequence of discrete samples, characterized in that the obtained discrete sequence is presented in the form of a wavelet plane that is segmented into segments, each of which reflects the spectral structure of the test phoneme, in each segment choose a characteristic feature, which correlated with the state of the vocal folds, the expert evaluates its value, and in the attribute space obtained in this way, the distances of the Mahalanobis from the point corresponding to the attribute vector to the centroid classes a priori determined for specific training samples in the same attribute space are determined, and the state of the vocal folds is referred to that class for which the distance of the Mahalanobis is the smallest.
RU2006116845/14A 2006-05-16 2006-05-16 Method for studying vocal cords functional state RU2313280C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2006116845/14A RU2313280C1 (en) 2006-05-16 2006-05-16 Method for studying vocal cords functional state

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2006116845/14A RU2313280C1 (en) 2006-05-16 2006-05-16 Method for studying vocal cords functional state

Publications (1)

Publication Number Publication Date
RU2313280C1 true RU2313280C1 (en) 2007-12-27

Family

ID=39018784

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006116845/14A RU2313280C1 (en) 2006-05-16 2006-05-16 Method for studying vocal cords functional state

Country Status (1)

Country Link
RU (1) RU2313280C1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2559689C2 (en) * 2013-04-29 2015-08-10 Антон Павлович Лысак Method of determining risk of development of individual's disease by their voice and hardware-software complex for method realisation
RU2582050C1 (en) * 2015-01-28 2016-04-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Пензенский государственный университет" (ФГБОУ ВПО "Пензенский государственный университет") Method for adaptive processing of speech signals in conditions of unstable operation of speech apparatus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ТРИФОН ЛАМБРОУ и др. Применение вейвлет-преобразования к обработке медицинских сигналов и изображений, 02.03.1998 [он-лайн] [Найдено 24.01.2007] найдено из Интернет http://old.computerra.ru/offline/1998/236/1126/. AKAY M. Wavelet Applications in Medicine, IEEE Spectrum, 1997, Vol.34, No.5, p.50-56. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2559689C2 (en) * 2013-04-29 2015-08-10 Антон Павлович Лысак Method of determining risk of development of individual's disease by their voice and hardware-software complex for method realisation
RU2582050C1 (en) * 2015-01-28 2016-04-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Пензенский государственный университет" (ФГБОУ ВПО "Пензенский государственный университет") Method for adaptive processing of speech signals in conditions of unstable operation of speech apparatus

Similar Documents

Publication Publication Date Title
Mendonca et al. A review of obstructive sleep apnea detection approaches
US10007480B2 (en) Multi-parametric analysis of snore sounds for the community screening of sleep apnea with non-Gaussianity index
Amrulloh et al. Automatic cough segmentation from non-contact sound recordings in pediatric wards
Vizza et al. Methodologies of speech analysis for neurodegenerative diseases evaluation
Chen et al. Voice disorder identification by using Hilbert-Huang transform (HHT) and K nearest neighbor (KNN)
US20200093423A1 (en) Estimation of sleep quality parameters from whole night audio analysis
US6055501A (en) Counter homeostasis oscillation perturbation signals (CHOPS) detection
Klára et al. Voice disorder detection on the basis of continuous speech
de Oliveira Florencio et al. Differences and reliability of linear and nonlinear acoustic measures as a function of vocal intensity in individuals with voice disorders
Ding et al. Severity evaluation of obstructive sleep apnea based on speech features
Carvalho et al. Wavelet transform and artificial neural networks applied to voice disorders identification
Stemple Voice research: so what? A clearer view of voice production, 25 years of progress; the speaking voice
RU2313280C1 (en) Method for studying vocal cords functional state
Vatanparvar et al. Speechspiro: Lung function assessment from speech pattern as an alternative to spirometry for mobile health tracking
Asthana et al. Preliminary analysis of causes of infant cry
Shabber et al. A review and classification of amyotrophic lateral sclerosis with speech as a biomarker
Scalassara et al. Autoregressive decomposition and pole tracking applied to vocal fold nodule signals
JP2023503606A (en) Systems and methods for detecting lung abnormalities
Lin et al. Glottographic signal perturbation in biomechanically different types of dysphonia
Sorensen et al. A computerized algorithm for arousal detection in healthy adults and patients with Parkinson disease
Pessoa et al. Automated respiratory sound analysis
Brockmann‐Bauser Instrumental analysis of voice
Gupta et al. Correlating spirometry findings with auscultation sounds for diagnosis of respiratory diseases
Sun et al. Apnea and hypopnea events classification using amplitude spectrum trend feature of snores
US20220369997A1 (en) Systems and methods for analyzing frequency-following response to evaluate central nervous system function

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20080517