KR102647385B1 - Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same - Google Patents

Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same Download PDF

Info

Publication number
KR102647385B1
KR102647385B1 KR1020210073542A KR20210073542A KR102647385B1 KR 102647385 B1 KR102647385 B1 KR 102647385B1 KR 1020210073542 A KR1020210073542 A KR 1020210073542A KR 20210073542 A KR20210073542 A KR 20210073542A KR 102647385 B1 KR102647385 B1 KR 102647385B1
Authority
KR
South Korea
Prior art keywords
data
stroke
artificial intelligence
important
severity
Prior art date
Application number
KR1020210073542A
Other languages
Korean (ko)
Other versions
KR20220165058A (en
Inventor
송태진
김건하
장윤경
Original Assignee
이화여자대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이화여자대학교 산학협력단 filed Critical 이화여자대학교 산학협력단
Priority to KR1020210073542A priority Critical patent/KR102647385B1/en
Publication of KR20220165058A publication Critical patent/KR20220165058A/en
Application granted granted Critical
Publication of KR102647385B1 publication Critical patent/KR102647385B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

본 발명은 인공지능을 이용하여 음성패턴을 분석하고 이에 따라 삼킴장애 여부를 예측하는 장치 및 방법에 관한 것이다.
본 발명에 의하면, 뇌졸중 환자와 같은 신경계질환 환자에서 주 사망원인인 흡인성 폐렴과 같은 심각한 합병증을 기존의 침습적 방법이 아닌 비침습적으로 예측할 수 있으며, 음성 데이터 및 중요 연관 인자 데이터를 사용한 인공지능 모델을 통하여 예측을 수행함으로써 정확도와 신뢰성을 높일 수 있다.
The present invention relates to an apparatus and method for analyzing voice patterns using artificial intelligence and predicting whether a person has a swallowing disorder accordingly.
According to the present invention, serious complications such as aspiration pneumonia, which is the main cause of death in patients with neurological diseases such as stroke patients, can be predicted non-invasively rather than using existing invasive methods, and an artificial intelligence model using voice data and important associated factor data By performing predictions through , accuracy and reliability can be increased.

Description

인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 장치 및 방법{Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same}Device and method for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence {Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same}

본 발명은 인공지능을 이용하여 음성패턴을 분석하고 이에 따라 삼킴장애 여부를 예측하는 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for analyzing voice patterns using artificial intelligence and predicting whether a person has a swallowing disorder accordingly.

뇌졸중이란 뇌혈류의 흐름의 이상으로 인해 갑작스럽게 발생한 신경학적 결손을 의미한다. 의학적으로 뇌혈관 질환(腦血管疾患, CerebroVascular Accident, CVA)이라고 하며, 영어권 국가에서는 stroke라고 하고 한의학에서는 중풍(中風)부르는 것이 보통이다. Stroke refers to a neurological deficit that occurs suddenly due to an abnormality in cerebral blood flow. Medically, it is called CerebroVascular Accident (CVA). In English-speaking countries, it is called stroke, and in Oriental medicine, it is usually called stroke.

뇌는 몸 전체에서 무게로는 체중의 2%만 차지하지만, 뇌로 가는 혈류량은 전체 심박출량의 15%나 되고, 산소 소모량은 몸 전체 산소 소모량의 20%나 된다. The brain accounts for only 2% of the total body weight, but blood flow to the brain is as much as 15% of the total cardiac output, and oxygen consumption is as much as 20% of the entire body's oxygen consumption.

게다가 뇌는 에너지원으로 포도당만을 사용하므로 에너지 공급이 잠시만 중단되어도 쉽게 손상된다. 뇌혈류의 감소로 인해 에너지원이 감소하게 되면 결국 뇌졸중이 발생한다. Additionally, since the brain uses only glucose as an energy source, it is easily damaged even if energy supply is interrupted even for a moment. When energy sources decrease due to a decrease in cerebral blood flow, a stroke eventually occurs.

뇌졸중의 위험인자는 매우 다양하지만 대표적으로는 고혈압, 당뇨병, 이상지질혈증, 흡연, 알코올 섭취, 심방세동 등이 있다. 뇌졸중은 사망률이 높고, 치료에 많은 비용과 시간이 들어가며, 치료한다고 하여도 장애를 남기기 쉬운 질환이다. 특히 뇌졸중 발생 이후 다수의 환자가 음식이나 물을 삼키는데 어려움을 겪는 삼킴장애가 발생한다.Risk factors for stroke are very diverse, but typical examples include high blood pressure, diabetes, dyslipidemia, smoking, alcohol consumption, and atrial fibrillation. Stroke is a disease that has a high mortality rate, requires a lot of money and time to treat, and can easily leave behind disabilities even if treated. In particular, after a stroke, many patients develop swallowing disorders that make it difficult to swallow food or water.

이와 같이 뇌졸중으로 인해 삼킴장애가 발생하는 경우, 예후가 극히 불량하고 폐렴, 패혈증 등으로 사망하거나 영구한 장애가 남게 되는 경우가 드물지 않다. In this way, when dysphagia occurs due to a stroke, the prognosis is extremely poor and it is not uncommon for the patient to die from pneumonia, sepsis, etc. or remain permanently disabled.

이를 예방하기 위해 뇌졸중의 진단 및 치료 가이드라인에서는 삼킴장애의 여부 및 심각도를 반드시 확인하고 필요한 경우 경관식을 투여하는 등의 삼킴장애에 대한 적극적인 진단 및 치료를 권장하고 있다. To prevent this, the stroke diagnosis and treatment guidelines recommend active diagnosis and treatment of swallowing disorders, such as checking the presence and severity of swallowing disorders and administering tube feedings if necessary.

그러나, 현재 삼킴장애의 여부를 확인하려면 환자에게 물을 삼켜보게 하거나 조영제를 삼키게 한 뒤 방사선 촬영을 시행하는 방법 이외에 다른 방법이 없는 상태이다. However, there is currently no other way to check for dysphagia other than having the patient swallow water or a contrast agent and then performing radiography.

그런데 이러한 방법에서 야기되는 문제는. 검사시 물이나 조영제를 삼키게 하는 행위 자체가 환자에게 흡인(aspiration)를 유발함으로써, 흡인성 폐렴의 위험을 증가시킬 수 있고, 방사선에 불필요하게 노출되게 된다는 점이다. However, the problem that arises from this method is. The act of having the patient swallow water or contrast medium during the test itself can cause aspiration in the patient, increasing the risk of aspiration pneumonia and unnecessary exposure to radiation.

따라서, 삼킴장애 여부를 보다 간편하면서 환자에게 위해를 최소화 할 수 있도록 비침습적으로 예측하는 방법이 필요한 상황이다.Therefore, there is a need for a non-invasive method of predicting the presence or absence of swallowing disorders in a simpler manner and to minimize harm to patients.

한편, 후술하는 특허문헌 1에는 음성 분석을 통하여 뇌졸중 여부를 판단하는 방법이 개시되나, 이는 뇌졸중의 여부만을 판단하는 것으로서, 삼킴장애를 직간접적으로 판단하는 것은 아니다. 더욱이, 삼킴장애 여부는 음성 패턴 이외에도 여러가지 인자에 의해 발생하는 바, 이를 삼킴장애 여부 예측에 사용하기에는 다소 무리가 있다.Meanwhile, Patent Document 1, which will be described later, discloses a method of determining whether a person has a stroke through voice analysis, but this only determines whether a person has a stroke and does not directly or indirectly determine whether a swallowing disorder exists. Moreover, since swallowing disorders are caused by various factors other than speech patterns, it is somewhat difficult to use them to predict whether or not there are swallowing disorders.

KRKR 10-1958188 10-1958188 B1B1

이에, 본 발명은 상기한 종래의 문제점에 착안하여 이를 해결하기 위하여 안출된 것으로서, 비침습적이면서 정확도 높은 삼킴장애 예측 장치 및 방법을 제공하고자 한다.Accordingly, the present invention was developed to solve the above-described conventional problems, and aims to provide a non-invasive and highly accurate swallowing disorder prediction device and method.

인공지능을 기반으로 하여 삼킴장애 여부를 예측하는 장치로서, 다수의 뇌졸중 환자의 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터가 입력되는 입력부; 상기 입력부에 입력된 음성 데이터를 시각화 데이터로 변환하는 변환부; 상기 시각화 데이터 및 상기 중요 연관 인자 데이터를 독립변수로 하고, 상기 진단 데이터를 종속변수로 하는 학습 데이터를 이용하여 인공지능 모델을 통하여 예측 모델을 구축하는 모델링부; 상기 예측 모델에 예측 대상 환자의 음성 데이터 및 중요 연관 인자 데이터가 포함된 예측 대상 데이터를 적용하여 삼킴장애 여부를 예측하는 예측부;를 포함하며, 상기 중요 연관 인자 데이터는, 상기 음성 데이터 측정 시의 나이, 키, 체중, 허리둘레, 및 성별 데이터를 포함하는 신체 데이터, 뇌졸중의 종류, 뇌졸중의 크기, 뇌졸중의 심각도, 뇌졸중의 발생위치, 소혈관질환 여부 및 뇌신경 진찰 소견 데이터를 포함하는 뇌졸중 데이터, 고혈압, 당뇨병, 고지혈증, 협심증, 심근경색, 대사증후군, 심부전증, 구강질환 및 성대질환의 여부 또는 심각도 데이터를 포함하는 기저질환 데이터, 및 흡연 및 알콜 섭취 여부 또는 빈도, 및 약물 섭취 여부, 빈도 또는 종류 데이터를 포함하는 생활습관 데이터를 포함하는 장치를 제공한다.A device that predicts swallowing disorders based on artificial intelligence, comprising: an input unit where voice data, important associated factor data, and diagnostic data of multiple stroke patients are input; a conversion unit that converts voice data input to the input unit into visualization data; a modeling unit that constructs a prediction model through an artificial intelligence model using learning data that uses the visualization data and the important correlation factor data as independent variables and the diagnostic data as a dependent variable; and a prediction unit that predicts whether or not there is a swallowing disorder by applying prediction target data including voice data and important associated factor data of the patient to be predicted to the prediction model, wherein the important associated factor data is used when measuring the voice data. Physical data including age, height, weight, waist circumference, and gender data; stroke data including type of stroke, size of stroke, severity of stroke, location of stroke, presence of small vessel disease, and cranial nerve examination findings; Underlying disease data including data on the presence or severity of high blood pressure, diabetes, hyperlipidemia, angina pectoris, myocardial infarction, metabolic syndrome, heart failure, oral disease, and vocal cord disease, and the presence or frequency of smoking and alcohol intake, and the presence, frequency, or type of drug intake. A device including lifestyle data including data is provided.

또한, (a) 다수의 뇌졸중 환자로부터 수집된 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터가 입력되는 단계; (b) 입력된 상기 음성 데이터가 시각화 데이터로 변환되는 단계; (c) 상기 시각화 데이터 및 상기 중요 연관 인자 데이터를 독립변수로 하고, 상기 진단 데이터를 종속변수로 하는 학습 데이터가 인공지능 모델에 의해 이용되어 예측 모델이 구축되는 단계; (d) 구축된 상기 예측 모델에 예측 대상 환자의 음성 데이터 및 중요 연관 인자 데이터가 포함된 예측 대상 데이터를 적용하여 삼킴장애 여부가 예측되는 단계;를 포함하며, 상기 학습 데이터 및 상기 예측 대상 데이터에 각각 포함되는 중요 연관 인자 데이터는, 상기 음성 데이터 수집 시의 나이, 키, 체중, 허리둘레, 구강구조 및 성별 데이터를 포함하는 신체 데이터, 뇌졸중의 종류, 뇌졸중의 크기, 뇌졸중의 심각도, 및 뇌졸중의 발생위치 데이터를 포함하는 뇌졸중 데이터, 고혈압, 당뇨병, 고지혈증, 협심증, 심근경색, 대사증후군, 심부전증, 구강질환 및 성대질환의 여부 또는 심각도 데이터를 포함하는 기저질환 데이터, 및 흡연 및 알콜 섭취 여부 또는 빈도, 및 약물 섭취 여부, 빈도 또는 종류 데이터를 포함하는 생활습관 데이터를 포함하는 방법을 제공한다.In addition, (a) inputting voice data, important associated factor data, and diagnostic data collected from multiple stroke patients; (b) converting the input voice data into visualization data; (c) constructing a prediction model by using learning data with the visualization data and the important correlation factor data as independent variables and the diagnostic data as a dependent variable by an artificial intelligence model; (d) predicting whether or not there is a swallowing disorder by applying prediction target data including voice data and important associated factor data of the patient to be predicted to the constructed prediction model; comprising: predicting whether or not there is a swallowing disorder; The important associated factor data included are physical data including age, height, weight, waist circumference, oral structure, and gender data at the time of voice data collection, stroke type, stroke size, stroke severity, and stroke Stroke data including location of occurrence data, underlying disease data including the presence or severity data of high blood pressure, diabetes, hyperlipidemia, angina pectoris, myocardial infarction, metabolic syndrome, heart failure, oral disease, and vocal cord disease, and the presence or frequency of smoking and alcohol consumption. , and provides a method of including lifestyle data including drug intake, frequency, or type data.

상기 인공지능 모델은 합성곱 신경망(CNN, Convolutional Neural Network)인 것이 바람직하다.The artificial intelligence model is preferably a convolutional neural network (CNN).

또한, 상기 방법을 실행시키기 위한 컴퓨터 프로그램을 기록한 기록매체 및 상기 방법을 실행시키기 위하여 기록매체에 기록된 컴퓨터 프로그램을 제공한다.Additionally, a recording medium recording a computer program for executing the method and a computer program recorded on the recording medium for executing the method are provided.

본 발명에 의하면, 뇌졸중 환자와 같은 신경계질환 환자에서 주 사망원인인 흡인성 폐렴과 같은 심각한 합병증을 예측하기 위해, 삼킴장애를 기존의 침습적 방법이 아닌 비침습적으로 예측할 수 있다.According to the present invention, in order to predict serious complications such as aspiration pneumonia, which is the main cause of death in patients with neurological diseases such as stroke patients, swallowing disorders can be predicted non-invasively rather than using existing invasive methods.

또한, 음성 데이터 및 중요 연관 인자 데이터를 사용한 인공지능 모델을 통하여 예측을 수행함으로써 정확도와 신뢰성을 높일 수 있다.In addition, accuracy and reliability can be increased by making predictions through an artificial intelligence model using voice data and important related factor data.

도 1은, 본 발명의 일 실시예에 따른 삼킴장애 예측장치의 개략도이다.
도 2는, 본 발명의 일 실시예에 따른 삼킴장애 예측방법의 플로우 차트이다.
도 3은, 중요 연관 인자 데이터 중 신체 데이터와 진단 데이터의 관계를 나타내는 표이다.
도 4는, 중요 연관 인자 데이터 중 뇌졸중 데이터와 진단 데이터의 관계를 나타내는 표이다.
도 5는, 뇌내 소혈관질환의 종류를 나타낸다.
도 6은, 중요 연관 인자 데이터 중 기저질환 데이터와 진단 데이터의 관계를 나타내는 표이다.
도 7은, 중요 연관 인자 데이터 중 생활습관 데이터와 진단 데이터의 관계를 나타내는 표이다.
Figure 1 is a schematic diagram of a swallowing disorder prediction device according to an embodiment of the present invention.
Figure 2 is a flow chart of a swallowing disorder prediction method according to an embodiment of the present invention.
Figure 3 is a table showing the relationship between physical data and diagnostic data among important associated factor data.
Figure 4 is a table showing the relationship between stroke data and diagnosis data among important associated factor data.
Figure 5 shows types of intracerebral small vessel disease.
Figure 6 is a table showing the relationship between underlying disease data and diagnosis data among important associated factor data.
Figure 7 is a table showing the relationship between lifestyle data and diagnosis data among important associated factor data.

본 발명의 상기와 같은 목적, 특징 및 다른 장점들은 첨부도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명함으로써 더욱 명백해질 것이다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 기술되어야 할 것이다.The above objects, features and other advantages of the present invention will become more apparent by describing the preferred embodiments of the present invention in detail with reference to the accompanying drawings. In this process, the thickness of lines or sizes of components shown in the drawing may be exaggerated for clarity and convenience of explanation. In addition, the terms described below are terms defined in consideration of functions in the present invention, and may vary depending on the intention or custom of the user or operator. Therefore, definitions of these terms should be described based on the content throughout this specification.

또한, 기술되는 실시예는 발명의 설명을 위해 예시적으로 제공되는 것이며, 본 발명의 기술적 범위를 한정하는 것은 아니다.Additionally, the described embodiments are provided as examples for explanation of the invention and do not limit the technical scope of the invention.

이하, 첨부된 도 1 내지 도 6을 참조하여 본 발명의 일 실시예에 따른 인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 장치를 상세히 설명한다.Hereinafter, with reference to the attached FIGS. 1 to 6, a device for predicting whether a swallowing disorder exists by analyzing voice patterns based on artificial intelligence according to an embodiment of the present invention will be described in detail.

도 1에 나타낸 바와 같이, 본 발명에 따라, 인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 장치는, 입력부(100), 변환부(200), 모델링부(300), 및 예측부(400)를 포함한다.As shown in Figure 1, according to the present invention, a device for predicting whether a swallowing disorder exists by analyzing voice patterns based on artificial intelligence includes an input unit 100, a conversion unit 200, a modeling unit 300, and a prediction unit. Includes part 400.

입력부(100)에는 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터가 입력된다.Voice data, important related factor data, and diagnostic data are input into the input unit 100.

입력부(100)는 음성 데이터를 입력받기 위한 제1입력장치(110), 중요 연관 인자 데이터 및 진단 데이터를 입력받기 위한 제2입력장치(120)로 구성될 수 있다.The input unit 100 may be comprised of a first input device 110 for receiving voice data, and a second input device 120 for receiving important associated factor data and diagnostic data.

제1입력장치(110)는 예를 들면, 음성이 입력될 수 있는 마이크로폰, 또는 마이크로폰이 내장된 기기 등으로 구성될 수 있으나, 이에 한정되는 것은 아니다.The first input device 110 may be, for example, a microphone through which voice can be input, or a device with a built-in microphone, but is not limited thereto.

제2입력장치(120)는 중요 연관 인자 데이터 및 진단 데이터를 입력받기 위한 문자 또는 이미지 입력장치로 구성되며, 예를 들면, 키보드, 키패드, 키버튼, 마우스, 터치형 입력장치 등을 들 수 있으나, 이에 한정되지는 않는다.The second input device 120 consists of a text or image input device for receiving important related factor data and diagnostic data, and examples include a keyboard, keypad, key button, mouse, and touch-type input device. , but is not limited to this.

입력부(100)를 통하여 입력되는 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터에 대하여는 후술한다.Voice data, important associated factor data, and diagnostic data input through the input unit 100 will be described later.

변환부(200)는 입력부(100)에 입력된 각 데이터 중 음성 데이터를 시각화 데이터로 변환한다.The conversion unit 200 converts voice data among each data input to the input unit 100 into visualization data.

변환부(200)는 음성 데이터를 시각화하기 위한 방법 또는 프로그램을 통하여 음성 데이터에 포함된 신호를 시각화하며, 이러한 방법에는 예를 들면 푸리에(Fourier) 합성, 변환 등을 이용할 수 있으나, 이에 한정되지는 않는다. The converter 200 visualizes signals included in the voice data through a method or program for visualizing the voice data. This method may use, for example, Fourier synthesis or transformation, but is not limited thereto. No.

변환부(200)는 음성 데이터를 파형(Wave form), 스펙트럼(Spectrum) 또는 스펙트로그램(Spectrogram) 등으로 변환함으로써 시각화 데이터를 생성한다.The conversion unit 200 generates visualization data by converting voice data into a wave form, spectrum, or spectrogram.

모델링부(300)는 상기 시각화 데이터, 중요 연관 인자 데이터 및 진단 데이터를 포함하는 학습 데이터를 이용하여 인공지능 모델을 통하여 예측 모델을 구축한다.The modeling unit 300 builds a prediction model through an artificial intelligence model using learning data including the visualization data, important correlation factor data, and diagnostic data.

모델링부(300)는 학습 데이터 중 시각화 데이터 및 중요 연관 인자 데이터를 독립변수(입력변수)로 하고, 상기 진단 데이터를 종속변수(결과변수)로 하여, 이를 인공지능 모델을 통하여 학습함으로써 예측 모델을 구축한다.The modeling unit 300 uses visualization data and important related factor data among the learning data as independent variables (input variables), and the diagnostic data as dependent variables (outcome variables), and learns them through an artificial intelligence model to create a prediction model. Build it.

모델링부(300)에서 사용되는 인공지능 모델은 알려진 인공지능 모델이 사용될 수 있으나, 시각화된 이미지 학습에 특화된 합성곱 신경망(CNN, Convolutional Neural Network)이 사용되는 것이 바람직할 수 있다.The artificial intelligence model used in the modeling unit 300 may be a known artificial intelligence model, but it may be preferable to use a convolutional neural network (CNN) specialized for learning visualized images.

중요 연관 인자 데이터는 신체 데이터, 뇌졸중 데이터, 기저질환 데이터 및 생활습관 데이터를 포함할 수 있으며, 상세히는 후술한다.Important associated factor data may include physical data, stroke data, underlying disease data, and lifestyle data, and will be described in detail later.

진단 데이터는 상기 음성 데이터 및 중요 연관 인자 데이터를 갖는 환자에게 실제로 삼킴장애 검사를 실시하여 진단한 삼킴장애 여부 또는 심각도 데이터이며, 상세히는 후술한다.Diagnosis data is data on whether or not a swallowing disorder is diagnosed by actually performing a swallowing disorder test on a patient who has the above voice data and important associated factor data, and will be described in detail later.

이러한 진단 데이터는 인공지능 모델을 통한 학습에 있어서, 독립변수에 종속되는 변수이나, 상기와 같이 실제 삼킴장애 검사를 실시한 결과를 입력하여 시각화 데이터 및 중요 연관 인자 데이터를 포함하는 학습 데이터를 레이블하는 역할을 하여 모델 정확도를 높이는 지도 학습에 사용된다. 물론, 비지도 학습도 가능하다.This diagnostic data is a variable that is dependent on the independent variable in learning through an artificial intelligence model, but it serves to label the learning data including visualization data and important related factor data by inputting the results of the actual swallowing disorder test as described above. It is used in supervised learning to increase model accuracy. Of course, unsupervised learning is also possible.

예측부(400)는 모델링부(300)에서 구축된 예측 모델에, 실제 예측 대상이 되는 환자의 음성 데이터 및 중요 연관 인자 데이터를 적용하여 삼킴장애 여부를 예측한다.The prediction unit 400 predicts whether there is a swallowing disorder by applying the actual prediction target patient's voice data and important associated factor data to the prediction model built in the modeling unit 300.

다음, 도 2 내지 도 6을 더 참조하여, 본 발명에 따라 인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 방법을 상세히 설명한다.Next, with further reference to FIGS. 2 to 6, a method for predicting whether a swallowing disorder exists by analyzing voice patterns based on artificial intelligence according to the present invention will be described in detail.

먼저, 다수의 뇌졸중 환자로부터 수집된 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터를 포함하는 학습 데이터가 입력된다(S10).First, learning data including voice data, important correlation factor data, and diagnosis data collected from multiple stroke patients is input (S10).

본 실시예에 따른 방법을 수행하기 위한 실제 적용예에서는, 뇌졸중 환자 423명으로부터 1035건의 음성 데이터를 수집하고, 1035건의 음성 데이터 중 700건의 음성파일을 학습 데이터 세트로 사용하였고, 나머지 335건의 음성 데이터는 후술하는 바와 같이 구축되는 예측 모델의 테스트 데이터 세트로 사용하였다.In an actual application example for performing the method according to this embodiment, 1035 pieces of voice data were collected from 423 stroke patients, 700 voice files out of the 1035 pieces of voice data were used as a learning data set, and the remaining 335 pieces of voice data were used as a learning data set. was used as a test data set for the prediction model built as described later.

입력부(100)에 상기와 같이 수집된 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터가 입력된다.The voice data, important associated factor data, and diagnostic data collected as described above are input into the input unit 100.

구체적으로, 제1입력장치(110)에는 음성 데이터가 입력되고, 제2입력장치(120)에는 중요 연관 인자 데이터 및 진단 데이터가 입력된다.Specifically, voice data is input to the first input device 110, and important associated factor data and diagnostic data are input to the second input device 120.

다음, 입력된 음성 데이터가 시각화 데이터로 변환된다(S20).Next, the input voice data is converted into visualization data (S20).

입력부(100)에 입력된 학습 데이터 중 음성 데이터가 변환부(200)에서 시각화 데이터로 변환된다.Voice data among the learning data input to the input unit 100 is converted into visualization data in the conversion unit 200.

변환부(200)는 상기와 같이 음성 데이터를 파형(Wave form), 스펙트럼(Spectrum) 또는 스펙트로그램(Spectrogram) 등으로 변환함으로써 시각화 데이터를 생성한다.The conversion unit 200 generates visualization data by converting voice data into a wave form, spectrum, or spectrogram as described above.

다음, 시각화 데이터 및 중요 연관 인자 데이터를 독립변수로 하고, 진단 데이터를 종속변수로 하는 학습 데이터가 인공지능 모델에 의해 이용되어 예측 모델이 구축된다(S30).Next, learning data with visualization data and important related factor data as independent variables and diagnostic data as dependent variables is used by an artificial intelligence model to build a prediction model (S30).

즉, 모델링부(300)에서 중요 연관 데이터 및 진단 데이터와, 시각화 데이터를 포함하는 학습 데이터가 인공지능 모델에 의해 예측 모델이 구축된다.That is, in the modeling unit 300, a prediction model is built using learning data including important related data, diagnostic data, and visualization data using an artificial intelligence model.

여기서, 학습 데이터는 시각화 데이터는 상기와 같이, 입력부(100)에 입력된 음성 데이터가 변환부(200)에 의해 변환된 데이터이며, 중요 연관 인자 데이터는 및 진단 데이터는 입력부(100)에 입력된 데이터이다.Here, the learning data and visualization data are data converted from voice data input to the input unit 100 by the conversion unit 200, as described above, and the important associated factor data and diagnostic data are input to the input unit 100. It's data.

달리 표현하면, 모델링부(300)는 시각화 데이터 및 중요 연관 인자 데이터를 독립변수(입력변수)로 하고 진단 데이터를 종속변수(결과변수)로 하여 학습 데이터로 인공지능 모델의 학습을 수행하여 예측 모델을 구축한다.In other words, the modeling unit 300 uses visualization data and important related factor data as independent variables (input variables) and diagnostic data as dependent variables (outcome variables) to perform training of an artificial intelligence model with training data to create a predictive model. Build.

중요 연관 인자 데이터에 대하여 설명한다.Describe the important correlation factor data.

중요 연관 인자 데이터는 신체 데이터, 뇌졸중 데이터, 기저질환 데이터 및 생활 습관 데이터를 포함한다.Important associated factor data include physical data, stroke data, underlying disease data, and lifestyle data.

신체 데이터는 음성 데이터 수집 시의 나이, 키, 체중, 허리둘레, 및 성별 데이터를 포함한다.Physical data includes age, height, weight, waist circumference, and gender data at the time of voice data collection.

도 3에 나타낸 바와 같이, 신체 데이터는 음성 데이터 수집 시의 나이, 키, 체중, 허리둘레를 해당 단위의 수치로 하여 입력되고, 성별 데이터의 경우에는 남성을 1, 여성을 2로 하여 입력될 수 있다.As shown in Figure 3, physical data is entered using the age, height, weight, and waist circumference at the time of voice data collection as the corresponding unit values, and in the case of gender data, male can be entered as 1 and female as 2. there is.

나이가 많을수록 뇌졸중의 심각도가 높으며 뇌졸중 이후 회복이 더디다.The older you get, the higher the severity of stroke and the slower recovery after stroke.

따라서 나이가 많을수록 뇌졸중에 의한 삼킴장애가 발생할 가능성이 높으며 삼킴장애가 심할 가능성이 높다.Therefore, the older you are, the more likely it is that you will develop dysphagia due to stroke, and the more likely it is that your dysphagia will be more severe.

또한, 나이에 따라 음성패턴이 변할 수 있기 때문에 음성패턴 고려시 나이를 고려할 필요가 있다.Additionally, because voice patterns may change depending on age, it is necessary to consider age when considering voice patterns.

키, 체중, 허리둘레 등은 체질량지수 및 비만도를 반영하는 지표로 인간의 음성은 체질량지수, 비만도 등에 따라 변할 수 있고 체질량지수, 비만도는 뇌졸중 발생과 밀접하게 연관되어 있다. 따라서 체질량지수, 비만도가 삼킴장애와 연관되어 있을 가능성이 높디.Height, weight, waist circumference, etc. are indicators that reflect body mass index and obesity, and human voice can change depending on body mass index and obesity, and body mass index and obesity are closely related to the occurrence of stroke. Therefore, it is highly likely that body mass index and obesity are related to swallowing disorders.

따라서, 음성패턴을 고려할 때 체질량지수 및 비만도 등을 고려할 필요가 있다.Therefore, when considering voice patterns, it is necessary to consider body mass index and obesity level.

또한, 음성패턴은 성별에 따라 크게 다르기 때문에 음성패턴 기반으로 하여 삼킴장애 여부를 판단하기 위하여는 성별을 고려할 필요가 있다.Additionally, because voice patterns differ greatly depending on gender, it is necessary to consider gender in order to determine whether a person has a swallowing disorder based on voice patterns.

뇌졸중 데이터는 뇌졸중의 종류, 뇌졸중의 크기, 뇌졸중의 심각도,뇌졸중의 발생위치, 소혈관질환 여부 및 뇌신경 진찰 소견 데이터를 포함한다.Stroke data includes the type of stroke, size of stroke, severity of stroke, location of stroke, presence of small vessel disease, and cranial nerve examination findings.

도 4에 나타낸 바와 같이, 뇌졸중 데이터는 뇌졸중의 종류(뇌경색, 뇌출혈)에 따라 미리 정해진 기준에 의해 수치가 입력될 수 있다.As shown in FIG. 4, stroke data can be entered into numerical values based on predetermined standards depending on the type of stroke (cerebral infarction, cerebral hemorrhage).

뇌졸중은 뇌혈관이 터졌을 때는 뇌출혈, 뇌혈관이 막혔을 때는 뇌경색으로 나눌 수 있는데, 일반적으로 뇌출혈이 뇌경색보다 삼킴장애가 더 흔하게 동반되므로 뇌졸중의 종류를 고려할 필요가 있으며, 도 4에 나타낸 바와 같이, 예를 들면, 뇌경색은 1, 뇌출혈은 2와 같이 설정될 수 있다. Stroke can be divided into cerebral hemorrhage when a cerebral blood vessel ruptures, and cerebral infarction when a cerebral blood vessel is blocked. In general, cerebral hemorrhage is more commonly accompanied by dysphagia than cerebral infarction, so it is necessary to consider the type of stroke. As shown in Figure 4, for example, For example, cerebral infarction can be set to 1, and cerebral hemorrhage can be set to 2.

그리고, 뇌졸중의 크기 단위에 따른 수치가 입력되며, 뇌졸중이 발생한 위치에 따라 설정된 수치가 입력될 수 있다. 또한, 뇌졸중의 심각도에 따라 설정된 범위의 수치(예를 들면, 1~5)가 입력될 수 있다.Additionally, a numerical value is input according to the size unit of the stroke, and a numerical value set according to the location where the stroke occurred can be input. Additionally, a number in a set range (eg, 1 to 5) may be entered depending on the severity of the stroke.

뇌졸중의 크기나 심각도가 높은 경우 삼킴장애를 일으킬 수 있는 뇌의 부위 또는 뇌신경의 경로가 손상될 가능성이 높아질 수 있다. If the size or severity of the stroke is high, there may be an increased risk of damage to areas of the brain or cranial nerve pathways that can cause swallowing difficulties.

따라서 삼킴장애 발생 가능성을 예측하기 위해서는 뇌졸중의 크기와 심각도를 고려해야 한다. Therefore, in order to predict the likelihood of developing swallowing disorders, the size and severity of the stroke must be considered.

뇌졸중의 종류, 크기, 심각도 이외에 삼킴장애 발생에 가장 중요한 요소는 뇌졸중의 발생 위치이다.In addition to the type, size, and severity of the stroke, the most important factor in the occurrence of dysphagia is the location of the stroke.

삼킴장애를 일으킬 가능성이 매우 높은 피질연수 경로(corticobulbar track)가 가장 많이 분포하는 곳은 주로 뇌간(brainstem)부위이다.The brainstem region is where the corticobulbar track, which is highly likely to cause swallowing disorders, is most abundant.

즉, 뇌간 특히 뇌교(pons)나 연수(medullar)부위에 뇌졸중이 발생하는 경우 삼킴장애가 상대적으로 심하며 회복도 더디게 된다.In other words, when a stroke occurs in the brainstem, especially in the pons or medullar region, swallowing difficulties are relatively severe and recovery is slow.

따라서, 뇌졸중의 발생위치에 따라 수치가 입력되도록 한다.Therefore, values are entered according to the location of the stroke.

뇌의 소혈관질환은 뇌내 소혈관에 병리적인 변화가 일어나고 뇌 MRI 나 CT상에서 이러한 병리적 변화가 관찰되는 것을 의미한다. Brain small vessel disease means that pathological changes occur in small blood vessels within the brain and these pathological changes are observed on brain MRI or CT.

도 5에 나타낸 바와 같이, 이러한 소혈관질환에는 A. 백질변성(white-matter hyperintensities), B. 뇌미세출혈(cerebral microbleeds), C. 혈관주위공간(perivascular spaces), D. 무증상 뇌경색(asymptomatic lacunar infarctions) 등이 있다(흰 화살표 참조). 이와 같은 소혈관질환의 여부나 종류에 따라 수치가 입력된다.As shown in Figure 5, these small vessel diseases include A. white-matter hyperintensities, B. cerebral microbleeds, C. perivascular spaces, and D. asymptomatic cerebral infarction. infarctions), etc. (see white arrow). Numerical values are entered depending on the presence or type of small vessel disease.

뇌신경 진찰 소견은 5번, 7번, 9번, 10번, 11번, 12번 뇌신경 마비의 여부에 따라 음성패턴이 달라질 수 있으며 삼킴장애가 발생하는데 직접적으로 연관되어 있으므로. 따라서, 뇌신경 마비의 여부 및 위치(좌, 우, 양측)에 따라 수치가 입력된다.Cranial nerve examination findings show that voice patterns may vary depending on whether there is paralysis of the 5th, 7th, 9th, 10th, 11th, or 12th cranial nerves, and are directly related to the occurrence of swallowing disorders. Therefore, values are entered according to the presence and location (left, right, bilateral) of cranial nerve paralysis.

기저질환 데이터는 고혈압, 당뇨병, 고지혈증, 협심증, 심근경색, 대사증후군, 심부전증, 구강질환 및 성대질환의 여부 또는 심각도 데이터를 포함한다.Underlying disease data includes data on the presence or severity of high blood pressure, diabetes, hyperlipidemia, angina pectoris, myocardial infarction, metabolic syndrome, heart failure, oral disease, and vocal cord disease.

도 6에 나타낸 바와 같이, 기저질환 데이터는 각 질환의 여부가 0 또는 1로 입력되거나, 각 질환의 심각도에 따라 설정된 범위의 수치(예를 들면, 0~100)가 입력될 수 있다. As shown in FIG. 6, the underlying disease data may be entered as 0 or 1 for each disease, or may be entered as a value in a range set according to the severity of each disease (for example, 0 to 100).

또한, 여기서 각 질환의 여부는 심각도에 따른 수치가 일정 수치(예를 들면 50)를 초과하는 여부에 따라 정해질 수 있다.In addition, here, the presence or absence of each disease may be determined based on whether the severity value exceeds a certain value (for example, 50).

고혈압, 당뇨병, 고지혈증, 협심증, 심근경색, 대사증후군, 심부전증 등은 뇌졸중 발생의 중요 위험인자이며, 또한, 이러한 기저질환들은 뇌의 소혈관질환과 도 밀접하게 연관되어 있는데 소혈관질환은 일종의 뇌의 미세한 손상으로 뇌의 신경망 손상을 반영한다.High blood pressure, diabetes, hyperlipidemia, angina pectoris, myocardial infarction, metabolic syndrome, and heart failure are important risk factors for stroke, and these underlying diseases are also closely related to small vessel disease in the brain. Small vessel disease is a type of brain disease. Microscopic damage reflects damage to the brain's neural network.

기저질환의 존재 여부는 그 자체도 뇌졸중의 발생 및 심각도와 밀접하게 연관되어 있다. 신경망 손상과 뇌졸중 발생, 뇌졸중의 심각도들은 뇌졸중으로 인한 삼킴장애와 밀접하게 연관되어 있어 삼킴장애 여부 및 심각도를 예측하기 위해서는 기저질환의 존재여부를 고려할 필요가 있고, 구강질환(구강내염증, 암, 기타질환 등), 성대질환(성대마비, 성대결절, 암, 기타질환 등)은 삼킴장애와 밀접하게 연관되어 있으므로 이에 대한 존재여부 및 심각도에 따라 수치가 입력된다.The presence of an underlying disease itself is closely related to the occurrence and severity of stroke. Nerve network damage, stroke occurrence, and severity of stroke are closely related to dysphagia due to stroke, so in order to predict the presence and severity of dysphagia, it is necessary to consider the presence of underlying diseases and oral diseases (oral inflammation, cancer, Other diseases, etc.) and vocal cord diseases (vocal cord paralysis, vocal cord nodules, cancer, other diseases, etc.) are closely related to swallowing disorders, so values are entered according to their presence and severity.

생활습관 데이터는 흡연 및 알콜 섭취 여부 또는 빈도, 및 약물 섭취 여부, 빈도 또는 종류 데이터를 포함한다.Lifestyle data includes the presence or frequency of smoking and alcohol consumption, and the presence, frequency or type of drug consumption.

도 7에 나타낸 바와 같이, 생활습관 데이터는 흡연 여부 또는 빈도(갑/일), 알콜 섭취 여부 또는 빈도(회/주), 및 약물 섭취 여부, 빈도(회/주)가 수치로 입력되며, 섭취하는 약물의 종류에 따라 설정된 수치가 입력될 수 있다.As shown in Figure 7, the lifestyle data includes smoking status or frequency (packs/day), alcohol consumption or frequency (times/week), and drug intake and frequency (times/week). A set value can be entered depending on the type of drug being administered.

흡연과 알코올 섭취의 경우 중요한 뇌졸중의 위험인자이며 흡연량과 알코올 섭취량이 증가할수록 뇌졸중의 발생 위험성이 높아지며 뇌졸중의 심각도도 높아진다. Smoking and alcohol consumption are important risk factors for stroke, and as the amount of smoking and alcohol consumption increases, the risk of stroke increases and the severity of stroke also increases.

뇌졸중의 심각도가 높을수록 삼킴장애가 동반될 가능성은 높아지게 된다. 따라서 뇌졸중에 동반된 삼킴장애를 진단하거나 심각도를 측정할 때 흡연 및 알코올 섭취 빈도에 따라 수치가 입력된다.The higher the severity of the stroke, the more likely it is to be accompanied by dysphagia. Therefore, when diagnosing or measuring the severity of dysphagia accompanying stroke, values are entered according to the frequency of smoking and alcohol consumption.

뇌졸중 환자에서 우울증약, 신경안정제, 치매행동장애 조절약제 등은 의식수준을 저하시키거나 추체외로 증상을 촉발시키거나 뇌신경의 기능저하를 초래하여 삼킴장애를 발생시거나 악화시킬 수 있기 때문에 뇌졸중 환자에서 삼킴장애의 발생여부와 심각도를 확인하기 위해서는 복용 중인 약물의 종류, 빈도에 수치가 입력된다.In stroke patients, antidepressants, tranquilizers, and dementia behavioral disorder control drugs can lower the level of consciousness, trigger extrapyramidal symptoms, or cause deterioration of cranial nerve function, which can cause or worsen swallowing disorders. To check the occurrence and severity of a disorder, values are entered for the type and frequency of medication being taken.

진단 데이터는 상기한 뇌졸중 환자를 상대로 실제 검진을 통하여 진단한 삼킴장애 여부 또는 심각도 데이터이다.Diagnosis data is data on the presence or severity of swallowing disorder diagnosed through actual examination of the above-mentioned stroke patients.

삼킴장애의 진단은 뇌졸중 환자들에게 현재 사용되는 삼킴장애에 대한 검사 방법인 물을 삼키게 하는 방법 또는 비디오 투시 연하검사를 시행하여 삼킴 여부를 확인하고, 또한 10회 물을 삼키는 동안 사레가 들리는 경우가 몇 번인지에 대해 확인하여 진단하였다.Diagnosis of swallowing disorders is performed by asking stroke patients to swallow water, which is a test method currently used for swallowing disorders, or by performing a video fluoroscopic swallowing test to check whether or not swallowing is possible. Also, if a sound is heard while swallowing water 10 times. The diagnosis was made by checking the number of cases.

도 3 내지 도 7에 나타낸 바와 같이, 진단 데이터는 삼킴장애의 여부가 0 또는 1로 입력되거나, 삼킴장애의 심각도에 따라 설정된 범위의 수치(예를 들면, 0~100)가 입력될 수 있고, 여기서 삼킴장애 여부는 심각도에 따른 수치가 일정 수치(예를 들면 50)를 초과하는 여부에 따라 정해질 수 있다.As shown in Figures 3 to 7, the diagnostic data may be entered as 0 or 1 for whether the swallowing disorder is present, or a value in a range set according to the severity of the swallowing disorder (e.g., 0 to 100) may be entered, Here, the presence or absence of a swallowing disorder can be determined based on whether the severity level exceeds a certain number (for example, 50).

실제로 진단한 진단 데이터를 학습 데이터의 종속변수로 직접 입력한다. 이는 인공지능 학습방법 중 지도 학습으로서, 결과인 종속변수도 독립변수와 함께 입력한다.The actually diagnosed diagnostic data is directly input as the dependent variable of the learning data. This is a supervised learning method among artificial intelligence learning methods, and the resulting dependent variable is input along with the independent variable.

비지도 학습의 경우 인공지능 모델이 입력되는 독립변수만을 가지고 종속변수와의 관계함수를 찾아야 하므로 정확도가 다소 떨어지며 학습시간도 느리고, 또한 많은 양의 학습 데이터가 필요하다.In the case of unsupervised learning, the artificial intelligence model must find the relationship function with the dependent variable using only the input independent variables, so accuracy is somewhat low, learning time is slow, and a large amount of learning data is required.

지도 학습의 경우 독립변수에 따른 종속변수를 함께 입력하여 학습을 수행함으로써 정확도가 높고 학습시간도 빠르며, 비교적 적은 양의 학습 데이터만으로도 높은 정확도의 모델 구축이 가능하다.In the case of supervised learning, learning is performed by inputting dependent variables according to the independent variables together, so accuracy is high and learning time is fast, and it is possible to build a high-accuracy model with only a relatively small amount of learning data.

학습 데이터에 인공지능 모델링을 적용하지 않았을 경우 삼킴장애가 있는 경우를 종속변수로 적용하였을 때 AUC는 0.83이었고, 본 실시예에 따른 인공지능 모델링을 이용하였을 때의 AUC는 0.87로 유의하게 예측력이 증가함을 확인하였다.When artificial intelligence modeling was not applied to the learning data, when cases with swallowing disorders were applied as the dependent variable, the AUC was 0.83, and when artificial intelligence modeling according to this example was used, the AUC was 0.87, significantly increasing the predictive power. was confirmed.

이후, 상기한 1035건의 데이터 중 예측 모델을 구축하는 데에 사용된 700건의 데이터를 제외한 335건의 음성파일을 이용하여 테스트를 수행하였다.Afterwards, a test was performed using 335 voice files, excluding the 700 data used to build the prediction model, among the 1035 data mentioned above.

테스트 세트를 통한 검정에서도 상기 학습 데이터에 의해 구축된 예측 모델이 아래와 같이 유효함을 확인하였다.In tests using the test set, it was confirmed that the prediction model built using the learning data was valid as shown below.

학습 데이터 세트: AUC 0.89, sensitivity 0.83, specificity 0.93Training dataset: AUC 0.89, sensitivity 0.83, specificity 0.93

테스트 데이터 세트: AUC 0.87, sensitivity 0.81, specificity 0.92 Test dataset: AUC 0.87, sensitivity 0.81, specificity 0.92

다음, 구축된 상기 예측 모델에 예측 대상 환자의 음성 데이터 및 중요 연관 인자 데이터가 포함된 예측 대상 데이터를 적용하여 삼킴장애 여부가 예측된다(S40).Next, the presence or absence of swallowing disorder is predicted by applying prediction target data including voice data and important associated factor data of the patient to be predicted to the constructed prediction model (S40).

예측부(400)는 상기와 같이 모델링부(300)에서 구축된 예측 모델에 실제로 예측 대상이 되는 환자의 음성 데이터 및 중요 연관 인자 데이터, 즉, 독립변수를 입력하여 종속변수인 삼킴장애 여부를 예측하며, 이를 통하여 실제 예측 대상 환자의 삼킴장애 여부를 예측할 수 있다.The prediction unit 400 inputs the patient's voice data and important associated factor data, that is, the independent variable that is actually the prediction target, into the prediction model built in the modeling unit 300 as described above to predict whether the dependent variable is dysphagia. And through this, it is possible to predict whether the actual patient to be predicted has a swallowing disorder.

여기서도 예측 결과로서 실제 삼킴장애의 여부가 0 또는 1로 예측되거나, 삼킴장애의 심각도에 따라 설정된 범위의 수치(예를 들면, 0~100)로 예측될 수 있고, 여기서 삼킴장애 여부는 심각도에 따른 수치가 일정 수치(예를 들면 50)를 초과하는 여부에 따라 정해질 수 있다.Here too, as a prediction result, the actual presence or absence of swallowing disorder may be predicted as 0 or 1, or may be predicted as a value in a range set according to the severity of the swallowing disorder (e.g., 0 to 100), where the presence or absence of swallowing disorder may be determined according to the severity. It can be determined depending on whether the value exceeds a certain value (for example, 50).

본 발명에 따른 인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 장치는 프로세서, 메모리, 사용자 입력장치, 프레젠테이션 장치 중 적어도 일부를 포함하는 컴퓨팅 장치에 의해 구현될 수 있다.The device for predicting whether a swallowing disorder exists by analyzing voice patterns based on artificial intelligence according to the present invention may be implemented by a computing device that includes at least some of a processor, memory, user input device, and presentation device.

이러한 컴퓨팅 장치는, 컴퓨팅 장치는 스마트폰, 태블릿, 랩탑, 데스크탑, 서버, 클라이언트 등의 다양한 장치를 포함할 수 있다. These computing devices may include various devices such as smartphones, tablets, laptops, desktops, servers, and clients.

메모리는 프로세서에 의해 실행되면 특정 태스크를 수행할 있도록 코딩되어 있는 컴퓨터-판독가능 소프트웨어, 애플리케이션, 데이터 등을 저장하는 매체이다.Memory is a medium that stores computer-readable software, applications, data, etc. that are coded to perform specific tasks when executed by a processor.

프로세서는 메모리에 저장되어 있는 컴퓨터-판독가능 소프트웨어, 애플리케이션, 데이터 등을 판독하여 실행할 수 있다. The processor can read and execute computer-readable software, applications, data, etc. stored in the memory.

또한, 본 발명에 따른 인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 방법은 상기한 컴퓨팅 장치에 의해 실행될 수 있으며, 이를 실현하기 위하여 컴퓨팅 장치로 읽을 수 있는 저장매체에 저장되는 컴퓨터 프로그램 및 이를 저장하여 컴퓨터로 읽을 수 있는 저장매체로 제공될 수 있다.In addition, the method of predicting whether a swallowing disorder exists by analyzing speech patterns based on artificial intelligence according to the present invention can be executed by the above-mentioned computing device, and to realize this, a computer is stored in a storage medium that can be read by the computing device. It can be provided as a program and a storage medium that stores it and can be read by a computer.

본 발명에 따른 인공지능을 기반으로 음성패턴을 분석하여 삼킴장애 여부를 예측하는 장치 및 방법에 의하면, 뇌졸중 환자와 같은 신경계질환 환자에서 주 사망원인인 흡인성 폐렴과 같은 심각한 합병증을 기존의 침습적 방법이 아닌 비침습적으로 예측할 수 있다.According to the device and method for predicting swallowing disorders by analyzing voice patterns based on artificial intelligence according to the present invention, serious complications such as aspiration pneumonia, which is the main cause of death in patients with neurological diseases such as stroke patients, can be prevented using existing invasive methods. This can be predicted non-invasively.

또한, 음성 데이터 및 중요 연관 인자 데이터를 사용한 인공지능 모델을 통하여 예측을 수행함으로써 정확도와 신뢰성을 높일 수 있다.In addition, accuracy and reliability can be increased by making predictions through an artificial intelligence model using voice data and important related factor data.

이상에서 본 발명의 바람직한 실시예에 대하여 설명하였으나, 본 발명은 상술한 특정의 실시예에 한정되지 아니한다. 즉, 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자라면 첨부된 특허청구범위의 사상 및 범주를 일탈함이 없이 본 발명에 대한 다수의 변경 및 수정이 가능하며, 그러한 모든 적절한 변경 및 수정의 균등물들도 본 발명의 범위에 속하는 것으로 간주되어야 할 것이다.Although preferred embodiments of the present invention have been described above, the present invention is not limited to the specific embodiments described above. In other words, a person skilled in the art to which the present invention pertains can make numerous changes and modifications to the present invention without departing from the spirit and scope of the appended claims, and all such appropriate changes and modifications can be made. Equivalents should also be considered to fall within the scope of the present invention.

100: 입력부
200: 변환부
300: 모델링부
400: 예측부
100: input unit
200: conversion unit
300: Modeling department
400: prediction unit

Claims (6)

인공지능을 기반으로 하여 삼킴장애 여부를 예측하는 장치로서,
다수의 뇌졸중 환자의 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터가 입력되는 입력부(100);
상기 입력부(100)에 입력된 음성 데이터를 시각화 데이터로 변환하는 변환부(200);
상기 시각화 데이터 및 상기 중요 연관 인자 데이터를 독립변수로 하고, 상기 진단 데이터를 종속변수로 하는 학습 데이터를 이용하여 인공지능 모델을 통하여 예측 모델을 구축하는 모델링부(300); 및
상기 예측 모델에 예측 대상 환자의 음성 데이터 및 중요 연관 인자 데이터가 포함된 예측 대상 데이터를 적용하여 삼킴장애 여부를 예측하는 예측부(400);를 포함하며,
상기 중요 연관 인자 데이터는,
상기 음성 데이터 측정 시의 나이, 키, 체중, 허리둘레, 및 성별 데이터를 포함하는 신체 데이터,
뇌졸중의 종류, 뇌졸중의 크기, 뇌졸중의 심각도, 뇌졸중의 발생위치 데이터, 소혈관질환 여부와 종류 및 뇌신경 진찰 소견 데이터를 포함하는 뇌졸중 데이터,
고혈압, 당뇨병, 고지혈증, 협심증, 심근경색, 대사증후군, 심부전증, 구강질환 및 성대질환의 여부 또는 심각도 데이터를 포함하는 기저질환 데이터,
흡연 및 알콜 섭취 여부 또는 빈도, 및 약물 섭취 여부, 빈도 또는 종류 데이터를 포함하는 생활습관 데이터를 포함하며,
상기 진단 데이터는, 실제 삼킴장애 검진을 통하여 진단된 삼킴장애 여부 또는 심각도 데이터를 포함하고,
상기 중요 연관 인자 데이터 및 상기 진단 데이터는 기설정된 기준에 따라 수치화 되어 입력되는,
장치.
A device that predicts swallowing disorders based on artificial intelligence,
An input unit 100 into which voice data, important associated factor data, and diagnostic data of a plurality of stroke patients are input;
A conversion unit 200 that converts voice data input to the input unit 100 into visualization data;
A modeling unit 300 that constructs a prediction model through an artificial intelligence model using learning data that uses the visualization data and the important correlation factor data as independent variables and the diagnostic data as a dependent variable; and
It includes a prediction unit 400 that predicts whether there is a swallowing disorder by applying prediction target data including voice data and important associated factor data of the prediction target patient to the prediction model,
The important correlation factor data is,
Physical data including age, height, weight, waist circumference, and gender data at the time of measuring the voice data,
Stroke data including type of stroke, size of stroke, severity of stroke, data on location of stroke, presence and type of small vessel disease, and data on cranial nerve examination findings;
Underlying disease data, including data on the presence or severity of high blood pressure, diabetes, hyperlipidemia, angina pectoris, myocardial infarction, metabolic syndrome, heart failure, oral disease, and vocal cord disease;
Includes lifestyle data, including data on the presence or frequency of smoking and alcohol consumption, and data on the presence, frequency, or type of drug consumption;
The diagnostic data includes data on the presence or severity of a swallowing disorder diagnosed through an actual swallowing disorder examination,
The important associated factor data and the diagnostic data are quantified and input according to preset standards,
Device.
제 1 항에 있어서,
상기 인공지능 모델은 합성곱 신경망(CNN, Convolutional Neural Network)인,
장치.
According to claim 1,
The artificial intelligence model is a convolutional neural network (CNN),
Device.
제 1 항에 따른 장치를 이용하여 삼킴장애 여부를 예측하는 방법으로서,
(a) 다수의 뇌졸중 환자로부터 수집된 음성 데이터, 중요 연관 인자 데이터 및 진단 데이터가 상기 입력부(100)에 입력되는 단계;
(b) 입력된 상기 음성 데이터가 상기 변환부(200)에서 시각화 데이터로 변환되는 단계;
(c) 상기 모델링부(300)에 의해, 상기 시각화 데이터 및 상기 중요 연관 인자 데이터를 독립변수로 하고, 상기 진단 데이터를 종속변수로 하는 학습 데이터가 인공지능 모델에 의해 이용되어 예측 모델이 구축되는 단계; 및
(d) 구축된 상기 예측 모델에 예측 대상 환자의 음성 데이터 및 중요 연관 인자 데이터가 포함된 예측 대상 데이터를 적용하여 삼킴장애 여부가 상기 예측부(400)에 의해 예측되는 단계;를 포함하며,
상기 학습 데이터 및 상기 예측 대상 데이터에 각각 포함되는 중요 연관 인자 데이터는,
상기 음성 데이터 수집 시의 나이, 키, 체중, 허리둘레, 및 성별 데이터를 포함하는 신체 데이터,
뇌졸중의 종류, 뇌졸중의 크기, 뇌졸중의 심각도, 뇌졸중의 발생위치 데이터, 소혈관질환 여부와 종류 및 뇌신경 진찰 소견 데이터를 포함하는 뇌졸중 데이터,
고혈압, 당뇨병, 고지혈증, 협심증, 심근경색, 대사증후군, 심부전증, 구강질환 및 성대질환의 여부 또는 심각도 데이터를 포함하는 기저질환 데이터, 및
흡연 및 알콜 섭취 여부 또는 빈도, 및 약물 섭취 여부, 빈도 또는 종류 데이터를 포함하는 생활습관 데이터를 포함하며,
상기 진단 데이터는, 실제 삼킴장애 검진을 통하여 진단된 삼킴장애 여부 또는 심각도 데이터를 포함하고,
상기 중요 연관 인자 데이터 및 상기 진단 데이터는 기설정된 기준에 따라 수치화 되어 입력되는,
방법.
As a method of predicting whether there is a swallowing disorder using the device according to claim 1,
(a) inputting voice data, important associated factor data, and diagnostic data collected from multiple stroke patients into the input unit 100;
(b) converting the input voice data into visualization data in the conversion unit 200;
(c) By the modeling unit 300, learning data with the visualization data and the important correlation factor data as independent variables and the diagnostic data as dependent variables is used by an artificial intelligence model to build a prediction model. step; and
(d) applying prediction target data including voice data and important associated factor data of the patient to be predicted to the constructed prediction model to predict whether or not there is a swallowing disorder by the prediction unit 400;
Important correlation factor data included in the learning data and the prediction target data, respectively,
Physical data including age, height, weight, waist circumference, and gender data at the time of collecting the voice data,
Stroke data including type of stroke, size of stroke, severity of stroke, data on location of stroke, presence and type of small vessel disease, and data on cranial nerve examination findings;
Underlying disease data, including data on the presence or severity of high blood pressure, diabetes, hyperlipidemia, angina pectoris, myocardial infarction, metabolic syndrome, heart failure, oral disease, and vocal cord disease, and
Includes lifestyle data, including data on the presence or frequency of smoking and alcohol consumption, and data on the presence, frequency, or type of drug consumption;
The diagnostic data includes data on the presence or severity of a swallowing disorder diagnosed through an actual swallowing disorder examination,
The important associated factor data and the diagnostic data are quantified and input according to preset standards,
method.
제 3 항에 있어서,
상기 인공지능 모델은 합성곱 신경망(CNN, Convolutional Neural Network)인,
방법.
According to claim 3,
The artificial intelligence model is a convolutional neural network (CNN),
method.
제 3 항 또는 제 4 항에 따른 방법을 실행시키기 위한 컴퓨터 프로그램이 저장된 저장매체.
A storage medium storing a computer program for executing the method according to claim 3 or 4.
제 3 항 또는 제 4 항에 따른 방법을 실행시키기 위하여 저장매체에 저장된 컴퓨터 프로그램.

A computer program stored in a storage medium for executing the method according to claim 3 or 4.

KR1020210073542A 2021-06-07 2021-06-07 Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same KR102647385B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210073542A KR102647385B1 (en) 2021-06-07 2021-06-07 Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210073542A KR102647385B1 (en) 2021-06-07 2021-06-07 Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same

Publications (2)

Publication Number Publication Date
KR20220165058A KR20220165058A (en) 2022-12-14
KR102647385B1 true KR102647385B1 (en) 2024-03-14

Family

ID=84438472

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210073542A KR102647385B1 (en) 2021-06-07 2021-06-07 Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same

Country Status (1)

Country Link
KR (1) KR102647385B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102001398B1 (en) * 2018-01-25 2019-07-18 재단법인 아산사회복지재단 Method and apparatus for predicting brain desease change though machine learning and program for the same
KR102043972B1 (en) * 2018-07-24 2019-12-02 충남대학교산학협력단 Apparatus for extraction acoustic parameter in aspirated voice of stroke patients and method thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102015473B1 (en) * 2017-06-22 2019-08-28 연세대학교 산학협력단 Management System for Treatment of Neurological Disorder and Method thereof
KR101958188B1 (en) 2018-10-12 2019-03-14 신성대학 산학협력단 System and method for determining stroke based on voice analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102001398B1 (en) * 2018-01-25 2019-07-18 재단법인 아산사회복지재단 Method and apparatus for predicting brain desease change though machine learning and program for the same
KR102043972B1 (en) * 2018-07-24 2019-12-02 충남대학교산학협력단 Apparatus for extraction acoustic parameter in aspirated voice of stroke patients and method thereof

Also Published As

Publication number Publication date
KR20220165058A (en) 2022-12-14

Similar Documents

Publication Publication Date Title
Ghiasi et al. Decision tree-based diagnosis of coronary artery disease: CART model
Abdar et al. A new machine learning technique for an accurate diagnosis of coronary artery disease
US10176896B2 (en) Coronary computed tomography clinical decision support system
Staessen et al. Antihypertensive treatment based on blood pressure measurement at home or in the physician's office: a randomized controlled trial
Razay et al. The metabolic syndrome and Alzheimer disease
Gautier et al. Artificial intelligence and diabetes technology: A review
KR102437594B1 (en) Method and device converting electrical biosignals data into numerical vectors and method and apparatus for analyzing diseases using the same
WO2022086454A1 (en) System and method for delivering personalized cognitive intervention
Kao et al. A web-based self-titration program to control blood pressure in patients with primary hypertension: randomized controlled trial
Lehmann et al. Noninvasive hypoglycemia detection in people with diabetes using smartwatch data
Shafi et al. Prediction of heart abnormalities using deep learning model and wearabledevices in smart health homes
KR20210053545A (en) Method of providing user interface for prediction of diseases and device of providing user interface for prediction of diseases using the same
Zhang et al. A remote medical monitoring system for heart failure prognosis
KR102647385B1 (en) Apparatus for predicting swallowing disorder by analyzing voice patterns based on artificial intelligence and method for same
Kazemi et al. Predicting of trend of hemoglobin a1c in type 2 diabetes: a longitudinal linear mixed model
US20230027982A1 (en) Regularized multiple-input pain assessment and trend
Javeed et al. Predictive power of XGBoost_BiLSTM model: a machine-learning approach for accurate sleep apnea detection using electronic health data
US20220415462A1 (en) Remote monitoring methods and systems for monitoring patients suffering from chronical inflammatory diseases
Oren et al. Addressing imaging pitfalls to reduce cardiovascular disease misdiagnosis in patients with breast cancer following reconstruction
Bernstein et al. Atrial fibrillation in patients with stroke attributed to large-or small-vessel disease: 3-year results from the STROKE AF randomized clinical trial
WO2022271572A1 (en) System and method for determining a stool condition
Noori et al. A comparative analysis for diabetic prediction based on machine learning techniques
Hernandez et al. Left ventricular assessment in myocardial infarction: the VALIANT registry
Honarvar et al. Enhancing convolutional neural network predictions of electrocardiograms with left ventricular dysfunction using a novel sub-waveform representation
TW202211258A (en) Pathological condition prediction system for elderly flu patients, a program product thereof, and a method for establishing and using the same

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)