KR20190069687A - Multi questionnaire analysis system for depression diagnosis and the method thereof - Google Patents

Multi questionnaire analysis system for depression diagnosis and the method thereof Download PDF

Info

Publication number
KR20190069687A
KR20190069687A KR1020170169847A KR20170169847A KR20190069687A KR 20190069687 A KR20190069687 A KR 20190069687A KR 1020170169847 A KR1020170169847 A KR 1020170169847A KR 20170169847 A KR20170169847 A KR 20170169847A KR 20190069687 A KR20190069687 A KR 20190069687A
Authority
KR
South Korea
Prior art keywords
questionnaire
depression
latent variable
data
database
Prior art date
Application number
KR1020170169847A
Other languages
Korean (ko)
Other versions
KR102106671B1 (en
Inventor
조성호
최봉재
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170169847A priority Critical patent/KR102106671B1/en
Publication of KR20190069687A publication Critical patent/KR20190069687A/en
Application granted granted Critical
Publication of KR102106671B1 publication Critical patent/KR102106671B1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Psychiatry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • General Health & Medical Sciences (AREA)
  • Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Developmental Disabilities (AREA)
  • Social Psychology (AREA)
  • Child & Adolescent Psychology (AREA)
  • Psychology (AREA)
  • Educational Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

The present invention relates to a multi-questionnaire analysis system for analyzing and providing depression-related medical information based on multiple questionnaires collected through a health examination and a method thereof. By integrating and analyzing different questionnaires while verifying a complex nonlinear relationship between questionnaires related to a depression by using a latent variable model through a deep learning technique, a medical expert can be provided with complex and efficient analysis information.

Description

우울증 진단을 위한 다중 설문 분석 시스템 및 그 방법{MULTI QUESTIONNAIRE ANALYSIS SYSTEM FOR DEPRESSION DIAGNOSIS AND THE METHOD THEREOF}[0001] MULTI QUESTIONNAIRE ANALYSIS SYSTEM FOR DEPRESSION DIAGNOSIS AND THE METHOD THEREOF [0002]

본 발명은 우울증 진단을 위한 다중 설문 분석 시스템 및 그 방법에 관한 것으로서, 보다 상세하게는 건강 검진을 통해 수집되는 다중 설문지를 기반으로 우울증 관련 의학적 정보를 분석하여 제공하는 시스템에 관한 것이다. The present invention relates to a system and method for analyzing multiple questionnaires for diagnosing depression, and more particularly, to a system for analyzing and providing depression-related medical information based on multiple questionnaires collected through health screening.

우울증을 치료하지 않고 방치하는 경우, 사회생활에 심각한 지장을 초래하고 자살 등의 심각한 문제를 일으킬 수 있다. 이러한 면에서 우울증은 자주 걸리는 감기와 같은 가벼운 증상이라도 방치하게 되면 죽음에 이를 수 있는 폐렴이 되는 것에 비유하여 마음의 감기라고 불린다. If depression is left untreated, it can seriously hurt social life and cause serious problems such as suicide. In this regard, depression is often referred to as the coldness of the heart, which is likened to being pneumonia that can lead to death if left untreated even with mild symptoms such as colds.

우리나라의 자살률은 2014년도 기준인구 10만 명당 27.3명으로 OECD 회원 국가의 평균 자살률의 약 2.5배로 압도적인 1위이다. 그러나, 우리나라의 현실에도 불구하고 질병 초기발견에 의한 건강 향상 및 의료비 절감 이라는 목표를 달성하고 있는 세계 최고 수준의 신체건강검진 체계와는 달리, 우울증에 관련된 정신건강검진은 객관적인 진단 기술의 부재로 인하여 체계화되지 못하고 있는 실정이다. 국내 우울증 등 기분장애를 앓고 있는 환자의 오직 37.7% 만이 평생 한 번 이상의 정신의료서비스를 이용했다는 통계 역시 이를 뒷받침 해준다.The suicide rate in Korea is 27.3 per 100,000 population as of 2014, which is the overwhelming number one in the OECD member countries, about 2.5 times the average suicide rate. However, unlike the world's highest level of physical health screening system, which achieves the goal of health improvement and medical cost reduction by early discovery of disease in spite of reality in Korea, mental health examination related to depression is not available due to lack of objective diagnostic technology It is not systematized. It is also supported by the statistics that only 37.7% of patients suffering from mood disorders such as domestic depression use mental health services more than once in their lifetime.

우울증 진단과정은 일반적인 의료활동과 비슷하게 크게 3단계로 이루어진다. 우선, 검진 전 인구학적 통계, 신체적 건강 및 정신적 건강에 관한 문항을 포함하는 설문조사를 통해 1차적으로 진단하며, 이를 바탕으로 전문가에 의한 문진, 혈액검사, 뇌파 등의 생체신호 분석 및 행동 모델 등의 진단방법을 통해 정밀검진 대상자를 2차적으로 선별한다. 이후, 마지막으로 fMRI(functional Magnetic Resonance Imaging; 기능적 자기공명영상), MRS(Magnetic Resonance Imaging; 자기공명분광법), PET(Positron Emission Tomography; 양전자방출단층촬영) 등의 정밀의료영상 장비를 통한 복합 뇌영상 측정을 통해 3차적으로 정밀 진단을 수행한다. The depression diagnosis process consists of three stages, similar to general medical activities. First, the preliminary diagnosis is made through a questionnaire including questions on demographic statistics, physical health and mental health before the examination, and based on this, based on the analysis, analysis of vital signs such as an examination, blood test, And the screening method is secondarily selected. Then, finally, the complex brain image through fine medical imaging equipment such as fMRI (functional Magnetic Resonance Imaging), MRS (Magnetic Resonance Imaging) and PET (Positron Emission Tomography) Measurement is carried out to perform third-degree precise diagnosis.

최근에는 심층 학습 기반의 기계 학습 기술의 진보로, 질병의 자동화된 진단 및 분석 기술이 등장하였다. 그 중 우울증 진단 관련 연구는 혈액검사나 뇌파, 심박 등의 생체 신호와 뇌영상을 분석하여 우울증을 진단하는 연구가 대부분이다. 즉, 우울증 관련 설문조사에 관한 연구는 우울증 관련 설문 문항들(BDI, PHQ 등)을 설계하거나 그 타당성을 검증하는데 초점이 맞추어져 있다. 다른 질환 관련 설문조사 연구로 확장하더라도 기계 학습적 방법론에 의한 설문지의 분석은 가장 기초적인 K­means clustering 알고리즘을 통한 집합군의 특징 분석 정도의 수준에 머물고 있다.In recent years, advances in machine learning technology based on in-depth learning have led to the automated diagnosis and analysis of diseases. Most of the studies related to the diagnosis of depression include diagnosis of depression by analyzing blood signals, brain waves, heartbeats, and other vital signs and brain images. In other words, the research on depression related questionnaires focuses on designing or verifying the validity of the depression related questionnaires (BDI, PHQ, etc.). Even if the questionnaire is extended to other disease related questionnaires, the analysis of the questionnaires by the machine learning methodology is at the level of the feature analysis of the grouping through the most basic Kmeans clustering algorithm.

즉, 객관적 지표로 우울증을 진단 및 예측하는 기술은 세계적으로도 아직 초기단계이며, 건강 검진 기반의 대규모 집단의 기계학습을 이용하는 기술은 전무한 실정이다. In other words, the technology for diagnosing and predicting depression as an objective index is still in the early stage in the world, and there is no technology using large-scale group-based machine learning based on health screening.

본 발명의 목적은 기존의 우울증 진단 설문자가 가지는 한계, 편견과 낙인에 대한 두려움, 성실한 답변을 전제로 한 자가보고식 척도, 척도별 인위적 컷오프(cut­off), 척도간 상호작용의 반영 어려움 등을 해결하기 위한 것이다. The purpose of the present invention is to solve the limitations of the existing depression diagnostic questionnaire, fear of stigma and stigma, self-report scale based on sincere answers, artificial cutoff by scale, difficulty of reflecting interactions between scales .

또한, 본 발명의 목적은 심층학습 기반의 다중모달(multi­modal) 잠재 변수 모델을 이용하여 다중의 서로 다른 설문지를 통합하고, 우울증에 관련된 의학적 및 기계학습적 분석을 제공하고자 한다.It is also an object of the present invention to integrate multiple different questionnaires using a multimodal latent variable model based on in-depth learning and to provide medical and machine learning analysis related to depression.

또한, 본 발명의 목적은 다중 설문지에 대한 통합 잠재 변수 모델을 이용하여 하나의 양식으로 통일되기 어려운 수만 단위의 우울증 관련 설문조사 결과들을 통합하여 심층 학습 모델을 학습하는 해법을 제공하고자 한다. It is also an object of the present invention to provide a solution for learning an in-depth learning model by integrating the results of tens of thousands of depression-related questionnaires which are difficult to be unified in one form by using an integrated latent variable model for multiple questionnaires.

본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템은 환자의 우울증에 관련된 설문 히스토리 데이터와, 상기 환자의 메디컬 데이터를 수집하여 설문조사 데이터베이스로 데이터베이스화하는 수집부, 상기 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 복수의 설문 문항 각각에 대한 잠재 변수 모델을 학습하고, 상기 학습된 잠재 변수 모델을 이용하여 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 모델 학습부, 상기 통합 잠재 변수 모델을 이용하여 대상 환자로부터 수신되는 우울증에 관련된 대상 설문 데이터를 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스를 비교하여 상기 대상 환자에 대한 우울증 진단을 예측하는 진단 예측부 및 상기 대상 환자에 대한 우울증 진단 결과를 제공하는 전송부를 포함한다.The multiple questionnaire analyzing system for diagnosing depression according to an embodiment of the present invention includes a questionnaire history data related to depression of a patient, a collection unit for collecting medical data of the patient and databaseing the questionnaire database, A model learning unit that learns a latent variable model for each of a plurality of survey items from medical data and learns an integrated latent variable model for multiple questionnaires using the learned latent variable model, A diagnostic predictor for converting target questionnaire data related to depression received from a target patient into a latent variable and comparing the converted latent variable with the questionnaire database to predict a diagnosis of depression for the target patient; To provide a diagnosis of depression Includes a transfer unit.

상기 수집부는 상기 환자에 대한 우울증에 관련된 상기 설문 히스토리 데이터, 상기 메디컬 데이터 및 개인 데이터 각각을 상기 설문조사 데이터베이스로 데이터베이스화할 수 있다.The collecting unit may database each of the question history history data, the medical data, and the personal data related to the depression of the patient with the questionnaire database.

상기 수집부는 상기 설문 히스토리 데이터에 포함된 상기 환자에 대한 상기 개인 데이터를 암호화하며, 상기 암호화된 개인 데이터 및 검진일을 기본 키로 사용하여 상기 설문조사 데이터베이스를 구축할 수 있다.The collecting unit may encrypt the personal data for the patient included in the questionnaire history data, and construct the questionnaire database using the encrypted personal data and the check date as a primary key.

상기 수집부는 상기 설문조사 데이터베이스에서 정신건강검진에 사용된 설문지 종류에 대응하는 하나의 설문지 종류마다 하나의 테이블을 구성하여 설문조사 결과인 상기 설문 히스토리 데이터를 저장하여 유지할 수 있다.The collecting unit may store one or more tables for each questionnaire type corresponding to the questionnaire type used in the mental health examination in the questionnaire database to store and maintain the questionnaire history data, which is a survey result.

상기 모델 학습부는 상기 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 공통적인 설문 문항 또는 고유의 설문 문항으로 분류하고, 분류된 각 문항에서의 상기 잠재 변수 모델을 학습하며, 상기 학습된 잠재 변수 모델 각각을 이용하여 상기 다중 설문지에 대한 상기 통합 잠재 변수 모델을 학습할 수 있다.The model learning unit classifies the collected questionnaire history data and medical data into a common question item or a unique questionnaire item, learns the latent variable model in each classified item, and uses each of the learned latent variable models The integrated potential model for the multiple questionnaires can be learned.

상기 진단 예측부는 상기 통합 잠재 변수 모델을 이용하여 상기 대상 설문 데이터에 대한 설문조사 결과를 상기 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스에 저장되어 유지되는 기존 잠재 변수를 비교하여 분류군을 판단할 수 있다.Wherein the diagnostic predicting unit converts the survey result of the questionnaire survey data into the latent variable using the integrated latent variable model and compares the converted latent variable with existing latent variables stored and maintained in the survey database The taxon can be judged.

상기 진단 예측부는 상기 판단된 분류군에서의 상기 대상 설문 데이터의 중요도를 분석하고, 상기 설문조사 데이터베이스에 저장되어 유지되는 상기 설문 히스토리 데이터와 상기 대상 설문 데이터를 비교 분석하여 상기 대상 환자에 대한 우울증 진단을 예측할 수 있다.Wherein the diagnostic predicting unit analyzes the importance of the subject questionnaire data in the determined taxon, and compares and analyzes the questionnaire history data stored and maintained in the questionnaire database with the subject questionnaire data to diagnose the subject's depression Can be predicted.

본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템의 동작 방법에 있어서, 수집부에서, 환자의 우울증에 관련된 설문 히스토리 데이터와, 상기 환자의 메디컬 데이터를 수집하여 설문조사 데이터베이스로 데이터베이스화하는 단계, 모델 학습부에서, 상기 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 복수의 설문 문항 각각에 대한 잠재 변수 모델을 학습하고, 상기 학습된 잠재 변수 모델을 이용하여 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 단계, 진단 예측부에서, 상기 통합 잠재 변수 모델을 이용하여 대상 환자로부터 수신되는 우울증에 관련된 대상 설문 데이터를 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스를 비교하여 상기 대상 환자에 대한 우울증 진단을 예측하는 단계 및 전송부에서, 대상 환자에 대한 우울증 진단 결과를 제공하는 단계를 포함한다.In an operation method of a multiple questionnaire analysis system for diagnosing depression according to an exemplary embodiment of the present invention, a collecting unit collects survey history data related to depression of a patient and medical data of the patient and database them into a questionnaire database A model learning unit learns a latent variable model for each of a plurality of survey items from the collected survey history data and medical data, and learns an integrated latent variable model for multiple questionnaires using the learned latent variable model Wherein the diagnostic predictor converts the subject questionnaire data related to depression received from the subject patient to the latent variable using the integrated latent variable model and compares the converted latent variable with the questionnaire database, To predict the depression diagnosis In the transfer unit, and includes the step of providing a depression diagnosis for patients.

상기 설문조사 데이터베이스로 데이터베이스화하는 단계는 상기 환자에 대한 우울증에 관련된 상기 설문 히스토리 데이터, 상기 메디컬 데이터 및 개인 데이터 각각을 상기 설문조사 데이터베이스로 데이터베이스화할 수 있다.The step of creating a database into the questionnaire database may database each of the questionnaire history data, the medical data, and the personal data related to the depression of the patient with the questionnaire database.

상기 설문조사 데이터베이스로 데이터베이스화하는 단계는 상기 설문 히스토리 데이터에 포함된 상기 환자에 대한 상기 개인 데이터를 암호화하며, 상기 암호화된 개인 데이터 및 검진일을 기본 키로 사용하여 상기 설문조사 데이터베이스를 구축할 수 있다.The step of creating a database into the questionnaire database may encrypt the personal data for the patient included in the questionnaire history data and construct the questionnaire database using the encrypted personal data and the check date as a primary key .

상기 설문조사 데이터베이스로 데이터베이스화하는 단계는 상기 설문조사 데이터베이스에서 정신건강검진에 사용된 설문지 종류에 대응하는 하나의 설문지 종류마다 하나의 테이블을 구성하여 설문조사 결과인 상기 설문 히스토리 데이터를 저장하여 유지할 수 있다.The step of forming the database into the questionnaire database may include storing a questionnaire history data as a result of the questionnaire data, constituting one table for each questionnaire type corresponding to the questionnaire type used in the mental health examination in the questionnaire database have.

상기 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 단계는 상기 설문조사 데이터베이스에서 상기 설문 히스토리 데이터를 설문지의 종류별로 분류하는 제1 단계, 상기 분류된 각 설문지에서 공통적인 설문 문항 또는 고유의 설문 문항으로 분리하는 제2 단계, 상기 공통적인 설문 문항에 대해 사다리형 회로망(Ladder network) 기반의 상기 잠재 변수 모델을 학습하는 제3 단계, 상기 고유의 설문 문항에 대해 상기 사다리형 회로망(Ladder network) 기반의 잠재 변수 모델을 학습하는 제4 단계 및 상기 학습된 잠재 변수 모델들을 사용하여 상기 다중 설문지에 대한 상기 통합 잠재 변수 모델을 학습하는 제5 단계를 포함할 수 있다.The step of learning the integrated latent variable model for the multiple questionnaires includes a first step of classifying the questionnaire history data into questionnaire types in the questionnaire database, a common questionnaire item or a unique questionnaire item in each of the classified questionnaires A third step of learning the latent variable model based on a ladder network for the common question item, a third step of learning the latent variable model based on a ladder network based on the unique questionnaire item, A fourth step of learning a latent variable model and a fifth step of learning the integrated latent variable model for the multiple questionnaires using the learned latent variable models.

상기 대상 환자에 대한 우울증 진단을 예측하는 단계는 상기 통합 잠재 변수 모델을 이용하여 상기 대상 설문 데이터에 대한 설문조사 결과를 상기 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스에 저장되어 유지되는 기존 잠재 변수를 비교하여 분류군을 판단할 수 있다.Wherein the step of predicting the diagnosis of depression for the subject patient comprises the steps of: converting the questionnaire result of the questionnaire survey data to the latent variable using the integrated latent variable model; storing the converted latent variable in the questionnaire database; The taxa can be judged by comparing the existing potential variables to be maintained.

상기 대상 환자에 대한 우울증 진단을 예측하는 단계는 상기 판단된 분류군에서의 상기 대상 설문 데이터의 중요도를 분석하고, 상기 설문조사 데이터베이스에 저장되어 유지되는 상기 설문 히스토리 데이터와 상기 대상 설문 데이터를 비교 분석하여 상기 대상 환자에 대한 우울증 진단을 예측할 수 있다. Wherein the step of predicting depression diagnosis of the subject patient comprises analyzing the importance of the subject questionnaire data in the determined taxon group and comparing and analyzing the questionnaire history data stored in the questionnaire database and the subject questionnaire data The diagnosis of depression for the subject can be predicted.

본 발명의 실시예에 따르면, 심층학습 기법을 통한 잠재 변수 모델을 이용하여 우울증 관련 설문 문항들의 복잡한 비선형적 관계성을 파악하는 동시에 서로 다른 설문지를 통합하여 분석함으로써, 이에 관련된 효율적인 분석 정보를 의학전문가에게 제공할 수 있다. According to the embodiment of the present invention, the complex nonlinear relationship of the questionnaire items related to depression can be grasped by using the latent variable model through the in-depth learning technique, and by analyzing the different questionnaires in an integrated manner, .

도 1은 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템의 세부 구성에 대한 블록도를 도시한 것이다.
도 2는 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 방법의 흐름도를 도시한 것이다.
도 3은 본 발명의 실시예에 따른 통합 잠재 변수 모델에 대한 모식도의 예를 도시한 것이다.
도 4a 및 도 4b는 본 발명의 실시예에 따른 잠재 변수 모델 및 통합 잠재 변수 모델 각각의 예를 도시한 것이다.
도 5는 본 발명의 실시예에 따른 통합 잠재 변수 모델을 사용하여 잠재 변수를 나타내는 그래프의 예를 도시한 것이다.
도 6은 본 발명의 실시예에 따른 설문 문항의 중요도를 분석한 결과를 도시한 것이다.
도 7은 본 발명의 실시예에 따른 의학정보를 제공하는 그래프의 예를 도시한 것이다.
1 is a block diagram illustrating a detailed configuration of a multiple questionnaire analysis system for diagnosing depression according to an embodiment of the present invention.
FIG. 2 is a flowchart illustrating a method for analyzing multiple questionnaires for diagnosing depression according to an embodiment of the present invention.
FIG. 3 shows an example of a schematic diagram of an integrated latent variable model according to an embodiment of the present invention.
4A and 4B show examples of latent variable models and integrated latent variable models, respectively, according to an embodiment of the present invention.
FIG. 5 illustrates an example of a graph representing latent variables using an integrated latent variable model according to an embodiment of the present invention.
FIG. 6 shows a result of analyzing the importance of a question item according to an embodiment of the present invention.
FIG. 7 illustrates an example of a graph that provides medical information according to an embodiment of the present invention.

이하, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. However, the present invention is not limited to or limited by the embodiments. In addition, the same reference numerals shown in the drawings denote the same members.

또한, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 바람직한 실시예를 적절히 표현하기 위해 사용된 용어들로서, 이는 시청자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. Also, terminologies used herein are terms used to properly represent preferred embodiments of the present invention, which may vary depending on the viewer, the intention of the operator, or the custom in the field to which the present invention belongs. Therefore, the definitions of these terms should be based on the contents throughout this specification.

본 발명은 우울증의 신속한 진단 및 분석을 위한 기계학습 기반의 설문조사 분석 시스템에 관한 것으로, 심층 학습 방법을 기반으로, 건강 검진을 통해 수집된 다중 설문지에 대한 서로 다른 우울증 관련 문항들을 통합하는 기계학습 알고리즘 및 이를 이용하여 우울증 관련 의학적 정보를 분석 및 제공하는 시스템에 관한 것이다. The present invention relates to a machine learning-based survey analysis system for rapid diagnosis and analysis of depression, which is based on an in-depth learning method, and includes machine learning which integrates different depression-related questions on multiple questionnaires collected through health screening Algorithm and a system for analyzing and providing depression-related medical information using the same.

우울증 진단을 위한 기존의 단순 자가보고식 설문 위주의 평가를 대체하여, 다양한 설문의 결과를 통합하고, 증상 요인들의 다변량적 영향을 반영할 수 있는 기계학습 기반의 설문 알고리즘의 일환으로서, 우울증 예측 기술의 개발과 활용은 우울증으로 인한 고통과 사회 경제적 비용의 감소를 위하여 꼭 필요한 기술이다. 그 결과, 우울증의 신속한 진단 및 분석을 위한 기계학습 기반의 설문조사 분석 시스템인 본 발명은 민감도, 특이도가 높은 객관적 검진기술의 확보 및 정신건강검진 산업활성화를 촉진할 것으로 기대된다.As a part of a machine learning based survey algorithm that can replace the existing self - report questionnaire - based assessment for depression diagnosis, integrate the results of various questionnaires, and reflect the multivariate effects of symptom factors, Is a necessary skill to reduce the pain and socioeconomic costs of depression. As a result, the present invention, which is a machine learning based survey analysis system for rapid diagnosis and analysis of depression, is expected to facilitate securing objective diagnostic techniques with high sensitivity and specificity and revitalizing the mental health examination industry.

일반적으로 정신건강검진은 설문결과에서 의미 있다고 판단되는 경우에만 정신과 의사의 평가를 받게 되기에 다음과 같은 문제가 발생하게 된다. 대규모 인원을 대상으로 얻은 설문의 경우, 임상의사의 대면 면접이 어려워 지도학습 기반의 심층 학습을 적용한 고위험군의 최우수 표준화 지표(golden standard)를 만들 수 없다는 제한점이 존재한다. 이에, 본 발명은 비지도 학습 기반의 심층 학습 모델을 사용하고 있기에 이러한 문제의 해답이 될 수 있다. In general, mental health checkups are subject to evaluation by a psychiatrist only if they are judged to be meaningful in the results of the survey. In the case of questionnaires obtained for large-scale personnel, there is a limitation in that it is difficult to conduct a face-to-face interview with a clinical doctor, and thus it is not possible to create a golden standard for high-risk groups applying in-depth learning based on instructional learning. Accordingly, the present invention can be a solution to such a problem because it uses an in-depth learning model based on non-background learning.

이하에서는 본 발명의 실시예들에 따른 우울증 진단을 위한 다중 설문 분석 시스템 및 그 방법에 대해 도 1 내지 도 7을 참조하여 상세히 설명한다.Hereinafter, a multiple questionnaire analysis system and method for diagnosing depression according to embodiments of the present invention will be described in detail with reference to FIG. 1 to FIG.

도 1은 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템의 세부 구성에 대한 블록도를 도시한 것이고, 도 2는 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 방법의 흐름도를 도시한 것이다.FIG. 1 is a block diagram illustrating a detailed configuration of a multiple questionnaire analysis system for diagnosing depression according to an embodiment of the present invention. FIG. 2 is a flowchart of a method for analyzing multiple questionnaires for diagnosing depression according to an embodiment of the present invention. FIG.

본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)은 통합 잠재 변수 모델을 이용하여 대상 환자로부터 수집되는 우울증에 관련된 대상 설문 데이터에 따른 우울증 진단을 예측한다.The multiple questionnaire analysis system 100 for diagnosing depression according to an embodiment of the present invention predicts the diagnosis of depression according to subject questionnaire data related to depression collected from a subject using an integrated latent variable model.

이를 위해, 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)은 수집부(110), 모델 학습부(120), 진단 예측부(130) 및 전송부(140)를 포함한다.The multiple questionnaire analysis system 100 for diagnosing depression according to an embodiment of the present invention includes a collecting unit 110, a model learning unit 120, a diagnostic predicting unit 130, and a transmitting unit 140 .

이 때, 수집부(110), 모델 학습부(120), 진단 예측부(130) 및 전송부(140)는 도 2의 단계들(210~240)을 수행하기 위해 구성될 수 있다.In this case, the collecting unit 110, the model learning unit 120, the diagnostic predicting unit 130, and the transmitting unit 140 may be configured to perform the steps 210 to 240 of FIG.

단계 210에서, 수집부(110)는 환자의 우울증에 관련된 설문 히스토리 데이터와, 환자의 메디컬 데이터를 수집하여 설문조사 데이터베이스로 데이터베이스화한다. In step 210, the collecting unit 110 collects survey data and patient medical data related to the depression of the patient and stores the collected data in the survey database.

수집부(110)는 환자에 대한 우울증에 관련된 설문 히스토리 데이터, 메디컬 데이터 및 개인 데이터 각각을 데이터베이스화하여 저장하여 유지할 수 있다. 보다 구체적으로, 수집부(110)는 환자로부터 우울증 관련 정보가 포함된 설문 히스토리 데이터를 수집하고, 설문 히스토리 데이터에 포함된 개인 데이터를 암호화하며, 암호화된 개인 데이터 및 검진일을 기본 키로 사용하여 설문조사 데이터베이스를 구축할 수 있다. The collecting unit 110 may store and store survey history data, medical data, and personal data related to the depression of the patient in a database. More specifically, the collecting unit 110 collects survey history data including the depression-related information from the patient, encrypts the personal data included in the question history data, and uses the encrypted personal data and the check date as a primary key, An investigation database can be constructed.

우선적으로, 수집부(110)는 설문지 문항에 대해 환자로부터 작성된 설문조사 결과인 설문 히스토리 데이터를 수집하며, 예를 들어 환자에게 제공되는 설문지는 다음과 같은 정보가 포함될 수 있다. 상기 설문지는 환자를 특정할 수 있는 개인 데이터, 예를 들면 이름, 주민등록번호, 생년월일, 직장인의 경우 사번, 학생의 경우 학번 등을 포함할 수 있다. 또한, 상기 설문지는 환자의 인구통계학적 특징 예를 들면, 나이, 성별, 가족구성, 결혼 여부, 친구의 수, 조언자의 수, 직장인의 경우 직급, 학생의 경우 학년 등을 포함할 수 있으며, 우울증과 간접적으로 관련 있는 육체적 또는 정신적 건강관련 설문 문항을 포함할 수 있다. 보다 상세하게는, 상기 설문지는 흡연 여부, 음주 여부, 수면량, 수면의 규칙성, 주의력 결핍 과다 행동장애, 스마트폰 의존도(Smartphone addiction scale) 등을 포함할 수 있으며, 직접적으로 우울증 및 정신질환과 관련된 설문 문항 예를 들면, BDI(Beck Depression Inventory), PHQ(Patient Health Questionnaire), GAD(Generalized Anxiety Disorder), RAS(Resilience Appraisals Scale), LSAS(Liebowitz Social Anxiety), SSI(Scale of Suicide Ideation) 등을 포함할 수 있다.First, the collection unit 110 collects questionnaire history data, which is a result of a questionnaire survey made by the patient, on the questionnaire item. For example, the questionnaire provided to the patient may include the following information. The questionnaire may include personal data that can identify a patient, such as name, resident registration number, date of birth, occupation number for an employee, and student number for a student. The questionnaire can also include demographic characteristics of the patient such as age, sex, family composition, marital status, number of friends, number of counselors, job title for employees, grade for students, And physical or mental health-related questionnaires that are indirectly related to health and mental health. More specifically, the questionnaire may include, but is not limited to, smoking, drinking, sleeping, regularity of sleep, attention deficit hyperactivity disorder, and a smartphone addiction scale, and may be directly related to depression and mental illness For example, questions such as Beck Depression Inventory (BDI), Patient Health Questionnaire (PHQ), Generalized Anxiety Disorder (GAD), Resilience Appraisals Scale (RAS), Liebowitz Social Anxiety (LSAS), and Scale of Suicide Ideation .

이 때, 상기 메디컬 데이터는 환자의 개인적인 의료 기록, 예를 들어 투병 기간, 약의 오남용 시간, 알코올의 오남용 기간, 정신과 상태 측정 스케일에 따른 점수, PHQ, GAD, BPRS, SANS, SAPS, BDI­I, BDI­II, BHS, SCST, RLI, SSI 등일 수 있다.In this case, the medical data may include personal medical records of patients, for example, duration of illness, abuse of medication, duration of abuse of alcohol, scores according to psychiatric condition measurement scale, PHQ, GAD, BPRS, SANS, SAPS, BDII, BDIII , BHS, SCST, RLI, SSI, and the like.

이후, 수집부(110)는 설문 히스토리 데이터에서 환자의 민감한 개인 데이터를 암호화할 수 있다. 이는 환자의 설문조사 결과인 설문 히스토리 데이터에서 개인 데이터를 제외하고, 비교분석을 위해 광범위하게 공개하기 위한 절차이다. 상기 암호화는 암호화 알고리즘, 예를 들어 AES(Advanced Encryption Standard)를 사용하여 환자의 개인 데이터를 암호화키로 암호화할 수 있으며, 해쉬 알고리즘, 예를 들어 SHA(Secure Hash Algorithm)을 이용하여 개인 데이터를 해쉬화할 수 있다. 이후, 암호화된 환자의 개인 데이터를 통해 환자 본인이나 환자를 진찰하여 의학적 판단을 제공하는 의학 전문가만이 해당 환자의 암호값으로 설문조사 데이터베이스에서 환자의 설문 히스토리 데이터를 색인하는 것이 가능하다. Then, the collecting unit 110 can encrypt the sensitive personal data of the patient in the question history data. This is a procedure to exclude the personal data from the questionnaire history data, which is the result of the patient survey, and to make it widely available for comparative analysis. The encryption can encrypt the patient's personal data with an encryption key using an encryption algorithm, for example, AES (Advanced Encryption Standard), and hash the personal data using a hash algorithm, for example, SHA (Secure Hash Algorithm) . It is then possible for only a medical professional to examine the patient himself or the patient through the encrypted patient's personal data and provide a medical judgment to index the patient's question history data in the questionnaire database with the patient's password value.

이후, 수집부(110)는 설문조사 데이터베이스에서 정신건강검진에 사용된 설문지 종류에 대응하는 하나의 설문지 종류마다 하나의 테이블을 구성하여 설문조사 결과인 설문 히스토리 데이터를 저장하여 유지할 수 있다. 이는 설문 히스토리 데이터를 테이블에 저장함에 있어, 암호화된 환자의 개인 데이터와 검진일을 기본 키(Primary Key)로 사용하여 추후에 우울증 관련 의학 정보를 비교 분석할 때, 설문조사 데이터베이스에서 환자의 설문조사 결과인 설문 히스토리 데이터를 특정하여 사용하고자 함이다.Thereafter, the collecting unit 110 may store a questionnaire history data, which is a survey result, by constructing one table for each questionnaire type corresponding to the questionnaire type used in the mental health examination in the questionnaire database. This is because when the survey history data is stored in the table, the patient's personal data and the date of the examination are used as the primary key to compare and analyze the depression-related medical information, and the patient's questionnaire We want to specify the result of the questionnaire history data.

단계 220에서, 모델 학습부(120)는 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 복수의 설문 문항 각각에 대한 잠재 변수 모델을 학습하고, 학습된 잠재 변수 모델을 이용하여 다중 설문지에 대한 통합 잠재 변수 모델을 학습한다. In step 220, the model learning unit 120 learns a latent variable model for each of a plurality of question items from collected survey history data and medical data, and calculates a combined latent variable model for multiple questionnaires using the learned latent variable model .

보다 구체적으로, 모델 학습부(120)는 설문조사 데이터베이스에서 설문 히스토리 데이터를 설문지의 종류별로 분류하는 제1 단계, 분류된 각 설문지에서 공통적인 설문 문항 또는 고유의 설문 문항으로 분리하는 제2 단계, 공통적인 설문 문항에 대해 사다리형 회로망(Ladder network) 기반의 잠재 변수 모델을 학습하는 제3 단계, 고유의 설문 문항에 대해 사다리형 회로망(Ladder network) 기반의 잠재 변수 모델을 학습하는 제4 단계, 및 학습된 잠재 변수 모델들을 사용하여 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 제5 단계로 구성될 수 있다. More specifically, the model learning unit 120 includes a first step of classifying survey history data into questionnaire types in a questionnaire database, a second step of separating questionnaire items into common questionnaires or unique questionnaires in each of the classified questionnaires, The third step is to learn the latent variable model based on the ladder network, the fourth step to learn latent variable model based on the ladder network for the original questionnaire item, And a fifth step of learning an integrated latent variable model for multiple questionnaires using learned latent variable models.

상기 제1 단계에서, 설문 히스토리 데이터는 설문조사 데이터베이스에 설문지 종류별로 분류되어 테이블에 저장되므로, 모델 학습부(120)는 복수의 각 테이블에 해당하는 저장 값을 획득할 수 있다. 이 때, 상기 제1 단계에서 설문지 종류별 설문 히스토리 데이터의 기본 키를 형성하는 암호화된 환자의 개인 데이터 및 검진일은 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 과정에 포함되지 않으므로, 설문지의 종류별로 분류 시 제외할 수 있다. In the first step, the survey history data is classified into the questionnaire database by the questionnaire type and stored in the table, so that the model learning unit 120 can acquire the stored values corresponding to the plurality of tables. At this time, since the personal data of the encrypted patient forming the primary key of the questionnaire history data by the questionnaire type in the first step and the examination date are not included in the process of learning the integrated latent variable model for the multiple questionnaires, Can be excluded.

상기 제2 단계에서, 모델 학습부(120)는 각 설문지 종류별 설문 문항의 교집합을 획득하여 설문지들 간의 공통적인 설문 문항으로 설정하고, 고유의 설문 문항은 각 설문지 종류별 설문 문항과 공통적인 설문 문항의 차집합으로 획득할 수 있다. 이후의 단계에서 각 설문 문항의 값은 부동 소수점으로 표현될 수 있다. 예외로서 범주(category) 값을 포함하는 설문 문항의 경우, 순서에 따라 선형적 의미가 있는 범주 값은 부동소수점으로 표현하고, 순서에 유의미한 내용이 없는 범주 값은 one­hot 표현, 예를 들어 성별에서 남성은 0, 여성은 1로 표현할 수 있다. In the second step, the model learning unit 120 acquires the intersection of the questionnaire items of the questionnaire types and sets them as a common questionnaire item among the questionnaire items. The unique questionnaire items are the questionnaire items of each questionnaire type and the common questionnaire items It can be obtained by a difference set. In the following steps, the value of each question item can be expressed as a floating point number. In the case of questionnaires that include category values as an exception, category values with linear significance in the order are represented by floating point, and category values without meaning in the order are represented by onehot expression, for example, Can be expressed as 0 for women and 1 for women.

상기 제3 단계에서, 모델 학습부(120)는 대표적인 비지도 심층 학습 기법 중 잠재 변수 모델을 학습하는 기계학습 방법론인 오토인코더(Autoencoder)를 바탕으로 측면 연결(lateral connection)을 통해 성능을 향상시킨 사다리형 회로망(Ladder network)를 사용하여 설문지들 간의 공통적인 설문 문항에 대한 잠재 변수 모델을 학습할 수 있다. In the third step, the model learning unit 120 improves performance through a lateral connection based on an autoencoder which is a machine learning methodology for learning a latent variable model among a representative non-mapping deep learning method Using a ladder network, you can learn latent variable models for common questionnaires among questionnaires.

이 때, 사다리형 회로망(Ladder network)는 하기의 [수식 1]과 같이 비용 함수 LR를 최소화하는 가중치를 찾는 목적을 포함하는 비지도 인공신경망 모델일 수 있다.In this case, the ladder network may be a non-geodesic artificial neural network model including a purpose of finding a weight that minimizes the cost function L R as in Equation (1) below.

[수식 1][Equation 1]

Figure pat00001
Figure pat00001

이 때, x는 입력 값인 설문지들 간의 공통적인 설문 문항을 의미하고,

Figure pat00002
는 인공신경망에 의해 재구성된(reconstructed) 공통적인 설문 문항을 의미하며,
Figure pat00003
는 인코딩된(encoding)
Figure pat00004
번째 인공신경망의 은닉층(hidden layer)을 의미한다. 또한,
Figure pat00005
는 디코딩된(decoding)
Figure pat00006
번째 인공신경망의 은닉층(hidden layer)을 의미하고, L은 인공신경망의 은닉층 개수를 의미한다.In this case, x represents a common question item among the questionnaires as input values,
Figure pat00002
Means a common question item reconstructed by an artificial neural network,
Figure pat00003
Lt; RTI ID = 0.0 >
Figure pat00004
And the hidden layer of the second artificial neural network. Also,
Figure pat00005
Decode < / RTI >
Figure pat00006
(Hidden layer) of the second artificial neural network, and L represents the number of hidden layers of the artificial neural network.

아울러,

Figure pat00007
는 (a)공통적인 설문 문항과 인공신경망에 의해 재구성된 공통적인 설문 문항 간의 제곱 편차(squared error), 또는 (b)인코딩된 은닉층과 디코딩된 은닉층 간의 제곱 편차를 각각 얼마만큼의 가중치를 두어 비용함수를 최소화하는지를 정해주는 계수를 의미한다. 이 때, (a)는 [수식 1]에서의
Figure pat00008
를 나타내며, (b)는 [수식 1]에서의
Figure pat00009
를 나타내는 것으로, 즉,
Figure pat00010
는 (a) 및 (b)가 비용함수에 부가될 때의 가중치를 의미한다.together,
Figure pat00007
(A) a squared error between a common survey item and a common survey item reconstructed by an artificial neural network, or (b) a square deviation between the encoded hidden layer and the decoded hidden layer, It means a coefficient that determines whether the function is minimized. At this time, (a) represents the value of
Figure pat00008
(B) shows the relationship between
Figure pat00009
That is,
Figure pat00010
Means a weight when (a) and (b) are added to the cost function.

이러한 최적화 문제를 통해 모델 학습부(120)는 사다리형 회로망(Ladder network)을 이용하여 최상 은닉층

Figure pat00011
을 최종적으로, 설문지들 간의 공통적인 설문 문항에 대한 잠재 변수인
Figure pat00012
를 학습할 수 있다. Through this optimization problem, the model learning unit 120 uses the ladder network to construct the best hidden layer
Figure pat00011
, Which is a potential variable for common questionnaires among the questionnaires
Figure pat00012
Can be learned.

상기 제4 단계에서, 모델 학습부(120)는 공통적인 설문 문항에 대해 사다리형 회로망(Ladder network) 기반의 잠재 변수 모델을 학습하는 제3 단계와 동일하게 사다리형 회로망(Ladder network)를 사용하여 각 설문지별 고유의 설문 문항의 잠재 변수를 학습할 수 있다. 이 때, 모델 학습부(120)는 설문지 종류의 개수와 동일한 개수의 사다리형 회로망(Ladder network)를 학습하여 각 사다리형 회로망(Ladder network)의 최상 은닉층을 i번째 설문지에 대한 고유의 설문 문항의 잠재 변수

Figure pat00013
로 사용할 수 있다. In the fourth step, the model learning unit 120 uses a ladder network in the same manner as the third step of learning a latent variable model based on a ladder network for a common question item It is possible to learn the potential variables of the questionnaire items unique to each questionnaire. At this time, the model learning unit 120 learns the same number of ladder networks as the number of questionnaire types, and determines the best hidden layer of each ladder network as a unique questionnaire item for the i-th questionnaire Potential variable
Figure pat00013
.

상기 제5 단계에서, 다중 설문지에 대한 통합 잠재 변수 모델은 각 설문지를 하나의 모달(modal)로 간주하며, 종래의 다중 모달(multi modal)에 대한 잠재 변수 문제의 특수한 예로 가정할 수 있다. 통상의 다중 모달에 대한 잠재 변수의 심층 학습적 해법은 오토인코더(Autoencoder)를 사용하여 공통 특징점을 학습하는 방법을 사용하는데, 이 경우 서로 다른 모달에서 동일한 의미의 1대1 대응을 나타내는 학습 데이터가 일정량 이상 존재해야만 한다는 한계가 존재하였다. 아울러, 상기 방법은 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)에 적용시킬 수 없으며, 정신건강검진의 경우, 환자의 상태가 검진 마다 변하기 때문에 인위적인 실험을 제외하고는 서로 다른 설문지를 1대1 대응시킬 수 있는 학습 데이터를 모집하는 것은 불가능하다.In the fifth step, the integrated latent variable model for multiple questionnaires considers each questionnaire as one modal, and it can be assumed that it is a specific example of the latent variable problem for conventional multi-modal. The in-depth learning solution of the latent variable for the ordinary multi-modal uses a method of learning a common feature point by using an autoencoder. In this case, the learning data representing the one-to-one correspondence with the same meaning in different modalities There was a limit that there should be more than a certain amount. In addition, the method can not be applied to the multiple questionnaire analysis system 100 for diagnosing depression according to the embodiment of the present invention. In the case of mental health examination, since the state of the patient changes with each examination, It is not possible to collect learning data that can correspond to one-on-one questionnaires.

따라서, 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)의 모델 학습부(120)는 상기 제5 단계에서, 상대적으로 1대1 대응의 학습이 가능한 약한 공유 특징점(weakly shared representation)을 사용하여 설문지 간 공통적인 설문 문항 및 고유의 설문 문항으로 분류하고, 유사하게 1대1 대응시킴으로써, 다중 설문지에 대한 통합 잠재 변수 모델을 학습할 수 있다. Accordingly, in the fifth step, the model learning unit 120 of the multiple questionnaire analysis system 100 for diagnosing depression according to an embodiment of the present invention generates a weakly shared feature point capable of relatively one-to- representation is used to classify common questionnaires and unique questionnaires among the questionnaires, and a one-to-one correspondence can be made to learn the integrated latent variable model for multiple questionnaires.

이 때, 사다리형 회로망(Ladder network)에 의한 약한 공유 특징점 학습은 하기의 [수식 2]와 같은 비용 함수 L를 최소화하는 과정에서 형성될 수 있다. In this case, weak shared feature point learning by the ladder network can be formed in the process of minimizing the cost function L as expressed by [Equation 2] below.

[수식 2][Equation 2]

Figure pat00014
Figure pat00014

이 때,

Figure pat00015
Figure pat00016
는 각각 공통적인 설문 문항과, i번째 설문지에 대한 고유의 설문 문항에 대한 [수식 1]로부터 획득되는 사다리형 회로망(Ladder network)의 비용 함수를 의미한다. 또한,
Figure pat00017
는 공통적인 설문 문항의 잠재 변수와, i번째 설문지에 대한 고유의 설문 문항의 잠재 변수의 제곱 편차를 의미하며,
Figure pat00018
는 비용 함수들의 비율을 정하는 가중치를 의미한다. At this time,
Figure pat00015
And
Figure pat00016
Is a cost function of a ladder network obtained from [Equation 1] for a common questionnaire item and a unique questionnaire item for the i-th questionnaire, respectively. Also,
Figure pat00017
, Which means that the latent variable of the common question item and the square deviation of the latent variable of the original question item for the i-th questionnaire,
Figure pat00018
Is a weight that determines the ratio of cost functions.

이 때,

Figure pat00019
를 추가적으로 최소화함으로써, 공통적인 설문 문항, 및 i번째 설문지에 대한 고유의 설문 문항은 제곱 편차를 최소화, 즉 서로 비슷한 분포를 포함하는 약한 공유 특징점(weakly shared representation)으로서 학습될 수 있다. 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)은 약한 공유 특징점(weakly shared representation) 학습을 각 설문지에 대해 조정 주기(epoch)마다 변경되는 임의의 순서로 학습함으로써, 최종적으로 공통적인 설문 문항의 잠재 변수 및 모든 설문지에 대한 고유의 설문 문항의 잠재 변수 간의 약간 공유 특징점, 즉 하기의 [수식 3]을 만족할 수 있다. At this time,
Figure pat00019
, The common questionnaire items and the unique questionnaire items for the i-th questionnaire can be learned as a weakly shared representation that minimizes the squared deviations, i. E., Contains similar distributions. The multiple questionnaire analysis system 100 for diagnosing depression according to an embodiment of the present invention learns weakly shared representation learning in an arbitrary order changed for each questionnaire per adjustment period (epoch) There are some shared feature points between the potential variables of the common questionnaire items and the latent variables of the original questionnaire items for all questionnaires, that is, [Equation 3] below.

[수식 3][Equation 3]

Figure pat00020
Figure pat00020

단계 230에서, 진단 예측부(130)는 통합 잠재 변수 모델을 이용하여 대상 환자로부터 수신되는 우울증에 관련된 대상 설문 데이터를 잠재 변수로 변환하고, 변환된 잠재 변수와 데이터베이스를 비교하여 대상 환자에 대한 우울증 진단을 예측한다. In step 230, the diagnostic predicting unit 130 converts the subject questionnaire data related to the depression received from the subject patient to the latent variable using the integrated latent variable model, and compares the converted latent variable with the database, Predict the diagnosis.

보다 구체적으로, 진단 예측부(130)는 새 건강검진 대상자인 대상 환자로부터 우울증 관련 설문조사를 작성 받아 대상 설문 데이터를 수신하고, 학습된 다중 설문지에 대한 통합 잠재 변수 모델을 이용하여 대상 설문 데이터에 대한 설문조사 결과를 잠재 변수로 변환하며, 변환된 잠재 변수와 설문조사 데이터베이스에 저장되어 유지되는 기존 잠재 변수를 비교하여 분류군을 판단할 수 있다. 이후, 진단 예측부(130)는 판단된 분류군에서의 대상 설문 데이터의 중요도를 분석하고, 데이터베이스화된 설문 히스토리 데이터와 대상 설문 데이터를 비교 분석하여 대상 환자에 대한 우울증 진단을 예측할 수 있다. More specifically, the diagnostic predicting unit 130 receives the questionnaire data on the depression from the patient who is a new health checkup target, receives the questionnaire data, and uses the integrated latent variable model for the learned multiple questionnaire data The results of the survey can be converted into latent variables, and the taxa can be determined by comparing the latent variables converted with the existing latent variables stored in the survey database. Thereafter, the diagnostic predicting unit 130 analyzes the importance of the questionnaire data in the determined taxon, and compares and analyzes the questionnaire historical data with the questionnaire data to predict the depression diagnosis of the subject.

예를 들어, 새 건강검진 대상자인 대상 환자로부터 대상 설문 데이터를 수집하는 과정은 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)의 수집부(110)를 통해 수신될 수 있다.For example, the process of collecting subject questionnaire data from a subject who is a new health checkup subject may be received through the collection unit 110 of the multiple questionnaire analysis system 100 for diagnosing depression according to an embodiment of the present invention .

진단 예측부(130)는 새 건강검진 대상자인 대상 환자로부터 수집된 대상 설문 데이터를 설문지 간 공통적인 설문 문항과 해당 설문지에 대한 고유의 설문 문항으로 분리하여 각각에 해당하는 사다리형 회로망(Ladder network)에 입력한 후, 각 설문지간 공통적인 설문 문항의 잠재 변수와, 해당하는 설문지에 대한 고유의 설문 문항의 잠재 변수를 출력할 수 있다.The diagnosis predicting unit 130 divides the questionnaire data collected from the subject who is the new health checkup target into a questionnaire item common to the questionnaires and a unique questionnaire item for the questionnaires, , It is possible to output the latent variable of the questionnaire items common to each questionnaire and the latent variable of the unique questionnaire item corresponding to the questionnaire.

이후, 진단 예측부(130)는 각 설문지간 공통적인 설문 문항의 잠재 변수 및 해당하는 설문지에 대한 고유의 설문 문항의 잠재 변수와, 설문조사 데이터베이스에 저장되어 유지되는 기존 잠재 변수를 비교하여 어느 분류군에 대응하는지를 판단할 수 있다. 이 때, 잠재 변수를 GMM(Gaussian Mixture Model) 모델에 대입하여 대상 설문 데이터가 설문조사 데이터베이스의 어느 분류군들과 비슷한지를 비교할 수 있다. 비교 결과는 GMM 모델에 의하여 각 분류군에 속할 확률로 산출될 수 있다. Thereafter, the diagnostic predicting unit 130 compares the latent variables of the questionnaire items common to each questionnaire with the latent variables of the unique questionnaire items corresponding to the questionnaire and the existing latent variables stored and maintained in the questionnaire database, It is possible to judge whether or not it corresponds. At this time, potential variables can be assigned to a GMM (Gaussian Mixture Model) model to compare which survey data is similar to which taxa in the survey database. The result of the comparison can be calculated as the probability belonging to each taxon by the GMM model.

또한, 진단 예측부(130)는 기계학습 모델과 상관없이 모델의 결과값에 영향을 미치는 특징점의 중요도를 분석하는 수학 모델, 예를 들어 LIME(Local Interpretable Model­agnostic Explanations) 및 PDA(Prediction Difference Analysis) 방법론을 사용하여 해당 분류군이라고 판단하는데 영향력 있는 설문 문항의 중요도를 분석할 수 있다.The diagnostic predicting unit 130 may include a mathematical model, for example, LIME (Local Interpretable Model Analytic Explanations) and a PDA (Prediction Difference Analysis) method for analyzing the importance of feature points that affect the result values of the model regardless of the machine learning model And the importance of the influential questionnaire items can be analyzed.

이후, 진단 예측부(130)는 설문조사 데이터베이스에 저장된 대상 환자의 설문 히스토리 데이터와 대상 설문 데이터를 비교 분석하여 대상 환자에 대한 우울증 진단을 예측할 수 있다. 예를 들면, 진단 예측부(130)는 대상 환자의 암호화된 개인 데이터를 기본 키로 활용하여 설문조사 데이터베이스에 저장되어 유지되는 대상 환자의 설문 히스토리 데이터를 획득하고, 설문 히스토리 데이터를 다중 설문지에 대한 통합 잠재 변수 모델을 이용하여 잠재 변수로 표현하며, GMM 모델에 대입하여 각각 어느 분류군에 분류되는지를 획득할 수 있다. 이에 따라서, 진단 예측부(130)는 대상 환자에 대한 우울증 진단을 예측할 수 있다.Thereafter, the diagnosis predicting unit 130 can compare the questionnaire history data of the subject patient stored in the questionnaire database with the subject questionnaire data to predict the depression diagnosis of the subject. For example, the diagnostic predicting unit 130 acquires survey history data of a target patient stored and maintained in the survey database using the encrypted personal data of the target patient as a primary key, and transmits the survey history data to the integration It can be expressed as latent variable using latent variable model, and it can be assigned to GMM model to acquire which taxa are classified respectively. Accordingly, the diagnosis predicting unit 130 can predict the diagnosis of depression in the target patient.

단계 240에서, 전송부(140)는 대상 환자에 대한 우울증 진단 결과를 제공한다. In step 240, the transfer unit 140 provides a depression diagnosis result for the target patient.

예를 들면, 전송부(140)는 진단 예측부(130)를 통해 예측된 대상 환자에 대한 우울증 진단 결과를 의학전문가에게 보다 효율적으로 제공하기 위해, 대상 환자의 시간에 따른 우울증 변화에 대한 설문 문항의 값들을 색 및 수치 값으로 제공할 수 있다.For example, in order to more efficiently provide the diagnosis result of the depression to the subject predicted through the diagnostic predicting unit 130 to the medical professional, the transfer unit 140 may include a questionnaire Can be provided as color and numerical values.

즉, 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템(100)은 서로 다른 우울증 관련 설문지 문항들을 통합하는 기계학습 알고리즘을 이용함으로써, 설문지들의 설문 문항이 동일하지 않더라도, 복수의 환자들과 비교 분석하여 보다 효율적이고 정확한 우울증 관련 의학적 정보를 제공할 수 있다.That is, the multiple questionnaire analysis system 100 for diagnosing depression according to an embodiment of the present invention uses a machine learning algorithm that integrates different depressive questionnaire items, so that even if the questionnaire items of the questionnaire are not the same, And to provide more efficient and accurate depression-related medical information.

도 3은 본 발명의 실시예에 따른 통합 잠재 변수 모델에 대한 모식도의 예를 도시한 것이다.FIG. 3 shows an example of a schematic diagram of an integrated latent variable model according to an embodiment of the present invention.

다중의 서로 다른 설문지 간의 공통적인 설문 문항과 각 설문지에 대한 고유의 설문 문항들은 도 3에 도시된 바와 같이, 같은 형태로 각각의 사다리형 회로망(Ladder network)을 통해 잠재 변수(z)를 출력하게 된다. 이 때, 각각의 잠재 변수들은 약한 공유 특징점(weakly shared representation)의 성격을 나타내므로 유사한 분포를 나타낼 수 있다. Common questionnaires among multiple different questionnaires and unique questionnaires for each questionnaires output the latent variable z through each ladder network in the same form as shown in FIG. 3 do. At this time, each latent variable represents a weakly shared representation, so it can show a similar distribution.

도 4a 및 도 4b는 본 발명의 실시예에 따른 잠재 변수 모델 및 통합 잠재 변수 모델 각각의 예를 도시한 것이다.4A and 4B show examples of latent variable models and integrated latent variable models, respectively, according to an embodiment of the present invention.

보다 상세하게는, 도 4a는 다중 설문지를 통합하기 위해 각 설문지에 대한 고유의 설문 문항을 제외하고, 공통적인 설문 문항만을 사용한 잠재 변수 모델을 이용하여 추출한 잠재 변수의 분포 결과를 도시한 것이고, 도 4b는 본 발명에서 제안하는 다중 설문지에 대한 통합 잠재 변수 모델을 이용하여 추출한 잠재 변수의 분포 결과를 도시한 것이다. More specifically, FIG. 4A shows distribution results of latent variables extracted using a latent variable model using only a common survey item, except for a unique questionnaire item for each questionnaire to integrate multiple questionnaires. 4b shows the distribution of latent variables extracted using the integrated latent variable model for the multiple questionnaires proposed in the present invention.

이 때, 도 4a 및 도 4b에 도시된 결과 그래프는 실제 서로 다른 3가지 종류의 우울증 관련 설문조사 결과를 25000여 개 활용하여 학습한 결과에 대해 t­SNE(t­Distributed Stochastic Neighbor Embedding)를 사용하여 2차원으로 나타낸 것이다. 각 모델은 500개의 은닉 노드를 가지는 3개의 층으로 형성되어 있으며, 최종적으로 4차원 잠재 변수를 출력할 수 있다.4A and 4B illustrate the results obtained by using the results of three different types of depression-related questionnaires, which are actually different from each other, in two dimensions using tSNE (tDistributed Stochastic Neighbor Embedding) . Each model is composed of three layers with 500 hidden nodes, and finally can output 4-dimensional latent variables.

도 4a 및 도 4b 각각의 왼쪽 그래프는 학습된 잠재 변수를 GMM(Gaussian Mixture Model)을 통해 두 개의 군집으로 클러스터링(clustering)한 결과로서, 빨간 점과 파란 점은 각각의 군집에 포함되는 잠재 변수를 의미하고, 청록색 점들은 실제 진단 결과 우울증을 가지고 있었다고 판명된 환자들의 설문조사에 대한 잠재 변수를 의미한다.The left graph of each of FIGS. 4A and 4B is a result of clustering the learned latent variable into two clusters using a GMM (Gaussian Mixture Model), and the red and blue points are latent variables included in the respective clusters , And cyan points indicate potential variables for the survey of patients who were found to have depression as a result of the actual diagnosis.

또한, 도 4a 및 도 4b 각각의 오른쪽 그래프는 실제 의학전문가들의 우울증을 진단할 때 일차적으로 확인하는 우울증에 직접 관련된 설문 문항인 PHQ(Patient Health Questionnaire) 값을 잠재 변수에 대입하여 표현한 그래프로, 색이 빨간 값에 가까울수록 우울증이 심한 것을 의미하며, 반대로 파란 값에 가까울수록 정상임을 의미한다.4A and FIG. 4B are graphs showing the results of substituting the PHQ (Patient Health Questionnaire) value, which is a question directly related to depression, which is confirmed primarily in diagnosing depression of medical professionals, into latent variables, The closer to the red value, the greater the degree of depression. On the other hand, the closer to the blue value, the more normal it is.

즉, 도 4a 및 도 4b를 참조하면, 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템에서 제안하는 다중 설문지에 대한 통합 잠재 변수 모델이 실제 우울증 환자들의 데이터들을 상대적으로 더 군집시키고 있음을 확인할 수 있다.That is, referring to FIGS. 4A and 4B, the integrated latent variable model for multiple questionnaires proposed in the multiple questionnaire analysis system for diagnosing depression according to an embodiment of the present invention relies more on data of actual depressed patients can confirm.

또한, 도 4a 및 도 4b를 참조하면, 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템에서 제안하는 다중 설문지에 대한 통합 잠재 변수 모델이 PHQ를 일관성 있게 잠재 변수로서 나타내고 있으며, 그 결과 군집도 PHQ가 상대적으로 높은 집단과 그렇지 않은 집단으로 분류되는 것을 확인할 수 있다. 4A and 4B, the integrated latent variable model for multiple questionnaires proposed by the multiple questionnaire analysis system for diagnosing depression according to an embodiment of the present invention consistently shows PHQ as a latent variable, The cluster is also classified into the group with relatively high PHQ and the group with no PHQ.

도 5는 본 발명의 실시예에 따른 통합 잠재 변수 모델을 사용하여 잠재 변수를 나타내는 그래프의 예를 도시한 것이다.FIG. 5 illustrates an example of a graph representing latent variables using an integrated latent variable model according to an embodiment of the present invention.

보다 상세하게는, 도 5는 본 발명의 실시예에 따른 다중 설문지에 대한 통합 잠재 변수 모델을 사용하여 각 설문지에 대한 고유의 설문 문항 중 우울증과 직간접으로 관련 있는 설문 문항에 대한 잠재 변수를 표현한 그래프의 예를 도시한 것이다.More specifically, FIG. 5 is a graph showing latent variables for questionnaires directly or indirectly related to depression among questionnaires unique to each questionnaires using an integrated latent variable model for multiple questionnaires according to an embodiment of the present invention Fig.

도 5를 참조하면, 왼쪽에서부터 각 그래프는 PHQ와 같이 우울증 정도를 직접 나타내는 BDI(Beck Depression Inventory), 범불안장애를 가진 정도를 나타내는 GAD(Generalized Anxiety Disorder), 자아 존중감에 관한 수치를 나타내는 RSES(Rosenberg's Self­Esteem Scale) 각각을 나타낸다. 이 때, 해당 지수가 높을수록 빨간 값에 가깝고, 낮을수록 파란 값에 가깝게 나타내었다.5, the graphs from the left show the BDI (Beck Depression Inventory) indicating the degree of depression directly, the GAD (Generalized Anxiety Disorder) indicating the degree of having generalized anxiety disorder, and the RSES Rosenberg's SelfEsteem Scale). In this case, the higher the index, the closer to the red value, and the lower the index, the closer to the blue value.

우울증 정도를 직접 나타내는 BDI는 물론이고, 일반적으로 우울증을 가질수록 높게 나타나는 GAD와 반대로 낮게 나오는 RSES 모두 일관성 있는 결과를 나타내는 것을 확인할 수 있다. 이러한 사실은 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템에서 제안하는 통합 잠재 변수 모델이 원활히 작동됨을 확인할 수 있다. In addition to the BDI, which is directly related to the degree of depression, it can be seen that both GAD, which is higher in depression, and RSES, which is lower in level, show consistent results. This fact confirms that the integrated latent variable model proposed in the multiple questionnaire analysis system for diagnosing depression according to the embodiment of the present invention works smoothly.

도 6은 본 발명의 실시예에 따른 설문 문항의 중요도를 분석한 결과를 도시한 것이다.FIG. 6 shows a result of analyzing the importance of a question item according to an embodiment of the present invention.

보다 상세하게는, 도 6은 대상 환자가 해당 분류군으로 판단되는데 영향력이 있는 설문 문항의 중요도를 분석한 결과를 도시한 것이다. 이 때, 상기 분석 결과는 LIME(Local Interpretable Model­agnostic Explanations) 모델을 사용하여 실제 우울증 환자(또는 대상 환자)를 우울증 고위험군으로 판단하는데 영향력 있는 설문 문항의 중요도를 분석한 결과이다. More specifically, FIG. 6 shows the results of analyzing the importance of the questionnaire items that are influential in determining the target patient as the taxa. In this case, the analysis result is the result of analyzing the importance of the questionnaire items influencing the actual depressive patients (or patients) to judge depressed high risk group using LIME (Local Interpretable Modelagnostic Explanations) model.

도 6의 왼쪽에 도시된 예측 확률(prediction probabilities)을 살펴보면, 대상 환자가 GMM에 의해 군집된 결과, 우울증 고위험군에 속할 확률이 100%임을 나타내고 있다. 아울러, 도 6에서의 중간 그래프는 각 설문 문항이 우울증 진단 결정에 미치는 영향력을 나타내는 수치로 해당 수치가 클수록 영향력이 있는 것을 의미하고, 방향에 따라 대상 환자의 설문 결과가 해당 분류군으로 판단되는 것에 영향을 주었다는 것을 의미한다. The prediction probabilities shown on the left side of FIG. 6 indicate that the probability of belonging to the high-risk group of depression is 100% as a result of clustering of the subject patients by the GMM. In addition, the middle graph in FIG. 6 shows the influence of each question item on the diagnosis of depression. As the corresponding value is larger, the influence of the questionnaire results on the determination of the subject group .

아울러, 도 6의 오른쪽 표를 살펴보면, 실제로 설문 결과의 값과, 그 값이 어느 분류군에 영향력이 있는 지를 나타낸다. 즉, 도 6을 살펴보면, 우울증 환자는 수면의 질을 나타내는 PSQI(Pittsburgh Sleep Quality Index)값 일부가 정상이지만 PSQI 값의 총합과 사회 불안 정도, 상황 회피 정도를 나타내는 LSAS1, LSAS2에 의한 영향으로 우울증 환자로 분류될 수 있다. In addition, referring to the right table of FIG. 6, the values of the survey results and the influence of the values on the taxon groups are shown. In other words, referring to FIG. 6, in a depressed patient, although a part of the PSQI (Pittsburgh Sleep Quality Index) value indicating the quality of sleep is normal, the effect of the LSAS1 and LSAS2 indicating the sum of the PSQI values, the degree of social anxiety, . ≪ / RTI >

도 7은 본 발명의 실시예에 따른 의학정보를 제공하는 그래프의 예를 도시한 것이다.FIG. 7 illustrates an example of a graph that provides medical information according to an embodiment of the present invention.

보다 상세하게는, 도 7은 본 발명의 실시예에 따른 설문조사 데이터베이스에 저장된 대상 환자에 대한 설문 히스토리 데이터와 대상 설문 데이터를 비교 분석하고, 분석 결과에 따른 의학정보를 제공하는 그래프의 예를 도시한 것이다.More specifically, FIG. 7 illustrates an example of a graph that provides comparative analysis of questionnaire history data and subject questionnaire data for a subject patient stored in a questionnaire database according to an embodiment of the present invention, and provides medical information according to the analysis result It is.

도 7을 참조하면, 2016년 1월에 우울증으로 진단받고, 관련 약물치료를 한 대상 환자의 치료 전후 설문조사 결과를 나타낸 것으로, 대상 환자의 잠재 변수가 약물치료 후, 우울증 고위험군에서 저위험군으로 이동한 것을 확인할 수 있다. 아울러, 관련 설문 항목인 PHQ 값이 낮아진 것을 확인할 수 있다. FIG. 7 shows the results of a questionnaire survey of patients who were diagnosed with depression in January 2016 and who were treated with related drugs, and the potential variables of the patients were changed from a high risk group to a low risk group . In addition, it can be confirmed that the related question item PHQ value is lowered.

이에 따라서, 본 발명의 실시예에 따른 우울증 진단을 위한 다중 설문 분석 시스템은 서로 다른 우울증 관련 설문지 문항들을 통합하는 기계학습 알고리즘을 이용함으로써, 설문지들의 설문 문항이 동일하지 않더라도, 복수의 환자들과 비교 분석하여 보다 효율적이고 정확한 우울증 관련 의학적 정보를 제공할 수 있다. Accordingly, the multiple questionnaire analysis system for diagnosing depression according to the embodiment of the present invention uses a machine learning algorithm that integrates the different depression questionnaire items, so that even if the questionnaire items of the questionnaire are not the same, To provide more efficient and accurate depression-related medical information.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the apparatus and components described in the embodiments may be implemented within a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable array (FPA) A programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For ease of understanding, the processing apparatus may be described as being used singly, but those skilled in the art will recognize that the processing apparatus may have a plurality of processing elements and / As shown in FIG. For example, the processing unit may comprise a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the foregoing, and may be configured to configure the processing device to operate as desired or to process it collectively or collectively Device can be commanded. The software and / or data may be in the form of any type of machine, component, physical device, virtual equipment, computer storage media, or device , Or may be permanently or temporarily embodied in a transmitted signal wave. The software may be distributed over a networked computer system and stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD­ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기­광 매체(magneto­optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape, optical media such as CDROMs and DVDs, magnetic optical media such as floppy disks, magnetooptical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; / RTI > or equivalents, even if it is replaced or replaced.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (15)

환자의 우울증에 관련된 설문 히스토리 데이터와, 상기 환자의 메디컬 데이터를 수집하여 설문조사 데이터베이스로 데이터베이스화하는 수집부;
상기 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 복수의 설문 문항 각각에 대한 잠재 변수 모델을 학습하고, 상기 학습된 잠재 변수 모델을 이용하여 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 모델 학습부;
상기 통합 잠재 변수 모델을 이용하여 대상 환자로부터 수신되는 우울증에 관련된 대상 설문 데이터를 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스를 비교하여 상기 대상 환자에 대한 우울증 진단을 예측하는 진단 예측부; 및
상기 대상 환자에 대한 우울증 진단 결과를 제공하는 전송부
를 포함하는 우울증 진단을 위한 다중 설문 분석 시스템.
A collection section for collecting survey data related to the depression of the patient and medical data of the patient and database it into a questionnaire database;
A model learning unit that learns a latent variable model for each of a plurality of survey items from the collected survey history data and medical data and learns an integrated latent variable model for multiple questionnaires using the learned latent variable model;
The integrated latent variable model is used to convert subject questionnaire data related to depression received from the subject patient into latent variables and to compare the converted latent variable with the questionnaire database to diagnose depression diagnosis A prediction unit; And
A transfer unit for providing the result of the depression diagnosis on the subject patient,
Multiple questionnaire analysis system for the diagnosis of depression.
제1항에 있어서,
상기 수집부는
상기 환자에 대한 우울증에 관련된 상기 설문 히스토리 데이터, 상기 메디컬 데이터 및 개인 데이터 각각을 상기 설문조사 데이터베이스로 데이터베이스화하는 우울증 진단을 위한 다중 설문 분석 시스템.
The method according to claim 1,
The collecting unit
Wherein the questionnaire history data, the medical data, and the personal data related to the depression of the patient are each databaseed into the questionnaire database.
제2항에 있어서,
상기 수집부는
상기 설문 히스토리 데이터에 포함된 상기 환자에 대한 상기 개인 데이터를 암호화하며, 상기 암호화된 개인 데이터 및 검진일을 기본 키로 사용하여 상기 설문조사 데이터베이스를 구축하는 우울증 진단을 위한 다중 설문 분석 시스템.
3. The method of claim 2,
The collecting unit
Encrypting the personal data for the patient included in the questionnaire history data, and building the questionnaire database using the encrypted personal data and the check date as a primary key.
제2항에 있어서,
상기 수집부는
상기 설문조사 데이터베이스에서 정신건강검진에 사용된 설문지 종류에 대응하는 하나의 설문지 종류마다 하나의 테이블을 구성하여 설문조사 결과인 상기 설문 히스토리 데이터를 저장하여 유지하는 우울증 진단을 위한 다중 설문 분석 시스템.
3. The method of claim 2,
The collecting unit
A plurality of questionnaire analysis systems for diagnosing depression in which one table for each questionnaire type corresponding to the questionnaire type used in the mental health examination is stored in the questionnaire database and the questionnaire history data as a survey result is stored and maintained.
제1항에 있어서,
상기 모델 학습부는
상기 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 공통적인 설문 문항 또는 고유의 설문 문항으로 분류하고, 분류된 각 문항에서의 상기 잠재 변수 모델을 학습하며, 상기 학습된 잠재 변수 모델 각각을 이용하여 상기 다중 설문지에 대한 상기 통합 잠재 변수 모델을 학습하는 우울증 진단을 위한 다중 설문 분석 시스템.
The method according to claim 1,
The model learning unit
The method of claim 1, further comprising the steps of: classifying the collected questionnaire history data and medical data into a common question item or a unique questionnaire item, learning the latent variable model in each classified question, Multiple questionnaire analysis system for depression diagnosis that learns the integrated latent variable model.
제1항에 있어서,
상기 진단 예측부는
상기 통합 잠재 변수 모델을 이용하여 상기 대상 설문 데이터에 대한 설문조사 결과를 상기 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스에 저장되어 유지되는 기존 잠재 변수를 비교하여 분류군을 판단하는 우울증 진단을 위한 다중 설문 분석 시스템.
The method according to claim 1,
The diagnostic predicting unit
The survey result of the questionnaire survey data is converted into the latent variable using the integrated latent variable model and the existing latent variable stored in the survey database is compared with the converted latent variable to determine the taxa Multiple questionnaire analysis system for depression diagnosis.
제6항에 있어서,
상기 진단 예측부는
상기 판단된 분류군에서의 상기 대상 설문 데이터의 중요도를 분석하고, 상기 설문조사 데이터베이스에 저장되어 유지되는 상기 설문 히스토리 데이터와 상기 대상 설문 데이터를 비교 분석하여 상기 대상 환자에 대한 우울증 진단을 예측하는 우울증 진단을 위한 다중 설문 분석 시스템.
The method according to claim 6,
The diagnostic predicting unit
A diagnosis of depression is made by analyzing the importance of the subject questionnaire data in the determined taxa group and comparing the questionnaire history data stored in the questionnaire database and the subject questionnaire data to analyze the subject, Multiple survey analysis system for.
우울증 진단을 위한 다중 설문 분석 시스템의 동작 방법에 있어서,
수집부에서, 환자의 우울증에 관련된 설문 히스토리 데이터와, 상기 환자의 메디컬 데이터를 수집하여 설문조사 데이터베이스로 데이터베이스화하는 단계;
모델 학습부에서, 상기 수집된 설문 히스토리 데이터 및 메디컬 데이터로부터 복수의 설문 문항 각각에 대한 잠재 변수 모델을 학습하고, 상기 학습된 잠재 변수 모델을 이용하여 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 단계;
진단 예측부에서, 상기 통합 잠재 변수 모델을 이용하여 대상 환자로부터 수신되는 우울증에 관련된 대상 설문 데이터를 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스를 비교하여 상기 대상 환자에 대한 우울증 진단을 예측하는 단계; 및
전송부에서, 대상 환자에 대한 우울증 진단 결과를 제공하는 단계
를 포함하는 우울증 진단을 위한 다중 설문 분석 방법.
A method for operating a multiple questionnaire analysis system for diagnosing depression,
Collecting survey history data related to depression of a patient and medical data of the patient and collecting the data into a questionnaire database;
Learning a latent variable model for each of a plurality of survey items from the collected survey history data and medical data and learning an integrated latent variable model for multiple questionnaires using the learned latent variable model, ;
The diagnostic predictor may convert the subject questionnaire data related to the depression received from the subject patient to the latent variable using the integrated latent variable model and compare the converted latent variable with the questionnaire database to determine the depression Predicting a diagnosis; And
In the transfer section, a step of providing depression diagnosis results to the target patient
A method for analyzing multiple questionnaires for the diagnosis of depression.
제8항에 있어서,
상기 설문조사 데이터베이스로 데이터베이스화하는 단계는
상기 환자에 대한 우울증에 관련된 상기 설문 히스토리 데이터, 상기 메디컬 데이터 및 개인 데이터 각각을 상기 설문조사 데이터베이스로 데이터베이스화하는 우울증 진단을 위한 다중 설문 분석 방법.
9. The method of claim 8,
The step of databaseing the questionnaire database
Wherein the questionnaire history data, the medical data, and the personal data related to depression for the patient are each databaseed in the questionnaire database.
제9항에 있어서,
상기 설문조사 데이터베이스로 데이터베이스화하는 단계는
상기 설문 히스토리 데이터에 포함된 상기 환자에 대한 상기 개인 데이터를 암호화하며, 상기 암호화된 개인 데이터 및 검진일을 기본 키로 사용하여 상기 설문조사 데이터베이스를 구축하는 우울증 진단을 위한 다중 설문 분석 방법.
10. The method of claim 9,
The step of databaseing the questionnaire database
Encrypting the personal data for the patient included in the questionnaire history data, and constructing the questionnaire database using the encrypted personal data and the check date as a primary key.
제9항에 있어서,
상기 설문조사 데이터베이스로 데이터베이스화하는 단계는
상기 설문조사 데이터베이스에서 정신건강검진에 사용된 설문지 종류에 대응하는 하나의 설문지 종류마다 하나의 테이블을 구성하여 설문조사 결과인 상기 설문 히스토리 데이터를 저장하여 유지하는 우울증 진단을 위한 다중 설문 분석 시스템.
10. The method of claim 9,
The step of databaseing the questionnaire database
A plurality of questionnaire analysis systems for diagnosing depression in which one table for each questionnaire type corresponding to the questionnaire type used in the mental health examination is stored in the questionnaire database and the questionnaire history data as a survey result is stored and maintained.
제8항에 있어서,
상기 다중 설문지에 대한 통합 잠재 변수 모델을 학습하는 단계는
상기 설문조사 데이터베이스에서 상기 설문 히스토리 데이터를 설문지의 종류별로 분류하는 제1 단계;
상기 분류된 각 설문지에서 공통적인 설문 문항 또는 고유의 설문 문항으로 분리하는 제2 단계;
상기 공통적인 설문 문항에 대해 사다리형 회로망(Ladder network) 기반의 상기 잠재 변수 모델을 학습하는 제3 단계;
상기 고유의 설문 문항에 대해 상기 사다리형 회로망(Ladder network) 기반의 잠재 변수 모델을 학습하는 제4 단계; 및
상기 학습된 잠재 변수 모델들을 사용하여 상기 다중 설문지에 대한 상기 통합 잠재 변수 모델을 학습하는 제5 단계
를 포함하는 우울증 진단을 위한 다중 설문 분석 방법.
9. The method of claim 8,
The step of learning the integrated latent variable model for the multiple questionnaires
A first step of classifying the questionnaire history data in the questionnaire database according to the type of the questionnaire;
A second step of separating each of the classified questionnaires into a common question item or a unique questionnaire item;
A third step of learning the latent variable model based on a ladder network for the common question item;
A fourth step of learning the latent variable model based on the ladder network for the unique question item; And
A fifth step of learning the integrated latent variable model for the multiple questionnaires using the learned latent variable models,
A method for analyzing multiple questionnaires for the diagnosis of depression.
제8항에 있어서,
상기 대상 환자에 대한 우울증 진단을 예측하는 단계는
상기 통합 잠재 변수 모델을 이용하여 상기 대상 설문 데이터에 대한 설문조사 결과를 상기 잠재 변수로 변환하고, 상기 변환된 잠재 변수와 상기 설문조사 데이터베이스에 저장되어 유지되는 기존 잠재 변수를 비교하여 분류군을 판단하는 우울증 진단을 위한 다중 설문 분석 방법.
9. The method of claim 8,
The step of predicting the depression diagnosis of the subject patient
The survey result of the questionnaire survey data is converted into the latent variable using the integrated latent variable model and the existing latent variable stored in the survey database is compared with the converted latent variable to determine the taxa Multiple questionnaire method for the diagnosis of depression.
제13항에 있어서,
상기 대상 환자에 대한 우울증 진단을 예측하는 단계는
상기 판단된 분류군에서의 상기 대상 설문 데이터의 중요도를 분석하고, 상기 설문조사 데이터베이스에 저장되어 유지되는 상기 설문 히스토리 데이터와 상기 대상 설문 데이터를 비교 분석하여 상기 대상 환자에 대한 우울증 진단을 예측하는 우울증 진단을 위한 다중 설문 분석 시스템.
14. The method of claim 13,
The step of predicting the depression diagnosis of the subject patient
A diagnosis of depression is made by analyzing the importance of the subject questionnaire data in the determined taxa group and comparing the questionnaire history data stored in the questionnaire database and the subject questionnaire data to analyze the subject, Multiple survey analysis system for.
제8항 내지 제14항 중 어느 한 항의 방법을 수행하기 위하여 컴퓨터로 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
15. A computer program stored in a computer-readable medium for performing the method of any one of claims 8 to 14.
KR1020170169847A 2017-12-12 2017-12-12 Multi questionnaire analysis system for depression diagnosis and the method thereof KR102106671B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170169847A KR102106671B1 (en) 2017-12-12 2017-12-12 Multi questionnaire analysis system for depression diagnosis and the method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170169847A KR102106671B1 (en) 2017-12-12 2017-12-12 Multi questionnaire analysis system for depression diagnosis and the method thereof

Publications (2)

Publication Number Publication Date
KR20190069687A true KR20190069687A (en) 2019-06-20
KR102106671B1 KR102106671B1 (en) 2020-05-04

Family

ID=67103844

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170169847A KR102106671B1 (en) 2017-12-12 2017-12-12 Multi questionnaire analysis system for depression diagnosis and the method thereof

Country Status (1)

Country Link
KR (1) KR102106671B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102260010B1 (en) * 2020-12-21 2021-06-04 타우데이타 주식회사 Sound source providing system and method for improving sleep quality based on artificial intelligence
KR20210144322A (en) * 2020-05-22 2021-11-30 남부대학교산학협력단 Method of making survey tools and survey system to survey through survey tools
KR20220161879A (en) * 2021-05-31 2022-12-07 성균관대학교산학협력단 Method and apparatus for generation of multi-label classifier algorithm, method for predicting of emotional disorder patient, computer-readable storage medium and computer program
KR20220164149A (en) * 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Method for predicting depression occurrence using artificial intelligence model and computer readable record medium thereof

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220135740A (en) 2021-03-31 2022-10-07 이창엽 Psychiatric scale test normalization system
KR102512055B1 (en) 2022-01-25 2023-03-20 안지윤 Method, device and system for analyzing patient condition based on survey information of first-time patient
KR20240044175A (en) 2022-09-28 2024-04-04 한양대학교 산학협력단 Finding Blue Integrated Depression Screening Application

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120101226A (en) * 2011-02-24 2012-09-13 성균관대학교산학협력단 System and method for analyzing online game loyalty of user
KR20130032999A (en) * 2011-09-26 2013-04-03 세명대학교 산학협력단 System and method for preventing depression of user with smart mobile communication terminal
KR20150080112A (en) * 2013-12-30 2015-07-09 주식회사 스캐터랩 Method for Emotion Analysis base on Dialogue in Messenger
WO2016120955A1 (en) * 2015-01-26 2016-08-04 株式会社Ubic Action predict device, action predict device control method, and action predict device control program
KR20160109716A (en) * 2015-03-12 2016-09-21 한국전자통신연구원 Apparatus and method for emergency psychiatric state prediction
KR101674150B1 (en) * 2015-05-15 2016-11-08 성낙봉 One Stop U-Health Care System
US20170308916A1 (en) * 2016-04-20 2017-10-26 Seer Analytics, LLC Social science machine for measuring latent variable models with big data surveys
KR20190011900A (en) 2017-07-26 2019-02-08 계명대학교 산학협력단 System for overcoming depression using application on smart device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120101226A (en) * 2011-02-24 2012-09-13 성균관대학교산학협력단 System and method for analyzing online game loyalty of user
KR20130032999A (en) * 2011-09-26 2013-04-03 세명대학교 산학협력단 System and method for preventing depression of user with smart mobile communication terminal
KR20150080112A (en) * 2013-12-30 2015-07-09 주식회사 스캐터랩 Method for Emotion Analysis base on Dialogue in Messenger
WO2016120955A1 (en) * 2015-01-26 2016-08-04 株式会社Ubic Action predict device, action predict device control method, and action predict device control program
KR20160109716A (en) * 2015-03-12 2016-09-21 한국전자통신연구원 Apparatus and method for emergency psychiatric state prediction
KR101674150B1 (en) * 2015-05-15 2016-11-08 성낙봉 One Stop U-Health Care System
US20170308916A1 (en) * 2016-04-20 2017-10-26 Seer Analytics, LLC Social science machine for measuring latent variable models with big data surveys
KR20190011900A (en) 2017-07-26 2019-02-08 계명대학교 산학협력단 System for overcoming depression using application on smart device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210144322A (en) * 2020-05-22 2021-11-30 남부대학교산학협력단 Method of making survey tools and survey system to survey through survey tools
KR102260010B1 (en) * 2020-12-21 2021-06-04 타우데이타 주식회사 Sound source providing system and method for improving sleep quality based on artificial intelligence
KR20220161879A (en) * 2021-05-31 2022-12-07 성균관대학교산학협력단 Method and apparatus for generation of multi-label classifier algorithm, method for predicting of emotional disorder patient, computer-readable storage medium and computer program
KR20220164149A (en) * 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Method for predicting depression occurrence using artificial intelligence model and computer readable record medium thereof

Also Published As

Publication number Publication date
KR102106671B1 (en) 2020-05-04

Similar Documents

Publication Publication Date Title
Vellappally et al. Analyzing relationship between patient and doctor in public dental health using particle Memetic multivariable logistic regression analysis approach (MLRA2)
KR20190069687A (en) Multi questionnaire analysis system for depression diagnosis and the method thereof
Hampel et al. The Alzheimer precision medicine initiative
Wasan et al. The impact of data mining techniques on medical diagnostics
Jung et al. Predicting need for advanced illness or palliative care in a primary care population using electronic health record data
Chung et al. Single classifier vs. ensemble machine learning approaches for mental health prediction
Ferrante et al. Artificial intelligence in the diagnosis of pediatric allergic diseases
Monga et al. Performance analysis of machine learning and soft computing techniques in diagnosis of behavioral disorders
Blessie et al. Novel approach for psychiatric patient detection and prediction using data mining techniques
Young et al. Subtype and stage inference with timescales
Sukmak et al. Time series forecasting in anxiety disorders of outpatient visits using data mining
Tamiziniyan et al. Future of Healthcare: Biomedical Big Data Analysis and IoMT
Mathew et al. A web based decision support system driven for the neurological disorders
Tharmakulasingam et al. TransAMR: an interpretable transformer model for accurate prediction of antimicrobial resistance using antibiotic administration data
Arora et al. Deep‐SQA: A deep learning model using motor activity data for objective sleep quality assessment assisting digital wellness in healthcare 5.0
Charitha et al. Big Data Analysis and Management in Healthcare
Belle et al. Rule-based computer aided decision making for traumatic brain injuries
Arvindhan et al. Artificial intelligence representation model for drug–target interaction with contemporary knowledge and development
CN113782140B (en) Diagnosis and treatment strategy determining method, device, equipment and medium based on machine learning
Sakib Healthcare Data Analytics for Predicting Health Outcomes of Older Adults and Emergency Responses of Aged Care Facilities
Kumar et al. A Framework for early recognition of Alzheimer’s using machine learning approaches
Oommen et al. A Deep Learning Approach for Automated Detection and Classification of Alzheimer’s Disease
Madhuri et al. Machine Learning Approach to Patient Health and Stress Monitoring System
Taylor Forecasting mental distress using healthcare claims data
Dhanusha et al. Enhanced deep hierarchical classification model for smart home-based alzheimer disease detection

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right