KR102124193B1 - Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk - Google Patents

Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk Download PDF

Info

Publication number
KR102124193B1
KR102124193B1 KR1020170157941A KR20170157941A KR102124193B1 KR 102124193 B1 KR102124193 B1 KR 102124193B1 KR 1020170157941 A KR1020170157941 A KR 1020170157941A KR 20170157941 A KR20170157941 A KR 20170157941A KR 102124193 B1 KR102124193 B1 KR 102124193B1
Authority
KR
South Korea
Prior art keywords
chromosome
depression
human
base
suicide
Prior art date
Application number
KR1020170157941A
Other languages
Korean (ko)
Other versions
KR20190060108A (en
Inventor
이세민
박종화
정형오
박영준
김정안
김병철
조윤성
Original Assignee
울산과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산과학기술원 filed Critical 울산과학기술원
Priority to KR1020170157941A priority Critical patent/KR102124193B1/en
Publication of KR20190060108A publication Critical patent/KR20190060108A/en
Application granted granted Critical
Publication of KR102124193B1 publication Critical patent/KR102124193B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Psychiatry (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Educational Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychology (AREA)
  • Social Psychology (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Physiology (AREA)

Abstract

기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법 및 상기 방법에 따라 발굴된 우울증 또는 자살 위험 예측용 마커에 관한 것이다. 우울증 또는 자살 위험 예측용 마커 발굴 방법에 따르면, 상기 정확도 및 신뢰도가 높은 우울증 또는 자살 위험 예측용 마커를 발굴할 수 있고, 유전자 검사를 통하여 우울증 또는 자살 위험을 조기에 진단 및 그 위험을 예방할 수 있다. A method for discovering a marker for predicting depression or suicide risk using machine learning and a marker for predicting a depression or suicide risk discovered according to the method. According to a method for discovering a marker for predicting depression or suicide risk, a marker for predicting depression or suicide risk with high accuracy and reliability can be discovered, and genetic testing can be used to diagnose depression or suicide risk early and prevent the risk. .

Figure R1020170157941
Figure R1020170157941

Description

기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법, 우울증 또는 자살 위험 예측용 마커, 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법{Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk}Method of screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depression or suicide risk using machine learning, and markers for predicting depression or suicide risk using machine learning for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk}

기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법, 우울증 또는 자살 위험 예측용 마커, 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법에 관한 것이다.A method for discovering a marker for predicting depression or suicide risk using machine learning, a marker for predicting a depression or suicide risk, and a method for predicting depression or suicide risk using machine learning.

우리나라의 자살률은 현재 OECD 국가들 중 가장 높게 관측되고 있다. 최근 조사에 의하면, 자살은 한국인의 사망원인 순위 중 암, 뇌혈관질환, 심장질환 다음을 차지하고 있으며, 지난 몇 해 동안 꾸준히 증가하고 있는 추세에 있다. 이에, 관련분야에서는 자살률이 우리나라에서 이렇게 증가하고 있는 것을 심각한 사회문제로 인식하고, 자살률을 예측하기 위한 노력을 하고 있다. 하지만, 현재의 자살 예측을 위한 연구는, 자살에 영향을 주는 요인으로서 실업률이나 기온 등의 단순하고 단편적인 요인만을 고려하고 있어 예측 결과에 대한 신뢰도가 떨어지는 한계를 갖는다.Korea's suicide rate is currently the highest among OECD countries. According to a recent survey, suicide accounts for cancer, cerebrovascular disease, and heart disease among the top causes of death among Koreans, and has been increasing steadily over the past few years. Accordingly, in the related field, the suicide rate is recognized as a serious social problem in Korea, and efforts are being made to predict the suicide rate. However, the current study for suicide prediction has a limitation that the reliability of the prediction result is poor because only simple and fragmentary factors such as unemployment rate and temperature are considered as factors affecting suicide.

자살은 인간의 생존에 대한 본능적인 집착과는 위배되는 것이기 때문에 그간에는 주로 심리적 또는 사회적 원인론이 지지받아 왔으나, 21세기에 들어 유전적 요인이 주요 원인이라는 것이 점차 밝혀지고 있다. 모든 종족에서 자살률이 공통적으로 약 1%로 높게 나타나고 이 자살률이 일정하게 계속 유지되고 있다는 점에 주목하여 진화유전학자들은 우울 증상도 진화과정에서 획득된 형질이고, 우울증이 자살과 명백하게 관련이 있다는 점에서 자살이 유전적으로 진화되어온 정신병리라고 강조하고 있다. 이러한 기본적인 관점을 토대로 가족, 쌍생아 및 입양 연구들에서 자살 행동의 유전적 요인에 대한 증거들을 제시하고 있다. 일부 쌍생아 연구에서는 자살 사고와 자살 행동의 발생에 있어 약 45%가 유전적 요인에 의한다고 제시하고 있다. 특히 치명적인 자살 시도의 경우 유전적 요인이 55%까지 추정되고 있다. 가족 연구에서는 자살 행동의 유전이 자살 행동과 관련된 정신 병리의 유전과 무관하다는 것을 밝혀내었다. 다시 말하면 정신질환 등의 스트레스의 가족간 유전은 자살 행동의 소인의 가족간 유전과는 관련이 없다는 것을 말한다. 이러한 사실들은 자살 행동의 소인과 연관된 유전적 인자가 있다는 것을 시사하고 있다.Since suicide is contrary to instinctive attachment to human survival, psychological or social causalism has been mainly supported in the meantime, but it has been gradually revealed that genetic factors are the main cause in the 21st century. Evolutionary geneticists note that depression symptoms are also acquired traits in the evolutionary process, and depression is clearly related to suicide, noting that the suicide rate is common at all races, with a high susceptibility of about 1%. Suicide emphasizes that it is a psychopathology that has been genetically evolved. Based on this basic view, family, twin and adoptive studies provide evidence for the genetic factors of suicidal behavior. Some twin studies suggest that about 45% of suicidal thoughts and suicidal behavior are genetic factors. Especially in the case of fatal suicide attempts, the genetic factor is estimated up to 55%. Family studies have found that the inheritance of suicidal behavior is independent of the genetic pathology associated with suicidal behavior. In other words, the cross-family inheritance of stress, such as mental illness, is not related to the cross-family inheritance of predisposition to suicidal behavior. These facts suggest that there is a genetic factor associated with the predisposition to suicidal behavior.

현재, 자살 행동에 대한 의미있는 유전적 예측 인자는 부족하다. 따라서, 당업계에서는 자살 위험이 있는 대상체를 확인하기 위한 진단 검정법 및 시험이 요구되고 있다. 이에, 본 발명에서는, 자살에 영향을 주는 보다 실제적인 요인들을 고려하여 신뢰도 높은 자살률을 예측할 수 있는 방안을 제안하고자 한다.Currently, there is a lack of meaningful genetic predictors for suicidal behavior. Accordingly, there is a need in the art for diagnostic assays and tests to identify subjects at risk of suicide. Accordingly, in the present invention, it is intended to propose a method for predicting a suicide rate with high reliability in consideration of more practical factors affecting suicide.

일 양상은 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법을 제공한다.One aspect provides a method for discovering a marker for predicting the risk of depression or suicide using machine learning.

다른 양상은 우울증 또는 자살 위험 예측용 마커를 제공한다.Other aspects provide markers for predicting the risk of depression or suicide.

다른 양상은 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법을 제공한다.Another aspect provides a method of predicting the risk of depression or suicide using machine learning.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.The present invention can be applied to various transformations and can have various embodiments, and specific embodiments will be illustrated in the drawings and described in the detailed description. Effects and features of the present invention and methods for achieving them will be clarified with reference to embodiments described below in detail with reference to the drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various forms.

이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용된다.In the following embodiments, terms such as first and second are not used in a limited sense, but for the purpose of distinguishing one component from other components.

이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.In the following embodiments, the singular expression includes the plural expression unless the context clearly indicates otherwise.

이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다.In the examples below, terms such as include or have are meant to mean the presence of features or components described in the specification, and do not preclude the possibility of adding one or more other features or components in advance.

어떤 실시예가 달리 구현 가능한 경우에 특정한 단계는 설명되는 순서와 다르게 수행될 수도 있다. 예를 들어, 연속하여 설명되는 두 단계는 실질적으로 동시에 수행될 수도 있고, 설명되는 순서와 반대의 순서로 수행될 수도 있다.When an embodiment is implemented differently, specific steps may be performed differently from the described order. For example, two steps described in succession may be performed substantially simultaneously, or may be performed in an order opposite to that described.

도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 두께는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.In the drawings, the size of components may be exaggerated or reduced for convenience of description. For example, since the size and thickness of each component shown in the drawings are arbitrarily shown for convenience of description, the present invention is not necessarily limited to what is shown.

일 양상은, 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계; 상기 메틸화 마커 데이터를 가공한 학습용 입력 데이터, 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하는 단계; 상기 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하는 단계; 상기 예측도가 미리 정해진 기준값 이상인 메틸화 마커를 선별하는 단계를 포함하는, 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법을 제공한다.One aspect includes the steps of obtaining methylation marker data and depression, suicidal airway or suicide performance data of a plurality of individuals with depression, suicidal airway individuals, or suicidal subjects; Generating a test model by machine learning the learning input data processing the methylation marker data, and the learning output data processing the depression, suicidal airway or suicide performance data; Calculating the predicted risk of depression or suicide by applying the learning input data and the learning output data to the test model; It provides a method for discovering a marker for predicting the risk of depression or suicide using machine learning, comprising the step of selecting a methylation marker having the predicted degree higher than a predetermined reference value.

도 1을 참조하면, 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계(S10)가 수행된다.Referring to FIG. 1, a step (S10) of obtaining methylation marker data and depression, suicidal airway or suicide performance data of a plurality of individuals having depression, a suicidal airway entity, or a suicide performing entity is performed.

상기 메틸화 마커는 개체의 염색체 내 특정 영역 또는 특정 위치에서 메틸화가 일어나는 염기의 위치를 의미한다. 메틸화 마커는 메틸화 자리와 혼용될 수 있다. 염기 메틸화(methylation)는 염기서열에 변화를 수반하지 않으면서도 DNA 메틸화와 같은 후천적인 수식에 의해 유전자 발현 메커니즘의 변화가 일어나는 현상을 의미한다. DNA 메틸화는 유전자 발현의 억제에 관여한다. 게놈 DNA의 CpG 디뉴클레오티드(dinucleotide) 서열의 시토신에는 메틸화가 일어날 수 있다. CpG 서열은 게놈에서 산발적으로 존재하지만, 특히 CpG 아일랜드(island)라고 불리우는 지역에서 메틸화가 많이 발생할 수 있다. CpG 아일랜드의 메틸화는 일반적으로 크로마틴 응집과 유전자 전사를 억제시킨다. 유전학적으로 DNA 메틸화에 따라 각 개체에 큰 차이를 야기할 수 있다. 따라서, 염색체 내 특정 위치에서의 메틸화 여부는 개체의 우울증 또는 자살 위험을 예측할 수 있는 지표로 사용될 수 있다. The methylation marker refers to the position of the base where methylation occurs in a specific region or a specific position in the chromosome of the individual. Methylation markers can be used interchangeably with methylation sites. Base methylation refers to a phenomenon in which a gene expression mechanism is changed by an adaptive modification such as DNA methylation without changing the base sequence. DNA methylation is involved in the suppression of gene expression. Methylation may occur in the cytosine of the CpG dinucleotide sequence of genomic DNA. The CpG sequence is sporadically present in the genome, but a lot of methylation can occur, especially in regions called CpG islands. The methylation of CpG islands generally inhibits chromatin aggregation and gene transcription. Genetically, DNA methylation can make a big difference in each individual. Therefore, whether methylation at a specific position in the chromosome can be used as an index to predict the risk of depression or suicide in an individual.

상기 메틸화 마커 데이터는 개체의 염색체 내 시퀀싱 결과, 메틸화된 염기의 염색체 내 위치, 메틸화된 염기의 염색체 내 위치와 관련된 유전자 등, 개체의 유전체에서 DNA 메틸화와 관련된 기록을 포함한다. The methylation marker data includes records related to DNA methylation in the genome of an individual, such as a result of sequencing in the chromosome of the individual, a position in the chromosome of the methylated base, and a gene related to the position in the chromosome of the methylated base.

상기 자살(suicide)이란 스스로를 죽음에 이르게 하려는 의도를 갖고 행동화하여 이로 인해 의학적 처치를 요하게된 경우로서 그 결과는 자살 기도 또는 자살 수행으로 나타난다. 상기 우울증(depressive disorder)은 우울한 기분 또는 대부분의 활동에서 흥미 또는 즐거움이 상실된 증상, 예를 들면, 수면의 변화, 식욕 및 체중의 변화, 초조, 지체, 피로감, 무가치감 또는 죄책감, 사고력 및 집중력 감소 등이 일정 기간 이상 지속되는 것을 의미한다.Suicide (suicide) is a case in which medical treatment is required due to acting with the intention of leading oneself to death, and the result is a suicide attempt or suicide performance. The depression (depressive disorder) is a depressed mood or a loss of interest or enjoyment in most activities, such as changes in sleep, changes in appetite and weight, irritation, delay, fatigue, worthlessness or guilt, decreased thinking and concentration, etc. This means that it lasts more than a certain period of time.

상기 우울증, 자살 기도 또는 자살 수행 여부 데이터는, 과거 또는 현재 우울증으로 진단받은 병적 기록, 자살 시도 경험, 또는 자살 수행에 의한 사망을 의미할 수 있으나, 이에 제한되는 것은 아니다.The depression, suicidal intention or suicide performance data may mean pathological records diagnosed as past or present depression, suicide attempt experience, or death due to suicide performance, but is not limited thereto.

상기 메틸화 마커 데이터 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터는 한 개 이상의 병원 또는 지역의 개체로부터 획득할 수 있다. 상기 메틸화 마커 데이터는 유전체 또는 DNA의 메틸화를 확인할 수 있는 공지의 방법을 수행하여 획득될 수 있고, 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터는 개체의 문진 또는 설문 결과로부터 획득될 수 있으나, 이에 제한되는 것은 아니다. The methylation marker data and the depression, suicidal airway, or suicide performance data may be obtained from one or more individuals in a hospital or region. The methylation marker data may be obtained by performing a known method capable of confirming methylation of a genomic or DNA, and the depression, suicidal airway or suicide performance data may be obtained from an individual's questionnaire or questionnaire results, but are not limited thereto. It does not work.

상기 개체는 우울증 또는 자살 위험을 예측하기 위한 대상을 의미한다. 상기 개체는 척추동물, 포유동물, 또는 인간(Homo sapiens)을 포함할 수 있다. 예를 들면, 상기 인간은 한국인일 수 있다.The subject refers to a subject for predicting the risk of depression or suicide. The subject can include a vertebrate, a mammal, or a human ( Homo sapiens ). For example, the human may be Korean.

상기 데이터를 획득하는 단계는 k-최근접 이웃 알고리즘(k-nearest neighbor algorithm: knn)을 이용하여 결측치(missing data, NaN)를 추가하는 단계를 포함할 수 있다.The step of acquiring the data may include adding a missing data (NaN) using a k-nearest neighbor algorithm (knn).

이 후, 상기 메틸화 마커 데이터를 가공한 학습용 입력 데이터, 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하는 단계(S20)가 수행된다. Thereafter, a step (S20) of generating a test model by performing machine learning on the learning input data processing the methylation marker data and the learning data processing the depression, suicidal airway or suicide performance data is performed (S20).

기계 학습(Machine Learning)은 인공지능의 한 종류로서 컴퓨터가 주어진 데이터를 통해 스스로 학습하도록 하는 것을 의미한다. 기계 학습은 데이터의 표현과 이들에 대한 평가를 위한 함수 및 일반화(generalization)를 포함한다. 일반화는 현재 모형이 새로운 데이터에도 그대로 적용되도록 하는 것을 의미한다. Machine learning is a kind of artificial intelligence that means that a computer learns itself through given data. Machine learning includes the representation of data and functions and generalization for evaluating them. Generalization means that the current model is applied to the new data as it is.

테스트 모델을 생성하는 단계는 기계 학습 기법으로 생성된 상기 메틸화 마커 데이터를 가공한 학습용 입력 데이터와 이러한 복수의 메틸화 마커 데이터 각각에 대응되는 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터 간의 상관 계수, 즉 양자의 매핑 정보일 수 있다. 학습용 데이터는 학습용 입력 데이터와 학습용 출력 데이터를 포함할 수 있다.The step of generating the test model is between learning input data processing the methylation marker data generated by the machine learning technique and learning output data processing depression or suicide airway or suicide performance data corresponding to each of the plurality of methylation marker data. It may be a correlation coefficient, that is, mapping information of both. The learning data may include learning input data and learning output data.

'학습용 입력 데이터'는 기계 학습을 위해 사용되는 데이터로, 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터로부터 가공되어 획득된다. 예를 들면, 상술한 메틸화 마커 데이터 중에서, 염색체 번호, 메틸화가 일어나는 염색체 내 염기의 위치 등, 분류(classification)가 가능한 값은 라벨링하여 하나의 수학적 값으로 변환시킬 수 있다. 'Learning input data' is data used for machine learning, and is obtained by processing from methylation marker data of a plurality of individuals with depression, suicidal airways, or suicidal subjects. For example, among the aforementioned methylation marker data, values that can be classified, such as a chromosome number and a location of a base in a chromosome where methylation occurs, can be labeled and converted into a single mathematical value.

'학습용 출력 데이터'는 테스트 모델을 통해 출력된 값 또는 이를 이용한 우울증 또는 자살 위험 예측 방법의 결과 값과 비교되는 데이터를 의미한다. 이러한 학습용 출력 데이터는 개체의 우울증, 자살 기도 또는 자살 수행 여부 데이터로부터 가공되어 획득된다. 예를 들면, '학습용 출력 데이터'는 과거의 임의의 시점 또는 현재에 우울증으로 진단받은 병적 기록, 자살 시도 경험, 또는 자살 수행에 의한 사망을 나타내는 데이터일 수 있다. 예를 들면, 테스트 모델이 미래의 임의의 시점에 우울증, 자살 기도 또는 자살 수행 여부를 예측하도록 기계 학습 되는 경우, '학습용 출력 데이터'는 우울증, 자살 기도 또는 자살 수행(1) 또는 우울증 없음, 자살 기도 또는 자살 수행 없음(0)과 같이 표현한 바이너리(binary) 데이터일 수 있다. 'Learning output data' means data that is compared with a value output through a test model or a result of a depression or suicide risk prediction method using the output. The output data for learning is processed and obtained from data on whether an individual is performing depression, suicide attempts, or suicide. For example, the'learning output data' may be data indicating pathological records diagnosed with depression at any point in the past or present, experiences of suicide attempts, or death due to suicide performance. For example, if the test model is machine-learned to predict whether depression, suicidal intention or suicide will be performed at any point in the future,'learning output data' means depression, suicidal intention or suicidal performance (1) or no depression, suicide It may be binary data expressed as no airway or suicide performance (0).

이와 같은 과정을 통해 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 수학적으로 처리할 수 있게 가공하여, 학습용 입력 데이터 및 학습용 출력 데이터를 획득할 수 있다.Through this process, the methylation marker data and depression, suicidal airway, or suicide performance data can be processed to be mathematically processed to obtain learning input data and learning output data.

'테스트 모델'은, 학습용 입력 데이터와 학습용 출력 데이터의 상관 계수를 분석하여 과거, 현재, 또는 미래의 임의의 시점에서의 우울증으로 진단, 자살 시도, 또는 자살 수행에 의한 사망을 예측하는 입출력함수를 의미한다. 이 경우, 테스트 모델은 0 또는 1에 가까운 값을 출력할 수 있으며, 출력 값이 0에 가깝거나 작을수록, 우울증 없거나, 자살 기도 또는 자살 수행이 없을 확률이 높고, 1에 가깝거나 클수록 우울증으로 진단받거나, 자살 시도, 또는 자살 수행으로 사망할 확률이 높다. 따라서 출력 값은 '우울증, 자살 기도 또는 자살 수행'을 나타내는 지표로 해석될 수 있다.The'Test Model' analyzes the correlation coefficient between the learning input data and the learning output data, and inputs and outputs functions to predict death by diagnosis, suicide attempt, or suicide by depression at any point in the past, present, or future. it means. In this case, the test model can output a value close to 0 or 1, and the closer or smaller the output value is, the higher the probability that there is no depression, suicidal airway or suicidal performance, and the closer or larger the diagnosis is to depression. There is a high probability of dying from receiving, attempting suicide, or performing suicide. Therefore, the output value can be interpreted as an index indicating'depression, suicide attempt or suicide performance'.

테스트 모델 생성 단계(S20) 이후에는 상기 테스트 모델의 예측 결과를 바탕으로, 상기 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하는 단계(S30)가 수행된다.After the test model generation step (S20), a step (S30) of calculating the predicted risk of depression or suicide is performed by applying the learning input data and the learning output data to the test model based on the prediction result of the test model (S30). .

상기 예측도는 학습용 입력 데이터 및 학습용 출력 데이터를 바탕으로 테스트 모델을 생성하고, 학습용 입력 데이터 및 학습용 출력 데이터의 일부 또는 전부를 상기 테스트 모델에 적용하였을 때, 우울증, 자살 기도 또는 자살 수행 여부의 예측 가능성, 또는 우울증을 갖는 개체, 자살 기도 또는 자살 수행 개체와 그렇지 않은 개체를 구분하는 정도를 나타낸다. The predictive diagram predicts whether depression, suicide intention, or suicide is performed when a test model is generated based on learning input data and learning output data, and some or all of the learning input data and learning output data is applied to the test model. Indicates the degree of differentiation between individuals who have a likelihood or depression, those who commit suicide, or those who commit suicide.

상기 예측도는 트레이닝 데이터 세트를, 우울증을 갖는 개체, 자살 기도 또는 자살 수행 개체를 포함하는 위험군(Case)와 그렇지 않는 개체인 정상인을 포함하는 대조군(Control)으로 나눈 후, 위험군의 수치 중의 중간값과 대조군의 수치 중의 중간값의 평균을 위험군과 대조군을 가르는 기준값으로 삼고, 그 기준값을 트레이닝 데이터 세트의 위험군과 대조군에 재적용해서 위험군과 대조군을 재구분 할 때, 본래의 위험군과 대조군 구분과 일치하는 정도를 계산하는 방법 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다. The predictive value is divided into a training data set into a risk group (Case) containing an individual with depression, a suicidal airway or a suicide-performing individual, and a control group containing a normal human (non-human) control group. When the mean of the median value of the and control group is used as the reference value for dividing the risk group from the control group, the standard value is reapplied to the risk group and the control group in the training data set, and the risk group and the control group are reclassified to match the original risk group and the control group. Algorithms and/or methods (techniques), such as how to calculate the degree to be used can be used.

우울증, 자살 기도 또는 자살 수행 예측에 영향이 적은 변수를 포함하여 기계 학습을 수행하게 되면, 연산량이 증가할 뿐만 아니라 예측에 대한 정확도가 떨어지는 문제가 발생한다. 이에 본 발명에서는 테스트 모델 생성 이후, 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하고, 상기 예측도가 미리 정해진 기준값 이상인 메틸화 마커를 선별하는 단계(S40)가 수행된다. When machine learning is performed including variables that have little influence on depression, suicidal intention, or suicidal performance prediction, a problem arises that not only increases the amount of computation but also decreases the accuracy of prediction. Accordingly, in the present invention, after generating a test model, applying learning input data and learning output data to the test model to calculate a predicted risk of depression or suicide, and selecting a methylation marker having the predicted value equal to or greater than a predetermined reference value (S40). Is performed.

상기 예측도는 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 65% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100%일 수 있다. 일 실시예 따르면, 예측도가 75% 이상인 메틸화 마커는 선별하여 우울증 또는 자살 위험 예측용 마커로 발굴할 수 있다.The prediction degree is about 50% or more, about 55% or more, about 60% or more, about 65% or more, about 70% or more, about 75% or more, about 80% or more, about 85% or more, about 90% or more, and about 95% or more, or about 100%. According to an embodiment, a methylation marker having a predictability of 75% or more may be selected to be identified as a marker for predicting depression or suicide risk.

상기 방법은, 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계; 상기 메틸화 마커 데이터를 가공한 검증용 입력 데이터 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 검증용 출력 데이터를 획득하는 단계; 상기 검증용 입력 데이터 및 검증용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 재현도를 산출하는 단계; 상기 재현도가 미리 정해진 기준값 이상인 메틸화 마커를 선별하는 단계를 포함할 수 있다.The method comprises the steps of obtaining methylation marker data and depression, suicidal airway or suicide performance data of a plurality of individuals with depression, suicidal airway individuals or suicidal subjects; Obtaining input data for verification processing the methylation marker data and verification output data processing the depression, suicidal airway, or suicide performance data; Calculating reproducibility of depression or suicide by applying the input data for verification and the output data for verification to the test model; The reproducibility may include a step of selecting a methylation marker having a predetermined reference value or higher.

복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계는 전술한 바와 동일하다. 검증용 입력 데이터 및 검증용 출력 데이터는, 학습용 입력 데이터 및 학습용 출력 데이터를 수득한 개체와 동일한 개체로부터 수득할 수 있고, 또한, 다른 개체로부터 수득할 수도 있다. The steps of acquiring the methylation marker data of the plurality of individuals having depression, the suicidal airway individual or the suicidal subject, and whether the depression, suicidal airway or suicide is performed are the same as described above. The input data for verification and the output data for verification can be obtained from the same individual as the individual who obtained the learning input data and the learning output data, or can also be obtained from another individual.

이어서, 상기 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계 이후에는, 검증용 입력 데이터 및 검증용 출력 데이터를 획득하는 단계가 수행된다. 검증용 데이터는 검증용 입력 데이터와 검증용 출력 데이터를 포함할 수 있다.Subsequently, after obtaining the methylation marker data and depression, suicidal airway, or suicide performance data, a step of obtaining input data for verification and output data for verification is performed. The verification data may include input data for verification and output data for verification.

'검증용 입력 데이터'는 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터로부터 가공되어 획득된다. 예를 들면, 상술한 메틸화 마커 데이터 중에서, 염색체 번호, 메틸화가 일어나는 염색체 내 염기의 위치 등, 분류가 가능한 값은 라벨링하여 하나의 수학적 값으로 변환시킬 수 있다. The'input data for verification' is obtained by processing from the methylation marker data of a plurality of individuals with depression, suicidal airways or suicidal subjects. For example, among the aforementioned methylation marker data, values that can be classified, such as chromosome number and location of a base in a chromosome where methylation occurs, can be labeled and converted into a single mathematical value.

'검증용 출력 데이터'는 테스트 모델을 통해 출력된 값 또는 이를 이용한 우울증 또는 자살 위험 예측 방법의 결과 값과 비교되는 데이터를 의미한다. The term'output data for verification' means data that is compared with a value output through a test model or a result of a depression or suicide risk prediction method using the output.

이러한 검증용 출력 데이터는 개체의 우울증, 자살 기도 또는 자살 수행 여부 데이터로부터 가공되어 획득된다. 예를 들면, '검증용 출력 데이터'는 과거의 임의의 시점 또는 현재에 우울증으로 진단받은 병적 기록, 자살 시도 경험, 또는 자살 수행에 의한 사망을 나타내는 데이터일 수 있다. 예를 들면, 테스트 모델이 미래의 임의의 시점에 우울증, 자살 기도 또는 자살 수행 여부를 예측하도록 기계 학습되는 경우, '검증용 출력 데이터'는 우울증, 자살 기도 또는 자살 수행(1) 또는 우울증 없음, 자살 기도 또는 자살 수행 없음(0)과 같이 표현한 바이너리(binary) 데이터일 수 있다. The output data for verification is processed and obtained from the data of whether the subject is depressed, suicidal, or suicidal. For example, the'output data for verification' may be data indicating a morbid record diagnosed with depression at any point in the past or present, experience of suicide attempt, or death due to suicide performance. For example, if the test model is machine-learned to predict whether depression, suicidal intention, or suicide will be performed at any point in the future,'output data for verification' means depression, suicidal intention or suicidal performance (1) or no depression, It may be binary data expressed as a suicide attempt or no suicide performance (0).

검증용 입력 데이터 및 검증용 출력 데이터를 획득하는 단계 이후에는, 상기 검증용 입력 데이터 및 검증용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 재현도를 산출하는 단계가 수행된다.After obtaining the input data for verification and the output data for verification, a step of calculating the reproducibility of depression or suicide by applying the verification input data and verification output data to the test model is performed.

상기 검증용 입력 데이터 및 검증용 출력 데이터를 기 생성된 테스트 모델에 적용하여 우울증 또는 자살 위험 재현도를 산출함으로써, 상기 테스트 모델의 성능과 타당성을 평가 및 검증할 수 있다. By applying the verification input data and verification output data to a previously generated test model, the reproducibility of depression or suicide can be calculated to evaluate and verify the performance and validity of the test model.

상기 재현도는 검증용 입력 데이터 및 검증용 출력 데이터의 일부 또는 전부를 상기 테스트 모델에 적용하였을 때, 우울증, 자살 기도 또는 자살 수행 여부의 예측 가능성, 또는 우울증을 갖는 개체, 자살 기도 또는 자살 수행 개체와 그렇지 않은 개체를 구분하는 정도를 나타낸다. When the reproducibility is applied to some or all of the input data for verification and the output data for verification to the test model, the predictability of depression, suicidal intention or suicidal performance, or individuals with depression, suicidal intention or suicidal performance It indicates the degree of differentiation between and not.

상기 재현도는 트레이닝 데이터 세트를, 우울증을 갖는 개체, 자살 기도 또는 자살 수행 개체를 포함하는 위험군(Case)와 그렇지 않는 개체인 정상인을 포함하는 대조군(Control)으로 나눈 후, 위험군의 수치 중의 중간값과 대조군의 수치 중의 중간값의 평균을 위험군과 대조군을 가르는 기준값으로 삼고, 그 기준값을 검증용 데이터 세트의 위험군과 대조군에 적용해서 위험군과 대조군을 구분할 때, 본래의 위험군과 대조군 구분과 일치하는 정도를 계산하는 방법 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다.The reproducibility is divided into a training data set into a risk group (Case) containing an individual with depression, a suicidal airway or a suicide-performing individual, and a control group containing a normal human (non-human) control group. When the average of the median of the values of the and control group is used as a reference value for dividing the risk group and the control group, and the standard value is applied to the risk group and the control group of the verification data set to distinguish the risk group from the control group, the degree of agreement with the original risk group and the control group Algorithms and/or methods (techniques), such as a method of calculating, can be used.

상기 재현도는 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 65% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100% 이상일 수 있다. 일 실시예 따르면, 재현도가 50% 이상인 메틸화 마커는 선별하여 우울증 또는 자살 위험 예측용 마커로 발굴할 수 있다.The reproducibility is about 50% or more, about 55% or more, about 60% or more, about 65% or more, about 70% or more, about 75% or more, about 80% or more, about 85% or more, about 90% or more, or about 95% or more, or about 100% or more. According to an embodiment, a methylation marker having a reproducibility of 50% or more can be selected and identified as a marker for predicting depression or suicide risk.

상기 방법은, 상기 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 심리사고 평가척도 데이터를 획득하는 단계; 상기 심리사고 평가척도 데이터와 메틸화 마커 데이터 사이의 상관 계수를 산출하는 단계; 상기 상관 계수가 미리 정해진 기준값 이상인 메틸화 마커를 선별하는 단계를 포함할 수 있다. The method comprises: obtaining psychological accident evaluation scale data of the plurality of individuals with depression, suicidal airways, or suicidal subjects; Calculating a correlation coefficient between the psychological accident evaluation scale data and methylation marker data; And selecting a methylation marker having the correlation coefficient equal to or greater than a predetermined reference value.

귀납처리에 앞서서 관련이 없거나 약한 관련을 가지는 속성을 추출하기 위해 속성과 차원의 관련성을 분석해 낼 수 있다. 구체적인 속성 관련 분석방법으로는 정보이득, 지니계수, 불확실지수, 상관 계수 등이 있다. 상관 계수(Correlation)는 두 변수간의 관계의 강도를 의미하며, 변수 간 높은 상관 계수가 존재한다는 것은 두 변수가 같이 커지거나 작아지는 경향이 있다는 것일 수 있다. Prior to induction processing, the relationship between attributes and dimensions can be analyzed to extract attributes that have no or weak associations. Specific property-related analysis methods include information gain, Gini coefficient, uncertainty index, and correlation coefficient. Correlation refers to the strength of the relationship between two variables, and the presence of a high correlation coefficient between the variables may indicate that the two variables tend to increase or decrease together.

상기 메틸화 마커 데이터는 심리사고 평가척도 데이터와 임의의 상관 관계를 가질 수 있다. 상기 메틸화 마커 데이터와 심리사고 평가척도 데이터의 상관 계수는 약 0.30 이상, 약 0.35 이상, 약 0.40 이상, 약 0.45 이상, 또는 약 0.5 이상일 수 있다. The methylation marker data may have any correlation with psychological accident evaluation scale data. The correlation coefficient between the methylation marker data and the psychological accident evaluation scale data may be about 0.30 or more, about 0.35 or more, about 0.40 or more, about 0.45 or more, or about 0.5 or more.

일 실시예 따르면, 상기 메틸화 마커 데이터와 심리사고 평가척도 데이터의 상관 계수가 0.3 이상인 메틸화 마커를 선별하여 우울증 또는 자살 위험 예측용 마커로 발굴할 수 있다.According to an embodiment, a methylation marker having a correlation coefficient of 0.3 or more between the methylation marker data and the psychological accident evaluation scale data may be selected to be identified as a marker for predicting depression or suicide risk.

한편, 도 1에 도시된 본 발명의 일 실시예에 따른 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성할 수 있고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.On the other hand, the marker discovery method for predicting the risk of depression or suicide by using machine learning according to an embodiment of the present invention shown in FIG. 1 can be written as a program that can be executed on a computer and using a computer-readable recording medium It may be implemented in a general-purpose digital computer running the program. The computer-readable recording medium includes a storage medium such as a magnetic storage medium (eg, ROM, floppy disk, hard disk, etc.), an optical reading medium (eg, CD-ROM, DVD, etc.).

본 발명에 따른 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법, 이를 수행하는 장치 및 프로그램에 따르면, 개체의 우울증 또는 자살 위험을 개개인별로 정확하게 예측할 수 있다. According to the method of discovering a marker for predicting depression or suicide risk using machine learning according to the present invention, and an apparatus and program for performing the same, it is possible to accurately predict an individual's depression or suicide risk for each individual.

다른 양상은 상기 방법에 따라 발굴된 우울증 또는 자살 위험 예측용 마커를 제공한다. Another aspect provides a marker for predicting the risk of depression or suicide discovered according to the method.

상기 우울증 또는 자살 위험 예측용 마커는, 인간의 11번째 염색체의 67806358번째 염기, 인간의 14번째 염색체의 102516597번째 염기, 인간의 15번째 염색체의 37172017번째 염기, 인간의 16번째 염색체의 14014009번째 염기, 인간의 16번째 염색체의 88636588번째 염기, 인간의 17번째 염색체의 73009364번째 염기, 인간의 18번째 염색체의 77487338번째 염기, 인간의 19번째 염색체의 40023259번째 염기, 인간의 2번째 염색체의 3423658번째 염기, 인간의 2번째 염색체의 73052175번째 염기, 인간의 20번째 염색체의 42163538번째 염기, 인간의 20번째 염색체의 62460632번째 염기, 인간의 3번째 염색체의 147125005번째 염기, 인간의 4번째 염색체의 85419584번째 염기, 인간의 6번째 염색체의 21524046번째 염기 또는 이들의 조합의 메틸화 여부인 것일 수 있다.The markers for predicting the risk of depression or suicide include the 67806358th base of the 11th human chromosome, the 102516597th base of the 14th human chromosome, the 37172017th base of the 15th human chromosome, and the 14014009th base of the 16th human chromosome, 88636588 base of human 16th chromosome, 73009364 base of human 17th chromosome, 77487338 base of human 18th chromosome, 40023259 base of human 19th chromosome, 3423658 base of human 2nd chromosome, 73052175th base of human 2nd chromosome, 42163538th base of human 20th chromosome, 62460632th base of human 20th chromosome, 147125005th base of 3rd human chromosome, 85419584th base of 4th human chromosome, It may be the methylation of the 21524046th base of human chromosome 6 or a combination thereof.

상기 우울증 또는 자살 위험 예측용 마커는, 인간의 11번째 염색체의 67806358번째 염기의 메틸화, 인간의 14번째 염색체의 102516597번째 염기의 비메틸화, 인간의 15번째 염색체의 37172017번째 염기의 비메틸화, 인간의 16번째 염색체의 14014009번째 염기의 메틸화, 인간의 16번째 염색체의 88636588번째 염기의 메틸화, 인간의 17번째 염색체의 73009364번째 염기의 비메틸화, 인간의 18번째 염색체의 77487338번째 염기의 비메틸화, 인간의 19번째 염색체의 40023259번째 염기의 메틸화, 인간의 2번째 염색체의 3423658번째 염기의 비메틸화, 인간의 2번째 염색체의 73052175번째 염기의 비메틸화, 인간의 20번째 염색체의 42163538번째 염기의 비메틸화, 인간의 20번째 염색체의 62460632번째 염기의 비메틸화, 인간의 3번째 염색체의 147125005번째 염기의 메틸화, 인간의 4번째 염색체의 85419584번째 염기의 메틸화, 인간의 6번째 염색체의 21524046번째 염기의 비메틸화 또는 이들의 조합인 것일 수 있다. The markers for predicting the risk of depression or suicide include the methylation of the 67806358th base of the human 11th chromosome, the unmethylation of the 102516597th base of the 14th chromosome of humans, the unmethylation of the 37172017th base of the 15th chromosome of humans, human Methylation of 14014009th base of 16th chromosome, methylation of 88636588th base of human 16th chromosome, unmethylation of 73009364th base of human 17th chromosome, unmethylation of 77487338th base of human 18th chromosome, human Methylation of the 40023259th base of the 19th chromosome, unmethylation of the 3423658th base of the second human chromosome, unmethylation of the 73052175th base of the second human chromosome, unmethylation of the 42163538th base of the human 20th chromosome, human Unmethylated of 62460632 nucleotides of chromosome 20, methylation of 147125005 nucleotides of human 3 chromosome, methylation of 85419584 nucleotides of human 4 chromosome, unmethylated 21524046 nucleotides of human 6 chromosome, or these It may be a combination of.

상기 자살 위험 예측용 마커는, 인간의 13번째 염색체의 100254805번째 염기, 인간의 15번째 염색체의 53093335번째 염기, 인간의 21번째 염색체의 46351387번째 염기, 인간의 3번째 염색체의 28390646번째 염기, 인간의 10번째 염색체의 44144362번째 염기 또는 이들의 조합의 메틸화 여부인 것일 수 있다.Markers for predicting suicide risk include: 100254805th base of the 13th human chromosome, 53093335th base of the 15th human chromosome, 46351387th base of the 21st human chromosome, 28390646th base of the 3rd human chromosome, human It may be whether the 44144362th base of the 10th chromosome or a combination thereof is methylated.

상기 자살 위험 예측용 마커는, 인간의 13번째 염색체의 100254805번째 염기의 메틸화, 인간의 15번째 염색체의 53093335번째 염기의 메틸화, 인간의 21번째 염색체의 46351387번째 염기의 메틸화, 인간의 3번째 염색체의 28390646번째 염기의 비메틸화, 인간의 10번째 염색체의 44144362번째 염기의 비메틸화 또는 이들의 조합인 것일 수 있다. The markers for predicting suicide risk include methylation of the 100254805th base of the human 13th chromosome, methylation of the 53093335th base of the human 15th chromosome, methylation of the 46351387th base of the human 21st chromosome, and the human third chromosome It may be the unmethylated 28390646 base, the unmethylated 44144362 base of the human 10th chromosome, or a combination thereof.

상기 자살 위험 예측용 마커는, 우울증 위험과 자살 위험을 특이적으로 구분할 수 있다. 이를 역으로 적용하면, 우울증 위험 예측용 마커로 적용할 수 있다.The marker for predicting suicide risk may specifically distinguish the risk of depression from suicide. If applied in reverse, it can be used as a marker for predicting depression risk.

다른 양상은 하기 단계를 포함하는 개체의 우울증 또는 자살 위험을 예측하기 위한 정보를 제공하는 방법으로서, 개체의 생물학적 시료로부터 핵산 시료를 수득하는 단계; 및 수득된 핵산 시료로부터 우울증 또는 자살 위험 예측용 마커의 메틸화 여부를 분석하는 단계를 포함하고, 상기 마커는, 인간의 11번째 염색체의 67806358번째 염기, 인간의 14번째 염색체의 102516597번째 염기, 인간의 15번째 염색체의 37172017번째 염기, 인간의 16번째 염색체의 14014009번째 염기, 인간의 16번째 염색체의 88636588번째 염기, 인간의 17번째 염색체의 73009364번째 염기, 인간의 18번째 염색체의 77487338번째 염기, 인간의 19번째 염색체의 40023259번째 염기, 인간의 2번째 염색체의 3423658번째 염기, 인간의 2번째 염색체의 73052175번째 염기, 인간의 20번째 염색체의 42163538번째 염기, 인간의 20번째 염색체의 62460632번째 염기, 인간의 3번째 염색체의 147125005번째 염기, 인간의 4번째 염색체의 85419584번째 염기, 인간의 6번째 염색체의 21524046번째 염기 또는 이들의 조합인 것일 수 있다.Another aspect is a method of providing information for predicting an individual's risk of depression or suicide, comprising the steps of: obtaining a nucleic acid sample from a biological sample of an individual; And analyzing the methylation of the marker for predicting the risk of depression or suicide from the obtained nucleic acid sample, the marker comprising: 67806358th base of the 11th chromosome of human, 102516597th base of the 14th chromosome of human, and human 37172017th base of 15th chromosome, 14014009th base of human 16th chromosome, 88636588th base of human 16th chromosome, 73009364th base of human 17th chromosome, 77487338th base of human 18th chromosome, human 40023259 base of the 19th chromosome, 3423658 base of the 2nd human chromosome, 73052175 base of the 2nd human chromosome, 42163538 base of the 20th chromosome of human, 62460632 base of the 20th chromosome of human, human It may be the 147125005th base of the 3rd chromosome, the 85419584th base of the 4th human chromosome, the 21524046th base of the 6th human chromosome, or a combination thereof.

상기 방법은 개체의 생물학적 시료로부터 핵산 시료를 수득하는 단계를 포함한다.The method includes obtaining a nucleic acid sample from an individual biological sample.

상기 개체는 우울증 또는 자살 위험을 예측하기 위한 대상을 의미한다. 상기 개체는 척추동물, 포유동물, 인간(Homo sapiens), 마우스, 래트, 소, 말, 돼지, 양, 염소, 개, 고양이 등을 포함하는 것일 수 있다. 예를 들면, 상기 인간은 아시아계 인, 또는 한국인일 수 있다. "개체" 및 "대상"는 본 명세서에서 상호교환적으로 사용된다.The subject refers to a subject for predicting the risk of depression or suicide. The individual may include vertebrates, mammals, humans ( homo sapiens ), mice, rats, cows, horses, pigs, sheep, goats, dogs, cats, and the like. For example, the human may be Asian or Korean. “Object” and “subject” are used interchangeably herein.

상기 생물학적 시료는 생물로부터 수득된 시료를 말한다. 상기 생물학적 시료는, 예를 들면, 혈액, 조직, 소변, 점액, 타액, 눈물, 혈장, 혈청, 객담, 척수액, 흉수, 유두 흡인물, 림프액, 기도액, 장액, 비뇨생식관액, 모유, 림프계 체액, 정액, 뇌척수액, 기관계내 체액, 복수, 낭성 종양 체액, 양수액 또는 이들의 조합인 것일 수 있다. 생물학적 시료는 순수하게 분리된 핵산, 조 분리된 핵산, 핵산을 포함하는 세포 파쇄물, 또는 세포 유리 핵산을 포함하는 것일 수 있다. The biological sample refers to a sample obtained from an organism. The biological sample is, for example, blood, tissue, urine, mucus, saliva, tears, plasma, serum, sputum, spinal fluid, pleural fluid, papillary aspirate, lymph fluid, airway fluid, intestinal fluid, genitourinary fluid, breast milk, lymphatic fluid , Semen, cerebrospinal fluid, body fluid in the tracheal system, ascites, cystic tumor fluid, amniotic fluid, or a combination thereof. The biological sample may be a purely isolated nucleic acid, a crude isolated nucleic acid, a cell lysate containing nucleic acid, or a cell free nucleic acid.

생물학적 시료로부터 핵산을 분리하는 방법은 통상의 핵산 분리 방법에 의하여 수행될 수 있다. 예를 들면, 표적 핵산을 중합효소 연쇄 반응(polymerase chain reactionL: PCR), 리가제 연쇄 반응(ligase chain reaction: LCR), 전사 증폭(transcription amplification), 또는 실시간-핵산 서열 기초 증폭(realtime-nucleic acid sequence based amplification: NASBA)을 통하여 증폭하고 이를 정제하여 얻을 수 있다.The method of separating nucleic acids from a biological sample can be performed by a conventional nucleic acid separation method. For example, the target nucleic acid may be polymerase chain reaction (PCR), ligase chain reaction (LCR), transcription amplification, or real-time nucleic acid sequence amplification. It can be obtained by amplification and purification through sequence based amplification (NASBA).

상기 방법은 수득된 핵산 시료로부터 마커의 메틸화 여부를 분석하는 단계를 포함한다. 상기 메틸화 여부를 분석하는 단계는, 유전체 또는 DNA의 메틸화를 확인할 수 있는 공지의 방법으로 수행될 수 있다. 예를 들면, 시퀀싱, PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로 시퀀싱 및 바이설파이트 시퀀싱 또는 이들의 조합에 의해 수행될 수 있다.The method includes analyzing whether the marker is methylated from the obtained nucleic acid sample. The step of analyzing the methylation may be performed by a known method capable of confirming methylation of a genome or DNA. For example, sequencing, PCR, methylation specific PCR, real time methylation specific PCR, PCR using methylated DNA specific binding protein, quantitative PCR, DNA chip, pyro sequencing and bi Sulfite sequencing or a combination thereof.

상기 시퀀싱은, 체세대 염기 시퀀싱일 수 있는데, "차세대 염기 시퀀싱(next generation sequencing: NGS)은 칩(Chip)기반 그리고 PCR 기반 쌍-말단(paired end) 형식으로 전장 유전체를 조각내고, 상기 조각을 화학적인 반응(hybridization)에 기초하여 초고속으로 시퀀싱을 수행하는 기술을 의미한다. 차세대 염기시퀀싱에 의해 짧은 시간 내에 분석 대상이 되는 시료에 대해 대량의 염기서열 데이터를 생성할 수 있다.The sequencing may be body generation base sequencing. "Next generation sequencing (NGS) fragments the full-length genome in a chip-based and PCR-based paired end format, and fragments the fragment. It refers to a technique that performs sequencing at an extremely high speed based on a chemical reaction, and a large amount of sequencing data can be generated for a sample to be analyzed in a short time by next-generation sequencing.

상기 마커에서 메틸화된 DNA의 수가, 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상인 경우, 우울증 또는 자살 위험이 높다고 판단할 수 있으며, 예측에 대한 정확도가 높아질 수 있다.The number of methylated DNA in the marker is 1 or more, 2 or more, 3 or more, 4 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more, 10 or more, 11 If there are more than 12 dogs, 12 dogs, 13 dogs, 14 dogs or more, it can be determined that the risk of depression or suicide is high, and the accuracy of prediction can be increased.

다른 양상은, 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 RNA 발현 마커 데이터 중 적어도 하나, 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계; 상기 메틸화 마커 데이터를 가공한 제1학습용 입력 데이터 및 상기 RNA 발현 마커 데이터를 가공한 제2학습용 입력 데이터 중 적어도 하나의 학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하는 단계; 상기 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하는 단계; 상기 예측도가 미리 정해진 기준값 이상인 메틸화 마커 및 상기 예측도가 미리 정해진 기준값 이상인 RNA 발현 마커 중 적어도 하나를 선별하는 단계; 상기 선별된 메틸화 마커 및 상기 선별된 RNA 발현 마커 중 적어도 하나를 학습용 입력 데이터로 하는 우울증 또는 자살 위험 예측용 모델을 생성하는 단계;를 포함하는, 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법을 제공한다.Another aspect includes the steps of acquiring at least one of methylation marker data and RNA expression marker data of a plurality of individuals with depression, suicidal airway individuals or suicidal subjects, and whether depression, suicidal airways or suicide has been performed; At least one learning input data of the first learning input data processing the methylation marker data and the second learning input data processing the RNA expression marker data, and learning output processing the depression, suicidal airway or suicide performance data. Generating a test model by machine learning the data; Calculating the predicted risk of depression or suicide by applying the learning input data and the learning output data to the test model; Selecting at least one of a methylation marker having the predictive degree of a predetermined reference value or higher and an RNA expression marker having the predictive degree of a predetermined reference value or higher; Providing a method for predicting depression or suicide risk using machine learning, comprising: generating a model for predicting depression or suicide risk using at least one of the selected methylation marker and the selected RNA expression marker as learning input data. .

우울증 또는 자살 위험을 예측하는 것은 개체의 유전적인 게놈, 전사체, 후성 유전체 데이터 등을 포함하는 오믹스 데이터를 입력하면 소정의 알고리즘을 통해 상기 개체의 우울증 또는 자살 시도 또는 자살 수행 가능성을 산출한다는 것을 의미할 수 있다.Predicting the risk of depression or suicide means that inputting ohmic data including an individual's genetic genome, transcripts, epigenetic data, etc., yields the likelihood of depression or suicide attempt or suicide of the individual through a predetermined algorithm. Can mean

상기 메틸화 마커 데이터는 전술한 바와 동일하다. 상기 RNA 발현 마커 데이터는 개체의 염색체 내 시퀀싱 결과, DNA의 RNA로의 전사 여부 등, 개체의 유전체에서 RNA 발현과 관련된 기록을 포함한다.The methylation marker data is the same as described above. The RNA expression marker data includes records related to RNA expression in the genome of the individual, such as sequencing in the chromosome of the individual, whether DNA is transcribed into RNA, and the like.

상기 메틸화 마커 데이터, RNA 발현 마커 데이터는 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터는 한 개 이상의 병원 또는 지역의 개체로부터 획득할 수 있다. The methylation marker data, RNA expression marker data, and the depression, suicidal airway, or suicide performance data can be obtained from one or more individuals in a hospital or region.

상기 메틸화 마커 데이터는 유전체 또는 DNA의 메틸화를 확인할 수 있는 공지의 방법을 수행하여 획득될 수 있고, 상기 RNA 발현 마커 DNA에서 RNA로의 전사 여부를 확인할 수 있는 공지의 방법을 수행하여 획득될 수 있으며, 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터는 개체의 문진 또는 설문 결과로부터 획득될 수 있으나, 이에 제한되는 것은 아니다. The methylation marker data may be obtained by performing a known method capable of confirming methylation of a genomic or DNA, or may be obtained by performing a known method capable of determining whether the RNA expression marker DNA is transcribed from RNA, The depression, suicide attempt, or suicide performance data may be obtained from an individual's questionnaire or questionnaire results, but is not limited thereto.

이 후, 상기 메틸화 마커 데이터를 가공한 제1학습용 입력 데이터 및 상기 RNA 발현 마커 데이터를 가공한 제2학습용 입력 데이터 중 적어도 하나의 학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하는 단계가 수행된다. Thereafter, at least one learning input data among the first learning input data processing the methylation marker data and the second learning input data processing the RNA expression marker data, and the depression, suicidal airway or suicide performance data are processed. The step of generating a test model by machine learning one output data for learning is performed.

테스트 모델을 생성하는 단계는 상기 메틸화 마커 데이터를 가공한 제1학습용 입력 데이터와 상기 RNA 발현 마커 데이터를 가공한 제2학습용 입력 데이터 중 적어도 하나에 대응되는 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터 간의 상관 계수, 즉 양자의 매핑 정보일 수 있다.The step of generating a test model processes depression, suicidal airway or suicide performance data corresponding to at least one of input data for first learning processing the methylation marker data and input data for second learning processing the RNA expression marker data. It may be a correlation coefficient between output data for one learning, that is, mapping information of both.

'학습용 입력 데이터'는 기계 학습을 위해 사용되는 데이터로, 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및/또는 RNA 발현 마커 데이터로부터 가공되어 획득된다. 학습용 입력 데이는 제1학습용 입력 데이터 및/또는 제2학습용 입력 데이터를 포함할 수 있다. 예를 들면, 상술한 RNA 발현 마커 데이터 중에서, 염색체 번호, 염색체 내 염기의 위치, RNA로의 전사 여부 등 분류가 가능한 값은 라벨링하여 하나의 수학적 값으로 변환시킬 수 있다. 'Learning input data' is data used for machine learning, and is obtained by processing from methylation marker data and/or RNA expression marker data of a plurality of individuals with depression, suicidal airways or suicidal subjects. The input data for learning may include input data for first learning and/or input data for second learning. For example, among the RNA expression marker data described above, values that can be classified, such as chromosome number, location of base in chromosome, and transcription into RNA, can be labeled and converted into a single mathematical value.

'학습용 출력 데이터'는 테스트 모델을 통해 출력된 값과 비교되는 데이터를 의미한다. 이러한 학습용 출력 데이터는 개체의 우울증, 자살 기도 또는 자살 수행 여부 데이터로부터 가공되어 획득된다. 이는 전술한 바와 동일하다.'Learning output data' means data that is compared with the values output through the test model. The output data for learning is processed and obtained from data on whether an individual is performing depression, suicide attempts, or suicide. This is the same as described above.

이와 같은 과정을 통해 메틸화 마커 데이터, RNA 발현 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 수학적으로 처리할 수 있게 가공하여, 학습용 입력 데이터 및 학습용 출력 데이터를 획득할 수 있다.Through this process, methylation marker data, RNA expression marker data, and depression, suicidal airway, or suicide performance data can be processed to be mathematically processed to obtain learning input data and learning output data.

'테스트 모델'은, 학습용 입력 데이터와 학습용 출력 데이터의 상관 계수를 분석하여 과거, 현재, 또는 미래의 임의의 시점에서의 우울증 진단, 자살 시도, 또는 자살 수행으로의 사망을 예측하는 입출력함수를 의미한다. The'test model' means an input/output function that predicts death from depression diagnosis, suicide attempt, or suicide performance at any point in the past, present, or future by analyzing correlation coefficients of learning input data and learning output data. do.

테스트 모델 생성 단계 이후에는 상기 테스트 모델의 예측 결과를 바탕으로, 상기 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하는 단계가 수행된다. After the test model generation step, a step of calculating a predicted risk of depression or suicide is performed by applying the learning input data and the learning output data to the test model based on the prediction results of the test model.

상기 예측도에 대하여는 전술한 바와 동일하다. The prediction degree is the same as described above.

테스트 모델 생성 이후, 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하고, 상기 예측도가 미리 정해진 기준값 이상인 메틸화 마커 및 상기 예측도가 미리 정해진 기준값 이상인 RNA 발현 마커 중 적어도 하나를 선별하는 단계가 수행된다.After the test model is generated, learning input data and learning output data are applied to the test model to calculate the predicted risk of depression or suicide, and the methylation marker with the predicted value equal to or higher than a predetermined reference value and RNA expression with the predicted value exceeding a predetermined reference value The step of selecting at least one of the markers is performed.

상기 예측도는 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 65% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100% 이상일 수 있다. 일 실시예 따르면, 예측도가 75% 이상인 메틸화 마커는 선별하여 우울증 또는 자살 위험 예측용 마커로 발굴할 수 있다.The prediction degree is about 50% or more, about 55% or more, about 60% or more, about 65% or more, about 70% or more, about 75% or more, about 80% or more, about 85% or more, about 90% or more, and about 95% or more, or about 100% or more. According to an embodiment, a methylation marker having a predictability of 75% or more may be selected to be identified as a marker for predicting depression or suicide risk.

상기 선별된 메틸화 마커 및 상기 선별된 RNA 발현 마커 중 적어도 하나를 학습용 입력 데이터로 하는 우울증 또는 자살 위험 예측용 모델을 생성하는 단계가 수행된다. 일 실시예에서는, 랜덤 포레스트(random forests)를 이용하여 선별된 메틸화 마커 및/또는 RNA 발현 마커를 통합한 결과를 랜덤 포레스트에 적용하여 결과 값으로 우울증 또는 자살 위험의 예측도가 높은 것을 확인하였다. The step of generating a model for predicting the risk of depression or suicide using at least one of the selected methylation marker and the selected RNA expression marker as learning input data is performed. In one embodiment, a result of integrating selected methylation markers and/or RNA expression markers using random forests was applied to a random forest to confirm that the predicted risk of depression or suicide was high as a result.

상기 방법은, 상기 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 심리사고 평가척도 데이터를 획득하는 단계; 상기 심리사고 평가척도 데이터와 메틸화 마커 데이터 및 RNA 발현 마커 데이터 중 적어도 하나 사이의 상관 계수를 산출하는 단계; 상기 상관 계수가 미리 정해진 기준값 이상인 메틸화 마커 및 상기 상관 계수가 미리 정해진 기준값 이상인 RNA 발현 마커 중 적어도 하나를 선별하는 단계를 포함할 수 있다.The method comprises: obtaining psychological accident evaluation scale data of the plurality of individuals with depression, suicidal airways, or suicidal subjects; Calculating a correlation coefficient between the psychological accident evaluation scale data and at least one of methylation marker data and RNA expression marker data; The method may include selecting at least one of a methylation marker having the correlation coefficient equal to or greater than a predetermined reference value and an RNA expression marker having the correlation coefficient equal to or greater than a predetermined reference value.

상기 메틸화 마커 데이터 및/또는 RNA 발현 마커 데이터는 심리사고 평가척도 데이터와 임의의 상관 관계를 가질 수 있다. 상기 메틸화 마커 데이터 및/또는 RNA 발현 마커 데이터와 심리사고 평가척도 데이터의 상관 계수는 약 0.30 이상, 약 0.35 이상, 약 0.40 이상, 약 0.45 이상, 또는 약 0.5 이상일 수 있다. 일 실시예 따르면, 상기 메틸화 마커 데이터 및/또는 RNA 발현 마커와 심리사고 평가척도 데이터의 상관 계수가 0.3 이상인 메틸화 마커 및/또는 RNA 발현 마커를 선별하여 우울증 또는 자살 위험 예측용 마커로 최종적으로 선별할 수 있다.The methylation marker data and/or RNA expression marker data may have any correlation with psychological accident evaluation scale data. The correlation coefficient of the methylation marker data and/or RNA expression marker data and psychological accident evaluation scale data may be about 0.30 or more, about 0.35 or more, about 0.40 or more, about 0.45 or more, or about 0.5 or more. According to an embodiment, the methylation marker data and/or the RNA expression marker and the psychological accident evaluation scale data have a correlation coefficient of 0.3 or higher, and a methylation marker and/or RNA expression marker is selected to finally select the marker for predicting depression or suicide risk. Can be.

상기 테스트 모델을 생성하는 단계는, 상기 메틸화 마커 데이터를 가공한 제1학습용 입력 데이터의 학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하고, 상기 테스트 모델을 바탕으로, 상기 RNA 발현 마커 데이터를 가공한 제2학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 기 생성된 테스트 모델을 수정 및 갱신하는 단계가 수행될 수 있다. 이후, 수정 및 갱신된 모델의 입력 변수 집합을 최종 변수 집합으로 선정할 수 있으며, 예를 들면, 수정 및 갱신된 모델의 메틸화 마커를 최종 변수 집합으로 선정할 수 있다. In the generating of the test model, the test model is obtained by machine learning the input data for learning of the first learning input data processed with the methylation marker data, and the learning output data processing the depression, suicide airway or suicide performance data. The generated test model is generated by machine learning the input data for second learning processing the RNA expression marker data and learning output data processing the depression, suicidal airway or suicide performance data based on the test model. The step of modifying and updating may be performed. Thereafter, the input variable set of the modified and updated model may be selected as the final variable set, and, for example, the methylated marker of the modified and updated model may be selected as the final variable set.

상기 우울증 또는 자살 위험 예측용 마커 발굴 방법 및/또는 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법은 복수의 학습용 입력 데이터 및/또는 학습용 출력 데이터를 분류하기 위해 Logistic regression, Decision tree, Nearest-neighbor classifier, Kernel discriminate analysis, Neural network, Support Vector Machine, Random forest, Boosted tree 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다.The method for discovering a marker for predicting depression or suicide risk and/or a method for predicting depression or suicide risk by using machine learning includes Logistic regression, Decision tree, Nearest-neighbor classifier, to classify a plurality of input data for learning and/or output data for learning. Algorithms and/or methods such as Kernel discriminate analysis, Neural network, Support Vector Machine, Random forest, and Boosted tree can be used.

상기 우울증 또는 자살 위험 예측용 마커 발굴 방법 및/또는 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법은 우울증 또는 자살 위험을 예측하기 위해 Linear regression, Regression tree, Kernel regression, Support vector regression, Deep Learning 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다.The method for discovering a marker for predicting depression or suicide risk and/or a method for predicting depression or suicide risk using machine learning includes algorithms such as linear regression, regression tree, kernel regression, support vector regression, and deep learning to predict depression or suicide risk. And/or methods (techniques) can be used.

또한, 상기 우울증 또는 자살 위험 예측용 마커 발굴 방법 및/또는 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법은 예측도, 재현도, 상관 계수 등의 연산을 위해 Principal component analysis, Non-negative matrix factorization, Independent component analysis, Manifold learning, SVD 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다.In addition, the method for discovering a marker for predicting depression or suicide risk and/or a method for predicting depression or suicide risk using machine learning includes Principal component analysis, Non-negative matrix factorization, Independent for calculation of predictability, reproducibility, correlation coefficient, etc. You can use algorithms and/or methods (techniques) such as component analysis, manifold learning, and SVD.

상기 우울증 또는 자살 위험 예측용 마커 발굴 방법 및/또는 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법은 복수의 메틸화 마커 데이터의 그룹화를 위해 k-means, Hierarchical clustering, mean-shift, self-organizing maps(SOMs) 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다. The method for discovering a marker for predicting depression or suicide risk and/or a method for predicting depression or suicide risk using machine learning includes k-means, hierarchical clustering, mean-shift, and self-organizing maps (SOMs) for grouping a plurality of methylation marker data. ) And/or methods (techniques).

상기 우울증 또는 자살 위험 예측용 마커 발굴 방법 및/또는 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법은 데이터 비교를 위해 Bipartite cross-matching, n-point correlation two-sample testing, minimum spanning tree 등의 알고리즘 및/또는 방식(기법)을 사용할 수 있다. The method for discovering a marker for predicting depression or suicide risk and/or a method for predicting depression or suicide risk using machine learning includes algorithms such as bipartite cross-matching, n-point correlation two-sample testing, minimum spanning tree, and/or Alternatively, a method (technique) can be used.

다만, 전술한 알고리즘 및/또는 방식(기법)은 예시적인 것으로 본 발명의 사상이 이에 한정되는 것은 아니다.However, the above-described algorithms and/or methods (techniques) are exemplary and the spirit of the present invention is not limited thereto.

한편, 데이터는 데이터 세트(Data set)일 수 있다. 다시 말하면, 학습용 입력 데이터, 학습용 출력 데이터, 검증용 입력 데이터, 검증용 출력 데이터 등은 행렬(Matrix)과 같이 복수개의 숫자(또는 계수)로 구성된 데이터 세트일 수 있다. Meanwhile, the data may be a data set. In other words, the input data for learning, the output data for learning, the input data for verification, the output data for verification, etc. may be a data set composed of a plurality of numbers (or coefficients) such as a matrix.

본 발명의 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법에 따르면, 정확도 및 신뢰도가 높은 우울증 또는 자살 위험 예측용 마커를 발굴할 수 있고, 유전자 검사를 통하여 우울증 또는 자살 위험을 조기에 진단 및 그 위험을 예방할 수 있다. 물론 이러한 효과에 의해 본 발명의 범위가 한정되는 것은 아니다.According to the method of discovering a marker for predicting depression or suicide risk using the machine learning of the present invention, a marker for predicting depression or suicide risk with high accuracy and reliability can be discovered, and a genetic test is used to diagnose and diagnose depression or suicide risk early. You can prevent that danger. Of course, the scope of the present invention is not limited by these effects.

도 1은 일 실시예에 따른 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법을 나타낸 순서도이다.
도 2는 선발된 70명을 대상으로 학습용 데이터를 수득하고, 유전자 전체에서 변형된 메틸 시토신의 분포를 분석한 결과이다.
도 3은 예측도 및 재현도가 기준값 이상이고, 심리사고 평가척도와 상관 계수가 기준값 이상인 메틸화 자리를 선별하는 과정 및 그에 따라 선별된 DNA 메틸화 마커를 나타낸다.
도 4는 우울증을 갖는 군 및 자살 기도 또는 자살 수행 군에서의 DNA 메틸화 마커를 나타낸다.
도 5는 우울증 또는 자살 위험 예측용 마커로 선별된 메틸화 마커에서 메틸화 정도를 나타낸 그래프이다.
도 6은 심리사고 평가척도와 연관성이 있는, 메틸화 자리, RNA 발현 결과, 메틸화 자리와 RNA 발현 결과를 통합한 결과 각각을 랜덤 포레스트에 적용하여 결과 값으로 우울증 또는 자살 위험의 예측도를 확인한 결과이다.
도 7은 일 실시예에 따른 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법을 나타낸 순서도이다.
1 is a flowchart illustrating a method for discovering a marker for predicting depression or suicide risk using machine learning according to an embodiment.
FIG. 2 shows the results of analyzing the distribution of modified methyl cytosine in all genes by obtaining learning data for 70 selected subjects.
3 shows a process of selecting a methylation site having a predictability and reproducibility of a reference value or higher, a psychological accident evaluation scale and a correlation coefficient of a reference value or higher, and a DNA methylation marker selected accordingly.
Figure 4 shows DNA methylation markers in the group with depression and in the suicidal airway or suicidal group.
5 is a graph showing the degree of methylation in a methylation marker selected as a marker for predicting depression or suicide risk.
6 is a result of confirming the predictability of depression or suicide risk as a result value by applying each of the results of integrating methylation sites, RNA expression results, methylation sites and RNA expression results to a random forest, correlated with a psychological accident evaluation scale. .
7 is a flowchart illustrating a method for predicting a depression or suicide risk using machine learning and a method for discovering a marker for predicting depression or suicide risk using machine learning according to an embodiment.

본 발명은 하기 실시예에 의하여 더욱 구체적으로 설명한다. 그러나, 하기 실시예는 본 발명의 이해를 돕기 위한 것일 뿐, 어떤 의미로든 본 발명의 범위가 이러한 실시예에 의하여 한정되는 것은 아니다.The present invention is explained in more detail by the following examples. However, the following examples are only to aid the understanding of the present invention, and the scope of the present invention is not limited by these examples in any sense.

실시예Example 1: 11: 1 ) 우울증, 자살 수행 또는 자살 기도 개체로부터, 유전체 메틸화 정보 추출, 2) 심리사고 평가척도와 상관 계수가 ) Depression, suicidal performance, or suicidal airway individuals, genome methylation information extraction, 2) Psychological accident evaluation scale and correlation coefficient 기준값Reference value 이상, 예측도 및 Anomaly, predictability and 재현도가Reproducibility 기준값Reference value 이상인 메틸화 자리 선별, 및 3) 메틸화 Selection of abnormal methylation sites, and 3) methylation 마커Marker And RNA 발현 RNA expression 마커Marker 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 And risk of suicide by using machine learning

1. 우울증, 자살 수행 또는 자살 기도 개체로부터, 유전체 메틸화 정보 추출, 및 심리사고 평가척도와 상관 계수가 1. Depression, suicidal performance, or suicidal airway individuals, genome methylation information extraction, and psychological accident assessment scales and correlation coefficients 기준값Reference value 이상, 예측도 및 Anomaly, predictability and 재현도가Reproducibility 기준값Reference value 이상인 메틸화 자리 선별 Selection of abnormal methylation sites

도 7은 일 실시예에 따른 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법을 나타낸 순서도이다. 도 7을 참조하면, 개체로부터 수득한 methylseq 리드(read)를 전환된 hg19 참조 서열에 정렬하고, 염기의 메틸화(methylation) 정보를 추출한다. 상기 정보를 이용하여, 위험군과 정상군에서 메틸화 여부가 다르게 나타난 염색체 자리(Differentially Methylated Site: DMS), 각각의 메틸화 자리에서의 우울증, 자살 기도 또는 자살 수행에 대한 예측도와 재현도, 및 각각의 메틸화 자리와 심리사고 평가척도의 상관 계수(correlation)을 이용를 이용하여, 우울증 또는 자살 위험 예측용 마커를 발굴할 수 있고, 이를 이용하여 개체의 우울증 또는 자살 위험을 예측할 수 있다. 7 is a flowchart illustrating a method for predicting a depression or suicide risk using machine learning and a method for discovering a marker for predicting depression or suicide risk using machine learning according to an embodiment. Referring to FIG. 7, methylseq reads obtained from an individual are aligned to a converted hg19 reference sequence, and methylation information of a base is extracted. Using the above information, the chromosome sites (Differentially Methylated Site: DMS) with different methylation status in the risk group and the normal group, depression at each methylation site, predictability and reproducibility of suicidal airway or suicide performance, and each methylation Markers for predicting the risk of depression or suicide can be identified using the correlation coefficient of the seat and the psychological accident evaluation scale, and the risk of depression or suicide of the individual can be predicted using the correlation coefficient.

우울증을 갖는 개체 22명, 자살 기도 또는 자살 수행 개체 34명(위험군) 및 그렇지 않는 개체 44명(정상군 또는 대조군), 총 100명을 모집하였다. 그 중 임의로 선발된 70명을 대상으로 학습용 데이터를 수득하였으며, 나머지 30명을 대상으로 검증용 데이터를 수득하였다. A total of 100 subjects were recruited: 22 individuals with depression, 34 individuals with suicide attempts or suicides (risk group), and 44 without suicides (normal or control group). Among them, learning data was obtained for 70 randomly selected subjects, and verification data was obtained for the remaining 30 subjects.

상기 100명의 대상자로부터 말초 혈액을 채취하고, 이어서, QiAmp DNA 키트(Qiagen, Germany)를 이용하여, 상기 혈액으로부터 유전체 DNA(genomic DNA: gDNA)을 수득하였다. 이어서, 바이설파이트(bisulfite)를 이용한 시퀀싱(Reduced representation bisulfite sequencing: RRBS)(Illumina)을 수행하였다. 수득된 시퀀싱 데이터를 NGSQcToolKit를 이용하여 품질 점수(quality control)가 20 이상인 리드만을 필터링하여, methylseq 리드(read)를 수득하였다. 인간 참조 게놈(Human reference genome)(hg19)은 bismark_genome_preparation 프로그램으로 전환(convert)하였다. methylseq 리드를 bismark 정렬(align)을 이용하여 전환된 hg19 참조 서열에 정렬하였다(http://genome.ucsc.edu). 정렬(Alignment) 결과로부터 MethylExtract를 이용하여 메틸화(methylation) 정보를 추출하였다. Peripheral blood was collected from the 100 subjects, and then genomic DNA (gDNA) was obtained from the blood using a QiAmp DNA kit (Qiagen, Germany). Subsequently, a reduced representation bisulfite sequencing (RRBS) (Illumina) was performed using bisulfite. The obtained sequencing data was filtered using NGSQcToolKit to filter only reads having a quality control of 20 or higher to obtain methylseq reads. The human reference genome (hg19) was converted to the bismark_genome_preparation program. The methylseq read was aligned to the converted hg19 reference sequence using bismark alignment (http://genome.ucsc.edu). From the alignment results, methylation information was extracted using MethylExtract.

70명의 메틸화 정보를 이용하여, 위험군과 정상군에서 메틸화 여부가 다르게 나타난 염색체 자리(Differentially Methylated Site: DMS)를, 게놈 전반적인 DNA 메틸화 프로파일의 분석을 위한 포괄적인 R 패키지인 methylKit 및 Wilcoxon 테스트를 이용하여 추출하였다. Using the methylation information of 70 people, the chromosomes (Differentially Methylated Site: DMS) with different methylation status in the risk group and the normal group were analyzed using methylKit and Wilcoxon tests, which are comprehensive R packages for analysis of the genome-wide DNA methylation profile. Extracted.

이어서, 각각의 메틸화 자리에서의 자살 기도 또는 자살 수행에 대한 예측도와 재현도를 계산하였다. 예측도는 70명의 메틸화 정보를 트레이닝 데이터 세트(training data set)로 하여 테스트 모델을 생성하고, 상기 트레이닝 테이터 세트를 상기 테스트 모델에 적용하였을 때, 위험군과 대조군이 구분되는 정도(0 내지 1)를 나타낸다. 재현도는 나머지 30명을 대상으로 검증용 데이터를 수득하고, 메틸화 정보를 생성된 테스트 모델에 적용하였을 때, 위험군과 대조군이 구분되는 정도(0 내지 1)를 나타낸다.Subsequently, prediction and reproducibility of suicidal airway or suicide performance at each methylation site were calculated. The predictability is the degree to which the risk group and the control group are distinguished (0 to 1) when a test model is generated using 70 methylation information as a training data set, and the training data set is applied to the test model. Shows. The reproducibility shows the degree (0 to 1) between the risk group and the control group when data for verification is obtained for the remaining 30 subjects and methylation information is applied to the generated test model.

구체적으로, 트레이닝 데이터 세트를 위험군(Case)와 대조군(Control)으로 나눈 후, 위험군의 수치 중의 중간값과 대조군의 수치 중의 중간값의 평균을 위험군과 대조군을 가르는 기준값으로 삼는다. 그 기준값을 트레이닝 데이터 세트의 위험군과 대조군에 재적용해서 위험군과 대조군을 재구분 할 때, 본래의 위험군과 대조군 구분과 일치하는 정도를 계산하여 나온 값을 예측도로 삼는다. 그 기준값을 검증용 데이터 세트에 위와 같은 방법으로 계산하여 나온 값을 재현도로 삼는다.Specifically, after dividing the training data set into a risk group (Case) and a control group (Control), the mean value of the median value of the risk group and the control group value is used as a reference value between the risk group and the control group. When re-classifying the risk group and the control group by reapplying the reference value to the risk group and the control group of the training data set, the predicted value is calculated by calculating the degree of matching with the original risk group and the control group. The reference value is calculated on the verification data set in the same way as above, and is used as the reproducibility.

또한, 메틸화 정보와 심리사고 평가척도 점수를 기초로 Spearman 상관 계수(correlation)를 이용하여 메틸화 자리와 심리사고 평가척도 점수 간의 상관 계수를 구하였다. In addition, the correlation coefficient between the methylation site and the psychological accident evaluation scale score was obtained using the Spearman correlation coefficient based on the methylation information and the psychological accident evaluation scale score.

도 2는 선발된 70명을 대상으로 학습용 데이터를 수득하고, 유전자 전체에서 메틸화된 염기의 분포를 분석한 결과이다. chr는 염색체 번호, Annotation은 해당 위치가 어떤 유전자의 어떤 영역에 위치하는지를 나타낸다. Rho_HAM21, HAM17, SSI는 심리사고 평가척도(우울증: HAM21, HAM17; 자살: SSI)와의 상관 계수를 나타낸다. Pval_HAM21, HAM17, SSI는 심리사고 평가척도와의 상관 계수의 유의도을 나타낸다. Pval_MethylKit와 Pval_Willcoxon은 각각의 메틸화 자리에서 위험군과 대조군이 구분되는 정도의 유의도를 나타낸다. Prediction 과 Replication은 각각 예측도와 재현도를 나타낸다. FIG. 2 shows the results of analyzing the distribution of methylated bases in all genes by obtaining learning data for 70 selected subjects. chr is the chromosome number, and Annotation indicates which region of the gene is located. Rho_HAM21, HAM17, and SSI represent correlation coefficients with the psychological accident evaluation scale (depression: HAM21, HAM17; suicide: SSI). Pval_HAM21, HAM17, and SSI indicate the significance of the correlation coefficient with the psychological accident evaluation scale. Pval_MethylKit and Pval_Willcoxon indicate the degree of significance between the risk group and the control group at each methylation site. Prediction and Replication show prediction and reproducibility, respectively.

도 3은, 도 2의 표로부터 예측도 및 재현도가 기준값 이상이고, 심리사고 평가척도와 상관 계수가 기준값 이상인 메틸화 자리를 선별하는 과정 및 그에 따라 선별된 DNA 메틸화 마커를 나타낸다. 3 shows a process of selecting a methylation site having a predictability and reproducibility of a reference value or higher, a psychological accident evaluation scale, and a correlation coefficient of a reference value or higher from the table of FIG. 2 and a DNA methylation marker selected accordingly.

도 3의 A을 참조하면, 예측도가 50% 이상인 메틸화 자리를 계수한 결과 31,739 개이며, 그 중 각각의 심리사고 평가척도와 연관성이 있는 메틸화 자리를 선별 및 계수하였다. 이 때, 연관성이 있는 메틸화 자리는 Rho_HAM21, HAM17, 및 SSI 각각과 상관 계수가 0.3 이상(Rho≥0.3), 상관 계수의 유의도가 0.05 미만(p-value<0.05)인 것을 선별하였다. 그 결과, HAM21에 대하여 5,524개, HAM17에 대하여 5,633개, SSI에 대하여 5,292개 이었다. 모든 심리사고 평가척도와 연관성이 있는 메틸화 자리의 수는 2,287개이었다. Referring to A of FIG. 3, as a result of counting methylation sites having a predictability of 50% or more, 31,739 cases were selected, and methylation sites related to each psychological evaluation scale were selected and counted. At this time, the relevant methylation sites were selected from Rho_HAM21, HAM17, and SSI, respectively, and the correlation coefficient was 0.3 or more (Rho≥0.3) and the significance of the correlation coefficient was less than 0.05 (p-value<0.05). As a result, there were 5,524 for HAM21, 5,633 for HAM17, and 5,292 for SSI. The number of methylation sites correlated with all psychological accident evaluation scales was 2,287.

그 중에서, 예측도가 75% 이상인 메틸화 자리 15개를 선별하여, 도 3의 B에 나타내었다. 도 3의 B에 나타낸 바와 같이, 상기 15종의 메틸화 마커는 자살 기도 또는 자살 시도, 또는 우울증의 위험을 높은 정확도 및 신뢰도로 예측할 수 있다. 도 3의 B에서, chr는 염색체 번호, site는 염색체 상의 위치, gene은 해당 위치가 어떠한 유전자와 연관되어 있는지, >methylation은 해당 위치에서 위험군과 정상군 중에 어떠한 군에 더 많이 메틸화가 되어 있는지, region은 해당 위치가 연관된 유전자의 어떠한 영역에 위치하는지를 나타낸다. 도 3의 C는 도 3의 A 및 B를 그래프로 나타낸 것이다. Among them, 15 methylation sites with a predictability of 75% or more were selected and shown in FIG. 3B. As shown in FIG. 3B, the 15 kinds of methylation markers can predict suicidal airway or suicide attempt, or the risk of depression with high accuracy and reliability. In B of FIG. 3, chr is a chromosome number, site is a position on the chromosome, gene is associated with which gene, >methylation is more methylated in which group of the risk group and the normal group at that position, The region indicates the region in which the corresponding gene is located. C of FIG. 3 graphically shows A and B of FIG. 3.

도 5는 우울증 또는 자살 위험 예측용 마커로 선별된 메틸화 마커에서 메틸화 정도를 나타낸 그래프이다. 도 5의 A는 메틸화 자리인 인간의 16번째 염색체의 14014009번째 염기에 대하여, 우울증을 갖는 개체, 자살 기도 또는 자살 수행 개체에서 메틸화 정도를 나타낸 그래프이다. 도 5의 A에 나타낸 바와 같이, 우울증을 갖는 개체, 자살 기도 또는 자살 수행 개체는 정상군에 비하여, 16번째 염색체의 14014009번째 염기에서 메틸화가 정도가 현저하게 높았다. 5 is a graph showing the degree of methylation in a methylation marker selected as a marker for predicting depression or suicide risk. 5A is a graph showing the degree of methylation in a subject having depression, a suicidal airway, or a suicidal performing person, with respect to the 14014009th base of the human 16th chromosome, which is the methylation site. As shown in FIG. 5A, individuals with depression, individuals with suicidal airway or suicide, had a significantly higher degree of methylation at the 14014009th base of the 16th chromosome than the normal group.

2. 자살 수행 또는 자살 기도와 특이적으로 관련된 메틸화 자리 선별 2. Screening methylation sites specifically related to suicidal conduct or suicidal airways

우울증과 자살 기도 또는 자살 수행의 위험은 다른 유전적인 요인에 의해 유발될 수 있으므로, 1과 동일한 방법으로, 우울증과 자살 기도 또는 자살 수행을 구분할 수 있는 메틸화 마커를 추가 확인하였다. Since the risk of depression and suicidal intention or suicidal performance may be caused by other genetic factors, in the same manner as 1, methylation markers capable of distinguishing depression and suicidal intention or suicidal performance were additionally confirmed.

도 4는 우울증을 갖는 군 및 자살 기도 또는 자살 수행 군에서의 DNA 메틸화 마커를 나타낸다.Figure 4 shows DNA methylation markers in the group with depression and in the suicidal airway or suicidal group.

도 4의 A을 참조하면, 자살 기도 또는 자살 수행에 대한 예측도가 50% 이상인 메틸화 자리를 계수한 결과 35,778개이며, 그 중 각각의 심리사고 평가척도와 연관성이 있는 메틸화 자리를 선별 및 계수하였다. 그 결과, HAM21에 대하여 322개, HAM17에 대하여 337개, SSI에 대하여 532개이었다. 모든 심리사고 평가척도와 연관성이 있는 메틸화 자리의 수는 122개이었다. 그 중에서, 예측도가 80% 이상이고, 각각의 심리사고 평가척도와 연관성이 있는 메틸화 자리의 수는 5개이었다. 도 4의 A에 나타낸 바와 같이, 상기 종의 메틸화 마커는 자살 기도 또는 자살 시도의 위험과 우울증의 위험을 특이적으로 구분하여, 높은 정확도 및 신뢰도로 예측할 수 있다. 도 4의 B는 도 4의 A를 그래프로 나타낸 것이다. Referring to A of FIG. 4, as a result of counting methylation sites with a predictability of suicidal airway or suicidal performance of 50% or more, 35,778 were counted, and among them, methylation sites correlated with each psychological accident evaluation scale were selected and counted. . As a result, there were 322 for HAM21, 337 for HAM17, and 532 for SSI. The number of methylation sites correlated with all psychological accident evaluation scales was 122. Among them, the predicted degree was 80% or more, and the number of methylation sites correlated with each psychological accident evaluation scale was five. As shown in A of FIG. 4, the methylation marker of the species can be predicted with high accuracy and reliability by specifically distinguishing the risk of suicide attempt or suicide attempt from the risk of depression. FIG. 4B is a graph of FIG. 4A.

도 5는 우울증 또는 자살 위험 예측용 마커로 선별된 메틸화 마커에서 메틸화 정도를 나타낸 그래프이다. 도 5의 B는 메틸화 자리인 인간의 10번째 염색체의 44144362번째 염기에 대하여, 우울증을 갖는 군 및 자살 기도 또는 자살 수행 군에서 메틸화 정도를 나타낸 그래프이다. 도 5의 B에 나타낸 바와 같이, 우울증을 갖는 개체는, 자살 기도 또는 자살 수행 개체에 비하여, 10번째 염색체의 44144362번째 염기에서 메틸화 정도가 현저하게 높았다. 한편, 자살 기도 또는 자살 수행 개체는, 인간의 13번째 염색체의 100254805번째 염기의 메틸화, 인간의 15번째 염색체의 53093335번째 염기의 메틸화, 인간의 21번째 염색체의 46351387번째 염기의 메틸화, 인간의 3번째 염색체의 28390646번째 염기의 비메틸화, 및 인간의 10번째 염색체의 44144362번째 염기의 비메틸화를 갖는 것을 알 수 있다. 5 is a graph showing the degree of methylation in a methylation marker selected as a marker for predicting depression or suicide risk. 5B is a graph showing the degree of methylation in the group having depression and in the suicidal airway or suicidal group, with respect to the 44144362th base of the 10th chromosome of a human, which is a methylation site. As shown in FIG. 5B, the individuals with depression had a significantly higher degree of methylation at the 44144362th base of the 10th chromosome, compared to the suicidal airway or suicidal subjects. On the other hand, the subject of suicidal airway or suicide, the methylation of the 100254805th base of the human 13th chromosome, the methylation of the 53093335th base of the human 15th chromosome, the methylation of the 46351387th base of the human 21st chromosome, the human third It can be seen that the chromosome has the unmethylated 28390646 base, and the human 10th chromosome 44144362.

3. 메틸화 3. Methylation 마커Marker And RNA 발현 RNA expression 마커Marker 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 And risk of suicide by using machine learning

3종의 심리사고 평가척도와 연관성이 있는(상관 계수가 0.35 이상) 메틸화 자리(86개)를 이용하여, 기계학습 방법 중 하나인 랜덤 포레스트(random forests)에 적용하였다. 1에서 우울증 또는 자살 위험이 있는 위험군과 정상군에 대한 결과를 확인하였으므로, 지도식 학습(Supervised Learning) 방법을 적용하여, 우울증 또는 자살 위험에 대한 예측도를 확인하였다. 상기 검증 방법은, 여러 검증 방법 중 적은 샘플 수에 유용한 leave-one-out cross validation 방법을 적용하였다. Using methylation sites (86) correlated with three psychological accident evaluation scales (correlation coefficient of 0.35 or more), they were applied to one of the machine learning methods, random forests. Since the results of the risk and depression suicide risk groups and the normal group were confirmed in 1, the predicted degree of depression or suicide risk was confirmed by applying the supervised learning method. For the verification method, a leave-one-out cross validation method useful for a small number of samples among various verification methods was applied.

1에서 수행한 메틸화 자리 및 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법을, RNA 발현 데이터에 적용하였다. 또한, 3종의 심리사고 평가척도와 연관성이 있는(상관 계수 0.35 이상) RNA 발현 데이터(28개)를 지도 랜덤 포레스트(Supervised random forests)에 적용하였다. The marker discovery method for predicting depression or suicide risk using methylation site and machine learning performed in 1 was applied to RNA expression data. In addition, RNA expression data (28) correlated with three psychological accident evaluation scales (correlation coefficient of 0.35 or more) was applied to supervised random forests.

메틸화 자리, RNA 발현 데이터, 및 Wilcoxon signed-rank 테스트 결과를 이용하여 지도 랜덤 포레스트(Supervised random forests)에 적용하였다. Methylated sites, RNA expression data, and Wilcoxon signed-rank test results were used to apply to supervised random forests.

도 6은 심리사고 평가척도와 연관성이 있는, 메틸화 자리, RNA 발현 결과, 메틸화 자리와 RNA 발현 결과를 통합한 데이터 각각을 랜덤 포레스트에 적용하여 결과 값으로 우울증 또는 자살 위험의 예측도를 확인한 결과이다. 6 is a result of confirming the predictability of depression or suicide risk as a result value by applying each of data combining methylation sites, RNA expression results, methylation sites and RNA expression results to a random forest, which is correlated with a psychological accident evaluation scale. .

도 6을 참조하면, 3종의 심리사고 평가척도와 연관성이 있는 메틸화 자리(86개)에 대하여 우울증 또는 자살 위험을 예측하는 정확도는 약 86%이었다. 3종의 심리사고 평가척도와 연관성이 있는 RNA 발현 결과에 대하여 우울증 또는 자살 위험을 예측하는 정확도는 약 73%이었다. 3종의 심리사고 평가척도와 연관성이 있는 메틸화 자리와 RNA 발현 결과를 통합한 데이터(114개)에 대하여 우울증 또는 자살 위험을 예측하는 정확도는 약 86%이었다. 3종의 심리사고 평가척도와 연관성이 있는 메틸화 자리와 RNA 발현 결과를 통합한 데이터(114개)에, 및 1에서 분석 및 확인된 15종의 마커를 추가한 경우, 우울증 또는 자살 위험을 예측하는 정확도는 약 90%이었다. 3종의 심리사고 평가척도와 연관성이 있는 메틸화 자리와 RNA 발현 결과를 통합한 데이터(114개)에, 1에서 분석 및 확인된 15종의 마커, 및 RNA 발현 분석 및 확인된 9종의 마커를 추가한 경우, 우울증 또는 자살 위험을 예측하는 정확도는 약 90%이었다. Referring to FIG. 6, the accuracy of predicting the risk of depression or suicide was about 86% for the methylated sites (86) correlated with three psychological accident evaluation scales. The accuracy of predicting the risk of depression or suicide was about 73% for the RNA expression results correlated with the three psychological accident evaluation scales. The accuracy of predicting the risk of depression or suicide was about 86% for data combining 114 methylation sites and RNA expression results correlated with three psychological accident evaluation scales. Predicting the risk of depression or suicide by adding the methylation site and RNA expression results correlated with three psychological evaluation scales (114) and 15 markers analyzed and identified in 1 Accuracy was about 90%. In the data (114) that integrates methylation sites and RNA expression results correlated with three psychological accident evaluation scales, 15 markers analyzed and identified in 1 and RNA expression analysis and 9 identified markers When added, the accuracy of predicting the risk of depression or suicide was about 90%.

개체의 우울증 또는 자살 위험은 개체의 전사체 및 후성 유전체 데이터 등을 포함하는 오믹스 데이터 및 소정의 알고리즘을 통해 높은 정확도로 예측할 수 있다.The risk of an individual's depression or suicide can be predicted with high accuracy through certain algorithms and ohmic data, including transcript and epigenetic data of the individual.

Claims (13)

컴퓨터에 의해 수행되는 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법에 있어서,
복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계;
상기 메틸화 마커 데이터를 가공한 학습용 입력 데이터, 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하는 단계;
상기 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하는 단계;
상기 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 우울증 또는 자살에 대한 심리사고 평가척도 데이터를 획득하는 단계;
상기 심리사고 평가척도 데이터와 메틸화 마커 데이터 사이의 상관 계수를 산출하는 단계; 및
상기 예측도 및 상관계수가 미리 정해진 기준값 이상인 메틸화 마커를 선별하는 단계를 포함하는, 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법.
In the method of finding a marker for predicting the risk of depression or suicide using machine learning performed by a computer
Obtaining a plurality of methylation marker data of individuals with depression, suicidal airways or suicidal subjects, and whether depression, suicidal airways or suicides have been performed;
Generating a test model by machine learning the learning input data processing the methylation marker data, and the learning output data processing the depression, suicidal airway or suicide performance data;
Calculating the predicted risk of depression or suicide by applying the learning input data and the learning output data to the test model;
Acquiring psychological accident evaluation scale data for depression or suicide of the plurality of individuals having depression, suicidal airway individuals, or suicidal individuals;
Calculating a correlation coefficient between the psychological accident evaluation scale data and methylation marker data; And
The method of discovering a marker for predicting the risk of depression or suicide using machine learning, comprising the step of selecting a methylation marker having the predicted degree and a correlation coefficient equal to or greater than a predetermined reference value.
청구항 1에 있어서,
복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계;
상기 메틸화 마커 데이터를 가공한 검증용 입력 데이터 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 검증용 출력 데이터를 획득하는 단계;
상기 검증용 입력 데이터 및 검증용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 재현도를 산출하는 단계;
상기 재현도가 미리 정해진 기준값 이상인 메틸화 마커를 선별하는 단계를 포함하는, 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법.
The method according to claim 1,
Obtaining a plurality of methylation marker data of individuals with depression, suicidal airways or suicidal subjects, and whether depression, suicidal airways or suicides have been performed;
Obtaining input data for verification processing the methylation marker data and verification output data processing the depression, suicidal airway, or suicide performance data;
Calculating reproducibility of depression or suicide by applying the input data for verification and the output data for verification to the test model;
A method of discovering a marker for predicting depression or suicide risk using machine learning, comprising the step of selecting the methylation marker having the reproducibility equal to or greater than a predetermined reference value.
삭제delete 청구항 1에 있어서, 상기 예측도에 대한 기준값은 50%인 것인, 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법.The method according to claim 1, wherein the reference value for the predictive degree is 50%, a method for discovering a marker for predicting depression or suicide risk using machine learning. 청구항 2에 있어서, 상기 재현도에 대한 기준값은 50%인 것인, 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법.The method according to claim 2, wherein the reference value for the reproducibility is 50%, a method for discovering a marker for predicting depression or suicide risk using machine learning. 청구항 1에 있어서, 상기 상관 계수에 대한 기준값은 0.3인 것인, 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법.The method according to claim 1, wherein the reference value for the correlation coefficient is 0.3, a method for discovering a marker for predicting depression or suicide risk using machine learning. 삭제delete 우울증 또는 자살 위험 예측용 마커로서, 상기 마커는 인간의 11번째 염색체의 67806358번째 염기, 인간의 14번째 염색체의 102516597번째 염기, 인간의 15번째 염색체의 37172017번째 염기, 인간의 16번째 염색체의 14014009번째 염기, 인간의 16번째 염색체의 88636588번째 염기, 인간의 17번째 염색체의 73009364번째 염기, 인간의 18번째 염색체의 77487338번째 염기, 인간의 19번째 염색체의 40023259번째 염기, 인간의 2번째 염색체의 3423658번째 염기, 인간의 2번째 염색체의 73052175번째 염기, 인간의 20번째 염색체의 42163538번째 염기, 인간의 20번째 염색체의 62460632번째 염기, 인간의 3번째 염색체의 147125005번째 염기, 인간의 4번째 염색체의 85419584번째 염기, 인간의 6번째 염색체의 21524046번째 염기 또는 이들의 조합의 메틸화 여부인 것인, 우울증 또는 자살 위험 예측용 마커.As a marker for predicting the risk of depression or suicide, the marker is the 67806358th base of the 11th human chromosome, the 102516597th base of the 14th human chromosome, the 37172017th base of the 15th human chromosome, and the 14014009th human 16th chromosome Base, 88636588th base of human 16th chromosome, 73009364th base of human 17th chromosome, 77487338th base of human 18th chromosome, 40023259th base of human 19th chromosome, 3423658th of human 2nd chromosome Base, 73052175th base of human 2nd chromosome, 42163538th base of human 20th chromosome, 62460632th base of human 20th chromosome, 147125005th base of human 3rd chromosome, 85419584th of 4th human chromosome A marker for predicting the risk of depression or suicide, whether or not methylation of the base, the 21524046th base of the human chromosome 6 or a combination thereof. 청구항 8에 있어서, 상기 마커는 인간의 11번째 염색체의 67806358번째 염기의 메틸화, 인간의 14번째 염색체의 102516597번째 염기의 비메틸화, 인간의 15번째 염색체의 37172017번째 염기의 비메틸화, 인간의 16번째 염색체의 14014009번째 염기의 메틸화, 인간의 16번째 염색체의 88636588번째 염기의 메틸화, 인간의 17번째 염색체의 73009364번째 염기의 비메틸화, 인간의 18번째 염색체의 77487338번째 염기의 비메틸화, 인간의 19번째 염색체의 40023259번째 염기의 메틸화, 인간의 2번째 염색체의 3423658번째 염기의 비메틸화, 인간의 2번째 염색체의 73052175번째 염기의 비메틸화, 인간의 20번째 염색체의 42163538번째 염기의 비메틸화, 인간의 20번째 염색체의 62460632번째 염기의 비메틸화, 인간의 3번째 염색체의 147125005번째 염기의 메틸화, 인간의 4번째 염색체의 85419584번째 염기의 메틸화, 인간의 6번째 염색체의 21524046번째 염기의 비메틸화 또는 이들의 조합인 것인, 우울증 또는 자살 위험 예측용 마커.The method according to claim 8, wherein the marker is the methylation of the 67806358th base of the 11th human chromosome, the unmethylation of the 102516597th base of the 14th human chromosome, the unmethylation of the 37172017th base of the 15th human chromosome, the 16th human Methylation of 14014009th base of chromosome, methylation of 88636588th base of human 16th chromosome, unmethylation of 73009364th base of human 17th chromosome, unmethylation of 77487338th base of human 18th chromosome, 19th human Methylation of 40023259th base of chromosome, 3423658th base of human 2nd chromosome, unmethylation of 73052175th base of human 2nd chromosome, unmethylation of 42163538th base of human 20th chromosome, human 20 Unmethylation of the 62460632th base of the chromosome, methylation of the 147125005th base of the 3rd human chromosome, methylation of the 85419584th base of the 4th human chromosome, unmethylation of the 21524046th base of the 6th human chromosome, or a combination thereof Is a marker for predicting the risk of depression or suicide. 하기 단계를 포함하는 개체의 우울증 또는 자살 위험을 예측하기 위한 정보를 제공하는 방법으로서,
개체의 생물학적 시료로부터 핵산 시료를 수득하는 단계; 및
수득된 핵산 시료로부터 우울증 또는 자살 위험 예측용 마커의 메틸화 여부를 분석하는 단계를 포함하고,
상기 마커는, 인간의 11번째 염색체의 67806358번째 염기, 인간의 14번째 염색체의 102516597번째 염기, 인간의 15번째 염색체의 37172017번째 염기, 인간의 16번째 염색체의 14014009번째 염기, 인간의 16번째 염색체의 88636588번째 염기, 인간의 17번째 염색체의 73009364번째 염기, 인간의 18번째 염색체의 77487338번째 염기, 인간의 19번째 염색체의 40023259번째 염기, 인간의 2번째 염색체의 3423658번째 염기, 인간의 2번째 염색체의 73052175번째 염기, 인간의 20번째 염색체의 42163538번째 염기, 인간의 20번째 염색체의 62460632번째 염기, 인간의 3번째 염색체의 147125005번째 염기, 인간의 4번째 염색체의 85419584번째 염기, 인간의 6번째 염색체의 21524046번째 염기 또는 이들의 조합인 방법.
A method of providing information for predicting the risk of depression or suicide in an individual comprising the following steps:
Obtaining a nucleic acid sample from an individual biological sample; And
Analyzing the methylation of the marker for predicting the risk of depression or suicide from the obtained nucleic acid sample,
The markers are 67806358th base of human 11th chromosome, 102516597th base of human 14th chromosome, 37172017th base of human 15th chromosome, 14014009th base of human 16th chromosome, 16th chromosome of human 88636588th base, 73009364th base of human 17th chromosome, 77487338th base of human 18th chromosome, 40023259th base of human 19th chromosome, 3423658th base of human 2nd chromosome, 2nd human chromosome 73052175th base, 42163538th base of human 20th chromosome, 62460632th base of human 20th chromosome, 147125005th base of human 3rd chromosome, 85419584th base of human 4th chromosome, human 6th chromosome The method which is the 21524046th base or a combination thereof.
컴퓨터에 의해 수행되는 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법에 있어서,
복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 메틸화 마커 데이터 및 RNA 발현 마커 데이터 중 적어도 하나, 및 우울증, 자살 기도 또는 자살 수행 여부 데이터를 획득하는 단계;
상기 메틸화 마커 데이터를 가공한 제1학습용 입력 데이터 및 상기 RNA 발현 마커 데이터를 가공한 제2학습용 입력 데이터 중 적어도 하나의 학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하는 단계;
상기 학습용 입력 데이터 및 학습용 출력 데이터를 상기 테스트 모델에 적용하여 우울증 또는 자살 위험 예측도를 산출하는 단계;
상기 복수의, 우울증을 갖는 개체, 자살 기도 개체 또는 자살 수행 개체의 우울증 또는 자살에 대한 심리사고 평가척도 데이터를 획득하는 단계;
상기 심리사고 평가척도 데이터와 메틸화 마커 데이터 및 RNA 발현 마커 데이터 중 적어도 하나 사이의 상관 계수를 산출하는 단계;
상기 예측도 및 상관 계수가 미리 정해진 기준값 이상인 메틸화 마커 및 상기 예측도 및 상관 계수가 미리 정해진 기준값 이상인 RNA 발현 마커 중 적어도 하나를 선별하는 단계;
상기 선별된 메틸화 마커 및 상기 선별된 RNA 발현 마커 중 적어도 하나를 학습용 입력 데이터로 하는 우울증 또는 자살 위험 예측용 모델을 생성하는 단계;를 포함하는, 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법.
A computer-aided method of predicting depression or suicide risk using machine learning,
Obtaining at least one of methylation marker data and RNA expression marker data of a plurality of individuals with depression, suicidal airway individuals or suicidal subjects, and whether depression, suicidal airways or suicide has been performed;
At least one learning input data of the first learning input data processing the methylation marker data and the second learning input data processing the RNA expression marker data, and learning output processing the depression, suicidal airway or suicide performance data. Generating a test model by machine learning the data;
Calculating the predicted risk of depression or suicide by applying the learning input data and the learning output data to the test model;
Acquiring psychological accident evaluation scale data for depression or suicide of the plurality of individuals having depression, suicidal airway individuals, or suicidal individuals;
Calculating a correlation coefficient between the psychological accident evaluation scale data and at least one of methylation marker data and RNA expression marker data;
Selecting at least one of a methylation marker having the predictive degree and correlation coefficient equal to or greater than a predetermined reference value, and an RNA expression marker having the predictive degree and correlation coefficient equal to or higher than a predetermined reference value;
A method of predicting depression or suicide risk using machine learning, comprising: generating a model for predicting depression or suicide risk using at least one of the selected methylation marker and the selected RNA expression marker as input data for learning.
삭제delete 청구항 11에 있어서,
상기 테스트 모델을 생성하는 단계는,
상기 메틸화 마커 데이터를 가공한 제1학습용 입력 데이터의 학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 생성하고,
상기 테스트 모델을 바탕으로, 상기 RNA 발현 마커 데이터를 가공한 제2학습용 입력 데이터, 및 상기 우울증, 자살 기도 또는 자살 수행 여부 데이터를 가공한 학습용 출력 데이터를 기계 학습시켜 테스트 모델을 갱신하는 단계를 포함하는, 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법.
The method according to claim 11,
Generating the test model,
A test model is generated by machine learning the learning input data of the first learning input data processed with the methylation marker data, and the learning output data processing the depression, suicidal airway or suicide performance data,
Based on the test model, updating the test model by machine learning the input data for the second learning processing the RNA expression marker data and the output data for processing the depression, suicidal airway or suicide performance data. How to predict depression or suicide risk using machine learning.
KR1020170157941A 2017-11-24 2017-11-24 Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk KR102124193B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170157941A KR102124193B1 (en) 2017-11-24 2017-11-24 Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170157941A KR102124193B1 (en) 2017-11-24 2017-11-24 Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk

Publications (2)

Publication Number Publication Date
KR20190060108A KR20190060108A (en) 2019-06-03
KR102124193B1 true KR102124193B1 (en) 2020-06-17

Family

ID=66849206

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170157941A KR102124193B1 (en) 2017-11-24 2017-11-24 Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk

Country Status (1)

Country Link
KR (1) KR102124193B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022534236A (en) * 2019-05-23 2022-07-28 ユニスト(ウルサン ナショナル インスティテュート オブ サイエンス アンド テクノロジー) A method for discovering a marker for predicting depression or suicide risk using multiple omics analysis, a marker for predicting depression or suicide risk, and a method for predicting depression or suicide risk using multiple omics analysis
KR102454498B1 (en) * 2020-02-07 2022-10-14 이진영 Pet loss syndrome prevention and overcoming support system
CN112185558A (en) * 2020-09-22 2021-01-05 珠海中科先进技术研究院有限公司 Mental health and rehabilitation evaluation method, device and medium based on deep learning

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160153044A1 (en) * 2013-07-11 2016-06-02 The Johns Hopkins University A dna methylation and genotype specific biomarker of suicide attempt and/or suicide ideation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160153044A1 (en) * 2013-07-11 2016-06-02 The Johns Hopkins University A dna methylation and genotype specific biomarker of suicide attempt and/or suicide ideation

Also Published As

Publication number Publication date
KR20190060108A (en) 2019-06-03

Similar Documents

Publication Publication Date Title
Fan et al. Characterizing transcriptional heterogeneity through pathway and gene set overdispersion analysis
CN112020565B (en) Quality control templates for ensuring the validity of sequencing-based assays
JP2022521791A (en) Systems and methods for using sequencing data for pathogen detection
EP3942556A1 (en) Systems and methods for deriving and optimizing classifiers from multiple datasets
US11514289B1 (en) Generating machine learning models using genetic data
KR102124193B1 (en) Method for screening makers for predicting depressive disorder or suicide risk using machine learning, markers for predicting depressive disorder or suicide risk, method for predicting depressive disorder or suicide risk
US20190287646A1 (en) Identifying copy number aberrations
CN115701286A (en) Systems and methods for detecting risk of alzheimer&#39;s disease using non-circulating mRNA profiling
US20200024663A1 (en) Method for detecting mood disorders
CN111540410B (en) System and method for predicting a smoking status of an individual
AU2019446735B2 (en) Method for discovering marker for predicting risk of depression or suicide using multi-omics analysis, marker for predicting risk of depression or suicide, and method for predicting risk of depression or suicide using multi-omics analysis
CA3158075A1 (en) Identification of host rna biomarkers of infection
Zhang et al. The Correlation‐Base‐Selection Algorithm for Diagnostic Schizophrenia Based on Blood‐Based Gene Expression Signatures
JP5307996B2 (en) Method, system and computer software program for identifying discriminant factor set
Warnat-Herresthal et al. Artificial intelligence in blood transcriptomics
CN112634983B (en) Pathogen species specific PCR primer optimization design method
CN116168761B (en) Method and device for determining characteristic region of nucleic acid sequence, electronic equipment and storage medium
US20230005569A1 (en) Chromosomal and Sub-Chromosomal Copy Number Variation Detection
WO2024062867A1 (en) Method for analyzing possibility of cancer developing in subject
US20240011105A1 (en) Analysis of microbial fragments in plasma
Diao et al. Modeling Species Specific Gene Expression Across Multiple Regions in the Brain
CN116904575A (en) Biomarker related to physical decline of silicosis patient and application thereof
CN118043670A (en) Random epigenomic sampling
CN116917495A (en) Cancer diagnosis and classification by non-human metagenomic pathway analysis
CN115662640A (en) Multi-source biological information fusion-based prognostic marker identification method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant