KR20200066578A - Deep learning based dementia prediction method - Google Patents

Deep learning based dementia prediction method Download PDF

Info

Publication number
KR20200066578A
KR20200066578A KR1020190157864A KR20190157864A KR20200066578A KR 20200066578 A KR20200066578 A KR 20200066578A KR 1020190157864 A KR1020190157864 A KR 1020190157864A KR 20190157864 A KR20190157864 A KR 20190157864A KR 20200066578 A KR20200066578 A KR 20200066578A
Authority
KR
South Korea
Prior art keywords
dementia
sequencing
sequence
viruses
microorganisms
Prior art date
Application number
KR1020190157864A
Other languages
Korean (ko)
Other versions
KR102410443B1 (en
Inventor
안광성
조성훈
권도혜
배은경
Original Assignee
주식회사 메타젠바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 메타젠바이오 filed Critical 주식회사 메타젠바이오
Publication of KR20200066578A publication Critical patent/KR20200066578A/en
Application granted granted Critical
Publication of KR102410443B1 publication Critical patent/KR102410443B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Disclosed is a deep learning based dementia prediction method. The deep learning based dementia prediction method, according to an embodiment of the present invention, includes the steps of: receiving a genomic information of at least one of the microorganisms and viruses contained in the bacterial flora distributed in the gut of the dementia patient; sequencing the genomic information to obtain sequencing information constituting the DNA chains of the microorganisms and viruses; forming microorganisms and viruses having similar sequencing information into one cluster; classifying the clustered species into lineages to generate a distribution of the bacterial flora in the gut of the dementia patient in a virtual three-dimensional space; and determining whether the general user has dementia by determining the similarity between the distribution of the intestinal bacterial flora and the general user′s intestinal flora.

Description

딥러닝 기반 치매 예측 방법{DEEP LEARNING BASED DEMENTIA PREDICTION METHOD}DEEP LEARNING BASED DEMENTIA PREDICTION METHOD}

본 발명은 딥러닝 기반 치매 예측 방법에 관한 것으로, 보다 상세하게는 치매 환자의 장내 세균총 분포 정보를 이용하여 사용자의 치매 발생 여부를 진단할 수 있는 딥러닝 기반 치매 예측 방법에 관한 것이다.The present invention relates to a method for predicting dementia based on deep learning, and more particularly, to a method for predicting dementia based on deep learning that can diagnose whether a user has dementia using the distribution information of the gut bacteria in a patient with dementia.

치매(Dementia)의 치료를 위한 연구는 20년 넘게 전 세계적으로 수행되었지만, 아직 완전한 치료 방법이 없는 상황이다.Research on the treatment of Dementia has been conducted worldwide for over 20 years, but there is no complete treatment.

특히, 초기 치매 환자는 기억력 저하 등을 제외하면 증상이 명확하지 않아 진단의 어려움이 있다. 따라서, 치매 발생 여부를 정확하게 진단하기 위해서는 전문가의 평가 또는 고가의 특수 검사 등을 필요로 한다.In particular, patients with initial dementia have difficulty in diagnosis because symptoms are not clear except for memory loss. Therefore, in order to accurately diagnose the occurrence of dementia, expert evaluation or expensive special examination is required.

치매 발생을 초기 단계 또는 사전에 진단할 수 있게 되면 환자의 치료와 요양에 소요되는 비용을 절감할 수 있게 되는바 이를 사전에 예측하고 진단하기 위한 기술 개발 노력이 이루어지고 있다.If the diagnosis of dementia can be diagnosed at an early stage or in advance, it is possible to reduce the cost of treatment and medical care for patients. Technology development efforts have been made to predict and diagnose this in advance.

한편, 다양한 질병의 원인 및 진행은 장내 세균과 관련성이 있다고 보고되고 있으며 특히 치매, 대장암을 포함한 다양한 질환에 관련이 있는 것으로 보고되고 있다.On the other hand, the cause and progress of various diseases are reported to be related to bacteria in the intestine, and in particular, it is reported to be related to various diseases including dementia and colorectal cancer.

이에, 치매 환자의 장내 세균총 분포를 이용하여 치매 발생 여부를 사전에 예측하고 진단할 수 있는 딥러닝 기반의 치매 예측 방법의 필요성이 대두되었다.Accordingly, there is a need for a deep learning-based dementia prediction method capable of predicting and diagnosing dementia in advance using the distribution of gut flora in patients with dementia.

본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 사용자의 장내 세균총 분포 데이터를 이용하여 그 사용자의 치매 발생 여부를 사전에 예측할 수 있는 딥러닝 기반의 치매 예측 방법을 제공하는데 있다.The present invention has been devised to solve the above-mentioned problems, and an object of the present invention is to provide a method for predicting dementia based on deep learning that can predict whether or not the user has dementia in advance by using distribution data of a user's gut flora. have.

본 발명의 또 다른 목적은 사용자가 응답한 질의 내용, 혈액 검사 정보를 이용하여 치매의 발생을 예측하고 사전에 진달할 수 있는 딥러닝 기반의 치매 예층 방법을 제공하는데 있다.Another object of the present invention is to provide a deep learning-based dementia prediction method capable of predicting the advancement of dementia and progressing in advance by using query content and blood test information answered by a user.

상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따른 딥러닝 기반 치매 예측 방법은, 치매 환자의 장내에 분포하는 세균총에 포함된 미생물, 바이러스 중 적어도 하나의 유전체 정보를 수신하는 단계, 상기 유전체 정보를 시퀀싱하여 상기 미생물, 바이러스들의 DNA 사슬을 구성하는 염기 서열 순서 정보를 획득하는 단계, 상기 염기 서열 순서 정보가 유사한 미생물, 바이러스들을 하나의 군집으로 형성하는 단계, 상기 군집화한 종을 계통별로 분류하여 치매 환자의 장내 세균총 분포도를 가상의 3차원 공간상에 생성하는 단계 및 상기 치매 환자의 장내 세균총 분포도와 일반 사용자의 장내 세균총 분포도의 유사도를 판단하여 상기 일반 사용자의 치매 발생 여부를 예측하는 단계를 포함하는 딥러닝 기반 치매 예측 방법.In order to achieve the above object, a method for predicting dementia based on deep learning according to an embodiment of the present invention includes receiving genomic information of at least one of microorganisms and viruses contained in a bacterial flora distributed in the gut of a patient with dementia, the genome Sequencing information to obtain sequencing information constituting the DNA chain of the microorganisms and viruses, forming microorganisms and viruses having similar sequencing information into one cluster, and classifying the clustered species into lineages Generating a distribution of intestinal microflora in a virtual three-dimensional space by determining the similarity between the intestinal microflora distribution of the dementia patient and an intestinal microflora distribution of the general user to predict whether the general user has dementia. Including deep learning-based dementia prediction method.

본 발명의 일 실시예에 따르면, 상기 염기 서열 순서 정보를 획득하는 단계는, 상기 미생물, 바이러스들에 포함된 16S rRNA의 염기 서열 순서 정보를 획득하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of obtaining the sequence information may include obtaining the sequence information of the sequence of the 16S rRNA contained in the microorganisms and viruses.

본 발명의 일 실시예에 따르면, 상기 염기 서열 순서 정보가 유사한 미생물, 바이러스들을 하나의 군집으로 형성하는 단계는, 제1 염기 서열 순서와 제2 염기 서열 순서를 가로 방향 및 세로 방향으로 나열하는 단계; 염기가 동일한 위치에 임의의 식별자를 부가하는 단계; 상기 임의의 식별자의 연속된 길이가 기 설정된 기준값을 초과하는 부분만을 선정하는 단계 및 상기 선정된 부분을 상호 연결하여 상기 제1 염기 서열 순서 및 제2 염기 서열 순서의 시작점에서 제1 염기 서열 순서 및 제2 염기 서열 순서의 종료점까지의 최단 거리를 탐색하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of forming microorganisms and viruses having similar sequencing information into a single cluster includes arranging the first sequencing sequence and the second sequencing sequence in the horizontal and vertical directions. ; Adding an arbitrary identifier at the same base position; Selecting only a portion in which the continuous length of the arbitrary identifier exceeds a predetermined reference value, and interconnecting the selected portions to obtain a first sequence sequence and a first sequence sequence at a starting point of the first sequence sequence and the second sequence sequence; And searching for the shortest distance to the end point of the second sequencing sequence.

본 발명의 일 실시예에 따르면, 상기 제1 염기 서열 순서 및 제2 염기 서열 순서의 시작점에서 제1 염기 서열 순서 및 제2 염기 서열 순서의 종료점까지의 최단 거리를 상기 제1 염기 서열 순서와 상기 제2 염기 서열 순서의 유사도로 결정하는 단계를 더 포함할 수 있다.According to an embodiment of the present invention, the shortest distance from the starting point of the first sequencing sequence and the second sequencing sequence to the end point of the first sequencing sequence and the second sequencing sequence is the first sequencing sequence and the And determining the similarity of the second sequence sequence.

본 발명의 일 실시예에 따르면, 상기 군집화한 종을 계통별로 분류하여 치매 환자의 장내 세균총 분포도를 가상의 3차원 공간상에 생성하는 단계는, 상기 군집의 특성과 관련한 인자들의 값을 축으로 하여 가상의 3차원 공간을 생성하는 단계; 상기 가상의 3차원 공간에 상호 유사한 미생물이나 바이러스의 군집을 플롯으로 표시하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of generating the distribution of the bacterial flora in the gut of the dementia patient in a virtual three-dimensional space by classifying the clustered species into a lineage is based on the values of factors related to the characteristics of the cluster. Creating a virtual three-dimensional space; And displaying a cluster of microorganisms or viruses similar to each other in a plot in the virtual three-dimensional space.

본 발명의 일 실시예에 따르면, 상기 군집의 특성과 관련한 인자들의 값을 축으로 하여 가상의 3차원 공간을 생성하는 단계는, 계통분류에서 특정 종 또는 속의 비율, 특정 미생물총의 비율, 특징 미생물군 유전체의 비율값을 축으로 하여 가상의 3차원 공간을 생성하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of generating a virtual three-dimensional space on the axis of the values of factors related to the characteristics of the cluster is a ratio of a specific species or genus, a ratio of a specific microflora, a characteristic microorganism It may include the step of generating a virtual three-dimensional space using the ratio value of the group dielectric as an axis.

상술한 딥러닝 기반 치매 예측 방법에 따르면, 전문가의 평가 또는 고가의 특수 검사를 수행하지 않더라도 치매 발생 여부를 사전에 예측하거나 진단할 수 있게 된다는 효과를 달성할 수 있다.According to the above-described deep learning-based dementia prediction method, it is possible to achieve the effect of predicting or diagnosing dementia in advance even without performing expert evaluation or expensive special examination.

도 1은 본 발명의 일 실시예에 따른 딥러닝 기반 치매 예측 방법을 설명하기 위한 흐름도이다.
도 2 도 5는 본 발명의 일 실시예에 따라 세균총에 포함된 미생물이나 바이러스들의 유사도를 판단하는 과정을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따라 가상의 3차원 공간상에 생성된 치매 환자의 장내 세균총 분포도를 설명하기 위한 도면이다.
1 is a flowchart illustrating a deep learning-based dementia prediction method according to an embodiment of the present invention.
2 is a view for explaining a process for determining the similarity of microorganisms or viruses contained in a bacterial group according to an embodiment of the present invention.
6 is a view for explaining the distribution of bacterial flora in the gut of dementia patients generated in a virtual three-dimensional space according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. Advantages and features of the present invention, and methods for achieving them will be clarified with reference to embodiments described below in detail together with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various different forms, and only the embodiments allow the publication of the present invention to be complete, and common knowledge in the technical field to which the present invention pertains It is provided to completely inform the person having the scope of the invention, and the present invention is only defined by the scope of the claims. The same reference numerals refer to the same components throughout the specification.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in the present specification may be used as meanings commonly understood by those skilled in the art to which the present invention pertains. In addition, terms defined in the commonly used dictionary are not ideally or excessively interpreted unless specifically defined.

또한, 본 명세서에서 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함될 수 있다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.Further, in the present specification, the singular form may also include a plural form unless otherwise specified in the phrase. As used herein, "comprises" and/or "comprising" refers to the elements, steps, operations and/or elements mentioned above, the presence of one or more other components, steps, operations and/or elements. Or do not exclude additions.

도 1은 본 발명의 일 실시예에 따른 딥러닝 기반 치매 예측 방법을 설명하기 위한 흐름도이다.1 is a flowchart illustrating a deep learning-based dementia prediction method according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 딥러닝 기반 치매 예측 방법은 치매 예측 프로그램이 설치된 단말 장치에서 수행될 수 있다.The deep learning-based dementia prediction method according to an embodiment of the present invention may be performed in a terminal device in which a dementia prediction program is installed.

사용자의 치매 발생 여부를 예측하기 위해, 먼저 치매 환자의 장내에 분포하는 세균총에 포함된 미생물, 바이러스 중 적어도 하나의 유전체 정보를 수신한다(S110).In order to predict whether a user has dementia, first, genomic information of at least one of microorganisms and viruses included in the bacterial flora distributed in the gut of the dementia patient is received (S110).

세균총(bacterial flora)는 일정 장소에서 상호 균형을 유지하며 공존하는 미생물이나 바이러스, 박테리아 등의 집단을 의미한다. 예를 들어, 인간의 피부, 점막, 장관 등과 같이 외계와 통하고 있는 부분에 상주하는 수종의 비병원균을 의미한다.Bacterial flora refers to a group of microorganisms, viruses, and bacteria that coexist with each other in a certain place. For example, it means a species of non-pathogen that resides in a part that communicates with the outside world, such as human skin, mucous membranes, and intestines.

또한, 세균총에 포함된 미생물, 바이러스 들의 유전체 정보는 범용적인 방법으로 추출된 미생물, 바이러스들의 DNA 정보를 의미한다.In addition, the genomic information of microorganisms and viruses included in the bacterial flora means DNA information of microorganisms and viruses extracted by a general-purpose method.

이후, 유전체 정보를 시퀀싱하여 세균총에 포함된 미생물, 바이러스들의 DNA 사슬을 구성하는 염기 서열 순서 정보를 획득한다 (S120).Subsequently, sequencing of the genomic information is obtained to obtain sequencing information constituting the DNA chain of microorganisms and viruses included in the bacterial group (S120).

시퀀싱이란 DNA 사슬을 구성하는 염기 A, G, C, T가 결합된 서열 순서를 분석하는 것을 의미한다Sequencing means analyzing the sequence sequence in which bases A, G, C, and T constituting a DNA chain are linked.

상술한 세균총에 포함된 미생물, 바이러스, 박테라이 등의 염기 서열 순서 정보는 전체 염색체 DNA에 대한 PFGE(Pulsed Field Gel Electrophoresis),Southern blotting 과 RELP(Restriction Fragment Length Polymorphism), PCR-based locus specific RELP, REP(Repetitibe Extragenic Palindromic) PCR, CELP(Cleavase Fragment Length Polymorphism) 및 염기서열 분석(DNA Sequencing) 중 하나의 방법으로 획득될 수 있다.The sequencing sequence information of microorganisms, viruses, bacteri, etc. included in the above-described bacterial flora includes PFGE (Pulsed Field Gel Electrophoresis), Southern blotting and Restriction Fragment Length Polymorphism (RELP), PCR-based locus specific RELP, for all chromosomal DNA. It can be obtained by one of REP (Repetitibe Extragenic Palindromic) PCR, Cleavase Fragment Length Polymorphism (CELP), and DNA sequencing.

염기 서열 순서 정보가 획득되면, 염기 서열 순서 정보가 유사한 미생물, 바이러스들을 하나의 군집으로 형성한다(S130).When sequencing information is obtained, microorganisms and viruses having similar sequencing information are formed into a single cluster (S130).

S120 단계에서 획득된 염기 서열 순서 정보는 각각의 미생물, 바이러스들의 16S rRNA의 염기 서열 순서 정보일 수 있다.The sequencing information obtained in step S120 may be sequencing information of 16S rRNA of each microorganism and virus.

16S rRNA는 단백질 합성에 핵심적인 역할을 하는 리보좀 유전자로 종과 속간의 분화에 따른 다형성 지역이 있어서 특정 분류군에만 존재하는 염기 서열을 가지고 있다.16S rRNA is a ribosomal gene that plays a key role in protein synthesis. It has a polymorphic region according to differentiation between species and genus, and thus has a nucleotide sequence only in a specific taxonomic group.

동시에 이 유전자는 생명현상 유지에 필수적인 이차구조를 가지는 서열 부위가 있어 대부분의 생명체에 공통적으로 보존되어 있다. 따라서, 16S rRNA의 염기 서열 순서 정보를 이용하면 세균총에 포함된 미생물이나 바이러스 등을 계통적으로 분류할 수 있게 된다.At the same time, this gene has a sequence region with a secondary structure essential for the maintenance of life phenomena and is conserved in common in most living things. Therefore, by using the sequence information of the nucleotide sequence of the 16S rRNA, it is possible to systematically classify microorganisms or viruses included in the bacterial flora.

16S rRNA의 염기 서열 순서 정보를 이용하여 유사한 미생물, 바이러스들을 하나의 군집으로 형성하는 과정은 도 2에서 상세하게 설명하도록 한다.The process of forming similar microorganisms and viruses into a single cluster using the sequence information of the sequence of the 16S rRNA will be described in detail in FIG. 2.

이후, 군집화한 종을 계통별로 분류하여 치매 환자의 장내 세균총 분포도를 가상의 3차원 공간상에 생성한다(S140).Subsequently, the clustered species are classified by lineage to generate a distribution map of the intestinal microflora of a patient with dementia in a virtual three-dimensional space (S140).

3차원 공간상에 표시되는 플롯(plot)들은 상호 유사한 미생물 및 바이러스의 군집을 의미한다. 또한, 서로 유사한 플롯들은 가상의 3차원 공간상에 인접하게 표시되는바 군집들의 관계성을 시각화된 정보로 확인할 수 있다.Plots displayed on the three-dimensional space mean a community of microbes and viruses that are similar to each other. In addition, since similar plots are displayed adjacent to each other in a virtual three-dimensional space, the relationship between clusters can be confirmed by visualized information.

치매 환자의 장내 세균총 분포도가 완성되면 일반 사용자의 장내 세균총 분포도와 유사도를 판단하여, 상기 일반 사용자의 치매 발생 여부를 예측한다(S150).When the distribution of the bacterial flora in the intestine of the dementia patient is completed, the distribution and similarity of the bacterial flora in the intestine of the general user are determined to predict whether the general user has dementia (S150).

구체적으로, 다수의 치매 환자들의 장내 세균총 분포도에 대한 데이터를 학습시켜 치매 환자의 장내 세균총 분포도의 특징점을 도출하고, 일반 사용자의 장내 세균총 분포도에 상술한 특징점이 존재하는지 여부를 판단하여 치매 발생 여부를 사전에 예측할 수 있다.Specifically, by learning the data on the distribution of the bacterial flora in the gut of a number of dementia patients, deriving the characteristic points of the distribution of the bacterial flora in the dementia patient, and determining whether or not the dementia occurs by determining whether the above-described feature points exist in the general bacterial flora distribution It can be predicted in advance.

이하에서는, 딥러닝 기반 치매 예측 방법의 각 단계들을 상세히 설명하도록 한다.Hereinafter, each step of the deep learning based dementia prediction method will be described in detail.

도 2 도 5는 본 발명의 일 실시예에 따라 세균총에 포함된 미생물이나 바이러스들의 유사도를 판단하는 과정을 설명하기 위한 도면이다.2 is a view for explaining a process for determining the similarity of microorganisms or viruses contained in a bacterial group according to an embodiment of the present invention.

상술한 바와 같이, 본 발명의 일 실시예에 따른 딥러닝 기반 치매 예측 방법은 세균총에 포함된 미생물, 바이러스들의 DNA 사슬을 구성하는 염기 서열 순서 정보를 획득하고, 그 염기 서열 순서 정보가 유사한 미생물, 바이러스들을 하나의 군집으로 형성한다.As described above, the method for predicting dementia based on deep learning according to an embodiment of the present invention obtains sequencing information constituting the DNA chain of microorganisms and viruses included in the bacterial flora, and microorganisms having similar sequencing information. Viruses form a cluster.

염기 서열 순서 정보가 서로 유사한 미생물, 바이러스들을 선정하기 위해 먼저, 임의의 염기 서열 순서 정보를 가로 방향 및 세로 방향으로 나열한다.In order to select microorganisms and viruses having similar sequencing information to each other, first, arbitrary sequencing information is listed in the horizontal and vertical directions.

예를 들어, 도 2에 도시된 바와 같이 임의의 제1 미생물의 염기 서열 순서인 제1 염기 서열 순서(210)를 가로 방향으로 나열하고, 임의의 제2 미생물의 염기 서열 순서인 제2 염기 서열 순서(220)를 세로 방향으로 나열한다.For example, as shown in FIG. 2, the first sequencing sequence 210, which is the sequencing sequence of any first microorganism, is arranged in the horizontal direction, and the second nucleotide sequence is the sequencing sequence of any second microorganism. The sequence 220 is listed in the vertical direction.

이후, 염기 서열 순서 정보를 구성하는 염기가 동일한 위치에 임의의 식별자를 부가한다. 예를 들어, 제1 염기 서열 순서(210)와 제2 염기 서열 순서(220)의 첫번째 염기가 동일하므로 해당 위치에 임의의 식별자인 "0"을 부가한다.Thereafter, an arbitrary identifier is added at the same position as the base constituting the sequence information of the sequencing. For example, since the first base of the first sequencing sequence 210 and the second sequencing sequence 220 is identical, an arbitrary identifier "0" is added to the corresponding position.

마찬가지로, 제1 염기 서열 순서(210)의 두번째 염기와 제2 염기 서열 순서(220)의 세번째 염기가 동일하므로 해당 위치에 임의의 식별자인 "0"을 부가한다.Similarly, since the second base of the first base sequence sequence 210 and the third base of the second base sequence sequence 220 are the same, an arbitrary identifier "0" is added to the corresponding position.

상술한 과정을 비교 대상인 염기 서열 순서들 전체에 대해 수행하고, 임의의 식별자가 연속하여 부가된 부분을 연결하면, 도 3에 도시된 바와 같은 결과물을 얻을 수 있다.When the above-described process is performed for all of the sequences of the base sequences to be compared, and a portion in which an arbitrary identifier is continuously added is connected, a result as shown in FIG. 3 can be obtained.

이후, 임의의 식별자가 연속하게 부가된 부분 중, 연속된 길이가 기 설정된 기준값을 초과하는 부분만을 선정한다. 식별자가 소정의 길이 이상만큼 연속하여 부가된 부분을 선정하면 도 4에 도시된 바와 같은 결과물을 얻을 수 있다.Thereafter, among the parts to which an arbitrary identifier is continuously added, only those parts in which the continuous length exceeds a preset reference value are selected. When a portion in which the identifier is continuously added by a predetermined length or more is selected, a result as shown in FIG. 4 can be obtained.

제1 염기 서열 순서(210) 및 제2 염기 서열 순서(220)의 시작점에서 종료점까지의 최단 경로를 탐색하기 위해, 도 4에서 선정된 부분을 상호 연결한다.In order to search for the shortest paths from the starting point to the ending point of the first sequencing sequence 210 and the second sequencing sequence 220, the portions selected in FIG. 4 are interconnected.

도 5에는 도 4에서 선정된 부분을 연결한 최단 경로가 도시되어 있다. 도 5에 도시된 제1 염기 서열 순서(210) 및 제2 염기 서열 순서(220)의 최단 경로의 길이가 제1 미생물과 제2 미생물의 유사도를 의미한다.5 shows the shortest path connecting the parts selected in FIG. 4. The lengths of the shortest paths of the first sequencing sequence 210 and the second sequencing sequence 220 illustrated in FIG. 5 indicate similarities between the first microorganism and the second microorganism.

도 2 내지 도 5에서 설명한 과정을 치매 환자의 장내 세균총에 포함된 모든 미생물, 바이러스들에 대해 수행하면 장내 세균총에 포함된 미생물, 바이러스들의 상호 유사도를 판단할 수 있게 된다.When the processes described in FIGS. 2 to 5 are performed on all microorganisms and viruses included in the intestinal microflora of the dementia patient, it is possible to determine the mutual similarity between the microorganisms and viruses contained in the intestinal microflora.

이후, 유사도가 기 설정된 기준값을 초과하는 미생물이나 바이러스들을 하나의 군집으로 형성하는 것이다.Thereafter, microorganisms or viruses having similarity exceeding a predetermined reference value are formed as a cluster.

도 6은 본 발명의 일 실시예에 따라 가상의 3차원 공간상에 생성된 치매 환자의 장내 세균총 분포도를 설명하기 위한 도면이다.6 is a view for explaining the distribution of bacterial flora in the gut of dementia patients generated in a virtual three-dimensional space according to an embodiment of the present invention.

상술한 바와 같이, 장내 세균총 분포도에 표시된 하나의 픗롯들은 상호 유사한 미생물이나 바이러스의 군집을 의미한다. 또한, 가상의 3차원 공간상에서 각 플롯들의 거리는 플롯에 포함된 군집 상호간의 유사도를 의미한다.As described above, the single plots indicated in the intestinal microflora distribution chart refer to a community of microorganisms or viruses similar to each other. In addition, the distance of each plot in the virtual three-dimensional space means similarity between clusters included in the plot.

즉, 서로 유사한 군집들은 3차원 공간상에서 인접하게 위치하게 된다. 반면, 그 특성이 서로 상이한 군집들은 3차원 공간상에서 원거리에 위치하게 된다.That is, clusters that are similar to each other are located adjacently in a three-dimensional space. On the other hand, clusters with different characteristics are located at a long distance in 3D space.

가상의 3차원 공간을 구성하는 각 축은 군집의 특성과 관련한 인자들의 값이며 축에 적용되는 인자를 달리 적용하면 각 플롯의 위치가 달라질 수도 있다.Each axis constituting a virtual three-dimensional space is a value of factors related to the characteristics of the cluster, and if the factors applied to the axis are applied differently, the position of each plot may be different.

예를 들어, 군집의 특성과 관련한 인자는 계통분류에서 특정 종 또는 속의 비율, 특정 미생물총의 비율, 특징 미생물군 유전체의 비율일 수 있다.For example, factors related to the characteristics of a community may be a ratio of a specific species or genus in a phylogenetic classification, a ratio of a specific microflora, and a ratio of a characteristic microbial genome.

본 발명의 일 실시예에 따른 딥러닝 기반 치매 예측 방법은, 복수의 치매 환자들에 대한 장내 세균총 분포도를 학습하여 치매 환자에서만 나타나는 분포도의 특성을 산출한다.The method for predicting dementia based on deep learning according to an embodiment of the present invention calculates characteristics of a distribution that appears only in patients with dementia by learning the distribution of intestinal microflora for a plurality of patients with dementia.

예를 들어, 분포도의 특성은 3차원 공간상에서의 특정 플롯의 절대적 위치, 다른 플롯과의 관계에서 나타나는 상대적 위치, 틀정 플롯에 포함된 미생물이나 바이러스들의 종류들에 대한 정보 중 어느 하나일 수 있다.For example, the characteristics of the distribution chart may be any one of information on the absolute position of a specific plot in 3D space, the relative position in relation to other plots, and the types of microorganisms or viruses included in the false plot.

이후, 일반 사용자의 장내 세균총 분포도 정보가 수신되면 기존에 학습된 치매 환자의 장내 세균총 분포도와 유사도를 판단하여 그 결과에 따라 일반 사용자의 치매 발생 여부를 예측한다.Subsequently, when the distribution information of the general user's gut flora is received, the degree of similarity and distribution of the flora in the gut of the previously demented patient is determined to predict whether or not the general user has dementia.

상술한 딥러닝 기반 치매 예측 방법에 따르면, 전문가의 평가 또는 고가의 특수 검사를 수행하지 않더라도 치매 발생 여부를 사전에 예측하거나 진단할 수 있게 된다는 효과를 달성할 수 있다.According to the above-described deep learning-based dementia prediction method, it is possible to achieve the effect of predicting or diagnosing dementia in advance even without performing expert evaluation or expensive special examination.

본 실시예와 관련된 기술 분야에서 통상의 지식을 가진 자는 상기된 기재의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 방법들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.Those of ordinary skill in the art related to the present embodiment will understand that it may be implemented in a modified form without departing from the essential characteristics of the above-described substrate. Therefore, the disclosed methods should be considered in terms of explanation, not limitation. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the equivalent range should be interpreted as being included in the present invention.

Claims (6)

치매 환자의 장내에 분포하는 세균총에 포함된 미생물, 바이러스 중 적어도 하나의 유전체 정보를 수신하는 단계;
상기 유전체 정보를 시퀀싱하여 상기 미생물, 바이러스들의 DNA 사슬을 구성하는 염기 서열 순서 정보를 획득하는 단계;
상기 염기 서열 순서 정보가 유사한 미생물, 바이러스들을 하나의 군집으로 형성하는 단계;
상기 군집화한 종을 계통별로 분류하여 치매 환자의 장내 세균총 분포도를 가상의 3차원 공간상에 생성하는 단계; 및
상기 치매 환자의 장내 세균총 분포도와 일반 사용자의 장내 세균총 분포도의 유사도를 판단하여 상기 일반 사용자의 치매 발생 여부를 예측하는 단계를 포함하는 딥러닝 기반 치매 예측 방법.
Receiving genomic information of at least one of microorganisms and viruses included in a bacterial flora distributed in the intestine of a patient with dementia;
Sequencing the genomic information to obtain sequencing information constituting the DNA chains of the microorganisms and viruses;
Forming microorganisms and viruses having similar sequencing information into one cluster;
Classifying the clustered species into lineages to generate a distribution map of the intestinal microflora of a patient with dementia in a virtual three-dimensional space; And
A method for predicting dementia based on deep learning, comprising determining the similarity between the intestinal microflora distribution of the dementia patient and the general user's intestinal microflora distribution.
제1항에 있어서,
상기 염기 서열 순서 정보를 획득하는 단계는,
상기 미생물, 바이러스들에 포함된 16S rRNA의 염기 서열 순서 정보를 획득하는 단계를 포함하는 딥러닝 기반 치매 예측 방법.
According to claim 1,
The step of obtaining the sequence information of the sequence,
A method for predicting dementia based on deep learning, comprising obtaining sequencing information of 16S rRNA contained in the microorganisms and viruses.
제1항에 있어서,
상기 염기 서열 순서 정보가 유사한 미생물, 바이러스들을 하나의 군집으로 형성하는 단계는,
제1 염기 서열 순서와 제2 염기 서열 순서를 가로 방향 및 세로 방향으로 나열하는 단계;
염기가 동일한 위치에 임의의 식별자를 부가하는 단계;
상기 임의의 식별자의 연속된 길이가 기 설정된 기준값을 초과하는 부분만을 선정하는 단계; 및
상기 선정된 부분을 상호 연결하여 상기 제1 염기 서열 순서 및 제2 염기 서열 순서의 시작점에서 제1 염기 서열 순서 및 제2 염기 서열 순서의 종료점까지의 최단 거리를 탐색하는 단계를 포함하는 딥러닝 기반 치매 예측 방법.
According to claim 1,
The step of forming microorganisms and viruses having similar sequencing information into one cluster may include:
Arranging the first nucleotide sequence and the second nucleotide sequence in the horizontal and vertical directions;
Adding an arbitrary identifier at the same base position;
Selecting only a portion in which the continuous length of the arbitrary identifier exceeds a preset reference value; And
Deep learning based comprising the step of searching the shortest distance from the starting point of the first sequencing sequence and the second sequencing sequence to the end point of the first sequencing sequence and the second sequencing sequence by interconnecting the selected parts Dementia prediction method.
제3항에 있어서,
상기 제1 염기 서열 순서 및 제2 염기 서열 순서의 시작점에서 제1 염기 서열 순서 및 제2 염기 서열 순서의 종료점까지의 최단 거리를 상기 제1 염기 서열 순서와 상기 제2 염기 서열 순서의 유사도로 결정하는 단계를 더 포함하는 딥러닝 기반 치매 예측 방법.
According to claim 3,
The shortest distance from the starting point of the first sequencing sequence and the second sequencing sequence to the end point of the first sequencing sequence and the second sequencing sequence is determined by the similarity between the first sequencing sequence and the second sequencing sequence. Deep learning based dementia prediction method further comprising the step of.
제1항에 있어서,
상기 군집화한 종을 계통별로 분류하여 치매 환자의 장내 세균총 분포도를 가상의 3차원 공간상에 생성하는 단계는,
상기 군집의 특성과 관련한 인자들의 값을 축으로 하여 가상의 3차원 공간을 생성하는 단계;
상기 가상의 3차원 공간에 상호 유사한 미생물이나 바이러스의 군집을 플롯으로 표시하는 단계를 포함하는 딥러닝 기반 치매 예측 방법.
According to claim 1,
The step of generating the distribution of the bacterial flora in the gut of the dementia patient in a virtual three-dimensional space by classifying the clustered species into lines,
Generating a virtual three-dimensional space based on values of factors related to the characteristics of the cluster;
A method of predicting dementia based on deep learning, comprising plotting a cluster of microorganisms or viruses similar to each other in the virtual three-dimensional space.
제5항에 있어서,
상기 군집의 특성과 관련한 인자들의 값을 축으로 하여 가상의 3차원 공간을 생성하는 단계는,
계통분류에서 특정 종 또는 속의 비율, 특정 미생물총의 비율, 특징 미생물군 유전체의 비율값을 축으로 하여 가상의 3차원 공간을 생성하는 단계를 포함하는 딥러닝 기반 치매 예측 방법.
The method of claim 5,
The step of generating a virtual three-dimensional space based on the values of factors related to the characteristics of the cluster as an axis,
A method for predicting dementia based on deep learning, comprising generating a virtual three-dimensional space based on a ratio of a specific species or genus, a ratio of a specific microflora, and a ratio of a characteristic microbial group genome in the system classification.
KR1020190157864A 2018-12-01 2019-12-01 Deep learning based dementia prediction method KR102410443B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180153200 2018-12-01
KR20180153200 2018-12-01

Publications (2)

Publication Number Publication Date
KR20200066578A true KR20200066578A (en) 2020-06-10
KR102410443B1 KR102410443B1 (en) 2022-06-17

Family

ID=71087283

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190157864A KR102410443B1 (en) 2018-12-01 2019-12-01 Deep learning based dementia prediction method

Country Status (1)

Country Link
KR (1) KR102410443B1 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102394331B1 (en) 2021-08-09 2022-05-10 주식회사 이모코그 Method for establishing training program of MCI patients and system thereof
KR20220091667A (en) 2020-12-23 2022-07-01 동의대학교 산학협력단 Method of learning medical image for dementia decision
KR20220097739A (en) 2020-12-31 2022-07-08 광운대학교 산학협력단 Dementia predicting ai controlling system using brain wave analysis, controlling method by the same, controlling server for the same and customized service providing method for old man
KR20230068256A (en) 2021-11-10 2023-05-17 주식회사 이모코그 Method for establishing training program of MCI patients and system thereof
US11699512B2 (en) 2021-08-09 2023-07-11 EMOCOG Co., Ltd. Method and system for constructing training program for improving symptoms of mild cognitive impairment patient
CN116805514A (en) * 2023-08-25 2023-09-26 鲁东大学 DNA sequence function prediction method based on deep learning
KR102621001B1 (en) 2022-08-09 2024-01-08 주식회사 이모코그 Method for implementing an application for MCI patients and apparatus thereof
KR20240028910A (en) 2022-08-25 2024-03-05 주식회사 이모코그 Method for controlling application of cognitive function training and apparatus thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4222835B2 (en) * 2001-03-14 2009-02-12 株式会社Dnaチップ研究所 Cancer prediction methods
KR20180098153A (en) * 2017-02-24 2018-09-03 주식회사 엠디헬스케어 Method for diagnosis of Parkinson's disease using analysis of bacteria metagenome
KR101950395B1 (en) * 2017-09-25 2019-02-20 (주)신테카바이오 Method for deep learning-based biomarker discovery with conversion data of genome sequences

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4222835B2 (en) * 2001-03-14 2009-02-12 株式会社Dnaチップ研究所 Cancer prediction methods
KR20180098153A (en) * 2017-02-24 2018-09-03 주식회사 엠디헬스케어 Method for diagnosis of Parkinson's disease using analysis of bacteria metagenome
KR101950395B1 (en) * 2017-09-25 2019-02-20 (주)신테카바이오 Method for deep learning-based biomarker discovery with conversion data of genome sequences

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220091667A (en) 2020-12-23 2022-07-01 동의대학교 산학협력단 Method of learning medical image for dementia decision
KR20220097739A (en) 2020-12-31 2022-07-08 광운대학교 산학협력단 Dementia predicting ai controlling system using brain wave analysis, controlling method by the same, controlling server for the same and customized service providing method for old man
KR102394331B1 (en) 2021-08-09 2022-05-10 주식회사 이모코그 Method for establishing training program of MCI patients and system thereof
US11699512B2 (en) 2021-08-09 2023-07-11 EMOCOG Co., Ltd. Method and system for constructing training program for improving symptoms of mild cognitive impairment patient
KR20230068256A (en) 2021-11-10 2023-05-17 주식회사 이모코그 Method for establishing training program of MCI patients and system thereof
KR102621001B1 (en) 2022-08-09 2024-01-08 주식회사 이모코그 Method for implementing an application for MCI patients and apparatus thereof
KR20240021137A (en) 2022-08-09 2024-02-16 주식회사 이모코그 Method for implementing an application for MCI patients and apparatus thereof
KR20240028910A (en) 2022-08-25 2024-03-05 주식회사 이모코그 Method for controlling application of cognitive function training and apparatus thereof
CN116805514A (en) * 2023-08-25 2023-09-26 鲁东大学 DNA sequence function prediction method based on deep learning
CN116805514B (en) * 2023-08-25 2023-11-21 鲁东大学 DNA sequence function prediction method based on deep learning

Also Published As

Publication number Publication date
KR102410443B1 (en) 2022-06-17

Similar Documents

Publication Publication Date Title
KR20200066578A (en) Deep learning based dementia prediction method
Conwill et al. Anatomy promotes neutral coexistence of strains in the human skin microbiome
CN109072300A (en) Distinguish the methylation level in complex biological sample
JP2019531700A5 (en)
CN107849618A (en) Differentiate and detect the genetic marker of aquatile infectious disease Causative virus and using its Causative virus discriminating and detection method
JP2016214111A (en) Determination method of intestine state, and determination device of intestine state
CN111411150B (en) Intestinal flora for diagnosing sarcopenia and application thereof
Kohannim et al. Boosting power to detect genetic associations in imaging using multi-locus, genome-wide scans and ridge regression
WO2019025004A1 (en) A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies
CN111681711B (en) Design and screening method of degenerate primer
JP2021531016A (en) Cell-free DNA damage analysis and its clinical application
JP2016220634A (en) Dandruff evaluation method
WO2018135464A1 (en) Rapid genetic screening method using next generation sequencer
US20200115754A1 (en) Age determination of human individual
Lo et al. Selection and utility of single nucleotide polymorphism markers to reveal fine-scale population structure in human malaria parasite Plasmodium falciparum
Li et al. Use of deep learning genomics to discriminate Alzheimer's disease and healthy controls
CN115762628A (en) Detection method and detection device for gene progressive infiltration among biological populations
CN104789572B (en) GPRASP2 mutated genes, its authentication method and detection kit
CN114093424A (en) Method, device, equipment and storage medium for screening and processing lesion specific data
EP3983561A1 (en) Dna methylation based high resolution characterization of microbiome using nanopore sequencing
CN115820654A (en) LOXHD1 gene mutant and application thereof
KR102612260B1 (en) Scalp microbiome-based biomarker for diagnosing female hair loss, method for diagnosing hair loss using the same, and method for screening microbiome-based biomarker using machine learning
JP2016214109A (en) Estimation method of intestine age, and estimation device of intestine age
CN113764044B (en) Method for constructing myelodysplastic syndrome progress gene prediction model
CN112831564B (en) Gene combination of genetic variation region related to auxiliary diagnosis of primary lung cancer and application of gene combination

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant