KR102513540B1 - Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa - Google Patents

Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa Download PDF

Info

Publication number
KR102513540B1
KR102513540B1 KR1020210000097A KR20210000097A KR102513540B1 KR 102513540 B1 KR102513540 B1 KR 102513540B1 KR 1020210000097 A KR1020210000097 A KR 1020210000097A KR 20210000097 A KR20210000097 A KR 20210000097A KR 102513540 B1 KR102513540 B1 KR 102513540B1
Authority
KR
South Korea
Prior art keywords
content
ulcerative colitis
present
colorectal cancer
risk
Prior art date
Application number
KR1020210000097A
Other languages
Korean (ko)
Other versions
KR20220068865A (en
Inventor
이범재
김남주
김정안
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Publication of KR20220068865A publication Critical patent/KR20220068865A/en
Application granted granted Critical
Publication of KR102513540B1 publication Critical patent/KR102513540B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 대장점막의 장내 미생물총 분석 방법으로 고위험 대장선종, 진행성 대장암, 궤양성 대장염의 감별 진단이 가능하여 이를 기반으로 한 체액 생검 방법(분변, 소변 및 혈액)의 개발에 기여할 것으로 판단된다. 또한, 본 발명을 통한 고위험 대장선종, 대장암, 궤양성 대장염의 감별진단이 가능한 바 각 질환의 병리기전의 규명, 장내미생물 기반 상기 질환들의 치료 및 예방을 위한 후속 연구 및 치료제 개발에 이용될 수 있으며 이를 기반으로 한 파생 산업을 유도할 수 있을 것으로 판단된다The present invention is a method for analyzing the intestinal microbiota of the mucous membrane of the large intestine, and it is possible to differentiate between high-risk colorectal adenoma, advanced colorectal cancer, and ulcerative colitis, and it is expected to contribute to the development of a bodily fluid biopsy method (feces, urine, and blood) based on this. . In addition, since the differential diagnosis of high-risk colorectal adenoma, colorectal cancer, and ulcerative colitis is possible through the present invention, it can be used for the identification of the pathogenesis of each disease, follow-up research and development of therapeutic agents for the treatment and prevention of the above diseases based on intestinal microbes. It is believed that derivative industries based on this can be induced.

Description

대장점막의 장내미생물총분석을 이용한 고위험성대장선종, 진행성 결장암 궤양성 대장염 및 정상대조군의 감별 진단 방법{Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa}Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa}

본 발명은 대장 점막의 마이크로바이옴의 메타게놈 정보를 통해, 고위험 선종, 진행성 대장암, 궤양성 대장염 및 정상 대조군을 감별하는 방법에 관한 것으로서, 보다 상세하게는 장내 점막에서의 메타게놈 분석 결과 각 질병 분류군을 정확하게 설명하는 미생물의 종, 또는 속 이상의 분류단계에 대한 비율 정보를 정립하고, 이를 이용하여 고위험 선종, 진행성 대장암, 궤양성 대장염 및 정상 대조군 감별하기 위한 1차적 진단방법에 관한 것이다. The present invention relates to a method for discriminating high-risk adenoma, advanced colorectal cancer, ulcerative colitis, and a normal control group through metagenome information of the microbiome of the colon mucosa, and more specifically, as a result of metagenome analysis in the intestinal mucosa, each It is about a primary diagnosis method for establishing ratio information on the classification stage of a microbial species or genus or higher that accurately describes a disease taxon, and using this to differentiate high-risk adenoma, advanced colorectal cancer, ulcerative colitis, and normal control group.

인체에 공생하는 미생물은 100조에 이르러 인간 세포보다 10배 많으며, 미생물의 유전자수는 인간 유전자수의 100배가 넘는 것으로 알려지고 있다. 미생물총(microbiota)은 주어진 거주지에 존재하는 세균(bacteria), 고세균(archaea), 진핵생물(eukarya)을 포함한 미생물 군집(microbial community)을 말하고, 장내 미생물총은 장관의 항상성 유지에 중요한 역할을 하며, 장내미생물총의 불균형은 인간의 건강과 질병에 큰 영향을 미치는 것으로 알려져 있다. It is known that there are 100 trillion microorganisms symbiotic with the human body, 10 times more than human cells, and the number of genes of microorganisms is more than 100 times the number of human genes. Microbiota refers to the microbial community including bacteria, archaea, and eukarya existing in a given habitat, and the intestinal microbiota plays an important role in maintaining intestinal homeostasis. , It is known that the imbalance of the intestinal microbiota has a great impact on human health and disease.

환경 유전체학이라고도 불리는 메타게놈학은 환경 또는 다양한 환자 검체에서 채취한 샘플에서 얻은 메타게놈 자료에 대한 분석학이라고 할 수 있다. 최근 16s 리보솜 RNA(16s rRNA) 염기서열을 기반으로 한 방법으로 인간의 미생물총의 세균 구성을 목록화하는 것이 가능해졌으며, 16s 리보솜 RNA의 유전자인 16s rDNA 염기서열을 차세대 염기서열분석(next generation sequencing, NGS) platform을 이용하여 분석한다. Metagenomics, also called environmental genomics, is the analysis of metagenome data obtained from samples taken from the environment or from various patient specimens. Recently, it has become possible to catalog the bacterial composition of the human microbiome by a method based on 16s ribosomal RNA (16s rRNA) nucleotide sequence, and next generation sequencing (next generation sequencing) of 16s rDNA gene, a gene of 16s ribosomal RNA, has become possible. , NGS) platform for analysis.

장내 미생물의 불균형에 따른 인체 질환의 진단법은 많은 논문과 특허 문서를 통해 제시되고 있다. 예를 들어, 국내등록특허 제10-1915360호는 아토피 피부염 진단을 위한 특정 미생물 종을 검출하는 방법에 관한 기술이고, 유럽등록특허 EP 2955232 B1은 대변 샘플에서의 미생물 군집에 따른 대장암의 진단법에 관한 기술이며, 미국공개특허 US 2019-0136299 A1은 진단기준과 클러스터링(clustering) 결과에 관한 기술이 제시되었다.Methods for diagnosing human diseases according to the imbalance of intestinal microorganisms have been suggested through many papers and patent documents. For example, Korean Patent No. 10-1915360 relates to a method for detecting a specific microbial species for diagnosing atopic dermatitis, and European Patent No. EP 2955232 B1 relates to a method for diagnosing colon cancer according to microbial communities in stool samples. It is a related technology, and US Patent Publication No. US 2019-0136299 A1 proposes a technology related to diagnostic criteria and clustering results.

하지만, 상기 종래 기술들은 분변을 이용한 검사로 분변의 특성상 식생활 패턴, 약제 복욕 등 외부 환경의 변함에 따른 변형(variation)이 심한 단점이 있어서, 정확하고 효율적인 질병 진단의 일관성이 유지되지 않는 한계가 있었다.However, the above conventional techniques are tests using feces, and due to the nature of feces, there is a disadvantage in that there is severe variation due to changes in the external environment such as dietary patterns and drug intake, and there is a limit in that consistency in accurate and efficient disease diagnosis is not maintained. .

KR 10-1915360KR 10-1915360

본 발명이 이루고자 하는 메타게놈 분석 결과를 바탕으로 기계학습 기법 중 결정 트리(Decision tree)와 랜덤 포레스트(Random forest)를 적용하여 장내 질병의 위험을 예측하는 마커를 발굴하고, 이를 질병의 진단을 위한 방법에 제공하는 것이다. Based on the results of the metagenome analysis to be achieved by the present invention, a decision tree and a random forest among machine learning techniques are applied to discover markers that predict the risk of intestinal diseases, and to diagnose the disease. is to provide a method.

그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당해 기술분야의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.However, the technical problem to be achieved by the present invention is not limited to the above-mentioned problems, and other problems not mentioned will be clearly understood by those skilled in the art from the description below.

상기 과제를 해결하기 위하여, 본 발명은 (a) 개체의 생물학적 시료에서 DNA를 분리하는 단계; (b) 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 및 (c1) 상기 PCR 산물의 서열분석을 통하여 장내 미생물균총에서 Bacteroides vulgatus의 함량을 확인하는 단계를 포함하는 정상대조군과 질병군을 감별하기 위한 정보제공방법을 제공한다. In order to solve the above problems, the present invention comprises the steps of (a) isolating DNA from a biological sample of an individual; (b) performing PCR on the isolated DNA; and (c1) checking the content of Bacteroides vulgatus in the intestinal microflora through sequencing of the PCR product.

본 발명의 일 구현예에서 질병군은 고위험 대장선종, 진행성 대장암, 궤양성 대장염 이 발병한 또는 발병가능성이 높은 군을 의미한다. In one embodiment of the present invention, the disease group refers to a group in which high-risk colorectal adenoma, advanced colorectal cancer, or ulcerative colitis has occurred or is likely to occur.

본 발명의 다른 구현예에서, 상기 방법은 (c1)단계 이후에 (d1) Bacteroides vulgatus의 함량이 정상보다 낮은 경우 질병이 있거나 고위험군으로 판정하는 단계를 추가로 포함할 수 있다. 구체적으로, Bacteroides vulgatus의 함량이 0.02% 초과인 경우 정상 또는 저 위험군으로 판정하고, 0.02% 이하인 경우 질병이 있거나 고위험군으로 판정할 수 있다. In another embodiment of the present invention, the method may further include (d1) after step (c1), if the content of Bacteroides vulgatus is lower than normal, determining that the group has a disease or is at high risk. Specifically, if the content of Bacteroides vulgatus exceeds 0.02%, it is determined as a normal or low-risk group, and if it is less than 0.02%, it may be determined as a disease or high-risk group.

또한, 본 발명은 상기 정보제공방법에서 질병군으로 분류된 개체를 대상으로 진행성 고위험 대장선종을 구별하기 위한 정보제공방법을 제공한다.In addition, the present invention provides an information providing method for distinguishing advanced high-risk colorectal adenoma targeting individuals classified as a disease group in the above information providing method.

본 발명의 일 구현예로서, 상기 고위험 대장선종 구별을 위한 정보제공방법은 하기 단계를 포함한다:As an embodiment of the present invention, the information providing method for distinguishing the high-risk colorectal adenoma includes the following steps:

(a) 개체의 생물학적 시료에서 DNA를 분리하는 단계; (b) 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 및 (c2) 상기 PCR 산물의 서열분석을 통하여 Tyzzerella nexilis의 함량을 확인하는 단계.(a) isolating DNA from the subject's biological sample; (b) performing PCR on the isolated DNA; and (c2) confirming the content of Tyzzerella nexilis through sequencing of the PCR product.

본 발명의 또 다른 구현예로서, 상기 정보제공방법은 (c2) 단계 이후에 (d2) Tyzzerella nexilis의 함량이 0.000759% 이상인 경우 고위험 대장선종 이 발병하였거나 이의 발병가능성이 높은 것으로 판정하는 단계를 추가로 포함할 수 있다.As another embodiment of the present invention, the information providing method includes the step (d2) determining that high-risk colorectal adenoma has occurred or is highly likely to develop if the content of Tyzzerella nexilis is 0.000759% or more after step (c2). can include

또한, 본 발명은 고위험 대장선종 이 아니거나 선종 저위험군에 속하는 개체를 대상으로 대장암과 궤양성 대장염을 구별하기 위한 정보제공방법을 제공한다.In addition, the present invention provides an information providing method for distinguishing between colorectal cancer and ulcerative colitis targeting individuals who are not high-risk colorectal adenomas or belong to the low-risk group of adenomas.

본 발명의 일 구현 예로서, 상기 정보제공방법은 상기 (b) 단계 이후에 (c3) 상기 PCR 산물의 서열분석을 통하여 Lachnoclostridium pacaense의 함량을 확인하는 단계 및 (d3) Lachnoclostridium pacaense의 함량이 0.000536% 초과인 경우 궤양성 대장염 또는 그 발병가능성이 높은 고위험군으로 판정하고, 0.000536% 이하인 경우 대장암 또는 그 발병가능성이 높은 고위험군으로 판정하는 단계를 포함한다.As an embodiment of the present invention, the information providing method includes, after step (b), (c3) confirming the content of Lachnoclostridium pacaense through sequencing of the PCR product, and (d3) the content of Lachnoclostridium pacaense is 0.000536% If it exceeds 0.000536%, it is determined as ulcerative colitis or a high-risk group with a high possibility of developing it, and when it is 0.000536% or less, it includes determining a high-risk group with a high possibility of developing colon cancer.

또한, 본 발명은 하기 단계를 포함하는 고위험 대장선종 진단 또는 발병가능성 예측을 위한 정보제공방법을 제공한다:In addition, the present invention provides an information providing method for diagnosing or predicting the possibility of developing high-risk colorectal adenoma, including the following steps:

개체의 생물학적 시료에서 DNA를 분리하는 단계; 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 상기 PCR 산물의 서열분석을 통하여 장내 미생물균총에서 Bacteroides vulgatusTyzzerella nexilis의 함량을 확인하는 단계; 및 Bacteroides vulgatus의 함량이 0.02% 이하이고, Tyzzerella nexilis의 함량이 0.000759% 이상인 경우 고위험 대장선종 이 발병하였거나 이의 발병가능성이 높은 것으로 판정하는 단계.isolating DNA from the subject's biological sample; performing PCR on the isolated DNA; Confirming the content of Bacteroides vulgatus and Tyzzerella nexilis in the intestinal microflora through sequencing of the PCR product; and determining that high-risk colorectal adenoma has occurred or is likely to develop if the content of Bacteroides vulgatus is 0.02% or less and the content of Tyzzerella nexilis is 0.000759% or more.

또한, 본 발명은 하기 단계를 포함하는 진행성 대장암의 진단 또는 발병가능성 예측을 위한 정보제공방법을 제공한다:In addition, the present invention provides an information providing method for diagnosing or predicting the onset of advanced colorectal cancer comprising the following steps:

개체의 생물학적 시료에서 DNA를 분리하는 단계; 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 상기 PCR 산물의 서열분석을 통하여 장내 미생물균총에서 Bacteroides vulgatus, Tyzzerella nexilisLachnoclostridium pacaense의 함량을 확인하는 단계; 및 Bacteroides vulgatus의 함량이 0.02% 이하이고, Tyzzerella nexilis의 함량이 0.000759% 미만이고, Lachnoclostridium pacaense의 함량이 0.000536% 이하인 경우 진행성 대장암이 발병하였거나 이의 발병가능성이 높은 것으로 판정하는 단계.isolating DNA from the subject's biological sample; performing PCR on the isolated DNA; Confirming the contents of Bacteroides vulgatus , Tyzzerella nexilis and Lachnoclostridium pacaense in the intestinal microflora through sequencing of the PCR product; And if the content of Bacteroides vulgatus is 0.02% or less, the content of Tyzzerella nexilis is less than 0.000759%, and the content of Lachnoclostridium pacaense is 0.000536% or less, determining that advanced colorectal cancer has occurred or is highly likely to develop.

또한, 본 발명은 하기 단계를 포함하는 궤양성 대장염 진단 또는 발병가능성 예측을 위한 정보제공방법을 제공한다:In addition, the present invention provides an information providing method for diagnosing or predicting the onset of ulcerative colitis, which includes the following steps:

개체의 생물학적 시료에서 DNA를 분리하는 단계; 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 상기 PCR 산물의 서열분석을 통하여 장내 미생물균총에서 Bacteroides vulgatus, Tyzzerella nexilisLachnoclostridium pacaense의 함량을 확인하는 단계; 및 Bacteroides vulgatus의 함량이 0.02% 이하이고, Tyzzerella nexilis의 함량이 0.000759% 미만이고, Lachnoclostridium pacaense의 함량이 0.000536% 초과인 경우 궤양성 대장염이 발병하였거나 이의 발병가능성이 높은 것으로 판정하는 단계. isolating DNA from the subject's biological sample; performing PCR on the isolated DNA; Confirming the contents of Bacteroides vulgatus , Tyzzerella nexilis and Lachnoclostridium pacaense in the intestinal microflora through sequencing of the PCR product; And when the content of Bacteroides vulgatus is 0.02% or less, the content of Tyzzerella nexilis is less than 0.000759%, and the content of Lachnoclostridium pacaense is more than 0.000536%, determining that ulcerative colitis has occurred or is highly likely to develop.

본 발명의 정보제공방법은 고위험 대장선종, 대장암, 및/또는 궤양성 대장염의 진단방법으로 제공될 수 있으며, 상기 질병들의 감별진단방법으로 이용될 수 있다.The information providing method of the present invention can be provided as a method for diagnosing high-risk colorectal adenoma, colorectal cancer, and/or ulcerative colitis, and can be used as a differential diagnosis method for the above diseases.

본 발명은 대장점막의 장내 미생물총 분석 방법으로 고위험 대장선종, 진행성 대장암, 궤양성 대장염의 감별 진단이 가능하여 이를 기반으로한 체액 생검 방법 (분변, 소변 및 혈액)의 개발에 기여할 것으로 판단된다. 또한, 본 발명을 통한 고위험 대장선종, 대장암, 궤양성 대장염의 감별진단이 가능한 바 각 질환의 병리기전의 규명, 장내미생물 기반 상기 질환들의 치료 및 예방을 위한 후속 연구 및 치료제 개발에 이용될 수 있으며 이를 기반으로 한 파생 산업을 유도할 수 있을 것으로 판단된다.The present invention is a method for analyzing the intestinal microbiota of the mucous membrane of the large intestine, and it is possible to differentiate between high-risk colorectal adenoma, advanced colorectal cancer, and ulcerative colitis, and it is expected to contribute to the development of a bodily fluid biopsy method (feces, urine, and blood) based on this. . In addition, since the differential diagnosis of high-risk colorectal adenoma, colorectal cancer, and ulcerative colitis is possible through the present invention, it can be used for the identification of the pathogenesis of each disease, follow-up research and development of therapeutic agents for the treatment and prevention of the above diseases based on intestinal microbes. And based on this, it is judged that derivative industries can be induced.

도 1은 본 발명의 기계학습법을 이용한 미생물에 의한 질병 분류군의 분류 방법의 동작을 설명하기 위한 순서도이다.
도 2 내지 도 7은 본 발명의 일 실시예에 따라 미생물의 종, 속, 과, 목, 강, 문 각각에 대한 고위험 대장선종, 대장암, 궤양성 대장염, 정상 상태 각각을 설명하는 결정 트리(decision tree)를 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따라 입력 데이터의 일부에 대하여, 각 종이 전체 미생물 군집 중 차지하는 비율을 나타낸 표이다.
도 9는 본 발명의 일 실시예에 따라 ANOVA 기법을 이용해 각 질병 분류군을 정확하게 설명하는 비율을 선정하고 시각화한 도면이다.
도 10은 본 발명의 다른 실시예에 따라 진행성 선종, 대장암, 궤양성 대장염, 정상 대조군상태 각각을 설명하는 결정 트리(decision tree) 및 랜덤 포레스트(random forest)를 통하여 설문지 정보로부터 중요한 인자를 발굴하는 방법을 도시한 도면이다.
도 11은 본 발명의 다른 실시예에 따라 결정 트리 개수 대비 설문지 정보의 에러값을 나타낸 그래프이다.
도 12는 본 발명의 다른 실시 예에 따라 평균 감소값 대비 설문지 정보 중 27개의 변수들 간의 상관 관계를 나타낸 그래프이다.
1 is a flowchart illustrating the operation of a method for classifying disease taxa by microorganisms using the machine learning method of the present invention.
2 to 7 are decision trees describing each of high-risk colorectal adenoma, colorectal cancer, ulcerative colitis, and normal state for each species, genus, family, order, class, and phylum of microorganisms according to an embodiment of the present invention ( It is a diagram showing a decision tree).
8 is a table showing the ratio of each species to the total microbial community with respect to a portion of input data according to an embodiment of the present invention.
9 is a diagram in which a ratio accurately describing each disease taxon is selected and visualized using an ANOVA technique according to an embodiment of the present invention.
10 is a diagram showing important factors from questionnaire information through a decision tree and a random forest describing each of progressive adenoma, colorectal cancer, ulcerative colitis, and normal control condition according to another embodiment of the present invention. This is a diagram showing how to do it.
11 is a graph showing the error value of questionnaire information versus the number of decision trees according to another embodiment of the present invention.
12 is a graph showing a correlation between 27 variables of questionnaire information versus an average decrease value according to another embodiment of the present invention.

이하, 첨부한 도면을 참고로 하여 본 발명의 바람직한 실시예에 대하여 상세히 설명하면 다음과 같다.Hereinafter, the preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 발명을 상세하게 설명하기 전에, 본 명세서에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 무조건 한정하여 해석되어서는 아니 되며, 본 발명의 발명자가 자신의 발명을 가장 최선의 방법으로 설명하기 위해서 각종 용어의 개념을 적절하게 정의하여 사용할 수 있다.Before explaining the present invention in detail, the terms or words used in this specification should not be construed unconditionally in a conventional or dictionary sense, and in order for the inventor of the present invention to explain his/her invention in the best way Concepts of various terms can be appropriately defined and used.

더 나아가 이들 용어나 단어는 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 함을 알아야 한다.Furthermore, it should be noted that these terms or words should be interpreted as meanings and concepts consistent with the technical idea of the present invention.

즉, 본 명세서에서 사용된 용어는 본 발명의 바람직한 실시예를 설명하기 위해서 사용되는 것일 뿐이고, 본 발명의 내용을 구체적으로 한정하려는 의도로 사용된 것이 아니다.That is, the terms used in this specification are only used to describe preferred embodiments of the present invention, and are not intended to specifically limit the contents of the present invention.

이들 용어는 본 발명의 여러 가지 가능성을 고려하여 정의된 용어임을 알아야 한다.It should be noted that these terms are terms defined in consideration of various possibilities of the present invention.

또한, 본 명세서에 있어서, 단수의 표현은 문맥상 명확하게 다른 의미로 지시하지 않는 이상, 복수의 표현을 포함할 수 있다.Also, in this specification, a singular expression may include a plurality of expressions unless the context clearly indicates otherwise.

또한, 유사하게 복수로 표현되어 있다고 하더라도 단수의 의미를 포함할 수 있음을 알아야 한다.In addition, it should be noted that similarly, even if expressed in a plurality, it may include a singular meaning.

본 명세서의 전체에 걸쳐서 어떤 구성 요소가 다른 구성 요소를 "포함"한다고 기재하는 경우에는, 특별히 반대되는 의미의 기재가 없는 한 임의의 다른 구성 요소를 제외하는 것이 아니라 임의의 다른 구성 요소를 더 포함할 수도 있다는 것을 의미할 수 있다.Throughout this specification, when a component is described as "including" another component, it does not exclude any other component, but further includes any other component, unless otherwise stated. It can mean you can do it.

또한, 이하에서, 본 발명을 설명함에 있어서, 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 구성, 예를 들어, 종래 기술을 포함하는 공지 기술에 대한 상세한 설명은 생략될 수도 있다.In addition, in the following description of the present invention, a detailed description of a configuration that is determined to unnecessarily obscure the subject matter of the present invention, for example, a known technology including the prior art, may be omitted.

도 1은 본 발명의 기계학습법을 이용한 미생물에 의한 질병 분류군의 분류 방법의 동작을 설명하기 위한 순서도이다.1 is a flowchart illustrating the operation of a method for classifying disease taxa by microorganisms using the machine learning method of the present invention.

도 2 내지 도 7은 본 발명의 일 실시 예에 따라 미생물의 종, 속, 과, 목, 강, 문 각각에 대한 고위험 대장선종, 진행성 대장암, 궤양성 대장염, 정상 상태 각각을 설명하는 결정 트리(decision tree)를 도시한 도면으로서, A는 고위험 선종, CL은 진행성 대장암, UL은 궤양성 대장염, W는 정상대조군을 나타낸다.2 to 7 are decision trees illustrating high-risk colorectal adenoma, advanced colorectal cancer, ulcerative colitis, and normal state for each of the species, genus, family, order, class, and phylum of microorganisms according to an embodiment of the present invention. (Decision tree) A is a high-risk adenoma, CL is advanced colorectal cancer, UL is ulcerative colitis, and W is a normal control group.

도 8은 본 발명의 일 실시예에 따라 입력 데이터의 일부에 대하여, 각 종이 전체 미생물 군집 중 차지하는 비율을 나타낸 표이다.8 is a table showing the ratio of each species to the total microbial community with respect to a portion of input data according to an embodiment of the present invention.

도 2 내지 도 7에서 보는 바와 같이, 장내 점막(또는 다른 조직, 분변도 가능)에서 수행한 메타게놈 분석(metagenome sequencing) 결과, 제시된 미생물의 종, 속, 과, 목, 강, 문에 대한 비율이 매트릭스(matrix)로 산출된다.As shown in Figures 2 to 7, as a result of metagenome sequencing performed on the intestinal mucosa (or other tissues, feces are also possible), the ratio of the species, genus, family, order, class, and phylum of the presented microorganisms It is calculated with this matrix.

그 다음, 이 매트릭스에서 각 질병 분류군을 정확하게 설명하는 미생물의 종(또는 상위 분류군)의 비율을 뽑아내고 시각화한다.Then, from this matrix, the proportion of microbial species (or higher taxa) that accurately describes each disease taxon is extracted and visualized.

도 2에서, 노드의 첫째 줄은 4가지 질병 분류군 중 가장 많은 질병 분류군을 나타내고, 비율에 따라 색상의 진하기가 다르게 도시된다.In FIG. 2 , the first row of nodes represents the largest number of disease taxa among the four disease taxa, and the color intensity varies according to the ratio.

또한, 노드의 둘째 줄은 4가지 질병 분류군에 속하는 각 샘플 수이고, 순서대로 진행성 선종, 대장암, 크론병, 정상 상태 각각을 나타낸다. In addition, the second line of the node shows the number of samples belonging to each of the four disease taxa, and represents progressive adenoma, colorectal cancer, Crohn's disease, and normal state, respectively, in order.

또한, 노드 아래 조건은 조건에 해당되면 왼쪽 노드로 분류되고, 조건에 해당되지 않으면 오른쪽 노드로 분류된다.In addition, the condition under the node is classified as a left node if the condition is met, and is classified as a right node if the condition is not met.

예를 들어, 도 2에서, 결정 트리는 3 개의 결정 노드로 구성되어 있다.For example, in Figure 2, the decision tree consists of three decision nodes.

즉, 가장 상위 레벨의 노드인 Bacteroides vulgatus는 1차적으로 정상 상태 또는 진행성 대장암을 분류하는 균의 기준이 되고, 그 다음 레벨의 두번째 노드인 Tyzzerella nexilis는 대장암 또는 고위험 대장선종을 분류하는 균의 기준이 되며, Lachnoclostridium pacaense는 진행성 대장암 또는 궤양성 대장염을 분류하는 균의 기준이 된다.That is, Bacteroides vulgatus , the highest level node, is the standard for bacteria that primarily classify normal or advanced colorectal cancer, and Tyzzerella nexilis , the second node of the next level, is the standard for bacteria that classify colorectal cancer or high-risk colorectal adenoma. Lachnoclostridium pacaense is the standard for classification of advanced colorectal cancer or ulcerative colitis.

도 2에서 보는 바와 같이, Bacterides vulgatus 종의 비율이 전체 비율의 0.0296 (2.96%) 이상인 경우 전체 정상(W) 13명 중 10명이 최종 노드인 세번째 노드로 곧바로 분류되었다. As shown in FIG. 2, when the ratio of Bacterides vulgatus species was 0.0296 (2.96%) or more of the total ratio, 10 out of 13 normal (W) subjects were immediately classified as the third node, the final node.

가장 오른쪽의 최종 노드는 주로 정상 상태(W) 샘플들로 구성이 되어 있으며, 총 18명 중 10명이 정상이었다. The final node on the far right is mainly composed of steady state (W) samples, and 10 out of a total of 18 were normal.

Tyzzerella nexilis 종의 비율이 전체 비율의 0.000759 (0.0759%) 이상인 경우 총 12명의 고위험 대장선종(A) 환자 중 7명이 가장 왼쪽의 최종 노드로 분류되었다. When the proportion of Tyzzerella nexilis species was more than 0.000759 (0.0759%) of the total proportion, 7 out of 12 high-risk colorectal adenoma (A) patients were classified as the leftmost terminal node.

Lachnoclostridium pacaense 종의 비율이 전체 비율의 0.000536 (0.0536%) 비율 이상일 경우 궤양성 대장염, 미만일 경우 진행성 대장암으로 분류되었다.If the ratio of Lachnoclostridium pacaense was greater than or equal to 0.000536 (0.0536%) of the total ratio, it was classified as ulcerative colitis, and if less than that, it was classified as advanced colorectal cancer.

이에 따라, 도 8에서 보는 바와 같이, 메타게놈 분석 결과 총 528종이 검출되었으며, 각 종들의 샘플별 비율이 산출되었다. Accordingly, as shown in FIG. 8, as a result of metagenome analysis, a total of 528 species were detected, and the ratio of each species to each sample was calculated.

도 8에서, 각 행의 제목은 종, 각 열의 제목은 검체명을 나타내고, 기타 분류 포함 총 529행으로 이루어져 있다.In FIG. 8, the title of each row indicates the species, the title of each column indicates the sample name, and consists of a total of 529 lines including other classifications.

또한, R에서의 분석을 위해 데이터 프레임 형태로 불러오고, 분류는 R의 rpart 패키지를 활용하였다.In addition, it was imported in the form of a data frame for analysis in R, and R's rpart package was used for classification.

도 9는 본 발명의 일 실시예에 따라 ANOVA 기법을 이용해 각 질병 분류군을 정확하게 설명하는 비율을 선정하고 시각화한 도면이다.9 is a diagram in which a ratio that accurately describes each disease taxon is selected and visualized using an ANOVA technique according to an embodiment of the present invention.

도 9에서 보는 바와 같이, p -value는 0.03 이하인 결과들이고, 궤양성 대장염 정상대조군, 고위험 대장선종 및 진행성 대장암이 약한 클러스터링이 되는 것을 확인하였다. As shown in FIG. 9, the p -value was 0.03 or less , and it was confirmed that the ulcerative colitis normal control group, high-risk colorectal adenoma, and advanced colorectal cancer were weakly clustered.

이때, 시각화는 R의 pheatmap 패키지로 수행하였다.At this time, visualization was performed with R's pheatmap package.

도 10은 본 발명의 다른 실시예에 따라 고위험 대장선종, 진행성 대장암, 궤양성 대장염, 정상 대조군 상태 각각을 설명하는 결정 트리(decision tree) 및 랜덤 포레스트(random forest)를 통하여 설문지 정보로부터 중요한 인자를 발굴하는 방법을 도시한 도면으로서, A는 고위험 대장선종, CL은 진행성 대장암, UL은 궤양성 대장염, W는 정상대조군 상태를 나타낸다.10 is an important factor from questionnaire information through a decision tree and a random forest describing high-risk colorectal adenoma, advanced colorectal cancer, ulcerative colitis, and normal control conditions, respectively, according to another embodiment of the present invention. As a diagram showing a method of excavation, A represents high-risk colon adenoma, CL represents advanced colorectal cancer, UL represents ulcerative colitis, and W represents a normal control group state.

도 11은 본 발명의 다른 실시예에 따라 결정 트리 개수 대비 설문지 정보의 에러값을 나타낸 그래프이다.11 is a graph showing the error value of questionnaire information versus the number of decision trees according to another embodiment of the present invention.

도 12는 본 발명의 다른 실시예에 따라 평균 감소값 대비 설문지 정보 중 27개의 변수들 간의 상관 관계를 나타낸 그래프이다.12 is a graph showing a correlation between 27 variables of questionnaire information versus an average decrease value according to another embodiment of the present invention.

도 10에서 보는 바와 같이, 결정 트리에서, 정신건강 지표(SA)가 낮을수록 진행성 선종으로 분류되었고, 애완동물 사육기간이 길수록 정상 상태로 분류되었다. As shown in FIG. 10, in the decision tree, the lower the mental health index (SA) was classified as progressive adenoma, and the longer the pet breeding period was, the more normal state was classified.

또한, 잡곡 섭취가 낮을수록 진행성 대장암으로 분류되었고, 멸치 섭취가 많을수록 대장암에 비해 고위험 대장선종으로 분류되는 경향이 확인되었다.In addition, the lower the grain intake, the more advanced colorectal cancer was classified, and the higher the anchovy intake, the higher the risk of colorectal adenoma compared to colorectal cancer.

즉, 랜덤 포레스트를 통해서 4가지 분류군을 가장 잘 설명하는 설문지 정보를 찾은 결과, 총 27개의 변수들이 확인되었으며, 각 변수들을 중요한 순서대로 나열하면 아래와 같다.That is, as a result of finding questionnaire information that best explains the four taxa through random forest, a total of 27 variables were identified, and each variable is listed in order of importance as follows.

SA,, CESD 정신건강지표 건강, 요구르트, 연령, 약물 복용, 배변 습관 변이, 음주량, 질병 과거력, 탄산 음료, 식후 포만감, 누적 담배, 두부 섭취, 튀긴 음식, 잡곡, 소주, 피곤 정도, 상복부 팽만감, 미역, 녹차, 혈변, 대변의 형상, 수면 시간, 쇠고기, 콩, 대변 횟수, 오징어, 고구마 순이다.SA, CESD Mental Health Index Health, yogurt, age, medication use, change in bowel habits, alcohol consumption, disease history, carbonated beverages, postprandial satiety, cumulative cigarettes, tofu intake, fried foods, cereals, soju, fatigue, epigastric bloating, Seaweed, green tea, bloody stool, shape of stool, sleep time, beef, beans, number of stools, squid, and sweet potato are in order.

이와 같이, 본 발명은 메타게놈 분석 결과를 바탕으로 기계학습 기법 중 결정 트리와 랜덤 포레스트를 적용하여 장내 질병의 위험을 예측하는 마커를 발굴함으로써, 미생물에 대한 각 질병 분류군을 정확하게 분류할 수 있는 기계학습법을 이용한 미생물에 의한 질병 분류군의 분류 방법을 제공한다.As such, the present invention is a machine that can accurately classify each disease taxon for microorganisms by discovering markers that predict the risk of intestinal diseases by applying decision trees and random forests among machine learning techniques based on the results of metagenome analysis. A method for classifying disease taxa by microorganisms using a learning method is provided.

또한, 본 발명은 상기 방법으로 발굴한 마커를 이용하여 정상, 고위험대장선종, 진행성 대장암, 및 궤양성 대장염의 감별하여 진단하기 위한 정보제공방법을 제공한다.In addition, the present invention provides an information providing method for differentially diagnosing normal, high-risk colorectal adenoma, advanced colorectal cancer, and ulcerative colitis using the markers discovered by the above method.

구체적으로 (a) 개체의 생물학적 시료에서 DNA를 분리하는 단계; (b) 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 및 (c1) 상기 PCR 산물의 서열분석을 통하여 Bacteroides vulgatus의 함량을 확인하는 단계;를 포함하는 정상군과 질환군을 감별하는 방법을 제공한다. Specifically, (a) isolating DNA from a biological sample of an individual; (b) performing PCR on the isolated DNA; and (c1) confirming the content of Bacteroides vulgatus through sequencing of the PCR product.

상기 방법은 (c1)단계 이후에 (d1) Bacteroides vulgatus의 함량이 0.02% 초과인 경우 정상으로 판단하고 0.02% 이하인 경우 질병이 있는 것으로 판단하는 단계를 추가로 포함할 수 있다. 한편, 상기 질병군에 속하는 개체는 고위험 대장선종, 진행성 대장암, 및/또는 궤양성 대장염으로 분류될 수 있다.The method may further include, after step (c1), (d1) determining that the content of Bacteroides vulgatus is normal when the content exceeds 0.02%, and determining that the content of Bacteroides vulgatus is diseased when the content is less than 0.02%. Meanwhile, individuals belonging to the disease group may be classified into high-risk colon adenoma, advanced colon cancer, and/or ulcerative colitis.

아울러, 본 발명은 상기 방법에서 질병군으로 분류된 개체를 대상으로 고위험 대장선종, 을 감별하여 진단하는 방법을 제공한다. 구체적으로 질병군에서 고위험 대장선종, 을 감별하여 진단하는 방법은 하기 단계를 포함한다:In addition, the present invention provides a method for identifying and diagnosing high-risk colorectal adenoma in individuals classified as a disease group in the above method. Specifically, the method for diagnosing and discriminating high-risk colorectal adenoma in the disease group includes the following steps:

(a) 개체의 생물학적 시료에서 DNA를 분리하는 단계; (b) 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 및 (c2) 상기 PCR 산물의 서열분석을 통하여 Tyzzerella nexilis의 함량을 확인하는 단계.(a) isolating DNA from the subject's biological sample; (b) performing PCR on the isolated DNA; and (c2) confirming the content of Tyzzerella nexilis through sequencing of the PCR product.

상기 방법은 (c2) 단계 이후에 (d2) Tyzzerella nexilis의 함량이 0.000759% 이상인 경우 진행성 선종으로 판정하는 단계를 추가로 포함할 수 있다. The method may further include, after step (c2), (d2) determining that it is an advanced adenoma when the content of Tyzzerella nexilis is 0.000759% or more.

또한, 본 발명은 상기 (d2) 단계 이후에 고위험 대장선종, 이 아닌 질병군에 속하는 개체를 대상으로 진행성 대장암과 궤양성 대장염으로 구별하여 질환을 진단하는 방법을 제공한다. 구체적으로 대장암과 궤양성 대장염의 감별 진단 방법은 하기의 단계를 포함한다:In addition, the present invention provides a method for diagnosing the disease by distinguishing between advanced colorectal cancer and ulcerative colitis in an individual belonging to a disease group other than high-risk colon adenoma after the step (d2). Specifically, the differential diagnosis method between colon cancer and ulcerative colitis includes the following steps:

(a) 개체의 생물학적 시료에서 DNA를 분리하는 단계; (b) 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 및 (c3) 상기 PCR 산물의 서열분석을 통하여 Lachnoclostridium pacaense의 함량을 확인하는 단계.(a) isolating DNA from the subject's biological sample; (b) performing PCR on the isolated DNA; and (c3) confirming the content of Lachnoclostridium pacaense through sequencing of the PCR product.

상기 방법은 (c3) 단계 이후에 (d3) Lachnoclostridium pacaense의 함량이 0.000536% 초과인 경우 궤양성 대장염으로 판정하고, 0.000536% 이하인 경우 대장암으로 판정하는 단계를 추가로 포함할 수 있다.The method may further include, after step (c3), (d3) determining ulcerative colitis when the content of Lachnoclostridium pacaense is greater than 0.000536%, and determining colorectal cancer when the content of Lachnoclostridium pacaense is less than 0.000536%.

본 발명에서 개체의 생물학적 시료는 장내 마이크로바이옴의 분포 정보를 포함하는 것이라면 제한되지 아니하나, 바람직하게는 대변일 수 있다. In the present invention, the subject's biological sample is not limited as long as it contains distribution information of the intestinal microbiome, but may preferably be feces.

한편, 상술한 본 발명의 정상대조군, 고위험 대장선종, 진행성 대장암, 및 궤양성 대장염의 감별하여 진단하기 위한 상기의 정보제공방법은 각 질환의 발병가능성의 예측을 위한 정보제공방법으로 제공될 수 있다. 이 경우 상기 (d1) 내지 (d3) 단계는 각 조건을 만족하는 경우에 해당하는 질병의 발병가능성이 높은 것으로 판정하는 것으로 해석한다. 구체적으로, 본 발명을 각 질병의 발병가능성 예측에 이용하는 경우 (d1) 내지 (d3) 단계는 하기와 같이 해석된다.On the other hand, the information providing method for differentially diagnosing the normal control group, high-risk colorectal adenoma, advanced colorectal cancer, and ulcerative colitis of the present invention described above can be provided as an information providing method for predicting the possibility of onset of each disease. there is. In this case, steps (d1) to (d3) are interpreted as determining that the occurrence of the corresponding disease is high when each condition is satisfied. Specifically, when the present invention is used to predict the onset of each disease, steps (d1) to (d3) are interpreted as follows.

(d1) Bacteroides vulgatus의 함량이 0.02% 이하인 경우 고위험 대장선종, 진행성 대장암, 및/또는 궤양성 대장염 고위험군으로 분류하는 단계.(d1) classifying into a high-risk group for high-risk colorectal adenoma, advanced colorectal cancer, and/or ulcerative colitis when the content of Bacteroides vulgatus is 0.02% or less.

(d2) Tyzzerella nexilis의 함량이 0.000759% 이상인 경우 고위험 대장선종의 고위험군으로 분류하는 단계.(d2) Classifying into a high-risk group for high-risk colorectal adenoma if the content of Tyzzerella nexilis is 0.000759% or more.

(d3) Lachnoclostridium pacaense의 함량이 0.000536% 초과인 경우 궤양성 대장염 고위험군으로 분류하고, 0.000536% 이하인 경우 진행성 대장암 고위험군으로 분류하는 단계.(d3) Classification of a high-risk group for ulcerative colitis when the content of Lachnoclostridium pacaense is greater than 0.000536%, and classification as a high-risk group for advanced colorectal cancer when the content of Lachnoclostridium pacaense is less than 0.000536%.

따라서, 본 발명에서 고위험 대장선종, 진행성 대장암, 및/또는 궤양성 대장염의 “진단”이란 환자에 대하여 상기 질병이 발병할 가능성이 있는지, 상기 질병이 발병할 가능성이 상대적으로 높은지, 또는 상기 질병이 이미 발병하였는지 여부를 판별하는 것을 의미한다. 본 발명의 방법은 임의의 특정 환자에 대한 상기 질병 발병 위험도가 높은 환자로써 특별하고 적절한 관리를 통하여 발병 시기를 늦추거나 발병하지 않도록 하는데 사용할 수 있다. 또한, 본 발명의 방법은 상기 질병의 예방, 조기진단 진단하여 및 장내미생물 기반한 새로운 치료법의 제시를 통한 임상영역에서 활용될 수 있다. Therefore, in the present invention, "diagnosis" of high-risk colorectal adenoma, advanced colorectal cancer, and/or ulcerative colitis means whether the patient has a possibility of developing the disease, a relatively high probability of developing the disease, or the disease This means determining whether or not it has already occurred. The method of the present invention can be used to delay or prevent the onset of the disease through special and appropriate management as a patient with a high risk of developing the disease for any specific patient. In addition, the method of the present invention can be used in the clinical field through prevention of the above diseases, early diagnosis and diagnosis, and presentation of new treatments based on intestinal microbes.

아울러, 본 발명의 상기 정보제공방법은 각각 정상대조군과 질병군을 구별하는 방법, 질병군 중에서도 고위험 대장선종을 구별하는 방법, 궤양성 대장염과 진행성 대장암을 구별하는 방법으로 구분되며, 각 방법에서 (a) 및 (b) 단계와 (c1~3) 및 (d1~3)단계는 시공간적으로 분리되어 수행될 수 있다.In addition, the information providing method of the present invention is divided into a method for distinguishing a normal control group from a disease group, a method for distinguishing high-risk colon adenoma among disease groups, and a method for distinguishing between ulcerative colitis and advanced colorectal cancer, and in each method (a Steps ) and (b) and steps (c1 to 3) and (d1 to 3) may be performed separately in space and time.

이를 통하여, 본 발명은 장내 점막에서 채취한 샘플을 이용하므로 기존의 대변을이용한 연구에 비해 식습관, 약제 복용, 검체 채취의 불안정성 등 환경적 요인에 의한 장내미생물의 변형이 적고, 이를 통해 질병 진단의 일관성이 획기적으로 개선되게 된다. 또한, 각 질병 분류군을 정확하게 설명하는 비율을 선정하고 시각화함으로써, 질병 진단의 신뢰성과 정확성을 향상시킬 수 있게 된다.Through this, since the present invention uses samples taken from the intestinal mucosa, there is less variation in intestinal microorganisms due to environmental factors such as eating habits, drug intake, and instability of sample collection, compared to studies using feces. Consistency is dramatically improved. In addition, the reliability and accuracy of disease diagnosis can be improved by selecting and visualizing a ratio that accurately describes each disease taxonomy.

본 발명에 있어서, 상기 (b) 및 (c1~3) 단계의 PCR과 PCR 산물의 서열분석을 통한 특정 종의 세균 함량 확인은 정량적 PCR(quantitative PCR, qPCR)을 통해 수행되는 것일 수 있으며, 각 단계에서 함량 확인하고자 하는 세균의 16s rDNA(bacterial universal 16S rDNA)에 특이적인 프라이머 쌍 및 프로브를 이용하여 qPCR을 수행하여 달성되는 것일 수 있다.In the present invention, the confirmation of the bacterial content of a specific species through PCR and sequencing of PCR products in steps (b) and (c1 to 3) may be performed through quantitative PCR (qPCR), and each In the step, it may be achieved by performing qPCR using a primer pair and a probe specific to 16s rDNA (bacterial universal 16S rDNA) of a bacterium to be checked for content.

본 발명에 있어서 “프로브(probe)”란 DNA또는 RNA의 특정 염기 서열에 상보적인 절편(또는 단편)으로, 방사선 원소 또는 형광으로 표지된 말단 염기를 지니는 DNA 또는 RNA 절편을 의미한다. 대개 100-1000 bp 정도 길이로 다양하며 분자생물학 영역에서 DNA 혹은 RNA 샘플 내의 특정 뉴클레오티드 서열을 찾기 위한 상보적인 서열을 갖는다. Probe는 타겟 유전자와의 상보적인 결합을 통해 단일 가닥의 DNA 혹은 RNA 속에서 찾고자 하는 유전자 서열을 확인하는 데 이용된다.In the present invention, “probe” refers to a fragment (or fragment) complementary to a specific base sequence of DNA or RNA, and a DNA or RNA fragment having terminal bases labeled with a radioactive element or fluorescence. It usually varies in length from 100 to 1000 bp and has a complementary sequence for finding a specific nucleotide sequence in a DNA or RNA sample in the field of molecular biology. Probe is used to identify the gene sequence to be found in single-stranded DNA or RNA through complementary binding with the target gene.

본 발명에 있어서 “프라이머(primer)”란 짧은 자유 3말단 수산화기(free 3`hydroxyl group)을 가지는 핵산 서열로 상보적인 주형(template)과 작용하는 염기쌍(base pair)을 형성할 수 있고 주형의 복사를 위한 시작지점으로서 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 중합효소 또는 역전사효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재 하에서 DNA 합성을 개시할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다. 상기 프라이머 쌍은 정배열 프라이머 및 역배열 프라이머가 하나의 쌍으로 구성된다.In the present invention, a "primer" is a nucleic acid sequence having a short free 3'hydroxyl group, which can form a base pair that works with a complementary template and copies the template. refers to a short nucleic acid sequence as a starting point for Primers can initiate DNA synthesis in the presence of a reagent for polymerization (i.e., DNA polymerase or reverse transcriptase) and four different nucleoside triphosphates in an appropriate buffer and temperature. PCR conditions and lengths of sense and antisense primers can be modified based on those known in the art. The primer pair is composed of a forward alignment primer and a reverse alignment primer.

이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.As above, specific parts of the present invention have been described in detail, and for those skilled in the art, it is clear that these specific descriptions are only preferred embodiments, and the scope of the present invention is not limited thereby. something to do. Accordingly, the substantial scope of the present invention will be defined by the appended claims and their equivalents.

A: 고위험대장선종
CL: 진행성 대장암
UL: 궤양성 대장염
W: 정상 상태
A: High-risk colorectal adenoma
CL: advanced colorectal cancer
UL: Ulcerative Colitis
W: steady state

Claims (6)

삭제delete 삭제delete 삭제delete (a) 개체의 생물학적 시료에서 DNA를 분리하는 단계; (b) 상기 분리된 DNA에 대하여 PCR을 수행하는 단계; 및 (c) 상기 PCR 산물의 서열분석을 통하여 장내 미생물균총에서 Bacteroides vulgatus, Tyzzerella nexilis 및 Lachnoclostridium pacaense의 함량을 순차적으로 확인하는 단계를 포함하고,
(c) 단계 이후에
Bacteroides vulgatus의 함량이 0.02% 초과인 경우 정상으로 판별하는 단계; 및
Bacteroides vulgatus의 함량이 0.02% 이하이고,
Tyzzerella nexilis의 함량이 0.000759% 이상인 경우 진행성 대장선종으로 판별하는 단계를 추가로 포함하는 것인, 대장 질환 진단을 위한 정보제공방법.
(a) isolating DNA from the subject's biological sample; (b) performing PCR on the isolated DNA; And (c) sequentially confirming the contents of Bacteroides vulgatus, Tyzzerella nexilis and Lachnoclostridium pacaense in the intestinal microflora through sequencing of the PCR product,
After step (c)
Determining the content of Bacteroides vulgatus as normal if it exceeds 0.02%; and
The content of Bacteroides vulgatus is less than 0.02%,
If the content of Tyzzerella nexilis is 0.000759% or more, an information providing method for diagnosing colorectal disease, which further comprises the step of determining that it is a progressive colorectal adenoma.
제4항에 있어서,
상기 방법은 (c) 단계 이후에
Bacteroides vulgatus의 함량이 0.02% 이하이고,
Tyzzerella nexilis의 함량이 0.000759% 미만이고,
Lachnoclostridium pacaense의 함량이 0.000536% 초과인 경우 궤양성 대장염으로 판별하는 단계를 추가로 포함하는 것인, 대장 질환 진단을 위한 정보제공방법.
According to claim 4,
The method after step (c)
The content of Bacteroides vulgatus is less than 0.02%,
The content of Tyzzerella nexilis is less than 0.000759%,
If the content of Lachnoclostridium pacaense is greater than 0.000536%, it further comprises the step of determining ulcerative colitis, an information providing method for diagnosing colon disease.
제4항에 있어서,
상기 방법은 (c) 단계 이후에
Bacteroides vulgatus의 함량이 0.02% 이하이고,
Tyzzerella nexilis의 함량이 0.000759% 미만이고,
Lachnoclostridium pacaense의 함량이 0.000536% 이하인 경우 진행성 대장암으로 판별하는 단계를 추가로 포함하는, 대장 질환 진단을 위한 정보제공방법.
According to claim 4,
The method after step (c)
The content of Bacteroides vulgatus is less than 0.02%,
The content of Tyzzerella nexilis is less than 0.000759%,
An information providing method for diagnosing colon disease, further comprising determining that the content of Lachnoclostridium pacaense is 0.000536% or less as advanced colon cancer.
KR1020210000097A 2020-11-19 2021-01-04 Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa KR102513540B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20200155231 2020-11-19
KR1020200155231 2020-11-19

Publications (2)

Publication Number Publication Date
KR20220068865A KR20220068865A (en) 2022-05-26
KR102513540B1 true KR102513540B1 (en) 2023-03-24

Family

ID=81808343

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210000097A KR102513540B1 (en) 2020-11-19 2021-01-04 Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa

Country Status (1)

Country Link
KR (1) KR102513540B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240048991A (en) 2022-10-07 2024-04-16 한림대학교 산학협력단 Nonalcoholic liver disease differential diagnosis method through intestinal microflora analysis
KR20240048990A (en) 2022-10-07 2024-04-16 한림대학교 산학협력단 Alcoholic liver disease differential diagnosis method through intestinal microflora analysis
KR20240048992A (en) 2022-10-07 2024-04-16 한림대학교 산학협력단 Viral liver disease differential diagnosis method through intestinal microflora analysis

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020182922A1 (en) 2019-03-13 2020-09-17 Goodgut S.L. Improved method for the screening, diagnosis and/or monitoring of colorectal advanced neoplasia, advanced adenoma and/or colorectal cancer

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101915360B1 (en) 2015-09-22 2018-11-08 고려대학교 산학협력단 Biomarker compositions, kits for the diagnosis, and method for provision of information thereof
KR102141246B1 (en) * 2018-05-25 2020-08-04 주식회사 엠디헬스케어 Method for the diagnosis of colon cancer using analysis of qPCR
KR20200068248A (en) * 2018-12-05 2020-06-15 대구한의대학교산학협력단 Development of selective quantitative comparative analysis of intestinal microbiome

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020182922A1 (en) 2019-03-13 2020-09-17 Goodgut S.L. Improved method for the screening, diagnosis and/or monitoring of colorectal advanced neoplasia, advanced adenoma and/or colorectal cancer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
M P Conte et al., Inflammatory Bowel Disease, 55, p.1760-1767, 2006.*

Also Published As

Publication number Publication date
KR20220068865A (en) 2022-05-26

Similar Documents

Publication Publication Date Title
KR102513540B1 (en) Differential diagnosis method of high risk colonic adenoma, advanced colorectal cancer, ulcerative colitis and normal control with the metagenomics analysis of colonic mucosa
Flemer et al. Tumour-associated and non-tumour-associated microbiota in colorectal cancer
Maffei et al. Biological aging and the human gut microbiota
CN105368944B (en) Biomarker of detectable disease and application thereof
Papa et al. Non-invasive mapping of the gastrointestinal microbiota identifies children with inflammatory bowel disease
Sepehri et al. Microbial diversity of inflamed and noninflamed gut biopsy tissues in inflammatory bowel disease
Ringel-Kulka et al. Molecular characterization of the intestinal microbiota in patients with and without abdominal bloating
CN107075446B (en) Biomarkers for obesity related diseases
CN111430027B (en) Duplex affective disorder biomarker based on intestinal microorganisms and screening application thereof
Biagi et al. Gut microbiome in Down syndrome
CN108350510A (en) For diagnosis of the gastrointestinal health associated disease from microbial population and therapy and system
Mahnic et al. Distinct types of gut microbiota dysbiosis in hospitalized gastroenterological patients are disease non-related and characterized with the predominance of either Enterobacteriaceae or Enterococcus
CN108474037A (en) Pu Shi dwell bacillus faecalis relationship group I and/or relationship group II member quantitative approach and its purposes as biomarker
Somineni et al. Site-and taxa-specific disease-associated oral microbial structures distinguish inflammatory bowel diseases
CN109266766A (en) Purposes of the enteric microorganism as cholangiocellular carcinoma diagnosis marker
Cushing et al. Predicting risk of postoperative disease recurrence in Crohn’s disease: patients with indolent Crohn’s disease have distinct whole transcriptome profiles at the time of first surgery
CN114231633B (en) Application of exosomes ARPC5, STK3 and the like in lung cancer diagnosis
US10982283B2 (en) Indices of microbial diversity relating to health
CN111647673A (en) Application of microbial flora in acute pancreatitis
Voss et al. A study comparing the healthy and diseased equine glandular gastric microbiota sampled with sheathed transendoscopic cytology brushes
Chamorro et al. Landscapes and bacterial signatures of mucosa-associated intestinal microbiota in Chilean and Spanish patients with inflammatory bowel disease
Sharma et al. Exploring the Genetic Basis of Tuberculosis Susceptibility in Human Populations
Berbisá et al. Similar gut bacterial composition between patients with ulcerative colitis and healthy controls in a high incidence population: a cross-sectional study of the Faroe Islands IBD cohort
CN111363803A (en) Intestinal flora microorganism for evaluation of allergic purpura in children
CN106795480A (en) Biomarker of rheumatoid arthritis and application thereof

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant