KR102329509B1 - Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae - Google Patents

Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae Download PDF

Info

Publication number
KR102329509B1
KR102329509B1 KR1020200088766A KR20200088766A KR102329509B1 KR 102329509 B1 KR102329509 B1 KR 102329509B1 KR 1020200088766 A KR1020200088766 A KR 1020200088766A KR 20200088766 A KR20200088766 A KR 20200088766A KR 102329509 B1 KR102329509 B1 KR 102329509B1
Authority
KR
South Korea
Prior art keywords
diabetes
strain
risk
predicting
composition
Prior art date
Application number
KR1020200088766A
Other languages
Korean (ko)
Inventor
원성호
김강진
김남은
박상철
이상헌
Original Assignee
서울대학교산학협력단
단국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단, 단국대학교 산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020200088766A priority Critical patent/KR102329509B1/en
Application granted granted Critical
Publication of KR102329509B1 publication Critical patent/KR102329509B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Abstract

The present invention relates to a composition for predicting or diagnosing a diabetes risk, comprising a formulation capable of detecting microorganisms of a Lachnospiraceae strain; a kit comprising the composition; a method of providing information for predicting or diagnosing a diabetes risk; and a diabetes prevention or treatment screening method. According to one aspect of the present invention, since GU174097_g, which is a Lachnospiraceae genus microorganism, is present more in a normal group than in a diabetic group and a diabetes risk group, a composition comprising a formulation capable of detecting the strain GU174097_g, a kit comprising the composition, an information providing method for predicting or diagnosing a diabetes risk, the method comprising a step of performing amplification by reacting a primer for the strain GU174097_g from a subject's sample, and a diabetes prevention or treatment screening method have an excellent effect in predicting or diagnosing the risk of diabetes or screening an agent for preventing or treating diabetes.

Description

라크노스피로세 과 균주의 미생물을 검출할 수 있는 제제를 포함하는 당뇨병 위험도 예측 또는 진단용 조성물 {Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae}Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae

본 명세서에는 라크노스피로세(Lachnospiraceae) 과 균주의 미생물을 검출할 수 있는 제제를 포함하는 당뇨병 위험도 예측 또는 진단용 조성물, 상기 조성물을 포함하는 키트, 라크노스피로세 과 균주의 미생물에 특이적인 프라이머를 반응시키는 단계를 포함하는 당뇨병 위험도 예측 또는 진단을 위한 정보제공방법, 및 피험자의 샘플에서 라크노스피로세 과 균주의 미생물의 변화를 검출하는 단계를 포함하는 당뇨병 예방 또는 치료제 스크리닝 방법이 개시된다.In the present specification, Lachnospiraceae and a composition for predicting or diagnosing diabetes risk comprising an agent capable of detecting microorganisms of the family strain, a kit comprising the composition, a primer specific to the microorganism of the Lachnospiraceae family strain Disclosed are a method for providing information for predicting or diagnosing diabetes risk, including reacting, and a screening method for preventing or treating diabetes, including detecting a change in microorganisms of the Lachnospirosaceae strain in a sample of a subject.

종래 연구는 당뇨병, 비만, 건선 및 과민성 장 증후군과 같은 질환에서 박테리아 군집(bacterial community)의 필수적인 역할을 확인했다. 당뇨병, 구체적으로 제2형 당뇨병 (type 2 diabetes mellitus, T2DM)과 관련된 장내 미생물 총 연구(intestinal microbial total studies)는 미생물 군집 데이터, 미생물 수집, 및 게놈 내용의 적용이 진단, 치료, 및 궁극적인 예방에 있어 사용될 수 있음을 제안하였다. 그러나, 미생물 군집은 내장에서부터 순환 혈액과 같은 기존에 고려되었던 멸균 환경에 이르기까지 인체 전체에서 발견된다. 따라서, 장 뿐만 아니라, 인체 전체에서 미생물의 역학(dynamics) 또는 안정성에 대한 이해가 중요하다. 현재까지, 장의 박테리아 게놈 정보 및 단사슬 지방산(short-chain fatty acid, SCFA)과 같은 대사산물 정보가 주로 조사되었다.Previous studies have identified an essential role of the bacterial community in diseases such as diabetes, obesity, psoriasis and irritable bowel syndrome. Intestinal microbial total studies related to diabetes, specifically type 2 diabetes mellitus (T2DM), have shown that the application of microbial community data, microbial collection, and genomic content to diagnosis, treatment, and eventual prevention It has been suggested that it can be used in However, microbial communities are found throughout the human body, from the gut to previously considered sterile environments such as circulating blood. Therefore, it is important to understand the dynamics or stability of microorganisms not only in the intestine but also in the entire human body. To date, information on intestinal bacteria genome and metabolite information such as short-chain fatty acid (SCFA) have been mainly investigated.

박테리아에서 사람에게 존재하는 세포외 소포(extracellular vesicles, EV)는 처음에는 세포로부터 노폐물인 화합물을 제거하는 수단으로 설명되었지만, 최근에는 세포들 사이에서, 핵산에서 지질 및 단백질까지 물질(components)을 교환하는 능력에 초점이 맞춰져 왔다. 또한, 세포외 소포는 항상성이 정상적인 세포에서 또는 병리적인 발달의 결과로서 신호 전달의 수단으로 작용한다는 것이 밝혀졌다. 장내 미생물과 비교할 때, 세포외 소포는 신체의 장 벽(intestinal barrier)을 통해 미생물의 역학 및 안정성을 조사하는 데 더 적합하다. 장내 미생물-유래 세포외 소포는 최근데 장내 미생물과 숙주 사이의 주요 커뮤니케이션 전달자로 제안되어 왔는데, 이는 장내 미생물(intestinal microflora)와 비교할 때 분비된 세포외 소포가 장 벽을 통과하여 장 순환으로 들어갈 수 있기 때문이다. 대변 마이크로바이옴(microbiome)은 인간 마이크로바이옴의 대표적인 마커임에도 불구하고, 대변 샘플은 인간 장(gut) 전체를 직접 샘플링한 것과 비교할 때 점막이 있는 마이크로바이옴에 대한 제한된 정보를 제공한다(Zmora, N., et al., Personalized gut mucosal colonization resistance to empiric probiotics is associated with unique host and microbiome features. Cell, 2018. 174(6): p. 1388-1405. e21). 따라서, 마이크로바이옴 세포외 소포를 식별(identify)하면 우리 몸의 병리생리학적 메커니즘을 이해하게 된다. 이에 더하여, 인간 및 당뇨병, 구체적으로 제2형 당뇨병에서 소변을 통한 미생물-유래 세포외 소포의 상관관계 분석은 제한적이다.Existing from bacteria to humans, extracellular vesicles (EVs) were initially described as a means of removing waste compounds from cells, but more recently they exchange components, from nucleic acids to lipids and proteins, between cells. The focus has been on the ability to It has also been shown that extracellular vesicles serve as a means of signal transduction in homeostasis normal cells or as a result of pathological development. Compared with intestinal microbes, extracellular vesicles are more suitable for investigating the dynamics and stability of microbes through the body's intestinal barrier. Intestinal microflora-derived extracellular vesicles have recently been proposed as major communication carriers between the gut microbiota and the host, which, compared to the intestinal microflora, allows secreted extracellular vesicles to cross the intestinal wall and enter the intestinal circulation. because there is Although the fecal microbiome is a representative marker of the human microbiome, fecal samples provide limited information about the mucosal microbiome when compared to direct sampling of the entire human gut (Zmora, et al. N., et al., Personalized gut mucosal colonization resistance to empiric probiotics is associated with unique host and microbiome features . Cell, 2018. 174(6): p. 1388-1405. e21). Therefore, the identification of microbiome extracellular vesicles leads to an understanding of the pathophysiological mechanisms of our body. In addition, correlation analysis of microbe-derived extracellular vesicles via urine in humans and diabetes, specifically type 2 diabetes, is limited.

이러한 배경 하에, 본 발명자들은 당뇨병의 위험도를 예측 또는 진단하기 위한 바이오마커를 발굴하기 위해 메타게놈 분석을 수행하여, 본 발명을 완성하였다.Under this background, the present inventors completed the present invention by performing metagenomic analysis to discover biomarkers for predicting or diagnosing the risk of diabetes.

일 측면에서, 본 발명의 목적은, 당뇨병 위험도를 예측 또는 진단하기 위한 바이오마커를 제공하는 것이다.In one aspect, an object of the present invention is to provide a biomarker for predicting or diagnosing the risk of diabetes.

일 측면에서, 본 발명은, 라크노스피로세(Lachnospiraceae) 과 균주의 미생물을 검출할 수 있는 제제를 포함하는 당뇨병 위험도 예측 또는 진단용 조성물을 제공한다.In one aspect, the present invention, Lachnospiraceae ( Lachnospiraceae ) Provides a composition for predicting or diagnosing the risk of diabetes comprising an agent capable of detecting microorganisms of the family.

다른 측면에서, 본 발명은, 상기 조성물을 포함하는, 당뇨병 위험도 예측 또는 진단용 키트를 제공한다.In another aspect, the present invention provides a kit for predicting or diagnosing diabetes risk, comprising the composition.

또 다른 측면에서, 본 발명은, 피험자의 샘플로부터 게놈 DNA를 추출하는 단계; 상기 추출된 게놈 DNA에 라크노스피로세(Lachnospiraceae) 과 균주의 미생물에 특이적인 프라이머를 반응시키는 단계; 및 상기 반응물을 증폭시키는 단계;를 포함하는, 당뇨병 위험도 예측 또는 진단을 위한 정보제공방법을 제공한다.In another aspect, the present invention provides a method comprising: extracting genomic DNA from a sample of a subject; Reacting the extracted genomic DNA with a primer specific to the microorganism of the Lachnospiraceae strain; and amplifying the reactant; provides an information providing method for predicting or diagnosing diabetes risk, including.

또 다른 측면에서, 본 발명은, 당뇨병 예방 또는 치료제 후보 물질을 처리하는 단계; 상기 후보물질 처리 전 및 처리 후 피험자의 샘플에서 라크노스피로세(Lachnospiraceae) 과 균주의 미생물의 변화를 검출하는 단계; 및 상기 후보물질 처리 후 상기 라크노스피로세 과 균주의 미생물 검출량이 증가한 경우, 상기 후보물질을 당뇨병 예방 또는 치료제인 것으로 판단하는 단계를 포함하는, 당뇨병 예방 또는 치료제 스크리닝 방법을 제공한다.In another aspect, the present invention provides a method for preventing or treating diabetes mellitus; Detecting the change of microorganisms of the Lachnospiraceae and strains in the sample of the subject before and after the candidate treatment; And when the detection amount of the microorganism of the Lachnospirosceae strain increases after the candidate substance treatment, it provides a screening method for preventing or treating diabetes, comprising the step of determining that the candidate substance is a diabetes preventive or therapeutic agent.

본 발명의 일 측면에 따르면, 라크노스피로세(Lachnospiraceae) 과의 미생물인 GU174097_g는 당뇨병 군 및 당뇨병 위험군에 비하여 정상군에서 더 많이 존재하는바, 이를 통해 상기 균주 GU174097_g는 당뇨병, 구체적으로 제2형 당뇨병의 위험성을 감소시킬 수 있음을 확인하였다. 따라서, 상기 균주 GU174097_g를 검출할 수 있는 제제를 포함하는 조성물, 상기 조성물을 포함하는 키트, 피험자의 샘플로부터 상기 균주 GU174097_g에 대한 프라이머를 반응시켜 증폭시키는 단계를 포함하는 당뇨병 위험도를 예측 또는 진단하기 위한 정보제공방법은 당뇨병의 위험도를 예측 또는 진단하는 데 있어 우수한 효과가 있다. According to one aspect of the present invention, GU174097_g , a microorganism of the Lachnospiraceae family, is more present in the normal group than in the diabetic group and the diabetes risk group, through which the strain GU174097_g is diabetes, specifically type 2 It was confirmed that it can reduce the risk of diabetes. Therefore, a composition comprising an agent capable of detecting the strain GU174097_g , a kit comprising the composition, and a primer for the strain GU174097_g from a sample of a subject to react and amplify the risk for predicting or diagnosing diabetes The information provision method has an excellent effect in predicting or diagnosing the risk of diabetes.

도 1은 본 발명의 일 측면에 따라 피험자의 소변 샘플로부터 추출한 게놈 DNA로 16S rRNA 메타게놈 데이터를 수득하고, 이로부터 2013년, 2015년 및 2017년 각각의 샘플들의 미생물 조성물을 분석하여 알파-다양성을 계산한 결과를 나타낸 도이다. 도 1의 6P, 7P, 8P는 각각 2013년, 2015년 및 2017년 각각의 샘플로 구성된 데이터를 의미하며, 도 1의 관찰된 OUT(Observed OUT), ACE, Shannon 및 Simpson은 알파 다양성으로 간주된 것이다.
도 2는 본 발명의 일 측면에 따른 피험자의 16S rRNA 메타게놈 데이터로부터 2013년, 2015년 및 2017년 각각의 샘플들의 미생물 각 속의 변화 추세를 나타낸 도로서, NMDS plot을 통해 균총과 건강 요인의 연관성을 분석한 결과이다. 도 2의 6P, 7P, 8P는 각각 2013년, 2015년 및 2017년 각각의 샘플로 구성된 데이터를 의미한다.
도 3은 본 발명의 일 측면에 따른 피험자의 16S rRNA 메타게놈 데이터로부터 PERMANOVA 방법을 사용하여 2013년, 2015년 및 2017년 각각의 샘플들의 미생물 조성에서의 KARE 표현형과 인슐린 저항성(HOMA-IR)의 연관성을 조사한 결과 나타낸 도이다.
도 4a 및 도 4b는 본 발명의 일 측면에 따른 피험자의 16S rRNA 메타게놈 데이터로부터 2013년, 2015년 및 2017년 각각의 샘플들의 미생물 각 속의 변화 추세를 평균 상대적 존재비로 나타낸 도이다. 도 4a는 평균 상대적 존재비가 0.01 초과인(mean relative abundance >=0.01) 미생물, 도 4b는 평균 상대적 존재비가 0.01 미만인(mean relative abundance <0.01) 미생물이고, 도 4a 및 도 4b의 6P, 7P, 8P는 각각 2013년, 2015년 및 2017년 각각의 샘플로 구성된 데이터를 의미한다.
도 5는 본 발명의 일 측면에 따른 피험자의 16S rRNA 메타게놈 데이터로부터 당뇨병 군(DM 또는 T2D 군), 당뇨병 위험군(DM_before 또는 T2D 위험군) 및 정상군(Healthy) 각각의 GU174097_g 균주의 상대적 비율 평균(relative proportion mean)을 나타낸 도이다. 상기 상대적 비율 평균은 피험자 샘플의 전체 균주의 절대적 존재비(abundance)의 총 합에 대한 특정 균주(GU174097_g 균주)의 절대적 존재비(abundance)의 비율로서, 0 에서 1 사이의 값을 가진다. 도 5의 x 축의 Alltime Healthy는 추적 기간인 2013년에서 2017년 기간 동안 계속 정상군이었던 피험자, Alltime DM group은 동일 기간 동안 계속 당뇨병이었던 피험자, Worse는 정상에서 당뇨병 또는 당뇨병 전증(prediabetes) 상태로 전환한 피험자 또는 당뇨병 전증 상태에서 당뇨병으로 전환한 피험자를 의미한다.
도 6은 본 발명의 일 측면에 따른 피험자의 16S rRNA 메타게놈 데이터로부터 GU174097_g 균주와 KARE 표현형과의 네트워크 분석을 수행한 결과를 나타낸 도이다.
1 is obtained by obtaining 16S rRNA metagenomic data with genomic DNA extracted from a urine sample of a subject according to an aspect of the present invention, and analyzing the microbial composition of each sample in 2013, 2015 and 2017 from this to alpha-diversity It is a diagram showing the result of calculating . 6P, 7P, and 8P in Fig. 1 mean data composed of samples from 2013, 2015 and 2017, respectively, and Observed OUT, ACE, Shannon, and Simpson in Fig. 1 were considered alpha diversity. will be.
Figure 2 is a road showing the change trend of each microbial genus of each sample in 2013, 2015 and 2017 from 16S rRNA metagenomic data of a subject according to an aspect of the present invention, the association between the flora and health factors through the NMDS plot is the result of the analysis. 6P, 7P, and 8P of FIG. 2 mean data composed of samples in 2013, 2015, and 2017, respectively.
3 is a KARE phenotype and insulin resistance (HOMA-IR) in the microbial composition of each sample in 2013, 2015 and 2017 using the PERMANOVA method from 16S rRNA metagenomic data of a subject according to an aspect of the present invention. It is a diagram showing the result of investigating the correlation.
4A and 4B are diagrams showing the change trend of each microbial genus of each sample in 2013, 2015, and 2017 from 16S rRNA metagenomic data of a subject according to an aspect of the present invention as an average relative abundance. Figure 4a shows microorganisms with mean relative abundance >=0.01, Figure 4b shows microorganisms with mean relative abundance <0.01, and 6P, 7P, 8P of Figures 4a and 4b denotes data composed of samples from 2013, 2015, and 2017, respectively.
5 shows the relative ratio average of the GU174097_g strain of the diabetes group (DM or T2D group), the diabetes risk group (DM_before or T2D risk group) and the normal group (Healthy) from 16S rRNA metagenomic data of subjects according to an aspect of the present invention ( It is a diagram showing the relative proportion mean). The relative ratio average is the ratio of the absolute abundance of a particular strain ( GU174097_g strain) to the total sum of the absolute abundance of all strains in the subject sample, and has a value between 0 and 1. Alltime Healthy on the x-axis of FIG. 5 is the subject who continued to be normal during the follow-up period from 2013 to 2017, the Alltime DM group is the subject who continued to be diabetic during the same period, and Worse is converted from normal to diabetic or prediabetes. refers to a subject or a subject who has converted from pre-diabetes to diabetes.
6 is a diagram showing the results of performing a network analysis of the GU174097_g strain and the KARE phenotype from 16S rRNA metagenomic data of a subject according to an aspect of the present invention.

이하, 본 발명을 상세하게 설명한다.Hereinafter, the present invention will be described in detail.

본 발명의 일 측면에서, "당뇨병 위험도 예측"이란 피험자에 대하여 당뇨병이 발병할 가능성이 있는지, 당뇨병이 발병할 가능성이 상대적으로 높은지, 당뇨병의 원인인자가 무엇인지, 또는 당뇨병이 이미 발병하였는지 여부를 예측 또는 진단하는 것을 의미할 수 있다. 또한, 본 발명의 일 측면에서, "당뇨병 위험도 진단"이란 피험자에 대하여 병리 상태의 존재 또는 특징을 확인하는 것을 의미하며, 본 발명의 일 측면에 따른 목적상, 진단은 당뇨병의 발병 여부를 확인하는 것을 의미할 수 있다. 본 발명의 일 측면에 따른 조성물, 키트 또는 방법은 임의의 특정 환자에 대한 당뇨병 발병 위험도가 높은 환자로써 특별하고 적절한 관리를 통하여 발병 시기를 늦추거나 발병하지 않도록 하는데 사용할 수 있다. 또한, 본 발명의 일 측면에 따른 조성물, 키트 또는 방법은 당뇨병을 조기에 진단하여 가장 적절한 치료방식을 선택함으로써 치료를 결정하기 위해 임상적으로 사용될 수 있다.In one aspect of the present invention, "diabetes risk prediction" refers to whether the subject is likely to develop diabetes, whether the likelihood of developing diabetes is relatively high, what is the causative factor of diabetes, or whether diabetes has already occurred. It may mean predicting or diagnosing. In addition, in one aspect of the present invention, "diabetes risk diagnosis" means confirming the presence or characteristics of a pathological condition for a subject, and for the purpose of one aspect of the present invention, the diagnosis is to determine whether or not diabetes occurs. can mean that The composition, kit or method according to one aspect of the present invention can be used to delay or prevent the onset of diabetes through special and appropriate management as a patient with a high risk of developing diabetes for any specific patient. In addition, the composition, kit, or method according to one aspect of the present invention can be used clinically to determine treatment by diagnosing diabetes early and selecting the most appropriate treatment method.

본 발명의 일 측면에서, "메타게놈(metagenome)"이란 "군유전체"라고도 하며, 흙, 동물의 장 등 고립된 지역 내의 모든 바이러스, 세균, 곰팡이 등을 포함하는 유전체의 총합을 의미하는 것으로, 주로 배양이 되지 않는 미생물을 분석하기 위해서 서열분석기를 사용하여 한꺼번에 많은 미생물을 동정하는 것을 설명하는 유전체의 개념으로 쓰일 수 있다. 특히, 메타게놈은 한 종의 게놈 또는 유전체를 말하는 것이 아니라, 한 환경단위의 모든 종의 유전체로서 일종의 혼합유전체를 말한다. 이는 오믹스적으로 생물학이 발전하는 과정에서 한 종을 정의할 때 기능적으로 기존의 한 종뿐만 아니라, 다양한 종이 서로 상호작용하여 완전한 종을 만든다는 관점에서 나온 용어이다. 기술적으로는 빠른 서열분석법을 이용해서, 종에 관계없이 모든 DNA, RNA를 분석하여, 한 환경 내에서의 모든 종을 동정하고, 상호작용, 대사작용을 규명하는 기법의 대상이다. 본 발명의 일 측면에서, 피험자의 샘플, 구체적으로 소변에서 분리한 세포외 소포를 이용하여 메타게놈 분석을 실시하였다.In one aspect of the present invention, "metagenome" is also referred to as "microgenome", and refers to the sum of genomes including all viruses, bacteria, fungi, etc. in isolated areas such as soil and animal intestines, It can be used as a concept of genome to explain the identification of many microorganisms at once using a sequencer to analyze microorganisms that cannot be cultured. In particular, the metagenome does not refer to the genome or genome of one species, but a kind of mixed genome as the genome of all species in one environmental unit. This is a term derived from the point of view that when defining a species in the process of omics development of biology, not only one functionally existing species but also various species interact with each other to create a complete species. Technically, it is the subject of a technique that uses rapid sequencing, analyzes all DNA and RNA regardless of species, identifies all species in one environment, and identifies interactions and metabolism. In one aspect of the present invention, metagenomic analysis was performed using a sample of a subject, specifically, extracellular vesicles isolated from urine.

일 측면에서, 본 발명은 라크노스피로세(Lachnospiraceae) 과 균주의 미생물을 검출할 수 있는 제제를 포함하는 당뇨병 위험도 예측 또는 진단용 조성물을 제공한다.In one aspect, the present invention provides a composition for predicting or diagnosing diabetes risk comprising an agent capable of detecting microorganisms of Lachnospiraceae and strains.

본 발명의 일 측면에서, 상기 라크노스피로세(Lachnospiraceae) 과 균주는 다양한 식물 다당류를 단사슬 지방산(short-chain fatty acid, SCFA) 및 알코올로 발효시키는 클로스트리디움(Clostridiales) 목의 혐기성, 포자 형성 균주로, 상기 라크노스피로세(Lachnospiraceae) 과는 SCFA 생산 경로와 관련 있다. 박테리아 교차-공급(cross-feeding)은 SCFA 생산의 최종 균형 및 인간의 장에 도달하는 기질의 효율적인 이용에 큰 영향을 미친다. 프로피온산 (propionate) 형성에 있어 콜로니 박테리아에 의해 3 가지 상이한 경로가 사용된다: 숙신산 경로(succinate pathway), 아크릴산 경로(acrylate pathway), 및 프로파노디올 경로(propanodiol pathway). 아크릴산 경로에서, 젖산은 락토일-CoA 탈수효소(lactoyl-CoA dehydratase) 및 다운 스트림 효소 반응(downstream enzymatic reactions)의 활성을 통해, SCFA 중 하나인 프로피온산(propionate)으로 전환되고; 이 경로는 베일로넬라세(Veillonellaceae) 및 라크노스피로세(Lachnospiraceae) 과의 일부 구성원으로 제한되어 있는 것으로 보인다(Flint, H.J., et al., Links between diet, gut microbiota composition and gut metabolism. Proceedings of the Nutrition Society, 2015. 74(1): p. 13-22). 또한, 디옥시-당(deoxy-sugar)의 프로피온산(propionate)으로의 전환을 특징으로 하는 프로파노디올 경로에서, 프로피온알데히드(propionaldehyde)를 프로피오닐-CoA(propionyl-CoA)로 전환시키는 CoA-의존성 프로피온알데히드 탈수효소(CoA-dependent propionaldehyde dehydrogenase)는 프로테오박테리아(proteobacteria) 및 라크노스피로세(Lachnospiraceae) 과의 구성원을 포함하는 박테리아에 존재한다(Reichardt, N., et al., Phylogenetic distribution of three pathways for propionate production within the human gut microbiota. The ISME journal, 2014. 8(6): p. 1323). In one aspect of the present invention, the Lachnospiraceae family strain is anaerobic, spores of the order Clostridiales that ferment various plant polysaccharides with short-chain fatty acid (SCFA) and alcohol As a forming strain, the Lachnospiraceae family is related to the SCFA production pathway. Bacterial cross-feeding has a major impact on the final balance of SCFA production and efficient utilization of substrates to reach the human gut. Three different pathways are used by colony bacteria for propionate formation: the succinate pathway, the acrylate pathway, and the propanodiol pathway. In the acrylic acid pathway, lactic acid is converted to propionate, one of the SCFAs, through the activity of lactoyl-CoA dehydratase and downstream enzymatic reactions; This path seems to be a veil restricted to some members of Ner La (Veillonellaceae) and Lac North fatigue three (Lachnospiraceae) (Flint, HJ, et al., Links between diet, gut microbiota composition and gut metabolism. Proceedings of the Nutrition Society, 2015. 74(1): p. 13-22). In addition, in the propanodiol pathway characterized by the conversion of deoxy-sugar to propionate, CoA-dependent conversion of propionaldehyde to propionyl-CoA CoA-dependent propionaldehyde dehydrogenase is present in bacteria, including proteobacteria and members of the Lachnospiraceae family (Reichardt, N., et al., Phylogenetic distribution of three) Pathways for propionate production within the human gut microbiota . The ISME journal, 2014. 8(6): p. 1323).

본 발명의 일 측면에서, 상기 라크노스피로세 과 균주는 16S rRNA 유전자 서열이 서열번호 1의 서열과 90% 이상의 상동성을 가지고 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열로 표시되는 GU174097_g 균주일 수 있다. 구체적으로, 상기 GU174097_g 균주는 16S rRNA을 포함하고, 상기 GU174097_g 균주의 16S rRNA 유전자 서열의 V3 내지 V4 부분(region), 보다 구체적으로 V3 및 V4 부분(region)이 서열번호 1의 서열과 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상의 상동성을 가지는 서열로 표시되는 것일 수 있고, 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열일 수 있다. 본 발명의 일 실시예에 따르면, 라크노스피로세(Lachnospiraceae) 과의 미생물인 GU174097_g는 당뇨병 군 및 당뇨병 위험군에 비하여 정상군에서 더 많이 존재하는바, 이로써 본 발명의 일 측면에 따른 상기 균주 GU174097_g를 검출할 수 있는 제제를 포함하는 조성물은 당뇨병의 위험도를 예측 또는 진단하는 데 있어 우수한 효과가 있음을 확인하였다. In one aspect of the present invention, the Lachnospirose family strain is GU174097_ g strain in which the 16S rRNA gene sequence is represented by a sequence having 90% or more homology with the sequence of SEQ ID NO: 1 and having predictive or diagnostic ability of diabetes risk can be Specifically, the GU174097_ g strain contains 16S rRNA, and the V3 to V4 region (region) of the 16S rRNA gene sequence of the GU174097_ g strain, more specifically the V3 and V4 region (region) is the sequence of SEQ ID NO: 1 and 90 % or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more. It may be a sequence having the ability to predict or diagnose diabetes risk. According to an embodiment of the present invention, GU174097_g , a microorganism of the Lachnospiraceae family, is more present in the normal group than in the diabetic group and the diabetes risk group, whereby the strain GU174097_g according to one aspect of the present invention is It was confirmed that the composition containing the detectable agent has an excellent effect in predicting or diagnosing the risk of diabetes.

본 발명의 일 측면에서, 상기 당뇨병은 제2형 당뇨병일 수 있다.In one aspect of the present invention, the diabetes may be type 2 diabetes.

본 발명의 일 측면에서, 상기 당뇨병은 하기 i) 내지 iii)의 선정기준 중 하나 이상을 만족하는 것일 수 있다:In one aspect of the present invention, the diabetes may satisfy one or more of the following selection criteria i) to iii):

i) 공복혈당 100 mg/dL 이상;i) fasting blood sugar greater than 100 mg/dL;

ii) 경구 당부하 120분 혈당 140 mg/dL 이상; 및ii) oral glucose tolerance 120 min blood glucose 140 mg/dL or higher; and

iii) 당화혈색소(HbA1c) 수치 5.7% 이상.iii) Glycated hemoglobin (HbA1c) level of 5.7% or higher.

본 발명의 일 측면에서, 상기 i) 선정기준은 구체적으로, 공복혈당이 100 mg/dL 이상, 102 mg/dL 이상, 104 mg/dL 이상, 106 mg/dL 이상, 108 mg/dL 이상, 110 mg/dL 이상, 112 mg/dL 이상, 114 mg/dL 이상, 116 mg/dL 이상, 118 mg/dL 이상, 120 mg/dL 이상, 122 mg/dL 이상, 124 mg/dL 이상 또는 126 mg/dL 이상일 수 있다.In one aspect of the present invention, the i) selection criteria are specifically, fasting blood sugar of 100 mg/dL or more, 102 mg/dL or more, 104 mg/dL or more, 106 mg/dL or more, 108 mg/dL or more, 110 mg/dL or higher, 112 mg/dL or higher, 114 mg/dL or higher, 116 mg/dL or higher, 118 mg/dL or higher, 120 mg/dL or higher, 122 mg/dL or higher, 124 mg/dL or higher, or 126 mg/dL or higher dL or higher.

본 발명의 일 측면에서, 상기 ii) 선정기준은 구체적으로, 경부 당부하 120분 혈당이 140 mg/dL 이상, 150 mg/dL 이상, 160 mg/dL 이상, 170 mg/dL 이상, 180 mg/dL 이상, 190 mg/dL 이상 또는 200 mg/dL 이상일 수 있다.In one aspect of the present invention, the ii) selection criterion is specifically, a 120-minute cervical glucose load blood sugar of 140 mg/dL or more, 150 mg/dL or more, 160 mg/dL or more, 170 mg/dL or more, 180 mg/dL or more. dL or more, 190 mg/dL or more, or 200 mg/dL or more.

본 발명의 일 측면에서, 상기 iii) 선정기준은 구체적으로, 당화혈색소(HbA1c) 수치가 5.7% 이상, 5.8% 이상, 5.9% 이상, 6.0% 이상, 6.1% 이상, 6.2% 이상, 6.3% 이상, 6.4% 이상 또는 6.5% 이상일 수 있다.In one aspect of the present invention, the iii) selection criterion is specifically, glycated hemoglobin (HbA1c) level of 5.7% or more, 5.8% or more, 5.9% or more, 6.0% or more, 6.1% or more, 6.2% or more, 6.3% or more , 6.4% or more or 6.5% or more.

본 발명의 일 측면에서, 상기 조성물은 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물을 검출할 수 있는 제제를 추가로 포함할 수 있다. 본 발명의 일 실시예에 따르면, 하프니아(Hafnia) 속 및 콜린셀라(Collinsella) 속과 당뇨병과 관련된 표현형 중 당화혈색소(HbA1c)는 양의 상관관계가 있는바, 이로써 본 발명의 일 측면에 따른 상기 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물을 검출할 수 있는 제제를 포함하는 조성물은 당뇨병의 위험도를 예측 또는 진단하는 데 있어 우수한 효과가 있다.In one aspect of the invention, the composition may further comprise an agent capable of detecting one or more microorganisms selected from the group consisting of hafnia (Hafnia) sp and choline Cellar (Collinsella) sp. According to one embodiment of the present invention, hafnia (Hafnia) inside and choline Cellar (Collinsella) in the glycosylated hemoglobin (HbA1c) of the phenotypes associated with diabetes is that a positive correlation between the bar, so that in accordance with an aspect of the present invention composition comprising an agent capable of detecting one or more microorganisms selected from the hafnia (hafnia) inside the group consisting of strains and choline Cellar (Collinsella) in the strain has the excellent effect it in predicting or diagnosing the risk of diabetes.

본 발명의 일 측면에서, 당뇨병 군 및 당뇨병 위험군에 비하여 정상군에서 라크노스피로세(Lachnospiraceae) 과의 미생물이 특이적으로 증가하고, 하프니아(Hafnia) 속 균주 또는 콜린셀라(Collinsella) 속 균주의 미생물은 특이적으로 감소함을 규명하고, 이에 기초하여, 라크노스피로세(Lachnospiraceae) 과 균주, 및 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군으로부터 선택된 하나 이상의 미생물을 당뇨병 위험도 예측 또는 진단을 위한 바이오마커로 제공함을 특징으로 한다. In one aspect of the present invention, the microorganisms of the Lachnospiraceae family are specifically increased in the normal group compared to the diabetes group and the diabetes risk group, and Hafnia ( Hafnia ) sp. strain or Collinsella sp. strain It is identified that microorganisms are specifically reduced, and based on this, Lachnospiraceae and strains, and Hafnia spp . strains and Collinsella spp . One or more microorganisms selected from the group consisting of strains It is characterized in that it is provided as a biomarker for predicting or diagnosing diabetes risk.

본 발명의 일 측면에서, 상기 검출할 수 있는 제제는 샘플 내에서 당뇨병의 위험도 예측 또는 진단 마커인 라크노스피로세 과의 미생물, 또는 하프니아 속 균주 및 콜린셀라 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물의 존재를 검출하기 위하여 사용될 수 있는 물질을 의미할 수 있다. 예를 들어, 라크노스피로세 과의 미생물, 또는 하프니아 속 균주 및 콜린셀라 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물에 특이적으로 존재하는 단백질, 핵산, 지질, 당지질, 당단백질 또는 당(단당류, 이당류, 올리고당류 등) 등과 같은 유기 생체 분자를 특이적으로 검출할 수 있는 프라이머, 프로브, 안티센스 올리고뉴클레오티드, 압타머 및 항체로 이루어진 군에서 선택된 하나 이상일 수 있다.In one aspect of the present invention, the detectable agent is at least one selected from the group consisting of microorganisms of the Lachnospirosaceae family, or Hafnia sp. It may refer to a substance that can be used to detect the presence of microorganisms. For example, proteins, nucleic acids, lipids, glycolipids, glycoproteins or sugars (monosaccharides , disaccharides, oligosaccharides, etc.) may be one or more selected from the group consisting of primers, probes, antisense oligonucleotides, aptamers, and antibodies capable of specifically detecting organic biomolecules.

본 발명의 일 측면에서, 상기 미생물 검출 제제는 항체일 수 있으며, 항원-항체 반응을 기반으로 한 면역학적 방법을 사용하여 해당 미생물을 검출할 수 있다. 이를 위한 분석 방법으로는 웨스턴 블랏, ELISA(enzyme linked immunosorbent assay), 방사선면역분석(RIA: Radioimmunoassay), 방사면역확산법(radioimmunodiffusion), 오우크 테로니(Ouchterlony) 면역 확산법, 로케이트(rocket) 면역전기영동, 조직면역 염색, 면역침전 분석법(Immunoprecipitation assay), 보체고정분석법 (Complement Fixation Assay), FACS(Fluorescence activated cell sorter), 단백질 칩(protein chip) 등이 있으나, 이에 제한되지 않는다.In one aspect of the present invention, the microorganism detection agent may be an antibody, and an antigen-antibody reaction-based immunological method may be used to detect the microorganism. Analysis methods for this include western blot, ELISA (enzyme linked immunosorbent assay), radioimmunoassay (RIA), radioimmunodiffusion, Ouchterlony immunodiffusion, and rocket immunoelectrolysis. Electrophoresis, tissue immunostaining, immunoprecipitation assay, complement fixation assay, fluorescence activated cell sorter (FACS), protein chip, etc., but are not limited thereto.

본 발명의 일 측면에서, 상기 미생물을 검출할 수 있는 제제는 라크노스피로세 과의 미생물, 또는 하프니아 속 균주 및 콜린셀라 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물에 특이적인 프라이머일 수 있다. 상기 프라이머란, 주형 가닥에 상보적인 염기쌍(base pair)을 형성할 수 있고, 주형 가닥 복사를 위한 시작 지점으로 기능하는 7개 내지 50개의 핵산서열을 의미한다. 프라이머는 보통 합성하지만 자연적으로 생성된 핵산에서 이용할 수도 있다. 프라이머의 서열은 반드시 주형의 서열과 정확히 같을 필요는 없으며, 충분히 상보적이어서 주형과 혼성화될 수 있으면 된다. 프라이머의 기본 성질을 변화시키지 않는 추가의 특징을 혼입할 수 있다. 혼입할 수 있는 추가의 특징의 예로 메틸화, 캡화, 하나 이상의 핵산을 동족체로의 치환 및 핵산 간의 변형 등이 있으나, 이에 제한되지 않는다.In one aspect of the present invention, the agent capable of detecting the microorganism may be a primer specific to one or more microorganisms selected from the group consisting of microorganisms of the Lachnospirosaceae family, or Hafnia sp. strains and Colincella sp. strains. The primer means 7 to 50 nucleic acid sequences capable of forming a base pair complementary to the template strand and functioning as a starting point for template strand copying. Primers are usually synthesized but can also be used on naturally occurring nucleic acids. The sequence of the primer does not necessarily have to be exactly the same as the sequence of the template, but only if it is sufficiently complementary to hybridize with the template. Additional features that do not change the basic properties of the primer may be incorporated. Examples of additional features that may be incorporated include, but are not limited to, methylation, encapsulation, substitution of one or more nucleic acids with homologs, and modifications between nucleic acids.

본 발명의 일 측면에서, 상기 프라이머는 라크노스피로세 과의 미생물, 또는 하프니아 속 균주 및 콜린셀라 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물의 16S rRNA를 증폭할 수 있는 프라이머일 수 있다. 상기 16S rRNA는, 원핵생물 리보솜의 30S 소단위체를 구성하고 있는 rRNA로, 염기서열이 대부분이 상당히 보존되어 있는 한편, 일부 구간에서는 높은 염기서열 다양성이 나타난다. 특히 동종 간에는 다양성이 거의 없는 반면에 타종 간에는 다양성이 나타나므로 16S rRNA의 서열을 비교하여 원핵생물을 유용하게 동정할 수 있다. In one aspect of the present invention, the primer may be a primer capable of amplifying 16S rRNA of one or more microorganisms selected from the group consisting of a microorganism of the Lachnospirose family, or a strain of Hafnia sp. and a sp. strain of Colincella. The 16S rRNA is an rRNA constituting the 30S subunit of the prokaryotic ribosome, and while most of the nucleotide sequences are highly conserved, high nucleotide sequence diversity appears in some sections. In particular, since there is little diversity among homogeneous species while diversity appears among other species, prokaryotes can be usefully identified by comparing the sequences of 16S rRNA.

본 발명의 일 측면에서, 상기 라크노스피로세 과 미생물은 16S rRNA 유전자서열이 서열번호 1의 서열과 90% 이상의 상동성을 가지고 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열로 표시되는 GU174097_g 균주일 수 있다. 구체적으로, 상기 GU174097_g 균주는 16S rRNA을 포함하고, 상기 GU174097_g 균주의 16S rRNA 유전자 서열의 V3 내지 V4 부분(region), 보다 구체적으로 V3 및 V4 부분(region)이 서열번호 1의 서열과 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상의 상동성을 가지는 서열로 표시되는 것일 수 있고, 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열일 수 있다. In one aspect of the present invention, the Lachnospirosceae microorganism is 16S rRNA gene sequence GU174097_ g strain represented by a sequence having 90% or more homology to the sequence of SEQ ID NO: 1 and predicting or diagnosing the risk of diabetes can be Specifically, the GU174097_ g strain contains 16S rRNA, and the V3 to V4 region (region) of the 16S rRNA gene sequence of the GU174097_ g strain, more specifically the V3 and V4 region (region) is the sequence of SEQ ID NO: 1 and 90 % or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more. It may be a sequence having the ability to predict or diagnose diabetes risk.

본 발명의 일 측면에서, 상기 라크노스피로세 과 미생물은 16S rRNA 유전자 서열이 서열번호 2의 서열과 90% 이상의 상동성을 가지고 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열로 표시되는 미생물일 수 있다. 구체적으로, 상기 라크노스피로세 과 미생물은 16S rRNA을 포함하고, 상기 라크노스피로세 과 미생물의 16S rRNA 유전자 서열의 V3 내지 V4 부분(region), 보다 구체적으로 V3 및 V4 부분(region)이 서열번호 2의 서열과 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상의 상동성을 가지는 서열로 표시되는 것일 수 있고, 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열일 수 있다.In one aspect of the present invention, the Lachnospirosceae microorganism is a microorganism in which the 16S rRNA gene sequence is 90% or more homologous to the sequence of SEQ ID NO: 2 and is a microorganism represented by a sequence having predictive or diagnostic ability of diabetes risk. have. Specifically, the Lachnospirosceae microorganisms include 16S rRNA, and V3 to V4 regions of the 16S rRNA gene sequence of the Lachnospirosceae microorganisms, more specifically V3 and V4 regions (region) are sequenced As a sequence having more than 90%, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more homology with the sequence of number 2 It may be displayed, and may be a sequence having predictive or diagnostic ability of diabetes risk.

본 발명의 일 측면에서, 상기 하프니아 속 균주는 16S rRNA 유전자 서열이 서열번호 3의 서열과 90% 이상의 상동성을 가지고 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열로 표시되는 미생물일 수 있다. 구체적으로, 상기 하프니아 속 균주는 16S rRNA을 포함하고, 상기 하프니아 속 균주의 16S rRNA 유전자 서열의 V3 내지 V4 부분(region), 보다 구체적으로 V3 및 V4 부분(region)이 서열번호 3의 서열과 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상의 상동성을 가지는 서열로 표시되는 것일 수 있고, 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열일 수 있다.In one aspect of the present invention, the Hafnia sp. strain may be a microorganism in which the 16S rRNA gene sequence has 90% or more homology with the sequence of SEQ ID NO: 3 and is represented by a sequence having predictive or diagnostic ability of diabetes risk. Specifically, the Hafnia sp. strain includes 16S rRNA, and V3 to V4 regions, more specifically V3 and V4 regions, of the 16S rRNA gene sequence of the Hafnia sp. strain are the sequences of SEQ ID NO: 3 and 90% or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more. and may be a sequence having predictive or diagnostic ability of diabetes risk.

본 발명의 일 측면에서, 상기 콜린셀라 속 균주는 16S rRNA 유전자 서열이 서열번호 4의 서열과 90% 이상의 상동성을 가지고 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열로 표시되는 미생물일 수 있다. 구체적으로, 상기 콜린셀라 속 균주는 16S rRNA을 포함하고, 상기 콜린셀라 속 균주의 16S rRNA 유전자 서열의 V3 내지 V4 부분(region), 보다 구체적으로 V3 및 V4 부분(region)이 서열번호 4의 서열과 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상의 상동성을 가지는 서열로 표시되는 것일 수 있고, 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열일 수 있다.In one aspect of the present invention, the Collinsella sp. strain may be a microorganism in which the 16S rRNA gene sequence has 90% or more homology with the sequence of SEQ ID NO: 4 and is represented by a sequence having predictive or diagnostic ability of diabetes risk. Specifically, the Collinsella sp. strain includes 16S rRNA, and the V3 to V4 regions (regions) of the 16S rRNA gene sequence of the Colincella sp. strains, more specifically V3 and V4 regions (regions) are the sequence of SEQ ID NO: 4 and 90% or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more. and may be a sequence having predictive or diagnostic ability of diabetes risk.

박테리아bacteria 서열order 서열번호SEQ ID NO: GU174097_gGU174097_g GATGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGAGTTAATCGGAAAAGGAG
TTAGCTTGCTAATAACAATTCGGATTGACTTAGTGGCGGACGGGTGAGTAACGCGTGGGT
AACCTGCCCCATACAGGGGGATAACAGTTAGAAATGACTGCTAACACCGCATAACATGGC
GGGGGCGCATGACCCTGCCATCAAAAATTTATTGGTATGGGATGGGCCCGCGTCTGATTA
GCTAGTTGGTAAGGTAACGGCCTACCAAGGCGACGATCAGTAGCCGGCTTGAGAGAGTGG
ACGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGGATA
TTGGACAATGGGGGCAACCCTGATCCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTA
TGTAAAGCTCTATCAGCAGGGAAGATAATGACAGTACCTGACCAAGAAGCACCGGCTAAA
TACGTGCCAGCAGCCGCGGTAATACGTATGGTGCAAGCGTTATCCGGATTTACTGGGTGT
AAAGGGAGCGTAGGCGGTCTGCCAAGTCTGATGTGAAAACCCGGGGCTCAACCCCGGGAG
TGCATTGGAAACTGGCGGACTGGAGTGTCGGAGAGGTAAGCGGAATTCCTAGTGTAGCGG
TGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACGATAACT
GACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCC
GTAAACGATGAATACTAGGTGTCGGGGCACAAAAGTGCTCCGGTGCCGTCGCAAACGCAG
TAAGTATTCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGAC
CCGCACAAGCGGTGGAGCATGTGGATTAATTCGACGCAACGCGAAGAACCTTACCTGTCC
TTGACATCCCCCTGACCGGTGAGTAACGTCACCTTTCCTACGGGACAGGGGAGACAGGTG
GTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCA
ACCCCTATTCCCAGTAGCCAGCGGCCAGGCCGGGCACTCTGGGGAGACTGCCGGGGATAA
CCCGGAGGAAGGCGGGGATGACGTCAAATCATCATGCCCCTTATGGGCAGGGCTTCACAC
GTGCTACAATGACAGCCACAAAGGGATGCGAACCTGCGAGGGGGAGCGAACCCCAGAAAA
GCTGTCCCAGTTCGGATTGTAGTCTGCAACCCGACTACATGAAGCTGGAATCGCTAGTAA
TCGCGAATCAGAATGTCGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACA
CCATGGGAGATGGATATGCCCGAAGTCAGTGACCTAACCGCAAGGGAGGAGCTGCCGAAG
GTGGAGCCATTAACTGGGGTG
GATGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGAGTTAATCGGAAAAGGAG
TTAGCTTGCTAATAACAATTCGGATTGACTTAGTGGCGGACGGGTGAGTAACGCGTGGGT
AACCTGCCCCATACAGGGGGATAACAGTTAGAAATGACTGCTAACACCGCATAACATGGC
GGGGGCGCATGACCCTGCCATCAAAAATTTATTGGTATGGGATGGGCCCGCGTCTGATTA
GCTAGTTGGTAAGGTAACGGCCTACCAAGGCGACGATCAGTAGCCGGCTTGAGAGAGTGG
ACGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGGATA
TTGGACAATGGGGGCAACCCTGATCCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTA
TGTAAAGCTCTATCAGCAGGGAAGATAATGACAGTACCTGACCAAGAAGCACCGGCTAAA
TACGTGCCAGCAGCCGCGGTAATACGTATGGTGCAAGCGTTATCCGGATTTACTGGGTGT
AAAGGGAGCGTAGGCGGTCTGCCAAGTCTGATGTGAAAACCCGGGGCTCAACCCCGGGAG
TGCATTGGAAACTGGCGGACTGGAGTGTCGGAGAGGTAAGCGGAATTCCTAGTGTAGCGG
TGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACGATAACT
GACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACCGCC
GTAAACGATGAATACTAGGTGTCGGGGCACAAAAGTGCTCCGGTGCCGTCGCAAACGCAG
TAAGTATTCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGAC
CCGCACAAGCGGTGGAGCATGTGGATTAATTCGACGCAACGCGAAGAACCTTACCTGTCC
TTGACATCCCCCTGACCGGTGAGTAACGTCACCTTTCCTACGGGACAGGGAGACAGGTG
GTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCA
ACCCCTATTCCCAGTAGCCAGCGGCCAGGCCGGGCACTCTGGGGAGACTGCCGGGGATAA
CCCGGAGGAAGGCGGGGATGACGTCAAATCATCATGCCCCTTATGGGCAGGGCTTCACAC
GTGCTACAATGACAGCCACAAAGGGATGCGAACCTGCGAGGGGGAGCGAACCCCAGAAAA
GCTGTCCCAGTTCGGATTGTAGTCTGCAACCCGACTACATGAAGCTGGAATCGCTAGTAA
TCGCGAATCAGAATGTCGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACA
CCATGGGAGATGGATATGCCCGAAGTCAGTGACCTAACCGCAAGGGAGGAGCTGCCGAAG
GTGGAGCCATTAACTGGGGTG
1One
라크노스피로세Lachnospirose GATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGACCCATATTGAAACCTAGTGATATATGGGTTAGTGGCGGACGGGTGAGTAACGCGTGGGCAACCTGCCTTACACAGGGGGATAACACTTAGAAATAGGTGCTAAAACCGCATAAGCGCACAGCTTCGCATGAAGCGGTGTGAAAAACTCCGGTGGTGTAAGATGGACCCGCGTCTGATTAGCTTGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGGCCTGAGAGGGCGGACGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTAATTCGTTACGTAAAGCTCTATCAGCAGGGAAGAAAATGACGGTACCTGAGTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGTGCGCCAAGTCTGGAGTGAAATGCCGCAGCTTAACTGCGGAACTGCTTTGGAAACTGGCGGACTAGAGTGCGGGAGGGGTAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCGGTGGCGAAGGCGGCTTACTGGACCGTAACTGACGTTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGATTACTAGGTGTCGGGGCCCTAAGGGGCTTCGGTGCCGCCGCAAACGCATTAAGTAATCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCTGCCCTTGACATCCGGATGAATAAGGGGTAATGCCCTTAGCCCTTCGGGGCATCCGAGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCTTCAGTAGCCAGCATTCAGGATGGGAACTCAGGAGAGACTGCCCGGGACAACCGGGAGGAAGGCGGGGATGACGTCAAATCATCATGCCCCTTATGGGCAGGGCTACACACGTGCTACAATGGCGAAAACAGAGGGAAGCGAGCCGGTGACGGTAAGCAAACCCCAAAAACATCGTCCCAGTTCGGACTGTAGTCTGCAACCCGACTACACGAAGCCGGAATCGCTAGTAATCGCGGATCAGAATGCCGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTCGGAAATGCCCGAAGTCAGTGACCTAACCTTTAAGGGAGGAGCTGCCGAAGGTGGAGCCGGTAACTGGGGTGGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGACCCATATTGAAACCTAGTGATATATGGGTTAGTGGCGGACGGGTGAGTAACGCGTGGGCAACCTGCCTTACACAGGGGGATAACACTTAGAAATAGGTGCTAAAACCGCATAAGCGCACAGCTTCGCATGAAGCGGTGTGAAAAACTCCGGTGGTGTAAGATGGACCCGCGTCTGATTAGCTTGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGGCCTGAGAGGGCGGACGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTAATTCGTTACGTAAAGCTCTATCAGCAGGGAAGAAAATGACGGTACCTGAGTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGTGCGCCAAGTCTGGAGTGAAATGCCGCAGCTTAACTGCGGAACTGCTTTGGAAACTGGCGGACTAGAGTGCGGGAGGGGTAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCGGTGGCGAAGGCGGCTTACTGGACCGTAACTGACGTTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGATTACTAGGTGTCGGGGCCCTAAGGGGCTTCGGTGCCGCCGCAAACGCATTAAGTAATCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCTGCCCTTGACATCCGGATGAATAAGGGGTAATGCCCTTAGCCCTTCGGGGCATCCGAGACAGG TGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCTTCAGTAGCCAGCATTCAGGATGGGAACTCAGGAGAGACTGCCCGGGACAACCGGGAGGAAGGCGGGGATGACGTCAAATCATCATGCCCCTTATGGGCAGGGCTACACACGTGCTACAATGGCGAAAACAGAGGGAAGCGAGCCGGTGACGGTAAGCAAACCCCAAAAACATCGTCCCAGTTCGGACTGTAGTCTGCAACCCGACTACACGAAGCCGGAATCGCTAGTAATCGCGGATCAGAATGCCGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTCGGAAATGCCCGAAGTCAGTGACCTAACCTTTAAGGGAGGAGCTGCCGAAGGTGGAGCCGGTAACTGGGGTG 22 하프니아hafnia ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGTAGCACAAGAGAGCTTGCTCTCTGGGTGACGAGCGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATGACGTCTTCGGACCAAAGTGGGGGACCTTCGGGCCTCACGCCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAATGGCTCACCTAGGCGACGATCTCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGAAGGCATTGTGGTTAATAACCACAGTGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTGATTAAGTCAGATGTGAAATCCCCGAGCTTAACTTGGGAACTGCATTTGAAACTGGTCAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAATTTAGCAGAGATGCTTTAGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCACGTAATGGTGGGAACTCAAAGGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCATATACAAAGAGAAGCGAACTCGCGAGAGCAAGCGGACCTCATAAAGTATGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTAGATCAGAATGCTACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGTAGCACAAGAGAGCTTGCTCTCTGGGTGACGAGCGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATGACGTCTTCGGACCAAAGTGGGGGACCTTCGGGCCTCACGCCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAATGGCTCACCTAGGCGACGATCTCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGAAGGCATTGTGGTTAATAACCACAGTGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTGATTAAGTCAGATGTGAAATCCCCGAGCTTAACTTGGGAACTGCATTTGAAACTGGTCAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAATTTAGCAGAGATGCTTTAGTGC CTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCACGTAATGGTGGGAACTCAAAGGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCATATACAAAGAGAAGCGAACTCGCGAGAGCAAGCGGACCTCATAAAGTATGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTAGATCAGAATGCTACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTG 33 콜린셀라Collinsella GATGAACGCTGGCGGCGCGCCTAACACATGCAAGTCGAACGGCACCCCTCTCCGGAGGGAAGCGAGTGGCGAACGGCTGAGTAACACGTGGAGAACCTGCCCCCTCCCCCGGGATAGCCGCCCGAAAGGACGGGTAATACCGGATACCCCGGGGTGCCGCATGGCGCCCCGGCTAAAGCCCCGACGGGAGGGGATGGCTCCGCGGCCCATCAGGTAGACGGCGGGGTGACGGCCCACCGTGCCGACAACGGGTAGCCGGGTTGAGAGACCGACCGGCCAGATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGGGGAACCCTGACGCAGCGACGCCGCGTGCGGGACGGAGGCCTTCGGGTCGTAAACCGCTTTCAGCAGGGAAGAGTCAAGACTGTACCTGCAGAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTATCCGGATTCATTGGGCGTAAAGCGCGCGTAGGCGGCCCGGCAGGCCGGGGGTCGAAGCGGGGGGCTCAACCCCCCGAAGCCCCCGGAACCCCGCGGCTTGGGTCCGGTAGGGGAGGGTGGAACACCCGGTGTAGCGGTGGAATGCGCAGATATCGGGTGGAACACCGGTGGCGAAGGCGGCCCTCTGGGCCGAGACCGACGCTGAGGCGCGAAAGCTGGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCCAGCCGTAAACGATGGACGCTAGGTGTGGGGGGACGATCCCCCCGTGCCGCAGCCAACGCATTAAGCGTCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCATGTGGCTTAATTCGAAGCAACGCGAAGAACCTTACCAGGGCTTGACATATGGGTGAAGCGGGGGAGACCCCGTGGCCGAGAGGAGCCCATACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCCGCCGCGTGTTGCCATCGGGTGATGCCGGGAACCCACGCGGGACCGCCGCCGTCAAGGCGGAGGAGGGCGGGGACGACGTCAAGTCATCATGCCCCTTATGCCCTGGGCTGCACACGTGCTACAATGGCCGGTACAGAGGGATGCCACCCCGCGAGGGGGAGCGGATCCCGGAAAGCCGGCCCCAGTTCGGATTGGGGGCTGCAACCCGCCCCCATGAAGTCGGAGTTGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATGCGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACCCGAGTCGTCTGCACCCGAAGTCGCCGGCCCAACCGAGAGGGGGGAGGCGCCGAAGGTGTGGAGGGTGAGGGGGGTGGATGAACGCTGGCGGCGCGCCTAACACATGCAAGTCGAACGGCACCCCTCTCCGGAGGGAAGCGAGTGGCGAACGGCTGAGTAACACGTGGAGAACCTGCCCCCTCCCCCGGGATAGCCGCCCGAAAGGACGGGTAATACCGGATACCCCGGGGTGCCGCATGGCGCCCCGGCTAAAGCCCCGACGGGAGGGGATGGCTCCGCGGCCCATCAGGTAGACGGCGGGGTGACGGCCCACCGTGCCGACAACGGGTAGCCGGGTTGAGAGACCGACCGGCCAGATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGGGGAACCCTGACGCAGCGACGCCGCGTGCGGGACGGAGGCCTTCGGGTCGTAAACCGCTTTCAGCAGGGAAGAGTCAAGACTGTACCTGCAGAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTATCCGGATTCATTGGGCGTAAAGCGCGCGTAGGCGGCCCGGCAGGCCGGGGGTCGAAGCGGGGGGCTCAACCCCCCGAAGCCCCCGGAACCCCGCGGCTTGGGTCCGGTAGGGGAGGGTGGAACACCCGGTGTAGCGGTGGAATGCGCAGATATCGGGTGGAACACCGGTGGCGAAGGCGGCCCTCTGGGCCGAGACCGACGCTGAGGCGCGAAAGCTGGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCCAGCCGTAAACGATGGACGCTAGGTGTGGGGGGACGATCCCCCCGTGCCGCAGCCAACGCATTAAGCGTCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCATGTGGCTTAATTCGAAGCAACGCGAAGAACCTTACCAGGGCTTGACATATGGGTGAAGCGGGGGAGACCCCGTGGCCGAGAGGAGCCCATACAGGTGGTGCATGGCTGTCGT CAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCCGCCGCGTGTTGCCATCGGGTGATGCCGGGAACCCACGCGGGACCGCCGCCGTCAAGGCGGAGGAGGGCGGGGACGACGTCAAGTCATCATGCCCCTTATGCCCTGGGCTGCACACGTGCTACAATGGCCGGTACAGAGGGATGCCACCCCGCGAGGGGGAGCGGATCCCGGAAAGCCGGCCCCAGTTCGGATTGGGGGCTGCAACCCGCCCCCATGAAGTCGGAGTTGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATGCGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACCCGAGTCGTCTGCACCCGAAGTCGCCGGCCCAACCGAGAGGGGGGAGGCGCCGAAGGTGTGGAGGGTGAGGGGGGTG 44

본 발명의 일 측면에서, 상기 조성물은 피험자의 샘플에 적용되는 것일 수 있고, 상기 샘플은 소변일 수 있으나, 이에 제한되지 않는다.In one aspect of the present invention, the composition may be applied to a sample of a subject, and the sample may be urine, but is not limited thereto.

다른 측면에서, 본 발명은 상기 라크노스피로세(Lachnospiraceae) 과 균주의 미생물을 검출할 수 있는 제제를 포함하는 당뇨병 위험도 예측 또는 진단용 키트를 제공한다. 상기 라크노스피로세 과 균주, 미생물 검출 제제, 당뇨병, 당뇨병 위험도 예측 또는 진단에 대한 설명은 상술한 바와 같다.In another aspect, the present invention provides a kit for predicting or diagnosing the risk of diabetes comprising an agent capable of detecting microorganisms of the Lachnospiraceae family. The description of the Lachnospirose family strain, microorganism detection agent, diabetes, diabetes risk prediction or diagnosis is the same as described above.

본 발명의 일 측면에서, 상기 키트는 피험자의 소변 샘플에 적용되는 것일 수 있고, 구체적으로 상기 키트는 비침습적 방법으로 당뇨병의 위험도를 예측 또는 진단할 수 있다.In one aspect of the present invention, the kit may be applied to a urine sample of a subject, and specifically, the kit may predict or diagnose the risk of diabetes in a non-invasive manner.

본 발명의 일 측면에서, 상기 키트는 피험자의 샘플 채취를 위한 흡수성 패드, 면봉, 스포이드, 스푼, 스왑 및 이쑤시개로 이루어진 군에서 선택된 하나 이상의 샘플 채취용 포집 기구를 추가로 포함할 수 있으나, 샘플을 포집할 수 있는 것이라면 이에 제한되지 않는다.In one aspect of the present invention, the kit may further include one or more collection devices for sampling selected from the group consisting of absorbent pads, cotton swabs, droppers, spoons, swabs, and toothpicks for collecting samples from a subject. As long as it can be collected, it is not limited thereto.

본 발명의 일 측면에서, 상기 키트는 설명서를 추가로 포함할 수 있다.In one aspect of the present invention, the kit may further include instructions.

본 발명의 일 측면에서, 상기 설명서에는 피험자의 샘플로부터 얻어진 라크노스피로세(Lachnospiraceae) 과 균주의 미생물 검출량이 정상 대조군 샘플에 비하여 낮으면 당뇨병을 예측 또는 진단하는 것이 기재될 수 있고, 또는 피험자의 샘플로부터 얻어진 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물 검출량이 정상 대조군 샘플에 비하여 높으면 당뇨병을 예측 또는 진단하는 것이 기재될 수 있으며, 또는 당뇨병의 위험도를 예측 또는 진단하기 위하여 피험자의 샘플, 보다 구체적으로 소변을 채취하라는 것이 기재될 수 있다.In one aspect of the present invention, in the manual, when the detection amount of microorganisms of Lachnospiraceae and strains obtained from the subject's sample is lower than that of the normal control sample, predicting or diagnosing diabetes may be described, or the subject's If the detection amount of one or more microorganisms selected from the group consisting of Hafnia sp. strain and Collinsella sp. strain obtained from the sample is higher than that of a normal control sample, predicting or diagnosing diabetes may be described, or the risk of diabetes It may be described to take a sample, more specifically urine, from a subject in order to predict or diagnose

또 다른 측면에서, 본 발명은 피험자의 샘플로부터 게놈 DNA를 추출하는 단계; 상기 추출된 게놈 DNA에 라크노스피로세(Lachnospiraceae) 과 균주의 미생물에 특이적인 프라이머를 반응시키는 단계; 및 상기 반응물을 증폭시키는 단계;를 포함하는, 당뇨병 위험도 예측 또는 진단을 위한 정보제공방법을 제공한다. 상기 라크노스피로세 과 균주, 프라이머, 당뇨병, 당뇨병 위험도 예측 또는 진단에 대한 설명은 상술한 바와 같다. 또한, 상기 당뇨병 위험도 예측 또는 진단용 조성물에 대한 설명은 상기 정보제공방법에 적용될 수 있다.In another aspect, the present invention provides a method comprising the steps of extracting genomic DNA from a sample of a subject; Reacting the extracted genomic DNA with a primer specific to the microorganism of the Lachnospiraceae strain; and amplifying the reactant; provides an information providing method for predicting or diagnosing diabetes risk, including. The description of the Lachnospirose family strain, primer, diabetes, diabetes risk prediction or diagnosis is as described above. In addition, the description of the composition for predicting or diagnosing the risk of diabetes may be applied to the information providing method.

본 발명의 일 측면에 따른 정보제공방법은 피험자의 샘플로부터 게놈 DNA를 추출하는 단계를 포함할 수 있다.The information providing method according to an aspect of the present invention may include extracting genomic DNA from a sample of a subject.

본 발명의 일 측면에서, 상기 게놈 DNA 추출 단계의 상기 피험자의 샘플은 당뇨병 환자 또는 당뇨병이 예상되는 사람의 몸에서 채취된 것으로, 조직, 세포, 전혈, 혈청, 혈장 타액 또는 소변과 같은 샘플 등을 포함할 수 있고, 구체적으로 상기 샘플은 피험자의 소변일 수 있으나, 이에 제한되지 않는다.In one aspect of the present invention, the sample of the subject in the genomic DNA extraction step is collected from the body of a diabetic patient or a person expected to be diabetic, and samples such as tissues, cells, whole blood, serum, plasma saliva or urine, etc. may include, and specifically, the sample may be the subject's urine, but is not limited thereto.

종래 당뇨병 위험도 예측 또는 진단에 사용되는 방법은 침습적인 혈액 채취와 공복조건의 혈당 측정으로 인한 부가적인 스트레스를 야기하는 문제점이 있었으나 본 발명의 일 측면에 따른 정보제공방법은 비침습성 방법, 특히 피험자의 소변 샘플을 사용할 수 있어 피험자의 스트레스를 줄일 수 있다.The conventional method used for predicting or diagnosing the risk of diabetes has a problem of causing additional stress due to invasive blood collection and fasting blood glucose measurement. However, the information providing method according to one aspect of the present invention is a non-invasive method, particularly, A urine sample may be used to reduce the subject's stress.

본 발명의 일 측면에서, 상기 게놈 DNA 추출은 당업계에 알려진 일반적인 기술을 적용하여 수행할 수 있다.In one aspect of the present invention, the genomic DNA extraction may be performed by applying a general technique known in the art.

본 발명의 일 측면에 따른 정보제공방법은 상기 추출된 게놈 DNA에 라크노스피로세(Lachnospiraceae) 과 균주의 미생물에 특이적인 프라이머를 반응시키는 단계를 포함할 수 있다.The information providing method according to an aspect of the present invention may include reacting the extracted genomic DNA with a primer specific to the microorganism of the Lachnospiraceae strain.

본 발명의 일 측면에서, 상기 라크노스피로세 과 균주는 16S rRNA 유전자 서열이 서열번호 1의 서열과 90% 이상의 상동성을 가지고 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열로 표시되는 GU174097_g 균주일 수 있다. 구체적으로, 상기 GU174097_g 균주는 16S rRNA을 포함하고, 상기 GU174097_g 균주의 16S rRNA 유전자 서열의 V3 내지 V4 부분(region), 보다 구체적으로 V3 및 V4 부분(region)이 서열번호 1의 서열과 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상의 상동성을 가지는 서열로 표시되는 것일 수 있고, 당뇨병 위험도의 예측 또는 진단능을 보유하는 서열일 수 있다. In one aspect of the present invention, the Lachnospirose family strain is GU174097_ g strain in which the 16S rRNA gene sequence is represented by a sequence having 90% or more homology with the sequence of SEQ ID NO: 1 and having predictive or diagnostic ability of diabetes risk can be Specifically, the GU174097_ g strain contains 16S rRNA, and the V3 to V4 region (region) of the 16S rRNA gene sequence of the GU174097_ g strain, more specifically the V3 and V4 region (region) is the sequence of SEQ ID NO: 1 and 90 % or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more. It may be a sequence having the ability to predict or diagnose diabetes risk.

본 발명의 일 측면에서, 상기 프라이머 반응 단계는 상기 추출된 게놈 DNA에 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물에 특이적인 프라이머를 반응시키는 것을 추가로 포함할 수 있다.In one aspect of the present invention, the primer reaction step further comprises reacting a primer specific to one or more microorganisms selected from the group consisting of Hafnia sp. strain and Collinsella sp. strain to the extracted genomic DNA. can be included as

본 발명의 일 측면에 따른 정보제공방법은 상기 반응물을 증폭시키는 단계를 포함할 수 있다.The information providing method according to an aspect of the present invention may include amplifying the reactant.

본 발명의 일 측면에서, 상기 반응물 증폭 단계에서, 반응물을 증폭시키는 방법은 당업계에 알려진 일반적인 증폭 기술들, 예를 들어 중합효소 연쇄반응, SYBR 실시간 PCR, 역전사-중합효소 연쇄반응, 멀티플렉스 PCR, 터치다운 PCR, 핫 스타트 PCR, 네스티드 PCR, 부스터 PCR, 실시간 PCR, 분별 디스플레이 PCR, cDNA 말단의 신속 증폭, 인버스 PCR, 벡토레트 PCR, TAIL-PCR, 리가아제 연쇄 반응, 복구 연쇄 반응, 전사-중재 증폭, 자가 유지 염기서열 복제, 타깃 염기서열의 선택적 증폭 반응을 이용할 수 있으나, 이에 제한되지 않는다.In one aspect of the present invention, in the step of amplifying the reactant, the method for amplifying the reactant may be performed using general amplification techniques known in the art, for example, polymerase chain reaction, SYBR real-time PCR, reverse transcription-polymerase chain reaction, multiplex PCR , touchdown PCR, hot start PCR, nested PCR, booster PCR, real-time PCR, fractional display PCR, rapid amplification of cDNA ends, inverse PCR, vectorret PCR, TAIL-PCR, ligase chain reaction, repair chain reaction, transcription -Mediated amplification, self-maintaining sequence replication, or selective amplification of a target sequence may be used, but is not limited thereto.

본 발명의 일 측면에서, 상기 정보제공방법은 상기 증폭 단계 후 상기 증폭 산물의 양을 정상 대조군 시료의 증폭산물과 비교하는 단계를 추가로 포함할 수 있다.In one aspect of the present invention, the method for providing information may further include comparing the amount of the amplification product with the amplification product of a normal control sample after the amplification step.

본 발명의 일 측면에서, 상기 정보제공방법은 상기 피험자 샘플의 라크노스피로세(Lachnospiraceae) 과 균주의 미생물에 대한 증폭산물이 정상 대조군 샘플보다 낮은 경우 당뇨병 위험성이 있는 것으로 예측하거나 당뇨병이 있는 것으로 진단할 수 있다. 또는, 본 발명의 일 측면에서, 상기 정보제공방법은 상기 피험자 샘플의 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물에 대한 증폭산물이 정상 대조군 샘플보다 높은 경우 당뇨병 위험성이 있는 것으로 예측하거나 당뇨병이 있는 것으로 진단할 수 있다.In one aspect of the present invention, the information providing method predicts that there is a risk of diabetes when the amplification product for the microorganisms of the Lachnospiraceae and strain of the subject sample is lower than that of the normal control sample or is diagnosed as having diabetes can do. Alternatively, in one aspect of the present invention, the method for providing information is that the amplification product for one or more microorganisms selected from the group consisting of Hafnia sp. strain and Collinsella sp. strain of the subject sample is higher than that of a normal control sample. If it is high, it can be predicted to be at risk for diabetes or diagnosed as having diabetes.

본 발명의 일 측면에서, 상기 당뇨병은 제2형 당뇨병일 수 있다.In one aspect of the present invention, the diabetes may be type 2 diabetes.

본 발명의 일 측면에서, 상기 당뇨병은 하기 i) 내지 iii)의 선정기준 중 하나 이상을 만족하는 것일 수 있다:In one aspect of the present invention, the diabetes may satisfy one or more of the following selection criteria i) to iii):

i) 공복혈당 100 mg/dL 이상;i) fasting blood sugar greater than 100 mg/dL;

ii) 경구 당부하 120분 혈당 140 mg/dL 이상; 및ii) oral glucose tolerance 120 min blood glucose 140 mg/dL or higher; and

iii) 당화혈색소(HbA1c) 수치 5.7% 이상.iii) Glycated hemoglobin (HbA1c) level of 5.7% or higher.

본 발명의 일 측면에서, 상기 i) 선정기준은 구체적으로, 공복혈당이 100 mg/dL 이상, 102 mg/dL 이상, 104 mg/dL 이상, 106 mg/dL 이상, 108 mg/dL 이상, 110 mg/dL 이상, 112 mg/dL 이상, 114 mg/dL 이상, 116 mg/dL 이상, 118 mg/dL 이상, 120 mg/dL 이상, 122 mg/dL 이상, 124 mg/dL 이상 또는 126 mg/dL 이상일 수 있다.In one aspect of the present invention, the i) selection criteria are specifically, fasting blood sugar of 100 mg/dL or more, 102 mg/dL or more, 104 mg/dL or more, 106 mg/dL or more, 108 mg/dL or more, 110 mg/dL or higher, 112 mg/dL or higher, 114 mg/dL or higher, 116 mg/dL or higher, 118 mg/dL or higher, 120 mg/dL or higher, 122 mg/dL or higher, 124 mg/dL or higher, or 126 mg/dL or higher dL or higher.

본 발명의 일 측면에서, 상기 ii) 선정기준은 구체적으로, 경부 당부하 120분 혈당이 140 mg/dL 이상, 150 mg/dL 이상, 160 mg/dL 이상, 170 mg/dL 이상, 180 mg/dL 이상, 190 mg/dL 이상 또는 200 mg/dL 이상일 수 있다.In one aspect of the present invention, the ii) selection criterion is specifically, a 120-minute cervical glucose load blood sugar of 140 mg/dL or more, 150 mg/dL or more, 160 mg/dL or more, 170 mg/dL or more, 180 mg/dL or more. dL or more, 190 mg/dL or more, or 200 mg/dL or more.

본 발명의 일 측면에서, 상기 iii) 선정기준은 구체적으로, 당화혈색소(HbA1c) 수치가 5.7% 이상, 5.8% 이상, 5.9% 이상, 6.0% 이상, 6.1% 이상, 6.2% 이상, 6.3% 이상, 6.4% 이상 또는 6.5% 이상일 수 있다.In one aspect of the present invention, the iii) selection criterion is specifically, glycated hemoglobin (HbA1c) level of 5.7% or more, 5.8% or more, 5.9% or more, 6.0% or more, 6.1% or more, 6.2% or more, 6.3% or more , 6.4% or more or 6.5% or more.

또 다른 측면에서, 본 발명은 당뇨병 예방 또는 치료제 후보 물질을 처리하는 단계; 상기 후보물질 처리 전 및 처리 후 피험자의 샘플에서 라크노스피로세(Lachnospiraceae) 과 균주의 미생물의 변화를 검출하는 단계; 및 상기 후보물질 처리 후 상기 라크노스피로세 과 균주의 미생물 검출량이 증가한 경우, 상기 후보물질을 당뇨병 예방 또는 치료제인 것으로 판단하는 단계를 포함하는, 당뇨병 예방 또는 치료제 스크리닝 방법을 제공한다. 상기 라크노스피로세 과 균주, 프라이머, 당뇨병, 당뇨병 위험도 예측 또는 진단에 대한 설명은 상술한 바와 같다. In another aspect, the present invention provides a method for preventing or treating diabetes mellitus; Detecting the change of microorganisms of the Lachnospiraceae and strains in the sample of the subject before and after the candidate treatment; And when the detection amount of the microorganism of the Lachnospirosceae strain increases after the candidate substance treatment, it provides a screening method for preventing or treating diabetes, comprising the step of determining that the candidate substance is a diabetes preventive or therapeutic agent. The description of the Lachnospirose family strain, primer, diabetes, diabetes risk prediction or diagnosis is as described above.

본 발명의 일 측면에서, 당뇨병 예방 또는 치료 후보물질의 존재 및 부재 하에서 샘플 내 라크노스피로세(Lachnospiraceae) 과 균주의 미생물, 또는 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물의 변화를 비교하는 방법으로, 당뇨병 예방 또는 치료제를 스크리닝하는데 적용될 수 있다. 다시 말해, 당뇨병 예방 또는 치료 후보물질의 존재 및 부재 하에서 샘플 내 라크노스피로세(Lachnospiraceae) 과 균주의 미생물, 또는 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물의 군집 형성 정도 또는 상대적 존재비를 각각 측정하여 양자를 비교한 후, 후보물질이 존재 할 때 라크노스피로세 과 균주의 미생물의 군집 형성 또는 상대적 존재비가 더 증가하는 경우 해당 후보물질을 당뇨병 예방 또는 치료제로 판단할 수 있고, 또는 후보물질이 존재할 때 하프니아 속 균주 및 콜린셀라 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물의 군집 형성 정도 또는 상대적 존재비가 더 감소하는 경우 해당 후보물질을 당뇨병 예방 또는 치료제로 판단할 수 있다. In one aspect of the present invention, Lachnospiraceae in the sample in the presence and absence of a candidate for preventing or treating diabetes, microorganisms of the family strain , or Hafnia spp . and Collinsella sp. strains consisting of As a method of comparing changes in one or more microorganisms selected from the group, it can be applied to screening for preventing or treating diabetes. In other words, the three (Lachnospiraceae) and microorganisms of the strains in the presence and absence of diabetes prevention or treatment of candidate samples within Lac North fatigue, or hafnia (Hafnia) sp and choline Cellar (Collinsella) one selected from the group consisting of sp After comparing the two by measuring the degree or relative abundance of the above microorganisms, when the candidate substance is present, if the colony formation or relative abundance of microorganisms of the Lachnospirosaceae strain is further increased, the candidate substance is used to prevent diabetes Or it can be determined as a therapeutic agent, or when the candidate substance is present, the degree or relative abundance of one or more microorganisms selected from the group consisting of Hafnia sp. strain and Colincella sp. strain is further reduced. It can be considered as a treatment.

본 발명의 일 측면에서, 상기 후보물질이란 당뇨병 예방 또는 치료제가 될 수 있는 각종 저분자량 화합물, 고분자량 화합물, 핵산 분자(예컨대, DNA, RNA, PNA 등), 단백질, 당 및 지질 등을 포함할 수 있으나, 이에 제한되지 않는다.In one aspect of the present invention, the candidate material may include various low molecular weight compounds, high molecular weight compounds, nucleic acid molecules (eg, DNA, RNA, PNA, etc.), proteins, sugars, lipids, etc. that can be a preventive or therapeutic agent for diabetes. can, but is not limited thereto.

이하, 실시예를 들어 본 발명의 구성 및 효과를 보다 구체적으로 설명한다. 그러나 아래 실시예는 본 발명에 대한 이해를 돕기 위해 예시의 목적으로만 제공된 것일 뿐 본 발명의 범주 및 범위가 그에 의해 제한되는 것은 아니다.Hereinafter, the configuration and effect of the present invention will be described in more detail by way of examples. However, the following examples are provided for illustrative purposes only to aid understanding of the present invention, and the scope and scope of the present invention are not limited thereto.

[실시예 1] 메타게놈 분석[Example 1] Metagenome analysis

[실시예 1-1] 코호트 및 연구 디자인[Example 1-1] Cohort and study design

당뇨병 위험도 예측 또는 진단을 위한 바이오마커 발굴을 위해, 메타게놈 분석을 수행하였다. 이와 관련한 KARE (Korean Association Resource, 안산, 안성 지역사회 기반 코호트 사업) 연구는 대한민국의 안성의 농촌 공동체와 안산시의 도시 공동체인, 두 지역 공동체를 대상으로 실시되었으며, 상기 두 코호트는 2001년에 한국 게놈 역학 연구(Korean Genome Epidemiology study)의 일환으로 시작되었다. 메타게놈 분석을 위해 상기 두 코호트에 속하는 2013년, 2015년 및 2017년에 315 명의 피험자로부터 소변 샘플을 수득하였다. 상기 샘플로부터 세포외 소포(EV, extracellular vesicles) 분리 및 DNA 추출 방법을 이용하여 315 명 각각으로부터 메타게놈(Metagenomic, 균유전체학의) 16S rRNA 서열을 얻었다.To discover biomarkers for predicting or diagnosing diabetes risk, metagenome analysis was performed. A related KARE (Korean Association Resource, Ansan, Anseong Community-Based Community-Based Cohort Project) study was conducted on two local communities: a rural community in Anseong in Korea and an urban community in Ansan City. It started as part of the Korean Genome Epidemiology study. Urine samples were obtained from 315 subjects in 2013, 2015 and 2017 belonging to the two cohorts for metagenomic analysis. Metagenomic 16S rRNA sequences were obtained from each of 315 individuals by using extracellular vesicles (EV) isolation and DNA extraction from the sample.

[실시예 1-2] 인간 샘플로부터의 EV 분리 및 DNA 추출[Example 1-2] EV Isolation and DNA Extraction from Human Samples

상기 실시예 1-1에서 수득한 소변 샘플을 4℃에서 10분 동안 10,000g에서 마이크로 원심분리기(Labogene 1730R; BMS, Korea)로 차등 원심 분리하여 세포외 소포(EV)를 분리하였다(Lee, E.Y., et al., Global proteomic profiling of native outer membrane vesicles derived from Escherichia coli. Proteomics, 2007. 7(17): p. 3143-3153). 박테리아, 이물질 및 노폐물을 제거하기 위해, 0.22μm 필터를 통해 상층액을 여과하였다. 그런 다음, DNA 추출을 위해, 분리된 세포외 소포(EV)를 100℃에서 40분 동안 끓이고 4℃에서 30분 동안 13,000 rpm에서 원심 분리하여 나머지 부유입자와 불순물을 제거하였다. 그 후, 상등액을 모으고 DNA 추출 표준 프로토콜에 따라 PowerSoil® DNA Isolation Kit(MO BIO Laboratories; Carlsbad, CA, USA)를 이용하여 DNA를 분리하였다. 그리고 각 샘플의 DNA를 QIAxpert system (Qiagen, Hilden, Germany)을 사용하여 정량하였다.The urine sample obtained in Example 1-1 was differentially centrifuged with a microcentrifuge (Labogene 1730R; BMS, Korea) at 10,000 g at 4° C. for 10 minutes to separate extracellular vesicles (EV) (Lee, EY) , et al., Global proteomic profiling of native outer membrane vesicles derived from Escherichia coli . Proteomics, 2007. 7(17): p. 3143-3153). The supernatant was filtered through a 0.22 μm filter to remove bacteria, foreign substances and wastes. Then, for DNA extraction, the isolated extracellular vesicles (EV) were boiled at 100° C. for 40 minutes and centrifuged at 13,000 rpm at 4° C. for 30 minutes to remove remaining suspended particles and impurities. Then, the supernatant was collected and DNA was isolated using the PowerSoil® DNA Isolation Kit (MO BIO Laboratories; Carlsbad, CA, USA) according to standard DNA extraction protocols. And the DNA of each sample was quantified using the QIAxpert system (Qiagen, Hilden, Germany).

[실시예 1-3] 추출된 DNA로부터 메타게놈 서열 분석[Example 1-3] Metagenomic sequence analysis from extracted DNA

피험자별 페어-엔드 시퀀스 쌍(paired-end sequence pairs)은 박테리아 16S rRNA 유전자의 V3-V4 영역을 타겟으로 하였다. V3-V4 영역을 증폭하는 데 널리 쓰이는 프라이머인, 하기 표 2의 F341 및 R805 프라이머(서열번호 5 및 6)는 최소 오버랩이 11개, 최대 오차율이 10%, 최소 길이가 10개의 CUTADAPT software를 사용하여 검출되고 제거되었다.Paired-end sequence pairs for each subject targeted the V3-V4 region of the bacterial 16S rRNA gene. The primers widely used to amplify the V3-V4 region, the F341 and R805 primers (SEQ ID NOs: 5 and 6) in Table 2 below, have a minimum overlap of 11, a maximum error rate of 10%, and a minimum length of 10 CUTADAPT software. detected and removed.

구분division 서열order 서열번호SEQ ID NO: F341F341 5'- CCTACGGGNGGCWGCAG -3'5'-CCTACGGGNGGCWGCAG -3' 55 R805R805 5'- GACTACHVGGGTATCTAATCC -3'5'-GACTACHVGGGTATCTAATCC -3' 66

상기 실시예 1-2에서 분리된 DNA는 상기 F341 및 R805 프라이머를 이용하여메타게놈 서열은 증폭된 후 불일치율이 0.27인 CASPER software를 사용하여 병합되었고, 그 결과 길이가 350-550 bp인 염기서열 데이터를 생성하였다(Kwon, et al., 2014). 상기 병합된 서열을 복제(dereplicate) 후, 키메라에 대한 Silva Gold 참조 데이터(reference database)로 VSEARCH software를 사용하여 키메라 서열(chimeric sequences)을 검출하고 제거하였다. de novo 선택 방법(de novo picking method)을 사용하여 97%의 서열 동일성 임계값(sequence identity threshold)의 결과 OUT(operating taxonomic unit, 운영분류단위) 표를 얻었다.The DNA isolated in Example 1-2 was merged using CASPER software having a mismatch rate of 0.27 after the metagenomic sequence was amplified using the F341 and R805 primers, and as a result, the nucleotide sequence of 350-550 bp in length Data were generated (Kwon, et al., 2014). After the merged sequence was duplicated (dereplicate), the chimeric sequences were detected and removed using VSEARCH software as a Silva Gold reference database for the chimera. Using the de novo picking method, an OUT (operating taxonomic unit) table was obtained as a result of a sequence identity threshold of 97%.

[실시예 2] 16S rRNA를 이용한 미생물 조성(microbial composition) 분석[Example 2] Analysis of microbial composition using 16S rRNA

[실시예 2-1] 16S rRNA 메타게놈 데이터로부터 기능적 프로파일의 예측[Example 2-1] Prediction of functional profile from 16S rRNA metagenomic data

미생물 군집의 기능적 잠재력은 계통 발생으로부터 예측할 수 있다. PICRUSt 및 Tax4fun은 진화 모델링을 사용하여 16S 데이터 및 EzTaxon 참조 게놈 데이터베이스에서 메타게놈을 예측한다. SILVA-기초 16S rRNA 프로파일을 원핵 생물 KEGG 유기체의 분류학적 프로파일로 변환하였다. 사전 계산된 연관 행렬에 의해 선형 변환을 실현하였다. 그런 다음, NCBI 게놈 주석(genome annotations)으로부터 얻어진 16S rRNA 카피 수에 의해 KEGG 유기체의 추정된 존재비를 정규화하였다. 마지막으로, 미생물 군집의 기능적 프로파일의 예측을 위해 KEGG 유기체의 사전 계산된 기능적 프로파일을 선형적으로 조합하는 데 정규화된 분류학적 존재비(abundance)를 사용하였다.The functional potential of a microbial community can be predicted from phylogeny. PICRUSt and Tax4fun use evolutionary modeling to predict the metagenome from 16S data and the EzTaxon reference genome database. The SILVA-based 16S rRNA profile was transformed into a taxonomic profile of a prokaryotic KEGG organism. A linear transformation was realized by a pre-computed associative matrix. The estimated abundance of KEGG organisms was then normalized by the 16S rRNA copy number obtained from NCBI genome annotations. Finally, the normalized taxonomic abundance was used to linearly combine the pre-calculated functional profiles of KEGG organisms for the prediction of the functional profile of the microbial community.

[실시예 2-2] 미생물 조성의 분석[Example 2-2] Analysis of microbial composition

알파 및 베타 다양성을 QIIME으로 계산하였다. 그리고, 희귀화된 10,000 개의 서열로 재귀곡선을 수득하였다. Bray-Curtis, Unweighted UniFrac은 베타 다양성으로 간주되고, 관찰된 OUT(Observed OUT), ACE, Shannon 및 Simpson은 알파 다양성으로 간주되었으며, 그 결과는 도 1, 도 2, 도 4a 및 도 4b와 같다.Alpha and beta diversity was calculated by QIIME. Then, a recursive curve was obtained with 10,000 sparse sequences. Bray-Curtis, Unweighted UniFrac was considered beta diversity, Observed OUT, ACE, Shannon and Simpson were considered alpha diversity, and the results are shown in FIGS. 1, 2, 4A and 4B.

도 1에는, 알파-다양성이 표시되어 있는데, 도 1의 6P, 7P, 8P는 각각 2013년, 2015년 및 2017년 각각의 샘플로 구성된 데이터를 의미한다. 도 1에 나타난 바와 같이, 상기 실시예 1-1의 2013년, 2015년 및 2017년의 피험자 샘플로부터의 메타게놈 데이터로부터 미생물 조성을 분석한 결과, 알파 다양성은 추적 기간 동안 감소하였고, 이는 연령 효과에 기인한 것일 수 있다.In FIG. 1, alpha-diversity is indicated, and 6P, 7P, and 8P in FIG. 1 mean data composed of samples in 2013, 2015, and 2017, respectively. As shown in FIG. 1 , as a result of analyzing the microbial composition from the metagenomic data from the subject samples in 2013, 2015 and 2017 of Example 1-1, the alpha diversity decreased during the follow-up period, which had an effect on the age effect. may be due to

또한, 도 2에는 각 연도에 따른 각 속의 변화 추세를 나타낸다. 도 2에 나타난 바와 같이, NMDS plot을 통해 균총과 건강 요인의 연관성을 분석한 결과 2013년에서 2015년과 2017년에 수집된 샘플들이 균총에 있어 약간 차이가 있으며, 균총의 각각의 속은 기간에 따라 변함을 확인하였다. In addition, Figure 2 shows the change trend of each genus according to each year. As shown in FIG. 2 , as a result of analyzing the association between the flora and health factors through the NMDS plot, the samples collected in 2013, 2015, and 2017 had a slight difference in the flora, and each genus of the flora according to the period change was confirmed.

또한, 도 4a 및 도 4b에 따르면 2 가지의 주요 속(genera)인, 박테로이드(Bacteriodes) 속 및 아커만시아(Akkermansia) 속 은 추적 기간 동안 감소하였다. 이를 통해 관찰 기간 동안 속(genera)의 변화가 임상적 의미가 반복 측정 데이터로 처리될 필요가 있음을 알 수 있다.In addition, according to Figures 4a and 4b two major genera, Bacteriodes genus and Akkermansia genus decreased during the follow-up period. This suggests that the clinical significance of genera changes during the observation period needs to be treated as repeated measurement data.

[실시예 3] 메타게놈 분석을 통한 당뇨 마커 균주 발굴[Example 3] Diabetes marker strain discovery through metagenomic analysis

상기 실시예 1 및 2로부터 수득한 메타게놈 및 미생물 조성 분석 결과를 이용하여 당뇨병 위험도 예측 또는 진단을 위한 바이오마커 발굴을 위해 하기 분석을 수행하였으며, 이 때 사용된 당뇨병 제2형 당뇨병(T2D, type-2 diabetes) 및 인슐린 저항성 수준의 정의는 다음과 같다. 먼저, KARE 표현형으로 인슐린 저항성을 조사하기 위해, 인슐린 저항성(homeostatic model assessment, HOMA-IR)을 공복 혈당 및 공복 인슐린 수치로 계산하였다(Pisprasert, V., et al., Limitations in the use of indices using glucose and insulin levels to predict insulin sensitivity: impact of race and gender and superiority of the indices derived from oral glucose tolerance test in African Americans. Diabetes care, 2013. 36(4): p. 845-853). 상기 실시예 1의 샘플들 중 당뇨병 군(T2D 군), 당뇨병 위험군(T2D 위험군) 및 정상군(Healthy 군)의 정의는 다음과 같다.The following analysis was performed to discover biomarkers for predicting or diagnosing diabetes risk using the metagenome and microbial composition analysis results obtained from Examples 1 and 2, and the diabetes type 2 diabetes (T2D, type -2 diabetes) and the level of insulin resistance are defined as follows. First, to investigate insulin resistance with the KARE phenotype, insulin resistance (homeostatic model assessment, HOMA-IR) was calculated with fasting blood glucose and fasting insulin levels (Pisprasert, V., et al., Limitations in the use of indices using glucose and insulin levels to predict insulin sensitivity: impact of race and gender and superiority of the indices derived from oral glucose tolerance test in African Americans . Diabetes care, 2013. 36(4): p. 845-853). The definitions of the diabetes group (T2D group), the diabetes risk group (T2D risk group), and the normal group (Healthy group) among the samples of Example 1 are as follows.

- 당뇨병 군(T2D 군): 공복 혈당이 126 mg/dL 이상, 경구 당부하 120분 혈당이 200 mg/dL 이상, 또는 당화혈색소(HbA1c) 수치가 6.5% 이상- Diabetes group (T2D group): Fasting blood sugar of 126 mg/dL or higher, Oral glucose tolerance 120-minute blood sugar 200 mg/dL or higher, or HbA1c level of 6.5% or higher

- 당뇨병 위험군(T2D 위험군): 공복 혈당이 100 mg/dL 이상, 경구 당부하 120분 혈당이 140 mg/dL 이상, 또는 당화혈색소(HbA1c) 수치가 5.7% 이상- Diabetes risk group (T2D risk group): Fasting blood sugar of 100 mg/dL or more, Oral glucose tolerance 120-minute blood sugar 140 mg/dL or more, or HbA1c level of 5.7% or more

- 정상군(Healthy 군): 상기 T2D 군과 T2D 위험군에 속하지 않은 샘플- Normal group (Healthy group): a sample that does not belong to the T2D group and the T2D risk group

이 때, 당뇨병 약을 복용하는 샘플들 또한 T2D 군으로 분류하였으며, DM_binary1은 T2D 군을 T2D 위험군 및 정상군으로부터 구별하는 표현형이고, DM_binary2는 정상군을 T2D 및 T2D 위험군으로부터 구별하는 표현형이다.At this time, samples taking diabetes drugs were also classified into the T2D group, DM_binary1 is a phenotype that distinguishes the T2D group from the T2D risk group and the normal group, and DM_binary2 is a phenotype that distinguishes the normal group from the T2D and T2D risk group.

[실시예 3-1] KARE 표현형에 의해 설명되는 미생물 다변량(variance) 분석[Example 3-1] Analysis of microbial variance explained by KARE phenotype

KARE 표현형에 의해 설명되는 미생물 다변량을 분석하기 위해, PERMANOVA(Permutational multivariate analysis of variance) 방법을 수행하였다. 상기 PERMANOVA는 쌍별 거리(pairwise distances)를 기반으로 하는 분산의 다변량 분석의 비-모수적 방법이다(Anderson, M.J., A new method for non-parametric multivariate analysis of variance. Austral ecology, 2001. 26(1): p. 32-46). R package pldist는 미생물 프로파일의 반복 측정에서 피험자에 대한 미생물 다변량을 얻기 위해 사용되는데, pldist는 균총(microbiome) 조성의 피험자 내 변화를 요약한 다음 이러한 조성 변화를 피험자별로 비교하였다. 이러한 비유사성은 상대적 존재비의 새로운 변형에 달려 있는데, 이를 2 이상의 시점으로 확장하여 여러 비유사성에 병합하였다. 이 비유사성에 Bray-Curtis 및 kulczynski 거리를 사용하였으며, R package adonis를 갖는 생화학 관련 KARE 표현형에서 PERMANOVA를 수행하였다. 또한, 2013년, 2015년 및 2017년의 값에 대해 표현형을 평균화하였으며, 그 결과는 도 3과 같다.To analyze the microbial multivariate explained by the KARE phenotype, PERMANOVA (Permutational multivariate analysis of variance) method was performed. The PERMANOVA is a non-parametric method of multivariate analysis of variance based on pairwise distances (Anderson, MJ, A new method for non-parametric multivariate analysis of variance . Austral ecology, 2001. 26(1)) : p. 32-46). The R package pldist is used to obtain microbial multivariate for a subject in repeated measurements of the microbial profile. The pldist summarizes the within-subject changes in the composition of the microbiome and then compares these compositional changes by subject. These dissimilarities depend on a new transformation of relative abundance, which has been extended to two or more points of view and merged with several dissimilarities. Bray-Curtis and kulczynski distances were used for this dissimilarity, and PERMANOVA was performed on the biochemistry-related KARE phenotype with R package adonis. In addition, the phenotypes were averaged for the values in 2013, 2015, and 2017, and the results are shown in FIG. 3 .

도 3은 PERMANOVA 방법을 사용하여 미생물 조성에서의 KARE 표현형과 인슐린 저항성(HOMA-IR)의 연관성을 조사한 결과로서, 도 3에 나타난 바와 같이, period 6 (2013년)의 당화혈색소(HbA1c), 백혈구(WBC) 수치, 헤마토크릿(Hct, hematocrit) 수치, DM_binary1 및 연령이 추적 기간 동안의 미생물 변화와 유의하게 관련이 있음을 확인하였다. 또한, 당화혈색소(HbA1c) 및 DM_binary1이 코호트 대상에서 2013년 내지 2017년까지의 미생물 변화의 다변량을 유의하게 설명할 수 있는데, 이는 미생물 변화가 당뇨병과 관련 있음을 암시한다.3 is a result of examining the correlation between KARE phenotype and insulin resistance (HOMA-IR) in the microbial composition using the PERMANOVA method. It was confirmed that (WBC) level, hematocrit (Hct, hematocrit) level, DM_binary1 and age were significantly related to microbial changes during the follow-up period. In addition, glycated hemoglobin (HbA1c) and DM_binary1 could significantly explain the multivariate of microbial changes from 2013 to 2017 in cohort subjects, suggesting that microbial changes are associated with diabetes.

[실시예 3-2] 균총과 당뇨병의 상관관계 분석 및 네트워크 분석[Example 3-2] Correlation analysis and network analysis of flora and diabetes

당뇨병 위험도 예측 또는 진단을 위한 바이오마커 발굴을 위해 하기 균총과당뇨병의 상관관계 분석 및 네트워크 분석을 수행하였다.In order to discover biomarkers for predicting or diagnosing diabetes risk, the following correlation analysis and network analysis of the flora and diabetes were performed.

먼저, 상관관계 분석에 있어, 각 속과 종에 대해, 일반화된 선형 혼합 모델을 당뇨병과의 연관성을 찾는 데 사용하고 선형 혼합 모델을 KARE 표현형과의 연관성을 찾는 데 사용하였다. 추적 기간 중 각각의 시점에 대해 상이한 스케일 파라미터를 갖는 복합 대칭 구조는 공분산 구조인 것으로 추정되고, 샌드위치 추정기(sandwich estimator)를 공분산 매트릭스의 강력한 추정치를 찾는 데 사용하였다. 여러 테스트의 문제는 Benjamin Hochberg 방법으로 FDR (false discovery rate)로 조정되었다. 상관 계수가 0.6 초과이고 FDR이 0.05보다 작은 속은 통계적으로 유의한 것으로 간주되었다.First, in the correlation analysis, for each genus and species, a generalized linear mixed model was used to find the association with diabetes, and the linear mixed model was used to find the association with the KARE phenotype. Complex symmetric structures with different scale parameters for each time point during the follow-up period were assumed to be covariance structures, and a sandwich estimator was used to find a robust estimate of the covariance matrix. The problems of several tests were adjusted to the false discovery rate (FDR) by the Benjamin Hochberg method. Genus with a correlation coefficient greater than 0.6 and an FDR less than 0.05 were considered statistically significant.

또한, 미생물 다변량을 설명하는 연관 분석 및 KARE 표현형에서 FDR 0.1 미만인 분류군 및 기능성 유전자의 경우, 표현형, 기능성 유전자 및 분류군 사이의 잠재적 관계를 찾기 위해 네트워크 분석을 수행하였다. 엣지 폭(edge width)은 p-값의 -log10이다. Rho가 양수이면, edge의 색을 붉은색으로, Rho가 음수이면 파란색으로 표시하였다. 파란색 노드(node)는 microbiota을 나타내고 KARE 표현형은 붉은색으로 표시하였다. 이러한 시각화에 R package visNetwork (version 2.0.8)를 사용하였다.In addition, for taxa and functional genes with an FDR less than 0.1 in association analysis and KARE phenotype to account for microbial multivariate, network analysis was performed to find potential relationships between phenotypes, functional genes and taxa. The edge width is -log 10 of the p-value. When Rho is positive, the edge color is displayed in red, and when Rho is negative, it is displayed in blue. Blue nodes indicate microbiota and KARE phenotypes are indicated in red. The R package visNetwork (version 2.0.8) was used for this visualization.

상기 분석 결과로부터, 당뇨병(DM) 군과 분류되지 않은 Lachnospiraceae 속균주의 미생물인 GU174097_g의 연관성을 발견했다. 하기 표 3는 GU174097_g 가 T2D 군 및 T2D 위험군보다 정상군에서 더 많이 존재함을 보여준다.From the above analysis results, the association between the diabetes (DM) group and the unclassified Lachnospiraceae microorganism GU174097_g was found. Table 3 below shows that GU174097_g was more present in the normal group than in the T2D group and the T2D risk group.

PhenotypePhenotype GenusGenus EstimateEstimate StdErrStdErr DFDF p-valuep-value FDRFDR DM_binary2DM_binary2 GU174097_gGU174097_g -189.13-189.13 46.632446.6324 735735 0.00006 0.00006 0.003930.00393

또한, 도 5에 나타난 바와 같이, 2013 내지 2017년의 기간 동안 GU174097_g 는 당뇨병 피험자(T2D 군(DM) 및 T2D 위험군(DM_before))보다 정상 피험자(정상군(Healthy))에서 더 많이 존재하고, 정상에서 당뇨병 또는 당뇨병 전증(prediabetes) 상태로 전환한 피험자 또는 당뇨병 전증 상태에서 당뇨병으로 전환한 피험자에서 상대적으로 더 많이 존재함을 확인하였다. 이를 통해 피험자의 상태가 악화, 즉 당뇨병 위험도가 증가하거나 당뇨병을 갖게 됨에 따라 GU174097_g 의 상대적 존재비가 감소함을 알 수 있었다.In addition, as shown in FIG. 5 , during the period of 2013 to 2017, GU174097_g was more present in normal subjects (normal group (Healthy)) than diabetic subjects (T2D group (DM) and T2D risk group (DM_before)), and normal It was confirmed that there was relatively more presence in subjects who switched to diabetes or prediabetes or those who switched from prediabetes to diabetes. Through this, it was found that the relative abundance of GU174097_g decreased as the subject's condition worsened, that is, the risk of diabetes increased or had diabetes.

한편, 하프니아(Hafnia) 속 및 콜린셀라(Collinsella) 속과 당뇨병-관련 표현형들 중 당화혈색소(HbA1c)는 하기 표 4와 같이 상관관계가 있으며, GU174097_g 의 미생물 대사는 다른 속과 구별될 수 없다. 하기 표 4의 결과는 하프니아(Hafnia) 속 및 콜린셀라(Collinsella) 속이 당뇨병, 구체적으로 제2형 당뇨병을 유도하기 위해서는 GU174097_g 또는 기타 다른 요인과 상호작용이 필요함을 보여준다.On the other hand, hafnia (Hafnia) in and Colin Cellar (Collinsella) in the diabetes - glycosylated hemoglobin (HbA1c) of the associated phenotypes are correlated as in Table 4, microbial metabolism of GU174097_g can not be distinguished from the others in . To the results in Table 4 is a hafnia (Hafnia) and choline in Sela (Collinsella) shows a trick requires diabetes, and specifically to lead to claim 2 diabetes GU174097_g or other factors and interactions.

PhenotypePhenotype GenusGenus EstimateEstimate p-valuep-value FDRFDR HbA1cHbA1c HafniaHafnia 0.00200.0020 1.76E-081.76E-08 5.74E-055.74E-05

또한, 하기 표 5에 따르면, GU174097_g가 경구 당부하 60분 인슐린 수치와 양의 상관관계가 있다. 이는 GU174097_g가 인체에서 인슐린 수치의 항상성 주기를 도울 수 있음을 의미한다. 또한, 공복 인슐린 수치 및 인슐린 저항성(HOMA-IR)의 계수(coefficient)는 상당한 유의미가 있지 않더라도, 음의 상관관계가 있어 인슐린 저항성을 완화시켜 당뇨병의 위험성을 줄일 수 있다. 당화혈색소(HbA1c) 수치 및 경구 당부하 60분 및 120분 혈당 수치는 또한 상기 분석 결과를 긍정적으로 뒷받침한다.In addition, according to Table 5 below, GU174097_g had a positive correlation with the 60-minute oral glucose tolerance insulin level. This means that GU174097_g can help the homeostatic cycle of insulin levels in the human body. In addition, although the fasting insulin level and the coefficient of insulin resistance (HOMA-IR) are not significantly significant, they have a negative correlation, which can alleviate the insulin resistance and reduce the risk of diabetes. Glycated hemoglobin (HbA1c) levels and oral glucose tolerance 60 min and 120 min blood glucose levels also support the above assay results positively.

PhenotypePhenotype RhoRho p-valuep-value FDRFDR Ins60Ins60 0.09500.0950 0.00180.0018 0.00260.0026 HbA1cHbA1c -0.0434-0.0434 0.15480.1548 0.18720.1872 Glu0Glu0 0.03060.0306 0.31650.3165 0.36470.3647 Ins0Ins0 -0.0301-0.0301 0.32360.3236 0.37210.3721 HOMA-IRHOMA-IR -0.0270-0.0270 0.37560.3756 0.42550.4255 Glu60Glu60 -0.0229-0.0229 0.45360.4536 0.50450.5045 Ins120Ins120 0.01770.0177 0.56220.5622 0.60960.6096 Glu120Glu120 0.00720.0072 0.81380.8138 0.84240.8424 BMIBMI -0.0070-0.0070 0.81860.8186 0.84690.8469

종래 연구에서, 제2형 당뇨병 환자는 인슐린을 충분히 생산할 수 없었지만 포도당 내성 장애가 있는 환자는 제2형 당뇨병 및 인슐린 민감성 환자보다 더 많은 양의 인슐린을 생산할 수 있었으며, 제2형 당뇨병 환자는 생산할 수 있는 인슐린의 양이 약간이지만 혈당을 잘 조절할 만큼 충분히 빠르지는 않았다. 또한, 인슐린 감수성이 정상인 사람은 인슐린의 중간 상승을 가지며, 이는 혈당에서의 항상성을 유지할 만큼 충분하고, 이러한 차이는 경구 당부하 60분 인슐린 수치에서 극대화된다(Lee, S., et al., Intact glucagon-like peptide-1 levels are not decreased in Japanese patients with type 2 diabetes. Endocrine journal, 2009: p. 0910220351-0910220351). 이러한 결과는 GU174097_g의 상대적 존재비의 수치가 피험자의 인슐린 감수성(insulin sensitive)과 연관 있다는 점에서, 도 5에서 정상군과 T2D 위험군 사이에서 GU174097_g의 상대적 존재비의 차이가 극대화되는 결과에 영향을 주는 것을 확인하였다. 또한, GU174097_g는 경구 당부하 60분 인슐린 수치와 강한 양의 상관관계가 있으나 경구 당부하 120분 인슐린 수치와는 명확한 연관성이 없다는 점에서, 상기 결과는 상기 표 5에 나타난 결과와 일치한다.In previous studies, patients with type 2 diabetes could not produce enough insulin, but patients with impaired glucose tolerance were able to produce higher amounts of insulin than patients with type 2 diabetes and insulin sensitivity, and type 2 diabetes patients could The amount of insulin was small, but not fast enough to control blood sugar well. In addition, people with normal insulin sensitivity have a moderate elevation of insulin, which is sufficient to maintain homeostasis in blood glucose, and this difference is maximized at 60-minute oral glucose tolerance insulin levels (Lee, S., et al., Intact). glucagon-like peptide-1 levels are not decreased in Japanese patients with type 2 diabetes . Endocrine journal, 2009: p. 0910220351-0910220351). These results confirm that the difference in the relative abundance of GU174097_g is maximized between the normal group and the T2D risk group in FIG. 5 in that the level of the relative abundance of GU174097_g is related to the subject's insulin sensitivity did. In addition, GU174097_g had a strong positive correlation with insulin levels at 60 minutes of oral glucose tolerance, but there was no clear correlation with insulin levels at 120 minutes of oral glucose tolerance, so the results are consistent with the results shown in Table 5 above.

도 6은 인슐린 수치와 혈당 수치의 네트워크 분석 결과 및 강한 양의 상관 관계와의 연관성을 설명한다. 음의 상관관계는 당화혈색소(HbA1c) 수치 및 경구 당부하 60분 인슐린 수치 사이에서 발견되었다. 이는 이전 임상 연구와 상기 네트워크 분석 결과 일관성을 보여준다.6 illustrates the correlation between the results of network analysis of the insulin level and the blood glucose level and the strong positive correlation. A negative correlation was found between glycated hemoglobin (HbA1c) levels and oral glucose tolerance 60 min insulin levels. This is consistent with previous clinical studies and the network analysis results.

종합적으로, 라크노스피로세(Lachnospiraceae) 과의 미생물인 GU174097_g는 당뇨병 군 및 당뇨병 위험군에 비하여 정상군에서 더 많이 존재하는바, 상기 균주 GU174097_g를 검출할 수 있는 제제를 포함하는 조성물, 상기 조성물을 포함하는 키트, 피험자의 샘플로부터 상기 균주 GU174097_g에 대한 프라이머를 반응시켜 증폭시키는 단계를 포함하는 당뇨병 위험도를 예측 또는 진단하기 위한 정보제공방법은 당뇨병의 위험도를 예측 또는 진단하는 데 있어 우수한 효과가 있다.Overall, GU174097_g , a microorganism of the Lachnospiraceae family, is more present in the normal group than in the diabetic group and the diabetes risk group. A composition comprising an agent capable of detecting the strain GU174097_g, including the composition A kit, an information providing method for predicting or diagnosing the risk of diabetes, including the step of amplifying by reacting a primer for the strain GU174097_g from a sample of a subject, has an excellent effect in predicting or diagnosing the risk of diabetes.

<110> Seoul National University R&DB Foundation Industry-Academic Cooperation Foundation, Dankook University <120> Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae <130> 20p102/ind <160> 6 <170> KoPatentIn 3.0 <210> 1 <211> 1461 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the family Lachnospiraceae <400> 1 gatgaacgct ggcggcgtgc ctaacacatg caagtcgaac ggagttaatc ggaaaaggag 60 ttagcttgct aataacaatt cggattgact tagtggcgga cgggtgagta acgcgtgggt 120 aacctgcccc atacaggggg ataacagtta gaaatgactg ctaacaccgc ataacatggc 180 gggggcgcat gaccctgcca tcaaaaattt attggtatgg gatgggcccg cgtctgatta 240 gctagttggt aaggtaacgg cctaccaagg cgacgatcag tagccggctt gagagagtgg 300 acggccacat tgggactgag acacggccca aactcctacg ggaggcagca gtgggggata 360 ttggacaatg ggggcaaccc tgatccagcg acgccgcgtg agtgaagaag tatttcggta 420 tgtaaagctc tatcagcagg gaagataatg acagtacctg accaagaagc accggctaaa 480 tacgtgccag cagccgcggt aatacgtatg gtgcaagcgt tatccggatt tactgggtgt 540 aaagggagcg taggcggtct gccaagtctg atgtgaaaac ccggggctca accccgggag 600 tgcattggaa actggcggac tggagtgtcg gagaggtaag cggaattcct agtgtagcgg 660 tgaaatgcgt agatattagg aggaacacca gtggcgaagg cggcttactg gacgataact 720 gacgctgagg ctcgaaagcg tggggagcaa acaggattag ataccctggt agtccacgcc 780 gtaaacgatg aatactaggt gtcggggcac aaaagtgctc cggtgccgtc gcaaacgcag 840 taagtattcc acctggggag tacgttcgca agaatgaaac tcaaaggaat tgacggggac 900 ccgcacaagc ggtggagcat gtggattaat tcgacgcaac gcgaagaacc ttacctgtcc 960 ttgacatccc cctgaccggt gagtaacgtc acctttccta cgggacaggg gagacaggtg 1020 gtgcatggtt gtcgtcagct cgtgtcgtga gatgttgggt taagtcccgc aacgagcgca 1080 acccctattc ccagtagcca gcggccaggc cgggcactct ggggagactg ccggggataa 1140 cccggaggaa ggcggggatg acgtcaaatc atcatgcccc ttatgggcag ggcttcacac 1200 gtgctacaat gacagccaca aagggatgcg aacctgcgag ggggagcgaa ccccagaaaa 1260 gctgtcccag ttcggattgt agtctgcaac ccgactacat gaagctggaa tcgctagtaa 1320 tcgcgaatca gaatgtcgcg gtgaatacgt tcccgggtct tgtacacacc gcccgtcaca 1380 ccatgggaga tggatatgcc cgaagtcagt gacctaaccg caagggagga gctgccgaag 1440 gtggagccat taactggggt g 1461 <210> 2 <211> 1444 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the Lachnospiraceae family <400> 2 gatgaacgct ggcggcgtgc ttaacacatg caagtcgaac ggacccatat tgaaacctag 60 tgatatatgg gttagtggcg gacgggtgag taacgcgtgg gcaacctgcc ttacacaggg 120 ggataacact tagaaatagg tgctaaaacc gcataagcgc acagcttcgc atgaagcggt 180 gtgaaaaact ccggtggtgt aagatggacc cgcgtctgat tagcttgttg gcggggtaac 240 ggcccaccaa ggcgacgatc agtagccggc ctgagagggc ggacggccac attgggactg 300 agacacggcc cagactccta cgggaggcag cagtggggaa tattgcacaa tgggggaaac 360 cctgatgcag cgacgccgcg tgagtgaaga agtaattcgt tacgtaaagc tctatcagca 420 gggaagaaaa tgacggtacc tgagtaagaa gccccggcta actacgtgcc agcagccgcg 480 gtaatacgta gggggcaagc gttatccgga tttactgggt gtaaagggag cgtagacggt 540 gcgccaagtc tggagtgaaa tgccgcagct taactgcgga actgctttgg aaactggcgg 600 actagagtgc gggaggggta agcggaattc ctagtgtagc ggtgaaatgc gtagatatta 660 ggaggaacac cggtggcgaa ggcggcttac tggaccgtaa ctgacgttga ggctcgaaag 720 cgtggggagc aaacaggatt agataccctg gtagtccacg ccgtaaacga tgattactag 780 gtgtcggggc cctaaggggc ttcggtgccg ccgcaaacgc attaagtaat ccacctgggg 840 agtacgttcg caagaatgaa actcaaagga attgacgggg acccgcacaa gcggtggagc 900 atgtggttta attcgaagca acgcgaagaa ccttacctgc ccttgacatc cggatgaata 960 aggggtaatg cccttagccc ttcggggcat ccgagacagg tggtgcatgg ttgtcgtcag 1020 ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg caacccctat cttcagtagc 1080 cagcattcag gatgggaact caggagagac tgcccgggac aaccgggagg aaggcgggga 1140 tgacgtcaaa tcatcatgcc ccttatgggc agggctacac acgtgctaca atggcgaaaa 1200 cagagggaag cgagccggtg acggtaagca aaccccaaaa acatcgtccc agttcggact 1260 gtagtctgca acccgactac acgaagccgg aatcgctagt aatcgcggat cagaatgccg 1320 cggtgaatac gttcccgggt cttgtacaca ccgcccgtca caccatggga gtcggaaatg 1380 cccgaagtca gtgacctaac ctttaaggga ggagctgccg aaggtggagc cggtaactgg 1440 ggtg 1444 <210> 3 <211> 1465 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the genus Hafnia <400> 3 attgaacgct ggcggcaggc ctaacacatg caagtcgagc ggtagcacaa gagagcttgc 60 tctctgggtg acgagcggcg gacgggtgag taatgtctgg gaaactgcct gatggagggg 120 gataactact ggaaacggta gctaataccg catgacgtct tcggaccaaa gtgggggacc 180 ttcgggcctc acgccatcag atgtgcccag atgggattag ctagtaggtg gggtaatggc 240 tcacctaggc gacgatctct agctggtctg agaggatgac cagccacact ggaactgaga 300 cacggtccag actcctacgg gaggcagcag tggggaatat tgcacaatgg gcgcaagcct 360 gatgcagcca tgccgcgtgt atgaagaagg ccttcgggtt gtaaagtact ttcagcgagg 420 aggaaggcat tgtggttaat aaccacagtg attgacgtta ctcgcagaag aagcaccggc 480 taactccgtg ccagcagccg cggtaatacg gagggtgcaa gcgttaatcg gaattactgg 540 gcgtaaagcg cacgcaggcg gttgattaag tcagatgtga aatccccgag cttaacttgg 600 gaactgcatt tgaaactggt cagctagagt cttgtagagg ggggtagaat tccaggtgta 660 gcggtgaaat gcgtagagat ctggaggaat accggtggcg aaggcggccc cctggacaaa 720 gactgacgct caggtgcgaa agcgtgggga gcaaacagga ttagataccc tggtagtcca 780 cgctgtaaac gatgtcgact tggaggttgt gcccttgagg cgtggcttcc ggagctaacg 840 cgttaagtcg accgcctggg gagtacggcc gcaaggttaa aactcaaatg aattgacggg 900 ggcccgcaca agcggtggag catgtggttt aattcgatgc aacgcgaaga accttaccta 960 ctcttgacat ccagagaatt tagcagagat gctttagtgc cttcgggaac tctgagacag 1020 gtgctgcatg gctgtcgtca gctcgtgttg tgaaatgttg ggttaagtcc cgcaacgagc 1080 gcaaccctta tcctttgttg ccagcacgta atggtgggaa ctcaaaggag actgccggtg 1140 ataaaccgga ggaaggtggg gatgacgtca agtcatcatg gcccttacga gtagggctac 1200 acacgtgcta caatggcata tacaaagaga agcgaactcg cgagagcaag cggacctcat 1260 aaagtatgtc gtagtccgga ttggagtctg caactcgact ccatgaagtc ggaatcgcta 1320 gtaatcgtag atcagaatgc tacggtgaat acgttcccgg gccttgtaca caccgcccgt 1380 cacaccatgg gagtgggttg caaaagaagt aggtagctta accttcggga gggcgcttac 1440 cactttgtga ttcatgactg gggtg 1465 <210> 4 <211> 1427 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the genus Collinsella <400> 4 gatgaacgct ggcggcgcgc ctaacacatg caagtcgaac ggcacccctc tccggaggga 60 agcgagtggc gaacggctga gtaacacgtg gagaacctgc cccctccccc gggatagccg 120 cccgaaagga cgggtaatac cggatacccc ggggtgccgc atggcgcccc ggctaaagcc 180 ccgacgggag gggatggctc cgcggcccat caggtagacg gcggggtgac ggcccaccgt 240 gccgacaacg ggtagccggg ttgagagacc gaccggccag attgggactg agacacggcc 300 cagactccta cgggaggcag cagtggggaa tcttgcgcaa tggggggaac cctgacgcag 360 cgacgccgcg tgcgggacgg aggccttcgg gtcgtaaacc gctttcagca gggaagagtc 420 aagactgtac ctgcagaaga agccccggct aactacgtgc cagcagccgc ggtaatacgt 480 agggggcgag cgttatccgg attcattggg cgtaaagcgc gcgtaggcgg cccggcaggc 540 cgggggtcga agcggggggc tcaacccccc gaagcccccg gaaccccgcg gcttgggtcc 600 ggtaggggag ggtggaacac ccggtgtagc ggtggaatgc gcagatatcg ggtggaacac 660 cggtggcgaa ggcggccctc tgggccgaga ccgacgctga ggcgcgaaag ctgggggagc 720 gaacaggatt agataccctg gtagtcccag ccgtaaacga tggacgctag gtgtgggggg 780 acgatccccc cgtgccgcag ccaacgcatt aagcgtcccg cctggggagt acggccgcaa 840 ggctaaaact caaaggaatt gacgggggcc cgcacaagca gcggagcatg tggcttaatt 900 cgaagcaacg cgaagaacct taccagggct tgacatatgg gtgaagcggg ggagaccccg 960 tggccgagag gagcccatac aggtggtgca tggctgtcgt cagctcgtgt cgtgagatgt 1020 tgggttaagt cccgcaacga gcgcaacccc cgccgcgtgt tgccatcggg tgatgccggg 1080 aacccacgcg ggaccgccgc cgtcaaggcg gaggagggcg gggacgacgt caagtcatca 1140 tgccccttat gccctgggct gcacacgtgc tacaatggcc ggtacagagg gatgccaccc 1200 cgcgaggggg agcggatccc ggaaagccgg ccccagttcg gattgggggc tgcaacccgc 1260 ccccatgaag tcggagttgc tagtaatcgc ggatcagcat gccgcggtga atgcgttccc 1320 gggccttgta cacaccgccc gtcacaccac ccgagtcgtc tgcacccgaa gtcgccggcc 1380 caaccgagag gggggaggcg ccgaaggtgt ggagggtgag gggggtg 1427 <210> 5 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> F357 <400> 5 cctacgggag gcagcag 17 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> R519 <400> 6 gtnttacngc ggckgctg 18 <110> Seoul National University R&DB Foundation Industry-Academic Cooperation Foundation, Dankook University <120> Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae <130> 20p102/ind <160> 6 <170> KoPatentIn 3.0 <210> 1 <211> 1461 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the family Lachnospiraceae <400> 1 gatgaacgct ggcggcgtgc ctaacacat caagtcgaac ggagttaatc ggaaaaggag 60 ttagcttgct aataacaatt cggattgact tagtggcgga cgggtgagta acgcgtgggt 120 aacctgcccc atacagggg ataacagtta gaaatgactg ctaacaccgc ataacatggc 180 gggggcgcat gaccctgcca tcaaaaattt attggtatgg gatgggcccg cgtctgatta 240 gctagttggt aaggtaacgg cctaccaagg cgacgatcag tagccggctt gagagagtgg 300 acggccacat tgggactgag acacggccca aactcctacg ggaggcagca gtgggggata 360 ttggacaatg ggggcaaccc tgatccagcg acgccgcgtg agtgaagaag tatttcggta 420 tgtaaagctc tatcagcagg gaagataatg acagtacctg accaagaagc accggctaaa 480 tacgtgccag cagccgcggt aatacgtatg gtgcaagcgt tatccggatt tactgggtgt 540 aaagggagcg taggcggtct gccaagtctg atgtgaaaac ccggggctca accccgggag 600 tgcattggaa actggcggac tggagtgtcg gagaggtaag cggaattcct agtgtagcgg 660 tgaaatgcgt agatattagg aggaacacca gtggcgaagg cggcttactg gacgataact 720 gacgctgagg ctcgaaagcg tggggagcaa acaggattag ataccctggt agtccacgcc 780 gtaaacgatg aatactaggt gtcggggcac aaaagtgctc cggtgccgtc gcaaacgcag 840 taagtattcc acctggggag tacgttcgca agaatgaaac tcaaaggaat tgacggggac 900 ccgcacaagc ggtggagcat gtggattaat tcgacgcaac gcgaagaacc ttacctgtcc 960 ttgacatccc cctgaccggt gagtaacgtc acctttccta cgggacaggg gagacaggtg 1020 gtgcatggtt gtcgtcagct cgtgtcgtga gatgttgggt taagtcccgc aacgagcgca 1080 acccctattc ccagtagcca gcggccaggc cgggcactct ggggagactg ccggggataa 1140 cccggaggaa ggcggggatg acgtcaaatc atcatgcccc ttatgggcag ggcttcacac 1200 gtgctacaat gacagccaca aagggatgcg aacctgcgag ggggagcgaa ccccagaaaa 1260 gctgtcccag ttcggattgt agtctgcaac ccgactacat gaagctggaa tcgctagtaa 1320 tcgcgaatca gaatgtcgcg gtgaatacgt tcccgggtct tgtacacacc gcccgtcaca 1380 ccatgggaga tggatatgcc cgaagtcagt gacctaaccg caagggagga gctgccgaag 1440 gtggagccat taactggggt g 1461 <210> 2 <211> 1444 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the Lachnospiraceae family <400> 2 gatgaacgct ggcggcgtgc ttaacacat caagtcgaac ggacccatat tgaaacctag 60 tgatatatgg gttagtggcg gacgggtgag taacgcgtgg gcaacctgcc ttacacaggg 120 ggataacact tagaaatagg tgctaaaacc gcataagcgc acagcttcgc atgaagcggt 180 gtgaaaaact ccggtggtgt aagatggacc cgcgtctgat tagcttgttg gcggggtaac 240 ggcccaccaa ggcgacgatc agtagccggc ctgagagggc ggacggccac attgggactg 300 agacacggcc cagactccta cgggaggcag cagtggggaa tattgcacaa tgggggaaac 360 cctgatgcag cgacgccgcg tgagtgaaga agtaattcgt tacgtaaagc tctatcagca 420 gggaagaaaa tgacggtacc tgagtaagaa gccccggcta actacgtgcc agcagccgcg 480 gtaatacgta gggggcaagc gttatccgga tttactgggt gtaaagggag cgtagacggt 540 gcgccaagtc tggagtgaaa tgccgcagct taactgcgga actgctttgg aaactggcgg 600 actagagtgc gggaggggta agcggaattc ctagtgtagc ggtgaaatgc gtagatatta 660 ggaggaacac cggtggcgaa ggcggcttac tggaccgtaa ctgacgttga ggctcgaaag 720 cgtggggagc aaacaggatt agataccctg gtagtccacg ccgtaaacga tgattactag 780 gtgtcggggc cctaaggggc ttcggtgccg ccgcaaacgc attaagtaat ccacctgggg 840 agtacgttcg caagaatgaa actcaaagga attgacgggg acccgcacaa gcggtggagc 900 atgtggttta attcgaagca acgcgaagaa ccttacctgc ccttgacatc cggatgaata 960 aggggtaatg cccttagccc ttcggggcat ccgagacagg tggtgcatgg ttgtcgtcag 1020 ctcgtgtcgt gagatgttgg gttaagtccc gcaacgagcg caacccctat cttcagtagc 1080 cagcattcag gatgggaact caggagagac tgcccgggac aaccgggagg aaggcgggga 1140 tgacgtcaaa tcatcatgcc ccttatgggc agggctacac acgtgctaca atggcgaaaa 1200 cagagggaag cgagccggtg acggtaagca aaccccaaaa acatcgtccc agttcggact 1260 gtagtctgca acccgactac acgaagccgg aatcgctagt aatcgcggat cagaatgccg 1320 cggtgaatac gttcccgggt cttgtacaca ccgcccgtca caccatggga gtcggaaatg 1380 cccgaagtca gtgacctaac ctttaaggga ggagctgccg aaggtggagc cggtaactgg 1440 ggtg 1444 <210> 3 <211> 1465 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the genus Hafnia <400> 3 attgaacgct ggcggcaggc ctaacacat caagtcgagc ggtagcacaa gagagcttgc 60 tctctgggtg acgagcggcg gacgggtgag taatgtctgg gaaactgcct gatggagggg 120 gataactact ggaaacggta gctaataccg catgacgtct tcggaccaaa gtgggggacc 180 ttcgggcctc acgccatcag atgtgcccag atgggattag ctagtaggtg gggtaatggc 240 tcacctaggc gacgatctct agctggtctg agaggatgac cagccacact ggaactgaga 300 cacggtccag actcctacgg gaggcagcag tggggaatat tgcacaatgg gcgcaagcct 360 gatgcagcca tgccgcgtgt atgaagaagg ccttcgggtt gtaaagtact ttcagcgagg 420 aggaaggcat tgtggttaat aaccacagtg attgacgtta ctcgcagaag aagcaccggc 480 taactccgtg ccagcagccg cggtaatacg gagggtgcaa gcgttaatcg gaattactgg 540 gcgtaaagcg cacgcaggcg gttgattaag tcagatgtga aatccccgag cttaacttgg 600 gaactgcatt tgaaactggt cagctagagt cttgtagagg ggggtagaat tccaggtgta 660 gcggtgaaat gcgtagagat ctggaggaat accggtggcg aaggcggccc cctggacaaa 720 gactgacgct caggtgcgaa agcgtgggga gcaaacagga tagataccc tggtagtcca 780 cgctgtaaac gatgtcgact tggaggttgt gcccttgagg cgtggcttcc ggagctaacg 840 cgttaagtcg accgcctggg gagtacggcc gcaaggttaa aactcaaatg aattgagggg 900 ggcccgcaca agcggtggag catgtggttt aattcgatgc aacgcgaaga accttaccta 960 ctcttgacat ccagagaatt tagcagagat gctttagtgc cttcgggaac tctgagacag 1020 gtgctgcatg gctgtcgtca gctcgtgttg tgaaatgttg ggttaagtcc cgcaacgagc 1080 gcaaccctta tcctttgttg ccagcacgta atggtgggaa ctcaaaggag actgccggtg 1140 ataaaccgga ggaaggtggg gatgacgtca agtcatcatg gcccttacga gtagggctac 1200 acacgtgcta caatggcata tacaaagaga agcgaactcg cgagagcaag cggacctcat 1260 aaagtatgtc gtagtccgga ttggagtctg caactcgact ccatgaagtc ggaatcgcta 1320 gtaatcgtag atcagaatgc tacggtgaat acgttcccgg gccttgtaca caccgcccgt 1380 cacaccatgg gagtgggttg caaaagaagt aggtagctta accttcggga gggcgcttac 1440 cactttgtga ttcatgactg gggtg 1465 <210> 4 <211> 1427 <212> DNA <213> Unknown <220> <223> 16S rRNA sequence from the genus Collinsella <400> 4 gatgaacgct ggcggcgcgc ctaacacat caagtcgaac ggcacccctc tccggaggga 60 agcgagtggc gaacggctga gtaacacgtg gagaacctgc cccctccccc gggatagccg 120 cccgaaagga cgggtaatac cggatacccc ggggtgccgc atggcgcccc ggctaaagcc 180 ccgacgggag gggatggctc cgcggcccat caggtagacg gcggggtgac ggcccaccgt 240 gccgacaacg ggtagccggg ttgagagacc gaccggccag attgggactg agacacggcc 300 cagactccta cgggaggcag cagtggggaa tcttgcgcaa tggggggaac cctgacgcag 360 cgacgccgcg tgcgggacgg aggccttcgg gtcgtaaacc gctttcagca gggaagagtc 420 aagactgtac ctgcagaaga agccccggct aactacgtgc cagcagccgc ggtaatacgt 480 agggggcgag cgttatccgg attcattggg cgtaaagcgc gcgtaggcgg cccggcaggc 540 cgggggtcga agcggggggc tcaacccccc gaagcccccg gaaccccgcg gcttgggtcc 600 ggtaggggag ggtggaacac ccggtgtagc ggtggaatgc gcagatatcg ggtggaacac 660 cggtggcgaa ggcggccctc tgggccgaga ccgacgctga ggcgcgaaag ctgggggagc 720 gaacaggatt agataccctg gtagtcccag ccgtaaacga tggacgctag gtgtgggggg 780 acgatccccc cgtgccgcag ccaacgcatt aagcgtcccg cctggggagt acggccgcaa 840 ggctaaaact caaaggaatt gacgggggcc cgcacaagca gcggagcatg tggcttaatt 900 cgaagcaacg cgaagaacct taccagggct tgacatatgg gtgaagcggg ggagaccccg 960 tggccgagag gagcccatac aggtggtgca tggctgtcgt cagctcgtgt cgtgagatgt 1020 tgggttaagt cccgcaacga gcgcaacccc cgccgcgtgt tgccatcggg tgatgccggg 1080 aacccacgcg ggaccgccgc cgtcaaggcg gaggagggcg gggacgacgt caagtcatca 1140 tgccccttat gccctgggct gcacacgtgc tacaatggcc ggtacagagg gatgccaccc 1200 cgcgaggggg agcggatccc ggaaagccgg ccccagttcg gattgggggc tgcaacccgc 1260 ccccatgaag tcggagttgc tagtaatcgc ggatcagcat gccgcggtga atgcgttccc 1320 gggccttgta cacaccgccc gtcacaccac ccgagtcgtc tgcacccgaa gtcgccggcc 1380 caaccgagag gggggaggcg ccgaaggtgt ggagggtgag gggggtg 1427 <210> 5 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> F357 <400> 5 cctacgggag gcagcag 17 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> R519 <400> 6 gtnttacngc ggckgctg 18

Claims (18)

당뇨병 위험도 예측 또는 진단용 조성물로서,
상기 조성물은 라크노스피로세(Lachnospiraceae) 과 균주의 미생물을 검출할 수 있는 제제를 포함하고,
상기 라크노스피로세 과 균주는 서열번호 1의 16S rRNA 유전자 서열을 포함하는 GU174097_g 균주이며,
상기 당뇨병은 제2형 당뇨병인, 당뇨병 위험도 예측 또는 진단용 조성물.
A composition for predicting or diagnosing diabetes risk,
The composition comprises an agent capable of detecting microorganisms of Lachnospiraceae and strains,
The Lachnospirose family strain is a GU174097 _g strain comprising the 16S rRNA gene sequence of SEQ ID NO: 1,
The diabetes is type 2 diabetes, diabetes risk prediction or diagnosis composition.
삭제delete 삭제delete 제1항에 있어서,
상기 당뇨병은 하기 i) 내지 iii)의 선정기준 중 하나 이상을 만족하는 것인, 당뇨병 위험도 예측 또는 진단용 조성물:
i) 공복혈당 100 mg/dL 이상;
ii) 경구 당부하 120분 혈당 140 mg/dL 이상; 및
iii) 당화혈색소(HbA1c) 수치 5.7% 이상.
According to claim 1,
The diabetes is a composition for predicting or diagnosing diabetes risk, which satisfies one or more of the following selection criteria of i) to iii):
i) fasting blood sugar greater than 100 mg/dL;
ii) oral glucose tolerance 120 min blood glucose 140 mg/dL or higher; and
iii) Glycated hemoglobin (HbA1c) level of 5.7% or higher.
제1항에 있어서,
상기 조성물은 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물을 검출할 수 있는 제제를 추가로 포함하는, 당뇨병 위험도 예측 또는 진단용 조성물.
According to claim 1,
The composition hafnia (Hafnia) sp and choline Cellar (Collinsella), diabetes risk prediction or diagnostic composition comprising from the group consisting of strains in the additional agents capable of detecting one or more microorganisms selected.
제1항에 있어서,
상기 검출 제제는 미생물에 특이적인 프라이머, 프로브, 안티센스 올리고뉴클레오티드, 압타머 및 항체로 이루어진 군으로부터 선택된 하나 이상인, 당뇨병 위험도 예측 또는 진단용 조성물.
According to claim 1,
The detection agent is at least one selected from the group consisting of primers, probes, antisense oligonucleotides, aptamers and antibodies specific to microorganisms, diabetes risk prediction or diagnosis composition.
제1항 및 제4항 내지 제6항 중 어느 한 항의 조성물을 포함하는, 당뇨병 위험도 예측 또는 진단용 키트.A kit for predicting or diagnosing diabetes risk, comprising the composition of any one of claims 1 and 4 to 6. 제7항에 있어서,
상기 키트는 피험자의 소변 샘플에 적용되는 것인, 당뇨병 위험도 예측 또는진단용 키트.
8. The method of claim 7,
The kit is applied to a urine sample of a subject, diabetes risk prediction or diagnosis kit.
제7항에 있어서,
상기 키트는 설명서를 추가로 포함하고,
상기 설명서에는 피험자의 샘플로부터 얻어진 라크노스피로세(Lachnospiraceae) 과 균주의 미생물 검출량이 정상 대조군 샘플에 비하여 낮으면 당뇨병을 예측 또는 진단하는 것이 기재된, 당뇨병 위험도 예측 또는 진단용 키트.
8. The method of claim 7,
The kit further comprises instructions,
In the manual, when the detection amount of microorganisms of Lachnospiraceae and strains obtained from the subject's sample is lower than that of the normal control sample, predicting or diagnosing diabetes is described, Diabetes risk prediction or diagnosis kit.
제9항에 있어서,
상기 설명서에는 피험자의 샘플로부터 얻어진 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물 검출량이 정상 대조군 샘플에 비하여 높으면 당뇨병을 예측 또는 진단하는 것이 기재된, 당뇨병 위험도 예측 또는 진단용 키트.
10. The method of claim 9,
In the above instructions, if the detection amount of one or more microorganisms selected from the group consisting of Hafnia sp. strain and Collinsella sp. strain obtained from a sample of a subject is higher than that of a normal control sample, predicting or diagnosing diabetes is described, diabetes risk Predictive or diagnostic kits.
당뇨병 위험도 예측 또는 진단을 위한 정보제공방법으로서, 상기 방법은
피험자의 샘플로부터 게놈 DNA를 추출하는 단계;
상기 추출된 게놈 DNA에 라크노스피로세(Lachnospiraceae) 과 균주의 미생물에 특이적인 프라이머를 반응시키는 단계; 및
상기 반응물을 증폭시키는 단계;를 포함하고,
상기 라크노스피로세 과 균주는 서열번호 1의 16S rRNA 유전자 서열을 포함하는 GU174097_g 균주이며,
상기 당뇨병은 제2형 당뇨병인, 당뇨병 위험도 예측 또는 진단을 위한 정보제공방법.
A method for providing information for predicting or diagnosing diabetes risk, the method comprising:
extracting genomic DNA from the subject's sample;
Reacting the extracted genomic DNA with a primer specific to the microorganism of the Lachnospiraceae strain; and
Including; amplifying the reactant;
The Lachnospirose family strain is a GU174097 _g strain comprising the 16S rRNA gene sequence of SEQ ID NO: 1,
The diabetes is type 2 diabetes, the information providing method for predicting or diagnosing the risk of diabetes.
삭제delete 삭제delete 제11항에 있어서,
상기 당뇨병은 하기 i) 내지 iii)의 선정기준 중 하나 이상을 만족하는 것인, 정보제공방법:
i) 공복혈당 100 mg/dL 이상;
ii) 경구 당부하 120분 혈당 140 mg/dL 이상; 및
iii) 당화혈색소(HbA1c) 수치 5.7% 이상.
12. The method of claim 11,
The diabetes is to satisfy one or more of the following selection criteria of i) to iii), information providing method:
i) fasting blood sugar greater than 100 mg/dL;
ii) oral glucose tolerance 120 min blood glucose 140 mg/dL or higher; and
iii) Glycated hemoglobin (HbA1c) level of 5.7% or higher.
제11항에 있어서,
상기 정보제공방법은 상기 증폭 단계 후,
상기 증폭 산물의 양을 정상 대조군 시료의 증폭산물과 비교하는 단계를 추가로 포함하는, 정보제공방법.
12. The method of claim 11,
The information providing method is after the amplification step,
The method of providing information, further comprising the step of comparing the amount of the amplification product with the amplification product of a normal control sample.
제15항에 있어서,
상기 정보제공방법은 상기 피험자 샘플의 라크노스피로세(Lachnospiraceae) 과 균주의 미생물에 대한 증폭산물이 정상 대조군 샘플보다 낮은 경우 당뇨병 위험성이 있는 것으로 예측하거나 당뇨병이 있는 것으로 진단하는 것인, 정보제공방법.
16. The method of claim 15,
The information providing method is predicting that there is a risk of diabetes or diagnosing that there is diabetes when the amplification product for the microorganisms of the Lachnospiraceae family strain of the subject sample is lower than that of the normal control sample, information providing method .
제15항에 있어서,
상기 프라이머 반응 단계는 상기 추출된 게놈 DNA에 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물에 특이적인 프라이머를 반응시키는 것을 추가로 포함하고,
상기 정보제공방법은 상기 피험자 샘플의 하프니아(Hafnia) 속 균주 및 콜린셀라(Collinsella) 속 균주로 이루어진 군에서 선택된 하나 이상의 미생물에 대한 증폭산물이 정상 대조군 샘플보다 높은 경우 당뇨병 위험성이 있는 것으로 예측하거나 당뇨병이 있는 것으로 진단하는 것인, 정보제공방법.
16. The method of claim 15,
The primer reacting step further includes reacting the primers specific to one or more microorganisms selected from the group consisting of hafnia (Hafnia) sp and choline Cellar (Collinsella) in the genomic DNA isolates the extracted,
The information providing method predicts that there is a risk of diabetes if the amplification product for one or more microorganisms selected from the group consisting of Hafnia sp. strain and Collinsella sp. strain of the subject sample is higher than that of the normal control sample, or A method for providing information, which is to diagnose as having diabetes.
삭제delete
KR1020200088766A 2020-07-17 2020-07-17 Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae KR102329509B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200088766A KR102329509B1 (en) 2020-07-17 2020-07-17 Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200088766A KR102329509B1 (en) 2020-07-17 2020-07-17 Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae

Publications (1)

Publication Number Publication Date
KR102329509B1 true KR102329509B1 (en) 2021-11-24

Family

ID=78748077

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200088766A KR102329509B1 (en) 2020-07-17 2020-07-17 Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae

Country Status (1)

Country Link
KR (1) KR102329509B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180098149A (en) * 2017-02-24 2018-09-03 주식회사 엠디헬스케어 Method for diagnosis of diabetes using analysis of bacteria metagenome
JP2019500905A (en) * 2016-01-05 2019-01-17 ウェルミクロ ソチエタ レスポンサビリタ リミタータWellmicro S.R.L. Evaluation method of individual health

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019500905A (en) * 2016-01-05 2019-01-17 ウェルミクロ ソチエタ レスポンサビリタ リミタータWellmicro S.R.L. Evaluation method of individual health
KR20180098149A (en) * 2017-02-24 2018-09-03 주식회사 엠디헬스케어 Method for diagnosis of diabetes using analysis of bacteria metagenome

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
British Journal of Nutrition (2016) 116:80-93* *
Genetic Epidemiology (2020.05.23.) 44(5):496-533, The 2020 Annual Meeting of the International Genetic Epidemiology Society, #59* *
Journal of Food Science (2019) 84(1):165-173 *
Microbes and Environments (2014) 29(4):427-430 *
Microbiome (2018) 6:89 *
NCBI, GenBank: HM124109.1 (2011.04.01.) *
Scientific Reports (2018) 8:3685 *

Similar Documents

Publication Publication Date Title
US20150211053A1 (en) Biomarkers for diabetes and usages thereof
JP6485843B2 (en) Rheumatoid arthritis biomarker and use thereof
CN111876478A (en) Pulmonary nodule diagnostic marker and application
KR101944662B1 (en) Method for diagnosis of stroke using analysis of bacteria metagenome
KR101815692B1 (en) The human oral microbiota in diagnosis of metabolic syndrome
WO2018062743A1 (en) Composition containing intravaginal microorganisms
Hoang et al. Metagenomic 16S rDNA amplicon data of microbial diversity of guts in Vietnamese humans with type 2 diabetes and nondiabetic adults
WO2019175803A1 (en) Method for predicting progression to active tuberculosis disease
KR102329509B1 (en) Composition for predicting or diagnosing diabetes risk comprising agent capable of detecting microorganisms of strain of the genus Lachnospiraceae
CN107937514B (en) Application of primer in preparation of product for diagnosing pulmonary tuberculosis
KR101560706B1 (en) Composition for diagnosing obesity
KR102616111B1 (en) Method for providing information for predicting therapeutic response of severe alcoholic hepatitis by rifaximin administration
CN112266955A (en) Ankylosing spondylitis diagnosis marker and application thereof
KR102363098B1 (en) Predicting or Diagnosing Composition for Risk of Renal Diseases Using Human Intestinal Microbiome, Diagnosing Kit, Method For Providing Information, And Screening Method For Drugs For Preventing Or Treating Renal Diseases Using The Same
KR102555467B1 (en) Exsomal biomarker for diagnosing or predicting of irritable bowel syndrome and use thereof
KR102363092B1 (en) Predicting or Diagnosing Composition for Risk of Obesity Using Human Intestinal Microbiome, Diagnosing Kit, Method For Providing Information, And Screening Method For Drugs For Preventing Or Treating Obesity Using The Same
KR102363094B1 (en) Predicting or Diagnosing Composition for Risk of Liver Diseases Using Human Intestinal Microbiome, Diagnosing Kit, Method For Providing Information, And Screening Method For Drugs For Preventing Or Treating Liver Diseases Using The Same
KR102363088B1 (en) Predicting or Diagnosing Composition for Risk of Diabetic Disease Using Human Intestinal Microbiome, Diagnosing Kit, Method For Providing Information, And Screening Method For Drugs For Preventing Or Treating Diabetes Using The Same
KR102406599B1 (en) Composition for predicting obesity by evaluating the level of intestinal microorganism colony, and use thereof
EP2691536A1 (en) Method for predicting insulinopenic type 2 diabetes
KR102247909B1 (en) Biomarkers in salvia for diagnosis of oral cancer
WO2021086067A1 (en) Biomarkers in saliva for diagnosing oral cancer
EP4015635A1 (en) Colorectal cancer diagnostic marker, method for assisting diagnosis of colorectal cancer, method for collecting data for diagnosis of colorectal cancer, colorectal cancer diagnostic kit, therapeutic agent for colorectal cancer, method for treating colorectal cancer, and method for diagnosing colorectal cancer
KR20220018369A (en) Composition for predicting obesity by evaluating the level of intestinal microorganism colony, and use thereof
JP2023178523A (en) Diagnosis method for atopic dermatitis

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant