KR20220119993A - 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법 - Google Patents

리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법 Download PDF

Info

Publication number
KR20220119993A
KR20220119993A KR1020210023569A KR20210023569A KR20220119993A KR 20220119993 A KR20220119993 A KR 20220119993A KR 1020210023569 A KR1020210023569 A KR 1020210023569A KR 20210023569 A KR20210023569 A KR 20210023569A KR 20220119993 A KR20220119993 A KR 20220119993A
Authority
KR
South Korea
Prior art keywords
otu
microbiome
read
pair
seq
Prior art date
Application number
KR1020210023569A
Other languages
English (en)
Inventor
이형기
Original Assignee
주식회사 메디클라우드
이형기
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 메디클라우드, 이형기 filed Critical 주식회사 메디클라우드
Priority to KR1020210023569A priority Critical patent/KR20220119993A/ko
Priority to PCT/KR2022/002589 priority patent/WO2022177408A1/ko
Publication of KR20220119993A publication Critical patent/KR20220119993A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법에 관한 것으로, 마이크로바이움을 분석하는 방법에 있어서, (a) OTU 표에서 동일한 OTU에 매칭되는 리드의 카운트 중 최대값을 상기 OTU의 리드의 카운트 값으로 지정하여 새로운 OTU 표를 제작하는 단계; 및 (b) 상기 OTU 표를 이용하여 마이크로바이옴을 분석하는 단계를 포함하는 마이크로바이옴 분석 방법이다. 본 발명에 따른 마이크로바이움 분석 방법은 종래의 서로 다른 프라이머쌍을 이용하여 마이크로바이옴 분석을 하였을 때 서로 상충되는 결과를 제공하는 문제를 해결하였으며, 미생물 서열의 결손 등에 의해서 읽어지지 않았던 미생물의 분포에 대해서도 최대의 다른 리드값으로 보정함으로써 보다 정확한 미생물군집 분석이 가능하다.

Description

리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법{Methods of analysis of microbiome by using the combination of maximum value of read value}
본 발명은 리드(read)의 최대값 조합을 이용한 미생물 군집 분석 방법에 대한 것이다.
차세대 염기서열 분석 방법(Next generation sequencing; NGS)은 대량 염기서열 분석이 가능하게 하였다. 2004년 최초로 상용화된 454 Pyrosequencer 이후 현재까지 그 성능이 발전하고 있다. 하나의 유전체를 무수히 많은 조각으로 분해하여 각 조각을 동시에 읽어낸 뒤, 얻어지는 데이터를 생물정보학적 기법을 이용하여 조합하고 대용량의 유전체 정보를 빠르게 해독할 수 있다. Roche가 처음으로 NGS 장비를 출시한 이후 Illumina Solexa, Applied Biosystems 등이 연이어 출시하였다. NGS 장비 출시 전에는 생어 염기서열 분석법을 이용한 장비는 기껏해야 동시에 수십 개의 전기영동이 가능한 반면,NGS 장비는 수십만에서 수십억 개의 서로 다른 염기서열 분석이 가능해졌다.
유전체의 경우 한 개체가 지닌 모든 유전 정보를 말한다면, 메타게놈의 경우는 주어진 환경에서 존재하는 모든 미생물의 유전체를 말한다.1 1 Ibid., 223면. 메타게놈 분석의 경우 16S rRNA를 증폭시켜서 분석하는 16S rRNA 앰플리콘 시퀀싱 (16S rRNA amplicon sequencing)과 환경 샘플의 주어진 모든 유전자의 염기서열 분석을 하는 삿건 메타게놈(shotgun metagenome) 분석이 있다. 16S rRNA 앰플리콘 시퀀싱의 경우 환경에서의 균주 조성만을 확인 가능하며 미생물 군체의 기능적인 면까지는 확인이 어렵다. 하지만 샷건 메타게놈의 경우 군체의 균주 조성은 물론 기능적인 면까지 가능하다는 장점을 있다. 하지만 16S rRNA 앰플리콘 시퀀싱에 비해 수 많은 정보를 가지고 있기 때문에 용량이 크다는 점과 이에 분석량이 많고 비용적으로도 비싸다는 단점을 가지고 있다.
16S rRNA의 경우에는 보존된 지역이 9개의 고변이지역(hypervariable regions; V1-V9)으로 나뉘어 있다(도 2 참고). 고변이지역은 대략 50 베이스에서 100 베이스의 크기를 가지고 있으며 변이정도가 상이하고, V3-V4 및 V4-V5 지역이 가장 높은 분류 정확도를 보이며, 이를 이용하여 genus 또는 species 정도의 수준의 분류가 가능하다.
조작분류단위(operational Taxonomic Unit; OTU)는 밀접하게 관련된 개체의 그룹을 분류하기 위해 사용되는 조작 정의이다. OTU는 상동성에 따른 개체를 그룹화 하기 위한 실용적인 정의로서, 고전적인 린네 분류나 현대의 진화적 계통분류와 등가관계에 있다고 할 수 있으나, 반드시 일치하는 것은 아니다. DNA시퀀싱 결과에서 유사한 시퀀스들을 서열 상동성을 기초로 하여 밀접하게 그룹화된 군집(cluster)화 할 수 있으며, OTU는 상동성 역치값에 의해서 정의될 수 있다. 일반적으로 속(Genus) 수준에서 세균을 구별하기 위해서 16S 유전자의 97% 상동성 역치 값에 의해 정의된다. 종으로 나누어지기 위해서는 98% 또는 99%의 서열 상동성의 높은 역치값을 요구한다. 경우에 따라서는 OTU 대신에 정확한 앰플리콘 서열 변이(Amplicon Sequence Variants; ASV)가 사용되기도 한다.
마이크로바이옴(microbiome, 미생물군집체)은 '특정 환경에 존재하는 모든 미생물의 총합'을 의미한다. 다양성은 알파 다양성, 베타 다양성, 감마 다양성이 있다. 알파 다양성은 하나의 샘플에 존재하는 다양한 미생물의 분포를 확인 하근 것이다. 베타 다양성은 샘플의 다양성이 비슷한지 여부이다. 감마 다양성은 한 지리적 지역 내 모든 군집에 대한 총 다양성을 의미한다.
OTU 표(table)은 OTU당 시료당 리드(read)의 숫자를 제시하는 표이다. OTU 표는 각각의 시료에서 관측된 각각의 리드 숫자("카운트(count)"라고 불림)를 포함한다. 카운트(count)는 리드(read)를 OTU에 맵핑하여 계산된다. 열(column)은 보통 시료를 나타내고, 행(row)는 보통 속 또는 종 특이적 OTU를 나타낸다.
시료내 마이크로바이옴을 분석하는 방법이 개발이 되었으나, 사용되어지는 프라이머에 의해 얻어지는 리드 값이 서로 다르기 때문에 정확한 마이크로바이움을 측정하는데 어려움이 있었다.
본 발명자들은 하나의 OTU에 맵핑되는 서로 다른 카운트을 가지고 있는 경우에 각각의 OTU에서 최대의 카운트을 이용하여 마이크로바이옴을 분석하였을 때 보다 더 정확하게 마이크로바이옴 분석을 수행할 수 있는 점을 발견하고 본 발명을 완성하였다.
자연계에 존재하는 미생물의 군집을 보다 정확히 반영하는 마이크로바이움 분석 방법을 제공하는 것을 목적으로 한다.
상기한 목적을 위해서 본 발명의 제 1 의 형태는 마이크로바이움을 분석하는 방법에 있어서, (a) OTU 표에서 동일한 OTU에 매칭되는 카운트 중 최대값을 상기 OTU의 카운트 값로 지정하여 새로운 OTU 표를 제작하는 단계; 및 (b) 상기 OTU 표를 이용하여 마이크로바이옴을 분석하는 단계를 포함하는 마이크로바이옴 분석 방법을 제공한다. 보다 구체적으로는 상기 OTU 표는 (c) 시료에 2개 이상의 프라이머 쌍를 사용하여 앰플리콘을 제조하는 단계; (d) 상기 앰플리콘을 차세대 서열분석하는 단계; (e) 상기 앰플리콘의 서열을 이용하여 중복되지 않도록 OTU(Operating Taxonomic Unit)를 추출하고, 각각의 OTU에 식별정보를 부여하는 단계; (f) 각각의 식별정보가 부여된 OTU에 상기 앰플리콘의 각각의 리드(read)을 상동성에 기초하여 매칭하는 단계; 및 (g) 상기 OTU의 동일한 부위에 매칭되는 리드(read)의 카운트를계산하여 OTU 표를 작성하는 단계를 추가적으로 더 포함하는 것을 특징으로 하는 마이크로바이옴 분석방법이다.
상기 프라이머 쌍은 계통분석에 사용되는 유전자를 증폭하는데 이용되는 모든 프라이머가 사용되어질 수 있다. 계통분석에 이용되는 유전자는 rDNA일 수 있고, ITS(internal transcribed spacer) 영역, 또는 IGS(Intergenic spacer)영역일 수 있다. 진핵세포의 rDNA 유전자는 18S, 5.8S, 28S의 순으로 되어 있으며, 각각의 rDNA 사이에 2개의 ITS영역으로 분리되어져 있다. 원핵세포는 23S. 16S, 5S rRNA 유전자를 가지고 있으며, 이중 16S rRNA 유전자가 세균의 분류에 가장 많이 사용된다. 바람직하게는 상기 유전자는 16S rRNA 부위를 사용할 수 있다. 보다 더 바람직하게는 상기 프라이머쌍은 서열번호 1과 2의 쌍, 서열번호 3과 4의 쌍, 서열번호 5과 6의 쌍, 서열번호 7과 8의 쌍, 서열번호 9과 10의 쌍, 및 서열번호 11과 12의 쌍으로 이루어진 그룹에서 선택되는 2 내지 9 쌍의 프라이머쌍일 수 있다.
상기 OTU 표는 분석되어지는 다른 유전자들의 조합을 통하여서도 작성이 될 수 있는데, 여러 유전자가 분석에 사용되는 경우에는 다음의 단계를 통하여 제작되어질 수 있다.
마이크로바이움을 분석하는 방법에 있어서, (a) OTU 표에서 동일한 OTU에 매칭되는 카운트 중 최대값을 상기 OTU의 카운트 값으로 지정하여 새로운 OTU 표를 제작하는 단계; 및 (b) 상기 OTU 표를 이용하여 마이크로바이옴을 분석하는 단계를 포함하고, 상기 OTU 표는 (c) 샘플의 주어진 모든 유전자의 염기서열 분석하는 단계; (d) 상기 염기 서열을 이용하여 중복되지 않도록 OTU(Operating Taxonomic Unit)를 추출하고, 각각의 OTU에 식별정보를 부여하는 단계; (e) 각각의 식별정보가 부여된 OTU에 상기 앰플리콘의 각각의 리드(read)을 상동성에 기초하여 매칭하는 단계; 및 (f) 상기 OTU의 동일한 부위에 매칭되는 리드(read)의 카운트를 계산하여 OTU 표를 작성될 수 있다.
본 발명에 따른 마이크로바이움 분석 방법은 종래의 서로 다른 프라이머쌍을 이용하여 마이크로바이옴 분석을 하였을 때 서로 상충되는 결과를 제공하는 문제를 해결하였으며, 미생물 서열의 결손 등에 의해서 읽어지지 않았던 미생물의 분포에 대해서도 최대의 다른 카운트 값으로 보정함으로써 보다 정확한 미생물군집 분석이 가능하다.
도 1 본 발명에 따른 마이크로바이옴 분석방법에 대한 절차도를 보인다.
도 2는 (a) 16S rRNA 유전자의 구조를 보인다. 계통적으로 잘 보존된 영역은 C1 내지 C9으로 나타내었고, 고변이부분(Hypervariable regions)은 V1 내지 V9으로 나타내었다. (b) 전체 유전자에서 증폭되는 위치를 나타내었다. V2 증폭 위치는 붉은색으로, V3 증폭 위치는 오렌지색으로 V4 증폭 위치는 갈색으로 V67 증폭 위치는 연두색으로, v8은 증폭위치는 하늘색으로, V9 증폭위치는 짙은파랑으로 나타내었다.
도 3은 각각의 OTU에서 리드의 매칭수 및 위치를 보여준다. V2에 해당하는 리드는 붉은색으로, V3에 해당하는 리드는 오렌지색으로, V4 에 해당하는 리드는 갈색으로 V67에 해당하는 리드는 연두색으로, V8 리드에 해당하는 리드는 하늘색으로, V9에 해당하는 리드는 짙은파랑으로 나타내었다.
도 4는 도 3에 나타낸 각각의 변이지역의 리드를 표로 나타내었고, 각각의 OTU에서 최대의 카운트 값을 각각의 OUT의 리드값으로 선택한 것을 보인다. 예를 들어 Bacillus에 해당하는 OTU1은 V2가 7, V3 3, V4 2, V67 4, V8이 1, V9이 1이어서, OTU1에서 최대의 카운트 값은 V2에 해당하는 7이 선택된 카운트 값이다. OTU2는 V8의 카운트 값인 7이 최대값이므로 선택된 카운트 값은 7이고, OTU3은 V9의 카운트 값인 7이 최대값이므로 선택된 카운트 값은 7이다.
도 5는 다수의 프라이머를 이용하여 증폭하였을 때 각 영역별 리드 결과를 보여준다.
도 6은 다수의 프라이머를 이용하여 증폭하였을 때 각 영역별 리드 결과를 보인다.
이하, 본 발명을 실시예에 기초하여 보다 상세히 기술한다. 본 발명의 하기 실시예는 본 발명을 구체화하기 위한 것일 뿐 본 발명의 권리범위를 제한하거나 한정하는 것이 아님은 물론이다. 본 발명의 상세한 설명 및 실시예로부터 본 발명이 속하는 기술분야의 전문가가 용이하게 유추할 수 있는 것은 본 발명의 권리범위에 속하는 것으로 해석된다.
[비교예 1]
시료의 16S의 V3 및 V4 영역을 이용하여 나온 미생물의 속(Genus)는 총 64로 나왔고, 이를 표1으로 나타내었다.
Figure pat00001
[실시예 1] 본 발명에 따른 마이크로바이옴 분석
시료 채취
배설물 시료는 장의 4곳(상행결장, 하행결장, S상결장, 직장) 및 대변, 항문스왑(Anus Swab)을 포함하여 총 6개의 샘플을 수집하였다. 장에서의 시료 채취는 대장내시경시 상행결장, 하행결장, S상결장, 직장(Ascending colon, Descending colon, Sigmoid colon, Rectum(이하 A,D,S,R)) 부위에서 썩션(Suction) 하여 즉시 -80℃에 냉동하였고, 항문스왑 시료는 병원에서 수집되었다. 대변 시료는 대상자가 직접 AccuStool Collection kit(AccuGene, Incheon, Korea)을 이용하여 수집 및 제공되었다(표 2).
Figure pat00002
DNA 추출 및 서열분석
상행결장, 하행결장, S상결장, 직장 및 항문스왑 시료는 AccuBuccal DNA Preparation kit(AccuGene, Incheon, Korea)를, 대변 시료는 AccuStool DNA Preparation kit(AccuGene, Incheon, Korea)를 사용하여 제공된 프로토콜에 따라 DNA를 추출하였다. 추출된 DNA 3ng(x2)으로 Ion 16S™ Metagenomics Kit(Thermo Fisher Scientific, Waltham, USA)를 사용하여 제공된 프로토콜에 따라 16S rRNA gene의 고변이지역(hypervariable regions)을 V2, V4, V8 프라이머 세트 및 V3, V6-7, V9 프라이머 세트를 이용하여 증폭(Amplify) 하여 라이브러리를 제작하였다. 이를 표 3로 나타내었다.
Figure pat00003
서열분석은 Chef Protocol - 400 bp 프로토콜에 따라 Ion Chef™(Thermo Fisher Scientific, Waltham, USA)와 Ion S5XL™(Thermo Fisher Scientific, Waltham, USA)에서 Ion 530™ Chip (Thermo Fisher Scientific, Waltham, USA)을 통해 분석되었고, 각 시료 당 200,000 Reads 이상을 생산하였다.
지역의 분할(Splitting by region)
Ion 16S Metagenomics Kit에는 다양한 primer가 포함되어 있어, 7개 variable region의 sequencing reads가 하나의 FASTQ 파일로 제공된다. usearch(v11.0.667)을 이용하여 primer(V2, V3, V4, V67, V8, V9)와 binding 하는 영역을 추출하였다.
노이즈 제거 및 계통분석을 위한 처리
바코드(Barcode) 및 어답터 서열 제거는 Cutadapt(v2.8)를 사용하였다. 노이즈 제거(Denoising)은 QIIME2의 DADA2(v1.14)를 이용하였다. 7개 지역으로 구분된 FASTQ 파일에 공통적으로 5`의 15bp 및 100bp 이하의 서열을 제거하였다. 지역별 FASTQ 파일의 필터 파라미터(Filter parameter)는 각각의 Quality score >25 이 되도록 적용하였다.
계통분류적 참고자료는 NCBI를 사용하였다. QIIME2의 classify-consensus-vsearch 알고리즘을 사용하여 유사도 99%로 계통분류적 처리(Taxonomic binning)을 진행하였다.
지역별로 생성한 OTU 표는 도 1의 방식을 적용하여 계산되었다. 지역별 OTU 표의 중복된 OTU ID의 값(abundance)는 최대값만 선택하여 하나의 OUT ID당 상기 최대값 하나만의 OTU값을 가지도록 하여 통합 OTU 표를 작성하였다.
통계분석
노말화(Normalization)는 CSS(Cumulative Sum Scaling)을 사용하였고, 이때 10 시료 미만에서 발견된 OTUs는 제거하였다. 다양성 측정(alpha와 beta diversity, Unifrac analysis)를 사용하여 위치(Location), BMI 변수에 따른 그룹별 차이점 분석을 진행하였다. Pearson correlation 방법을 통해 위치 사이의 상관관계를 분석했으며, 사후검정(Bonfferoni)으로 P-value를 보정하였다.
최대 카운트 값을 이용한 새로운 OUT 표의 생성
위의 결과로 얻어진 각각의 변이 지역에 대한 카운트를 표 4로 나타내었다.
Figure pat00004
각각의 변이지역의 카운트 값 중 최대값을 이용하여 각각의 OUT에 해당하는 새로운 OUT 표를 작성하였고 이를 표 5로 나타내었다.
Figure pat00005
표 5의 새로운 OTU 표를 이용하여 미생물군집을 분석하였을 때 사용되어진 리드에 의한 영향이 없이 하나의 미생물군집 분포를 나타내어서 일관성이 있는 결과를 나타내었다.
V3 및 V4영역의 증폭만으로 나오지 않는 미생물도 존재하였다(도 5참조). 총 12종(Hankyongella, Zoogloea, Kibdelosporangium, Natranaerovirga, Alkanindiges, Sporacetigenium, Synergistes, Chenggangzhangella, Agrobacterium, Magnetospirillum, Dactylosporangium, Jeotgalibaca)이 나오지 않았고(도 5의 붉은 색 박스로 나타냄), 이 영역의 V67,V8 및 V9 영역의 증폭으로 나타낸 종이었다. 따라서 한 V3 및 V4 증폭만 한다면 나오지 않는 속들도 존재 하기에 정확한 미생물 군집을 표시하지 않았다.
다수의 프라이머를 이용하여 증폭하였을 때 각 영역별 리드 결과의 하나를 도 6에 나타내었다. 도6에서는 V2 , V3, V4 및 V9 지역에서 리드(read) 되지 않았던 Thermolithobacteria 의 경우에는 V67 지역의 리드에서는 36개의 리드 및 V8의 지역의 리드에서는 40개의 리드가 나왔다. Spirochaetia의 경우에도 V2, V3, V4 및 V9 지역에서 리드되지 않았지만, V67 지역에서는 9개, V8 지역에서는 8개 리드되었다. 이의 결과는 사용되어지는 프라이머 쌍에 따라 미생물 군집에 대한 분포가 다르게 나타난다는 것을 보인다. 이는 정확한 미생물 군집을 분석하는데 문제점이 있다는 것을 보인다
본 발명에 따른 마이크로바이옴 분석을 수행하였을 경우에, 일부 읽어지지 않는 리드에 의해서 카운트되지 못했던 미생물 종도 다른 부분의 리드에 의해서 읽어져 누락이 되지 않았으며, 서로 다른 프라이머쌍에 의해 하나의 OTU에 서로 다른 리드값이 나왔을 때, 최대 리드된 값을 선택함으로써 어느 부위의 유전자에 의해서 읽어졌는지 상관없이 그 미생물종의 존재를 반영하도록하여 실질적인 미생문 군집을 잘 반영도록 하였다.
<110> Medicloud co.,Ltd <120> Methods of analysis of microbiome by using the combination of maximum value of read value <130> PN210005 <160> 12 <170> KoPatentIn 3.0 <210> 1 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> V2_forward <400> 1 ggcgsacggg tgagtaa 17 <210> 2 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> V2_reverse <400> 2 gctgcctccc gtaggagt 18 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> V3_forward <400> 3 actgagacac ggtccaract 20 <210> 4 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> V3_reverse <400> 4 gtattaccgc ggctgctg 18 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> V4_forward <400> 5 ccagcagccg cggtaata 18 <210> 6 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> V4_reverse <400> 6 ggactaccag ggtatctaat cctgt 25 <210> 7 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> V67_forward <400> 7 acaagcgghg garcatgt 18 <210> 8 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> V67_reverse <400> 8 gacgtcatcc ccaccttcc 19 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> V8_forward <400> 9 gytgtcgtca gctcgtgt 18 <210> 10 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> V8_reverse <400> 10 cgattactag cgaytccgac ttca 24 <210> 11 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> V9_forward <400> 11 gttacgactt caccccagtc a 21 <210> 12 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> V9_reverse <400> 12 gcgtcgtagt ccggattgg 19

Claims (6)

  1. 마이크로바이움을 분석하는 방법에 있어서,
    (a) OTU 표에서 동일한 OTU에 매칭되는 리드의 카운트 중 최대값을 상기 OTU의 리드의 카운트 값으로 지정하여 새로운 OTU 표를 제작하는 단계; 및
    (b) 상기 OTU 표를 이용하여 마이크로바이옴을 분석하는 단계를 포함하는 마이크로바이옴 분석 방법.
  2. 제 1 항에 있어서, 상기 OTU 표는
    (c) 시료에 2개 이상의 프라이머 쌍를 사용하여 앰플리콘을 제조하는 단계;
    (d) 상기 앰플리콘을 차세대 서열분석하는 단계;
    (e) 상기 앰플리콘의 서열을 이용하여 중복되지 않도록 OTU(Operating Taxonomic Unit)를 추출하고, 각각의 OTU에 식별정보를 부여하는 단계;
    (f) 각각의 식별정보가 부여된 OTU에 상기 앰플리콘의 각각의 리드(read)을 상동성에 기초하여 매칭하는 단계; 및
    (g) 상기 OTU의 동일한 부위에 매칭되는 리드(read)의 카운트 값을 이용하여 OTU 표를 작성하는 단계를 추가적으로 더 포함하는 것을 특징으로 하는 마이크로바이옴 분석방법.
  3. 제 2 항에 있어서, 상기 프라이머 쌍은 16S rRNA 유전자에 대한 프라이머인 것을 특징으로 마이크로바이옴 분석 방법.
  4. 제 3 항에 있어서, 상기 프라이머 쌍은 2 내지 9 쌍인 것을 특징으로 하는 마이크로바이옴 분석 방법.
  5. 제 4 항에 있어서, 상기 프라이머 쌍은 서열번호 1과 2의 쌍, 서열번호 3과 4의 쌍, 서열번호 5과 6의 쌍, 서열번호 7과 8의 쌍, 서열번호 9과 10의 쌍, 및 서열번호 11과 12의 쌍으로 이루어진 그룹에서 선택되는 2 내지 9 쌍인 것을 특징으로 하는 마이크로바이옴 분석 방법.
  6. 제 1 항에 있어서, 상기 OTU 표는
    (c) 샘플의 주어진 모든 유전자의 염기서열 분석하는 단계;
    (d) 상기 염기 서열을 이용하여 중복되지 않도록 OTU(Operating Taxonomic Unit)를 추출하고, 각각의 OTU에 식별정보를 부여하는 단계;
    (e) 각각의 식별정보가 부여된 OTU에 상기 앰플리콘의 각각의 리드(read)을 상동성에 기초하여 매칭하는 단계; 및
    (f) 상기 OTU의 동일한 부위에 매칭되는 리드(read)의 숫자를 카운팅하여 OTU 표를 작성하는 단계를 추가적으로 더 포함하는 것을 특징으로 하는 마이크로바이옴 분석방법.
KR1020210023569A 2021-02-22 2021-02-22 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법 KR20220119993A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210023569A KR20220119993A (ko) 2021-02-22 2021-02-22 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법
PCT/KR2022/002589 WO2022177408A1 (ko) 2021-02-22 2022-02-22 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210023569A KR20220119993A (ko) 2021-02-22 2021-02-22 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법

Publications (1)

Publication Number Publication Date
KR20220119993A true KR20220119993A (ko) 2022-08-30

Family

ID=82930820

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210023569A KR20220119993A (ko) 2021-02-22 2021-02-22 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법

Country Status (2)

Country Link
KR (1) KR20220119993A (ko)
WO (1) WO2022177408A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120021921A1 (en) * 2008-04-01 2012-01-26 Scott David L Process and method for monitoring gastrointestinal microbiota
DK3435264T3 (da) * 2017-07-28 2021-10-18 Tata Consultancy Services Ltd Fremgangsmåde og system til identificering og klassificering af operative taksonomiske enheder i en metagenomisk prøve
EP3679135B1 (en) * 2017-09-08 2023-04-19 Psomagen, Inc. Normalization for sequencing libraries

Also Published As

Publication number Publication date
WO2022177408A1 (ko) 2022-08-25

Similar Documents

Publication Publication Date Title
Shaiber et al. Functional and genetic markers of niche partitioning among enigmatic members of the human oral microbiome
Lim et al. Comparison of DNA extraction methods for human gut microbial community profiling
Henriquez et al. Molecular evolution of chloroplast genomes in Monsteroideae (Araceae)
Gloor et al. Microbiome profiling by illumina sequencing of combinatorial sequence-tagged PCR products
US8032310B2 (en) Computer-implemented method, computer readable storage medium, and apparatus for identification of a biological sequence
Mueller et al. A new fungal large subunit ribosomal RNA primer for high-throughput sequencing surveys
Jiang et al. Vibrio Clade 3.0: new Vibrionaceae evolutionary units using genome-based approach
Brealey et al. Dental calculus as a tool to study the evolution of the mammalian oral microbiome
CN105420375B (zh) 一种环境微生物基因组草图的构建方法
CN106055924A (zh) 微生物操作分类单元确定和序列辅助分离
Yang et al. Testing three pipelines for 18S rDNA-based metabarcoding of soil faunal diversity
Pandya et al. Whole genome single nucleotide polymorphism based phylogeny of Francisella tularensis and its application to the development of a strain typing assay
US10658069B2 (en) Biological sequence variant characterization
Ionescu et al. Microbial community analysis using high‐throughput amplicon sequencing
Puławska et al. Pararhizobium polonicum sp. nov. isolated from tumors on stone fruit rootstocks
CN115719616A (zh) 一种病原物种特异性序列的筛选方法及系统
KR20220119993A (ko) 리드의 최대값 조합을 이용한 마이크로바이옴 분석 방법
CN111944917B (zh) 一种基于转录组测序开发山茶属植物ssr引物的方法
US20160103955A1 (en) Biological sequence tandem repeat characterization
CN115331737A (zh) 一种分析肠道菌群中致病菌和量化菌群地域特征的方法
WO2021246045A1 (ja) 検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法
WO2015053803A1 (en) Methods for distinguishing inflammatory bowel diseases using microbial community signatures
Tobias et al. A chromosome-level genome resource for studying virulence mechanisms and evolution of the coffee rust pathogen Hemileia vastatrix
Bishara et al. Culture-free generation of microbial genomes from human and marine microbiomes
WO2022177410A1 (ko) 스왑 샘플링 방법을 이용한 마이크로바이옴 분석 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal