KR20190074576A - 세균총 분석 시스템 및 방법 - Google Patents

세균총 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20190074576A
KR20190074576A KR1020170176042A KR20170176042A KR20190074576A KR 20190074576 A KR20190074576 A KR 20190074576A KR 1020170176042 A KR1020170176042 A KR 1020170176042A KR 20170176042 A KR20170176042 A KR 20170176042A KR 20190074576 A KR20190074576 A KR 20190074576A
Authority
KR
South Korea
Prior art keywords
bacterial
sequence data
database
individual
analysis
Prior art date
Application number
KR1020170176042A
Other languages
English (en)
Inventor
강신덕
Original Assignee
강신덕
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강신덕 filed Critical 강신덕
Priority to KR1020170176042A priority Critical patent/KR20190074576A/ko
Publication of KR20190074576A publication Critical patent/KR20190074576A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 세균총 분석 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 메타지노믹스 연구 방법을 활용하여 각 개인의 체내 세균의 분포를 분석하고 분석 결과를 토대로 개인의 건강에 관한 조언을 제공하는 세균총 분석 시스템 및 방법을 제공한다.

Description

세균총 분석 시스템 및 방법 {MICROBIOME ANALYSIS SYSTEM AND METHOD}
본 발명은 세균총 분석 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 메타지노믹스 연구 방법을 활용하여 각 개인의 체내 세균의 분포를 분석하고 분석 결과를 토대로 개인의 건강과 맞춤형 의료에 활용하는 세균총 분석 시스템 및 방법에 관한 것이다.
메타지노믹스 기술은 미생물을 배양하지 않고도 연구할 수 있는 장점이 있다. 이는 매우 유용한 기술로, 인공 배지에서 배양되지 않는 미생물의 종류와 유전자를 연구할 수 있게 해주고, 이제까지 밝혀지지 않은 새로운 유전자와 미생물을 찾아서 그 역할을 이해할 수 있게 해준다. 이와 함께, 차세대 시퀀싱 기술의 발달로 체내의 세균총에 대한 연구가 늘어나면서 세균총의 분포와 인간의 건강이 밀접한 연관이 있음을 알게 되었다.
지금까지 가장 많이 연구된 세균총 분포는 장내미생물 연구이다. 사람의 장 점막에는 100조 마리가 넘는 장내세균이 살고 있는데, 이들은 자가면역 질환, 장 질환(크론병, 대장암), 정신질환(자폐증, 알츠하이머) 등과 연관이 있다고 밝혀졌다. 앞으로 많은 임상정보와 세균총 분석을 통해 더 많은 질병과 장내미생물과의 연관성이 밝혀질 것으로 기대하고 있다.
한편 구강세균은 당뇨병 신장질환 등 만성질환이나 임신부의 조산과도 밀접한 관련이 있다. 치태 세균과 염증에 생긴 각종 독성물질이 혈류를 통해 전신으로 퍼져나가기 때문이다. 뿐만 아니라, 피부에 존재하는 세균총은 여드름과 아토피성 피부염(습진)과 관련이 있다.
여성의 질내 미생물총에는 Lactobacillus spp.(Lactobacillus iners, L. crispatus, L. gasseri, L. jensenii)가 주로 분포한다. 그러나 세균성 질염에 걸린 경우에는 혐기성 세균이 100~1,000배 정도 증가하며 정상 유산균은 없어지게 된다.
최근 세균총 연구로부터 장내 세균총이 특정 약물을 불활성화 시킬 수 있음이 보고되었는데, 이는 맞춤형 의약품 개발에 개인의 장내 세균총 연구가 선행되어야 함을 의미한다. 지금까지의 질병 치료는 항생제나 소염진통제를 무차별적으로 사용하여 많은 부작용이 수반되는 약물치료가 중심이었다. 무분별한 항생제의 오남용으로 인해 세균들의 항생제 내성은 점점 증가하고 있고, 미국에서는 연간 200만 명이 항생제 내성 세균에 감염되고 있다. 이에 버락 오바마 대통령이 5개년 계획을 세워 항생제 내성 세균에 대처하기 위한 국가적 프로젝트를 추진하기도 하였다.
항생제 내성균의 문제를 해결하기 위한 방안으로, 앞으로는 세균총 유전체연구를 통해 유해한 세균만을 선택적으로 제거하거나 유익한 세균만을 이식 또는 배양하는 생물학적 치료가 이루어질 것이다.
이처럼 세균총은 인체의 건강과 밀접한 관계를 갖고 있으나, 세균총 분포를 분석한 결과를 토대로 개인의 질병 치료 및 건강관리에 활용할 수 있는 기술이 없다는 문제점이 있다. 본 기술에서는 16S rRNA 유전자 시퀀싱 기술을 이용하여 세균총을 분석하고 이를 맞춤형 의료에 활용하고자 한다.
한국공개특허 [10-2011-0066018]에서는 16S rDNA-DGGE와 real-time PCR 증폭을 이용한 세균군집 분석법이 개시되어 있다.
한국공개특허 [10-2011-0066018](공개일자: 2011년06월16일)
따라서 본 발명은 상기한 바와 같은 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 메타지노믹스 연구 방법을 활용하여 각 개인의 체내 세균의 분포를 분석함으로써, 분석 결과를 토대로 개인의 건강에 관한 조언을 제공하고 개인의 맞춤형 의료에 활용하기 위한 세균총 분석 시스템 및 방법을 제공하는 것이다.
상기한 바와 같은 목적을 달성하기 위한 본 발명은 정상인의 세균총 참조 서열 데이터가 저장되는 제1 데이터베이스(100);
질환별 세균총 참조 서열 데이터가 저장되는 제2 데이터베이스(200);
DNA 유전자 서열을 추출한 데이터를 분석하여, 개인의 세균총 서열 데이터를 생성하는 분석 서버(300);
상기 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터를 비교하여, 체내에 분포된 유익균, 중립균 및 유해균에 대한 세균총 분석 결과를 보고하는 메인 서버(400);
개인별 세균총 서열 데이터 및 분석 결과가 저장되는 제3 데이터베이스(500);
상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 저장하는 제4 데이터베이스(600); 및
상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 판단하는 분석부(700)를 포함하는 세균총 분석 시스템을 제공한다.
본 발명의 일실시예에 있어서, 상기 메인 서버(400)는 상기 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 상기 개인의 세균총 서열 데이터의 유사도를 계산하고 이를 자카드 계수(Jaccard coefficient)와 쎄타와이씨 계수(Thetayc coefficient)를 사용하여 히트맵(heatmap)으로 나타내는 것을 특징으로 한다.
본 발명의 일실시예에 있어서, 상기 메인 서버(400)는 유익균에 대한 세균총 분석 결과, 중립균에 대한 세균총 분석 결과 및 유해균에 대한 세균총 분석 결과를 종합적으로 고려하여 의뢰인의 건강에 관한 의견을 제시하는 것을 특징으로 한다.
또한 본 발명은 대변에서 DNA를 추출하는 DNA추출 단계(S10);
차세대 시퀀싱(Next Generation Sequencing) 방법을 통해, 상기 DNA추출 단계(S10)에서 추출된 DNA로부터 DNA 유전자 서열 데이터를 생산하는 유전자서열데이터생성 단계(S20);
상기 유전자서열데이터생성 단계(S20)에서 생산된 DNA 유전자 서열 데이터를 분석하여 개인의 세균총 서열 데이터를 생성하는 체내세균분포분석 단계(S30);
제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 상기 체내세균분포분석 단계(S30)에서 분석된 개인의 세균총 서열 데이터를 메인서버(400)에서 비교하는 체내세균분포비교 단계(S40);
상기 체내세균분포비교 단계(S40)의 비교 결과를 바탕으로, 체내에 분포된 유익균, 중립균 및 유해균의 결과를 보고하는 분석결과보고 단계(S50);
결과 보고가 완료된 개인별 세균총 서열 데이터 및 분석 결과를 제3 데이터베이스(500)에 저장하는 개인별데이터저장 단계(S60);
상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 제4 데이터베이스(600)에 저장하는 제4데이터베이스저장 단계(S70); 및
상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 분석부(700)에서 판단하는 질환가능성판단 단계(S80)를 포함하는 세균총 분석 방법을 제공한다.
본 발명의 일실시예에 있어서, 상기 DNA추출 단계(S10)는 세포를 파쇄(lysis)하여 세포 내 구성물질을 용액화 하고, 화학적 작용을 통해 단백질을 제거하는 단백질제거 단계(S11);
상기 용액에 페놀(phenol)/클로로포름(chloroform)/아이소아밀알코올(IAA, isoamyl alcohol) 혼합물을 처리하고 원심분리를 하여 페놀과 수용액을 분리하는 유전자추출 단계(S12); 및
상기 수용액에 알코올 용액을 혼합하고 원심분리를 한 후, DNA를 펠릿의 형태로 수득하는 DNA분리 단계(S13);를 포함하는 것을 특징으로 한다.
본 발명의 세균총 분석 시스템 및 방법에 의하면, 메타지노믹스 연구 방법을 활용하여 각 개인의 체내 세균의 분포를 분석하고 분석 결과를 토대로 개인의 건강에 관한 조언을 제공할 수 있음으로써, 국민 건강 증진에 이바지할 수 있는 효과가 있다.
또한, 개인별/질환별 세균총 데이터베이스를 주기적으로 축적하고 관리하여, 개인의 라이프 로그를 기록하고 추적할 수 있음으로써, 개인 라이프 로그를 각종 질병 치료와 건강관리에 활용하여, 정밀의학(Precision medicine)을 구현할 수 있는 효과가 있다.
아울러 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 판단함으로써 개인의 건강 유지 및 질환 예방에 기여할 수 있다.
도 1은 본 발명의 일 실시예에 따른 세균총 분석 시스템의 개념도.
도 2는 본 발명의 일 실시예에 따른 세균총 분석 방법의 흐름도.
도 3은 도 2의 DNA추출 단계의 일 실시예에 따른 세부 흐름도.
도 4는 Illumina사 Solexa의 샘플파일의 예시도.
도 5는 ABI사 SOLiD의 .csfasta 샘플파일의 예시도.
도 6은 ABI사 SOLiD의 .qual 샘플파일의 예시도.
도 7은 도 2의 체내세균분포분석 단계의 일 실시예에 따른 세부 흐름도.
이하 실시예를 바탕으로 본 발명을 상세히 설명한다. 본 발명에 사용된 용어, 실시예 등은 본 발명을 보다 구체적으로 설명하고 통상의 기술자의 이해를 돕기 위하여 예시된 것에 불과할 뿐이며, 본 발명의 권리범위 등이 이에 한정되어 해석되어서는 안 된다.
본 발명에 사용되는 기술 용어 및 과학 용어는 다른 정의가 없다면 이 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 나타낸다.
도 1은 본 발명의 일 실시예에 따른 세균총 분석 시스템의 개념도이고, 도 2는 본 발명의 일 실시예에 따른 세균총 분석 방법의 흐름도이며, 도 3은 도 2의 DNA추출 단계의 일 실시예에 따른 세부 흐름도이고, 도 4는 Illumina사 Solexa의 샘플파일의 예시도이며, 도 5는 ABI사 SOLiD의 .csfasta 샘플파일의 예시도이고, 도 6은 ABI사 SOLiD의 .qual 샘플파일의 예시도이며, 도 7은 도 2의 체내세균분포분석 단계의 일 실시예에 따른 세부 흐름도이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 세균총 분석 시스템은 정상인의 세균총 참조 서열 데이터가 저장되는 제1 데이터베이스(100); 질환별 세균총 참조 서열 데이터가 저장되는 제2 데이터베이스(200); DNA 유전자 서열을 추출한 데이터를 분석하여, 개인의 세균총 서열 데이터를 생성하는 분석 서버(300); 상기 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터를 비교하여, 체내에 분포된 유익균, 중립균 및 유해균에 대한 세균총 분석 결과를 보고하는 메인 서버(400); 개인별 세균총 서열 데이터 및 분석 결과가 저장되는 제3 데이터베이스(500); 상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 저장하는 제4 데이터베이스(600); 및 상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 판단하는 분석부(700)를 포함한다.
제1 데이터베이스(100)는 정상인의 세균총 참조 서열 데이터를 저장하며, 제2 데이터베이스(200)는 질환별 세균총 참조 서열 데이터를 저장한다.
상기 제1 데이터베이스(100)는 정상인의 세균총 참조 서열 데이터를 포함하는 것으로, 정상인(질환이 없는 건강한 사람)에 대한 세균총을 채집하여, 정상인의 세균총 참조 서열 데이터를 수집할 수 있다.
상기 제2 데이터베이스(200)는 질환별 세균총 참조 서열 데이터를 포함하는 것으로, 질환별 환자에 대한 세균총을 채집하여, 질환별 세균총 참조 서열 데이터를 수집할 수 있다.
또한, 제3 데이터베이스(500)는 개인별 세균총 서열 데이터 및 분석 결과를 저장하여 관리할 수 있다. 분석 서버(300)로부터 생성된 개인의 세균총 서열 데이터 및 메인 서버(400)로부터 분석된 분석결과는 상기 제3 데이터베이스(500)에 분석할 때마다 저장되어, 각 개인에 대한 세균총 서열 데이터 및 분석결과는 시간에 따라 축적되어 누적된 데이터를 확보할 수 있다.
즉, 개인별/정상인/질환별 세균총 및 분석결과를 데이터베이스화 할 수 있다.
상기 분석 서버(300)는 DNA 유전자 서열을 추출한 데이터를 분석하여, 개인의 세균총 서열 데이터를 생성하며, 생성된 개인의 세균총 서열 데이터는 메인 서버(400)로 전달되어 개인의 세균총 분석을 위해 사용된다.
또한 분석 서버(300)에 의해 생성된 개인의 세균총 서열 데이터는 제3 데이터베이스(500)에 저장되어 주기적으로 관리함으로써 개인의 라이프로그를 기록하고 추적할 수 있다.
상기 메인 서버(400)는 상기 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터를 비교하여, 체내에 분포된 유익균, 중립균 및 유해균에 대한 세균총 분석 결과를 보고할 수 있다.
즉, 체내(대변, 구강, 피부 등)에서 추출된 DNA에서 DNA 유전자 서열 데이터를 생산하고, 생산된 DNA 유전자 서열 데이터를 분석하여 개인의 세균총 서열 데이터를 생성하며, 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터를 비교한 후, 이들을 바탕으로 체내(장, 구강, 피부 등)에 분포된 유익균, 중립균 및 유해균에 대한 세균총 분석 결과를 보고할 수 있다.
이때, 상기 메인 서버(400)는 정상인의 세균총 참조 서열 데이터, 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터의 유사도를 계산하고 이를 자카드 계수(Jaccard coefficient)와 쎄타와이씨 계수(Thetayc coefficient)를 사용하여 히트맵(heatmap)으로 나타내는 것을 특징으로 할 수 있다.
자카드 계수는 수치 분류학에서 사용되는 연관 계수로, 두 종류의 개체가 가지고 있지 않은 것을 제외하고, 동일한 특성이 많을수록 증가한다.
쎄타와이씨 계수(Thetayc coefficient)는 두 집단 사이의 차이를 측정하는 Yue &Clayton 측정 계수이다.
히트맵(heatmap)은 데이터 매트릭스의 값에 따라 서로 다른 색으로 나타내어 2D로 표시한 것이다.
예를 들어, 더 큰 값은 작은 짙은 회색 또는 검은 색 사각형(픽셀)으로 표시되고 작은 값은 밝은 사각형으로 나타낼 수 있다.
또한, 상기 메인 서버(400)는 유익균에 대한 세균총 분석 결과, 중립균에 대한 세균총 분석 결과 및 유해균에 대한 세균총 분석 결과를 종합적으로 고려하여 의뢰인의 건강에 관한 의견을 제시하는 것을 특징으로 할 수 있다.
유익균에 대한 분석 결과는 의뢰인의 체내세균 중 기존 연구결과를 바탕으로 유익균의 종류와 분포를 그래프로 가시화하고 건강에 대한 의견을 제시할 수 있고, 중립균에 대한 분석 결과는 의뢰인의 체내세균 중 기존 연구결과를 바탕으로 중립균의 종류와 분포를 그래프로 가시화하고 건강에 대한 의견을 제시할 수 있으며, 유해균에 대한 분석 결과는 의뢰인의 체내세균 중 기존 연구결과를 바탕으로 유해균의 종류와 분포를 그래프로 가시화하고 건강에 대한 의견을 제시할 수 있다.
이때, 분석한 체내세균에 관한 정보는 기존 연구 결과(논문)를 인용하여 제공할 수 있다.
또한, 개인별 세균총 서열 데이터 및 분석 결과를 제3 데이터베이스(500)에 주기적으로 축적하고 관리함으로써 개인의 라이프로그를 기록하고 추적함으로써, 개인 라이프 로그를 각종 질병 치료 및 건강관리에 필요한 기초자료로 활용할 수 있도록 할 수 있다.
제4 데이터베이스(600)는 상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 저장한다.
본 발명의 분석 시스템은 개인의 세균총 서열 데이터 및 분석결과를 각 개인별로 제3 데이터베이스(500)에 저장하는데, 만일 분석 시에 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터와 비교로부터 질환으로 판단되는 경우에는, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치는 상기 제3 데이터베이스(500)로부터 제4 데이터베이스(600)로 전송되어 저장된다.
분석 시 질환으로 판단되지 않는 경우에는, 개인의 세균총 서열 데이터 및 분석결과의 누적치는 그대로 제3 데이터베이스(500)에 저장된다.
분석부(700)는 상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 판단한 후, 그 결과를 현재 분석 대상인 개인에게 제공한다.
질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치는 제4 데이터베이스(600)에 저장되는데, 이로부터 시간의 경과에 따라 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 변화를 분석할 수 있다.
따라서 현재 분석 대상인 개인의 세균총 서열 데이터를 상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터와 비교하여 유사성 또는 차이점을 확인함으로써 특정 질환의 진행 가능성, 진행 시점 등을 예측할 수 있다.
현재 분석 대상인 개인은 이러한 정보를 바탕으로 예상되는 질환을 예방할 수 있고 보다 효율적인 건강관리를 수행할 수 있다.
아울러, 상기 분석 서버(300) 및 메인 서버(400)는 클라우드 컴퓨팅(Cloud computing)으로 구성될 수 있다.
클라우드 컴퓨팅(Cloud Computing)은 인터넷 기반(Cloud)의 컴퓨터기술(Computing)을 의미하는 것으로, 여기에서 구름(Cloud)은 컴퓨터 네트워크 상에 숨겨진 복잡한 인프라 구조, 인터넷을 뜻한다.
클라우드 컴퓨팅은 사용자가 필요한 소프트웨어를 자신의 컴퓨터에 설치하지 않고도 인터넷 접속을 통해 언제든 사용할 수 있고 동시에 각종 정보통신 기기로 데이터를 손쉽게 공유할 수 있는 사용 환경이다.
즉, 개인이 웹에 접속해서 포토샵, 오피스 같은 프로그램을 작업할 수 있고 그 작업에 대한 저장도 웹에서 하게 된다.
결국 가상 공간에 한 서버(컴퓨터)만을 놓고 이 한 컴퓨터를 통해 여러 사람이 개인 작업을 할 수 있는 것이다.
은행의 ATM이나 항공기ㆍ열차의 실시간 좌석 예약 시스템이 대표적이다.
또한 Google Apps의 경우 웹 브라우저로 이용할 수 있는 일반적인 비즈니스 응용 프로그램들을 온라인으로 제공하고 소프트웨어와 데이터는 서버에 저장할 수 있다.
클라우드 컴퓨팅의 장점은, 사용자의 데이터를 신뢰성 높은 서버에 안전하게 보관할 수 있고, 기기를 가지지 못한 소외 계층도 공용 컴퓨터나 인터넷에 연결되기만 한다면 개인 컴퓨팅 환경을 누릴 수 있으며, 개인이 가지고 다녀야 하는 장비나 저장 공간의 제약이 사라진다는 점이다.
본 발명의 일 실시예에 따른 세균총 분석 시스템은 클라우드 컴퓨팅 환경에서 다수의 물리적인 서버를 이용할 수 있으며, 서로 다른 운영체제 기반의 클러스터 환경 시스템으로 구성될 수도 있다.
예를 들어, DNA 유전자 서열 데이터를 생산하고 개인의 세균총 서열 데이터를 생성하는 작업은 주로 Microsoft Window 운영체제 기반의 서버, 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터를 비교하는 작업은 Linux 운영체제 기반의 서버, 세균총 분석 결과를 도출하는 작업은 Macintosh 운영체제 기반의 서버로 이루어질 수 있다. 이는, 각각의 정보 처리 등 적합한 별도의 운영체제 및 프로그램이 존재하므로 각각의 데이터 처리과정의 효율성을 높이기 위함이다.
이렇게 이질적인 운영체제 기반으로 환경을 클러스터로 구성을 할 경우, 실행환경이 다양한 기존에 개발된 코드들을 타 운영체제 기반에 맞도록 변환할 필요가 없는 장점이 있으며, 각각의 자료처리 환경에 맞도록 파일 형식의 변경 없이 각각의 자료처리 환경에 맞는 클러스터에 쉽게 추가할 수 있는 장점이 있다. 즉, 각각의 데이터 처리에 유리한 운영체제를 선택할 수 있어 유연한 세균총 분석 시스템을 구축할 수 있으며, 별도의 파일 형식의 변환과정 없이 세균총 분석 시스템을 구축할 수 있는 장점이 있다.
이질적인(이기종) 운영체제 기반으로 구성된 클라우드 컴퓨팅은 빠른 처리속도를 제공함으로써, 더 많은 동시접속 사용자를 유지하여도 정시성을 확보할 수 있다.
이질적인 운영체제 기반의 클라우드 컴퓨팅은 여러 대의 컴퓨터가 단일 컴퓨터와 같이 동작하도록 관리하는 것이 바람직하며, 각 노드 간에 데이터 교환이 가능하도록 설정 할 수 있다. 이러한 환경이 갖추어지면 어느 한 노드에서 다른 노드의 프로세스를 실행할 수 있도록, RSH(Remote Shell)이 작동할 수 있도록 해야 한다.또한 MPI(Message Passing Interface)를 사용한 병렬 구조의 프로그램을 작성하여 실행시킬 수 있다. 서버에서 병렬 프로그램을 실행하게 되면 MPI 데몬은 네트워크를 통해 각 노드로 작업을 분할하여 보내주며, 각 노드는 할당받은 작업을 처리하고 네트워크를 통해 결과를 서버에 돌려줄 수 있다. 서버는 노드로부터 받은 결과를 조합하여 하나의 결과로 만들고 그 결과를 출력하게 된다.
예를 들어, 4대의 노드로 구성된 클러스터에서 1부터 n까지 더하는 병렬 프로그램을 실행할 경우, 실행중인 MPI 데몬은 프로세스를 노드 수만큼 분할하여 각 노드에 작업을 할당하며, 작업을 할당받은 노드는 작업을 처리하여 결과를 서버에 돌려주고, 서버는 각 결과를 다시 조합하여 1에서 n까지 더한 결과를 출력하게 된다.
도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 세균총 분석 방법은 DNA추출 단계(S10), 유전자서열데이터생성 단계(S20), 체내세균분포분석 단계(S30), 체내세균분포비교 단계(S40), 분석결과보고 단계(S50), 개인별데이터저장 단계(S60), 제4데이터베이스저장 단계(S70) 및 질환가능성판단 단계(S80)를 포함한다.
DNA추출 단계(S10)는 체내, 예를 들면 대변에서 DNA를 추출한다.
도 3에 도시된 바와 같이, DNA추출 단계(S10)는 단백질제거 단계(S11), 유전자추출 단계(S12) 및 DNA분리 단계(S13)를 포함할 수 있다.
단백질제거 단계(S11)는 세포를 파쇄(lysis)하여 세포 내 구성 물질을 용액화 하고, 화학적 작용을 통해 단백질을 제거한다.
이를 위해 Proteinase K를 처리할 수 있다.
유전자추출 단계(S12)는 상기 용액에 페놀(phenol)/클로로포름(chloroform)/아이소아밀알코올(IAA, isoamyl alcohol) 혼합물을 처리하고 원심분리를 하여 페놀과 수용액을 분리하며, 상기 수용액 층에는 DNA가 용해되어 있다.
페놀은 물보다 단백질의 용해도가 높아, 수용액 속 단백질을 추출하고 구조를 변성되도록 한다. 따라서 페놀을 혼합한 뒤 원심분리를 통해 페놀과 수용액을 분리하면, 단백질이 수용액으로부터 페놀로 분리되도록 할 수 있다.
한편 페놀은 약하게 수용성을 가지고 있어서 수용액에 일부 용해되어 DNA와 함께 추출된다.
이때 클로로포름을 함께 처리하면 페놀이 물보다 높은 용해도를 가지는 클로로포름에 용해되므로, 페놀과 단백질을 수용액으로부터 더 효율적으로 분리할 수 있다.
이때 아이소아밀알코올을 처리하면 페놀과 클로로포름이 수용액과 혼합될 때 기포가 발생하는 현상을 막아서 실험의 효율이 증가한다.
혼합물을 원심분리 하여 수용액과 페놀을 분리하면, 수용액 층에 DNA가 용해되어 있게 된다.
DNA분리 단계(S13)는 상기 수용액 층에 알코올 용액을 혼합하고 원심분리를 한 후, DNA를 수득한다.
유전자추출 단계(S12) 이후 알코올 용액을 섞어주면 DNA를 펠릿의 형태로 분리할 수 있다.
알코올 성분은 수용액에 혼합되면 DNA와 물 분자 사이의 결합을 약하게 하여 아세테이트 (acetate) 등의 염(salt)이 DNA와 결합하여 뭉치도록 유도한다.
따라서 알코올 용액을 혼합한 뒤 원심분리 하면 DNA가 염과 함께 침전된다.
이후 DNA를 증류수에 용해시키면 높은 순도의 DNA를 추출할 수 있다.
여기서, 상기 DNA분리 단계(S13)는 수용액에서 DNA 침전을 만드는 과정에 아이소프로판올(isopropanol)을 사용하고, 펠릿을 세척하는 과정에는 에탄올(ethanol)을 사용하는 것을 특징으로 할 수 있다.
아이소프로판올은 에탄올에 비해 DNA와 염의 용해도가 낮기 때문에, 에탄올에 비해 더 많은 양의 DNA와 염을 펠릿의 형태로 침전하여 더 효율적으로 DNA를 추출할 수 있다.
한편 펠릿의 세척 과정에서는, 이후 DNA를 증류수에 녹이기 전에 알코올 성분을 충분히 증발시켜 제거해야 하기 때문에 좀 더 휘발성이 높은 에탄올을 사용하는 것이 바람직하다.
유전자서열데이터생성 단계(S20)는 차세대 시퀀싱(Next Generation Sequencing) 방법을 통해, 상기 DNA추출 단계(S10)에서 추출된 DNA로부터 DNA 유전자 서열 데이터를 생산한다.
이때, 상기 유전자서열데이터생성 단계(S20)는 Illumina Solexa의 Genome Analyzer, Roche의 FLX 454, 또는 Applied Biosystems의 SOLiD를 이용하는 것을 특징으로 할 수 있다.
Illumina Solexa의 Genome Analyzer 출력 파일 포맷은 .fasta, 또는 .fastq파일이다. Illumina의 장비가 먼저 NGS시장을 넓게 개척했기 때문에 FASTA 포맷이 가장 널리 알려졌고, 많은 분석 소프트웨어 역시 이 포맷을 입력 포맷으로 사용하고 있다. FASTA 파일 포맷은 @ 뒤에 시퀀싱 read의 이름을 적고, 염기서열 값을 나열하는 방식으로 구성되어있다. FASTQ 파일 포맷은 .fasta파일에 + 뒤에 read의 이름과 quality 값을 적어주면 된다. Illumina Solexa에서 quality 값은 Sanger score를 쓰는데, -10log10(p/(1-p))로 계산하고, p는 base call한 것이 잘못될 확률을 나타낸다. 도 4는 .fastq 형식의 샘플 파일이다.
상기 DNA추출 단계(S10)에서 추출된 DNA로부터 DNA 유전자 서열 데이터를 생산하는 과정의 예는 다음과 같다.
① Illumina Experiment Manager를 사용하여 각 플레이트에 샘플 플레이트를 만든다. 그런 다음 샘플 플레이트를 사용하여 샘플 시트를 만든다. 샘플 시트는 실행을 위해 MiSeq에서 사용하는 일련의 실행 매개 변수 및 색인 구성표 역할을 한다. 샘플 시트는 플래시 드라이브를 통해 MiSeq으로 전송된다.
② 시약 카트리지는 MiSeq System Guide에 따라 수조에서 해동된다.
③ 샘플 시트, 플로우 셀, 시약 카트리지, PR2 병, 빈 폐기물 병이 MiSeq에 로드되고 실행이 시작된다. 500 사이클 실행은 약 44 시간이 소요된다.
④ 실행은 Illumina Sequence Analysis Viewer를 사용하여 모니터링 된다.
⑤ 실행이 완료되면 fastq 파일이 하드 디스크 드라이브로 전송된다.
Roche사의 GS FLX의 출력 파일 형식은 Standard Flowgram File(.sff)이다. 이 파일은, common header section, read header section, 그리고 read data section으로 구성되며, 바이너리 파일이다.
Applied Biosystems(ABI)사의 SOLiD의 출력 파일은 시퀀싱된 염기서열의 정보를 담고 있는 .csfasta 파일과 밝혀진 염기서열의 정확도 정보를 가지고 있는 .qual파일로 이루어진다.
.qual 파일은 .csfasta형식에 대한 별도의 파일인데, color space에 대한 quality 값을 숫자로 표현해준다. 이 quality 값은, 기존에 존재하던 phred score의 개념을 따르고, -10 x log10(p) 값으로 계산한다. 여기서 p값은 시퀀싱 할 때, color call한 것이 잘못된 값일 확률을 나타낸다. phred score에서는 10은 10%의 에러확률, 20은 1%의 에러확률, 30은 0.1%의 에러확률을 의미한다. .csfasta 파일의 형식은 > 뒤에 시퀀싱 된 read의 이름과 시퀀싱 된 염기서열의 color space값으로 표현되고 있고, .qual 파일은 > 뒤에 시퀀싱 된 read의 이름과 이에 따른 quality 값이 phred score로 표현되어있다. 도 5는 .csfasta 형식의 샘플 파일이고, 도 6은 .qual 형식의 샘플 파일이다.
체내세균분포분석 단계(S30)는 상기 유전자서열데이터생성 단계(S20)에서 생산된 DNA 유전자 서열 데이터를 분석하여 개인의 세균총 서열 데이터를 생성한다.
이때, 상기 체내세균분포분석 단계(S30)는 샘플에 포함된 유전체들(세균총)로부터 직접 유전적 분석을 수행하는 메타지노믹스 연구 방법을 활용할 수 있다.
미생물 생태학(Microbial ecology)은 지구상의 생물계(Biosphere)에 존재하는 미생물의 역할과 그들과 환경간의 상호작용을 이해하기 위한 분야로서, 전통적인 미생물 생태학은 실험실에서 미생물을 배양하고 이것을 분석하는 것에 기반하고 있다. 그러나 환경에 존재하고 있는 미생물들의 99% 이상은 실험실에서 배양할 수 없다.
또한, 일반적으로 미생물은 그 주위의 미생물, 또는 환경과 상호작용을 하며 존재하기 때문에 비록 실험실에서 배양할 수 있는 것이라 할지라도 그들의 생육지 내에서의 역할과 미생물의 군집(Community)에 대해 정확히 반영하지 못한다.
메타지노믹스는 자연 환경에서 존재하는 미생물들을 실험실에서 배양 가능하거나 혹은 가능하지 않거나 상관없이 환경에서 직접적으로 유전물질을 추출하여 어떤 것들이 존재하는지 또는 그들이 어떤 역할을 하는지 분석하기 위한 연구 분야로, 기존의 전통적 미생물 생태학의 한계를 뛰어 넘는 접근법이다.
메타지노믹스란 용어는 “omplex”를 뜻하는 그리스어 “eta”와 유전체학을 뜻하는 영어 “enomics”가 합성된 것으로서 Jo Handelsman(1998)에 의해 새로운 용어로 1998년 처음 차용되었다.
메타지노믹스는 분류하는 기준에 따라 여러 가지로 나뉠 수 있지만 흔히 시행되고 있는 일반적인 접근 방법에 따라 나누자면 단일 유전자 접근법(single gene approach, target gene approach)과 훌 지놈 샷건 시퀀싱 접근법(whole genome shotgun sequencing)으로 나눌 수 있다.
단일 유전자 접근법은 환경 샘플로부터 추출한 16S rRNA(small subunit of the ribosomal RNA)와 같은 특정 유전자를 활용 미생물의 다양성 및 분포를 연구하기 위한 것으로서, 메타지노믹스가 도입되기 이전부터 미생물 생태학에서 다양성 분석하기 위해 사용된 방법이다. 이 접근법에서는 454 파이로시퀀싱(Pyrosequencing) 플랫폼이 주로 사용된다. 아직까지 SSU rRNA 전체 영역을 커버 할 수 있는 차세대 시퀀싱 플랫폼은 나오지 않고 있으나 다른 플랫폼에 비해 긴 서열(600에서 1000bp까지)을 생산할 수 있는 454 파이로시퀀싱 플랫폼이 다른 것들에 비해 높은 다양성을 갖는 영역을 식별하기에 유용하기 때문이다.
단일 유전자 접근법은 특정 환경 내에서의 미생물의 다양성 연구에 적합하지만 존재하는 미생물이 어떤 역할을 하는지, 그 미생물에 속한 유전자의 환경 내에서의 기능은 무엇인지는 알기 어렵다.
훌 지놈 샷건 시퀀싱을 통한 접근법은 미생물이 환경 내에서 어떤 역할을 하는지 알아보기 위한 접근법이다. 단일 유전자 접근법과는 다르게 특정 유전자만을 선정하여 분석하는 것이 아니라 환경 시료에서 존재하는 미생물의 모든 유전자를 대상으로 한다. 일반적으로 훌 지놈 샷건 시퀀싱은 일루미나(Illumina) 사의 차세대 시퀀서를 이용할 수 있다. 비록 일루미사의 플랫폼은 454 파이로시퀀싱 플랫폼에 에 비해 서열의 길이는 짧지만 적은 비용으로 훨씬 더 많은 서열 데이터를 생산할 수 있기 때문에 많은 유전자의 서열을 생산해 내야 하는 샷건 시퀀싱 방법에 더 적합하다.
또한, 상기 체내세균분포분석 단계(S30)는 16s rDNA(16S ribosomal DNA)를 이용하여 분석할 수 있다.
도 7에 도시된 바와 같이, 체내세균분포분석 단계(S30)는 어셈블리 단계(S31), 노이즈제거 단계(S32), 중복제거 단계(S33), 필터링 단계(S34), 불필요서열제거 단계(S35), 클러스터링 단계(S36) 및 거리행렬생성 단계(S37)를 포함할 수 있다.
어셈블리 단계(S31)는 Paired-end data를 하나의 contig로 어셈블리(Assembly) 한다.
어셈블리란 차세대 시퀀싱(Next Generation Sequencing) 방법을 이용하여 얻어낸 다량의 짧은 염기서열 리드(약 100~500 염기쌍 정도의 길이)들을 연결하여 더 긴 길이의 서열로 이어붙이는 과정을 뜻한다.
노이즈제거 단계(S32)는 시퀀싱 퀄리티(Quality)가 미리 설정된 수준보다 낮은 서열들을 제거한다.
중복제거 단계(S33)는 중복된 서열을 제거한다.
필터링 단계(S34)는 어셈블리 되지 않는 서열을 필터링하여 제거한다.
불필요서열제거 단계(S35)는 키메라(서로 다른 종의 DNA가 합쳐져 만들어진 서열) 및 세균 이외의 서열을 제거한다.
클러스터링 단계(S36)는 미리 설정된 수준 이내로 유사한 서열들 끼리 클러스터링 한다.
거리행렬생성 단계(S37)는 거리행렬(Distance matrix)을 생성한다.
체내세균분포비교 단계(S40)는 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 상기 체내세균분포분석 단계(S30)에서 분석된 개인의 세균총 서열 데이터를 비교한다.
이때, 상기 체내세균분포비교 단계(S40)는 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 상기 체내세균분포분석 단계(S30)에서 분석된 개인의 세균총 서열 데이터의 유사도를 계산하고 이를 자카드 계수(Jaccard coefficient)와 쎄타와이씨 계수(Thetayc coefficient)를 사용하여 히트맵(heatmap)으로 나타내는 것을 특징으로 할 수 있다.
자카드 계수는 수치 분류학에서 사용되는 연관 계수로, 두 종류의 개체가 가지고 있지 않은 것을 제외하고, 동일한 특성이 많을수록 증가한다.
쎄타와이씨 계수(Thetayc coefficient)는 두 집단 사이의 차이를 측정하는 Yue &Clayton 측정 계수 이다.
히트맵(heatmap)은 데이터 매트릭스의 값에 따라 서로 다른 색으로 나타내어 2D로 표시한 것이다.
예를 들어, 더 큰 값은 작은 짙은 회색 또는 검은 색 사각형 (픽셀)으로 표시되고 작은 값은 밝은 사각형으로 나타낼 수 있다.
분석결과보고 단계(S50)는 상기 체내세균분포비교 단계(S40)의 비교 결과를 바탕으로, 체내에 분포된 유익균, 중립균 및 유해균에 대한 세균총 분석 결과를 보고한다.
유익균에 대한 분석 결과는 의뢰인의 체내세균 중 기존 연구결과를 바탕으로 유익균의 종류와 분포를 그래프로 가시화하고 건강에 대한 의견을 제시할 수 있고, 중립균에 대한 분석 결과는 의뢰인의 체내세균 중 기존 연구결과를 바탕으로 중립균의 종류와 분포를 그래프로 가시화하고 건강에 대한 의견을 제시할 수 있으며, 유해균에 대한 분석 결과는 의뢰인의 체내세균 중 기존 연구결과를 바탕으로 유해균의 종류와 분포를 그래프로 가시화하고 건강에 대한 의견을 제시할 수 있다.
이때, 상기 분석결과보고 단계(S50)는 유익균에 대한 세균총 분석 결과, 중립균에 대한 세균총 분석 결과 및 유해균에 대한 세균총 분석 결과를 종합적으로 고려하여 의뢰인의 건강에 관한 의견을 제시하는 것을 특징으로 할 수 있다.
분석한 체내세균에 관한 정보는 기존 연구 결과(논문)를 인용하여 제공할 수 있다.
개인별데이터저장 단계(S60)는 결과 보고가 완료된 개인별 세균총 서열 데이터 및 분석 결과를 제3 데이터베이스(500)에 저장한다.
제4데이터베이스저장 단계(S70)는 상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 제4 데이터베이스(600)에 저장한다.
질환가능성판단 단계(S80)는 상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 분석부(700)에서 판단한다.
100: 제1 데이터베이스
200: 제2 데이터베이스
300: 분석 서버
400: 메인 서버
500: 제3 데이터베이스
600: 제4 데이터베이스
700: 판단부
S10: DNA추출 단계
S11: 단백질제거 단계 S12: 유전자추출 단계
S13: DNA분리 단계
S20: 유전자서열데이터생성 단계
S30: 체내세균분포분석 단계
S31: 어셈블리 단계 S32: 노이즈제거 단계
S33: 중복제거 단계 S34: 필터링 단계
S35: 불필요서열제거 단계 S36: 클러스터링 단계
S37: 거리행렬생성 단계
S40: 체내세균분포비교 단계
S50: 분석결과보고 단계
S60: 개인별데이터저장 단계
S70: 제4데이터베이스저장 단계
S80: 질환가능성판단 단계

Claims (5)

  1. 정상인의 세균총 참조 서열 데이터가 저장되는 제1 데이터베이스(100);
    질환별 세균총 참조 서열 데이터가 저장되는 제2 데이터베이스(200);
    DNA 유전자 서열을 추출한 데이터를 분석하여, 개인의 세균총 서열 데이터를 생성하는 분석 서버(300);
    상기 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 개인의 세균총 서열 데이터를 비교하여, 체내에 분포된 유익균, 중립균 및 유해균에 대한 세균총 분석 결과를 보고하는 메인 서버(400);
    개인별 세균총 서열 데이터 및 분석 결과가 저장되는 제3 데이터베이스(500);
    상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 저장하는 제4 데이터베이스(600); 및
    상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 판단하는 분석부(700)를 포함하는 세균총 분석 시스템.
  2. 제1항에 있어서,
    상기 메인 서버(400)는
    상기 제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 상기 개인의 세균총 서열 데이터의 유사도를 계산하고 이를 자카드 계수(Jaccard coefficient)와 쎄타와이씨 계수(Thetayc coefficient)를 사용하여 히트맵(heatmap)으로 나타내는 것을 특징으로 하는 세균총 분석 시스템.
  3. 제1항에 있어서,
    상기 메인 서버(400)는
    유익균에 대한 세균총 분석 결과, 중립균에 대한 세균총 분석 결과 및 유해균에 대한 세균총 분석 결과를 종합적으로 고려하여 의뢰인의 건강에 관한 의견을 제시하는 것을 특징으로 하는 세균총 분석 시스템.
  4. 대변에서 DNA를 추출하는 DNA추출 단계(S10);
    차세대 시퀀싱(Next Generation Sequencing) 방법을 통해, 상기 DNA추출 단계(S10)에서 추출된 DNA로부터 DNA 유전자 서열 데이터를 생산하는 유전자서열데이터생성 단계(S20);
    상기 유전자서열데이터생성 단계(S20)에서 생산된 DNA 유전자 서열 데이터를 분석하여 개인의 세균총 서열 데이터를 생성하는 체내세균분포분석 단계(S30);
    제1 데이터베이스(100)에 저장된 정상인의 세균총 참조 서열 데이터, 제2 데이터베이스(200)에 저장된 질환별 세균총 참조 서열 데이터 및 상기 체내세균분포분석 단계(S30)에서 분석된 개인의 세균총 서열 데이터를 메인서버(400)에서 비교하는 체내세균분포비교 단계(S40);
    상기 체내세균분포비교 단계(S40)의 비교 결과를 바탕으로, 체내에 분포된 유익균, 중립균 및 유해균의 결과를 보고하는 분석결과보고 단계(S50);
    결과 보고가 완료된 개인별 세균총 서열 데이터 및 분석 결과를 제3 데이터베이스(500)에 저장하는 개인별데이터저장 단계(S60);
    상기 메인서버(400)의 분석 결과로부터 질환으로 판단되는 경우, 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 상기 제3 데이터베이스(500)로부터 전송받아 제4 데이터베이스(600)에 저장하는 제4데이터베이스저장 단계(S70); 및
    상기 제4 데이터베이스(600)에 저장된 질환으로 판단된 개인의 세균총 서열 데이터 및 분석결과의 누적치를 현재 분석 대상인 개인의 세균총 서열 데이터와 비교하여, 현재 분석 대상인 개인의 질환의 진행 가능성을 분석부(700)에서 판단하는 질환가능성판단 단계(S80)를 포함하는 세균총 분석 방법.
  5. 제4항에 있어서,
    상기 DNA추출 단계(S10)는
    세포를 파쇄(lysis)하여 세포 내 구성물질을 용액화 하고, 화학적 작용을 통해 단백질을 제거하는 단백질제거 단계(S11);
    상기 용액에 페놀(phenol)/클로로포름(chloroform)/아이소아밀알코올(IAA, isoamyl alcohol) 혼합물을 처리하고 원심분리를 하여 페놀과 수용액을 분리하는 유전자추출 단계(S12); 및
    상기 수용액에 알코올 용액을 혼합하고 원심분리를 한 후, DNA를 펠릿의 형태로 수득하는 DNA분리 단계(S13);
    를 포함하는 것을 특징으로 하는 세균총 분석 방법.

KR1020170176042A 2017-12-20 2017-12-20 세균총 분석 시스템 및 방법 KR20190074576A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170176042A KR20190074576A (ko) 2017-12-20 2017-12-20 세균총 분석 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170176042A KR20190074576A (ko) 2017-12-20 2017-12-20 세균총 분석 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20190074576A true KR20190074576A (ko) 2019-06-28

Family

ID=67066251

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170176042A KR20190074576A (ko) 2017-12-20 2017-12-20 세균총 분석 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20190074576A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210129953A (ko) * 2020-04-21 2021-10-29 박선민 대사성 질환과 안질환의 예방 및 건강 유지를 위한 장내 미생물 검사 기반 맞춤형 프리바이오틱스 또는 프로바이오틱스 정보 제공방법
CN114341370A (zh) * 2020-07-30 2022-04-12 内斯托尔株式会社 细菌提供系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110066018A (ko) 2009-12-10 2011-06-16 서울대학교산학협력단 16S rDNA-DGGE와 real-time PCR 증폭을 이용한 세균군집 분석법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110066018A (ko) 2009-12-10 2011-06-16 서울대학교산학협력단 16S rDNA-DGGE와 real-time PCR 증폭을 이용한 세균군집 분석법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210129953A (ko) * 2020-04-21 2021-10-29 박선민 대사성 질환과 안질환의 예방 및 건강 유지를 위한 장내 미생물 검사 기반 맞춤형 프리바이오틱스 또는 프로바이오틱스 정보 제공방법
CN114341370A (zh) * 2020-07-30 2022-04-12 内斯托尔株式会社 细菌提供系统
CN114341370B (zh) * 2020-07-30 2024-06-07 内斯托尔株式会社 细菌提供系统

Similar Documents

Publication Publication Date Title
CN108804875B (zh) 一种利用宏基因组数据分析微生物群体功能的方法
Nissen et al. Improved metagenome binning and assembly using deep variational autoencoders
AU2018318756B2 (en) Disease-associated microbiome characterization process
Lagkouvardos et al. IMNGS: a comprehensive open resource of processed 16S rRNA microbial profiles for ecology and diversity studies
Cherry et al. Computational reconstruction of the signalling networks surrounding implanted biomaterials from single-cell transcriptomics
Jeffery et al. Composition and temporal stability of the gut microbiota in older persons
Franzosa et al. Identifying personal microbiomes using metagenomic codes
Turnbaugh et al. The human microbiome project
Verster et al. Competitive lottery-based assembly of selected clades in the human gut microbiome
Volant et al. SHAMAN: a user-friendly website for metataxonomic analysis from raw reads to statistical analysis
Saeed et al. Unsupervised discovery of microbial population structure within metagenomes using nucleotide base composition
Robinson et al. Intricacies of assessing the human microbiome in epidemiologic studies
Foster et al. Measuring the microbiome: perspectives on advances in DNA-based techniques for exploring microbial life
AU2022202660A1 (en) Method and system for characterization for appendix-related conditions associated with microorganisms
CN109475305B (zh) 用于微生物药物基因组学的方法和系统
US20200202979A1 (en) Nasal-related characterization associated with the nose microbiome
CN111164224A (zh) 微生物相关的重要性指数指标
Stumpf et al. Transfer learning efficiently maps bone marrow cell types from mouse to human using single-cell RNA sequencing
CA3054487A1 (en) Systems and methods for metagenomic analysis
Barash et al. BacPaCS—bacterial pathogenicity classification via sparse-SVM
Montassier et al. CLOUD: a non-parametric detection test for microbiome outliers
KR20190074576A (ko) 세균총 분석 시스템 및 방법
Alkema et al. Charting host-microbe co-metabolism in skin aging and application to metagenomics data
EP3776285A1 (en) Method and system for characterizing microorganism-related conditions
Shen et al. A universal approach for integrating super large-scale single-cell transcriptomes by exploring gene rankings

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right