KR20220004069A - 질환의 진단 방법 - Google Patents

질환의 진단 방법 Download PDF

Info

Publication number
KR20220004069A
KR20220004069A KR1020217035793A KR20217035793A KR20220004069A KR 20220004069 A KR20220004069 A KR 20220004069A KR 1020217035793 A KR1020217035793 A KR 1020217035793A KR 20217035793 A KR20217035793 A KR 20217035793A KR 20220004069 A KR20220004069 A KR 20220004069A
Authority
KR
South Korea
Prior art keywords
bam
ibs
bacteria
diagnosing
detecting
Prior art date
Application number
KR1020217035793A
Other languages
English (en)
Inventor
폴 오'툴
퍼거스 샤나한
이안 제프리
에일린 오'헐리
아누바브 다스
Original Assignee
4디 파마 코르크 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1909052.1A external-priority patent/GB201909052D0/en
Priority claimed from GB201915143A external-priority patent/GB201915143D0/en
Priority claimed from GB201915156A external-priority patent/GB201915156D0/en
Application filed by 4디 파마 코르크 리미티드 filed Critical 4디 파마 코르크 리미티드
Publication of KR20220004069A publication Critical patent/KR20220004069A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/435Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with one nitrogen as the only ring hetero atom
    • A61K31/44Non condensed pyridines; Hydrogenated derivatives thereof
    • A61K31/445Non condensed piperidines, e.g. piperocaine
    • A61K31/451Non condensed piperidines, e.g. piperocaine having a carbocyclic group directly attached to the heterocyclic ring, e.g. glutethimide, meperidine, loperamide, phencyclidine, piminodine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/24Mucus; Mucous glands; Bursa; Synovial fluid; Arthral fluid; Excreta; Spinal fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/74Bacteria
    • A61K35/741Probiotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/12Antidiarrhoeals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7206Mass spectrometers interfaced to gas chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/493Physical analysis of biological material of liquid biological material urine
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N2030/022Column chromatography characterised by the kind of separation mechanism
    • G01N2030/025Gas chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N2030/022Column chromatography characterised by the kind of separation mechanism
    • G01N2030/027Liquid chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/06Gastro-intestinal diseases
    • G01N2800/065Bowel diseases, e.g. Crohn, ulcerative colitis, IBS
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Veterinary Medicine (AREA)
  • Data Mining & Analysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Computing Systems (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Databases & Information Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)

Abstract

본원은 BAM을 진단하기 위한 새롭고 개선된 방법을 제공한다.

Description

질환의 진단 방법
본 발명은 진단 분야 및 특히 담즙산 흡수장애(BAM)의 진단에 관한 것이다.
담즙산 흡수장애(BAM)는 몇 가지 장 관련 문제, 특히 만성 설사의 원인이다. 이는 위장 질환에 이차적으로 발생하는 흡수장애에서 비롯될 수 있거나, 또는 과도한 담즙산 생성과 관련된, 일차 장애일 수 있다. 설사가 주된 과민성 대장 증후군(IBS-D) 및 교대형(alternating) 또는 혼합형 과민성 대장 증후군(IBS-M)을 앓고 있는 것으로 잘못 진단된 환자 중 일부는 실제로 BAM을 앓고 있으며(1, 2), 이에 대한 치료는 과민성 대장 증후군(IBS)의 치료와 다르다(3). 중요한 점은, BAM은 IBS와 임상적으로 뚜렷이 다른 독립체라는 것이다- BAM을 앓고 있는 모든 환자가 IBS를 가지고 있는 것은 아니며, 모든 IBS 환자가 BAM을 앓고 있는 것은 아니다. BAM은 기능성 설사 또는 설사성 과민성 대장 증후군(IBS-D)이 있는 환자의 25%~50%를 차지하며 인구의 1%가 이 질환을 앓고 있는 것으로 추정된다(4).
BAM은 담즙산 억제제로 치료할 수 있다. 담즙산은 간에서 생산되어, 담도계로 분비되며, 담낭에 저장되었다가 식사 후에 콜레시스토키닌에 의해 자극을 받아 방출된다. 일반적으로 담즙산의 95% 초과분이 회장 말단에서 흡수되고 간에 의해 흡수되어 재분비된다. 다량의 담즙산이 대장으로 들어가면, 결장에서 수분 분비와 장의 운동성을 자극하며, 이는 만성 설사의 증상을 유발한다. 정점 나트륨-의존성 담즙염 수송체(ASBT, IBAT, 유전자 기호 SLC10A2), 세포질 회장 담즙산 결합 단백질(IBABP, ILBP, 유전자 기호 FABP6) 및 OSTα 및 OSTβ의 기저외측 이종이량체를 포함하는 담즙산 수송체는 담즙산을 운반한다. 이들 운반체의 발현이 감소되면, 장은 담즙산을 흡수하는 능력이 떨어진다(제1형 담즙산 흡수장애). 장 운동이 위-장 수술에 의해 영향을 받거나, 담즙산이 소장 박테리아의 과증식으로 인해 분해되면, 흡수가 덜 효율적이다(제3형 담즙산 흡수장애). 원발성 담즙산 설사(제2형 담즙산 "흡수장애")는 담즙산의 과생산에 의해 발생될 수 있다. 명백한 질병이 없는 환자의 극히 일부(제2형 담즙산 흡수장애)는 ASBT에 돌연변이가 있을 수 있다.
BAM은 75셀레늄(Se) 호모콜산 타우린(SeHCAT) 검사를 통해 진단될 수 있는데, 이 검사는 담즙산을 재흡수하고 대사하지 못하는 것을 검출한다. 상기 검사는 방사선표지된 담즙 화합물을 투여하고 1주일 후 그의 유지(retention)를 측정하는 것을 포함한다(5). BAM은 예를 들어 담즙산 억제제에 의해 성공적으로 관리할 수 있는 IBS와 임상적으로 뚜렷이 다른 독립체이다. 병원에서 BAM 진단을 위한 확실한 검사인 SeHCAT 검사는(6) 비싸며 널리 사용 가능하지 않다.
IBS는 소화기관에 영향을 미치는 흔한 병태이다. 증상은 경련, 팽만감, 설사, 변비가 포함되며 일반적으로 수년에 걸쳐, 장기간 발생한다. 불안, 주요 우울증, 만성피로증후군 같은 장애는 IBS 환자들에게 흔하다. IBS에 대한 알려진 치료법은 없으며 치료는 일반적으로 증상을 개선하기 위해 시행된다. 치료에는 식습관 변화, 약물, 프로바이오틱스 및/또는 상담이 포함될 수 있다. 일반적으로 치료법으로 제안되는 식이 요법에는 수용성 섬유질 섭취 증가, 글루텐-프리 식단, 또는 발효성 올리고당, 이당류, 단당류 및 폴리올이 낮은 단기-식단(FODMAP)이 포함된다. 완하제는 변비를 돕는 데 사용되는 반면 약물 로페라미드는 설사를 돕는 데 사용된다. 항우울제는 전반적인 증상과 통증을 개선할 수 있다. 대부분의 만성 비-전염성 장애와 마찬가지로, IBS는 이종으로 보인다(7). 이 질환은 성가신 장 장애(bowel disturbance)에서 사회적 장애(social disablement)에 이르기까지 심각성이 다양하며, 뚜렷한 증상 이질성을 동반한다(8). 흔히 뇌-장 축의 장애로 간주되지만(9, 10), IBS가 장, 뇌 또는 둘 다에서 시작하는지 확실하지 않다. 비록 감수성 위험 요인이 있지만, 감염 후 IBS의 발생(11)이 일부 경우는 말단 기관에서 시작되고, 일부는 심리사회적일 수 있음을 시사한다. 신경 발달과 아마도 행동에 대한 미생물군집체에 의한 수정적 영향의 새로운 증거와 함께, 미생물군유전체 과학의 발전은 미생물군집체-장-뇌 축을 포괄하는 정신/신체 연결의 개념을 확장했다(12). 그러나, IBS의 이해 및 치료에 대한 발전은 신뢰할 수 있는 바이오마커가 없기 때문에 제한되었으며 IBS는 여전히 증상에 따라 정의된다. 나아가, 주요 증상(설사가-두드러진(IBS-D) 또는 변비가-두드러진(IBS-C))을 바탕으로 환자를 임상 아형으로 계층화하려는 현재의 접근 방식은 때때로 수일 내에 아형 사이를 교대하는 환자의 치료를 알리지 않는 것을 포함하여 상당한 제한이 있다(13). 극성 반대 증상을 해결하도록 설계된 약제는, 환자가 잘못 분류된 경우, 원치 않는 심각한 부작용의 가능성이 있다(14).
장 장애가 있는 환자의 장내 미생물군집체 변화를 대조군과 비교하여 연구조사가 실시되었다(15-18). 장 장애와 모두 관련될 수 있는, 식단, 항생제 및 장 감염과 미생물군유전체와의 상호 작용은, 미생물군유전체의 변화가 이 증후군의 병태생리학적 기전을 활성화 또는 존속시킬 수 있다는 가설과 일치한다(19, 20). 그러나, IBS 중증도에 대한 특징은 제안되었지만, 장 장애가 있는 환자를 대조군과 분리하고 치료법을 알려주는 강력한 미생물군유전체 특징 또는 바이오마커가 부족하다. 나아가, 현재까지 대부분의 미생물군집체 연구는 16S rRNA 프로파일링을 사용했으며, 박테리아 대사산물은 분석하지 않았다.
BAM과 같은 장 장애를 진단하는 데 있어 더 나은 개선된 방법이 필요하다. 또한 IBS와 같은 유사한 증상을 가진 다른 질병으로 이미 진단된 환자에서 BAM과 같은 장 장애를 진단하기 위한 더 나은 개선된 방법이 필요하다.
발명의 요약
본 발명가들은 담즙산 흡수장애(BAM)를 진단하기 위한 새롭고 개선된 방법을 개발했다. 환자 및 대조군(비-BAM)에서 미생물군유전체 및 대사체의 종합적이고 상세한 분석은 새로운 질환의 지표를 확인할 수 있게 한다. 본 발명은 다음을 검출하는 것을 포함하는 환자의 BAM 을 진단하는 방법을 제공한다: BAM과 관련된 분류군의 박테리아 종 및/또는 BAM과 관련된 대사산물.
도 1. SeHCAT 검정 피험자의 담즙산 흡수장애(BAM) 분포, 미생물군유전체 및 대사 프로파일. (A) 대조군 및 IBS 환자의 SeHCAT 유지율 (B) 테스트된 IBS-D 및 IBS-M 환자의 BAM 부류의 분포 (C) IBS 환자의 BAM 부류 간에 유의한 차이가 없는 미생물군집체 조성물의 PCoA(16S OTU 수준에서 스피어만(Spearman) 거리를 가진 순열 MANOVA(다변량 분산분석); p-값 = 0.289). (D) 테스트된 IBS 환자의 BAM 부류 간에 유의미한 차이를 보여주는 대변 MS 대사체의 PCoA(16S OTU 수준에서 스피어만(Spearman) 거리를 가진 순열 MANOVA, p-값 <0.001).
도 2. SeHCAT 검정 피험자(IBS: n=45; 대조군 n=9)에 대한, 대변 대사산물 및 랜덤 포레스트를 기반으로 한, BAM의 예측 확률.
도 3: 대체 기계 학습 파이프라인의 핵심 워크플로. N은 최소 절대 수축 및 선택 연산자(LASSO)에 의해 반환된 특성들의 수를 나타낸다.
도 4: SeHCAT 검정 IBS 환자(IBS-BAM: n = 19, IBS 비-BAM n=21)에 대한, 대변 대사산물 및 랜덤 포레스트를 기반으로 한, BAM의 예측 확률. 경계성 BAM이 있는 IBS 환자는 모델에서 제외되었다.
본 예에서 보듯이, 본 발명가들은 75셀레늄(Se) 호모콜산 타우린(SeHCAT) 검사보다 효과적이고 훨씬 더 저렴하고, 접근이 더 용이하며 더 안전한 담즙산 흡수장애(BAM)를 진단하기 위한 방법을 개발했다. SeHCAT 검사는 현재 BAM 진단에 가장 널리 사용되는 기법이지만, 본 발명의 방법과 달리, 환자를 방사선에 노출시키며, 임상 설정이 필요하고 매우 비싸다. SeHCAT 검사는, 방사선표지 된 75SeHCAT(370kBq의 셀레늄-75 및 0.1mg 미만의 SeHCAT 포함)를 포함하는 캡슐이 물과 함께 경구 투여된다. 캡슐을 복용한 후 1-3시간 후 및 7일 째에 시준 되지 않은 감마 카메라를 사용하여 측정이 수행된다. 그 후 7일 째의 SeHCAT 유지 퍼센트가 계산되며, 7일 SeHCAT 유지 값이 15% 초과이면 정상으로, 15% 미만의 값은 담즙산 흡수장애에서 발견되는, 과도한 담즙산 손실을 의미하는 것으로 간주된다.
일 실시예에서, 본 발명은 BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 특정 일 실시예에서, 본 발명은 경증 BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 특정 일 실시예에서, 본 발명은 중등도 BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 중등도 BAM은 SeHCAT 검사에서 표지된 담즙산 유사물질이 10% 유지된 것이 특징일 수 있다. 특정 일 실시예에서, 본 발명은 중증 BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 본 데이터는 본 발명의 방법이 중증 BAM 진단에 특히 효과적이라는 것을 보여준다. 중증 BAM은 SeHCAT 검사에서 표지된 담즙산 유사물질이 5% 이하로 유지된 것이 특징일 수 있다. 일부 실시예에서, 본 발명의 방법은 IBS로 진단된 환자의 BAM을 진단하기 위한 것이다. 일부 실시예에서, 본 발명의 방법은 IBS-M으로 진단된 환자의 BAM을 진단하기 위한 것이다. 일부 선호 실시예에서, 본 발명의 방법은 IBS-D로 진단된 환자의 BAM을 진단하기 위한 것이다. 특정 일 실시예에서, 본 발명의 방법은 IBS로 진단된 환자의 중증 BAM을 진단하기 위한 것이다.
일 실시예에서, 상기 방법은 미생물군집체 조성을 기반으로 중증 BAM을 앓고 있는 환자를 진단하는 것을 포함한다. 특정 일 실시예에서, IBS 및 중증 BAM을 앓고 있는 환자들은 뚜렷이 다른 미생물군집체 조성을 가진다. 특정 일 실시예에서, 중증 BAM을 앓고 있는 IBS 환자는 정상, 경증, 중등도 또는 경계성 BAM 진단을 받은 IBS 환자와 뚜렷이 다른 미생물군집체 조성을 가진다.
일 실시예에서, 본 발명은 뚜렷이 다른 대변 대사체 특징을 검출하는 것을 포함하는, BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 특정 일 실시예에서, 본 발명은 뚜렷이 다른 대변 대사체 특징을 검출하는 것을 포함하는, 중증 BAM을 가진 IBS 환자를 진단하기 위한 방법을 제공한다. 일 실시예에서, 기계 학습은 대변 대사체 데이터에 적용되어 BAM을 예측한다.
일 실시예에서, 본 발명은 BAM을 예측하는 하나 이상의 대사산물을 검출하는 것을 포함하는, BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 일반적으로, 본 발명의 방법에서 BAM을 예측하는 또는 BAM과 관련된 대사산물을 검출하는 것은 시료에서 대사산물의 농도를 측정하거나 대사산물의 농도 변화를 측정하는 것 및 선택적으로 상기 농도를 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 비교하는 것을 포함한다. 특정 일 실시예에서, 본 발명의 방법에서 BAM을 예측하는 또는 BAM과 관련된 대사산물을 검출하는 것은 시료의 대사산물 농도를 측정하거나 대사산물 농도의 변화를 측정하는 것 및 상기 농도를 IBS를 앓고 있는 환자의 해당 시료에 대해 비교하는 것을 포함한다. 일 실시예에서, 상기 BAM을 예측하는 하나 이상의 대사산물은 다음 중에서 선택된다: PG(P-16:0/14:0), 2-에틸수베르산, Glu-Glu-Gly-Tyr, 1,2,3-트리스(1-에톡시에톡시)프로판, PG(O-30:1), 우르소데옥시콜산(UDCA), MG(22:2(13Z,16Z)/0:0/0:0), L-라이신, O-포스포에타놀아민, PE(22:5(7Z,10Z,13Z,16Z,19Z)/24:0) 및/또는 헵타데칸산. 또 다른 실시예에서, 상기 BAM을 예측하는 하나 이상의 대사산물은 다음 중에서 선택된다: 1,3-di-(5Z,8Z,11Z,14Z,17Z-에이코사펜타에노일)-2-하이드록시-글리세롤 (d5), 디메틸 벤질 카르비닐 부티레이트, 1-18:0-2-18:2-모노갈락토실디아실글리세롤, PG(P-16:0,14:0), Glu-Glu-Gly-Tyr, PC(22:2(13Z,16Z)/15:0), PG(34:0), PE(18:3(6Z,9Z,12Z)/P-18:0) , MG(22:2(13Z,16Z)/0:0/0:0), Arg-Ile-Gln-Ile,, PE(22:5(7Z,10Z,13Z,16Z,19Z)/24:0), PC(18:1(9Z)/15:0), 티오파네이트-메틸, Asn-Ser-His-His, 1,2,3-트리스(1-에톡시에톡시)프로판, PS(39:6), 2-히드록시라우로일카르니틴, 하이포잔틴, 아데노신, PC(40:6), Asp-Phe-Phe-Val, 3-디히드록시카르니틴, 이노신, PG(O-34:3), 11-데옥소쿠르비타신 I, 메틸 카프레이트, 리놀레오일 에탄올아미드, His-Met-Phe-Phe, 1-데칸올, 그라벨리페론, 우리딘, 아라키딜 카르니틴, 구아노신, 노닐산메틸, 3-에피데미시딘, 모모르돌, N-[2-(1H-인돌-3-yl)에틸]도코산아미드, 카프로산메틸, 아스코르브산, N-아세틸-leu-leu-tyr, 4-하이드록시부티르산, [ST 디메틸(4:0/3:0)](5Z,7E,17Z)-(1S,3R)-26,27-디메틸-9,10-seco-5,7,10(19),17(20)-콜레스테트라엔-22-yne-1,3,25-트리올, N-메틸인돌로[3,2-b]-5알파-콜레스트-2-ene 및 감마-글루타밀-S-메틸시스테닐-베타-알라닌. 바람직한 일 실시예에서, 상기 방법은 우르소데옥시콜산 검출을 포함한다. 바람직한 일 실시예에서, 상기 방법은 L-라이신 검출을 포함한다. 바람직한 일 실시예에서, 상기 방법은 1,3-di-(5Z,8Z,11Z,14Z,17Z-에이코사펜타에노일)-2-하이드록시-글리세롤 (d5) 검출을 포함한다. 바람직한 일 실시예에서, 상기 방법은 디메틸 벤질 카르비닐 부티레이트 검출을 포함한다. 바람직한 일 실시예에서, 상기 방법은 1-18:0-2-18:2-모노갈락토실디아실글리세롤 검출을 포함한다. 바람직한 일 실시예에서, 상기 방법은 PG(P-16:0/14:0) 검출을 포함한다. 바람직한 일 실시예에서, 상기 방법은 Glu-Glu-Gly-Tyr 검출을 포함한다. 이와 같은 임의의 실시예에서, 대사산물을 검출하는 것은, 예를 들어, 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 시료 내 대사산물의 상대적 농도를 측정하는 것을 포함한다. 바람직한 일 실시예에서, 대사산물을 검출하는 것은, 예를 들어, IBS를 앓고 있는 환자의 해당 시료에 대해 시료 내 대사산물의 상대적 농도를 측정하는 것을 포함한다. 일부 실시예에서, 상기 방법은 상기 대사산물들의 전구체 또는 분해 산물을 검출하는 것을 포함한다.
일 실시예에서, 본 발명은 BAM을 예측하는 하나 이상의 대사산물의 농도 증가를 검출하는 것을 포함하는, BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 일부 실시예에서, 본 발명의 방법에서 BAM을 예측하는 또는 BAM과 관련된 대사산물을 검출하는 것은 시료에서 대사산물의 농도를 측정하는 것 및 선택적으로 상기 농도를 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 비교하는 것을 포함한다. 일부 실시예에서, BAM을 예측하는 대사산물은 대조군(비-BAM) 개별의 해당 시료와 비교하여 또는 기준값에 대해 비교하여 농도가 더 높다. 특정 일 실시예에서, 본 발명의 방법에서 BAM을 예측하는 또는 BAM과 관련된 대사산물을 검출하는 것은 대사산물의 농도를 측정하는 것 및 상기 농도를 IBS를 앓고 있는 환자의 해당 시료에 대해 비교하는 것을 포함한다. 일부 실시예에서, BAM을 예측하는 대사산물은 IBS를 앓고 있는 환자의 해당 시료에 비해 농도가 더 높다. 특정 일 실시예에서, 상기 BAM을 예측하는 하나 이상의 대사산물은 다음 중에서 선택된다: 1,3-di-(5Z,8Z,11Z,14Z,17Z-에이코사펜타에노일)-2-하이드록시-글리세롤 (d5), 디메틸 벤질 카르비닐 부티레이트, PG(P-16:0/14:0), PG(34:0), PE(18:3(6Z,9Z,12Z)/P-18:0), 티오파네이트-메틸, PS(39:6), Asp-Phe-Phe-Val, PG(O-34:3), 1-데칸올, 3-에피데미시딘 및/또는 모모르돌.
일 실시예에서, 본 발명은 대조군 개별(비-BAM)을 예측하는 하나 이상의 대사산물의 농도 감소를 검출하는 것을 포함하는, BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 일부 실시예에서, 본 발명의 방법에서 BAM을 예측하는 또는 BAM과 관련된 대사산물을 검출하는 것은 시료에서 대사산물의 농도를 측정하는 것 및 선택적으로 상기 농도를 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 비교하는 것을 포함한다. 일부 실시예에서, BAM을 예측하는 대사산물은 대조군(비-BAM) 개인의 해당 시료에 비해 또는 기준값에 대해 농도가 더 낮다. 특정 일 실시예에서, 본 발명의 방법에서 BAM을 예측하는 또는 BAM과 관련된 대사산물을 검출하는 것은 대사산물의 농도를 측정하는 것 및 상기 농도를 IBS를 앓고 있는 환자의 해당 시료에 대해 비교하는 것을 포함한다. 일부 실시예에서, BAM을 예측하는 대사산물은 IBS를 앓고 있는 환자의 해당 시료와 비교하여 농도가 더 낮다. 특정 일 실시예에서, 대조군(비-BAM) 개인의 BAM을 예측하는 하나 이상의 대사산물은 다음 중에서 선택된다: 1-18:0-2-18:2-모노갈락토실디아실글리세롤, Glu-Glu-Gly-Tyr, PC(22:2(13Z,16Z)/15:0), MG(22:2(13Z,16Z)/0:0/0:0), Arg-Ile-Gln-Ile, PE(22:5(7Z,10Z,13Z,16Z,19Z)/24:0), PC(18:1(9Z)/15:0), Asn-Ser-His-His, 1,2,3-트리스(1-에톡시에톡시)프로판, 2-히드록시라우로일카르니틴, 하이포잔틴, 아데노신, PC(40:6), 3-디하이드록시카르니틴, 이노신, 11-데옥소쿠쿠르비타신 I, 메틸 카프레이트, 리놀레오일 에탄올아미드, His-Met-Phe-Phe, 그라벨리페론, 우리딘, 아라키딜 카르니틴, 구아노신, 노닐산메틸, N-[2-(1H-인돌-3-yl)에틸]도코산아미드, 카프로산메틸, 아스코르브산, N-아세틸-leu-leu-tyr, 4-하이드록시부티르산, [ST 디메틸(4:0/3:0)](5Z,7E,17Z)-(1S,3R)-26,27-디메틸-9,10-seco-5,7,10(19),17(20)-콜레스테트라엔-22-yne-1,3,25-트리올, N-메틸인돌로[3,2-b]-5알파-콜레스트-2-ene 및/또는 감마-글루타밀-S-메틸시스테닐-베타-알라닌.
일부 실시예에서, 본 발명의 방법에서 BAM과 관련된 대사산물을 검출하는 것은 대사산물의 전구체 농도를 측정하는 것 및 상기 농도를 선택적으로 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 비교하는 것을 포함한다. 일부 실시예에서, 본 발명의 방법에서 BAM과 관련된 대사산물을 검출하는 것은 대사산물의 분해 산물의 농도를 측정하는 것 및 상기 농도를 선택적으로 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 비교하는 것을 포함한다. 특정 실시예에서, 상기 방법은 BAM을 예측하는 대사산물을 생성하는 것으로 알려진 박테리아 분류군을 검출하는 것을 포함한다.
일 실시예에서, 본 발명은 표 1 및/또는 표 7에서 선택된 BAM을 예측하는 대사산물을 검출하는 것을 포함하는, BAM을 가진 환자를 진단하기 위한 방법을 제공한다. 특정 일 실시예에서, 본 발명은 표 1 및/또는 표 7에서 선택된 BAM을 예측하는 대사산물을 검출하는 것을 포함하는, 중증 BAM을 가진 IBS 환자를 진단하기 위한 방법을 제공한다. 바람직한 실시예에서, 본 발명의 상기 방법은 지방산 대사와 관련된 대사산물 검출을 포함한다. 바람직한 실시예에서, 본 발명의 상기 방법은 우르소데옥시콜산 검출을 포함한다. 일 실시예에서, 기계 학습이 BAM을 진단하기 위해 사용된다. 이와 같은 임의의 실시예에서, 대사산물을 검출하는 것은, 예를 들어, 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 시료 내 대사산물의 상대적 농도를 측정하는 것을 포함한다.
본 발명가들은 예에서 보여주었듯이, BAM과 관련된 박테리아 분류군을 확인했다. 이에따라, 본 발명은 특정 박테리아 분류군의 존재를 검출하는 것을 포함하는 BAM을 진단하기 위한 방법들을 제공한다. 바람직하게는, 상기 방법들은 환자의 대변 시료에 포함된 박테리아 균주를 검출하는 것을 포함한다. 대안으로, 면봉과 같은 구강 시료에서, 박테리아(즉, 하나 이상의 박테리아 균주)를 검출할 수 있다. 일반적으로, 본 발명의 방법에서 BAM과 관련된 박테리아 분류군을 검출하는 것은, 예를 들어, 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 시료 내의 박테리아(즉, 하나 이상의 박테리아 균)의 상대적 풍부도(the relative abundance)를 측정하는 것을 포함한다.
일 실시예에서, 본 발명은 다음 과 중 하나 이상의 박테리아 종을 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다: 라크노스피라과(Lachnospiraceae), 박테로이데스과(Bacteroidaceae), 루미노코커스과(Ruminococcaceae), 비피도박테리움과(Bifidobacteriaceae), 프레보텔라과(Prevotellaceae), 베일로넬라과(Veillonellaceae) 및 코리오박테리움과(Coriobacteriaceae). 일 실시예에서, 본 발명은 다음 속 중 하나 이상의 박테리아 종을 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 블라우티아(Blautia), 박테로이데스(Bacteroides), 패칼리박테리움(Faecalibacterium), 오실리박터(Oscillibacter), 루미노코커스(Ruminococcus), 비피도박테리움(Bifidobacterium), 코프로코커스(Coprococcus), 파라프레보텔라(Paraprevotella), 젬미거(Gemmiger), 다이얼리스터(Dialister) 및 메가모나스(Megamonas). 이와 같은 임의의 실시예에서, 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것은, 예를 들어, 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 시료 내 박테리아의 상대적 풍부도를 측정하는 것을 포함한다. 본 예들은 이러한 박테리아를 검출하는 방법들이 특히 효과적이라는 것을 보여준다. 본 발명에 사용된 박테리아 분류군은 16S rRNA 유전자 서열을 참조하여 정의할 수 있거나, 본 발명은 린네 분류법을 사용할 수 있다. 계통-특이적 박테리아 유전자, 16S 서열, 전사체학, 대사체학, 또는 이러한 기법들의 조합을 이용하여 분류군의 어느 한 범주의 박테리아를 검출할 수 있다. 특정 실시예에서, 계통-특이적 박테리아 유전자, 16S 서열, 전사체학 또는 대사체학을 이용하여 박테리아(즉, 하나 이상의 박테리아 균주)를 검출할 수 있다.
일 실시예에서, 본 발명은 BAM과 관련된 운영 분류 단위(OTU)에 속하는 하나 이상의 박테리아 균주를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 당업계에 잘 알려진 바와 같이, 운영 분류 단위(OTU)는 밀접하게 관련된 개인들의 그룹들을 분류하는 데 사용되는 운영 정의이다. 본 명세서에 사용되는 "OTU"는 특정 분류 마커 유전자의 DNA 서열 유사성에 의해 그룹화된 유기체의 그룹이다(39). 일부 실시예에서, 상기 특정 분류체계 마커 유전자는 16S rRNA 유전자이다. 일부 실시예에서, 리보솜 데이터베이스 프로젝트(RDP) 분류체계 분류기가 대표적인 OTU 서열에 분류체계를 할당하는 데 사용된다. 예를 들어, 표 3의 서열 정보는 박테리아(즉, 하나 이상의 박테리아 균주)가 표 2에 나열된 OTU들에 속하는지 여부를 분류하는데 사용될 수 있다. 표 3의 서열에서 최소 97%의 서열 동일성을 가진 박테리아는 표 2의 해당 OTU들에 속한다. 바람직한 실시예에서, 상기 OTU는 표 2에서 선택된다. 이와 같은 임의의 실시예에서, 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것은, 예를 들어, 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 시료 내 박테리아의 상대적 풍부도를 측정하는 것을 포함한다.
일 실시예에서, 본 발명은 BAM과 관련된 운영 분류 단위(OTU)에 속하는 하나 이상의 박테리아 균주를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 바람직한 실시예에서, 상기 OTU는 표 2에서 선택된다. 일 실시예에서, 상기 BAM과 관련된 OTU는 다음 문 중 하나에 속하는 것으로 분류된다: 후벽균문(Firmicutes), 의간균문(Bacteroidetes) 또는 방선균문(Actinobacteria). 특정 일 실시예에서, 상기 BAM과 관련된 OTU는 다음 강 중 하나에 속하는 것으로 분류된다: 클로스트리디움강(Clostridia), 박테로이데스강(Bacteroidia), 악티노박테리아강(Actinobacteria) 또는 네가티비콕쿠스강(Negativicutes). 특정 일 실시예에서, 상기 BAM과 관련된 OTU는 다음 목 중 하나에 속하는 것으로 분류된다: 클로스트리디움목(Clostridiales), 박테로이데스목 (Bacteroidales), 셀레노모나스목 (Selenomonadales) 또는 코리오박테리움목 (Coriobacteriales). 특정 일 실시예에서, 상기 BAM과 관련된 OTU는 다음 과 중 하나에 속하는 것으로 분류된다: 라크노스피라과(Lachnospiraceae), 박테로이데스과(Bacteroidaceae), 루미노코커스과(Ruminococcaceae), 비피도박테리움과(Bifidobacteriaceae), 프레보텔라과(Prevotellaceae), 베일로넬라과(Veillonellaceae) 또는 코리오박테리움과(Coriobacteriaceae). 특정 일 실시예에서, 상기 BAM과 관련된 OTU는 다음 속 중 하나에 속하는 것으로 분류된다: 블라우티아(Blautia), 박테로이데스(Bacteroides), 패칼리박테리움(Faecalibacterium), 오실리박터(Oscillibacter), 라크노스피라시아_인서테_세디스(Lachnospiracea_incertae_sedis), 루미노코커스2(Ruminococcus2), 비피도박테리움(Bifidobacterium), 코프로코커스(Coprococcus), 파라프레보텔라(Paraprevotella), 젬미거(Gemmiger), 다이얼리스터(Dialister) 또는 메가모나스(Megamonas).
일 실시예에서, 본 발명은 표 2에 나열된 하나 이상의 OTU들에 속하는 박테리아 균주를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 표 3의 서열은 박테리아(즉, 하나 이상의 박테리아 균주)가 표 2에 나열된 OTU들에 속하는 것으로 분류하는데 사용될 수 있다. 표 3의 서열에서 최소 97%의 서열 동일성을 가진 박테리아(즉, 하나 이상의 박테리아 균주)는 표 2의 해당 OTU들에 속한다. 정렬은 서열의 길이에 걸쳐 있다. Metaphlan2 및 HUMAnN2 실행 모두에서, 종 조성에 대한 정렬은 보우타이2(bowtie 2)를 사용하여 수행된다. 보우타이2는 "매우 민감한 인수"로 실행되며 수행되는 정렬은 "전역 정렬"이다.
일 실시예에서, 본 발명은 서열번호: 1과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 블라우티아속(Blautia)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 2와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 박테로이데스속(Bacteroides)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 3과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridales) 에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 4와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 패칼리박테리움속(Faecalibacterium)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 5와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 오실리박터속(Oscillibacter)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 6과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라속(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 6과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 7과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 8과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 9와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스과(Ruminococcaceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 10과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스속(Ruminocococcus)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 11과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 12와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 비피도박테리움속(Bifidobacterium)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 13과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 코프로코쿠스속(Coprococcus)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 14와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridiales)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 15와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 파라프레보텔라속(Paraprevotella)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 16과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 박테로이데스속(Bacteroides)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 17과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스과(Ruminococcaceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 18과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 젬미거속(Gemmiger)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 19와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스과(Ruminococcaceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 20과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 다이얼리스터속(Dialister)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 21과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridiales)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 22와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridiales)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 23과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridiales)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 24와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 25와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 패칼리박테리움속(Faecalibacterium )에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 26과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridiales)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 27과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 메가모나스속(Megamonas)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 28과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 코리오박테리움과(Coriobacteriaceae)에 속하는 것으로 분류된다.
바람직한 실시예에서, 본 발명은 서열번호: 1-28 중 2개 이상, 예를 들어, 서열번호: 5, 8, 또는 서열번호: 1-28 모두와 적어도 97%(예: 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다.
일 실시예에서, 본 발명은 표 5에 나열된 하나 이상의 OTU들에 속하는 박테리아 균주를 검출하는 것을 포함하는, IBS 진단의 추가 단계를 제공한다. 표 6의 서열은 박테리아(즉, 하나 이상의 박테리아 균주)가 표 5에 나열된 OTU들에 속하는 것으로 분류하는데 사용될 수 있다. 표 6의 서열에서 최소 97%의 서열 동일성을 가진 박테리아(즉, 하나 이상의 박테리아 균주)는 표 5의 해당 OTU들에 속한다. 정렬은 서열의 길이에 걸쳐 있다. Metaphlan2 및 HUMAnN2 실행 모두에서, 종 조성에 대한 정렬은 보우타이2를 사용하여 수행된다. 보우타이2는 "매우 민감한 인수”로 실행되며 수행되는 정렬은 "전역 정렬"이다.
일 실시예에서, 본 발명은 서열번호: 29와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 30과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 후벽균문(Firmicutes)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 31과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 부티리코쿠스속(Butyricicoccus)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 32와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 33과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 클로스트리디움목(Clostridales)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 34와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스과(Ruminococcaceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 35와 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스과(Ruminococcaceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 36과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 후벽균문(Firmicutes)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 37과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 루미노코쿠스과(Ruminococcaceae)에 속하는 것으로 분류된다.
일 실시예에서, 본 발명은 서열번호: 38과 적어도 97%(예를 들어, 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다. 이러한 특정 실시예에서, 상기 박테리아(즉, 하나 이상의 박테리아 균주)가 라크노스피라과(Lachnospiraceae)에 속하는 것으로 분류된다.
바람직한 실시예에서, 본 발명은 서열번호: 29-38 중 2개 이상, 예를 들어, 서열번호: 5, 8, 또는 서열번호: 29-38 모두와 적어도 97%(예: 98%, 99%, 99.5% 또는 100%) 동일한 16S rRNA 유전자 서열을 갖는 박테리아(즉, 하나 이상의 박테리아 균주)를 검출하는 것을 포함하는, BAM을 진단하기 위한 방법을 제공한다.
특정 실시예에서, 상기 박테리아 종은 서열 기반 분류군에 속한다. 바람직한 실시예에서, 서열 기반 분류군이 표 2에서 선택된다.
바람직한 실시예에서, BAM을 진단하기 위한 방법은 위에 설명된 바와 같이 적어도 하나의 대사산물을 검출하는 것 및 위에 설명된 바와 같이 적어도 하나의 박테리아 균주 또는 종을 검출하는 것을 포함한다. 상기 대사체학 모델은 중증 및 중등도 BAM에 대해 100% 정확도로 수행되었지만, 상기 OTU 모델은 상기 대변 대사체학 모델(9개)에 비해 오분류(5개)가 더 적었다. 모델들 간에 오분류된 피험자들은 중첩되지 않았는데, 이는 결합된 미생물군유전체-대사체 모델이 BAM 예측 정확도를 높일 수 있음을 의미한다.
일 실시예에서, 본 발명은 BAM과 합병증성 질병으로 이미 진단된 환자의 BAM을 진단하기 위한 방법을 제공한다. 또 다른 실시예에서, BAM 대사체 특징을 이용한 BAM의 진단은 BAM으로 고통받는 환자들과 다른 질병, 예를 들어, BAM과 합병증성 질병으로 고통받는 환자들을 구별한다.
특정 일 실시예에서, 본 발명은 이미 염증성 장 질환, 예를 들어, 궤양성 대장염 또는 크론병으로 진단된 환자의 BAM을 진단하기 위한 방법을 제공한다. 특정 일 실시예에서, BAM 대사체 특징을 이용한 BAM의 진단은 BAM으로 고통받는 환자들과 다른 질병, 예를 들어, 궤양성 대장염 또는 크론병과 같은 염증성 장질환 등의 다른 질병으로 고통받는 환자들을 구별한다.
일 실시예에서, 거식증으로 이미 진단된 환자의 BAM을 진단하기 위한 방법을 제공한다. 또 다른 실시예에서, BAM 대사체 특징을 이용한 BAM의 진단은 BAM으로 고통받는 환자들과 다른 질병, 예를 들어, 거식증으로 고통받는 환자들을 구별한다.
특정 실시예에서, BAM을 진단하기 위한 방법은 하나 이상의 박테리아 종 및 하나 이상의 대사산물을 검출하는 것을 포함한다.
BAM 환자의 식단, 미생물군유전체 및 대사체의 통합 분석
특정 실시예에서, 본 발명은 다음 중 하나 이상을 포함하는 BAM의 진단 방법을 제공한다 i) 예를 들어, 위에서 논의된 바와 같은 박테리아 종을 검출하는 것, ii) 예를 들어, 위에서 논의된 바와 같은 대사산물을 검출하는 것. 이와 같은 임의의 실시예에서, 상기 박테리아, 유전자 또는 대사산물을 검출하는 것은, 예를 들어, 대조군(비-BAM) 개인의 해당 시료에 대해 또는 기준값에 대해 시료 내 상기 마커의 풍부도나 농도를 측정하는 것을 포함한다.
진단 방법
본 발명가들은 BAM을 진단하기 위한 새롭고 개선된 방법을 개발했다.
바람직한 실시예에서, 본 발명의 방법은 북유럽과 같은, 바람직하게는 아일랜드와 같은 유럽에 거주하는 환자들 또는 유럽, 북유럽 또는 아일랜드식 식단을 하는 환자들을 진단하는데 사용하기 위한 것이다. 본 예들은 본 발명의 방법들이 이러한 환자들에게 특히 효과적임을 보여준다. 다른 실시예에서, 환자가 미국에 거주할 수 있다.
본 발명의 임의의 측면의 특정 실시예에서, 박테리아, 유전자 또는 대사산물의 풍부도는 대조군(비-BAM) 개인에 대해 평가된다. 이러한 기준값들은 당업계에 확립된 임의의 기술을 이용하여 생성될 수 있다.
본 발명의 임의의 측면의 특정 실시예에서, 대조군(비-BAM) 개인의 해당 시료와 비교하는 것은 건강한 개인의 해당 시료와 비교한 것이다.
상기 BAM을 진단하는 방법은 바람직하게는 40% 초과(예: 45%, 50% 또는 52% 초과, 예: 53% 또는 58%)의 민감도 및 90% 초과(예: 93% 또는 95% 초과, 예: 96%)의 특이도를 가지고 있다.
특정 실시예에서, 상기 진단 방법은 BAM 치료 과정을 모니터링하는 방법이다.
특정 실시예에서, 대변 시료에서와 같이, 박테리아의 존재 또는 풍부도를 검출하는 단계는, 핵산 기반 정량 방법론, 예를 들어, 16s rRNA 유전자 앰플리콘 서열분석을 포함한다. 16s rRNA 유전자 앰플리콘 서열분석을 이용하여 시료에서 박테리아의 정성적 및 정량적 분석을 위한 방법들은 문헌에 설명되어 있으며 당업자에게 잘 알려질 것이다. 다른 기법들은 PCR, rtPCR, qPCR, 고처리량 서열분석, 메타전사체학 서열분석, 또는 16S rRNA 분석을 포함 할 수 있다.
본 발명의 임의의 실시예들의 대안적인 측면에서, 본 발명은 BAM 발병 위험을 진단하기 위한 방법을 제공한다.
본 발명의 임의의 실시예에서, 박테리아 균주, 종 또는 대사산물의 모듈화된 풍부도가 BAM을 나타낸다. 바람직한 실시예에서, 시료 내의 총 미생물군집체에 대한 비율로서의 박테리아 균주, 종들 또는 OTU의 풍부도가 상기 균주, 종들 또는 OTU의 상대적 풍부도를 결정하기 위해 측정된다. 바람직한 실시예에서, 대사산물의 농도가 측정된다. 바람직한 실시예에서, 시료 내의 총 미생물군집체에 대한 비율로서의 박테리아 균주의 풍부도가 상기 균주들의 상대적 풍부도를 결정하기 위해 측정된다. 그 후, 이러한 바람직한 실시예에서, 상기 시료 내의 박테리움 또는 OTU의 상대적 풍부도나 상기 대사산물의 농도 또는 유전자 서열이 기준 대조군(비-BAM) 개인의 동일한 시료 내의 상대적 풍부도나 농도와 비교된다. 시료 내의 박테리움 또는 OTU의 상대적 풍부도의 차이, 예를 들어, 기준값에 비해 감소 또는 증가는, 모듈화된 상대적 풍부도이다. 본 명세서에 설명된 것처럼, 모듈화된 풍부도의 검출은 시료 풍부도 값을 절대 기준값과 비교하여 절대적인 방법으로 수행될 수도 있다. 따라서, 본 발명은 하나 이상의 BAM-관련 박테리아의 상대적 풍부도 및/또는 대사산물의 모듈화된 농도에 대해 개인의 생물학적 시료를 검정하는 단계를 포함하는 개인의 BAM 상태를 확인하는 방법을 제공하고, 박테리아의 모듈화된 상대적 풍부도 또는 대사산물의 모듈화된 농도가 BAM을 나타낸다. 유사하게, 본 발명은 하나 이상의 BAM-관련 구강 박테리아 또는 BAM-관련 대사산물의 상대적 풍부도에 대해 개인의 생물학적 시료를 검정하는 단계를 포함하는 개인이 BAM에 걸릴 증가된 위험을 갖는지 여부를 결정하는 방법을 제공하며, 모듈화된 상대적 풍부도 또는 농도가 증가된 위험을 나타낸다.
본 발명의 임의의 실시예에서, 박테리아를 검출하는 것은 "모듈화된 상대적 풍부도" 를 검출하는 것을 포함할 수 있다. 본 명세서에 사용된 바와 같이, 개인의 시료 내의 박테리아 또는 OTU에 적용되는 "모듈화된 상대적 풍부도"라는 용어는 기준 대조군(비-BAM) 개인의 동일한 시료 내의 상대적 풍부도(이하 "기준 상대적 풍부도”(reference relative abundance))와 비교하여 시료 내의 박테리아 또는 OTU의 상대적 풍부도 차이를 의미한다는 것을 이해해야 한다. 일 실시예에서, 상기 박테리움이나 OTU는 기준 상대적 풍부도에 비해 증가된 상대적 풍부도를 보인다. 일 실시예에서, 상기 박테리움이나 OTU는 기준 상대적 풍부도에 비해 감소된 상대적 풍부도를 보인다. 모듈화된 풍부도의 검출은 시료 풍부도 값을 절대 기준값과 비교하여 절대적인 방법으로 수행될 수도 있다. 일 실시예에서, 상기 기준 풍부도 값은 연령 및/또는 성 매칭된 개인에게서 얻어진다. 일 실시예에서, 상기 기준 풍부도 값은 상기 시료(즉, 켈트계, 북아프리카계, 중동계)와 동일한 모집단의 개인에게서 얻는다. 박테리아의 풍부도(즉, 하나 이상의 박테리아 균주)를 검출하는 방법과 같이, 구강 및 대변 시료에서 박테리아를 분리하는 방법이 하기에 기술되어 있다. 박테리아의 특정 종 또는 속을 분리하기 위한 임의의 적합한 방법이 사용될 수 있으며, 이러한 방법들은 당업자에게 자명할 것이다. 한천 플레이트 정량 검정, 형광 시료 정량, qPCR, 16S rRNA 유전자 앰플리콘 서열분석, 및 염료-기반 대사산물 고갈 또는 대사산물 생산 검정을 포함하여, 박테리아 풍부도를 검출하는 임의의 적절한 방법이 사용될 수 있다.
본 발명은 본 발명의 방법을 수행하기 위한 시약들을 포함하는 키트들, 예를 들어 하나 이상의, 예를 들어 위에서 설명한 두 개 이상의 박테리아 종, 유전자 또는 대사산물을 검출하기 위한 시약들을 포함하는 키트들을 또한 제공한다. 위에서 언급한 바와 같이, BAM을 진단하는 대상 방법을 실행하는 데 사용되는 키트들 또한 제공된다. 상기 키트는 개인의 생물학적 시료, 예를 들어, 소변 시료 또는 대변 시료를 채취하도록 구성될 수 있다. 상기 개인은 BAM을 가진 것으로 의심될 수 있다. 상기 개인은 BAM을 가질 위험이 증가된 것으로 의심될 수 있다. 키트는 생물학적 시료를 담도록 구성된 밀봉가능한 용기를 포함할 수 있다. 키트는 폴리뉴클레오타이드 프라이머들을 포함할 수 있다. 상기 폴리뉴클레오티드 프라이머는 적어도 하나의 BAM-관련 박테리아로부터의 16S rRNA 폴리뉴클레오티드 서열을 증폭하여 증폭된 16S rRNA 폴리뉴클레오티드 서열을 형성하도록 구성될 수 있다. 키트는 상기 증폭된 16S rRNA 서열을 검출하기 위한 검출 시약을 포함할 수 있다. 키트는 사용 설명서를 포함할 수 있다.
실시예
요약
배경 및 목적: BAM 진단은 SeHCAT 분석을 기반으로 한다. 일부 환자들은 미생물군집체에 변이를 가지고 있다. 따라서, 상기 상태에 대한 바이오마커를 식별하기 위해 미생물군유전체 및 대사체학 프로파일링이 수행되었다.
방법:
인체 공학, 의료 및 식단 정보가 미생물군유전체 및 대사체학 분석을 위해 대변 시료와 함께 수집되었다. 샷건 및 16S rRNA 앰플리콘 서열분석은 대변에 대해 수행되었으며, 기체 크로마토그래피(GC) - 및 액체 크로마토그래피(LC) 질량분광법(MS)을 통해 대변 대사산물이 분석되었다. 담즙산 흡수장애(BAM)는 방사선표지된 75셀레늄(Se) 호모콜산 타우린(SeHCAT)의 유지에 의해 설사 환자에서 확인되었다.
결과: BAM은 대변 대사체학에 의해 IBS 내에서 정확하게 구분되었다.
결론: BAM은 IBS의 종-, 메타유전체학 및 대변 대사체학-특징에 의해 식별될 수 있다. 이러한 발견들은 BAM을 진단하고 IBS 및 BAM에 대한 정밀 치료법을 개발하는 데 유용하다.
실시예 1 - 담즙산 흡수장애(BAM)가 있는 IBS 환자의 대변 미생물군유전체 및 대사체 분석
재료 및 방법
피험자 모집: IBS가 로마 IV 기준에 부합하는 16-70세 환자 80명이 코크 대학교 병원에 모집되었다. 환자들의 임상 아형(21)은 다음과 같았다: 변비가 있는 IBS(IBS-C), 혼합 IBS(IBS-M) 또는 설사가 있는 IBS(IBS-D). 같은 연령대 및 같은 민족성과 지리적 지역의 65개 대조군이 모집되었다. 연구 모집단에 대한 기술적 통계는 표 4에 제시되어 있다.
제외 기준은 연구 등록 전 6주 이내에 항생제 사용, 위장 질환, 심각한 정신 질환, 탈장 치료 또는 맹장 수술 이외의 복부 수술을 포함한 다른 만성 질환들을 포함하였다. 최근의 결과가 없는 경우 모든 참가자들을 대상으로 표준-치료-혈액 분석이 실시되었으며, 모든 피험자들은 셀리악 질환을 배제하기 위해 혈청학 검사를 받았다. 대조군에 대한 포함/제외 기준은 IBS에 대한 로마 IV 기준을 충족해야 하는 경우를 제외하고 IBS 모집단의 포함/제외 기준과 동일하였다. 위장관(GI) 증상 이력, 심리적 증상, 식단, 병력 및 약물 데이터를 각 참가자(IBS 및 대조군 모두)에 대해 수집하였고 다음 설문지를 사용하였다: 브리스톨 대변 점수(BSS), 병원 불안 및 우울증 척도(HADS)(22); 음식 빈도 설문지(FFQ)(23). 동의한 대조군 피험자 아집단 뿐만 아니라 설사를 보고한 IBS-D 및 IBS-M 환자들이 박테리아에 의해 대사되지 않고 장간순환을 통해 내인성 담즙산으로 전달되는 BAM의 임상적 진단에 사용되는 방사선 표지된 담즙산인, SeHCAT에 의해 담즙산 흡수장애가 평가되었다. 본 연구를 시작하기 전에 코크 연구 윤리 위원회(프로토콜 번호: 4DC001)에서 연구에 대한 윤리적 승인을 받았으며 모든 참가자는 참여에 대해 서면 동의서를 제공하였다.
시료 채취: 모든 참가자들로부터 미생물군유전체 및 대사체학 프로파일링을 위해 대변 및 소변 시료가 채취되었다. 신선한 소변 시료를 수집한 당일, 피험자들은 수집 키트를 사용하여 집에서 갓 배뇨된 대변 시료를 수집하고 시료를 병원으로 가져왔다. 시료 수집 후 몇 시간 내에 -80℃에서 보관하기 위해 실험실로 가져올 때까지 시료들은 4℃에 보관되었다.
미생물군유전체 프로파일링 및 메타유전체학: 브라운 등(24)에 의해 기술된 방법을 이용하여 냉동 대변 시료(0.25g)에서 게놈 DNA를 추출하고 증폭했다. 브라운 등(18)에 의해 기술된 방법의 수정에는 0.1mm 지르코니아 비드 0.5g과 3.5mm 유리 비드 4개로 구성된 비드 비팅 튜브가 포함되었다. 대변 시료는 3 x 60초 주기 동안 비드 비팅을 통해 균질화되었고 각 주기 사이에 얼음 위에서 냉각되었다. 게놈 DNA는 0.8%의 아가로스 겔에 시각화되어 SimpliNano Spectrometer(Biochrom™, 미국)를 사용하여 정량화되었다. PCR 마스터 믹스는 2X Phusion Taq High-Fidelity Mix(Thermo Scientific, 아일랜드) 및 15ng의 DNA를 사용했다. PCR 결과 생성물들은 MiSeq(2×250 bp) 화학 플랫폼의 상용 공급업체(GATC Biotech AG, 독일, 콘스탄츠)에 서열분석을 보내기 전에 정제되고, 정량화되었으며 각 앰플리콘의 동일몰수의 양이 풀링되었다. 서열분석은 독일 GATC Biotech에서 2 × 250bp의 페어드 엔드 시퀀싱 실행을 사용한 Illumina MiSeq 기기에서 수행되었다.
미생물군유전체 프로파일링 및 메타유전체학 - 16S 앰플리콘 서열분석: Qiagen DNeasy Blood & Tissue Kit를 사용하고 제조업체의 설명서에 따라, 144개의 냉동 대변 시료(IBS: n = 80 및 대조군(n = 64) 각각의 0.25g에서 미생물 DNA를 추출했다. 하나의 대조군 피험자에 대한 대변 시료가 유용하지 않았다. 16S rRNA 유전자 앰플리콘의 준비 및 서열분석은 Illumina(미국, 캘리포니아주, 샌디에이고)에서 개발한 16S 시퀀싱 라이브러리 프레퍼레이션 넥스테라(Sequencing Library Preparation Nextera) 프로토콜을 사용하여 수행되었다. 각 DNA 대변 추출물 15ng은 PCR 및 다음 유전자-특이적 프라이머들을 사용하여 16S rRNA 유전자의 V3-V4 가변 영역을 표적화하는 프라이머를 사용하여 증폭시켰다:
16S 앰플리콘 PCR 정방향 프라이머(S-D-Bact-0341-b-S-17) = 5': (서열번호: 44)
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG
16S 앰플리콘 PCR 역방향 프라이머(S-D-Bact-0785-a-A-21) = 5': (서열번호: 45)
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC
상기 앰플리콘 크기는 531bp였다. 상기 생성물들은 정제되고 정방향 및 역방향 바코드들이 두 번째 라운드의 어댑터 PCR에 의해 부착되었다.
미생물군유전체 프로파일링 및 메타유전체학-샷건 서열분석: 게놈 DNA는 위에서 기술한 대로 추출되었다. DNA 품질은 0.8% 아가로스 겔에서 확인되었으며 Simplinano(Thermo Scientific, 아일랜드)를 사용하여 정량화되었다. 샷건 서열분석의 경우, 2 × 250 bp 페어드-엔드(paired-end) 화학을 사용하는 Illumina HiSeq 플랫폼(HiSeq 2500)에서 서열분석을 하기 위해 각 시료에 대해 1μg(농도 >5 ng/μl)의 고분자량 DNA를 독일 GATC Biotech로 보냈다. 이 결과는 2,714,158,144개의 원시 판독(2,612,201,598개의 처리된 판독)으로 반환되었으며, 그 중 45.6%는 시료 당 평균 222,945개의 유전자 패밀리에 매핑되었으며 평균 카운트 값은 시료 당 8,924,302 ± 2,569,353 이었다.
생물정보학 분석(16S 앰플리콘 서열분석): 144명의 피험자에 대한 Miseq 16S 서열분석 데이터가 반환되었다. 3개의 시료들(2개의 IBS 및 1개의 대조군)에 대해 생성된 데이터는 서열분석에서 반환된 판독 수가 분석하기에 너무 적기 때문에 제거되어, 141개(대조군: n = 63, IBS n = 78)의 시료가 남게 되었다. 원시 앰플리콘 시퀀스 데이터가 병합되었고 플래시 방법(25)을 사용하여 상기 판독들이 트리밍되었다. USEARCH 파이프라인은 OTU 표를 생성하는 데 사용되었다(26). UPARSE 알고리즘은 97% 유사성으로 서열들을 OTU들에 클러스터링하는 데 사용되었다(27). UCHIME 키메라 제거 알고리즘은 키메라슬레이어(Chimeraslayer)와 함께 키메라 서열들을 제거하는데 사용되었다(28). 리보솜 데이터베이스 프로젝트(RDP) 분류체계 분류기는 대표적인 OTU 서열들에 분류체계를 할당하는 데 사용되었고(26) 미성물군집체 조성(풍부도 및 다양성) 정보가 생성되었다.
생물정보학 분석(샷건 메타유전체학 서열분석): 샷건 메타유전체학의 경우, QC를 통과하지 못했거나 사용 가능한 시료가 없기 때문에 6개의 대조군 시료는 서열 분석되지 않았다(대조군: n=59; IBS n=80). 서열분석 후 얻은 원시 판독 쌍 수는 5,247,013에서 21,280,723까지 다양하였다(평균 = 9,763,159 ± 2,408,048). 판독은 인간 미생물군유전체 프로젝트(HMP) 컨소시엄의 표준 운영 절차에 따라 처리되었다(29). 메타유전체학 조성 및 기능적 프로파일들은 HUMAnN2 파이프라인을 사용하여 생성되었다(30). 각 시료에 대해, 다음을 포함하는 다중 프로파일들이 얻어졌다: 계통-특이적 유전자 정보(MetaPhlAn2 사용) 및 유전자 패밀리 풍부도에서 얻은 미생물 조성 프로파일들.
대변 GC/LC MS: 냉동 대변 1g의 시료들을 드라이아이스하여 독일 포츠담에 있는 Metabolomic Discoveries(현재 Metabolon)로 보냈다. LC-MS를 위해, 시료들은 건조되고 분석 전에 400μl 당 10mg의 최종 농도로 재부유되었다. GC-MS 및 SCFA 분석은 습식 시료를 사용하여 수행되었다. 비표적 대사체학 분석은 액체 크로마토그래피(LC) 및 고체상 미세 추출(SPME) 가스 크로마토그래피(GC)를 사용하여 수행되었으며, 대사산물은 전기분무 이온화 질량분광법(ESI-MS)을 사용하여 확인되었다. SCFA 분석은 LC-탠덤 질량분석법을 통해서도 수행되었다.
대변 대사체 데이터의 생물정보학 분석: 모든 IBS 피험자(n=80)와 QC를 통과하지 못했거나 시료를 사용할 수 없어 2개의 시료를 제외한 모든 대조군(n=63)에 대해 대변 MS 대사체학 데이터가 반환되었다. 서비스 제공자가 수행한 비표적 대변 대사체학 분석에서 2,933개의 대사산물이 반환되었으며 그 중 753개가 확인되었다. 시료 준비 과정에서 대변 시료가 이미 건조 중량(400μl 당 10mg)으로 정규화되었으므로, LC-MS를 사용하여 확인된 대사산물은 정규화시키지 않았다. GC-MS를 사용하여 확인된 대사산물은 해당 시료 습식 무게로 정규화시켰다. 추가 분석에는 확인된 대사산물만 고려되었다. 기계 학습 분석은 하기에 기술한 바와 같이 수행되었다. 모든 데이터세트에 대한 요약 통계는 다중 테스트를 위한 q-값 조정과 함께 윌콕슨 순위 합계 테스트를 이용하여 생성되었다.
BAM SeHCAT 검정: SeHCAT은 0.1mg 미만의 타우로셀콜산(GE Healthcare, 영국)을 포함하는 단일 캡슐 용량으로 기준일에 370kBq의 방사능 용량으로 코크 대학 병원에서 투여되었다. 캡슐 투여 2-3시간 후 시준 되지 않은 감마 카운터(지멘스 이캠 카메라)를 사용한 기준 전신 흡수 판독이 각 피험자에 대해 이루어졌다. 7일 후에 후속 스캔이 실시되었으며 담즙산 유지(retension) 비율이 계산되었다; 왓슨 등에 의해 논의된 경계성 분류를 나타내는 15-20% 의 SeHCAT 점수와 더불어 <15% 유지 값은 경증에서 중증 BAM을 나타내었다. (31).
기계 학습: 사내 기계 학습 파이프라인이 최소 절대 수축 및 선택 연산자(LASSO) 특성 선택에 이어 랜덤 포레스트(RF) 모델링을 적용하는 2단계 접근방식을 사용하여 각 데이터 유형(16S, 샷건 및 BAM-대변 MS 대사체학)에 적용되었다(32). 상기 모델들은 LASSO 특성 선택을 위한 패키지 글름넷 버전 2.0-10, 및 RF 패키지 랜덤 포레스트(randomForest) 버전 4.6-12를 사용한 R 소프트웨어 버전 3.4.0을 사용하여 구현되었다.
먼저, 특성 선택은 LASSO 알고리즘을 이용하여 관련 특성들을 효율적으로 선택하여 모델들의 정확도와 해석 가능성을 개선하도록 실행되었다. 그리드 검색을 사용하여 각 데이터 세트에 최적화된, 람다 매개 변수에 의해 이 프로세스는 조정되었다. 훈련 데이터는 LASSO 알고리즘에 의해 선택된 특성들만을 포함하도록 필터링되었으며, RF는 그 뒤 1500개의 트리가 구축되는 모델링에 사용되었다. 시료들의 IBS 또는 대조군 분류를 예측하는 최적의 모델을 산출한 내부 10-배 예측을 생성했던, 10-배 교차 검증(CV)을 이용하여 LASSO 특성 선택과 RF 모델링이 수행되었다.
BAM-대변 대사체학 데이터 분석을 위해, 10-배 교차-검증 대신, 모든 교차-검증 단계에서 리브-원-아웃(LOO) CV를 사용되었다는 것만 다른 유사한 방식으로 기계 학습이 수행되었다
모델 1; IBS 및 대조군 피험자의 BAM(경계성에서 중증 BAM 또는 SeHCAT 유지<20%) 또는 정상 담즙산(SeHCAT 유지>20%).
모델 2; IBS 피험자만의 BAM(경증에서 중증 BAM 또는 SeHCAT 유지<15%) 또는 정상 담즙산(SeHCAT 유지>20%).
데이터 유형의 공-관성 분석: 미생물군유전체 파생 데이터 세트들은 헬링거(Hellinger) 변환되었다. 공-관성 분석은 R(v 3.2.0)의 ade4(v. 1.7.2) 패키지를 사용하여 수행되었다. 비교 쌍의 각 프로파일에 대해 주 성분 분석(PCA)이 수행된 다음, 처음 5개의 주축에서 이러한 PCA 개체들에 대한 공-관성 분석이 이어졌다. 공-관성의 유의성은 랜드태스트(randtest) 함수를 이용한 순열 테스트에 의해 계산되었다.
결과
담즙산 흡수장애가 있는 IBS 환자는 대변 미생물군집체를 변화시켰다
IBS-D를 가진 환자들 중 일부는 통과 시간과 아마도 미생물군유전체 조성에 영향을 미칠 담즙산 흡수장애(BAM)가 있을 수 있으므로, IBS-D를 가진 환자 21명 중 19명, IBS-M을 가진 피험자들 29명 중 26명 및 대조군 65명 중 9명이 BAM 확인을 위한 황금 표준인, SeHCAT 유지 테스트를 받았다(33). 현재 지침에 따라(34), 표지된 담즙산 유사체의 >15% 유지 실패는 BAM으로 분류되었고, 10-15% 유지는 경증 BAM으로, 5-10%는 중등도 BAM, <5%는 중증 BAM으로 분류되었다(도 1a).
테스트된 IBS 환자 45명 중 18명(54%)이 BAM으로 진단되었으며, 그 중 4명은 중증 BAM, 7명은 중등도 BAM, 7명은 경증 BAM을 가지고 있었다. 추가로 5명의 환자는 경계성 BAM(16-20% 유지)이었다. 15% 임계값을 사용하여, 테스트된 IBS 모집단의 40%에서 양성 BAM 분류가 보고되었다. 하나의 대조군 피험자에서 경증 BAM이 확인되었으며, 이후 IBS로 진단되었다. 예상했던 바와 같이, 양성 BAM 진단은 IBS-M(35%)보다 IBS-D(74%)에서 더 일반적이었다(p-값 = 0.03)(도 1b).
중증 BAM 범주에 속하는 IBS 환자들만이 그들의 미생물군집체와 정상, 경증, 중등도 또는 경계성 BAM 진단을 받은 환자들의 미생물군집체가 뚜렷이 다른 차이를 보여주었다(설명된 분석을 사용, 도 1c 참조). BAM의 생물학적 영향을 추가 조사하기 위해, GC- 및 LC-MS(위에서 설명한 대로)에 의한 비표적 대변 대사산물 분석이 수행되었다. 중증 BAM 진단을 받은 IBS 환자의 대변 대사체는 SeHCAT 검정을 받은 IBS 환자의 다른 BAM 부류들의 대변 대사체와 상당히 달랐다(도 1D). 대변 대사체 데이터에 적용된 기계 학습은 IBS 환자 및 대조군의 테스트 세트에서 모든 BAM 부류들(경계성 포함)을 감지하기 위해 0.92의 AUC로 BAM을 성공적으로 예측하였다; 상기 모델은 중증 및 중등도 BAM에 대해 100%, 경증 BAM에 대해 62.5%, 경계성 BAM에 대해 60% 정확도(민감도: 0.80 및 특이도: 0.86)로 수행되었다(도 2 및 표 1). BAM을 예측하는 주요 대사산물들은 L-라이신, 2개의 글리세로포스포리피드와 담즙산(우르소데옥시콜산(UDCA))을 포함했다. 이러한 범주의 화합물의 증가된 수준은 변화된 지방산 대사 및 질병과 관련이 있다(35, 36).
미생물군유전체 OTU 데이터세트에 적용된 기계 학습이 BAM을 확인하였다(AUC: 0.95, 민감도: 0.88 및 특이도: 0.93)(표 2). 상기 대사체학 모델은 중증 및 중등도 BAM에 대해 100% 정확도로 수행되었지만, 상기 OTU 모델은 상기 대변 대사체학 모델(9개)에 비해 오분류(5개)가 더 적었다. 모델들 간에 오분류된 피험자들은 중첩되지 않았는데, 이는 결합된 미생물군유전체-대사체 모델이 BAM 예측 정확도를 높일 수 있음을 의미한다.
논의
심각한 담즙산 흡수장애가 있는 IBS-D 및 IBS-M 환자의 아집단은 변화된 미생물군유전체 및 대변 대사체가 있는 것으로 나타났다.
IBS 임상적 아형 간의 미생물군유전체는 상당히 다르지 않고, 이러한 범주에 환자를 배정하는 임상적 유용성에 대해서 논란의 여지가 있다. 그러나. BAM을 가진 IBS-D 및 IBS-M 환자의 아집단은 대사체적 특징으로 구별할 수 있는 것으로 확인되었다. 다른 저자들은 IBS-D에서 미생물군집체가 변했다고 보고했지만 BAM 분류는 하지 않았다(15). 또한 통과 시간(Bristol Stool Score에 의해 반영된)은 미생물군집체 조성과 더불어 주요 공-변량이지만(37) IBS 환자의 혼합, 변비 및 설사 아형들 사이를 번갈아 가며 나타나는 경향은, 통과 시간과 미생물군집체의 연관성을 가리거나 '평균화'할 수 있다는 점도 주목할 만한다. 그럼에도 불구하고, 세 가지 아형 모두 일반적인 대변 미생물군유전체 특징에 의해 대조군과 구별될 수 있다. BAM은 테스트된 결합 IBS-D 및 M 피험자들 절반의 초과에서 SeHCAT에 의해 검출되었다. 미생물군유전체의 차이는 중증 BAM 그룹에서 가장 뚜렷하였다. BAM이 있는 상당한 수의 인식할 수 없는 피험자의 존재는 다양한 IBS 치료법을 사용한 이전 임상시험에서 위약에 비해 치료 성공률이 낮은 데 기여했을 수 있다(38). 중증 BAM 범주에 속하는 피험자들은 상당히 변형된 미생물군유전체를 가지고 있었지만, 모든 BAM 진단 피험자에 대해 대변 대사체학 특징이 확인되었다. BAM에 대한 이 대변 대사체학 특징은 SeHCAT(현재 미국에서 사용할 수 없음)보다 더 편리하고, 접근이 더 용이하며 더 저렴한 기기를 필요로 하므로 임상적으로 즉시 적용될 것이다.
실시예 2 - 대체 기계 학습 파이프라인을 이용한 담즙산 흡수장애(BAM)가 있는 IBS 환자의 대변 대사체 분석
재료 및 방법
피험자 모집: IBS가 로마 IV 기준에 부합하는 16-70세 환자 80명이 코크 대학교 병원에 모집되었다. 환자들의 임상 아형(21)은 다음과 같다: 변비가 있는(IBS-C), 혼합 IBS(IBS-M) 또는 설사가 있는 IBS(IBS-D). 같은 연령대와 같은 민족성과 지리적 지역의 65개 대조군이 모집되었다. 연구 모집단에 대한 기술적 통계는 표 4에 제시되어 있다.
제외 기준에는 연구 등록 전 6주 이내의 항생제 사용, 위장 질환을 포함한 기타 만성 질환, 중증 정신 질환, 탈장 복구 또는 충수 절제술 이외의 복부 수술이 포함되었다. 최근의 결과가 없는 경우 모든 참가자를 대상으로 표준-치료- 혈액 분석이 실시되었으며, 모든 피험자들은 셀리악 질환을 배제하는 검사를 받았다. 대조군에 대한 포함/제외 기준은 IBS에 대한 로마 IV 기준을 충족해야 하는 경우를 제외하고 IBS 모집단의 포함/제외 기준과 동일하였다. 위장관(GI) 증상 이력, 심리적 증상, 식단, 병력 및 약물 데이터를 각 참가자(IBS 및 대조군 둘다)에 대해 수집하였고 다음 설문지를 사용하였다: 브리스톨 대변 점수(BSS), 병원 불안 및 우울증 척도(HADS)(22); 음식 빈도 설문지(FFQ)(23). 동의한 대조군 피험자 아집단 뿐만 아니라 설사를 보고한 IBS-D 및 IBS-M 환자들이 박테리아에 의해 대사되지 않고 장간순환을 통해 내인성 담즙산으로 전달되는 BAM의 임상적 진단에 사용되는 방사선 표지된 담즙산인, SeHCAT에 의해 담즙산 흡수장애가 평가되었다. 연구를 시작하기 전에 코크 연구 윤리 위원회(프로토콜 번호: 4DC001)에 의해 연구에 대한 윤리적 승인이 허가되었으며 모든 참가자들이 참여에 대한 서면 동의서를 제공하였다.
시료 채취: 대사체학 프로파일링을 위해 대변 시료와 소변 시료가 모든 참가자들로부터 채취되었다. 신선한 소변 시료를 수집한 당일, 피험자들은 수집 키트를 사용하여 집에서 갓 배뇨된 대변 시료를 수집하고 시료를 병원으로 가져왔다. 시료 수집 후 몇 시간 내에 -80℃에서 보관하기 위해 실험실로 가져올 때까지 시료들은 4℃에 보관되었다.
대변 GC/LC MS: 냉동 대변 1g의 시료들을 드라이아이스하여 독일 포츠담에 있는 Metabolomic Discoveries(현재 Metabolon)로 보냈다. LC-MS의 경우, 시료는 건조되고 분석 전에 400μl 당 10mg의 최종 농도로 재부유되었다. GC-MS 및 SCFA 분석은 습식 시료를 사용하여 수행되었다. 비표적 대사체학 분석은 액체 크로마토그래피(LC) 및 고체상 미세 추출(SPME) 가스 크로마토그래피(GC)를 사용하여 수행되었으며, 대사산물은 전기분무 이온화 질량분광법(ESI-MS)을 사용하여 확인되었다. SCFA 분석은 LC-탠덤 질량분석법을 통해서도 수행되었다.
대변 대사체 데이터의 생물정보학 분석: 모든 IBS 피험자(n=80)와 QC를 통과하지 못했거나 시료를 사용할 수 없어 2개의 시료를 제외한 모든 대조군(n=63)에 대해 대변 MS 대사체학 데이터가 반환되었다. 서비스 제공자가 수행한 비표적 대변 대사체학 분석에서 2,933개의 대사산물이 반환되었으며 그 중 753개가 확인되었다. 시료 준비 과정에서 대변 시료가 이미 건조 중량(400μl 당 10mg)으로 정규화되었으므로, LC-MS를 사용하여 확인된 대사산물은 정규화시키지 않았다. GC-MS를 사용하여 확인된 대사산물은 해당 시료 습식 무게로 정규화시켰다. 추가 분석에는 확인된 대사산물만 고려되었다. 기계 학습 분석은 하기에 기술한 바와 같이 수행되었다. 모든 데이터세트에 대한 요약 통계는 다중 테스트를 위한 q-값 조정과 함께 윌콕슨 순위 합계 테스트를 이용하여 생성되었다.
BAM SeHCAT 검정: SeHCAT은 0.1mg 미만의 타우로셀콜산(GE Healthcare, 영국)을 포함하는 단일 캡슐 용량으로 기준일에 370kBq의 방사능 용량으로 코크 대학 병원에서 투여되었다. 캡슐 투여 2-3시간 후 시준 되지 않은 감마 카운터(지멘스 이캠 카메라)를 사용한 기준 전신 흡수 판독이 각 피험자에 대해 이루어졌다. 7일 후에 후속 스캔이 실시되었으며 담즙산 유지(retension) 비율이 계산되었다; 왓슨 등(2015)(31)에 의해 논의된 경계성 분류를 나타내는 15-20%의 SeHCAT 점수와 더불어 <15% 유지 값은 경증에서 중증 BAM을 나타내었다.
기계 학습: 사내 기계 학습 파이프라인이 대변 대사체학 데이터에 적용되었다. 이 예에 사용된 기계 학습 파이프라인은 예 1에 사용된 기계 학습 파이프라인과 유사하지만, 10-배 교차-검증 내에서 2단계 접근 방식을 사용하여, 추가 최적화 및 검증 단계를 포함한다. 각 검증 폴드 내에서 최소 절대 수축 및 선택 연산자(LASSO) 특성 선택이 수행된 후 랜덤 포레스트(RF) 모델링이 뒤따랐고 교차-검증 교육 아집단 외부에 있는 교차-검증 테스트 데이터에 대해 최적화된 모델이 검증되었다.
상기 모델들은 LASSO 특성 선택을 위한 패키지 글름넷 버전 2.0-10, 및 RF 패키지 랜덤 포레스트(randomForest) 버전 4.6-12를 사용한 R 소프트웨어 버전 3.4.0을 사용하여 구현되었다.
대변 대사체 시료 프로파일은 기계 학습 파이프라인에서 분석되기 전에 log10 변환되었다. SeHCAT 정보가 있는 IBS 시료들만 변환되었다. 그 후 경계성 BAM이 있는 시료들이 제거되고, 나머지 시료들이 BAM(19개 시료) 또는 정상(21개 시료)으로 분류되었다. 그 후 분류된 시료들이 기계 학습 파이프라인에서 분석되었다.
도 3은 이 예에 사용된 기계 학습 파이프라인을 보여준다. 분류된 대변 대사체 시료 프로파일들은 먼저 교육 세트와 테스트 세트로 분할되었다. 그 후 교육 세트는 LASSO 알고리즘에 사용할 최적의 람다(λ) 범위를 생성하는데 사용되었다. 최적의 람다(λ) 범위는 앞서 기술한 교차-검증된 LASSO와 글름넷 패키지(버전 2.0-18)를 사용하여 생성되었다. 최적의 람다(λ) 범위의 사전-결정은 파이프라인 실행 계산 시간을 줄여주고 사용자가 상기 범위를 수동으로 지정할 필요를 줄여준다.
람다(λ) 범위를 결정한 후, 그들의 부류 확률에 따라 시료들에 가중치가 할당되었다. 이 단계에서 교육 시료에 할당된 가중치는 이후의 모든 해당 단계에서 사용되었다.
그 후 실시예 1에 기술된 대로 LASSO 알고리즘이 가중된 교육 시료들에 적용되었다. 이 예에서, 상기 LASSO 알고리즘은 이전에 계산된 최적의 람다(λ) 범위를 사용하였으며, 캐럿(Caret)(이 예에서는 버전 6.0-84) 및 글름넷(이 예에서는 버전 2.0-18) 패키지를 사용하였고, 상기 ROC AUC(수신자조작특성, 곡선아래면적) 메트릭은 리브-원-아웃 교차 검증을 이용하여 계산되었다. 리브-원-아웃 교차 검증은 모델 최적화에 사용할 수 있는 시료들의 수를 최대화하기 위해 사용되었다. 상기 최적화된 LASSO 알고리즘에 의해 확인된 특성 계수들이 추출되었고, 알고리즘이 추출되었으며 추가 분석을 위해 계수가 0이 아닌 특성들이 선택되었다. 도 3에서, N은 상기 LASSO 알고리즘에 의해 반환된 특성들의 수를 나타낸다. LASSO에 의해 선택된 특성들의 개수가 5보다 작은 경우, 그 후 랜덤 포리스트를 생성하기 위해 모든 특성들(pre-LASSO)이 사용되었다, 즉, 상기 LASSO 필터링은 상기 랜덤 포리스트 생성기에 의해 무시되었다. LASSO에 의해 선택된 특성들의 개수가 5 이상 인 경우, 그 후 LASSO에 의해 선택된 특성들 만이 상기 랜덤 포리스트 생성을 위해 사용되었다.
LASSO를 이용한 특성 선택에 이어, 상기 선택된 특성들을 이용하여 최적화된 랜덤 포리스트 분류기(트리 1500개 포함)가 생성되었다. 상기 ROC AUC 메트릭을 최대화하기 위해 'mtry' 매개변수를 조정하여, 캐럿(버전 6.0-84) 및 내부 교차 검증을 이용하여 랜덤 포레스트 생성이 수행되었다. 그 후 상기 최적화된 랜덤 포리스트 분류자가 테스트 세트에 적용되었고 상기 분류자의 성능은 AUC, 민감도, 및 특이도 메트릭을 통해 계산되었다.
결과
대변 대사체는 BAM 부류들을 예측한다
시료들을 BAM 또는 비-BAM으로 분류할 수 있는 예측 능력에 대해 대변 대사체 프로파일이 연구되었다. 교차-검증은 리브-원-아웃 CV이었다. 리브-원-아웃 CV는 모델 최적화에 사용할 수 있는 시료들의 최대 수를 확인하는 데 사용되었다.
경계성 BAM 진단을 받은 환자는 제외한, SeHCAT 검정을 받은 IBS 환자의 대변 대사체 데이터 세트에 대한 기계 학습. 상기 예측 모델은 세 가지 BAM 등급 모두에서 AUC가 0.85인 BAM을 가진 피험자를 성공적으로 확인하였다. 상기 모델은 중증 BAM의 경우 100%, 중등도 BAM의 경우 75%, 경증 BAM의 경우 43%의 정확도로 수행되었다. 성능 요약 및 특성 세부사항은 표 7에 기술되어 있으며, 도 4에 보여준다. LASSO에 의해 선택된 계수가 0보다 작은 특성들은 BAM과 연관되고 양의 계수는 정상과 연관된다. 상기 교차-검증 결과는 상기 대변 대사체 프로파일이 BAM을 예측한다는 것을 암시한다. 전체 테스트 성능은 AUC 0.852, 민감도 0.684, 특이도 0.762, 정확도 0.725로, 11개의 오분류가 있었다(표 7).
분류 임계값은 pROC 패키지(버전 1.15.0) 및 Youden J 점수를 사용하여 최대 민감도 및 특이도를 달성하도록 최적화되었다. 민감도 및 특이도에 대해 최적화되어 얻은 값은 각각 0.684 및 0.904이었다.
이 파이프라인을 사용하여 BAM 예측으로 확인된 대사산물들은 표 7에 나와 있다. 주요 예측 대사산물 중에는 다양한 글리세로인지질들이 있었다. 이러한 화합물의 농도 상승은 변화된 지방산 대사 및 질환과 관련이 있다. BAM을 예측하는 주요 대사산물 중에는 1,3-di(5Z, 8Z, 11Z, 14Z, 17Z-에이코사펜타에노일)-2-하이드록시-글리세롤 (d5) 및 디메틸 벤질 카르비닐 부티레이트가 있었다.
논의
대변 대사산물이 IBS에서 BAM 상태를 예측한다는 것을 기계 학습 분석을 통해 보여주었다. 담즙산 흡수장애를 가진 IBS-D 및 IBS-M 환자의 아집단은 SeHCAT 테스트 없이 이러한 피험자들을 구별하는 데 잠재적으로 사용할 수 있는 변화된 대변 대사체가 있는 것으로 나타났다.
IBS 임상적 아형 간의 미생물군유전체는 상당히 다르지 않고, 이러한 범주에 환자를 배정하는 임상적 유용성에 대해서 논란의 여지가 있다. 그러나, BAM을 가진 IBS-D 및 IBS-M 환자의 아집단은 대사체적 특징으로 구별할 수 있는 것으로 확인되었다. 다른 저자들은 IBS-D에서 미생물군집체가 변했다고 보고했지만 BAM 분류는 하지 않았다(15). BAM은 테스트된 결합 IBS-D 및 M 피험자의 절반의 초과에서 SeHCAT에 의해 검출되었다. 미생물군유전체의 차이는 중증 BAM 그룹에서 가장 뚜렷했다. BAM이 있는 상당한 수의 인식할 수 없는 피험자의 존재는 다양한 IBS 치료법을 사용한 이전 임상시험에서 위약에 비해 치료 성공률이 낮은 데 기여했을 수 있다(38). 중증 BAM 범주에 속하는 피험자들은 상당히 변형된 미생물군유전체를 가지고 있었지만, 모든 BAM 진단 피험자에 대해 대변 대사체학 특징이 확인되었다. BAM에 대한 이 대변 대사체학 특징은 SeHCAT(현재 미국에서 사용할 수 없음)보다 더 편리하고, 접근이 더 용이하며 더 저렴한 기기를 필요로 하므로 임상적으로 즉시 적용될 것이다.
BAM의 대변 대사체학 시그니처(signature)에서 기술한 파이프라인은 SeHCAT보다 더 편리하고, 접근이 더 용이하며 비용이 더 저렴한 기기를 유사하게 활용하기 때문에 임상적으로도 적용될 것이다.
결론
본 연구의 발견은 임상적 의미가 있다. 대변 대사체학 프로파일은 비-BAM 관련 IBS와 정확하게 구별할 수 있는 BAM과 연관되어 있다.
본 명세서에서 확인된 BAM 피험자와 비-BAM 관련 IBS 피험자를 구별하는 상기 분류군 및 대사산물은 대변 이식, 항생제, 프로바이오틱스 또는 살아있는 생물 치료제와 같은 다양한 미생물군집체-지향적 치료법의 표적이 될 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
SEQUENCE LISTING <110> 4D PHARMA CORK LIMITED <120> METHODS OF DIAGNOSING DISEASE <130> P075199WO <150> EP19167114.8 <151> 2019-04-03 <150> EP19167118.9 <151> 2019-04-03 <150> GB1909052.1 <151> 2019-06-24 <150> GB1915156.2 <151> 2019-10-18 <150> GB1915143.0 <151> 2019-10-18 <160> 45 <170> SeqWin2010, version 1.0 <210> 1 <211> 440 <212> DNA <213> Blautia <400> 1 cctacgggtg gcagcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgaagg aagaagtatc tcggtatgta aacttctatc agcagggaag atagtgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgtaga cggactggca agtctgatgt 240 gaaaggcggg ggctcaaccc ctggactgca ttggaaactg ttagtcttga gtgccggaga 300 ggtaagcgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttactggacg gtaactgacg ttgaggctcg aaagcgtggg gagcaaacag 420 gattagatac cctggtagtc 440 <210> 2 <211> 460 <212> DNA <213> Bacteroides <400> 2 cctacggggg gctgcagtga ggaatattgg tcaatgggcg atggcctgaa ccagccaagt 60 agcgtgaagg atgactgccc tatgggttgt aaacttcttt tataaaggaa taaagtcggg 120 tatgcatacc cgtttgcatg tactttatga ataaggatcg gctaactccg tgccagcagc 180 cgcggtaata cggaggatcc gagcgttatc cggatttatt gggtttaaag ggagcgtaga 240 tggatgttta agtcagttgt gaaagtttgc ggctcaaccg taaaattgca gttgatactg 300 gatgtcttga gtgcagttga ggcaggcgga attcgtggtg tagcggtgaa atgcttagat 360 atcacgaaga actccgattg cgaaggcagc ctgctaagct gcaactgaca ttgaggctcg 420 aaagtgtggg tatcaaacag gattagatac cccagtagtc 460 <210> 3 <211> 439 <212> DNA <213> Clostridiales <400> 3 cctacggggg gctgcagtgg ggaatattgc acaatgggcg aaagcctgat gcagcaacgc 60 cgcgtgagcg aagaaggtct tcggatcgta aagctctgtc cttggggaag ataatgacgg 120 tacccttgga ggaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggaattatt gggcgtaaag agtgcgtagg tggttaccta agcagggggt 240 gaaaggcact ggcttaacca atgtcagccc cctgaactgg gtaccttgag tgcaggagag 300 gaaagcggaa ttcctagtgt agcggtgaaa tgcgtagata ttaggaggaa caccagtggc 360 gaaggcggct ttctggactg ttactgacac tgaggcacga aagtgtgggg agcaaacagg 420 attagatacc ccagtagtc 439 <210> 4 <211> 440 <212> DNA <213> Faecalibacterium <400> 4 cctacggggg gctgcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtggagg aagaaggtct tcggattgta aactcctgtt gttgaggaag ataatgacgg 120 tactcaacaa ggaagtgacg gctaactacg tgccagcagc cgcggtaaaa cgtaggtcac 180 aagcgttgtc cggaattact gggtgtaaag ggagcgcagg cgggaagaca agttggaagt 240 gaaatccatg ggctcaaccc atgaactgct ttcaaaactg tttttcttga gtagtgcaga 300 ggtaggcgga attcccggtg tagcggtgga atgcgtagat atcgggagga acaccagtgg 360 cgaaggcggc ctactgggca ccaactgacg ctgaggctcg aaagtgtggg tagcaaacag 420 gattagatac cccagtagtc 440 <210> 5 <211> 442 <212> DNA <213> Oscillibacter <400> 5 cctacggggg gctgcagtgg ggaatattgg gcaatggacg caagtctgac ccagcaacgc 60 cgcgtgaagg aagaaggctt tcgggttgta aacttctttt gtcagggaac agtagaagag 120 ggtacctgac gaataagcca cggctaacta cgtgccagca gccgcggtaa tacgtaggtg 180 gcaagcgttg tccggattta ctgggtgtaa agggcgtgca gccgggctgg caagtcaggc 240 gtgaaatccc agggctcaac cctggaactg cgtttgaaac tgctggtctt gagtaccgga 300 gaggtcatcg gaattccttg tgtagcggtg aaatgcgtag atataaggaa gaacaccagt 360 ggcgaaggcg gatgactgga cggcaactga cggtgaggcg cgaaagcgtg gggagcaaac 420 aggattagat accccggtag tc 442 <210> 6 <211> 440 <212> DNA <213> Lachnospiracea_incertae_sedis <400> 6 cctacggggg gctgcagtgg ggaatattgc acaatggagg aaactctgat gcagcgacgc 60 cgcgtgagtg aagaagtaat tcgttatgta aagctctatc agcagggaag atagtgacgg 120 tacctgacta agaagctccg gctaaatacg tgccagcagc cgcggtaata cgtatggagc 180 aagcgttatc cggatttact gggtgtaaag ggagtgtagg tggccatgca agtcagaagt 240 gaaaatccgg ggctcaaccc cggaactgct tttgaaactg taaggctgga gtgcaggagg 300 ggtgagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc tcactggact gtaactgaca ctgaggctcg aaagcgtggg gagcaaacag 420 gattagatac cccagtagtc 440 <210> 7 <211> 440 <212> DNA <213> Lachnospiraceae <400> 7 cctacggggg gcagcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgaagg aagaagtatt tcggtatgta aacttctatc agcagggaag aaaatgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgtagg cggtctgaca agtcagaagt 240 gaaagcccgg ggctcaactc cgggactgct tttgaaactg ccggactaga ttgcaggaga 300 ggtaagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttactggact gtaaatgacg ctgaggctcg aaagcgtggg gagcaaacag 420 gattagatac ccgtgtagtc 440 <210> 8 <211> 440 <212> DNA <213> Lachnospiraceae <400> 8 cctacgggtg gctgcagtgg ggaatattgc acaatggggg aaaccctgat gcagcaacgc 60 cgcgtgagtg aagaagtatt tcggtatgta aagctctatc agcaggaaag aaaatgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgtaga cggtgaggca agtctgaagt 240 gaaatgccgg ggctcaaccc cggaactgct ttggaaactg tcgtactaga gtgtcggagg 300 ggtaagcgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttgctggact gtaactgaca ctgaggctcg aaagcgtggg gagcaaacag 420 gattagatac ccttgtagtc 440 <210> 9 <211> 440 <212> DNA <213> Ruminococcaceae <400> 9 cctacggggg gctgcagtgg ggaatattgc acaatggagg aaactctgat gcagcgacgc 60 cgcgtgaggg aagaaggtct tcggattgta aacctctgtt gtcagggacg atgatgacgg 120 tacctgacga ggaagccacg gctaactacg tgccagcagc cgcggtaaaa cgtaggtggc 180 aagcgttgtc cggaattact gggtgtaaag ggagcgcagg cgggagagca agttgggagt 240 gaaatctgtg ggctcaaccc acaaattgct ttcaaaactg tttttcttga gtggtgtaga 300 ggtaggcgga attcccggtg tagcggtgga atgcgtagat atcgggagga acaccagtgg 360 cgaaggcggc ctactgggca ctaactgacg ctgaggctcg aaagcatggg tagcaaacag 420 gattagatac cccggtagtc 440 <210> 10 <211> 440 <212> DNA <213> Ruminococcus2 <400> 10 cctacggggg gctgcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgagcg aagaagtatt tcggtatgta aagctctatc agcagggaag aaaatgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgtaga cggagcagca agtctgatgt 240 gaaaacccgg ggctcaaccc cgggactgca ttggaaactg ttgatctgga gtgccggaga 300 ggtaagcgga attcctagtg tagcggtgaa atgcgtagat attaggaaga acaccagtgg 360 cgaaggcggc ttgctggaca gtaactgacg ttcaggctcg aaagcgtggg gagcaaacag 420 gattagatac ccttgtagtc 440 <210> 11 <211> 440 <212> DNA <213> Lachnospiraceae <400> 11 cctacgggtg gcagcagtgg ggaatattgc acaatggggg aaaccctgat gcagcaacgc 60 cgcgtgagtg aagaagtatt tcggtatgta aagctctatc agcagggaag aaaatgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgcagg cggtacggca agtcagatgt 240 gaaaacccgg ggctcaaccc cgggactgca tttgaaactg tcggactaga gtgccggaga 300 ggtaagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttactaaacc ataactgaca ctgaagcacg aaagcgtggg gagcaaacag 420 gattagatac ccgggtagtc 440 <210> 12 <211> 445 <212> DNA <213> Bifidobacterium <400> 12 cctacggggg gctgcagtgg ggaatattgc acaatgggcg caagcctgat gcagcgacgc 60 cgcgtgaggg atggaggcct tcgggttgta aacctctttt atcggggagc aagcgagagt 120 gagtttaccc gttgaataag caccggctaa ctacgtgcca gcagccgcgg taatacgtag 180 ggtgcaagcg ttatccggaa ttattgggcg taaagggctc gtaggcggtt cgtcgcgtcc 240 ggtgtgaaag tccatcgctt aacggtggat ccgcgccggg tacgggcggg cttgagtgcg 300 gtaggggaga ctggaattcc cggtgtaacg gtggaatgtg tagatatcgg gaagaacacc 360 aatggcgaag gcaggtctct gggccgttac tgacgctgag gagcgaaagc gtggggagcg 420 aacaggatta gataccccag tagtc 445 <210> 13 <211> 440 <212> DNA <213> Coprococcus <400> 13 cctacggggg gcagcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgagcg aagaagtatt tcggtatgta aagctctatc agcagggaag ataatgacgg 120 tacctgacta agaagcaccg gctaaatacg tgccagcagc cgcggtaata cgtatggtgc 180 aagcgttatc cggatttact gggtgtaaag ggtgcgtagg tggtgagaca agtctgaagt 240 gaaaatccgg ggcttaaccc cggaactgct ttggaaactg cctgactaga gtacaggaga 300 ggtaagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcgac ttactggact gctactgaca ctgaggcacg aaagcgtggg gagcaaacag 420 gattagatac cctggtagtc 440 <210> 14 <211> 441 <212> DNA <213> Clostridiales <400> 14 cctacggggg gcagcagtcg ggaatattgc gcaatggagg aaactctgac gcagtgacgc 60 cgcgtatagg aagaaggttt tcggattgta aactattgtc gttagggaag atacaagaca 120 gtacctaagg aggaagctcc ggctaactac gtgccagcag ccgcggtaat acgtagggag 180 caagcgttat ccggatttat tgggtgtaaa gggtgcgtag acgggacaac aagttagttg 240 tgaaatccct cggcttaact gaggaactgc aactaaaact attgttcttg agtgttggag 300 aggaaagtgg aattcctagt gtagcggtga aatgcgtaga tattaggagg aacaccggtg 360 gcgaaggcga ctttctggac aataactgac gttgaggcac gaaagtgtgg ggagcaaaca 420 ggattagata ccccagtagt c 441 <210> 15 <211> 459 <212> DNA <213> Paraprevotella <400> 15 cctacggggg gcagcagtga ggaatattgg tcaatgggcg ggagcctgaa ccagccaagt 60 agcgtgaagg acgacggccc tacgggttgt aaacttcttt tataagggaa taaagtgcgt 120 tacgtgtaat gttttgtatg taccttatga ataagcatcg gctaattccg tgccagcagc 180 cgcggtaata cggaagatgc gagcgttatc cggatttatt gggtttaaag ggagcgtagg 240 cgggctttta agtcagcggt caaatgtcac ggctcaaccg tggccagccg ttgaaactgc 300 aagccttgag tctgcacagg gcacatggaa ttcgtggtgt agcggtgaaa tgcttagata 360 tcacgaagaa ctccgatcgc gaaggcattg tgccggggca gcactgacgc tgaggctcga 420 aagtgcgggt atcaaacagg attagatacc cctgtagtc 459 <210> 16 <211> 460 <212> DNA <213> Bacteroides <400> 16 cctacgggag gcagcagtga ggaatattgg tcaatgggcg atggcctgaa ccagccaagt 60 agcgtgaagg atgactgccc tatgggttgt aaacttcttt tataaaggaa taaagtcggg 120 tatgcatacc cgtttgtatg taccttatga ataaggatcg gctaactccg tgccagcagc 180 cgcggtaata cggaggatcc gagcgttatc cggatttatt gggtttaaag ggagcgtagg 240 cggactatta agtcagctgt gaaagtttgc ggctcaaccg taaaattgca gttgatactg 300 gtcgtcttga gtgcagtaga ggtaggcgga attcgtggtg tagcggtgaa atgcttagat 360 atcacgaaga actccgattg cgaaggcagc ctgctaagct gcaactgaca ttgaggctcg 420 aaagtgtggg tatcaaacag gattagatac ccgagtagtc 460 <210> 17 <211> 440 <212> DNA <213> Ruminococcaceae <400> 17 cctacggggg gctgcagtgg gggatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtggagg aagaaggttt tcggattgta aactcctgtc gttagggacg ataatgacgg 120 tacctaacaa gaaagcaccg gctaactacg tgccagcagc cgcggtaaaa cgtagggtgc 180 aagcgttatc cggatttact gggtgtaaag ggagcgcagg cgggactgca agttggatgt 240 gaaataccgt ggcttaacca cggaactgca tccaaaactg tagttcttga gtgaagtaga 300 ggcaagcgga attccgagtg tagcggtgaa atgcgtagag atggggagga acaccagtgg 360 cgaaggcggc ctgctgggct ttaactgacg ctgaggcacg aaagcgtggg tagcaaacag 420 gattagatac cccagtagtc 440 <210> 18 <211> 440 <212> DNA <213> Gemmiger <400> 18 cctacgggag gcagcagtgg gggatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtggagg aagaaggttt tcggattgta aactcctgtc gttagggacg ataatgacgg 120 tacctaacaa gaaagcaccg gctaactacg tgccagcagc cgcggtaaaa cgtagggtgc 180 aagcgttgtc cggaattact gggtgtaaag ggagcgcaga cggcactgca agtctgaagt 240 gaaagcccgg ggctcaaccc cggtactgca ttggaaactg tcgtactaga gtgtcggagg 300 ggtaagcgga attcctagtg tagcggtgaa atgcgtagat atcgggagga acaccagtgg 360 cgaaggcgac ctactgggca ccaactgacg ctgaggctcg aaagcatggg tagcaaacag 420 gattagatac ccctgtagtt 440 <210> 19 <211> 442 <212> DNA <213> Ruminococcaceae <400> 19 cctacggggg gctgcagtgg ggaatattag gcaatgggcg aaagcctgac ctagcgacgc 60 cgcgtgaggg aagacggtct tcggattgta aacctctgtc ttcagggacg aagaagatga 120 cggtacctga agaggaagcc acggctaact acgtgccagc agccgcggta atacgtaggt 180 ggcgagcgtt gtccggaatt actgggtgta aagggagcgt aggcgggtac gcaagttgaa 240 tgtgaaaact aacggctcaa ccgatagttg cgttcaaaac tgcggatctt gagtgaagta 300 gaggcaggcg gaattcctag tgtagcggta aaatgcgtag atattaggag gaacaccagt 360 ggcgaaggcg gcctgctggg ctttaactga cgctgaggct cgaaagtgtg gggagcaaac 420 aggattagat accccggtag tc 442 <210> 20 <211> 466 <212> DNA <213> Dialister <400> 20 cctacggggg gctgcagtgg ggaatcttcc gcaatgggcg aaagcctgac ggagcaacgc 60 cgcgtgagtg atgacggcct tcgggttgta aaactctgtg atccgggacg aaaaggcaga 120 gtgcgaagaa caaactgcat tgacggtacc ggaaaagcaa gccacggcta actacgtgcc 180 agcagccgcg gtaatacgta ggtgacaagc gttgtccgga tttactgggt gtaaagggcg 240 cgtaggcgga ctgtcaagtc agtcgtgaaa taccggggct taaccccggg gctgcgattg 300 aaactgacag ccttgagtat cggagaggaa agtggaattc ctagtgtagc ggtgaaatgc 360 gtagagatta ggaagaacac cggtggcgaa ggcgactttc tggacgaaaa ctgacgctga 420 ggcgcgaaag cgtggggagc aaacaggatt agatacccgg gtagtc 466 <210> 21 <211> 443 <212> DNA <213> Clostridiales <400> 21 cctacgggtg gctgcagtgg gggatattgc acaatggagg gaactctgat gcagcaacgc 60 cgcgtgaagg acgaaggcct tcgggttgta aacttctgtc cttggtgacg aagaaagtga 120 cggtagccag ggaggaagcc acggctaact acgtgccagc agccgcggta atacgtaggt 180 ggcgagcgtt gtccggaatt actgggtgta aagggtgcgt aggcggcttc taaagtcaga 240 tgtgaaatac cgcagctcaa ctgcggggct gcatttgaaa cttgggagct tgagtgaagt 300 agaggtaagc ggaattccta gtgtagcggt ggaatgcgta gatattagga ggaacaccag 360 tggcgaaggc ggcttactgg gctttaactg acgctgaggc acgaaagcgt ggggagcaaa 420 caggattaga taccccagta gtc 443 <210> 22 <211> 441 <212> DNA <213> Clostridiales <400> 22 cctacgggag gctgcagtgg ggaatattgg gcaatgggcg aaagcctgac ccagcaacgc 60 cgcgtgaagg aagaaggcct tcgggttgta aacttctttt aagagggacg aagaagtgac 120 ggtacctctt gaataagcca cggctaacta cgtgccagca gccgcggtaa tacgtaggtg 180 gcaagcgttg tccggattta ttgggtgtaa agggagcgca gacggcactg caagtctgaa 240 gtgaaagccc ggggctcaac cccgggactg ctttggaaac tgtagagcta gagtgctgga 300 gaggcaagcg gaattcctag tgtagcggtg aaatgcgtag atattaggag gaacaccagt 360 ggcgaaggcg gcttactgga cggtaactga cgttgaggct cgaaagcgtg gggagcaaac 420 aggattagat acccgtgtag c 441 <210> 23 <211> 442 <212> DNA <213> Clostridiales <400> 23 cctacgggtg gctgcagtgg gggatattgc gcaatggggg caaccctgac gcagcaacgc 60 cgcgtgaagg aagaaggctt tcgggttgta aacttctttt gtcggggacg aaacaaatga 120 cggtacccga cgaataagcc acggctaact acgtgccagc agccgcggta atacgtaggg 180 ggctagcgtt atccggaatt actgggcgta aagggtgcgt aggtggtttc ttaagtcaga 240 ggtgaaaggc tacggctcaa ccgtagtaag cctttgaaac tgggaaactt gagtgcagga 300 gaggagagtg gaattcctag tgtagcggtg aaatgcgtag atattaggag gaacaccagt 360 tgcgaaggcg gctctctgga ctgtaactga cactgaggca cgaaagcgtg gggagcaaac 420 aggattagat accctagtag tc 442 <210> 24 <211> 440 <212> DNA <213> Lachnospiraceae <400> 24 cctacgggag gcagcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgaagg atgaagtatt tcggtatgta aagctctatc agtagggaag aaaatgacgg 120 tacctgacta agaagcaccg gctaaatacg tgccagcagc cgcggtaata cgtatggtgc 180 aagcgttatc cggatttact gggtgtaaag gaagtgtagg tggccaggca agtcagaagt 240 gaaagcccgg ggctcaaccc cgggactgct tttgaaactg cagggctaga gtgcaggaga 300 ggtaagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttgctggacg atgactgacg ttgaggctcg aaagcgtggg gagcaaacag 420 gattagatac cctagtagtc 440 <210> 25 <211> 441 <212> DNA <213> Faecalibacterium <400> 25 cctacggggg gctgcagtga gggatattgg gcaatggggg aaaccctgac ccagcgacgc 60 cgcgtgaggg aagacggtct tcggattgta aacctctgtc tttggggacg aaaaaggacg 120 gtacccaagg aggaagctcc ggctaactac gtgccagcag ccgcggtaat acgtagggag 180 cgagcgttgt ccggaattac tgggtgtaaa gggagcgcag gcgggaaggc aagttggaag 240 tgaaatccat gggctcaacc catgaactgc tttcaaaact gtttttcttg agtagtgcag 300 aggtaggcgg aattcccggt gtagcggtgg aatgcgtaga tattcggagg aacaccagtg 360 gcgaaggcgg cctactgggc tttaactgac gctgaggctc gaaagtgtgg ggagcaaaca 420 ggattagata ccccggtagt c 441 <210> 26 <211> 443 <212> DNA <213> Clostridiales <400> 26 cctacgggag gctgcagtgg ggaatattgc acaatggggg aaaccctgat gcagcaacgc 60 cgcgtgaagg atgacggttt tcggattgta aacttctttt cttagtgacg aagacagtga 120 cggtagctaa ggaataagca tcggctaact acgtgccagc agccgcggta atacgtagga 180 tgcaagcgtt atccggattt actgggtgta aagggagcgt aggtggcgag gcaagccaga 240 agtgaaaacc cggggctcaa ccgcgggatt gcttttggaa ctgtcatgct agagtgcagg 300 aggggtgagc ggaattccta gtgtagcggt gaaatgcgta gatattagga ggaacaccag 360 tggcgaaggc ggcctactgg gcaccaactg acgctgaggc tcgaaagtgt gggtagcaaa 420 caggattaga taccccggta gtc 443 <210> 27 <211> 465 <212> DNA <213> Megamonas <400> 27 cctacggggg gctgcagtgg ggaatcttcc gcaatgggcg aaagcctgac ggagcaacgc 60 cgcgtgaacg atgaaggtct taggatcgta aagttctgtt gttagggacg aagggtaaga 120 atcataataa ggtttttatt tgacggtacc taacgaggaa gccacggcta actacgtgcc 180 agcagccgcg gtaatacgta ggcggcaagc gttgtccgga attattgggc gtaaagggag 240 cgcaggcggg aaactaagcg gatcttaaaa gtgcggggct caaccccgtg atggggtccg 300 aactggtttt cttgagtgca ggagaggaaa gcggaattcc cagtgtagcg gtgaaatgcg 360 tagatattgg gaagaacacc agtggcgaag gcggctttct ggactgtaac tgacgctgag 420 gctcgaaagc tagggtagcg aacgggatta gataccccag tagtc 465 <210> 28 <211> 446 <212> DNA <213> Coriobacteriaceae <400> 28 cctacggggg gctgcagtgg ggaatcttgc gcaatggggg gaaccctgac gcagcgacgc 60 cgcgtgcggg acgaaggccc tcgggtcgta aaccgctttc agcagggaag aggccgaaag 120 gtgacggtac ctgcagaaga agccccggct aaatacgtgc cagcagccgc ggtaatacgt 180 atggggcgag cgttatccgg attcattggg cgtaaagcgc gcgtaggcgg cctcgtaggc 240 cgggagtcaa atccgggggc tcaacccccg cccgctcccg gaaccccgag gcttgagtct 300 ggcaggggag ggtggaattc ccagtgtagc ggtggaatgc gcagatattg ggaagaacac 360 cggtggcgaa ggcggccctc tgggccacga ctgacgctga ggcgcgaaag ctgggggagc 420 gaacaggatt agatacccga gtagtc 446 <210> 29 <211> 440 <212> DNA <213> Lachnospiraceae <400> 29 cctacggggg gcagcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgagtg aagaagtatt tcggtatgta aagctctatc agcagggaag aaaatgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgtagg tggtatggca agtcagaggt 240 gaaaacccag ggcttaacct tgggattgcc tttgaaactg tcagactaga gtgcaggagg 300 ggtaagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttactggact gtaactgaca ctgaggctcg aaagcgtggg gagcaaacag 420 gattagatac ccgagtagtc 440 <210> 30 <211> 442 <212> DNA <213> Firmicutes <400> 30 cctacggggg gctgcagtgg ggaatattgg gcaatggagg aaactctgac ccagcaacgc 60 cgcgtggagg aagaaggttt tcggatcgta aactcctgtc cttggagacg agtagaagac 120 ggtatccaag gaggaagccc cggctaacta cgtgccagca gccgcggtaa tacgtagggg 180 gcaagcgttg tccggaataa ttgggcgtaa agggcgcgta ggcggctcgg taagtctgga 240 gtgaaagtcc tgcttttaag gtgggaattg ctttggatac tgtcgggctt gagtgcagga 300 gaggttagtg gaattcccag tgtagcggtg aaatgcgtag agattgggag gaacaccagt 360 ggcgaaggcg actaactgga ctgtaactga cgctgaggcg cgaaagtgtg gggagcaaac 420 aggattagat accccagtag tc 442 <210> 31 <211> 441 <212> DNA <213> Butyricicoccus <400> 31 cctacggggg gctgcagtgg ggaatattgc gcaatggggg aaaccctgac gcagcaacgc 60 cgcgtgattg aagaaggcct tcgggttgta aagatcttta atcagggacg aaacatgacg 120 gtacctgaag aataagctcc ggctaactac gtgccagcag ccgcggtaat acgtagggag 180 caagcgttat ccggatttac tgggtgtaaa gggcgcgcag gcgggccggc aagttggaag 240 tgaaatccgg gggcttaacc cccgaactgc tttcaaaact gctggtcttg agtgatggag 300 aggcaggcgg aattccgtgt gtagcggtga aatgcgtaga tatacggagg aacaccagtg 360 gcgaaggcgg cctgctggac attaactgac gctgaggcgc gaaagcgtgg ggagcaaaca 420 ggattagata cccctgtagt c 441 <210> 32 <211> 440 <212> DNA <213> Lachnospiraceae <400> 32 cctacgggtg gctgcagtgg ggaatattgc acaatggggg aaaccctgat gcagcaacgc 60 cgcgtgagtg aagaagtatt tcggtatgta aagctctatc agcaggaaag aaaatgacgg 120 tacctgacta agaagccccg gctaactacg tgccagcagc cgcggtaata cgtagggggc 180 aagcgttatc cggatttact gggtgtaaag ggagcgtaga cggtgaggca agtctgaagt 240 gaaatgccgg ggctcaaccc cggaactgct ttggaaactg tcgtactaga gtgtcggagg 300 ggtaagcgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccagtgg 360 cgaaggcggc ttgctggact gtaactgaca ctgaggctcg aaagcgtggg gagcaaacag 420 gattagatac ccttgtagtc 440 <210> 33 <211> 441 <212> DNA <213> Clostridiales <400> 33 cctacggggg gcagcagtcg ggaatattgc gcaatggagg aaactctgac gcagtgacgc 60 cgcgtatagg aagaaggttt tcggattgta aactattgtc gttagggaag atacaagaca 120 gtacctaagg aggaagctcc ggctaactac gtgccagcag ccgcggtaat acgtagggag 180 caagcgttat ccggatttat tgggtgtaaa gggtgcgtag acgggacaac aagttagttg 240 tgaaatccct cggcttaact gaggaactgc aactaaaact attgttcttg agtgttggag 300 aggaaagtgg aattcctagt gtagcggtga aatgcgtaga tattaggagg aacaccggtg 360 gcgaaggcga ctttctggac aataactgac gttgaggcac gaaagtgtgg ggagcaaaca 420 ggattagata ccccagtagt c 441 <210> 34 <211> 443 <212> DNA <213> Ruminococcaceae <400> 34 cctacggggg gctgcagtgg ggaatattgg gcaatgggcg aaagcctgac ccagcaacgc 60 cgcgtgaagg aagaaggtct tcggattgta aacttctttt atgagggacg aaggaagtga 120 cggtacctca tgaataagcc acggctaact acgtgccagc agccgcggta atacgtaggt 180 ggcaagcgtt gtccggattt actgggtgta aagggcgcgt aggcgggatg gcaagtcaga 240 tgtgaaatcc atgggctcaa cccatgaact gcatttgaaa ctgtcgttct tgagtatcgg 300 agaggcaagc ggaattccta gtgtagcggt gaaatgcgta gatattagga ggaacaccag 360 tggcgaaggc ggcttgctgg acgacaactg acgctgaggc gcgaaagcgt ggggagcaaa 420 caggattaga tacccctgta gtc 443 <210> 35 <211> 440 <212> DNA <213> Ruminococcaceae <400> 35 cctacggggg gctgcagtgg gggatattgc acaatggggg aaaccctgat gcagcaacgc 60 cgcgtgaggg aagaaggttt tcggattgta aacctctgtc ctcagggaag ataatgacgg 120 tacctgagga ggaagctccg gctaactacg tgccagcagc cgcggtaata cgtagggagc 180 aagcgttgtc cggatttact gggtgtaaag ggtgcgtagg cgggatatca agtcagacgt 240 gaaatccatc ggcttaactg atgaactgcg tttgaaactg gtattcttga gtgagtcaga 300 ggcaggcgga attcccggtg tagcggtgaa atgcgtagag atcgggagga acaccagtgg 360 cgaaggcggc ctgctggggc ttaactgacg ctgaggcacg aaagcgtggg gagcaaacag 420 gattagatac ccgagtagtc 440 <210> 36 <211> 443 <212> DNA <213> Firmicutes <400> 36 cctacggggg gctgcagtgg ggaatattgg gcaatggagg gaactctgac ccagcaatgc 60 cgcgtgagtg aagaaggttt tcggattgta aaactcttta agcagggacg aagaaagtga 120 cggtacctgc agaataagca tcggctaact acgtgccagc agccgcggta atacgtagga 180 tgcaagcgtt atccggaatg actgggcgta aagggtgcgt aggcggtaaa tcaagttggc 240 agcgtaattc cggggcttaa ctccggaact actgccaaaa ctggtgaact agagtgtgtc 300 aggggtaagt ggaattccta gtgtagcggt ggaatgcgta gatattagga ggaacaccgg 360 aggcgaaagc gacttactgg ggcacaactg acgctgaggc acgaaagcgt ggggagcaaa 420 caggattaga taccccggta gtc 443 <210> 37 <211> 440 <212> DNA <213> Ruminococcaceae <400> 37 cctacgggag gcagcagtgg gggatattgc acaatggagg aaactctgat gcagcaacgc 60 cgcgtgaggg aagaaggatt tcggtttgta aacctctgtc ttcggtgacg aaaatgacgg 120 tagccgagga ggaagctccg gctaactacg tgccagcagc cgcggtaata cgtagggagc 180 aagcgttgtc cggaattact gggtgtaaag ggtgcgtagg tgggactgca agtcaggtgt 240 gaaaacggtc ggctcaaccg atcgcctgca cttgaaactg tggttcttga gtgaagtaga 300 ggtaggcgga attcccggtg tagcggtgaa atgcgtagag atcgggagga acaccagtgg 360 cgaaggcggc ctactgggct ttaactgacg ctgaggcacg aaagcatggg tagcaaacag 420 gattagatac cccggtagtc 440 <210> 38 <211> 440 <212> DNA <213> Lachnospiraceae <400> 38 cctacggggg gctgcagtgg ggaatattgc acaatggggg aaaccctgat gcagcgacgc 60 cgcgtgagcg aagaagtatt tcggtatgta aagctctatc agcagggaag ataatgacgg 120 tacctgacta agaagccccg gctaaatacg tgccagcagc cgcggtaata cgtagggagc 180 aagcgttatc cggatttatt gggtgtaaag ggtgcgtaga cgggacaaca agttagttgt 240 gaaatccctc ggcttaactg aggaactgca actaaaacta ttgttcttga gtgttggaga 300 ggaaagtgga attcctagtg tagcggtgaa atgcgtagat attaggagga acaccggtgg 360 cgaaggcggc ctactgggca ccaactgacg ctgaggctcg aaagtgtggg tagcaaacag 420 gattagatac cctagtagtc 440 <210> 39 <211> 4 <212> PRT <213> Unknown <220> <223> metabolite <400> 39 Glu Glu Gly Tyr 1 <210> 40 <211> 4 <212> PRT <213> Unknown <220> <223> metabolite <400> 40 Arg Ile Gln Ile 1 <210> 41 <211> 4 <212> PRT <213> Unknown <220> <223> metabolite <400> 41 Asn Ser His His 1 <210> 42 <211> 4 <212> PRT <213> Unknown <220> <223> metabolite <400> 42 Asp Phe Phe Val 1 <210> 43 <211> 4 <212> PRT <213> Unknown <220> <223> metabolite <400> 43 His Met Phe Phe 1 <210> 44 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 44 tcgtcggcag cgtcagatgt gtataagaga cagcctacgg gnggcwgcag 50 <220> <221> misc_feature <222> (42) <223> n is any of g, t, a and c <220> <221> misc_feature <222> (46) <223> w is any of a and t <210> 45 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 45 gtctcgtggg ctcggagatg tgtataagag acaggactac hvgggtatct aatcc 55 <220> <221> misc_feature <222> (41) <223> h is any of a, c and t <220> <221> misc_feature <222> (42) <223> v is any of a, g and c

Claims (15)

  1. 환자의 담즙산 흡수 장애(BAM)를 진단하는 방법으로서,
    a. BAM과 관련된 분류군의 박테리아 균주; 또는
    b. BAM과 관련된 대사산물
    을 검출하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 방법은 BAM과 관련된 분류군의 박테리아 균주 및 BAM과 관련된 대사산물을 검출하는 단계를 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 박테리아 균주는 다음으로 구성된 목록에서 선택된 과(family)의 것인, 방법: 라크노스피라과(Lachnospiraceae), 박테로이데스과(Bacteroidaceae), 루미노코커스과(Ruminococcaceae), 비피도박테리움과(Bifidobacteriaceae), 프레보텔라과(Prevotellaceae), 베일로넬라과(Veillonellaceae) 및 코리오박테리움과(Coriobacteriaceae).
  4. 제1항 또는 제2항에 있어서, 상기 박테리아 균주는 다음으로 구성된 목록에서 선택된 속(genus)인, 방법: 블라우티아(Blautia), 박테로이데스(Bacteroides), 패칼리박테리움(Faecalibacterium), 오실리박터(Oscillibacter), 루미노코커스(Ruminococcus), 비피도박테리움(Bifidobacterium), 코프로코커스(Coprococcus), 파라프레보텔라(Paraprevotella), 젬미거(Gemmiger), 다이얼리스터(Dialister), 메가모나스(Megamonas) 및 부티리코쿠스(Butyricicoccus).
  5. 제2항 내지 제4항에 있어서, 상기 박테리아 균주는 표 2 및/또는 표 5에서 선택된 운영 분류 단위(OTU)에 속하는, 방법.
  6. 제1항 또는 제2항에 있어서, 상기 박테리아 균주가 서열번호: 1 내지 38 중 하나와 적어도 97% 동일한 16S rRNA 유전자 서열을 갖는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 2, 5, 10, 15 또는 20번 박테리아 분류군의 균주가 검출되는, 방법.
  8. 제1항 또는 제2항에 있어서, 상기 대사산물은 다음으로 구성된 군으로부터 선택된, 방법: PG(P-16:0/14:0), 2-에틸수베르산, Glu-Glu-Gly-Tyr, 1,2,3-트리스(1-에톡시에톡시)프로판, PG(O-30:1), 우르소데옥시콜산, MG(22:2(13Z,16Z)/0:0/0:0), L-라이신, O-포스포에타놀아민, PE(22:5(7Z,10Z,13Z,16Z,19Z)/24:0) 및 헵타데칸산.
  9. 제1항 또는 제2항에 있어서, 상기 대사산물은 다음으로 구성된 군으로부터 선택된, 방법: 1,3-디-(5Z,8Z,11Z,14Z,17Z-에이코사펜타에노일)-2-하이드록시-글리세롤 (d5), 디메틸 벤질 카르비닐 부티레이트, 1-18:0-2-18:2-모노갈락토실디아실글리세롤, PG(P-16:0,14:0), Glu-Glu-Gly-Tyr, PC(22:2(13Z,16Z)/15:0), PG(34:0), PE(18:3(6Z,9Z,12Z)/P-18:0) , MG(22:2(13Z,16Z)/0:0/0:0), Arg-Ile-Gln-Ile,, PE(22:5(7Z,10Z,13Z,16Z,19Z)/24:0), PC(18:1(9Z)/15:0), 티오파네이트-메틸, Asn-Ser-His-His, 1,2,3-트리스(1-에톡시에톡시)프로판, PS(39:6), 2-히드록시라우로일카르니틴, 하이포잔틴, 아데노신, PC(40:6), Asp-Phe-Phe-Val, 3-디히드록시카르니틴, 이노신, PG(O-34:3), 11-데옥소쿠쿠르비타신 I, 메틸 카프레이트, 리놀레오일 에탄올아미드, His-Met-Phe-Phe, 1-데칸올, 그라벨리페론, 우리딘, 아라키딜 카르니틴, 구아노신, 노닐산메틸, 3-에피데미시딘, 모모르돌, N-[2-(1H-인돌-3-yl)에틸]도코산아미드, 카프로산메틸, 아스코르브산, N-아세틸-leu-leu-tyr, 4-하이드록시부티르산, [ST 디메틸(4:0/3:0)](5Z,7E,17Z)-(1S,3R)-26,27-디메틸-9,10-seco-5,7,10(19),17(20)-콜레스테트라엔-22-yne-1,3,25-트리올, N-메틸인돌로[3,2-b]-5알파-콜레스트-2-ene 및 감마-글루타밀-S-메틸시스테닐-베타-알라닌.
  10. 제1항 또는 제2항에 있어서, 상기 대사산물은 다음으로 구성된 군으로부터 선택된, 방법: PG(P-16:0/14:0), 2-에틸수베르산, Glu-Glu-Gly-Tyr, 1,2,3-트리스(1-에톡시에톡시)프로판, PG(O-30:1), 우르소데옥시콜산, MG(22:2(13Z,16Z)/0:0/0:0), L-라이신, O-포스포에타놀아민, PE(22:5(7Z,10Z,13Z,16Z,19Z)/24:0), 헵타데칸산, 1,3-di-(5Z,8Z,11Z,14Z,17Z-에이코사펜타에노일)-2-하이드록시-글리세롤 (d5), 디메틸 벤질 카르비닐 부티레이트, 1-18:0-2-18:2-모노갈락토실디아실글리세롤, PC(22:2(13Z,16Z)/15:0), PG(34:0), PE(18:3(6Z,9Z,12Z)/P-18:0), Arg-Ile-Gln-Ile, PC(18:1(9Z)/15:0), 티오파네이트-메틸, Asn-Ser-His-His, PS(39:6), 2-히드록시라우로일카르니틴, 하이포잔틴, 아데노신, PC(40:6), Asp-Phe-Phe-Val, 3-디히드록시카르니틴, 이노신, PG(O-34:3), 11-데옥소쿠르비타신 I, 메틸 카프레이트, 리놀레오일 에탄올아미드, His-Met-Phe-Phe, 1-데칸올, 그라벨리페론, 우리딘, 아라키딜 카르니틴, 구아노신, 노닐산메틸, 3-에피데미시딘, 모모르돌, N-[2-(1H-인돌-3-yl)에틸]도코산아미드, 카프로산메틸, 아스코르브산, N-아세틸-leu-leu-tyr, 4-하이드록시부티르산, [ST 디메틸(4:0/3:0)](5Z,7E,17Z)-(1S,3R)-26,27-디메틸-9,10-seco-5,7,10(19),17(20)-콜레스테트라엔-22-yne-1,3,25-트리올, N-메틸인돌로[3,2-b]-5알파-콜레스트-2-ene 및 감마-글루타밀-S-메틸시스테닐-베타-알라닌.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 방법은 중증 BAM을 진단하기 위한 것인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 환자는 이전에 IBS, 거식증 또는 염증성 장 질환, 예를 들어, 궤양성 대장염 또는 크론병으로 고통받는 것으로 진단 받은, 방법.
  13. 제1항 내지 제12항 중 어느 한 항의 방법을 수행하기 위한 시약들을 포함하는, 키트.
  14. 제2항 내지 제6항에 정의된 박테리아 균주, 및/또는 제8항에 정의된 대사산물 중 2종 이상을 검출하기 위한 시약을 포함하는, 키트.
  15. 제13항 또는 제14항에 있어서, 대변 시료를 분석하도록 구성된, 키트.
KR1020217035793A 2019-04-03 2020-04-02 질환의 진단 방법 KR20220004069A (ko)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
EP19167118.9 2019-04-03
EP19167114.8 2019-04-03
EP19167118 2019-04-03
EP19167114 2019-04-03
GB1909052.1 2019-06-24
GBGB1909052.1A GB201909052D0 (en) 2019-06-24 2019-06-24 Methods of diagnosing disease
GB201915143A GB201915143D0 (en) 2019-10-18 2019-10-18 Methods of diagnosing disease
GB1915143.0 2019-10-18
GB201915156A GB201915156D0 (en) 2019-10-18 2019-10-18 Methods of diagnosing disease
GB1915156.2 2019-10-18
PCT/EP2020/059460 WO2020201458A1 (en) 2019-04-03 2020-04-02 Methods of diagnosing disease

Publications (1)

Publication Number Publication Date
KR20220004069A true KR20220004069A (ko) 2022-01-11

Family

ID=70057152

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020217035791A KR20210149127A (ko) 2019-04-03 2020-04-02 질환의 진단 방법
KR1020217035793A KR20220004069A (ko) 2019-04-03 2020-04-02 질환의 진단 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020217035791A KR20210149127A (ko) 2019-04-03 2020-04-02 질환의 진단 방법

Country Status (8)

Country Link
US (2) US20220128556A1 (ko)
EP (2) EP3947744A1 (ko)
JP (2) JP2022527653A (ko)
KR (2) KR20210149127A (ko)
CN (2) CN114127317A (ko)
AU (2) AU2020255035A1 (ko)
TW (2) TW202102683A (ko)
WO (2) WO2020201458A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022073973A1 (en) * 2020-10-05 2022-04-14 Vib Vzw Means and methods to diagnose gut flora dysbiosis and inflammation
US11139063B1 (en) 2020-12-29 2021-10-05 Kpn Innovations, Llc. Systems and methods for generating a microbiome balance plan for prevention of bacterial infection
CA3223853A1 (en) * 2021-06-28 2023-01-05 Suneer JAIN Systems and methods for identifying microbial signatures
CN113969251B (zh) * 2021-11-30 2023-05-02 华中农业大学 一株巴士链球菌及其在生物合成儿茶素衍生物中的应用
WO2023127875A1 (ja) * 2021-12-30 2023-07-06 株式会社メタジェン 予測方法、予測プログラム、予測装置、学習モデル
CN114965764A (zh) * 2022-05-18 2022-08-30 陕西安宁云生生物技术有限公司 便秘的诊断和治疗

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7943328B1 (en) * 2006-03-03 2011-05-17 Prometheus Laboratories Inc. Method and system for assisting in diagnosing irritable bowel syndrome
CA2776420A1 (en) * 2009-10-05 2011-04-14 Aak Patent B.V. Methods for diagnosing irritable bowel syndrome
BR112012012513A2 (pt) * 2009-11-25 2017-01-10 Prometheus Lab Inc método para diagnosticar síndrome do intestino irritável em um paciente, método para monitorar a progressão ou regressão da síndrome do intestino irritável em um paciente, e para designar uma terapia contra síndrome do intestino irritável a um paciente em necessidade do mesmo
CN105392780A (zh) * 2013-05-24 2016-03-09 雀巢产品技术援助有限公司 用于预测肠易激综合征诊断的途径特异性测定
MX2016014329A (es) * 2014-05-04 2017-02-23 Salix Pharmaceuticals Inc Microbiota ibs y sus usos.
GB201416015D0 (en) 2014-09-10 2014-10-22 Univ Warwick Biomarker
ES2731579T3 (es) 2016-03-04 2019-11-18 4D Pharma Plc Composiciones que comprenden cepas de blautia bacteriana para tratar hipersensibilidad visceral
CA3016059A1 (en) * 2016-03-04 2017-09-08 The Regents Of The University Of California Microbial consortium and uses thereof
ITUA20164448A1 (it) * 2016-06-16 2017-12-16 Ospedale Pediatrico Bambino Gesù Metodo metagenomico per la diagnosi in vitro di disbiosi intestinale.
GB201621123D0 (en) 2016-12-12 2017-01-25 4D Pharma Plc Compositions comprising bacterial strains
WO2018112459A1 (en) * 2016-12-16 2018-06-21 uBiome, Inc. Method and system for characterizing microorganism-related conditions
US11447811B2 (en) * 2017-07-17 2022-09-20 smartDNA Pty Ltd Method of diagnosing a dysbiosis

Also Published As

Publication number Publication date
CN114127317A (zh) 2022-03-01
AU2020255277A1 (en) 2021-10-28
EP3947743A1 (en) 2022-02-09
JP2022527653A (ja) 2022-06-02
CN114040986A (zh) 2022-02-11
WO2020201458A1 (en) 2020-10-08
US20220128556A1 (en) 2022-04-28
US20220165361A1 (en) 2022-05-26
EP3947744A1 (en) 2022-02-09
TW202102683A (zh) 2021-01-16
WO2020201457A1 (en) 2020-10-08
AU2020255035A1 (en) 2021-10-28
KR20210149127A (ko) 2021-12-08
JP2022528466A (ja) 2022-06-10
TW202102684A (zh) 2021-01-16

Similar Documents

Publication Publication Date Title
KR20220004069A (ko) 질환의 진단 방법
Sepehri et al. Microbial diversity of inflamed and noninflamed gut biopsy tissues in inflammatory bowel disease
RU2723336C2 (ru) Способ определения дисбиоза желудочно-кишечного тракта
Barnett et al. The presence of Oxalobacter formigenes in the microbiome of healthy young adults
US10036074B2 (en) Gene signatures of inflammatory disorders that relate to the liver
CN106574294A (zh) 用于通过定量pcr从人粪便样本诊断结肠直肠癌的方法、引物及试剂盒
CN107075446B (zh) 用于肥胖症相关疾病的生物标记物
CA2963013C (en) Biomarkers for rheumatoid arthritis and usage thereof
Fukuda et al. Determination of the discriminant score of intestinal microbiota as a biomarker of disease activity in patients with ulcerative colitis
WO2020244018A1 (zh) 一种精神分裂症的小规模生物标志物组合、其应用及metaphlan2筛选方法
CN111876478A (zh) 肺结节诊断标志物及应用
KR101815692B1 (ko) 구강 세균의 군집을 이용한 대사성 질환 진단용 바이오 마커
Pan et al. Elderly patients with mild cognitive impairment exhibit altered gut microbiota profiles
US11649508B2 (en) Inflammation associated, low cell count enterotype
Lopez-Siles et al. Evaluation of bacterial biomarkers to aid in challenging inflammatory bowel diseases diagnostics and subtype classification
KR20200095308A (ko) 장내 미생물 군집의 변화를 이용한 아토피피부염 발생 및 지속성 예측
US10227651B2 (en) Gene expression based biomarker system for irritable bowel syndrome (IBS) diagnosis
CN111020020A (zh) 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法
CN113684242A (zh) 一种基于淋巴结微生物菌群的头颈癌预后生物标志物及其应用
JP2021532827A (ja) 虚弱性の診断および/または予測のためのバイオマーカー
CN114717342B (zh) 用于预测新冠肺炎患者一年后中和抗体水平的肠道微生物基因标志物及其应用
Lopez-Siles et al. WJGP
WO2023156628A1 (en) Methods for predicting severity of dysbiosis caused by treatment with an antibiotic
TW202118877A (zh) 使用腸道菌叢偵測慢性腎病及其嚴重度之方法
JP2024001864A (ja) うつ病バイオマーカー