JP2020513856A - 大腸癌の複合バイオマーカーを特定するための配列ベースの糞便微生物群調査データの活用 - Google Patents

大腸癌の複合バイオマーカーを特定するための配列ベースの糞便微生物群調査データの活用 Download PDF

Info

Publication number
JP2020513856A
JP2020513856A JP2020500023A JP2020500023A JP2020513856A JP 2020513856 A JP2020513856 A JP 2020513856A JP 2020500023 A JP2020500023 A JP 2020500023A JP 2020500023 A JP2020500023 A JP 2020500023A JP 2020513856 A JP2020513856 A JP 2020513856A
Authority
JP
Japan
Prior art keywords
otu
seq
sample
crc
microorganisms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020500023A
Other languages
English (en)
Other versions
JP2020513856A5 (ja
Inventor
トッド ザチャリー デサンティス
トッド ザチャリー デサンティス
トーマス ウェインマイヤー
トーマス ウェインマイヤー
マナシ サンジャイ シャー
マナシ サンジャイ シャー
エミリー ブルック ホリスター−ブラントン
エミリー ブルック ホリスター−ブラントン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baylor College of Medicine
Original Assignee
Baylor College of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baylor College of Medicine filed Critical Baylor College of Medicine
Publication of JP2020513856A publication Critical patent/JP2020513856A/ja
Publication of JP2020513856A5 publication Critical patent/JP2020513856A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本開示は、大腸癌および大腸腺腫を診断するための糞便微生物マーカーを提供する。本開示はまた、これらの腸内微生物マーカーを使用して大腸癌および大腸腺腫を診断する方法も提供する。

Description

関連出願の相互参照
本出願は、2017年3月17日に出願された米国仮特許出願第62/472,863号の優先権の恩典を主張するものであり、その内容はその全体が参照により本明細書に組み入れられる。
開示内容の分野
本開示は、大腸癌(colorectal cancer:CRC)および大腸腺腫(colorectal adenoma:CRA)を診断するための、および腺腫から癌への移行を検出するための、非侵襲性バイオマーカーとしての糞便微生物叢(fecal microbiome)の使用に関する。特に、本開示は、CRCおよびCRAを診断するためのマーカーとしての糞便微生物由来の16S rRNA配列の使用に関する。
電子申請テキストファイルの説明
ここに電子申請されたテキストファイルの内容は、その全体が参照により本明細書に組み入れられる:配列表のコンピュータ読み取り可能形式のコピー(ファイル名:SEGE_002_01WO_SeqList_ST25;2018年2月18日記録;ファイルサイズ:315キロバイト)。
背景
大腸癌(CRC)は、世界中で3番目に多く発生している癌であり、男性と女性を合わせた米国での癌関連死亡原因の第2位である[1]。生存率は、この癌が初期の局所的な段階で検出された場合に90%を超えるが、進行した転移性疾患では13%に低下する[2-4]。それにもかかわらず、検診に関する勧告の順守は限定的である。ハイリスクグループ(すなわち、50歳以上)からの30%超の個人は、CRC検査を受けたことがないと報告している[5]。
大腸内視鏡検査(colonoscopy)は、侵襲的で、費用がかかり、中間期癌(interval cancer)(すなわち、大腸内視鏡スクリーニング後6〜36ヶ月以内に診断されたCRC)に対処することができないが、最も一般的に採用されているスクリーニング法である[5, 6]。在宅型便潜血検査(FOBT)は、癌関連死亡率を低減させるのに有効でないという認識のため、それほど頻繁には使用されていない[5]。FOBTはまた、前癌病変または大腸腺腫(CRA)を検出する際の感度が低い[7]。
Cologuardは、より新しいマルチターゲット便DNA検査(multi-target stool DNA test)である。これはCRCを検出する感度が高いものの、非進行性CRAを検出する感度は低く、FOBTよりも高価であり、かつ保険会社による補償範囲がさまざまである[8, 9]。
現在のスクリーニング法の欠点は、CRCおよび前癌病変のための高感度で非侵襲的な診断検査の必要性を強調し、こうした検査は患者の検診率を高める可能性がある。
ほとんどのCRCおよびCRAの症例は本質的に散発的なものである(すなわち、遺伝的形質の遺伝子パターンがない)。それゆえ、この疾患を反映する「シグナル」を特定するために、腸内微生物叢などの環境要因が広く研究されてきた[10-17]。16SリボソームRNA(rRNA)遺伝子(rDNA)は、全ての細菌で保存されているリボソーム成分であり、種特異性を付与する可変配列を含んでいる。したがって、小さなリボソームサブユニットRNA遺伝子、特に16S rRNA遺伝子内の超可変領域に的を絞ったDNA配列決定は、微生物叢の生物多様性を特徴付けることを可能にしてきた。いくつかの研究が腸内微生物叢とCRCまたはCRAとの関連性を分析したが、CRCおよび前癌状態CRAに関連する統一的な微生物のシグネチャは定義されなかった。報告されたCRC関連分類群(例えば、フソバクテリウム・ヌクレアタム(Fusobacterium nucleatum)、ペプトストレプトコッカス属(Peptostreptococcus sp.)、およびポルフィロモナス属(Porphyromonas sp.))に関してある程度の一致は存在するが、CRCの一貫性のあるシグナルは確立されていない[10, 11, 18, 19]。報告された研究は、単一の原核生物分類学的バイオマーカーである16SリボソームRNA(rRNA)遺伝子の評価を当てにしたものであり、理論的には、それらの研究を互いに直接比較することが可能である。しかしながら、様々に異なる実験方法、16S rRNA遺伝子の標的領域、シーケンシングプラットフォーム、インフォマティクス技術、および人口統計が直接的な比較可能性を制限している。
その結果、CRCもしくはCRAの発症リスクまたはCRCもしくはCRAの存在を示す、より正確な微生物マーカーの開発が必要となっている。
開示内容の概要
本開示は、大腸癌(CRC)または大腸腺腫(CRA)を診断するための糞便微生物マーカーおよびそれらを使用する方法を提供する。本開示の方法は、対象の腸内微生物プロファイルを決定するために対象由来の腸サンプルを分析すること、および該対象をCRCもしくはCRAがあるまたはないと診断することを含む。
いくつかの態様では、前記方法は、対象由来の腸サンプル(「試験サンプル」)を取得すること、および腸サンプルを処理して該サンプル中の1種類または複数種類の微生物および/または操作的分類単位(OTU)を特定することを含む。
いくつかの態様では、前記腸サンプルは便サンプルである。
いくつかの態様では、前記1つまたは複数のOTUは、細菌科、細菌属、細菌種、細菌株、またはそれらの組み合わせを含む。
いくつかの態様では、前記分析するステップは、腸サンプル中の微生物および/またはOTUのレベルを定量化することを含む。他の態様では、分析するステップは、腸サンプル中の微生物および/またはOTUのレベルを、対照サンプル中の微生物および/またはOTUのレベルと比較することを含む。さらに他の態様では、対照サンプルは1個体以上の健康な個体から得られ、その健康な個体は前記対象と同じ種である。
いくつかの態様では、前記1種類または複数種類の微生物および/またはOTUのレベルの増加は、対象におけるCRCまたはCRAを示している。他の態様では、該1種類または複数種類の微生物および/またはOTUの増加は、CRCを示している。さらに他の態様では、該1種類または複数種類の微生物および/またはOTUのレベルの低下は、対象におけるCRCまたはCRAを示している。
いくつかの態様では、前記方法は、分析するステップが表1に記載されるOTU識別子のうち2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または21のOTUの存在を腸サンプル中に検出した場合、対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断することを含む。他の態様では、表1に記載されるOTU識別子のうち4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または21のOTUのレベルは、対照サンプルと比較して、それぞれ増加する。さらに他の態様では、表1に記載されるOTU識別子のうち4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または21のOTUのレベルは、対照サンプルと比較して、それぞれ少なくとも2倍、4倍、5倍または10倍増加する。さらに他の態様では、生体サンプル中の表1に記載されるOTU識別子のうち4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または21のOTUのレベルが、対照サンプルと比較して、それぞれlog2変化倍率スケールで少なくとも約1.0倍、1.1倍、1.2倍、1.3倍、1.4倍、または1.5倍増加した場合、対象はCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断される。さらに他の態様では、対照の腸サンプルは、少なくとも5、10、15、20、25、30、40または50の健康な個体に由来する腸サンプルである。さらに他の態様では、対照サンプルは、対象と同じ種の健康な個体に由来するものである。
いくつかの態様では、前記方法は、分析するステップが少なくとも1つまたは複数のOTU識別子の存在を腸サンプル中に検出した場合、対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断することを含み、ここで、1つまたは複数のOTU識別子はOTU1167およびOTU3191を含む。他の態様では、1つまたは複数のOTU識別子はOTU1044をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2573をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU1873をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU1169をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2790をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2589をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2910をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU3364をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2049をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2703をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU295をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU567をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU569をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU969をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU1255をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU1926をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2405をさらに含む。他の態様では、1つまたは複数のOTU識別子はOTU2691をさらに含む。
いくつかの態様では、1つまたは複数のOTU識別子は、OTU1167、OTU3191、OTU2573、OTU1044、OTU567、およびOTU1873を含む。他の態様では、1つまたは複数のOTU識別子は、OTU1167、OTU2790、OTU3191、およびOTU1044を含む。
いくつかの態様では、1つまたは複数のOTU識別子の存在を検出するステップは、対照サンプル中の1つまたは複数のOTU識別子のレベルと比較して、1つまたは複数のOTU識別子の増加を検出することを含む。さらに他の態様では、対照サンプルは1つまたは複数の健康な個体に由来する腸サンプルである。さらに他の態様では、対照サンプルは、少なくとも5、10、15、20、25、30、40または50の個体に由来する腸サンプルである。さらに他の態様では、対照サンプルは、対象と同じ種の個体に由来するものである。さらに他の態様では、腸サンプルは便サンプルである。
別の態様において、生体サンプル中の1つまたは複数のOTUのレベルが、対照サンプルと比較して、log2変化倍率スケールで少なくとも約1.0倍、1.1倍、1.2倍、1.3倍、1.4倍、または1.5倍増加した場合、その対象はCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断される。
本開示の方法は、対象由来の腸サンプル(例えば、便サンプル)(「試験サンプル」)を取得すること;腸サンプルを処理して微生物の核酸を抽出しかつ/または該核酸の配列を決定すること;および微生物の核酸を解析して腸サンプル中の微生物および/またはOTUを特定し、かつそのレベルを定量化することを含む。いくつかの態様では、微生物の核酸はDNAである。他の態様では、微生物の核酸はRNAである。一態様では、試験サンプルは、該サンプル中に存在する微生物の16S rRNA遺伝子(rDNA)を抽出して、その配列を決定するように処理される。
いくつかの態様では、微生物の核酸を解析するステップは、16S rRNA配列を解析することを含む。他の態様では、解析するステップは、V1、V2、V3、V4、V5、V6、V7、V8およびV9から選択される16S rRNAの1つまたは複数の超可変領域を解析することを含む。
いくつかの態様では、微生物の核酸を解析するステップは、核酸増幅技術を使用することを含む。いくつかの態様では、その増幅技術はリアルタイムのポリメラーゼ連鎖反応(PCR)または逆転写PCRである。
いくつかの態様では、微生物の核酸を解析するステップは核酸シーケンシングを含む。他の態様では、核酸シーケンシングは次世代シーケンシング(NGS)を含む。
いくつかの態様では、微生物の核酸を解析するステップは、核酸マイクロアレイを使用することを含む。
いくつかの態様では、微生物の核酸を解析するステップは、1つまたは複数のオリゴヌクレオチドを、表1にOTU識別子で表される1つまたは複数の核酸にハイブリダイズさせることを含むアッセイを実施することを含む。他の態様では、OTU識別子で表される1つまたは複数の核酸にハイブリダイズする1つまたは複数のオリゴヌクレオチドは、以下の配列に特異的にハイブリダイズするオリゴヌクレオチドを含む:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:191〜248 (OTU2790)の少なくとも各1つずつ、SEQ ID NO:113〜149 (OTU2589)の少なくとも各1つずつ、SEQ ID NO:249〜259 (OTU2910)の少なくとも各1つずつ、SEQ ID NO:514〜546 (OTU3364)の少なくとも各1つずつ、SEQ ID NO:26〜42 (OTU1169)の少なくとも各1つずつ、SEQ ID NO:648〜654 (OTU1873)の少なくとも各1つずつ、SEQ ID NO:92〜98 (OTU2049)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、SEQ ID NO:1〜7 (OTU2703)の少なくとも各1つずつ、SEQ ID NO:260〜290 (OTU295)の少なくとも各1つずつ、SEQ ID NO:655〜660 (OTU567)の少なくとも各1つずつ、SEQ ID NO:560〜587 (OTU569)の少なくとも各1つずつ、SEQ ID NO:588〜640 (OTU969)の少なくとも各1つずつ、SEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ、SEQ ID NO:43〜49 (OTU1255)の少なくとも各1つずつ、SEQ ID NO:50〜91 (OTU1926)の少なくとも各1つずつ、SEQ ID NO:99〜112 (OTU2405)の少なくとも各1つずつ、SEQ ID NO:150〜190 (OTU2691)の少なくとも各1つずつ、およびSEQ ID NO:547〜559 (OTU467)の少なくとも各1つずつ。さらに他の態様では、OTU識別子で表される1つまたは複数の核酸にハイブリダイズする1つまたは複数のオリゴヌクレオチドは、以下の配列に特異的にハイブリダイズするオリゴヌクレオチドを含む:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:648〜654 (OTU1873)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、SEQ ID NO:655〜660 (OTU567)の少なくとも各1つずつ、およびSEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ。さらに他の態様では、OTU識別子で表される1つまたは複数の核酸にハイブリダイズする1つまたは複数のオリゴヌクレオチドは、以下の配列に特異的にハイブリダイズするオリゴヌクレオチドを含む:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:191〜248 (OTU2790)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、およびSEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ。いくつかの態様では、該1つまたは複数のオリゴヌクレオチドのそれぞれは、約10〜50ヌクレオチド、10〜40ヌクレオチド、10〜30ヌクレオチド、10〜20ヌクレオチド、15〜40ヌクレオチド、15〜30ヌクレオチド、15〜25ヌクレオチド、20〜40ヌクレオチド、25〜40ヌクレオチド、20〜30ヌクレオチド、10〜25ヌクレオチド、または5〜15ヌクレオチドの長さを有する。
いくつかの態様では、微生物の核酸を解析する方法は、1つまたは複数のOTU識別子のレベルを決定するためにStrain Select-UPARSE(SS-UP)を実施することを含む。他の態様では、SS-UPを使用して16S rRNA遺伝子配列データを解析するステップは、微生物および/またはOTUの株レベルの分解能を提供する。
いくつかの態様では、本開示は、対象の便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルを検出する方法を提供し、その方法は以下を含む:該対象由来の便サンプルを取得すること;便サンプルを処理して16S rRNA遺伝子配列を得ること;StrainSelectデータベース中の参照配列に対して16S rRNA遺伝子配列をアライメントすること;SS-UPを使用してデノボクラスタリングを実施すること;およびデノボクラスタリングに基づいて1種類または複数種類の微生物および/またはOTUのレベルを決定すること;ここで、該1種類または複数種類の微生物および/またはOTUは、表1に記載される微生物および/またはOTUの群から選択される。
いくつかの態様では、本開示は、対象における大腸癌または大腸腺腫を診断する方法を提供し、その方法は以下を含む:該対象由来の便サンプルを取得すること;便サンプルを処理して16S rRNA遺伝子配列データを解析すること;16S rRNA遺伝子配列データを解析することを含む、便サンプル中の1つまたは複数のOTUのレベルを検出すること;および便サンプル中の1つまたは複数のOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1つまたは複数のOTUは表1に記載されるOTUの群から選択される。
いくつかの態様では、大腸癌または大腸腺腫を診断する方法は、Strain Select-UPARSE(SS-UP)を使用して16S rRNA遺伝子配列データを解析し、OTU1167、OTU3191、OTU2573、OTU1044、OTU567およびOTU1873からなる群より選択される、またはOTU1167、OTU2790、OTU3191およびOTU1044からなる群より選択される1つまたは複数のOTU識別子のレベルを決定することを含み、ここで、対照サンプルと比較して、試験便サンプル中のこれらのOTU識別子のうち1つまたは複数のレベルの増加は、対象が大腸癌もしくは大腸腺腫に罹患しているか、または大腸癌もしくは大腸腺腫を発症するリスクがあることを示している。他の態様では、対照サンプルと比較して、試験便サンプル中のOTU1167、OTU3191、OTU2573、OTU1044、OTU567およびOTU1873のそれぞれのレベルの増加、またはOTU1167、OTU2790、OTU3191およびOTU1044のそれぞれのレベルの増加は、対象が大腸癌もしくは大腸腺腫に罹患しているか、または大腸癌もしくは大腸腺腫を発症するリスクがあることを示している。
いくつかの態様では、CRCまたはCRAを診断する方法は、試験サンプル中のOTU1167のレベルを決定することを含み、ここで、試験サンプル中のOTU1167のレベルの増加は、対象が大腸癌もしくは大腸腺腫に罹患しているか、または大腸癌もしくは大腸腺腫を発症するリスクがあることを示している。
いくつかの態様では、微生物の核酸を解析する方法は、配列特異的アッセイを実施することを含み、ここで、配列特異的アッセイは、表1に記載されるOTU識別子の微生物核酸配列への複数のオリゴヌクレオチドのハイブリダイゼーションを含む。
いくつかの態様では、配列特異的アッセイは、OTU識別子内の配列のそれぞれを増幅し、検出して、そのレベルを定量化するPCR反応である。他の態様では、該アッセイは、OTU識別子内の配列のそれぞれを検出して、そのレベルを定量化するマイクロアレイアッセイである。
いくつかの態様では、微生物の核酸を解析する方法は、以下を含む:腸サンプルから微生物DNAを抽出すること;抽出された微生物DNAから16S rRNA遺伝子を増幅すること;および増幅された16S rRNA遺伝子の配列を決定すること。
いくつかの態様では、配列特異的アッセイは、以下の配列にハイブリダイズするオリゴヌクレオチドの使用を含む:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:191〜248 (OTU2790)の少なくとも各1つずつ、SEQ ID NO:113〜149 (OTU2589)の少なくとも各1つずつ、SEQ ID NO:249〜259 (OTU2910)の少なくとも各1つずつ、SEQ ID NO:514〜546 (OTU3364)の少なくとも各1つずつ、SEQ ID NO:26〜42 (OTU1169)の少なくとも各1つずつ、SEQ ID NO:648〜654 (OTU1873)の少なくとも各1つずつ、SEQ ID NO:92〜98 (OTU2049)の少なくとも各1つずつ、SEQ ID NOS:8〜14 (OTU2573)の少なくとも各1つずつ、SEQ ID NO:1〜7 (OTU2703)の少なくとも各1つずつ、SEQ ID NO:260〜290 (OTU295)の少なくとも各1つずつ、SEQ ID NO:655〜660 (OTU567)の少なくとも各1つずつ、SEQ ID NO:560〜587 (OTU569)の少なくとも各1つずつ、SEQ ID NO:588〜640 (OTU969)の少なくとも各1つずつ、SEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ、SEQ ID NO:43〜49 (OTU1255)の少なくとも各1つずつ、SEQ ID NO:50〜91 (OTU1926)の少なくとも各1つずつ、SEQ ID NO:99〜112 (OTU2405)の少なくとも各1つずつ、SEQ ID NO:150〜190 (OTU2691)の少なくとも各1つずつ、およびSEQ ID NO:547〜559 (OTU467)の少なくとも各1つずつ。他の態様では、OTU識別子で表される1つまたは複数の核酸にハイブリダイズする1つまたは複数のオリゴヌクレオチドは、以下の配列にハイブリダイズするオリゴヌクレオチドを含む:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:648〜654 (OTU1873)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、SEQ ID NO:655〜660 (OTU567)の少なくとも各1つずつ、およびSEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ。さらに他の態様では、OTU識別子で表される1つまたは複数の核酸にハイブリダイズする1つまたは複数のオリゴヌクレオチドは、以下の配列にハイブリダイズするオリゴヌクレオチドを含む:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:191〜248 (OTU2790)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、およびSEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ。
いくつかの態様では、腸サンプル中の1つまたは複数のOTUのレベルが対照サンプルと比較して少なくとも約5%、10%または15%増加した場合、対象はCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断される。
いくつかの局面では、以下の配列に相補的な1つまたは複数のオリゴヌクレオチドを含む診断ツールが提供される:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:191〜248 (OTU2790)の少なくとも各1つずつ、SEQ ID NO:113〜149 (OTU2589)の少なくとも各1つずつ、SEQ ID NO:249〜259 (OTU2910)の少なくとも各1つずつ、SEQ ID NO:514〜546 (OTU3364)の少なくとも各1つずつ、SEQ ID NO:26〜42 (OTU1169)の少なくとも各1つずつ、SEQ ID NO:648〜654 (OTU1873)の少なくとも各1つずつ、SEQ ID NO:92〜98 (OTU2049)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、SEQ ID NO:1〜7 (OTU2703)の少なくとも各1つずつ、SEQ ID NO:260〜290 (OTU295)の少なくとも各1つずつ、SEQ ID NO:655〜660 (OTU567)の少なくとも各1つずつ、SEQ ID NO:560〜587 (OTU569)の少なくとも各1つずつ、SEQ ID NO:588〜640 (OTU969)の少なくとも各1つずつ、SEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ、SEQ ID NO:43〜49 (OTU1255)の少なくとも各1つずつ、SEQ ID NO:50〜91 (OTU1926)の少なくとも各1つずつ、SEQ ID NO:99〜112 (OTU2405)の少なくとも各1つずつ、SEQ ID NO:150〜190 (OTU2691)の少なくとも各1つずつ、およびSEQ ID NO:547〜559 (OTU467)の少なくとも各1つずつ。他の態様では、該1つまたは複数のオリゴヌクレオチドは、以下の配列に相補的である:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:648〜654 (OTU1873)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、SEQ ID NO:655〜660 (OTU567)の少なくとも各1つずつ、およびSEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ。さらに他の態様では、該1つまたは複数のオリゴヌクレオチドは、以下の配列に相補的である:SEQ ID NO:641〜647 (OTU1167)の少なくとも各1つずつ、SEQ ID NO:291〜513 (OTU3191)の少なくとも各1つずつ、SEQ ID NO:191〜248 (OTU2790)の少なくとも各1つずつ、SEQ ID NO:8〜14 (OTU2573)の少なくとも各1つずつ、およびSEQ ID NO:15〜25 (OTU1044)の少なくとも各1つずつ。いくつかの態様では、該1つまたは複数のオリゴヌクレオチドのそれぞれの配列は、少なくとも1つのOTU配列の相補体と99%または100%同一である。いくつかの態様では、診断組成物はマイクロアレイである。他の態様では、診断組成物は、本開示の1つまたは複数のOTUを検出するためのポリメラーゼ連鎖反応を実施するための試薬をさらに含むキットである。
図1は、選択された研究のQIIME-CRおよびSS-UP解析のフローチャートを示す。 図2は、選択されたSS-UP OTU(図2A)およびQIIME-CR OTU(図2B)のフォレストプロット(forest plot)を示す。これらのプロットは、5件以上の研究で検出されたOTUについての、全研究にわたる研究ごと(per-study)の調整REM log2変化倍率を示す。ここに示された全てのOTUはREM FDR<0.1を有し、一般に報告されているフソバクテリウム属(Fusobacterium)も含まれていた。エラーバーの長さは95%信頼区間を表し、ポイントの大きさは個々の研究のポイント推定値の精度を示す(1/(95%CI上限−95%CI下限)。REモデルのポイントの大きさは一定であった。ブランク値は、その特定のOTU配列がその特別な研究で検出されなかったことを示す。図2Aに示された分類学的アイデンティティは、SS-UPでは属、種、株(または株が未分類である場合はOTU ID)であり、図2BのQIIME-CRでは門、属、種(または種が未分類である場合はOTU ID)である。
詳細な説明
定義
本明細書で別途定義されない限り、本出願で使用される科学用語および技術用語は、当業者が一般に理解している意味を有するものとする。一般的に、本明細書に記載される化学、分子生物学、細胞および癌生物学、免疫学、微生物学、薬理学、タンパク質・核酸化学に関連して使用される命名法ならびにそれらの技術は、当技術分野で周知であって、よく使用されるものである。したがって、以下の用語は当業者によって十分に理解されていると考えられるが、ここに開示される主題の説明を容易にするために、以下の定義が示される。
この明細書全体を通して、用語「含む(comprise)」または「含む(comprises)」もしくは「含んでいる(comprising)」などの変化形は、記載された成分または成分のグループの包含を意味するが、他の成分または成分のグループの除外を意味するものではないことが理解されよう。
用語「1つの(a)」または「1つの(an)」は、その実在物の1つ以上を指し、すなわち、複数の指示対象を指すことができる。したがって、用語「1つの(a)」または「1つの(an)」、「1つ以上」、「1つまたは複数」および「少なくとも1つ」は、本明細書では相互交換可能に使用される。また、不定冠詞「a」または「an」による「要素(an element)」への言及は、文脈上、1つおよび1つのみの要素が存在することが明確に要求されない限り、2つ以上の要素が存在する可能性を排除しない。
用語「〜を含む」は、「〜を含むがこれらに限定されない」を意味するために使用される。「〜を含む」と「〜を含むがこれらに限定されない」は相互交換可能に使用される。
数値の直前にある用語「約」は、その値のプラスまたはマイナス5%または10%の範囲を意味する。ただし、本開示の文脈がそうでないことを示すか、そのような解釈と矛盾する場合を除く。
用語「対象」、「患者」および「個体」は相互交換可能に使用することができ、ヒトまたは非ヒト動物のいずれかを指す。これらの用語には、哺乳類、例えば、ヒト、霊長類、家畜(ウシ、ブタなど)、ペット(イヌ、ネコなど)、げっ歯類(マウス、ラットなど)が含まれる。特定の態様では、これらの用語はヒト患者を指す。いくつかの態様では、これらの用語は胃腸障害を患っているヒト患者を指す。
本開示は、一部には、多数の糞便微生物研究からの生の16S rRNA遺伝子配列データを全ての研究にわたって一貫した方法で解析したときに、一般化が可能なCRCおよびCRAの微生物マーカーを発見したことに基づいている。
本開示は、対象の便サンプル中の1つまたは複数の操作的分類単位(OTU)の存在に基づいてCRCおよび/またはCRAを診断する方法を提供する。本開示はまた、対象の便サンプル中の1つまたは複数のOTUの存在を検出する方法を提供する。いくつかの態様では、本開示の方法は、対象の便サンプル中に存在する1種類または複数種類の微生物の科、属、種および/または株レベルの分解能を提供する。
「操作的分類単位」(OTU、複数形OTUs)は、系統樹の末端の葉を指し、特定の遺伝子配列およびこの配列との配列同一性を科、属、種または株のレベルで共有する全ての配列によって定義される。特定の遺伝子配列は、16S配列または16S配列の一部であるか、または真正細菌界全体に広く見られる機能的に保存されたハウスキーピング遺伝子であり得る。OTUは、少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%または99%の配列同一性を共有する。OTUは、多くの場合、95%未満の配列同一性を有する配列が同じOTUの一部を形成すると見なされないように、生物間で配列を比較することによって定義される。しかし、本明細書に記載されるシステム、アルゴリズムおよび方法においては、OTU識別子は、0〜100%、25%〜100%および50%〜100%、好ましくは70%〜100%、75%〜100%、77%〜100%、80%〜100%、81%〜100%、82%〜100%、83%〜100%、84%〜100%、より好ましくは85%〜100%、86%〜100%、87%〜100%、88%〜100%、89%〜100%、90%〜100%、91%〜100%、92%〜100%、93%〜100%、94%〜100%、95%〜100%、96%〜100%、97%〜100%、98%〜100%および99%〜100%の配列同一性を有する配列を含むことができる。
本明細書では、例えば以下の表1に記載される、OTUまたはOTU識別子の検出は細菌の目、科、属、種または株の検出と同等であり、表1に記載されるOTUは属、種および/または株名を以前に割り当てられていてもいなくてもよい1つまたは複数の細菌を代表すると理解される。したがって、本開示は、本明細書に記載される1つまたは複数のOTUの検出に基づいた対象の腸内の微生物(細菌)の存在に基づいて、CRCまたはCRAを有する対象を診断する方法に関し、ここで各OTU識別子は1つまたは複数の核酸配列(SEQ ID NO:1〜660)によって定義される。
16S rRNAの「V1-V9領域」は、細菌サンプルの遺伝子タイピングに使用される16S rRNA遺伝子の1番目から9番目の超可変領域を指し、当業者によく理解されている(Woese et al., 1975, Nature, 254:83-86; Fox et al., 1980, Science, 209:457-463)。細菌のこれらの領域は、大腸菌(E. coli)の命名方式に基づくナンバリングを使用して、それぞれヌクレオチド69-99、137-242、433-497、576-682、822-879、986-1043、1117-1173、1243-1294および1435-1465によって定義される。Brosius et al. (PNAS 75:4801-4805 (1978))。いくつかの態様では、OTUを特徴付けるためにV1、V2、V3、V4、V5、V6、V7、V8およびV9領域の少なくとも1つが使用される。一態様では、OTUを特徴付けるためにV3およびV4領域が使用される。
本明細書に記載されるOTUポリヌクレオチドに「特異的にハイブリダイズする」オリゴヌクレオチドは、当技術分野でルーチンに使用される所定の条件下での標的(例:OTU)ヌクレオチド配列へのそのようなハイブリダイゼーションを可能にするのに十分に相補的な配列を有するオリゴヌクレオチドを指す(「実質的に相補的な」と呼ばれることもある)。特に、この用語は、オリゴヌクレオチドと本開示の一本鎖DNAまたはRNA分子内に含まれる実質的に相補的な配列とのハイブリダイゼーションを包含し、該オリゴヌクレオチドと非相補的配列の一本鎖核酸とのハイブリダイゼーションを実質的に排除する。プローブとプライマーの具体的な長さおよび配列は、温度やイオン強度などの反応条件だけでなく、必要とされる核酸標的の複雑さにも依存する。一般的に、ハイブリダイゼーション条件は、当技術分野で知られるようにストリンジェントであるべきである。「ストリンジェント」とは、ヌクレオチド配列が関連配列または非特異的配列に結合できる条件を指す。例えば、高温および低い塩分はストリンジェンシーを高め、結果として非特異的結合または低い融解温度の結合が解離するであろう。いくつかの態様では、OTUポリヌクレオチドに相補的なオリゴヌクレオチドは、OTUポリヌクレオチドに対して少なくとも95%、96%、97%、98%、99%または100%相補的である。
一態様では、対象における大腸癌(CRC)または大腸腺腫(CRA)を診断する方法は、以下を含む:対象由来の試験サンプルからの核酸を分析すること;試験サンプルからの核酸中の1種類または複数種類の微生物および/またはOTUのレベルを検出すること;および試験サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1種類または複数種類の微生物および/またはOTUは表1から選択される。
別の態様では、対象における大腸癌(CRC)または大腸腺腫(CRA)を診断する方法は、以下を含む:対象由来の便サンプルを取得すること;便サンプルを処理して16S rRNA遺伝子配列データを得ること;SS-UPを使用して16S rRNA遺伝子配列データを解析することを含む、便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルを検出すること;および便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1つまたは複数のOTUは表1に記載の微生物の群から選択される。
サンプル収集およびDNA抽出
本方法の様々な態様では、生体サンプルまたは試験サンプルは、便、胃腸管の部位からの粘膜生検、胃腸管の部位からの吸引液、またはそれらの組み合わせから選択することができる。本方法の様々な態様では、胃腸管の部位は、胃、小腸、大腸、肛門、またはそれらの組み合わせであり得る。本方法のいくつかの態様では、胃腸管の部位は、十二指腸、空腸、回腸、またはそれらの組み合わせであり得る。あるいは、胃腸管の部位は、盲腸、結腸、直腸、肛門、またはそれらの組み合わせであり得る。さらに、胃腸管の部位は、上行結腸、横行結腸、下行結腸、S状結腸の湾曲部、またはそれらの組み合わせであり得る。
便サンプルは通常、標準化された容器内に対象により自宅で収集される。対象は、そのサンプルを自宅の冷凍庫にすぐに保管するように要求される。凍結サンプルは検査室に送られ、使用するまで冷凍庫に保管される。
便サンプルを氷上で解凍し、標準的な技術を使用して核酸抽出を実施する。抽出される核酸はDNAおよび/またはRNAであり得る。好ましい態様では、抽出された核酸はDNAである。
一態様では、便サンプルからDNAを抽出するためにQiagen社のQlAamp DNA Stool Mini Kitを使用することができる。別の態様では、以前に記載されたように[47]、ビーズビーティング(bead-beating)抽出およびフェノール-クロロホルム精製によって各糞便サンプルからゲノムDNAを抽出する。一般的には、RNA汚染をなくすためにDNaseフリーのRNaseで抽出物を処理する。
DNAの量とクオリティは、分光光度計、蛍光光度計、ゲル電気泳動などの標準的な手法を用いて決定される。例えば、DNAの量を決定するために(Quant-iTTMdsDNA BR Assay Kitと共に)Qubit Fluorometerを使用することができる。別の態様では、Fluorescent and Radioisotope Science Imaging Systems FLA-5100(富士フィルム, 東京, 日本)を用いてDNAの量を決定することができる。
DNAの完全性とサイズは、0.8%(w/v)アガロースゲル電気泳動を用いて0.5mg/ml臭化エチジウムでチェックされる。さらに処理するまで全てのDNAサンプルを−20℃で保存する。
抽出されたDNAの配列決定
当技術分野で知られる様々な配列決定方法を使用して、抽出されたDNAから16S rRNA遺伝子の配列、すなわち16S rDNA配列、を得ることができる。さらに、16S rRNA遺伝子のV1、V2、V3、V4、V5、V6、V7、V8および/またはV9超可変領域を増幅するためのユニバーサルプライマーを設計することができる。
例えば、細菌16S rDNAのV1-V3領域のPCR増幅は、FLX Titaniumアダプターとサンプルバーコード配列を組み込んだユニバーサルプライマー:
Figure 2020513856
を用いて実施することができる。PCRサイクリングパラメータとしては、95℃で5分の初期変性;95℃での変性(30秒)、55℃でのアニーリング(30秒)、72℃での伸長(30秒)を25サイクル;および72℃で5分の最終伸長を用いることができる。配列決定のために、各サンプルの3つの別々のPCR反応をプールし得る。PCR産物を1%アガロースゲル電気泳動で分離し、QIAquick Gel抽出キット(Qiagen社)を使用して精製する。各サンプルから等濃度のアンプリコンをプールする。エマルジョンPCRおよび配列決定は、以前に記載されたように行われる[48]。あるいは、16S rRNA遺伝子アンプリコンは、Roche GS FLX 454シーケンサー(Genoscreen社, Lille, フランス)で配列決定をすることができる。
あるいは、各DNAサンプルからの16S rRNA遺伝子のV3領域は、細菌のユニバーサルフォワードプライマー:
Figure 2020513856
とリバースプライマー:
Figure 2020513856
を使用して増幅することができる。NNNNNNNNは、PCRアンプリコンを異なるサンプルに分類するためのサンプル固有の8塩基バーコードであり、下線付きのテキストは、16S rRNA遺伝子のV3領域のためのユニバーサル細菌プライマーを示す。その後、16S rRNA遺伝子アンプリコンの配列決定を行う。
あるいは、各DNAサンプルからの16S rRNA遺伝子のV3-V4領域は、そのV3-V4領域を標的とするV3F
Figure 2020513856
フォワードプライマー(SEQ ID NO: 665)とV4R
Figure 2020513856
リバースプライマー(SEQ ID NO: 666)を用いて増幅することができる。その後、16S rRNA遺伝子アンプリコンの配列決定を行う。
シーケンシングリードは、バーコードおよびプライマー配列によりフィルタリングされ得る。得られた配列は、クオリティおよび長さについてさらにスクリーニングおよびフィルタリングされ得る。150ヌクレオチド未満の配列、あいまいな文字(ambiguous character)を含む配列、プライマーに対して2つを超えるミスマッチを含む配列、または6ヌクレオチドを超えるモノヌクレオチドリピートを含む配列は除去される。
SS-UPを使用した16S rRNA遺伝子配列データの解析
16S rRNA遺伝子配列データを解析するために、Strain Select-UPARSE(SS-UP)(Second Genome, Inc)法が使用される。SS-UPは、現存するカルチャーコレクションから取得できる細菌株および古細菌株に由来する高クオリティ配列および注釈データのコレクションである、StrainSelectデータベース(secondgenome.com/StrainSelect)を利用し、株ヒットなしに全ての配列のデノボクラスタリングを実施する。SS-UP法は、本開示の最後の参照番号34に記載の「UPARSE: highly accurate OTU sequences from microbial amplicon reads」, Edgar RC, Nat Meth, 2013, 10: 996-8に説明されており、その全体が参照により本明細書に組み入れられる。
SS-UPを使用してデノボクラスタリングを実施する場合、ペアエンドシーケンスリードは、fastq_minmergelenおよびfastq_maxmergelenのデータセット固有のカットオフを除き、デフォルト設定でUSEARCH fastq_mergepairsを使用してマージされ得る(表3A〜3B)。その結果得られた全てのマージされた配列は、USEARCHのusearch_globalを使用してStrainSelectデータベースに対して比較される。シングルエンドのリードは、最初に、PrinSeq-lite[26]およびパラメータ「-trim_ns_left 1 -trim_ns_right 1 - min_len $MIN_LEN -trim_qual_right 20」を用いてN末端からクオリティトリミングされ(データセットごとの最小長さ値を表3A〜3Bに示す)、その後でUSEARCHのusearch_globalを用いてStrainSelectと比較される。
明確な株のマッチは、最も近いマッチング株からの16S配列に対して99%以上の同一性を有し、かつ2番目に近いマッチング株に対して(たとえ1塩基でも)より低い同一性を有するものとして定義される。これらの明確なヒットを株ごとに集計して、株レベルのOTUの存在量テーブルを作成する。残りの配列は、USEARCHのfastq_maxeeとMAX_EE値1を使用して全体的リードクオリティによりフィルタリングされ、リード長分布の95%区間の下方境界に長さトリミング(length-trimming)され(不均等なリード長分布を有するデータセットの場合、最短リード長への長さトリミングは非常に短いリードによって強く影響される;この外れ値の影響を補正するために95%区間を使用する)、脱複製され、サイズにより降順ソートされ、そしてUSEARCH(fastq_filter, derep_fulllength, sortbysize, cluster_otus)を用いて97%同一性でクラスター化される。USEARCH cluster_otusは、可能性のあるキメラを廃棄する。
存在量が3未満のデノボOTUは、あやしい(spurious)として廃棄される。StrainSelectとの比較に使用されるが、株OTUに至らない全ての配列は、その後、デノボOTU存在量テーブルを作成するために、代表的なコンセンサス配列(≧97%同一性)のセットにマッピングされ得る。代表的な株レベルのOTU配列および代表的なデノボOTU配列は、80%信頼でmothurのベイズ分類器[28]を介してGreengenes[12]分類学的分類(taxonomic classification)を割り当てられる;該分類器は、16S rRNA遺伝子配列のGreengenes参照データベース(例:バージョン13_5)に対してトレーニングされる。標準的な分類学的名称が確立されていない場合は、階層的な分類群(taxon)の識別子が使用される(例えば、「97otu15279」)。株レベルのOTUの存在量および分類体系(taxonomy)でマッピングされたデノボOTUの存在量はマージされ、さらなる解析に使用される。SS-UPアプローチは、全ての高クオリティ配列をカウントできるようにし、また、デノボOTUの分類学的分類は、分類体系に保存されたデノボOTUを様々なサンプル間で比較できるようにする。
クオリティフィルタリングおよびOTU割り当て後に100未満の配列を含むサンプルは、さらなる解析から除外される。
統計分析は標準ツールを用いて行うことができる。例えば、Rパッケージphyloseqは、α多様性、β多様性メトリック(Bray-CurtisおよびJaccard指数など)、Bray-Curtis非類似度の主座標スケーリング、フィルミクテス門(Firmicutes)/バクテロイデス門(Bacteroidetes)(F/B)の比率、および示差的存在量分析(differential abundance analysis)などの全体的群集特性(global community properties)を決定するために使用され得る。Monte-Carloリサンプリングを使用した2サンプル並べ替えt検定は、CRCと対照またはCRAと対照間のα多様性推定値およびF/B比率を比較するために使用することができる。順列分散分析(permutational analysis of variance: PERMANOVA)は、veganパッケージでadonis関数を使用して、グループ内距離がグループ間距離と有意に異なるかどうかを検定するために使用され得る。多変量グループ分散等質性(multivariate homogeneity of group dispersions)は、betadisper関数を使用してveganにより検定することができる。OTUは、それらの偽発見率(False Discovery Rate:FDR)調整Benjamin Hochberg(BH)p値が<0.1であり、かつ推定log2変化倍率が>1.5または<-1.5である場合、有意に異なると見なされる。
統計分析は、SPSS Statisticsなどの他のツールを使用して行うこともできる。
診断方法
いくつかの態様では、大腸癌または大腸腺腫を診断する方法は、1種類または複数種類の微生物またはOTUの存在について、Strain Select-UPARSE(SS-UP)法を使用して糞便16S rRNA遺伝子配列を解析することを含む。
一態様では、SS-UP法は、secondgenome.com/StrainSelectで入手可能なStrainSelectデータベース中の参照配列に対して16S rRNA遺伝子配列をアライメントし、SS-UPを使用してデノボクラスタリングを実施することを含む。
別の態様では、微生物および/またはOTUのレベルは、ポリメラーゼ連鎖反応(PCR)およびリアルタイムPCRを含むがこれらに限定されない、当技術分野で周知の標準的な核酸検出・定量技術により決定される。PCRでは、表1に特定された各OTU識別子を代表する配列(SEQ ID NO:1〜660)にハイブリダイズするようにフォワードプライマーとリバースプライマーを設計して、反応産物のレベルを定量化する。また、RNAレベルを分析する方法も含まれ、この方法では、RNAを抽出して、16S rRNA配列のその後のPCR増幅のために逆転写を実施する。サンプル中の微生物および/またはOTUのレベルを検出する方法には、ルーチンのマイクロアレイ分析も含まれ、そこでは、表1に特定された各OTU識別子を代表する配列(SEQ ID NO:1〜660)に直接または間接的に選択的にハイブリダイズするプローブを使用して、サンプルから抽出されたポリヌクレオチドを検出および定量する。
PCR、qPCR、RT-PCRなどのハイブリダイゼーションアッセイ、およびマイクロアレイ分析は、当技術分野でルーチンに使用されており、当業者であれば、診断目的で本明細書に開示された微生物および/またはOTUを分析して定量するために、これらの技術をどのように応用するかについて理解しているであろう。
PCR、マイクロアレイ法などの配列特異的または配列選択的方法を用いて微生物および/またはOTUのレベルを決定する場合、オリゴヌクレオチド(例:プライマーおよびプローブ)は、表1に記載の1つまたは複数のOTU識別子を代表する1つまたは複数の配列にハイブリダイズするように設計される。例えば、7つの配列(SEQ ID NO:641〜647)によって代表されるOTU1167を検出するために、PCRを用いてSEQ ID NO:641〜647のそれぞれを増幅することができる。あるいは、SEQ ID NO:641〜647のそれぞれを検出して定量するようにマイクロアレイを設計することができる。したがって、試験サンプル中のSEQ ID NO:641〜647に対応する核酸の検出レベルは、健康な対照サンプル(複数可)中のSEQ ID NO:641〜647に対応する核酸の検出レベルと比較される。
例えばPCRおよびマイクロアレイ分析のために、特定の核酸配列にハイブリダイズまたはアニーリングするオリゴヌクレオチド(すなわち、SEQ ID NO:1〜660のいずれか1つの配列を有するポリヌクレオチド)は、二重鎖、三重鎖、または他の高次構造の形成をもたらす、ある核酸と別の核酸とのヌクレオチド塩基対合の相互作用に関する十分に理解された知識に基づいて、ルーチンの方法および/またはソフトウェアを用いて容易に決定される。一次相互作用は典型的には、ワトソン-クリックおよびフーグスティーン型水素結合によりヌクレオチド塩基特異的であり、例えば、A:T、A:U、およびG:Cである。特定の態様では、塩基スタッキングおよび疎水性相互作用も二重鎖の安定性に寄与し得る。プライマーが相補的配列または実質的に相補的な配列にアニーリングする条件は、当技術分野で周知であり、例えば、Nucleic Acid Hybridization, A Practical Approach, Hames and Higgins, eds., IRL Press, Washington, D.C. (1985)およびWetmur and Davidson, Mol. Biol. 31:349, 1968に記載されている。一般に、そのようなアニーリングが起こるかどうかは、とりわけ、プライマーの相補部分の長さ、アダプター修飾分子および/または伸長産物のそれらの対応するプライマー結合部位、pH、温度、1価および2価カチオンの存在、ハイブリダイズする領域のGおよびCヌクレオチドの割合、媒体の粘度、ならびに変性剤の存在の影響を受ける。そのような可変要素はハイブリダイゼーションに必要とされる時間に影響してくる。プライマーおよびレポータープローブの相補部分に特定のヌクレオチド類似体または小溝結合剤(minor groove binder)が存在することも、ハイブリダイゼーション条件に影響を及ぼし得る。したがって、好ましいアニーリング条件は特定のアプリケーションに依存するであろう。しかしながら、そのような条件は、過度の実験をすることなく、当業者によってルーチンに決定され得る。典型的には、アニーリング条件は、記載されたオリゴヌクレオチドが、対応するアダプター修飾分子および/または伸長産物中の相補的配列または実質的に相補的な配列と選択的にハイブリダイズできるが、反応中の他の配列とはどのような有意な程度にもハイブリダイズしないように選択される。
例えばSEQ ID NO:1〜660のうち1つの配列を含む第2のポリヌクレオチドに、「選択的にハイブリダイズする」オリゴヌクレオチドおよびその変異体は、適切なストリンジェンシー条件下で、相補的なヌクレオチド鎖(例えば、限定するものではないが、標的フランキング配列またはアンプリコンのプライマー結合部位)を含む第2のヌクレオチドとアニーリングするが、非標的核酸または他のプライマーなどの望ましくない配列を含むポリヌクレオチドにはアニーリングしないものであると理解される。典型的には、反応温度が特定の二本鎖配列の融解温度に向かって上昇するにつれて、選択的ハイブリダイゼーションの相対量は一般に増加し、ミスプライミングは一般に減少する。したがって、あるオリゴヌクレオチドが別のオリゴヌクレオチドまたはポリヌクレオチドとハイブリダイズするまたは選択的にハイブリダイズするという記述は、該配列のうちの少なくとも1つの配列全体が他のヌクレオチド配列の全体または他のヌクレオチド配列の一部とハイブリダイズする状態を包含する。
サンプル中の各OTU識別子の対応するレベルを計算するために、ルーチンの方法を使用して、各OTU識別子の検出に使用されたサンプル量およびユニークな配列または反応の数を決定づけるように検出シグナルを調整する。
一態様では、対象から得られた試験サンプル(例えば、便サンプル)中の1種類または複数種類の微生物またはOTUのレベルが対照サンプルと比較して増加している場合、該対象は大腸癌もしくは大腸腺腫があると診断されるか、または大腸癌もしくは大腸腺腫を発症するリスクがあると診断される。
対照または対照サンプルは、健康な対象から得られたサンプルである。本明細書で使用する用語「健康な対象」とは、CRCもしくはCRAに罹患していないおよび/またはCRCもしくはCRAを発症するリスクがない対象を指す。いくつかの態様では、対照サンプルは、少なくとも5、10、25または50の健康な対象からのサンプルをプールすることにより得られる。
試験サンプル中の1種類または複数種類の微生物またはOTUのレベルが、対照サンプルと比較して、約2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%または25%(それらの間の値および範囲を含む)増加している場合、対象は大腸癌もしくは大腸腺腫があると診断されるか、または大腸癌もしくは大腸腺腫を発症するリスクがあると診断される。
別の態様では、試験サンプル中の1種類または複数種類の微生物またはOTUのレベルが、対照サンプルと比較して、log2変化倍率スケールで約1.2倍変化している場合、対象は大腸癌もしくは大腸腺腫があると診断されるか、または大腸癌もしくは大腸腺腫を発症するリスクがあると診断される。用語「変化」は、対照サンプルと比較したときの試験サンプル中の微生物またはOTUのレベルの増加または減少を包含する。いくつかの態様では、試験サンプルと対照サンプルとの間の1種類または複数種類の微生物またはOTUのレベルの変化は、対照サンプルと比較して、log2変化倍率スケールで約1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍、4.9倍、または5倍(それらの間の値および範囲を含む)であり得る。
いくつかの態様では、試験サンプル中の1種類または複数種類の微生物またはOTUのレベルが、対照サンプルと比較して、log2変化倍率スケールで約1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍、4.9倍、または5倍(それらの間の値および範囲を含む)増加している場合、対象は大腸癌もしくは大腸腺腫があると診断されるか、または大腸癌もしくは大腸腺腫を発症するリスクがあると診断される。
いくつかの態様では、試験サンプル中の1種類または複数種類の微生物またはOTUのレベルが、対照サンプルと比較して、log2変化倍率スケールで約1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍、4.9倍、または5倍(それらの間の値および範囲を含む)減少している場合、対象は大腸癌もしくは大腸腺腫があると診断されるか、または大腸癌もしくは大腸腺腫を発症するリスクがあると診断される。
本開示に従ってCRCまたはCRAを診断するためのマーカーとして使用し得る微生物および/またはOTUは、表1に記載された微生物およびOTUから選択される。
(表1)
Figure 2020513856
特定の態様では、対象におけるCRCまたはCRAを診断する方法は、以下を含む:該対象由来の便サンプルを取得すること;便サンプルを処理して16S rRNA遺伝子配列データを得ること;Strain Select-UPARSEを使用して16S rRNA遺伝子配列データを解析することを含む、便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルを検出すること;および便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1種類または複数種類の微生物および/またはOTUは、表1に記載された微生物および/またはOTUの群から選択される。
別の特定の態様では、対象におけるCRCまたはCRAを診断する方法は、以下を含む:該対象由来の便サンプルを取得すること;便サンプルを処理して16S rRNA遺伝子配列データを得ること;Strain Select-UPARSEを使用して16S rRNA遺伝子配列データを解析することを含む、便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルを検出すること;および便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1種類または複数種類の微生物および/またはOTUは、OTU識別子OTU1167、OTU3191、OTU2573、OTU1044、OTU567、およびOTU1873のものを含む。
別の特定の態様では、対象におけるCRCまたはCRAを診断する方法は、以下を含む:該対象由来の便サンプルを取得すること;便サンプルを処理して16S rRNA遺伝子配列データを得ること;Strain Select-UPARSEを使用して16S rRNA遺伝子配列データを解析することを含む、便サンプル中のOTU1167、OTU2790、OTU3191およびOTU1044のレベルを検出すること;および便サンプル中のOTU1167、OTU2790、OTU3191およびOTU1044のそれぞれのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること。
一態様では、Strain Select-UPARSE法は、患者の便サンプル中に存在する微生物の株レベルの分解能を提供する。
一態様では、Strain Select-UPARSE法は、少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、または95%のAUROC(area under receiver operator characteristic curve:受信者操作特性曲線下面積)値を提供する。例えば、一態様では、Strain Select-UPARSE法は89.6%のAUROC値を提供する。別の態様では、Strain Select-UPARSE法は91.3%の診断AUROC値を提供する。
Strain Select-UPARSE法は、QIIME-CRが種レベルの分解能を提供するのに対して、株レベルの分解能を提供する。
Strain Select-UPARSE法は、QIIME-CRと比較して、改善されたAUROC値を提供する。例えば、一態様では、Strain Select-UPARSE法は、QIIME-CRにより提供される76.6%のAUROC値と比較して、80.3%のAUROC値を提供する。別の態様では、Strain Select-UPARSE法は、QIIME-CRでの83.3%のAUROC値と比較して、91.3%の診断AUROC値を提供する。
いくつかの態様では、便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルは、上記のSS-UP法を用いて検出される。
いくつかの他の態様では、便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルは、定量PCR(qPCR)を用いて検出することができる。例えば、上記のように便サンプルから微生物DNAを抽出する。qPCRでは、抽出されたDNAからの16S rRNA遺伝子を、上記のユニバーサルプライマーを用いて増幅し、同時にユニバーサルプローブを用いて定量する。同じqPCRには、関心対象の微生物および/またはOTUに特異的または選択的なプローブを、その微生物またはOTUのレベルを定量するために含めることができる。例えば、qPCRは、全微生物16S rRNA遺伝子の増幅および定量のためのユニバーサルプライマーとユニバーサルプローブ、ならびに表1に記載される微生物および/またはOTUに選択的な1つまたは複数のプローブ、例えば、パルビモナス・ミクラ(Parvimonas micra)ATCC 32770(OTU識別子OTU1167、SEQ ID NO:641〜647)に特異的または選択的なプローブ、ディアリスター・ニューモシンテス(Dialister pneumosintes)ATCC 33048(OTU識別子OTU2573、SEQ ID NO:8〜14)に特異的なプローブなど、を含むことができる。微生物またはOTUに選択的なプローブは、その特定の微生物またはOTUのレベルの定量化に役立つ。
さらなる態様は、ポリヌクレオチドのマイクロアレイアッセイを使用することであり、そこでは、腸サンプルの処理から得られたOTUポリヌクレオチドに選択的にハイブリダイズする標的オリゴヌクレオチドが使用される。
言い換えれば、表1に記載された微生物および/またはOTUの検出と定量は、表1に提供されたSEQ ID NOで定義される各微生物/OTUの1つまたは複数の配列に選択的にハイブリダイズするオリゴヌクレオチド、すなわち、特定されたOTUの表1のSEQ ID NOの一部と全長にわたって同一、90%、92%、94%、95%、96%、97%、98%、99%または100%同一であるオリゴヌクレオチド、またはそれらの相補体を使用するルーチンアッセイ(例えば、定量PCR、リアルタイムPCR、マイクロアレイ)を用いて達成することができる。
さらに、プローブ選択的をベースとした定量反応(例えば、PCR、マイクロアレイ)は、OTU識別子内の配列の全てまたはほぼ全て(例えば、OTU1167では7つの配列のうち6つまたは7つ全部の配列;OTU3191では223の配列のうち200または223全部の配列)を含むように設計することができる。代替的にまたは追加的に、腸サンプル中のOTUのレベルを検出および定量するために、表1に記載されたOTU識別子内の配列の少なくとも50%、60%、70%、80%、90%、95%、99%または100%にハイブリダイズするオリゴヌクレオチドを含めてもよい。
したがって、いくつかの態様では、対象におけるCRCまたはCRAを診断する方法は、以下を含む:該対象由来の便サンプルを取得すること;便サンプルから微生物DNAを抽出すること;抽出されたDNAから16S rRNA遺伝子を増幅すること;qPCR、RT-PCRまたはマイクロアレイを使用して、16S rRNA遺伝子のレベルと1種類または複数種類の微生物および/またはOTUのレベルを定量すること;および便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1種類または複数種類の微生物および/またはOTUは、表1に記載された微生物および/またはOTUの群から選択される。
別の特定の態様では、対象におけるCRCまたはCRAを診断する方法は、以下を含む:該対象由来の便サンプルを取得すること;便サンプルから微生物DNAを抽出すること;抽出されたDNAから16S rRNA遺伝子を増幅すること;qPCR、RT-PCRまたはマイクロアレイを使用して、16S rRNA遺伝子のレベルと1種類または複数種類の微生物および/またはOTUのレベルを定量すること;および便サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること;ここで、該1種類または複数種類の微生物および/またはOTUは、OTU識別子OTU1167、OTU3191、OTU2573、OTU1044、OTU567、およびOTU1873のものを含む。
別の特定の態様では、対象におけるCRCまたはCRAを診断する方法は、以下を含む:該対象由来の便サンプルを取得すること;便サンプル中のOTU1167、OTU2790、OTU3191およびOTU1044のレベルを検出すること;および便サンプル中のOTU1167、OTU2790、OTU3191およびOTU1044のそれぞれのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること。
定量PCRを使用する態様では、試験サンプル中の1種類または複数種類の微生物またはOTUのレベルが、対照サンプルと比較して、約2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%または25%(それらの間の値および範囲を含む)増加している場合、該対象は大腸癌もしくは大腸腺腫があるまたは大腸癌もしくは大腸腺腫を発症するリスクがあると診断され得る。
定量PCRを使用する別の態様では、試験サンプル中の1種類または複数種類の微生物またはOTUのレベルが、対照サンプルと比較して、約1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍、4.9倍、または5倍(それらの間の値および範囲を含む)変化している場合、対象は大腸癌もしくは大腸腺腫があるまたは大腸癌もしくは大腸腺腫を発症するリスクがあると診断され得る。
診断ツール
本開示の教示は、本明細書に記載の診断方法を実施するために使用できる様々な診断ツールまたはデバイスをサポートする。例えば、診断テストは、本開示のOTUの1つまたは複数の存在およびレベルを検出するためのPCR反応、ポリヌクレオチドシーケンシングおよび/またはマイクロアレイハイブリダイゼーションの使用を含み得る。したがって、これらの診断ツールまたはデバイスのいずれか、例えば、ヌクレオチドマイクロアレイ、PCRキット、ヌクレオチドシーケンシングキットなどは、本開示による1つまたは複数のOTUに相補的なオリゴヌクレオチドのセットを含むであろう。
本明細書に記載される1つまたは複数のOTUに相補的なオリゴヌクレオチドのそれぞれは、その相補的なOTUに特異的にハイブリダイズすることができる。本明細書で使用する語句「特異的にハイブリダイズする」または「特異的にハイブリダイズすることができる」は、ある配列がDNAまたはRNAの複雑な混合物中に存在する場合、その配列がストリンジェントなハイブリダイゼーション条件下で特定のヌクレオチド配列または特定のヌクレオチド配列のグループと実質的にまたは排他的に結合するか、二本鎖になるか、またはハイブリダイズすることを意味する。一般に、核酸は、温度の上昇により、または核酸を含む緩衝液中の塩分濃度の低下により変性することが知られている。低ストリンジェントな条件(低温および/または高い塩分濃度など)の下では、たとえ対合した配列が完全に相補的でないとしても、徐冷の結果としてハイブリッド二本鎖(例えば、DNA:DNA、RNA:RNA、またはRNA:DNA)が形成される。そのため、ハイブリダイゼーションの特異性は、低ストリンジェントな条件下では低下する。反対に、高ストリンジェントな条件(例えば、高温または低い塩分濃度)では、適切なハイブリダイゼーションを行うには、ミスマッチをできるだけ少なくする必要がある。
当業者であれば、適切なレベルのストリンジェンシーが達成されるようにハイブリダイゼーション条件を選択し得ることが理解されよう。例示的な一態様では、徹底したハイブリダイゼーションを確認するために、ハイブリダイゼーションを37℃で6×SSPE-T(0.05%のTriton X-100)などの低ストリンジェンシー条件下で実施する。その後、洗浄を高ストリンジェントな条件(37℃で1×SSPE-Tなど)の下で実施すると、ミスマッチのハイブリッド二本鎖が除去される。ハイブリダイゼーションの所望のレベルの特異性が得られるまで、ストリンジェンシーを次第に高めて(例えば、37℃〜50℃で0.25 SSPE-T)一連の洗浄を行うことができる。ハイブリダイゼーションの特異性は、配列と様々な予想される対照(例えば、発現レベル対照、標準化対照、ミスマッチ対照など)とのハイブリダイゼーションを、配列と試験プローブとのハイブリダイゼーションと比較することによって検証することができる。ハイブリダイゼーション条件を最適化するための種々の方法が当業者に周知である(例えば、P. Tijssen (Ed) "Laboratory Techniques in Biochemistry and Molecular Biology", vol. 24; Hybridization With Nucleic Acid Probes, 1993, Elsevier, N.Y.を参照されたい)。
本開示は、以下の追加の実施例によってさらに説明されるが、これらの実施例は限定と解釈されるべきではない。当業者は、本開示に照らして、開示された特定の態様に多くの変更を加えることができ、本開示の精神および範囲から逸脱することなく同様のまたは類似した結果をなおも得ることができることを理解すべきである。
本開示を通して記載される全ての特許および非特許文献は、あらゆる目的のためにそれらの全体が参照により本明細書に組み入れられる。
実施例1
CRCおよびCRAの一般化可能な微生物マーカーを特定できるかどうかを見極めるために、本発明者らは、2006年〜2016年の間に発表された多数の糞便微生物研究からの生の16S rRNA遺伝子配列データにアクセスした。本発明者らは、2つのバイオインフォマティクスのパイプラインを使用して該データを解析した:(1)以前に発表されたメタ解析で使用されたクローズドリファレンスOTU割り当て(closed-reference OTU assignment)アプローチである、QIIMEクローズドリファレンス(QIIME-CR)[20-22];および(2)より多くの生の配列データを利用し、場合によっては株レベルの分解能を提供する株特異的方法である、Strain Select-UPARSE(SS-UP)。さらに、データが利用可能な場合、本発明者らは、本発明者らの複合微生物マーカーを、持ち帰り用の非侵襲的だが不正確な検査であるグアヤック(guaiac)ベースの便潜血検査(FOBT)と比較した[23, 24]。
研究の検索、選択、および組み入れ
本発明者らは、ヒト対象を含みかつ2006年から2016年の間に発表された、タイトルに大腸癌、結腸癌、大腸腺癌という用語を含む研究を特定するために、体系的なPubMed検索を行った。PubMedアドバンスドサーチ(advanced search)を使用した最終的な詳細検索用語は、((((((((((bacterial microbiome OR gut microbiome OR microbiota OR microbial)) AND (fecal or feces)) AND (colorectal cancer[Title] OR colon cancer[Title] OR colorectal adenoma[Title] OR adenomatous polyp[Title] or colorectal carcinoma[Title])) AND (“2006/01/01 “[PDAT]:“2016/04/01”[PDAT])) AND humans[MeSH Terms]) NOT review[Publication Type]) AND Humans[Mesh]))であった。原稿は、その本文中に細菌微生物叢(bacterial microbiome)、腸内微生物叢(gut microbiome)または微生物叢(microbiota)という用語、タイトルには大腸癌(colorectal cancer)または大腸腺腫(colorectal adenoma)または腺腫性ポリープ(adenomatous polyp)または大腸癌腫(colorectal carcinoma)という用語を必要とし、ヒト対象のみを含み、2006年〜2016年の間に発表されたものであった。
糞便微生物叢とCRCとの関連性を評価する疫学研究の不偏合成(unbiased synthesis)を提示するために、本発明者らは、本発明者らの解析用の研究を特定して組み入れるために推奨のMOOSE(Meta-analysis of Observational Studies in Epidemiology:疫学における観察研究のメタ解析)チェックリストに従った[25]。研究が(i)16S rRNA遺伝子アンプリコンに454またはIlluminaシーケンシングを使用した;(ii)組織学的に確認されたCRCまたはCRAのサンプルおよび対照を含んでいた;および(iii)2016年4月1日までに公開されているまたは著者らによって共有された配列および関連するメタデータを有していた場合に、それらの研究は本発明者らの組み入れ基準(inclusion criteria)に適合する。
糞便微生物とCRCとの関連性を評価する13件の研究が、上記の体系的な検索によって特定された。これらの研究は、DNA抽出方法、標的とされた16S rRNA遺伝子可変領域、シーケンシングプラットフォーム、および研究特性に関して異なっており、表2Aおよび2Bに要約される。
(表2A)メタ解析に組み入れられた糞便研究の特性
Figure 2020513856
略語:Seq Plat:シーケンシングプラットフォーム,Seq dir:シーケンシング方向,F:フォワード(5'-3')方向,R:リバース(3'-5')方向,CRC:大腸癌,CRA:大腸腺腫,Ctrl:対照,V1、V3、V4:16S rRNA遺伝子の可変領域;
Figure 2020513856
は解析に組み入れられた研究を示し、Xはデータが利用できなかった研究を示す。
(表2B)メタ解析に組み入れられた研究の配列統計値
Figure 2020513856
略語:seq:配列,Avg:平均,SD:標準偏差,QIIME-CR:QIIMEクローズドリファレンスOTUピッキング,SS-UP:Strain Select, UPARSEバイオインフォマティクスパイプライン;各パイプラインについて、サンプルあたりのAvgリード±SDが報告される。
これらのうち9件は、パブリックリポジトリ(例えば、Sequence Read Archive(SRA)、European Nucleotide Archive(ENA)、MG-RAST)に配列データを有するか、要請に応じて生データを提供した。これらのうち8件は、研究デザインにCRCまたはCRAおよび対照を有していた[10-14, 26-28]。1件の研究は、もっぱらCRA症例および対照由来の糞便サンプルを評価した[29]。残りの4件の研究の生の配列データは、公開されていなかったか、要請に応じて提供されなかったか、制御されたアクセスを介してのみ入手できた[15, 30-32]。したがって、これらの研究は解析に含めなかった。
本発明者らは、9件の研究からの16S rRNA遺伝子シーケンシングデータをコンパイルした。研究の規模は対象12人から129人までさまざまであり、本発明者らは2つのバイオインフォマティクスパイプラインQIIME-CRおよびSS-UPを使用して、合計59,163,765の生の16S rRNA遺伝子配列を解析した。この組み合わせデータセットは、195のCRC、79のCRA、および235の対照から成っていた。配列の長さとカウント数は研究にわたって不均一であったが、SS-UPはQIIME-CRよりも多くのリードを保持していた。
患者のメタデータ
疾患状態(すなわち、CRC、CRA、または対照)が入手できた参加者を解析に組み入れた。Zeller et al [10]は、大きな腺腫を彼らの解析から除外し、小さな腺腫を対照として組み入れた。本発明者らはこれらのサンプルの全部をCRA試料として評価した。年齢、性別、BMI(または身長と体重)、および便潜血検査(FOBT)の結果の臨床的変数も3件の研究では入手できた[10-12]。
バイオインフォマティクス解析
上述したように、各研究は2つのバイオインフォマティクスパイプラインを使用して解析された;すなわち、QIIMEで実行されるオープンソースのクローズドリファレンス操作的分類単位(OTU)割り当てパイプライン(QIIME-CR)[33]、およびStrainSelectデータベース(secondgenome.com/StrainSelect)中の参照に対して糞便16S配列をアライメントし、UPARSEの方法論を使用してデノボクラスタリングを実行するパイプライン(SS-UP)[34]である。
2つのパイプラインの使用の背後にある論理的根拠は、微生物叢メタ解析で一般的に使用されるクローズドリファレンスOTUピッキングへの代替アプローチを評価すること、および異なるOTUクラスタリングの手法がCRCの複合バイオマーカーの下流性能にどのように影響しうるかを判断することであった。SS-UPは、一部のOTUについての株レベルの注釈という追加の利点を有し、一方QIIME-CRは、一部のOTUについての種レベルの分解能を提供した。本発明者らは、罹患対象と対照対象との間の微生物叢ベースの違いが、いずれか一方のバイオインフォマティクスパイプラインを使用して対象を識別するのに十分であるかどうか、またはその違いがわずかであって、結果として特殊なアルゴリズムを必要とする可能性があるかどうか、を判断しようとした。各パイプラインについて、クオリティフィルタリング基準および配列の利用を表3A〜3Bに提供し、各パイプラインの実行に関する詳細を「補足方法」に提供する。
(表3A)OTUクラスタリング用のリードを生成するために使用された長さフィルタリング基準
Figure 2020513856
(表3B)各パイプラインで利用されたリードの配列長さの中央値
リードは、SS-UPで株レベルのOTUにマップされて、デノボOTUにクラスター化され、かつQIIME-CRを使用して参照OTUにマップされた。
Figure 2020513856
略語:QIIME-CR:QIIMEクローズドリファレンス法;SS-UP:Strain Select, UPARSE法。
QIIME-CR処理:
QIIME-CRパイプラインでは、454データセットのクオリティフィルタリングと逆多重化(demultiplexing)を、QIIME 1.8でsplit_libraries.pyコマンドを使用して行った[10]。QIIME-CRとSS-UPの両方ではトランケートされたリードまたは誤って長いリードを除外するために、標的アンプリコンの長さに基づいて最小および最大リード長を選択した。それぞれに使用されたフィルタリングの長さを表3A〜3Bにまとめてある。さらに、本発明者らはクオリティフィルタリング(すなわち、6を超えるあいまいな塩基を含む配列、6ヌクレオチドを超えるホモポリマー鎖、プライマーまたはバーコード配列へのミスマッチの除外)にデフォルトパラメータを使用した。Illuminaデータでは、本発明者らは、複数のファイルを同時に処理できるため、QIIME 1.9からのmultiple_join_paired_ends.pyおよびmultiple_split_libraries_fastq.pyスクリプトを使用した。クオリティフィルタリングのパラメータをデフォルトに設定した(すなわち、低クオリティのベースコール(q<20)の最初のインスタンスでリードをトランケートし、元のリードの長さの<75%の場合にリードを除外した)。QIIME 1.9.0は、大規模MiSeqベースの研究の初期fastq処理にのみ使用した。全ての研究でのOTUクラスタリングおよび分類学的割り当て(taxonomy assignment)はQIIME 1.8.0を使用して行った。
454およびIlluminaの両研究からのクオリティフィルタリングされかつ逆多重化されたデータセットは、pick_closed_reference_otus.py(リバースストランドマッチング対応のuclust 1.2.22q[11]を使用した)を用いて参照ベースのOTUに割り当てた。この戦略では、インプット配列を参照データベース(Greengenes_13_8)中の所定のクラスターセントロイド(centroid)にアライメントした[12]。配列が97%同一性の閾値で参照データセットとマッチした場合にのみ、その配列を保持した。このアプローチの欠点は、参照に似ていないリードを度外視することである。1件の研究[14]では、fasta形式のシーケンスファイルがMG-RASTリポジトリで共有されたが、qualファイルは除かれた。それゆえ、この研究ではクオリティフィルタリングが不可能であり、QIIME-CRおよびSS-UPの両パイプラインではクラスタリングの前に長さのトリミングのみを行った。2件の研究[27, 13]では、FリードとRリードの両方を収集するために454が使用されたが、それらは対合しなかったため、シングルエンドリード(single ended read)の2つのライブラリーの合計としてリードを評価した。
SS-UP処理:
Strain Select-UPARSE(SS-UP)(Second Genome, Inc)パイプラインは、現存するカルチャーコレクションから取得できる細菌および古細菌株に由来する高クオリティ配列および注釈データのコレクションである、StrainSelectデータベース(secondgenome.com/StrainSelect)(公開準備中)を利用し、UPARSE方法論(SS-UP)を使用して株ヒットなしに全ての配列のデノボクラスタリングを実施する。SS-UPでは、Illuminaのペアエンドシーケンスリードは、fastq_minmergelenおよびfastq_maxmergelenのデータセット固有のカットオフを除き、デフォルト設定でUSEARCH fastq_mergepairsを使用してマージされた(表3A〜3B)。その結果得られた全てのマージされた配列は、USEARCHのusearch_globalを使用してStrainSelect v2014-02-20に対して比較された。454シングルエンドリードは、最初に、PrinSeq-lite[26]およびパラメータ「-trim_ns_left 1 -trim_ns_right 1 - min_len $MIN_LEN -trim_qual_right 20」を用いてN末端からクオリティトリミングされ(データセットごとの最小長さ値を表3A〜3Bに示す)、その後でUSEARCHのusearch_globalを用いてStrainSelectと比較された。明確な株のマッチは、最も近いマッチング株からの16S配列に対して99%以上の同一性を有し、2番目に近いマッチング株に対して(たとえ1塩基でも)より低い同一性を有するものとして定義された。これらの明確なヒットは株ごとに集計され、株レベルのOTU存在量テーブルが作成された。残りの配列は、USEARCHのfastq_maxeeとMAX_EE値1を使用して全体的なリードクオリティによりフィルタリングされ、リード長分布の95%区間の下方境界に長さトリミングされ(不均等なリード長分布を有するデータセットの場合、最短リード長への長さトリミングは非常に短いリードによって強く影響される;この外れ値の影響を補正するために95%区間を使用する)、脱複製され、サイズにより降順ソートされ、そしてUSEARCH(fastq_filter, derep_fulllength, sortbysize, cluster_otus)により97%同一性でクラスター化される。USEARCH cluster_otusは、可能性のあるキメラを廃棄する。デノボOTUあたりの代表的なコンセンサス配列が存在した。各研究について、存在量が3未満のデノボOTUは、あやしい(spurious)として廃棄した。その後、StrainSelectと比較されたが、株OTUに至らなかった全ての配列は、デノボOTU存在量テーブルを作成するために、代表的なコンセンサス配列(≧97%同一性)のセットにマッピングされた。代表的な株レベルのOTU配列および代表的なデノボOTU配列は、80%信頼でmothurのベイズ分類器[28]を介してGreengenes[12]分類学的分類を割り当てられた;該分類器は、16S rRNA遺伝子配列のGreengenes参照データベース(バージョン13_5)に対してトレーニングされた。SS-UPに使用されたGreengenesバージョン13_5とQIIME-CRに使用されたバージョン13_8は両方とも、同じ参照配列のセットを含む。13_8バージョンでは、追加の分類学的用語が手動でキュレートされたが、参照OTUと系統樹は変わらなかった。標準的な分類学的名称が確立されていない場合は、階層的な分類群の識別子を使用した(例えば、「97otu15279」)。全ての研究からの株レベルのOTUの存在量および分類体系でマッピングされたデノボOTU存在量をマージして、さらなる解析に使用した。SS-UPアプローチは、全ての高クオリティ配列をカウントできるようにし、また、デノボOTUの分類学的分類は、分類体系に保存されたデノボOTUを研究間で比較できるようにした。
いずれか一方のバイオインフォマティクスパイプラインのクオリティフィルタリングおよびOTU割り当て後に100未満の配列を含むサンプルは、両方の全てのさらなる解析から除外した。あらゆる場合に、一方のパイプラインで100未満の配列を含んでいたサンプルはどれも、他方のパイプラインで100未満の配列を含んでいた。
統計分析
Rパッケージphyloseqは、α多様性、β多様性メトリック(Bray-CurtisおよびJaccard指数など)、Bray-Curtis非類似度の主座標スケーリング、フィルミクテス門/バクテロイデス門(F/B)の比率、および示差的存在量分析などの全体的群集特性を決定するために使用された。Monte-Carloリサンプリングを使用した2サンプル並べ替えt検定を使用して、CRCと対照およびCRAと対照間のα多様性推定値およびF/B比率を比較した。順列分散分析(PERMANOVA)を使用して、veganパッケージでadonis関数を用いて、グループ内距離がグループ間距離と有意に異なるかどうかを検定した。多変量グループ分散等質性は、betadisper関数を使用してveganにより検定することができる。CRC症例および対照間のQIIME OTUとSS-UP OTUの示差的存在量は、DESeq2デザイン(〜研究(Study)+疾患状態)において交絡因子としての研究(Study)を調整して評価した。OTUは、それらの偽発見率(FDR)調整Benjamin Hochberg(BH)p値が<0.1であり、かつ推定log2変化倍率が>1.5または<-1.5であった場合、有意に異なると見なされた。
ランダム効果モデル(Random Effects model:REM)は、CRC対照サンプルを含む8件の研究を多数の研究のサンプルと見なし、新しい研究が実施された場合に起こりそうな結果を推測した。CRC-糞便微生物叢の研究は、それらの方法だけでなく患者の人口統計の点でも似ていなかった。これらの相違は、真の効果に異質性を持ち込む可能性がある。REモデルはこの異質性をランダムとして扱う。具体的には、前述のプール解析に加えて、本発明者らは、効果量の推定値としての研究ごとのDESeq2 log2変化倍率、および対応する標本分散(sampling variance)としてのそれらに関連する標準誤差を、REMへの入力として推定した。CRC 対 対照比較では少なくとも5件の研究(すなわち5、6、7または8件の研究)で、CRA 対 対照比較では3または4件の研究で、DESeq2により示差的に豊富として生じたOTUは、解析のために保持された。結果として生じるREモデルのp値は分類群OTUにわたる多数の比較のためにFDR補正され、有意なOTUについてはフォレストプロットがプロットされた。本発明者らはまた、いくつかの研究にわたってこれらのOTUの相対存在量をプロットし、対照と比較して症例のlog変化倍率が実際のOTUの保有率(prevalence)にどのように反映するかを推定した。
ランダムフォレスト分類器(random forest classifier)の微生物分類群の予測力を決定するために、一般にmtryとして知られる決定木の各ノードで分割するためにランダムにサンプリングされた予測子特徴(predictor feature)の数を、(0.5, 1, 1.5, 1.75, 2, 2.5, 3.0)*(微生物予測子の総数の平方根)としてチューニングした。オーバーフィッティングを避けるために、モデルを内部的に10分割で交差検証し、5回繰り返した。最大値を持つ受信者操作特性曲線下面積(AUROC)のチューニングを使用して、最適なモデルを選択した。疾患の転帰を予測するためのRFモデルを、臨床マーカーのみ(臨床メタデータが利用可能な研究(n=3研究、156サンプル)の場合)、微生物マーカーのみ(全てのサンプルおよび研究(n=8研究、344サンプル)ならびに完全な臨床メタデータが利用可能なサンプルのサブセット(n=3研究、156サンプル)の場合)、および臨床マーカーと微生物マーカーの両方の組み合わせ(n=3研究、156サンプル)のために構築した。RFモデルを構築する前に、年齢およびBMIなどの臨床メタデータ間の連続変数を中心化してスケーリングした。特定の研究が分類器の最適なAUROC値に偏って影響したかどうかを推定するために、本発明者らは1件の研究抜き(leave one study out)解析を実施して、各研究が除かれた後の分類器の精度を推定した。本発明者らはまた、複合分類器が個々の研究からの均質に処理された特徴にどのように対応したかを比較するために、個々の研究の分類器を調べた。5回繰り返す10分割交差検証を使用した再帰的特徴消去(recursive feature elimination)を使用して、rfe関数を用いる分類のための最もインフォーマティブな微生物分類群を特定した。複合微生物バイオマーカーの一般化可能性を判断するために、1件研究抜きコホート(テストセット)分類器を使用して、predict.train関数を用いて抜き出された研究(検証セット)における疾患の転帰を予測した。上記モデルのROCを、pROCパッケージを使用してプロットした[29]。AUROCの違いを、該パッケージ内のDeLongの検定を用いて統計的に検定した。
各パイプラインから得られたOTUテーブルを単変量および多変量技術を用いて解析し、全ての統計分析をR(バージョン3.2.1)で実施した。化学療法または放射線療法を受けており、サンプルあたり100未満のリードを有し、OTUが全サンプルの5%未満に存在すると記録された患者からのサンプルは、両パイプラインの解析から除外した。α多様性の比較のためにデータを、置換なしで深度1000まで希薄化したが、他の解析では希薄化しなかった[35]。phyloseq[35, 36]を用いて全体的群集特性を評価し、veganでadonis関数を用いて順列分散分析(PERMANOVA)を行った[37]。示差的存在量分析(症例と対照間)は、種レベル(QIIME-CR)および株レベル(SS-UP)でDESeq2を用いて実施した。CRCおよびCRA症例で普遍的に発生しかつ技術的変化に対してロバストであった微生物の特徴を特定するために、本発明者らはランダム効果モデル(REM)を適用して、調整log2変化倍率の要約推定値を取得した(FDR p<0.1で有意と見なした)。これは、Rでmetaforパッケージを使用しかつ研究をランダム効果として扱って、実施された[38]。ランダムフォレスト(RF)モデルは、複合糞便微生物バイオマーカーがCRCおよびCRAの症例を対照と識別できるかどうかを判定するために使用した。全研究にわたる、相対存在量に変換されたOTUカウントの組み合わせを、Rでcaretパッケージを使用して解析した[39, 40]。この解析に関するさらなる詳細は、「補足方法」に記載される。
結果
Bray-Curtis非類似度およびJaccard指数を使用して、それぞれ、存在量およびキャリッジ(carriage)の効果を評価した。座標付け解析(ordination analysis)は、微生物群集の組成に関してサンプル間のかなりのばらつきを明らかにし、また、SS-UPからの座標付けが、QIIME-CRからのそれよりも、最初の2つの軸に沿ってより大きな総変動量を捉えたことを示した。軸1に沿った分離は、第一に研究によって生じ、その後は可変領域とシーケンシングプラットフォームによって生じた。これらのパラメータに大きな違いがあると、症例と対照の分離が容易に観察されなかった。
PERMANOVAは、微生物叢の組成が疾患状態に応じて大幅に異なっていたことを示したが、症例と対照間の等分散性(homogeneity of variance)の欠如がこの結果に影響を与えた可能性が高い。等分散性を確認した後では、微生物叢の組成は、いずれか一方のインフォマティクスパイプラインまたは時には両方の場合に、BMIカテゴリー、シーケンシングプラットフォーム、FOBT検査の結果、および転移性疾患の分類(TNM病期分類でMにより表示)(情報が入手可能な場合)間でPERMANOVAによって有意に異なっていた(表4)。
(表4)PERMANOVAを使用した臨床的、人口統計的および技術的変数にわたる微生物叢組成群の比較
Figure 2020513856
略語:PERMANOVA:順列ANOVA,SS-UP:Strain Select UPARSE,QIIME-CR:QIIMEクローズドリファレンスOTUピッキング,BMI:体格指数,V1-V4:16S rRNA遺伝子の可変領域1から4,FOBT:便潜血検査
#:サンプル数は「クラス」の列に表示される順である;
*TNM:TNMは癌の病期分類システムであり、ここでTは元の腫瘍のサイズを表す(T1〜T4はそれぞれ最小から最大までの範囲である;Tis:上皮内癌);Nはリンパ節転移を表す(N0〜N2は少ないから多いまでのリンパ節浸潤を示す;Nx:リンパ節転移を評価できない);およびMは癌が体のさまざまな部分に転移しているかどうかを示す(M0:転移していない、M1:転移している)
α多様性指数によって測定された全体的群集特性は、SS-UPでのCRC症例と対照間、SS-UPおよびQIIME-CRの両パイプラインでのCRA症例と対照間で類似していた。Shannon指数およびinverse Simpson指数は、Monte-Carlo並べ替えベースのt検定により、QIIME-CRパイプラインで対照と比較してCRA症例で有意に低かった(表5)。フィルミクテス門(Firmicutes)/バクテロイデス門(Bacteroidetes)の比率は、対照と比較してCRC症例とCRA症例のいずれにおいても違いがなかった。
(表5)両パイプライン間の疾患状態の異なるサンプルのα多様性分布
Figure 2020513856
略語:QIIME-CR, QIIMEクローズドリファレンスOTUピッキング,SD:標準偏差,CRC - 大腸癌,CRA - 大腸腺腫,SS-UP:Strain Select-UPARSE,p値:Monte Carlo並べ替えによるt検定で決定された疾患カテゴリーにわたる平均の差のp値。
フィルタリング後、CRC症例と対照間の示差的存在量を分析するために、SS-UPパイプラインとQIIME-CRパイプラインに、それぞれ合計895および3511のOTUが保持された。ペプトストレプトコッカス・アナエロビウス(Peptostreptococcus anerobius)、パルビモナス属(Parvimonas)、ポルフィロモナス属(Porphyromonas)、アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)、およびフソバクテリウム属菌種(Fusobacterium sp.)は、両パイプラインにまたがって、対照と比較してCRC症例でかなり豊富に存在していた(表6)。
(表6)SS-UPを使用して対照と比較したときのCRC症例での示差的存在量
Figure 2020513856
略語:CRC:大腸癌,SS-UP:Strain Select-UPARSE,OTU:操作的分類単位,LogFC:Log2変化倍率,lfcse:Log2変化倍率標準誤差,stat:Wald検定の統計値,p:Wald検定に関連したp値,padj:FDR調整p値
ベース平均:サイズ係数(size factor)で割った正規化カウント値の平均
正のLog2変化倍率は、対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
「97otu12932」は、標準の分類学的名称が割り当てられていない、97%(種レベル)OTUクラスターを表す。
分類の表記法:門;属;種;株。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
正のLog2変化倍率は、対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
SS-UPパイプラインは、CRC症例において、ポルフィロモナス・アサッカロリティカ(Porphyromonas asaccharolytica)ATCC 25260およびパルビモナス・ミクラ(Parvimonas micra)ATCC 33270を含めて、特定の菌株の顕著な富化を確認した。CRC症例におけるパントエア・アグロメランス(Pantoea agglomerans)の顕著な増菌もQIIME-CRから確認された(表7)。
(表7)対照と比較したときのCRC症例での示差的存在量(QIIME-CR)
Figure 2020513856
Figure 2020513856
略語:OTU:操作的分類単位,LogFC:Log2変化倍率,lfcse:Log2変化倍率標準誤差,stat:Wald検定の統計値,p値:Wald検定に関連したp値,padj:FDR調整p値,unc:未分類,ベース平均:サイズ係数で割った正規化カウント値の平均;
正のLog2変化倍率は、対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
CRAと対照の比較では、SS-UPおよびQIIME-CRパイプラインからそれぞれ710および2586のOTUが解析された。プレボテラ属(Prevotella)、メタノスパエラ属(Methanosphaera)、サクシノビブリオ属(Succinovibrio)およびヘモフィルス・パラインフルエンザ(Haemophilus parainfluenzae)種内のOTUは、両パイプラインで顕著に豊富であった。SS-UPは、DESeqによって顕著に異なって豊富であるとしてシネルギステス(Synergistes)科DSM 25858、メタノスパエラ・スタッドマナエ(Methanosphaera stadtmanae)DSM 3091などのユニークな株を特定した。アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)は、QIIME-CRによって対照と比較して、CRA症例ではあまり豊富でなかった(表8および9)。
(表8)対照と比較したときのCRA症例での示差的存在量(SS-UP);正のLog2変化倍率は対照と比較してCRA糞便サンプルに豊富であることを示し、負の値はCRAと比較して対照サンプルに豊富であることを示す
Figure 2020513856
略語:CRC:大腸癌,SS-UP:Strain Select-UPARSE,OTU:操作的分類単位,LogFC:Log2変化倍率,lfcse:Log2変化倍率標準誤差,stat:Wald検定の統計値,p値:Wald検定に関連したp値,padj:FDR調整p値;
ベース平均:サイズ係数で割った正規化カウント値の平均;
正のLog2変化倍率は対照と比較してCRC糞便サンプルに豊富であることを示し、負の値はCRCと比較して対照サンプルに豊富であることを示す。
「97otu12791」は、標準の分類学的名称が割り当てられていない、97%(種レベル)OTUクラスターを表す。
分類は、門;属;種;株の順に従う。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
(表9)対照と比較したときのCRA症例での示差的存在量(QIIME-CR)
Figure 2020513856
Figure 2020513856
Figure 2020513856
Figure 2020513856
略語:OTU:操作的分類単位,LogFC:Log2変化倍率,lfcse:Log2変化倍率標準誤差,stat:Wald検定の統計値,p値:Wald検定に関連したp値,padj:FDR調整p値,unclassified(未分類) ベース平均:サイズ係数で割った正規化カウント値の平均
正のLog2変化倍率は対照と比較してCRA糞便サンプルに豊富であることを示し、負の値はCRAと比較して対照サンプルに豊富であることを示す。
ルミノコッカス属(Ruminococcus)とラクトバシラス属(Lactobacillus)、およびエンテロバクター科(Enterobacteriaceae)内のOTUは、対照と比較してCRCとCRAの両症例で一貫して豊富であった。特に、フソバクテリウム属菌種(Fusobacterium sp.)は、CRC症例では豊富であったが、CRA症例ではそうでなかった。
本発明者らは、疾患の微生物マーカーが研究間で一貫していた度合いを評価するためにREMを構築した。5件以上の研究において、SS-UPパイプラインから合計142のOTUが、QIIME-CRパイプラインから388のOTUが生じた。パルビモナス・ミクラ(Parvimonas micra)ATCC 33270株は、SS-UPによって8件の研究のうち5件で、対照と比較してCRC症例で顕著に高かった(調整REM log2倍の推定値:3.3、95%CI:2.2〜4.5、REM p<0.001、FDR調整p値<0.001)。SS-UPパイプラインからの他の例には、以下が含まれる:プロテオバクテリア門(Proteobacteria)内のOTU(8件の研究にわたる調整REM log2倍の推定値:1.96、95%CI:0.8, 3.1、REM p=0.001、FDR p=0.07)およびストレプトコッカス・アンギノサス(Streptococcus anginosus)内のOTU(5件の研究にわたる調整REM log2倍の推定値:1.4、95%CI:0.4, 2.4、REM p値:0.008、FDR p:0.19)。これらの研究に伴う生物学的および技術的な異質性にもかかわらず、上記のマーカーはCRCの重要なシグナルとして出現した(図2A;表10)。
(表10)SS-UPでのランダム効果モデル(REM)によって特定された、対照と比較してCRC症例で示差的に豊富なOTU
分類は門、属、種、株の順の慣例に従う。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
Figure 2020513856
Figure 2020513856
Figure 2020513856
Figure 2020513856
略語:LogFC:Log2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
フソバクテリウム属菌種(Fusobacterium sp.)は、8件のCRC-微生物叢関連研究のうち7件で検出されたが、症例と対照間で一貫して異なることはなかった。一部の研究では、ほとんど差異が観察されず、他の研究では逆の関係が検出された(つまり、症例と比較して対照で豊富)。対照と比較して症例でのフソバクテリウム属菌種の富化は、特にMiSeq研究で観察され、1.6の調整REM推定値(95%CI:0.04, 3.2、p:0.04、FDR p:0.4)をもたらした(表10)。
REMによって有意と判定された分類群は、研究にわたってこれらの分類群の相対存在量分布のボックスプロットと合致していたが、比較グループではまばらに分布していた。また、QIIME-CRパイプラインは、対照と比較して、症例では一貫して富化または枯渇していた多数のOTUを特定したが、信頼性の高い種レベルの分類学的割り当てはほんの少数しかなかった。そのような例の1つは、ポルフィロモナス属(Porphyrmonas)内のOTUであった(5件の研究にわたる調整REM log2倍推定値:2.9;95%CI:2.0, 3.9;REM p値:2.2*10-9;FDR p:5.8*10-7)(図2B;表11)。
(表11)REM(QIIME-CR)によって特定された、対照と比較してCRC症例で示差的に豊富なOTU
分類は門、属、種の慣例に従う。所与の分類学的階級で不確実な分類の場合にはブランクが表示される。
Figure 2020513856
Figure 2020513856
Figure 2020513856
Figure 2020513856
LogFC:Log2変化倍率 略語:LogFC:Log2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
同様のREMを、CRAと対照を含む4件の研究のために構築した。SS-UPパイプラインは、CRAを含む研究のうち3件または全4件において検出された192のOTUを特定した。ラクノスピラ科(Lachnospiraceae)内のOTU(OTU1642;調整REM推定値:-1.96;95%CI:-2.97, -0.94;p:1.5*10-4;FDR:0.03)、およびバクテロイデス・プレビウス(Bacteroides plebius)種内のOTU(調整REM推定値:1.86;95%CI:0.5〜3.2;p:0.005;FDR:0.48)は、4件のCRA研究のうち3件で検出され、高い調整REM log2変化倍率を有していたが、FDR補正後は統計的に有意でなかった。同様に、QIIME-CRパイプラインは、バクテロイデス属(Bacteroides)(調整REM推定値:-2.9;95%CI:-4.1, -1.7;p:2.9*10-6;FDR:0.001)およびルミノコッカス属(Ruminococcus)(調整REM推定値:1.8;95%CI:0.6, 2.9;p:0.003;FDR:0.5)内のOTUをもたらした(表12および13)。
(表12)ランダム効果モデル(SS-UP)によって特定された、対照と比較してCRA症例で示差的に豊富なOTU
分類は門、属、種、株の順の慣例に従う。数字で表した株の注釈については、www.secondgenome.com/solutions/resources/data-analysis-tools/strainselect/を参照されたい。
Figure 2020513856
略語:LogFC:Log2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
(表13)ランダム効果モデル(QIIME-CR)によって特定された、対照と比較してCRA症例で示差的に豊富なOTU
分類は門、属、種の慣例に従う。所与の分類学的階級で不確実な分類の場合にはブランクが表示される。
Figure 2020513856
略語:LogFC:Log2変化倍率,τ2:真の効果間の異質性の(合計)量,SE:標準誤差,QE:フルモデルからの(残留)異質性の検定の検定統計量,QEp:QEに関連したp値,I2:ランダム効果モデルの場合、I2は、効果量推定値の全変動(異質性とサンプリング変動性で構成される)のどれだけが真の効果間の異質性に起因し得るかを(パーセントで)推定する,H2:サンプリング変動量に対する効果量推定値の全変動量の比率を推定する,FDR:偽発見率,RE:ランダム効果
上述したように、本発明者らは、疾患の複合微生物バイオマーカーを特定するために、各バイオインフォマティクスパイプライン用のランダムフォレスト分類器を開発した。最適モデルは、受信者操作特性曲線下面積(AUROC)についてチューニングされた。SS-UPパイプラインの場合、8件の研究で特定された微生物マーカーは80.4%のAUROC(感度:60.1%、特異度84.8%)を有し、これは臨床特徴に基づく分類器(AUROC:79.6%、DeLongs検定p=0.76)に類似していた。SS-UP微生物分類器は向上した感度を有し、一方臨床分類器はより良好な特異度を有していた。QIIME-CR微生物分類器のAUROCは76.6%であった(感度:55.3%、特異度:82.9%)(表14)。
(表14)両パイプラインのランダムフォレスト分類器の特性
Figure 2020513856
略語:QIIME-CR:QIIMEクローズドリファレンス,SS-UP:Strain Select UPARSE,ROC:受信者操作特性曲線,CRA:大腸腺腫;
平均は交差検証の分割(folds)にわたる平均を示し、臨床的変数は「臨床」および「臨床+」に含まれる。
微生物分類器はFOBT、年齢、性別、BMI、国籍であった。
SS-UPとQIIME-CRの両方で、ペプトストレプトコッカス・アナエロビウス(Peptostreptococcus anerobius)、ポルフィロモナス属(Porphyromonas)およびディアリスター属(Dialister)内のOTUは、変数重要度(variable importance)が高くランク付けされた。SS-UP微生物分類器に含まれる上位の特徴は、前述のパルビモナス・ミクラ(Parvimonas micra)、ディアリスター・ニューモシンテス(Dialister pneumosintes)ATCC 33048、ペプトストレプトコッカス・ストマティス(Peptostreptococcus stomatis)DSM 17678、およびバクテロイデス・ブルガタス(Bacteroides vulgatus)ATCC 84842であったが、QIIME-CRアプローチでは、ブレイディア・モーレイ(Bulleida moorei)およびユウバクテリウム・ドリクム(Eubacterium dolichum)が重要であると特定された。フソバクテリウム属内のOTUもまた、CRC症例と対照を識別する上で重要であった。
臨床データと人口統計データの両方が利用可能であった研究のサブセット(n=3研究、156サンプル)を使用して[10〜12]、これらの研究の微生物のみの分類器は、QIIME-CRの場合が80.9%、SS-UPの場合が89.6%のAUROC値を有していた。上述したように、臨床特徴単独は79.6%のAUROCをもたらし、臨床特徴と微生物特徴の両方を含む分類器は、QIIME-CRとSS-UPの場合に、それぞれ82.4%と91.3%のAUROC値を有していた(表14)。
特定の研究が分類器の精度に重み付けをしたかどうかを判断するために、本発明者らは、n−1分析を行って、各研究が一度に1つずつ除外されたため、フルセットの研究(n=8研究)に基づいた性能と比較して、分類器の性能の変化を評価した。Wang_V3_454 [14]を除外すると、分類器の精度が最も低くなった(80.1%から75.8%);このことは、それが貢献する重要な特徴を有していたことを示唆する。WuZhu_V3_454を除外すると、SS-UPパイプラインの全体的な精度が向上した(AUROCは80.1%から83.9%に増加);このことは、それが疾患の転帰の分類を損なう「ノイズの多い」特徴に寄与していたことを示す。QIIME-CR解析でも同様の傾向が見られた(表15)。
(表15)1件の研究抜き(leave one study out)および1件ごと(per study)のランダムフォレスト分類器の特性
Figure 2020513856
略語:QIIME-CR:QIIMEクローズドリファレンス,SS-UP:Strain Select UPARSE,ROC:受信者操作特性曲線,PPV - 陽性的中率(Positive Predictive Value),NPV - 陰性的中率(Negative Predictive Value),mtry - ランダムフォレスト解析での各ノードでサブサンプリングされた特徴の数を決定するチューニングパラメータ、特徴:ランダムフォレスト解析で使用された微生物特徴の総数;
平均は交差検証の分割にわたる平均を示す。
本発明者らは、各研究のRFモデルを個別に構築して、均質に処理されたサンプルを含む単一の研究内で特定された特徴がより良好なROCをしばしば有していたが、個々の研究モデルの感度は、多くの場合、組み合わせ分類器で得られた感度よりも低いことを観察した(表15)。
分類器の一般化可能性をテストするために、本発明者らは、抜き出された研究における疾患の転帰をn−1微生物分類器がどの程度予測できるかを観察した。例えば、本発明者らは、(n−Chen_V13_454コホート)をトレーニングセットと考え、Chen_V13_454コホートを検証セットと考えて、Chenらのコホートにおける疾患の転帰が、残りの研究からの微生物特徴によってどの程度予測されるかを調べた。残りのコホートからの微生物特徴は、Chen_V13_454における36/42サンプル(AUROC:80.5%、精度:84.6%)を正しく予測することが観察された。予測値は研究間で異なっていた(表16)。
(表16)除外された研究に対するn−1研究コホートの予測精度(SS-UP)
Figure 2020513856
略語:SS-UP:Strain Select UPARSE,AUROC:受信者操作特性曲線下面積
(表17)解析全体での上位25のOTU(SS-UP)
Figure 2020513856
上向きの矢印は、対照と比較してCRC症例で分類群が上昇したことを示す。下向きの矢印は、症例と比較して対照で分類群が上昇したことを示す;
略語:SS-UP - Strain Select-UPARSE
示差的に豊富:DESeq2 Log2変化倍率>1.5、<-1.5、FDR p<0.05により選択された;
研究間で一貫して変化:調整ランダム効果Log2変化倍率>1もしくは<-1またはFDR調整REモデルp<0.5を有する;
分類での重要度:微生物特徴のRF分類器における重要度>10%;
上記の3つの基準のうち少なくとも2つを満たしたOTUが選ばれた。
4件の研究からの微生物分類群を組み合わせたCRA 対 対照SS-UP分類器は、CRC分類器よりも低い精度(AUROC:63.6%)であったが、良好な感度(80.5%)および低い特異度(34.4%)を有していた。QIIME-CR CRA微生物分類器も同様のメトリックスを有していた(AUROC:67.4%、感度:78.3%、特異度:38.8%)。本発明者らはまた、CRAサンプルとCRCサンプルの分類を試みて、中程度に良好な分類精度を得た(SS-UP AUROC:73.7%、QIIME AUROC:80.7%)。
最後に、本発明者らは、CRC 対 対照の比較用に上記解析からの微生物マーカーを組み合わせて、示差的に豊富であり、研究間で一貫しており、かつ分類する上で重要である共通のセットを特定した。SS-UPパイプラインからのこの25の微生物OTUリストを表17に示す。
考察
以前に報告された大部分の微生物叢メタ解析では、16Sデータを処理するためのクローズドリファレンス方式が採用されてきた[20, 22, 41]。本研究において、本発明者らは、微生物叢研究の様々なコレクションをアセンブルして、クローズドリファレンスの手法と、オープンリファレンスOTUピッキングを組み合わせて参照データベースに対してデノボOTUを再分類する代替法と、の両方を評価した。多数の糞便微生物叢研究からの生の配列データをリポジショニングし、それを均一の方法で解析することによって、本発明者らは、CRCで一貫して豊富であるかまたは枯渇している微生物マーカーを特定した。重要なことに、本発明者らは、ショットガンメタゲノムシーケンシングを使用せずに、CRCおよびCRAに関連する新規かつこれまで未報告の菌株を特定した。
元の微生物叢研究のそれぞれに関連する異質性にもかかわらず、本発明者らが構築したRF分類器は、Zeller et al [10](22分類群のショットガンメタゲノム分類器;AUROC 84%)、Zackular et al(6分類群;AUROC 79%)、およびBaxter et al [42](結腸病変を分類する微生物マーカー;AUROC 84.7%)によって報告された結果に匹敵した。[42] SS-UPベースの分類器は、一貫して、QIIME-CRの手法よりも高い感度と特異度をもたらし、予測子(すなわちOTU)およびチューニング変数(mtry)も少なかった。SS-UP微生物分類器は80.1%の精度を有し、Wu_V3_454研究(n=39)を除外すると、Baxter et al [42]と同様のAUROCが得られた。SS-UPパイプラインから得られた、研究[10-12]のサブセットからの微生物特徴を評価するモデル(AUROC 89.6%)または微生物特徴に加えてFOBT結果、年齢、性別およびBMIを評価するモデル(AUROC 91.8%)の結果は、Zeller et al(AUROC 87%)およびZackular et al(AUROC 93.6%)によって報告されたメタゲノムとFOBTを組み合わせた分類器に匹敵した。同様に、Baxterらは、微生物マーカーと、FOBTに代わるスクリーニング法である免疫学的便潜血検査(fecal immunochemical test:FIT)に基づいた組み合わせ分類器を報告しており、AUROCは95.2%であった[42]。したがって、これは、AUROC>84%を達成するCRC便分類器の最初の報告であるが、同時に8つのコホートおよび複数の実験室プロトコル間でばらつきが見られる。
特に、本発明者らの1件抜き(leave-one-out)解析の結果は、SS-UP分類器が特定の研究に固有の特徴によって極端な影響を受けなかったことを示唆する。これにより、CRCのための信頼できる分類ツールとしての微生物マーカーの安定性が実証される。SS-UP微生物分類器の一般化可能性をさらに確立するために、1件抜き解析で除外された研究を外部検証コホートとして扱った場合に、その平均予測AUROCは71.3%であった(表16)。
本発明者らは、パルビモナス・ミクラ(Parvimonas micra)ATCC 33270との高い類似度を有するOTUが、CRC症例で一貫して上昇するだけでなく、微生物分類器モデルおよび組み合わせ臨床-微生物分類器モデルで高くランク付けされることを報告する。以前に提案されたように[43]、歯周病のマーカー、例えばペプトストレプトコッカス属、ポルフィロモナス属およびディアリスター属菌種内のOTUは、両方のパイプラインに対して高い分類力を示した(表6〜7)。口腔病原体はCRCに関連して記述されており、この関係を説明するために複数のメカニズムが仮定されている[41, 44]。SS-UPパイプラインはまた、CRC症例に以前関与していた[26, 45]ブラウティア属(Blautia)内の菌株(例えば、Blautia luti DSM14534およびBlautia obeum ATCC 29174)の富化、ならびに食事由来の発癌物質を変換するユウバクテリウム・ハリイ(Eubacterium hallii)[46](DSM 3353株)および酪酸を産生するフィーカリバクテリウムcf.プラウスニッツイ(Faecalibacterium cf. prausnitzii)[12 27](KLE1255株)などの潜在的に有益な微生物の枯渇を確認した(表6)。
SS-UPパイプラインとQIIME-CRパイプラインの両方において、CRC研究で最も一般的に報告されている細菌分類群の1つであるフソバクテリウム属菌種(Fusobacterium sp.)は対照と比較してCRC症例に豊富であることが判明した。それは本発明者らの示差的存在量分析でCRC症例に著しく豊富であり、組み合わせ(臨床+微生物)RFモデルで重要度が高いとランク付けされた;これらは両方ともプール解析であって、2つの大規模なMiSeq研究により重み付けされる可能性があった。1件ごと(per-study)の解析では、本発明者らは、V3および/またはV4領域を標的とするこれらのMiSeq研究で、log2変化倍率が著しく高いフソバクテリウムOTUを特定したが、全研究にまたがって比較すると、その相対存在量および分布はかなり可変的であった。このことは、CRCに関連したフソバクテリウム属菌種の検出と報告が、16S標的領域(例えば、V3/V4アンプリコン)および/または利用したシーケンシングプラットフォームに左右され得ることを示唆する。フソバクテリウム属菌種はCRCサンプルに豊富であったものの、単変量解析、REMまたはRF分類モデルによるいずれのパイプラインでも、CRAサンプルに示差的に豊富であるとは認められなかった;このことは、それが後期疾患のマーカーであり得ることを示している。
CRAまたは前癌病変は、どちらのバイオインフォマティクスパイプラインによっても、微生物マーカーにより対照から十分には識別されなかった。以前に発表された研究は、腺腫と対照を区別するための5つのOTUの組み合わせ(AUROC 83.9%)を報告したが、異なるコホートと20の微生物分類群を利用した別の研究は、CRAの識別において67.3%のROCをもたらした。微生物マーカーと臨床マーカーの組み合わせは、微生物マーカー単独よりもCRAに対する診断的有用性が高いようである。特に、FIT検査と門(phylum)レベルの微生物存在量の組み合わせは、CRAを分類するのに76.7%のAUROCを有することが報告されている[30]。以前に発表された研究と比較して、本発明者らの微生物マーカーのみのSS-UP分類器の感度は比較的高く(75.5%)、より特異度の高いFOBTまたはFIT検査[24, 30]を補完するために使用できる可能性がある。
本発明者らのCRA 対 CRC分類は、本発明者らの解析での健常 対 CRA比較よりも、または他の研究からのものよりも、優れたAUROCをもたらした[11, 42]。したがって、微生物組成の変化は腺腫から癌への移行において最も明らかであるようだが、ポリープの発生時には必ずしもそうではない。示差的存在量分析は、CRAおよびCRCの両症例と対照との比較において、サクシノビブリオ属(Succinovibrio)およびクロストリジウム属(Clostridia)内の同じOTUのいくつかを特定した;これらは癌の進行において「ドライバー」種として機能しうる可能性がある。ドライバーであろうとパッセンジャーであろうと、これらの観察研究から、微生物の共生バランス失調(dysbiosis)はCRCに特有の特徴であり、検出および治療介入のための有望な標的を提示することが確認される。
最善の努力にもかかわらず、特定の制限がいくつかあった。癌の病期、腫瘍の位置、FOBTの結果、および患者の人口統計(年齢、性別、BMIを含む)に関する情報は、解析された9件の研究のうち3件のみで利用可能であった。同様に、腺腫の成長パターン(例えば、管状または絨毛)および癌の能力(すなわち、腫瘍性または過形成性)に関する情報が限られていた。統計的に、示差的存在量分析は、疎な(sparse)微生物OTUデータ(微生物分類群分布の特性である)およびカバレッジの深度(depth of coverage)に関する変動に影響されやすい。本発明者らは、交絡因子を調整しかつ複数の比較を補正することによって、潜在的に人為的な結果を調整しようとした。
これらの制限にもかかわらず、本研究は、様々な糞便微生物叢CRCデータセットをアセンブルして均一に解析し、CRC症例で一貫して上昇していた主要な分類群を特定し、そしてCRC検出用の16S rRNA遺伝子ベースの糞便微生物バイオマーカーの複合セットを決定した。これは、高感度で、特異的かつ非侵襲的なCRC診断法を探索する上で、重要な一歩前進に相当する。
参照による組み入れ
本明細書に引用された全ての参考文献、記事、出版物、特許、特許公報、および特許出願は、あらゆる目的のためにそれらの全体が参照により本明細書に組み入れられる。
しかしながら、本明細書に引用された参考文献、記事、出版物、特許、特許公報、および特許出願についての言及は、それらが有効な先行技術を構成するまたは世界のどの国でも一般常識の一部を形成する、ということの承認または何らかの示唆ではなく、また、そのようなものとして解釈されるべきではない。
参考文献
Figure 2020513856
Figure 2020513856
Figure 2020513856
Figure 2020513856
Figure 2020513856

Claims (18)

  1. 対象における大腸癌(CRC)または大腸腺腫(CRA)を診断するための方法であって、
    該対象由来の腸サンプルを取得すること;
    該腸サンプルを処理して16S rRNA遺伝子配列データを得ること;
    16S rRNA遺伝子配列データを解析することを含む、該腸サンプル中の1種類または複数種類の微生物および/または操作的分類単位(OTU)のレベルを検出すること;および
    該腸サンプル中の2種類以上の微生物および/またはOTUのレベルが対照サンプルと比較して増加している場合、該対象をCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断すること
    を含み、ここで、該2種類以上の微生物および/またはOTUが、表1に記載される微生物および/またはOTUの群から選択される、方法。
  2. 前記2種類以上の微生物および/またはOTUが、OTU識別子:OTU1167、OTU3191、OTU2573、OTU1044、OTU567およびOTU1873からなる群より選択される、請求項1に記載の方法。
  3. 前記2種類以上の微生物および/またはOTUが、OTU識別子:OTU1167、OTU2790、OTU3191およびOTU1044からなる群より選択される、請求項1に記載の方法。
  4. 16S rRNA遺伝子配列データを解析するステップが、腸サンプルから微生物のポリヌクレオチドを抽出すること、腸サンプルから抽出された16S rRNAポリヌクレオチドの配列を決定すること、対象の腸サンプルからの16S rRNA配列をStrainSelectデータベースの参照配列に対してアライメントすること、およびSS-UPを使用してデノボクラスタリングを行うことを含む、請求項1に記載の方法。
  5. SS-UPを使用して16S rRNA遺伝子配列データを解析するステップが、微生物および/またはOTUの株レベルの分解能を提供する、請求項4に記載の方法。
  6. SS-UPを使用して16S rRNA遺伝子配列データを解析するステップが、少なくとも約80%の受信者操作特性曲線下面積(AUROC)を提供する、請求項4に記載の方法。
  7. SS-UPを使用して16S rRNA遺伝子配列データを解析するステップが、QIIME-CRによって提供される種レベルの分解能と比較して、OTUの株レベルの分解能を提供する、請求項4に記載の方法。
  8. 1種類または複数種類の微生物および/またはOTUのレベルを検出するステップが、複数のオリゴヌクレオチドを表1のOTUポリヌクレオチド配列にハイブリダイズさせることを含むアッセイを実施することを含む、請求項1に記載の方法。
  9. 前記複数のオリゴヌクレオチドがSEQ ID NO:1〜660の少なくとも1つに選択的にハイブリダイズするオリゴヌクレオチドを含む、請求項8に記載の方法。
  10. 前記1種類または複数種類の微生物および/またはOTUが、OTU1167 (SEQ ID NO:641〜647)、OTU3191 (SEQ ID NO:291〜513)、OTU1873 (648〜654)、OTU2573 (SEQ ID NO:8〜14)、OTU567 (SEQ ID NO:655〜660)、およびOTU1044 (SEQ ID NO:15〜25)からなる群より選択される、請求項8に記載の方法。
  11. 前記1種類または複数種類の微生物および/またはOTUが、OTU1167 (SEQ ID NO:641〜647)、OTU3191 (SEQ ID NO:291〜513)、OTU2790 (SEQ ID NO:191〜248)、およびOTU1044 (SEQ ID NO:15〜25)からなる群より選択される、請求項8に記載の方法。
  12. 腸サンプル中の2種類以上の微生物および/またはOTUのレベルが対照サンプルと比較して少なくとも約5%増加している場合、対象はCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断される、請求項1に記載の方法。
  13. 腸サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが、対照サンプルと比較して、log2変化倍率スケールで少なくとも約1.2倍増加している場合、対象はCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断される、請求項1に記載の方法。
  14. 腸サンプル中の1種類または複数種類の微生物および/またはOTUのレベルが、対照サンプルと比較して、少なくとも約2倍増加している場合、対象はCRCもしくはCRAがあるまたはCRCもしくはCRAを発症するリスクがあると診断される、請求項1に記載の方法。
  15. 対照サンプルが少なくとも5個体の健康な個体から収集された腸サンプルである、請求項1に記載の方法。
  16. 腸サンプルが便サンプルである、請求項1に記載の方法。
  17. 便サンプル中の前記2種類以上の微生物のレベルが対照サンプルと比較して増加している場合、対象をCRCがあるまたはCRCを発症するリスクがあると診断することを含む、請求項1に記載の方法。
  18. OTU1167 (SEQ ID NO:641〜647)、OTU3191 (SEQ ID NO:291〜513)、OTU1873 (648〜654)、OTU2573 (SEQ ID NO:8〜14)、OTU567 (SEQ ID NO:655〜660)、およびOTU1044 (SEQ ID NO:15〜25)のそれぞれの、少なくとも1つのOTUに相補的な複数のオリゴヌクレオチドを含む、対象におけるCRCまたはCRAを診断するための診断ツール。
JP2020500023A 2017-03-17 2018-03-16 大腸癌の複合バイオマーカーを特定するための配列ベースの糞便微生物群調査データの活用 Pending JP2020513856A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762472863P 2017-03-17 2017-03-17
US62/472,863 2017-03-17
PCT/US2018/022862 WO2018170396A1 (en) 2017-03-17 2018-03-16 Leveraging sequence-based fecal microbial community survey data to identify a composite biomarker for colorectal cancer

Publications (2)

Publication Number Publication Date
JP2020513856A true JP2020513856A (ja) 2020-05-21
JP2020513856A5 JP2020513856A5 (ja) 2021-04-22

Family

ID=63522628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020500023A Pending JP2020513856A (ja) 2017-03-17 2018-03-16 大腸癌の複合バイオマーカーを特定するための配列ベースの糞便微生物群調査データの活用

Country Status (9)

Country Link
US (1) US20200011873A1 (ja)
EP (1) EP3596237A4 (ja)
JP (1) JP2020513856A (ja)
KR (1) KR20190140925A (ja)
CN (1) CN110637097A (ja)
AU (1) AU2018234737A1 (ja)
CA (1) CA3056789A1 (ja)
SG (1) SG11201908571UA (ja)
WO (1) WO2018170396A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102241357B1 (ko) * 2020-10-20 2021-04-16 주식회사 에이치이엠 머신러닝 모델을 이용하여 대장용종을 진단하는 방법 및 장치
KR102304399B1 (ko) * 2021-03-26 2021-09-24 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 고혈당을 판별하는 방법 및 진단 장치
KR102304402B1 (ko) * 2021-03-26 2021-09-24 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 비만 여부를 판별하는 방법 및 진단 장치
KR20220008213A (ko) * 2020-07-13 2022-01-20 서울대학교병원 에스트로겐을 포함하는 장내 미생물총 변화를 통한 남성의 대장암 예방 또는 치료용 조성물
WO2022250444A1 (ko) * 2021-05-25 2022-12-01 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 복부팽만 유무를 판별하는 방법 및 진단 장치

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107868837B (zh) * 2017-12-12 2019-03-01 苏州普瑞森基因科技有限公司 一种用于分析肠道微生物的引物组合物及其应用
WO2020178297A1 (en) * 2019-03-04 2020-09-10 Fundación Para La Investigación Biomédica Del Hospital Ramón Y Cajal Anal bacterial biomarkers for the diagnosis of anal precancerous lesions
CN109943636B (zh) * 2019-04-11 2020-01-24 上海宝藤生物医药科技股份有限公司 一种结直肠癌微生物标志物及其应用
CN110512015A (zh) * 2019-09-11 2019-11-29 苏州普瑞森基因科技有限公司 一种肠癌生物标志物组合物及其应用
CN112029882B (zh) * 2020-09-17 2022-09-09 中国农业科学院植物保护研究所 一种从环境中分离有益微生物的方法
CN112410449A (zh) * 2021-01-25 2021-02-26 天津奇云诺德生物医学有限公司 一种与结直肠癌相关的微生物标志物及其应用
CN112725457B (zh) * 2021-03-08 2022-09-02 温州医科大学 用于判断肠癌的肠道菌群标志物及其检测方法
CN112863606B (zh) * 2021-03-08 2022-07-26 杭州微数生物科技有限公司 细菌鉴定和分型分析基因组数据库及鉴定和分型分析方法
CN114032278A (zh) * 2021-03-26 2022-02-11 上海交通大学医学院 结直肠癌的微生物标志物及其应用
WO2023049842A1 (en) * 2021-09-23 2023-03-30 Flagship Pioneering Innovations Vi, Llc Diagnosis and treatment of diseases and conditions of the intestinal tract
CN114369673B (zh) * 2022-01-06 2023-07-14 同济大学 结直肠腺瘤生物标志物、试剂盒及生物标志物的筛选方法
CN114373508B (zh) * 2022-01-24 2024-02-02 浙江天科高新技术发展有限公司 一种基于16S rDNA序列的菌种鉴定方法
CN114496088B (zh) * 2022-01-27 2023-06-20 中国农业科学院兰州兽医研究所 一种棘球蚴病微生物标志物及其筛选方法和应用
WO2023242413A1 (en) * 2022-06-17 2023-12-21 Barcelona Supercomputing Center - Centro Nacional De Supercomputación Method for screening for colorectal cancer using fecal microbiome profiling

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040170954A1 (en) * 2003-02-10 2004-09-02 Mckenney Keith Pathogen inactivation assay
US20040170981A1 (en) * 2003-02-10 2004-09-02 Mckenney Keith Real-time polymerase chain reaction using large target amplicons
WO2014153194A2 (en) * 2013-03-14 2014-09-25 Seres Health, Inc. Methods for pathogen detection and enrichment from materials and compositions
WO2014197607A1 (en) * 2013-06-05 2014-12-11 The Regents Of The University Of California Detection of tick-borne diseases
WO2015018307A1 (en) * 2013-08-06 2015-02-12 Bgi Shenzhen Co., Limited Biomarkers for colorectal cancer

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FRONTIERS IN CELLULAR AND INFECTION MICROBIOLOGY, 2016, VOL.6, ARTICLE 179, JPN6022005532, ISSN: 0004908180 *
GUT, 2017, VOL.66, PP.1441-1448, JPN6022005538, ISSN: 0004908183 *
GUT, 2017, VOL.66, PP.633-643, JPN6022005534, ISSN: 0004908181 *
GUT, 2017, VOL.66, PP.70-78, JPN6022005536, ISSN: 0004908182 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220008213A (ko) * 2020-07-13 2022-01-20 서울대학교병원 에스트로겐을 포함하는 장내 미생물총 변화를 통한 남성의 대장암 예방 또는 치료용 조성물
KR102623834B1 (ko) * 2020-07-13 2024-01-12 서울대학교병원 에스트로겐을 포함하는 장내 미생물총 변화를 통한 남성의 대장암 예방 또는 치료용 조성물
KR102241357B1 (ko) * 2020-10-20 2021-04-16 주식회사 에이치이엠 머신러닝 모델을 이용하여 대장용종을 진단하는 방법 및 장치
WO2022085941A1 (ko) * 2020-10-20 2022-04-28 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 대장용종 유무를 진단하는 방법 및 장치
KR102304399B1 (ko) * 2021-03-26 2021-09-24 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 고혈당을 판별하는 방법 및 진단 장치
KR102304402B1 (ko) * 2021-03-26 2021-09-24 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 비만 여부를 판별하는 방법 및 진단 장치
WO2022203306A1 (ko) * 2021-03-26 2022-09-29 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 고혈당을 판별하는 방법 및 진단 장치
WO2022203307A1 (ko) * 2021-03-26 2022-09-29 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 비만 여부를 판별하는 방법 및 진단 장치
WO2022250444A1 (ko) * 2021-05-25 2022-12-01 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 복부팽만 유무를 판별하는 방법 및 진단 장치

Also Published As

Publication number Publication date
CA3056789A1 (en) 2018-09-20
SG11201908571UA (en) 2019-10-30
CN110637097A (zh) 2019-12-31
EP3596237A4 (en) 2021-01-27
KR20190140925A (ko) 2019-12-20
EP3596237A1 (en) 2020-01-22
WO2018170396A1 (en) 2018-09-20
AU2018234737A1 (en) 2019-10-10
US20200011873A1 (en) 2020-01-09

Similar Documents

Publication Publication Date Title
JP2020513856A (ja) 大腸癌の複合バイオマーカーを特定するための配列ベースの糞便微生物群調査データの活用
Links et al. The chaperonin-60 universal target is a barcode for bacteria that enables de novo assembly of metagenomic sequence data
AU2015216742B2 (en) Apparatus, kits and methods for the prediction of onset of sepsis
JP6830094B2 (ja) 染色体異常を検出するための核酸及び方法
US10520503B2 (en) Compositions and methods for determining the likelihood of appendicitis
EP2456885A2 (en) Methods for assessing disease risk
CN112538545B (zh) 真菌微生物组作为标志物在制备治疗筛查和肺癌诊断中的应用
EP4035161A1 (en) Systems and methods for diagnosing a disease condition using on-target and off-target sequencing data
CN109797438A (zh) 一种用于16S rDNA可变区定量测序文库构建的接头元件及文库构建方法
CN111411150A (zh) 诊断肌少症的肠道菌群及其应用
CN114269944A (zh) 使用探针、探针分子以及包含探针的阵列组合检测基因组序列用于对生物体特异性检测
JP6588536B2 (ja) 異なる種属の微生物間の種類と存在比を比較するための人工外来性参照分子
CN111662992A (zh) 与急性胰腺炎相关的菌群及其应用
CN114736970B (zh) 一种鉴别不同人群的方法
CN113637782B (zh) 与急性胰腺炎病程进展相关的微生物标志物及其应用
CN114045353B (zh) 与诺如病毒感染性腹泻相关的微生物标志物及其用途
CN113832080B (zh) 系统性红斑狼疮疾病标志性肠道微生物组合及其应用
CN113789289B (zh) 评估系统性红斑狼疮患病风险的肠道微生物组合及其检测试剂
US20230326600A1 (en) A method for determining a diagnostic outcome
EP4234720A1 (en) Epigenetic biomarkers for the diagnosis of thyroid cancer
WO2024030342A1 (en) Methods and compositions for nucleic acid analysis
CN113832079A (zh) 肠道微生物组合及其作为系统性红斑狼疮标志物的应用
WO2024077162A2 (en) Probes for improving coronavirus sample surveillance
TW202413655A (zh) 標誌物在診斷乳腺癌或預測乳腺癌風險中的用途
Xu et al. Characterization of Microbial Diversity in Food Chain: A Molecular Review

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210312

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210312

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220812

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221031