JP2022532761A - 異数性の迅速検出法 - Google Patents

異数性の迅速検出法 Download PDF

Info

Publication number
JP2022532761A
JP2022532761A JP2021568507A JP2021568507A JP2022532761A JP 2022532761 A JP2022532761 A JP 2022532761A JP 2021568507 A JP2021568507 A JP 2021568507A JP 2021568507 A JP2021568507 A JP 2021568507A JP 2022532761 A JP2022532761 A JP 2022532761A
Authority
JP
Japan
Prior art keywords
cancer
amplicon
sample
primer
aneuploidy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021568507A
Other languages
English (en)
Other versions
JPWO2020236625A5 (ja
Inventor
バート フォーゲルシュタイン
ケネス ダブリュ. キンズラー
クリストファー デュヴィル
ニコラス パパドプロス
クリスティアン トマセッティ
Original Assignee
ザ・ジョンズ・ホプキンス・ユニバーシティー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ・ジョンズ・ホプキンス・ユニバーシティー filed Critical ザ・ジョンズ・ホプキンス・ユニバーシティー
Publication of JP2022532761A publication Critical patent/JP2022532761A/ja
Publication of JPWO2020236625A5 publication Critical patent/JPWO2020236625A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)

Abstract

本文書により、哺乳動物を、疾患(例えば、がんまたは先天異常)を有すると特定するために使用され得る染色体異常を同定するための方法および材料を提供する。例えば、本文書により、哺乳動物を、1つまたは複数の染色体異常と関連している疾患(例えば、がんまたは先天異常)を有すると特定するためにシーケンシングデータを評価するための方法および材料を提供する。例えば、本文書により、がんの診断法、非侵襲的出生前検査(NIPT)、着床前遺伝子診断および先天異常の評価において使用され得るシーケンシングデータを評価するための方法および材料を提供する。

Description

関連出願の相互参照
本出願は、2019年5月17日に出願された米国特許仮出願第62/849,662号;2019年9月24日に出願された米国特許仮出願第62/905,327号および2020年2月6日に出願された米国特許仮出願第62/971,050号の恩典を主張する。これらの先行出願の開示内容は本出願の開示内容の一部とみなす(かつ、参照により本明細書に組み入れられる)。
政府による資金提供の記載
本発明は、米国国立衛生研究所によって付与された助成金CA230691およびCA230400での政府の補助を伴ってなされた。米国政府は、本発明において一定の権利を有する。
1. 技術分野
本文書により、がんの診断法、非侵襲的出生前検査(NIPT)、着床前遺伝子診断および先天異常の評価において使用され得る染色体異常を同定するための方法および材料を提供する。例えば、本文書により、哺乳動物を、1つまたは複数の染色体異常と関連している疾患(例えば、がんまたは先天異常)を有すると特定するためにシーケンシングデータを評価するための方法および材料を提供する。付加的または択一的に、本文書により、がんの診断法、非侵襲的出生前検査(NIPT)、着床前遺伝子診断および先天異常の評価において使用され得るシーケンシングデータを評価するための方法および材料を提供する。
2. 背景情報
異数性は染色体数の異常と定義される。これは、がんにおいて同定された最初のゲノム異常であり(Boveri 2008 Journal of cell science 121(Supplement 1):1-84(非特許文献1);およびNowell 1976 Science 194(4260):23-28(非特許文献2))、ほとんどの組織病理学的な型のがんの>90%に存在していると推定されている(Knouse et al. 2017 Annual Review of Cancer Biology 1:335-354(非特許文献3))。がんにおける異数性は核型試験によって最初に検出され、後にマイクロアレイ、サンガーシーケンシングによって、ごく最近では超並列シーケンシング法によって評価された(Wang et al. 2002 Proceedings of the National Academy of Sciences 99(25):16156-16161(非特許文献4))。最近のシーケンシング法としては、サーキュラーバイナリーセグメンテーション(circular binary segmentation)、隠れマルコフモデル、期待値最大化および平均値シフトを使用するもの((Zhao et al. 2013 BMC bioinformatics 14(11):S1(非特許文献5))に概説されているようなもの)が挙げられる。がんのゲノムへの応用に加え、このような技術は、ダウン症および他のトリソミーを有する胎児の非侵襲的出生前検出のための根拠となる(Bianchi et al. 2015 JAMA 314(2):162-169(非特許文献6);Zhao et al. 2015 Clinical chemistry 61(4):608-616(非特許文献7))。
Boveri 2008 Journal of cell science 121(Supplement 1):1-84 Nowell 1976 Science 194(4260):23-28 Knouse et al. 2017 Annual Review of Cancer Biology 1:335-354 Wang et al. 2002 Proceedings of the National Academy of Sciences 99(25):16156-16161 Zhao et al. 2013 BMC bioinformatics 14(11):S1 Bianchi et al. 2015 JAMA 314(2):162-169 Zhao et al. 2015 Clinical chemistry 61(4):608-616
概要
本開示は、1つまたは複数の染色体異常(例えば、異数性)を同定するための方法および材料に関する。一部の態様では、本開示により、哺乳動物を、1つまたは複数の染色体異常と関連している疾患または障害を有すると特定するためにアンプリコンベースシーケンシングのデータを使用するための方法および材料を提供する。例えば、本明細書に記載の方法および材料は、哺乳動物から採取された試料に適用され、哺乳動物が1つまたは複数の染色体異常を有すると特定され得る。例えば、哺乳動物は、少なくとも一部において1つまたは複数の異数性の存在に基づいて、疾患または障害を有すると特定され得る。一部の態様では、単一のプライマーペアを用いてゲノム全体のゲノム内エレメントを増幅する。例えば、本明細書に記載の単一のプライマーペアを用いて固有の反復エレメント(例えば、アンプリコン)が約1,000,000個に増幅され得る。一部の態様では、増幅された固有の反復エレメントは平均で100塩基対(bp)未満のサイズである。一部の態様では、あるアプローチ(WALDO(Within-Sample-AneupLoidy-DetectiOn、サンプル内異数性検出)と称される)を用いて、アンプリコンから得られたシーケンシングデータを評価し、1つまたは複数の染色体異常(例えば、異数性)の存在が同定され得る。本明細書に記載のように、健常人由来の1,348例の血漿試料およびがん患者由来の883例の血漿試料における異数性のアセスメントでは、がん患者由来の血漿試料の49%において異数性が検出された。
一局面では、本明細書において、哺乳動物のゲノムにおける異数性の存在について検査する方法を提供する。方法は、複数のアンプリコンを形成させるために、DNAサンプル中の複数の染色体配列を、染色体配列に相補的なプライマーペアを用いて増幅する工程;複数のアンプリコンのうちの1つまたは複数の核酸配列の少なくとも一部分を決定する工程;シーケンシングされたアンプリコンを参照ゲノムにマッピングする工程;DNAサンプルを複数のゲノム区間に分割する工程;ゲノム区間にマッピングされたアンプリコンに関する複数の特徴を定量する工程;第1のゲノム区間内のアンプリコンの複数の特徴を、1つまたは複数の異なるゲノム区間内のアンプリコンの複数の特徴と比較する工程を含み;増幅する工程で少なくとも100,000個のアンプリコンが形成される(例えば、複数のアンプリコンとしては約745,000個のアンプリコンが挙げられ得る)。
一部の態様では、方法がインビトロで行なわれる。一部の態様では、複数のアンプリコンが、約1,000,000個のアンプリコン、例えば約1,000,000~10,000個のアンプリコン;約1,000,000~50,000個のアンプリコン;約1,000,000~100,000個のアンプリコン;約1,000,000~200,000個のアンプリコン;約1,000,000~300,000個のアンプリコン;約1,000,000~400,000個のアンプリコン;約1,000,000~500,000個のアンプリコン;約1,000,000~600,000個のアンプリコン;約1,000,000~700,000個のアンプリコン;約1,000,000~800,000個のアンプリコン;約1,000,000~900,000個のアンプリコン;約900,000~10,000個のアンプリコン;約800,000~10,000個のアンプリコン;約700,000~10,000個のアンプリコン;約600,000~10,000個のアンプリコン;約500,000~10,000個のアンプリコン;約400,000~10,000個のアンプリコン;約300,000~10,000個のアンプリコン;約200,000~10,000個のアンプリコン;約100,000~10,000個のアンプリコンまたは約50,000~10,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが、約50,000個のアンプリコン;約100,000個のアンプリコン;約150,000個のアンプリコン;約200,000個のアンプリコン;約250,000個のアンプリコン;約300,000個のアンプリコン;約350,000個のアンプリコン;約400,000個のアンプリコン;約450,000個のアンプリコン;約500,00個のアンプリコン;約550,000個のアンプリコン;約600,000個のアンプリコン;約650,000個のアンプリコン;約700,000個のアンプリコン;約750,000個のアンプリコン;約800,000個のアンプリコン;約850,000個のアンプリコン;約900,000個のアンプリコン;約950,000個のアンプリコン;または約1,000,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが約750,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが約350,000個のアンプリコンを含む。
一部の態様では、本明細書に開示の単一のプライマーペアによって増幅される反復エレメント、例えばアンプリコンの数が、サンプル中に存在する反復エレメントの数および/またはサンプル中に存在する反復エレメントの長さの関数である。例えば、一部のサンプルでは、単一のプライマーペアを用いて検出され得る反復エレメント、例えばアンプリコンの数が約750,000個以下のアンプリコンである。一部の態様において、他のサンプルでは、単一のプライマーペアを用いて検出され得る反復エレメント、例えばアンプリコンの数が約350,000個以下のアンプリコンである。
一部の態様では、DNAサンプルが複数の正倍数性DNAサンプルである。一部の態様では、DNAサンプルが複数の検査DNAサンプルである。一部の態様では、DNAサンプルが複数の検査DNAサンプルである。一部の態様では、DNAサンプルが血漿に由来する。一部の態様では、DNAサンプルが血清に由来する。一部の態様では、DNAサンプルが胎児細胞内DNAを含む。一部の態様では、DNAサンプルが少なくとも3ピコグラムのDNAを含む。一部の態様では、哺乳動物がヒトである。一部の態様では、プライマーペアが、SEQ ID NO:1を含む第1のプライマーとSEQ ID NO:10を含む第2のプライマーを含む。一部の態様では、本明細書において提供する方法が、1つまたは複数のさらなるプライマーペアを含む。一部の態様では、アンプリコンが、反復エレメント(例えば、表1に示す1つまたは複数の型の反復エレメント)を含む。一部の態様では、アンプリコンが、固有の短鎖散在反復配列(short interspersed nucleotide element)(SINE)を含む。一部の態様では、アンプリコンが、固有の長鎖散在反復配列(long interspersed nucleotide element)(LINE)を含む。
一部の態様では、アンプリコンの平均長さが約100塩基対以下である。一部の態様では、アンプリコンの平均長さが約110bp未満、例えば約10~110bp、約10~105bp、約10~100bp、約10~99bp、約10~98bp、約10~97bp、約10~96bp、約10~95bp、約10~94bp、約10~93bp、約10~92bp、約10~91bp、約10~90bp、約10~89bp、約10~87bp、約10~86bp、約10~85bp、約10~84bp、約10~83bp、約10~82bp、約10~81bp、約10~80bp、約10~79bp、約10~78bp、約10~77bp、約10~76bp、約10~75bp、約10~74bp、約10~73bp、約10~72bp、約10~71bp、約10~70bp、約10~65bp、約10~60bp、約10~55bp、約10~50bp、約10~40bp、約10~30bp、約10~20bp、約15~110bp、約20~110bp、約25~110bp、約30~110bp、約35~110bp、約40~110bp、約45~110bp、約50~110bp、約55~110bp 約60~110bp、約65~110bp、約70~110bp、約75~110bp、約80~110bp、約85~110bp、約90~110bp、約95~110bp、約100~110bpまたは約105~110bpである。
一部の態様では、アンプリコンの平均長さが約10bp;約20bp;約30bp;約40bp;約45bp;約50bp;約60bp;約65bp;約70bp;約75bp;約80bp;約85bp;約90bp;約95bp;約100bp;約105bpまたは約110bpである。
一部の態様では、アンプリコンが、1つまたは複数の長鎖アンプリコンを含み、その平均長さが1000塩基対以上である。一部の態様では、長鎖アンプリコンが、夾雑細胞由来のDNAを含む。一部の態様では、夾雑細胞が白血球である。一部の態様では、ゲノム区間が、約100個のヌクレオチド~約125,000,000個のヌクレオチドを含む(例えば、ゲノム区間は約500,000個のヌクレオチドを含み得る)。
別の局面では、本開示により、対象を、対象における複数のがんのいずれか、例えば少なくとも4つのがんのいずれかの存在またはその発症リスクについて評価する方法であって、
(i)1つまたは複数の遺伝子バイオマーカー、例えば、1つまたは複数の遺伝子(例えば、1つまたは複数のドライバー遺伝子、例えば少なくとも4個のドライバー遺伝子)の各々における1つまたは複数の変異(例えば、1つまたは複数のドライバー遺伝子変異)の存在に関する、例えば検出するための、値を取得、例えば直接取得または間接的に取得する工程であって、任意で、各遺伝子、例えばドライバー遺伝子は複数のがんのうちの1つのがんの存在またはリスクと関連している、工程;
(ii)複数の、例えば少なくとも4つのタンパク質バイオマーカーの各々のレベルに関する、例えば検出するための、値を取得、例えば直接取得または間接的に取得する工程であって、任意で、複数のタンパク質バイオマーカーの各々のレベルは、複数のがんのうちの1つのがんの存在またはリスクと関連している、工程;あるいは
(iii)異数性に関する、例えば検出するための、値を取得、例えば直接取得または間接的に取得する工程であって、異数性の値は、反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数または長さの関数であり、REファミリーは、
(a)長鎖散在反復配列(LINE)以外のREファミリー、
(b)自身の末端反復エレメントに相補的なプライマー部分を用いて増幅されるとX nt未満の平均長さを有するアンプリコンをもたらすREファミリーであって、ここで、Xは100、105もしくは110である、REファミリー、
(c)約700bp未満の長さであるREファミリー、あるいは
(d)少なくとも100コピー/ゲノムで存在するREファミリー
を含み;
任意で、異数性は、複数のがんのうちの1つのがんの存在またはリスクと関連しており;
それにより、対象を、複数のがんのいずれか、例えば少なくとも4つのがんのいずれかの存在またはその発症リスクについて評価する、工程
を含む方法を提供する。
一態様では、(i)、(ii)および(iii)のうちの1つが直接取得される。一態様では、(i)と(ii)が直接取得される。一態様では、(i)と(iii)が直接取得される。一態様では、(ii)と(iii)が直接取得される。一態様では、(i)、(ii)および(iii)のすべてが直接取得される。
一態様では、(i)、(ii)および(iii)のうちの1つが間接的に取得される。一態様では、(i)と(ii)が間接的に取得される。一態様では、(i)と(iii)が間接的に取得される。一態様では、(ii)と(iii)が間接的に取得される。一態様では、(i)、(ii)および(iii)のすべてが間接的に取得される。
一態様では、方法が、遺伝子バイオマーカーを含む1つもしくは複数のサブゲノム区間もしくはアンプリコンをシーケンシングする工程を含む。一態様では、方法が、1つもしくは複数のゲノム配列を異数性について解析する工程を含む。一態様では、方法が、タンパク質バイオマーカーを検出試薬と接触させる工程を含む。一態様では、方法が、(1)遺伝子バイオマーカーを含む1つもしくは複数のサブゲノム区間もしくはアンプリコンをシーケンシングする工程、(2)1つもしくは複数のゲノム配列を異数性について解析する工程、および/または(3)タンパク質バイオマーカーを検出試薬と接触させる工程を含む。
一態様では、異数性の値が、REファミリーの少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数の関数である。一態様では、異数性の値が、反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列の長さの関数である。
一部の態様では、方法がインビトロで行なわれる。
一態様では、対象から採取されたサンプル、例えば生体試料が、(i)~(iii)のうちの1つ、2つまたは全部について評価される。一態様では、生体試料が、液状試料、例えば血液試料を含む。一態様では、生体試料が、セルフリーDNAサンプル、血漿試料または血清試料を含む。一態様では、生体試料が、セルフリーDNA、例えば循環腫瘍DNAを含む。一態様では、生体試料が細胞および/または組織を含む。一態様では、生体試料が細胞(例えば、正常細胞またはがん細胞)およびセルフリーDNAを含む。
本明細書に開示のいずれかの方法の一態様では、(i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出の特異度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う複数のがんのうちの1つのがんの検出の特異度と実質的に同じである、例えば(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う複数のがんのうちの1つのがんの検出の特異度より実質的に低くない。
本明細書に開示のいずれかの方法の一態様では、(i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出感度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う複数のがんのうちの1つのがんの検出感度より高い、例えば約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍高い。一態様では、ある特定の特異度における、例えば所定の特異度、例えば少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の特異度における検出感度の上昇、例えば検出感度の約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍の上昇。
一部の態様では、複数のアンプリコンが、約1,000,000個のアンプリコン、例えば約1,000,000~10,000個のアンプリコン;約1,000,000~50,000個のアンプリコン;約1,000,000~100,000個のアンプリコン;約1,000,000~200,000個のアンプリコン;約1,000,000~300,000個のアンプリコン;約1,000,000~400,000個のアンプリコン;約1,000,000~500,000個のアンプリコン;約1,000,000~600,000個のアンプリコン;約1,000,000~700,000個のアンプリコン;約1,000,000~800,000個のアンプリコン;約1,000,000~900,000個のアンプリコン;約900,000~10,000個のアンプリコン;約800,000~10,000個のアンプリコン;約700,000~10,000個のアンプリコン;約600,000~10,000個のアンプリコン;約500,000~10,000個のアンプリコン;約400,000~10,000個のアンプリコン;約300,000~10,000個のアンプリコン;約200,000~10,000個のアンプリコン;約100,000~10,000個のアンプリコンまたは約50,000~10,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが、約50,000個のアンプリコン;約100,000個のアンプリコン;約150,000個のアンプリコン;約200,000個のアンプリコン;約250,000個のアンプリコン;約300,000個のアンプリコン;約350,000個のアンプリコン;約400,000個のアンプリコン;約450,000個のアンプリコン;約500,00個のアンプリコン;約550,000個のアンプリコン;約600,000個のアンプリコン;約650,000個のアンプリコン;約700,000個のアンプリコン;約750,000個のアンプリコン;約800,000個のアンプリコン;約850,000個のアンプリコン;約900,000個のアンプリコン;約950,000個のアンプリコン;または約1,000,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが約750,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが約350,000個のアンプリコンを含む。
一部の態様では、本明細書に開示の単一のプライマーペアによって増幅される反復エレメント、例えばアンプリコンの数が、サンプル中に存在する反復エレメントの数および/またはサンプル中に存在する反復エレメントの長さの関数である。例えば、一部のサンプルでは、単一のプライマーペアを用いて検出され得る反復エレメント、例えばアンプリコンの数が約750,000個以下のアンプリコンである。一部の態様において、他のサンプルでは、単一のプライマーペアを用いて検出され得る反復エレメント、例えばアンプリコンの数が約350,000個以下のアンプリコンである。
一部の態様では、アンプリコンの平均長さが約100塩基対以下である。一部の態様では、アンプリコンの平均長さが約110bp未満、例えば約10~110bp、約10~105bp、約10~100bp、約10~99bp、約10~98bp、約10~97bp、約10~96bp、約10~95bp、約10~94bp、約10~93bp、約10~92bp、約10~91bp、約10~90bp、約10~89bp、約10~87bp、約10~86bp、約10~85bp、約10~84bp、約10~83bp、約10~82bp、約10~81bp、約10~80bp、約10~79bp、約10~78bp、約10~77bp、約10~76bp、約10~75bp、約10~74bp、約10~73bp、約10~72bp、約10~71bp、約10~70bp、約10~65bp、約10~60bp、約10~55bp、約10~50bp、約10~40bp、約10~30bp、約10~20bp、約15~110bp、約20~110bp、約25~110bp、約30~110bp、約35~110bp、約40~110bp、約45~110bp、約50~110bp、約55~110bp 約60~110bp、約65~110bp、約70~110bp、約75~110bp、約80~110bp、約85~110bp、約90~110bp、約95~110bp、約100~110bpまたは約105~110bpである。
一部の態様では、アンプリコンの平均長さが約10bp;約20bp;約30bp;約40bp;約45bp;約50bp;約60bp;約65bp;約70bp;約75bp;約80bp;約85bp;約90bp;約95bp;約100bp;約105bpまたは約110bpである。
一部の態様では、方法が、対象を器官または体内領域の放射線スキャン、例えばPET-CTスキャンに供する工程をさらに含む。一部の態様では、器官または体内領域の放射線スキャン法によってがんを特性評価する。一部の態様では、器官または体内領域の放射線スキャン法によってがんの場所を特定する。一部の態様では、放射線スキャンがPET-CTスキャンである。一部の態様では、対象が複数のがんの各々の存在について評価された後に放射線スキャン法が行なわれる。
別の局面では、本開示により、哺乳動物のゲノムにおける異数性の存在について検査する方法を提供する。方法は、
a)複数のアンプリコンを形成させるために、DNAサンプル中の複数の染色体配列を、プライマー部分、例えば、染色体配列に相補的な1つのプライマーまたはプライマーペアを用いて増幅する工程であって、例えばプライマー部分は、異数性の検出を可能とするのに充分な数の配列を増幅する、工程;
b)複数のアンプリコンのうちの1つまたは複数の核酸配列の少なくとも一部分を決定する工程;
c)シーケンシングされたアンプリコンを参照ゲノムにマッピングする工程;
d)DNAサンプルを複数のゲノム区間に分割する工程;
e)ゲノム区間にマッピングされたアンプリコンに関する複数の特徴を定量する工程;
f)第1のゲノム区間内のアンプリコンの複数の特徴を、1つまたは複数の異なるゲノム区間内のアンプリコンの複数の特徴と比較する工程
を含み;
増幅する工程で、異数性を検出するのに充分な数のアンプリコン、例えば少なくとも10,000、20,000、50,000または100,000個のアンプリコンが形成される。
一部の態様では、方法がインビトロで行なわれる。
本明細書に開示のいずれかの方法の一態様では、複数のがんのうちの1つのがんの検出感度の上昇によって複数のがんのうちの1つのがんの検出の特異度が影響されない、例えば低下せず、実質的に低下もしない。一態様では、複数のがんのうちの1つのがんの検出の特異度がプラトー状態である、例えば検出の特異度は、さらなるバイオマーカーの検出によって変わることはない。
別の局面では、本明細書において、低インプットのDNAを含むサンプルにおいて、本文書に開示のいずれかの方法を用いて異数性を検出する方法を提供する。
一部の態様では、サンプルが約0.01ピコグラム(pg)~500 pgのDNAを含む。一部の態様では、サンプルが、約0.01~500pg、0.05~400pg、0.1~300pg、0.5~200pg、1~100pg、10~90pgまたは20~50pgのDNAを含む。一部の態様では、サンプルが、少なくとも0.01 pg、少なくとも.01 pg、少なくとも0.1 pg、少なくとも1 pg. 少なくとも2 pg、少なくとも3 pg、少なくとも4 pg、少なくとも5 pg、少なくとも6 pg、少なくとも7 pg、少なくとも8 pg、少なくとも9 pg 少なくとも10pg、少なくとも11 pg、少なくとも12 pg、少なくとも13 pg、少なくとも14 pg、少なくとも15 pg、少なくとも16 pg、少なくとも17 pg、少なくとも18 pg、少なくとも19 pg、少なくとも20 pg、少なくとも21 pg、少なくとも22 pg、少なくとも23 pg、少なくとも24 pg、少なくとも25 pg、少なくとも26 pg、少なくとも27 pg、少なくとも28 pg、少なくとも29 pg、少なくとも30 pg、少なくとも31 pg、少なくとも32 pg、少なくとも33 pg、少なくとも34 pg、少なくとも35 pg、少なくとも36 pg、少なくとも37 pg、少なくとも38 pg、少なくとも39 pg、少なくとも40 pg、少なくとも50 pg、少なくとも60 pg、少なくとも70 pg、少なくとも80 pg、少なくとも90 pg、少なくとも100pg、少なくとも150pg、少なくとも200 pg、少なくとも300 pg、少なくとも350 pg、少なくとも400 pg、少なくとも450 pgまたは少なくとも500 pgのDNAを含む。
一部の態様では、サンプルが1 pgのDNAを含む。一部の態様では、サンプルが2 pgのDNAを含む。一部の態様では、サンプルが3 pgのDNAを含む。一部の態様では、サンプルが4 pgのDNAを含む。一部の態様では、サンプルが5 pgのDNAを含む。一部の態様では、サンプルが10 pgのDNAを含む。
一部の態様では、サンプルが対象由来の生体試料である。一態様では、生体試料が、液状試料、例えば血液試料を含む。一態様では、生体試料が、セルフリーDNAサンプル、血漿試料または血清試料を含む。一態様では、生体試料が、セルフリーDNA、例えば循環腫瘍DNAを含む。一態様では、生体試料が細胞および/または組織を含む。一態様では、生体試料が細胞(例えば、正常細胞またはがん細胞)およびセルフリーDNAを含む。
一部の態様では、サンプルが21トリソミー試料である。一部の態様では、サンプルが法医学的試料である。一部の態様では、サンプルが胚由来、例えば着床前の胚由来である。
一部の態様では、サンプルが、例えば実施例3に記載のようなバイオバンク試料である。
一部の態様では、方法が、診断法、例えば着床前診断法のために使用される。
一部の態様では、方法が法医学のために使用される。
一部の態様では、方法がインビトロ法である。
別の局面では、本明細書において、本文書に開示のいずれかの方法を用いてサンプルを同定または区別する方法を提供する。
一部の態様では、対象(例えば、第1の対象)由来のサンプル、例えば第1のサンプルが第2の対象由来の第2のサンプルと区別される。一部の態様では、サンプル、例えば第1のサンプルが、多型(例えば、複数の多型、例えば一般的多型)に基づいて第1の対象由来であると同定される。一部の態様では、第2のサンプルが、多型(例えば、複数の多型、例えば一般的多型)に基づいて第2の対象由来であると同定される。一部の態様では、一般的多型が、例えば本文書に記載のような反復エレメント内に存在する。一部の態様では、実施例8に開示した方法がサンプルを同定および/または区別するために使用され得る。
別の局面では、本明細書において、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9または少なくとも10種類の検出試薬を含む反応混合物であって、1種類の検出試薬が、(i)本文書において言及される1つもしくは複数の遺伝子バイオマーカー;(ii)本文書において言及される1つもしくは複数のタンパク質バイオマーカー;および/または(iii)本文書において言及される反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数もしくは長さ、例えば異数性のレベルまたは存在に関する値である読み出し情報を媒介する反応混合物を提供する。
また別の局面では、本開示により、以下を含むキットを提供する:(a)少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9または少なくとも10種類の検出試薬であって、1種類の検出試薬が、(i)本文書において言及される1つもしくは複数の遺伝子バイオマーカー;(ii)本文書において言及される1つもしくは複数のタンパク質バイオマーカー;および/または(iii)本文書において言及される反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数もしくは長さ、例えば異数性のレベルまたは存在に関する値である読み出し情報を媒介する、検出試薬;ならびに(b)キットを使用するための使用説明書。
本明細書に開示のいずれかの方法の一部の態様では、ゲノム区間にマッピングされたアンプリコンを定量する工程が、1つまたは複数の共有アンプリコン特徴を有する複数のゲノム区間を同定することを含む。一部の態様では、共有アンプリコン特徴が、マッピングされたアンプリコンの数である。
本明細書に開示のいずれかの方法の一部の態様では、共有アンプリコン特徴が、マッピングされたアンプリコンの平均長さである。一部の態様では、共有アンプリコン特徴を有する複数のゲノム区間がクラスターへ群分けされる。一部の態様では、各クラスターが、約200個のゲノム区間を含む。一部の態様では、クラスターが、規定済みクラスターを含む。一部の態様では、ゲノム区間の比較が、検査サンプル由来の1つまたは複数のゲノム区間を規定済みクラスターとマッチさせることをさらに含む。一部の態様では、検査サンプル由来のゲノム区間を規定済みクラスターとマッチさせることが、規定済みクラスターに関する所定の有意性閾値外の共有アンプリコン特徴を有する1つまたは複数のゲノム区間を同定することをさらに含む。一部の態様では、方法が、教師あり機械学習を含む。一部の態様では、教師あり機械学習が、サポートベクターマシンモデルを使用する。
本明細書に開示のいずれかの方法の一部の態様では、SEQ ID NO:1と少なくとも80%同一である配列を含む第1のプライマーおよびSEQ ID NO:10と少なくとも80%同一である配列を含む第2のプライマーを含む単一のプライマーペアがDNAサンプルからの複数のアンプリコンの増幅のために使用される。一部の態様では、第1のプライマーの配列がSEQ ID NO:1と少なくとも90%同一である。一部の態様では、第1のプライマーの配列がSEQ ID NO:1と少なくとも95%同一である。一部の態様では、第1のプライマーの配列がSEQ ID NO:1と100%同一である。一部の態様では、第2のプライマーの配列がSEQ ID NO:10と少なくとも90%同一である。一部の態様では、第2のプライマーの配列がSEQ ID NO:10と少なくとも95%同一である。一部の態様では、第2のプライマーの配列がSEQ ID NO:10と100%同一である。一部の態様では、プライマーペアを備えているキットがDNAサンプルから複数のアンプリコンを増幅するために使用され、プライマーペアの第1のプライマーは、SEQ ID NO:1またはこれと少なくとも80%同一の配列を含み、プライマーペアの第2のプライマーは、SEQ ID NO:10またはこれと少なくとも80%同一の配列を含む。
別の局面では、本開示により、哺乳動物をがんの存在について検査する方法を提供する。方法は、a)複数のアンプリコンを形成させるために、DNAサンプル中の複数の染色体配列を、染色体配列に相補的なプライマーペアを用いて増幅する工程;b)複数のアンプリコンのうちの1つまたは複数の核酸配列の少なくとも一部分を決定する工程;c)シーケンシングされたアンプリコンを参照ゲノムにマッピングする工程;d)DNAサンプルを複数のゲノム区間に分割する工程;e)ゲノム区間にマッピングされたアンプリコンに関する複数の特徴を定量する工程;f)第1のゲノム区間内のアンプリコンの複数の特徴を、1つまたは複数の異なるゲノム区間内のアンプリコンの複数の特徴と比較する工程;およびg)第1のゲノム区間内のアンプリコンの複数の特徴が1つまたは複数の異なるゲノム区間内のアンプリコンの複数の特徴と異なる場合、哺乳動物にがんが存在すると判定する工程を含む。一部の態様では、方法が、増幅する工程で形成された少なくとも100,000個のアンプリコンを含み得る。一部の態様では、がんがステージIのがんであり得る。一部の態様では、がんが、肝臓がん、卵巣がん、食道がん、胃がん、膵がん、結腸直腸がん、肺がん、乳がんまたは前立腺がんであり得る。
一部の態様では、方法がインビトロ法である。
本明細書に開示のいずれかの方法、反応混合物またはキットの一部の態様では、複数のアンプリコンが、約1,000,000個のアンプリコン、例えば約1,000,000~10,000個のアンプリコン;約1,000,000~50,000個のアンプリコン;約1,000,000~100,000個のアンプリコン;約1,000,000~200,000個のアンプリコン;約1,000,000~300,000個のアンプリコン;約1,000,000~400,000個のアンプリコン;約1,000,000~500,000個のアンプリコン;約1,000,000~600,000個のアンプリコン;約1,000,000~700,000個のアンプリコン;約1,000,000~800,000個のアンプリコン;約1,000,000~900,000個のアンプリコン;約900,000~10,000個のアンプリコン;約800,000~10,000個のアンプリコン;約700,000~10,000個のアンプリコン;約600,000~10,000個のアンプリコン;約500,000~10,000個のアンプリコン;約400,000~10,000個のアンプリコン;約300,000~10,000個のアンプリコン;約200,000~10,000個のアンプリコン;約100,000~10,000個のアンプリコンまたは約50,000~10,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが、約50,000個のアンプリコン;約100,000個のアンプリコン;約150,000個のアンプリコン;約200,000個のアンプリコン;約250,000個のアンプリコン;約300,000個のアンプリコン;約350,000個のアンプリコン;約400,000個のアンプリコン;約450,000個のアンプリコン;約500,00個のアンプリコン;約550,000個のアンプリコン;約600,000個のアンプリコン;約650,000個のアンプリコン;約700,000個のアンプリコン;約750,000個のアンプリコン;約800,000個のアンプリコン;約850,000個のアンプリコン;約900,000個のアンプリコン;約950,000個のアンプリコン;または約1,000,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが約750,000個のアンプリコンを含む。
一部の態様では、複数のアンプリコンが約350,000個のアンプリコンを含む。
本明細書に開示のいずれかの方法の一部の態様では、本明細書に開示の単一のプライマーペアによって増幅される反復エレメント、例えばアンプリコンの数が、サンプル中に存在する反復エレメントの数および/またはサンプル中に存在する反復エレメントの長さの関数である。例えば、一部のサンプルでは、単一のプライマーペアを用いて検出され得る反復エレメント、例えばアンプリコンの数が約750,000個以下のアンプリコンである。一部の態様において、他のサンプルでは、単一のプライマーペアを用いて検出され得る反復エレメント、例えばアンプリコンの数が約350,000個以下のアンプリコンである。
本明細書に開示のいずれかの方法、反応混合物またはキットの一部の態様では、アンプリコンの平均長さが約100塩基対以下である。一部の態様では、アンプリコンの平均長さが約110bp未満、例えば約10~110bp、約10~105bp、約10~100bp、約10~99bp、約10~98bp、約10~97bp、約10~96bp、約10~95bp、約10~94bp、約10~93bp、約10~92bp、約10~91bp、約10~90bp、約10~89bp、約10~87bp、約10~86bp、約10~85bp、約10~84bp、約10~83bp、約10~82bp、約10~81bp、約10~80bp、約10~79bp、約10~78bp、約10~77bp、約10~76bp、約10~75bp、約10~74bp、約10~73bp、約10~72bp、約10~71bp、約10~70bp、約10~65bp、約10~60bp、約10~55bp、約10~50bp、約10~40bp、約10~30bp、約10~20bp、約15~110bp、約20~110bp、約25~110bp、約30~110bp、約35~110bp、約40~110bp、約45~110bp、約50~110bp、約55~110bp 約60~110bp、約65~110bp、約70~110bp、約75~110bp、約80~110bp、約85~110bp、約90~110bp、約95~110bp、約100~110bpまたは約105~110bpである。
一部の態様では、アンプリコンの平均長さが約10bp;約20bp;約30bp;約40bp;約45bp;約50bp;約60bp;約65bp;約70bp;約75bp;約80bp;約85bp;約90bp;約95bp;約100bp;約105bpまたは約110bpである。
本明細書に開示のいずれかの方法のさらなる特長は、以下の列挙態様のうちの1つまたは複数を含む。
当業者は、常套的な範囲内の実験手法を用いて、本明細書に記載の発明の具体的な態様の多くの均等物を認識し、または確認することができよう。かかる均等物は以下の列挙態様に包含されることを意図する。
列挙態様
E1. 以下の工程を含む、対象における複数のがんのいずれか、例えば少なくとも4つのがんのいずれかの存在またはその発症リスクについて対象を評価する方法:
(i)1つまたは複数の遺伝子バイオマーカー、例えば、1つまたは複数の遺伝子(例えば、1つまたは複数のドライバー遺伝子、例えば少なくとも4個のドライバー遺伝子)の各々における1つまたは複数の変異(例えば、1つまたは複数のドライバー遺伝子変異)の存在に関する、例えば検出するための、値を取得、例えば直接取得または間接的に取得する工程であって、任意で、各遺伝子、例えばドライバー遺伝子は複数のがんのうちの1つのがんの存在またはリスクと関連している、工程;
(ii)複数の、例えば少なくとも4つのタンパク質バイオマーカーの各々のレベルに関する、例えば検出するための、値を取得、例えば直接取得または間接的に取得する工程であって、任意で、複数のタンパク質バイオマーカーの各々のレベルは、複数のがんのうちの1つのがんの存在またはリスクと関連している、工程;あるいは
(iii)異数性に関する、例えば検出するための、値を取得、例えば直接取得または間接的に取得する工程であって、異数性の値は、反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数または長さの関数であり、REファミリーは、
(a)長鎖散在反復配列(LINE)以外のREファミリー、
(b)自身の末端反復エレメントに相補的なプライマー部分を用いて増幅されるとX nt未満の平均長さを有する複数のアンプリコンをもたらすREファミリーであって、ここで、Xは100、105もしくは110である、REファミリー、
(c)約700bp未満の長さであるREファミリー、あるいは
(d)少なくとも100コピー/ゲノムで存在するREファミリー
を含み;
任意で、異数性は、複数のがんのうちの1つのがんの存在またはリスクと関連しており;
それにより、対象を、複数のがんのいずれか、例えば少なくとも4つのがんのいずれかの存在またはその発症リスクについて評価する、
工程。
E2. (a)(i)、(ii)および(iii)のうちの1つが直接取得される;
(b)(i)と(ii)が直接取得される;
(c)(i)と(iii)が直接取得される;
(d)(ii)と(iii)が直接取得される;または
(e)(i)、(ii)および(iii)のすべてが直接取得される、
態様E1の方法。
E3. (a)(i)、(ii)および(iii)のうちの1つが間接的に取得される;
(b)(i)と(ii)が間接的に取得される;
(c)(i)と(iii)が間接的に取得される;
(d)(ii)と(iii)が間接的に取得される;または
(e)(i)、(ii)および(iii)のすべてが間接的に取得される、
態様E1の方法。
E4. (1)遺伝子バイオマーカーを含む1つもしくは複数のサブゲノム区間もしくはアンプリコンをシーケンシングする工程;
(2)1つもしくは複数のゲノム配列を異数性について解析する工程、および/または
(3)タンパク質バイオマーカーを検出試薬と接触させる工程
を含む、態様E1~E3のいずれか1つの方法。
E5. 異数性の値が、
(a)REファミリーの少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数;および/または
(b)反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列の長さ
の関数である、態様E1~E4のいずれか1つの方法。
E6. 対象から採取された生体試料が、(i)~(iii)のうちの1つ、2つまたは全部について評価される、態様E1~E5のいずれか1つの方法。
E7. 生体試料が、液状試料、例えば血液試料を含む、態様E6の方法。
E8. 生体試料が、セルフリーDNAサンプル、血漿試料または血清試料を含む、態様E6またはE7の方法。
E9. 生体試料が、セルフリーDNA、例えば循環腫瘍DNAを含む、態様E6~E8のいずれか1つの方法。
E10. (i)サンプル由来のセルフリーDNAのサブゲノム区間の配列を取得する工程;
(ii)白血球パラメータ、例えばサンプル由来の白血球DNAのサブゲノム区間の配列を取得する工程
をさらに含む、態様E1~E9のいずれか1つの方法。
E11. (i)サンプル由来のセルフリーDNAの、異数性解析のためのサブゲノム区間の配列を取得する工程;
(ii)白血球パラメータ、例えばサンプル由来の白血球DNAの、異数性解析のためのサブゲノム区間の配列を取得する工程
をさらに含む、態様E1~E10のいずれか1つの方法。
E12. セルフリーDNAサブゲノム区間またはセルフリーDNA異数性解析サンプルにみられるゲノム事象、例えば変異を評価するために(i)を(ii)と比較する工程
をさらに含む、態様E10またはE11の方法。
E13. セルフリーDNAまたは異数性解析のセルフリーDNAのサブゲノム区間におけるゲノム事象、例えば変異をさらにクラス分類する工程、例えば変異を第1のクラスまたは第2のクラスに帰属させる工程、態様E10~E12のいずれか1つの方法。
E14. セルフリーDNAまたは異数性解析のセルフリーDNAのサブゲノム区間におけるゲノム事象、例えば変異を増殖脱制御性、例えば、がん性であるとクラス分類する工程をさらに含む、態様E10~E13のいずれか1つの方法。
E15. セルフリーDNAまたは異数性解析のセルフリーDNAのサブゲノム区間におけるゲノム事象、例えば変異を増殖脱制御性以外、例えば、がん性以外であるとクラス分類する工程をさらに含む、態様E10~E13のいずれか1つの方法。
E16. セルフリーDNAまたは異数性解析のセルフリーDNAのサブゲノム区間におけるゲノム事象、例えば変異が、
(a)サブゲノム区間はセルフリーDNAでは異数性であり、サブゲノム区間が白血球では異数性でない;あるいは
(b)ゲノム事象がセルフリーDNAのサブゲノム区間に存在し、ゲノム事象は白血球のサブゲノム区間には存在しない
場合、がん性であるとクラス分類される、
態様E10~E14のいずれか1つの方法。
E17. セルフリーDNAまたは異数性解析のセルフリーDNAの(form)サブゲノム区間におけるゲノム事象、例えば変異が、
(a)サブゲノム区間はセルフリーDNAでは異数性であり、サブゲノム区間が白血球でも異数性である;あるいは
(b)ゲノム事象がセルフリーDNAのサブゲノム区間に存在し、ゲノム事象が白血球のサブゲノム区間にも存在する
場合、増殖脱制御性以外であるとクラス分類される、
態様E10~E13またはE15のいずれか1つの方法。
E18. ゲノム事象が、白血球のクローン性拡大増殖、例えば加齢に伴うクローン性造血、例えば未確定の潜在能を持つクローン造血(CHIP)と関連している、態様E17の方法。
E19. (i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出の特異度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う複数のがんのうちの1つのがんの検出の特異度と実質的に同じである、例えば(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う複数のがんのうちの1つのがんの検出の特異度より実質的に低くない、態様E1~E18のいずれか1つの方法。
E20. (i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出感度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う複数のがんのうちの1つのがんの検出感度より高い、例えば約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍高い、態様E1~E19のいずれか1つの方法。
E21. (i)、(ii)および(iii)により、ある特定の特異度における、例えば所定の特異度、例えば少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の特異度における検出感度の上昇、例えば検出感度の約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍の上昇がもたらされる、態様E1~E20のいずれか1つの方法。
E22. 複数のがんのうちの1つのがんの検出感度の上昇によって複数のがんのうちの1つのがんの検出の特異度が影響されない、例えば低下せず、実質的に低下もしない、態様E20~E21のいずれか1つの方法。
E23. 複数のがんのうちの1つのがんの検出の特異度がプラトー状態である、態様E22の方法。
E24. REファミリーがLINE以外である、態様E1~E23のいずれか1つの方法。
E25. REファミリーが反復エレメントを含み、末端反復エレメントに対するプライマーを用いて増幅されると約110bp未満、例えば約10~110bp、約10~105bp、約10~100bp、約10~99bp、約10~98bp、約10~97bp、約10~96bp、約10~95bp、約10~94bp、約10~93bp、約10~92bp、約10~91bp、約10~90bp、約10~89bp、約10~87bp、約10~86bp、約10~85bp、約10~84bp、約10~83bp、約10~82bp、約10~81bp、約10~80bp、約10~79bp、約10~78bp、約10~77bp、約10~76bp、約10~75bp、約10~74bp、約10~73bp、約10~72bp、約10~71bp、約10~70bp、約10~65bp、約10~60bp、約10~55bp、約10~50bp、約10~40bp、約10~30bp、約10~20bp、約15~110bp、約20~110bp、約25~110bp、約30~110bp、約35~110bp、約40~110bp、約45~110bp、約50~110bp、約55~110bp 約60~110bp、約65~110bp、約70~110bp、約75~110bp、約80~110bp、約85~110bp、約90~110bp、約95~110bp、約100~110bpまたは約105~110bpの平均長さを有する複数のアンプリコンをもたらす、態様E1~E24のいずれか1つの方法。
E26. REファミリーが、表1に示される1つまたは複数の反復エレメントを含む、態様E1~E25のいずれか1つの方法。
E27. REファミリーが、SINEまたはタンデムリピート(例えば、マイクロサテライトDNA、ミニサテライトDNA、サテライトDNAもしくは多コピーを有する遺伝子のDNA(例えば、リボソームRNAをコードしているDNA))を含む、態様E1~E26のいずれか1つの方法。
E28. REファミリーがSINE、例えばAluファミリー、MIRもしくはMIR3、またはVassetzky and Kramerov(2013)Nucleic Acids Res. 41:D83-89に記載のSINEである、態様E27の方法。
E29. 異数性の値がさらに、LINE反復エレメントの末端反復エレメント間に配されているゲノム配列のコピー数または長さの関数である、態様E1~E28のいずれか1つの方法。
E30. 異数性の値がさらに、自身の末端反復エレメントに相補的なプライマーを用いて増幅されると100bp超の平均長さを有するアンプリコンをもたらす反復エレメントファミリーの末端反復エレメント間に配されている複数のゲノム配列のコピー数または長さの関数である、態様E1~E29のいずれか1つの方法。
E31. 異数性の値がさらに、
a)複数のアンプリコンを形成させるために、DNAサンプル中の複数の染色体配列を、染色体配列に相補的なプライマーペアを用いて増幅すること;
b)複数のアンプリコンのうちの1つまたは複数の核酸配列の少なくとも一部分を決定すること;
c)シーケンシングされたアンプリコンを参照ゲノムにマッピングすること;
d)DNAサンプルを複数のゲノム区間に分割すること;
e)ゲノム区間にマッピングされたアンプリコンに関する複数の特徴を定量すること;
f)第1のゲノム区間内のアンプリコンの複数の特徴を、1つまたは複数の異なるゲノム区間内のアンプリコンの複数の特徴と比較すること;および
g)増幅する工程で少なくとも100,000個のアンプリコンが形成される
の関数である、態様E1~E30のいずれか1つの方法。
E32. 異数性に関する値を得る工程を含み、該値が、REファミリーの末端反復エレメント間に配されている少なくとも約5、10、20、30、50、100、200、500または1000の異なるゲノム配列のコピー数の関数である、態様E1~E31のいずれか1つの方法。
E33. コピー数が2より大きいか、または2より小さい、態様E1~E32のいずれか1つの方法。
E34. 少なくとも約100,000個のアンプリコン、約150,000個のアンプリコン、約200,000個のアンプリコン;約250,000個のアンプリコン;約300,000個のアンプリコン;約350,000個のアンプリコン;約400,000個のアンプリコン;約450,000個のアンプリコン;約500,000個のアンプリコン;約550,000個のアンプリコン;約600,000個のアンプリコン;約650,000個のアンプリコン;約700,000個のアンプリコン;約750,000個のアンプリコン;約800,000個のアンプリコン;約850,000個のアンプリコン;約900,000個のアンプリコン;約950,000個のアンプリコン;または約1,000,000個のアンプリコンが形成される、態様E31~E33のいずれか1つの方法。
E35. 異数性に関する値を得る工程を含み、該値が、
(i)ゲノムDNAの第1のセグメント上の、REファミリーの末端反復エレメント間に配されている第1のゲノム配列のコピー数または長さ;および
(ii)ゲノムDNAの第2のセグメント上の、(例えば、同じか、または異なる)REファミリーの末端反復エレメント間に配されている第2のゲノム配列のコピー数または長さ
の関数である、態様E1~E34のいずれか1つの方法。
E36. (i)ゲノムDNAの第1のセグメントとゲノムDNAの第2のセグメントが同じ染色体の異なる腕上に存在している、例えば第1のセグメントが同じ染色体のq腕上に存在しており、第2のセグメントがp腕上に存在しているか;あるいは第1のセグメントが同じ染色体のp腕上に存在しており、第2のセグメントがq腕上に存在している;
(ii)ゲノムDNAの第1のセグメントとゲノムDNAの第2のセグメントが同じ染色体の同じ腕上に存在している、例えば第1のセグメントと第2のセグメントがともに染色体のp腕上またはq腕上に存在している;および/または
(iii)ゲノムDNAの第1のセグメントとゲノムDNAの第2のセグメントが異なる染色体、例えば非相同染色体上に存在している、
態様E35の方法。
E37. 異数性に関する値を得る工程を含み、該値が、第3の染色体上の、REファミリーの末端反復エレメント間に配されている第3のゲノム配列のコピー数または長さの関数である、態様E1~E36のいずれか1つの方法。
E38. 異数性に関する値を得る工程を含み、該値が、N番目の染色体上の、REファミリーの末端反復エレメント間に配されているN番目のゲノム配列のコピー数または長さの関数であり、ここで、Nは4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23である、態様E1~E37のいずれか1つの方法。
E39. 対象のゲノムの核酸を、REファミリーの末端反復エレメント間に配されているゲノム配列を含む配列を増幅するプライマー部分と接触させる工程を含む、態様E1~E38のいずれか1つの方法。
E40. プライマー部分がREファミリーの末端エレメントに相補的である、態様E39の方法。
E41. プライマー部分がプライマーペアを含む、態様E39またはE40の方法。
E42. プライマー部分が単一のプライマーを含み、例えば等温増幅で使用される、態様E39~E41のいずれか1つの方法。
E43. 検出されたバイオマーカー(例えば、ドライバー遺伝子変異の数)の数が、複数のがんのうちの、各遺伝子、例えばドライバー遺伝子が関連しているがんの検出感度が1つまたは複数のさらなる遺伝子バイオマーカーの検出によって実質的に上昇しないような充分な数である、態様E1~E42のいずれか1つの方法。
E44. 遺伝子バイオマーカーを検出する工程が、例えばシーケンシングによって遺伝子バイオマーカーの配列(例えば、ヌクレオチド配列)を得ることを含む、態様E1~E42のいずれか1つの方法。
E45. 得られた遺伝子バイオマーカー配列の数が、複数のがんのうちの、各遺伝子、例えばドライバー遺伝子が関連しているがんの検出感度がさらなる遺伝子バイオマーカーの1つまたは複数の配列が得られることによって実質的に上昇しないような充分な数である、態様E44の方法。
E46. バイオマーカーを検出する工程が、遺伝子バイオマーカーを含む1つまたは複数のサブゲノム区間の配列(例えば、ヌクレオチド配列)を得ることを含む、態様E1~E42のいずれか1つの方法。
E47. 得られたサブゲノム区間の配列の数が、複数のがんのうちの、各遺伝子、例えばドライバー遺伝子が関連しているがんの検出感度がさらなるサブゲノム区間の1つまたは複数の配列(例えば、ヌクレオチド配列)が得られることによって実質的に上昇しないような充分な数である、態様E46の方法。
E48. 遺伝子バイオマーカーを検出する工程が、遺伝子バイオマーカーを含むアンプリコンの配列を得ることを含む、態様E1~E42のいずれか1つの方法。
E49. 得られたアンプリコン配列の数が、複数のがんのうちの、各遺伝子、例えばドライバー遺伝子が関連しているがんの検出感度がさらなるアンプリコンの1つまたは複数の配列が得られることによって実質的に上昇しないような充分な数である、態様E48の方法。
E50. 得られたサブゲノム区間の配列の数が、複数のがんのうちの、各遺伝子、例えばドライバー遺伝子が関連しているがんの検出の特異度がさらなるサブゲノム区間の1つまたは複数の配列が得られることによって実質的に低下しないような充分な数である、態様E46の方法。
E51. 得られたアンプリコンの数が、複数のがんのうちの、複数の遺伝子の各遺伝子、例えばドライバー遺伝子が関連しているがんの検出の特異度がさらなるアンプリコンの1つまたは複数の配列が得られることによって実質的に低下しないような充分な数である、態様E48の方法。
E52. 複数のがんが4、5、6、7または8つのがんを含む、前記態様のいずれかの方法。
E53. 複数のがんが、充実性腫瘍、例えば、中皮腫(例えば、悪性胸膜中皮腫)、肺がん(例えば、非小細胞肺がん、小細胞肺がん、肺扁平上皮がんもしくは大細胞肺がん)、膵がん(例えば、膵管腺癌)、肝臓がん(例えば、肝細胞癌もしくは胆管癌)、食道がん(例えば、食道腺癌もしくは扁平上皮癌)、頭頸部がん、卵巣がん、結腸直腸がん、膀胱がん、子宮頸がん、子宮がん(子宮内膜がん)、腎臓がん、乳がん、前立腺がん、脳のがん(例えば、髄芽細胞腫もしくは膠芽細胞腫)あるいは肉腫(例えば、ユーイング肉腫、骨肉腫、横紋筋肉腫)またはその組合せから選ばれる、前記態様のいずれかの方法。
E54. 複数のがんが、肝臓がん、卵巣がん、食道がん、胃がん、膵がん、結腸直腸がん、肺がん、乳がんもしくは前立腺がんまたはその組合せから選ばれる、前記態様のいずれかの方法。
E55. 複数のがんのうちの1つまたは複数のがんが、肝臓がん、卵巣がん、食道がん、胃がん、膵がん、結腸直腸がん、肺がんまたは乳がんから選ばれる、前記態様のいずれかの方法。
E56. 複数のがんのうちの1つまたは複数のがんが血液のがんである、前記態様のいずれかの方法。
E57. 1つまたは複数の遺伝子、例えば1つまたは複数のドライバー遺伝子、例えばUS2019/0256924A1の表60および61に列記された遺伝子、例えば
Figure 2022532761000001
由来の60以下、100以下、150以下、200以下、300以下、または400以下のサブゲノム区間またはアンプリコンがシーケンシングされる、前記態様のいずれかの方法。
E58. 1つまたは複数の遺伝子、例えば1つまたは複数のドライバー遺伝子、例えばUS2019/0256924A1の表60および61に列記された遺伝子、例えば
Figure 2022532761000002
由来の少なくとも30、少なくとも40、少なくとも50または少なくとも60のサブゲノム区間またはアンプリコンがシーケンシングされる、前記態様のいずれかの方法。
E59. 1つまたは複数の遺伝子、例えば1つまたは複数のドライバー遺伝子、例えばUS2019/0256924A1の表60および61に列記された1つまたは複数の遺伝子、例えば
Figure 2022532761000003
由来の少なくとも30で400以下、少なくとも40で300以下、少なくとも50で200以下、少なくとも60で150以下、または少なくとも60で100以下のサブゲノム区間またはアンプリコンがシーケンシングされる、前記態様のいずれかの方法。
E60. 遺伝子のシーケンシングが行なわれたサブゲノム区間またはアンプリコンの数が、がんの検出感度でプラトーとなる最低数の125%を超えない、150%を超えない、200%を超えない、または300%を超えない、前記態様のいずれかの方法。
E61. 遺伝子バイオマーカーの各サブゲノム区間またはアンプリコンが、6~800bp、例えば6~750bp、6~700bp、6~650bp、6~600bp、6~550bp、6~500bp、6~450bp、6~400bp、6~350bp、6~300bp、6~250bp、6~200bp、6~150bp、6~100bp、10~800bp、15~800bp、20~800bp、25~800bp、30~800bp、35~800bp、40~800bp、45~800bp、50~800bp、55~800bp、60~800bp、65~800bp、70~800bp、75~800bp、80~800bp、85~800bp、90~800bp、95~800bp、100~800bp、200~800bp、300~800bp、400~800bp、500~800bp、600~800bp、700~800bp、10~700bp、20~600bp、30~500bp、40~400bp、50~300bp、60~200bp、61~150bp、62~140bp、63~130bp、64~120bpまたは65~100bp、例えば66~80bpを含む、前記態様のいずれかの方法。
E62. 遺伝子バイオマーカーの各サブゲノム区間またはアンプリコンが、約35、約40、約45、約50、約51、約52、約53、約54、約55、約56、約57、約58、約59、約60、約61、約62、約63、約64、約65、約66、約67、約68、約69、約70、約71、約72、約73、約74、約75、約76、約77、約78、約79、約80、約81、約82、約83、約84、約85、約86、約87、約88、約89、約90、約91、約92、約93、約94、約95、約100または約110bpを含む、前記態様のいずれかの方法。
E63. 遺伝子バイオマーカーの各サブゲノム区間またはアンプリコンが、50bp以下、55bp以下、60bp以下、65bp以下、70bp以下、75bp以下、80bp以下、85bp以下、90bp以下、95bp以下、100bp以下、200bp以下、300bp以下、400bp以下、500bp以下、600bp以下、700bp以下または800bp以下を含む、前記態様のいずれかの方法。
E64. 遺伝子バイオマーカーの各サブゲノム区間またはアンプリコンが、少なくとも6bp、少なくとも10bp、少なくとも15bp、少なくとも20bp、少なくとも25bp、少なくとも30bp、少なくとも35bp、少なくとも40bp、少なくとも45bp、または少なくとも50bpを含む、前記態様のいずれかの方法。
E65. 遺伝子バイオマーカーの各サブゲノム区間またはアンプリコンが、少なくとも6pbで800bp以下、少なくとも10bpで700bp以下、少なくとも15bpで600bp以下、少なくとも20bpで600bp以下、少なくとも25bpで500bp以下、少なくとも30bpで400bp以下、少なくとも35bpで300bp以下、少なくとも40bpで200bp以下、少なくとも45bpで100bp以下、少なくとも50bpで95bp以下または少なくとも55bpで90bp以下を含む、前記態様のいずれかの方法。
E66. 遺伝子バイオマーカーの各サブゲノム区間またはアンプリコンが66~80bpを含む、前記態様のいずれかの方法。
E67. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンが、2000bp以下、2500bp以下、3000bp以下、3500bp以下、4000bp以下、5000bp以下、6000bp以下、7000bp以下、8000bp以下、9000bp以下、10,000bp以下、15,000bp以下または20,000bp以下を含む、前記態様のいずれかの方法。
E68. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンが、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも600bp、少なくとも700bp、少なくとも800bp、少なくとも900bp、少なくとも1000bp、少なくとも1100bp、少なくとも1200bp、少なくとも1300bp、少なくとも1400bp、少なくとも1500bp、少なくとも1600bp、少なくとも1700bp、少なくとも1800bp、少なくとも1900bpまたは少なくとも2000bpを含む、前記態様のいずれかの方法。
E69. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンが、少なくとも200bpで20,000bp以下、少なくとも300bpで15,000bp以下、少なくとも400bpで10,000bp以下、少なくとも500bpで9000以下、少なくとも600bpで8000bp以下、少なくとも700bpで7000bp以下、少なくとも800bpで6000bp以下、少なくとも900bpで5000bp以下、少なくとも1000bpで4000bp以下、少なくとも1100bpで3500bp以下、少なくとも1200bpで3000bp以下、少なくとも1300bpで2500bp以下または少なくとも1500bpで2000bp以下を含む、前記態様のいずれかの方法。
E70. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンが、200bp+15%、300bp+15%、400bp+15%、500bp+15%、600bp+15%、700bp+15%、800bp+15%、900bp+15%、1000bp+15%、1100bp+15%、1200bp+15%、1300bp+15%、1400bp+15%、1500bp+15%、1600bp+15%、1700bp+15%、1800bp+15%、1900bp+15%、2000bp+15%、2500bp+15%、3000bp+15%、3500bp+15%、4000bp+15%、5000bp+15%、6000bp+15%、7000bp+15%、8000bp+15%、9000bp+15%、10,000bp+15%、15,000bp+15%または20,000bp+15%、例えば2000bp+15%を含む、前記態様のいずれかの方法。
E71. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンが2000bpを含む、前記態様のいずれかの方法。
E72. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンがシーケンシングされる平均深度が少なくとも5×のシーケンシング深度である、前記態様のいずれかの方法。
E73. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンがシーケンシングされる平均深度が500×以下のシーケンシング深度である、前記態様のいずれかの方法。
E74. 遺伝子バイオマーカーの数のサブゲノム区間またはアンプリコンがシーケンシングされる平均深度が5×~500×のシーケンシング深度である、前記態様のいずれかの方法。
E75. 前記検出する工程が、各サブゲノム区間を少なくとも50,000リード/塩基の深度までシーケンシングすることを含む、前記態様のいずれかの方法。
E76. 前記検出する工程が、各サブゲノム区間を150,000リード以下/塩基の深度までシーケンシングすることを含む、前記態様のいずれかの方法。
E77. 前記検出する工程が、各サブゲノム区間を50,000リード/塩基~150,000リード/塩基の深度までシーケンシングすることを含む、前記態様のいずれかの方法。
E78. 前記検出する工程が、各サブゲノム区間を、関心対象の前記領域内に0.0005%という低い頻度の変異が検出されるのに充分な深度でシーケンシングすることを含む、前記態様のいずれかの方法。
E79. 20bp以下、21bp以下、22bp以下、23bp以下、24bp以下、25bp以下、26bp以下、27bp以下、28bp以下、29bp以下、30bp以下、31bp以下、32bp以下、33bp以下、34bp以下、35bp以下、40bp以下、45bp以下、50bp以下、55bp以下、60bp以下、100bp以下、200bp以下または300bp以下が、各バイオマーカー、例えば各遺伝子、例えば各ドライバー遺伝子、例えばUS2019/0256924A1の表60または61に開示された各遺伝子、例えば、
Figure 2022532761000004
についてシーケンシングされる、前記態様のいずれかの方法。
E80. 少なくとも6bp、少なくとも7bp、少なくとも8bp、少なくとも9bp、少なくとも10bp、少なくとも11bp、少なくとも12bp、少なくとも13bp、少なくとも14bp、少なくとも15bp、少なくとも16bp、少なくとも17bp、少なくとも18bp、少なくとも19bpまたは少なくとも20bpが、各バイオマーカー、例えば各遺伝子、例えば各ドライバー遺伝子、例えばUS2019/0256924A1の表60または61に開示された各遺伝子、例えば
Figure 2022532761000005
においてシーケンシングされる、前記態様のいずれかの方法。
E81. 少なくとも6で300bp以下、少なくとも7で200bp以下、少なくとも8bpで100bp以下、少なくとも9bpで60bp以下、少なくとも10bpで55bp以下、少なくとも11bpで50bp以下、少なくとも12bpで45bp以下、少なくとも13bpで40bp以下、少なくとも14bpで35bp以下、少なくとも15bpで34bp以下、少なくとも14bpで33bp以下、少なくとも15bpで32bp以下、少なくとも16bpで31bp以下、少なくとも17bpで30bp以下、少なくとも18bpで29bp以下、少なくとも19bpで28bp以下、少なくとも20bpで27bp以下が、各バイオマーカー、例えば各遺伝子、例えば各ドライバー遺伝子、例えばUS2019/0256924A1の表60または61に開示された各遺伝子、例えば
Figure 2022532761000006
においてシーケンシングされる、前記態様のいずれかの方法。
E82. 約33bpが、各バイオマーカー、例えば各遺伝子、例えば各ドライバー遺伝子、例えばUS2019/0256924A1の表60または61に開示された各遺伝子、例えば
Figure 2022532761000007
においてシーケンシングされる、前記態様のいずれかの方法。
E83. バイオマーカーを検出する工程が、20bp以下、21bp以下、22bp以下、23bp以下、24bp以下、25bp以下、26bp以下、27bp以下、28bp以下、29bp以下、30bp以下、31bp以下、32bp以下、33bp以下、34bp以下、35bp以下、40bp以下、45bp以下、50bp以下、55bp以下、60bp以下、100bp以下、200bp以下または300bp以下の長さのサブゲノム区間またはアンプリコンの配列を得ることを含み、サブゲノム区間またはアンプリコンが、バイオマーカー、例えばドライバー変異を含むドライバー遺伝子を含む、前記態様のいずれかの方法。
E84. バイオマーカーを検出する工程が、少なくとも6bp、少なくとも7bp、少なくとも8bp、少なくとも9bp、少なくとも10bp、少なくとも11bp、少なくとも12bp、少なくとも13bp、少なくとも14bp、少なくとも15bp、少なくとも16bp、少なくとも17bp、少なくとも18bp、少なくとも19bpまたは少なくとも20bpの長さのサブゲノム区間またはアンプリコンの配列を得ることを含み、サブゲノム区間またはアンプリコンが、バイオマーカー、例えばドライバー変異を含むドライバー遺伝子を含む、前記態様のいずれかの方法。
E85. バイオマーカーを検出する工程が、少なくとも6で300bp以下、少なくとも7で200bp以下、少なくとも8bpで100bp以下、少なくとも9bpで60bp以下、少なくとも10bpで55bp以下、少なくとも11bpで50bp以下、少なくとも12bpで45bp以下、少なくとも13bpで40bp以下、少なくとも14bpで35bp以下、少なくとも15bpで34bp以下、少なくとも14bpで33bp以下、少なくとも15bpで32bp以下、少なくとも16bpで31bp以下、少なくとも17bpで30bp以下、少なくとも18bpで29bp以下、少なくとも19bpで28bp以下、少なくとも20bpで27bp以下の長さのサブゲノム区間またはアンプリコンの配列を得ることを含み、サブゲノム区間またはアンプリコンが、バイオマーカー、例えばドライバー変異を含むドライバー遺伝子を含む、前記態様のいずれかの方法。
E86. バイオマーカーを検出する工程が、6bp~300bp、7bp~200bpまたは8~100bp、9bp~60bp、10bp~50bp、15bp~40bp、20bp~35bpの長さのサブゲノム区間またはアンプリコンの配列を得ることを含み、サブゲノム区間またはアンプリコンが、バイオマーカー、例えばドライバー変異を含むドライバー遺伝子を含む、前記態様のいずれかの方法。
E87. バイオマーカーを検出する工程が、約33bpの長さのサブゲノム区間またはアンプリコンの配列を得ることを含み、サブゲノム区間またはアンプリコンが、バイオマーカー、例えばドライバー変異を含むドライバー遺伝子を含む、前記態様のいずれかの方法。
E88. b)生体試料において複数の、例えば少なくとも4つのタンパク質バイオマーカーの各々のレベルを検出する工程であって、複数のタンパク質バイオマーカーの各々のレベルは、複数のがんのうちの1つのがんの存在と関連している、工程;
(任意で)(c)複数のタンパク質バイオマーカーの各タンパク質バイオマーカーの検出されたレベルを、タンパク質バイオマーカーの参照レベルと比較する工程;および
d)1つまたは複数の遺伝子バイオマーカーの存在および複数のタンパク質バイオマーカーのうちの1つのタンパク質バイオマーカーのレベルが検出された場合、対象において複数のがんのうちの1つのがんが存在すると特定する工程
をさらに含む、前記態様のいずれかの方法。
E89. (i)対象がまだ、がん、例えば複数のがんから選択されるがんを有すると判定されていない、
(ii)対象がまだ、がん細胞、例えば複数のがんから選択されるがんの細胞を有すると判定されていない、または
(iii)対象が、がん、例えば複数のがんから選択されるがんと関連している症状を示していないか、もしくは症状を示したことがない、
前記態様のいずれかの方法。
E90. 対象が、
(i)小児科の対象もしくは若年成人(若齢成体);例えば、年齢が6ヶ月(齢)~21歳である;または
(ii)成人(成体)、例えば年齢が18歳以上である、
前記態様のいずれかの方法。
E91. サンプルが腫瘍試料、例えば生検試料(例えば、液状生検試料(例えば、循環腫瘍DNAサンプルもしくはセルフリーDNAサンプル)または充実性腫瘍の生検試料);血液試料(例えば、循環腫瘍DNAサンプルもしくはセルフリーDNAサンプル)、アフェレーシス試料、尿試料、嚢胞液試料(例えば、膵嚢胞液試料)、パパニコロー(Pap)試料、あるいは固定腫瘍試料(例えば、ホルマリン固定試料またはパラフィン包埋試料(FPPE))を含む、前記態様のいずれかの方法。
E92. 1つまたは複数、例えば複数の遺伝子が、US2019/0256924A1の表60および61の1、2、3または4つの遺伝子、例えば
Figure 2022532761000008
を含む、前記態様のいずれかの方法。
E93. 1つまたは複数、例えば複数の遺伝子が、US2019/0256924A1の表60および61から選ばれる5、6、7または8つの遺伝子、例えば
Figure 2022532761000009
を含む、前記態様のいずれかの方法。
E94. 1つまたは複数、例えば複数の遺伝子が、NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1AまたはGNASから選択される遺伝子である、前記態様のいずれかの方法。
E95. 1つまたは複数、例えば複数のバイオマーカー(例えば、1つまたは複数の遺伝子)が、KRAS、PIK3CA、HRAS、CDKN2A、TP53、AKT1、CTNNB1、APC、EGFR、GNAS、PPP2R1A、BRAF、FBXW7、PTENもしくはFGFR2またはその組合せから選ばれ、がんが、肝臓がん、卵巣がん、食道がん、胃がん、膵がん、結腸直腸がん、肺がん、乳がん、または前立腺がんから選ばれる、前記態様のいずれかの方法。
E96. 1つまたは複数、例えば複数のバイオマーカー(例えば、1つまたは複数の遺伝子)が、KRAS、PIK3CA、HRAS、CDKN2A、TP53、TERT、ERBB2、FGFR3、MET、MLLもしくはVHLまたはその組合せから選ばれ、がんが、膀胱がんまたは上部尿路上皮癌(UTUC)から選ばれる、前記態様のいずれかの方法。
E97. 1つまたは複数、例えば複数のバイオマーカー(例えば、1つまたは複数の遺伝子)が、KRAS、PIK3CA、CDKN2A、TP53、CTNNB1、PPP2R1A、BRAF、PTEN、CSMD3、FAT3、BRCAもしくはARID1Aまたはその組合せから選ばれ、がんが卵巣がんまたは子宮内膜がんである、前記態様のいずれかの方法。
E98. 1つまたは複数、例えば複数のバイオマーカー(例えば、1つまたは複数の遺伝子)が、KRAS、PIK3CA、CDKN2A、TP53、CTNNB1、GNAS、BRAF、NRAS、VHL、RNF43もしくはSMAD4またはその組合せから選ばれ、がんが膵がん、例えば膵管腺癌(PDAC)である、前記態様のいずれかの方法。
E99. 1つまたは複数、例えば複数のバイオマーカーが、5、6、7または8つのタンパク質バイオマーカーを含む、前記態様のいずれかの方法。
E100. 1つまたは複数、例えば複数のバイオマーカーが、CA19-9、CEA、HGF、OPN、CA125、プロラクチン(PRL)、TIMP-1、CA15-3、AFPまたはMPOから選択されるタンパク質バイオマーカーを含む、前記態様のいずれかの方法。
E101. 1つまたは複数の遺伝子バイオマーカーの存在を検出する工程が、
a. サンプル中に存在する複数の鋳型分子の各々に固有識別子(UID)を帰属させること;
b. 固有タグを有する各鋳型分子を増幅させてUIDファミリーを作出すること;および
c. 増幅産物を重複してシーケンシングすること
を含む、前記態様のいずれかの方法。
E102. サンプルにおける異数性の存在を検出する工程、例えば1つまたは複数の染色体の獲得または喪失を、例えば実施例6に記載のようなWALDO法を用いて検出する工程をさらに含む、前記態様のいずれかの方法。
E103. (i)体細胞変異荷重を評価する工程;(ii)発癌物質シグネチャーを評価する工程、および/または(iii)マイクロサテライト不安定性(MSI)を検出する工程を含む、態様102の方法。
E104. 2つのサンプル、例えば2つの無関連のサンプルを比較し、サンプル間の遺伝子の類似性を評価するため、またはサンプル内、例えばサンプル中のLINEエレメント内の体細胞変異を見出すために使用され得る、態様102または103の方法。
E105. 異数性の検出の特異度および/または感度の上昇がもたらされる、態様102または103の方法。
E106. 異数性の存在が1つまたは複数の染色体腕上に検出される、態様102の方法。
E107. 遺伝子マーカー、タンパク質バイオマーカーおよび/または異数性状態の値に対応して、起源またはがんの型をがんに帰属させる工程をさらに含む、前記態様のいずれかの方法。
E108. 遺伝子マーカー、タンパク質バイオマーカーおよび/または異数性状態の値に対応して、対象を、がんを有する、またはがんを発症するリスクを有すると特定する工程を含む、前記態様のいずれか1つの方法。
E109. がんを処置するために対象に治療用薬剤を投与する工程、または、対象のがんを処置するための治療用薬剤を選択する工程をさらに含む、態様E108の方法。
E110. 対象に治療用薬剤を1種類または複数種のさらなる治療用薬剤と併用して投与する、態様E109の方法。
E111. 少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9または少なくとも10種類の検出試薬を含む反応混合物であって、1種類の検出試薬が、
(i)本文書において言及される1つもしくは複数の遺伝子バイオマーカー;
(ii)本文書において言及される1つもしくは複数のタンパク質バイオマーカー;および/または
(iii)本文書において言及される反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数もしくは長さ、例えば異数性
のレベルまたは存在に関する値である読み出し情報を媒介する、反応混合物。
E112. (i)の複数の検出試薬を含む、態様E111の反応混合物。
E113. (ii)の複数の検出試薬を含む、態様E111~E112のいずれかの反応混合物。
E114. (iii)の複数の検出試薬を含む、態様E111~E113のいずれかの反応混合物。
E115. 対象由来、例えば対象のサンプル由来のサンプルを含む、態様E111~E114のいずれかの反応混合物。
E116. 以下を含む、キット:
(a)少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9または少なくとも10種類の検出試薬であって、1種類の検出試薬が、
(i)本文書において言及される1つもしくは複数の遺伝子バイオマーカー;
(ii)本文書において言及される1つもしくは複数のタンパク質バイオマーカー;および/または
(iii)本文書において言及される反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数もしくは長さ、例えば異数性
のレベルまたは存在に関する値である読み出し情報を媒介する、
検出試薬;ならびに
(b)キットを使用するための使用説明書。
E117. (i)の複数の検出試薬を含む、態様E116の反応混合物。
E118. (ii)の複数の検出試薬を含む、態様E116~E117のいずれかの反応混合物。
E119. (iii)の複数の検出試薬を含む、態様E116~E118のいずれかの反応混合物。
E120. 異数性状態が、第1のプライマーと第2のプライマーを用いて評価される、例えば測定される、態様E1~E110のいずれか1つの方法。
E121. 第1のプライマーが、SEQ ID NO:1と少なくとも80%、85%、90%、95%、96%、96%、98%、99%または100%同一である配列を含む、態様E120の方法。
E122. 第1のプライマーがSEQ ID NO:1の配列を含む、態様E121の方法。
E123. 第2のプライマーが、SEQ ID NO:10と少なくとも80%、85%、90%、95%、96%、96%、98%、99%または100%同一である配列を含む、態様E120の方法。
E124. 第2のプライマーがSEQ ID NO:10の配列を含む、態様E123の方法。
E125. 対象を器官または体内領域の放射線スキャン、例えばPET-CTスキャンに供する工程をさらに含む、態様E1~E110またはE120~E124のいずれか1つの方法。
E126. 器官または体内領域の放射線スキャン法によってがんを特性評価する、態様125の方法。
E127. 器官または体内領域の放射線スキャン法によってがんの場所を特定する、態様125の方法。
E128. 放射線スキャンがPET-CTスキャンである、態様E125~E127のいずれか1つの方法。
E129. 対象が複数のがんの各々の存在について評価された後に放射線スキャン法が行なわれる、態様E125~E128のいずれか1つの方法。
E130. 対象に1つまたは複数の治療介入(例えば、手術、術後補助化学療法、術前補助化学療法、放射線療法、免疫療法、標的療法および/または免疫チェックポイント阻害剤)を施す工程を含む、態様E1~E110またはE120~E129のいずれか1つの方法。
E131. 評価が、ある1つの時点またはいろいろな時点の対象由来試料を評価する工程を含む、態様E1~E110またはE120~E130のいずれか1つの方法。
E132. 対象から採取された1つまたは複数の試料、例えば多回抜取試料を評価する工程を含む、態様E1~E110またはE120~E131のいずれか1つの方法。
E133. 1つまたは複数の試料、例えば多回抜取試料が毎年、例えば互いに1年以内に採取される、E132の方法。
E134. 対象が複数のがんの各々の有無について同時に評価される、態様E1~E110またはE120~E133のいずれかの方法。
E135. 対象が複数のがんの各々の有無について共評価される、態様E1~E110またはE120~E134のいずれかの方法。
E136. 対象における複数のがんの各々の存在を、対象におけるがんの少なくとも1つの所定の期間内の、例えば同じまたは実質的に同じ臨床病期の1つまたは複数の時点で評価する工程を含む、態様E1~E110またはE120~E135のいずれかの方法。
E137. 対象から採取された試料、例えば単一の試料または多回抜取試料を評価する工程を含む、態様E1~E110またはE120~E136のいずれかの方法。
E138. 共評価が、互いに例えば1時間以内、5時間以内、24時間以内または48時間以内に採取された単一の試料、単一の試料のアリコートまたは複数の試料に対して行なわれる、態様E1~E110またはE120~E137のいずれかの方法。
E139. 対象ががんに関して無症候性である、任意の態様E1~E110またはE120~E138の方法。
E140. 対象が複数のがんのうちの1つのがんに関して無症候性である、態様E1~E110またはE120~E139のいずれかの方法。
E141. 対象が、がん細胞を有することが不明であり、がん細胞を有すると判定されてもいない、態様E1~E110またはE120~E140のいずれかの方法。
E142. 対象が、がんを有すると判定されたことがなく、がんを有すると診断されたこともない、態様E1~E110またはE120~E141のいずれかの方法。
E143. 対象が早期、例えばステージIまたはステージIIのがんを有する、態様E1~E110またはE120~E142のいずれかの方法。
E144. 対象が前転移状態である、態様E1~E110またはE120~E143のいずれかの方法。
E145. 対象が検出可能な転移を有していない、態様E1~E110またはE120~E144のいずれかの方法。
E146. 対象が、がんと関連している症状を示していない、態様E1~E110またはE120~E145のいずれかの方法。
E147. 対象にがんと臨床的に関連している1つ、2つまたはそれより多くの症状が表れていない、態様E1~E110またはE120~E146のいずれかの方法。
E148. 異数性状態が陽性である場合、対象が早期、例えばステージIまたはステージIIの、例えば表3に示すようながんを有する、態様E1~E110またはE120~E147のいずれかの方法。
E149. 異数性状態が陰性である場合、対象が早期、例えばステージIまたはステージIIの、例えば表3に示すようながんを有する、態様E1~E110またはE120~E147のいずれかの方法。
E150. 低インプットのDNAを含むサンプルにおける異数性を検出する方法。
E151. サンプルが約0.01ピコグラム(pg)~500 pgのDNAを含む、態様E1~E110またはE120~E150のいずれかの方法。
E152. サンプルが、約0.01~500pg、0.05~400pg、0.1~300pg、0.5~200pg、1~100pg、10~90pgまたは20~50pgのDNAを含む、態様E151の方法。
E153. サンプルが、少なくとも0.01 pg、少なくとも.01 pg、少なくとも0.1 pg、少なくとも1 pg. 少なくとも2 pg、少なくとも3 pg、少なくとも4 pg、少なくとも5 pg、少なくとも6 pg、少なくとも7 pg、少なくとも8 pg、少なくとも9 pg 少なくとも10pg、少なくとも11 pg、少なくとも12 pg、少なくとも13 pg、少なくとも14 pg、少なくとも15 pg、少なくとも16 pg、少なくとも17 pg、少なくとも18 pg、少なくとも19 pg、少なくとも20 pg、少なくとも21 pg、少なくとも22 pg、少なくとも23 pg、少なくとも24 pg、少なくとも25 pg、少なくとも26 pg、少なくとも27 pg、少なくとも28 pg、少なくとも29 pg、少なくとも30 pg、少なくとも31 pg、少なくとも32 pg、少なくとも33 pg、少なくとも34 pg、少なくとも35 pg、少なくとも36 pg、少なくとも37 pg、少なくとも38 pg、少なくとも39 pg、少なくとも40 pg、少なくとも50 pg、少なくとも60 pg、少なくとも70 pg、少なくとも80 pg、少なくとも90 pg、少なくとも100pg、少なくとも150pg、少なくとも200 pg、少なくとも300 pg、少なくとも350 pg、少なくとも400 pg、少なくとも450 pgまたは少なくとも500 pgのDNAを含む、態様E151の方法。
E154. 例えば本文書に開示のいずれかの方法を用いてサンプルを同定または区別する方法。
E155. 対象由来、例えば第1の対象由来のサンプル、例えば第1のサンプルが、第2の対象由来の第2のサンプルと区別される、態様E154の方法。
E156. サンプルが、多型(例えば、複数の多型、例えば一般的多型)に基づいて対象由来であると同定される、態様E154の方法。
E157. 多型、例えば一般的多型が例えば本文書に記載のような反復エレメント内に存在する、態様E156の方法。
E158. サンプルを同定および/または区別するために実施例8に開示した方法が使用される、態様E154の方法。
E159. インビトロ法である、態様E1~E110またはE120~E158のいずれかの方法。
特に定義していない限り、本明細書で用いる科学技術用語はすべて、本発明が関する技術分野の当業者に一般的に理解されているものと同じ意味を有する。本明細書に記載のものと同様または同等の方法および材料が、本発明の実施形態の実施において使用され得るが、好適な方法および材料を以下に説明する。本明細書において挙げた刊行物、特許出願および特許および他の参考文献はすべて、参照によりその全体が本明細書に組み入れられる。矛盾する場合は、定義を含む本明細書に支配される。また、材料、方法および実施例は例示にすぎず、限定を意図するものではない。
本発明の1つまたは複数の態様の詳細事項を添付の図面および以下の説明に示す。本発明の他の特長、目的および利点は、本説明および図面ならびに特許請求の範囲から明らかとなろう。
図1Aは、反復エレメント(反復エレメントの一覧については、例えば表1参照)を増幅するために単一のプライマーペアを用いた場合のアンプリコンサイズの分布を示す。図1Aに示すアンプリコンサイズにはプライマーの塩基の数が含まれている。 図1Bは、反復エレメント(反復エレメントの一覧については、例えば表1参照)を増幅するために単一のプライマーペアを用いた場合のアンプリコンサイズの分布を示す。図1Bに示すアンプリコンサイズには、プライマーの塩基の数が含まれていない。 図1Cは、2231例の血漿試料由来のセルフリーDNAにおけるアンプリコンの数の実測値の分布を示す。 図2A. 本明細書に記載のワークフローの一態様の例示的な概観。 図2Bは、Repetitive Element AneupLoidy Sequencing System(RealSeqS)の一態様の例示的な概観である。 図3は、異なる型のがんでの変異と対比した異数性の感度(99%の特異度における)を示す。各がんの型において検出された異数性のパーセントをY軸上に示す。 図4は、異数性が他のがんバイオマーカーと比較した異数性の感度を示すことを示す。検出されたがんのパーセント(感度)をY軸上に示す。 図5は、複数の腕改変を有する合成体を作成するための擬似コードを示す。 図6は、リードとDNA濃度との間の関係の推定を示す。 図7Aは、異なるマルチアナライト検査でのがん検出の感度の比較を示す。3つの異なるマルチアナライト検査により、標示した8つのがんの検出感度を評価した。3つの検査は、(1)異数性状態、体細胞変異解析およびタンパク質バイオマーカーの評価;(2)異数性状態と体細胞変異解析;ならびに(3)異数性状態とタンパク質バイオマーカーの評価であった。 図7Bは、異数性、変異および異常に高レベルの8つのタンパク質を組み込んだ検査の感度と、異数性+タンパク質のみ、または変異とタンパク質のみ比較する検査の感度との比較を示す。感度はすべて、99%の特異度の集約(aggregate)で計算した(すなわち、血漿試料の1%のみが、10回イテレーションの10分割交差検証を用いた異数性、変異およびタンパク質を組み込んだ検査において異数性、変異またはタンパク質について陽性であった)。 図8は、種々の検査を用いたがん検出の真陽性率(感度)をy軸上に、および偽陽性率を示すグラフである。検査は、(1)異数性状態;体細胞変異;およびタンパク質バイオマーカー;(2)異数性状態とタンパク質バイオマーカー;(3)体細胞変異とタンパク質バイオマーカー;(4)異数性状態と体細胞変異;(5)異数性状態;ならびに(6)体細胞変異を含む。真陽性率(感度)は99%の特異度における閾値を用いて計算した。 図9は、異なるステージのがんにおける、異数性とタンパク質バイオマーカー(95%の特異度における)での感度と比較した、異数性単独(98%または99%の特異度における)でのがん検出の感度を示す。 図10は、異なるステージのがんにおける異数性(99%の特異度における)を示す。 図11は、異なる型のがんにおける異数性(99%の特異度における)を示す。 図12は、異数性(99%の特異度における)をタンパク質バイオマーカーの検出と組み合わせた場合の感度を示す。 図13は、全ゲノムシーケンシング、FAST-SeqSおよびReal SeqSの比較のために使用するインシリコトリソミーサンプルおよびインシリコモノソミーサンプルを作成するための擬似コードを示す。 図14は、ゲノムワイド異数性SVMトレーニングセットに使用した、複数の腕改変を有するインシリコ・シミュレーション・サンプルを作成するための擬似コードを示す。 図15A~15Cは、次世代シーケンシング技術を用いた異数性の検出を示す。感度は99%の特異度において計算した。エラーバーは95%信頼区間を表す。図15A 5%の細胞率での39例すべての非末端動原体型染色体腕におけるモノソミーおよびトリソミーに対する感度の比較。 図15B 5%の細胞率での22qにおける1.5 Mbのディジョージ欠失に対する感度の比較。 図15C 1%の細胞率での20コピーのERBB2局所増幅に対する感度の比較。 図16A~16Bは、局所の欠失または増幅を有する血漿試料の例を示す。図16Aは、ディジョージ症候群に特徴的な22番染色体の約3 Mbの欠失を有する正常個体由来の血漿試料におけるRealSeqSデータを示す。この座位に微細欠失を有する多くの患者は軽度の徴候および症状を有し、臨床的に検出されないことに注意されたい。図16Bは、ディジョージ座位の欠失を示さない正常個体由来の典型的な血漿試料におけるRealSeqSデータを示す。 図17A~17Bは、局所の欠失または増幅を有する血漿試料の例を示す。図17Aは、染色体17qのERBB2座位を含む2.5MBの局所増幅を示すがんを有する患者由来の血漿試料におけるRealSeqSデータを示す。図17Bは、ERBB2座位の増幅を示さない正常個体由来の典型的な血漿試料におけるRealSeqSデータを示す。 図18は、種々の量の腫瘍由来DNAを有する血漿試料でのRealSeqS感度を示す。腫瘍DNAの量は、血漿試料中に存在するドライバー変異の変異アレル頻度(MAF)によって推定した。 図19A~19Bは、8つの異なる型の非転移性がんを有する試料由来の液状生検材料におけるがんの検出を示す。感度は、交差検証中、99%の特異度において計算した。エラーバーは95%信頼区間を表す。図19Aは、RealSeqSによってアセスメントされる異数性状態と腫瘍型に関する体細胞変異状態との比較を示す。図19Bは、RealSeqSによって計算される異数性状態とがんのステージに関する体細胞変異状態との比較を示す。
詳細な説明
定義
用語「ドライバー遺伝子変異」または「ドライバー変異」は、本明細書で用いる場合、(i)ドライバー遺伝子内に起こり;(ii)変異が起こる細胞に対して増殖有利性をもたらす変異を示す。細胞の増殖有利性としては、
a)ドライバー遺伝子変異を有する細胞における細胞分裂速度の増大、例えば参照細胞、例えば本来は同様の細胞、例えば変異を有する細胞に隣接する本来は同様の細胞と比べたとき、例えばドライバー遺伝子変異を有しない同じ型の細胞と比べたときの細胞分裂速度の増大;
b)ドライバー遺伝子変異を有する細胞におけるクローン性拡大増殖速度の増大、例えば参照細胞、例えば本来は同様の細胞、例えば変異を有する細胞に隣接する本来は同様の細胞と比べたとき、例えばドライバー変異を有しない同じ型の細胞と比べたときのクローン性拡大増殖速度の増大;
c)ドライバー遺伝子変異を有する細胞の子孫、例えば娘細胞である細胞の数の増加、例えば細胞がドライバー遺伝子変異を有しなかった場合に予測される子孫細胞の数と比べた子孫細胞の数の増加;
d)例えば参照細胞、例えばドライバー遺伝子変異を有しない本来は同様の細胞と比べたときの腫瘍を形成できる能力もしくは腫瘍増殖、例えば腫瘍増悪を促進できる能力の上昇の上昇;または
e)対象内の第2の、もしくは後続の部位もしくは場所における存在もしくは出現
が挙げられ得る。
一態様では、ドライバー遺伝子変異が、0.1~5%、例えば0.1~4.5%、0.1~4%、0.1~3.5%、0.1~3%、0.1~2.5%、0.1~2%、0.1~1.5%、0.1~1%、0.1~0.5%、0.5~5%、1~5%、1.5~5%、2~5%、2.5~5%、3~5%、3.5~5%、4~5%、4.5~5%、0.5~4.5%、1~4%、1.5~3.5%または2~3%の増殖有利性、例えば細胞誕生と細胞死の差の増大をもたらす。一態様では、ドライバー遺伝子変異が、少なくとも0.1% 0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%または4.5%、例えば約0.4%の増殖有利性、例えば細胞誕生と細胞死の差の増大をもたらす。一態様では、ドライバー遺伝子変異が、変異が起こる細胞に対して増殖能をもたらす、例えば細胞の拡大増殖、例えばクローン性拡大増殖を可能にする。
一部の態様では、ドライバー遺伝子変異が、がんの進行に因果的に関連している可能性がある。
一態様では、ドライバー遺伝子変異が、タンパク質コード遺伝子の調節、発現または機能に影響する、例えば調節、発現または機能を改変する。一態様では、ドライバー遺伝子変異が、非コード領域、例えば非タンパク質コード領域の機能に影響する、例えば機能を改変する。一態様において、ドライバー遺伝子変異としては、転座、欠失(例えば、ホモ接合性欠失)、挿入(例えば、遺伝子内挿入)、小規模な挿入欠失(インデル)、単一塩基置換(例えば、同義変異、非同義変異、ナンセンス変異もしくはフレームシフト変異)、コピー数多型(CNV)(例えば、増幅)、または単一ヌクレオチド変異(SNV)(例えば、単一ヌクレオチド多型(SNP))が挙げられる。例示的なドライバー変異はUS2019/0256924A1の表60および61に開示されている。
一部の態様では、細胞におけるドライバー遺伝子変異の存在により、細胞における遺伝子産物の発現が改変(例えば、増大または低減)され得る。一部の態様では、細胞におけるドライバー遺伝子変異の存在により、遺伝子産物の機能が改変され得る。一部の場合では、細胞におけるドライバー遺伝子変異の存在により、細胞に増殖有利性がもたらされ得る。例えば、細胞におけるドライバー遺伝子変異の存在により、増殖速度の増大(例えば、参照細胞と比べたとき)が引き起こされ得る。例えば、細胞におけるドライバー遺伝子変異の存在により、ドライバー遺伝子変異を有する細胞のクローン性拡大増殖速度の増大(例えば、参照細胞と比べたとき)が引き起こされ得る。例えば、細胞におけるドライバー遺伝子変異の存在により、ドライバー遺伝子変異を有する細胞に由来する子孫細胞の数の増加(例えば、参照細胞と比べたとき)が引き起こされ得る。例えば、細胞におけるドライバー遺伝子変異の存在により、細胞が腫瘍を形成できる能力の増大(例えば、参照細胞と比べたとき)が引き起こされ得る。一部の場合では、増殖有利性は、細胞発生(例えば、新しい細胞の形成)と細胞死の差の増大としての測定値であり得る。例えば、細胞におけるドライバー遺伝子変異の存在により、細胞に少なくとも約0.1%(例えば、約0.2%、約0.3%、約0.4%、約0.5%、約0.6%、約0.7%、約0.8%、約0.9%、約1%、約1.5%、約2%、約2.5%、約3%、約3.5%、約4%、約4.5%またはそれ以上)の増殖有利性がもたらされ得る。例えば、細胞におけるドライバー遺伝子変異の存在により、細胞に約0.1%~約5%(例えば、約0.1~約5%、約0.1~約4.5%、約0.1~約4%、約0.1~約3.5%、約0.1~約3%、約0.1~約2.5%、約0.1~約2%、約0.1~約1.5%、約0.1~約1%、約0.1~約0.5%、約0.5~約5%、約1~約5%、約1.5~約5%、約2~約5%、約2.5~約5%、約3~約5%、約3.5~約5%、約4~約5%、約4.5~約5%、約0.5~約4.5%、約1~約4%、約1.5~約3.5%または約2~約3%)の増殖有利性がもたらされ得る。
一部の場合では、ドライバー遺伝子が、1つより多く(例えば、2、3、4、5、6、7、8、9、10またはそれ以上)のドライバー遺伝子変異を含み得る。一部の場合では、1つまたは複数のドライバー遺伝子変異を含むドライバー遺伝子が、1つまたは複数のさらなる変異(例えば、パッセンジャー遺伝子変異(ドライバー変異でない体細胞変異))も含み得る。
用語「ドライバー遺伝子」は、本明細書で用いる場合、ドライバー遺伝子変異を含む遺伝子を示す。一態様では、ドライバー遺伝子が、1つまたは複数(例えば、1、2、3、4、5、6、7、8、9、10またはそれ以上)の獲得変異、例えばドライバー遺伝子変異が、がんの進行に因果的に関連している可能性がある遺伝子である。一態様では、ドライバー遺伝子は、1つまたは複数の細胞プロセス、例えば、細胞運命決定、細胞生存およびゲノム維持をモジュレートする。ドライバー遺伝子は、1つまたは複数のシグナル伝達経路と関連し得る(例えば、モジュレートし得る)。シグナル伝達経路の例としては、非限定的に、TGF-ベータ経路、MAPK経路、STAT経路、PI3K経路、RAS経路、細胞周期経路、アポトーシス経路、NOTCH経路、ヘッジホッグ(HH)経路、APC経路、クロマチン修飾経路、転写調節経路およびDNAダメージコントロール経路が挙げられる。ドライバー遺伝子の例としては、非限定的に、
Figure 2022532761000010
が挙げられる。例示的なドライバー遺伝子としてはがん遺伝子および腫瘍抑制因子が挙げられる。一態様では、ドライバー遺伝子が、例えば本明細書に記載のような1つまたは複数のドライバー遺伝子変異を有する。一態様では、ドライバー遺伝子が、US2019/0256924A1の表60または61に列記された遺伝子である。一態様では、ドライバー遺伝子が、US2019/0256924A1の表60または61に記載の1つまたは複数の細胞プロセス、例えば細胞運命決定、細胞生存およびゲノム維持をモジュレートする遺伝子である。一態様では、ドライバー遺伝子が、US2019/0256924A1の表60または61に記載の1つまたは複数の経路をモジュレートする遺伝子である。一態様では、ドライバー遺伝子が、US2019/0256924A1の表62に記載の1つまたは複数のシグナル伝達経路をモジュレートする遺伝子である。
一態様では、ドライバー遺伝子が1つより多くのドライバー変異を含み、第1のドライバー遺伝子変異が、変異が起こる細胞に対して選択的増殖有利性をもたらす。一態様では、ドライバー遺伝子における後続の変異、例えば第2、第3、第4、第5またはそれ以降の変異、例えばドライバー変異が、変異が起こる細胞に対して増殖能をもたらす、例えば細胞の拡大増殖、例えばクローン性拡大増殖を可能にする。一態様では、ドライバー遺伝子が、1つまたは複数のパッセンジャー遺伝子変異、例えば、がんの発生時に生じるがドライバー変異ではない体細胞変異を有する。一態様では、ドライバー遺伝子が、任意の細胞型、例えば3つの胚葉:外胚葉、内胚葉または中胚葉のいずれか1つに由来する細胞型に存在し得る、例えば発現され得る。一態様では、ドライバー遺伝子が体細胞に存在する、例えば発現されている。一態様では、ドライバー遺伝子が胚細胞に存在する、例えば発現されている。一態様では、ドライバー遺伝子が、多数のがん、例えば5%より多くのがんに存在し得る。一態様では、ドライバー遺伝子が、少数のがん、例えば5%未満のがんに存在し得る。一態様では、ドライバー遺伝子が、非ランダムおよび/または反復的である変異パターンを有する、すなわち、ドライバー遺伝子内のドライバー変異が存在する場所が異なる型のがんにおいて同じである。例示的な反復的ドライバー遺伝子変異としては、IDH1遺伝子内の基質結合部位、例えばコドン132における変異、およびPIK3CA遺伝子内のヘリカルドメインもしくはキナーゼドメインにおける変異が挙げられ、Vogelstein et al(2013)Science 339:1546-1558に示されている。
一態様では、ドライバー遺伝子変異を有するドライバー遺伝子が、がん遺伝子である。一態様では、がん遺伝子が、少なくとも20%、例えば少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%または少なくとも100%のがん遺伝子スコアを有する遺伝子である。一態様において、がん遺伝子スコアを、変異、例えばクラスター型変異(例えば、同じアミノ酸におけるミスセンス変異または同一のインフレーム挿入もしくは欠失)の数を変異の総数で割り算したものと定義する。一態様では、例えば本明細書に記載のような増幅を有するドライバー遺伝子が、がん遺伝子である。一態様では、ドライバー遺伝子変異を有するドライバー遺伝子が腫瘍抑制因子遺伝子(TSG)である。一態様では、腫瘍抑制因子遺伝子が、少なくとも20%、例えば少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%または少なくとも100%の腫瘍抑制因子遺伝子スコアを有する遺伝子である。一態様において、腫瘍抑制因子遺伝子スコアを、不活性化変異の数を変異の総数で割り算したものと定義する。一態様では、例えば本明細書に記載のような、欠失を有するドライバー遺伝子が腫瘍抑制因子遺伝子である。
語句「反復エレメントファミリー」または「REファミリー」は、本明細書で用いる場合、有機体のゲノムに存在するリピートDNAエレメント(反復DNAエレメントまたは反復単位またはDNAリピートとしても知られる)のファミリーを示す。DNAリピートエレメントは有機体のゲノム全体に散在し得るか、または選ばれた染色体に存在し得る。REファミリーは1つまたは複数のリピートDNAエレメントを含み得る。ヒトゲノムにおける例示的なREファミリーとしては、散在リピート(例えば、長鎖散在反復配列(LINE);短鎖散在反復配列(SINE));およびタンデムリピート(例えば、マイクロサテライト、ミニサテライト、サテライトDNAまたは多コピー遺伝子(例えば、リボソームRNA))が挙げられる。一部の態様では、REファミリーは、表1に列記した1つまたは複数のリピートエレメント、例えばSINEを含む。
「取得する」または「取得すること」とは、これらの用語を本明細書で用いる場合、物理的実体の所有または値、例えば数値を、物理的実体または値を「直接取得すること」または「間接的に取得すること」によって得ることを示す。「直接取得すること」とは、この用語を本明細書で用いる場合、物理的実体または値を得るためのプロセスを行なうこと(例えば、合成方法または分析方法行なうこと)を示す。「間接的に取得すること」とは、この用語を本明細書で用いる場合、物理的実体または値を、別の相手または供給元(例えば、物理的実体または値を直接取得した第三者の研究所)から受け取ることを示す。物理的実体を直接取得することとしては、物理的存在、例えば出発物質の物理的変化を含むプロセス行なうことが挙げられる。値を直接取得することとしては、試料または別の物質の物理的変化を含むプロセス行なうこと、例えば物質、例えば試料、分析物または試薬の物理的変化を含む分析プロセス(場合によっては、本明細書において「物理分析」と称する)を行なうこと、分析方法、例えば、以下:物質、例えば分析物またはその断片もしくは他の誘導体を別の物質から分離または精製すること;分析物またはその断片もしくは他の誘導体を別の物質、例えばバッファー、溶媒または反応体と合わせること;あるいは分析物またはその断片もしくは他の誘導体の構造を変えることのうちの1つまたは複数を含む方法を行なうことが挙げられる。
「生体試料」、「試料」、「患者試料」または「被検物」は、これらの用語を本明細書で用いる場合、各々、対象または患者から採取された試料を示す。試料の供給源は、生検組織(例えば、液状生検組織)、吸引物;血液または任意の血液構成要素;体液(例えば、脳脊髄液、羊水、腹水または間質液)であり得る。試料は、細胞(例えば、ヒト身体由来の任意の細胞、例えば正常細胞および/またはがん細胞)および/またはセルフリーDNA、例えば循環腫瘍DNAもしくは正常細胞由来の循環DNAを含み得る。一態様では、試料、例えば腫瘍試料が、外科的切除断端由来の組織または細胞を含む。別の態様では、試料、例えば腫瘍試料が、1個または複数の循環腫瘍細胞(CTC)(例えば、血液試料から取得したCTC)を含む。
本明細書で用いる場合、用語「感度」は、対象において疾患の存在を検出または同定できる方法の能力を示す。例えば、対象においてがんの存在を検出することができる本明細書に記載のさまざまな方法のいずれかに関して用いる場合、高感度は、方法により、対象においてがんの存在が高率の回数で正しく同定されることを意味する。例えば、本明細書に記載の方法は、方法が行なわれる回数の95%で対象においてがんの存在が正しく検出されることを95%の感度を有するという。一部の態様では、対象においてがんの存在を検出することができる本明細書に記載の方法は、少なくとも70%(例えば、約70%、約72%、約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、約99.5%または約100%)の感度を示す。一部の態様では、2つ以上のクラスのバイオマーカー(例えば、遺伝子バイオマーカーおよび/またはタンパク質バイオマーカー)の1つまたは複数の構成員の存在を検出する工程を含む本明細書において提供する方法が、1つだけのクラスのバイオマーカーの1つまたは複数の構成員の存在を検出する工程を含む方法より高い感度を示す。
一部の態様において、感度は、不均一な配列集団において配列バリアントを検出できる方法の能力の尺度を示す。サンプル中に配列バリアントがサンプル中の配列の少なくともF%で存在すると仮定し、方法によって配列がC%の信頼度で回数のS%で検出され得るならば、方法はF%のバリアントに対してS%の感度を有する。一例として、サンプル中にバリアント配列がサンプル中の配列の少なくとも5%で存在すると仮定し、方法によって配列が99%の信頼度で10回のうち9回、検出され得るならば、方法は5%のバリアントに対して90%の感度を有する(F=5%;C=99%;S=90%)。例示的な感度としては、F=0.5%、1%、5%、10%、20%、50%、100%の配列バリアントに対してC=90%、95%、99%および99.9%の信頼度レベルでS=90%、95%、99%、99.9%のものが挙げられる。
上記に論考したように、諸態様において、感度は、第1の状態の試料をすべて同一性の第1の状態に帰属できる能力、換言すると、第1の状態の試料をすべて発見または同定できる試験方法の能力である。(感度は、第1の状態の試料が第2の状態の試料として帰属ミスとなる方法の傾向に対処しない)。一態様では、第1の状態が陰性であり、感度は陰性の試料をすべて同定できる能力である。一態様では、第1の状態が陽性であり、感度は陽性の試料をすべて同定できる能力である。
本明細書で用いる場合、用語「特異度」は、対象において疾患の存在を検出できる方法の能力を示す(例えば、方法の特異度は、対象において真陰性と比べて真陽性を同定できる能力および/または真に存在している配列バリアントをシーケンシングアーチファクトまたは他の近縁種配列と区別できる方法の能力と説明され得る)。例えば、対象においてがんの存在を検出することができる本明細書に記載のさまざまな方法のいずれかに関して用いる場合、高特異度は、方法により、対象におけるがんの非存在が高率の回数で正しく同定されることを意味する(例えば、方法により、対象においてがんの存在が高率の回数で不正確に同定されない)。X個の真の配列が真にバリアントであり、X個の真でないものが真にバリアントでないN個の全配列のサンプルセットに適用したとき、方法によって真にバリアントでないものの少なくともX%がバリアントでないとして選択できるならば、方法はX%の特異度を有する。例えば、500個の配列が真にバリアントであり、500個が真にバリアントでない1,000個の配列のサンプルセットに適用したとき、方法によって500個の真のバリアント配列でないものの90%がバリアントでないとして選択されるならば、方法は90%の特異度を有する。例えば、本明細書に記載の方法は、方法が行なわれる回数の95%で対象におけるがんの非存在が正しく検出されることを95%の特異度を有するという。一部の態様では、対象におけるがんの非存在を検出することができる本明細書に記載の方法は、少なくとも80%の(例えば、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%またはそれより高い)特異度を示す。高特異度を有する方法により、偽陽性結果は最小限となるか、または偽陽性結果はもたらされない(例えば、他の方法と比べたとき)。偽陽性結果は任意の供給源で生じ得る。例えば、がんの非存在が正しく検出され、核酸のシーケンシングを含む本明細書に記載の種々の方法において、偽陽性は、サンプル調製中に関心対象の配列に導入されるエラー、シーケンシングエラーおよび/または遺伝子ファミリーの近縁種配列、例えば偽遺伝子もしくは構成員の偶発的シーケンシングに起因し得る。一部の態様では、2つ以上のクラスのバイオマーカー(例えば、遺伝子バイオマーカーおよび/またはタンパク質バイオマーカー)の1つまたは複数の構成員の存在を検出する工程を含む本明細書において提供する方法が、1つだけのクラスのバイオマーカーの1つまたは複数の構成員の存在を検出する工程を含む方法より高い特異度を示す。
上記に論考したように、諸態様において、特異度は、試料を同一性の第1の状態に真に帰属できる試験方法の能力である。(特異度は、真の第1の状態の試料をすべて発見できる方法の能力、すなわち感度に対処しない。)一態様では、第1の状態が陰性であり、特異度は、陰性に対して(不正確ではなく)真の帰属を行なうことができる(そして、第2の状態(例えば、陽性)の試料を第1の状態(陰性)の試料として帰属ミスしない)能力である。一態様では、第1の状態が陽性であり、特異度は、陽性に対して(不正確ではなく)真の帰属を行なうことができる(そして、第2の状態(例えば、陰性)の試料を第1の状態(陽性)の試料として帰属ミスしない)能力である。
本明細書で用いる場合、語句「サブゲノム区間」はゲノム配列の一部分を示す。サブゲノム区間は任意の適切なサイズであり得る(例えば、任意の適切な数のヌクレオチドが含まれ得る)。一部の態様では、サブゲノム区間に単一のヌクレオチド(例えば、そのバリアントが腫瘍表現型と(陽性または陰性に)関連する単一のヌクレオチド)が含まれ得る。一部の態様では、サブゲノム区間に1個より多くのヌクレオチドが含まれ得る。例えば、サブゲノム区間には少なくとも約2(例えば、約5、約10、約50、約100、約150、約250または約300)個のヌクレオチドが含まれ得る。一部の場合では、サブゲノム区間に遺伝子全体が含まれ得る。一部の場合では、サブゲノム区間に遺伝子の一部分(例えば、コード領域、例えばエキソン、非コード領域、例えばイントロン、または調節領域、例えばプロモーター、エンハンサー、5’非翻訳領域(5’UTR)または3’非翻訳領域(3’UTR))が含まれ得る。一部の場合では、サブゲノム区間に天然に存在する(例えば、ゲノム内)ヌクレオチド配列の全部または一部が含まれ得る。例えば、サブゲノム区間は、シーケンシング反応に供され得るゲノムDNAの断片に対応し得る。一部の場合では、サブゲノム区間はゲノム供給源由来の連続ヌクレオチド配列であり得る。一部の場合では、サブゲノム区間に、ゲノム内で隣接していないヌクレオチド配列が含まれ得る。例えば、サブゲノム区間には、エキソン-エキソンジャンクションを(例えば、サブゲノム区間から逆転写されたcDNA内に)含むヌクレオチド配列が含まれ得る。一部の場合では、サブゲノム区間に変異(例えば、SNV、SNP、体細胞変異、生殖細胞系列変異、点変異、再編成、欠失変異(例えば、インフレーム欠失、遺伝子内欠失もしくは全遺伝子欠失)、挿入変異(例えば、遺伝子内挿入)、逆位変異(例えば、染色体内逆位)、逆位重複変異、タンデム重複(例えば、染色体内タンデム重複)、転座(例えば、染色体転座もしくは非相互転座)、遺伝子コピー数の変化、またはその任意の組合せが含まれ得る。
本明細書で用いる場合、語句「白血球パラメータ」は、白血球の核酸、例えば染色体の核酸の配列を示す。
本明細書で用いる場合、語句「ゲノム事象」は、サブゲノム区間の配列が参照配列の配列と異なることを示す。ゲノム事象は、例えば変異、例えば点変異または再編成、例えば転座であり得る。
異数性の検出
本文書により、試料における1つまたは複数の染色体異常(例えば、異数性)を同定するための方法および材料を提供する。一部の態様では、本明細書に記載の方法および材料が、胚における1つまたは複数の染色体異常(例えば、異数性)を同定するために使用される。一部の態様では、本明細書に記載の方法および材料が、哺乳動物(例えば、幼若哺乳動物または成体哺乳動物)における1つまたは複数の染色体異常(例えば、異数性)を同定するために使用される。例えば、哺乳動物(例えば、哺乳動物から採取された試料)は、1つまたは複数の染色体異常の有無についてアセスメントされ得る。一部の場合では、本文書により、哺乳動物を、1つまたは複数の染色体異常と関連している疾患(例えば、がん)を有すると特定するためにアンプリコンベースシーケンシングのデータを使用するための方法および材料を提供する。例えば、本明細書に記載の方法および材料は、哺乳動物から採取された試料に適用され、哺乳動物が1つまたは複数の染色体異常を有すると特定され得る。例えば、本明細書に記載の方法および材料は、哺乳動物から採取された試料に適用され、哺乳動物が、1つまたは複数の染色体異常と関連している疾患(例えば、がん)を有すると特定され得る。また、本文書により、1つまたは複数の染色体異常(例えば、本明細書に記載のとおりに同定される1つまたは複数の染色体異常)と関連している疾患または障害を同定および/または処置するための方法および材料を提供する。一部の場合では、1つまたは複数の染色体異常が、哺乳動物から採取された試料から得られたDNA(例えば、ゲノムDNA)内に同定され得る。例えば、出生前の哺乳動物(例えば、出生前のヒト)は、少なくとも一部において1つまたは複数の染色体異常の存在に基づいて疾患または障害を有すると特定され得る。一部の態様では、少なくとも一部において1つまたは複数の染色体異常に基づいて疾患または疾患を有すると特定された哺乳動物胚が、体外受精の目的でアセスメントされ得る。一部の態様では、少なくとも一部において1つまたは複数の染色体異常の存在に基づいてがんを有すると特定された哺乳動物が1つまたは複数のがん処置法で処置され得る。一部の態様では、哺乳動物が、少なくとも一部において1つまたは複数の染色体異常の存在に基づいて先天異常を有すると特定され得る。一部の態様では、本明細書において提供する方法および材料が、胚(例えば、体外受精によって得られた胚)を、着床のために子宮(例えば、ヒトの子宮)に移す前に染色体異常について検査するために使用される。
本明細書において、とりわけ、1つまたはそれより多くのがん、または複数のがんの検出感度を、前記がんまたは複数のがんの検出特異度を改変することなく高める方法を開示する。一態様では、(i)遺伝子バイオマーカー、例えば体細胞変異;(ii)タンパク質バイオマーカー;および(iii)異数性状態を評価することによるがんの検出感度が、(i)単独;(ii)単独;(iii)単独;(i)と(ii)のみ;(i)と(iii)のみ;または(ii)と(iii)のみを評価することによるがんの検出感度より高い、例えば約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍高い。(i)、(ii)および(iii)を含む方法による感度の上昇によってがんまたは複数のがんの検出特異度は改変されない、例えば低下しない。本開示の方法を用いたがん検出の例示的な感度の上昇を本開示の実施例6に示す。
任意の適切な哺乳動物が、本明細書に記載のようにしてアセスメントされ得る。哺乳動物は出生前の哺乳動物(例えば、出生前のヒト)であり得る。哺乳動物は、1つまたは複数の染色体異常と関連している疾患(例えば、がんまたは先天異常)を有することが疑われる哺乳動物であってもよい。一部の場合では、ヒトまたは他の霊長類、例えばサルが、1つまたは複数の染色体異常の存在について本明細書に記載のようにしてアセスメントされ得る。一部の場合では、イヌ、ネコ、ウマ、ウシ、ブタ、ヒツジ、マウスおよびラットが、1つまたは複数の染色体異常の存在について本明細書に記載のようにしてアセスメントされ得る。例えば、ヒトが、1つまたは複数の染色体異常の存在について本明細書に記載のようにしてアセスメントされ得る。
哺乳動物由来の任意の適切な試料が、本明細書に記載のようにしてアセスメントされ(例えば、1つまたは複数の染色体異常の存在についてアセスメントされ)得る。試料にゲノムDNAが含まれ得る。一部の場合では、試料に循環セルフリーDNA(例えば、循環胎児セルフリーDNA)が含まれ得る。一部の場合では、試料に循環腫瘍DNA(ctDNA)が含まれ得る。DNA(例えば、ctDNA)が含まれ得る試料の例としては、非限定的に、血液(例えば、全血、血清または血漿)、羊膜、組織、尿、脳脊髄液、唾液、痰、気管支肺胞洗浄液、胆汁、リンパ液、嚢胞液、便、腹水、パップスメア、脳脊髄液、内頸部、子宮内膜および卵管の試料が挙げられる。例えば、試料は血漿試料であり得る。例えば、試料は尿試料であり得る。例えば、試料は唾液試料であり得る。例えば、試料は嚢胞液試料であり得る。例えば、試料は痰試料であり得る。一部の場合では、試料に新生物細胞率(例えば、低い新生物細胞率)が含まれ得る。
一部の態様では、試料が、試料からDNAを単離および/または精製するために加工処理され得る。一部の態様では、DNAの単離および/または精製が細胞溶解(例えば、デタージェントおよび/または界面活性剤の使用)を含み得る。一部の態様では、DNAのさらなる加工処理(例えば、増幅反応)が、細胞溶解によるDNAを精製せずに行なわれる。かかる場合では、さらなる加工処理を助長するために、さらなる試薬、例えば非限定的に、プロテアーゼ阻害剤が添加される。一部の態様では、DNAの単離および/または精製がタンパク質を除去すること(例えば、プロテアーゼの使用)を含み得る。一部の場合では、DNAの単離および/または精製がRNAを除去すること(例えば、RNaseの使用)を含み得る。一部の態様では、DNAの単離が、市販のキット(例えば非限定的に、Qiagen DNAeasyキット)または当技術分野において公知のバッファー(例えば、デタージェント含有Tris-バッファー)を用いて行なわれる。
一部の態様において、単離および/または精製の反応液にインプットされるDNA(「インプットDNA」)の量は、さまざまな要素、例えば非限定的に、DNA断片の平均長さ、全体的なDNAの品質および/またはDNAの型(例えば、gDNA、ミトコンドリアDNA、cfDNA)に応じて異なり得る。一部の態様では、任意の適当な量のインプットDNAが本明細書に記載の方法において使用され得る。一部の態様では、インプットDNAの量が1ピコグラム(pg)~500 pgの任意の量であり得る。一部の態様では、インプットDNAの量が、少なくとも0.01 pg、少なくとも.01 pg、少なくとも0.1 pgまたは少なくとも1 pgであり得る。一部の態様では、インプットDNAの量が、少なくとも1ピコグラム(pg)、少なくとも2 pg、少なくとも3 pg、少なくとも4 pg、少なくとも5 pg、少なくとも6 pg、少なくとも7 pg、少なくとも8 pg、少なくとも9 pg 少なくとも10pg、少なくとも11 pg、少なくとも12 pg、少なくとも13 pg、少なくとも14 pg、少なくとも15 pg、少なくとも16 pg、少なくとも17 pg、少なくとも18 pg、少なくとも19 pg、少なくとも20 pg、少なくとも21 pg、少なくとも22 pg、少なくとも23 pg、少なくとも24 pg、少なくとも25 pg、少なくとも26 pg、少なくとも27 pg、少なくとも28 pg、少なくとも29 pg、少なくとも30 pg、少なくとも31 pg、少なくとも32 pg、少なくとも33 pg、少なくとも34 pg、少なくとも35 pg、少なくとも36 pg、少なくとも37 pg、少なくとも38 pg、少なくとも39 pgまたは少なくとも40 pgであり得る。一部の態様では、インプットDNAの量が3 pgである。
一部の態様では、本明細書に記載のような1つまたは複数の染色体異常(例えば、異数性)を同定するための方法および材料が、複数のアンプリコンの増幅を含み得る。一部の態様では、複数のアンプリコンがDNAサンプル中の複数の染色体配列から増幅される。一部の態様では、複数のアンプリコンが任意のさまざまな反復エレメントから増幅され得る(例えば、反復エレメントの一覧については表1参照)。一部の態様では、複数のアンプリコンが、複数の短鎖散在反復配列(SINE)から増幅される。一部の態様では、複数のアンプリコンが、複数の長鎖散在反復配列(LINE)から増幅される。複数のアンプリコンを増幅する方法としては、非限定的に、ポリメラーゼ連鎖反応(PCR)および等温増幅法(例えば、ローリングサークル増幅またはブリッジ増幅)が挙げられる。一部の態様では、第2の増幅工程が行なわれる。一部の態様では、第1の増幅反応で増幅されたDNAが第2の増幅反応での鋳型として使用される。一部の態様では、増幅されたDNAが第2の増幅反応の前に精製される(例えば、当技術分野において公知の方法を用いたPCR精製)。
一部の態様では、増幅反応が、SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8またはSEQ ID NO:9を有するかあるいはSEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8またはSEQ ID NO:9を含む第1のプライマーを含む単一のプライマーペアの使用を含む。一部の態様では、増幅反応が、SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8またはSEQ ID NO:9と少なくとも80%(例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%)の配列同一性を有する第1のプライマーを含む単一のプライマーペアの使用を含む。一部の態様では、増幅反応が、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18またはSEQ ID NO:19を有するかあるいはSEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18またはSEQ ID NO:19を含む第2のプライマーを含む単一のプライマーペアの使用を含む。一部の態様では、増幅反応が、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18またはSEQ ID NO:19と少なくとも80%(例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%)の配列同一性を有する第2のプライマーを含む単一のプライマーペアの使用を含む。
一部の態様では、第1のプライマーが、
Figure 2022532761000011
と少なくとも80%同一(例えば、少なくとも85%、少なくとも90%、少なくとも95% 少なくとも99%または100%同一)である配列を有する。一部の態様では、第2のプライマーが、
Figure 2022532761000012
と少なくとも80%同一(例えば、少なくとも85%、少なくとも90%、少なくとも95% 少なくとも99%または100%同一)である配列を有する。一部の態様では、増幅反応が、SEQ ID NO:1を有する第1のプライマーとSEQ ID NO:10を有する第2のプライマーを含む単一のプライマーペアの使用を含む。一部の態様では、増幅反応が、SEQ ID NO:1と少なくとも80%(例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%)の配列同一性を有する第1のプライマーと、SEQ ID NO:10と少なくとも80%(例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%)の配列同一性を有する第2のプライマーとを含む単一のプライマーペアの使用を含む。
一部の態様では、第1のプライマーが、5’末端から3’末端に向かって、ユニバーサルプライマー配列(UPS)、固有識別子DNA配列(UID)および増幅配列を含む。一部の態様では、第1のプライマーが、5’末端から3’末端に向かって、UPS配列および増幅配列を含む。一部の態様では、第1のプライマーが、5’末端から3’末端に向かって、増幅配列を含む。第1のプライマーが少なくとも増幅配列を含むかかる場合では、当技術分野において公知の任意のさまざまなライブラリー作成手法が、増幅されたアンプリコンから次世代シーケンシングライブラリーを作成するために使用され得る。
一部の態様では、ユニバーサルプライマー配列(UPS)により、次世代シーケンシングの準備のためのアンプリコンライブラリーの作成が助長される。例えば、第1のプライマー(SEQ ID NO:1)と第2のプライマー(SEQ ID NO:10)を用いた増幅反応中に生成したアンプリコンが第2の増幅反応での鋳型として使用される。かかる場合では、UPSに結合するように設計され第2のプライマーセットが、Illumina製フローセルとのハイブリダイゼーションに必要な5’グラフティング配列を含む。
一部の態様では、UIDが16~20個の縮重塩基の配列を含む。一部の態様では、縮重配列が、ヌクレオチド配列の一部の位置にいくつかの考えられ得る塩基を含む配列である。本明細書に記載のいずれかの方法の一部の態様では、縮重配列が、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約25、約30、約35、約40、約45もしくは約50個または少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45もしくは少なくとも50個のヌクレオチドを含む縮重ヌクレオチド配列であり得る。一部の態様では、ヌクレオチド配列がヌクレオチド配列内に1、2、3、4、5、6、7、8、9、0、10、15、20、25個またはそれ以上の縮重位置を含む。一部の態様では、縮重配列が固有識別子DNA配列(UID)として使用される。一部の態様では、縮重配列が、アンプリコンの増幅を改善するために使用される。例えば、縮重配列は、増幅対象の染色体配列に相補的な塩基を含み得る。かかる場合では、高い相補性により、染色体配列に対するプライマーの親和性が高くなり得る。一部の態様では、UID(例えば、縮重塩基)が、複数の染色体配列に対するプライマーの親和性が高くなるように設計され得る。
一部の態様では、増幅反応が1つまたは複数のプライマーペア(例えば、表2から選択される1つまたは複数のプライマーペア)を含む。一部の態様では、増幅反応が、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つのプライマーペアを含む。一部の態様において、増幅反応に1つより多くのペアまたはプライマーを含める場合、少なくとも1つのプライマーペアは、第1のプライマーとしてSEQ ID NO:1を有するプライマーと第2のプライマーとしてSEQ ID NO:10を有するプライマーを含む。一部の態様では、増幅反応に1つより多くのプライマーペアを含める場合、少なくとも1つのプライマーペアが、SEQ ID NO:1と少なくとも80%(例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%)の配列同一性を有する配列を有する第1のプライマーと、SEQ ID NO:10と少なくとも80%(例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%)の配列同一性を有する配列を有する第2のプライマーとを含む。
一部の態様では、増幅反応に1つまたは複数のプライマーペアを含める場合、任意のさまざまな組合せのプライマーまたはプライマーペアが表2から選択され得る。例えば、2つのプライマーペア(例えば、表2から選択される4つのプライマー)を含有する増幅反応液は、第1のプライマー(例えば、SEQ ID NO:1を有する第1のプライマー)と第2のプライマー(例えば、SEQ ID NO:10を有する第2のプライマー)を含む第1のプライマーペア(例えば、表2の第1のプライマーペア1)および第3のプライマー(例えば、SEQ ID NO:2を有する第3のプライマー)と第4のプライマー(例えば、SEQ ID NO:11を有する第4のプライマー)を含む第2のプライマーペア(例えば、表2の第2のプライマーペア2)を含み得る。表2に列記したいずれかのフォワードプライマー(例えば、SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8またはSEQ ID NO:9を有する“FP”)を、表2に列記したいずれかのリバースプライマー(例えば、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18またはSEQ ID NO:19を有する“RP”)と組み合わせることにより、本明細書に記載のような反復エレメント(例えば、例示的な反復エレメントの一覧については表1参照)由来のアンプリコンが生成される。例えば、2つのプライマーペア(例えば、表2から選択される4つのプライマー)を含有する増幅反応液は、第1のプライマー(例えば、SEQ ID NO:1を有する第1のプライマー)と第2のプライマー(例えば、SEQ ID NO:10を有する第2のプライマー)を含む第1のプライマーペア(例えば、表2の第1のプライマーペア1)および第3のプライマー(例えば、SEQ ID NO:2を有する第3のプライマー)と第4のプライマー(例えば、SEQ ID NO:12を有する第4のプライマー)を含む第2のプライマーペア(例えば、表2にプライマーペアとして列記していないもの)を含むものであってもよい。一部の態様では、増幅反応に、第1のプライマーが両方のプライマーペアに含まれている1つまたは複数のプライマーペアを含める。例えば、増幅反応には、第1のプライマー(例えば、SEQ ID NO:1を有する第1のプライマー)と第2のプライマー(例えば、SEQ ID NO:10を有する第2のプライマー)を含む第1のプライマーペア(例えば、表2の第1のプライマーペア1)および第3のプライマー(例えば、SEQ ID NO:1を有する第3のプライマー)と第4のプライマー(例えば、SEQ ID NO:11を有する第4のプライマー)を含む第2のプライマーペアが含められ得る。
一部の態様では、プライマーペアが複数の染色体配列に相補的である。本明細書で用いる場合、用語「相補的な」または「相補性」は、核酸残基が、増幅がサポートされるのに充分なワトソン・クリック型または類似の塩基対合相互作用を行なうことができる、あるいは相互作用に関与できることを示す。一部の態様では、第1のプライマーの増幅配列が、1つまたは複数の染色体配列を増幅するように設計され得る。一部の態様では、1つまたは複数の染色体配列が、本明細書に記載のような任意のさまざまな反復エレメント(例えば、例示的な反復エレメントの一覧については表1参照)を含む。一部の態様では、染色体配列がSINEである。一部の態様では、染色体配列がLINEである。一部の態様では、染色体配列が、異なる型の反復エレメント(例えば、SINE、LINEおよび/または表1に列記した他の例示的な反復エレメント)の混合物である。一部の態様では、増幅反応に2つ以上のプライマーペアを含める場合、各プライマーペアによって異なる型の反復エレメント(例示的な反復エレメントの一覧については、例えば表1参照)が増幅される。例えば、第1のプライマーペアによってSINEが増幅され得、第2のプライマーペアによってLINEが増幅され得る。任意で、第3、第4、第5などのプライマーペアによって第3、第4、第5などの型の反復エレメントが増幅され得る(さらなる例示的な反復エレメントの一覧については、例えば表1参照)。一部の態様では、増幅反応に2つ以上のプライマーペアを含める場合、各プライマーペアによって同じ型の反復エレメント(例示的な反復エレメントの一覧については、例えば表1参照)由来のアンプリコンが生成される。例えば、第1のプライマーペアによってSINEが増幅され得、第2のプライマーペアによってSINEが増幅される。任意で、第3、第4、第5などのプライマーペアによってSINEが増幅され得る。一部の態様では、増幅反応に2つ以上のプライマーペアを含める場合、各プライマーペアによって異なる型の反復エレメント(例えば、例示的な反復エレメントの一覧については表1参照)の混合物由来のアンプリコンが生成される。
(表1)例示的な反復エレメントの一覧
Figure 2022532761000013
Figure 2022532761000014
Figure 2022532761000015
一部の態様では、本明細書に記載のプライマーペアの一方または両方のプライマーがプライマー修飾を含む。プライマー修飾の例としては、非限定的に、スペーサー(例えば、C3スペーサー、PCスペーサー、ヘキサンジオール、スペーサー9、スペーサー18、1’,2’-ジデオキシリボース(dスペーサー))、リン酸化、ホスホロチオエート結合修飾、修飾核酸、アタッチメントケミストリー(attachment chemistry)および/またはリンカー修飾が挙げられる。修飾核酸の例としては、非限定的に、2-アミノプリン、2,6-ジアミノプリン(2-アミノ-dA)、5-ブロモdU、デオキシウリジン、逆向きdT、逆向きジデオキシ-T、ジデオキシ-C、5-メチルdC、デオキシイノシン、Super T(登録商標)、Super G(登録商標)、ロック核酸(LNA)、5-ニトロインドール、2’-O-メチルRNA塩基、ヒドロキシメチルdC、イソ-dG、イソ-dC、フルオロC、フルオロU、フルオロA、フルオロG、2-メトキシエトキシA、2-メトキシエトキシMeC、2-メトキシエトキシG、および/または2-メトキシエトキシTが挙げられる。アタッチメントケミストリーおよびリンカー修飾の例としては、非限定的に、アクリダイトTM、アデニル化、アジド(NHSエステル)、ジゴキシゲニン(NHSエステル)、コレステロール-TEG、I-リンカー、アミノ修飾体(例えば、アミノ修飾体C6、アミノ修飾体C12、アミノ修飾体C6 dT、アミノ修飾体および/またはUni-LinkTMアミノ修飾体)、アルキン(例えば、5’ヘキシニルおよび/または5-オクタジイニルdU)、ビオチン化(例えば、ビオチン、ビオチン(アジド)、ビオチン dT、ビオチン-TEG、デュアルビオチン、pCビオチン、および/またはデスチオビオチン-TEG)、および/またはチオール修飾(例えば、チオール修飾体C3 S-S、ジチオールおよび/またはチオール修飾体C6 S-S)が挙げられる。一部の態様では、本明細書に記載のような任意のプライマーが合成核酸を含む。
一部の態様では、本明細書に記載のプライマーペアの一方または両方のプライマーが、増幅させたDNAのプロセッシングを向上させるプライマー修飾を含む。一部の態様では、本明細書に記載のような任意のプライマーが、プライマーの除去を助長するプライマー修飾(例えば、増幅反応後のプライマーの除去)を含む。一部の態様では、プライマー修飾が増幅反応の産物に伝達される(例えば、増幅産物が修飾塩基を含む)。かかる場合では、増幅産物が、修飾およびその修飾に内在性の特性(例えば、修飾を含む増幅産物を選択できる能力)を含む。
一部の態様では、本明細書に記載のような1つまたは複数の染色体異常を同定するための方法は、アンプリコンベースシーケンシングのリードを使用する工程を含む。一部の態様では、複数のアンプリコン(例えば、DNAサンプルから得られたアンプリコン)がシーケンシングされる。一部の態様では、各アンプリコンが、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20回またはそれ以上シーケンシングされる。一部の態様では、各アンプリコンが、約1~約20(例えば、約1~約15、約1~約12、約1~約10、約1~約8、約1~約5、約5~約20、約7~約20、約10~約20、約13~約20、約3~約18、約5~約16または約8~約12)回シーケンシングされ得る。一部の場合では、アンプリコンベースシーケンシングのリードが連続シーケンスリードを含み得る。一部の場合では、アンプリコンが短鎖散在反復配列(SINE)を含む。一部の場合では、アンプリコンベースシーケンシングのリードが、約100,000~約2500万(例えば、約100,000~約2000万、約100,000~約1500万、約100,000~約1200万、約100,000~約1000万、約100,000~約500万、約100,000~約100万、約100,000~約750,000、約100,000~約500,000、約100,000~約250,000、約250,000~約2500万、約500,000~約2500万、約750,000~約2500万、約100万~約2500万、約500万~約2500万、約1000万~約2500万、約1500万~約2500万、約200,000~約2000万、約250,000~約1500万、約500,000~約1000万、約750,000~約500万または約100万~約200万)シーケンスリードを含み得る。例えば、複数のアンプリコンをシーケンシングすることは、固有識別子(UID)を各鋳型分子に(例えば、各アンプリコンに)帰属させること、固有タグを有する各鋳型分子を増幅させてUIDファミリーを作出すること、および増幅産物を重複してシーケンシングすることを含み得る。例えば、複数のアンプリコンをシーケンシングすることは、式
Figure 2022532761000016
を用いて、前記選択された染色体腕におけるバリアントのZスコアを計算することを含み得、式中、wiはバリアントiでのUID深度であり、ZiはバリアントiのZスコアであり、kは、染色体腕において観察されたバリアントの数である。一部の態様では、アンプリコンをシーケンシングする方法が当技術分野において公知の方法を含む(例えば、米国特許出願公開第2015/0051085号;およびKinde et al. 2012 PloS ONE 7:e41162参照、これらは参照によりその全体が本明細書に組み入れられる)。一部の態様では、アンプリコンが参照ゲノム(例えば、GRC37)に対してアラインメントされる。
一部の態様では、本明細書に記載の方法によって生成する複数のアンプリコンが、約10,000~約1,000,000(例えば、約15,000~約1,000,000、約25,000~約1,000,000、約35,000~約1,000,000、約50,000~約1,000,000、約75,000~約1,000,000、約100,000~約1,000,000、約125,000~約1,000,000、約160,000~約1,000,000、約180,000~約1,000,000、約200,000~約1,000,000、約300,000~約1,000,000、約500,000~約1,000,000、約750,000~約1,000,000、約10,000~約800,000、約10,000~約500,000、約10,000~約250,000、約10,000~約150,000、約10,000~約100,000、約10,000~約75,000、約10,000~約50,000、約10,000~約40,000、約10,000~約30,000または約10,000~約20,000)個のアンプリコン(例えば、固有アンプリコン)を含む。非限定的な一例として、複数のアンプリコンは、約745,000個のアンプリコン(例えば、745,000個の固有アンプリコン)を含み得る。複数のアンプリコン中のアンプリコンは、約50~約140(例えば、約60~約140、約76~約140、約90~約140、約100~約140、約130~約140、約50~約130、約50~約120、約50~約110、約50~約100、約50~約90、約50~約80、約60~約130、約70~約125、約80~約120または約90~約100)個のヌクレオチドを含み得る。非限定的な一例として、アンプリコンは約100個のヌクレオチドを含み得る。
一部の態様では、本明細書に記載の方法によって生成する複数のアンプリコン中の1個または複数のアンプリコンが1000塩基対(bp)より長い長さ(「長鎖アンプリコン」)であり得る。一部の態様では、1つまたは複数の長鎖アンプリコンが、複数のアンプリコン全体の全アンプリコンの少なくとも4.0%を構成する。一部の態様では、本明細書に記載の方法および材料により、長鎖アンプリコンは、長鎖アンプリコンが複数のアンプリコン全体の全アンプリコンの少なくとも4.0%を構成する場合に検出され得る。一部の態様では、本明細書に記載の方法および材料により、長鎖アンプリコンは、長鎖アンプリコンが複数のアンプリコン全体の全アンプリコンの0.01%~3.9%を構成する場合に検出され得る。
一部の態様では、>1000bpの長さを有する1個または複数のアンプリコンが、染色体異常を含んでいない細胞由来のDNAの増幅によって生じる。一部の態様では、染色体異常を含んでいない細胞が夾雑細胞とみなされる。一部の態様では、染色体異常を含んでいない細胞が対照の細胞または試料として使用される。一部の態様では、夾雑細胞が、血漿試料中にみられることもあり得る、意図される標的の増幅を希薄にし得る任意のさまざまな細胞であり得る。一部の態様では、夾雑細胞は白血球(white blood cell)(例えば、白血球(leukocyte)、顆粒球、好酸球、好塩基球、B細胞、T細胞またはナチュラルキラー細胞)である。例えば、夾雑細胞は白血球であり得る。
一部の態様では、本明細書に記載のような1つまたは複数の染色体異常を同定するための方法および材料は、シーケンスリード(例えば、複数のアンプリコンの)をゲノム区間のクラスター(例えば、固有クラスター)に群分けする工程を含む。一部の態様では、ある1つのゲノム区間が1つまたは複数のクラスターに含まれている。一部の態様では、ある1つのゲノム区間が、約100~約252(例えば、約125~約252、約150~約252、約175~約252、約200~約252、約225~約252、約100~約250、約100~約225、約100~約200、約100~約175、約100~約150、約125~約225、約150~約200または約160~約180)のクラスターに属し得る。非限定的な一例として、ある1つのゲノム区間が約176のクラスターに属し得る。一部の態様では、各クラスターが任意の適切な数のゲノム区間を含む。一部の態様では、各クラスターが同じ数のゲノム区間を含む。一部の態様では、いろいろなクラスターが、いろいろな数のゲノムクラスターを含む。非限定的な一例として、各クラスターは約200個のゲノム区間を含み得る。
一部の態様では、ゲノム区間が共有アンプリコン特徴を有すると同定される。本明細書で用いる場合、用語「共有アンプリコン特徴」は、複数のアンプリコンが有する1つまたは複数の類似した特徴を示す。一部の態様では、複数のゲノム区間が、クラスターに、ゲノム区間にマッピングされたシーケンスリードの1つまたは複数の共有アンプリコン特徴に基づいて群分けされる。一部の態様では、共有アンプリコン特徴が、ゲノム区間にマッピングされたアンプリコンの数(例えば、各ゲノム区間内のシーケンスリードの分布の総和)である。一部の態様では、共有アンプリコン特徴が、マッピングされたアンプリコンの平均長さである。
一部の態様では、ゲノム区間のクラスターが、約5000~約6000(例えば、約5100~約6000、約5200~約6000、約5300~約6000、約5400~約6000、約5500~約6000、約5600~約6000、約5700~約6000、約5800~約6000、約5900~約6000、約5000~約5900、約5000~約5800、約5000~約5700、約5000~約5600、約5000~約5500、約5000~約5400、約5000~約5300、約5000~約5200、約5000~約5100、約5100~約5800、約5100~約5700、約5100~約5600、約5100~約5500、約5100~約5400、約5100~約5300、約5100~約5200、約5200~約5600、約5200~約5500、約5200~約5400、約5200~約5300、約5300~約5500、約5300~約5400または約5400~5500 約5200~約5700または約5300~約5500)個のゲノム区間を含む。非限定的な一例として、ゲノム区間のクラスターは約5344個のゲノム区間を含み得る。ゲノム区間は任意の適切な長さであり得る。例えば、ゲノム区間は、本明細書に記載のようにしてシーケンシングされたアンプリコンの長さであり得る。例えば、ゲノム区間は染色体腕の長さであり得る。一部の場合では、ある1つのゲノム区間が、約100~約125,000,000(例えば、約250~約125,000,000、約500~約125,000,000、約750~約125,000,000、約1,000~約125,000,000、約1,500~約125,000,000、約2,000~約125,000,000、約5,000~約125,000,000、約7,500~約125,000,000、約10,000~約125,000,000、約25,000~約125,000,000、約50,000~約125,000,000、約100,000~約125,000,000、約250,000~約125,000,000、約500,000~約125,000,000、約100~約1,000,000、約100~約750,000、約100~約500,000、約100~約250,000、約100~約100,000、約100~約50,000、約100~約25,000、約100~約10,000、約100~約5,000、約100~約2,500、約100~約1,000、約100~約750、約100~約500、約100~約250、約500~約1,000,000、約5000~約900,000、約50,000~約800,000または約100,000~約750,000)個のヌクレオチドを含み得る。非限定的な一例として、ゲノム区間は約500,000個のヌクレオチドを含み得る。一部の態様では、ゲノム区間のクラスターが、当技術分野において公知の任意の適切な方法を用いて形成される。一部の態様では、ゲノム区間のクラスターが、ゲノム区間の共有アンプリコン特徴に基づいて形成される(例えばDouville et al. PNAS 201 115(8):1871-1876参照、これは参照によりその全体が本明細書に組み入れられる)。
一部の態様では、1つまたは複数の染色体異常を同定するための本明細書に記載の方法および材料は、ゲノム(例えば、哺乳動物のゲノム)を1つまたは複数の染色体異常(例えば、異数性)の有無についてアセスメントする工程を含む。哺乳動物のゲノムにおける1つまたは複数の染色体異常の有無は、例えば、哺乳動物から採取された試料(例えば、検査サンプル)から得られた複数のアンプリコンをシーケンシングしてシーケンスリードを得、シーケンスリードをゲノム区間のクラスターに群分けすることによって判定され得る。一部の場合では、ゲノム区間のリード数が同じサンプルの他のゲノム区間のリード数と比較され得る。ゲノム区間のリード数が同じサンプルの他のゲノム区間のリード数と比較される一部の場合では、第2の(例えば、対照または参照)サンプルはアッセイされない。一部の場合では、ゲノム区間のリード数が別のサンプルのゲノム区間のリード数と比較され得る。例えば、遺伝的近縁性、多型(例えば、体細胞変異)および/またはマイクロサテライト不安定性を同定するために本明細書に記載の方法および材料を使用する場合、ゲノム区間は参照サンプルのゲノム区間のリード数と比較され得る。参照サンプルは合成サンプルであり得る。参照サンプルはデータベースのものであってもよい。本明細書に記載の方法および材料が異常(例えば、異数性)を同定するために使用される一部の場合では、参照サンプルが、同じがん患者から採取された正常サンプル(例えば、がん細胞を有しないがん患者由来のサンプル)または別の供給源(例えば、がんを有していない患者)由来の正常サンプルであり得る。本明細書に記載の方法および材料が異常(例えば、異数性)を同定するために使用される一部の場合では、参照サンプルが、同じ患者から採取された正常サンプル(例えば、母体の細胞しか含まない出生前のヒト由来のサンプル)であり得る。
一部の態様では、本明細書に記載の方法および材料が、着床前の胚(例えば、体外受精によって得られた胚)における異数性を検出するために使用される。一部の態様では、着床前の胚における1つまたは複数の染色体異常の有無が、着床前の胚から採取された試料(例えば、検査サンプル、例えば非限定的に、胚盤胞から得られた1個または複数の細胞)から得られた複数のアンプリコンをシーケンシングしてシーケンスリードを得、シーケンスリードをゲノム区間のクラスターに群分けすることによって判定される。一部の場合では、ゲノム区間のリード数が同じサンプルの他のゲノム区間のリード数と比較され得る。ゲノム区間のリード数が同じサンプルの他のゲノム区間のリード数と比較される一部の場合では、第2の(例えば、対照または参照)サンプルはアッセイされない。一部の場合では、ゲノム区間のリード数が別のサンプルのゲノム区間のリード数(例えば、参照サンプル)と比較され得る。一部の態様では、参照サンプルが参照哺乳動物から採取された試料である。一部の態様では、参照サンプルがデータベースから得たものである(例えば、参照サンプルが、関心対象のゲノム位置の配列および/または倍数性が既知であるインシリコサンプルである)。着床前の胚において検出され得る例示的な異数性としては、21番染色体におけるトリソミー(例えば、ダウン症となる)、13番染色体におけるトリソミー、18番染色体におけるトリソミー、ターナー症候群(例えば、X染色体が1つしかない女性)およびクラインフェルター症候群(例えば、2つ以上のX染色体を有する男性)が挙げられる。
一部の態様では、本明細書に記載の方法および材料が、哺乳動物のゲノムにおける異数性を検出するために使用される。例えば、哺乳動物から採取された試料から得られた複数のアンプリコンがシーケンシングされ得、シーケンスリードがゲノム区間のクラスターへ群分けされ得、各ゲノム区間内のシーケンスリードの分布の総和が計算され得、染色体腕のZスコアが計算され得、哺乳動物のゲノムにおける異数性の存在または非存在が特定され得る。各ゲノム区間におけるシーケンスリードの分布の総和を得てもよい。例えば、各ゲノム区間におけるシーケンスリードの分布の総和は、式
Figure 2022532761000017
を用いて計算され得、式中、Riはシーケンスリードの数であり、Iは染色体腕におけるクラスターの数であり、Nは、パラメータμiおよびσi 2を伴うガウス分布であり、μiは各ゲノム区間におけるシーケンスリードの数の平均であり、σi 2は各ゲノム区間におけるシーケンスリードの分散である。染色体腕のZスコアは、任意の適切な手法を用いて計算され得る。例えば、染色体腕のZスコアは、分位点関数
Figure 2022532761000018
を用いて計算され得る。哺乳動物のゲノムにおける異数性の存在は、Zスコアが所定の有意性閾値外である場合、哺乳動物のゲノムにおいて特定され得、哺乳動物のゲノムにおける異数性の非存在は、Zスコアが所定の有意性閾値内である場合に哺乳動物のゲノムにおいて特定され得る。所定の閾値は、検査の信頼度および偽陽性の許容数に対応し得る。例えば、有意性閾値は、±1.96、±3または±5であり得る。一部の態様では、本明細書に記載の方法および材料には教師あり機械学習が使用される。一部の態様では、教師あり機械学習により、1つまたは複数の染色体腕における小さな変化が検出され得る。例えば、教師あり機械学習により、染色体異常と関連している疾患または障害、例えば、がんまたは先天異常に多くの場合で存在する変化、例えば染色体腕の獲得または喪失が検出され得る。一部の態様では、教師あり機械学習により、着床前の胚(例えば、体外受精法によって得られた着床前の胚)に存在する変化、例えば染色体腕の獲得または喪失が検出され得る。一部の場合では、教師あり機械学習が、サンプルを異数性状態に従ってクラス分類するために使用され得る。例えば、教師あり機械学習は、ゲノムワイド異数性コールを行なうために使用され得る。一部の場合では、サポートベクターマシンモデルが、SVMスコアを得ることを含み得る。SVMスコアは、任意の適切な手法を用いて得られ得る。一部の場合では、SVMスコアが、他に記載のようにして得られ得る(例えば、Cortes 1995 Machine learning 20:273-297;およびMeyer et al. 2015 Rパッケージ version:1.6-3参照)。低リード深度では、サンプルは典型的には高い生のSVMスコアを有する。したがって、一部の場合では、生のSVM確率がサンプルのリード深度に基づいて、式
Figure 2022532761000019
を用いて補正され得、式中、rは、リード深度が充分であると仮定したときの、ある特定のリード深度でのSVMスコア/ある特定のサンプルの最低SVMスコアの比である。AおよびBは、実施例1に記載のようにして求めることができる。例えば、A=-7.07610^-7、x=所与のサンプルでの固有鋳型分子の数、およびB=-1.94610^-1。
また、本明細書において、サンプル間のばらつき量を低減させる新しい正規化方法を提供する。一部の態様では、主成分分析(PCA)が正規化のために使用され得る。一部の態様では、PCAが対照のシーケンシングデータに対して行なわれる。例えば、PCAにより、500 kbのゲノム区間の数がn=5,344から、より扱いやすいサイズの数まで低減され得る。対照のPCA座標を使用し、ある特定の500kb区間が、さらなるサンプルにおいて、より高い効率で増幅されるのか、またはより低い効率で増幅されるのかを、そのPCA座標に基づいて予測するモデルが作成され得る。
Figure 2022532761000020
例えば、各検査サンプルについて、サンプルはPCA空間に射影され得、補正係数が各500kb区間について、そのPCA座標の関数として計算され得る。補正係数を各500 kbのゲノム区間に当てはめた後、検査サンプルが、1つまたは複数の対照サンプルと、その500 kb区間の最も近いユークリッド距離に基づいてマッチされ得る。
一部の態様では、データの品質を確保するためにサンプルが除外される。一部の態様では、データ解析の前に、データ解析と併存的に、および/またはデータ解析の後にサンプルが除外される。一部の態様では、一連の係数をデータに当てはめることが、一連の係数に示された基準に合わないデータを除外するために行なわれ得る。一部の態様では、一連の係数は任意の妥当な数値の係数であり得る。例えば、サンプルを除外するために一連の5つの係数が使用され得る。サンプルが除外されるべきであることを判定するために任意の組合せの係数が使用され得る。一部の態様では、2.5Mリードより少ないサンプルが除外され得る。一部の態様では、充分な夾雑のエビデンスを有するサンプルが除外され得る。例えば、サンプルは、サンプルが少なくとも10個の有意な対立遺伝子不均衡型染色体腕(zスコア>=2.5)および10個より少ない有意な染色体腕の獲得または喪失(z>=2.5またはz<=-2.5)を有するならば、夾雑状態とみなされ得る。一部の態様では、対立遺伝子不均衡がSNPにより判定され得、一方、獲得または喪失はWALDOによってアセスメントされ得る。一部の態様では、血漿試料の品質を調べる場合、8.5%より多くのアンプリコンが94bpより大きかった(フォワードプライマーとリバースプライマーの間が50塩基対の)サンプルが除外され得る。理論に拘束されることを望まないが、かかるサンプルは白血球DNAによる夾雑状態であり得る。一部の態様では、下記の式によって定義されるようなアッセイのダイナミックレンジ外のサンプルが除外され得る。
Figure 2022532761000021
例えば、このメトリックの分布は長い裾部分を有する。>0.2450および0.2320の値が、カットオフを評価することができたダイナミックレンジとして選択され得る。一部の態様では、同じ患者の白血球において異数性が既知の血漿試料が除外され得る。例えば、かかる患者は未確定の潜在能を持つクローン性造血(CHIP)または先天性の障害を有し得る。
一部の態様では、本明細書において、不確定な長さのコピー数バリアント(CNV)を検出するための方法を提供する。一部の態様では、本明細書において、ほぼ固定の長さのコピー数多型を検出するための方法を提供する。一部の態様では、コピー数多型を検出することが、1つまたは複数の変数の値を計算することを含む。一部の態様では、各染色体腕における500 kb区間ごとの検査サンプルの実測値とWALDO予測値の対数を使用し、サーキュラーバイナリーセグメンテーションアルゴリズムを適用して、各染色体腕全体におけるコピー数バリアントを調べられ得る。例えば、サイズが≦5Mbのコピー数バリアントにフラグが立ち得る。一部の態様では、フラグが立ったCNVが解析の前に、解析と併存的に、および/または解析の後に除去され得る。一部の態様では、微細欠失または微細増幅をアセスメントするために小CNVが使用され得る。例えば、微細欠失または微細増幅はディジョージ症候群(染色体22q11.2または乳がん(染色体17q12)に起こる。
一部の態様では、本明細書において、合成の異数性サンプルを使用する方法を提供する。一部の態様では、合成の異数性サンプルが、いくつかの染色体腕由来のリードをこのような正常DNAサンプル由来のリードに付加すること(または取り去ること)により作出され得る。例えば、1、10、15または20の染色体腕由来のリードが各サンプルに対して付加され得るか、または取り去られ得る。付加および取り去りは、新生物細胞率が0.5%~1.5%の範囲となり、厳密に1000万リードを含む合成サンプルがもたらされるように設計され得る。各染色体腕由来のリードは一様に付加され得るか、または取り去られ得る。一部の態様では、本明細書において、例示的な擬似コード(図5)を用いて合成の異数性サンプルを作成する方法を提供する。一部の態様において、当業者は、公知のコード言語および手法を図5に示した例示的な擬似コードに適用することによって合成サンプルを作成することができよう。
本明細書に記載の方法および材料を用いて検出され得る染色体異常の例としては、非限定的に、数的障害、構造的異常、対立遺伝子不均衡およびマイクロサテライト不安定性が挙げられる。染色体異常としては数的障害が挙げられ得る。例えば、染色体異常としては、異数性(例えば、異常な染色体数)が挙げられ得る。一部の場合では、異数性が染色体全体を包含し得る。一部の場合では、異数性が染色体の一部(例えば、染色体腕の獲得または染色体腕の喪失)を包含し得る。異数性の例としては、非限定的に、モノソミー、トリソミー、テトラソミーおよびペンタソミーが挙げられる。染色体異常としては構造的異常が挙げられ得る。構造的異常の例としては、非限定的に、欠失、重複、転座(例えば、相互転座およびロバートソン転座)、逆位、挿入、環状および同腕染色体が挙げられる。染色体異常は、任意の染色体ペア(例えば、1番染色体、2番染色体、3番染色体、4番染色体、5番染色体、6番染色体、7番染色体、8番染色体、9番染色体、10番染色体、11番染色体、12番染色体、13番染色体、14番染色体、15番染色体、16番染色体、17番染色体、18番染色体、19番染色体、20番染色体、21番染色体、22番染色体および/または一方の性染色体(例えば、X染色体もしくはY染色体)に起こり得る。例えば、異数性は、非限定的に、13番染色体(例えば、13トリソミー)、16番染色体(例えば、16トリソミー)、18番染色体(例えば、18トリソミー)、21番染色体(例えば、21トリソミー)、および/または性染色体(例えば、X染色体モノソミー;性染色体トリソミー、例えばXXX、XXYおよびXYY;性染色体テトラソミー、例えばXXXXおよびXXYY;ならびに性染色体ペンタソミー、例えばXXXXX、XXXXYおよびXYYYY)に起こり得る。例えば、構造的異常は、非限定的に、4番染色体(例えば、4番染色体の短腕の部分欠失)、11番染色体(例えば、11qの端部欠失)、13番染色体(例えば、13番染色体におけるロバートソン転座)、14番染色体(例えば、14番染色体におけるロバートソン転座)、15番染色体(例えば、15番染色体におけるロバートソン転座)、17番染色体(例えば、末梢性ミエリンタンパク質22をコードしている遺伝子の重複)、21番染色体(例えば、21番染色体におけるロバートソン転座)および22番染色体(例えば、22番染色体におけるロバートソン転座)に起こり得る。
一部の態様では、本明細書に記載のような方法および材料が、1つまたは複数の染色体異常(例えば、本明細書に記載のとおりに同定される1つまたは複数の染色体異常、例えば非限定的に、異数性)と関連している疾患を特定および/または処置するために使用される。一部の場合では、哺乳動物から採取されたDNAサンプル(例えば、ゲノムDNAサンプル)が、1つまたは複数の染色体異常の有無についてアセスメントされ得る。例えば、哺乳動物(例えば、ヒト)は、少なくとも一部において1つまたは複数の染色体異常の存在に基づいて疾患を有すると特定され得、1つまたは複数のがん処置法で処置され得る。一部の態様では、少なくとも一部において1つまたは複数の染色体異常の存在に基づいてがんを有すると特定された哺乳動物が、1つまたは複数のがん処置法で処置される。一部の態様では、哺乳動物(例えば、出生前のヒト)が、少なくとも一部において1つまたは複数の染色体異常の存在に基づいて疾患または障害を有すると特定され得る。一部の態様では、胚(例えば、体外受精によって得られた胚)が、少なくとも一部において1つまたは複数の染色体異常の存在に基づいて、着床のために子宮(例えば、ヒトの子宮)に移すことに適さないと特定され得る。一部の態様では、胚(例えば、体外受精によって得られた胚)が、少なくとも一部において1つまたは複数の染色体異常の非存在に基づいて、着床のために子宮(例えば、ヒトの子宮)に移すことに適していると特定され得る。
一部の態様では、本明細書に記載のとおりに(例えば、少なくとも一部において1つまたは複数の染色体異常の存在、例えば非限定的に、異数性に基づいて)1つまたは複数の染色体異常と関連している疾患または障害を有すると特定された哺乳動物が、任意の適切な方法を用いて確認された疾患または障害の診断を有し得る。1つまたは複数の染色体異常の存在を確認するために使用され得る方法の例としては、非限定的に、核型分析、蛍光インサイチュハイブリダイゼーション(FISH)、ショートタンデムリピートの定量PCR、定量蛍光PCR(QF-PCR)、定量PCR量解析、SNPの定量的質量分析、比較ゲノムハイブリダイゼーション(CGH)、全ゲノムシーケンシングおよびエクソームシーケンシングが挙げられる。
がん検出のためのマルチアナライト検査
一部の態様では、異数性の検出が、哺乳動物を、がん(例えば、本明細書に記載の例示的な任意のがん)を有すると特定するために使用される。一部の態様では、1つまたは複数の遺伝子バイオマーカーの検出が、哺乳動物を、がん(例えば、本明細書に記載の例示的な任意のがん)を有すると確認するため、または特定するために使用される。一部の態様では、1つまたは複数のペプチドバイオマーカーの高値レベルが、哺乳動物を、がん(例えば、本明細書に記載の例示的な任意のがん)を有すると確認するため、または特定するために使用される。一部の態様では、本明細書に記載のようにして(例えば、異数性の検出に基づいて、および/または少なくとも一部において1つもしくは複数の遺伝子バイオマーカー(例えば、変異)の有無および/または1つもしくは複数のタンパク質バイオマーカー(例えば、ペプチド)の高値レベルに基づいて)がんを有すると特定された哺乳動物が、任意の適切な方法を用いて確認されたがんの診断を有し得る。がんと診断するため、またはがんの診断を確認するために使用され得る方法の例としては、非限定的に、身体検査(例えば、骨盤内検査)、画像検査(例えば、超音波またはCTスキャン)、細胞診および組織検査(例えば、生検)が挙げられる。
一部の態様では、1つまたは複数の染色体異常(例えば、異数性)を同定するための本明細書において提供する方法が、明確なステージのがんを有すると特定するために使用される。哺乳動物を、一部の態様では、がんがステージIのがんであり得る。一部の態様では、がんがステージIIのがんであり得る。一部の態様では、がんがステージIIIのがんであり得る。一部の態様では、がんがステージIVのがんであり得る。一部の態様では、1つまたは複数の染色体異常(例えば、異数性)を同定するための本明細書において提供する方法が、哺乳動物を、慣用的ながん検出方法では信頼性のある検出ができないステージのがんを有すると特定するために使用される。例えば、1つまたは複数の染色体異常(例えば、異数性)を同定するための本明細書において提供する方法は、哺乳動物を、慣用的ながん検出方法では信頼性のある検出ができないステージIのがんを有すると特定するために使用され得る。一部の態様では、1)1つまたは複数の染色体異常(例えば、異数性)、および2)1つまたは複数の遺伝子バイオマーカー(例えば、本明細書において提供する遺伝子バイオマーカーのいずれか)を同定するための本明細書において提供する方法が、哺乳動物を、慣用的ながん検出方法では信頼性のある検出ができないステージのがんを有すると特定するために使用される。一部の態様では、1)1つまたは複数の染色体異常(例えば、異数性)、および2)1つまたは複数のタンパク質バイオマーカー(例えば、本明細書において提供するタンパク質バイオマーカーのいずれか)を同定するための本明細書において提供する方法が、哺乳動物を、慣用的ながん検出方法では信頼性のある検出ができないステージのがんを有すると特定するために使用される。本明細書に記載のとおりに(例えば、異数性の検出に基づいて、および/または少なくとも一部において1つもしくは複数の遺伝子バイオマーカー(例えば、変異)の有無および/または1つもしくは複数のタンパク質バイオマーカー(例えば、ペプチド)の高値レベルに基づいて)特定されるがんの非限定的な例としては、肝臓がん、卵巣がん、食道がん、胃がん、膵がん、結腸直腸がん、肺がん、乳がん、および前立腺がんが挙げられる。
一部の態様では、1つまたは複数の染色体異常(例えば、異数性)の存在が検出される対象が、さらなる診断検査に選択され得る。一部の態様では、本明細書において提供する方法が、対象を、慣用的な手法で対象が早期がんを有すると診断できる期間の前の期間において、さらなる診断検査に選択するために使用され得る。例えば、対象をさらなる診断検査に選択するための本明細書において提供する方法は、対象が慣用的な方法によってがんを有すると診断されていない場合および/または対象にがんが内在しているかわからない場合に使用され得る。一部の態様では、さらなる診断検査に選択された対象に診断検査(例えば、本明細書に記載のいずれかの診断検査)が、さらなる診断検査に選択されなかった対象と比べて高い頻度で施行され得る。例えば、さらなる診断検査に選択された対象には診断検査が、1日2回、毎日、隔週、毎週、隔月、毎月、年4回、年2回、毎年の頻度で、またはその間の任意の頻度で施行され得る。一部の態様では、さらなる診断検査に選択された対象には、さらなる診断検査に選択されなかった対象と比べて1つまたは複数のさらなる診断検査が施行され得る。例えば、さらなる診断検査に選択された対象には2つ以上の診断検査が施行され得るが、さらなる診断検査に選択されなかった対象には診断検査が1つしか施行されない(または診断検査は施行されない)。一部の態様では、診断検査方法により、初めに検出されたがんと同じ型のがんが存在すると判定され得る。付加的または択一的に、診断検査方法により、初めに検出されたがんと異なる型のがんが存在すると判定され得る。
一部の態様では、診断検査方法がスキャンである。一部の態様では、スキャンが骨スキャン、コンピュータ断層撮影法(CT)、CT血管造影法(CTA)、食道造影(バリウム嚥下)、バリウム注腸検査、ガリウムスキャン、磁気共鳴画像法(MRI)、マンモグラフィ、モノクローナル抗体スキャン(例えば、前立腺がんに関するProstaScint(登録商標)スキャン、卵巣がんに関するOncoScint(登録商標)スキャン、および結腸がんに関するCEA-Scan(登録商標))、マルチゲート収集(MUGA)スキャン、PETスキャン、PET/CTスキャン、甲状腺スキャン、超音波(例えば、乳房超音波、気管支腔内超音波、内視鏡下超音波、経膣超音波)、X線、DEXAスキャンである。
一部の態様では、診断検査方法が身体検査、例えば非限定的に、肛門鏡検査法、生検、気管支鏡検査法(例えば、自家蛍光気管支鏡検査法、白色光気管支鏡検査法、ナビゲーション気管支鏡検査法)、乳房デジタルトモシンセシス、直腸指診、内視鏡検査、例えば非限定的に、カプセル内視鏡検査、仮想内視鏡検査、関節鏡検査法、気管支鏡検査法、結腸内視鏡検査、コルポスコピー、膀胱鏡検査法、食道鏡検査法、胃鏡検査法、腹腔鏡検査法、喉頭鏡検査法、神経内視鏡検査、直腸鏡検査法、S状結腸鏡検査法、皮膚がん検査、胸腔鏡検査、内視鏡的逆行性胆管膵管造影法(ERCP)、食道胃十二指腸内視鏡検査、骨盤内検査である。
一部の態様では、診断検査方法が生検(例えば、骨髄穿刺、組織生検)である。一部の態様では、生検が、吸引針生検または外科的切除によって行なわれる。一部の態様では、診断検査方法が、生体試料(例えば、組織試料、尿試料、血液試料、チェックスワブ、唾液試料、粘膜試料(例えば、痰、気管支分泌物)、乳頭吸引物、分泌物または排泄物)を得る工程をさらに含む。一部の態様では、診断検査方法が、エキソソームタンパク質(例えば、エキソソーム表面タンパク質(例えば、CD24、CD147、PCA-3))(Soung et al.(2017)Cancers 9(1):pii:E8)を測定する工程を含む。一部の態様では、診断検査方法がオンコタイプDX(登録商標)検査(Baehner(2016)Ecancermedicalscience 10:675)である。
一部の態様では、診断検査方法が、非限定的に、アルファ-フェトプロティン血液検査、骨髄検査、便潜血検査、ヒトパピローマウイルス検査、低線量ヘリカルコンピュータ断層撮影法、腰椎穿刺、前立腺特異抗原(PSA)検査、パップスメアまたは腫瘍マーカー検査などの検査である。
一部の態様では、診断検査方法は、公知のタンパク質バイオマーカー(例えば、CA-125または前立腺特異抗原(PSA))のレベル測定する工程を含む。例えば、高値量のCA-125は、卵巣がん、子宮内膜のがん、卵管がん、膵がん、胃がん、食道がん、結腸がん、肝臓がん、乳がん、または肺がんを有する対象の血液中にみられ得る。用語「バイオマーカー」は、本明細書で用いる場合、例えば、米国立がん研究所によって定義されているような「正常な過程もしくは異常な過程または病態もしくは疾患指標となる、血液、他の体液または組織中にみられる生体分子」を示す。(例えばURL www.cancer.gov/publications/dictionaries/cancer-terms?CdrID=45618参照)。バイオマーカーとしては、遺伝子バイオマーカー、例えば非限定的に、核酸(例えば、DNA分子、RNA分子(例えば、マイクロRNA、長鎖非コードRNA(lncRNA)または他の非コードRNA)が挙げられ得る バイオマーカーとしては、タンパク質バイオマーカー、例えば非限定的に、ペプチド、タンパク質またはその断片が挙げられ得る。
一部の態様では、バイオマーカーがFLT3、NPM1、CEBPA、PRAM1、ALK、BRAF、KRAS、EGFR、Kit、NRAS、JAK2、KRAS、HPVウイルス、ERBB2、BCR-ABL、BRCA1、BRCA2、CEA、AFPおよび/またはLDHである。例えば、Easton et al.(1995)Am. J. Hum. Genet. 56:265-271、Hall et al.(1990)Science 250:1684-1689、Lin et al.(2008)Ann. Intern. Med. 149:192-199、Allegra et al.(2009)(2009)J. Clin. Oncol. 27:2091-2096、Paik et al.(2004)N. Engl. J. Med. 351:2817-2826、Bang et al.(2010)Lancet 376:687-697、Piccart-Gebhart et al.(2005)N. Engl. J. Med. 353:1659-1672、Romond et al.(2005)N. Engl. J. Med. 353:1673-1684、Locker et al.(2006)J. Clin. Oncol. 24:5313-5327、Giligan et al.(2010)J. Clin. Oncol. 28:3388-3404、Harris et al.(2007)J. Clin. Oncol. 25:5287-5312;Henry and Hayes(2012)Mol. Oncol. 6:140-146を参照のこと。一部の態様では、バイオマーカーが対象における乳がんの検出のためのバイオマーカー、例えば非限定的に、MUC-1、CEA、p53、ウロキナーゼ型プラスミノゲンアクチベータ、BRCA1、BRCA2および/またはHER2である(Gam(2012)World J. Exp. Med. 2(5):86-91)。一部の態様では、バイオマーカーが対象における肺がんの検出のためのバイオマーカー、例えば非限定的に、KRAS、EGFR、ALK、METおよび/またはROS1である(Mao(2002)Oncogene 21:6960-6969;Korpanty et al.(2014)Front Oncol. 4:204)。一部の態様では、バイオマーカーが対象における卵巣がんの検出のためのバイオマーカー、例えば非限定的に、HPV、CA-125、HE4、CEA、VCAM-1、KLK6/7、GST1、PRSS8、FOLR1、ALDH1である(Nolen and Lokshin(2012)Future Oncol. 8(1):55-71;Sarojini et al.(2012)J. Oncol. 2012:709049)。一部の態様では、バイオマーカーが対象における結腸直腸がんの検出のためのバイオマーカー、例えば非限定的に、MLH1、MSH2、MSH6、PMS2、KRASおよびBRAFである(Gonzalez-Pons and Cruz-Correa(2015)Biomed. Res. Int. 2015:149014;Alvarez-Chaver et al.(2014)World J. Gastroenterol. 20(14):3804-3824)。一部の態様では、診断検査方法により、核酸(例えば、マイクロRNA(Sethi et al.(2011)J. Carcinog. Mutag. S1-005)、RNA、SNP(Hosein et al.(2013)Lab. Invest doi:10.1038/labinvest.2013.54;Falzoi et al.(2010)Pharmacogenomics 11:559-571)、メチル化状態(Castelo-Branco et al.(2013)Lancet Oncol 14:534-542)、ホットスポットがん変異(Yousem et al.(2013)Chest 143:1679-1684))の存在および/または発現レベルを調べる。試料中の核酸の検出方法の非限定的な例としては、PCR、RT-PCR、シーケンシング(例えば、次世代シーケンシング法、ディープシーケンシング)、DNAマイクロアレイ、マイクロRNAマイクロアレイ、SNPマイクロアレイ、蛍光インサイチュハイブリダイゼーション(FISH)、制限断片長多型(RFLP)、ゲル電気泳動、ノザンブロット解析、サザンブロット解析、発色インサイチュハイブリダイゼーション(CISH)、クロマチン免疫沈降(ChIP)、SNPジェノタイピングおよびDNAメチル化アッセイが挙げられる。例えば、Meldrum et al.(2011)Clin. Biochem. Rev. 32(4):177-195;Sidranksy(1997)Science 278(5340):1054-9を参照のこと。
一部の態様では、診断検査方法が、試料中のタンパク質バイオマーカー(例えば、血漿バイオマーカー(Mirus et al.(2015)Clin. Cancer Res. 21(7):1764-1771))の存在を調べる工程を含む。タンパク質バイオマーカーの存在を調べる方法の非限定的な例としては、ウエスタンブロット解析、免疫組織化学検査(IHC)、免疫蛍光、質量分析(MS)(例えば、マトリックス支援レーザー脱離イオン化(MALDI)-MS、表面増強レーザー脱離イオン化飛行時間型(SELDI-TOF)-MS)、酵素結合イムノソルベントアッセイ(ELISA)、フローサイトメトリー、近接アッセイ(例えば、VeraTag近接アッセイ(Shi et al.(2009)Diagnostic molecular pathology:the American journal of surgical pathology, part B:18:11-21、Huang et al.(2010)AM. J. Clin. Pathol. 134:303-11))、タンパク質マイクロアレイ(例えば、抗体マイクロアレイ(Ingvarsson et al.(2008)Proteomics 8:2211-9、Woodbury et al.(2002)J. Proteome Res. 1:233-237)、IHCベースのマイクロアレイ(Stromberg et al.(2007)Proteomics 7:2142-50)、マイクロアレイELISA(Schroder et al.(2010)Mol. Cell. Proteomics 9:1271-80)が挙げられる。一部の態様では、タンパク質バイオマーカーの存在を調べる方法が機能アッセイである。一部の態様では、機能アッセイがキナーゼアッセイ(Ghosh et al.(2010)Biosensors & Bioelectronics 26:424-31、Mizutani et al.(2010)Clin. Cancer Res. 16:3964-75、Lee et al.(2012)Biomed. Microdevices 14:247-57)、プロテアーゼアッセイ(Lowe et al.(2012)ACS nano. 6:851-7、Fujiwara et al.(2006)Breast cancer 13:272-8、Darragh et al.(2010)Cancer Res 70:1505-12)である。例えば、がん患者を診断するためのタンパク質解析アッセイの概説については、Powers and Palecek(2015)J. Heathc Eng. 3(4):503-534を参照のこと。
一部の態様では、本明細書に記載のような1つまたは複数の染色体異常と関連している(例えば、少なくとも一部において1つまたは複数の染色体異常の存在、例えば非限定的に、異数性に基づいて)任意の適切な疾患または病態が本明細書に記載のとおりに同定される。一部の態様では、疾患が、がんである。1つまたは複数の染色体異常と関連している可能性があるがんの例としては、非限定的に、肺がん(例えば、小細胞肺がんまたは非小細胞肺がん)、甲状腺乳頭がん、甲状腺髄様がん、分化型甲状腺がん、再発性甲状腺がん、難治性分化型甲状腺がん、肺腺癌、細気管支肺細胞癌、多発性内分泌腺腫2A型もしくは2B型(それぞれ、MEN2AもしくはMEN2B)、褐色細胞腫、副甲状腺過形成、乳がん、結腸直腸がん(例えば、転移性結腸直腸がん)、乳頭状腎細胞癌、胃腸粘膜の神経節細胞腫、炎症性筋線維芽細胞性腫瘍、または子宮頸がん、急性リンパ芽球性白血病(ALL)、急性骨髄性(myeloid)白血病(AML)、青年期の若者のがん、副腎がん、副腎皮質癌、肛門がん、虫垂がん、星状細胞腫、異型奇形/ラブドイド腫瘍、基底細胞癌、胆管がん、膀胱がん、骨がん、脳幹膠腫、脳腫瘍、乳がん、気管支腫瘍、バーキットリンパ腫、カルチノイド腫瘍、原発不明癌、心臓腫瘍、子宮頸がん、小児がん、脊索腫、慢性リンパ球性白血病(CLL)、慢性骨髄性(myelogenous)白血病(CML)、慢性骨髄増殖性腫瘍、結腸がん、結腸直腸がん、頭蓋咽頭腫、皮膚T細胞性リンパ腫、胆管がん、非浸潤性乳管癌、胎児性腫瘍、子宮内膜のがん、上衣細胞腫、食道がん、鼻腔神経芽細胞腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管がん、目のがん、卵管がん、骨の線維性組織球腫、胆嚢がん、胃がん、胃腸管のカルチノイド腫瘍、消化管間質腫瘍(GIST)、胚細胞腫瘍、妊娠性絨毛疾患、神経膠腫、ヘアリー細胞腫瘍、ヘアリー細胞白血病、頭頸部がん、心臓のがん、肝細胞がん、組織球増殖症、ホジキンリンパ腫、下咽頭がん、眼内黒色腫、膵島細胞腫瘍、膵神経内分泌腫瘍、カポジ肉腫、腎臓がん、ランゲルハンス細胞組織球増殖症、喉頭がん、白血病、口唇および口腔のがん、肝臓がん、肺がん、リンパ腫、マクログロブリン血症、悪性骨の線維性組織球腫、骨の癌、黒色腫、メルケル細胞癌、中皮腫、転移性頸部扁平上皮がん、正中線上の癌、口腔(mouth)がん、多発性内分泌腺腫症候群、多発性骨髄腫、菌状息肉腫、骨髄異形成症候群、骨髄異形成/骨髄増殖性腫瘍、骨髄性(myelogenous)白血病、骨髄性(myeloid)白血病、多発性骨髄腫、骨髄増殖性腫瘍、鼻腔および副鼻腔のがん、鼻咽腔がん、神経芽細胞腫、非ホジキンリンパ腫、非小細胞肺がん、口腔(oral)がん、口腔(oral cavity)がん、口唇がん、口腔咽頭がん、骨肉腫、卵巣がん、膵がん、肝胆道がん、上部尿路がん、乳頭腫症、傍神経節腫、副鼻腔および鼻腔のがん、副甲状腺がん、陰茎がん、咽頭がん、褐色細胞腫、下垂体がん、形質細胞新生物、胸膜肺芽腫、妊娠中の乳がん、中枢神経系原発リンパ腫、原発性腹膜がん、前立腺がん、直腸がん、腎細胞がん、網膜芽腫、横紋筋肉腫、唾液腺がん、肉腫、セザリー症候群、皮膚がん、小細胞肺がん、小腸がん、軟部組織肉腫、扁平上皮癌、頸部扁平上皮がん、胃がん、T細胞性リンパ腫、精巣がん、咽喉がん、胸腺腫および胸腺癌、甲状腺がん、腎盂および尿管の移行上皮細胞がん、原発不明癌、尿道がん、子宮がん、子宮肉腫、膣がん、外陰がん、ワルデンストレームマクログロブリン血症、ウィルムス腫瘍、1p36欠失症候群、1q21.1欠失症候群、2q37欠失症候群、ウォルフヒルシュホーン症候群、猫鳴き症候群(Cri du chat)、5q欠失症候群、ウィリアムズ症候群、8pモノソミー、8qモノソミー、アルフィ症候群、クリーフストラ症候群、10pモノソミー、10qモノソミー、ヤコブセン症候群、パトウ症候群、アンジェルマン症候群、プラダー・ウィリ症候群、ミラー・ディカー症候群、スミス・マギニス症候群、エドワーズ症候群、ダウン症候群、ディジョージ症候群、フェラン・マクダーミド症候群、22q11.2遠位欠失症候群、キャットアイ症候群、XYY症候群、トリプルX症候群、クラインフェルター症候群、ウォルフヒルシュホーン症候群、ヤコブセン症候群、シャルコー・マリー・トゥース病1A型ならびにリンチ症候群が挙げられる。
本明細書に記載のような1つまたは複数の染色体異常と関連している疾患を有すると特定されたら(例えば、少なくとも一部において1つまたは複数の染色体異常の存在、例えば非限定的に、異数性に基づいて)、哺乳動物(例えば、ヒト)は相応に処置され得る。例えば、哺乳動物が、本明細書に記載のような1つまたは複数の染色体異常と関連しているがんを有すると特定された場合、哺乳動物は1つまたは複数のがん処置法で処置され得る。1つまたは複数のがん処置法は任意の適切ながん処置法を含み得る。がん処置法は手術を含み得る。がん処置法は放射線療法を含み得る。がん処置法は、化学療法、ホルモン療法、標的療法および/または細胞傷害性療法などの薬物療法の施行を含み得る。がん処置法の例としては、非限定的に、白金化合物(例えば、シスプラチンまたはカルボプラチン)、タキサン(例えば、パクリタキセルまたはドセタキセル)、アルブミン結合パクリタキセル(nab-パクリタキセル)、アルトレタミン、カペシタビン、シクロホスファミド、エトポシド(vp-16)、ゲムシタビン、イホスファミド、イリノテカン(cpt-11)、リポソーム内ドキソルビシン、メルファラン、ペメトレキセド、トポテカン、ビノレルビン、黄体形成ホルモン放出ホルモン(LHRH)アゴニスト(例えば、ゴセレリンおよびロイプロリド)、抗エストロゲン療法(例えば、タモキシフェン)、アロマターゼ阻害剤(例えば、レトロゾール、アナストロゾールおよびエキセメスタン)、血管新生阻害剤(例えば、ベバシズマブ)、ポリ(ADP)-リボースポリメラーゼ(PARP)阻害剤(例えば、オラパリブ、ルカパリブおよびニラパリブ)、外照射放射線療法、近接照射療法、放射性リン、ならびにその任意の組合せが挙げられる。
検出感度を高めるためのマルチアナライト試験
一部の態様では、異数性を検出(例えば、染色体配列(例えば、解析され得る反復エレメントの例示的な一覧については表1参照)の解析を用いて)するための本明細書において提供する方法により、がん検出の感度が、1つまたは複数の遺伝子バイオマーカーの存在をがんの指標として使用するがん検出と比べて高くなる。一部の態様では、異数性を検出(例えば、染色体配列(例えば、解析され得る反復エレメントの例示的な一覧については表1参照)の解析を用いて)するための本明細書において提供する方法により、がん検出の感度が、1つまたは複数のタンパク質バイオマーカーの存在をがんの指標として使用するがん検出と比べて高くなる。
一部の態様では、異数性を検出(例えば、染色体配列(例えば、解析され得る反復エレメントの例示的な一覧については表1参照)の解析を用いて)するための本明細書において提供する方法を、1つまたは複数の遺伝子バイオマーカー(例えば、変異)の存在を検出するための1つまたは複数の方法と併用する。一部の態様では、異数性の検出と遺伝子バイオマーカーの検出との併用によりがん検出の特異度および/または感度が高くなる。一部の態様では、異数性を検出(例えば、染色体配列(例えば、解析され得る反復エレメントの例示的な一覧については表1参照)の解析を用いて)するための本明細書において提供する方法を、タンパク質バイオマーカー(例えば、ペプチド)パネルの1つまたは複数の構成員の存在を検出するための1つまたは複数の方法と併用する。一部の態様では、異数性の検出とタンパク質バイオマーカーの検出との併用によりがん検出の特異度および/または感度が高くなる。一部の態様では、異数性を検出(例えば、染色体配列(例えば、解析され得る反復エレメントの例示的な一覧については表1参照)の解析を用いて)するための本明細書において提供する方法を、1つもしくは複数の遺伝子バイオマーカー(例えば、変異)の存在を検出するための方法および/またはタンパク質バイオマーカー(例えば、ペプチド)パネルの1つもしくは複数の構成員の存在を検出するための方法と併用する。一部の態様では、異数性の検出と遺伝子バイオマーカーおよび/またはタンパク質バイオマーカーの検出との併用により、がん検出の特異度および/または感度が高くなる。
一部の態様では、異数性を検出するための本明細書において提供する方法を、NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAFからなる群より選択される1つまたは複数の遺伝子における1つまたは複数の遺伝子バイオマーカー(例えば、変異)の存在を検出するための方法と併用する。一部の態様では、異数性を検出するための本明細書において提供する方法を、PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43およびPPP2R1Aからなる群より選択される1つまたは複数の遺伝子における1つまたは複数の遺伝子バイオマーカー(例えば、変異)の存在を検出するための方法と併用する。一部の態様では、アッセイは、本明細書に開示の遺伝子、例えば非限定的に、
Figure 2022532761000022
のいずれかの1つまたは複数における遺伝子バイオマーカー(例えば、変異)の検出を含む。一部の態様では、異数性の検出を1つまたは複数の遺伝子バイオマーカー(例えば、変異)の検出と併用することにより、がん検出の特異度および/または感度が高くなる。
一部の態様では、遺伝子バイオマーカー(例えば、1つまたは複数の遺伝子バイオマーカー)の検出が、参照によりその全体が本明細書に組み入れられる米国特許第7,700,286号に記載のさまざまな方法のいずれかを含む。当技術分野において公知のさまざまなメッセンジャーRNA(“mRNA”)単離方法の任意のものが、RNAを試料から単離するために使用され得る(例えば、Qiagen RNeasy Kit)。当技術分野において公知のさまざまなゲノムDNA(“gDNA”)単離方法の任意のものが、gDNAを試料から単離するために使用され得る(例えば、Qiagen DNeasy Kit)。一部の態様では、遺伝子バイオマーカーの検出が、がん検出アッセイを含む。一部の態様では、試料中のgDNAおよび/またはmRNAの量が、本明細書に開示の任意の遺伝子バイオマーカーについて測定される。gDNAおよび/またはmRNAの量の変化はがんを示唆し得る。例えば、gDNAを測定する場合、遺伝子の増幅(例えば、染色体配列(例えば、遺伝子のコード領域または非コードDNAのコピー数の増加(例えば、測定され得る反復エレメントの例示的な一覧については表1参照))はがんを示唆し得る。例えば、mRNAを測定する場合、RNA量の増加(例えば、遺伝子バイオマーカーの発現の増大)はがんを示唆し得る。一部の場合では、DNAの変化とRNAの変化が相関し得る。
一部の態様では、異数性を検出するための本明細書において提供する方法が、がん(例えば、卵巣または子宮内膜の)の存在を調べるために、AFP、CA19-9、CEA、HGF、OPN、CA-125、CA15-3、MPO、プロラクチン(PRL)および/またはTIMP-1からなる群より選択される1つまたは複数のタンパク質における1つまたは複数のタンパク質バイオマーカー(例えば、ペプチド)の存在を検出するための方法と併用され得る。一部の態様では、タンパク質バイオマーカーが任意の適切なペプチドバイオマーカーであり得る。一部の態様では、ペプチドバイオマーカーが、がんと関連しているペプチドバイオマーカーであり得る。例えば、ペプチドバイオマーカーは、がんにおいて高値レベル(例えば、ペプチドの参照レベルと比べたとき)を有するペプチドであり得る。
一部の特定のタンパク質バイオマーカーの例示的で非限定的な閾値レベルとしては、CA19-9(>92 U/ml)、CEA(>7,507 pg/ml)、CA125(>577 U/ml)、AFP(>21,321 pg/ml)、プロラクチン(>145,345 pg/ml)、HGF(>899 pg/ml)、OPN(>157,772 pg/ml)、TIMP-1(>176,989 pg/ml)、フォリスタチン(>1,970 pg/ml)、およびCA15-3(>98 U/ml)が挙げられる。一部の態様では、タンパク質バイオマーカーの閾値レベルが本明細書に記載の例示的な閾値レベルより高い(例えば、約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、約100%またはそれより高い)レベルであり得る。一部の態様では、タンパク質バイオマーカーの閾値レベルが本明細書に記載の例示的な閾値レベルより低い(例えば、約10%、約20%、約30%、約40%、約50%またはそれより大きく低い)レベルであり得る。
一部の態様では、CA19-9の閾値レベルが少なくとも約92 U/mL(例えば、約92 U/mL)であり得る。一部の態様では、CA19-9の閾値レベルが92 U/mLであり得る。一部の態様では、CEAの閾値レベルが少なくとも約7,507 pg/ml(例えば、約7,507 pg/ml)であり得る。一部の態様では、CEAの閾値レベルが7.5 ng/mLであり得る。一部の態様では、HGFの閾値レベルが少なくとも約899 pg/ml(例えば、約899 pg/ml)であり得る。一部の態様では、HGFの閾値レベルが0.92 ng/mLであり得る。一部の態様では、OPNの閾値レベルが少なくとも約157,772 pg/ml(例えば、約157,772 pg/ml)であり得る。一部の態様では、OPNの閾値レベルが158 ng/mLであり得る。一部の態様では、CA125の閾値レベルが少なくとも約577 U/ml(例えば、約577 U/ml)であり得る。一部の態様では、CA125の閾値レベルが577 U/mLであり得る。一部の態様では、AFPの閾値レベルが少なくとも約21,321 pg/ml(例えば、約21,321 pg/ml)であり得る。一部の態様では、AFPの閾値レベルが21,321 pg/mlであり得る。一部の態様では、プロラクチンの閾値レベルが少なくとも約145,345 pg/ml(例えば、約145,345 pg/ml)であり得る。一部の態様では、プロラクチンの閾値レベルが145,345 pg/mlであり得る。一部の態様では、TIMP-1の閾値レベルが少なくとも約176,989 pg/ml(例えば、約176,989 pg/ml)であり得る。一部の態様では、TIMP-1の閾値レベルが176,989 pg/mlであり得る。一部の態様では、フォリスタチンの閾値レベルが少なくとも約1,970 pg/ml(例えば、約1,970 pg/ml)であり得る。一部の態様では、CA15-3の閾値レベルが少なくとも約98 U/ml(例えば、約98 U/ml)であり得る。一部の態様では、CA15-3の閾値レベルが98 U/mlであり得る。一部の態様では、CA19-9、CEA、および/またはOPNの閾値レベルが、上記に挙げた閾値レベルより5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%またはそれよりさらに高い(例えば、CA-19-9では92 U/mL、CEAでは7,507 pg/ml、HGFでは899 pg/ml、OPNでは157,772 pg/ml、CA125では577 U/ml、AFPでは21,321 pg/ml、プロラクチンでは145,345 pg/ml、TIMP-1では176,989 pg/ml、フォリスタチンでは1,970 pg/mlおよび/またはCA15-3では98 U/mlの閾値レベルより高い)レベルであり得る。
一部の態様では、タンパク質バイオマーカーの閾値レベルは、診断目的または臨床目的の検査で典型的なレベルより高いレベルであり得る。例えば、CA19-9の閾値レベルは約37 U/mlより高い(例えば、約40 U/mL超、約45 U/mL超、約50 U/mL超、約55 U/mL超、約60 U/mL超、約65 U/mL超、約70 U/mL超、約75 U/mL超、約80 U/mL超、約85 U/mL超、約90 U/mL超、約95 U/mL超またはそれより高い)レベルであり得る。付加的または択一的に、CEAの閾値レベルは約2.5 ug/Lより高い(例えば、約3.0 ug/L超、約3.5 ug/L超、約4.0 ug/L超、約4.5 ug/L超、約5.0 ug/L超、約5.5 ug/L超、約6.0 ug/L超、約6.5 ug/L超、約7.0 ug/L超、約7.5 ug/Lまたはそれより高い)レベルであり得る。付加的または択一的に、CA125の閾値レベルは約35 U/mLより高い(例えば、約40 U/mL超、約45 U/mL超、約50 U/mL超、約55 U/mL超、約60 U/mL超、約65 U/mL超、約70 U/mL超、約75 U/mL超、約80 U/mL超、約85 U/mL超、約90 U/mL超、約95 U/mL超、約100 U/mL超、約150 U/mL超、約200 U/mL超、約250 U/mL超、約300 U/mL超、約350 U/mL超、約400 U/mL超、約450 U/mL超、約500 U/mL超、約550 U/mL超またはそれより高い)レベルであり得る。付加的または択一的に、AFPの閾値レベルは約21 ng/mLより高い(例えば、約25 ng/L超、約30 ng/L超、約40 ng/L超、約50 ng/L超、約60 ng/L超、約70 ng/L超、約80 ng/L超、約90 ng/L超、約100 ng/L超、約150 ng/L超、約200 ng/L超、約250 ng/L超、約300 ng/L超、約350 ng/L超、約400 ng/L超またはそれより高い)レベルであり得る。付加的または択一的に、TIMP-1の閾値レベルは約2300 ng/mLより高い(例えば、約2,500 ng/L超、約3,000 ng/L超、約4,000 ng/L超、約5,000 ng/L超、約6,000 ng/L超、約7,000 ng/L超、約8,000 ng/L超、約9,000 ng/L超、約10,000 ng/L超、約15,000 ng/L超、約20,000 ng/L超、約25,000 ng/L超、約30,000 ng/L超、約35,000 ng/L超、約40,000 ng/L超またはそれより高い)レベルであり得る。付加的または択一的に、フォリスタチンの閾値レベルは約2 ug/mLより高い(例えば、約2.5 ug/L超、約3.0 ug/L超、約3.5 ug/L超、約4.0 ug/L超、約4.5 ug/L超、約5.0 ug/L超、約5.5 ug/L超、約6.0 ug/L超、約6.5 ug/L超、約7.0 ug/L超、約7.5 ug/L超またはそれより高い)レベルであり得る。付加的または択一的に、CA15-3の閾値レベルは約30 U/mLより高い(例えば、約35 U/mL超、約40 U/mL超、約45 U/mL超、約50 U/mL超、約55 U/mL超、約60 U/mL超、約65 U/mL超、約70 U/mL超、約75 U/mL超、約80 U/mL超、約85 U/mL超、約90 U/mL超、約95 U/mL超またはそれより高い)レベルであり得る。一部の態様では、従来の診断アッセイまたは臨床アッセイの際の検査で典型的なレベルより高い閾値レベルの1つまたは複数のタンパク質バイオマーカーを検出することにより、がん検出の感度が改善され得る。
ペプチドバイオマーカーの例としては、非限定的に、AFP、アンジオポエチン-2、AXL、CA125、CA 15-3、CA19-9、CD44、CEA、CYFRA 21-1、DKK1、エンドグリン、FGF2、フォリスタチン、ガレクチン-3、G-CSF、GDF15、HE4、HGF、IL-6、IL-8、カリクレイン-6、レプチン、LRG-1、メソテリン、ミドカイン、ミエロペルオキシダーゼ、NSE、OPG、OPN、PAR、プロラクチン、sEGFR、sFas、SHBG、sHER2/sEGFR2/sErbB2、sPECAM-1、TGFa、トロンボス ポンジン-2、TIMP-1、TIMP-2およびビトロネクチンが挙げられる。例えば、ペプチドバイオマーカーは、OPN、IL-6、CEA、CA125、HGF、ミエロペルオキシダーゼ、CA19-9、ミドカインおよび/またはTIMP-1のうちの1つまたは複数を含み得る。一部の態様では、異数性の検出と1つまたは複数のタンパク質バイオマーカー(例えば、ペプチド)の検出を併用することにより、がん検出の特異度および/または感度が高くなる。
一部の態様では、遺伝子バイオマーカーおよび/またはタンパク質バイオマーカーの存在が、対象(例えば、ヒト対象)から単離または採取された任意のさまざまな生体試料、例えば非限定的に、血液、血漿、血清、尿、脳脊髄液、唾液、痰、気管支肺胞洗浄液、胆汁、リンパ液、嚢胞液、便、腹水、およびその組合せにおいて検出され得る。正常な健常ヒト対象は入らないが、がんを有するヒト対象は入るものより上の閾値値が得られた場合、当技術分野において公知の任意のタンパク質バイオマーカーが検出され得る。本明細書に記載のような1つまたは複数のタンパク質バイオマーカーのレベルの検出には任意の適切な方法が使用され得る。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが所定の閾値と比較される。一部の態様では、所定の閾値が汎用閾値またはグローバル閾値である。一部の態様では、所定の閾値が、ある特定のタンパク質バイオマーカーに関する閾値である。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが参照タンパク質バイオマーカーの絶対量と比較される。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが参照タンパク質バイオマーカーの量に相対的である。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが高値レベルである。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが所定の閾値より上である。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが所定の範囲内の閾値である。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが所定の閾値であるか、または所定の閾値の概算値である。一部の態様では、1つまたは複数のタンパク質バイオマーカーのレベルが所定の閾値より下である。一部の態様では、生体試料由来の1つまたは複数のタンパク質バイオマーカーのレベルが、ある特定の閾値より下である。一部の態様では、生体試料由来の1つまたは複数のタンパク質バイオマーカーのレベルが所定の閾値と比べて下がっている。
一部の態様では、本明細書に記載の方法および材料が、哺乳動物のゲノムにおける1つまたは複数の多型(例えば、体細胞変異)を検出するために使用され得る。例えば、第1の哺乳動物(例えば、試験哺乳動物または1つもしくは複数の多型が内在することが疑われる哺乳動物)から採取された試料から得られた複数のアンプリコンがシーケンシングされ得、第2の哺乳動物(例えば、参照哺乳動物)から採取された試料から得られた複数のアンプリコンがシーケンシングされ得、第1の哺乳動物から採取された試料由来のバリアントシーケンスリードが、ゲノム区間のクラスターへ群分けされ得、第2の哺乳動物から採取された試料由来の参照シーケンスリードが、ゲノム区間のクラスターへ群分けされ得、両方のアレルにおけるバリアントシーケンスリードと参照シーケンスリードの合計が約3より多い(例えば、約4より多い、約5より多い、約6より多い、約7より多い、約8より多い、約9より多い、約10より多い、約12より多い、約15より多い、約18より多い、約20より多い、約22より多い、約25より多い、または約30より多い)染色体腕が選択され得、選択された染色体腕のバリアント-アレル頻度(VAF)が求められ得、選択された染色体腕における1つまたは複数の多型の存在または非存在が特定され得る。選択された染色体腕のVAFは、任意の適切な手法を用いて求められ得る。例えば、選択された染色体腕のVAFは、バリアントシーケンスリード/シーケンスリードの総数の数値であり得る。哺乳動物のゲノムにおける1つまたは複数の多型の存在は、VAFが約0.2~約0.8(例えば、約0.3~約0.8、約0.4~約0.8、約0.5~約0.8、約0.6~約0.8、約0.2~約0.7、約0.2~約0.6、約0.2~約0.5または約0.2~約0.4)である場合に哺乳動物のゲノムにおいて特定され得、哺乳動物のゲノムにおける1つまたは複数の多型の非存在は、VAFが所定の有意性閾値内である場合に哺乳動物のゲノムにおいて特定され得る。例えば非限定的に、哺乳動物のゲノムにおける1つまたは複数の多型の存在は、VAFが約0.4~0.6である場合に哺乳動物のゲノムにおいて特定され得る。
一部の態様では、本明細書に記載の方法および材料が試料の同定のために使用され得る。本明細書に記載の方法によって増幅される反復エレメントは、試料(例えば、血漿、腫瘍および血液)間での試料の同一性(sample identify)を確立するため、または試料の同一性の誤りを証明するために使用され得る一般的多型を含む。例えば、多型の場所の各々における遺伝子型が同定され、試料間で比較され得る。多型の場所における試料間の全体的な類似性を試料の同一性を判定するために使用してもよい。
一部の場合では、本明細書に記載のような1つまたは複数の染色体異常と関連している(例えば、少なくとも一部において1つまたは複数の染色体異常の存在、例えば非限定的に、異数性に基づいて)疾患は、対照(例えば、非疾患試料)と比較したとき、高い変異率とも関連している(例えば、高い変異率は疾患の病期と関連し得る)。かかる場合において、本明細書に記載の材料および方法は、対照と比べた変異率(例えば、変異の数)の測定値に基づいて(a)1つまたは複数の染色体異常(例えば、異数性)の存在を特定する、ならびに(b)疾患の病期(例えば、がんのステージI、II、IIIおよびIV)を特定するために使用され得る。
本発明を、以下の実施例においてさらに説明する。以下の実施例は、特許請求の範囲に記載の本発明の範囲を限定するものではない。
実施例1: がんを有する患者における異数性の検出
この実施例では、アンプリコンベースの異数性検出の新規な適合を記載する。染色体腕における変化を検出するために教師あり機械学習を使用するWALDO(Within-Sample-AneupLoidy-DetectiOn、サンプル内異数性検出)と称されるアプローチにより、これまでの方法と比べて異数性の検出感度が改善された。ここでは、DNAサンプル由来の短鎖散在反復配列(SINE)のアンプリコンを解析するためにWALDOを使用することで異数性検出の感度が高まることが示された。また、約100bpの平均長さを有する約1,000,000のSINEアンプリコンにより、検出感度も高めつつセルフリーDNAインプットの必要インプットが低減される。
材料および方法
プライマー
候補プライマーのリストを作成するため、hg19のRepeatMaskerトラック内の考えられ得るすべての6量体(4^6=4096)の頻度を計算した。次に、6量体から75bp上流または下流内の考えられ得るすべての4量体(4^4=256)の頻度を計算した。これらの6量体と4量体を合わせて2,097,152とおりの候補ペアを作成した。これらのペアを、単峰型分布を目指して、PCR媒介性増幅から予測される固有ゲノム座位の数、6量体とその対応する4量体との間の平均サイズ、およびこのようなサイズの分布に基づいて、さらなるアセスメントのために選択した。このフィルタリング基準によって16とおりの潜在的k量体ペアが得られ、このようなk量体ペアが3-末端に組み込まれた16とおりのプライマーペアを設計した。k量体は、当技術分野において、配列内に含まれている長さkの部分配列を示すと理解されている。
合計で、16種類のプライマーを最初に設計し、試験した(表2)。1つのプライマー(SEQ ID NO:1)は、一貫してプライマー二量体が少なく、コホートの試験における使用に選択された。一方のプライマーとしてSEQ ID NO:1を有するプライマーペアではアンプリコンが745,184個に固有に増幅され、これらのアンプリコンは約88bpの平均アンプリコンサイズを有した(図1A)。図1Aに示すアンプリコンサイズには45bpのプライマーが含まれている。例えば、プライマーを含めない場合、アンプリコンは約43塩基対の平均サイズを有する(図1B)。
(表2)
Figure 2022532761000023
シーケンシングライブラリーの調製
SEQ ID NO:1を有する第1のプライマーには、5’末端から3’末端に向かって、ユニバーサルプライマー配列(UPS)、固有識別子DNA配列(UID)および増幅配列を含めた。ポリメラーゼ連鎖反応(PCR)を、7.25 uLの水、0.125 uLの各プライマー、12.5 uLのNEBNext Ultra II Q5 Master Mix(New England Biolabsカタログ番号M0544S)および5 uLのDNAを含む25 uLの反応液で行なった。サイクル条件は、98℃で120秒を1サイクル、次いで98℃で10秒、57℃で120秒および72℃で120秒を15サイクルであった。血漿を用いた実験では、5 uL中のDNA量を0.14 ngにした。次いで、シーケンシングの前に各PCRにデュアルインデックス(バーコード)を付加するために2回目のPCRを行なった。2回目のPCRに使用したフォワードプライマーおよびリバースプライマーを表2に列記する。最初の増幅プライマーは除去せず、1回目の反応による増幅産物を1:20に希釈した。この希釈物を直接、1回目のプライマーによって導入されたUPS部位にアニーリングし、かつIllumina製フローセルとのハイブリダイゼーションに必要な5’グラフティング配列をさらに含むプライマーを使用する2回目の増幅に使用した。
FIndexes(例えば、サンプル間の識別を行なうために使用される配列)を、後でマルチプレックス型シーケンシングが可能となるように、第2のリバースプライマーを用いて各サンプルに導入した。2回目のPCRを、7.25 uLの水、0.125 uLの各プライマー、12.5 uLのNEBNext Ultra II Q5 Master Mix(New England Biolabsカタログ番号M0544S)、および5%の1回目のPCR産物を含む5 uLの DNAを含む25 uLの反応液で行なった。サイクル条件は、98℃で120秒を1サイクル、次いで98℃で10秒、65℃で15秒および72℃で120秒を15サイクルであった。増幅産物をアガロースゲル上で分離させて増幅を確認した。増幅産物を、1.2倍量のAMPure XPビーズを用いて精製し、分光測色法、リアルタイムPCR、Agilent 2100 BioanalyzerまたはAiglent TapeStationを用いた自動電気泳動によって定量した。オリゴヌクレオチドはすべて、Integrated DNA技術(Coralville, Iowa)から購入した。
シーケンシングおよびシーケンシング解析
Bowtie2を使用し、7つのプライマーペアの各々を用いて生成したアンプリコンのリードをヒト参照ゲノムアセンブリGRC37(Langmead et al. 2012)とアラインメントした。プライマーペア1(SEQ ID NO:1を有するプライマーとSEQ ID NO:10を有するプライマー)では、全リードの平均51.1%を固有にアラインメントすることができ、平均アンプリコンサイズは88bpであった(図1A)。図1Aに示すアンプリコンサイズには45bpのプライマーが含まれている。例えば、プライマーを含めない場合、アンプリコンは約43塩基対の平均サイズを有する(図1B)。プライマーペア1は理論的には、固有にアラインメントされ得る反復エレメントを745,184個まで増幅することができたが、平均的なサンプルには平均350,000個の反復エレメントが含まれていた。図1C参照。理論に拘束されることを望まないが、血漿試料中のアンプリコンの潜在数と実際の数の実測値との間の不一致にはいくつかの潜在的理由があった。(1)配列内の多型によってミスアラインメントが引き起こされ、「ミッシングアンプリコン」となったのかもしれない。(2)プライマー内の多型によって増幅されなかったのかもしれない。(3)各アンプリコンが異なるPCR効率を有しており、PCR中、低効率アンプリコンが打ち負かされたのかもしれない。(4)小DNA断片が優先的に増幅されて長鎖アンプリコン(>100bp)が増幅されなかったのかもしれない。(5)セルフリーDNA内のDNA断片のサイズが小さいため、セルフリーDNA内に長鎖アンプリコンが存在しなかったのかもしれない。(6)これらのサンプルに使用されたシーケンシング量が、どのアンプリコンも、特に低PCR効率を有するものも観察されるのに充分に高くなかったのかもしれない。(7)最後に、一部の反復エレメントは、どの個体にも存在しているとは限らなかったのかもしれない。SEQ ID NO:1とSEQ ID NO:10のプライマーペアによって生成したアンプリコン内には、52,762の多型が同定された。1348例の正常血漿とがん患者個体由来の883例の血漿の検査コホートにおけるヘテロ接合の部位の平均数は2,200であった。これらの部位を用いて対立遺伝子不均衡を測定し、サンプルを遺伝学的に同定し、サンプルが偶発的に一体に混合されたのかどうかを調べることができた。同じSNPを使用し、合成実験を用いて、1つのサンプルDNAの量が所与の混合物の2つのサンプルDNAの量の>4%である場合にサンプルの混合が検出され得ると推定した。
統計解析
リード深度ベースの解析方法は全ゲノムシーケンシング(WGS)プロトコルに広く適用されている。リードが一様に独立して分布しているという仮定の下では、正常なコピー数の領域はポアソン分布または正規分布に従うと予測される(Zhao et al 2013 and Pirooznia et al 2015)。アンプリコンベースのプロトコルでは比較的低コストで高いカバレッジ深度が得られ、WGSの魅力的な代替法であるが、アンプリコンシーケンシングによるアラインメント済みリード、例えば上記のアッセイにより生じるものは、WGSおよびWESにより生じるものとは異なる特性を有する。このようなリードは比較的少数の離散した座位に限定されるため不連続である。また、このようなリードはランダムな分布でもなく、これにより、WGSおよびWES用に設計されたリード深度カバレッジの統計モデルを使用することが困難となっている。サンプル内異数性検出(WALDO)は、アンプリコンベースの異数性検出用に特別に設計されたアルゴリズムである(例えばDouville et al. PNAS 201 115(8):1871-1876参照)。WALDOを、上記のゲノム座位にマッピングされたシーケンスリード(例えば、SINE)に適用した。ゲノムワイド異数性スコアを使用し、サンプルが異数性の存在を有するかどうかを特定した。
WALDOの基礎となる統計的原理
コピー数変化をアセスメントするためのほとんどの慣用的なアプローチとは異なり、WALDOでは、検査サンプル中の各染色体腕由来の正規化されたリード数を他のサンプル中の各染色体腕のリード率と比較しない。かかる慣用的な比較は、制御することが困難な可変量と関連しているバッチ効果および他の人為的影響を受ける。全ゲノムシーケンシングデータを評価するため、異数性を、各々500-kbの配列を含む5344個のゲノム区間内のリード数を比較することにより検出した。サンプル内の500-kbのゲノム区間内のリード数は、同じサンプル内の他のゲノム区間のリード数と比較しただけであった(したがってWALDOにおいて「Within-Sample(サンプル内)」と表示)。先に記載のWALDOプロトコルをこの実施例において個別調整し、これによりいくつかの解析の変更がもたらされた(図2参照)。修正には、後述するような、新しい正規化工程、不確定な長さの少数コピー数変化をコールするための新しい様式、およびゲノムワイド異数性を検出するための様式の改善を含めた。このような解析の改善を、SEQ ID NO:1とSEQ ID NO:10のプライマーペアを用いて得られるアンプリコンのゲノム密度の増大と合わせると、より高い感度ならびに1 Mb未満のサイズの局所の増幅および欠失の検出が可能となった。
正倍数性サンプルでは、各500-kbのゲノム区間内のリード数は、ある特定の他のゲノム領域内のリードの数とともにトラックされるはずである。一緒にトラックされるゲノム区間でそうなるのは、区間内のアンプリコンが同様の程度まで増幅されるためである。ここでは、一緒にトラックされるかかるゲノム領域を「クラスター」と称する。正倍数性サンプルにおけるシーケンシングデータからクラスターを同定することが可能である。検査サンプルでは、各事前定義クラスターの各ゲノム区間内のリードの数が同じサンプルのその他のクラスターの予測限界内であるかどうかが判定される。あるゲノム区間内のリードが統計学的予測限界外であり、同じ染色体腕においてかかる予測限界外が多く存在するならば、染色体腕は異数性とクラス分類される。この検査の統計学的根拠は他において記載されている(例えば、Douville et al. PNAS 201 115(8):1871-1876)。簡単には、リードの数はゲノム全体にランダムに分布されていないが、各クラスター内のスケールの(scaled)リードの分布はほぼ正規である。正規分布の便利な特性は、複数の正規分布の和もまた正規分布となることである。したがって、各染色体腕における合計のリードの理論上の平均と分散は、単に、染色体腕において示された全クラスターの平均と分散を合計することによりコンピューティングすることが可能である。
また、WALDOでは、これを臨床試料由来のPCR生成アンプリコンの解析に適用可能にするいくつかの他のイノベーションも使用される。このようなイノベーションのうちの一例は、データが最初の鋳型のサイズに強く依存することに起因する増幅バイアスを制御することである。別の例は、含まれている新生物率が少ない試料における異数性の検出を可能にする機械学習アルゴリズム(例えば、サポートベクターマシン(SVM))の使用である。
正規化
この実施例に記載の改善されたWALDO法は、サンプル間のばらつき量が低減された新しい正規化方法を含む。この正規化では、主成分分析(PCA)をまず、対照のシーケンシングデータに対して行なった。PCAにより、500 kbのゲノム区間の数がn=5,344から、より扱いやすいサイズの数まで低減された。対照のPCA座標を使用し、ある特定の500kb区間が、さらなるサンプルにおいて、より高い効率で増幅されるのか、またはより低い効率で増幅されるのかを、そのPCA座標に基づいて予測するためのモデル型を作出した。
Figure 2022532761000024
各検査サンプルについて、サンプルをPCA空間に射影し、補正係数を各500kb区間について、そのPCA座標の関数として計算した。補正係数を各500 kbのゲノム区間に当てはめた後、検査サンプルを7つの対照サンプルと、その500 kb区間の最も近いユークリッド距離に基づいてマッチさせた。
合成の異数性サンプルの作成
データを、各々少なくとも1000万リードを含みかつ各々正常なWBCのDNAに由来する84例のおそらく正倍数性の血漿試料から選択した。合成の異数性サンプルは、いくつかの染色体腕由来のリードをこのような正常DNAサンプル由来のリードに付加すること(または取り去ること)により作出した。1、10、15または20の染色体腕に由来するリードを各サンプルに対して付加するか、または取り去った。付加および取り去りは、0.5%~1.5%の範囲の新生物細胞率を表すように設計され、厳密に1000万リードを含む合成サンプルがもたらされた。各染色体腕由来のリードは一様に付加するか、または取り去った。例えば、喪失している5つの染色体腕をモデル設計する場合、各々は同一の度合いで喪失しており、本発明者らは腫瘍のヘテロ不均一性をモデルに組み込まなかった。さらに、いずれかの染色体腕を3つより多く;例えば、4コピーの3p染色体を含む合成サンプルは作出しなかった。この単純化したアプローチでは、生物学的に妥当なすべての異数性事象が包括的にカバーされなかった。しかしながら、改変された腕の考えられ得る組合せを限定することによって、サンプルの作成がコンピューティングによりトラック可能となり、得られたサポートベクターマシンは実際に良好に機能した。単一の染色体腕にしか由来しないリードが付加された、または取り去られた、合成によって作成したサンプルにより、本発明者らは、関心対象の単一の染色体腕のみが獲得された場合または喪失した場合のWALDOのパフォーマンスを推定することが可能であった。合成サンプルを作成するための擬似コードを図5に示す。
ゲノムワイド異数性の測定
2クラスサポートベクターマシン(SVM)をトレーニングし、正倍数性サンプルと異数性サンプルとの間の区別がなされるようにした。トレーニングセットには、少なくとも2.5Mのリードを含む正常個体由来の1348例のおそらく正倍数性の陰性クラスの血漿試料および635例の異数性サンプルを含めた。異数性クラスには、合成サンプルと実際に異数性のサンプルの混合物を含めた。SVMトレーニングは、Rにおいてe1071パッケージを用い、ラジアル基底カーネルおよびデフォルトパラメータを使用して行なった。各サンプルは、染色体腕の獲得および喪失を表す39のZスコア特徴を有した。トレーニング中、陽性クラスが陰性クラスのサイズの10%となるように、陽性クラスをランダムにサンプリングした。1つの合成サンプルに対して2つの実物サンプルの比で、陽性クラスをランダムにサンプリングした。この手順を10回のイテレーションで行なった。最終のゲノムワイド異数性スコアは、10回のイテレーションにおける生のsvmスコアの平均とした。
結果
このアッセイのパフォーマンスを、1348例の正倍数性の血漿試料およびがん患者由来の883例の血漿試料のコホートにおいてアセスメントした(表3)。がん患者由来の試料には、乳がん、結腸直腸がん、食道がん、肝臓がん、肺がん、卵巣がん、膵臓がん、および胃がんを含めた(図3)。1348例の正倍数性サンプルのコホートにおいて本発明者らが規定した99%の特異度をもたらすカットオフを使用すると、がん試料由来の49%の血漿が異数性を有することがわかった。
サンプル除外基準
本文書の結果のセクションに含めたすべてのサンプルが高品質となることを確実にするため、いくつかの除外基準を開発した。第1に、2.5Mより少ないリードのサンプルを除外した。第2に、充分な夾雑のエビデンスを有するサンプルを除外した。夾雑状態であると標示するためには、サンプルは少なくとも10個の有意な対立遺伝子不均衡型染色体腕(zスコア>=2.5)および10個より少ない有意な染色体腕の獲得または喪失(z>=2.5またはz<=-2.5)を有していなければならなかった。対立遺伝子不均衡はSNPにより判定するが、獲得または喪失はWALDOによってアセスメントした。混合実験によって調べると、多数の獲得または喪失が存在しない比較的多数の対立遺伝子不均衡型染色体腕で、別の個体由来のDNAによるサンプルの夾雑が示された。第3に、血漿の解析では、8.5%より多くのアンプリコンが94bpより大きかった(フォワードプライマーとリバースプライマーの間が50塩基対の)サンプルを除外した。かかるサンプルは白血球DNAによる夾雑状態である可能性が高かった。第4に、下記の式によって定義されるようなアッセイのダイナミックレンジ外のサンプルを除外した。
Figure 2022532761000025
このメトリックの分布は長い裾部分を有する。>0.2450および0.2320の値を、本発明者らがカットオフを評価することができるダイナミックレンジとして選択した。第5に、同じ患者の白血球において異数性が既知の血漿試料;かかる患者は、未確定の潜在能を持つクローン性造血(CHIP)または先天性の障害を有すると仮定した。
マルチアナライト検査を用いたがんの検出
異数性をさらなるバイオマーカーとして、公表されたフレームワークに組み込むことができるかどうか、ならびに異数性およびタンパク質マーカーを伴うロジスティック回帰モデルの予測能力を、体細胞変異およびタンパク質マーカーを使用するオリジナルのロジスティック回帰モデルと比較した。
ここでは、健常人由来の1348例の血漿試料および883人のがん患者を解析した。1348例の健常試料のうち、248例のみがオリジナル試験とオーバーラップした。883例のがん試料はすべて、オリジナル試験に含まれた。試料の個体群統計の情報を表3に示した。
812例のオリジナル健常試料(Cohen et al.)および883例のがん試料を用いて、ロジスティック回帰モデルをトレーニングし、次いでパフォーマンスを、10回の10分割交差検証を用いてアセスメントするために使用した。試料およびそのバイオマーカー値の完全リストを表3に示した。564例のオリジナル健常試料は異数性について解析しなかったため、1348例の正常試料由来のスコアのリストをランダムにサンプリングし、各ミッシング試料に異数性の値を帰属させた。10回の解析を行ない、新しい回ごとに1348の正常例のスコアのコレクションをランダムにサンプリングし直し、この564例の試料に新しいスコアを帰属させた。
異なる実験間での検出下限値の差異を説明するため、90位パーセンタイル特徴値を健常トレーニングサンプルにおいて使用した。この閾値より下の特徴値はいずれも、すべての値を90位パーセンタイル閾値に設定した。この変換を、すべてのトレーニングサンプルおよびテストサンプルに対して行なった。この手順を、異数性スコア、体細胞変異スコアおよびタンパク質濃度に対して行なった。ロジスティック回帰モデルによる90位パーセンタイル閾値および最終特徴係数を表4に列記した。
(表4)ロジスティック回帰係数および閾値
Figure 2022532761000026
他のがんバイオマーカーとの異数性検出感度の比較
異数性の結果を、ドライバー遺伝子変異パネルおよび血漿試料におけるがん検出のための主要なバイオマーカーとして最近公表された7つのタンパク質マーカー(AFP、CA-125、CA15-3、CA19-9、CEA、HGF、OPN、TIMP1)のコレクションに対してベンチマーク評価した(図4)(Cohen et. al 2018, Science 359(6378):926-930)。異数性は、すべてのタンパク質マーカーよりパフォーマンスが優れていた。また、異数性では、変異では見逃された試料の42%および変異パネルならびにタンパク質では見逃された試料の34%を検出することができた。この異数性アッセイの高特異度および各さらなるがんバイオマーカーの有用性のため、これらの成分を合わせて、がん検出のためのマルチアナライト検査にできることが理解されよう。
実施例2: 21トリソミー試料由来の低インプットのDNAでの異数性の検出
着床前診断法ならびに法医学への応用には、わずか数ピコグラム(pg)のDNAで異数性が確実に検出されることが必要である。着床前診断では、胚盤胞から採取された数個の細胞がコピー数多型のアセスメントに使用される。例えば、着床前診断は、哺乳動物を、ダウン症に関連する異数性を有すると特定することを含む。本開示において取り上げた方法でのインプットDNAに関する検出限界を試験するため、21トリソミーと関連している異数性を有するサンプルを、3~225 pgの範囲のインプットDNA濃度で解析した。リードとDNAとの関係は、陰性対照(DNAなしの水のウェル)および既知濃度の正倍数性の対照を基準にした(図6)。21トリソミーの異数性は、検査された各サンプルにおいて、二倍体細胞の半分である3 pgのインプットDNAを有するものにおいてですら、検出された。21トリソミーサンプルにおいて、21番染色体以外の染色体腕は異数性でないことが見出された。この実験に使用した正倍数性の対照において、21番染色体を含む染色体腕は異数性でないことが見出された。
実施例3: バイオバンクのサンプル由来の低インプットのDNAでの異数性の検出
バイオバンクの低インプットのDNAを有するサンプルを、異数性または同定目的のいずれかのためにアセスメントした。本明細書に記載の方法を、10年間という長期間PCRプレート内で保存されていた793例の血漿DNAサンプルに適用した。このPCRプレートの各ウェルは、DNA体積はすべて、他の実験で使用されたものであった。5マイクロリットルの水を乾燥(空の)ウェルに添加し、次いで本明細書に記載の方法に供した。728例のサンプルにおいて、異数性が確実にアセスメントされるのに充分な数である250万個より多くのアラインメント済みリードをシーケンシングした。これらのサンプルのうち768例において、血漿DNAと同じドナー由来の他のサンプルとの同一性が確認されるのに充分な数である100万個より多くのアラインメント済みリードをシーケンシングした。
実施例4: 血漿試料における白血球DNA夾雑の検出
血漿cfDNAは多くの場合、採血または血漿の調製のいずれかにより白血球から漏出したDNAとの夾雑状態である。この夾雑白血球DNAは、白血球が胎児細胞(NIPT中)またはがん細胞(液状生検材料中)のいずれにも由来しないため、血漿試料での異数性検査の感度を低下させ得る。白血球ゲノムDNA(gDNA)は>1000bpの平均断片サイズを有する一方、血漿セルフリーDNAは<160bpの平均サイズを有する。PCR反応中、小断片の方がより効率的に増幅されるとすると、短い方のcfDNAが優先的に増幅されるため夾雑白血球gDNAの検出は困難である。本明細書に記載の方法の適用により、SEQ ID NO:1とSEQ ID NO:10のプライマーを用いて生成されるアンプリコンのおかげで夾雑白血球gDNAの検出が可能となった。この方法を使用し、gDNAに典型的に存在するがcfDNAには存在しない1241個のアンプリコンを同定した。これらのアンプリコンのリードをシーケンシングすることにより、血漿試料における白血球夾雑が示された。白血球DNAと血漿セルフリーDNAを混合し、本明細書に記載の方法を使用することにより、表5に示すように、>4%の白血球DNAを含むサンプルを検出することができた。
(表5)血漿におけるgDNA夾雑の予測
Figure 2022532761000027
実施例5: 不確定な長さのコピー数解析
不確定な長さのコピー数バリアントを検出した。まず、各染色体腕における500 kb区間ごとの検査サンプルの実測値とWALDO予測値の比の対数を計算した。この比の対数を使用し、サーキュラーバイナリーセグメンテーションアルゴリズムを適用して各染色体腕全体におけるコピー数バリアントを見出した。サイズが≦5Mbのコピー数バリアントにはいずれもフラグが立った。各染色体腕における統計学的有意性を計算する前に、このようなフラグが立ったCNVを除去した。一般に、小CNVは、微細欠失または微細増幅、例えばディジョージ症候群(染色体22q11.2または乳がん(染色体17q12)に起こるものをアセスメントするために使用され得る。
実施例6: マルチアナライト検査でのがん検出の感度
この実施例では、異なるマルチアナライト検査でのがん検出の感度を記載する。
3つの異なるマルチアナライト検査を使用し、患者由来の血漿試料において8つ:乳房、卵巣、肝臓、肺、膵臓、食道、胃および結腸直腸のがんの検出感度を評価した。3つの検査は、(1)異数性状態、体細胞変異解析およびタンパク質バイオマーカーの評価を用いる3要素検査;(2)異数性状態と体細胞変異解析を用いる2要素検査;および(3)異数性状態とタンパク質バイオマーカーの評価を用いる2要素検査であった。検査した8つのタンパク質バイオマーカーおよび検査した体細胞変異はCohen et al., Science 359, pp. 926-930に記載のとおりであり、その全内容は参照により本明細書に組み入れられる。
図7A~7Bに示されるように、3要素マルチアナライト検査での卵巣、肝臓、肺、膵臓、食道、胃および結腸直腸のがんの検出感度の中央値は80%であり、検出感度の範囲は77%~97%であった。3要素マルチアナライト検査での乳がんの検出感度は38%であった。感度は99%の特異度における閾値を用いて計算した。
図8は、以下の検査:(1)異数性状態;体細胞変異;およびタンパク質バイオマーカー;(2)異数性状態とタンパク質バイオマーカー;(3)体細胞変異とタンパク質バイオマーカー;(4)異数性状態と体細胞変異;(5)異数性状態;ならびに(6)体細胞変異を用いたがん検出の真陽性率(感度の尺度)をさらに示す。検出の特異度は99%に維持された。
図8に示されるように、3要素マルチアナライト検査(異数性状態、体細胞変異解析およびタンパク質バイオマーカーの評価)では、がんが、99%の特異度で73%の感度で検出された。真陽性率(感度の尺度)は、その他の検査と比べると3要素マルチアナライト検査で最も高かった。
図9に示されるように、マルチアナライト検査(異数性状態とタンパク質バイオマーカーの評価)では、サンプルベースのがんのステージをみたとき異数性単独より高い感度でがんが検出された。
したがって、この実施例に開示したデータは、異数性状態、体細胞変異解析およびタンパク質バイオマーカーの評価を伴う3要素マルチアナライト検査により、高いがん検出の特異度は維持されたまま、がんの検出感度は高まり得ることを示す。
実施例7: 体細胞/生殖細胞系列の状態の測定
本明細書に記載の材料および方法を、試料(例えば、腫瘍試料または非腫瘍試料(すなわち、正常試料))から増幅された反復エレメントの配列内の体細胞変異を同定するために使用してもよい。例えば、非腫瘍試料と腫瘍試料の2種類の試料が同じ患者から入手可能な場合、一方の試料にはあるが他方にはない変異を見分けることができる。各試料について、体細胞変異の数がカウントされ、単一塩基置換(SBS)(例えば、A->T、A->Cなど)のスペクトルが測定され得る。また、試料をエクソームシーケンシングによって解析する場合、本明細書における増幅された反復エレメント内のSBSの数とエクソーム内のSBSの数との間の相関が調べられ得る。したがって、本明細書に記載の材料および方法を用いて試料における体細胞変異が同定され得る。
実施例8: サンプルの同定
本明細書に記載の材料および方法を、サンプルを同定および/または区別する(例えば、ある対象由来のサンプルを第2の対象由来のサンプルと区別する)ために使用してもよい。かかる場合では、サンプルを、本明細書に記載の材料および方法によって増幅された反復エレメント内に存在する一般的多型に基づいて同定する。次いでサンプルを、一般的多型の配列をサンプル間で比較することにより他のサンプルと区別する。各アンプリコンでの各多型の遺伝子型を調べることで、遺伝子型がサンプルに帰属される。遺伝子型は、サンプルを同定する(例えば、腫瘍試料を非腫瘍試料と、またはある対象由来のサンプルを異なる対象由来のサンプルと区別する)ためにサンプル間で比較され得る。サンプルは、一致度(例えば、遺伝子型間の類似性パーセント)が<0.99であり、少なくとも5,000個のアンプリコンが充分なカバレッジを有する場合、異なるサンプル由来であるとみなされ得る。
実施例9: 異なるステージおよび異なる型のがんにおける異数性の検出
異なるステージおよび異なる型のがんにおける異数性の検出をアセスメントするための一組の実験を行なった。この実験では、異なるステージの乳房、結腸直腸、食道、肝臓、肺、卵巣、膵臓および胃のがんを有する対象由来の血漿を本明細書に記載の方法に従って単離した。図10は、ステージI(n=109)、ステージII(n=276)およびステージIII(173)での異数性(99%の特異度における)を示す。図11は、がんのステージ(図10)ではなく、がんの型(図11)で示した図7の同じがんでの異数性(99%の特異度における)を示す。
Real Seq法を使用すると、異数性は、がん患者由来の血漿試料における変異より一般的に検出された。異数性は、がん患者由来の血漿試料における変異より一般的に検出された(883例の試料のうち、それぞれ49%および34%;P<10-20、片側二項検定、図19A)。組織型に関しては、異数性は、食道、結腸直腸、膵臓、肺、胃および乳房のがんを有する患者由来の試料における変異より一般的に(すべてP値<0.01)、卵巣の場合ではより一般的でなく(P=0.048)、肝臓がんの場合では等しく一般的に検出された(図19A)。ステージに関しては、異数性は、すべてのステージ、特にステージIおよびIIで変異より一般的に検出された(図19B、P値<10-9)。
実施例10: 異数性とタンパク質バイオマーカーを用いた試料におけるがんの検出
異数性の検出を本明細書に記載のようなタンパク質バイオマーカーの検出と組み合わせた場合のがん検出の感度をアセスメントするための一組の実験を行なった。このような実験では、実施例8のものと同じコホート(例えば、異なるステージの乳房、結腸直腸、食道、肝臓、肺、卵巣、膵臓および胃のがん)由来の血漿を、異数性およびタンパク質バイオマーカーについてアッセイした。図12は、異なるステージのがん(ステージI(n=109)、ステージII(n=276)およびステージIII(n=173)における検出感度を示す。
実施例11: Real Seqと他の次世代シーケンシング技術との比較
Real Seqのパフォーマンスを他の次世代シーケンシング技術と比較してアセスメントするための一組の実験を行なった。
最も一般的な形態のNIPTにおいては、染色体(例えば、ダウン症では21番染色体)の獲得または喪失の検出が目標である。全ゲノムシーケンシング(WGS)、FAST-SeqSおよびRealSeqSを使用し、非侵襲的出生前検査(NIPT)において典型的にみられるDNA混合物のサンプル、すなわち、胎児DNA率が5%である場合におけるパフォーマンスをアセスメントした。この目的のため、この3つの方法で得られた実際のデータを使用したが、次いで、同じサンプルの種々の染色体領域由来の既定の数のリードを加え、このような領域に異数性がみられる場合に起こるであろうことをシミュレーションした。このようなインシリコ・シミュレーション・サンプルを作成するために使用した擬似コードを図13および図14に記載する。ある特定の染色体腕におけるリード率の実測値を、正常パネルの平均リード率をこの正常パネルの標準偏差で割り算したものと比較する、高頻度に使用されるz-スコアを用いて、パフォーマンスを計算した。シングルエンドの100bpリードと仮定し、アラインメント率の違いおよび典型的に使用されるフィルタリング基準を考慮して、3つすべてのアプローチに必要とされた全リードの結果を報告する。
図15Aに示されるように、RealSeqSでは低シーケンシング量で一貫して高感度が得られた。例えば、RealSeqSは、モノソミーおよびトリソミーに対して5%の細胞率で99%の感度(99%の特異度における)を有したが、WGSおよびFAST-SeqSは、それぞれ94%および81%の感度を有した(図15A)。
コピー数多型に関するアッセイの別の重要な局面は、欠失または増幅した比較的小さい領域の検出である。例えば、ディジョージ症候群での欠失は多くの場合、1.5 Mbという小さいものである。5%の欠失含有細胞率をシミュレーションしたデータでは、RealSeqSは、1.5 Mbのディジョージ欠失に対して75.0%の感度(99%の特異度における)を有したが、WGSおよびFAST-SeqSは、それぞれ19.0%および29.0%の感度を有した(図15B;および図16A~16B)。
増幅、例えば乳がんにおけるERBB2の増幅の検出は、患者をトラスツズマブで処置すべきか他の標的療法で処置すべきかを決定するために重要である。この実施例では上記のものと同じプロトコルに従い、約42 KbのERBB2遺伝子の局所増幅(20コピー)を有するインシリコ・シミュレーション・サンプルをWGS、FAST-SeqSおよびRealSeqS用に作成した。RealSeqSでは、インシリコ・シミュレーション・サンプルにおける増幅が、WGSまたはFast-SeqSと比べて有意に少ないシーケンシングで検出された。1%の細胞率では、RealSeqSは91.0%の感度を有したが、WGSは50.0%の感度を有した(図15C;および図17A~17B)。
このデータは、Real SEQ手法により、増幅または欠失した小領域が検出され得、方法が低シーケンシング量で高感度を有することを示す。
実施例12: 少量濃度の腫瘍由来DNAを有するサンプルにおける異数性の検出
さまざまな濃度の腫瘍由来DNAを有するサンプルにおいてReal SEQ法を用いて異数性の検出をアセスメントするための一組の実験を行なった。血漿中に存在する変異の解析(Cohen et al., Science 359;926-930)によって変異型対立遺伝子率が測定されてある302例のサンプルのアセスメントにおいて、異数性が、変異型対立遺伝子率≧2%を有する65例のサンプルの92%、0.5%~2%の変異型対立遺伝子率を有する65例のサンプルの71%、および0.01%~0.5%の範囲の変異型対立遺伝子頻度を有する172例のサンプルの49%において検出された(図18)。これらの3つのクラスのサンプル間の異数性の差は有意であった(P<10-3、片側二項検定)。
このデータは、Real Seq法により、例えば低い腫瘍DNA濃度であっても異数性が検出され得ることを示す。したがって、異数性の検出感度はサンプルにおける循環腫瘍DNA濃度と関連している。
他の態様
本発明を、その詳細な説明とともに説明したが、前述の説明は実例を示すことを意図しており、本発明の範囲を限定することを意図するものではなく、本発明は、添付の特許請求の範囲の範囲によって規定されることは理解されよう。他の局面、利点および修正は以下の特許請求の範囲の範囲内である。
(表3)
Figure 2022532761000028
Figure 2022532761000029
Figure 2022532761000030
Figure 2022532761000031
Figure 2022532761000032
Figure 2022532761000033
Figure 2022532761000034
Figure 2022532761000035
Figure 2022532761000036
Figure 2022532761000037
Figure 2022532761000038
Figure 2022532761000039
Figure 2022532761000040
Figure 2022532761000041
Figure 2022532761000042
Figure 2022532761000043
Figure 2022532761000044
Figure 2022532761000045
Figure 2022532761000046
Figure 2022532761000047
Figure 2022532761000048
Figure 2022532761000049
Figure 2022532761000050
Figure 2022532761000051

Claims (107)

  1. 以下の工程を含む、哺乳動物のゲノムにおける異数性の存在について検査する方法:
    (a)複数のアンプリコンを形成させるために、DNAサンプル中の複数の染色体配列を、該染色体配列に相補的なプライマーペアを用いて増幅する工程であって、該プライマーペアは、異数性の検出を可能とするのに充分な数の配列を増幅する、工程;
    (b)該複数のアンプリコンのうちの1つまたは複数の核酸配列の少なくとも一部分を決定する工程;
    (c)シーケンシングされたアンプリコンを参照ゲノムにマッピングする工程;
    (d)該DNAサンプルを複数のゲノム区間に分割する工程;
    (e)該ゲノム区間にマッピングされたアンプリコンに関する複数の特徴を定量する工程;
    (f)第1のゲノム区間内のアンプリコンの該複数の特徴を、1つまたは複数の異なるゲノム区間内のアンプリコンの該複数の特徴と比較する工程;および
    (g)該増幅する工程で、異数性を検出するのに充分な数のアンプリコンが形成され、それにより、該哺乳動物の該ゲノムにおける異数性の存在が検査される工程。
  2. DNAサンプルが、複数の正倍数性DNAサンプルを含む、請求項1記載の方法。
  3. DNAサンプルが、複数の検査DNAサンプルを含む、請求項1記載の方法。
  4. 検査DNAが、倍数性の不明なDNAを含む、請求項3記載の方法。
  5. DNAサンプルが血漿に由来する、請求項1記載の方法。
  6. DNAサンプルが血清に由来する、請求項1記載の方法。
  7. DNAサンプルが、セルフリーDNAを含む、請求項1記載の方法。
  8. DNAサンプルが、少なくとも3ピコグラムのDNAを含む、請求項1~7のいずれか一項記載の方法。
  9. 哺乳動物がヒトである、請求項1~8のいずれか一項記載の方法。
  10. プライマーペアが、表1から選ばれる第1のプライマーおよび第2のプライマー、例えばSEQ ID NO:1を含む第1のプライマーおよびSEQ ID NO:10を含む第2のプライマー、またはSEQ ID NO:1と少なくとも80%、85%、90%、95%、96%、97%、98%もしくは99%の同一性を有する第1のプライマーおよびSEQ ID NO:10と少なくとも80%、85%、90%、95%、96%、97%、98%もしくは99%の同一性を有する第2のプライマーを含む、請求項1~9のいずれか一項記載の方法。
  11. 1つまたは複数のさらなるプライマーペアが、工程(a)のDNAサンプル中の1組または複数組のさらなる複数の染色体配列を増幅する、請求項1~10のいずれか一項記載の方法。
  12. アンプリコンが、表1に示される1つまたは複数の反復エレメントを含む、請求項1~11のいずれか一項記載の方法。
  13. アンプリコンが、固有の短鎖散在反復配列(SINE)を含む、請求項12記載の方法。
  14. アンプリコンの平均長さが100塩基対以下である、請求項1~13のいずれか一項記載の方法。
  15. アンプリコンが1つまたは複数の長鎖アンプリコンを含み、該長鎖アンプリコンの平均長さが1000塩基対以上である、請求項1~14のいずれか一項記載の方法。
  16. 長鎖アンプリコンが、夾雑細胞由来のDNAを含む、請求項15記載の方法。
  17. 夾雑細胞が白血球である、請求項16記載の方法。
  18. 複数のアンプリコンが、複数の、例えば2つ以上の異なる染色体上の配列を含む、請求項1~17のいずれか一項記載の方法。
  19. ゲノム区間が、約100個のヌクレオチド~約125,000,000個のヌクレオチドを含む、請求項1~18のいずれか一項記載の方法。
  20. ゲノム区間にマッピングされたアンプリコンを定量する工程が、1つまたは複数の共有アンプリコン特徴を有する複数のゲノム区間を同定することを含む、請求項1~19のいずれか一項記載の方法。
  21. 共有アンプリコン特徴が、マッピングされたアンプリコンの数である、請求項20記載の方法。
  22. 共有アンプリコン特徴が、マッピングされたアンプリコンの平均長さである、請求項20記載の方法。
  23. 共有アンプリコン特徴を有する複数のゲノム区間が、1つまたは複数のクラスターへ群分けされる、請求項20~22のいずれか一項記載の方法。
  24. 各クラスターが、約200個のゲノム区間を含む、請求項23記載の方法。
  25. クラスターが、規定済みクラスターを含む、請求項23記載の方法。
  26. ゲノム区間の比較が、検査サンプル由来の1つまたは複数のゲノム区間を規定済みクラスターとマッチさせることをさらに含む、請求項1~25のいずれか一項記載の方法。
  27. 検査サンプル由来のゲノム区間を規定済みクラスターとマッチさせることが、規定済みクラスターに関する所定の有意性閾値外の共有アンプリコン特徴を有する1つまたは複数のゲノム区間を同定することをさらに含む、請求項26記載の方法。
  28. 異数性の存在が検査される工程が、教師あり機械学習を含む、請求項1~27のいずれか一項記載の方法。
  29. 教師あり機械学習が、サポートベクターマシンモデルを使用する、請求項28記載の方法。
  30. SEQ ID NO:1と少なくとも80%同一である配列を含む第1のプライマーおよびSEQ ID NO:10と少なくとも80%同一である配列を含む第2のプライマーを含む、DNAサンプルからの複数のアンプリコンの増幅のためのプライマーペア。
  31. 第1のプライマーの配列がSEQ ID NO:1と少なくとも90%同一である、請求項30記載のプライマーペア。
  32. 第1のプライマーの配列がSEQ ID NO:1と少なくとも95%同一である、請求項30記載のプライマーペア。
  33. 第1のプライマーの配列が、SEQ ID NO:1と100%同一である配列であるかもしくはSEQ ID NO:1と100%同一である配列を含み、および/または、第2のプライマーの配列が、SEQ ID NO:2と100%同一である配列であるかもしくはSEQ ID NO:2と100%同一である配列を含む、請求項30記載のプライマーペア。
  34. 第2のプライマーの配列がSEQ ID NO:10と少なくとも90%同一である、請求項30~32のいずれか一項記載のプライマーペア。
  35. 第2のプライマーの配列がSEQ ID NO:10と少なくとも95%同一である、請求項30~32のいずれか一項記載のプライマーペア。
  36. 第2のプライマーの配列が、SEQ ID NO:10と100%同一である配列であるか、またはSEQ ID NO:10と100%同一である配列を含む、請求項30~32のいずれか一項記載のプライマーペア。
  37. プライマーペアを含み、該プライマーペアの第1のプライマーがSEQ ID NO:1を含み、該プライマーペアの第2のプライマーがSEQ ID NO:10を含む、DNAサンプルからの複数のアンプリコンの増幅のためのキット。
  38. 増幅する工程で少なくとも10,000個のアンプリコンが形成される、請求項1~29のいずれか一項記載の方法。
  39. 増幅する工程で少なくとも20,000個のアンプリコンが形成される、請求項1~37のいずれか一項記載の方法。
  40. 増幅する工程で少なくとも50,000個のアンプリコンが形成される、請求項1~37のいずれか一項記載の方法。
  41. 増幅する工程で少なくとも100,000個のアンプリコンが形成される、請求項1~37のいずれか一項記載の方法。
  42. 以下の工程を含む、対象における複数のがんの各々の存在またはその発症リスクについて対象を評価する方法:
    (i)1つまたは複数のドライバー遺伝子の各々における1つまたは複数の変異の存在に関する値を取得する工程であって、ドライバー遺伝子の各々は、該複数のがんのうちの1つのがんの存在またはリスクと関連している、工程;
    (ii)複数のタンパク質バイオマーカーの各々のレベルに関する値を取得する工程であって、該複数のタンパク質バイオマーカーの各々のレベルは、該複数のがんのうちの1つのがんの存在またはリスクと関連している、工程;
    (iii)異数性に関する値を取得する工程であって、該異数性の値は、反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数または長さの関数であり、該REファミリーは、
    (a)長鎖散在反復配列(LINE)以外のREファミリー、
    (b)自身の末端反復エレメントに相補的なプライマー部分を用いて増幅されるとX nt未満の平均長さを有するアンプリコンをもたらすREファミリーであって、ここで、Xは100、105もしくは110である、REファミリー、
    (c)約700bp未満の長さであるREファミリー、あるいは
    (d)少なくとも100コピー/ゲノムで存在するREファミリー
    を含み;
    該異数性は、該複数のがんのうちの1つのがんの存在またはリスクと関連しており;
    それにより、該対象を、該複数のがんのいずれかの存在またはその発症リスクについて評価する、
    工程。
  43. (i)、(ii)および(iii)のうちの1つが直接取得される、請求項42記載の方法。
  44. (i)と(ii)が直接取得される、請求項42記載の方法。
  45. (i)と(iii)が直接取得される、請求項42記載の方法。
  46. (i)と(ii)が直接取得される、請求項42記載の方法。
  47. (i)、(ii)および(iii)のすべてが直接取得される、請求項42記載の方法。
  48. (i)、(ii)および(iii)のうちの1つが間接的に取得される、請求項42記載の方法。
  49. (i)と(ii)が間接的に取得される、請求項42記載の方法。
  50. (i)と(iii)が間接的に取得される、請求項42記載の方法。
  51. (i)と(ii)が間接的に取得される、請求項42記載の方法。
  52. (i)、(ii)および(iii)のすべてが間接的に取得される、請求項42記載の方法。
  53. (1)遺伝子バイオマーカーを含む1つもしくは複数のサブゲノム区間もしくはアンプリコンをシーケンシングする工程;
    (2)1つもしくは複数のゲノム配列を異数性について解析する工程、および/または
    (3)タンパク質バイオマーカーを検出試薬と接触させる工程
    を含む、請求項42~52のいずれか一項記載の方法。
  54. 異数性の値が、REファミリーの少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数の関数である、請求項42~53のいずれか一項記載の方法。
  55. 異数性の値が、反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列の長さの関数である、請求項42~54のいずれか一項記載の方法。
  56. (i)サンプル由来のセルフリーDNAのサブゲノム区間の配列を取得する工程;および
    (ii)該サンプル由来の白血球DNAの白血球パラメータを取得する工程
    をさらに含む、請求項42~55のいずれか一項記載の方法。
  57. 白血球パラメータが前記サブゲノム区間の配列を含む、請求項55または56記載の方法。
  58. セルフリーDNAサブゲノム区間またはセルフリーDNA異数性解析サンプルにみられるゲノム事象を評価するために(i)を(ii)と比較する工程をさらに含む、請求項55または56記載の方法。
  59. ゲノム事象が変異を含む、請求項58記載の方法。
  60. (i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出の特異度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う該複数のがんのうちの該1つのがんの検出の特異度と実質的に同じである、請求項42~59のいずれか一項記載の方法。
  61. (i)、(ii)および(iii)を伴う該複数のがんのうちの1つのがんの検出の特異度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う該複数のがんのうちの該1つのがんの検出の特異度より実質的に低くない、請求項42~59のいずれか一項記載の方法。
  62. (i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出感度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う該複数のがんのうちの該1つのがんの検出感度より高い、請求項42~61のいずれか一項記載の方法。
  63. (i)、(ii)および(iii)を伴う複数のがんのうちの1つのがんの検出感度が、(i);(ii);(iii);(i)と(ii);(i)と(iii);または(ii)と(iii)を伴う該複数のがんのうちの該1つのがんの検出感度より約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍高い、請求項62記載の方法。
  64. (i)、(ii)および(iii)により、ある特定の特異度における検出感度の上昇がもたらされる、請求項42~63のいずれか一項記載の方法。
  65. 検出感度の上昇が、特定の特異度における約1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5または10倍の上昇である、請求項64記載の方法。
  66. 特異度が所定の特異度である、請求項64または65記載の方法。
  67. 所定の特異度が少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の特異度である、請求項66記載の方法。
  68. 複数のがんのうちの1つのがんの検出感度の上昇によって該複数のがんのうちの該1つのがんの検出の特異度が影響されない、請求項62~67のいずれか一項記載の方法。
  69. 複数のがんのうちの1つのがんの検出感度の上昇によって該複数のがんのうちの該1つのがんの検出の特異度が低下せず、実質的に低下もしない、請求項62~67のいずれか一項記載の方法。
  70. 複数のがんのうちの1つのがんの検出の特異度がプラトー状態である、請求項68または69記載の方法。
  71. 1つまたは複数の変異の存在に関する値を取得する工程が、1つまたは複数のドライバー遺伝子における1つまたは複数の変異を検出することを含む、請求項42~70のいずれか一項記載の方法。
  72. 1つまたは複数の変異が1つまたは複数のドライバー遺伝子変異を含む、請求項71記載の方法。
  73. 1つまたは複数のドライバー遺伝子が、NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1AまたはGNASから選ばれる、請求項42~72のいずれか一項記載の方法。
  74. 1つまたは複数の変異の存在が、NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1AまたはGNASから選ばれる少なくとも4個のドライバー遺伝子において評価される、請求項42~73のいずれか一項記載の方法。
  75. 1つまたは複数の変異の存在が、以下の16個のドライバー遺伝子:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1AおよびGNASのすべてにおいて評価される、請求項42~74のいずれか一項記載の方法。
  76. 複数のタンパク質バイオマーカーの各々に関する値を取得する工程が、例えばCA19-9、CEA、HGF、OPN、CA125、プロラクチン(PRL)、TIMP-1、CA15-3、AFPまたはMPOから選ばれる該複数のタンパク質バイオマーカーの各々を検出することを含む、請求項42~75のいずれか一項記載の方法。
  77. 複数のタンパク質バイオマーカーが少なくとも4つのタンパク質バイオマーカーを含む、請求項76記載の方法。
  78. 異数性に関する値を取得する工程が、異数性を検出することを含む、請求項42~77のいずれか一項記載の方法。
  79. 複数のがんが少なくとも4つのがんを含む、請求項42~78のいずれか一項記載の方法。
  80. 対象を器官または体内領域の放射線スキャン、例えばPET-CTスキャンに供する工程をさらに含む、請求項42~79のいずれか一項記載の方法。
  81. 器官または体内領域の放射線スキャン法によってがんを特性評価する、請求項80記載の方法。
  82. 器官または体内領域の放射線スキャン法によってがんの場所を特定する、請求項80記載の方法。
  83. 放射線スキャンがPET-CTスキャンである、請求項80~82のいずれか一項記載の方法。
  84. 対象が複数のがんの各々の存在について評価された後に放射線スキャン法が行なわれる、請求項80~83のいずれか一項記載の方法。
  85. 対象に1つまたは複数の治療介入(例えば、手術、術後補助化学療法、術前補助化学療法、放射線療法、免疫療法、標的療法および/または免疫チェックポイント阻害剤)を施す工程を含む、請求項42~84のいずれか一項記載の方法。
  86. 対象ががんに関して無症候性である、請求項42~85のいずれか一項記載の方法。
  87. 対象が複数のがんのうちの1つのがんに関して無症候性である、請求項42~85のいずれか一項記載の方法。
  88. 対象が、がん細胞を有することが不明であり、がん細胞を有すると判定されてもいない、請求項42~85のいずれか一項記載の方法。
  89. 対象が、がんを有すると判定されたことがなく、がんを有すると診断されたこともない、請求項42~85のいずれか一項記載の方法。
  90. 対象が早期、例えばステージIまたはステージIIのがんを有する、請求項42~85のいずれか一項記載の方法。
  91. 以下を含む、キット:
    (a)少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9または少なくとも10種類の検出試薬であって、1種類の検出試薬が、
    (i)本文書において言及される1つもしくは複数の遺伝子バイオマーカー;
    (ii)本文書において言及される1つもしくは複数のタンパク質バイオマーカー;および/または
    (iii)本文書において言及される反復エレメントファミリー(REファミリー)の少なくとも2つの末端反復エレメント間に配されているゲノム配列のコピー数もしくは長さ
    のレベルまたは存在に関する値である読み出し情報を媒介する、
    検出試薬;ならびに
    (b)該キットを使用するための使用説明書。
  92. 検出試薬が、ゲノム配列における異数性のレベルまたは存在に関する値である読み出し情報を媒介する、請求項91記載のキット。
  93. 以下の工程を含む、哺乳動物をがんの存在について検査する方法:
    (a)複数のアンプリコンを形成させるために、DNAサンプル中の複数の染色体配列を、該染色体配列に相補的なプライマーペアを用いて増幅する工程;
    (b)該複数のアンプリコンのうちの1つまたは複数の核酸配列の少なくとも一部分を決定する工程;
    (c)シーケンシングされたアンプリコンを参照ゲノムにマッピングする工程;
    (d)該DNAサンプルを複数のゲノム区間に分割する工程;
    (e)該ゲノム区間にマッピングされた該アンプリコンに関する複数の特徴を定量する工程;
    (f)第1のゲノム区間内のアンプリコンの該複数の特徴を、1つまたは複数の異なるゲノム区間内のアンプリコンの該複数の特徴と比較する工程;および
    (g)第1のゲノム区間内のアンプリコンの該複数の特徴が1つまたは複数の異なるゲノム区間内のアンプリコンの該複数の特徴と異なる場合、該哺乳動物にがんが存在すると判定する工程。
  94. 増幅する工程で少なくとも100,000個のアンプリコンが形成される、請求項93記載の方法。
  95. がんがステージIのがんである、請求項93または94記載の方法。
  96. がんが肝臓がん、卵巣がん、食道がん、胃がん、膵がん、結腸直腸がん、肺がん、乳がんまたは前立腺がんである、請求項93~95のいずれか一項記載の方法。
  97. 第1のゲノム区間内のアンプリコンの複数の特徴が1つまたは複数の異なるゲノム区間内のアンプリコンの該複数の特徴と異なる場合、異数性が存在すると判定する工程をさらに含む、請求項93~96のいずれか一項記載の方法。
  98. 低インプットのDNAを含むサンプルにおいて、本文書に開示のいずれかの方法を用いて異数性を検出する方法。
  99. サンプルが、約0.01ピコグラム(pg)~500 pgのDNAを含む、請求項98記載の方法。
  100. サンプルが、対象由来の生体試料である、請求項98または99記載の方法。
  101. サンプルが、液状試料、血液試料、セルフリーDNAサンプル(例えば、循環腫瘍DNAサンプル)、血漿試料、血清試料;または組織試料を含む、請求項98~100のいずれか一項記載の方法。
  102. サンプル、例えば生体試料が、細胞(例えば、正常細胞またはがん細胞)およびセルフリーDNAを含む、請求項98~100のいずれか一項記載の方法。
  103. 本文書に開示のいずれかの方法を用いてサンプルを同定または区別する方法。
  104. 対象、例えば第1の対象由来のサンプル、例えば第1のサンプルが、第2の対象由来の第2のサンプルと区別される、請求項103記載の方法。
  105. サンプルが、多型(例えば、複数の多型、例えば一般的多型)に基づいて対象由来であると同定される、請求項103記載の方法。
  106. 多型、例えば一般的多型が、例えば本文書に記載のような反復エレメント内に存在する、請求項105記載の方法。
  107. インビトロ法である、請求項1~90または93~106のいずれか一項記載の方法。
JP2021568507A 2019-05-17 2020-05-15 異数性の迅速検出法 Pending JP2022532761A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962849662P 2019-05-17 2019-05-17
US62/849,662 2019-05-17
US201962905327P 2019-09-24 2019-09-24
US62/905,327 2019-09-24
US202062971050P 2020-02-06 2020-02-06
US62/971,050 2020-02-06
PCT/US2020/033209 WO2020236625A2 (en) 2019-05-17 2020-05-15 Rapid aneuploidy detection

Publications (2)

Publication Number Publication Date
JP2022532761A true JP2022532761A (ja) 2022-07-19
JPWO2020236625A5 JPWO2020236625A5 (ja) 2023-05-17

Family

ID=71741878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021568507A Pending JP2022532761A (ja) 2019-05-17 2020-05-15 異数性の迅速検出法

Country Status (14)

Country Link
US (1) US20220259668A1 (ja)
EP (1) EP3969616A2 (ja)
JP (1) JP2022532761A (ja)
KR (1) KR20220021909A (ja)
CN (1) CN114207147A (ja)
AU (1) AU2020279106A1 (ja)
BR (1) BR112021023025A2 (ja)
CA (1) CA3140850A1 (ja)
CL (1) CL2021003030A1 (ja)
CO (1) CO2021017009A2 (ja)
IL (1) IL288081A (ja)
MX (1) MX2021013834A (ja)
SG (1) SG11202112680XA (ja)
WO (1) WO2020236625A2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020279106A1 (en) * 2019-05-17 2021-12-09 The Johns Hopkins University Rapid aneuploidy detection
WO2023239866A1 (en) * 2022-06-10 2023-12-14 The Johns Hopkins University Methods for identifying cns cancer in a subject
CN114990202B (zh) * 2022-07-29 2022-09-30 普瑞基准科技(北京)有限公司 Snp位点在评估基因组异常的应用及评估基因组异常的方法
WO2024155909A1 (en) * 2023-01-19 2024-07-25 The Johns Hopkins University Methods for identifying ovarian cancer in a subject
KR102630597B1 (ko) * 2023-08-22 2024-01-29 주식회사 지놈인사이트테크놀로지 종양 정보를 활용한 미세 잔존 질환 탐지 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006214800B2 (en) * 2005-02-16 2012-06-07 Cy O'connor Erade Village Foundation Methods of genetic analysis involving the amplification of complementary duplicons
EP1712639B1 (en) 2005-04-06 2008-08-27 Maurice Stroun Method for the diagnosis of cancer by detecting circulating DNA and RNA
JP2008173083A (ja) * 2007-01-22 2008-07-31 Nippon Software Management Kk Dnaタグによる生物の同定方法
ES2945311T3 (es) * 2012-03-26 2023-06-30 Univ Johns Hopkins Detección rápida de aneuploidía
JP6474058B2 (ja) * 2012-09-13 2019-02-27 御木本製薬株式会社 エンドセリン−1産生抑制剤
WO2016054255A1 (en) * 2014-10-01 2016-04-07 Chronix Biomedical Methods of quantifying cell-free dna
US20160210404A1 (en) * 2015-01-15 2016-07-21 Good Start Genetics, Inc. Methods of quality control using single-nucleotide polymorphisms in pre-implantation genetic screening
US20160275240A1 (en) * 2015-02-18 2016-09-22 Nugen Technologies, Inc. Methods and compositions for pooling amplification primers
CA3072195A1 (en) 2017-08-07 2019-04-04 The Johns Hopkins University Methods and materials for assessing and treating cancer
AU2020279106A1 (en) * 2019-05-17 2021-12-09 The Johns Hopkins University Rapid aneuploidy detection

Also Published As

Publication number Publication date
WO2020236625A3 (en) 2021-02-11
SG11202112680XA (en) 2021-12-30
CA3140850A1 (en) 2020-11-26
KR20220021909A (ko) 2022-02-22
CO2021017009A2 (es) 2022-04-08
MX2021013834A (es) 2022-06-29
AU2020279106A1 (en) 2021-12-09
BR112021023025A2 (pt) 2022-01-04
CN114207147A (zh) 2022-03-18
CL2021003030A1 (es) 2022-10-07
EP3969616A2 (en) 2022-03-23
IL288081A (en) 2022-01-01
US20220259668A1 (en) 2022-08-18
WO2020236625A2 (en) 2020-11-26

Similar Documents

Publication Publication Date Title
JP7232476B2 (ja) がんを評価及び治療するための方法及び物質
JP6683752B2 (ja) 血漿による胎児または腫瘍のメチロームの非侵襲的決定
US11984195B2 (en) Methylation pattern analysis of tissues in a DNA mixture
JP6700333B2 (ja) ヘテロ接合性の消失(loss of heterozygosity)を評価するための方法および材料
JP2022532761A (ja) 異数性の迅速検出法
JP2022519159A (ja) 循環細胞の分析方法
EP3322816B1 (en) System and methodology for the analysis of genomic data obtained from a subject
ES2911613T3 (es) Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN
WO2019047577A1 (zh) 一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质
CN106414768B (zh) 与癌症相关的基因融合体和基因变异体
Xing et al. Lineage-specific alterations in gynecologic neoplasms with choriocarcinomatous differentiation: implications for origin and therapeutics
AU2021401813A1 (en) Methods of cancer detection using extraembryonically methylated cpg islands
US20230348999A1 (en) Stratification and prognosis of cancer
CA2889937C (en) Papanicolaou test for ovarian and endometrial cancers
WO2023226939A1 (zh) 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用
WO2022178108A1 (en) Cell-free dna methylation test
Paracchini Analysis of Defects in Transcriptional Regulation Mechanisms in High-Grade Serous Ovarian Cancer and Their Correlation with Clinic-Pathological Features
김대윤 Analysis of the relationship between hidden inherited germline factor and cancer risk
Nagy Biomedical Papers
WO2024081769A2 (en) Methods and systems for detection of cancer based on dna methylation of specific cpg sites
WO2020023893A1 (en) Reducing noise in sequencing data
Cho Sparsity and scarcity: Multiomic studies in a low resource setting (A study in archival FFPE cancer tissue)

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230509

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240808