JP2023506560A - 無細胞dna断片化およびヌクレアーゼ - Google Patents

無細胞dna断片化およびヌクレアーゼ Download PDF

Info

Publication number
JP2023506560A
JP2023506560A JP2022537721A JP2022537721A JP2023506560A JP 2023506560 A JP2023506560 A JP 2023506560A JP 2022537721 A JP2022537721 A JP 2022537721A JP 2022537721 A JP2022537721 A JP 2022537721A JP 2023506560 A JP2023506560 A JP 2023506560A
Authority
JP
Japan
Prior art keywords
amount
cell
terminal
free dna
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022537721A
Other languages
English (en)
Inventor
ユク-ミン デニス ロー
ロッサ ワイ クン チウ
ダイアナ シャオ チョン ハン
モン ニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of JP2023506560A publication Critical patent/JP2023506560A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/113Time

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

ヌクレアーゼに関連する遺伝子における遺伝性障害を検出するため、抗凝固剤の投与量の有効性を決定するため、およびヌクレアーゼの活性を監視するための、様々な方法、装置、およびシステムが提供される。測定されたパラメータ値を参照値と比較して、遺伝性障害、効率、または活性の分類を決定することができる。断片末端での(例えば、末端モチーフにおける)特定の塩基の量、特定のサイズの断片末端での特定の塩基の量、または無細胞DNA断片の総量(例えば、濃度として)が使用され得る。特定の試料は、抗凝固剤で処理され得、異なるインキュベーション時間が特定の方法に使用され得る。

Description

関連出願の相互参照
本出願は、2019年12月18日に出願された「Cell-Free DNA Fragmentation And Nucleases」と題する米国仮特許出願第62/949,867号、および2020年1月8日に出願された「Cell-Free DNA Fragmentation And Nucleases」と題する米国仮特許出願第62/958,651号の利益を主張し、これらは、参照によりその全体があらゆる目的で本明細書に組み込まれる。
無細胞DNA(cfDNA)は、妊娠およびがんなどの多くの生理学的および病理学的状態の診断および予後予測に適用され得る豊富な情報源である(Chan,K.C.A.et al.(2017),New England Journal of Medicine 377,513-522、Chiu,R.W.K.et al.(2008),Proceedings of the National Academy of Sciences of the United States of America 105,20458-20463、Lo,Y.M.D.et al.,(1997),The Lancet 350,485-487)。循環cfDNAは現在、非侵襲的バイオマーカーとして一般的に使用されており、短い断片の形態で循環することが知られているが、cfDNAの断片化および分子プロファイルを支配する生理学的要因は、依然として理解しにくいままである。
近年の研究は、cfDNAの断片化が、ヌクレオソームの位置決定に関連する非ランダムプロセスであることを示唆している(Chandrananda,D.et al.,(2015),BMC Medical Genomics 8,29、Ivanov,M.et al.,(2015),BMC genomics 16,S1、Lo,Y.M.D.et al.(2010),Science Translational Medicine 2,61ra91-61ra91、Snyder,M.W.et al.,(2016),Cell 164,57-68、Sun,K.et al.,(2019),Genome Research 29,418-427))。以前に、我々は、DNASE1L3ヌクレアーゼが血漿中のcfDNAのサイズプロファイルに寄与することを実証している(Serpas,L.et al.(2019),Proceedings of the National Academy of Sciences 116,641-649)。
様々な実施形態は、ヌクレアーゼに関連する遺伝子における遺伝性障害を検出するため、抗凝固剤の投与量の有効性を決定するため、およびヌクレアーゼの活性を監視するための、無細胞DNA(cfDNA)の定量的断片化情報を使用する。測定されたパラメータ値を参照値と比較して、遺伝性障害、効率、または活性の分類を決定することができる。断片末端での(例えば、末端モチーフにおける)特定の塩基の量、特定のサイズの断片末端での特定の塩基の量、または無細胞DNA断片の総量(例えば、濃度として)が使用され得る。特定の試料は、抗凝固剤で処理され得、異なるインキュベーション時間がいくつかの実施形態において使用され得る。
例えば、参照値と比較した断片末端での特定の塩基の量を使用して、抗凝固剤で処理された試料中の特定のサイズの断片末端での特定の塩基の量を使用して、および異なる時間にわたって抗凝固剤とインキュベートされた試料についての断片末端での特定の塩基の量を比較して、遺伝子についての遺伝性障害を検出するための、いくつかの実施形態が提供される。
例えば、抗凝固剤を投与された対象の試料中の断片末端での特定の塩基の量を使用して、および抗凝固剤を投与された対象の試料中の特定のサイズの断片末端での特定の塩基の量を使用して、抗凝固剤の投与量の有効性を決定するための、いくつかの実施形態が提供される。
例えば、参照値と比較して試料中の断片末端での特定の塩基の量を使用して、および試料中の特定のサイズの断片末端での特定の塩基の量を使用して、ヌクレアーゼの活性を監視するための、いくつかの実施形態が提供される。
本開示のこれらの実施形態および他の実施形態を、以下で詳細に説明する。例えば、他の実施形態は、本明細書に記載の方法に関連付けられたシステム、デバイス、およびコンピュータ可読媒体を対象とする。
本開示の実施形態の性質および利点のより良好な理解は、以下の詳細な説明および添付の図面を参照して得ることができる。
本開示の実施形態による、DNA断片の末端に単一の塩基を含む末端モチーフの例を示す。 本開示の実施形態による、異なる領域内の参照ゲノム含有量と比較した、WT cfDNA断片の5’末端の塩基含有量を示す。 本開示の実施形態による、TSSおよびPol II領域内の塩基含有量の割合を示す。TSS(3A)およびPol II(3C)領域内の参照ゲノム含有量は、WT EDTA 0時間試料(3Bおよび3D)におけるcfDNAの5’末端塩基含有量と比較される。 本開示の実施形態による、断片サイズの範囲にわたるWT cfDNAの5’末端の塩基含有量を示す。 本開示の実施形態による、新鮮なcfDNAが濃縮されたEDTA 6時間試料の集合体を示す。 本開示の実施形態による、WTマウスにおけるEDTA 0時間試料対6時間試料についてのサイズプロファイルを示す。 本開示の実施形態による、ランダム、CTCF、TSS、およびPol II領域についての、マウスにおける新鮮なcfDNAが濃縮されたEDTA 6時間試料の塩基含有率を示す。 図8Aは、本開示の実施形態による、短い断片、中間の断片、および長い断片の間での、WTマウスにおけるベースラインcfDNA(EDTA 0時間)と新鮮なcfDNAが濃縮された試料(EDTA 6時間)との間で比較した、A<>A断片の割合を示す。図8B)は、短い断片、中間の断片、および長い断片の間での、EDTA 0時間とEDTA 6時間との間で比較した、WTマウスにおけるG<>G断片の割合についてのサイズプロファイルを示し、図9A~9Bは、C<>C、T<>T断片の割合についてのサイズプロファイルを示す。P値は、マン・ホイットニーのU検定によって計算される。 図8Aは、本開示の実施形態による、短い断片、中間の断片、および長い断片の間での、WTマウスにおけるベースラインcfDNA(EDTA 0時間)と新鮮なcfDNAが濃縮された試料(EDTA 6時間)との間で比較した、A<>A断片の割合を示す。図8B)は、短い断片、中間の断片、および長い断片の間での、EDTA 0時間とEDTA 6時間との間で比較した、WTマウスにおけるG<>G断片の割合についてのサイズプロファイルを示し、図9A~9Bは、C<>C、T<>T断片の割合についてのサイズプロファイルを示す。P値は、マン・ホイットニーのU検定によって計算される。 本開示の実施形態による、WTおよびDffb欠損マウスにおける新鮮なcfDNAが濃縮されたEDTA 0時間試料対EDTA 6時間試料の塩基含有率を示す。 図11Aは、本開示の実施形態による、Dffb欠損マウスにおけるEDTA 0時間試料対6時間試料のcfDNAの濃度を示す。図11Bは、本開示の実施形態による、Dffb欠損マウスにおけるEDTA 0時間試料対6時間試料のサイズプロファイルを示す。図11Cは、本開示の実施形態による、短い断片、中間の断片、および長い断片の間での、EDTA 0時間とEDTA 6時間との間で比較したDffb欠損マウスにおけるA<>Aの割合を示す。 本開示の実施形態による、ランダム領域およびCTCF領域についてのEDTA 0時間試料および6時間試料におけるDffb欠損マウスの塩基含有量の割合を示す。 本開示の実施形態による、TSS領域およびPol II領域についてのEDTA 0時間試料および6時間試料におけるDffb欠損マウスの塩基含有量の割合を示す。 図14Aは、本開示の実施形態による、A<>A断片の構築を示す。図14Bは、本開示の実施形態による、WT試料と比較したDnase1l3欠損試料の末端塩基含有量を示す。 本開示の実施形態による、断片サイズ当たりのWT試料と比較したDnase1l3欠損試料の末端塩基含有量を示す。 図16Aは、本開示の実施形態による、WT EDTA 0時間cfDNAのベースライン表現(灰色)と比較した、Dnase1l3欠損EDTA 0時間cfDNAにおけるA<>A、A<>G、およびA<>C断片のパーセンテージを示す。図16Bは、本開示の実施形態による、WT EDTA 0時間cfDNAのベースライン表現(灰色)と比較した、新鮮なcfDNAが濃縮されたWT EDTA 6時間試料におけるA<>A、A<>G、およびA<>C断片のパーセンテージを示す。 本開示の実施形態による、普通および対数スケールでの、ヘパリン中でのインキュベーションを伴うWT、Dnase1+/-、およびDnase1-/-マウスのcfDNAのサイズプロファイルを示す。 本開示の実施形態による、ヘパリン中でのインキュベーションを伴うWTおよびDnase1-/-マウスのcfDNAのサイズプロファイルおよび塩基含有量を示す。 本開示の実施形態による、ヘパリン中でのインキュベーションを伴うDnase1+/-マウスのcfDNAのサイズプロファイルおよび塩基含有量を示す。 本開示の実施形態による、ヘパリン中の0時間試料および6時間試料を有するWT、Dnase1+/-、およびDnase1-/-マウスについてのcfDNA量を示す。 図21Aは、本開示の実施形態による、EDTA 0時間WT試料中のA末端、G末端、C末端、およびT末端断片のcfDNAサイズプロファイルを示す。図21Bは、本開示の実施形態による、ヘパリン6時間WT試料中のA末端、G末端、C末端、およびT末端断片のcfDNAサイズプロファイルを示す。 本開示の実施形態による、Dffb-/-、Dnase1l3-/-、Dnase1+/-、およびDnase1-/-マウスのEDTA 0時間試料におけるA末端、G末端、C末端、およびT末端断片のcfDNAサイズプロファイルを示す。 図23Aは、本発明の実施形態による、ベースライン試料(EDTA 0時間および6時間、ヘパリン0時間)(灰色)と比較した、ヘパリン6時間試料(赤色)のCTCF領域内の断片末端密度を示す。図23B~23Cは、本開示の実施形態による、WT(D)のヘパリン0時間試料および6時間試料のCTCF領域内の5’末端塩基表現を示す。 本開示の実施形態による、Dnase1-/-マウスのヘパリン0時間試料および6時間試料のCTCF領域内の5’末端塩基表現を示す。 本開示の実施形態による、T末端断片ピークが、ヘパリン6時間において増加した末端密度を有するヌクレオソーム内領域に対応することを示すために重ね合わされた図23Aおよび23Cを示す。 本開示の実施形態による、ヌクレアーゼDFFB、DNASE1、およびDNASE1L3について示される切断選択を有するcfDNA生成および消化のモデルを示す。 本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法を例示するフローチャートを示す。 本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法を例示するフローチャートを示す。 本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法を例示するフローチャートを示す。 本開示の実施形態による、血液障害を有する対象の治療の有効性を決定するための方法を例示するフローチャートを示す。 本開示の実施形態による、血液障害を有する対象の治療の有効性を決定するための方法1300を例示するフローチャートを示す。 図32Aは、本開示の実施形態による、ヘパリンで治療された4つの症例についてのデータを示す。図32B~32Cは、本開示の実施形態による、ヘパリンで治療された深部静脈血栓症(DVT)を有する患者の2つの試料についてのデータを示す。 本開示の実施形態による、異なる投与量のDNASE1についての異なる末端の含有率対断片のサイズのプロットを示す。図33はまた、本開示の実施形態による、すべての断片のサイズについての頻度プロットを示す。 図34Aは、本開示の実施形態による、未処理およびEDTA処理(0時間および6時間)と比較した、DNASE1で処理された血清についてのサイズプロファイルを示す。図34Bは、血漿中のサイズプロファイルを示す。 本開示の実施形態による、6時間後の血清に対する異なる用量のDNASE1の効果を示す。 本開示の実施形態による、尿試料中の頻度対サイズおよび塩基含有量対サイズを示す。 異なる組織についてのDNASE1発現を示す。 本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼの活性を監視するための方法を例示するフローチャートである。 本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼの活性を監視するための方法を例示するフローチャートである。 本開示の実施形態による、各条件について取得された非重複断片の数を要約する。 図41Aは、両方のコピーについてのDnase1遺伝子における欠失を示す(Dnase1-/-)。図41Bは、両方のコピーにおけるDffb遺伝子についての欠失を示す。 本発明の実施形態による、測定システムを例示する。 本発明の実施形態による、システムおよび方法とともに使用可能な例示的なコンピュータシステムのブロック図を示す。
用語
「組織」は、機能単位としてともにグループ化する細胞のグループに対応する。2つ以上のタイプの細胞が、単一の組織内に見出され得る。種々のタイプの組織は、種々のタイプの細胞(例えば、肝細胞、肺胞細胞、または血球細胞)からなり得るが、種々の生物(母体対胎児)由来の組織または健常細胞対腫瘍細胞にも対応し得る。「参照組織」は、組織特異的メチル化レベルを決定するために使用される組織に対応し得る。種々の個体由来の同じ組織タイプの複数の試料を使用して、その組織タイプの組織特異的メチル化レベルを決定することができる。
「生物学的試料」は、対象(例えば、妊婦、がんもしくは他の疾患を有する人、またはがんもしくは他の疾患を有する疑いがある人などのヒト(または他の動物)、臓器移植レシピエント、または臓器が関与する疾患プロセス(例えば、心筋梗塞における心臓、脳卒中における脳、もしくは貧血における造血系)を有する疑いがある対象)から採取され、目的の1つ以上の核酸分子を含有する任意の試料を指す。生物学的試料は、血液、血漿、血清、尿、膣液、水腫(例えば、精巣の)からの液体、膣洗浄液体、胸膜液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳首からの排出液、体の種々の部分(例えば、甲状腺、乳腺)からの吸引液、眼内液(例えば、房水)などの体液であり得る。便試料もまた、使用され得る。様々な実施形態において、無細胞DNAのために濃縮された生物学的試料(例えば、遠心分離プロトコルを介して取得された血漿試料)におけるDNAの大部分は、無細胞であり得、例えば、DNAの50%超、60%超、70%超、80%超、90%超、95%超、または99%超は、無細胞であり得る。遠心分離プロトコルは、例えば、3,000g×10分で流体部分を取得することと、残留細胞を除去するために30,000gでさらに10分間再遠心分離することと、を含み得る。生物学的試料の分析の一部として、統計的に有意な数の無細胞DNA分子が、生物学的試料について分析され得る(例えば、正確な測定値を提供するために)。いくつかの実施形態において、少なくとも1,000個の無細胞DNA分子が分析される。他の実施形態において、少なくとも10,000個または50,000個または100,000個または500,000個または1,000,000個または5,000,000個、またはそれより多い無細胞DNA分子が分析され得る。少なくとも同数の配列リードが分析され得る。
「配列リード」は、核酸分子の任意の部分または全部から配列決定されるヌクレオチドの鎖を指す。例えば、配列リードは、核酸断片から配列決定された短鎖ヌクレオチド(例えば、約20~150ヌクレオチド)、核酸断片の片端もしくは両端の短鎖ヌクレオチド、または生物学的試料中に存在する核酸断片全体の配列決定であり得る。配列リードは、例えば、配列決定技術を使用した、またはプローブを使用した種々の方法で、例えば、ハイブリダイゼーションアレイもしくはマイクロアレイで使用され得るような捕捉プローブで、または単一プライマーもしくは等温増幅を使用した、ポリメラーゼ連鎖反応(PCR)もしくは線形増幅などの増幅技術で、取得することができる。生物学的試料の分析の一部として、少なくとも1,000個の配列リードが分析され得る。他の例として、少なくとも10,000個または50,000個または100,000個または500,000個または1,000,000個または5,000,000個、またはそれより多い配列リードが分析され得る。
配列リードは、断片の末端に関連する「末端配列」を含み得る。末端配列は、断片の最も外側のN塩基、例えば断片の末端の1~30塩基に対応し得る。配列リードが断片全体に対応する場合、配列リードは2つの末端配列を含み得る。対の末端配列決定が断片の末端に対応する2つの配列リードを提供する場合、各配列リードは1つの末端配列を含み得る。
「配列モチーフ」は、DNA断片(例えば、無細胞DNA断片)における塩基の短い繰り返しパターンを指し得る。配列モチーフは、断片の末端に生じ得、したがって、末端配列の一部であるか、またはそれを含み得る。「末端モチーフ」は、潜在的に特定のタイプの組織について、DNA断片の末端で優先的に生じる末端配列についての配列モチーフを指し得る。末端モチーフはまた、断片の末端の直前または直後に生じ得、それにより、依然として末端配列に対応する。ヌクレアーゼは、特定の末端モチーフに対する特定の切断選択、ならびに第2の末端モチーフに対する2番目に好ましい切断選択を有し得る。
「対立遺伝子」という用語は、同じ物理的ゲノム遺伝子座にある代替DNA配列を指し、異なる表現型の特徴をもたらす場合ともたらさない場合がある。各染色体のコピーが2つある任意の特定の二倍体生物(男性の対象の性染色体を除く)では、各遺伝子の遺伝子型は、ホモ接合体においては同じであり、ヘテロ接合体においては異なる、その遺伝子座に存在する対立遺伝子の対を含む。生物の集団または種は、典型的には、様々な個体の各遺伝子座に複数の対立遺伝子を含む。集団内に2つ以上の対立遺伝子が見られるゲノム遺伝子座は、多型部位と呼ばれる。遺伝子座での対立遺伝子多様性は、存在する対立遺伝子の数(すなわち、多型の程度)、または集団内のヘテロ接合体の割合(すなわち、ヘテロ接合性率)として測定可能である。本明細書で使用される「多型」という用語は、その頻度に関係なく、ヒトゲノムにおける任意の個体間の多様性を指す。そのような多様性の例は、一塩基多型、単純なタンデムリピート多型、挿入-欠失多型、変異(疾患を引き起こし得る)、およびコピー数の多様性を含むが、これらに限定されない。本明細書で使用される「ハプロタイプ」という用語は、同じ染色体または染色体領域上で一緒に伝達される複数の遺伝子座での対立遺伝子の組み合わせを指す。ハプロタイプは、わずか1対の遺伝子座、または染色体領域、または染色体全体または染色体腕を指し得る。
「相対頻度」(単に「頻度」とも称される)は、割合(例えば、パーセンテージ、画分、または濃度)を指し得る。特に、特定の末端モチーフ(例えば、CCGAまたは単一塩基のみ)の相対頻度は、例えば、CCGAの末端配列を有することによって、末端モチーフCCGAに関連する試料中の無細胞DNA断片の割合を提供し得る。
「集計値」は、例えば、末端モチーフのセットの相対的頻度の集合的特性を指し得る。例には、平均、中央値、相対頻度の合計、相対頻度間の変動(例えば、エントロピー、標準偏差(SD)、変動係数(CV)、四分位範囲(IQR)、または種々の相対頻度中の特定のパーセンタイルカットオフ(例えば95または99パーセンタイル))、またはクラスタリングで実装し得る相対頻度の参照パターンからの差(例えば、距離)を含む。
「較正試料」は、所望の測定値(例えば、ヌクレアーゼ活性、遺伝性障害の分類、または他の所望の特性)が既知であるか、または較正方法を介して、例えば、有効投与量の測定のための凝固測定、またはヌクレアーゼ量を測定するためのELISA、またはヌクレアーゼ活性を測定するためのヌクレアーゼによるDNA消化の速度を定量化するアッセイなどの他の測定技術を使用して決定される、生物学的試料に対応することができる。例示的な測定は、cfDNA量の蛍光測定または分光光度測定を含み得、これは、それ自体で、またはヌクレアーゼ含有試料の添加の前、後、および/またはそれとリアルタイムで行われ得る。別の例は、放射状酵素拡散法を使用することである。較正試料は、別々の測定値(例えば、特定の末端モチーフを有するか、または特定のサイズを有する断片の量)を有することができ、所望の測定値がどれに相関し得るかが決定され得る。
「較正データ点」は、「較正値」(例えば、特定の末端モチーフを有するか、または特定のサイズを有する断片の量)、および他の試験試料について決定されることが望まれる測定値もしくは既知の値を含む。較正値は、試料のDNA分子から測定された様々なタイプのデータから決定され得る(例えば、末端モチーフを有するか、または特定のサイズを有する断片の量)。較正値は、所望の特性、例えば、遺伝性障害の分類、ヌクレアーゼ活性、または抗凝固剤投与の有効性に相関するパラメータに対応する。例えば、較正値は、所望の特性が既知である較正試料に対して決定された測定値から決定され得る。較正データ点は、様々な方法で、例えば、離散点として、または較正関数(検量線または較正面とも呼ばれる)として定義され得る。較正関数は、較正データ点の追加の数学的変換から導出され得る。
「部位」(「ゲノム部位」とも呼ばれる)は、単一の塩基位置、または相関する塩基位置の群、例えば、CpG部位、TSS部位、Dnase過敏性部位、または相関する塩基位置のより大きい群であり得る、単一の部位に対応する。「遺伝子座」は、複数の部位を含む領域に対応し得る。遺伝子座は、遺伝子座をその文脈における部位と等価にするであろうただ1つの部位を含み得る。
「cfDNAプロファイル」は、試料中のcfDNA断片(単にDNA断片とも称される)の末端配列(例えば、1~30塩基)の関係を指し得る。例えば、特定の末端配列(末端モチーフ)を有するcfDNA断片の量、1つ以上の他の末端配列と比較した特定の末端配列を有するcfDNA断片の相対頻度、ならびにサイズなどの他のパラメータを含む、様々な関係が提供され得る。cfDNAプロファイルは、様々なサイズのcfDNA断片について提供され得る。そのようなcfDNAプロファイル(cfDNAサイズプロファイルと称されることもある)は、所与のサイズ(単一の長さまたはサイズ範囲)について1つ以上の特定の末端配列を有するcfDNA断片の量を示す様々な方法で提供され得る。
「分離値」は、2つの値を包含する差または比、例えば、2つの画分寄与または2つのメチル化レベルに相当する。分離値は、単純な差または比であり得る。例として、x/yの直接比は、x/(x+y)と同様に分離値である。分離値は、他の因子、例えば、乗法的因子を含み得る。他の例として、値の関数の差または比、例えば、2つの値の自然対数(ln)の差または比が使用され得る。分離値には、差および比を含み得る。
「分離値」および「集計値」(例えば、相対頻度)は、異なる分類(状態)間で変化する試料の測定値を提供するパラメータ(メトリックとも呼ばれる)の2つの例であり、したがって様々な分類を決定するために使用され得る。集計値は、例えば、クラスタリングで行われるように、試料の相対頻度のセットと相対頻度の参照セット間で差が取られる場合の分離値であり得る。
本明細書で使用される「分類」という用語は、試料の特定の特性と関係した任意の数または他の特徴を指す。例えば、「+」という記号(または「陽性」という語)は、試料が欠失または増幅を有するものとして分類されることを意味し得る。分類は、二者択一(例えば、陽性もしくは陰性)であり得、またはより多くのレベルの分類(例えば、1~10もしくは0~1のスケール)を有し得る。
「カットオフ」および「閾値」という用語は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、それを超えると断片が除外されるサイズを指し得る。閾値は、特定の分類が適用されるのを上回るまたは下回る値であり得る。これらの用語のいずれかは、これらの文脈のいずれかにおいて使用され得る。カットオフまたは閾値は、「参照値」であり得るか、または特定の分類を表すか、もしくは2つ以上の分類間を区別する参照値から導出され得る。そのような参照値は、当業者によって理解されるように、様々な方法で決定され得る。例えば、メトリックは、異なる既知の分類を有する対象の2つの異なるコホートについて決定され得、参照値は、1つの分類(例えば、平均)の代表として、またはメトリックの2つのクラスター間の値(例えば、所望の感度および特異度を取得するために選択された)として選択され得る。別の例として、参照値は、試料の統計シミュレーションに基づいて決定され得る。カットオフ、閾値、参照などの特定の値は、所望の精度(例えば、感度および特異度)に基づいて決定され得る。
「病理のレベル」(または障害のレベル)とは、生物に関連する病理の量、低度、または重症度を指し得る。一例は、ヌクレアーゼの発現における細胞障害である。病理の別の例は、移植された臓器の拒絶反応である。他の病理の例には、自己免疫発作(例えば、腎臓を損傷するループス腎炎または多発性硬化症)、炎症性疾患(例えば、肝炎)、線維化プロセス(例えば、肝硬変)、脂肪浸潤(例えば、脂肪肝疾患)、変性プロセス(例えば、アルツハイマー病)、および虚血性組織損傷(例えば、心筋梗塞または脳卒中)を含み得る。対象の健康な状態は、病理のない分類とみなし得る。病理は、がんであり得る。
「がんのレベル」という用語は、がんが存在するかどうか(すなわち、存在または不在)、がんのステージ、腫瘍のサイズ、転移があるかどうか、体の総腫瘍負荷、治療に対するがんの応答、および/またはがんの重症度の他の尺度(例えば、がんの再発)を指し得る。がんのレベルは、数字、または、記号、アルファベット文字、および色などの他のしるしであり得る。レベルは、ゼロであり得る。がんのレベルは、前悪性病態または前がん性病態(状態)も含み得る。がんのレベルは、様々な方法で使用され得る。例えば、スクリーニングは、がんを有することを今まで知らなかった人物においてがんが存在するかどうかをチェックし得る。評価は、がんと診断されている人物を調べて、がんの進行を経時的に監視し、療法の有効性を研究し、または予後を決定し得る。一実施形態では、予後は、患者ががんで死亡する可能性、または特定の持続時間または特定の時間の後、がんが進行する可能性、またはがんが転移する可能性もしくは程度として表すことができる。検出は、「スクリーニング」を意味することができ、またはがんの示唆的な特徴(例えば、症状または他の陽性検査)を有する人物ががんを有するかどうかをチェックすることを意味し得る。
「約」または「およそ」という用語は、当業者によって決定される特定の値の許容誤差範囲内を意味し得、これは値の測定または決定方法、すなわち測定システムの制限について部分的に依存する。例えば、「約」は、当技術分野の慣例により、1以内または1を超える標準偏差を意味し得る。あるいは、「約」は、所与の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、「約」または「およそ」という用語は、値の1桁以内、5倍以内、より好ましくは2倍以内を意味し得る。本出願および特許請求の範囲に特定の値が記載されている場合、特に明記しない限り、特定の値の許容誤差範囲内の「約」という用語を想定すべきである。「約」という用語は、当業者によって一般に理解されている意味を有し得る。「約」という用語は、±10%を指し得る。「約」という用語は、±5%を指し得る。
無細胞DNA(cfDNA)は、がんおよび出生前検査のための強力な非侵襲的バイオマーカーであり、血漿(および他の無細胞試料)中を短い断片として循環する。本開示において、cfDNA断片化におけるDNASE1、DNASE1L3、およびDNA断片化因子サブユニットベータ(DFFB、カスパーゼ活性化DNaseとしても既知)のそれぞれの役割を調査した。cfDNA断片化の生物学を解明するために、これらのヌクレアーゼの各々を欠損したマウスを用いて、DNASE1、DNASE1L3、およびDNA断片化因子サブユニットベータ(DFFB)の役割を分析した。
分析例において、cfDNA断片の末端塩基を含む、各タイプのヌクレアーゼを欠損したマウスと野生型の対応物との間でcfDNAプロファイル(cfDNAサイズプロファイルを含む)を比較した。DNA断片の末端塩基は、あるタイプの末端モチーフであり、特定の塩基で終わるcfDNA断片の相対量(例えば、割合)の測定は、組織ヌクレアーゼ活性、組織ヌクレアーゼ活性に関連するcfDNA断片源、ヌクレアーゼ機能、およびヌクレアーゼに影響を与える障害に関する情報を提供することができる。各ヌクレアーゼが、cfDNA断片化において異なるが補完的な役割を果たしたことを発見した。
各タイプのヌクレアーゼ欠損マウスにおけるcfDNA断片の末端を野生型マウスの末端と分析することによって、各ヌクレアーゼが、cfDNA断片化の段階的なプロセスを明らかにする特定の切断選択(例えば、特定の末端モチーフ)を有することを示す。cfDNAが、最初にDFFBを用いて細胞内で、DNASE1L3および他のヌクレアーゼを用いて細胞内で生成されることを実証する。次いで、cfDNA断片化は、循環DNASE1L3およびDNASE1を用いて細胞外で継続する。ヌクレオソーム構造を破壊するためにヘパリンを使用することで、10bpの周期性が無傷のヌクレオソーム構造内のDNAの切断に由来したことも示した。要するに、本開示は、cfDNA断片化のモデルを確立する。
ヌクレアーゼに関連する遺伝子における遺伝性障害を検出するため、抗凝固剤の投与量の有効性を決定するため、およびヌクレアーゼの活性を監視するための、様々な実施形態が提供される。
例えば、参照値と比較した断片末端での特定の塩基の量を使用して、抗凝固剤で処理された試料中の特定のサイズの断片末端での特定の塩基の量を使用して、および異なる時間にわたって抗凝固剤とインキュベートされた試料についての断片末端での特定の塩基の量を比較して、遺伝子についての遺伝性障害を検出するための、様々な技術が提供される。
例えば、抗凝固剤を投与された対象の試料中の断片末端での特定の塩基の量を使用して、および抗凝固剤を投与された対象の試料中の特定のサイズの断片末端での特定の塩基の量を使用して、抗凝固剤の投与量の有効性を決定するための、様々な技術が提供される。
例えば、参照値と比較して試料中の断片末端での特定の塩基の量を使用して、および試料中の特定のサイズの断片末端での特定の塩基の量を使用して、ヌクレアーゼの活性を監視するための、様々な技術が提供される。
I.無細胞DNA末端モチーフ
末端モチーフは、無細胞DNA断片の末端配列、例えば、断片のいずれかの末端でのK塩基の配列に関する。末端配列は、例えば、1、2、3、4、5、6、7などの様々な数の塩基を有するk merであり得る。末端モチーフ(または「配列モチーフ」)は、参照ゲノムの特定の位置とは対照的に、配列自体に関する。したがって、同じ末端モチーフは、参照ゲノム全体の多数の位置に生じ得る。末端モチーフは、例えば、開始位置の直前または終了位置の直後の塩基を同定するために、参照ゲノムを使用して決定され得る。このような塩基は、例えば、断片の末端配列に基づいて同定されるため、無細胞DNA断片の末端に対応する。
図1は、本開示の実施形態による末端モチーフの例を示す。図1は、分析する4mer末端モチーフを定義する2つの方法を示す。技術140において、4mer末端モチーフは、血漿DNA分子の各末端の最初の4bp配列から直接構築される。例えば、配列決定された断片の最初の4ヌクレオチドまたは最後の4ヌクレオチドが使用され得る。技術160において、4mer末端モチーフは、断片の配列決定された末端からの2mer配列およびその断片の末端に隣接するゲノム領域からの他の2mer配列を利用することによって共同で構築される。他の実施形態において、他のタイプのモチーフ、例えば、1mer、2mer、3mer、5mer、6mer、7mer末端モチーフが使用され得る。
図1に示すとおり、無細胞DNA断片110は、例えば、遠心分離などによる血液試料の精製プロセスを使用して取得される。血漿DNA断片に加えて、例えば、血清、尿、唾液、および本明細書で言及される他の試料由来の他のタイプの無細胞DNA分子が使用され得る。一実施形態において、DNA断片は、平滑末端化され得る。
ブロック120で、DNA断片は、対末端配列決定に供される。いくつかの実施形態において、対末端配列決定は、DNA断片の2つの末端から2つの配列リード、例えば、配列リード当たり30~120塩基を生成し得る。これらの2つの配列リードは、DNA断片(分子)の一対のリードを形成し得、各配列リードは、DNA断片のそれぞれの末端の末端配列を含む。他の実施形態において、DNA断片全体が配列決定され得、それにより、DNA断片の両端の末端配列を含む単一の配列リードを提供する。両端の2つの末端配列は、単一の配列決定操作から一緒に生成された場合でも、対の配列リードとみなされ得る。
ブロック130で、配列リードは、参照ゲノムにアラインメントされ得る。このアラインメントは、配列モチーフを定義するための異なる方法を説明するためのものであり、いくつかの実施形態において使用されない場合がある。例えば、断片の末端にある配列は、参照ゲノムにアラインメントする必要なく直接使用され得る。しかしながら、アラインメントは、対象における変動(例えば、SNP)に依存しない、末端配列の均一性を有することが望ましい場合がある。例えば、変動または配列決定誤差により、末端塩基が参照ゲノムと異なる可能性があるが、参照における塩基は、カウントされたものであり得る。あるいは、配列リードの末端の塩基は、個々に合わせて調整されるように使用され得る。アラインメント手順は、BLAST、FASTA、Bowtie、BWA、BFAST、SHRiMP、SSAHA2、NovoAlign、およびSOAPなど(であるがこれらに限定されない)様々なソフトウェアパッケージを使用して実施され得る。
技術140は、ゲノム145へのアラインメントを有する、配列決定された断片141の配列リードを示す。5’末端を開始とみなして、第1の末端モチーフ142(CCCA)は、配列決定された断片141の開始にある。第2の末端モチーフ144(TCGA)は、配列決定された断片141の尾部にある。cfDNA断片の末端優位性を分析する場合、この配列リードは、5’末端のC末端カウントに寄与する。そのような末端モチーフは、一実施形態において、酵素がCCCAを認識し、次に最初のCの直前に切断を行うときに生じ得る。その場合、CCCAは優先的に血漿DNA断片の末端にある。TCGAの場合、酵素がそれを認識し、次いで、Aの後に切断を行い得る。Aについてカウントが決定されると、この配列リードは、A末端カウントに寄与する。
技術160は、ゲノム165へのアラインメントを有する、配列決定された断片161の配列リードを示す。5’末端を開始とみなして、第1の末端モチーフ162(CGCC)は、配列決定された断片161の開始の直前に生じる第1の部分(CG)、および配列決定された断片161の開始の末端配列の一部である第2の部分(CC)を有する。第2の末端モチーフ164(CCGA)は、配列決定された断片161の尾部の直後に生じる第1の部分(GA)、および配列決定された断片161の尾部の末端配列の一部である第2の部分(CC)を有する。そのような末端モチーフは、一実施形態において、酵素がCGCCを認識し、次いで、GおよびCの直前を切断するときに生じ得る。その場合、CCは、その直前にCGが生じている血漿DNA断片の末端に優先的に存在し、それによってCGCCの末端モチーフを提供するであろう。第2の末端モチーフ164(CCGA)については、酵素はCとGとの間を切断し得る。その場合、CCは優先的に血漿DNA断片の末端に存在するであろう。技術160について、隣接するゲノム領域および配列決定された血漿DNA断片からの塩基の数を変えられ得、必ずしも固定比率に制限されるとは限らず、例えば、2:2の代わりに、比率は2:3、3:2、4:4、2:4などであり得る。
無細胞DNA末端のシグネチャに含まれるヌクレオチドの数が多いほど、モチーフの特異性が高くなり、これは、ゲノムにおいて正確な構成で順序付けられた6塩基を有する確率が、ゲノムにおいて正確な構成で順序付けられた2塩基を有する確率よりも低いためである。したがって、末端モチーフの長さの選択は、使用目的の用途に必要な感度および/または特異度によって支配され得る。
末端配列は、配列リードを参照ゲノムにアラインメントするために使用されるため、末端配列、または直前/直後から決定された任意の配列モチーフは、依然として末端配列から決定される。したがって、技術160は、他の塩基への末端配列の関連を作成し、参照は、その関連を作成するためのメカニズムとして使用される。技術140と160間の差は、特定のDNA断片がどの2つの末端モチーフに割り当てられるかであり、これは、相対頻度についての特定の値に影響を与える。しかし、全体的な結果(例えば、遺伝性障害の検出、投与量の有効性の決定、ヌクレアーゼの活性の監視など)は、一貫した技術が、例えば、機械学習モデルを使用して生じ得る、参照値を決定するための任意の訓練データに使用される限り、DNA断片が末端モチーフにどのように割り当てられるかによって影響されないであろう。
特定の末端モチーフ(例えば、特定の塩基)に対応する末端配列を有するDNA断片のカウントされた数は、特定の末端モチーフの量を決定するためにカウントされ得る(例えば、メモリ内のアレイに保存され得る)。量は、生のカウントまたは頻度など、量が正規化される様々な方法で測定され得る。正規化は、DNA断片の総数またはDNA断片の指定された群内の数(例えば、指定された領域から、指定されたサイズを有する、または1つ以上の指定された末端モチーフを有する)を使用して(例えば、それで除算して)行われ得る。遺伝性障害が存在する場合、ならびに有効量の抗凝固剤が投与された場合、ならびにヌクレアーゼの活性が変化(例えば、増加または減少)した場合)、末端モチーフの量の差が検出されている。
II.循環CFDNAおよび新鮮なCFDNAにおける末端選択
循環cfDNAは、対象から取得された試料、例えば、血液または血漿から直接見つけることができる。そのような循環cfDNAは、体内に無細胞形態で存在する。したがって、無細胞DNAは、体内の細胞から(例えば、アポトーシスまたは壊死を介して)産生され、次いで、無細胞DNAは循環し始めた(例えば、血液中)。対照的に、新鮮なcfDNAは、身体由来の細胞から取得され、次いで、細胞が体外にある間に、例えばインキュベーションなどの様々な方法のいずれかで細胞を死滅させることによって、無細胞DNAが生成される。好ましい末端配列の差が観察された。
A.典型的な循環CFDNAにおけるC末端選択
野生型(WT)マウスにおける異なるゲノム領域内のcfDNA断片の5’末端での塩基含有量の割合を分析して、cfDNA断片化がランダムではないという仮説を検証した。血液試料の場合、EDTAを抗凝固剤として使用し、血漿ヌクレアーゼを阻害して、低温、例えば、-5℃~20℃などの標準的な冷蔵庫温度に保持された場合に初期状態に比較的近い無細胞DNAのサイズプロファイル、末端モチーフの頻度、および濃度を維持することができる。より高い温度(例えば、室温)でインキュベートされた場合、新鮮なcfDNAは、インキュベーション時間の量に依存する量で生成される。0の時間は、室温でのインキュベーションがないことを示す。
図2A~2Eは、本開示の実施形態による、異なる領域内の参照ゲノム含有量と比較した、WT cfDNA断片の5’末端の塩基含有量を示す。これらの図は、参照ゲノムの一般的な塩基含有量と比較した末端モチーフ(この例では単一塩基)の塩基含有率を使用した、T/Aと比較したC/Gでの断片化についての選択を示す。
1.断片の末端モチーフについての塩基含有率の定義
図2Aは、断片がアラインメントされている凝集領域205を示し、断片は、5’末端の末端塩基に基づいてラベル付けされている。横軸は、領域の中心に対する相対位置を示す。そのような領域のタイプの例には、オープンクロマチン領域、CTCF領域、例えば、特定のヌクレアーゼ(例えば、DNase)の過敏性部位に関連する領域、Pol II領域(RNAポリメラーゼII)、および転写開始部位(TSS)に関連する領域が含まれる。参照ゲノムには各タイプの領域のインスタンスが多くあるため、アラインメントされたカウントデータ(例えば、領域の所与のインスタンスの各位置についての末端モチーフのカウント)は、領域タイプの多くのインスタンスにわたって集計される。位置0は、各インスタンスについて選択され、これによりカウントは、各末端モチーフ、この例では特定の塩基の所与の位置について集計され得る。
縦線260は、各位置についてパーセンテージがどのように決定されるかを例示する。パーセンテージは、特定の塩基でラベル付けされたリードのものであり、これは上記のように、5’末端の末端塩基に対応する。したがって、所与の位置でのパーセンテージの計算は、その位置で終わる断片のすべてを使用する。図2A中、塩基含有量は、縦線260に対応する位置で50%のAおよび50%のCである。末端モチーフが1merを超える場合、パーセンテージの決定は、3以上である可能な末端モチーフの数、例えば、2merである末端モチーフについては16を説明することができる。
2.参照の一般的な塩基含有量と比較した末端塩基含有量
図2Bは、参照ゲノム含有量についての(すなわち、参照ゲノムの)ランダム領域内の位置での塩基含有率のプロットを示す。ランダム領域を、1000個の塩基の領域を定義する位置0をランダムに選択し、次いで、その位置と比較して参照ゲノムにおける塩基含有量を決定することによって生成した。したがって、図2Bは、DNA断片の末端塩基を使用して決定されるのではなく、代わりに、ランダムに選択された位置と比較した参照ゲノムの塩基含有量が使用される。図2Bは、位置0までの相対距離についての末端塩基のパーセンテージの変動がないことを示す。異なる塩基についてのパーセンテージは、参照ゲノムにおける塩基の発生の差の結果としての差を有するが、所与の塩基についてのパーセンテージは、一定である。図2Bの特定のデータの場合、約10,000個のランダムな位置を選択し、それらの位置の周辺の塩基を分析した。これらの位置は、位置0に示される。参照ゲノム含有量のランダムな領域において、AおよびTの割合は等しく、CおよびGの割合は等しい。ランダムな領域の場合、塩基含有率は、均一である。TおよびAについてのパーセンテージは、30%をわずかに下回り、GおよびCについては20%をわずかに上回る。
図2Dは、参照ゲノム含有量についてのCTCF領域内の位置での塩基含有率のプロットを示す。CTCF領域は、真核生物ゲノム内にほぼ不変の位置を有するヌクレオソームが隣接していることが知られており、それによってゲノム領域の機能に応じて任意の選択を示す。CTCF領域の場合、塩基含有率は、CTCF部位で反転し、G/Cの含有量は、T/Aよりも高い。
図2Cは、ランダム領域内のWT EDTA 0時間試料におけるcfDNA断片の5’末端の塩基含有量を示す。したがって、図2Cについては、インキュベーションは行われなかった。末端塩基についてのカウントデータを、ランダムに選択された位置に対する各位置で集計し、パーセンテージを、その位置で終わる各塩基の相対頻度について決定した。塩基含有率は、A末端210、G末端220、T末端230、およびC末端240について示される。断片化が完全にランダムであった場合、末端ヌクレオチドの割合は、図2Bに示されるように、28.8%のA、28.8%のT、21.2%のC、および21.2%のGであるマウスゲノムの組成を反映するはずである。しかしながら、ランダムに選択されたゲノム領域ないcfDNA断片の5’末端は、図2Cに示されるように、C(32.6%)の実質的な過剰表現、G(24.4%)のわずかな過剰表現、ならびにA(19.8%)およびT(23.2%)の過少表現を示す。そのような変化は、A/T部位が参照ゲノムにおいてより一般的であるが、断片末端ではあまり頻繁に現れないため、DNAがCおよびG位置で不均衡に断片化されていることを示す。
図2Eは、CTCF領域内のWT EDTA 0時間試料におけるcfDNA断片の5’末端の塩基含有量を示す。塩基含有率は、A末端210、G末端220、T末端230、およびC末端240について示される。これらの試料において、参照ゲノム含有量と比較して、cfDNA断片の5’末端で、AおよびTが過小表現されているのに対し、CおよびGは、過剰表現されている。したがって、この場合もやはり、循環cfDNAの自然な断片化が、A/T部位よりもC/G部位にあることが選択される。そのような非対称表現は、他の領域についても見られ得る。
図3A~3Bは、本開示の実施形態による、TSS領域内の塩基含有量の割合を示す。TSS(図3A)領域内の参照ゲノム含有量は、WT EDTA 0時間試料(図3B)におけるcfDNAの5’末端塩基含有量と比較される。図3Bは、参照含有量と比較したC末端の増加を示す。A末端およびT末端は、概してより低く、G末端は、ほぼ同じである。
図3C~3Dは、本開示の実施形態による、Pol II領域内の塩基含有量の割合を示す。Pol II(図3C)領域内の参照ゲノム含有量は、WT EDTA 0時間試料(図3D)におけるcfDNAの5’末端塩基含有量と比較される。図3Dは、参照含有量と比較したC末端の大きな増加、およびG端についてのより小さな増加を示す。A末端およびT末端は、概してより低い。他の図と同様に、塩基含有率は、A末端210、G末端220、T末端230、およびC末端240について示される。
したがって、この非対称表現のパターンは、TSSおよびPol II領域にアラインメントするcfDNAにおいても見られた。CTCF領域が、CTCF結合部位に隣接する安定した位置にあるヌクレオソームのアレイを含有するため、ならびにTSSおよびPol II領域が、既知のオープンクロマチン領域であるため、ゲノムのヌクレオソーム領域およびオープン領域の両方が、同じC末端過剰表現を示す。
3.異なる断片サイズについての末端塩基含有量
図4は、本開示の実施形態による、断片サイズの範囲にわたるWT cfDNAの5’末端の塩基含有量を示す。縦軸は、塩基含有率であり、横軸は、断片サイズである。断片の各末端は、独立してカウントされる。異なる断片サイズにおいて、cfDNA断片の5’末端で、AおよびTが過小表現されているのに対し、CおよびGは、過剰表現されている。図5に示されるように、5’末端が、cfDNA断片サイズの0~600bpの範囲にわたってプロットされている場合、C末端の過剰発現およびA末端の過少発現は、明らかであり、野生型cfDNAのすべての断片サイズにわたって比較的均一である。したがって、C末端優位性のcfDNAは、すべての断片サイズにわたってWTマウスにおける典型的なcfDNAプロファイルであるように思われる。
B.新鮮なcfDNAの断片化パターン(例えば、DFFBについて)
新鮮なDNAは、全血試料中の細胞から取得され得、EDTA中で室温において一定期間、全血をインキュベートすることによって、細胞を死滅させる。このようにして、得られた血漿試料は、新鮮なDNAが濃縮され得る。
この典型的なcfDNAプロファイル(すなわち、前のセクションで示されるような)が、細胞源から「そのまま」作られたのか、または血漿内でのさらなる消化後に産生されたのかを調査した。したがって、瀕死細胞から新たに生成されたcfDNAを捕捉および分析し、そのプロファイルを上に示される典型的なC末端優位性なcfDNAプロファイルと比較しようとした。
1.インキュベーションによるcfDNAの量の変化
図5A~5Bは、本開示の実施形態による、新鮮なcfDNAが濃縮されたEDTA 6時間試料の集合体を示す。
図5Aは、2つの期間にわたってEDTAで処理されているWTマウスからのcfDNAを示す。全血を室温においてEDTA中で6時間インキュベートすることによって、試料を新鮮なcfDNAで濃縮した。EDTAと室温でインキュベートすると、細胞が死滅し、それによって新鮮なcfDNA(すなわち、試料が最初に収集されたときに無細胞ではなかったが、無細胞になったDNA)が放出される。各対の試料におけるインキュベーション後の新鮮なcfDNAの流入は、血漿cfDNA量の1.1から5.9倍の増加によって確認された。
図5Bは、インキュベーションなしから室温での6時間のインキュベーションへのcfDNAの濃度(ゲノム当量GE/mL)の増加を示す。長いcfDNA断片の増加も観察される。
図6は、5つの異なる野生型プールについて、インキュベーションなし(0時間)の試料のサイズプロファイル710、およびインキュベーションあり(6時間)のサイズプロファイル720を示す。各プールは、野生型(WT)を有するマウスの異なる群からのDNAを含有する。サイズプロファイルは、横軸にDNA断片のサイズ(bp)、および所与のサイズでのDNA断片の頻度(パーセンテージとして)を示す。サイズプロファイル720が長いDNA断片についてのサイズプロファイル710よりも大きいことによって示されるように、長いDNA断片(例えば、350~600bp)の頻度は、概して、インキュベーションに伴い高まる。
図5A、5B、および6におけるそのような挙動は、全血が長期間保持される場合、試料中に存在する血球の一部が無細胞DNAを漏出させ始める可能性があることを示す。そのような漏出は、任意の分析で説明され、検出および他の測定などの用途に使用され得る。
2.新鮮なcfDNAにおけるA末端およびG末端選択
EDTAとのインキュベーションの結果としてのcfDNAの増加に加えて、塩基末端含有量の変化も調査した。EDTAとの血液試料のインキュベーションは、インキュベートされていない血液試料中の典型的な塩基末端含有量と比較して、A末端およびG末端含有量の増加をもたらす。この増加は、ランダム領域、CTCF領域、TSS領域、およびPol II領域を含む様々な領域内に見られる。
図7A~7Dは、本開示の実施形態による、ランダム、CTCF、TSS、およびPol II領域についての、マウスにおける新鮮なcfDNAが濃縮されたEDTA 6時間試料の塩基含有率を示す。図2Cおよび2Eと比較して、インキュベーションは、A末端およびG末端の頻度を高め、インキュベーション中に生じる断片化におけるAおよびGの選択を示す。
図7Aは、本開示の実施形態による、血液試料をEDTAとともに6時間にわたってインキュベートすることによって調製された、新鮮なcfDNA試料についてのランダム領域内の塩基含有率を示す。6時間EDTA試料におけるcfDNAの5’末端を分析すると、典型的なcfDNAに見られるC末端優位性は、図2Cに示されるように、そのベースラインの0時間インキュベーションと比較して、新鮮なcfDNAの存在下で大幅に減少した。C末端およびT末端断片は、それぞれ、28.3%および17.0%に減少した。A末端およびG末端断片は、ランダムに選択されたゲノム領域内で、それぞれ、27.7%および27.0%に大幅に増加した。
図7Bは、本開示の実施形態による、新鮮なcfDNA試料についてのCTCF領域内の塩基含有率を示す。ランダム領域についての塩基含有量の変化も、ヌクレオソームアレイを有するCTCF領域内で一貫して視覚化された。図7Bを図2Eと比較すると、A末端含有量が20%をわずかに下回る量から約20~30%に増加し、G末端含有量は、概して、30%未満から30%超に増加することがわかる。
図7Cは、本開示の実施形態による、新鮮なcfDNAが濃縮されたEDTA 6時間試料中のTSS領域内の塩基含有量の割合を示す。図3Bと比較すると、A末端含有量の20%未満から20%超への増加、およびG末端含有量の30%未満から30%超への増加がわかる。
図7Dは、本開示の実施形態による、新鮮なcfDNAが濃縮されたEDTA 6時間試料中のPol II領域内の塩基含有量の割合を示す。図3Dと比較すると、A末端含有量の20%未満から20%超への増加、およびG末端含有量の概して約30%から40%以上への増加がわかる。
したがって、全血インキュベーション後の新鮮なcfDNAは、典型的なcfDNAと比較して、A末端およびG末端の断片が濃縮されていた。瀕死細胞からの新鮮なcfDNAプロファイルは、ベースライン試料に見られる典型的なC末端優位性のcfDNAと動揺であるようには思われないため、典型的なC末端優位性のcfDNAが次のステップで作られると推測した。インキュベーション後の断片末端選択(例えば、A末端の濃縮)は異なるため(例えば、A末端対C末端)、新鮮なcfDNAの生成が、典型的なcfDNAを作ったものとは異なるメカニズムに由来する可能性が高かったとも推論した。後のセクションで示されるように、A末端についての濃縮は、より長いcfDNAにおいて生じる。
3.異なるサイズの新鮮なcfDNA間のA末端およびG末端
また、断片サイズごとに塩基末端選択を調査した。断片を2つの末端ヌクレオチドによって特定し、両端がA、G、C、またはTで終わる断片を分析した。両端が特定されたこれらの断片を、それらの末端ヌクレオチドおよびその間の記号<>で示し、これによりAとしての両端を有する断片は、A<>Aとして指定される。異なるサイズ間でA<>A、G<>G、C<>C、およびT<>T断片の比例する表現を比較し、特定のヌクレオチドを切断することの任意の選択が、これらの断片タイプで最もよく視覚化され、両端が、同じヌクレオチド選択を包含したと推論した。これらの4タイプの断片のうち、新鮮なcfDNAが濃縮された6時間試料は、150bp超のサイズの有意により高い割合のA<>A断片を有し、250bp以上の長い断片においてさらに増加した。一方、G<>G、C<>C、およびT<>T断片は、サイズごとに有意に異ならなかった。したがって、新鮮なcfDNAは、150bpよりも長かったA末端断片が濃縮されていた。
図8Aは、本開示の実施形態による、短い断片、中間の断片、および長い断片の間での、WTマウスにおけるベースラインcfDNA(EDTA 0時間)と新鮮なcfDNAが濃縮された試料(EDTA 6時間)との間で比較した、A<>A断片の割合を示す。P値は、マン・ホイットニーのU検定によって計算される。図8A中、4つの分類は、短い断片(150bp以下)、中間の断片(150~250bp)、長い断片(250bp以上)、およびすべての断片についての分析を示す。各分類について、EDTAの0時間および6時間についての測定値が示される。パーセントは、中間の断片および長い断片、ならびにすべてのA<>A断片について著しく増加する。A<>Aの増加は、以下で分析されるように、DNA断片化因子サブユニットベータ(DFFB)ヌクレアーゼが、血液から細胞内DNA(すなわち、細胞の内側)を切断し、次いで、その無細胞DNAを血漿中に放出することに関連し得る。
図8Bは、短い断片、中間の断片、および長い断片の間での、EDTA 0時間とEDTA 6時間との間で比較した、WTマウスにおけるG<>G断片の割合についてのサイズプロファイルを示し、図9A~9Bは、C<>C、T<>T断片の割合についてのサイズプロファイルを示す。P値は、マン・ホイットニーのU検定によって計算される。上記のように、G<>G、C<>C、およびT<>T断片の量は、サイズごとに有意に異ならなかった。
図10Aは、それぞれのベースラインの非インキュベーションEDTAレベルと比較した、各断片サイズについてのA末端、G末端、C末端、およびT末端断片の割合を示す。図10A中、カウントは、図8A~9Bにあるように、二重末端とは対照的に単一末端についてのものである。具体的には、図10Aは、EDTA 0時間試料(灰色)におけるベースライン表現と比較した、新鮮なcfDNAが濃縮されたWT EDTA 6時間試料におけるA末端1010(緑色)、G末端1020(オレンジ色)、C末端1040(青色)、およびT末端1030(赤色)を有するcfDNAのパーセンテージを示す。示されるように、A末端およびG末端断片は増加し、C末端およびT末端断片は減少する。これらはパーセンテージであるため、特定の群の含有量が増加すると、対応して他の含有量が減少する。
驚くべきことに、長いA末端断片の増加は特定のサイズ範囲に集中しており、ヌクレオソームラダーサイズを連想させた約200bpおよび400bpを伴った。G末端断片も、これらのサイズで同様であるがより弱い周期性を有した。これらのA末端(およびG末端)cfDNA断片が、ヌクレオソーム間を切断することによって作られた可能性が高く、これにより無傷のヌクレオソームDNAの完全長が保持されたと仮定した。周期性のピークは、ヌクレオソーム間領域5’からAへの切断の真の選択を裏付け、5’からGへの切断の選択はわずかにより小さい。
4.A末端を有するcfDNAに対するDFFBの効果
A末端の長い断片は瀕死細胞から新たに生成されたため、それらの生成におけるアポトーシスの役割を調べた。DFFBは、アポトーシス中のDNA断片化に関与する主要な細胞内ヌクレアーゼであるため、Dffb-/-によって示される、両方の対立遺伝子でその遺伝子がノックアウトされているDffb欠損マウスからの試料を調査した。
図10Bは、EDTA 0時間試料(灰色)におけるそのベースライン表現と比較した、Dffb欠損EDTA 6時間試料におけるA末端(緑色)、G末端(オレンジ色)、C末端(青色)、T末端(赤色)を有するcfDNAのパーセンテージを示す。各断片サイズでのA末端、G末端、C末端、およびT末端断片の割合を比較すると、ベースラインと比較して6時間のEDTAインキュベーション後のDffb欠損マウスにおける変化はほとんどなく、A末端およびG末端断片において周期性はなかった。したがって、Dffb欠損マウスにおいて、WTマウスで観察されたA末端断片における増加はなく、DFFBが、これらのA末端の長い断片の生成に重要な役割を果たしている可能性があることを示唆する。
さらに、インキュベーション後のcfDNAの全体的な変化、断片サイズ、および異なる領域について調査した。インキュベーション後、本質的に変化はなかった。
図11Aは、本開示の実施形態による、Dffb欠損マウスにおけるEDTA 0時間試料対6時間試料のcfDNAの濃度を示す。6時間のEDTAインキュベーション後、cfDNA量は有意に増加しなかった。
図11Bは、本開示の実施形態による、Dffb欠損マウスにおけるEDTA 0時間試料対6時間試料のサイズプロファイルを示す。長い断片の増加はほとんどまたは全くなかった。
図11Cは、本開示の実施形態による、短い断片、中間の断片、および長い断片の間での、EDTA 0時間とEDTA 6時間との間で比較したDffb欠損マウスにおけるA<>Aの割合を示す。A<>A断片のパーセンテージは、図8Aに示されるように、WTマウスとは異なり、Dffb欠損マウスにおいて6時間のEDTAインキュベーション後に増加しなかった。
図12A~12Dは、本開示の実施形態による、ランダム領域およびCTCF領域についてのEDTA 0時間試料および6時間試料におけるDffb欠損マウスの塩基含有量の割合を示す。図13A~13Dは、本開示の実施形態による、TSS領域およびPol II領域についてのEDTA 0時間試料および6時間試料におけるDffb欠損マウスの塩基含有量の割合を示す。ランダムゲノム領域、CTCF、TSS、およびPol II領域内で、A末端断片は増加しなかった。
図10Aの変化が見られなかった場合、これは、動物(例えば、ヒトまたはマウス)が、ヌクレアーゼ、例えば、DFFBの欠損を有したことを示すであろう。そのような変化は、2つの異なる時間(例えば、0時間および6時間)でインキュベートし、それらの2つの異なる時間でのサイズプロファイルを比較することによって分析され得る。変化がないことは、細胞内切断を行うヌクレアーゼのいずれか1つの欠損を示し得、さらなる分析は、どのヌクレアーゼかに関する詳細を提供する能性がある。
III.典型的なCFDNAに対するDNASE1L3の効果
上記の分析は、新たに生成されたcfDNAの末端塩基含有量およびサイズプロファイルを特徴付けるが、このセクションは、典型的なC末端優位性が血漿cfDNAにおいてもたらされたプロセスを分析する。図4に見られる循環cfDNA断片のすべてのサイズにおけるC末端のこの明確な選択は、Cに対して5’を切断することを選択するヌクレアーゼの存在を示唆する。以前に、WTマウスからのcfDNAが、CCNNモチーフで終わる断片の高い頻度を有したこと、およびcfDNA断片におけるCCNNモチーフのこの選択が、Dnase1l3欠損マウスでは低減されたことを実証している(Serpas,L.et al.(2019),Proceedings of the National Academy of Sciences 116,641-649)。C末端選択に関与するヌクレアーゼもDNASE1L3であり得ると仮定した。この仮説を調査するために、Dnase1l3欠損マウス(Dnase1l3-/-)とWTマウスとの間で、特定のA<>A、G<>G、C<>C、およびT<>T断片の割合を比較した。
図14Aは、本開示の実施形態による、A<>A断片の構築を示す。図14Aは、A末端断片およびA<>A断片を示す。A末端断片は、ワトソン鎖の5’端またはクリック鎖の5’端にAを有する。塩基は任意の塩基であり得るため、他方の末端は、Nで示され得る。A<>A断片は、ワトソン鎖の5’端およびクリック鎖の5’端にAを有する。そのような命名法は、C<>C、G<>G、およびT<>Tにも適用され、これらのすべては、本開示全体を通して使用される。
図14Bは、本開示の実施形態による、WT試料と比較したDnase1l3欠損試料の末端塩基含有量を示す。塩基含有量データは、同じ塩基の両側末端についてである。図14Bは、WTマウス対Dnase1l3欠損(1l3-/-)マウス(両方ともEDTA 0時間)におけるA<>A、G<>G、C<>C、およびT<>T断片のパーセンテージを示す。縦軸は、試料中の断片パーセントである。横軸は、4つの分類(他の分類、例えば、A<>T、図示せず)についてのWTおよび1l3-/-に対応する。P値は、マン・ホイットニーのU検定によって計算される。A<>AおよびG<>Gのパーセンテージは、1l3-/-について増加し(すなわち、WTよりも高かった)、一方で、1l3-/-について、C<>Cのパーセンテージは、大幅に減少し、T<>Tのパーセンテージは、減少した(すなわち、WTよりも低かった)。そのような変化は、Dnase1l3の欠如がCで切断しないため、Cを切断することを選択するDnase1l3と一致しているが、他の塩基切断選択を有する他のヌクレアーゼはまだ存在し、それらの他の塩基で切断する。
図15は、本開示の実施形態による、断片サイズ当たりのWT試料と比較したDnase1l3欠損試料の末端塩基含有量を示す。図15は、WT EDTA 0時間cfDNA(灰色)のベースライン表現と比較した、DNASE1L3欠損EDTA 0時間cfDNAにおけるA末端1510(緑色)、G末端1520(オレンジ色)、C末端1540(青色)、およびT末端1530(赤色)のパーセンテージを示す。
図15中、EDTA 0時間試料におけるDnase113欠損マウスとWTマウスとの間で、各断片サイズのA末端、G末端、C末端、およびT末端の断片の割合を比較すると、C<>C断片が減少するという我々の発見と一致して、すべての断片サイズでC末端断片が減少する。A末端断片はまた、約200bpおよび400bpの頻度のピークを有するヌクレオソーム周期パターンも実証する。したがって、Dnase1l3欠損マウスにおいて、特にこれらのピークでA末端断片が増加する。特にこれらのピークで、対応してT末端断片が減少する。A末端断片のこのヌクレオソーム周期パターンは、新鮮なcfDNAが濃縮されたWT EDTA 6時間試料において以前に観察されたものと同様である(図10A)。したがって、DFFB切断の結果は、周期パターンを有するA末端の断片になり、これは通常、DNASE1L3によってすぐにC末端に変換される。しかし、DNASE1L3がそこにないため、A末端断片は増加する。また、結果として、C末端とは対照的にA末端が優位種になる。
これらの結果は、DNASE1L3がC末端およびT末端断片の両方を生成し、C<>C断片のパーセンテージがより大幅に低減されるため、C末端の選択がより大きいことを示唆する。
したがって、DNASE1L3の欠損により、新鮮なcfDNAのプロファイルが明らかにされたように思われた。基質-酵素-生成物の関係において、酵素が欠損していると、生成物は減少し、基質は増加する。したがって、DNASE1L3欠損cfDNAは、その基質cfDNAプロファイルを明らかにしたように見え、これは、DFFBによって作られたcfDNAプロファイルであるように思われた。これは、DFFB切断が細胞内で生じる傾向がある一方で、DNASE1L3による少なくともある程度の切断が循環血液ちゅうで生じることを示唆する。
cfDNA断片の両端を使用して断片タイプをより詳細に調べると、A<>A、A<>G、およびA<>C断片のみが、Dnase1l3欠損試料および新鮮なcfDNAが濃縮されたWT EDTA 6時間試料の両方において、このヌクレオソーム周期パターンを実証したことがわかった。
図16Aは、本開示の実施形態による、WT EDTA 0時間cfDNAのベースライン表現(灰色)と比較した、Dnase1l3欠損EDTA 0時間cfDNAにおけるA<>A、A<>G、およびA<>C断片のパーセンテージを示す。図16Bは、本開示の実施形態による、WT EDTA 0時間cfDNAのベースライン表現(灰色)と比較した、新鮮なcfDNAが濃縮されたWT EDTA 6時間試料におけるA<>A、A<>G、およびA<>C断片のパーセンテージを示す。データ1610は、Dnase1l3欠損試料についてのものである。2つの図の灰色の線は、WT EDTA 0時間についての異なるバッチに対応する。
これら2つの試料タイプの断片の間には、多数の顕著な差があった。Dnase113欠損マウスにおいて、A<>A、A<>G、およびA<>C断片の周期パターンは、非常に顕著であった(図16A)。DNASE1L3活性は、Dnase1l3欠損マウスにおいて存在しないため、cfDNAにおけるこの顕著さは、残りの活性な細胞内ヌクレアーゼ、特にDFFBでのヌクレオソームの周期的切断の真の選択を反映する可能性が高い。
一方で、新鮮なcfDNAに見られる周期パターンは、弱められており、これは、A<>C断片の中で特に顕著であった(図16B)。DNASE1L3活性は、Dnase1l3欠損マウスと比較して新鮮なcfDNAの生成において保持されるため、この差は、DNASE1L3がA<>C断片の作成において役割を果たすことを示し、これは、C<>C断片の作成のための中間ステップであり得る。これらの結果はまた、DNASE1L3がDFFB後に切断することによって、DFFBヌクレアーゼの優先的な切断を弱めることも示す。したがって、DNASE1L3切断が、主にDFFB切断の後続ステップとして生じること、およびDNASE1L3が、cfDNAにおいてC末端優位性を有する典型的なプロファイルの作成において役割を有し得るだけではなく、実際に優位な役割を果たすものであり得ると推測され得る(図4)。
IV.CFDNAに対するDNASE1の効果(ヘパリンを用いる)
C末端優位性を有する典型的なcfDNA断片の作成に関与するステップを実証したが、cfDNA断片がさらに消化され得、これによりcfDNAの恒常性の全体像が構築され得る方法についても調査する。C末端断片は、150bp未満の短い断片でも最も一般的であり続けるが、典型的なcfDNAプロファイルにおいて約50~150bpおよび約250bpのサイズのT末端断片の濃縮に注目した(図4)。これらのピークは、DNASE1L3選択に関連したC末端断片、またはDFFB切断選択に関連したA末端断片のいずれとも一致していなかった。断片末端がヌクレアーゼ選択と相関しているという我々の理論を用いて、これらのT末端がDNASE1選択に関連している可能性があるかどうかを調査した。
A.Dnase1における欠失の高価
DNASE1の切断選択を特定するために、Dnase1-/-、Dnase1+/-、およびWTマウスからの全血を採取し、タイプ内で試料をプールし、ヘパリンとの0時間または6時間のインキュベーションのために各プールをチューブに均等に分配した。DNASE1L3を阻害しながらDNASE1活性を強化することが知られているため、EDTAの代わりにヘパリンを使用した(Napirei,M.et al.,(2005),The Biochemical journal 389,355-364)。ヘパリンは、ヌクレオソームに取って代わることも示されている。
図17A~17Bは、本開示の実施形態による、ヘパリン中でのインキュベーションを伴うWT、Dnase1+/-、およびDnase1-/-マウスのcfDNAのサイズプロファイルを示す。普通(図17A)および対数(図17B)のスケールが提供される。図17Aは、6時間後のEDTAを含む血液(灰色)1710についてのcfDNAサイズプロファイル、ならびにWT、(青色)1720、Dnase1+/-(緑色)1730、およびDnase1-/-(赤色)1740マウスについての6時間後のヘパリンで処理された血液についてのデータを示す。WTおよびDnase1+/-マウスにおいて、6時間のヘパリンインキュベーションが、166bpのピークの低減およびヌクレオソームパターンの喪失を伴う、短い断片の著しい増加をもたらしたことがわかった。Dnase1-/-において、サイズの変化は生じず、サイズパターンは、EDTA血液からのcfDNAと本質的に同じであった。
この効果がDnase1によるものであることを示すために、青色曲線1720(WTヘパリン6時間)は、赤色曲線1740(Dnase1のホモ接合ノックアウトを有するマウスから採取れた血漿であるDnase1-/-)と比較され得る。Dnase1が存在しない場合、非常に短いDNA分子の増加はない。そして、Dnase1+/-についての緑色曲線1730において、非常に短いDNA分子がまだ出現しており(より少ないが)、これは、ヘテロ接合であり、このため1つの対立遺伝子のみが、遺伝子が欠損している。対数プロットは、より長い断片の量の変化を示すのに役立つ。
したがって、実施形態は、試料をヘパリンで処理し、試料をWTサイズ分布と比較することによって、Dnase1における障害(例えば、欠失)を検出することができる。
また、断片末端の割合の差についてこれらの試料を調べた。
図18A~18Bは、本開示の実施形態による、ヘパリン中でのインキュベーションを伴うWTおよびDnase1-/-マウスのcfDNAのサイズプロファイルおよび塩基含有量を示す。末端断片についてのデータは、単一末端データについてのものである。
図18Aは、ヘパリン0時間(灰色)におけるそのベースライン表現と比較した、WTヘパリン6時間試料のA末端1810(緑色)、G末端1820(オレンジ色)、C末端1840(青色)、およびT末端1830(赤色)のパーセンテージを示す。図18Bは、ヘパリン0時間(灰色)におけるそのベースライン表現と比較した、Dnase1-/-マウスのA末端1860(緑色)、G末端1870(オレンジ色)、C末端1890(青色)、およびT末端1880(赤色)のパーセンテージを示す。
図19は、本開示の実施形態による、ヘパリン中でのインキュベーションを伴うDnase1+/-マウスのcfDNAのサイズプロファイルおよび塩基含有量を示す。.WT、Dnase1+/-、Dnase1-/-マウスにおけるヘパリン効果。図19は、0時間インキュベーション(灰色)におけるそのベースラインと比較した、6時間ヘパリンインキュベーション後のDnase1+/- cfDNAにおけるA末端1910(緑色)、G末端1920(オレンジ色)、C末端1940(青色)、およびT末端1930(赤色)を有するcfDNAのパーセンテージを示す。
WTおよび6時間のヘパリンインキュベーション後のDnase1+/-マウスにおいて、T末端断片の割合は、約50~150bpのサイズの断片において増加した(図18A、図19)。対照的に、Dnase1-/-マウスにおいて、この増加はなかった(図18B)。これらの観察結果は、DNASE1がT末端断片の作成を選択する可能性があるという我々の仮説を裏付けた。概して、T末端の塩基含有量は、Dnase1-/-についてよりもWTおよびDnase1+/-についてより高かった。さらに、ヌクレオソーム周期性を有する長いA末端断片は、WT、Dnase1+/-、およびDnase1-/-マウスにおいて、6時間のヘパリンインキュベーション後に存在していた。A末端断片のそのような観察結果は、EDTAと同様に、血液試料中の細胞の細胞死によるcfDNAの増加と一致している。
図20は、本開示の実施形態による、ヘパリン中の0時間試料および6時間試料を有するWT、Dnase1+/-、およびDnase1-/-マウスについてのcfDNA量を示す。1mL当たりのゲノム当量におけるcfDNAの濃度は、縦軸にあり、横軸は、ヘパリンとのインキュベーションの異なる時間を有する。示されるように、cfDNAの量は、インキュベーション時間とともに増加する。
3つすべての遺伝子型におけるcfDNA量の増加を、アポトーシスを誘導するヘパリンインキュベーションに関する文献(Manaster,J.et al.,(1996),British Journal of Haematology 94,48-52)と組み合わせると、新たにアポトーシスを起こしたcfDNAからのA末端DFFBシグネチャは、一致していた。DFFBからの新鮮なA末端断片を有するcfDNAの増加は、(WTマウスにおけるDNASE1のヘパリン強化により)短いT末端断片に迅速に消化され、DNASE1がTに対して5’を切断することを選択したことを示唆する。
B.ヌクレオソームから切断された断片からの周期性
EDTA、ヘパリン、および異なるインキュベーション時間を用いて断片の周期性を分析した。結果は、T末端を切断することを選択するDNASE1、および血漿中のヌクレオソーム構造を破壊するヘパリンと一致している。
図21Aは、本開示の実施形態による、EDTA 0時間WT試料中のA末端、G末端、C末端、およびT末端断片のcfDNAサイズプロファイルを示す。頻度は、特定の末端塩基タイプ内で決定され、例えば、G末端についての特定のサイズでの各頻度値は、G末端断片の総数によって正規化される。特に、すべてのA末端、G末端、C末端、およびT末端の断片タイプは、すべてのマウス遺伝子型(WT、Dnase1l3-/-、Dffb-/-、Dnase1+/-、およびDnase1-/-)の間で、短い150bp以下の断片において10bpの周期性を実証した。図22A~22Dは、本開示の実施形態による、Dffb-/-、Dnase1l3-/-、Dnase1+/-、およびDnase1-/-マウスのEDTA 0時間試料におけるA末端、G末端、C末端、およびT末端断片のcfDNAサイズプロファイルを示す。ピーク値における10bpの周期性は、Dnase1l3-/-について図22Bで特に顕著である。
すべてのcfDNAサイズのC末端選択を除いて、10bp周期断片に関連する特定の末端選択はなかった。したがって、単一の特定のヌクレアーゼが10bpの周期性に関与する可能性は低いであろう。実際、10bpの周期性についての一般的な理論は、10bpの周期性が無傷のヌクレオソーム内でのDNAのヌクレアーゼ消化の結果であるというものである。これは、ヒストンに巻かれたDNAへのヌクレアーゼアクセスの制限と、DNAヘリックスの1ターン当たり10bpの構造によるDNAの一方の鎖のもう一方の鎖への周期的曝露との複合効果から仮定された(Klug,A.,and Lutter,L.C.(1981),Nucleic Acids Res 9,4267-4283)。
図21Bは、本開示の実施形態による、ヘパリン6時間WT試料中のA末端、G末端、C末端、およびT末端断片のcfDNAサイズプロファイルを示す。血漿中のヌクレオソーム構造を破壊した我々のヘパリンモデルにおいて、WTにおける6時間のヘパリンインキュベーション後、すべての断片タイプで10bpの周期性が破壊された。さらに、T末端2130は、小さな断片の間で増加する。ヘパリンがヌクレオソーム構造を破壊した結果としてのT末端2130のこの増加は、DNASE1が(無傷の細胞内とは対照的に)血漿中で一般的であり、T末端を切断することを選択することと一致している。ヘパリンインキュベーションによる約50~150bpのサイズのT末端断片のそのような変化は、例えば、T末端断片について予想された増加が生じない場合、DNASE1での遺伝性障害を検出するために使用され得る。
図23Aは、本開示の実施形態による、ベースライン試料(EDTA 0時間および6時間、ヘパリン0時間)(灰色の線2320)と比較した、ヘパリン6時間試料(赤色の線2310)におけるCTCF領域内の断片末端密度を示す。灰色の線2320は、3つの特定された試料からのものである。これらの3つの線は、位置0の周辺である程度の差を示すが、位置0から離れてピークの同様の周期性を有する。
CTCF領域は、ヌクレオソームの間隔が非常に明確であるという点で特別である。灰色の線2320(EDTAおよびインキュベーションなしのヘパリン)を見ると、非常に良好な周期性があるが、ヘパリンの存在下(赤色の線2310)では波のパターンが低減され、これはヌクレオソーム構造を破壊し、これにより通常は比較的アクセスできないヌクレオソームDNA内の場所に切断が生じ得る。したがって、CTCF領域の十分に段階的なヌクレオソームでは、WTでのヘパリンの6時間のインキュベーションに伴い、ヌクレオソーム内の断片末端が増加する。したがって、(ヘパリンインキュベーションの結果として)破壊されたヌクレオソーム構造は、ヌクレオソーム内DNAの切断をもたらした。
図23B~23Cは、本開示の実施形態による、WTのヘパリン0時間試料および6時間試料のCTCF領域内の5’末端塩基表現を示す。どの断片タイプが上記のヌクレオソーム内断片に寄与するかを調査した。WTヘパリン6時間において、ヌクレオソーム内位置に対応するT末端断片の周期性が明らかであった(図23C)。また、WTヘパリン0時間(図23B)において、最低約15%(位置0)で平均して約20%を有するT末端断片2330の、30%のピークで位置0において最低20%を有するT末端断片2380への増加があった。これらの結果は合わせて、ヘパリンがDNASE1を強化し、ヌクレオソーム構造を破壊し、T末端選択を有するDNASE1がヌクレオソーム内で切断することを可能にすることを裏付ける。
図24~24Bは、本開示の実施形態による、Dnase1-/-マウスのヘパリン0時間試料および6時間試料のCTCF領域内の5’末端塩基表現を示す。WT(図23B~23C)での周期性およびT末端断片の増加に見られる効果は、Dnase1-/-マウス(図24A~24B)においては存在しなかった。これは、0時間T末端断片2430および6時間T末端断片2480で見られ得る。DNASE1は、マウスにおけるDnase1-/-遺伝性障害により存在しないため、ヘパリンインキュベーションの結果としてヌクレオソームを含まない断片は、T末端でDNASE1によって切断されていない。したがって、周期性は欠損し、6時間T端断片2480の割合は、0時間T端断片2430と比較して減少し、対応してA末端およびG末端が増加する。
図25は、本開示の実施形態による、T末端断片ピークが、ヘパリン6時間において増加した末端密度を有するヌクレオソーム2510間のヌクレオソーム内領域に対応することを示すために重ね合わされた図23Aおよび23Cを示す。線2511は、EDTA 0時間に対応する。線2512は、EDTA 6時間に対応する。線2513は、ヘパリン0時間に対応する。線2514は、ヘパリン6時間に対応する。
リンカー領域は、すでに他の酵素(C/G/A末端)によって切断されており、T切断酵素は、弱い競合相手であるため、リンカー領域は、T末端と比較してC/G末端において依然としてより豊富である。(細胞内のこのヌクレオソーム間切断は、依然としてヌクレオソームの存在によって導かれる)。しかしながら、ヌクレオソームが血漿中にあり、ヘパリンに曝露されると、構造は破壊され、次いで、ヌクレオソーム内領域は、大きなT末端選択を有するヘパリン強化DNASE1によって切断され得る。
図23C中の他の塩基(すなわち、Tではない)は、C末端を作るDNASE1L3がほとんどの時間優位に立つため、ヘパリン(またはEDTA)中でのインキュベーションで明確な周期性を示さない。DNASE1L3はまた、ヌクレオソーム内で切断することもでき、したがって、非常に明確なパターンは観察されない。配列決定深度がより高いほど、他の末端、特にEDTA 6時間におけるA末端において周期パターンが見られ得る可能性があり、図7B中では、それはほんのわずかである。
V.細胞および血漿中のヌクレアーゼの切断選択
上記の観察により、DFFB、DNASE1、およびDNASE1L3についての塩基末端切断選択、ならびにヌクレアーゼが細胞内または血漿などの細胞外環境内で切断する普及度を有するかどうかの決定が可能になる。
図26は、本開示の実施形態による、ヌクレアーゼDFFB、DNASE1、およびDNASE1L3について示される切断選択を有するcfDNA生成および消化のモデルを示す。DFFBは、新鮮なcfDNAを生成し(つまり、細胞内で切断することによって)、切断は、A末端について選択され、A末端濃縮されたcfDNAをもたらす。DNASE1L3は、典型的な末端プロファイルに見られる主にC末端濃縮されたcfDNAを生成する。そのような切断は、細胞内および細胞外で生じる。DNASE1は、ヘパリンおよび内因性プロテアーゼの助けを得て、細胞外環境(例えば、血漿)中でcfDNAをT末端断片にさらに消化することができる。
図26は、細胞内に示されるDFFB(緑色のはさみ2610)およびDNASE1L3(青色のはさみ2620)を有するアポトーシス細胞を示す。説明文は、異なる塩基についての3つのヌクレアーゼを切断する選択順序を示す。DFFBは、細胞内でのみ作用していることが示される。DNASE1L3は、細胞内および血漿中でも作用していることが示される。ヘパリンを有するDNASE1(赤色のはさみ2630)は、血漿中で作用していることが示される。末端塩基での得られた断片が、対応するヌクレアーゼについて異なる色で示される。DNA分子は、細胞内で切断された後により短くなり、次いで、血漿中で切断された後にさらにより短くなる。
異なるマウスモデルにおけるcfDNA断片末端に関する本研究から、cfDNAを生成した断片化プロセスの概要を示すモデルの全貌を明らかにすることができる。EDTA中で全血をインキュベートした後に自発的に作られた新たに放出されたcfDNAの我々の分析において、新鮮でより長いcfDNAが、A末端断片が濃縮されていることを実証した。特に、A<>A、A<>G、およびA<>C断片は、約200bpおよび400bpで強いヌクレオソーム周期性を実証する。この同じ実験モデルがDffb欠損マウスの全血に適用されると、長いA末端断片の濃縮は見られない。したがって、DFFBがこれらのA末端断片の生成に関与している可能性が高いと結論付けることができる。
この仮説は、アポトーシス中のDNA断片化において重要な役割を果たすDFFB酵素について発表された文献によって実証されている(Elmore,S.(2007),Toxicologic pathology 35,495-516、Larsen,B.D.and Sφrensen,C.S.(2017),The FEBS Journal 284,1160-1170)。酵素の特性評価研究は、DFFBが、AおよびGヌクレオチド(プリン)を選択して、開いたヌクレオソーム間DNA領域に鈍い二本鎖切断をもたらすことを示している(Larsen,B.D.and Sφrensen,C.S.(2017),The FEBS Journal 284,1160-1170、Widlak,P.,and Garrard,W.T.(2005),Journal of cellular biochemistry 94,1078-1087、Widlak,P.et al.,(2000),The Journal of biological chemistry 275,8226-8232))。ヌクレオソーム間リンカー領域のみでの鈍い二本鎖切断のこの生物学は、例えば、図16Bによって例示されるように、A<>A、A<>G、およびA<>C断片におけるヌクレオソームパターン形成を説明するであろう。
本研究では、インキュベーション前に取得された血漿中の典型的なcfDNAが、すべての断片サイズにわたって主にCで終わることも実証しており、このC末端の過剰表現は、ゲノム全体にわたって複数の異なる領域で一致している。cfDNAの典型的なプロファイルは、新鮮なcfDNAとは非常に異なるため、1)1つ以上の他のヌクレアーゼ(すなわち、DFFB以外)がこのプロファイルを作ること、2)このヌクレアーゼまたはこれらのヌクレアーゼが典型的なcfDNAにおける切断プロセスで優位に立つこと、および3)このプロセスが、新鮮なA末端断片(例えば、DFFBから)の生成後に主に生じることを推測することができる。
このC末端優位性は、Dnase1l3欠損マウスにおいて失われるため、このC末端断片の過剰発現に関与する1つのヌクレアーゼは、DNASE1L3であると考えられる。DNASE1L3の特定のヌクレオチド切断選択を調査する既存の酵素研究はないが、DNASE1L3は、タンパク質分解の助けなしにほとんど検出できないレベルまで高効率でクロマチンを切断することが知られている(Napirei,M.et al.,(2009),The FEBS Journal 276,1059-1073)、Sisirak,V.et al.(2016),Cell 166,88-101)。すべての断片サイズ間でC末端断片がかなり均一に存在することは、DNASE1L3がすべてのDNA、さらにはヌクレオソーム内DNAを効率的に切断することができることを示唆する。
DNASE1L3は、興味深い特性を有し、これは、小胞体で発現して、主要な血清ヌクレアーゼのうちの1つとして細胞外に分泌され、またアポトーシスが誘導された後、その小胞体を標的とするモチーフが切断されると核に移行する(Errami,Y.et al.(2013),The Journal of biological chemistry 288,3460-3468)、Napirei,M.et al.,(2005),The Biochemical journal 389,355-364))。アポトーシス細胞内エンドヌクレアーゼとしてのその役割において、DNASE1L3は、DNA断片化においてDFFBと協働することが示唆されている(Errami,Y.et al.(2013),The Journal of biological chemistry 288,3460-3468)、Koyama,R.et al.,(2016),Genes to Cells 21,1150-1163))。新鮮なcfDNA(例えば、図16B)の断片末端プロファイルをDnase1l3欠損マウス(例えば、図16A)のものと比較すると、A末端断片、特にA<>C断片において周期性の顕著な減衰がある。この減衰は、WT対Dnase1l3欠損マウスにおけるアポトーシスから新たに断片化されたDNAを生成する最中の、DNASE1L3およびDFFBの共存する細胞内活性によるものと疑われる。
血漿ヌクレアーゼとして、DNASE1L3は、アポトーシス後に食作用を免れた循環中のDNAを消化するのに役立つ。したがって、DNASE1L3は、細胞内断片化が生じた後、断片化されたcfDNAに対して効果を発揮する可能性が高い。二段階プロセスにおいて、第2のステップを阻害すると、第1のステップ(すなわち、細胞内断片化)の通常は一時的な結果が明らかになるはずである。Dnase1l3欠損マウスの血漿は、DNASE1L3作用のこの第2のステップを阻害し、第1のステップのcfDNAプロファイルであるアポトーシスからの細胞内DNA断片化を明らかにする。これはまさに我々が発見したものであり、Dnase113欠損マウスのcfDNA断片プロファイル(例えば、図16A)は、新たに生成されたcfDNAに見られるもの(例えば、図16B)と非常に類似している。したがって、血漿内でのDNASE1L3消化は、典型的な恒常性cfDNAをもたらす後続のステップになる。
Dnase1欠損マウスからのcfDNAのサイズプロファイルが、WTマウスのものと実質的に異なるようには思われなかったことを以前に発見したが(図17A)、DNASE1は、「裸の」DNAの切断を好むことが知られており、インビボでタンパク質分解の助けを得てクロマチンを切断することだけができる(Cheng,T.H.T.et al.,(2018),Clin Chem 64,406-408、Napirei,M.et al.,(2009),The FEBS Journal 276,1059-1073))。ヘパリンを使用してインビボプロテアーゼの機能に取って代わり、DNASE1活性を強化することで、DNASE1が、DNAをT末端断片に切断することを好むことを実証している(図18Aと比較した図18B)。ヘパリンインキュベーションによるT末端断片の増加は、主にサブヌクレオソームサイズ(50~150bp)であり、DNASE1が短い150bp未満の断片の生成において役割を果たすことを示唆する(図18A)。DNASE1が裸のDNAをT末端断片に切断することを好むことが知られているため、典型的なcfDNAプロファイルから、50~150bpおよび250~300bpの範囲のT末端断片ピークが、ほとんど裸であり得ると推測することができる。
ヘパリンインキュベーションおよび末端分析の使用はまた、10bpの周期性の起源への独特の洞察を提供している。すべての断片タイプが10bpの周期性を実証するため(図21A)、短い断片における10bpの周期性に完全に関与する特定のヌクレアーゼはないことを示す。代わりに、すべての断片タイプについて、ヘパリンが使用されると10bpの周期性が破壊されることを実証する(図21B)。DNASE1活性を強化することに加えて、ヘパリンは、図23Aに示されるように、ヌクレオソーム構造を破壊する(Villeponteau,B.(1992),The Biochemical journal 288(Pt3),953-958)。多くの人が、10bpの周期性が無傷のヌクレオソーム構造内のDNAの切断に由来すると仮定しているが、本研究が裏付けとなる証拠を提供し、破壊されたヌクレオソームの存在下では10bpの周期性が生じないことを示すと考えている。
近年、Watanabe et al.は、渡辺らは、Dnase1L3およびDffb欠損マウスにおけるアセトアミノフェンの過剰摂取および抗Fas抗体治療により、インビボ肝細胞壊死およびアポトーシスを誘導した(Watanabe,T.et al.,(2019),Biochemical and biophysical research communications 516,790-795)。Watanabe et al.は、cfDNAがDNASE1L3およびDFFBによって生成されることを示したと主張しているが、彼らのデータは、Dnase1l3およびDffbダブルノックアウトマウスにおける肝細胞損傷後に血清cfDNAが増加しているようには思われないことを示すだけである。その場合でさえ、彼らの方法からの肝細胞損傷の程度は、野生型でも大きく変動し、彼らのアポトーシス抗Fas抗体実験におけるcfDNA量との相関は驚くほど低い。ノックアウトマウスにおいて誘導されるアポトーシスの程度に不確実性を与えるこれらの不一致に加えて、彼らは、本研究で提供された断片末端に関する詳細をなにも有していない。
本研究において、典型的なcfDNA断片が2つの主要なステップ:1)DFFB、細胞内DNASE1L3、および他のアポトーシスヌクレアーゼによる細胞内DNA断片化、ならびに2)血清DNASE1L3による細胞外DNA断片化で作られ得ることを実証している。次いで、おそらくインビボタンパク質分解により、DNASE1は、cfDNAを短いT末端断片にさらに分解することができる(図18Aと18Bとの間のT末端グラフの差を比較する)。この最初のモデルは、cfDNA生成に関与する多くの主要なヌクレアーゼを含んでいたと考えられるが、モデルは、将来さらに改良され得る。例えば、他の潜在的なアポトーシスヌクレアーゼには、エンドヌクレアーゼG、AIF、トポイソメラーゼII、およびシクロフィリンが含まれ、おそらくさらに発見されるであろう(Nagata,S.(2018),Annual review of immunology 36,489-517、Samejima,K.and Earnshaw,W.C.(2005),Nature Reviews:Molecular Cell Biology 6,677-688、Yang,W.(2011),Quarterly reviews of biophysics 44,1-93)。ダブルノックアウトモデルを用いたこれらのヌクレアーゼのさらなる研究は、このモデルをさらに改良し、G末端選択を有するヌクレアーゼを明らかにし得る。本研究において、異なるヌクレアーゼの作用をcfDNA断片末端プロファイルに明確に関連付けている。
ヌクレアーゼ生物学とcfDNA生理学との間のこの関連性が確立されたことで、cfDNAの分野に多くの重要かつ実用的な影響がある。第一に、病理学的結果を伴うヌクレアーゼ生物学の異常は、異常なcfDNAプロファイルに反映され得る(Al-Mayouf et al.(2011),Nat Genet 43,1186-1188、Jimenez-Alcazar,M.et al.(2017),Science(New York,NY)358,1202-1206、Ozcakar,Z.B.et al.,(2013),Arthritis Rheum 65,2183-2189))。第二に、血漿末端モチーフ分析は、cfDNA生物学を調査するための強力なアプローチであり、診断用途があり得る。そして最後に、抗凝固剤のタイプおよび血液分離の時間遅延などの分析前の変数は、エピジェネティック情報および遺伝情報についてcfDNAをマイニングするときに覚えておくべき重要な交絡因子である。そのようなcfDNAプロファイリングの例示的な用途が以下に記載される。
さらに、データはマウスについて提供されているが、そのような生物学的機能は、血液または他の無細胞試料を有するすべての生物に共通している。
VI.ヌクレアーゼの遺伝性障害を検出するための方法
上記のように、様々な技術を使用して、例えばヌクレアーゼに関連する遺伝性障害を検出することができる。遺伝性障害は、特定の遺伝子に対応するヌクレアーゼの変異(例えば、欠失)に関連し得る。そのような変異により、ヌクレアーゼは存在しないか、または不規則に機能する可能性がある。正常/参照cfDNAプロファイル(例えば、断片末端および/またはサイズによる)は、遺伝性障害が存在しない場合に決定され得、新たな試料について比較が行われ得る。正常/参照cfDNAプロファイルは、他の対象から、または同じ対象についてだが、異なる条件(例えば、以前に、または異なるインキュベーション量で採取された試料)で決定され得る。そのような方法の例が以下のフローチャートに示される。1つのフローチャートについて説明される技術は、他のフローチャートにも適用可能であり、簡潔にするために繰り返されない。
A.経時的なインキュベーションを使用した遺伝性障害の検出
試料の異なるインキュベーション量は、遺伝性障害が存在するかどうかに応じて、異なるcfDNAプロファイルをもたらし得る。特定のcfDNAプロファイルの挙動は、特定のヌクレアーゼが適切に発現され、機能しているかどうかに依存し得るため、そのような挙動の正常からの変化は、遺伝性障害が存在することを示し得る。
図27は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法2700を例示するフローチャートを示す。本明細書の方法2700および他の方法は、コンピュータシステムによって制御されることを含めて、コンピュータシステムを用いて全体的または部分的に実施され得る。例として、遺伝子は、ヌクレアーゼをコードすること、その転写のためのエピジェネティックマーカーを有すること、そのRNA転写物が存在すること、可変的にスプライシングされたRNAを有すること、またはそのRNAが可変的に翻訳されることによって、ヌクレアーゼに関連付けられ得る。遺伝性障害は、特定の組織(例えば、腫瘍組織)にのみ存在する可能性がある。したがって、遺伝性障害の検出は、がんのレベルを決定するために使用され得る。
ブロック2710で、第1の配列リードを、対象の第1の生物学的試料中の第1の無細胞DNA断片の配列決定から取得し、受け取る。例示的な生物学的試料、例えば、血液、血漿、血清、尿、および唾液が本明細書に提供される。配列決定は、例えば本明細書に記載されるような様々な方法で実施することができる。例示的な配列決定技術には、超並列配列決定もしくは次世代シーケンシング、単一分子配列決定の使用、および/または二本鎖もしくは一本鎖DNA配列決定ライブラリ調製プロトコルが含まれる。当業者は、使用され得る様々な配列決定技術を理解するであろう。配列決定の一部として、得られた配列リードの一部が細胞核酸に対応し得ることが可能である。
配列決定は、例えば本明細書に記載されるような標的化配列決定であり得る。例えば、生物学的試料は、CTCF領域、TSS領域、Dnase過敏性部位、またはPol II領域などの特定の領域からのDNA断片が濃縮され得る。濃縮は、例えば参照ゲノムによって定義されるように、ゲノムの一部または全体に結合する捕捉プローブを使用することを含み得る。別の例として、濃縮は、プライマーを使用して、ゲノムの特定の領域を増幅することができる(例えば、PCR、ローリングサークル増幅、または多重置換増幅(MDA)を介して)。
第1の生物学的試料は、抗凝固剤で処理され、第1の時間の長さにわたってインキュベートされ得る。インキュベーションは、特定の温度以上、例えば、摂氏5°、10°、15°、20°、25°、または30°を超えることができる。より低温での保管は、インキュベーション時間の一部としてカウントされない場合がある。第1の時間の長さは、ゼロであり得る。他の実装例において、第1の生物学的試料は、抗凝固剤で処理されることなく、第1の時間の長さにわたってインキュベートされる。例として、抗凝固剤は、EDTAまたはヘパリンであり得る。EDTAは、血漿ヌクレアーゼ(例えば、DNASE1およびDNASE1L3)を阻害して、分析用にcfDNAを保存するのに役立ち得る。
ブロック2720で、第1の配列リードを使用して、特定の塩基で終わる第1の無細胞DNA断片の第1の量を決定する。特定の塩基は、対末端配列についてリードの配向(例えば、配列決定された第1の塩基)を使用して決定され得る、断片の末端に対応する第1の配列リードの末端を特定することによって決定され得る。特定の断片末端、例えば、5’末端または3’末端が使用され得る。第1の量は、特定の塩基を含む特定の末端モチーフについて決定され得る。したがって、第1の量は、2つ以上の塩基についてのものであり得る特定の末端配列についてのものであり得る。第1の量は、パラメータ値の一例である。
いくつかの実施形態において、第1の量は、断片の一方の末端に第1の末端モチーフ(例えば、第1の塩基)を有し、断片のもう一方の末端に第2の末端モチーフ(例えば、第2の塩基)を有するDNA断片についてのものであり得る。
いくつかの実装例において、第1の量を決定する前に第1の無細胞DNA断片が濾過され、例えば、特定の領域(例えば、CTCF)からの断片のみが、第1の量を決定するために使用され得る。第1の配列リードは、参照ゲノムにアラインメントされ得る。次いで、参照ゲノムの特定の位置で、または特定の位置から指定された距離で終わる配列リードの第1のセットが特定され得、特定の位置は、参照ゲノムにおける指定された特性を有する特定の座標またはゲノム位置に対応する。次いで、第1の量は、特定の塩基で終わる配列リードの第1のセットの量として決定され得る。ゲノム位置は、CTCF領域の中心であり得る。他の例として、ゲノム位置は、オープンクロマチン領域、Pol II領域、TSS領域、および/または特定の酵素(例えば、特定のDNase)の過敏性部位に関連付けられ得る。
ブロック2730で、対象の第2の生物学的試料中の第2の無細胞DNA断片の配列決定から取得された第2の配列リードを受け取る。第2の生物学的試料は、抗凝固剤で処理され、第1の時間の長さよりも長い第2の時間の長さにわたってインキュベートされ得る。他の実装例において、第2の生物学的試料は、抗凝固剤によって処理されることなくインキュベートされ得る。時間の長さは、温度係数を含むことができ、例えば、より高い温度は、時間の長さを取得するために時間単位を乗算した重み付け係数として機能し得る。このように、より大きい/同じ量の細胞死が、より高い温度でのインキュベーションにより、試料/より短い時間で生じ得る。
ブロック2740で、第2の配列リードを使用して、特定の塩基で終わる第2の無細胞DNA断片の第2の量を決定する。いくつかの実装例において、第1の量および第2の量は、特定の塩基での両端を有する無細胞DNA断片のものである。第2の量はまた、特定の塩基を含む特定の末端モチーフについて決定され得る。したがって、第2の量は、2つ以上の塩基についてのものであり得る特定の末端配列についてのものであり得る。いくつかの実施形態において、第1の量は、断片の一方の末端に第1の末端モチーフ(例えば、第1の塩基)を有し、断片のもう一方の末端に第2の末端モチーフ(例えば、第2の塩基)を有するDNA断片についてのものであり得る。
量は、パーセンテージとして決定され得、本明細書において塩基含有量または頻度とも称される。他の実装例において、量は、測定されたDNA断片の量(例えば、配列リードによって測定される)を使用して直接正規化(例えば、それによって除算)されない生の量であり得る。代わりに、同じサイズの試料を使用することによって、または2つの試料について同じ数のDNA断片を配列決定することによって、間接的な正規化が行われ得る。
量は、DNA断片のサイズに関連し得る。例えば、第1の配列リードを使用して、特定の塩基またはより大きな末端モチーフで終わる第1の無細胞DNA断片の第1のサイズを決定することができる。第1の量は、特定のサイズを有する第1の無細胞DNA断片の第1のセットを使用して決定され得る。第2の配列リードを使用して、特定の塩基またはより大きな末端モチーフで終わる第2の無細胞DNA断片の第2のサイズを決定することができる。第2の量は、特定のサイズを有する第2の無細胞DNA断片の第2のセットを使用して決定され得る。特定のサイズは、サイズ範囲であり得る。サイズの使用例は、図10Bと比較した図10Aならびに他の同様の図に見られ得る。
ブロック2750で、第1の量を第2の量と比較して、遺伝子が対象において遺伝性障害を示すかどうかの分類を決定する。いくつかの実装例において、第1の量を第2の量と比較することは、第1の量が第2の量と少なくとも閾値量だけ異なるかどうかを決定することを含み、統計的に有意な差または他の分離値がある場合、どの量が他よりも大きいかを含み得る。したがって、分類は、第1の量が第2の量の閾値内にあるときに遺伝性障害が存在することであり得る。
いくつかの実施形態において、量の比較は、第1の量と第2の量との間の分離値を決定することを含み得る。分離値を参照値(例えば、カットオフ)と比較して、分類を決定することができる。参照値は、既知の分類を有する較正(参照)試料を使用して決定された較正値であり得、参照値または較正関数を決定するために集合的に分析され得る(例えば、分類が連続変数である場合)。第1の量および第2の量は、参照/較正値と比較され得るパラメータ値の例である。そのような技術は、本明細書のすべての方法に使用され得、さらなる詳細は、他のセクションに提供される。
分類は、例えば、ヌクレアーゼのコード遺伝子が両方の染色体において、一方の染色体においてのみ欠損しているか、特定の組織においてのみ欠損しているか、または変異が発現を低減するが、ヌクレアーゼの存在を排除しないかからの、障害のレベルまたは重症度であり得る。ヌクレアーゼの発現のそのような部分的低減は、変異(例えば、欠失)が特定の組織においてのみ存在する場合、または変異が支持領域内、例えば、ヌクレアーゼの発現レベルに影響を及ぼすmiRNAなどの非コード領域内に存在する場合に生じ得る。参照レベルと比較した差の異なる量の結果としての、遺伝性障害の異なるレベルまたは重症度。複数の参照レベルを使用して、差の分類を決定することができる。
いくつかの例において、第1の量が第2の量の閾値内にある場合、分類は、例えば、図10Bにあるように、遺伝性障害が存在することであり得る。図10Bに示されるように、末端塩基のいずれについても断片の量に有意差はないが、図10Aに示されるWTの場合、塩基のすべてについて有意差がある。様々な実装例において、量が、すべてのサイズについてもしくは特定のサイズのセットについて集計され得るか、または各サイズの差が集計され得る。例えば、WTについての差が約10%であり、Dffb-/-についての差が約1パーセント以内であるため、200塩基でのA末端断片についての閾値量は、約5%であり得る。特定の末端モチーフを有する特定のDNA断片の量に変化がない例は、図8Aと図11Cとの比較においても見られ得、断片の両端が使用され得ることを例示する。特定の末端モチーフを有する特定のDNA断片の量に変化がない別の例は、図12A~12Dおよび13と図4Bおよび4Cとの比較においても見られ得、分析が、特定のタイプの領域内の、およびさらには特定のタイプの領域内の特定の位置でのDNA断片(配列リード)のものであり得ることを例示する。
他の例において、第2の量が第1の量よりも少なくとも閾値だけ少ない場合(例えば、T末端について)、分類は、WTがT末端についてより大きい第2の量を有する場合(図23Bおよび23C)とは対照的に、例えば図24A~24Bにあるように、遺伝性障害が存在することであり得る。他の例において、分類は、WTが、例えば図23Aおよび23Bにあるように、第1および第2の量についてほぼ同じである場合とは対照的に、例えば図24A~24Bにあるように、第2の量がより大きい場合(例えば、A末端について)、遺伝性障害が存在することであり得る。
他の例において、WTおよび変異の両方が、特定の末端モチーフを有するDNA断片の同じ変化(例えば、増加または減少)を引き起こし得るが、変化の量は異なり得る。例えば、図16Aおよび16Bは、Dnase1l3-/-のA<>G断片についてよりも、20bpでのA<>G断片のWTについて大きな増加を示す。
試験されている遺伝性障害のタイプは、cfDNAの挙動が異なるため、障害が存在するかどうかを決定するために使用される基準のタイプを提供することができる。
一例として、遺伝性障害には、遺伝子の欠失が含まれ得る。例として、遺伝子は、DFFB、DNASE1L3、またはDNASE1であり得る。ヌクレアーゼは、細胞内DNAを切断するもの、例えば、DFFBまたはDNASE1L3であり得る。ヌクレアーゼは、細胞外DNAを切断するもの、例えば、DNASE1またはDNASE1L3であり得る。
B.参照値を使用した遺伝性障害の検出
上記のように、異なるインキュベーションを伴う試料間の特定の塩基含有量の差または他の分離値(例えば、小さいか大きいか)を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を分類することができる。あるいは、特定の塩基の測定された量が参照値と比較され得る。そのような参照値は、健康な対象において測定された特定の塩基の量に対応し得る。
例えば、EDTA 0時間の図12A(DFFB欠損)とEDTA 0時間の図2C(WT)との比較は、ランダム領域についてDffb欠損マウスにおけるA末端含有量の減少を示す。したがって、Dffb欠損において測定されたA末端含有量の比較は、WTについての参照値と比較され得、測定された量が統計的に有意な量だけ参照値よりも低い場合、障害が決定される。そのような差は、インキュベーションなしで存在する。CTCF領域(図12B対図2E)、TSS領域(図13A対図3B)、およびPol II領域(図13C対図3D)について同様の差が存在する。G末端含有量の減少はまたは、DFFB欠損の結果として見られる。
別の例が図15に見られ得る。DNASE1L3欠損は、T末端断片およびC末端断片の減少をもたらし、A末端断片およびG末端断片の増加をもたらす。一実装例は、WTについての(例えば、すべてのサイズまたは特定のサイズ範囲のみについての)参照T末端含有量を使用し、測定されたT末端含有量が統計的により低いかどうかを決定することができ、これは、DNASE1L3についての障害の分類を提供する。図16Aは、そのような差のさらなる例を提供し、この場合、量が両端についての例である。図14Bは、別の例を提供する。
図28は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法2800を例示するフローチャートを示す。方法2700に使用されるのと同様の技術が、方法2800で使用され得る。例として、遺伝子は、DNASE1L3、DFFB、またはDNASE1である。
ブロック2810で、対象の第1の生物学的試料中の第1の無細胞DNA断片の配列決定から取得された第1の配列リードを受け取る。配列決定は、例えば本明細書に記載されるような様々な方法で実施することができる。第1の生物学的試料は、抗凝固剤で処理され、例えば、図18Aと比較して図18Bについて記載されるように、少なくとも指定された時間にわたってインキュベートされ得る。ブロック2710に使用されるのと同様の技術が、ブロック2810で使用され得る。
ブロック2820で、第1の配列リードを使用して、特定の塩基で終わる第1の無細胞DNA断片の第1の量を決定する。ブロック2720に使用されるのと同様の技術が、ブロック2820で使用され得る。例えば、特定のサイズの配列リードが、特定の塩基で終わる量を決定するために使用され得る。別の例として、量は、特定の塩基を含む特定の末端モチーフについて決定され得る。
ブロック2830で、第1の量を参照値と比較して、遺伝子が対象において遺伝性障害を示すかどうかの分類を決定する。様々な実施形態において、第1の量を第2の量と比較することは、(1)第1の量が参照値と少なくとも閾値量だけ異なるかどうか、もしくは差が閾値量よりも小さいかどうかを決定すること、(2)第1の量が参照値よりも少なくとも閾値量だけ少ないかどうかを決定すること、または(3)第1の量が参照値よりも少なくとも閾値量だけ大きいかどうかを決定することを含み得る。第1の量は、パラメータ値の一例であり、参照値は、較正値であり得るか、または較正試料の較正値から決定され得る。さらなる詳細が他の方法について提供されるが、方法2800にも同様に適用される。
C.サイズを使用した遺伝性障害の検出
上記のように、特定のサイズの断片を使用して、特定の塩基での配列リードの量を決定することができる。いくつかの実装例において、サイズは、塩基含有量または特定の塩基で終わる断片の他の測定された量の決定なしに使用され得る。そのような例は、抗凝固剤(例えば、ヘパリン)とのインキュベーションを含む、図17Aおよび17Bに示される。遺伝性障害(この場合は様々なレベルのDNASE1欠損)を有する対象は、特定のサイズで異なる頻度のDNA断片を有する。例えば、50~150bpで、WT(参照値)は、Dnase1+/-対象よりも高い頻度を有し、これは、Dnase1-/-対象よりも高い頻度を有する。150~230bpのサイズ範囲において、DNA断片の頻度について反対の関係が存在する。
図29は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法2900を例示するフローチャートを示す。方法2700および2800に使用されるのと同様の技術が、方法2900で使用され得る。
ブロック2910で、対象の第1の生物学的試料中の第1の無細胞DNA断片の配列決定から取得された第1の配列リードを受け取る。生物学的試料は、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされ得る。例として、抗凝固剤は、ヘパリンであり得る。
ブロック2920で、例えば、図17Aおよび17Bに記載されるように、第1の配列リードを使用して、特定のサイズを有する第1の無細胞DNA断片の第1の量を決定することができる。特定のサイズは、範囲であり得る。例えば、サイズ範囲は、サイズカットオフよりも大きいかまたは小さい、例えば、100bp、150bp、または200bpであり得る。他の例として、サイズ範囲は、最小サイズおよび最大サイズ、例えば、50~80、50~100、50~150、100~150、100~200、150~200、150~230、200~300、または300~400塩基、ならびに他の範囲によって指定され得る。サイズ範囲の幅は、例えば50、100、150、または200塩基になるように異なり得る。例として、第1の量は、生のカウントであり得るか、または例えば、分析された配列リードまたはDNA断片の総数を使用して、頻度として正規化され得る。
ブロック2930で、第1の量を参照値と比較して、遺伝子が対象において遺伝性障害を示すかどうかの分類を決定する。分離値は、第1の量と参照値との間で決定され得る。一例において、遺伝子は、DNASE1である。方法2900の分類は、他の方法について記載されるものと同じであり得、例えば、参照レベルと比較した差の異なる量の結果としての、遺伝性障害の異なるレベルまたは重症度の分類である。複数の参照レベルを使用して、差の分類を決定することができる。
第1の量は、パラメータ値の一例である。参照値は、パラメータの所与の測定値についての(例えば、所与の較正値についての)既知の有効性を有する1つ以上の較正試料から決定される較正データ点の一部であり得る。既知の有効性は、後に記載されるように、血液凝固試験を使用して決定され得る。
方法2700~2900の様々な実施形態において、参照値は、遺伝性障害を有しない1つ以上の参照試料から決定され得る、および/または遺伝性障害を有する1つ以上の参照試料から決定され得る。
VII.抗凝固剤の投与量の有効性の決定
一部の人々は、例えば深部静脈血栓症(DVT)のために抗凝固剤で治療され、これは、一部の静脈において血栓をもたらす。一治療法は、ヘパリンである。いくつかの実施形態は、抗凝固剤が作用しているかどうかを決定することができる。例として、ヘパリンの効果は、cfDNA量の増加、および/またはDNASE1活性の上昇、および/または短い断片の増加とともに見られ得る。これは、サイズプロファイル、サイズ中央値のシフト、または特定のサイズ、例えば150bp未満の断片の増加に見られ得る。
A.断片末端の特定の塩基の量を使用した有効性の決定
いくつかの実施形態において、有効性は、断片末端の特定の塩基の量(例えば、塩基含有量)を使用して決定され得る。
図30は、本開示の実施形態による、血液障害を有する対象の治療の有効性を決定するための方法3000を例示するフローチャートを示す。他の方法に使用されるのと同様の技術が、方法3000で使用され得る。
ブロック3010で、対象の血液試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取る。血液試料は、第1の投与量の抗凝固剤を投与された対象の後に取得される。抗凝固剤は、ヘパリンであり得る。方法3000は、第1の投与量の抗凝固剤を対象に投与することを含み得る。
配列リードを受け取る前に、血液試料は、対象から取得され得、血液試料中の無細胞DNA断片の配列決定が実施されて、配列リードを取得することができる。
ブロック3020で、配列リードを使用して、特定の塩基で終わる無細胞DNA断片の量を決定することができる。例として、量は、特定のサイズであってもよいか(例えば、図18Bに示されるように)、または例えば、図7B~7Dに示されるように、指定された特性を有する特定の座標もしくはゲノム位置に(またはそれに隣接して)あってもよい。断片の末端の特定の塩基の量に対する抗凝固剤の効果は、図18Aに見られ得る。例えば、A末端断片の増加は、合計で、および特定のサイズ範囲で予想される。他の方法と同様に、特定の塩基は、例えば、2mer、3merなどのより大きな末端モチーフの一部であり得る。さらに、特定の塩基は、DNA断片の両端にある必要があり得るか、または異なる末端モチーフの特定の対を使用して、DNA断片の特定のセットを選択することができる。
特定の塩基で終わる無細胞DNA断片の量に加えて、cfDNAの総量(すなわち、あらゆる末端についての)は、例えば、後に図32Aに示されるように決定および使用され得る。この方法および他の方法で測定された量は、例えば、試料の特性(例えば、試料の体積もしくは質量)を使用して、または指定された基準を満たす無細胞DNA断片または配列リードの別の量(例えば、試料中のDNA断片の総量、もしくは異なる末端モチーフを有する断片の数)を使用して正規化され得る。
ブロック3030で、量を参照値と比較して、治療の有効性の分類を決定することができる。参照値は、例えば本明細書に記載されるように、様々な方法で決定され得る。例えば、予想量は、必要に応じて応答する患者について決定され得る。量と参照値との間の差の量は、分類を提供することができる。差が十分に小さい(例えば、カットオフ未満である)場合、第1の投与量は、有効であると分類され得る。差がカットオフよりも大きい場合、第1の投与量は、有効ではないと決定され得る。1つ以上の追加のカットオフ値を使用することによって決定され得る、例えば、中程度のまたは大きな無効性など、異なるレベルの無効な投与量があり得る。
量が参照値と一致しない場合(例えば、参照値の指定された範囲内で)、比較に基づいて第2の投与量の抗凝固剤が対象に投与され得、第2の投与量は、第1の投与量よりも大きい。他の例において、例えば、量が参照値を超える場合、第2の投与量は、第1の投与量よりも少なくなり得る。
量は、パラメータ値の一例である。参照値は、パラメータの所与の測定値についての(例えば、所与の較正値についての)既知の有効性を有する1つ以上の較正試料から決定される較正データ点の一部であり得る。既知の有効性は、後に記載されるように、血液凝固試験を使用して決定され得る。さらなる詳細が他の方法およびセクションについて提供されるが、方法3000にも同様に適用される。
一例として、参照値は、抗凝固剤を投与する前に対象において以前に実施された測定に対応し得る。以前の測定からの量の変化は、抗凝固剤の投与量の有効性を示し得る。別の実装例において、参照値は、健康な対象において測定された量に対応し得る。有効な投与量は、量を健康な対象についての参照値の閾値内に導くものであり得る。さらに別の実装例において、参照値は、血液障害を有する対象において測定された量に対応し得る(例えば、抗凝固剤を投与する前に対象において以前に測定され得るか、または血液障害を有する別の対象で測定され得るような)。
B.断片のサイズを使用した有効性の決定
いくつかの実施形態において、有効性は、断片末端のサイズを使用して決定され得る。
図31は、本開示の実施形態による、血液障害を有する対象の治療の有効性を決定するための方法3100を例示するフローチャートを示す。他の方法に使用されるのと同様の技術が、方法3100で使用され得る。
ブロック3110で、対象の血液試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取る。血液試料は、第1の投与量の抗凝固剤を投与された対象の後に取得される。抗凝固剤は、ヘパリンであり得る。方法3100は、第1の投与量の抗凝固剤を対象に投与することを含み得る。
ブロック3120で、配列リードを使用して、特定のサイズを有する無細胞DNA断片の量を決定することができる。ブロック3120は、方法1100のブロック1120と同様の方法で実施され得る。サイズに対する効果は、図17Aおよび17Bに例示されるとおりであり得る。
ブロック3130で、量を参照値と比較して、治療の有効性の分類を決定することができる。参照値は、方法3000に関するものと同様の方法で決定され得る。第1の量は、パラメータ値の一例であり、参照値は、較正値であり得るか、または較正試料の較正値から決定され得る。さらなる詳細が他の方法について提供されるが、方法3100にも同様に適用される。
量が参照値と一致しない場合(例えば、参照値の指定された範囲内で)、比較に基づいて第2の投与量の抗凝固剤が対象に投与され得、第2の投与量は、第1の投与量よりも大きい。他の例において、例えば、量が参照値を超える場合、第2の投与量は、第1の投与量よりも少なくなり得る。
C.結果
図32Aは、本開示の実施形態による、ヘパリンで治療された4つの症例についての表3200を示す。各列は、異なる患者に対応する。1行目は、4人の患者の各々の止血障害を特定する。ITPは、免疫性血小板減少性紫斑病:出血傾向につながる血小板の免疫介在性破壊である。DVTは、深部静脈血栓症である。ATIIIは、アンチトロンビンIII欠損症:凝固カスケードにアンチトロンビンIIIがなく、トロンビン、第IXa因子、第Xa因子などの阻害がなく、血栓(血餅形成)傾向(すなわち、DVT)につながることである。Seq4は、ヘパリンの投与以外の不明な臨床例の詳細を有する。
2行目は、血漿試料中のcfDNAの濃度を測定するために使用する方法を列挙する。3行目は、GE/mlでの無細胞DNAの濃度を示す。4行目は、抗凝固剤で治療されておらず、血液障害を有しない3,844個の参照試料から決定された参照値を示す。5行目および6行目は、2行目の測定値と3行目の参照値との差を示す。示されるように、大幅な増加がある。最後の行は、無細胞DNA量についての平均からの有意な偏差を示し、これは、ヘパリンの投与量が無細胞DNAの量に影響を及ぼしており、大幅な増加をもたらすことを示す。
5行目および6行目に示されるように、ヘパリンが凝固を予防する働きをするにつれて、無細胞DNAの量は、大幅に増加する。したがって、DNAの総量を使用して投与量の有効性を決定することができる。以下に記載されるように、cfDNAの絶対減少または倍率減少を決定し、目標と比較して、現在の用量の有効性を決定すること、および/または投与量をどれだけ増加もしくは減少させるべきかを決定することができる。パラメータが高すぎる場合、目標を達成するために投与量を減少させることができる。
図32B~32Cは、本開示の実施形態による、ヘパリンで治療されたDVT患者の異なる時間に採取された2つの試料についてのデータを示す。異なる時間は、妊娠の週および日によって指定される。図32B~32Cは、参照に対する対象の相対的な頻度対サイズのプロットを示す。図32B~32Cに見られるように、対象のサイズ分布は、図17Aと一致して、ヘパリンの効果を示すようにより小さなサイズにシフトした。他の実施形態は、ワーファリンまたは第Xa因子阻害剤などの他の抗凝固剤を使用することができる(例えば、心房細動のために)。
血液凝固試験を、特定の投与量の抗凝固剤を用いた各対象についての較正データとして使用して、量またはサイズのどの変化が量/サイズの有効な変化と相関するかを特定することができる。例えば、抗凝固剤を投与された患者(例えば、DVT患者)の群で行われた相関研究は、cfDNAの総量の倍率変化、特定の末端モチーフを有する量の変化、またはサイズプロファイルの変化を決定することができ、DVT血餅のクリアランスの最適速度をもたらし得る。測定された変化(絶対または倍率)は、目標のまたは測定された特性(例えば、クリアランスのための最適速度)に対応する較正値に対応し得る。量/サイズについてのこの値または値の範囲は、療法を監視するために治療のための目標になり得る。対象の血液をインビトロで凝固させてもよく、次いで、抗凝固剤が有効である用量について、抗凝固剤をインビトロで滴定することができる。cfDNAの量/サイズは、血餅が溶解した後に試料中で測定され得、これらの値または値の範囲は、対象についての治療目標になり得る。例えば、凝固試験は、対象が適切な量で凝固していることを特定することができ、対応する量/サイズは、現在の投与量の有効性を分類するために使用され得る参照(較正)値として使用され得る。
有効な変化を達成するために、投与量は、個人ごとに異なり得、これは、そのような技術が、得られた変化の測定を可能にするために有利であり得る理由である。断片のサイズまたは量のそのような変化は、すべての人が同じ用量に対して同じように反応することを単に予想することとは対照的に、体内の実際の効果を測定することができる。
VIII.ヌクレアーゼの活性の監視
いくつかの実施形態を使用して、ヌクレアーゼ、例えば、DFFB、DNASE1、およびDNASE1L3の活性を監視することができる。そのような活性は、内部ヌクレアーゼから(すなわち、身体の自然なプロセスとして)、および/またはヌクレアーゼ、例えば、DNASE1を添加した結果からのものであり得る。そのような監視を使用して、治療の有効性について遺伝性障害の変化を決定することができる。例えば、DNASE1を使用して対象を治療することができる。処理の効果は、T末端断片のパーセンテージまたはサイズを分析することによって測定され得る。いくつかの実施形態において、DNASE1(例えば、外因的に添加された)を使用して、SLEなどの自己免疫状態を治療することができる。活性の決定に応じて、ヌクレアーゼの治療の投与量が変更され得る。
異常なヌクレアーゼ活性(例えば、正常/健康な値に対応する参照値よりも上または下)の決定は、単独で、または他の要因と組み合わせて、病理のレベルを示すことができる。病理は、がんであり得る。
A.試料にDNASE1を添加する効果
図33は、本開示の実施形態による、異なる投与量のDNASE1についての異なる末端の含有率対断片のサイズのプロットを示す。塩基含有率は、右側の縦軸にあり、横軸は、bpごとのサイズである。緑色の線3311は、A末端断片の頻度に対応する。赤色の線3312は、T末端断片の頻度に対応する。青色の線3313は、C末端断片の頻度に対応する。灰色の線3314は、G末端断片の頻度に対応する。DNASE1をインビトロで投与した。
図33はまた、本開示の実施形態による、すべての断片のサイズについての頻度プロットを示す。頻度は、左側の縦軸にある。黄色の線3305は、すべての断片のサイズに対応する。GE/mlの濃度は、各試料について提供される。プロットは、DNASE1を投与する1U/ml(mlごとの単位)、10U/ml、および20U/mlの3つの異なる用量についてのものであり、これは、対象から血漿を取得した後、試料にインビトロで添加された。
T末端断片3312は、DNASE1用量とともに増加する。示されるように、赤色の線3312は、投与量が高くなるにつれて左から右に増加する。ヌクレアーゼ活性に対する塩基含有量(合計またはサイズ当たり)のこの依存は、特定の活性を有するものとしての試験試料の分類を可能にすることができる。T末端の総量、または特定のサイズもしくはサイズ範囲の特定の量が使用され得る。本開示の他の箇所に記載され、ヌクレアーゼ活性に依存する特徴のいずれか(例えば、特定のサイズまたはすべての断片サイズにわたる他の塩基の含有量)を使用して、例えば、既知の分類を有する他の試料において決定された参照値を使用して、ヌクレアーゼ活性を測定することができる。
サイズプロファイル3305はまた、DNASE1活性を反映することができる。例えば、より小さなDNA断片の増加は、DNASE1活性の上昇を示し得る。図の左から右への進行に見られるように、DNASE1の投与量が高くなるにつれて、より小さなDNA断片の数が増加し、より多くの小さなDNA断片は、20U/mlの最高用量を有する。
これらのプロットのいずれかからのデータのいずれかが、参照値として使用され得るか、または参照値と比較され得る。例えば、特定のサイズ範囲(特定のサイズを含む)でのDNA断片の頻度は、用量の各々について決定され得る。次いで、新しい試料についての測定値をこれらの各参照値と比較して、試験試料中の相対活性量を決定することができる。ヌクレアーゼ活性のそのような分類は、定性的(例えば、低、中、もしくは高)または定量的(特定の数値)であり得る。これらの試料は、既知の活性に対応しているため、試験試料中の活性を決定するための較正値としての役割を果たすことができる。必要に応じて、内挿または回帰を使用して、試験試料中の測定値についての特定の活性を推定することができる。
図34Aは、本開示の実施形態による、未処理およびEDTA処理(9時間および6時間)と比較した、DNASE1で処理された血清についてのサイズプロファイルを示す。より多くのDNASE1を添加するほど、より小さなDNA断片へのシフトが大きくなる。これはまた、図33と一致して、ヌクレアーゼ活性に対するサイズの依存を示す。図34Bは、血漿中の同様の効果を示す。図34Aおよび34Bに示されるように、普通血漿は、普通(抗凝固剤を含まない)ファルコンチューブに入れられ、4℃で直ちに分離された血液である。対照的に、抗凝固剤を含まないファルコンチューブで1時間以上凝固させた血清試料。
図35は、本開示の実施形態による、6時間後の血清に対する異なる用量のDNASE1の効果を示す。説明文において、「untx‘d」は「未処理」に対応する。サイズに対する効果は、サイズプロファイルのより小さなDNA断片へのさらに顕著なシフトを示す。図35は、インキュベーションがある場合にサイズへの依存が存在することを示す。インキュベーションなし(0時間)よりも効果が大きいため、各試料から取得された参照値の差は、より大きくなり得、それによって既知の分類を有する試料についての参照値の差がより大きくなるため、より高い分類(区別)の精度を可能にする。
B.尿中のDNASE1活性
他の無細胞試料は、本明細書に記載の方法のいずれかに使用され得る。一例として、尿が使用され得る。血漿中のヌクレアーゼの量は、血液とは異なり得、サイズを含む異なるcfDNAプロファイルをもたらす。
図36は、本開示の実施形態による、尿試料中の頻度対サイズおよび塩基含有量対サイズを示す。DNASE1がT末端を切断しなければならないという選択の結果として、T末端が最も高い。血液と比較して尿中のT普及度が高いことは、血液中よりも尿中のDNASE1の相対活性が高いことを示す。
図37は、異なる組織についてのDNASE1発現を示す。腎臓発現は、血球と比較して比較的高い。腎臓細胞のより高い発現は、尿中に現れる。これは、DNASE1活性およびT末端頻度の相関関係を例示する。
C.断片末端の特定の塩基の量を使用した監視
したがって、いくつかの実施形態は、末端に特定の塩基を有するDNA断片の量を使用して、ヌクレアーゼ活性を監視することができる。本明細書の様々な図は、1人以上の対象の試料を使用したそのような監視についての例示的なデータを示す。
図38は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼの活性を監視するための方法3800を例示するフローチャートである。方法3800の態様は、本明細書に記載の他の方法と同様の方法で実施され得る。
ブロック3810で、配列リードを受け取る。配列リードは、対象の生物学的試料中の無細胞DNA断片の配列決定から取得され得る。
ブロック3820で、特定の塩基で終わる無細胞DNA断片の量を、配列リードを使用して決定する。他の方法と同様に、特定の塩基は、例えば、2mer、3merなどのより大きな末端モチーフの一部であり得る。さらに、特定の塩基は、DNA断片の両端にある必要があり得るか、または異なる末端モチーフの特定の対を使用して、DNA断片の特定のセットを選択することができる。
量は、パラメータ値の一例である。この方法および他の方法で測定された量は、例えば、試料の特性(例えば、試料の体積もしくは質量)を使用して、または指定された基準を満たす無細胞DNA断片または配列リードの別の量(例えば、試料中のDNA断片の総量、もしくは異なる末端モチーフを有する断片の数)を使用して正規化され得る。そのような正規化は、本明細書に記載の量(パラメータ)のいずれかについて実施され得る。
ブロック3830で、量を参照値と比較して、ヌクレアーゼの活性の分類を決定する。いくつかの実施形態において、活性が参照値を下回る場合、対象は、障害を有すると分類され得る。そのような場合、対象は、例えば本明細書に記載されるように治療され得る。分類は、数分類値であり得、これをカットオフと比較して、ヌクレアーゼに関連する遺伝子が対象において遺伝性障害を示すかどうかの第2の分類を決定することができる。
参照値は、既知の分類を有する較正(参照)試料を使用して決定された較正値であり得、参照値または較正関数を決定するために集合的に分析され得る(例えば、分類が連続変数である場合)。例えば、ヌクレアーゼ活性は、連続変数であり得、量と参照値との比較は、例えば、本明細書に記載されるように、量を較正関数に入力することによって決定され得る。
D.断片のサイズを使用した監視
実施形態はまた、特定のサイズ値を含む特定のサイズ範囲のDNA断片の量を使用したヌクレアーゼ活性の監視を提供することができる。本明細書の様々な図は、1人以上の対象の試料を使用したそのような監視についての例示的なデータを示す。
図39は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼの活性を監視するための方法を例示するフローチャートである。方法3800の態様は、本明細書に記載の他の方法と同様の方法で実施され得る。
ブロック3910で、配列リードを受け取る。配列リードは、対象の生物学的試料中の無細胞DNA断片の配列決定から取得され得る。生物学的試料は、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされ得る。
ブロック3920で、特定のサイズを有する無細胞DNA断片の量を、配列リードを使用して決定する。他の方法と同様に、特定の塩基は、例えば、2mer、3merなどのより大きな末端モチーフの一部であり得る。さらに、特定の塩基は、DNA断片の両端にある必要があり得るか、または異なる末端モチーフの特定の対を使用して、DNA断片の特定のセットを選択することができる。量は、パラメータ値の一例である。
ブロック3930で、量を参照値と比較して、ヌクレアーゼの活性の分類を決定する。いくつかの実施形態において、活性が参照値を下回る場合、対象は、障害を有すると分類され得る。そのような場合、対象は、例えば本明細書に記載されるように治療され得る。
特定の塩基の量またはサイズの使用に関係なく、参照値は、ヌクレアーゼの活性の第1の分類を有する較正試料から決定され得る。量が参照値と同様である場合、生物学的試料(およびそれが取得された対象)は、ヌクレアーゼ活性についての第1の分類を有すると特定され得る。例として、第1の分類は、正常、増加、または減少であり得る。
様々な実施形態において、量を参照値と比較することは、量が参照値と少なくとも閾値量だけ異なるかどうかを決定すること含み得る。量を参照値と比較することは、量が参照値よりも少なくとも閾値量だけ少ないかどうかを決定することを含む。量を参照値と比較することは、量が参照値よりも少なくとも閾値量だけ大きいかどうかを決定することを含む。
例として、ヌクレアーゼは、DFFB、DNASE1L3、またはDNASE1であり得る。生物学的試料は、ヌクレアーゼで処理された対象から取得され得る。この方法は、量と参照値との比較に基づいて治療の有効性の分類を決定することをさらに含み得る。
IX.分類の較正
本明細書に記載されるように、参照値は、既知の分類を有する1つ以上の参照(較正)試料を使用して決定され得る。例えば、参照試料は、健康であることが知られ得るか、または遺伝性障害を有することが知られ得る。他の例として、参照/較正試料は、所与の較正値(例えば、本明細書に記載の量のいずれかを含むパラメータ)について、既知のまたは測定されたヌクレアーゼ活性または有効性値を有することができる。
1つ以上の較正値は、1つ以上の参照値であり得るか、または参照値を決定するために使用され得る。参照値は、分類についての特定の数値に対応することができる。例えば、較正データ点(較正値、およびヌクレアーゼ活性または有効性のレベルなどの測定された特性)を、補間または回帰を介して分析して、較正関数(例えば、線形関数)を決定することができる。次いで、較正関数の点を使用して、測定された量または他のパラメータ(例えば、2つの量間、もしくは測定された量と参照値との間の分離値)の入力に基づいて、入力としての数値分類を決定することができる。そのような技術は、本明細書に記載の方法のいずれにも適用され得る。
方法3000および3100の例では、参照値は、治療の有効性についての既知のまたは測定された分類を有する、1つ以上の参照試料を使用して決定され得る。1つ以上の参照試料についての治療の有効性は、1つ以上の参照試料に対して凝固試験を実施することによって測定され得る。対応する量(例えば、ブロック3020または3120の量)は、1つ以上の参照試料で測定され得、それによって参照/較正試料についての2つの測定値を含む較正データ点を提供する。1つ以上の参照試料は、複数の参照試料であり得る。複数の参照試料の測定された有効性および測定された量に対応する較正データ点を、例えば、補間または回帰によって近似する較正関数が決定され得る。
方法3800および3900の例では、参照値は、ヌクレアーゼの活性についての既知のまたは測定された分類を有する、1つ以上の参照試料を使用して決定され得る。1つ以上の参照試料についてのヌクレアーゼの活性は、本明細書に記載されるように、例えば、cfDNA量の蛍光測定または分光光度測定で測定され得、これは、それ自体で、またはヌクレアーゼ含有試料の添加の前、後、および/またはそれとリアルタイムで行われ得る。別の例は、放射状酵素拡散法を使用することである。対応する量(例えば、ブロック3820または3920の量)は、1つ以上の参照試料で測定され得、それによって参照/較正試料についての2つの測定値を含む較正データ点を提供する。1つ以上の参照試料は、複数の参照試料であり得る。複数の参照試料の測定された活性および測定された量に対応する較正データ点を、例えば、補間または回帰によって近似する較正関数が決定され得る。
X.治療
実施形態は、対象についての分類を決定した後、患者における遺伝性障害または低いヌクレアーゼ活性(例えば、閾値よりも低い)を治療することをさらに含み得る。治療後の対象についての分類は、cfDNA末端プロファイルを強化するために、インビボまたはインビトロで抗凝固剤を添加することを伴う場合と伴わない場合がある。さらに、現在の投与量が低い有効性を有する場合、治療は、現在の治療(例えば、抗凝固剤)の代替として決定され得、例えば、投与量の増加または異なる抗凝固剤が使用され得る。治療は、決定された障害のレベル、任意の特定された変異、および/または起源の組織に従って提供され得る。例えば、(例えば、多型実装例の)特定された変異は、特定の薬物または化学療法によって標的化され得る。起源の組織を使用して、手術または任意の他の形態の治療を誘導することができる。そして、障害のレベルを使用して、任意のタイプの治療についてどれほど積極的にするかを決定することができ、任意のタイプの治療もまた、障害のレベルに基づいても決定され得る。障害(例えば、がん)は、化学療法、薬物、食事療法、療法、および/または手術によって治療され得る。いくつかの実施形態において、パラメータの値(例えば、量またはサイズ)が参照値を超えるほど、治療は、より積極的になり得る。
治療には、経尿道的膀胱腫瘍切除術(TURBT)が含まれ得る。この手順は、診断、病期分類、および治療に使用される。TURBT中、外科医は、膀胱鏡を尿道から膀胱に挿入する。次いで、小型ワイヤーループ、レーザー、または高エネルギー電気を備えたツールを使用して、腫瘍が切除される。NMIBCを有する患者の場合、がんの治療または除去のためにTURBTが使用され得る。別の治療には、根治的膀胱切除術およびリンパ節郭清が含まれ得る。根治的膀胱切除術は、膀胱全体、ならびに場合によっては周囲の組織および臓器の除去である。
治療には、化学療法が含まれ得、これは、通常がん細胞の成長および分裂を防ぐことによって、がん細胞を破壊するための薬物の使用である。薬物には、例えば、膀胱内化学療法のためのマイトマイシン-C(ジェネリック医薬品として入手可能)、ゲムシタビン(Gemzar)、およびチオテパ(Tepadina)が含まれ得るが、これらに限定されない。全身化学療法には、例えば、シスプラチンゲムシタビン、メトトレキサート(Rheumatrex、Trexall)、ビンブラスチン(Velban)、ドキソルビシン、およびシスプラチンが含まれ得るが、これらに限定されない。
いくつかの実施形態において、治療には、免疫療法が含まれ得る。免疫療法には、PD-1と呼ばれるタンパク質をブロックする免疫チェックポイント阻害剤が含まれ得る。阻害剤には、アテゾリズマブ(Tecentriq)、ニボルマブ(Opdivo)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、およびペムブロリズマブ(Keytruda)が含まれ得るが、これらに限定されない。
治療の実施形態はまた、標的療法を含み得る。標的療法は、がんの成長および生存に寄与するがんの特定の遺伝子および/またはタンパク質を標的とする治療である。例えば、エルダフィチニブは、がん細胞の成長または拡散を続けているFGFR3またはFGFR2遺伝子変異を伴う局所進行性または転移性尿路上皮がんを有する人々を治療するために承認された、経口投与される薬物である。
一部の治療法には、放射線療法が含まれ得る。放射線療法は、がん細胞を破壊するために高エネルギーX線または他の粒子を使用することである。各個々の治療に加えて、本明細書に記載のこれらの治療の組み合わせが使用され得る。いくつかの実施形態において、パラメータの値が閾値を超え、閾値自体が参照値を超える場合、治療の組み合わせが使用され得る。参考文献における治療に関する情報は、参照により本明細書に組み込まれる。
XI.実験モデルおよび対象の詳細
A.マウス
Dnase1l3-/-マウスについての血漿DNAデータを、European Genome-phenome Archive(EGA;アクセッション番号EGAS00001003174)(Serpas,L.et al.(2019),Proceedings of the National Academy of Sciences 116,641-649)から読み出した。Dnase1の標的対立遺伝子[Dnase1tm1.1(KOMP)Vlcg]を担持するマウス、およびDffbの標的対立遺伝子[DffbC57BL/6N-Dffbem1Wtsi]を担持するマウス(両方ともB6バックグラウンドの)を、Knockout Mouse Project Repository of the University of California at Davisから取得した。詳細については、「Key Resources Table」を参照されたい。マウスを、Laboratory Animal Center of The Chinese University of Hong Kong(CUHK)で維持した。すべての実験手順は、Animal Experimentation Ethics committee of CUHKによって承認され、National Institutes of Healthによって作成された「Guide for the Care and Use of Laboratory Animals」(第8版、2011年)に準拠して実施された。13~17週齢の雄および雌のマウスを実験に使用した。血液試料がプールされたため、結果に対する雌雄および性別の影響に関する分析を行わなかった。
B.マウス試料収集
心臓穿刺によってマウスを屠殺し、放血させた。各マウスからの血液をプールし、すぐに実験条件に均等に分配した:0時間のインキュベーションのEDTA、および6時間のインキュベーションのEDTA、または0時間のインキュベーションのヘパリン、および6時間のインキュベーションのヘパリン。Dffb-/-実験について、合計14匹のWTマウスおよび14匹のDffb-/-マウスを使用して、5つの血液プールを作り、各々は、2~4匹のマウスからの血液を含有した。Dnase1-/-実験について、合計12匹のWTマウス、12匹のDnase1+/-マウス、および11匹のDnase1-/-マウスから、各遺伝子座について1つのプールを作った。EDTAチューブは、商業的に購入した1.3mL K3Eマイクロチューブ(Sarstedt)であった。ヘパリンチューブは、血液1ml当たり18IUのヘパリン(Sigma-Aldrich)が添加された2mLのマイクロ遠心チューブであった。インキュベーションは、ロッカー上で室温(12~20℃)において行った。
室温(RT)インキュベーション時間が完了した後、血液試料を二重遠心分離プロトコル(4℃で10分間1,600×g、次いで4℃で10分間16,000×gでの血漿の再遠心分離)によって分離した(Chiu,R.W.K.et al.,(2001),Clinical Chemistry 47,1607-1613)。得られた血漿を収集し、各条件および時点で0.4~1.5mLの血漿を得た。
C.血漿DNA抽出およびライブラリ調製
血漿DNAを、QIAamp Circulating Nucleic Acid Kit(Qiagen)を用いて、製造業者のプロトコルに従って抽出した。インデックス付き血漿DNAライブラリを、TruSeq DNA Nano Library Prep Kitを使用して、製造業者の指示に従って構築した。アダプターを連結したDNAを、8サイクルのPCRで濃縮し、品質管理およびゲルベースのサイズ決定について、High Sensitivity D1000 ScreenTape System(Agilent Technologies)を使用して、Agilent 4200 TapeStation(Agilent Technologies)上で分析した。ライブラリを、配列決定前にQubit dsDNA高感度アッセイキット(Thermo Fisher Scientific)によって定量化した。
D.DNA配列決定およびアラインメント
多重化DNAライブラリを、NextSeq 500プラットフォーム(Illumina)上で、2×75bp対末端リードについて配列決定した。配列を、6塩基インデックス配列に基づいて、対応する試料に割り当てた。Short Oligonucleotide Alignment Program 2(SOAP2)を使用して、マウス血漿からの対末端リードを参照マウスゲノム(NCBI build 37/UCSC mm9;非リピートマスク)にアラインメントした(Li,R.et al.,(2009),Bioinformatics 25,1966-1967)。最大2つのヌクレオチドのミスマッチが許容された。正しい配向の、600bp未満の挿入サイズに及ぶ同じ染色体にアラインメントされた対末端リードのみを、下流サイズ分析のために保持した。同じ開始および終了ゲノム座標を共有する対末端リードは、PCR重複とみなされ、下流分析から破棄された。
図40は、本開示の実施形態による、各条件について取得された非重複断片の数を要約する。アラインメントされた末端のゲノム座標を使用して、配列決定されたcfDNAの断片全体のサイズを推定した。Dnase1およびDffb遺伝子の欠失は、それぞれ、Dnase1-/-およびDffb-/-マウスデータにおけるアラインメント後に観察された。
図41A~41Bは、WT(青色)、Dnase1-/-マウス(A、赤色)、およびDffb-/-マウス(プール1~5)(B、赤色)の血漿についての配列リード範囲を示す。ノックアウト領域を黄色で強調する。図41Aは、両方のコピーについてのDnase1遺伝子における欠失を示す(Dnase1-/-)。WTは、1行目にあり、Dnase1遺伝子についての領域にアラインメントする配列リードの標準のカウントを示す。2行目は、欠失を有する試料についての配列リードの欠如を示す。図41Bは、両方のコピーにおけるDffb遺伝子についての欠失を示す。Dffb遺伝子についての領域内のリードカウントの欠如は、縦棒によって示される。
E.塩基末端分析および断片タイプ分析
CTCFおよびPol II領域を、マウスENCODEプロジェクトからダウンロードした(Shen,Y.et al.(2012),Nature 488,116-120)。参照マウスゲノムUCSC mm9におけるすべての遺伝子の転写開始部位(TSS)を、UCSCからダウンロードした。10,000bpの長さの10,000個のランダムな非重複領域を、BEDTools(v2.27.1)によってゲノム全体にわたってランダムに選択した(Quinlan,A.R.and Hall,I.M.(2010),Bioinformatics 26,841-842)。±500bpのウィンドウサイズを使用した。末端ド密度分析について、CTCF領域の±1500bpのウィンドウの末端密度を、±3000bpのCTCF領域内の末端カウント中央値によって正規化した。
ランダム、CTCF、およびPol II領域について、ワトソン鎖の方向に配向したcfDNA断片のみを分析に使用した。TSS領域について、TSS領域と同じ方向に配向したcfDNA断片のみを使用した。これらの領域内の各位置で、5‘末端の第1のヌクレオチドを各断片について特定し、塩基末端のパーセンテージを計算した(例えば、A末端断片/すべての断片であり、すべての断片は、A末端、G末端、C末端、およびT断片を含む)。断片サイズによって塩基末端のパーセンテージを分析するために、cfDNA断片の両方の5’末端(それぞれのワトソン鎖またはクリック鎖上)を、断片ごとにカウントし、各サイズでの塩基末端のパーセンテージを計算した。
断片タイプ分析について、各断片を、2つの末端ヌクレオチドに基づいて断片タイプに割り当てた。両端が特定されたこれらの断片を、それらの末端ヌクレオチドおよびその間の記号<>で示し、これによりAとしての両端を有する断片は、A<>Aとして指定される。すべての断片は、A<>A、A<>G、A<>C、A<>T、C<>C、C<>G、C<>T、G<>G、G<>T、T<>T断片を含む。各断片タイプのパーセンテージを計算した(例えば、A<>A断片パーセント=A<>A断片/すべての断片)。
F.cfDNA定量化
ヘパリンは、Qubit dsDNA高感度アッセイ(ThermoFisher Scientific)で有意な正の干渉を有することがわかった(データは図示せず)。代わりに、Bio-Rad QX200 Droplet Digital PCR(ddPCR)プラットフォームをすべてのcfDNA定量化に使用し、これは、DNA標的分子のヘパリン干渉が、ddPCRの反応分割によって改善され得るためである(Dingle,T.C.et al.,(2013),Clin Chem 59,1670-1672)。ヘパリン試料を5倍に希釈し、試料当たり少なくとも4つのウェルを作った。マウスcfDNAを、トランスフェリン受容体遺伝子(Tfrc)を標的とするマウスTaqManコピー数参照アッセイ(ThermoFisher Scientific)によって定量化した。
G.定量化および統計分析
分析を、PythonおよびR言語で記述された特注のプログラムを使用して実施した。統計的差異を、特に指定がない限り、マン・ホイットニーのU検定を使用して計算した。0.05未満のP値を統計的に有意なものとみなし、全ての確率は、両側検定であった。
XII.例示的なシステム
図42は、本開示の実施形態による、測定システム4200を例示する。示されるようなシステムは、アッセイデバイス4210内に無細胞DNA分子などの試料4205を含み、アッセイ4208は、試料4205に対して実施され得る。例えば、試料4205をアッセイ4208の試薬と接触させて、物理的特性4215の信号を提供することができる。アッセイデバイスの一例は、アッセイのプローブおよび/もしくはプライマー、または液滴が(アッセイを含む液滴とともに)移動するチューブを含む、フローセルであり得る。試料からの物理的特性4215(例えば、蛍光強度、電圧、または電流)は、検出器4220によって検出される。検出器4220は、データ信号を構成するデータ点を取得するために、間隔をおいて(例えば、周期的な間隔)測定し得る。一実施形態において、アナログ-デジタル変換器は、検出器からのアナログ信号をデジタル形態へと複数回変換する。アッセイデバイス4210および検出器4220は、アッセイシステム、例えば、本明細書に記載の実施形態に従って配列決定を実施する配列決定システムを形成し得る。データ信号4225は、検出器4220から論理システム4230へ送信される。一例として、データ信号4225を使用して、DNA分子の参照ゲノムにおける配列および/または位置を決定することができる。データ信号4225は、同時に行われる様々な測定、例えば、試料4205の異なる分子について異なる色の蛍光染料または異なる電気信号を含むことができ、したがって、データ信号4225は、複数の信号に対応することができる。データ信号4225は、ローカルメモリ4235、外部メモリ4240、または記憶デバイス4245に保存され得る。
論理システム4230は、コンピュータシステム、ASIC、マイクロプロセッサなどであり得るか、またはそれらを含み得る。それはまた、ディスプレイ(例えば、モニタ、LEDディスプレイなど)、およびユーザ入力デバイス(例えば、マウス、キーボード、ボタンなど)を含み得るか、またはそれらに連結され得る。論理システム4230および他の構成要素は、スタンドアローンもしくはネットワーク接続されたコンピュータシステムの一部であり得るか、または検出器4220および/またはアッセイデバイス4210を含むデバイス(例えば、配列決定デバイス)に直接取り付けられ得るか、もしくは組み込まれ得る。論理システム4230はまた、プロセッサ4250において実行するソフトウェアを含み得る。論理システム4230は、本明細書に説明される方法のいずれかを実施するようにシステム4200を制御するための命令を保存するコンピュータ可読媒体を含み得る。例えば、論理システム4230は、配列決定または他の物理的操作が実施されるように、アッセイデバイス4210を含むシステムにコマンドを提供し得る。そのような物理的操作は、特定の順序で、例えば、試薬が特定の順序で追加および除去されるように、実施され得る。そのような物理的操作は、試料を取得してアッセイを実施するために使用され得るように、例えば、ロボットアームを含む、ロボットシステムによって実施され得る。
測定システム4200はまた、対象に治療を提供することができる治療デバイス4260を含み得る。治療デバイス4260は、治療を決定し得る、および/または治療を実施するために使用され得る。そのような治療の例には、手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、および幹細胞移植が含まれ得る。論理システム4230は、例えば、本明細書に記載の方法の結果を提供するために、治療デバイス4260に接続され得る。治療デバイスは、画像化デバイスおよびユーザ入力などの他のデバイスからの入力を受け取り得る(例えば、ロボットシステムの制御など、治療を制御するために)。
本明細書で言及されるコンピュータシステムのうちのいずれも、任意の好適な数のサブシステムを利用し得る。コンピュータシステム10においてそのようなサブシステムの例を図43に示す。いくつかの実施形態において、コンピュータシステムは、単一のコンピュータ装置を含み、サブシステムは、コンピュータ装置の構成要素であり得る。他の実施形態において、コンピュータシステムは、各々がサブシステムであり、内部構成要素を備える、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップコンピュータおよびラップトップコンピュータ、タブレット、携帯電話、ならびに他の携帯デバイスを含み得る。
図43に示されるサブシステムは、システムバス75を介して相互接続されている。プリンタ74、キーボード78、記憶デバイス79、ディスプレイアダプター82に接続されたモニタ76(例えば、LEDなどのディスプレイスクリーン)、およびその他などの追加のサブシステムが示されている。I/Oコントローラ71に結合する周辺機器および入力/出力(I/O)デバイスは、入力/出力(I/O)ポート77(例えば、USB、FireWire(登録商標))などの当技術分野において既知の任意の数の手段によって、コンピュータシステムに接続され得る。例えば、I/Oポート77または外部インターフェース81(例えば、Ethernet(登録商標)、Wi-Fiなど)を使用して、Internetなどの広域ネットワーク、マウス入力デバイス、またはスキャナに、コンピュータシステム10を接続し得る。システムバス75を介した相互接続は、中央プロセッサ73が、各サブシステムと通信し、システムメモリ72または記憶デバイス79(例えば、ハードドライブまたは光ディスクなどの固定ディスク)からの複数の命令の実行、およびサブシステム間の情報交換を制御することを可能にする。システムメモリ72および/または記憶デバイス79は、コンピュータ可読媒体を具現化し得る。別のサブシステムは、カメラ、マイクロホン、および加速度計、ならびにこれらに類するものなどのデータ収集デバイス85である。本明細書に言及されるデータのうちのいずれも、1つの構成要素から別の構成要素に出力されてもよく、ユーザに対して出力されてもよい。
コンピュータシステムは、例えば、外部インターフェース81によって、内部インターフェースによって、または1つの構成要素から別の構成要素に接続し、取り外され得るリムーバブル記憶デバイスを介して、ともに接続された、複数の同じ構成要素またはサブシステムを含み得る。いくつかの実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワーク上で通信することができる。そのような例において、1つのコンピュータをクライアント、別のコンピュータをサーバとみなすことができ、各々が、同じコンピュータシステムの一部であり得る。クライアントおよびサーバは各々、複数のシステム、サブシステム、または構成要素を含むことができる。
実施形態の態様は、制御ロジックの形態で、ハードウェア回路(例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ)を使用して、および/またはモジュール式もしくは集積様態で汎用プログラマブルプロセッサを有するコンピュータソフトウェアを使用して、実装され得る。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同じ集積チップ上のマルチコアプロセッサ、または単一の回路基板もしくはネットワーク化された上の複数の処理ユニット、ならびに専用のハードウェアを含み得る。本開示および本明細書に提供される教示に基づいて、当業者は、ハードウェア、およびハードウェアとソフトウェアとの組み合わせを使用して、本発明の実施形態を実装するための他の方式および/または方法を認識および理解するであろう。
本出願で説明されるソフトウェアコンポーネントまたは関数のうちのいずれも、例えば、Java(登録商標)、C、C++、C#、Objective-C、Swiftなどの任意の好適なコンピュータ言語、または、例えば、従来の技術もしくは物体指向の技術を使用するPerlもしくはPythonなどのスクリプト言語を使用する、処理デバイスによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、記憶および/または伝送のためのコンピュータ可読媒体上に一連の命令またはコマンドとして記憶され得る。好適な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ(RAM)、リード専用メモリ(ROM)、磁気媒体(ハードドライブもしくはフロッピー(登録商標)ディスク等)、または光学媒体(コンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)等)、またはブルーレイディスクおよびフラッシュメモリ等を含み得る。コンピュータ可読媒体は、そのようなストレージまたは伝送デバイスの任意の組み合わせであってもよい。
そのようなプログラムはまた、コード化され、インターネットを含む様々なプロトコルに従う有線ネットワーク、光ネットワーク、および/または無線ネットワークを介した伝送に適合した搬送波信号を使用して伝送され得る。したがって、コンピュータ可読媒体は、そのようなプログラムでコード化されたデータ信号を使用して作成され得る。プログラムコードでコード化されたコンピュータ可読媒体は、互換性のあるデバイスでパッケージ化されてもよく、または(例えば、インターネットダウンロードを介して)他のデバイスとは別個に提供され得る。任意のそのようなコンピュータ可読媒体は、単一のコンピュータ製品(例えば、ハードドライブ、CD、もしくはコンピュータシステム全体)上もしくはその内部に存在し得、システムまたはネットワーク内の異なるコンピュータ製品上もしくはその内部に存在し得る。コンピュータシステムは、モニタ、プリンタ、または本明細書に記載の結果のうちのいずれかをユーザに提供するための他の好適なディスプレイを含み得る。
本明細書に記載される方法のうちのいずれも、ステップを行うように構成することができる、1つ以上のプロセッサを含むコンピュータシステムで全体的または部分的に行われ得る。したがって、実施形態は、本明細書に説明される方法のうちのいずれかのステップを実施するように構成されたコンピュータシステムを対象とし得、潜在的には異なるコンポーネントがそれぞれのステップまたはそれぞれのステップの群を実施する。番号付けされた工程として提示されるが、本明細書の方法の工程は、同時に若しくは異なる時間に、または異なる順序で実施され得る。加えて、これらのステップの部分は、他の方法からの他のステップの部分と併用され得る。また、あるステップのすべてまたは部分は、任意選択的であり得る。加えて、本方法のうちのいずれかの任意の工程は、これらの工程を実行するためのシステムのモジュール、ユニット、回路、または他の手段で実行することができる。
特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨および範囲から逸脱することなく、任意の好適な様態で組み合わせることができる。しかしながら、本発明の他の実施形態は、各個々の態様、またはこれらの個々の態様の特定の組み合わせに関する特定の実施形態を対象とし得る。
本開示の例示的実施形態の上の説明は、例示および説明の目的で提示されている。網羅的であること、または本開示を説明された正確な形態に限定することは意図されず、多くの修正および変更が、先の教示に鑑みて可能である。
「a」、「an」、または「the」の記述は、それとは反対に具体的に示されない限り、「1つ以上」を意味することが意図される。「または」の使用は、それとは反対に具体的に示されない限り、「を除く、または」ではなく「を含む、または」を意味することが意図される。「第1」の構成要素への言及は、第2の構成要素が提供されることを必ずしも必要としない。さらに、「第1」または「第2」の構成要素への言及は、明示的に述べられていない限り、言及される構成要素を特定の場所に限定するものではない。「~に基づいて」という用語は、「少なくとも一部に基づいて」を意味することを意図している。
本明細書において言及されるすべての特許、特許出願、刊行物、および明細書は、すべての目的のために参照によりそれらの全体が組み込まれる。いかなるものも、先行技術であるとは認められていない。
XIII.参考文献
Al-Mayouf,S.M.,Sunker,A.,Abdwani,R.,Abrawi,S.A.,Almurshedi,F.,Alhashmi,N.,Al Sonbul,A.,Sewairi,W.,Qari,A.,Abdallah,E.,et al.(2011).Loss-of-function variant in DNASE1L3 causes a familial form of systemic lupus erythematosus.Nat Genet 43,1186-1188.
Chan,K.C.A.,Woo,J.K.S.,King,A.,Zee,B.C.Y.,Lam,W.K.J.,Chan,S.L.,Chu,S.W.I.,Mak,C.,Tse,I.O.L.,Leung,S.Y.M.,et al.(2017).Analysis of Plasma Epstein-Barr Virus DNA to Screen for Nasopharyngeal Cancer.New England Journal of Medicine 377,513-522.
Chandrananda,D.,Thorne,N.P.,and Bahlo,M.(2015).High-resolution characterization of sequence signatures due to non-random cleavage of cell-free DNA.BMC Medical Genomics 8,29.
Cheng,T.H.T.,Lui,K.O.,Peng,X.L.,Cheng,S.H.,Jiang,P.,Chan,K.C.A.,Chiu,R.W.K.,and Lo,Y.M.D. (2018).DNase1 Does Not Appear to Play a Major Role in the Fragmentation of Plasma DNA in a Knockout Mouse Model.Clin Chem 64,406-408.
Chiu,R.W.K.,Chan,K.C.A.,Gao,Y.,Lau,V.Y.M.,Zheng,W.,Leung,T.Y.,Foo,C.H.F.,Xie,B.,Tsui,N.B.Y.,Lun,F.M.F.,et al.(2008).Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma.Proceedings of the National Academy of Sciences of the United States of America 105,20458-20463.
Chiu,R.W.K.,Poon,L.L.M.,Lau,T.K.,Leung,T.N.,Wong,E.M.C.,and Lo,Y.M.D. (2001).Effects of Blood-Processing Protocols on Fetal and Total DNA Quantification in Maternal Plasma.Clinical Chemistry 47,1607-1613.
Dingle,T.C.,Sedlak,R.H.,Cook,L.,and Jerome,K.R.(2013).Tolerance of droplet-digital PCR vs real-time quantitative PCR to inhibitory substances.Clin Chem 59,1670-1672.
Elmore,S.(2007).Apoptosis: a review of programmed cell death.Toxicologic pathology 35,495-516.
Errami,Y.,Naura,A.S.,Kim,H.,Ju,J.,Suzuki,Y.,El-Bahrawy,A.H.,Ghonim,M.A.,Hemeida,R.A.,Mansy,M.S.,Zhang,J.,et al.(2013).Apoptotic DNA fragmentation may be a cooperative activity between caspase-activated deoxyribonuclease and the poly(ADP-ribose) polymerase-regulated DNAS1L3,an endoplasmic reticulum-localized endonuclease that translocates to the nucleus during apoptosis.The Journal of biological chemistry 288,3460-3468.
Ivanov,M.,Baranova,A.,Butler,T.,Spellman,P.,and Mileyko,V.(2015).Non-random fragmentation patterns in circulating cell-free DNA reflect epigenetic regulation.BMC genomics 16,S1.
Jimenez-Alcazar,M.,Rangaswamy,C.,Panda,R.,Bitterling,J.,Simsek,Y.J.,Long,A.T.,Bilyy,R.,Krenn,V.,Renne,C.,Renne,T.,et al.(2017).Host DNases prevent vascular occlusion by neutrophil extracellular traps.Science (New York,NY) 358,1202-1206.
Klug,A.,and Lutter,L.C.(1981).The helical periodicity of DNA on the nucleosome.Nucleic Acids Res 9,4267-4283.
Koyama,R.,Arai,T.,Kijima,M.,Sato,S.,Miura,S.,Yuasa,M.,Kitamura,D.,and Mizuta,R.(2016).DNase γ,DNase I and caspase-activated DNase cooperate to degrade dead cells.Genes to Cells 21,1150-1163.
Larsen,B.D.,and Sφrensen,C.S.(2017).The caspase-activated DNase: apoptosis and beyond.The FEBS Journal 284,1160-1170.
Li,R.,Yu,C.,Li,Y.,Lam,T.-W.,Yiu,S.-M.,Kristiansen,K.,and Wang,J.(2009).SOAP2: an improved ultrafast tool for short read alignment.Bioinformatics 25,1966-1967.
Lo,Y.M.D.,Chan,K.C.A.,Sun,H.,Chen,E.Z.,Jiang,P.,Lun,F.M.F.,Zheng,Y.W.,Leung,T.Y.,Lau,T.K.,Cantor,C.R.,et al.(2010).Maternal Plasma DNA Sequencing Reveals the Genome-Wide Genetic and Mutational Profile of the Fetus.Science Translational Medicine 2,61ra91-61ra91.
Lo,Y.M.D.,Corbetta,N.,Chamberlain,P.F.,Rai,V.,Sargent,I.L.,Redman,C.W.G.,and Wainscoat,J.S.(1997).Presence of fetal DNA in maternal plasma and serum.The Lancet 350,485-487.
Manaster,J.,Chezar,J.,Shurtz-Swirski,R.,Shapiro,G.,Tendler,Y.,Kristal,B.,Shasha,S.M.,and Sela,S.(1996).Heparin induces apoptosis in human peripheral blood neutrophils.British Journal of Haematology 94,48-52.
Nagata,S.(2018).Apoptosis and Clearance of Apoptotic Cells.Annual review of immunology 36,489-517.
Napirei,M.,Ludwig,S.,Mezrhab,J.,Klockl,T.,and Mannherz,H.G.(2009).Murine serum nucleases - contrasting effects of plasmin and heparin on the activities of DNase1 and DNase1-like 3 (DNase1l3).The FEBS Journal 276,1059-1073.
Napirei,M.,Wulf,S.,Eulitz,D.,Mannherz,H.G.,and Kloeckl,T.(2005).Comparative characterization of rat deoxyribonuclease 1 (Dnase1) and murine deoxyribonuclease 1-like 3 (Dnase1l3).The Biochemical journal 389,355-364.
Ozcakar,Z.B.,Foster,J.,2nd,Diaz-Horta,O.,Kasapcopur,O.,Fan,Y.S.,Yalcinkaya,F.,and Tekin,M.(2013).DNASE1L3 mutations in hypocomplementemic urticarial vasculitis syndrome.Arthritis Rheum 65,2183-2189.
Quinlan,A.R.,and Hall,I.M.(2010).BEDTools: a flexible suite of utilities for comparing genomic features.Bioinformatics 26,841-842.
Samejima,K.,and Earnshaw,W.C.(2005).Trashing the genome: the role of nucleases during apoptosis.Nature Reviews: Molecular Cell Biology 6,677-688.
Serpas,L.,Chan,R.W.Y.,Jiang,P.,Ni,M.,Sun,K.,Rashidfarrokhi,A.,Soni,C.,Sisirak,V.,Lee,W.-S.,Cheng,S.H.,et al.(2019).Dnase1l3 deletion causes aberrations in length and end-motif frequencies in plasma DNA.Proceedings of the National Academy of Sciences 116,641-649.
Shen,Y.,Yue,F.,McCleary,D.F.,Ye,Z.,Edsall,L.,Kuan,S.,Wagner,U.,Dixon,J.,Lee,L.,Lobanenkov,V.V.,et al.(2012).A map of the cis-regulatory sequences in the mouse genome.Nature 488,116-120.
Sisirak,V.,Sally,B.,D’Agati,V.,Martinez-Ortiz,W.,Ozcakar,Z.B.,David,J.,Rashidfarrokhi,A.,Yeste,A.,Panea,C.,Chida,Asiya S.,et al.(2016).Digestion of Chromatin in Apoptotic Cell Microparticles Prevents Autoimmunity.Cell 166,88-101.
Snyder,M.W.,Kircher,M.,Hill,A.J.,Daza,R.M.,and Shendure,J.(2016).Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin.Cell 164,57-68.
Sun,K.,Jiang,P.,Cheng,S.H.,Cheng,T.H.T.,Wong,J.,Wong,V.W.S.,Ng,S.S.M.,Ma,B.B.Y.,Leung,T.Y.,Chan,S.L.,et al.(2019).Orientation-aware plasma cell-free DNA fragmentation analysis in open chromatin regions informs tissue of origin.Genome Research 29,418-427.
Villeponteau,B.(1992).Heparin increases chromatin accessibility by binding the trypsin-sensitive basic residues in histones.The Biochemical journal 288 ( Pt 3),953-958.
Watanabe,T.,Takada,S.,and Mizuta,R.(2019).Cell-free DNA in blood circulation is generated by DNase1L3 and caspase-activated DNase.Biochemical and biophysical research communications 516,790-795.
Widlak,P.,and Garrard,W.T.(2005).Discovery,regulation,and action of the major apoptotic nucleases DFF40/CAD and endonuclease G. Journal of cellular biochemistry 94,1078-1087.
Widlak,P.,Li,P.,Wang,X.,and Garrard,W.T.(2000).Cleavage preferences of the apoptotic endonuclease DFF40 (caspase-activated DNase or nuclease) on naked DNA and chromatin substrates.The Journal of biological chemistry 275,8226-8232.
Yang,W.(2011).Nucleases: diversity of structure,function and mechanism.Quarterly reviews of biophysics 44,1-93

Claims (57)

  1. 無細胞DNAを含む対象の生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法であって、
    前記対象の前記生物学的試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取ることと、
    前記配列リードを使用して、特定の塩基で終わる無細胞DNA断片の第1の量を決定することと、
    前記第1の量を参照値と比較して、前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの分類を決定することと、を含む、方法。
  2. 前記生物学的試料が、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされる、請求項1に記載の方法。
  3. 無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法であって、
    対象の第1の生物学的試料中の第1の無細胞DNA断片の配列決定から取得された第1の配列リードを受け取ることであって、前記第1の生物学的試料が、抗凝固剤で処理され、第1の時間の長さにわたってインキュベートされる、受け取ることと、
    前記第1の配列リードを使用して、特定の塩基で終わる前記第1の無細胞DNA断片の第1の量を決定することと、
    前記対象の第2の生物学的試料中の第2の無細胞DNA断片の配列決定から取得された第2の配列リードを受け取ることであって、前記第2の生物学的試料が、前記抗凝固剤で処理され、前記第1の時間の長さよりも長い第2の時間の長さにわたってインキュベートされる、受け取ることと、
    前記第2の配列リードを使用して、前記特定の塩基で終わる前記第2の無細胞DNA断片の第2の量を決定することと、
    前記第1の量を前記第2の量と比較して、前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの分類を決定することと、を含む、方法。
  4. 前記第1の量および前記第2の量が、前記特定の塩基を含む特定の末端モチーフについて決定される、請求項1または3に記載の方法。
  5. 前記第1の配列リードを参照ゲノムにアラインメントすることと、
    前記参照ゲノムの特定の位置で、または前記特定の位置から指定された距離で終わる配列リードの第1のセットを特定することであって、前記特定の位置が、前記参照ゲノムにおける指定された特性を有する特定の座標またはゲノム位置に対応する、特定することと、をさらに含み、
    前記第1の量が、前記特定の塩基で終わる配列リードの前記第1のセットの量に対応する、請求項1または3に記載の方法。
  6. 前記ゲノム位置が、CTCF領域の中心である、請求項5に記載の方法。
  7. 前記第1の量を前記第2の量と比較することは、前記第1の量が前記第2の量と少なくとも閾値量だけ異なるかどうかを決定することを含む、請求項3に記載の方法。
  8. 前記分類は、前記第1の量が前記第2の量の閾値内にあるときに前記遺伝性障害が存在することである、請求項3に記載の方法。
  9. 前記分類は、前記第2の量が前記第1の量よりも少なくとも閾値だけ少ないときに前記遺伝性障害が存在することである、請求項3に記載の方法。
  10. 前記第1の量および前記第2の量が、前記特定の塩基での両端を有する無細胞DNA断片のものである、請求項3に記載の方法。
  11. 前記第1の配列リードを使用して、前記特定の塩基で終わる前記第1の無細胞DNA断片の第1のサイズを決定することと、
    前記第2の配列リードを使用して、前記特定の塩基で終わる前記第2の無細胞DNA断片の第2のサイズを決定することと、をさらに含み、
    前記第1の量が、特定のサイズを有する前記第1の無細胞DNA断片の第1のセットを使用して決定され、
    前記第2の量が、前記特定のサイズを有する前記第2の無細胞DNA断片の第2のセットを使用して決定される、請求項3に記載の方法。
  12. 前記特定のサイズが、サイズ範囲である、請求項11に記載の方法。
  13. 前記第1の時間の長さが、ゼロである、請求項3に記載の方法。
  14. 無細胞DNAを含む対象の生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法であって、
    前記対象の前記生物学的試料中の第1の無細胞DNA断片の配列決定から取得された第1の配列リードを受け取ることであって、前記生物学的試料が、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされる、受け取ることと、
    前記第1の配列リードを使用して、特定のサイズを有する前記第1の無細胞DNA断片の第1の量を決定することと、
    前記第1の量を参照値と比較して、前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの分類を決定することと、を含む、方法。
  15. 前記第1の量を前記参照値と比較することは、前記第1の量が前記参照値と少なくとも閾値量だけ異なるかどうかを決定することを含む、請求項1または14に記載の方法。
  16. 前記第1の量を前記参照値と比較することは、前記第1の量が前記参照値よりも少なくとも閾値量だけ少ないかどうかを決定することを含む、請求項1または14に記載の方法。
  17. 前記第1の量を前記参照値と比較することは、前記第1の量が前記参照値よりも少なくとも閾値量だけ大きいかどうかを決定することを含む、請求項1または14に記載の方法。
  18. 前記参照値が、前記遺伝性障害を有しない1つ以上の参照試料から決定される、請求項1または14に記載の方法。
  19. 前記参照値が、前記遺伝性障害を有する1つ以上の参照試料から決定される、請求項1または14に記載の方法。
  20. 前記抗凝固剤が、ヘパリンである、請求項3または14に記載の方法。
  21. 前記抗凝固剤が、EDTAである、請求項3または14に記載の方法。
  22. 前記遺伝子が、DNASE1である、請求項1、3、および14のいずれか一項に記載の方法。
  23. 前記遺伝子が、DFFBである、請求項1、3、および14のいずれか一項に記載の方法。
  24. 前記遺伝子が、DNASE1L3である、請求項1、3、および14のいずれか一項に記載の方法。
  25. 前記ヌクレアーゼが、細胞内DNAを切断する、請求項1、3、および14のいずれか一項に記載の方法。
  26. 前記遺伝性障害が、前記遺伝子の欠失を含む、請求項1、3、および14のいずれか一項に記載の方法。
  27. 前記第1の量が、正規化される、請求項1、3、および14のいずれか一項に記載の方法。
  28. 前記遺伝性障害の前記分類に基づいて前記対象を治療すること、をさらに含む、請求項1、3、および14のいずれか一項に記載の方法。
  29. 血液障害を有する対象の治療の有効性を決定するための方法であって、
    前記対象の血液試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取ることであって、前記血液試料が、第1の投与量の抗凝固剤を投与された前記対象の後に取得される、受け取ることと、
    前記配列リードを使用して、特定の塩基で終わる前記無細胞DNA断片の量を決定することと、
    前記量を参照値と比較して、前記治療の前記有効性の分類を決定することと、を含む、方法。
  30. 血液障害を有する対象の治療の有効性を決定するための方法であって、
    前記対象の血液試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取ることであって、前記血液試料が、第1の投与量の抗凝固剤を投与された前記対象の後に取得される、受け取ることと、
    前記配列リードを使用して、特定のサイズを有する前記無細胞DNA断片の量を決定することと、
    前記量を参照値と比較して、前記治療の前記有効性の分類を決定することと、を含む、方法。
  31. 前記対象から前記血液試料を取得することと、
    前記血液試料中の前記無細胞DNA断片を配列決定して、前記配列リードを取得することと、をさらに含む、請求項29または30に記載の方法。
  32. 前記第1の投与量の前記抗凝固剤を前記対象に投与すること、をさらに含む、請求項29または30に記載の方法。
  33. 前記比較に基づいて、第2の投与量の前記抗凝固剤を前記対象に投与することであって、前記第2の投与量が、前記第1の投与量よりも多い、投与すること、をさらに含む、請求項29または30に記載の方法。
  34. 前記抗凝固剤が、ヘパリンである、請求項29または30に記載の方法。
  35. 前記参照値が、前記治療の前記有効性について既知のまたは測定された分類を有する1つ以上の参照試料を使用して決定される、請求項29または30に記載の方法。
  36. 前記1つ以上の参照試料に対して凝固試験を実施することによって、前記1つ以上の参照試料についての前記治療の前記有効性を測定することと、
    前記1つ以上の参照試料中の前記量を測定することと、をさらに含む、請求項35に記載の方法。
  37. 前記1つ以上の参照試料が、複数の参照試料であり、前記方法が、
    前記複数の参照試料について測定された有効性および測定された量に対応する較正データ点を近似する較正関数を決定すること、をさらに含む、請求項36に記載の方法。
  38. 無細胞DNAを含む対象の生物学的試料を使用してヌクレアーゼの活性を監視するための方法であって、
    前記対象の前記生物学的試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取ることと、
    前記配列リードを使用して、特定の塩基で終わる前記無細胞DNA断片の量を決定することと、
    前記量を参照値と比較して、前記ヌクレアーゼの活性の第1の分類を決定することと、を含む、方法。
  39. 無細胞DNAを含む対象の生物学的試料を使用してヌクレアーゼの活性を監視するための方法であって、
    前記対象の前記生物学的試料中の無細胞DNA断片の配列決定から取得された配列リードを受け取ることと、
    前記配列リードを使用して、特定のサイズを有する前記無細胞DNA断片の量を決定することと、
    前記量を参照値と比較して、前記ヌクレアーゼの活性の第1の分類を決定することと、を含む、方法。
  40. 前記第1の分類が、数分類値であり、前記方法が、
    前記数分類値をカットオフと比較して、前記ヌクレアーゼに関連する遺伝子が前記対象において遺伝性障害を示すかどうかの第2の分類を決定すること、をさらに含む、請求項38または39に記載の方法。
  41. 前記生物学的試料が、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされる、請求項38または39に記載の方法。
  42. 前記参照値が、前記ヌクレアーゼの前記活性の特定の分類を有する較正試料から決定される、請求項38または39に記載の方法。
  43. 前記特定の分類が、正常、増加、または減少である、請求項42に記載の方法。
  44. 前記量を前記参照値と比較することが、前記量が前記参照値と少なくとも閾値量だけ異なるかどうかを決定することを含む、請求項38または39に記載の方法。
  45. 前記量を前記参照値と比較することが、前記量が前記参照値よりも少なくとも閾値量だけ少ないかどうかを決定することを含む、請求項38または39に記載の方法。
  46. 前記量を前記参照値と比較することが、前記量が前記参照値よりも少なくとも閾値量だけ大きいかどうかを決定することを含む、請求項38または39に記載の方法。
  47. 前記ヌクレアーゼが、DFFB、DNASE1L3、またはDNASE1である、請求項38または39に記載の方法。
  48. 前記対象は、前記生物学的試料が取得される前に、前記ヌクレアーゼによる治療を提供されている、請求項38または39に記載の方法。
  49. 前記量と前記参照値との比較に基づいて、前記ヌクレアーゼによる前記治療の有効性の第2の分類を決定すること、をさらに含む、請求項48に記載の方法。
  50. 前記参照値が、前記ヌクレアーゼの前記活性について既知のまたは測定された分類を有する1つ以上の参照試料を使用して決定される、請求項38または39に記載の方法。
  51. 前記1つ以上の参照試料についての前記ヌクレアーゼの前記活性を測定することと、
    前記1つ以上の参照試料中の前記量を測定することと、をさらに含む、請求項50に記載の方法。
  52. 前記1つ以上の参照試料が、複数の参照試料であり、前記方法が、
    前記複数の参照試料について測定された活性および測定された量に対応する較正データ点を近似する較正関数を決定すること、をさらに含む、請求項51に記載の方法。
  53. コンピュータシステムを制御して、先行請求項のいずれか一項に記載の方法を実施するための、複数の命令を記憶する非一時的コンピュータ可読媒体を含む、コンピュータ製品。
  54. システムであって、
    請求項53に記載のコンピュータ製品と、
    前記非一時的コンピュータ可読媒体上に保存される指示を実行するための1つ以上のプロセッサと、を備える、システム。
  55. 請求項1~54のいずれか一項に記載の方法を実施するための手段を備える、システム。
  56. 請求項1~55のいずれか一項に記載の方法を実施するように構成された1つ以上のプロセッサを備える、システム。
  57. 請求項1~56のいずれか一項に記載の方法のステップをそれぞれ実施するモジュールを備える、システム。
JP2022537721A 2019-12-18 2020-12-18 無細胞dna断片化およびヌクレアーゼ Pending JP2023506560A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962949867P 2019-12-18 2019-12-18
US62/949,867 2019-12-18
US202062958651P 2020-01-08 2020-01-08
US62/958,651 2020-01-08
PCT/CN2020/137516 WO2021121368A1 (en) 2019-12-18 2020-12-18 Cell-free dna fragmentation and nucleases

Publications (1)

Publication Number Publication Date
JP2023506560A true JP2023506560A (ja) 2023-02-16

Family

ID=76439147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022537721A Pending JP2023506560A (ja) 2019-12-18 2020-12-18 無細胞dna断片化およびヌクレアーゼ

Country Status (7)

Country Link
US (1) US20210189494A1 (ja)
EP (1) EP4077721A4 (ja)
JP (1) JP2023506560A (ja)
CN (1) CN115298324A (ja)
AU (1) AU2020409879A1 (ja)
CA (1) CA3161683A1 (ja)
WO (1) WO2021121368A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022214051A1 (en) * 2021-04-08 2022-10-13 The Chinese University Of Hong Kong Cell-free dna methylation and nuclease-mediated fragmentation

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2852680B1 (en) * 2012-05-21 2019-12-25 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
JP2017522908A (ja) * 2014-07-25 2017-08-17 ユニヴァーシティ オブ ワシントン セルフリーdnaを生じる組織及び/又は細胞タイプを決定する方法、並びにそれを用いて疾患又は異常を識別する方法
WO2016065295A1 (en) * 2014-10-24 2016-04-28 Dae Hyun Kim Enrichment of small nucleic acids
KR20180031742A (ko) * 2015-07-23 2018-03-28 더 차이니즈 유니버시티 오브 홍콩 무세포 dna의 단편화 패턴 분석
US10095831B2 (en) * 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
CN109415727A (zh) * 2016-06-13 2019-03-01 格里尔公司 富集突变的无细胞核酸以供癌症检测的方法
CN117604082A (zh) * 2016-08-10 2024-02-27 格瑞尔有限责任公司 分析核酸片段的方法
AU2019207900A1 (en) * 2018-01-12 2020-07-09 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid

Also Published As

Publication number Publication date
EP4077721A1 (en) 2022-10-26
AU2020409879A1 (en) 2022-06-23
US20210189494A1 (en) 2021-06-24
WO2021121368A1 (en) 2021-06-24
CN115298324A (zh) 2022-11-04
EP4077721A4 (en) 2024-01-17
CA3161683A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
Rodin et al. The landscape of somatic mutation in cerebral cortex of autistic and neurotypical individuals revealed by ultra-deep whole-genome sequencing
US20150315645A1 (en) Methods of identifying biomarkers associated with or causative of the progression of disease
JP2022544604A (ja) がん検体において細胞経路調節不全を検出するためのシステム及び方法
EP3494235A1 (en) Swarm intelligence-enhanced diagnosis and therapy selection for cancer using tumor- educated platelets
US20220396838A1 (en) Cell-free dna methylation and nuclease-mediated fragmentation
US20210238668A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
CN113228190A (zh) 基于预测的肿瘤突变负荷的肿瘤分类
JP2023518291A (ja) 循環遊離mRNAプロファイリングアッセイを使用してアルツハイマー病のリスクを検出するシステムおよび方法
US20220010353A1 (en) Nuclease-associated end signature analysis for cell-free nucleic acids
Rodin et al. The landscape of mutational mosaicism in autistic and normal human cerebral cortex
Gaksch et al. Residual disease detection using targeted parallel sequencing predicts relapse in cytogenetically normal acute myeloid leukemia
WO2022212590A1 (en) Systems and methods for multi-analyte detection of cancer
US20210189494A1 (en) Cell-free dna fragmentation and nucleases
KR20210132139A (ko) 대립유전자 빈도에 기초한 기능 손실의 컴퓨터 모델링
JP2020533663A (ja) Dna修復プロファイリング及びそのための方法
Gindin et al. Analytical principles of cancer next generation sequencing
JP7090604B2 (ja) びまん性大細胞型b細胞リンパ腫の予後予測因子、及び予後予測方法
US20240182982A1 (en) Fragmentomics in urine and plasma
WO2024114678A1 (en) Fragmentomics in urine and plasma
Palou-Márquez et al. Variable efficiency of nonsense-mediated mRNA decay across human tissues, tumors and individuals
Class et al. Patent application title: METHODS OF IDENTIFYING BIOMARKERS ASSOCIATED WITH OR CAUSATIVE OF THE PROGRESSION OF DISEASE Inventors: Theresa Gaasterland (Del Mar, CA, US) Douglas E. Gaasterland (Colonial Beach, VA, US) Assignees: THE REGENTS OF THE UNIVERSITY OF CALIFORNIA
Suraci Development of models to understand the complexity in cardiovascular research and diagnostic
WO2021108525A1 (en) Detecting congenital heart defects
JP2021501422A (ja) テモゾロミド反応予測因子及び方法
Reuther INVESTIGATION OF GENETIC ALTERATIONS IN EMT SUPPRESSOR, DEAR1, THROUGH PAN-CANCER ANALYSIS AND ULTRA-DEEP TARGETED SEQUENCING IN DUCTAL CARCINOMA IN SITU

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221025

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20221025

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231201