TWI856481B - 非侵入性產前樣本製備以及相關方法和用途 - Google Patents

非侵入性產前樣本製備以及相關方法和用途 Download PDF

Info

Publication number
TWI856481B
TWI856481B TW112101104A TW112101104A TWI856481B TW I856481 B TWI856481 B TW I856481B TW 112101104 A TW112101104 A TW 112101104A TW 112101104 A TW112101104 A TW 112101104A TW I856481 B TWI856481 B TW I856481B
Authority
TW
Taiwan
Prior art keywords
nucleotides
length
deficiency
cfdna
type
Prior art date
Application number
TW112101104A
Other languages
English (en)
Other versions
TW202334439A (zh
Inventor
戴爾 穆茲
珍妮薇 古爾德
珏皛 王
克里斯多夫 J 貝堤
萊維 帕特
桑吉塔 蓋尼時
凱爾 崔汀
Original Assignee
美商瑪利雅德婦女保健公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商瑪利雅德婦女保健公司 filed Critical 美商瑪利雅德婦女保健公司
Publication of TW202334439A publication Critical patent/TW202334439A/zh
Application granted granted Critical
Publication of TWI856481B publication Critical patent/TWI856481B/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本揭露內容係關於自妊婦或孕婦製備游離DNA樣本之方法,以及分析此類樣本之相關方法。

Description

非侵入性產前樣本製備以及相關方法和用途
本文描述了自妊婦製備樣本之方法以及分析此類樣本之相關方法。
以下對本技術背景之描述僅係為了幫助理解本技術而提供,並不承認描述或構成本技術之先前技術。
非侵入性產前篩查(non-invasive pre-natal screening;NIPS)已經成為妊婦保健之一常規組成部分。NIPS可涉及篩查非整倍體(如唐氏症候群(Down syndrome)等)及篩查母親或胎兒之其他基因異常。許多此類篩查利用游離DNA(cfDNA);然而,cfDNA之利用遇到許多挑戰,因為母體血漿中僅一小部分cfDNA來自胎兒。
此外,對某些遺傳性病況之產前篩查傳統上需要自母親及父親二者獲得DNA樣本。例如,檢測非整倍體及各種基因狀況之傳統方法需要自胎兒之母親及父親二者獲得基因體DNA(gDNA)樣本,以及自母親獲得cfDNA。因此,此種測試需要至少三個樣本,每個樣本可以不同方式進行處理及評估。
本揭露內容藉由提供選擇性地使母體樣本之胎兒部分富集之方法來解決彼等挑戰,使得非整倍體及其他基因變體/突變之NIPS可以僅用單一母體樣本並行進行。
本揭露內容總體上係關於新的樣本製備及對來自單一樣本之非整倍體及其他基因變異(如致病性SNP、插入或缺失(INDEL)及單基因拷貝數變異(single gene copy number variation))之並行篩查。該等組成物及方法藉由對所需分析進行流線型化及簡化、使用更少樣本及降低背景雜訊來改善非侵入性產前篩查(NIPS),與習知產前篩查分析相比,所有該等方法皆具有更低的複雜性且需要更少的時間。
在一個範疇中,本揭露內容提供了製備具有經富集的胎兒部分之生物樣本之方法,其包括: (a-1)自孕婦獲得包含游離DNA(cfDNA)之生物樣本; (b-1)自該生物樣本中萃取cfDNA; (c-1)製備cfDNA片段庫以獲得cfDNA庫; (d-1)根據大小分離該cfDNA庫中之該等cfDNA片段,以僅保留小於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、約180個核苷酸長度、約185個核苷酸長度、約190個核苷酸長度、約195個核苷酸長度、或約200個核苷酸長度之cfDNA片段; (e-1)對所保留之cfDNA片段進行定序以獲得第一序列庫; (f-1)基於讀段長度的長度鑑定存在於該第一序列庫之至少兩個窗口中之(i)游離胎兒DNA(cffDNA)序列及(ii)游離母體DNA(cfmDNA)序列;及 (g-1)自該序列庫之該至少兩個窗口中之每一者中分離該等cffDNA序列,從而獲得至少兩個富集胎兒部分之序列庫; 或者 (a-2)自孕婦獲得包含游離DNA(cfDNA)之生物樣本; (b-2)自該生物樣本中萃取cfDNA; (c-2)分離來自(b-2)之所萃取之樣本中之cfDNA片段,以僅保留小於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、約180個核苷酸長度、約185個核苷酸長度、約190個核苷酸長度、約195個核苷酸長度、或約200個核苷酸長度之cfDNA片段; (d-2)自來自(c-2)之所分離之cfDNA片段製備cfDNA庫; (e-2)對該cfDNA庫進行定序以獲得第一序列庫; (f-2)基於讀段長度的長度鑑定存在於該第一序列庫之至少兩個窗口中之(i)游離胎兒DNA(cffDNA)序列及(ii)游離母體DNA(cfmDNA)序列;及 (g-2)自該序列庫之該至少兩個窗口中之每一者中分離該等cffDNA序列,從而獲得至少兩個富集胎兒部分之序列庫。
在一些實施例中,分離該等cfDNA片段使該生物樣本中之胎兒部分富集約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、或約2.0倍。
在一些實施例中,自該第一序列庫之至少兩個窗口中分離該等cffDNA序列使該生物樣本中之胎兒部分富集約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、約2.0倍、約2.1倍、約2.2倍、約2.3倍、約2.4倍、約2.5倍、約2.6倍、約2.7倍、約2.8倍、約2.9倍、約3.0倍、約3.1倍、約3.2倍、約3.3倍、約3.4倍、或約3.5倍。
在一些實施例中,分離該等cfDNA片段包括電泳。
在一些實施例中,評估該第一序列庫之至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口,以鑑定及分離cffDNA序列,從而分別獲得至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個富集胎兒部分之序列庫。
在一些實施例中,該方法可進一步包括藉由對該第一序列庫中之cffDNA及cfmDNA之序列讀段與參考基因體進行比較、對來自該第一庫之序列讀段進行解多工、自該第一序列庫中去除重複序列、或其組合,從而自cfmDNA中鑑定及分離cffDNA。
在一些實施例中,該方法可進一步包括評估該至少兩個富集胎兒部分之序列庫中一種或多種基因突變之存在。在一些實施例中,該一種或多種基因突變導致選自以下之至少一種病況:21-羥化酶缺乏症、ABCC8相關高胰島素症、ARSACS、軟骨發育不全、全色盲、腺苷單磷酸脫胺酶1、胼胝體發育不全伴神經元病、黑尿症、α-1-抗胰蛋白酶缺乏症、α-甘露醣儲積症、α-肌聚糖病、α-地中海貧血;阿茲海默症(Alzheimers),血管收縮素II受體I型、脂蛋白E基因分型;精胺琥珀酸尿症(Argininosuccinicaciduria)、天門冬葡萄糖胺尿、運動失調伴維生素E缺乏、運動失調毛細管擴張症、自體免疫多內分泌病變症候群1型、BRCA1遺傳性乳癌/卵巢癌、BRCA2遺傳性乳癌/卵巢癌、Bardet-Biedl二氏症候群、Best卵黃囊狀黃斑失養症、β-肌聚糖病、β-地中海貧血、生物素酶缺乏症、Blau症候群、Bloom症候群、CFTR相關病症、CLN3相關神經性類蠟脂褐質病、CLN5相關神經性類蠟脂褐質病、CLN8相關神經性類蠟脂褐質病、Canavan病、肉毒鹼棕櫚醯轉移酶IA缺乏症、肉毒鹼棕櫚醯轉移酶II缺乏症、軟骨-毛髮發育不良、腦海綿狀畸形(Cerebral Cavernous Malformation)、無脈絡脈畸型、Cohen氏症候群、先天性白內障、面部異形(Facial Dysmorphism)及神經病變、先天性醣基化障礙la(Congenital Disorder of Glycosylationla)、先天性醣基化障礙Ib、先天性芬蘭腎病(Congenital Finnish Nephrosis)、克隆氏病(Crohn Disease)、胱胺酸病、DFNA 9(COCH)、糖尿病及聽力損失、早發性原發性肌緊張不足(Early-Onset Primary Dystonia;DYTI)、Herlitz-Pearson型交界型水皰性表皮鬆解症(Epidermolysis Bullosa Junctional, Herlitz-Pearson Type)、FANCC相關Fanconi貧血、FGFR1相關顱縫線封閉過早、FGFR2相關顱縫線封閉過早、FGFR3相關顱縫線封閉過早、第五因素Leiden血栓好發症(Factor V Leiden Thrombophilia)、第五因素R2突變血栓好發症、第十一因素缺乏症、第十三因素缺乏症、家族性腺瘤性息肉病(Familial Adenomatous Polyposis)、家族性自主神經障礙(Familial Dysautonomia)、家族性高膽固醇血症B型、家族性地中海熱(Familial Mediterranean Fever)、游離唾液酸儲存障礙(Free Sialic Acid Storage Disorder)、額顳葉癡呆伴Parkinson氏症17(Frontotemporal Dementia with Parkinsonism-17)、延胡索酸酶缺乏症、GJB2相關DFNA 3型非症候群性聽力損失及耳聾、GJB2相關DFNB 1非症候群性聽力損失及耳聾、GNE相關肌病、半乳糖血症、Gaucher氏病、葡萄糖-6-磷酸脫氫酶缺乏症、戊二酸血症1型、醣原貯積病1a型(Glycogen Storage Disease Type 1a)、醣原貯積病Ib型、醣原貯積病II型、醣原貯積病III型、醣原貯積病V型、Gracile症候群、HFE相關聯之遺傳性血鐵沈積症(HFE-Associated Hereditary Hemochromatosis)、Halder AIMs、血紅蛋白S β-地中海貧血、遺傳性果糖不耐受、遺傳性胰腺炎、遺傳性胸腺嘧啶-尿嘧啶尿症(Hereditary Thymine-Uraciluria)、己醣胺酶A缺乏症、有汗性外胚層發育異常2(Hidrotic Ectodermal Dysplasia 2)、胱硫醚β-合酶缺乏引起之高胱胺酸尿症、高鉀血週期性麻痹1型、高鳥胺酸血症-高氨血症-高瓜胺酸尿症候群、原發性高草酸鹽尿症1型、原發性高草酸鹽尿症2型、軟骨生成減退、低鉀血週期性麻痹1型、低鉀血週期性麻痹2型、低磷酸酶症、嬰兒肌病及乳酸性酸中毒(致死型及非致死型)、異戊酸血症、Krabbe病、LGMD2I、Leber遺傳性視神經病變、法國-加拿大型Leigh症候群、長鏈3-羥醯基-輔酶A脫氫酶缺乏症(Long Chain 3-Hydroxyacyl-CoA Dehydrogenase Deficiency)、MELAS、MERRF、MTHFR缺乏症、MTHFR不耐熱變異、MTRNR1相關聽力損失及耳聾、MTTS1相關聽力損失及耳聾、MYH相關聯之息肉病、楓糖漿尿病1A型、楓糖漿尿病1B型、馬科恩-亞百特氏症候群(McCune-Albright Syndrome)、中鏈醯基輔酶A脫氫酶缺乏症、巨腦白質病伴皮質下囊腫(Megalencephalic Leukoencephalopathy with Subcortical Cyst)、異染性白質失養症(Metachromatic Leukodystrophy)、粒線體心肌病(Mitochondrial Cardiomyopathy)、粒線體DNA相關聯之Leigh症候群及NARP、黏脂貯積病IV(Mucolipidosis IV)、黏多醣病I型(Mucopolysaccharidosis Type I)、黏多醣病IIIA型、黏多醣病VII型、多發性內分泌瘤2型、肌-眼-腦疾病、線樣肌病(Nemaline Myopathy)、神經表型、由於神經磷脂酶缺乏引起之尼曼-匹克病(Niemann-Pick Disease Due to Sphingomyelinase Deficiency)、尼曼-匹克病C1型、奈梅亨染色體斷裂症候群(Nijmegen Breakage Syndrome)、PPT1相關神經性類蠟脂褐質病、PROP1相關下垂體激素缺乏症(PROP1-related pituitary hormone deficiency)、Pallister-Hall症候群、先天性肌剛痙病(Paramyotonia Congenita)、Pendred症候群、過氧化體雙功能酶缺乏症、廣泛性發展障礙(Pervasive Developmental Disorder)、苯丙胺酸羥化酶缺乏症、血漿蛋白原活化因子抑制物I(Plasminogen Activator Inhibitor I)、體染色體隱性遺傳多囊腎病、凝血酶原G20210A血栓好發症、假維生素D缺乏性佝僂病、緻密成骨不全症、Bothnia型體染色體隱性色素沉著性視網膜炎、雷特氏症候群(Rett Syndrome)、肢根性點狀軟骨發育異常1型(Rhizomelic Chondrodysplasia Punctata Type 1)、短鏈醯基輔酶A脫氫酶缺乏症、Shwachman-Diamond症候群、Sjogren-Larsson症候群、Smith-Lemli-Opitz症候群、痙攣性截癱13、硫酸鹽轉運蛋白相關骨軟骨發育不良、TFR2相關遺傳性血色病、TPP1相關神經性類蠟脂褐質病、致死性軟骨發育不全、運甲狀腺素蛋白澱粉樣變性(Transthyretin Amyloidosis)、三功能蛋白缺乏症、酪胺酸羥化酶缺乏性DRD、酪胺酸血症I型、Wilson氏病、X性聯青年性視網膜劈裂症(X-Linked Juvenile Retinoschisis)、囊腫纖維化(cystic fibrosis)、脊髓性肌肉萎縮症(SMA)、血紅素病、及Zellweger症候群譜系。
在一些實施例中,該方法可進一步包括評估包含cfDNA之生物樣本中非整倍體之存在。在一些實施例中,該非整倍體選自單染色體、三染色體、四染色體、五染色體、微缺失、微複製、以及單染色體、三染色體、四染色體、及五染色體之嵌合體形式。
在另一範疇中,本揭露內容提供了並行檢測單一母體樣本中非整倍體之存在或不存在以及至少一種基因變體之存在或不存在之方法,其包括 (i)自孕婦獲得生物樣本,其中該生物樣本包含游離DNA(cfDNA); (ii)製備cfDNA庫; (iii)對該cfDNA庫進行定序以產生序列庫;及 (iv)檢測該單一母體樣本中非整倍體之存在或不存在以及至少一種基因變體之存在或不存在; 其中(a)使該cfDNA庫富集以增加胎兒部分,(b)使該序列庫富集以增加胎兒部分,或(c)其組合,使得在檢測該單一母體樣本中非整倍體之存在或不存在以及至少一種基因變體之存在或不存在之前,該單一母體樣本之該胎兒部分增加至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、或至少1.5倍。
在一些實施例中,該生物樣本係血液、血清、或血漿。
在一些實施例中,使該cfDNA庫富集以增加胎兒部分,並且使該序列庫富集以增加胎兒部分。
在一些實施例中,富集該cfDNA庫之胎兒部分包括自該cfDNA庫中去除大於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之任何DNA片段。在一些實施例中,自該cfDNA庫中去除該等DNA片段包括電泳。
在一些實施例中,富集該序列庫之胎兒部分包括對該序列庫之至少兩個窗口中之序列進行基於讀段長度之大小排除,從而獲得至少兩個富集胎兒部分之序列庫。在一些實施例中,評估該第一序列庫之至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口,以鑑定及分離cffDNA序列,從而分別獲得至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個富集胎兒部分之序列庫。在一些實施例中,該序列庫之至少兩個窗口選自(i)0-145個核苷酸之序列、(ii)0-150個核苷酸之序列、(iii)0-155個核苷酸、(iv)0-160個核苷酸、(v)0-165個核苷酸、(vi)0-168個核苷酸、(vii)0-170個核苷酸、(viii)0-175個核苷酸、(ix)0-180個核苷酸、(x)0-185個核苷酸、(xi)0-190個核苷酸、(xii)0-195個核苷酸、(xiii)0-200個核苷酸、及(xiv)未閘控者。
在一些實施例中,富集該序列庫之胎兒部分進一步包括藉由對該第一序列庫中之cffDNA及cfmDNA之序列讀段與參考基因體進行比較、對來自該第一庫之序列讀段進行解多工、自該第一序列庫中去除重複序列、或其組合,從而自cfmDNA中鑑定及分離cffDNA。
在一些實施例中,檢測至少一種基因變體之存在或不存在包括在該至少兩個富集胎兒部分之序列庫中之每一者中確定樣本中編碼該至少一種基因變體之每個等位基因之等位基因平衡,並基於該至少兩個富集胎兒部分之序列庫中之每一者中之該等位基因平衡產生每個等位基因之等位基因平衡軌跡,基於該至少兩個富集胎兒部分之序列庫之深度產生深度軌跡,或產生等位基因平衡軌跡及深度軌跡之組合。
在一些實施例中,檢測非整倍體之存在或不存在包括分析該序列庫中對應於感興趣之染色體之至少一個序列之序列深度。在一些實施例中,對應於該感興趣之染色體之該至少一個序列之該序列深度適配該感興趣之染色體之預期深度模型。在一些實施例中,該序列深度藉由下式來計算: 其中: d p係妊娠深度 f係胎兒部分 c m係母體拷貝數 d b係背景深度 c f係胎兒拷貝數。
在一些實施例中,將該序列深度正規化以控制GC偏差、樣本背景、雜交探針捕獲、或其組合。
在一些實施例中,該方法包括檢測選自單染色體、三染色體、四染色體、多染色體X、多染色體Y、微缺失、微重複、五染色體、及其組合之非整倍體之存在或不存在。
在一些實施例中,該至少一種基因變體與選自以下之疾病相關聯:21-羥化酶缺乏症、ABCC8相關高胰島素症、ARSACS、軟骨發育不全、全色盲、腺苷單磷酸脫胺酶1、胼胝體發育不全伴神經元病、黑尿症、α-1-抗胰蛋白酶缺乏症、α-甘露醣儲積症、α-肌聚糖病、α-地中海貧血;阿茲海默症,血管收縮素II受體I型、脂蛋白E基因分型;精胺琥珀酸尿症、天門冬葡萄糖胺尿、運動失調伴維生素E缺乏、運動失調毛細管擴張症、自體免疫多內分泌病變症候群1型、BRCA1遺傳性乳癌/卵巢癌、BRCA2遺傳性乳癌/卵巢癌、Bardet-Biedl二氏症候群、Best卵黃囊狀黃斑失養症、β-肌聚糖病、β-地中海貧血、生物素酶缺乏症、Blau症候群、Bloom症候群、CFTR相關病症、CLN3相關神經性類蠟脂褐質病、CLN5相關神經性類蠟脂褐質病、CLN8相關神經性類蠟脂褐質病、Canavan病、肉毒鹼棕櫚醯轉移酶IA缺乏症、肉毒鹼棕櫚醯轉移酶II缺乏症、軟骨-毛髮發育不良、腦海綿狀畸形、無脈絡脈畸型、Cohen氏症候群、先天性白內障、面部異形及神經病變、先天性醣基化障礙la、先天性醣基化障礙Ib、先天性芬蘭腎病、克隆氏病、胱胺酸病、DFNA 9(COCH)、糖尿病及聽力損失、早發性原發性肌緊張不足(DYTI)、Herlitz-Pearson型交界型水皰性表皮鬆解症、FANCC相關Fanconi貧血、FGFR1相關顱縫線封閉過早、FGFR2相關顱縫線封閉過早、FGFR3相關顱縫線封閉過早、第五因素Leiden血栓好發症、第五因素R2突變血栓好發症、第十一因素缺乏症、第十三因素缺乏症、家族性腺瘤性息肉病、家族性自主神經障礙、家族性高膽固醇血症B型、家族性地中海熱、游離唾液酸儲存障礙、額顳葉癡呆伴Parkinson氏症17、延胡索酸酶缺乏症、GJB2相關DFNA 3型非症候群性聽力損失及耳聾、GJB2相關DFNB 1非症候群性聽力損失及耳聾、GNE相關肌病、半乳糖血症、Gaucher氏病、葡萄糖-6-磷酸脫氫酶缺乏症、戊二酸血症1型、醣原貯積病1a型、醣原貯積病Ib型、醣原貯積病II型、醣原貯積病III型、醣原貯積病V型、Gracile症候群、HFE相關聯之遺傳性血鐵沈積症、Halder AIMs、血紅蛋白S β-地中海貧血、遺傳性果糖不耐受、遺傳性胰腺炎、遺傳性胸腺嘧啶-尿嘧啶尿症、己醣胺酶A缺乏症、有汗性外胚層發育異常2、胱硫醚β-合酶缺乏引起之高胱胺酸尿症、高鉀血週期性麻痹1型、高鳥胺酸血症-高氨血症-高瓜胺酸尿症候群、原發性高草酸鹽尿症1型、原發性高草酸鹽尿症2型、軟骨生成減退、低鉀血週期性麻痹1型、低鉀血週期性麻痹2型、低磷酸酶症、嬰兒肌病及乳酸性酸中毒(致死型及非致死型)、異戊酸血症、Krabbe病、LGMD2I、Leber遺傳性視神經病變、法國-加拿大型Leigh症候群、長鏈3-羥醯基-輔酶A脫氫酶缺乏症、MELAS、MERRF、MTHFR缺乏症、MTHFR不耐熱變異、MTRNR1相關聽力損失及耳聾、MTTS1相關聽力損失及耳聾、MYH相關聯之息肉病、楓糖漿尿病1A型、楓糖漿尿病1B型、馬科恩-亞百特氏症候群、中鏈醯基輔酶A脫氫酶缺乏症、巨腦白質病伴皮質下囊腫、異染性白質失養症、粒線體心肌病、粒線體DNA相關聯之Leigh症候群及NARP、黏脂貯積病IV、黏多醣病I型、黏多醣病IIIA型、黏多醣病VII型、多發性內分泌瘤2型、肌-眼-腦疾病、線樣肌病、神經表型、由於神經磷脂酶缺乏引起之尼曼-匹克病、尼曼-匹克病C1型、奈梅亨染色體斷裂症候群、PPT1相關神經性類蠟脂褐質病、PROP1相關下垂體激素缺乏症、Pallister-Hall症候群、先天性肌剛痙病、Pendred症候群、過氧化體雙功能酶缺乏症、廣泛性發展障礙、苯丙胺酸羥化酶缺乏症、血漿蛋白原活化因子抑制物I、體染色體隱性遺傳多囊腎病、凝血酶原G20210A血栓好發症、假維生素D缺乏性佝僂病、緻密成骨不全症、Bothnia型體染色體隱性色素沉著性視網膜炎、雷特氏症候群、肢根性點狀軟骨發育異常1型、短鏈醯基輔酶A脫氫酶缺乏症、Shwachman-Diamond症候群、Sjogren-Larsson症候群、Smith-Lemli-Opitz症候群、痙攣性截癱13、硫酸鹽轉運蛋白相關骨軟骨發育不良、TFR2相關遺傳性血色病、TPP1相關神經性類蠟脂褐質病、致死性軟骨發育不全、運甲狀腺素蛋白澱粉樣變性、三功能蛋白缺乏症、酪胺酸羥化酶缺乏性DRD、酪胺酸血症I型、Wilson氏病、X性聯青年性視網膜劈裂症、囊腫纖維化、脊髓性肌肉萎縮症(SMA)、血紅素病、及Zellweger症候群譜系。
在另一範疇中,本揭露內容提供了富集生物樣本中之游離胎兒DNA(cffDNA)之方法,其包括自孕婦獲得包含游離DNA(cfDNA)之生物樣本,其中該cfDNA包含cffDNA及游離母體DNA(cfmDNA);自該生物樣本中萃取該cfDNA;以及使所萃取之cfDNA經受大小排除過程,其中該大小排除過程具有約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之截止大小,從而產生富集cffDNA之樣本。
在另一範疇中,本揭露內容提供了電腦模擬處理游離DNA(cfDNA)之方法,其包括對包含游離胎兒DNA(cffDNA)及游離母體DNA(cfmDNA)之cfDNA樣本進行定序以製備序列庫;進行基於讀段長度之分析,其中在該序列庫之至少兩個窗口中建立感興趣之核酸序列之等位基因平衡;以及基於該至少兩個窗口之該等位基因平衡建立軌跡。
在另一範疇中,本揭露內容提供了在非侵入性產前篩查(NIPS)中減少來自多餘遺傳物質之背景雜訊之方法,其包括 (i)自孕婦獲得生物樣本,其中該生物樣本包含游離DNA(cfDNA);及 (ii)處理用於NIPS之cfDNA,其中處理包括富集該生物樣本中之游離胎兒DNA(cffDNA)、對該cfDNA進行電腦模擬處理、或其組合。
在一些實施例中,處理包括富集該生物樣本中之游離胎兒DNA(cffDNA)富集及對該cfDNA進行電腦模擬處理兩者。
在一些實施例中,富集該生物樣本中之游離胎兒DNA(cffDNA)包括本文揭示之富集生物樣本中之游離胎兒DNA(cffDNA)之方法中之任一種。
在一些實施例中,對該cfDNA進行電腦模擬處理包括本文揭示之對游離DNA(cfDNA)進行電腦模擬處理之方法中之任一種。
在一些實施例中,該方法可進一步包括正規化以控制GC偏差、樣本背景、雜交探針捕獲、或其組合。
以下實施方式係例示性及解釋性的,但不旨在限制。
[關申請案之交互參考]
本申請案要求2022年1月11日提交之美國臨時申請案第63/298,593號及2022年7月1日提交之美國臨時申請案第63/357,915號之權益,每個申請案之全部內容以引用方式併入本文中。
本文所揭示之樣本製備及方法大體上係關於自一生母收集生物樣本(例如血液或其他含DNA之樣本)然後進行篩查之新穎方法,諸如藉由一非侵入性產前篩查並行檢測非整倍體及基因突變(例如一隱性監測程序)。亦即,本揭露內容提供了一種單一測試(例如,並行測試)以僅使用來自一個個體,即一生母之樣本發現兩組可檢測基因狀況(例如,非整倍體及基因變體篩查)。將此兩種監測測試組合成不涉及生父之單一測試,相較於習知測試及方法提供了效率及方便,該等常規測試及方法通常需要一父親樣本並分別進行非整倍體篩查及基因變體篩查。此外,樣本製備可以改善靈敏度、特異性,並使各種因果基因變體檢測所不需要之多餘遺傳物質之雜訊降至最低。
下文將更全面地描述根據本揭露內容之實施例。然而,本揭露內容之範疇可以不同形式實施,且不應被解釋為受限於本文闡述之實施例。相反,提供此等實施例以使得本揭露內容將為透徹且完整的,且將向所屬技術領域中具有通常知識者充分傳達本發明之範圍。本文描述中所用之術語僅出於描述特定實施例之目的,且不意欲進行限制。
除非另有明確說明,否則所有指定之實施例、特點及術語旨在包括所引用之實施例、特點或術語及其等同物。 I. 定義
如本文所用,單數形式「一」、「一個」、及「該」表示單數及複數兩者,除非明確聲明僅表示單數。
如本文所用,術語「約」應理解為包含所述數值及+/-10%範圍之相對術語。例如,短語「約10」應理解為意指「10」及「9至11」兩者。
此外,如本文所用,「及/或」係指且包含一個或多個相關聯列出項之任何及所有可能之組合,以及當以替代(「或」)解釋時不進行組合。
如本文所用,「可選」或「可選地」係指隨後描述之事件或情況可能發生或可能不發生,並且該描述包括該事件或情況發生之情況及其不發生之情況。
如本文所用,「DNA結合顆粒」係指任何與DNA片段如cfDNA片段相互作用之習知固相材料,或經修飾以與該DNA片段相互作用之常規固相材料。例如,固相材料係任何類型之不溶性、通常剛性之材料、基質、或固定相材料,其在反應溶液中直接或間接與DNA相互作用。在某些例示性實施例中,DNA結合顆粒係珠粒。
如本文所用,「珠粒」係指任何方便尺寸之固相顆粒,且可以具有不規則或規則的形狀。在某些例示性實施例中,珠粒之表面經修飾以直接及/或間接結合DNA。例如,珠粒可包括矽烷醇基團、羧基基團、或促進珠粒與DNA直接相互作用及/或相互作用之其他基團。在某些例示性實施例中,二氧化矽珠粒(及凝膠)可以藉由將一級胺、硫醇、巰基、丙基、辛基、以及其他衍生物添加至附著於二氧化矽之羥基基團(矽烷醇)而被官能化。珠粒可由任何數目的已知材料製成,包括纖維素、纖維素衍生物、丙烯酸樹脂、玻璃、矽膠、聚苯乙烯、明膠、聚乙烯吡咯啶酮、乙烯基與丙烯醯胺之共聚物、與二乙烯基苯或類似物交聯之聚苯乙烯、聚丙烯醯胺、乳膠凝膠、聚苯乙烯、葡聚糖、橡膠、矽、塑膠、硝化纖維素、天然海綿、矽膠、受控多孔玻璃(CPG)、金屬、交聯葡聚糖(例如Sephadex®)、瓊脂糖凝膠(Sepharose®)、及所屬技術領域中具有通常知識者已知之其他固相珠粒支撐物。在某些例示性實施例中,珠粒可被填充在一起,以便形成可以與習知管柱層析法一起使用之管柱。
如本文所用,術語「基因變體」在用於提及本文所述之篩查、調用、或過程時係指被視為一非致病性或野生型基因序列之改變。因此,術語「基因變體」包括致病性單核苷酸多態性(SNP)、受試者基因體內鹼基之插入或缺失、置換突變、單基因拷貝數變異等。此外,應注意,本文使用之術語「基因變體」不同於非整倍體,且術語「基因變體」不涉及缺失或額外之染色體。相反,術語「基因變體」應理解為與受試者基因體序列中之特徵或改變(致病性的或其他)有關,而非染色體異常。
如本文所用,術語「cfDNA庫」或「核酸庫」可互換使用,以指核酸之集合,例如,衍生自生物樣本之游離核酸之集合。在一些實施例中,cfDNA庫或核酸庫藉由擴增樣本中之核酸或以其他方式使用基於無PCR之方法製備庫來產生。在一些實施例中,cfDNA庫或核酸庫藉由擴增樣本內之特定目標片段而產生,如下詳述。在一些實施例中,cfDNA庫或核酸庫中之部分或全部核酸包含轉接子序列。轉接子序列可以位於一端或兩端。轉接子序列可用於例如定序方法(例如NGS法)、擴增、反轉錄、或選殖至一載體中。
cfDNA庫或核酸庫可包含核酸片段之集合,其可包含靶核酸序列(例如,其中可檢測到與疾病相關聯之基因變體之核酸序列)、參考核酸序列、或其組合。在一些實施例中,可組合來自相同受試者之二或更多個cfDNA或核酸庫。
如本文所用,「序列庫」係已經藉由對cfDNA庫或核酸庫進行定序,例如使用大規模並行方法(諸如下一代定序或NGS)而製備之核酸序列之集合。NGS通常指允許對選殖擴增的及單一核酸分子進行大規模並行定序之定序方法,在此過程中,來自單一樣本或多個不同樣本之複數個,例如數百萬個核酸片段被一致定序。NGS之非限制性實例包括合成定序、連接定序、實時定序、及奈米孔定序。 II. 樣本製備
游離DNA(cfDNA)係性質(例如大小、序列、豐度)以及來源組織(例如母體對胎兒)不同之DNA混合物。例如,自孕婦獲得之cfDNA含母體及胎兒來源之DNA。當在給定母體血漿樣本中利用cfDNA時,NIPS靈敏度之主要驅動因素係胎兒部分(FF)。胎兒部分包括來自胎兒或衍生自游離胎兒DNA(cffDNA)之總游離DNA部分。對於大多數樣本,FF值介於1%與30%之間,但在許多情況下,該數量甚至可能更低。
本揭露內容提供了樣本製備及自孕婦(即,妊婦或生母)製備樣本之方法,其可用於改善靈敏度、特異性,並在進行NIPS時將雜訊降至最低。具體而言,樣本製備可能依賴於自孕婦獲得之cfDNA樣本之物理處理、對自孕婦獲得之cfDNA樣本產生之定序讀段之電腦模擬處理、或其組合。 A. 胎兒部分之物理富集
藉由本揭露內容之方法對自孕婦獲得之cfDNA樣本(例如血液)之物理處理可以使cfDNA樣本之胎兒部分富集高達3倍。具體而言,藉由使用保留大部分胎兒游離DNA片段並去除大的游離母體DNA片段中的一些之大小截止值進行大小選擇,可以在樣本中富集胎兒部分。例如,可設定截止值以保留小於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之cfDNA片段。
在一些實施例中,該方法可用於選擇及分離以下片段:少於75個核苷酸、少於80個核苷酸、少於85個核苷酸、少於90個核苷酸、少於95個核苷酸、少於100個核苷酸、少於105個核苷酸、少於110個核苷酸、少於115個核苷酸、少於120個核苷酸、少於125個核苷酸、少於130個核苷酸、少於135個核苷酸、少於140個核苷酸、少於145個核苷酸、少於150個核苷酸、少於155個核苷酸、少於160個核苷酸、少於165個核苷酸、少於170個核苷酸、少於175個核苷酸、少於180個核苷酸、少於195個核苷酸、少於200個核苷酸、少於205個核苷酸、少於206個核苷酸、少於210個核苷酸、少於215個核苷酸、少於220個核苷酸、少於225個核苷酸、少於230個核苷酸、少於235個核苷酸、少於240個核苷酸、少於245個核苷酸、少於250個核苷酸、少於255個核苷酸、少於260個核苷酸、少於265個核苷酸、少於270個核苷酸、少於275個核苷酸、少於280個核苷酸、少於285個核苷酸、少於290個核苷酸、少於295個核苷酸、少於300個核苷酸、少於305個核苷酸、少於310個核苷酸、少於311個核苷酸、少於315個核苷酸、少於320個核苷酸、或少於325個核苷酸。在一些實施例中,目標大小可以係少於125個核苷酸、少於130個核苷酸、少於135個核苷酸、少於140個核苷酸、少於145個核苷酸、少於150個核苷酸、少於155個核苷酸、少於160個核苷酸、少於165個核苷酸、少於170個核苷酸、少於175個核苷酸、少於180個核苷酸、少於195個核苷酸、或少於200個核苷酸。不管精確截止值或目標大小如何,該過程之目標係保留cffDNA而損失很少或沒有損失,並將cfmDNA減至最少或耗盡。
此種類型之基於大小之排除可以使用電泳(例如,凝膠電泳或毛細管電泳)及其他已知方法來進行,該等方法可以利用例如DNA結合顆粒,諸如珠粒(例如,AMPURE™珠粒)。在一個實施例中,使用核酸電泳分離,然後回收所需之片段長度。各種已知之電泳過程可用於此目的,但在一個實施例中,可使用用於高通量核酸大小選擇的具有Ranger Technology™之NIMBUS Select™工作站。用於片段大小選擇之其他策略包括遵循製造商關於「範圍」模式之說明在瓊脂糖盒(BluePippin,Sage Science)上進行電泳。自凝膠中洗脫出短片段,直至獲得所洗脫的DNA之所需目標大小。其他方法包括但不限於固體支撐物捕獲(例如親和管柱),諸如抗體包被之旋轉管柱;阻力改變大小之同步(或非同步)係數(synchronous (or non-synchronous) coefficient of drag alteration sizing;SCODA);固相可逆固定化施膠(例如,使用羧基化磁珠粒);親和層析過程,或具有不同長度擴增子之PCR擴增與微晶片分離之組合。
所揭示之基於大小之排除方法可使cfDNA樣本中之胎兒部分富集至少1.1X、1.2X、1.25X、1.5X、1.75X、2X、2.25X、2.5X、2.75X、3X、3.25X、3.5X、3.75X、4X、4.25X、4.5X、4.75X、5X、5.5X、6X、6.5X、7X、7.5X、8X、8.5X、9X、9.5X、10X、15X、20X、25X、或更多倍。
因此,本揭露內容提供了游離胎兒DNA(cffDNA)之大小選擇方法,其包括使包含cffDNA及游離母體DNA(cfmDNA)之游離DNA(cfDNA)樣本經受大小排除過程,以富集自孕婦獲得之DNA樣本中之胎兒部分。 B. 胎兒部分之電腦模擬富集
本揭露內容還提供了自孕婦獲得之cfDNA樣本(例如,血液、血漿、血清)之電腦模擬富集,其能夠進一步富集cfDNA樣本之胎兒部分。具體而言,所揭示之電腦模擬富集包括基於讀段長度之大小分析。為了本揭露內容之目的,「基於讀段長度之大小分析」係一種電腦模擬過程,其自一系列窗口中建立軌跡,該軌跡應用於對讀段資料進行定序。已建立之軌跡基於在一組FF水平上觀察到之等位基因平衡(AB)。因此,藉由來自不同窗口之電腦模擬大小選擇來確定FF水平,從而允許區分母體及胎兒DNA(分別為cfmDNA及cffDNA)。例如,軌跡可以示出10% FF時之AB為55%,15% FF時之AB為60%,且20% FF時之AB為65%。此係向上傾斜之軌跡,因為AB隨著FF增加而增加。此種軌跡之斜率及偏移(或截距)二者皆有用。例如,若cfmDNA主要藉由一給定窗口進行選擇,使得FF儘可能低,則所得AB主要反映母體基因型。隨著具有更小片段之窗口拾取更多FF,AB之偏轉指示胎兒基因型。因此,若截距為約50%(意味著母親係變體之雜合體),則斜率為負之軌跡表明胎兒沒有遺傳特定之母體變體。
理解cfDNA樣本中之等位基因平衡改進了關注所需樣本部分之能力(例如,用於非整倍體及基因變體分析之FF,或用於攜帶者分析之母體部分)。在一些實施例中,在基於大小之移動窗口分析之後進行體外適度大小選擇(即,物理處理/大小排除)可以提供最佳結果。
一旦已經製備序列庫,序列庫之胎兒部分可以使用電腦模擬移動窗口分析進一步處理或富集。出於所揭示方法之目的,「窗口」係序列庫之選擇或子部分,其包括特定大小範圍之序列。例如,「窗口」可包含序列庫中之所有序列,該等序列係0-145個核苷酸、0-150個核苷酸、0-155個核苷酸、0-160個核苷酸、0-165個核苷酸、0-170個核苷酸、0-175個核苷酸、0-180個核苷酸、0-185個核苷酸、0-190個核苷酸、0-195個核苷酸、0-200個核苷酸、0-205個核苷酸、0-210個核苷酸、0-215個核苷酸、0-220個核苷酸、0-225個核苷酸、25-145個核苷酸、25-150個核苷酸、25-155個核苷酸、25-160個核苷酸、25-165個核苷酸、25-170個核苷酸、25-175個核苷酸、25-180個核苷酸、25-185個核苷酸、25-190個核苷酸、25-195個核苷酸、25-200個核苷酸、25-205個核苷酸、25-210個核苷酸、25-215個核苷酸、25-220個核苷酸、25-225個核苷酸、50-145個核苷酸、50-150個核苷酸、50-155個核苷酸、50-160個核苷酸、50-165個核苷酸、50-170個核苷酸、50-175個核苷酸、50-180個核苷酸、50-185個核苷酸、50-190個核苷酸、50-195個核苷酸、50-200個核苷酸、50-205個核苷酸、50-210個核苷酸、50-215個核苷酸、50-220個核苷酸、50-225個核苷酸、75-145個核苷酸、75-150個核苷酸、75-155個核苷酸、75-160個核苷酸、75-165個核苷酸、75-170個核苷酸、75-175個核苷酸、75-180個核苷酸、75-185個核苷酸、75-190個核苷酸、75-195個核苷酸、75-200個核苷酸、75-205個核苷酸、75-210個核苷酸、75-215個核苷酸、75-220個核苷酸、75-225個核苷酸、100-145個核苷酸、100-150個核苷酸、100-155個核苷酸、100-160個核苷酸、100-165個核苷酸、100-170個核苷酸、100-175個核苷酸、100-180個核苷酸、100-185個核苷酸、100-190個核苷酸、100-195個核苷酸、100-200個核苷酸、100-205個核苷酸、100-210個核苷酸、100-215個核苷酸、100-220個核苷酸、100-225個核苷酸、或介於之間的任何範圍。若不設定一特定最大值及最小值,窗口可被視為「未閘控的」,且相反該窗口包括整個序列庫。圖2示出其中序列庫中之序列被分成四個窗口之一實例。
因此,所揭示之電腦模擬富集方法可包括對序列庫之至少兩個窗口中之序列進行基於讀段長度之大小排除,從而獲得至少兩個富集胎兒部分之序列庫。在一些實施例中,可以評估3、4、5、6、7、8、9、10、或更多個窗口。在一些實施例中,可以評估至少5個、至少6個、至少7個、或至少8個窗口。在一些實施例中,窗口大小相同(例如,各窗口包含設定範圍之核苷酸,諸如0-100、5-105、10-110等)。在一些實施例中,窗口具有不同之大小。例如,每個附加窗口之大小可以增加,而最小值保持相同(例如,一組窗口之大小截止值為0-145、0-150、0-155、0-160、0-165、0-170等)。比較每個窗口中之等位基因平衡允許計算各個富集胎兒部分之序列庫之間的等位基因平衡軌跡。該軌跡係任何給定感興趣之基因序列之等位基因平衡百分比跨所觀察窗口之變化。等位基因平衡軌跡可計算為每個所觀察窗口中等位基因平衡之斜率,並且它可以多種方式視覺化,如圖3所示。
此外,cfmDNA序列庫可藉由在兩種片段大小(諸如100-200個核苷酸、105-200個核苷酸、110-200個核苷酸、115-200個核苷酸、120-200個核苷酸、125-200個核苷酸、130-200個核苷酸、135-200個核苷酸、140-200個核苷酸、140-200個核苷酸、145-200個核苷酸、150-200個核苷酸、155-200個核苷酸、160-200個核苷酸、165-200個核苷酸、170-200個核苷酸、或175-200個核苷酸或介於之間的任何大小範圍)之間進行集中分析來富集。在一些實施例中,選擇用於富集之大小範圍可為約155至約200個核苷酸。
在一些實施例中,該序列庫之至少兩個窗口選自(i)0-145個核苷酸之序列、(ii)0-150個核苷酸之序列、(iii)0-155個核苷酸、(iv)0-160個核苷酸、(v)0-165個核苷酸、(vi)0-168個核苷酸、(vii)0-170個核苷酸、(viii)0-175個核苷酸、(ix)0-180個核苷酸、(x)0-185個核苷酸、(xi)0-190個核苷酸、(xii)0-195個核苷酸、(xiii)0-200個核苷酸、及(xiv)未閘控者。在一些實施例中,至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口選自(i)0-145個核苷酸之序列、(ii)0-150個核苷酸之序列、(iii)0-155個核苷酸、(iv)0-160個核苷酸、(v)0-165個核苷酸、(vi)0-168個核苷酸、(vii)0-170個核苷酸、(viii)0-175個核苷酸、(ix)0-180個核苷酸、(x)0-185個核苷酸、(xi)0-190個核苷酸、(xii)0-195個核苷酸、(xiii)0-200個核苷酸、及(xiv)未閘控者。
電腦模擬富集序列庫之胎兒部分還可以進一步包括藉由將第一序列庫中之cffDNA及cfmDNA之序列讀段與參考基因體進行比較、對來自第一庫中之序列讀段進行解多工、自第一序列庫中去除重複序列、或其組合,從而自cfmDNA中鑑定及分離cffDNA。
例如,樣本製備可包括電腦模擬二進制比對處理,其中所收集之DNA樣本可以藉由使用短定序讀段之間之重疊進行計算重建。若可獲得定序讀段可與之比對之參考基因體,則可促進基因體之重建。可使用序列比對工具將儲存在檔案中之短讀段映射至參考基因體。隨後,可使用深度及變體處理來鑑定及分離特定基因序列,以通知後續分析,其可以針對例如特定非整倍體及/或基因變體之鑑定。以此種方式,僅用有限量之最初收集之cfDNA,即可以標繪及彙集所收集之DNA之特定部分,以用於特異性測定檢測(specific assay detection)。
所收集之DNA樣本可以藉由使用短定序讀段之間之重疊進行計算重建。因此,可以使用解多工器(例如,demux)在第一遍標繪DNA樣本,此允許確定評估特定篩查(例如,攜帶者、產前等)可能需要之獨特分子標識符。獨特分子標識符(UMI)(有時稱為分子條形碼(MBC))係在定序庫製備方案中添加至DNA片段上之短序列(例如標籤),以鑑定特定篩查可能針對之所需DNA分子。該等標籤在任何擴增之前添加,並可用於減少擴增引入之誤差及定量偏差。
一旦被標記,特定標記之DNA序列最初可以使用比對處理進行比對,以彼此標繪出所需之DNA序列。接著重複減少(例如,「去重複」)可以清除任何錯誤的鑑定及/或未比對,此可包括保留成對末端讀段之重疊部分之共有序列。此後,可以進行再比對過程,以在所需DNA序列與所標記之DNA序列之間產生更穩健之標繪。
可使用擴增來分離感興趣或隨後篩查所需之特異性核酸序列。例如,可以使用計算工具來計算理論聚合酶鏈式反應(PCR)結果,使用給定一組引子(探針)自所定序之DNA樣本中擴增DNA序列,從而完成電腦模擬擴增。擴增後,可以藉由去除(例如,修剪)位於序列開始及結束處之部分(例如,不完整)序列來提高特異性讀段序列之品質。達成此點之一例示性但非限制性之方法被稱為成對末端(PE)修剪,其可包括兩個輸入檔案(用於正向及反向讀段)及四個輸出檔案(用於正向成對、正向不成對、反向成對、及反向不成對讀段)以鑑定及去除部分序列。有用的DNA樣本之重建可被促進並儲存在備用檔案中。此外,可根據片段長度(根據核苷酸數目)將檔案標繪為不同之二進數。
作為深度及變體處理之一部分,可以鑑定及分離儲存在檔案中之特異性基因序列,以通知針對特定非整倍體及/或因果基因變體之後續分析。該檔案可在特定程序中使用,以減輕初始收集之樣本中之偏差。前述之電腦模擬步驟及計算製備可以針對給定測試或篩查之特定目標,針對特異性DNA序列將DNA樣本最佳化。
所揭示之電腦模擬處理可使cfDNA樣本中之胎兒部分富集至少1.1X、1.2X、1.25X、1.5X、1.75X、2X、2.25X、2.5X、2.75X、3X、3.25X、3.5X、3.75X、4X、4.25X、4.5X、5.75X、5X、5.5X、6X、6.5X、7X、7.5X、8X、8.5X、9X、9.5X、10X、15X、20X、25X、或更多倍。
替代地,若需要,所揭示之電腦模擬處理還可用於藉由選擇較大之片段來富集樣本之母體部分。在一些實施例中,所揭示之電腦模擬處理可以使cfDNA樣本中之母體部分富集至少1.1X、1.2X、1.25X、1.5X、1.75X、2X、2.25X、2.5X、2.75X、3X、3.25X、3.5X、3.75X、4X、4.25X、4.5X、5.75X、5X、5.5X、6X、6.5X、7X、7.5X、8X、8.5X、9X、9.5X、10X、15X、20X、25X、或更多倍。
因此,本揭露內容提供了cffDNA之電腦模擬分選及富集之方法,其包括對包含cffDNA及游離DNA母體(cfmDNA)之游離DNA(cfDNA)樣本進行定序,並進行基於讀段長度之大小分析,其中基於大小之移動窗口用於基於cfmDNA與cffDNA之間之等位基因平衡建立軌跡,從而闡明給定樣本中cfmDNA或cffDNA之基因型。在一些實施例中,此類方法可進一步包括藉由將cffDNA及cfmDNA之序列讀段與參考基因體進行比較、對序列讀段進行解多工、以及去除重複序列,從而自cfmDNA中鑑定及分離cffDNA。 C. 物理富集與電腦模擬富集之組合
前述樣本製備方法可單獨或組合進行,以富集給定樣本之胎兒部分。在物理富集或電腦模擬富集之前,可藉由習知方式自母體樣本(如血液、血漿、血清)中分離總cfDNA。例如,可以使用Apostle™游離DNA萃取套組自樣本中獲得之澄清血漿中萃取總cfDNA。亦可使用用於cfDNA萃取之其他已知方法及市售套組,包括但不限於Molzym GmbH & Co KG(德國不來梅)、Qiagen(德國希爾登)、Macherey-Nagel(德國杜倫)、Roche(瑞士巴塞爾)、及Sigma(德國戴森霍芬)生產之套組。
在物理富集及電腦模擬富集之後,胎兒部分可為用於進一步測試、篩查、或分析之DNA樣本之2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、85%、90%、95%、99%、或100%。附加地或替代地,在物理富集及電腦模擬富集之後,胎兒部分可為約5%至100%、約5%至約95%、約5%至約90%、約5%至約85%、約5%至約80%、約5%至約75%、約10%至100%、約10%至約95%、約10%至約90%、約10%至約85%、約10%至約80%、約10%至約75%、約15%至100%、約15%至約95%、約15%至約90%、約15%至約85%、約15%至約80%、約15%至約75%、約20%至100%、約20%至約95%、約20%至約90%、約20%至約85%、約20%至約80%、約20%至約75%、約25%至100%、約25%至約95%、約25%至約90%、約25%至約85%、約25%至約80%、約25%至約75%、約30%至100%、約30%至約95%、約30%至約90%、約30%至約85%、約30%至約80%、約30%至約75%、約35%至100%、約35%至約95%、約35%至約90%、約35%至約85%、約35%至約80%、約35%至約75%、約40%至100%、約40%至約95%、約40%至約90%、約40%至約85%、約40%至約80%、約40%至約75%、約45%至100%、約45%至約95%、約45%至約90%、約45%至約85%、約45%至約80%、約45%至約75%、約50%至100%、約50%至約95%、約50%至約90%、約50%至約85%、約50%至約80%、及約50%至約75%。
因此,本揭露內容提供了製備具有經富集之胎兒部分之游離DNA樣本之方法,其包括使用大小排除處理cfDNA樣本以保留游離胎兒DNA(cffDNA)並去除游離母體DNA(cfmDNA),進行電腦處理以自cfmDNA中鑑定及分離cffDNA,或其組合。 III. 並行篩查方法
本揭露內容提供了僅利用來自胎兒生母之單一生物樣本(如血液、血漿、血清)評估或篩查胎兒中非整倍體及基因變體之方法。習知地,非整倍體測試及基因變體測試係分開進行,並且需要多個樣本。事實上,篩查某些病況甚至還需要自生父獲得生物樣本。所揭示方法克服了該等問題,並用於提供改善習知非侵入性產前篩查(NIPS)之新的有用方法。
所揭示方法可包括利用來自生母之同一單一cfDNA樣本的兩種並行篩查:用於檢測非整倍體之第一篩查及用於檢測基因變體之第二篩查。
在第一篩查中,所收集之樣本之特定子部分(例如,較小cfDNA片段之子部分)可用於將胎兒部分最佳化,以評估非整倍體狀況之存在或不存在。非整倍體之存在或不存在可藉由確定允許區分母體及胎兒DNA之軌跡來確定。以此種方式,所揭示之篩查可同時評估胎兒非整倍體及母體非整倍體,此在之前係不可能的。第一篩查可以附加地或替代地依賴定序深度來確定給定樣本中是否存在或不存在非整倍體。
在第二篩查中,可使用所收集之樣本之特定子部分(例如,較小cfDNA片段之子部分)將胎兒部分最佳化並將來自多餘遺傳物質之雜訊降至最低。然後,藉由例如建立軌跡以自多餘樣本材料中標繪出相關樣本材料,可使用該子部分檢測各種基因變體。在每種篩查中,使用包括適當比率之游離母體DNA(cfmDNA)與游離胎兒cffDNA之基因樣本之最佳刈幅,允許以合理之確定性檢測已知非整倍體及基因變體之存在或不存在,而不必求助於針對一種方法或另一種方法定製並行篩查之個體焦點。
該等方法可以自生母收集樣本開始,典型地藉由抽血,儘管亦考慮了其他生物樣本(例如,血漿、血清等)。該樣本包含游離DNA(cfDNA)。cfDNA可包括各種自由循環之DNA,包括循環腫瘤DNA(ctDNA)、游離粒線體DNA(cf mtDNA)、游離母體DNA(cfmDNA)、及游離胎兒DNA(cffDNA)。由於受試者係妊婦,cfDNA樣本中亦將會存在一定水平之胎兒DNA。此外,還可進行適合特定基因序列之靶向DNA捕獲。因此,cfDNA及靶向捕獲之範疇皆可用於所揭示方法之目的。
在一個範疇中,本揭露內容提供了並行檢測單一母體樣本中非整倍體及至少一種基因突變之存在或不存在之方法,其包括(i)自孕婦獲得生物樣本,其中該生物樣本包含游離DNA(cfDNA);(ii)製備cfDNA庫(例如,藉由擴增cfDNA片段之目標群體);(iii)對該cfDNA庫進行定序以製備序列庫;及(iv)檢測該單一母體樣本中非整倍體及至少一種基因變體之存在或不存在; 其中(a)使cfDNA庫富集以增加胎兒部分,(b)使序列庫富集以增加胎兒部分,或(c)其組合,使得在檢測單一母體樣本中非整倍體及至少一種基因變體存在或不存在之前,單一母體樣本之胎兒部分增加至少1.5倍。在一些實施例中,使cfDNA庫富集以增加胎兒部分,且使序列庫富集以增加胎兒部分。以下各部分提供關於每種富集形式之相關過程之更多細節。 (i). 生物樣本
為了所揭示方法之目的,生物樣本需要含cfDNA,包括cffDNA。可自生母獲得用於所揭示方法之樣本之實例包括但不限於血液、血清、及血漿。
在一些實施例中,核酸萃取將在擴增樣本中之cfDNA及製備該cfDNA庫或該等cfDNA庫之前進行。用於核酸萃取之各種方案可用於本技術之方法中。市售核酸純化套組之實例包括Apostle MiniMax套組、Molzym GmbH & Co KG(德國不來梅)、Qiagen(德國希爾登)、Macherey-Nagel(德國杜倫)、Roche(瑞士巴塞爾)或Sigma(德國戴森霍芬)。亦可使用基於使用聚苯乙烯珠粒等作為支撐材料之其他核酸純化系統。亦可使用自動化DNA萃取平台,諸如QIAsymphony ®、Hamilton ®自動化、或Biorobot ®EZ1 TM自動化系統。 (ii).       cfDNA庫製備
cfDNA庫製備可使用已知之擴增方法(例如xGen Prism庫製備套組(IDT™))以及無PCR之庫製備方法進行,諸如Illumina生產之COLLIBRI™、NEBNEXT®及TRUSEQ™套組、Roche生產之KAPA™ HyperPrep套組、及MG Tech生產之MGIEasy套組。可選地,cfDNA庫之製備可包括末端修復之步驟。cfDNA可包含對給定核酸序列末端之其他損傷之突出端,且末端修復可將此種損傷或剪切之DNA轉化為更容易連接至轉接子、標籤、或條形碼之平端分子(blunt-ended molecule)。可進行一個或多個連接反應,以將轉接子連接至樣本之核酸序列上。轉接子用於藉由提供引子可以退火之一致序列來促進擴增,並用於分離感興趣之序列。轉接子可為一獨特長度(以允許藉由電泳進行分開及分離)、一獨特序列,或包含其他特徵以幫助擴增後分離目標核酸序列。
基於PCR之方法通常用於在給定核酸樣本之定序或分析之前產生經擴增之庫;然而,PCR並非必需的,且所屬技術領域中具有通常知識者將知悉不含PCR之庫製備方法。利用市售試劑及聚合酶之各種PCR方法可用於庫製備之核酸擴增部分(例如,KAPA™ HiFi HotStart ReadyMix)。
使用本文描述或所屬技術領域中具有通常知識者以其他方式已知之任何方法,可以自母體樣本中製備cfDNA庫。可選地,cfDNA庫可以使用已知方法進行清理,諸如使用AMPURE珠粒或其他類似之方法分離庫中之經擴增之片段,以便自樣本中去除鹽、不需要的大分子、及其他碎片。
在cfDNA庫定序之前,可如本文所述使胎兒部分富集。另外或替代地,在製備cfDNA庫之前,可自母體樣本中使胎兒部分富集。簡言之,富集cfDNA庫或母體樣本之胎兒部分係對樣本之物理處理,其可包括自cfDNA庫中去除任何大於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、約180個核苷酸長度、約185個核苷酸長度、約190個核苷酸長度、約195個核苷酸長度、或約200個核苷酸長度之DNA片段。
此種類型之基於大小之排除可以使用電泳(例如,凝膠電泳或毛細管電泳)及其他已知方法來進行,該等方法可以利用例如DNA結合顆粒,諸如珠粒(例如,AMPURE™珠粒)。在一個實施例中,使用核酸電泳分離,然後回收所需之片段長度。各種已知電泳過程可以用於此種目的。例如,在一個實施例中,可使用用於高通量核酸大小選擇的具有Ranger Technology™之NIMBUS Select™工作站。在另一實施例中,可使用BluePippin電泳系統。
先前之基於大小之排除方法已用於富集cfDNA庫之胎兒部分,但與彼等先前之方法不同,本發明人發現,如本文所述,當與進一步的電腦模擬選擇相結合時,使用更高截止值可改善雜訊降低效果。簡言之,儘管不受理論之束縛,但由於藉由更寬容的大小選擇保留了更高總數之cffDNA分子,因此可以降低雜訊。習知地認為使用較低截止值更優異,因為它排除了更多母體cfDNA。圖1示出了所揭示之大小排除過程與傳統方法之比較。如圖1所示,該等限制性更強之傳統方法亦丟棄了大量cffDNA。因此,所揭示之將更「寬容」之大小排除技術與進一步之電腦模擬富集組合之方法係一種改進,其具體解決了產前篩查領域中之一關鍵問題:胎兒部分之富集,而不會無意中或不必要地丟棄在一給定之樣本內供應極其受限之cffDNA。
所揭示之基於大小之排除方法可使cfDNA樣本中之胎兒部分富集至少1.1X、1.2X、1.25X、1.5X、1.75X、2X、2.25X、2.5X、2.75X、3X、3.25X、3.5X、3.75X、4X、4.25X、4.5X、5.75X、5X、5.5X、6X、6.5X、7X、7.5X、8X、8.5X、9X、9.5X、10X、15X、20X、25X、或更多倍。 (iii).      對核酸庫進行定序
可以富集胎兒部分之核酸庫可使用已知定序方法進行定序(例如,NovaSeq定序儀及流通池、Illumina定序儀、焦磷酸定序(pyrosequencing)、可逆染料終止子定序(Reversible dye-terminator sequencing)、SOLiD定序、離子半導體定序、Helioscope單分子定序、Ion Torrent TM(Life Technologies,加利福尼亞州卡爾斯巴德)擴增子定序系統、454 TMGS FLX TM定序系統、SMRT TM定序等)。在一些實施例中,自兩端對核酸庫中之cfDNA片段進行定序(即,成對末端模式)。在一些實施例中,對核酸庫中之cfDNA片段進行一端定序(即,單末端模式)。在一些實施例中,核酸庫中之cfDNA片段可以使用所靶向捕獲方法諸如雜交捕獲來分離或結合。自每個片段之兩個末端定序允許確定片段之長度。在一些實施例中,可使用所得序列繪製cfDNA片段。
在一些實施例中,所揭示方法可利用目標捕獲方法僅對感興趣之特定片段進行定序。感興趣之片段可例如對應於編碼與遺傳性疾病、病況、或性狀(即感興趣之基因變體)相關之基因之cfDNA或對應於特定染色體之cfDNA。
一旦對核酸庫中之cfDNA片段進行了定序,可使用本文所述之電腦模擬移動窗口分析進一步富集序列庫之胎兒部分。為了所揭示方法之目的,「窗口」係包括特定大小範圍之序列的序列庫之選擇或子部分。例如,「窗口」可包含序列庫中之所有序列,該等序列係0-145個核苷酸、0-150個核苷酸、0-155個核苷酸、0-160個核苷酸、0-165個核苷酸、0-170個核苷酸、0-175個核苷酸、0-180個核苷酸、0-185個核苷酸、0-190個核苷酸、0-195個核苷酸、0-200個核苷酸、25-145個核苷酸、25-150個核苷酸、25-155個核苷酸、25-160個核苷酸、25-165個核苷酸、25-170個核苷酸、25-175個核苷酸、25-180個核苷酸、25-185個核苷酸、25-190個核苷酸、25-195個核苷酸、25-200個核苷酸、50-145個核苷酸、50-150個核苷酸、50-155個核苷酸、50-160個核苷酸、50-165個核苷酸、50-170個核苷酸、50-175個核苷酸、50-180個核苷酸、50-185個核苷酸、50-190個核苷酸、50-195個核苷酸、50-200個核苷酸、75-145個核苷酸、75-150個核苷酸、75-155個核苷酸、75-160個核苷酸、75-165個核苷酸、75-170個核苷酸、75-175個核苷酸、75-180個核苷酸、75-185個核苷酸、75-190個核苷酸、75-195個核苷酸、75-200個核苷酸、100-145個核苷酸、100-150個核苷酸、100-155個核苷酸、100-160個核苷酸、100-165個核苷酸、100-170個核苷酸、100-175個核苷酸、100-180個核苷酸、100-185個核苷酸、100-190個核苷酸、100-195個核苷酸、100-200個核苷酸、或其之間的任何範圍。在一些實施例中,所揭示方法可利用二或更多個(例如,2、3、4、5、6、7、8、9、或10個、或更多個)窗口,該等窗口包含選自以下之二或更多個(例如,2、3、4、5、6、7、8、9、或10個、或更多個)大小範圍中之片段:0-145個核苷酸、0-146個核苷酸、0-147個核苷酸、0-148個核苷酸、0-149個核苷酸、0-150個核苷酸、0-151個核苷酸、0-152個核苷酸、0-153個核苷酸、0-154個核苷酸、0-155個核苷酸、0-156個核苷酸、-157個核苷酸、0-158個核苷酸、0-159個核苷酸、0-160個核苷酸、0-161個核苷酸、0-162個核苷酸、0-163個核苷酸、0-164個核苷酸、0-165個核苷酸、0-166個核苷酸、0-167個核苷酸、0-168個核苷酸、0-169個核苷酸、0-170個核苷酸、0-171個核苷酸、0-172個核苷酸、0-173個核苷酸、0-174個核苷酸、0-175個核苷酸、0-176個核苷酸、0-177個核苷酸、0-178個核苷酸、0-179個核苷酸、0-180個核苷酸、0-181個核苷酸、0-182個核苷酸、0-183個核苷酸、0-184個核苷酸、0-185個核苷酸、0-186個核苷酸、0-187個核苷酸、0-188個核苷酸、0-189個核苷酸、0-190個核苷酸、0-191個核苷酸、0-192個核苷酸、0-193個核苷酸、0-194個核苷酸、0-195個核苷酸、0-196個核苷酸、0-197個核苷酸、0-198個核苷酸、0-199個核苷酸、0-200個核苷酸、5-145個核苷酸、5-146個核苷酸、5-147個核苷酸、5-148個核苷酸、5-149個核苷酸、5-150個核苷酸、5-151個核苷酸、5-152個核苷酸、5-153個核苷酸、5-154個核苷酸、5-155個核苷酸、5-156個核苷酸、-157個核苷酸、5-158個核苷酸、5-159個核苷酸、5-160個核苷酸、5-161個核苷酸、5-162個核苷酸、5-163個核苷酸、5-164個核苷酸、5-165個核苷酸、5-166個核苷酸、5-167個核苷酸、5-168個核苷酸、5-169個核苷酸、5-170個核苷酸、5-171個核苷酸、5-172個核苷酸、5-173個核苷酸、5-174個核苷酸、5-175個核苷酸、5-176個核苷酸、5-177個核苷酸、5-178個核苷酸、5-179個核苷酸、5-180個核苷酸、5-181個核苷酸、5-182個核苷酸、5-183個核苷酸、5-184個核苷酸、5-185個核苷酸、5-186個核苷酸、5-187個核苷酸、5-188個核苷酸、5-189個核苷酸、5-190個核苷酸、5-191個核苷酸、5-192個核苷酸、5-193個核苷酸、5-194個核苷酸、5-195個核苷酸、5-196個核苷酸、5-197個核苷酸、5-198個核苷酸、5-199個核苷酸、5-200個核苷酸、10-145個核苷酸、10-146個核苷酸、10-147個核苷酸、10-148個核苷酸、10-149個核苷酸、10-150個核苷酸、10-151個核苷酸、10-152個核苷酸、10-153個核苷酸、10-154個核苷酸、10-155個核苷酸、10-156個核苷酸、-157個核苷酸、10-158個核苷酸、10-159個核苷酸、10-160個核苷酸、10-161個核苷酸、10-162個核苷酸、10-163個核苷酸、10-164個核苷酸、10-165個核苷酸、10-166個核苷酸、10-167個核苷酸、10-168個核苷酸、10-169個核苷酸、10-170個核苷酸、10-171個核苷酸、10-172個核苷酸、10-173個核苷酸、10-174個核苷酸、10-175個核苷酸、10-176個核苷酸、10-177個核苷酸、10-178個核苷酸、10-179個核苷酸、10-180個核苷酸、10-181個核苷酸、10-182個核苷酸、10-183個核苷酸、10-184個核苷酸、10-185個核苷酸、10-186個核苷酸、10-187個核苷酸、10-188個核苷酸、10-189個核苷酸、10-190個核苷酸、10-191個核苷酸、10-192個核苷酸、10-193個核苷酸、10-194個核苷酸、10-195個核苷酸、10-196個核苷酸、10-197個核苷酸、10-198個核苷酸、10-199個核苷酸、10-200個核苷酸、15-145個核苷酸、15-146個核苷酸、15-147個核苷酸、15-148個核苷酸、15-149個核苷酸、15-150個核苷酸、15-151個核苷酸、15-152個核苷酸、15-153個核苷酸、15-154個核苷酸、15-155個核苷酸、15-156個核苷酸、-157個核苷酸、15-158個核苷酸、15-159個核苷酸、15-160個核苷酸、15-161個核苷酸、15-162個核苷酸、15-163個核苷酸、15-164個核苷酸、15-165個核苷酸、15-166個核苷酸、15-167個核苷酸、15-168個核苷酸、15-169個核苷酸、15-170個核苷酸、15-171個核苷酸、15-172個核苷酸、15-173個核苷酸、15-174個核苷酸、15-175個核苷酸、15-176個核苷酸、15-177個核苷酸、15-178個核苷酸、15-179個核苷酸、15-180個核苷酸、15-181個核苷酸、15-182個核苷酸、15-183個核苷酸、15-184個核苷酸、15-185個核苷酸、15-186個核苷酸、15-187個核苷酸、15-188個核苷酸、15-189個核苷酸、15-190個核苷酸、15-191個核苷酸、15-192個核苷酸、15-193個核苷酸、15-194個核苷酸、15-195個核苷酸、15-196個核苷酸、15-197個核苷酸、15-198個核苷酸、15-199個核苷酸、15-200個核苷酸、或其之間的任何範圍。在一些實施例中,所揭示方法可利用至少八個窗口,該等窗口所包含的大小範圍包括0至約145個核苷酸、0至約150個核苷酸、0至約155個核苷酸、0至約160個核苷酸、0至約165個核苷酸、0至約168個核苷酸、0至約175個核苷酸、及0至約190個核苷酸。在一些實施例中,所揭示方法可利用八個窗口,該等窗口包括大小範圍為0-145個核苷酸、0-150個核苷酸、0-155個核苷酸、0-160個核苷酸、0-165個核苷酸、0-168個核苷酸、0-175個核苷酸、及0-190個核苷酸。
在一些實施例中,所揭示方法可利用二或更多個(例如,2、3、4、5、6、7、8、9、或10個、或更多個)窗口,該等窗口包含選自以下之二或更多個(例如,2、3、4、5、6、7、8、9、或10個、或更多個)大小範圍中之片段:約20至約145個核苷酸、約20至約150個核苷酸、約20至約155個核苷酸、約20至約160個核苷酸、約20至約165個核苷酸、約20至約170個核苷酸、約20至約175個核苷酸、約20至約180個核苷酸、約20至約185個核苷酸、約20至約190個核苷酸、約20至約195個核苷酸、約20至約200個核苷酸、約25至約145個核苷酸、約25至約150個核苷酸、約25至約155個核苷酸、約25至約160個核苷酸、約25至約165個核苷酸、約25至約170個核苷酸、約25至約175個核苷酸、約25至約180個核苷酸、約25至約185個核苷酸、約25至約190個核苷酸、約25至約195個核苷酸、約25至約200個核苷酸、約50至約145個核苷酸、約50至約150個核苷酸、約50至約155個核苷酸、約50至約160個核苷酸、約50至約165個核苷酸、約50至約170個核苷酸、約50至約175個核苷酸、約50至約180個核苷酸、約50至約185個核苷酸、約50至約190個核苷酸、約50至約195個核苷酸、約50至約200個核苷酸、約75至約145個核苷酸、約75至約150個核苷酸、約75至約155個核苷酸、約75至約160個核苷酸、約75至約165個核苷酸、約75至約170個核苷酸、約75至約175個核苷酸、約75至約180個核苷酸、約75至約185個核苷酸、約75至約190個核苷酸、約75至約195個核苷酸、約75至約200個核苷酸、約100至約145個核苷酸、約100至約150個核苷酸、約100至約155個核苷酸、約100至約160個核苷酸、約100至約165個核苷酸、約100至約170個核苷酸、約100至約175個核苷酸、約100至約180個核苷酸、約100至約185個核苷酸、約100至約190個核苷酸、約100至約195個核苷酸、約100至約200個核苷酸、或其之間的任何範圍。
為了所揭示方法之目的,用於後續分析及軌跡計算之窗口可係不同之大小(即,每個窗口包含不同範圍之片段大小,諸如0-145、0-150、0-155等)或者窗口可係相同之大小(即,每個窗口包含不同之片段,但跨越設定之大小範圍,諸如0-145、5-150、10-155等)。窗口可被視為「未閘控的」,即未設定特定最大值及最小值,且相反該窗口包括整個序列庫。圖2示出了可如何將序列庫中之序列分成六個不同窗口之實例。
如上所述,富集序列庫之胎兒部分係電腦模擬富集之形式,其可包括對序列庫之至少兩個窗口中之序列進行基於讀段長度之大小排除,從而獲得至少兩個富集胎兒部分之序列庫。比較每個窗口中之等位基因平衡允許計算各個富集胎兒部分之序列庫之間的等位基因平衡軌跡。等位基因平衡軌跡係任何給定感興趣之基因序列之等位基因平衡百分比跨所觀察窗口之變化。等位基因平衡軌跡可計算為每個所觀察窗口中等位基因平衡之斜率,並且它可以多種方式視覺化,如圖3所示。例如,圖3上圖中之帶型(banding pattern)示出了等位基因平衡在多個所觀察窗口中之差異,或者等位基因平衡軌跡可被視覺化為高斯混合模型(GMM)。應理解,每個窗口(例如,0-145、0-150、0-155等)將擁有與其他窗口不同之相關聯的胎兒部分,並且該胎兒部分值可用作軌跡圖之X軸,如圖3所示(上圖)。換言之,圖3(上圖)所示之軌跡圖類型提供了等位基因平衡相對於胎兒部分之視覺化,其中沿X軸(即胎兒部分軸)之點由不同窗口之選擇提供。
無論等位基因平衡資料係如何視覺化,它皆可用於鑑定cfDNA序列庫中之雜合及純合突變或感興趣之標記。例如,等位基因平衡可轉化為帶型圖,其中y軸針對特定感興趣之基因或核酸序列顯示具有給定等位基因之樣本中cfDNA之百分比(例如,0%、10%、20%、30%、40%、50%、60%),且x軸顯示對應於野生型序列或與特定疾病、病況、或性狀相關聯之突變/變體(例如,與囊腫纖維化相關聯之CFTR基因內之不同已知突變)之感興趣之基因或核酸之不同替代物。
舉例而言,在具有20%胎兒部分之樣本或窗口中,可示出y軸上10%處之條帶對應於作為來自生父DNA之攜帶者的胎兒(或者,在一些情況下,它可表示胎兒中之原發突變(de novo mutation))。該窗口內y軸上40%處之條帶對應於感興趣之基因或序列中突變/變體為陰性(即純合參考)之胎兒。y軸上50%處之條帶對應於來自生母DNA之攜帶者的胎兒,或者,若母親及父親攜帶相同之突變/變體(即alt等位基因),則該胎兒可具有父親之alt等位基因及母親之參考等位基因。因此,50%處之條帶可指示胎兒及母親各有一個alt等位基因。y軸上60%處之條帶對應於感興趣之基因或序列中突變/變體為純合alt之胎兒(即,胎兒為陽性)。因此,分析跨序列庫之多個窗口(即,多個富集胎兒部分之序列庫)之等位基因平衡提供了一種新的有用方法,以自包含cfDNA之母體樣本中確定基因變體/突變之存在或不存在,而不需要任何額外之樣本。此外,由於移動窗口分析提供之富集,雜訊及背景顯著降低,此使得即使在具有極少量cffDNA(例如,<總cfDNA之5%)之樣本中仍能進行穩健之檢測。此外,應注意,若窗口或樣本不具有20%之胎兒部分,則前述條帶可能偏移或移動,且它們可能不會分別精確地處於10%、40%、50%、及60%處。
雖然為了確定等位基因平衡軌跡需要至少兩個窗口,但為了所揭示方法之目的可以評估之窗口之數目不受特別限制,且可包括多個額外之窗口。因此,在一些實施例中,評估第一序列庫之至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口,從而分別獲得至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個富集胎兒部分之序列庫,從中可以鑑定及分離cffDNA序列。在一些實施例中,序列庫之至少兩個窗口選自(i)0-145個核苷酸之序列、(ii)0-150個核苷酸之序列、(iii)0-155個核苷酸、(iv)0-160個核苷酸、(v)0-165個核苷酸、(vi)0-170個核苷酸、(vii)0-175個核苷酸、(viii)0-180個核苷酸、(ix)0-190個核苷酸、(x)0-195個核苷酸、(xi)0-200個核苷酸、及(xii)未閘控者。在一些實施例中,至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口選自(i)0-145個核苷酸之序列、(ii)0-150個核苷酸之序列、(iii)0-155個核苷酸、(iv)0-160個核苷酸、(v)0-165個核苷酸、(vi)0-170個核苷酸、(vii)0-175個核苷酸、(viii)0-180個核苷酸、(ix)0-190個核苷酸、(x)0-195個核苷酸、(xi)0-200個核苷酸、及(xii)未閘控者。
圖4提供了在序列庫內電腦模擬富集胎兒部分,然後使用生物資訊學演算法(在本文中亦稱為「調用程式(caller)」)及後處理以自單一樣本中並行鑑定非整倍體及基因變體之過程之一例示性實施例之概述。 A. 樣本處理及計算管線
一般而言,用於對非整倍體及基因變體進行並行評估之所揭示方法之樣本處理步驟可以如上文第II部分(「樣本製備」)所述進行。在此處展開更多特徵。
所揭示方法可包括將來自序列庫之定序資料轉化為有用輸出之計算管線,其包括確定cffDNA中是否存在非整倍體或任何基因變體。可以可選地提供之額外有用輸出包括但不限於胎兒性別及其他基本胎兒統計資料之確定。
計算管線可包括二進制比對圖(BAM)處理,其中所收集之DNA樣本可使用短定序讀段進行計算重建。若可獲得定序讀段可與之比對之參考基因體,則可促進基因體之重建。可使用序列比對工具將儲存在檔案中之短讀段映射至參考基因體。此種做法會產生BAM檔案,其中特異性基因序列可以在下一步中進行處理。
計算流程還可包括深度及變體處理,在此期間,可以鑑定及分離特異性基因序列,以通知針對特定非整倍體及/或基因變體之後續分析。基於所收集之初始DNA之量,可對所收集之DNA之特定部分進行標繪,並且可選地,對其進行彙集,以用於分析及檢測感興趣之特異性序列。一旦在深度及變體處理步驟進行了標繪,即可使用特定調用程式及後處理來鑑定及彙集關於非整倍體、基因變體、及任何其他輸出之輸出資訊至結果報告中。通常將結果報告、遞送、或傳送給母親、父親、督管妊娠之醫生(即母親之婦產科醫生)、或其組合。
可使用特定生物資訊學演算法(即「調用程序」;下文描述)來評估BAM檔案中DNA樣本之深度。所用之調用程式可確定非整倍體及感興趣之基因變體兩者之存在或不存在。亦即,該兩個目標可使用相同製備及處理之BAM檔案一起完成(例如,以並行方式)。因此,可使用非整倍體調用程式來檢測非整倍體,同時可以並行運行使用專用調用程式之其他基因變體。該等計算步驟之具體範疇將在下文更詳細地討論。
應理解,如上所述之本揭露內容可以模組或整合方式使用電腦軟體以控制邏輯之形式實現。基於本文提供之揭露及教導,所屬技術領域中具有通常知識者將知悉及理解使用硬體及硬體與軟體之組合來實現本揭露內容之其他方式及/或方法。
在本申請案中描述之軟體組件、過程、或功能中之任一者可被實現為由處理器使用任何合適之電腦語言(諸如例如Python、R、匯編語言Java、JavaScript、C、C++、或Perl)、使用例如習知或面向對象之技術執行之軟體代碼。軟體代碼可作為一系列指令或命令儲存在電腦可讀取媒體上,諸如隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁性媒體(諸如硬磁碟或軟磁碟)、或光學媒體(諸如CD-ROM)。任何此種電腦可讀取媒體可駐留在單一計算設備上或計算設備內,並且可存在於系統或網路內之不同計算設備上或計算設備內。 B. 非整倍體之檢測
為了本揭露內容之目的,可使用所揭示方法評估或檢測之非整倍體包括但不限於單染色體(例如,Turner症候群)、三染色體(例如,唐氏症候群、Edward氏症候群、Patau氏症候群、三染色體13、三染色體18、三染色體21)、四染色體、多染色體X及/或Y、微缺失及微重複(諸如染色體22q11.2缺失症候群)、及五染色體。
本揭露內容提供了用於單獨或者與感興趣之基因變體/突變並行檢測非整倍體之系統及方法,其依賴於定序深度以確定給定樣本中非整倍體存在還是不存在。為了本揭露內容之目的,「深度」被定義為藉由定序獲得之與感興趣之位點重疊之讀段之數目和庫之大小或庫中每個鹼基被測量之平均次數之比率。
自母體cfDNA樣本製備之任何給定庫中觀察到之深度係胎兒部分、母體拷貝數、及胎兒拷貝數之函數。若存在非整倍體(例如三染色體),則目標染色體之深度應以確定、可預測之方式不同於具有23條染色體之樣本。例如,在三染色體中,與背景相比,目標染色體(例如,染色體21)之深度將增加。圖5說明了該措施所依據之原理。
一般而言,當檢測包括胎兒cfDNA之一些部分(例如,胎兒部分)之母體樣本內之非整倍體(無論它是胎兒非整倍體還是母體非整倍體)時,可基於可檢測之非整倍體區域或非整倍體染色體與已知非非整倍體區域或染色體相比之偏移來鑑定非整倍體之存在。亦即,根據實際胎兒部分,每個片段之分析(例如,下面之式1)將產生cfDNA妊娠深度對cfDNA密度之可繪圖結果。如圖5之中間圖所示,此偏移可以統計方式計算或被視覺化,其中背景深度表示沒有非整倍體之樣本之比較器或集合,且偏移之目標深度表示包括三染色體之樣本,因此指示胎兒中存在非整倍體(假定妊婦沒有表現出該非整倍體)。此偏差使用正規化分佈曲線可檢測到,並且隨著樣本之胎兒部分經由本文所述之富集過程而增加,此偏差將會更加明顯。
在一些實施例中,可使用深度調用圖(在圖5之下圖中示出)將偏移視覺化及量化。如圖5之下圖所示,可確定給定樣本之深度(即陰影區域)以在四個已知拷貝數(CN)曲線(例如,CN=1、CN=2、CN=3、及CN=4)中之一者內進行擬合。在該例示性圖中,陰影分佈在CN=3曲線內擬合,因此指示存在具有三個染色體拷貝之非整倍體(即三染色體)。可以採用各種處理步驟來增強分佈圖結果並消除分析期間資料中之雜訊。
在一些實施例中,檢測非整倍體之存在或不存在可包括計算深度軌跡。深度軌跡係任何給定之感興趣之基因序列之讀段深度跨所觀察窗口之變化。深度軌跡可被計算為跨所觀察窗口之深度對胎兒部分之斜率,並且可以多種方式視覺化,如圖8所示。當胎兒部分增加時減小之深度軌跡將指示胎兒比母親具有更少之基因(或染色體)拷貝。隨著胎兒部分增加而保持恆定之深度軌跡將指示胎兒及母親具有相同之基因(或染色體)拷貝數。並且隨著胎兒部分增加而增加之深度軌跡將指示胎兒比母親具有更多之基因(或染色體)拷貝。儘管深度軌跡可用於確定染色體數目以檢測非整倍體之存在或不存在之目的,但應注意,深度軌跡還可用於檢測某些基因變體(諸如拷貝數異常)之存在或不存在。
在分析任何給定樣本之染色體深度時,可能需要考慮GC偏差並將其正規化。GC含量(或鳥嘌呤-胞嘧啶含量)係DNA分子上為鳥嘌呤或胞嘧啶(來自四種不同鹼基之可能性,亦包括腺嘌呤及胸腺嘧啶)之含氮鹼基之百分比。高GC含量可扭曲結果並導致高水平之雜訊。例如,在圖5C之上下文中,增加之雜訊將加寬資料帶及相應拷貝數假設(黑線)之寬度,並且隨著該等分佈變得更寬,準確解釋真實拷貝數水平變得更加困難。正確正規化會減少高雜訊樣本中深度之差異,從而減少GC偏差之影響並改善非整倍體調用。
此外,對由1)GC偏差、2)樣本背景、及3)雜交探針捕獲(適當時;即,在利用混合探針之實施例中)引起之變化的三重正規化控制可跨所採樣的資料採用,以改善所採樣的資料之分佈圖,如圖6所示。如圖6中所提供的,頂部一組分佈圖示出了沒有任何正規化之原始深度資料,中間一組分佈圖示出了在採用GC偏差正規化之後改善之分佈圖,且底部一組分佈圖在第二(樣本背景)及第三(雜交探針捕獲)正規化資料處理步驟完成之後甚至得到了更大之改善。因此,三重正規化控制可改善所採樣的資料之分佈圖,並且在某些所揭示之實施例中或者對於某些樣本有用。一旦正規化,該等分佈圖可與模型預期進行比較,以得出關於非整倍體存在或不存在之結論,如圖7所說明的。
圖7示出了非整倍體發生率之正規化深度擬合模型預期之圖,其可用於解讀彙集及可選地正規化之樣本分佈。深度擬合模型可使用習知已知之非整倍體分佈來彙集,用於比較步驟,以解讀實際彙集及可選地正規化之分佈是否匹配彙集之已知模型中之一者或多者。如圖7所示,以灰色示出之正規化的深度分佈可相對於已知分佈曲線設定,該等分佈曲線反映了染色體13、18、21、及X之1、2、或3個拷貝(以自左至右之順序)。可使用最大似然選擇最可能之胎兒拷貝數來確定特定曲線擬合。由於最大似然擬合產生了與特定調用之匹配,因此可得出關於所分析樣本內非整倍體存在或不存在之結論。
基於當樣本中存在非整倍體時將觀察到之深度之預測差異,可設計非整倍體調用程式來選擇在正態分佈上產生非整倍體之最高似然性之一組母體及胎兒拷貝數。為此,開發了以下方程式來確定給定非整倍體之深度: [式1] 其中: d p係血漿深度 f係胎兒部分 c m係母體拷貝數 d b係背景深度 c f係胎兒拷貝數
此調用程式示出對檢測體染色體及性別染色體非整倍體以及胎兒性別調用之高度靈敏度及特異性。下面之實例提供了關於非整倍體調用程式之表現之進一步細節。
在完成本文揭示之篩查後,醫生可選擇進行進一步之評估,諸如擴展之非整倍體分析(EAA),其分析甚至更多編號之染色體對以提供對妊娠健康之額外見解。因此,在一些實施例中,所揭示之確定非整倍體存在或不存在之方法可進一步包括EAA。 C. 基因變體之檢測
一般而言,作為所揭示方法之一部分而檢測之基因變體(例如,基因突變)係與特定遺傳性或可遺傳疾病、病況、或性狀相關聯之基因變體、標記、或突變。基因變體可包括單核苷酸變異(SNV)、致病性或非致病性單核苷酸多態性(SNP)、插入及缺失(indel)、替代突變、或單基因拷貝數變體。
基因變體可能與多於一種疾病、病況、或性狀相關聯。基因變體可表現為聚核苷酸之變異,諸如野生型(即,非突變的或與疾病或病況無關的)基因或基因座之間至少約1、2、3、4、5、6、7、8、9、10、20、30、40、50、或更多之序列差異。可使用所揭示方法檢測之基因變體類型之非限制性實例包括但不限於單核苷酸多態性(SNP)、缺失/插入多態性(DIP)、微拷貝數變體(CNV)、短串聯重複(STR)、限制性片段長度多態性(RFLP)、單序列重複(SSR)、可變數目串聯重複(VNTR)、隨機擴增多態性DNA(RAPD)、擴增片段長度多態性、基於反轉座子之插入多態性、序列特異性擴增多態性、及可遺傳表觀遺傳修飾(例如,DNA甲基化)。
為了所揭示方法之目的,至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、或1000種、或更多種不同之基因變體之存在或不存在可在單一測定中檢測,並與非整倍體存在或不存在之檢測並行進行。在一些實施例中,該等方法可並行檢測與至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、或200種、或更多種疾病、病況、或性狀相關聯之基因變體之存在或不存在。
一般而言,藉由所揭示方法檢測之基因變體類型之存在係與患有或發展疾病、病況、或性狀之風險增加約、小於約、或大於約1%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、或更多相關聯。在一些實施例中,基因變體之存在使患有或發展疾病、病況、或性狀之風險增加約、小於約、或大於約1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、100倍、500倍、1000倍、10000倍、或更多倍。在一些實施例中,基因變體之存在使患有或發展疾病、病況、或性狀之風險增加了任何統計學上顯著之量,諸如所具有之p值為約或小於約0.1、0.05、10 -3、10 -4、10 -5、10 -6、10 -7、10 -8、10 -9、10 -10、10 -11、10 -12、10 -13、10 -14、10 -15、或更小之增加。
為了本揭露內容之目的,可以藉由確定基因變體之存在或不存在來評估或檢測之遺傳性疾病包括但不限於21-羥化酶缺乏症、ABCC8相關高胰島素症、ARSACS、軟骨發育不全、全色盲、腺苷單磷酸脫胺酶1、胼胝體發育不全伴神經元病、黑尿症、α-1-抗胰蛋白酶缺乏症、α-甘露醣儲積症、α-肌聚糖病、α-地中海貧血;阿茲海默症,血管收縮素II受體I型、脂蛋白E基因分型;精胺琥珀酸尿症、天門冬葡萄糖胺尿、運動失調伴維生素E缺乏、運動失調毛細管擴張症、自體免疫多內分泌病變症候群1型、BRCA1遺傳性乳癌/卵巢癌、BRCA2遺傳性乳癌/卵巢癌、Bardet-Biedl二氏症候群、Best卵黃囊狀黃斑失養症、β-肌聚糖病、β-地中海貧血、生物素酶缺乏症、Blau症候群、Bloom症候群、CFTR相關病症、CLN3相關神經性類蠟脂褐質病、CLN5相關神經性類蠟脂褐質病、CLN8相關神經性類蠟脂褐質病、Canavan病、肉毒鹼棕櫚醯轉移酶IA缺乏症、肉毒鹼棕櫚醯轉移酶II缺乏症、軟骨-毛髮發育不良、腦海綿狀畸形、無脈絡脈畸型、Cohen氏症候群、先天性白內障、面部異形及神經病變、先天性醣基化障礙la、先天性醣基化障礙Ib、先天性芬蘭腎病、克隆氏病、胱胺酸病、DFNA 9(COCH)、糖尿病及聽力損失、早發性原發性肌緊張不足(DYTI)、Herlitz-Pearson型交界型水皰性表皮鬆解症、FANCC相關Fanconi貧血、FGFR1相關顱縫線封閉過早、FGFR2相關顱縫線封閉過早、FGFR3相關顱縫線封閉過早、第五因素Leiden血栓好發症、第五因素R2突變血栓好發症、第十一因素缺乏症、第十三因素缺乏症、家族性腺瘤性息肉病、家族性自主神經障礙、家族性高膽固醇血症B型、家族性地中海熱、游離唾液酸儲存障礙、額顳葉癡呆伴Parkinson氏症17、延胡索酸酶缺乏症、GJB2相關DFNA 3型非症候群性聽力損失及耳聾、GJB2相關DFNB 1非症候群性聽力損失及耳聾、GNE相關肌病、半乳糖血症、Gaucher氏病、葡萄糖-6-磷酸脫氫酶缺乏症、戊二酸血症1型、醣原貯積病1a型、醣原貯積病Ib型、醣原貯積病II型、醣原貯積病III型、醣原貯積病V型、Gracile症候群、HFE相關聯之遺傳性血鐵沈積症、Halder AIMs、血紅蛋白S β-地中海貧血、遺傳性果糖不耐受、遺傳性胰腺炎、遺傳性胸腺嘧啶-尿嘧啶尿症、己醣胺酶A缺乏症、有汗性外胚層發育異常2、胱硫醚β-合酶缺乏引起之高胱胺酸尿症、高鉀血週期性麻痹1型、高鳥胺酸血症-高氨血症-高瓜胺酸尿症候群、原發性高草酸鹽尿症1型、原發性高草酸鹽尿症2型、軟骨生成減退、低鉀血週期性麻痹1型、低鉀血週期性麻痹2型、低磷酸酶症、嬰兒肌病及乳酸性酸中毒(致死型及非致死型)、異戊酸血症、Krabbe病、LGMD2I、Leber遺傳性視神經病變、法國-加拿大型Leigh症候群、長鏈3-羥醯基-輔酶A脫氫酶缺乏症、MELAS、MERRF、MTHFR缺乏症、MTHFR不耐熱變異、MTRNR1相關聽力損失及耳聾、MTTS1相關聽力損失及耳聾、MYH相關聯之息肉病、楓糖漿尿病1A型、楓糖漿尿病1B型、馬科恩-亞百特氏症候群、中鏈醯基輔酶A脫氫酶缺乏症、巨腦白質病伴皮質下囊腫、異染性白質失養症、粒線體心肌病、粒線體DNA相關聯之Leigh症候群及NARP、黏脂貯積病IV、黏多醣病I型、黏多醣病IIIA型、黏多醣病VII型、多發性內分泌瘤2型、肌-眼-腦疾病、線樣肌病、神經表型、由於神經磷脂酶缺乏引起之尼曼-匹克病、尼曼-匹克病C1型、奈梅亨染色體斷裂症候群、PPT1相關神經性類蠟脂褐質病、PROP1相關下垂體激素缺乏症、Pallister-Hall症候群、先天性肌剛痙病、Pendred症候群、過氧化體雙功能酶缺乏症、廣泛性發展障礙、苯丙胺酸羥化酶缺乏症、血漿蛋白原活化因子抑制物I、體染色體隱性遺傳多囊腎病、凝血酶原G20210A血栓好發症、假維生素D缺乏性佝僂病、緻密成骨不全症、Bothnia型體染色體隱性色素沉著性視網膜炎、雷特氏症候群、肢根性點狀軟骨發育異常1型、短鏈醯基輔酶A脫氫酶缺乏症、Shwachman-Diamond症候群、Sjogren-Larsson症候群、Smith-Lemli-Opitz症候群、痙攣性截癱13、硫酸鹽轉運蛋白相關骨軟骨發育不良、TFR2相關遺傳性血色病、TPP1相關神經性類蠟脂褐質病、致死性軟骨發育不全、運甲狀腺素蛋白澱粉樣變性、三功能蛋白缺乏症、酪胺酸羥化酶缺乏性DRD、酪胺酸血症I型、Wilson氏病、X性聯青年性視網膜劈裂症、囊腫纖維化、脊髓性肌肉萎縮症(SMA)、血紅素病、及Zellweger症候群譜系。
為了所揭示方法之目的,可以使用電腦模擬移動窗口分析來進行基因變體之鑑定或檢測,以基於本文所述跨所分析窗口之等位基因平衡(當評估涉及SNP、插入及缺失、或其他點突變之基因變體時)或基於深度(當評估涉及拷貝數變化之基因變體時)來建立軌跡。此種分析對於檢測隱性病況、性狀、或疾病可能特別有用。如上所述,該過程可包括對序列庫之至少兩個窗口中之序列進行基於讀段長度之大小排除,從而獲得至少兩個富集胎兒部分之序列庫。比較每個窗口中之等位基因平衡允許計算各個富集胎兒部分之序列庫之間的等位基因平衡軌跡。等位基因平衡軌跡係任何給定感興趣之基因序列之等位基因平衡百分比跨所觀察窗口之變化。等位基因平衡軌跡可被計算為跨所觀察窗口之等位基因平衡相對於胎兒部分之斜率,並且它可以多種方式視覺化,如圖3所示。
可利用等位基因平衡軌跡來鑑定cfDNA庫內之雜合及純合突變。例如,軌跡中之單一點係基於給定窗口中之等位基因平衡,並可被轉換成帶型圖,其中y軸針對特定感興趣之基因或核酸序列顯示具有給定等位基因之樣本中cfDNA之百分比(例如,0%、10%、20%、30%、40%、50%、60%),且x軸顯示感興趣之基因或核酸之不同等位基因(即,參考等位基因或alt等位基因),其對應於野生型序列或與特定疾病、病況、或性狀相關聯之突變/變體(例如,與囊腫纖維化相關聯之CFTR基因內之不同已知突變)。若窗口或樣本中之胎兒部分係例如20%,則y軸上10%處之條帶對應於作為來自生父DNA之攜帶者之胎兒或胎兒中之原發突變。y軸上40%處之條帶對應於感興趣之基因或序列之突變/變體為陰性(即純合參考)之胎兒,而母親係雜合的(即攜帶者)。y軸上50%處之條帶對應於來自生母DNA之攜帶者之胎兒,或者在母親及父親二者皆為具有相同alt等位基因之攜帶者之情況下,對應於為生父DNA之攜帶者之胎兒。y軸上60%處之條帶對應於感興趣之基因或序列之突變/變體為純合陽性之胎兒。如上所述,上文討論之條帶(即,在10%、40%、50%、及60%處)並非固定的,且它們之位置將基於胎兒部分而變化。例如,若胎兒部分改為10%(與上述實例中之20%相對照),則條帶之值分別自10%、40%、50%、及60%變化為5%、45%、50%、及55%。
等位基因平衡軌跡結合了來自每個所觀察窗口之此靜態資訊,其必然將具有不同之胎兒部分。因此,軌跡可依賴於具有上述20%胎兒部分之窗口,具有10%胎兒部分之第二窗口,以及可選地,具有不同胎兒部分之1、2、3、4、5、6、7、8、9、或10個更多之窗口。
另外或替代地,感興趣之基因變體之特定調用程式可以依賴於拷貝數之評估、深度分析(如上文關於非整倍體所述)或所屬技術領域中已知之其他檢測形式例如,可使用深度軌跡來檢測拷貝數變體之存在或不存在,諸如SMA1、RHD、HBA1、及HBA 2之拷貝數變體,它們皆與特定之遺傳性疾病相關聯。在一些實施例中,深度軌跡可具有負斜率(指示胎兒中較少之拷貝)、近似平坦之斜率(指示胎兒與母親之間相同數目之拷貝)、或正斜率(指示胎兒中更多之拷貝,並且此種斜率可基於具有不同胎兒部分之1、2、3、4、5、6、7、8、9、或10個更多之窗口。
在一些實施例中,針對某些病況之調用程式可依賴於檢測「差異鹼基」之存在或不存在。在一些實施例中,針對某些病況之調用程式可依賴於檢測野生型序列(例如,SNV)中取代之存在或不存在。在一些實施例中,針對某些病況之調用程式可依賴於檢測單核苷酸多態性(SNP)之存在或不存在。在一些實施例中,針對某些病況之調用程式可依賴於檢測一個或多個插入或缺失之存在或不存在。在多個SNV、差異鹼基、SNP、或其組合與給定病況相關聯之情況下,集中或合併甚至少量SNV、差異鹼基、SNP、插入或缺失、或其組合(例如,< 3、< 4、< 5、< 6、< 7、< 8、< 9、< 10、< 11、< 12、< 13、< 14、< 15)之檢測訊號可提供基因型之間的經改善之分離。因此,在一些實施例中,針對某一病況之調用程式可能依賴於對1、2、3、4、5、6、7、8、9、10、11、12、13、14、或15個、或更多SNV、差異鹼基、SNP、插入或缺失、或其組合之存在或不存在之檢測。
例如,在檢測α地中海貧血時,所揭示方法可利用檢測 HBA1HBA2之雙順式突變存在或不存在之調用程式,該雙順式突變係該病況之最常見原因。因此,調用程式可檢測到,例如,自感興趣之區域,諸如雙缺失區域中之多個探針獲得之共有拷貝數訊號。
因此,利用所揭示方法允許以單一樣本調用感興趣之基因變體,並且與非整倍體之檢測並行進行。事實上,該方法甚至可針對給定感興趣之基因變體來確定胎兒是純合的還是雜合的。此外,在母親及父親擁有不同alt等位基因之一些實施例中,可以確定胎兒是否自母親、父親、或兩者獲得了特定變體。此係用以確定母體樣本中存在或不存在基因變體/突變之新的有用方式。 D. 雜訊之降低
如上所解釋以及在實例中進一步所示,所揭示之方法及系統可顯著降低cfDNA資料中之雜訊,此會改善用於檢測基因變體及非整倍體之測定之效能。由於自孕婦獲得之大多數生物樣本中cffDNA水平較低,自習知處理及檢測方法產生之高水平背景雜訊可導致樣本不可用、不可解釋、或兩者兼有。因此,所揭示之雜訊降低方法表示改善習知非侵入性產前篩查(NIPS)之新的有用方法。
此外,本揭露內容提供了在非侵入性產前篩查(NIPS)中降低來自多餘遺傳物質之背景雜訊之方法,其包括(i)自孕婦獲得生物樣本,其中該生物樣本包含游離DNA(cfDNA);及(ii)處理用於NIPS之cfDNA,其中處理包括富集生物樣本中之游離胎兒DNA(cffDNA)、對cfDNA進行電腦模擬處理、或其組合。
在一些實施例中,降低雜訊之方法將包括富集生物樣本中之游離胎兒DNA(cffDNA)及對cfDNA進行電腦模擬處理。
為了降低雜訊,富集生物樣本中之cffDNA可包括所揭示之胎兒部分之物理分離或富集之方法。例如,在一些實施例中,富集生物樣本中之cffDNA可包括自孕婦獲得包含游離DNA(cfDNA)之生物樣本,其中cfDNA包含cffDNA及游離DNA母體(cfmDNA);自生物樣本中萃取cfDNA;以及使所萃取之cfDNA經受大小排除過程,其中大小排除過程具有約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之截止大小,從而產生富集cffDNA之核酸。
類似地,為了降低雜訊,電腦模擬處理可包括所揭示之分析序列庫或序列庫資料之方法中之任一者,以將基因變體或非整倍體之任何分析集中在樣本之胎兒部分。例如,在一些實施例中,電腦模擬處理可包括對包含游離胎兒DNA(cffDNA)及游離母體DNA(cfmDNA)之cfDNA樣本進行定序,以製備序列庫;進行基於讀段長度之分析,其中在序列庫之至少兩個窗口中建立感興趣之核酸序列之等位基因平衡;以及基於該至少兩個窗口之等位基因平衡建立軌跡,其中該軌跡指示包含感興趣之核酸序列之樣本中存在之等位基因之百分比。
雜訊降低可進一步包括正規化以控制GC偏差、樣本背景、雜交探針捕獲、或其組合。一般而言,正規化可為「中值正規化」。換言之,探針讀段深度可除以跨具有相似GC含量之探針之中值,然後除以跨母體及胎兒中具有推定拷貝數2之樣本及探針之四分位數間距平均值。
雜交探針捕獲可能會出現問題,因為含有變體及重疊捕獲探針之DNA片段以較低效率被捕獲,從而降低了備選等位基因之等位基因平衡。然而,捕獲偏差通常為可重複的,且在此類情況下,可使用下式來學習及校正: [式2]
雜交探針捕獲之校正及正規化對於確保正確的插入或缺失調用特別有用,儘管它可更普遍地幫助變體調用。
給出以下實例來說明所揭示之樣本製備及方法。然而,應理解,本發明不限於該等實例中描述之具體實施例或細節。 實例
實例 1- 非整倍體調用程式效能
所揭示之非整倍體調用程式係基於如上所述之序列讀段深度。為了確立該方法之可行性,對110個可行性樣本進行了分析,並與標準認可之非整倍體檢測系統(Myriad PREQUEL™產前篩查)進行了比較。樣本中可檢測到之非整倍體及每個樣本之對照調用如下表所示:
前傳調用 樣本
體染色體 三染色體13 9
三染色體18 10
三染色體21 10
22q微缺失 5
SCA 單染色體X 2
三染色體X 3
XXY 2
XYY 1
陰性 68
所揭示之基於深度之分析方法提供了以下結果: ● 對於體染色體 + 22qo    靈敏度= 100%(CI:89.95%-100%) o    特異性= 99.75%(CI:98.59%-99.96%) o    一假陽性嵌合單染色體21調用 ● 對於性別染色體非整倍體o    靈敏度= 100%(CI:63.06%-100%) o    特異性= 100%(CI:96.41%-100%) ● 對於胎兒性別調用o    與對照測試100%一致
110個樣本中僅一個樣本因低深度而不合格(0.9%之重複運行率)。
實例 2-SNV/插入或缺失 (即基因變體)調用程式效能
使用來自5個產前配對之十五(15)個設計混合物來驗證本文揭示之SNV/插入或缺失調用程式系統之效能。單獨及與一組已知在群體內具有高可變性之SNV(即dbSNP)組合之感興趣之基因區域(ROI)之靈敏度及特異性如下表所示:
基因 ROI 靈敏度 95% CI 基因 ROI 特異性 95% CI 基因 ROI + dbSNP 靈敏度 95% CI 基因 ROI + dbSNP 特異性 95% CI CFTR ∆F508 準確度( n=6
胎兒基因分型指派 父體遺傳的 100% (95.55%-100%) 98.0% (95.41%-99.35%) 99.9% (99.79%-99.92%) 99.99% (99.97%-100%) NA
母體遺傳的 100% (97.89%-100%) 98.9% (97.41%-99.64%) 98.7% (98.53%-98.73%) 98.9% (98.85%-99.02%) 100%
母體攜帶者狀況指派 100% (98.61%-100%) 100% (99.30%-100%) 99.99% (99.98%-99.99%) 99.997% (99.992%-99.999%) 100%
該初始效能係在不使用本文所述之物理富集過程之情況下建立。預計富集胎兒部分及最佳化不同濾波器參數將進一步改善效能。
此外,所揭示之單基因SNV/插入或缺失調用程式在FF為5.8%-16%之5個獨特cfDNA樣本上滿足效能要求。結果如下表所示。
基因 ROI 靈敏度 95% CI 基因 ROI 特異性 95% CI 基因 ROI + dbSNP 靈敏度 95% CI 基因 ROI + dbSNP 特異性 95% CI CFTR ∆F508 準確度( n=6
胎兒基因分型指派 父體遺傳的 100% (92.13%-100%) 99.1% (94.95%-99.98%) 99.6% (99.45%-99.76%) 99.99% (99.96%-100%) NA
母體遺傳的 100% (94.87%-100%) 99.4% (96.65%-99.98%) 98.5% (98.35%-98.66%) 98.96% (98.82%-99.07%) 100%
母體攜帶者狀況指派 100% (96.82%-100%) 100% (98.05%-100%) 99.99% (99.97%-100%) 100% (99.99%-100%) 100%
對於該效能評估,當同時實施基於物理大小之排除之富集及偏差校正時,觀察到最佳效能。
實例 3-SMA 調用程式效能分析
脊髓性肌肉萎縮症(SMA)係一種通常包括在產前篩查中之遺傳性病況。然而,由於 SMN1基因與 SMN2基因之間的高度同源性,SMA調用很難。該等基因在很少位置上(最顯著的是外顯子7)不同,且SMA攜帶者/受影響之狀況僅取決於 SMN1拷貝數。
所揭示之系統評估多個鹼基(至多44個差異鹼基)之存在或不存在,以確保正確之調用。如下表所示,SMA調用程式非常準確、敏感、及特異。
樣本類型 #樣本 (攜帶者母體;受影響之胎兒) 母體攜帶者狀況 胎兒狀況(受影響相對於健康)
準確度 靈敏度 特異性 準確度 靈敏度 特異性
Coriell人為混合 30 (6; 6) 100% (88.4%-100%) 100% (54.1%-100%) 100% (85.8%-100%) 100% (88.4%-100%) 100% (54.1%-100%) 100% (85.8%-100%)
內部血漿 10 (0; 0) 100% (69.1%-100%) N/A 100% (69.1%-100%) 100%** (69.1%-100%) N/A 100% (69.1%-100%)
外部血漿 5 (0; 0) 100% (47.8%-100%) N/A 100% (47.8%-100%) 100% (47.8%-100%) N/A 100% (47.8%-100%)
為了此評估之目的,攜帶者胎兒被視為健康的。
實例 4-α 地中海貧血調用程式效能分析
α地中海貧血係一種減少血紅蛋白生產之血液病。它係一種基因遺傳性病況,通常包括在產前篩查中。所揭示之系統評估了 HBA1HBA2之雙順式突變之存在或不存在,該雙順式突變係該病況之最常見原因。更具體地,自雙重缺失區域中之多個探針中獲得了共有拷貝數訊號。如下表所示,α地中海貧血調用程式高度準確、敏感、及特異。
樣本類型 #樣本 (攜帶者母體;受影響之胎兒) 母體攜帶者狀況 胎兒狀況(受影響相對於健康)
準確度 靈敏度 特異性 準確度 靈敏度 特異性
Coriell人為混合 19 (3; 3) 100% (82.4%-100%) 100% (29.2%-100%) 100% (79.4%-100%) 100% (82.4%-100%) 100% (29.2%-100%) 100% (79.4%-100%)
內部血漿 10 (4; 1) 100% (69.1%-100%) 100% (47.8%-100%) 100% (47.8%-100%) 100% (69.1%-100%) 100% (39.8%-100%) 100% (54.1%-100%)
外部血漿 5 (0; 0) 100% (47.8%-100%) N/A 100% (47.8%-100%) 100% (47.8%-100%) N/A 100% (47.8%-100%)
為了此評估之目的,攜帶者胎兒被視為健康的。
實例 5-RhD 調用程式效能分析
若妊娠母親係D(-)型,而胎兒係D(+)型,當母親的血液接觸到胎兒的血液時,就會發生溶血性疾病。此種病況通常包括在產前篩查中。RhD(-)最常見的原因係 RHD之整個基因缺失。因此,開發了基於221個可靠差異鹼基之調用程式來評估拷貝數。如下表所示,RhD調用程式高度準確、敏感、及特異。
樣本類型 #樣本 (RHD-母體;帶有RHD+胎兒之RHD-母體) 母體RhD狀況 RhD_胎兒及RhD-母體
準確度 靈敏度 特異性 準確度 靈敏度 特異性
Coriell人為混合 19 (7; 7) 100% (82.4%-100%) 100% (59.0%-100%) 100% (73.5%-100%) 100% (59.0%-100%) 100% (59.0%-100%) N/A
外部血漿 5 (0; 0) 100% (47.8%-100%) N/A 100% (47.8%-100%) 100% (47.8%-100%) N/A 100% (47.8%-100%)
*****
說明書中提到之所有專利及出版物指示本揭露內容所屬技術領域中具有通常知識者之水平。所有專利及出版物以引用方式併入本文中,其程度如同每一個別出版物被具體及單獨地指出以引用方式併入。
本技術就本申請案中描述之特定實施例而言不受限制,此等特定實施例旨在作為本技術之個別範疇之單一說明。在不脫離本技術之精神及範圍之情況下,可以對本技術進行許多修改及變化,此對所屬技術領域中具有通常知識者來說係顯而易見的。除本文中所列舉之彼等者外,所屬技術領域中具有通常知識者自前述描述將顯而易見在本技術之範疇內之功能上等效之方法及設備。此類修改及變化旨在落入本技術之範疇內。應理解,本技術不限於特定方法、試劑、化合物、組成物、或系統,其當然可改變。亦應理解,本文使用之術語僅用於描述特定實施例之目的,幷不旨在進行限制。
圖1提供了對習知大小排除技術與所揭示之大小排除方法進行比較之圖,所揭示之大小排除方法更寬容且保留更多cffDNA。
圖2提供了所揭示之電腦模擬富集方法之視覺化,其依賴於一移動窗口分析來密切觀察等位基因平衡隨胎兒及母體cfDNA之量變化之變化。
圖3示出了自所揭示之移動窗口分析觀察到的等位基因平衡之兩種視覺化方式。
圖4示出了所揭示之方法及系統之一個實施例之一例示性計算流程之概述。
圖5示出了深度調用如何用於確立非整倍體之存在之若干視覺表示。上圖比較了正常妊娠及胎兒具有三染色體21之妊娠中習知核型(karyotype)與染色體21之深度讀段。中間圖表示當觀察到三染色體時預期之深度偏移之類型。下圖示出了表示各種倍數體(ploidy)之四個已知拷貝數(CN)曲線(例如,CN=1、CN=2、CN=3、及CN=4)之預期擬合,其中陰影區域指示來自包括三染色體之樣本之讀段深度將如何在預期擬合曲線內擬合。
圖6示出了資料圖中之例示性改進,其可以藉由對由1)GC偏差、2)樣本背景、及3)雜交探針捕獲引起之變化採用三重正規化控制來達成。
圖7示出了針對具有不同擬合樣本(fit sample)之若干染色體,深度讀段相對於預期擬合曲線之擬合。每個圖中之陰影區域表示指定染色體之一給定樣本之深度。每個圖中自左至右之擬合曲線係該擬合模型中1、2、或3條染色體之預期擬合。
圖8示出了一基因(SMN2)之一深度軌跡圖,其中母親具有一個基因拷貝,而胎兒具有零個。

Claims (33)

  1. 一種製備具有經富集的胎兒部分之生物樣本之方法,其包括:(a)自孕婦獲得包含游離DNA(cfDNA)之生物樣本;(b)自該生物樣本中萃取cfDNA;(c)以下之一者:(i)製備cfDNA庫及根據大小分離該等cfDNA片段,以僅保留小於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、約180個核苷酸長度、約185個核苷酸長度、約190個核苷酸長度、約195個核苷酸長度、或約200個核苷酸長度之cfDNA片段,或(ii)根據大小分離該等cfDNA片段,以僅保留小於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、約180個核苷酸長度、約185個核苷酸長度、約190個核苷酸長度、約195個核苷酸長度、或約200個核苷酸長度之cfDNA片段,及由該等經分離cfDNA片段製備cfDNA庫;(d)對所保留之cfDNA片段進行定序以獲得第一序列庫;(e)基於讀段長度的長度鑑定存在於該第一序列庫之至少兩個窗口中之(i)游離胎兒DNA(cffDNA)序列及(ii)游離母體DNA(cfmDNA)序列;及(f)自該第一序列庫之該至少兩個窗口中之每一者中分離該等cffDNA序列,從而獲得至少兩個富集胎兒部分之序列庫。
  2. 如請求項1之方法,其中根據大小分離該等cfDNA片段使該生物樣本中之該胎兒部分富集約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、或約2.0倍。
  3. 如請求項1或2之方法,其中自該第一序列庫之該至少兩個窗口中之每一者中分離該等cffDNA序列使該生物樣本中之該胎兒部分富集約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、約2.0倍、約2.1倍、約2.2倍、約2.3倍、約2.4倍、約2.5倍、約2.6倍、約2.7倍、約2.8倍、約2.9倍、約3.0倍、約3.1倍、約3.2倍、約3.3倍、約3.4倍、或約3.5倍。
  4. 如請求項1或2之方法,其中分離該等cfDNA片段包括電泳。
  5. 如請求項1或2之方法,其中該第一序列庫之該至少兩個窗口包含經評估之該第一序列庫之至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口,以鑑定及分離cffDNA序列,從而分別獲得至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個富集胎兒部分之序列庫。
  6. 如請求項1或2之方法,其進一步包括藉由對該第一序列庫中之cffDNA及cfmDNA之序列讀段與參考基因體進行比較、對來自該第一庫之序列讀段進行解多工、自該第一序列庫中去除重複序列、或其組合,從而自cfmDNA中鑑定及分離cffDNA。
  7. 如請求項1或2之方法,其進一步包括評估該至少兩個富集胎兒部分之序列庫中一種或多種基因突變之存在。
  8. 如請求項7之方法,其中該一種或多種基因突變導致選自以下之至少一種病況:21-羥化酶缺乏症、ABCC8相關高胰島素症、ARSACS、軟骨發育不全、全色盲、腺苷單磷酸脫胺酶1關聯之疾病、胼胝體發育不全伴神經元病、黑尿症、α-1-抗胰蛋白酶缺乏症、α-甘露醣儲積症、α-肌聚糖病、α-地中海貧血;阿茲海默症(Alzheimers),血管收縮素II受體關聯之疾病、脂蛋白E關聯之疾病;精胺琥珀酸尿症(Argininosuccinicaciduria)、天門冬葡萄糖胺 尿、運動失調伴維生素E缺乏、運動失調毛細管擴張症、自體免疫多內分泌病變症候群1型、BRCA1遺傳性乳癌/卵巢癌、BRCA2遺傳性乳癌/卵巢癌、Bardet-Biedl二氏症候群、Best卵黃囊狀黃斑失養症、β-肌聚糖病、β-地中海貧血、生物素酶缺乏症、Blau症候群、Bloom症候群、CFTR相關病症、CLN3相關神經性類蠟脂褐質病、CLN5相關神經性類蠟脂褐質病、CLN8相關神經性類蠟脂褐質病、Canavan病、肉毒鹼棕櫚醯轉移酶IA缺乏症、肉毒鹼棕櫚醯轉移酶II缺乏症、軟骨-毛髮發育不良、腦海綿狀畸形(Cerebral Cavernous Malformation)、無脈絡脈畸型、Cohen氏症候群、先天性白內障、面部異形(Facial Dysmorphism)及神經病變、先天性醣基化障礙la(Congenital Disorder of Glycosylationla)、先天性醣基化障礙Ib、先天性芬蘭腎病(Congenital Finnish Nephrosis)、克隆氏病(Crohn Disease)、胱胺酸病、DFNA 9(COCH)、糖尿病及聽力損失、早發性原發性肌緊張不足(Early-Onset Primary Dystonia;DYTI)、Herlitz-Pearson型交界型水皰性表皮鬆解症(Epidermolysis Bullosa Junctional,Herlitz-Pearson Type)、FANCC相關Fanconi貧血、FGFR1相關顱縫線封閉過早、FGFR2相關顱縫線封閉過早、FGFR3相關顱縫線封閉過早、第五因素Leiden血栓好發症(Factor V Leiden Thrombophilia)、第五因素R2突變血栓好發症、第十一因素缺乏症、第十三因素缺乏症、家族性腺瘤性息肉病(Familial Adenomatous Polyposis)、家族性自主神經障礙(Familial Dysautonomia)、家族性高膽固醇血症B型、家族性地中海熱(Familial Mediterranean Fever)、游離唾液酸儲存障礙(Free Sialic Acid Storage Disorder)、額顳葉癡呆伴Parkinson氏症17(Frontotemporal Dementia with Parkinsonism-17)、延胡索酸酶缺乏症、GJB2相關DFNA 3型非症候群性聽力損失及耳聾、GJB2相關DFNB 1非症候群性聽力損失及耳聾、GNE相關肌病、半乳糖血症、Gaucher氏病、葡萄糖-6-磷酸脫氫酶缺乏症、戊二酸血症1型、醣 原貯積病1a型(Glycogen Storage Disease Type 1a)、醣原貯積病Ib型、醣原貯積病II型、醣原貯積病III型、醣原貯積病V型、Gracile症候群、HFE相關聯之遺傳性血鐵沈積症(HFE-Associated Hereditary Hemochromatosis)、Halder自體祖先訊息標記(AIMs)、血紅蛋白S β-地中海貧血、遺傳性果糖不耐受、遺傳性胰腺炎、遺傳性胸腺嘧啶-尿嘧啶尿症(Hereditary Thymine-Uraciluria)、己醣胺酶A缺乏症、有汗性外胚層發育異常2(Hidrotic Ectodermal Dysplasia 2)、胱硫醚β-合酶缺乏引起之高胱胺酸尿症、高鉀血週期性麻痹1型、高鳥胺酸血症-高氨血症-高瓜胺酸尿症候群、原發性高草酸鹽尿症1型、原發性高草酸鹽尿症2型、軟骨生成減退、低鉀血週期性麻痹1型、低鉀血週期性麻痹2型、低磷酸酶症、嬰兒肌病及乳酸性酸中毒(致死型及非致死型)、異戊酸血症、Krabbe病、LGMD2I、Leber遺傳性視神經病變、法國-加拿大型Leigh症候群、長鏈3-羥醯基-輔酶A脫氫酶缺乏症(Long Chain 3-Hydroxyacyl-CoA Dehydrogenase Deficiency)、MELAS、MERRF、MTHFR缺乏症、MTHFR不耐熱變異、MTRNR1相關聽力損失及耳聾、MTTS1相關聽力損失及耳聾、MYH相關聯之息肉病、楓糖漿尿病1A型、楓糖漿尿病1B型、馬科恩-亞百特氏症候群(McCune-Albright Syndrome)、中鏈醯基輔酶A脫氫酶缺乏症、巨腦白質病伴皮質下囊腫(Megalencephalic Leukoencephalopathy with Subcortical Cyst)、異染性白質失養症(Metachromatic Leukodystrophy)、粒線體心肌病(Mitochondrial Cardiomyopathy)、粒線體DNA相關聯之Leigh症候群及NARP、黏脂貯積病IV(Mucolipidosis IV)、黏多醣病I型(Mucopolysaccharidosis Type I)、黏多醣病IIIA型、黏多醣病VII型、多發性內分泌瘤2型、肌-眼-腦疾病、線樣肌病(Nemaline Myopathy)、由於神經磷脂酶缺乏引起之尼曼-匹克病(Niemann-Pick Disease Due to Sphingomyelinase Deficiency)、尼曼-匹克病C1型、奈梅亨染色體斷裂症候群(Nijmegen Breakage Syndrome)、PPT1相關神經 性類蠟脂褐質病、PROP1相關下垂體激素缺乏症(PROP1-related pituitary hormone deficiency)、Pallister-Hall症候群、先天性肌剛痙病(Paramyotonia Congenita)、Pendred症候群、過氧化體雙功能酶缺乏症、廣泛性發展障礙(Pervasive Developmental Disorder)、苯丙胺酸羥化酶缺乏症、血漿蛋白原活化因子抑制物I(Plasminogen Activator Inhibitor I)關聯之疾病、體染色體隱性遺傳多囊腎病、凝血酶原G20210A血栓好發症、假維生素D缺乏性佝僂病、緻密成骨不全症、Bothnia型體染色體隱性色素沉著性視網膜炎、雷特氏症候群(Rett Syndrome)、胺根性點狀軟骨發育異常1型(Rhizomelic Chondrodysplasia Punctata Type 1)、短鏈醯基輔酶A脫氫酶缺乏症、Shwachman-Diamond症候群、Sjogren-Larsson症候群、Smith-Lemli-Opitz症候群、痙攣性截癱13、硫酸鹽轉運蛋白相關骨軟骨發育不良、TFR2相關遺傳性血色病、TPP1相關神經性類蠟脂褐質病、致死性軟骨發育不全、運甲狀腺素蛋白澱粉樣變性(Transthyretin Amyloidosis)、三功能蛋白缺乏症、酪胺酸羥化酶缺乏性DRD、酪胺酸血症I型、Wilson氏病、X性聯青年性視網膜劈裂症(X-Linked Juvenile Retinoschisis)、囊腫纖維化(cystic fibrosis)、脊髓性肌肉萎縮症(SMA)、血紅素病、及Zellweger症候群譜系。
  9. 如請求項1或2之方法,其進一步包括評估包含cfDNA之該生物樣本中非整倍體之存在。
  10. 如請求項9之方法,其中該非整倍體選自單染色體、三染色體、四染色體、五染色體、微缺失、微複製、以及單染色體、三染色體、四染色體、及五染色體之嵌合體形式。
  11. 一種並行檢測單一母體樣本中非整倍體之存在或不存在以及至少一種基因變體之存在或不存在之方法,其包括(i)自孕婦獲得生物樣本,其中該生物樣本包含游離DNA(cfDNA); (ii)製備cfDNA庫;(iii)對該cfDNA庫進行定序以產生序列庫;及(iv)檢測該單一母體樣本中非整倍體之存在或不存在以及至少一種基因變體之存在或不存在;其中(a)使該cfDNA庫富集以增加胎兒部分及(b)使該序列庫富集以增加胎兒部分,使得在檢測該單一母體樣本中非整倍體之存在或不存在以及至少一種基因變體之存在或不存在之前,該單一母體樣本之該胎兒部分增加至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、或至少1.5倍。
  12. 如請求項11之方法,其中該生物樣本係血液或血漿。
  13. 如請求項11或12之方法,其中使該cfDNA庫富集以增加該胎兒部分,並且使該序列庫富集以增加該胎兒部分。
  14. 如請求項11或12之方法,其中富集該cfDNA庫之該胎兒部分包括自該cfDNA庫中去除大於約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之任何DNA片段。
  15. 如請求項14之方法,其中自該cfDNA庫中去除該等DNA片段包括電泳。
  16. 如請求項11或12之方法,其中富集該序列庫之該胎兒部分包括對該序列庫之至少兩個窗口中之序列進行基於讀段長度之大小排除,從而獲得至少兩個富集胎兒部分之序列庫。
  17. 如請求項16之方法,其中該序列庫之該至少兩個窗口包含經評估之該第一序列庫之至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、或至少10個窗口,以鑑定及分離cffDNA序列,從而分別獲得至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少 9個、或至少10個富集胎兒部分之序列庫。
  18. 如請求項16之方法,其中該序列庫之該至少兩個窗口選自(i)0-145個核苷酸之序列、(ii)0-150個核苷酸之序列、(iii)0-155個核苷酸、(iv)0-160個核苷酸、(v)0-165個核苷酸、(vi)0-168個核苷酸、(vii)0-170個核苷酸、(viii)0-175個核苷酸、(ix)0-180個核苷酸、(x)0-185個核苷酸、(xi)0-190個核苷酸、(xii)0-195個核苷酸、(xiii)0-200個核苷酸、及(xiv)未閘控者。
  19. 如請求項16之方法,其中富集該序列庫之該胎兒部分進一步包括藉由對該第一序列庫中之cffDNA及cfmDNA之序列讀段與參考基因體進行比較、對來自該第一庫之序列讀段進行解多工、自該第一序列庫中去除重複序列、或其組合,從而自cfmDNA中鑑定及分離cffDNA。
  20. 如請求項11或12之方法,其中檢測至少一種基因變體之存在或不存在包括在該至少兩個富集胎兒部分之序列庫中之每一者中確定樣本中編碼該至少一種基因變體之每個等位基因之等位基因平衡,並基於該至少兩個富集胎兒部分之序列庫中之每一者中之該等位基因平衡產生每個等位基因之等位基因平衡軌跡,基於該至少兩個富集胎兒部分之序列庫之深度產生深度軌跡,或產生等位基因平衡軌跡及深度軌跡之組合。
  21. 如請求項11或12之方法,其中檢測非整倍體之存在或不存在包括分析該序列庫中對應於感興趣之染色體之至少一個序列之序列深度。
  22. 如請求項21之方法,其中對應於該感興趣之染色體之該至少一個序列之該序列深度適配該感興趣之染色體之預期深度模型。
  23. 如請求項21之方法,其中該序列深度藉由下式來計算:
    Figure 112101104-A0305-02-0064-1
    其中:dp係妊娠深度f係胎兒部分cm係母體拷貝數db係背景深度cf係胎兒拷貝數。
  24. 如請求項21之方法,其中將該序列深度正規化以控制GC偏差、樣本背景、雜交探針捕獲、或其組合。
  25. 如請求項11或12之方法,其中該方法包括檢測選自單染色體、三染色體、四染色體、多染色體X、多染色體Y、微缺失、微重複、五染色體、及其組合之非整倍體之存在或不存在。
  26. 如請求項11或12之方法,其中該至少一種基因變體與選自以下之疾病相關聯:21-羥化酶缺乏症、ABCC8相關高胰島素症、ARSACS、軟骨發育不全、全色盲、腺苷單磷酸脫胺酶1關聯之疾病、胼胝體發育不全伴神經元病、黑尿症、α-1-抗胰蛋白酶缺乏症、α-甘露醣儲積症、α-肌聚糖病、α-地中海貧血;阿茲海默症,血管收縮素II受體關聯之疾病、脂蛋白E關聯之疾病;精胺琥珀酸尿症、天門冬葡萄糖胺尿、運動失調伴維生素E缺乏、運動失調毛細管擴張症、自體免疫多內分泌病變症候群1型、BRCA1遺傳性乳癌/卵巢癌、BRCA2遺傳性乳癌/卵巢癌、Bardet-Biedl二氏症候群、Best卵黃囊狀黃斑失養症、β-肌聚糖病、β-地中海貧血、生物素酶缺乏症、Blau症候群、Bloom症候群、CFTR相關病症、CLN3相關神經性類蠟脂褐質病、CLN5相關神經性類蠟脂褐質病、CLN8相關神經性類蠟脂褐質病、Canavan病、肉毒鹼棕櫚醯轉移酶IA缺乏症、肉毒鹼棕櫚醯轉移酶II缺乏症、軟骨-毛髮發育不良、腦海綿狀畸形、無脈絡脈畸型、Cohen氏症候群、先天性白內障、面部異形及神經病 變、先天性醣基化障礙la、先天性醣基化障礙Ib、先天性芬蘭腎病、克隆氏病、胱胺酸病、DFNA 9(COCH)、糖尿病及聽力損失、早發性原發性肌緊張不足(DYTI)、Herlitz-Pearson型交界型水皰性表皮鬆解症、FANCC相關Fanconi貧血、FGFR1相關顱縫線封閉過早、FGFR2相關顱縫線封閉過早、FGFR3相關顱縫線封閉過早、第五因素Leiden血栓好發症、第五因素R2突變血栓好發症、第十一因素缺乏症、第十三因素缺乏症、家族性腺瘤性息肉病、家族性自主神經障礙、家族性高膽固醇血症B型、家族性地中海熱、游離唾液酸儲存障礙、額顳葉癡呆伴Parkinson氏症17、延胡索酸酶缺乏症、GJB2相關DFNA 3型非症候群性聽力損失及耳聾、GJB2相關DFNB 1非症候群性聽力損失及耳聾、GNE相關肌病、半乳糖血症、Gaucher氏病、葡萄糖-6-磷酸脫氫酶缺乏症、戊二酸血症1型、醣原貯積病1a型、醣原貯積病Ib型、醣原貯積病II型、醣原貯積病III型、醣原貯積病V型、Gracile症候群、HFE相關聯之遺傳性血鐵沈積症、Halder自體祖先訊息標記(AIMs)、血紅蛋白S β-地中海貧血、遺傳性果糖不耐受、遺傳性胰腺炎、遺傳性胸腺嘧啶-尿嘧啶尿症、己醣胺酶A缺乏症、有汗性外胚層發育異常2、胱硫醚β-合酶缺乏引起之高胱胺酸尿症、高鉀血週期性麻痹1型、高鳥胺酸血症-高氨血症-高瓜胺酸尿症候群、原發性高草酸鹽尿症1型、原發性高草酸鹽尿症2型、軟骨生成減退、低鉀血週期性麻痹1型、低鉀血週期性麻痹2型、低磷酸酶症、嬰兒肌病及乳酸性酸中毒(致死型及非致死型)、異戊酸血症、Krabbe病、LGMD2I、Leber遺傳性視神經病變、法國-加拿大型Leigh症候群、長鏈3-羥醯基-輔酶A脫氫酶缺乏症、MELAS、MERRF、MTHFR缺乏症、MTHFR不耐熱變異、MTRNR1相關聽力損失及耳聾、MTTS1相關聽力損失及耳聾、MYH相關聯之息肉病、楓糖漿尿病1A型、楓糖漿尿病1B型、馬科恩-亞百特氏症候群、中鏈醯基輔酶A脫氫酶缺乏症、巨腦白質病伴皮質下囊腫、異染性白質失養症、粒線體心肌病、粒 線體DNA相關聯之Leigh症候群及NARP、黏脂貯積病IV、黏多醣病I型、黏多醣病IIIA型、黏多醣病VII型、多發性內分泌瘤2型、肌-眼-腦疾病、線樣肌病、由於神經磷脂酶缺乏引起之尼曼-匹克病、尼曼-匹克病C1型、奈梅亨染色體斷裂症候群、PPT1相關神經性類蠟脂褐質病、PROP1相關下垂體激素缺乏症、Pallister-Hall症候群、先天性肌剛痙病、Pendred症候群、過氧化體雙功能酶缺乏症、廣泛性發展障礙、苯丙胺酸羥化酶缺乏症、血漿蛋白原活化因子抑制物I關聯之疾病、體染色體隱性遺傳多囊腎病、凝血酶原G20210A血栓好發症、假維生素D缺乏性佝僂病、緻密成骨不全症、Bothnia型體染色體隱性色素沉著性視網膜炎、雷特氏症候群、肢根性點狀軟骨發育異常1型、短鏈醯基輔酶A脫氫酶缺乏症、Shwachman-Diamond症候群、Sjogren-Larsson症候群、Smith-Lemli-Opitz症候群、痙攣性截癱13、硫酸鹽轉運蛋白相關骨軟骨發育不良、TFR2相關遺傳性血色病、TPP1相關神經性類蠟脂褐質病、致死性軟骨發育不全、運甲狀腺素蛋白澱粉樣變性、三功能蛋白缺乏症、酪胺酸羥化酶缺乏性DRD、酪胺酸血症I型、Wilson氏病、X性聯青年性視網膜劈裂症、囊腫纖維化、脊髓性肌肉萎縮症(SMA)、血紅素病、及Zellweger症候群譜系。
  27. 一種富集生物樣本中之游離胎兒DNA(cffDNA)之方法,其包括自孕婦獲得包含游離DNA(cfDNA)之生物樣本,其中該cfDNA包含cffDNA及游離母體DNA(cfmDNA);自該生物樣本中萃取該cfDNA;以及使所萃取之cfDNA經受大小排除過程,其中該大小排除過程具有約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之截止大小,從而產生富集cffDNA之樣本;定序該富集cffDNA之樣本;及 進行基於讀段長度之分析,其中在該序列庫之至少兩個窗口中建立感興趣之核酸序列之等位基因平衡;以及基於該至少兩個窗口之該等位基因平衡建立軌跡。
  28. 一種電腦模擬處理游離DNA(cfDNA)之方法,其包括對包含游離胎兒DNA(cffDNA)及游離母體DNA(cfmDNA)之cfDNA樣本進行定序以製備序列庫;進行基於讀段長度之分析,其中在該序列庫之至少兩個窗口中建立感興趣之核酸序列之等位基因平衡;以及基於該至少兩個窗口之該等位基因平衡建立軌跡。
  29. 一種在非侵入性產前篩查(NIPS)中減少來自多餘遺傳物質之背景雜訊之方法,其包括(i)自孕婦獲得生物樣本,其中該生物樣本包含游離DNA(cfDNA);(ii)定序用於NIPS之cfDNA;及(iii)處理用於NIPS之cfDNA序列,其中處理包括對該cfDNA進行電腦模擬處理以富集游離胎兒DNA(cffDNA)序列,及視情況進一步包含在定序之前藉由大小排除富集該生物樣本中之cffDNA。
  30. 如請求項29之方法,其中處理包括富集該生物樣本中之cffDNA及對該cfDNA進行電腦模擬處理兩者。
  31. 如請求項29或30之方法,其中富集該生物樣本中之游離胎兒DNA(cffDNA)包括使該cfDNA經受大小排除過程,其中該大小排除過程具有約150個核苷酸長度、約155個核苷酸長度、約160個核苷酸長度、約165個核苷酸長度、約170個核苷酸長度、約175個核苷酸長度、或約180個核苷酸長度之截止大小,從而產生富集cffDNA之樣本。
  32. 如請求項29或30之方法,其中對該cfDNA進行電腦模擬處 理包括如請求項28之方法。
  33. 如請求項29或30之方法,其進一步包括正規化以控制GC偏差、樣本背景、雜交探針捕獲、或其組合。
TW112101104A 2022-01-11 2023-01-10 非侵入性產前樣本製備以及相關方法和用途 TWI856481B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202263298593P 2022-01-11 2022-01-11
US63/298,593 2022-01-11
US202263357915P 2022-07-01 2022-07-01
US63/357,915 2022-07-01

Publications (2)

Publication Number Publication Date
TW202334439A TW202334439A (zh) 2023-09-01
TWI856481B true TWI856481B (zh) 2024-09-21

Family

ID=87070224

Family Applications (2)

Application Number Title Priority Date Filing Date
TW113131347A TW202449174A (zh) 2022-01-11 2023-01-10 非侵入性產前樣本製備以及相關方法和用途
TW112101104A TWI856481B (zh) 2022-01-11 2023-01-10 非侵入性產前樣本製備以及相關方法和用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW113131347A TW202449174A (zh) 2022-01-11 2023-01-10 非侵入性產前樣本製備以及相關方法和用途

Country Status (7)

Country Link
US (1) US20230220448A1 (zh)
EP (1) EP4463547A4 (zh)
JP (1) JP2025504393A (zh)
AU (1) AU2023207959A1 (zh)
CA (1) CA3247737A1 (zh)
TW (2) TW202449174A (zh)
WO (1) WO2023137021A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024129354A1 (en) * 2022-12-16 2024-06-20 The Johns Hopkins University Methods for distinguishing aneuplodies in non-invasive prenatal testing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021236680A1 (en) * 2020-05-18 2021-11-25 Myriad Women's Health, Inc. Nucleic acid sample enrichment and screening methods

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2728014B1 (en) * 2012-10-31 2015-10-07 Genesupport SA Non-invasive method for detecting a fetal chromosomal aneuploidy
WO2018064486A1 (en) * 2016-09-29 2018-04-05 Counsyl, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021236680A1 (en) * 2020-05-18 2021-11-25 Myriad Women's Health, Inc. Nucleic acid sample enrichment and screening methods

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
期刊 Ge, Huijuan et al. Noninvasive prenatal detection for pathogenic CNVs: the application in α-thalassemia. PloS one vol. 8 PLOS 28 Jun. 2013 *

Also Published As

Publication number Publication date
TW202334439A (zh) 2023-09-01
WO2023137021A2 (en) 2023-07-20
AU2023207959A1 (en) 2024-07-25
US20230220448A1 (en) 2023-07-13
JP2025504393A (ja) 2025-02-12
EP4463547A4 (en) 2025-12-31
CA3247737A1 (en) 2023-07-20
EP4463547A2 (en) 2024-11-20
TW202449174A (zh) 2024-12-16
WO2023137021A3 (en) 2023-10-05

Similar Documents

Publication Publication Date Title
US20220325344A1 (en) Identifying a de novo fetal mutation from a maternal biological sample
TWI832483B (zh) 核酸鹼基修飾的測定
JP7081829B2 (ja) 無細胞試料中の腫瘍dnaの解析
Valencia et al. Assessment of target enrichment platforms using massively parallel sequencing for the mutation detection for congenital muscular dystrophy
CN115066504A (zh) 使用孕妇体内的长游离片段进行的分子分析
EP2663655A2 (en) Paired end random sequence based genotyping
TWI856481B (zh) 非侵入性產前樣本製備以及相關方法和用途
CN118647717A (zh) 非侵入性产前样本制备以及相关方法和用途
Li et al. The potential of mRNA markers in body fluids and personal source analysis based on the QNome nanopore sequencing
CN114507707B (zh) 一种富集目标区域再酶切构建单倍型的方法
HK40077753A (zh) 使用孕妇体内的长游离片段进行的分子分析
HK40092153A (zh) 由母本生物样品进行胎儿基因组的分析
WO2026085074A1 (en) Methods and compositions for single-gene non-invasive prenatal testings
HK40047861B (zh) 由母本生物样品进行胎儿基因组分析
HK40047861A (zh) 由母本生物样品进行胎儿基因组分析
EA049610B1 (ru) Молекулярные анализы с использованием длинных внеклеточных фрагментов при беременности
HK40007427A (zh) 由母本生物样品鉴定新生胎儿突变
HK40007427B (zh) 由母本生物样品鉴定新生胎儿突变
Benovoy Characterization of transcript isoform variations in human and chimpanzee
HK1175504B (zh) 基於母本生物样品进行胎儿基因组的分析
HK1175504A (zh) 基於母本生物样品进行胎儿基因组的分析
HK1239754B (zh) 由母本生物样品进行胎儿基因组的分析