CN117580963A - 用于分析核酸分子的方法和系统 - Google Patents

用于分析核酸分子的方法和系统 Download PDF

Info

Publication number
CN117580963A
CN117580963A CN202280046401.3A CN202280046401A CN117580963A CN 117580963 A CN117580963 A CN 117580963A CN 202280046401 A CN202280046401 A CN 202280046401A CN 117580963 A CN117580963 A CN 117580963A
Authority
CN
China
Prior art keywords
nucleic acid
cell
acid molecules
free nucleic
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280046401.3A
Other languages
English (en)
Inventor
J·J·查本
D·M·库兹
M·迪恩
A·A·阿里扎德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leland Stanford Junior University
Original Assignee
Leland Stanford Junior University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leland Stanford Junior University filed Critical Leland Stanford Junior University
Priority claimed from PCT/US2022/071759 external-priority patent/WO2022236221A1/en
Publication of CN117580963A publication Critical patent/CN117580963A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

描述了从活检检测癌症、移植排斥或胎儿遗传异常的过程和材料。在一些情况下,可以对核酸分子例如细胞游离核酸进行测序,并且可以利用测序结果来检测指示赘生物、移植排斥或胎儿遗传异常的序列。相中发生的体细胞变异和/或插入和缺失(插入缺失突变)的检测可以在诊断扫描中指示癌症、移植排斥或胎儿遗传异常的存在,并且可以进行临床干预。

Description

用于分析核酸分子的方法和系统
相关申请的交叉引用
本申请要求2021年5月13日提交的美国临时申请号63/188,410、2021年7月22日提交的美国临时申请号63/224,795以及2021年5月5日提交的美国专利申请号17/308,958的权益,其各自通过引用整体并入本文。
序列表
本申请包含已以ASCII格式以电子方式提交并通过引用整体并入本文的序列表。所述ASCII副本创建于2020年11月3日,名为58626-702_601_SL.txt,大小为307,199字节。
政府权利
本发明是在美国国立卫生研究院授予的CA233975、CA241076和CA188298下由政府支持完成的。政府对本发明享有一定的权利。
背景技术
可以基于细胞游离核酸(例如,细胞游离脱氧核糖核酸(cfDNA)和细胞游离核糖核酸(cfRNA))的分析来检测体细胞改变(例如,突变的核酸)的无创血液测试由于获得生物标本(例如生物体液)相对容易性而成为癌症筛查应用的有吸引力的候选者。循环肿瘤核酸(例如,ctDNA或ctRNA;即来源于癌性细胞的核酸)可以是许多癌症亚型中的敏感和特异的生物标志物。然而,目前从ctDNA检测微小残留病(MRD)的方法可能受到一个或多个因素的限制,例如低输入DNA量和高背景错误率。
最近的方法通过使用错误抑制测序(error-suppressed sequencing)来跟踪多个体细胞突变来提高ctDNA MRD性能,导致低至来自有限的cfDNA输入的100,000中的4份的检测限。在治疗期间或之后检测残留疾病是一种强大的工具,即使在放射学缓解期间,可检测到的MRD也代表了不良的预后体征。然而,目前的检测限可能不足以普遍检测注定疾病复发或进展的患者的残留疾病。这种“检测缺失”在弥漫性大B细胞淋巴瘤(DLBCL)中得到了体现,其中两个周期的治愈性治疗后的ctDNA检测是一个强有力的预后标志物。尽管如此,几乎三分之一的经历疾病进展的患者没有在该界标处可检测到的ctDNA,这代表了“假阴性”测试。在结肠癌和乳腺癌中观察到类似的假阴性率。
发明内容
本公开内容提供用于分析来自受试者的核酸例如细胞游离核酸(例如,cfDNA、cfRNA)的方法和系统。本公开内容的方法和系统可以利用来源于受试者的测序结果来检测来源于癌症的核酸(例如,ctDNA、ctRNA)以用于例如疾病诊断、疾病监测或确定用于受试者的治疗。本公开内容的方法和系统可以表现出检测来源于癌症的核酸的增强的灵敏度、特异性和/或可靠性。
在一个方面,本公开内容提供了一种方法,包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异(phasedvariant),其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析鉴定的一个或多个细胞游离核酸分子以确定受试者的病况。在一些实施方案中,使用细胞DNA代替细胞游离DNA(例如,用于检测白血病或其他血液癌症)。
在本文公开的任何一种方法的一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一种或多种插入或缺失(插入缺失突变(indel)),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一些实施方案中,该方法还包括确定分子中的起始位置(即,最5'端核苷酸)和结束位置(即,最3'端核苷酸)。在一些情况下,肿瘤来源的核酸,例如肿瘤来源的cfDNA分子,可以具有定型的起始/结束位置,其可能反映了组织特异性核酸酶的切割。起始和结束位置可以与定相变异结合使用来鉴定受试者的病况。
在一个方面,本公开内容提供了一种方法,包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,包括:(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
在本文公开的任何一种方法的一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在本文公开的任何一种方法的一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,过程(a)至(c)通过计算机系统执行。
在本文公开的任何一种方法的一些实施方案中,基于核酸扩增生成测序数据。在本文公开的任何一种方法的一些实施方案中,基于聚合酶链式反应生成测序数据。在本文公开的任何一种方法的一些实施方案中,基于扩增子测序生成测序数据。
在本文公开的任何一种方法的一些实施方案中,基于下一代测序(NGS)生成测序数据。备选地,在本文公开的任何一种方法的一些实施方案中,基于非基于杂交的NGS生成测序数据。
在本文公开的任何一种方法的一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下生成测序数据。在本文公开的任何一种方法的一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
在本文公开的任何一种方法的一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种治疗受试者的病况的方法,该方法包括:(a)鉴定用于治疗病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中多个定相变异的存在指示受试者的病况;和(b)基于(a)中的鉴定使受试者接受治疗。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
在一个方面,本公开内容提供了一种监测受试者的病况的进展的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于病况的第一状态和病况的第二状态确定病况的进展,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在本文公开的任何一种方法的一些实施方案中,病况的进展是病况的恶化。
在本文公开的任何一种方法的一些实施方案中,病况的进展是病况的至少部分缓解。
在本文公开的任何一种方法的一些实施方案中,所述多个定相变异的存在指示受试者的病况的第一状态或第二状态。
在本文公开的任何一种方法的一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。
在本文公开的任何一种方法的一些实施方案中,病况的进展指示受试者的病况的微小残留病。在本文公开的任何一种方法的一些实施方案中,病况的进展指示受试者的肿瘤负荷或癌症负荷。
在本文公开的任何一种方法的一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,和其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,和其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
在本文公开的任何一种方法的一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。
在本文公开的任何一种方法的一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。
在本文公开的任何一种方法的一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,可激活报告剂是荧光团。
在本文公开的任何一种方法的一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的病况。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的病况。在一些实施方案中,频率指示与病况相关的患病细胞。在一些实施方案中,病况是弥漫性大B细胞淋巴瘤,并且其中频率指示一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
在本文公开的任何一个方法的一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在本文公开的任何一种方法的一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列来源于受试者的样品。
在本文公开的任何一种方法的一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。
在本文公开的任何一种方法的一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包括患病细胞。在一些实施方案中,患病细胞包括肿瘤细胞。在一些实施方案中,患病样品包括实体瘤。
在本文公开的任何一种方法的一些实施方案中,核酸探针组是基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者或健康队列的健康细胞的测序数据而鉴定的多个定相变异设计的。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。在一些实施方案中,已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。
在本文公开的任何一种方法的一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。
在本文公开的任何一种方法的一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子,确定受试者患有病况或确定受试者的病况的程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的病况的进展。
在本文公开的任何一种方法的一些实施方案中,该方法还包括进行不同的程序以确认受试者的病况。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。
在本文公开的任何一种方法的一些实施方案中,受试者在(a)之前已接受针对病况的治疗。
在本文公开的任何一种方法的一些实施方案中,治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。
在本文公开的任何一种方法的一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
在本文公开的任何一种方法的一些实施方案中,病况包括疾病。
在本文公开的任何一种方法的一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
在本文公开的任何一种方法的一些实施方案中,受试者是哺乳动物。在本文公开的任何一种方法的一些实施方案中,受试者是人。
在本文公开的任何一种方法的一些实施方案中,病况包括赘生物、癌症或肿瘤。在一些实施方案中,病况包括实体瘤。在一些实施方案中,病况包括淋巴瘤。在一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。在本文公开的任何一种方法的一些实施方案中,所述病况包括移植排斥或染色体异常。
在本文公开的任何一种方法的一些实施方案中,根据对先前肿瘤样品或细胞游离核酸样品进行测序,多个定相变异先前已被鉴定为肿瘤来源的。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种包含诱饵组的组合物,所述诱饵组包含一组核酸探针,其被设计为捕获细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约5%的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针组被设计成下拉细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针组被设计成捕获一个或多个细胞游离DNA分子,所述一个或多个细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至多约10%、至多约20%、至多约30%、至多约40%、至多约50%、至多约60%、至多约70%、至多约80%、至多约90%或约100%的基因组区域。
在本文公开的任何组合物的一些实施方案中,诱饵组包含至多5个、至多10个、至多50个、至多100个、至多500个、至多1000个或至多2000个核酸探针。
在本文公开的任何组合物的一些实施方案中,核酸探针组中的个体核酸探针包含下拉标签(pull-down tag)。
在本文公开的任何组合物的一些实施方案中,下拉标签包含核酸条形码。
在本文公开的任何组合物的一些实施方案中,下拉标签包含生物素。
在本文公开的任何组合物的一些实施方案中,每个细胞游离DNA分子的长度为约100个核苷酸至约180个核苷酸。
在本文公开的任何组合物的一些实施方案中,基因组区域与病况相关。
在本文公开的任何组合物的一些实施方案中,当受试者患有病况时,基因组区域表现出异常的体细胞超突变。
在本文公开的任何组合物的一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
在本文公开的任何组合物的一些实施方案中,该组合物进一步包含获自或衍生自受试者的多个细胞游离DNA分子。
在一个方面,本公开内容提供了一种对个体进行临床程序的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;(c)利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和(d)基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
在本文公开的任何组合物的一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,基因组基因座选自:(i)表1中鉴定的基因组区域,(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针的序列选自表6。
在本文公开的任何组合物的一些实施方案中,临床程序是血液测试、医学成像或体格检查。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
在一个方面,本公开内容提供一种治疗个体的B细胞癌症的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;(c)利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和(d)基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
在本文公开的任何组合物的一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,基因组基因座选自:(i)表1中鉴定的基因组区域,(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针的序列选自表6。
在本文公开的任何组合物的一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
在一个方面,本公开内容提供了一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且其中靶向测序是利用核酸探针下拉经确定为含有多个定相变异的基因组基因座的序列进行的,所述基因组基因座的序列由来源于癌症的先前活检的先前测序结果所确定;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异中的至少一组;和(c)基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
在本文公开的任何组合物的一些实施方案中,液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变来治疗个体以减少癌症。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)通过计算机系统分析一个或多个插入缺失突变以确定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)通过计算机系统分析一个或多个插入或缺失(插入缺失突变)以确定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个,其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
在一个方面,本公开内容提供了治疗受试者的病况的方法,该方法包括:(a)鉴定用于治疗该病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变),并且其中一个或多个插入缺失突变的存在指示受试者的病况;和(b)基于(a)中的鉴定使受试者接受治疗。
在一个方面,本公开内容提供了一种监测受试者的病况的进展的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于病况的第一状态和病况的第二状态确定病况的进展,其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)。
在一些实施方案中,病况的进展是病况的恶化。在一些实施方案中,病况的进展是病况的至少部分缓解。在一些实施方案中,一个或多个插入缺失突变的存在指示受试者的病况的第一状态或第二状态。在一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。在一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。在一些实施方案中,病况的进展指示受试者的病况的微小残留病。在一些实施方案中,病况的进展指示受试者的肿瘤负荷或癌症负荷。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,在个体核酸探针与一个或多个插入缺失突变杂交后,可激活报告剂被激活。在一些实施方案中,在已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含一个或多个插入缺失突变的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含一个或多个插入缺失突变的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量指示受试者的病况。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的一个或多个插入缺失突变的频率指示受试者的病况。在一些实施方案中,频率指示与病况相关的患病细胞。在一些实施方案中,病况是弥漫性大B细胞淋巴瘤,并且其中频率指示一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
在一些实施方案中,一个或多个插入缺失突变包含同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个插入缺失突变。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,患病细胞包括肿瘤细胞。在一些实施方案中,患病样品包括实体瘤。在一些实施方案中,基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者的健康细胞或健康队列的测序数据而鉴定的一个或多个插入缺失突变来设计核酸探针组。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。在一些实施方案中,已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域或(ii)表3中鉴定的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
在一些实施方案中,该方法还包括基于所鉴定的包含一个或多个插入缺失突变的一个或多个细胞游离核酸分子来确定受试者患有病况或确定受试者的病况的程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的病况的进展。在一些实施方案中,该方法还包括进行不同的程序以确认受试者的病况。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。在一些实施方案中,受试者在(a)之前已接受针对病况的治疗。在一些实施方案中,治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,病况包括疾病。在一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,病况包括赘生物、癌症或肿瘤。在一些实施方案中,病况包括实体瘤。在一些实施方案中,病况包括淋巴瘤。在一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。在一些实施方案中,一个或多个插入缺失突变先前已通过对先前的肿瘤样品或细胞游离核酸样品进行测序而被鉴定为肿瘤来源的。
在一个方面,本公开内容提供了一种对个体进行临床程序的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
在一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。在一些实施方案中,核酸探针的序列选自表6。在一些实施方案中,临床程序是血液测试、医学成像或体格检查。
在一个方面,本公开内容提供了治疗个体的B细胞癌症的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
在一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。在一些实施方案中,核酸探针的序列选自表6。在一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一个方面,本公开内容提供了一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且其中靶向测序是利用核酸探针下拉经确定含有一个或多个插入或缺失(插入缺失突变)的基因组基因座的序列来进行的,如通过在来源于癌症的先前活检上的先前测序结果所确定的;鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入缺失突变的至少一个集合;和基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
在一些实施方案中,液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种治疗已经接受器官或组织移植的受试者的移植排斥的方法,该方法包括:(a)鉴定用于治疗移植排斥的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有移植排斥,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中多个定相变异的存在指示受试者的移植排斥;和(b)基于(a)中的鉴定使受试者接受治疗。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有移植排斥。
在一个方面,本公开内容提供了一种监测已经接受器官或组织移植的受试者的移植排斥的存在、不存在或程度的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第一状态;(b)基于从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于第一状态和第二状态确定受试者的移植排斥状态,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在一些实施方案中,移植排斥状态是至少部分移植排斥。在一些实施方案中,多个定相变异的存在指示第一状态或第二状态。在一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。在一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受移植排斥的治疗。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与移植排斥相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者具有移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)多个细胞游离核酸分子,所述细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)多个细胞游离核酸分子,所述细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。在一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的移植排斥的存在、不存在或程度。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的移植排斥的存在、不存在或程度。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的移植排斥的存在或不存在。在一些实施方案中,频率指示与移植排斥的存在、不存在或程度相关的患病细胞。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的移植排斥的存在或不存在。在一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。在一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与与移植排斥的存在或不存在相关的基因组基因座的至少一部分序列杂交。在一些实施方案中,已知当受试者患有移植排斥时,与移植排斥的存在、不存在或程度相关的基因组基因座表现出异常的体细胞超突变。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。在一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定移植排斥的存在或不存在或确定其程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与移植排斥的存在或不存在相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的移植排斥的存在、不存在或程度的进展。在一些实施方案中,该方法还包括进行不同的程序以确认受试者的移植排斥的存在、不存在或程度。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子确定针对受试者的移植排斥的治疗。在一些实施方案中,受试者在(a)之前已接受针对移植排斥的治疗。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,根据权利要求309-313中任一项所述的方法,其中所述测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种监测怀孕受试者的胎儿遗传异常的存在、不存在或升高的风险的方法,该方法包括:(a)基于来自从怀孕受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的第一状态;(b)基于来自从怀孕受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的第二状态,其中在从怀孕受试者获得第一多个细胞游离核酸分子之后从怀孕受试者获得第二多个细胞游离核酸分子;和(c)基于第一状态和第二状态确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在一些实施方案中,移植排斥状态是至少部分移植排斥。在一些实施方案中,多个定相变异的存在指示第一状态或第二状态。在一些实施方案中,第二多个细胞游离核酸分子是在从怀孕受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月从怀孕受试者获得的。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与遗传异常相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。在一些实施方案中,已至少部分地基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定胎儿具有遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于已鉴定的一个或多个插入缺失突变确定遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。在一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示遗传异常。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示遗传异常。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示遗传异常。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示遗传异常。在一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。在一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于怀孕受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,健康细胞来自怀孕受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与遗传异常相关的基因组基因座的至少一部分序列杂交。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。在一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来监测怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的进展。在一些实施方案中,该方法还包括进行不同的程序以确认怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,多个细胞游离核酸分子来源于怀孕受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,怀孕受试者是哺乳动物。在一些实施方案中,怀孕受试者是人。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,其包括将一组核酸探针添加到包含已从受试者获得或衍生的多个核酸分子的样品中,其中核酸探针组的每个核酸探针被配置为与包含多个定相变异的靶核酸分子杂交,使得核酸探针与从多个定相变异中的第一定相变异延伸至多个定相变异中的第二定相变异的靶核酸分子的至少一个区域互补。(为清楚起见,该区域包括第一定相变异和第二定相变异)。
此方法及其本文所述的实施方案可涉及使用杂合捕获探针/诱饵,例如生物素化寡核苷酸,其可用于杂合捕获富集步骤,使得杂合捕获探针结合并优先捕获含有定相变异的核酸分子。这种杂合捕获方法可以提高循环肿瘤DNA或来自移植器官的循环DNA的捕获灵敏度。通过将杂合捕获探针设计为(1)包含与包含定相变异的分子(而不是参考基因组序列的相应区域)互补的序列和(2)具有优化核酸结合动力学/热力学(ΔG或结合能)的长度,使得与没有定相变异的相应分子相比,杂合捕获探针优先结合包含感兴趣的定相变异的核酸分子,可以合成杂合捕获探针来特异性靶向含有定相变异的分子。这种杂合捕获探针可以导致相关核酸序列的改善的富集,从而结果需要更少的测序。例如,在一些情况下(例如在评估微小残留病、疾病状态或移植排斥状态时),可以获得癌性样品或来自移植器官的样品并进行测序以鉴定此类样品中相对于参考基因组序列(例如来自受试者的相应健康细胞的序列)的定相变异,并且杂合捕获探针可以被设计为优先结合含有从癌性和/或移植器官样品中鉴定的定相变异的核酸序列。在一些情况下,此类杂合捕获探针可用于含有定相变异的核酸分子的单链回收。由这样的探针组捕获的核酸分子可以包括DNA或RNA(例如,单链RNA),例如细胞游离DNA或细胞游离DNA。该特定方法中描述的探针可以与本文描述的其他方法组合使用。
在一些实施方案中,核酸探针组中的每个核酸探针包含下拉标签,例如生物素。在一些实施方案中,该方法还包括将与核酸探针杂交的靶核酸分子和不与核酸探针杂交的核酸分子分离,从而捕获靶核酸分子。在一些实施方案中,核酸分子是细胞游离核酸分子。在一些实施方案中,第一定相变异选自体细胞单核苷酸变异、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点和局部超突变区域,并且第二定相变异选自体细胞单核苷酸变异、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点以及局部超突变区域。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异间隔至少1、2、3、4、5、10或20个核苷酸。在一些实施方案中,核酸探针组中的每个核酸探针的长度是(1)少于40个核苷酸、少于30个核苷酸或少于20个核苷酸,或(2)比多个定相变异中的第一定相变异与多个定相变异中的第二定相变异之间的距离长不超过5个核苷酸、不超过10个核苷酸、不超过20个核苷酸或不超过30个核苷酸,其中第一定相变异和第二定相变异是多个定相变异中最分离的定相变异(即,具有最多数量的插入核苷酸)。
在一些实施方案中,靶核酸分子是来源于受试者的癌细胞或移植细胞的基因组的其序列与参考基因组序列不同的预先鉴定的部分的分子,其中基因组的预先鉴定的部分的长度小于200、小于180或小于150个核苷酸。在一些实施方案中,多个核酸探针中的每个核酸探针与靶核酸分子的结合的ΔG比与在长度和序列上与靶核酸分子相同的对应分子的结合的ΔG更低,除该对应分子具有与参考基因组序列相对应的序列之外。在一些实施方案中,参考基因组序列包含(1)参考队列的一部分,例如hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的一部分,或(2)来自受试者的健康样品的一部分。在一些实施方案中,该方法涉及捕获来源于染色体的沃森链或克里克链的靶核酸,但不涉及捕获另一条链的相应互补核酸。在一些实施方案中,该方法包括捕获至少10、至少100、至少1000或至少10,000个靶核酸分子。在一些实施方案中,该方法还包括对捕获的靶核酸进行测序以获得来源于多个核酸分子的测序数据。在一些实施方案中,测序不涉及分子条形码的使用。在一些实施方案中,测序不包括双链体测序。
在一个方面,本公开内容提供了一种用于确定受试者的病况(例如,评估微小残留病、疾病进展或移植排斥状态)的方法,该方法包括通过计算机系统获得通过本文描述的涉及使用杂合捕获探针的任何方法获得的序列信息,所述杂合捕获探针被设计为优先结合与缺乏定相变异的相应分子相比含有定相变异的分子;通过计算机系统处理测序数据以鉴定多个核酸分子中的一个或多个核酸分子,其中所述一个或多个核酸分子中的每一个相对于参考基因组序列包含多个定相变异;以及通过计算机系统分析所鉴定的一个或多个核酸分子以确定受试者的病况。在一些实施方案中,此类方法不包括双链体介导的错误抑制或条形码介导的错误抑制。可以基于受试者的病况(例如,状态)的鉴定来治疗个体(例如,用抗癌剂、抗排斥剂或外科手术)。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。在一些实施方案中,使用细胞DNA代替细胞游离DNA(例如,用于检测白血病或其他血液癌症)。
在本文公开的任何一种方法的一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一些实施方案中,该方法还包括确定分子中的起始位置(即,最5'端核苷酸)和结束位置(即,最3'端核苷酸)。在一些情况下,肿瘤来源的核酸,例如肿瘤来源的cfDNA分子,可以具有定型的起始/结束位置,其可能反映了组织特异性核酸酶的切割。起始和结束位置可以与定相变异结合使用来鉴定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
在本文公开的任何一种方法的一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在本文公开的任何一种方法的一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,过程(a)至(c)通过计算机系统执行。
在本文公开的任何一种方法的一些实施方案中,测序数据基于核酸扩增产生。在本文公开的任何一种方法的一些实施方案中,测序数据基于聚合酶链式反应产生。在本文公开的任何一种方法的一些实施方案中,测序数据基于扩增子测序产生。
在本文公开的任何一种方法的一些实施方案中,测序数据基于下一代测序(NGS)产生。备选地,在本文公开的任何一种方法的一些实施方案中,测序数据基于非基于杂交的NGS产生。
在本文公开的任何一种方法的一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在本文公开的任何一种方法的一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
在本文公开的任何一种方法的一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种治疗受试者的病况的方法,该方法包括:(a)鉴定用于治疗该病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中多个定相变异的存在指示受试者的病况;和(b)基于(a)中的鉴定使受试者接受治疗。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
在一个方面,本公开内容提供了一种监测受试者的病况的进展的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于病况的第一状态和病况的第二状态确定病况的进展,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在本文公开的任何一种方法的一些实施方案中,病况的进展是病况的恶化。
在本文公开的任何一种方法的一些实施方案中,病况的进展是病况的至少部分缓解。
在本文公开的任何一种方法的一些实施方案中,所述多个定相变异的存在指示受试者的病况的第一状态或第二状态。
在本文公开的任何一种方法的一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。
在本文公开的任何一种方法的一些实施方案中,病况的进展指示受试者的病况的微小残留病。在本文公开的任何一种方法的一些实施方案中,病况的进展指示受试者的肿瘤负荷或癌症负荷。
在本文公开的任何一种方法的一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
在本文公开的任何一种方法的一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。
在本文公开的任何一种方法的一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。
在本文公开的任何一种方法的一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,可激活报告剂是荧光团。
在本文公开的任何一种方法的一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的病况。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的病况。在一些实施方案中,频率指示与病况相关的患病细胞。在一些实施方案中,病况是弥漫性大B细胞淋巴瘤,并且其中频率指示一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
在本文公开的任何一种方法的一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在本文公开的任何一种方法的一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列来源于受试者的样品。
在本文公开的任何一种方法的一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。
在本文公开的任何一种方法的一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,患病细胞包括肿瘤细胞。在一些实施方案中,患病样品包括实体瘤。
在本文公开的任何一种方法的一些实施方案中,核酸探针组是基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者或健康队列的健康细胞的测序数据而鉴定的多个定相变异设计的。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。在一些实施方案中,已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。
在本文公开的任何一种方法的一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。
在本文公开的任何一种方法的一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子,确定受试者患有病况或确定受试者的病况的程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的病况的进展。
在本文公开的任何一种方法的一些实施方案中,该方法还包括进行不同的程序以确认受试者的病况。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。
在本文公开的任何一种方法的一些实施方案中,受试者在(a)之前已接受针对病况的治疗。
在本文公开的任何一种方法的一些实施方案中,治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。
在本文公开的任何一种方法的一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
在本文公开的任何一种方法的一些实施方案中,病况包括疾病。
在本文公开的任何一种方法的一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
在本文公开的任何一种方法的一些实施方案中,受试者是哺乳动物。在本文公开的任何一种方法的一些实施方案中,受试者是人。
在本文公开的任何一种方法的一些实施方案中,病况包括赘生物、癌症或肿瘤。在一些实施方案中,病况包括实体瘤。在一些实施方案中,病况包括淋巴瘤。在一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。在本文公开的任何一种方法的一些实施方案中,病况包括移植排斥或染色体异常。
在本文公开的任何一种方法的一些实施方案中,根据对先前肿瘤样品或细胞游离核酸样品进行测序,多个定相变异先前已被鉴定为肿瘤来源的。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种包含诱饵组的组合物,所述诱饵组包含一组核酸探针,其被设计为捕获细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约5%的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针组被设计成下拉细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针组被设计成捕获一个或多个细胞游离DNA分子,所述一个或多个细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至多约10%、至多约20%、至多约30%、至多约40%、至多约50%、至多约60%、至多约70%、至多约80%、至多约90%或约100%的基因组区域。
在本文公开的任何组合物的一些实施方案中,诱饵组包含至多5个、至多10个、至多50个、至多100个、至多500个、至多1000个或至多2000个核酸探针。
在本文公开的任何组合物的一些实施方案中,核酸探针组中的个体核酸探针包含下拉标签(pull-down tag)。
在本文公开的任何组合物的一些实施方案中,下拉标签包含核酸条形码。
在本文公开的任何组合物的一些实施方案中,下拉标签包含生物素。
在本文公开的任何组合物的一些实施方案中,每个细胞游离DNA分子的长度为约100个核苷酸至约180个核苷酸。
在本文公开的任何组合物的一些实施方案中,基因组区域与病况相关。
在本文公开的任何组合物的一些实施方案中,当受试者患有病况时,基因组区域表现出异常的体细胞超突变。
在本文公开的任何组合物的一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
在本文公开的任何组合物的一些实施方案中,该组合物进一步包含获自或衍生自受试者的多个细胞游离DNA分子。
在一个方面,本公开内容提供了一种对个体进行临床程序的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;(c)利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和(d)基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
在本文公开的任何组合物的一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,基因组基因座选自:(i)表1中鉴定的基因组区域,(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针的序列选自表6。
在本文公开的任何组合物的一些实施方案中,临床程序是血液测试、医学成像或体格检查。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
在一个方面,本公开内容提供一种治疗个体的B细胞癌症的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;(c)利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和(d)基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
在本文公开的任何组合物的一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,基因组基因座选自:(i)表1中鉴定的基因组区域,(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针的序列选自表6。
在本文公开的任何组合物的一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
在一个方面,本公开内容提供了一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且其中靶向测序是利用核酸探针下拉经确定为含有多个定相变异的基因组基因座的序列进行的,所述基因组基因座的序列由来源于癌症的先前活检的先前测序结果所确定;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异中的至少一组;和(c)基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
在本文公开的任何组合物的一些实施方案中,液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变来治疗个体以减少癌症。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)通过计算机系统分析一个或多个插入缺失突变以确定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)通过计算机系统分析一个或多个插入或缺失(插入缺失突变)以确定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个,其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
在一个方面,本公开内容提供了治疗受试者的病况的方法,该方法包括:(a)鉴定用于治疗该病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定该受试者患有所述病况,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变),并且其中一个或多个插入缺失突变的存在指示受试者的病况;和(b)基于(a)中的鉴定使受试者接受治疗。
在一个方面,本公开内容提供了一种监测受试者的病况的进展的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于病况的第一状态和病况的第二状态确定病况的进展,其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)。
在一些实施方案中,病况的进展是病况的恶化。在一些实施方案中,病况的进展是病况的至少部分缓解。在一些实施方案中,一个或多个插入缺失突变的存在指示受试者的病况的第一状态或第二状态。在一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。在一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。在一些实施方案中,病况的进展指示受试者的病况的微小残留病。在一些实施方案中,病况的进展指示受试者的肿瘤负荷或癌症负荷。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,在个体核酸探针与一个或多个插入缺失突变杂交后,可激活报告剂被激活。在一些实施方案中,在已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含一个或多个插入缺失突变的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含一个或多个插入缺失突变的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量指示受试者的病况。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的一个或多个插入缺失突变的频率指示受试者的病况。在一些实施方案中,频率指示与病况相关的患病细胞。在一些实施方案中,病况是弥漫性大B细胞淋巴瘤,并且其中频率指示一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
在一些实施方案中,一个或多个插入缺失突变包含同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个插入缺失突变。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,患病细胞包括肿瘤细胞。在一些实施方案中,患病样品包括实体瘤。在一些实施方案中,基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者的健康细胞或健康队列的测序数据而鉴定的一个或多个插入缺失突变来设计核酸探针组。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。在一些实施方案中,已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域或(ii)表3中鉴定的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
在一些实施方案中,该方法还包括基于所鉴定的包含一个或多个插入缺失突变的一个或多个细胞游离核酸分子来确定受试者患有病况或确定受试者的病况的程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的病况的进展。在一些实施方案中,该方法还包括进行不同的程序以确认受试者的病况。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。在一些实施方案中,受试者在(a)之前已接受针对病况的治疗。在一些实施方案中,治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,病况包括疾病。在一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,病况包括赘生物、癌症或肿瘤。在一些实施方案中,病况包括实体瘤。在一些实施方案中,病况包括淋巴瘤。在一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。在一些实施方案中,一个或多个插入缺失突变先前已通过对先前的肿瘤样品或细胞游离核酸样品进行测序而被鉴定为肿瘤来源的。
在一个方面,本公开内容提供了一种对个体进行临床程序的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
在一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。在一些实施方案中,核酸探针的序列选自表6。在一些实施方案中,临床程序是血液测试、医学成像或体格检查。
在一个方面,本公开内容提供了治疗个体的B细胞癌症的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
在一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。在一些实施方案中,核酸探针的序列选自表6。在一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一个方面,本公开内容提供了一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且其中靶向测序是利用核酸探针下拉经确定含有一个或多个插入或缺失(插入缺失突变)的基因组基因座的序列来进行的,如通过在来源于癌症的先前活检上的先前测序结果所确定的;鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入缺失突变的至少一个集合;和基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
在一些实施方案中,液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种治疗已经接受器官或组织移植的受试者的移植排斥的方法,该方法包括:(a)鉴定用于治疗移植排斥的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有移植排斥,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中多个定相变异的存在指示受试者的移植排斥;和(b)基于(a)中的鉴定使受试者接受治疗。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有移植排斥。
在一个方面,本公开内容提供了一种监测已经接受器官或组织移植的受试者的移植排斥的存在、不存在或程度的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第一状态;(b)基于从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于第一状态和第二状态确定受试者的移植排斥状态,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在一些实施方案中,移植排斥状态是至少部分移植排斥。在一些实施方案中,多个定相变异的存在指示第一状态或第二状态。在一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。在一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受移植排斥的治疗。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与移植排斥相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者具有移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)多个细胞游离核酸分子,所述细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)多个细胞游离核酸分子,所述细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。在一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的移植排斥的存在、不存在或程度。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的移植排斥的存在、不存在或程度。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的移植排斥的存在或不存在。在一些实施方案中,频率指示与移植排斥的存在、不存在或程度相关的患病细胞。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的移植排斥的存在或不存在。在一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。在一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与与移植排斥的存在或不存在相关的基因组基因座的至少一部分序列杂交。在一些实施方案中,已知当受试者患有移植排斥时,与移植排斥的存在、不存在或程度相关的基因组基因座表现出异常的体细胞超突变。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。在一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定移植排斥的存在或不存在或确定其程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与移植排斥的存在或不存在相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的移植排斥的存在、不存在或程度的进展。在一些实施方案中,该方法还包括进行不同的程序以确认受试者的移植排斥的存在、不存在或程度。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子确定针对受试者的移植排斥的治疗。在一些实施方案中,受试者在(a)之前已接受针对移植排斥的治疗。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,根据权利要求309-313中任一项所述的方法,其中所述测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种监测怀孕受试者的胎儿遗传异常的存在、不存在或升高的风险的方法,该方法包括:(a)基于来自从怀孕受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的第一状态;(b)基于来自从怀孕受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的第二状态,其中在从怀孕受试者获得第一多个细胞游离核酸分子之后从怀孕受试者获得第二多个细胞游离核酸分子;和(c)基于第一状态和第二状态确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在一些实施方案中,移植排斥状态是至少部分移植排斥。在一些实施方案中,多个定相变异的存在指示第一状态或第二状态。在一些实施方案中,第二多个细胞游离核酸分子是在从怀孕受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月从怀孕受试者获得的。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与遗传异常相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。在一些实施方案中,已至少部分地基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定胎儿具有遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,该方法包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于已鉴定的一个或多个插入缺失突变确定遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。在一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示遗传异常。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示遗传异常。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示遗传异常。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示遗传异常。在一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。在一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于怀孕受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,健康细胞来自怀孕受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与遗传异常相关的基因组基因座的至少一部分序列杂交。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。在一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来监测怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的进展。在一些实施方案中,该方法还包括进行不同的程序以确认怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,多个细胞游离核酸分子来源于怀孕受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,怀孕受试者是哺乳动物。在一些实施方案中,怀孕受试者是人。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,其包括将一组核酸探针添加到包含已从受试者获得或衍生的多个核酸分子的样品中,其中核酸探针组的每个核酸探针被配置为与包含多个定相变异的靶核酸分子杂交,使得核酸探针与从多个定相变异中的第一定相变异延伸至多个定相变异中的第二定相变异的靶核酸分子的至少一个区域互补。(为清楚起见,该区域包括第一定相变异和第二定相变异)。
此方法及其本文所述的实施方案可涉及使用杂合捕获探针/诱饵,例如生物素化寡核苷酸,其可用于杂合捕获富集步骤,使得杂合捕获探针结合并优先捕获含有定相变异的核酸分子。这种杂合捕获方法可以提高循环肿瘤DNA或来自移植器官的循环DNA的捕获灵敏度。通过将杂合捕获探针设计为(1)包含与包含定相变异的分子(而不是参考基因组序列的相应区域)互补的序列和(2)具有优化核酸结合动力学/热力学(ΔG或结合能)的长度,使得与没有定相变异的相应分子相比,杂合捕获探针优先结合包含感兴趣的定相变异的核酸分子,可以合成杂合捕获探针来特异性靶向含有定相变异的分子。这种杂合捕获探针可以导致相关核酸序列的改善的富集,从而结果需要更少的测序。例如,在一些情况下(例如在评估微小残留病、疾病状态或移植排斥状态时),可以获得癌性样品或来自移植器官的样品并进行测序以鉴定此类样品中相对于参考基因组序列(例如来自受试者的相应健康细胞的序列)的定相变异,并且杂合捕获探针可以被设计为优先结合含有从癌性和/或移植器官样品中鉴定的定相变异的核酸序列。在一些情况下,此类杂合捕获探针可用于含有定相变异的核酸分子的单链回收。由这样的探针组捕获的核酸分子可以包括DNA或RNA(例如,单链RNA),例如细胞游离DNA或细胞游离DNA。该特定方法中描述的探针可以与本文描述的其他方法组合使用。
在一些实施方案中,核酸探针组中的每个核酸探针包含下拉标签,例如生物素。在一些实施方案中,该方法还包括将与核酸探针杂交的靶核酸分子和不与核酸探针杂交的核酸分子分离,从而捕获靶核酸分子。在一些实施方案中,核酸分子是细胞游离核酸分子。在一些实施方案中,第一定相变异选自体细胞单核苷酸变异、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点和局部超突变区域,并且第二定相变异选自体细胞单核苷酸变异、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点以及局部超突变区域。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异间隔至少1、2、3、4、5、10或20个核苷酸。在一些实施方案中,核酸探针组中的每个核酸探针的长度是(1)少于40个核苷酸、少于30个核苷酸或少于20个核苷酸,或(2)比多个定相变异中的第一定相变异与多个定相变异中的第二定相变异之间的距离长不超过5个核苷酸、不超过10个核苷酸、不超过20个核苷酸或不超过30个核苷酸,其中第一定相变异和第二定相变异是多个定相变异中最分离的定相变异(即,具有最多数量的插入核苷酸)。
在一些实施方案中,靶核酸分子是来源于受试者的癌细胞或移植细胞的基因组的其序列与参考基因组序列不同的预先鉴定的部分的分子,其中基因组的预先鉴定的部分的长度小于200、小于180或小于150个核苷酸。在一些实施方案中,多个核酸探针中的每个核酸探针与靶核酸分子的结合的ΔG比与在长度和序列上与靶核酸分子相同的对应分子的结合的ΔG更低,除该对应分子具有与参考基因组序列相对应的序列之外。在一些实施方案中,参考基因组序列包含(1)参考队列的一部分,例如hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的一部分,或(2)来自受试者的健康样品的一部分。在一些实施方案中,该方法涉及捕获来源于染色体的沃森链或克里克链的靶核酸,但不涉及捕获另一条链的相应互补核酸。在一些实施方案中,该方法包括捕获至少10、至少100、至少1000或至少10,000个靶核酸分子。在一些实施方案中,该方法还包括对捕获的靶核酸进行测序以获得来源于多个核酸分子的测序数据。在一些实施方案中,测序不涉及分子条形码的使用。在一些实施方案中,测序不包括双链体测序。
在一个方面,本公开内容提供了一种用于确定受试者的病况(例如,评估微小残留病、疾病进展或移植排斥状态)的方法,该方法包括通过计算机系统获得通过本文描述的涉及使用杂合捕获探针的任何方法获得的序列信息,所述杂合捕获探针被设计为优先结合与缺乏定相变异的相应分子相比含有定相变异的分子;通过计算机系统处理测序数据以鉴定多个核酸分子中的一个或多个核酸分子,其中所述一个或多个核酸分子中的每一个相对于参考基因组序列包含多个定相变异;以及通过计算机系统分析所鉴定的一个或多个核酸分子以确定受试者的病况。在一些实施方案中,此类方法不包括双链体介导的错误抑制或条形码介导的错误抑制。可以基于受试者的病况(例如,状态)的鉴定来治疗个体(例如,用抗癌剂、抗排斥剂或外科手术)。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
在本文公开的任何一种方法的一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在本文公开的任何一种方法的一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,过程(a)至(c)通过计算机系统执行。
在本文公开的任何一种方法的一些实施方案中,测序数据基于核酸扩增产生。在本文公开的任何一种方法的一些实施方案中,测序数据基于聚合酶链式反应产生。在本文公开的任何一种方法的一些实施方案中,测序数据基于扩增子测序产生。
在本文公开的任何一种方法的一些实施方案中,测序数据基于下一代测序(NGS)产生。备选地,在本文公开的任何一种方法的一些实施方案中,测序数据基于非基于杂交的NGS产生。
在本文公开的任何一种方法的一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在本文公开的任何一种方法的一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
在本文公开的任何一种方法的一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种治疗受试者的病况的方法,该方法包括:(a)鉴定用于治疗该病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中多个定相变异的存在指示受试者的病况;和(b)基于(a)中的鉴定使受试者接受治疗。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
在一个方面,本公开内容提供了一种监测受试者的病况的进展的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于病况的第一状态和病况的第二状态确定病况的进展,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在本文公开的任何一种方法的一些实施方案中,病况的进展是病况的恶化。
在本文公开的任何一种方法的一些实施方案中,病况的进展是病况的至少部分缓解。
在本文公开的任何一种方法的一些实施方案中,所述多个定相变异的存在指示受试者的病况的第一状态或第二状态。
在本文公开的任何一种方法的一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。
在本文公开的任何一种方法的一些实施方案中,病况的进展指示受试者的病况的微小残留病。在本文公开的任何一种方法的一些实施方案中,病况的进展指示受试者的肿瘤负荷或癌症负荷。
在本文公开的任何一种方法的一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在本文公开的任何一种方法的一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
在本文公开的任何一种方法的一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。
在本文公开的任何一种方法的一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。
在本文公开的任何一种方法的一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,可激活报告剂是荧光团。
在本文公开的任何一种方法的一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的病况。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的病况。在一些实施方案中,频率指示与病况相关的患病细胞。在一些实施方案中,病况是弥漫性大B细胞淋巴瘤,并且其中频率指示一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
在本文公开的任何一种方法的一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在本文公开的任何一种方法的一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
在本文公开的任何一种方法的一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列来源于受试者的样品。
在本文公开的任何一种方法的一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。
在本文公开的任何一种方法的一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,患病细胞包括肿瘤细胞。在一些实施方案中,患病样品包括实体瘤。
在本文公开的任何一种方法的一些实施方案中,核酸探针组是基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者或健康队列的健康细胞的测序数据而鉴定的多个定相变异设计的。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。在一些实施方案中,已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。
在本文公开的任何一种方法的一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。
在本文公开的任何一种方法的一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子,确定受试者患有病况或确定受试者的病况的程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的病况的进展。
在本文公开的任何一种方法的一些实施方案中,该方法还包括进行不同的程序以确认受试者的病况。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
在本文公开的任何一种方法的一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。
在本文公开的任何一种方法的一些实施方案中,受试者在(a)之前已接受针对病况的治疗。
在本文公开的任何一种方法的一些实施方案中,治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。
在本文公开的任何一种方法的一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
在本文所公开的任一方法的一些实施方案中,病况包括疾病。
在本文公开的任何一种方法的一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
在本文公开的任何一种方法的一些实施方案中,受试者是哺乳动物。在本文公开的任何一种方法的一些实施方案中,受试者是人。
在本文公开的任何一种方法的一些实施方案中,病况包括赘生物、癌症或肿瘤。在一些实施方案中,病况包括实体瘤。在一些实施方案中,病况包括淋巴瘤。在一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。在本文公开的任何一种方法的一些实施方案中,病况包括移植排斥或染色体异常。
在本文公开的任何一种方法的一些实施方案中,根据对先前肿瘤样品或细胞游离核酸样品进行测序,多个定相变异先前已被鉴定为肿瘤来源的。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定所述受试者的病况。
在一个方面,本公开内容提供了一种包含诱饵组的组合物,所述诱饵组包含一组核酸探针,其被设计为捕获细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约5%的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针组被设计成下拉细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针组被设计成捕获一个或多个细胞游离DNA分子,所述一个或多个细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至多约10%、至多约20%、至多约30%、至多约40%、至多约50%、至多约60%、至多约70%、至多约80%、至多约90%或约100%的基因组区域。
在本文公开的任何组合物的一些实施方案中,诱饵组包含至多5个、至多10个、至多50个、至多100个、至多500个、至多1000个或至多2000个核酸探针。
在本文公开的任何组合物的一些实施方案中,核酸探针组中的个体核酸探针包含下拉标签。
在本文公开的任何组合物的一些实施方案中,下拉标签包含核酸条形码。
在本文公开的任何组合物的一些实施方案中,下拉标签包含生物素。
在本文公开的任何组合物的一些实施方案中,每个细胞游离DNA分子的长度为约100个核苷酸至约180个核苷酸。
在本文公开的任何组合物的一些实施方案中,基因组区域与病况相关。
在本文公开的任何组合物的一些实施方案中,当受试者患有病况时,基因组区域表现出异常的体细胞超突变。
在本文公开的任何组合物的一些实施方案中,病况包括B细胞淋巴瘤。在一些实施方案中,病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
在本文公开的任何组合物的一些实施方案中,该组合物进一步包含获自或衍生自受试者的多个细胞游离DNA分子。
在一个方面,本公开内容提供了一种对个体进行临床程序的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;(c)利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和(d)基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
在本文公开的任何组合物的一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,基因组基因座选自:(i)表1中鉴定的基因组区域,(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针的序列选自表6。
在本文公开的任何组合物的一些实施方案中,临床程序是血液测试、医学成像或体格检查。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
在一个方面,本公开内容提供了治疗个体的B细胞癌症的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;(c)利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和(d)基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
在本文公开的任何组合物的一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,基因组基因座选自:(i)表1中鉴定的基因组区域,(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
在本文公开的任何组合物的一些实施方案中,核酸探针的序列选自表6。
在本文公开的任何组合物的一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
在一个方面,本公开内容提供了一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,该方法包括:(a)获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且其中靶向测序是利用核酸探针下拉经确定为含有多个定相变异的基因组基因座的序列进行的,所述基因组基因座的序列由来源于癌症的先前活检的先前测序结果所确定;(b)在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异中的至少一组;和(c)基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
在本文公开的任何组合物的一些实施方案中,液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
在本文公开的任何组合物的一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一些实施方案中,该方法还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变来治疗个体以减少癌症。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)通过计算机系统分析一个或多个插入缺失突变以确定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)通过计算机系统分析一个或多个插入或缺失(插入缺失突变)以确定受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理该测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,基于核酸扩增产生测序数据。在一些实施方案中,测序数据基于聚合酶链式反应生成。在一些实施方案中,测序数据基于扩增子测序生成。在一些实施方案中,测序数据基于下一代测序(NGS)生成。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下生成测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
在一个方面,本公开内容提供了治疗受试者的病况的方法,该方法包括:(a)鉴定用于治疗该病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定该受试者患有所述病况,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变),并且其中一个或多个插入缺失突变的存在指示受试者的病况;(b)基于(a)中的鉴定使受试者接受治疗。
在一个方面,本公开内容提供了一种监测受试者的病况的进展的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于病况的第一状态和病况的第二状态确定病况的进展,其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)。
在一些实施方案中,病况的进展是病况的恶化。在一些实施方案中,病况的进展是病况的至少部分缓解。在一些实施方案中,一个或多个插入缺失突变的存在指示受试者的病况的第一状态或第二状态。在一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。在一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。在一些实施方案中,病况的进展指示受试者的病况的微小残留病。在一些实施方案中,病况的进展指示受试者的肿瘤负荷或癌症负荷。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,在个体核酸探针与一个或多个插入缺失突变杂交后,可激活报告剂被激活。在一些实施方案中,在已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,所述可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含一个或多个插入缺失突变的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含一个或多个插入缺失突变的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量指示受试者的病况。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的一个或多个插入缺失突变的频率指示受试者的病况。在一些实施方案中,频率指示与病况相关的患病细胞。在一些实施方案中,病况是弥漫性大B细胞淋巴瘤,并且其中频率指示一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
在一些实施方案中,一个或多个插入缺失突变包含同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个插入缺失突变。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包含健康白细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,患病细胞包括肿瘤细胞。在一些实施方案中,患病样品包括实体瘤。在一些实施方案中,基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者的健康细胞或健康队列的测序数据而鉴定的一个或多个插入缺失突变来设计核酸探针组。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的至少一部分序列杂交。在一些实施方案中,已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域或(ii)表3中鉴定的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
在一些实施方案中,该方法还包括基于所鉴定的包含一个或多个插入缺失突变的一个或多个细胞游离核酸分子来确定受试者患有病况或确定该受试者的病况的程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来监测受试者的病况的进展。在一些实施方案中,该方法还包括进行不同的程序以确认受试者的病况。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。在一些实施方案中,受试者在(a)之前已接受针对病况的治疗。在一些实施方案中,所述治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,所述病况包括疾病。在一些实施方案中,所述多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,所述病况包括赘生物、癌症或肿瘤。在一些实施方案中,所述病况包括实体瘤。在一些实施方案中,所述病况包括淋巴瘤。在一些实施方案中,所述病况包括B细胞淋巴瘤。在一些实施方案中,所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。在一些实施方案中,一个或多个插入缺失突变先前已通过对先前的肿瘤样品或细胞游离核酸样品进行测序而被鉴定为肿瘤来源的。
在一个方面,本公开内容提供了一种对个体进行临床程序的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
在一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。在一些实施方案中,核酸探针的序列选自表6。在一些实施方案中,临床程序是血液测试、医学成像或体格检查。
在一个方面,本公开内容提供了治疗个体的B细胞癌症的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,并且其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
在一些实施方案中,活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。在一些实施方案中,核酸探针的序列选自表6。在一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一个方面,本公开内容提供了一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,该方法包括:获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且其中靶向测序是利用核酸探针下拉经确定含有一个或多个插入或缺失(插入缺失突变)的基因组基因座的序列来进行的,如通过在来源于癌症的先前活检上的先前测序结果所确定的;鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入缺失突变的至少一个集合;和基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
在一些实施方案中,液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。在一些实施方案中,治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案中,测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种治疗已经接受器官或组织移植的受试者的移植排斥的方法,该方法包括:(a)鉴定用于治疗移植排斥的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有移植排斥,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中多个定相变异的存在指示受试者的移植排斥;和(b)基于(a)中的鉴定使受试者接受治疗。
在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有移植排斥。
在一个方面,本公开内容提供了一种监测已经接受器官或组织移植的受试者的移植排斥的存在、不存在或程度的方法,该方法包括:(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第一状态;(b)基于从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第二状态,其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和(c)基于第一状态和第二状态确定受试者的移植排斥状态,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在一些实施方案中,移植排斥状态是至少部分移植排斥。在一些实施方案中,多个定相变异的存在指示第一状态或第二状态。在一些实施方案中,在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。在一些实施方案中,(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受移植排斥的治疗。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与移植排斥相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。在一些实施方案中,已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者具有移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)多个细胞游离核酸分子,所述细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)多个细胞游离核酸分子,所述细胞游离核酸分子获自或衍生自已经接受器官或组织移植的受试者,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。在一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的移植排斥的存在、不存在或程度。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的移植排斥的存在、不存在或程度。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的移植排斥的存在或不存在。在一些实施方案中,频率指示与移植排斥的存在、不存在或程度相关的患病细胞。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的移植排斥的存在或不存在。在一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。在一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,健康细胞包括健康白细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,健康细胞来自受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与与移植排斥的存在或不存在相关的基因组基因座的至少一部分序列杂交。在一些实施方案中,已知当受试者患有移植排斥时,与移植排斥的存在、不存在或程度相关的基因组基因座表现出异常的体细胞超突变。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。在一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定移植排斥的存在或不存在或确定其程度或状态。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与移植排斥的存在或不存在相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的移植排斥的存在、不存在或程度的进展。在一些实施方案中,该方法还包括进行不同的程序以确认受试者的移植排斥的存在、不存在或程度。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子确定针对受试者的移植排斥的治疗。在一些实施方案中,受试者在(a)之前已接受针对移植排斥的治疗。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,多个细胞游离核酸分子来源于受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种方法,其包括:(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种方法,其包括:(a)获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。在一些实施方案中,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,(a)至(c)通过计算机系统执行。在一些实施方案中,根据权利要求309-313中任一项所述的方法,其中所述测序数据基于核酸扩增产生。在一些实施方案中,测序数据基于聚合酶链式反应产生。在一些实施方案所述测序数据基于扩增子测序产生。在一些实施方案中,测序数据基于下一代测序(NGS)产生。在一些实施方案中,测序数据基于非基于杂交的NGS产生。在一些实施方案中,测序数据是在不使用分子条形码的情况下生成的。在一些实施方案中,在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。在一些实施方案中,在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
在一个方面,本公开内容提供了一种监测怀孕受试者的胎儿遗传异常的存在、不存在或升高的风险的方法,该方法包括:(a)基于来自从怀孕受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的第一状态;(b)基于来自从怀孕受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的第二状态,其中在从怀孕受试者获得第一多个细胞游离核酸分子之后从怀孕受试者获得第二多个细胞游离核酸分子;和(c)基于第一状态和第二状态确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
在一些实施方案中,移植排斥状态是至少部分移植排斥。在一些实施方案中,多个定相变异的存在指示第一状态或第二状态。在一些实施方案中,第二多个细胞游离核酸分子是在从怀孕受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月从怀孕受试者获得的。在一些实施方案中,用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与遗传异常相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。在一些实施方案中,已至少部分地基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定胎儿具有遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于已鉴定的一个或多个插入缺失突变确定遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种方法,其包括:(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一些实施方案中,鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。在一些实施方案中,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。在一些实施方案中,在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。在一些实施方案中,在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。在一些实施方案中,该方法还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。在一些实施方案中,可激活报告剂是荧光团。在一些实施方案中,分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。在一些实施方案中,来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示遗传异常。在一些实施方案中,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示遗传异常。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示遗传异常。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子的基因组起源指示遗传异常。在一些实施方案中,第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。在一些实施方案中,第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
在一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。在一些实施方案中,多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。在一些实施方案中,所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。在一些实施方案中,参考基因组序列来源于参考队列。在一些实施方案中,参考基因组序列包含来自参考队列的共有序列。在一些实施方案中,参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。在一些实施方案中,参考基因组序列来源于怀孕受试者的样品。在一些实施方案中,样品是健康样品。在一些实施方案中,样品包含健康细胞。在一些实施方案中,样品是患病样品。在一些实施方案中,患病样品包含患病细胞。在一些实施方案中,健康细胞来自怀孕受试者。在一些实施方案中,健康细胞来自健康队列。在一些实施方案中,核酸探针组被设计为与遗传异常相关的基因组基因座的至少一部分序列杂交。
在一些实施方案中,核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。在一些实施方案中,核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。在一些实施方案中,核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。在一些实施方案中,该方法还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,该方法还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险相关的样品。在一些实施方案中,统计模型分析包括Monte Carlo统计分析。在一些实施方案中,该方法还包括基于所鉴定的一个或多个细胞游离核酸分子来监测怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的进展。在一些实施方案中,该方法还包括进行不同的程序以确认怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。在一些实施方案中,不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。在一些实施方案中,多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。在一些实施方案中,多个细胞游离核酸分子来源于怀孕受试者的身体样品。在一些实施方案中,身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。在一些实施方案中,怀孕受试者是哺乳动物。在一些实施方案中,怀孕受试者是人。在一些实施方案中,(b)还包括鉴定一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
在一个方面,本公开内容提供了一种计算机程序产品,该计算机程序产品包括在其中编码计算机可执行代码的非暂时性计算机可读介质,该计算机可执行代码经调整以适于被执行来实现本文公开的任一种方法。
在一个方面,本公开内容提供了一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器,其中计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现本文公开的任一种方法。
根据以下详细描述,本公开内容的其他方面和优点对于本领域技术人员将变得明显,其中仅显示和描述了本公开内容的举例说明性实施方案。如将意识到的,本公开内容能够实现其他的和不同的实施方案,并且其若干细节能够在各种明显的方面进行修改,所有这些都不背离本公开内容。因此,附图和描述在本质上被认为是举例说明性的,而不是限制性的。
通过引用并入
本说明书中提及的所有出版物、专利和专利申请均以引用方式并入本文,其程度就好像每个单独的出版物、专利或专利申请被具体地和单独地指示为通过引用并入一样。如果通过引用并入的出版物和专利或专利申请与包含在说明书中的公开内容相矛盾,则本说明书旨在取代和/或优先于任何此类矛盾的材料。
附图的简要说明
本发明的各种特征在所附权利要求中具体阐述。通过参考以下示出其中利用了本发明的原理的举例说明性实施方案的详细描述以及附图(本文也称为“图”和“附图”),将获得对本发明的特征和优点的更好理解,在所述附图中:
图1A-1E示出了通过全基因组测序数据的分析发现定相变异及其突变特征。图1A是一幅卡通画,描绘了在个体细胞游离DNA分子上单核苷酸变异(SNV)(上图)和多个“同相”变异(定相变异,PV;下图)的检测之间的差异。理论上,PV的检测是比孤立的SNV的检测更特异的事件。虽然定相变异在此图中显示为SNV,但相对于参考基因组序列的其他变化也可以被认为是定相变异。图1B是一个散点图,显示了来自24种不同癌症组织学的WGS数据的PV数量的分布,通过SNV的总数标准化。条形显示中值和四分位距。(FL-NHL,滤泡性淋巴瘤;DLBCL-NHL,弥漫性大B细胞淋巴瘤;伯基特-NHL,伯基特淋巴瘤;肺-SCC,鳞状细胞肺癌;肺-Adeno,肺腺癌;肾-RCC,肾细胞癌;骨-Osteosarc,骨肉瘤;肝-HCC,肝细胞癌;乳腺-Adeno,乳腺腺癌;胰腺-Adeno,胰腺腺癌;头-SCC,头颈部鳞状细胞癌;卵巢-Adeno,卵巢腺癌;Eso-Adeno,食道腺癌;子宫-Adeno,子宫腺癌;胃-Adeno,胃腺癌;CLL,慢性淋巴细胞白血病;结直肠-Adeno,结直肠腺癌;前列腺-Adeno,前列腺腺癌;CNS-GBM,多形性胶质母细胞瘤;胰腺-内分泌,胰腺神经内分泌肿瘤;Thy-Adeno,甲状腺腺癌;CNS-PiloAstro,毛细胞黏液样星形细胞瘤(piloastrocytoma);CNS-Medullo,成神经管细胞瘤)。图1C是一个热图,展示了在多种癌症类型中PV相对单个SNV的单碱基替换(SBS)突变特征的富集。蓝色代表在特定组织学中富集PV的特征;深灰色代表富集非定相的单个SNV的特征;红色代表孤立发生的SNV。仅显示在校正多个假设后在PV和非定相SNV之间具有显著差异的特征;其他特征是灰色的。指示了与吸烟、AID/AICDA和APOBEC相关的特征。图1D展示条形图,显示B淋巴样恶性肿瘤和肺腺癌中在基因组中的典型区域中PV的分布。在该图中,基因组被划分为1000bp的分箱(bins),并计算了每个1000bp的分箱中具有PV的给定组织学的样品的分数。仅显示在任何癌症亚型中至少具有2%复发频率的分箱。还标记了关键基因组基因座。图1E是双链体测序与定相变异测序的比较。该方案比较双链体测序相对定相变异的恢复的错误抑制测序。在双链体测序中,需要在原始DNA双螺旋的两条链上观察到的单个SNV的恢复(即反式)。这需要通过测序独立恢复两个分子,因为原始DNA分子的正链和负链独立地经受文库制备和PCR。相比之下,PV的恢复需要在DNA的同一条单链上观察到多个SNV(即顺式)。因此,仅恢复正链或负链(而不是两者)就足以鉴定PV。
图2A-2F示出了定相变异富集测序的设计、验证和应用。图2A是PhasED-Seq的设计示意图。汇总了来自DLBCL肿瘤样品的WGS数据(左图),并鉴定了复发性假定PV的区域(中图)。然后设计了一种捕获最经常包含PV的基因组区域的测定(右图),导致与WGS相比PV中约7500倍的富集。右上图显示了对于递增的实验组尺寸(x轴),每千碱基的实验组尺寸的每个病例的PV的计算机模拟预期数量(y轴)。虚线显示了PhasED-Seq实验组中的选定区域。右下图显示对于递增的实验组尺寸(y轴),每个病例的预期PV总数(y轴,从WGS数据计算机模拟评估的)。黑色区域显示了PhasED-Seq实验组中的选定区域。图2B示出了两个图,显示了对于通过先前建立的淋巴瘤CAPP-Seq实验组或PhasED-Seq对肿瘤DNA和匹配的种系进行测序的SNV(左)和PV(右)的产率;通过将WGS限制在感兴趣的靶标空间来计算机模拟评估值。右图中报告的PV包括双联体、三联体和四联体定相事件。图2C显示了来自CAPP-Seq相对PhasED-Seq的肿瘤和/或细胞游离DNA的实验测序的SNV(左)和PV(右)的产率,类似于图2B。图2D是散点图,显示了DLBCL患者(由WGS鉴定或由PhasED-Seq鉴定)的按基因组位置(以1000bp分箱)的PV频率。突出显示IGH、BCL2、MYC和BCL6中的PV。图2E示出了散点图,比较患有不同类型的淋巴瘤的患者的按基因组位置(以50bp分箱)的PV频率。彩色圆圈显示了来自感兴趣的特定基因的以50bp分箱的PV的相对频率;另一些(灰色)圆圈显示来自PhasED-Seq测序实验组的其余部分的以50bp分箱的PV的相对频率。图2F示出了火山图,总结了淋巴瘤类型之间特定基因的基因座(包括ABC-DLBCL相对GCB-DLBCL(深灰色,左);PMBCL相对DLBCL(深灰色,中间);和HL相对DLBCL(深灰色,右))中PV相对频率的差异。x轴表示特定基因座中PV的相对富集,而y轴表示这种关联的统计显著性。(实施例10)。
图3A-3I示出了用于疾病检测的PhasED-Seq的技术性能。图3A示出了条形图,显示用于从具有递增程度的突变/非参考碱基的两个基因座(MYC和BCL6)恢复合成的150bp寡核苷酸的杂交捕获测序的性能。误差条代表95%置信区间(不同样品中每个条件的n=3个重复)。图3B示出了展示来自在PhasED-Seq实验组上测序的12个健康对照细胞游离DNA样品的不同类型错误抑制的背景错误率的图(实施例10)。“PhasED-Seq 2x”或“双联体”代表在同一DNA分子上检测到两个同相突变;“PhasED-Seq 3x”或“三联体”代表在同一DNA分子上检测到三个同相突变。图3C示出了条形图,显示了对于不同类型的错误抑制(包括条形码去重复、双链体测序和同相SNV之间递增的最大距离的PV的恢复),来自12个细胞游离DNA样品的测序数据的独特分子恢复的深度(例如,条形码介导的PCR重复去除后的深度)。图3D示出了显示SNV之间最大距离小于x轴上显示的碱基对数量的PV的累积分数的条形图。图3E示出了显示模拟包含1x10-3至0.5x10-6的患者特异性肿瘤分数的细胞游离DNA样品的有限稀释系列的结果的图;每个稀释度都使用来自3个独立患者样品的cfDNA。使用用于恢复预期的肿瘤分数的多种错误抑制方法(包括iDES、双链体测序和PhasED-Seq(均用于恢复双联体和三联体分子))分析相同的测序数据。点和误差条代表所考虑的三种患者特异性肿瘤突变的平均值、最小值和最大值。通过配对t检验比较<1:10,000的样品的观察到的和预期的肿瘤分数之间的差异。*,P<0.05,**,P<0.005,***,P<0.0005。图3F示出了展示用于在12个不相关的健康细胞游离DNA样品和用于有限稀释系列的健康cfDNA样品(n=13个总样品)中检测肿瘤特异性等位基因的背景信号的图。在每个样品中,来自3个患者样品的肿瘤特异性SNV或PV用于图3E中所示的有限稀释实验,总共评估了39个评估。条形代表所有39个评估的算术平均值;通过Wilcoxon秩和检验进行统计学比较。*,P<0.05,**,P<0.005,***,P<0.0005。图3G示出了显示根据简单二项式采样的具有给定数量的含PV区域的样品的理论检测率的图。该图是通过假设5000x(线)的独特测序深度以及来自3个区域(蓝色)到67个区域(紫色)的不同数量的独立150bp含PV区域生成的。置信度范围考虑4000-6000x的深度;还假设了5%的假阳性率。图3H示出了显示在不同数量的含PV区域的情况下给定真实肿瘤分数(x轴)的样品的观察到的检测率(y轴)的图。对于从3到67个肿瘤报告基因区域的每个数量,150bp窗口的此数量从3个患者特异性PV报告基因列表中的每一个随机采样25次,并用于评估每个稀释度下的肿瘤检测。实心点代表“湿”稀释系列实验,而空心点代表计算机模拟稀释实验。点和误差条代表原始采样中使用的三个患者特异性的PV报告基因列表之间的平均值、最小值和最大值。图3I示出了散点图,比较了来自图3G和图3H实验组中所示的稀释系列的样品的预测检测率相对观察到的检测率。在实施例10中提供了此实验的其他细节。
图4A-4G示出了在DLBCL中用于超灵敏疾病检测和反应监测的PhasED-Seq的临床应用。图4A示出了显示对一线免疫化学疗法有反应并随后在一线免疫化学疗法后复发的DLBCL患者的ctDNA水平的图。通过CAPP-Seq测量的水平以深灰色圆圈显示,而通过PhasED-Seq测量的水平以浅灰色圆圈显示。空心圆圈代表通过CAPP-Seq检测不到的水平。图4B示出了单变量散点图,其显示了在微小疾病的时间点(即,在1或2个治疗周期之后)通过PhasED-Seq测量的临床样品的平均肿瘤等位基因分数。该图由通过标准CAPP-Seq检测到的样品相对未检测到的样品划分开;P值来自Wilcoxon秩和检验。图4C示出了条形图,显示了在1或2个治疗周期后具有可通过CAPP-Seq检测到的ctDNA的DLBCL患者的分数(深灰色条),以及在将PhasED-Seq添加到标准CAPP-Seq时具有可检测的疾病的其他患者的分数(中等灰色条)。P值表示在1或2个治疗周期后,在171个样品中,单独使用CAPP-Seq相对PhasED-Seq和CAPP-Seq的组合进行检测的Fisher精确检验。图4D示出了瀑布图,显示了DLBCL患者在2个周期的一线治疗后通过CAPP-Seq测量的ctDNA水平的变化。具有通过CAPP-Seq无法检测到的ctDNA的患者显示为“ND”(“未检测到”),以较深颜色显示。条形的颜色还指示这些患者的最终临床结果。图4E示出了Kaplan-Meier图,显示了2个周期后具有通过CAPP-Seq测量的检测不到的ctDNA的52名DLBCL患者的无事件存活率。图4F示出了Kaplan-Meier图,显示通过在该同一时间点(第3周期,第1天)通过PhasED-Seq进行的ctDNA检测分层的图4E所示的52名患者(通过CAPP-Seq检测不到的ctDNA)的无事件存活率。图4G示出了Kaplan-Meier图,显示了在第3周期第1天通过ctDNA分层的89名DLBCL患者的无事件存活率分为3层——未能实现主要分子反应的患者(深灰色),仍然具有通过PhasED-Seq和/或CAPP-Seq可检测到的ctDNA的具有主要分子反应的患者(浅灰色),以及具有严格分子缓解的患者(通过PhasED-Seq和CAPP-Seq检测不到的ctDNA;中等灰色)。
图5A-5C示出了来自WGS的不同癌症中的SNV和PV的列举。图5A-C示出了单变量散点图,显示了来自24种不同癌症组织学的WGS数据的SNV(图5A)、PV(图5B)和控制SNV的总数的PV(图5C)的数量。条形显示中值和四分位距。(FL-NHL,滤泡性淋巴瘤;DLBCL-NHL,弥漫性大B细胞淋巴瘤;伯基特-NHL,伯基特淋巴瘤;肺-SCC,鳞状细胞肺癌;肺-Adeno,肺腺癌;肾-RCC,肾细胞癌;骨-Osteosarc,骨肉瘤;肝-HCC,肝细胞癌;乳腺-Adeno,乳腺腺癌;Panc-Adeno,胰腺腺癌;头-SCC,头颈部鳞状细胞癌;卵巢-Adeno,卵巢腺癌;Eso-Adeno,食道腺癌;子宫-Adeno,子宫腺癌;胃-Adeno,胃腺癌;CLL,慢性淋巴细胞白血病;结直肠-Adeno,结直肠腺癌;前列腺-Adeno,前列腺腺癌;CNS-GBM,多形性胶质母细胞瘤;胰腺-内分泌,胰腺神经内分泌肿瘤;Thy-Adeno,甲状腺腺癌;CNS-PiloAstro,毛细胞黏液样星形细胞瘤;CNS-Medullo,成神经管细胞瘤)。
图6A-6WW示出了WGS中的定相和非定相SNV中的突变特征的贡献(图6A-6WW)。散点图显示了已建立的单碱基取代(SBS)突变特征对来自WGS的在PV中看到的SNV(以深色显示)和在可能的定相关系之外看到的SNV(以浅色显示)的贡献。这是针对24种癌症亚型的49种SBS突变特征呈现的。在多重假设检验校正后显示定相和非定相SNV之间的贡献的显著差异的突变特征用*表示。这些图代表图1C中概括的原始数据。
图7示出了基因组中的典型区域中PV的分布。条形图显示了在多种癌症类型的基因组中的典型区域中发生的PV的分布。在该图中,基因组被划分为1000bp的分箱,并计算了每个1000bp的分箱中具有PV的给定组织学样品的分数。仅显示在任何癌症亚型中至少具有2%复发频率的分箱。显示的组织学如图1E所示;还显示了DLBCL的激活B细胞(ABC)和生发中心B细胞(GCB)亚型。
图8A-8E示出了淋巴恶性肿瘤中来自WGS的PV的数量和基因组位置。图8A示出了条形图,显示了基因组中反复包含DLBCL、FL、BL和CLL的PV(分别为n=68、74、36和151)的独立1000bp区域的数量。图8B-D示出了显示与特定基因的基因座相关的多种淋巴恶性肿瘤的PV频率的图,包括图8B:BCL2,图8C:MYC,和图8D:ID3。给定基因的转录物的位置在图下方以灰色显示;外显子以深灰色显示。*指示通过Fisher精确检验(P<0.05),与所有其他组织学相比,在给定癌症组织学中具有显著更多PV的区域。图8E,类似于图8B-D,这些图显示了淋巴瘤亚型中的PV频率。此处显示了ABC和GCB亚型DLBCL(分别为n=25和25)的IGH基因座,其由IGHV、IGHD和IGHJ部分组成。显示了Ig部分的编码区域,包括Ig恒定区和V基因。(DLBCL,弥漫性大B细胞淋巴瘤;FL,滤泡性淋巴瘤;BL,伯基特淋巴瘤,CLL,慢性淋巴细胞白血病)。
图9A-9K示出了PhasED-Seq用于淋巴瘤中PV的恢复的性能。图9A示出了单变量散点图,显示与PhasED-Seq(右)相比,由先前报道的淋巴瘤CAPP-Seq实验组8(左)恢复的由WGS(n=79)鉴定的基因组中的所有PV的分数。图9B示出了使用先前建立的淋巴瘤CAPP-Seq实验组或PhasED-Seq实验组从WGS鉴定的每个病例的SNV的预期产率。图9C示出了使用先前建立的淋巴瘤CAPP-Seq实验组或PhasED-Seq实验组从WGS鉴定的每个病例的PV的预期产率。来自三个独立的公开可用队列的数据显示在图9A-9C中。图9D-9F示出了显示在通过两种测定测序的16名患者中,与CAPP-Seq相比,通过PhasED-Seq的PV恢复的改善。这包括d)两个同相SNV(例如,2x或“双联体PV”)、e)三个同相SNV(3x或“三联体PV”)和f)四个同相SNV(例如,4x或“四联体PV”)的改善。图9G-9K示出了显示针对患有不同类型淋巴瘤的患者鉴定的SNV和PV的数量的图。这些图显示了g)SNV、h)双联体PV、i)三联体PV、j)四联体PV和k)所有PV的数量。*,P<0.05;**,P<0.01,***,P<0.001。(DLBCL,弥漫性大B细胞淋巴瘤;GCB,生发中心B细胞样DLBCL;ABC,激活B细胞样DLBCL;PMBCL,原发性纵隔B细胞淋巴瘤;HL,霍奇金淋巴瘤)。
图10A-10Y示出了ABC-DLBCL和GCB-DLBC之间的PV的位置特异性差异(图10A-10Y)。类似于图2D,这些散点图比较了不同类型淋巴瘤患者的按基因组位置(以50bp分箱)的PV频率;在该图中,显示了ABC-DLBCL和GCB-DLBCL之间的差异。红色圆圈显示了来自感兴趣的特定基因的以50bp分箱的PV的相对频率;另一些(灰色)圆圈显示来自PhasED-Seq测序实验组的其余部分的以50bp分箱的PV的相对频率。仅显示了在ABC-DLBCL和GCB-DLBCL之间具有PV的统计学显著差异的基因。P值代表来自给定基因的50bp分箱针对所有其他50bp分箱的Wilcoxon秩和检验;见实施例10。
图11A-11X示出了DLBCL和PMBCL之间的PV的位置特异性差异(图11A-11X)。类似于图2D,这些散点图比较了不同类型淋巴瘤患者的按基因组位置(以50bp分箱)的PV频率;在该图中,显示了DLBCL和PMBCL之间的差异。蓝色圆圈显示了来自感兴趣的特定基因的以50bp分箱的PV的相对频率;另一些(灰色)圆圈显示来自PhasED-Seq测序实验组的其余部分的以50bp分箱的PV的相对频率。仅显示了在DLBCL和PMBCL之间具有PV的统计学显著差异的基因。P值代表来自给定基因的50bp分箱针对所有其他50bp分箱的Wilcoxon秩和检验;见实施例10。
图12A-12NN示出了DLBCL和HL之间的PV的位置特异性差异。类似于图2D,图12A-12NN的散点图比较了不同类型淋巴瘤患者的按基因组位置(以50bp分箱)的PV频率;在该图中,显示了DLBCL和HL之间的差异。绿色圆圈显示了来自感兴趣的特定基因的以50bp分箱的PV的相对频率;另一些(灰色)圆圈显示来自PhasED-Seq测序实验组的其余部分的以50bp分箱的PV的相对频率。仅显示了DLBCL和HL之间具有PV的统计学显著差异的基因。P值代表来自给定基因的50bp分箱针对所有其他50bp分箱的Wilcoxon秩和检验;见实施例10。
图13示出了在IGH基因座中的突变中淋巴瘤类型之间的PV的差异。该图显示了对于不同类型B细胞淋巴瘤的@IGH基因座中的来自PhasED-Seq的PV的频率。下方的轨迹显示了@IGH基因座和基因部分的结构,包括Ig恒定基因和V基因。下一个(概述)轨迹显示了来自WGS数据(ICGC队列)的在该基因组区域中的PV的频率。其余轨迹显示了来自PhasED-Seq靶向测序数据的PV的频率,包括1)DLBCL、GCB-DLBCL、ABC-DLBCL、PMBCL和HL。PhasED-Seq实验组靶向的区域显示在上图。带有在特定组织学中富集的PV的选定免疫球蛋白部分被标记(即IGHV4-34、Sε、Sγ3和Sγ1)。
图14A-14E示出了通过杂交捕获测序的PhasED-Seq的技术方面。图14A显示了随着从参考基因组突变的碱基分数增加,基因组中的典型150聚体(150-mer)的结合的理论能量的图。突变分布在整个150聚体中,聚集在序列的一端,聚集在序列的中间,或在整个序列中随机分布。点和误差条代表来自10,000次计算机模拟的中位数和四分位数范围。图14B示出了显示跨该研究中所有患者的PhasED-Seq实验组的151-bp窗口的突变率的汇总度量的两个直方图的图。浅灰色直方图显示了本研究中所有患者在任何151bp窗口中突变的最大百分比;深灰色直方图显示了所有突变的151bp窗口中的第95个百分位突变率。图14C是显示本研究中所有患者的所有突变的151-bp窗口的突变率的百分位的图。图14D示出了显示单个SNV(左,“红色”)、双联体PV(中间,“黄色”)和三联体PV(右,“蓝色”)的相对错误率(作为log10(错误率))的热图。图14D表明基于多个定相变异(例如,双联体或三联体PV)的分析比基于单个SNV的分析产生更低的错误率。此外,图14D表明,与基于较少数量的定相变异集(例如,标记为“黄色”的双联体PV)的分析相比,使用更多数量的定相变异集(例如,标记为“蓝色”的三联体PV)的分析产生更低的错误率。显示了使用多种错误抑制方法(包括条形码去重复、iDES和双链体测序)进行测序的单个SNV的错误率。错误率按突变类型汇总。在三联体PV的情况下,热图的x轴和y轴代表PV中的第一和第二类型的碱基变化;第三个变化是所有12个可能的碱基变化的平均值。图14E示出了显示作为组分SNV之间的基因组距离的函数的双联体/2xPV的错误率的图。
图15和16A-16B示出了通过PhasED-Seq的ctDNA定量与通过CAPP-Seq的ctDNA定量的比较和临床应用。图15示出了通过标准CAPP-Seq(绿色)以及使用双联体(浅蓝色)、三联体(中蓝色)和四联体(深蓝色)的PhasED-Seq对来自107名大B细胞淋巴瘤患者的预处理样品的ctDNA的检测率。还显示了ctDNA检测的特异性。在下方的两个图中,显示了40个保留的健康对照cfDNA样品的误检率。这两个图中每个条形的大小显示了所有107个病例中这40个保留的对照中患者特异性cfDNA突变的检测率。图16A示出了总结使用如图A所示的双联体、三联体和四联体通过CAPP-Seq和PhasED-Seq在预处理样品中检测ctDNA的灵敏度和特异性的表格。灵敏度在所有107个病例中计算,而特异性在40个保留对照样品中计算,对107个独立的患者特异性突变列表中的每一个进行评估,总共进行4280次独立测试。图16B示出了散点图,其显示通过CAPP-Seq相对PhasED-Seq在个体样品中测量的ctDNA的量(测量为log10(单倍体基因组当量/mL))。在RCHOP治疗的第1个周期之前(即预处理)、第2个周期之前和第3个周期之前采集的样品以独立的颜色显示(分别为蓝色、绿色和红色;总共278个样品)。无法检测的水平落在轴上。显示了Spearman相关性和P值。
图17A-17D示出了两个周期的全身治疗后ctDNA的检测。图17A示出了散点图,其显示了对于接受RCHOP治疗的患者,通过CAPP-Seq或PhasED-Seq测量的2个治疗周期后的ctDNA的对数倍数变化(即,主要分子反应或MMR)。虚线显示对于MMR先前确定的ctDNA 2.5-对数减少的阈值。检测不到的样品落在轴上;相关系数表示通过CAPP-Seq和PhasED-Seq检测到的33个样品的Spearman rho。图17B示出了总结通过PhasED-Seq相对CAPP-Seq在2个治疗周期后对ctDNA样品的检测率的2×2表格。具有最终疾病进展的患者显示在下图中,而没有最终疾病进展的患者显示在上图中。图17C示出了条形图,其显示用于基于2个治疗周期后的CAPP-Seq(浅色)或PhasED-Seq(深色)针对24个月时的无事件存活对患者进行分类的接受者操作曲线下面积(AUC)。显示了所有患者(n=89,左)和仅实现MMR的患者(n=69,右)的分类。图17D示出了显示通过使用CAPP-Seq(上图)或PhasED-Seq(下图)的ctDNA检测分层的69名实现MMR的患者的无事件存活率的Kaplan-Meier图。
图18A-18H示出了在一个周期的全身治疗后ctDNA的检测。图18A示出了散点图,其显示了对于接受RCHOP治疗的患者,通过CAPP-Seq或PhasED-Seq测量的在1个治疗周期后ctDNA的对数倍数变化(即早期分子反应或EMR)。虚线显示对于EMR先前确定的ctDNA的2-对数减少的阈值。检测不到的样品落在轴上;相关系数表示通过CAPP-Seq和PhasED-Seq检测到的45个样品的Spearman rho。图18B示出了总结通过PhasED-Seq相对CAPP-Ceq在1个治疗周期后对ctDNA样品的检测率的2×2表格。具有最终疾病进展的患者以红色显示,而没有最终疾病进展的患者以蓝色显示。图18C示出了条形图,其显示用于基于1个治疗周期后的CAPP-Seq(浅色)或PhasED-Seq(深色)针对24个月时的无事件存活率对患者进行分类的接受者操作曲线下面积(AUC)。显示了所有患者(n=82,左)和仅实现EMR的患者(n=63,右)的分类。图18D示出了Kaplan-Meier图,其显示通过使用CAPP-Seq(上图)或PhasED-Seq(下图)的ctDNA检测分层的63名实现EMR的患者的无事件存活率。图18E示出了瀑布图,其显示DLBCL患者在1个周期的一线治疗后通过CAPP-Seq测量的ctDNA水平的变化。具有通过CAPP-Seq无法检测到的ctDNA的患者显示为“ND”(“未检测到”),以较深颜色显示。条形的颜色还指示这些患者的最终临床结果。图18F示出了Kaplan-Meier图,其显示了在1个治疗周期后具有通过CAPP-Seq测量的检测不到的ctDNA的33名DLBCL患者的无事件存活率。图18G示出了Kaplan-Meier图,其显示通过在该同一时间点(第2周期,第1天)通过PhasED-Seq进行的ctDNA检测分层的图18F所示的33名患者(通过CAPP-Seq检测不到的ctDNA)的无事件存活率。图18H示出了Kaplan-Meier图,其显示了在第2周期第1天通过ctDNA分层的82名DLBCL患者的无事件存活率分为3层——未能实现早期分子反应的患者,仍具有可通过PhasED-Seq和/或CAPP-Seq检测到的ctDNA的具有早期分子反应的患者,以及具有严格分子缓解的患者(通过PhasED-Seq和CAPP-Seq检测不到的ctDNA)。
图19示出了其中PhasED-Seq将实现比基于PCAWG数据(全基因组测序)(从其量化了不同肿瘤类型中的SNV和定相变异(PV)的数量)跟踪SNV的双链体测序更低的LOD的患者分数。
图20示出了与全基因组测序数据的双链体测序相比,在肺癌(腺癌,缩写为“A”,和鳞状细胞癌,缩写为“S”)中获得的改善的LOD。
图21A示出了来自其中对肿瘤组织进行WGS并为5名实体瘤患者(5名肺癌患者)设计定制实验组以检查和比较定制CAPP-Seq相对PhasED-Seq的LOD的实验的经验数据,显示在5/5患者中使用PhasED-Seq的约10X更低的LOD。
图21B显示了在进行和不进行涉及原始患者的肿瘤和种系DNA的靶向重测序的再分析的情况下检测对照细胞游离DNA样品中的患者和肿瘤特异性DNA的背景信号。
图22A示出了比较使用定制CAPP-Seq和PhasED-Seq用于肺癌的疾病监测的原理证明示例患者小插图,显示了使用PhasED-Seq对复发的早期检测。
图22B示出了比较使用定制CAPP-Seq和PhasED-Seq用于乳腺癌的疾病早期检测的原理证明示例患者小插图,显示了使用PhasED-Seq对疾病的早期检测。
图22C显示了从全基因组测序数据中选择经验证的定相变异的过程。
图22D显示了六名患者的个性化PhasED-seq的性能指标,包括背景信号和检测限。上图,SNV(正方形)、双链SNV(三角形)或PV(圆形)的背景率;条形代表中位数和IQR。下图,每个样品的最低可检测肿瘤分数。SNV的背景率以2×10-5显示,PV的背景率以5×10-7显示。
图22E显示了对于来自六名实体瘤患者的所有样品通过CAPP-seq(x轴)和PhasED-seq(y轴)进行恢复的肿瘤分数之间的比较。
图22F显示了使用个性化小组的使用基于SNV的检测(即CAPP-Seq)或PhasED-Seq对6例实体瘤患者(包括肺癌(n=5)和乳腺癌(n=1))的ctDNA进行检测。患者血浆样品中ctDNA的检测结果以蓝色显示;可使用PhaseED-Seq而非基于SNV的方法检测到的样品以浅蓝色显示。使用24个健康对照样品评估测定的特异性;在所有6个个性化小组中,通过PhasED-Seq检测到的ctDNA证据在右侧以粉红色显示,指示97%(139/144)的特异性;相同样品上的CAPP-Seq显示出95%(137/144)的特异性。
图22G显示了通过CAPP-Seq和PhasED-Seq两者测量的接受联合化学放射疗法(CRT)和免疫疗法的3期肺腺癌患者(LUP831)的ctDNA谱。左图显示了使用两种方法测量的肿瘤活检样品中的肿瘤分数。右图显示了血浆DNA中的肿瘤分数,包括由PhasED-Seq检测到但CAPP-Seq未检测到的样品。ND:未检测到。
图23A-23B示出了本文描述的检测方法(例如产生图3E和图3F所描绘的方法)不需要条形码介导的错误抑制。
图24示出了根据一个实施方案的基于检测测序结果中的循环肿瘤核酸序列对个体进行临床干预和/或治疗的过程的流程图。
图25A-25C显示了基于一个或多个包含多个变异的细胞游离核酸分子来确定受试者的病况的方法的示例性流程图。
图25D显示了基于一个或多个包含多个变异的细胞游离核酸分子来治疗受试者的病况的方法的示例性流程图。
图25E显示了用于基于一个或多个包含多个变异的细胞游离核酸分子来确定受试者的病况的进展(例如,发展或消退)的方法的示例性流程图。
图25F和25G显示了基于一个或多个包含多个变异的细胞游离核酸分子来确定受试者的病况的方法的示例性流程图。
图26A和26B示意性地示出了用于鉴定一个或多个包含多个定相变异的细胞游离核酸分子的不同荧光探针。
图27示出了被编程或以其他方式配置以实施本文提供的方法的计算机系统。
图28显示了与双链体测序相比,较大插入缺失突变的低错误率。
详细描述
虽然本文已经示出和描述了本发明的各种实施方案,但是对于本领域技术人员将明显的是这些实施方案仅作为示例提供。在不脱离本发明的情况下,本领域技术人员可以想到多种变异、变化和替换。应当理解,可以采用对本文描述的本发明的实施方案的各种替代方案。
术语“约”或“大约”通常表示在特定值的可接受误差范围内,这可能部分取决于如何测量或确定该值,例如,测量系统的限制。例如,根据本领域的实践,“约”可以表示在1个或多于1个标准偏差之内。备选地,“约”可以表示给定值的多至20%、多至10%、多至5%或多至1%的范围。备选地,特别是就生物系统或过程而言,该术语可表示值的一定数量级之内,优选在5倍内,更优选在2倍内。在本申请和权利要求中描述特定值的情况下,除非另有说明,否则可以假定术语“约”表示在特定值的可接受误差范围内。
如本文中可互换使用,术语“定相变异”、“同相变异”或“PV”通常是指(1)核酸序列中相对于参考基因组序列的两个或更多个变化(例如,SNV、插入缺失突变、易位、扩增等),或(2)核酸序列中相对于参考序列的一个或多个变化以及甲基化状态的相对于参考甲基化状态的一个或多个一个或多个变化,只要此类变化发生在彼此的170bp内,如通过参考基因组参考序列确定的。核酸序列中相对于参考基因组序列(例如,来源于多个健康细胞之一的序列或来自队列的共有序列)的变化的实例可包括:体细胞单核苷酸变异(SNV)、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点(例如,大基因组拷贝数改变的边界,例如大规模缺失或大规模扩增)、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点或局部超突变区域(kataegis)。在一些情况下,定相变异可以在单个分子(例如单个细胞游离核酸分子)内以顺式(即,在核酸分子的相同链上)发生。在一些情况下,细胞游离核酸分子可以是细胞游离脱氧核糖核酸(cfDNA)分子。在一些情况下,cfDNA分子可以来源于患病组织,例如肿瘤(例如,循环肿瘤DNA(ctDNA)分子)。在一些情况下,细胞游离核酸分子可以是细胞游离核糖核酸分子。术语“定相变异”可以指需要彼此接近地发生以构成定相变异的多个变体之一,而如权利要求中所使用的术语“定相变异的集合”可以指代一起形成定相变异的多个变异(即相对于参考基因组在彼此的170bp内的变异,其发生在同一条DNA链上)。
本文可互换使用的术语“生物样品”或“身体样品”通常是指来自受试者的组织或流体样品。生物样品可以直接从受试者获得。备选地,生物样品可以来源于受试者(例如,通过处理从受试者获得的初始生物样品)。生物样品可以是或可以包括一个或多个核酸分子,例如DNA或核糖核酸(RNA)分子。生物样品可以来源于任何器官、组织或生物流体。生物样品可以包括例如体液或实体组织样品。实体组织样品的一个实例是肿瘤样品,例如来自实体瘤活检。体液的非限制性实例包括血液、血清、血浆、肿瘤细胞、唾液、尿液、脑脊液、淋巴液、前列腺液、精液、乳汁、痰液、粪便、泪液和它们的衍生物。在一些情况下,如本文所公开的一个或多个细胞游离核酸分子可以来源于生物样品。
如本文所用,术语“受试者”通常是指任何动物、哺乳动物或人。受试者可以患有、可能患有或怀疑患有一种或多种病况,例如疾病。在一些情况下,受试者的病况可以是癌症、与癌症相关的一种或多种症状或关于癌症无症状或是未确诊的(例如,未诊断为癌症)。在一些情况下,受试者可能患有癌症,受试者可能表现出与癌症相关的症状,受试者可能没有与癌症相关的症状,或者受试者可能没有被诊断出患有癌症。在一些实例中,受试者是人。
本文可互换使用的术语“细胞游离DNA”或“cfDNA”通常是指在受试者的血流中自由循环的DNA片段。细胞游离DNA片段可具有双核小体保护(例如,片段大小为至少240个碱基对(“bp”))。这些具有双核小体保护的cfDNA片段在核小体之间可能不被切割,导致更长的片段长度(例如,典型的大小分布集中在334bp附近)。细胞游离DNA片段可以具有单核小体保护(例如,片段大小为小于240个碱基对(“bp”))。这些具有单核小体保护的cfDNA片段可能在核小体之间被切割,导致更短的片段长度(例如,典型的大小分布集中在167bp附近)。
如本文所用,术语“测序数据”通常指核酸的“原始序列读数”和/或“共有序列”,例如细胞游离核酸或其衍生物。原始序列读数是DNA测序仪的输出,并通常包括相同亲本分子的冗余序列(例如在扩增后)。“共有序列”是来源于旨在代表原始亲本分子的序列的亲本分子的冗余序列的序列。可以通过投票(其中序列中的每个多数核苷酸(例如,在给定碱基位置最常观察到的核苷酸)是共有核苷酸)或其他方法(例如与参考基因组进行比较)来产生共有序列。在某些情况下,共有序列可以通过用独特或非独特的分子标签标记原始亲本分子来产生,这允许通过跟踪标签和/或使用序列读取内部信息来跟踪后代序列(例如,扩增后)。
如本文所用,术语“参考基因组序列”通常是指与受试者的核苷酸序列进行比较的核苷酸序列。
如本文所用,术语“基因组区域”通常是指基因组的任何区域(例如,碱基对位置的范围),例如整个基因组、染色体、基因或外显子。基因组区域可以是连续区域或非连续区域。“基因的基因座”(或“基因座”)可以是基因组区域的一部分或全部(例如,基因、基因的一部分或基因的单个核苷酸)。
如本文所用,术语“可能性”通常是指概率、相对概率、存在或不存在或程度。
如本文所用,术语“液体活检”通常是指无创或微创实验室测试或测定(例如,生物样品或细胞游离核酸的)。“液体活检”测定可以报告与受试者的病况相关的一种或多种标志物基因(例如,癌症或肿瘤相关标志物基因)的检测或测量(例如,次要等位基因频率、基因表达或蛋白质表达)。
A.引言
基因组DNA的修饰(例如,突变)可以在受试者的一种或多种病况(例如疾病,例如癌症或肿瘤)的形成和/或进展中表现出来。本公开内容提供用于分析来自受试者的细胞游离核酸分子(例如cfDNA)以确定受试者的病况的存在或不存在、受试者诊断的病况的预后、受试者的病况随时间推移的进展、受试者诊断的病况的治疗性治疗或受试者的病况的预测的治疗结果的方法和系统。
细胞游离核酸(例如cfDNA)的分析已经在例如产前检测、器官或组织移植、传染病和肿瘤学中具有广泛的应用。在检测或监测受试者的疾病(例如癌症)的背景下,循环肿瘤DNA(ctDNA)可以是多种癌症类型中的敏感和特异性生物标志物。在一些情况下,ctDNA可用于检测治疗(例如实体瘤的化学疗法或手术切除)后微小残留病(MRD)或肿瘤负荷的存在。然而,ctDNA分析的检测限(LOD)可能受到许多因素的限制,包括(i)来自典型血液采集的低输入DNA量和(ii)测序的背景错误率。
在一些情况下,可以通过使用错误抑制测序跟踪多个体细胞突变来改善基于ctDNA的癌症检测,例如,在使用现成的实验组或个性化测定时使用来自cfDNA输入的100,000中约2份的LOD。然而,在一些情况下,感兴趣的ctDNA的当前LOD可能不足以普遍检测注定疾病复发或进展的患者的MRD。例如,这种“检测缺失”可以在弥漫性大B细胞淋巴瘤(DLBCL)中得到例证。对于DLBCL,在仅两个周期的治愈性治疗后的中期ctDNA检测可以代表主要分子反应(MMR),并且可以成为最终临床结果的强有力的预后标志物。尽管如此,使用现有技术(例如,通过深度测序进行癌症个性化分析(CAPP-Seq)),近三分之一最终经历疾病进展的患者在这个临时界标处没有可检测到的ctDNA,因此代表了“假阴性”测量。通过替代方法,例如通过免疫球蛋白基因重排监测ctDNA,在DLBCL患者中也观察到了如此高的假阴性率。因此,需要具有更高灵敏度的基于ctDNA的癌症检测的改进方法。
在亲本DNA双链体的两条互补链上都检测到的体细胞变异可用于降低ctDNA检测的LOD,从而有利地提高ctDNA检测的灵敏度。由于检测单核苷酸变异(SNV)需要两个一致事件,因此这种“双链体测序”可以减少背景误差特征谱。然而,单独的双链体测序方法可能会受到DNA双链体的低效恢复率的限制,因为在所有恢复的分子中的少数分子中可能发生两条原始链的恢复。因此,对于起始样品量有限的真实世界ctDNA检测而言,双链体测序可能是次优且低效的,其中来自实际血液体积的输入DNA(例如,每个标准10毫升(mL)采血管约4,000至约8,000个基因组)是有限的,并且基因组的最大恢复是必不可少的。
因此,仍然存在对于以低LOD(例如,从而产生高灵敏度)检测和分析ctDNA以用于确定例如受试者的疾病的存在或不存在、疾病的预后、疾病的治疗和/或治疗的预测结果的显著未满足的需求。
B.用于确定或监测病况的方法和系统
本公开内容描述了用于检测和分析具有作为受试者的病况的特征的多个定相变异的细胞游离核酸的方法和系统。在一些方面,细胞游离核酸分子可包含cfDNA分子,例如ctDNA分子。本文公开的方法和系统可以利用来源于受试者的多个细胞游离核酸分子的测序数据来鉴定具有多个定相变异的多个细胞游离核酸分子的子集,从而确定受试者的病况。本文公开的方法和系统可以直接检测并在一些情况下下拉(或捕获)表现出多个定相变异的多个细胞游离核酸分子的这样的子集,从而在使用或不使用测序的情况下确定受试者的病况。本文公开的方法和系统可以降低在细胞游离核酸分子例如cfDNA的检测和分析过程中经常涉及的背景错误率。
在一些方面,提供了用于细胞游离核酸测序和癌症检测的方法和系统。在一些实施方案中,细胞游离核酸(例如,cfDNA或cfRNA)可以从个体的液体活检中提取并准备用于测序。可以分析细胞游离核酸的测序结果以检测同相体细胞变异(即,定相变异,如本文所公开)作为循环肿瘤核酸(ctDNA或ctRNA)序列(即,衍生或来源于癌细胞的核酸)的指示。因此,在一些情况下,可以通过从个体中提取液体活检并对来源于该液体活检的细胞游离核酸进行测序以检测循环肿瘤核酸序列来检测个体中的癌症,并且循环肿瘤核酸序列的存在可以表明个体患有癌症(例如,特定类型的癌症)。在一些情况下,可以基于癌症的检测对个体确定和/或执行临床干预和/或治疗。
如本文所公开的,同相体细胞变异的存在可以强烈表明含有此类定相变异的核酸来源于具有病况的身体样品,例如癌细胞(或者备选地,核酸来源于获自或衍生自患有病况(例如癌症)的受试者的身体样品)。定相体细胞变异的检测可以提高细胞游离核酸检测方法的信噪比(例如,通过减少或消除虚假的“噪音”信号),因为定相突变不太可能会发生在大约是典型细胞游离核酸分子的大小(例如,约170bp或更小)的小的基因窗口内。
在一些方面,许多基因组区域可用作用于检测定相变异的热点区,尤其是在各种癌症例如淋巴瘤中。在一些情况下,酶(例如AID、Apobec3a)可以典型地诱变特定基因和位置中的DNA,导致特定癌症的发展。因此,可以捕获或靶向(例如,使用或不使用深度测序)来源于此类热点基因组区域的细胞游离核酸以用于癌症检测和/或监测。备选地,可以在先前从特定个体的癌源(例如,肿瘤)中检测到定相变异的区域上进行捕获或靶向测序,以检测该个体的癌症。
在一些方面,可以对细胞游离核酸进行捕获测序作为筛选诊断(例如,在并未先前被诊断和/或先前怀疑或患有病况例如癌症的受试者中)。在一些情况下,可以开发筛选诊断并用于检测具有定相变异的典型区域的癌症的循环肿瘤核酸。在一些情况下,对细胞游离核酸进行捕获测序作为诊断方法以检测MRD或肿瘤负荷,以确定在治疗期间或治疗后是否存在特定疾病。在一些情况下,可以对细胞游离核酸进行捕获测序作为诊断方法以确定治疗的进展(例如发展或消退)。
在一些方面,可以分析细胞游离核酸测序结果以检测定相体细胞单核苷酸变异(SNV)或其他突变或变异(例如,插入缺失突变)是否存在于细胞游离核酸样品中。在一些情况下,特定体细胞SNV或其他变异的存在可以指示循环肿瘤核酸序列,并因此指示受试者中存在肿瘤。在一些情况下,可以在细胞游离核酸分子上同相检测到最少两个变异。在一些情况下,可以在细胞游离核酸分子上同相检测到最少三个变异。在一些情况下,可以在细胞游离核酸分子上同相检测到最少四个变异。在一些情况下,可以在细胞游离核酸分子上同相检测到最少五个或更多个变异。在一些情况下,在细胞游离核酸分子上检测到的定相变异数量越多,该细胞游离核酸分子来源于癌症的可能性就越大,这与检测来源于序列文库的分子制备或随机生物错误的体细胞变异的无害序列相反。因此,假阳性检测的可能性可以随着分子内更多同相变异的检测而降低(例如,从而提高检测的特异性)。
在一些方面,可以分析细胞游离核酸测序结果以检测一个或多个核碱基的插入或缺失(即,插入缺失突变)是否存在于细胞游离核酸样品中,例如相对于参考基因组序列。不希望受理论束缚,在一些情况下,细胞游离核酸分子(例如,cfDNA)中插入缺失突变的存在可以指示受试者的病况,例如疾病,例如癌症。在一些情况下,如本文所公开的,由于插入缺失突变导致的遗传变异可以被视为变异或突变,因此两个插入缺失突变可以被视为两个定相变异。在一些实例中,在细胞游离核酸分子内,来自第一插入缺失突变(第一定相变异)的第一遗传变异和来自第二插入缺失突变(第二定相变异)的第二遗传变异可以通过至少1个核苷酸彼此隔开。
在单个细胞游离核酸分子(例如单个cfDNA分子)中,如本文所公开的,第一定相变异可以是SNV并且第二定相变异可以是不同小核苷酸多态性的一部分,例如另一个SNV或多核苷酸变异(MNV)的一部分。多核苷酸变异可以是存在于核酸分子的同一链中的两个或更多个(例如,至少2、3、4、5或更多个)相邻变异的簇。在一些情况下,第一定相变异和第二定相变异可以是单个细胞游离核酸分子内相同MNV的部分。在一些情况下,第一定相变异和第二定相变异可以来自单个细胞游离核酸分子内的两个不同的MNV。
在一些方面,可以利用统计方法来计算检测到的定相变异来自癌症而非随机或人工(例如,来自样品制备或测序错误)的可能性。在一些情况下,可以使用Monte Carlo采样方法来确定检测到的定相变异来自癌症而非随机或人工的可能性。
本公开内容的方面提供了具有多个定相变异的细胞游离核酸(例如,cfDNA分子)(例如来自受试者的液体活检)的鉴定或检测。在一些情况下,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异可以彼此直接相邻(例如,相邻的SNV)。在一些情况下,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异可以被至少一个核苷酸隔开。第一定相变异和第二定相变异之间的间距可受细胞游离核酸分子的长度限制。
在单个细胞游离核酸分子(例如单个cfDNA分子)中,如本文所公开的,第一定相变异和第二定相变异可以彼此隔开至少或至多约1个核苷酸、至少或至多约2个核苷酸、至少或至多约3个核苷酸、至少或至多约4个核苷酸、至少或至多约5个核苷酸、至少或至多约6个核苷酸、至少或至多约7个核苷酸、至少或至多约8个核苷酸、至少或至多约9个核苷酸、至少或至多约10个核苷酸、至少或至多约11个核苷酸、至少或至多约12个核苷酸、至少或至多约13个核苷酸、至少或至多约14个核苷酸、至少或至多约15个核苷酸、至少或至多约20个核苷酸、至少或至多约25个核苷酸、至少或至多约30个核苷酸、至少或至多约35个核苷酸、至少或至多约40个核苷酸、至少或至多约45个核苷酸、至少或至多约50个核苷酸、至少或至多约60个核苷酸、至少或至多约70个核苷酸、至少或至多约80个核苷酸、至少或至多约90个核苷酸、至少或至多约100个核苷酸、至少或至多约110个核苷酸、至少或至多约120个核苷酸、至少或至多约130个核苷酸、至少或至多约140个核苷酸、至少或至多约150个核苷酸、至少或至多约160个核苷酸、至少或至多约170个核苷酸或至少或至多约180个核苷酸。备选地或另外地,在单个细胞游离核酸分子内,第一定相变异和第二定相变异可以不或不需要被一个或多个核苷酸隔开,因此可以彼此直接相邻。
如本文公开的单个细胞游离核酸分子(例如单个cfDNA分子)可以包含在同一分子内的至少或至多约2个定相变异、至少或至多约3个定相变异、至少或至多约4个定相变异、至少或至多约5个定相变异、至少或至多约6个定相变异、至少或至多约7个定相变异、至少或至多约8个定相变异、至少或至多约9个定相变异、至少或至多约10个定相变异、至少或至多约12个定相变异、至少或至多约12个定相变异、至少或至多约13个定相变异、至少或至多约14个定相变异、至少或至多约15个定相变异、至少或至多约20个定相变异或至少或至多约25个定相变异。
从获得的多个细胞游离核酸分子(例如,来自受试者的液体活检)来看,两个或更多个(例如,10个或更多个、1,000个或更多个、10,000个或更多个)细胞游离核酸分子可以被鉴定为在每个被鉴定为包含多个定相变异的细胞游离核酸分子中具有平均至少或至多约2个定相变异、至少或至多约3个定相变异、至少或至多约4个定相变异、至少或至多约5个定相变异、至少或至多约6个定相变异、至少或至多约7个定相变异、至少或至多约8个定相变异、至少或至多约9个定相变异、至少或至多约10个定相变异、至少或至多约12个定相变异、至少或至多约12个定相变异、至少或至多约13个定相变异、至少或至多约14个定相变异、至少或至多约15个定相变异、至少或至多约20个定相变异或至少或至多约25个定相变异。
在一些情况下,可以从受试者的生物样品(例如,实体瘤或液体活检)获得多个细胞游离核酸分子(例如,cfDNA分子)。从多个细胞游离核酸分子中,可以鉴定至少或至多1个、至少或至多2个、至少或至多3个、至少或至多4个、至少或至多5个、至少或至多6个、至少或至多7个、至少或至多8个、至少或至多9个、至少或至多10个、至少或至多15个、至少或至多20个、至少或至多25个、至少或至多30个、至少或至多35个、至少或至多40个、至少或至多45个、至少或至多50个、至少或至多60个、至少或至多70个、至少或至多80个、至少或至多90个、至少或至多100个、至少或至多150个、至少或至多200个、至少或至多300个、至少或至多400个、至少或至多500个、至少或至多600个、至少或至多700个、至少或至多800个、至少或至多900个、至少或至多1,000个、至少或至多5,000个、至少或至多10,000个、至少或至多50,000个或至少或至多100,000个细胞游离核酸分子,使得每个鉴定的细胞游离核酸分子包括多个定相变异,如本文所公开的。
在一些情况下,可以从受试者的生物样品(例如,实体瘤或液体活检)获得多个细胞游离核酸分子(例如,cfDNA分子)。从多个细胞游离核酸分子中,可以从靶基因组区域(例如靶基因组基因座)鉴定至少或至多1个、至少或至多2个、至少或至多3个、至少或至多4个、至少或至多5个、至少或至多6个、至少或至多7个、至少或至多8个、至少或至多9个、至少或至多10个、至少或至多15个、至少或至多20个、至少或至多25个、至少或至多30个、至少或至多35个、至少或至多40个、至少或至多45个、至少或至多50个、至少或至多60个、至少或至多70个、至少或至多80个、至少或至多90个、至少或至多100个、至少或至多150个、至少或至多200个、至少或至多300个、至少或至多400个、至少或至多500个、至少或至多600个、至少或至多700个、至少或至多800个、至少或至多900个或至少或至多1,000个细胞游离核酸分子,使得每个鉴定的细胞游离核酸分子包含多个定相变异,如本文所公开的。
图1A和1E示意性地示出了(i)包含SNV的cfDNA分子和(ii)包含多个定相变异的另一cfDNA分子的实例。cfDNA中鉴定出的每个变异可以表明cfNDA从中来源的细胞中一个或多个基因突变的存在。在备选实施方案中,一个或多个定相变异可以是插入或缺失(插入缺失突变)或其它基因组变化而不是SNV。
在一个方面,本公开内容提供一种用于确定受试者的病况的方法,如图25A中的流程图2510所示。该方法可以包括(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据(过程2512)。该方法可以还包括(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异(过程2514)。在一些情况下,一个或多个细胞游离核酸分子的至少一部分可以包含多个定相变异中的第一定相变异和多个定相变异中的第二定相变异,它们被至少一个核苷酸隔开,如本文所公开的。该方法可以任选地包括(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子的至少一部分以确定受试者的病况(过程2516)。
在一些情况下,至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%、至少或至多约50%、至少或至多约60%、至少或至多约70%、至少或至多约80%、至少或至多约90%、至少或至多约95%、至少或至多约99%或约100%的一个或多个细胞游离核酸分子可以包含多个定相变异中的第一定相变异和多个定相变异中的第二定相变异,它们被至少一个核苷酸隔开,如本文所公开的。在一些实例中,单个cfDNA分子内的多个定相变异可包含(i)彼此间隔至少一个核苷酸的第一多个定相变异和(ii)彼此相邻的第二多个定相变异(例如,MNV内的两个定相变异)。在一些实例中,单个cfDNA分子内的多个定相变异可以由彼此间隔至少一个核苷酸的定相变异的组成。
在一个方面,本公开内容提供一种用于确定受试者的病况的方法,如图25B中的流程图2520所示。该方法可以包括(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据(过程2522)。该方法可以还包括(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异(过程2524)。在一些情况下,如本文所公开的,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异可以被至少一个核苷酸隔开。该方法可以任选地包括(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子的至少一部分以确定受试者的病况(过程2526)。
在一个方面,本公开内容提供一种用于确定受试者的病况的方法,如图25C中的流程图2530所示。该方法可以包括(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据(过程2532)。该方法可以还包括(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中LOD小于来自测序数据的50,000个观察结果中的约1个(或细胞游离核酸分子)(过程2534)。在一些情况下,一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。该方法可以任选地包括(c)分析所鉴定的一个或多个细胞游离核酸分子的至少一部分以确定受试者的病况(过程2536)。
在一些情况下,如本文所公开的,鉴定一个或多个细胞游离核酸分子的操作的LOD可以小于来自测序数据的60,000个观察结果中的约1个、小于来自测序数据的70,000个观察结果中的1个、小于来自测序数据的80,000个观察结果中的10个、小于来自测序数据的90,000个观察结果中的1个、小于来自测序数据的100,000个观察结果中的1个、小于来自测序数据的150,000个观察结果中的1个、小于来自测序数据的200,000个观察结果中的1个、小于来自测序数据的300,000个观察结果中的1个、小于来自测序数据的400,000个观察结果中的1个、小于来自测序数据的500,000个观察结果中的1个、小于来自测序数据的600,000个观察结果中的1个、小于来自测序数据的700,000个观察结果中的1个、小于来自测序数据的800,000个观察结果中的1个、小于来自测序数据的900,000个观察结果中的1个、小于来自测序数据的1,000,000个观察结果中的1个、小于来自测序数据的1,000,000个观察结果中的1个、小于来自测序数据的1,100,000个观察结果中的1个、小于来自测序数据的1,200,000个观察结果中的1个、小于来自测序数据的1,300,000个观察结果中的1个、小于来自测序数据的1,400,000个观察结果中的1个、小于来自测序数据的1,500,000个观察结果中的1个或小于来自测序数据的2,000,000个观察结果中的1个。
在一些情况下,所鉴定的一个或多个细胞游离核酸分子中的至少一种细胞游离核酸分子可包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异,如本文所公开的。
在一些情况下,主题方法的操作(a)到(c)中的一个或多个可以通过计算机系统执行。在一个实例中,主题方法的所有操作(a)到(c)可以通过计算机系统执行。
如本文所公开的,测序数据可以从一种或多种测序方法获得。测序方法可以是第一代测序方法(例如,Maxam-Gilbert测序、Sanger测序)。测序方法可以是高通量测序方法,例如下一代测序(NGS)(例如,合成测序)。高通量测序方法可同时(或基本同时)测序至少约10,000、至少约100,000、至少约100万、至少约1000万、至少约1亿、至少约10亿或更多个多核苷酸分子(例如,细胞游离核酸分子或其衍生物)。NGS可以是任何代数的测序技术(例如,第二代测序技术、第三代测序技术、第四代测序技术等)。高通量测序方法的非限制性实例包括大规模平行特征测序、聚合酶克隆测序、焦磷酸测序、合成测序、组合探针锚合成(combinatorial probe anchor synthesis,cPAS)、连接测序(例如,通过寡核苷酸连接和检测测序(SOLiD)的测序)、半导体测序(例如Ion Torrent半导体测序)、DNA纳米球测序和单分子测序、杂交测序。
在本文公开的任何一种方法的一些实施方案中,可以基于任何公开的利用核酸扩增的测序方法(例如聚合酶链式反应(PCR))获得测序数据。此类测序方法的非限制性实例可包括454焦磷酸测序、聚合酶克隆测序和SoLiD测序。在一些情况下,对应于感兴趣的基因组区域(例如,与疾病相关的基因组区域)的扩增子(例如,如本文公开的获自或衍生自受试者的多个细胞游离核酸分子的衍生物)可以通过PCR生成,任选地合并,然后进行测序以生成测序数据。在一些实例中,因为感兴趣的区域在测序之前通过PCR扩增成扩增子,所以核酸样品已经富集感兴趣的区域,并因此可能不需要或没必要需要在测序(例如,基于非杂交的NGS)之前的任何额外的合并(例如,杂交)。备选地,还可以进行通过杂交的合并以用于在测序之前进行额外的富集。备选地,可以在不生成PCR拷贝的情况下获得测序数据,例如,通过cPAS测序。
许多实施方案利用捕获杂交技术来进行靶向测序。在对细胞游离核酸进行测序时,为了提高特定基因组基因座上的分辨率,可以在测序前通过杂交捕获文库产物。捕获杂交在尝试从样品中检测特定基因组基因座的稀有和/或体细胞定相变异时特别有用。在一些情况下,稀有和/或体细胞定相变异的检测表明核酸的来源,包括来源于癌症来源的核酸。因此,捕获杂交是一种可以增强细胞游离核酸中的循环肿瘤核酸的检测的工具。
各种类型的癌症反复经历在特定基因组基因座中的异常体细胞超突变。例如,酶激活诱导的脱氨酶诱导B细胞异常体细胞超突变,导致各种B细胞淋巴瘤,包括(但不限于)弥漫性大B细胞淋巴瘤(DLBCL)、滤泡性淋巴瘤(FL)、伯基特淋巴瘤(BL)和B细胞慢性淋巴细胞白血病(CLL)。因此,在许多实施方案中,探针被设计成下拉(或捕获)已知在淋巴瘤中经历异常体细胞超突变的基因组基因座。图1D和表1描述了在DLBCL、FL、BL和CLL中经历异常体细胞超突变的许多区域。表6中提供了可用于下拉(或捕获)基因组基因座以检测B细胞癌症中的异常体细胞超突变的核酸探针列表。
还可以利用设计用于检测个体癌症的存在的个性化核酸探针来进行捕获测序。可以对患有癌症的个体的癌症进行活检和测序,以检测在癌症中积累的体细胞定相变异。基于测序结果,根据多个实施方案,设计并合成能够下拉包括定相变异的位置的基因组基因座的核酸探针。这些个性化设计并合成的核酸探针可用于从该个体的液体活检中检测循环肿瘤核酸。因此,个性化核酸探针可用于确定治疗反应和/或检测治疗后的MRD。
在本文公开的任何一种方法的一些实施方案中,可以基于利用衔接子的任何测序方法获得测序数据。核酸样品(例如,来自受试者的多个细胞游离核酸分子,如本文所公开的)可以与一种或多种用于识别(例如,通过杂交)样品的衔接子(或衔接子序列)或其任何衍生物(例如,扩增子)缀合。在一些实例中,核酸样品可用分子条形码标记,例如,使得多个细胞游离核酸分子中的每个细胞游离核酸分子可具有独特的条形码。备选地或另外地,核酸样品可以用样品条形码标记,例如,使得来自受试者的多个细胞游离核酸分子(例如,从受试者的特定身体组织获得的多个细胞游离核酸分子)可以具有相同的条形码。
在备选实施方案中,如本文所公开的,鉴定包含多个定相变异的一个或多个细胞游离核酸分子的方法可以在没有分子条形码化、没有样品条形码化或没有分子条形码化和样品条形码化的情况下进行,这至少部分是由于通过依赖于鉴定定相变异而不是例如单个SNV而实现的高特异性和低LOD。
在本文公开的任何一种方法的一些实施方案中,可以获得测序数据,并且不用计算机模拟去除或抑制(i)背景错误和/或(ii)测序错误而进行分析,这至少部分是由于通过依赖于鉴定定相变异而不是例如单个SNV或插入缺失突变而实现的高特异性和低LOD。
在本文公开的任何一种方法的一些实施方案中,使用多个变异作为条件来鉴定具有感兴趣的特定突变的靶细胞游离核酸分子而无需错误抑制的计算机模拟方法产生的背景错误率可以比(i)条形码去重复、(ii)集成的数字错误抑制或(iii)双链体测序的背景错误率低至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约200倍、至少约400倍、至少约600倍、至少约800倍或至少约1,000倍。这种方法可以有利地提高鉴定具有感兴趣的特定突变的靶细胞游离核酸分子的信噪比(从而提高灵敏度和/或特异性)。
在本文公开的任何一种方法的一些实施方案中,增加作为鉴定具有感兴趣的特定突变的靶细胞游离核酸分子的条件所需的每个细胞游离核酸分子的定相变异最小数量(例如,从至少两个定相变异增加到至少三个定相变异)可以将背景错误率降低至少约5倍、至少约10倍、至少约20倍、至少约30倍,至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。这种方法可以有利地提高鉴定具有感兴趣的特定突变的靶细胞游离核酸分子的信噪比(从而提高灵敏度和/或特异性)。
在一个方面,本公开内容提供了一种治疗受试者的病况的方法,如图25D中的流程图2540所示。该方法可以包括(a)鉴定用于治疗病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况(过程2542)。所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列可包含多个定相变异。多个定相变异的至少一部分(例如,部分或全部)可以被至少一个核苷酸隔开,使得多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开,如本文所公开的。在一些情况下,多个定相变异的存在指示受试者的病况(例如,疾病,例如癌症)。该方法可以还包括(b)基于步骤(a)使受试者接受治疗(过程2544)。在本公开内容的其他地方公开了受试者的病况的此类治疗的实例。
在一个方面,本公开内容提供了一种监测受试者的病况的进展(例如,发展或消退)的方法,如图25E中的流程图2550所示。该方法可以包括(a)基于获自或衍生自受试者的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态(过程2552)。该方法可以还包括(b)基于获自或衍生自受试者的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态(过程2554)。在从受试者获得第一多个细胞游离核酸分子之后,可以从受试者获得第二多个细胞游离核酸分子。该方法可以任选地包括(c)至少部分地基于病况的第一状态和病况的第二状态来确定病况的进展(例如,发展或消退)(过程2556)。在一些情况下,所鉴定的一个或多个细胞游离核酸分子中的每一个(例如,所鉴定的第一集合的一个或多个细胞游离核酸分子中的每一个,所鉴定的第二集合的一个或多个细胞游离核酸分子中的每一个)可以相对于参考基因组序列包含多个定相变异。如本文所公开的,所鉴定的一个或多个细胞游离核酸分子中的至少一部分(例如,部分或全部)可以被至少一个核苷酸隔开。在一些情况下,多个定相变异的存在可以指示受试者的病况的状态。
在一些情况下,可以获得(例如,通过血液活检)并分析来自受试者的第一多个细胞游离核酸分子以确定(例如,诊断)受试者的病况(例如,疾病,例如癌症)的第一状态。可以通过本文公开的任何方法(例如,使用或不使用测序)分析第一多个细胞游离核酸分子,以鉴定包含多个定相变异的第一集合的一个或多个细胞游离核酸分子,并且第一集合的一个或多个细胞游离核酸分子的存在或特征可用于确定受试者的病况的第一状态(例如,初始诊断)。基于所确定的病况的第一状态,受试者可以接受如本文公开的一种或多种治疗(例如,化学疗法)。在所述一种或多种治疗之后,可以从受试者获得第二多个细胞游离核酸分子。
在一些情况下,基于所确定的病况的第一状态,受试者可以接受至少或至多约1次治疗、至少或至多约2次治疗、至少或至多约3次治疗、至少或至多约4次治疗、至少或至多约5次治疗、至少或至多约6次治疗、至少或至多约7次治疗、至少或至多约8次治疗、至少或至多约9次治疗或至少或至多约10次治疗。在一些情况下,基于所确定的病况的第一状态,受试者可以接受多次治疗,并且多次治疗中的第一次治疗和多次治疗中的第二次治疗可以间隔至少或至多约1天、至少或至多约7天、至少或至多约2周、至少或至多约3周、至少或至多约4周、至少或至多约2个月、至少或至多约3个月、至少或至多约4个月、至少或至多约5个月、至少或至多约6个月、至少或至多约12个月、至少或至多约2年、至少或至多约3年、至少或至多约4年、至少或至多约5年或至少或至多约10年。受试者的多次治疗可以是相同的。备选地,多次治疗可以因药物类型(例如,不同的化学疗法药物)、药物剂量(例如,增加剂量、减少剂量)、联合治疗剂的存在或不存在(例如,化学疗法和免疫疗法)、施用模式(例如,静脉施用相对口服施用)、施用频率(例如,每天、每周、每月)等而不同。
在一些情况下,在确定病况的第一状态和确定病况的第二状态之间可以不治疗受试者的病况并且不需要治疗受试者的病况。例如,在没有任何干预治疗的情况下,可以包含(例如,通过液体活检)来自受试者的第二多个细胞游离核酸分子,以确认受试者是否仍然表现出病况的第一状态的指征。
在一些情况下,可以在从受试者获得第一多个细胞游离核酸分子后至少或至多约1天、至少或至多约7天、至少或至多约2周、至少或至多约3周、至少或至多约4周、至少或至多约2个月、至少或至多约3个月、至少或至多约4个月、至少或至多约5个月、至少或至多约6个月、至少或至多约12个月、至少或至多约2年、至少或至多约3年、至少或至多约4年、至少或至多约5年或至少或至多约10年获得(例如,通过血液活检)来自受试者的第二多个细胞游离核酸分子。
在一些情况下,可以随时间(例如,每月一次持续6个月,每两个月一次持续一年,每三个月一次持续一年,每6个月一次持续一年或多年等)获得包含多个核酸分子(例如,至少第一多个细胞游离核酸分子和第二多个细胞游离核酸分子)的至少或至多约2个、至少或至多约3个、至少或至多约4个、至少或至多约5个、至少或至多约6个、至少或至多约7个、至少或至多约8个、至少或至多约9个或至少或至多约10个不同的样品,以监测受试者的病况的进展,如本文所公开的。
在一些情况下,基于病况的第一状态和病况的第二状态确定病况的进展的步骤可以包括比较病况的第一状态和第二状态的一个或多个特征,例如,(i)被鉴定为包含每个状态下(例如,每等重量或等体积的原始生物样品,每等数量的分析的初始细胞游离核酸分子等)的多个定相变异的细胞游离核酸分子的总数,(ii)每个被鉴定为包含多个定相变异(即,两个或多个定相变异)的细胞游离核酸分子的多个定相变异的平均数目,或(iii)被鉴定为包含多个定相变异的细胞游离核酸分子的数量除以包含与多个定相变异中的一些重叠的突变的细胞游离核酸分子的总数(即定相变异等位基因频率)。基于这样的比较,可以确定受试者的病况(例如,癌症或肿瘤)的MRD。例如,可以基于这样的比较来确定受试者的肿瘤负荷或癌症负荷。
在一些情况下,病况的进展可以是病况的发展或恶化。在一个实例中,病况的恶化可以包括癌症从早期阶段发展到晚期阶段,例如从I期癌症发展到III期癌症。在另一个实例中,病况的恶化可包括实体瘤的大小(例如,体积)增加。然而在一个不同的实例中,病况的恶化可以包括癌症从受试者体内的一个位置转移到另一个位置。
在一些实例中,(i)来自受试者的病况的第二状态的被鉴定为包含多个定相变异的细胞游离核酸分子的总数可以高于(ii)来自受试者的病况的第一状态的被鉴定为包含多个定相变异的细胞游离核酸分子的总数至少或至多约0.1倍、至少或至多约0.2倍、至少或至多约0.3倍、至少或至多约0.4倍、至少或至多约0.5倍、至少或至多约0.6倍、至少或至多约0.7倍、至少或至多约0.8倍、至少或至多约0.9倍、至少或至多约1倍、至少或至多约2倍、至少或至多约3倍、至少或至多约4倍、至少或至多约5倍、至少或至多约6倍、至少或至多约7倍、至少或至多约8倍、至少或至多约9倍,至少或至多约10倍、至少或至多约15倍、至少或至多约20倍、至少或至多约30倍、至少或至多约40倍、至少或至多约50倍、至少或至多约60倍、至少或至多约70倍、至少或至多约80倍、至少或至多约90倍、至少或至多约100倍、至少或至多约200倍、至少或至多约300倍、至少或至多约400倍或至少或至多约500倍。
在一些实例中,(i)来自受试者的病况的第二状态的被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数可以高于(ii)来自受试者的病况的第一状态的被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数至少或至多约0.1倍、至少或至多约0.2倍、至少或至多约0.3倍、至少或至多约0.4倍、至少或至多约0.5倍、至少或至多约0.6倍、至少或至多约0.7倍、至少或至多约0.8倍、至少或至多约0.9倍、至少或至多约1倍、至少或至多约2倍、至少或至多约3倍、至少或至多约4倍、至少或至多约5倍、至少或至多约6倍、至少或至多约7倍、至少或至多约8倍、至少或至多约9倍、至少或至多约10倍、至少或至多约15倍、至少或至多约20倍、至少或至多约30倍、至少或至多约40倍、至少或至多约50倍、至少或至多约60倍、至少或至多约70倍、至少或至多约80倍、至少或至多约90倍、至少或至多约100倍、至少或至多约200倍、至少或至多约300倍、至少或至多约400倍或至少或至多约500倍。
在一些情况下,病况的进展可以是病况的消退或至少部分缓解。在一个实例中,病况的至少部分缓解可以包括癌症从晚期阶段降级到早期阶段,例如从IV期癌症到II期癌症。备选地,病况的至少部分缓解可以是癌症的完全缓解。在另一个实例中,病况的至少部分缓解可以包括实体瘤的大小(例如,体积)减小。
在一些实例中,(i)来自受试者的病况的第二状态的被鉴定为包含多个定相变异的细胞游离核酸分子的总数可以低于(ii)来自受试者的病况的第一状态的被鉴定为包含多个定相变异的细胞游离核酸分子的总数至少或至多约0.1倍、至少或至多约0.2倍、至少或至多约0.3倍、至少或至多约0.4倍、至少或至多约0.5倍、至少或至多约0.6倍、至少或至多约0.7倍、至少或至多约0.8倍、至少或至多约0.9倍、至少或至多约1倍、至少或至多约2倍、至少或至多约3倍、至少或至多约4倍、至少或至多约5倍、至少或至多约6倍、至少或至多约7倍、至少或至多约8倍、至少或至多约9倍,至少或至多约10倍、至少或至多约15倍、至少或至多约20倍、至少或至多约30倍、至少或至多约40倍、至少或至多约50倍、至少或至多约60倍、至少或至多约70倍、至少或至多约80倍、至少或至多约90倍、至少或至多约100倍、至少或至多约200倍、至少或至多约300倍、至少或至多约400倍或至少或至多约500倍。
在一些实例中,(i)来自受试者的病况的第二状态的被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数量可以低于(ii)来自受试者的病况的第一状态的被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数量至少或至多约0.1倍、至少或至多约0.2倍、至少或至多约0.3倍、至少或至多约0.4倍、至少或至多约0.5倍、至少或至多约0.6倍、至少或至多约0.7倍、至少或至多约0.8倍、至少或至多约0.9倍、至少或至多约1倍、至少或至多约2倍、至少或至多约3倍、至少或至多约4倍、至少或至多约5倍、至少或至多约6倍、至少或至多约7倍、至少或至多约8倍、至少或至多约9倍、至少或至多约10倍、至少或至多约15倍、至少或至多约20倍、至少或至多约30倍、至少或至多约40倍、至少或至多约50倍、至少或至多约60倍、至少或至多约70倍、至少或至多约80倍、至少或至多约90倍、至少或至多约100倍、至少或至多约200倍、至少或至多约300倍、至少或至多约400倍或至少或至多约500倍。
在一些情况下,在受试者的病况的两种状态之间,病况的进展可以保持基本相同。在一些实例中,(i)来自受试者的病况的第二状态的被鉴定为包含多个定相变异的细胞游离核酸分子的总数可以与(ii)来自受试者的病况的第一状态的被鉴定为包含多个定相变异的细胞游离核酸分子的总数大致相同。在一些实例中,(i)来自受试者的病况的第二状态的被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数量可以与(ii)来自受试者的病况的第一状态的被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数量大致相同。
在本文公开的任何一种方法的一些实施方案中,可以通过一种或多种测序方法从多个细胞游离核酸分子中鉴定包含多个定相变异的一个或多个细胞游离核酸分子。备选地或另外地,包含多个定相变异的一个或多个细胞游离核酸分子可以通过使用一组核酸探针从多个细胞游离核酸分子中下拉(或从其中捕获)来鉴定。通过核酸探针组的下拉(或捕获)方法可以足以鉴定一个或多个感兴趣的细胞游离核酸分子而无需测序。在一些情况下,核酸探针组可以被配置为与来自与受试者的病况相关的一个或多个基因组区域的细胞游离核酸(例如,cfDNA)分子的至少一部分杂交。因此,已被核酸探针组下拉的一个或多个细胞游离核酸分子的存在可以表明该一个或多个细胞游离核酸分子来源于该病况(例如,ctDNA或ctRNA)。核酸探针组的其他细节在本公开内容的其他地方公开。
在本文公开的任何一种方法的一些实施方案中,基于来源于获自或衍生自受试者的多个细胞游离核酸分子(例如,cfDNA)的测序数据,(i)被鉴定为包含多个定相变异的一个或多个细胞游离核酸分子可以在计算机模拟中与(ii)未被鉴定为包含多个定相变异的一个或多个其他细胞游离核酸分子(或不包含多个定相变异的一个或多个其他细胞游离核酸分子)分离。在一些情况下,方法还可以包括生成额外的数据,该额外的数据包含仅(i)被鉴定为包含多个定相变异的一个或多个细胞游离核酸分子的测序信息。在一些情况下,方法还可以包括生成不同的数据,该不同的数据包含仅(ii)未被鉴定为包含多个定相变异的一个或多个其他细胞游离核酸分子(或不包含多个定相变异的一个或多个其他细胞游离核酸分子)的测序信息。
在一个方面,本公开内容提供一种用于确定受试者的病况的方法,如图25F中的流程图2560所示。该方法可以包括(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子(过程2562)。在一些情况下,核酸探针组中的个体核酸探针可以设计为与相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异的靶细胞游离核酸分子杂交。因此,如本文所公开的,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异可以被至少一个核苷酸隔开。在一些情况下,个体核酸探针可包含可激活报告剂。可激活报告剂可以通过以下任一方式激活:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交。该方法可以还包括(b)检测被激活的报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子(过程2564)。所述一个或多个细胞游离核酸分子中的每一个可包含多个定相变异。该方法可以任选地包括(c)分析所鉴定的一个或多个细胞游离核酸分子的至少一部分以确定受试者的病况(过程2566)。
在一个方面,本公开内容提供一种用于确定受试者的病况的方法,如图25G中的流程图2570所示。该方法可以包括(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子(过程2572)。在一些情况下,核酸探针组中的个体核酸探针可以被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子杂交。在一些情况下,个体核酸探针可包含可激活报告剂。可激活报告剂可以通过以下任一方式激活:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交。该方法可以还包括(b)检测被激活的报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子(过程2574)。所述一个或多个细胞游离核酸分子中的每一个可包含多个定相变异,并且鉴定步骤的LOD可以小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个,如本文所公开的。该方法可以任选地包括(c)分析所鉴定的一个或多个细胞游离核酸分子的至少一部分,以确定受试者的病况(过程2576)。
在一些情况下,如本文公开的,多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
在一些情况下,如本文所公开的,鉴定一个或多个细胞游离核酸分子的步骤的LOD可以小于多个细胞游离核酸分子中的60,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子中的70,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的80,000个细胞游离核酸分子中的10个、小于多个细胞游离核酸分子中的90,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的100,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的150,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的200,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的300,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的400,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的500,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的600,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的700,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的800,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的900,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,000,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,000,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,100,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,200,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,300,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,400,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的1,500,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的2,000,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的2,500,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的3,000,000个细胞游离核酸分子中的1个、小于多个细胞游离核酸分子中的4,000,000个细胞游离核酸分子中的1个或小于多个细胞游离核酸分子中的5,000,000个细胞游离核酸分子中的1个。通常,具有较低LOD的检测方法具有此类检测的更高的灵敏度。
在本文公开的任何一种方法的一些实施方案中,该方法可以还包括混合(1)核酸探针组和(2)多个细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,核酸探针的可激活报告剂可在个体核酸探针与多个定相变异杂交后激活。此类核酸探针的非限制性实例可包括分子信标、eclipse探针、amplifluor探针、scorpions PCR引物和光延伸荧光PCR引物(LUX引物)。
例如,核酸探针可以是分子信标,如图26A所示。分子信标可以是荧光标记的(例如,染料标记的)寡核苷酸探针,其包含与在包含多个定相变异的区域中的靶细胞游离核酸分子2603的互补性。分子信标的长度可为约25个核苷酸至约50个核苷酸。分子信标也可以设计成部分自互补的,从而形成具有茎2601a和环2601b的发夹结构。分子信标探针的5'和3'末端可以具有形成茎结构2601a的互补序列(例如,约5-6个核苷酸)。可以将发夹的环部分2601b设计为与包含两个或更多个定相变异的靶序列的一部分(例如,约15-30个核苷酸)特异性杂交。发夹可以设计为与包含至少2、3、4、5或更多个定相变异的部分杂交。荧光报告分子可以附接到分子信标探针的5'端,淬灭荧光报告分子的荧光的淬灭剂可以附接到分子信标探针的3'端。因此,发夹的形成可以将荧光报告分子和淬灭剂聚集在一起,从而不发射荧光。然而,在获自或衍生自受试者的多个细胞游离核酸分子的扩增反应的退火操作期间,分子信标的环部分可与其靶序列结合,导致茎变性。因此,报告分子和淬灭剂可以分离,消除淬灭,并且荧光报道分子被激活而变成可检测的。因为荧光报告分子的荧光仅在探针与靶序列结合时才从分子信标探针发射,所以检测到的荧光的量或水平可以与反应中靶标的量成比例(例如,靶标的量为(i)在每个状态下被鉴定为包含多个定相变异的细胞游离核酸分子的总数量,或(ii)被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数,如本文公开的)。
在本文公开的任何一种方法的一些实施方案中,可激活报告剂可在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后被激活。换言之,一旦个体核酸探针与包含多个定相变异的靶细胞游离核酸分子的部分杂交,个体核酸探针的至少一部分与靶细胞游离核酸的去杂交可以激活可激活报告剂。此类核酸探针的非限制性实例可包括水解探针(例如,TaqMan prob)、双杂交探针和QZyme PCR引物。
例如,核酸探针可以是水解探针,如图26B所示。水解探针2611可以是荧光标记的寡核苷酸探针,其可以与靶细胞游离核酸分子2613的一部分(例如,约10至约25个核苷酸)特异性杂交,其中杂交部分包含两个或更多个定相变异。水解探针2611可以在5'端用荧光报告分子标记,在3'端用淬灭剂标记。当水解探针是完整的(例如,没有被切割)时,报告分子的荧光由于其靠近淬灭剂而被淬灭(图26B)。在获自或衍生自受试者的多个细胞游离核酸分子的扩增反应的退火操作期间,某些热稳定聚合酶(例如Taq或Tth)的5'→3'外切核酸酶活性。获自或衍生自受试者的多个细胞游离核酸分子的扩增反应可包括组合的退火/延伸操作,在该操作期间水解探针与靶细胞游离核酸分子杂交,并且热稳定聚合酶(例如,Taq或Tth)的dsDNA特异性5'→3'核酸外切酶活性从水解探针上切下荧光报告分子。结果,荧光报道分子与淬灭剂分离,产生与样品中靶标的量成比例的荧光信号(例如,靶标的量为(i)在每个状态下被鉴定为包含多个定相变异的细胞游离核酸分子的总数量,或(ii)被鉴定为包含多个定相变异的每个细胞游离核酸分子的多个定相变异的平均数,如本文公开的)。
在本文公开的任何一种方法的一些实施方案中,报告剂可以包括荧光报告分子。荧光报告分子的非限制性实例包括荧光素亚酰胺(FAM,2-[3-(二甲氨基)-6-二甲基亚氨基-呫吨-9-基]苯甲酸酯TAMRA,(2E)-2-[(2E,4E)-5-(2-叔丁基-9-乙基-6,8,8-三甲基-吡喃酮[3,2-g]喹啉-1-鎓-4-基)戊-2,4-亚二烯基]-1-(6-羟基-6-氧代-己基)-3,3-二甲基-吲哚啉-5-磺酸盐Dy750,6-羧基-2',4,4',5',7,7'-六氯荧光素,4,5,6,7-四氯荧光素TETTM,磺基罗丹明101酰基氯琥珀酰亚胺酯Texas Red-X,ALEXA染料,Bodipy染料,花青染料,罗丹明123(盐酸盐),Well RED染料,MAX和TEX 613。在一些情况下,报告剂进一步包含淬灭剂,如本文所公开的。淬灭剂的非限制性实例可包括Black Hole淬灭剂、Iowa Black淬灭剂和4-二甲氨基偶氮苯-4'-磺酰氯(DABCYL)。
在本文公开的任何一种方法的一些实施方案中,可以使用实时PCR(qPCR)进行利用核酸探针组的任何PCR反应。备选地,可以使用数字PCR(dPCR)进行利用核酸探针组的PCR反应。
提供在图24中的是基于检测个体生物样品中的循环肿瘤核酸来执行临床干预和/或治疗的过程的示例流程图。在几个实施方案中,循环肿瘤核酸的检测是通过检测细胞游离核酸样品中的同相体细胞变异来确定的。在许多实施方案中,循环肿瘤核酸的检测表明存在癌症,因此可以进行适当的临床干预和/或治疗。
参考图24,过程2400可以开始于获得、制备和测序(2401)从非侵入性活检(例如,液体或废料活检)获得的细胞游离核酸,利用在显示为含有同相发生的多个基因突变或变异的区域中的捕获测序方法。在几个实施方案中,cfDNA和/或cfRNA是从血浆、血液、淋巴液、唾液、尿液、粪便和/或其他合适的体液中提取的。细胞游离核酸可以通过任何合适的方式分离和纯化。在一些实施方案中,使用柱纯化(例如,来自德国Hilden的Qiagen的QIAamp循环核酸试剂盒)。在一些实施方案中,分离的RNA片段可被转化为互补DNA以用于进一步的下游分析。
在一些实施方案中,在癌症的任何指征之前提取活检(例如液体活检)。在一些实施方案中,提取活检以提供早期筛查以检测癌症。在一些实施方案中,提取活检以检测治疗后是否存在残留癌症。在一些实施方案中,在治疗期间提取活检以确定治疗是否提供期望的反应。可以进行任何特定癌症的筛查。在一些实施方案中,进行筛查以检测在基因组的典型区域中产生体细胞定相变异的癌症,诸如(例如)淋巴瘤。在一些实施方案中,进行筛查以检测其中利用先前提取的癌症活检发现体细胞定相变异的癌症。
在一些实施方案中,活检是从具有发展癌症的确定风险的个体(例如具有病症家族史或具有确定的风险因素(例如,暴露于致癌物)的那些)中提取的。在许多实施方案中,活检是从一般群体中的任何个体提取的。在一些实施方案中,活检是从具有较高癌症风险的特定年龄组(例如,50岁以上的老年个体)内的个体中提取的。在一些实施方案中,活检是从被诊断患有癌症并接受针对癌症的治疗的个体中提取的。
在一些实施方案中,制备提取的细胞游离核酸用于测序。因此,细胞游离核酸被转化为用于测序的分子文库。在一些实施方案中,衔接子和/或引物附着在细胞游离核酸上以促进测序。在一些实施方案中,将进行特定基因组基因座的靶向测序,并因此在测序(例如,捕获测序)之前通过杂交捕获对应于特定基因座的特定序列。在一些实施方案中,利用一组探针进行捕获测序,所述探针下拉(或捕获)已被发现通常含有针对特定癌症(例如,淋巴瘤)的定相变异的区域。在一些实施方案中,利用一组探针进行捕获测序,所述探针下拉(或捕获)已被发现含有定相变异的区域(如之前通过对癌症的活检测序所确定的)。在标题为“捕获测序”的部分中提供了捕获测序和探针的更详细讨论。
在一些实施方案中,可以利用可以检测指示循环肿瘤核酸的定相变异的任何合适的测序技术。测序技术包括(但不限于)454测序、Illumina测序、SOLiD测序、Ion Torrent测序、单端测序(single-read sequencing)、双端测序(paired-end sequencing)等。
过程2400分析(2403)细胞游离核酸测序结果以检测循环肿瘤核酸序列,如通过检测同相发生的体细胞变异所确定的。由于癌症正在积极生长和扩张,因此赘生性细胞通常将生物分子(尤其是核酸)释放到脉管系统、淋巴和/或废物系统中。此外,由于赘生性细胞局部环境的生物物理限制,赘生性细胞经常破裂,将其内部细胞内容物释放到脉管系统、淋巴和/或废物系统中。因此,有可能从液体或废料活检中检测远端原发肿瘤和/或转移瘤。
检测到循环肿瘤核酸序列表明被检查的个体中存在癌症。因此,基于循环肿瘤核酸的检测,可以进行临床干预和/或治疗(2405)。在多个实施方案中,进行临床程序,诸如(例如)血液测试、基因测试、医学成像、体格检查、肿瘤活检或其任何组合。在几个实施方案中,进行诊断以确定癌症的特定阶段。在多个实施方案中,进行治疗,诸如(例如)化学疗法、放射疗法、化学放射疗法、免疫疗法、激素疗法、靶向药物疗法、手术、移植、输血、医学监测或其任何组合。在一些实施方案中,个体由医疗专业人员(例如医生、医师、医师助理、执业护士、护士、看护人、营养师或类似人员)评估和/或治疗。
本公开内容的各种实施方案涉及利用癌症的检测来执行临床干预。在多个实施方案中,个体具有通过本文所述的方法筛选和处理的液体或废料活检,以指明个体患有癌症并且因此将进行干预。临床干预包括临床程序和治疗。临床程序包括(但不限于)血液测试、基因测试、医学成像、体格检查和肿瘤活检。治疗包括(但不限于)化学疗法、放射疗法、化学放射疗法、免疫疗法、激素疗法、靶向药物疗法、手术、移植、输血和医学监测。在几个实施方案中,进行诊断以确定癌症的特定阶段。在一些实施方案中,个体由医疗专业人员(例如医生、医师、医师助理、执业护士、护士、看护人、营养师或类似人员)评估和/或治疗。
在如本文所述的几个实施方案中,可以利用来源于血液、血清、脑脊液、淋巴液、尿液或粪便的细胞游离核酸的测序结果来检测癌症。在许多实施方案中,当测序结果具有在短基因窗口(例如细胞游离分子的长度(例如,约170bp))内同相存在的一个或多个体细胞变异时,则检测到癌症。在许多实施方案中,利用统计方法来确定定相变异的存在是否来源于癌源(与分子伪影或其他生物源相反)。各种实施方案利用Monte Carlo采样方法作为统计方法,以基于由定相变异的存在所确定的评分来确定细胞游离核酸的测序结果是否包括循环肿瘤核酸的序列。因此,在许多实施方案中,提取、处理和测序细胞游离核酸,并分析测序结果,从而检测癌症。该过程特别可用于在临床环境中提供诊断扫描。
用于个体的B细胞癌症的诊断扫描的示例性程序如下:
(a)从个体提取液体或废料活检,
(b)利用对B细胞癌症特异的核酸探针,从活检制备和进行细胞游离核酸的靶向测序,
(c)在测序结果中检测指示循环肿瘤核酸序列的定相变异,以及
(d)基于循环肿瘤核酸序列的检测进行临床干预。
先前已测序以检测特定基因组基因座中的定相变异的个体的针对癌症的个性化诊断扫描的示例性程序如下:
(a)设计和合成针对包含检测到的定相变异的位置的基因组基因座的核酸探针,
(b)从个体提取液体或废料活检,
(c)利用设计和合成的核酸探针,从活检制备和进行细胞游离核酸的靶向测序,
(d)在测序结果中检测指示循环肿瘤核酸序列的定相变异,以及
(e)基于循环肿瘤核酸序列的检测进行临床干预。
在本文公开的任何一种方法的一些实施方案中,可以进一步分析所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子的至少一部分以确定受试者的病况。在这样的分析中,(i)所鉴定的一个或多个细胞游离核酸分子和(ii)多个细胞游离核酸分子中的不包含多个定相变异的其他细胞游离核酸分子可以作为不同的变量进行分析。在一些情况下,(i)所鉴定的一个或多个细胞游离核酸分子的数量与(ii)多个细胞游离核酸分子中的不包含多个定相变异的其他细胞游离核酸分子的数量的比率可以作为一个因素用于确定受试者的病况。在一些情况下,(i)所鉴定的一个或多个细胞游离核酸分子相对于参考基因组序列的一个或多个位置和(ii)多个细胞游离核酸分子中的不包含多个定相变异的其他细胞游离核酸分子相对于参考基因组序列的一个或多个位置的比较可作为一个因素用于确定受试者的病况。
备选地,在一些情况下,用于确定受试者的病况的所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子的分析可以不并且不需要基于多个细胞游离核酸分子中的不包含多个定相变异的其他细胞游离核酸分子。如本文所公开的,包含多个定相变异的一个或多个细胞游离核酸分子的信息或特征的非限制性实例可包括(i)此类细胞游离核酸分子的总数和(ii)所鉴定的细胞游离核酸分子群体中每个核酸分子的多个定相变异的平均数。
因此,在本文公开的任何一种方法的一些实施方案中,来自已被鉴定为具有多个定相变异的一个或多个细胞游离核酸分子的多个定相变异的数量可以指示受试者的病况。在一些情况下,(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异的数量的比率可以指示受试者的病况。例如,特定病况(例如,滤泡性淋巴瘤)可以表现出不同于另一种病况(例如,乳腺癌)的特征比率。在一些实例中,对于癌症或实体瘤,如本文所公开的比率可为约0.01至约0.20。在一些实例中,对于癌症或实体瘤,如本文所公开的比率可为约0.01、约0.02、约0.03、约0.04、约0.05、约0.06、约0.07、约0.08、约0.09、约0.10、约0.11、约0.12、约0.13、约0.14、约0.15、约0.16、约0.17、约0.18、约0.19或约0.20。在一些实例中,对于癌症或实体瘤,如本文所公开的比率可以是至少或至多约0.01、至少或至多约0.02、至少或至多约0.03、至少或至多约0.04、至少或至多约0.05、至少或至多约0.06、至少或至多约0.07、至少或至多约0.08、至少或至多约0.09、至少或至多约0.10、至少或至多约0.11、至少或至多约0.12、至少或至多约0.13、至少或至多约0.14、至少或至多约0.15、至少或至多约0.16、至少或至多约0.17、至少或至多约0.18、至少或至多约0.19或至少或至多约0.20。
在本文公开的任何一种方法的一些实施方案中,已鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率可以指示受试者的病况。在一些情况下,基于本文公开的测序数据,每个所鉴定的细胞游离核酸分子内每个预定分箱长度(例如,约50个碱基对的分箱)的多个定相变异的平均频率可以指示受试者的病况。在一些情况下,基于本文公开的测序数据,与特定基因(例如,BCL2、PIM1)相关的每个所鉴定的细胞游离核酸分子内每个预定分箱长度(例如,约50个碱基对的分箱)的多个定相变异的平均频率可以指示受试者的病况。分箱的大小可以是约30、约40、约50、约60、约70或约80。
在一些实例中,第一病况(例如,霍奇金淋巴瘤或HL)可以表现出第一平均频率,而第二病况(例如,DLBCL)可以表现出不同的平均频率,从而允许鉴定和/或确定受试者是否患有或怀疑患有特定病况。在一些实例中,疾病的第一亚型可表现出第一平均频率,而同一疾病的第二亚型可表现出不同的平均频率,从而允许鉴定和/或确定受试者是否患有或怀疑患有特定亚型的疾病。例如,受试者可以患有DLBCL,并且来源于生发中心B细胞(GCB)DLBCL或激活B细胞(ABC)DLBCL的一个或多个细胞游离核酸分子可以对于每个预定的分箱长度具有多个定相变异的不同平均频率,如本文所公开的。
在一些实例中,受试者的病况可具有跨越预定基因组基因座的预定数量的定相变异(即,定相变异的预定频率)。当定相变异的预定频率与已从来自受试者的多个细胞游离核酸分子鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率匹配时,可以指示受试者有这样的病况。
在本文公开的任何一种方法的一些实施方案中,可以分析被鉴定为包含多个定相变异的一个或多个细胞游离核酸分子以确定它们的基因组起源(例如,它们来自哪个基因座))。已鉴定的一个或多个细胞游离核酸分子的基因组起源可以指示受试者的病况,因为不同的疾病可以在不同的特征基因中具有多个定相变异。例如,受试者可以具有GCBDLBCL,并且来源于受试者的GCB的一个或多个细胞游离核酸分子可以具有BCL2基因中普遍存在的定相变异,而来源于同一受试者的ABC的一个或多个细胞游离核酸分子可能不具有与来自GCB的那些一样多的在BCL2基因中的定相变异。另在一个方面,受试者可能患有ABCDLBCL,并且来源于受试者ABC的一个或多个细胞游离核酸分子可以具有PIM1基因中普遍存在的定相变异,而来源于同一受试者的GCB的一个或多个细胞游离核酸分子可能不具有与来自ABC的那些一样多的在PIM1基因中的定相变异。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%、至少或至多约50%、至少或至多约55%,至少或至多约60%,至少或至多约65%,至少或至多约70%,至少或至多约75%,至少或至多约80%,至少或至多约85%、至少或至多约90%、至少或至多约95%、至少或至多约99%或约100%可以包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少3个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少4个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少5个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少6个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少7个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少8个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少9个核苷酸的SNV。
在本文公开的任何一种方法的一些实施方案中,包含多个定相变异的一个或多个细胞游离核酸分子中的至少或至多约5%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%或至少或至多约50%可包含距相邻单核苷酸变异(SNV)至少10个核苷酸的SNV。
C.参考基因组序列
在本文公开的任何一种方法的一些实施方案中,参考基因组序列可以是核酸序列数据库(即参考基因组)的至少一部分,该数据库由遗传数据组装而成并旨在代表参考队列的基因组。在一些情况下,参考队列可以是来自特定或不同基因型、单倍型、人口统计信息、性别、国籍、年龄、种族、亲属、身体状况(例如,健康或被诊断为具有相同或不同病况,例如特定类型的癌症)或其他分组的个体集合。本文公开的参考基因组序列可以是两个或更多个个体基因组的嵌合体(mosaic)(或共有序列)。参考基因组序列可以包括公众可用的参考基因组或私有参考基因组的至少一部分。人参考基因组的非限制性实例包括hgl9、hg18、hg17、hg16和hg38。
在一些实例中,参考基因组序列可包含至少或至多约500个核碱基、至少或至多约1千碱基(kb)、至少或至多约2kb、至少或至多约3kb、至少或至多约4kb、至少或至多约5kb、至少或至多约6kb、至少或至多约7kb、至少或至多约8kb、至少或至多约9kb、至少或至多约10kb、至少或至多约20kb、至少或至多约30kb、至少或至多约40kb、至少或至多约50kb、至少或至多约60kb、至少或至多约70kb、至少或至多约80kb、至少或至多约90kb、至少或至多约100kb、至少或至多约200kb、至少或至多约300kb、至少或至多约400kb、至少或至多约500kb、至少或至多约600kb、至少或至多约700kb、至少或至多约800kb、至少或至多约900kb、至少或至多约1,000kb、至少或至多约2,000kb、至少或至多约3,000kb、至少或至多约4,000kb、至少或至多约5,000kb、至少或至多约6,000kb、至少或至多约7,000kb、至少或至多约8,000kb、至少或至多约9,000kb、至少或至多约10,000kb、至少或至多约20,000kb、至少或至多约30,000kb、至少或至多约40,000kb、至少或至多约50,000kb、至少或至多约60,000kb、至少或至多约70,000kb、至少或至多约80,000kb、至少或至多约90,000kb或至少或至多约100,000kb。
在一些情况下,参考基因组序列可以是完整的参考基因组或基因组的一部分(例如,与感兴趣的病况相关的部分)。例如,参考基因组序列可以由在某些类型的癌症下经历异常体细胞超突变的至少1、2、3、4、5或更多个基因组成。在一些情况下,参考基因组序列可以是完整的染色体序列或其片段。在一些情况下,参考基因组序列可以包含参考基因组的两个或更多个(例如,至少2、3、4、5个或更多个)彼此不相邻(例如,在同一染色体内或来自不同的染色体)的不同部分。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列可以是所选个体(例如健康个体或本文公开的任何方法的受试者)的参考基因组的至少一部分。
在一些情况下,参考基因组序列可以来源于不是受试者的个体(例如,健康对照个体)。备选地,在一些情况下,参考基因组序列可以来源于受试者的样品。在一些实例中,样品可以是受试者的健康样品。受试者的健康样品可以是任何健康的受试者细胞,例如健康的白细胞。通过将受试者的多个细胞游离核酸分子(例如,cfDNA分子)的测序数据与同一受试者的健康细胞的基因组序列的至少一部分进行比较,可以鉴定和分析包含多个定相变异的一个或多个细胞游离核酸分子,如本文所公开的。在一些实例中,样品可以是受试者的患病样品,例如患病细胞(例如,肿瘤细胞)或实体瘤。参考基因组序列可以通过对受试者患病细胞的至少一部分进行测序或通过对从受试者的实体瘤获得的多个细胞游离核酸分子进行测序而获得。一旦受试者被诊断出患有特定病况(例如,疾病),包含多个定相变异的受试者的参考基因组序列可用于确定该受试者在未来时间点是否仍表现出相同定相变异。在这种情况下,在受试者的“患病”参考基因组序列和获自或衍生自受试者的新的细胞游离核酸分子之间鉴定的任何新的定相变异可以指示在特定基因组基因座中降低程度的异常体细胞超突变(例如,至少部分缓解)。
在各种实施方案中,可以对任何赘生物类型进行诊断扫描,包括(但不限于)急性成淋巴细胞白血病(ALL)、急性髓性白血病(AML)、肛门癌、星形细胞瘤、基底细胞癌、胆管癌、膀胱癌、乳腺癌、伯基特淋巴瘤、宫颈癌、慢性淋巴细胞白血病(CLL)、慢性骨髓性白血病(CML)、慢性骨髓增生性肿瘤、结直肠癌、弥漫性大B细胞淋巴瘤、子宫内膜癌、室管膜瘤、食道癌、嗅神经母细胞瘤、尤文肉瘤、输卵管癌、滤泡性淋巴瘤、胆囊癌、胃癌、胃肠道类癌、毛细胞白血病、肝细胞癌、霍奇金淋巴瘤、下咽癌、卡波西肉瘤、肾癌、朗格汉斯细胞组织细胞增生症、喉癌、白血病、肝癌、肺癌、淋巴瘤、黑色素瘤、默克尔细胞癌、间皮瘤、口腔癌、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、骨肉瘤、卵巢癌、胰腺癌、胰腺神经内分泌肿瘤、咽癌、垂体瘤、前列腺癌、直肠癌、肾细胞癌、视网膜母细胞瘤、皮肤癌、小细胞肺癌、小肠癌、鳞状颈癌、T细胞淋巴瘤、睾丸癌、胸腺瘤、甲状腺癌、子宫癌、阴道癌和血管肿瘤。
在多个实施方案中,利用诊断扫描来提供癌症的早期检测。在一些实施方案中,诊断扫描检测患有I、II或III期癌症的个体的癌症。在一些实施方案中,诊断扫描用于检测MRD或肿瘤负荷。在一些实施方案中,诊断扫描用于确定治疗的进展(例如,发展或消退)。基于诊断扫描,可以进行临床程序和/或治疗。
D.核酸探针
在本文公开的任何一种方法的一些实施方案中,可以基于本公开内容的任何受试者参考基因组序列设计核酸探针组。在一些情况下,可以基于已通过比较(i)来自受试者的实体瘤的测序数据和(ii)来自受试者或健康队列的健康细胞的测序数据鉴定的多个定相变异来设计核酸探针组,如本文所公开的。可以基于已通过比较(i)来自受试者的实体瘤的测序数据和(ii)来自受试者的健康细胞的测序数据鉴定的多个定相变异来设计核酸探针组。可以基于已通过比较(i)来自受试者的实体瘤的测序数据和(ii)来自健康队列的健康细胞的测序数据鉴定的多个定相变异来设计核酸探针组。
在本文公开的任何一种方法的一些实施方案中,核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。如本文所公开的,当受试者患有病况时,可以确定与该病况相关的基因组基因座经历或表现出异常的体细胞超突变。备选地,核酸探针组被设计为与典型区域的序列杂交。
在本文公开的任何一种方法的一些实施方案中,核酸探针组可以设计为与表1中鉴定的至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%或约100%的基因组区域杂交。
在本文公开的任何一种方法的一些实施方案中,核酸探针组可以设计为与衍生自表1中鉴定的至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%或约100%的基因组区域的细胞游离核酸(例如,cfDNA)分子的至少一部分杂交。
在本文公开的任何一种方法的一些实施方案中,核酸探针组的每个核酸探针可与选自表6的探针序列具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%的序列同一性、至少约95%的序列同一性、至少约99%或约100%的序列同一性。
在本文公开的任何一种方法的一些实施方案中,核酸探针组可包含至少约1%、至少约2%、至少约3%、至少约4%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或约100%的表6中的探针序列。
在本文公开的任何一种方法的一些实施方案中,核酸探针组可以被设计成覆盖一个或多个靶基因组区域,该区域包含至少或至多约500个核碱基、至少或至多约1千碱基(kb)、至少或至多约2kb、至少或至多约3kb、至少或至多约4kb、至少或至多约5kb、至少或至多约6kb、至少或至多约7kb、至少或至多约8kb、至少或至多约9kb、至少或至多约10kb、至少或至多约20kb、至少或至多约30kb、至少或至多约40kb、至少或至多约50kb、至少或至多约60kb、至少或至多约70kb、至少或至多约80kb、至少或至多约90kb、至少或至多约100kb、至少或至多约200kb、至少或至多约300kb、至少或至多约400kb或至少或至多约500kb。
在本文公开的任何一种方法的一些实施方案中,一个或多个靶基因组区域的靶基因组区域(例如,靶基因组基因座)可包含至多约200个核碱基、至多约300个核碱基、400个核碱基,至多约500个核碱基、至多约600个核碱基、至多约700个核碱基、至多约800个核碱基、至多约900个核碱基、至多约1kb、至多约2kb、至多约3kb、至多约4kb、至多约5kb、至多约6kb、至多约7kb、至多约8kb、至多约9kb、至多约10kb、至多约11kb、至多约12kb、至多约13kb、至多约14kb、至多约15kb、至多约16kb、至多约17kb、至多约18kb、至多约19kb、至多约20kb、至多约25kb、至多约30kb、至多约35kb、至多约40kb、至多约45kb、至多约50kb或至多约100kb。
在本文公开的任何一种方法的一些实施方案中,核酸探针组可以包含被设计为与不同的靶核酸序列杂交的至少或至多约10个、至少或至多约20个、至少或至多约30个、至少或至多约40个、至少或至多约50个、至少或至多约60个、至少或至多约70个、至少或至多约80个、至少或至多约90个、至少或至多约约100个、至少或至多约200个、至少或至多约300个、至少或至多约400个、至少或至多约500个、至少或至多约600个、至少或至多约700个、至少或至多约800个、至少或至多约900个、至少或至多约1,000个、至少或至多约2,000个、至少或至多约3,000个、至少或至多约4,000个或至少或至多约5,000个不同的核酸探针。
在本文公开的任何一种方法的一些实施方案中,核酸探针组可以具有至少或至多约50个、至少或至多约55个、至少或至多约60个、至少或至多约65个、至少或至多约70个、至少或至多约75个、至少或至多约80个、至少或至多约85个、至少或至多约90个、至少或至多约95个或至少或至多约100个核苷酸的长度。
在一个方面,本公开内容提供包含诱饵组的组合物,该诱饵组包含本文公开的核酸探针组中的任一个。包含此类诱饵组的组合物可用于本文公开的任何方法。在一些情况下,核酸探针组可以设计为下拉(或捕获)cfDNA分子。在一些情况下,核酸探针组可以设计为下拉(或捕获)cfRNA分子。
在一些实施方案中,诱饵组可包含被设计为下拉来源于表1中列出的基因组区域的细胞游离核酸(例如,cfDNA)分子的核酸探针组。核酸探针组可被设计为下拉来源于表1中列出的至少或至多约1%、至少或至多约2%、至少或至多约3%、至少或至多约4%、至少或至多约5%、至少或至多约6%、至少或至多约7%、至少或至多约8%、至少或至多约9%、至少或至多约10%、至少或至多约15%、至少或至多约20%、至少或至多约25%、至少或至多约30%、至少或至多约35%、至少或至多约40%、至少或至多约45%、至少或至多约50%、至少或至多约55%、至少或至多约60%、至少或至多约65%、至少或至多约70%、至少或至多约75%、至少或至多约80%,至少或至多约85%、至少或至多约90%、至少或至多约95%、至少或至多约99%或约100%的基因组区域的细胞游离核酸分子。在一些情况下,核酸探针组可以被设计为下拉cfDNA分子。在一些情况下,核酸探针组可以被设计为下拉cfRNA分子。
在本文公开的任何组合物的一些实施方案中,核酸探针组中的个体核酸探针(或每个核酸探针)可包含下拉标签。下拉标签可用于富集样品(例如,包含获自或衍生自受试者的多个核酸分子的样品)的特定子集(例如,如本文公开的包含多个定相变异的细胞游离核酸分子)。
在一些情况下,下拉标签可包含核酸条形码(例如,在核酸探针的任一侧或两侧)。通过利用包含与核酸条形码具有互补性的核酸序列的珠子或基底,核酸条形码可用于下拉和富集与靶细胞游离核酸分子杂交的任何核酸探针。备选地或另外地,核酸条形码可用于从通过使用本文公开的任何核酸探针组获得的任何测序数据(例如,通过扩增的测序)鉴定靶细胞游离核酸分子。
在一些情况下,下拉标签可以包含可以被亲和结合部分特异性识别并结合的亲和靶标部分。亲和结合部分可以特异性结合亲和靶标部分以形成亲和对。在一些情况下,通过使用包含亲和结合部分的珠子或基底,亲和靶标部分可用于下拉和富集与靶细胞游离核酸分子杂交的任何核酸探针。备选地,下拉标签可包含亲和结合部分,而珠子/基底可包含亲和靶标部分。亲和对的非限制性实例可包括生物素/抗生物素蛋白、抗体/抗原、生物素/链霉抗生物素蛋白、金属/螯合剂、配体/受体、核酸和结合蛋白以及互补核酸。在一个实例中,下拉标签可以包含生物素。
在本文公开的任何组合物的一些实施方案中,待被任何主题核酸探针下拉的靶细胞游离核酸(例如,cfDNA)分子的长度可为约100个核苷酸至约200个核苷酸。靶细胞游离核酸分子的长度可为至少约100个核苷酸。靶细胞游离核酸分子的长度可为至多约200个核苷酸。靶细胞游离核酸分子的长度可为约100个核苷酸至约110个核苷酸、约100个核苷酸至约120个核苷酸、约100个核苷酸至约130个核苷酸、约100个核苷酸至约140个核苷酸、约100个核苷酸至约150个核苷酸、约100个核苷酸至约160个核苷酸、约100个核苷酸至约170个核苷酸、约100个核苷酸至约180个核苷酸、约100个核苷酸至约190个核苷酸、约100个核苷酸至约200个核苷酸、约110个核苷酸至约120个核苷酸、约110个核苷酸至约130个核苷酸、约110个核苷酸至约140个核苷酸、约110个核苷酸至约150个核苷酸、约110个核苷酸至约160个核苷酸、约110个核苷酸至约170个核苷酸、约110个核苷酸至约180个核苷酸、约110个核苷酸至约190个核苷酸、约110个核苷酸至约200个核苷酸、约120个核苷酸至约130个核苷酸、约120个核苷酸至约140个核苷酸、约120个核苷酸至约150个核苷酸、约120个核苷酸至约160个核苷酸、约120个核苷酸至约170个核苷酸、约120个核苷酸至约180个核苷酸、约120个核苷酸至约190个核苷酸、约120个核苷酸至约200个核苷酸、约130个核苷酸至约140个核苷酸、约130个核苷酸至约150个核苷酸、约130个核苷酸至约160个核苷酸、约130个核苷酸至约170个核苷酸、约130个核苷酸至约180个核苷酸、约130个核苷酸至约190个核苷酸、约130个核苷酸至约200个核苷酸、约140个核苷酸至约150个核苷酸、约140个核苷酸至约160个核苷酸、约140个核苷酸至约170个核苷酸、约140个核苷酸至约180个核苷酸、约140个核苷酸至约190个核苷酸、约140个核苷酸至约200个核苷酸、约150个核苷酸至约160个核苷酸、约150个核苷酸至约170个核苷酸、约150个核苷酸至约180个核苷酸、约150个核苷酸至约190个核苷酸、约150个核苷酸至约200个核苷酸、约160个核苷酸至约170个核苷酸、约160个核苷酸至约180个核苷酸、约160个核苷酸至约190个核苷酸、约160个核苷酸至约200个核苷酸、约170个核苷酸至约180个核苷酸、约170个核苷酸至约190个核苷酸、约170个核苷酸至约200个核苷酸、约180个核苷酸至约190个核苷酸、约180个核苷酸至约200个核苷酸或约190个核苷酸至约200个核苷酸。靶细胞游离核酸分子的长度可为约100个核苷酸、约110个核苷酸、约120个核苷酸、约130个核苷酸、约140个核苷酸、约150个核苷酸、约160个核苷酸、约170个核苷酸、约180个核苷酸、约190个核苷酸或约200个核苷酸。在一些实例中,靶细胞游离核酸分子的长度可在约100个核苷酸至约180个核苷酸的范围内。
在本文公开的任何组合物的一些实施方案中,基因组区域可以与病况相关。当受试者患有该病况时,该基因组区域可以被确定为表现出异常的体细胞超突变。例如,该病况可包括B细胞淋巴瘤或其亚型,例如弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病。下文提供了该病况的其他详细信息。
在本文公开的任何组合物的一些实施方案中,组合物进一步包含获自或衍生自受试者的多个细胞游离核酸(例如,cfDNA)分子。
E.诊断或治疗应用
许多实施方案涉及对个体的细胞游离核酸进行诊断扫描,然后基于指示癌症的扫描结果,进行进一步的临床程序和/或治疗个体。根据各种实施方案,可以检测多种类型的肿瘤。
在本文公开的任何一种方法的一些实施方案中,方法可以包括基于包含多个定相变异的分子的一个或多个细胞游离核酸确定受试者患有病况或确定受试者的病况的程度或状态。在一些情况下,方法可以还包括基于统计模型分析(即分子分析)确定一个或多个细胞游离核酸分子(各自被鉴定为包含多个定相变异)来源于与病况(例如,癌症)相关的样品。例如,方法可以包括使用一种或多种算法(例如Monte Carlos模拟)来确定细胞游离核酸被鉴定为具有与第一病况相关或来源于第一病况的多个定相变异的第一概率(例如,80%)和相同细胞游离核酸与第二病况相关或来源于第二病况(或来自健康细胞)的第二概率(例如,20%)。在一些情况下,方法可以包括基于对各自被鉴定为包含多个定相变异的一个或多个细胞游离核酸分子的分析(即,宏观或全局分析)来确定受试者患有一种或多种病况的可能性或概率。例如,方法可以包括使用一种或多种算法(例如,包括一种或多种如本文公开的数学模型,例如二项式采样)来分析各自被鉴定为包含多个定相变异的多个细胞游离核酸分子,从而确定受试者患有第一病况的第一概率(例如,80%)和受试者患有第二病况(或是健康的)的第二概率(例如,20%)。
如本文所公开的统计模型分析可以是通过数值近似法(例如二项式模型、三元模型、Monte Carlo模拟或有限差分方法)的近似解。在一个实例中,本文使用的统计模型分析可以是Monte Carlo统计分析。在另一个实例中,本文使用的统计模型分析可以是二项式或三元模型分析。
在本文公开的任何一种方法的一些实施方案中,方法可以包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的病况的进展,使得所鉴定的细胞游离核酸分子中的每一个包含多个定相变异。在一些情况下,如本公开内容中所述的,病况的进展可以是病况的恶化(例如,从I期癌症发展为III期癌症)。在一些情况下,如本公开内容中所述的,病况的进展可以是病况的至少部分缓解(例如,从IV期癌症降期至II期癌症)。备选地,在一些情况下,如本公开内容中所述的,在两个不同的时间点之间,病况的进展可以保持基本相同。在一个实例中,方法可以包括确定受试者的病况的不同进展的可能性或概率。例如,方法可以包括使用一种或多种算法(例如,包括如本文公开的一种或多种数学模型,例如二项式采样)来确定受试者的病况比以前更差的第一概率(例如,20%)、病况的至少部分缓解的第二概率(例如,70%)以及受试者的病况与以前相同的第三概率(例如,10%)。
在本文公开的任何一种方法的一些实施方案中,方法可包括进行不同的程序(例如,随访诊断程序)以确认受试者的病况,该病况已被确定和/或监测其进展,如本公开内容中所提供的。不同程序的非限制性实例可包括体格检查、医学成像、基因测试、乳房X光检查、内窥镜检查、粪便取样、宫颈刮片检查、甲胎蛋白血液测试、CA-125测试、前列腺特异性抗原(PSA)测试、活检提取、骨髓穿刺和肿瘤标志物检测测试。医学成像包括(但不限于)X射线、磁共振成像(MRI)、计算机断层扫描(CT)、超声和正电子发射断层扫描(PET)。内窥镜检查包括(但不限于)支气管镜检查、结肠镜检查、阴道镜检查、膀胱镜检查、食道镜检查、胃镜检查、腹腔镜检查、神经内窥镜检查、直肠镜检查和乙状结肠镜检查。
在本文公开的任何一种方法的一些实施方案中,方法可以包括基于所鉴定的一个或多个细胞游离核酸分子确定针对受试者的病况的治疗,每个所鉴定的细胞游离核酸分子包含多个定相变异。在一些情况下,治疗可以基于(i)确定的受试者的病况和/或(ii)确定的受试者的病况的进展来确定。此外,治疗可以基于以下的一个或多个附加因素来确定:受试者的性别、国籍、年龄、种族和其他身体状况。在一些实例中,如本文所公开的,可以基于所鉴定的细胞游离核酸分子的多个定相变异的一种或多种特征来确定治疗。
在本文公开的任何一种方法的一些实施方案中,受试者可能尚未接受针对该病况的任何治疗,例如,该受试者可能尚未被诊断出患有病况(例如,淋巴瘤)。在本文公开的任何一种方法的一些实施方案中,受试者可以在本公开内容的任何主题方法之前接受针对病况的治疗。在一些情况下,可以执行本文公开的方法以监测受试者已被诊断患有的病况的进展,从而(i)确定先前治疗的功效和(ii)评估是否保持治疗、修改治疗或取消治疗以支持新治疗。
在本文公开的任何一种方法的一些实施方案中,治疗(例如,先前治疗、待基于本公开内容的方法确定的新治疗等)的非限制性实例可包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法(例如嵌合抗原受体(CAR)T细胞疗法、CAR NK细胞疗法、修饰性T细胞受体(TCR)T细胞疗法等)、激素疗法、靶向药物疗法、手术、移植、输血或医疗监测。
在本文公开的任何一种方法的一些实施方案中,病况可包括疾病。在本文公开的任何一种方法的一些实施方案中,病况可包括赘生物、癌症或肿瘤。在一个实例中,病况可以包括实体瘤。在另一个实例中,病况可以包括淋巴瘤,例如B细胞淋巴瘤(BCL)。BCL的非限制性实例可包括弥漫性大B细胞淋巴瘤(DLBCL)、滤泡性淋巴瘤(FL)、伯基特淋巴瘤(BL)、B细胞慢性淋巴细胞白血病(CLL)、边缘区B细胞淋巴瘤(MZL)和套细胞淋巴瘤(MCL)。
如本文所公开的,对受试者的病况的治疗可以包括向受试者施用一种或多种治疗剂。一种或多种治疗药物可以通过以下中的一种或多种方式施用至受试者:口服、腹膜内、静脉内、动脉内、透皮、肌内、脂质体、经由导管或支架的局部递送、皮下、脂肪内和鞘内。
治疗药物的非限制性实例可包括细胞毒性剂、化学治疗剂、生长抑制剂、用于放射治疗的药剂、抗血管生成剂、凋亡剂、抗微管蛋白剂和用于治疗癌症的其他药剂,例如抗CD20抗体、抗PD1抗体(例如派姆单抗)、血小板衍生生长因子抑制剂(例如GLEEVECTM(甲磺酸伊马替尼))、COX-2抑制剂(例如塞来昔布)、干扰素、细胞因子、结合以下靶标中的一种或多种的拮抗剂(例如、中和抗体):PDGFR-β、BlyS、APRIL、BCMA受体、TRAIL/Apo2,其他生物活性和有机化学药剂等。
细胞毒性剂的非限制性实例可包括放射性同位素(例如At211、I131、I125、Y90、Re186、Re188、Sm153、Bi212、P32以及Lu的放射性同位素)、化学疗法剂,例如甲氨蝶呤、阿霉素、长春花生物碱(长春新碱、长春碱、依托泊苷)、多柔比星、美法仑、丝裂霉素C、苯丁酸氮芥、道诺霉素或其他嵌入剂、酶及其片段,例如核溶解酶、抗生素和细菌、真菌、植物或动物来源的毒素例如小分子毒素或酶促毒素。
化学治疗剂的非限制性实例可包括烷基化剂,例如噻替哌和环磷酰胺;烷基磺酸盐,例如白消安、英丙舒凡和哌泊舒凡;氮丙啶类,例如苯佐替哌、卡波醌、美妥替哌和乌瑞替哌;亚乙烯亚胺和甲基三聚氰胺,包括六甲蜜胺、三亚乙基三聚氰胺、三亚乙基磷酰胺、三亚乙基硫代磷酰胺和三羟甲基三聚氰胺;多聚乙酰(尤其是布拉他辛和布拉他西酮);δ-9-四氢大麻酚(屈大麻酚、);β-拉帕醌;拉帕醇;秋水仙碱;桦木酸;喜树碱(包括合成类似物托泊替康CPT-11(伊立替康、)、乙酰喜树碱、scopolectin和9-氨基喜树碱);苔藓抑素;卡司他丁;CC-1065(包括其阿多来新、卡折来新和比折来新合成类似物);鬼臼毒素;鬼臼酸;替尼泊苷;念珠藻素(特别是念珠藻素1和念珠藻素8);多拉司他汀;倍癌霉素(包括合成类似物KW-2189和CB1-TM1);eleutherobin;水鬼蕉碱;sarcodictyin;spongistatin;氮芥,如苯丁酸氮芥、萘氮芥、cyclophosphamide、雌莫司汀、异环磷酰胺、二氯甲基二乙胺、盐酸氧氮芥、美法仑、新氮芥、苯芥胆甾醇、泼尼莫司汀、曲磷胺、尿嘧啶氮芥;亚硝基脲,如卡莫司汀、氯脲菌素、福莫司汀、洛莫司汀、尼莫司汀和雷莫司汀;抗生素,如烯二炔抗生素;dynemicin,包括dynemicin A;埃斯佩拉霉素;以及新制癌菌素发色团和相关的发色蛋白烯二炔抗生素发色团)、aclacinomycin、放线菌素、authramycin、重氮丝氨酸、博来霉素、放线菌素C、carabicin、去甲柔红霉素、嗜癌霉素、色霉素、更生霉素、柔红霉素、地托比星、6-重氮基-5-氧代-L-正亮氨酸、多柔比星(包括吗啉代多柔比星、氰基吗啉代多柔比星、2-吡咯啉-多柔比星和脱氧多柔比星)、表柔比星、依索比星、伊达比星、麻西罗霉素、丝裂霉素例如丝裂霉素C、霉酚酸、诺加霉素、橄榄霉素、培洛霉素、potfiromycin、嘌罗霉素、三铁阿霉素、罗多比星、链黑霉素、链脲佐菌素、杀结核菌素、乌苯美司、新制癌菌素、佐柔比星;抗代谢物,如甲氨蝶呤和5-氟尿嘧啶(5-FU);叶酸类似物,如二甲叶酸、甲氨蝶呤、蝶罗呤、三甲曲沙;嘌呤类似物,如氟达拉滨、6-巯基嘌呤、硫咪嘌呤、硫鸟嘌呤;嘧啶类似物,如安西他滨、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、二脱氧尿苷、去氧氟尿苷、依诺他滨、氟尿苷;雄激素,例如卡甾酮、丙酸屈莫他酮、表甾烷醇、美皮司坦、睾酮内酯;抗肾上腺素,如氨鲁米特、米托坦、曲洛司坦;叶酸补充剂,如叶酸;醋葡醛内酯;醛磷酰胺糖苷;氨基乙酰丙酸;恩尿嘧啶;安吖啶;bestrabucil;比生群;edatraxate;defofamine;秋水仙胺;地吖醌;eflornithine;依利醋铵;埃坡霉素;依托格鲁;硝酸镓;羟基脲;香菇多糖;lonidainine;类美登素,如美登素和安丝菌素;米托胍腙;米托蒽醌;mopidanmol;nitraerine;喷司他丁;蛋氨氮芥;吡柔比星;洛索蒽醌;2-乙基酰肼;丙卡巴肼;多糖复合物(JHS Natural Products,Eugene,Oreg.);雷佐生;根霉素;西佐喃;螺旋锗;细格孢氮杂酸;三亚胺醌;2,2',2"-三氯三乙胺;单端孢霉烯(特别是T-2毒素、verracurin A、杆孢菌素A和anguidine);乌拉坦;长春地辛达卡巴嗪;甘露莫司汀;二溴甘露醇;二溴卫矛醇;哌泊溴烷;gacytosine;阿糖胞苷(“Ara-C”);噻替派;紫杉烷类,例如紫杉烷,包括紫杉醇(Bristol-Myers Squibb Oncology,Princeton,N.J.)、ABRAXANETMCremophor-free、紫杉醇的白蛋白工程化纳米颗粒制剂(American Pharmaceutical Partners,Schaumberg,Ill.)和多西紫杉醇(-Poulenc Rorer,Antony,France);苯丁酸氮芥;吉西他滨6-硫鸟嘌呤;巯基嘌呤;甲氨蝶呤;铂类似物,如顺铂和卡铂;长春碱铂;依托泊苷(VP-16);异环磷酰胺;米托蒽醌;长春新碱奥沙利铂;leucovovin;长春瑞滨诺消灵;依达曲沙;道诺霉素;氨基蝶呤;伊班膦酸盐;拓扑异构酶抑制剂RFS2000;二氟甲基鸟氨酸(DMFO);维甲酸类,例如视黄酸;卡培他滨上述任何一种的药学上可接受的盐、酸或衍生物;以及上述两种或更多种的组合,例如CHOP(环磷酰胺、多柔比星、长春新碱和泼尼松龙的组合治疗的缩写),和FOLFOX(使用与5-FU和leucovovin组合的奥沙利铂(ELOXATINTM)的治疗方案的缩写)。
化学治疗剂的实例还可以包括“抗激素剂”或“内分泌治疗剂”,其用于调节、减少、阻断或抑制可促进癌症生长的激素的作用,并且通常呈系统或全身治疗的形式。它们可能是激素本身。实例包括抗雌激素和选择性雌激素受体调节剂(SERM),包括例如他莫昔芬(包括他莫昔芬)、雷洛昔芬、屈洛昔芬、4-羟基他莫昔芬、曲沃昔芬、keoxifene、LY117018、奥那司酮和托瑞米芬;抗孕酮;雌激素受体下调剂(ERD);用于抑制或关闭卵巢的药剂,例如促黄体激素释放激素(LHRH)激动剂,如和ELIGARD)醋酸亮丙瑞林、醋酸戈舍瑞林、醋酸布舍瑞林和tripterelin;其它抗雄激素,如氟他胺、尼鲁米特和比卡鲁胺;和抑制调节肾上腺中的雌激素产生的芳香酶的芳香酶抑制剂,例如4(5)-咪唑、氨鲁米特、醋酸甲地孕酮、依西美坦、formestanie、法倔唑、伏氯唑、来曲唑和阿那曲唑此外,化学治疗剂的这种定义包括二膦酸盐,例如氯膦酸盐(例如)、依替膦酸盐、NE-58095、唑来膦酸/唑来膦酸盐、阿伦膦酸盐、帕米膦酸盐、替鲁膦酸或利塞膦酸酯;以及曲沙他滨(1,3-二氧戊环核苷胞嘧啶类似物);反义寡核苷酸,特别是抑制与异常细胞增殖有关的信号传导通路中的基因表达的那些,例如PKC-α、Raf、H-Ras和表皮生长因子受体(EGFR);疫苗,如疫苗和基因治疗疫苗,例如疫苗、疫苗和疫苗;拓扑异构酶1抑制剂;rmRH;拉帕替尼二甲苯磺酸盐(ErbB-2和EGFR双酪氨酸激酶小分子抑制剂,也称为GW572016);以及任何上述物质的药学上可接受的盐、酸或衍生物。
化学治疗剂的实例还可包括抗体,例如阿仑单抗(Campath)、贝伐单抗(AVASTIN@Genentech);西妥昔单抗(ERBITUX@Imclone);帕尼单抗(VECTIBIX@Amgen)、利妥昔单抗(RITUXAN@Genentech/Biogen Idec)、培妥珠单抗(OMNITARG@2C4,Genentech)、曲妥珠单抗(HERCEPTIN@Genentech)、托西莫单抗(Bexxar,Corixia)和抗体药物缀合物,吉妥珠单抗奥佐米星(MYLOTARG@Wyeth)。与本发明化合物组合的、具有作为化学疗法剂的治疗潜力的其它人源化单克隆抗体包括:阿泊珠单抗、阿塞珠单抗、atlizumab、巴品珠单抗、bivatuzumabmertansine、cantuzumab mertansine、西利珠单抗、赛妥珠单抗、cidfusituzumab、cidtuzumab、达克珠单抗、依库利珠单抗、依法利珠单抗、依帕珠单抗、厄利珠单抗、泛维珠单抗、芳妥珠单抗、吉妥珠单抗奥佐米星、inotuzumab ozogamicin、易普利单抗、拉贝珠单抗、林妥珠单抗、马妥珠单抗、美泊利单抗、莫维珠单抗、motovizumab、那他珠单抗、尼妥珠单抗、nolovizumab、numavizumab、ocrelizumab、奥玛珠单抗、帕利珠单抗、帕考珠单抗、pecfusituzumab、pectuzumab、培克珠单抗、ralivizumab、兰尼单抗、reslivizumab、瑞利珠单抗、resyvizumab、罗维珠单抗、鲁利单抗、西罗珠单抗、西利珠单抗、索土珠单抗、tacatuzumab tetraxetan、tadocizumab、他利珠单抗、tefibazumab、托珠单抗、托利珠单抗、tucotuzumab celmoleukin、tucusituzumab、umavizumab、乌珠单抗、ustekinumab、维西珠单抗和抗-白细胞介素-12(ABT-874/J695,Wyeth Research and AbbottLaboratories),其为排他性地为重组的人序列、全长IgG1λ抗体,经遗传修饰识别白细胞介素-12p40蛋白质。
化学疗法剂的实例还可以包括“酪氨酸激酶抑制剂”,例如EGFR靶向剂(例如,小分子、抗体等);小分子HER2酪氨酸激酶抑制剂例如可自Takeda获得的TAK165;CP-724,714,ErbB2受体酪氨酸激酶的口服选择性抑制剂(Pfizer和OSI);双HER抑制剂例如EKB-569(可自Wyeth获得),其优先结合EGFR但抑制HER2和EGFR过表达细胞;拉帕替尼(GSK572016;可得自Glaxo-SmithKline),口服HER2和EGFR酪氨酸激酶抑制剂;PKI-166(可得自Novartis);pan-HER抑制剂,例如canertinib(CI-1033;Pharmacia);Raf-1抑制剂,例如可得自ISISPharmaceuticals的反义剂ISIS-5132,其抑制Raf-1信号传导;非HER靶向TK抑制剂,例如甲磺酸伊马替尼(可得自Glaxo SmithKline);多靶点酪氨酸激酶抑制剂例如舒尼替尼(可得自Pfizer);VEGF受体酪氨酸激酶抑制剂例如瓦他拉尼(PTK787/ZK222584,可得自Novartis/Schering AG);MAPK细胞外调节激酶I抑制剂CI-1040(可得自Pharmacia);喹唑啉类,例如PD 153035,4-(3-氯苯胺基)喹唑啉;吡啶并嘧啶类;嘧啶并嘧啶类;吡唑并嘧啶类,例如CGP59326、CGP 60261和CGP 62706;吡唑并嘧啶类,4-(苯基氨基)-7H-吡唑并[2,3-d]嘧啶类;姜黄素(阿魏酰甲烷(diferuloyl methane),4,5-双(4-氟苯胺基)邻苯二甲酰亚胺);含有硝基噻吩部分的酪氨酸磷酸酯类;PD-0183805(Warner-Lamber);反义分子(例如结合编码HER的核酸的那些);喹喔啉类(美国专利第5,804,396号);tryphostins(美国专利第5,804,396号);ZD6474(Astra Zeneca);PTK-787(Novartis/Schering AG);泛-HER抑制剂例如CI-1033(Pfizer);Affinitac(ISIS 3521;Isis/Lilly);甲磺酸伊马替尼PKI 166(Novartis);GW2016(GlaxoSmithKline);CI-1033(Pfizer);EKB-569(Wyeth);Semaxinib(Pfizer);ZD6474(AstraZeneca);PTK-787(Novartis/Schering AG);INC-1C11(Imclone);和雷帕霉素(西罗莫司,)。
化学治疗剂的实例还可以包括地塞米松、干扰素、秋水仙碱、美托品、环孢菌素、两性霉素、甲硝唑、阿仑单抗、阿利维A酸、别嘌呤醇、氨磷汀、三氧化二砷、天冬酰胺酶、活卡介苗、贝伐珠单抗、贝沙罗汀、克拉屈滨、氯法巴明、达比泊汀α、地尼白介素、右雷佐生、阿法依泊汀、厄洛替尼、非格司亭、乙酸组氨瑞林、替伊莫单抗、干扰素α-2a、干扰素α-2b、来那度胺、左旋咪唑、美司钠、甲氧沙林、诺龙、奈拉滨、诺菲妥珠单抗、奥普瑞白介素、帕利夫明、帕米膦酸盐、培加酶、培门冬酶、培非格司亭、培美曲塞二钠、普拉霉素、卟吩姆钠、奎纳克林、拉布立酶、沙莫司亭、替莫唑胺、VM-26、6-TG、托瑞米芬、维A酸、ATRA、戊柔比星、唑来膦酸盐和唑来膦酸及其药学上可接受的盐。
化学治疗剂的实例还可以包括氢化可的松、乙酸氢化可的松、乙酸可的松、替可的松匹伐酯、曲安奈德、triamcinolonealcohol、莫米松、安西奈德、布地奈德、地奈德、氟轻松、氟西奈德、倍他米松、倍他米松磷酸钠、地塞米松、地塞米松磷酸钠、氟可龙、氢化可的松-17-丁酸酯、氢化可的松-17-戊酸酯、二丙酸阿氯米松、戊酸倍他米松、二丙酸倍他米松、泼尼卡酯、氯倍他松-17-丁酸酯、氯倍他松-17-丙酸酯、己酸氟可龙、特戊酸氟可龙和乙酸氟泼尼定;免疫选择性抗炎肽(ImSAID)例如苯丙氨酸-谷氨酰胺-甘氨酸(FEG)及其D-异构体形式(feG)(IMULAN BioTherapeutics,LLC);抗风湿药物例如硫唑嘌呤、环孢菌素(环孢霉素A)、D-青霉胺、金盐、羟氯喹,来氟米特、米诺环素、柳氮磺吡啶、肿瘤坏死因子α(TNFα)阻断剂例如依那西普英夫利昔单抗阿达木单抗赛妥珠单抗戈利木单抗白细胞介素1(IL-1)阻断剂例如阿那白滞素T细胞共刺激阻断剂例如阿巴西普白细胞介素6(IL-6)阻断剂例如托珠单抗白细胞介素13(IL-13)阻断剂例如雷贝珠单抗;干扰素α(IFN)阻断剂例如罗利珠单抗;β7整合素阻断剂例如rhuMAb Beta7;IgE途径阻断剂例如抗-M1 prime;分泌的同源三聚体LTa3和膜结合异源三聚体LTa1/β2阻断剂例如抗淋巴毒素α(LTa);各种研究性药剂例如thioplatin、PS-341、苯丁酸盐、ET-18-OCH3或法尼基转移酶抑制剂(L-739749、L-744832);多酚,例如槲皮素、白藜芦醇、白皮杉醇、表没食子儿茶素没食子酸酯、茶黄素、黄烷醇、原花青素、桦木酸及其衍生物;自噬抑制剂例如氯喹;δ-9-四氢大麻酚(屈大麻酚,);β-拉帕醌;拉帕醇;秋水仙碱;桦木酸;乙酰喜树碱(乙酰基camptothecin)、莨菪亭和9-氨基喜树碱;鬼臼毒素;替加氟贝沙罗汀二膦酸盐例如氯膦酸盐(例如,)、依替膦酸盐NE-58095、唑来膦酸/唑来膦酸盐阿仑膦酸盐帕米膦酸盐替鲁膦酸或利塞膦酸盐和表皮生长因子受体(EGF-R);疫苗例如疫苗;哌立福辛(perifosine)、COX-2抑制剂(例如塞来昔布或依托考昔)、蛋白酶体抑制剂(例如PS341);CCI-779;替吡法尼(R11577);奥拉非尼、ABT510;Bcl-2抑制剂,例如奥美林钠吡虫啉酮;法尼基转移酶抑制剂,例如拉那非尼(SCH 6636,SARASARTM);和任何上述药剂的药学上可接受的盐、酸或衍生物;以及上述两种或更多种药剂的组合。
根据许多实施方案,一旦指示癌症的诊断,就可以进行多种治疗,包括(但不限于)手术、切除术、化学疗法、放射疗法、免疫疗法、靶向疗法、激素疗法、干细胞移植和输血。在一些实施方案中,施用抗癌剂和/或化学疗法剂,包括(但不限于)烷基化剂、铂剂、紫杉烷类、长春花剂、抗雌激素药物、芳香酶抑制剂、卵巢抑制剂、内分泌/激素剂、双膦酸盐治疗剂和靶向生物治疗剂。药物包括(但不限于)环磷酰胺、氟尿嘧啶(或5-氟尿嘧啶或5-FU)、甲氨蝶呤、噻替哌、卡铂、顺铂、紫杉烷、紫杉醇、蛋白结合紫杉醇、多西紫杉醇、长春瑞滨、他莫昔芬、雷洛昔芬、托瑞米芬、氟维司群、吉西他滨、伊立替康、伊沙匹隆、替莫唑胺、托泊替康、长春新碱、长春碱、艾日布林、突变霉素、卡培他滨、希罗达、阿那曲唑、依西美坦、来曲唑、亮丙瑞林、阿巴瑞克、布舍瑞林、戈舍瑞林、醋酸甲地孕酮、利塞膦酸钠、帕米磷酸二钠、埃本膦酸钠、阿仑膦酸钠、唑来磷酸、拉帕替尼、道诺霉素、多柔比星、表柔比星、伊达比星、戊柔比星米托蒽醌、贝伐单抗、西妥昔单抗、伊匹单抗、ado-trastuzumab emtansine、阿法替尼、阿地白介素、阿雷替尼、阿仑单抗、阿特珠单抗、avelumab、axtinib、贝利单抗、贝利司他、贝伐单抗、博纳吐单抗、硼替佐米、博舒替尼、本妥昔单抗、布加替尼、卡博替尼、康纳单抗、卡非佐米、certinib、西妥昔单抗、考比替尼、克唑替尼、达拉菲尼、达雷木单抗、达沙替尼、地诺单抗、dinutuximab、durvalumab、埃罗妥珠单抗、enasidenib、埃罗替尼、依维莫司、吉非替尼、替伊莫单抗、依鲁替尼、idelalisib、伊马替尼、伊匹单抗、伊沙佐米、拉帕替尼、乐伐替尼、米哚妥林、耐昔妥珠单抗、来那替尼、尼罗替尼、尼拉帕尼、纳武单抗、obinutuzumab、奥法木单抗、奥拉帕尼、olaratumab、奥希替尼、帕博西尼、帕尼单抗、帕比司他、派姆单抗、帕妥珠单抗、帕纳替尼、雷莫芦单抗、瑞戈非尼、瑞博西尼、利妥昔单抗、罗米地辛、卢卡帕尼、鲁索替尼、司妥昔单抗、西普鲁塞-T、索尼德吉、索拉非尼、替西罗莫司、托珠单抗、托法替尼、托西莫单抗、曲美替尼、曲妥珠单抗、凡德他尼、维罗非尼、维奈托克、vismodegib、伏立诺他和雷莫芦单抗。根据各种实施方案,可以通过本文所述的单一药物或药物组合治疗个体。常见的治疗组合是环磷酰胺、甲氨蝶呤和5-氟尿嘧啶(CMF)。
在本文公开的任何一种方法的一些实施方案中,任何细胞游离核酸分子(例如,cfDNA、cfRNA)可以来源于细胞。例如,细胞样品或组织样品可以从受试者获得并进行处理以从样品中去除所有细胞,从而产生来源于样品的细胞游离核酸分子。
在本文公开的任何一种方法的一些实施方案中,参考基因组序列可以来源于个体的细胞。个体可以是健康对照或接受本文公开的用于确定或监测病况的进展的方法的受试者。
细胞可以是健康细胞。备选地,细胞可以是患病细胞。患病细胞可以具有改变的代谢、基因表达和/或形态特征。患病细胞可以是癌细胞、糖尿病细胞和凋亡细胞。患病细胞可以是来自患病受试者的细胞。示例性疾病可包括血液病、癌症、代谢病、眼病、器官病、肌肉骨骼病、心脏病等。
细胞可以是哺乳动物细胞或来源于哺乳动物细胞。细胞可以是啮齿动物细胞或来源于啮齿动物细胞。细胞可以是人细胞或来源于人细胞。细胞可以是原核细胞或来源于原核细胞。细胞可以是细菌细胞或可以来源于细菌细胞。细胞可以是古细菌细胞或来源于古细菌细胞。细胞可以是真核细胞或来源于真核细胞。细胞可以是多能干细胞。细胞可以是植物细胞或来源于植物细胞。细胞可以是动物细胞或来源于动物细胞。细胞可以是无脊椎动物细胞或来源于无脊椎动物细胞。细胞可以是脊椎动物细胞或来源于脊椎动物细胞。细胞可以是微生物细胞或来源于微生物细胞。细胞可以是真菌细胞或来源于真菌细胞。细胞可以来自特定器官或组织。
细胞的非限制性实例可包括淋巴细胞,例如B细胞、T细胞(细胞毒性T细胞、天然杀伤T细胞、调节性T细胞、T辅助细胞)、天然杀伤细胞、细胞因子诱导的杀伤(CIK)细胞;髓样细胞,例如粒细胞(嗜碱性粒细胞、嗜酸性粒细胞、嗜中性粒细胞/分叶过多嗜中性粒细胞)、单核细胞/巨噬细胞、红细胞(网织红细胞)、肥大细胞、血小板/巨核细胞、树突状细胞;来自内分泌系统的细胞,包括甲状腺(甲状腺上皮细胞、滤泡旁细胞)、甲状旁腺(甲状旁腺主细胞、嗜酸性细胞)、肾上腺(嗜铬细胞)、松果体(松果腺细胞)细胞;神经系统细胞,包括神经胶质细胞(星形胶质细胞、小胶质细胞)、大细胞神经分泌细胞、星状细胞、Boettcher细胞和垂体(促性腺激素细胞、促肾上腺皮质激素细胞、促甲状腺素细胞、促生长激素细胞、催乳激素细胞);呼吸系统的细胞,包括肺细胞(I型肺细胞、II型肺细胞)、克拉拉细胞、杯状细胞、噬尘细胞;循环系统的细胞,包括心肌细胞、周细胞;消化系统细胞,包括胃(胃主细胞、壁细胞)、杯状细胞、潘氏细胞、G细胞、D细胞、ECL细胞、I细胞、K细胞、S细胞;肠内分泌细胞,包括肠嗜铬细胞、APUD细胞、肝脏(肝细胞、枯否细胞)、软骨/骨/肌肉;骨细胞,包括成骨细胞、骨细胞、破骨细胞、牙齿(成牙骨质细胞、成釉细胞);软骨细胞,包括成软骨细胞、软骨细胞;皮肤细胞,包括毛细胞(Trichocyte)、角质细胞、黑色素细胞(痣细胞);肌肉细胞,包括肌细胞;泌尿系统细胞,包括足状突细胞、肾小球旁细胞、肾小球内系膜细胞/肾小球外系膜细胞、肾近端小管刷状缘细胞、致密斑细胞;生殖系统细胞,包括精子、支持细胞、Leydig细胞,卵子;以及其他细胞,包括脂肪细胞、成纤维细胞、腱细胞、表皮角质细胞(分化表皮细胞)、表皮基底细胞(干细胞)、指甲和脚趾甲的角质细胞、甲床基底细胞(干细胞)、髓质毛干细胞、皮质毛干细胞、表皮毛干细胞、表皮毛根鞘细胞、Huxley层的毛根鞘细胞、Henle层的毛根鞘细胞、外毛根鞘细胞、毛基质细胞(干细胞)、湿分层屏障上皮细胞,角膜、舌、口腔、食管、肛管、远端尿道和阴道的分层鳞状上皮的表面上皮细胞,角膜、舌、口腔、食管、肛管、远端尿道和阴道上皮的基底细胞(干细胞),泌尿上皮细胞(衬里膀胱和尿管)、外分泌分泌上皮细胞、唾液腺粘液细胞(富含多糖的分泌)、唾液腺浆液细胞(富含糖蛋白酶的分泌)、舌中的Von Ebner腺细胞(洗味蕾)、乳腺细胞(乳汁分泌)、泪腺细胞(泪液分泌)、耳中的盯聍腺细胞(蜡分泌)、外分泌汗腺暗细胞(糖蛋白分泌)、外分泌汗腺透明细胞(小分子分泌)、顶泌汗腺细胞(气味分泌,对性激素敏感)、眼睑中的莫耳腺细胞(特化的汗腺)、皮脂腺细胞(富含脂质的皮脂分泌)、鼻中的鲍曼腺细胞(洗涤嗅觉上皮)、十二指肠中的布伦纳氏腺细胞(酶和碱性粘液)、精囊细胞(分泌精液成分,包括用于游泳精子的果糖)、前列腺细胞(分泌精液成分)、尿道球腺细胞(粘液分泌)、前庭大腺细胞(阴道润滑液分泌)、利特雷氏腺细胞(粘液分泌)、子宫内膜细胞(碳水化合物分泌)、分离的呼吸道和消化道的杯状细胞(粘液分泌)、胃壁粘液细胞(粘液分泌)、胃腺酶原细胞(胃蛋白酶原分泌)、胃腺泌酸细胞(盐酸分泌)、胰腺腺泡细胞(碳酸氢盐和消化酶分泌)、小肠的潘氏细胞(溶菌酶分泌)、肺的II型肺细胞(表面活性物质分泌)、肺的克拉拉细胞、激素分泌细胞、垂体前叶细胞、促生长激素细胞(Somatotropes)、促乳素细胞、促甲状腺素细胞、促性腺激素细胞、促肾上腺皮质激素细胞、中间垂体细胞、巨细胞神经分泌细胞、肠道和呼吸道细胞、甲状腺细胞、甲状腺上皮细胞、滤泡旁细胞、甲状旁腺细胞、甲状旁腺主细胞、嗜酸性细胞、肾上腺细胞、嗜铬细胞、睾丸的莱氏细胞、卵泡内膜细胞、破裂卵泡的黄体细胞、粒状叶黄素细胞、膜叶黄素细胞、肾小球旁细胞(肾素分泌)、肾的致密斑细胞、代谢和储存细胞、屏障功能细胞(肺、肠道、外分泌腺和泌尿生殖道)、肾脏、I型肺细胞(衬里肺的空气空间)、胰管细胞(泡心细胞)、无纹状导管细胞(汗腺、唾液腺、乳腺等的)、导管细胞(精囊、前列腺等的)、衬里封闭内体腔的上皮细胞、具有推进功能的纤毛细胞、细胞外基质分泌细胞、可收缩细胞;骨骼肌细胞、干细胞、心肌细胞、血液和免疫系统细胞、红细胞(红血细胞)、巨核细胞(血小板前体)、单核细胞、结缔组织巨噬细胞(各种类型)、表皮朗格汉斯细胞、破骨细胞(骨中)、树突状细胞(淋巴组织中)、小胶质细胞(中枢神经系统中)、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、辅助性T细胞、抑制性T细胞、细胞毒性T细胞、天然杀伤性T细胞、B细胞、天然杀伤细胞、网织红细胞、血液和免疫系统的干细胞和定向祖细胞(各种类型)、多能干细胞、全能干细胞、诱导多能干细胞、成体干细胞、感觉传感器细胞、自主神经元细胞、感觉器官和外周神经元支持细胞、中枢神经系统神经元和神经胶质细胞、晶状体细胞、色素细胞、黑色素细胞、视网膜色素上皮细胞、生殖细胞、卵原细胞/卵母细胞、精子细胞、精母细胞、精原细胞(精母细胞的干细胞)、精子、哺育细胞、卵巢卵泡细胞、支持细胞(睾丸中)、胸腺上皮细胞、间质细胞和间质肾细胞。
在本文公开的任何一种方法的一些实施方案中,病况可以是癌症或肿瘤。此类病况的非限制性实例可包括棘皮瘤、腺泡细胞癌、听觉神经瘤、肢端着色斑黑色素瘤、肢端汗腺瘤、急性嗜酸性粒细胞白血病、急性成淋巴细胞白血病、急性成巨核细胞白血病、急性单核细胞白血病、成熟的急性成髓细胞白血病、急性髓细胞性树突状细胞白血病、急性髓细胞性白血病、急性早幼粒细胞白血病、釉质瘤、腺癌、腺样囊性癌、腺瘤、腺瘤样牙源性肿瘤、肾上腺皮质癌、成人T细胞白血病、侵袭性NK细胞白血病、AIDS相关癌症、AIDS相关淋巴瘤、肺泡软部肉瘤、成釉细胞纤维瘤、肛门癌、间变性大细胞淋巴瘤、甲状腺未分化癌、血管免疫母细胞性T细胞淋巴瘤、血管平滑肌脂肪瘤、血管肉瘤、阑尾癌、星形细胞瘤、非典型畸胎瘤样横纹肌样瘤、基底细胞癌、基底样癌、B-细胞白血病、B细胞淋巴瘤、贝里尼管癌、胆道癌、膀胱癌、胚细胞瘤、骨癌、骨肿瘤、脑干胶质瘤、脑肿瘤、乳腺癌、Brenner肿瘤、支气管肿瘤、细支气管肺泡癌、Brown肿瘤、伯基特淋巴瘤、原发部位不明的癌症、类癌瘤、癌、原位癌、阴茎癌、未知原发部位癌、癌肉瘤、Castleman病、中枢神经系统胚胎性肿瘤、小脑星形细胞瘤、脑星形细胞瘤、宫颈癌、胆管癌、软骨瘤、软骨肉瘤、脊索瘤、绒毛膜癌、脉络丛乳头状瘤、慢性淋巴细胞白血病、慢性单核细胞白血病、慢性骨髓性白血病、慢性骨髓增生性疾病、慢性嗜中性粒细胞白血病、透明细胞瘤、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、德戈斯病、皮肤纤维肉瘤突起、皮样囊肿、促结缔组织增生性小圆细胞瘤、弥漫性大B细胞淋巴瘤、胚胎发育不良神经上皮肿瘤、胚胎癌、内胚窦瘤、子宫内膜癌、子宫内膜子宫癌、子宫内膜样肿瘤、肠病相关T细胞淋巴瘤、室管膜母细胞瘤、室管膜瘤、上皮样肉瘤、红白血病、食管癌、嗅神经母细胞瘤、尤文家族肿瘤、尤文家族肉瘤、尤文氏肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、乳房外佩吉特病、输卵管癌、寄生胎、纤维瘤、纤维肉瘤、滤泡性淋巴瘤、滤泡性甲状腺癌、胆囊癌、胆囊癌、神经节神经胶质瘤、节细胞神经瘤、胃癌、胃淋巴瘤、胃肠道癌、胃肠道类癌瘤、胃肠道间质瘤、胃肠道间质瘤、生殖细胞肿瘤、生殖细胞瘤、妊娠绒毛膜癌、妊娠滋养细胞肿瘤、骨巨细胞瘤、多形性胶质母细胞瘤、胶质瘤、脑胶质瘤病、血管球瘤、胰高血糖素瘤、性腺母细胞瘤、颗粒细胞肿瘤、毛细胞白血病、毛细胞白血病、头颈癌、头颈癌、心脏癌、血管母细胞瘤、血管外皮细胞瘤、血管肉瘤、血液系统恶性肿瘤、肝细胞癌、肝脾T细胞淋巴瘤、遗传性乳腺-卵巢癌综合征、霍奇金淋巴瘤、霍奇金氏淋巴瘤、下咽癌、下丘脑胶质瘤、炎性乳腺癌、眼内黑色素瘤、胰岛细胞癌、胰岛细胞肿瘤、幼年髓单核细胞白血病,卡波西肉瘤、卡波西氏肉瘤、肾癌、Klatskin瘤、Krukenberg瘤、喉癌、喉癌、恶性雀斑样痣黑色素瘤、白血病、血癌、唇和口腔癌、脂肪肉瘤、肺癌、黄体瘤、淋巴管瘤、淋巴管肉瘤、淋巴上皮瘤、淋巴样白血病、淋巴瘤、巨球蛋白血症、恶性纤维组织细胞瘤、恶性纤维性组织细胞瘤、骨恶性纤维性组织细胞瘤、恶性胶质瘤、恶性间皮瘤、恶性周围神经鞘瘤、恶性横纹肌样瘤、恶性蝾螈瘤、MALT淋巴瘤、套细胞淋巴瘤、肥大细胞白血病、纵隔生殖细胞肿瘤、纵隔肿瘤、甲状腺髓样癌、成神经管细胞瘤、成神经管细胞瘤、髓质上皮瘤、黑色素瘤、黑素瘤、脑膜瘤、默克尔细胞癌、间皮瘤、间皮瘤、隐匿原发性转移性鳞状颈癌、转移性尿路上皮癌、苗勒管混合瘤、单核细胞白血病、口腔癌、粘液性肿瘤、多发性内分泌瘤形成综合征、多发性骨髓瘤、多发性骨髓瘤、蕈样真菌病、蕈样肉芽肿、髓增生异常病、骨髓增生异常综合征、骨髓性白血病、骨髓肉瘤、骨髓增生性疾病、粘液瘤、鼻腔癌、鼻咽肿瘤、鼻咽癌、赘生物、神经鞘瘤、神经母细胞瘤、成神经细胞瘤、神经纤维瘤、神经瘤、结节性黑色素瘤、非霍奇金淋巴瘤、非霍奇金淋巴瘤、非黑素瘤皮肤癌、非小细胞肺癌、眼部肿瘤学、少突星形细胞瘤、少突胶质细胞瘤、大嗜酸细胞瘤、视神经鞘脑膜瘤、口腔癌、口腔癌、口咽癌、骨肉瘤、骨肉瘤、卵巢癌、卵巢癌、卵巢上皮细胞癌、卵巢生殖细胞肿瘤、卵巢低恶性潜能肿瘤、乳腺佩吉特病、肺上沟癌、胰腺癌、胰腺癌、胰腺癌、甲状腺乳头状癌、乳头状瘤病、副神经节瘤、副鼻窦癌、甲状旁腺癌、阴茎癌、血管周围上皮样细胞瘤、咽癌、嗜铬细胞瘤、中分化松果体实质肿瘤、松果体母细胞瘤、垂体细胞瘤、垂体腺瘤、垂体瘤、浆细胞赘生物、胸膜肺母细胞瘤、多胚瘤、前体T淋巴细胞淋巴瘤、原发性中枢神经系统淋巴瘤、原发性渗出性淋巴瘤、原发性肝细胞癌、原发性肝癌、原发性腹膜癌、原始神经外胚层肿瘤、前列腺癌症、腹膜假粘液瘤、直肠癌、肾细胞癌、涉及第15号染色体上NUT基因的呼吸道癌、视网膜母细胞瘤、横纹肌瘤、横纹肌肉瘤、Richter转化、骶尾部畸胎瘤、唾液腺癌、肉瘤、神经鞘瘤病、皮脂腺癌、继发性赘生物、精原细胞瘤、浆液性肿瘤、Sertoli-Leydig细胞瘤、性索间质瘤、Sezary综合征,印戒细胞癌、皮肤癌、小蓝圆细胞瘤、小细胞癌、小细胞肺癌、小细胞淋巴瘤、小肠癌、软组织肉瘤、生长抑素瘤、烟尘疣、脊髓肿瘤、脊髓肿瘤、脾边缘区淋巴瘤、鳞状细胞癌、胃癌、浅表扩散性黑色素瘤、幕上原始神经外胚层肿瘤、表面上皮间质瘤、滑膜肉瘤、T细胞急性淋巴细胞白血病、T细胞大颗粒淋巴细胞白血病、T细胞白血病、T细胞淋巴瘤、T细胞幼淋巴细胞白血病、畸胎瘤、终末淋巴癌、睾丸癌、泡膜细胞瘤、喉癌、胸腺癌、胸腺瘤、甲状腺癌、肾盂和输尿管移行细胞癌、移行细胞癌、脐尿管癌、尿道癌、泌尿生殖系统赘生物、子宫肉瘤、葡萄膜黑色素瘤、阴道癌、Verner Morrison综合征、疣状癌、视觉通路胶质瘤、外阴癌、Waldenstrom巨球蛋白血症、Warthin瘤和Wilms瘤。
根据各种实施方案,可以检测多种类型的赘生物,包括(但不限于)急性成淋巴细胞白血病(ALL)、急性髓性白血病(AML)、肛门癌、星形细胞瘤、基底细胞癌、胆管癌、膀胱癌、乳腺癌、伯基特淋巴瘤、宫颈癌、慢性淋巴细胞白血病(CLL)、慢性骨髓性白血病(CML)、慢性骨髓增生性肿瘤、结直肠癌、弥漫性大B细胞淋巴瘤、子宫内膜癌、室管膜瘤、食道癌、嗅神经母细胞瘤、尤文肉瘤、输卵管癌、滤泡性淋巴瘤、胆囊癌、胃癌、胃肠道类癌、毛细胞白血病、肝细胞癌、霍奇金淋巴瘤、下咽癌、卡波西肉瘤、肾癌、朗格汉斯细胞组织细胞增生症、喉癌、白血病、肝癌、肺癌、淋巴瘤、黑色素瘤、默克尔细胞癌、间皮瘤、口腔癌、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、骨肉瘤、卵巢癌、胰腺癌、胰腺神经内分泌肿瘤、咽癌、垂体瘤、前列腺癌、直肠癌、肾细胞癌、视网膜母细胞瘤、皮肤癌、小细胞肺癌、小肠癌、鳞状颈癌、T细胞淋巴瘤、睾丸癌、胸腺瘤、甲状腺癌、子宫癌、阴道癌和血管肿瘤。
许多实施方案涉及在个体的癌症治疗期间进行的诊断或伴随诊断扫描。在治疗期间进行诊断扫描时,可以监测药剂治疗癌症生长的能力。大多数抗癌治疗剂导致赘生物细胞的死亡和坏死,这应从这些细胞中释放出更多的核酸到被测试的样品中。因此,循环肿瘤核酸的水平可以随着时间的推移进行监测,因为该水平应该在早期治疗期间增加并随着癌细胞数量的减少而开始减少。在一些实施方案中,基于对癌细胞的治疗效果调整治疗。例如,如果治疗对肿瘤细胞没有细胞毒性,则可以增加剂量或施用具有更高细胞毒性的药剂。备选地,如果癌细胞的细胞毒性良好但不想要的副作用高,则可以减少剂量或可以施用副作用较小的药剂。
各种实施方案还涉及在个体治疗后进行的诊断扫描以检测残留疾病和/或癌症复发。如果诊断扫描表明癌症残留和/或复发,则可以如本文所述进行进一步的诊断测试和/或治疗。如果癌症和/或个体容易复发,可以经常进行诊断扫描以监测任何潜在的复发。
F.计算机系统
在一个方面,本公开内容提供了一种计算机程序产品,其包括具有在其中编码的计算机可执行代码的非暂时性计算机可读介质,该计算机可执行代码经调整以适于被执行来实现前述方法中的任一个。
本公开内容提供了经编程以实现本公开内容的方法的计算机系统。在一些情况下,该系统可以包括组件例如处理器、用于输入测序数据或从其衍生的数据的输入模块、包含指令的计算机可读介质(当由处理器执行时,该指令对输入执行关于一个或多个细胞游离核酸分子的算法)以及提供与病况相关的一个或多个标记的输出模块。
图27示出了计算机系统2701,该计算机系统2701被编程或以其他方式配置为实现本文公开的方法的部分或全部。计算机系统2701可以调节本公开内容的各个方面,例如,(i)从来源于多个细胞游离核酸分子的测序数据中鉴定包含多个定相变异的一个或多个细胞游离核酸分子,(ii)分析任何鉴定的细胞游离核酸分子,(iii)至少部分基于所鉴定的细胞游离核酸分子确定受试者的病况,(iv)至少部分基于所鉴定的细胞游离核酸分子来监测受试者的病况的进展,(v)至少部分基于所鉴定的细胞游离核酸分子来鉴定受试者,或(vi)至少部分基于所鉴定的细胞游离核酸分子来确定受试者的病况的适当的治疗。计算机系统2701可以是用户的电子设备或相对于电子设备位于远程的计算机系统。电子设备可以是移动电子设备。
计算机系统2701包括中央处理单元(CPU,在此也称为“处理器”和“计算机处理器”)2705,其可以是单核或多核处理器,或用于并行处理的多个处理器。计算机系统2701还包括存储器或存储位置2710(例如,随机存取存储器、只读存储器、闪存)、电子存储单元2715(例如,硬盘)、用于与一个或多个其他系统通信的通信接口2720(例如,网络适配器)和外围设备2725,例如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器2710、存储单元2715、接口2720和外围设备2725通过通信总线(实线)例如母板与CPU 2705通信。存储单元2715可以是用于存储数据的数据存储单元(或数据仓库)。计算机系统2701可以在通信接口2720的帮助下可操作地耦合到计算机网络(“网络”)2730。网络2730可以是因特网、互联网和/或外联网或与互联网通信的内联网和/或外联网。在一些情况下,网络2730是电通信和/或数据网络。网络2730可以包括一个或多个计算机服务器,其可以实现分布式计算,例如云计算。网络2730在一些情况下在计算机系统2701的帮助下可以实现对等网络,其可以使耦合到计算机系统2701的设备能够充当客户端或服务器。
CPU 2705可以执行一系列机器可读指令,这些指令可以体现在程序或软件中。指令可以存储在存储位置,例如存储器2710。指令可以被引导到CPU 2705,其可以随后编程或以其他方式配置CPU 2705以实现本公开内容的方法。CPU 2705执行的操作的实例可以包括获取、解码、执行和写回。
CPU 2705可以是电路(例如集成电路)的一部分。系统2701的一个或多个其他组件可以包括在电路中。在一些情况下,该电路是专用集成电路(ASIC)。
存储单元2715可以存储文件,例如驱动程序、文库和保存的程序。存储单元2715可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统2701可以包括一个或多个位于计算机系统2701外部的附加数据存储单元,例如位于通过内联网或因特网与计算机系统2701通信的远程服务器上。
计算机系统2701可以通过网络2730与一个或多个远程计算机系统进行通信。例如,计算机系统2701可以与用户的远程计算机系统进行通信。远程计算机系统的实例包括个人计算机(例如便携式PC)、平板计算机或平板电脑(例如iPad、Galaxy Tab)、电话、智能手机(例如iPhone、支持Android的设备、)或个人数字助理。用户可以通过网络2730访问计算机系统2701。
如本文所述的方法可以通过存储在计算机系统2701的电子存储位置(例如,存储器2710或电子存储单元2715)上的机器(例如,计算机处理器)可执行代码来实现。机器可执行或机器可读代码可以以软件的形式提供。在使用过程中,代码可由处理器2705执行。在一些情况下,代码可以从存储单元2715中取回并存储在存储器2710中以供处理器2705随时访问。在一些情况下,电子存储单元2715可以排除,并且机器可执行指令存储在存储器2710上。
代码可以被预编译和配置为与具有适于执行代码的处理器的机器一起使用,或者可以在运行时被编译。代码可以以编程语言提供,可以选择该语言以使代码能够以预编译或所编译(as-compiled)的方式执行。
本文提供的系统和方法的方面(例如计算机系统2701)可以体现在编程中。该技术的各个方面可以被认为是通常以携带于或体现在一种类型的机器可读介质中的机器(或处理器)可执行代码和/或相关数据的形式的“产品”或“制品”。机器可执行代码可以存储在电子存储单元上,例如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘。“存储”型介质可包括计算机、处理器等或其相关模块的任何或所有有形存储器,例如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可随时提供非暂时性存储以用于软件编程。软件的全部或部分有时可以通过互联网或各种其他电信网络进行通信。例如,这样的通信可以使软件能够从一台计算机或处理器加载到另一台计算机或处理器中,例如从管理服务器或主机计算机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种类型的介质包括光波、电波和电磁波,例如跨本地设备之间的物理接口、通过有线和光学陆线网络以及通过各种空中链路使用。承载这种波的物理元件(例如有线或无线链路、光链路等)也可以被认为是承载软件的介质。如本文所用,除非限于非暂时性、有形“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。
因此,机器可读介质例如计算机可执行代码可以采用多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机等中的任何存储设备,例如可用于实现图中所示的数据库等。易失性存储介质包括动态存储器,例如此类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内的总线的电线。载波传输介质可以采用电信号或电磁信号或者声波或光波(例如在射频(RF)和红外(IR)数据通信期间产生的那些)的形式。因此,计算机可读介质的常见形式包括例如:软盘、可折叠磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡纸磁带、任何其他带有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式磁带、传输数据或指令的载波、传输此类载波的电缆或链接或计算机可以从中读取编程代码和/或数据的任何其他介质。计算机可读介质的许多这些形式可能涉及将一个或多个指令的一个或多个序列传送到处理器以用于执行。
计算机系统2701可以包括电子显示器2735或与电子显示器2735通信,该电子显示器2735包括用户界面(UI)2740以用于提供例如(i)所鉴定的任何细胞游离核酸分子的分析,(ii)至少部分基于所鉴定的细胞游离核酸分子的确定的受试者的病况,(iii)至少部分基于所鉴定的细胞游离核酸分子的确定的受试者的病况的进展,(iv)至少部分基于所鉴定的细胞游离核酸分子的鉴定的怀疑患有病况的受试者,或(v)至少部分基于所鉴定的细胞游离核酸分子的确定的受试者的病况的治疗。UI的实例包括但不限于图形用户界面(GUI)和基于Web的用户界面。
本公开内容的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单元2705执行时通过软件的方式来实现。该算法可以例如(i)从来源于多个细胞游离核酸分子的测序数据中鉴定包含多个定相变异的一个或多个细胞游离核酸分子,(ii)分析任何鉴定的细胞游离核酸分子,(iii)至少部分基于所鉴定的细胞游离核酸分子确定受试者的病况,(iv)至少部分基于所鉴定的细胞游离核酸分子监测受试者的病况的进展,(v)至少部分基于所鉴定的细胞游离核酸分子鉴定受试者,或(vi)至少部分基于所鉴定的细胞游离核酸分子来确定受试者的病况的适当治疗。
实施例
以下举例说明性实施例是本文描述的刺激、系统和方法的实施方案的代表,并不意味着以任何方式进行限制。
实施例1:定相变异的基因组分布
描述了用于降低背景错误率的双链体测序的替代方法,其涉及“定相变异”(PV)的检测,其中两个或多个突变顺式发生(即,在DNA的同一条链上,图1A和图1E)。与双链体测序类似,由于在个体分子中两个单独的非参考事件的一致检测,该方法提供了较低的错误特征谱。然而,与双链体测序不同的是,这两个事件都发生在同一个测序读数对上,从而提高了基因组恢复的效率。定相突变存在于不同的癌症类型中,但发生在B细胞恶性肿瘤中基因组的典型部分中,这可能是由于激活诱导脱氨酶(AID)驱动的中靶和异常体细胞超突变(aSHM)。鉴定了B细胞非霍奇金淋巴瘤(NHL)中aSHM的最常见区域。本文描述的是定相变异富集和检测测序(PhasED-Seq),这是一种通过在百万分之几的数量级上相对肿瘤分数的定相变异检测ctDNA的新方法。本文描述的是证明PhasED-Seq可以在治疗期间和疾病复发前显著改善临床样品中ctDNA的检测。
为了鉴定其中PV可能潜在地改善疾病检测的恶性肿瘤,评估了跨癌症类型的PV的频率。对公众可用的全基因组测序数据进行分析,以鉴定以间距<170bp(其代表了由单个核心核小体和相关接头组成的单个cfDNA片段的典型长度)发生的变异组。鉴定并总结了来自24种癌症组织学(包括实体瘤和血液系统恶性肿瘤)的2538个肿瘤的控制SNV总数的这些“推定的定相变异”(实施例10)的频率(图1B、图5和表1)。PV在两种B细胞淋巴瘤(DLBCL和滤泡性淋巴瘤,FL,相对所有其他组织学P<0.05)(这是一组具有由AID/AICDA驱动的超突变的疾病)中最显著富集。
实施例2:PV的突变机制
为了研究PV的起源,比较了促成在另一个SNV的170bp内发生的SNV和单独发生的SNV(例如,在170bp内没有另一个SNV)(实施例10)的单碱基取代(SBS)突变特征。如预期的,PV在与聚集的突变相关的几个突变特征中高度富集。与AID(SBS84和SBS85)的活性相关的聚集突变的特征在来自B细胞淋巴瘤和CLL的PV中显著富集,而与APOBEC3B(SBS2和SBS13)的活性相关的特征(kataegis超突变的另一种机制)在来自多种实体癌组织学(包括卵巢癌、胰腺癌、前列腺癌和乳腺癌)的PV中显著富集(图1C和图6A-6WW)。与AID(SBS84和SBS85)的活性相关的聚集簇突变的特征在淋巴瘤和CLL中发现的PV中富集,而与APOBEC3B(SBS2和SBS13)的活性相关的特征在乳腺癌中显著富集(图1C和图6A-6WW)。来自多种肿瘤类型的PV也与SBS4相关,这是与烟草使用相关的特征。此外,在跨多个肿瘤组织学的PV中,观察到没有明确相关机制的在几个其他特征(例如,SBS24、SBS37、SBS38和SBS39)中的新富集。相比之下,诸如SBS1和SBS5的与衰老相关的突变特征在分离的SNV中显著富集。
实施例3:PV发生在淋巴癌中的典型基因组区域中
为了评估推定的PV的基因组分布,首先将这些事件分箱到1-kb区域中以可视化它们在肿瘤类型中的频率。观察到个体淋巴样赘生物(例如DLBCL、FL、伯基特淋巴瘤(BL)和慢性淋巴细胞白血病(CLL);图1D和图7)中PV的显著典型分布。相比之下,非淋巴样癌通常不在典型区域中表现出聚集PV的大量复发。即使考虑到黑色素瘤和肺癌、具有频繁PV的疾病,PV的位置中典型性的这种缺乏也是真实的。
值得注意的是,大多数超突变区域在所有三种淋巴瘤亚型之间共享,其中在aSHM的已知靶标(包括BCL2、BCL6和MYC)以及编码重和轻链IGH、IGK和IGL的免疫球蛋白(Ig)基因座中看到最高密度(表2)。引人注目的是,在几乎所有淋巴瘤患者以及CLL患者中,Ig基因座内的某些区域发生了密集突变(图1D)。在淋巴瘤亚型中,DLBCL肿瘤含有最多的反复包含PV的1kb区域(图8A),这与在该肿瘤类型中观察到的最高数量的反复突变的基因一致。总共鉴定了1639个独特的反复含有B淋巴恶性肿瘤中的PV的1-kb区域。在这些与淋巴瘤相关的1-kb区域中,近三分之一落入以前与B细胞中的生理或异常SHM相关的基因组区域。具体而言,19%(315/1639)位于Ig区域中,而13%(218/1639)在aSHM的68个先前鉴定的靶标的部分中(表2)。虽然大多数PV落入基因组的非编码区域中,但还鉴定了以前未被描述为aSHM的靶标的其他反复受影响的基因座,包括XBP1、LPP和AICDA等。
每个淋巴恶性肿瘤内PV的分布与相应疾病的不同病理生理学相关的致癌特征相关。例如,FL的病例(其中超过90%的肿瘤具有致癌BCL2融合)与其他淋巴恶性肿瘤相比,显著更可能包含BCL2中的定相变异(图1D和图8B)。类似地,与其他淋巴恶性肿瘤相比,显著更多的伯基特淋巴瘤(BL)在MYC和ID3(这两个驱动基因与BL发病机制密切相关)中含有PV(图1D和图8C-8D)。与不同起源细胞相关的DLBCL分子亚型也表现出不同的PV分布(表2)。具体来说,虽然生发中心B细胞样(GCB)和激活的B细胞样(ABC)DLBCL总体上具有相似的PV频率(中位数798相对516,P=0.37),但发现了在ABC-DLBCL中端粒IGH类别转换区域(Sγ1和Sγ3)中PV的显著富集,与之前的报道41一致(图8E)。相反,GCB-DLBCL在着丝粒IGH类别转换区域(Sα2和Sε)和BCL2中包含更多的定相单倍型。
实施例4:针对淋巴瘤的PhasED-Seq实验组的设计和验证
为了验证这些富集PV的区域并评估它们用于从ctDNA检测疾病的效用,设计了靶向来自三个独立的DLBCL患者队列以及CLL患者的WGS中鉴定的推定PV的测序实验组(图2A和实施例10)。这个最终的定相变异富集和检测测序(PhasED-Seq)实验组靶向集中于PV的约115kb的基因组空间,以及额外的在B-NHL中反复突变的约200kb靶向基因(表3)。虽然专用于PV捕获的115kb的空间仅靶向人基因组的0.0035%,但它捕获了在通过WGS分析的成熟B细胞赘生物中观察到的26%的定相变异(图9A),从而产生了相对于WGS的通过PhasED-Seq实现的约7500倍的PV富集。
将预期的SNV和PV恢复与先前报道的被设计为使B细胞淋巴瘤中每位患者的SNV最大化的CAPP-Seq选择器进行比较(图9A-C)。在考虑具有可用的WGS数据的不同B-NHL时,与之前的CAPP-Seq实验组相比,PhasED-Seq在中位数病例中恢复了3.0倍的SNV(81相对27)和2.9倍的PV(50相对17)。这一观察强调了包括基因组的非编码部分对于最大突变恢复率的重要性。为了通过实验验证这些产率提高,对来自DLBCL患者的16个预处理肿瘤或血浆DNA样品(表4)进行了分析。CAPP-Seq和PhasED-Seq实验组平行应用于每个样品,然后将它们测序到高度独特的分子深度(图2B)。与从WGS建立的预期富集相比,观察到与CAPP-Seq相比,PhasED-Seq对SNV产率的类似改善(2.7倍;中值304.5相对114)。然而,当列举在测序的个体DNA片段中观察到的PV时,发现超出来自WGS的预期改善的有利于PhasED-Seq的改善(7.7倍;中值5554相对719.5个PV/病例)。这种改善可能是由于1)靶向测序中更高的测序深度,其导致稀有等位基因检测的改善,或2)在使用PhasED-Seq或CAPP-Seq的靶向测序中更高阶的PV的列举,其在WGS设计中未考虑到(即每个片段>2个SNV;图9D-9F)。此外,在实验组中的1-kb窗口中,观察到WGS数据中的推定PV与101个DLBCL样品中来自通过PhasED-Seq的靶向测序的PV的频率之间的鲁棒相关性(图2C),进一步验证了B细胞恶性肿瘤中PV的频率和分布。
实施例5:淋巴瘤亚型之间的定相变异的差异
已经验证了PhasED-Seq实验组,现检查各种B细胞恶性肿瘤(包括DLBCL(n=101)、原发性纵隔B细胞淋巴瘤(PMBCL)(n=16)和经典霍奇金淋巴瘤(cHL)(n=23))之间的PV的生物学差异。每个病例鉴定的SNV的数量在淋巴瘤亚型之间没有显著差异(图9G-9K)。然而,在考虑突变单倍型时,cHL的PV负荷明显低于DLBCL或PMBCL。除了这种数量差异之外,还观察到不同B细胞淋巴瘤亚型之间PV的基因组位置的差异(图2D-2E和图10-12)。这包括先前在DLBCL亚型中建立的生物学关联,包括与ABC型DLBCL相比在GCB型中的BCL2中更频繁的PV,而对于PIM1观察到相反的关联。还观察到与DLBCL相比,在PMBCL中的CIITA(其是其中断点在PMBCL中常见的基因)中更频繁的PV。在整个IGH基因座中还观察到了相对富集,其中在ABC-DLBCL(与GCB-DLBCL相比)中的Sγ3和Sγ1区域看到更频繁的PV,有趣的是,与DLBCL相比,在cHL中的Sε基因座中更频繁的PV(图2E和图13)。总的来说,在用于测试多个假设的校正后,发现ABC-和GCB-DLBCL之间的25个基因座、DLBCL和PMBCL之间的24个基因座以及DLBCL和cHL之间的40个基因座中的显著相对富集(图10-12)。
实施例6:通过PhasED-Seq的定相变异的恢复
为了促进使用PV检测ctDNA,需要有效恢复DNA分子。杂交捕获测序可能对DNA错配敏感,其中增加的突变降低杂交效率。事实上,AID热点可能包含5-10%的局部突变率,其中在IGH的某些区域中甚至有更高的比率。为了凭经验评估突变率对捕获效率的影响,模拟了在计算机模拟中具有不同突变率的150聚体的DNA杂交。如预期的,预测的结合能随着突变数量的增加而降低(图14A)。值得注意的是,随机分布的突变对结合能的影响比聚集突变更大。为了评估这种降低的结合亲和力的影响,合成了在MYC和BCL6(作为aSHM的靶标的两个基因座)中与参考序列有0%到10%差异的150聚体DNA寡核苷酸。为了评估杂交的最坏情况,非参考碱基随机分布而不是聚集分布(实施例10)。然后用PhasED-Seq实验组捕获这些寡核苷酸的等摩尔混合物。与计算机模拟预测一致,增加的突变率导致降低的捕获效率(图3A)。相对于完全野生型对应物,具有5%突变率的分子以85%的效率被捕获,而具有10%突变的分子仅以27%的相对效率被捕获。为了评估这种突变程度在人肿瘤中的普遍性,检查了140名B细胞淋巴瘤患者的实验组中变异的分布,其计算重叠151-bp窗口中突变碱基的分数(实施例10)。只有7%(10/140)的患者具有超过10%突变率的任何151-bp窗口(图14B-C)。事实上,在使用合成寡核苷酸的实验中,5%的突变率几乎与野生型序列一样有效地被恢复。在所考虑的所有病例的超过一半中,没有基因座在任何窗口处具有>5%的突变率,而在所有病例中,>90%的窗口具有<5%的突变。总体而言,这些观察表明,尽管存在杂交偏好性,但大多数定相突变可通过有效的杂交捕获来恢复。
实施例7:定相变异测序的错误特征谱和检测限
应用于cfDNA的高度错误抑制的测序的先前方法已经利用用于错误抑制(例如,集成数字错误抑制,iDES)的分子和计算机模拟方法的组合或双链分子恢复。然而,这些方法中的每一个都有局限性,无论是用于检测超低肿瘤分数的事件还是用于有效恢复原始DNA分子,这是在输入DNA有限时cfDNA分析的重要考虑因素。将通过PhasED-Seq的来自12个健康成人的血浆cfDNA样品的输入基因组的恢复和错误特征谱与iDES-CAPP-Seq和双链体测序进行了比较。虽然iDES增强的CAPP-Seq比单独的条形码去重复具有更低的背景错误特征谱,但双链体测序为非参考单核苷酸替换提供最低的背景错误率(图3B,3.3x10-5相对1.2x10-5,P<0.0001)。然而,在iDES增强的CAPP-Seq或双链体测序数据中,定相错误率(例如,在同一测序片段上出现多个非参考碱基)显著低于单个错误率。这对于同一DNA分子上两个(2x或“双联体”PV)或三个(3x或“三联体”PV)取代的发生率是正确的(图3B,分别为8.0x10-7和3.4x 10-8,P<0.0001)。包含C到T或T到C转换取代的定相错误比其他类型的PV更常见(图14D)。值得注意的是,cfDNA中的双联体PV错误率还与位置之间的距离相关,其中最高的PV错误率由相邻的SNV(例如DNV)组成,并且错误率随着组成变异之间距离的增加而降低(图14E)。在考虑独特的分子深度时,双链体测序仅恢复了所有独特cfDNA片段的19%(图3C)。相比之下,<20bp的基因组距离内的PV的独特深度几乎与个体位置的深度相同(例如,覆盖个体SNV的分子)。类似地,大小为至多80bp的PV的深度大于样品的中位独特分子深度的50%。重要的是,所有PV的几乎一半(48%)都在彼此的80bp之内,证明了它们用于从输入受限的cfDNA样品检测疾病的效用(图3D)。
为了定量比较PhasED-Seq与用于ctDNA检测的替代方法的性能,产生了来自3名淋巴瘤患者的ctDNA在健康对照cfDNA中的有限稀释液,导致0.1%至0.00005%(1/2,000,000)的预期的肿瘤分数(实施例10)。将预期的肿瘤分数与这些稀释液中的每一个中使用PhasED-Seq的估计的肿瘤含量进行比较,以跟踪肿瘤来源的PV,以及与依赖于个体SNV的错误抑制检测方法(例如iDES-增强的CAPP-Seq或双链体测序;图3E)进行比较。所有方法在肿瘤分数低至0.01%(1/10,000)时表现同样出色。然而,低于此水平(例如,0.001%、0.0002%、0.0001%和0.00005%)时,PhasED-Seq和双链体测序均显著优于iDES增强的CAPP-Seq(对于双链体、“2x”PhasED-Seq和“3x”PhasED-Seq,P<0.0001;图3E)。此外,当与双链体测序相比,跟踪2或3个同相变异(例如,2x和3x PhasED-Seq)更准确地鉴定了预期的肿瘤含量,具有低至1/2,000,000的优越线性度(对于双链体相对2xPhasED-Seq,P=0.005,对于3x PhasED-Seq,P=0.002)(实施例10)。通过在来自12名不相关的健康对照受试者和用于有限稀释的健康对照的cfDNA样品中寻找肿瘤来源的SNV或PV的证据,评估了PV的特异性。同样,2x-或3x-PhasED-Seq均显示出比CAPP-Seq和双链体测序显著更低的背景信号水平(图3F)。这种较低的错误率和来自PV的背景提高了ctDNA疾病检测的检测限。在一些情况下,本文所述的基于测序的cfDNA测定方法(例如图3E和图3F中描述的方法)不需要分子条形码来实现精确的错误抑制和低检测限。通过不使用条形码的方法评估的信号使用从1:1,000至5:10,000,000的有限稀释系列和“空白”对照(图23A-23B)。
该稀释系列用于评估给定数量的PV的检测限(图3G-3I)。当考虑150个碱基对(bp)区域内的一组PV时,可以通过二项式采样准确建模给定样品的检测概率,同时考虑测序深度和具有PV的150bp区域的数量(实施例10)。
实施例8:低负荷微小残留病的检测的改善
为了测试由PhasED-Seq提供的较低LOD用于检测来自cfDNA的超低负荷MRD的效用,对来自接受针对DLBCL的一线治疗的患者的连续细胞游离DNA样品进行测序(图4A)。使用CAPP-Seq,该患者仅在一个治疗周期后就具有无法检测到ctDNA,其中治疗期间和治疗后的多个后续样品也保持无法检测到。该患者在治疗开始后>250天具有后续再次出现的可检测的ctDNA,最终在5个月后出现临床和放射学疾病进展,表明使用CAPP-Seq的假阴性连续测量结果。引人注目的是,治疗期间和治疗后通过CAPP-Seq无法检测到的所有四个血浆样品都具有通过PhasED-Seq可检测到的ctDNA水平,其中平均等位基因分数低至6/1,000,000。与放射学监测相比,这种增加的灵敏度将通过ctDNA的疾病检测的前置期从使用CAPP-Seq的5个月提高到使用PhasED-Seq的10个月。
接下来,评估了107名患有大B细胞淋巴瘤的患者的队列中和1或2个周期的标准免疫化学疗法后可用的血液样品中的PhasED-Seq ctDNA检测的性能。重要的是,通过PhasED-Seq测量的ctDNA水平与通过CAPP-Seq测量的水平高度相关。总共评估了443个肿瘤、种系和细胞游离DNA样品,包括治疗前(n=107)和1或2个治疗周期后(n=82和89)的cfDNA。在治疗之前,在98%的样品中可通过PhasED-Seq检测到患者特异性PV,在来自健康对照的cfDNA中具有95%的特异性(图15和16A)。重要的是,考虑到治疗前和治疗后样品,通过PhasED-Seq测量的ctDNA水平与通过CAPP-Seq测量的ctDNA水平高度相关(Spearman rho=0.91,图16B)。接下来,比较了治疗开始后通过PhasED-Seq和CAPP-Seq从cfDNA样品测量的ctDNA的定量水平。在1或2个周期后具有可通过PhasED-Seq检测到的ctDNA的样品中总共72%(78/108)也被常规CAPP-Seq检测到(图4B)。在通过PhasED-Seq检测到的108个样品中,相对于具有使用常规CAPP-Seq可检测到(72%)的ctDNA水平的样品,对于具有无法检测到(28%)的ctDNA水平的样品,疾病负荷显著较低,其中在中位ctDNA水平中有>10倍的差异(肿瘤分数2.2x10-4相对1.2x10-5,P<0.001,图4B)。在比较PhasED-Seq和CAPP-Seq时,在1个治疗周期后总共有另外16%(13/82)的样品和在2个治疗周期后总共有另外19%(17/89)的样品具有可检测的ctDNA(图4C)。
针对DLBCL患者,先前使用CAPP-Seq描述了ctDNA分子反应标准,包括主要分子反应(MMR),定义为2个治疗周期后ctDNA的2.5-对数减少22。虽然在这个时间点的MMR是结果的预测,但许多患者在这个界标处具有无法通过CAPP-Seq检测到的ctDNA(图4D-4E)。重要的是,即使在具有通过CAPP-Seq无法检测到ctDNA的患者中,通过PhasED-Seq检测隐藏的超低ctDNA水平也可预测结果,包括无事件存活率和总体存活率(图4D)。实际上,在从该时间点可获得样品的89名患者中,58%(52/89)在完成6个计划的治疗周期中的2个后,在其中期MMR评估中具有无法通过CAPP-Seq检测到的ctDNA。通过使用PhasED-Seq,CAPP-Seq未检测到的样品中的33%(17/52)具有如通过PV证明的ctDNA的证据,水平低至~3:1,000,000(图17A-17D)—通过PhasED-Seq另外检测到的这17个病例代表通过CAPP-Seq的潜在假阴性测试。在早期分子反应(EMR)时间点(即在1个治疗周期后,图18A-18H)观察到类似的结果。
虽然在1或2个治疗周期后在DLBCL中的ctDNA检测是已知的不良预后标记,但对于在这些时间点具有检测不到的ctDNA的患者的结果是异质的(图4E和图18F)。重要的是,即使在1或2个治疗周期后具有通过CAPP-Seq检测不到的ctDNA的患者中,通过PhasED-Seq的超低ctDNA水平的检测强烈预测包括无事件存活的结果(图4F,图17C-D、图18C-D和图18G)。当将通过PhasED-Seq的检测与先前描述的MMR阈值相结合时,患者可以分为三组——未达到MMR的患者、达到MMR但具有持续ctDNA的患者和具有无法检测到的ctDNA的患者(图4G)。有趣的是,尽管进行了额外的计划性一线治疗(例如,在治疗的第一年内),但未达到MMR的患者处于特别高的早期事件风险中,而具有持续低水平的ctDNA的患者似乎具有后期复发或进展事件的更高风险。相比之下,在2个治疗周期后具有通过PhasED-Seq检测不到的ctDNA的患者具有压倒性的良好结果,其中在第5年时95%是无事件的并且97%是总体存活的。在1个治疗周期后在EMR时间点看到了类似的结果(图18H)。
实施例9:当突变不是单碱基变化而是一对突变时,使用下一代测序(NGS)进行突变检测的示例性实施方案
在许多情况下,cfDNA追踪的限制可能是对可用于检测的分子数量的限制。此外,从细胞游离DNA追踪肿瘤分子存在多种潜在限制,不仅包括测序错误特征谱,还包括可用于检测的分子数量。可用于检测的分子数量(本文称为“可评估片段”的数量)可以被认为是恢复的独特基因组的数量(例如,独特的测序深度)和被追踪的体细胞突变数量的函数。更具体地说,可评估片段的数量等于:EF=d*n。
其中d=所考虑的独特分子深度,并且n=追踪的体细胞改变的数量。对于典型的细胞游离DNA样品,通常恢复少于10,000个独特的基因组(d),需要任何灵敏的方法来追踪多个改变(n)。此外,如上所述,双链体测序的主要限制是难以恢复足够的独特分子深度(d);因此,对于具有~1,500x的双链体深度的典型血浆样品,即使在100个体细胞改变后,也只有150,000个可评估片段。因此,在这种情况下,灵敏度受到可用于检测的分子数量的限制。相比之下,诸如iDES增强的CAPP-Seq的其他方法考虑了恢复的所有分子。在这里,可以恢复多达5,000-6,000x的独特单倍体基因组。因此,追踪相同的100个体细胞变化的可评估片段的数量可以是500,000-600,000x。然而,单链测序的错误特征谱(即使有错误抑制)允许检测至最多1/50,000的水平。因此,旨在提高针对ctDNA的检测限的方法必须克服测序的错误特征谱和足够的可评估片段的恢复以利用所述较低的错误特征谱。
为了弥补这种明显的缺陷,本公开内容中描述的PhasED-Seq的方法允许淋巴恶性肿瘤并且适用于其他癌症组织学,(例如,使用“个性化”方法)。对于个性化方法,使用定制的杂交捕获寡核苷酸(或针对PCR扩增子的引物)来捕获从全外显子组或基因组测序中鉴定的个性化体细胞突变。重新分析了针对发生在基因组空间中彼此170bp内的SNV进行评估的PCAWG数据集。结果发现,在考虑的24种癌症组织学中的14种中,中位数病例包含超过100个可能的定相变异,包括在几种实体瘤中的,例如黑色素瘤(中位数2072)、肺鳞状细胞癌(1268)、肺腺癌(644.5)和结直肠腺癌(216.5)。
接下来,评估PCAWG数据集中所有病例中使用双链体测序或PhasED-Seq的预期检测限。同样,检测限由可评估片段的预期数量定义,因此取决于追踪的变异的数量和预期的测序深度。利用来自优化的杂交捕获条件的数据,构建了一个模型来预测具有给定DNA输入和测序读数数量的预期去重复(单链)和双链体(双链的)分子深度。使用这一点,连同来自PCAWG数据集的SNV或可能的PV的数量,对于每个病例,评估了哪种方法将导致更多数量的可评估片段和因此导致优越的检测限。假设64纳克(ng)的总cfDNA输入和总共2000万个测序读数,该练习的结果显示在图19中。值得注意的是,在大多数癌症类型(18/24个组织学)中,PhasED-Seq的检测限低于双链体测序。重要的是这不仅包括B细胞淋巴瘤,还包括常见的实体瘤,包括肺鳞状细胞癌和腺癌、结直肠腺癌、食管和胃腺癌以及乳腺腺癌等。实际上,以肺癌作为具体的实例,与双链体测序相比,使用PhasED-Seq对于中位数肺鳞状细胞癌和肺腺癌病例发现10倍较低的检测限(图20)。使用个性化方法的PhasED-Seq和双链体测序都比非个性化方法(例如,iDES增强的CAPP-Seq)具有更低的检测限。
为了进一步确认定相变异和PhasED-Seq在不同实体瘤中的适用性,对配对的肿瘤和正常DNA进行WGS(~20-30x深度),以鉴定来自治疗前的预计具有低ctDNA负荷的五名实体瘤患者的PV(肺癌(n=5)以及一名患有乳腺癌的患者(n=1))。测序读数与hg19进行比对,并使用samtools markdup进行重复数据删除。根据GATK实践,在变异调用之前使用GATKIndelRealigner和BaseRecalibrator处理肿瘤和正常去重BAM文件,使用默认参数(GATKv3.8-1-0-gf15c1c3ef)(Van der Auwera,G.A.等人,From FastQ data to high-confidence variant calls:the Genome Analysis Toolkit best practices pipeline.Curr.Protoc.Bioinformatics 43,11.10.1-11.10.33(2013))。使用三种方法进行变异调用:VarScan2(v2.3.9)(Koboldt,D.C.等人,VarScan 2:somatic mutation and copynumber alteration discovery in cancer by exome sequencing.Genome Res.22,568-576(2012)),Mutect(v1.1.7)(Cibulskis,K.等人,Sensitive detection of somaticpoint mutations in impure and heterogeneous cancer samples.Nat.Biotechnol.31,213-219(2013)),和Strelka2(v2.9.1)(Kim,S.等人,Strelka2:fast and accuratecalling of germline and somatic variants.Nat.Methods 15,591 594(2018))。Mutect和VarScan2 VCF文件由annovar(v2018Apr16)注释,Strelka VCF文件由Oncotator(v1.9.8.0)注释。根据以下标准对通过每种方法调用的变异进行组合和过滤:(1)通过调用器内在质量过滤器(例如,碱基质量、方向偏差和种系风险);(2)深度≥30×;(3)AF≥5%;和(4)由≥2个变异调用器鉴定的变异。然后评估通过所有过滤器的SNV的可能的定相关系-与其最近邻的距离≤170bp的任何一对SNV都被认为是可行的PV。(“可行的PV”在此实施例中定义为最初由WGS鉴定的PV)。我们还直接从WGS读数对PV进行基因分型,考虑了具有至少两个支持读数、10×深度和5%肿瘤分数的任何可行PV。然后评估可行的PV,并针对肿瘤特异性进行优先级排序,考虑了(1)个体肿瘤读数中作为定相关系的存在,(2)匹配的正常读数中读数支持的缺乏,(3)支持读数上其他非参考碱基的存在,(4)碱基质量,(5)作图质量和(6)基因组位置的独特性。基于这些指标,随后选择候选PV进行下面的靶向重测序。(“候选PV”被定义为选择用于靶向重测序和验证的可行PV的子集)。如本实施例中所使用的,“推定PV”可以指可行PV或候选PV中的一种或两种。
在从这六个肿瘤的每一个中鉴定候选PV后,我们设计了靶向感兴趣的区域的120-bp生物素化杂合捕获寡核苷酸(Integrated DNA Technologies)。然后我们对肿瘤-正常配对进行杂合捕获重测序至高独特分子深度(~1000-3000×去重复深度)以创建用于肿瘤监测的经验证的PV列表(图22C)。图22C的各列中所示的数字代表包含多个定相变异的长度小于170bp的区域的数量。如果PV以高于5% AF存在于肿瘤中,并且在匹配的种系DNA中没有读数支持,则认为PV是经验证的。
我们将上述靶向PV的个性化杂合捕获小组应用于这六名参与者中每一个的血浆样品,测序至高独特分子深度(~1000至10,000×去重复深度)。我们还对每个小组的24个对照健康cfDNA样品进行了测序,以评估特异性。
肿瘤分数被定义为相对于覆盖PV位置的读数总数的包含先验定义的PV的读数数量。之前已使用基于SNV的CAPP-seq方法评估了大多数样品的ctDNA含量,并提供了与PhasED-seq的比较。这些实验的结果示于22D-22G中。
考虑到五个肺癌病例,PhasED-Seq方法在分析灵敏度方面实现了约10倍的提高,与使用定制CAPP-Seq的0.0019%中值LOD相比,实现了0.00018%的中值LOD(图21A和图21B)。
为了证明实体瘤中来自PhasED-Seq的ctDNA的这种改善的检测限的临床意义,使用CAPP-Seq和PhasED-Seq分析了来自使用治愈性目的放化学疗法(LUP814)治疗的患有3期肺腺癌的患者的系列血浆样品。如上所述,CAPP-Seq和PhasED-Seq均定量了在治疗前相似水平的ctDNA(约1%的肿瘤分数)。然而,开始治疗后的3个后续样品具有通过标准CAPP-Seq检测不到的ctDNA,包括放化学疗法期间和之后以及使用德瓦鲁单抗(Durvalumab)的辅助免疫治疗期间的样品。尽管缺乏通过CAPP-Seq可检测到的疾病,但患者在最初的放射照相反应后具有活检证实的复发性疾病。然而,当使用PhasED-Seq分析这些相同的样品时,检测到3/3(100%)的样品中的分子残留疾病,其中平均肿瘤分数低至0.00016%(百万分之1.6)。此外,ctDNA定量的趋势反映了患者的病程,其中对放化学疗法有初步反应,但在免疫治疗期间有疾病进展。重要的是,该患者的疾病在所有时间点保持可检测到的,其中在患者的活检证实的疾病进展前8个月的放化学疗法完成时有可检测到的疾病(图22)。
实施例10:用于增强从细胞游离DNA检测疾病的定相变异富集的方法
10(a):全基因组测序分析
10(a)(1):全基因组测序数据推定的定相变异鉴定
从两个来源获得全基因组测序数据。淋巴样恶性肿瘤(弥漫性大B细胞淋巴瘤,DLBCL;滤泡性淋巴瘤,FL;伯基特淋巴瘤,BL;慢性淋巴细胞白血病,CLL)的数据于2018年5月7日从国际癌症基因组联盟(ICGC)数据门户下载。来自所有其他组织学的数据是全基因组的泛癌症分析(PCAWG)的一部分,并于2019年11月11日下载。仅考虑至少有35个可用病例的癌症组织学;表1中提供了所考虑的数据集的详细信息。所有样品都具有使用匹配的肿瘤和正常基因分型从WGS调用的体细胞突变。查询限于从WGS获得的碱基取代(单核苷酸变异、双核苷酸变异、三核苷酸变异和寡核苷酸变异;SNV、DNV、TNV和ONV)。已这样鉴定了感兴趣的病例和变异后,接下来鉴定每个肿瘤中推定的定相变异(PV)的数量。为了用作单个细胞游离DNA(cfDNA)分子上的PV,通常必须在小于典型cfDNA分子长度(~170bp)的基因组距离内出现两个变异,例如两个单核苷酸变异(SNV)。因此,推定的PV被定义为在<170bp的基因组距离内发生在同一染色体上的两个变异。DNV、TNV和ONV被认为是它们各自的组分SNV的集合。每个病例的SNV的数量以及推定的PV的身份在表1中详述。SNV和推定的PV的原始数量以及控制SNV的数量的推定的PV的数量显示在图5A-C中。
10(a)(2):来自WGS的定相变异的突变特征
为了评估不同癌症类型/亚型中的与定相和非定相突变相关的突变过程,使用R软件包“deconstructSigs”为上述每个WGS病例列举了单碱基取代(SBS)的突变特征。每个患者的SNV列表首先分为两组:1)可能的PV中包含的SNV;即,与相邻或“最近的邻居”SNV距离<170bp,以及2)孤立的SNV(即非定相的),定义为与最近的相邻SNV的距离≥170bp的那些。然后使用COSMIC中描述的49个SBS特征(不包括与可能的测序伪影相关的特征)应用“DeconstructSigs”,以评估每个SBS特征对每个患者的候选定相SNV和非定相SNV的贡献。为了比较每个SBS特征对定相和孤立的SNV的贡献,进行Wilcoxon符号秩检验以比较每种癌症类型的在这两个类别之间的每个SBS特征的相对贡献(图6A-6WW)。为了解释多个假设,如果Wilcoxon符号秩检验导致<0.05/49或0.001的P值,则通过考虑对在定相相对非定相SNV的贡献上不同的任何SBS特征是显著的来应用Bonferroni校正。这些比较的分布以及显著性检验描绘在图6A-6WW中。该分析的概述还使用热图展示显示在图1C中,其中“热度”代表SBS特征对定相变异的平均贡献与对孤立/非定相变异的平均贡献之间的差异。
10(a)(3):来自WGS的定相变异的基因组分布
在每个肿瘤类型内的基因组中评估每个癌症类型中PV的复发频率。具体来说,人基因组(build GRCh37/hg19)首先被分为1-kb分箱(总共3,095,689个分箱);然后,对于每个样品,计算每个1-kb分箱中包含的PV(如上定义)的数量。对于此分析,包括其至少一个组成性SNV落入感兴趣的1-kb分箱内的任何PV。然后计算其肿瘤在每个基因组分箱内具有每种癌症类型的PV的患者的分数。为了鉴定患者中反复含有PV的1-kb分箱,绘制了每个1-kb分箱中包含PV的患者的分数相对基因组坐标的图(图1D和图7);对于此分析,仅绘制了其中至少2%的样品包含至少一种癌症亚型中的PV的分箱。
10(a)(4):使用定相变异鉴定反复出现的1-kb分箱
为了鉴定在B-淋巴恶性肿瘤中反复含有PV的1-kb分箱,利用来自以下疾病的WGS数据:DLBCL、FL、BL和CLL。来自这些肿瘤类型的>1个样品的任何1-kb分箱被认为反复包含来自B淋巴恶性肿瘤的PV。包含淋巴恶性肿瘤中反复出现的PV的1-kb分箱的基因组坐标列举在表2中,并绘制在图8A中。
10(b):B淋巴恶性肿瘤的PhasED-Seq实验组的设计
10(b)(1):以更高分辨率从WGS数据中鉴定反复出现的PV
鉴于B细胞恶性肿瘤中来自WGS数据的反复出现的推定PV的普遍存在,设计了一种靶向测序方法用于它们的杂交介导的捕获(定相变异富集测序(PhasED-Seq))以从肿瘤或细胞游离DNA中富集这些特定的PV事件。除了上述ICGC数据外,本设计中还利用了来自其他来源(包括B细胞NHL和CLL)的WGS数据。
还检查了先前在NHL中从cfDNA进行靶向测序的经验。鉴定了在每个B细胞肿瘤样品中相距<170bp存在的SNV对。然后,包含PV的基因组“窗口”鉴定如下:对于每条染色体,PV按相对于参考基因组的基因组坐标进行分选。然后,鉴定任何患者中待从基因组中捕获的任何PV的最低(即最左侧)位置;这定义了播种感兴趣的所需窗口的左手侧(5')坐标。然后通过增长其3'端来扩展该窗口以捕获连续的PV,直到达到≥340bp的间隙,选择340bp作为捕获两个连续的染色体的约170bp的大小的片段。当达到这样的间隙时,开始一个新的窗口,并再次重复添加相邻PV的此迭代过程,直到达到下一个≥340bp的间隙。这导致了基因组窗口的BED文件,其中包含来自考虑的所有样品的所有可能的PV。最后,每个窗口的每一侧都额外填补50bp,以使得能够在重复或不良映射插入序列可能阻止其直接靶向富集的罕见情况下实现从侧翼序列的有效捕获。
在鉴定了包含推定的PV的感兴趣区域后,然后将每个窗口分成170bp的片段(例如,染色体cfDNA分子的近似大小)。然后,列举每个病例中包含PV的病例的数量。对于每个170bp区域,如果满足以下一项或多项标准,则将最终测序实验组设计中的区域包括在内:1)至少一名患者在5个独立数据集中的3个中在170bp区域中包含PV,2)如果一个数据集是先前的CAPP-Seq经验,则至少一名患者在5个独立数据集中的2个中在该区域中包含PV,或3)至少一名患者在5个独立数据集中的2个中在该区域中包含PV,其中总共有至少3名患者在该区域中含有PV。这产生了691个“瓦片”,每个瓦片代表一个170bp的基因组区域。这些瓦片连同额外的靶向在B-NHL中反复突变的驱动基因的~200kb的基因组空间被组合成一个统一的靶向测序实验组,如之前对于使用NimbleDesign(Roche NimbleGen)的肿瘤和cfDNA基因分型所描述的。该实验组的最终坐标在表3中提供。
10(b)(2):PV产率中PhasED-Seq和CAPP-Seq性能的比较
为了评估与先前报道的用于B细胞淋巴瘤的CAPP-Seq选择器相比,PhasED-Seq捕获SNV和PV的性能,定量了可以使用每个实验组通过计算机模拟限制WGS以捕获每种方法的靶标来恢复的SNV和PV的预测数量(图9A-C)。然后使用Wilcoxon符号秩检验比较预测的变异数量。还对来自DLBCL患者的16个样品进行了CAPP-Seq和PhasED-Seq。在这些样品中,对肿瘤或血浆DNA以及匹配的种系DNA进行了测序。得到的变异数量再次通过Wilcoxon符号秩检验进行比较(图2B和图9D-9E)。表4中提供了该分析中包含的样品的测序深度。
10(c):从靶向的测序数据中鉴定定相变异
10(c)(1):患者招募和临床样品收集
从北美和欧洲的六个中心(包括Stanford University,MD AndersonCancerCenter,the National Cancer Institute,University of Eastern Piedmont(Italy),Essen University Hospital(Germany)和CHU Dijon(France))招募接受一线疗法的B细胞淋巴瘤患者到此研究中。此研究总共包括来自183名患者的343个细胞游离DNA、73个肿瘤和183个种系样品。所有患者样品均在书面知情同意下收集用于研究,并根据赫尔辛基宣言获得相应机构审查委员会的批准。如前所述分离细胞游离、肿瘤和种系DNA。所有放射照相成像作为标准临床护理的一部分进行。
10(c)(2):文库制备和测序
为了生成测序文库和靶向的测序数据,如前所述应用CAPP-Seq。简而言之,按照KAPA Hyper Prep Kit制造商的说明,使用细胞游离、肿瘤和种系DNA通过末端修复、A加尾和衔接子连接构建测序文库,其中连接在4℃下过夜进行。具有独特分子标识符(UMID)的CAPP-Seq衔接子用于独特的DNA双链体的条形码化和测序读数对的随后去重复。然后使用上述PhasED-Seq实验组执行杂交捕获(SeqCap EZ Choice;NimbleGen)。根据制造商的方案进行亲和捕获,所有47℃杂交均在Eppendorf热循环仪上进行。富集后,使用IlluminaHiSeq4000仪器以2x150bp双端(PE)读数对文库进行测序。
10(c)(3):预处理和比对
对FASTQ文件进行多路分解并且使用如前所述的定制管线提取UMID。多路分解后,使用BWA ALN将读数与人基因组(build GRCh37/hg19)比对。然后如前所述进行分子条形码介导的错误抑制和背景抛光(即,集成数字错误抑制;iDES)。
10(c)(4):定相变异的鉴定和等位基因定量
在生成UMID错误抑制比对文件(例如,BAM文件)之后,如下从每个样品中鉴定PV。首先,进行未受累的外周血单核细胞(PBMC)的匹配的种系测序,以鉴定患者特异性的组成性单核苷酸多态性(SNP)。这些被定义为变异等位基因分数(VAF)高于40%且深度为至少10或VAF高于0.25%且深度至少为100的非参考位置。接下来,对感兴趣的样品从读数水平数据鉴定PV。在UMID介导的错误抑制之后,每个个体双端(PE)读取和所鉴定的所有非参考位置使用“samtools calmd”。使用PE数据而不是单个读数来鉴定发生在同一模板DNA分子上的变异,其随后可能落入读数1或读数2。任何包含≥2个非参考位置的读数对都被认为代表可能的体细胞PV。对于具有>2个非参考位置的读数,大小≥2的每个排列被独立考虑:即,如果在一个读数对中鉴定出4个非参考位置,则独立考虑2个SNV的所有组合(即“双联体”定相变异)和3个SNV的所有组合(即“三联体”定相变异)。包含推定的种系SNP的PV也被如下移除:如果在给定的n聚体(即在给定分子上同相的n个SNV)中,≥n-1的组分变异被鉴定为种系SNP,则PV被编辑。这种过滤策略确保对于任何剩余的PV,至少2个组分SNV在种系中未被见到,如对于灵敏度和特异性相关的。
在考虑来自用作对照的170个种系DNA样品的测序数据时,使用启发式黑名单方法过滤推定的体细胞PV。在这些样品中的每一个中,如上所述在读数对上鉴定PV,但没有过滤匹配的种系。在这些对照样品中的一个或多个中,出现在一个或多个双端读数中的任何PV都包含在黑名单中,并从患者特异性的体细胞PV列表中删除。
为了计算每个PV的VAF,在代表覆盖感兴趣的基因组区域的DNA分子总数的分母上计算代表包含感兴趣的PV的DNA分子数量的分子。也就是说,分子只是包含给定PV的去重读数对的总数,而分母是跨越给定PV的基因组基因座的读数对的数量。
10(c)(5):基因分型来自预处理样品的定相变异
上述策略在每个样品中产生了≥1读数深度的PV的列表。为了鉴定用作疾病监测的肿瘤特异性体细胞报告分子的PV,对于每个病例,鉴定“最佳基因分型”样品(来自肿瘤组织活检(优选)的DNA或预处理的细胞游离DNA)。在鉴定“最佳基因分型样品”中所有可能的PV后,进一步如下过滤针对特异性的列表。对于任何n聚体PV集合,如果在上述170个对照样品中存在≥n-1个组成SNV作为种系SNP,则移除PV。此外,仅考虑满足以下标准的PV:1)AF>1%;2)≥100个读数对的PV基因座的深度,以及3)至少一个组分SNV必须在中靶空间中。最后,4)在12个健康对照cfDNA样品的队列中就读数支持评估符合这些标准的任何PV。如果在这12个样品中的>1个中存在任何读数支持,则移除PV。对于从通过SNV鉴定为低肿瘤分数的细胞游离DNA样品的基因分型(即,所有SNV中小于1%的平均AF),用于确定PV的AF阈值放宽至>0.2%。这种过滤产生了用于疾病监测和MRD检测的PV列表。
10(c)(6):根据定相变异确定样品中的肿瘤分数
为了使用肿瘤基因型的先验知识针对微小残留病(MRD)评估样品,可以评估在感兴趣的MRD样品中在最佳预处理基因分型样品中鉴定的任何PV的存在。考虑到在最佳基因分型样品中观察到的k个可能的肿瘤来源的PV的列表,确定了覆盖k个可能PV中的至少1个的所有读数对。这个值d可以被认为是在PhasED-Seq实验中cfDNA分子跨越的所有PV中的聚合“信息深度”。然后评估这些d读数对中有多少实际上包含k个可能的PV中的1个或更多个,此值x代表给定样品中包含体细胞PV的肿瘤来源分子的数量。因此,包含PV的肿瘤来源分子的数量除以信息深度(x/d)是给定样品中的定相变异肿瘤分数(PVAF)。为了检测每个样品中的MRD,独立计算双联体、三联体和四联体PV的PVAF。
10(c)(7):针对样品内PV检测的经验显著性的Monte Carlo模拟
为了评估在任何样品中肿瘤来源PV的检测的统计显著性,实施了经验显著性测试方法。检验统计量f首先定义如下—从在最佳基因分型样品中观察到的k个可能的肿瘤衍生PV的给定列表,计算所有k个PV的等位基因分数的算术平均值(等位基因分数定义为相对于跨越PV位置的读数对数量(di)的包含个体PV的读数对的数量(xi)):
以评估f与从同一样品评估的类似PV的背景错误率没有显著差异的假设。MonteCarlo方法用于开发零分布并执行如下统计测试:
1.考虑到一组k个PV,{pv1...pvi...pvk},生成PV的“替代”列表,{pv′1...pv′i...pv′k},以使得对于每个替代PV具有与测试PV相同类型的碱基变化和SNV之间的距离。例如,如果双联体PV chr14:106329929C>T和chr14:106329977G>A在基因分型样品中被鉴定,则搜寻与参考碱基C和G处于相同基因组距离(这里是48bp)的两个替代位置并使用以下启发式搜索方案评估具有相同类型碱基变化(即C>T和G>A)的读数对。
2.对于k组中的每个肿瘤pvi,鉴定了50个这样的替代物。这是用随机搜索算法执行的,以扫描基因组空间并鉴定替代物。为了找到这50个替代物,鉴定了在与测试pvi相同的染色体上的随机位置,然后在与上述相同的基因组距离处搜索相同类型的参考碱基。观察到的/替代的PV的同线性用于控制SHM/aSHM中的区域变异以及拷贝数变异,作为无效分布的潜在混杂因素。被鉴定为种系SNP(定义为具有AF>5%)的替代位置被排除在外。
3.在对于每个pvi鉴定50个这样的替代物之后,为k个原始PV中的每一个生成了1个替代物的10,000个随机排列,并计算了在就MRD的存在评估的感兴趣的样品中这些替代物列表的定相变异分数f’,如上所述。
4.计算了经验P值,定义为在10,000个随机PV列表中观察到真实定相变异分数f小于或等于替代f'的次数,作为感兴趣的血液样品中MRD显著性的经验显著性度量。
虽然此得到的比较是与感兴趣的样品内经验定义的背景PV错误率相比较的肿瘤报告因子列表的PV检测的显著性的度量,但还评估了其与病例和对照样品中的检测特异性的关系,如下面所描述的。
10(c)(8):PhasED-Seq的特异性的评估
为了通过PhasED-Seq确定疾病和MRD检测的特异性,首先使用预处理肿瘤或血浆DNA以及配对的种系样品鉴定来自107名DLBCL患者的患者特异性PV。然后使用上文概述的Monte Carlo方法评估来自健康个体的40个独立血浆DNA样品的这些患者特异性PV的存在。P值的阈值由MonteCarlo凭经验确定,以便对于从双联体、三联体和四联体PV的疾病检测获得95%的特异性。对每个大小的PV产生≥95%特异性的P值阈值如下:双联体<0.041,三联体<1,四联体<1。这种特异性在对照cfDNA分析中的结果显示在图15和16A中。
10(c)(9):错误率的计算
为了评估孤立的SNV和PV的错误特征谱,在所有读数中检查了每种类型的变异的非参考碱基观察率。对于孤立的SNV,在考虑参考等位基因的所有可能的碱基变化时,每个可能的碱基变化的错误率en1>n1′计算为其中参考等位基因n1被突变为替代等位基因n1’的中靶碱基的分数。非参考等位基因率超过5%的位置被归类为可能的种系事件,并从错误率分析中排除。还计算了全局错误率,定义为从hg19参考等位基因到任何替代等位基因的突变率。
对于定相变异,进行了类似的计算。对于由k个组成性碱基变化{en1>n1′...enk>nk′}组成的给定类型的定相变异的错误率,通过确定碱基变化的类型的实例数(即分子)以及碱基变化的可能实例数(即分母)来计算错误率。为了计算分子(N),计算给定样品中所有读数对中感兴趣的PV的出现次数。例如,为了计算C>T和G>A定相双联体的错误率,首先计算包含突变为T的参考C和突变为A的参考G的读数对的数量。
为了计算分母(D),还计算了此类型的定相变异的可能实例数;这是首先对每个读数对i执行的,然后对所有读数对进行求和。具有k个组分的PV可以概括为具有某一组参考碱基pA、pC、pG、pT,其中pN是PV中每个参考碱基的数量。类似地,给定的读数对包含某一组参考碱基bA、bC、bG、bT,其中bN是读数对中每个参考碱基的数量。因此,对于给定样品中的每个读数对,感兴趣的PV类型的可能出现次数可以组合计算为:
例如,考虑具有40个参考A、50个参考C、45个参考G和35个参考T的读数对。C>T和G>A PV的位置数为:
用于错误率计算的聚集分母D随后简单地是所有读数对的该值的总和。这种类型的PV的错误率简单地是N/D。
10(d):淋巴瘤亚型之间定相变异的差异
为了比较不同类型淋巴瘤中定相变异的分布,通过肿瘤活检样品和/或治疗前细胞游离DNA和配对的种系样品的测序,在101名DLBCL、16名PMBCL和23名cHL患者中鉴定了肿瘤特异性PV。在鉴定这些肿瘤特异性PV后,它们的分布在靶向的测序实验组中进行了评估。该实验组首先被划分为50bp的分箱;对于每个患者,然后确定每个患者是否在50bp分箱内有PV的证据,定义为在分箱内具有至少一个组分的PV。基于参考基因组的GENCODEv19注释,进一步确定最接近每个50bp分箱的基因。
为了评估淋巴瘤亚型之间PV的分布如何在特定基因水平上变化,检查了跨越每个基因(或最近的基因)的50bp分箱中的PV分布。例如,考虑在靶向的测序实验组中表示的具有n个这样的50bp分箱的给定的基因。对于每个分箱,首先确定PV落在50bp分箱内的每种类型淋巴瘤中的患者分数f,即,确定{ftyp1,1,…ftype1,n}和{ftyp2,1,…ftype2,n}。然后,随后比较任何两种组织学在分配给每个基因的一组50bp分箱中包含PV的病例的分数。这些比较在图2D和图10-12中的基因特异性图上针对个体基因进行了描述。
通过计算在分配给基因(即与给定基因或与给定的最近基因重叠)的所有分箱中每个50bp分箱中包含PV的患者的分数的差异来统计学比较特定淋巴瘤类型或亚型中相对于彼此的PV的富集。具体来说,对于两种淋巴瘤类型(type1和type2)之间的任何比较,首先在组织学之间鉴定PV率的这组差异{ftype1,1-ftype2,1,...ftype1,n-ftype2,n}。PV频率的这组基因特异性差异是通过Wilcoxon秩和检验在淋巴瘤类型之间针对测序实验组中所有其他50bp分箱的分布进行比较的。对于此测试,将分配至给定基因的n个50bp分箱的集合与所有其他50bp分箱进行比较(即6755-n,因为测序实验组中有6755个50bp分箱)。该P值连同组织学之间每个基因的在每个分箱中具有PV的患者的分数的平均差异被描绘为图2E中的火山图。为了解释不同组织学之间PV率的全局差异,通过减去所有基因的平均差异,将组织学之间具有PV的患者的分数的平均差异集中在0上。
10(e):杂交偏差
为了评估突变对杂交效率的影响,首先通过考虑在整个片段中包含0-30%突变的DNA片段来估计计算机模拟中突变分子对野生型捕获诱饵的亲和力。对于这个范围内的每个突变条件,首先从整个基因组中随机采样10,000个区域,每个区域的长度为150bp。然后对这些150聚体进行计算机模拟突变,从而以3种不同方式模拟所需的突变率:1)从序列末端开始突变“聚集”或连续的碱基,2)从序列中间开始突变聚集的碱基,或3)突变在整个序列的随机位置选择的碱基。然后使用energy.c软件包计算突变序列和野生型序列之间的理论结合能(kcal/mol),依赖于采用已建立的热力学参数的最近邻模型(图14A)。
然后通过在体外测试相同突变率的影响来复制这个计算机模拟实验。具体而言,寡核苷酸(IDT)被合成并退火以形成DNA双链体,其在相对于人参考基因组序列的定义位置上包含0-10%的突变。然后将这些合成DNA分子以等摩尔浓度捕获在一起,并定量突变的双链体与野生型、未突变物种相比的相对捕获效率(图3A)。从BCL6和MYC的编码区中选择两组寡核苷酸序列来捕获与每个基因相关的AID介导的异常体细胞超突变(表5);通过BWA ALN确保了突变物种的保持的可映射性。然后对这些合成的寡核苷酸双链体进行文库制备,然后使用PhasED-Seq进行捕获和测序,并使用不同的样品以一式三份进行。这允许直接与与参考基因组相同的野生型分子相比,评估杂交捕获和分子恢复的相对效率。
10(f):使用有限稀释系列的检测限的评估
为了凭经验确定PhasED-Seq的分析灵敏度,使用了来自3名患者的细胞游离DNA的有限稀释系列,其以定义的浓度掺入健康对照细胞游离DNA中。稀释系列包含预期平均肿瘤分数为0.1%、0.01%、0.001%、0.0002%、0.0001%和0.00005%或范围为从1/1,000到1/2,000,000的样品。提供了通过CAPP-Seq、双链体测序和PhasED-Seq进行的测序特征和ctDNA定量。为了比较每种方法的性能,计算了每个患者i在每个稀释浓度j下观察到的和预期的肿瘤分数之间的差异δ:
对于每种ctDNA检测方法(CAPP-Seq、双链体、双联体PhaseED-Seq和三联体PhasED-Seq),针对患者i={1,2,3}和浓度j={0.001%,0.0002%,0.0001%,0.00005%}计算该值。然后通过这组患者和浓度上的配对t检验将每种方法的性能相互比较。
10(g):预测给定的一组定相变异的检测概率的模型
为了构建数学模型来预测给定感兴趣的样品的检测概率,首先假设cfDNA检测可以被视为基于二项式采样的随机过程。然而,与发生在彼此相距较大基因组距离处的SNV不同,PV的检测可能是高度相互依赖的,尤其是当PV是简并的(即,当两个PV共享组分SNV时)或非常接近地存在时。为了考虑这一点,只有彼此相距>150bp的PV才被视为独立的“肿瘤报告因子”。因此,可以如下确定允许在给定样品中检测疾病的“肿瘤报告因子”的数量。PhasED-Seq实验组被分成150bp的分箱。然后,将给定患者的报告因子列表中的每个PV转换为BED坐标,其由起始位置(定义为最左侧的组分SNV)和结束位置(定义为最右侧的组分SNV)组成。对于每个PV,确定来自包含PV的PhasED-Seq选择器实验组的150bp分箱;如果PV跨越两个或更多150bp分箱,则将它分配到两个分箱。然后,将独立肿瘤报告因子的数量定义为包含肿瘤特异性PV的单独150bp分箱的数量。
然后开发了一个数学模型,其将给定肿瘤分数的给定样品的预期检测概率与给定数量的独立肿瘤报告因子(例如,150bp分箱)进行比较。对于肿瘤报告因子的给定数量r、给定的肿瘤分数f、给定的测序深度d,检测包含肿瘤特异性PV的1个或多个细胞游离DNA分子的概率可以基于简单二项式抽样定义为:
Pr(检测)=1-Pr(未检测) (5)
然而,由于ctDNA检测方法被训练为具有5%的假阳性率,因此该假阳性率项也被添加到模型中:
Pr(检测)=1-Pr(未检测)+0.05*Pr(未检测) (7)
Pr(检测)=1-0.95*Pr(未检测) (8)
图3G显示了在5000的深度d处对于从3到67的肿瘤报告因子r的范围的该模型的结果。该图上的置信包络显示了从4000到6000的深度d范围的解。
为了凭经验验证评估疾病检测的概率的该模型,使用了来自有限稀释系列的样品。在此稀释系列中,将3个患者cfDNA样品(每个包含患者特异性PV)掺入健康对照cfDNA中。对于患者特异性PV的每个列表,对包含患者特异性PV的150bp分箱进行25次随机子采样,以生成包含可变数量的肿瘤特异性报告因子的报告因子列表。选择67的最大分箱数以允许从所有3个患者特异性的PV列表采样,然后将每次操作的分箱数缩小2倍或3倍。这导致报告因子列表包含来自3、6、17、34或67个独立150bp分箱的患者特异性PV。然后使用在从1:1,000到1:1,000,000的“湿”有限稀释样品的每一个中具有增加大小的这些患者特异性PV列表中的每一个评估疾病检测(图3H,闭合圆圈)。使用来自具有不同预期肿瘤含量的有限稀释样品的测序读数进一步创建计算机模拟混合物,并再次使用不同长度的患者特异性子采样的PV报告因子列表评估疾病检测的概率(空心圆圈)。对于这个实验,“湿”和“计算机模拟”稀释bam文件都进行了下采样,以实现~4000-6000x的深度,以与建模的深度相对应。所有下采样的bam文件的深度的最终平均值和标准偏差为4214x±789。对于给定的患者特异性PV列表,在给定的预期肿瘤分数的所有测试中总结了检测概率。对于每个给定的稀释度,考虑了多个独立采样的读数集,以允许更好地估计检测的真实概率。具体而言,表7中考虑了所示的每个稀释度的以下重复次数。
表7.用于预测给定的一组定相变异的检测概率每个稀释度的重复。
因此,对于每个患者特异性PV列表,测试的总数是随机子采样的PV列表的数量(例如,25)乘以独立下采样的bam文件的数量;上表提供了这个数字。在图3H中,点和误差条代表所有三名患者的平均值、最小值和最大值。来自理论数学模型的疾病检测的预测概率与验证该模型的湿样品和计算机模拟样品之间的一致性显示在图3I中。
10(h):统计分析和软件可用性
除非另有说明,否则本说明书中报告的所有P值都是双侧的。使用Wilcoxon符号秩检验进行匹配的样品和群体的比较;使用Wilcoxon秩和检验进行从不相关群体中抽取的样品的比较。配对的样品的比较通过配对t检验进行。使用Kaplan-Meier方法估计存活概率;使用对数秩检验比较基于ctDNA水平的患者组的存活率。其他统计测试在使用的手稿文本中注明。所有分析均使用MATLAB 2018b版、R统计软件3.4.1版和GraphPad Prism 8.0.2版进行。使用所描述的COSMIC特征集(v2)使用解构Sigs R软件包评估已知突变过程对来自WGS的定相和孤立SNV的贡献。使用默认设置的R‘survivalROC’软件包版本1.0.3进行解释存活的AUC的计算和审查。用C++17开发的PhasED-Seq软件的可执行版本可获自phasedseq(dot)stanford(dot)edu。
实施例11
使用本公开内容的方法和系统,可以分析细胞游离核酸分子以检测其中包含的插入和缺失(插入缺失突变),并且检测到的插入缺失突变可以应用于各种应用(例如,确定受试者的病况(例如受试者的赘生物、受试者的癌症、受试者的移植排斥或受试者的胎儿的染色体异常)的存在或不存在;以及确定细胞游离核酸分子是否是肿瘤来源的)。
例如,使用本公开内容的方法和系统,可以分析来自已经接受器官或组织移植的受试者的细胞游离核酸分子,以检测其中包含的定相变异和/或插入和缺失(插入缺失突变),并且检测到的PV和/或插入缺失突变可以应用于各种应用(例如,确定受试者的移植排斥存在或不存在)。
作为另一个例子,使用本公开内容的方法和系统,可以分析来自怀孕受试者的细胞游离核酸分子以检测其中包含的定相变异和/或插入和缺失(插入缺失突变),并且检测到的PV和/或插入缺失突变可以应用于各种应用(例如,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险)。
虽然插入缺失突变与定相变异有一些共同的因素(例如,它们包含多个非参考碱基),但插入缺失突变也可能以各种方式与定相变异不同(例如,生物差异,其中生物插入缺失突变可以与单个DNA复制错误一起发生,而PV可能需要两个单独的错误;以及与映射相关的技术错误,其中插入缺失突变可能需要一个错配和/或非模板化事件,而定相变异可能需要两个或更多个此类错配和/或非模板化事件)。
在一些实施方案中,在细胞游离核酸分子中检测到的单独的插入缺失突变可通过利用其低背景或错误率而应用于各种应用(例如,确定受试者中病况例如作为赘生物或癌症的存在或不存在;并确定细胞游离核酸分子是否是肿瘤来源的)。在一些实施方案中,细胞游离核酸分子中与检测到的定相变异组合的检测到的插入缺失突变可以应用于各种应用(例如,确定受试者中病况例如赘生物或癌症的存在或不存在;以及确定细胞游离核酸分子是否是肿瘤来源的)。
分析了用于评估iDES增强的CAPP-Seq、双链体测序和PhasED-Seq中的错误或背景率的一组12个健康cfDNA样品,以也评估插入缺失突变的错误率。该分析是在相同的测序数据上进行的,使得错误率具有可比性。对于每种这些类型的改变如下定义了错误率或背景率。SNV背景率定义为相对于碱基总数的非参考碱基的数量,如本文所述。插入缺失突变背景率定义为在相对于碱基总数进行映射后观察到的插入缺失突变的总数,如本文所述。PV背景率被定义对于给定大小相对于可能的PV的总数的非参考PV的组合的总数,如本文所述。
所有以大于5%等位基因分数发生的事件都被认为是种系,并且在这里不包括在内。除了报告的SNV和PV中观察到的背景之外,图28显示了所有大小、大于或等于2个碱基对、大于或等于3bps、以及大于或等于4bps以及这组12个健康对照cfDNA样品中的插入缺失突变的背景率。
如图28表明,当仅考虑较大的插入缺失突变时,插入缺失突变的错误谱会有所改善。有趣的是,观察到长度为1bp或更长的插入缺失突变的背景率与没有计算机模拟错误抑制的SNV的背景率相似(分别为8.0E-5vs.8.0E-5)。然而,较长的插入缺失突变(例如,特别是长度大于或等于4bp的那些)具有较低的背景率,与来自双链体测序的SNV的背景率相当(8.9E-6vs.1.2E-5)。然而,观察到双联体和三联体PV的背景率均低于双链体和较大插入缺失突变的背景率(双联体和三联体PV的背景率分别为8.0E-7和3.5E-8)。值得注意的是,即使不使用UMI或分子条形码,PV的背景也较低。
PV的这种较低的背景率可能是生物学起源的。如本文所讨论的,SNV或插入缺失突变中存在真实生物学背景的巨大潜力,其可能大于PV,因为每个SNV或插入缺失突变可能仅需要一个体细胞突变事件,而PV可能需要至少两个体细胞事件。尽管如此,PV的背景率支持其提高针对来自细胞游离DNA的低水平肿瘤负荷的检测限的实用性。然而,在PV数量较少的情况下,跟踪较长的插入缺失突变(例如,长度大于或等于3bp)可能提供低错误率肿瘤报告因子的替代来源,以实现超灵敏的肿瘤监测。因此,可利用插入缺失突变监测作为检测和分析细胞游离DNA中的PV的补充或替代方法。
实施例12
使用本公开内容的方法和系统,可以分析来自已经接受器官或组织移植的受试者的细胞游离核酸分子,以检测其中包含的定相变异和/或插入和缺失(插入缺失突变),并且检测到的PV和/或插入缺失突变可应用于各种应用(例如,确定受试者的移植排斥的存在或不存在)。在一些实施方案中,受试者已经接受器官(例如,心脏、肾、肝、肺、胰腺、胃和肠)、组织(例如,角膜、骨、肌腱、皮肤、胰岛、心脏瓣膜、神经和静脉)、细胞(例如骨髓和干细胞)或肢体(例如手、手臂、脚)的移植。
在一些实施方案中,在鉴定受试者患有移植排斥后,该方法可以还包括治疗受试者的移植排斥。在一些实施方案中,治疗包括免疫抑制药物、基于抗体的治疗、血液转移、骨髓移植、基因治疗、移植物移除和/或再移植程序。在一些实施方案中,免疫抑制药物包括皮质类固醇(例如,泼尼松龙、氢化可的松)、钙调磷酸酶抑制剂(例如,环孢素、他克莫司)、抗增殖剂(例如,硫唑嘌呤、麦考酚酸)或mTOR抑制剂(例如,西罗莫司、依维莫司)。在一些实施方案中,基于抗体的治疗包括单克隆抗IL-2Rα受体抗体(例如,巴利昔单抗、达克珠单抗)、多克隆抗T细胞抗体(例如,抗胸腺细胞球蛋白(ATG)、抗淋巴细胞球蛋白(ALG)),或单克隆抗CD20抗体(例如利妥昔单抗)。
在一些实施方案中,可以随时间监测受试者(例如,通过分析细胞游离核酸分子以在多个不同时间点检测PV和/或插入缺失突变)以评估受试者的移植排斥状态和/或确定受试者的移植排斥状态的进展。
在一些实施方案中,检测到的受试者的PV和/或插入缺失突变可以与具有移植排斥的第一受试者队列和/或不具有移植排斥的第二受试者队列的PV和/或插入缺失突变进行比较。
实施例13
使用本公开内容的方法和系统,可以分析来自怀孕受试者的细胞游离核酸分子以检测其中包含的定相变异和/或插入和缺失(插入缺失突变),并且检测到的PV和/或插入缺失突变可以可应用于各种应用(例如,确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险)。
在一些实施方案中,在鉴定怀孕受试者的胎儿具有遗传异常后,该方法还可以包括治疗受试者或进行怀孕受试者的后续临床程序(例如,侵入性或非侵入性诊断程序)。
在一些实施方案中,检测到的受试者的PV和/或插入缺失突变可以与具有携带遗传异常的胎儿的第一受试者队列和/或不具有携带遗传异常的胎儿的第二受试者队列的PV和/或插入缺失突变进行比较。
在一些实施方案中,遗传异常是染色体非整倍性。在一些实施方案中,染色体非整倍性在染色体13、18、21、X或Y中。
实施例14
本文提供了贯穿本公开内容描述的表格的额外细节:
表1:在各种淋巴样赘生物中包含推定的定相变异(PV)的整个基因组中的感兴趣的1000bp区域。仅显示了包含>1个具有PV的受试者的区域。坐标在hg19中。来自先前被鉴定为激活诱导脱氨酶(AID)的靶标的基因的区域被标记。在任何组织学(BL、CLL、DLBCL、FL)中,在>5%的受试者中包含PV的区域也被标记。BL,伯基特淋巴瘤;CLL,慢性淋巴细胞白血病;DLBCL,弥漫性大B细胞淋巴瘤;FL,滤泡性淋巴瘤。
表2:在DLBCL的ABC和GCB亚型中包含推定的定相变异(PV)的整个基因组的感兴趣的1000bp区域。仅显示包含>1个具有PV的受试者的区域。坐标在hg19中。来自先前被鉴定为AID的靶标的基因的区域被标记。ABC,激活的B细胞亚型;GCB,生发中心B细胞亚型。
表3:用于集中于淋巴恶性肿瘤的本文中描述的PhasED-Seq捕获试剂的区域。坐标在hg19中。还显示了最接近的基因和纳入原因(定相变异相对一般性DLBCL基因分型)。
表4:针对不同类型的B细胞淋巴瘤(包括ABC和GCB亚型的DLBCL、PMBCL和cHL),在整个PhasED-Seq靶向的测序实验组中基因的基因座处PV的富集。PhasED-Seq选择器在hg19坐标中被分箱成50bp的分箱,每个分箱用基因或最近的基因标记。显示了在所有50bp分箱中具有PV的给定组织学病例的分数的平均值。显著性通过针对测序实验组的其余部分对给定基因的50bp分箱的秩和(Mann-Whitney U)检验来确定。显示了未校正的P值;多假设检验校正采用Bonferroni方法进行。DLBCL,弥漫性大B细胞淋巴瘤;PMBCL,原发性纵隔B细胞淋巴瘤;cHL,经典霍奇金淋巴瘤;ABC,激活的B细胞DLBCL;GCB,生发中心B细胞DLBCL。
表5:合成以评估在增加突变负荷的情况下的杂交和分子恢复偏好的寡核苷酸序列(SEQ ID NO.1331-1358)。
表6:用于B细胞癌症的捕获测序的核酸探针(SEQ ID NO.0001-1330)。
实施方案
以下是本公开内容的实施方案的说明性示例,并且不应该以任何方式进行限制。
1.一种方法,包括:
(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子,以确定所述受试者的病况。
2.根据实施方案1所述的方法,其中细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
3.根据实施方案1或2所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
4.一种方法,包括:
(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子,以确定所述受试者的病况。
5.根据实施方案4所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
6.一种方法,包括:
(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子,以确定所述受试者的病况。
7.根据实施方案6所述的方法,其中鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
8.根据实施方案6-7中任一项所述的方法,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。
9.根据实施方案8所述的方法,其中所述多个定相变异的第一定相变异和所述多个定相变异的第二定相变异被至少一个核苷酸隔开。
10.根据实施方案6-9中任一项所述的方法,其中(a)至(c)通过计算机系统执行。
11.根据前述实施方案中任一项所述的方法,其中所述测序数据基于核酸扩增产生。
12.根据前述实施方案中任一项所述的方法,其中所述测序数据基于聚合酶链式反应产生。
13.根据前述实施方案中任一项所述的方法,其中所述测序数据基于扩增子测序产生。
14.根据前述实施方案中任一项所述的方法,其中所述测序数据基于下一代测序(NGS)产生。
15.根据前述实施方案中任一项所述的方法,其中所述测序数据基于非基于杂交的NGS产生。
16.根据前述实施方案中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。
17.根据前述实施方案中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
18.根据前述实施方案中任一项所述的方法,其中在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
19.根据实施方案6-18中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
20.一种治疗受试者的病况的方法,所述方法包括:
(a)鉴定用于治疗病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况,
其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且
其中,所述多个定相变异的存在指示所述受试者的病况;和
(b)基于(a)中的鉴定使所述受试者接受治疗。
21.根据实施方案20所述的方法,其中已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
22.一种监测受试者的病况的进展的方法,所述方法包括:
(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;
(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,
其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和
(c)基于病况的第一状态和病况的第二状态确定病况的进展,
其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
23.根据实施方案22所述的方法,其中所述病况的进展是所述病况的恶化。
24.根据实施方案22所述的方法,其中所述病况的进展是所述病况的至少部分缓解。
25.根据实施方案22-24中任一项所述的方法,其中所述多个定相变异的存在指示受试者的病况的第一状态或第二状态。
26.根据实施方案22-25中任一项所述的方法,其中在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。
27.根据实施方案22-26中任一项所述的方法,其中(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。
28.根据实施方案22-27中任一项所述的方法,其中所述病况的进展指示所述受试者的病况的微小残留病。
29.根据实施方案22-28中任一项所述的方法,其中所述病况的进展指示所述受试者的肿瘤负荷或癌症负荷。
30.根据前述实施方案中任一项所述的方法,其中用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
31.根据实施方案22-30中任一项所述的方法,其中已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定受试者患有所述病况。
32.根据实施方案22-31中任一项所述的方法,其中所述受试者已经接受器官或组织移植,并且其中所述病况包括所述受试者的移植排斥。
33.一种方法,包括:
(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,和
其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
34.根据实施方案33所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
35.根据实施方案33-34中任一项所述的方法,其中所述受试者已经接受器官或组织移植,并且其中所述病况包括所述受试者的移植排斥。
36.一种方法,包括:
(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且
其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
37.根据实施方案36所述的方法,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
38.根据实施方案36或37所述的方法,其中所述多个定相变异的第一定相变异和所述多个定相变异的第二定相变异被至少一个核苷酸隔开。
39.根据实施方案36-38中任一项所述的方法,其中在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。
40.根据实施方案36-38中任一项所述的方法,其中在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。
41.根据实施方案36-40中任一项所述的方法,其还包括混合(1)所述核酸探针组和(2)所述多个细胞游离核酸分子。
42.根据实施方案36-41中任一项所述的方法,其中所述可激活报告剂是荧光团。
43.根据前述实施方案中任一项所述的方法,其中分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。
44.根据前述实施方案中任一项所述的方法,其中对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。
45.根据前述实施方案中任一项所述的方法,其中来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示受试者的病况。
46.根据实施方案45所述的方法,其中(i)来自所述一个或多个细胞游离核酸分子的所述多个定相变异的数量与(ii)来自所述一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示所述受试者的病况。
47.根据前述实施方案中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子中的所述多个定相变异的频率指示所述受试者的病况。
48.根据实施方案47所述的方法,其中所述频率指示与所述病况相关的患病细胞。
49.根据实施方案48所述的方法,其中所述病况是弥漫性大B细胞淋巴瘤,并且其中所述频率指示所述一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。
50.根据前述实施方案中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子的基因组期源指示所述受试者的病况。
51.根据前述实施方案中任一项所述的方法,其中第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。
52.根据前述实施方案中任一项所述的方法,其中第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
53.根据前述实施方案中任一项所述的方法,其中包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
54.根据前述实施方案中任一项所述的方法,其中所述多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
55.根据前述实施方案中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
56.根据前述实施方案中任一项所述的方法,其中所述参考基因组序列来源于参考队列。
57.根据实施方案56所述的方法,其中所述参考基因组序列包含来自所述参考队列的共有序列。
58.根据实施方案56所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
59.根据前述实施方案中任一项所述的方法,其中所述参考基因组序列来源于所述受试者的样品。
60.根据实施方案59所述的方法,其中所述样品是健康样品。
61.根据实施方案60所述的方法,其中所述样品包含健康细胞。
62.根据实施方案61所述的方法,其中所述健康细胞包括健康白细胞。
63.根据实施方案59所述的方法,其中所述样品是患病样品。
64.根据实施方案63所述的方法,其中所述患病样品包含患病细胞。
65.根据实施方案64所述的方法,其中所述患病细胞包括肿瘤细胞。
66.根据实施方案63所述的方法,其中所述患病样品包括实体瘤。
67.根据前述实施方案中任一项所述的方法,其中核酸探针组是基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者或健康队列的健康细胞的测序数据而鉴定的多个定相变异设计的。
68.根据实施方案67所述的方法,其中所述健康细胞来自所述受试者。
69.根据实施方案67所述的方法,其中所述健康细胞来自所述健康队列。
70.根据前述实施方案中任一项所述的方法,其中所述核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。
71.根据实施方案70所述的方法,其中已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
72.根据前述实施方案中任一项所述的方法,其中所述核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。
73.根据前述实施方案中任一项所述的方法,其中所述核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。
74.根据前述实施方案中任一项所述的方法,其中所述核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
75.根据前述实施方案中任一项所述的方法,其还基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子,确定受试者患有病况或确定受试者的病况的程度或状态。
76.根据实施方案75所述的方法,其还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。
77.根据实施方案76所述的方法,其中所述统计模型分析包括Monte Carlo统计分析。
78.根据前述实施方案中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子来监测受试者的病况的进展。
79.根据前述实施方案中任一项所述的方法,其还包括进行不同的程序以确认所述受试者的病况。
80.根据实施方案79所述的方法,其中所述不同的程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
81.根据前述实施方案中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。
82.根据前述实施方案中任一项所述的方法,其中所述受试者在(a)之前已接受针对病况的治疗。
83.根据前述实施方案中任一项所述的方法,其中所述治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。
84.根据前述实施方案中任一项所述的方法,其中所述多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
85.根据前述实施方案中任一项所述的方法,其中所述病况包括疾病。
86.根据前述实施方案中任一项所述的方法,其中所述多个细胞游离核酸分子来源于所述受试者的身体样品。
87.根据实施方案86所述的方法,其中所述身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
88.根据前述实施方案中任一项所述的方法,其中所述受试者是哺乳动物。
89.根据前述实施方案中任一项所述的方法,其中所述受试者是人。
90.根据前述实施方案中任一项所述的方法,其中所述病况包括赘生物、癌症或肿瘤。
91.根据实施方案90所述的方法,其中所述病况包括实体瘤。
92.根据实施方案90所述的方法,其中所述病况包括淋巴瘤。
93.根据实施方案92所述的方法,其中所述病况包括B细胞淋巴瘤。
94.根据实施方案93所述的方法,其中所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
95.根据前述实施方案中任一项所述的方法,其中根据对先前肿瘤样品或细胞游离核酸样品进行测序,多个定相变异先前已被鉴定为肿瘤来源的。
96.根据实施方案36-95中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
97.根据实施方案36-96中任一项所述的方法,其中所述受试者已经接受器官或组织移植,并且其中所述病况包括所述受试者的移植排斥。
98.一种包含诱饵组的组合物,所述诱饵组包含一组核酸探针,其被设计为捕获细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约5%的基因组区域。
99.根据实施方案98所述的组合物,其中所述核酸探针组被设计成下拉细胞游离DNA分子,所述细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的基因组区域。
100.根据实施方案98-99中任一项所述的组合物,其中所述核酸探针组被设计成捕获一个或多个细胞游离DNA分子,所述一个或多个细胞游离DNA分子来源于(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域中所示的至多约10%、至多约20%、至多约30%、至多约40%、至多约50%、至多约60%、至多约70%、至多约80%、至多约90%或约100%的基因组区域。
101.根据实施方案98-100中任一项所述的组合物,其中所述诱饵组包含至多5个、至多10个、至多50个、至多100个、至多500个、至多1000个或至多2000个核酸探针。
102.根据实施方案98-101中任一项所述的组合物,其中所述核酸探针组中的个体核酸探针包含下拉标签。
103.根据实施方案98-102中任一项所述的组合物,其中所述下拉标签包含核酸条形码。
104.根据实施方案98-103中任一项所述的组合物,其中所述下拉标签包含生物素。
105.根据实施方案98-104中任一项所述的组合物,其中每个细胞游离DNA分子的长度为约100个核苷酸至约180个核苷酸。
106.根据实施方案98-105中任一项所述的组合物,其中所述基因组区域与病况相关。
107.根据实施方案98-106中任一项所述的组合物,其中当受试者患有病况时,基因组区域表现出异常的体细胞超突变。
108.根据实施方案98-107中任一项所述的组合物,其中所述病况包括B细胞淋巴瘤。
109.根据实施方案108所述的组合物,其中所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
110.根据实施方案98-109中任一项所述的组合物,其还包含从获自或衍生自受试者的多个细胞游离DNA分子。
111.一种对个体执行临床程序的方法,所述方法包括:
获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,
其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,以及
其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;
在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;
利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和
基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
112.根据实施方案111所述的方法,其中所述活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
113.根据实施方案111所述的方法,其中所述基因组基因座选自(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
114.根据实施方案111所述的方法,其中所述核酸探针的序列选自表6。
115.根据实施方案111所述的方法,其中所述临床程序是血液测试、医学成像或体格检查。
116.根据实施方案111-115中任一项所述的方法,其还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
117.一种治疗个体的B细胞癌症的方法,所述方法包括:
获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,
其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,以及
其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;
在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异;
利用统计模型和所鉴定的定相变异确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸;和
基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
118.根据实施方案117所述的方法,其中所述活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
119.根据实施方案117所述的方法,其中所述基因组基因座选自(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域,或(iii)被鉴定为具有表3中的多个定相变异的基因组区域。
120.根据实施方案117所述的方法,其中所述核酸探针的序列选自表6。
121.根据实施方案117所述的方法,其中所述治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
122.根据实施方案117-121中任一项所述的方法,其还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果包含来源于赘生物的核苷酸。
123.一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,所述方法包括:
获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,
其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,
其中液体或废料活检是在一系列处理以检测微小残留病后获得的,以及
其中靶向测序是利用核酸探针下拉经确定为含有多个定相变异的基因组基因座的序列进行的,所述基因组基因座的序列由来源于癌症的先前活检的先前测序结果所确定;
在细胞游离核酸测序结果中鉴定或已经鉴定了多个定相变异中的至少一组;和
基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
124.根据实施方案123所述的方法,其中所述液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
125.根据实施方案123所述的方法,其中所述治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
126.根据实施方案123-125中任一项所述的方法,其还包括鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变),并且至少部分地基于所鉴定的一个或多个插入缺失突变来治疗个体以减少癌症。
127.一种计算机程序产品,其包含在其中编码计算机可执行代码的非暂时性计算机可读介质,该计算机可执行代码经调整以被执行以实现根据前述实施方案中任一项所述的方法。
128.一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器,其中计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现根据前述实施方案中任一项所述的方法。
129.一种方法,包括:
(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和
(c)通过计算机系统分析一个或多个插入缺失突变以确定受试者的病况。
130.一种方法,包括:
(a)获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个,其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变);和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
131.根据实施方案129或130所述的方法,其中鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
132.根据实施方案129-131中任一项所述的方法,其中(a)至(c)通过计算机系统执行。
133.根据实施方案129-132中任一项所述的方法,其中所述测序数据基于核酸扩增产生。
134.根据实施方案129-133中任一项所述的方法,其中所述测序数据基于聚合酶链式反应产生。
135.根据实施方案129-134中任一项所述的方法,其中所述测序数据基于扩增子测序产生。
136.根据实施方案129-135中任一项所述的方法,其中所述测序数据基于下一代测序(NGS)产生。
137.根据实施方案129-136中任一项所述的方法,其中所述测序数据基于非基于杂交的NGS产生。
138.根据实施方案129-137中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。
139.根据实施方案129-138中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
140.根据实施方案129-139中任一项所述的方法,其中在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
141.一种治疗受试者的病况的方法,所述方法包括:
(a)鉴定用于治疗病况的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有所述病况,
其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变),以及
其中所述一个或多个插入缺失突变的存在指示所述受试者的病况;和
(b)基于(a)中的鉴定使所述受试者接受治疗。
142.一种监测受试者的病况的进展的方法,所述方法包括:
(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;
(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,
其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和
(c)基于病况的第一状态和病况的第二状态确定病况的进展,
其中一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)。
143.根据实施方案142所述的方法,其中所述病况的进展是所述病况的恶化。
144.根据实施方案142所述的方法,其中所述病况的进展是所述病况的至少部分缓解。
145.根据实施方案142-144中任一项所述的方法,其中所述一个或多个插入缺失突变的存在指示受试者的病况的第一状态或第二状态。
146.根据实施方案142-145中任一项所述的方法,其中在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。
147.根据实施方案142-146中任一项所述的方法,其中(i)在从受试者获得第二多个细胞游离核酸分子之前和(ii)在从受试者获得第一多个细胞游离核酸分子之后,使受试者接受针对病况的治疗。
148.根据实施方案142-147中任一项所述的方法,其中所述病况的进展指示所述受试者的病况的微小残留病。
149.根据实施方案142-148中任一项所述的方法,其中所述病况的进展指示所述受试者的肿瘤负荷或癌症负荷。
150.根据实施方案142-149中任一项所述的方法,其中用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与病况相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
151.一种方法,包括:
(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,以及
其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
152.一种方法,包括:
(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含一个或多个插入或缺失(插入缺失突变)的靶细胞游离核酸分子的至少一部分杂交,以及
其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与一个或多个插入缺失突变的杂交,和(ii)已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含一个或多个插入缺失突变,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定所述受试者的病况。
153.根据实施方案151或152所述的方法,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
154.根据实施方案151-153中任一项所述的方法,其中在个体核酸探针与一个或多个插入缺失突变杂交后,可激活报告剂被激活。
155.根据实施方案151-154中任一项所述的方法,其中在已与一个或多个插入缺失突变杂交的个体核酸探针的至少一部分去杂交后,可激活报告剂被激活。
156.根据实施方案151-155中任一项所述的方法,其还包括混合(1)所述核酸探针组和(2)所述多个细胞游离核酸分子。
157.根据实施方案151-156中任一项所述的方法,其中所述可激活报告剂是荧光团。
158.根据实施方案151-157中任一项所述的方法,其中分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含一个或多个插入缺失突变的其他细胞游离核酸分子。
159.根据实施方案151-158中任一项所述的方法,其中对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含一个或多个插入缺失突变的其他细胞游离核酸分子。
160.根据实施方案151-159中任一项所述的方法,其中来自所鉴定的一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量指示受试者的病况。
161.根据实施方案151-160中任一项所述的方法,其中(i)来自一个或多个细胞游离核酸分子的一个或多个插入缺失突变的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。
162.根据实施方案151-161中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子中的一个或多个插入缺失突变的频率指示受试者的病况。
163.根据实施方案162所述的方法,其中所述频率指示与所述病况相关的患病细胞。
164.根据实施方案163所述的方法,其中所述病况是弥漫性大B细胞淋巴瘤,并且其中所述频率指示所述一个或多个细胞游离核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。
165.根据实施方案151-164中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的病况。
166.根据实施方案151-165中任一项所述的方法,其中所述一个或多个插入缺失突变包含同一细胞游离核酸分子内的至少3个、至少4个、至少5个或至少10个插入缺失突变。
167.根据实施方案151-166中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
168.根据实施方案151-167中任一项所述的方法,其中所述参考基因组序列来源于参考队列。
169.根据实施方案168所述的方法,其中所述参考基因组序列包含来自所述参考队列的共有序列。
170.根据实施方案168所述的方法,其中所述参考基因组序列包括hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
171.根据实施方案151-170中任一项所述的方法,其中所述参考基因组序列来源于所述受试者的样品。
172.根据实施方案171所述的方法,其中所述样品是健康样品。
173.根据实施方案172所述的方法,其中所述样品包含健康细胞。
174.根据实施方案173所述的方法,其中所述健康细胞包括健康白细胞。
175.根据实施方案171所述的方法,其中所述样品是患病样品。
176.根据实施方案175所述的方法,其中所述患病样品包含患病细胞。
177.根据实施方案176所述的方法,其中所述患病细胞包括肿瘤细胞。
178.根据实施方案175所述的方法,其中所述患病样品包括实体瘤。
179.根据实施方案151-178中任一项所述的方法,其中基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者的健康细胞或健康队列的测序数据而鉴定的一个或多个插入缺失突变来设计核酸探针组。
180.根据实施方案179所述的方法,其中所述健康细胞来自所述受试者。
181.根据实施方案179所述的方法,其中所述健康细胞来自所述健康队列。
182.根据实施方案151-181中任一项所述的方法,其中所述核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。
183.根据实施方案182所述的方法,其中已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
184.根据实施方案151-183中任一项所述的方法,其中所述核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域或(ii)表3中鉴定的基因组区域杂交。
185.根据实施方案151-184中任一项所述的方法,其中所述核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。
186.根据实施方案151-185中任一项所述的方法,其中所述核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
187.根据实施方案151-186中任一项所述的方法,其还包括基于所鉴定的包含一个或多个插入缺失突变的一个或多个细胞游离核酸分子来确定受试者患有病况或确定该受试者的病况的程度或状态。
188.根据实施方案187所述的方法,其还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与病况相关的样品。
189.根据实施方案188所述的方法,其中所述统计模型分析包括Monte Carlo统计分析。
190.根据实施方案151-189中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子来监测受试者的病况的进展。
191.根据实施方案151-190中任一项所述的方法,其还包括进行不同程序以确认所述受试者的病况。
192.根据实施方案191所述的方法,其中所述不同程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
193.根据实施方案151-192中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子来确定针对受试者的病况的治疗。
194.根据实施方案151-193中任一项所述的方法,其中所述受试者在(a)之前已接受针对病况的治疗。
195.根据实施方案151-194中任一项所述的方法,其中所述治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。
196.根据实施方案151-195中任一项所述的方法,其中所述多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
197.根据实施方案151-196中任一项所述的方法,其中所述病况包括疾病。
198.根据实施方案151-197中任一项所述的方法,其中所述多个细胞游离核酸分子来源于所述受试者的身体样品。
199.根据实施方案198所述的方法,其中所述身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
200.根据实施方案151-199中任一项所述的方法,其中所述受试者是哺乳动物。
201.根据实施方案151-200中任一项所述的方法,其中所述受试者是人。
202.根据实施方案151-201中任一项所述的方法,其中所述病况包括赘生物、癌症或肿瘤。
203.根据实施方案202所述的方法,其中所述病况包括实体瘤。
204.根据实施方案202所述的方法,其中所述病况包括淋巴瘤。
205.根据实施方案204所述的方法,其中所述病况包括B细胞淋巴瘤。
206.根据实施方案205所述的方法,其中所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
207.根据实施方案151-206中任一项所述的方法,其中所述一个或多个插入缺失突变先前已通过对先前的肿瘤样品或细胞游离核酸样品进行测序而被鉴定为肿瘤来源的。
208.一种对个体执行临床程序的方法,所述方法包括:
获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,
其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,以及
其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;
鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);
利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和
基于确定细胞游离核酸测序结果包含可能来源于B细胞癌症的核酸序列,对个体进行临床程序以确认B细胞癌症的存在。
209.根据实施方案208所述的方法,其中所述活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
210.根据实施方案208或209所述的方法,其中所述基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。
211.根据实施方案208-210中任一项所述的方法,其中所述核酸探针的序列选自表6。
212.根据实施方案208-211中任一项所述的方法,其中所述临床程序是血液测试、医学成像或体格检查。
213.一种治疗个体的B细胞癌症的方法,所述方法包括:
获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,
其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,以及
其中靶向测序是利用核酸探针下拉已知在B细胞癌症中经历异常体细胞超突变的基因组基因座的序列来进行的;
鉴定或已经鉴定细胞游离核酸测序结果中的一个或多个插入或缺失(插入缺失突变);
利用统计模型和所鉴定的一个或多个插入缺失突变确定或已经确定细胞游离核酸测序结果含有来源于赘生物的核苷酸;和
基于确定细胞游离核酸测序结果包含来源于B细胞癌症的核酸序列,治疗个体以减少B细胞癌症。
214.根据实施方案213所述的方法,其中所述活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
215.根据实施方案213或214所述的方法,其中所述基因组基因座选自(i)表1中鉴定的基因组区域,或(ii)表3中鉴定的基因组区域。
216.根据实施方案213-215中任一项所述的方法,其中所述核酸探针的序列选自表6。
217.根据实施方案213-216中任一项所述的方法,其中所述治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
218.一种检测个体中的癌性微小残留病并治疗所述个体的癌症的方法,所述方法包括:
获得或已经获得细胞游离核酸分子的收集物的靶向测序结果,
其中细胞游离核酸分子的收集物来源于个体的液体或废料活检,
其中液体或废料活检是在一系列处理以检测微小残留病后获得的,并且
其中靶向测序是利用核酸探针下拉经确定含有一个或多个插入或缺失(插入缺失突变)的基因组基因座的序列来进行的,如通过在来源于癌症的先前活检上的先前测序结果所确定的;
鉴定或已经鉴定了细胞游离核酸测序结果中的一个或多个插入缺失突变的至少一个集合;和
基于确定细胞游离核酸测序结果包含来源于癌症的核酸序列,治疗个体以减少癌症。
219.根据实施方案218所述的方法,其中所述液体或废料活检是血液、血清、脑脊液、淋巴液、尿液或粪便中的一种。
220.根据实施方案218或219所述的方法,其中所述治疗是化学疗法、放射疗法、免疫疗法、激素疗法、靶向药物疗法或医学监测。
221.一种计算机程序产品,其包含在其中编码计算机可执行代码的非暂时性计算机可读介质,该计算机可执行代码经调整以被执行以实现根据前述实施方案中任一项所述的方法。
222.一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器,其中计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现根据前述实施方案中任一项所述的方法。
223.一种方法,包括:
(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受了器官或组织移植的受试者;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
224.根据实施方案223所述的方法,其中细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
225.根据实施方案223或224所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
226.一种方法,包括:
(a)通过计算机系统获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受了器官或组织移植的受试者;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
227.根据实施方案226所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
228.一种方法,包括:
(a)获得来源于多个细胞游离核酸分子的测序数据,所述多个细胞游离核酸分子获自或衍生自已经接受了器官或组织移植的受试者;
(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
229.根据实施方案223-228中任一项所述的方法,其中鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
230.根据实施方案223-229中任一项所述的方法,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。
231.根据实施方案230所述的方法,其中所述多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
232.根据实施方案223-231中任一项所述的方法,其中(a)至(c)通过计算机系统执行。
233.根据实施方案223-232中任一项所述的方法,其中所述测序数据基于核酸扩增产生。
234.根据实施方案223-233中任一项所述的方法,其中所述测序数据基于聚合酶链式反应产生。
235.根据实施方案223-234中任一项所述的方法,其中所述测序数据基于扩增子测序产生。
236.根据实施方案223-235中任一项所述的方法,其中所述测序数据基于下一代测序(NGS)产生。
237.根据实施方案223-236中任一项所述的方法,其中所述测序数据基于非基于杂交的NGS产生。
238.根据实施方案223-237中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。
239.根据实施方案223-238中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
240.根据实施方案223-239中任一项所述的方法,其中在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
241.根据实施方案223-240中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
242.一种治疗已经接受器官或组织移植的受试者的移植排斥的方法,所述方法包括:
(a)鉴定用于治疗移植排斥的受试者,其中已基于来自从受试者获得或衍生的多个细胞游离核酸分子的一个或多个细胞游离核酸分子的鉴定确定受试者患有移植排斥,
其中所鉴定的一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,并且
其中所述多个定相变异的存在指示所述受试者的移植排斥;和
(b)基于(a)中的鉴定使所述受试者接受治疗。
243.根据实施方案242所述的方法,其中已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定所述受试者患有移植排斥。
244.根据实施方案242或243所述的方法,其中所述多个细胞游离核酸分子是来源于供体的细胞游离核酸分子。
245.根据实施方案242-244中任一项所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
246.根据实施方案242-245中任一项所述的方法,其中所述治疗选自免疫抑制药物、基于抗体的治疗、血液转移、骨髓移植、基因治疗、移植物移除和再移植程序。
247.根据实施方案246所述的方法,其中所述免疫抑制药物选自皮质类固醇、钙调磷酸酶抑制剂、抗增殖剂和mTOR抑制剂。
248.根据实施方案246所述的方法,其中所述基于抗体的治疗选自单克隆抗IL-2Rα受体抗体、多克隆抗T细胞和单克隆抗CD20抗体。
249.一种监测已经接受器官或组织移植的受试者的移植排斥的存在、不存在或程度的方法,所述方法包括:
(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第一状态;
(b)基于从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的移植排斥的存在、不存在或程度的第二状态,
其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和
(c)基于所述第一状态和所述第二状态来确定所述受试者的移植排斥状态,
其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
250.根据实施方案249所述的方法,其中所述移植排斥状态是至少部分的移植排斥。
251.根据实施方案249-250中任一项所述的方法,其中所述多个定相变异的存在指示所述第一状态或所述第二状态。
252.根据实施方案249-251中任一项所述的方法,其中在从受试者获得第一多个细胞游离核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个细胞游离核酸分子。
253.根据实施方案249-252中任一项所述的方法,其中已至少部分基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定所述受试者具有所述移植排斥的存在、不存在或程度。
254.根据实施方案249-253中任一项所述的方法,其中所述多个细胞游离核酸分子是来源于供体的细胞游离核酸分子。
255.根据实施方案249-254中任一项所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
256.一种方法,包括:
提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自已经接受器官或组织移植的受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,和
其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
257.根据实施方案253-256中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在或不存在。
258.根据实施方案253-257中任一项所述的方法,其中所述多个细胞游离核酸分子是来源于供体的细胞游离核酸分子。
259.根据实施方案253-258中任一项所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
260.一种方法,包括:
提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自已经接受器官或组织移植的受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且
其中个体核酸探针包含可激活报告剂,所述可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定受试者的移植排斥的存在、不存在或程度。
261.根据实施方案223-260中任一项所述的方法,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
262.根据实施方案223-261中任一项所述的方法,其中所述多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
263.根据实施方案223-262中任一项所述的方法,其中在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。
264.根据实施方案223-263中任一项所述的方法,其中在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。
265.根据实施方案223-264中任一项所述的方法,其还包括混合(1)所述核酸探针组和(2)所述多个细胞游离核酸分子。
266.根据实施方案223-265中任一项所述的方法,其中所述可激活报告剂是荧光团。
267.根据实施方案223-266中任一项所述的方法,其中分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。
268.根据实施方案223-267中任一项所述的方法,其中对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。
269.根据实施方案223-268中任一项所述的方法,其中来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示所述受试者的移植排斥的存在、不存在或程度。
270.根据实施方案269所述的方法,其中(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的移植排斥的存在、不存在或程度。
271.根据实施方案223-270中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示受试者的移植排斥的存在或不存在。
272.根据实施方案271所述的方法,其中所述频率指示与移植排斥的存在、不存在或程度相关的患病细胞。
273.根据实施方案223-272中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子的基因组起源指示受试者的移植排斥的存在或不存在。
274.根据实施方案223-273中任一项所述的方法,其中第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。
275.根据实施方案223-274中任一项所述的方法,其中第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
276.根据实施方案223-275中任一项所述的方法,其中包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
277.根据实施方案223-276中任一项所述的方法,其中所述多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
278.根据实施方案223-277中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
279.根据实施方案223-278中任一项所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
280.根据实施方案223-279中任一项所述的方法,其中所述核酸探针组被设计为与基因组基因座的序列的至少一部分杂交。
281.根据实施方案223-280中任一项所述的方法,其还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定移植排斥的存在或不存在或确定其程度或状态。
282.根据实施方案281所述的方法,其还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与移植排斥的存在或不存在相关的样品。
283.根据实施方案282所述的方法,其中所述统计模型分析包括Monte Carlo统计分析。
284.根据实施方案223-283中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子监测受试者的移植排斥的存在、不存在或程度的进展。
285.根据实施方案223-284中任一项所述的方法,还包括进行不同的程序以确认受试者的移植排斥的存在、不存在或程度。
286.根据实施方案285所述的方法,其中所述不同程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
287.根据实施方案223-286中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子确定针对受试者的移植排斥的治疗。
288.根据实施方案223-287中任一项所述的方法,其中所述多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
289.根据实施方案223-288中任一项所述的方法,其中所述多个细胞游离核酸分子来源于所述受试者的身体样品。
290.根据实施方案289所述的方法,其中所述身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
291.根据实施方案223-290中任一项所述的方法,其中所述受试者是哺乳动物。
292.根据实施方案223-291中任一项所述的方法,其中所述受试者是人。
293.根据实施方案223-292中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变来确定受试者的移植排斥的存在、不存在或程度。
294.根据实施方案257-293中任一项所述的方法,其中所述多个细胞游离核酸分子是来源于供体的细胞游离核酸分子。
295.一种方法,包括:
(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
296.根据实施方案295所述的方法,其中细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
297.根据实施方案295或296所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
298.根据实施方案295-297中任一项所述的方法,其中所述遗传异常是染色体非整倍性。
299.根据实施方案298所述的方法,其中所述染色体非整倍性在染色体13、18、21、X或Y中。
300.根据实施方案249-299中任一项所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
301.一种方法,包括:
(a)通过计算机系统获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
302.根据实施方案301所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
303.根据实施方案301-302中任一项所述的方法,其中所述遗传异常是染色体非整倍性。
304.根据实施方案303所述的方法,其中所述染色体非整倍性在染色体13、18、21、X或Y中。
305.一种方法,包括:
(a)获得来源于从怀孕受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
306.根据实施方案295-305中任一项所述的方法,其中鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
307.根据实施方案295-306中任一项所述的方法,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异。
308.根据实施方案307所述的方法,其中所述多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
309.根据实施方案295-308中任一项所述的方法,其中(a)至(c)通过计算机系统执行。
310.根据实施方案295-309中任一项所述的方法,其中所述测序数据基于核酸扩增产生。
311.根据实施方案295-310中任一项所述的方法,其中所述测序数据基于聚合酶链式反应产生。
312.根据实施方案295-311中任一项所述的方法,其中所述测序数据基于扩增子测序产生。
313.根据实施方案295-312中任一项所述的方法,其中所述测序数据基于下一代测序(NGS)产生。
314.根据实施方案295-313中任一项所述的方法,其中所述测序数据基于非基于杂交的NGS产生。
315.根据实施方案295-314中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的分子条形码化的情况下产生测序数据。
316.根据实施方案295-315中任一项所述的方法,其中在不使用多个细胞游离核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
317.根据实施方案295-316中任一项所述的方法,其中在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
318.根据实施方案295-317中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
319.根据实施方案295-318中任一项所述的方法,其中所述遗传异常是染色体非整倍性。
320.根据实施方案319所述的方法,其中所述染色体非整倍性在染色体13、18、21、X或Y中。
321.根据实施方案295-320中任一项所述的方法,其中用一组核酸探针从多个细胞游离核酸分子中捕获一个或多个细胞游离核酸分子,其中核酸探针组被配置为与包含与遗传异常相关的一个或多个基因组区域的细胞游离核酸分子的至少一部分杂交。
322.根据实施方案295-321中任一项所述的方法,已至少部分地基于在一个或多个细胞游离核酸分子中鉴定的一个或多个插入或缺失(插入缺失突变),确定胎儿具有遗传异常的存在、不存在或升高的风险。
323.一种方法,包括:
(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与靶细胞游离核酸分子的至少一部分杂交,所述靶细胞游离核酸分子相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,和
其中所述个体核酸探针包含可激活报告剂,可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
324.根据实施方案323所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于已鉴定的一个或多个插入缺失突变确定遗传异常的存在、不存在或升高的风险。
325.一种方法,包括:
(a)提供混合物,其包含(1)一组核酸探针和(2)获自或衍生自怀孕受试者的多个细胞游离核酸分子,
其中核酸探针组中的个体核酸探针被设计为与相对于参考基因组序列包含多个定相变异的靶细胞游离核酸分子的至少一部分杂交,并且
其中所述个体核酸探针包含可激活报告剂,可激活报告剂的激活选自:(i)个体核酸探针与多个定相变异的杂交,和(ii)已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交;
(b)检测被激活的可激活报告剂,以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个包含多个定相变异,其中鉴定步骤的检测限为小于多个细胞游离核酸分子的50,000个细胞游离核酸分子中的约1个;和
(c)分析所鉴定的一个或多个细胞游离核酸分子以确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
326.根据实施方案295-325中任一项所述的方法,其中所述鉴定步骤的检测限为小于多个细胞游离核酸分子的100,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的500,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,000,000个细胞游离核酸分子中的约1个、小于多个细胞游离核酸分子的1,500,000个细胞游离核酸分子中的约1个或小于多个细胞游离核酸分子的2,000,000个细胞游离核酸分子中的约1个。
327.根据实施方案295-326中任一项所述的方法,其中所述多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
328.根据实施方案295-327中任一项所述的方法,其中在个体核酸探针与多个定相变异杂交时,可激活报告剂被激活。
329.根据实施方案295-328中任一项所述的方法,其中在已与多个定相变异杂交的个体核酸探针的至少一部分的去杂交后,可激活报告剂被激活。
330.根据实施方案295-329中任一项所述的方法,其还包括混合(1)所述核酸探针组和(2)所述多个细胞游离核酸分子。
331.根据实施方案295-330中任一项所述的方法,其中所述可激活报告剂是荧光团。
332.根据实施方案295-331中任一项所述的方法,其中分析所鉴定的一个或多个细胞游离核酸分子包括分析(i)所鉴定的一个或多个细胞游离核酸分子和(ii)作为不同变量的多个细胞游离核酸分子中不包含多个定相变异的其他细胞游离核酸分子。
333.根据实施方案295-332中任一项所述的方法,其中对所鉴定的一个或多个细胞游离核酸分子的分析不基于多个细胞游离核酸分子的不包含多个定相变异的其他细胞游离核酸分子。
334.根据实施方案295-333中任一项所述的方法,其中来自所鉴定的一个或多个细胞游离核酸分子的多个定相变异的数量指示遗传异常。
335.根据实施方案334所述的方法,其中(i)来自一个或多个细胞游离核酸分子的多个定相变异的数量和(ii)来自一个或多个细胞游离核酸分子的单核苷酸变异(SNV)的数量的比率指示遗传异常。
336.根据实施方案295-335中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子中的多个定相变异的频率指示遗传异常。
337.根据实施方案295-336中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子的基因组起源指示遗传异常。
338.根据实施方案295-337中任一项所述的方法,其中第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。
339.根据实施方案295-338中任一项所述的方法,其中第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
340.根据实施方案295-339中任一项所述的方法,其中包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
341.根据实施方案295-340中任一项所述的方法,其中所述多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
342.根据实施方案295-341中任一项所述的方法,其中所鉴定的一个或多个细胞游离核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个细胞游离核酸分子。
343.根据实施方案295-342中任一项所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
344.根据实施方案295-343中任一项所述的方法,其中所述所述核酸探针组被设计为与基因组基因座的序列的至少一部分杂交。
345.根据实施方案295-344中任一项所述的方法,其中所述核酸探针组被设计为与遗传异常相关的基因组基因座的至少一部分序列杂交。
346.根据实施方案295-345中任一项所述的方法,其还包括基于所鉴定的包含多个定相变异的一个或多个细胞游离核酸分子确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
347.根据实施方案346所述的方法,其还包括基于对所鉴定的一个或多个细胞游离核酸分子进行统计模型分析来确定一个或多个细胞游离核酸分子来源于与怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险相关的样品。
348.根据实施方案347所述的方法,其中所述统计模型分析包括Monte Carlo统计分析。
349.根据实施方案295-348中任一项所述的方法,其还包括基于所鉴定的一个或多个细胞游离核酸分子来监测怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险的进展。
350.根据实施方案295-349中任一项所述的方法,其还包括进行不同的程序以确认怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
351.根据实施方案350所述的方法,其中所述不同程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
352.根据实施方案295-351中任一项所述的方法,其中所述多个细胞游离核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
353.根据实施方案295-352中任一项所述的方法,其中所述多个细胞游离核酸分子来源于怀孕受试者的身体样品。
354.根据实施方案353所述的方法,其中所述身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
355.根据实施方案295-354中任一项所述的方法,其中所述怀孕受试者是哺乳动物。
356.根据实施方案295-355中任一项所述的方法,其中所述怀孕受试者是人。
357.根据实施方案295-356中任一项所述的方法,其中(b)还包括鉴定所述一个或多个细胞游离核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失突变确定怀孕受试者的胎儿的遗传异常的存在、不存在或升高的风险。
358、一种方法,包括:
(a)通过计算机系统获得来源于从受试者获得或衍生的多个细胞游离核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个细胞游离核酸分子中的一个或多个细胞游离核酸分子,其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含多个定相变异,其中一个或多个细胞游离核酸分子中的至少约10%包含被至少一个核苷酸隔开的多个定相变异中的第一定相变异和多个定相变异中的第二定相变异;和
(c)通过计算机系统分析鉴定的一个或多个细胞游离核酸分子以确定受试者的病况。
359.根据实施方案358所述的方法,其中细胞游离核酸分子中的至少约10%包括一个或多个细胞游离核酸分子中的至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
360.根据实施方案358或实施方案359所述的方法,其中所述多个核酸分子是DNA分子。
361.根据实施方案360所述的方法,其中所述DNA分子是细胞DNA分子。
362.根据实施方案360所述的方法,其中所述细胞DNA分子来源于血液系统癌症细胞或循环肿瘤细胞。
363.根据实施方案360所述的方法,其中所述核酸分子是细胞游离DNA分子。
364.根据实施方案363所述的方法,其还包括确定所述cfDNA分子中的起始位置和结束位置中的一个或两者,并且至少部分基于所述cfDNA分子的所述起始位置和结束位置中的一个或两者来确定所述受试者是否患有所述病况。
365.根据实施方案358-359中任一项所述的方法,其中所述核酸分子是RNA分子。
366.根据实施方案365所述的方法,其中所述核酸分子是细胞游离RNA分子。
367.根据实施方案358-366中任一项所述的方法,其中在步骤(c)之前尚未确定所述受试者患有所述病况。
368.根据实施方案358-367中任一项所述的方法,其中分析所鉴定的一个或多个核酸分子以确定所述受试者的病况包括在之前未被诊断和/或怀疑患有所述癌症的患者中确定所述受试者的癌症。
369.根据实施方案358-368中任一项所述的方法,其中如通过参考所述参考基因组序列所确定的,所述定相变异在彼此的180bp以内、170bp以内、160bp以内或150bp以内。
370.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞单核苷酸变异(SNV)。
371.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞插入缺失。
372.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞易位断点。
373.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞扩增或缺失断点。
374.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是局部超突变区域。
375.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是相对于参考甲基化状态的甲基化状态变化。
376.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系单核苷酸变异(SNV)。
377.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系插入缺失突变。
378.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系易位断点。
379.根据实施方案358-369中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系扩增或缺失断点。
380.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞单核苷酸变异(SNV)。
381.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞插入缺失。
382.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞易位断点。
383.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞扩增或缺失断点。
384.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是局部超突变区域。
385.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是相对于参考甲基化状态的甲基化变化。
386.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系单核苷酸变异(SNV)。
387.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系插入缺失。
388.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系易位断点。
389.根据实施方案370-379中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系扩增或缺失断点。
390.根据实施方案358-389中任一项所述的方法,其中(b)还包括鉴定所述一个或多个核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
391.一种方法,包括:
(a)通过计算机系统获得来源于从受试者获得或衍生的多个核酸分子的测序数据;
(b)通过计算机系统处理测序数据以鉴定多个核酸分子中的一个或多个核酸分子,其中所述一个或多个核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异;和
(c)通过计算机系统分析所鉴定的一个或多个核酸分子以确定所述受试者的病况。
392.根据实施方案391所述的方法,其中所述多个核酸分子是DNA分子。
393.根据实施方案392所述的方法,其中所述DNA分子是细胞DNA分子。
394.根据实施方案392所述的方法,其中所述细胞DNA分子来源于血液系统癌症细胞或循环肿瘤细胞。
395.根据实施方案392所述的方法,其中所述核酸分子是细胞游离DNA分子。
396.根据实施方案395所述的方法,其还包括确定所述cfDNA分子的起始位置和结束位置中的一个或两者,并且至少部分基于所述cfDNA分子的所述起始位置和结束位置中的一个或两者来确定所述受试者是否患有所述病况。
397.根据实施方案391-396中任一项所述的方法,其中所述核酸分子是RNA分子。
398.根据实施方案397所述的方法,其中所述核酸分子是细胞游离RNA分子。
399.根据实施方案391-398中任一项所述的方法,其中在步骤(c)之前尚未确定所述受试者患有所述病况。
400.根据实施方案391-399中任一项所述的方法,其中分析所鉴定的一个或多个核酸分子以确定所述受试者的病况包括在之前未被诊断和/或怀疑患有所述癌症的患者中确定所述受试者的癌症。
401.根据实施方案391-400中任一项所述的方法,其中如通过参考所述参考基因组序列所确定的,所述定相变异在彼此的180bp以内、170bp以内、160bp以内或150bp以内。
402.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞单核苷酸变异(SNV)。
403.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞插入缺失。
404.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞易位断点。
405.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞扩增或缺失断点。
406.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是局部超突变区域。
407.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是相对于参考甲基化状态的甲基化状态变化。
408.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系单核苷酸变异(SNV)。
409.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系插入缺失突变。
410.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系易位断点。
411.根据实施方案391-401中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系扩增或缺失断点。
412.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞单核苷酸变异(SNV)。
413.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞插入缺失。
414.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞易位断点。
415.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞扩增或缺失断点。
416.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是局部超突变区域。
417.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是相对于参考甲基化状态的甲基化变化。
418.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系单核苷酸变异(SNV)。
419.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系插入缺失。
420.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系易位断点。
421.根据实施方案402-411中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系扩增或缺失断点。
422.根据实施方案391-421中任一项所述的方法,其中(b)还包括鉴定所述一个或多个核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
423、一种方法,包括:
(a)获得来源于从受试者获得或衍生的多个核酸分子的测序数据;
(b)处理测序数据以鉴定所述多个核酸分子中的一个或多个核酸分子,其检测限为小于来自测序数据的50,000个观察结果中的约1个;和
(c)分析所鉴定的一个或多个核酸分子以确定所述受试者的病况。
424.根据实施方案423所述的方法,其中鉴定步骤的检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
425.根据实施方案423-424中任一项所述的方法,其中所述一个或多个核酸分子中的每一个相对于参考基因组序列包含多个定相变异。
426.根据实施方案425所述的方法,其中所述多个定相变异中的第一定相变异和多个定相变异中的第二定相变异被至少一个核苷酸隔开。
427.根据实施方案423-426中任一项所述的方法,其中(a)至(c)通过计算机系统执行。
428.根据实施方案423-427中任一项的方法,其中所述多个核酸分子是DNA分子。
429.根据实施方案428所述的方法,其中所述DNA分子是细胞DNA分子。
430.根据实施方案428所述的方法,其中所述细胞DNA分子来源于血液系统癌症细胞或循环肿瘤细胞。
431.根据实施方案428所述的方法,其中所述核酸分子是细胞游离DNA分子。
432.根据实施方案431所述的方法,其还包括确定所述cfDNA分子的起始位置和结束位置中的一个或两者,并且至少部分基于所述cfDNA分子的所述起始位置和结束位置中的一个或两者来确定所述受试者是否患有所述病况。
433.根据实施方案423-427中任一项所述的方法,其中所述核酸分子是RNA分子。
434.根据实施方案433所述的方法,其中所述核酸分子是细胞游离RNA分子。
435.根据实施方案423-434中任一项所述的方法,其中在步骤(c)之前尚未确定所述受试者患有所述病况。
436.根据实施方案423-435中任一项所述的方法,其中分析所鉴定的一个或多个核酸分子以确定所述受试者的病况包括在之前未被诊断和/或怀疑患有所述癌症的患者中确定所述受试者的癌症。
437.根据实施方案423-436中任一项所述的方法,其中如通过参考所述参考基因组序列所确定的,所述定相变异在彼此的180bp以内、170bp以内、160bp以内或150bp以内。
438.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞单核苷酸变异(SNV)。
439.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞插入缺失。
440.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞易位断点。
441.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞扩增或缺失断点。
442.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是局部超突变区域。
443.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是相对于参考甲基化状态的甲基化状态变化。
444.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系单核苷酸变异(SNV)。
445.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系插入缺失突变。
446.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系易位断点。
447.根据实施方案423-437中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系扩增或缺失断点。
448.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞单核苷酸变异(SNV)。
449.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞插入缺失。
450.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞易位断点。
451.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞扩增或缺失断点。
452.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是局部超突变区域。
453.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是相对于参考甲基化状态的甲基化变化。
454.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系单核苷酸变异(SNV)。
455.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系插入缺失。
456.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系易位断点。
457.根据实施方案438-447中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系扩增或缺失断点。
458.附加前述实施方案中任一项所述的方法,其中所述测序数据基于核酸扩增产生。
459.根据前述实施方案中任一项所述的方法,其中所述测序数据基于聚合酶链式反应产生。
460.根据前述实施方案中任一项所述的方法,其中所述测序数据基于扩增子测序产生。
461.根据前述实施方案中任一项所述的方法,其中所述测序数据基于下一代测序(NGS)产生。
462.根据前述实施方案中任一项所述的方法,其中所述测序数据基于非基于杂交的NGS产生。
463.根据前述实施方案中任一项所述的方法,其中在不使用多个核酸分子的至少一部分的分子条形码化的情况下生成测序数据。
464.根据前述实施方案中任一项所述的方法,其中在不使用多个核酸分子的至少一部分的样品条形码化的情况下获得测序数据。
465.根据前述实施方案中任一项所述的方法,其中在没有(i)背景错误或(ii)测序错误的计算机模拟去除或抑制的情况下获得测序数据。
466.根据实施方案423-465中任一项所述的方法,其中(b)还包括鉴定所述一个或多个核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
467.一种治疗受试者的病况的方法,所述方法包括:
(a)鉴定用于治疗病况的受试者,其中已基于来自从受试者获得或衍生的多个核酸分子的一个或多个核酸分子的鉴定确定受试者患有所述病况,
其中所鉴定的一个或多个核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异,和
其中所述多个定相变异的存在指示所述受试者的病况;和
(b)基于(a)中的鉴定使所述受试者接受治疗。
468.根据实施方案467所述的方法,其中所述多个核酸分子是DNA分子
469.根据实施方案468所述的方法,其中所述DNA分子是细胞DNA分子。
470.根据实施方案468所述的方法,其中所述细胞DNA分子来源于血液系统癌症细胞或循环肿瘤细胞。
471.根据实施方案468所述的方法,其中所述核酸分子是细胞游离DNA分子。
472.根据实施方案471所述的方法,其还包括确定所述cfDNA分子的起始位置和结束位置中的一个或两者,并且其中至少部分基于所述cfDNA分子的所述起始位置和结束位置中的一个或两者鉴定用于治疗病况的受试者。
473.根据实施方案467所述的方法,其中所述核酸分子是RNA分子。
474.根据实施方案473所述的方法,其中所述核酸分子是细胞游离RNA分子。
475.根据实施方案467-474中任一项所述的方法,其中所述受试者未被预先确定为患有所述病况。
476.根据实施方案467-475中任一项所述的方法,其中使所述受试者接受治疗包括治疗所述受试者的癌症,其中所述受试者之前未被诊断和/或怀疑患有癌症。
477.根据实施方案467-476中任一项所述的方法,其中如通过参考所述参考基因组序列所确定的,所述定相变异在彼此的180bp以内、170bp以内、160bp以内或150bp以内。
478.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞单核苷酸变异(SNV)。
479.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞插入缺失。
480.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞易位断点。
481.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞扩增或缺失断点。
482.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是局部超突变区域。
483.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是相对于参考甲基化状态的甲基化状态变化。
484.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系单核苷酸变异(SNV)。
485.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系插入缺失突变。
486.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系易位断点。
487.根据实施方案467-477中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系扩增或缺失断点。
488.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞单核苷酸变异(SNV)。
489.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞插入缺失。
490.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞易位断点。
491.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞扩增或缺失断点。
492.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是局部超突变区域。
493.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是相对于参考甲基化状态的甲基化变化。
494.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系单核苷酸变异(SNV)。
495.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系插入缺失。
496.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系易位断点。
497.根据实施方案478-487中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系扩增或缺失断点。
498.根据实施方案467-497中任一项所述的方法,其中至少部分基于所述一个或多个核酸分子中的一个或多个插入或缺失(插入缺失突变)而已经确定所述受试者患有所述病况。
499.一种监测受试者的病况的进展的方法,所述方法包括:
(a)基于来自从受试者获得或衍生的第一多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第一集合的鉴定来确定受试者的病况的第一状态;
(b)基于来自从受试者获得或衍生的第二多个细胞游离核酸分子的一个或多个细胞游离核酸分子的第二集合的鉴定来确定受试者的病况的第二状态,
其中在从受试者获得第一多个细胞游离核酸分子之后,从受试者获得第二多个细胞游离核酸分子;和
(c)基于病况的第一状态和病况的第二状态确定病况的进展,
其中所述一个或多个细胞游离核酸分子中的每一个相对于参考基因组序列包含被至少一个核苷酸隔开的多个定相变异。
500.根据实施方案499所述的方法,其中所述病况的进展是所述病况的恶化。
501.根据实施方案499所述的方法,其中所述病况的进展是所述病况的至少部分缓解。
502.根据实施方案499-501中任一项所述的方法,其中所述多个定相变异的存在指示受试者的病况的第一状态或第二状态。
503.根据实施方案499-502中任一项所述的方法,其中在从受试者获得第一多个核酸分子后至少约1周、至少约2周、至少约3周、至少约4周、至少约2个月或至少约3个月,从受试者获得第二多个核酸分子。
504.根据实施方案499-503中任一项所述的方法,其中(i)在从受试者获得第二多个核酸分子之前和(ii)在从受试者获得第一多个核酸分子之后,使受试者接受针对病况的治疗。
505.根据实施方案499-504中任一项所述的方法,其中所述病况的进展指示所述受试者的病况的微小残留病。
506.根据实施方案499-505中任一项所述的方法,其中所述病况的进展指示所述受试者的肿瘤负荷或癌症负荷。
507.根据前述实施方案中任一项所述的方法,其中用一组核酸探针从所述多个细胞游离核酸分子中捕获所述一个或多个核酸分子,其中所述核酸探针组被配置为与包含病况相关的一个或多个基因组区域的核酸分子的至少一部分杂交。
508.根据实施方案499-507中任一项所述的方法,其中至少部分基于所述一个或多个核酸分子中所鉴定的一个或多个插入或缺失(插入缺失突变)而已经确定所述受试者患有所述病况。
509.根据实施方案499-508中任一项所述的方法,其中所述受试者已经接受器官或组织移植,并且其中所述病况包括所述受试者的移植排斥。
510.根据实施方案499-509所述的方法,其中所述多个核酸分子是DNA分子。
511.根据实施方案510所述的方法,其中所述DNA分子是细胞DNA分子。
512.根据实施方案510所述的方法,其中所述细胞DNA分子来源于血液系统癌症细胞或循环肿瘤细胞。
513.根据实施方案510所述的方法,其中所述核酸分子是细胞游离DNA分子。
514.根据实施方案513所述的方法,其还包括确定所述cfDNA分子的起始位置和结束位置中的一个或两者,并且其中至少部分基于所述cfDNA分子的所述起始位置和结束位置中的一个或两者鉴定用于治疗病况的受试者。
515.根据实施方案499-509中任一项所述的方法,其中所述核酸分子是RNA分子。
516.根据实施方案515所述的方法,其中所述核酸分子是细胞游离RNA分子。
517.根据实施方案499-516中任一项所述的方法,其中所述受试者未被预先确定为患有所述病况。
518.根据实施方案499-517中任一项所述的方法,其中使所述受试者接受治疗包括治疗受试者的癌症,其中所述受试者先前未被诊断和/或怀疑患有癌症。
519.根据实施方案499-518中任一项所述的方法,其中如通过参考所述参考基因组序列所确定的,所述定相变异在彼此的180bp以内、170bp以内、160bp以内或150bp以内。
520.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞单核苷酸变异(SNV)。
521.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞插入缺失。
522.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞易位断点。
523.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是体细胞扩增或缺失断点。
524.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是局部超突变区域。
525.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是相对于参考甲基化状态的甲基化状态变化。
526.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系单核苷酸变异(SNV)。
527.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系插入缺失突变。
528.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系易位断点。
529.根据实施方案499-519中任一项所述的方法,其中所述多个定相变异的第一定相变异是种系扩增或缺失断点。
530.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞单核苷酸变异(SNV)。
531.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞插入缺失。
532.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞易位断点。
533.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是体细胞扩增或缺失断点。
534.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是局部超突变区域。
535.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是相对于参考甲基化状态的甲基化变化。
536.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系单核苷酸变异(SNV)。
537.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系插入缺失。
538.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系易位断点。
539.根据实施方案520-529中任一项所述的方法,其中所述多个定相变异的第二定相变异是种系扩增或缺失断点。
540.根据前述实施方案中任一项所述的方法,其中分析所鉴定的一个或多个核酸分子包括分析(i)所鉴定的一个或多个核酸分子和(ii)作为不同变量的所述多个核酸分子中不包含所述多个定相变异的其他核酸分子。
541.根据前述实施方案中任一项所述的方法,其中对所鉴定的一个或多个核酸分子的分析不是基于所述多个核酸分子中不包含所述多个定相变异的其他核酸分子。
542.根据前述实施方案中任一项所述的方法,其中来自所鉴定的一个或多个核酸分子的所述多个定相变异的数量指示所述受试者的病况。
543.根据实施方案542所述的方法,其中(i)来自一个或多个核酸分子的多个定相变异的数量和(ii)来自一个或多个核酸分子的单核苷酸变异(SNV)的数量的比率指示受试者的病况。
544.根据前述实施方案中任一项的方法,其中所鉴定的一个或多个核酸分子中的所述多个定相变异的频率指示所述受试者的病况。
545.根据实施方案544所述的方法,其中所述频率指示与所述病况相关的患病细胞。
546.根据实施方案545所述的方法,其中所述病况是弥漫性大B细胞淋巴瘤,并且其中所述频率指示所述一个或多个核酸分子是否来源于生发中心B细胞(GCB)或激活的B细胞(ABC)。
547.根据前述实施方案中任一项所述的方法,其中所鉴定的一个或多个核酸分子的基因组起源指示所述受试者的病况。
548.根据前述实施方案中任一项所述的方法,其中第一定相变异和第二定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。
549.根据前述实施方案中任一项所述的方法,其中第一定相变异和第二定相变异被至多约180个、至多约170个、至多约160个、至多约150个或至多约140个核苷酸隔开。
550.根据前述实施方案中任一项所述的方法,其中包含多个定相变异的一个或多个细胞游离核酸分子中的至少约10%、至少约20%、至少约30%、至少约40%或至少约50%包含距相邻单核苷酸变异(SNV)至少2个核苷酸的SNV。
551.根据前述实施方案中任一项所述的方法,其中所述多个定相变异包括同一细胞游离核酸分子内的至少3个、至少4个、至少5个、至少10个、至少15个、至少20个或至少25个定相变异。
552.根据前述实施方案中任一项所述的方法,其中所鉴定的一个或多个核酸分子包含至少2个、至少3个、至少4个、至少5个、至少10个、至少50个、至少100个、至少500个或至少1,000个核酸分子。
553.根据前述实施方案中任一项所述的方法,其中所述参考基因组序列来源于参考队列。
554.根据实施方案553所述的方法,其中所述参考基因组序列包含来自所述参考队列的共有序列。
555.根据实施方案553所述的方法,其中所述参考基因组序列包含hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。
556.根据前述实施方案中任一项所述的方法,其中所述参考基因组序列来源于所述受试者的样品。
557.根据实施方案556所述的方法,其中所述样品是健康样品。
558.根据实施方案557所述的方法,其中所述样品包含健康细胞。
559.根据实施方案558所述的方法,其中所述健康细胞包括健康白细胞。
560.根据实施方案556所述的方法,其中所述样品是患病样品。
561.根据实施方案560所述的方法,其中所述患病样品包含患病细胞。
562.根据实施方案561所述的方法,其中所述患病细胞包括肿瘤细胞。
563.根据实施方案560所述的方法,其中所述患病样品包括实体瘤。
564.根据前述实施方案中任一项所述的方法,其中所述核酸探针组是基于通过比较(i)来自受试者的实体瘤、淋巴瘤或血液肿瘤的测序数据和(ii)来自受试者或健康队列的健康细胞的测序数据而鉴定的多个定相变异设计的。
565.根据实施方案564所述的方法,其中所述健康细胞来自所述受试者。
566.根据实施方案564所述的方法,其中所述健康细胞来自所述健康队列。
567.根据前述实施方案中任一项所述的方法,其中所述核酸探针组被设计为与病况相关的基因组基因座的序列的至少一部分杂交。
568.根据实施方案567所述的方法,其中已知当受试者患有病况时,病况相关的基因组基因座表现出异常的体细胞超突变。
569.根据前述实施方案中任一项所述的方法,其中所述核酸探针组被设计为与至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%的(i)表1中鉴定的基因组区域、(ii)表3中鉴定的基因组区域或(iii)被鉴定为具有表3中的多个定相变异的基因组区域杂交。
570.根据前述实施方案中任一项所述的方法,其中所述核酸探针组中的每个核酸探针与选自表6的探针序列具有至少约70%、至少约80%、至少约90%序列同一性、至少约95%序列同一性或约100%序列同一性。
571.根据前述实施方案中任一项所述的方法,其中所述核酸探针组包含至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的表6中的探针序列。
572.根据前述实施方案中任一项所述的方法,其还包括基于所鉴定的包含多个定相变异的一个或多个核酸分子,确定受试者患有病况或确定受试者的病况的程度或状态。
573.根据实施方案572所述的方法,其还包括基于对所鉴定的一个或多个核酸分子进行统计模型分析来确定一个或多个核酸分子来源于与病况相关的样品。
574.根据实施方案573所述的方法,其中所述统计模型分析包括Monte Carlo统计分析。
575.根据前述实施方案中任一项所述的方法,其还包括基于所鉴定的一个或多个核酸分子监测受试者的病况的进展。
576.根据前述实施方案中任一项所述的方法,其还包括进行不同的程序以确认受试者的病况。
577.根据实施方案576所述的方法,其中所述不同程序包括血液测试、基因测试、医学成像、体格检查或组织活检。
578.根据前述实施方案中任一项所述的方法,其还包括基于所鉴定的一个或多个核酸分子来确定针对受试者的病况的治疗。
579.根据前述实施方案中任一项所述的方法,其中所述受试者在(a)之前已接受针对病况的治疗。
580.根据前述实施方案中任一项所述的方法,其中所述治疗包括化学疗法、放射疗法、化学放射疗法、免疫疗法、过继细胞疗法、激素疗法、靶向药物疗法、手术、移植、输血或医学监测。
581.根据前述实施方案中任一项所述的方法,其中所述多个核酸分子包含多个细胞游离脱氧核糖核酸(DNA)分子。
582.根据前述实施方案中任一项所述的方法,其中所述病况包括疾病。
583.根据前述实施方案中任一项所述的方法,其中所述多个核酸分子来源于所述受试者的身体样品。
584.根据实施方案583所述的方法,其中所述身体样品包括血浆、血清、血液、脑脊液、淋巴液、唾液、尿液或粪便。
585.根据前述实施方案中任一项所述的方法,其中所述受试者是哺乳动物。
586.根据前述实施方案中任一项所述的方法,其中所述受试者是人。
587.根据前述实施方案中任一项所述的方法,其中所述病况包括赘生物、癌症或肿瘤。
588.根据实施方案587所述的方法,其中所述病况包括实体瘤。
589.根据实施方案587所述的方法,其中所述病况包括淋巴瘤。
590.根据实施方案589所述的方法,其中所述病况包括B细胞淋巴瘤。
591.根据实施方案590所述的方法,其中所述病况包括选自弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、伯基特淋巴瘤和B细胞慢性淋巴细胞白血病的B细胞淋巴瘤亚型。
592.根据前述实施方案中任一项所述的方法,其中根据对先前肿瘤样品或核酸样品进行测序,多个定相变异先前已被鉴定为肿瘤来源的。
593.根据实施方案499-592中任一项所述的方法,其中(b)还包括鉴定所述一个或多个核酸分子中的一个或多个插入或缺失(插入缺失突变),并且其中(c)还包括至少部分基于所鉴定的一个或多个插入缺失来确定所述受试者的病况。
594.根据实施方案499-593中任一项所述的方法,其中所述受试者已经接受器官或组织移植,并且其中所述病况包括所述受试者的移植排斥。
595.一种用于优先捕获包含定相变异的核酸分子的方法,所述方法包括将一组核酸探针添加到包含已从受试者获得或衍生的多个核酸分子的样品中,其中核酸探针组的每个核酸探针被配置为与包含多个定相变异的靶核酸分子杂交,使得核酸探针与从多个定相变异中的第一定相变异延伸至多个定相变异中的第二定相变异的靶核酸分子的至少一个区域互补。
596.根据实施方案595所述的方法,其中所述核酸探针组中的每个核酸探针都包含下拉标签。
597.根据实施方案595或596所述的方法,其还包括将与核酸探针杂交的靶核酸分子和不与核酸探针杂交的核酸分子分离,从而捕获靶核酸分子。
598.根据实施方案595或597所述的方法,其中所述下拉标签包含生物素。
599.根据实施方案595-598中任一项所述的方法,其中所述核酸分子是细胞游离核酸分子(例如,细胞游离DNA分子或细胞游离RNA分子)。
600.根据实施方案595-599中任一项所述的方法,其中所述第一定相变异是SNV,并且所述第二定相变异是SNV。
601.根据实施方案595-600中任一项所述的方法,其中所述第一定相变异选自体细胞单核苷酸变异、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点和局部超突变区域,并且所述第二定相变异选自体细胞单核苷酸变异、体细胞插入缺失突变、体细胞易位断点、体细胞扩增或缺失断点、种系SNV、种系插入缺失突变、种系易位断点、种系扩增或缺失断点以及局部超突变区域。
602.根据实施方案595-601中任一项所述的方法,其中多个定相变异中的第一定相变异和多个定相变异中的第二定相变异间隔至少1、2、3、4、5、10或20个核苷酸。
603.根据实施方案595-602中任一项所述的方法,其中所述核酸探针组中的每个核酸探针是(1)少于40个核苷酸、少于30个核苷酸或少于20个核苷酸,或(2)比多个定相变异中的第一定相变异与多个定相变异中的第二定相变异之间的距离长不超过5个核苷酸、不超过10个核苷酸、不超过20个核苷酸或不超过30个核苷酸,其中第一定相变异和第二定相变异是多个定相变异中最分离的定相变异。
604.根据实施方案595-603中任何一种的方法,其中靶核酸分子是来源于受试者的癌细胞或移植细胞的基因组的其序列与参考基因组序列不同的预先鉴定的部分的分子,其中基因组的预先鉴定的部分的长度小于200、小于180或小于150个核苷酸。
605.根据实施方案595-604中任一项所述的方法,其中多个核酸探针中的每个核酸探针与靶核酸分子的结合的ΔG比与在长度和序列上与靶核酸分子相同的对应分子的结合的ΔG更低,除该对应分子具有与参考基因组序列相对应的序列之外。
606.根据实施方案605所述的方法,其中参考基因组序列包含(1)参考队列的一部分,例如hg19人基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的一部分,或(2)来自受试者的健康样品的一部分。
607.根据实施方案595-606中任一项所述的方法,其中所述方法涉及捕获来源于染色体的沃森链或克里克链的靶核酸,但不涉及捕获另一条链的相应互补核酸。
608.根据实施方案595-607中任一项所述的方法,其中所述方法包括捕获至少10个、至少100个、至少1000个或至少10,000个靶核酸分子。
609.根据实施方案595-608中任一项所述的方法,其还包括对捕获的靶核酸进行测序以获得来源于多个核酸分子的测序数据。
610.根据实施方案609所述的方法,其中所述测序不涉及分子条形码的使用。
611.根据实施方案609或610所述的方法,其中所述测序不包括双链体测序。
612.一种用于确定受试者的病况的方法,所述方法包括:
通过计算机系统获得通过根据实施方案609-611中任一项实施方案所述的方法获得的序列信息;
通过所述计算机系统处理测序数据以鉴定所述多个核酸分子中的一个或多个核酸分子,其中所述一个或多个核酸分子中的每一个相对于参考基因组序列包含多个定相变异;和
通过所述计算机系统分析所鉴定的一个或多个核酸分子以确定所述受试者的病况。
613.根据实施方案612所述的方法,其中所述方法不包括双链体介导的错误抑制。
614.根据实施方案612或613所述的方法,其中所述方法不包括条形码介导的错误抑制。
615.一种用于从受试者的实体瘤样品鉴定经验证的定相变异的集合的方法,所述方法包括:
(a)通过计算机系统从受试者的实体瘤样品获得测序数据;
(b)通过计算机系统从受试者的匹配的非肿瘤样品获得测序数据;
(c)使用计算机系统分析来自实体瘤样品的测序数据和来自匹配的非肿瘤样品的测序数据,以鉴定受试者的基因组的包含第一推定的定相变异和第二推定的定相变异的多个区域,其中多个区域中的每一个的长度不超过170个碱基对;
(d)在(c)之后,对来自受试者的实体瘤样品的来自(c)中鉴定的多个区域的核酸进行靶向测序至至少250×的深度;
(e)使用计算机系统,基于来自(d)中的靶向测序的测序数据,从受试者的实体瘤样品鉴定经验证的定相变异的集合。
616.根据实施方案615所述的方法,其中所述第一推定的定相变异和所述第二推定的定相变异被至少一个核苷酸隔开。
617.根据实施方案615或616所述的方法,其中所述第一推定的定相变异和所述第二推定的定相变异被至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或至少8个核苷酸隔开。
618.根据实施方案615-617中任一项所述的方法,其中步骤(c)包括:
确定受试者的基因组中相对于匹配的非肿瘤样品存在于实体瘤样品中的多个单核苷酸变异;和
基于以下中的一项或多项从所鉴定的单核苷酸变异鉴定基因组的包含第一定相变异和第二定相变异的多个区域:(1)基因组内所鉴定的单核苷酸变异中的两个或更多个的接近度(例如,在170bp内)和(2)在来自受试者的实体瘤样品的序列数据的单个读数上,多个单核苷酸变异的存在。
619.根据实施方案615-618中任一项所述的方法,其中步骤(a)中的所述受试者的实体瘤样品的测序数据包括全基因组测序数据。
620.根据实施方案615-618中任一项所述的方法,其中步骤(a)中的所述受试者的实体瘤样品的测序数据包括所述受试者的基因组的至少50%、75%、80%、90%、95%或99%的数据。
621.根据实施方案615-618中任一项所述的方法,其中步骤(a)中的所述受试者的实体瘤样品的测序数据是全外显子组数据。
622.根据实施方案615-621中任一项所述的方法,其中步骤(b)中的所述受试者的匹配的非肿瘤样品的测序数据包括全基因组测序数据。
623.根据实施方案615-621中任一项所述的方法,其中步骤(b)中的所述受试者的匹配的非肿瘤样品的测序数据包括所述受试者的至少50%、75%、80%、90%、95%或99%的基因组的数据。
624.根据实施方案615-621中任一项所述的方法,其中步骤(b)中的所述受试者的匹配的非肿瘤样品的测序数据包括全外显子组数据。
625.根据实施方案615-624中任一项所述的方法,其中步骤(a)的测序以10×至500×、10×至250×、10×至200×、10×至100×或10×至50×的深度进行。
626.根据实施方案615-625中任一项所述的方法,其中步骤(b)的测序以10×至500×、10×至250×、10×至200×、10×至100×或10×至50×的深度进行。
627.根据实施方案615-626中任一项所述的方法,其中步骤(c)中的所述基因组的所鉴定的区域的数量包括至少400个、至少500个、至少700个、至少1000个、至少2000个、至少3000个、至少4000个或至少5000个区域。
628.根据实施方案615-627中任一项所述的方法,其中步骤(c)中的所述基因组的所鉴定的区域的数量不多于15,000个、10,000个或8,000个区域。
629.根据实施方案615-618中任一项所述的方法,其中步骤(c)中鉴定基因组的多个区域包括确定以下一项或多项:(i)来自受试者的实体瘤样品的个体读数中定相变异的存在,(ii)匹配的非肿瘤样品中读数支持的存在或不存在,(iii)支持读数上的其他非参考碱基的存在,(iv)碱基质量,(v)作图质量,和(vi)基因组位置的独特性。
630.根据实施方案615-629中任一项所述的方法,其中步骤(d)的靶向测序包括(1)杂交捕获与步骤(c)中的所述基因组的所鉴定的区域相对应的来自所述受试者的肿瘤样品的核酸,和(2)对所捕获的来自所述受试者的肿瘤样品的核酸进行测序。
631.根据实施方案615-630中任一项所述的方法,其中经验证的定相变异的集合数小于1000、小于900、小于800或小于700。
632.根据实施方案615-631中任一项所述的方法,其中经验证的定相变异的集合数大于10、大于20、大于50或大于80。
633.根据实施方案615-632中任一项所述的方法,其中步骤(c)中的所鉴定的区域是非重叠的区域。
634.根据实施方案615-633中任一项所述的方法,其中步骤(d)的核酸是DNA分子。
635.根据实施方案615-634中任一项所述的方法,其中所述第一定相变异和所述第二定相变异各自是单核苷酸变异。
636.根据前述实施方案中任一项所述的方法,其中所述匹配的非肿瘤样品是来自所述受试者的健康样品。
637.根据前述实施方案中任一项所述的方法,其中发现所述经验证的定相变异的集合具有大于5%的等位基因分数并且没有来自所述匹配的非肿瘤样品的测序数据中的读数支持。
638.根据前述实施方案中任一项所述的方法,其中在步骤(e)中鉴定的经验证的定相变异的集合数比在步骤(c)中鉴定的定相变异的假定集合数低至少1.5倍、2倍、3倍、4倍或5倍。
639.根据前述实施方案中任一项所述的方法,其中步骤(d)还包括对来自受试者的匹配的非肿瘤样品的来自(c)中鉴定的多个区域的核酸进行靶向测序至至少500×的深度;
640.一种方法,包括将一组核酸探针与从受试者获得或衍生的多个细胞游离核酸分子组合以形成混合物,其中所述核酸探针组中的每个核酸探针被配置为与细胞游离核酸分子的至少一部分杂交,所述细胞游离核酸分子包含通过任何前述实施方案鉴定的定相变异集合。
641.根据实施方案640所述的方法,其中所述核酸探针组中的每个核酸探针被配置为与包含多个定相变异的靶核酸分子杂交,使得所述核酸探针与所述靶核酸分子的至少一个区域互补,所述区域从所述定相变异的集合的第一定相变异延伸至所述定相变异的集合的第二定相变异。
642.根据实施方案640或641所述的方法,其中所述核酸探针组中的每个核酸探针都包含下拉标签。
643.根据实施方案642所述的方法,其中所述下拉标签包含生物素。
644.根据实施方案640-643中任一项所述的方法,其还包括将与核酸探针杂交的靶核酸分子和不与核酸探针杂交的核酸分子分离,从而捕获靶核酸分子。
645.根据实施方案640-644中任一项所述的方法,其还包括对与所述核酸探针杂交的所述细胞游离核酸分子进行测序。
646.根据实施方案640-645中任一项所述的方法,其还包括将一个或多个细胞游离核酸分子鉴定为癌症来源的分子,其检测限为小于来自从细胞游离核酸分子的测序获得的测序数据的50,000个观察结果中的约1个。
647.根据实施方案646所述的方法,其中所述检测限为小于来自测序数据的100,000个观察结果中的约1个、小于来自测序数据的500,000个观察结果中的约1个、小于来自测序数据的1,000,000个观察结果中的约1个、小于来自测序数据的1,500,000个观察结果中的约1个或小于来自测序数据的2,000,000个观察结果中的约1个。
648.根据实施方案645-647中任一项所述的方法,其中所述测序不包括使用分子条形码。
649.根据实施方案645-648中任一项所述的方法,其中所述测序不包括双链体测序。
650.根据实施方案645-649中任一项所述的方法,其中所述方法不包括双链体介导的错误抑制。
651.根据实施方案645-650中任一项所述的方法,其中所述方法不包括条形码介导的错误抑制。
652.根据实施方案640-651中任一项所述的方法,其还包括确定所述受试者的病况。
653.根据实施方案640-652中任一项所述的方法,其还包括监测所述受试者的病况的进展。
654.一种计算机程序产品,其包含在其中编码计算机可执行代码的非暂时性计算机可读介质,该计算机可执行代码经调整以被执行以实现根据前述实施方案中任一项所述的方法。
655.一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器,其中计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现根据前述实施方案中任一项所述的方法。
虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员来说显而易见的是这些实施方案仅通过示例的方式提供。本发明不受限于说明书中提供的具体示例。虽然本发明已经参照上述说明书进行了描述,但本文中实施方案的描述和说明并不意味着在限制意义上进行解释。在不脱离本发明的情况下,本领域技术人员将想到许多变化、改变和替换。此外,应当理解,本发明的所有方面不限于本文所列出的依赖于各种条件和变量的特定描述、配置或相对比例。应当理解,在实施本发明时可以采用本文所述的本发明实施方案的各种替代方案。因此,考虑到本发明还应包括任何此类替代、修改、变化或等同物。下列权利要求意为限定本发明的范围,并由此覆盖这些权利要求范围内的方法和结构及其等同物。
表1
表2
表3
表4
表5
表6
序列表
<110> 斯坦福大学托管董事会(THE BOARD OF TRUSTEES OF THE LELAND STANFORDJUNIOR
UNIVERSITY)
<120> 用于分析核酸分子的方法和系统
<130> 58626-702.601
<140>
<141>
<150> 62/931,688
<151> 2019-11-06
<160> 1358
<170> PatentIn version 3.5
<210> 1
<211> 100
<212> DNA
<213> 智人
<400> 1
tctcttctgg cccacagccg cagcaatggc gctgagttcc tctgctggag ttcatcctgc 60
tagctgggtt cccgagctgc cggtctgagc ctgaggcatg 100
<210> 2
<211> 100
<212> DNA
<213> 智人
<400> 2
gagcctcctg gagactgggg gcctcctccc tggagatcca cccccaaaac cgacgtcttg 60
aggctggtga gcccccgagc ctcctctccg tctgctcgca 100
<210> 3
<211> 100
<212> DNA
<213> 智人
<400> 3
gatcccagtt ctgaccccag ggcctcccac agatctcttc cccatgcccc tgtcctggcc 60
gttgctggct ccggcgtcca gcccgtcccc tgctgcctgg 100
<210> 4
<211> 100
<212> DNA
<213> 智人
<400> 4
ccatgttgct ggcttacttg gcatttccca tgatctcaca ctgctggctt atttggcatt 60
tcccatgatc ccctgctgct ggtttacttg gcattcccta 100
<210> 5
<211> 100
<212> DNA
<213> 智人
<400> 5
tgatcccatg ttgctggttt acttagcatt tcccatgatc ccatgttgct ggcttacttg 60
gcatttccca tgataccatg ttgctggctt acttggcatt 100
<210> 6
<211> 100
<212> DNA
<213> 智人
<400> 6
atagattaga ggaaggaatt ctagatgaaa ttaagtaaat gagttattta agtcaactaa 60
tacaagtcct caaaactttg attatataga gagctaaact 100
<210> 7
<211> 100
<212> DNA
<213> 智人
<400> 7
gataaatata gacaaatata gtgagcctat aaattaaagc tatactatga tgaaaaaata 60
aatgaataat tgtgaaatag ccaaaaatac taaaatacag 100
<210> 8
<211> 100
<212> DNA
<213> 智人
<400> 8
aatgaataat tgtgaaatag ccaaaaatac taaaatacag ctataaggtt aaaaataaat 60
ctgaataaaa aatgtaggag ggaaaagtga ttaccttacc 100
<210> 9
<211> 100
<212> DNA
<213> 智人
<400> 9
gacatgcatc aaatgtaaac aaatgattac agccatttta taaaaagtca tattctttaa 60
aacatttttt gtcatcatta aaaattaaaa ggcaataaag 100
<210> 10
<211> 100
<212> DNA
<213> 智人
<400> 10
tgtcattgtc gtgaaacagt acgtgatctt aagggaagaa acatctcact agagtttgca 60
caagttcctt cttcttctaa ctgtagatct ggtggcaaag 100
<210> 11
<211> 100
<212> DNA
<213> 智人
<400> 11
gaggagcccc tgggtcccca ggtctgggaa gtgtagttga agagaagatg gtattttcag 60
ttctgcctac ttctagaaca ggcaaattca gagaagaatt 100
<210> 12
<211> 100
<212> DNA
<213> 智人
<400> 12
agtagaaaaa aagggcgtcg tgctggattc tccttctgga tggtacatga cagtggatgc 60
cctcagtttt tcagagaaat tactctcatc tgaatttgat 100
<210> 13
<211> 100
<212> DNA
<213> 智人
<400> 13
ctggagaggt tgttcgtggc tccatctgga aaaggttcac aactgctaca ttttagtcct 60
acaataaaat tattcagatg taaatgaaaa agtaactaaa 100
<210> 14
<211> 100
<212> DNA
<213> 智人
<400> 14
acccgagacc tctcactgag cccgagccgc gcgcgacatg agccacggga agggaaccga 60
catgctcccg gagatcgccg ccgccgtggg cttcctctcc 100
<210> 15
<211> 100
<212> DNA
<213> 智人
<400> 15
agcctcctga ggacccgggg ctgcgtgagc gagcagaggc ttaaggtctt cagcggggcg 60
ctccaggagg cactcacagg tgagcgcatg ccgaggggcc 100
<210> 16
<211> 100
<212> DNA
<213> 智人
<400> 16
tggcgccacc gggggtcggc cccatccctg ccagggccgt ctttcttcta ctcctgcggc 60
agggtgaccc acgggagcag ctttgggact cggtggccct 100
<210> 17
<211> 100
<212> DNA
<213> 智人
<400> 17
cctccgaccc ccggggcggc ccgcagtccc cagtttcctg ggtcctcctc cccagccctg 60
tgctcgggtc tcggccgtgg cggttctgat ggggcgcgcc 100
<210> 18
<211> 100
<212> DNA
<213> 智人
<400> 18
cctctacgct ctcggaggcg cagaccctgg tcctggagtg ccagcccgag tccccagctt 60
atgcccctgt ctcattacgg gctcgtctcc ctcgctggac 100
<210> 19
<211> 100
<212> DNA
<213> 智人
<400> 19
cctcgagatc ttaagaccct cgatggatgt tgttgcgggc cgcccggtcg gccgaggggt 60
cccgatgagg gaagaaggtg cagtcgagcc ttttcaacaa 100
<210> 20
<211> 100
<212> DNA
<213> 智人
<400> 20
tttggagtcc cagtgcggtt cttcctgccg gtcggggtgc gctgtgcctg gggtagtcca 60
ctggttgctg actggcttca agttggaatt tgggccccct 100
<210> 21
<211> 100
<212> DNA
<213> 智人
<400> 21
ttgtgttatc tttggttccc cttagccatc tgccacctat tgtggtaggg aggagagcct 60
cgtagctcgt gaccctgccg tgcgggcctt caagttggga 100
<210> 22
<211> 100
<212> DNA
<213> 智人
<400> 22
ggtgaagaga taagcagccc gctcgctggc tggggagaga cctctctccc agctgtttct 60
agctggttac tgtcagtttt gggaagcgat agccatctcg 100
<210> 23
<211> 100
<212> DNA
<213> 智人
<400> 23
gaacgcaccc acacagaccc tgccttctga ggaaaacaga tgtttcatca aaacaaccca 60
gttttcactc ccttaggcac tgctaaggaa ggttctctga 100
<210> 24
<211> 100
<212> DNA
<213> 智人
<400> 24
ctcttctgaa ggaagcagag ggaacacagg gtgggaggtc cagtgacttg ctgtggaccc 60
aacaatgttg gcagccttcc tggccctgaa acttcagctc 100
<210> 25
<211> 100
<212> DNA
<213> 智人
<400> 25
acaggtctcc agaggccctg cctggacatg ccagtcccag tcacaccctt cccttgcttt 60
gggggtgtgc caaaagcaat acactggcca ctagagagta 100
<210> 26
<211> 100
<212> DNA
<213> 智人
<400> 26
ccctagagct ctagaatccc ctcccaacac gcacacacac acacacacac actctctctc 60
tcacacacac acactcagtc acacacacac acacacacac 100
<210> 27
<211> 100
<212> DNA
<213> 智人
<400> 27
ctttcagatc tttcgcagcg tcccaacagg gcaaaggctc cagcattctg ccagaaggaa 60
ttcccgcctc cacattcccg gtccccggct gtgctgaggg 100
<210> 28
<211> 100
<212> DNA
<213> 智人
<400> 28
gctgccccca agcaagccca gcgttgggga ccctccctcc actctgtcgg agagctgcca 60
acgccccccg cccacggggg ccccacttcg ggcctcctca 100
<210> 29
<211> 100
<212> DNA
<213> 智人
<400> 29
gggcctacgg aggccagggc cctgggcagc ctggaccagc tcagggaatc agaggactct 60
gcgctttgca cgctcacagt cgtctcctct ggccttttgc 100
<210> 30
<211> 100
<212> DNA
<213> 智人
<400> 30
ccacttcagg ctccccagag cccggcatgc cacagggcag atatcctttc cccatcttcc 60
cagggggttc tccatcgcgg ggcccgcccc tttctggggc 100
<210> 31
<211> 100
<212> DNA
<213> 智人
<400> 31
tgggcttgtc tcactgccca gaaactgccc ctgcctctcc accagggcct ctgggggctg 60
caggtcctca agctcacggg ctctcccaga cggctcagtg 100
<210> 32
<211> 100
<212> DNA
<213> 智人
<400> 32
agggcaagat cctgtggacg gtgtggccca gtggatgtaa ctctcgctgc cacttccgtg 60
gccatcgtta agctagctcc gaacagcccc aatgagggag 100
<210> 33
<211> 100
<212> DNA
<213> 智人
<400> 33
ctaggcagct ccgagttccc ggggtaggag agcccctttt gtcaatttcc atagctgtgg 60
gtgagccaca gcggggactg gcagggatac ccttctccat 100
<210> 34
<211> 100
<212> DNA
<213> 智人
<400> 34
ccttacaaaa gcggatggac cctgagcctc tgatcctgta ggggcagccc ggccgggaag 60
aggtggcatt cctttcttca cctgcgagga gcataggctg 100
<210> 35
<211> 100
<212> DNA
<213> 智人
<400> 35
ggccctcctt tcctcccgga gtcggttcct gaagtctctg gacattgctc cccccaggac 60
tttgtcctcc gttcctcgct ccgggcgccc tgaaccagga 100
<210> 36
<211> 100
<212> DNA
<213> 智人
<400> 36
cccttccagg gggctgactg ctgctgcgga aggggcacgg ggagggcgag cgagccctgc 60
ccaaacgcgg gctgcggggc gcttgaatgg cggagctctg 100
<210> 37
<211> 100
<212> DNA
<213> 智人
<400> 37
tgcctggatg tgcgcctcaa acatgcccac tttctggttc acctgcacgt tctgcaactc 60
gcgctgcaag atccgcagct tcctcttggc ctcctccggc 100
<210> 38
<211> 100
<212> DNA
<213> 智人
<400> 38
cctggcgggg agagggtacc ggctgccacc acctgctgcc ggtcccctcg caggcgacca 60
gcccaacttg ggctgctcac gctactgccg ctgctgccgc 100
<210> 39
<211> 100
<212> DNA
<213> 智人
<400> 39
tgccactgcc gctgctacta ttcagcctgc gccggccgct ccgccagccc ccggggctcc 60
ggggctcctc gggggacagc gactcggctg gggggaagag 100
<210> 40
<211> 100
<212> DNA
<213> 智人
<400> 40
gaaagaggcg cctctcccgg ggctgaaaac gctgccgggg ctcagcactg ccctcctcgg 60
gggcgggggc gtctcgctgc cactgggccc cgggccgccg 100
<210> 41
<211> 100
<212> DNA
<213> 智人
<400> 41
ccgctcttca tctcgttggc gctattcatg atcaccaggc tattgagcgc atagcagtac 60
acagccatag tactgggtcc cgcgctgccc gccgccgcgg 100
<210> 42
<211> 100
<212> DNA
<213> 智人
<400> 42
ctcccgctcc tgctccgccg ccggcgcctc ctcctcccgg cgctcccggc tcagccccgg 60
aggcccggca gccgcggctc cgcgcgcaga tggggcggca 100
<210> 43
<211> 100
<212> DNA
<213> 智人
<400> 43
aagtgcgaag gaagtgtcag gctggatgtc aaaatgaaca ccttggagaa ctggatgatg 60
gaacagacgg taaaaatcag ctaaacatca gagaaaatgg 100
<210> 44
<211> 100
<212> DNA
<213> 智人
<400> 44
aggaagaggt caaaactgtg aacaggaact agaagaaagt gtagcagaaa aagacttgtc 60
acaaacttcg agagatttgg agaaaatgat gtcaaaacac 100
<210> 45
<211> 100
<212> DNA
<213> 智人
<400> 45
atcttcctca agcccatgct gagtatctct gatttggtta atttcttggt aagtgttcca 60
agtacagaca acaaagcaga aaagcactga ttacagggaa 100
<210> 46
<211> 100
<212> DNA
<213> 智人
<400> 46
tatgcagaat gatccttcag atcatgtgaa cgctataatt aaatgttgct accaaatccc 60
cactaccctt tctcccacct agaaaaagtt aatgcatgaa 100
<210> 47
<211> 100
<212> DNA
<213> 智人
<400> 47
ttcagtatga gcaaattgtg atttataaaa acaaacaaac aaacaaacaa acaaaaccca 60
ccctattcac tccgtagggg aataaagctt tcttgcatta 100
<210> 48
<211> 100
<212> DNA
<213> 智人
<400> 48
aacaaacaaa acccacccta ttcactccgt aggggaataa agctttcttg cattaagtca 60
cgcatcatgg gggtaggaaa aaagcacagt actgaaagaa 100
<210> 49
<211> 100
<212> DNA
<213> 智人
<400> 49
gtgaagtgat ccaaatgtag cccagagatc ctaaagaaaa aacgatgctc atgtgttaca 60
aaacaaaatt ttaaggcaat cagtgaggaa tcacagacaa 100
<210> 50
<211> 100
<212> DNA
<213> 智人
<400> 50
atttccttag tgcttttatc aaggttgaat ctgaatataa attactagag gaaagcaaat 60
cagatttcac atctgaaaat taaaaacaaa attcttagct 100
<210> 51
<211> 100
<212> DNA
<213> 智人
<400> 51
aggcaacaaa atgagatcct gtccctagaa aacatttcaa aaaattaaca gcatggtgac 60
gcacacttgt agccctagct acttgggagg ctgagtggga 100
<210> 52
<211> 100
<212> DNA
<213> 智人
<400> 52
aagaacttaa gcagactagg atataaagta taggagcgta ttgtgtacag gaacgggaaa 60
tactgtttcc tggatctttt gtttcactta cgcacacacc 100
<210> 53
<211> 100
<212> DNA
<213> 智人
<400> 53
cacacccgcc agtagtgtac caggttgcga tggaaatctc tctctttctg tggatgagtt 60
tgtggaagcc cttgctccag catgccctcc ttcctgccca 100
<210> 54
<211> 100
<212> DNA
<213> 智人
<400> 54
cccctggacc attccttccc ttcacagcac tgtcccatgg gtaggccaca gcccagcaca 60
ggccccagcc tggcggctgc agcaggagcc ccatcccagg 100
<210> 55
<211> 100
<212> DNA
<213> 智人
<400> 55
gcctgagggg ccatgcgggg gtctgggtgg gagtgggaac cgctgaggaa ggtgaaggga 60
aatatggtga gatgacaggc ccgctgtcag ggagagtggg 100
<210> 56
<211> 100
<212> DNA
<213> 智人
<400> 56
aggagccctg gagtgcccta cctctgtggg gctggaactc cctgtatccg agctagggtc 60
ttccacacgc atgctactac cccaagtgcc acagctggag 100
<210> 57
<211> 100
<212> DNA
<213> 智人
<400> 57
tcatctccca ctggataaca gtgttgtcgg gaacttccat ccagcactgg cggacactcc 60
cgtcgcagct gctcctgact gagcaagtca tttaaggggg 100
<210> 58
<211> 100
<212> DNA
<213> 智人
<400> 58
tccttggcac tcataagcac tcacagaatg gggctggcag tgcgcccggc ctccctggga 60
tgggtccaga atggtaggaa gcgcagtccg ggagggaccc 100
<210> 59
<211> 100
<212> DNA
<213> 智人
<400> 59
actgcttaga gctctcagcc ctagatggcg tatcacagtt aatgctctat aaaacccatc 60
atggcttttc cctagtaagc ctcaaatcgc tgcaagcaag 100
<210> 60
<211> 100
<212> DNA
<213> 智人
<400> 60
gcttcatata tgagagtttc tgctgtctcc tggagccatc tcacccaaag ccactgactc 60
tgggagacca gcccaggcca caaaccagca aagcaccagt 100
<210> 61
<211> 100
<212> DNA
<213> 智人
<400> 61
tatagttaga gctgcattat aaagtggcca gaggacattt ctttgcagtg agatgtgtat 60
cgtgaacgtt tggggcctgt gctcgcctag tcctcatctt 100
<210> 62
<211> 100
<212> DNA
<213> 智人
<400> 62
tgcttttcta ggtacacaaa gccatcccat ggctgcaaat gttagctggg ctgggctccc 60
tacttgcctc aagccccttc atagaccctt caggcacatg 100
<210> 63
<211> 100
<212> DNA
<213> 智人
<400> 63
cttttctctg gacgtttaca gacaggtcct cagaggtcag agcaggttgt cctagggagc 60
agggaggctt cctagggagg tcagactcca aatagtggat 100
<210> 64
<211> 100
<212> DNA
<213> 智人
<400> 64
atggcaaaaa tgcagctgca gactcatgag gagtcgccct gggctgccac tagggctccc 60
acagtgtgcg ctgccaacct gctgcccgtg cagaaactct 100
<210> 65
<211> 100
<212> DNA
<213> 智人
<400> 65
caactgtgcc ctgcactgtt agggcccttg tcaaaacaac acatttctca gtgattctga 60
gactctttct cttatctata gaagtcataa ctcaagagta 100
<210> 66
<211> 100
<212> DNA
<213> 智人
<400> 66
aaatcatacc aatattttac ataaacccta gaatttttat agatctatta tttcttttta 60
gagtacatat tggaagtaac ttcacaagga acattttctt 100
<210> 67
<211> 100
<212> DNA
<213> 智人
<400> 67
tctggtcaaa ccactccaca aataaagtgg actgatcctc ttgactctat gtgtaagtgc 60
ccattgtgtg tgcacagagc tggtgagaac ggccatggtg 100
<210> 68
<211> 100
<212> DNA
<213> 智人
<400> 68
ctaggtgggg gtggtgttgg tggagttgga ctagattatc tgggatcatg cgaaatggaa 60
attcatttct agctggctgg cttcagaagg tgccatctcc 100
<210> 69
<211> 100
<212> DNA
<213> 智人
<400> 69
tatttttata tgaagcgtgc tttggaactc agggcaacga agggtgggtg tgctgcacaa 60
ggacagcaga agagtgagct gactggtccc tgaaatcgca 100
<210> 70
<211> 100
<212> DNA
<213> 智人
<400> 70
gttggaaagt ggattaccag tgcagtagaa ctcttcacgg aggcctggac catcaggtct 60
aatggtgttg ttccaggtgg gtggtcatgt ggagcaaaaa 100
<210> 71
<211> 100
<212> DNA
<213> 智人
<400> 71
tatttgaaat cagcgagcac gtacctgaga gatgactttt ccacttgggc tagtctcttg 60
atatttctgg tcctgtttct tcatctgtaa actgggttag 100
<210> 72
<211> 100
<212> DNA
<213> 智人
<400> 72
aaggagacca agaagcgtat ttaaaatctt gatgttttga gtttcttcct agcttccccc 60
tattccttaa taaagttcta aattgttttg ttggagctct 100
<210> 73
<211> 100
<212> DNA
<213> 智人
<400> 73
ttgcagccat tctgagggct ttgcatgctt ttctgacctt gcagtaaact caatgcttta 60
ggcaaagaat ggccacgtca tccgaccccc tcagagttta 100
<210> 74
<211> 100
<212> DNA
<213> 智人
<400> 74
gaattcagaa caggtctgaa gaagaccagg cagcggctga gtcaaggaaa gcctccgtcc 60
gcttttattt cccctgtgcc tcttccagga ctgtgctggg 100
<210> 75
<211> 100
<212> DNA
<213> 智人
<400> 75
ataacaggct cccgggggtt actttggctg ggctgggcta aaacctccct gcagagcagg 60
ccctgagccc tgcctctgcg cctgggtggt gtcagcccct 100
<210> 76
<211> 100
<212> DNA
<213> 智人
<400> 76
ccaccttctg actgttccag caactctcta agccctccca aaggcctcaa ggcctgtaac 60
catatgcagc aattttcagc cataccagga gaggtcaact 100
<210> 77
<211> 100
<212> DNA
<213> 智人
<400> 77
gtaatcttgg ccacctgcct aagaggaagt ggctagcttc acttctgacc ctcagcaact 60
gccaggtggc ctcttggaaa tccccctctg ggggattcca 100
<210> 78
<211> 100
<212> DNA
<213> 智人
<400> 78
cccgttgggt gggagagcag tagttaaaat gtaaaataag aatcttttgc tgggagaagt 60
caacagatag ggagaagtca gctgataaca gaaatagttt 100
<210> 79
<211> 100
<212> DNA
<213> 智人
<400> 79
taaaactaac ttcactgtta accaagcagt tcaacatgaa agactgaatc tcttatgttt 60
aatattttct tctcttttaa tcttcataac taattttttt 100
<210> 80
<211> 100
<212> DNA
<213> 智人
<400> 80
cagataattg tataaaataa ccatggtagc aaaataatgt gatcactgga aaataagcag 60
ggaaaaacat gctatgaaga tactcctatc tgggtgaatt 100
<210> 81
<211> 100
<212> DNA
<213> 智人
<400> 81
cttgatagct ttacattttt catctggcat ttaaacatta aacagttaat gtatttgaca 60
tgaaaattat ttcaagttat cttattagtt ttaatagagt 100
<210> 82
<211> 100
<212> DNA
<213> 智人
<400> 82
ttaaaaagtg tttaaaagag ttttcaaaag gctctaaaat cattttgaaa tagtttaaaa 60
cagttttgaa tcgttgtaag ttagttttaa tagagcttta 100
<210> 83
<211> 100
<212> DNA
<213> 智人
<400> 83
aaaaggccct aaaatagtcc tatcaagttg ttgcagacca aaataatctc cttaaatatc 60
acttttgaga tcagctgggg taaacgacag caacacaatg 100
<210> 84
<211> 100
<212> DNA
<213> 智人
<400> 84
acaaatcatt aaactatttt agagattatg aaattaaaat actcagatta aaattttcct 60
atcacagaat taaggtactg gaaaatatgt ttaagttttt 100
<210> 85
<211> 100
<212> DNA
<213> 智人
<400> 85
attaatcaca ttgctatagg tttagatatt ttgtacaact gaaataaaat cacacactgg 60
cagctacatt tttgaaagtt aaaaacatgg tcacgaatat 100
<210> 86
<211> 100
<212> DNA
<213> 智人
<400> 86
atcttatttt aaaatcagtt aatatacctt aatggtattt aatgccaaat tcaaagtgaa 60
ttgatcaagc cctcagtggc caggtcatgg gtgtgatttt 100
<210> 87
<211> 100
<212> DNA
<213> 智人
<400> 87
tactctgaaa gaattacata tttctttctt tttggttgag cttttgttat ttaaatacat 60
ttgatgagag gatattgaaa taattaaata gcactgaaaa 100
<210> 88
<211> 100
<212> DNA
<213> 智人
<400> 88
aaaaaaagct ttaaattatt tacaatcccc taatggaaat tttcactaat gagatatcat 60
aatgaatgtg aattttattt ctgaaatctc taataaatca 100
<210> 89
<211> 100
<212> DNA
<213> 智人
<400> 89
aagctttaaa ttatttacaa tcccctaatg gaaattttca ctaatgagat atcataatga 60
atgtgaattt tatttctgaa atctctaata aatcagtctt 100
<210> 90
<211> 100
<212> DNA
<213> 智人
<400> 90
ctccctggtt ttcccagctc agcgcccatt acgtttctgt tctctttccc ttagtggcat 60
tatttgtatc actgtgcatc aggaaagctg gctacggcag 100
<210> 91
<211> 100
<212> DNA
<213> 智人
<400> 91
catcaatcgg gcagacacag ggtggccacg gccactagcg gcaaggcggc tgccccaaga 60
gcgcggtggc atggccacca aagccactca atcgagaaag 100
<210> 92
<211> 100
<212> DNA
<213> 智人
<400> 92
accgcggctc tgtctacagc tcgcggtgcc acggccttct tggcagaata aaaatgtaga 60
caagtaataa cagaggataa tgaaagaaca tactctttaa 100
<210> 93
<211> 100
<212> DNA
<213> 智人
<400> 93
aatatttcct atttttttca cagacccacg gtcattaaaa aatgcaatta tttacttttt 60
ttcatttaaa cacatttctt tgagattgag cttttgggaa 100
<210> 94
<211> 100
<212> DNA
<213> 智人
<400> 94
taaccacctt tccaccatta caataagaga taatttcacg tttagtctaa tgtacaaatt 60
ggatttttaa aaaatgagct ctatctgtga agcccttatt 100
<210> 95
<211> 100
<212> DNA
<213> 智人
<400> 95
aaaatgagct ctatctgtga agcccttatt cctatagaat gtgtcttttt gagtttatta 60
cttattacag actctaaaaa caacattgct gctgattttc 100
<210> 96
<211> 100
<212> DNA
<213> 智人
<400> 96
aagtaagctg cctcttctac atagcaaata ggtacacttc acttttccct gatttttctt 60
agggcgtgct attgattttt attgttgtct gacaaaataa 100
<210> 97
<211> 100
<212> DNA
<213> 智人
<400> 97
tttatcaaac aaaagggaga aagactaaaa aatgtatttt tccacttttc tgtatcatgc 60
ataatcagca acaaccaata caatatttgg caagagtgaa 100
<210> 98
<211> 100
<212> DNA
<213> 智人
<400> 98
caaaaataaa tttacttttg ctccttagaa atacaagggt tcctttttag ttacactttt 60
tttttttact ttgtgtcatt cagtttagag caatttaatc 100
<210> 99
<211> 100
<212> DNA
<213> 智人
<400> 99
tttttttctc caaatccatt tttgaagctg agtttaactt ttgcaaccca tggcaaatct 60
taaatgccct catttaccaa tctttaccaa actcctattt 100
<210> 100
<211> 100
<212> DNA
<213> 智人
<400> 100
aagcctctaa aagtcaatac tggccatcag acccaaattt cagaagacaa tagtgaaaaa 60
ttacttacgt ttaatctcca gtcgtgtccc ttggccgaag 100
<210> 101
<211> 100
<212> DNA
<213> 智人
<400> 101
gtgatccaca gtgttaactt aattactttc cccttaacaa aaatctcttt tcgctgttaa 60
tatcactaac ctgaccgatg cagagaaaat cttgcaattg 100
<210> 102
<211> 100
<212> DNA
<213> 智人
<400> 102
agatgcctca cttaactggc tagcgcttgg ctgttcctta agatgaacta attttctatc 60
ccttactcat ctgacttttt gaaagaatct ggtactcttt 100
<210> 103
<211> 100
<212> DNA
<213> 智人
<400> 103
ggaattgacc tgagctaata tctcaaacac aaaaacgctc caaatttaaa accttataag 60
aaaaagcatt aggaaagtgc acttacgttt gatctccacc 100
<210> 104
<211> 100
<212> DNA
<213> 智人
<400> 104
ttggtccctc cgccgaaagt gagccacagt gagggatctc accctttccc ctcaacaaaa 60
acctctcttg aagccaatca tatgagatag gctgcttgtt 100
<210> 105
<211> 100
<212> DNA
<213> 智人
<400> 105
cagagaaaaa tctagctatt tcttccccat ttcccccatg aatcctattc tcctctcaaa 60
cccaatgatt cgtctatttg ctcagctttt taagttcatt 100
<210> 106
<211> 100
<212> DNA
<213> 智人
<400> 106
ttctggtgtc ctgctattta cttctgggtc accaggttta ttcaaccaaa atatcacaaa 60
acttgcacaa atgatacaat ggcactaaaa tctcacgaat 100
<210> 107
<211> 100
<212> DNA
<213> 智人
<400> 107
aattgagaca gatgtactta cgtttgatat ccactttggt cccagggccg aaagtgaatc 60
acagtgattc gtcttaactt ttccctttac aaaaacctcc 100
<210> 108
<211> 100
<212> DNA
<213> 智人
<400> 108
ctgaaagctc agcaagcctc tttcccccaa tgaagttatt ttgatttaga aatcttaaaa 60
attagccaca agctagcgtc ctgtggaaca atttcccctc 100
<210> 109
<211> 100
<212> DNA
<213> 智人
<400> 109
ctctgtacct aacctgggaa tgaagtttgt tagatccctg gcatccgact aatgaaaatc 60
cacacaaagg aacacaaagt aaactaatta gcaacagtga 100
<210> 110
<211> 100
<212> DNA
<213> 智人
<400> 110
agaatcagtg gaaaaaagta cttacgtttg atctccagct tggtcccctg gccaaaagtg 60
tacacacaat ggttcctctt aacttccctc ctatacaaaa 100
<210> 111
<211> 100
<212> DNA
<213> 智人
<400> 111
actccctttc tgacaattga ccaaggctct gtccagaaca tgttatgttc cccaggacat 60
ttctgaagct attacttaga caagttattc tcacccaatg 100
<210> 112
<211> 100
<212> DNA
<213> 智人
<400> 112
actgaatctt gcttgctctt caaagaaaat gtgcaatcaa ttctcgagtt tgactacaga 60
cttatcttta tcttttccct gaaggatatc agaggctgat 100
<210> 113
<211> 100
<212> DNA
<213> 智人
<400> 113
tgcagagtca ccttatagat cacttcatag acacagggaa cagaagacac agacaactga 60
ggaagcaaag tttaaattct actcacgttt gatttccacc 100
<210> 114
<211> 100
<212> DNA
<213> 智人
<400> 114
ttggtccctt ggccgaacgt ccaccacagt gagagctctc cattgtcttg ctgaacaaaa 60
acccttctca ccaaagggga acagagtcct gggtcagctg 100
<210> 115
<211> 100
<212> DNA
<213> 智人
<400> 115
atcaacttaa ggctcataac tttgaaatgc attttgaaat gtagctccag atggtatacg 60
aaaccaaagt gaagactaat agagtagaaa agtagacttt 100
<210> 116
<211> 100
<212> DNA
<213> 智人
<400> 116
acttggttgg tttgtctgtt ttcacagcac aggaagagct cagctcttac tgagctggac 60
caggcgcatg ccatctttgg agctgccatg gagtcccagt 100
<210> 117
<211> 100
<212> DNA
<213> 智人
<400> 117
gttccatagt gtttccatag taatctcatc aacaacactg aagacctttt cagtattttc 60
ttttgagtcc agctccattt ttgcagcctt gtatctctct 100
<210> 118
<211> 100
<212> DNA
<213> 智人
<400> 118
ccgcgcccag ccgagtgcct gtttattttt acctgctttc agattctctt ctacccttct 60
aaattataag ctgtttgatg ttttatttgc cctgtatttg 100
<210> 119
<211> 100
<212> DNA
<213> 智人
<400> 119
ggaggctccg tccagtatct ttacttagca aatgcttaac aaacattttc agaataaata 60
aaaaaaaata cctaattgaa agtcaataat agatcagaga 100
<210> 120
<211> 100
<212> DNA
<213> 智人
<400> 120
tgctatcata gaccaaagac taatactgac tgccacaaca gtaactttta caacagaaat 60
cataactaca attctaaaga ttaggggtag gtttatttga 100
<210> 121
<211> 100
<212> DNA
<213> 智人
<400> 121
ttctgtcact ggcagctttg ctagttgcct tgaatagcag aattagcatt tggtctcacc 60
agaagatgag gaaggagagg gatcaagtta gaggtggaga 100
<210> 122
<211> 100
<212> DNA
<213> 智人
<400> 122
gttaacattg gcaagtgaaa tttaatgtgc aaaatagctg accaagggca tagtcctttt 60
ttaaagggga cacaaagtga ttttctctgc agacatacac 100
<210> 123
<211> 100
<212> DNA
<213> 智人
<400> 123
gcaataccaa tcataaaggg tgacatttat tgagcactta ctaagtgcca gacattgtac 60
atggatcatc acatttaatt attcccaaga ctctatgaac 100
<210> 124
<211> 100
<212> DNA
<213> 智人
<400> 124
tgagcactta ctaagtgcca gacattgtac atggatcatc acatttaatt attcccaaga 60
ctctatgaac taggaactaa tattatcccc tactttgtag 100
<210> 125
<211> 100
<212> DNA
<213> 智人
<400> 125
gtgcaaaaac ttgagggcag agaggtcaag gaactggctt atggcagtaa gtggcagagc 60
tgtgacctaa actcagatcc catgttttta actgaactat 100
<210> 126
<211> 100
<212> DNA
<213> 智人
<400> 126
atgcagatta tactccagga gtaaagtcac tcaacggaag caacaagcgt gacagggaat 60
gctgggatgg gggaaggtaa aaggaactcc ttagactggg 100
<210> 127
<211> 100
<212> DNA
<213> 智人
<400> 127
ataagtgtgt acagacgtat gtataagact acacatggaa atattgttta aagagtgaaa 60
aataactaaa atcctcatta ataggagttt ggttaaactg 100
<210> 128
<211> 100
<212> DNA
<213> 智人
<400> 128
tgctagagct ttacaatgta gcacaaagca gacattaagg ggaagacgta gacttctata 60
tagttacgtg gaaggtgttt gtgaaaatgc aggtcactga 100
<210> 129
<211> 100
<212> DNA
<213> 智人
<400> 129
agagtatgtg tggtgagata tcatgatccc atctacattg aatatatatg tatataaata 60
cgggctgaat tttaaaagac ataaattgtg cttggtagtt 100
<210> 130
<211> 100
<212> DNA
<213> 智人
<400> 130
aaatacgggc tgaattttaa aagacataaa ttgtgcttgg tagttatctc ctgggattgc 60
agaggaggaa caatgacact ttatgccatc tcctcctact 100
<210> 131
<211> 100
<212> DNA
<213> 智人
<400> 131
cttctgtatg gtgatgtgaa tatattcatt ttatagtttt tagaaataat aaaactgtac 60
taattttgaa aaacagtaaa ctctgacatt gcctattagc 100
<210> 132
<211> 100
<212> DNA
<213> 智人
<400> 132
attctcgata ttcctgtgca atgcataaac ataacttttt aaaagatatg tacacacatg 60
tgtgagtttt ctttgtcaaa tacttttcta taatctttaa 100
<210> 133
<211> 100
<212> DNA
<213> 智人
<400> 133
atcaagcatg ccaaaaaggt aaaagctttc ctgtttcagt gtaggagata gtcgtctgca 60
aaggaaagag atgtagggga tagaaacagg aatgaaaaag 100
<210> 134
<211> 100
<212> DNA
<213> 智人
<400> 134
atgactgagc tgttcgaggg acttatgttc ctaagtgagc taattggaaa tctaatatga 60
acagtgcaac cgaataacta ttgtaaagca gtatttgtaa 100
<210> 135
<211> 100
<212> DNA
<213> 智人
<400> 135
acaataaaag atgattatca taagtaccat tgttgcaaaa actattttat tgatcacatg 60
cagtggtgat ctgtaggaat gattgttgtg atgtttgctg 100
<210> 136
<211> 100
<212> DNA
<213> 智人
<400> 136
taacataaaa tgaaacatgg gaagtggctg agatctttag gatgtgtgtg gttcattttt 60
tgaaagcaaa tgttgtctca gaagcatctg tgagactctg 100
<210> 137
<211> 100
<212> DNA
<213> 智人
<400> 137
ccaggatcca ccgttctaca aaatatctgt gatggacatt gataagattg atctgttgag 60
gaaaggcaag gtgtcagtaa gatagtctga gagcttcttg 100
<210> 138
<211> 100
<212> DNA
<213> 智人
<400> 138
gatttcatgt aaaagagtgc tggaaataga atttcttggg gaacattcca actaactcat 60
cactgaaggt gctttacatt gaaccctcag caaagttaga 100
<210> 139
<211> 100
<212> DNA
<213> 智人
<400> 139
ttatcagaaa aaaaatataa actgctgtgg aggggacagg aaggaaagtc agggagggag 60
gggggcaagg agagaaagag cgagagagag gagagaaaga 100
<210> 140
<211> 100
<212> DNA
<213> 智人
<400> 140
agagaggaga gagagagcac aagtacacac ttcaatgcac atctataaat catcctgaaa 60
actactgata aattatttta gcaatgttcc tcagatgtaa 100
<210> 141
<211> 100
<212> DNA
<213> 智人
<400> 141
catttcaaga aatatcattt ttgcttttta tttggcataa tttactagcc aatttaggaa 60
gttcccctca catcagtaac atacagtaca tcacccagta 100
<210> 142
<211> 100
<212> DNA
<213> 智人
<400> 142
tgtcagagga cacaatggca taagtttgcc ttttgcaagg tttgagggat ggccatttcc 60
ctacctgact caggaaagtc tgtagctgat atccatcttc 100
<210> 143
<211> 100
<212> DNA
<213> 智人
<400> 143
aagtttgtgg ttctttctct ctatatatat atttgagctc agcagtcatg ctggagtcca 60
gagtaggtga ttctttctgc tttagcttga ctcctcctta 100
<210> 144
<211> 100
<212> DNA
<213> 智人
<400> 144
tatatatttg agctcagcag tcatgctgga gtccagagta ggtgattctt tctgctttag 60
cttgactcct ccttaagatt gtaactctct cagttttaca 100
<210> 145
<211> 100
<212> DNA
<213> 智人
<400> 145
ttttttgtca gacgtaagct gacattccac aaggagagga ggaaattctg tggttcacat 60
ccagtggtgc ttggaacctg attggttgtc attcttccag 100
<210> 146
<211> 100
<212> DNA
<213> 智人
<400> 146
ctagtttgtc acgagtggat atctgtcctg gattcccaag gatcaaggct gccccattag 60
ccaggaagta gggagataga ggaggtcact tgagaaagag 100
<210> 147
<211> 100
<212> DNA
<213> 智人
<400> 147
ctgcttcttt gccgcctcca ggttgtgtct gtttcctctc atatctgaag acagatgtgc 60
tggcagaagc aaagtccttt gtccggccac gtgcaaatgc 100
<210> 148
<211> 100
<212> DNA
<213> 智人
<400> 148
atgggacata aatatgaaca gagattcttg tcccactcta gaaaatgtag atgttcatct 60
tgtttccaag gggacagtaa ggctgcaggt gttttttgac 100
<210> 149
<211> 100
<212> DNA
<213> 智人
<400> 149
cttttgtact cactggttgt ttttgcatag gcccctccag gccacgacca gctgtttgga 60
ttttataaac gggccgtttg cattgtgaac tgagctacaa 100
<210> 150
<211> 100
<212> DNA
<213> 智人
<400> 150
caggcaggca ggggcagcaa gatggtgttg cagacccagg tcttcatttc tctgttgctc 60
tggatctctg gtgaggaatt aaaaagtgcc acagtctttt 100
<210> 151
<211> 100
<212> DNA
<213> 智人
<400> 151
cagagtaata tctgtgtaga aataaaaaaa attaagatat agttggaaat aatgactatt 60
tccaatatgg atccaattat ctgctgactt ataatactac 100
<210> 152
<211> 100
<212> DNA
<213> 智人
<400> 152
attaagatat agttggaaat aatgactatt tccaatatgg atccaattat ctgctgactt 60
ataatactac tagaaagcaa atttaaatga catatttcaa 100
<210> 153
<211> 100
<212> DNA
<213> 智人
<400> 153
ttatatctga gacagcgtgt ataagtttat gtataatcat tgtccattac tgactacagg 60
tgcctacggg gacatcgtga tgacccagtc tccagactcc 100
<210> 154
<211> 100
<212> DNA
<213> 智人
<400> 154
ctggctgtgt ctctgggcga gagggccacc atcaactgca agtccagcca gagtgtttta 60
tacagctcca acaataagaa ctacttagct tggtaccagc 100
<210> 155
<211> 100
<212> DNA
<213> 智人
<400> 155
agaaaccagg acagcctcct aagctgctca tttactgggc atctacccgg gaatccgggg 60
tccctgaccg attcagtggc agcgggtctg ggacagattt 100
<210> 156
<211> 100
<212> DNA
<213> 智人
<400> 156
cactctcacc atcagcagcc tgcaggctga agatgtggca gtttattact gtcagcaata 60
ttatagtact cctcccacag tgcttcagcc tcgaacacaa 100
<210> 157
<211> 100
<212> DNA
<213> 智人
<400> 157
acctcctccc catacgctgg gccagtaggt ctttgctgca gcagctgctt cctctgcaca 60
cagcccccaa catgcatgct tcctctgtgt gttggggagg 100
<210> 158
<211> 100
<212> DNA
<213> 智人
<400> 158
aatacatgaa aacaactacc gaaatgttat gaaattatag tttagtagaa ctaacaagtg 60
cattaatgca aaagaaaagt agggctcagt aatcagggaa 100
<210> 159
<211> 100
<212> DNA
<213> 智人
<400> 159
ccaagtgtgc attgtaaaag tgcagcctct ctaacactgg gtttcatcac aagtaacaga 60
acaggatgcc tgatgcaggg aaaaaagaaa ggcaattgtt 100
<210> 160
<211> 100
<212> DNA
<213> 智人
<400> 160
gatctctggt aagagaaaca cttcctctcc tctgtgccac caagtcccct gcatatccac 60
aaaaataata tattttcata aggaattgat tttcctcatt 100
<210> 161
<211> 100
<212> DNA
<213> 智人
<400> 161
ctctgcaaat atgatgcatt tgatttatgt tttttacttt gctccataat cagataccag 60
ggcagaaacg acactcacgc agtctccagc attcatgtca 100
<210> 162
<211> 100
<212> DNA
<213> 智人
<400> 162
gcgactccag gagacaaagt caacatctcc tgcaaagcca gccaagacat tgatgatgat 60
atgaactggt accaacagaa accaggagaa gctgctattt 100
<210> 163
<211> 100
<212> DNA
<213> 智人
<400> 163
tcattattca agaagctact actctcgttc ctggaatccc acctcgattc agtggcagcg 60
ggtatggaac agattttacc ctcacaatta ataacataga 100
<210> 164
<211> 100
<212> DNA
<213> 智人
<400> 164
atctgaggat gctgcatatt acttctgtct acaacatgat aatttccctc tcacagtgat 60
acaccctgtt acaaaaacct ccaagttctc tcagtgggat 100
<210> 165
<211> 100
<212> DNA
<213> 智人
<400> 165
gccctctgtc ctggagacac ggccaaggag gctggagact gggtcagcac aatgtcccca 60
ttgcagcctg aaatgataaa gacagataaa ttatatcaga 100
<210> 166
<211> 100
<212> DNA
<213> 智人
<400> 166
tatactgaga ctgtccccat gtaggccatg cattggtgac acttgtaacc acagtcatat 60
gcaacatctt gagtaaccag aaaacaaaag ataactgggg 100
<210> 167
<211> 100
<212> DNA
<213> 智人
<400> 167
aacttacaac ctacaatgag tgccctaaat ccaacaacca agaatccaga gacacaaaaa 60
acaatgatgg ccacatgagt ttgcccgatg tttccctata 100
<210> 168
<211> 100
<212> DNA
<213> 智人
<400> 168
taccaacacc atcagagtgt ggctgcatct gaggaccact ctcagctgat agaggcatca 60
ggaggagcag ctggggcagc cctgcctcac acatctgctt 100
<210> 169
<211> 100
<212> DNA
<213> 智人
<400> 169
ggggtttatg ttcgggtgtg taacactgtg ggagaataac tattatactg ttggcagtaa 60
taagttgcaa aatcatcagg ctgcaggctg ctgatggtga 100
<210> 170
<211> 100
<212> DNA
<213> 智人
<400> 170
gccgctgaac cttgatggga ccccactttc taaactagac gccttataga tcaggagctt 60
aggggctttc cctggtttct gctgatacca ggccaaccag 100
<210> 171
<211> 100
<212> DNA
<213> 智人
<400> 171
ctactaatac tctgactggc ccggcaagtg atggtgactc tgtctcctac agatgcagac 60
agggtggaag gagactgggt catctggatg tcacatttgg 100
<210> 172
<211> 100
<212> DNA
<213> 智人
<400> 172
ggatgtcaca tttggcacct gagattggaa atagaaacac aaatattcat actattgatc 60
atattatagg aagacttccc tgaataacca ggcagtactg 100
<210> 173
<211> 100
<212> DNA
<213> 智人
<400> 173
agcacactgg gctgagtaaa ttcctagtgt tctccttcct tacctgggag ccagagcagc 60
aggagcccca ggagctgagc ggggaccctc atgtccatgc 100
<210> 174
<211> 100
<212> DNA
<213> 智人
<400> 174
gggactattt tattatgaga aacaattttt aggtattttt ttgagaattt taaatattcc 60
tcaggagccg atagagtaat gtatttcatt ggtgtatcag 100
<210> 175
<211> 100
<212> DNA
<213> 智人
<400> 175
gattatttag gagaatattc ttgtttgtag gaaacacata gtaaaatgtt agatggtagg 60
attctcaagt cttcaaaaga ctctcataag attccgggta 100
<210> 176
<211> 100
<212> DNA
<213> 智人
<400> 176
tattcttgtt tgtaggaaac acatagtaaa atgttagatg gtaggattct caagtcttca 60
aaagactctc ataagattcc gggtagggaa gggggtaatt 100
<210> 177
<211> 100
<212> DNA
<213> 智人
<400> 177
tgtaagtatt aggtaatggt gttatgcctt tgttcttact agtattagat caagcaattt 60
attacagata tacaaagatg ataccgtgtt gtctccatgc 100
<210> 178
<211> 100
<212> DNA
<213> 智人
<400> 178
atgcagcact cacagatcca ccactatcaa gaactgcagg tctctttaat acccagagac 60
taaatgaggt gcaccttatt cttgttttgg gtaccttcat 100
<210> 179
<211> 100
<212> DNA
<213> 智人
<400> 179
ttgggtgtgt aacactgtgg gagggtaact ataatactgt tgacagtaat aagttgcaaa 60
atcttcagac tgcaggcagc tgatggtgag agtgaaatct 100
<210> 180
<211> 100
<212> DNA
<213> 智人
<400> 180
ctgactcgcc cgacaagtga tggtgactct gtctcctgta gatgcagaga atgaggatgg 60
agactgggtc atccggatgg cacatctggc acctgagatt 100
<210> 181
<211> 100
<212> DNA
<213> 智人
<400> 181
ctttcccctg gagacaaaga cagggtgcct ggagactgcg tcaacacaat ttctccggtg 60
gtatctgaga ttggaaataa aacagaaaag tcacccatgt 100
<210> 182
<211> 100
<212> DNA
<213> 智人
<400> 182
aatctaaatc aaacccattg tcttcccaga agagccagaa ttattgcttt atattgagct 60
ttaattattg tattgactga gcagagttgc caggtaacag 100
<210> 183
<211> 100
<212> DNA
<213> 智人
<400> 183
gacttgagag ggttttcact gacatgcaaa accatcccat gttcccctca cctgggagcc 60
agagtagcag gaggaagaga agctgcgctg gggtttccat 100
<210> 184
<211> 100
<212> DNA
<213> 智人
<400> 184
agctcttctc cagagctctg acccaggcat tgatatgggc tctggactgc agggcggctg 60
ggagggacat gcaaagcagc tggggcgggt gctgggcttg 100
<210> 185
<211> 100
<212> DNA
<213> 智人
<400> 185
cagctgcaga gacaatctgc ctcccctttc tgctctcagc agcccatgcc caggtgatca 60
ggccagaaaa ggccgttggc tcagtctgag ggtagaactt 100
<210> 186
<211> 100
<212> DNA
<213> 智人
<400> 186
ctcccctgcg gccacagaat ttaacccctg tgtcctcttg tctcaccatc acctagattg 60
agccacagaa tgtttggtac aagtctgtta gaaacaaaat 100
<210> 187
<211> 100
<212> DNA
<213> 智人
<400> 187
agaaggctgt ggtttcattt ttctctttct gctccaactt gtgcccagtc agctccctaa 60
atgcatgatg gatcaggttg aaaggaagag tctattacaa 100
<210> 188
<211> 100
<212> DNA
<213> 智人
<400> 188
ctttatcttc cggatatact tgtatttact tgttagtgat ctttcctgag ggtccagaag 60
ctgtctcatt ctttgcagaa attaaaagag taacattcaa 100
<210> 189
<211> 100
<212> DNA
<213> 智人
<400> 189
ttaacctcag cactgtgggt gtgaggactt tcacaactgc acagataagt gagacctggg 60
ctccaaatcc tcagggtagt gataccattt ccctaaagac 100
<210> 190
<211> 100
<212> DNA
<213> 智人
<400> 190
agaagatggt tttgtccatg caggcaaaga actatttctt gggtgatcct ctaaactatc 60
cagtcttttt attctgtata gctggtatag tttaccctta 100
<210> 191
<211> 100
<212> DNA
<213> 智人
<400> 191
ggctatatat gtatttgttc atatttcaaa aatacacagt ttcaaaatgg aactcaaggg 60
atccaaggct caaaggggtc tccagaagac cccacaccat 100
<210> 192
<211> 100
<212> DNA
<213> 智人
<400> 192
cccctttctg tgtcagtctt ccccagagca cagatccttg tttctgcttg aatcttcctc 60
actctcacag atctgatcat cacatgcccc actctggagg 100
<210> 193
<211> 100
<212> DNA
<213> 智人
<400> 193
acaacatgtg catgtccaat acaggaaagg aacacacata ggagtgtagt gagaccccca 60
gagatcactg ttgttagagg cagtggggcc ccagaactca 100
<210> 194
<211> 100
<212> DNA
<213> 智人
<400> 194
ggagcagcag cgggtggaga ccccatgggc tggccgagac aagaggactc ctcagccagt 60
cctcctgacc tgagacaggt ctcaggaatg tgcggaggac 100
<210> 195
<211> 100
<212> DNA
<213> 智人
<400> 195
acaccgggac atacatttcc cttcatgctc ccaacataca catgcaaaca tacacagacc 60
catacaggca cgcgcgagca gccatgcccc accccctccc 100
<210> 196
<211> 100
<212> DNA
<213> 智人
<400> 196
ccaacacaca cacgtataaa agtgtgtgta tatgggcaaa ctgctcgcat ccccaaatgg 60
caggctcttt ccctagaggc gcccagtccg cggcggggag 100
<210> 197
<211> 100
<212> DNA
<213> 智人
<400> 197
aagctcactc actggggcca ttgactggga tccagtctgt ggccatgtca tggtttctat 60
ttttgaggtt atagctaatg agcaacatga ggttaagaca 100
<210> 198
<211> 100
<212> DNA
<213> 智人
<400> 198
cacttttcat aaggccccag ccagcatcat aaatatgtgt gtgagcatgt tcacactcag 60
gttatgtctt ctttatgtgc accctctacc acacacacac 100
<210> 199
<211> 100
<212> DNA
<213> 智人
<400> 199
gccaagaacc acgactctct aattttactt cccagcaggt attcagtgca taatagttcc 60
tacttagaag tatcatattt gcccaaacac aaggtgatac 100
<210> 200
<211> 100
<212> DNA
<213> 智人
<400> 200
ccaaaatgag gtaagtttcc tgttttctca gtgagatctt ttgttgttgt tgttgttgtt 60
gttgttttgt tgtcgatgtt gttgtttttg gttttggtct 100
<210> 201
<211> 100
<212> DNA
<213> 智人
<400> 201
ccgggtcgtc cagccccggg ccgccgcggc tgcccactac acccacgcca accgcccgca 60
agcagcgctg caggggctcc gctgggcgac acgccaggct 100
<210> 202
<211> 100
<212> DNA
<213> 智人
<400> 202
ctgtcccaca gggtgctggg gagcgactgg gcggctccgc cgcgagcgtc tttgaattgc 60
gcgccgctgc aggaaaccaa aaactcccta gcaagagggt 100
<210> 203
<211> 100
<212> DNA
<213> 智人
<400> 203
ttcaaaaggt ttctggaaac caccgacggt taaacatcac aactggactc ggagagagcc 60
aaacggtttc cccacttgca cctgccagtc ttcgcggcgg 100
<210> 204
<211> 100
<212> DNA
<213> 智人
<400> 204
cgacctggca gcccaggtgc ggtcttaacc gcccccgccc ctcaccccgt acccgctcct 60
atccccggag cgcaaatctc agggctggca gctgcgcggt 100
<210> 205
<211> 100
<212> DNA
<213> 智人
<400> 205
ggaaggtttt ccccctcaaa cccaaagcgc gcgggcggat caactcctag ctgctgccac 60
cactcgatcc cctcagagga tcggcgcggt gggtccaccc 100
<210> 206
<211> 100
<212> DNA
<213> 智人
<400> 206
gcctctcccg ccctctgcct actgtgctgg gagactggca cagctccgtc ggccgcacag 60
agtttaacaa acacgcaccc agtgtcaaga acagtcacca 100
<210> 207
<211> 100
<212> DNA
<213> 智人
<400> 207
ggcgcttaac cccgaagtta aagcgggcgc aatctcctcc tgggaactca gcccaggcac 60
gccgccctcc gcctctaaat tcagacaatg taactcgctc 100
<210> 208
<211> 100
<212> DNA
<213> 智人
<400> 208
caagacatcc ccgcttcccc aaggaagaga ccggtggtct gagtcccgag gcagcgcgca 60
cgccttctct gcacttgtgc acagaatgtt cttacgtttg 100
<210> 209
<211> 100
<212> DNA
<213> 智人
<400> 209
caaacagcgt gcaagccgcc gcgcgcggcg ggactcaagg gggagacaca tgcagccact 60
ggaacgctct ttccagtcgt ttctcctcga ctcacagaga 100
<210> 210
<211> 100
<212> DNA
<213> 智人
<400> 210
aaaagattcc aatcctgctc cccccccacc cacccgcact atataggcat ggtcaagaaa 60
actcctttcg gtgacccttt tttggagtac gggtacctcc 100
<210> 211
<211> 100
<212> DNA
<213> 智人
<400> 211
aatgtcctgg ccgcttctgc ccgctcggag aggggctgcg ctctaagttc aaacgtttgt 60
acatttatga caaagcaggt tgaaactgga cttacactga 100
<210> 212
<211> 100
<212> DNA
<213> 智人
<400> 212
tcccctccat ggtaaccgct ggttctccag atgcggtggc tactggagca ctcaggccct 60
cggcgtcact ttgctacctg ctgccgcagc caacaaactg 100
<210> 213
<211> 100
<212> DNA
<213> 智人
<400> 213
cccattgctg acatacttac tccctgagag tggctcttca tgcacctcca aggggttgct 60
ctccggtcca tccagtgtct tgctcacccc ctgtggtgaa 100
<210> 214
<211> 100
<212> DNA
<213> 智人
<400> 214
agttctccac catctccctc tccggagggt gagctgggct gcttggcgag gggcacctcc 60
cctctggggc ctgagctggg ctctgggctt tggtttctcc 100
<210> 215
<211> 100
<212> DNA
<213> 智人
<400> 215
cagccggagc actgcacaca tccccagtcc ccggtttctc attctccagt gacgcgtgat 60
ccccacgtgc gttttttgca tctctggcat cctcggtgct 100
<210> 216
<211> 100
<212> DNA
<213> 智人
<400> 216
atttgcaggt tatatcctgg atggtggcac gacagcgcct ggaacacaga aggttgggag 60
gcgtgacgct catcaggaag gctcttttgg ggagccagga 100
<210> 217
<211> 100
<212> DNA
<213> 智人
<400> 217
agagtccccc agaagcccac ttggcaccct atctataaca agttgctctt taagaatcat 60
gggaactcca gaatcatttt cacaaatacc ttccactcat 100
<210> 218
<211> 100
<212> DNA
<213> 智人
<400> 218
gattcaatta aatggcagaa aacacaaacc ttccgttccc actggcaaac tgggtctagc 60
taactgagca cagctagcac aaggcaggcc ccctgctagc 100
<210> 219
<211> 100
<212> DNA
<213> 智人
<400> 219
agggcaagtg gcggcccggt ccccaaggcc caggggagcc tctgcagctc cctggaagga 60
cggtcaagtg aacagagagc tggctgccat ctgggttctt 100
<210> 220
<211> 100
<212> DNA
<213> 智人
<400> 220
atgagatcac cagtttatcg taactagagg cctctcccat ctaaagcatc tttgtaactg 60
ctttcccttt ccccacactg cctacacata aagaagcccc 100
<210> 221
<211> 100
<212> DNA
<213> 智人
<400> 221
taatttgtaa caagtcattt gacaactcca gaagaggggc cacatccttt ttctctatgt 60
ctgttgatta acaaagacaa cattatgttt ccaacaccag 100
<210> 222
<211> 100
<212> DNA
<213> 智人
<400> 222
tcagaccaag ggggaaaaaa gtccccatga cttcagtaat tttccatcct ttggaacaag 60
gaaatataca caaaaggttt actatagaat gtaagcattg 100
<210> 223
<211> 100
<212> DNA
<213> 智人
<400> 223
aactgttcaa gattgggctc tcacactaac acacctcttc cttgcaactt gcacccaatt 60
tgactctggt cctaggcatg ctgacctgaa atagttgctg 100
<210> 224
<211> 100
<212> DNA
<213> 智人
<400> 224
gctgcggcaa gcaccacgcg gtggcaggag aattcctgaa tgtccacaca caagatgaca 60
tctgtcagag cgttttccat tcgcagggtt tccaggccat 100
<210> 225
<211> 100
<212> DNA
<213> 智人
<400> 225
tctgaagaat taaggagagt cccgcgtcgt caaatttgac cttttcccca tttaagatct 60
cgaccaagtc tcctgttttc tgggagggct catctgtaga 100
<210> 226
<211> 100
<212> DNA
<213> 智人
<400> 226
aggtgccagg ggcccttcca aactcttctc gaccacatca cccatggtcc aggcgcccct 60
ttgtcctgcc atcaacatcg agactgaagg agcgcccaag 100
<210> 227
<211> 100
<212> DNA
<213> 智人
<400> 227
ccttcctgtt ggccactaca tacgtgtccc ccgcttcttg cccctctctg cttgggtccc 60
tgctacactg gtatcctgca ctttccacct tgtattgcca 100
<210> 228
<211> 100
<212> DNA
<213> 智人
<400> 228
gtttgtttcc aaggccatct ccactttgag cttgttcatg accacctcac acagcacact 60
tggtctgtgt ggtggtttga ggggttctgt ctgtacactg 100
<210> 229
<211> 100
<212> DNA
<213> 智人
<400> 229
tgctttggct gtgttggagg cgggcaggtg ggaaggaaga aatgtattct tggggagatt 60
tgtttttaga gacatgagac atggaaaata gttaagtaat 100
<210> 230
<211> 100
<212> DNA
<213> 智人
<400> 230
aatataatat gggaggcatg gactatcaga ggaggcaggc aggactgccc aacctcctca 60
ctgggcacgt tacgctactt cctcctgacc tctatagtcc 100
<210> 231
<211> 100
<212> DNA
<213> 智人
<400> 231
ctatcattgc cctttcttac cttgatatcc taaaaagctg gtggtctgtc ttctctatct 60
tttgtcctgg tcagttatcc taactatttt gtgtctgttt 100
<210> 232
<211> 100
<212> DNA
<213> 智人
<400> 232
ctgtggatta gtaaacgggg tccccacccc cactccacaa ggagaacatc tggcacccag 60
aagtcactga gagaatagct gttgctttgg tagaattctg 100
<210> 233
<211> 100
<212> DNA
<213> 智人
<400> 233
cctctgagtg gcttgttctt ttcccagacg gagaggtctc ctgacagcag ctctcttctt 60
tttctttttt tttttttttg agacagagtt ttgctcttgc 100
<210> 234
<211> 100
<212> DNA
<213> 智人
<400> 234
ctcctgtacc ctgtgggcct gagagaggag acaatgggac aagaagaccc agtggcttcc 60
ttggaagctt ttgtgctagc tggagagaga agacctactt 100
<210> 235
<211> 100
<212> DNA
<213> 智人
<400> 235
cctatatgcc tagcaacagt ccacactgac tggactgcaa ccaggacatt tccagattac 60
tcagtggggc ttatcttgaa ataatagttg atgccatttg 100
<210> 236
<211> 100
<212> DNA
<213> 智人
<400> 236
ttaaatatat tatatatacc atctaagggt cttacatgcc ttctctcatt tgatcttcat 60
ggcaaaccct gtgaggtatg accaccaacc accattttac 100
<210> 237
<211> 100
<212> DNA
<213> 智人
<400> 237
ctcagaactc aggctcccag agtttaagtt gctcacagga gcccagaaag taagcgacag 60
aggtgggatt tggttctagg tgtttgccac cagcacttta 100
<210> 238
<211> 100
<212> DNA
<213> 智人
<400> 238
aatcaccaaa gctttctgga agctccaact tttcttctca agatactgaa agacaggtat 60
ctggatgggt tggcagggcg ggtgggaggt gggcgagatt 100
<210> 239
<211> 100
<212> DNA
<213> 智人
<400> 239
tccatcaaca acgggtctaa aaccagcgat ggtgagctgg gtgattttga tggaacccct 60
gccatacagt ctattaatat cataattgga gctaaaattt 100
<210> 240
<211> 100
<212> DNA
<213> 智人
<400> 240
aatcatgatg gcaatcatga gttctggggc ttcttgattt gggccagcag acacagtctc 60
agtcactagt tctccgaatc agagaaagga tgccttcagg 100
<210> 241
<211> 100
<212> DNA
<213> 智人
<400> 241
ctgtgtcttc acatggcttt tcctctgtgc gtggtggaaa gagagagctc tgcgggtctc 60
ttcttgttgt aaggacactg gccccattgg attagggccc 100
<210> 242
<211> 100
<212> DNA
<213> 智人
<400> 242
caccacatga cacatttaat cctaattacc tccctcacag ccctatttcc aaacagggta 60
ttagtcacat tagggattag ggcttcaaca taggaattct 100
<210> 243
<211> 100
<212> DNA
<213> 智人
<400> 243
gggggcacac aattcagtct ataacagagg gaaaacagat ttgagaagaa aaaagtccaa 60
aatatgcaca gtggtaatat ctgaagatgt gcgtgcgtgc 100
<210> 244
<211> 100
<212> DNA
<213> 智人
<400> 244
tcaagggctc agcaaacgac aacttaagca tttagagtcc catccctatc caccaaaccc 60
agaataagtt agtcttttca agaaagcatt ggtataaaac 100
<210> 245
<211> 100
<212> DNA
<213> 智人
<400> 245
ccttcaaaac tgaaaagaag aaaggggcaa ttggagaatt cccacttttt ctggctgtct 60
ccttcaagtc gcccagtttt tatgaacagc atctagcctt 100
<210> 246
<211> 100
<212> DNA
<213> 智人
<400> 246
actgtcacta tcaacaaccc ttaaaactag ccaatgcttc ggcctctagt attggaaagt 60
cttccaaata ggatactgga aacttctatt tataagcttg 100
<210> 247
<211> 100
<212> DNA
<213> 智人
<400> 247
gggtggcggg cggggcgggg aggtggagag agagttgcca tctacaggtt tctattttgg 60
cctgaagact caactgcagt cattagagta agggaatgcc 100
<210> 248
<211> 100
<212> DNA
<213> 智人
<400> 248
ttatttatta aaaccacaca caccttgcaa agaaaaaggg aaactggcag tctctgtaga 60
ggaagccggt ggcatcgctc agagccacaa actgtatttc 100
<210> 249
<211> 100
<212> DNA
<213> 智人
<400> 249
taaacagccc tttccctggt tccctctctc ctgccccact ttttttaaaa tccagactgt 60
aaaaaacaca tctactgaca ctcactttac tttaaaaaaa 100
<210> 250
<211> 100
<212> DNA
<213> 智人
<400> 250
gaagagaaaa agtaaagcgt tacaagactt tcctcctgga aactataaac tgaaaaaaaa 60
atccataaaa gattaaatcc tggcgggttg tggggtggcg 100
<210> 251
<211> 100
<212> DNA
<213> 智人
<400> 251
ggggccggcg gggagggggc gcggagtgga gattggctct ctgaggtggt caggggccct 60
gtgacagctt gggactttca gcacctggtt tggggtcatt 100
<210> 252
<211> 100
<212> DNA
<213> 智人
<400> 252
tatctgctca actgtcagga ccccccaccc ccaaacccca gccaccaaca caaccatcgt 60
agaagggaac acaacacaga gggtcttttt tcattttttt 100
<210> 253
<211> 100
<212> DNA
<213> 智人
<400> 253
tttttaaaaa atcggtttgg ttgtgttttt gttttccatg ggggagcttt aaaactcatt 60
attgcaacac tagttccatt tttcgccagg gttccaataa 100
<210> 254
<211> 100
<212> DNA
<213> 智人
<400> 254
caagacattt accacggtca ctacatccgg cagcggggtg gcccctagct cctgctgccc 60
ccccgccctt tctccccgcc cgcccccgga gctcagccga 100
<210> 255
<211> 100
<212> DNA
<213> 智人
<400> 255
tttctgaggc tccaactcta cccactccct ccccgggccg ccgccgccgc gccttccccc 60
attcttactc cctcgaggag agccacaggt tgcaaatcca 100
<210> 256
<211> 100
<212> DNA
<213> 智人
<400> 256
accaacctcg caatctattt ttgcaaaatc actcacaaag atctcccttt cgcgcccgcg 60
cccgctcctc ccgcgccggg tcccctcagc cacggccaca 100
<210> 257
<211> 100
<212> DNA
<213> 智人
<400> 257
aagtgccctt ctctcctcct gagtcttgca cataaggaac gcgggctggg gctctgttcg 60
tctttctcct cgcccaaggt aaggacctcg ggaatctgaa 100
<210> 258
<211> 100
<212> DNA
<213> 智人
<400> 258
gcctggcgtc cactacgctc aggcccgcag ttcccttttt acagagcttg caccatggga 60
aaaaataaaa taaaatttag gaaagggagg caacagccat 100
<210> 259
<211> 100
<212> DNA
<213> 智人
<400> 259
taaaatttag gaaagggagg caacagccat tgggagccaa cacagagtca cgcagcgccc 60
aaaatacaaa caccgcagcg gccagaaatc ccgccacctt 100
<210> 260
<211> 100
<212> DNA
<213> 智人
<400> 260
tctcgttctc ccaggctgtc ctgtcgaggt tccctgagtc cccccgcaca ctgaaaggca 60
tcgcaggtgc agtgcgcacc cctttcccac ccaccccaag 100
<210> 261
<211> 100
<212> DNA
<213> 智人
<400> 261
aagccctgtc ccgccatcag tctctctcct cgggatgagc agggagagcg cgcggaggtt 60
cccgactccc tcgactacaa ccaagaaaga ataattttca 100
<210> 262
<211> 100
<212> DNA
<213> 智人
<400> 262
aagtgttcaa catccccgcc cccaagctcc ccaaaacaca ggggcaggga acaccaaaac 60
actcggctct cattaggaag atcacggctc tgaaaggaaa 100
<210> 263
<211> 100
<212> DNA
<213> 智人
<400> 263
tagtagacac gatacttcat ctcatctgga tttatgacca aaaaaacaaa aacaaaaacc 60
caaagagttc gcttgcattt tttccttcca aatctcggtt 100
<210> 264
<211> 100
<212> DNA
<213> 智人
<400> 264
aacaaaaacc caaagagttc gcttgcattt tttccttcca aatctcggtt cggctcgaag 60
gcagggaatc taaaagaccg aggccgatgg aagagagcca 100
<210> 265
<211> 100
<212> DNA
<213> 智人
<400> 265
gcggggcgag cgagcgggca gcctcccttt ttgcctcccg gagttaccca gaaggacagg 60
ggaagggaag gaagaagagg cgaggaaaaa gaggagggag 100
<210> 266
<211> 100
<212> DNA
<213> 智人
<400> 266
ggaagcggag gccaggagcg acggagcaag gaaagcagtt tgcaagcgag aaaagaggga 60
aaaaacacag ccgcacgaat ccagagagat cacaagccgt 100
<210> 267
<211> 100
<212> DNA
<213> 智人
<400> 267
acgcaagcag cagcagaaag agcgagagcg cgagcgcgcg tcctctccgc ggtctggggc 60
cagacagccc ccagactagc ccgaatcacc ccccaagcac 100
<210> 268
<211> 100
<212> DNA
<213> 智人
<400> 268
tgtctcgtcc tctctgctcc ggccgccccc taattcccct ccttcctctc ctccacctcc 60
tttccaaaaa ccaaaacaac acaagggagg gtggcaaaag 100
<210> 269
<211> 100
<212> DNA
<213> 智人
<400> 269
cctccccaaa ccggccgatt cactcaaaga caacaataat aataataaat acataacaat 60
ctatatccta tggtgggaga gacgtgggac taatcttcgg 100
<210> 270
<211> 100
<212> DNA
<213> 智人
<400> 270
acataacaat ctatatccta tggtgggaga gacgtgggac taatcttcgg catttatttt 60
aacacctgac agctagaata aataaatata tacatttata 100
<210> 271
<211> 100
<212> DNA
<213> 智人
<400> 271
aataaatata tacatttata tcaatagata cacatagaaa acttggagcc aaagcatttg 60
gcaagagcgg aaaaaaaaag aattaaaagg taaaataatg 100
<210> 272
<211> 100
<212> DNA
<213> 智人
<400> 272
atcatgagca gcggcggcgg cagcggcacc agcggcaaca gcggcggcgg cggcagtagc 60
agcagcagcg gcggcagcaa cagcaataat cacctggtgt 100
<210> 273
<211> 100
<212> DNA
<213> 智人
<400> 273
ccggcctttc ctagaaactt cttgcatcac cacttctaag aaccccagtt ctaagaatca 60
acagagctca attctcggaa tttgagcttc ggactttacc 100
<210> 274
<211> 100
<212> DNA
<213> 智人
<400> 274
actgctacgt ggcaggggag gacttggtgt cagctctccg agatttttac tgcccctggc 60
caaccaaaag ccctcaaagc cacaagattt tttcactggc 100
<210> 275
<211> 100
<212> DNA
<213> 智人
<400> 275
cggcatattt cgaggtcctc ataagcagag cgtctcggat ttggaggttc cggttcgagg 60
ctcgaggggc ctgaaggtgg ctctccctcc ccgggcccaa 100
<210> 276
<211> 100
<212> DNA
<213> 智人
<400> 276
gacgatggta tggcctgctc cgccaccatc acgtgggctc ctcctctgtg acgtcggcgc 60
cttcgctgta gcaaagctcg gcctctggaa ttctgagaac 100
<210> 277
<211> 100
<212> DNA
<213> 智人
<400> 277
gcacaaaagg gagcgagagg tttgaaccac tgggaaaagt atgttatata tatagtaggg 60
ttagagaggc gagtaagaga aaaataaaat aaaataaaca 100
<210> 278
<211> 100
<212> DNA
<213> 智人
<400> 278
aaaataaaat aaacatcaca gctctttcca actagaatat taggcaccac gagaaaaata 60
tttgccaagc agttttcggt gggttcattt gctttatttt 100
<210> 279
<211> 100
<212> DNA
<213> 智人
<400> 279
tatttaggac aggggttttt gctgttgttc tgggtttttt tctttctggt gtggtggctt 60
gggatttttg gtttctgtat tttgatggtt tatggatttt 100
<210> 280
<211> 100
<212> DNA
<213> 智人
<400> 280
tgcttctgat tttttgcctt ttgcaagttt gtggtgttac gtaaatcaca ggatcggcat 60
cggttggatt tttttgtacg tgccttttct ttccctatct 100
<210> 281
<211> 100
<212> DNA
<213> 智人
<400> 281
aatccctcaa gcgttttaaa gatgtattat ttcaatacta atactattga aagaagctta 60
aatttttggc catatgtaac aatcccagcc cccacttttt 100
<210> 282
<211> 100
<212> DNA
<213> 智人
<400> 282
attatcatca tcaccaccaa catcctctgc cctggagacc aagagaattc aaacaggtca 60
gcacctctaa ttgctgtata gaacattgac cctactgtct 100
<210> 283
<211> 100
<212> DNA
<213> 智人
<400> 283
cccagttcct gaggatggtg tgataataat acatctcaga gttctgtagt ttcttcacca 60
ctgtgcaggt gtggttggtg ggagcaatgc cctggatgga 100
<210> 284
<211> 100
<212> DNA
<213> 智人
<400> 284
taagccaagc tcttgtgtcc tggcagataa acaaggtgaa ccctcaatcc gtgtagcagg 60
agtttccaga caaactcact ttgcatggaa ggacactaac 100
<210> 285
<211> 100
<212> DNA
<213> 智人
<400> 285
ccttccaggt gcatggaaat attttgtagt ttttactgtc tcccccttcc tccactgcct 60
catctttttt gttttttccc ctgtgagact atttgctctg 100
<210> 286
<211> 100
<212> DNA
<213> 智人
<400> 286
cctttccaac actggcctgc cttagggact caccgtctgc actccgcctg cacaggtgga 60
actgagttca gatgagggag aattgctttc cattgttcag 100
<210> 287
<211> 100
<212> DNA
<213> 智人
<400> 287
taggcttttt gtaatttcta gttttgctta cctttcctac tcaccacaca cacaaaacag 60
tgtgagcttt ctcattctag tgcataaaca caggtcggtc 100
<210> 288
<211> 100
<212> DNA
<213> 智人
<400> 288
aatacccaca agtgttccaa aaggtgagct ggcattgctg cccaactggg cattatagtc 60
ccttctgtcc ctgcccatca ggcttgcctt cctcggcaac 100
<210> 289
<211> 100
<212> DNA
<213> 智人
<400> 289
ctttctagct tgaattgtac tgtgactcct tctcacggac cactcccgga gactggtgaa 60
agttgggccc attcttgaag cctctgcttc taaatcatgt 100
<210> 290
<211> 100
<212> DNA
<213> 智人
<400> 290
tttccataaa gtctccctca tcgtgcttgc ttccaccttc tcctatttgg aattactggt 60
gggctcttcc actgtcccat agcaagtgtt ctatacattc 100
<210> 291
<211> 100
<212> DNA
<213> 智人
<400> 291
tgaaggcaca tttgaatata tactttgtca tggttgcttg gaaccatgtc gtcttttcca 60
agtaggctgt gaacattcag tggcatggat cataccgtgc 100
<210> 292
<211> 100
<212> DNA
<213> 智人
<400> 292
cccattgttc aaagaaaggc attatggagt ctccaaaagc cattggcagg tggtgtctgt 60
gacttcctta gcctggaaat aaacaaataa acaagcacaa 100
<210> 293
<211> 100
<212> DNA
<213> 智人
<400> 293
aaacaaataa acaagcacaa attagaagtc tttgccctat tactgcacta ttagtattga 60
ttgcgcaaca tcatgcaaaa agtcacttta atttatctgg 100
<210> 294
<211> 100
<212> DNA
<213> 智人
<400> 294
caggtcctat gtaaacacca atacagtcaa gagggcttgg atgggtattt gctttcattt 60
ctaatgaaat ttcaggcctc tagggtagga tatcaaaatt 100
<210> 295
<211> 100
<212> DNA
<213> 智人
<400> 295
ggtagatcat ttgcaattta ttttatccca aacacctcac tttacagtca gagaaactga 60
ggcccagaga agtaaaatga gttgctcaag gtctcagaga 100
<210> 296
<211> 100
<212> DNA
<213> 智人
<400> 296
actgaggccc agagaagtaa aatgagttgc tcaaggtctc agagagcaag aaatagagat 60
gggacttgag cacctagatc tctggtattg ctgtcctgta 100
<210> 297
<211> 100
<212> DNA
<213> 智人
<400> 297
gttcatggag ctggcagatg gatacatctg tgacctggga tgatggagag actgctggac 60
ccttcagagg atctcatctc aaggtggggt ttatgtgtaa 100
<210> 298
<211> 100
<212> DNA
<213> 智人
<400> 298
atgatatctg tgtgtttcat tttcctttca taaactaatt taaaaatcct tttggtatca 60
aattttaagc caaaaagtag tgagggggaa catgggtagg 100
<210> 299
<211> 100
<212> DNA
<213> 智人
<400> 299
aatagcttac agcttgccta acaaggttgt tgactgcata agagtcagga gttttgggta 60
agagtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgag 100
<210> 300
<211> 100
<212> DNA
<213> 智人
<400> 300
cgtactgaat ttgactgctt tattttgtag ggaaggaaac tgatgtgcct agagtagttg 60
agagctttat tcaaactcat tccactgtta ttgagtagtt 100
<210> 301
<211> 100
<212> DNA
<213> 智人
<400> 301
aggatattag accagcaaca tatttgggta gaaactttca tataaaaaag cgtaatcata 60
actatccaat catgtcaact agtaaggctg ctcaggtggg 100
<210> 302
<211> 100
<212> DNA
<213> 智人
<400> 302
ataacacatc aaccttcttt gggattcttc cctcagacat ggttttggtg ggaggagcat 60
ggcaagggag gggcgagctc caaatgcagg gctgctctgt 100
<210> 303
<211> 100
<212> DNA
<213> 智人
<400> 303
cctcggcgac ctgagcagac acacgagcag agatcagaga cactcttagt gaatgaacct 60
ccctattggc tatattaaag taatgctctg aaaaagttcc 100
<210> 304
<211> 100
<212> DNA
<213> 智人
<400> 304
tatgtatgca tagtctaaag tgatgatttt agaggtagca agacagtgag aatgtcccta 60
catgtgaaat gggcacagtt ttatcaggga agtgtcaata 100
<210> 305
<211> 100
<212> DNA
<213> 智人
<400> 305
gagggttaat gttccacgta gtggctgcaa gaatgataag tggtcatggg gatagcctga 60
cactctagga gcagaaggtg gtgggtatgg atagaactac 100
<210> 306
<211> 100
<212> DNA
<213> 智人
<400> 306
tgatatagca tgaatccaac ctgctgttat ctgcgcaggc ctctctgcag ctgtttgccc 60
tgaagtacat gctgtacgtt tctccagctg atcctgcatg 100
<210> 307
<211> 100
<212> DNA
<213> 智人
<400> 307
actgggtata aacgcctgtc cgctgtgtgc tggacagccc cagacaccct cggcagcctg 60
ctgtgtttgt gtgagacatg ctgtgttagg gatttaagca 100
<210> 308
<211> 100
<212> DNA
<213> 智人
<400> 308
acagctttct catctacatg gacaacctat ttttaaagaa tcttcagaga gtcgttgact 60
ttgttataac tactactata tacgtaattt cagatgatag 100
<210> 309
<211> 100
<212> DNA
<213> 智人
<400> 309
aattgaaaat ttaacttgtt tttctagaaa gagtttattt tccctataac ttcaaagagt 60
aatggtgggg agtaggacat tctgaaaata agaagaaaca 100
<210> 310
<211> 100
<212> DNA
<213> 智人
<400> 310
tgtcaaatga atttctgact tccagctagg catatggaat aaaggtcttt attccagtga 60
cctctgctca ttggaaaact ttgggctggt agatttcatg 100
<210> 311
<211> 100
<212> DNA
<213> 智人
<400> 311
tctcttgcat tcttaacttg caatttagta ctgtttatat tctgcttgaa ggttagagac 60
attcgactaa atggtctttt ctccacattg ctgtcattca 100
<210> 312
<211> 100
<212> DNA
<213> 智人
<400> 312
ttaatgtcct ggtcctggac tttactcatt gaccacagga caagtggctc aactctctcc 60
tgccactacc caggctgtta gtcctgttgg gaggctcagg 100
<210> 313
<211> 100
<212> DNA
<213> 智人
<400> 313
gcccaactca ctcatctgta actctcatct ccattcagct gcagcctcta cagcccctgg 60
ttataccctg gatcttatca ttgcttcgct ctattttacc 100
<210> 314
<211> 100
<212> DNA
<213> 智人
<400> 314
tcctaaatcg taaaaattaa aaccagcctc ggaacacaac ccctcattct tccagcactc 60
tctctcattc aggtaactcc tattctactt ttcttcagca 100
<210> 315
<211> 100
<212> DNA
<213> 智人
<400> 315
ttgttttttt ttactttacc ttaatttctc tttttggact aagatgttaa aatgtttctt 60
aatgtgactg tctccgaaac tgttttgtgt ctaccactca 100
<210> 316
<211> 100
<212> DNA
<213> 智人
<400> 316
tcctagtggc agtcattgat ccttttcttg ttgcgagtgt ttgagtgtgg gtgtgtgtga 60
gtgtgtatat gtatttgtag agggaaaaac aagagagagg 100
<210> 317
<211> 100
<212> DNA
<213> 智人
<400> 317
tgtgagtgtg tatatgtatt tgtagaggga aaaacaagag agagggaaac agacattgga 60
gccacctttc ccccactagc cacgtacctg ttgaaccttc 100
<210> 318
<211> 100
<212> DNA
<213> 智人
<400> 318
aagcctctct atagaatcag atatacacaa gcacagtgac agaactacat gtgtcctaca 60
gtccagcttt taagatatga taaaaactct tgtattcaca 100
<210> 319
<211> 100
<212> DNA
<213> 智人
<400> 319
gagctaaatg gcaataacca taggagattg catattgcta cattatgtaa agacagagtc 60
ccaagaaaat agtgagaact cagtttgatg tatgatgtga 100
<210> 320
<211> 100
<212> DNA
<213> 智人
<400> 320
tatgtgatat cttactttac atggctaaca gttgacattc tttgtggatt ctatattgtc 60
taaggctaca gaagagccat atgataaatt catcggcaac 100
<210> 321
<211> 100
<212> DNA
<213> 智人
<400> 321
cagtgaaaag gcttgggccg cttttgtttt cacctgcttt tgttgaacaa atttgatttc 60
cggagtcagt cattttactg tcaagacatt tcttcggcat 100
<210> 322
<211> 100
<212> DNA
<213> 智人
<400> 322
tctgcaacag gtaaggattt tgcttcctta aaagtatttc tttggtgtca aaagaaattt 60
ttctaatttt atttagcttt tactctaggc caaacatcgt 100
<210> 323
<211> 100
<212> DNA
<213> 智人
<400> 323
aatgactctg agctacctgc tgtaaggtgt agaatcaatt tacaggggga cgggggtcgg 60
gggggtgagt gttgctttga tattcactgc ccctcaccac 100
<210> 324
<211> 100
<212> DNA
<213> 智人
<400> 324
agtcctaaca agatttttga aacatgaaaa gttacaatag ttggcttttt ggttttccag 60
atattctaga gaatgcatat gcttgtgact gtggctgagc 100
<210> 325
<211> 100
<212> DNA
<213> 智人
<400> 325
tcaactgtat gggtagttta aatactaccc aaggtttgat gaagtaaatc taaagatgct 60
ctaagttgtg caaatatgaa ttttaaagtt gtctagttca 100
<210> 326
<211> 100
<212> DNA
<213> 智人
<400> 326
gaaaagaaac agaaccgaag tctaaatgat gtagatttca atctggaatt tctagcttgt 60
gtttttcacc tattgccaat gttaatgacc atttcccaaa 100
<210> 327
<211> 100
<212> DNA
<213> 智人
<400> 327
agtgctctat gatgtataac atgtattttt taattaaatt taatctttct tctgaggtgg 60
tttgatttgg agatatgcta cgaggtacca gtcagtagcc 100
<210> 328
<211> 100
<212> DNA
<213> 智人
<400> 328
tgagttgtaa ctaaacaaag tttgggaaat caccggtttt aggtgcttta ctaaatgaaa 60
gttgccattg acgtattcaa gcaggcaaca agtagttggt 100
<210> 329
<211> 100
<212> DNA
<213> 智人
<400> 329
gtccccttat tggttctaag ctggtgccgt ggaggatata agagaaatat tttaaaaatc 60
tctactttga aggaccctat aatctggtag ttgtgataag 100
<210> 330
<211> 100
<212> DNA
<213> 智人
<400> 330
tttaaaaatc tctactttga aggaccctat aatctggtag ttgtgataag aagtaaaatt 60
taggaagcaa tgcaagatga gaattcagtg atgagtgggg 100
<210> 331
<211> 100
<212> DNA
<213> 智人
<400> 331
cagcacaggc ttgaagagtt ctgtgaattc catggagggg gcctgggggc aaactggagt 60
tgtcaggaag atctgggctt tggaagaatg cgaagtgtcg 100
<210> 332
<211> 100
<212> DNA
<213> 智人
<400> 332
gtagaaggag aaggggcagg tgatttcaga ctgggaggac cttgtgggca aaggcacaaa 60
ggcgagactg acctggagat gataaggcca gttgaagaga 100
<210> 333
<211> 100
<212> DNA
<213> 智人
<400> 333
acattgcagg aaatcagatt agacagttag ggtgtggaca caaaagcgag gaccttgcag 60
gcactgggga gaagtgaccc cattcaatag tccttggtct 100
<210> 334
<211> 100
<212> DNA
<213> 智人
<400> 334
ccttctgccc tgcggctgcg cttcctcggc tctcacggca ccagcagaat tccatgtgag 60
agggagcttg tcgagcgtgg cctcttccca cttggggctg 100
<210> 335
<211> 100
<212> DNA
<213> 智人
<400> 335
ctttctgcat ccctgtgcct ggctgtgggc ctccatttgc cctctactgt cttcccttag 60
gacatcattt atgcagagaa aggttcgtgt ggctcggggt 100
<210> 336
<211> 100
<212> DNA
<213> 智人
<400> 336
ggacgttgtt tagagagtca gtagatcata ataattcaga cacttttttt ctggaccata 60
aaatatctga acccatataa taacaaacat acagcacggt 100
<210> 337
<211> 100
<212> DNA
<213> 智人
<400> 337
gaataagaac ccaacttttg agccagatca ctttgcatgg aatccccatt ctatcattct 60
atcatttctg ggctgtggga acctcagaca agttacttaa 100
<210> 338
<211> 100
<212> DNA
<213> 智人
<400> 338
cttcttcaat gctcagatta aaaaaaaaat tcacaaaata tctctaataa cagtaataat 60
aactgaaaat acctacctca gagggttgtc gtagagatca 100
<210> 339
<211> 100
<212> DNA
<213> 智人
<400> 339
aaaattcaca aaatatctct aataacagta ataataactg aaaataccta cctcagaggg 60
ttgtcgtaga gatcaaatga gataaaaata tgtaaagcat 100
<210> 340
<211> 100
<212> DNA
<213> 智人
<400> 340
gtagcctagt gcctgactga aaaaaaaatc tctcaataga tgcaactctt atgattctta 60
ttaaggactt ggctattgcc acaaatgaag gtgttatgag 100
<210> 341
<211> 100
<212> DNA
<213> 智人
<400> 341
ccctggctta agagcaagaa gcctgcaaag ctaactctcc taatcccaac attcctttcc 60
agggaaagta gggtgacagg tggaggctgg gaattaacgt 100
<210> 342
<211> 100
<212> DNA
<213> 智人
<400> 342
tttttgagca ccaaatatgg acaaggcaca ggggttgggt gtttttctag tgagaataca 60
tatgaaagaa ggaaaacaaa cttggaaacc gctattttaa 100
<210> 343
<211> 100
<212> DNA
<213> 智人
<400> 343
gccatttggt aacagtttct ctagcttatg agatgagaga ggtcctctca gtatccgctg 60
cattacttgt gggcctcctt ggttgacgtc gctctctgaa 100
<210> 344
<211> 100
<212> DNA
<213> 智人
<400> 344
cgcttggggt ggaattctag aggtgctttt cattagaggc agagagcatg acctttcttc 60
cttgcccagt ttaaattaaa ttattttatc ttacaatgtg 100
<210> 345
<211> 100
<212> DNA
<213> 智人
<400> 345
ttaattttag tgctagcaag gcacagctaa aattccattt ctacttagga gtggggatca 60
ttgtggcagt gagtgcttat ttgggtttgg gatgcttgga 100
<210> 346
<211> 100
<212> DNA
<213> 智人
<400> 346
tctgggtgaa agccaggatt aaaaagcatc ctccttcccc attccactct ctaggttata 60
aatatttttt tggattaaaa gcctccttta aaaaaatgca 100
<210> 347
<211> 100
<212> DNA
<213> 智人
<400> 347
aatccacctg gcatgttaat tgtgcagggg attcctaatt atgtgtgcag atgacgtgag 60
tcacacggtg atagtgttcc ttctagagtc ccactggtgt 100
<210> 348
<211> 100
<212> DNA
<213> 智人
<400> 348
actaggcgtt catcctgtgt aatttgaaaa tatgtcacac gtggtgatga gaatctattt 60
gaggaacatg ggcagtttga aataatatat gcaatgtatg 100
<210> 349
<211> 100
<212> DNA
<213> 智人
<400> 349
actagtttat ataatgaaag gaagtattta aaaagataga atgacataga ctaatctaat 60
tgagaaatat gaaagtctaa cagaaatgat tgcttgtgaa 100
<210> 350
<211> 100
<212> DNA
<213> 智人
<400> 350
attttatgaa gaaatccaca gataaattct ccaccttgat ctatgtaatc cgaaatttag 60
atgttaaaaa tatgttgatt ctgaaaattt atatttattc 100
<210> 351
<211> 100
<212> DNA
<213> 智人
<400> 351
tttggtatga ataggtcaaa acaagtcacc attaactgac aggaagcaca gaattctcaa 60
tttagttttg gcaaagacat tattttataa atatgagttt 100
<210> 352
<211> 100
<212> DNA
<213> 智人
<400> 352
ttaaatgatt cttatgaaga aactagcacc aaagtgaatg cactctgcaa ataactccca 60
gcttctctga atttcaaaag cagccactaa atattattag 100
<210> 353
<211> 100
<212> DNA
<213> 智人
<400> 353
caaatcaatt tagctgaaag cgatgaatta cagaagtaaa tctttaggta caaagtagac 60
agctgacaca catgtagcat atacacacta gtgatctgcc 100
<210> 354
<211> 100
<212> DNA
<213> 智人
<400> 354
ttccttcttt accaacatag agtttcccat gagccctgaa tccggggcac ttttgctaac 60
ttcccctgca gcggcgacgc tgccactccc agtgcccccg 100
<210> 355
<211> 100
<212> DNA
<213> 智人
<400> 355
cagtggaagg ggctcgcgcc acctccattg ctcttggccc caaagccata gaggtgcccc 60
ccggaagggg cctggctgcc actgccattc tggtggccct 100
<210> 356
<211> 100
<212> DNA
<213> 智人
<400> 356
gaagcaggtc gtgcttgtcc ttcctggatt tccccgcatc cttatcccgc ttggcgcctc 60
ggctgctctg gcttttacct ggcttctcct ctttgctttt 100
<210> 357
<211> 100
<212> DNA
<213> 智人
<400> 357
cccacaggag cctgcccccg cggtggcggc agaggtgctg gtgctggtac tattgctgtt 60
tgggttgccg ctgccgccgc tgctcacact ttgacccagc 100
<210> 358
<211> 100
<212> DNA
<213> 智人
<400> 358
gctgaattca tgccagttgc ctctccaggg cgcccttgga cttcctgcct cttgccagtg 60
ctgctgatct cgggaatccc atacaaggca gcagaaggca 100
<210> 359
<211> 100
<212> DNA
<213> 智人
<400> 359
gagatttatt agcatcctta gaagttttac tccttttcac ttttgatttg ctggtctctt 60
tgtgtgaatt cccctgggga gcagaggcct gaacagaagc 100
<210> 360
<211> 100
<212> DNA
<213> 智人
<400> 360
aaattttagg ccatcagcta aggctgcggt agcaccagcc ccactggagg ccggacctcc 60
acaatccttg gagttgctgc tactagtggt ggtggtggaa 100
<210> 361
<211> 100
<212> DNA
<213> 智人
<400> 361
ttattcatct caaatttctg tctgtccttc tccaaatcag cgtccaaatc aattattaaa 60
tttccaaccc cgatttccca atcatcgcca ctgtcataag 100
<210> 362
<211> 100
<212> DNA
<213> 智人
<400> 362
tatcaactgt atttggatcc acaccttttc ctgcagtaga aatgttcact gacatcctga 60
agatgagctc tctagaataa aaatccgatg aacttttctt 100
<210> 363
<211> 100
<212> DNA
<213> 智人
<400> 363
ttcctcagga atttgagctg gggatctgca tcctggccat tgcagtcctt tagcatcctc 60
gccgcgccct gagcgcgctg gaggctcgca ggctgcgccc 100
<210> 364
<211> 100
<212> DNA
<213> 智人
<400> 364
tcccagggct gatgccgcgt cctgctccgc cgttctggga cgtcggggac aaaagtggag 60
gagacgggag agcccgggca gaaaaagcag gacgcgcgtc 100
<210> 365
<211> 100
<212> DNA
<213> 智人
<400> 365
ccaggtgccc acctcttcgc tttgaggcgg gggcggtggg atggaatatg ggtgcgcgag 60
gtcggggctg gtaactctcg gaggggcacg gcctccacgc 100
<210> 366
<211> 100
<212> DNA
<213> 智人
<400> 366
tgggagggat gaatggacgc tgggccccgg caaatgaggc gctgtgggtc cccaggaagt 60
ggggtaccag gctctactcc caccccggcc tctgaaacgc 100
<210> 367
<211> 100
<212> DNA
<213> 智人
<400> 367
ggccaggagg ggtggcggct gggtggggag agagggtgca agacgagcgg cgcgtgtcgg 60
gagcctttgg gctgcgggtg cgttacagga gagcaggcgg 100
<210> 368
<211> 100
<212> DNA
<213> 智人
<400> 368
gtaggagcct tcgcgggggc cgagctcgga aggcggacgg ctgtgcccgc ccaggggatg 60
cgcccgggcc ggccgcgaag gtgccttctt ccgggggccc 100
<210> 369
<211> 100
<212> DNA
<213> 智人
<400> 369
ggacgaccct gacacggcac gcgcgcgctt cgcagcctca aagactccgg ggcctcgtgg 60
tcactggcgc aggggatcgg ggcggggtgc ccggagtgcg 100
<210> 370
<211> 100
<212> DNA
<213> 智人
<400> 370
cccgcagtgc agagcagagc gggcggagga ccccgggcgc gggcgcggac ggcacgcggg 60
gcatgaacct ggagggcggc ggccgaggcg gagagttcgg 100
<210> 371
<211> 100
<212> DNA
<213> 智人
<400> 371
catgagcgcg gtgagctgcg gcaacgggaa gctccgccag tggctgatcg accagatcga 60
cagcggcaag taccccgggc tggtgtggga gaacgaggag 100
<210> 372
<211> 100
<212> DNA
<213> 智人
<400> 372
aagagcatct tccgcatccc ctggaagcac gcgggcaagc aggactacaa ccgcgaggag 60
gacgccgcgc tcttcaaggt ctccggcctc gggagccggc 100
<210> 373
<211> 100
<212> DNA
<213> 智人
<400> 373
cccgcgcgcc acagctctgc agctcgtggc agcggcgcag cgctccagcc atgtcgcgcg 60
gcctccagct tctgctcctg agctgcggta gggctcgcga 100
<210> 374
<211> 100
<212> DNA
<213> 智人
<400> 374
gcgcctgtct cgcctgtcgc cccccgcccc tccacgacac cccctcccgt cggtcgcttg 60
ctcacgacgc gctctctctt tcttgtagcc tacagcctgg 100
<210> 375
<211> 100
<212> DNA
<213> 智人
<400> 375
ctcccgcgac gccggaggtg aaggtggctt gctccgaaga tgtggacttg ccctgcaccg 60
ccccctggga tccgcaggtt ccctacacgg tctcctgggt 100
<210> 376
<211> 100
<212> DNA
<213> 智人
<400> 376
caaggtaggt gctgcgatac ccacgggctg gggtttggtg ggctcatttg aagacagcag 60
gaaccatctc ccctaggctg gcgaccctct gtggctgcca 100
<210> 377
<211> 100
<212> DNA
<213> 智人
<400> 377
ggtgggggcg aggggcgtct cccgcagctg aacttggagt acccagcctc ccgtcgcgcc 60
tcccccaccc catccgcatc caggtacagg gccgaattag 100
<210> 378
<211> 100
<212> DNA
<213> 智人
<400> 378
gttttgctct ccgcagacct caatcccctt cctgtcactg aaggtggcct gagatgaatg 60
atccacttaa gatgttttgg aagggcagag actctcattt 100
<210> 379
<211> 100
<212> DNA
<213> 智人
<400> 379
ggattaattc tggaggccac ctgtggttgt gggccagcag gtcaggaaga aagcaacagg 60
gacctagatt tgggcattgg acagggggaa tgtctccaga 100
<210> 380
<211> 100
<212> DNA
<213> 智人
<400> 380
ctctccagtt cctatattct aatacccctc cgccgccaaa taaaatttgg cgtctggcca 60
cagctctttt agtgggtatc tgggtggctc ttaaaagagc 100
<210> 381
<211> 100
<212> DNA
<213> 智人
<400> 381
ctttggggtt aggtgttaag acgcttactt ggaatgttta cttggagctg gtgtacttgg 60
tgacggcctt ggtgccctcc gacacggcgt gcttggccag 100
<210> 382
<211> 100
<212> DNA
<213> 智人
<400> 382
ctccggcccc tgccgagaag actcccgtga agaagaaggc ccgcaagtct gcaggtgcgg 60
ccaagcgcaa agcgtctggg cccccggtgt ccgagctcat 100
<210> 383
<211> 100
<212> DNA
<213> 智人
<400> 383
tactaaagct gttgccgcct ccaaggagcg cagcggcgta tctttggccg ctctcaagaa 60
agcgctggca gccgctggct atgacgtgga gaagaacaac 100
<210> 384
<211> 100
<212> DNA
<213> 智人
<400> 384
agccgcatca agctgggtct caagagcctg gtgagcaagg gcaccctggt gcagaccaag 60
ggcaccggcg cgtcgggttc cttcaaactc aacaagaagg 100
<210> 385
<211> 100
<212> DNA
<213> 智人
<400> 385
cggcctctgg ggaagccaag cctaaggcta aaaaggcagg cgcggccaag gccaagaagc 60
cagcaggagc ggcgaagaag cccaagaagg cgacgggggc 100
<210> 386
<211> 100
<212> DNA
<213> 智人
<400> 386
ggccaccccc aagaagagcg ccaagaagac cccaaagaag gcgaagaagc cggctgcagc 60
tgctggagcc aaaaaagcga aaagcccgaa aaaggcgaaa 100
<210> 387
<211> 100
<212> DNA
<213> 智人
<400> 387
gcagccaagc caaaaaaggc gcccaagagc ccagcgaagg ccaaagcagt taaacccaag 60
gcggctaaac caaagaccgc caagcccaag gcagccaagc 100
<210> 388
<211> 100
<212> DNA
<213> 智人
<400> 388
caaagaaggc ggcagccaag aaaaagtaga aagttccttt ggccaactgc ttagaagccc 60
aacacaaccc aaaggctctt ttcagagcca cccaccgctc 100
<210> 389
<211> 100
<212> DNA
<213> 智人
<400> 389
tcagtaaaag agctgttgca ctattagggg gcgtggctcg ggaaaacgct gctaagcagg 60
ggcgggtctc ccgggaacaa agtcggggag aggagtggga 100
<210> 390
<211> 100
<212> DNA
<213> 智人
<400> 390
ctccttagcc agactcgatt acaagcactg catgcattac tcagtgtgat aagatcatga 60
taatcccttt aaaaagatcg cccgaattta agcctggatt 100
<210> 391
<211> 100
<212> DNA
<213> 智人
<400> 391
aggaacacgt gtttacagct ctaatatcga taatttaagt ggctcttaaa agagcctttg 60
gggttgggct ttaagacgct tacttggcaa gtttacttag 100
<210> 392
<211> 100
<212> DNA
<213> 智人
<400> 392
cgctggtgta cttggtgacg gccttggtgc cctcggacac ggcgtgcttg gccaactccc 60
cgggcagcag caggcgcacg gccgtctgga tctccctgga 100
<210> 393
<211> 100
<212> DNA
<213> 智人
<400> 393
ccccggctcc ggctcctgcg gcagctcctc tgggcaccgt ccctgcgccg acatcctgga 60
ggttgggatg ctcttgtcca aaatcaactc gcttgcccac 100
<210> 394
<211> 100
<212> DNA
<213> 智人
<400> 394
ctgcgcgccg cgccctgcaa cgacctgcac gccaccaagc tggcgcccgg tgagagcacc 60
ccccgcctcc ggcccgggga tgcggggcgg cggcgggatc 100
<210> 395
<211> 100
<212> DNA
<213> 智人
<400> 395
tcctgggtgg ggagctggcg gctcgcgggc cggcactgag tccccgtgct tccccctttc 60
ctaggcaagg agaaggagcc cctggagtcg cagtaccagg 100
<210> 396
<211> 100
<212> DNA
<213> 智人
<400> 396
tgggcccgct actgggcagc ggcggcttcg gctcggtcta ctcaggcatc cgcgtctccg 60
acaacttgcc ggtgagtggg cgccccgcgg tggggagggc 100
<210> 397
<211> 100
<212> DNA
<213> 智人
<400> 397
gcgccgggcg gggggcgcac gggcgtgctt tagcccggac gagggaacct gacggagacc 60
ctgggcttcc aggtggccat caaacacgtg gagaaggacc 100
<210> 398
<211> 100
<212> DNA
<213> 智人
<400> 398
ggatttccga ctggggagag ctggtgagtg ccctgcagga gcgaccccca ggatgagtgg 60
gtggggtgag gggcgccccc gactcccgcc ctaacgcggc 100
<210> 399
<211> 100
<212> DNA
<213> 智人
<400> 399
cccctcgccc ctgcagccta atggcactcg agtgcccatg gaagtggtcc tgctgaagaa 60
ggtgagctcg ggtttctccg gcgtcattag gctcctggac 100
<210> 400
<211> 100
<212> DNA
<213> 智人
<400> 400
tggttcgaga ggcccgacag tttcgtcctg atcctggaga ggcccgagcc ggtgcaagat 60
ctcttcgact tcatcacgga aaggggagcc ctgcaagagg 100
<210> 401
<211> 100
<212> DNA
<213> 智人
<400> 401
agctggcccg cagcttcttc tggcaggtgc tggaggccgt gcggcactgc cacaactgcg 60
gggtgctcca ccgcgacatc aaggacgaaa acatccttat 100
<210> 402
<211> 100
<212> DNA
<213> 智人
<400> 402
cgacctcaat cgcggcgagc tcaagctcat cgacttcggg tcgggggcgc tgctcaagga 60
caccgtctac acggacttcg atggtgagcc aggcccggga 100
<210> 403
<211> 100
<212> DNA
<213> 智人
<400> 403
gggagctgcc caggtgactc ggcccggccc ggcccagtcc ggaggcctcg gccagtctcc 60
cgcgccagcc ttttgtaaag gtcattgggc cgcctggctc 100
<210> 404
<211> 100
<212> DNA
<213> 智人
<400> 404
gatgctagcc ggggtgggac gcaggagagc ctcccagcgt agtaaagccg gggattttca 60
gccagctgaa cctgtaatgt ttctggcatg attttattct 100
<210> 405
<211> 100
<212> DNA
<213> 智人
<400> 405
tcaagtggaa ttcagttagt tccaggcttt cccgatgaat aagaggttgt gggcaaccgg 60
cggtagccca gatttttcta aagtctgacc cagtttcccc 100
<210> 406
<211> 100
<212> DNA
<213> 智人
<400> 406
ctctaaacag acaaaagcaa aatatctcat taggcatcat ctccgccaag gttcccacta 60
ggcaggaaag gatttttatc taaagtaatt acccttttta 100
<210> 407
<211> 100
<212> DNA
<213> 智人
<400> 407
gttaaataca ctcaacagat gaaatttaca gagagtgaga gactgcagca ctagacagcg 60
aaggtgaaaa ccaggaacgc cgcgtctcgc cgcccgcggg 100
<210> 408
<211> 100
<212> DNA
<213> 智人
<400> 408
cccgccggga gactgcgggt ccgtctcgcg ggtggggcgc cccggtccct ctcgtttcct 60
ggaggccaca ggtcacggcg acggcggtga ccgggagagc 100
<210> 409
<211> 100
<212> DNA
<213> 智人
<400> 409
cgggtctgac agctgctgcg gctcgcgcgg acgcgcgcct cctgcagccc gccctcccca 60
tgcctgactt attactctct gctcctcctc cctctgctgt 100
<210> 410
<211> 100
<212> DNA
<213> 智人
<400> 410
tccaaaacac ccttcgacgc cagcaaaata caatgcgcct cggccgccgt aaacagccgg 60
gagggagagc acacattcgg cgcggcgcgg ccgccggctc 100
<210> 411
<211> 100
<212> DNA
<213> 智人
<400> 411
ggctcccacc cccttcccgt tcctagaaaa tgccataaaa gcgggcaggg cgcggggagg 60
gcggctgcgc gcccggcggc cggggctccc ttcccgcgcc 100
<210> 412
<211> 100
<212> DNA
<213> 智人
<400> 412
tatgaaacag ccagtgctac gtctccttta taccaaaact ggtagcctga agagctctca 60
ggcttaccta taaacgatgt tcagtgaatg caggtagccc 100
<210> 413
<211> 100
<212> DNA
<213> 智人
<400> 413
aaggcactgg ctatttcagc agcatagaaa cgagcccgtg gttccaggaa gcagcgttcc 60
ctctggagat ggtagaacaa ctgcaggaga cagaacaaag 100
<210> 414
<211> 100
<212> DNA
<213> 智人
<400> 414
tcattctggg ttgcaaatga atttaattag ttttgacata cacagcaaaa gaacaactgc 60
aggaagtggc cccaagtaat ctattaacta taaacctgac 100
<210> 415
<211> 100
<212> DNA
<213> 智人
<400> 415
aggttgaagg aaatgctaat tctggtaaca ttctccccac caaaaatctt tgaaaacttt 60
tttctcaaac taaaacaaag caggctgtgc agagacacta 100
<210> 416
<211> 100
<212> DNA
<213> 智人
<400> 416
agagttgact tctatccccc ctgctcacct ctccaccatt aatgtagtct aggacaaagt 60
acaatttgtc agcagtctgg aaagagaagt gaaggcccac 100
<210> 417
<211> 100
<212> DNA
<213> 智人
<400> 417
caggaaaggg tgcttcacat tcttcaacag aacattccgc tccgacataa tatgcttctc 60
ctaggaaaat gacgattcag atttagtggc atgtttcaac 100
<210> 418
<211> 100
<212> DNA
<213> 智人
<400> 418
gaggacatga aggaagtgta ccaaaagatc ttcagatttg aaattacctt tccaaaactg 60
ccctttccga tcactttcaa gaagtgaaag tcagatggtt 100
<210> 419
<211> 100
<212> DNA
<213> 智人
<400> 419
tagcatgagg attggacgac gggccaaggt tgatttgctg agaaggactt ggctagaaaa 60
aaaaaaaaag aatttctttt aataccattg cttcaaagga 100
<210> 420
<211> 100
<212> DNA
<213> 智人
<400> 420
aatttctttt aataccattg cttcaaagga agacatctat aacataaacg atgtagaaaa 60
tgttacatct acaaatgact gatgcaaatg accatacatc 100
<210> 421
<211> 100
<212> DNA
<213> 智人
<400> 421
aataaaataa tactctgact caatacttaa atatttatat cacttgttat gccataatga 60
agcattcctg ccttgatact aatttctaga aatgctattt 100
<210> 422
<211> 100
<212> DNA
<213> 智人
<400> 422
taatccatta atgtaggaat actaactgac tcccttacag ttctccacag atgcacggca 60
catacaaaaa cttactggag gagaagggtt ggcattcata 100
<210> 423
<211> 100
<212> DNA
<213> 智人
<400> 423
agctcaggct cctgaggttg ggagatcttc aagatggact gaacttcagg gctgcaggga 60
ataaagggca cgatttagaa tccagctcgc cactaggggg 100
<210> 424
<211> 100
<212> DNA
<213> 智人
<400> 424
cacaccaaca tcaaaagtga gtttctggct ctaccgactt ctacccggat aattcactgt 60
ttaaactgaa aataccccaa tacattagtc agttaaagaa 100
<210> 425
<211> 100
<212> DNA
<213> 智人
<400> 425
aataataaac cccattaaat acagaaataa ggattgttgc tcatggagaa aggccgtgaa 60
ttcggccaac acgaaccatt tatcttacat ctccagttca 100
<210> 426
<211> 100
<212> DNA
<213> 智人
<400> 426
agccaaatca gcaaattaac tttaatgttt aaaatgtgtc aaatatatta gaatttaagg 60
agaaatgaga tccccacccc agaagaagtc ttcgccttcc 100
<210> 427
<211> 100
<212> DNA
<213> 智人
<400> 427
cgataaacgc cgtgatgaga atgtttaccg ctggcaaatt caaactatac tagttatttc 60
ctcaaatccg gtcaaactta ctgtttgcat gcataggagt 100
<210> 428
<211> 100
<212> DNA
<213> 智人
<400> 428
tattggcaat cttctgaata aagtcgttca gacccatcct cctctgcttc atgaaagctg 60
tggatgaagg aggagaaata aagaaacgtt tagacggctt 100
<210> 429
<211> 100
<212> DNA
<213> 智人
<400> 429
cataacgtcc ggcgccacac acactaatct gatccgggac tttcaaaaaa tttccacttt 60
gcgtctcctg gagcagaagt cccgcaagat tcctgcactc 100
<210> 430
<211> 100
<212> DNA
<213> 智人
<400> 430
accgatgaga attgccacca tgcccctcat cctggagtaa gtgagggtgc ccttagcagc 60
ctcagttttc accgtcatca ccaccgcggg gagacagaaa 100
<210> 431
<211> 100
<212> DNA
<213> 智人
<400> 431
gacgttagcg ctcaaagacc ggctcggcgt atgctgcgcc aggccgcgcg ctcggcctta 60
taaaaaaggc accgccgcgg gggcggggcc tgcgcgacag 100
<210> 432
<211> 100
<212> DNA
<213> 智人
<400> 432
agggtgagag gagtcaccag gtaaagatgg gttggaagga cctggcaggc agagcaggga 60
gcaggacccc agtccagggc agcagggaag cgggagtctg 100
<210> 433
<211> 100
<212> DNA
<213> 智人
<400> 433
ggcagagctg attccaggca gctcagtatt gctggcctgt gcatcctgag acttatccga 60
gtcgcaggtg aagctggtgg gaatcaggca gagtgcagag 100
<210> 434
<211> 100
<212> DNA
<213> 智人
<400> 434
ctttagctgg ggcagggtta gccaagagcc tgtcatggag ctgctctctg ggcactggga 60
aacataagtc tggaggcttt ggctgcagct gcagataaag 100
<210> 435
<211> 100
<212> DNA
<213> 智人
<400> 435
atgcaggggc ctctgacgat gggggcctta gtcatctcag aggtggtgca gagggtagaa 60
gcctgactgg ggtcagagat gaggaaggag agggtcagaa 100
<210> 436
<211> 100
<212> DNA
<213> 智人
<400> 436
acagtgattc taaaccaatt tggttgaggc agaagatact aatggccgag gggaggagag 60
agggagcgta ggctctaaag gggaagcttg ttaggaatga 100
<210> 437
<211> 100
<212> DNA
<213> 智人
<400> 437
agacagaggc gcaggcacag ccctttcatc agctgaccag gagtgctcgg cccggcctgc 60
caggaacctc ttatcaaact ccaccggctg cctgcatcta 100
<210> 438
<211> 100
<212> DNA
<213> 智人
<400> 438
caattcaagt ccatggctaa ccttctgtta gagacagaaa ttctgctgca gccagcaagt 60
ttgctggtgt acagggcacc gcttcatggg cctagtagga 100
<210> 439
<211> 100
<212> DNA
<213> 智人
<400> 439
agcgaagctg aaaggcaact tccgaaagcc agtctcctct cccaaacgcc ctttaatatc 60
tccccagttg gatctggggc gcctgtggtt tcggaccctt 100
<210> 440
<211> 100
<212> DNA
<213> 智人
<400> 440
aggagctctg agaactggtg tgtgtggtcg gaagccatct gagtctccct gtgatttgga 60
ctttttaaga aacttctaag ttgtattact atacccttta 100
<210> 441
<211> 100
<212> DNA
<213> 智人
<400> 441
ttcccttgtc atatgacttc catcctcagc actacaatat tatcattaat gtttaaatca 60
ttgtcaagtc tgtgattgcc ttagagattt attaagaata 100
<210> 442
<211> 100
<212> DNA
<213> 智人
<400> 442
acatgctagg attaggaaag tttaactttt taccatcctt aaaattagat ttttgaaaac 60
tgtcttatcc ccattaaaga aaaaaataaa aaggatgaat 100
<210> 443
<211> 100
<212> DNA
<213> 智人
<400> 443
tatacatacc tgcacatata tacagcatat gtatatgtgt ctgtattata tgtattaaat 60
gaaagattat ccacattttg ttctttagga tcttcagcag 100
<210> 444
<211> 100
<212> DNA
<213> 智人
<400> 444
ctctcttccc atcacaatag aaaggcctga gctaacattt ccatttctgc aaaaggcaga 60
ttttgttcaa ttaaaaatta taatgcctta aatttccaca 100
<210> 445
<211> 100
<212> DNA
<213> 智人
<400> 445
gacatttaag agacttcgtt ttcactgtga taaacaggtt tgatttggac ttataacttt 60
tttctaaaat tatcaaatta ataacgacta taatgaaata 100
<210> 446
<211> 100
<212> DNA
<213> 智人
<400> 446
gaggcaaata ttttagagga ttcattcctt ggggtaacat ttgttctata atttatagtc 60
tcataatgtt gagagattaa agcatttaaa taacattgtc 100
<210> 447
<211> 100
<212> DNA
<213> 智人
<400> 447
aactaacttt cagcttacct ttcttaagga aaaaaaacaa aaaaatgtta aaaatagaca 60
tgtatttttc aaacatacaa ttcatgtttt tatgtcatta 100
<210> 448
<211> 100
<212> DNA
<213> 智人
<400> 448
aagagatgtg agggacttat aaataatatt aagataacag gaattaaagt ctcggtgtgt 60
gaaaatactg tatatctagg atgcacataa aaactgccct 100
<210> 449
<211> 100
<212> DNA
<213> 智人
<400> 449
tacagatctt gcagggaaaa gtacctgact atactgtata agacttctgc tgtaccattt 60
aatcatacca aaaaaaatgg aatcaacaca caaatagatt 100
<210> 450
<211> 100
<212> DNA
<213> 智人
<400> 450
tcttttccac tgttctcaat ttaaaaataa ttggagaaat gtgtgctttg tttagaagag 60
taaaggaaaa cattcattca atagtaccat gcagaatgat 100
<210> 451
<211> 100
<212> DNA
<213> 智人
<400> 451
cagaaaaata gaaagattat catcggattt gggaatcaaa gacagctcag caaaatacta 60
ggacatggct catataagat ggaataagcc tggaaataca 100
<210> 452
<211> 100
<212> DNA
<213> 智人
<400> 452
ctttagggga tagctctgca aggggagagg ttcgggactg tggcgcgcac tgcgcgctgc 60
gccaggtttc cgcaccaaga cccctttaac tcaagactgc 100
<210> 453
<211> 100
<212> DNA
<213> 智人
<400> 453
ctcccgcttt gtgtgccccg ctccagcagc ctcccgcgac gatgcccctc aacgttagct 60
tcaccaacag gaactatgac ctcgactacg actcggtgca 100
<210> 454
<211> 100
<212> DNA
<213> 智人
<400> 454
gccgtatttc tactgcgacg aggaggagaa cttctaccag cagcagcagc agagcgagct 60
gcagcccccg gcgcccagcg aggatatctg gaagaaattc 100
<210> 455
<211> 100
<212> DNA
<213> 智人
<400> 455
gagctgctgc ccaccccgcc cctgtcccct agccgccgct ccgggctctg ctcgccctcc 60
tacgttgcgg tcacaccctt ctcccttcgg ggagacaacg 100
<210> 456
<211> 100
<212> DNA
<213> 智人
<400> 456
acggcggtgg cgggagcttc tccacggccg accagctgga gatggtgacc gagctgctgg 60
gaggagacat ggtgaaccag agtttcatct gcgacccgga 100
<210> 457
<211> 100
<212> DNA
<213> 智人
<400> 457
cgacgagacc ttcatcaaaa acatcatcat ccaggactgt atgtggagcg gcttctcggc 60
cgccgccaag ctcgtctcag agaagctggc ctcctaccag 100
<210> 458
<211> 100
<212> DNA
<213> 智人
<400> 458
gctgcgcgca aagacagcgg cagcccgaac cccgcccgcg gccacagcgt ctgctccacc 60
tccagcttgt acctgcagga tctgagcgcc gccgcctcag 100
<210> 459
<211> 100
<212> DNA
<213> 智人
<400> 459
agtgcatcga cccctcggtg gtcttcccct accctctcaa cgacagcagc tcgcccaagt 60
cctgcgcctc gcaagactcc agcgccttct ctccgtcctc 100
<210> 460
<211> 100
<212> DNA
<213> 智人
<400> 460
ggattctctg ctctcctcga cggagtcctc cccgcagggc agccccgagc ccctggtgct 60
ccatgaggag acaccgccca ccaccagcag cgactctggt 100
<210> 461
<211> 100
<212> DNA
<213> 智人
<400> 461
gctccccatc tgtccccaca gttgctcctt ggctgagcca agggcttgct cacctctcag 60
agcattgccc taactggttt gttttgggct tacattgcaa 100
<210> 462
<211> 100
<212> DNA
<213> 智人
<400> 462
gatcaggtcc tccccagagc caggctggag tccgaggcag aaaaggctgt ggagggcact 60
ggggtcacca cagactggaa accggttggg cgcaggcccc 100
<210> 463
<211> 100
<212> DNA
<213> 智人
<400> 463
aaaccttgag gaatcgtttg ggctgggacc agaacagggg gctcctctgc acagagctcc 60
ccaccgcttt ggtggattac ttcagactca gaaaattgac 100
<210> 464
<211> 100
<212> DNA
<213> 智人
<400> 464
acaaagagaa actgacctgc ccgcagccag ccctggctgc ctacacaagc tttcccctgc 60
ttgccaggcc actcagcact gcgtggcaga cacggacatg 100
<210> 465
<211> 100
<212> DNA
<213> 智人
<400> 465
ctcgccccgg gaagctcacc ttcactccag ccgggtctct gctgcctttg ttaaataggg 60
gacctgcggc taggaaagct ggatcccagg ctgttgggat 100
<210> 466
<211> 100
<212> DNA
<213> 智人
<400> 466
gggggggagc ggggtgggag gaccaggcat ggggacggct cctagcccgg gagcaactcc 60
ctgacctgaa gcccgcagag accccgagcg gcacccgagc 100
<210> 467
<211> 100
<212> DNA
<213> 智人
<400> 467
cgaggctgcc gaagcctgtc accttcctcc agcctggctc tgcagcaaac agaaaggaaa 60
cgcgattcgt tccacttgga atttccttga aatctccgaa 100
<210> 468
<211> 100
<212> DNA
<213> 智人
<400> 468
tctaatccgg cgttaactca ccgtgagagg agcgctcatc tcacaggagg ctgtggtaat 60
gggtgaattg gcaggatccc tgcgggccag gcagccaggc 100
<210> 469
<211> 100
<212> DNA
<213> 智人
<400> 469
ttttcgtttc ttatcctctt tttttaaagg ggagaagcca tgagaaaagg cgtcctgcag 60
agaaggaccc aatggggtct ttaagggtct ctgtatgaac 100
<210> 470
<211> 100
<212> DNA
<213> 智人
<400> 470
tggccggctc ctaagcagaa gctgaactca gaaaccgcta cttccttgat ttttcaaagc 60
cccctcctca actccaggac gcctttggag ccctagcccc 100
<210> 471
<211> 100
<212> DNA
<213> 智人
<400> 471
tgtcgccgcc ggagccttga aaggctgcag ctcgctgccc aagctacgcg ttgccggagg 60
cgggattccc aggtgcctca gcccgggcgg ccaagtgcgt 100
<210> 472
<211> 100
<212> DNA
<213> 智人
<400> 472
tgtttcaggt cccctgcctg ggatccctgc actttgcaaa gttagctgcg cggctgcaga 60
ggtccgagat ccttccggcc ttagtacctg acccacggtc 100
<210> 473
<211> 100
<212> DNA
<213> 智人
<400> 473
cggcaccccc aacccggtcc cggcgggaga gtgagagaag cgagctcgcc gcctacttac 60
tatgcatgga tgcaaacggg tcgtgcttac agtgtatttc 100
<210> 474
<211> 100
<212> DNA
<213> 智人
<400> 474
catcggggcg ctccagactg caggccggcc cacgccgccg cctcccggcg ccaaggggct 60
gcccagggcg gatagggagc ctcgccacca ggccaggcac 100
<210> 475
<211> 100
<212> DNA
<213> 智人
<400> 475
tgtgcgagct gggctcagaa aacactgctg gagcttcggg gtctctctca gagcctccct 60
gctggagacc gcccggagct gcgcggagag gcgggaaatg 100
<210> 476
<211> 100
<212> DNA
<213> 智人
<400> 476
gtgctagcgc acccgggcta ggagcgggtg cccaactccg gctggcttcc ctccctggct 60
ggctcaagca gcagctccgg gcccagcccg gggtagctgc 100
<210> 477
<211> 100
<212> DNA
<213> 智人
<400> 477
ggccaaggcg cccgcggctt cgggggcata gcgtaggggc ccgcctccgg gacagccagc 60
agcccccggc cccaggaagg agcagctttg aggaggccgc 100
<210> 478
<211> 100
<212> DNA
<213> 智人
<400> 478
cggaacaatc ggcccttgac ttcactcagg gggcggagag acccgggggc tgccaggctg 60
gttccgcggc ctcgatgctt ctgaggtccc tcctcgaccc 100
<210> 479
<211> 100
<212> DNA
<213> 智人
<400> 479
cacacaggca aacaactttt ggacacaaac tcatatattt ttacatcttt taaaaataca 60
tatactgtaa tgaacacact gagtccctta tataaacaca 100
<210> 480
<211> 100
<212> DNA
<213> 智人
<400> 480
caggccctaa cttgcagacc cccggaagga cgccagcgtg aacattcaga aacagagaaa 60
aacacagaca aactcacaga tatttggact gatgcagaag 100
<210> 481
<211> 100
<212> DNA
<213> 智人
<400> 481
acagtttgaa gtgtgagcct gaacatgttt gatctaaggt ctggaggaag atgtgaagca 60
aatctgacct aaaaaaaatt ataggaaaaa agcaaattgt 100
<210> 482
<211> 100
<212> DNA
<213> 智人
<400> 482
tctggatttg tttcaccaag gaacaagtaa gcagagaacc agacactgga gaaaaaaagg 60
agtcaggaag tagacaagga aatgttaaaa gaaataatag 100
<210> 483
<211> 100
<212> DNA
<213> 智人
<400> 483
gataactgaa agaatgtagc ttccagattg ctagctatca gcagatagat agaaactttt 60
atacagcctt taaatcttcc ctagaaacct ttttaaaagt 100
<210> 484
<211> 100
<212> DNA
<213> 智人
<400> 484
caagggcctg ccaggatgag aacgggcaaa cctggccaag gtgaccccat tagggactac 60
cctcctaggg acagcactca gggccgttcc caatcacccc 100
<210> 485
<211> 100
<212> DNA
<213> 智人
<400> 485
ggatttcctg tcctgctcgt ctcctgccac acctcctttt gatctacccc caagacaccc 60
ctaccttttt attctgtgaa aatttactca tgctgtgggc 100
<210> 486
<211> 100
<212> DNA
<213> 智人
<400> 486
cctgctggaa atgccctcct actgtttccc caaaccccgt cagaaattcc acggggaaac 60
tcccttccct tctgctgcag gcaccgtcac tgtgtctctc 100
<210> 487
<211> 100
<212> DNA
<213> 智人
<400> 487
agctctgccc cccagcctct gagtaccacc ttatcctagc ccttagctac tggcttgtca 60
ttgtctcttt acgttctcag cctcccacag aagcctggga 100
<210> 488
<211> 100
<212> DNA
<213> 智人
<400> 488
aggcacactc gcccctggtc tccaaggctc tgggtcctca gactggctga gtactgggga 60
ccaaggtcac ccaagaagcc ctgagtggcc ctcttgaggg 100
<210> 489
<211> 100
<212> DNA
<213> 智人
<400> 489
ttagcagagc ttctctctgt ccaagacagg tcaggctctc tcccctggcc ccagctccac 60
cgtcactcag aggagtggcc taaacaaacg ctgcaggtga 100
<210> 490
<211> 100
<212> DNA
<213> 智人
<400> 490
ggctcccgag cccctgacat ggatgtttat ggaagaggac tcttggcatc agcacctggg 60
caaggtgggt agaggcagga gtgggcaaat gggaaagtct 100
<210> 491
<211> 100
<212> DNA
<213> 智人
<400> 491
ggagagccgt ttgagattca ccaggtgaat gaaccccggt ttttttctgg gtaacaggtc 60
gaatgtgaat tacttatttt cacaagctct tgacatgttc 100
<210> 492
<211> 100
<212> DNA
<213> 智人
<400> 492
cgtcaaattg ctgttcccca aagagtggac tctggtgaca tataagtgtg tgggaccatt 60
gcatcttacc ccagagatcc actcctgatc tggcattatt 100
<210> 493
<211> 100
<212> DNA
<213> 智人
<400> 493
caaaatctgc tgaattcaaa acgatcctgt acttcctgct caccaggtct gaaaagaaaa 60
aagaaaaaag aagaaggaaa gactacacct gacaaaagac 100
<210> 494
<211> 100
<212> DNA
<213> 智人
<400> 494
ttcacggttt ctctttagtt ttatctgaaa tacatttgta agcttagggt gcaatttgga 60
ttaaaacagt tttctttagt gtcaataatg gcctttacta 100
<210> 495
<211> 100
<212> DNA
<213> 智人
<400> 495
gagtgaatgg atatttttcc attctggatt atcgtttaat cgaaactttg tttcctgtgg 60
aaatttttct ggtttaagtt atttgatttg ggagataaat 100
<210> 496
<211> 100
<212> DNA
<213> 智人
<400> 496
catgtaactt aataaacttt ggcatcctgg ttaactgaaa ttgcttcatt caatatttga 60
agactgaaat ctgtattgtt gcctgtacct aaattatggg 100
<210> 497
<211> 100
<212> DNA
<213> 智人
<400> 497
ggacagacag ggagagatga ctgagttaga tgagacgagg gggcgggctg ggggtgcgag 60
aaggaagctt ggcaaggaga ctaggtctag ggggaccaca 100
<210> 498
<211> 100
<212> DNA
<213> 智人
<400> 498
gtggggcagg ctgcatggaa aatatccgca gggtccccca ggcagaacag ccacgctcca 60
ggccaggctg tccctactgc ctggtggagg gggaacttga 100
<210> 499
<211> 100
<212> DNA
<213> 智人
<400> 499
cctctgggag ggcgccgctc ttgcatagct gagcgagccc gggtgcgctg gtctgtgtgg 60
aaggaggaag gcagggagag gtagaagggg tggaggagtc 100
<210> 500
<211> 100
<212> DNA
<213> 智人
<400> 500
ggggcaggcg gagcttgagg aaaccgcaga taagtttttt tctctttgaa agatagagat 60
taatacaact acttaaaaaa tatagtcaat aggttactaa 100
<210> 501
<211> 100
<212> DNA
<213> 智人
<400> 501
gatattgctt agcgttaagt ttttaacgta attttaatag cttaagattt taagagaaaa 60
tatgaagact tagaagagta gcatgaggaa ggaaaagata 100
<210> 502
<211> 100
<212> DNA
<213> 智人
<400> 502
aaaggtttct aaaacatgac ggaggttgag atgaagcttc ttcatggagt aaaaaatgta 60
tttaaaagaa aattgagaga aaggactaca gagccccgaa 100
<210> 503
<211> 100
<212> DNA
<213> 智人
<400> 503
ttaataccaa tagaagggca atgcttttag attaaaatga aggtgactta aacagcttaa 60
agtttagttt aaaagttgta ggtgattaaa ataatttgaa 100
<210> 504
<211> 100
<212> DNA
<213> 智人
<400> 504
ttggagaagt atagaagata gaaaaatata aagccaaaaa ttggataaaa tagcactgaa 60
aaaatgagga aattattggt aaccaattta ttttaaaagc 100
<210> 505
<211> 100
<212> DNA
<213> 智人
<400> 505
ccatcaattt aatttctggt ggtgcagaag ttagaaggta aagcttgaga agatgagggt 60
gtttacgtag accagaacca atttagaaga atacttgaag 100
<210> 506
<211> 100
<212> DNA
<213> 智人
<400> 506
ctagaagggg aagttggtta aaaatcacat caaaaagcta ctaaaaggac tggtgtaatt 60
taaaaaaaac taaggcagaa ggcttttgga agagttagaa 100
<210> 507
<211> 100
<212> DNA
<213> 智人
<400> 507
tggtgtaaga gatgtgccag cggctggccg aggggcgctt agggctagag cccggggcgc 60
tgcagaggtt gagagtcagt gggtggggcg cagttatcaa 100
<210> 508
<211> 100
<212> DNA
<213> 智人
<400> 508
acaccagggc ccaaaagcag gctctagata ggttccaggt gctcaatttc tatttcacgt 60
ttggagtgag ccagtggaat tgtgaagttg tggcattttg 100
<210> 509
<211> 100
<212> DNA
<213> 智人
<400> 509
attcggttgc caagagttat cactgggcct ttgcaggtgc caaataaatt tcaggacaga 60
gcctaaggca gagctctggc acaggaagga agtaaaacgt 100
<210> 510
<211> 100
<212> DNA
<213> 智人
<400> 510
ttaatgagca aatggacgca tgtttccaag cggtggtagg aagacagcag tttttggttg 60
tcttcctggt gatcagcatg gaaacctagt agtgctctta 100
<210> 511
<211> 100
<212> DNA
<213> 智人
<400> 511
ctctgatcaa tacattgtcg aaggcatgta cctgatgcta acgtaacaat aatattaaat 60
attgacttta tttgctatta tttattgcta acattaagta 100
<210> 512
<211> 100
<212> DNA
<213> 智人
<400> 512
ctgctacctg ctatgtgcta ggtttgtctc tgaagacttt acatgtattt ttcacgttta 60
attatcataa tcttaagaag caggtaccat aattatctcc 100
<210> 513
<211> 100
<212> DNA
<213> 智人
<400> 513
gggaaaaaga atgacgaaag gcaagacagt ggagcaagtg aggacacgct tcaccgagcc 60
agatctccac tcctcccagg gtatccacag ggacaagtca 100
<210> 514
<211> 100
<212> DNA
<213> 智人
<400> 514
cacctggcag aaagctaagt cactcagcta gaaacaggcc cagggaattc aacagaaggc 60
tgaagagcca ctgcttatgg aaataaagcc cctcctgtaa 100
<210> 515
<211> 100
<212> DNA
<213> 智人
<400> 515
agaactgcat ggcttttccc tcccaacccc aaacccatcc cacatctggc ttttgttgtg 60
tgaatcataa actgcccttt cttcaccaca gtgattcatg 100
<210> 516
<211> 100
<212> DNA
<213> 智人
<400> 516
aatcctctcc cactgtggat ctgtaaaatc tagacaggtc agtcagctcc cgccctttaa 60
gagtttattt tccattctgt ggaagaagca gataaggaga 100
<210> 517
<211> 100
<212> DNA
<213> 智人
<400> 517
gctgctgtcc ttaggagaca tcctttagag gaagctggaa gacacgggtt caggccctgc 60
atcctcctct gagttgctat gtgactggga acaggatact 100
<210> 518
<211> 100
<212> DNA
<213> 智人
<400> 518
tcacctctcc attctttctc tccttttctc ttagggtcgg aatatggaac tagacaggaa 60
agtactttgg aggttttctt accgtaagga ggctggcatt 100
<210> 519
<211> 100
<212> DNA
<213> 智人
<400> 519
gggccctcca cccagcctca gttctatggg ggacgtggag tcaggcgatg atgtcctctg 60
aggcagcgtc catctcccct taacattaag gaataaggcc 100
<210> 520
<211> 100
<212> DNA
<213> 智人
<400> 520
agagggttct cgctcatttg ggaaaataaa aaaagcagga atggggcgct ggaaattcta 60
taagcttttc cccaccactc acaaaaacac agctgtgaaa 100
<210> 521
<211> 100
<212> DNA
<213> 智人
<400> 521
ataaatacca ccccccaaac caagggtcta gggccaccaa cagtcctcct cctcctcctc 60
ctcctccttc tcctcctcgt cctccagatc cagctgccaa 100
<210> 522
<211> 100
<212> DNA
<213> 智人
<400> 522
ccttctcctc ctcgtcctcc agatccagct gccaacagca tcccccgctc ctgaagaaat 60
gcaccgccca gaagggaacg gcgaaagggg gaagaagtcc 100
<210> 523
<211> 100
<212> DNA
<213> 智人
<400> 523
aggggacccc cggcctctgg ccgagagctt gggtgggggc ctcggccgtc gccactcacc 60
cggggagggg aaaagctcca gatcgacttt ttccgtcttg 100
<210> 524
<211> 100
<212> DNA
<213> 智人
<400> 524
atgatggtga gagtcggctt gagatcgacg gccgccttca tggtgccagg agtgggggac 60
gtacgggatg gtagcaagtt tgcagttact gttgtttttc 100
<210> 525
<211> 100
<212> DNA
<213> 智人
<400> 525
tttttaatga ggattagtaa cagggggaag gggacggggg aaatccgact ttcttcccaa 60
aaatctcaaa ttcccgctgc ctttctttcc cccgcgcccg 100
<210> 526
<211> 100
<212> DNA
<213> 智人
<400> 526
gacggtgcgc gcccggcact ccaggggaag ttggcacttt gcggcgaagt gagcgcgctc 60
gggtcccagc ctcgcccgcg ccgcgcccgc tcctcctgcc 100
<210> 527
<211> 100
<212> DNA
<213> 智人
<400> 527
gagtgagtag caaatattca tttatgaccc agtttttgtc caccctcagg cggggcatag 60
gactacagac atttttctag attacagcta ggatattatt 100
<210> 528
<211> 100
<212> DNA
<213> 智人
<400> 528
cctgagttta tgacaatgaa atggtttgag aaggcaatat tgtggggctt tcagagaggt 60
ttgctgagtg gctaggtgca tgcatgggtt taaccattaa 100
<210> 529
<211> 100
<212> DNA
<213> 智人
<400> 529
cttccctttt tgccttttta ttataagctg gttttgtctg tggctgtttt tttcttttaa 60
aattaattaa aacttctcaa aatttctaaa agtaaacaag 100
<210> 530
<211> 100
<212> DNA
<213> 智人
<400> 530
gcattctcta catacatcta catacatatt ttgcatttta aaaattggaa tatttgtcat 60
ttttctgtat tacccaaaag tatataaaca gttaccagag 100
<210> 531
<211> 100
<212> DNA
<213> 智人
<400> 531
atttatgtga gaagacagtt gtcacattac agatgtcaga ttagctataa aattgtttca 60
ttctagaaac ctaatatggt aaaaataaac cttacttatt 100
<210> 532
<211> 100
<212> DNA
<213> 智人
<400> 532
tagccattta tcagacaatt gcttttgttc agccagtttc ttgttctagc agtataaata 60
ttctttttat agaaagttac ttggtttgag aaataaacat 100
<210> 533
<211> 100
<212> DNA
<213> 智人
<400> 533
ataagcttaa ggtaggctag agatgaaaaa tttcagactt gtgtttgttt tggatttatt 60
gtaccctttc tactattatc tgagaaagct atttaggagt 100
<210> 534
<211> 100
<212> DNA
<213> 智人
<400> 534
ttaagaaata gtctagtttt aaaatagcaa tggtttgccg gacacagtgg ctcacccctg 60
taatcccagc attttgggag gccgaggtgg gcagattgct 100
<210> 535
<211> 100
<212> DNA
<213> 智人
<400> 535
gaatttgcca gttttcaata ttctgattca ctctgttaag ctagtaaggc agtctttaaa 60
ttacacagtc tgtgtgttat tttactactg ctcagagggc 100
<210> 536
<211> 100
<212> DNA
<213> 智人
<400> 536
attggagaag gttcccttgt gattagaact gttcatgttg agacatgaat cataaggcat 60
tccaaagttg gtttaaggtg tgtctgcttt agacactgtg 100
<210> 537
<211> 100
<212> DNA
<213> 智人
<400> 537
cccaggacta ttcttttgct ccagttttgc cttttgatta aatcaatatt atacctgagt 60
tttataaact actaagaatt tgttcccctt cctcactgtg 100
<210> 538
<211> 100
<212> DNA
<213> 智人
<400> 538
attttcttgc agtattttct tagaagagtc aactttaata acttacccca aagtgcacgt 60
tcttgatatt atgaacttgc tattgttgtc ttcccagttt 100
<210> 539
<211> 100
<212> DNA
<213> 智人
<400> 539
tattgtagtt tttggaaggg ctcgttctgc ccaagagaag ttcctcctta cagctgattc 60
ggctgtctac catttgcacg ttggtgctgt tttgagtgct 100
<210> 540
<211> 100
<212> DNA
<213> 智人
<400> 540
acctcctgct ggtgaggctt catacagcac acagatggag ccatcctctc caattctgta 60
ggacacttca taggggtcaa cccagagtgt gagttcactt 100
<210> 541
<211> 100
<212> DNA
<213> 智人
<400> 541
gggagaagcc tgaacagctc ctgactgctc agtccaatcc gctgtgctgc ctgtccaatc 60
agaggatcca ttttatggtt gatgcgaata caacggtaac 100
<210> 542
<211> 100
<212> DNA
<213> 智人
<400> 542
ccgatccctt gcatggcttt tctgggaacc agtgatgttt ataatgttct atagaagaaa 60
agaagaacag agaaacaacg cttaggatcg ttagctccca 100
<210> 543
<211> 100
<212> DNA
<213> 智人
<400> 543
ctgcggattc ctcctacccc aggctccttt gaggagcgaa aatgaaaact atcaactttt 60
taaaatgtcc aggattgcat ccgttgttgt gcatgtgcgg 100
<210> 544
<211> 100
<212> DNA
<213> 智人
<400> 544
ggatggaaaa agcgggcagg gttttagaaa taacacagta gtaccggaca aaacaatctc 60
caggaaccaa ccggttgagc cgccaaaaca ggaatcaggc 100
<210> 545
<211> 100
<212> DNA
<213> 智人
<400> 545
gcgcagcctc ggccagtcgg gaagccactg gcacctatgg ccaggcgaga aactgtttac 60
tttctccacc ccaccccaga tgcacacaat ggagttgatg 100
<210> 546
<211> 100
<212> DNA
<213> 智人
<400> 546
gctttggaga tgagaagcgc caccggactg ttaaccccga agggaagaaa aacaagcaac 60
cctaaaccac gctctgggca gggctgttaa ttgtgccggt 100
<210> 547
<211> 100
<212> DNA
<213> 智人
<400> 547
acgcaacggt tggagggggc tgaggaaagg ggacgtcgaa cccaccccag ccccacggct 60
cctttgtccc caaatccgcc gacggtcctc ggaccgcagc 100
<210> 548
<211> 100
<212> DNA
<213> 智人
<400> 548
tcccgcctcg gtgggcttaa gtttctttgt tgtgcgtgtt gtcttctcct ctccgttttg 60
ccagctgggg ggaagggggc gccctccgtc cagcccctaa 100
<210> 549
<211> 100
<212> DNA
<213> 智人
<400> 549
agcctcgcgg ggaaccgctg ttagcggcca cccagcgcaa ccacaccggt cccgcggcgg 60
ggcccaagcg cgaccggccc cggggcgctg ccgaggttcc 100
<210> 550
<211> 100
<212> DNA
<213> 智人
<400> 550
cgcagccccg acggccggac tctgacccag ggatgtgggg cccgcgtccc tccgacgccc 60
tcgccctgct cacctgccag cagctcctgc aggctctggc 100
<210> 551
<211> 100
<212> DNA
<213> 智人
<400> 551
tgaaggtctg cagctgtcgc tcgctcgtga gccccttggt gcggagaaac ttggagatga 60
aggacacggc ggcggcgatc tcgcctatca tggtggcggc 100
<210> 552
<211> 100
<212> DNA
<213> 智人
<400> 552
ccgggtgtag aagggatgca tgggggcggc gtgcgggggc ggcccggggc ggctggggct 60
cggcggcgcg gccccgacgg cggagcagcc accccgggct 100
<210> 553
<211> 100
<212> DNA
<213> 智人
<400> 553
acgccgcacc cctcccccgt gcgttctgcg gccacccagg ccttccagga caccgtggag 60
agggaacaag ggggcaggga cgcccccttc ggcaggagcc 100
<210> 554
<211> 100
<212> DNA
<213> 智人
<400> 554
gtcggagaag ggggcccaga ccggagggag gcgagaagcc ccactgaagc cgggcgcagg 60
gtctgggacg cagttgggag tgcaaagggc tggctgagag 100
<210> 555
<211> 100
<212> DNA
<213> 智人
<400> 555
ccgcaggagc agcaggctgt ggcccaggcc tcctgggtga caggccctgt ctggcgggga 60
agagggacca agagacaaca cggaagaggc tggacctcga 100
<210> 556
<211> 100
<212> DNA
<213> 智人
<400> 556
acaggggcgg ctgcctcact ccctacctga gccagccgag ggggccaagg actttagagc 60
tgtttcctcc ggcataagag agacacttgc tttccagggc 100
<210> 557
<211> 100
<212> DNA
<213> 智人
<400> 557
agcacccttt atcggagaag gctctacagg gaaggggtct ttgcagcctg gatggccatc 60
ccacattcct ttaacggagg tctctaggcc tcagagagaa 100
<210> 558
<211> 100
<212> DNA
<213> 智人
<400> 558
cccagagtta gaaaggaggc cagacggtcc ttgctgtccc cctggggaga gaggaagttg 60
ccgcctgctg ccaggcccag gaggagctgg gcctgcaata 100
<210> 559
<211> 100
<212> DNA
<213> 智人
<400> 559
gtgggggacc tggcccctga ggcagtggcg gccatgtcac ggccaggcca cggtgggctg 60
atgcctgtga atggtctggg cttcccaccg cagaacgtgg 100
<210> 560
<211> 100
<212> DNA
<213> 智人
<400> 560
cccgggtggt ggtgtgggag tggctgaatg agcacagccg ctggcggccc tacacggcca 60
ccgtgtgcca ccacattgag aacgtgctga aggaggacgc 100
<210> 561
<211> 100
<212> DNA
<213> 智人
<400> 561
tcgcggttcc gtggtcctgg ggcaggtgga cgcccagctt gtgccctaca tcatcgacct 60
gcagtccatg caccagtttc gccaggacac aggtgagcag 100
<210> 562
<211> 100
<212> DNA
<213> 智人
<400> 562
acacccaccc catgccaccc gccccgccga gccatcacta ccttgcagcg taggatgctg 60
aaaatcccag taaatctgct gatgccaaat cccttcccca 100
<210> 563
<211> 100
<212> DNA
<213> 智人
<400> 563
tctccctgcc tcacctccag aaaaacaggg cagtctaacc ttgtccagtt taagacttgg 60
attccaatgc agcctctgag caagctgtag ggccttgagc 100
<210> 564
<211> 100
<212> DNA
<213> 智人
<400> 564
gggtagatca atatctctca cagctgagtg aggattaaat aaaattgtgc tcactgagca 60
cagaacctag aacagcagta gcatgggatt gtagaataag 100
<210> 565
<211> 100
<212> DNA
<213> 智人
<400> 565
ggctttacat gcacttcctc atttgatttt tcccaagaat cacaggcagt aagtctgtgt 60
attgttgtat tattatgagt cccattttat agatgaagaa 100
<210> 566
<211> 100
<212> DNA
<213> 智人
<400> 566
tttatagatg aagaaaccga gtctcccaga agctgagtga tttaaactca gagctgggat 60
ttaaacccag gcggttgagt tccagaacca aagttcttaa 100
<210> 567
<211> 100
<212> DNA
<213> 智人
<400> 567
ctggtatcct atactggctc caagtgttgg tttgtggggt ggagtcgtgc tggtggtaat 60
taattgggga tggggggcgt tggtggtgtt gatggtgggg 100
<210> 568
<211> 100
<212> DNA
<213> 智人
<400> 568
tgaggtggca atgatggagg agacagtgtt agcggttgtg ttggtggtga ctcagtgata 60
gtattgatgg tggtggggtc ttggtgacaa tggagggatg 100
<210> 569
<211> 100
<212> DNA
<213> 智人
<400> 569
tgttggtgac attgatagtt gtgttggtgg tggtgctgga agtggtgtga tggggtggtg 60
atgatggaga aaatgagaga atgatgttgg tggcagtctt 100
<210> 570
<211> 100
<212> DNA
<213> 智人
<400> 570
cgtggccatg tggtgtggct ggtagccctg tgtgtggctg ttacttagtg gtattggtga 60
tcctgttgtg gttgtaatga tggtgatgtt gatggttgcg 100
<210> 571
<211> 100
<212> DNA
<213> 智人
<400> 571
ttggtggtaa tgtgatggct gatgatggag ataaaatcga tgaggtccca ctctcaggcc 60
tactctcttt tgttctggag atttgtcatc gttggggaga 100
<210> 572
<211> 100
<212> DNA
<213> 智人
<400> 572
tgaaatggct gctgtcgggc tgtcatctcc aggcccgggg cgctgacatt tgggccactc 60
tcggtctccc tcttcattct gggcgcgcat tagctctggt 100
<210> 573
<211> 100
<212> DNA
<213> 智人
<400> 573
ccggccggtt ccgctgcagc tgaacagcaa gatgcggcac ccaggttacc ctgatcatcg 60
cagatttctc cccggggctc tgttctgagg cctcaaaagt 100
<210> 574
<211> 100
<212> DNA
<213> 智人
<400> 574
gctccttgta gatgggacca ggggtcattt gggcagtagc agcgcctggt ctcagtctgg 60
tactgaagtc aggaatggct taaggtgaaa tcgtggtcct 100
<210> 575
<211> 100
<212> DNA
<213> 智人
<400> 575
ctggtgaagc tcagcgaaga ccccctcgcc ttgtttatga caagagaact tctgggggcg 60
ggaggaagag tccctgttac gatgctgatc atcattgagc 100
<210> 576
<211> 100
<212> DNA
<213> 智人
<400> 576
ttttgctgag cagaaaactc tttagtactc aaggtcgaga gtctctggtg gtctgcctgg 60
caccaggcac cttcctacaa ccctagtttt ccaaaaggac 100
<210> 577
<211> 100
<212> DNA
<213> 智人
<400> 577
aaagcctggg gcaggcgacg tcctagctcg catttgaaca gggccgcggg ccagcagaga 60
tgcgcgatgc ccaactcttt ccaagagcac ctcgcgtccc 100
<210> 578
<211> 100
<212> DNA
<213> 智人
<400> 578
gaaccggtgc cttcaactcg gagaagtcaa gagacccgca agaaacttgc acgactgcac 60
ccgccgccgc gctctggggg ctgggcaggg gcagctgggc 100
<210> 579
<211> 100
<212> DNA
<213> 智人
<400> 579
tggctcccgg ggaacgcgac ccccccgcgc cccgcagacc ggctgtctcc catggacccc 60
tcggcacctg cagcctccga ggaagggtca gcgcgcgtgt 100
<210> 580
<211> 100
<212> DNA
<213> 智人
<400> 580
ggggggctcg ggccagccga tgtttttggc cagaagccgt tcgtcctggg ccgcggctgc 60
ctctccacac cgggagctcg tgtttgtttt gcggagggag 100
<210> 581
<211> 100
<212> DNA
<213> 智人
<400> 581
ctgttgtttt tgttctctgc accggggaga gggggacttg gtggcggccg cgcgtggttt 60
tcgggatcac attagcgtcc gcccggcgtg gcccggtcga 100
<210> 582
<211> 100
<212> DNA
<213> 智人
<400> 582
cattaagggg atcgaacctt tccgcggcct cgtcggggtc tgctcggaat cggcccctgg 60
gccaggcccg aggcgcaagc agatcgccag gttgggtcag 100
<210> 583
<211> 100
<212> DNA
<213> 智人
<400> 583
agttgttgaa aactccccgc tgcctgattt caactttatt atttttttcc cacgccttca 60
ctggggtccc ggagggagag gagccgccgc aacgctggct 100
<210> 584
<211> 100
<212> DNA
<213> 智人
<400> 584
agtagcgcct cggtctctaa aagccactgg gggcgagcct ccggtgtggc ggtgtcacaa 60
gttagctgtc ctttctgagt caaacccaac aaaaaaggca 100
<210> 585
<211> 100
<212> DNA
<213> 智人
<400> 585
agaggaaaat caataaagtc cacgtgctcc ccggcctcct atggaaaggg ctggctgcga 60
tggccggatg cccggccgtg ggctgggttt ggctccagtg 100
<210> 586
<211> 100
<212> DNA
<213> 智人
<400> 586
ggacaaagaa ttttcagaac cgtgagaagg ggaggctttc caaagttgag atccaagtcg 60
tcggtgtctc gggagctccc ctggtacaca gggtgcccgg 100
<210> 587
<211> 100
<212> DNA
<213> 智人
<400> 587
tgcccgactg gagccattta aaaatggcag aaacagctgc aggccaacac acacacgctg 60
gaaaacaacc cgcagccccc tctactgtgg gattccccgc 100
<210> 588
<211> 100
<212> DNA
<213> 智人
<400> 588
gggaagcccg gagttgctcc cctccttgcc tcagcccctg tgcaaagaaa gaactggtgt 60
ctgtgcctgg gtcccttctg tcgccggcct ggaggttggg 100
<210> 589
<211> 100
<212> DNA
<213> 智人
<400> 589
aaacagccgg caagccgcct ttctctgctc gaggaggcgt ggtggggcct cctactccag 60
gttcccggct ggacagaggc tcctgcaccc tgacagctgc 100
<210> 590
<211> 100
<212> DNA
<213> 智人
<400> 590
ggaggccttc cagcccgctg accccgcggg gaccaggcct gtagttggag cttgaggggc 60
tgtacctctg cgcctccctg ggtttgggga aacaacacat 100
<210> 591
<211> 100
<212> DNA
<213> 智人
<400> 591
cgtgtcctct gaagacctca ggctttggga tctcatggtc cagcttccag ttcacttcgt 60
tgccgcgacc ttgggcatat cattgtcact tctctaacca 100
<210> 592
<211> 100
<212> DNA
<213> 智人
<400> 592
tggtgacccg gggttttgtg cttggcttcc aggtcccctc gggttattga ggacgattga 60
ggtcatgcct ccgagagcac cgcgccctgg gcgcaggagg 100
<210> 593
<211> 100
<212> DNA
<213> 智人
<400> 593
aatgcaaatt taacagggca ccctgtattt tacccagagg gaagccgaag tgtttggcag 60
atcatttggc cccatgagcc ttgggtgggt ttctcctcag 100
<210> 594
<211> 100
<212> DNA
<213> 智人
<400> 594
ccctagtgac ccctaaaatt acccccccga cccacccact gtcccctgat gcttccccca 60
cccccggaaa aagctgtggc ctccctctca tttggggcag 100
<210> 595
<211> 100
<212> DNA
<213> 智人
<400> 595
gctgcctcct gttctctttt tctggtgttt cagcaaggca ggccagtgga ggtgaggtga 60
ccagaagatg gctaaaggga aaacaaaatg gtgggcctct 100
<210> 596
<211> 100
<212> DNA
<213> 智人
<400> 596
ccagggtttg ggggccctgt gctggtggag gagagaagac cccagggcga tggtaggaga 60
cgaaagcttg ggctgcagcg taagcttgga ggcccgctgc 100
<210> 597
<211> 100
<212> DNA
<213> 智人
<400> 597
ggtggctcac gcctgtaatc ccagagcttt gggaggctga gacaggagga ttgcttgagc 60
ccaggagttt gagaccagcc tgggtctcaa accaaaaaaa 100
<210> 598
<211> 100
<212> DNA
<213> 智人
<400> 598
taaatataat tttaacgcca atctgagaaa aatgacttat tagctgtgtg attttgagca 60
atgctcttaa cctcccccat gaaggatggt gtgagaacga 100
<210> 599
<211> 100
<212> DNA
<213> 智人
<400> 599
acagaattgt agcacgtgta tcagtctggt acacaatgtc ctatgaaggt tagctttatt 60
atcaccatca ttattattgc agaaagactt tcagttcaga 100
<210> 600
<211> 100
<212> DNA
<213> 智人
<400> 600
ataagacagc acagttacag agacctggtt ttattttcca gcttcttaac tgagtcatct 60
ttcagctcct tttaattaaa aagaaaaaac aatcagagat 100
<210> 601
<211> 100
<212> DNA
<213> 智人
<400> 601
tcaaagacct ggcagaaatg acttcccaac cccagatgcc cccagcagca gtatttagca 60
gtcatacaat tgcctgaaat gaagaatgag taatctggat 100
<210> 602
<211> 100
<212> DNA
<213> 智人
<400> 602
gagtcggccc tgaaatcgac ctgcaactta cccggaacgt gagctgtctc tctctgacct 60
ctgctggctg cttcacctgg agtctgagtc cgactcatgt 100
<210> 603
<211> 100
<212> DNA
<213> 智人
<400> 603
agcacttcac tgtccgcgtt agtttagcct tcactgtcag caactcgtca ccttgtcctc 60
ttgcagcgaa ggtttggaat cccatcacgg gtgtgcagtg 100
<210> 604
<211> 100
<212> DNA
<213> 智人
<400> 604
gttagtcctg agatcatggt ggtgctagga gaacctgcca accaatacag aaagttgtca 60
cgaatagaaa cctaagctct ggccgggtgc ggtggttcaa 100
<210> 605
<211> 100
<212> DNA
<213> 智人
<400> 605
agatatactg ttctagacat gtgtctgaaa ggaatcctgc aaattctgtc ttattgaaca 60
ggcataaggt gtcacgtcag gcgtaaggtg tcacagcagg 100
<210> 606
<211> 100
<212> DNA
<213> 智人
<400> 606
cgtaaggcgt cacgtcaggc gtaaggtgtc acagcaggcg taaggcatca cgtcaggcgt 60
aaggcgtcac gtcaggcgta aggtgtcaca agctcggtga 100
<210> 607
<211> 100
<212> DNA
<213> 智人
<400> 607
acgtcagggg tgtgccttgt gttctctgtt cgttgctttc agaagcagca gcatgtggca 60
gcatctctgt gcctatgacg atattgcagt gaatatgaga 100
<210> 608
<211> 100
<212> DNA
<213> 智人
<400> 608
aattgtacat ttcaacaaca taaataagct gttcaagact gtctcccatg cctccaaaac 60
aaataaaaac cccccacaac tcaaatgcat ataagctgtt 100
<210> 609
<211> 100
<212> DNA
<213> 智人
<400> 609
actatagtat aatggtgagt tatagccagt gtatgatggg attgttgata gaataatgca 60
tattagagct tttagttcaa aaatttgaga tagtgattca 100
<210> 610
<211> 100
<212> DNA
<213> 智人
<400> 610
gaaagaaaaa aaggaatgat tatcatgaat tctgtttatt agaattctgt ttattaaaga 60
gttaaagata tgttttattt ttttatcttt attatcatta 100
<210> 611
<211> 100
<212> DNA
<213> 智人
<400> 611
aattctaatg ttggtccctt aggatcagca gggggggacc gggaatctgt aactgcaacc 60
accccaccga gaggattaca ggaacccagt cgagagctgg 100
<210> 612
<211> 100
<212> DNA
<213> 智人
<400> 612
ttcccaacaa tgaggttcat ttaaaaagtc gtgagggggg aggggggcca aagaaagaaa 60
tagatcaaag agcgggagag tcgagaaaag aaggaagaaa 100
<210> 613
<211> 100
<212> DNA
<213> 智人
<400> 613
tgttggggag cgctggcagc cgggctggca agtggagttt gggaatgtgc agggagggaa 60
ggaagctgaa aaattcaaac tttttaaatg ctactcttca 100
<210> 614
<211> 100
<212> DNA
<213> 智人
<400> 614
gctcctcggc gtccctgcac cccaaccctg cagccctggg gcgttggcag ctgcaccaac 60
aggagcagca agctgggaaa acagagcaac atgacccgac 100
<210> 615
<211> 100
<212> DNA
<213> 智人
<400> 615
gtgttaagag aaggcaaaac acttcagcaa ttaaaaagta gcccagcagc ttcacccttt 60
caaattggga gggggaggtt ggaaagaaat ttaacaacat 100
<210> 616
<211> 100
<212> DNA
<213> 智人
<400> 616
ccatagactt ttgctatgta catttaaacc gcagtcctgg aacattccga gtttaaaact 60
tgctttttca acactggctg acaagcaaca tgttttaagg 100
<210> 617
<211> 100
<212> DNA
<213> 智人
<400> 617
agccccccat taaatcctta ctcgcgggac tctcgagttc aagccagcat tttgtcgcca 60
cctccccccc caaccccgcc cgcaatcgat gagccgcaat 100
<210> 618
<211> 100
<212> DNA
<213> 智人
<400> 618
gcctcggcaa cacaggtaag cgggtcaacc tgaatgcctc tttcacccca aagtttgctg 60
cacgatcggc tatcgcggga agaagcccaa cggagctagg 100
<210> 619
<211> 100
<212> DNA
<213> 智人
<400> 619
gcggactcaa gccccactgc aaacttgttc tgcaacatct ttttgaatca caacttggcc 60
tttcttcctc gcatatcccc agctcccccc aaagagtgga 100
<210> 620
<211> 100
<212> DNA
<213> 智人
<400> 620
ggaaaacatt gtcccgagac tcacttcccc gagggacctc ccactcccaa ccccacgggt 60
gggtaatgcc gctggacaga cctagggcgc agactgggaa 100
<210> 621
<211> 100
<212> DNA
<213> 智人
<400> 621
cccgatcaga ccagcaaacc tgggatccag cagcacgtta cgtaaaacag gatcgcccaa 60
aacttgtccc aatcccagcc ctccccccga agcccccggg 100
<210> 622
<211> 100
<212> DNA
<213> 智人
<400> 622
ctgccctgcc aggcaaactt cgcccctcaa aaccctggcc tccagattca catgtaatcc 60
ccgccagcaa ctgttgaaac tcaaagggtg ggaaggacgg 100
<210> 623
<211> 100
<212> DNA
<213> 智人
<400> 623
ggccaaattc cttcaaactt gggagaaatg ccggaggaga aaagaatcat ctcgctgcac 60
cactttcccc attgccttcc aagacccaaa cttttggggg 100
<210> 624
<211> 100
<212> DNA
<213> 智人
<400> 624
ttctttctta aggcaaaaga aaaagacttt ttgaaaagca aatgctccgc ccccctttac 60
cttgcataaa acttcgctca agtcgaagat ggtggcagac 100
<210> 625
<211> 100
<212> DNA
<213> 智人
<400> 625
acgagggtgg tggtcatcct gtgcgttcgc gcgagccagg ggcgaggatc tggtgtgtcg 60
cgaaggtccc ggtgcgggga aggcgcagcc tctcctgtct 100
<210> 626
<211> 100
<212> DNA
<213> 智人
<400> 626
ttattttttt atattaagat ttattctaaa ttttgattct tctaaatata gtatatattt 60
agtatatata taatgcacct ctcttaccta atgatcattt 100
<210> 627
<211> 100
<212> DNA
<213> 智人
<400> 627
ctaaataatc ataacaacat cgagtaaaac tatgtaataa cacatattat tattaagata 60
agtataagaa atataataat aaattgtccc tgttctaaaa 100
<210> 628
<211> 100
<212> DNA
<213> 智人
<400> 628
ggtaattata taatgctgaa tgtgtcagag gcattcgaac cagagtgact ccattttgag 60
tgagggctag gaaaatgagg ctgagacttg ctgggatgca 100
<210> 629
<211> 100
<212> DNA
<213> 智人
<400> 629
tttaattttt atgctttctt cagtgtatgt ttggagagag tttgaacatt ttttgactct 60
ttttcattga gtaaatccaa atacttgtaa aagacttatc 100
<210> 630
<211> 100
<212> DNA
<213> 智人
<400> 630
tatttcttta acaaaaactt aacatggatt aaggacccat cttaaggcat cacacattaa 60
aaaagtcaat attgattcaa taccggcgct tatactacga 100
<210> 631
<211> 100
<212> DNA
<213> 智人
<400> 631
catcacttgt taaatttgtt ttctaaataa agcccagagg tagtggaaaa tacttcacac 60
tctaggccag tgtttgctat gcctggttga ccctaaactg 100
<210> 632
<211> 100
<212> DNA
<213> 智人
<400> 632
ttgagggttc tttttaaaaa tacagatttc tgggacccac ctgagatgat tccgataatc 60
ggccatatgg atgagtcact tagagatacc catttttaag 100
<210> 633
<211> 100
<212> DNA
<213> 智人
<400> 633
gattaggacc ccgaagccca gaaaatgcct gctgtagtca acattatagt cacactccac 60
aggcactggg tccacccctt tgaccgacat tcctttgcgg 100
<210> 634
<211> 100
<212> DNA
<213> 智人
<400> 634
ttttcccacc cttcttccct gcctggagaa ctcctattca tcctccagag cccggctcaa 60
agtggcttca tctgtgggga tcctccctgc cccatagtga 100
<210> 635
<211> 100
<212> DNA
<213> 智人
<400> 635
gtgctccttg agtcctcgcc cttcctaggg catcccaagc tcccaggggc tgcccctgct 60
gcctcgccat ccgctccaaa gctggctgta cctcgatggt 100
<210> 636
<211> 100
<212> DNA
<213> 智人
<400> 636
taagggcagc caggcgtgct gcttctcgtc caaatacacg aacttctccc aggcccacag 60
gcggtccggg tggtcggtga ctgcctcccc gagtgtcggg 100
<210> 637
<211> 100
<212> DNA
<213> 智人
<400> 637
aggaatcaga tttcaaaatg aatatgtata agaaaagaac cggggatcag tgatcaggaa 60
cagggatcca tgatctggtc cagggctcag cggtcaggaa 100
<210> 638
<211> 100
<212> DNA
<213> 智人
<400> 638
ccctggcctg gagtcccaag tccccagccc atcctgcccc tggagcccag tttagcttgg 60
tcttgaagtc tgctctaggt acccccaaaa tcacagtatc 100
<210> 639
<211> 100
<212> DNA
<213> 智人
<400> 639
cagccccgct ctgcccaccg ggacagccaa gttcagctga gactggccta ccgggggagt 60
cgccctctga agttcactct aagccagcct ggttcagcct 100
<210> 640
<211> 100
<212> DNA
<213> 智人
<400> 640
ggcccaggtc agcccaggac ctccccttgc aggcagcaaa ctcttatttc agtccagcca 60
gctcaaccag cttgcttctg actcagctcc tcttagccag 100
<210> 641
<211> 100
<212> DNA
<213> 智人
<400> 641
ttagctcagc aaagctggac ctaaagtagc cacctcaccc cagcttcatc cagatgaata 60
cagtccagat cagcttagtc agttaagcct agcctagcta 100
<210> 642
<211> 100
<212> DNA
<213> 智人
<400> 642
gttaaatcca gttacgacca gctcaactaa tcctgctcag gcctgctcag cccagcccag 60
ctgaacccag tttagccgag gccaggccag cccagctgaa 100
<210> 643
<211> 100
<212> DNA
<213> 智人
<400> 643
tacagttgcc cagtctagct cagcccagtc cagcactgcc cagtttagct gagctcagcc 60
tggcccagcc cagctcatat cagcccatct cagctgaacc 100
<210> 644
<211> 100
<212> DNA
<213> 智人
<400> 644
agtttgaccc agtctaaccc aaccccgctc agctgaaccc agcccagccc agcccagccc 60
agccaaaccc agtttagcct agctcagctc agcccatttc 100
<210> 645
<211> 100
<212> DNA
<213> 智人
<400> 645
cctgtcctag gggtggcagg cagtctgcac ccagcctagc cctgcccagc gtggggtctc 60
tgaccttctt ggtcttgggc ccagccaaga ttcccagccc 100
<210> 646
<211> 100
<212> DNA
<213> 智人
<400> 646
ttctagcttt cctgtgtccc catgcaggga agggatgcct agagtccacg cagtgaccaa 60
gaagcttggt tgatgctgtg agggtggccc aggagtcccc 100
<210> 647
<211> 100
<212> DNA
<213> 智人
<400> 647
cacctgctgt ccttggtcct ggctgagagg agggccctac ggccagctct gctgaccctg 60
ccctgggctc tggtgatgct gccggcctgg acaagcccct 100
<210> 648
<211> 100
<212> DNA
<213> 智人
<400> 648
gagctcaggt cggtcgtgcc catcctggca tcaccccaca gccggttctg ccgcatcccg 60
tcatgttcct cgtgctccca gcccggtcgt cctggaggcc 100
<210> 649
<211> 100
<212> DNA
<213> 智人
<400> 649
tgagcatgag tggggcgggc agaggcctcc gggtgaggag acagatgggg cctgccttgc 60
tgccctgggc tggggctgca cagccggggt gcgtccaggc 100
<210> 650
<211> 100
<212> DNA
<213> 智人
<400> 650
aggagggctg agcctggctt ccagcagaca ccctccctcc ctgagctggc ctctcaccaa 60
ctgtcttgtc caccttggtg ttgctgggct tgtgatctac 100
<210> 651
<211> 100
<212> DNA
<213> 智人
<400> 651
accaactgtc ttgtccacct tggtgttgct gggcttgtga tctacgttgc aggtgtaggt 60
ctgggtgccg aagttgctgg agggcacggt caccacgctg 100
<210> 652
<211> 100
<212> DNA
<213> 智人
<400> 652
ggactgtagg acagccggga aggtgtgcac gccgctggtc agagcgcctg agttccacga 60
caccgtcacc ggttcgggga agtagtcctt gaccaggcag 100
<210> 653
<211> 100
<212> DNA
<213> 智人
<400> 653
tgctacactg ccctgcacca cctccactca gcttcattgt gctggtggcc ctggctcctg 60
gcagcccatc ttgctccttc tggggcgcca gcctcagagg 100
<210> 654
<211> 100
<212> DNA
<213> 智人
<400> 654
ccttcctgcc tagggtccgc tggggccagc cctgggaccc tcctggtctc aagcacacat 60
tccccctgca gccacacctg cccctgcctg agagctcagc 100
<210> 655
<211> 100
<212> DNA
<213> 智人
<400> 655
cccgagccct ggaatgcctt cccttctcca tcccagctca cccttgccaa ctgctcagtg 60
ggatgggctc acactccctt cctggcacca ggaggctgca 100
<210> 656
<211> 100
<212> DNA
<213> 智人
<400> 656
ctgcactttc accagccctc agctgtctgc tgccagcaac tacccagctc ctgccaaaat 60
ctaggagctg agtgatgcct cccaccggcc ctgctcacct 100
<210> 657
<211> 100
<212> DNA
<213> 智人
<400> 657
gtggttgcct tgccctgagc tctagtgcct gtcccctgct cgtcctgcct cccaccggcc 60
ctgctcacct gtggctgctc tgctctgatt ccctgaggct 100
<210> 658
<211> 100
<212> DNA
<213> 智人
<400> 658
aagcctcagt cctgctcacc ttctgatgct ctcctctgtc ccctgagctc caggggctgt 60
cccctgctcg tcctgcctcc tacctgcccc tgcttacctg 100
<210> 659
<211> 100
<212> DNA
<213> 智人
<400> 659
agggtgctct gccctggtgc tctgagctcc aggggctgtc ccctgctcct cctgcttcct 60
accagcccct gctcacctgt ggctgctctg ccctggtccc 100
<210> 660
<211> 100
<212> DNA
<213> 智人
<400> 660
ctctgccctg gtcccctgag ctccaggggc ttccccctgc tcttcctgcc cccaccagcc 60
cctgttcacc ttcagatgcc ctcccctggt cccctgaagt 100
<210> 661
<211> 100
<212> DNA
<213> 智人
<400> 661
cccagagctg ccccctgttc ctcctgcctc ccaccagccc gtgctcacct gccgctgctc 60
tgccctggtc ccgagttcca ggggctgcac cctgttcgcc 100
<210> 662
<211> 100
<212> DNA
<213> 智人
<400> 662
cacctcccac tagccatgct cagctcttga tgctctgtcc tggtcccctg agctccagga 60
gctgtcccct actcgtcctg ccacccacca gcccctgctc 100
<210> 663
<211> 100
<212> DNA
<213> 智人
<400> 663
acctgaggca cctgaggctg ctctgccctg gtcccctgag ctccagggtc ttccccctgc 60
tcatcctgcc tcccacctgc ccttgttcac cttcagttgc 100
<210> 664
<211> 100
<212> DNA
<213> 智人
<400> 664
tctgccctgg tctgctgagc tccaggaggt gccccctgct ccttctgccc ccacctgccc 60
tgctcacctg tggctgctcg gtcctggtac cctgaactcc 100
<210> 665
<211> 100
<212> DNA
<213> 智人
<400> 665
gccccctgct ccttctgccc ccacctgccc tgctcacctg tggctgctcg gtcctggtac 60
cctgaactcc aatgcctgcc ccctgctcac tctgccctcc 100
<210> 666
<211> 100
<212> DNA
<213> 智人
<400> 666
ctcaacccgg gcagcaatgt cactcaggtc actgttgccc ccctgcctgt cctggcaccc 60
tctgtccagg tttgggctgt ttttctggcc tcatttttgt 100
<210> 667
<211> 100
<212> DNA
<213> 智人
<400> 667
tgtccagtca ggtctcccca acagagcccc ttgcccttgc ccatgtgccc ctcctgggtg 60
agctcccaga tcctcccgtc cctgcactgc tcctgctctg 100
<210> 668
<211> 100
<212> DNA
<213> 智人
<400> 668
gaagcctctc cagaacctca gctcctcagt ggcctctgct ctgctgggtc agctccctga 60
acgcacggag cctcacccct cccctcgccc caggcctgct 100
<210> 669
<211> 100
<212> DNA
<213> 智人
<400> 669
gcactctggg cctttctggg cctccctgga ctcttccctc ctcccatctg tgcactcagc 60
acagctctcc cctccactcc gctgctgacc acagccctgc 100
<210> 670
<211> 100
<212> DNA
<213> 智人
<400> 670
cctttctggg cctccctgga ctcttccctc ctcccatctg tgcactcagc acagctctcc 60
cctccactcc gctgctgacc acagccctgc tccccgccag 100
<210> 671
<211> 100
<212> DNA
<213> 智人
<400> 671
cccacggcca gcactgctga ccctgccctg ggctccagtg atgctgctgg cctggacaag 60
cccctccgtt cacctggggc ctctcctcct ccctcgttct 100
<210> 672
<211> 100
<212> DNA
<213> 智人
<400> 672
actgcctcct cagctcaggt gggtcctgcc catgctggca tcaccccacg gccggctctg 60
ccgcatcccg tcaggttcct cgtgctccca gcctggtcgt 100
<210> 673
<211> 100
<212> DNA
<213> 智人
<400> 673
catggaggcc tcagtcagcc tctggtgtgt cctgccctgt tggcttggaa gcccctgccc 60
acggtccccg tcatcttgca ctgggtgggc gttggtgcct 100
<210> 674
<211> 100
<212> DNA
<213> 智人
<400> 674
agctcagccc agcctagtcc agcccagccc agcacaggtc agcccagctt agcttagccc 60
aggtcagtcc agctcagctc agtccactta agctcaccca 100
<210> 675
<211> 100
<212> DNA
<213> 智人
<400> 675
ggtcagctcc gtccagctca gcccagccta gcccagctta gcccagccca gcccaacaca 60
ggtcagccca gctcagccta gcccagccca gctcagcaca 100
<210> 676
<211> 100
<212> DNA
<213> 智人
<400> 676
ggtcagacca gctcagtaca gctcaggtca gcccagacca gtccaaccca gcccagcgca 60
gtccaaccca gcccagctca gctcatccaa gcctagctca 100
<210> 677
<211> 100
<212> DNA
<213> 智人
<400> 677
gctcagccca gcccaggtca gcctagccca gccgaaccca gctcagccca ggtcaaccca 60
attcagctca gctcagccca ggtcaaccca accaagctca 100
<210> 678
<211> 100
<212> DNA
<213> 智人
<400> 678
gctcagccta gcccagtcca gctcagccca gctcagctca gcccagtcca gctcaatcca 60
cctaagctca cccagctcag cccagtctgg ctcagcttag 100
<210> 679
<211> 100
<212> DNA
<213> 智人
<400> 679
gtcagcccag cccagcctag cccagatcag tccagcttag cccagcccag gtcagcccag 60
cccaggtcag cccagctcag ctcagcccag cccagctcag 100
<210> 680
<211> 100
<212> DNA
<213> 智人
<400> 680
cccagcccag ctcagcgcag cccagcctag ctcaccccag ccaggtccag cttagcccag 60
ctcagcccag cccaactcag ctcagcccag ctcagcccaa 100
<210> 681
<211> 100
<212> DNA
<213> 智人
<400> 681
tctgagctcc aggggctgcc cacctgctcc tcctgcttcc caccggccct gctcacctgc 60
agctgctctg ccctggctcc ctgaggctga gcctcagtcc 100
<210> 682
<211> 100
<212> DNA
<213> 智人
<400> 682
tgctcacctt ctgatgctct ccccttgtcc cctgagctcc aggggctgac ccctgatctt 60
tctgcttcct acctgcccct gctcacctgt ggctgctctg 100
<210> 683
<211> 100
<212> DNA
<213> 智人
<400> 683
ccctgatccc ctgagctcca ggagctgcct cctgctcttc ctgcctccca cctgcccctg 60
ctcacctgca gatctgccct ggctctctga ggtccagggg 100
<210> 684
<211> 100
<212> DNA
<213> 智人
<400> 684
ctgccccctg ctcgcccacc tcccaccagc catgctgacg ttgtgatgct ctgccctggt 60
ctcctgaggt ccaggggctg tcccctgctt attctgcctc 100
<210> 685
<211> 100
<212> DNA
<213> 智人
<400> 685
ccacctgccc cttctcacct gaggctcttc tgccctggtg ctctgagctc caaaagctgc 60
ccacttgctc ctcctgcttc ctaccagccc ctgctctcct 100
<210> 686
<211> 100
<212> DNA
<213> 智人
<400> 686
gtggatgatc tgccctggct ctctgagctc caggggctgc ccacctgctc cccatgcttc 60
ccacctgccc ctgctgacct gcggctgctc tgccttggct 100
<210> 687
<211> 100
<212> DNA
<213> 智人
<400> 687
ccctgagctc caggagcttc cccctgctca tcctgccccc cactggcccc tgttcacctt 60
cagatgccct ccctggtccc ctgaagtcca ggagctgccc 100
<210> 688
<211> 100
<212> DNA
<213> 智人
<400> 688
cctgttcctc ccgcctccca ccagcccgtg ctcacctgcg gctgctctgc cctggtcccc 60
tgagttccag gggctgcccc ctgctcgccc acctcccact 100
<210> 689
<211> 100
<212> DNA
<213> 智人
<400> 689
agccatgctc acctcctgat gctctgtcct ggtcccctga gctccagggg ctgccccctg 60
cttgcccatc tcccactagc catgctcacc ttctgatgct 100
<210> 690
<211> 100
<212> DNA
<213> 智人
<400> 690
ctgccctggt cccctgagct ccagggtctt ccccctgctc atcctgccgc ccaccagccc 60
ctgctcacct gaggctgctc tgccctggtc ccctgagctc 100
<210> 691
<211> 100
<212> DNA
<213> 智人
<400> 691
cccctgagct ccagggtctt ccccctgctc atcctgccgc ccaccagccc ctgctcacct 60
gaggctgctc tgccctggtc ccctgagctc caggaggtgc 100
<210> 692
<211> 100
<212> DNA
<213> 智人
<400> 692
ttctgccccc acctgccctg ctcacctgtg gctgcttggt cctggtccct gagctccaat 60
gcctgctccc tgctcactct gccctccctc aacccgggca 100
<210> 693
<211> 100
<212> DNA
<213> 智人
<400> 693
gcaatgtcac tcaggtcact gttgcccccc tgcctgtcct ggcaccctct gtccaggttt 60
gggctgtttt tctgccctca tttttgattt tgcagcactt 100
<210> 694
<211> 100
<212> DNA
<213> 智人
<400> 694
cctctgtcca ggtttgggct gtttttctgc cctcattttt gattttgcag cacttggcgt 60
gttccctatg ctgtggagca gccccagtgt ccagtcaggt 100
<210> 695
<211> 100
<212> DNA
<213> 智人
<400> 695
agtgtccagt caggtctccc caacagagcc ccttgccctt gcccatgtgc ccctcctgaa 60
tgagctcccg gatcctcctg tccctgcact gctcctgctc 100
<210> 696
<211> 100
<212> DNA
<213> 智人
<400> 696
tggaagcctc tctggaacct cagctcctca gtggcctctg ctctgctggg tcagttccct 60
gaacgcacgg agcctcagcc cttcccctcg ccccaggcct 100
<210> 697
<211> 100
<212> DNA
<213> 智人
<400> 697
gctgcactct gggcctttct gggcctccct ggactcttcc cttctcccgc ccgtgcactc 60
agcacagctc tcccctcctc tccactgctg accacagccc 100
<210> 698
<211> 100
<212> DNA
<213> 智人
<400> 698
tgctccccgc cagcaggtgc cccaacccca tcagctggct ctgagcccag cccctgtgcc 60
tcccctgtcc ctgcctctgc ctctgggctc cttggcttcc 100
<210> 699
<211> 100
<212> DNA
<213> 智人
<400> 699
acctgctgtc cttggtcctg gctgagagga gggccccacg gccagcactg ctgaccctgc 60
cctgggctcc ggtgatgctg ccggcctgga caagcccctc 100
<210> 700
<211> 100
<212> DNA
<213> 智人
<400> 700
cgttcacctg gggcctctcc tcctccctcg ctctgctgcc tcctgagctc aggtcggtcg 60
tgcccatcct ggcatcaccc cacggccggc tctgccgcat 100
<210> 701
<211> 100
<212> DNA
<213> 智人
<400> 701
ccagtcatgt tcctcgtgct cccagcccgg tcgtcctgga ggcctcagtc agcctctggt 60
gtgtcctgcc ctgttggctt ggaagcccct gcccacggtc 100
<210> 702
<211> 100
<212> DNA
<213> 智人
<400> 702
cccgtcgtct cgcactgggt gggcatcggt gcctgaaggc tgcccacctc ccccgtgctg 60
gctccgcttg ggcctccatg tggggccggc ctcgacccca 100
<210> 703
<211> 100
<212> DNA
<213> 智人
<400> 703
cactgcactt tcaccagccc tcagctgtct gctgccggca actacccagc tcctgccaaa 60
gtctaggagc tgcgtgctgc ctcccaccgt ccctgctcac 100
<210> 704
<211> 100
<212> DNA
<213> 智人
<400> 704
ctgtggctgc tctgccctgg tgctctgagc tccaggagat gccccctgct cctcctgccc 60
cccacctgcc cctgctcacc tgcagcggct ctgccctggt 100
<210> 705
<211> 100
<212> DNA
<213> 智人
<400> 705
gagctccaag agctgccccc tgctcctcct gtcccctgac cctgctcctg tttgcctatg 60
gctgctctgc ccttgtcccc tgagctccag gagctgcccc 100
<210> 706
<211> 100
<212> DNA
<213> 智人
<400> 706
tgctcattct gccgcccacc tgcccctgtt cacctgtggc tgctcttccc tggtcctctg 60
agctccatga gctgcccctt gctcctcctg ctttccacca 100
<210> 707
<211> 100
<212> DNA
<213> 智人
<400> 707
gcccctgctc acctaccgat gatcttcccc ggctctctga gctccagggg ctgcccacct 60
gctacccctg cttcccacca gccctgctta cctgcagctg 100
<210> 708
<211> 100
<212> DNA
<213> 智人
<400> 708
ctctgccctg gctggcagag ctgcagaagc tgccccctgc tctgcaacct cccaccggcc 60
cttctcatct tctgatgttc tcccctgttc cctgagctcc 100
<210> 709
<211> 100
<212> DNA
<213> 智人
<400> 709
aggagctgcc ccctactcgt tctacctccc accaacccgt gctcacctgc gactgctctg 60
ccctggtccc ctgagctcca ggggctgccc cctgctcgcc 100
<210> 710
<211> 100
<212> DNA
<213> 智人
<400> 710
tgccctgatc ccctgagctc caggactgcc ccctgctcgt cctgcccctc acctgcccct 60
gctcacctga ggctgctctg ccctggtccc ctgagctaaa 100
<210> 711
<211> 100
<212> DNA
<213> 智人
<400> 711
ggggctgccc cttactcatc ctgcctccca ccagcccctg ctcaccttct gatgccctcc 60
cctggtcccc tgagctccag gggctgcccc ctgctcgtcc 100
<210> 712
<211> 100
<212> DNA
<213> 智人
<400> 712
gggctgcccc ctgctcgtcc tgcctcccac cagcccctgc tcacctgcag ctacactgcc 60
ctggttccct gagctccagg agctgccacc tgcttgtcct 100
<210> 713
<211> 100
<212> DNA
<213> 智人
<400> 713
gccttccacc agcccctgct cacctgcagc tacactgccc tggttccctg agctccggga 60
gctgccgcct gcttgtcctg cctcccacca gcccctgctc 100
<210> 714
<211> 100
<212> DNA
<213> 智人
<400> 714
acctgtggct acactgccct ggtgccctga gctccaggag ctgccccctg cttgcccatc 60
ttccactgag ccctgctcac ctgcaactgc tctgccctgg 100
<210> 715
<211> 100
<212> DNA
<213> 智人
<400> 715
ctctatgagc tccaggggct gccccctgct ggtcctgcct cccacctgcc ctgcgcacct 60
gtggctgcct cctcacctgt ggctgctctg ccctggtccc 100
<210> 716
<211> 100
<212> DNA
<213> 智人
<400> 716
ctgagctcca gggtcttcct cctgctcatc ctgcccctcc accggctcct gttcaccttc 60
agatgctctc ccgtggtccc ctgagctcca ggagctgccc 100
<210> 717
<211> 100
<212> DNA
<213> 智人
<400> 717
cctgttcttc ctgcctccca cctgccctgt gcacctgtgg ctgcttggtc ctggtcccct 60
gaactccaat gcctgccccc tgctcactct gccctccctc 100
<210> 718
<211> 100
<212> DNA
<213> 智人
<400> 718
aacctggggc agcaacgtca ctcggtccac tgttgccccc ctgcctgtcc tggcaccctc 60
tgtccaggtt taggctgttt ttcttgcctc atttttgttt 100
<210> 719
<211> 100
<212> DNA
<213> 智人
<400> 719
tggcaccctc tgtccaggtt taggctgttt ttcttgcctc atttttgttt ttgcagcact 60
tggcgtgttc cctatgctgt ggagcagccc cagtgtccag 100
<210> 720
<211> 100
<212> DNA
<213> 智人
<400> 720
tccagtcagg tctccccaac agagcccctt gcccttgccc atgtgcccct cctggatgag 60
ctcccggatc ctcccgtccc tgcactgctc ctgctctgga 100
<210> 721
<211> 100
<212> DNA
<213> 智人
<400> 721
agcctctcca gaacctcagc tcctcagtgg cctctgctct gctgggtcag ttccctgaac 60
gcacggagcc tcagcccctc ccctcgcccc aggcctgctg 100
<210> 722
<211> 100
<212> DNA
<213> 智人
<400> 722
cactctgggc ctttctgggc ctccctggac tcttccctcc tcccgcccgt gcactcagca 60
cagctctccc ctcctctccg ctgctgacca cagccctgct 100
<210> 723
<211> 100
<212> DNA
<213> 智人
<400> 723
gaccacagcc ctgctcccgg ccagcaggtg ccccaacccc atcagctggc tctgagccca 60
gcccctgtgc ctcccctgtc cctgcctctg cctctgggct 100
<210> 724
<211> 100
<212> DNA
<213> 智人
<400> 724
gctctgctcc cagctcacct gctgtccttg gtcctggctg agaggagggc cctacggcca 60
gctctgctga ccctgccctg ggctccggtg atgctgccgg 100
<210> 725
<211> 100
<212> DNA
<213> 智人
<400> 725
cctggacaag cccctcggtt cacctggggc ctctcctcct ccctctctct gctgcctcct 60
gagctcaggt cggtcatgcc catcctggca tcaccccatg 100
<210> 726
<211> 100
<212> DNA
<213> 智人
<400> 726
gctggctctg ccccatcccg tcatgttcct cacactccca gcccggtcgt cctggaggcc 60
tcagtcagcc tctggtgtgt cctgccctgt tggcttggaa 100
<210> 727
<211> 100
<212> DNA
<213> 智人
<400> 727
gggtagagcc cacctcgtgg cctgcaagcc agccagcccc tgccggtcga gaaggaagcc 60
tgtgtgagag cacacaactg gaggccgggc ggggaagaga 100
<210> 728
<211> 100
<212> DNA
<213> 智人
<400> 728
aacacgtgcc aacaggccac gcaggccagg accccagacc cggaggcagc gcccctttga 60
gttcctctct ctggtctccg atgttcttct gttgggatca 100
<210> 729
<211> 100
<212> DNA
<213> 智人
<400> 729
tttcacctac aggcaacaga gacagtgtga aatgctttcc ctgtggtcgg gaagggagcc 60
ggggcagaga tgacccagtg gggtggtgtg ggggcctccg 100
<210> 730
<211> 100
<212> DNA
<213> 智人
<400> 730
ctttgcacac cacgtgttcg tctgtgccct gcatgacgtc cttggaaggc agcagcacct 60
gtgaggtggc tgcgtacttg ccccctctca ggactgatgg 100
<210> 731
<211> 100
<212> DNA
<213> 智人
<400> 731
gaagccccgg gtgctgctga tgtcagagtt gttcttgtat ttccaggaga aagtgatgga 60
gtcgggaagg aagtcctgtg cgaggcagcc aacggccacg 100
<210> 732
<211> 100
<212> DNA
<213> 智人
<400> 732
ctgctcgtat ccgacgggga attctcacag gagacgaggg ggaaaagggt tggggcggat 60
gcactccctg aggacccgca ggacaaaaga gaaagggagg 100
<210> 733
<211> 100
<212> DNA
<213> 智人
<400> 733
actccagcta ccctgaagtc tccccaggca gacaacccag gcctgggagt gagtataggg 60
agggtgggtg tgatggggaa cgcagtgtag actcagctga 100
<210> 734
<211> 100
<212> DNA
<213> 智人
<400> 734
ggctatccat ctatgtccaa caagatcatg aagattggcc cagtgccatg tcctccagtt 60
catcccagcc caggccagct caatccagtt catcccagcc 100
<210> 735
<211> 100
<212> DNA
<213> 智人
<400> 735
caggccagct caatccagcc cagcccaccc caccccagct cagcaaagcc aagctcagct 60
cagcccaact cagatgagct cagaccagct cagcccagcc 100
<210> 736
<211> 100
<212> DNA
<213> 智人
<400> 736
cagctcagct cagcccaacc cagcccagct cgctcaacct tgctcggctc agcttagccc 60
agcccagccc agctcaatcc agcctggctc agcccagccc 100
<210> 737
<211> 100
<212> DNA
<213> 智人
<400> 737
agcccagttt ggctcaaccc agcttggctc agcccaggtc agcctggctc aactcagccc 60
agcccagccc agctctgctc aacccagctc tgctcaactc 100
<210> 738
<211> 100
<212> DNA
<213> 智人
<400> 738
agcccagctc atcccagctc agcccagccc agcctagctt agctcaaccc agctcagctc 60
agttcagctc agccctgctc agcacagcac agcagagccc 100
<210> 739
<211> 100
<212> DNA
<213> 智人
<400> 739
agcccggatc ggctcaaccc agcttagctc agcccaggtc agcccagctt aactcagccc 60
aggtcagccc agcttaactc agcccagccc agcccagctc 100
<210> 740
<211> 100
<212> DNA
<213> 智人
<400> 740
tcagcccagt tcagcccagc tcagcccagc ccagcctagc ttggctcaac acagctcagc 60
tcagccagcc cagaccagct cagctcagcc cagtccagct 100
<210> 741
<211> 100
<212> DNA
<213> 智人
<400> 741
caacccagcc cagcccaacc cagctcggct taacccagct cggctcagcc cagatcagcc 60
tggctcaact cagcccagcc cagctcaacc cagcccagtt 100
<210> 742
<211> 100
<212> DNA
<213> 智人
<400> 742
cagctcagct gagcccagcc cagcccagtc cggctcagct cagccccgcc ccactcagcc 60
cagctcagct cagcccagct cagcccagct cagcttagcc 100
<210> 743
<211> 100
<212> DNA
<213> 智人
<400> 743
cagcccagat catcccagct cagctcagct cagctcggct tagcccagct caacctggcc 60
cagcctggtc caggtcagcc cagcctggac cacccagccc 100
<210> 744
<211> 100
<212> DNA
<213> 智人
<400> 744
agctcagctc agcccagctc atcctggttc agctcagctc aacccggctc agcccaggtc 60
tgctcaaccc agcccaaatc agctcagccc agcccaggtc 100
<210> 745
<211> 100
<212> DNA
<213> 智人
<400> 745
atcccagctc agcccagcac agcctacttc agctcagctc agctcagcct aggtcagctc 60
agttgaggtc agctcaactc agcccaatcc agcctggctc 100
<210> 746
<211> 100
<212> DNA
<213> 智人
<400> 746
agcccagctc accctagctc agcttagctc agcccaactc aacccagccc agccttgccc 60
aacccagctc agctcagccc agcccaggtt agcccagccc 100
<210> 747
<211> 100
<212> DNA
<213> 智人
<400> 747
agcctcggct tagctctgct cagctcggcc ctgctcgcct cagcccgttc agcccagttc 60
agctcagctc agctcagccc agctcagccc agccctggtt 100
<210> 748
<211> 100
<212> DNA
<213> 智人
<400> 748
agctcagccc agctaagctc agctcggctt ggctctgctg agcttggccc agcttggctt 60
agcctgatac aacctgctca gcccagttca gctcggctca 100
<210> 749
<211> 100
<212> DNA
<213> 智人
<400> 749
gcccagcgta gctcagctca gctgagccca gcccaggtta gctcagcccc agtccaggtc 60
agctcaactc agcccaaacc agcctggctc ggcccagctc 100
<210> 750
<211> 100
<212> DNA
<213> 智人
<400> 750
accctagttc agcttagctc agcccagccc agccctgccc aacccagctc agctcagccc 60
agcccaggtt agcccagccc agcctcggct tagctctgct 100
<210> 751
<211> 100
<212> DNA
<213> 智人
<400> 751
agcccagccc aggttagccc agcccagcct cggcttagct ctgctcagct cggcccagcc 60
caggttagcc cagcccagcc tcggcttagc tctgctcagc 100
<210> 752
<211> 100
<212> DNA
<213> 智人
<400> 752
tcggccctgc tcgcctcagc ccgttcagcc cagttcagct cagctcagct cagcccagct 60
cagcccagcc ctggttagct cagcccagct aagctcagct 100
<210> 753
<211> 100
<212> DNA
<213> 智人
<400> 753
cggctcagct ctgctgagct cggcccagct tggctcagcc cgacacagcc tgctcagccc 60
agttcagctc ggctcagccc agcccagccc agcgtagctc 100
<210> 754
<211> 100
<212> DNA
<213> 智人
<400> 754
agctgagccc agcccaggtt agctcagccc cagcccaggt tagctcagcc cagctcagct 60
ctgcccaggt tagctcagcc ccagtccagg ttagctcagc 100
<210> 755
<211> 100
<212> DNA
<213> 智人
<400> 755
ccagctcagc tctgcccagg ttagctcagc cccagtccag gttagctcag cccagctcag 60
ccttgcccag gttagctcag cccagctaag ctcaacttgg 100
<210> 756
<211> 100
<212> DNA
<213> 智人
<400> 756
ctcagctcag cctagcttgg ctcagcccag cacagcacgc tcaacccggt tcagcttggc 60
tcagcccagc ccagcccagc ctagctcagc tcagccccgc 100
<210> 757
<211> 100
<212> DNA
<213> 智人
<400> 757
ccagctcagc gcagcccagc tcagctcagc tcagcctagc cttgctcggc ccagctcagc 60
tcagcccagc tcagcctagc cttgctcagc ccagctcagc 100
<210> 758
<211> 100
<212> DNA
<213> 智人
<400> 758
tcagcccagc cctgcccagc tcagcccagc ttagtgcagc caagcccagc tcagctcagc 60
tcacctggtg caacttagcc cagctcagct cagctcagct 100
<210> 759
<211> 100
<212> DNA
<213> 智人
<400> 759
caacccagtt caactcagcc cagttcagct cagctcagcc cagttcagcc ttgtttagtc 60
taggtcagct taggtcagtt ttgcccatct gagtccattt 100
<210> 760
<211> 100
<212> DNA
<213> 智人
<400> 760
ctgaaagctg gatggagttg tcatggccag aaatggtcag cccaccagac ctgcttgtct 60
cagctaaagc catctcattg ccaggttcct gcacagccag 100
<210> 761
<211> 100
<212> DNA
<213> 智人
<400> 761
gctggcttcc atcttttgtc tccctctact tgatacccca gttccctgca gtcctgcccc 60
agcgccacct gggttttggt tccaaagcat taccaatcat 100
<210> 762
<211> 100
<212> DNA
<213> 智人
<400> 762
taccaccctc cactacctgg gtggaatatt tctttgctgc tttaaagtca ttaaaacatc 60
ttgagaatga gaccaagaat ttaggagcct gtgctgtgat 100
<210> 763
<211> 100
<212> DNA
<213> 智人
<400> 763
aaaaatgagc aggtcccctt gctctagaag tggcagcata tcttctgcac caagaggagg 60
gtattgagat gctcagagcc tccaccttcc cggagcatcc 100
<210> 764
<211> 100
<212> DNA
<213> 智人
<400> 764
cctcccttct gagtctgcag taaacccctg cctttaaatt ccctctagat aacagtcatc 60
attggaaaca accaagaaat gcattttatc tgaatttgcc 100
<210> 765
<211> 100
<212> DNA
<213> 智人
<400> 765
acttaaaatt ctgccattta ccataaatcg ctttggaagg catgggctac tttcaagggt 60
gcgatgatga cctacagtca atgacttaga caagggcgat 100
<210> 766
<211> 100
<212> DNA
<213> 智人
<400> 766
gccagtgggg cttggtatgt tctcaagcat cattacccat gccatcccca ttcagaggtt 60
gtggagcagc tcgtgcgacc tctccttcaa atgggcttta 100
<210> 767
<211> 100
<212> DNA
<213> 智人
<400> 767
gggaaagtta aatgggagtg acccagacaa tggtcactca aaagactcac ataaatgagt 60
ctcctgctct tcatcaagca attaagacca gttccccttc 100
<210> 768
<211> 100
<212> DNA
<213> 智人
<400> 768
tagtggaaat aagacgtcaa atacaaagtt ttaagagaag caaatgcagc agcggcggct 60
gcctgtctct taccatgtcg ggcgcctggt cactgcgagc 100
<210> 769
<211> 100
<212> DNA
<213> 智人
<400> 769
cttgcaaagc tttggcatgg aatcattcct ccaagtccat taacaagggc tggggcctga 60
gcagccagtc ggcccggcag cagaagccac gcatcccagc 100
<210> 770
<211> 100
<212> DNA
<213> 智人
<400> 770
tctgggtagt ccggggagac ccaaagccca ggccgggcct ggcagccacc ctcccagagc 60
ctccgctagg ccagtcctgc tgacgccgca tcggtgattc 100
<210> 771
<211> 100
<212> DNA
<213> 智人
<400> 771
ggaacagaat ctgtccttct aaggtgtctc cacagtcctg tcttcagcac tatctgattg 60
agttttctct tatgccacca actaacatgc ttaactgaaa 100
<210> 772
<211> 100
<212> DNA
<213> 智人
<400> 772
taattcagga taatgatgca cattttacct aaaacttatc ctaaagtgag tagttgaaaa 60
gtggtcttga aaaatactaa aatgaaggcc actctatcag 100
<210> 773
<211> 100
<212> DNA
<213> 智人
<400> 773
aatatcaaag tgtttctcct taatcacaaa gagaaaacga gttaacctaa aaagattgtg 60
aacacagtca ttatgaaaat aatgctctga ggtatcgaaa 100
<210> 774
<211> 100
<212> DNA
<213> 智人
<400> 774
aagtatttga gattagttat cacatgaagg gataacaagc taatttaaaa aactttttga 60
atacagtcat aaactctccc taagactgtt taatttctta 100
<210> 775
<211> 100
<212> DNA
<213> 智人
<400> 775
aacatcttac tttaaaaatg aatgcagttt agaagttgat atgctgtttg cacaaactag 60
cagttgataa gctaagattg gaaatgaaat tcagatagtt 100
<210> 776
<211> 100
<212> DNA
<213> 智人
<400> 776
aaaaaaagcc ttttcagttt cggtcagcct cgccttattt tagaaacgca aattgtccag 60
gtgttgtttt gctcagtaga gcactttcag atctgggcct 100
<210> 777
<211> 100
<212> DNA
<213> 智人
<400> 777
gggcaaaacc acctcttcac aaccagaagt gataaattta ccaattgtgt ttttttgctt 60
cctaaaatag actctcgcgg tgacctgctt cctgccacct 100
<210> 778
<211> 100
<212> DNA
<213> 智人
<400> 778
gctgtgggtg ccggagaccc ccatgcagcc atcttgactc taattcatca tctgcttcca 60
gcttcgctca attaattaaa aaaataaact tgatttatga 100
<210> 779
<211> 100
<212> DNA
<213> 智人
<400> 779
tggtcaaaac gcagtcccgc atcggggccg acagcactgt gctagtattt cttagctgag 60
cttgctttgg cctcaattcc agacacatat cactcatggg 100
<210> 780
<211> 100
<212> DNA
<213> 智人
<400> 780
tgttaatcaa atgataagaa tttcaaatac ttggacagtt aaaaaaatta atatacttga 60
aaatctctca catttttaag tcataatttt cttaaccatt 100
<210> 781
<211> 100
<212> DNA
<213> 智人
<400> 781
tttctcagaa gccacttcaa acatatcctg tcttttaaca gtaagcatgc ctcctaagat 60
aaacaatcct tttctcttgg aaaccagctt caaggcactg 100
<210> 782
<211> 100
<212> DNA
<213> 智人
<400> 782
aggtcctgga gcctccctaa gcccctgtca ggacggcagc caccgtttct gggctacccc 60
tgcccccaac cctgctctca tcaagaccgg ggctacgcgt 100
<210> 783
<211> 100
<212> DNA
<213> 智人
<400> 783
ccctcctggc tggattcacc cactccgaca gttctctttc cagccaataa agaatttaag 60
atgcaggttg acacacagcg cacctcataa ttctaaagaa 100
<210> 784
<211> 100
<212> DNA
<213> 智人
<400> 784
aatatttcac gattcgctgc tgtgcagcga tcttgcagtc ctacagacac cgctcctgag 60
acacattcct cagccatcac taagacccct ggtttgttca 100
<210> 785
<211> 100
<212> DNA
<213> 智人
<400> 785
ggcatctcgt ccaaatgtgg ctccccaagc ccccaggctc agttactcca tcagacgcac 60
ccaacctgag tcccattttc caaaggcatc ggaaaatcca 100
<210> 786
<211> 100
<212> DNA
<213> 智人
<400> 786
cagaggctcc cagatcctca aggcacccca gtgcccgtcc cctcctggcc agtccgccca 60
ggtcccctcg gaacatgccc cgaggaccaa cctgcaatgc 100
<210> 787
<211> 100
<212> DNA
<213> 智人
<400> 787
tcaggaaacc ccacaggcag tagcagaaaa caaaggccct agagtggcca ttcttacctg 60
aggagacggt gaccgtggtc cctttgcccc agacgtccat 100
<210> 788
<211> 100
<212> DNA
<213> 智人
<400> 788
gtagtagtag tagtagtaat cacaatggca gaatgtccat cctcacccca caaaaaccca 60
gccacccaga gaccttctgt ctccgggcgt cacatggaag 100
<210> 789
<211> 100
<212> DNA
<213> 智人
<400> 789
ctgactgtcc gtggccctgt cctgcccttc tcatggaacc ctctgctggc ctcccacgta 60
ccccacattc tggcctgacc cctcagaagc cagaccactg 100
<210> 790
<211> 100
<212> DNA
<213> 智人
<400> 790
tcggcctggg aagtccaact gcaagcagac ggctgctaag tcacccccag gagtccaaaa 60
accccggggg gcacccgtcc cagagagcgg gtgccttgga 100
<210> 791
<211> 100
<212> DNA
<213> 智人
<400> 791
gcgggacaga gtcccaccac gcaatcatca cgacagcccc tgagaatgct ccaggtgaag 60
cggagagagg tcaccccaga ccagccgaag gagcccccca 100
<210> 792
<211> 100
<212> DNA
<213> 智人
<400> 792
gctgccgaca tctgtggccg gacttgggga ggacaggctg ggttcccatt cgaagggtcc 60
ctctccccgg ctttctttcc tgacctccaa aatgcctcca 100
<210> 793
<211> 100
<212> DNA
<213> 智人
<400> 793
agactctgac cctgagaccc tggcaagctg agtctcccta agtggactca gagagggggt 60
ggtgaggact cacctgagga gacggtgacc agggttccct 100
<210> 794
<211> 100
<212> DNA
<213> 智人
<400> 794
ggccccaggg gtcgaaccag ttgtcacatt gtgacaacaa tgccaggacc ccaggcaaga 60
actggcgccc cgctacgtcc ctgggaccct ctcagactga 100
<210> 795
<211> 100
<212> DNA
<213> 智人
<400> 795
gcccggggag ggcccggggg ttgttgggca ttggacccca gaggcctagg gtggccctgg 60
ccacagagag acccgtgctg ctgggctcag gaggaaggag 100
<210> 796
<211> 100
<212> DNA
<213> 智人
<400> 796
catctggagc ccttgcccct cgtctgtgtg gccgctgttg cctcagggca tcctcctgag 60
ccccccagga tgctccgggg ctctcttggc aggagaccca 100
<210> 797
<211> 100
<212> DNA
<213> 智人
<400> 797
gcacccttat ttccccccag aaatgcagca aaacccttca gagttaaagc aggagagagg 60
ttgtgaggac tcacctgagg agacggtgac cagggttccc 100
<210> 798
<211> 100
<212> DNA
<213> 智人
<400> 798
tggccccagt agtcaaagta gtcacattgt gggaggcccc attaaggggt gcacaaaaac 60
ctgactctcc gactgtcccg ggccggccgt ggcagccagc 100
<210> 799
<211> 100
<212> DNA
<213> 智人
<400> 799
cccgtgtccc aaggtcattt tgtccccagc acaagcatga ctctgcccac cctttgcccc 60
agcagcagag tcccagttcc caaagaaagg ccttctgctg 100
<210> 800
<211> 100
<212> DNA
<213> 智人
<400> 800
aacgtggtcc caaacagccg gagaaggagc cccggagggc cccacatggc ccagcgcaga 60
ccaaggagcc cccggacatt atctcccagc tccaggacag 100
<210> 801
<211> 100
<212> DNA
<213> 智人
<400> 801
aggacgctgg gcccagagaa aggaggcaga aggaaagcca tcttacctga agagacggtg 60
accattgtcc cttggcccca gatatcaaaa gcatcacaca 100
<210> 802
<211> 100
<212> DNA
<213> 智人
<400> 802
gggacacagt ccctgttcct gcccagacac aaacctgtgc ccgtgcagga cactcgaatg 60
ggtcacatgg cccaagcaca gagcagaggc agccggcgtc 100
<210> 803
<211> 100
<212> DNA
<213> 智人
<400> 803
cctgtcccca gccacacaga cccccgggct gagacccagg cagggagggg tgacgttccc 60
agggagacgg tggccgggct gccctggccc cagtgctcca 100
<210> 804
<211> 100
<212> DNA
<213> 智人
<400> 804
agcacttgta gccacactaa agcgcaggcc tggtccccgg cacatgaaca gccagcgccc 60
agccccagcc caggctctgc ccacaacttc tccttcccgt 100
<210> 805
<211> 100
<212> DNA
<213> 智人
<400> 805
ccctgccctc ggcctgcttg ctacctgtgg agggtccctg acggggctga agcccagcgg 60
ggtccctgcc tgtccttggg ggctccagct ggccccaggg 100
<210> 806
<211> 100
<212> DNA
<213> 智人
<400> 806
ctaagtgaca gcagggctct ggcatgcagc ccatggcgga gaccccaggg atggcagctg 60
gtgtggcctc aggccagacc caggccggct gcagacccca 100
<210> 807
<211> 100
<212> DNA
<213> 智人
<400> 807
gatacctggc ctggtgcctg gacagagaag actgggaggg ggctgcagtg ggactcacct 60
gaggagacag tgaccagggt gccacggccc cagagatcga 100
<210> 808
<211> 100
<212> DNA
<213> 智人
<400> 808
agtaccagta gcacagcctc tgccctcctg cttctcccat acaaaaacac accctccgcc 60
ctcctgccga cctcctttgc tgagcacctg tccccaagtc 100
<210> 809
<211> 100
<212> DNA
<213> 智人
<400> 809
tgaagccaaa gcccttgcct ggcccagtac acctggctcc ccgctatccc cagacagcag 60
actcacctga ggagacggtg accagggtgc cctggcccca 100
<210> 810
<211> 100
<212> DNA
<213> 智人
<400> 810
gtgctggaag tattcagcca cggtgagtca gccctgagcc aggggctaca gaaacccaca 60
gcccggggtc ccgggggagc atggtttttg tagagctgcc 100
<210> 811
<211> 100
<212> DNA
<213> 智人
<400> 811
aatcactgtg tccccagtta gcacagtggt tctcagctca gccaaaaccc tgcggctggt 60
agggggcctg tggggctggg ggctgatgtg gctgcggtct 100
<210> 812
<211> 100
<212> DNA
<213> 智人
<400> 812
tgctgggtct gtcctctgtg ggaggggctg ctacccaggc ccaggactgc agtggagggc 60
tcactgaggg gcttttgggt ctggcctgag ccgctgtggg 100
<210> 813
<211> 100
<212> DNA
<213> 智人
<400> 813
gctctcaggt ctactgcggg gacactcggg tctgcccctg gcttaggtgg acagtgtccg 60
tgcccacctg tgccctgagg ctccatttca ggctgatatc 100
<210> 814
<211> 100
<212> DNA
<213> 智人
<400> 814
tgtctgtatt gtccctaccc gctgcatggc catgtccttt tgggtttata aattgccccc 60
aaatcacgca ggcatcattc aggcttttta tattccctgg 100
<210> 815
<211> 100
<212> DNA
<213> 智人
<400> 815
tattccctgg gccaccaggt gcctccaccc agaaagctga gatgtgggag gttctagagt 60
cattctgcaa ccctggatga gcccctgcag cctcagtgct 100
<210> 816
<211> 100
<212> DNA
<213> 智人
<400> 816
actgaggttc cagcaagacc tggagcaggt gcagatgagg cctgaggcca ggtgaagccc 60
aggccaggtg aggtccaggc cagtgaggcc caggtcagat 100
<210> 817
<211> 100
<212> DNA
<213> 智人
<400> 817
gaggcccagg tcaggtgaag cccaggtcag gtgaaaccca ggtcaggtga ggcccagatc 60
atgtgagctc aggacaggca aggtccaagt caggtgaggc 100
<210> 818
<211> 100
<212> DNA
<213> 智人
<400> 818
cgagctcagg tgaagcccag aggtgaggtc taggccaggt gaggtccagg ccaggtgagg 60
tccaggtcag gtgaggccca ggtcaggcaa ggctgaggta 100
<210> 819
<211> 100
<212> DNA
<213> 智人
<400> 819
tccaggtcag gtgaggccca ggtcaggcaa ggctgaggta gatgtatgag acttctgtaa 60
ttttcagttg gtgccaaccc tgcctggtgt ccctgcccct 100
<210> 820
<211> 100
<212> DNA
<213> 智人
<400> 820
cctcccagcc catgctctgt gcctgccaga tggcggcccc tgcacaggtg ctgctggctg 60
tggaggagct gggctctgcc tccctgtgca tgggcgtccc 100
<210> 821
<211> 100
<212> DNA
<213> 智人
<400> 821
gcctgcagcc tgtccgggga tgcccaggga ggtgagtgcc accacatatc aggccttttc 60
tctttaaagt catttctttg gggatacatc atcaatgtct 100
<210> 822
<211> 100
<212> DNA
<213> 智人
<400> 822
tctaaacaca gctgtgtgca ttttcctctt cttgcaattt agaattttaa ctgctgtttt 60
caaggtactg taatgtattt gttctcttct tgttaggaga 100
<210> 823
<211> 100
<212> DNA
<213> 智人
<400> 823
cttgccaacc ctgtgtgtct cagttcatac cctcttcctt ccccagtaga agtaacgacc 60
actgtgttta tgtgatcatc cttttcttga ttttccttat 100
<210> 824
<211> 100
<212> DNA
<213> 智人
<400> 824
tgtgatcatc cttttcttga ttttccttat agttttccta gtggaaagtt tatcccttaa 60
gaagatagtt cattttgccg gctgtaaatt ttatttagaa 100
<210> 825
<211> 100
<212> DNA
<213> 智人
<400> 825
ctgccatcgt ttatttgcct gttttccttc agatggctgt ttgcttcatt ctcagtttgg 60
ggctatgaca aacatatgtt ctgcacatct ttgcccatga 100
<210> 826
<211> 100
<212> DNA
<213> 智人
<400> 826
ggctctcagg gagggctctg gagctggcat tgcctgcagg gctctgcttt gttgcaggga 60
gttcctgcca aggcttttca gagtgtctgt gcccagcctg 100
<210> 827
<211> 100
<212> DNA
<213> 智人
<400> 827
aaggtacaca ctgtactttg cccttgcatc aggcactttc cttgtgcttg cttctgtgtg 60
gctccacatt ctggagaatt tattcagatc tgtgctgcaa 100
<210> 828
<211> 100
<212> DNA
<213> 智人
<400> 828
cttcccacac tgtcctcctg ggctcactcc cagccatcga tcttgaacac cagtttatgg 60
aactatctgc acaggaaagc agaaacagca aaaggccctg 100
<210> 829
<211> 100
<212> DNA
<213> 智人
<400> 829
ttgcgtggac cctgtttttg gtcaagggaa gtacttgctg gtgaaggaga cctcccctcc 60
tttctttctc aggagccccc tctgatgccg ttgcctggtg 100
<210> 830
<211> 100
<212> DNA
<213> 智人
<400> 830
tttctcaggg ctggtgctgg gggctcagca gtgtctgccc tgttccaggt gggaatgtgg 60
gtctgttctg tttccacgcg gtgttctggg gccgccagtg 100
<210> 831
<211> 100
<212> DNA
<213> 智人
<400> 831
cagcagtgtc tgccctgttc caggtgggaa tgtgggtctg ttctgtttcc acgcggtgtt 60
ctggggccgc cagtgagggg ctcgggatgt cagcggctgg 100
<210> 832
<211> 100
<212> DNA
<213> 智人
<400> 832
tctctgtccc tatggtctgg gctccggttc actgctcccc tgccctccag gtcggtcact 60
gactcagtta ctatccagcg ggctccgtgg ctgttcagtg 100
<210> 833
<211> 100
<212> DNA
<213> 智人
<400> 833
gggagcaaat ggagagggaa gtggcagcgg cccgagtgcc aggcggtccc ggtttggggt 60
tgatctttgt ggaacagctc cctggcccgt gtgtaagtgg 100
<210> 834
<211> 100
<212> DNA
<213> 智人
<400> 834
tcgggggagg cacggaggtc tggagctaca agcggtggca ggaaggcagg tcccagtctt 60
gggggtctgg agcttatctt cttcctgtga actgagtgtg 100
<210> 835
<211> 100
<212> DNA
<213> 智人
<400> 835
atggaggacc tgcctcggat gacaccccta tcttaagaag gtcatggtgg gttccagctg 60
ggaggaaggg aagtgggcca cctcctgggg gtcttccacc 100
<210> 836
<211> 100
<212> DNA
<213> 智人
<400> 836
gtcttccacc cccaccacct cagcctgggg cctctgtgat tcctctctgc acagacccca 60
aagtctgtgc tgccgcaggg caggaaggaa gggcctgtgg 100
<210> 837
<211> 100
<212> DNA
<213> 智人
<400> 837
tcgaggttgg ggccacagtg gtgttcccta agcccgagtc tggtctcatg gcccgccccg 60
cagcaggtcc tgagtgaggg acagagaccg gggcggggtc 100
<210> 838
<211> 100
<212> DNA
<213> 智人
<400> 838
tttggtcctg gtggactctg gggtggattc cagtggggag tcatcagggt cggtgtcccc 60
cagggtactg gggtgtctct gctcctggag tcggctctgg 100
<210> 839
<211> 100
<212> DNA
<213> 智人
<400> 839
cctgggtttt tgtacaggag gtgccctggg ctgtgtcttt gtggtctgtg tgcacagtaa 60
tatgtggctg tgtccacagg gtccatgttg gtcattgtaa 100
<210> 840
<211> 100
<212> DNA
<213> 智人
<400> 840
gtgtccttgg tgatggtgag cctgctcttc agagatgggc tgtagcgctt atcatcattc 60
caataaatga gtgcaagcca ctccagggcc tttcctgggg 100
<210> 841
<211> 100
<212> DNA
<213> 智人
<400> 841
gctgacggat ccagcccaca cccactccac tagtgctgag tgagaaccca gagaaggtgc 60
aggtcagcgt gagggtctgt gtgggtttca ccagcgtagg 100
<210> 842
<211> 100
<212> DNA
<213> 智人
<400> 842
ctgtggagaa agcataagaa gatgaagccc acaaacaaga aaactgatgt ttcacccgtg 60
aaggagtccc tgaccacagc actcacatga agggatggtc 100
<210> 843
<211> 100
<212> DNA
<213> 智人
<400> 843
agcagcagga gcgtggagca aagtgtgtcc atggtggggc acaggagtca ctgagctggg 60
acctgtgctc ggctttttca acccagagga gggtggagct 100
<210> 844
<211> 100
<212> DNA
<213> 智人
<400> 844
aagtgtgtcc atggtggggc acaggagtca ctgagctggg acctgtgctc ggctttttca 60
acccagagga gggtggagct ggtggagatt tgcattcccc 100
<210> 845
<211> 100
<212> DNA
<213> 智人
<400> 845
agatttgcat tcccctcatc tgtgccctac tctatgggat ggagtcaggt ttcaggactc 60
aggagggtgt tgcatctgtg gtgaggacca gtgatagtaa 100
<210> 846
<211> 100
<212> DNA
<213> 智人
<400> 846
catgatcagt gtaattcaga tggcattaat ctaaggctgg gcaagtagat tctgagtaga 60
agtctttgca gaagtcatga ttatgaggtc atgttggtct 100
<210> 847
<211> 100
<212> DNA
<213> 智人
<400> 847
gcccttcaca gagtccacat agtatttctc acttccatct tgctttatgt tggccaccca 60
ctccagcccc ttccctggag cctggcggac ccagctcatc 100
<210> 848
<211> 100
<212> DNA
<213> 智人
<400> 848
tgagtcctct gtgctcagtg ctgatcacca agtggaaagg ccttggagtc cagggctaag 60
gctcctctct gagacctgca gggtcagggt tgggttggtt 100
<210> 849
<211> 100
<212> DNA
<213> 智人
<400> 849
ttcatcagta gagggagggc cctatttgca tgtctcctac tatataagaa gctctagtgg 60
gatgctggag gaataggctg tacccatata agaagacggt 100
<210> 850
<211> 100
<212> DNA
<213> 智人
<400> 850
agggccctat ttgcatgtct cctactatat aagaagctct agtgggatgc tggaggaata 60
ggctgtaccc atataagaag acggtgctct gcagaagttt 100
<210> 851
<211> 100
<212> DNA
<213> 智人
<400> 851
gctgacaatg atggtatttg gaaaatatgc tgtcttatga aattgtgctg tgataaacac 60
tttgccctga tcaccctatt acatttttta aaaaatgtgt 100
<210> 852
<211> 100
<212> DNA
<213> 智人
<400> 852
caaacacaga gacaacctag tcagaaactg ccacatatat tcactgctta tctcactcac 60
gtccactcaa tgtctctagt tctccataaa tcacctttta 100
<210> 853
<211> 100
<212> DNA
<213> 智人
<400> 853
taatagcaac aaggaaaacc cagctcagcc caaactccat ggtgagtcct ctgtgttcag 60
tgctgatcac cgaatggaaa ctcctgggaa ttctggggct 100
<210> 854
<211> 100
<212> DNA
<213> 智人
<400> 854
gtcctctgtg ttcagtgctg atcaccgaat ggaaactcct gggaattctg gggctggggc 60
tcttctccca gagctgcagg gtctgggctc ggctggtttt 100
<210> 855
<211> 100
<212> DNA
<213> 智人
<400> 855
tatcagcaga gggagggccc tatttgcatg tctcctacta tatagcaagc tctagtggga 60
cgctggagga gagggcagtg cccagagcag atgagagggt 100
<210> 856
<211> 100
<212> DNA
<213> 智人
<400> 856
cccggaaaac actggaggta atcctatctc tcaggaaaat ataacttcag attatgtgat 60
tgtgacttga tgatcaatta gcagtcatca tcttatttaa 100
<210> 857
<211> 100
<212> DNA
<213> 智人
<400> 857
tgtttacata tttgcagaat atattcagtg caagtgtcaa tgttacattt ttagagaaga 60
tgaattacat acataacaga gcagttgtgc aatgtgtcca 100
<210> 858
<211> 100
<212> DNA
<213> 智人
<400> 858
actcacactt aatctctcta gttctccata aatcaccttt taaaatagca gcaaggaaaa 60
tccagctcag cccaaactcc atggtgagtc ctctgtgttc 100
<210> 859
<211> 100
<212> DNA
<213> 智人
<400> 859
gatgctattt aatagcccaa ttcctgaccc aggatgagaa agagcaaata catgacacat 60
ggacgacaca attgtagaag ctgagggttc aagccgtaat 100
<210> 860
<211> 100
<212> DNA
<213> 智人
<400> 860
cctgttagag gccacgcatc ccctacccat ccctgaactc tgtgttgaca gagcttcccc 60
cactggagaa caagctcccc caggacacgc acctcactta 100
<210> 861
<211> 100
<212> DNA
<213> 智人
<400> 861
ggcccttcac ggagtctgcg tagtatgtgc taccaccact accactaata gctgagaccc 60
actccagccc cttccctgga gcctggcgga cccagctcat 100
<210> 862
<211> 100
<212> DNA
<213> 智人
<400> 862
ggcatagctg ctaaaggtga atccagaggc tgcacaggag agtctcaggg accccccagg 60
ctgtaccaag cctcccccag actccaacag ctgcacctca 100
<210> 863
<211> 100
<212> DNA
<213> 智人
<400> 863
actgtttctc tcactcttat ccattcacac tcaatttttc tatttctcca tgaattacct 60
tttaaaatag ccacaagaaa aagccagctc agcccaaact 100
<210> 864
<211> 100
<212> DNA
<213> 智人
<400> 864
ccatggtgag ttctctctgt tcagtcctga tcaccaaatg aaaacacctg aaaatcccag 60
ggctgggctc ctctctcaga gctgcagggt cagggctggg 100
<210> 865
<211> 100
<212> DNA
<213> 智人
<400> 865
tttgcatatc tcctactata tagtaagctc tggggtgaga ggcctttgga gatagtgggg 60
ctcagagcat gtcagaatgt cctcggggag atctgtgata 100
<210> 866
<211> 100
<212> DNA
<213> 智人
<400> 866
ttgaaagcat tgggaaattg tgctttccta ttgtcagttt gttttgtgat aaacttaaac 60
cttaaaacct aaaaatctta taattttgta atttttattt 100
<210> 867
<211> 100
<212> DNA
<213> 智人
<400> 867
gaggtaccat agatctacat aaactgcata tttttaaagt tagcaccaat catcttttat 60
ttttacatac gcagagaaac catggtatat agtatcaata 100
<210> 868
<211> 100
<212> DNA
<213> 智人
<400> 868
ttatttccat gttaaagatg aaaaattatc agcaaaagca caggtgggtt ttacaatgtc 60
cccagtgctc acttttggtc agagtgagcc tgggcatctg 100
<210> 869
<211> 100
<212> DNA
<213> 智人
<400> 869
tcctacataa tgacagtgta cacatctttc cattgctgtt ttactcaatt actcaaccca 60
ttttctaaac agatttaaac ttcataaatc ctgtcatctc 100
<210> 870
<211> 100
<212> DNA
<213> 智人
<400> 870
ctcagcctca gcacagctgc ctcattcctc agggtttctg acgctctcag gatgtgggtt 60
ttcacactgt gtctgttgca cagtaataca cggccgtgtc 100
<210> 871
<211> 100
<212> DNA
<213> 智人
<400> 871
gctcagctcc atgtaggctg tgtctgtaga tgtgtcctcg gtcatggtga ctctgccctg 60
gaacttctgt gcgtagattg tttcaccatc ttcaggatca 100
<210> 872
<211> 100
<212> DNA
<213> 智人
<400> 872
ttcaggatca aaacctccca tccactcaag cccttttcca ggagcctgtc gcacccagtg 60
catggataat tcagtgaggg tgtatccgga aaccttgcag 100
<210> 873
<211> 100
<212> DNA
<213> 智人
<400> 873
gagaccttca ctgaggcccc aggcttcttc acctcagccc cagactgtac cagctggacc 60
tgggcgtggg tgcctgtgga gaggacagag gagtggatga 100
<210> 874
<211> 100
<212> DNA
<213> 智人
<400> 874
gacaccactt aactggaccc agtcccctca tcagccctgg aactcaggat tctcttgcct 60
gtagctgctg ccaccaagaa gaggatcctc caggtgcagt 100
<210> 875
<211> 100
<212> DNA
<213> 智人
<400> 875
gagggtggga atctgggaga gcaaggggct tcccataagt gttctgataa aaatcctctt 60
tgtttagggg gaaagtgatg atttttttga atgatagaga 100
<210> 876
<211> 100
<212> DNA
<213> 智人
<400> 876
atacatcacc caaacattta aaaatgtatt gtgtaaagaa gtgtaaatgg catctcagcc 60
atttacacac tgcaagacac acagcttatt agtgtgcctg 100
<210> 877
<211> 100
<212> DNA
<213> 智人
<400> 877
tggtgaatcg gcccttcacg gagtctgcat agtatttatt acttccatca tatgatataa 60
ctgccaccca ctccagcccc ttgcctggag cctggcggac 100
<210> 878
<211> 100
<212> DNA
<213> 智人
<400> 878
acaatcactt gagttcagac acaccaggat tcacttaatg ttatttttag ttcagaacct 60
ctatcaggtt tagagggaat cgctctgtcc cagggagtgg 100
<210> 879
<211> 100
<212> DNA
<213> 智人
<400> 879
atcttacaat agcaaaacgg tcttagaaaa cccaacataa tctacagcga gacctcagca 60
tggcaagcaa ggaatcacta aagccaccag ggagatccgg 100
<210> 880
<211> 100
<212> DNA
<213> 智人
<400> 880
cactaaagcc accagggaga tccggatgca ctgatacgat ccagaaacat agcgagtccg 60
ggaactgatg cggactttga ggcagcctct tttttttttt 100
<210> 881
<211> 100
<212> DNA
<213> 智人
<400> 881
gatggtgaat cggcccttca cggagtctgc atagtattta ttacttccat cataccatat 60
aactgccacc cactccagcc ccttgcctgg agcctggcgg 100
<210> 882
<211> 100
<212> DNA
<213> 智人
<400> 882
acccagtgca tgccatagct actgaaggtg aatccagacg ctgcacagga gagtctcagg 60
gacctcccag gctggaccac gcctccccca gactccacca 100
<210> 883
<211> 100
<212> DNA
<213> 智人
<400> 883
ctcgactctt gagggacggg ttgtagttgg tgcttccact atgattgatt tccccaatcc 60
actccagccc cttccctggg ggctggcgga tccagctcca 100
<210> 884
<211> 100
<212> DNA
<213> 智人
<400> 884
ggctggcgga tccagctcca gtagtaacca ctgaaggacc caccatagac agcgcaggtg 60
agggacaggg tctccgaagg cttcaacagt cctgcgcccc 100
<210> 885
<211> 100
<212> DNA
<213> 智人
<400> 885
actgctgtag ctgcacctgg gacaggaccc ctgtgaacag agaaacccac agtgagccct 60
gggatcagag gcagcatctc atatcttcat atccgcattc 100
<210> 886
<211> 100
<212> DNA
<213> 智人
<400> 886
ctgagacact cacatctggg agctgccacc aggaggagga agaaccacag gtgtttcatg 60
ttcttgtgca ggaggtccat gactctcaga aagcacttcc 100
<210> 887
<211> 100
<212> DNA
<213> 智人
<400> 887
gaggatttgc atgtgggtgg tgcctttgta tggataggta aaaagggatg agggaggccc 60
cagtcttttg ggctcaccct gggaggtgta tgctggctgt 100
<210> 888
<211> 100
<212> DNA
<213> 智人
<400> 888
agttctcttc ctgtggcctc ccctcaccaa acccagagtc ctcttcttcc aggtaggaaa 60
tgtgctgaag gagctggtct gggagacaag tgtgatcatg 100
<210> 889
<211> 100
<212> DNA
<213> 智人
<400> 889
ggtctgggag acaagtgtga tcatggatca aagacagatt ttggaataca gttaatactg 60
ttctacattt aaagattcat ataacaccaa ccatacaccc 100
<210> 890
<211> 100
<212> DNA
<213> 智人
<400> 890
aggtcaccta aattgtcatt taccccttca gacatattga aacagctgct gagtgtaata 60
atcacagtga attgagacaa acctggatcc atgcaatgtg 100
<210> 891
<211> 100
<212> DNA
<213> 智人
<400> 891
tactgtagtt cagaacatcc atcatggtta gaaggatgct acctgtccca ggaagtgggt 60
tatttttaaa tagtacctga gagctgccct tctgagacct 100
<210> 892
<211> 100
<212> DNA
<213> 智人
<400> 892
tttgaaattt gagattgtgt gtgagatctc aggagaaggt agtagaatat atctccatcc 60
ttctcaatgt gtaaccctga gaatatggcc tgacctctaa 100
<210> 893
<211> 100
<212> DNA
<213> 智人
<400> 893
acatttctgt gtgaaaagat gtacattggg gatagcagtg acagcttcag atgaaaactc 60
tatagtacat cagcactgga ggatagtctc atcaccaaga 100
<210> 894
<211> 100
<212> DNA
<213> 智人
<400> 894
ttagtgaaat tacctttcct gggaaccaga gaggacctct gtgagctcta ccctctgaga 60
gaacaaggaa ctctggttct tccctgacag gtcacacctg 100
<210> 895
<211> 100
<212> DNA
<213> 智人
<400> 895
aacaagtggg ctggccttct atgagacgac agagggaaag agacagactc aatatccaga 60
gcgaggtgag ctccttacct acctaccagg tggtctctgg 100
<210> 896
<211> 100
<212> DNA
<213> 智人
<400> 896
gccatttgtt tgagcagacc cagaagtacc ttcctcaccc tcaggagaat tatgaacatt 60
gagagaaact gagatacttt ttttatttac agggaatatt 100
<210> 897
<211> 100
<212> DNA
<213> 智人
<400> 897
tcatcggcgt gtttacatct acctgggtgt gtacagggat gctaggatgt gctcatacac 60
agaagagcaa gaattatatt tcgtggaaag aaaaccaaag 100
<210> 898
<211> 100
<212> DNA
<213> 智人
<400> 898
agcttctgaa tttgtaggta ttgtttgctg caaatgtgtc aggtcactag atcatgttat 60
gctgctagaa gaaaaacttc ccaacattgt catggagaca 100
<210> 899
<211> 100
<212> DNA
<213> 智人
<400> 899
aaatgcaaaa cagtaaagat tcaactgaga ttcccttgaa aatcaccagt aatgaacagg 60
ccaaaagaaa tcaaccattg tggaaagagt ggtcattaag 100
<210> 900
<211> 100
<212> DNA
<213> 智人
<400> 900
cccagtgtca ccttacacat cctgcaggtc acctcacaca tccaccaggt caccgcacat 60
ataccccaca tcacctcaga cacaccctgg tcacctcata 100
<210> 901
<211> 100
<212> DNA
<213> 智人
<400> 901
catacgtcag gtcacctcac gctcacccaa ggtcacctca cacatcccgc aggtcacctc 60
gtaaatcccc caggtcacca catacatgca ccagttcacc 100
<210> 902
<211> 100
<212> DNA
<213> 智人
<400> 902
ctcttgaggg acgggttgta gtaggtgctc ccactataat agatactccc aatccactcc 60
agccccttcc ctgggggctg gcggatccag ccccagtagt 100
<210> 903
<211> 100
<212> DNA
<213> 智人
<400> 903
aactactact gctgatggag ccaccagaga cagtgcaggt gagggacagg gtctccgaag 60
gcttcaccag tcctgggccc gactcctgca gctgcagctg 100
<210> 904
<211> 100
<212> DNA
<213> 智人
<400> 904
gaacagaaaa acccacagtg agccctggga tcagaggcag cctcccatat ctccatgtct 60
gcatcctaga aacactcaca tctgggagcc gccaccagca 100
<210> 905
<211> 100
<212> DNA
<213> 智人
<400> 905
ggaggaagaa ccacaggtgc ttcattttct tgcacatgag atccatgact ctcagaaagc 60
atttccctta tgagttggac ctgaatttaa ggaaatgtgt 100
<210> 906
<211> 100
<212> DNA
<213> 智人
<400> 906
ggtggcttcc tgtgggcgcc taagtgagga tttgcatggg ggtggtgcgt ttgtacggag 60
cagtgaaaag ggatgagaga ggcgccagtc ttttgagctc 100
<210> 907
<211> 100
<212> DNA
<213> 智人
<400> 907
accctgggag gagaatgctg gctgtgccct ttgagaactc agttctcttc ttgggcctcc 60
cctctccaag cccagagtcc tcttcttcca ggtaaagaga 100
<210> 908
<211> 100
<212> DNA
<213> 智人
<400> 908
tgtgctgaag gagctggtct gagagatgag tgtgatcctg gatcaaggac agattttgga 60
atagggtcag tactgttcaa cccttaaaga ttcatataaa 100
<210> 909
<211> 100
<212> DNA
<213> 智人
<400> 909
acccaccaca cacccaggcc atctaaatag tcatttaccc tttcagacac attgaaacaa 60
cagctgaatg taataatgac agtgacttca aacaatactg 100
<210> 910
<211> 100
<212> DNA
<213> 智人
<400> 910
atgtttattg tagttcagaa catccaccat ggttacaggg aagctcactg tccctggaag 60
tgggtcattt tttaaaagca cctgagagct gtccttctgt 100
<210> 911
<211> 100
<212> DNA
<213> 智人
<400> 911
aaggtagtgg gacatatctc catacttctc aatgtgtgac cttgaagatg tgtcctgccc 60
tctaaacact tctgattgaa aatatgtaga ttggggatta 100
<210> 912
<211> 100
<212> DNA
<213> 智人
<400> 912
gtggaaatgc cttggaatcc agggctaagg cacctctctg agagctgcag ggtcagggtt 60
gggttggttt tcatcagtag agggagggcc ctatttgcat 100
<210> 913
<211> 100
<212> DNA
<213> 智人
<400> 913
ggacccttga ggagtaggct gtacccagat aagacgacgg tgccctgtag aagtttgctg 60
gcaatgattg catttggaaa atatgctgtc ttattatgaa 100
<210> 914
<211> 100
<212> DNA
<213> 智人
<400> 914
attgtgctgt gataaacact ttgcactaat caccctattt cattttaaat attcatgtaa 60
actatgttct gtaggagaca atattttctc catttacaga 100
<210> 915
<211> 100
<212> DNA
<213> 智人
<400> 915
acactttgca ctaatcaccc tatttcattt taaatattca tgtaaactat gttctgtagg 60
agacaatatt ttctccattt acagaagtgg aagtaaaccc 100
<210> 916
<211> 100
<212> DNA
<213> 智人
<400> 916
ctgtatgcat ctaggagctc atgtctggga tgagtgaacc ccggtatctg gccctgtgct 60
cttcatcact gtctctgaca tccccctaaa ccaactccag 100
<210> 917
<211> 100
<212> DNA
<213> 智人
<400> 917
gacaaagctg gatgtgtcta gtgtttttat cagaacccac tttccgtaat aagagcatgt 60
gtggttttgc tgccctccag cactcttctg aaaatatgga 100
<210> 918
<211> 100
<212> DNA
<213> 智人
<400> 918
gagaactagg atccaggcac attaattttc aggtacttct gacattgaac ttattttttc 60
tatctttcta ttactctttc cttgtctaag tttccatttg 100
<210> 919
<211> 100
<212> DNA
<213> 智人
<400> 919
agagagaccc acagtgagcc ctgggatcag aggcacctcc catatcccca tgtctggatc 60
cctgagatac tcacatctgg gagctgccac caggagaagg 100
<210> 920
<211> 100
<212> DNA
<213> 智人
<400> 920
aagaaccaca gatgtttcat gttcttgcac aggaggtcca ggactctcag aaagtatttc 60
ccatgtgagc tggaacctga atttaaggaa atgtgtggtg 100
<210> 921
<211> 100
<212> DNA
<213> 智人
<400> 921
atttgcatgt gggtggtgcc tttgtatgga gaggtgaaaa aggaggaggg aggccccagt 60
cttttgggct cgccctggga gtaggatgct ggctgtgccc 100
<210> 922
<211> 100
<212> DNA
<213> 智人
<400> 922
tttgagaact cagttgtctt cttggggtct cccctctcca agcccagagt cctcttcttt 60
caggtaaaga gacgtgctga aggacctggt ctgggagatg 100
<210> 923
<211> 100
<212> DNA
<213> 智人
<400> 923
ctgacagtgg tgaccatggt tgagaacttt tcatctcctc tgtgaggatc aatctgcatt 60
ttctgcatag gagaataggt tttcatatta aaacaatcat 100
<210> 924
<211> 100
<212> DNA
<213> 智人
<400> 924
tttaaaaata tgtagaaatg accctagtaa tcacagaatt ccgaacttag gttcagtaga 60
gaaactttaa gaagatgaag tcccacatcg tgacaggaaa 100
<210> 925
<211> 100
<212> DNA
<213> 智人
<400> 925
tggagatggt gaatctgccc ttcacagagt ctgcataata tgtgctaccc ccattactac 60
taatagctga aacatattcc agtcccttcc ctggagcctg 100
<210> 926
<211> 100
<212> DNA
<213> 智人
<400> 926
gcggacccag tgcatagcat agctactgaa ggtgaatcca gaggctgcac aggagagtct 60
cagggacccc ccaggctgga ccaagccttc cccagactcc 100
<210> 927
<211> 100
<212> DNA
<213> 智人
<400> 927
ttctctcact catgtccact cacactcaat atctctattt cctcatgaat cacctttaaa 60
aatagcaaca aggaaaaccc agctcagccc aaactccatc 100
<210> 928
<211> 100
<212> DNA
<213> 智人
<400> 928
atgactcttc tgtgttcagt gctgatcacc aaatgaaaac acctgggaat cccagggcgg 60
gggctcctct cccagagctg cggagtcagg gctgggctgg 100
<210> 929
<211> 100
<212> DNA
<213> 智人
<400> 929
tagggcacat ccttcccatc cactcaagcc cttgtgcatg ggcctggcgc acctagtgca 60
tagagtaact ggtgaaggta ggtgtatcca caagtcttgc 100
<210> 930
<211> 100
<212> DNA
<213> 智人
<400> 930
aggagacttt cactgatgcc ccagccttct tcatctcatc cccagactgc accagctgca 60
cctgggactg ggcacctgtg gagaggacac gggagtggat 100
<210> 931
<211> 100
<212> DNA
<213> 智人
<400> 931
gaaaacttgt tcacagtagc accttcatgg aatgtttgta tcaacgttat agagtgtggc 60
cttttccact ctgtgaattt ggcttatatt acgactcttg 100
<210> 932
<211> 100
<212> DNA
<213> 智人
<400> 932
aatggaatat ttatcttaaa attagagtat gtacttgttt ctactgttct ttttttctca 60
aatatataac ccattttgta aacagcctta aacctaataa 100
<210> 933
<211> 100
<212> DNA
<213> 智人
<400> 933
ctgctcagct ccatgtaggc tgtgctcgtg gatttgtccg cggtaatcgt gactctgccc 60
tggaacttct gtgcgtagtt tgctgtacca aagataggga 100
<210> 934
<211> 100
<212> DNA
<213> 智人
<400> 934
tgatccctcc catccactca agcccttgtc caggggcctg tcgcacccag ctgatagcat 60
agctgctgaa ggtgcctcca gaagccttgc aggagacctt 100
<210> 935
<211> 100
<212> DNA
<213> 智人
<400> 935
caccgaggac ccaggcttct tcacctcagc cccagactgc accagctgca cctgggactg 60
gacacctgtg gagaggacac aggggtgaat aaaatcctct 100
<210> 936
<211> 100
<212> DNA
<213> 智人
<400> 936
cctgggactg gacacctgtg gagaggacac aggggtgaat aaaatcctct ttaactaaac 60
caggatccct tcctcagcct taggactagg aagcccctta 100
<210> 937
<211> 100
<212> DNA
<213> 智人
<400> 937
cctgtagctg ctgccaccac aaagaggaac ctccaggtcc agtccatggt gatgagctgt 60
gctcccaggg gcttcttcag aggaggaatg tggttgttat 100
<210> 938
<211> 100
<212> DNA
<213> 智人
<400> 938
gtgatgctct cagggcacca atatatctat atttatctca gaagacctca ggttatttgc 60
atatgcatga ggcagggtat ttcacagctc aaagcctgat 100
<210> 939
<211> 100
<212> DNA
<213> 智人
<400> 939
tttgcatatg catgaggcag ggtatttcac agctcaaagc ctgatctagg atgagaaaga 60
aaacacagat gccacatcag ctgtacaagt gtgggatgct 100
<210> 940
<211> 100
<212> DNA
<213> 智人
<400> 940
cagaacaaac cccaacccca ggatgcactc ctcactgtga acccacattt tattggccta 60
aagattacct gggttttttg tgggaccatt gctgtctctg 100
<210> 941
<211> 100
<212> DNA
<213> 智人
<400> 941
acattgagca ggcacctaga cccatcctgg tcccattagg aacactcaga gctcactggt 60
aacactgaaa aggtggccac tcgttaccct acatgagtgt 100
<210> 942
<211> 100
<212> DNA
<213> 智人
<400> 942
ccagcaggac ccatggagag ttctgagatc tgctgggcac tcccaagaca gggtccccag 60
cactttcctg agggtcctga cctcccaggt ccttcagtgg 100
<210> 943
<211> 100
<212> DNA
<213> 智人
<400> 943
ttatccattt ctatgtgttc ttttgaaaat gtctactcat gtcctttgct cattttaacg 60
gagttatttg gttcttgttg ctgttgttgt tgtagagttg 100
<210> 944
<211> 100
<212> DNA
<213> 智人
<400> 944
ttgcaaattc ttcatattag ttccctgtca caggcaaagt gtgcaaaagt tttctgtcat 60
tctgtaaatt gcgtattcac tctgttgttg tgaaaaaaat 100
<210> 945
<211> 100
<212> DNA
<213> 智人
<400> 945
tatttaggtt aattaaatct catctgtcta ttttttttta ggtagcagga cctttcatgc 60
tgaatctttg tcaaacagga tacagcttct gcttgcatga 100
<210> 946
<211> 100
<212> DNA
<213> 智人
<400> 946
accactaaca ggggacatgc catttattag taaagaaaaa ggaggaaaac aaggctctga 60
gtcagatggg gatgggaaac gcacgccctg ggcaggaaat 100
<210> 947
<211> 100
<212> DNA
<213> 智人
<400> 947
ggcatctcag ccacactatc ctgttctgca gaagtgggga gggagcacca ctgaaaaaca 60
cctgggttct tgtacaggaa gcgccctggg ctgtgtctct 100
<210> 948
<211> 100
<212> DNA
<213> 智人
<400> 948
gtggtatccg tgcacaataa tacgtggctg tgtccacagg gtccatgttg gtcattgtaa 60
ggaccacctg gtttttggag gtgtccttgg agatggtgag 100
<210> 949
<211> 100
<212> DNA
<213> 智人
<400> 949
acctggtttt tggaggtgtc cttggagatg gtgagcctgg tcttcagaga tgtgctgtag 60
tatttatcat catcccaatc aatgagtgca agccactcca 100
<210> 950
<211> 100
<212> DNA
<213> 智人
<400> 950
gggccttccc tgggggctga cggatccagc tcacacacat tccactagtg ctgagtgaga 60
acccagagaa ggtgcaggtc agtgtgaggg tctgtgtggg 100
<210> 951
<211> 100
<212> DNA
<213> 智人
<400> 951
tttcaccagc gcaggaccag actccctcaa ggtgacctgg gataagaccc ctgtggagaa 60
gacataagaa gatgaagccc acaaaggaga gaatagattt 100
<210> 952
<211> 100
<212> DNA
<213> 智人
<400> 952
ctgtggagaa gacataagaa gatgaagccc acaaaggaga gaatagattt tttgcttctg 60
aagtactacc tgaccacagc actcacagga cgggacagtc 100
<210> 953
<211> 100
<212> DNA
<213> 智人
<400> 953
agtagcagga gcgtggaaca aagtatgtcc atggtggaga gcaggattca ctgagcgagg 60
ccctgtcctc gtcttttgaa cccaggggag ggtggagctg 100
<210> 954
<211> 100
<212> DNA
<213> 智人
<400> 954
gtggagattt gcatcccctc atctgagccc tactctatgg ggtgcactca ggtctcagga 60
ctcagtaggg gagtgcatct gtggtgagga gcagtgagcc 100
<210> 955
<211> 100
<212> DNA
<213> 智人
<400> 955
tactctatgg ggtgcactca ggtctcagga ctcagtaggg gagtgcatct gtggtgagga 60
gcagtgagcc ctcaggtgtg ggggtccacg tgtgctctcc 100
<210> 956
<211> 100
<212> DNA
<213> 智人
<400> 956
atcagggaat ctatctcatt tcagcaccat ggctctcagt caagtcttga cgctcctgct 60
tctacagaca ggatcttctt cgatgctccc gcaccggaca 100
<210> 957
<211> 100
<212> DNA
<213> 智人
<400> 957
tgcaaccttc tggttttagt cctagaggat tagagtagaa atcaagagag ctgccgttcc 60
tcctcccttc aagaataatg atggtgggca tctggggggc 100
<210> 958
<211> 100
<212> DNA
<213> 智人
<400> 958
aaggggctcc ccacaagcat tctgatcaaa atcctctttg attatgggga aaagtgatga 60
atttgtgtaa aaaaattgga gagaataaat aagaaaatac 100
<210> 959
<211> 100
<212> DNA
<213> 智人
<400> 959
agttacaagt aattatgtaa agaagtgtgt gcttagcagt gtgtgtgcac acagctgcat 60
tcctagaggc atgttccatg aaaaatcgat gttgtccttg 100
<210> 960
<211> 100
<212> DNA
<213> 智人
<400> 960
tgccccgtca gttctgtgga gagagtagac tgcatgaatg acttcccttt tctcagccca 60
tgaatgagcg gatgctttgg acaagggaat tggaagactc 100
<210> 961
<211> 100
<212> DNA
<213> 智人
<400> 961
ctgagggagc agcaggctga ctgttgcagc cttgctctgc acctgcactg gatgtggtct 60
ctgtgctcat aaggccgtgg aaactcatca atccaggttc 100
<210> 962
<211> 100
<212> DNA
<213> 智人
<400> 962
caaaaagggg ttaaatgatt ttggaaaagt aagtagaaaa taaaagaagg agggagtaag 60
agcggacaga agggaggaag gcaagcaagc aatgatgaac 100
<210> 963
<211> 100
<212> DNA
<213> 智人
<400> 963
tgtgtaaaat tttcactaat taaaagacta ttatattgaa gaggtgccta ttaggcagcc 60
ttttgatgtt aaccatgtaa tatacaccat gaacaacctt 100
<210> 964
<211> 100
<212> DNA
<213> 智人
<400> 964
gaacaacctt gtagaacaca caagagcccc ctcagagaac tggatgggtc aggtctccca 60
tccagttgcc ttaggggtta ggaacgctcc catgttgttc 100
<210> 965
<211> 100
<212> DNA
<213> 智人
<400> 965
tctggttttt gctcctgagg acacaaacag ccagtgtttc ctccccggat gaatagagag 60
gcccctgggg agggtgtgtc tggcagctca ctctgcacct 100
<210> 966
<211> 100
<212> DNA
<213> 智人
<400> 966
gtttcctccc cggatgaata gagaggcccc tggggagggt gtgtctggca gctcactctg 60
cacctgcacc gcggaaggtt ttagatggtc cctctcacac 100
<210> 967
<211> 100
<212> DNA
<213> 智人
<400> 967
aataatacat ggcggcgtcc gaggccttca ggctgctcca ctgcaggtag gcggtgctgc 60
tggagctgtc ggctgagatg gtgacgtggc cttggaagga 100
<210> 968
<211> 100
<212> DNA
<213> 智人
<400> 968
tgggctgtat ctggtatcag agttcccagg atagatgctc cccatccact ccagttcttt 60
cccgggcatc tggcgcaccc agtggatcca gtagctggta 100
<210> 969
<211> 100
<212> DNA
<213> 智人
<400> 969
acaggagatc ctcagagact ccccgggtct tttcacctct gctgcagact gcaacagctg 60
cacctcggca aagacacctg tgtgggagac acaaaatttg 100
<210> 970
<211> 100
<212> DNA
<213> 智人
<400> 970
gtgtctggag tatgaaccat gtatcagcac cgaaaggttc tagaagtcag actttcgggc 60
agtgtgtcac taactctcag catgctggcc tggctcggcc 100
<210> 971
<211> 100
<212> DNA
<213> 智人
<400> 971
cacagcaagg tcttctcgcc tccctttggg taaatactga ggggtgcctc tgcaggacgg 60
gacctctgcc agactccact ccatacccag agaagcaggg 100
<210> 972
<211> 100
<212> DNA
<213> 智人
<400> 972
aaaccaaaat tggagtcagc cttgaggtgt agctgttgag ccctcagcag ctggggagag 60
ctggcggatg ctgccctccc cccagtttcc taatggtgtt 100
<210> 973
<211> 100
<212> DNA
<213> 智人
<400> 973
gtttaaaaag ggtcagggga cgggggaaca gatggtggga agagcacagt gcagacacct 60
ggcaccggct ctgaaggcag catggcagct acaccgttgg 100
<210> 974
<211> 100
<212> DNA
<213> 智人
<400> 974
ctgggaaggg tgtgcccctg aagaagtcgt ttacattctc gagtcaattt tcctggagtg 60
tacaatggac ctgtgggaaa gcctgtatga aagggtaatg 100
<210> 975
<211> 100
<212> DNA
<213> 智人
<400> 975
atgagggacc tagcacagtg tccaatattt tataggaact ggaattgagc tcataggagc 60
tcaattttat tggcattgct gttgttggat ggttaaaggg 100
<210> 976
<211> 100
<212> DNA
<213> 智人
<400> 976
gtggtatccc ttttctcaga ctcccctgaa atgtatggtt tgctttgaac ccagagactg 60
atgacaggtc tgccggtgtg gttgggtgca gccttaagtt 100
<210> 977
<211> 100
<212> DNA
<213> 智人
<400> 977
gctacgggaa agtgttggag ggggagaagt cagaggtaac cttgccccct ccctcaattc 60
cagatgagga aattcaggcc tgaaaaggga aagtgaccac 100
<210> 978
<211> 100
<212> DNA
<213> 智人
<400> 978
ctcaaagtct catgccttgg aggacccagc aggaatccaa gacctctgaa aaggaccggc 60
agggctcttg ccacggctgg gggtgtggtc atggtaacac 100
<210> 979
<211> 100
<212> DNA
<213> 智人
<400> 979
aggttttcca tccatggaag gtacctgagg gattttctct tcctccctag ggccagcatc 60
agaggagtga atagctcagt tagctcatct caggggccat 100
<210> 980
<211> 100
<212> DNA
<213> 智人
<400> 980
gtgccctcgg aggtggtttg ccactttcac ggttggactg agttggagag aaacagagac 60
ccacccaggg gtggggacaa gctccctgca actcaggact 100
<210> 981
<211> 100
<212> DNA
<213> 智人
<400> 981
tgcagatcac ttgcccaagt ggctccctag ctcctggctc ctggcccggg gcctgggact 60
ctccccgaag tggggctggc cactgtgagg aaccgactgg 100
<210> 982
<211> 100
<212> DNA
<213> 智人
<400> 982
aggcagggac ctcttggatg ccccaggcag ttgggatgcc acttctgata aagcacgtgg 60
tggccacagt aggtgcttgg ttgctccaca gcctggcccg 100
<210> 983
<211> 100
<212> DNA
<213> 智人
<400> 983
agctcagcgc tgcagaaaga aagtgaaagg gaaaaagaac tgcggggagg cggggaggta 60
ggatgaccag cggacgagct gccacagact tgccgcggcc 100
<210> 984
<211> 100
<212> DNA
<213> 智人
<400> 984
ccagagctgg cgggagggag aggccaccag cagcgcgcgc gggagcccgg ggaacagcgg 60
taggtgacca aagtctcctc tgtaacccct aaggtcgggc 100
<210> 985
<211> 100
<212> DNA
<213> 智人
<400> 985
tgagaatcga ggctccgaga ctgtcagcta cttgctcaag gtcacacagc aagtctggga 60
ggatgggggg atggaatatg caaaatgtag ggccgggaaa 100
<210> 986
<211> 100
<212> DNA
<213> 智人
<400> 986
cacctcgttt ccagcatccc cgcaacgact ctgcgcggga accaggagcc gggaacccgg 60
agcttggctt gctgtgccca gagctccggg gccgtgggcg 100
<210> 987
<211> 100
<212> DNA
<213> 智人
<400> 987
ggtggcagga aagcctggcg gcagcttctg cagagaagcc ggagcgcaga ctgggagcgc 60
ggagcagaca cactcccccg gccacccttg gccgactccg 100
<210> 988
<211> 100
<212> DNA
<213> 智人
<400> 988
cgcgcccggg atcctgcaga ggtgcgcgcc cttcttgtac gccagacttt ggaccagggc 60
cgccgttccc tgagcttcac tttccctgtt gggtcatatt 100
<210> 989
<211> 100
<212> DNA
<213> 智人
<400> 989
ccatctctaa ctctggaatc ttgggtattg ggctctccag gcggggggcc ctgctcaggg 60
aggcagtagg gagccaaacc tttaaccaga ggatgggata 100
<210> 990
<211> 100
<212> DNA
<213> 智人
<400> 990
agtcctcaac tctcgttgaa catcttggcg aaggtgtgtg ttgttgggag gggtggggga 60
gggatccccc cggactgaac cgatctcttg atctctcact 100
<210> 991
<211> 100
<212> DNA
<213> 智人
<400> 991
tctctacctc gctttggggc cctgagtcac accctctaag gagagaggct aaagcgcccc 60
ggaaagccag cgtgcgaatg ccggggtggg agtgggagat 100
<210> 992
<211> 100
<212> DNA
<213> 智人
<400> 992
tggatctccc tggggtccag gaaagccgga atcggagcca ccatgcttag cttagtctgg 60
aactcttaaa agccgcggtc ctcctgagtc ccacagcccc 100
<210> 993
<211> 100
<212> DNA
<213> 智人
<400> 993
tctccaccct aggtggcaca ggagaggtgg caaaagccta gaagttcaag gcatggctcc 60
ctccccagcc gcagcctgga gtgtctaact ttggcaggaa 100
<210> 994
<211> 100
<212> DNA
<213> 智人
<400> 994
gtcttccgtt tctgctcccc actccagaga aaaaataaat aaatacttct ccggagtgag 60
attaaggaaa caggtacttc ttcctcttgg agaaagagga 100
<210> 995
<211> 100
<212> DNA
<213> 智人
<400> 995
cttctccgga gtgagattaa ggaaacaggt acttcttcct cttggagaaa gaggagccaa 60
aggaacttga ctccaacaaa tgatcacctt gcaaaccccc 100
<210> 996
<211> 100
<212> DNA
<213> 智人
<400> 996
ggctccctta ggggatgacc tggtctccaa caatctcaga gcgtttggag gcagggtctt 60
tggagatgac tgagtgggga atcccaggct ccccacacat 100
<210> 997
<211> 100
<212> DNA
<213> 智人
<400> 997
gaacatcacc tgggatgatc aacctgttca ggatgtaggt tcccgggctc acccccaggc 60
ccggttggct aggcctgggg tgaggctgag atcctgcagg 100
<210> 998
<211> 100
<212> DNA
<213> 智人
<400> 998
ttaaaccatc tatcccaggt gactccaatg ttcgtttgtg gggcaaaagt ccctcaagtc 60
agagacactg ggaggcgctg atgtggtctc atctctttac 100
<210> 999
<211> 100
<212> DNA
<213> 智人
<400> 999
caagaggtga gaaggggtct gcggcctcgt ctccagccga gggcgggagg cgcctcgccc 60
ctacacccat ccgctccctc caacccaggc cggggagggt 100
<210> 1000
<211> 100
<212> DNA
<213> 智人
<400> 1000
acccacatgg ttccaggcaa gtaataacaa aataacacgg catcccagtt aatgctgcgt 60
gcacggcggg cgctgccggt caaatctgga aggggaagga 100
<210> 1001
<211> 100
<212> DNA
<213> 智人
<400> 1001
gctcaggtag tcgcggagga cggggttgag ggggatgcga gccaggttct cgcggcccac 60
ggtggccacg atgcgctggc ggcacagctc ctgcagcggc 100
<210> 1002
<211> 100
<212> DNA
<213> 智人
<400> 1002
cgcacgcggc gctggcgcag cggggccccc agcatgcggc gcggcgccgc cacgtagtgc 60
tccagcagct cgaagaggca gtcgaagctc tcgcggctgc 100
<210> 1003
<211> 100
<212> DNA
<213> 智人
<400> 1003
catccaggtg aaagcggccg gcctgaaagt gcacgcggat gctcgtgggt cccgaggcca 60
tcttcacgct aagggcgaaa aagcagttcc gctggcggct 100
<210> 1004
<211> 100
<212> DNA
<213> 智人
<400> 1004
gtcgcgcacc aggaaggtgc ccacgggctc ggcgcgcagc cgctcgtgcg ccccgtgcac 60
gctcaggggc ccccagtaga atccgcaggc gtccaggagc 100
<210> 1005
<211> 100
<212> DNA
<213> 智人
<400> 1005
gcgctggcgc gcgtgatgcg ccggtaatcg gcgtgcgaac ggaatgtgcg gaagtgcgtg 60
tcgccggggg ccggggccgg gaccgcgggg cacggccgcg 100
<210> 1006
<211> 100
<212> DNA
<213> 智人
<400> 1006
ggcgcgcggg ggccgcgggc gaggaggagg aagaggagga aggttctggc cgccgtcggg 60
gctctgctgc tgtggagact gcattgtcgg ctgccacctg 100
<210> 1007
<211> 100
<212> DNA
<213> 智人
<400> 1007
tttaaaatca cccaaatcaa aataatttta tcttcattaa taaataatca tcagaagttt 60
aactaatttt tactttataa tactaggttt aaaaattctt 100
<210> 1008
<211> 100
<212> DNA
<213> 智人
<400> 1008
aatctgaatg cccaagtcgt tgattgtcgt ttgcctgttt ccaaagattg gtagatagat 60
gcctttttaa aaatctcatt tttctttaaa tctggtttac 100
<210> 1009
<211> 100
<212> DNA
<213> 智人
<400> 1009
atggaaaacg ttaggagagc tcatataatg aacggcaata gcaaccccct atcttgaaac 60
gcgctctatc atcccactga aattctacca cgtggaataa 100
<210> 1010
<211> 100
<212> DNA
<213> 智人
<400> 1010
tgcttggagg gtcagagttg tggaactgcc caataaccag tcgttactga gggttagttt 60
gtgaaggagg ggacagactg cttctaaaat tctgtttaat 100
<210> 1011
<211> 100
<212> DNA
<213> 智人
<400> 1011
gacagtcaat taagatttct gagtctggct tgagggcctt tgcttccatc acagcccagt 60
cgtccttggc aagagagtct gtatatgggc cacagctcac 100
<210> 1012
<211> 100
<212> DNA
<213> 智人
<400> 1012
aaaagcattg tttgaaaaaa tttattgaaa gaacattgtt tgtaaaatga gtcccaatac 60
ataggacaga ctttcctaag gtgagatgtg ttacttaccc 100
<210> 1013
<211> 100
<212> DNA
<213> 智人
<400> 1013
agagctgtga aaggctttac ggatggaaac tagagactga attttccaga attttaagaa 60
gtctccccaa ccaatggccc cccactttct ttttttaaac 100
<210> 1014
<211> 100
<212> DNA
<213> 智人
<400> 1014
ggcgtgatct ccgaagccca cagtacactc atccataaag taggaaacac tacaccctcc 60
agtgctgtta gtagtgcttt ctactttatg ggtgactgca 100
<210> 1015
<211> 100
<212> DNA
<213> 智人
<400> 1015
ctgtctgtct gtccgtcggc gtgtactctt caggctgccc aggcctcctg actcctgctc 60
caagagcccc ccagccctcc ttgtggcttc ctaagatccc 100
<210> 1016
<211> 100
<212> DNA
<213> 智人
<400> 1016
ccctcttccc ttccccctaa aggctccacc ccatcccccc agtttcagag acactcaggt 60
agagactagg gcctctggag gcctcacctt cagttctgtg 100
<210> 1017
<211> 100
<212> DNA
<213> 智人
<400> 1017
aacccctggc tggccgcttc cagccacgct agccaccctc cagcgtccaa atgaggcagc 60
cacagctccc ctgccaaggt cttggtctcc agtccacccc 100
<210> 1018
<211> 100
<212> DNA
<213> 智人
<400> 1018
aaccgtgagg tcctgactgc ccagagcctc agtccccacc cttcagcctc cccaccagcc 60
caagatcctg accccccagg gcctaagtcc ccagcctccc 100
<210> 1019
<211> 100
<212> DNA
<213> 智人
<400> 1019
caacagccca gggtcctgac cccccagggc ctcaggccct ggcctcccca ccagcccaag 60
gtcttgaaca caccagggcc tcaattccca gcctccccac 100
<210> 1020
<211> 100
<212> DNA
<213> 智人
<400> 1020
cagctcaagg tcctgactcc cccagagcct cagtcccagc ctccatagca gcccaaggtc 60
ctgacccccc agggcctcag tccccagcca ctccaccagc 100
<210> 1021
<211> 100
<212> DNA
<213> 智人
<400> 1021
cccaaagtcc tgactcccca gagccttgat tctcggcctc cccaccagcc caaagtcctg 60
actccctcac tgccctgctg ttcccctggc aggagcccaa 100
<210> 1022
<211> 100
<212> DNA
<213> 智人
<400> 1022
ggctatccca acaaaaatgg tggccatgtt gggcggagga agaggctggc gccccttgag 60
acactggtcc cacttctcag cctctgcgta ccctctgcca 100
<210> 1023
<211> 100
<212> DNA
<213> 智人
<400> 1023
tccccgcctt actctccagc cctcctcctt ggacacctct ttccccgcct ggggtcccgg 60
agccatttta ccttccttca ctagagaggg tttcaaggcg 100
<210> 1024
<211> 100
<212> DNA
<213> 智人
<400> 1024
ctaagatttt caagaagtta aacgtagaat taagattgtt ctaattctgg ttgtaaactg 60
ctattttaaa aaacaaaaca aacagaaaac atcaaaaaca 100
<210> 1025
<211> 100
<212> DNA
<213> 智人
<400> 1025
aaacaaacag aaaacatcaa aaacacaaaa agatattaaa acagcaagtc ttttgtacat 60
cactgtagca taagctgctt gaggttgtca tgcagaatag 100
<210> 1026
<211> 100
<212> DNA
<213> 智人
<400> 1026
tatccttcac gtcacggaaa acaaggcgga tgttctccgt gttgatagca gtggtgaagt 60
ggtggtataa gggcttctgt tgctggtccc ggcgtttgtt 100
<210> 1027
<211> 100
<212> DNA
<213> 智人
<400> 1027
ccggaaacat tccaccagga atttttggac gtctcttaag cagtggggat ccccttcaaa 60
ttctaggaaa tagtctttga tgctcacaat ttgcaccttc 100
<210> 1028
<211> 100
<212> DNA
<213> 智人
<400> 1028
tcctcaagca agtctgtctt gtttaagaac agaattatgg agacattgct gaaaacccgg 60
ttattgacga ttgtttcaaa aatgttcaga gactctgtaa 100
<210> 1029
<211> 100
<212> DNA
<213> 智人
<400> 1029
ggcgattggt cagtcgatct tccataagca cctggtcaaa ttcacttgag gaaacaagga 60
aaagtattga tgtcacactg tcgaaacatt caaaccaacg 100
<210> 1030
<211> 100
<212> DNA
<213> 智人
<400> 1030
tttcctttct gatctctgac cacctacatc aaccattttg aaaggaacat tttttatttc 60
aaagtcgtat tcatggatgc ctttggtggg tcttctggca 100
<210> 1031
<211> 100
<212> DNA
<213> 智人
<400> 1031
agcagaatat cttgttgtga tggaatataa tcctggaaaa gaaaaaactt gttttatacc 60
tattaatccc gaagtaatgc gaatttttaa tggactacta 100
<210> 1032
<211> 100
<212> DNA
<213> 智人
<400> 1032
tgtaaatatt tggccaacta agctgagtgg ctaagttctc ctgctgcccg gagcttcttg 60
gaacatgttt ccttttcgca aggggtttcc ctggcttcca 100
<210> 1033
<211> 100
<212> DNA
<213> 智人
<400> 1033
ggagggccag gaagaaattc gaattggcca ccgctttctc taaaatcact ccgctcaagt 60
tatcacccct ctgggctccc gaagaccggc tggctggagg 100
<210> 1034
<211> 100
<212> DNA
<213> 智人
<400> 1034
ctggagatag tctcaatgct cgaaatgccg taaccgaagc tccccgcggc gccggcactg 60
ggatccaggg agctgctgct acagcgcagc tctggattcc 100
<210> 1035
<211> 100
<212> DNA
<213> 智人
<400> 1035
tggatgtgtt ggatatgtgc agggcgttcc tgggaggagc ggggagggag ggtgctgctg 60
gcggggctgg tctgcgtgtg ctttgcttct ctacaatggc 100
<210> 1036
<211> 100
<212> DNA
<213> 智人
<400> 1036
atgctgcgtg tcggccatgc agaggcatgt cagtgagcag gggctgaggg atctccctaa 60
cggacctgct ttcagagggt cttttcatgc tgggagaacc 100
<210> 1037
<211> 100
<212> DNA
<213> 智人
<400> 1037
ccagagacta aatcatgcag ccaacggggt ggtccccggc ctcaaagcag ggaggggcga 60
ggagctttgt aggcaatgcc atctgctcct gaaacgccgt 100
<210> 1038
<211> 100
<212> DNA
<213> 智人
<400> 1038
cagcctcctt agtagctacc gccttagtaa gtaccactta gtaagtaccg ccttagtaag 60
taccacttag tagctacctc cttagtaagt accacttagt 100
<210> 1039
<211> 100
<212> DNA
<213> 智人
<400> 1039
aagtacctcc ttagtaagta ccacttagta ctaccaccac gcctggctaa tttcgtattt 60
tttttttttt agtagagacg gggtttctcc atattggtca 100
<210> 1040
<211> 100
<212> DNA
<213> 智人
<400> 1040
aggtcaggcg catactgcat gcgggtctcg cggtcgtgct ccagccacag cacggacatc 60
tggaagagcg ccagctccga ctccacgggg ggcggcagcg 100
<210> 1041
<211> 100
<212> DNA
<213> 智人
<400> 1041
agtccagcag ggcgcgcatc tcctcgaagt tgagcagcag cacatcctcc accaggtact 60
tgttggccag cttcttggtc tcctccaggc cgtgcagcgc 100
<210> 1042
<211> 100
<212> DNA
<213> 智人
<400> 1042
ggcgatcttg cacacctgct tgtagttctg caccgagatc tggtcgttga ggaactgcac 60
gcagagcttg gtgacctggg ggatgtgcag gatcttgctg 100
<210> 1043
<211> 100
<212> DNA
<213> 智人
<400> 1043
accgacagca cctcctccac cgtgtccagg gacagggtca cgttggccgt gtagaggtac 60
tcgagcacca ggcgcagccc gatggacgag cagccctgca 100
<210> 1044
<211> 100
<212> DNA
<213> 智人
<400> 1044
gcaccaggtt gttgatggcc cgggggctgg tcagcagctt gtcgtcgggg gaggaagaag 60
gagtcccggg ctcctcctgc ggcggcggct gctgctgctg 100
<210> 1045
<211> 100
<212> DNA
<213> 智人
<400> 1045
tgacggctgc tgctgcggcg gctgctgctg gtccttgggg gcccccaggc cgtcctggcc 60
gccgacccct cccccgagag gggggtggct ggagaagagc 100
<210> 1046
<211> 100
<212> DNA
<213> 智人
<400> 1046
gagacttcag ccggagctgg ctattccaga gatggacctc agaggattcc ttagtctaat 60
taccttctgg gctggggtag aagatggtgt ctggagggaa 100
<210> 1047
<211> 100
<212> DNA
<213> 智人
<400> 1047
gcacagaacc aagttcccta ctgccgcact agctatgcaa atactgcagg gcacctgtgg 60
gctcatgtcc ctcctgcaag aaggtgtggt cagtccagta 100
<210> 1048
<211> 100
<212> DNA
<213> 智人
<400> 1048
attcaaaaga cgtacttctg aaataggtgg agaaatgcat ttatagcaaa aagtgctaaa 60
aatatgttaa tagttatgct atttggttca ccaggttagt 100
<210> 1049
<211> 100
<212> DNA
<213> 智人
<400> 1049
gtaataaacc ataacaagag agactaaagg ccgtatctat atgaccttga aatctcatct 60
tcagcgggct tattcattca gtaaccaaac tatttttgta 100
<210> 1050
<211> 100
<212> DNA
<213> 智人
<400> 1050
aggtgctgag tatttagctt aaagctaaat aagacacatg ccctgcccta tagtaactgc 60
ttggtaatat tcccagtggc ttccatgggc ctgataattt 100
<210> 1051
<211> 100
<212> DNA
<213> 智人
<400> 1051
tcttagtact gaattcaaag cactttgtgt cttgtctgca ggcccatttg cccagcagtg 60
gccttgccag gagagaacag gcccatgctc ctgtcctcat 100
<210> 1052
<211> 100
<212> DNA
<213> 智人
<400> 1052
caaacaaaca attcaagaag aggatttaaa ttttagaaat ttaaattggg gcattttagt 60
taatcttact tttaaacacc aaacagtggc atcaatattt 100
<210> 1053
<211> 100
<212> DNA
<213> 智人
<400> 1053
tgtcaacttt ggtcaaataa gatcagatgt tcacatcaat catctacttt tcttggcctt 60
ttctctattt ggcctcctag tatgagcaca ctttgtaaaa 100
<210> 1054
<211> 100
<212> DNA
<213> 智人
<400> 1054
tgtaataaaa acatgtggtg tgcttcttga catctaatcc acttgcagta atttctaggc 60
tttttgctcc tgttaggtcc tataaaataa tgacattagt 100
<210> 1055
<211> 100
<212> DNA
<213> 智人
<400> 1055
atagatacct agatgcaaat ttttttcagc cgaccacaaa attaggtcca ctctgagtgg 60
tgaaaaacaa aagattctaa cattctagca aactggtaaa 100
<210> 1056
<211> 100
<212> DNA
<213> 智人
<400> 1056
ccatacacaa attatagaat acaaagaatg cagccgatgc aaattctgtc actgacaagg 60
tagcaaagcc atagcctgat actcctcagg acacctcatc 100
<210> 1057
<211> 100
<212> DNA
<213> 智人
<400> 1057
acgcccactg ggaacatggc acacactgga gattccagtc caaggacttt ggaatgtcaa 60
cttagctctt tacaaacaca actaagtttt tcagggaaaa 100
<210> 1058
<211> 100
<212> DNA
<213> 智人
<400> 1058
agacttacat tggttttcct cttttggaaa attttaccga ttgatgatgc ccttggtctt 60
ctgtggagtc tattcttcta atcgggttgt tctccaattt 100
<210> 1059
<211> 100
<212> DNA
<213> 智人
<400> 1059
tagtgtacaa cgggcttgtt tcaggggagc ttgtttggga tgcagactgt caagacccaa 60
cctggtatct ggttcataag cagtccctga aacctccctc 100
<210> 1060
<211> 100
<212> DNA
<213> 智人
<400> 1060
cggttccaac aagctgctca agccaggaaa cggtggtcct ggggactcct ggaccttcag 60
cttgagaaac actgaagggg taccatttac caccacatcc 100
<210> 1061
<211> 100
<212> DNA
<213> 智人
<400> 1061
tactggatta caaacgctag atctttggat ctccacgact agcaagcaag ttaaagactt 60
ttagatggca ggcgttatcg gtcaggttgg gagtgaacgc 100
<210> 1062
<211> 100
<212> DNA
<213> 智人
<400> 1062
tttgtccaga ggaggaggta gggacgccgg gaagcaacaa ctctgatttt atttcgccgg 60
ctccacagcc tcccattgcc ccaggagccc acccgcactc 100
<210> 1063
<211> 100
<212> DNA
<213> 智人
<400> 1063
caacccccgc atctcggacc tgtggcctca gcccagactc acatcaccaa gtgcacctac 60
ccagcctccg ttatcctgga tccaggtgtg caggtgccgg 100
<210> 1064
<211> 100
<212> DNA
<213> 智人
<400> 1064
ttcaggtact cagtcatcca cagggcgatg ttgtccacca ggggcgacat ctcccggttg 60
acgctctcca cacacatgac cccaccgaac tcaaagaagg 100
<210> 1065
<211> 100
<212> DNA
<213> 智人
<400> 1065
ccacaatcct cccccagttc accccgtccc tgaagagctc ctccaccacc gtggcaaagc 60
gtccccgcgc ggtgaagggc gtcaggtgca gctggctgga 100
<210> 1066
<211> 100
<212> DNA
<213> 智人
<400> 1066
catctcggcg aagtcgcggc ggtagcggcg ggagaagtcg tcgccggcct ggcggagggt 60
caggtggacc acaggtggca ccgggctgag cgcaggcccc 100
<210> 1067
<211> 100
<212> DNA
<213> 智人
<400> 1067
gcggcggcgc cgggggcagc cggggtctgc agcggcgagg tcctggcgac cgggtcccgg 60
gatgcggctg gatggggcgt gtgcccgggc tgggaggaga 100
<210> 1068
<211> 100
<212> DNA
<213> 智人
<400> 1068
agatgcccgg tgcgggggcg gcccccgggg gcgcggcgcc cacatctccc gcatcccact 60
cgtagcccct ctgcgacagc ttataatgga tgtacttcat 100
<210> 1069
<211> 100
<212> DNA
<213> 智人
<400> 1069
cactatctcc cggttatcgt accctgttct cccagcgtgc gccatccttc ccagaggaaa 60
agcaacgggg gccaacggca cctctcgccc cagctcccac 100
<210> 1070
<211> 100
<212> DNA
<213> 智人
<400> 1070
cccacggccc ccagagaaag aagaggagtt ataatccagc tattttattg gatgtgcttt 60
gcattcttgg acgagggggt gtcttcaatc acgcggaaca 100
<210> 1071
<211> 100
<212> DNA
<213> 智人
<400> 1071
cttgattctg gtgtttcccc cttggcatga gatgcaggaa atttttattc caattccttt 60
cggatcttta tttcatgagg cacgttatta ttagtaagta 100
<210> 1072
<211> 100
<212> DNA
<213> 智人
<400> 1072
ttgttaatat cagtctactt cctctgtgat gctgaaaggt taaagaaaaa acaaactaat 60
aagtaaaaaa tcaggtgcgt ttccctgtac acactgagtg 100
<210> 1073
<211> 100
<212> DNA
<213> 智人
<400> 1073
aaagcagggc atacacacta caagtaacac ggctaaaaag aatgtattaa gctgcctgga 60
aattaaattt actcgaatgc actttaagta aaaaatctca 100
<210> 1074
<211> 100
<212> DNA
<213> 智人
<400> 1074
aaggtttcca ttgaaagtta cattaaacca atttcctgtg cagagaactt acttgtattt 60
tttaagtaca gcatgatcct ctgtcaagtt tcctttttgt 100
<210> 1075
<211> 100
<212> DNA
<213> 智人
<400> 1075
aaaaccaaaa caaatgcata aggcaacgat cccatcaatc ttcagcactc tccagttata 60
gctgatttga aacttcccaa tgaatcagga gtcgcgggga 100
<210> 1076
<211> 100
<212> DNA
<213> 智人
<400> 1076
gagggagtaa aaattaggag gatttccaga tcgattccca gacttctgct tcacagaaat 60
gtcaatccgc aggaatccca accggagatc tcaagagctc 100
<210> 1077
<211> 100
<212> DNA
<213> 智人
<400> 1077
gagaaaaaaa aaaggcagcg gcggcggcag atgaattaca attttcagtc cggtattcgc 60
agaagtcctg tgatgttttc cccttctcgg caatttacac 100
<210> 1078
<211> 100
<212> DNA
<213> 智人
<400> 1078
tgaaggagcc ggggacggag gcaggaatcc tcttctgatt aaactccgaa cagcaaatgc 60
attttccgaa aagctgctgg ataaatgaag gcaggacgcg 100
<210> 1079
<211> 100
<212> DNA
<213> 智人
<400> 1079
cctggcccgc cggtgccgag cgctagaagc ccgcgctgtg tgtggtgcgg cgaggggtgg 60
ggagaaggag gtggtggggg agggttttat tttttccctc 100
<210> 1080
<211> 100
<212> DNA
<213> 智人
<400> 1080
ttttcctaaa aaggatgact gctacgaagt tctcccccct ggaccccctc ttccgctgca 60
ccccaccggc gcaccccgcc tccgggctgc gcaccctttc 100
<210> 1081
<211> 100
<212> DNA
<213> 智人
<400> 1081
gtgtgtgtct cgcctggacc ttttctagcc gtgtatgtgg gagtgtgtgt gtcgcctgga 60
ccctttctag ccgtgtatga gagtgtgtac acgcgcctac 100
<210> 1082
<211> 100
<212> DNA
<213> 智人
<400> 1082
acacacacac gttgtgttac cggcgctcgg ccgccggggg aagacccagg ccaatgccgc 60
cccccaccgc ccccagcagt gggacctcag cgctgccctg 100
<210> 1083
<211> 100
<212> DNA
<213> 智人
<400> 1083
ctgtgaagac aggtgactct gcacgtttta agcaatgtct agggacgccc cgagcgtggt 60
gtttactttc aagtagcttc ctaggtgtcc gcgcactaca 100
<210> 1084
<211> 100
<212> DNA
<213> 智人
<400> 1084
cacgcacgcg catccccgcc cgtgtccacc tgaacaccta gtccgtggcc caggccatgc 60
agaactcagc gctccaggga aggggtttat caagggcttt 100
<210> 1085
<211> 100
<212> DNA
<213> 智人
<400> 1085
acgacagttt aagtcaatgt tttccctctg tccctaacac cttttacact ggtttagtgc 60
tacacgatga ggacttccat atagtaactt tcaggcccac 100
<210> 1086
<211> 100
<212> DNA
<213> 智人
<400> 1086
cgtcctaacg ctggggtggg tgggctccta aaggtctcca cctttgcctc gtagccaatc 60
ctagttggcc gcactttctc aaatgaggta catagataca 100
<210> 1087
<211> 100
<212> DNA
<213> 智人
<400> 1087
gtgtctccat ggagatggca gcaggacccg accccgtgct ggcccgcact ctcggcctcc 60
ttatctggtt taggaatgcg cggtatccac gctcgctcgc 100
<210> 1088
<211> 100
<212> DNA
<213> 智人
<400> 1088
gcgggagcca cgcctcctct cccccccgcc cccgagaccg ccacacgcgc ggggccccca 60
cgtctccaag cggcactgga aggattcctc tccgtcccgc 100
<210> 1089
<211> 100
<212> DNA
<213> 智人
<400> 1089
caggggtccc gcctcgagat tctgggaaga ctgggggtgg gggaccagat cgcagcagca 60
gctgcaccgc gagttccgcg cctggccgtg tcgccccacg 100
<210> 1090
<211> 100
<212> DNA
<213> 智人
<400> 1090
agggggactg tgggctcagc gcgtggggcc cggagcatct gacaaggaca gagacagagg 60
agggggtgga aatccccggg tgagtcaacc cgtgcctgag 100
<210> 1091
<211> 100
<212> DNA
<213> 智人
<400> 1091
aagggggcga gttccgacgc tccgcccggc tcggggccac gcgaggtccg cgccacgcgc 60
gccttcaccc acgacccatc cctgagccgg agttgaaaga 100
<210> 1092
<211> 100
<212> DNA
<213> 智人
<400> 1092
ggaggcgtct gagccacgca gtcactttct ctttccttac aaaacaaagc cacgcccccc 60
gccgggggac cggaggaggc aaacaacttg gggaaaccga 100
<210> 1093
<211> 100
<212> DNA
<213> 智人
<400> 1093
cccactttcc ccttctgtcc ctaaagtttt ttcttcctct tgcctccccc agcccttttg 60
aaagctcccc gcgtcgtcct cctgctgccc cggctcctta 100
<210> 1094
<211> 100
<212> DNA
<213> 智人
<400> 1094
gcagcttctg ggacgcacgg gagggaaaag ccgcggggac cccccccacc ccagcctccc 60
agccgggtga gatttggttg ctgtgtttcc tcctcacttg 100
<210> 1095
<211> 100
<212> DNA
<213> 智人
<400> 1095
ccaccccagc ctcccagccg ggtgagattt ggttgctgtg tttcctcctc acttgggcat 60
ttaaaaaata ttttaacacg aattgtccgc ggaattttca 100
<210> 1096
<211> 100
<212> DNA
<213> 智人
<400> 1096
catggcctgg acccctctcc tcctccagct tctcaccctc tgctcaggtg actgcctgtg 60
gaatgccaaa gtgattattg gggacacatg ggatgacttt 100
<210> 1097
<211> 100
<212> DNA
<213> 智人
<400> 1097
tctcttatat tttaacattg tggggtgggt agtgaaccca gactcacctc tctgtgcctg 60
cctcctctgt tccagggtcc tgggcacagt ctgcgctgac 100
<210> 1098
<211> 100
<212> DNA
<213> 智人
<400> 1098
ccaggaagcc tcggtgtcag ggaccgtggg acagaaggtc accctctcct gtactggaaa 60
cagcaacaac gttggaagtt atgctgtggg ctggtaccaa 100
<210> 1099
<211> 100
<212> DNA
<213> 智人
<400> 1099
cagatttctc acggtgctcc caaaactgtg atgtttggaa attctctgcc ctcagggatc 60
cctgaccgct tctctggctc aaagtctggg accacagcct 100
<210> 1100
<211> 100
<212> DNA
<213> 智人
<400> 1100
ccctgactat ctcgggcctc tagcctgagg acgaggctga ttattactgt tcaacatggg 60
actacagcct cagtgctcac acagtgctgc aggcacatgg 100
<210> 1101
<211> 100
<212> DNA
<213> 智人
<400> 1101
ggaaccgaga caaaaacctg cccttggcct gtcccgaggc tgatcactcc atacttgcct 60
atgacaaaca aagagggtgc ctgtggctga tcgtacagtt 100
<210> 1102
<211> 100
<212> DNA
<213> 智人
<400> 1102
gaaatgttgt ttgctcttgt ccttccttca ggccataatg agcgtctctg ttttcagggt 60
ctctctccca gcctgtgctg actcaatcat cctctgcctc 100
<210> 1103
<211> 100
<212> DNA
<213> 智人
<400> 1103
tcaagctcac ctgcactctg agcagtgggc acagtagcta catcatcgca tggcatcagc 60
agcagccagg gaaggcccct cggtacttga tgaagcttga 100
<210> 1104
<211> 100
<212> DNA
<213> 智人
<400> 1104
aggtagtgga agctacaaca aggggagcgg agttcctgat cgcttctcag gctccagctc 60
tggggctgac cgctacctca ccatctccaa cctccagttt 100
<210> 1105
<211> 100
<212> DNA
<213> 智人
<400> 1105
gaggatgagg ctgattatta ctgtgagacc tgggacagta acactcacac agtgatacag 60
gcagatgagg aagtgggaca aaatcctcaa cctgctgagg 100
<210> 1106
<211> 100
<212> DNA
<213> 智人
<400> 1106
aaggtcacca tctcctgctc tggaagcagc tccaacattg ggaataatta tgtatcctgg 60
taccagcagc tcccaggaac agcccccaaa ctcctcattt 100
<210> 1107
<211> 100
<212> DNA
<213> 智人
<400> 1107
atgacaataa taagcgaccc tcagggattc ctgaccgatt ctctggctcc aagtctggca 60
cgtcagccac cctgggcatc accggactcc agactgggga 100
<210> 1108
<211> 100
<212> DNA
<213> 智人
<400> 1108
tcagccagac tcacctgcac cttgcgcagt ggcatcaatc ttggtagcta caggatattc 60
tggtaccagc agaagccaga gagccctccc cggtatctcc 100
<210> 1109
<211> 100
<212> DNA
<213> 智人
<400> 1109
tgagctacta ctcagactca agtaagcatc agggctctgg agtccccagc cgcttctctg 60
gatccaaaga tgcttcgagc aatgcaggga ttttagtcat 100
<210> 1110
<211> 100
<212> DNA
<213> 智人
<400> 1110
agagatctgg gggaagctca gcttcagctg tggtagagaa gacaggattc aggacaatct 60
ccagcatggc cggcttccct ctcctcctca ccctcctcac 100
<210> 1111
<211> 100
<212> DNA
<213> 智人
<400> 1111
tcactgtgca ggtgacagga tggggaccaa gagaggggcc ctgggaagcc catggggccc 60
tgctttctcc tcttgtctcc tttcgtctct tgtcaatcac 100
<210> 1112
<211> 100
<212> DNA
<213> 智人
<400> 1112
catgtctgtg tctctctcac ttccagggtc ctgggcccag tctgtgctga ctcagccacc 60
ctcagcgtct gggacccccg ggcagagggt caccatctct 100
<210> 1113
<211> 100
<212> DNA
<213> 智人
<400> 1113
tgttctggaa gcagctccaa catcggaagt aattatgtat actggtacca gcagctccca 60
ggaacggccc ccaaactcct catctatagt aataatcagc 100
<210> 1114
<211> 100
<212> DNA
<213> 智人
<400> 1114
ggccctcagg ggtccctgac cgattctctg gctccaagtc tggcacctca gcctccctgg 60
ccatcagtgg gctccggtcc gaggatgagg ctgattatta 100
<210> 1115
<211> 100
<212> DNA
<213> 智人
<400> 1115
atttgcataa agcagcacac agcacacccc ctccgtgcgg agagctcaat aggagataaa 60
gagccatcag aatccagccc cagctctggc accaggggtc 100
<210> 1116
<211> 100
<212> DNA
<213> 智人
<400> 1116
ccttccaata tcagcaccat ggcctggact cctctctttc tgttcctcct cacttgctgc 60
ccaggttaag agagatttca aataccagcc tttggaggga 100
<210> 1117
<211> 100
<212> DNA
<213> 智人
<400> 1117
tccctttttc tccctttcta attcctaata tatgtctgtt ttttttgttt cagggtccaa 60
ttcccaggct gtggtgactc aggagccctc actgactgtg 100
<210> 1118
<211> 100
<212> DNA
<213> 智人
<400> 1118
ggacagtcac tctcacctgt ggctccagca ctggagctgt caccagtggt cattatccct 60
actggttcca gcagaagcct ggccaagccc ccaggacact 100
<210> 1119
<211> 100
<212> DNA
<213> 智人
<400> 1119
gatttatgat acaagcaaca aacactcctg gacacctgcc cggttctcag gctccctcct 60
tgggggcaaa gctgccctga cccttttggg tgcgcagcct 100
<210> 1120
<211> 100
<212> DNA
<213> 智人
<400> 1120
gaggatgagg ctgagtatta ctgcttgctc tcctatagtg gtgctcggca cagtgacaga 60
cccatgagag gaaccaagac ataaacctcc ctcggccctt 100
<210> 1121
<211> 100
<212> DNA
<213> 智人
<400> 1121
ggtcagccac ccagcctgat tctgactctt ctggcaaaga tccctgaaaa actttaccct 60
ggtttctgcc ttagcaccca ttaatgtctg tgtttccagg 100
<210> 1122
<211> 100
<212> DNA
<213> 智人
<400> 1122
ttccctctcg caggctgtgc tgactcagcc gtcttccctc tctgcatctc ctggagcatc 60
agccagtctc acctgcacct tgcgcagtgg catcaatgtt 100
<210> 1123
<211> 100
<212> DNA
<213> 智人
<400> 1123
gcatcagcca gtctcacctg caccttgcgc agtggcatca atgttggtac ctacaggata 60
tactggtacc agcagaagcc agggagtcct ccccagtatc 100
<210> 1124
<211> 100
<212> DNA
<213> 智人
<400> 1124
tcctgaggta caaatcagac tcagataagc agcagggctc tggagtcccc agccgcttct 60
ctggatccaa agatgcttcg gccaatgcag ggattttact 100
<210> 1125
<211> 100
<212> DNA
<213> 智人
<400> 1125
acagatgggg aagtgggaca aaaacctcac cctgctctgg gtcttgctct gtaccaattt 60
ttaaatttta aaataactgg cctaggcaca aactatattt 100
<210> 1126
<211> 100
<212> DNA
<213> 智人
<400> 1126
gcccagtctg tgctgactca gccaccctca gcgtctggga cccccgggca gagggtcacc 60
atctcttgtt ctggaagcag ctccaacatc ggaagtaata 100
<210> 1127
<211> 100
<212> DNA
<213> 智人
<400> 1127
ctgtaaactg gtaccagcag ctcccaggaa cggcccccaa actcctcatc tatagtaata 60
atcagcggcc ctcaggggtc cctgaccgat tctctggctc 100
<210> 1128
<211> 100
<212> DNA
<213> 智人
<400> 1128
tgctgctcag gcctggcctg tggcttctgc tgctgcagct tccttcatgg gtccaggggc 60
atccagggcc ctgcctgaga gtggaggctc ctcctcccct 100
<210> 1129
<211> 100
<212> DNA
<213> 智人
<400> 1129
tccagcactg gagcagtcac cagtggttac tatccaaact ggttccagca gaaacctgga 60
caagcaccca gggcactgat ttatagtaca agcaacaaac 100
<210> 1130
<211> 100
<212> DNA
<213> 智人
<400> 1130
ccctccttgg gggcaaagct gccctgacac tgtcaggtgt gcagcctgag gacgaggctg 60
agtattactg cctgctctac tatggtggtg ctcagcacag 100
<210> 1131
<211> 100
<212> DNA
<213> 智人
<400> 1131
tgacagactc ataagaggaa ccaagacata aacctccctc ggcccttgtg atgtggagat 60
tgtgtgatca tacacaccag ctctcaagac agcctacatg 100
<210> 1132
<211> 100
<212> DNA
<213> 智人
<400> 1132
acataaacct ccctcggccc ttgtgatgtg gagattgtgt gatcatacac accagctctc 60
aagacagcct acatgtggac cagccataga aaggggaagg 100
<210> 1133
<211> 100
<212> DNA
<213> 智人
<400> 1133
atagaaaggg gaaggaaagg gtctgaattg atttctatcc ctccttgtgc cctgaagtgg 60
aggaaatgtg agagtgattt gcagtaattg aatgagacaa 100
<210> 1134
<211> 100
<212> DNA
<213> 智人
<400> 1134
agcaaaagtt atttgtttta tatgaaaaaa aaaaacagaa acagcaggat cagatctaaa 60
ggctgagtct aaatgcattt cctccagaca gaagcttctt 100
<210> 1135
<211> 100
<212> DNA
<213> 智人
<400> 1135
cagatctaaa ggctgagtct aaatgcattt cctccagaca gaagcttctt caaacgatgg 60
gctttctgag ctaagagcaa agaaaataaa ctctccacgg 100
<210> 1136
<211> 100
<212> DNA
<213> 智人
<400> 1136
gtatattatt aaagtttatt ttattgagtt actttcaaag caatccatga ctattatata 60
aagtcagaaa gtattaaaaa tcaccaagtt ctctgctaag 100
<210> 1137
<211> 100
<212> DNA
<213> 智人
<400> 1137
ctaccttatc ccatgcaatc aaaataagta cttttcttca tttggatgca ttttttattt 60
ctgtttttaa tatttccaca atggtgatta aacctggtgc 100
<210> 1138
<211> 100
<212> DNA
<213> 智人
<400> 1138
acagggtcag gggaggggtc caggaagccc atgaggccct gctttctcct tctctctcta 60
gaccaagaat caccgtgtct gtgtctctcc tgcttccacg 100
<210> 1139
<211> 100
<212> DNA
<213> 智人
<400> 1139
gtcctgggcc cagtctgtgt tgacgcagcc gccttcagtg tctgcggccc caggacagaa 60
ggtcaccatc tcctgctctg gaagcagctc cgacatgggg 100
<210> 1140
<211> 100
<212> DNA
<213> 智人
<400> 1140
aattatgcgg tatcctggta ccagcagctc ccaggaacag cccccaaact cctcatctat 60
gaaaataata agcgaccctc agggattcct gaccgattct 100
<210> 1141
<211> 100
<212> DNA
<213> 智人
<400> 1141
ctggctccaa gtctggcacc tcagccaccc tgggcatcac tggcctctgg cctgaggact 60
aggccgatta ttactgctta gcatgggata ccagcctgag 100
<210> 1142
<211> 100
<212> DNA
<213> 智人
<400> 1142
agcttgcaca gtgctccagg ccaatgggga actgagacaa gaaccctctt cctcctccgc 60
caggagggtg agtgcctgca gctgctgctc acacctgacc 100
<210> 1143
<211> 100
<212> DNA
<213> 智人
<400> 1143
tgtagcttct gctgctgtag cttcccccat gggcctcggg gcatccaggg ccttgcctag 60
gagtggaggc tccaccactt ttgtcctcag agtcaggaac 100
<210> 1144
<211> 100
<212> DNA
<213> 智人
<400> 1144
agggacccca ggagacagaa tatcctgctc ctcagcttgg gacacagggt ctctgcactg 60
aaatcgtggg ctgaggtggc aggtccaact gtgtcttcac 100
<210> 1145
<211> 100
<212> DNA
<213> 智人
<400> 1145
ctctgcactg aaatcgtggg ctgaggtggc aggtccaact gtgtcttcac agtccttcct 60
gtgcctgccc atggtgtggg gacggagtga ggaagtgtgg 100
<210> 1146
<211> 100
<212> DNA
<213> 智人
<400> 1146
tcctcactct cctcgctcac tgcacaggtg actggataca ggtccagggg aggggccctg 60
ggaagcctat ggattcttgc tttctcctgt tgtctctaga 100
<210> 1147
<211> 100
<212> DNA
<213> 智人
<400> 1147
agccgaataa tgatgcctgt gtctctccca cttccagggt cctgggccca gtctgtgctg 60
acgcagccgc cctcagtgtc tggggcccca gggcagaggg 100
<210> 1148
<211> 100
<212> DNA
<213> 智人
<400> 1148
tcaccatctc ctgcactggg agcagctcca acatcggggc aggttatgat gtacactggt 60
accagcagct tccaggaaca gcccccaaac tcctcatcta 100
<210> 1149
<211> 100
<212> DNA
<213> 智人
<400> 1149
ctccaggctg aggatgaggc tgattattac tgccagtcct atgacagcag cctgagtggt 60
tccacagtgc tccaggcccg gggggaactg agacaagaac 100
<210> 1150
<211> 100
<212> DNA
<213> 智人
<400> 1150
gctcctcact ctcctcactc aggacacagg tgacgcctcc agggaagggg tcttggggac 60
ctctgggctg atccttggtc tcctgctcct caggctcacc 100
<210> 1151
<211> 100
<212> DNA
<213> 智人
<400> 1151
ttccagggtc ctgggcccag tctgccctga ctcagcctgc ctccgtgtct gggtctcctg 60
gacagtcgat caccatctcc tgcactggaa ccagcagtga 100
<210> 1152
<211> 100
<212> DNA
<213> 智人
<400> 1152
tgttgggagt tataaccttg tctcctggta ccaacagcac ccaggcaaag cccccaaact 60
catgatttat gagggcagta agcggccctc aggggtttct 100
<210> 1153
<211> 100
<212> DNA
<213> 智人
<400> 1153
aatcgcttct ctggctccaa gtctggcaac acggcctccc tgacaatctc tgggctccag 60
gctgaggacg aggctgatta ttactgctgc tcatatgcag 100
<210> 1154
<211> 100
<212> DNA
<213> 智人
<400> 1154
gctgaggacg aggctgatta ttactgctgc tcatatgcag gtagtagcac tttccacagt 60
ggtccaagtt catggggaac tgagaccaaa acctgcccag 100
<210> 1155
<211> 100
<212> DNA
<213> 智人
<400> 1155
ggccttcaga cttcctcctt gctctgaaga tgcttcctca cccggtgcaa gaggcttgct 60
gcagcgcggc cttgagaatt cttctctctc agctccttcc 100
<210> 1156
<211> 100
<212> DNA
<213> 智人
<400> 1156
ctttccacca tgaattccaa caggaaacct gccctgtggt ttcccatcca ggacagggac 60
agcttcctga tgcttgtgtg ctgtggtccc tgaatgtgca 100
<210> 1157
<211> 100
<212> DNA
<213> 智人
<400> 1157
actcttccca gctcttcaaa tgcagggaca gtgacaagga gctgcctgat tggtgcagtc 60
actgcttttt tcagggatgt cttcacccta catgtatcat 100
<210> 1158
<211> 100
<212> DNA
<213> 智人
<400> 1158
catcccctac actgtgggta gaattttagc aactacattc taatggttat cgccacaact 60
ttgatcttag aaataacagt gcagtgaaca tccctatgca 100
<210> 1159
<211> 100
<212> DNA
<213> 智人
<400> 1159
ggctcctttg agttcctgtg tgaatacgac cataggattc atttctaaaa gtgaaattgc 60
gggtcagaaa gatgtgtgtt tgtgattttc acccaatgtt 100
<210> 1160
<211> 100
<212> DNA
<213> 智人
<400> 1160
accagcagaa gccaggccag gcccctgtgc tggtcgtcta tgatgatagc gaccggccct 60
cagggatccc tgagcgattc tctggctcca actctgggaa 100
<210> 1161
<211> 100
<212> DNA
<213> 智人
<400> 1161
cccagcctcg gtcaccctct tgctccagcc ccgggaagcc tgttgataaa gccatgagtg 60
aatctggccc agttcacctg gatctgagcc tttcaggttg 100
<210> 1162
<211> 100
<212> DNA
<213> 智人
<400> 1162
cccttccctc cagccccctc caggagtctc tacagaagat acatcaggca taaatatggc 60
ctggaagggc cagaatcatc tggtgacttg gggctgttgt 100
<210> 1163
<211> 100
<212> DNA
<213> 智人
<400> 1163
ggtcctgggc ccagtctgcc ctgactcagc ctgcctccgt gtctgggtct cctggacagt 60
cgatcaccat ctcctgcact ggaaccagca gtgacgttgg 100
<210> 1164
<211> 100
<212> DNA
<213> 智人
<400> 1164
aaagccccca aactcatgat ttatgaggtc agtaatcggc cctcaggggt ttctaatcgc 60
ttctctggct ccaagtctgg caacacggcc tccctgacca 100
<210> 1165
<211> 100
<212> DNA
<213> 智人
<400> 1165
aggctcagtg cccatagacc ccaagttggc cctgccctga accctgtgca aagcccagac 60
acagtcttag ggtaggaccc ctgggaatgg gctcttgatc 100
<210> 1166
<211> 100
<212> DNA
<213> 智人
<400> 1166
ttcaagcccc ctctcctgtt ttccttgcag tctctgaggc ctcctatgag ctgacacagc 60
caccctcggt gtcagtgtcc ccaggacaaa cggccaggat 100
<210> 1167
<211> 100
<212> DNA
<213> 智人
<400> 1167
agaagtcagg ccaggcccct gtgctggtca tctatgagga cagcaaacga ccctccggga 60
tccctgagag attctctggc tccagctcag ggacaatggc 100
<210> 1168
<211> 100
<212> DNA
<213> 智人
<400> 1168
caccttgact atcagtgggg cccaggtgga ggatgaagct gactactact gttactcaac 60
agacagcagt ggtaatcata gcacagtgac actggcagat 100
<210> 1169
<211> 100
<212> DNA
<213> 智人
<400> 1169
ggggaagtga gacacaaacc ccttcttcat ctattttacc ctctccctcc agccccagga 60
ccgctgtgga ccaacccata agcaggtctg gcagaattca 100
<210> 1170
<211> 100
<212> DNA
<213> 智人
<400> 1170
aggctcacct gggcccagca ctgactcact agactgtgtt tctccctttc cagggtcctg 60
ggcccagtct gccctgactc agcctccctc cgcgtccggg 100
<210> 1171
<211> 100
<212> DNA
<213> 智人
<400> 1171
catctcctgc actggaacca gcagtgacgt tggtggttat aactatgtct cctggtacca 60
acagcaccca ggcaaagccc ccaaactcat gatttatgag 100
<210> 1172
<211> 100
<212> DNA
<213> 智人
<400> 1172
gtcagtaagc ggccctcagg ggtccctgat cgcttctctg gctccaagtc tggcaacacg 60
gcctccctga ccgtctctgg gctccaggct gaggatgagg 100
<210> 1173
<211> 100
<212> DNA
<213> 智人
<400> 1173
aggctgagga tgaggctgat tattactgca gctcatatgc aggcagcaac aatttccaca 60
gtgttttaag tcaatgagga agtaagatca aaacctgccc 100
<210> 1174
<211> 100
<212> DNA
<213> 智人
<400> 1174
tcaggctcag aacccatagg atcctgagct gggcctgccc aaacatgagt tcatcccagg 60
cacaacctca gggtgggacc ccctgggaac agattcatca 100
<210> 1175
<211> 100
<212> DNA
<213> 智人
<400> 1175
tttacaagcc tcctctcctg tcctctcttg caagctccta tgagcttaca cagccaccct 60
cagtgtcagt gtcaccagga caggcagcca tgatcacctg 100
<210> 1176
<211> 100
<212> DNA
<213> 智人
<400> 1176
ctcttgagat aacctcaaag atgagtatgt ttactggttc tggcagaagc cagaccaggc 60
ccatactggt gatatatgaa ggcagcaagc ggccctcagg 100
<210> 1177
<211> 100
<212> DNA
<213> 智人
<400> 1177
aatttctgat tttctgagtc cagctcaggg aacatggcca ccctgaccat cagcagggct 60
cagactgagg acgaggctga ctattactgt cacaggtaca 100
<210> 1178
<211> 100
<212> DNA
<213> 智人
<400> 1178
atagaaacag tgatgagccc acagtgacac aggcagatta ggaagtgaga cacaaacccc 60
ttcccaatct gtgtcaccct ctttctccag ccccaggatg 100
<210> 1179
<211> 100
<212> DNA
<213> 智人
<400> 1179
gggatgagaa gggaccaggg gcctgggatt gagctgtgaa gggaaccaaa aggcaggagg 60
gacagggcag gggctgtcag ctatgactca ggggaggttc 100
<210> 1180
<211> 100
<212> DNA
<213> 智人
<400> 1180
ctgggcctca ggatcctccc tctgaggcca ccagggggcg ggggtggcac atgcctggac 60
ctgggaggtc cctgctgggc ttcaccctgg gtgggtccta 100
<210> 1181
<211> 100
<212> DNA
<213> 智人
<400> 1181
atgcctggac ctgggaggtc cctgctgggc ttcaccctgg gtgggtccta ggagctcctt 60
cctcctaagt ccccctaaag agacagaggc attctggggt 100
<210> 1182
<211> 100
<212> DNA
<213> 智人
<400> 1182
cctaaatctg tcatgccccc ataaatgcat ttctacgagg gccaataaat gaactccagg 60
tttatccaag cagcagcttc aggcgtctgc agacacagag 100
<210> 1183
<211> 100
<212> DNA
<213> 智人
<400> 1183
cggggaggaa ttagccaacc tgaggcaccc tagaagggct gaagggggct gaaggggact 60
gaagggtccc tgtggggcct gtggtcctgg ggaggggaga 100
<210> 1184
<211> 100
<212> DNA
<213> 智人
<400> 1184
gctggggtgt ctcccagcca ctctgggccc tgtcctgaca cttctcccac aaagaaggga 60
agggaaatcc tgggacccca cagccaggac caaccgtgaa 100
<210> 1185
<211> 100
<212> DNA
<213> 智人
<400> 1185
ccacaggaca ggaaggacag ggacccccaa ggctggctcc atttcccagg cactgtcatg 60
ggctgagtct caggaaatcc aagtcaagga gtttcaatcc 100
<210> 1186
<211> 100
<212> DNA
<213> 智人
<400> 1186
ccaaggaaac agaagtctac gggcccaggc ccaggtgagg gtggggtaag aagaggagct 60
taggatgcag atttgcatgg aggccccgcc ctcctctgag 100
<210> 1187
<211> 100
<212> DNA
<213> 智人
<400> 1187
gcatcagggt aagacaaggc tgggggcagg cccagtgctg gggtctcagg aggcagcgct 60
ctggggacgt ctccaccatg gcctgggctc tgctcctcct 100
<210> 1188
<211> 100
<212> DNA
<213> 智人
<400> 1188
ctcagggcac aggtgacgcc tccagggaag gggcctcggg gacccttggg ctgatccttg 60
gtctcctgct cctcaggctc acctgggccc agcactgact 100
<210> 1189
<211> 100
<212> DNA
<213> 智人
<400> 1189
ttgggagtta tgactatgtc tcctggtacc aacagcaccc aggcacagtc cccaaaccca 60
tgatctacaa tgtcaatact cagccctcag gggtccctga 100
<210> 1190
<211> 100
<212> DNA
<213> 智人
<400> 1190
tcgtttctct ggctccaagt ctggcaatac ggcctccatg accatctctg gactccaggc 60
tgaggacgag gctgattatt agtgctgctc atatacaagc 100
<210> 1191
<211> 100
<212> DNA
<213> 智人
<400> 1191
tgaggacgag gctgattatt agtgctgctc atatacaagc agtgccactt aaccacagtg 60
gtccaagttc ttggggaact gagacgaaaa cctgccctgg 100
<210> 1192
<211> 100
<212> DNA
<213> 智人
<400> 1192
cctgggctct caggctccct ttttgctctg aagatgtttc ctcacccagt gcaacgggct 60
tcctgaagca cagccttgag aattcttctc cctcagcaac 100
<210> 1193
<211> 100
<212> DNA
<213> 智人
<400> 1193
tctcttttcc caccatgaaa tccaaaggaa acctgctctg tggtttctca tccaggacag 60
ggacagcttc cttttgcttg tgtgttgtgg tccctgagtg 100
<210> 1194
<211> 100
<212> DNA
<213> 智人
<400> 1194
ggtgcaactc ttcctagctt tttaaattat gggagggtga caatgagctc cctgactggt 60
gcagtccctg ctgttttcag gaacatcctc atcctaaatg 100
<210> 1195
<211> 100
<212> DNA
<213> 智人
<400> 1195
catctgaatc tcccactgtg tgcagaccaa tctggacaga tgttattagg gggagtttcc 60
agaagccaca tcttactcaa ctctgtatcc accacactct 100
<210> 1196
<211> 100
<212> DNA
<213> 智人
<400> 1196
tgcctcagcc atggcatgga tccctctctt cctcggcgtc cttgcttact gcacaggtgc 60
tgcccctagg gtcctagcca ctggtccagt cccagggctc 100
<210> 1197
<211> 100
<212> DNA
<213> 智人
<400> 1197
tgggtccagc ctggccctga ctctgagctc agcagggccc ccgcctgtgg tgggcaggat 60
gctcatgacc ctgctgcagg tggatgggct cggcggggct 100
<210> 1198
<211> 100
<212> DNA
<213> 智人
<400> 1198
tgggcaggat gctcatgacc ctgctgcagg tggatgggct cggcggggct gaaatccccc 60
cacacagtgc tcatgtgctc acactgcctt agggctcttt 100
<210> 1199
<211> 100
<212> DNA
<213> 智人
<400> 1199
catccctgga tctgtgtcca ggccaggcac gtgggaagat ttacttggag ttcagctcct 60
cagtttcaag ccttttctct cccgttttct ctcctgtagg 100
<210> 1200
<211> 100
<212> DNA
<213> 智人
<400> 1200
atccgtggcc tcctatgagc tgactcagcc accctcagtg tccgtgtccc caggacagac 60
agccagcatc acctgctctg gagataaatt gggggataaa 100
<210> 1201
<211> 100
<212> DNA
<213> 智人
<400> 1201
caggacagac agccagcatc acctgctctg gagataaatt gggggataaa tatgcttgct 60
ggtatcagca gaagccaggc cagtcccctg tgctggtcat 100
<210> 1202
<211> 100
<212> DNA
<213> 智人
<400> 1202
ctatcaagat agcaagcggc cctcagggat ccctgagcga ttctctggct ccaactctgg 60
gaacacagcc actctgacca tcagcgggac ccaggctatg 100
<210> 1203
<211> 100
<212> DNA
<213> 智人
<400> 1203
gatgaggctg actattactg tcaggcgtgg gacagcagca ctgcacacag tgacacaggc 60
agatgcggaa gtgagacaga aaccagccac ctcggcctgg 100
<210> 1204
<211> 100
<212> DNA
<213> 智人
<400> 1204
ctcacaagac ccttccctct ctcctgccct gtcacactga gcaggaggga gccttccatg 60
tggaatggaa gtttccagtc ctatccctgc ccttatgttc 100
<210> 1205
<211> 100
<212> DNA
<213> 智人
<400> 1205
ctgagagacg ggagcaagtt cctgcccacc tctaggctca gcttatccca gaataaactg 60
agctagtcat tttgatgatc aaatgccagc tcccaaaaga 100
<210> 1206
<211> 100
<212> DNA
<213> 智人
<400> 1206
ccccagaaac cctgatatct aagtagcacc gactctatta gtatcaaggg agactagccc 60
tagggtggaa tcattttagt gtctcagaag gcacagggca 100
<210> 1207
<211> 100
<212> DNA
<213> 智人
<400> 1207
atggaaagtg tttatgaggt ttcaggatat gcacgtgagc agttaaaggc aggtcttaca 60
aggaaggaac ctactagaat tggggcccat ctgtgacatc 100
<210> 1208
<211> 100
<212> DNA
<213> 智人
<400> 1208
acatccctct gctttgggag agaagggcca gggcgggacc cagagagctc tgcagaggca 60
ccacagaccc tcagcagggg gtctgccaaa caggacagct 100
<210> 1209
<211> 100
<212> DNA
<213> 智人
<400> 1209
ggacttggct gcttctgccc aggcctggat ccagcccttg cacatctcag ggcaggggat 60
aggcctgggt ggccagagct gcagctgcac ctgctgggga 100
<210> 1210
<211> 100
<212> DNA
<213> 智人
<400> 1210
ggcctagtcc agtcctccag ggtccccaga cagactcgga tttccgactg cagccaccat 60
ggaaggatgt ggtctgcggt gacgatgtct atccagaggc 100
<210> 1211
<211> 100
<212> DNA
<213> 智人
<400> 1211
ccgaatatcc aaggagccca agatcagagg caggaatagg ccaagctccc cagtggagaa 60
gctgtgctgg accaggggtt tcccagggcc ctcccttgtg 100
<210> 1212
<211> 100
<212> DNA
<213> 智人
<400> 1212
ccctgaatga tgtctgttag ggcacctaca ccctgttact gctcagtgcc ttgcctattt 60
tgaaggacag ggatgtgtgg tgattatttg tataatccag 100
<210> 1213
<211> 100
<212> DNA
<213> 智人
<400> 1213
cccccagcac ctggtcctca aaagttaccc aagcaatgtg tataaagatc cagcctggag 60
atctttgaaa accgattcga tgagtcgaac cattaagtca 100
<210> 1214
<211> 100
<212> DNA
<213> 智人
<400> 1214
tgatcaccat cctcaacttc atctctttct tcctcctcct cctcattatc atcaccttca 60
agaactgtta agagtctgag acttcatcct atttgcagac 100
<210> 1215
<211> 100
<212> DNA
<213> 智人
<400> 1215
tcctcctcct cctcattatc atcaccttca agaactgtta agagtctgag acttcatcct 60
atttgcagac taaaaagtaa gcctgccaca gtgccatgga 100
<210> 1216
<211> 100
<212> DNA
<213> 智人
<400> 1216
tgctggcaga agatacaaga ctcctgggtc agagacaacg aataatctgt ttttcacagc 60
aatagcagtt gccaaggtat cagcattgtc ttgcaccagt 100
<210> 1217
<211> 100
<212> DNA
<213> 智人
<400> 1217
tccacaaggt gatgcaaaga gggccaggtg acatctgcat gccagagctc agggatccca 60
aatatttcat acttgacagt aagcatatat ctgtgttttg 100
<210> 1218
<211> 100
<212> DNA
<213> 智人
<400> 1218
ctccaaagag aggcattctc tgtaccttcc gaggttgttc actccacaaa cactcttgaa 60
aagataatcc acaatcagtg cctttgcccg agagacatgc 100
<210> 1219
<211> 100
<212> DNA
<213> 智人
<400> 1219
agaaatgcag agatccatag tagaccactg tctcccaaca accatcaact ttatcaatga 60
aatgaagtct caggctattt gtctgttacc atagcccaca 100
<210> 1220
<211> 100
<212> DNA
<213> 智人
<400> 1220
aaaatgtctg gcttgattgt caccaaatgt atcaaggaag ttaaggagta tctgacacaa 60
aatgtgaacc aagcaattct caaaggagcc tcccaggaaa 100
<210> 1221
<211> 100
<212> DNA
<213> 智人
<400> 1221
ttcactttag gaagtcctag gaggctcctc tgagagttgc taaaacaaaa cattgagagt 60
cctagagggc tgcagatctg aacttgagca gatattttta 100
<210> 1222
<211> 100
<212> DNA
<213> 智人
<400> 1222
aagattttgt ggcagaaaaa gaaactggaa agcaagaggg cagaccctca ttgcagttct 60
gtaatgtaag ggggcagagc aggggccttt ctcaccagag 100
<210> 1223
<211> 100
<212> DNA
<213> 智人
<400> 1223
gatattggac cctgcattca tcttctctgg atggtaattt tctcacctgt aaaacagaga 60
cactggcccc aaggacaccc cacaagtagt tgtgaatccc 100
<210> 1224
<211> 100
<212> DNA
<213> 智人
<400> 1224
aaagtaagag aagaacaaaa aaagaaccag aatttattca acacccactg agtgcttagc 60
aaacacatgg tttctttaac tctcataagc ttcatgctgc 100
<210> 1225
<211> 100
<212> DNA
<213> 智人
<400> 1225
agaggaactc tccccatttt acagataagg aaactgaggc ccagaggtaa cctaggtcta 60
gatagactcc acatttatga cttcaccact cttccttgcc 100
<210> 1226
<211> 100
<212> DNA
<213> 智人
<400> 1226
aaactgaggc ccagaggtaa cctaggtcta gatagactcc acatttatga cttcaccact 60
cttccttgcc tgaaggatat agaatcactc cctgcagggc 100
<210> 1227
<211> 100
<212> DNA
<213> 智人
<400> 1227
tcttgcctga ctcaggaaag ggccacagga tagccagcca ggcttaacca acccagccaa 60
gaaagggctg gtcccaactg gctggagtgc agtgtacagg 100
<210> 1228
<211> 100
<212> DNA
<213> 智人
<400> 1228
gttggtagat gcccctctgg gagagatccc caggggtgac agccatggac cctggaaggg 60
cctgggctag ggacagggac cagagccagt ccagggagag 100
<210> 1229
<211> 100
<212> DNA
<213> 智人
<400> 1229
gacagagcca atggactggg gtgtactgta acagccctgc tggcgagagg gaccagggca 60
ccgtcctcca gggagcccat gctgcaagtc gggccagagg 100
<210> 1230
<211> 100
<212> DNA
<213> 智人
<400> 1230
tgcccctgaa cctgaaggcc aatgagaccc aagacaggcc aagtgggttg tgagacccct 60
gaggagctgg gccctggtcc caggcagcgc tggcccctgc 100
<210> 1231
<211> 100
<212> DNA
<213> 智人
<400> 1231
tgctgctggg tctggccatg gtcgcccatg gcctgctgcg cccaatggtt gcaccgcaaa 60
gcggggaccc agaccctgga gcctcagttg gaagcagccg 100
<210> 1232
<211> 100
<212> DNA
<213> 智人
<400> 1232
atccagcctg cggagcctgt ggggcaggta aggggcaaga gattccaggg gatgtggggg 60
tcctgcagca gagctgggaa agggtgacca aggggagaca 100
<210> 1233
<211> 100
<212> DNA
<213> 智人
<400> 1233
agccagagga gtgaggagga aggttaaccc ctaagagggg cctgggctga cactggcttt 60
agtaatgggt tgatattttg tccatcacag atttgtttga 100
<210> 1234
<211> 100
<212> DNA
<213> 智人
<400> 1234
attactgttt ttaatatcat attacgatat tatttttctt gatttctgag ttttctggcg 60
ccacttaaat tttcaccagg gtcagtgcct caatcaccta 100
<210> 1235
<211> 100
<212> DNA
<213> 智人
<400> 1235
gtcctagtcc tctgggtagg gaaggaacag aggcagggac aggacatcca cagggggtgg 60
tggccactgt ccccacaggg tgcccaggcc tgttcctccc 100
<210> 1236
<211> 100
<212> DNA
<213> 智人
<400> 1236
cctcctcctc tctgcccatg tgcctcctgc ccagtgaggg caggggccac tccctggaga 60
aggcagcaag ggcttggttt ggtctccccc aaggctgtct 100
<210> 1237
<211> 100
<212> DNA
<213> 智人
<400> 1237
gttcaccaac ttgcacataa atgcttactg gggccaggct caaggacaca gggagggtgg 60
gatgaaccga ggggagctgt ccagtcattg gaacaggccc 100
<210> 1238
<211> 100
<212> DNA
<213> 智人
<400> 1238
acggcccatg tttggagcaa taaagggaga ggggatctcc ctctgggatg atgcccaggc 60
tggtctcaca gatcgagggg cactggctgg tgatgggtgc 100
<210> 1239
<211> 100
<212> DNA
<213> 智人
<400> 1239
tggtctcaca gatcgagggg cactggctgg tgatgggtgc ccccaaaaga cagagcagcg 60
tcagaggaga ggagagcaca ggatgaggct gggagctcct 100
<210> 1240
<211> 100
<212> DNA
<213> 智人
<400> 1240
gggtgactgg gaaggggagg caagaagacc atagggtccg tgcaccattc ccagtccagg 60
acgagtcctt ggatggattt aggtagattg attatcagag 100
<210> 1241
<211> 100
<212> DNA
<213> 智人
<400> 1241
tcagatttgt gtttttggaa aaatcagcac cggattggag gctgatgcga cgcccgatta 60
gaggagggag gagagggggt gatggccaag tccagggtag 100
<210> 1242
<211> 100
<212> DNA
<213> 智人
<400> 1242
gtggggatcc tggaggaagc cgtgccttgg ggatggggag gacactcaga ttcagagcac 60
ccaggggccc agtttcctat gaaatgggag catgaagttg 100
<210> 1243
<211> 100
<212> DNA
<213> 智人
<400> 1243
aagtgagggc tgagcagagg ggagcagaca cgctcgggga ctgtctatgg gcattaaaaa 60
tgtataacca ttttagcaac aggcggcgag tcaaaaaaca 100
<210> 1244
<211> 100
<212> DNA
<213> 智人
<400> 1244
aagtgtgttt atctaaactg ggcaattcca cttctaggaa tttatcctaa gggttggttg 60
ggggaataat caaagctgta accaaatctt tataacaagg 100
<210> 1245
<211> 100
<212> DNA
<213> 智人
<400> 1245
gtggttagct cagcattatt agtgatggga gaaaactgga aaaaatccaa atatctacca 60
gaaagggtgt gaaaaaacac aattgtattt gggggactgt 100
<210> 1246
<211> 100
<212> DNA
<213> 智人
<400> 1246
tggctaattt tgattaggat tattattagt ttagagacag agcctcgcta tattgctcag 60
gcctgtctca aattcctaag ctcaagcaat ctttctgcct 100
<210> 1247
<211> 100
<212> DNA
<213> 智人
<400> 1247
actgcacctg acccaactgt gtttttaaag tatatatgca ttttcaaaaa cctgtcagaa 60
aatatagaaa aatgtcaatg gtgtgtctgg ctggctgatg 100
<210> 1248
<211> 100
<212> DNA
<213> 智人
<400> 1248
ggatttcacc taattttaat gtggctttat aattttctgg ttttgtgaag ttgttcacaa 60
aaagagacat ttcttctaat ataattttta atacaacagt 100
<210> 1249
<211> 100
<212> DNA
<213> 智人
<400> 1249
aatgtactca tgtgcattac tctttttgta atgagtatat tacaaaatgt aatgactttt 60
gtacattact cttttttctt gccaaaaaaa aaaaagatta 100
<210> 1250
<211> 100
<212> DNA
<213> 智人
<400> 1250
agcagagaag tatataaagt aaaagcaagt gcttctgctt accatctctc acctcttccc 60
agagatagcc actgtcaggt tggtcaatat acttccagaa 100
<210> 1251
<211> 100
<212> DNA
<213> 智人
<400> 1251
cttttcctgt gtgtgtgtgt gtccctgaaa acacacacac acacacacac acacacacac 60
acagttggtg ctgggatttt attttgcaaa agtaagagcc 100
<210> 1252
<211> 100
<212> DNA
<213> 智人
<400> 1252
cacacacagt tggtgctggg attttatttt gcaaaagtaa gagccatatt ctgcatatta 60
ccaactttta atctattatt gacactttct gtatcagtcc 100
<210> 1253
<211> 100
<212> DNA
<213> 智人
<400> 1253
atatggatta accacattca ttgcttataa actttgtttt ataagcaaag tttagatgag 60
ccagaattta tttccactaa aaaatctaaa tgacaaatga 100
<210> 1254
<211> 100
<212> DNA
<213> 智人
<400> 1254
tgctgcagtg gaaatttgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 60
tgtatgtgta caaagtgcac ttatatatct ccccaggata 100
<210> 1255
<211> 100
<212> DNA
<213> 智人
<400> 1255
tgacctgggt gtttttcttt ttctctgtag gatgttaata gtatcttgtg tcatgctagg 60
atgtctagga cagagggcaa tacaatgagg ggaaggcatt 100
<210> 1256
<211> 100
<212> DNA
<213> 智人
<400> 1256
ctgcgatgtc cccaggcctc tggcttgaag agtaacttgc tgaagtgagg actctgtgga 60
ggagcaagtt atacagaaag aagtttagtt gtgatctgtt 100
<210> 1257
<211> 100
<212> DNA
<213> 智人
<400> 1257
gagttggagg tgtctacagg gcatccaagc agacataggt tgaggaggca gaatatatgt 60
gaatctggag ccaagaagag aggtaagggc tggaaatagg 100
<210> 1258
<211> 100
<212> DNA
<213> 智人
<400> 1258
gatctaagac ccctggacag ttgtgagtgt gcacaatgag ggtcagatgc agagaaaatt 60
aggagactac agagagcaga acccagggtg gggatctggg 100
<210> 1259
<211> 100
<212> DNA
<213> 智人
<400> 1259
agtcagcagt tgggcatggg cctggtagaa agggaagcca aggaggagga gagggggcag 60
tctcagacac caaggagggg agagtgacta gaaagaaaac 100
<210> 1260
<211> 100
<212> DNA
<213> 智人
<400> 1260
cttcttgcag agacataggg gatggggaag aactgcagac tgaactgggg caaaggactg 60
ttggccttaa ccagagagat ttgagggaga gatgaggctg 100
<210> 1261
<211> 100
<212> DNA
<213> 智人
<400> 1261
agagccaggg gatcctgcca tgtcccagca taaaaacagt acctgacaca gatgggtgct 60
tgggagctgt tgtcggatga atgagtggac agatgcatgg 100
<210> 1262
<211> 100
<212> DNA
<213> 智人
<400> 1262
atggacggat ggatggaagg atgatagatt gatggacaaa cagatgaaca gatgaatagc 60
tggatggaca actggatgga tgggtagaca gaatgatctc 100
<210> 1263
<211> 100
<212> DNA
<213> 智人
<400> 1263
agagatcaga aaaagcttca tgcactaagt gggactgaac cgcgtctcca tgggtagaaa 60
gcagaggaat ctccacttga gtcaggaatg acccagtgct 100
<210> 1264
<211> 100
<212> DNA
<213> 智人
<400> 1264
ctcaatccag ggagaaagcc agcctggctt cactggggac acttgtgtgg gggactcaga 60
ggccctttaa atgaggccag acgaggttgg acaggtccaa 100
<210> 1265
<211> 100
<212> DNA
<213> 智人
<400> 1265
gccaactcag cactcctctg ccacactgca caggagggga tgtgtcactc agggagttgc 60
tgggacctat gggtcccagt gttgtcatca gcaccgacag 100
<210> 1266
<211> 100
<212> DNA
<213> 智人
<400> 1266
cctcagagag gaaagacaca cactggggta actccaaggc tgtgtgtggc acttgccttg 60
gacagcagac aggcacaggg acacctctag ggggctggcc 100
<210> 1267
<211> 100
<212> DNA
<213> 智人
<400> 1267
acccccctgc ctcatgtcta ggtcccagcc ccgcccactg caaccctgtg cccgtcatgc 60
ccagcaggct cctgctccag cccagccccc agagagcaga 100
<210> 1268
<211> 100
<212> DNA
<213> 智人
<400> 1268
cactgcaacc ctgtgcccgt catgcccagc aggctcctgc tccagcccag cccccagaga 60
gcagacccca ggtgctggcc ccgggggttt tggtctgagc 100
<210> 1269
<211> 100
<212> DNA
<213> 智人
<400> 1269
ctcagtcact gtgttatgtc ttcggaactg ggaccaaggt caccgtccta ggtaagtggc 60
tctcaacctt tcccagcctg tctcaccctc tgctgtccct 100
<210> 1270
<211> 100
<212> DNA
<213> 智人
<400> 1270
ggaaaatctg ttttctctct ctggggcttc ctcccctctg tcctcccagc cttaagcact 60
gacccttacc tttctccatg gggcctggag gaggtgcatt 100
<210> 1271
<211> 100
<212> DNA
<213> 智人
<400> 1271
agtctccggg taaccggcag gaagggcctc cacagtggga gcagccggat gcagcctggt 60
cccggggcct gagctgggat tgggcagggt cagggctcct 100
<210> 1272
<211> 100
<212> DNA
<213> 智人
<400> 1272
cctctcttcc agggcagatg tctgagtgag ggacagaggc tggttctgat gaggggccct 60
gcagtgtcct tagggacatt gcccagtgac tcctggggtc 100
<210> 1273
<211> 100
<212> DNA
<213> 智人
<400> 1273
ggacagaggc tggttctgat gaggggccct gcagtgtcct tagggacatt gcccagtgac 60
tcctggggtc aaggacagag gctgctgggg tgggcctggg 100
<210> 1274
<211> 100
<212> DNA
<213> 智人
<400> 1274
agctgctgag tctcatagtc taggggagca gccccaagaa cagctgaggg tctaggctga 60
ggactggatg ccaatccagc ctgggagggc cacacggcct 100
<210> 1275
<211> 100
<212> DNA
<213> 智人
<400> 1275
tctcatagtc taggggagca gccccaagaa cagctgaggg tctaggctga ggactggatg 60
ccaatccagc ctgggagggc cacacggcct ggtgacacag 100
<210> 1276
<211> 100
<212> DNA
<213> 智人
<400> 1276
aggtcacccc aaggggagac caatggaggg cacagagagg gctctgggtc taggctgcag 60
ctctgtggcc tgtgctgggt catgaggaca tggggacaca 100
<210> 1277
<211> 100
<212> DNA
<213> 智人
<400> 1277
tgtgctgggt catgaggaca tggggacaca gagggacggg tgagactggg tgaggtgcca 60
gaatccaacc ctcccaggac agtcaccaga aaggagacag 100
<210> 1278
<211> 100
<212> DNA
<213> 智人
<400> 1278
tctcttaggg cagagatgtg tctgtccctg gagccccgtc acctctgggg cccagtgtct 60
ctctgttcac ggatcggcct cctgccttcc tcaaagggca 100
<210> 1279
<211> 100
<212> DNA
<213> 智人
<400> 1279
tgttagactc aggaaatgac cagaggggag tgaatgaggg gtgcagagaa ctccatggct 60
accaggtgaa gtttggggtc atcacaggct gctggggtgg 100
<210> 1280
<211> 100
<212> DNA
<213> 智人
<400> 1280
catagtctgt gggagcagcc ccaggaacag ctgaggtgaa gggttctgtg gtcgggcttg 60
tggagacagg aaacatctca gagcctcaga ggagccctga 100
<210> 1281
<211> 100
<212> DNA
<213> 智人
<400> 1281
ggcttgtcta ggtggagccc actccttgcc aggagagcca agtgggctgg gctggggcag 60
agcccggtgc ctgtgaggga taggaagctc cagttcaaag 100
<210> 1282
<211> 100
<212> DNA
<213> 智人
<400> 1282
caggcttggg tctccccaca cactgcctgc caggacagtc ctacaggatg agcaggggac 60
ccacagttca cggaggaggc tctaggtcct ggaagaataa 100
<210> 1283
<211> 100
<212> DNA
<213> 智人
<400> 1283
agtgggtgat ggaggggggt atagggatgg aaatgaggga tccaggggtc aaggccagat 60
tctaaactca gactccagag atcagagaag aaggaacaca 100
<210> 1284
<211> 100
<212> DNA
<213> 智人
<400> 1284
gcctgccctg ggtatatgga gaaattgagg ctgtagagga gaggggctgg gccaggacac 60
ctgtgaaagg tgacttggga gggctcctag gaaggcacag 100
<210> 1285
<211> 100
<212> DNA
<213> 智人
<400> 1285
tgaaagcccc actgctatga ccaggtagcc gggacgtggg gtggatgcca gaaaagactc 60
cacggaataa gagagagccc aggacagcag gcaggctctc 100
<210> 1286
<211> 100
<212> DNA
<213> 智人
<400> 1286
cgatcccccc aggcccttgc cccatacacg ggctccagaa cacacatttg gctggaacag 60
cctgagggac caaaaggccc cagtatccca cagagctgag 100
<210> 1287
<211> 100
<212> DNA
<213> 智人
<400> 1287
gagccaggcc agaaaagtaa ccccagagtt cgctgtgcag gggagacaca gagctctctt 60
tatctgtcag gatggcagga ggggacaggg tcagggcgct 100
<210> 1288
<211> 100
<212> DNA
<213> 智人
<400> 1288
gagggtcaga tgtcggtgtt gggggccaag gccccgagag atctcaggac aggtggtcag 60
gtgtctaagg taaaacagct ccccgtgcag atcagggcat 100
<210> 1289
<211> 100
<212> DNA
<213> 智人
<400> 1289
atgcaggaca gtccggagag ggaaatcagg agaagtgaag gggtctctgg ggagcccaga 60
tgtgggctag aggcagaagt aagggtgaag agcacctatg 100
<210> 1290
<211> 100
<212> DNA
<213> 智人
<400> 1290
agtcaatgtc atggtctcag caggaacaca gttgaaaatc cccattccac acaagaccgt 60
ttagcaggaa aggagtccat acttgtgctg ccaccaggat 100
<210> 1291
<211> 100
<212> DNA
<213> 智人
<400> 1291
gtcctgagaa gccttggaga atgaaacata caggtgcatt tcctagactt gacaatgcac 60
gttagccaag taaaggcaat gaaaagttct ctactaggga 100
<210> 1292
<211> 100
<212> DNA
<213> 智人
<400> 1292
tttgtttgtt tctgtatctt gtctcaactt gtggtcagcc tttctccctg catcccaggc 60
ctgagcaagg acctctgccc tccctgttca gacccttgct 100
<210> 1293
<211> 100
<212> DNA
<213> 智人
<400> 1293
tgcctcagca ggtcactaca accacttcac ctctgaccgc aggggcaggg gactagatag 60
aatgacctac tgagcctcgt ctgtctgtct gtctgtctgt 100
<210> 1294
<211> 100
<212> DNA
<213> 智人
<400> 1294
ctgtttgtct ctctgtctgt ctgacaggcg caggctgggt ctctaagcct tgttctgttc 60
tggcctcctc agtctgggtt cttgtcggaa cagctttgcc 100
<210> 1295
<211> 100
<212> DNA
<213> 智人
<400> 1295
cttgggttac ctgggttcca tctcctgggg aattgggaac aaggggtctg agggaggcac 60
ctcctgggag actttagaag gacccagtgc cctcggggct 100
<210> 1296
<211> 100
<212> DNA
<213> 智人
<400> 1296
agagttcgct gtgcagggga gacacagagc tctctttatc tgtcaggatg gcaggagggg 60
acagggtcag ggcgctgagg gtcagatgtc ggtgttgggg 100
<210> 1297
<211> 100
<212> DNA
<213> 智人
<400> 1297
gccaaggccc cgagagatct caggacaggt ggtcaggtgt ctaaggtaaa acagctcccc 60
gtgcagatca ggacatagtg gaaaacaccc tgacccctct 100
<210> 1298
<211> 100
<212> DNA
<213> 智人
<400> 1298
gcctggcata gaccttcaga cacagagccc ctgaacaagg gcaccccaac acctcatcat 60
atactgaggt caggggctcc ccaggtggac accaggactc 100
<210> 1299
<211> 100
<212> DNA
<213> 智人
<400> 1299
agaatattcc gtgagaaggt ggccccacag cgctgggtca cacgccatcc cccaagacag 60
gcaggacacc acagacaggg tggtgggtct cagaaaactc 100
<210> 1300
<211> 100
<212> DNA
<213> 智人
<400> 1300
aggccctaaa cgtggatgct taccaattcc tccactggag gaagacctca gagcagatgc 60
ccaggacagg gacttctggt agggacggtg actgggacgg 100
<210> 1301
<211> 100
<212> DNA
<213> 智人
<400> 1301
gtgcctgttt gtcagggaaa acccactgga gagtcagatc ccccagataa cttctcacga 60
catggagact ctttcgaaca gacaaagctc cacgttcagc 100
<210> 1302
<211> 100
<212> DNA
<213> 智人
<400> 1302
tcagggagta aaaaaaaaat gcctcaaatg gaggcctttg atctactgga atccagcccc 60
caggactgac accctgtctc accaggcagc ccagaggggt 100
<210> 1303
<211> 100
<212> DNA
<213> 智人
<400> 1303
cagggtccac cagaaggcat ctcagaacca gccagcagtg gccctgattg tcagcaggac 60
cccagggagg ggggtggcca ggacagggct ctgaagcccc 100
<210> 1304
<211> 100
<212> DNA
<213> 智人
<400> 1304
caccccagga ccttccctgg gcagaacgag ttggtgaggg agtgatgagc aaccacaggc 60
ctcctaactt cccaagctgg cgattctgag aggcctcaag 100
<210> 1305
<211> 100
<212> DNA
<213> 智人
<400> 1305
gctgagacac ggttcagcct tttaggccct cctgaacgtg tcccctgtct ccacagcctg 60
ggaatgcact ctcttttgac ccagaaatcc tgctcataag 100
<210> 1306
<211> 100
<212> DNA
<213> 智人
<400> 1306
ctgtcattgt acaacacatc atttcacttt gtttttcaaa catagtgaat tctttcctaa 60
ttaaagaaga aaagagtata aagagaaagt ttccagtgca 100
<210> 1307
<211> 100
<212> DNA
<213> 智人
<400> 1307
gtataaagag aaagtttcca gtgcagcctg gagatctgta ctggttgtat ctggaattcc 60
agactcagcc ttgcatttca catagcagat agatgatgat 100
<210> 1308
<211> 100
<212> DNA
<213> 智人
<400> 1308
gatggagaag gagaagaaga aggaggagga ggaggaaaga aggaagaaga agaagaagag 60
gaggaggaag aagaagacga agggaagaag aagaaggatg 100
<210> 1309
<211> 100
<212> DNA
<213> 智人
<400> 1309
tccaggtctg ccaggtgtag gggaggtgtg actggttcca tcatggaccg gttcctccat 60
ggaccggttc ctccgtggac cggttccgcc atggaccggt 100
<210> 1310
<211> 100
<212> DNA
<213> 智人
<400> 1310
tccgccatgg accactcctg ccctggacca ctcctgccct ggaccggttc tgccgtggac 60
tggttcccgc cgtggaccag ttcccgctgt atactggttc 100
<210> 1311
<211> 100
<212> DNA
<213> 智人
<400> 1311
tgccctggac tggttcccgc tgtggactgg ttccttgggg ctctaagtgc ggaagggccc 60
agagctggtc cctgcccagc gccctgctag ggctgtgtcc 100
<210> 1312
<211> 100
<212> DNA
<213> 智人
<400> 1312
tcgtactcgt gcgcctcgct tcggtgagcc ccagggcccc tgcctccttc ctcctgccgt 60
cctgcctccg tccccgccct ttcatcatcc gcgtccctgt 100
<210> 1313
<211> 100
<212> DNA
<213> 智人
<400> 1313
gaaggcattc cctaaatccg agcccgagtg gttctccccg ggaaggctac tttggggagc 60
tggggggatg cgaaacaccc tagatactgg ataatggggt 100
<210> 1314
<211> 100
<212> DNA
<213> 智人
<400> 1314
ggggaaatcg atgatttaag aacaaaaccg aaaaactggc gttttgccgt gccgctcgga 60
ggggacatta aaaaatttct tagtgtttgc ccgcaaaggt 100
<210> 1315
<211> 100
<212> DNA
<213> 智人
<400> 1315
tagtgtttgc ccgcaaaggt attgtgcgtt gccttggagg ctgagatatg ggggaataga 60
caagtccttt gttctgaggt tcatcttccg agccccgagc 100
<210> 1316
<211> 100
<212> DNA
<213> 智人
<400> 1316
ctcctcccag cctcggacgg ctgcgcgggc tgcatctgtg cagcctggcg gcggcggggc 60
tgtgctatga catctttaca gtccttcttg cagagacatg 100
<210> 1317
<211> 100
<212> DNA
<213> 智人
<400> 1317
tgtgccaggg atgccgaatt gccgggagag caggcaagac cggcttcggg gcgcgcggcg 60
gccgctttgt gtgcggggct gcattgtgac gcgggcgatg 100
<210> 1318
<211> 100
<212> DNA
<213> 智人
<400> 1318
aagccggtag ggcggtggtc ggaagctcca gccgcggccg ccgcctttgt gagaggacta 60
gaaagccgga tccggcccgc atccttgcgg agaggccgcg 100
<210> 1319
<211> 100
<212> DNA
<213> 智人
<400> 1319
gctaggaaat ggaaacgctt ttcctacctg ggctccattt taggaattct tgccgatttt 60
tcccacttga atttggaagt ggctttcctc ttctttcctt 100
<210> 1320
<211> 100
<212> DNA
<213> 智人
<400> 1320
gtcctagcca gcctttaatt ttaaacgctg taattaacaa ttcgcagtgg tcaatttcct 60
ttattctgca agattcggct ttgagaggca tccgccctct 100
<210> 1321
<211> 100
<212> DNA
<213> 智人
<400> 1321
ttggtccaca gcgttttgaa atatggggag gaggggcgcg gggggtgtcg cctctttttc 60
tgtagaaaga ggaagctcgt gagcgcggaa cggcagcagt 100
<210> 1322
<211> 100
<212> DNA
<213> 智人
<400> 1322
aagtgcagtt cccagcccag agacagcggg gcgggtggct cttcctcacg ctcgctcttg 60
gcttgctccc tgcagctttt cctccgcaac catgtctgac 100
<210> 1323
<211> 100
<212> DNA
<213> 智人
<400> 1323
aaacccgata tggctgagat cgagaaattc gataagtcga aactgaagaa gacagagacg 60
caagagaaaa atccactgcc ttccaaagaa agtgagctcc 100
<210> 1324
<211> 100
<212> DNA
<213> 智人
<400> 1324
agacgcaaga gaaaaatcca ctgccttcca aagaaagtga gctccgaccc acccccatct 60
ttagaaaggc tgggtgggag cggccggtgg gagggcggga 100
<210> 1325
<211> 100
<212> DNA
<213> 智人
<400> 1325
tttatagaaa ggcatatgga acaggagtca tccaaatata tcccaggggt tgcaaattga 60
ccaaaagagt cacctttagg gaagcctgct tctgaatgct 100
<210> 1326
<211> 100
<212> DNA
<213> 智人
<400> 1326
tgtggaattt atcattcttc tgaatggctg ttgcatttat ctgcagcttt tactcaccag 60
atgagacctc agacatttca aattctgcgg aggctggcta 100
<210> 1327
<211> 100
<212> DNA
<213> 智人
<400> 1327
cacaccttca taggaaagct ttttgctgat ttccctgttg gtacttttct cttacacatt 60
ctatggggta tggtaaacct ggaggtagag tcatagccaa 100
<210> 1328
<211> 100
<212> DNA
<213> 智人
<400> 1328
gcacagataa agcaggcaca gaatctctga ccagcctcac aaaagcagac aaacacacaa 60
tctttttgca cctgtttctt ccactccggt tgccgtgaat 100
<210> 1329
<211> 100
<212> DNA
<213> 智人
<400> 1329
tagaaatggt tcaaccagtc caatatcaat atagctgctt attactctat tcacttactt 60
caaagtggca tttgttttga gtaagacttt atttaattct 100
<210> 1330
<211> 100
<212> DNA
<213> 智人
<400> 1330
taccgttagc ttgaaaccat agagatcttc tctctatttg ccctacttcc ttcaaaagtc 60
aaatgacctc ctacaaataa aagacgttct tattttcatt 100
<210> 1331
<211> 150
<212> DNA
<213> 智人
<400> 1331
cgactacgac tcggtgcagc cgtatttcta ctgcgacgag gaggagaact tctaccagca 60
gcagcagcag agcgagctgc agcccccggc gcccagcgag gatatctgga agaaattcga 120
gctgctgccc accccgcccc tgtcccctag 150
<210> 1332
<211> 150
<212> DNA
<213> 智人
<400> 1332
cgactacgac tcggtgcagc cgtagttcta ctgcgacgag gaggaaaact tctaccagca 60
gcagcagcag agcgagctgc agcccctggc gcccagcgag gatatctgga agaacttcga 120
gctgctgccc accccgcccc tgtcccctag 150
<210> 1333
<211> 150
<212> DNA
<213> 智人
<400> 1333
cgactacgac tcggtgcagc cgtagttcta ctgcgacgag gaggaatact tctaccagca 60
gcagccgcag agcgagctgc agcccctggc gcccagcgag ggtatctgga agaacttcga 120
gctactgccc accccgcccc tgtcccctag 150
<210> 1334
<211> 150
<212> DNA
<213> 智人
<400> 1334
cgactacgac tcgttgcagc cgtagttcta ctgcgacgag gaggaatact tctaccagca 60
gcagccgcag agcgagctgc agcgcctggc gcccagcgag ggtatctgga agaacttcga 120
gctacagccc accccgcccc tgtcccctag 150
<210> 1335
<211> 150
<212> DNA
<213> 智人
<400> 1335
cgactacgac tcgttgcagc cgtagatcta ctgcgacgag gaggaatact tctacctgca 60
gcagccgcag agcgagctgc agcgcctggc gcccagcgag cgtatctgga agaacttcga 120
gctacagccc accccgccct tgtcccctag 150
<210> 1336
<211> 150
<212> DNA
<213> 智人
<400> 1336
cgacaacgac tcgttgcacc cgtagatcta ctgcgacgag gaggaatact tctacctgca 60
gcagccgcag agcgagctgc agcgcctggc gcccagcgag cgtatctgaa agaacttcga 120
gctacagccc acgccgccct tgtcccctag 150
<210> 1337
<211> 150
<212> DNA
<213> 智人
<400> 1337
cgacaacgac tcgttgcacc cgtagatcta ctgcgacgag gaggaatact tctacctgca 60
gcagccgcag agcgagctgc agcgcctggc gcccagcgag cgtatctgaa agaacttcga 120
gctacagccc acgccgccct tgtcccctag 150
<210> 1338
<211> 150
<212> DNA
<213> 智人
<400> 1338
gctcacctgt acaaatctgg ctccgcaggt ttcgcatttg tagggcttct ctccagagtg 60
aattcgagtg tgggttttca ggttggctgg ccggttgaac tgggccccac agatgttgca 120
acgatagggt ttctcaccta ttaccaagaa 150
<210> 1339
<211> 150
<212> DNA
<213> 智人
<400> 1339
gctcacctgt acaaatctgc ctccgcaggt ttcgcatttg tagggctcct ctccagagtg 60
aattcgagtg tgggttttca ggttggctgg gcggttgaac tgggccccac agatgttgca 120
acgctagggt ttctcaccta ttaccaagaa 150
<210> 1340
<211> 150
<212> DNA
<213> 智人
<400> 1340
gctcacctgt acaaatctgc ctccgcaggt ttcgcctttg tagggctcct ctccagagtg 60
aattcgagtg taggttttca agttggctgg gcggttgaac tgggccccac ggatgttgca 120
acgctagggt ttctcaccta ttaccaagaa 150
<210> 1341
<211> 150
<212> DNA
<213> 智人
<400> 1341
gctcacctgt acaaatctgc ctccgccggt ttcgcctttt tagggctcct ctccagagtg 60
aattcgagtg taggttttca agttggctgg gcggttgaac tgggccccac ggatgttgca 120
acgctagggt ttctcaccta tttccaagaa 150
<210> 1342
<211> 150
<212> DNA
<213> 智人
<400> 1342
gctcacctgt acaagtctgc ctccgccggt tacgcctttt tagggctcct ctccagagtg 60
aattcgagtg taggttttca agttggctgg gcggttgaac tgggctccac ggatgttgca 120
acgctaggga ttctcaccta tttccaagaa 150
<210> 1343
<211> 150
<212> DNA
<213> 智人
<400> 1343
gctcacctgg acaagtctgc ctccgccggt tacgactttt tagggctcct ctccagagtg 60
aattcgagtg taggctttca agttggctgg gcggttgaac tgggctccac ggctgttgca 120
acgctaggga ttctcaccta tttccaagaa 150
<210> 1344
<211> 150
<212> DNA
<213> 智人
<400> 1344
gctcacctgg acaagtctgc ctccgccggt tacgactttt tagggcacct ctccagagtg 60
aattcgagtg taggctttca agttggctgg gagcttgaac tgggctgcac ggctgttgca 120
acgctaggga ttctcaccta tttccaagaa 150
<210> 1345
<211> 150
<212> DNA
<213> 智人
<400> 1345
ctaggggaca ggggcggggt gggcagcagc tcgaatttct tccagatatc ctcgctgggc 60
gccgggggct gcagctcgct ctgctgctgc tgctggtaga agttctcctc ctcgtcgcag 120
tagaaatacg gctgcaccga gtcgtagtcg 150
<210> 1346
<211> 150
<212> DNA
<213> 智人
<400> 1346
ctaggggaca ggggcggggt gggcagcagc tcgaagttct tccagatatc ctcgctgggc 60
gccaggggct gcagctcgct ctgctgctgc tgctggtaga agttttcctc ctcgtcgcag 120
tagaactacg gctgcaccga gtcgtagtcg 150
<210> 1347
<211> 150
<212> DNA
<213> 智人
<400> 1347
ctaggggaca ggggcggggt gggcagtagc tcgaagttct tccagatacc ctcgctgggc 60
gccaggggct gcagctcgct ctgcggctgc tgctggtaga agtattcctc ctcgtcgcag 120
tagaactacg gctgcaccga gtcgtagtcg 150
<210> 1348
<211> 150
<212> DNA
<213> 智人
<400> 1348
ctaggggaca ggggcggggt gggctgtagc tcgaagttct tccagatacc ctcgctgggc 60
gccaggcgct gcagctcgct ctgcggctgc tgctggtaga agtattcctc ctcgtcgcag 120
tagaactacg gctgcaacga gtcgtagtcg 150
<210> 1349
<211> 150
<212> DNA
<213> 智人
<400> 1349
ctaggggaca agggcggggt gggctgtagc tcgaagttct tccagatacg ctcgctgggc 60
gccaggcgct gcagctcgct ctgcggctgc tgcaggtaga agtattcctc ctcgtcgcag 120
tagatctacg gctgcaacga gtcgtagtcg 150
<210> 1350
<211> 150
<212> DNA
<213> 智人
<400> 1350
ctaggggaca agggcggcgt gggctgtagc tcgaagttct ttcagatacg ctcgctgggc 60
gccaggcgct gcagctcgct ctgcggctgc tgcaggtaga agtattcctc ctcgtcgcag 120
tagatctacg ggtgcaacga gtcgttgtcg 150
<210> 1351
<211> 150
<212> DNA
<213> 智人
<400> 1351
ctaggcgaca agggcggcgt gggctgtagc tcgaagttct ttcagatacg ctcggtgggc 60
gccaggcgct gcagcacgct ctgcggctgc tgcaggtaga agtattcctc ctcgtcgcag 120
tagatctacg ggtgcaacga gtcgctgtcg 150
<210> 1352
<211> 150
<212> DNA
<213> 智人
<400> 1352
ttcttggtaa taggtgagaa accctatcgt tgcaacatct gtggggccca gttcaaccgg 60
ccagccaacc tgaaaaccca cactcgaatt cactctggag agaagcccta caaatgcgaa 120
acctgcggag ccagatttgt acaggtgagc 150
<210> 1353
<211> 150
<212> DNA
<213> 智人
<400> 1353
ttcttggtaa taggtgagaa accctagcgt tgcaacatct gtggggccca gttcaaccgc 60
ccagccaacc tgaaaaccca cactcgaatt cactctggag aggagcccta caaatgcgaa 120
acctgcggag gcagatttgt acaggtgagc 150
<210> 1354
<211> 150
<212> DNA
<213> 智人
<400> 1354
ttcttggtaa taggtgagaa accctagcgt tgcaacatcc gtggggccca gttcaaccgc 60
ccagccaact tgaaaaccta cactcgaatt cactctggag aggagcccta caaaggcgaa 120
acctgcggag gcagatttgt acaggtgagc 150
<210> 1355
<211> 150
<212> DNA
<213> 智人
<400> 1355
ttcttggaaa taggtgagaa accctagcgt tgcaacatcc gtggggccca gttcaaccgc 60
ccagccaact tgaaaaccta cactcgaatt cactctggag aggagcccta aaaaggcgaa 120
accggcggag gcagatttgt acaggtgagc 150
<210> 1356
<211> 150
<212> DNA
<213> 智人
<400> 1356
ttcttggaaa taggtgagaa tccctagcgt tgcaacatcc gtggagccca gttcaaccgc 60
ccagccaact tgaaaaccta cactcgaatt cactctggag aggagcccta aaaaggcgta 120
accggcggag gcagacttgt acaggtgagc 150
<210> 1357
<211> 150
<212> DNA
<213> 智人
<400> 1357
ttcttggaaa taggtgagaa tccctagcgt tgcaacagcc gtggagccca gttcaaccgc 60
ccagccaact tgaaagccta cactcgaatt cactctggag aggagcccta aaaagtcgta 120
accggcggag gcagacttgt ccaggtgagc 150
<210> 1358
<211> 150
<212> DNA
<213> 智人
<400> 1358
ttcttggaaa taggtgagaa tccctagcgt tgcaacagcc gtgcagccca gttcaagctc 60
ccagccaact tgaaagccta cactcgaatt cactctggag aggtgcccta aaaagtcgta 120
accggcggag gcagacttgt ccaggtgagc 150

Claims (30)

1.一种用于从受试者的肿瘤样品鉴定经验证的定相变异的集合的方法,所述方法包括:
(a)通过计算机系统从受试者的肿瘤样品获得测序数据;
(b)通过计算机系统从受试者的匹配的非肿瘤样品获得测序数据;
(c)使用计算机系统分析来自肿瘤样品的测序数据和来自匹配的非肿瘤样品的测序数据,以鉴定受试者的基因组的包含第一推定的定相变异和第二推定的定相变异的多个区域,其中多个区域中的每一个的长度不超过170个碱基对;
(d)在(c)之后,对来自受试者的肿瘤样品的来自(c)中鉴定的多个区域的核酸进行靶向测序至至少250×的深度;
(e)使用计算机系统,基于来自(d)中的靶向测序的测序数据,从受试者的肿瘤样品鉴定经验证的定相变异的集合。
2.权利要求1的方法,其中所述第一推定的定相变异和所述第二推定的定相变异被至少一个核苷酸隔开。
3.权利要求1至2中任一项的方法,其中(c)还包括:
确定受试者的基因组中相对于匹配的非肿瘤样品存在于肿瘤样品中的多个单核苷酸变异;和
至少部分地基于以下中的一项或多项从所鉴定的多个单核苷酸变异鉴定基因组的包含第一定相变异和第二定相变异的多个区域:(1)基因组内所鉴定的多个单核苷酸变异中的两个或更多个的接近度和(2)在来自受试者的肿瘤样品的序列数据的单个读数上,所鉴定的多个单核苷酸变异中的两个或更多个的存在。
4.权利要求3的方法,其中(a)和(b)中来自受试者的肿瘤样品的测序数据各自包含受试者的至少50%的基因组的数据。
5.权利要求4的方法,其中(c)还包括将来自肿瘤样品的测序数据和来自匹配的非肿瘤样品的测序数据与基因组进行比对。
6.权利要求5的方法,其中来自肿瘤样品的测序数据和来自匹配的非肿瘤样品的测序数据以10×至100×的深度获得。
7.权利要求6的方法,其中(c)中所鉴定的基因组的多个区域具有至少400个区域且不超过15,000个区域。
8.权利要求1至7中任一项的方法,其中在(c)中鉴定基因组的多个区域包括确定以下一项或多项:(i)来自受试者的肿瘤样品的个体读数中定相变异的存在,(ii)匹配的非肿瘤样品中读数支持的存在或不存在,(iii)支持读数上的其他非参考碱基的存在,(iv)碱基质量,(v)作图质量,以及(vi)基因组位置的独特性。
9.权利要求1至8中任一项的方法,其中进行(d)的靶向测序包括(1)对来自所述受试者的肿瘤样品的对应于来自(c)的所鉴定的基因组的多个区域的核酸进行杂交捕获以获得捕获的核酸,以及(2)对来自受试者的肿瘤样品的捕获的核酸进行测序。
10.权利要求1至9中任一项的方法,其中经验证的定相变异的集合数小于1000且大于10。
11.权利要求1至10中任一项的方法,其中在(c)中鉴定的多个区域是非重叠区域。
12.权利要求1至11中任一项的方法,其中(d)的核酸是DNA分子。
13.权利要求1至12中任一项的方法,其中第一定相变异和第二定相变异各自是单核苷酸变异。
14.权利要求1至13中任一项的方法,其中发现经验证的定相变异的集合具有大于5%的等位基因分数并且没有来自匹配的非肿瘤样品的测序数据中的读数支持。
15.权利要求1至14中任一项的方法,其中(d)还包括:在(c)之后,对来自受试者的匹配的非肿瘤样品的来自(c)中鉴定的多个区域的核酸进行靶向测序至至少500×的深度。
16.权利要求1至15中任一项的方法,其中(d)还包括:在(c)之后,对来自受试者的匹配的非肿瘤样品的来自(c)中鉴定的多个区域的核酸进行靶向测序至至少250×的深度。
17.权利要求1至16中任一项的方法,其中所述经验证的定相变异的集合具有小于百万分之一的背景信号。
18.权利要求1至17中任一项的方法,其中所述肿瘤样品是实体瘤样品。
19.权利要求1至18中任一项的方法,其中:
来自肿瘤样品的测序数据以10×至100×的深度获得,并且包含受试者的至少50%的基因组;
来自匹配的非肿瘤样品的测序数据以10×至100×的深度获得,并且包含受试者的至少50%的基因组;
(c)还包括:
将来自肿瘤样品的测序数据和来自匹配的非肿瘤样品的测序数据与基因组进行比对;
确定受试者的基因组中相对于匹配的非肿瘤样品存在于肿瘤样品中的多个单核苷酸变异;和
至少部分地基于以下中的一项或多项从所鉴定的多个单核苷酸变异鉴定基因组的包含第一定相变异和第二定相变异的多个区域:(1)基因组内所鉴定的多个单核苷酸变异中的两个或更多个的接近度和(2)在来自受试者的肿瘤样品的序列数据的单个读数上,所鉴定的多个单核苷酸变异中的两个或更多个的存在;
其中(c)中鉴定的多个区域是非重叠区域;
进行(d)的靶向测序包括(1)对来自受试者的肿瘤样品的对应于来自(c)的所鉴定的基因组的多个区域的核酸进行杂交捕获以获得捕获的核酸,以及(2)对来自受试者的肿瘤样品的捕获的核酸进行测序;和
第一推定的定相变异和第二推定的定相变异是被至少一个核苷酸隔开的单核苷酸变异。
20.权利要求1至19中任一项的方法,还包括将一组核酸探针与从受试者获得或衍生的多个细胞游离核酸分子组合以形成混合物,其中核酸探针组的每个核酸探针被配置为与包含所鉴定的经验证的定相变异的集合中的一个或多个的细胞游离核酸分子杂交。
21.权利要求20的方法,其中核酸探针组中的每个核酸探针被配置为与包含多个定相变异的靶核酸分子杂交,使得所述核酸探针与从定相变异的集合的第一定相变异延伸至定相变异的集合的第二定相变异的靶核酸分子的至少一个区域互补。
22.权利要求20或21的方法,其中核酸探针组中的每个核酸探针包含生物素下拉标签。
23.权利要求20至22中任一项的方法,还包括:
将与核酸探针组中的至少一个核酸探针杂交的靶核酸分子和不与核酸探针组中的至少一个核酸探针杂交的靶核酸分子分离,从而捕获靶核酸分子;和
对与核酸探针组中的至少一个杂交的靶核酸分子进行测序。
24.权利要求23的方法,还包括将一个或多个细胞游离核酸分子鉴定为癌症来源的分子,其检测限为小于来自从细胞游离核酸分子的测序获得的测序数据的50,000个观察结果中的约1个。
25.权利要求24的方法,其中检测限为小于来自测序数据的1,000,000个观察结果中的1个。
26.权利要求23至25中任一项的方法,其中所述测序不包括使用分子条形码。
27.权利要求23至26中任一项的方法,还包括确定所述受试者的病况。
28.权利要求27的方法,其中所述病况是癌症。
29.权利要求23至28中任一项的方法,还包括监测所述受试者的病况的进展。
30.权利要求29的方法,其中所述病况是癌症。
CN202280046401.3A 2021-05-05 2022-04-15 用于分析核酸分子的方法和系统 Pending CN117580963A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US17/308,958 2021-05-05
US63/188,410 2021-05-13
US202163224795P 2021-07-22 2021-07-22
US63/224,795 2021-07-22
PCT/US2022/071759 WO2022236221A1 (en) 2021-05-05 2022-04-15 Methods and systems for analyzing nucleic acid molecules

Publications (1)

Publication Number Publication Date
CN117580963A true CN117580963A (zh) 2024-02-20

Family

ID=89896056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280046401.3A Pending CN117580963A (zh) 2021-05-05 2022-04-15 用于分析核酸分子的方法和系统

Country Status (1)

Country Link
CN (1) CN117580963A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150376700A1 (en) * 2014-06-26 2015-12-31 10X Genomics, Inc. Analysis of nucleic acid sequences
CN107208156A (zh) * 2015-02-09 2017-09-26 10X基因组学有限公司 用于使用变异识别数据来确定结构变异和定相的系统和方法
CN108368542A (zh) * 2015-10-19 2018-08-03 多弗泰尔基因组学有限责任公司 用于基因组组装、单元型定相以及独立于靶标的核酸检测的方法
CN108624668A (zh) * 2013-02-01 2018-10-09 加利福尼亚大学董事会 用于基因组组装及单体型定相的方法
US20210025005A1 (en) * 2010-05-18 2021-01-28 Natera, Inc. Methods for simultaneous amplification of target loci

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210025005A1 (en) * 2010-05-18 2021-01-28 Natera, Inc. Methods for simultaneous amplification of target loci
CN108624668A (zh) * 2013-02-01 2018-10-09 加利福尼亚大学董事会 用于基因组组装及单体型定相的方法
US20150376700A1 (en) * 2014-06-26 2015-12-31 10X Genomics, Inc. Analysis of nucleic acid sequences
CN107208156A (zh) * 2015-02-09 2017-09-26 10X基因组学有限公司 用于使用变异识别数据来确定结构变异和定相的系统和方法
CN108368542A (zh) * 2015-10-19 2018-08-03 多弗泰尔基因组学有限责任公司 用于基因组组装、单元型定相以及独立于靶标的核酸检测的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
D. M. KURTZ 等: "PHASED VARIANTS IMPROVE DLBCL MINIMAL RESIDUAL DISEASE DETECTION AT THE END OF THERAPY", HEMATOLOGICAL ONCOLOGY,SUPPLEMENT: 16TH INTERNATIONAL CONFERENCE ON MALIGNANT LYMPHOMA, VIRTUAL EDITION, 9 June 2021 (2021-06-09), pages 55 - 56 *

Similar Documents

Publication Publication Date Title
AU2019201577B2 (en) Cancer diagnostics using biomarkers
CN113383085A (zh) 用于分析核酸分子的方法和系统
US20190300967A1 (en) Compositions and methods for predicting response and resistance to ctla4 blockade in melanoma using a gene expression signature
KR101545020B1 (ko) 식도암 및 식도암 전이 진단을 위한 조성물 및 방법
KR102657306B1 (ko) 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도
CN107077536B (zh) 使用靶基因表达的数学建模评价TGF-β细胞信号传导途径的活性
ES2374954T3 (es) Variaciones genéticas asociadas con tumores.
KR102023584B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
AU2013277971B2 (en) Molecular malignancy in melanocytic lesions
AU2012345789B2 (en) Methods of treating breast cancer with taxane therapy
KR101828290B1 (ko) 자궁내막암 마커
KR20210046031A (ko) 유방암 치료를 위한 진단 및 치료 방법들
AU2012340393B2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
US20200300859A1 (en) Modulating biomarkers to increase tumor immunity and improve the efficacy of cancer immunotherapy
KR20110015409A (ko) 염증성 장 질환에 대한 유전자 발현 마커
KR20160117606A (ko) 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험
KR20150090246A (ko) 암을 위한 분자 진단 테스트
KR20140044341A (ko) 암에 대한 분자적 진단 검사
KR100964193B1 (ko) 간암 예후 마커
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
WO2021162981A2 (en) Methods and compositions for identifying castration resistant neuroendocrine prostate cancer
KR20240005018A (ko) 핵산 분자를 분석하기 위한 방법 및 시스템
CN101111768A (zh) 肺癌预后
CA2666057C (en) Genetic variations associated with tumors
CN111575379B (zh) 甲状腺癌相关58基因检测试剂盒及其使用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination