CN117711489A - 用于检测异体来源核酸占比的方法 - Google Patents

用于检测异体来源核酸占比的方法 Download PDF

Info

Publication number
CN117711489A
CN117711489A CN202311708347.7A CN202311708347A CN117711489A CN 117711489 A CN117711489 A CN 117711489A CN 202311708347 A CN202311708347 A CN 202311708347A CN 117711489 A CN117711489 A CN 117711489A
Authority
CN
China
Prior art keywords
sequencing
nucleic acid
locus
sample
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311708347.7A
Other languages
English (en)
Inventor
胡春旭
潘琦
陆思嘉
张振
王艳涛
谢珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Yikang Medical Laboratory Co ltd
Original Assignee
Suzhou Yikang Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Yikang Medical Laboratory Co ltd filed Critical Suzhou Yikang Medical Laboratory Co ltd
Priority to CN202311708347.7A priority Critical patent/CN117711489A/zh
Publication of CN117711489A publication Critical patent/CN117711489A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了用于检测异体来源核酸占比的方法,具体地,其包括:(1)对受体的第一样本中含有靶基因座的受检核酸进行文库构建;(2)对(1)中获得的文库进行测序,得到靶基因座测序数据;(3)对测序数据进行分析处理,获得异体来源核酸占比结果;所述的靶基因座包含SNPs位点,所述的SNPs位点中至少75%的SNPs位点具有大于25%的次要等位基因频率。本发明使用生物体DNA为检测材料,通过测序技术检测生物体核酸中的异体来源位点和比例,进而计算确定受检生物体中异体来源核酸占比,无需事先得知异体核酸的位点信息,噪音小,灵敏性和特异性高,具有良好的应用前景。

Description

用于检测异体来源核酸占比的方法
技术领域
本发明涉及基因检测技术领域,具体涉及一种检测异体来源核酸占比的方法。
背景技术
同种生物的异体来源核酸占比检测,有较多的应用场景,各应用场景的背景和检测该占比的意义,分别举例如下:
在实体器官移植方面,快速检测同种异体移植物损伤和/或排斥仍然是一个挑战。以往使用血清肌酐等传统生化测试指标来确定移植物状态的尝试,缺乏特异性,移植物活检的特异性较高,但由于其侵入性且费用昂贵的特点,导致无法常规的周期性的进行,这可能导致移植物因活检损伤和(或)敏感性不佳,之中排斥反应的的延迟诊断。由于生物体的免疫系统将同种异体移植物鉴定为外来物,会激活各种免疫机制来排斥同种异体移植物,所以临床医生常需要在医学上抑制正常的免疫系统应答,减轻生物体对移植物的排斥。因此,临床医生需要一种比血清肌酐等常规生化检测更敏感且更具特异性的、非侵入性的移植物排斥检测。基于NGS的异体来源核酸占比检测,可以帮助临床医生确定移植受体内同种异体移植物存活状态。
在微小嵌合体检测方面,包含两种使用场景,分别是造血干细胞移植后受体内微小嵌合体的检测,和输血相关性微嵌合体的确定。两种嵌合体,分别因为骨髓移植或输血引入供体来源的同种异源淋巴细胞或白细胞,这种细胞变为微嵌合的基础日后可刺激受体产生自身免疫疾病或者慢性移植物抗宿主病。以往临床医生常使用流式细胞术进行同种异源细胞的检测和鉴定,但由于基于流式细胞术的检测需要用受体特异性抗体作为细胞识别物,目前也缺乏可靠的特异性抗体,此方法具有相当强烈的局限性,而基于NGS的异体来源核酸占比检测,可以帮助临床医生确定受体内同种异体来源细胞的核酸的比例,通过定量的检测更精准的指示微小嵌合体的嵌合程度。
在孕妇体内胎儿游离DNA比例计算方面,常用的技术手段是无创产前基因检测,该方法通过分析孕妇外周血中DNA来判断胎儿是否存在染色体非整倍体,而不是针对性的分析胎儿的DNA。当胎儿DNA比例过低时(如小于3%),该技术可能因为胎儿DNA量太少而不能被检测出来染色体是否异常,虽然业内都通过接收怀孕12周以后的孕妇来减少这种情况的发生,但孕妇个体之间的差异还是可能存在胎儿DNA比例较低。同时还有一种情况,就是孕妇孕周较大,能够避免孕周大,母体游离DNA含量过高,但胎儿游离DNA浓度很低,也会造成该方法的假阴性。现有技术通过对男胎中含有的Y染色体信息来判断男胎的浓度,对女胎还没有有效的方法。基于此,来源于胎儿的血浆游离DNA核酸作为异体来源核酸,通过NGS技术手段进行占比检测,可以帮助临床医生在无创产前基因检测的方法下,不需通过额外的检测,确定母体总游离DNA核酸中胎儿来源游离DNA核酸的比例,提示孕妇是否需要重新采血,可以有效的避免检测的假阴性。
在流产物的母源污染或羊水穿刺的母源污染的排查方面,目前这两个检测均已经发展到二代测序和分子生物学层面,但目前这种污染排查,都需要借助传统的STR位点PCR加一代测序或者其他非二代测序的方法学,还没有直接使用二代测序数据对母源污染进行检测或对污染比例进行定量的分析方法,基于NGS技术手段进行母源污染占比检测,可以有效避免因母源污染造成的流产物检测假阴性或羊水穿刺检测假阴性。
在医学检验中,同种异体核酸的交叉污染,对检验结果影响较为严重,具体的可以是某一个同种异源强阳性样本污染周围阴性样本,或者不同受检区域的若干强阳性样本之间相互污染,造成假阳性检测结果。通过NGS方式确定样本之间的串扰,并对串扰进行定量,有助于污染源头的查找和检验结果的勘误。
发明内容
为解决现有技术中存在的不足,本发明的目的是提供一种检测同种生物的异体来源核酸占比的方法。为实现该目的,本发明采用了如下技术方案:
第一方面,本发明提供了一种检测异体来源核酸占比的方法,其包括:
(1)对受体的第一样品中含有靶基因座的受检核酸进行文库构建,
(2)对(1)中获得的文库进行测序,得到测序数据;
(3)对测序数据进行分析处理,获得异体来源核酸占比结果;
所述的靶基因座包含SNPs位点,所述的SNPs位点中至少75%的SNPs位点具有大于25%的次要等位基因频率。
作为一种优选地实施方式,所述的SNPs位点中至少80%、至少85%、至少90%、至少95%、至少97%、或至少99%的SNPs位点具有大于25%的次要等位基因频率。
在本发明中,所述的靶基因座为2-500,000个。
在某些实施方案中,所述的靶基因座包括多态性基因座和/或非多态性基因座。
在某些实施方案中,所述的靶基因座包括二元杂合位点和/或三元杂合位点。
在某些实施方案中,所述的靶基因座在人群中等位基因频率分布于0.2~0.5之间。
在某些实施方案中,所述的靶基因座还包含插入或缺失位点、和/或微卫星位点。
根据本发明的具体实施方式,所述的受体包括移植受体。
在某些实施方案中,所述的移植受体为哺乳动物或人。
在本发明中,所述的移植包括但不限于肾移植、肝移植、胰腺移植、肠移植、心脏移植、肺移植、心脏/肺移植、胃移植、睾丸移植、阴茎移植、卵巢移植、子宫移植、胸腺移植、面部移植、手移植、腿移植、骨移植、骨髓移植、角膜移植、皮肤移植、胰岛细胞移植、心脏瓣膜移植、血管移植、输血的移植。
在本发明中,移植的供体可以和受体没有亲缘关系,也可以有直系血亲,也可以有旁系血亲。
在本发明中,所述的受体还包括孕妇。
在本发明中,所述的受体的第一样本还包括已被/未被交叉污染的核酸样本。
在本发明中,所述的异体来源核酸为同种异体来源核酸。“同种”指的是同一物种(Species),“异体”指的是和待检测样本不属于同一个体。
根据本发明的具体实施方式,所述的受体的第一样本为受体接受移植后采集的样本。
根据本发明的具体实施方式,所述的受体的第一样本为液体样本。作为一种优选地实施方式,所述的液体样本包括血液、尿液、汗液、精液。更为优选地,所述的液体样本为血液、或尿液。
根据本发明的具体实施方式,所述的受检核酸包括打断的核酸,和/或不经过打断的核酸。
作为一种优选地实施方式,所述的打断的核酸包括超声波方式打断的核酸、非特异片段化酶切方式打断的核酸、特异性位点酶切方式打断的核酸。
根据本发明的具体实施方式,所述的受检核酸为DNA。作为一种优选的实施方式,所述的DNA为cfDNA。
根据本发明的具体实施方式,所述的SNPs位点为二元杂合位点。
根据本发明的具体实施方式,所述的SNPs位点在基因组中前后各120个碱基区域内GC含量为40%-60%。
作为一种优选的实施方式,所述的SNPs位点在基因组中前后各120个碱基中,两个以上碱基组合重复出现次数小于5。
根据本发明的具体实施方式,每个SNP位点能被至少一条长度为120碱基的探针覆盖,每条所述探针的全长至少包含1~3个所述的SNP位点。
在本发明的具体实施例中,所述的SNPs位点如表1所示。
表1
/>
/>
根据本发明的具体实施方式,所述的文库构建中所用的接头为带分子标签的接头。作为一种优选地实施方式,所述的分子标签为长度为2-100的随机碱基和/或长度为2-100的简并碱基。更为优选地,所述的简并碱基为双元简并碱基或三元简并碱基。
根据本发明的具体实施方式,所述的对测序数据进行分析处理包括噪音去除,所述的噪音去除包括去除复杂低频突变。
根据本发明的具体实施方式,所述的去除复杂低频突变的方法如下:
获取人群基线样本的测序结果,确认每一个SNP位点的测序噪音的突变形式;删除所述测序数据中携带有与所述测序噪音突变形式相同的低频信号的reads。
根据本发明的具体实施方式,所述的噪音去除还包括去除克隆造血的影响。
根据本发明的具体实施方式,所述的去除克隆造血的影响的方法如下:
获得受体的第二样本的低频突变信号,删除所述测序数据中携带所述低频突变信号的reads。
在某些实施方式中,所述的受体的第二样本包括受体接受移植之前采集的样本、或受体接受移植之后采集的样本。
根据本发明的具体实施方式,所述的受体的第二样本为受体接受移植之后采集的样本。
根据本发明的具体实施方式,所述的受体的第二样本为白细胞。
根据本发明的具体实施方式,所述的受体的第二样本的低频突变信号为gDNA测序结果中的低频突变信号。
根据本发明的具体实施方式,所述的对测序数据进行分析处理还包括降噪处理。在本发明中,所述的降噪处理为双端分子标签降噪处理。所述的降噪处理的方法见专利CN109439729A《检测低频变异用的接头、接头混合物及相应方法》。
根据本发明的具体实施方式,所述的对测序数据进行分析处理还包括去除只有正向reads中或只有反向reads中的SNPs位点。
根据本发明的具体实施方式,所述的对测序数据进行分析处理还包括去除深度不合格的SNPs位点。
根据本发明的具体实施方式,所述的步骤(3)还包括筛选信息基因座,所述的信息基因座为受体的第二样本中,突变频率在5%以下或95%以上的位点。
根据本发明的具体实施方式,所述受体的第二样本与受体的第一样本实施的同深度的测序。
根据本发明的具体实施方式,所述的获得异体来源核酸占比结果的方法如下:
在经分析处理后的测序数据中,筛选所述信息基因座的低频信号,得到所述的信息基因座上低频信号的mean值。
根据本发明的具体实施方式,所述的对测序数据进行分析处理包括排除测序错误、PCR扩增错误、和受污染样本中的低频克隆造血。具体的操作为,首先将经过比对到受检样本基因组上的测序读段(reads)进行去重,去重可以使用分子标签去重或无分子标签的reads首尾一致性去重,然后对待测基因座的基因型进行calling,确定该低频信号的信号比例。
使用分子标签去重的原则和所用技术详见专利CN109439729A《检测低频变异用的接头、接头混合物及相应方法》。
在本发明中,所述的排除测序错误的方式可以为双端分子标签合并去重并去掉该错误,也可是单端分子标签合并去重并去掉该错误,也可以是无分子标签利用reads首尾一致性去重并去掉该错误,也可以是利用该基因座人群基线样本测序结果在该特定位置建立特定噪音模型,然后与噪音模型进行显著性差异分析进而确定差异显著性去掉该错误,还可以是利用样本本身的白细胞的克隆造血模型去除该错误,还可以是利用大样本量的人群的白细胞样本的大白细胞的克隆造血的集合建立模型去除该错误。还可以是以上各举措的组合。
在本发明中,排除PCR扩增错误的方式可以为上述双端分子标签合并去重并去掉该错误,也可是单端分子标签合并去重并去掉该错误,也可以是无分子标签利用reads首尾一致性去重并去掉该错误,也可以是利用该基因座人群基线样本测序结果在该特定位置建立特定噪音模型,然后与噪音模型进行显著性差异分析进而确定差异显著性去掉该错误,还可以是利用样本本身的白细胞的克隆造血模型去除该错误,还可以是利用大样本量的人群的白细胞样本的大白细胞的克隆造血的集合建立模型去除该错误。还可以是以上各举措的组合。
在本发明中,去除各种错误的方式可以是利用待检测样本的信号和频率分布规律和配对样本在该基因座上的信号的频率分布规律做差异显著性分析,确定差异显著程度p值,对与比较样本的信号和频率分布规律差异显著的信号进行保留,对与比较样本的信号和频率分布规律差异不显著的噪音进行噪音去除。
在本发明中,显著性差异分析的方式可以是均值差异显著性检验,包括但不限于T检验-配对样本、T检验-独立样本、方差分析-单因素、方差分析-多因素。也可以是非参数检验,包括但不限于2关联样本非参数检验、K关联样本非参数检验、2独立样本非参数检验、K独立样本非参数检验。也可以是拟合优度检验,包括但不限于单样本K-S检验、卡方检验、二项分布检验、游程检验。也可以是低测度数据的检验,包括但不限于基于检查表的卡方检验。还可以是各种适合的检验方式的组合。
在某些实施方案中,本发明的方法在事先不知道供体基因型的情况下进行。
在某些实施方式中,本发明的方法的取材是非侵入性的。
在本发明中,术语“信息基因座”是指满足区分受体和同种异体信息基因座。信息基因座需要满足的要求是:需要为有效基因座,且同时需要有“非杂合”基因座信号(但并非绝对的纯合基因座信号,带有一定比例的同种异体信息)。信息基因座用来提示的同种异体来源基因座是否存在,进而提示同种异源来源的核酸是否存在,需要通过生物信息学方式判断该基因座是否为同种异体来源基因座。生物信息学方式判断该基因座是否为同种异体来源基因座的操作为:当一个受检样本中,某个基因座位属于非杂合状态,但非绝对的纯合状态,认为该那么对该低频信号进行分析。
在本发明中,术语“有效基因座”是指满足分析需求的基因座。有效基因座需要满足的要求是测序深度大于100×,更好的是测序深度大于500×,更好的是测序深度大于1000×,更好的是测序深度大于1500×,更好的是测序深度大于2000×,更好的是测序深度大于2500×,最好的是测序深度大于3000×。
对于有分子标签的靶向测序文库,有效基因座的测序深度是经过分子标签去重合并后的深度。
对于无分子标签的靶向测序文库,有限基因座的测序深度是不经过分子标签去重合并后的深度。
在某些实施方式中,所述异体来源核酸占比的结果,以异体来源DNA在异体和受体总DNA中的占比体现。占比为下述公式分子分母的对比,具体的为:
hGE:haploid Genome Equivalents
Carrier:DNA的承载载体
在某些实施方式中,所述的异体来源核酸占比的结果,也可以以每毫升承载载体种单倍型拷贝数体现,具体的为:
异体来源DNA当量:
在某些实施方式中,所述的异体来源核酸占比的结果是通过连续非侵入性检测随着时间的推移进行计算出的异体来源核酸增长的速度指标(Velocity Metric)体现,该生长速度,基于异体来源核酸定量水平进行线性回归分析,并由回归线斜率计算得出。
在某些实施方案中,所述的文库构建的方法包括捕获法和/或扩增子法。所述的捕获法包括使用特异性探针对靶基因座处进行靶向捕获,所述的扩增子法包括使用特异性引物对靶基因座处进行靶向扩增。
作为一种优选地实施方式,所述的文库构建的方法为捕获法。
根据本发明的具体实施方式,所述的测序为NGS测序。作为一种优选地实施方式,所述的测序的平台包括Illumina平台、MGI平台、Ion torrent平台。更为优选地,所述的平台为Illumina平台。
另一方面,本发明还提供了检测上述SNPs位点的试剂在制备检测异体来源核酸占比的产品中的应用。
在某些实施方式中,所述的产品包括试剂盒、芯片或高通量测序平台。
在某些实施方式中,所述的产品还包括系统。
作为一种优选的实施方式,所述的SNPs位点包括如表1所示的SNPs位点。
第二方面,本发明提供了一种检测异体来源核酸占比的装置,其包括:
数据输入模块:用于输入前面所述的方法获得的测序数据;
数据处理模块:用于根据前面所述的方法完成所述测序数据的分析处理;
结果输出模块:用于输出异体来源核酸占比的计算结果。
第三方面,本发明提供了一种电子设备,其包括:
存储器;
处理器,与所述存储器连接,用于通过执行存储在所述存储器上的计算机可执行指令,能够实现前面提供的方法。
第四方面,本发明提供了一种计算机存储介质,其存储有计算机可执行指令,所述计算机可执行指令被处理器执行后,能够实现前面提供的方法。
第五方面,本发明提供了本发明第一方面所述的方法、本发明第二方面所述的装置、本发明第三方面所述的电子设备、本发明第四方面所述的计算机存储介质或检测上述SNPs位点的试剂在下述任一项的应用:
(a)在制备检测/定量实体器官移植后受体的血液样本中供体来源的细胞游离DNA的产品中的应用;
(b)在制备检测/定量造血干细胞移植后受体内微小嵌合体的产品中的应用;
(c)在制备检测/定量输血相关性微嵌合体的产品中的应用;
(d)在制备检测/定量孕妇体内胎儿游离DNA的产品中的应用;
(e)在检测/定量流产物的母源污染或羊水穿刺的母源污染中的应用;
(f)在检测/定量同种异体核酸的交叉污染中的应用;
(g)在制备移植患者术后排斥反应早期监测的产品中的应用;
(h)在制备区分TCMR(T细胞介导的排斥反应)和ABMR(抗体介导的排斥反应)的产品中的应用;
(i)在制备评估发生免疫排斥反应的患者在免疫抑制剂使用前后血液/尿液ddcfDNA的变化和差异的产品中的应用;
(j)在制备药效评估的产品中的应用。
依据移植物的不同,所述的供体来源DNA百分比,应有阳性判断值,超过阳性判断值,认为受体体内供体来源DNA占比阳性,该阳性判断值应为0.005%以上的数值。
依据移植物的不同,所述的供体来源DNA监测应有一个预后不良阳性判断值,超过阳性判断值,认为该患者预后不良,低于该阳性判断值,认为该患者预后良好,该阳性判断值应为0.005%以上的数值(以ctDNA百分比进行计算);该阳性判断值还可以是10%以上的数值(以ctDNA增长率计算)。
依据移植物不同所述的供体来源DNA监测应有一个免疫排异反映阳性判断值,超过阳性判断值,认为该受体产生了免疫排异,该阳性判断值应为0.02%以上的数值(以ctDNA百分比进行计算),该阳性判断值还可以是20%以上的数值(以ctDNA增长率计算)。
本发明中的“低频信号”、“低频突变”、“低频突变信号”是指测序数据中千分之一以下的信号。
附图说明
图1为实施例1中同种异体非亲缘样本血浆游离DNA低比例掺合后检测实验流程图;
图2为实施例1中同种异体非亲缘样本的低比例掺合的实测值展示图;
图3为实施例2中同种异体亲缘样本的低比例掺合的检测实验流程图;
图4为实施例2中同种异体亲缘样本的低比例掺合的实测值展示图;
图5为实施例3中对ddcfDNA百分比结果及活检/临床诊断的一致性分析结果图;
图6为实施例3中的阳性样本详情。
具体实施方式
在进一步描述本发明具体实施方案之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规技术。
实施例1捕获探针位点设计以及同种异体非亲缘样本血浆游离DNA低比例掺合后检测实验
首先,根据需求设计用于器官移植的生物素标记的特异性捕获探针SNPs panel,所述的用于器官移植的生物素标记的特异性捕获探针SNPs panel,位点选入规则如下文所述:
1.首先进行SNPs杂合形态的控制,入选的SNPs尽量保证在全基因组分布的均匀性(Y染色体因长度限制,不做均匀性要求),也需要具有跨不同种族的高变体等位基因频率。为了确保准确的不同人种的同种异体核酸占比评估,无论受测试者的种族如何,在千人基因组项目中定义的主要种族群体中,SNPs都必须具有较高的次要等位基因频率。具体而言,在欧洲、非洲、亚洲和美洲族裔群体中,要求至少75%的SNPs具有大于25%的次要等位基因频率。同时避免三元杂合位点,只保留二元杂合位点;
2.区域碱基GC均衡度的控制:在上述位点选取原则的基础上,对保留下来的位点坐标的前后各120个碱基做GC含量分析,保留位点前后各120个碱基区域范围内,GC含量40%-60%的位点,计算、评价方式为区域内A/C/G/T均≥30%;
3.重复序列控制:在上述位点选取原则的基础上,对保留下来的位点坐标的前后各120各碱基做重复序列排查,定义两个以上碱基组合重复连续出现5次以上为高重复,利用SSRIT软件(参见官网介绍:https://archive.gramene.org/db/markers/ssrtool)删除所有候选位点中,落在高重复区域的位点;
4.得到的SNPs位点做探针设计,探针以DNA核酸负链为模板(碱基排布与DNA正链相同),要求120碱基长度,为人工合成的DNA单链核酸,每条探针的全长至少包含上述规则1-3条所挑选出来的SNPs位点,对于无法覆盖的SNPs位点做删除处理,如经过比,对待合成探针在全基因组范围内的非特异性结合超过50次上靶可能,随即对该位点和探针做删除处理;
5.根据上述规则1-4,设计探针得到3508个合格的SNPs位点,如表1所示。
根据1-5条设计原则得到的SNPs位点探针,以单条柱式合成法使用核酸合成仪进行合成,HPLC方式纯化,每个反应使用量:每条探针400amol。
文库构建和杂交捕获的实施方式的框架,可参见文献Blumenstiel B,CibulskisK,et al.(2010)Targeted exon sequencing by in-solution hybrid selection.CurrProtoc Hum Genet,Chapter 18:Unit 18.4.和文献Hodges E,Rooks M,et al.(2009)Hybrid selection of discrete genomic intervals on custom-designed microarraysfor massively parallel sequencing.Nat Protoc 4(6):960–974.,
为验证本发明方法的实际可用性,本发明对同种异体无亲缘关系的模拟样本做掺合实验,本实施例的测试过程简述图如图1所示。
具体的,人工制备的模拟掺合样本,掺合模拟进行,但核酸均来自于血浆提取出来的cfDNA。以样本各自的ng数为衡量标准,进行目的百分比的掺合。设置一个无模板对照用于监控实验过程中引入的外源污染,掺合形式详情,如表2所示。表中所用代号YKRD-13、14、15均指代测试样本提供志愿者,样本类型均为血浆来源的cfDNA。对于受体,需额外取白细胞提取gDNA,使用超声打断仪处理成主峰为100-300bp大小的片段,然后与模拟掺合样本使用同样的实验方法进行文库构建和捕获测序工作,作为克隆造血去除用的对照:
表2
核酸经过全基因组双端分子标签全基因组文库构建,文库构建方式参见基因测序文库试剂盒使用说明书(亿康医学,XK-048-48),而后对见全基因组文库进行杂交捕获,杂交捕获方法与步骤可参见杂交捕获试剂盒xGen Hybridization and Wash Kit所述的详细方法(Integrated DNA Technologies,1080584),文库上机测序,目标测序数据量为20Gb碱基数,测序机型为Illumina公司的NovaSeq-6000,使用的测序试剂为V1.5版本,具体操作参见NovaSeq 6000S4 Reagent Kit v1.5测序试剂说明书所述(Illumina,Inc,20028312)。下机数据经过拆分、数据质控合格的文库数据数据拆分经由测序仪配套的服务器默认进行,无特殊要求。数据质控要求测序Q30指标≥85%,如无法满足此规则,则进行重新上机处理。而后使用FASTP软件,对原始数据下机数据进行接头去除和低质量碱基的去除后,使用BWA软件将质控后数据与Hg19参考基因组进行比对,比对后生成中间文件BAMBAM经双端分子标签降噪处理,具体处理方式和所用技术,详见本公司以往公开的发明专利:CN109439729A《检测低频变异用的接头、接头混合物及相应方法》。
要求经双端分子标签去重合并后,平均有效测序深度仍≥3000×,去除只有正向reads中或只有反向reads中的SNPs位点,去除深度不合格的SNPs位点。得到初筛的SNPs位点后进行下一步噪音去除(复杂低频突变和克隆性造血位点)。利用模拟受体的白细胞测序结果和人群基线样本测序结果,去除相应复杂的低频突变和克隆造血的影响。具体的处理方式如下,首先构建人群基线样本的基线,对20名志愿者的白细胞做高深度测序,实验和分析处理方式如实施例1中上方文字所述,得到3508个SNPs位点的基因型,并且确认每一个位点的复杂测序噪音分布形式(将每个位点除了主等位基因和次等位基因之外的其他碱基变化定义为测序噪音,识别每一个位点测序噪音的碱基变化主要形式,这个突变形式需要在后续测序数据中予以去除(如,输入一个新样本,测序数据中出现了低频信号,且与基线中识别出的测序噪音变化形式相同,则删除携带这些低频突变的reads);其次使用当下受体白细胞去除克隆造血的影响,操作为:在每个模拟掺合样本的检测过程中,都对模拟受体白细胞进行一次和掺合样本同深度的测序(文库也带有分子标签,且保证实验为同批次),在掺合的样本测序数据中,针对每一个SNPs位点进行识别,如出现了低频信号,则先识别与基线中识别出的测序噪音变化形式是否相同,如是则删除携带这些低频突变的reads,再识别与同深度测序的受体白细胞上该位点携带的低频突变是否相同,如是则删除携带这些低频突变的reads。通过这样处理,每个SNPs位点上保留下来的低频突变信号,就是可以使用的合格的信息基因座信息。
进而得到合格的信息基因座信息(即受体非杂合基因座的信息),对于“非杂合”基因座(可用基因座),做如下定义:在受体的白细胞测序中,突变频率在5%以下(含)或95%以上(含)的位点。掌握了这类信息基因座后,在掺合样本测序结果中观察各个信息基因座的低频突变(要求必须经过上述过滤规则进行充分过滤),得到掺合样本中各信息位点的突变频率,再求mean值,即可得到模拟供体的百分比实测值,模拟供体的百分比实测值,以如下公式进行计算(所述carrier为DNA承载的载体,在本实施例中,为血浆):
hGE:haploid Genome Equivalents
Carrier:DNA的承载载体
计算得到的每个掺合梯度的模拟供体实测值,如图2所示。
由图2可知,使用器官移植的生物素标记的特异性捕获探针SNPs panel处理血浆cfDNA模拟掺合的样本,可以明确区分模拟的受体和0.1%以上的模拟供体,模拟供体的掺合比例为0.1%时,信号明显。
实施例2同种异体亲缘样本尿液游离DNA低比例掺合后检测实验。
测试过程简述图如图3所示。
设计用于器官移植的生物素标记的特异性捕获探针SNPs panel,探针设计和制备方式参见实施例1。
人工制备的模拟掺合样本,掺合模拟进行,但核酸均来自于尿液提取出来的cfDNA。以样本各自的ng数为衡量标准,进行目的百分比的掺合。设置一个无模板对照用于监控实验过程中引入的外源污染,掺合形式详情,如表3所示。表中所用代号YKRD-6、7、10、11均指代测试样本提供志愿者,样本类型均为尿液来源的cfDNA。对于受体,需额外取白细胞提取gDNA,使用超声打断仪处理成主峰为100-300bp大小的片段,然后与模拟掺合样本使用同样的实验方法进行文库构建和捕获测序工作,作为克隆造血去除用的对照。
表3
进而得到合格的信息基因座信息(即受体非杂合基因座的信息),对于“非杂合”基因座(可用基因座)的定义与实施例1相同。各信息位点的突变频率求mean值,即可得到模拟供体的百分比实测值,模拟供体的百分比实测值,以如下公式进行计算(所述carrier为DNA承载的载体,在本实施例中,为尿液):
hGE:haploid Genome Equivalents
Carrier:DNA的承载载体
计算得到的每个掺合梯度的模拟供体实测值,如图4所示。图4左半部分,为两组模拟掺合的实测值箱型图,用于观察梯度掺合后理论梯度和实际梯度的趋势或一致性。图4右半部分,为第一组模拟掺合的实测信号强度,用于观察随着掺合比例增大,实测外源DNA信号占比的增强情况。
由图4可知,使用器官移植的生物素标记的特异性捕获探针SNPs panel处理尿液cfDNA模拟掺合的样本,可以明确区分模拟的受体和0.1%以上的模拟供体。
实施例3检测异体来源核酸占比的方法学的实际应用和数据表现
为探索本发明的实际应用可能性,本发明将本套方法学用于实际应用中,以期探索、ddcfDNA在肾移植排斥反应监测中应用效果。具体的,本发明开展了一个观察性临床试验,研究血液/尿液ddcfDNA检测对肾移植患者术后免疫排斥反应早期监测的有效性,临床试验中ddcfDNA的检测方法和实验物料以及生物信息分析方法与实施例1和实施例2相同,区别仅在于本实施例检测的是肾移植患者的血液/尿液样本中的ddcfDNA,并获取肾移植患者的白细胞来提取gDNA作为对照。为尽早得到本套方法学的效果,试验进行了中期揭盲,目前掌握的数据情况如下:目前共入组105名患者,出组患者7例,现有98名患者可纳入分析,对这98例患者,本发明以ddcfDNA在受体总cfDNA中的比例大于等于1%为阳性判断值,超过阳性判断值的,定义为肾移植排斥反应高风险,然后对ddcfDNA百分比结果及活检/临床诊断的一致性进行分析。一致性分析结果如图5所示。
阳性样本详情如图6所示,统计目前入组病例的检测结果,摘录血浆ddcfDNA检测阳性访视点,比对临床“金标准信息”进行分析。为保护受试者隐私,姓名做脱敏处理。
对纳入的98名有临床/活检诊断结果的患者进行详细分析,可知入组病例的ddcfDNA检测无假阴性,另,文献提示新冠病毒感染,急性肾损伤,血栓性微血管病均可能引起ddcfDNA升高,造成“假阳性”结果。
在cutoff≥1%的前提下,现阶段数据显示:特异度93.5%(95%CI,85.9-97.4%),灵敏度100%(95%CI,46.3%-100%),NPV 100%(95%CI,94.7-100%),PPV45.5%(95%CI,18.1-75.4%),计算过程见表4和表5(注:现阶段本试验排斥反应发病率为5%,发病率会影响PPV、NPV数值):
表4
全部患者分析
表5
由以上中期揭盲的数据表现可知,本发明的方法学由一个较为高的NPV数值和较高的特异性及灵敏度,证明本发明具有潜在的临床应用价值。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

Claims (10)

1.一种检测异体来源核酸占比的方法,其包括:
(1)对受体的第一样本中含有靶基因座的受检核酸进行文库构建;
(2)对(1)中获得的文库进行测序,得到靶基因座测序数据;
(3)对测序数据进行分析处理,获得异体来源核酸占比结果;
所述的靶基因座包含SNPs位点,所述的SNPs位点中至少75%的SNPs位点具有大于25%的次要等位基因频率。
2.根据权利要求1所述的方法,其中,所述的SNPs位点为二元杂合位点。
3.根据权利要求1所述的方法,其中,所述的SNPs位点在基因组中前后各120个碱基区域内GC含量为40%-60%,
优选地,所述的SNPs位点在基因组中前后各120个碱基中,两个以上碱基组合重复出现次数小于5;
优选地,每个SNP位点能被至少一条长度为120碱基的探针覆盖,每条所述探针的全长至少包含1~3个所述的SNP位点,
更优选地,所述的SNPs位点包括如表1所示的SNPs位点。
4.根据权利要求1所述的方法,其中,所述的对测序数据进行分析处理包括噪音去除,所述的噪音去除包括去除复杂低频突变,
优选地,所述的去除复杂低频突变的方法如下:
获取人群基线样本的测序结果,确认每一个SNP位点的测序噪音的突变形式;删除所述测序数据中携带有与所述测序噪音的突变形式相同的低频信号的reads;
优选地,所述的噪音去除还包括去除克隆造血的影响,
优选地,所述的去除克隆造血的影响的方法如下:
获得受体的第二样本的低频突变信号,删除所述测序数据中携带所述低频突变信号的reads;
优选地,所述的受体的第二样本为白细胞;
优选地,所述的步骤(3)还包括筛选信息基因座,所述的信息基因座为受体的第二样本中,突变频率在5%以下或95%以上的位点。
5.根据权利要求4所述的方法,所述的获得异体来源核酸占比结果的方法包括:
在经分析处理后的测序数据中,筛选所述信息基因座的低频信号,得到所述的信息基因座上低频信号的mean值。
6.根据权利要求1-5任一项所述的方法,其中,文库构建的方法包括捕获法和/或扩增子法,优选地,所述的文库构建的方法为捕获法。
7.一种检测异体来源核酸占比的装置,其包括:
数据输入模块:用于输入采用权利要求1-6任一项所述的方法获得的测序数据;数据处理模块:用于根据权利要求1-6任一项所述的方法完成所述测序数据的分析处理;
结果输出模块:用于输出异体来源核酸占比的计算结果。
8.一种电子设备,其包括:
存储器;
处理器,与所述存储器连接,用于通过执行存储在所述存储器上的计算机可执行指令,能够实现权利要求1-6任一项提供的方法。
9.一种计算机存储介质,其存储有计算机可执行指令,所述计算机可执行指令被处理器执行后,能够实现权利要求1-6任一项提供的方法。
10.权利要求1-6任一项所述的方法、权利要求7所述的装置、权利要求8所述的电子设备、或权利要求9所述的计算机存储介质在下述任一项的应用:
(a)在制备检测/定量实体器官移植后受体的血液样本中供体来源的细胞游离DNA的产品中的应用;
(b)在制备检测/定量造血干细胞移植后受体内微小嵌合体的产品中的应用;
(c)在制备检测/定量输血相关性微嵌合体的产品中的应用;
(d)在制备检测/定量孕妇体内胎儿游离DNA的产品中的应用;
(e)在检测/定量流产物的母源污染或羊水穿刺的母源污染中的应用;
(f)在检测/定量同种异体核酸的交叉污染中的应用;
(g)在制备移植患者术后排斥反应早期监测的产品中的应用;
(h)在制备区分TCMR(T细胞介导的排斥反应)和ABMR(抗体介导的排斥反应)的产品中的应用;
(i)在制备评估发生免疫排斥反应的患者在免疫抑制剂使用前后血液/尿液ddcfDNA的变化和差异的产品中的应用;
(j)在制备药效评估的产品中的应用。
CN202311708347.7A 2023-12-13 2023-12-13 用于检测异体来源核酸占比的方法 Pending CN117711489A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311708347.7A CN117711489A (zh) 2023-12-13 2023-12-13 用于检测异体来源核酸占比的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311708347.7A CN117711489A (zh) 2023-12-13 2023-12-13 用于检测异体来源核酸占比的方法

Publications (1)

Publication Number Publication Date
CN117711489A true CN117711489A (zh) 2024-03-15

Family

ID=90154713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311708347.7A Pending CN117711489A (zh) 2023-12-13 2023-12-13 用于检测异体来源核酸占比的方法

Country Status (1)

Country Link
CN (1) CN117711489A (zh)

Similar Documents

Publication Publication Date Title
US11519031B2 (en) Non-invasive prenatal diagnosis of fetal genetic condition using cellular DNA and cell free DNA
JP4245666B2 (ja) 非侵入性の出生前診断
US20060040305A1 (en) Non-invasive prenatal genetic diagnosis using transcervical cells
Vestergaard et al. On the road to replacing invasive testing with cell‐based NIPT: Five clinical cases with aneuploidies, microduplication, unbalanced structural rearrangement, or mosaicism
US20130130921A1 (en) Kit, a Device and a Method for Detecting Copy Number of Fetal Chromosomes or Tumor Cell Chromosomes
CN1798853A (zh) 使用经子宫颈细胞的非侵入性产前遗传诊断
US20080108071A1 (en) Methods and Systems to Determine Fetal Sex and Detect Fetal Abnormalities
Li et al. Invasive prenatal diagnosis of fetal thalassemia
Enninga et al. Maternal T cells in the human placental villi support an allograft response during noninfectious villitis
Du et al. Massively Parallel Sequencing (MPS) of cell-free fetal DNA (cffDNA) for trisomies 21, 18, and 13 in twin pregnancies
CN106480170A (zh) 确定供体和受体差异snp的方法及应用
RU2587540C1 (ru) Способ диагностики состояния иммунной системы пациента и набор праймеров, зондов и стандартных образцов для количественной оценки днк молекул trec, krec и количества геном эквивалентов днк
GB2559437A (en) Prenatal screening and diagnostic system and method
CN115678964B (zh) 基于胚胎培养液的植入前胚胎的无创筛选方法
Mayo et al. Noninvasive prenatal testing: How far can we reach detecting fetal copy number variations
CN117711489A (zh) 用于检测异体来源核酸占比的方法
US11869630B2 (en) Screening system and method for determining a presence and an assessment score of cell-free DNA fragments
Makrydimas et al. Prenatal paternity testing using DNA extracted from coelomic cells
JP2008182993A (ja) 遺伝子検査結果判定法およびプログラムおよびその装置
Sonek et al. Identification of fetal aneuploidy with dual‐probe fluorescence in situ hybridization analysis in circulating trophoblasts after enrichment using a high‐sensitivity microfluidic platform
CN108070639A (zh) 数字pcr方法快速检测羊水细胞非整倍体
CN116497106B (zh) 一种产前诊断中母源污染的鉴别方法
RU2777072C1 (ru) Способ определения анеуплоидии плода в образце крови беременной женщины
EP3202912A1 (en) Noninvasive method and system for determining fetal chromosomal aneuploidy
KR102142904B1 (ko) 비침습적 산전진단을 통한 태아의 성별 판별방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20240315

WD01 Invention patent application deemed withdrawn after publication