CN109584957A - 用于捕获α地中海贫血相关基因拷贝数检测试剂盒 - Google Patents

用于捕获α地中海贫血相关基因拷贝数检测试剂盒 Download PDF

Info

Publication number
CN109584957A
CN109584957A CN201910083308.XA CN201910083308A CN109584957A CN 109584957 A CN109584957 A CN 109584957A CN 201910083308 A CN201910083308 A CN 201910083308A CN 109584957 A CN109584957 A CN 109584957A
Authority
CN
China
Prior art keywords
nucleotide
chr16
chromosome
coordinate
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910083308.XA
Other languages
English (en)
Other versions
CN109584957B (zh
Inventor
叶程晨
孟鑫
蔡秋娴
旷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xuzhenda Biotechnology Co ltd
Original Assignee
Plain (shanghai) Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Plain (shanghai) Biotechnology Co Ltd filed Critical Plain (shanghai) Biotechnology Co Ltd
Publication of CN109584957A publication Critical patent/CN109584957A/zh
Application granted granted Critical
Publication of CN109584957B publication Critical patent/CN109584957B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于捕获α地中海贫血相关基因拷贝数检测试剂盒,包括捕获探针,所述捕获探针由17个主要探针和对照探针组成,17个主要探针是针对HBZ/HBZP1/HBA2/HBA1/HBQ1/HS‑40基因区域设计的,所述捕获探针对目标区域进行捕获,测序,通过数据分析估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。经实验验证,本发明试剂盒能准确检测捕获α地中海贫血相关基因拷贝数并进行缺失类型分型,检测灵敏度为100%,特异性为99.89%,精度为96.55%,准确性为99.90%。解决了现有方法错误率较高、稳定性不好、通量较小、特异性差,尤其是对HBA1和HBA2基因的高度同源性欠缺考虑等问题,还用于解决HBA1和HBA2基因高度同源性以及缺失类型种类多且难以区分等问题。

Description

用于捕获α地中海贫血相关基因拷贝数检测试剂盒
技术领域
本发明属于体外诊断领域,具体涉及用于捕获α地中海贫血相关基因拷贝数检测试剂盒。
背景技术
地中海贫血是严重威胁人类健康的致死致残的常染色体隐性遗传性血液病。全球约2%的人为地中海贫血基因的携带者,在我国南方高发病地区的人群携带率为3%-24%。地中海贫血是由于珠蛋白基因发生缺陷,导致肽链合成减少或缺失的遗传性溶血性血红蛋白病。临床上地中海贫血又分为轻型(地中海贫血携带者),中间型和重型。临床上表现出特殊的地中海贫血面容—头颅增大、颧骨突出、眼距增宽、鼻梁低平,根据病情的轻重表现为小细胞低色素,溶血性贫血伴黄疸,疲乏无力,肝脾肿大,不定期或定期输血,水肿胎或过多铁沉积导致心力衰竭致死。
α-地中海贫血主要由α-珠蛋白基因发生缺失所引起,并且缺失范围具有很大的异质性,可以是仅涉及HBA1和HBA2基因附近的几千个碱基对的缺失,更多的是包含2个HBA1和HBA2基因在内的涉及几万到几十万碱基对的缺失,甚至整个α珠蛋白基因簇的丢失。此外,还有只包含α基因上游调控区的片段的缺失。目前全球已鉴定的α地中海贫血缺失超过20种,不同种族的α-珠蛋白基因的缺失谱不同,中国人中最常见的是SEA、3.7kb和4.2kb这三种缺失类型,在广西地区突变携带率分别为7.84%,4.78%和1.61%。
如图1所示,HBA1和HBA2处于高度同源的两个重复单元中,这些单元包括了三个同源片段(X、Y和Z盒),其间被三个非同源区所分隔。HBA1和HBA2基因结构极其相似,其中编码区序列完全相同(5’端非编码区以及intron区有些微差异,3’端非编码区有部分碱基差异),这极大地造成了分析的难度,这也是罕有利用二代测序检测α-地中海贫血的重要原因。
目前检测地中海贫血的方法主要有Gap-PCR以及MLPA(多重连接探针扩增),其中,Gap-PCR往往是根据已知缺失类型进行引物设计,仅可检测已知缺失突变,检测范围十分有限,而且不能检测其它未知罕见的缺失类型,极有可能造成漏诊,导致重症患儿出生。此外,对于α地中海贫血缺失突变也可利用多重连接探针扩增(MLPA)技术对其进行检测,虽然相较于Gap-PCR而言,MLPA不但可以检测α-地中海贫血常见、非常见以及未知罕见缺失突变,但MLPA技术仍存在一定局限性,需要精确测量DNA的浓度、样本容易被污染且存在一定假阳性的可能,尤其对于单个外显子缺失突变的情况,需要利用PCR的方法进行进一步的验证实验。总之,目前尚无一种快速、低成本、大通量和自动化检测α-地中海贫血缺失突变的方法。
目前公开文献中也有关于检测α-地中海贫血缺失突变的相关产品,下面是检索到的相关的专利文献:有专利申请(专利申请公开号CN107267648A)采用多重PCR的方法设计引物并提供快速检测地中海贫血常见突变基因的试剂盒,该方法有PCR偏好性,相对于二代测序技术而言,通量低价格昂贵,并且只能检测已知的常见的突变类型。专利申请(专利申请公开号CN107475410A)采用基因芯片技术进行alpha-地中海贫血的缺失或重复突变的检测,基因芯片技术虽然是新一代测序技术,但是相对于二代测序技术背景噪音大,精度明显受探针设计影响并且价格昂贵。专利申请(专利申请公开号CN107841545A)虽采用二代测序技术检测地中海贫血基因型,但是仅描述了常见的二代测序的步骤以及分析流程,并没有针对地中海贫血基因设计探针,更没有针对地中海贫血基因的分析方法,实际操作较难实现。专利申请(专利申请公开号CN106591441A)发明了一种基于全基因捕获测序的alpha/beta地中海贫血突变的检测探针、方法、芯片,该发明虽然针对alpha/beta基因区域设计了相关探针并且提供了探针序列,但是该发明没有考虑HBA1以及HBA2基因的高度同源性,没有针对HBA1以及HBA2设计探针,也没有针对高度同源基因的分析方法,这会导致捕获序列特异性差,同时也会影响分析结果的准确性,此外,该发明没有针对HBA1/2基因的调控区设计探针,极有可能造成漏诊,导致重症患儿出生。
发明内容
本发明要解决的技术问题是提供一种基于基因捕获和二代测序技术的用于捕获α地中海贫血相关基因拷贝数检测试剂盒,用于解决现有方法错误率较高、稳定性不好、通量较小、特异性差,尤其是对HBA1和HBA2基因的高度同源性欠缺考虑以及缺失类型种类多且难以区分等问题。
为解决上述技术问题,本发明采用如下技术方案:
在本发明的一方面,提供本发明公开了一种基于基因捕获和二代测序技术的用于捕获α地中海贫血相关基因拷贝数检测试剂盒,包括捕获探针,所述捕获探针由以下17个主要探针和对照探针组成;17个主要探针见表1:
表1
所述捕获探针对目标区域进行捕获,测序,通过数据分析估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。
作为本发明优选的技术方案,所述主要探针为针对α珠蛋白基因簇上X、Y、Z同源盒之间的非同源区设计,并且包含所有用于估算拷贝数的特征位点;此外充分考虑HBA1基因和HBA2基因的高度同源性,其中针对HBA1基因和HBA2基因区间所设计的捕获探针(见表1,探针序号1-4)至少包含一个能够区分HBA1基因和HBA2基因的差异位点。
作为本发明的优选技术方案,所述差异位点是用于区分HBA1基因和HBA2基因的位点,具体为:
染色体chr16,坐标222869,HBA2基因,外显子1上游23bp,核苷酸G;
染色体chr16,坐标226673,HBA1基因,外显子1上游23bp,核苷酸C;
染色体chr16,坐标223447,HBA2基因,外显子3上游24bp,核苷酸G;
染色体chr16,坐标227258,HBA1基因,外显子3上游24bp,核苷酸C;
染色体chr16,坐标223614,HBA2基因,外显子3下游14bp,核苷酸A;
染色体chr16,坐标227425,HBA1基因,外显子3下游14bp,核苷酸G;
染色体chr16,坐标223618,HBA2基因,外显子3下游18bp,核苷酸G;
染色体chr16,坐标227429,HBA1基因,外显子3下游18bp,核苷酸A;
染色体chr16,坐标223620,HBA2基因,外显子3下游20bp,核苷酸T;
染色体chr16,坐标227431,HBA1基因,外显子3下游20bp,核苷酸G;
染色体chr16,坐标223622,HBA2基因,外显子3下游22bp,核苷酸C;
染色体chr16,坐标227433,HBA1基因,外显子3下游22bp,核苷酸T;
染色体chr16,坐标223625,HBA2基因,外显子3下游25bp,核苷酸C;
染色体chr16,坐标227436,HBA1基因,外显子3下游25bp,核苷酸T;
染色体chr16,坐标223631-223632,HBA2基因,外显子3下游31-32bp,核苷酸GC;
染色体chr16,坐标227442-227443,HBA1基因,外显子3下游31-32bp,核苷酸CT;
染色体chr16,坐标223643-223644,HBA2基因,外显子3下游43-44bp,核苷酸AA;
染色体chr16,坐标227454-227455,HBA1基因,外显子3下游43-44bp,核苷酸CC;
染色体chr16,坐标223646,HBA2基因,外显子3下游46bp,核苷酸G;
染色体chr16,坐标223457,HBA1基因,外显子3下游46bp,核苷酸A;
染色体chr16,坐标223648,HBA2基因,外显子3下游48bp,核苷酸G;
染色体chr16,坐标223459,HBA1基因,外显子3下游48bp,核苷酸C。
作为本发明优选的技术方案,所述特征位点经过如下步骤筛选得到;包括:(1)挑选用于区分HBA1基因和HBA2基因外显子1和外显子3的差异位点,其中位点区域如图2所示;(2)挑选并加入HBA1基因以及HBA2基因上其它位点(除HBA1基因和HBA2基因差异位点外的其它位点),所挑选位点避开多态位点、常见SNP(单核苷酸多态性)变异位点等;(3)挑选并加入HBZ、HBQ1、HBZP1基因外显子区域上的位点,所挑选位点均匀分布各基因外显子区域,并避开高度同源区、回文系列区域、多态位点、常见SNP变异位点等;(4)根据训练集进一步筛选步骤(1)(2)(3)所选位点,其中所选位点在训练集中经过两步标准化之后的覆盖深度的标准差要小于0.18(将经过这四步筛选得到的位点定义为特征位点)。所选77个特征位点如下所示:
染色体chr16,坐标203900,核苷酸A
染色体chr16,坐标203950,核苷酸G
染色体chr16,坐标204000,核苷酸A
染色体chr16,坐标204050,核苷酸G
染色体chr16,坐标204400,核苷酸C
染色体chr16,坐标214480,核苷酸G
染色体chr16,坐标214500,核苷酸A
染色体chr16,坐标214505,核苷酸A
染色体chr16,坐标214600,核苷酸G
染色体chr16,坐标214605,核苷酸T
染色体chr16,坐标219818,核苷酸T
染色体chr16,坐标219853,核苷酸C
染色体chr16,坐标219922,核苷酸G
染色体chr16,坐标221062,核苷酸C
染色体chr16,坐标221082,核苷酸A
染色体chr16,坐标221108,核苷酸C
染色体chr16,坐标221128,核苷酸C
染色体chr16,坐标223383,核苷酸C
染色体chr16,坐标223447,核苷酸C
染色体chr16,坐标223614,核苷酸G
染色体chr16,坐标223618,核苷酸T
染色体chr16,坐标223620,核苷酸C
染色体chr16,坐标223622,核苷酸T
染色体chr16,坐标223625,核苷酸T
染色体chr16,坐标223631,核苷酸C
染色体chr16,坐标223632,核苷酸T
染色体chr16,坐标223643,核苷酸A
染色体chr16,坐标223644,核苷酸C
染色体chr16,坐标223646,核苷酸G
染色体chr16,坐标223648,核苷酸C
染色体chr16,坐标223661,核苷酸C
染色体chr16,坐标223663,核苷酸T
染色体chr16,坐标223670,核苷酸G
染色体chr16,坐标223673,核苷酸C
染色体chr16,坐标223678,核苷酸T
染色体chr16,坐标225100,核苷酸A
染色体chr16,坐标225120,核苷酸G
染色体chr16,坐标225141,核苷酸G
染色体chr16,坐标225161,核苷酸C
染色体chr16,坐标225181,核苷酸C
染色体chr16,坐标225735,核苷酸T
染色体chr16,坐标225745,核苷酸C
染色体chr16,坐标225755,核苷酸A
染色体chr16,坐标225765,核苷酸G
染色体chr16,坐标225780,核苷酸T
染色体chr16,坐标226043,核苷酸T
染色体chr16,坐标226220,核苷酸C
染色体chr16,坐标226221,核苷酸C
染色体chr16,坐标226673,核苷酸C
染色体chr16,坐标227187,核苷酸C
染色体chr16,坐标227250,核苷酸C
染色体chr16,坐标227253,核苷酸G
染色体chr16,坐标227258,核苷酸C
染色体chr16,坐标227425,核苷酸G
染色体chr16,坐标227429,核苷酸T
染色体chr16,坐标227431,核苷酸C
染色体chr16,坐标227433,核苷酸T
染色体chr16,坐标227436,核苷酸T
染色体chr16,坐标227442,核苷酸T
染色体chr16,坐标227443,核苷酸T
染色体chr16,坐标227454,核苷酸C
染色体chr16,坐标227455,核苷酸C
染色体chr16,坐标227457,核苷酸G
染色体chr16,坐标227459,核苷酸C
染色体chr16,坐标227472,核苷酸C
染色体chr16,坐标227474,核苷酸T
染色体chr16,坐标227481,核苷酸G
染色体chr16,坐标227484,核苷酸C
染色体chr16,坐标227487,核苷酸C
染色体chr16,坐标227488,核苷酸C
染色体chr16,坐标227490,核苷酸T
染色体chr16,坐标230700,核苷酸C
染色体chr16,坐标230750,核苷酸A
染色体chr16,坐标231000,核苷酸T
染色体chr16,坐标231050,核苷酸T
染色体chr16,坐标231100,核苷酸C
染色体chr16,坐标231150,核苷酸T
作为本发明优选的技术方案,所述对照探针影响覆盖深度的标准化效果,进而影响拷贝数估算结果。其中对照探针捕获区域经如下步骤筛选:(1)对照探针以安捷伦ClearSeq探针组(一种捕获试剂)为备选,并从中挑选合适的探针区间;(2)挑选GC含量与所述主要探针相近的区间;(3)挑选训练集中覆盖深度与所述主要探针覆盖深度相关性大于0.8的区间;对照探针序列如下表2所示:
表2
作为本发明优选的技术方案,所述数据分析为结合捕获探针所开发的独特的针对高度同源区的拷贝数估算方法,包括将测序读段使用比对软件比对到人参考基因组、去除重复序列、去除比对结果不可信的读段,标准化覆盖深度,利用极大似然估计估算α地中海贫血相关基因的拷贝数以及缺失类型分型。
作为本发明优选的技术方案,所述去除重复序列具体使用Picard去除PCR扩增过程中产生的重复序列。
作为本发明的优选技术方案,所述比对结果不可信的读段为不涵盖任何一个如上所述差异位点的读段。
作为本发明优选的技术方案,所述标准化覆盖深度具体包括如下步骤:
步骤1,计算覆盖深度:计算目标捕获区域每个碱基的覆盖深度;所述覆盖深度是指分配至所述碱基的读段数目;
步骤2,计算特征位点(特征位点如上所述)的覆盖深度;
步骤3,标准化特征位点覆盖深度:
覆盖深度的标准化主要分为两个维度:首先,“单样本多位点标准化”,该步骤是相对于同一样本所有特征位点,即通过所有特征位点的覆盖深度和相关对照探针捕获区间的平均覆盖深度进行计算的,公式如下:
其中,read depth of unique site i为特征位点的覆盖深度,sample’savg.depth指每个样本对照探针的覆盖深度。
其次,“多样本单位点标准化”,该步骤是相对于同一特征位点所有样本进行计算的,所述所有样本指已有训练集中的所有样本,公式如下:
其中,site’s avg.depth指每个所选特征位点在训练集中经过第一步标准化之后的平均覆盖深度。
作为本发明的优选技术方案,所述利用极大似然估计估算α地中海贫血相关基因的拷贝数以及缺失类型分型具体包括如下步骤:
(1)假设所选取的特征位点之间相互独立
(2)计算z-score:对于一批样本中的每个样本每个特征位点,按如下公式计算z-score:
其中,Zi,j表示第j个样本的特征位点i的Z-score值,normRD′i,J为第j个样本特征位点i经步骤3计算得到的标准化覆盖深度,expected copy number为相对于某一种缺失类型在该位点的期望拷贝数,SD(normRD′i)为该特征位点矫正后覆盖深度的标准差;
(3)极大似然估计:把每个位点相对于某一种基因型计算的z-score转化为概率值,对于某一个样本某一种假设缺失类型,将所有位点的概率值相乘,最大概率值所对应的基因型即为该样本所对应的基因型。
作为本发明的优选技术方案,所述捕获探针对目标区域进行捕获后,采用磁珠分离富集,PCR进行扩增,构建测序文库,再进行测序,并利用结合所述捕获探针所开发的独特的针对高度同源区的拷贝数估算方法估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。
与现有技术相比,本发明的有益效果在于:
1)本发明充分利用基因捕获(capture-based)的技术克服扩增子测序(AmpliconSequencing)所带来的测序不均一的问题。
2)本发明采用了Illumina二代测序平台,使得获得的目标基因序列信息错误率更低、稳定性更好、通量更大。
3)针对高度同源基因HBA1和HBA2差异位点设计探针,捕获序列特异性高,读段能够准确地匹配到HBA1或HBA2,HBA1/2的拷贝数估算结果精度高。
4)针对X、Y、Z同源盒之间的非同源区以及所选特征位点设计捕获探针,有利于进一步确定缺失区域,从而进行更为精确地基因分型。
5)本发明结合设计的捕获探针所开发的独特的针对高度同源区的拷贝数估算方法具有灵敏度高、特异度高等特点。
经实验验证,本发明试剂盒能准确检测捕获α地中海贫血相关基因拷贝数并进行缺失类型分型,检测灵敏度为100%,特异性为99.89%,精度为96.55%,准确性为99.90%。解决了现有方法错误率较高、稳定性不好、通量较小、特异性差,尤其是对HBA1和HBA2基因的高度同源性欠缺考虑以及缺失类型种类多且难以区分等问题。
附图说明
图1是α珠蛋白基因簇上两个高度同源的重复单元中包含的X、Y和Z同源盒示意图。显示α珠蛋白基因簇中同源盒X、Y、Z所在位置。
图2是HBA1基因和HBA2基因的差异位点所在区域示意图。
具体实施方式
以下通过实施例对本发明进行更加具体的说明。应当理解,此处所描述的实施例是用于解释本发明,而非用于限定本发明。
实施例1:
本发明实施例提供了一种基于二代测序技术的α-地中海贫血突变的检测方法,本实施例对986个样本进行了分析,其中980个样本的α-地中海贫血检测结果用MLPA方法进行了验证,操作步骤具体包括:
1.目标基因和参考序列的设计及合成
在本实施例中,针对HBZ/HBZP1/HBA2/HBA1/HBQ1/HS-40基因区域设计了捕获探针,同时添加了对照探针。
2.从样本中提取DNA和打断;
提取986个样本的DNA 3ug,该986样本中包含血液样本以及唾液样本。采用DNA提取、纯化,采用超声波对提取的DNA进行打断,末端补平并磷酸化,两侧加上接头。
3.目标区域捕获:
本方法使用专门设计的捕获探针对目标区域进行捕获、磁珠分离富集、构建测序文库。此处,目标区域主要包括HBZ/HBZP1/HBA2/HBA1/HBQ1/HS-40基因外显子及其上下游一定区域,此外还包括特定的对照探针的捕获区域。HBZ/HBZP1/HBA2/HBA1/HBQ1/HS-40的目标捕获区域和相应探针序列为针对α珠蛋白基因簇上X、Y、Z同源盒之间的非同源区设计(如表1所述),并且包含所有用于估算拷贝数的特征位点(特征位点通过已有数据训练得到);对照探针捕获区域通过训练集筛选:(1)对照探针以安捷伦ClearSeq探针组(一种捕获试剂)为备选,并从中挑选合适的探针区间;(2)挑选GC含量与所述主要探针相近的区间;(3)挑选训练集中覆盖深度与所述主要探针覆盖深度相关性大于0.8的区间;对照探针序列如下表2所示:
表1
表2
4.测序
测序文库的DNA片段被杂交到测序仪的流动槽(flow cell)上并以之为模板生长DNA簇,然后在Illumina HiSeq平台(Illumina高通量测序平台)上进行150bp双端测序。
5.数据分析
步骤A,将测序读段(reads)使用比对软件(BWA软件,版本:0.7.12)比对到人参考基因组(hg19)。
步骤B,去除重复序列。使用Picard(一种基本序列处理工具,版本2.8)去除PCR扩增过程产生的重复序列(PCR duplicate reads)。
步骤C,去除比对结果不可信的读段。此处,比对结果不可信是指:由于HBA1和HBA2高度同源,虽然比对软件将一个读段分配到其中一个基因的外显子,但实际上该读段既可以被分配到HBA1,也可以分配到HBA2。对于被分配到HBA1和HBA2外显子1和外显子3的读段,本发明剔除那些不涵盖任何一个如下所述用于区分HBA1和HBA2的外显子1和外显子3的位点的读段:
染色体chr16,坐标222869,HBA2基因,外显子1上游23bp,核苷酸G;
染色体chr16,坐标226673,HBA1基因,外显子1上游23bp,核苷酸C;
染色体chr16,坐标223447,HBA2基因,外显子3上游24bp,核苷酸G;
染色体chr16,坐标227258,HBA1基因,外显子3上游24bp,核苷酸C;
染色体chr16,坐标223614,HBA2基因,外显子3下游14bp,核苷酸A;
染色体chr16,坐标227425,HBA1基因,外显子3下游14bp,核苷酸G;
染色体chr16,坐标223618,HBA2基因,外显子3下游18bp,核苷酸G;
染色体chr16,坐标227429,HBA1基因,外显子3下游18bp,核苷酸A;
染色体chr16,坐标223620,HBA2基因,外显子3下游20bp,核苷酸T;
染色体chr16,坐标227431,HBA1基因,外显子3下游20bp,核苷酸G;
染色体chr16,坐标223622,HBA2基因,外显子3下游22bp,核苷酸C;
染色体chr16,坐标227433,HBA1基因,外显子3下游22bp,核苷酸T;
染色体chr16,坐标223625,HBA2基因,外显子3下游25bp,核苷酸C;
染色体chr16,坐标227436,HBA1基因,外显子3下游25bp,核苷酸T;
染色体chr16,坐标223631-223632,HBA2基因,外显子3下游31-32bp,核苷酸GC;
染色体chr16,坐标227442-227443,HBA1基因,外显子3下游31-32bp,核苷酸CT;
染色体chr16,坐标223643-223644,HBA2基因,外显子3下游43-44bp,核苷酸AA;
染色体chr16,坐标227454-227455,HBA1基因,外显子3下游43-44bp,核苷酸CC;
染色体chr16,坐标223646,HBA2基因,外显子3下游46bp,核苷酸G;
染色体chr16,坐标223457,HBA1基因,外显子3下游46bp,核苷酸A;
染色体chr16,坐标223648,HBA2基因,外显子3下游48bp,核苷酸G;
染色体chr16,坐标223459,HBA1基因,外显子3下游48bp,核苷酸C。
HBA1和HBA2基因具有高度同源性,能否准确区分这两个基因对于拷贝数估算结果至关重要,本发明根据上述特定差异位点设计的探针均能直接用于区分HBA1和HBA2基因,解决了本领域的技术难题。这样的设计,使本发明试剂盒在实际估算样本拷贝数时能够直接估算样本拷贝数并且能够处理更多的情况(比如HBA1和HBA2的某些特定位点发生突变时),从而具有决定性的优势,达到了本领域所预料不到的技术效果。
步骤D,标准化覆盖深度,具体包括:步骤1,计算覆盖深度:将目标捕获区域划分为固定长度的区间,并计算每个区间的平均覆盖深度;所述覆盖深度是指分配至所述区间的读段数目与该区间大小的比值;
步骤2,挑选差异位点,差异位点通过已有训练集挑选,包括如下步骤;(1)挑选能够区分HBA1基因以及HBA2基因的差异位点,其中位点区域如图2所示;(2)挑选HBA1基因以及HBA2基因上其它位点(除HBA1/HBA2差异位点外的其它位点),所挑选位点需避开多态位点、常见SNP(单核苷酸多态性)变异位点;(3)挑选HBZ、HBQ1、HBZP1基因外显子区域上的位点,所挑选位点均匀分布各基因外显子区域,并避开高度同源区、回文序列区域、多态位点、常见SNP(单核苷酸多态性)变异位点等;(4)根据训练集进一步筛选步骤(1)(2)(3)所选位点,其中所选位点在训练集中经过两步标准化之后的覆盖深度的标准差要小于0.18(将经过这四步筛选所得到的位点定义为特征位点)。所选77个特征位点,如下所示:
染色体chr16,坐标203900,核苷酸A
染色体chr16,坐标203950,核苷酸G
染色体chr16,坐标204000,核苷酸A
染色体chr16,坐标204050,核苷酸G
染色体chr16,坐标204400,核苷酸C
染色体chr16,坐标214480,核苷酸G
染色体chr16,坐标214500,核苷酸A
染色体chr16,坐标214505,核苷酸A
染色体chr16,坐标214600,核苷酸G
染色体chr16,坐标214605,核苷酸T
染色体chr16,坐标219818,核苷酸T
染色体chr16,坐标219853,核苷酸C
染色体chr16,坐标219922,核苷酸G
染色体chr16,坐标221062,核苷酸C
染色体chr16,坐标221082,核苷酸A
染色体chr16,坐标221108,核苷酸C
染色体chr16,坐标221128,核苷酸C
染色体chr16,坐标223383,核苷酸C
染色体chr16,坐标223447,核苷酸C
染色体chr16,坐标223614,核苷酸G
染色体chr16,坐标223618,核苷酸T
染色体chr16,坐标223620,核苷酸C
染色体chr16,坐标223622,核苷酸T
染色体chr16,坐标223625,核苷酸T
染色体chr16,坐标223631,核苷酸C
染色体chr16,坐标223632,核苷酸T
染色体chr16,坐标223643,核苷酸A
染色体chr16,坐标223644,核苷酸C
染色体chr16,坐标223646,核苷酸G
染色体chr16,坐标223648,核苷酸C
染色体chr16,坐标223661,核苷酸C
染色体chr16,坐标223663,核苷酸T
染色体chr16,坐标223670,核苷酸G
染色体chr16,坐标223673,核苷酸C
染色体chr16,坐标223678,核苷酸T
染色体chr16,坐标225100,核苷酸A
染色体chr16,坐标225120,核苷酸G
染色体chr16,坐标225141,核苷酸G
染色体chr16,坐标225161,核苷酸C
染色体chr16,坐标225181,核苷酸C
染色体chr16,坐标225735,核苷酸T
染色体chr16,坐标225745,核苷酸C
染色体chr16,坐标225755,核苷酸A
染色体chr16,坐标225765,核苷酸G
染色体chr16,坐标225780,核苷酸T
染色体chr16,坐标226043,核苷酸T
染色体chr16,坐标226220,核苷酸C
染色体chr16,坐标226221,核苷酸C
染色体chr16,坐标226673,核苷酸C
染色体chr16,坐标227187,核苷酸C
染色体chr16,坐标227250,核苷酸C
染色体chr16,坐标227253,核苷酸G
染色体chr16,坐标227258,核苷酸C
染色体chr16,坐标227425,核苷酸G
染色体chr16,坐标227429,核苷酸T
染色体chr16,坐标227431,核苷酸C
染色体chr16,坐标227433,核苷酸T
染色体chr16,坐标227436,核苷酸T
染色体chr16,坐标227442,核苷酸T
染色体chr16,坐标227443,核苷酸T
染色体chr16,坐标227454,核苷酸C
染色体chr16,坐标227455,核苷酸C
染色体chr16,坐标227457,核苷酸G
染色体chr16,坐标227459,核苷酸C
染色体chr16,坐标227472,核苷酸C
染色体chr16,坐标227474,核苷酸T
染色体chr16,坐标227481,核苷酸G
染色体chr16,坐标227484,核苷酸C
染色体chr16,坐标227487,核苷酸C
染色体chr16,坐标227488,核苷酸C
染色体chr16,坐标227490,核苷酸T
染色体chr16,坐标230700,核苷酸C
染色体chr16,坐标230750,核苷酸A
染色体chr16,坐标231000,核苷酸T
染色体chr16,坐标231050,核苷酸T
染色体chr16,坐标231100,核苷酸C
染色体chr16,坐标231150,核苷酸T
步骤3,标准化覆盖深度:
覆盖深度的标准化主要分为两个维度:首先,“单样本多位点标准化”,该步骤是相对于同一样本所有特征位点,即所有特征位点的覆盖深度和相关对照探针捕获区间的覆盖深度进行计算的,公式如下:
其中,read depth of unique site i为特征位点的覆盖深度,sample’savg.depth指每个样本对照探针的覆盖深度。
其次,“多样本单位点标准化”,该步骤是相对于同一特征位点所有样本(所有样本指已有训练集中的所有样本)进行计算的,公式如下:
其中,site’s avg.depth指每个所选特征位点在训练集中经过第一步标准化之后的平均覆盖深度。
步骤E,极大似然估计:
(1)假设所选取的特征位点之间相互独立
(2)计算z-score:对于一批样本中的每个样本每个差异位点,按如下公式计算z-score:
其中,Zi,j表示第j个样本的特征位点i的Z-score值,normRD′i,J为第j个样本特征位点i经步骤3计算得到的标准化覆盖深度,Expected copy number为相对于某一种缺失类型在该位点的拷贝数,SD(normRD′i)为在训练集中该特征位点矫正后覆盖深度的标准差。
(3)极大似然估计:把每个位点相对于某一种基因型计算的z-score转化为概率值,对于某一个样本某一种假设缺失类型,将所有位点的概率值相乘,最大概率值所对应的基因型即为该样本所对应的基因型。
6.实验结果
表3. 980个样本的实验结果(所有样本均用MLPA进行过验证)
表3的检测结果表明,在980个进行过MLPA验证的样本中,一共有28个携带者(HBA1/HBA2基因存在缺失,经过MLPA验证),对于这28个样本,本发明全部准确检测出来,灵敏度为100%,特异性为99.89%,精度为96.55%,准确性为99.90%。本发明所检测的所有真阳性样本的缺失类型如下表4所示,其中有6个样本为--SEA/αα缺失类型,20个样本为-α3.7/αα缺失类型,2个样本为-α4.2/αα缺失类型。
表4.本方法检测的阳性结果与MLPA结果的比较(29个样本)
以上仅是本发明的具体应用范例,对本发明的保护范围不构成任何限制;对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以列举说明。凡采用等同变换或者等效替换而形成的类似此种的技术方案,均落在本发明权利保护范围之内。
序列表
<110> 明码(上海)生物科技有限公司
<120> 用于捕获α地中海贫血相关基因拷贝数检测试剂盒
<130> WH-YXSC-NP-18-100070C
<160> 88
<170> SIPOSequenceListing 1.0
<210> 1
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 1
atgagcgccg cccggccggg cgtgcccccg cgccccaagc ataaaccctg gcgcgctcgc 60
ggcccggcac tcttctggtc cccacagact cagagagaac ccaccatggt gctgtctcct 120
gccgacaaga ccaacgtcaa ggccgcctgg ggtaaggtcg gcgcgcacgc tggcgagtat 180
ggtgcggagg ccctggagag gtgaggctcc ctcccctgct ccgacccggg ctcctcgccc 240
<210> 2
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 2
caggcggcgg ctgcgggcct gggccctcgg ccccactgac cctcttctct gcacagctcc 60
taagccactg cctgctggtg accctggccg cccacctccc cgccgagttc acccctgcgg 120
tgcacgcctc cctggacaag ttcctggctt ctgtgagcac cgtgctgacc tccaaatacc 180
gttaagctgg agcctcggtg gccatgcttc ttgccccttg ggcctccccc cagcccctcc 240
<210> 3
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 3
atgagcgccg cccggccggg cgtgcccccg cgccccaagc ataaaccctg gcgcgctcgc 60
gggccggcac tcttctggtc cccacagact cagagagaac ccaccatggt gctgtctcct 120
gccgacaaga ccaacgtcaa ggccgcctgg ggtaaggtcg gcgcgcacgc tggcgagtat 180
ggtgcggagg ccctggagag gtgaggctcc ctcccctgct ccgacccggg ctcctcgccc 240
<210> 4
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 4
tgtagcgcag gcggcggctg cgggcctggg ccgcactgac cctcttctct gcacagctcc 60
taagccactg cctgctggtg accctggccg cccacctccc cgccgagttc acccctgcgg 120
tgcacgcctc cctggacaag ttcctggctt ctgtgagcac cgtgctgacc tccaaatacc 180
gttaagctgg agcctcggta gccgttcctc ctgcccgctg ggcctcccaa cgggccctcc 240
<210> 5
<211> 180
<212> DNA
<213> 人工序列(未知)
<400> 5
cctgagcagg cccaactcca gtgcagctgc ccaccctgcc gccatgtctc tgaccaagac 60
tgagaggacc atcattgtgt ccatgtgggc caagatctcc acgcaggccg acaccatcgg 120
caccgagact ctggagaggt gagtgtcaga cgggactgcc agagggactg ggtgggaggc 180
<210> 6
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 6
ccccgccccc cgtcccaggc tcttcctcag ccacccgcag accaagacct acttcccgca 60
cttcgacctg cacccggggt ccgcgcagtt gcgcgcgcac ggctccaagg tggtggccgc 120
cgtgggcgac gcggtgaaga gcatcgacga catcggcggc gccctgtcca agctgagcga 180
gctgcacgcc tacatcctgc gcgtggaccc ggtcaacttc aaggtgcgcg gggcgcggtg 240
<210> 7
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 7
gccgggcggg gcccgggcta ggccccgccc cctcactgag ccgcccccgc ccccagctcc 60
tgtcccactg cctgctggtc accctggccg cgcgcttccc cgccgacttc acggccgagg 120
cccacgccgc ctgggacaag ttcctatcgg tcgtatcctc tgtcctgacc gagaagtacc 180
gctgagcgcc gcctccggga cccccaggac aggctgcggc ccctcccccg tcctggaggt 240
<210> 8
<211> 221
<212> DNA
<213> 人工序列(未知)
<400> 8
caggcgcagc ggggtcgcag ggcgcggcgg gttccagcgc ggggatggcg ctgtccgcgg 60
aggaccgggc gctggtgcgc gccctgtgga agaagctggg cagcaacgtc ggcgtctaca 120
cgacagaggc cctggaaagg tgcggcaggc tgggcgcccc cgcccccagg ggccctccct 180
ccccaagccc cccggacgcg cctcacccac gttcctctcg c 221
<210> 9
<211> 241
<212> DNA
<213> 人工序列(未知)
<400> 9
acccacgttc ctctcgcagg accttcctgg ctttccccgc cacgaagacc tacttctccc 60
acctggacct gagccccggc tcctcacaag tcagagccca cggccagaag gtggcggacg 120
cgctgagcct cgccgtggag cgcctggacg acctacccca cgcgctgtcc gcgctgagcc 180
acctgcacgc gtgccagctg cgagtggacc cggccagctt ccaggtgagc ggctgccgtg 240
c 241
<210> 10
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 10
gtgcgggggg cgtgcggggc gggtgcaggc gagtgagcct tgagcgctcg ccgcagctcc 60
tgggccactg cctgctggta accctcgccc ggcactaccc cggagacttc agccccgcgc 120
tgcaggcgtc gctggacaag ttcctgagcc acgttatctc ggcgctggtt tccgagtacc 180
gctgaactgt gggtgggtgg ccgcgggatc cccaggcgac cttccccgtg tttgagtaaa 240
<210> 11
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 11
cctgagcagg cccaactcca gtgcagccgc ccaccctgcc gccatgtctc tgaccaagac 60
ttaggggacc atcattgtgt ccatgtgggc caagatctcc acgcaggccg acaccatcgg 120
<210> 12
<211> 240
<212> DNA
<213> 人工序列(未知)
<400> 12
ccccgccccc cgtcccaggc tcttcctcag ccacccgcag accaagacct acttcccgca 60
cttcgacctg cacccggggt ccgcgcagtt gcgcgcgcac ggctccaagg tggtggccgc 120
cgtgggcgac gcggtgaaga gcatcgacga catcggcggc gccctgtcca agctgagcga 180
gctgcacgcc tacatcctgc gcgtggaccc ggtcaacttc aaggtgcgcg gggcgcggtg 240
<210> 13
<211> 180
<212> DNA
<213> 人工序列(未知)
<400> 13
gcggggcggg gcccgggcta ggccccgccc ccgcactgag ccgcccccgc ccccagctcc 60
tgtcccactg cctgctggtc accctggccg cgcgcttccc cgccgacttc acggccgagg 120
cccacgccgc ctgggccaag ttcctatcgg tcgtatcctc tgtcctgacc gagaagtacc 180
<210> 14
<211> 200
<212> DNA
<213> 人工序列(未知)
<400> 14
ccaagggtgg aggcatgcag ctgtgggggt ctgtgaaaac acttgaggga gcagataact 60
gggccaacca tgactcagtg cttctggagg ccaacaggac tgctgagtca tcctgtgggg 120
gtggaggtgg gacaagggaa aggggtgaat ggtactgctg attacaacct ctggtgctgc 180
ctccccctcc tgtttatctg 200
<210> 15
<211> 160
<212> DNA
<213> 人工序列(未知)
<400> 15
catactgtag atacctgtgt acaacttcct attctcagtg aagtgtctcc cctgcatccc 60
tttcagccag ttcattcagc tctgcgccat tccacagtct cactgattat tactatgttt 120
ccatcatgat ccccccaaaa aatcatgact ttattttttt 160
<210> 16
<211> 101
<212> DNA
<213> 人工序列(未知)
<400> 16
cctcccagag gaggttgaat gctccagccg gttccagcta ttgctttgtt tacctgttta 60
accagtattt acctagcaag tcttccatca gatagcattt g 101
<210> 17
<211> 201
<212> DNA
<213> 人工序列(未知)
<400> 17
atgaggtctg cacctctgtg tgtacttgtg tgatggttag aggactgcct acctcccaga 60
ggaggttgaa tgctccagcc ggttccagct attgctttgt ttacctgttt aaccagtatt 120
tacctagcaa gtcttccatc agatagcatt tggagagctg ggggtgtcac agtgaaccac 180
gacctctagg ccagtgggag a 201
<210> 18
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 18
ggtctcaccc agctcagctg aggtaactca ttttgccatt tcttcatttt taggacaact 60
gtcatctggg aagtaacaac gcaggatgcc ccctggggtg gactgcccca tggaattctg 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 19
cattaaattc cagtgccagg attccagaag cactgtgaca atgctgattg ggagctctct 60
ctcttacctc tctggaagga cttgaaaact ccatcccctc agggtcatta gatgaagaga 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 20
ggcccagctt ctgattcttt aaaaacccca gggatgccag aggggaacag gaggtgacac 60
ttgggaactg cagctgctct attctagtcc gtactctcca gtcacatgtc tcaacccctt 120
<210> 21
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 21
tccaagctca ctgttctcac cacacggccc cactccggtt tcctggaggc tcccccagaa 60
gcatttgggg gacatagtcc aggcaggtgc ctcctcccag gtggggcaag cacctggcat 120
<210> 22
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 22
ataaatatct tttgaatgat tgaaggacct aaagccaccc tccccctact agggtgacat 60
ctatgtgctg tcttctctgg accgggagaa gaaggaccac tatatcctga ctgccttggc 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 23
cctttgatgg attgttcagc tctggctgtg tccccgagcc acactctttc catttccttc 60
cttttgctca gtatttgtgg acttttttct acttcctctt tcacactttt cctttggatg 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 24
ggtctccgca caccgccccc gcccacagaa cccaggggag ccgactgcag ccactactca 60
ctggtccagg tggacctgcc agtaggcctt gcgggtgaca ttcaggtagg acagagaacc 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 25
agctgctgta tcccacccta tgaggctgca aagatgggat ggagagggag agagtagcaa 60
gttgcagaaa gccataggta aaatccaatc agtagtcagc agagggcaag aaacgcccag 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 26
cgcggggcac ggcgagggca gtgcagggtc gaggcgcccg gtccaggctg cggcgccgct 60
actcacctct ccgaactgga aggcggagac gatggtgaca acgacgccca agaagcacac 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 27
gggcaagctc ctctctccac ggccatcgcc atggagggat cctccaagct cccactttct 60
gtgatttcag agtccctcag actcggccga tgggtcattt ttcatgtata ttttctcttg 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 28
tttggaagaa ctttaaaatg gtgtatgcca tgagtatttc tttgcatttt tcacctgtcc 60
ccaccctacc tttgtctccc gttttggtgt aaatcttggg gatcctgggt gtcttcgagg 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 29
gggatggagg ggtcccctca agggaaggct ctgactgtac ccccatgttt aggaggcagc 60
catggccaag ctggccgcct cggaggccgc gaccgccatc agccaccagg tgagtgtcca 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 30
tgggatagag gttaactcgg ttgtgaaata atggccaaag cggtgcactc ttaataactt 60
ttttgtagcc ctggagaaag cttctggatt gactgtgaga agcttggcag aaggtgctgc 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 31
gccccactta caaatgcagg cagcagccag caggcggctg gcagcataag gggcgaagca 60
gctcgggaag agaggctgta ccatgtagtt ggcaaaggtg atggcaatga tggcctggct 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 32
agcactgctg cccaacagtg gcccgccctc cacctgctct gtctcccaag tccaggtggg 60
tggcactgac ctgtcaacat gcttgagaag agcatggctg ggaagtagtg gtggaagtag 120
<210> 33
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 33
actataacat ttctggttta gtgtggcccc agggttcagt cagtccattt caagtcagga 60
agccttactc ctctcattcc catgtagctg tgatgctcat atttatcccc aggcttctgg 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 34
gggcggccct cacctctgct tggggtcctt cttgagcagc cctgaaagca aggacttggc 60
ctcgggacca agcgtgcgcg ggaagcggat ctcctccatg aggatgagct caaaaagctt 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 35
gagggctcca gccaaccccc caaatctgaa tcccgagagg ccaaggggat acttacgcgc 60
cacagagaag ttgttgaggg gagcctcacg ttggtccaca tcctgcggcc gctccttgta 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 36
tacaagatgg cactatttta aactcacctc ccttttgtga ggaatgaagc aaactcctgg 60
cctgcaggag cccaagagct ctgcccggca gcccccctgg ggcaggagtg cgaggggtca 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 37
tctgggtagt ggagatgctg tctgcagtgg catctgttta cctctctcct attagcttcg 60
tcagaccatg gctaagttcc ttcaggagca cctggccccc aaggcccagg agatcgatcg 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 38
tccccaaccc tgcccctact taccaggccg agggggatat ggccaccgcc aatgtggggc 60
aagttccctc tgccaagcag acctccacgt cgaacaccag ggcccgctcc tcggggatgg 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 39
cctggggcca cgtggcaggg acagagatgg gtccatggca gtgtctgctc ttctctgtga 60
aggcaaaggg cctctgaggg agtattatag ccgcctcatc caccagaagc acttccagca 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 40
tgtctgacct gtccctctgc ccacaggtga atgtgacctg cgtcctgagg atcccgagta 60
tcaggagagc tggcagagga agtcatgcag aggcaaagcc aggagccccg acagggagat 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 41
ccccacatgg cacggagccg ggctgggatt tgatgagaaa ggcctgagcc cacctgccac 60
cctccctgca gtagtaggaa tagacaaggt tgatgcagcc gcccagagtc agggctggaa 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 42
tgttacccat tagagtaacc acttcaccga ctggcaagcg agggagggga gaccaagggc 60
tctgagcagc ccccaaagct ccttgtccct cagggtggct atgtggggag cggcctacct 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 43
agctagatgc cagcggggtc ctcggtaact gtacgtggca tcggattgaa cctcagtctt 60
cctaacaggt tgtggtgcct cctggagtga caaactcctc ttttcaagtg acatctcaaa 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 44
caccccacct accggacaga tgaacagttt ctgctgcagc ggctggcaga cggggccatc 60
gacctctatg ccatggtggt ggttctctcg aggtgaggag gcaggcaggg aatgcctgag 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 45
gctccccact agggtgttcc ctcaggtcaa tgtcacgaag atgggcagtt ggggccactt 60
taactgttcc tactcctgct ccttccttct ggctccggaa gaccccatat tccccatcat 120
<210> 46
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 46
acctcctggg ctctggcctg gcctctgtgc ctcaccccac gccctgtcct cggcacgggg 60
tcctcacctg tgcgcacacc agcttggctg agcagcagcg gcaggctccg caccttgtcg 120
<210> 47
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 47
aaaaaaaaaa aggaagcaac acaaagggac atgttcaggt agccagctcc ttctttctcc 60
aggctcagca gactacagga ctggtaggat tgaaagcata attacctaag aaaaatgcta 120
<210> 48
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 48
gtgacttatt tcttcaaaca gcaggttacc tggtgcagta tctgtatgtc aagcggaggt 60
ccaaagggta catcagctcc cgaagggtat ggctggtaaa tgtgtttgtc agtgagaggg 120
<210> 49
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 49
gagatgggat caggatcagg agaaaaggag agcgagagaa acaggaggca tcacccctgc 60
tctcaagttc caatggacac atgtaataat gactaagctc attgccagag agacgcccca 120
<210> 50
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 50
ctctcctatt cccacagaga ccgagcggct tctgaccccc aaccccgggt atgggaccca 60
ggcggggcct tcaccggccc ctccgacacc cccagaagag gaagaccttc gccgtcgtct 120
<210> 51
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 51
tgggtgggct gcagagagcg ggccggactc acaggccctc cccttctctg cccacagtac 60
ctggcgttgc ctgacgtgtc actgggccgg tatgcgtatg tccgtggtgg gggtgaccct 120
<210> 52
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 52
ggccttggag gttgggagcc actttcaggc tgagcctccc ggcttctctc cccagcatcc 60
cggcggcgca ggcgcagagg agagcgagct gcaggcctac atcgcacagt gccaggacag 120
<210> 53
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 53
gtgagccacc ctgcctggct gtttttaaag tgtgccccaa acataatccc ggactattcc 60
ttaccttcaa gagatgggtc atcatcatag attggttttg ctgaaccaga aaagaagagt 120
<210> 54
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 54
gtccggggcg aggcggatgc aggggaggcc tggcgttcct ccgcggttcc tgtcacaaag 60
gcgacgacaa gtcccgggtc cccggagccg cctccgcgac atacacgagt cgccctccgt 120
<210> 55
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 55
caccaccctc ctcccgagca gggatgagca agggggcaca gggagggctg accacagcta 60
cctgtttgcc cagcagcacc aggtccacct tctccttctc tgccagcttg gccaggaccc 120
<210> 56
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 56
atgaggcctg ctcactggta gaacttcttg ttagggctgt tagcatggtc agctagcagc 60
tggcatgggg tgaactgttt tccataggca gcttcatatt tcttgagccg gtccactatc 120
<210> 57
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 57
ggccaggccc tccagtggcc ccctgcctca cctgctgccc tccattctgt cccccacctc 60
tccaggtaca agtgcctgct cctggtggat tcggtggcat ccctgggcgg gacccccctt 120
<210> 58
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 58
tggactggcc tgccctgagg tgggactcac ccgtcccgag caaaccaccc atctacaggc 60
atcgacatcc tgtactcggg ctcccagaag gccctgaacg cccctccagg gacctcgctc 120
<210> 59
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 59
gaacccggac aggactcctc tgcggaggat accggcctgt ggtcagagag cctgtgctgt 60
tggggctggg gcagacagag ctaatgcccc atctgccccc aaccctgccc atggtgctgg 120
<210> 60
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 60
gctgtcggtc agggtcaggc aggtcccagg cgggaggctg acgtcagccc gccctgtgcc 60
ccccaggtgc tgcggatcgg cctgctgggc tgcaatgcca cccgcgagaa tgtggaccgc 120
<210> 61
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 61
aaaactccat gcaccagatg acaatactga aagagacttg gcagagctgt ggaggcaggt 60
gtgggatata ttaaggacat accttgagaa cttttgttcc aggcaagagg gatctaaggg 120
<210> 62
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 62
tggtcttctt ggaaggaata aatgtaaaaa tgttgctcag ccccacagag ttggggtgac 60
tccacagggt gaaggcttgg aggagtggcg tcttcagagg ttctgccctg ctcgttggtt 120
<210> 63
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 63
cagggagcag gcggccaggc gggccagcac atgcggctgc agctcagcca tcccccccgg 60
gtcccggcag gctcggcatg ggtaggggac agccagccct ggccaccccc tctgggcctg 120
<210> 64
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 64
atggaagtga actagctggg aaaacacaca agcaagcctc ttacattaaa atcggatcct 60
tttaccagaa agcatgccca ctcacctctg cccaaaccat ccccagcaaa agggaggccc 120
<210> 65
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 65
tcgacctggg ctacagaccc tgagggaagt ggcctggggg aggggcccac actcacacag 60
tccaccacca tcttgcccag ttccttggcc ccaaaaacag tcttggccag ctcccagggg 120
<210> 66
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 66
atcttcaatt taatcacctg aggcaatcct tgtcagatcc cctacatcaa atcagccacc 60
aaatctcaag attctaatct atttctcctc tctatcccca atgacaggtt gccacacgct 120
<210> 67
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 67
tgggccactc acctccccag cttcccccca ccccacaggc ttctcacctc cctggctggg 60
cacccccgtg ggccactcac ctccccagtg ccccctcccc ctgcaggcca ctcacctccc 120
<210> 68
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 68
agagcacgtg ccggcgagct tgggcactgg cagaggcgtg gaggaagctg cttacagagc 60
ctgcagcaca gcgcaagtaa tccatctcag ccgggaacac gttccccagg tacagcgaaa 120
<210> 69
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 69
tgagaggtcc tcacggataa ccaccccaga cttctcccag aaagccttac cacaggaact 60
cgcggggaac tgggcccata cacagattcc ccgtaggaag ggttattcac attcatagtg 120
<210> 70
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 70
ttgtgcttgg aggacctgat atttttattg aggcctattt tcactacctc aaggttactt 60
actttctgcc ccaacattcc aggaaatcct gggaaaccct gtgaaaagag caacaaataa 120
<210> 71
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 71
cccggttccc cgccagcctg tcccctagca atgcctcccc gtacccgggt cccgcagact 60
tacgcgcaag ccgcgcgtag ggcccagaag cagcagaacc agcaacagag ggaggatgcg 120
<210> 72
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 72
ctctcacccc acccgcccgt gatgtcctct caccctgccc gcccgtgatg ccctcttgcc 60
ccgcctgccc gcagtgcata ggttccatgt gacagtggct ccaggcacca agttggagag 120
<210> 73
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 73
cggtcaggaa catggagcgg gaacttccaa ggtgcaggag aggcggagtg gggaggaggg 60
gctaggcagg gtgggcagct ctttactgca caatctttga gatctgtgcc cctctcggtc 120
<210> 74
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 74
gctcctaccc gagggcaccc ctggaggaaa ttctcgaggt gacctggaca gggcgggctg 60
ggcgaggacg ctcccggggc ctggaggcgg agtcgggggc gggcgcgcgc agtcatctga 120
<210> 75
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 75
attaaaaata aaataaaaat taaaaaatga gtgccttcag gcagtgttcc aagcattggt 60
gaacacaatg gtggggctaa tgcagaaaag agtatcattt ttgcacacat ttctctgggt 120
<210> 76
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 76
gctctgtggg cctctgaggg cggcatgcgg gactacgacg aggtgaccgc cttcctgggc 60
gagtgggggc ccttccagcg cctcatcttc ttcctgctca gcgccagcat catccccaat 120
<210> 77
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 77
gaataaacaa aagtcagtga ctgattgaga tggcggggtg ggcaatgggg aagggatgta 60
taggtagact cttaagtcag aagccttact gaaatcagcc agaaagagct gggatcttct 120
<210> 78
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 78
cagtagaact ggcacatttt caaagtgaaa tggcgagagc tggctagaca acccaaacac 60
tcacatcagc atttgaaaag ggccaaaata aatgtttgac aagaattcct ttaaaaagag 120
<210> 79
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 79
agctccccac tagctttttg gttgacctct cagaccggca agtggctcac cttcctccag 60
gtcatgaacc ctgcgtttga gggcagctgt catagcatca gagcagagag agtagaggtc 120
<210> 80
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 80
agagagggag aacatgagct ggggagggga agtagctggg gttctactct ccagagaccc 60
tcaccttcag taagtggagc ccaaggtgac tacaggcagc agcaactact gtggtcttcc 120
<210> 81
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 81
cagtgagcca cgagcctccg ccaggcaggt gctcactgac actgtcccca tgggtcgggc 60
ttcattagaa accacagacc tcagaatgaa taaccccctc tcacactgcc aggcaaatca 120
<210> 82
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 82
ccctgtatgg tcaggctggg tggggatggg agaggcctgg tgactgggaa ccttttctcc 60
cagccgagtt cctgttctgg gcttcgctgt gcatgaccca tctcagcagg atggccgagg 120
<210> 83
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 83
aggcaatgga ggcagatcag ggcatggaga aacctgcctc agcgccatct tcctccctgg 60
cacccagatg ccattccgcc aggcccacga ggcctccggg aaagctgtgt tcatggccga 120
<210> 84
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 84
gcaaaaccag atttttagtt aataataggt tctggtttaa ttctacagta gataagtgtt 60
tattacttta ttacttaaat aaaagtcatc tttttagacc gtgttagtga gtctcccgtc 120
<210> 85
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 85
aggactcctt tggaatatag ctgtggacaa tgaatcctgc gagcgatggg ggcacatcag 60
agagcatttt tgacctggac tatgcatcct gggggatccg ctccacgctg atggtcgctg 120
<210> 86
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 86
caggagagag ggagctagag agctctgagg actgatcttg actgtctgcc cccagaccat 60
cagcatatcc gctacaaccc gctgcaggat gagtgggtgc tggtgtcagc tcaccgcatg 120
<210> 87
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 87
ccacagggat agtgaacctc cttctgggtc atatcccacc aagctttttg gtcccctagg 60
gtgggccttc cctactccct tgtagcctgt ccagtctttg aagcccacca ggtaactggt 120
<210> 88
<211> 120
<212> DNA
<213> 人工序列(未知)
<400> 88
tccgccgttc ccggcctcgg cttcctgctg cctacaccgc cctagcccag gcccccttag 60
tgagcgcttg gggagagaat ttccccggac gcccccctgg gcgtggcctc agccccattt 120

Claims (11)

1.一种用于捕获α地中海贫血相关基因拷贝数检测试剂盒,其特征在于:包括捕获探针,所述捕获探针由17个主要探针和对照探针组成;17个主要探针见表1:
表1
所述捕获探针对目标区域进行捕获,测序,通过数据分析估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。
2.如权利要求1所述的试剂盒,其特征在于,所述主要探针为针对α珠蛋白基因簇上X、Y、Z同源盒之间的非同源区设计,并且包含所有用于估算拷贝数的特征位点;此外充分考虑HBA1基因和HBA2基因的高度同源性,其中针对HBA1基因和/HBA2基因区间所设计的捕获探针至少包含一个能够区分HBA1基因和HBA2基因的差异位点。
3.如权利要求2所述的试剂盒,其特征在于,所述特征位点通过训练集经过如下步骤筛选;包括:(1)挑选能够区分HBA1基因以及HBA2基因的差异位点;(2)挑选HBA1基因以及HBA2基因上其它位点,即除HBA1和HBA2基因差异位点外的其它位点,所挑选位点避开多态位点、常见SNP变异位点;(3)挑选HBZ、HBQ1、HBZP1基因外显子区域上的位点,所挑选位点均匀分布各基因外显子区域,并避开高度同源区、回文序列区域、多态位点、常见SNP变异位点;(4)根据训练集进一步筛选步骤(1)(2)(3)所选位点,其中所选位点在训练集中经过两步标准化之后的覆盖深度的标准差小于0.18;将经过该四步筛选得到的位点定义为特征位点,所选77个特征位点,如下所示:
染色体chr16,坐标203900,核苷酸A
染色体chr16,坐标203950,核苷酸G
染色体chr16,坐标204000,核苷酸A
染色体chr16,坐标204050,核苷酸G
染色体chr16,坐标204400,核苷酸C
染色体chr16,坐标214480,核苷酸G
染色体chr16,坐标214500,核苷酸A
染色体chr16,坐标214505,核苷酸A
染色体chr16,坐标214600,核苷酸G
染色体chr16,坐标214605,核苷酸T
染色体chr16,坐标219818,核苷酸T
染色体chr16,坐标219853,核苷酸C
染色体chr16,坐标219922,核苷酸G
染色体chr16,坐标221062,核苷酸C
染色体chr16,坐标221082,核苷酸A
染色体chr16,坐标221108,核苷酸C
染色体chr16,坐标221128,核苷酸C
染色体chr16,坐标223383,核苷酸C
染色体chr16,坐标223447,核苷酸C
染色体chr16,坐标223614,核苷酸G
染色体chr16,坐标223618,核苷酸T
染色体chr16,坐标223620,核苷酸C
染色体chr16,坐标223622,核苷酸T
染色体chr16,坐标223625,核苷酸T
染色体chr16,坐标223631,核苷酸C
染色体chr16,坐标223632,核苷酸T
染色体chr16,坐标223643,核苷酸A
染色体chr16,坐标223644,核苷酸C
染色体chr16,坐标223646,核苷酸G
染色体chr16,坐标223648,核苷酸C
染色体chr16,坐标223661,核苷酸C
染色体chr16,坐标223663,核苷酸T
染色体chr16,坐标223670,核苷酸G
染色体chr16,坐标223673,核苷酸C
染色体chr16,坐标223678,核苷酸T
染色体chr16,坐标225100,核苷酸A
染色体chr16,坐标225120,核苷酸G
染色体chr16,坐标225141,核苷酸G
染色体chr16,坐标225161,核苷酸C
染色体chr16,坐标225181,核苷酸C
染色体chr16,坐标225735,核苷酸T
染色体chr16,坐标225745,核苷酸C
染色体chr16,坐标225755,核苷酸A
染色体chr16,坐标225765,核苷酸G
染色体chr16,坐标225780,核苷酸T
染色体chr16,坐标226043,核苷酸T
染色体chr16,坐标226220,核苷酸C
染色体chr16,坐标226221,核苷酸C
染色体chr16,坐标226673,核苷酸C
染色体chr16,坐标227187,核苷酸C
染色体chr16,坐标227250,核苷酸C
染色体chr16,坐标227253,核苷酸G
染色体chr16,坐标227258,核苷酸C
染色体chr16,坐标227425,核苷酸G
染色体chr16,坐标227429,核苷酸T
染色体chr16,坐标227431,核苷酸C
染色体chr16,坐标227433,核苷酸T
染色体chr16,坐标227436,核苷酸T
染色体chr16,坐标227442,核苷酸T
染色体chr16,坐标227443,核苷酸T
染色体chr16,坐标227454,核苷酸C
染色体chr16,坐标227455,核苷酸C
染色体chr16,坐标227457,核苷酸G
染色体chr16,坐标227459,核苷酸C
染色体chr16,坐标227472,核苷酸C
染色体chr16,坐标227474,核苷酸T
染色体chr16,坐标227481,核苷酸G
染色体chr16,坐标227484,核苷酸C
染色体chr16,坐标227487,核苷酸C
染色体chr16,坐标227488,核苷酸C
染色体chr16,坐标227490,核苷酸T
染色体chr16,坐标230700,核苷酸C
染色体chr16,坐标230750,核苷酸A
染色体chr16,坐标231000,核苷酸T
染色体chr16,坐标231050,核苷酸T
染色体chr16,坐标231100,核苷酸C
染色体chr16,坐标231150,核苷酸T。
4.如权利要求1所述的试剂盒,其特征在于,所述对照探针捕获区域经如下步骤筛选:(1)对照探针以安捷伦ClearSeq探针组为备选,并从中挑选合适的探针区间;(2)挑选GC含量与所述主要探针相近的区间;(3)进一步挑选训练集中覆盖深度与所述主要探针覆盖深度相关性大于0.8的区间。
5.如权利要求1所述的试剂盒,其特征在于,所述数据分析为结合了捕获探针所开发的独特的针对高度同源区的拷贝数估算方法,包括将测序读段使用比对软件比对到人参考基因组、去除重复序列、去除比对结果不可信的读段,标准化覆盖深度,利用极大似然估计估算α地中海贫血相关基因的拷贝数以及缺失类型分型。
6.如权利要求5所述的试剂盒,其特征在于,所述去除重复序列具体使用Picard去除PCR扩增过程产生的重复序列。
7.如权利要求5所述的试剂盒,其特征在于,所述比对结果不可信的读段为不涵盖任何一个差异位点的读段。
8.如权利要求2、3或7所述的试剂盒,其特征在于,所述差异位点为用于区分HBA1基因和HBA2基因的位点,如下所示:
染色体chr16,坐标222869,HBA2基因,外显子1上游23bp,核苷酸G;
染色体chr16,坐标226673,HBA1基因,外显子1上游23bp,核苷酸C;
染色体chr16,坐标223447,HBA2基因,外显子3上游24bp,核苷酸G;
染色体chr16,坐标227258,HBA1基因,外显子3上游24bp,核苷酸C;
染色体chr16,坐标223614,HBA2基因,外显子3下游14bp,核苷酸A;
染色体chr16,坐标227425,HBA1基因,外显子3下游14bp,核苷酸G;
染色体chr16,坐标223618,HBA2基因,外显子3下游18bp,核苷酸G;
染色体chr16,坐标227429,HBA1基因,外显子3下游18bp,核苷酸A;
染色体chr16,坐标223620,HBA2基因,外显子3下游20bp,核苷酸T;
染色体chr16,坐标227431,HBA1基因,外显子3下游20bp,核苷酸G;
染色体chr16,坐标223622,HBA2基因,外显子3下游22bp,核苷酸C;
染色体chr16,坐标227433,HBA1基因,外显子3下游22bp,核苷酸T;
染色体chr16,坐标223625,HBA2基因,外显子3下游25bp,核苷酸C;
染色体chr16,坐标227436,HBA1基因,外显子3下游25bp,核苷酸T;
染色体chr16,坐标223631-223632,HBA2基因,外显子3下游31-32bp,核苷酸GC;
染色体chr16,坐标227442-227443,HBA1基因,外显子3下游31-32bp,核苷酸CT;
染色体chr16,坐标223643-223644,HBA2基因,外显子3下游43-44bp,核苷酸AA;
染色体chr16,坐标227454-227455,HBA1基因,外显子3下游43-44bp,核苷酸CC;
染色体chr16,坐标223646,HBA2基因,外显子3下游46bp,核苷酸G;
染色体chr16,坐标223457,HBA1基因,外显子3下游46bp,核苷酸A;
染色体chr16,坐标223648,HBA2基因,外显子3下游48bp,核苷酸G;
染色体chr16,坐标223459,HBA1基因,外显子3下游48bp,核苷酸C。
9.如权利要求5所述的试剂盒,其特征在于,所述标准化覆盖深度具体包括如下步骤:
步骤1,计算覆盖深度:计算目标捕获区域每个碱基的覆盖深度;所述覆盖深度是指分配至所述碱基的读段数目;
步骤2,计算特征位点覆盖深度;
步骤3,标准化特征位点覆盖深度:覆盖深度的标准化主要分为两个维度:
首先,“单样本多位点标准化”,该步骤是相对于同一样本所有特征位点,即所有特征位点的覆盖深度和相关对照探针捕获区间的平均覆盖深度进行计算的,公式如下:
其中,read depth of unique site i为特征位点的覆盖深度,sample’s avg.depth指每个样本对照探针的覆盖深度;
其次,“多样本单位点标准化”,该步骤是相对于同一特征位点所有样本进行计算的,所述所有样本指已有训练集中的所有样本,公式如下:
其中,site’s avg.depth指每个所选特征位点在训练集中经过第一步标准化之后的平均覆盖深度。
10.如权利要求9所述的试剂盒,其特征在于,所述利用极大似然估计估算α地中海贫血相关基因的拷贝数以及缺失类型分型具体包括如下步骤:
(1)假设所选取的特征位点之间相互独立;
(2)计算z-score:对于一批样本中的每个样本每个特征位点,按如下公式计算z-score:
其中,Zi,j表示第j个样本的特征位点i的Z-score值,normRD′i,J为第j个样本特征位点i经步骤3计算得到的标准化覆盖深度,expected copy number为相对于某一种缺失类型在该位点的拷贝数,SD(normRD′i)为在训练集中该特征位点矫正后覆盖深度的标准差;
(3)极大似然估计:把每个位点相对于某一种基因型计算的z-score转化为概率值,对于某一个样本某一种假设缺失类型,将所有位点的概率值相乘,最大概率值所对应的基因型即为该样本所对应的基因型。
11.如权利要求1或5所述的试剂盒,其特征在于,所述捕获探针对目标区域进行捕获后,采用磁珠分离富集,PCR进行扩增,构建测序文库,再进行测序,并利用结合所述捕获探针所开发的独特的针对高度同源区的拷贝数估算方法估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。
CN201910083308.XA 2019-01-21 2019-01-28 用于捕获α地中海贫血相关基因拷贝数检测试剂盒 Active CN109584957B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019100519321 2019-01-21
CN201910051932 2019-01-21

Publications (2)

Publication Number Publication Date
CN109584957A true CN109584957A (zh) 2019-04-05
CN109584957B CN109584957B (zh) 2020-04-17

Family

ID=65918381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910083308.XA Active CN109584957B (zh) 2019-01-21 2019-01-28 用于捕获α地中海贫血相关基因拷贝数检测试剂盒

Country Status (1)

Country Link
CN (1) CN109584957B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110373458A (zh) * 2019-06-27 2019-10-25 东莞博奥木华基因科技有限公司 一种地中海贫血检测的试剂盒及分析系统
CN113755568A (zh) * 2021-08-26 2021-12-07 广东省妇幼保健院 利用微滴数字PCR检测α珠蛋白基因拷贝数的引物探针、试剂盒及应用
CN114277096A (zh) * 2021-12-29 2022-04-05 深圳联合医学科技有限公司 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒
CN116769906A (zh) * 2023-08-10 2023-09-19 赛雷纳(中国)医疗科技有限公司 用于检测α-地中海贫血的试剂盒

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102952877A (zh) * 2012-08-06 2013-03-06 深圳华大基因研究院 检测α珠蛋白基因拷贝数的方法和系统
CN106834502A (zh) * 2017-03-06 2017-06-13 明码(上海)生物科技有限公司 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
CN106939350A (zh) * 2017-04-28 2017-07-11 深圳市龙华区人民医院 地中海贫血症相关基因突变的检测试剂盒、检测方法及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102952877A (zh) * 2012-08-06 2013-03-06 深圳华大基因研究院 检测α珠蛋白基因拷贝数的方法和系统
CN106834502A (zh) * 2017-03-06 2017-06-13 明码(上海)生物科技有限公司 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
CN106939350A (zh) * 2017-04-28 2017-07-11 深圳市龙华区人民医院 地中海贫血症相关基因突变的检测试剂盒、检测方法及其应用

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110373458A (zh) * 2019-06-27 2019-10-25 东莞博奥木华基因科技有限公司 一种地中海贫血检测的试剂盒及分析系统
CN113755568A (zh) * 2021-08-26 2021-12-07 广东省妇幼保健院 利用微滴数字PCR检测α珠蛋白基因拷贝数的引物探针、试剂盒及应用
CN113755568B (zh) * 2021-08-26 2023-09-15 广东省妇幼保健院 利用微滴数字PCR检测α珠蛋白基因拷贝数的引物探针、试剂盒及应用
CN114277096A (zh) * 2021-12-29 2022-04-05 深圳联合医学科技有限公司 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒
CN116769906A (zh) * 2023-08-10 2023-09-19 赛雷纳(中国)医疗科技有限公司 用于检测α-地中海贫血的试剂盒
CN116769906B (zh) * 2023-08-10 2023-11-17 赛雷纳(中国)医疗科技有限公司 用于检测α-地中海贫血的试剂盒

Also Published As

Publication number Publication date
CN109584957B (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN106834502B (zh) 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
CN109584957A (zh) 用于捕获α地中海贫血相关基因拷贝数检测试剂盒
Arze et al. Global genome analysis reveals a vast and dynamic anellovirus landscape within the human virome
CN107849612B (zh) 比对和变体测序分析管线
CN109599148B (zh) 鉴定基因组中的变异的定相和连接方法
CN107368708B (zh) 一种精准分析dmd基因结构变异断点的方法及系统
CN100557033C (zh) 诊断α-地中海贫血的核酸膜条及试剂盒
JP7067896B2 (ja) 品質評価方法、品質評価装置、プログラム、および記録媒体
CN106591441A (zh) 基于全基因捕获测序的α和/或β‑地中海贫血突变的检测探针、方法、芯片及应用
CN110656157B (zh) 用于高通量测序样本溯源的质控品及其设计和使用方法
CN110904220B (zh) 检测cyp2d6基因多态性和拷贝数的组合物、试剂盒及方法
Lange et al. Analysis pipelines for cancer genome sequencing in mice
US20170321270A1 (en) Noninvasive prenatal diagnostic methods
CN111534602A (zh) 一种基于高通量测序分析人类血型基因型的方法及其应用
CN106845155A (zh) 一种用于检测内部串联重复的装置
CN106282195A (zh) 基因突变体及其应用
Billingsley et al. Genome‐wide analysis of structural variants in Parkinson disease
Zamperin et al. Sequencing of animal viruses: quality data assurance for NGS bioinformatics
CN106906220A (zh) 一种突变的col4a5基因及其应用
CN105803054A (zh) 试剂盒及其在检测唇腭裂相关基因中的用途
Kim et al. Optimized metavirome analysis of marine DNA virus communities for taxonomic profiling
CN109920480B (zh) 一种校正高通量测序数据的方法和装置
CN105838720B (zh) Ptprq基因突变体及其应用
CN110273011A (zh) 一种与猪体长性状相关的InDel分子标记
CN116121360A (zh) 一种用于检测dba致病基因集合的试剂盒及检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221020

Address after: Room 607, Building 1, No. 55, Aona Road, China (Shanghai) Pilot Free Trade Zone, Pudong New Area, Shanghai, 200137

Patentee after: Shanghai xuzhenda Biotechnology Co.,Ltd.

Address before: 200131 Room D04, Floor 3, No. 207, Fute North Road, Free Trade Pilot Zone, Pudong New Area, Shanghai

Patentee before: WUXI NEXTCODE GENOMICS (SHANGHAI) CO.,LTD.

TR01 Transfer of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Used to capture a Mediterranean anemia related gene copy number detection kit

Effective date of registration: 20231130

Granted publication date: 20200417

Pledgee: Industrial Bank Co.,Ltd. Shanghai Zhangyang Sub branch

Pledgor: Shanghai xuzhenda Biotechnology Co.,Ltd.

Registration number: Y2023310000791

PE01 Entry into force of the registration of the contract for pledge of patent right