CN112442530B - 检测cah相关真假基因的方法 - Google Patents

检测cah相关真假基因的方法 Download PDF

Info

Publication number
CN112442530B
CN112442530B CN201910828750.0A CN201910828750A CN112442530B CN 112442530 B CN112442530 B CN 112442530B CN 201910828750 A CN201910828750 A CN 201910828750A CN 112442530 B CN112442530 B CN 112442530B
Authority
CN
China
Prior art keywords
artificial sequence
dna
sequencing
cah
true
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910828750.0A
Other languages
English (en)
Other versions
CN112442530A (zh
Inventor
高贵丽
郎娜
高玉梅
汪德鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Grandomics Biosciences Co ltd
Original Assignee
Grandomics Biosciences Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grandomics Biosciences Co ltd filed Critical Grandomics Biosciences Co ltd
Priority to CN201910828750.0A priority Critical patent/CN112442530B/zh
Publication of CN112442530A publication Critical patent/CN112442530A/zh
Application granted granted Critical
Publication of CN112442530B publication Critical patent/CN112442530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于分子生物学领域,尤其涉及一种检测CAH相关真假基因的方法。具体的,本发明公开了一种确定CAH相关基因的突变情况的检测方法,其中CAH相关基因包括:CYP21A2基因和CYP11B1基因,所述方法包括以下步骤:S1:提取样品中DNA并使用引物组进行PCR扩增;S2:用三代测序平台对扩增产物进行检测;S3:对测序结果进行分析得到CAH相关基因的突变情况。本发明公开的方法通过设计引物组将真假基因一起扩出,通过长片段建库测序可检测出突变类型。该方法可以同时检测到已知的CYP21A2和CYP11B1基因致病突变,且灵敏度高,只需样品中含有1‑50ngDNA即可;操作方便;可以检测到长片段的缺失,区分真假基因,同时可检测到未知的染色体结构变异。

Description

检测CAH相关真假基因的方法
技术领域
本发明属于分子生物学领域,尤其涉及一种检测CAH相关真假基因的方法。
背景技术
人类基因组大约有2.91G个碱基,在两万多个基因中有一些特别的基因。这些基因有非常相似的假基因,给现有的检测方法带来了很大的困扰。由于真假基因的相似性,在人类细胞减数分裂时染色体联会期间可能出现错误的重组,产生真假基因的融合,因此产生新的突变导致真基因的表达功能丧失或不全。
先天性肾上腺皮质增生症(CAH)是一种由于肾上腺皮质激素合成过程中酶的缺陷所引起的疾病,属常染色体隐性遗传病,引起男性化者又称肾上腺性征异常综合征。典型的CAH发病率约为1/10000,而非典型的发病率约为典型的10倍,并有种族特异性。21-羟化酶缺乏症(ZD-OHD)是先天性肾上腺皮质增生症中最常见的一种,占典型病例的90%-95%,CAH会导致低血钠及高血钾、严重者可导致休克,对于新生儿来讲未出现症状时做出尽早的诊断,可有效地减少肾上腺危症的发病率及病死率,这是至关重要的。
超过90%的CAH由CYP21A2基因突变导致,CYP21A2(Gene ID:1589)位于染色体6p21.3,全长3.5kb,在距其30kb处有一个高度同源的假基因CYP21A1P(Gene ID:1590),外显子同源性达98%,内含子同源性达96%。假基因与CYP21A2的主要区别为外显子3中8bp的缺失,外显子7中1bp的插入,及外显子8发生的C到T的点突变形成终止密码子,这些变异导致假基因没有功能。该基因突变致使21-羟化酶部分或完全缺乏,由于皮质醇合成分泌不足,雄激素合成过多,致使临床出现轻重不等的症状。可表现为单纯男性化典型、失盐型和非典型三种类型。
CYP21A2与CYP21A1P排列位置相近且同源度很高,因此90%~95%的21羟化酶等位基因突变与真假基因在细胞减数分裂期间出现同源重组偏差或者连锁不平衡所致的真假基因错配有关;包括真基因大片段缺失和真假基因间碱基互相转换两种,其中c.293-13C>G和真假基因融合为最常见2种突变类型,分别占34.2%和18.4%(参考文献:《The next150 years of congenital adrenal hyperplasia》),CYP21A2的突变70%-80%来源于CYP21A2与CYP21A1P的碱基互换,因而真假基因辨别显得尤为重要。
11β-羟化酶缺陷症(11β-OHD)约占CAH的5%-8%,CYP11B1是11β-羟化酶的编码基因,CYP11B1存在假基因CYP11B2。此酶缺乏时,雄激素和11-脱氧皮质酮均增多,临床表现出与21-羟化酶缺乏相似的男性化症状,但程度较轻。
现有的基因测序主要包括以下几种:
(一)一代测序,即设计很多对引物,通过普通PCR扩增,一代测序后再进行全长拼接。其具有以下缺陷:
1、读长短一般为500-800bp,遇到poly结构测序质量不好,不能准确判读;
2、需要设计7对左右引物,工作量大,操作繁琐;
3、低剂量基因组不能很好检测全长,需要一个样本很大量DNA才能拼接到全长;
4、一代测序读长较短,不能很好区分真假基因,假基因会影响真基因突变的判读;
5、不能区分真假基因转换的情况。
(二)二代测序,即提取人的全基因组,打断建库后进行测序。其具有以下缺陷:
1、需要的数据量较大,低频突变需要深度很大才能检测到,成本高;
2、读长短,长片段的缺失或插入变异没办法检测到;
3、由于读长很短,没办法区别真假基因,就不能判断真基因与假基因序列相同的区域的突变是来自于真基因或是假基因。
(三)针对CYP21A2/CYP21A1P、CYP11B1/CYP11B2设计很多对引物,引物在同一管进行扩增,多重PCR产物二代建库测序。其具有以下缺陷:
操作繁琐,不能辨别真假基因,不能发现真假基因转换的变异,不适合大规模检测。
(四)MLPA检测,即多重连接探针扩增技术。其具有以下缺陷:
1、MLPA受到DNA样本纯净度影响较大,对基因组纯度要求很高,基因组中存在杂质会影响MLPA中探针杂交与连接反应;
2、已知MLPA试剂盒只针对目前高发缺失突变设计探针进行检测,很难发现未知突变;
3、MLPA实验每次需要检测正常人样本做为对照样本,若毛细管电泳检测时对照样本会出现异常情况,需要重新进行实验;
4、不能区分真假基因转换导致的重复与缺失与真实缺失重复之间的差别,从而无法仔细洞悉其致病机理与基因结构;
5、不能检测内含子区域;
6、对于点突变的检测不准确。
(五)MLPA结合一代测序
为了检测出具体的突变位点,目前实验方法用的较多的是MLPA结合一代测序进行突变检测。其具有以下缺陷:
1、一代测序验证会引入假基因干扰,不能很好的区分真假基因,影响结果的准确性;
2、不能区分真假基因转换的情况。
(六)巢式PCR
先根据真假基因的不同位点设计引物,以区别真假基因,然后在第一次PCR产物基础上进行巢式PCR扩增和检测。其具有以下缺陷:
1、这种方法只能检测有限的几种突变,如果发生未知突变则很难解释结果;
2、针对基因全长设计区分真假基因的引物有困难;
3、如果第一轮PCR产物为假基因,则检测结果不准确。
由于现有的测序技术的种种局限性,因此,亟需发明一种新的能够准确区分真假基因的测序技术。
发明内容
本发明的设计思路为:将真假基因同时扩增出来测序,通过新的三代测序技术的长读长优势和生信分析方法,能同时检测基因的indel突变或融合突变,还有成本低和操作方便的优势。本发明以CAH的致病基因为例阐述这个检测方法。本发明公开的测序方法可以准确区分真假基因,同时能够检测到未知的染色体结构变异。
具体的,本发明的技术方案如下:
本发明第一个方面公开了一种引物组,所述引物组包括:第一引物对,其核苷酸序列如SEQ ID NO:1和SEQ ID NO:2所示;第二引物对,其核苷酸序列如SEQ ID NO:3和SEQ IDNO:4所示。
术语“引物”意指一小段单链DNA或RNA,作为DNA复制的起始点,除非特定限制,否则所述术语涵盖自然中生物的DNA复制和聚合酶链式反应(PCR)中人工合成的引物(通常为DNA引物)。之所以需要引物是因为在DNA合成中DNA聚合酶仅仅可以把新的核苷酸加到已有的DNA链上。除非特定限制,否则上游引物为在DNA复制时,作为DNA模板3’端的复制起始点的引物,下游引物为在DNA复制时,作为DNA模板5’端的复制起始点的引物。
本发明第二个方面公开了一种PCR扩增体系,所述PCR扩增体系包括:用于扩增的缓冲体系以及位于所述PCR扩增体系中的权利要求1所述的引物组。
术语“PCR”意指聚合酶链式反应(Polymerase Chain Reaction),简称PCR。聚合酶链式反应(PCR)是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火(复性)及适温延伸等几步反应组成一个周期,循环进行,使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。它不仅可用于基因分离、克隆和核酸序列分析等基础研究,还可用于疾病的诊断或任何有DNA、RNA的地方。
本发明第三个方面公开了一种试剂盒,所述试剂盒包括上述的引物组。
本发明第四个方面公开了一种确定CAH相关基因的突变情况的检测方法,所述方法包括以下步骤:
S1:提取样品中DNA并使用上述的引物组进行PCR扩增;
S2:用三代测序平台对扩增产物进行检测;
S3:对测序结果进行分析得到CAH相关基因的突变情况。
应该理解,本发明不限于上述步骤,还可以包含其他的步骤,例如在步骤S1之前、步骤S1和S2之间、步骤S3之后,还包含其他额外的步骤,而不超出本发明的保护范围。
优选的,所述样品采集于血液。
优选的,在S1中,每个样品上标记特异的barcode序列。此处在样本上添加上barcode(标签)以进一步区分,将样品混合在一起,构建一个测序文库,达到高通量测序大量样本的同时降低实验成本的目的。在本发明的一优选实施例中,barcode序列设计于权利要求1所述的引物(SEQ ID NO:1-4)的前端。
优选的,在S2中,包括以下步骤:
(1)使用建库试剂盒进行建库;
(2)进行接头连接PCR反应;
(3)纯化处理后上机测序。
优选的,在S3中,测序结果分析包括以下步骤:首先进行下机数据处理,然后进行生物信息学分析。
更优选的,生物信息学分析包括以下步骤:
1)将测序序列与参考序列比对;
2)基于参考序列开发标签;
3)对测序序列基于标签构建数组、排序并分组;
4)确定基因型;
5)变异分析。
优选的,可根据以下方法确定真假基因标签:a真假基因间参考序列之间的差异位点;b已有科研数据支持的确信差异位点;c根据同种类样品类型样本库获得的适用于特定样本集的真假基因差异位点。每个差异位点作为一个“标签”。
优选的,步骤3)具体为:根据公式
Figure BDA0002189954730000041
计算测序序列排序值,根据排序值对测序序列进行排序;其中y为测序序列编号,S[y]为测序序列排序值,x为当前标签位置值,n为标签总数,i为测序序列在当前标签处的碱基类型且i属于A、T、G、C、-中的至少一种,D[x,i]为测序序列在标签处的特定碱基类型的测序深度,E[x]为当前标签对排序的贡献率且E[x]=(1/L)×(1/N)且L为测序序列长度、N为当前标签处测序深度。
本发明第五个方面公开了上述引物组、PCR扩增体系、试剂盒或上述的方法在CAH领域中的应用。所述CAH领域包括:制备CAH的诊断剂、CAH的诊断、CAH疾病的机理研究等。
本发明所述三代测序平台,以Pacific Biosciences和Oxford NanoporeTechnologies为代表,包括但不限于Pacific Biosciences的Sequel、Sequel II平台,Oxford Nanopore Technologies的MinION、PromethION、GridION平台。
在符合本领域常识的基础上,上述各优选条件,可任意组合,而不超出本发明的构思与保护范围。
本发明相对于现有技术具有如下的显著优点及效果:
本发明公开的方法通过设计引物组将真假基因一起扩出,其中第一引物对用于特异性扩增CYP21A2和CYP21A1P,第二引物对用于特异性扩增CYP11B1和CYP11B2,通过长片段建库测序可检测出突变类型。该方法可以同时检测到已知的CYP21A2和CYP11B1基因致病突变,且灵敏度高,只需样品中含有1-50ngDNA即可;操作方便;可以检测到长片段的缺失,区分真假基因,同时可检测到未知的染色体结构变异和真假基因转换的情况。
附图说明
图1为本发明实施例中的电泳图(图中1:CYP21F/R,2:CYP11BF/R,M:D15000);
图2为本发明实施例中真假基因的分析图谱。
具体实施方式
下面结合附图和实施例对本发明的技术方案进行详细描述,但并不因此将本发明限制在所述的实施例范围之中。
下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。本发明所用试剂和原料均市售可得。
本发明公开了一种确定CAH相关基因的突变情况的检测方法,其中CAH相关基因包括:CYP21A2基因和CYP11B1基因,所述方法包括以下步骤:
S1:提取样品中DNA并使用上述的引物组进行PCR扩增;
S2:用三代测序平台对扩增产物进行检测;
S3:对测序结果进行分析得到CAH相关基因的突变情况。
下面例举一些优选实施例来进一步解释说明本发明的技术方案。
首先用收集20例样本,编号依次为1至20。包括:正常人样本4例;经临床表现、生化检测结合染色体、X线、B超或CT检查,确诊为CAH患者样本4例;以及该4例CAH患者的同家系样本12例,此12例临床上均为非CAH患者。对上述样本使用本发明所述的方法进行了检测。该过程中,实验人员、数据分析人员均不知道样本的基因型及表现型,以确保结果的可信性。
实施例1DNA提取及PCR扩增
一、DNA提取实验方法
使用试剂盒从血液中提取基因组DNA,例如使用TIANamp Blood DNA Kit血液基因组DNA提取试剂盒(DP348),操作按照试剂盒说明书进行:
1.于血样中加入Buffer CL,混匀后离心;
2.弃上清,将入Buffer GS,混匀后离心;
3.加入Buffer GB和Proteinase K,混匀,温育;
4.室温静置,将入Buffer BD,混匀;
5.过吸附柱CG2,室温静置,离心,弃滤液;
6.向吸附柱CG2中加入Buffer BD,离心,弃滤液;
7.向吸附柱CG2中加入Buffer PW,离心,弃滤液;
8.重复步骤7;
9.离心,晾干吸附柱CG2;
10.向吸附柱CG2中加入Buffer TB,室温静置,离心。将滤液再次加入吸附柱CG2,室温静置,离心,收集滤液。滤液内含人全基因组DNA。
二、PCR扩增
用primer3在线设计引物,引物名称及序列参见下表1:
表1
Figure BDA0002189954730000061
20个样品合成对应barcode引物进行扩增,引物与barcode序列参见表2,其中barcode序列以斜体、下划线形式突出:
表2
Figure BDA0002189954730000071
/>
Figure BDA0002189954730000081
/>
Figure BDA0002189954730000091
PCR扩增实验体系如表3所示:
表3
Figure BDA0002189954730000092
Figure BDA0002189954730000101
反应程序如表4所示:
表4
Figure BDA0002189954730000102
将PCR产物用1%琼脂糖凝胶电泳,检测结果如图1所示,图1中1、2分别为一个样品分别使用引物CYP21F/R、CYP11BF/R进行扩增获得的产物,大小符合预期,特异性好。
将PCR产物通过一代测序进行验证,测序结果显示,PCR产物中同时含有真假基因,说明设计的一对引物成功将真假基因同时扩增出。
三、PCR产物纯化及混样
产物纯化:取一个样品的2对引物PCR产物进行0.9×AmpXP磁珠纯化,测定每对引物纯化后产物浓度。
混样:根据上述浓度确定2对引物产物的混样比,其他样品按照这个比例进行混样后,整体进行一次纯化。
实施例2使用Pacbio Sequel进行三代测序
一、使用建库试剂盒进行建库
1.将混好的文库进行修复修复溶液配制如表5所示:
表5
Figure BDA0002189954730000111
混匀,离心,放入PCR热循环仪中,进行修复反应,具体条件如表6所示:
表6
Figure BDA0002189954730000112
2.接头连接
连接溶液体系如表7所示:
表7
Figure BDA0002189954730000113
/>
Figure BDA0002189954730000121
混匀,离心,于PCR热循环仪中进行连接反应,具体条件如表8所示:
表8
Figure BDA0002189954730000122
3.纯化
使用AMPure XP磁珠进行纯化,最后使用双蒸水洗脱磁珠,-20℃冰箱保存。
二、上机测序
实施例3使用Oxford Nanopore Technology的PromethION平台进行三代测序
一、使用建库试剂盒建库
1.文库准备
1.1末端修复及A尾连接
取DNA,置于冰上,加入NEB末端修复及A尾连接试剂,混匀。20℃孵育40分钟,65℃孵育20分钟。
1.2磁珠纯化
步骤如下:
(1)将1×AMPure beads加入DNA中,室温孵育15min,室温磁力架吸附5min,吸弃上清。
(2)加入80%乙醇,磁力架吸附,弃上清,重复一次。室温晾干。
(3)添加Ultra Pure Water,37℃下吹打洗脱。
(4)磁力架上静置5min,吸取上清,即为纯化后的DNA。
1.3连接测序接头
加入NEB T4 DNA快速连接buffer、NEB T4 DNA快速连接酶和接头,混匀,20℃孵育20min。
1.4磁珠纯化,同步骤1.2
二、上样及测序实施例4测序结果分析
本实施例对测序结果进行分析,包括以下步骤:
一、下机数据处理
对实施例2的下机数据使用官方软件产生高质量的ccs(一致性序列,CircularConsensus Sequence);使用lima软件,拆分不同样品的ccs。
对实施例3的下机数据使用官方推荐软件进行basecalling及barcode拆分。
二、生物信息学分析
1.与参考序列比对
根据扩增的目标区域,截取人类基因组对应目标区域序列作为参考序列,采用长序列比对软件,分别将每个样品的测序序列比对到参考序列。
2.开发标签
可根据以下方法确定真假基因标签:a真假基因间参考序列之间的差异位点;b已有科研数据支持的确信差异位点;c根据同种类样品类型样本库获得的适用于特定样本集的真假基因差异位点。每个差异位点作为一个“标签”。标签开发个数以h表示,该h个标签分别对应h个真基因上的位置。
以其中CYP21A2与CYP21A1P真假基因分析的过程为例,根据人类参考基因组CYP21A2与CYP21A1P的差异,选取真假基因区分的关键区域(对应人类基因组HG19位置chr6:32006621-32006905)开发标签;最终开发的标签如下表9所示(表中位置为CYP21A2基因在此区域的相对位置)。
表9
Figure BDA0002189954730000131
Figure BDA0002189954730000141
/>
在本实施例中,因仅在真假基因区分的关键区域开发标签,可有效避免因测序错误产生的差异及同源序列非贡献差异对基因型确定的干扰。
3.构建数组、排序并分组
根据开发的标签,在已知真假基因关键差异位点区域(P)构建数组(M)。横坐标x为P所在的基因组位置的先后顺序排序,纵坐标y为按照测序序列ID进行排序。
数组中每个标签位点,均有对应的坐标x和序列对应的碱基i(i属于A、T、G、C、-中的至少一种)。对于每一个标签x,依照碱基i出现的先后顺序,计算每种碱基i的测序深度D[x,i]。每个位点对排序的贡献率为E[i],E[i]=(1/L)×(1/N),L为当前测序序列长度、N为当前标签处测序深度。加权后得出每个位点的分值,根据各位点分值,得出每条测序序列对应的排序值S[Y]。具体计算公式为
Figure BDA0002189954730000142
根据每条测序序列对应的排序值重新排序后,根据标签进行分组。过滤掉深度比例较低的组。
4.确定基因型
每组的一致性序列即为分组基因型。
在标签位置上,根据分组基因型与真假基因基因型的相似性,判断各分组基因型类型。
如图2所示,若分组基因型有i个标签与真基因相似,j个标签与假基因相似:
(1)(i,j)与(h,0)进行卡方检验,若存在显著性差异,判定该分组基因型与假基因相同;
(2)(i,j)与(0,h)进行卡方检验,若存在显著性差异,判定该分组基因型与真基因相同;
(3)若一个分组基因型一部分与真基因匹配,另一部分与假基因匹配,判定该分组基因型为融合基因型。
5.变异分析
根据CAH致病原理,分析测序序列中的变异位点,并使用IGV软件对变异位点进行查看确认,进行注释。
实施例5测序结果及准确性
使用本发明方法检测上述20例样本,共检测出4例样本为CAH患者,其中3例样本由CYP21基因突变导致(1例样本纯合缺失,1例样本纯合点突,1例样本存在真假基因转换),1例样本由CYP11B基因突变导致;10例样本为CAH携带者,均来自于家系样本,同时在一个样本中检测出新发点突;6例样本不存在序列异常,其中2例来自于家系样本,4例为正常人样本。以上结果均与临床结论一致。
检测结果如表10所示:
表10
Figure BDA0002189954730000151
Figure BDA0002189954730000161
上述实施例针对性的设计引物,可以将真假基因在一个反应扩增出,可以检测到点突变、真假基因转换及未知染色体结构变异;检测CYP21A2/CYP21A1P、CYP11B1/CYP11B2引物对数只需2对,检测同一个样品反应数变少,操作更简便;结合三代测序,可以测出较长片段的缺失,检测出CYP21A2、CYP11B1基因的所有突变,更好的为肾上腺皮质增生症病诊断服务。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
序列表
<110> 北京希望组生物科技有限公司
<120> 检测CAH相关真假基因的方法
<160> 84
<170> SIPOSequenceListing 1.0
<210> 1
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttcctgagtt ctgtgaaatt c 21
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
cacttggagg gctaccacgg 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
attggaatgg cactcagggc 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ctggctgggt acactctcaa 20
<210> 5
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tgctcgcagt atcacattcc tgagttctgt gaaattc 37
<210> 6
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gtcagacact catacacact tggagggcta ccacgg 36
<210> 7
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agtctgcgag acagagttcc tgagttctgt gaaattc 37
<210> 8
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tatgcagtct gtcgtccact tggagggcta ccacgg 36
<210> 9
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tagcgtgaga gtgtcgttcc tgagttctgt gaaattc 37
<210> 10
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tctgagagtc tactgtcact tggagggcta ccacgg 36
<210> 11
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gacatgtgac tgtgctttcc tgagttctgt gaaattc 37
<210> 12
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ctagacacgc agtcaccact tggagggcta ccacgg 36
<210> 13
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
agtagacaga gcgtgattcc tgagttctgt gaaattc 37
<210> 14
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gtcgcgacgt cagtgtcact tggagggcta ccacgg 36
<210> 15
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tatgtgtctg cgcatattcc tgagttctgt gaaattc 37
<210> 16
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
acagatgtct gtgcgccact tggagggcta ccacgg 36
<210> 17
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gacgtgtcgt agatatttcc tgagttctgt gaaattc 37
<210> 18
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tctacagagc gagagtcact tggagggcta ccacgg 36
<210> 19
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
agtcgagata tacagtttcc tgagttctgt gaaattc 37
<210> 20
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gactctcgag cacgtgcact tggagggcta ccacgg 36
<210> 21
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtctcatcat gctgcgttcc tgagttctgt gaaattc 37
<210> 22
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gcgatgacag cagagtcact tggagggcta ccacgg 36
<210> 23
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cgctcatatg agctcattcc tgagttctgt gaaattc 37
<210> 24
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gcatcgtgca cgagtgcact tggagggcta ccacgg 36
<210> 25
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gatatctcga tctctgttcc tgagttctgt gaaattc 37
<210> 26
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
tagctcacac atgagacact tggagggcta ccacgg 36
<210> 27
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
cgctgcgaga gacagtttcc tgagttctgt gaaattc 37
<210> 28
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tgcgactgtg tatcgccact tggagggcta ccacgg 36
<210> 29
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
acgtagtgca cacagattcc tgagttctgt gaaattc 37
<210> 30
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cgatatgcga tagatacact tggagggcta ccacgg 36
<210> 31
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
agatatactg tctgatttcc tgagttctgt gaaattc 37
<210> 32
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
acgcgcgtat atatcacact tggagggcta ccacgg 36
<210> 33
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
actcatgtat atgagtttcc tgagttctgt gaaattc 37
<210> 34
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tgtgtcgagt cagcgacact tggagggcta ccacgg 36
<210> 35
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tatctgagcg cgagcattcc tgagttctgt gaaattc 37
<210> 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cgagactgtc gatctccact tggagggcta ccacgg 36
<210> 37
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gagtctcgat atactattcc tgagttctgt gaaattc 37
<210> 38
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gtacacagat acacagcact tggagggcta ccacgg 36
<210> 39
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ctgcgtatag atatgattcc tgagttctgt gaaattc 37
<210> 40
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gtgatgagcg cacatgcact tggagggcta ccacgg 36
<210> 41
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gtctacgctc gtcgcgttcc tgagttctgt gaaattc 37
<210> 42
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tcacgtatct cgtatacact tggagggcta ccacgg 36
<210> 43
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gctcgcacag cgcgtcttcc tgagttctgt gaaattc 37
<210> 44
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
acatgtacat cagctccact tggagggcta ccacgg 36
<210> 45
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
tgctcgcagt atcacaattg gaatggcact cagggc 36
<210> 46
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
gtcagacact catacactgg ctgggtacac tctcaa 36
<210> 47
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
agtctgcgag acagagattg gaatggcact cagggc 36
<210> 48
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
tatgcagtct gtcgtcctgg ctgggtacac tctcaa 36
<210> 49
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
tagcgtgaga gtgtcgattg gaatggcact cagggc 36
<210> 50
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tctgagagtc tactgtctgg ctgggtacac tctcaa 36
<210> 51
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
gacatgtgac tgtgctattg gaatggcact cagggc 36
<210> 52
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ctagacacgc agtcacctgg ctgggtacac tctcaa 36
<210> 53
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
agtagacaga gcgtgaattg gaatggcact cagggc 36
<210> 54
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gtcgcgacgt cagtgtctgg ctgggtacac tctcaa 36
<210> 55
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tatgtgtctg cgcataattg gaatggcact cagggc 36
<210> 56
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
acagatgtct gtgcgcctgg ctgggtacac tctcaa 36
<210> 57
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gacgtgtcgt agatatattg gaatggcact cagggc 36
<210> 58
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
tctacagagc gagagtctgg ctgggtacac tctcaa 36
<210> 59
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
agtcgagata tacagtattg gaatggcact cagggc 36
<210> 60
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gactctcgag cacgtgctgg ctgggtacac tctcaa 36
<210> 61
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gtctcatcat gctgcgattg gaatggcact cagggc 36
<210> 62
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gcgatgacag cagagtctgg ctgggtacac tctcaa 36
<210> 63
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
cgctcatatg agctcaattg gaatggcact cagggc 36
<210> 64
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gcatcgtgca cgagtgctgg ctgggtacac tctcaa 36
<210> 65
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
gatatctcga tctctgattg gaatggcact cagggc 36
<210> 66
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
tagctcacac atgagactgg ctgggtacac tctcaa 36
<210> 67
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
cgctgcgaga gacagtattg gaatggcact cagggc 36
<210> 68
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
tgcgactgtg tatcgcctgg ctgggtacac tctcaa 36
<210> 69
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
acgtagtgca cacagaattg gaatggcact cagggc 36
<210> 70
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
cgatatgcga tagatactgg ctgggtacac tctcaa 36
<210> 71
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
agatatactg tctgatattg gaatggcact cagggc 36
<210> 72
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
acgcgcgtat atatcactgg ctgggtacac tctcaa 36
<210> 73
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
actcatgtat atgagtattg gaatggcact cagggc 36
<210> 74
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tgtgtcgagt cagcgactgg ctgggtacac tctcaa 36
<210> 75
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
tatctgagcg cgagcaattg gaatggcact cagggc 36
<210> 76
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
cgagactgtc gatctcctgg ctgggtacac tctcaa 36
<210> 77
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
gagtctcgat atactaattg gaatggcact cagggc 36
<210> 78
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
gtacacagat acacagctgg ctgggtacac tctcaa 36
<210> 79
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
ctgcgtatag atatgaattg gaatggcact cagggc 36
<210> 80
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
gtgatgagcg cacatgctgg ctgggtacac tctcaa 36
<210> 81
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
gtctacgctc gtcgcgattg gaatggcact cagggc 36
<210> 82
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
tcacgtatct cgtatactgg ctgggtacac tctcaa 36
<210> 83
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gctcgcacag cgcgtcattg gaatggcact cagggc 36
<210> 84
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
acatgtacat cagctcctgg ctgggtacac tctcaa 36

Claims (9)

1.一种引物组,其特征在于,所述引物组包括:第一引物对,其核苷酸序列
如SEQ ID NO:1和SEQ ID NO:2所示;第二引物对,其核苷酸序列如SEQ ID NO:3和SEQID NO:4所示。
2.一种PCR扩增体系,其特征在于,所述PCR扩增体系包括:用于扩增的缓 冲体系以及位于所述PCR扩增体系中的权利要求1所述的引物组。
3.一种试剂盒,其特征在于,所述试剂盒包括权利要求1所述的引物组。
4.一种如权利要求3所述确定CAH相关基因的突变情况的试剂盒,其特征在于,试剂盒使用方法包括以下步骤:
S1:提取样品中DNA并使用权利要求1所述的引物组进行PCR扩增;
S2:用三代测序平台对扩增产物进行检测;
S3:对测序结果进行分析得到CAH相关基因的突变情况。
5.根据权利要求4所述的试剂盒,其特征在于,在S1中,每个样品上标记特异 的barcode序列。
6.根据权利要求4所述的试剂盒,其特征在于,在S2中,包括以下步骤:
(1)使用建库试剂盒进行建库;
(2)进行接头连接PCR反应;
(3)纯化处理后上机测序。
7.根据权利要求4所述的试剂盒,其特征在于,在S3中,测序结果分析包括以 下步骤:首先进行下机数据处理,然后进行生物信息学分析。
8.根据权利要求7所述的试剂盒,其特征在于,所述生物信息学分析包括以下
步骤:
1)将测序序列与参考序列比对;
2)基于参考序列开发标签;
3)对测序序列基于标签构建数组、排序并分组;
4)确定基因型;
5)变异分析。
9.权利要求1所述的引物组、权利要求2所述的PCR扩增体系或权利要求3-8任一项所述的试剂盒在CAH领域中的应用,所述应用属于非诊断和治疗疾病目的的。
CN201910828750.0A 2019-09-03 2019-09-03 检测cah相关真假基因的方法 Active CN112442530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910828750.0A CN112442530B (zh) 2019-09-03 2019-09-03 检测cah相关真假基因的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910828750.0A CN112442530B (zh) 2019-09-03 2019-09-03 检测cah相关真假基因的方法

Publications (2)

Publication Number Publication Date
CN112442530A CN112442530A (zh) 2021-03-05
CN112442530B true CN112442530B (zh) 2023-03-28

Family

ID=74735386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910828750.0A Active CN112442530B (zh) 2019-09-03 2019-09-03 检测cah相关真假基因的方法

Country Status (1)

Country Link
CN (1) CN112442530B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113564247B (zh) * 2021-09-24 2022-01-28 北京贝瑞和康生物技术有限公司 同时检测先天性肾上腺皮质增生症相关9个基因多种突变的引物组和试剂盒
CN117385025B (zh) * 2023-12-11 2024-03-08 赛雷纳(中国)医疗科技有限公司 用于检测cyp21a2基因的试剂盒

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107488704A (zh) * 2016-06-12 2017-12-19 上海市内分泌代谢病研究所 Cah相关基因靶向二代测序检测方法
CN108690873A (zh) * 2017-04-05 2018-10-23 张巍 21羟化酶基因突变的检测方法及检测试剂盒

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107488704A (zh) * 2016-06-12 2017-12-19 上海市内分泌代谢病研究所 Cah相关基因靶向二代测序检测方法
CN108690873A (zh) * 2017-04-05 2018-10-23 张巍 21羟化酶基因突变的检测方法及检测试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Single molecule real-time(SMRT) sequencing comes of age:applications and utilities for medical diagnostics;Simon A等;《Nucleic acid research》;20180201;第46卷(第5期);第2159-2168页 *
The next 150 years of Congenital adrenal hyperplasia;Adina FT等;《J steroid biochem mol boil》;20150603;63-71页 *

Also Published As

Publication number Publication date
CN112442530A (zh) 2021-03-05

Similar Documents

Publication Publication Date Title
US11913063B2 (en) Systems and methods for combined detection of genetic alterations
CN104531883B (zh) Pkd1基因突变的检测试剂盒及检测方法
CN105969857A (zh) 非小细胞肺癌靶向治疗基因检测方法
CN113564247B (zh) 同时检测先天性肾上腺皮质增生症相关9个基因多种突变的引物组和试剂盒
CN113278611B (zh) 捕获测序探针及其用途
CN106995851B (zh) 扩增pkd1外显子超长片段的pcr引物、检测pkd1基因突变的试剂盒及应用
CN107236037B (zh) 一种突变的msh6蛋白及其编码基因、应用
CN112442530B (zh) 检测cah相关真假基因的方法
Jiang et al. Detection of rare thalassemia mutations using long-read single-molecule real-time sequencing
CN114317728B (zh) 用于检测sma中多种突变的引物组、试剂盒、方法和系统
CN113889187A (zh) 单样本等位基因拷贝数变异检测方法、探针组和试剂盒
CN111378732B (zh) 一种线粒体基因组测序引物、试剂盒及方法
CN110846408A (zh) 用于检测ttn基因突变的引物组合及其应用
CN113564266B (zh) Snp分型遗传标记组合、检测试剂盒及用途
Li et al. Accurate genotype diagnosis of Hong Kongαα thalassemia based on third-generation sequencing
CN113667673A (zh) 一种类孟买血型FUT1 236delG等位基因及其检测方法和应用
EP3545102B1 (en) Determination of the genotype underlying the s-s-u- phenotype of the mnss blood group system
CN117143997B (zh) 一种用于pkd1基因突变检测的引物组、试剂盒及检测方法
CN114277096B (zh) 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒
CN110819710A (zh) 髓系肿瘤的高通量测序检测
KR102409336B1 (ko) 면역글로불린 a 신병증 및 혈관염 진단용 snp 마커 및 이를 이용한 진단 방법
US11920198B2 (en) Method and kit for identifying gene mutations
CN117511954B (zh) Hcfc1基因突变体、突变体蛋白、试剂、试剂盒及应用
CN113817813B (zh) 与特殊类型糖尿病相关的基因突变片段及其应用
CN117757912A (zh) Pkd1和pkd2基因的引物组合物、试剂盒及测序方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant