CN113403371A - 一种用于检测基因长片段拷贝数变异的方法 - Google Patents

一种用于检测基因长片段拷贝数变异的方法 Download PDF

Info

Publication number
CN113403371A
CN113403371A CN202110791634.3A CN202110791634A CN113403371A CN 113403371 A CN113403371 A CN 113403371A CN 202110791634 A CN202110791634 A CN 202110791634A CN 113403371 A CN113403371 A CN 113403371A
Authority
CN
China
Prior art keywords
artificial sequence
copy number
seq
gene
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110791634.3A
Other languages
English (en)
Other versions
CN113403371B (zh
Inventor
董辉
周宏骏
赵加栋
金维荣
秦红友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyou Genomics Research Institute Nanjing Co ltd
Original Assignee
Shenyou Genomics Research Institute Nanjing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyou Genomics Research Institute Nanjing Co ltd filed Critical Shenyou Genomics Research Institute Nanjing Co ltd
Publication of CN113403371A publication Critical patent/CN113403371A/zh
Application granted granted Critical
Publication of CN113403371B publication Critical patent/CN113403371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于检测基因长片段拷贝数变异的新方法;包括以下步骤:(1)得到待测样本的人基因组DNA;(2)添加人工内标(competitor)进行多重PCR扩增反应;(3)进行虾碱性磷酸酶(SAP)反应;(4)延伸反应得到人基因组DNA的延伸产物和人工内标的延伸产物;(5)纯化脱盐;(6)MassARRAY飞行时间质谱;(7)根据FREQ数据,计算拷贝数变异系数(TR值),并判断基因片段的拷贝数;本发明适用于基因长片段拷贝数变异的检测,是一种新的检测基因长片段拷贝数变异的方法,具有大通量、准确性高、成本低等特点。

Description

一种用于检测基因长片段拷贝数变异的方法
技术领域
本发明涉及一种用于检测基因长片段拷贝数变异的方法,特别涉及一种添加人工内标(competitor)并基于MassARRAY飞行时间质谱的多重PCR反应,并对基因片段的拷贝数进行检测的新方法。
背景技术
人类基因组存在着广泛的变异,其中包括单核苷酸多态(SNP)、可变数目串联重复序列多态(VNTR)和基因结构改变等。基因组结构变异根据大小可分为两个层次:显微水平和亚显微水平。显微水平主要是指显微镜下可见的染色体畸变,包括整倍体、非整倍体、缺失、插入、倒位、易位、脆性位点等结构变异。亚显微水平是指DNA片段长度在1Kb至数Mb的基因组结构变异,包括缺失、重复、插入、倒位、易位以及复杂的重排等,这些统称为大片段重排(large genomic rearrangement,LGR)。而其中能够引起拷贝数的数量变化的称为拷贝数变异(copy number variation,CNV)。据研究估计,CNV至少占到基因组的12%,已成为基因组多态性的又一重要来源。
基因突变可能导致蛋白截断、mRNA加工破坏或对蛋白功能有显著影响的氨基酸替换,从而引起各种疾病。基因突变的检测对人类疾病的预防、治疗和预后的监测都有很重要的意义。例如中国家族性乳腺癌中乳腺癌易感基因BRCA1/2突变频率为10.5%,高加索人种家族性乳腺癌中BRCA1/2突变频率为15%~20%。BRCA1/2基因拷贝数变异(CNV)在不同地区人群中的发生频率为0.2%~12.2%,占BRCA1/2全部致病性基因突变的0.9%~21.4%。
大部分的点突变和短片段的插入缺失很容易通过PCR和测序进行检测。然而大于1Kb的DNA长片段拷贝数变异(CNV),目前难以通过测序检测。现有的检测CNV的方法较少,使用最多的是多重连接探针扩增技术(multiplex ligation-dependent probeamplification,MLPA)。但是该方法覆盖的片段短,成本高,样本用量大,通量小。因此急需探索新的方法,能够低成本高通量的检测CNV。
发明内容
本发明的目的在于提供一种用于检测基因长片段拷贝数变异的新方法。本方法开创性的添加人工内标(competitor),采用特异的PCR引物和延伸引物,基于MassARRAY飞行时间质谱的多重PCR反应,可以高通量检测样本,降低成本。拷贝数变异结果更全面的提供了基因检测的信息,有助于辅助医生进行诊断。
为实现上述目的,本发明包括如下步骤:
(1)采用商业化的DNA提取试剂盒提取待测样本的人基因组DNA;
(2)以待测样本的人基因组DNA为模板,并添加人工内标(competitor),通过多重PCR扩增反应,同时获得人基因组DNA的扩增产物和人工内标的扩增产物;
添加的人工内标(competitor)为合成的双链DNA片段或含有合成的双链DNA片段的质粒。其中合成的双链DNA片段与待测样本的目标扩增片段只有1个碱基不同,并且两个片段上不同的碱基均与延伸引物的3’端相邻。
反应得到的人基因组DNA的扩增产物、人工内标的扩增产物均包含目标检测基因片段以及内参基因的片段。目标检测基因片段的长度为70-600bp;内参基因为RNaseP、EIF2C1、ALB、GAPDH中的一种或几种。
多重PCR扩增反应的体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、UNG酶以及PCR酶;且每次实验需设置阴性样本。
PCR引物Pool为特异性的目的片段扩增引物混合物。PCR引物Pool为目标检测基因扩增引物、内参基因扩增引物的混合物。一个PCR引物Pool包含若干对引物,引物的数量≤30。如果超过30对引物,需分成2个或多个PCR引物Pool,用2个或多个样品检测孔进行检测;
(3)将上述扩增反应的产物通过虾碱性磷酸酶(SAP)反应,除去多余的脱氧核糖核苷三磷酸(dNTP/dUTP)。虾碱性磷酸酶(SAP)反应的体系包括SAP酶以及SAP Buffer;
(4)将步骤(3)的产物通过延伸反应,在延伸引物的3’端延伸一个碱基,得到人基因组DNA的延伸产物和人工内标的延伸产物。
延伸反应的体系包括Buffer Plus、Termination Mix、延伸引物混合物以及iPLEXEnzyme。
延伸引物混合物为与步骤(2)中人基因组DNA的扩增产物、人工内标的扩增产物的序列相匹配的延伸引物混合物,且延伸引物混合物中任意一条延伸引物在3’端延伸一个碱基,得到相应的延伸产物。
一个延伸引物混合物包含若干条引物,引物的数量≤30。如果超过30条引物,需分成2个或多个延伸引物混合物,用2个或多个样品检测孔进行检测;
(5)将上述延伸反应的产物通过树脂纯化,脱盐;
(6)将脱盐后的产物点样在质谱芯片基质上共结晶,再将晶体转入质谱仪的真空管,用激光激发进行MassARRAY飞行时间质谱检测;
(7)根据MassARRAY飞行时间质谱检测得到的FREQ数据,计算拷贝数变异系数TR值,并判断基因片段的拷贝数。
延伸产物经过纯化和MassARRAY飞行时间质谱检测,得到两个质谱峰,用两个质谱峰的FREQ数据根据下列公式进行计算,可以得到拷贝数变异系数(TR值);其中两个质谱峰分别为人基因组DNA(gDNA)片段的峰以及人工内标片段的峰;目标检测基因片段的人工内标拷贝数、内参基因片段的人工内标拷贝数为添加进入体系的拷贝数。
Figure BDA0003161151700000031
Figure BDA0003161151700000032
Figure BDA0003161151700000033
Figure BDA0003161151700000034
Figure BDA0003161151700000035
Figure BDA0003161151700000036
Figure BDA0003161151700000037
由于有n个内参基因,每个待测样本与每个阴性样本拷贝数比值有n个数值,取中位数。由于有n个阴性样本,所以得到了n个中位数,取平均值,得到最终的拷贝数变异系数(TR值)。
Figure BDA0003161151700000038
根据拷贝数变异系数(TR值),当TR≤0.65时,待测样本目标检测基因片段为缺失阳性;当0.8<TR<1.2时,待测样本目标检测基因片段拷贝数正常,结果为阴性;当TR≥1.5时,待测样本目标检测基因片段为重复阳性。
一种基于上述用于检测基因长片段拷贝数变异的方法的试剂盒,包括样品检测孔W1和样品检测孔W2;样品检测孔W1包括W1多重PCR反应体系、虾碱性磷酸酶(SAP)反应体系以及W1延伸反应体系;样品检测孔W2包括W2多重PCR反应体系、虾碱性磷酸酶(SAP)反应体系以及W2延伸反应体系。
W1多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标(competitor)、UNG酶和PCR酶。
进一步的,W1多重PCR反应体系中PCR引物Pool的序列如下:
Figure BDA0003161151700000039
Figure BDA0003161151700000041
进一步的,W1多重PCR反应体系中人工内标的序列如下:
Figure BDA0003161151700000042
Figure BDA0003161151700000051
Figure BDA0003161151700000061
W2多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标、UNG酶和PCR酶。
进一步的,W2多重PCR反应体系中PCR引物Pool的序列如下:
F17 GTTGGATGTGTGAATTTTCTGAGACGGATG SEQ ID NO:66
F18 ACGTTGGATGTGACGTGTCTGCTCCACTTC SEQ ID NO:67
F19 GGATGTTTGTTTTCTCATTCCATTTAAAGC SEQ ID NO:68
F20 CGTTGGATGTTTTTAGCAAAAGCGTCCAGA SEQ ID NO:69
F21 TGGATGTCTCCTGAACATCTAAAAGATGAA SEQ ID NO:70
F22 ACGTTGGATGCAGAGGGATACCATGCAACA SEQ ID NO:71
F23 CGTTGGATGAAAGCAGATTTGGCAGTTCAA SEQ ID NO:72
F24 GTTGGATGAACTTCTCCCATTCCTTTCAGA SEQ ID NO:73
F25 ACGTTGGATGGGTAGAGGGCCTGGGTTAAG SEQ ID NO:74
F26 ACGTTGGATGGCTCTTTAGCTTCTTAGGAC SEQ ID NO:75
F27 TGGTTTTTCTAATGTGTTAAAGTTCATTGG SEQ ID NO:76
F28 ACGTTGGATGTTTCTCAGATAACTGGGCCCCTG SEQ ID NO:77
F29 ACGTTGGATGTTCCCCTGTCCCTCTCTCTT SEQ ID NO:78
F30 CGTTGGATGTTCAGGAGGAAAAGCACAGAA SEQ ID NO:79
R17 ACGTTGGATGGCTGTAATGAGCTGGCATGA SEQ ID NO:80
R18 ACGTTGGATGTGTCCTGGGATTCTCTTGCT SEQ ID NO:81
R19 CGTTGGATGCCTTTCCACTCCTGGTTCTTT SEQ ID NO:82
R20 ACGTTGGATGAAGTGTTGGAAGCAGGGAAG SEQ ID NO:83
R21 ACGTTGGATGGCCACAGAGCAAGACTCCAT SEQ ID NO:84
R22 ACGTTGGATGTTTGGCCAACAATACACACC SEQ ID NO:85
R23 GTTGGATGGCTTTCGTTTTGAAAGCAGATT SEQ ID NO:86
R24 ACGTTGGATGTGACTCTGGGGCTCTGTCTT SEQ ID NO:87
R25 ACGTTGGATGTGTGTCCTCCCTCTCTGACA SEQ ID NO:88
R26 ACGTTGGATGCATTTTCCTCCCGCAATTCC SEQ ID NO:89
R27 ACGTTGGATGCAGAGTGGATGGAGAACAAGG SEQ ID NO:90
R28 ACGTTGGATGCCTCTCAGGTTCCGCCCC SEQ ID NO:91
R29 ACGTTGGATGGGTTCTCCCAGGCTCTTACC SEQ ID NO:92
R30 CGTTGGATGCCTGAGACCCTTACCCAATTC SEQ ID NO:93
F31 ACGTTGGATGGGTCAGCTCTTCCCTTCATC SEQ ID NO:94
F32 ACGTTGGATGGTGGTTCGGCTTTCACCAGTCTG SEQ ID NO:95
F33 ACGTTGGATGAGCAACCTGTTACATATTAAAGTT SEQ ID NO:96
R31 ACGTTGGATGCCTCCCACATGTAATGTGTTG SEQ ID NO:97
R32 ACGTTGGATGGGTGTGGTCACTGGACTTGGG SEQ ID NO:98
R33 ACGTTGGATGATACTGAGCAAAGGCAATCAAC SEQ ID NO:99
进一步的,W2多重PCR反应体系中人工内标的序列如下:
Figure BDA0003161151700000071
Figure BDA0003161151700000081
Figure BDA0003161151700000091
Figure BDA0003161151700000101
W1和W2的SAP反应体系均包括SAP酶以及SAP Buffer。
W1延伸反应体系包括Buffer Plus、Termination Mix、W1延伸引物混合物以及iPLEX Enzyme;W2延伸反应体系包括Buffer Plus、Termination Mix、W2延伸引物混合物以及iPLEX Enzyme。
进一步的,W1延伸引物混合物的序列如下:
UEP1 GCTGAAACTTCTCAACC SEQ ID NO:1
UEP2 CTGGGAGCTCCTCTCACTC SEQ ID NO:2
UEP3 GAGTTGATCAAGGAACCTG SEQ ID NO:3
UEP4 CACAGCAGAAACCTACAACTC SEQ ID NO:4
UEP5 AAAGGCATCTGGCTGCACAACC SEQ ID NO:5
UEP6 GGGTGAGAGGATAGCCCTGAGC SEQ ID NO:6
UEP7 ACAAGAAAGTACGAGATTTAGTC SEQ ID NO:7
UEP8 ATTCAGCATTTTTCTTTCTTTAAT SEQ ID NO:8
UEP9 ATTAGATTAGTTAAAGTGATGTGG SEQ ID NO:9
UEP10 TGGAGATCAAGAATTGTTACAAATC SEQ ID NO:10
UEP11 GGATGTTCTCATTTCCCATTTCTCTT SEQ ID NO:11
UEP12 CCCTCTGAAGATACCGTTAATAAGGC SEQ ID NO:12
UEP13 TGAGATGGGTAGTTTCTATTCTGAAG SEQ ID NO:13
UEP14 CACCCTTCCATCATAAGTGAC SEQ ID NO:14
UEP15 TCAACATTGATGGTG SEQ ID NO:15
UEP16 GGGAAACAAAGGACACCGTTA SEQ ID NO:16
W2延伸引物混合物的序列如下:
Figure BDA0003161151700000102
Figure BDA0003161151700000111
由于采用了以上技术,本发明较现有技术相比,具有的有益效果如下:
本发明成功建立了一种用于检测基因长片段拷贝数变异的新方法,应用本发明对基因长片段拷贝数变异进行检测,覆盖的检测序列更长,可同时进行384个检测,具有大通量、准确性高、成本低等特点。
附图说明
图1是基因片段发生缺失的MassARRAY结果图;
图2是基因片段发生重复的MassARRAY结果图;
图3是基因片段发生缺失的结果计算柱状图;
图4是基因片段发生重复的结果计算柱状图;
图5是人工内标与人基因组DNA的对比示意图,其中在延伸引物3’端的延伸位置有一个碱基的不同;
图6是人工内标的延伸产物峰(人工内标峰)与人基因组DNA的延伸产物峰(目标峰)的示意图。
具体实施方式
下面结合具体实施方式,进一步阐明本发明。
实施例1
1.BRCA1基因长片段拷贝数变异的检测:
1)DNA样本的准备
人基因组DNA的提取采用商业化的DNA提取试剂盒。得到的DNA质量,用Nano300检测须符合OD260/OD280在1.8-2.0之间,浓度>10ng/μl。将质量合格的DNA样本稀释至10ng/μl,置于4℃备用。
2)PCR扩增反应
本申请当中优选的扩增引物组合序列见表1-表4,扩增引物为内参基因和BRCA1基因的23个外显子的特异性引物。内参基因扩增引物和延伸引物的目标片段为人源基因RNaseP、EIF2C1和ALB的一段。由于超过30对引物,每个样本分2个孔检测,分别为W1和W2。W1中的16对引物分别按照终浓度0.5μM进行混合,配制成W1的PCR引物Pool;W2中的17对引物分别按照终浓度0.5μM进行混合,配制成W2的PCR引物Pool。
表1.W1的BRCA1基因扩增引物序列
F1 GATGTTTGCCTTTTGAGTATTCTTTCTACA SEQ ID NO:34
F2 ACGTTGGATGACTCTACCAGTGCCAGGAGC SEQ ID NO:35
F3 ACGTTGGATGTTCTTTTTCTCCCCCCCTAC SEQ ID NO:36
F4 ACGTTGGATGGTTGTTCTAGCAGTGAAGAG SEQ ID NO:37
F5 GGATGGATGAAGTGACAGTTCCAGTAGTCC SEQ ID NO:38
F6 ACGTTGGATGCACGCTTTTTACCTGAGTGG SEQ ID NO:39
F7 GTTGGATGCACTTGCTGAGTGTGTTTCTCA SEQ ID NO:40
F8 CGTTGGATGAAAGAGCACGTTCTTCTGCTG SEQ ID NO:41
F9 CGTTGGATGTTCTGAGCTGTGTGCTAGAGG SEQ ID NO:42
F10 GTTGGATGTGGTCAGCTTTCTGTAATCGAA SEQ ID NO:43
F11 ACGTTGGATGACGGCTAATTGTGCTCACTG SEQ ID NO:44
F12 GTTGGATGAGGATCTGATTCTTCTGAAGATAC SEQ ID NO:45
F13 ACGTTGGATGATGAGCTCCTCTTGAGATGG SEQ ID NO:46
F14 ACGTTGGATGCAGAGGGATACCATGCAACA SEQ ID NO:47
R1 ACGTTGGATGCCTACTGTGGTTGCTTCCAA SEQ ID NO:48
R2 ACGTTGGATGATAATTTTGTGCTCATGGCAGA SEQ ID NO:49
R3 ACGTTGGATGTGGAGCCACATAACACATTC SEQ ID NO:50
R4 ACGTTGGATGACTCTTCTTGGCTCCAGTTG SEQ ID NO:51
R5 ACGTTGGATGTACATGCAGGCACCTTACCA SEQ ID NO:52
R6 ACGTTGGATGTAAGGTGAAGCAGCATCTGG SEQ ID NO:53
R7 ACGTTGGATGTCCAAACCTGTGTCAAGCTG SEQ ID NO:54
R8 ACGTTGGATGGGTGCATTGATGGAAGGAAG SEQ ID NO:55
R9 ACGTTGGATGTTTATGCAGCAGATGCAAGG SEQ ID NO:56
R10 CGTTGGATGTTTTTGCAGAATCCAAACTGA SEQ ID NO:57
R11 ACGTTGGATGGCTAGAGGAAAACTTTGAGG SEQ ID NO:58
R12 ACGTTGGATGGTTCTCTTTGACTCACCTGCAA SEQ ID NO:59
R13 ACGTTGGATGGTCATCCCCTTCTAAATGCC SEQ ID NO:60
R14 ACGTTGGATGTTTGGCCAACAATACACACC SEQ ID NO:61
表2.W1的内参基因扩增引物序列
F15 ACGTTGGATGGTGGTTCGGCTTTCACCAGTCTG SEQ ID NO:62
F16 ACGTTGGATGGGTCAGCTCTTCCCTTCATC SEQ ID NO:63
R15 ACGTTGGATGGGTGTGGTCACTGGACTTGGG SEQ ID NO:64
R16 ACGTTGGATGCCTCCCACATGTAATGTGTTG SEQ ID NO:65
表3.W2的BRCA1基因扩增引物序列
F17 GTTGGATGTGTGAATTTTCTGAGACGGATG SEQ ID NO:66
F18 ACGTTGGATGTGACGTGTCTGCTCCACTTC SEQ ID NO:67
F19 GGATGTTTGTTTTCTCATTCCATTTAAAGC SEQ ID NO:68
F20 CGTTGGATGTTTTTAGCAAAAGCGTCCAGA SEQ ID NO:69
F21 TGGATGTCTCCTGAACATCTAAAAGATGAA SEQ ID NO:70
F22 ACGTTGGATGCAGAGGGATACCATGCAACA SEQ ID NO:71
F23 CGTTGGATGAAAGCAGATTTGGCAGTTCAA SEQ ID NO:72
F24 GTTGGATGAACTTCTCCCATTCCTTTCAGA SEQ ID NO:73
F25 ACGTTGGATGGGTAGAGGGCCTGGGTTAAG SEQ ID NO:74
F26 ACGTTGGATGGCTCTTTAGCTTCTTAGGAC SEQ ID NO:75
F27 TGGTTTTTCTAATGTGTTAAAGTTCATTGG SEQ ID NO:76
F28 ACGTTGGATGTTTCTCAGATAACTGGGCCCCTG SEQ ID NO:77
F29 ACGTTGGATGTTCCCCTGTCCCTCTCTCTT SEQ ID NO:78
F30 CGTTGGATGTTCAGGAGGAAAAGCACAGAA SEQ ID NO:79
R17 ACGTTGGATGGCTGTAATGAGCTGGCATGA SEQ ID NO:80
R18 ACGTTGGATGTGTCCTGGGATTCTCTTGCT SEQ ID NO:81
R19 CGTTGGATGCCTTTCCACTCCTGGTTCTTT SEQ ID NO:82
R20 ACGTTGGATGAAGTGTTGGAAGCAGGGAAG SEQ ID NO:83
R21 ACGTTGGATGGCCACAGAGCAAGACTCCAT SEQ ID NO:84
R22 ACGTTGGATGTTTGGCCAACAATACACACC SEQ ID NO:85
R23 GTTGGATGGCTTTCGTTTTGAAAGCAGATT SEQ ID NO:86
R24 ACGTTGGATGTGACTCTGGGGCTCTGTCTT SEQ ID NO:87
R25 ACGTTGGATGTGTGTCCTCCCTCTCTGACA SEQ ID NO:88
R26 ACGTTGGATGCATTTTCCTCCCGCAATTCC SEQ ID NO:89
R27 ACGTTGGATGCAGAGTGGATGGAGAACAAGG SEQ ID NO:90
R28 ACGTTGGATGCCTCTCAGGTTCCGCCCC SEQ ID NO:91
R29 ACGTTGGATGGGTTCTCCCAGGCTCTTACC SEQ ID NO:92
R30 CGTTGGATGCCTGAGACCCTTACCCAATTC SEQ ID NO:93
表4.W2的内参基因扩增引物序列
F31 ACGTTGGATGGGTCAGCTCTTCCCTTCATC SEQ ID NO:94
F32 ACGTTGGATGGTGGTTCGGCTTTCACCAGTCTG SEQ ID NO:95
F33 ACGTTGGATGAGCAACCTGTTACATATTAAAGTT SEQ ID NO:96
R31 ACGTTGGATGCCTCCCACATGTAATGTGTTG SEQ ID NO:97
R32 ACGTTGGATGGGTGTGGTCACTGGACTTGGG SEQ ID NO:98
R33 ACGTTGGATGATACTGAGCAAAGGCAATCAAC SEQ ID NO:99
上述用于检测BRCA1基因长片段拷贝数变异的试剂盒设有人工内标(competitor),人工内标为与目标扩增片段仅有1碱基不同的双链DNA合成片段或含有该片段的质粒。不同的碱基为延伸引物在延伸反应时延伸的3’端碱基(如图5、图6所示),作为内部对照。具体的人工内标序列见表5-表6。W1的15个人工内标按终浓度相当于3000拷贝/μl人基因组DNA的量混合;W2的15个人工内标也按终浓度相当于3000拷贝/μl人基因组DNA的量混合。分别得到W1人工内标混合物和W2人工内标混合物。
表5.W1的人工内标序列
Figure BDA0003161151700000141
Figure BDA0003161151700000151
Figure BDA0003161151700000161
表6.W2的人工内标序列
Figure BDA0003161151700000162
Figure BDA0003161151700000171
Figure BDA0003161151700000181
上述用于检测BRCA1基因长片段拷贝数变异的试剂盒所使用的多重PCR反应体系中含有PCR Buffer、MgCl2、dNTPs、UNG酶和PCR酶(购于AgenaBioScience公司,货号21327L),以及dUTP(购于上海兆维,货号D5331)、PCR引物Pool和人工内标混合物。每个样本分两个孔检测,分别为样品检测孔W1和样品检测孔W2。PCR扩增反应体系见表7,其中W1孔使用W1的PCR引物Pool和人工内标混合物,W2孔使用W2的PCR引物Pool和人工内标混合物。PCR扩增反应程序见表8。
表7.PCR扩增反应体系
试剂 单孔体积/μl
ddH<sub>2</sub>O 6.4
10×PCR Buffer 2
MgCl<sub>2</sub>(25mM) 3.2
dNTP Mix(25mM) 0.4
dUTP(100mM) 0.1
PCR引物Pool 2.4
UNG Enzyme(5U/μl) 0.5
PCR Enzyme(5U/μl) 1
人工内标混合物 2
DNA(10ng/μl) 2
总体积 20
表8.PCR扩增反应程序
Figure BDA0003161151700000191
3)SAP反应
上述SAP反应体系含有SAP酶和SAP Buffer(购于Agena BioScience公司,货号10141)。PCR扩增后,取5ul产物进行SAP反应。SAP反应体系见表9,反应程序见表10。
表9.SAP反应体系
试剂 单孔体积/μl
PCR扩增产物 5
ddH<sub>2</sub>O 1.53
SAP Buffer 0.17
SAP酶 0.30
总体积 7
表10.SAP反应程序
37℃ 40min
85℃ 5min
4℃ Forever
4)延伸反应
上述延伸反应体系含有Buffer Plus、Termination Mix和iPLEX Enzyme(购于Agena BioScience公司,货号10141),以及延伸引物混合物。本申请当中优选的延伸引物组合序列见表12-表15,延伸引物为BRCA1基因和内参基因的特异性引物。W1中的16条延伸引物(UEP)按照表11的规则进行混合,配制成W1的UEP混合物;W2中的17条延伸引物(UEP)按照表11的规则进行混合,配制成W2的UEP混合物。SAP反应结束后,进行延伸反应。延伸反应体系见表16,其中W1孔使用W1的UEP混合物,W2孔使用W2的UEP混合物。反应程序见表17。
表11.延伸引物(UEP)混合物配制表
UEP分子量/Da UEP混合物中终浓度/μM
<5000 4
5000-6000 6
6000-7000 8
>7000 12
表12.W1的BRCA1基因延伸引物序列
UEP1 GCTGAAACTTCTCAACC SEQ ID NO:1
UEP2 CTGGGAGCTCCTCTCACTC SEQ ID NO:2
UEP3 GAGTTGATCAAGGAACCTG SEQ ID NO:3
UEP4 CACAGCAGAAACCTACAACTC SEQ ID NO:4
UEP5 AAAGGCATCTGGCTGCACAACC SEQ ID NO:5
UEP6 GGGTGAGAGGATAGCCCTGAGC SEQ ID NO:6
UEP7 ACAAGAAAGTACGAGATTTAGTC SEQ ID NO:7
UEP8 ATTCAGCATTTTTCTTTCTTTAAT SEQ ID NO:8
UEP9 ATTAGATTAGTTAAAGTGATGTGG SEQ ID NO:9
UEP10 TGGAGATCAAGAATTGTTACAAATC SEQ ID NO:10
UEP11 GGATGTTCTCATTTCCCATTTCTCTT SEQ ID NO:11
UEP12 CCCTCTGAAGATACCGTTAATAAGGC SEQ ID NO:12
UEP13 TGAGATGGGTAGTTTCTATTCTGAAG SEQ ID NO:13
UEP14 CACCCTTCCATCATAAGTGAC SEQ ID NO:14
表13.W1的内参基因延伸引物序列
UEP15 TCAACATTGATGGTG SEQ ID NO:15
UEP16 GGGAAACAAAGGACACCGTTA SEQ ID NO:16
表14.W2的BRCA1基因延伸引物序列
UEP17 ACTGAGAAGCGTGCAGC SEQ ID NO:17
UEP18 CGACCTTGGTGGTTTC SEQ ID NO:18
UEP19 CCTCAAACTTGTCAGCAGAA SEQ ID NO:19
UEP20 CTCCGGAGTCCTAGCCCTTTC SEQ ID NO:20
UEP21 GGTTCACTCTGTAGAAGTCTTT SEQ ID NO:21
UEP22 CCATGTTCTAACACAGCTTCTAG SEQ ID NO:22
UEP23 GGAGTCTGCTCCGTTTGGTTAGT SEQ ID NO:23
UEP24 AACACTTACCTGGAATCTGGAATC SEQ ID NO:24
UEP25 GGATGGTGAATGATGAAAGCTCCT SEQ ID NO:25
UEP26 GGGGAGATGCTGAGTTTGTGTGTG SEQ ID NO:26
UEP27 TAAGAAGTACAAAATGTC SEQ ID NO:27
UEP28 CCTGTCCCTTTCCCGGG SEQ ID NO:28
UEP29 TGTTGGCATGTTGGTGAAGGGCCCAT SEQ ID NO:29
UEP30 CGGGTCCAACTCTCTAACCTTGGAACTG SEQ ID NO:30
表15.W2的内参基因延伸引物序列
UEP31 TGATAACAAAGGACACCGTTA EQ ID NO31
UEP32 GGGAGGCTCAACATTGATGGTG EQ ID NO32
UEP33 TTACTACATTTTTCTACATCCTTTGTTT EQ ID NO33
表16.延伸反应体系
试剂 单孔体积/μl
SAP产物 7
ddH<sub>2</sub>O 0.619
Buffer Plus(10×) 0.2
Termination Mix 0.2
UEP混合物 0.94
iPLEX Pro Enzyme 0.041
总体积 9
表17.延伸反应程序
Figure BDA0003161151700000211
Figure BDA0003161151700000221
5)脱盐
向延伸反应的产物中加入19ul超纯水,放入MassARRAY-CPM机器中,设置机器加入10ul的树脂,进行脱盐纯化,并静置沉降。
6)质谱检测
MassARRAY-CPM自动化地将产物点样在芯片上,并移入真空管中,然后用激光激发,进行飞行时间质谱。一张芯片最多可以同时检测192个样本,增加了通量,减少了成本。
2.数据分析
用Typer软件打开实验结果,可以对散点图进行分析。外显子缺失或者重复的样本,其结果会散落在正常样本的聚堆之外(如图1和图2圈出的部分)。我们需要对数据进行进一步的分析,在Typer软件中点击View--Plate Data Pane导出数据表,得到FREQ值(表18)。以BRCA1基因片段Exon15为例。
表18.FREQ值
样本名称 检测片段 gDNA的FREQ 人工内标的FREQ
待测样本1 ALB 0.383216 0.616784
待测样本2 ALB 0.361839 0.638161
阴性样本1 ALB 0.461943 0.538056
阴性样本2 ALB 0.384088 0.615913
阴性样本3 ALB 0.356612 0.64339
待测样本1 EIF2C1 0.573677 0.426323
待测样本2 EIF2C1 0.514017 0.485983
阴性样本1 EIF2C1 0.627566 0.372434
阴性样本2 EIF2C1 0.535629 0.464371
阴性样本3 EIF2C1 0.495153 0.504847
待测样本1 RNaseP 0.441841 0.558159
待测样本2 RNaseP 0.399637 0.600362
阴性样本1 RNaseP 0.3908 0.6092
阴性样本2 RNaseP 0.463194 0.536802
阴性样本3 RNaseP 0.403123 0.596877
待测样本1 Exon15 0.488966 0.511034
待测样本2 Exon15 0.340837 0.659161
阴性样本1 Exon15 0.546832 0.453167
阴性样本2 Exon15 0.496558 0.503443
阴性样本3 Exon15 0.438126 0.561872
根据数据表中的每个BRCA1基因片段的人基因组DNA(gDNA)的FREQ参数和人工内标的FREQ参数,按照以下公式计算拷贝数。
Figure BDA0003161151700000231
Figure BDA0003161151700000232
Figure BDA0003161151700000233
Figure BDA0003161151700000234
Figure BDA0003161151700000235
Figure BDA0003161151700000236
Figure BDA0003161151700000237
由于本实施例中有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数。由于有3个阴性样本,所以得到了3个中位数,取平均值,得到最终的拷贝数变异系数(TR值)。
Figure BDA0003161151700000238
以Well1的Exon15片段为例,其中本实施例中添加的目标检测基因片段和内参基因片段的人工内标拷贝数为6000。
1)阴性样本1拷贝数比值
Figure BDA0003161151700000239
Figure BDA00031611517000002310
Figure BDA00031611517000002311
Figure BDA00031611517000002312
Figure BDA00031611517000002313
Figure BDA00031611517000002314
Figure BDA00031611517000002315
2)阴性样本2拷贝数比值
Figure BDA00031611517000002316
Figure BDA00031611517000002317
Figure BDA0003161151700000241
Figure BDA0003161151700000242
Figure BDA0003161151700000243
Figure BDA0003161151700000244
Figure BDA0003161151700000245
3)阴性样本3拷贝数比值
Figure BDA0003161151700000246
Figure BDA0003161151700000247
Figure BDA0003161151700000248
Figure BDA0003161151700000249
Figure BDA00031611517000002410
Figure BDA00031611517000002411
Figure BDA00031611517000002412
4)待测样本1拷贝数比值
Figure BDA00031611517000002413
Figure BDA00031611517000002414
Figure BDA00031611517000002415
Figure BDA00031611517000002416
Figure BDA00031611517000002417
Figure BDA00031611517000002418
Figure BDA00031611517000002419
5)待测样本2拷贝数比值
Figure BDA00031611517000002420
Figure BDA00031611517000002421
Figure BDA00031611517000002422
Figure BDA0003161151700000251
Figure BDA0003161151700000252
Figure BDA0003161151700000253
Figure BDA0003161151700000254
6)待测样本1拷贝数变异系数
Figure BDA0003161151700000255
Figure BDA0003161151700000256
Figure BDA0003161151700000257
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.99。
Figure BDA0003161151700000258
Figure BDA0003161151700000259
Figure BDA00031611517000002510
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.97。
Figure BDA00031611517000002511
Figure BDA00031611517000002512
Figure BDA00031611517000002513
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为1.05。
由于有3个阴性样本,所以得到了3个中位数,再将3个中位数取平均值,得到最终的拷贝数变异系数(TR值)。
Figure BDA00031611517000002514
7)待测样本2拷贝数变异系数
Figure BDA00031611517000002515
Figure BDA00031611517000002516
Figure BDA0003161151700000261
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.65。
Figure BDA0003161151700000262
Figure BDA0003161151700000263
Figure BDA0003161151700000264
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.58。
Figure BDA0003161151700000265
Figure BDA0003161151700000266
Figure BDA0003161151700000267
由于有3个内参基因,每个待测样本与每个阴性样本拷贝数比值有3个数值,取中位数,为0.65。
由于有3个阴性样本,所以得到了3个中位数,再将3个中位数取平均值,得到最终的拷贝数变异系数(TR值)。
Figure BDA0003161151700000268
根据TR值,判断如下:
TR值 结果判断
1 待测样本1 0.8<TR<1.2 Exon15正常
2 待测样本2 TR≤0.65 Exon15缺失
根据上述算法,用RStudio编辑器编写代码后,可直接上传实验数据,得到最终的TR值。用同样的方法计算待测样本1和待测样本2的其他外显子拷贝数,待测样本1的Exon13拷贝数变异系数(TR值)为1.9,结果判断为Exon13重复;待测样本2的Exon16拷贝数变异系数(TR值)为0.56,结果判断为Exon16缺失。根据TR值做柱状图,待测样本1的Exon13柱形图明显高于其他柱形图(如图4所示)。待测样本2的Exon15和Exon16的柱形图明显低于其他柱形图(如图3所示)。
3.质控标准
质量控制,每次试验需做2个阳性对照、3个阴性对照和3个空白对照。缺失阳性对照的TR≤0.65,重复阳性对照TR≥1.5,空白对照的TR=0。
TR值 结果判断
1 TR=0 空白对照
2 TR≤0.65 缺失阳性对照
3 TR≥1.5 重复阳性对照
4.产品性能指标:
本方法能特异检测BRCA1的23个外显子的1个或多个缺失和重复。
检测2份阳性参考品、10份阴性参考品,符合率为100%;企业重复性参考品重复检测10次,10次结果相同。检测未知样本,其符合率为98.6%。
本发明开发了一种用于检测基因长片段拷贝数变异的新方法,开创性的添加人工内标(competitor),采用特异的PCR引物和延伸引物,基于MassARRAY飞行时间质谱的多重PCR反应,可以大通量、准确性高、成本低地检测基因长片段拷贝数变异。弥补大多数基因测序检测的漏洞,有助于更全面的提供基因检测信息辅助医生进行诊断。
上述实施例仅为本发明的优选技术方案,而不应视为对于本发明的限制,本发明的保护范围应以权利要求记载的技术方案,包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围,即在此范围内的等同替换改进,也在本发明的保护范围之内。
序列表
<110> 申友基因组研究院(南京)有限公司
<120> 一种用于检测基因长片段拷贝数变异的方法
<150> 2020113518391
<151> 2020-11-26
<160> 129
<170> SIPOSequenceListing 1.0
<210> 1
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gctgaaactt ctcaacc 17
<210> 2
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ctgggagctc ctctcactc 19
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gagttgatca aggaacctg 19
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cacagcagaa acctacaact c 21
<210> 5
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaaggcatct ggctgcacaa cc 22
<210> 6
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gggtgagagg atagccctga gc 22
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
acaagaaagt acgagattta gtc 23
<210> 8
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
attcagcatt tttctttctt taat 24
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
attagattag ttaaagtgat gtgg 24
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tggagatcaa gaattgttac aaatc 25
<210> 11
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ggatgttctc atttcccatt tctctt 26
<210> 12
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ccctctgaag ataccgttaa taaggc 26
<210> 13
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgagatgggt agtttctatt ctgaag 26
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cacccttcca tcataagtga c 21
<210> 15
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tcaacattga tggtg 15
<210> 16
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gggaaacaaa ggacaccgtt a 21
<210> 17
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
actgagaagc gtgcagc 17
<210> 18
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
cgaccttggt ggtttc 16
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cctcaaactt gtcagcagaa 20
<210> 20
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctccggagtc ctagcccttt c 21
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ggttcactct gtagaagtct tt 22
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ccatgttcta acacagcttc tag 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ggagtctgct ccgtttggtt agt 23
<210> 24
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aacacttacc tggaatctgg aatc 24
<210> 25
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ggatggtgaa tgatgaaagc tcct 24
<210> 26
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ggggagatgc tgagtttgtg tgtg 24
<210> 27
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
taagaagtac aaaatgtc 18
<210> 28
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cctgtccctt tcccggg 17
<210> 29
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tgttggcatg ttggtgaagg gcccat 26
<210> 30
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cgggtccaac tctctaacct tggaactg 28
<210> 31
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tgataacaaa ggacaccgtt a 21
<210> 32
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gggaggctca acattgatgg tg 22
<210> 33
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ttactacatt tttctacatc ctttgttt 28
<210> 34
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gatgtttgcc ttttgagtat tctttctaca 30
<210> 35
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
acgttggatg actctaccag tgccaggagc 30
<210> 36
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
acgttggatg ttctttttct ccccccctac 30
<210> 37
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
acgttggatg gttgttctag cagtgaagag 30
<210> 38
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ggatggatga agtgacagtt ccagtagtcc 30
<210> 39
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
acgttggatg cacgcttttt acctgagtgg 30
<210> 40
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gttggatgca cttgctgagt gtgtttctca 30
<210> 41
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
cgttggatga aagagcacgt tcttctgctg 30
<210> 42
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cgttggatgt tctgagctgt gtgctagagg 30
<210> 43
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gttggatgtg gtcagctttc tgtaatcgaa 30
<210> 44
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
acgttggatg acggctaatt gtgctcactg 30
<210> 45
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gttggatgag gatctgattc ttctgaagat ac 32
<210> 46
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
acgttggatg atgagctcct cttgagatgg 30
<210> 47
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
acgttggatg cagagggata ccatgcaaca 30
<210> 48
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
acgttggatg cctactgtgg ttgcttccaa 30
<210> 49
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
acgttggatg ataattttgt gctcatggca ga 32
<210> 50
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
acgttggatg tggagccaca taacacattc 30
<210> 51
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
acgttggatg actcttcttg gctccagttg 30
<210> 52
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
acgttggatg tacatgcagg caccttacca 30
<210> 53
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
acgttggatg taaggtgaag cagcatctgg 30
<210> 54
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
acgttggatg tccaaacctg tgtcaagctg 30
<210> 55
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
acgttggatg ggtgcattga tggaaggaag 30
<210> 56
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
acgttggatg tttatgcagc agatgcaagg 30
<210> 57
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
cgttggatgt ttttgcagaa tccaaactga 30
<210> 58
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
acgttggatg gctagaggaa aactttgagg 30
<210> 59
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
acgttggatg gttctctttg actcacctgc aa 32
<210> 60
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
acgttggatg gtcatcccct tctaaatgcc 30
<210> 61
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
acgttggatg tttggccaac aatacacacc 30
<210> 62
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
acgttggatg gtggttcggc tttcaccagt ctg 33
<210> 63
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
acgttggatg ggtcagctct tcccttcatc 30
<210> 64
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
acgttggatg ggtgtggtca ctggacttgg g 31
<210> 65
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
acgttggatg cctcccacat gtaatgtgtt g 31
<210> 66
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
gttggatgtg tgaattttct gagacggatg 30
<210> 67
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
acgttggatg tgacgtgtct gctccacttc 30
<210> 68
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
ggatgtttgt tttctcattc catttaaagc 30
<210> 69
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
cgttggatgt ttttagcaaa agcgtccaga 30
<210> 70
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
tggatgtctc ctgaacatct aaaagatgaa 30
<210> 71
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
acgttggatg cagagggata ccatgcaaca 30
<210> 72
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
cgttggatga aagcagattt ggcagttcaa 30
<210> 73
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gttggatgaa cttctcccat tcctttcaga 30
<210> 74
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
acgttggatg ggtagagggc ctgggttaag 30
<210> 75
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
acgttggatg gctctttagc ttcttaggac 30
<210> 76
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
tggtttttct aatgtgttaa agttcattgg 30
<210> 77
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
acgttggatg tttctcagat aactgggccc ctg 33
<210> 78
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
acgttggatg ttcccctgtc cctctctctt 30
<210> 79
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
cgttggatgt tcaggaggaa aagcacagaa 30
<210> 80
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
acgttggatg gctgtaatga gctggcatga 30
<210> 81
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
acgttggatg tgtcctggga ttctcttgct 30
<210> 82
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cgttggatgc ctttccactc ctggttcttt 30
<210> 83
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
acgttggatg aagtgttgga agcagggaag 30
<210> 84
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
acgttggatg gccacagagc aagactccat 30
<210> 85
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
acgttggatg tttggccaac aatacacacc 30
<210> 86
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gttggatggc tttcgttttg aaagcagatt 30
<210> 87
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
acgttggatg tgactctggg gctctgtctt 30
<210> 88
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
acgttggatg tgtgtcctcc ctctctgaca 30
<210> 89
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
acgttggatg cattttcctc ccgcaattcc 30
<210> 90
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
acgttggatg cagagtggat ggagaacaag g 31
<210> 91
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
acgttggatg cctctcaggt tccgcccc 28
<210> 92
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
acgttggatg ggttctccca ggctcttacc 30
<210> 93
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
cgttggatgc ctgagaccct tacccaattc 30
<210> 94
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
acgttggatg ggtcagctct tcccttcatc 30
<210> 95
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
acgttggatg gtggttcggc tttcaccagt ctg 33
<210> 96
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
acgttggatg agcaacctgt tacatattaa agtt 34
<210> 97
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
acgttggatg cctcccacat gtaatgtgtt g 31
<210> 98
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
acgttggatg ggtgtggtca ctggacttgg g 31
<210> 99
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
acgttggatg atactgagca aaggcaatca ac 32
<210> 100
<211> 287
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ttctttttct ccccccctac cctgctagtc tggagttgat caaggaacct gactccacaa 60
agtgtgacca catattttgc aagtaagttt gaatgtgtta tgtggctcca ttttcaaaac 120
tgaaaaactc atatattcag tattttactc ccacagcacc tccccccaat ttgacccaca 180
gggaccccca tccaggtgca gggtcctcgc ctgtgtacag ggcacacctt tggtcactcc 240
aaattcccag agctcccagg gtccttctca gggtctccac ctggatg 287
<210> 101
<211> 372
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
tttgcctttt gagtattctt tctacaaaag gaagtaaatt aaattgttct ttctttcttt 60
ataatttata gattttgcat gctgaaactt ctcaacctga agaaagggcc ttcacagtgt 120
cctttatgta agaatgatat aaccaaaagg tatataattt ggtaatgatg ctaggttgga 180
agcaaccaca gtaggttttc aaaactgaaa aactcatata ttcagtattt tactcccaca 240
gcacctcccc ccaatttgac ccacagggac ccccatccag gtgcagggtc ctcgcctgtg 300
tacagggcac acctttggtc actccaaatt cccagagctc ccagggtcct tctcagggtc 360
tccacctgga tg 372
<210> 102
<211> 302
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
cacttgctga gtgtgtttct caaacaattt aatttcagga gcctacaaga aagtacgaga 60
tttagtctac ttgttgaaga gctattgaaa atcatttgtg cttttcagct tgacacaggt 120
ttggattttc aaaactgaaa aactcatata ttcagtattt tactcccaca gcacctcccc 180
ccaatttgac ccacagggac ccccatccag gtgcagggtc ctcgcctgtg tacagggcac 240
acctttggtc actccaaatt cccagagctc ccagggtcct tctcagggtc tccacctgga 300
tg 302
<210> 103
<211> 366
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
ctcagtaaat atttctagtt gaatatctgt ttttcaacaa gtacattttt ttaacccttt 60
taattaagaa aacttttatt gatttatttt ttggggggaa attttttagg atctgattct 120
tctgaagata ccgttaataa ggctacttat tgcaggtgag tcaaagagaa cctttgtcta 180
tgaagctggt tttcaaaact gaaaaactca tatattcagt attttactcc cacagcacct 240
ccccccaatt tgacccacag ggacccccat ccaggtgcag ggtcctcgcc tgtgtacagg 300
gcacaccttt ggtcactcca aattcccaga gctcccaggg tccttctcag ggtctccacc 360
tggatg 366
<210> 104
<211> 361
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
tggtcagctt tctgtaatcg aaagagctaa aatgtttgat cttggtcatt tgacagttct 60
gcatacatgt aactagtgtt tcttattagg actctgtctt ttccctatag tgtgggagat 120
caagaattgt tacaaatctc ccctcaagga accagggatg aaatcagttt ggattctgca 180
aaaattttca aaactgaaaa actcatatat tcagtatttt actcccacag cacctccccc 240
caatttgacc cacagggacc cccatccagg tgcagggtcc tcgcctgtgt acagggcaca 300
cctttggtca ctccaaattc ccagagctcc cagggtcctt ctcagggtct ccacctggat 360
g 361
<210> 105
<211> 293
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
gttgttctag cagtgaagag ataaagaaaa aaaagtacaa ccaaatgcca gtcaggcaca 60
gcagaaacct acaactcttg gaaggtaaag aacctgcaac tggagccaag aagagttttt 120
caaaactgaa aaactcatat attcagtatt ttactcccac agcacctccc cccaatttga 180
cccacaggga cccccatcca ggtgcagggt cctcgcctgt gtacagggca cacctttggt 240
cactccaaat tcccagagct cccagggtcc ttctcagggt ctccacctgg atg 293
<210> 106
<211> 268
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
gctagaggaa aactttgagg aacattcaat gtcacctgta agagaaatgg gaaatgagaa 60
cattccaagt acagtgagca caattagccg tttttcaaaa ctgaaaaact catatattca 120
gtattttact cccacagcac ctccccccaa tttgacccac agggaccccc atccaggtgc 180
agggtcctcg cctgtgtaca gggcacacct ttggtcactc caaattccca gagctcccag 240
ggtccttctc agggtctcca cctggatg 268
<210> 107
<211> 282
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
taaggtgaag cagcatctgg gtgtgagagt gaaacaagcg tctctgaaga cagctcaggg 60
ctatcctctc agagtgacat tttaaccact caggtaaaaa gcgtgttttc aaaactgaaa 120
aactcatata ttcagtattt tactcccaca gcacctcccc ccaatttgac ccacagggac 180
ccccatccag gtgcagggtc ctcgcctgtg tacagggcac acctttggtc actccaaatt 240
cccagagctc ccagggtcct tctcagggtc tccacctgga tg 282
<210> 108
<211> 279
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
gtcatcccct tctaaatgcc catcattaga tgataggtgg tacatgcaca gttgctctgg 60
gagacttcag aatagaaact acccatctca agaggagctc atttttcaaa actgaaaaac 120
tcatatattc agtattttac tcccacagca cctcccccca atttgaccca cagggacccc 180
catccaggtg cagggtcctc gcctgtgtac agggcacacc tttggtcact ccaaattccc 240
agagctccca gggtccttct cagggtctcc acctggatg 279
<210> 109
<211> 367
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
ttctgagctg tgtgctagag gtaactcatg ataatggaat atttgattta atttcagatg 60
ctcgtgtaca agtttgccag aaaactccac atcactttaa ctaatctaat tactgaagag 120
actactcatg ttgttatgaa aacaggtata ccaagaacct ttacagaata ccttgcatct 180
gctgcataaa ttttcaaaac tgaaaaactc atatattcag tattttactc ccacagcacc 240
tccccccaat ttgacccaca gggaccccca tccaggtgca gggtcctcgc ctgtgtacag 300
ggcacacctt tggtcactcc aaattcccag agctcccagg gtccttctca gggtctccac 360
ctggatg 367
<210> 110
<211> 357
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
aaagagcacg ttcttctgct gtatgtaacc tgtcttttct atgatctctt taggggtgac 60
ccagtcaatt aaagaaagaa aaatgctgaa tgaggtaagt acttgatgtt acaaactaac 120
cagagatatt cattcagtca tatagttaaa aatgtatttg cttccttcca tcaatgcacc 180
ttttcaaaac tgaaaaactc atatattcag tattttactc ccacagcacc tccccccaat 240
ttgacccaca gggaccccca tccaggtgca gggtcctcgc ctgtgtacag ggcacacctt 300
tggtcactcc aaattcccag agctcccagg gtccttctca gggtctccac ctggatg 357
<210> 111
<211> 319
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
aagtgacagt tccagtagtc ctactttgac actttgaatg ctctttcctt cctggggatc 60
cagggtgtcc acccaattga ggttgtgcag ccagatgcct ggacagagga caatggcttc 120
catggtaagg tgcctgcatg tattttcaaa actgaaaaac tcatatattc agtattttac 180
tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg cagggtcctc 240
gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca gggtccttct 300
cagggtctcc acctggatg 319
<210> 112
<211> 292
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
gtggttcggc tttcaccagt ctgtgcgccc tgccatgtgg aagatgatgc tcaacattga 60
tggtgtgtgg ggagagctat ggagccaggg gcaccccaag tccagtgacc acaccttttc 120
aaaactgaaa aactcatata ttcagtattt tactcccaca gcacctcccc ccaatttgac 180
ccacagggac ccccatccag gtgcagggtc ctcgcctgtg tacagggcac acctttggtc 240
actccaaatt cccagagctc ccagggtcct tctcagggtc tccacctgga tg 292
<210> 113
<211> 259
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
ggtcagctct tcccttcatc acatacttgg agaacaaagg acaccgttat ccatgctttt 60
tcaacacatt acatgtggga ggttttcaaa actgaaaaac tcatatattc agtattttac 120
tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg cagggtcctc 180
gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca gggtccttct 240
cagggtctcc acctggatg 259
<210> 114
<211> 368
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
cagagggata ccatgcaaca taacctgata aagctccagc aggaaatggc tgatctagaa 60
gctgtgttag aacagcatgg gagccagcct tctaacagct acccttccat cataagtgac 120
acttctgccc ttgaggacct gcgaaatcca gaacaaagca catcagaaaa aggtgtgtat 180
tgttggccaa attttcaaaa ctgaaaaact catatattca gtattttact cccacagcac 240
ctccccccaa tttgacccac agggaccccc atccaggtgc agggtcctcg cctgtgtaca 300
gggcacacct ttggtcactc caaattccca gagctcccag ggtccttctc agggtctcca 360
cctggatg 368
<210> 115
<211> 366
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
tctcctgaac atctaaaaga tgaagtttct atcatccaaa gtatgggcta cagaaaccgt 60
gcctaaagac ttctacagag tgaacccgaa aatccttcct tggtaaaacc atttgttttc 120
ttcttcttct tcttcttctt ttcttttttt tttctttttt ttttttgaga tggagtcttg 180
ctctgtggct tttcaaaact gaaaaactca tatattcagt attttactcc cacagcacct 240
ccccccaatt tgacccacag ggacccccat ccaggtgcag ggtcctcgcc tgtgtacagg 300
gcacaccttt ggtcactcca aattcccaga gctcccaggg tccttctcag ggtctccacc 360
tggatg 366
<210> 116
<211> 360
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
ttcaggagga aaagcacaga actggccaac aattgcttga ctgttcttta ccatactgtt 60
tagcaggaaa ccagtctcag tgtccaactc tctaaccttg gaactgagag aactctgagg 120
acaaagcagc ggatacaacc tcaaaagacg tctgtctaca ttgaattggg taagggtctc 180
aggttttcaa aactgaaaaa ctcatatatt cagtatttta ctcccacagc acctcccccc 240
aatttgaccc acagggaccc ccatccaggt gcagggtcct cgcctgtgta cagggcacac 300
ctttggtcac tccaaattcc cagagctccc agggtccttc tcagggtctc cacctggatg 360
<210> 117
<211> 355
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
tgtgaatttt ctgagacgga tgtaacaaat actgaacatc atcaacccag taataatgat 60
ttgaacacca ctgagaagcg tgcagcagag aggcatccag aaaagtatca gggtagttct 120
gtttcaaact tgcatgtgga gccatgtggc acaaatactc atgccagctc attacagctt 180
ttcaaaactg aaaaactcat atattcagta ttttactccc acagcacctc cccccaattt 240
gacccacagg gacccccatc caggtgcagg gtcctcgcct gtgtacaggg cacacctttg 300
gtcactccaa attcccagag ctcccagggt ccttctcagg gtctccacct ggatg 355
<210> 118
<211> 371
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
aaagcagatt tggcagttca aaagactcct gaaatgataa atcagggtac taaccaaacg 60
gagcagaatg gtcaagtgat gaatattact aatagtggtc atgagaataa aacaaaaggt 120
gattctattc agaatgagaa aaatcctaac ccaatagaat cactcgaaaa agaatctgct 180
ttcaaaacga aagcttttca aaactgaaaa actcatatat tcagtatttt actcccacag 240
cacctccccc caatttgacc cacagggacc cccatccagg tgcagggtcc tcgcctgtgt 300
acagggcaca cctttggtca ctccaaattc ccagagctcc cagggtcctt ctcagggtct 360
ccacctggat g 371
<210> 119
<211> 337
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
tttttagcaa aagcgtccag aaaggagagc ttagcaggag tcctagccct ttctcccata 60
cacatttggc tcagggttac cgaagagggg ccaagaaatt agagtcctca gaagagaact 120
tatctagtga ggatgaagag cttccctgct tccaacactt ttttcaaaac tgaaaaactc 180
atatattcag tattttactc ccacagcacc tccccccaat ttgacccaca gggaccccca 240
tccaggtgca gggtcctcgc ctgtgtacag ggcacacctt tggtcactcc aaattcccag 300
agctcccagg gtccttctca gggtctccac ctggatg 337
<210> 120
<211> 368
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
cagagggata ccatgcaaca taacctgata aagctccagc aggaaatggc tgatctagaa 60
gctgtgttag aacagcatgg gagccagcct tctaacagct acccttccat cataagtgac 120
acttctgccc ttgaggacct gcgaaatcca gaacaaagca catcagaaaa aggtgtgtat 180
tgttggccaa attttcaaaa ctgaaaaact catatattca gtattttact cccacagcac 240
ctccccccaa tttgacccac agggaccccc atccaggtgc agggtcctcg cctgtgtaca 300
gggcacacct ttggtcactc caaattccca gagctcccag ggtccttctc agggtctcca 360
cctggatg 368
<210> 121
<211> 329
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
tttgttttct cattccattt aaagcagtat taacttcaca gaaaagtagt gaatacccta 60
taagccagaa tccagaaggc cattctgctg acaagtttga ggtgtctgca gatagttcta 120
ccagtaaaaa taaagaacca ggagtggaaa ggttttcaaa actgaaaaac tcatatattc 180
agtattttac tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg 240
cagggtcctc gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca 300
gggtccttct cagggtctcc acctggatg 329
<210> 122
<211> 284
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
aacttctccc attcctttca gagggaaccc cttacctgga atctggaatc tgcctcttct 60
ctgatgaccc tgaatctgat ccttctgaag acagagcccc agagtcattt tcaaaactga 120
aaaactcata tattcagtat tttactccca cagcacctcc ccccaatttg acccacaggg 180
acccccatcc aggtgcaggg tcctcgcctg tgtacagggc acacctttgg tcactccaaa 240
ttcccagagc tcccagggtc cttctcaggg tctccacctg gatg 284
<210> 123
<211> 315
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
gctctttagc ttcttaggac agcacttcct gattttgttt tcaacttcta atcctttgag 60
tgtttttcat tctgcagatg ctgagtttgt gtgtgtacgg acactgaaat attttctagg 120
aattgcggga ggaaaatgtt ttcaaaactg aaaaactcat atattcagta ttttactccc 180
acagcacctc cccccaattt gacccacagg gacccccatc caggtgcagg gtcctcgcct 240
gtgtacaggg cacacctttg gtcactccaa attcccagag ctcccagggt ccttctcagg 300
gtctccacct ggatg 315
<210> 124
<211> 333
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
tgacgtgtct gctccacttc cattgaagga agcttctctt tctcttatcc tgatgggttg 60
tgtttggttt ctttcagcat gattttgaag tcagaggaga tgtggtcaat ggatgaaacc 120
accaaggtcc aaagcgagca agagaatccc aggacatttt caaaactgaa aaactcatat 180
attcagtatt ttactcccac agcacctccc cccaatttga cccacaggga cccccatcca 240
ggtgcagggt cctcgcctgt gtacagggca cacctttggt cactccaaat tcccagagct 300
cccagggtcc ttctcagggt ctccacctgg atg 333
<210> 125
<211> 286
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
ttcccctgtc cctctctctt cctctcttct tccagatctt cagggggcta gaaatctgtt 60
gcaatgggcc cttcaccaac atgcccacag gtaagagcct gggagaacct tttcaaaact 120
gaaaaactca tatattcagt attttactcc cacagcacct ccccccaatt tgacccacag 180
ggacccccat ccaggtgcag ggtcctcgcc tgtgtacagg gcacaccttt ggtcactcca 240
aattcccaga gctcccaggg tccttctcag ggtctccacc tggatg 286
<210> 126
<211> 353
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
ggtagagggc ctgggttaag tatgcagatt actgcagtga ttttacatct aaatgtccat 60
tttagatcaa ctggaatgga tggtacagct gtgtggtgct tctgtggtgt aggagctttc 120
atcattcacc cttggcacag taagtattgg gtgccctgtc agagagggag gacacatttt 180
caaaactgaa aaactcatat attcagtatt ttactcccac agcacctccc cccaatttga 240
cccacaggga cccccatcca ggtgcagggt cctcgcctgt gtacagggca cacctttggt 300
cactccaaat tcccagagct cccagggtcc ttctcagggt ctccacctgg atg 353
<210> 127
<211> 292
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
gtggttcggc tttcaccagt ctgtgcgccc tgccatgtgg aagatgatgc tcaacattga 60
tggtgtgtgg ggagagctat ggagccaggg gcaccccaag tccagtgacc acaccttttc 120
aaaactgaaa aactcatata ttcagtattt tactcccaca gcacctcccc ccaatttgac 180
ccacagggac ccccatccag gtgcagggtc ctcgcctgtg tacagggcac acctttggtc 240
actccaaatt cccagagctc ccagggtcct tctcagggtc tccacctgga tg 292
<210> 128
<211> 259
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
ggtcagctct tcccttcatc acatacttgg agaacaaagg acaccgttat ccatgctttt 60
tcaacacatt acatgtggga ggttttcaaa actgaaaaac tcatatattc agtattttac 120
tcccacagca cctcccccca atttgaccca cagggacccc catccaggtg cagggtcctc 180
gcctgtgtac agggcacacc tttggtcact ccaaattccc agagctccca gggtccttct 240
cagggtctcc acctggatg 259
<210> 129
<211> 262
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
agcaacctgt tacatattaa agttttatta tactacattt ttctacatcc tttgttttag 60
ggtgttgatt gcctttgctc agtatttttc aaaactgaaa aactcatata ttcagtattt 120
tactcccaca gcacctcccc ccaatttgac ccacagggac ccccatccag gtgcagggtc 180
ctcgcctgtg tacagggcac acctttggtc actccaaatt cccagagctc ccagggtcct 240
tctcagggtc tccacctgga tg 262

Claims (10)

1.一种用于检测基因长片段拷贝数变异的方法,包括如下步骤:
(1)采用DNA提取试剂盒提取待测样本的人基因组DNA;
(2)以待测样本的人基因组DNA为模板,添加人工内标,通过多重PCR扩增反应,获得人基因组DNA的扩增产物和人工内标的扩增产物;
(3)将扩增反应的产物通过虾碱性磷酸酶反应,除去多余的脱氧核糖核苷三磷酸;
(4)将步骤(3)的产物通过延伸反应,在延伸引物的3’端延伸一个碱基,得到人基因组DNA的延伸产物和人工内标的延伸产物;
(5)将延伸反应的产物通过树脂纯化,脱盐;
(6)将脱盐后的产物点样在质谱芯片基质上共结晶,再将晶体转入质谱仪的真空管,用激光激发进行MassARRAY飞行时间质谱检测;
(7)根据MassARRAY飞行时间质谱检测得到的FREQ数据,计算拷贝数变异系数(TR值),并判断基因片段的拷贝数。
2.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(2)中人工内标为合成的双链DNA片段或含有合成的双链DNA片段的质粒;其中合成的双链DNA片段与待测样本的目标扩增片段只有1个碱基不同,并且两个片段上不同的碱基均与延伸引物的3’端相邻。
3.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(2)得到的人基因组DNA的扩增产物、人工内标的扩增产物均包含目标检测基因片段以及内参基因的片段;目标检测基因片段的长度为70-600bp;内参基因为RNaseP、EIF2C1、ALB、GAPDH中的一种或几种。
4.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(2)中,多重PCR扩增反应的体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、UNG酶以及PCR酶。
5.根据权利要求4所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:PCR引物Pool为目标检测基因扩增引物、内参基因扩增引物的混合物。
6.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(3)中,虾碱性磷酸酶反应的体系包括SAP酶以及SAP Buffer。
7.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(4)中,延伸反应的体系包括Buffer Plus、Termination Mix、延伸引物混合物以及iPLEXEnzyme;其中,延伸引物混合物为与步骤(2)中人基因组DNA的扩增产物、人工内标的扩增产物的序列相匹配的延伸引物混合物,且延伸引物混合物中任意一条延伸引物在3’端延伸一个碱基,得到相应的延伸产物。
8.根据权利要求1所述的一种用于检测基因长片段拷贝数变异的方法,其特征在于:步骤(7)中,根据MassARRAY飞行时间质谱检测,得到两个质谱峰,用两个质谱峰的FREQ数据根据下列公式进行计算,可以得到拷贝数变异系数(TR值);其中,两个质谱峰分别为人基因组DNA(gDNA)片段的峰以及人工内标片段的峰;目标检测基因片段的人工内标拷贝数、内参基因片段的人工内标拷贝数为添加进入体系的拷贝数;
Figure FDA0003161151690000021
Figure FDA0003161151690000022
Figure FDA0003161151690000023
Figure FDA0003161151690000024
Figure FDA0003161151690000025
Figure FDA0003161151690000026
Figure FDA0003161151690000027
Figure FDA0003161151690000028
根据拷贝数变异系数TR值,当TR≤0.65时,待测样本目标检测基因片段为缺失阳性;当0.8<TR<1.2时,待测样本目标检测基因片段拷贝数正常,结果为阴性;当TR≥1.5时,待测样本目标检测基因片段为重复阳性。
9.一种基于权利要求1-8任一项所述的用于检测基因长片段拷贝数变异的方法的试剂盒,其特征在于:包括样品检测孔W1和样品检测孔W2;样品检测孔W1内含有W1多重PCR反应体系、SAP反应体系以及W1延伸反应体系;W1多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标、UNG酶以及PCR酶;其中人工内标的序列如SEQ ID NO:100-114所示;样品检测孔W2内含有W2多重PCR反应体系、SAP反应体系以及W2延伸反应体系;W2多重PCR反应体系包括PCR Buffer、MgCl2、dNTPs、dUTP、PCR引物Pool、人工内标、UNG酶和PCR酶;其中人工内标的序列如SEQ ID NO:115-129所示。
10.根据权利要求9所述的试剂盒,其特征在于:W1多重PCR反应体系中PCR引物Pool的序列如SEQ ID NO:34-65所示;W1延伸反应体系包括Buffer Plus、Termination Mix、W1延伸引物混合物以及iPLEX Enzyme;W1延伸引物混合物的序列如SEQ ID NO:1-16所示;W2多重PCR反应体系中PCR引物Pool的序列如SEQ ID NO:66-99所示;W2延伸反应体系包括Buffer Plus、Termination Mix、W2延伸引物混合物以及iPLEX Enzyme;W2延伸引物混合物的序列如SEQ ID NO:17-33所示;SAP反应体系包括SAP酶以及SAP Buffer。
CN202110791634.3A 2020-11-26 2021-07-13 一种用于检测基因长片段拷贝数变异的方法 Active CN113403371B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020113518391 2020-11-26
CN202011351839.1A CN112501266A (zh) 2020-11-26 2020-11-26 一种用于检测brca1基因长片段拷贝数变异的试剂盒

Publications (2)

Publication Number Publication Date
CN113403371A true CN113403371A (zh) 2021-09-17
CN113403371B CN113403371B (zh) 2024-04-16

Family

ID=74966517

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202011351839.1A Pending CN112501266A (zh) 2020-11-26 2020-11-26 一种用于检测brca1基因长片段拷贝数变异的试剂盒
CN202110791634.3A Active CN113403371B (zh) 2020-11-26 2021-07-13 一种用于检测基因长片段拷贝数变异的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202011351839.1A Pending CN112501266A (zh) 2020-11-26 2020-11-26 一种用于检测brca1基因长片段拷贝数变异的试剂盒

Country Status (1)

Country Link
CN (2) CN112501266A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102517282A (zh) * 2011-12-30 2012-06-27 中国人民解放军军事医学科学院放射与辐射医学研究所 一种富集分离内源转录因子及其复合物的方法及其专用转录因子串联结合序列
CN106191269A (zh) * 2016-07-22 2016-12-07 上海产业技术研究院 通用型brca1基因多重pcr建库试剂盒
US20180340234A1 (en) * 2017-05-26 2018-11-29 Life Technologies Corporation Methods and systems to detect large rearrangements in brca1/2

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102517282A (zh) * 2011-12-30 2012-06-27 中国人民解放军军事医学科学院放射与辐射医学研究所 一种富集分离内源转录因子及其复合物的方法及其专用转录因子串联结合序列
CN106191269A (zh) * 2016-07-22 2016-12-07 上海产业技术研究院 通用型brca1基因多重pcr建库试剂盒
US20180340234A1 (en) * 2017-05-26 2018-11-29 Life Technologies Corporation Methods and systems to detect large rearrangements in brca1/2

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PRAMOD GAUTAM等: "Spectrum of large copy number variations in 26 diverse Indian populations: potential involvement in phenotypic diversity", 《HUM GENET》, pages 1 - 13 *
UMI SHAKINA HARIDAN等: "A Comparison of Assays for Accurate Copy Number Measurement of the Low-Affinity Fc Gamma Receptor Genes FCGR3A and FCGR3B", 《PLOS ONE》, vol. 0116791, pages 1 - 13 *

Also Published As

Publication number Publication date
CN112501266A (zh) 2021-03-16
CN113403371B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN102329876B (zh) 一种测定待检测样本中疾病相关核酸分子的核苷酸序列的方法
KR101074841B1 (ko) 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 진단용키트 및 칩
CN102703595B (zh) 一种碱基选择性可控延伸的str序列高通量检测方法及其检测试剂
CN109022579B (zh) 染色体1p/19q杂合性缺失的检测方法、试剂盒及引物组
CN103898199A (zh) 一种高通量核酸分析方法及其应用
CN108070658B (zh) 检测msi的非诊断方法
JP2014519310A (ja) Dnaメチル化のデジタル配列分析
EP3029148B1 (en) Method for determining nucleic acid composition of nucleic acid mixture
JP2013090622A (ja) 多型検出用プローブ、多型検出方法、薬効判定方法及び多型検出用キット
CN105463116A (zh) 一种基于20个三等位基因snp遗传标记的法医学复合检测试剂盒及检测方法
Perucho et al. [18] Fingerprinting of DNA and RNA by arbitrarily primed polymerase chain reaction: Applications in cancer research
JP2018528780A (ja) 短いホモポリマー反復の改良された検出
CA2905461C (en) Method for detecting cystic fibrosis
CN111893192B (zh) 混合检材分析微单倍型复合扩增体系及构建及单倍型频率
KR101387663B1 (ko) 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 검출방법
CN112342303A (zh) 一种基于ngs的人类y染色体str和snp遗传标记联合检测体系及检测方法
EP3722444B1 (en) Method for determining rcc subtypes
CN113403371B (zh) 一种用于检测基因长片段拷贝数变异的方法
CN113416769B (zh) 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途
JP2007202552A (ja) 核酸における点変異及び/又は大規模変更をアッセイするための方法及び組成物、並びに遺伝疾病及び癌の診断におけるそれらの使用
CN103103267B (zh) 检测人21号染色体str基因型的试剂盒
EP1092782B1 (en) Genetic screening method and genetic screening apparatus
CN111020034B (zh) 新型的诊断肿瘤的标志物及其应用
De Lellis et al. Combined use of MLPA and nonfluorescent multiplex PCR analysis by high performance liquid chromatography for the detection of genomic rearrangements
CN102134595A (zh) 样品中核酸质量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant