CN102952794B

CN102952794B - 靶向基因dna分子探针的制备方法

Info

Publication number: CN102952794B
Application number: CN201210324630.5A
Authority: CN
Inventors: 方园
Original assignee: Zhangjiagang Indigo Plant Thing Engineering Co Ltd Of Reviving
Current assignee: Hangzhou Derlead Biotech Co ltd
Priority date: 2012-09-05
Filing date: 2012-09-05
Publication date: 2015-02-25
Anticipated expiration: 2032-09-05
Also published as: CN102952794A

Abstract

本发明公开了靶向基因DNA分子探针的制备方法，其将网路生物医学信息学和实验室分子生物学有机的结合起来，通过使用网路的或计算机的生物医学信息学工具，来确定人类基因组中疾病基因序列或正常基因序列，剔除其中的非特异的重复DNA片断，保留独特的和特异的疾病基因序列或者基因组特有的正常基因序列。整个DNA探针制作过程包括两大程序：第一程序是将基因的DNA序列确定并排除非特异性重复片段，第二程序是在第一程序的设计和指导下，应用实验室分子生物学的手段将此DNA探针实际地制造出来。本发明制造的探针可用于在福尔马林固定、石蜡包埋的组织和细胞切片以及细胞涂片的临床病理标本上进行以形态学为基础的原位杂交反应包括荧光原位杂交和非荧光的显色原位杂交，用于各级各类疾病基因的检测和诊断，还可用于正常人类基因和非人类基因的测定。

Description

靶向基因DNA分子探针的制备方法

技术领域

本发明属于生物医学技术领域，涉及将基于计算机的生物医学信息学和实验室分子生物学结合起来以制备靶向基因DNA分子探针的方法。

背景技术

人类基因组测序工程于1990年正式启动，经过多个国家的数百名科学家和工程技术人员的共同努力，于2001年发表了初稿，并于2006年最后完成，历时十六年，耗资上百亿美元。这一工程的完工，将第一个也是最重要的一个哺乳动物，即我们人类自己的整个基因组的图谱展现在我们眼前，其中包括所有22对常染色体（1-22）和两个性染色体（X，Y）的DNA序列，共计大约32亿核苷酸碱基。同时揭示人类蛋白质编码的基因大约有二万至二万五千个，其核苷酸序列的总长度仅占整个基因组长度的1.9%。这些基因不均等地分散分布在基因组的各个角落，参见图1。此外，占基因组绝大部分的碱基是一些有序或无序的重复序列，有些重复序列具有明显的规律，比如，5-8个碱基循环出现构成到100-200个碱基的集团，然后这个集团又在不同的基因组中出现，由于此类DNA碱基可以在任意（无规律）基因组DNA中出现，如图2，因此，如果所制作的进行杂交的DNA分子探针中含有此类重复序列，则信号会在所有染色体基因或细胞中出现，所得结果就被混淆，这类杂交信号即被称为干扰信号或背景信号。因此，如何去除这些重复片段，成为一个问题。

随着人类基因组测序工程的完成以及后基因组时代的到来，生物医学的科学研究和技术发展进入了一个前所未有的新时期，这对医疗保健的发展和进步提供了空前的机遇，对生物医学高科技的研究和应用也提出了巨大的挑战。生物医学基础研究也不再是一个独立的概念，而是时时刻刻都与医疗保健相关联。如何将基础研究的成果用于临床？如何开展具有明确医药用途的科学研究即基础与临床转化性的研究(transitional research)?是目前每一位生物医学研究人员都在考虑的问题。由于基因的异常与多种疾病都相关，例如肿瘤，心血管疾病，遗传病，中枢神经退行性疾病，视网膜黄斑变性，血液病，代谢营养性疾病，自体免疫性疾病，内分泌性疾病如糖尿病，等等。另外，对于传染性疾病，如病毒，细菌感染，也要研究其基因结构，表达方式及蛋白产物，才能深刻地理解疾病的发生，发展和转归，才能进行更好的治疗，又如爱滋病（人类免疫缺陷病毒，Human immunodeficient virus,HIV），乙型肝炎病毒(Hepatitis Bvirus,HBV)，结核病(tuberculosis,TB)等等。在疾病的诊断上，用基因及其产物进行诊断，包括肿瘤（人类基因）和感染性疾病（微生物基因），已显现广阔的应用前景。其结果更加准确，迅速，安全，可靠。基因诊断亦称分子诊断，是由人类基因组序列工程与其它致病性病源微生物和病源体的基因序列弄清楚以后所衍生出来的诊断领域，其历史虽然不长，已显示出强大的生命力。其发展速度非常快，其范围也囊括几乎所有医学领域。目前临床上已在使用的，以感染性疾病，肿瘤及心血管疾病最多。其中肿瘤病理学的“分子诊断”是一个重要的分支。根治肿瘤仍然是一世界性难题，但针对致癌基因的“靶向治疗”是目前最有效的肿瘤治疗战略之一。配合靶向治疗的“伴侣诊断”是目前国际上最新的肿瘤分子诊断方法。它通过对疾病分子标志物进行检测，对靶向治疗中病人的筛选及预后的观察起关键性作用。

在过去的60年里，有关DNA的技术层出不穷，使得对DNA的检测成为可能，比如于1969年发明的荧光原位杂交（FISH）技术（Gall and Pardue，PNAS 1969)，1972年发明的分子克隆技术（Cohen,Chang and Hsu,PNAS 1972)以及1985年发明的PCR技术（Saiki RK et al,Science 1985;Jeffreys,Wilsonand Thein,Nature 1985)等等。此外，伴随人类基因组测序工程的进展，为了能够充分的分析，研究，分享和应用DNA序列的成果，计算机软件及基因网络系统得到了很好的开发。比如，1990年发明的基础局部搜索DNA同源序列的工具-比较基因组学的关键技术BLAST（Altschul SF et al,J.Mol.Biol.1990)和2002年开始运行的UCSC基因组浏览器(Kent WJ and Colleagues,GenomeRes.2002)，都是很好的研究应用工具。这使得任何研究人员都能够再次利用并开发和发展DNA序列，并将其用到实际应用当中。本发明的靶向基因DNA分子探针的制备方法就是在分析，比较和应用以上这些技术的基础上诞生的。

发明内容

本发明的目的是提供将基于计算机的生物医学信息学和实验室分子生物学结合起来来制作具有特异性序列的DNA分子探针的方法，制备出的DNA分子探针能够与整个靶向基因的所有特异性DNA序列进行DNA-DNA杂交，起到准确探测、识别疾病基因和正常基因的作用。DNA分子探针的制备方法包括两大程序：

第一程序：利用基于计算机的生物信息学手段来获得靶向基因的特异性DNA 序列，并设计出相应PCR引物

第一程序包括以下步骤：

（1）在公共基因库上搜索到靶向基因的基因组位置，然后识别出该靶向基因的编码序列和非编码序列（即外显子和内含子的区域），剔除掉其中的非特异性重复序列，获得覆盖整个靶向基因的特异性DNA序列，该特异性DNA序列为不连续的多个DNA片段；

位于外显子的编码序列一般都是特异性序列，即该基因所特有的（在少数情况下，有些基因的外显子编码序列也会与其同一家族的其它基因序列有非常大的同源性，应有所注意，在设计探针时因避免使用）。位于内含子的非编码序列又分成特异性序列和非特异性序列，前者是该基因所特有的，在制作探针时应当保留，后者一般由有序或无序的重复DNA序列构成，在制作DNA探针时应当去除。下面列出的一些重复序列，在基因组的许多基因内含子的区域中都存在，应当避免用在探针里。

重复序列1：

tgaatttcccagcctccagaactatgggaaataaatttctgttgtttacaagtaaatcattttatgttattttgttacagaagcccaaaaagatgaagacatacaccagatcactccattctcttcttgcttgcatggtttctgaggatacgttggatgtaattctaatattctctataggtattttctttatggctcct

重复序列2：

aagctccagtatacctaaacaagtgcaaatttgtttaagtacagttatttgtggtagcattagtcattgttttcaatagcaagaagaaaaaggaaacaac

重复序列3：

catcaaaaatcggttaccataaaatcctaatagttgaagagatgtaatttcaattatttggtaaacctgaccttcattgtcaaagc

重复序列4：

ttttcctgtgtctctgcaaccacaggcccctctcctttctcttaataaagataccagtcattgagtttgaaaattgctaagagagtctgttgtaaatctt

重复序列5：

cttagcacaaaaaaaaatgacagatatgtgaagtggtagatatattaattagtttgatttgatcactccgctatgtgtataaatgtcaaaacaaacattg

重复序列6：

taggaaagtgattggcttttgtatgttaacgttgtatcctgctcacttgctataactgcttattagttccaggagcttttttattgtttcttttggattttctaagagacaattacattatcagtgaacaaacacgatttatttcttccc

重复序列7：

ctttgttcctgattttagctataggtttttgtagctgttctttattaagttgaggatatccttctctattcttagtttgctgagaatttttatcatgaat

重复序列8：

aggtaattctggcttcacaaaattaattatggagtcttccctctacttctagtttctggaagagattgtagagaatggatgtaatttctttcttaaatgt

重复序列9：

ttctttcatttctgatattcataatttgtgtattctctctttgtttcttagcctggtgagaggcttataaattttattgattttttgaagaatcactttttggttttgctgattttcttgctgggattataggcgtgagccaccacactc

重复序列10：

aaaaagtccaggcattagctaggactgtgcctgtagtcccagctactcaggaggctgagatgagaagatcaccggagcctagaaatttgaggctgcagtgggctgtgatcatgtcacttcactcctgcctagaagacagttagaccctgc

ctctaaaataaacaagcaaataaataaaaagaaaggaagaaaagaagagcaagggcagcaaatagaaaatagtaataaatatggtagctattaatccaactatgtcaataattaccttaaatgttagtggtctaaatatactgcaatgga

在确定并去除了非特异性重复序列后，将靶向基因的特异性DNA序列包括编码和非编码的特异性DNA序列下载下来，此时这部分的DNA序列由于去除了其中的非特异性片段，则成为不连续的许多大小不同的DNA片段，有些基因可能包含一百多个特异性DNA片段，如人类PTEN基因即含有126个长度在150bp-4666bp的DNA特异性片段。

（2）在得到靶向基因的特异性序列片段之后，再利用网上提供的公共引物设计工具或利用其它非网上的计算机软件，给靶向基因的特异性DNA序列中每一个DNA片段设计出成对PCR引物，引物长度为18-25个碱基，至此完成了第一程序的工作。

在第一程序中，在确定好特定靶基因的前提下，用基因数据库（genebank)中的工具（实际上是网络中的软件，也即生物医学信息学方法）来发现并确定该特定基因的DNA序列，比如在哪一个染色体上，整个基因在该染色体上的跨度范围和大小，其中有没有非特异性重复序列，有多少，在其上游和下游有没有其他基因存在，离其有多远等等，然后将该基因及其两边一定范围内的DNA序列下载下来，在下载的同时，识别该基因序列中所含的非特异性重复序列（repetitive sequence)，因为这些序列可在其他染色体的多个部位存在，是造成非特异性杂交信号的主要原因，因此，必须踢除它们。由于重复序列甚至在同一个基因序列中多处存在，必须一一剔出，结果使我们最终得到的特异性DNA序列成为多个小的DNA片段。目前国内外还没有人用这种方法来获得某个靶基因的、不含任何非特异性重复序列的，非常纯的，能覆盖整个靶基因的基因组DNA序列，这属于本发明的创新点。

第二程序：是在第一程序的设计和指导下，应用实验室分子生物学的手段将DNA分子探针实际地制造出来

第二程序包括以下步骤：

（1）以正常组织的基因组DNA为模板，利用第一程序的步骤（2）中设计出的PCR引物，用PCR方法扩增出第一程序的步骤（1）中确定的靶向基因的特异性DNA序列，扩增出的特异性DNA序列含有靶向基因的所有特异信息；

（2）利用扩增出的特异性DNA序列制造特异性的DNA分子探针，该DNA分子探针能够与整个靶向基因的所有特异性DNA序列进行DNA-DNA杂交。

第一步：确定序列并剔出重复序列，1-2天，设计引物，1-2天；

第二步：PCR扩增目的基因1-2天，其实这时的

步骤（1）扩增出的PCR产物已经能够直接用来标记探针和进行原位杂交实验了。但为了建立稳定的探针来源，使其永久地，不断地提供探针，将步骤（1）扩增出的PCR产物克隆，即将步骤（1）中扩增出的特异性DNA序列中每一个DNA片段均克隆到一个质粒载体上，克隆的质粒用作永久、稳定地特异性DNA序列来源，用PCR方法多次连续扩增所有质粒中克隆的DNA片段，其中每次扩增后的产物均进行稀释后再进行下次扩增，连续三次，最后一次扩增的产物即为未标记的DNA分子探针。

装在质粒载体中的DNA比PCR产物DNA要稳定得多，将永远不会降解或丢失。克隆这一步大约需1-2周时间，再加上第一程序中确定序列并剔出重复序列需要1-2天，设计引物需要1-2天，以及第二程序中PCR扩增目的基因需要1-2天，这样总共只需不到3周的时间就可以建立某个靶基因的DNA探针的永久货源。而且，质粒DNA的扩增可以大规模进行，比PCR方法的产量和稳定性都要好，而且成本要低得多。本发明特异性强、周期短、效率高、成本低，可大规模生产探针、促进试剂盒的产业化、用于各种疾病分子病理诊断。

在将DNA片段克隆到质粒中后，经小量扩增提取质粒中插入的DNA片段，进行鉴定，保证正确后，扩增大量提取质粒DNA。克隆的质粒将会提供永久的DNA来源。待所有DNA片段都获得克隆之后，每个克隆的质粒按插入片段的大小分别取出一小份混合到一起，在该质粒的插入片段的两端设计一对引物，或用质粒载体所特有的引物，比如M13引物或T7和SP6引物，用PCR的方法同时扩增所有的插入片段，其产物经过凝胶电泳检测，产物的大小范围与最初确认的DNA片段的大小范围应当一致，或者对扩增的产物进行测序保证所克隆片段的正确。产物经过1：1000稀释后，再次用PCR扩增，总共三次，以达到稳定的产物。最后一次PCR的产物就作为未标记的探针。此次PCR产物经过纯化后，用TE缓冲液(10mM,pH 8.5)按每批所需要的量分装后，储藏到-20℃冰箱。

在第二程序中，将第一程序获得的靶向基因的特异性基因组DNA序列（genomic DNA sequence of targeted gene，已不含有非特异性重复序列，或仅含有微量成分，小于0.1%)，纯度达99.9%，用分子生物学的分子克隆的方法，将每一个上面纯的DNA序列都克隆了，所得结果，我们将获得与众不同的，已经过处理过的，包含靶向基因所有特异信息的DNA片段。用这一DNA（含多个小的DNA片段）来制作特异性很高的DNA探针（其特征是虽然由多个小的DNA片段组成，但合起来覆盖整个靶基因），用于疾病如肿瘤病理分子诊断，即在病理组织细胞切片和细胞涂片上的原位杂交方法的诊断包括荧光原位杂交和非荧光的显色原位杂交。该DNA探针不同于其他种类的探针，不是RNA探针（RNA-RNA杂交），也不是cDNA探针（cDNA-RNA,或cDNA-DNA杂交），也不是仅仅与基因组DNA中的靶基因的某个特定编码序列的杂交，而是与整个靶基因的所有特异性DNA序列的DNA-DNA杂交，包括编码序列和非编码的特异序列。

本发明用克隆的办法加上测序，保证了所做的探针的序列准确无误，并且通过质粒的扩增，可得到大量且稳定的DNA探针来源，一旦做好以后，将给标记探针永久提供DNA模板，且保持序列不会改变，而且本发明在第一程序的步骤（1）中就将非特异性重复序列剔出了，因此不需要反复抽提和FISH的测试（参见参考文献1、2、3），本专利方法周期短，成本低，适合于大规模生产探针。

附图说明

附图1显示了基因组中基因分散在不同的区域中，基因和基因之间有大片的非基因区段，图示人类Y染色体0-59Mbp区段中散布着19个基因，每个基因之间有较大的空间。

附图2为本发明所列的重复序列1（200bp)作为问讯DNA序列到基因数据库去扫描后，所得结果显示，在人类基因组中有为数众多染色体在不同程度上都与这一重复序列有同源性（74%-100%），其部位与长短大多没有规律，这是引起DNA-DNA杂交的主要背景来源。

附图3为DNA靶向分子探针技术的总体路线图。

附图4为pCR^TM 质粒载体多克隆位点DNA序列图谱。

具体实施方式

下面结合附图来进一步阐述本发明的结构。

具体实施例：人类PTEN DNA探针的制作

人类PTEN(Phosphatase and Tensin homolog deleted from chromosome ten)基因是一个肿瘤抑制基因，是继p53之后第二个在肿瘤中最常发生突变的基因。该基因在正常胚胎发育和保持染色体的稳定性方面起非常重要的作用。该基因在许多疾病的病理发生上起非常重要的作用，例如糖尿病(diabetes)，呆小症（autism),以及几乎所有肿瘤均有关，已明确的肿瘤有神经胶质瘤，乳腺癌，结肠癌，肺癌，前列腺癌，子宫内膜癌，神经胶质母细胞瘤和黑色素细胞瘤等等。

参见图3，整个制备方法包括两大程序，具体实施如下：

一、特异性DNA序列的获取，引物设计：

我们研制的PTEN基因探针，位于第10染色体长臂第23条区带（10q23）覆盖包括整个PTEN基因组位点在内的大约320kb的基因组区段，经过反复整合及筛选，去除非特异性DNA序列，最后选择大小不等的多片段基因序列（从150bp到4666bp），总的片段数目达到126个，其净长度为112kb。下表显示了PTEN基因片段的组成：

下面选择上表中五个片段说明如何设计引物：

1.PTEN016-1270bp

序列：

>chr10:89635406-89636675

CATGAGGTGGTATTCATTTATTCATATAGTTAGAACAAAAAATATTTAAAATATTGAGGTAGAAACAAATTAGTCTCTTTTTAATTAAAAGCCAGATTACTTGTTAGAGTAACATTTTCCCAAATGAGGTAAAATTGTTGCGACTGTTAAACTTAAGGAAATTTTGATCTAGGTGTGGTATATACCTTCTTGTGGGGTGCTAATGAAAACAGGGATGGCAAAAATATTTTGTTTGTGAGTGTATGCATTTATGCTTTTTGACAACCTAAGAAACACTCTTACATCTGAGTATCTTTCATGGACTAGCTGTAGGAAATCTATATAAAATAGCTTAGTATACTGAAAGTATGACATAGTTTTACATATCTAGATTGTGGTTGTGATTATATATAATACTATAAAATATGCTAACGTGCTGCTTAATAATACTATTTGGATTTTTTTTAATACTGAAAAGGTCACACAGATTGTGATTATTGTGTAGTGTCCAAGAACTAAGGCCTACCATCTGTTACTCAAATGTATGAAAAAGTTAAGATAATTTAGTGATATAAGTGGTTTTGACACCACTGTTTTTGGAATAATCTAATTATGATTTTTATAAAGACTAATATCAAATTTTAAACGTTTGCAAAAATGAAACCTAATAGTTATACTGTTATTTATATTTTTCTATTACAATACAGATACTGGCTGAGAACTAAAGATTGTGTAATAAACGCCTGGCCTTCAGTCATTTGGTTTTTTTTTTCCCTCGATTGTTTGGATAGTTAACTGGACATCATGTTTTAACTTGAGAAATTAAGTTATACAAGATTTTGATATTTTAAACTAGTTTTCCTAACTGGTTGAGATATATAAGAATTTAGTATTACAGGACTCAATCAGGGAACTGATTTAATAAGAATTTCTTAAAAATTTGTTTAAATATTTTTCAAGTTCTTTTCTTCATCTTCTACAACTTAATTCTTGTCTGTATGCAAATGAGCTTCCCCATTTAAAATTTTGCTGTTGCATTTTAGGCCACTATAGAAGTTGTTTCTTTAATTTTCACTCACAAGAATTTGGTCTTACCAAATTGTGTAAATCTTTAAAATTGTGTATTTGGCTTAATATTATAGAATCTGATTGATTTAATCTACCTTGTTTCATTTAGTATGTTGACATTTTCTTGAGAAATTTGTTATGCCAAATGATTAACATAATAATATTTTAAGTTTAGATATGATTTTGAATTTACATTTTCAAATGCAACTTTGTGTCTGTGGCC

2.PTEN015-1628bp

序列：

>chr10:89633751-89635378GCTAGTAGTTTTTAAAGTAATCCTTTTTCCTTTAATTATGTAGTTGTTGAACTGTTGGGAGTTACTTTTCTCTTACTATTTTGTTATTTAATGTATTCTTTGACCTTATGCTTTTTTATTCTAAAGCTGCTTTTATTATAGTCAGATATGATGAAGTTAAATGTACAATGTAAAATTGCAAATTTCCAACGAGCTATACAAACTTAAATATTTCTAAGTAAAGAAAATAGGGCTGACTCTAAGGTTCTTTGATCCATGTGTTGCATTCTTTTCTAGGCCCTAAATTTGCTATGCCAGCCTGTTGAATTAAAGTGCTTTATTTATCTAAATTAGAAACTTGTATTAAAGTGAAGTTTTAGAAAAAAAGAAACAAAATCGGAATGGAGTTTTAGGTTAGCCCAGAGATGGGAAGATGCCAAGAAGGTAGCTTTAGTGGATTCTGAATTTTTTGGTTTTGTTTTGTTTTTAGGGCAGGCAAATGTAATTACAAAAGGGTTCTAGGAATAGATTGCTGTGATTTTTTTTCTGTTTGCATGATTTTACAGTTTGCTTTGCCTCTCACTTTTGAATGCAGAATAAAATGTCAAGGCCTTATTTTTTTTTAAATTCTTAAGAAATTTAAGATTTGACTGTTAATTCCTTTTGAAATATGGGATATTTTGAGATACCAATTATTTAAGACAAATAGGACTCATTGTTACAATTCAGTTGAATAAGGCTTATGATGTTTATTTCAGTATATGAATGAAAACTATGTGCTTATTGTACTTAAGAAAATTTCTTTTATTAAAAACATGACTAAAGAGAATTTTAAAAATCACCCACTGTCCTACTTCTCTAAAACTTAATGTTTTCATATTAGCTTCCAGTTTTGTTCATATGCATATACTTTAAAACCTAGTTCATGGTGAACTTAAGAGGGTGTTCTTTTTAAAAAACAATTTCCATTGCACTTTGTCGTTGCCTTAATTAAATGGTGAAATCATCAGAAATATTTATTTTCCTATACTTATACATTTATTAAGCTTGTTTCCATTTTTTTATTTTGTGATTTTTTAAGTGGATTTAAGATAACCTAAACATTAGAGAGGATTTTCATGGTTTTGATTCATGAAATCATAATGTTATACAAACCTAACTGAAGTGTTAGAGCCTTGAAGATTTTTCCCCCGAATTACATATAGTAACTCTACTTGTATTTAATACTGAAAGCATATTTTACTTATTTAAGTGAGACAAAGTAAAATTTAGCTGAATACTTTAGATCTATCATTTCCTTTTCCTGTTGTAAGAACATTACATTGTGTTGAAATTAAAGTGGATATAGAAGGTAATTAGAATAAACTGCCACATCATTTTTATAGTAAAGTGGTAATAACACTATTGCTTTCTGTTTTTTTAATCAGAAGGAGTATGGGCTTATAATGATGTTACTGTTCCCTGAAGCATATTTTGAATGATACGGTTTATATTTGCACAGTTGCCCAGGTAATCATTGTGATATTAATTGATCAATTTGCTATTTATTTGCGTTTTAAATCAGTACTAGTATTTGTGCTTAAAAATTTTGCATATGTTTTATCAGATTTAATTTTTAAGTGTCAGATACTAAAACAAATAACCTTAAC

3.PTEN017-624bp

名称

序列（5’-3')

长度

开始

终止

Tm

GC%

产物长度

正向引物

TGGTGAGAACTGAATTGGAGGCT

23

78

100

55

47

逆向引物

ACACATAACACCTCTCACACCCT

23

276

254

55

47

199bp

序列：

>chr10:89636692-89637315

ACGAGAAACATCTTGCCAATTTTCAGATTAATCTGTGAGGAAAGTAGATTGGTTTACTAGACTCAGTTTGTAGACTTTGGTGAGAACTGAATTGGAGGCTATGAAAAAAATACCTTTTGGGCCTTTCTGAATAGACATATATACATAAATTATATCTCTTACATTAAGTGAGGCACATATGTAGGTGAGATTTTTACCTGAATATTAAAAGTTTAAAAGTCGTTACCTATTCTGTTTACTTAATAGTATTTAAAGGGTGTGAGAGGTGTTATGTGTTTCTGTCCCTTGTTTTTATTCCTATCCCTCCCATCTAACTGTTGGTACTCTTATCTTCCCAGGTATTAAACTTGTATGTTTTAAAAGCTTATTTACTTGTTGAAATGGTTAACTTAATTAGTTTTTTCTTTGAAGTTTCAGCCTAAATATTTTCTGTTTTTTTATATGTCCTTTAAATATGAAAATTCTACAGCTAATCATAATTAGTAATTGTACTTTTTCCCCTATTACAATAACTGGTTTCATAATAAAATGGTATCCCTTCAATAACAAGCATTTATAGTAGTTTATTAAAACTAAGGGTGTTATCTATTCAAACCAAGCAATGCAGACTTACTGTTGACTCTG

4.PTEN019-750bp

序列：

>chr10:89638106-89638855

TAAATTTTGATTGTTATTAGCAACTATAAAAGTTTTGCAGTTGGCTTATTGGAAAAAGAAAACCTCCTTGCCGGAGACGGAGACGCATTTGTATTAGAACTTTGTTTTCTGAGTACCTTACCTATAGTAGGTTTCAAATATTGGTGAATTAGTTGATGGTTAGGTCTGCATAATTACTGCGTATGGAAATTCTGGAACCCTATTTTTTCAAAATGCAGCTAATGTTGAGAGAATATGCACTAAATATTACTAGATCTTTGTTTTTCAAGATGCTGATATCCCTTAACATCTTCTGCACTTTACCTGTTTGAATATCTTTTTTGCTGTAAAAATTAGTGGCCTTATGTCTTTCTGCATAATTATAGAGTAGCCAAAACCTGTTTTAGGTTAATCACCTCTGGCAAAATAAATGATAAAAGCATAGCTTTTGTAAGCAGAATGATATTACAGAAGTTAACTTATAAATCTAAGTGTATTAAAGACACTTAGGAAATTTATGATAATGCTGGGTCAGCATTACAGTTTTAACTTTTTACAGTTTTTCATATGCTTTTTTTGTGATTTTGCTGTAGAAAATTAACAGTTGGCATTTGGCTTAGTTCAAGTATAATGCTGTTGACAAGTATATCTGACACGTCATTGAACTAATAATATTTTTGAAAGCTGATAGGTAAGTTATATCTATTTTGTTTCATTCGTCATTAGTGATCGGTCTTAGATGTTTTTAGCGAGAGCAAAACTGTAGAGGAA

5.PTEN021-1323bp

序列：

>chr10:89641965-89643287

GACAAATTGTTCTTAAATAATGAACAGTTGGCACTTTTTCAACTGGAAAATTCAAGGAACTGCTCTTTCTGCTTTCTGCTCAATATGAATCTTCAATTTAGAAATGAGAGTCCATCATTAACAATTCAACATAGCTTATTAATAGGAAAAAAAAACCTAGTAACAAATGTAAAATCTTTGATTAAATGAGAAAGTCATAGAAGTTCATCAGATTTGTATTTAAAGCATGATTTCATTAGAAAAGTTGATAATAAGGATTTAACTGTGACATAATTGGAAAATACTTGTTTAAACTTAAAATTTTGAAAAGAAATGTAAATGTGATGTAACTTATGAATCAGTGGTTGAGTTTCTTTTTTGCTCACAAGAACCCTAACTGTGTGTTACTTGAAAGCACTGATGGAAATCAGGGAAAAAGCTCCAGAAGTTCCTACGAAATAAAATTAAATGATAAAGTCCTGGTATCTGCTAACTTGCCTTCCATTCCTGTTATCTTTTCTTCTTAGTCTGACTTCATTAATTCTTTCACCCTGGCTACTGGTTTAGCTCAGTGTTTTATGAGCCAGGCAGCTTCAGACTTTGCTTTTGATGCTCTTTGTTCATTACCTCTAAAGCTGTATTATCACTTTCATTTTATCATTAATGTTTCATGTATATGTTATAGTTTCATATTGTTACTGCAACTTTTACTTAGCTATAATTTAAAAAATATCTGTGATCTGTGGAAATAATTATTCTATGGCAGAAAAGTAGTTATTGCATTTTACTTTATAAGTTGTTTAAGGATAAGCATACCTATATATTAAGCACTACAAAGAAACTTTTACAATGGCTTTATTTTTAGCAAACCATCATAGTTAAAATAAGATTTAGTGTACATGTCAGGAACACAGTCTTATGAAATAAGGTTTAGGGAGCTATTTTTAGTTACTATATCCTACTTGAAAATTGTAGTTAAATTTCTAGCATATACCCTATTAATTTAGATGCAAGTACAGATTTGAGATAAGGTAGATACATTATTTGGATGTCAACTCGGAAGTTGTTCAAGAAAAGATATTTTGTTATTTAGATGTAACTTGGAACATATTTCTAGTGTTTCAAGTCATGATTGTATGCCTAGAACAGGCAATAAAAATTTACTTAGCTGGTAAAACAGCCACATTATTTCAAATATAGTTTAGTTATATTATGGATTAAATTGATTTTTGTGGACAGACTTTAGAACTTAATTGCTATTAATTACATTTTTTCTTTGGGACGGTATTTGTTCTTTGGTGAGAAAGGATTCTTGTAACACCTAAATCAAGACTGTCCAAACAT

二、以人类正常组织基因组DNA为模板扩增所选的特异性靶基因片段人类正常组织提取的基因组DNA可以从BioServe购买。

1、用设计好的引物进行PCR反应，条件如下：

该步PCR的反应条件为：

95℃，3分钟；

95℃，20秒，55-60℃（依实际引物为准），30秒，72℃1-5分钟（依片段的大小来定），共35次循环；

72℃，5分钟，保持在12℃。

上述各个PCR产物经凝胶电泳检查确认只有单一产物，且量和长度都符合要求，则进入下一步PCR产物的克隆与探针制作。

2、将PCR产物克隆到载体中

用TAKi t含pCR^TM 质粒载体和质粒小量提取试剂盒（Quick Plasmid Miniprep Kit）（Cat#K4500-02，Invitrogen,CA,USA)，质粒载体的图谱见图4.

克隆的步骤如下：

1）所需材料：

（1）TOPO载体与PCR产物的克隆混合物；

（2）LB培养板（含50μg/ml青霉素或50μg/ml卡那霉素）；

（3）40mg/mlX-gal(溶在二甲基哑酚中,DMF);

(4)42℃水浴；

（5）37℃细菌摇床和37℃温箱；

（6）其它消毒的用于细菌的材料，如细菌涂板等等；

（7）S.O.C.培养液。

2）设置克隆反应液：

将反应液混匀在室温下孵育5-10分钟，然后放置冰上备用。

3）准备转染细菌

（1）将水浴设置到42℃；

（2）将S.O.C.培养液保育到室温；

（3）将含50-100μg/ml青霉素的LB培养板放置37℃30分钟；

（4）将40mg/ml X-gal均匀涂到LB培养板的表面，放置37℃温箱备用；

（5）在冰上溶化化学感受态细胞，每个转染克隆一个管（50μl)

4）进行化学转染细菌的程序

（1）在上述化学感受态细胞中加入2μl上述克隆反应液，轻微混均；

（2）在冰上孵育5-30分钟；

（3）在42℃水浴给于细胞热休克30秒，不要摇；

（4）立即将细胞转至冰上；

（5）加250μl置于室温的S.O.C.培养液：

（6）盖紧管盖在37℃水平摇床孵育1小时，摇速每分钟200次；

（7）在预温的LB培养板上均匀涂上已转染并孵育的细胞混悬液10-50μl；

（8）在37℃温箱中孵育8-12小时；

（9）在转染克隆的同时，单独设一管细胞，转染对照质粒pUC19(10pg/μl)做为程序阳性对照，另放一管不加任何质粒做为阴性对照。

5）鉴定克隆结果：

（1）挑选6-8个菌落，放入含50μg/ml青霉素的LB液体培养液，放置37℃摇床每分钟250转培养过夜；

（2）用质粒小量提取试剂盒，提取克隆的质粒；

（3）用限制性内切酶分析克隆的质粒，然后用电泳检查插入片段的大小，方向看是否存在所设计的克隆片段；

（4）为进一步确实所克隆的片段，可将提取的质粒经过纯化后进行测序，用M13引物来做，引物的序列如下：

M13正向引物：5′-GTAAAACGACGGCCAG-3′或

M13逆向引物：5′-CAGGAAACAGCTATGAC-3′

6）用PCR方法扩增所克隆的片段，将其产物做为未标记的DNA探针：

待所有设计的DNA片段都得到克隆完毕之后，将它们按比例混合在一起，然后直接用上述M13引物对，将插入片段予以扩增，连续三次，每次扩增后的产物按1：1000稀释，最后一次的PCR产物，在电泳上检查是否扩增的均匀，大小范围是否正确，然后用PCR纯化柱纯化该产物，并在UV分光光度计上测量DNA的量（260/280nm波长），用TE缓冲液(10mM,pH 8.5)按每批所需要的量分装后放-20℃冰箱长期储存。此阶段的DNA为多个DNA片段的集合，可做为未标记的DNA探针。

该靶向基因DNA分子探针的制备方法，将基于网路生物医学信息学和基于实验室分子生物学结合起来，制作具有特异序列的人类基因组DNA探针，探测肿瘤病人或正常人群中肿瘤生物标志物基因或正常基因。该探针能够用于但不限于肿瘤的伴侣诊断或称伴随诊断（Companion Diagnostics)，该诊断是在福尔马林固定、石蜡包埋的组织和细胞切片以及细胞涂片的临床病理标本上进行以形态学为基础的原位杂交反应包括荧光原位杂交和非荧光的显色原位杂交。DNA靶向分子探针技术的关键点，是用基于网路的或基于计算机的生物医学信息学工具来确定人类肿瘤生物标志物基因序列，这些序列是独特的和特异的肿瘤靶基因序列。用于作为探针的这些序列应该不含有非特异的重复DNA片断，因为它们是在临床标本上进行DNA-DNA杂交时引起非特异性背景增高的主要原因。应用DNA靶向分子探针技术制作的与肿瘤生物标志物基因相匹配的特异性探针，将从基因序列中剔除非特异的重复DNA片断。因此，DNA探针制作过程完全用计算机程序控制和设计，并指导实际用分子生物学的方法在实验室制造探针的整个过程。创新点在于可以直接设计探针序列，排除了内源性干扰序列，避免了非特异性杂交信号，探针的纯度可以达到99.9%。因此，其特异性强、灵敏度高，且探针制作周期短、效率高、成本低。用本技术制作的探针进行的临床病理标本或正常人群的标本的体外诊断或普查可用于但不限于个体化医学的伴侣诊断，以此指导：（1）肿瘤病人靶向治疗的药物选择；（2）对新的或已知的肿瘤生物标志物开发新的药物；（3）监测药物治疗前，治疗中及治疗后疾病的转归和预后；（4）用于肿瘤防治过程中的癌前病变；（5）用于病理学中肿瘤的分子分型和分类；（6）用于染色体核型以及染色体末端长度的测定。应用本技术，可以满足日益增长的对肿瘤分子标志物进行检测的需要，也将对肿瘤的靶向治疗起到推动作用。

参考文献：

1.Jon M.Davison,Thomas W.Morgan,Bae-Li Hsi,Sheng Xiao,andJonathan A.Fletcher:Subtracted,Unique-Sequence,In Situ HybridizationExperimental and Diagnostic Applications.American Journal of Pathology,Vol.153,No.5,November 1998.

2.Jeffrey M.Craig ·Jürgen Kraus ·Thomas Cremer:Removal ofrepetitive sequences from FISH probes using PCR-assisted affinitychromatography.Hum Genet(1997)100:472–476

3.D.PINKEL*,J.LANDEGENTt,C.COLLINS,J.FUSCOEt,R.SEGRAVES,J.LUCAS,AND J.GRAY:Fluorescence in situ hybridization with humanchromosome-specific libraries:Detection of trisomy 21 andtranslocations of chromosome 4.Proc.Nati.Acad.Sci.USA Vol.85,pp.9138-9142,December 1988

SEQUENCE LISTING

<110> 张家港蓝苏生物工程有限公司

<120> 靶向基因DNA分子探针的制备方法

<160> 29

<170> PatentIn version 3.3

<210> 1

<211> 200

<212> DNA

<213> 人工序列

<400> 1

tgaatttccc agcctccaga actatgggaa ataaatttct gttgtttaca agtaaatcat 60

tttatgttat tttgttacag aagcccaaaa agatgaagac atacaccaga tcactccatt 120

ctcttcttgc ttgcatggtt tctgaggata cgttggatgt aattctaata ttctctatag 180

gtattttctt tatggctcct 200

<210> 2

<211> 100

<212> DNA

<213> 人工序列

<400> 2

aagctccagt atacctaaac aagtgcaaat ttgtttaagt acagttattt gtggtagcat 60

tagtcattgt tttcaatagc aagaagaaaa aggaaacaac 100

<210> 3

<211> 86

<212> DNA

<213> 人工序列

<400> 3

catcaaaaat cggttaccat aaaatcctaa tagttgaaga gatgtaattt caattatttg 60

gtaaacctga ccttcattgt caaagc 86

<210> 4

<211> 100

<212> DNA

<213> 人工序列

<400> 4

ttttcctgtg tctctgcaac cacaggcccc tctcctttct cttaataaag ataccagtca 60

ttgagtttga aaattgctaa gagagtctgt tgtaaatctt 100

<210> 5

<211> 100

<212> DNA

<213> 人工序列

<400> 5

cttagcacaa aaaaaaatga cagatatgtg aagtggtaga tatattaatt agtttgattt 60

gatcactccg ctatgtgtat aaatgtcaaa acaaacattg 100

<210> 6

<211> 150

<212> DNA

<213> 人工序列

<400> 6

taggaaagtg attggctttt gtatgttaac gttgtatcct gctcacttgc tataactgct 60

tattagttcc aggagctttt ttattgtttc ttttggattt tctaagagac aattacatta 120

tcagtgaaca aacacgattt atttcttccc 150

<210> 7

<211> 100

<212> DNA

<213> 人工序列

<400> 7

ctttgttcct gattttagct ataggttttt gtagctgttc tttattaagt tgaggatatc 60

cttctctatt cttagtttgc tgagaatttt tatcatgaat 100

<210> 8

<211> 100

<212> DNA

<213> 人工序列

<400> 8

aggtaattct ggcttcacaa aattaattat ggagtcttcc ctctacttct agtttctgga 60

agagattgta gagaatggat gtaatttctt tcttaaatgt 100

<210> 9

<211> 150

<212> DNA

<213> 人工序列

<400> 9

ttctttcatt tctgatattc ataatttgtg tattctctct ttgtttctta gcctggtgag 60

aggcttataa attttattga ttttttgaag aatcactttt tggttttgct gattttcttg 120

ctgggattat aggcgtgagc caccacactc 150

<210> 10

<211> 300

<212> DNA

<213> 人工序列

<400> 10

aaaaagtcca ggcattagct aggactgtgc ctgtagtccc agctactcag gaggctgaga 60

tgagaagatc accggagcct agaaatttga ggctgcagtg ggctgtgatc atgtcacttc 120

actcctgcct agaagacagt tagaccctgc ctctaaaata aacaagcaaa taaataaaaa 180

gaaaggaaga aaagaagagc aagggcagca aatagaaaat agtaataaat atggtagcta 240

ttaatccaac tatgtcaata attaccttaa atgttagtgg tctaaatata ctgcaatgga 300

<210> 11

<211> 20

<212> DNA

<213> 人工序列

<400> 11

aaacgcctgg ccttcagtca 20

<210> 12

<211> 22

<212> DNA

<213> 人工序列

<400> 12

ggccacagac acaaagttgc at 22

<210> 13

<211> 25

<212> DNA

<213> 人工序列

<400> 13

gggtgctaat gaaaacaggg atggc 25

<210> 14

<211> 22

<212> DNA

<213> 人工序列

<400> 14

ccaaatgact gaaggccagg cg 22

<210> 15

<211> 1270

<212> DNA

<213> 人工序列

<400> 15

catgaggtgg tattcattta ttcatatagt tagaacaaaa aatatttaaa atattgaggt 60

agaaacaaat tagtctcttt ttaattaaaa gccagattac ttgttagagt aacattttcc 120

caaatgaggt aaaattgttg cgactgttaa acttaaggaa attttgatct aggtgtggta 180

tataccttct tgtggggtgc taatgaaaac agggatggca aaaatatttt gtttgtgagt 240

gtatgcattt atgctttttg acaacctaag aaacactctt acatctgagt atctttcatg 300

gactagctgt aggaaatcta tataaaatag cttagtatac tgaaagtatg acatagtttt 360

acatatctag attgtggttg tgattatata taatactata aaatatgcta acgtgctgct 420

taataatact atttggattt tttttaatac tgaaaaggtc acacagattg tgattattgt 480

gtagtgtcca agaactaagg cctaccatct gttactcaaa tgtatgaaaa agttaagata 540

atttagtgat ataagtggtt ttgacaccac tgtttttgga ataatctaat tatgattttt 600

ataaagacta atatcaaatt ttaaacgttt gcaaaaatga aacctaatag ttatactgtt 660

atttatattt ttctattaca atacagatac tggctgagaa ctaaagattg tgtaataaac 720

gcctggcctt cagtcatttg gttttttttt tccctcgatt gtttggatag ttaactggac 780

atcatgtttt aacttgagaa attaagttat acaagatttt gatattttaa actagttttc 840

ctaactggtt gagatatata agaatttagt attacaggac tcaatcaggg aactgattta 900

ataagaattt cttaaaaatt tgtttaaata tttttcaagt tcttttcttc atcttctaca 960

acttaattct tgtctgtatg caaatgagct tccccattta aaattttgct gttgcatttt 1020

aggccactat agaagttgtt tctttaattt tcactcacaa gaatttggtc ttaccaaatt 1080

gtgtaaatct ttaaaattgt gtatttggct taatattata gaatctgatt gatttaatct 1140

accttgtttc atttagtatg ttgacatttt cttgagaaat ttgttatgcc aaatgattaa 1200

cataataata ttttaagttt agatatgatt ttgaatttac attttcaaat gcaactttgt 1260

gtctgtggcc 1270

<210> 16

<211> 23

<212> DNA

<213> 人工序列

<400> 16

agcccagaga tgggaagatg cca 23

<210> 17

<211> 23

<212> DNA

<213> 人工序列

<400> 17

aggcaacgac aaagtgcaat gga 23

<210> 18

<211> 1628

<212> DNA

<213> 人工序列

<400> 18

gctagtagtt tttaaagtaa tcctttttcc tttaattatg tagttgttga actgttggga 60

gttacttttc tcttactatt ttgttattta atgtattctt tgaccttatg cttttttatt 120

ctaaagctgc ttttattata gtcagatatg atgaagttaa atgtacaatg taaaattgca 180

aatttccaac gagctataca aacttaaata tttctaagta aagaaaatag ggctgactct 240

aaggttcttt gatccatgtg ttgcattctt ttctaggccc taaatttgct atgccagcct 300

gttgaattaa agtgctttat ttatctaaat tagaaacttg tattaaagtg aagttttaga 360

aaaaaagaaa caaaatcgga atggagtttt aggttagccc agagatggga agatgccaag 420

aaggtagctt tagtggattc tgaatttttt ggttttgttt tgtttttagg gcaggcaaat 480

gtaattacaa aagggttcta ggaatagatt gctgtgattt tttttctgtt tgcatgattt 540

tacagtttgc tttgcctctc acttttgaat gcagaataaa atgtcaaggc cttatttttt 600

tttaaattct taagaaattt aagatttgac tgttaattcc ttttgaaata tgggatattt 660

tgagatacca attatttaag acaaatagga ctcattgtta caattcagtt gaataaggct 720

tatgatgttt atttcagtat atgaatgaaa actatgtgct tattgtactt aagaaaattt 780

cttttattaa aaacatgact aaagagaatt ttaaaaatca cccactgtcc tacttctcta 840

aaacttaatg ttttcatatt agcttccagt tttgttcata tgcatatact ttaaaaccta 900

gttcatggtg aacttaagag ggtgttcttt ttaaaaaaca atttccattg cactttgtcg 960

ttgccttaat taaatggtga aatcatcaga aatatttatt ttcctatact tatacattta 1020

ttaagcttgt ttccattttt ttattttgtg attttttaag tggatttaag ataacctaaa 1080

cattagagag gattttcatg gttttgattc atgaaatcat aatgttatac aaacctaact 1140

gaagtgttag agccttgaag atttttcccc cgaattacat atagtaactc tacttgtatt 1200

taatactgaa agcatatttt acttatttaa gtgagacaaa gtaaaattta gctgaatact 1260

ttagatctat catttccttt tcctgttgta agaacattac attgtgttga aattaaagtg 1320

gatatagaag gtaattagaa taaactgcca catcattttt atagtaaagt ggtaataaca 1380

ctattgcttt ctgttttttt aatcagaagg agtatgggct tataatgatg ttactgttcc 1440

ctgaagcata ttttgaatga tacggtttat atttgcacag ttgcccaggt aatcattgtg 1500

atattaattg atcaatttgc tatttatttg cgttttaaat cagtactagt atttgtgctt 1560

aaaaattttg catatgtttt atcagattta atttttaagt gtcagatact aaaacaaata 1620

accttaac 1628

<210> 19

<211> 23

<212> DNA

<213> 人工序列

<400> 19

tggtgagaac tgaattggag gct 23

<210> 20

<211> 23

<212> DNA

<213> 人工序列

<400> 20

acacataaca cctctcacac cct 23

<210> 21

<211> 624

<212> DNA

<213> 人工序列

<400> 21

acgagaaaca tcttgccaat tttcagatta atctgtgagg aaagtagatt ggtttactag 60

actcagtttg tagactttgg tgagaactga attggaggct atgaaaaaaa taccttttgg 120

gcctttctga atagacatat atacataaat tatatctctt acattaagtg aggcacatat 180

gtaggtgaga tttttacctg aatattaaaa gtttaaaagt cgttacctat tctgtttact 240

taatagtatt taaagggtgt gagaggtgtt atgtgtttct gtcccttgtt tttattccta 300

tccctcccat ctaactgttg gtactcttat cttcccaggt attaaacttg tatgttttaa 360

aagcttattt acttgttgaa atggttaact taattagttt tttctttgaa gtttcagcct 420

aaatattttc tgttttttta tatgtccttt aaatatgaaa attctacagc taatcataat 480

tagtaattgt actttttccc ctattacaat aactggtttc ataataaaat ggtatccctt 540

caataacaag catttatagt agtttattaa aactaagggt gttatctatt caaaccaagc 600

aatgcagact tactgttgac tctg 624

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<400> 22

aacctccttg ccggagacgg 20

<210> 23

<211> 23

<212> DNA

<213> 人工序列

<400> 23

tcctctacag ttttgctctc gct 23

<210> 24

<211> 750

<212> DNA

<213> 人工序列

<400> 24

taaattttga ttgttattag caactataaa agttttgcag ttggcttatt ggaaaaagaa 60

aacctccttg ccggagacgg agacgcattt gtattagaac tttgttttct gagtacctta 120

cctatagtag gtttcaaata ttggtgaatt agttgatggt taggtctgca taattactgc 180

gtatggaaat tctggaaccc tattttttca aaatgcagct aatgttgaga gaatatgcac 240

taaatattac tagatctttg tttttcaaga tgctgatatc ccttaacatc ttctgcactt 300

tacctgtttg aatatctttt ttgctgtaaa aattagtggc cttatgtctt tctgcataat 360

tatagagtag ccaaaacctg ttttaggtta atcacctctg gcaaaataaa tgataaaagc 420

atagcttttg taagcagaat gatattacag aagttaactt ataaatctaa gtgtattaaa 480

gacacttagg aaatttatga taatgctggg tcagcattac agttttaact ttttacagtt 540

tttcatatgc tttttttgtg attttgctgt agaaaattaa cagttggcat ttggcttagt 600

tcaagtataa tgctgttgac aagtatatct gacacgtcat tgaactaata atatttttga 660

aagctgatag gtaagttata tctattttgt ttcattcgtc attagtgatc ggtcttagat 720

gtttttagcg agagcaaaac tgtagaggaa 750

<210> 25

<211> 25

<212> DNA

<213> 人工序列

<400> 25

ggaactgctc tttctgcttt ctgct 25

<210> 26

<211> 23

<212> DNA

<213> 人工序列

<400> 26

gcaaagtctg aagctgcctg gct 23

<210> 27

<211> 1323

<212> DNA

<213> 人工序列

<400> 27

gacaaattgt tcttaaataa tgaacagttg gcactttttc aactggaaaa ttcaaggaac 60

tgctctttct gctttctgct caatatgaat cttcaattta gaaatgagag tccatcatta 120

acaattcaac atagcttatt aataggaaaa aaaaacctag taacaaatgt aaaatctttg 180

attaaatgag aaagtcatag aagttcatca gatttgtatt taaagcatga tttcattaga 240

aaagttgata ataaggattt aactgtgaca taattggaaa atacttgttt aaacttaaaa 300

ttttgaaaag aaatgtaaat gtgatgtaac ttatgaatca gtggttgagt ttcttttttg 360

ctcacaagaa ccctaactgt gtgttacttg aaagcactga tggaaatcag ggaaaaagct 420

ccagaagttc ctacgaaata aaattaaatg ataaagtcct ggtatctgct aacttgcctt 480

ccattcctgt tatcttttct tcttagtctg acttcattaa ttctttcacc ctggctactg 540

gtttagctca gtgttttatg agccaggcag cttcagactt tgcttttgat gctctttgtt 600

cattacctct aaagctgtat tatcactttc attttatcat taatgtttca tgtatatgtt 660

atagtttcat attgttactg caacttttac ttagctataa tttaaaaaat atctgtgatc 720

tgtggaaata attattctat ggcagaaaag tagttattgc attttacttt ataagttgtt 780

taaggataag catacctata tattaagcac tacaaagaaa cttttacaat ggctttattt 840

ttagcaaacc atcatagtta aaataagatt tagtgtacat gtcaggaaca cagtcttatg 900

aaataaggtt tagggagcta tttttagtta ctatatccta cttgaaaatt gtagttaaat 960

ttctagcata taccctatta atttagatgc aagtacagat ttgagataag gtagatacat 1020

tatttggatg tcaactcgga agttgttcaa gaaaagatat tttgttattt agatgtaact 1080

tggaacatat ttctagtgtt tcaagtcatg attgtatgcc tagaacaggc aataaaaatt 1140

tacttagctg gtaaaacagc cacattattt caaatatagt ttagttatat tatggattaa 1200

attgattttt gtggacagac tttagaactt aattgctatt aattacattt tttctttggg 1260

acggtatttg ttctttggtg agaaaggatt cttgtaacac ctaaatcaag actgtccaaa 1320

cat 1323

<210> 28

<211> 16

<212> DNA

<213> 人工序列

<400> 28

gtaaaacgac ggccag 16

<210> 29

<211> 17

<212> DNA

<213> 人工序列

<400> 29

caggaaacag ctatgac 17

Claims

1.一种靶向基因DNA分子探针的制备方法，其特征在于：包括

第一程序，其利用基于计算机的生物信息学手段来获得靶向基因的特异性DNA序列，并设计出相应PCR引物；

第二程序，其根据第一程序的设计应用分子生物学手段来制造DNA分子探针；

所述第一程序包括以下步骤：

(1)在公共基因库上搜索到靶向基因的基因组位置，然后识别出该靶向基因的编码序列和非编码序列，剔除掉其中的非特异性重复序列，获得覆盖整个靶向基因的特异性DNA序列，该特异性DNA序列为不连续的多个DNA片段；

(2)给靶向基因的特异性DNA序列中每一个DNA片段设计出成对PCR引物，引物长度为18-25个碱基；

所述第二程序包括以下步骤：

(1)以正常组织的基因组DNA为模板，利用第一程序的步骤(2)中设计出的PCR引物，用PCR方法扩增出第一程序的步骤(1)中确定的靶向基因的特异性DNA序列，扩增出的特异性DNA序列含有靶向基因的所有特异信息；

(2)利用扩增出的特异性DNA序列制造特异性的DNA分子探针，该DNA分子探针能够与整个靶向基因的所有特异性DNA序列进行DNA-DNA杂交；

在第二程序的步骤(2)中，将步骤(1)中扩增出的特异性DNA序列中每一个DNA片段均克隆到一个质粒载体上，克隆的质粒用作永久、稳定地特异性DNA序列来源，用PCR方法多次连续扩增所有质粒中克隆的DNA片段，其中每次扩增后的产物均进行稀释后再进行下次扩增，连续三次，最后一次扩增的产物即为未标记的DNA分子探针。

2.根据权利要求1所述的靶向基因DNA分子探针的制备方法，其特征在于：设计所述靶向基因为人类肿瘤抑制基因-PTEN基因，通过所述第一程序的步骤(1)获得的特异性DNA序列为126个长度在150bp-4666bp的特异性DNA片段。

3.根据权利要求2所述的靶向基因DNA分子探针的制备方法，其特征在于：所述PTEN基因的特异性DNA序列中一个DNA片段的序列为

由此设计出两对PCR引物，其中一对引物的序列如下：

正向引物：5'-AAACGCCTGGCCTTCAGTCA-3'

逆向引物：5'-GGCCACAGACACAAAGTTGCAT-3'

另外一对引物的序列如下：

正向引物：5'-GGGTGCTAATGAAAACAGGGATGGC-3'

逆向引物：5'-CCAAATGACTGAAGGCCAGGCG-3'，

所述PTEN基因的特异性DNA序列中另外一个DNA片段的序列为

GCTAGTAGTTTTTAAAGTAATCCTTTTTCCTTTAATTATGTAGTTGTTGAACTGTTGGGAGTTACTTTTCTCTTACTATTTTGTTATTTAATGTATTCTTTGACCTTATGCTTTTTTATTCTAAAGCTGCTTTTATTATAGTCAGATATGATGAAGTTAAATGTACAATGTAAAATTGCAAATTTCCAACGAGCTATACAAACTTAAATATTTCTAAGTAAAGAAAATAGGGCTGACTCTAAGGTTCTTTGATCCATGTGTTGCATTCTTTTCTAGGCCCTAAATTTGCTATGCCAGCCTGTTGAATTAAAGTGCTTTATTTATCTAAATTAGAAACTTGTATTAAAGTGAAGTTTTAGAAAAAAAGAAACAAAATCGGAATGGAGTTTTAGGTTAGCCCAGAGATGGGAAGATGCCAAGAAGGTAGCTTTAGTGGATTCTGAATTTTTTGGTTTTGTTTTGTTTTTAGGGCAGGCAAATGTAATTACAAAAGGGTTCTAGGAATAGATTGCTGTGATTTTTTTTCTGTTTGCATGATTTTACAGTTTGCTTTGCCTCTCACTTTTGAATGCAGAATAAAATGTCAAGGCCTTATTTTTTTTTAAATTCTTAAGAAATTTAAGATTTGACTGTTAATTCCTTTTGAAATATGGGATATTTTGAGATACCAATTATTTAAGACAAATAGGACTCATTGTTACAATTCAGTTGAATAAGGCTTATGATGTTTATTTCAGTATATGAATGAAAACTATGTGCTTATTGTACTTAAGAAAATTTCTTTTATTAAAAACATGACTAAAGAGAATTTTAAAAATCACCCACTGTCCTACTTCTCTAAAACTTAATGTTTTCATATTAGCTTCCAGTTTTGTTCATATGCATATACTTTAAAACCTAGTTCATGGTGAACTTAAGAGGGTGTTCTTTTTAAAAAACAATTTCCATTGCACTTTGTCGTTGCCTTAATTAAATGGTGAAATCATCAGAAATATTTATTTTCCTATACTTATACATTTATTAAGCTTGTTTCCATTTTTTTATTTTGTGATTTTTTAAGTGGATTTAAGATAACCTAAACATTAGAGAGGATTTTCATGGTTTTGATTCATGAAATCATAATGTTATACAAACCTAACTGAAGTGTTAGAGCCTTGAAGATTTTTCCCCCGAATTACATATAGTAACTCTACTTGTATTTAATACTGAAAGCATATTTTACTTATTTAAGTGAGACAAAGTAAAATTTAGCTGAATACTTTAGATCTATCATTTCCTTTTCCTGTTGTAAGAACATTACATTGTGTTGAAATTAAAGTGGATATAGAAGGTAATTAGAATAAACTGCCACATCATTTTTATAGTAAAGTGGTAATAACACTATTGCTTTCTGTTTTTTTAATCAGAAGGAGTATGGGCTTATAATGATGTTACTGTTCCCTGAAGCATATTTTGAATGATACGGTTTATATTTGCACAGTTGCCCAGGTAATCATTGTGATATTAATTGATCAATTTGCTATTTATTTGCGTTTTAAATCAGTACTAGTATTTGTGCTTAAAAATTTTGCATATGTTTTATCAGATTTAATTTTTAAGTGTCAGATACTAAAACAAATAACCTTAAC

由此设计出的PCR引物的序列如下：

正向引物：5'-AGCCCAGAGATGGGAAGATGCCA-3'

逆向引物：5'-AGGCAACGACAAAGTGCAATGGA-3'，

所述PTEN基因的特异性DNA序列中第三个DNA片段的序列为

由此设计出的PCR引物的序列如下：

正向引物：5'-TGGTGAGAACTGAATTGGAGGCT-3'

逆向引物：5'-ACACATAACACCTCTCACACCCT-3'，

所述PTEN基因的特异性DNA序列中第四个DNA片段的序列为

由此设计出的PCR引物的序列如下：

正向引物：5'-AACCTCCTTGCCGGAGACGG-3'

逆向引物：5'-TCCTCTACAGTTTTGCTCTCGCT-3'，

所述PTEN基因的特异性DNA序列中第五个DNA片段的序列为

由此设计出的PCR引物的序列如下：

正向引物：5'-GGAACTGCTCTTTCTGCTTTCTGCT-3'

逆向引物：5'-GCAAAGTCTGAAGCTGCCTGGCT-3'。

4.根据权利要求1所述的靶向基因DNA分子探针的制备方法，其特征在于：在所述第一程序的步骤(1)中，剔除掉的非特异性重复序列能够为

或

ctctaaaataaacaagcaaataaataaaaagaaaggaagaaaagaagagcaagggcagcaaatagaaaatagtaataaatatggtagctattaatccaactatgtcaataattaccttaaatgttagtggtctaaatatactgcaatgga。

5.根据权利要求1所述的靶向基因DNA分子探针的制备方法，其特征在于：所述靶向基因为人类、非人类动物、植物或微生物的疾病基因或正常基因，疾病的种类包括：肿瘤、心脑血管疾病、内分泌及代谢性疾病、免疫淋巴系统疾病、遗传性疾病、神经系统疾病、血液系统疾病、组织器官及个体发育性疾病、泌尿和生殖系统疾病、骨关节肌肉运动系统疾病、老年性疾病、呼吸和消化系统疾病、皮肤病、眼耳鼻舌身的感觉器官或感受器的疾病以及各个种类的传染性疾病。