发明内容
本发明的目的是提供将基于计算机的生物医学信息学和实验室分子生物学结合起来来制作具有特异性序列的DNA分子探针的方法,制备出的DNA分子探针能够与整个靶向基因的所有特异性DNA序列进行DNA-DNA杂交,起到准确探测、识别疾病基因和正常基因的作用。DNA分子探针的制备方法包括两大程序:
第一程序:利用基于计算机的生物信息学手段来获得靶向基因的特异性DNA
序列,并设计出相应PCR引物
第一程序包括以下步骤:
(1)在公共基因库上搜索到靶向基因的基因组位置,然后识别出该靶向基因的编码序列和非编码序列(即外显子和内含子的区域),剔除掉其中的非特异性重复序列,获得覆盖整个靶向基因的特异性DNA序列,该特异性DNA序列为不连续的多个DNA片段;
位于外显子的编码序列一般都是特异性序列,即该基因所特有的(在少数情况下,有些基因的外显子编码序列也会与其同一家族的其它基因序列有非常大的同源性,应有所注意,在设计探针时因避免使用)。位于内含子的非编码序列又分成特异性序列和非特异性序列,前者是该基因所特有的,在制作探针时应当保留,后者一般由有序或无序的重复DNA序列构成,在制作DNA探针时应当去除。下面列出的一些重复序列,在基因组的许多基因内含子的区域中都存在,应当避免用在探针里。
重复序列1:
tgaatttcccagcctccagaactatgggaaataaatttctgttgtttacaagtaaatcattttatgttattttgttacagaagcccaaaaagatgaagacatacaccagatcactccattctcttcttgcttgcatggtttctgaggatacgttggatgtaattctaatattctctataggtattttctttatggctcct
重复序列2:
aagctccagtatacctaaacaagtgcaaatttgtttaagtacagttatttgtggtagcattagtcattgttttcaatagcaagaagaaaaaggaaacaac
重复序列3:
catcaaaaatcggttaccataaaatcctaatagttgaagagatgtaatttcaattatttggtaaacctgaccttcattgtcaaagc
重复序列4:
ttttcctgtgtctctgcaaccacaggcccctctcctttctcttaataaagataccagtcattgagtttgaaaattgctaagagagtctgttgtaaatctt
重复序列5:
cttagcacaaaaaaaaatgacagatatgtgaagtggtagatatattaattagtttgatttgatcactccgctatgtgtataaatgtcaaaacaaacattg
重复序列6:
taggaaagtgattggcttttgtatgttaacgttgtatcctgctcacttgctataactgcttattagttccaggagcttttttattgtttcttttggattttctaagagacaattacattatcagtgaacaaacacgatttatttcttccc
重复序列7:
ctttgttcctgattttagctataggtttttgtagctgttctttattaagttgaggatatccttctctattcttagtttgctgagaatttttatcatgaat
重复序列8:
aggtaattctggcttcacaaaattaattatggagtcttccctctacttctagtttctggaagagattgtagagaatggatgtaatttctttcttaaatgt
重复序列9:
ttctttcatttctgatattcataatttgtgtattctctctttgtttcttagcctggtgagaggcttataaattttattgattttttgaagaatcactttttggttttgctgattttcttgctgggattataggcgtgagccaccacactc
重复序列10:
aaaaagtccaggcattagctaggactgtgcctgtagtcccagctactcaggaggctgagatgagaagatcaccggagcctagaaatttgaggctgcagtgggctgtgatcatgtcacttcactcctgcctagaagacagttagaccctgc
ctctaaaataaacaagcaaataaataaaaagaaaggaagaaaagaagagcaagggcagcaaatagaaaatagtaataaatatggtagctattaatccaactatgtcaataattaccttaaatgttagtggtctaaatatactgcaatgga
在确定并去除了非特异性重复序列后,将靶向基因的特异性DNA序列包括编码和非编码的特异性DNA序列下载下来,此时这部分的DNA序列由于去除了其中的非特异性片段,则成为不连续的许多大小不同的DNA片段,有些基因可能包含一百多个特异性DNA片段,如人类PTEN基因即含有126个长度在150bp-4666bp的DNA特异性片段。
(2)在得到靶向基因的特异性序列片段之后,再利用网上提供的公共引物设计工具或利用其它非网上的计算机软件,给靶向基因的特异性DNA序列中每一个DNA片段设计出成对PCR引物,引物长度为18-25个碱基,至此完成了第一程序的工作。
在第一程序中,在确定好特定靶基因的前提下,用基因数据库(genebank)中的工具(实际上是网络中的软件,也即生物医学信息学方法)来发现并确定该特定基因的DNA序列,比如在哪一个染色体上,整个基因在该染色体上的跨度范围和大小,其中有没有非特异性重复序列,有多少,在其上游和下游有没有其他基因存在,离其有多远等等,然后将该基因及其两边一定范围内的DNA序列下载下来,在下载的同时,识别该基因序列中所含的非特异性重复序列(repetitive sequence),因为这些序列可在其他染色体的多个部位存在,是造成非特异性杂交信号的主要原因,因此,必须踢除它们。由于重复序列甚至在同一个基因序列中多处存在,必须一一剔出,结果使我们最终得到的特异性DNA序列成为多个小的DNA片段。目前国内外还没有人用这种方法来获得某个靶基因的、不含任何非特异性重复序列的,非常纯的,能覆盖整个靶基因的基因组DNA序列,这属于本发明的创新点。
第二程序:是在第一程序的设计和指导下,应用实验室分子生物学的手段
将DNA分子探针实际地制造出来
第二程序包括以下步骤:
(1)以正常组织的基因组DNA为模板,利用第一程序的步骤(2)中设计出的PCR引物,用PCR方法扩增出第一程序的步骤(1)中确定的靶向基因的特异性DNA序列,扩增出的特异性DNA序列含有靶向基因的所有特异信息;
(2)利用扩增出的特异性DNA序列制造特异性的DNA分子探针,该DNA分子探针能够与整个靶向基因的所有特异性DNA序列进行DNA-DNA杂交。
第一步:确定序列并剔出重复序列,1-2天,设计引物,1-2天;
第二步:PCR扩增目的基因1-2天,其实这时的
步骤(1)扩增出的PCR产物已经能够直接用来标记探针和进行原位杂交实验了。但为了建立稳定的探针来源,使其永久地,不断地提供探针,将步骤(1)扩增出的PCR产物克隆,即将步骤(1)中扩增出的特异性DNA序列中每一个DNA片段均克隆到一个质粒载体上,克隆的质粒用作永久、稳定地特异性DNA序列来源,用PCR方法多次连续扩增所有质粒中克隆的DNA片段,其中每次扩增后的产物均进行稀释后再进行下次扩增,连续三次,最后一次扩增的产物即为未标记的DNA分子探针。
装在质粒载体中的DNA比PCR产物DNA要稳定得多,将永远不会降解或丢失。克隆这一步大约需1-2周时间,再加上第一程序中确定序列并剔出重复序列需要1-2天,设计引物需要1-2天,以及第二程序中PCR扩增目的基因需要1-2天,这样总共只需不到3周的时间就可以建立某个靶基因的DNA探针的永久货源。而且,质粒DNA的扩增可以大规模进行,比PCR方法的产量和稳定性都要好,而且成本要低得多。本发明特异性强、周期短、效率高、成本低,可大规模生产探针、促进试剂盒的产业化、用于各种疾病分子病理诊断。
在将DNA片段克隆到质粒中后,经小量扩增提取质粒中插入的DNA片段,进行鉴定,保证正确后,扩增大量提取质粒DNA。克隆的质粒将会提供永久的DNA来源。待所有DNA片段都获得克隆之后,每个克隆的质粒按插入片段的大小分别取出一小份混合到一起,在该质粒的插入片段的两端设计一对引物,或用质粒载体所特有的引物,比如M13引物或T7和SP6引物,用PCR的方法同时扩增所有的插入片段,其产物经过凝胶电泳检测,产物的大小范围与最初确认的DNA片段的大小范围应当一致,或者对扩增的产物进行测序保证所克隆片段的正确。产物经过1:1000稀释后,再次用PCR扩增,总共三次,以达到稳定的产物。最后一次PCR的产物就作为未标记的探针。此次PCR产物经过纯化后,用TE缓冲液(10mM,pH 8.5)按每批所需要的量分装后,储藏到-20℃冰箱。
在第二程序中,将第一程序获得的靶向基因的特异性基因组DNA序列(genomic DNA sequence of targeted gene,已不含有非特异性重复序列,或仅含有微量成分,小于0.1%),纯度达99.9%,用分子生物学的分子克隆的方法,将每一个上面纯的DNA序列都克隆了,所得结果,我们将获得与众不同的,已经过处理过的,包含靶向基因所有特异信息的DNA片段。用这一DNA(含多个小的DNA片段)来制作特异性很高的DNA探针(其特征是虽然由多个小的DNA片段组成,但合起来覆盖整个靶基因),用于疾病如肿瘤病理分子诊断,即在病理组织细胞切片和细胞涂片上的原位杂交方法的诊断包括荧光原位杂交和非荧光的显色原位杂交。该DNA探针不同于其他种类的探针,不是RNA探针(RNA-RNA杂交),也不是cDNA探针(cDNA-RNA,或cDNA-DNA杂交),也不是仅仅与基因组DNA中的靶基因的某个特定编码序列的杂交,而是与整个靶基因的所有特异性DNA序列的DNA-DNA杂交,包括编码序列和非编码的特异序列。
本发明用克隆的办法加上测序,保证了所做的探针的序列准确无误,并且通过质粒的扩增,可得到大量且稳定的DNA探针来源,一旦做好以后,将给标记探针永久提供DNA模板,且保持序列不会改变,而且本发明在第一程序的步骤(1)中就将非特异性重复序列剔出了,因此不需要反复抽提和FISH的测试(参见参考文献1、2、3),本专利方法周期短,成本低,适合于大规模生产探针。
具体实施例:人类PTEN DNA探针的制作
人类PTEN(Phosphatase and Tensin homolog deleted from chromosome ten)基因是一个肿瘤抑制基因,是继p53之后第二个在肿瘤中最常发生突变的基因。该基因在正常胚胎发育和保持染色体的稳定性方面起非常重要的作用。该基因在许多疾病的病理发生上起非常重要的作用,例如糖尿病(diabetes),呆小症(autism),以及几乎所有肿瘤均有关,已明确的肿瘤有神经胶质瘤,乳腺癌,结肠癌,肺癌,前列腺癌,子宫内膜癌,神经胶质母细胞瘤和黑色素细胞瘤等等。
参见图3,整个制备方法包括两大程序,具体实施如下:
一、特异性DNA序列的获取,引物设计:
我们研制的PTEN基因探针,位于第10染色体长臂第23条区带(10q23)覆盖包括整个PTEN基因组位点在内的大约320kb的基因组区段,经过反复整合及筛选,去除非特异性DNA序列,最后选择大小不等的多片段基因序列(从150bp到4666bp),总的片段数目达到126个,其净长度为112kb。下表显示了PTEN基因片段的组成:
下面选择上表中五个片段说明如何设计引物:
1.PTEN016-1270bp
序列:
>chr10:89635406-89636675
CATGAGGTGGTATTCATTTATTCATATAGTTAGAACAAAAAATATTTAAAATATTGAGGTAGAAACAAATTAGTCTCTTTTTAATTAAAAGCCAGATTACTTGTTAGAGTAACATTTTCCCAAATGAGGTAAAATTGTTGCGACTGTTAAACTTAAGGAAATTTTGATCTAGGTGTGGTATATACCTTCTTGTGGGGTGCTAATGAAAACAGGGATGGCAAAAATATTTTGTTTGTGAGTGTATGCATTTATGCTTTTTGACAACCTAAGAAACACTCTTACATCTGAGTATCTTTCATGGACTAGCTGTAGGAAATCTATATAAAATAGCTTAGTATACTGAAAGTATGACATAGTTTTACATATCTAGATTGTGGTTGTGATTATATATAATACTATAAAATATGCTAACGTGCTGCTTAATAATACTATTTGGATTTTTTTTAATACTGAAAAGGTCACACAGATTGTGATTATTGTGTAGTGTCCAAGAACTAAGGCCTACCATCTGTTACTCAAATGTATGAAAAAGTTAAGATAATTTAGTGATATAAGTGGTTTTGACACCACTGTTTTTGGAATAATCTAATTATGATTTTTATAAAGACTAATATCAAATTTTAAACGTTTGCAAAAATGAAACCTAATAGTTATACTGTTATTTATATTTTTCTATTACAATACAGATACTGGCTGAGAACTAAAGATTGTGTAATAAACGCCTGGCCTTCAGTCATTTGGTTTTTTTTTTCCCTCGATTGTTTGGATAGTTAACTGGACATCATGTTTTAACTTGAGAAATTAAGTTATACAAGATTTTGATATTTTAAACTAGTTTTCCTAACTGGTTGAGATATATAAGAATTTAGTATTACAGGACTCAATCAGGGAACTGATTTAATAAGAATTTCTTAAAAATTTGTTTAAATATTTTTCAAGTTCTTTTCTTCATCTTCTACAACTTAATTCTTGTCTGTATGCAAATGAGCTTCCCCATTTAAAATTTTGCTGTTGCATTTTAGGCCACTATAGAAGTTGTTTCTTTAATTTTCACTCACAAGAATTTGGTCTTACCAAATTGTGTAAATCTTTAAAATTGTGTATTTGGCTTAATATTATAGAATCTGATTGATTTAATCTACCTTGTTTCATTTAGTATGTTGACATTTTCTTGAGAAATTTGTTATGCCAAATGATTAACATAATAATATTTTAAGTTTAGATATGATTTTGAATTTACATTTTCAAATGCAACTTTGTGTCTGTGGCC
2.PTEN015-1628bp
序列:
>chr10:89633751-89635378GCTAGTAGTTTTTAAAGTAATCCTTTTTCCTTTAATTATGTAGTTGTTGAACTGTTGGGAGTTACTTTTCTCTTACTATTTTGTTATTTAATGTATTCTTTGACCTTATGCTTTTTTATTCTAAAGCTGCTTTTATTATAGTCAGATATGATGAAGTTAAATGTACAATGTAAAATTGCAAATTTCCAACGAGCTATACAAACTTAAATATTTCTAAGTAAAGAAAATAGGGCTGACTCTAAGGTTCTTTGATCCATGTGTTGCATTCTTTTCTAGGCCCTAAATTTGCTATGCCAGCCTGTTGAATTAAAGTGCTTTATTTATCTAAATTAGAAACTTGTATTAAAGTGAAGTTTTAGAAAAAAAGAAACAAAATCGGAATGGAGTTTTAGGTTAGCCCAGAGATGGGAAGATGCCAAGAAGGTAGCTTTAGTGGATTCTGAATTTTTTGGTTTTGTTTTGTTTTTAGGGCAGGCAAATGTAATTACAAAAGGGTTCTAGGAATAGATTGCTGTGATTTTTTTTCTGTTTGCATGATTTTACAGTTTGCTTTGCCTCTCACTTTTGAATGCAGAATAAAATGTCAAGGCCTTATTTTTTTTTAAATTCTTAAGAAATTTAAGATTTGACTGTTAATTCCTTTTGAAATATGGGATATTTTGAGATACCAATTATTTAAGACAAATAGGACTCATTGTTACAATTCAGTTGAATAAGGCTTATGATGTTTATTTCAGTATATGAATGAAAACTATGTGCTTATTGTACTTAAGAAAATTTCTTTTATTAAAAACATGACTAAAGAGAATTTTAAAAATCACCCACTGTCCTACTTCTCTAAAACTTAATGTTTTCATATTAGCTTCCAGTTTTGTTCATATGCATATACTTTAAAACCTAGTTCATGGTGAACTTAAGAGGGTGTTCTTTTTAAAAAACAATTTCCATTGCACTTTGTCGTTGCCTTAATTAAATGGTGAAATCATCAGAAATATTTATTTTCCTATACTTATACATTTATTAAGCTTGTTTCCATTTTTTTATTTTGTGATTTTTTAAGTGGATTTAAGATAACCTAAACATTAGAGAGGATTTTCATGGTTTTGATTCATGAAATCATAATGTTATACAAACCTAACTGAAGTGTTAGAGCCTTGAAGATTTTTCCCCCGAATTACATATAGTAACTCTACTTGTATTTAATACTGAAAGCATATTTTACTTATTTAAGTGAGACAAAGTAAAATTTAGCTGAATACTTTAGATCTATCATTTCCTTTTCCTGTTGTAAGAACATTACATTGTGTTGAAATTAAAGTGGATATAGAAGGTAATTAGAATAAACTGCCACATCATTTTTATAGTAAAGTGGTAATAACACTATTGCTTTCTGTTTTTTTAATCAGAAGGAGTATGGGCTTATAATGATGTTACTGTTCCCTGAAGCATATTTTGAATGATACGGTTTATATTTGCACAGTTGCCCAGGTAATCATTGTGATATTAATTGATCAATTTGCTATTTATTTGCGTTTTAAATCAGTACTAGTATTTGTGCTTAAAAATTTTGCATATGTTTTATCAGATTTAATTTTTAAGTGTCAGATACTAAAACAAATAACCTTAAC
3.PTEN017-624bp
名称 |
序列(5’-3') |
长度 |
开始 |
终止 |
Tm |
GC% |
产物长度 |
正向引物 |
TGGTGAGAACTGAATTGGAGGCT |
23 |
78 |
100 |
55 |
47 |
|
逆向引物 |
ACACATAACACCTCTCACACCCT |
23 |
276 |
254 |
55 |
47 |
199bp |
序列:
>chr10:89636692-89637315
ACGAGAAACATCTTGCCAATTTTCAGATTAATCTGTGAGGAAAGTAGATTGGTTTACTAGACTCAGTTTGTAGACTTTGGTGAGAACTGAATTGGAGGCTATGAAAAAAATACCTTTTGGGCCTTTCTGAATAGACATATATACATAAATTATATCTCTTACATTAAGTGAGGCACATATGTAGGTGAGATTTTTACCTGAATATTAAAAGTTTAAAAGTCGTTACCTATTCTGTTTACTTAATAGTATTTAAAGGGTGTGAGAGGTGTTATGTGTTTCTGTCCCTTGTTTTTATTCCTATCCCTCCCATCTAACTGTTGGTACTCTTATCTTCCCAGGTATTAAACTTGTATGTTTTAAAAGCTTATTTACTTGTTGAAATGGTTAACTTAATTAGTTTTTTCTTTGAAGTTTCAGCCTAAATATTTTCTGTTTTTTTATATGTCCTTTAAATATGAAAATTCTACAGCTAATCATAATTAGTAATTGTACTTTTTCCCCTATTACAATAACTGGTTTCATAATAAAATGGTATCCCTTCAATAACAAGCATTTATAGTAGTTTATTAAAACTAAGGGTGTTATCTATTCAAACCAAGCAATGCAGACTTACTGTTGACTCTG
4.PTEN019-750bp
序列:
>chr10:89638106-89638855
TAAATTTTGATTGTTATTAGCAACTATAAAAGTTTTGCAGTTGGCTTATTGGAAAAAGAAAACCTCCTTGCCGGAGACGGAGACGCATTTGTATTAGAACTTTGTTTTCTGAGTACCTTACCTATAGTAGGTTTCAAATATTGGTGAATTAGTTGATGGTTAGGTCTGCATAATTACTGCGTATGGAAATTCTGGAACCCTATTTTTTCAAAATGCAGCTAATGTTGAGAGAATATGCACTAAATATTACTAGATCTTTGTTTTTCAAGATGCTGATATCCCTTAACATCTTCTGCACTTTACCTGTTTGAATATCTTTTTTGCTGTAAAAATTAGTGGCCTTATGTCTTTCTGCATAATTATAGAGTAGCCAAAACCTGTTTTAGGTTAATCACCTCTGGCAAAATAAATGATAAAAGCATAGCTTTTGTAAGCAGAATGATATTACAGAAGTTAACTTATAAATCTAAGTGTATTAAAGACACTTAGGAAATTTATGATAATGCTGGGTCAGCATTACAGTTTTAACTTTTTACAGTTTTTCATATGCTTTTTTTGTGATTTTGCTGTAGAAAATTAACAGTTGGCATTTGGCTTAGTTCAAGTATAATGCTGTTGACAAGTATATCTGACACGTCATTGAACTAATAATATTTTTGAAAGCTGATAGGTAAGTTATATCTATTTTGTTTCATTCGTCATTAGTGATCGGTCTTAGATGTTTTTAGCGAGAGCAAAACTGTAGAGGAA
5.PTEN021-1323bp
序列:
>chr10:89641965-89643287
GACAAATTGTTCTTAAATAATGAACAGTTGGCACTTTTTCAACTGGAAAATTCAAGGAACTGCTCTTTCTGCTTTCTGCTCAATATGAATCTTCAATTTAGAAATGAGAGTCCATCATTAACAATTCAACATAGCTTATTAATAGGAAAAAAAAACCTAGTAACAAATGTAAAATCTTTGATTAAATGAGAAAGTCATAGAAGTTCATCAGATTTGTATTTAAAGCATGATTTCATTAGAAAAGTTGATAATAAGGATTTAACTGTGACATAATTGGAAAATACTTGTTTAAACTTAAAATTTTGAAAAGAAATGTAAATGTGATGTAACTTATGAATCAGTGGTTGAGTTTCTTTTTTGCTCACAAGAACCCTAACTGTGTGTTACTTGAAAGCACTGATGGAAATCAGGGAAAAAGCTCCAGAAGTTCCTACGAAATAAAATTAAATGATAAAGTCCTGGTATCTGCTAACTTGCCTTCCATTCCTGTTATCTTTTCTTCTTAGTCTGACTTCATTAATTCTTTCACCCTGGCTACTGGTTTAGCTCAGTGTTTTATGAGCCAGGCAGCTTCAGACTTTGCTTTTGATGCTCTTTGTTCATTACCTCTAAAGCTGTATTATCACTTTCATTTTATCATTAATGTTTCATGTATATGTTATAGTTTCATATTGTTACTGCAACTTTTACTTAGCTATAATTTAAAAAATATCTGTGATCTGTGGAAATAATTATTCTATGGCAGAAAAGTAGTTATTGCATTTTACTTTATAAGTTGTTTAAGGATAAGCATACCTATATATTAAGCACTACAAAGAAACTTTTACAATGGCTTTATTTTTAGCAAACCATCATAGTTAAAATAAGATTTAGTGTACATGTCAGGAACACAGTCTTATGAAATAAGGTTTAGGGAGCTATTTTTAGTTACTATATCCTACTTGAAAATTGTAGTTAAATTTCTAGCATATACCCTATTAATTTAGATGCAAGTACAGATTTGAGATAAGGTAGATACATTATTTGGATGTCAACTCGGAAGTTGTTCAAGAAAAGATATTTTGTTATTTAGATGTAACTTGGAACATATTTCTAGTGTTTCAAGTCATGATTGTATGCCTAGAACAGGCAATAAAAATTTACTTAGCTGGTAAAACAGCCACATTATTTCAAATATAGTTTAGTTATATTATGGATTAAATTGATTTTTGTGGACAGACTTTAGAACTTAATTGCTATTAATTACATTTTTTCTTTGGGACGGTATTTGTTCTTTGGTGAGAAAGGATTCTTGTAACACCTAAATCAAGACTGTCCAAACAT
二、以人类正常组织基因组DNA为模板扩增所选的特异性靶基因片段人类正常组织提取的基因组DNA可以从BioServe购买。
1、用设计好的引物进行PCR反应,条件如下:
该步PCR的反应条件为:
95℃,3分钟;
95℃,20秒,55-60℃(依实际引物为准),30秒,72℃1-5分钟(依片段的大小来定),共35次循环;
72℃,5分钟,保持在12℃。
上述各个PCR产物经凝胶电泳检查确认只有单一产物,且量和长度都符合要求,则进入下一步PCR产物的克隆与探针制作。
2、将PCR产物克隆到载体中
用TAKi t含pCRTM 质粒载体和质粒小量提取试剂盒(Quick Plasmid Miniprep Kit)(Cat#K4500-02,Invitrogen,CA,USA),质粒载体的图谱见图4.
克隆的步骤如下:
1)所需材料:
(1)TOPO载体与PCR产物的克隆混合物;
(2)LB培养板(含50μg/ml青霉素或50μg/ml卡那霉素);
(3)40mg/mlX-gal(溶在二甲基哑酚中,DMF);
(4)42℃水浴;
(5)37℃细菌摇床和37℃温箱;
(6)其它消毒的用于细菌的材料,如细菌涂板等等;
(7)S.O.C.培养液。
2)设置克隆反应液:
将反应液混匀在室温下孵育5-10分钟,然后放置冰上备用。
3)准备转染细菌
(1)将水浴设置到42℃;
(2)将S.O.C.培养液保育到室温;
(3)将含50-100μg/ml青霉素的LB培养板放置37℃30分钟;
(4)将40mg/ml X-gal均匀涂到LB培养板的表面,放置37℃温箱备用;
(5)在冰上溶化化学感受态细胞,每个转染克隆一个管(50μl)
4)进行化学转染细菌的程序
(1)在上述化学感受态细胞中加入2μl上述克隆反应液,轻微混均;
(2)在冰上孵育5-30分钟;
(3)在42℃水浴给于细胞热休克30秒,不要摇;
(4)立即将细胞转至冰上;
(5)加250μl置于室温的S.O.C.培养液:
(6)盖紧管盖在37℃水平摇床孵育1小时,摇速每分钟200次;
(7)在预温的LB培养板上均匀涂上已转染并孵育的细胞混悬液10-50μl;
(8)在37℃温箱中孵育8-12小时;
(9)在转染克隆的同时,单独设一管细胞,转染对照质粒pUC19(10pg/μl)做为程序阳性对照,另放一管不加任何质粒做为阴性对照。
5)鉴定克隆结果:
(1)挑选6-8个菌落,放入含50μg/ml青霉素的LB液体培养液,放置37℃摇床每分钟250转培养过夜;
(2)用质粒小量提取试剂盒,提取克隆的质粒;
(3)用限制性内切酶分析克隆的质粒,然后用电泳检查插入片段的大小,方向看是否存在所设计的克隆片段;
(4)为进一步确实所克隆的片段,可将提取的质粒经过纯化后进行测序,用M13引物来做,引物的序列如下:
M13正向引物:5′-GTAAAACGACGGCCAG-3′或
M13逆向引物:5′-CAGGAAACAGCTATGAC-3′
6)用PCR方法扩增所克隆的片段,将其产物做为未标记的DNA探针:
待所有设计的DNA片段都得到克隆完毕之后,将它们按比例混合在一起,然后直接用上述M13引物对,将插入片段予以扩增,连续三次,每次扩增后的产物按1:1000稀释,最后一次的PCR产物,在电泳上检查是否扩增的均匀,大小范围是否正确,然后用PCR纯化柱纯化该产物,并在UV分光光度计上测量DNA的量(260/280nm波长),用TE缓冲液(10mM,pH 8.5)按每批所需要的量分装后放-20℃冰箱长期储存。此阶段的DNA为多个DNA片段的集合,可做为未标记的DNA探针。
该靶向基因DNA分子探针的制备方法,将基于网路生物医学信息学和基于实验室分子生物学结合起来,制作具有特异序列的人类基因组DNA探针,探测肿瘤病人或正常人群中肿瘤生物标志物基因或正常基因。该探针能够用于但不限于肿瘤的伴侣诊断或称伴随诊断(Companion Diagnostics),该诊断是在福尔马林固定、石蜡包埋的组织和细胞切片以及细胞涂片的临床病理标本上进行以形态学为基础的原位杂交反应包括荧光原位杂交和非荧光的显色原位杂交。DNA靶向分子探针技术的关键点,是用基于网路的或基于计算机的生物医学信息学工具来确定人类肿瘤生物标志物基因序列,这些序列是独特的和特异的肿瘤靶基因序列。用于作为探针的这些序列应该不含有非特异的重复DNA片断,因为它们是在临床标本上进行DNA-DNA杂交时引起非特异性背景增高的主要原因。应用DNA靶向分子探针技术制作的与肿瘤生物标志物基因相匹配的特异性探针,将从基因序列中剔除非特异的重复DNA片断。因此,DNA探针制作过程完全用计算机程序控制和设计,并指导实际用分子生物学的方法在实验室制造探针的整个过程。创新点在于可以直接设计探针序列,排除了内源性干扰序列,避免了非特异性杂交信号,探针的纯度可以达到99.9%。因此,其特异性强、灵敏度高,且探针制作周期短、效率高、成本低。用本技术制作的探针进行的临床病理标本或正常人群的标本的体外诊断或普查可用于但不限于个体化医学的伴侣诊断,以此指导:(1)肿瘤病人靶向治疗的药物选择;(2)对新的或已知的肿瘤生物标志物开发新的药物;(3)监测药物治疗前,治疗中及治疗后疾病的转归和预后;(4)用于肿瘤防治过程中的癌前病变;(5)用于病理学中肿瘤的分子分型和分类;(6)用于染色体核型以及染色体末端长度的测定。应用本技术,可以满足日益增长的对肿瘤分子标志物进行检测的需要,也将对肿瘤的靶向治疗起到推动作用。
参考文献:
1.Jon M.Davison,Thomas W.Morgan,Bae-Li Hsi,Sheng Xiao,andJonathan A.Fletcher:Subtracted,Unique-Sequence,In Situ HybridizationExperimental and Diagnostic Applications.American Journal of Pathology,Vol.153,No.5,November 1998.
2.Jeffrey M.Craig ·Jürgen Kraus ·Thomas Cremer:Removal ofrepetitive sequences from FISH probes using PCR-assisted affinitychromatography.Hum Genet(1997)100:472–476
3.D.PINKEL*,J.LANDEGENTt,C.COLLINS,J.FUSCOEt,R.SEGRAVES,J.LUCAS,AND J.GRAY:Fluorescence in situ hybridization with humanchromosome-specific libraries:Detection of trisomy 21 andtranslocations of chromosome 4.Proc.Nati.Acad.Sci.USA Vol.85,pp.9138-9142,December 1988
SEQUENCE LISTING
<110> 张家港蓝苏生物工程有限公司
<120> 靶向基因DNA分子探针的制备方法
<160> 29
<170> PatentIn version 3.3
<210> 1
<211> 200
<212> DNA
<213> 人工序列
<400> 1
tgaatttccc agcctccaga actatgggaa ataaatttct gttgtttaca agtaaatcat 60
tttatgttat tttgttacag aagcccaaaa agatgaagac atacaccaga tcactccatt 120
ctcttcttgc ttgcatggtt tctgaggata cgttggatgt aattctaata ttctctatag 180
gtattttctt tatggctcct 200
<210> 2
<211> 100
<212> DNA
<213> 人工序列
<400> 2
aagctccagt atacctaaac aagtgcaaat ttgtttaagt acagttattt gtggtagcat 60
tagtcattgt tttcaatagc aagaagaaaa aggaaacaac 100
<210> 3
<211> 86
<212> DNA
<213> 人工序列
<400> 3
catcaaaaat cggttaccat aaaatcctaa tagttgaaga gatgtaattt caattatttg 60
gtaaacctga ccttcattgt caaagc 86
<210> 4
<211> 100
<212> DNA
<213> 人工序列
<400> 4
ttttcctgtg tctctgcaac cacaggcccc tctcctttct cttaataaag ataccagtca 60
ttgagtttga aaattgctaa gagagtctgt tgtaaatctt 100
<210> 5
<211> 100
<212> DNA
<213> 人工序列
<400> 5
cttagcacaa aaaaaaatga cagatatgtg aagtggtaga tatattaatt agtttgattt 60
gatcactccg ctatgtgtat aaatgtcaaa acaaacattg 100
<210> 6
<211> 150
<212> DNA
<213> 人工序列
<400> 6
taggaaagtg attggctttt gtatgttaac gttgtatcct gctcacttgc tataactgct 60
tattagttcc aggagctttt ttattgtttc ttttggattt tctaagagac aattacatta 120
tcagtgaaca aacacgattt atttcttccc 150
<210> 7
<211> 100
<212> DNA
<213> 人工序列
<400> 7
ctttgttcct gattttagct ataggttttt gtagctgttc tttattaagt tgaggatatc 60
cttctctatt cttagtttgc tgagaatttt tatcatgaat 100
<210> 8
<211> 100
<212> DNA
<213> 人工序列
<400> 8
aggtaattct ggcttcacaa aattaattat ggagtcttcc ctctacttct agtttctgga 60
agagattgta gagaatggat gtaatttctt tcttaaatgt 100
<210> 9
<211> 150
<212> DNA
<213> 人工序列
<400> 9
ttctttcatt tctgatattc ataatttgtg tattctctct ttgtttctta gcctggtgag 60
aggcttataa attttattga ttttttgaag aatcactttt tggttttgct gattttcttg 120
ctgggattat aggcgtgagc caccacactc 150
<210> 10
<211> 300
<212> DNA
<213> 人工序列
<400> 10
aaaaagtcca ggcattagct aggactgtgc ctgtagtccc agctactcag gaggctgaga 60
tgagaagatc accggagcct agaaatttga ggctgcagtg ggctgtgatc atgtcacttc 120
actcctgcct agaagacagt tagaccctgc ctctaaaata aacaagcaaa taaataaaaa 180
gaaaggaaga aaagaagagc aagggcagca aatagaaaat agtaataaat atggtagcta 240
ttaatccaac tatgtcaata attaccttaa atgttagtgg tctaaatata ctgcaatgga 300
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<400> 11
aaacgcctgg ccttcagtca 20
<210> 12
<211> 22
<212> DNA
<213> 人工序列
<400> 12
ggccacagac acaaagttgc at 22
<210> 13
<211> 25
<212> DNA
<213> 人工序列
<400> 13
gggtgctaat gaaaacaggg atggc 25
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<400> 14
ccaaatgact gaaggccagg cg 22
<210> 15
<211> 1270
<212> DNA
<213> 人工序列
<400> 15
catgaggtgg tattcattta ttcatatagt tagaacaaaa aatatttaaa atattgaggt 60
agaaacaaat tagtctcttt ttaattaaaa gccagattac ttgttagagt aacattttcc 120
caaatgaggt aaaattgttg cgactgttaa acttaaggaa attttgatct aggtgtggta 180
tataccttct tgtggggtgc taatgaaaac agggatggca aaaatatttt gtttgtgagt 240
gtatgcattt atgctttttg acaacctaag aaacactctt acatctgagt atctttcatg 300
gactagctgt aggaaatcta tataaaatag cttagtatac tgaaagtatg acatagtttt 360
acatatctag attgtggttg tgattatata taatactata aaatatgcta acgtgctgct 420
taataatact atttggattt tttttaatac tgaaaaggtc acacagattg tgattattgt 480
gtagtgtcca agaactaagg cctaccatct gttactcaaa tgtatgaaaa agttaagata 540
atttagtgat ataagtggtt ttgacaccac tgtttttgga ataatctaat tatgattttt 600
ataaagacta atatcaaatt ttaaacgttt gcaaaaatga aacctaatag ttatactgtt 660
atttatattt ttctattaca atacagatac tggctgagaa ctaaagattg tgtaataaac 720
gcctggcctt cagtcatttg gttttttttt tccctcgatt gtttggatag ttaactggac 780
atcatgtttt aacttgagaa attaagttat acaagatttt gatattttaa actagttttc 840
ctaactggtt gagatatata agaatttagt attacaggac tcaatcaggg aactgattta 900
ataagaattt cttaaaaatt tgtttaaata tttttcaagt tcttttcttc atcttctaca 960
acttaattct tgtctgtatg caaatgagct tccccattta aaattttgct gttgcatttt 1020
aggccactat agaagttgtt tctttaattt tcactcacaa gaatttggtc ttaccaaatt 1080
gtgtaaatct ttaaaattgt gtatttggct taatattata gaatctgatt gatttaatct 1140
accttgtttc atttagtatg ttgacatttt cttgagaaat ttgttatgcc aaatgattaa 1200
cataataata ttttaagttt agatatgatt ttgaatttac attttcaaat gcaactttgt 1260
gtctgtggcc 1270
<210> 16
<211> 23
<212> DNA
<213> 人工序列
<400> 16
agcccagaga tgggaagatg cca 23
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<400> 17
aggcaacgac aaagtgcaat gga 23
<210> 18
<211> 1628
<212> DNA
<213> 人工序列
<400> 18
gctagtagtt tttaaagtaa tcctttttcc tttaattatg tagttgttga actgttggga 60
gttacttttc tcttactatt ttgttattta atgtattctt tgaccttatg cttttttatt 120
ctaaagctgc ttttattata gtcagatatg atgaagttaa atgtacaatg taaaattgca 180
aatttccaac gagctataca aacttaaata tttctaagta aagaaaatag ggctgactct 240
aaggttcttt gatccatgtg ttgcattctt ttctaggccc taaatttgct atgccagcct 300
gttgaattaa agtgctttat ttatctaaat tagaaacttg tattaaagtg aagttttaga 360
aaaaaagaaa caaaatcgga atggagtttt aggttagccc agagatggga agatgccaag 420
aaggtagctt tagtggattc tgaatttttt ggttttgttt tgtttttagg gcaggcaaat 480
gtaattacaa aagggttcta ggaatagatt gctgtgattt tttttctgtt tgcatgattt 540
tacagtttgc tttgcctctc acttttgaat gcagaataaa atgtcaaggc cttatttttt 600
tttaaattct taagaaattt aagatttgac tgttaattcc ttttgaaata tgggatattt 660
tgagatacca attatttaag acaaatagga ctcattgtta caattcagtt gaataaggct 720
tatgatgttt atttcagtat atgaatgaaa actatgtgct tattgtactt aagaaaattt 780
cttttattaa aaacatgact aaagagaatt ttaaaaatca cccactgtcc tacttctcta 840
aaacttaatg ttttcatatt agcttccagt tttgttcata tgcatatact ttaaaaccta 900
gttcatggtg aacttaagag ggtgttcttt ttaaaaaaca atttccattg cactttgtcg 960
ttgccttaat taaatggtga aatcatcaga aatatttatt ttcctatact tatacattta 1020
ttaagcttgt ttccattttt ttattttgtg attttttaag tggatttaag ataacctaaa 1080
cattagagag gattttcatg gttttgattc atgaaatcat aatgttatac aaacctaact 1140
gaagtgttag agccttgaag atttttcccc cgaattacat atagtaactc tacttgtatt 1200
taatactgaa agcatatttt acttatttaa gtgagacaaa gtaaaattta gctgaatact 1260
ttagatctat catttccttt tcctgttgta agaacattac attgtgttga aattaaagtg 1320
gatatagaag gtaattagaa taaactgcca catcattttt atagtaaagt ggtaataaca 1380
ctattgcttt ctgttttttt aatcagaagg agtatgggct tataatgatg ttactgttcc 1440
ctgaagcata ttttgaatga tacggtttat atttgcacag ttgcccaggt aatcattgtg 1500
atattaattg atcaatttgc tatttatttg cgttttaaat cagtactagt atttgtgctt 1560
aaaaattttg catatgtttt atcagattta atttttaagt gtcagatact aaaacaaata 1620
accttaac 1628
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<400> 19
tggtgagaac tgaattggag gct 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列
<400> 20
acacataaca cctctcacac cct 23
<210> 21
<211> 624
<212> DNA
<213> 人工序列
<400> 21
acgagaaaca tcttgccaat tttcagatta atctgtgagg aaagtagatt ggtttactag 60
actcagtttg tagactttgg tgagaactga attggaggct atgaaaaaaa taccttttgg 120
gcctttctga atagacatat atacataaat tatatctctt acattaagtg aggcacatat 180
gtaggtgaga tttttacctg aatattaaaa gtttaaaagt cgttacctat tctgtttact 240
taatagtatt taaagggtgt gagaggtgtt atgtgtttct gtcccttgtt tttattccta 300
tccctcccat ctaactgttg gtactcttat cttcccaggt attaaacttg tatgttttaa 360
aagcttattt acttgttgaa atggttaact taattagttt tttctttgaa gtttcagcct 420
aaatattttc tgttttttta tatgtccttt aaatatgaaa attctacagc taatcataat 480
tagtaattgt actttttccc ctattacaat aactggtttc ataataaaat ggtatccctt 540
caataacaag catttatagt agtttattaa aactaagggt gttatctatt caaaccaagc 600
aatgcagact tactgttgac tctg 624
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<400> 22
aacctccttg ccggagacgg 20
<210> 23
<211> 23
<212> DNA
<213> 人工序列
<400> 23
tcctctacag ttttgctctc gct 23
<210> 24
<211> 750
<212> DNA
<213> 人工序列
<400> 24
taaattttga ttgttattag caactataaa agttttgcag ttggcttatt ggaaaaagaa 60
aacctccttg ccggagacgg agacgcattt gtattagaac tttgttttct gagtacctta 120
cctatagtag gtttcaaata ttggtgaatt agttgatggt taggtctgca taattactgc 180
gtatggaaat tctggaaccc tattttttca aaatgcagct aatgttgaga gaatatgcac 240
taaatattac tagatctttg tttttcaaga tgctgatatc ccttaacatc ttctgcactt 300
tacctgtttg aatatctttt ttgctgtaaa aattagtggc cttatgtctt tctgcataat 360
tatagagtag ccaaaacctg ttttaggtta atcacctctg gcaaaataaa tgataaaagc 420
atagcttttg taagcagaat gatattacag aagttaactt ataaatctaa gtgtattaaa 480
gacacttagg aaatttatga taatgctggg tcagcattac agttttaact ttttacagtt 540
tttcatatgc tttttttgtg attttgctgt agaaaattaa cagttggcat ttggcttagt 600
tcaagtataa tgctgttgac aagtatatct gacacgtcat tgaactaata atatttttga 660
aagctgatag gtaagttata tctattttgt ttcattcgtc attagtgatc ggtcttagat 720
gtttttagcg agagcaaaac tgtagaggaa 750
<210> 25
<211> 25
<212> DNA
<213> 人工序列
<400> 25
ggaactgctc tttctgcttt ctgct 25
<210> 26
<211> 23
<212> DNA
<213> 人工序列
<400> 26
gcaaagtctg aagctgcctg gct 23
<210> 27
<211> 1323
<212> DNA
<213> 人工序列
<400> 27
gacaaattgt tcttaaataa tgaacagttg gcactttttc aactggaaaa ttcaaggaac 60
tgctctttct gctttctgct caatatgaat cttcaattta gaaatgagag tccatcatta 120
acaattcaac atagcttatt aataggaaaa aaaaacctag taacaaatgt aaaatctttg 180
attaaatgag aaagtcatag aagttcatca gatttgtatt taaagcatga tttcattaga 240
aaagttgata ataaggattt aactgtgaca taattggaaa atacttgttt aaacttaaaa 300
ttttgaaaag aaatgtaaat gtgatgtaac ttatgaatca gtggttgagt ttcttttttg 360
ctcacaagaa ccctaactgt gtgttacttg aaagcactga tggaaatcag ggaaaaagct 420
ccagaagttc ctacgaaata aaattaaatg ataaagtcct ggtatctgct aacttgcctt 480
ccattcctgt tatcttttct tcttagtctg acttcattaa ttctttcacc ctggctactg 540
gtttagctca gtgttttatg agccaggcag cttcagactt tgcttttgat gctctttgtt 600
cattacctct aaagctgtat tatcactttc attttatcat taatgtttca tgtatatgtt 660
atagtttcat attgttactg caacttttac ttagctataa tttaaaaaat atctgtgatc 720
tgtggaaata attattctat ggcagaaaag tagttattgc attttacttt ataagttgtt 780
taaggataag catacctata tattaagcac tacaaagaaa cttttacaat ggctttattt 840
ttagcaaacc atcatagtta aaataagatt tagtgtacat gtcaggaaca cagtcttatg 900
aaataaggtt tagggagcta tttttagtta ctatatccta cttgaaaatt gtagttaaat 960
ttctagcata taccctatta atttagatgc aagtacagat ttgagataag gtagatacat 1020
tatttggatg tcaactcgga agttgttcaa gaaaagatat tttgttattt agatgtaact 1080
tggaacatat ttctagtgtt tcaagtcatg attgtatgcc tagaacaggc aataaaaatt 1140
tacttagctg gtaaaacagc cacattattt caaatatagt ttagttatat tatggattaa 1200
attgattttt gtggacagac tttagaactt aattgctatt aattacattt tttctttggg 1260
acggtatttg ttctttggtg agaaaggatt cttgtaacac ctaaatcaag actgtccaaa 1320
cat 1323
<210> 28
<211> 16
<212> DNA
<213> 人工序列
<400> 28
gtaaaacgac ggccag 16
<210> 29
<211> 17
<212> DNA
<213> 人工序列
<400> 29
caggaaacag ctatgac 17