CN1290298A - 鉴别和分析中度串联重复dna标记的物质和方法 - Google Patents
鉴别和分析中度串联重复dna标记的物质和方法 Download PDFInfo
- Publication number
- CN1290298A CN1290298A CN99802696A CN99802696A CN1290298A CN 1290298 A CN1290298 A CN 1290298A CN 99802696 A CN99802696 A CN 99802696A CN 99802696 A CN99802696 A CN 99802696A CN 1290298 A CN1290298 A CN 1290298A
- Authority
- CN
- China
- Prior art keywords
- seq
- sequence
- dna
- idno
- dna marker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及鉴别和分析DNA中中度串联重复序列的物质和方法,其中中度串联重复(1TR)序列是DNA序列的一个区域,其含有至少一个串联出现至少两次的5—7个碱基重复单位。用本发明的物质和方法的特别优选的实施方案鉴别和分析了人类基因组中高多态ITR基因座的DNA标记。
Description
相关申请的交叉参考
关于联邦资助的研究或开发的声明
本发明是在美国政府的支持下完成的,由国立健康研究院颁发的小企业发明研究资助号1-43-MH5294-01及1-43-MH5294-02资助。美国政府拥有本发明的某些权利。
发明领域
本发明一般涉及在基因组系统中鉴别和分析遗传标记。本发明特别涉及在DNA中,尤其是在基因组DNA中鉴别这样的基因座,其含有由于中度(5~7个碱基)序列重复数目变异而形成的长度多态性。本发明还涉及检测此多态基因座。本发明还涉及鉴别和区分个体的方法,其主要基于在该基因座扩增基因组DNA的产物的大小不同,其中中度串联重复序列数随个体不同而变化。
发明背景
DNA分型通常用于亲子鉴定,并用于确定马、狗及其它比赛动物的谱系。DNA分型还通常用于鉴别血液、唾液、精液及其它在犯罪场所发现的其它组织。目前所用的DNA分型法被设计为检测和分析已知在群体中以至少两种不同形式显现的DNA的一或多个区域的长度和/或序列中的差异。DNA分型还用于临床测定骨髓移植的成功或失败及特殊癌组织的存在与否。此变异长度和/或序列变异称为“多态性”。其中发生这种变异的DNA的任何区域(即“基因座”)称为“多态基因座”。大多数DNA分型技术使用至少一个含至少一个该多态基因座的“标记”。每个个体标记含有最终衍生自群体中单一个体基因组DNA的单一等位基因。本发明的方法和物质均设计为用于检测以长度变异为主要特征的DNA多态性的特定类别。
就长度或序列而言充分多态的遗传标记,很久以来被试图用于鉴定应用中,如亲权认定及鉴别收集的用于法医分析的组织样品。这种标记及分析该标记的方法的揭示与开发,在以往许多年已进行了几个阶段的开发。近年来,作为遗传标记的多态短串联重复(STRs)的揭示和开发已激发连锁图谱开发,致病基因的鉴别与鉴定及DNA分型的简化性和精确性的进程。术语“短串联重复”或“STR”指2~7个核苷酸长,在任何生物体的基因组DNA串联中完全或近乎完全串联重复的所有序列。例如见美国专利号5,364,759第4栏第58行中人基因组DNA的“短串联重复”的定义。
第一个鉴别的DNA变体标记是简单碱基取代,即简单序列多态性,其通常由Southern杂交分析检测。设计用于用放射活性探针分析限制性内切酶消化的DNA的这种标记的鉴别论述,参见Southern,E.M.(1975),J.Mol.Biol.98(3):503-507;Schumm,et al(1988),American Journal of Human Geneties 42:143-159;及Wyman,A.andWhite,R(1980)Proc.Natl.Acad.Sci.U.S.A.77:6754-6758。
第二代标记是大小变体,即长度多态性,尤其“串联重复可变数”(VNTR)标记(Nakamura Y.et al.(1987).Science 235:1616-1622;及美国专利4,963,663,授予White等(1990);美国专利5,411,859,4,963,663的继续,授予White等(1995))和“小卫星”标记(Jeffreys et al.(1985a),Nature 314:67-73;Jeffreys et al,(1985b)Nature 316:76-79;美国专利5,175,082,发明人Feffreys)。VNTR和小卫星标记均含有以串联方式重复的几个相同序列的区域。核心重复序列长度为10-70个碱基,较短的核心重复序列称为“小卫星”重复,较长重复称为VNTRs。人群中不同个体含有不同数量的这些重复。这些标记比碱基取代多态性具有更高的多态性,有时在单一遗传基因座上呈现接近40或更多个等位基因。但是,仍需要限制酶消化及随后的Southern杂交分析等繁琐方法检测及分析大多数这种标记。
接下来的进展包括聚合酶链反应(PCR)(美国专利4,683,203,Mullis,K.B.)技术与分析VNTR基因座(Kasai,K.et al.(1990)JournalForensic Science 35(5):1196-1200)的联合。可扩增的VNTR基因座被发现,其可不需Southern转移而被检测。扩增产物通过琼脂糖或聚丙烯酰胺凝胶分离,并通过在扩增期间掺入放射活性或通过用银或溴化乙锭后染色而检测。但PCR只能用于可靠扩增相对小的DNA区段,即仅可靠扩增长度在3000个碱基之下的DNA区段。(Ponce,M.& Micol,L.(1992)NAR 20(3):623;Decorte R.,et al.(1990)DNA Cell Biol,9(6):461-469)。结果,仅开发了非常少的可扩增VNTRs,使它们作为不能进行连锁作图的一类。
对具有多态二核苷酸重复(Litt和Luty(1989)Am J.Hum Genet3(4):599~605;Tautz,D.(1989)NAR 17:6463-6471;Weber和May(1989)Am J Hum Genet 44:388-396;德国专利DE 38 34 636C2,发明人Tautz,D;美国专利5,582,979,Weber,L.)及多态短串联重复(STR)(Edwards,A.等,(1991)Am.J.Hum.Genet,49:746-756;Hammond,H.A,等,(1994)Am.J.Hum.Genet.55:175-189;Fregeau C.J.和Foumey,R.M.(1993)BioTechniques 15(1):100-119;Schumm,J.W等,(1994),第四届人类鉴定国际研讨会,1993,PP.177-178;美国专利5,364,759,Caskey等;德国专利DE 3834636C2,Tautz,D.)的多态标记的新近开发,已克服了许多以前方法的缺陷。含有二核苷酸或STR重复(意为包括2-7bp重复)的二类标记通常被称为“微卫星”标记。微卫星基因座通常被认为是最适用标记,其与可扩增VNTRs相似之处在于其等位基因可以基于长度变化而区分。但是,与VNTRs不同,这些基因座含有2,3,4或少见的5个碱基长的完全或不完全重复序列。它们展示出在单个基因座上从仅几个等位基因至超过40个等位基因。扩增方案可以设计为产生通常60~400碱基对长的小产物,且每个基因座的等位基因通常包含在少于50bp范围内。通过精心设计PCR引物,使得来自一个个体系统的所有潜在扩增产物不重迭同一凝胶中其它系统的等位基因范围,可在相同凝胶上同时电泳分析几个系统。
有三种明显缺点与微卫星基因座的使用相关。首先,打滑(stutter)假象的存在,即通常在扩增后可见除代表每个等位基因的主要片段之外的一或多个次要片段。此缺陷在二核苷酸重复基因座比三或四核苷酸重复标记基因座更明显(Edwards等,1991,Am.J.Hum.Genet.49:746-756;Edwards等,1992.Genomics 12:241-253;Weber & May,1989.Am.J.Hum.Genet.44:388-396)。这些假象的存在,推测得自称为重复滑动的DNA聚合酶相关的现象(Levinson & Gutman,1987,Mol.Biol.Evol.4(3):203-221;Schlotterer & Tautz,1992.NAR20:211-215),使解释基因座的等位基因含量变得复杂。在所有解释复杂化的同时,代表每个等位基因的主要和次要片段的存在尤其限制这些标记在法医分析中的效力,法医分析通常要求测定是否存在一个以上DNA样品来源。在本研究中阐述的许多标记代表一类新的与已知标记相比产生明显少的打滑假象的标记。
当前的STR和微卫星标记系统的第二个缺点涉及在单一凝胶中分离多个基因座的难度。此发生是由于在由本领域技术人员最常用于分离DNA片段的凝胶上部区域中,存在不同大小片段的空间堆积。本研究中所述的基于较长重复单位的标记的开发,扩展了这些凝胶的有用范围,使更多基因座可同时被分析。
第三个缺点是在本发明之前,只有少数人类基因组DNA的DNA基因座已在文献中阐述,每个这种基因座具有基于5~7个碱基重复变化的长度多态性。如见于Edward等,(1991)核酸研究19:4791;Chen等(1993)基因组15(3):621-5;Harada等(1994)Am.J.Hum.Genet.55:175-189;Comings等(1995),Genomics 29(2):390-6;及UtahMarker Development Group(1995),Am.J.Genet.57:619-628。在1995年,Jurka和Pethiyagoda发表的文章阐述了一项研究,其中他们用GenBank数据库测定在灵长类基因组中五聚和六聚串联重复的相对丰度及可变性(Jurka和Pethiyagoda(1995)J.Mol.Evol.40:120-126)。但是,可变性只是间接估计的,且个体基因座多态水平未证实。我们已开发了鉴别和分析含5~7个碱基重复的高多态重复的DNA基因座的物质和方法。
本发明的物质和方法被设计为用于鉴别和分析各类DNA的特定多态基因座,包括各种不同来源的单链和双链DNA。本发明阐述了对现有技术的明显改进,使用于连锁分析,犯罪审判,亲权认定及其它法医和医学用途方面的DNA分布分析的能力及精确性增加。
发明概述
因此,本发明一个目的在于提供鉴别和分析具有中度串联重复序列的DNA基因座的物质和方法,其中“中度串联重复序列”是DNA的一区域,其含有至少一个由串联重复至少2次的5,6或7个碱基的序列组成的重复单位。
本发明另一个目的在于提供鉴别中度串联重复DNA标记的物质和方法,当其用于分析或检测含中度串联重复的DNA样品的一或多个基因座时,很少产生假象。本发明的方法和物质优选用于鉴别和分析基因组DNA的基因座,每个基因座均含有多态中度串联重复序列。本发明的物质包括针对人基因组DNA的这种基因座的寡核苷酸引物和DNA标记。用本发明的方法检测的中度串联重复基因座,比用相似方法检测的许多已知基因座,包括短STR(即2,3或4个碱基DNA序列的串联重复),呈现较少的假象。
本发明一特别目的是提供一种分析个体多态遗传基因座的方法和物质,其主要基于主要由于中度核苷酸串联重复的区域中,核酸重复单位数目的不同而引起的长度变化。本发明另一目的在于提供一种检测和分析基因组DNA的多态性基因座的方法,试剂盒及引物,该基因座含有中度串联重复多态性,包括五核苷酸串联重复多态性。
本发明的一实施方案是分离含有来自基因组DNA的中度串联重复序列的DNA片段的方法,包括(a)提供多个DNA片段,其中至少一个片段含有一中度串联重复序列:(b)提供一支持工具(means),如:结合至少一个寡核苷酸的固定支持工具,该寡核苷酸含有互补于中度串联重复序列的一部分的核苷酸序列;(c)在一定条件下组合该多个DNA片段和支持工具,其中含中度重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。
本发明另一实施方案是一种检测基因组DNA中具有低打滑假象的多态中度串联重复序列的方法,包括(a)提供一DNA样品,其具有至少一个靶中度串联重复序列,(b)检测DNA样品中靶中度串联重复序列,其中观测到不超过1.1%的平均打滑假象。
本发明另一实施方案是用至少一个寡核苷酸引物扩增DNA样品中感兴趣的中度串联重复序列(后文中称为“靶”中度串联重复序列),以检测DNA样品中靶中度串联重复序列的方法,其中寡核苷酸引物含有互补于并位于一DNA标记的一个区域侧翼的序列,该DNA标记在其序列中含有一中度串联重复序列(后文称为“模板中度串联重复序列”),其中,此DNA标记具有选自SEQ ID NOS:1-43的序列。
本发明的另一实施方案是一检测DNA样品中至少一个靶中度串联重复序列的试剂盒,该试剂盒包括一容器,其具有至少一个寡核苷酸引物,用于扩增至少一个靶中度串联重复序列,其中此寡核苷酸引物的核苷酸序列互补于并位于双链DNA标记一个区域的一部分的侧翼,该双链DNA标记含有模板中度串联重复序列,其中该DNA标记具有选自SEQ ID NOS:1-43的序列。
本发明的另一实施方案是一寡核苷酸引物,其包含互补于双链DNA标记的一条链的位于模板中度串联重复序列侧翼的区域的序列,其中该DNA标记具有选自SEQ ID NOS:1-6和SEQ ID NOS:28-33的序列。
本发明的各个实施方案在人及其它生物体鉴别,法医分析,亲权认定,监测骨髓移植,连锁作图及检测遗传病及癌症等领域均有特殊用处。准确辨别不同个体少量组织在法医应用中是特别急需的,其中许多定罪(及宣判无罪)要依于DNA分型分析,包括STR基因座的分析。
本发明的其它目的,特点及优势通过以下实施本发明的最佳模式及附图将显而易见。
附图简要描述
图1是通过滤膜杂交富集中度串联重复方法的流程图。
图2是S159五核苷酸重复的电泳图。
图3是vWA四核苷酸重复的电泳图。
图4是G210五核苷酸重复的电泳图。
图5是D5S818四核苷酸重复的电泳图。
图6是S159五核苷酸重复打滑百分率的散射图。
图7是G210五核苷酸重复打滑百分率的散射图。
图8是D5S818四核苷酸重复打滑百分率的散射图。
图9是vWA四核苷酸重复打滑百分率的散射图。
图10是在经凝胶电泳分离后,S159五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。
图11是在经凝胶电泳分离后,G210五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。
附图不是必需成比例的,且本发明的某些特征可按比例放大或为清楚及简洁目的而以示意形式示出。
发明详述
本领域技术人员知晓在不偏离本文揭示的本发明范围及精神之下,对本发明可作各种替代及修改。A.定义
本文所用术语“中度串联重复”或“ITR”指含有串联至少两次的5~7个碱基序列的DNA序列的一区域。术语ITR也包括这样的DNA区域,其中多于一个单一5~7碱基序列是串联重复的,或具有间插碱基,条件是至少一个该序列至少串联重复2次。在ITR内至少重复一次的每个序列本文称为“重复单位”。
“ITR多态性”指基因组DNA中的一个ITR,其主要由于每个染色体相同区域中重复单位数的不同而使个体群中的染色体长度变化。
根据本发明鉴别和分析的中度串联重复序列可被分为二类:完全的和不完全的。本文所用术语“完全的”ITR指含有至少串联重复二次的单一5~7个碱基重复单位的双链DNA区域,如(AAAAT)12。术语“不完全的”ITR指含有至少二个串联完全重复单位个至少一个不完全重复单位的DNA区域,其中不完全重复单位由得自完全重复单位的序列中插入,缺失或取代1,2或3个碱基的DNA序列组成,如(AAAAT)12(AAAAT)5AAT(AAATT)4。每个不完全ITR序列含有至少一个完全ITR序列。特别地,每个ITR序列,不管是完全的还是不完全的,均包括至少一个至少串联出现2次的重复单位序列,该重复单位序列可以公式(I)代表:
(AwGxTyCz)n (I)其中A,G,T代表可以是任何顺序的核苷酸;w,x,y和z代表序列中每个核苷酸的数目,并在0~7范围内,w+x+y+z的范围在5~7之间;n代表序列串联重复的次数,且至少为2。
“五核苷酸串联重复”指以上所定义的“中度串联重复”多态性的一亚类。除非特殊提及,术语“五核苷酸串联重复”包括完全ITRs,其中重复单位是5个碱基的序列,及不完全ITRs,其中至少一个重复单位是5个碱基重复。
“DNA标记”指含有一ITR序列的DNA片段,如含由扩增基因组DNA一区域产生的ITR序列的DNA片段。每个标记含有一最终衍生自一群体中的一个单独个体基因组DNA的一个单等位基因。
术语“基因座“指DNA的特殊区域。当用于阐述基因组DNA的区域时,“基因座”指染色体上的特定位置。就群体中的任何个体而言,相同基因组基因座在每对同源染色体上相同位点出现。每个这种染色体上相同基因座的DNA序列,或在源自相同的这种染色体的DNA的相同基因座的DNA序列,称为“等位基因”。
术语“多态性”指相同物种个体生物体组成的群体的基因组DNA中发现的在至少2个染色体上见到的基因座的等位基因的变化。术语“多态性”包括得自克隆入其它载体如DNA载体的染色体片段或另一种生物体的染色体DNA的相同基因座的DNA序列的变化。
本文所用术语“ITR侧翼序列”指相邻于含ITR的DNA序列一条链上的ITR的核苷酸序列。包括ITR侧翼序列作为其全部序列一部分的序列本身是侧翼序列。
术语“寡核苷酸引物”是一种分子,其含有3个以上脱氧核糖核苷酸或核糖核苷酸。尽管每个引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,则与模板结合越好。其精确长度和序列将依于许多因素,涉及寡核苷酸引物的最终功能及使用,包括温度,引物序列,及使用方法。本发明的每个寡核苷酸引物包含一互补于位于ITR序列侧翼的DNA标记序列的核酸序列。本发明的寡核苷酸引物当置于一定条件下时,能作为合成起始点,该条件是诱导互补于一核酸链的引物延伸产物的合成的条件。该条件可包括存在核苷酸和诱导剂如DNA聚合酶,合适温度及pH。在优选实施方案中,该引物是足够长的单链寡脱氧核糖核苷酸,以在存在诱导剂下引导从特定序列合成延伸产物。寡核苷酸引物的敏感性及特异性通过引物长度及所供DNA模板样品中序列的独特性确定。在本发明中,寡核苷酸引物通常大约15个碱基以上,且优选大约20~40个碱基长。
术语“寡核苷酸引物对”指一对引物,每个引物均含互补于位于相同ITR侧翼的双链DNA相反链的脱氧核糖核苷酸或核糖核苷酸的序列。本发明的每对寡核苷酸引物优选地选择用以检测单一ITR。尽管每对引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,与模板结合越好。
术语“延伸产物”指从寡核苷酸引物3’末端合成的核苷酸序列,其互补于寡核苷酸与之结合的链。
术语“寡核苷酸探针”指单链DNA或RNA分子,其包括互补于靶序列的一部分的序列,靶序列例如DNA样品的中度串联重复序列,其中互补性部分的长度足以使探针与靶序列杂交。
术语“打滑假象”指当检测靶DNA的一或多个分子时,观测到的特定类型的假象,其中靶DNA含有相同重复单位序列的串联重复,包括根据本发明检测和分析的靶中度串联重复序列。在通过长度如用凝胶电泳分离样品中所有DNA之后,检测到含任何该靶DNA样品时,每个靶DNA分子产生一主要信号(如在凝胶上的主要条带);但在接近每个主要信号处可检测到次要信号。次要信号通常产生自DNA片段的检测,其由于靶DNA序列的一或多个重复单位的加入或缺失,而在长度上与靶DNA不同。打滑假象已归因于在DNA的体内和体外复制期间滑动链的错配。如参见Levinson和Gutman(1987),Mol.Biol.Evol.,4(3):203-221;及Schlotterer和Tautz(1992),Nucleic Acids Research 20(2):211-215。当含有任何这种重复序列的DNA用如PCR扩增法体外扩增时,此假象尤为明显,这是由于样品存在的或聚合期间产生的任何次要片段随主要片段一起扩增。
术语“打滑假象百分率”指在得自单一来源如单菌落细菌或基因组DNA的单一染色体的DNA样品中,观测的次要(即假象)信号幅度与主要(即靶)信号幅度的对比。打滑假象百分率可在未扩增的DNA上测定,但优选在至少一个靶中度串联重复序列扩增后测定。术语“打滑假象平均百分率”指在对一个群体至少20个等位基因的代表样品检测测定的打滑假象百分率平均而得。
术语“基因组DNA”指最终衍生自基因组DNA的任何DNA。该术语例如包括异源生物体中的克隆的DNA,整个基因组DNA,及部分基因组DNA(如单一分离的染色体的DNA)。
根据本发明检测或分离的DNA可以是单链或双链的。例如:适用于本发明的单链DNA可得自噬菌体、细菌或基因组DNA的片段。适用于本发明的双链DNA可得自一些含有具有中度串联重复序列的DNA的各种不同来源中的任一种,包括噬菌体文库,粘粒文库,和细菌基因组DNA或质粒DNA,及分离自任何真核生物的DNA,包括人基因组DNA。DNA优选得自人基因组DNA。可以使用任一不同来源的人基因组DNA,包括医学或法医样品如血液,精液,阴道拭物,组织,头发,唾液,尿液及体液混合物。该样品可以是新鲜的,陈旧的,干燥的和/或部分降解的。此样品可收集自犯罪现场。
B.分离含ITR的多态DNA标记的方法:
本发明的一实施方案是用杂交选择分离含ITR的DNA片段的方法。该方法包括以下步骤:(a)提供多个DNA片段,其中至少一个DNA片段含有ITR;(b)提供结合有至少一个寡核苷酸的支持工具,其中此寡核苷酸包括互补于中度串联重复序列一部分的核苷酸序列;(c)将所述的多个DNA片段与支持工具在一定条件下组合,其中包括任何含ITR序列的DNA片段的DNA片段与支持工具杂交。
此方法(a)步提供的多个DNA片段可通过任何含ITR的DNA样品片段化而得,但优选通过基因组DNA片段化而得,如见并入参考的《人类遗传学当前方案》(1994),第2章:从基因组DNA构建小插入片段文库,p.2.2.1。制备(a)步所用的多个DNA片段的最优选方法可根据以下步骤进行:片段化DNA样品,从而产生DNA片段群,其中至少一个DNA片段含有ITR;将含有引导序列的接头与DNA片段群中每个DNA片段的至少一个末端连接;用含互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。不同的接头可连于每个片段的每个末端。但是,优选将单一接头连于每个末端,以使能用具有互补于接头引导序列的序列的单一寡核苷酸引物扩增。接头连接优选在有连接酶的情况下进行,如T4DNA连接酶。
可用任一工具产生本发明方法(a)步中提供的多个DNA片段,包括用超声处理或用至少一种限制酶片段化,当然只有双链DNA可用限制酶片段化。当限制酶用于片段化双链DNA样品时,其优选是具有4碱基对识别序列的限制酶,其留下单链的突出端,并且不切割DNA样品内感兴趣的ITR区。用于片段化双链DNA样品的优选限制酶包括MboI,AciI,BfaI,DpnII,HhaI,Hin PII,HpaII,MseI,Nla III,Sau 3AI,TaqI,Csp6I,和TaiI。
如上述产生的接头连接的DNA片段随后用扩增反应扩增,如PCR(美国专利4,683,202,Mullis,K.B.),基于核酸序列的扩增(NASBA)(Kievits等(1991)J.Virol Merthods 35(3):273-286),连接介导的扩增(Volloch等(1994),Nucleic Acids Res 22(13):2507-2511),链置换扩增(SDA)(Walker等(1992)PNAC 89(1):392-396),序列不依赖的单引物扩增(SISPA)(Reyes(1991)Mol CellProbes 5(6):473-481)或连接酶链反应(美国专利5,686,272,授予Narshall等)。
在方法(b)步中提供的支持工具包括具有至少一个与其相结合的靶寡核苷酸的固定支持物。此固定支持物优选包括一能与寡核苷酸直接或间接偶联的物质,能与寡核苷酸直接偶联的合适物质包括硝基纤维素,尼龙,玻璃,二氧化硅,及乳胶。用于本方法这一优选实施方案的合适的固定支持物例如包括尼龙膜,用二氧化硅颗粒包埋的滤膜,玻璃珠,二氧化硅磁性颗粒,或含二氧化硅的树脂。通过与寡核苷酸结合的第一个偶联剂和与固定支持物表面结合的第二个偶联剂而能与寡核苷酸间接偶联的合适物质包括亲和素和链亲和素,或抗原及其抗体。
与固定支持物相结合的所述至少一个靶寡核苷酸包括互补于DNA片段中度串联重复序列一部分的核苷酸序列。术语“部分”指足够长的DNA片段的ITR区域中的核苷酸序列,当具有互补于该序列的序列的寡核苷酸与其接触时,发生杂交。“部分”优选至少20个碱基,更优选至少40个碱基长。靶寡核苷酸更优选具有(AwGxTyCz)n公式特征的序列,其中A,G,T和C代表可以是任何顺序的核苷酸;w,x,y,z代表序列中每个核苷酸数目,范围在0~7,且w+x+y+z在5~7范围内;n代表序列串联重复的次数,且至少大约4次,更优选至少大约8次,最优选至少大约15次。
在本方法(c)步中,所述的多个DNA片段与支持工具在一定条件下组合,其中含ITR的DNA片段与支持工具杂交。当该多个片段是多个双链DNA片段时,此DNA在与支持工具杂交前变性。在与支持工具杂交前使双链DNA片段变性的合适方法包括将DNA暴露于足够高的使双链DNA变性的温度,或将DNA悬浮于变性溶液中。此DNA优选用含变性剂如碱(例如NaOH或KOH)的变性溶液变性。当用碱变性DNA片段时,所得混合物的pH优选调正至大约中性pH,优选通过在混合物中加入pH4.8的缓冲液而调正。
一旦DNA片段已与支持工具杂交,优选洗涤此支持工具以除去未杂交的DNA片段及任何存在于含有支持工具的溶液中,或在支持工具表面上的未杂交的其它物质。所用任何洗涤液优选配制成除去如此物质而不释放与支持工具杂交的DNA片段。
与支持工具杂交的DNA片段用加热或合适释放溶液,根据支持工具与DNA片段间结合性质,可从支持工具中释放。例如水或低盐水溶液如TE缓冲液(如10mM Tris-HCl,pH7.5,lmM EDTA)可用于释放与由二氧化硅组成的支持工具杂交的DNA片段。一旦从支持工具释放,此DNA片段可被处理以从存在于释放的DNA片段的所得混合物中的其它DNA片段中分离含ITR序列的DNA。附加处理步骤可包括根据上述方法再杂交和筛选,或克隆入DNA载体及筛选克隆的转化体。
图1图示了分离含ITR的DNA片段的方法的优选实施方案,其中制备DNA片段群,与支持工具杂交,扩增,克隆,并筛选含ITR的转化体。图1中图示的每个步骤均用罗马数字标记。步骤I示出用限制酶(2)消化的双链DNA(1)的分子,产生不同大小的DNA片段群(未示出),其中至少一个包括靶ITR。步骤I和II间的箭头图示将接头(3)加入DNA片段群中以产生在两类不同DNA片段的末端具有接头(3)的接头连接的片段(8),所述的两类不同DNA片段为具有靶ITR序列的片段(6)和没有靶序列的片段(4)。将具有互补于每个接头(3)的引导序列的序列的寡核苷酸引物(7)在第III步中加入DNA片段(8)群中,并通过PCR扩增该DNA片段(8)群,从而产生扩增的DNA片段(9)群。在第IV步中,将扩增的DNA片段(9)群置入具有杂交溶液(12)和结合有至少一个寡核苷酸的滤膜(10)的容器(15)中,该寡核苷酸具有互补于靶ITR序列的一部分的序列。杂交溶液促进含ITR序列的DNA片段与滤膜的杂交。在第V步,将滤膜(10)从容器(15)中除去,并从中释放与其杂交的DNA片段。在第VI步,再扩增所得富集的释放的片段群,使用第III步中扩增反应中使用的相同寡核苷酸引物。最后在第VII步将富集的扩增的DNA片段群的每个片段克隆入质粒载体(18)中。第VII步示出用具有靶ITR序列的片段(6)克隆的载体及用没有ITR序列的片段(4)克隆的载体。
C.检测具有低打滑多态ITR的方法
当根据本发明方法的这一具体实施方案检测具有靶ITR序列的DNA样品的该序列时,观测到最小打滑假象。观测的平均打滑假象优选不超过1.1%,更优选不超过0.9%。靶ITR序列可以是完全ITR或不完全ITR序列。检测的DNA样品优选是基因组DNA。
优选在DNA样品中ITR序列扩增后观测平均打滑假象。
D.引物、探针和标记
本发明还包括以下序列表中SEQ ID NOS:1~43所示的DNA标记,引物,其中每个引物的序列互补于位于由43个序列中的一个序列所示的DNA标记的ITR区侧翼的序列,及探针,其具有互补于43个标记之一的ITR区内所含序列的序列。实施例中实验鉴别的特别优选的引物列于下表1。
表1
标记SEQ IDNO | 克隆号 | 引物SEQ IDNO | 上链引物&下链引物 |
1 | C074 | 44 | TGGCTCAGACACCTCATTG |
45 | CACCACTGTATTCCCAGTTTG | ||
2 | C221 | 46 | CACTTGCCATCCCTGCCACACA |
47 | AGCGCACCCCCAATTTCCGGTAT | ||
C221 | 48 | TGGGGACATGAACACACTTTGC | |
49 | GAGGCCCAGGACCAGATGAAAT | ||
C221 | 50 | CACCTGTCAGGCAAGGCTTAAAC | |
51 | CAACACTGAGCGCTTTTAGGGACT | ||
C221 | 52 | TCAGGCAAGGCTTAAACAGGGATA | |
53 | ACACTGAGCGCTTCTAGGGACTTC |
标记SEQ IDNO | 克隆号 | 引物SEQ IDNO | 上链引物&下链引物 |
C221 | 52 | TCAGGCAAGGCTTAAACAGGGATA | |
54 | TGAGCGCTTCTAGGGACTTCTTCA | ||
C221 | 55 | CCCTGCCCTACCCACTTG | |
56 | AGGCCCAGGACCAGATGA | ||
C221 | 57 | GCACCTGTCAGGCAAGGCTTAAAC | |
58 | CCAGCCATGAAGTGGCTGTGAG | ||
3 | C240 | 59 | CCCGCTTCAAAGTTCCCAGTTC |
60 | CCTCCCATTTCAGCCTCCTGA | ||
4 | C331 | 61 | GTCTGCCACAGTGCTGGAAACTAA |
62 | GCACCCCAGCCTAAGGCAATA | ||
5 | C362 | 63 | GCATGGCGGAAGAAACAA |
64 | TGGCAACAGAGCGAGACTC | ||
6 | C390 | 65 | CCTGGGTGACAGCGAGAATCT |
66 | TGTCCCTTGCCTTGTCTCACTAAA | ||
7 | G022 | 67 | CAGCCTTGGTGACAGAGCAAA |
68 | TGTGTTGAGGGTGGGGTACAT | ||
8 | G023 | 69 | CCTGGGCAAGAGAGCAAG |
70 | CACATCCCAAAACCACCCTAC | ||
9 | G025 | 71 | GCATTTCCCCTGCTTGTACT |
72 | GATCACATTTGCTAACCACTTCTC | ||
10 | G047 | 73 | GGCAACATATCAAGACCCCCATCTCT |
74 | GAAGCTGCCCCTCACCACTACATTTT | ||
11 | G065 | 75 | GATCACATTTGCTAACCACTTCTC |
76 | TATAAATTACCCAGTCTCAGGAAG | ||
12 | G085 | 77 | GTGATACAGCAAGCCTCATC |
78 | AGAGACTCCTGGAAAGATAAAAGT | ||
13 | G132 | 79 | GTCTGGAGAACAGTGGCCCTTGT |
80 | CAGGAAGCTGAGGCAGGAGAATCT | ||
14 | G145 | 81 | AAGGCTCCAGTGGGGTAT |
82 | AAAACAAGGCAGTAGTCAATAAAG | ||
15 | G152 | 83 | GGCATGAGAATCGCTTGAACCTG |
84 | GGCCTCCATGATGTTTCCAATGAT | ||
16 | G153 | 85 | TCAGGAGGCATGAGAATCGCTTGA |
86 | GGCCTCCATGATGTTTCCCAATGA | ||
17 | G158 | 87 | CTCGCCCTCTCCTATAAGCAGTTT |
88 | GCAGAGATAATTTGGAGTGGGATG | ||
18 | G181 | 89 | CTTGGGTGCCTGTAATCC |
90 | GGTAGAGCTCCCCCATCT | ||
19 | G210 | 91 | GCAGAATATTGGGGCTCATCAC |
标记SEQ IDNO | 克隆号 | 引物SEQ IDNO | 上链引物&下链引物 |
92 | AAACAAGGAAAGGAGAGGAGAGGA | ||
G210 | 93 | AAGGTTGTGGGATGACTACTACA | |
94 | TGGTCAACACAGCAAGACATT | ||
20 | G212 | 95 | TCCTGCCACCTGCTTGCTTTCT |
96 | ATTGCACTCCAGCCTGGGTGATAC | ||
21 | G233 | 97 | CGCTTGAGCCTTGGAGATTG |
98 | GAGCAGTCAGAATTCAGGAGTTGT | ||
22 | G234 | 99 | TGGGCAACAAGAGCAAAACTCCAT |
100 | GGGACTTGGGCTGAGGGCTTTAC | ||
23 | G235 | 101 | ATATCAATATCAGGCAGCCACAGG |
102 | CCGTTTCAGAGCAGAGGTTTAGC | ||
24 | G331 | 103 | TCTCATTGGTTTCAAAGAACTTA |
104 | AGACTCCATCTCAAACAAAAGA | ||
25 | G405 | 105 | TCATGTGCATGGAGCCTGGTTCAT |
106 | CCCAGCCTTGGCAAGAGTGAGGT | ||
26 | G475 | 107 | GGCGACTGAGCAAGACTC |
108 | TTAAGCAAAGTAGCCTCAAACA | ||
G475 | 109 | GGGCGACTGAGCAAGACTC | |
110 | ACTCATTACCTTGCATGCATGATA | ||
G475 | 107 | GGCGACTGAGCAAGACTC | |
111 | CATTACCTTGCATGCATGATA | ||
27 | G539 | 112 | TGGGCAACAGAGTAAGACTCA |
113 | GTTCAGTACCGTTCACCTCTTTA | ||
G539 | 114 | GTAAGACTCAGTCTCCAAAAAAAAAAAAAG | |
115 | AGGAATGGTTTCTCTGTTAGTAAATGGT | ||
28 | S023 | 116 | CAGCCTGGGCAACAAGAATGAAAC |
117 | TGGCCCCTGCAGCGGAGTC | ||
29 | S071 | 118 | GAATTCATTTGCGGAAAGATT |
119 | CTAGGGAGGCTGGAGTATTCA | ||
30 | S085 | 120 | AGAGCAAGACCCCGTCTCAT |
121 | AGTCCATGGGCCTTTTAACA | ||
31 | S125 | 122 | GAGAATCACTTGAACCCAGGAAG |
123 | AGAACCAGCTGTTAGTTTCGTTGA | ||
32 | S132 | 124 | GGTTGCAGTGAGCCGAGATAAGAGT |
125 | TGTGCCAGGAACCAGAAATTTACAG | ||
33 | S136 | 126 | GGCCCAAGGTTACTTTTCAC |
127 | GGGCCACTGCACTCCT | ||
34 | S159 | 128 | CATGGTGAGGCTGAAGTAGGAT |
129 | GTGGCGTGTCTTTTTACTTTCTTTA |
标记SEQ IDNO | 克隆号 | 引物SEQ IDNO | 上链引物&下链引物 |
35 | S176 | 130 | AGGCAGCCCAGGAACAAT |
131 | CCAAGATAGCGGCCAAGATAGT | ||
36 | S189 | 132 | GAGGGCAGCTGGGATGTTACTCTT |
133 | TGCCCTGTTTGGAGAACTGTAGGT | ||
37 | S199 | 134 | CTCCCCAGAAACAGATGTA |
135 | GTGAGCCGAGATTGTATCAT | ||
38 | S040 | 136 | TCGGGGACAGGGCTTACTC |
137 | ATCATTGTCGCTGCTACTTTATCG | ||
39 | S066 | 138 | CTACTCTACCCCATTTCATTC |
139 | GTAGAGTGGAGTGGATGAGA | ||
40 | S077 | 140 | ATCAGGCAAAAACGAACAAAC |
141 | CGGCATCCCAAAGTGAC | ||
41 | S097 | 142 | CAGAGAGGGCAGCACCTTGGACAG |
143 | GGCTTCACCTGCTCCCGTTTCAG | ||
42 | S103 | 144 | TCTGCCCATTCCCCAGCCTCTC |
145 | TACCGCGTGGCATTCAAGCATAGC | ||
43 | S110 | 146 | TCCAGTCTGGGTGACAAA |
147 | CAATCCACTCCACTCCTCTA |
以下实施例是通过举例说明,而非以任何方法限制本发明。在实施例中,所有百分比如果针对固体则是重量百分比,如果针对液体则是体积百分比,除非特殊指出,所有温度是摄氏度。
实施例1:构建全基因组PCR文库
实施例1和以下实施例2中所用的特殊扩增及杂交选择技术,是对Armor,J.等,(1994)Hum Mol Genet 3(4):599-605中所述选择方法的修改形式。
人基因组DNA是用标准苯酚:氯仿提取程序,从15个个体的集合全血中纯化的(人类遗传学当前方案(1994),Gilber,J.编辑,附录)。
将大约100μg基因组DNA用5单位MboI限制酶/μgDNA在37℃切割16小时,随后用苯酚:氯仿提取,乙醇沉淀进行纯化,在100μlTE缓冲液中(10mM Tris-HCl,lmM EDTA,pH8.0)再悬浮,终浓度为大约1μg/μlDNA。
将在250-600bp范围的DNA片段在1%Seakem GTG(FMCBio Products,Rockland,Maine)制备琼脂糖凝胶上(15×29cm),通过在100v凝胶电泳1.25小时而分离,并通过电洗脱回收(参考),通过在A260测定吸收值对DNA定量,并在无菌超纯(nanopure)水中稀释至500ng/μl并储存在-20℃。
通过将等摩尔量的寡A(5’-GCG GTA CCC GGG AAG CTTGG-3’)和5’磷酸化的寡B(5’-GAT CCC AAG CTT CCC GGGTAC CGC-3’)退火至终浓度为1,000pmd/μl制备接头。将1μg大小选择的插入DNA(3.5pmol,平均大小为425bp)与13μg(875pmols)的接头(250:1接头:插入物摩尔比率),用1~3单位的T4 DNA连接酶在15℃连接16小时。通过凝胶电泳(1%Seakem GTG琼脂糖,1.5小时,100v)从原始片段中分离过量的接头和接头二聚体。通过电洗脱从凝胶中回收接头连接的DNA片段,并在50μl无菌水中再悬浮。
将具有连接接头的DNA(50ng),在含有10μl 10×STR缓冲液(50mM KCl,100mM Tris-HCl,pH9.0,15mM MgCl2,1%Trition X-100和2mM每种dNTP),1μl Taq聚合酶(5U/μl),和1μM寡A引物(10μl 10pmol/μl储存液)的100μl反应体积中用PCR进行扩增。在此反应中用作引物的“寡A”与上述用于装配MboI接头的“寡A”相同。循环条件是95℃1分钟,67C1分钟,70℃2分钟,循环30次。通过用Centricon-100s微滤(向样品中加入2ml无菌水,并加载Centricon-100s,在2,000RPM旋转2分钟,倒置Centricon滤膜并在2000RPM旋转2分钟以回收DNA,在100μl无菌水中重悬浮)除去dNTPs,引物和引物二聚体。将5μl等份的所得PCR文库在1%琼脂糖凝胶上检验(1小时,100v),以证实大小在250~600bp范围之间。
实施例2:通过杂交选择而富集五核苷酸重复
将根据实施例1产生的含有各种不同重复的全基因组PCR文库中的DNA片段,用不同的与固体支持物相结合的寡核苷酸混合物,通过杂交富集。将含有(AAAAX)n五核苷酸重复的片段通过杂交选择而富集。此方法通过首先构建用于杂交选择的寡核苷酸而完成,该寡核苷酸由大约1000bp长的(AAAAC)n,(AAAAG)n和(AAAAT)n串联组组成。将这些寡核苷酸固定在膜上,并与全基因组PCR文库杂交,以选择那些含有(AAAAX)n重复的片段。
如下构建一组寡核苷酸:(a)合成5’磷酸化的30mer寡核苷酸(AAAAC)6,(AAAAG)6和(AAAAT)6及其互补寡核苷酸(GTTTT)6,(CTTTT)6和(ATTTT)6,并以1000pmol/μl浓度悬浮于超纯水中,(b)将等摩尔浓度(用10μl或10nmol或198μg)的具有互补序列的寡核苷酸组合,加热至65℃,15分钟,并在4℃放置12小时以互相退火,(c)然后将退火的寡核苷酸用每μgDNA 1Weiss单位的T4 DNA连接酶在15℃彼此连接过夜,(d)在1%Seakem GTG琼脂糖上,根据大小选择≥200bp的多联体,(e)将连接DNA进行无引物PCR以延长串联组,(f)将表观大小超过1000bp的片段从1%琼脂糖中回收,并通过微滤纯化。测定在A260的吸光度,并在无菌超纯水中制备成1μg/μl储液。
然后将总计1ug的(AAAAC)200,(AAAAG)200或(AAAAT)200寡核苷酸点在4mm×4mm尼龙HybondNfp滤膜上(Amersham LifeSciences,Inc.)用预杂交缓冲液振荡洗涤2次,每次30分钟,以除去弱结合的寡核苷酸,在空气中干燥,在1200μJoules进行UU交联结合DNA,然后在-20℃贮存。
全基因组PCR文库与上述获得的与尼龙滤膜结合的寡核苷酸的支持介质的杂交选择如下进行:(a)将滤膜在1ml预杂交缓冲液(1%BSA(SigmaB-4287),1mM EDTA,pH8.0,7%(w/v)SDS,0.5MNa2HPO4)中,对于含有(AAAAC)n和(AAAAG)n序列的寡核苷酸的滤膜在40℃预杂交,对于含有(AAAAT)n序列的寡核苷酸在37℃预杂交。20分钟后,除去缓冲液,并加入100μl新鲜预杂交缓冲液,(b)用碱(KOH,终浓度150mM)将全基因组PCR文库DNA(20μg)变性,通过加入0.25体积的1M Tris-HCl pH4.8中和,并加入含滤膜的缓冲液中。将所得反应混合物在37℃或40℃预杂交温度培养过夜,(c)用1ml洗涤缓冲液#1(40mM Na2HPO4,pH7.2,0.1%SDS)在40℃将(AAAAC)200和(AAAAG)200滤膜洗涤2次,及在室温振荡洗涤1次,每次15分钟。(AAAAT)200滤膜用1ml洗涤缓冲液在37℃洗涤1次及在室温洗涤1次,(d)与每个滤膜结合的DNA,通过在100μl无菌纯水中加热至95℃5分钟而释出。在95℃将样品除去,以防止再退火。将滤膜剥离(stripped),并通过在0.4M NaOH中在45℃保温30分钟,然后转移至0.1×SSC,0.1%SDS,0.2M Tris pH7.5中并再保温15分钟而再利用。将此膜印迹干燥并在-20℃贮存在密封管中。
实施例3克隆DNA片段的五核苷酸重复富集文库
将根据实施例2的富集五核苷酸重复的DNA片段群,通过PCR再扩增。然后将再扩增的片段克隆入质粒载体pGEM-3Zf(+)中,如下述。此方法通过将选择的插入物与pGEM载体连接,然后将环化的质粒转化入JM109 E.Coli宿主中而进行。
插入物与载体的连接如下进行:(a)将5μl杂交选择的DNA在100μl反应体积中,用1XSTR缓冲液(50mM KCl,10mM Tris-HCl,pH9.0,1.5mM MgCl2,0.1%Triton X-100,和0.2mM每种dNTP),1μlTaq聚合酶(5U/μ1),及1μM寡A引物(1μ1 100pmol/μl储液)进行再扩增。循环条件是95℃1分钟,67℃1分钟,70℃2分钟;循环30次。(b)通过向100μl PCR反应物中加入11μl Promega限制酶10×缓冲液C,和2μl(8U/μl)MboI,在37℃将所得反应混合物保温过夜而用MboI消化再扩增的DNA,并通过在65℃将混合物保温20分钟加热灭活限制酶。(c)通过用BamHI(5U/μg)在37℃消化16小时,随后加入适量小牛小肠碱性磷酸酶10×缓冲液(Promega)和1μlCIAP(U/μl)并在37℃保温1小时,制备用于进行片段插入的pGEM-3Zf(+)载体(约20μg或10.6pmol)。通过加入0.5M EDTA至终浓度为0.02M而终止此反应。乙醇沉淀及以1g/μl重悬浮于TE缓冲液中,然后用苯酚提取。(d)最后,在室温将1μl用MboI切割的DNA(见b步)与1μl或200ng去磷酸化的pGEM 3Zf(+)(见c步)和1μlT4 DNA连接酶(1~3U/μl)保温2小时,进行20μl插入物-载体连接。
最后,用Technical Bulletin #095所述Promega转化法,将10μl的插入物-载体连接反应转化入100μl JM109感受态细胞中。
实施例4通过菌落杂交选择含有(AAAAX)n五核苷酸重复的小插入片段基因组文库
用Lightsmith II试剂和方法(见Promega Technical Bulletin#TM227)经菌落杂交筛选选择含有(AAAAX)n五核苷酸重复的克隆,并通过与碱性磷酸酶辍合的探针杂交而显色。
将MagnaGraph尼龙膜(Micron Separations,Inc.Westboro,MA)置于含有细菌菌落的平板上,搁置3分钟,然后在干燥滤纸上印迹而将菌落DNA转移至膜上,接着将此膜转移到一系列含10%SDS托盘中,放置3分钟,然后转移至含5ml NaOH+30ml 5M NaCl+65mldH2O的变性液中放置5分钟,然后转至由30ml 5M NaCl+25ml MTris-HCl,pH7.4+45ml dH2O组成的中和溶液中放置5分钟,最后转至2XSSC中放置5分钟。然后将此膜在室温干燥30分钟,随后用Statalinker_(Stratagene,La Jolla,CA)用1200ufoules UV交联。
借助于AP缀合的探针和化学发光物,检测含有具有(AAAAX)n重复的克隆的菌落。将与AP缀合的探针杂交的滤膜在X线下曝光表明菌落含所需克隆。进行第二次杂交以证实初始结果。
检测程序利用Promega的Lightsmith II试剂盒(见PromegaBulletin#TM227关于程序的详述)。简而言之,所用检测程序由以下步骤组成:(a)在Quantum Yield_封闭溶液(Promega Cat No F1021)中,将滤膜在56℃强力振荡培养45分钟,(b)到出封闭溶液,并每cm2含AP探针的膜加入0.05ml Quantum Yield_高严格性杂交溶液(Promega Cat No F1231),并在56℃强力振荡培养45分钟,(c)从滤膜中到出杂交/探针溶液,并用150~200ml在56℃预热15分钟的洗涤液#1(2×SSC,0.A%SDS)洗涤2次,(d)组合所有滤膜,并用洗涤液#2(1×SSC)在室温下洗涤1次,10分钟,(e)在200ml 100mM二乙醇胺,1mM MgCl2中平衡印迹5分钟,(f)加入足够的0.25mM CDP-Star底物(Tropix Bedford,MA),以饱和滤膜,然后在室温至少培养5分钟,(g)将底物饱和的滤膜置于杂交折叠器(folder)中的聚苯乙烯塑料片防护器上,并关上折叠器,(h)将含滤膜的杂交折叠器放在底片盒中,并将所含的滤膜曝光于X光胶片,(i)在曝光至少1小时之后,显色底片。
实施例5 DNA测序和分析
一种简便的利用细胞裂解物制备测序模板的方法被开发出,以对实施例4中鉴别的可能含有带有至少一个(AAAAX)n序列的插入物的大量克隆进行测序。此方法包括将菌落杂交分析中的阳性克隆转移至含200μl LB/Amp(100μl/ml)的无菌96孔微滴定平板中(Falconcat.#3072),在250rpm,37℃培养过夜。接着,将过夜培养物分开,并用于三种不同方法,包括制备细胞裂解物,从第二次杂交中制备复制滤膜以证实初始发现,或制备甘油储液以长期贮存克隆。
取2μl过夜培养物并将其加入96孔反应平板(Perkin Elmer Cat#N801-0560)中的100μl无菌超纯水中,在9600热循环仪中加热至100℃4分钟,以产生细胞裂解物。然后冷却,冰冻,并在-20℃贮存直至使用。
经灼烧将96-针复制器灭菌,将此复制器蘸含过夜培养物的96孔平板中,印迹在LB/Amp(100ug/ml)平板上的137mm圆形尼龙膜(MagnaGraph,MSI),在37℃将此膜培养过夜,从而制备复制滤膜以进行第二次杂交。
向每个孔中加入46μl 80%甘油,并将平板放在振荡培养器中,以250rpm振荡几分钟至混合,然后在-70℃贮存,以将剩余过夜培养物转变为甘油储液。
选择在二个菌落杂交分析中是阳性的所有克隆,并将细胞裂解物平板的相应克隆用于PCR扩增。用Qiagen QIAquick 96 PCR纯化平板(cat #28180)纯化PCR反应产物,并用模板进行测序。将2μl细胞裂解物用于含有2μM M13-47正向引物(Promega cat,#Q560A)和2μM M13反向引物(Promega cat.#Q542A),1×STR缓冲液和2.5单位Ampli Taq(Perkin Elmer)的50μl PCR反应中。在PE480热循环仪上使用以下循环曲线:在96℃/2分钟循环1次;在94℃/1分钟,56℃/分钟,70℃/1.5分钟循环10次;在90℃/1分钟,56℃/1分钟,70℃/1.5分钟循环20次;在4℃保持。根据生产者之建议用Qiagen QIAquick 96 PCR纯化平板(cat.#28180)净化PCR反应产物,并回收入70μl Tris-HCl 10mM pH8.5,终浓度大约35ng/μl,并在-20℃贮存。
用ABI染料终止测序化学和ABI377测序仪进行DNA测序。用ABI染料终止试剂盒和生产商方案(Protocol P/N 402078)制备测序模板。将2μl或大约30~90ng纯化的PCR产物(上述)用作DNA模板进行测序反应。此测序反应包括8μl染料终止剂混合物,2μlDNA模板(35ng/μl),4μl 0.8M M13-21正向引物,和6μl无菌超纯水,在GeneAmp PCR System 9600上循环测序循环曲线为:在96℃/10秒,50℃/5秒,60℃/4分钟循环25次,保持在4℃,在每个试管中加入50μl 95%乙醇和2μl 3M乙酸钠,pH4.6,用涡流混合,置于冰上10分钟,然后在最大速度离心30分钟,从而纯化延伸产物。将粒状沉淀用250μl 70%乙醇漂洗,真空离心约3分钟脱水,并在-20℃干燥贮存直至使用。然后将干燥的粒状沉淀再悬浮于6-9μl加样缓冲液中,然后在95℃变性2分钟,并在冰上贮存直至加样于凝胶上。
根据生产者之方案制备5%Long Ranger凝胶(FMC Bio Products,Rockland,ME),并聚合2小时。将此凝胶在1000v预电泳45分钟。将加样缓冲液中的1.5μl模板加样于凝胶上,并在2×或4×条件下分别电泳3.5小时或7小时。
将产生自ABI 377测序仪的DNA序列数据进行编辑,以除去任何pGEM载体序列,然后置入局部数据库,该数据库是用遗传学计算机组Wisconsin软件包版本9.0(Madison WI)产生的,含有所有被评价克隆的序列信息。接着,测试克隆中是否存在五聚体重复,及其长度和序列模式。然后将那些含有5或更多个重复的克隆,用BLAST序列对比程序(Alargland et al;1990)比较,以鉴别复制的克隆和那些已存在于美国马里兰州Besthesda的国立生物信息中心的GenBank数据库中的克隆。一旦鉴别出独特的克隆,借助于寡聚物引物分析软件版本5.0(National Biosciences,Inc,Plymouth,MN)设计PCR引物。
实施例6筛选多态水平的克隆及测定染色体位置
在二个集合的DNA样品上进行初始多态性筛选,一个样品含有15个随机个体的人基因组DNA,另一个含有取自NIGMS人类遗传突变细胞贮存处(CEPH Collection DNA pool,cat.#NA 13431,CoriellCell Repositories,Camden,NJ)的54个CEPH个体的基因组DNA。荧光标记的PCR引物用于基因组DNA靶基因座的PCR扩增,并将PCR产物在聚丙烯酰胺凝胶上分离,并在荧光扫描仪上显色。将那些具有4个等位基因和50%杂合性的基因座随后用16个个体CEPH DNAs(102-1,102-2,884-1,884-2,1331-1,1331-2,1332-1,1332-2,1347-1,1347-2,1362-1,1362-2,1413-1,1413-2,1416-1,1416-2)测试,以测定初步杂合值。然后进一步分析相同基因座的数据,以确定等位基因数,等位基因频率和杂合值。(见表2)
将发现的含有五聚体重复序列并符合≥4个等位基因和≥50%杂合性的选择标准的克隆作图,以测定精确染色体位置(见表2)。有三种不同方法用于作图:(1)用代表单个人染色体的NIGMS组26个体细胞杂种(Coriell Cell Repositories,camden,NJ)进行体细胞杂种作图,以鉴别染色体起源,(2)利用GeneBridge 4RH组的93个RH克隆(Schuler et al;1996)进行辐射杂种作图的技术,和(3)标准减数连锁作图技术和8个取自CEPH同源参考组的家族(K102,K884,K1347,1362,1331,1332,1413,1416)并用CRI-MAP多点连锁程序(Lander & Green,1987)作图。
在对含有100个以上来自4种主要种族包括非洲人,白人,亚洲人和西班牙人的较大群体研究中,评价了16个CEPH个体中杂合值超过70%的克隆的基因型和等位基因出现频率。图10和11图示扩增自群体中24个不同个体基因组DNA样品中(DNA样品S02~S25)2个不同多态ITR基因座的等位基因迁移的广泛变化。用于此分析的引物对序列见上表1。用荧光标记的引物扩增每个五核苷酸重复基因座,随后在聚丙烯酰胺凝胶上分离,并经FMBIO II荧光扫描仪(Hitachi Software Engineering America,Ltd,San Francisco,CA)扫描显色,而产生凝胶图象。含有每个分析的基因座的大多数已知等位基因的等位梯包含在电泳凝胶两头的泳道中,即S01和S26泳道中。用于扩增每个基因座的引物对具有互补于分离自克隆S159或克隆G210的分离的DNA标记的序列至少一部分的序列,如以下实施例所示。此引物对序列选自上表1列出的克隆S159和G210引物对。
进行多态性筛选的PCR条件如下:25μl含大约200ng集合的DNA模板或25ng个体CEPH DNAs,1×STR缓冲液,1单位Taq聚合酶,和1μM相应引物对的反应物。用于扩增表2所列每个克隆的每个引物对序列见表1中所列。注意到每个引物以表1所列的SEQ ID NO表示。Perkin-Elmer Gene Amp PCR System 9600热循环仪(Perkin-Elmer Foster City,CA)的循环条件是:96℃1分钟,然后在94℃,30秒,68秒内缓升至60℃,保持30秒,50秒内缓升至70℃,保持45秒,循环10次,随后90℃30秒,60秒内缓升至60℃,保持30秒,50秒内缓升至70℃,保持45秒,60℃,30分钟循环20次。将2.5μl每个样品与2.5μl 2×溴酚蓝加样液混合以制备PCR样品,在95℃加热2分钟以变性,冰冻,然后将3μl每个样品在4%聚丙烯酰胺凝胶上,在40W电泳50分钟。将此PCR产物通过Hitachi FMBIO荧光扫描仪扫描显色,并用所附软件分析(FMBIO Analysis Version 6.0,Hitachi Software Engineering,San Francisco CA)
表2
SEQIDNO. | 克隆号 | GenBank登录号 | 观察到的最长ITR序列 | 观察到的等位基因号 | %杂合性(白种人) | 染色体位置 |
1 | C074 | none | [TTTTG]9 | 6 | 75 | 1 |
2 | C221 | none | [GTTTT]13 | 7 | 78 | 9p |
3 | C240 | none | [CAAAA]7 | 4 | 42 | NA |
4 | C331 | none | [GTTTT]10 | 5 | 43 | NA |
5 | C362 | none | [GTTTT]5 | 4 | 62 | 4 |
6 | C390 | none | [CAAAA]7 | 5 | 56 | NA |
7 | G022 | none | [AAAAG]6 | 4 | 63 | 2p |
8 | G023 | none | [AAAAG]10 | 12 | 71 | 16q |
9 | G025 | none | [AAAAG]6 | 12 | 86 | 1 |
10 | G047 | none | [AAAAG]9 | 5 | 86 | 2p |
11 | G065 | none | [TTTTC]6 | 13 | 100 | 1q |
12 | G085 | none | [AAAAG]11 | 8 | 93 | 10q |
13 | G132 | none | [CTTTT]15 | 12 | 100 | 4 qter |
14 | G145 | none | [AAAAG]13 | 8 | 33 | NA |
15 | G152 | none | [AAAAG]6 | 5 | 87 | 8 qter |
16 | G153 | none | [AAAAG]6 | 5 | 88 | 8 qter |
17 | G158 | none | [AAAAG]5 | 8 | 75 | 5q |
18 | G181 | none | [GAAAA]14 | 5 | 72 | NA |
19 | G210 | none | [CTTTT]6 | 9 | 56 | 8p |
20 | G212 | none | [CTTTT]9 | 6 | 100 | NA |
21 | G233 | none | [AAAAG]8 | 12 | 50 | 10q |
SEQIDNO. | 克隆号 | GenBank登录号 | 观察到的最长ITR序列 | 观察到的等位基因号 | %杂合性(白种人) | 染色体位置 |
22 | G234 | none | [AAAAG]12 | 4 | 80 | 16qter |
23 | G235 | none | [TTTTC]6 | 4 | 56 | 2p |
24 | G331 | none | [CTTTT]8 | 5 | 73 | NA |
25 | G405 | none | [CTTTT]6 | 10 | 80 | NA |
26 | G475 | none | [GAAAA]12 | 12 | 92 | 15q22.3 |
27 | G539 | none | [GAAAA]12 | 13 | 100 | 15q26.2 |
28 | S023 | X05367 | [AAAAT]6 | 4 | 50 | NA |
29 | S071 | M90078 | [AAAAT]8 | 4 | 56 | 6q26-27 |
30 | S085 | U07000 | [AAAAT]5 | 7 | 44 | 22q11 |
31 | S125 | Z73416 | [AAAAT]13 | 5 | 64 | 22q11.2-qter |
32 | S132 | Z83847 | [AAAAT]10 | 8 | 69 | 22 |
33 | S136 | Z82250 | [TTTTC]6 | 11 | 94 | 22q12-qter |
34 | S159 | AC000014 | [GAAAA]9 | 12 | 72 | 21q22-qter |
35 | S176 | AC000059 | [GTTTT]9 | 4 | 56 | 7q21-7q22 |
36 | S189 | Z54073 | [AAAAC]8 | 5 | 69 | 22q11.2-qter |
37 | S199 | Z84475 | [GTTTT]7 | 4 | 75 | 6q21 |
38 | S040 | X06583 | [AGCCTGG]4 | 2 | NA | NA |
39 | S066 | M68516 | [ACTCC]5 | 3 | NA | NA |
40 | S077 | M25718 | [AATAC]12 | 6 | NA | NA |
41 | S097 | Z21818 | [CAGGCT]3 | 3 | NA | NA |
42 | S103 | X15949 | [ATCCC]8 | 3 | NA | NA |
43 | S110 | X54108 | [GGA(A/G)T]32 | 6 | NA | NA |
实施例7通过GenBank搜索鉴别短串联重复
鉴别串联重复序列的方法是:搜索国立生物信息中心(NCBI)GenBank中中度串联重复的存在与否。使用的一些方法包括用DNASTAR的Lasergene软件包,在CD-ROM上成批搜索GenBank入口,用遗传学计算机组Wisconsin软件包版本9.0(Madison,WI)成批搜索GenBank。
有45=1024个不同的五字母单词可从4个字母(A,C,G,T)组成,以产生所有可能的五聚体重复,且有46=4096和47=16384个不同六字母和七字母单词产生6碱基重复和7碱基重复。但是,由于二个互补链的等价(如AAAAT等价于ATTTT),及环状置换的等价(如AATAA…等价于ATAAA…),独特的重复基序数相对较少。在5碱基重复的情况下,这意味着如果除去单核苷酸重复A5/T5和C5/G5,有102类独特的五聚体重复。
所有具有至少3个连续拷贝的5,6和7碱基重复的独特组合,用于搜索GenBank人基因组数据库。所有含3个或更多重复拷贝或具有偶然碱基取代的拷贝的重复区被鉴别。用现存的序列数据,设计位于重复区侧翼的引物,靶基因座经PCR扩增,并如实施例6所述评价多态含量。
然后将含有用GenBank数据库信息装配的引物鉴别的序列的每个克隆,如实施例7中所述筛选重复序列含量。发现的含有ITR序列,即ITR标记的每个克隆的序列指定为SEQ ID NO:28~43之一。含有位于每个这种标记的ITR区侧翼的序列的引物的序列见表1。每个这种ITR标记序列特征分析结果见表2。
实施例8评价中度串联重复基因座的PCR假象(即打滑百分率)
本研究中所述的许多标记代表一类新的标记,其产生较少的已知为“打滑”的PCR假象,(见以上本发明详述的解释章节)。这些假象的产生发生在PCR扩增期间,可能是称为重复滑动的DNA聚合酶相的现象导致。(Levinson & Gutman,1987,Mol,Biol.Evol.4(3):203-221;Schlotterer & Tautz,1992.NAR20:21l-215)。重复滑动的最终结果是含有与真正等位基因不同数目重复单位的PCR产物的产生。如果在PCR期间发生足够量的滑动,扩增的产物将显示为主要和次要条带,主要条带相当于真正等位基因,而次要条带相当于含有较多或较少重复单位的产物。
为确定不同基因座打滑条带的数量,将6个ITR基因座(C221,G023,G025,G210,S159和本发明中未阐述的另外的ITR即S117),和17个四核苷酸串联重复基因座(F13A01,THO1,TPOX,F13B,FESFPS,D7S820,CSFlPO,D13S317,D8S1179,D16S539,LPL,FGA,D5S818,D3S1358,D18S51,vWA和D21S11)的PCR扩增产物在ABI 377测序仪上电泳,并用GenScan软件(PE AppliedBiosystems,Foster City CA)分析。测定在25~40个研究的个体样品中每个基因座观测到的所有主要峰和次要峰的峰高,以相对荧光单位(RFU)表示。计算次要峰相对于主要真正等位基因峰中观测的RFU百分率,在五核苷酸重复中次要峰通常比真正等位基因少5bp,在四核苷酸重复中比真正等位基因少4bp(见表3)。
ITR基因座S159(图2)和G210(图3),和四核苷酸重复基因座vWA(图4)和D5S818(图5)的ABI 377电泳图示出在ITR基因座打滑最小或无打滑,在四核苷酸重复基因座可清楚观察到打滑。特别地,图3中再产生的vWA四核苷酸重复基因座的电泳图中箭头14和15,和图5中再产生的D5S818四核苷酸重复基因座的电泳图中箭头16和17表示打滑假象。将那些明显的假象峰与示于图2的分离自克隆S159的DNA标记(即具有SEQ ID NO:34的序列的标记)和示于图4的分离自克隆G210的DNA标记(即具有SEQ ID NO:19的序列的标记)的五核苷酸重复的电泳图中渐消的小假象相对比。图2-5中再产生的特异电泳图是每个基因座观测的打滑最高发生率。
对所有基因座观测的打滑数量有一些可变性。通常的趋势是等位基因含有最高重复数(以碱基对大小而表明)呈现最高量打滑。示出的25-40个每个测试个体打滑百分值是散射图(图6,7,8和9)。
简而言之,“打滑”条带与真正等位基因条带的百分比,在大多数评价的ITR基因座中,与四核苷酸串联重复基因座相比明显较低。即使所用四核苷酸基因座代表当前已知的最佳此类标记,此结果也是确实的。例如,13个这种四核苷酸标记,包括一些下表3中阐述报道的具有高打滑百分率的四核苷酸标记,已被美国联邦调查局选择用于分析国立组合DNA指数系统(CODIS)的所有DNA样品,(Macivee,I.(1998)Profiles in DNA(3):2)。
表3
基因座名称或克隆号 | 串联重复单位长度 | 平均打滑百分率 | 最高打滑百分率 | 最低打滑百分率 | 标准偏差 | 所分析的等位基因数量 |
Clone S159 | 5 bp(ITR) | 0.1 | 1.4 | 0.0 | 0.4 | 40.0 |
Clone G210 | 5 bp(ITR) | 0.6 | 3.2 | 0.0 | 0.9 | 30.0 |
Clone C221 | 5 bp(ITR) | 0.9 | 3.3 | 0.0 | 0.9 | 27.0 |
F13A01 | 4 bp | 1.2 | 9.7 | 0.0 | 2.5 | 34.0 |
TH01 | 4 bp | 1.7 | 5.2 | 0.0 | 1.7 | 34.0 |
Clone S117 | 5 bp(ITR) | 2.0 | 6.9 | 0.0 | 1.7 | 37.0 |
Clone G023 | 5 bp(ITR) | 2.3 | 6.6 | 0.0 | 1.7 | 39.0 |
TPOX | 4 bp | 2.4 | 5.6 | 0.0 | 1.8 | 34.0 |
F13B | 4 bp | 2.6 | 7.7 | 0.0 | 1.7 | 31.0 |
FESFPS | 4 bp | 3.6 | 10.0 | 0.0 | 2.3 | 34.0 |
D7S820 | 4 bp | 3.8 | 8.2 | 1.6 | 1.6 | 28.0 |
CSF1PO | 4 bp | 4.1 | 9.5 | 0.0 | 2.5 | 31.0 |
Clone G025 | 5 bp(ITR) | 4.5 | 9.3 | 0.0 | 2.1 | 36.0 |
D13S317 | 4 bp | 4.7 | 7.5 | 1.7 | 1.5 | 26.0 |
D8S1179 | 4 bp | 5.0 | 8.3 | 2.4 | 1.6 | 27.0 |
D16S539 | 4 bp | 5.1 | 8.6 | 1.7 | 2.0 | 28.0 |
LPL | 4 bp | 5.4 | 15.0 | 1.7 | 3.1 | 29.0 |
FGA | 4 bp | 5.5 | 11.6 | 3.0 | 1.7 | 36.0 |
D5S818 | 4 bp | 6.1 | 9.0 | 0.0 | 1.9 | 28.0 |
D3S1358 | 4 bp | 6.1 | 12.5 | 0.9 | 2.1 | 25.0 |
D18S51 | 4 bp | 6.5 | 11.6 | 2.5 | 2.4 | 28.0 |
vWA | 4 bp | 6.6 | 11.4 | 3.7 | 1.4 | 28.0 |
D21S11 | 4 bp | 7.5 | 15.7 | 1.9 | 3.5 | 30.0 |
序列表(1)一般信息:
(i)申请人:Schumm,James W.
(ii)发明名称:鉴别和分析中度串联重复DNA标记的物质和方法
(iii)序列数:147
(iv)通讯地址:
(A)收信人:普罗梅加公司
(B)街道:2800 Woods Hollow Road
(C)城市:Madison
(D)州:Wisconsin
(E)国家:USA
(F)ZIP:53711-5399
(v)计算机可读形式:
(A)媒介类型:3.5英寸软盘,1.44Mb
(B)计算机:IBM PC兼容机
(C)操作系统:Windows NT4.0
(D)软件:WordPerfect 7.0(DOS文本格式)
(viii)律师/代理人信息:
(A)姓名:Grady J.Frenchick
(B)注册号:29,018
(C)卷号:8976.80
(ix)电讯信息:
(A)电话:(608)257-2281
(B)传真:(608)257-7643
(C)E-MAIL:gfrechick@mail.stroudlaw.com(2)SEQ ID NO:1的信息:
(i)序列特征:
(A)长度:445bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(vii)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C074
(viii)基因组中的位置
(A)染色体/区段:1
(xi)序列描述:SEQ ID NO:1:GATCCTTTGC ACCCAGANAG AAGTAATTAT TTCAACACAG TTGGAACAGT 50TAAAAAGATT TAAAATTTTC AAAAAAACAA TCATTTTCTC TTTTCTTTCT 100GGCTCAGACA CCTCATTGCT TTCTGACTGA CCAAGGCGCA GCGCANTTTG 150CAGCAGCCAT GGGGGTTCCA GAGATTCCTG GANAAAAACT GGTGACAGAN 200AGAAACAAAA AGCGCCTGGA AAAAGATAAG CATGAAAAAG GTGCTCAGAA 250AACAGATTGT CAAAAGTAAG TCTTACCTGT GGCTCGCATT ATTTGGGAGT 300TATTAAAATA TGAAAGTTTG GCAAATACCC GGTTATCTAC AGTCCTTTNG 350TTTNGTTTTG GTTTTGTTTA GTTTGGTTTT GTTTNGTTTN GTTTGACACG 400GAATCTCTCT CTGTTGCCCA AACTGGGAAT ACAGTGGTGC CGATC 445(2)SEQ ID NO:2的信息:
(i)序列特征:
(A)长度:411bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C221
(viii)基因组中的位置
(A)染色体/区段:9p
(xi)序列描述:SEQ ID NO:2:GATCACTTGC CATCCCTGCC ACACAGTTTC CTCCTCTGGA AACTGGGGGT 50GATGACCCCT GCCCTACCCA CTTGTCATGG CATTGGGGAC ATGAACACAC 100TTTGCACCTG TCAGGCAAGG CTTAAACAGG GATATGCACT GGTAATAGAA 150AAGAGGGACT AAGTTTTGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT 200TTGTTTTGTT TTGTTTTGTT TTGTTTTTCT GAAGAAGTCC CTAGAAGCGC 250TCAGTGTTGG AATGCTCTCT TGTAGCAGTG GCGGCTGCTG CTGGTTCCGG 300GTCAGATGCC GGAATTGGGG GTGCGCTTGG GTGCAGCTGC ATTTCATCTG 350GTCCTGGGCC TCGGTCCTGG CTTGGAGAGG TGCAGCTCAC AGCCACTTCA 400TGGCTGGGAT C 411(2)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:354bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C240
(xi)序列描述:SEQ ID NO:3:GATCANCATG GGTTCTATCT GCCTGGCCCT TCACCCCCTA CTCAGGGCAG 50CTCTGAATTG TCTNCCCCGC TTCAAAGTTC CCAGTTCAAC TTCTCCCTCT 100GCCCAATCCT GTTTCCTTCT CTTCCACAGG TATTAATTTG GCCAGNTGCA 150GTGGCTCATG CCTGTAATCT CAACTTTGGG AGGCCAAGGT GGGAGGATTG 200CTTGANCCCA GAATTTTGAA ACCANCCTCT GAAACATANT GANACCCCTG 250TCTCAAAACA AAACAAAACA AAACAAAACA AAACAAAAAC TANCCAGGCA 300TGATGGTGTG TGCCTGTGGT CCCANCTATT CAGGAGGCTG AAATGGGAGG 350ATC 353(2)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:317bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C331
(xi)序列描述:SEQ ID NO:4:GACCGTGGAA NCCAAAAGTC TGCCTACCGC ATCTTAGTCC AGAGTTCCTG 50TTTTTACTTC TTTTTGAAGG TCTGTGGATT CTTTATTTTC ATGGCACCTT 100AGCAATACAT TTTAAAAGCT TGTTTTATTT TATTCAGCAT TTTGGTTATT 150TCCATTGGAA NANTCATTCA GGGCGTTTAG TCTGCCACAG TGCTGGAAAC 200TAAAGCTAGG ATTACATGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT 250TTGTTTTGTT TTGTTTTGTG ACAGGGTCTT GCTCTATTGC CTTAGGCTGG 300GGTGCAGTGT TGTGATC 317(2)SEQ ID NO:5的信息:
(i)序列特征:
(A)长度:387bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C362
(viii)基因组中的位置
(A)染色体/区段:4
(xi)序列描述:SEQ ID NO:5:ACAGACTAAC AGAAAGAANA TCAGGTCGAC TTGCCTAAAA AGAGTGAGCT 150AGGGAAAAGC ATGGCGGAAG AAACAANGTT GCTGAAAGCA ACTCTTATTT 200TCTTGGCTTA GAAACCANNA AAATGCNTTT GGGTTTTATC TTAGCATAAT 250GAAAAGACAT GTNANACTTC TGAACACGAA ATCTGACATG TTTTACAGAC 300NTGTTTTACA TGGTTTTGTT TTGTTTNGTT TTGTTTTGGG ATGGAGTCTC 350GCTCTGTTGC CANGCTGGGA GTGCAATGGT TGCGATC 387(2)SEQ ID NO:6的信息:
(i)序列特征:
(A)长度:471bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:C390
(xi)序列描述:SEQ ID NO:6:GATCACGAGG TCAGGAGATG GAGACCATCC TGGCTAACAT GGTGAAACCC 50CGTCTCTACT AAAAATACCA AAAAATTAGC CGGGCATGGT GGCGGGCGCC 100TGTAGTCCCA GCTACTCAGG AGGCTGAGGC AGGAGAATGG CGTGAACCCG 150GGAGGCGGAG CTTGCAGTGA GCCGAGATTG CGCCACTGCG CTCCAGCCTG 200GGTGACAGCG AGAATCTGTC TCAAAACATA ACAAAACAAA ACAAAACAAA 250ACAAAACAAA ACAAAAAAGA TTTGGAATTA TGTAGGCAAA GTGGGAGAAA 300GAGANGGACG AGGACTNAGG TAAAGATAAT ATGCAAAATA GAAAGAGCAN 350GAAGGGGCAT GGATATGTGT AAATTCAAAG AAAGGCAAAG TGGCTGGTGC 400ACAAAGAGTG AGGAGAGCAA NGNGTGAAAA TGACTTTAGT GAGACAAGGC 450AAGGGACAAA TCATGAAAAA T 471(2)SEQ ID NO:7的信息:
(i)序列特征:
(A)长度:367bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G022
(viii)基因组中的位置
(A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:7:GATCGCACCA CTGCACTCCA GCCTTGGTGA CAGAGCAAAA CTCNTTCTCC 50AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAAA AAAATCCATG 100GTGAAAGTGA CGACAGTNGA GTAGGGGATG AGCTCAAAGC AAATGCATGC 150ATGTNCCCCA CCCTCAACAC AAACACACAC ACACACACAC ACACACACAC 200ACACACACAC ACACATACTT CTTTAGAGAT ATTTAGGTGT ATATATGCTA 250ACTTAGGAAA CTTTAGAAAA CCTTGTTATG ATATTATTAG TCAAAAAATA 300TTTAAGCCAC AGTTTCGCAA TTTTAAGATT GTACTACTGG TATCTGGAGT 350ATCTGAATCT CTGGATC 367(2)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:295bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G023
(viii)基因组中的位置
(A)染色体/区段:16q
(xi)序列描述:SEQ ID NO:8:GATCACAGCA CTGCACTGCA GCCTGGGCAA GAGAGCAAGA CCCTCTCTCT 50CAGGGAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA 100AAGAAAAGAA AGGAAGGAAA GAGAGAGGAA GGAAGGAAGG AAGGTAAGAA 150GGAAGGAAGG AAAGAAAGAA GGAAGGAAGG TAGGGTGGTT TTGGGATGTG 200AAATGCTGTC AGTCAACAAA GAGCTATGAC CACAGGTGTC ACTGAGTAGC 250AGGGGCAGCC CATCCTGCTC CCTAGCTGCA CTCACCCTGA AGATC 295(2)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:361bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G025
(viii)基因组中的位置
(A)染色体/区段:1
(xi)序列描述:SEQ ID NO:9:GATCTGATGG TTTCATAAGT GTCTGGCATT TCCCCTGCTT GTACTTCTCT 50CCCCGGCTAC CGTGTGAAAA AGGTCCTTGC TTCCCCTTTG CCTTCCACCA 100TGATTGTGAG CTTCCTGAGG CCTCCACAGA CATGTGGAAC TGTGAGTCAA 150TTAAACTTCT TTCCTTTATA AATTACCCAG TCTCAGGAAG TTCTTTGTAG 200CAGTGTGAGA ATGGAGGAAG AAAGAAAAAG AAAAAAAAGG AAAAGAAAAG 250AAAAGAAAAG AAAAGAAAAG AAAGGAAGA AAGAAAGAAAG AAAGAAAGAA 300AGAAAGAAAG AAAGAAAGAA AGAAAGAAAG AAAGAGAGAG AAGTGGTTAG 350CAAATGTGAT C 361(2)SEQ ID NO:10的信息:
(i)序列特征:
(A)长度:318bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G047
(viii)基因组中的位置
(A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:10:GATCACTTGA GGCCAGGGGT TCGAGGCCAG CCTGGGCAAC ATATCAAGAC 50CCCCATCTCT ACATAAAAAG AAGAAGAAAC GAAAAGAAAA GAAAAGAAAA 100GAAAAGAAAA GAAAAGAAAA GAAAAGAGTG GAAGAGTGCA GGAGCCGAGA 150GGGAGAGAAA ATGTAGTGGT GAGGGGCAGC TTCTGGAAAG GCCCATACTA 200CAGAGGGAGG AATCCTAATT CCTCACTATC TCTCTAACAT CAGGTAAGCA 250TCTCATGATG CAGTTAGAAA GCACATTTCC TTCTTCAGTT TCCCCTCTGG 300CTGTGTTGAC CCAGCCCA 318(2)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:362bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G065
(viii)基因组中的位置
(A)染色体/区段:1q
(xi)序列描述:SEQ ID NO:11:GATCACATTT GCTAACCACT TCTCTCTCTN TCTTTCTTTC TTTCTTTCTT 50TCTTTCTTTC TNTCTTNCTT TCTTTCTTTC TATCTTCCTT TCTTTACTTT 100NCTTTNCTNT TCTNTTCTAT TCCTTTANAT TTCTTTTTCT TTCTTTCTCC 150ATTCTCACNC TGCTANAAAG AACTTCCTGA GACTGGGTAA TTTATANAGG 200AAAGAAGTTT AATTGACTCA CAGTTCCACA TGTTTGTGGA GGCCTCAGGA 250AACTTACAAT CNTGGTGGAA NGCAAAGGGG AANCAAGGAC CTTTTTCACA 300CGGTAGCCGG GGAAATAATT ACAANCAGGG GAAATGCCAN ACACTTATGA 350AACCATCAGA TC 362(2)SEQ ID NO:12的信息:
(i)序列特征:
(A)长度:297bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G085
(viii)基因组中的位置
(A)染色体/区段:10q
(xi)序列描述:SEQ ID NO:12:GATCATGTCA TTGCACTCCA GCCTGGGTGA TACAGCAAGC CTCATCGAAA 50GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA 100GAAAGGAAGA AAAGAAAACA AANAGATAGA AAGCAANCNN GTGGCNTGAG 150AANTNAAATT CTTATAGGTA ACCTGGAGGA CTTTTATCTT TCCAGGAGTC 200TCTCTCAATG CATTTAGACT CAACAANGAT TTCCTTTTCT CTTGTCTCTA 250NAAANAAATG CATTTCCTCA AAANANTGGA GGTCANATTA TGTTANAGAT 300GGGAGAATGC ACTGAGTTNC GCTGAANGA 329(2)SEQ ID NO:13的信息:
(i)序列特征:
(A)长度:372bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G132
(viii)基因组中的位置
(A)染色体/区段:4qter
(xi)序列描述:SEQ ID NO:13:GATCTACCAT TCTTGGGTCT GGAGAACAGT GGCCCTTGTT TCTTTTCTTT 50TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT CCTTTTCTTT 100TCCTTTCCTT TCCTTTTCTT CTCTCTCTCC TTCTCTCTCT CTCTCTCTCT 150CTCTCTCTCT CTCTCTCTCT CTCCCTCTCC CTTCCCTTCC CTTCCTTTCC 200CTTCCTTTCC TTTCCTTTCA TTTTTTTTGA CATGGAGTTT CACTCTTGTC 250ATCCAGGCTG GAGTACAGTA NTGTGATTTT GGCTCACTGC AACCTCTGCC 300TCNTGGGTTC AAGAGATTCT CCTGCCTCAG CTTCCTGANT AGCTGGGATT 350ACAGGTGCCT GCCACCATGC TT 372(2)SEQ ID NO:14的信息:
(i)序列特征:
(A)长度:350bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G145.1
(xi)序列描述:SEQ ID NO:14:GATCTCTTGA AGCCTCGCAN ATAAAGGCTC CAGTGGGGTA TGATTGCACC 50ANTGCACTCC ANCCTGNGAN ACGGNAGAGA GATTCTGTCT CAAAAGAAAA 100CAAAATAAAA GAAAANAAAA NAAAANAAAA TAAAANAAAA TANAAGAAAA 150GAAAAGGATG CTTTAAAAAT NTGGCAAAAT GTNCCCTTTA TTGACTACTG 200CCTTGTTTTA ATTTNCTCTA TTTNTCTATT TATTTTCTCA GTGTACTTTC 250CCATNTNNCT TTNTCTCTTC CTTCTTTGAA AGTAATTCTT GGCCAGGCAT 300GGTGGTTCAT GCCTATAATC TCANCACTTN AGGGGGCTNA AGCNGGAAGA 350(2)SEQ ID NO:15的信息:
(i)序列特征:
(A)长度:372bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G152
(viii)基因组中的位置
(A)染色体/区段:8qter
(xi)序列描述:SEQ ID NO:15:GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC 50CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT 100GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG 150GAGGTTGTAG TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA 200GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA 250AAGAAATTCA TCATTGGGAA ACATCATGGA NGGCCGCNAC CAGTCAGGGG 300AACATTTCCG AAAGCNANTT NTTCTTCCAA TGCCCTATGT TNCTTCCCCN 350AAGCTTGCCA TTTTNAACCC TT 372(2)SEQ ID NO:16的信息:
(i)序列特征:
(A)长度:361bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G153
(viii)基因组中的位置
(A)染色体/区段:8qter
(xi)序列描述:SEQ ID NO:16:GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC 50CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT 100GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG 150GAGGTTGTAN TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA 200GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA 250AGAANTTCNT CATTGGGAAA CATCATGGAG GCCGCAGCAN TCAGGGGAAC 300ATTTCCGAAA GCNAGTTGTC NTTCCAATGC CCTATGTTNC TTCCCCNAAG 350CNTGCCATTT T 361(2)SEQ ID NO:17的信息:
(i)序列特征:
(A)长度:447bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G158
(viii)基因组中的位置
(A)染色体/区段:5q
(xi)序列描述:SEQ ID NO:17:GATCGCCTGG GTACAGCAGG AAAGAAGGGG GCGGCCACGG CAAGGCAGCC 50TCCGACTGCC CGGCGGGGGA NGCCGGCGGC GGCCCCTTCT CGCCCTCTCC 100TATAAGCAGT TTTATAAGCT TCCTGAGACT ANAAAAGGAA AAGAAAAGAA 150AAGAAAAGAA AAGAAAAATC AGTCTCTATT TTATATGCGT ATAATTTTTT 200TTATATGCGT ATAATTTTTT TTTTAACCAA AAACTCNTTA TGGACAAAAC 250AAACTACCAT CCCACTCCAA ATTATCTCTG CATCATGCTC ACAACCTCAG 300CNCAAATTTC AATANAANTT TTATTGGGAT ATGTTTGGCT TCCATCAATT 350GAAATTTCCC CTAATGAATA AAATTTCCTC CCGTTTTTTT GGTAAACATT 400TCCCCTTGNA AGGCCCACCT AAAAATCNCC NGGNCTTTTT CCAAAGG 447(2)SEQ ID NO:18的信息:
(i)序列特征:
(A)长度:415bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G181
(viii)基因组中的位置
(A)染色体/区段:
(B)图谱位置:
(C)单位:
(xi)序列描述:SEQ ID NO:18:GATCCCAAGC TTCCCGGGTA CCGCGATCAC CTGAGGTCAG GAGTTCAAGA 50CCAGCCTTCT CAACATGGCA AAACCTCATT TCTACTAAAA ATACAAAAAA 100TTAGCTGGGC ATGGTCTTGG GTGCCTGTAA TCCCAGCTAC TCAGGAGGCT 150GAGGCAGGAG AATGTCTTGA ACCCAGGAGG CGGTGGCTGC AGTGAGGCAA 200NATTTTGCCA GTGTNCTCCA GCCTGGGTGA CAANANTGAA ACTCCGTCTG 250AAAGAAAGAA AGAAAAAGAA AGAAAGGAAG GAAGGAAGGA AGGAAAGGGA 300AGGAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA 350AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA TNAGATGGGG GAGCTCTACC 400GAACTGATTC CGATC 415(2)SEQ ID NO:19的信息:
(i)序列特征:
(A)长度:444bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G210
(Viii)基因组中的位置
(A)染色体/区段:8p
(xi)序列描述:SEQ ID NO:19:GATCCTATCC TGACAAACTC AAGCAAATTC ACAAATACAA CCCTCTAGCC 50GGCCCATGGC CTCCCTATTT GGGAGGAAAA AACTCAGTAT GATACTGTGA 100CATATTTCAT TCATTATCTG TTAAGGTGAG CGTGGCAAAC CTGGCCGAAG 150TGGCAGAATA TTGGGGCTCA TCACTTGGGG GAATGATTCA GGAGTGGCAT 200CCTTCTGTGA CCTGTGACAG CCACTTAAGG TTGTGGGATG ACTACTACAA 250AATCCCAAAT AAAGTATATC CTAAAGGCTT TCTTTTCTTT TCTTTTCTTT 300TCTTTTCTTT TCTCTTCTCA TCTCTTGTCT TCTCTTCTTT TCTCCTCTCC 350CCTCCCCTCC CATCCCCTCT CCTCTCCTCT CCTTTCCTTG TTTTAAAAAC 400AATGTCTTGC TCTGTTGACC AGGCTGGAAT GCAGTTCTGT GATC 444(2)SEQ ID NO:20的信息:
(i)序列特征:
(A)长度:321bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G212
(xi)序列描述:SEQ ID NO:20:GATCTCCTTC AGTGTACTCA GTGCATTCTC CATCTCTTAC ATAATCTGAC 50CTCCACTCTT CCTGGAAATG CATTTCTTTT TAGAGACAAG AGAAAAGGAA 100ATCCTTGTTG AGTCTAAATG CATTGAGANA NACTCCTGGA AAGATAAAAG 150TCCTCCAGGT TACCTTTAAN ACTTTCATTT CTCCTGCCAC CTGCTTGCTT 200TCTCTCTCTT TCTTTTCTTT TCTTCCTTTC TTTTCTTTTC TTTTCTTTTC 250TTTTCTTTTC TTTTCTTTTC TTTTCTTTCG ATGAGGCTTG CTGTATCACC 300CAGGCTGGAG TGCAATGACA T 321(2)SEQ ID NO:21的信息:
(i)序列特征:
(A)长度:329bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G233
(viii)基因组中的位置
(A)染色体/区段:10q
(xi)序列描述:SEQ ID NO:21:GATCGCTTGA GCCTTGGAGA TTGAGGCTAC GGTGAGCTAT GATTGCACCA 50CTGCACTCCA GCCTGGGTGA CAGAGTGAGA CCCTGGGAGA AAAAAAGAAA 100GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GTCNTGACCT 150TGGAAAAAAC CANAATTTCT GATGTTGTAC AACTCCTGAA TTCTGACTGC 200TCTCTCCNCN GAAAGANGGA ATNNNTGNTC CTTGGAGGAT TCNTACTAAT 250ATTCTTCGGT CNANACAAAA ACNTGACCTC NAGCCNAGAA AACAANATTN 300NNCCNTTCCA TAGAAAAGTT CAGGGGACA 329(2)SEQ IDNO:22的信息:
(i)序列特征:
(A)长度:412bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G234
(viii)基因组中的位置
(A)染色体/区段:16qter
(xi)序列描述:SEQ ID NO:22:GGATCACGCC ATTGCACTCC ACTCTGGGCA ACAAGAGCAA AACTCCATCT 50CAGAAAAAAA GAAAGAAAGA AAGAAAGAAA GAGAGAAAAG AAAACAGAAA 100AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAC 150CCNNCAGAAA GCCAAGGCAA TGGGAACAAG CTGGGGCAAG TGCCTGGAGG 200TGTTGCTGGA AAGGCAGATA GGGCAGAGAG CACCTGGACT CTTCCAAAAC 250ATATTAGCAT CATGGTAAAG CCCTCAGCCC AAGTCCCCCA GAACATAGCC 300GTAGTCAACC AAGTTGAGAT TGATTACTAG CTTCCTGTNA CAAGGGAGAT 350TATNCNCACA CAAGTGCCAT CTGCCTCTCC CTTCACCCAG CTTGAGTTTC 400GCTTGTAGCA CT 412(2)SEQ ID NO:23的信息:
(i)序列特征:
(A)长度:359bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G235
(viii)基因组中的位置
(A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:23:GATCACCAGG CCCCTGAGGA AGCAGCACAG AAAAACACAA ATAATATCAA 50TATCAGGCAG CCACAGGGGA AACAATGGGG CATTTCTCCG TGCTACATGC 100ATGCTGCTAT TGTTTCAAGG GCTGGGGAAT TAATTCCACT TATTTATTTA 150AGGCGTGTCA ACTCACTGCC TAAACCTGTT TCAGTGTCAA AATGGATAAA 200ACTTTTATGG CTCATAAAAT ANANCCATTC ATCTCAATGT TCTTTGTGGT 250GGGTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCTTTTTTC TTTTTTTTTC 300TGGCATACTG AGCTAAACCT CTGCTCTGAA ACGGTTACAT CTGAACCCAT 350TGCTGCTAT 359(2)SEQ ID NO:24的信息:
(i)序列特征:
(A)长度:516bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G331
(xi)序列描述:SEQ ID NO:24:GACTTTCCCA CCTTCTGATG TGGGCATTTA GTGCTATAAA TTTCCCTCTA 50AACACTGCTT TAGCTGTGTC CCANAGATTC TGGTATGTTG TGTCTTTGTT 100CTCATTGGTT TCAAAGAACT TATTTATTTC TGCCTTAATT TTGTTATTTA 150CCCAGTAGTC ATTCAGGAGA AGGTAGTTCA GTTTCCATGT AGTTGTGAAG 200TTTTGAGTGA GTTTCTTTCC TTTTCTTTTC TTTTCTTTTC TTTTCTTTTC 250CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT 300TTCTTTTGTT TGAGATGGAG TCTTACTCTG TCGCCAGTCT GGAGTGCAGT 350GGTGTCATCT CAGCTCGCTG CAACCTCCGC CTCCTGGGTT CAANAAATTC 400CTCTGCCTCA GCCTCCCAAG TAGCTGGGTT TACAGGCACA CACCACCACG 450CCCAGCTAAT TTTTTGTATT TTANTAAAGA CAGGGTTTCA CCATGTTGAC 500NAAAATGGTC TCGATC 516(2)SEQ ID NO:25的信息:
(i)序列特征:
(A)长度:556bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G405
(xi)序列描述:SEQ ID NO:25:GATCTCACAT TCTTCCTCAG AATTCTTCTT GTTACCTCTG CAAAATTTCA 50TCCTTCAAAC TCAAAGCTCA TTATCTTTGG ACTCTGTGAC ACTCTTCTGA 100TTCTCATATC ACTTCTTGAT TTTCCTGCAT TTCCTCACTA ACTCTCAGCT 150CATAATCATA TAAAATCACT AAGACTCTTT TTATATTGTC ATGAAGCTCA 200GGTATTTTCA CAGATTGAAC CATTTCCCTG TAGACAGCAA TGCTCAACAT 250GAACCATTCA CATCCTTCTT CCAAAGCACA GACTCTTCTT GCCATCTGCG 300TCATGCCCAT GCTCATGTGC ATGGAGCCTG GTTCATTATC TTCCAAAATC 350AAGCTTCCCC CACTTGATTT CTCTTTTCTT TTCTTTCCTT TCCTTTCCTC 400TTTTCCTTTT CCCTTTCCCT TTCCTTACCT TTCCTTTCCT TTCCTTTCCT 450CTCCTCTTTT CTCTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCCTTTCCT 500TTCNTTTCTT TTATTTGCAC CTCACTCTTG CCAAGGCTGG GATGGCAGTA 550ANCACG 556(2)SEQ ID NO:26的信息:
(i)序列特征:
(A)长度:335bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G475
(viii)基因组中的位置
(A)染色体/区段:15q22.3
(xi)序列描述:SEQ ID NO:26:GATCACGCCA TTGCACTCCA GCCTGGGCGA CTGAGCAAGA CTCAGTCTCA 50AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA 100AAGAAAAGAA AATTGTAAGG AGTTTTCTCA ATTAATAACC CAAATAAGAG 150AATTCTTTCC ATGTATCAAT CATGATACTA AGCACTTTAC ACACATGTAT 200GTTATGTAAT CATTATATCA TGCATGCAAG GTAATGAGTA TTATTTTCCT 250CATTTTATAA AAGAGGAAAC TGATGTTTGA GGCTACTTTG CTTAAGACCG 300CAGAACTAGC AAAGGAAAAG AGAAGTGAAT GTATC 335(2)SEQ ID NO:27的信息:
(i)序列特征:
(A)长度:333bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:G539
(viii)基因组中的位置
(A)染色体/区段:15q26.2
(xi)序列描述:SEQ ID NO:27:GATCGTGCCA CTGCACTCCA GCCTGGGCAA CAGAGTAAGA CTCAGTCTCC 50AAAAAAAAAA AAAGAAAGAA AGAAAAAGAA AGAAAGAAAG AAAGAAAGAA 100AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA 150AAGAAAAGAA AAAGAAAAAG AAAAAATAAA GAGGTGAACG GTACTGAACA 200GAAACTAAGA AGGCTGAGAG CCAACTCTGA GGTAACAGCT AGGAGCTGAA 250GCAGGAAAGC TAAAATCTGC CCCAGTCCCA TTGCTGATAG ACTCACCATT 300TACTAACAGA GAAACCATTC CTCCTTTTAG ATC 333(2)SEQ ID NO:28的信息:
(i)序列特征:
(A)长度:1011bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:质粒,pGem3Zf(+)
(B)克隆:S023
(xi)序列描述:SEQ ID NO:28:CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA 50GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA 100CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG 150CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT 200CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT 250AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT 300GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG 350TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG 400CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA 450GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG 500AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT 550TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT 600GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG 650GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA 700CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA 750GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA 800CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC 850TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA 900CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG 950CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA 100OGCCCTGCTGT A 1011(2)SEQ ID NO:29的信息:
(i)序列特征:
(A)长度:1011bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S071
(viii)基因组中的位置
(A)染色体/区段:6q26-27
(xi)序列描述:SEQ ID NO:29:CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA 50GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA 100CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG 150CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT 200CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT 250AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT 300GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG 350TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG 400CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA 450GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG 500AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT 550TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT 600GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG 650GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA 700CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA 750GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA 800CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC 850TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA 900CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG 950CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA 1000GCCCTGCTGT A 1011(2)SEQ ID NO:30的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S085
(viii)基因组中的位置
(A)染色体/区段:22q11
(xi)序列描述:SEQ ID NO:30:AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT 50TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC 100AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT 150CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC 200CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT 250TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT 300GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG 350GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC 400CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC 450AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG 500CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA 550AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT 600TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG 650CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG 700CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT 750CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG 800GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT 850GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT 900ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA 950TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG 1000(2)SEQ ID NO:31的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:
(B)克隆:S125
(viii)基因组中的位置
(A)染色体/区段:22q11.2-qter
(xi)序列描述:SEQ ID NO:31:AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT 50TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC 100AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT 150CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC 200CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT 250TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT 300GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG 350GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC 400CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC 450AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG 500CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA 550AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT 600TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG 650CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG 700CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT 750CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG 800GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT 850GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT 900ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA 950TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG 1000(2)SEQ ID NO:32的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S132
(viii)基因组中的位置
(A)染色体/区段:22
(xi)序列描述:SEQ ID NO:32:GGTGTGACCT TATCCTCTCT GAACCTCAGT TTCCTCATCC GTAAAATGAA 50AAGCTGCTAG ATTGTTGTAA AAAAATTAAA TGGAATAGGC TAGGCGCGGT 100GGCTCACGCC TGTAATCCCA GCACTTTAGA AGGTCGAAGA GGGTGGATCA 150CTTGAGGTCA GGAGTTTTGA GACCAGCCTG GCCAACACGG TGAAACCCCA 200TCTCTACTAA AAATAAAAAA TTAGCTNGGG TGCGGTGGCT CACACCTGTA 250ATCCCAGCAC TTTGGGAGGC TGAGACGGGT GGATCACCTG AAGTCAGGAG 300TTCAAGGCCA GCCTGGGCAA CATGGTGAAA CCACGTCTCT ACTAAAAATA 350CAAAAATTAG CCAGGTGTGG TGGCACACGC CTGTAGTCCC AGCTACTTGG 400GAGGCTGAGG CGGAAGAATC GCTTGAACCC AGTAGGCAGA GGTTGCAGTG 450AGCCGAGATA AGAGTCACTG CACTCCAGCC TGGGTGACAG AGCAAGACTC 500CCTCTCAGAA AATAAAATAA AATAAAATAA AATAAAATAA AATAAAATAA 550AATAAAATTC TAAAAGGGCT GGCATTTGCC TAGCACTTAT ATGCCCAATA 600AGTAATAGCT ATCAATATCC CCACCCCTAC CACTGTGCTG AAATTTAGTT 650TCTTTTTGTC ACCCCCCATT AGACTTAAGG CAGAATTCTC ACCGTACTCC 700TCTGTAAATT TCTGGTTCCT GGCACATAGT TGGGTCTCAG TGAAACATGG 750TGAGTGAATG AGCAAATGCA AGGAATCTCC AGGCCATCTG GGAGCCCTCC 800CAGGCGGGTG AGTTCGGGAA ACTCATAGTC TGTCCTCAAT GGCCCACTGA 850AAGGTAGAGA GTTCTGGGTC CCACCTCCGC ACCCCCATCT CCTGACTCAC 900TGCTGAAAAA TAAATAAATA AATAAAATAA CACTTATCCG GAGCCTCCCA 950CATGCCTTGC CAGGACTGCA AGGAGCCCAG CAGAATGATG ACCGGCGTGC 1000(2)SEQ ID NO:33的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S136
(viii)基因组中的位置
(A)染色体/区段:22q12-qter
(xi)序列描述:SEQ ID NO:33:CCACTACATA TCCCATACAG GCTAATCAAC ATGTCAAAGT TCACACAGTT 50ATTGTGTACC CCTGGGCTCA ATCTCAAGTG TTCTGGTTGG TCGTCCAAGG 100TTACTTTTTT TTTTTTTTTT TTTTTTTTGA GATGGAGTCT TGCTCTGTTG 150CCCAAGCTGG AGTGCAATGG CATGATCTTG GCTCACTGCA ACCTCCGCCT 200CCTGGGTTCA AGGGATTCTC CTGCCTCAGC CTCCTGAGTA GTTGGGATTA 250CAGGCATGCA CTACCATGCC TGGCTAATTT TTGTATTTTT AGTAGAGGTG 300GAGTTTCTCC ATGTTGTTCA GGCTGGTCTT GAACTCCCAA CCTCAGGCAA 350TCCACCTCGG CCTCCCAAAG TACTGGGGTT ACAGGCATGA GCCACTGCGC 400CTGGCCCAAG GTTACTTTTC ACTACATCTT CCTACCTGTA TCACTTACTG 450CCGTGTGTAT AACTTCCACA TTTTCTTTCT TTTCTTTTCT TTTCTTTTCT 500TTTCTTTTCT TTCTTTTCTT TCTTTCTTTC TTTCTCTCTC TTTCTCTCTC 550TCTTTCTCTC TGTCCCCTCC TTCCTTCTCC TTCCTTCTTC CTTCCTTCCT 600TCCTTTCCTT CCTTCCTTCC TTCTTTCAAC ACAGAGTCTC ACTCTGTCAC 650CTAGGCAGGA GTGCAGTGGC CCAGTCTCAG CTCACTGCAA CCTCCGCCTC 700CTGGGCTCAA GCAATTCTCT CACCTCAGCC TCCCGAGTAG CTGGGATTAC 750AGGCATGTGC CACCATACCC AGCTAATTTT TGTATTTTTA GTAGAGACGG 800GATTTCACCA TATTTTCCAA GCTGGTCTCG AACTCCTGAC CTCAAGGGAT 850CTGCCCGACT CAGCCTCCCA AACTGCTGGG ATCATAGGTG TGAGCCATCA 900TGCTTGGCCC ACACTTTCTA TGTTAATCTA ATTTAGATGA TTTAATCTAT 950ATACAGTTTC TATATTAATC TAATTTAGAT GACTTAATCT ATATACAACT 1000(2)SEQ ID NO:34的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S159
(viii)基因组中的位置
(A)染色体/区段:21q22-qter
(xi)序列描述:SEQ ID NO:34:AAACCCCGTC TCTACTAAAA ATACAAAAGT TAGTTGAGCA TGGTGGCACG 50GGCCTGTAAT CCCACCTATA ATCCCACCTA CTCGGGAGGC TGAGGCAGGA 100GAATCGCTTG AACCCAGGAT GGGGCGATTG CAGTGAGCCG AGATCGTGCC 150ACTGCACTCC AGCCTGGGTG ACAGAGCGAG ACTCCATCTC AAAAAAAAAA 200AAAAAAAACA GAATCATAGG CCAGGCACAG TGGCTAATTG TACCTTGGGA 250GGCTGAGACG GGAGGATCGA GACCATCCTG GGCACCATAG TGAGACCCCA 300TCTCTACAAA AAAAAAAAAA AATTTTTTTT AAATAGCCAG GCATGGTGAG 350GCTGAAGTAG GATCACTTGA GCCTGGAAGG TCGAAGCTGA AGTGAGCCAT 400GATCACACCA CTACACTCCA GCCTAGGTGA CAGAGCAAGA CACCATCTCA 450AGAAAGAAAA AAAAGAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA 500AAAGAAAAGA AAAAACGAAG GGGAAAAAAA GAGAATCATA AACATAAATG 550TAAAATTTCT CAAAAAAATC GTTATGACCA TAGGTTAGGC AAATATTTCT 600TAGATATCAC AAAATCATGA CCTATTAAAA AATAATAATA AAGTAAGTTT 650CATCAAAACT TAAAAGTTCT ACTCTTCAAA AGATACCTTA TAAAGAAAGT 700AAAAAGACAC GCCACAGGCT AAGAGAAAGT ACTTCTAATC ACATATCTAA 750AAAAGGACTT GTGTCCAGAT TAAAGAATTC TTACACATCA ATAAGACAAC 800CCAATTAAAA ATCGGCAAAA GATTTGAAGA GATATTTAAC CAAAGAAAAC 850ATATAAATGT GTCCGGGCGC GATGGTAATC CCAGCACTTT GAGAGGCCGA 900GGCAGGCGGA TCACTTGAGG TCAGGAGTTT AGGACCAGTC TGGCCAACAT 950GGTGAAACCC TGTCTCTAAT AAAAATACAA AAATTAGCTG GGTGTGGTGG 1000(2)SEQ ID NO:35的信息:
(i)序列特征:
(A)长度:1400bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S176
(viii)基因组中的位置
(A)染色体/区段:7q21-7q22
(xi)序列描述:SEQ ID NO:35:CCATATGTTT GTTTCCTCTA CTACTGCTCC TCCCTGACCC TTAAGAAACA 50CTGCCATAGA GCCCTACAGC TTGATGGGAG AAGTCCTATC CCTTAGGCAT 100GGAAAGCTAT TAAGAATGTG AGAACTGTGT ATGAGGAAAC TAATTTAATA 150ATTCCTTAGA ATGGAACCAG TTGAAAATTT CCAGCTCCAC AAACTGAAGT 200GAAATCATTT TTTCTCCACT CCTTACTAGT AAATTTACTG TTCTATGTTA 250AAAGAAAAAA AAAATCAACC AGCATTTAAA TTATGGCAAC CTAAAATGTG 300TCCAGTATCT TAGAATAATT TCCCCACTGA CCTATTCCTC TGTAATAGTA 350AAACATATAC ACAAATGTTT ATAGCTACAT TAGTCATAAT AGCCGAAAGG 400TAAAAACAAC CCAAATGCCC ATCAACTAGA TAAATGTATT TAAAAAATAT 450GACCCAGGCG AGGTGGCTCA GGCCTGTAAT CCCAGCACTT TAGGAGGCTG 500AGGTGGGTGG ATGACCCAGG AGTTCAAGGC CAACCTGGTG AACATAGTGA 550GACCCCATCT CTACAAAACT AAAAATAAAA AATTAGCCAG ATGTTGTGGT 600GTACACCTGT AGTCCAAGCT ACTCAGGACG GTGAGGAAGG AAGATCACTT 650GAGCCCGGGA GTTTGAGGCT GCAGTGAGCT ATGATCACAC CATGGCACTC 700CAGCCTGGGC AAGAAAGTGA GACCAAATTA TTAAAAAAAA AAAAAAAAAA 750AAAAAAAAAA AAAAAACAGA AGAAGAAGCA CTGATGCATA GGCCATGAAT 800AAACTTTGTA AATATTATGC TAAGTAAAAG AAGCCAGAGA TGAAAATCAC 850ATATTGTAAT TGTATGACTC CATGTGTTTT TTTAAAAAGG TCCACACAGA 900AAAGCTATTA GTAGTTGCTC ACAGCTGGAA GGCAAGGAGG GCACGTAAGT 950GGGTGATAGC TATAGGACAC AAGGATTATT TCTGAAATGA TGAAAATGTT 1000CTAAAACCGT GGTAATGGTT TTACAACCCT GTGAATATAC TAAAAACTAC 1050TGAATTGTAT ACTTAAAATG GGTGAATTAG ACGGCATATG AATTATATAT 1100CAATAAAGGT ATTACCCAAG AAAAAGAATA CAGTATCTTC ATATTCTATA 1150TTCTCCTCTC TTAGCTTTAC TCAGATTTCA CCTCTGTCCA GTCACCTTTC 1200CACATTAACT CCAGGCAACT CCAAAAGTTA TTCTTCCTGC TTCATTCATC 1250CCCCAAATAA ATTACATTCA CTACTGCGAA GATAACTGGC CAGAAACTCA 1300ATTCCTGAAG TTCTGGCAAA TGGTTCCTAG ACTCCAAATG GAGCAGAATA 1350ATTTGCAACT GGGCTTAAAC ACGATTGTCT TTTTTAAGGC ATCCTCAGTT 1400(2)SEQ IDNO:36的信息:
(i)序列特征:
(A)长度:1250bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S189
(viii)基因组中的位置
(A)染色体/区段:22q11.2-qter
(xi)序列描述:SEQ ID NO:36:GTTGCTCTGG CGATTCGCAA CTCGAAAATG ACACTTACTA TTCAGCTAGA 50GATTAGAATC TCAAGCAGTA GGGCATTTTT TAATAAAAAA TTAAATTAAA 100AATAGATTTG CCATTGTCTG CTTAATAAAA CTAGTAGCTC TGCTGGCTTA 150GAGGGGAAAT AACATATTTC TTCGGATTTT TATATATTCA TCTGAGCAGT 200GCTAAAAAAT AAAACAAAGT TACTAATATT CATATCTTGA GCAATTGTAC 250ATTGCTTCTA ACTATACATT CAATCTCTCT GGCACATCCA CTGTGGCCCT 300GAGCAGCCAG TACAGGCTCT TCTACCAAAA CGAAGCAAGC CACTCCAAAA 350CCTGACGCGT GCAGGTGTCA CGAAACACCA GGTGCAGCTT GACAGATGTG 400AGCCAAATAA GGAAACATTC AGCCCAGCAC TGCCCAACAG TCATGATGTA 450TATTTTCTAC ATCTGTGCTC TAAAATATGG TGGCCACTAG CTGCAGGTGG 500CTATTGAGAC TAAGGAACTG TATTTTTAAT TTTATTTCAT TTCAACTCAT 550TTAAAGTAGC CACATGCCGC TAATGGCTAC TGATCTAGAG GGCAGCTGGG 600ATGTTACTCT TGAGAATGTC TCCAGCATTT TACCTGTTGC TCTCTCTCAC 650TCACATTTCC CATTCTAGCA CAAACAAAAC AAAACAAAAC AAAACAAAAC 700AAAACAAAAC AAAACAAAAA AACCACAACA CCTACAGTTC TCCAAACAGG 750GCATCTGTTT TGTTCCTCTG GGGGGGTCCT GTCTATGTTG TTCACGTGGC 800CCTGGATTTC CATACTCCTA GCCTTCCTGG AAGACATCCT TTTCATCCTC 850ACAACCCAAC CCAGGCTTTA TCTCTTCTGT GAAGCTGTCC TTGATTTTCC 900GTTCTATCTT CCCTGCTTGT GAATGGGTCA GCTCTCCTTC CCCACCGCCC 950TGTGCGTGTG AACATCTTTG TTCAGTATAC TGCAGTGGGT CGGGAGTATG 1000TCCCTTCCAG ACTGGAAGGC AGAGAGGGTG GCTGTAAGGA TTGGCACTTT 1050GGGCCAGGCA CAGTGCTCAT GCCTGTAATC CCAGCACTTT GGGAGGCTGA 1100GGCAGGAGAA TCGCCCGACC CCAGGAGACA GAGTTTGCAG TGAGACGAGA 1150TTGCACCACT GCACTCTAGC CTGAGGGATA GAGCAAGACT CCCTCTCAAA 1200AAAATAAATA AATAAATAAA TAAATAAATA AAAATAAAAA ATTAAAGAGG 1250(2)SEQ ID NO:37的信息:
(i)序列特征:
(A)长度:1200bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S199
(viii)基因组中的位置
(A)染色体/区段:6q21
(xi)序列描述:SEQ ID NO:37:TTTCATGTTC ACAGATTGGA TTAATATTGT TAAACTGTCC ATACTACCCA 50AAGCAATCCA TAGATTCAAT GCAACCCTGA TATAGTTTGA ATGTATGTAG 100GCACCAAAAT CTCATGTTGA ACTTTAATCC CCAGTGTTGG AGGTGGAGCC 150TGGTGTAAGA TGTTTAGATT ATGAAGGTGA ATCCCTCATG AACGGCTTGG 200GCCATCTGCT TGGTGATAAG TGAGCTCTTG TTCTGAGTTC ACATGAGATA 250CAGTCATTTA AAAGCCTGTG GTACCCAAAC TCTCTCTTGC TCTTGCTTCT 300GTTCACGCCA TGTGATATAC CTGCTATCCT TTGCCTTTGC CTTCTGCCAT 350GATTGGAAGC TTCCTGAGTC CTCCCCAGAA ACAGATGTAA CTATGCTTCC 400TGTACAGCCT GCAGAACCAA GAACAAACTG AAACTCTTTT GTTATAAATT 450GCCCAGGATT AGGTGGGTGT TTTGTTTTGT TTTGTTTTGT TTTGTTTTGT 500TTTTTGAGAT GGAGTCTCGC TCTGTCTCCC AGGCTGGAGT GCAATGATAC 550AATCTCGGCT CACTGCAACC TCCACCTCCC CGTTCAAGCA ATTCTCCTGC 600CTCAGCCTCC TGAGTAGCTG GGATTACAGG CGCACGCCAT CATGCCCGGC 650TAATTTTTGT ATTTTTAGTA GAGACGGGGT TTCACCACAT TGGTCAGGCT 700GGTCTCGAAC TCCTGACCTC ATGATCCACC CGCCTTGGCC TCCCAAAGTG 750CTGGGATTAC AGGCGTAAGC CACCATGCCC AGCCAGGTGG TTTTTTATAG 800TAGTGCAAGA ATGGCCGAAT ACAAACCCCT ATCAAAATAC CAATGACATT 850TGTCAGGGAC ATTTTTAAAA ATTCTGAAAT TTATATGGAA CCACAAAAGA 900CCCAGAATAG CCAAAACTAA CCTGAGCAAA AAGAACAAAC CTGGAAGAAT 950CACATTACCT GACTTCAAAG TGTACTACAG AGCTCTTATA ATCAAAACAT 1000CATGGTACTA GCATAACAAC AGACACATAG ACCAATGGAA CACAATAGAG 1050AACCCAGAAA CAAATCCATA CACCTACTGT GAACTCATTT TTGACAAAGG 1100TGCCAAGAAC ATACATGGGA GAAAGGACAG TATCTCCAAA TAAATGGTGC 1150TGAGAAAAGT GGATATACAT ATGCATAAGA ATGTAACTAG ACCCCTATCT 1200(2)SEQ ID NO:38的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S040
(xi)序列描述:SEQ ID NO:38:GCTGCAATAA ACACGGGAGT GTAGGTATCT TTAAAAGAAG GTGGTGATTT 1900CATCTCTTCT GGGTATGTAT CCAAAATAGG GTCACTGTTG GGTTATAAGG 1950TGGTTAGGTT TTGAATTTCT TTAGGAACCT CCATACTGTT TTCCATAATG 2000GGTGCACCAA TCATCATTCC CACCAACAAT GTACAAGTGT TTTATTTTCT 2050TCACACCCTC ATCAATATTT ATCTCTTGTC TTTTTTATAA TAGCCATCCT 2100AAAGACTGTA AGGCGTTTTA TTTCTAATCT CAGATTTCAC TGTAGAAACA 2150GTGATGACAC AGTCTCCAGC TTCCCTGTCT TTGTCTCTGG AGAAAAAAGC 2200CACCCTGACT TGCAGGGCCA GTCAGTGTTA GCAGCTACTA AGCCTGGTAC 2250CAGAAGAAAC CTGAGCGGGT TCCCAGGCTC CTCATCTATG GTACAGCCCT 2300GATTTGTGAT AGTGGGTCGG GGACAGGGCT TACTCTCACC ATCGGCAGCC 2350TGGAGCCTGG AGCCTGGAGA TTTGCACTTC ATCACTGTTA TCAGCATAGT 2400AGTTGGTGTC CCATACTGAT TCGACATGCA ACAAAAACCT CCAGGAGACC 2450TAAGGTGTTT ATTTGATTAT ACTACCTGCT TCCTTTTTAG TCATCTGATG 2500TGGTGCTGCT CAGTTTTAGC ATCTCTGCTT TGATTGGAAA TTCTGAGGTT 2550CTCAAAAGTA ATTCCTTATA ATATTTATAG TTTCACTCAT GGATTTTTTT 2600CTCAGACCCA AATGTACAGC CAGGTTCAGG CACAATTTCA TGGTCAAGGC 2650CATTGGATCA GACTCACATG AGTGGACGCC TCTAAAGGTC CTGGCCAGTG 2700CGATAAAGTA GCAGCGACAA TGATAAAGAA GAAGAATTAG AAAGGCAGAA 2750TTAAAGGTAT AACAATTCAC TGATGAAAGG ACTGTGTGGG GGAGAAATTT 2800CTAATTGTCT ACACAGAAAT TATTAGAATT AATGAGATAC ATAGCAAATT 2850(2)SEQ ID NO:39的信息:
(i)序列特征:
(A)长度:1050bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S066
(xi)序列描述:SEQ ID NO:39:GGGGCCTAGC CCAGTTGGAG GGACAAGAGC TGGAAACTGG GTTCCTTAGG 50GTGGTGCCAG AGTGGGCAGA GACCTCTGGG CAGCCCACGT CCAAGTCCAG 100AGCAAGGGGA GGCTCATCCT AGAAAAGAGG CCAGAGGAGC CATAACCACC 150ATTGTTCCTT GGGTTAAGGA GTCCTTTTTT AAAACCATCA AAACTAAGAA 200TCCAGTGCAT TATGAATCCA AGGGGTGAGG CTCAGTGTGC CAATGCCCCA 250GAACAGTCTA AGAAAGCTCC TTTTCCCTTT CCAGGCAGCT CGAGCTTTAC 300CTTCCCAAAT TCTCCATTGA GGGCTCCTAT CAGCTGGAGA AAGTCCTCCC 350CAGTCTGGGG ATCAGTAACG TCTTCACCTC CCATGCTGAT CTGTCCGGCA 400TCAGCAACCA CTCAAATATC CAGGTGTCTG AGGTGGGTTC AGAAGCTCCT 450ATGCATCTGC TTCCCAAGAT CTATTCTGTT CTATTCTTTC TATTCTACTC 500TACCCCATTT CATTCCATTC CATTCCACTC AACTCCACTC CACTCCACTC 550CACTCCAGTT CACTCTATTC AATTCCACTC CACTCCAGTT CACTCTATTC 600AATTCCACTC CACTCCACTC CAGTTCACTC TATTCAGTTC CACTCCACTC 650CACTCCACTC CACTCCAGTT CACTCTATTC CATTCCACTC CATTCCACTC 700CTCCACTCCT CTCATCCACT CCACTCTACT CCTCCACTCC ACATCTCCAC 750TCCACTCCTC CACTCCACTC CTCCACTCCA CTCATCCACT CCACTCCTCC 800ACTCCACTCC TCCACTCCAC TCCTCCACTC CACTCCACTC ATCCACTCCA 850CTCTTCCATT CCACTCCATT CCACTCCTCC ACTCCACTCT TCCACTCCAC 900TCCATTCCAC TCCTCCACTC CACTCCACTC TATTCTATTC TATTCCATTC 950CATTCTACTC TATTCTATTC CATTCCATTG CAGTCAACTC CACTCCACTC 1000TCTACTATTC TATTCCACTC CTCTCCCCTC CACTCCATTC CATTGCAGTC 1050(2)SEQ ID NO:40的信息:
(i)序列特征:
(A)长度:4580bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:
(B)克隆:S077
(xi)序列描述:SEQ ID NO:40:GGATCCCAAT TCATTCCGGG CTGACACGCT CACTGGCAGG CGTCGGGCAT 50CACCTAGCGG TCACTGTTAC TCTGAAAACG GAGGCCTCAC AGAGGAAGGG 100AGCACCAGGC CGCCTGCGCA CAGCCTGGGG CAACTGTGTC TTCTCCACCG 150CCCCCGCCCC CACCTCCAAG TTCCTCCCTC CCTTGTTGCC TAGGAAATCG 200CCACTTTGAC GACCGGGTCT GATTGACCTT TGATCAGGCA AAAACGAACA 250AACAGATAAA TAAATAAAAT AACACAAAAG TAACTAACTA AATAAAATAA 300GTCAATACAA CCCATTACAA TACAATAAGA TACGATACGA TAGGATGCGA 350TAGGATACGA TAGGATACAA TACAATAGGA TACGATACAA TACAATACAA 400TACAATACAA TACAATACAA TACAATACAA TACAATACAA TACAATACGC 450CGGGCGCGGT GGCTCATGCC TGTCATCCCG TCACTTTGGG ATGCCGAGGT 500GGACGCATCA CCTGAAGTCG GGAGTTGGAG ACAAGCCCGA CCAACATGGA 550GAAATCCCGT CTCAATTGAA AATACAAAAC TAGCCGGGCG CGGTGGCACA 600TGCCTATAAT CCCAGCTGCT AGGAAGGCTG AGGCAGGAGA ATCGCTTGAA 650CCTGGGAAGC GGAGGTTGCA GTGAGCCGAG ATTGCGCCAT CGCACTCCAG 700TCTGAGCAAC AAGAGCGAAA CTCCGTCTCA AAAATAAATA CATAAATAAA 750TACATACATA CATACATACA TACATACATA CATACATACA TAAATTAAAA 800TAAATAAATA AAATAAAATA AATAAATGGG CCCTGCGCGG TGGCTCAAGC 850CTGTCATCCC CTCACTTTGG GAGGCCAAGG CCGGTGGATC AAGAGGCGGT 900CAGACCAACA GGGCCAGTAT GGTGAAACCC CGTCTCTACT CACAATACAC 950AACATTAGCC GGGCGCTGTG CTGTGCTGTA CTGTCTGTAA TCCCAGCTAC 1000(2)SEQ ID NO:41的信息:
(i)序列特征:
(A)长度:1000bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(A)文库:
(B)克隆:S097
(xi)序列描述:SEQ ID NO:41:GGACATGAGG CTTCCCAGCC AACTGCAGGT GCACAACATA AATGTATCTG 50CAAACAGACT GAGAGTAAAG CTGGGGGCAC AAACCTCAGC ACTGCCAGGA 100CACACACCCT TCTCGTGGAT TCTGACTTTA TCTGACCCGG CCCACTGTCC 150AGATCTTGTT GTGGGATTGG GACAAGGGAG GTCATAAAGC CTGTCCCCAG 200GGCACTCTGT GTGAGCACAC GAGACCTCCC CACCCCCCCA CCGTTAGGTC 250TCCACACATA GATCTGACCA TTAGGCATTG TGAGGAGGAC TCTAGCGCGG 300GCTCAGGGAT CACACCAGAG AATCAGGTAC AGAGAGGAAG ACGGGGCTCG 350AGGAGCTGAT GGATGACACA GAGCAGGGTT CCTGCAGTCC ACAGGTCCAG 400CTCACCCTGG TGTAGGTGCC CCATCCCCCT GATCCAGGCA TCCCTGACAC 450AGCTCCCTCC CGGAGCCTCC TCCCAGGTGA CACATCAGGG TCCCTCACTC 500AAGCTGTCCA GAGAGGGCAG CACCTTGGAC AGCGCCCACC CCACTTCACT 550CTTCCTCCCT CACAGGGCTC AGGGCTCAGG GCTCAAGTCT CAGAACAAAT 600GGCAGAGGCC AGTGAGCCCA GAGATGGTGA CAGGGCAATG ATCCAGGGGC 650AGCTGCCTGA AACGGGAGCA GGTGAAGCCA CAGATGGGAG AAGATGGTTC 700AGGAAGAAAA ATCCAGGAAT GGGCAGGAGA GGAGAGGAGG ACACAGGCTC 750TGTGGGGCTG CAGCCCAGGA TGGGACTAAG TGTGAAGACA TCTCAGCAGG 800TGAGGCCAGG TCCCATGAAC AGAGAAGCAG CTCCCACCTC CCCTGATGCA 850CGGACACACA GAGTGTGTGG TGCTGTGCCC CCAGAGTCGG GCTCTCCTGT 900TCTGGTCCCC AGGGAGTGAG AAGTGAGGTT GACTTGTCCC TGCTCCTCTC 950TGCTACCCCA ACATTCACCT TCTCCTCATG CCCCTCTCTC TCAAATATGA 1000(2)SEQ ID NO:42的信息:
(i)序列特征:
(A)长度:1144bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S103
(xi)序列描述:SEQ ID NO:42:CTCTGACTCT CCGCGGTGGT TGTTGGGGCT TCTTGGCTTT GTTTTGTTGT 50TTGTTTGTAT TTTATTTTTT TCTCTCTGAC ACCTATTTTA GACAAATCTA 100AGGGAAAAAG CCTTGACAAT AGAACATTGA TTGCTGTGTC CAACTCCAGT 150ACCTGGAGCT TCTCTTTAAC TCAGGACTCC AGCCCATTGG TAGACGTGTG 200TTTCTAGAGC CTGCTGGATC TCCCAGGGCT ACTCACTCAA GTTCAAGGAC 250CAACAAGGGC AGTGGAGGTG CTGCATTGCC TGCGGTCAAG GCCAGCAAGG 300TGGAGTGGAT GCCTCAGAAC GGACGAGATA ATGTGAACTA GCTGGAATTT 350TTTATTCTTG TGAATATGTA CATAGGCAGC ACTAGCGACA TTGCAGTCTG 400CTTCTGCACC TTATCTTAAA GCACTTACAG ATAGGCCTTC TTGTGATCTT 450GCTCTATCTC ACAGCACACT CAGCACCCCC TTCTCTGCCC ATTCCCCAGC 500CTCTCTTCCT ATCCCATCCC ATCCCATCCC ATCCCATCCC ATCCCATCCC 550GCTCTTTTCC TACTTTTCCT TCCCTCAAAG CTTCCATTCC ACATCCGGAG 600GAGAAGAAGG AAATGAATTT CTCTACAGAT GTCCCATTTT CAGACTGCTT 650TAAAAAAAAT CCTTCTAATC TGCTATGCTT GAATGCCACG CGGTACAAAG 700GAAAAAGTAT CATGGAAATA TTATGCAAAT TCCCAGATTT GAAGACAAAA 750ATACTCTAAT TCTAACCAGA GCAAGCTTTT TTATTTTTTA TACAGGGGAA 800TATTTTATTC AAGGTAAAAT TCTAAATAAA ATATAATTGT TTTTTATCTT 850TTCTACAGCA AATTTATAAT TTTAAGATTC CTTTTCTTGT TTATCAGCAG 900TTGTTATTAC ATCCTTGTGG CACATTTTTT TTTAATTTTG TAAAGGTGAA 1000AAAAGCTTTT ATGAGCTCAT CTAGCAATCA GATTTTCCTG TGGA 1144(2)SEQ ID NO:43的信息:
(i)序列特征:
(A)长度:1366bp
(B)类型:核酸
(C)链性:双链
(D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
(B)克隆:S110
(xi)序列描述:SEQ ID NO:43:GGAATTCAAT GGAATATAAC GAAATGGATA GGATCAGAAC GGAACAGAGC 50GGAGTGGAGT TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAT 100AGAATGGAAT GGAATGCAGT GGAGTGGAAT GGAATGAAGT GGAATGGAGT 150TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAG AGAATGGAAT 200GGAATGGAAT GCAGTGGACT GGAATGGAAT GGAGTGGAGT GGAGTGCAGT 250GGGAATCGAG TGGAGTGGAG TGGAATGGAC TGGAATGGAA TGGATTGGAG 300TGGAGTGCAG TGGAATCGAG TGGAGTGGAG TGGAATGGAG TAGAATGGAA 350TGGAGTGGAG TGTAGTGGAA TGGAATGGAA TGGTGAATGA ATGTCAGCTA 400AGATTGTGCA ACTGCATTCC AGTCTGGGTG ACAAAGTGAG ATCCAGTCGA 450AGTAAAGGAA TGGAATGGAA TAGAGTAAAA TGGAATGGAA TGGTGTGGAG 500TGGAATGGAA TGGAGAGGAA TGGAGTGGAG TGGAGTGGAG TGGAGTGGAA 550TGGAGTGGAG TGGAATGGAG AGTGATGGAG AGGAATGGAA TGGAATGGAA 600TGGAATGGAG TGGAATGGAA TGGAATGGAG TGGAATGGAA TGGAATGTAG 650AGGAGTGGAG TGGATTGGAG TGGAGTGGAA TGGAGTGGAA TAGAGTGAAA 700TTTAGTGGAG TGTAATGGAG TGGAGTGGAG TGGCAGTTGA GTGGCATGGA 750TCAGGTGCAG TGGAATGGAA TGGAATGGAG TGGAGTGGAG AGGAGTGGAG 800TGGAATCGAA TGGAATGGCA TGGAGTGGAG TGGAATGGAG TGGATTGGAA 850TTGAATGCAG TGGAATGGAA TGCAATGGAG TGGAGTGGAG TGCAGTGGAG 900TGGAGTGGAG GGGAATGGAA TGGAGTGGAG TAAAATGGTT TGGAATGGAG 950TGGGGTGGAA TGGAGTGGGT TGGAATGGAG TGGAGTGGAG TAGAACGGAG 1000TGATTGGGGT GGAATGGAAT AGAGTGGAAT GGAATGGAGT GGAGTGGAGT 1050AGAACGGAGT GATTGGAGTG GAATGGAATA CAGTAGAGTG GAATGCAGTG 1100GAGTGGAATG GAATGGAGTG GAGTGGCATG GAAAGGAATG GAGAGGAATG 1150GAATGGAATG GAATGGAATG GAATGGAATG GAATGGAATG GAACGGTGAA 1200ATAAAATGTG AGTTAAGATT GTGCCACTGC ATTGCAGTCT GGGGGACAGA 1250GTGAGATACA GTCGAAATAA AGGAATGGAA GGGACTGGAG TAGAATGGAA 1300TGGAATTGAG TGGAGTGGAA TGGAATGAAG TGGAGAGGAA TGGAATGGAG 1350TGGAATGCAA TGGAGG 1366(2)SEQ ID NO:44的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:44:TGGCTCAGAC ACCTCATTG 19(2)SEQ ID NO:45的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:45:CACCACTGTA TTCCCAGTTT G 21(2)SEQ ID NO:46的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:46:CACTTGCCAT CCCTGCCACA CA 22(2)SEQ ID NO:47的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:47:AGCGCACCCC CAATTTCCGG TAT 23(2)SEQ ID NO:48的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:48:TGGGGACATG AACACACTTT GC 22(2)SEQ ID NO:49的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:49:GAGGCCCAGG ACCAGATGAA AT 22(2)SEQ ID NO:50的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQID NO:50:CACCTGTCAG GCAAGGCTTA AAC 23(2)SEQ ID NO:51的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:51:CAACACTGAG CGCTTTTAGG GACT 24(2)SEQ ID NO:52的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:52:TCAGGCAAGG CTTAAACAGG GATA 24(2)SEQ ID NO:53的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:53:ACACTGAGCG CTTCTAGGGA CTTC 24(2)SEQ ID NO:54的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:54:TGAGCGCTTC TAGGGACTTC TTCA 24(2)SEQ ID NO:55的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:55:CCCTGCCCTA CCCACTTG 18(2)SEQ ID NO:56的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:56:AGGCCCAGGA CCAGATGA 18(2)SEQ ID NO:57的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:57:GCACCTGTCA GGCAAGGCTT AAAC 24(2)SEQ ID NO:58的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:58:CCAGCCATGA AGTGGCTGTG AG 22(2)SEQ ID NO:59的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:59:CCCGCTTCAA AGTTCCCAGT TC 22(2)SEQ ID NO:60的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:60:CCTCCCATTT CAGCCTCCTG A 21(2)SEQ ID NO:61的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:61:GTCTGCCACA GTGCTGGAAA CTAA 24(2)SEQ ID NO:62的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:62:GCACCCCAGC CTAAGGCAAT A 21(2)SEQ ID NO:63的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:63:GCATGGCGGA AGAAACAA 18(2)SEQ ID NO:64的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:64:TGGCAACAGA GCGAGACTC 19(2)SEQ ID NO:65的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:65:CCTGGGTGAC AGCGAGAATC T 21(2)SEQ ID NO:66的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:66:TGTCCCTTGC CTTGTCTCAC TAAA 24(2)SEQ ID NO:67的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:67:CAGCCTTGGT GACAGAGCAA A 21(2)SEQ ID NO:68的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:68:TGTGTTGAGG GTGGGGTACA T 21(2)SEQ ID NO:69的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:69:CCTGGGCAAG AGAGCAAG 18(2)SEQ ID NO:70的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:70:CACATCCCAA AACCACCCTA C 21(2)SEQ ID NO:71的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:71:GCATTTCCCC TGCTTGTACT 20(2)SEQ ID NO:72的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:72:GATCACATTT GCTAACCACT TCTC 24(2)SEQ ID NO:73的信息:
(i)序列特征:
(A)长度:26
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:73:GGCAACATAT CAAGACCCCC ATCTCT 26(2)SEQ ID NO:74的信息:
(i)序列特征:
(A)长度:26
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:74:GAAGCTGCCC CTCACCACTA CATTTT 26(2)SEQ ID NO:75的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:75:GATCACATTT GCTAACCACT TCTC 24(2)SEQ ID NO:76的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:76:TATAAATTAC CCAGTCTCAG GAAG 24(2)SEQ ID NO:77的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:77:GTGATACAGC AAGCCTCATC 20(2)SEQ ID NO:78的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:78:AGAGACTCCT GGAAAGATAA AAGT 24(2)SEQ ID NO:79的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:79:GTCTGGAGAA CAGTGGCCCT TGT 23(2)SEQ ID NO:80的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:80:CAGGAAGCTG AGGCAGGAGA ATCT 24(2)SEQ ID NO:81的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:81:AAGGCTCCAG TGGGGTAT 18(2)SEQ ID NO:82的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:82:AAAACAAGGC AGTAGTCAAT AAAG 24(2)SEQ ID NO:83的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:83:GGCATGAGAA TCGCTTGAAC CTG(2)SEQID NO:84的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:84:GGCCTCCATG ATGTTTCCAA TGAT 24(2)SEQ ID NO:85的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:85:TCAGGAGGCA TGAGAATCGC TTGA 24(2)SEQ ID NO:86的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:86:GGCCTCCATG ATGTTTCCCA ATGA 24(2)SEQ ID NO:87的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:87:CTCGCCCTCT CCTATAAGCA GTTT 24(2)SEQ ID NO:88的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:88:GCAGAGATAA TTTGGAGTGG GATG 24(2)SEQ ID NO:89的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:89:CTTGGGTGCC TGTAATCC 18(2)SEQ ID NO:90的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:90:GGTAGAGCTC CCCCATCT 18(2)SEQ ID NO:91的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:91:GCAGAATATT GGGGCTCATC AC 22(2)SEQ ID NO:92的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:92:AAACAAGGAA AGGAGAGGAG AGGA 24(2)SEQ ID NO:93的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:93:AAGGTTGTGG GATGACTACT ACA 23(2)SEQ ID NO:94的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:94:TGGTCAACAC AGCAAGACAT T 21(2)SEQ ID NO:95的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:95:TCCTGCCACC TGCTTGCTTT CT 22(2)SEQ ID NO:96的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:96:ATTGCACTCC AGCCTGGGTGA TAC 23(2)SEQ ID NO:97的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:97:CGCTTGAGCC TTGGAGATTG 20(2)SEQ ID NO:98的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:98:GAGCAGTCAG AATTCAGGAG TTGT 24(2)SEQ ID NO:99的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:99:TGGGCAACAA GAGCAAAACT CCAT 24(2)SEQ ID NO:100的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:100:GGGACTTGGG CTGAGGGCTT TAC 23(2)SEQ ID NO:101的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:101:ATATCAATAT CAGGCAGCCA CAGG 24(2)SEQ ID NO:102的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:102:CCGTTTCAGA GCAGAGGTTT AGC 23(2)SEQ ID NO:103的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:103:TCTCATTGGT TTCAAAGAAC TTA 23(2)SEQ ID NO:104的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:104:AGACTCCATC TCAAACAAAA GA 23(2)SEQ ID NO:105的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:105:TCATGTGCAT GGAGCCTGGT TCAT 24(2)SEQ ID NO:106的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:106:CCCAGCCTTG GCAAGAGTGA GGT 23(2)SEQ ID NO:107的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:107:GGCGACTGAG CAAGACTC 18(2)SEQ ID NO:108的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:108:TTAAGCAAAG TAGCCTCAAA CA 22(2)SEQ ID NO:109的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:109:GGGCGACTGA GCAAGACTC 19(2)SEQ ID NO:110的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:110:ACTCATTACC TTGCATGCAT GATA 24(2)SEQ ID NO:111的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:111:CATTACCTTG CATGCATGAT A 21(2)SEQ ID NO:112的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:112:TGGGCAACAG AGTAAGACTC A 21(2)SEQ ID NO:113的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:113:GTTCAGTACC GTTCACCTCT TTA 23(2)SEQ ID NO:114的信息:
(i)序列特征:
(A)长度:30
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:114:GTAAGACTCA GTCTCCAAAA AAAAAAAAAG 30(2)SEQ ID NO:115的信息:
(i)序列特征:
(A)长度:38
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:115:AGGAATGGTT TCTCTGTTAG TAAATGGT 38(2)SEQ ID NO:116的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:116:CAGCCTGGGC AACAAGAATG AAAC 24(2)SEQ ID NO:117的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:117:TGGCCCCTGC AGCGGAGTC 19(2)SEQ ID NO:118的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:118:GAATTCATTT GCGGAAAGAT T 21(2)SEQ ID NO:119的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:119:CTAGGGAGGC TGGAGTATTC A 21(2)SEQ ID NO:120的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:120:AGAGCAAGAC CCCGTCTCAT 20(2)SEQ ID NO:121的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:121:AGTCCATGGG CCTTTTAACA 20(2)SEQ ID NO:122的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(ii)分子类型:寡核苷酸ssDNA
(iii)假设:否
(iv)立即来源:
(B)扩增的克隆:S125
(xi)序列描述:SEQ ID NO:122:GAGAATCACT TGAACCCAGG AAG 23(2)SEQ ID NO:123的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:123:AGAACCAGCT GTTAGTTTCG TTGA 24(2)SEQ ID NO:124的信息:
(i)序列特征:
(A)长度:25
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:124:GGTTGCAGTG AGCCGAGATA AGAGT 25(2)SEQ ID NO:125的信息:
(i)序列特征:
(A)长度:25
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:125:TGTGCCAGGA ACCAGAAATT TACAG 25(2)SEQ ID NO:126的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:126:GGCCCAAGGT TACTTTTCAC 20(2)SEQ ID NO:127的信息:
(i)序列特征:
(A)长度:16
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:127:GGGCCACTGC ACTCCT 16(2)SEQ ID NO:128的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:128:CATGGTGAGG CTGAAGTAGG AT 22(2)SEQ ID NO:129的信息:
(i)序列特征:
(A)长度:25
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:129:GTGGCGTGTC TTTTTACTTT CTTTA 25(2)SEQ ID NO:130的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:130:AGGCAGCCCA GGAACAAT 18(2)SEQ ID NO:131的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:131:CCAAGATAGC GGCCAAGATA GT 22(2)SEQ ID NO:132的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:132:GAGGGCAGCT GGGATGTTAC TCTT 24(2)SEQ ID NO:133的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:133:TGCCCTGTTT GGAGAACTGT AGGT 24(2)SEQ ID NO:134的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:134:CTCCCCAGAA ACAGATGTA 19(2)SEQ ID NO:135的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:135:GTGAGCCGAG ATTGTATCAT 20(2)SEQ ID NO:136的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:136:TCGGGGACAG GGCTTACTC 19(2)SEQ ID NO:137的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:137:ATCATTGTCG CTGCTACTTT ATCG 24(2)SEQ ID NO:138的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:138:CTACTCTACC CCATTTCATT C 21(2)SEQ ID NO:139的信息:
(i)序列特征:
(A)长度:19
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:139:GTAGAGTGGAG TGGATGAGA 19(2)SEQ ID NO:140的信息:
(i)序列特征:
(A)长度:21
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:140:ATCAGGCAAA AACGAACAAA C 21(2)SEQ ID NO:141的信息:
(i)序列特征:
(A)长度:17
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:141:CGGCATCCCA AAGTGAC 17(2)SEQ ID NO:142的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:142:CAGAGAGGGCA GCACCTTGGA CAG 23(2)SEQ ID NO:143的信息:
(i)序列特征:
(A)长度:23
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:143:GGCTTCACCT GCTCCCGTTT CAG 23(2)SEQ ID NO:144的信息:
(i)序列特征:
(A)长度:22
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:144:TCTGCCCATT CCCCAGCCTC TC 22(2)SEQ ID NO:145的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:145:TACCGCGTGG CATTCAAGCA TAGC 24(2)SEQ ID NO:146的信息:
(i)序列特征:
(A)长度:18
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:146:TCCAGTCTGG GTGACAAA 18(2)SEQ ID NO:147的信息:
(i)序列特征:
(A)长度:20
(B)类型:核酸
(C)链性:单链
(D)拓扑学:线性
(xi)序列描述:SEQ ID NO:147:CAATCCACTC CACTCCTCTA 20
Claims (34)
1.一种用杂交选择分离含有中度串联重复序列的DNA片段的方法,包括以下步骤:
(a)提供多个DNA片段,其中至少一个片段含有一中度串联重复序列,中度串联重复序列是该DNA片段的一区域,其含有至少一个由串联重复至少2次的5,6或7个碱基的序列组成的重复单位;
(b)提供一固定支持物,其结合至少一个寡核苷酸,其中该寡核苷酸包括互补于所述中度串联重复序列的一部分的核苷酸序列;
(c)在一定条件下组合该多个DNA片段和支持工具,其中包括含有中度重复序列的DNA片段的DNA片段与支持工具杂交。
2.权利要求1的方法,其中步骤(a)提供的多个DNA片段是由下述附加步骤产生的富集的DNA片段群,所述步骤包括:
将DNA样品片段化,从而产生DNA片段群,其中至少一个DNA片段含有中度串联重复序列;
将含引导序列的接头与DNA片段群每个DNA片段的至少一个末端连接;
用含互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。
3.权利要求2的方法,其中DNA样品是双链的,且是用至少一个限制性内切酶片段化的。
4.权利要求3的方法,其中双链的DNA样品是用限制酶MboI片段化的,且其中接头是MboI接头,该MboI接头为一双链DNA分子,该DNA分子具有互补于MboI消化的DNA片段每个末端的突出端序列的单链突出端核苷酸序列。
5.权利要求4的方法,其中接头是式(I)的双链DNA分子:
5’-pGCGGTACCCGGGAAGCTTGG (I)
CGCCATGGGCCCTTCGAACCCTAG-5’
其中A,G,C和T代表核苷酸,其中p表示DNA链的磷酸化5’末端。
6.权利要求1的方法,包括释放与步骤(c)中支持工具杂交的DNA片段的附加步骤。
7.权利要求6的方法,还包括以下步骤:
将每个释放自支持工具的DNA片段克隆入DNA载体中,
用克隆的载体转化宿主细胞,
鉴别含有靶克隆载体的转化体,该载体含有中度串联重复序列,和
从转化体中释放靶克隆载体。
8.权利要求1的方法,其中步骤(b)提供的支持工具包括直接与寡核苷酸偶联的物质,其中该物质选自硝基纤维素,尼龙,玻璃,二氧化硅和乳胶。
9.权利要求1的方法,其中步骤(b)提供的支持工具包括间接与寡核苷酸偶联的物质,其中第一个偶联剂与寡核苷酸结合,第二个偶联剂与固定支持物表面结合,其中第一个偶联剂和第二个偶联剂是亲和素和链亲和素,或抗体和抗原。
10.权利要求1的方法,其中步骤(b)中提供的支持工具包括至少两个不同寡核苷酸的混合物。
11.权利要求1的方法,其中中度串联重复序列是五核苷酸串联重复序列。
12.一种用杂交选择分离含有五核苷酸中度串联重复序列的DNA片段的方法,包括以下步骤:
(a)提供多个双链DNA片段,其中至少一个DNA片段含有五核苷酸串联重复序列,五核苷酸串联重复序列是该DNA片段的一区域,其含有至少一个由串联重复至少2次的5个碱基的序列组成的重复单位;
(b)提供一支持工具,其结合至少一个寡核苷酸,其中该寡核苷酸包括互补于所述中度串联重复序列的一部分的核苷酸序列;
(c)在一定条件下组合该多个DNA片段和支持工具,其中含有五核苷酸串联重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。
13.权利要求12的方法,其中步骤(a)提供的多个DNA片段通过以下步骤产生:
将双链的DNA样品用限制酶片段化,从而产生多个DNA片段,其中至少一个DNA片段含有五核苷酸串联重复序列;
将含引导序列的接头与多个DNA片段中的每个DNA片段的至少一个末端连接;
用包括互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。
14.权利要求12的方法,还包括以下步骤:
释放与支持工具杂交的DNA片段;和
用寡核苷酸引物扩增释放自支持工具的片段,该引物是用于在与支持工具杂交前扩增每个接头连接的片段的引物。
15.权利要求14的方法,还包括以下步骤:
将每个扩增的释放自支持工具的DNA片段克隆入DNA载体中,
用克隆的载体转化宿主细胞,
鉴别含靶克隆载体的转化体,该载体含有中度串联重复序列,和
从转化体中分离靶克隆载体。
16.权利要求12的方法,其中步骤(b)中提供的支持工具包括至少二种不同寡核苷酸的混合物。
17.检测具有低打滑假象出现率的靶中度串联重复DNA序列的方法,包括以下步骤:
(a)提供具有至少一个靶中度串联重复序列的DNA样品,其中靶中度串联重复序列是含有至少一个重复单位的DNA区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成;
(b)检测DNA样品中靶中度串联重复序列,其中观测到平均打滑假象不超过2.4%。
18.权利要求17的方法,其中靶中度串联重复序列是完全中度串联重复序列。
19.权利要求17的方法,其中靶中度串联重复序列是不完全中度串联重复序列。
20.权利要求17的方法,其中步骤(a)提供的DNA样品是人基因组DNA。
21.权利要求17的方法,其中步骤(a)提供的DNA样品的靶中度串联重复序列在步骤(b)之前扩增。
22.权利要求21的方法,其中靶中度串联重复序列用至少一个寡核苷酸引物扩增,该引物包括互补于并位于双链DNA标记的含有模板中度串联重复序列的区域的侧翼的序列,其中模板中度串联重复序列是含有至少串联重复2次的重复单位序列的DNA标记的区域,条件是DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43。
23.权利要求22的方法,其中用于扩增靶中度串联重复序列的寡核苷酸引物具有与其共价附着的荧光标记。
24.权利要求17的方法,通过将检测的靶中度串联重复序列与DNA大小标记中已知长度的片段相对比,在步骤(b)中观测到打滑假象。
25.权利要求24的方法,其中观测到不超过1.1%的平均打滑。
26.一种检测DNA样品中至少一个靶中度串联重复序列的方法,其中靶中度串联重复序列是含至少一个重复单位的DNA样品的一区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成,此方法包括以下步骤:
(a)提供至少一个寡核苷酸引物,该引物包括互补于并位于DNA标记的含有模板中度串联重复序列的区域的侧翼的核苷酸序列,其中DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ IDNO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ IDNO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13, SEQID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43;
(b)提供一含有靶中度串联重复序列的DNA样品;
(c)用所述的至少一个寡核苷酸引物扩增DNA样品的靶中度重复序列;和
(d)检测扩增的靶中度串联重复序列中的多态性。
27.权利要求26的方法,其中步骤(b)中提供的DNA样品是人基因组DNA样品。
28.权利要求26的方法,其中靶中度串联重复序列是完全中度串联重复。
29.权利要求26的方法,其中靶中度串联重复序列是不完全中度串联重复。
30.权利要求26的方法,其中步骤(a)中提供的寡核苷酸引物包括选自如下一组的序列:
SEQ ID NO:44和SEQ ID NO:45,当DNA标记序列是SEQ IDNO:1时;
SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,当DNA标记序列是SEQ ID NO:2时;
SEQ ID NO:59,SEQ ID NO:60,当DNA标记序列是SEQ IDNO:3时;
SEQ ID NO:61,SEQ ID NO:62,当DNA标记序列是SEQ IDNO:4时;
SEQ ID NO:63,SEQ ID NO:64,当DNA标记序列是SEQ IDNO:5时;
SEQ ID NO:65,SEQ ID NO:66,当DNA标记序列是SEQ IDNO:6时;
SEQ ID NO:67,SEQ ID NO:68,当DNA标记序列是SEQ IDNO:7时;
SEQ ID NO:69,SEQ ID NO:70,当DNA标记序列是SEQ IDNO:8时;
SEQ ID NO:71,SEQ ID NO:72,当DNA标记序列是SEQ IDNO:9时;
SEQ ID NO:73,SEQ ID NO:74,当DNA标记序列是SEQ IDNO:10时;
SEQ ID NO:75,SEQ ID NO:76,当DNA标记序列是SEQ IDNO:11时;
SEQ ID NO:77,SEQ ID NO:78,当DNA标记序列是SEQ IDNO:12时;
SEQ ID NO:79,SEQ ID NO:80,当DNA标记序列是SEQ IDNO:13时;
SEQ ID NO:81,SEQ ID NO:82,当DNA标记序列是SEQ IDNO:14时;
SEQ ID NO:83,SEQ ID NO:84,当DNA标记序列是SEQ IDNO:15时;
SEQ ID NO:85,SEQ ID NO:86,当DNA标记序列是SEQ IDNO:16时;
SEQ ID NO:87,SEQ ID NO:88,当DNA标记序列是SEQ IDNO:17时;
SEQ ID NO:89,SEQ ID NO:90,当DNA标记序列是SEQ IDNO:18时;
SEQ ID NO:91,SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,当DNA标记序列是SEQ ID NO:19时;
SEQ ID NO:95,SEQ ID NO:96,当DNA标记序列是SEQ IDNO:20时;
SEQ ID NO:97,SEQ ID NO:98,当DNA标记序列是SEQ IDNO:21时;
SEQ ID NO:99,SEQ ID NO:100,当DNA标记序列是SEQ IDNO:22时;
SEQ ID NO:101,SEQ ID NO:102,当DNA标记序列是SEQ IDNO:23时;
SEQ ID NO:103,SEQ ID NO:104,当DNA标记序列是SEQ IDNO:24时;
SEQ ID NO:105,SEQ ID NO:106,当DNA标记序列是SEQ IDNO:25时;
SEQ ID NO:107,SEQ ID NO:108,SEQ ID NO:109,SEQ IDNO:110,SEQ ID NO:111,当DNA标记序列是SEQ ID NO:26时;
SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ IDNO:115,当DNA标记序列是SEQ ID NO:27时;
SEQ ID NO:116,SEQ ID NO:117,当DNA标记序列是SEQ IDNO:28时;
SEQ ID NO:118,SEQ ID NO:119,当DNA标记序列是SEQ IDNO:29时;
SEQ ID NO:120,SEQ ID NO:121,当DNA标记序列是SEQ IDNO:30时:
SEQ ID NO:122,SEQ ID NO:123,当DNA标记序列是SEQ IDNO:31时;
SEQ ID NO:124,SEQ ID NO:125,当DNA标记序列是SEQ IDNO:32时;
SEQ ID NO:126,SEQ ID NO:127,当DNA标记序列是SEQ IDNO:33时;
SEQ ID NO:128,SEQ ID NO:129,当DNA标记序列是SEQ IDNO:34时:
SEQ ID NO:130,SEQ ID NO:131,当DNA标记序列是SEQ IDNO:35时;
SEQ ID NO:132,SEQ ID NO:133,当DNA标记序列是SEQ IDNO:36时;
SEQ ID NO:134,SEQ ID NO:135,当DNA标记序列是SEQ IDNO:37时;
SEQ ID NO:136,SEQ ID NO:137,当DNA标记序列是SEQ IDNO:38时;
SEQ ID NO:138,SEQ ID NO:139,当DNA标记序列是SEQ IDNO:39时;
SEQ ID NO:140,SEQ ID NO:141,当DNA标记序列是SEQ IDNO:40时;
SEQ ID NO:142,SEQ ID NO:143,当DNA标记序列是SEQ IDNO:41时;
SEQ ID NO:144,SEQ ID NO:145,当DNA标记序列是SEQ IDNO:42时;
SEQ ID NO:146,SEQ ID NO:147,当DNA标记序列是SEQ IDNO:43时。
31.一种检测DNA样品中至少一个靶中度串联重复序列的试剂盒,其中靶中度串联重复序列是DNA样品的一区域,其含有至少一个由至少串联重复2次的5,6或7碱基对的序列组成的重复单位,该试剂盒包括:
一种容器,其具有至少一个用于扩增所述至少一个靶中度串联重复序列的寡核苷酸引物,其中寡核苷酸引物包括互补于并位于双链DNA标记的含有模板中度串联重复序列的区域的侧翼的核苷酸序列,该模板中度串联重复序列包括至少串联重复2次的重复单位,其中DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ IDNO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43。
32.权利要求31的试剂盒,还包括一DNA标记
33.一种寡核苷酸引物,其包括互补于双链DNA标记的一条链的位于模板中度串联重复序列的侧翼的序列,其中该模板中度串联重复序列是双链DNA标记的含有至少一个由至少串联重复2次的5、6或7碱基对序列组成的重复单位的区域,其中双链DNA标记序列选自如下一组:含有互补于双链DNA标记侧翼模板中度串联序列的链的序列的,SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26和SEQ ID NO:27。
34.权利要求33的寡核苷酸引物,其中该寡核苷酸引物包括选自如下一组的序列:
SEQ ID NO:44和SEQ ID NO:45,当DNA标记序列是SEQ IDNO:1时;
SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,当DNA标记序列是SEQ ID NO:2时;
SEQ ID NO:59,SEQ ID NO:60,当DNA标记序列是SEQ IDNO:3时;
SEQ ID NO:61,SEQ ID NO:62,当DNA标记序列是SEQ IDNO:4时;
SEQ ID NO:63,SEQ ID NO:64,当DNA标记序列是SEQ IDNO:5时;
SEQ ID NO:65,SEQ ID NO:66,当DNA标记序列是SEQ IDNO:6时;
SEQ ID NO:67,SEQ ID NO:68,当DNA标记序列是SEQ IDNO:7时;
SEQ ID NO:69,SEQ ID NO:70,当DNA标记序列是SEQ IDNO:8时;
SEQ ID NO:71,SEQ ID NO:72,当DNA标记序列是SEQ IDNO:9时;
SEQ ID NO:73,SEQ ID NO:74,当DNA标记序列是SEQ IDNO:10时;
SEQ ID NO:75,SEQ ID NO:76,当DNA标记序列是SEQ IDNO:11时;
SEQ ID NO:77,SEQ ID NO:78,当DNA标记序列是SEQ IDNO:12时;
SEQ ID NO:79,SEQ ID NO:80,当DNA标记序列是SEQ IDNO:13时;
SEQ ID NO:81,SEQ ID NO:82,当DNA标记序列是SEQ IDNO:14时;
SEQ ID NO:83,SEQ ID NO:84,当DNA标记序列是SEQ IDNO:15时;
SEQ ID NO:85,SEQ ID NO:86,当DNA标记序列是SEQ IDNO:16时;
SEQ ID NO:87,SEQ ID NO:88,当DNA标记序列是SEQ IDNO:17时;
SEQ ID NO:89,SEQ ID NO:90,当DNA标记序列是SEQ IDNO:18时;
SEQ ID NO:91,SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,当DNA标记序列是SEQ ID NO:19时;
SEQ ID NO:95,SEQ ID NO:96,当DNA标记序列是SEQ IDNO:20时;
SEQ ID NO:97,SEQ ID NO:98,当DNA标记序列是SEQ IDNO:21时;
SEQ ID NO:99,SEQ ID NO:100,当DNA标记序列是SEQ IDNO:22时;
SEQ ID NO:101,SEQ ID NO:102,当DNA标记序列是SEQ IDNO:23时;
SEQ ID NO:103,SEQ ID NO:104,当DNA标记序列是SEQ IDNO:24时;
SEQ ID NO:105,SEQ ID NO:106,当DNA标记序列是SEQ IDNO:25时;
SEQ ID NO:107,SEQ ID NO:108,SEQ ID NO:109,SEQ IDNO:110,SEQ ID NO:111,当DNA标记序列是SEQ ID NO:26时;
SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ IDNO:115,当DNA标记序列是SEQ ID NO:27时。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/018,584 US6238863B1 (en) | 1998-02-04 | 1998-02-04 | Materials and methods for indentifying and analyzing intermediate tandem repeat DNA markers |
US09/018,584 | 1998-02-04 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910164448A Division CN101857895A (zh) | 1998-02-04 | 1999-02-04 | 鉴别和分析中度串联重复dna标记的物质和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1290298A true CN1290298A (zh) | 2001-04-04 |
CN100545265C CN100545265C (zh) | 2009-09-30 |
Family
ID=21788699
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910164448A Pending CN101857895A (zh) | 1998-02-04 | 1999-02-04 | 鉴别和分析中度串联重复dna标记的物质和方法 |
CNB998026964A Expired - Lifetime CN100545265C (zh) | 1998-02-04 | 1999-02-04 | 鉴别和分析中度串联重复dna标记的物质和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910164448A Pending CN101857895A (zh) | 1998-02-04 | 1999-02-04 | 鉴别和分析中度串联重复dna标记的物质和方法 |
Country Status (11)
Country | Link |
---|---|
US (2) | US6238863B1 (zh) |
EP (3) | EP1058727B1 (zh) |
JP (3) | JP4494630B2 (zh) |
KR (1) | KR100691195B1 (zh) |
CN (2) | CN101857895A (zh) |
AT (1) | ATE486129T1 (zh) |
AU (1) | AU758639B2 (zh) |
CA (1) | CA2319111A1 (zh) |
DE (1) | DE69942891D1 (zh) |
ES (2) | ES2475416T3 (zh) |
WO (1) | WO1999040194A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1806051B (zh) * | 2003-05-13 | 2012-05-30 | 莫诺昆特股份有限公司 | 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0907889B1 (en) | 1996-04-25 | 2007-07-04 | BioArray Solutions Ltd. | Light-controlled electrokinetic assembly of particles near surfaces |
AU2001255344A1 (en) * | 2000-04-12 | 2001-11-12 | King Faisal Specialist Hospital And Research Centre | System for identifying and analyzing expression of are-containing genes |
US6531282B1 (en) * | 2000-05-30 | 2003-03-11 | Oligotrail, Llc | Multiplex amplification and analysis of selected STR loci |
ES2259666T3 (es) | 2000-06-21 | 2006-10-16 | Bioarray Solutions Ltd | Analisis molecular de multiples analitos usando series de particulas aleatorias con especificidad de aplicacion. |
US9709559B2 (en) | 2000-06-21 | 2017-07-18 | Bioarray Solutions, Ltd. | Multianalyte molecular analysis using application-specific random particle arrays |
DE10119468A1 (de) * | 2001-04-12 | 2002-10-24 | Epigenomics Ag | Mikroarray-Verfahren zur Anreicherung von DNA-Fragmenten aus komplexen Mischungen |
US20020172948A1 (en) * | 2001-05-04 | 2002-11-21 | Perlin Mark W. | Method and system for nucleic acid sequencing |
US7262063B2 (en) | 2001-06-21 | 2007-08-28 | Bio Array Solutions, Ltd. | Directed assembly of functional heterostructures |
US20080138800A1 (en) * | 2001-10-15 | 2008-06-12 | Alice Xiang Li | Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection |
EP2722395B1 (en) * | 2001-10-15 | 2018-12-19 | Bioarray Solutions Ltd | Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection |
JP4805542B2 (ja) * | 2002-04-08 | 2011-11-02 | ピッグ インプルーブメント カンパニー ユーケイ リミテッド | 動物生産物を追跡するためのシステム |
US7157228B2 (en) * | 2002-09-09 | 2007-01-02 | Bioarray Solutions Ltd. | Genetic analysis and authentication |
US7526114B2 (en) | 2002-11-15 | 2009-04-28 | Bioarray Solutions Ltd. | Analysis, secure access to, and transmission of array images |
WO2005029705A2 (en) | 2003-09-18 | 2005-03-31 | Bioarray Solutions, Ltd. | Number coding for identification of subtypes of coded types of solid phase carriers |
WO2005031305A2 (en) | 2003-09-22 | 2005-04-07 | Bioarray Solutions, Ltd. | Surface immobilized polyelectrolyte with multiple functional groups capable of covalently bonding to biomolecules |
JP2007521017A (ja) | 2003-10-28 | 2007-08-02 | バイオアレイ ソリューションズ リミテッド | 固定化捕捉プローブを用いる遺伝子発現分析法の最適化 |
EP1694859B1 (en) | 2003-10-29 | 2015-01-07 | Bioarray Solutions Ltd | Multiplexed nucleic acid analysis by fragmentation of double-stranded dna |
US7848889B2 (en) | 2004-08-02 | 2010-12-07 | Bioarray Solutions, Ltd. | Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification |
US7867703B2 (en) * | 2004-08-26 | 2011-01-11 | Agilent Technologies, Inc. | Element defined sequence complexity reduction |
US8486629B2 (en) | 2005-06-01 | 2013-07-16 | Bioarray Solutions, Ltd. | Creation of functionalized microparticle libraries by oligonucleotide ligation or elongation |
US7772390B1 (en) | 2006-07-18 | 2010-08-10 | The Regents Of The University Of California | Lipid mediated nucleic acid synthesis |
US8163480B2 (en) * | 2006-10-05 | 2012-04-24 | Quest Diagnostics Investments Incorporated | Nucleic acid size detection method |
US20090004662A1 (en) | 2007-06-18 | 2009-01-01 | Applera Corporation | Method and compositions for nucleic acid amplification |
WO2009012984A1 (en) | 2007-07-26 | 2009-01-29 | Roche Diagnostics Gmbh | Target preparation for parallel sequencing of complex genomes |
EP2905344B1 (en) * | 2008-06-30 | 2016-11-09 | Life Technologies Corporation | Method for direct amplification from crude nucleic acid samples |
US20120183953A1 (en) * | 2011-01-14 | 2012-07-19 | Opgen, Inc. | Genome assembly |
CA2960840A1 (en) * | 2014-09-18 | 2016-03-24 | Illumina, Inc. | Methods and systems for analyzing nucleic acid sequencing data |
CN104408331A (zh) * | 2014-11-10 | 2015-03-11 | 南京工程学院 | 鉴别dna基因序列中编码区域与非编码区域的系统 |
JP6728657B2 (ja) * | 2015-12-04 | 2020-07-22 | 東洋紡株式会社 | 核酸増幅法 |
US20210130815A1 (en) * | 2019-11-05 | 2021-05-06 | Florida State University Research Foundation, Inc. | Evaluating Genomic Variation Using Repetitive Nucleic Acid Sequences |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IS1355B6 (is) | 1984-11-12 | 1989-04-19 | Lister Institute Of Preventive Medicine | Fjölkjarna kannar |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
GB8606719D0 (en) | 1986-03-19 | 1986-04-23 | Lister Preventive Med | Genetic probes |
US4963663A (en) | 1988-12-23 | 1990-10-16 | University Of Utah | Genetic identification employing DNA probes of variable number tandem repeat loci |
DE68929070T2 (de) | 1988-02-18 | 2000-05-25 | The University Of Utah, Salt Lake City | Verwendung von dna-proben mit variabler anzahl von tandem-repetitiven stellen zur genetischen identifizierung |
DE3834636A1 (de) | 1988-10-11 | 1990-04-19 | Max Planck Gesellschaft | Verfahren zur analyse von laengenpolymorphismen in dna-bereichen |
US5075217A (en) | 1989-04-21 | 1991-12-24 | Marshfield Clinic | Length polymorphisms in (dC-dA)n ·(dG-dT)n sequences |
US5582979A (en) | 1989-04-21 | 1996-12-10 | Marshfield Clinic | Length polymorphisms in (dC-dA)n.(dG-dT)n sequences and method of using the same |
US5364759B2 (en) | 1991-01-31 | 1999-07-20 | Baylor College Medicine | Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats |
CA2136764A1 (en) | 1992-05-29 | 1993-12-09 | Ronald L. Marshall | Ligase chain reaction starting with rna sequences |
GB9326052D0 (en) * | 1993-12-21 | 1994-02-23 | Zeneca Ltd | Sequences |
US5599666A (en) | 1994-03-28 | 1997-02-04 | Promega Corporation | Allelic ladders for short tandem repeat loci |
US6479235B1 (en) * | 1994-09-30 | 2002-11-12 | Promega Corporation | Multiplex amplification of short tandem repeat loci |
US5843660A (en) * | 1994-09-30 | 1998-12-01 | Promega Corporation | Multiplex amplification of short tandem repeat loci |
-
1998
- 1998-02-04 US US09/018,584 patent/US6238863B1/en not_active Expired - Lifetime
-
1999
- 1999-02-04 EP EP99906720A patent/EP1058727B1/en not_active Expired - Lifetime
- 1999-02-04 KR KR20007008495A patent/KR100691195B1/ko not_active IP Right Cessation
- 1999-02-04 ES ES10011439.6T patent/ES2475416T3/es not_active Expired - Lifetime
- 1999-02-04 DE DE69942891T patent/DE69942891D1/de not_active Expired - Lifetime
- 1999-02-04 CA CA002319111A patent/CA2319111A1/en not_active Abandoned
- 1999-02-04 ES ES10011440.4T patent/ES2476266T3/es not_active Expired - Lifetime
- 1999-02-04 AU AU26565/99A patent/AU758639B2/en not_active Ceased
- 1999-02-04 WO PCT/US1999/002345 patent/WO1999040194A1/en active IP Right Grant
- 1999-02-04 EP EP10011439.6A patent/EP2287307B1/en not_active Expired - Lifetime
- 1999-02-04 AT AT99906720T patent/ATE486129T1/de not_active IP Right Cessation
- 1999-02-04 CN CN200910164448A patent/CN101857895A/zh active Pending
- 1999-02-04 EP EP10011440.4A patent/EP2287308B1/en not_active Expired - Lifetime
- 1999-02-04 CN CNB998026964A patent/CN100545265C/zh not_active Expired - Lifetime
- 1999-02-04 JP JP2000530608A patent/JP4494630B2/ja not_active Expired - Lifetime
-
2001
- 2001-02-15 US US09/784,423 patent/US6767703B2/en not_active Expired - Fee Related
-
2009
- 2009-08-10 JP JP2009185861A patent/JP5898829B2/ja not_active Expired - Lifetime
-
2013
- 2013-04-25 JP JP2013092789A patent/JP2013143965A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1806051B (zh) * | 2003-05-13 | 2012-05-30 | 莫诺昆特股份有限公司 | 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞 |
Also Published As
Publication number | Publication date |
---|---|
WO1999040194A1 (en) | 1999-08-12 |
EP2287307A2 (en) | 2011-02-23 |
ATE486129T1 (de) | 2010-11-15 |
CA2319111A1 (en) | 1999-08-12 |
US6238863B1 (en) | 2001-05-29 |
EP2287307A3 (en) | 2011-06-29 |
ES2476266T3 (es) | 2014-07-14 |
EP1058727A4 (en) | 2003-03-26 |
KR100691195B1 (ko) | 2007-03-08 |
EP2287308A2 (en) | 2011-02-23 |
JP5898829B2 (ja) | 2016-04-06 |
JP2002502606A (ja) | 2002-01-29 |
JP4494630B2 (ja) | 2010-06-30 |
KR20010040624A (ko) | 2001-05-15 |
JP2009254388A (ja) | 2009-11-05 |
EP1058727B1 (en) | 2010-10-27 |
CN101857895A (zh) | 2010-10-13 |
US20020012924A1 (en) | 2002-01-31 |
EP2287307B1 (en) | 2014-04-09 |
EP1058727A1 (en) | 2000-12-13 |
EP2287308B1 (en) | 2014-04-09 |
DE69942891D1 (de) | 2010-12-09 |
AU2656599A (en) | 1999-08-23 |
AU758639B2 (en) | 2003-03-27 |
ES2475416T3 (es) | 2014-07-10 |
JP2013143965A (ja) | 2013-07-25 |
EP2287308A3 (en) | 2011-06-29 |
CN100545265C (zh) | 2009-09-30 |
US6767703B2 (en) | 2004-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1290298A (zh) | 鉴别和分析中度串联重复dna标记的物质和方法 | |
CN1254547C (zh) | 具有酶活性的dna分子 | |
CN1273611C (zh) | 使用突变dna聚合酶的高温逆转录 | |
CN1608139A (zh) | 数字化分析 | |
CN1255551C (zh) | 用特定序列组合体检测核酸的方法 | |
CN1118581C (zh) | 对dna的特性分析 | |
CN1219972A (zh) | 短串联重复基因座的多重扩增 | |
CN1471588A (zh) | 核酸扩增方法 | |
CN1898395A (zh) | 基于引物的核酸的多重扩增的方法和试剂盒 | |
CN1668923A (zh) | 带有标准探针的dna微阵列以及包含该阵列的试剂盒 | |
CN1259957A (zh) | 产生由多个亚单位组成的aslv逆转录酶的方法 | |
CN1723217A (zh) | 使用单核苷酸多态性组分析受损样品的方法和组合物 | |
CN1930306A (zh) | 发展用于血栓形成倾向识别的方法(mert) | |
CN1566366A (zh) | 一种基于dna芯片的基因分型方法及其应用 | |
CN1541267A (zh) | 核酸扩增或检测用试剂的稳定化方法和保存方法 | |
CN1688718A (zh) | 检测靶序列的方法和组合物 | |
CN1890368A (zh) | 扩增核酸的方法 | |
CN1798842A (zh) | 核酸检测 | |
CN1671841A (zh) | 基因多态性分型方法 | |
CN1496402A (zh) | 表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法 | |
CN1678741A (zh) | 用于检测基因多态性的方法 | |
CN1865440A (zh) | 肥厚型心肌病致病基因的新突变及其用途 | |
CN1532292A (zh) | 转录活性试验 | |
CN1174104C (zh) | 人工序列模板引物集及用途 | |
CN1254549C (zh) | 用于人HNF-1α基因扩增的多重PCR引物组 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20090930 |