CN1290298A - 鉴别和分析中度串联重复dna标记的物质和方法 - Google Patents

鉴别和分析中度串联重复dna标记的物质和方法 Download PDF

Info

Publication number
CN1290298A
CN1290298A CN99802696A CN99802696A CN1290298A CN 1290298 A CN1290298 A CN 1290298A CN 99802696 A CN99802696 A CN 99802696A CN 99802696 A CN99802696 A CN 99802696A CN 1290298 A CN1290298 A CN 1290298A
Authority
CN
China
Prior art keywords
seq
sequence
dna
idno
dna marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99802696A
Other languages
English (en)
Other versions
CN100545265C (zh
Inventor
詹姆斯·W·舒姆
杰弗里·W·巴彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Promega Corp
Original Assignee
Promega Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Promega Corp filed Critical Promega Corp
Publication of CN1290298A publication Critical patent/CN1290298A/zh
Application granted granted Critical
Publication of CN100545265C publication Critical patent/CN100545265C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及鉴别和分析DNA中中度串联重复序列的物质和方法,其中中度串联重复(1TR)序列是DNA序列的一个区域,其含有至少一个串联出现至少两次的5—7个碱基重复单位。用本发明的物质和方法的特别优选的实施方案鉴别和分析了人类基因组中高多态ITR基因座的DNA标记。

Description

鉴别和分析中度串联重复DNA标记的物质和方法
相关申请的交叉参考
关于联邦资助的研究或开发的声明
本发明是在美国政府的支持下完成的,由国立健康研究院颁发的小企业发明研究资助号1-43-MH5294-01及1-43-MH5294-02资助。美国政府拥有本发明的某些权利。
发明领域
本发明一般涉及在基因组系统中鉴别和分析遗传标记。本发明特别涉及在DNA中,尤其是在基因组DNA中鉴别这样的基因座,其含有由于中度(5~7个碱基)序列重复数目变异而形成的长度多态性。本发明还涉及检测此多态基因座。本发明还涉及鉴别和区分个体的方法,其主要基于在该基因座扩增基因组DNA的产物的大小不同,其中中度串联重复序列数随个体不同而变化。
发明背景
DNA分型通常用于亲子鉴定,并用于确定马、狗及其它比赛动物的谱系。DNA分型还通常用于鉴别血液、唾液、精液及其它在犯罪场所发现的其它组织。目前所用的DNA分型法被设计为检测和分析已知在群体中以至少两种不同形式显现的DNA的一或多个区域的长度和/或序列中的差异。DNA分型还用于临床测定骨髓移植的成功或失败及特殊癌组织的存在与否。此变异长度和/或序列变异称为“多态性”。其中发生这种变异的DNA的任何区域(即“基因座”)称为“多态基因座”。大多数DNA分型技术使用至少一个含至少一个该多态基因座的“标记”。每个个体标记含有最终衍生自群体中单一个体基因组DNA的单一等位基因。本发明的方法和物质均设计为用于检测以长度变异为主要特征的DNA多态性的特定类别。
就长度或序列而言充分多态的遗传标记,很久以来被试图用于鉴定应用中,如亲权认定及鉴别收集的用于法医分析的组织样品。这种标记及分析该标记的方法的揭示与开发,在以往许多年已进行了几个阶段的开发。近年来,作为遗传标记的多态短串联重复(STRs)的揭示和开发已激发连锁图谱开发,致病基因的鉴别与鉴定及DNA分型的简化性和精确性的进程。术语“短串联重复”或“STR”指2~7个核苷酸长,在任何生物体的基因组DNA串联中完全或近乎完全串联重复的所有序列。例如见美国专利号5,364,759第4栏第58行中人基因组DNA的“短串联重复”的定义。
第一个鉴别的DNA变体标记是简单碱基取代,即简单序列多态性,其通常由Southern杂交分析检测。设计用于用放射活性探针分析限制性内切酶消化的DNA的这种标记的鉴别论述,参见Southern,E.M.(1975),J.Mol.Biol.98(3):503-507;Schumm,et al(1988),American Journal of Human Geneties 42:143-159;及Wyman,A.andWhite,R(1980)Proc.Natl.Acad.Sci.U.S.A.77:6754-6758。
第二代标记是大小变体,即长度多态性,尤其“串联重复可变数”(VNTR)标记(Nakamura Y.et al.(1987).Science 235:1616-1622;及美国专利4,963,663,授予White等(1990);美国专利5,411,859,4,963,663的继续,授予White等(1995))和“小卫星”标记(Jeffreys et al.(1985a),Nature 314:67-73;Jeffreys et al,(1985b)Nature 316:76-79;美国专利5,175,082,发明人Feffreys)。VNTR和小卫星标记均含有以串联方式重复的几个相同序列的区域。核心重复序列长度为10-70个碱基,较短的核心重复序列称为“小卫星”重复,较长重复称为VNTRs。人群中不同个体含有不同数量的这些重复。这些标记比碱基取代多态性具有更高的多态性,有时在单一遗传基因座上呈现接近40或更多个等位基因。但是,仍需要限制酶消化及随后的Southern杂交分析等繁琐方法检测及分析大多数这种标记。
接下来的进展包括聚合酶链反应(PCR)(美国专利4,683,203,Mullis,K.B.)技术与分析VNTR基因座(Kasai,K.et al.(1990)JournalForensic Science 35(5):1196-1200)的联合。可扩增的VNTR基因座被发现,其可不需Southern转移而被检测。扩增产物通过琼脂糖或聚丙烯酰胺凝胶分离,并通过在扩增期间掺入放射活性或通过用银或溴化乙锭后染色而检测。但PCR只能用于可靠扩增相对小的DNA区段,即仅可靠扩增长度在3000个碱基之下的DNA区段。(Ponce,M.& Micol,L.(1992)NAR 20(3):623;Decorte R.,et al.(1990)DNA Cell Biol,9(6):461-469)。结果,仅开发了非常少的可扩增VNTRs,使它们作为不能进行连锁作图的一类。
对具有多态二核苷酸重复(Litt和Luty(1989)Am J.Hum Genet3(4):599~605;Tautz,D.(1989)NAR 17:6463-6471;Weber和May(1989)Am J Hum Genet 44:388-396;德国专利DE 38 34 636C2,发明人Tautz,D;美国专利5,582,979,Weber,L.)及多态短串联重复(STR)(Edwards,A.等,(1991)Am.J.Hum.Genet,49:746-756;Hammond,H.A,等,(1994)Am.J.Hum.Genet.55:175-189;Fregeau C.J.和Foumey,R.M.(1993)BioTechniques 15(1):100-119;Schumm,J.W等,(1994),第四届人类鉴定国际研讨会,1993,PP.177-178;美国专利5,364,759,Caskey等;德国专利DE 3834636C2,Tautz,D.)的多态标记的新近开发,已克服了许多以前方法的缺陷。含有二核苷酸或STR重复(意为包括2-7bp重复)的二类标记通常被称为“微卫星”标记。微卫星基因座通常被认为是最适用标记,其与可扩增VNTRs相似之处在于其等位基因可以基于长度变化而区分。但是,与VNTRs不同,这些基因座含有2,3,4或少见的5个碱基长的完全或不完全重复序列。它们展示出在单个基因座上从仅几个等位基因至超过40个等位基因。扩增方案可以设计为产生通常60~400碱基对长的小产物,且每个基因座的等位基因通常包含在少于50bp范围内。通过精心设计PCR引物,使得来自一个个体系统的所有潜在扩增产物不重迭同一凝胶中其它系统的等位基因范围,可在相同凝胶上同时电泳分析几个系统。
有三种明显缺点与微卫星基因座的使用相关。首先,打滑(stutter)假象的存在,即通常在扩增后可见除代表每个等位基因的主要片段之外的一或多个次要片段。此缺陷在二核苷酸重复基因座比三或四核苷酸重复标记基因座更明显(Edwards等,1991,Am.J.Hum.Genet.49:746-756;Edwards等,1992.Genomics 12:241-253;Weber & May,1989.Am.J.Hum.Genet.44:388-396)。这些假象的存在,推测得自称为重复滑动的DNA聚合酶相关的现象(Levinson & Gutman,1987,Mol.Biol.Evol.4(3):203-221;Schlotterer & Tautz,1992.NAR20:211-215),使解释基因座的等位基因含量变得复杂。在所有解释复杂化的同时,代表每个等位基因的主要和次要片段的存在尤其限制这些标记在法医分析中的效力,法医分析通常要求测定是否存在一个以上DNA样品来源。在本研究中阐述的许多标记代表一类新的与已知标记相比产生明显少的打滑假象的标记。
当前的STR和微卫星标记系统的第二个缺点涉及在单一凝胶中分离多个基因座的难度。此发生是由于在由本领域技术人员最常用于分离DNA片段的凝胶上部区域中,存在不同大小片段的空间堆积。本研究中所述的基于较长重复单位的标记的开发,扩展了这些凝胶的有用范围,使更多基因座可同时被分析。
第三个缺点是在本发明之前,只有少数人类基因组DNA的DNA基因座已在文献中阐述,每个这种基因座具有基于5~7个碱基重复变化的长度多态性。如见于Edward等,(1991)核酸研究19:4791;Chen等(1993)基因组15(3):621-5;Harada等(1994)Am.J.Hum.Genet.55:175-189;Comings等(1995),Genomics 29(2):390-6;及UtahMarker Development Group(1995),Am.J.Genet.57:619-628。在1995年,Jurka和Pethiyagoda发表的文章阐述了一项研究,其中他们用GenBank数据库测定在灵长类基因组中五聚和六聚串联重复的相对丰度及可变性(Jurka和Pethiyagoda(1995)J.Mol.Evol.40:120-126)。但是,可变性只是间接估计的,且个体基因座多态水平未证实。我们已开发了鉴别和分析含5~7个碱基重复的高多态重复的DNA基因座的物质和方法。
本发明的物质和方法被设计为用于鉴别和分析各类DNA的特定多态基因座,包括各种不同来源的单链和双链DNA。本发明阐述了对现有技术的明显改进,使用于连锁分析,犯罪审判,亲权认定及其它法医和医学用途方面的DNA分布分析的能力及精确性增加。
发明概述
因此,本发明一个目的在于提供鉴别和分析具有中度串联重复序列的DNA基因座的物质和方法,其中“中度串联重复序列”是DNA的一区域,其含有至少一个由串联重复至少2次的5,6或7个碱基的序列组成的重复单位。
本发明另一个目的在于提供鉴别中度串联重复DNA标记的物质和方法,当其用于分析或检测含中度串联重复的DNA样品的一或多个基因座时,很少产生假象。本发明的方法和物质优选用于鉴别和分析基因组DNA的基因座,每个基因座均含有多态中度串联重复序列。本发明的物质包括针对人基因组DNA的这种基因座的寡核苷酸引物和DNA标记。用本发明的方法检测的中度串联重复基因座,比用相似方法检测的许多已知基因座,包括短STR(即2,3或4个碱基DNA序列的串联重复),呈现较少的假象。
本发明一特别目的是提供一种分析个体多态遗传基因座的方法和物质,其主要基于主要由于中度核苷酸串联重复的区域中,核酸重复单位数目的不同而引起的长度变化。本发明另一目的在于提供一种检测和分析基因组DNA的多态性基因座的方法,试剂盒及引物,该基因座含有中度串联重复多态性,包括五核苷酸串联重复多态性。
本发明的一实施方案是分离含有来自基因组DNA的中度串联重复序列的DNA片段的方法,包括(a)提供多个DNA片段,其中至少一个片段含有一中度串联重复序列:(b)提供一支持工具(means),如:结合至少一个寡核苷酸的固定支持工具,该寡核苷酸含有互补于中度串联重复序列的一部分的核苷酸序列;(c)在一定条件下组合该多个DNA片段和支持工具,其中含中度重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。
本发明另一实施方案是一种检测基因组DNA中具有低打滑假象的多态中度串联重复序列的方法,包括(a)提供一DNA样品,其具有至少一个靶中度串联重复序列,(b)检测DNA样品中靶中度串联重复序列,其中观测到不超过1.1%的平均打滑假象。
本发明另一实施方案是用至少一个寡核苷酸引物扩增DNA样品中感兴趣的中度串联重复序列(后文中称为“靶”中度串联重复序列),以检测DNA样品中靶中度串联重复序列的方法,其中寡核苷酸引物含有互补于并位于一DNA标记的一个区域侧翼的序列,该DNA标记在其序列中含有一中度串联重复序列(后文称为“模板中度串联重复序列”),其中,此DNA标记具有选自SEQ ID NOS:1-43的序列。
本发明的另一实施方案是一检测DNA样品中至少一个靶中度串联重复序列的试剂盒,该试剂盒包括一容器,其具有至少一个寡核苷酸引物,用于扩增至少一个靶中度串联重复序列,其中此寡核苷酸引物的核苷酸序列互补于并位于双链DNA标记一个区域的一部分的侧翼,该双链DNA标记含有模板中度串联重复序列,其中该DNA标记具有选自SEQ ID NOS:1-43的序列。
本发明的另一实施方案是一寡核苷酸引物,其包含互补于双链DNA标记的一条链的位于模板中度串联重复序列侧翼的区域的序列,其中该DNA标记具有选自SEQ ID NOS:1-6和SEQ ID NOS:28-33的序列。
本发明的各个实施方案在人及其它生物体鉴别,法医分析,亲权认定,监测骨髓移植,连锁作图及检测遗传病及癌症等领域均有特殊用处。准确辨别不同个体少量组织在法医应用中是特别急需的,其中许多定罪(及宣判无罪)要依于DNA分型分析,包括STR基因座的分析。
本发明的其它目的,特点及优势通过以下实施本发明的最佳模式及附图将显而易见。
附图简要描述
图1是通过滤膜杂交富集中度串联重复方法的流程图。
图2是S159五核苷酸重复的电泳图。
图3是vWA四核苷酸重复的电泳图。
图4是G210五核苷酸重复的电泳图。
图5是D5S818四核苷酸重复的电泳图。
图6是S159五核苷酸重复打滑百分率的散射图。
图7是G210五核苷酸重复打滑百分率的散射图。
图8是D5S818四核苷酸重复打滑百分率的散射图。
图9是vWA四核苷酸重复打滑百分率的散射图。
图10是在经凝胶电泳分离后,S159五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。
图11是在经凝胶电泳分离后,G210五核苷酸重复的荧光标记的扩增片段的荧光成象扫描结果的激光打印图。
附图不是必需成比例的,且本发明的某些特征可按比例放大或为清楚及简洁目的而以示意形式示出。
发明详述
本领域技术人员知晓在不偏离本文揭示的本发明范围及精神之下,对本发明可作各种替代及修改。A.定义
本文所用术语“中度串联重复”或“ITR”指含有串联至少两次的5~7个碱基序列的DNA序列的一区域。术语ITR也包括这样的DNA区域,其中多于一个单一5~7碱基序列是串联重复的,或具有间插碱基,条件是至少一个该序列至少串联重复2次。在ITR内至少重复一次的每个序列本文称为“重复单位”。
“ITR多态性”指基因组DNA中的一个ITR,其主要由于每个染色体相同区域中重复单位数的不同而使个体群中的染色体长度变化。
根据本发明鉴别和分析的中度串联重复序列可被分为二类:完全的和不完全的。本文所用术语“完全的”ITR指含有至少串联重复二次的单一5~7个碱基重复单位的双链DNA区域,如(AAAAT)12。术语“不完全的”ITR指含有至少二个串联完全重复单位个至少一个不完全重复单位的DNA区域,其中不完全重复单位由得自完全重复单位的序列中插入,缺失或取代1,2或3个碱基的DNA序列组成,如(AAAAT)12(AAAAT)5AAT(AAATT)4。每个不完全ITR序列含有至少一个完全ITR序列。特别地,每个ITR序列,不管是完全的还是不完全的,均包括至少一个至少串联出现2次的重复单位序列,该重复单位序列可以公式(I)代表:
(AwGxTyCz)n    (I)其中A,G,T代表可以是任何顺序的核苷酸;w,x,y和z代表序列中每个核苷酸的数目,并在0~7范围内,w+x+y+z的范围在5~7之间;n代表序列串联重复的次数,且至少为2。
“五核苷酸串联重复”指以上所定义的“中度串联重复”多态性的一亚类。除非特殊提及,术语“五核苷酸串联重复”包括完全ITRs,其中重复单位是5个碱基的序列,及不完全ITRs,其中至少一个重复单位是5个碱基重复。
“DNA标记”指含有一ITR序列的DNA片段,如含由扩增基因组DNA一区域产生的ITR序列的DNA片段。每个标记含有一最终衍生自一群体中的一个单独个体基因组DNA的一个单等位基因。
术语“基因座“指DNA的特殊区域。当用于阐述基因组DNA的区域时,“基因座”指染色体上的特定位置。就群体中的任何个体而言,相同基因组基因座在每对同源染色体上相同位点出现。每个这种染色体上相同基因座的DNA序列,或在源自相同的这种染色体的DNA的相同基因座的DNA序列,称为“等位基因”。
术语“多态性”指相同物种个体生物体组成的群体的基因组DNA中发现的在至少2个染色体上见到的基因座的等位基因的变化。术语“多态性”包括得自克隆入其它载体如DNA载体的染色体片段或另一种生物体的染色体DNA的相同基因座的DNA序列的变化。
本文所用术语“ITR侧翼序列”指相邻于含ITR的DNA序列一条链上的ITR的核苷酸序列。包括ITR侧翼序列作为其全部序列一部分的序列本身是侧翼序列。
术语“寡核苷酸引物”是一种分子,其含有3个以上脱氧核糖核苷酸或核糖核苷酸。尽管每个引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,则与模板结合越好。其精确长度和序列将依于许多因素,涉及寡核苷酸引物的最终功能及使用,包括温度,引物序列,及使用方法。本发明的每个寡核苷酸引物包含一互补于位于ITR序列侧翼的DNA标记序列的核酸序列。本发明的寡核苷酸引物当置于一定条件下时,能作为合成起始点,该条件是诱导互补于一核酸链的引物延伸产物的合成的条件。该条件可包括存在核苷酸和诱导剂如DNA聚合酶,合适温度及pH。在优选实施方案中,该引物是足够长的单链寡脱氧核糖核苷酸,以在存在诱导剂下引导从特定序列合成延伸产物。寡核苷酸引物的敏感性及特异性通过引物长度及所供DNA模板样品中序列的独特性确定。在本发明中,寡核苷酸引物通常大约15个碱基以上,且优选大约20~40个碱基长。
术语“寡核苷酸引物对”指一对引物,每个引物均含互补于位于相同ITR侧翼的双链DNA相反链的脱氧核糖核苷酸或核糖核苷酸的序列。本发明的每对寡核苷酸引物优选地选择用以检测单一ITR。尽管每对引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,与模板结合越好。
术语“延伸产物”指从寡核苷酸引物3’末端合成的核苷酸序列,其互补于寡核苷酸与之结合的链。
术语“寡核苷酸探针”指单链DNA或RNA分子,其包括互补于靶序列的一部分的序列,靶序列例如DNA样品的中度串联重复序列,其中互补性部分的长度足以使探针与靶序列杂交。
术语“打滑假象”指当检测靶DNA的一或多个分子时,观测到的特定类型的假象,其中靶DNA含有相同重复单位序列的串联重复,包括根据本发明检测和分析的靶中度串联重复序列。在通过长度如用凝胶电泳分离样品中所有DNA之后,检测到含任何该靶DNA样品时,每个靶DNA分子产生一主要信号(如在凝胶上的主要条带);但在接近每个主要信号处可检测到次要信号。次要信号通常产生自DNA片段的检测,其由于靶DNA序列的一或多个重复单位的加入或缺失,而在长度上与靶DNA不同。打滑假象已归因于在DNA的体内和体外复制期间滑动链的错配。如参见Levinson和Gutman(1987),Mol.Biol.Evol.,4(3):203-221;及Schlotterer和Tautz(1992),Nucleic Acids Research 20(2):211-215。当含有任何这种重复序列的DNA用如PCR扩增法体外扩增时,此假象尤为明显,这是由于样品存在的或聚合期间产生的任何次要片段随主要片段一起扩增。
术语“打滑假象百分率”指在得自单一来源如单菌落细菌或基因组DNA的单一染色体的DNA样品中,观测的次要(即假象)信号幅度与主要(即靶)信号幅度的对比。打滑假象百分率可在未扩增的DNA上测定,但优选在至少一个靶中度串联重复序列扩增后测定。术语“打滑假象平均百分率”指在对一个群体至少20个等位基因的代表样品检测测定的打滑假象百分率平均而得。
术语“基因组DNA”指最终衍生自基因组DNA的任何DNA。该术语例如包括异源生物体中的克隆的DNA,整个基因组DNA,及部分基因组DNA(如单一分离的染色体的DNA)。
根据本发明检测或分离的DNA可以是单链或双链的。例如:适用于本发明的单链DNA可得自噬菌体、细菌或基因组DNA的片段。适用于本发明的双链DNA可得自一些含有具有中度串联重复序列的DNA的各种不同来源中的任一种,包括噬菌体文库,粘粒文库,和细菌基因组DNA或质粒DNA,及分离自任何真核生物的DNA,包括人基因组DNA。DNA优选得自人基因组DNA。可以使用任一不同来源的人基因组DNA,包括医学或法医样品如血液,精液,阴道拭物,组织,头发,唾液,尿液及体液混合物。该样品可以是新鲜的,陈旧的,干燥的和/或部分降解的。此样品可收集自犯罪现场。
B.分离含ITR的多态DNA标记的方法:
本发明的一实施方案是用杂交选择分离含ITR的DNA片段的方法。该方法包括以下步骤:(a)提供多个DNA片段,其中至少一个DNA片段含有ITR;(b)提供结合有至少一个寡核苷酸的支持工具,其中此寡核苷酸包括互补于中度串联重复序列一部分的核苷酸序列;(c)将所述的多个DNA片段与支持工具在一定条件下组合,其中包括任何含ITR序列的DNA片段的DNA片段与支持工具杂交。
此方法(a)步提供的多个DNA片段可通过任何含ITR的DNA样品片段化而得,但优选通过基因组DNA片段化而得,如见并入参考的《人类遗传学当前方案》(1994),第2章:从基因组DNA构建小插入片段文库,p.2.2.1。制备(a)步所用的多个DNA片段的最优选方法可根据以下步骤进行:片段化DNA样品,从而产生DNA片段群,其中至少一个DNA片段含有ITR;将含有引导序列的接头与DNA片段群中每个DNA片段的至少一个末端连接;用含互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。不同的接头可连于每个片段的每个末端。但是,优选将单一接头连于每个末端,以使能用具有互补于接头引导序列的序列的单一寡核苷酸引物扩增。接头连接优选在有连接酶的情况下进行,如T4DNA连接酶。
可用任一工具产生本发明方法(a)步中提供的多个DNA片段,包括用超声处理或用至少一种限制酶片段化,当然只有双链DNA可用限制酶片段化。当限制酶用于片段化双链DNA样品时,其优选是具有4碱基对识别序列的限制酶,其留下单链的突出端,并且不切割DNA样品内感兴趣的ITR区。用于片段化双链DNA样品的优选限制酶包括MboI,AciI,BfaI,DpnII,HhaI,Hin PII,HpaII,MseI,Nla III,Sau 3AI,TaqI,Csp6I,和TaiI。
如上述产生的接头连接的DNA片段随后用扩增反应扩增,如PCR(美国专利4,683,202,Mullis,K.B.),基于核酸序列的扩增(NASBA)(Kievits等(1991)J.Virol Merthods 35(3):273-286),连接介导的扩增(Volloch等(1994),Nucleic Acids Res 22(13):2507-2511),链置换扩增(SDA)(Walker等(1992)PNAC 89(1):392-396),序列不依赖的单引物扩增(SISPA)(Reyes(1991)Mol CellProbes 5(6):473-481)或连接酶链反应(美国专利5,686,272,授予Narshall等)。
在方法(b)步中提供的支持工具包括具有至少一个与其相结合的靶寡核苷酸的固定支持物。此固定支持物优选包括一能与寡核苷酸直接或间接偶联的物质,能与寡核苷酸直接偶联的合适物质包括硝基纤维素,尼龙,玻璃,二氧化硅,及乳胶。用于本方法这一优选实施方案的合适的固定支持物例如包括尼龙膜,用二氧化硅颗粒包埋的滤膜,玻璃珠,二氧化硅磁性颗粒,或含二氧化硅的树脂。通过与寡核苷酸结合的第一个偶联剂和与固定支持物表面结合的第二个偶联剂而能与寡核苷酸间接偶联的合适物质包括亲和素和链亲和素,或抗原及其抗体。
与固定支持物相结合的所述至少一个靶寡核苷酸包括互补于DNA片段中度串联重复序列一部分的核苷酸序列。术语“部分”指足够长的DNA片段的ITR区域中的核苷酸序列,当具有互补于该序列的序列的寡核苷酸与其接触时,发生杂交。“部分”优选至少20个碱基,更优选至少40个碱基长。靶寡核苷酸更优选具有(AwGxTyCz)n公式特征的序列,其中A,G,T和C代表可以是任何顺序的核苷酸;w,x,y,z代表序列中每个核苷酸数目,范围在0~7,且w+x+y+z在5~7范围内;n代表序列串联重复的次数,且至少大约4次,更优选至少大约8次,最优选至少大约15次。
在本方法(c)步中,所述的多个DNA片段与支持工具在一定条件下组合,其中含ITR的DNA片段与支持工具杂交。当该多个片段是多个双链DNA片段时,此DNA在与支持工具杂交前变性。在与支持工具杂交前使双链DNA片段变性的合适方法包括将DNA暴露于足够高的使双链DNA变性的温度,或将DNA悬浮于变性溶液中。此DNA优选用含变性剂如碱(例如NaOH或KOH)的变性溶液变性。当用碱变性DNA片段时,所得混合物的pH优选调正至大约中性pH,优选通过在混合物中加入pH4.8的缓冲液而调正。
一旦DNA片段已与支持工具杂交,优选洗涤此支持工具以除去未杂交的DNA片段及任何存在于含有支持工具的溶液中,或在支持工具表面上的未杂交的其它物质。所用任何洗涤液优选配制成除去如此物质而不释放与支持工具杂交的DNA片段。
与支持工具杂交的DNA片段用加热或合适释放溶液,根据支持工具与DNA片段间结合性质,可从支持工具中释放。例如水或低盐水溶液如TE缓冲液(如10mM Tris-HCl,pH7.5,lmM EDTA)可用于释放与由二氧化硅组成的支持工具杂交的DNA片段。一旦从支持工具释放,此DNA片段可被处理以从存在于释放的DNA片段的所得混合物中的其它DNA片段中分离含ITR序列的DNA。附加处理步骤可包括根据上述方法再杂交和筛选,或克隆入DNA载体及筛选克隆的转化体。
图1图示了分离含ITR的DNA片段的方法的优选实施方案,其中制备DNA片段群,与支持工具杂交,扩增,克隆,并筛选含ITR的转化体。图1中图示的每个步骤均用罗马数字标记。步骤I示出用限制酶(2)消化的双链DNA(1)的分子,产生不同大小的DNA片段群(未示出),其中至少一个包括靶ITR。步骤I和II间的箭头图示将接头(3)加入DNA片段群中以产生在两类不同DNA片段的末端具有接头(3)的接头连接的片段(8),所述的两类不同DNA片段为具有靶ITR序列的片段(6)和没有靶序列的片段(4)。将具有互补于每个接头(3)的引导序列的序列的寡核苷酸引物(7)在第III步中加入DNA片段(8)群中,并通过PCR扩增该DNA片段(8)群,从而产生扩增的DNA片段(9)群。在第IV步中,将扩增的DNA片段(9)群置入具有杂交溶液(12)和结合有至少一个寡核苷酸的滤膜(10)的容器(15)中,该寡核苷酸具有互补于靶ITR序列的一部分的序列。杂交溶液促进含ITR序列的DNA片段与滤膜的杂交。在第V步,将滤膜(10)从容器(15)中除去,并从中释放与其杂交的DNA片段。在第VI步,再扩增所得富集的释放的片段群,使用第III步中扩增反应中使用的相同寡核苷酸引物。最后在第VII步将富集的扩增的DNA片段群的每个片段克隆入质粒载体(18)中。第VII步示出用具有靶ITR序列的片段(6)克隆的载体及用没有ITR序列的片段(4)克隆的载体。
C.检测具有低打滑多态ITR的方法
当根据本发明方法的这一具体实施方案检测具有靶ITR序列的DNA样品的该序列时,观测到最小打滑假象。观测的平均打滑假象优选不超过1.1%,更优选不超过0.9%。靶ITR序列可以是完全ITR或不完全ITR序列。检测的DNA样品优选是基因组DNA。
优选在DNA样品中ITR序列扩增后观测平均打滑假象。
D.引物、探针和标记
本发明还包括以下序列表中SEQ ID NOS:1~43所示的DNA标记,引物,其中每个引物的序列互补于位于由43个序列中的一个序列所示的DNA标记的ITR区侧翼的序列,及探针,其具有互补于43个标记之一的ITR区内所含序列的序列。实施例中实验鉴别的特别优选的引物列于下表1。
表1
 标记SEQ IDNO  克隆号  引物SEQ IDNO     上链引物&下链引物
    1  C074  44     TGGCTCAGACACCTCATTG
 45     CACCACTGTATTCCCAGTTTG
    2  C221  46     CACTTGCCATCCCTGCCACACA
 47     AGCGCACCCCCAATTTCCGGTAT
 C221  48     TGGGGACATGAACACACTTTGC
 49     GAGGCCCAGGACCAGATGAAAT
 C221  50     CACCTGTCAGGCAAGGCTTAAAC
 51     CAACACTGAGCGCTTTTAGGGACT
 C221  52     TCAGGCAAGGCTTAAACAGGGATA
 53     ACACTGAGCGCTTCTAGGGACTTC
  标记SEQ IDNO  克隆号  引物SEQ IDNO     上链引物&下链引物
 C221  52     TCAGGCAAGGCTTAAACAGGGATA
 54     TGAGCGCTTCTAGGGACTTCTTCA
 C221  55     CCCTGCCCTACCCACTTG
 56     AGGCCCAGGACCAGATGA
 C221  57     GCACCTGTCAGGCAAGGCTTAAAC
 58     CCAGCCATGAAGTGGCTGTGAG
    3  C240  59     CCCGCTTCAAAGTTCCCAGTTC
 60     CCTCCCATTTCAGCCTCCTGA
    4  C331  61     GTCTGCCACAGTGCTGGAAACTAA
 62     GCACCCCAGCCTAAGGCAATA
    5  C362  63     GCATGGCGGAAGAAACAA
 64     TGGCAACAGAGCGAGACTC
    6  C390  65     CCTGGGTGACAGCGAGAATCT
 66     TGTCCCTTGCCTTGTCTCACTAAA
    7  G022  67     CAGCCTTGGTGACAGAGCAAA
 68     TGTGTTGAGGGTGGGGTACAT
    8  G023  69     CCTGGGCAAGAGAGCAAG
 70     CACATCCCAAAACCACCCTAC
    9  G025  71     GCATTTCCCCTGCTTGTACT
 72     GATCACATTTGCTAACCACTTCTC
    10  G047  73     GGCAACATATCAAGACCCCCATCTCT
 74     GAAGCTGCCCCTCACCACTACATTTT
    11  G065  75     GATCACATTTGCTAACCACTTCTC
 76     TATAAATTACCCAGTCTCAGGAAG
    12  G085  77     GTGATACAGCAAGCCTCATC
 78     AGAGACTCCTGGAAAGATAAAAGT
    13  G132  79     GTCTGGAGAACAGTGGCCCTTGT
 80     CAGGAAGCTGAGGCAGGAGAATCT
    14  G145  81     AAGGCTCCAGTGGGGTAT
 82     AAAACAAGGCAGTAGTCAATAAAG
    15  G152  83     GGCATGAGAATCGCTTGAACCTG
 84     GGCCTCCATGATGTTTCCAATGAT
    16  G153  85     TCAGGAGGCATGAGAATCGCTTGA
 86     GGCCTCCATGATGTTTCCCAATGA
    17  G158  87     CTCGCCCTCTCCTATAAGCAGTTT
 88     GCAGAGATAATTTGGAGTGGGATG
    18  G181  89     CTTGGGTGCCTGTAATCC
 90     GGTAGAGCTCCCCCATCT
    19  G210  91     GCAGAATATTGGGGCTCATCAC
  标记SEQ IDNO   克隆号   引物SEQ IDNO     上链引物&下链引物
    92     AAACAAGGAAAGGAGAGGAGAGGA
    G210     93     AAGGTTGTGGGATGACTACTACA
    94     TGGTCAACACAGCAAGACATT
    20     G212     95     TCCTGCCACCTGCTTGCTTTCT
    96     ATTGCACTCCAGCCTGGGTGATAC
    21     G233     97     CGCTTGAGCCTTGGAGATTG
    98     GAGCAGTCAGAATTCAGGAGTTGT
    22     G234     99     TGGGCAACAAGAGCAAAACTCCAT
    100     GGGACTTGGGCTGAGGGCTTTAC
    23     G235     101     ATATCAATATCAGGCAGCCACAGG
    102     CCGTTTCAGAGCAGAGGTTTAGC
    24     G331     103     TCTCATTGGTTTCAAAGAACTTA
    104     AGACTCCATCTCAAACAAAAGA
    25     G405     105     TCATGTGCATGGAGCCTGGTTCAT
    106     CCCAGCCTTGGCAAGAGTGAGGT
    26     G475     107     GGCGACTGAGCAAGACTC
    108     TTAAGCAAAGTAGCCTCAAACA
    G475     109     GGGCGACTGAGCAAGACTC
    110     ACTCATTACCTTGCATGCATGATA
    G475     107     GGCGACTGAGCAAGACTC
    111     CATTACCTTGCATGCATGATA
    27     G539     112     TGGGCAACAGAGTAAGACTCA
    113     GTTCAGTACCGTTCACCTCTTTA
    G539     114     GTAAGACTCAGTCTCCAAAAAAAAAAAAAG
    115     AGGAATGGTTTCTCTGTTAGTAAATGGT
    28     S023     116     CAGCCTGGGCAACAAGAATGAAAC
    117     TGGCCCCTGCAGCGGAGTC
    29     S071     118     GAATTCATTTGCGGAAAGATT
    119     CTAGGGAGGCTGGAGTATTCA
    30     S085     120     AGAGCAAGACCCCGTCTCAT
    121     AGTCCATGGGCCTTTTAACA
    31     S125     122     GAGAATCACTTGAACCCAGGAAG
    123     AGAACCAGCTGTTAGTTTCGTTGA
    32     S132     124     GGTTGCAGTGAGCCGAGATAAGAGT
    125     TGTGCCAGGAACCAGAAATTTACAG
    33     S136     126     GGCCCAAGGTTACTTTTCAC
    127     GGGCCACTGCACTCCT
    34     S159     128     CATGGTGAGGCTGAAGTAGGAT
    129     GTGGCGTGTCTTTTTACTTTCTTTA
  标记SEQ IDNO    克隆号  引物SEQ IDNO     上链引物&下链引物
    35     S176     130     AGGCAGCCCAGGAACAAT
    131     CCAAGATAGCGGCCAAGATAGT
    36     S189     132     GAGGGCAGCTGGGATGTTACTCTT
    133     TGCCCTGTTTGGAGAACTGTAGGT
    37     S199     134     CTCCCCAGAAACAGATGTA
    135     GTGAGCCGAGATTGTATCAT
    38     S040     136     TCGGGGACAGGGCTTACTC
    137     ATCATTGTCGCTGCTACTTTATCG
    39     S066     138     CTACTCTACCCCATTTCATTC
    139     GTAGAGTGGAGTGGATGAGA
    40     S077     140     ATCAGGCAAAAACGAACAAAC
    141     CGGCATCCCAAAGTGAC
    41     S097     142     CAGAGAGGGCAGCACCTTGGACAG
    143     GGCTTCACCTGCTCCCGTTTCAG
    42     S103     144     TCTGCCCATTCCCCAGCCTCTC
    145     TACCGCGTGGCATTCAAGCATAGC
    43     S110     146     TCCAGTCTGGGTGACAAA
    147     CAATCCACTCCACTCCTCTA
以下实施例是通过举例说明,而非以任何方法限制本发明。在实施例中,所有百分比如果针对固体则是重量百分比,如果针对液体则是体积百分比,除非特殊指出,所有温度是摄氏度。
实施例1:构建全基因组PCR文库
实施例1和以下实施例2中所用的特殊扩增及杂交选择技术,是对Armor,J.等,(1994)Hum Mol Genet 3(4):599-605中所述选择方法的修改形式。
人基因组DNA是用标准苯酚:氯仿提取程序,从15个个体的集合全血中纯化的(人类遗传学当前方案(1994),Gilber,J.编辑,附录)。
将大约100μg基因组DNA用5单位MboI限制酶/μgDNA在37℃切割16小时,随后用苯酚:氯仿提取,乙醇沉淀进行纯化,在100μlTE缓冲液中(10mM Tris-HCl,lmM EDTA,pH8.0)再悬浮,终浓度为大约1μg/μlDNA。
将在250-600bp范围的DNA片段在1%Seakem GTG(FMCBio Products,Rockland,Maine)制备琼脂糖凝胶上(15×29cm),通过在100v凝胶电泳1.25小时而分离,并通过电洗脱回收(参考),通过在A260测定吸收值对DNA定量,并在无菌超纯(nanopure)水中稀释至500ng/μl并储存在-20℃。
通过将等摩尔量的寡A(5’-GCG GTA CCC GGG AAG CTTGG-3’)和5’磷酸化的寡B(5’-GAT CCC AAG CTT CCC GGGTAC CGC-3’)退火至终浓度为1,000pmd/μl制备接头。将1μg大小选择的插入DNA(3.5pmol,平均大小为425bp)与13μg(875pmols)的接头(250:1接头:插入物摩尔比率),用1~3单位的T4 DNA连接酶在15℃连接16小时。通过凝胶电泳(1%Seakem GTG琼脂糖,1.5小时,100v)从原始片段中分离过量的接头和接头二聚体。通过电洗脱从凝胶中回收接头连接的DNA片段,并在50μl无菌水中再悬浮。
将具有连接接头的DNA(50ng),在含有10μl 10×STR缓冲液(50mM KCl,100mM Tris-HCl,pH9.0,15mM MgCl2,1%Trition X-100和2mM每种dNTP),1μl Taq聚合酶(5U/μl),和1μM寡A引物(10μl 10pmol/μl储存液)的100μl反应体积中用PCR进行扩增。在此反应中用作引物的“寡A”与上述用于装配MboI接头的“寡A”相同。循环条件是95℃1分钟,67C1分钟,70℃2分钟,循环30次。通过用Centricon-100s微滤(向样品中加入2ml无菌水,并加载Centricon-100s,在2,000RPM旋转2分钟,倒置Centricon滤膜并在2000RPM旋转2分钟以回收DNA,在100μl无菌水中重悬浮)除去dNTPs,引物和引物二聚体。将5μl等份的所得PCR文库在1%琼脂糖凝胶上检验(1小时,100v),以证实大小在250~600bp范围之间。
实施例2:通过杂交选择而富集五核苷酸重复
将根据实施例1产生的含有各种不同重复的全基因组PCR文库中的DNA片段,用不同的与固体支持物相结合的寡核苷酸混合物,通过杂交富集。将含有(AAAAX)n五核苷酸重复的片段通过杂交选择而富集。此方法通过首先构建用于杂交选择的寡核苷酸而完成,该寡核苷酸由大约1000bp长的(AAAAC)n,(AAAAG)n和(AAAAT)n串联组组成。将这些寡核苷酸固定在膜上,并与全基因组PCR文库杂交,以选择那些含有(AAAAX)n重复的片段。
如下构建一组寡核苷酸:(a)合成5’磷酸化的30mer寡核苷酸(AAAAC)6,(AAAAG)6和(AAAAT)6及其互补寡核苷酸(GTTTT)6,(CTTTT)6和(ATTTT)6,并以1000pmol/μl浓度悬浮于超纯水中,(b)将等摩尔浓度(用10μl或10nmol或198μg)的具有互补序列的寡核苷酸组合,加热至65℃,15分钟,并在4℃放置12小时以互相退火,(c)然后将退火的寡核苷酸用每μgDNA 1Weiss单位的T4 DNA连接酶在15℃彼此连接过夜,(d)在1%Seakem GTG琼脂糖上,根据大小选择≥200bp的多联体,(e)将连接DNA进行无引物PCR以延长串联组,(f)将表观大小超过1000bp的片段从1%琼脂糖中回收,并通过微滤纯化。测定在A260的吸光度,并在无菌超纯水中制备成1μg/μl储液。
然后将总计1ug的(AAAAC)200,(AAAAG)200或(AAAAT)200寡核苷酸点在4mm×4mm尼龙HybondNfp滤膜上(Amersham LifeSciences,Inc.)用预杂交缓冲液振荡洗涤2次,每次30分钟,以除去弱结合的寡核苷酸,在空气中干燥,在1200μJoules进行UU交联结合DNA,然后在-20℃贮存。
全基因组PCR文库与上述获得的与尼龙滤膜结合的寡核苷酸的支持介质的杂交选择如下进行:(a)将滤膜在1ml预杂交缓冲液(1%BSA(SigmaB-4287),1mM EDTA,pH8.0,7%(w/v)SDS,0.5MNa2HPO4)中,对于含有(AAAAC)n和(AAAAG)n序列的寡核苷酸的滤膜在40℃预杂交,对于含有(AAAAT)n序列的寡核苷酸在37℃预杂交。20分钟后,除去缓冲液,并加入100μl新鲜预杂交缓冲液,(b)用碱(KOH,终浓度150mM)将全基因组PCR文库DNA(20μg)变性,通过加入0.25体积的1M Tris-HCl pH4.8中和,并加入含滤膜的缓冲液中。将所得反应混合物在37℃或40℃预杂交温度培养过夜,(c)用1ml洗涤缓冲液#1(40mM Na2HPO4,pH7.2,0.1%SDS)在40℃将(AAAAC)200和(AAAAG)200滤膜洗涤2次,及在室温振荡洗涤1次,每次15分钟。(AAAAT)200滤膜用1ml洗涤缓冲液在37℃洗涤1次及在室温洗涤1次,(d)与每个滤膜结合的DNA,通过在100μl无菌纯水中加热至95℃5分钟而释出。在95℃将样品除去,以防止再退火。将滤膜剥离(stripped),并通过在0.4M NaOH中在45℃保温30分钟,然后转移至0.1×SSC,0.1%SDS,0.2M Tris pH7.5中并再保温15分钟而再利用。将此膜印迹干燥并在-20℃贮存在密封管中。
实施例3克隆DNA片段的五核苷酸重复富集文库
将根据实施例2的富集五核苷酸重复的DNA片段群,通过PCR再扩增。然后将再扩增的片段克隆入质粒载体pGEM-3Zf(+)中,如下述。此方法通过将选择的插入物与pGEM载体连接,然后将环化的质粒转化入JM109 E.Coli宿主中而进行。
插入物与载体的连接如下进行:(a)将5μl杂交选择的DNA在100μl反应体积中,用1XSTR缓冲液(50mM KCl,10mM Tris-HCl,pH9.0,1.5mM MgCl2,0.1%Triton X-100,和0.2mM每种dNTP),1μlTaq聚合酶(5U/μ1),及1μM寡A引物(1μ1 100pmol/μl储液)进行再扩增。循环条件是95℃1分钟,67℃1分钟,70℃2分钟;循环30次。(b)通过向100μl PCR反应物中加入11μl Promega限制酶10×缓冲液C,和2μl(8U/μl)MboI,在37℃将所得反应混合物保温过夜而用MboI消化再扩增的DNA,并通过在65℃将混合物保温20分钟加热灭活限制酶。(c)通过用BamHI(5U/μg)在37℃消化16小时,随后加入适量小牛小肠碱性磷酸酶10×缓冲液(Promega)和1μlCIAP(U/μl)并在37℃保温1小时,制备用于进行片段插入的pGEM-3Zf(+)载体(约20μg或10.6pmol)。通过加入0.5M EDTA至终浓度为0.02M而终止此反应。乙醇沉淀及以1g/μl重悬浮于TE缓冲液中,然后用苯酚提取。(d)最后,在室温将1μl用MboI切割的DNA(见b步)与1μl或200ng去磷酸化的pGEM 3Zf(+)(见c步)和1μlT4 DNA连接酶(1~3U/μl)保温2小时,进行20μl插入物-载体连接。
最后,用Technical Bulletin #095所述Promega转化法,将10μl的插入物-载体连接反应转化入100μl JM109感受态细胞中。
实施例4通过菌落杂交选择含有(AAAAX)n五核苷酸重复的小插入片段基因组文库
用Lightsmith II试剂和方法(见Promega Technical Bulletin#TM227)经菌落杂交筛选选择含有(AAAAX)n五核苷酸重复的克隆,并通过与碱性磷酸酶辍合的探针杂交而显色。
将MagnaGraph尼龙膜(Micron Separations,Inc.Westboro,MA)置于含有细菌菌落的平板上,搁置3分钟,然后在干燥滤纸上印迹而将菌落DNA转移至膜上,接着将此膜转移到一系列含10%SDS托盘中,放置3分钟,然后转移至含5ml NaOH+30ml 5M NaCl+65mldH2O的变性液中放置5分钟,然后转至由30ml 5M NaCl+25ml MTris-HCl,pH7.4+45ml dH2O组成的中和溶液中放置5分钟,最后转至2XSSC中放置5分钟。然后将此膜在室温干燥30分钟,随后用Statalinker_(Stratagene,La Jolla,CA)用1200ufoules UV交联。
借助于AP缀合的探针和化学发光物,检测含有具有(AAAAX)n重复的克隆的菌落。将与AP缀合的探针杂交的滤膜在X线下曝光表明菌落含所需克隆。进行第二次杂交以证实初始结果。
检测程序利用Promega的Lightsmith II试剂盒(见PromegaBulletin#TM227关于程序的详述)。简而言之,所用检测程序由以下步骤组成:(a)在Quantum Yield_封闭溶液(Promega Cat No F1021)中,将滤膜在56℃强力振荡培养45分钟,(b)到出封闭溶液,并每cm2含AP探针的膜加入0.05ml Quantum Yield_高严格性杂交溶液(Promega Cat No F1231),并在56℃强力振荡培养45分钟,(c)从滤膜中到出杂交/探针溶液,并用150~200ml在56℃预热15分钟的洗涤液#1(2×SSC,0.A%SDS)洗涤2次,(d)组合所有滤膜,并用洗涤液#2(1×SSC)在室温下洗涤1次,10分钟,(e)在200ml 100mM二乙醇胺,1mM MgCl2中平衡印迹5分钟,(f)加入足够的0.25mM CDP-Star底物(Tropix Bedford,MA),以饱和滤膜,然后在室温至少培养5分钟,(g)将底物饱和的滤膜置于杂交折叠器(folder)中的聚苯乙烯塑料片防护器上,并关上折叠器,(h)将含滤膜的杂交折叠器放在底片盒中,并将所含的滤膜曝光于X光胶片,(i)在曝光至少1小时之后,显色底片。
实施例5 DNA测序和分析
一种简便的利用细胞裂解物制备测序模板的方法被开发出,以对实施例4中鉴别的可能含有带有至少一个(AAAAX)n序列的插入物的大量克隆进行测序。此方法包括将菌落杂交分析中的阳性克隆转移至含200μl LB/Amp(100μl/ml)的无菌96孔微滴定平板中(Falconcat.#3072),在250rpm,37℃培养过夜。接着,将过夜培养物分开,并用于三种不同方法,包括制备细胞裂解物,从第二次杂交中制备复制滤膜以证实初始发现,或制备甘油储液以长期贮存克隆。
取2μl过夜培养物并将其加入96孔反应平板(Perkin Elmer Cat#N801-0560)中的100μl无菌超纯水中,在9600热循环仪中加热至100℃4分钟,以产生细胞裂解物。然后冷却,冰冻,并在-20℃贮存直至使用。
经灼烧将96-针复制器灭菌,将此复制器蘸含过夜培养物的96孔平板中,印迹在LB/Amp(100ug/ml)平板上的137mm圆形尼龙膜(MagnaGraph,MSI),在37℃将此膜培养过夜,从而制备复制滤膜以进行第二次杂交。
向每个孔中加入46μl 80%甘油,并将平板放在振荡培养器中,以250rpm振荡几分钟至混合,然后在-70℃贮存,以将剩余过夜培养物转变为甘油储液。
选择在二个菌落杂交分析中是阳性的所有克隆,并将细胞裂解物平板的相应克隆用于PCR扩增。用Qiagen QIAquick 96 PCR纯化平板(cat #28180)纯化PCR反应产物,并用模板进行测序。将2μl细胞裂解物用于含有2μM M13-47正向引物(Promega cat,#Q560A)和2μM M13反向引物(Promega cat.#Q542A),1×STR缓冲液和2.5单位Ampli Taq(Perkin Elmer)的50μl PCR反应中。在PE480热循环仪上使用以下循环曲线:在96℃/2分钟循环1次;在94℃/1分钟,56℃/分钟,70℃/1.5分钟循环10次;在90℃/1分钟,56℃/1分钟,70℃/1.5分钟循环20次;在4℃保持。根据生产者之建议用Qiagen QIAquick 96 PCR纯化平板(cat.#28180)净化PCR反应产物,并回收入70μl Tris-HCl 10mM pH8.5,终浓度大约35ng/μl,并在-20℃贮存。
用ABI染料终止测序化学和ABI377测序仪进行DNA测序。用ABI染料终止试剂盒和生产商方案(Protocol P/N 402078)制备测序模板。将2μl或大约30~90ng纯化的PCR产物(上述)用作DNA模板进行测序反应。此测序反应包括8μl染料终止剂混合物,2μlDNA模板(35ng/μl),4μl 0.8M M13-21正向引物,和6μl无菌超纯水,在GeneAmp PCR System 9600上循环测序循环曲线为:在96℃/10秒,50℃/5秒,60℃/4分钟循环25次,保持在4℃,在每个试管中加入50μl 95%乙醇和2μl 3M乙酸钠,pH4.6,用涡流混合,置于冰上10分钟,然后在最大速度离心30分钟,从而纯化延伸产物。将粒状沉淀用250μl 70%乙醇漂洗,真空离心约3分钟脱水,并在-20℃干燥贮存直至使用。然后将干燥的粒状沉淀再悬浮于6-9μl加样缓冲液中,然后在95℃变性2分钟,并在冰上贮存直至加样于凝胶上。
根据生产者之方案制备5%Long Ranger凝胶(FMC Bio Products,Rockland,ME),并聚合2小时。将此凝胶在1000v预电泳45分钟。将加样缓冲液中的1.5μl模板加样于凝胶上,并在2×或4×条件下分别电泳3.5小时或7小时。
将产生自ABI 377测序仪的DNA序列数据进行编辑,以除去任何pGEM载体序列,然后置入局部数据库,该数据库是用遗传学计算机组Wisconsin软件包版本9.0(Madison WI)产生的,含有所有被评价克隆的序列信息。接着,测试克隆中是否存在五聚体重复,及其长度和序列模式。然后将那些含有5或更多个重复的克隆,用BLAST序列对比程序(Alargland et al;1990)比较,以鉴别复制的克隆和那些已存在于美国马里兰州Besthesda的国立生物信息中心的GenBank数据库中的克隆。一旦鉴别出独特的克隆,借助于寡聚物引物分析软件版本5.0(National Biosciences,Inc,Plymouth,MN)设计PCR引物。
实施例6筛选多态水平的克隆及测定染色体位置
在二个集合的DNA样品上进行初始多态性筛选,一个样品含有15个随机个体的人基因组DNA,另一个含有取自NIGMS人类遗传突变细胞贮存处(CEPH Collection DNA pool,cat.#NA 13431,CoriellCell Repositories,Camden,NJ)的54个CEPH个体的基因组DNA。荧光标记的PCR引物用于基因组DNA靶基因座的PCR扩增,并将PCR产物在聚丙烯酰胺凝胶上分离,并在荧光扫描仪上显色。将那些具有4个等位基因和50%杂合性的基因座随后用16个个体CEPH DNAs(102-1,102-2,884-1,884-2,1331-1,1331-2,1332-1,1332-2,1347-1,1347-2,1362-1,1362-2,1413-1,1413-2,1416-1,1416-2)测试,以测定初步杂合值。然后进一步分析相同基因座的数据,以确定等位基因数,等位基因频率和杂合值。(见表2)
将发现的含有五聚体重复序列并符合≥4个等位基因和≥50%杂合性的选择标准的克隆作图,以测定精确染色体位置(见表2)。有三种不同方法用于作图:(1)用代表单个人染色体的NIGMS组26个体细胞杂种(Coriell Cell Repositories,camden,NJ)进行体细胞杂种作图,以鉴别染色体起源,(2)利用GeneBridge 4RH组的93个RH克隆(Schuler et al;1996)进行辐射杂种作图的技术,和(3)标准减数连锁作图技术和8个取自CEPH同源参考组的家族(K102,K884,K1347,1362,1331,1332,1413,1416)并用CRI-MAP多点连锁程序(Lander & Green,1987)作图。
在对含有100个以上来自4种主要种族包括非洲人,白人,亚洲人和西班牙人的较大群体研究中,评价了16个CEPH个体中杂合值超过70%的克隆的基因型和等位基因出现频率。图10和11图示扩增自群体中24个不同个体基因组DNA样品中(DNA样品S02~S25)2个不同多态ITR基因座的等位基因迁移的广泛变化。用于此分析的引物对序列见上表1。用荧光标记的引物扩增每个五核苷酸重复基因座,随后在聚丙烯酰胺凝胶上分离,并经FMBIO II荧光扫描仪(Hitachi Software Engineering America,Ltd,San Francisco,CA)扫描显色,而产生凝胶图象。含有每个分析的基因座的大多数已知等位基因的等位梯包含在电泳凝胶两头的泳道中,即S01和S26泳道中。用于扩增每个基因座的引物对具有互补于分离自克隆S159或克隆G210的分离的DNA标记的序列至少一部分的序列,如以下实施例所示。此引物对序列选自上表1列出的克隆S159和G210引物对。
进行多态性筛选的PCR条件如下:25μl含大约200ng集合的DNA模板或25ng个体CEPH DNAs,1×STR缓冲液,1单位Taq聚合酶,和1μM相应引物对的反应物。用于扩增表2所列每个克隆的每个引物对序列见表1中所列。注意到每个引物以表1所列的SEQ ID NO表示。Perkin-Elmer Gene Amp PCR System 9600热循环仪(Perkin-Elmer Foster City,CA)的循环条件是:96℃1分钟,然后在94℃,30秒,68秒内缓升至60℃,保持30秒,50秒内缓升至70℃,保持45秒,循环10次,随后90℃30秒,60秒内缓升至60℃,保持30秒,50秒内缓升至70℃,保持45秒,60℃,30分钟循环20次。将2.5μl每个样品与2.5μl 2×溴酚蓝加样液混合以制备PCR样品,在95℃加热2分钟以变性,冰冻,然后将3μl每个样品在4%聚丙烯酰胺凝胶上,在40W电泳50分钟。将此PCR产物通过Hitachi FMBIO荧光扫描仪扫描显色,并用所附软件分析(FMBIO Analysis Version 6.0,Hitachi Software Engineering,San Francisco CA)
表2
  SEQIDNO.  克隆号  GenBank登录号   观察到的最长ITR序列  观察到的等位基因号  %杂合性(白种人) 染色体位置
    1     C074     none     [TTTTG]9     6     75     1
    2     C221     none     [GTTTT]13     7     78     9p
    3     C240     none     [CAAAA]7     4     42     NA
    4     C331     none     [GTTTT]10     5     43     NA
    5     C362     none     [GTTTT]5     4     62     4
    6     C390     none     [CAAAA]7     5     56     NA
    7     G022     none     [AAAAG]6     4     63     2p
    8     G023     none     [AAAAG]10     12     71     16q
    9     G025     none     [AAAAG]6     12     86     1
    10     G047     none     [AAAAG]9     5     86     2p
    11     G065     none     [TTTTC]6     13     100     1q
    12     G085     none     [AAAAG]11     8     93     10q
    13     G132     none     [CTTTT]15     12     100     4 qter
    14     G145     none     [AAAAG]13     8     33     NA
    15     G152     none     [AAAAG]6     5     87     8 qter
    16     G153     none     [AAAAG]6     5     88     8 qter
    17     G158     none     [AAAAG]5     8     75     5q
    18     G181     none     [GAAAA]14     5     72     NA
    19     G210     none     [CTTTT]6     9     56     8p
    20     G212     none     [CTTTT]9     6     100     NA
    21     G233     none     [AAAAG]8     12     50     10q
  SEQIDNO.   克隆号    GenBank登录号   观察到的最长ITR序列   观察到的等位基因号  %杂合性(白种人)   染色体位置
    22     G234     none   [AAAAG]12     4     80   16qter
    23     G235     none   [TTTTC]6     4     56     2p
    24     G331     none   [CTTTT]8     5     73     NA
    25     G405     none   [CTTTT]6     10     80     NA
    26     G475     none   [GAAAA]12     12     92    15q22.3
    27     G539     none   [GAAAA]12     13     100    15q26.2
    28     S023     X05367   [AAAAT]6     4     50     NA
    29     S071     M90078   [AAAAT]8     4     56    6q26-27
    30     S085     U07000   [AAAAT]5     7     44     22q11
    31     S125     Z73416   [AAAAT]13     5     64  22q11.2-qter
    32     S132     Z83847   [AAAAT]10     8     69     22
    33     S136     Z82250   [TTTTC]6     11     94   22q12-qter
    34     S159   AC000014   [GAAAA]9     12     72   21q22-qter
    35     S176   AC000059   [GTTTT]9     4     56   7q21-7q22
    36     S189     Z54073   [AAAAC]8     5     69  22q11.2-qter
    37     S199     Z84475   [GTTTT]7     4     75     6q21
    38     S040     X06583   [AGCCTGG]4     2     NA     NA
    39     S066     M68516   [ACTCC]5     3     NA     NA
    40     S077     M25718   [AATAC]12     6     NA     NA
    41     S097     Z21818   [CAGGCT]3     3     NA     NA
    42     S103     X15949   [ATCCC]8     3     NA     NA
    43     S110     X54108  [GGA(A/G)T]32     6     NA     NA
实施例7通过GenBank搜索鉴别短串联重复
鉴别串联重复序列的方法是:搜索国立生物信息中心(NCBI)GenBank中中度串联重复的存在与否。使用的一些方法包括用DNASTAR的Lasergene软件包,在CD-ROM上成批搜索GenBank入口,用遗传学计算机组Wisconsin软件包版本9.0(Madison,WI)成批搜索GenBank。
有45=1024个不同的五字母单词可从4个字母(A,C,G,T)组成,以产生所有可能的五聚体重复,且有46=4096和47=16384个不同六字母和七字母单词产生6碱基重复和7碱基重复。但是,由于二个互补链的等价(如AAAAT等价于ATTTT),及环状置换的等价(如AATAA…等价于ATAAA…),独特的重复基序数相对较少。在5碱基重复的情况下,这意味着如果除去单核苷酸重复A5/T5和C5/G5,有102类独特的五聚体重复。
所有具有至少3个连续拷贝的5,6和7碱基重复的独特组合,用于搜索GenBank人基因组数据库。所有含3个或更多重复拷贝或具有偶然碱基取代的拷贝的重复区被鉴别。用现存的序列数据,设计位于重复区侧翼的引物,靶基因座经PCR扩增,并如实施例6所述评价多态含量。
然后将含有用GenBank数据库信息装配的引物鉴别的序列的每个克隆,如实施例7中所述筛选重复序列含量。发现的含有ITR序列,即ITR标记的每个克隆的序列指定为SEQ ID NO:28~43之一。含有位于每个这种标记的ITR区侧翼的序列的引物的序列见表1。每个这种ITR标记序列特征分析结果见表2。
实施例8评价中度串联重复基因座的PCR假象(即打滑百分率)
本研究中所述的许多标记代表一类新的标记,其产生较少的已知为“打滑”的PCR假象,(见以上本发明详述的解释章节)。这些假象的产生发生在PCR扩增期间,可能是称为重复滑动的DNA聚合酶相的现象导致。(Levinson & Gutman,1987,Mol,Biol.Evol.4(3):203-221;Schlotterer & Tautz,1992.NAR20:21l-215)。重复滑动的最终结果是含有与真正等位基因不同数目重复单位的PCR产物的产生。如果在PCR期间发生足够量的滑动,扩增的产物将显示为主要和次要条带,主要条带相当于真正等位基因,而次要条带相当于含有较多或较少重复单位的产物。
为确定不同基因座打滑条带的数量,将6个ITR基因座(C221,G023,G025,G210,S159和本发明中未阐述的另外的ITR即S117),和17个四核苷酸串联重复基因座(F13A01,THO1,TPOX,F13B,FESFPS,D7S820,CSFlPO,D13S317,D8S1179,D16S539,LPL,FGA,D5S818,D3S1358,D18S51,vWA和D21S11)的PCR扩增产物在ABI 377测序仪上电泳,并用GenScan软件(PE AppliedBiosystems,Foster City CA)分析。测定在25~40个研究的个体样品中每个基因座观测到的所有主要峰和次要峰的峰高,以相对荧光单位(RFU)表示。计算次要峰相对于主要真正等位基因峰中观测的RFU百分率,在五核苷酸重复中次要峰通常比真正等位基因少5bp,在四核苷酸重复中比真正等位基因少4bp(见表3)。
ITR基因座S159(图2)和G210(图3),和四核苷酸重复基因座vWA(图4)和D5S818(图5)的ABI 377电泳图示出在ITR基因座打滑最小或无打滑,在四核苷酸重复基因座可清楚观察到打滑。特别地,图3中再产生的vWA四核苷酸重复基因座的电泳图中箭头14和15,和图5中再产生的D5S818四核苷酸重复基因座的电泳图中箭头16和17表示打滑假象。将那些明显的假象峰与示于图2的分离自克隆S159的DNA标记(即具有SEQ ID NO:34的序列的标记)和示于图4的分离自克隆G210的DNA标记(即具有SEQ ID NO:19的序列的标记)的五核苷酸重复的电泳图中渐消的小假象相对比。图2-5中再产生的特异电泳图是每个基因座观测的打滑最高发生率。
对所有基因座观测的打滑数量有一些可变性。通常的趋势是等位基因含有最高重复数(以碱基对大小而表明)呈现最高量打滑。示出的25-40个每个测试个体打滑百分值是散射图(图6,7,8和9)。
简而言之,“打滑”条带与真正等位基因条带的百分比,在大多数评价的ITR基因座中,与四核苷酸串联重复基因座相比明显较低。即使所用四核苷酸基因座代表当前已知的最佳此类标记,此结果也是确实的。例如,13个这种四核苷酸标记,包括一些下表3中阐述报道的具有高打滑百分率的四核苷酸标记,已被美国联邦调查局选择用于分析国立组合DNA指数系统(CODIS)的所有DNA样品,(Macivee,I.(1998)Profiles in DNA(3):2)。
表3
 基因座名称或克隆号 串联重复单位长度  平均打滑百分率   最高打滑百分率  最低打滑百分率  标准偏差  所分析的等位基因数量
Clone S159     5 bp(ITR)     0.1     1.4     0.0     0.4     40.0
Clone G210     5 bp(ITR)     0.6     3.2     0.0     0.9     30.0
Clone C221     5 bp(ITR)     0.9     3.3     0.0     0.9     27.0
F13A01     4 bp     1.2     9.7     0.0     2.5     34.0
TH01     4 bp     1.7     5.2     0.0     1.7     34.0
Clone S117     5 bp(ITR)     2.0     6.9     0.0     1.7     37.0
Clone G023     5 bp(ITR)     2.3     6.6     0.0     1.7     39.0
TPOX     4 bp     2.4     5.6     0.0     1.8     34.0
F13B     4 bp     2.6     7.7     0.0     1.7     31.0
FESFPS     4 bp     3.6     10.0     0.0     2.3     34.0
D7S820     4 bp     3.8     8.2     1.6     1.6     28.0
CSF1PO     4 bp     4.1     9.5     0.0     2.5     31.0
Clone G025     5 bp(ITR)     4.5     9.3     0.0     2.1     36.0
D13S317     4 bp     4.7     7.5     1.7     1.5     26.0
D8S1179     4 bp     5.0     8.3     2.4     1.6     27.0
D16S539     4 bp     5.1     8.6     1.7     2.0     28.0
LPL     4 bp     5.4     15.0     1.7     3.1     29.0
FGA     4 bp     5.5     11.6     3.0     1.7     36.0
D5S818     4 bp     6.1     9.0     0.0     1.9     28.0
D3S1358     4 bp     6.1     12.5     0.9     2.1     25.0
D18S51     4 bp     6.5     11.6     2.5     2.4     28.0
vWA     4 bp     6.6     11.4     3.7     1.4     28.0
D21S11     4 bp     7.5     15.7     1.9     3.5     30.0
序列表(1)一般信息:
(i)申请人:Schumm,James W.
(ii)发明名称:鉴别和分析中度串联重复DNA标记的物质和方法
(iii)序列数:147
(iv)通讯地址:
      (A)收信人:普罗梅加公司
      (B)街道:2800 Woods Hollow Road
      (C)城市:Madison
      (D)州:Wisconsin
      (E)国家:USA
      (F)ZIP:53711-5399
(v)计算机可读形式:
      (A)媒介类型:3.5英寸软盘,1.44Mb
      (B)计算机:IBM PC兼容机
      (C)操作系统:Windows NT4.0
      (D)软件:WordPerfect 7.0(DOS文本格式)
(viii)律师/代理人信息:
      (A)姓名:Grady J.Frenchick
      (B)注册号:29,018
      (C)卷号:8976.80
(ix)电讯信息:
      (A)电话:(608)257-2281
      (B)传真:(608)257-7643
      (C)E-MAIL:gfrechick@mail.stroudlaw.com(2)SEQ ID NO:1的信息:
(i)序列特征:
      (A)长度:445bp
      (B)类型:核酸
      (C)链性:双链
      (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(vii)立即来源:
      (A)文库:质粒,pGem3Zf(+)
      (B)克隆:C074
(viii)基因组中的位置
      (A)染色体/区段:1
(xi)序列描述:SEQ ID NO:1:GATCCTTTGC ACCCAGANAG AAGTAATTAT TTCAACACAG TTGGAACAGT         50TAAAAAGATT TAAAATTTTC AAAAAAACAA TCATTTTCTC TTTTCTTTCT         100GGCTCAGACA CCTCATTGCT TTCTGACTGA CCAAGGCGCA GCGCANTTTG         150CAGCAGCCAT GGGGGTTCCA GAGATTCCTG GANAAAAACT GGTGACAGAN         200AGAAACAAAA AGCGCCTGGA AAAAGATAAG CATGAAAAAG GTGCTCAGAA         250AACAGATTGT CAAAAGTAAG TCTTACCTGT GGCTCGCATT ATTTGGGAGT         300TATTAAAATA TGAAAGTTTG GCAAATACCC GGTTATCTAC AGTCCTTTNG         350TTTNGTTTTG GTTTTGTTTA GTTTGGTTTT GTTTNGTTTN GTTTGACACG         400GAATCTCTCT CTGTTGCCCA AACTGGGAAT ACAGTGGTGC CGATC              445(2)SEQ ID NO:2的信息:
(i)序列特征:
     (A)长度:411bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:C221
(viii)基因组中的位置
     (A)染色体/区段:9p
(xi)序列描述:SEQ ID NO:2:GATCACTTGC CATCCCTGCC ACACAGTTTC CTCCTCTGGA AACTGGGGGT         50GATGACCCCT GCCCTACCCA CTTGTCATGG CATTGGGGAC ATGAACACAC         100TTTGCACCTG TCAGGCAAGG CTTAAACAGG GATATGCACT GGTAATAGAA         150AAGAGGGACT AAGTTTTGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT         200TTGTTTTGTT TTGTTTTGTT TTGTTTTTCT GAAGAAGTCC CTAGAAGCGC         250TCAGTGTTGG AATGCTCTCT TGTAGCAGTG GCGGCTGCTG CTGGTTCCGG         300GTCAGATGCC GGAATTGGGG GTGCGCTTGG GTGCAGCTGC ATTTCATCTG         350GTCCTGGGCC TCGGTCCTGG CTTGGAGAGG TGCAGCTCAC AGCCACTTCA         400TGGCTGGGAT C                                                   411(2)SEQ ID NO:3的信息:
(i)序列特征:
     (A)长度:354bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:C240
(xi)序列描述:SEQ ID NO:3:GATCANCATG GGTTCTATCT GCCTGGCCCT TCACCCCCTA CTCAGGGCAG      50CTCTGAATTG TCTNCCCCGC TTCAAAGTTC CCAGTTCAAC TTCTCCCTCT      100GCCCAATCCT GTTTCCTTCT CTTCCACAGG TATTAATTTG GCCAGNTGCA      150GTGGCTCATG CCTGTAATCT CAACTTTGGG AGGCCAAGGT GGGAGGATTG      200CTTGANCCCA GAATTTTGAA ACCANCCTCT GAAACATANT GANACCCCTG      250TCTCAAAACA AAACAAAACA AAACAAAACA AAACAAAAAC TANCCAGGCA      300TGATGGTGTG TGCCTGTGGT CCCANCTATT CAGGAGGCTG AAATGGGAGG      350ATC                                                         353(2)SEQ ID NO:4的信息:
(i)序列特征:
     (A)长度:317bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:C331
(xi)序列描述:SEQ ID NO:4:GACCGTGGAA NCCAAAAGTC TGCCTACCGC ATCTTAGTCC AGAGTTCCTG   50TTTTTACTTC TTTTTGAAGG TCTGTGGATT CTTTATTTTC ATGGCACCTT   100AGCAATACAT TTTAAAAGCT TGTTTTATTT TATTCAGCAT TTTGGTTATT   150TCCATTGGAA NANTCATTCA GGGCGTTTAG TCTGCCACAG TGCTGGAAAC   200TAAAGCTAGG ATTACATGTT TTGTTTTGTT TTGTTTTGTT TTGTTTTGTT   250TTGTTTTGTT TTGTTTTGTG ACAGGGTCTT GCTCTATTGC CTTAGGCTGG   300GGTGCAGTGT TGTGATC                                       317(2)SEQ ID NO:5的信息:
(i)序列特征:
     (A)长度:387bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:C362
(viii)基因组中的位置
     (A)染色体/区段:4
(xi)序列描述:SEQ ID NO:5:ACAGACTAAC AGAAAGAANA TCAGGTCGAC TTGCCTAAAA AGAGTGAGCT      150AGGGAAAAGC ATGGCGGAAG AAACAANGTT GCTGAAAGCA ACTCTTATTT      200TCTTGGCTTA GAAACCANNA AAATGCNTTT GGGTTTTATC TTAGCATAAT      250GAAAAGACAT GTNANACTTC TGAACACGAA ATCTGACATG TTTTACAGAC      300NTGTTTTACA TGGTTTTGTT TTGTTTNGTT TTGTTTTGGG ATGGAGTCTC      350GCTCTGTTGC CANGCTGGGA GTGCAATGGT TGCGATC                    387(2)SEQ ID NO:6的信息:
(i)序列特征:
    (A)长度:471bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:C390
(xi)序列描述:SEQ ID NO:6:GATCACGAGG TCAGGAGATG GAGACCATCC TGGCTAACAT GGTGAAACCC      50CGTCTCTACT AAAAATACCA AAAAATTAGC CGGGCATGGT GGCGGGCGCC      100TGTAGTCCCA GCTACTCAGG AGGCTGAGGC AGGAGAATGG CGTGAACCCG      150GGAGGCGGAG CTTGCAGTGA GCCGAGATTG CGCCACTGCG CTCCAGCCTG      200GGTGACAGCG AGAATCTGTC TCAAAACATA ACAAAACAAA ACAAAACAAA      250ACAAAACAAA ACAAAAAAGA TTTGGAATTA TGTAGGCAAA GTGGGAGAAA      300GAGANGGACG AGGACTNAGG TAAAGATAAT ATGCAAAATA GAAAGAGCAN      350GAAGGGGCAT GGATATGTGT AAATTCAAAG AAAGGCAAAG TGGCTGGTGC      400ACAAAGAGTG AGGAGAGCAA NGNGTGAAAA TGACTTTAGT GAGACAAGGC      450AAGGGACAAA TCATGAAAAA T                                     471(2)SEQ ID NO:7的信息:
(i)序列特征:
     (A)长度:367bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G022
(viii)基因组中的位置
     (A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:7:GATCGCACCA CTGCACTCCA GCCTTGGTGA CAGAGCAAAA CTCNTTCTCC   50AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAAA AAAATCCATG   100GTGAAAGTGA CGACAGTNGA GTAGGGGATG AGCTCAAAGC AAATGCATGC   150ATGTNCCCCA CCCTCAACAC AAACACACAC ACACACACAC ACACACACAC   200ACACACACAC ACACATACTT CTTTAGAGAT ATTTAGGTGT ATATATGCTA   250ACTTAGGAAA CTTTAGAAAA CCTTGTTATG ATATTATTAG TCAAAAAATA   300TTTAAGCCAC AGTTTCGCAA TTTTAAGATT GTACTACTGG TATCTGGAGT   350ATCTGAATCT CTGGATC                                       367(2)SEQ ID NO:8的信息:
(i)序列特征:
     (A)长度:295bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G023
(viii)基因组中的位置
      (A)染色体/区段:16q
(xi)序列描述:SEQ ID NO:8:GATCACAGCA CTGCACTGCA GCCTGGGCAA GAGAGCAAGA CCCTCTCTCT   50CAGGGAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA   100AAGAAAAGAA AGGAAGGAAA GAGAGAGGAA GGAAGGAAGG AAGGTAAGAA   150GGAAGGAAGG AAAGAAAGAA GGAAGGAAGG TAGGGTGGTT TTGGGATGTG   200AAATGCTGTC AGTCAACAAA GAGCTATGAC CACAGGTGTC ACTGAGTAGC   250AGGGGCAGCC CATCCTGCTC CCTAGCTGCA CTCACCCTGA AGATC        295(2)SEQ ID NO:9的信息:
(i)序列特征:
     (A)长度:361bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G025
(viii)基因组中的位置
     (A)染色体/区段:1
(xi)序列描述:SEQ ID NO:9:GATCTGATGG TTTCATAAGT GTCTGGCATT TCCCCTGCTT GTACTTCTCT      50CCCCGGCTAC CGTGTGAAAA AGGTCCTTGC TTCCCCTTTG CCTTCCACCA      100TGATTGTGAG CTTCCTGAGG CCTCCACAGA CATGTGGAAC TGTGAGTCAA      150TTAAACTTCT TTCCTTTATA AATTACCCAG TCTCAGGAAG TTCTTTGTAG      200CAGTGTGAGA ATGGAGGAAG AAAGAAAAAG AAAAAAAAGG AAAAGAAAAG      250AAAAGAAAAG AAAAGAAAAG AAAGGAAGA AAGAAAGAAAG AAAGAAAGAA      300AGAAAGAAAG AAAGAAAGAA AGAAAGAAAG AAAGAGAGAG AAGTGGTTAG      350CAAATGTGAT C                                                361(2)SEQ ID NO:10的信息:
(i)序列特征:
     (A)长度:318bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G047
(viii)基因组中的位置
     (A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:10:GATCACTTGA GGCCAGGGGT TCGAGGCCAG CCTGGGCAAC ATATCAAGAC      50CCCCATCTCT ACATAAAAAG AAGAAGAAAC GAAAAGAAAA GAAAAGAAAA      100GAAAAGAAAA GAAAAGAAAA GAAAAGAGTG GAAGAGTGCA GGAGCCGAGA      150GGGAGAGAAA ATGTAGTGGT GAGGGGCAGC TTCTGGAAAG GCCCATACTA      200CAGAGGGAGG AATCCTAATT CCTCACTATC TCTCTAACAT CAGGTAAGCA      250TCTCATGATG CAGTTAGAAA GCACATTTCC TTCTTCAGTT TCCCCTCTGG      300CTGTGTTGAC CCAGCCCA                                         318(2)SEQ ID NO:11的信息:
(i)序列特征:
     (A)长度:362bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G065
(viii)基因组中的位置
     (A)染色体/区段:1q
(xi)序列描述:SEQ ID NO:11:GATCACATTT GCTAACCACT TCTCTCTCTN TCTTTCTTTC TTTCTTTCTT      50TCTTTCTTTC TNTCTTNCTT TCTTTCTTTC TATCTTCCTT TCTTTACTTT      100NCTTTNCTNT TCTNTTCTAT TCCTTTANAT TTCTTTTTCT TTCTTTCTCC      150ATTCTCACNC TGCTANAAAG AACTTCCTGA GACTGGGTAA TTTATANAGG      200AAAGAAGTTT AATTGACTCA CAGTTCCACA TGTTTGTGGA GGCCTCAGGA      250AACTTACAAT CNTGGTGGAA NGCAAAGGGG AANCAAGGAC CTTTTTCACA      300CGGTAGCCGG GGAAATAATT ACAANCAGGG GAAATGCCAN ACACTTATGA      350AACCATCAGA TC                                               362(2)SEQ ID NO:12的信息:
(i)序列特征:
     (A)长度:297bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G085
(viii)基因组中的位置
     (A)染色体/区段:10q
(xi)序列描述:SEQ ID NO:12:GATCATGTCA TTGCACTCCA GCCTGGGTGA TACAGCAAGC CTCATCGAAA      50GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA      100GAAAGGAAGA AAAGAAAACA AANAGATAGA AAGCAANCNN GTGGCNTGAG      150AANTNAAATT CTTATAGGTA ACCTGGAGGA CTTTTATCTT TCCAGGAGTC      200TCTCTCAATG CATTTAGACT CAACAANGAT TTCCTTTTCT CTTGTCTCTA      250NAAANAAATG CATTTCCTCA AAANANTGGA GGTCANATTA TGTTANAGAT      300GGGAGAATGC ACTGAGTTNC GCTGAANGA                             329(2)SEQ ID NO:13的信息:
(i)序列特征:
    (A)长度:372bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G132
(viii)基因组中的位置
    (A)染色体/区段:4qter
(xi)序列描述:SEQ ID NO:13:GATCTACCAT TCTTGGGTCT GGAGAACAGT GGCCCTTGTT TCTTTTCTTT      50TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT CCTTTTCTTT      100TCCTTTCCTT TCCTTTTCTT CTCTCTCTCC TTCTCTCTCT CTCTCTCTCT      150CTCTCTCTCT CTCTCTCTCT CTCCCTCTCC CTTCCCTTCC CTTCCTTTCC      200CTTCCTTTCC TTTCCTTTCA TTTTTTTTGA CATGGAGTTT CACTCTTGTC      250ATCCAGGCTG GAGTACAGTA NTGTGATTTT GGCTCACTGC AACCTCTGCC      300TCNTGGGTTC AAGAGATTCT CCTGCCTCAG CTTCCTGANT AGCTGGGATT      350ACAGGTGCCT GCCACCATGC TT                                    372(2)SEQ ID NO:14的信息:
(i)序列特征:
    (A)长度:350bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G145.1
(xi)序列描述:SEQ ID NO:14:GATCTCTTGA AGCCTCGCAN ATAAAGGCTC CAGTGGGGTA TGATTGCACC      50ANTGCACTCC ANCCTGNGAN ACGGNAGAGA GATTCTGTCT CAAAAGAAAA      100CAAAATAAAA GAAAANAAAA NAAAANAAAA TAAAANAAAA TANAAGAAAA      150GAAAAGGATG CTTTAAAAAT NTGGCAAAAT GTNCCCTTTA TTGACTACTG      200CCTTGTTTTA ATTTNCTCTA TTTNTCTATT TATTTTCTCA GTGTACTTTC      250CCATNTNNCT TTNTCTCTTC CTTCTTTGAA AGTAATTCTT GGCCAGGCAT      300GGTGGTTCAT GCCTATAATC TCANCACTTN AGGGGGCTNA AGCNGGAAGA      350(2)SEQ ID NO:15的信息:
(i)序列特征:
    (A)长度:372bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G152
(viii)基因组中的位置
    (A)染色体/区段:8qter
(xi)序列描述:SEQ ID NO:15:GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC      50CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT      100GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG      150GAGGTTGTAG TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA      200GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA      250AAGAAATTCA TCATTGGGAA ACATCATGGA NGGCCGCNAC CAGTCAGGGG      300AACATTTCCG AAAGCNANTT NTTCTTCCAA TGCCCTATGT TNCTTCCCCN      350AAGCTTGCCA TTTTNAACCC TT                                    372(2)SEQ ID NO:16的信息:
(i)序列特征:
    (A)长度:361bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G153
(viii)基因组中的位置
    (A)染色体/区段:8qter
(xi)序列描述:SEQ ID NO:16:GACCACCTGA GGTCATGAGT TCCAGACCAG CCTGGCCAAC ATGGCAAAAC   50CCCGTCTCTA CTAAAAATAC AAAAAATAGC CGGTGTGATG GTGGGTGCCT   100GTAATCCCAG CTACTCAGGA GGCATGAGAA TCGCTTGAAC CTGGGAGGCG   150GAGGTTGTAN TGAGCTGAGA TTGCGCCTCT GCACTCCAGC CTGAGTGATA   200GAGTGAGACC CCATCTTGAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA   250AGAANTTCNT CATTGGGAAA CATCATGGAG GCCGCAGCAN TCAGGGGAAC   300ATTTCCGAAA GCNAGTTGTC NTTCCAATGC CCTATGTTNC TTCCCCNAAG   350CNTGCCATTT T                                             361(2)SEQ ID NO:17的信息:
(i)序列特征:
    (A)长度:447bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G158
(viii)基因组中的位置
    (A)染色体/区段:5q
(xi)序列描述:SEQ ID NO:17:GATCGCCTGG GTACAGCAGG AAAGAAGGGG GCGGCCACGG CAAGGCAGCC      50TCCGACTGCC CGGCGGGGGA NGCCGGCGGC GGCCCCTTCT CGCCCTCTCC      100TATAAGCAGT TTTATAAGCT TCCTGAGACT ANAAAAGGAA AAGAAAAGAA      150AAGAAAAGAA AAGAAAAATC AGTCTCTATT TTATATGCGT ATAATTTTTT      200TTATATGCGT ATAATTTTTT TTTTAACCAA AAACTCNTTA TGGACAAAAC      250AAACTACCAT CCCACTCCAA ATTATCTCTG CATCATGCTC ACAACCTCAG      300CNCAAATTTC AATANAANTT TTATTGGGAT ATGTTTGGCT TCCATCAATT      350GAAATTTCCC CTAATGAATA AAATTTCCTC CCGTTTTTTT GGTAAACATT      400TCCCCTTGNA AGGCCCACCT AAAAATCNCC NGGNCTTTTT CCAAAGG         447(2)SEQ ID NO:18的信息:
(i)序列特征:
     (A)长度:415bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G181
(viii)基因组中的位置
     (A)染色体/区段:
     (B)图谱位置:
     (C)单位:
(xi)序列描述:SEQ ID NO:18:GATCCCAAGC TTCCCGGGTA CCGCGATCAC CTGAGGTCAG GAGTTCAAGA   50CCAGCCTTCT CAACATGGCA AAACCTCATT TCTACTAAAA ATACAAAAAA   100TTAGCTGGGC ATGGTCTTGG GTGCCTGTAA TCCCAGCTAC TCAGGAGGCT   150GAGGCAGGAG AATGTCTTGA ACCCAGGAGG CGGTGGCTGC AGTGAGGCAA   200NATTTTGCCA GTGTNCTCCA GCCTGGGTGA CAANANTGAA ACTCCGTCTG   250AAAGAAAGAA AGAAAAAGAA AGAAAGGAAG GAAGGAAGGA AGGAAAGGGA   300AGGAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA   350AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA TNAGATGGGG GAGCTCTACC   400GAACTGATTC CGATC                                         415(2)SEQ ID NO:19的信息:
(i)序列特征:
     (A)长度:444bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G210
(Viii)基因组中的位置
     (A)染色体/区段:8p
(xi)序列描述:SEQ ID NO:19:GATCCTATCC TGACAAACTC AAGCAAATTC ACAAATACAA CCCTCTAGCC      50GGCCCATGGC CTCCCTATTT GGGAGGAAAA AACTCAGTAT GATACTGTGA      100CATATTTCAT TCATTATCTG TTAAGGTGAG CGTGGCAAAC CTGGCCGAAG      150TGGCAGAATA TTGGGGCTCA TCACTTGGGG GAATGATTCA GGAGTGGCAT      200CCTTCTGTGA CCTGTGACAG CCACTTAAGG TTGTGGGATG ACTACTACAA      250AATCCCAAAT AAAGTATATC CTAAAGGCTT TCTTTTCTTT TCTTTTCTTT      300TCTTTTCTTT TCTCTTCTCA TCTCTTGTCT TCTCTTCTTT TCTCCTCTCC      350CCTCCCCTCC CATCCCCTCT CCTCTCCTCT CCTTTCCTTG TTTTAAAAAC      400AATGTCTTGC TCTGTTGACC AGGCTGGAAT GCAGTTCTGT GATC            444(2)SEQ ID NO:20的信息:
(i)序列特征:
    (A)长度:321bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G212
(xi)序列描述:SEQ ID NO:20:GATCTCCTTC AGTGTACTCA GTGCATTCTC CATCTCTTAC ATAATCTGAC    50CTCCACTCTT CCTGGAAATG CATTTCTTTT TAGAGACAAG AGAAAAGGAA   100ATCCTTGTTG AGTCTAAATG CATTGAGANA NACTCCTGGA AAGATAAAAG   150TCCTCCAGGT TACCTTTAAN ACTTTCATTT CTCCTGCCAC CTGCTTGCTT   200TCTCTCTCTT TCTTTTCTTT TCTTCCTTTC TTTTCTTTTC TTTTCTTTTC   250TTTTCTTTTC TTTTCTTTTC TTTTCTTTCG ATGAGGCTTG CTGTATCACC   300CAGGCTGGAG TGCAATGACA T                                  321(2)SEQ ID NO:21的信息:
(i)序列特征:
    (A)长度:329bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G233
(viii)基因组中的位置
    (A)染色体/区段:10q
(xi)序列描述:SEQ ID NO:21:GATCGCTTGA GCCTTGGAGA TTGAGGCTAC GGTGAGCTAT GATTGCACCA    50CTGCACTCCA GCCTGGGTGA CAGAGTGAGA CCCTGGGAGA AAAAAAGAAA    100GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GAAAAGAAAA GTCNTGACCT    150TGGAAAAAAC CANAATTTCT GATGTTGTAC AACTCCTGAA TTCTGACTGC    200TCTCTCCNCN GAAAGANGGA ATNNNTGNTC CTTGGAGGAT TCNTACTAAT    250ATTCTTCGGT CNANACAAAA ACNTGACCTC NAGCCNAGAA AACAANATTN    300NNCCNTTCCA TAGAAAAGTT CAGGGGACA                           329(2)SEQ IDNO:22的信息:
(i)序列特征:
    (A)长度:412bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G234
(viii)基因组中的位置
    (A)染色体/区段:16qter
(xi)序列描述:SEQ ID NO:22:GGATCACGCC ATTGCACTCC ACTCTGGGCA ACAAGAGCAA AACTCCATCT   50CAGAAAAAAA GAAAGAAAGA AAGAAAGAAA GAGAGAAAAG AAAACAGAAA   100AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAA AGAAAAGAAC   150CCNNCAGAAA GCCAAGGCAA TGGGAACAAG CTGGGGCAAG TGCCTGGAGG   200TGTTGCTGGA AAGGCAGATA GGGCAGAGAG CACCTGGACT CTTCCAAAAC   250ATATTAGCAT CATGGTAAAG CCCTCAGCCC AAGTCCCCCA GAACATAGCC   300GTAGTCAACC AAGTTGAGAT TGATTACTAG CTTCCTGTNA CAAGGGAGAT   350TATNCNCACA CAAGTGCCAT CTGCCTCTCC CTTCACCCAG CTTGAGTTTC   400GCTTGTAGCA CT                                            412(2)SEQ ID NO:23的信息:
(i)序列特征:
    (A)长度:359bp
    (B)类型:核酸
    (C)链性:双链
    (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
    (A)文库:质粒,pGem3Zf(+)
    (B)克隆:G235
(viii)基因组中的位置
    (A)染色体/区段:2p
(xi)序列描述:SEQ ID NO:23:GATCACCAGG CCCCTGAGGA AGCAGCACAG AAAAACACAA ATAATATCAA   50TATCAGGCAG CCACAGGGGA AACAATGGGG CATTTCTCCG TGCTACATGC   100ATGCTGCTAT TGTTTCAAGG GCTGGGGAAT TAATTCCACT TATTTATTTA   150AGGCGTGTCA ACTCACTGCC TAAACCTGTT TCAGTGTCAA AATGGATAAA   200ACTTTTATGG CTCATAAAAT ANANCCATTC ATCTCAATGT TCTTTGTGGT   250GGGTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCTTTTTTC TTTTTTTTTC   300TGGCATACTG AGCTAAACCT CTGCTCTGAA ACGGTTACAT CTGAACCCAT   350TGCTGCTAT                                                359(2)SEQ ID NO:24的信息:
(i)序列特征:
     (A)长度:516bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
      (A)文库:质粒,pGem3Zf(+)
      (B)克隆:G331
(xi)序列描述:SEQ ID NO:24:GACTTTCCCA CCTTCTGATG TGGGCATTTA GTGCTATAAA TTTCCCTCTA 50AACACTGCTT TAGCTGTGTC CCANAGATTC TGGTATGTTG TGTCTTTGTT 100CTCATTGGTT TCAAAGAACT TATTTATTTC TGCCTTAATT TTGTTATTTA 150CCCAGTAGTC ATTCAGGAGA AGGTAGTTCA GTTTCCATGT AGTTGTGAAG 200TTTTGAGTGA GTTTCTTTCC TTTTCTTTTC TTTTCTTTTC TTTTCTTTTC 250CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT 300TTCTTTTGTT TGAGATGGAG TCTTACTCTG TCGCCAGTCT GGAGTGCAGT 350GGTGTCATCT CAGCTCGCTG CAACCTCCGC CTCCTGGGTT CAANAAATTC 400CTCTGCCTCA GCCTCCCAAG TAGCTGGGTT TACAGGCACA CACCACCACG 450CCCAGCTAAT TTTTTGTATT TTANTAAAGA CAGGGTTTCA CCATGTTGAC 500NAAAATGGTC TCGATC                                      516(2)SEQ ID NO:25的信息:
(i)序列特征:
     (A)长度:556bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G405
(xi)序列描述:SEQ ID NO:25:GATCTCACAT TCTTCCTCAG AATTCTTCTT GTTACCTCTG CAAAATTTCA   50TCCTTCAAAC TCAAAGCTCA TTATCTTTGG ACTCTGTGAC ACTCTTCTGA   100TTCTCATATC ACTTCTTGAT TTTCCTGCAT TTCCTCACTA ACTCTCAGCT   150CATAATCATA TAAAATCACT AAGACTCTTT TTATATTGTC ATGAAGCTCA   200GGTATTTTCA CAGATTGAAC CATTTCCCTG TAGACAGCAA TGCTCAACAT   250GAACCATTCA CATCCTTCTT CCAAAGCACA GACTCTTCTT GCCATCTGCG   300TCATGCCCAT GCTCATGTGC ATGGAGCCTG GTTCATTATC TTCCAAAATC   350AAGCTTCCCC CACTTGATTT CTCTTTTCTT TTCTTTCCTT TCCTTTCCTC   400TTTTCCTTTT CCCTTTCCCT TTCCTTACCT TTCCTTTCCT TTCCTTTCCT   450CTCCTCTTTT CTCTTTTCTT TTCTTTTCTT TTCTTTTCTT TTCCTTTCCT   500TTCNTTTCTT TTATTTGCAC CTCACTCTTG CCAAGGCTGG GATGGCAGTA   550ANCACG                                                   556(2)SEQ ID NO:26的信息:
(i)序列特征:
     (A)长度:335bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G475
(viii)基因组中的位置
     (A)染色体/区段:15q22.3
(xi)序列描述:SEQ ID NO:26:GATCACGCCA TTGCACTCCA GCCTGGGCGA CTGAGCAAGA CTCAGTCTCA    50AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA    100AAGAAAAGAA AATTGTAAGG AGTTTTCTCA ATTAATAACC CAAATAAGAG    150AATTCTTTCC ATGTATCAAT CATGATACTA AGCACTTTAC ACACATGTAT    200GTTATGTAAT CATTATATCA TGCATGCAAG GTAATGAGTA TTATTTTCCT    250CATTTTATAA AAGAGGAAAC TGATGTTTGA GGCTACTTTG CTTAAGACCG    300CAGAACTAGC AAAGGAAAAG AGAAGTGAAT GTATC                    335(2)SEQ ID NO:27的信息:
(i)序列特征:
     (A)长度:333bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:G539
(viii)基因组中的位置
     (A)染色体/区段:15q26.2
(xi)序列描述:SEQ ID NO:27:GATCGTGCCA CTGCACTCCA GCCTGGGCAA CAGAGTAAGA CTCAGTCTCC   50AAAAAAAAAA AAAGAAAGAA AGAAAAAGAA AGAAAGAAAG AAAGAAAGAA   100AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA AAGAAAAGAA   150AAGAAAAGAA AAAGAAAAAG AAAAAATAAA GAGGTGAACG GTACTGAACA   200GAAACTAAGA AGGCTGAGAG CCAACTCTGA GGTAACAGCT AGGAGCTGAA   250GCAGGAAAGC TAAAATCTGC CCCAGTCCCA TTGCTGATAG ACTCACCATT   300TACTAACAGA GAAACCATTC CTCCTTTTAG ATC                     333(2)SEQ ID NO:28的信息:
(i)序列特征:
     (A)长度:1011bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:质粒,pGem3Zf(+)
     (B)克隆:S023
(xi)序列描述:SEQ ID NO:28:CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA   50GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA   100CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG   150CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT   200CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT   250AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT   300GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG   350TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG   400CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA   450GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG   500AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT   550TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT   600GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG   650GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA   700CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA   750GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA   800CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC   850TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA   900CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG   950CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA   100OGCCCTGCTGT A                                            1011(2)SEQ ID NO:29的信息:
(i)序列特征:
     (A)长度:1011bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S071
(viii)基因组中的位置
     (A)染色体/区段:6q26-27
(xi)序列描述:SEQ ID NO:29:CTGTACTGAA TTACAGCCCC AAATCTGGGT CAACTGGGGA GAGACGACGA   50GGATTAGGGT TCCAAGGTGA AACTGTGCCA TTGCGCTCCA GCCTGGGCAA   100CAAGAATGAA ACTCTCTTAA AATAAAATAA AATAAAATAA AATAAAATAG   150CCTAAGGATG CATTTCTCAG AACTTATCCC TGTTGTTCAA TGATGTGTGT   200CTATACAGTG GGGCCATAAC TAAGACGTAT GTTGCCCAAG CTGGCAAGAT   250AGCTCTGACC TTCTCTTGGG CCCCTCATTT CCCCCAAACA CAGGTTGTCT   300GCAGTCTTGA CCAATGGCTG CCAGGGCATG GACTCCGCTG CAGGGGCCAG   350TGGGAGGCCC CAGCTCAGGC AAAAGCACAG GCAGATATTT CAGGAGTCTG   400CTAGGGCTGG CACTGAGGGC AGAGACAGAG GGGTCTCCCT GTCCTTTGGA   450GAACCTCACG CTGCAGAAAT TCCAGACTGA ACCTTGATAC CGAGTAGGGG   500AGGAGCTGTC TGCGGGTTTG AGCCTGCAGC AGGAGGAAGG ACGTGAACAT   550TTTATCAGCT TCTGGTATGG CCTTGAGCTG GTAGTTATAA TCTTGGCCCT   600GGTGGCCCAG GGCTACAGTC ATCCTAGCAG TCCCCGCTGA AGTGGAGCAG   650GTACAGTCAC AGCTGTGGGG ACAGCAATGC TGGCCAAGGG TCTTCCCCCA   700CGCTCAGTCC TGGTCAAAGG CTGCCAGACC TTTCTGAGTG CCCCCAGGGA   750GGGGCTGGGG CGTCTCAGGG TGCCCACTGG CGAGGGAGCT GGCATCTCCA   800CCCGCAGTCC TCGCCCCTTC AATGAGATCC CCTCTCCTGG TGACAATGGC   850TGGCTAAACC TGTACCATTT CTGGAGGGAG ACGGGCACAC ACAAAGTCCA   900CCTTCACCAT GTCCAGAATT TCCAGAAGTA TGGCCCGATT TACAGGTAAG   950CCTGGCAGAG GGTGGGAGCC GAAGGACAGG GAGGAGGAGG GGACTGGGTA   1000GCCCTGCTGT A                                             1011(2)SEQ ID NO:30的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S085
(viii)基因组中的位置
     (A)染色体/区段:22q11
(xi)序列描述:SEQ ID NO:30:AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT    50TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC    100AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT    150CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC    200CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT    250TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT    300GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG    350GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC    400CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC    450AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG    500CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA    550AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT    600TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG    650CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG    700CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT    750CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG    800GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT    850GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT    900ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA    950TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG    1000(2)SEQ ID NO:31的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:
     (B)克隆:S125
(viii)基因组中的位置
     (A)染色体/区段:22q11.2-qter
(xi)序列描述:SEQ ID NO:31:AGTCAAATGA CGGTCATAGT TTGGGTGATG GTCACGGCTC AGGTTCTTTT   50TTACACGTGC TTGCTTTGGT TGTTGTTGTT GTTCTTTGTT TTCTTGAGGC   100AGTATCTGGC TGTGTCTCCC AGGCTGGCGT GCAATGGCAG GATCATAGCT   150CACTGCAACC TCAAACTCCT GGCTGAAGCA ATCTTTGTGC CCTAGCCTCC   200CAAGTTGTTG GGATTACAGT CGTGCCCCAC CATGCCTGGC TAAGTTGTTT   250TTTGTTTTTT GTTTTTTTTT TTTTTTTCGA GACAGAGTTT TGCTCTTGTT   300GCCCAGGCCG GAGTGCAGTG GTGTGATCTT GGCTCTCTGC AACCTCCCGG   350GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC AAAGTGATGG GATTACAGGC   400CTGAGCCACT GTGCCTGGCC ACATGTGCTT TCCCATTCGG TCCTTGCAGC   450AGATCTTTGA GAGAGCTCAT TTGACACTCA GGAGATGCTT CTCTAACCTG   500CTCAGAATCA GGGCCCTGGG TATTCAGGGA GGTAGAGGGA GCAGACTGCA   550AAGCCAGTCG TGCTCCCATC GCTCCCACTT CTCTCTCCCT CTCCATGTTT   600TCTGTCTCCC CCACCCAGCC TAGGGCATTC CTCCCCCACA GTCCAGCCTG   650CATCTGGCAC AGTGTCACTG CTCAGCCCAG GGATACTCAC AGCCTGGGTG   700CCTGGCTCCT TTTTTCAGCT CATCAAACCA GGTAAAGGGA GGTTCAGATT   750CTGCCAACCA TTGACTCAAT TCATCCAAAT CTTCAATCAC TGGAATCCTG   800GGAGTGGCTG GATTTGAACC AGGACCTCTG AGTACTATTG CTAAGTAACT   850GGGGGTCTCA GTGAAAGAGA GAAAAGAGCT GATAGGCCTC TTCCTGTGTT   900ATCATGTCAG GCCATCTTTT GAAACTCTTT TCTGCAATGC TACTGAAGTA   950TTTATGCACG TGACCTGTGC TCTTCTGTCA GTCTAGGGGT GCTGGCTGAG   1000(2)SEQ ID NO:32的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S132
(viii)基因组中的位置
     (A)染色体/区段:22
(xi)序列描述:SEQ ID NO:32:GGTGTGACCT TATCCTCTCT GAACCTCAGT TTCCTCATCC GTAAAATGAA   50AAGCTGCTAG ATTGTTGTAA AAAAATTAAA TGGAATAGGC TAGGCGCGGT   100GGCTCACGCC TGTAATCCCA GCACTTTAGA AGGTCGAAGA GGGTGGATCA   150CTTGAGGTCA GGAGTTTTGA GACCAGCCTG GCCAACACGG TGAAACCCCA   200TCTCTACTAA AAATAAAAAA TTAGCTNGGG TGCGGTGGCT CACACCTGTA   250ATCCCAGCAC TTTGGGAGGC TGAGACGGGT GGATCACCTG AAGTCAGGAG   300TTCAAGGCCA GCCTGGGCAA CATGGTGAAA CCACGTCTCT ACTAAAAATA   350CAAAAATTAG CCAGGTGTGG TGGCACACGC CTGTAGTCCC AGCTACTTGG   400GAGGCTGAGG CGGAAGAATC GCTTGAACCC AGTAGGCAGA GGTTGCAGTG   450AGCCGAGATA AGAGTCACTG CACTCCAGCC TGGGTGACAG AGCAAGACTC   500CCTCTCAGAA AATAAAATAA AATAAAATAA AATAAAATAA AATAAAATAA   550AATAAAATTC TAAAAGGGCT GGCATTTGCC TAGCACTTAT ATGCCCAATA   600AGTAATAGCT ATCAATATCC CCACCCCTAC CACTGTGCTG AAATTTAGTT   650TCTTTTTGTC ACCCCCCATT AGACTTAAGG CAGAATTCTC ACCGTACTCC   700TCTGTAAATT TCTGGTTCCT GGCACATAGT TGGGTCTCAG TGAAACATGG   750TGAGTGAATG AGCAAATGCA AGGAATCTCC AGGCCATCTG GGAGCCCTCC   800CAGGCGGGTG AGTTCGGGAA ACTCATAGTC TGTCCTCAAT GGCCCACTGA   850AAGGTAGAGA GTTCTGGGTC CCACCTCCGC ACCCCCATCT CCTGACTCAC   900TGCTGAAAAA TAAATAAATA AATAAAATAA CACTTATCCG GAGCCTCCCA   950CATGCCTTGC CAGGACTGCA AGGAGCCCAG CAGAATGATG ACCGGCGTGC   1000(2)SEQ ID NO:33的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S136
(viii)基因组中的位置
     (A)染色体/区段:22q12-qter
(xi)序列描述:SEQ ID NO:33:CCACTACATA TCCCATACAG GCTAATCAAC ATGTCAAAGT TCACACAGTT   50ATTGTGTACC CCTGGGCTCA ATCTCAAGTG TTCTGGTTGG TCGTCCAAGG   100TTACTTTTTT TTTTTTTTTT TTTTTTTTGA GATGGAGTCT TGCTCTGTTG   150CCCAAGCTGG AGTGCAATGG CATGATCTTG GCTCACTGCA ACCTCCGCCT   200CCTGGGTTCA AGGGATTCTC CTGCCTCAGC CTCCTGAGTA GTTGGGATTA   250CAGGCATGCA CTACCATGCC TGGCTAATTT TTGTATTTTT AGTAGAGGTG   300GAGTTTCTCC ATGTTGTTCA GGCTGGTCTT GAACTCCCAA CCTCAGGCAA   350TCCACCTCGG CCTCCCAAAG TACTGGGGTT ACAGGCATGA GCCACTGCGC   400CTGGCCCAAG GTTACTTTTC ACTACATCTT CCTACCTGTA TCACTTACTG   450CCGTGTGTAT AACTTCCACA TTTTCTTTCT TTTCTTTTCT TTTCTTTTCT   500TTTCTTTTCT TTCTTTTCTT TCTTTCTTTC TTTCTCTCTC TTTCTCTCTC   550TCTTTCTCTC TGTCCCCTCC TTCCTTCTCC TTCCTTCTTC CTTCCTTCCT   600TCCTTTCCTT CCTTCCTTCC TTCTTTCAAC ACAGAGTCTC ACTCTGTCAC   650CTAGGCAGGA GTGCAGTGGC CCAGTCTCAG CTCACTGCAA CCTCCGCCTC   700CTGGGCTCAA GCAATTCTCT CACCTCAGCC TCCCGAGTAG CTGGGATTAC   750AGGCATGTGC CACCATACCC AGCTAATTTT TGTATTTTTA GTAGAGACGG   800GATTTCACCA TATTTTCCAA GCTGGTCTCG AACTCCTGAC CTCAAGGGAT   850CTGCCCGACT CAGCCTCCCA AACTGCTGGG ATCATAGGTG TGAGCCATCA   900TGCTTGGCCC ACACTTTCTA TGTTAATCTA ATTTAGATGA TTTAATCTAT   950ATACAGTTTC TATATTAATC TAATTTAGAT GACTTAATCT ATATACAACT   1000(2)SEQ ID NO:34的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S159
(viii)基因组中的位置
      (A)染色体/区段:21q22-qter
(xi)序列描述:SEQ ID NO:34:AAACCCCGTC TCTACTAAAA ATACAAAAGT TAGTTGAGCA TGGTGGCACG  50GGCCTGTAAT CCCACCTATA ATCCCACCTA CTCGGGAGGC TGAGGCAGGA  100GAATCGCTTG AACCCAGGAT GGGGCGATTG CAGTGAGCCG AGATCGTGCC  150ACTGCACTCC AGCCTGGGTG ACAGAGCGAG ACTCCATCTC AAAAAAAAAA  200AAAAAAAACA GAATCATAGG CCAGGCACAG TGGCTAATTG TACCTTGGGA  250GGCTGAGACG GGAGGATCGA GACCATCCTG GGCACCATAG TGAGACCCCA  300TCTCTACAAA AAAAAAAAAA AATTTTTTTT AAATAGCCAG GCATGGTGAG  350GCTGAAGTAG GATCACTTGA GCCTGGAAGG TCGAAGCTGA AGTGAGCCAT  400GATCACACCA CTACACTCCA GCCTAGGTGA CAGAGCAAGA CACCATCTCA  450AGAAAGAAAA AAAAGAAAGA AAAGAAAAGA AAAGAAAAGA AAAGAAAAGA  500AAAGAAAAGA AAAAACGAAG GGGAAAAAAA GAGAATCATA AACATAAATG  550TAAAATTTCT CAAAAAAATC GTTATGACCA TAGGTTAGGC AAATATTTCT  600TAGATATCAC AAAATCATGA CCTATTAAAA AATAATAATA AAGTAAGTTT  650CATCAAAACT TAAAAGTTCT ACTCTTCAAA AGATACCTTA TAAAGAAAGT  700AAAAAGACAC GCCACAGGCT AAGAGAAAGT ACTTCTAATC ACATATCTAA  750AAAAGGACTT GTGTCCAGAT TAAAGAATTC TTACACATCA ATAAGACAAC  800CCAATTAAAA ATCGGCAAAA GATTTGAAGA GATATTTAAC CAAAGAAAAC  850ATATAAATGT GTCCGGGCGC GATGGTAATC CCAGCACTTT GAGAGGCCGA  900GGCAGGCGGA TCACTTGAGG TCAGGAGTTT AGGACCAGTC TGGCCAACAT  950GGTGAAACCC TGTCTCTAAT AAAAATACAA AAATTAGCTG GGTGTGGTGG  1000(2)SEQ ID NO:35的信息:
(i)序列特征:
     (A)长度:1400bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S176
(viii)基因组中的位置
     (A)染色体/区段:7q21-7q22
(xi)序列描述:SEQ ID NO:35:CCATATGTTT GTTTCCTCTA CTACTGCTCC TCCCTGACCC TTAAGAAACA   50CTGCCATAGA GCCCTACAGC TTGATGGGAG AAGTCCTATC CCTTAGGCAT   100GGAAAGCTAT TAAGAATGTG AGAACTGTGT ATGAGGAAAC TAATTTAATA   150ATTCCTTAGA ATGGAACCAG TTGAAAATTT CCAGCTCCAC AAACTGAAGT   200GAAATCATTT TTTCTCCACT CCTTACTAGT AAATTTACTG TTCTATGTTA   250AAAGAAAAAA AAAATCAACC AGCATTTAAA TTATGGCAAC CTAAAATGTG   300TCCAGTATCT TAGAATAATT TCCCCACTGA CCTATTCCTC TGTAATAGTA   350AAACATATAC ACAAATGTTT ATAGCTACAT TAGTCATAAT AGCCGAAAGG   400TAAAAACAAC CCAAATGCCC ATCAACTAGA TAAATGTATT TAAAAAATAT   450GACCCAGGCG AGGTGGCTCA GGCCTGTAAT CCCAGCACTT TAGGAGGCTG   500AGGTGGGTGG ATGACCCAGG AGTTCAAGGC CAACCTGGTG AACATAGTGA   550GACCCCATCT CTACAAAACT AAAAATAAAA AATTAGCCAG ATGTTGTGGT   600GTACACCTGT AGTCCAAGCT ACTCAGGACG GTGAGGAAGG AAGATCACTT   650GAGCCCGGGA GTTTGAGGCT GCAGTGAGCT ATGATCACAC CATGGCACTC   700CAGCCTGGGC AAGAAAGTGA GACCAAATTA TTAAAAAAAA AAAAAAAAAA   750AAAAAAAAAA AAAAAACAGA AGAAGAAGCA CTGATGCATA GGCCATGAAT   800AAACTTTGTA AATATTATGC TAAGTAAAAG AAGCCAGAGA TGAAAATCAC   850ATATTGTAAT TGTATGACTC CATGTGTTTT TTTAAAAAGG TCCACACAGA   900AAAGCTATTA GTAGTTGCTC ACAGCTGGAA GGCAAGGAGG GCACGTAAGT   950GGGTGATAGC TATAGGACAC AAGGATTATT TCTGAAATGA TGAAAATGTT   1000CTAAAACCGT GGTAATGGTT TTACAACCCT GTGAATATAC TAAAAACTAC   1050TGAATTGTAT ACTTAAAATG GGTGAATTAG ACGGCATATG AATTATATAT   1100CAATAAAGGT ATTACCCAAG AAAAAGAATA CAGTATCTTC ATATTCTATA   1150TTCTCCTCTC TTAGCTTTAC TCAGATTTCA CCTCTGTCCA GTCACCTTTC   1200CACATTAACT CCAGGCAACT CCAAAAGTTA TTCTTCCTGC TTCATTCATC   1250CCCCAAATAA ATTACATTCA CTACTGCGAA GATAACTGGC CAGAAACTCA   1300ATTCCTGAAG TTCTGGCAAA TGGTTCCTAG ACTCCAAATG GAGCAGAATA   1350ATTTGCAACT GGGCTTAAAC ACGATTGTCT TTTTTAAGGC ATCCTCAGTT   1400(2)SEQ IDNO:36的信息:
(i)序列特征:
     (A)长度:1250bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S189
(viii)基因组中的位置
     (A)染色体/区段:22q11.2-qter
(xi)序列描述:SEQ ID NO:36:GTTGCTCTGG CGATTCGCAA CTCGAAAATG ACACTTACTA TTCAGCTAGA   50GATTAGAATC TCAAGCAGTA GGGCATTTTT TAATAAAAAA TTAAATTAAA   100AATAGATTTG CCATTGTCTG CTTAATAAAA CTAGTAGCTC TGCTGGCTTA   150GAGGGGAAAT AACATATTTC TTCGGATTTT TATATATTCA TCTGAGCAGT   200GCTAAAAAAT AAAACAAAGT TACTAATATT CATATCTTGA GCAATTGTAC   250ATTGCTTCTA ACTATACATT CAATCTCTCT GGCACATCCA CTGTGGCCCT   300GAGCAGCCAG TACAGGCTCT TCTACCAAAA CGAAGCAAGC CACTCCAAAA   350CCTGACGCGT GCAGGTGTCA CGAAACACCA GGTGCAGCTT GACAGATGTG   400AGCCAAATAA GGAAACATTC AGCCCAGCAC TGCCCAACAG TCATGATGTA   450TATTTTCTAC ATCTGTGCTC TAAAATATGG TGGCCACTAG CTGCAGGTGG   500CTATTGAGAC TAAGGAACTG TATTTTTAAT TTTATTTCAT TTCAACTCAT   550TTAAAGTAGC CACATGCCGC TAATGGCTAC TGATCTAGAG GGCAGCTGGG   600ATGTTACTCT TGAGAATGTC TCCAGCATTT TACCTGTTGC TCTCTCTCAC   650TCACATTTCC CATTCTAGCA CAAACAAAAC AAAACAAAAC AAAACAAAAC   700AAAACAAAAC AAAACAAAAA AACCACAACA CCTACAGTTC TCCAAACAGG   750GCATCTGTTT TGTTCCTCTG GGGGGGTCCT GTCTATGTTG TTCACGTGGC   800CCTGGATTTC CATACTCCTA GCCTTCCTGG AAGACATCCT TTTCATCCTC   850ACAACCCAAC CCAGGCTTTA TCTCTTCTGT GAAGCTGTCC TTGATTTTCC   900GTTCTATCTT CCCTGCTTGT GAATGGGTCA GCTCTCCTTC CCCACCGCCC   950TGTGCGTGTG AACATCTTTG TTCAGTATAC TGCAGTGGGT CGGGAGTATG   1000TCCCTTCCAG ACTGGAAGGC AGAGAGGGTG GCTGTAAGGA TTGGCACTTT   1050GGGCCAGGCA CAGTGCTCAT GCCTGTAATC CCAGCACTTT GGGAGGCTGA   1100GGCAGGAGAA TCGCCCGACC CCAGGAGACA GAGTTTGCAG TGAGACGAGA   1150TTGCACCACT GCACTCTAGC CTGAGGGATA GAGCAAGACT CCCTCTCAAA   1200AAAATAAATA AATAAATAAA TAAATAAATA AAAATAAAAA ATTAAAGAGG   1250(2)SEQ ID NO:37的信息:
(i)序列特征:
     (A)长度:1200bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S199
(viii)基因组中的位置
     (A)染色体/区段:6q21
(xi)序列描述:SEQ ID NO:37:TTTCATGTTC ACAGATTGGA TTAATATTGT TAAACTGTCC ATACTACCCA   50AAGCAATCCA TAGATTCAAT GCAACCCTGA TATAGTTTGA ATGTATGTAG   100GCACCAAAAT CTCATGTTGA ACTTTAATCC CCAGTGTTGG AGGTGGAGCC   150TGGTGTAAGA TGTTTAGATT ATGAAGGTGA ATCCCTCATG AACGGCTTGG   200GCCATCTGCT TGGTGATAAG TGAGCTCTTG TTCTGAGTTC ACATGAGATA   250CAGTCATTTA AAAGCCTGTG GTACCCAAAC TCTCTCTTGC TCTTGCTTCT   300GTTCACGCCA TGTGATATAC CTGCTATCCT TTGCCTTTGC CTTCTGCCAT   350GATTGGAAGC TTCCTGAGTC CTCCCCAGAA ACAGATGTAA CTATGCTTCC   400TGTACAGCCT GCAGAACCAA GAACAAACTG AAACTCTTTT GTTATAAATT   450GCCCAGGATT AGGTGGGTGT TTTGTTTTGT TTTGTTTTGT TTTGTTTTGT   500TTTTTGAGAT GGAGTCTCGC TCTGTCTCCC AGGCTGGAGT GCAATGATAC   550AATCTCGGCT CACTGCAACC TCCACCTCCC CGTTCAAGCA ATTCTCCTGC   600CTCAGCCTCC TGAGTAGCTG GGATTACAGG CGCACGCCAT CATGCCCGGC   650TAATTTTTGT ATTTTTAGTA GAGACGGGGT TTCACCACAT TGGTCAGGCT   700GGTCTCGAAC TCCTGACCTC ATGATCCACC CGCCTTGGCC TCCCAAAGTG   750CTGGGATTAC AGGCGTAAGC CACCATGCCC AGCCAGGTGG TTTTTTATAG   800TAGTGCAAGA ATGGCCGAAT ACAAACCCCT ATCAAAATAC CAATGACATT   850TGTCAGGGAC ATTTTTAAAA ATTCTGAAAT TTATATGGAA CCACAAAAGA   900CCCAGAATAG CCAAAACTAA CCTGAGCAAA AAGAACAAAC CTGGAAGAAT   950CACATTACCT GACTTCAAAG TGTACTACAG AGCTCTTATA ATCAAAACAT   1000CATGGTACTA GCATAACAAC AGACACATAG ACCAATGGAA CACAATAGAG   1050AACCCAGAAA CAAATCCATA CACCTACTGT GAACTCATTT TTGACAAAGG   1100TGCCAAGAAC ATACATGGGA GAAAGGACAG TATCTCCAAA TAAATGGTGC   1150TGAGAAAAGT GGATATACAT ATGCATAAGA ATGTAACTAG ACCCCTATCT   1200(2)SEQ ID NO:38的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S040
(xi)序列描述:SEQ ID NO:38:GCTGCAATAA ACACGGGAGT GTAGGTATCT TTAAAAGAAG GTGGTGATTT 1900CATCTCTTCT GGGTATGTAT CCAAAATAGG GTCACTGTTG GGTTATAAGG 1950TGGTTAGGTT TTGAATTTCT TTAGGAACCT CCATACTGTT TTCCATAATG 2000GGTGCACCAA TCATCATTCC CACCAACAAT GTACAAGTGT TTTATTTTCT 2050TCACACCCTC ATCAATATTT ATCTCTTGTC TTTTTTATAA TAGCCATCCT 2100AAAGACTGTA AGGCGTTTTA TTTCTAATCT CAGATTTCAC TGTAGAAACA 2150GTGATGACAC AGTCTCCAGC TTCCCTGTCT TTGTCTCTGG AGAAAAAAGC 2200CACCCTGACT TGCAGGGCCA GTCAGTGTTA GCAGCTACTA AGCCTGGTAC 2250CAGAAGAAAC CTGAGCGGGT TCCCAGGCTC CTCATCTATG GTACAGCCCT 2300GATTTGTGAT AGTGGGTCGG GGACAGGGCT TACTCTCACC ATCGGCAGCC 2350TGGAGCCTGG AGCCTGGAGA TTTGCACTTC ATCACTGTTA TCAGCATAGT 2400AGTTGGTGTC CCATACTGAT TCGACATGCA ACAAAAACCT CCAGGAGACC 2450TAAGGTGTTT ATTTGATTAT ACTACCTGCT TCCTTTTTAG TCATCTGATG 2500TGGTGCTGCT CAGTTTTAGC ATCTCTGCTT TGATTGGAAA TTCTGAGGTT 2550CTCAAAAGTA ATTCCTTATA ATATTTATAG TTTCACTCAT GGATTTTTTT 2600CTCAGACCCA AATGTACAGC CAGGTTCAGG CACAATTTCA TGGTCAAGGC 2650CATTGGATCA GACTCACATG AGTGGACGCC TCTAAAGGTC CTGGCCAGTG 2700CGATAAAGTA GCAGCGACAA TGATAAAGAA GAAGAATTAG AAAGGCAGAA 2750TTAAAGGTAT AACAATTCAC TGATGAAAGG ACTGTGTGGG GGAGAAATTT 2800CTAATTGTCT ACACAGAAAT TATTAGAATT AATGAGATAC ATAGCAAATT 2850(2)SEQ ID NO:39的信息:
(i)序列特征:
     (A)长度:1050bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
      (B)克隆:S066
(xi)序列描述:SEQ ID NO:39:GGGGCCTAGC CCAGTTGGAG GGACAAGAGC TGGAAACTGG GTTCCTTAGG   50GTGGTGCCAG AGTGGGCAGA GACCTCTGGG CAGCCCACGT CCAAGTCCAG   100AGCAAGGGGA GGCTCATCCT AGAAAAGAGG CCAGAGGAGC CATAACCACC   150ATTGTTCCTT GGGTTAAGGA GTCCTTTTTT AAAACCATCA AAACTAAGAA   200TCCAGTGCAT TATGAATCCA AGGGGTGAGG CTCAGTGTGC CAATGCCCCA   250GAACAGTCTA AGAAAGCTCC TTTTCCCTTT CCAGGCAGCT CGAGCTTTAC   300CTTCCCAAAT TCTCCATTGA GGGCTCCTAT CAGCTGGAGA AAGTCCTCCC   350CAGTCTGGGG ATCAGTAACG TCTTCACCTC CCATGCTGAT CTGTCCGGCA   400TCAGCAACCA CTCAAATATC CAGGTGTCTG AGGTGGGTTC AGAAGCTCCT   450ATGCATCTGC TTCCCAAGAT CTATTCTGTT CTATTCTTTC TATTCTACTC   500TACCCCATTT CATTCCATTC CATTCCACTC AACTCCACTC CACTCCACTC   550CACTCCAGTT CACTCTATTC AATTCCACTC CACTCCAGTT CACTCTATTC   600AATTCCACTC CACTCCACTC CAGTTCACTC TATTCAGTTC CACTCCACTC   650CACTCCACTC CACTCCAGTT CACTCTATTC CATTCCACTC CATTCCACTC   700CTCCACTCCT CTCATCCACT CCACTCTACT CCTCCACTCC ACATCTCCAC   750TCCACTCCTC CACTCCACTC CTCCACTCCA CTCATCCACT CCACTCCTCC   800ACTCCACTCC TCCACTCCAC TCCTCCACTC CACTCCACTC ATCCACTCCA   850CTCTTCCATT CCACTCCATT CCACTCCTCC ACTCCACTCT TCCACTCCAC   900TCCATTCCAC TCCTCCACTC CACTCCACTC TATTCTATTC TATTCCATTC   950CATTCTACTC TATTCTATTC CATTCCATTG CAGTCAACTC CACTCCACTC   1000TCTACTATTC TATTCCACTC CTCTCCCCTC CACTCCATTC CATTGCAGTC   1050(2)SEQ ID NO:40的信息:
(i)序列特征:
     (A)长度:4580bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:
     (B)克隆:S077
(xi)序列描述:SEQ ID NO:40:GGATCCCAAT TCATTCCGGG CTGACACGCT CACTGGCAGG CGTCGGGCAT   50CACCTAGCGG TCACTGTTAC TCTGAAAACG GAGGCCTCAC AGAGGAAGGG   100AGCACCAGGC CGCCTGCGCA CAGCCTGGGG CAACTGTGTC TTCTCCACCG   150CCCCCGCCCC CACCTCCAAG TTCCTCCCTC CCTTGTTGCC TAGGAAATCG   200CCACTTTGAC GACCGGGTCT GATTGACCTT TGATCAGGCA AAAACGAACA   250AACAGATAAA TAAATAAAAT AACACAAAAG TAACTAACTA AATAAAATAA   300GTCAATACAA CCCATTACAA TACAATAAGA TACGATACGA TAGGATGCGA   350TAGGATACGA TAGGATACAA TACAATAGGA TACGATACAA TACAATACAA   400TACAATACAA TACAATACAA TACAATACAA TACAATACAA TACAATACGC   450CGGGCGCGGT GGCTCATGCC TGTCATCCCG TCACTTTGGG ATGCCGAGGT   500GGACGCATCA CCTGAAGTCG GGAGTTGGAG ACAAGCCCGA CCAACATGGA   550GAAATCCCGT CTCAATTGAA AATACAAAAC TAGCCGGGCG CGGTGGCACA   600TGCCTATAAT CCCAGCTGCT AGGAAGGCTG AGGCAGGAGA ATCGCTTGAA   650CCTGGGAAGC GGAGGTTGCA GTGAGCCGAG ATTGCGCCAT CGCACTCCAG   700TCTGAGCAAC AAGAGCGAAA CTCCGTCTCA AAAATAAATA CATAAATAAA   750TACATACATA CATACATACA TACATACATA CATACATACA TAAATTAAAA   800TAAATAAATA AAATAAAATA AATAAATGGG CCCTGCGCGG TGGCTCAAGC   850CTGTCATCCC CTCACTTTGG GAGGCCAAGG CCGGTGGATC AAGAGGCGGT   900CAGACCAACA GGGCCAGTAT GGTGAAACCC CGTCTCTACT CACAATACAC   950AACATTAGCC GGGCGCTGTG CTGTGCTGTA CTGTCTGTAA TCCCAGCTAC   1000(2)SEQ ID NO:41的信息:
(i)序列特征:
     (A)长度:1000bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (A)文库:
     (B)克隆:S097
(xi)序列描述:SEQ ID NO:41:GGACATGAGG CTTCCCAGCC AACTGCAGGT GCACAACATA AATGTATCTG   50CAAACAGACT GAGAGTAAAG CTGGGGGCAC AAACCTCAGC ACTGCCAGGA   100CACACACCCT TCTCGTGGAT TCTGACTTTA TCTGACCCGG CCCACTGTCC   150AGATCTTGTT GTGGGATTGG GACAAGGGAG GTCATAAAGC CTGTCCCCAG   200GGCACTCTGT GTGAGCACAC GAGACCTCCC CACCCCCCCA CCGTTAGGTC   250TCCACACATA GATCTGACCA TTAGGCATTG TGAGGAGGAC TCTAGCGCGG   300GCTCAGGGAT CACACCAGAG AATCAGGTAC AGAGAGGAAG ACGGGGCTCG   350AGGAGCTGAT GGATGACACA GAGCAGGGTT CCTGCAGTCC ACAGGTCCAG   400CTCACCCTGG TGTAGGTGCC CCATCCCCCT GATCCAGGCA TCCCTGACAC   450AGCTCCCTCC CGGAGCCTCC TCCCAGGTGA CACATCAGGG TCCCTCACTC   500AAGCTGTCCA GAGAGGGCAG CACCTTGGAC AGCGCCCACC CCACTTCACT   550CTTCCTCCCT CACAGGGCTC AGGGCTCAGG GCTCAAGTCT CAGAACAAAT   600GGCAGAGGCC AGTGAGCCCA GAGATGGTGA CAGGGCAATG ATCCAGGGGC   650AGCTGCCTGA AACGGGAGCA GGTGAAGCCA CAGATGGGAG AAGATGGTTC   700AGGAAGAAAA ATCCAGGAAT GGGCAGGAGA GGAGAGGAGG ACACAGGCTC   750TGTGGGGCTG CAGCCCAGGA TGGGACTAAG TGTGAAGACA TCTCAGCAGG   800TGAGGCCAGG TCCCATGAAC AGAGAAGCAG CTCCCACCTC CCCTGATGCA   850CGGACACACA GAGTGTGTGG TGCTGTGCCC CCAGAGTCGG GCTCTCCTGT   900TCTGGTCCCC AGGGAGTGAG AAGTGAGGTT GACTTGTCCC TGCTCCTCTC   950TGCTACCCCA ACATTCACCT TCTCCTCATG CCCCTCTCTC TCAAATATGA  1000(2)SEQ ID NO:42的信息:
(i)序列特征:
     (A)长度:1144bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S103
(xi)序列描述:SEQ ID NO:42:CTCTGACTCT CCGCGGTGGT TGTTGGGGCT TCTTGGCTTT GTTTTGTTGT   50TTGTTTGTAT TTTATTTTTT TCTCTCTGAC ACCTATTTTA GACAAATCTA   100AGGGAAAAAG CCTTGACAAT AGAACATTGA TTGCTGTGTC CAACTCCAGT   150ACCTGGAGCT TCTCTTTAAC TCAGGACTCC AGCCCATTGG TAGACGTGTG   200TTTCTAGAGC CTGCTGGATC TCCCAGGGCT ACTCACTCAA GTTCAAGGAC   250CAACAAGGGC AGTGGAGGTG CTGCATTGCC TGCGGTCAAG GCCAGCAAGG   300TGGAGTGGAT GCCTCAGAAC GGACGAGATA ATGTGAACTA GCTGGAATTT   350TTTATTCTTG TGAATATGTA CATAGGCAGC ACTAGCGACA TTGCAGTCTG   400CTTCTGCACC TTATCTTAAA GCACTTACAG ATAGGCCTTC TTGTGATCTT   450GCTCTATCTC ACAGCACACT CAGCACCCCC TTCTCTGCCC ATTCCCCAGC   500CTCTCTTCCT ATCCCATCCC ATCCCATCCC ATCCCATCCC ATCCCATCCC   550GCTCTTTTCC TACTTTTCCT TCCCTCAAAG CTTCCATTCC ACATCCGGAG   600GAGAAGAAGG AAATGAATTT CTCTACAGAT GTCCCATTTT CAGACTGCTT   650TAAAAAAAAT CCTTCTAATC TGCTATGCTT GAATGCCACG CGGTACAAAG   700GAAAAAGTAT CATGGAAATA TTATGCAAAT TCCCAGATTT GAAGACAAAA   750ATACTCTAAT TCTAACCAGA GCAAGCTTTT TTATTTTTTA TACAGGGGAA   800TATTTTATTC AAGGTAAAAT TCTAAATAAA ATATAATTGT TTTTTATCTT   850TTCTACAGCA AATTTATAAT TTTAAGATTC CTTTTCTTGT TTATCAGCAG   900TTGTTATTAC ATCCTTGTGG CACATTTTTT TTTAATTTTG TAAAGGTGAA   1000AAAAGCTTTT ATGAGCTCAT CTAGCAATCA GATTTTCCTG TGGA         1144(2)SEQ ID NO:43的信息:
(i)序列特征:
     (A)长度:1366bp
     (B)类型:核酸
     (C)链性:双链
     (D)拓扑学:环状
(ii)分子类型:基因组DNA
(iii)假设:否
(iv)立即来源:
     (B)克隆:S110
(xi)序列描述:SEQ ID NO:43:GGAATTCAAT GGAATATAAC GAAATGGATA GGATCAGAAC GGAACAGAGC   50GGAGTGGAGT TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAT   100AGAATGGAAT GGAATGCAGT GGAGTGGAAT GGAATGAAGT GGAATGGAGT   150TGAGTGGAGT GGATCGGAGT GCAGTGGAAA GGAATGGAAG AGAATGGAAT   200GGAATGGAAT GCAGTGGACT GGAATGGAAT GGAGTGGAGT GGAGTGCAGT   250GGGAATCGAG TGGAGTGGAG TGGAATGGAC TGGAATGGAA TGGATTGGAG   300TGGAGTGCAG TGGAATCGAG TGGAGTGGAG TGGAATGGAG TAGAATGGAA   350TGGAGTGGAG TGTAGTGGAA TGGAATGGAA TGGTGAATGA ATGTCAGCTA   400AGATTGTGCA ACTGCATTCC AGTCTGGGTG ACAAAGTGAG ATCCAGTCGA   450AGTAAAGGAA TGGAATGGAA TAGAGTAAAA TGGAATGGAA TGGTGTGGAG   500TGGAATGGAA TGGAGAGGAA TGGAGTGGAG TGGAGTGGAG TGGAGTGGAA   550TGGAGTGGAG TGGAATGGAG AGTGATGGAG AGGAATGGAA TGGAATGGAA   600TGGAATGGAG TGGAATGGAA TGGAATGGAG TGGAATGGAA TGGAATGTAG   650AGGAGTGGAG TGGATTGGAG TGGAGTGGAA TGGAGTGGAA TAGAGTGAAA   700TTTAGTGGAG TGTAATGGAG TGGAGTGGAG TGGCAGTTGA GTGGCATGGA   750TCAGGTGCAG TGGAATGGAA TGGAATGGAG TGGAGTGGAG AGGAGTGGAG   800TGGAATCGAA TGGAATGGCA TGGAGTGGAG TGGAATGGAG TGGATTGGAA   850TTGAATGCAG TGGAATGGAA TGCAATGGAG TGGAGTGGAG TGCAGTGGAG   900TGGAGTGGAG GGGAATGGAA TGGAGTGGAG TAAAATGGTT TGGAATGGAG   950TGGGGTGGAA TGGAGTGGGT TGGAATGGAG TGGAGTGGAG TAGAACGGAG   1000TGATTGGGGT GGAATGGAAT AGAGTGGAAT GGAATGGAGT GGAGTGGAGT   1050AGAACGGAGT GATTGGAGTG GAATGGAATA CAGTAGAGTG GAATGCAGTG   1100GAGTGGAATG GAATGGAGTG GAGTGGCATG GAAAGGAATG GAGAGGAATG   1150GAATGGAATG GAATGGAATG GAATGGAATG GAATGGAATG GAACGGTGAA   1200ATAAAATGTG AGTTAAGATT GTGCCACTGC ATTGCAGTCT GGGGGACAGA   1250GTGAGATACA GTCGAAATAA AGGAATGGAA GGGACTGGAG TAGAATGGAA   1300TGGAATTGAG TGGAGTGGAA TGGAATGAAG TGGAGAGGAA TGGAATGGAG   1350TGGAATGCAA TGGAGG                                        1366(2)SEQ ID NO:44的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:44:TGGCTCAGAC ACCTCATTG                                     19(2)SEQ ID NO:45的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:45:CACCACTGTA TTCCCAGTTT G                                  21(2)SEQ ID NO:46的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:46:CACTTGCCAT CCCTGCCACA CA                                    22(2)SEQ ID NO:47的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:47:AGCGCACCCC CAATTTCCGG TAT                23(2)SEQ ID NO:48的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:48:TGGGGACATG AACACACTTT GC                             22(2)SEQ ID NO:49的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:49:GAGGCCCAGG ACCAGATGAA AT                                    22(2)SEQ ID NO:50的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQID NO:50:CACCTGTCAG GCAAGGCTTA AAC                          23(2)SEQ ID NO:51的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:51:CAACACTGAG CGCTTTTAGG GACT                         24(2)SEQ ID NO:52的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:52:TCAGGCAAGG CTTAAACAGG GATA                         24(2)SEQ ID NO:53的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:53:ACACTGAGCG CTTCTAGGGA CTTC                         24(2)SEQ ID NO:54的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:54:TGAGCGCTTC TAGGGACTTC TTCA                          24(2)SEQ ID NO:55的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:55:CCCTGCCCTA CCCACTTG                                 18(2)SEQ ID NO:56的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:56:AGGCCCAGGA CCAGATGA                                 18(2)SEQ ID NO:57的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:57:GCACCTGTCA GGCAAGGCTT AAAC                          24(2)SEQ ID NO:58的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:58:CCAGCCATGA AGTGGCTGTG AG                          22(2)SEQ ID NO:59的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:59:CCCGCTTCAA AGTTCCCAGT TC                          22(2)SEQ ID NO:60的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:60:CCTCCCATTT CAGCCTCCTG A                           21(2)SEQ ID NO:61的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:61:GTCTGCCACA GTGCTGGAAA CTAA                        24(2)SEQ ID NO:62的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:62:GCACCCCAGC CTAAGGCAAT A                           21(2)SEQ ID NO:63的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:63:GCATGGCGGA AGAAACAA                          18(2)SEQ ID NO:64的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:64:TGGCAACAGA GCGAGACTC                         19(2)SEQ ID NO:65的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:65:CCTGGGTGAC AGCGAGAATC T                      21(2)SEQ ID NO:66的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:66:TGTCCCTTGC CTTGTCTCAC TAAA                   24(2)SEQ ID NO:67的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:67:CAGCCTTGGT GACAGAGCAA A                         21(2)SEQ ID NO:68的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:68:TGTGTTGAGG GTGGGGTACA T                         21(2)SEQ ID NO:69的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:69:CCTGGGCAAG AGAGCAAG                             18(2)SEQ ID NO:70的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:70:CACATCCCAA AACCACCCTA C                         21(2)SEQ ID NO:71的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:71:GCATTTCCCC TGCTTGTACT                           20(2)SEQ ID NO:72的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:72:GATCACATTT GCTAACCACT TCTC                      24(2)SEQ ID NO:73的信息:
(i)序列特征:
     (A)长度:26
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:73:GGCAACATAT CAAGACCCCC ATCTCT                    26(2)SEQ ID NO:74的信息:
(i)序列特征:
     (A)长度:26
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:74:GAAGCTGCCC CTCACCACTA CATTTT                    26(2)SEQ ID NO:75的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:75:GATCACATTT GCTAACCACT TCTC                      24(2)SEQ ID NO:76的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:76:TATAAATTAC CCAGTCTCAG GAAG                     24(2)SEQ ID NO:77的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:77:GTGATACAGC AAGCCTCATC                          20(2)SEQ ID NO:78的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:78:AGAGACTCCT GGAAAGATAA AAGT                     24(2)SEQ ID NO:79的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:79:GTCTGGAGAA CAGTGGCCCT TGT                      23(2)SEQ ID NO:80的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:80:CAGGAAGCTG AGGCAGGAGA ATCT                    24(2)SEQ ID NO:81的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:81:AAGGCTCCAG TGGGGTAT                           18(2)SEQ ID NO:82的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:82:AAAACAAGGC AGTAGTCAAT AAAG                     24(2)SEQ ID NO:83的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:83:GGCATGAGAA TCGCTTGAAC CTG(2)SEQID NO:84的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:84:GGCCTCCATG ATGTTTCCAA TGAT                     24(2)SEQ ID NO:85的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:85:TCAGGAGGCA TGAGAATCGC TTGA                 24(2)SEQ ID NO:86的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:86:GGCCTCCATG ATGTTTCCCA ATGA                 24(2)SEQ ID NO:87的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:87:CTCGCCCTCT CCTATAAGCA GTTT                 24(2)SEQ ID NO:88的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:88:GCAGAGATAA TTTGGAGTGG GATG                 24(2)SEQ ID NO:89的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:89:CTTGGGTGCC TGTAATCC                     18(2)SEQ ID NO:90的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:90:GGTAGAGCTC CCCCATCT                     18(2)SEQ ID NO:91的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:91:GCAGAATATT GGGGCTCATC AC                22(2)SEQ ID NO:92的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:92:AAACAAGGAA AGGAGAGGAG AGGA              24(2)SEQ ID NO:93的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:93:AAGGTTGTGG GATGACTACT ACA              23(2)SEQ ID NO:94的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:94:TGGTCAACAC AGCAAGACAT T                     21(2)SEQ ID NO:95的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:95:TCCTGCCACC TGCTTGCTTT CT                    22(2)SEQ ID NO:96的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:96:ATTGCACTCC AGCCTGGGTGA TAC                  23(2)SEQ ID NO:97的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:97:CGCTTGAGCC TTGGAGATTG                       20(2)SEQ ID NO:98的信息:
(i)序列特征:
     (A)长度:24
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:98:GAGCAGTCAG AATTCAGGAG TTGT                  24(2)SEQ ID NO:99的信息:
(i)序列特征:
      (A)长度:24
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:99:TGGGCAACAA GAGCAAAACT CCAT                   24(2)SEQ ID NO:100的信息:
(i)序列特征:
      (A)长度:23
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:100:GGGACTTGGG CTGAGGGCTT TAC                   23(2)SEQ ID NO:101的信息:
(i)序列特征:
      (A)长度:24
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:101:ATATCAATAT CAGGCAGCCA CAGG                  24(2)SEQ ID NO:102的信息:
(i)序列特征:
      (A)长度:23
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:102:CCGTTTCAGA GCAGAGGTTT AGC                   23(2)SEQ ID NO:103的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:103:TCTCATTGGT TTCAAAGAAC TTA                   23(2)SEQ ID NO:104的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:104:AGACTCCATC TCAAACAAAA GA                    23(2)SEQ ID NO:105的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:105:TCATGTGCAT GGAGCCTGGT TCAT                  24(2)SEQ ID NO:106的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:106:CCCAGCCTTG GCAAGAGTGA GGT                   23(2)SEQ ID NO:107的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:107:GGCGACTGAG CAAGACTC                          18(2)SEQ ID NO:108的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:108:TTAAGCAAAG TAGCCTCAAA CA                     22(2)SEQ ID NO:109的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:109:GGGCGACTGA GCAAGACTC                         19(2)SEQ ID NO:110的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:110:ACTCATTACC TTGCATGCAT GATA                   24(2)SEQ ID NO:111的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:111:CATTACCTTG CATGCATGAT A                      21(2)SEQ ID NO:112的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:112:TGGGCAACAG AGTAAGACTC A                      21(2)SEQ ID NO:113的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:113:GTTCAGTACC GTTCACCTCT TTA                    23(2)SEQ ID NO:114的信息:
(i)序列特征:
     (A)长度:30
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:114:GTAAGACTCA GTCTCCAAAA AAAAAAAAAG             30(2)SEQ ID NO:115的信息:
(i)序列特征:
     (A)长度:38
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:115:AGGAATGGTT TCTCTGTTAG TAAATGGT             38(2)SEQ ID NO:116的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:116:CAGCCTGGGC AACAAGAATG AAAC                 24(2)SEQ ID NO:117的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:117:TGGCCCCTGC AGCGGAGTC                       19(2)SEQ ID NO:118的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:118:GAATTCATTT GCGGAAAGAT T                    21(2)SEQ ID NO:119的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:119:CTAGGGAGGC TGGAGTATTC A                   21(2)SEQ ID NO:120的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:120:AGAGCAAGAC CCCGTCTCAT                       20(2)SEQ ID NO:121的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:121:AGTCCATGGG CCTTTTAACA                       20(2)SEQ ID NO:122的信息:
(i)序列特征:
     (A)长度:23
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(ii)分子类型:寡核苷酸ssDNA
(iii)假设:否
(iv)立即来源:
     (B)扩增的克隆:S125
(xi)序列描述:SEQ ID NO:122:GAGAATCACT TGAACCCAGG AAG                   23(2)SEQ ID NO:123的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:123:AGAACCAGCT GTTAGTTTCG TTGA                  24(2)SEQ ID NO:124的信息:
(i)序列特征:
     (A)长度:25
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:124:GGTTGCAGTG AGCCGAGATA AGAGT                    25(2)SEQ ID NO:125的信息:
(i)序列特征:
     (A)长度:25
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:125:TGTGCCAGGA ACCAGAAATT TACAG                    25(2)SEQ ID NO:126的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:126:GGCCCAAGGT TACTTTTCAC                          20(2)SEQ ID NO:127的信息:
(i)序列特征:
     (A)长度:16
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:127:GGGCCACTGC ACTCCT                              16(2)SEQ ID NO:128的信息:
(i)序列特征:
     (A)长度:22
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:128:CATGGTGAGG CTGAAGTAGG AT                       22(2)SEQ ID NO:129的信息:
(i)序列特征:
    (A)长度:25
    (B)类型:核酸
    (C)链性:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:129:GTGGCGTGTC TTTTTACTTT CTTTA                    25(2)SEQ ID NO:130的信息:
(i)序列特征:
    (A)长度:18
    (B)类型:核酸
    (C)链性:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:130:AGGCAGCCCA GGAACAAT                           18(2)SEQ ID NO:131的信息:
(i)序列特征:
    (A)长度:22
    (B)类型:核酸
    (C)链性:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:131:CCAAGATAGC GGCCAAGATA GT                      22(2)SEQ ID NO:132的信息:
(i)序列特征:
    (A)长度:24
    (B)类型:核酸
    (C)链性:单链
    (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:132:GAGGGCAGCT GGGATGTTAC TCTT                  24(2)SEQ ID NO:133的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:133:TGCCCTGTTT GGAGAACTGT AGGT                  24(2)SEQ ID NO:134的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:134:CTCCCCAGAA ACAGATGTA                        19(2)SEQ ID NO:135的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:135:GTGAGCCGAG ATTGTATCAT                       20(2)SEQ ID NO:136的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:136:TCGGGGACAG GGCTTACTC                        19(2)SEQ ID NO:137的信息:
(i)序列特征:
     (A)长度:24
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:137:ATCATTGTCG CTGCTACTTT ATCG                   24(2)SEQ ID NO:138的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:138:CTACTCTACC CCATTTCATT C                      21(2)SEQ ID NO:139的信息:
(i)序列特征:
     (A)长度:19
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:139:GTAGAGTGGAG TGGATGAGA                       19(2)SEQ ID NO:140的信息:
(i)序列特征:
     (A)长度:21
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:140:ATCAGGCAAA AACGAACAAA C                     21(2)SEQ ID NO:141的信息:
(i)序列特征:
     (A)长度:17
     (B)类型:核酸
     (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:141:CGGCATCCCA AAGTGAC                        17(2)SEQ ID NO:142的信息:
(i)序列特征:
      (A)长度:23
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:142:CAGAGAGGGCA GCACCTTGGA CAG                23(2)SEQ ID NO:143的信息:
(i)序列特征:
      (A)长度:23
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:143:GGCTTCACCT GCTCCCGTTT CAG                 23(2)SEQ ID NO:144的信息:
(i)序列特征:
      (A)长度:22
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:144:TCTGCCCATT CCCCAGCCTC TC                  22(2)SEQ ID NO:145的信息:
(i)序列特征:
      (A)长度:24
      (B)类型:核酸
      (C)链性:单链
      (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:145:TACCGCGTGG CATTCAAGCA TAGC                24(2)SEQ ID NO:146的信息:
(i)序列特征:
     (A)长度:18
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:146:TCCAGTCTGG GTGACAAA                       18(2)SEQ ID NO:147的信息:
(i)序列特征:
     (A)长度:20
     (B)类型:核酸
     (C)链性:单链
     (D)拓扑学:线性
(xi)序列描述:SEQ ID NO:147:CAATCCACTC CACTCCTCTA                     20

Claims (34)

1.一种用杂交选择分离含有中度串联重复序列的DNA片段的方法,包括以下步骤:
(a)提供多个DNA片段,其中至少一个片段含有一中度串联重复序列,中度串联重复序列是该DNA片段的一区域,其含有至少一个由串联重复至少2次的5,6或7个碱基的序列组成的重复单位;
(b)提供一固定支持物,其结合至少一个寡核苷酸,其中该寡核苷酸包括互补于所述中度串联重复序列的一部分的核苷酸序列;
(c)在一定条件下组合该多个DNA片段和支持工具,其中包括含有中度重复序列的DNA片段的DNA片段与支持工具杂交。
2.权利要求1的方法,其中步骤(a)提供的多个DNA片段是由下述附加步骤产生的富集的DNA片段群,所述步骤包括:
将DNA样品片段化,从而产生DNA片段群,其中至少一个DNA片段含有中度串联重复序列;
将含引导序列的接头与DNA片段群每个DNA片段的至少一个末端连接;
用含互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。
3.权利要求2的方法,其中DNA样品是双链的,且是用至少一个限制性内切酶片段化的。
4.权利要求3的方法,其中双链的DNA样品是用限制酶MboI片段化的,且其中接头是MboI接头,该MboI接头为一双链DNA分子,该DNA分子具有互补于MboI消化的DNA片段每个末端的突出端序列的单链突出端核苷酸序列。
5.权利要求4的方法,其中接头是式(I)的双链DNA分子:
5’-pGCGGTACCCGGGAAGCTTGG                   (I)
     CGCCATGGGCCCTTCGAACCCTAG-5’
其中A,G,C和T代表核苷酸,其中p表示DNA链的磷酸化5’末端。
6.权利要求1的方法,包括释放与步骤(c)中支持工具杂交的DNA片段的附加步骤。
7.权利要求6的方法,还包括以下步骤:
将每个释放自支持工具的DNA片段克隆入DNA载体中,
用克隆的载体转化宿主细胞,
鉴别含有靶克隆载体的转化体,该载体含有中度串联重复序列,和
从转化体中释放靶克隆载体。
8.权利要求1的方法,其中步骤(b)提供的支持工具包括直接与寡核苷酸偶联的物质,其中该物质选自硝基纤维素,尼龙,玻璃,二氧化硅和乳胶。
9.权利要求1的方法,其中步骤(b)提供的支持工具包括间接与寡核苷酸偶联的物质,其中第一个偶联剂与寡核苷酸结合,第二个偶联剂与固定支持物表面结合,其中第一个偶联剂和第二个偶联剂是亲和素和链亲和素,或抗体和抗原。
10.权利要求1的方法,其中步骤(b)中提供的支持工具包括至少两个不同寡核苷酸的混合物。
11.权利要求1的方法,其中中度串联重复序列是五核苷酸串联重复序列。
12.一种用杂交选择分离含有五核苷酸中度串联重复序列的DNA片段的方法,包括以下步骤:
(a)提供多个双链DNA片段,其中至少一个DNA片段含有五核苷酸串联重复序列,五核苷酸串联重复序列是该DNA片段的一区域,其含有至少一个由串联重复至少2次的5个碱基的序列组成的重复单位;
(b)提供一支持工具,其结合至少一个寡核苷酸,其中该寡核苷酸包括互补于所述中度串联重复序列的一部分的核苷酸序列;
(c)在一定条件下组合该多个DNA片段和支持工具,其中含有五核苷酸串联重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。
13.权利要求12的方法,其中步骤(a)提供的多个DNA片段通过以下步骤产生:
将双链的DNA样品用限制酶片段化,从而产生多个DNA片段,其中至少一个DNA片段含有五核苷酸串联重复序列;
将含引导序列的接头与多个DNA片段中的每个DNA片段的至少一个末端连接;
用包括互补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。
14.权利要求12的方法,还包括以下步骤:
释放与支持工具杂交的DNA片段;和
用寡核苷酸引物扩增释放自支持工具的片段,该引物是用于在与支持工具杂交前扩增每个接头连接的片段的引物。
15.权利要求14的方法,还包括以下步骤:
将每个扩增的释放自支持工具的DNA片段克隆入DNA载体中,
用克隆的载体转化宿主细胞,
鉴别含靶克隆载体的转化体,该载体含有中度串联重复序列,和
从转化体中分离靶克隆载体。
16.权利要求12的方法,其中步骤(b)中提供的支持工具包括至少二种不同寡核苷酸的混合物。
17.检测具有低打滑假象出现率的靶中度串联重复DNA序列的方法,包括以下步骤:
(a)提供具有至少一个靶中度串联重复序列的DNA样品,其中靶中度串联重复序列是含有至少一个重复单位的DNA区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成;
(b)检测DNA样品中靶中度串联重复序列,其中观测到平均打滑假象不超过2.4%。
18.权利要求17的方法,其中靶中度串联重复序列是完全中度串联重复序列。
19.权利要求17的方法,其中靶中度串联重复序列是不完全中度串联重复序列。
20.权利要求17的方法,其中步骤(a)提供的DNA样品是人基因组DNA。
21.权利要求17的方法,其中步骤(a)提供的DNA样品的靶中度串联重复序列在步骤(b)之前扩增。
22.权利要求21的方法,其中靶中度串联重复序列用至少一个寡核苷酸引物扩增,该引物包括互补于并位于双链DNA标记的含有模板中度串联重复序列的区域的侧翼的序列,其中模板中度串联重复序列是含有至少串联重复2次的重复单位序列的DNA标记的区域,条件是DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43。
23.权利要求22的方法,其中用于扩增靶中度串联重复序列的寡核苷酸引物具有与其共价附着的荧光标记。
24.权利要求17的方法,通过将检测的靶中度串联重复序列与DNA大小标记中已知长度的片段相对比,在步骤(b)中观测到打滑假象。
25.权利要求24的方法,其中观测到不超过1.1%的平均打滑。
26.一种检测DNA样品中至少一个靶中度串联重复序列的方法,其中靶中度串联重复序列是含至少一个重复单位的DNA样品的一区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成,此方法包括以下步骤:
(a)提供至少一个寡核苷酸引物,该引物包括互补于并位于DNA标记的含有模板中度串联重复序列的区域的侧翼的核苷酸序列,其中DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ IDNO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ IDNO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13, SEQID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43;
(b)提供一含有靶中度串联重复序列的DNA样品;
(c)用所述的至少一个寡核苷酸引物扩增DNA样品的靶中度重复序列;和
(d)检测扩增的靶中度串联重复序列中的多态性。
27.权利要求26的方法,其中步骤(b)中提供的DNA样品是人基因组DNA样品。
28.权利要求26的方法,其中靶中度串联重复序列是完全中度串联重复。
29.权利要求26的方法,其中靶中度串联重复序列是不完全中度串联重复。
30.权利要求26的方法,其中步骤(a)中提供的寡核苷酸引物包括选自如下一组的序列:
SEQ ID NO:44和SEQ ID NO:45,当DNA标记序列是SEQ IDNO:1时;
SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,当DNA标记序列是SEQ ID NO:2时;
SEQ ID NO:59,SEQ ID NO:60,当DNA标记序列是SEQ IDNO:3时;
SEQ ID NO:61,SEQ ID NO:62,当DNA标记序列是SEQ IDNO:4时;
SEQ ID NO:63,SEQ ID NO:64,当DNA标记序列是SEQ IDNO:5时;
SEQ ID NO:65,SEQ ID NO:66,当DNA标记序列是SEQ IDNO:6时;
SEQ ID NO:67,SEQ ID NO:68,当DNA标记序列是SEQ IDNO:7时;
SEQ ID NO:69,SEQ ID NO:70,当DNA标记序列是SEQ IDNO:8时;
SEQ ID NO:71,SEQ ID NO:72,当DNA标记序列是SEQ IDNO:9时;
SEQ ID NO:73,SEQ ID NO:74,当DNA标记序列是SEQ IDNO:10时;
SEQ ID NO:75,SEQ ID NO:76,当DNA标记序列是SEQ IDNO:11时;
SEQ ID NO:77,SEQ ID NO:78,当DNA标记序列是SEQ IDNO:12时;
SEQ ID NO:79,SEQ ID NO:80,当DNA标记序列是SEQ IDNO:13时;
SEQ ID NO:81,SEQ ID NO:82,当DNA标记序列是SEQ IDNO:14时;
SEQ ID NO:83,SEQ ID NO:84,当DNA标记序列是SEQ IDNO:15时;
SEQ ID NO:85,SEQ ID NO:86,当DNA标记序列是SEQ IDNO:16时;
SEQ ID NO:87,SEQ ID NO:88,当DNA标记序列是SEQ IDNO:17时;
SEQ ID NO:89,SEQ ID NO:90,当DNA标记序列是SEQ IDNO:18时;
SEQ ID NO:91,SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,当DNA标记序列是SEQ ID NO:19时;
SEQ ID NO:95,SEQ ID NO:96,当DNA标记序列是SEQ IDNO:20时;
SEQ ID NO:97,SEQ ID NO:98,当DNA标记序列是SEQ IDNO:21时;
SEQ ID NO:99,SEQ ID NO:100,当DNA标记序列是SEQ IDNO:22时;
SEQ ID NO:101,SEQ ID NO:102,当DNA标记序列是SEQ IDNO:23时;
SEQ ID NO:103,SEQ ID NO:104,当DNA标记序列是SEQ IDNO:24时;
SEQ ID NO:105,SEQ ID NO:106,当DNA标记序列是SEQ IDNO:25时;
SEQ ID NO:107,SEQ ID NO:108,SEQ ID NO:109,SEQ IDNO:110,SEQ ID NO:111,当DNA标记序列是SEQ ID NO:26时;
SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ IDNO:115,当DNA标记序列是SEQ ID NO:27时;
SEQ ID NO:116,SEQ ID NO:117,当DNA标记序列是SEQ IDNO:28时;
SEQ ID NO:118,SEQ ID NO:119,当DNA标记序列是SEQ IDNO:29时;
SEQ ID NO:120,SEQ ID NO:121,当DNA标记序列是SEQ IDNO:30时:
SEQ ID NO:122,SEQ ID NO:123,当DNA标记序列是SEQ IDNO:31时;
SEQ ID NO:124,SEQ ID NO:125,当DNA标记序列是SEQ IDNO:32时;
SEQ ID NO:126,SEQ ID NO:127,当DNA标记序列是SEQ IDNO:33时;
SEQ ID NO:128,SEQ ID NO:129,当DNA标记序列是SEQ IDNO:34时:
SEQ ID NO:130,SEQ ID NO:131,当DNA标记序列是SEQ IDNO:35时;
SEQ ID NO:132,SEQ ID NO:133,当DNA标记序列是SEQ IDNO:36时;
SEQ ID NO:134,SEQ ID NO:135,当DNA标记序列是SEQ IDNO:37时;
SEQ ID NO:136,SEQ ID NO:137,当DNA标记序列是SEQ IDNO:38时;
SEQ ID NO:138,SEQ ID NO:139,当DNA标记序列是SEQ IDNO:39时;
SEQ ID NO:140,SEQ ID NO:141,当DNA标记序列是SEQ IDNO:40时;
SEQ ID NO:142,SEQ ID NO:143,当DNA标记序列是SEQ IDNO:41时;
SEQ ID NO:144,SEQ ID NO:145,当DNA标记序列是SEQ IDNO:42时;
SEQ ID NO:146,SEQ ID NO:147,当DNA标记序列是SEQ IDNO:43时。
31.一种检测DNA样品中至少一个靶中度串联重复序列的试剂盒,其中靶中度串联重复序列是DNA样品的一区域,其含有至少一个由至少串联重复2次的5,6或7碱基对的序列组成的重复单位,该试剂盒包括:
一种容器,其具有至少一个用于扩增所述至少一个靶中度串联重复序列的寡核苷酸引物,其中寡核苷酸引物包括互补于并位于双链DNA标记的含有模板中度串联重复序列的区域的侧翼的核苷酸序列,该模板中度串联重复序列包括至少串联重复2次的重复单位,其中DNA标记具有选自如下一组的序列:SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ IDNO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43。
32.权利要求31的试剂盒,还包括一DNA标记
33.一种寡核苷酸引物,其包括互补于双链DNA标记的一条链的位于模板中度串联重复序列的侧翼的序列,其中该模板中度串联重复序列是双链DNA标记的含有至少一个由至少串联重复2次的5、6或7碱基对序列组成的重复单位的区域,其中双链DNA标记序列选自如下一组:含有互补于双链DNA标记侧翼模板中度串联序列的链的序列的,SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO;19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26和SEQ ID NO:27。
34.权利要求33的寡核苷酸引物,其中该寡核苷酸引物包括选自如下一组的序列:
SEQ ID NO:44和SEQ ID NO:45,当DNA标记序列是SEQ IDNO:1时;
SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,当DNA标记序列是SEQ ID NO:2时;
SEQ ID NO:59,SEQ ID NO:60,当DNA标记序列是SEQ IDNO:3时;
SEQ ID NO:61,SEQ ID NO:62,当DNA标记序列是SEQ IDNO:4时;
SEQ ID NO:63,SEQ ID NO:64,当DNA标记序列是SEQ IDNO:5时;
SEQ ID NO:65,SEQ ID NO:66,当DNA标记序列是SEQ IDNO:6时;
SEQ ID NO:67,SEQ ID NO:68,当DNA标记序列是SEQ IDNO:7时;
SEQ ID NO:69,SEQ ID NO:70,当DNA标记序列是SEQ IDNO:8时;
SEQ ID NO:71,SEQ ID NO:72,当DNA标记序列是SEQ IDNO:9时;
SEQ ID NO:73,SEQ ID NO:74,当DNA标记序列是SEQ IDNO:10时;
SEQ ID NO:75,SEQ ID NO:76,当DNA标记序列是SEQ IDNO:11时;
SEQ ID NO:77,SEQ ID NO:78,当DNA标记序列是SEQ IDNO:12时;
SEQ ID NO:79,SEQ ID NO:80,当DNA标记序列是SEQ IDNO:13时;
SEQ ID NO:81,SEQ ID NO:82,当DNA标记序列是SEQ IDNO:14时;
SEQ ID NO:83,SEQ ID NO:84,当DNA标记序列是SEQ IDNO:15时;
SEQ ID NO:85,SEQ ID NO:86,当DNA标记序列是SEQ IDNO:16时;
SEQ ID NO:87,SEQ ID NO:88,当DNA标记序列是SEQ IDNO:17时;
SEQ ID NO:89,SEQ ID NO:90,当DNA标记序列是SEQ IDNO:18时;
SEQ ID NO:91,SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,当DNA标记序列是SEQ ID NO:19时;
SEQ ID NO:95,SEQ ID NO:96,当DNA标记序列是SEQ IDNO:20时;
SEQ ID NO:97,SEQ ID NO:98,当DNA标记序列是SEQ IDNO:21时;
SEQ ID NO:99,SEQ ID NO:100,当DNA标记序列是SEQ IDNO:22时;
SEQ ID NO:101,SEQ ID NO:102,当DNA标记序列是SEQ IDNO:23时;
SEQ ID NO:103,SEQ ID NO:104,当DNA标记序列是SEQ IDNO:24时;
SEQ ID NO:105,SEQ ID NO:106,当DNA标记序列是SEQ IDNO:25时;
SEQ ID NO:107,SEQ ID NO:108,SEQ ID NO:109,SEQ IDNO:110,SEQ ID NO:111,当DNA标记序列是SEQ ID NO:26时;
SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ IDNO:115,当DNA标记序列是SEQ ID NO:27时。
CNB998026964A 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法 Expired - Lifetime CN100545265C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/018,584 US6238863B1 (en) 1998-02-04 1998-02-04 Materials and methods for indentifying and analyzing intermediate tandem repeat DNA markers
US09/018,584 1998-02-04

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200910164448A Division CN101857895A (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法

Publications (2)

Publication Number Publication Date
CN1290298A true CN1290298A (zh) 2001-04-04
CN100545265C CN100545265C (zh) 2009-09-30

Family

ID=21788699

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200910164448A Pending CN101857895A (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法
CNB998026964A Expired - Lifetime CN100545265C (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200910164448A Pending CN101857895A (zh) 1998-02-04 1999-02-04 鉴别和分析中度串联重复dna标记的物质和方法

Country Status (11)

Country Link
US (2) US6238863B1 (zh)
EP (3) EP1058727B1 (zh)
JP (3) JP4494630B2 (zh)
KR (1) KR100691195B1 (zh)
CN (2) CN101857895A (zh)
AT (1) ATE486129T1 (zh)
AU (1) AU758639B2 (zh)
CA (1) CA2319111A1 (zh)
DE (1) DE69942891D1 (zh)
ES (2) ES2475416T3 (zh)
WO (1) WO1999040194A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1806051B (zh) * 2003-05-13 2012-05-30 莫诺昆特股份有限公司 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0907889B1 (en) 1996-04-25 2007-07-04 BioArray Solutions Ltd. Light-controlled electrokinetic assembly of particles near surfaces
AU2001255344A1 (en) * 2000-04-12 2001-11-12 King Faisal Specialist Hospital And Research Centre System for identifying and analyzing expression of are-containing genes
US6531282B1 (en) * 2000-05-30 2003-03-11 Oligotrail, Llc Multiplex amplification and analysis of selected STR loci
ES2259666T3 (es) 2000-06-21 2006-10-16 Bioarray Solutions Ltd Analisis molecular de multiples analitos usando series de particulas aleatorias con especificidad de aplicacion.
US9709559B2 (en) 2000-06-21 2017-07-18 Bioarray Solutions, Ltd. Multianalyte molecular analysis using application-specific random particle arrays
DE10119468A1 (de) * 2001-04-12 2002-10-24 Epigenomics Ag Mikroarray-Verfahren zur Anreicherung von DNA-Fragmenten aus komplexen Mischungen
US20020172948A1 (en) * 2001-05-04 2002-11-21 Perlin Mark W. Method and system for nucleic acid sequencing
US7262063B2 (en) 2001-06-21 2007-08-28 Bio Array Solutions, Ltd. Directed assembly of functional heterostructures
US20080138800A1 (en) * 2001-10-15 2008-06-12 Alice Xiang Li Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
EP2722395B1 (en) * 2001-10-15 2018-12-19 Bioarray Solutions Ltd Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
JP4805542B2 (ja) * 2002-04-08 2011-11-02 ピッグ インプルーブメント カンパニー ユーケイ リミテッド 動物生産物を追跡するためのシステム
US7157228B2 (en) * 2002-09-09 2007-01-02 Bioarray Solutions Ltd. Genetic analysis and authentication
US7526114B2 (en) 2002-11-15 2009-04-28 Bioarray Solutions Ltd. Analysis, secure access to, and transmission of array images
WO2005029705A2 (en) 2003-09-18 2005-03-31 Bioarray Solutions, Ltd. Number coding for identification of subtypes of coded types of solid phase carriers
WO2005031305A2 (en) 2003-09-22 2005-04-07 Bioarray Solutions, Ltd. Surface immobilized polyelectrolyte with multiple functional groups capable of covalently bonding to biomolecules
JP2007521017A (ja) 2003-10-28 2007-08-02 バイオアレイ ソリューションズ リミテッド 固定化捕捉プローブを用いる遺伝子発現分析法の最適化
EP1694859B1 (en) 2003-10-29 2015-01-07 Bioarray Solutions Ltd Multiplexed nucleic acid analysis by fragmentation of double-stranded dna
US7848889B2 (en) 2004-08-02 2010-12-07 Bioarray Solutions, Ltd. Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification
US7867703B2 (en) * 2004-08-26 2011-01-11 Agilent Technologies, Inc. Element defined sequence complexity reduction
US8486629B2 (en) 2005-06-01 2013-07-16 Bioarray Solutions, Ltd. Creation of functionalized microparticle libraries by oligonucleotide ligation or elongation
US7772390B1 (en) 2006-07-18 2010-08-10 The Regents Of The University Of California Lipid mediated nucleic acid synthesis
US8163480B2 (en) * 2006-10-05 2012-04-24 Quest Diagnostics Investments Incorporated Nucleic acid size detection method
US20090004662A1 (en) 2007-06-18 2009-01-01 Applera Corporation Method and compositions for nucleic acid amplification
WO2009012984A1 (en) 2007-07-26 2009-01-29 Roche Diagnostics Gmbh Target preparation for parallel sequencing of complex genomes
EP2905344B1 (en) * 2008-06-30 2016-11-09 Life Technologies Corporation Method for direct amplification from crude nucleic acid samples
US20120183953A1 (en) * 2011-01-14 2012-07-19 Opgen, Inc. Genome assembly
CA2960840A1 (en) * 2014-09-18 2016-03-24 Illumina, Inc. Methods and systems for analyzing nucleic acid sequencing data
CN104408331A (zh) * 2014-11-10 2015-03-11 南京工程学院 鉴别dna基因序列中编码区域与非编码区域的系统
JP6728657B2 (ja) * 2015-12-04 2020-07-22 東洋紡株式会社 核酸増幅法
US20210130815A1 (en) * 2019-11-05 2021-05-06 Florida State University Research Foundation, Inc. Evaluating Genomic Variation Using Repetitive Nucleic Acid Sequences

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IS1355B6 (is) 1984-11-12 1989-04-19 Lister Institute Of Preventive Medicine Fjölkjarna kannar
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
GB8606719D0 (en) 1986-03-19 1986-04-23 Lister Preventive Med Genetic probes
US4963663A (en) 1988-12-23 1990-10-16 University Of Utah Genetic identification employing DNA probes of variable number tandem repeat loci
DE68929070T2 (de) 1988-02-18 2000-05-25 The University Of Utah, Salt Lake City Verwendung von dna-proben mit variabler anzahl von tandem-repetitiven stellen zur genetischen identifizierung
DE3834636A1 (de) 1988-10-11 1990-04-19 Max Planck Gesellschaft Verfahren zur analyse von laengenpolymorphismen in dna-bereichen
US5075217A (en) 1989-04-21 1991-12-24 Marshfield Clinic Length polymorphisms in (dC-dA)n ·(dG-dT)n sequences
US5582979A (en) 1989-04-21 1996-12-10 Marshfield Clinic Length polymorphisms in (dC-dA)n.(dG-dT)n sequences and method of using the same
US5364759B2 (en) 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
CA2136764A1 (en) 1992-05-29 1993-12-09 Ronald L. Marshall Ligase chain reaction starting with rna sequences
GB9326052D0 (en) * 1993-12-21 1994-02-23 Zeneca Ltd Sequences
US5599666A (en) 1994-03-28 1997-02-04 Promega Corporation Allelic ladders for short tandem repeat loci
US6479235B1 (en) * 1994-09-30 2002-11-12 Promega Corporation Multiplex amplification of short tandem repeat loci
US5843660A (en) * 1994-09-30 1998-12-01 Promega Corporation Multiplex amplification of short tandem repeat loci

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1806051B (zh) * 2003-05-13 2012-05-30 莫诺昆特股份有限公司 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞

Also Published As

Publication number Publication date
WO1999040194A1 (en) 1999-08-12
EP2287307A2 (en) 2011-02-23
ATE486129T1 (de) 2010-11-15
CA2319111A1 (en) 1999-08-12
US6238863B1 (en) 2001-05-29
EP2287307A3 (en) 2011-06-29
ES2476266T3 (es) 2014-07-14
EP1058727A4 (en) 2003-03-26
KR100691195B1 (ko) 2007-03-08
EP2287308A2 (en) 2011-02-23
JP5898829B2 (ja) 2016-04-06
JP2002502606A (ja) 2002-01-29
JP4494630B2 (ja) 2010-06-30
KR20010040624A (ko) 2001-05-15
JP2009254388A (ja) 2009-11-05
EP1058727B1 (en) 2010-10-27
CN101857895A (zh) 2010-10-13
US20020012924A1 (en) 2002-01-31
EP2287307B1 (en) 2014-04-09
EP1058727A1 (en) 2000-12-13
EP2287308B1 (en) 2014-04-09
DE69942891D1 (de) 2010-12-09
AU2656599A (en) 1999-08-23
AU758639B2 (en) 2003-03-27
ES2475416T3 (es) 2014-07-10
JP2013143965A (ja) 2013-07-25
EP2287308A3 (en) 2011-06-29
CN100545265C (zh) 2009-09-30
US6767703B2 (en) 2004-07-27

Similar Documents

Publication Publication Date Title
CN1290298A (zh) 鉴别和分析中度串联重复dna标记的物质和方法
CN1254547C (zh) 具有酶活性的dna分子
CN1273611C (zh) 使用突变dna聚合酶的高温逆转录
CN1608139A (zh) 数字化分析
CN1255551C (zh) 用特定序列组合体检测核酸的方法
CN1118581C (zh) 对dna的特性分析
CN1219972A (zh) 短串联重复基因座的多重扩增
CN1471588A (zh) 核酸扩增方法
CN1898395A (zh) 基于引物的核酸的多重扩增的方法和试剂盒
CN1668923A (zh) 带有标准探针的dna微阵列以及包含该阵列的试剂盒
CN1259957A (zh) 产生由多个亚单位组成的aslv逆转录酶的方法
CN1723217A (zh) 使用单核苷酸多态性组分析受损样品的方法和组合物
CN1930306A (zh) 发展用于血栓形成倾向识别的方法(mert)
CN1566366A (zh) 一种基于dna芯片的基因分型方法及其应用
CN1541267A (zh) 核酸扩增或检测用试剂的稳定化方法和保存方法
CN1688718A (zh) 检测靶序列的方法和组合物
CN1890368A (zh) 扩增核酸的方法
CN1798842A (zh) 核酸检测
CN1671841A (zh) 基因多态性分型方法
CN1496402A (zh) 表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法
CN1678741A (zh) 用于检测基因多态性的方法
CN1865440A (zh) 肥厚型心肌病致病基因的新突变及其用途
CN1532292A (zh) 转录活性试验
CN1174104C (zh) 人工序列模板引物集及用途
CN1254549C (zh) 用于人HNF-1α基因扩增的多重PCR引物组

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20090930