CN1981057B - 改良核酸表达的新序列 - Google Patents
改良核酸表达的新序列 Download PDFInfo
- Publication number
- CN1981057B CN1981057B CN2005800229700A CN200580022970A CN1981057B CN 1981057 B CN1981057 B CN 1981057B CN 2005800229700 A CN2005800229700 A CN 2005800229700A CN 200580022970 A CN200580022970 A CN 200580022970A CN 1981057 B CN1981057 B CN 1981057B
- Authority
- CN
- China
- Prior art keywords
- sequence
- antirepressor
- cell
- nucleic acid
- promotor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Saccharide Compounds (AREA)
- Peptides Or Proteins (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本发明提供了一种新的抗阻抑物元件,其可用于改良核酸在宿主细胞中的表达。本发明还提供了使用所述新的抗阻抑物元件生产感兴趣蛋白质的方法。本发明还提供了包含抗阻抑物元件的表达盒的新构型。
Description
本发明涉及分子生物学和生物技术领域。更特别地,本发明涉及改良可在宿主细胞中编码蛋白质的一或多种核酸的产生的手段和方法。
可以在多种宿主细胞中产生的蛋白质在生物学和生物技术学中具有广泛应用,例如可用于生物制药学。这种产生方法已经确立,通常是使编码感兴趣蛋白质的核酸(也称作转基因)在宿主细胞中表达。
与转基因的表达相关的一个问题是其是不可预知的,这是由于转基因由于基因沉默而将变得无活性的高度可能性(McBurney et al.,2002),因此对于转基因的高表达需要测试许多宿主细胞克隆。另外,一旦这种克隆已经确定,则所述转基因的表达通常是不稳定的,在延长的宿主细胞培养期间常常观测到转基因表达沉默的现象。在脊椎动物细胞中,这可能是由于异染色质在转基因座形成,阻止了转基因的转录所致(Whitelaw et al,2001)。转基因沉默是随机的,其通常可以在转基因整合进基因组之中后立刻发生,或者只是在细胞分化之后发生。这样在延长的培养之后产生异质细胞群,其中一些细胞持续表达高水平的重组蛋白质,而其它细胞表达低水平或者不可检测水平的蛋白质(Martin & Whitelaw,1996,McBumey etal.,2002)。用于产生异源蛋白质的细胞系衍生自单一细胞,通常对其按比例扩大并长期维持在1000升或更大体积的培养器中每毫升1千万个细胞以上的密度。这些大细胞群(1014-1016个细胞)由于转基因沉默而倾向于生产力明显下降(Migliaccio et al.,2000,Strutzenberger et al.,1999)。
克服上述问题的一种可能性是在表达系统中应用所谓的STAR序列。多种这样的STAR序列在WO 03/004704中描述。这些序列可用于在一些类型宿主细胞中使用表达构建体而改良蛋白质生产的可预测性、产量和/或稳定性(WO 03/004704;Kwaks et al,2003)。
国际出版物WO 03/106674描述了STAR序列在一些细胞系中表达编码重组蛋白质的核酸的应用。
国际出版物WO 03/106684描述了STAR序列表达编码多聚体蛋白质如抗体的核酸的应用。
本发明提供了改良蛋白质生产的另外的手段和方法。
发明概述
一方面,本发明提供了包含选自如下一组的具有抗阻抑物活性的核酸序列的重组核酸分子:a)SEQ.ID.NO.66,b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,c)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性,及d)与a)-c)任一序列互补的序列;所述重组核酸分子进一步包含表达盒,所述表达盒包含与感兴趣核酸连接的异源启动子,且其中所述感兴趣核酸优选编码全部或部分感兴趣蛋白质。在一个优选的实施方案中,所述具有抗阻抑物活性的核酸序列位于所述表达盒中所述启动子的上游,在其特别优选的实施方案中,所述具有抗阻抑物活性的序列和所述启动子间隔少于2kb。在某些实施方案中,所述编码感兴趣蛋白质的核酸存在于多顺反子基因中,所述多顺反子基因进一步编码可选择标记基因。在某些实施方案中,所述分子进一步包含至少一个其它具有抗阻抑物活性的序列,所述至少一个其它序列选自:a)SEQ.ID.NO.1-65任一序列;b)SEQ.ID.NO.1-65任一序列的片段,其中所述片段具有抗阻抑物活性;c)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及d)与a)-c)任一序列互补的序列。本发明还提供了包含表达盒的重组核酸分子,其包含5’-抗阻抑物序列A-启动子-编码全部或者部分感兴趣蛋白质的核酸-抗阻抑物序列B-3’,其中抗阻抑物序列A和B可以相同或不同,并选自:(i)SEQ.ID.NO.1-65任一序列;(ii)SEQ.ID.NO.1-65任一序列的片段,其中所述片段具有抗阻抑物活性;(iii)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及(iv)与(i)-(iii)任一序列互补的序列,特征在于所述表达盒在所述抗阻抑物序列A和B之间进一步包含具有抗阻抑物活性的序列,该序列选自:a)SEQ.ID.NO.66;b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性;c)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及d)与a)-c)任一序列互补的序列。
本发明进一步提供了包含本发明分子的细胞。优选所述细胞是哺乳动物细胞,在某些实施方案中所述细胞是CHO细胞。
本发明进一步提供了一种生产感兴趣蛋白质的方法,包括培养包含编码感兴趣蛋白质的重组核酸分子的细胞,以在所述细胞中表达编码感兴趣蛋白质的所述核酸,其特征在于所述重组核酸分子包含具有抗阻抑物活性的、选自如下一组的核酸序列:a)SEQ.ID.NO.66,b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,c)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及d)与a)-c)任一序列互补的序列。在一个优选的实施方案中,所述方法进一步包括分离所述感兴趣蛋白质。在优选的实施方案中,所述具有抗阻抑物活性的核酸序列位于控制感兴趣蛋白质表达的启动子的上游。在其优选的实施方案中,所述具有抗阻抑物活性的序列与所述启动子间隔少于2kb。在某些实施方案中,所述编码感兴趣蛋白质的核酸存在于多顺反子基因中,所述多顺反子基因进一步编码可选择标记基因。在某些实施方案中,所述细胞是哺乳动物细胞,例如CHO细胞。
本发明还提供了选自如下一组的具有抗阻抑物活性的核酸序列在增加感兴趣核酸表达中的应用:a)SEQ.ID.NO.66;b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性;c)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及d)与a)-c)任一序列互补的序列。
另一方面,本发明提供了一种产生表达两种感兴趣多肽的宿主细胞的方法,所述方法包括:a)向宿主细胞中导入一或多种核酸分子,所述一种核酸分子或多种核酸分子一起包含:(i)与编码第一种感兴趣多肽和第一种可选择标记基因的序列功能性连接的启动子,及(ii)与编码第二种感兴趣多肽和第二种可选择标记基因的序列功能性连接的启动子,及(iii)具有抗阻抑物活性的至少一个序列,选自:(a)SEQ.ID.NO.1-66任一序列,(b)SEQ.ID.NO.1-66任一序列的片段,所述片段具有抗阻抑物活性,(c)与(a)或(b)至少70%相同并具有抗阻抑物活性的序列,及(d)与(a)-(c)任一序列互补的序列;b)通过基本上同时选择表达所述第一种和第二种可选择标记基因而选择宿主细胞。本发明还提供了表达两种感兴趣多肽的方法,所述方法包括:培养通过本发明的方法获得的宿主细胞以表达所述第一种和第二种多肽,及任选分离所述多肽。在一个实施方案中,所述具有抗阻抑物活性的序列选自:a)SEQ.ID.NO.66,b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,c)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性,及d)与a)-c)任一序列互补的序列。在某些实施方案中,所述两种多肽是多聚体蛋白质的一部分。
发明详述
抗阻抑物序列
本发明使用的具有抗阻抑物活性的序列是当HP1或HPC2蛋白质与DNA结合(tether)时,能至少部分抵消这些蛋白质的阻抑作用的序列。适于本发明的具有抗阻抑物活性的序列(在本文有时也称作抗阻抑物序列或者抗阻抑物元件)在WO 03/004704中揭示,其并入本文参考,在该文章中将其称作STAR序列(在本文中无论什么情况下将一序列称作STAR序列,则该序列具有本发明的抗阻抑物活性)。作为非限制性的例子,称作STAR1-65的65个抗阻抑物元件的序列(见WO 03/004704)在本文分别以SEQ.ID.NO.1-65表示。
根据本发明,一指定抗阻抑物元件的功能性片段或衍生物当其仍具有抗阻抑物活性时,被认为与所述抗阻抑物元件等同。这种抗阻抑物活性的存在可易于由本领域技术人员例如通过下述分析而检测。功能性片段或者衍生物可易于由分子生物学领域技术人员通过用指定的抗阻抑物序列起始产生缺失、添加、取代、翻转等而获得(见例如WO 03/004704)。功能性片段或者衍生物还包含其它物种的直向同源物(ortholog),其可以被本领域技术人员通过已知方法使用已知的抗阻抑物序列发现(见例如WO 03/004704)。因此,本发明涵盖抗阻抑物序列的片段,其中所述片段仍具有抗阻抑物活性。对于指定序列的片段,相同性百分比是指在该片段中发现的参考天然序列的部分。本发明还涵盖与所述具有抗阻抑物活性的序列或其具有抗阻抑物活性的功能片段在核苷酸序列水平至少70%相同的序列,只要这些至少70%相同的序列仍具有本发明的抗阻抑物活性。优选地,所述序列与参考天然序列或其功能片段至少80%相同、更优选至少90%相同、更优选至少95%相同。
根据本发明具有抗阻抑物活性的序列可以通过多种方法获得,包括但不限于从人基因组或者另一种生物体的基因组中克隆,或者通过例如利用对序列的了解例如通过PCR从这种基因组中直接扩增已知抗阻抑物序列,或者可以部分或全部化学合成。
具有抗阻抑物活性的序列或其功能片段或衍生物在本发明通过其序列在结构上加以限定,另外限定为具有抗阻抑物活性的序列进行功能性限定,使用下文所述分析确定。
本发明的具有抗阻抑物活性的任何序列应至少能通过如下的功能分析(见WO 03/004704,实施例1,并入本文作参考)。将人U-2OS细胞(ATCC HTB-96)用pTet-Off质粒(Clontech K1620-A)及用编码含有LexA DNA结合结构域和HP1或HPC2编码区的LexA-阻抑物融合蛋白的核酸(当与DNA结合时抑制基因表达的果蝇Polycomb群蛋白质;该分析对任一融合蛋白质均起作用),在Tet-Off转录调节系统(Gossen and Bujard,1992)控制下稳定转染。这些细胞在下文抗阻抑物活性分析中称作报道细胞。提供潮霉素抗性的报道质粒位于四个LexA操纵基因位点与控制zeocin抗性基因的SV40启动子之间含有一个多接头序列。可以将测试抗阻抑物活性的序列克隆在所述多接头中。合适的报道质粒如pSelect的构建在WO 00/004704的实施例1和图1中描述。将该报道质粒转染进报道细胞中,将该细胞在潮霉素选择(25μg/ml;针对报道质粒的存在而选择)和四环素抑制(强力霉素,10ng/ml;防止LexA-阻抑物融合蛋白表达)下培养。在这些条件下生长一周后,将强力霉素的浓度降低至0.1ng/ml(或更低)以诱导LexA-阻抑物基因,两天后加入250μg/ml的zeocin。将细胞培养5周,直至对照培养物(用空白报道质粒转染,即在多接头中没有克隆的抗阻抑物序列)被zeocin杀死(在这个对照质粒中,SV40启动子被与LexA操纵位点结合的LexA-阻抑物融合蛋白抑制,导致在这种细胞中无效的zeocin表达,以在zeocin选择中存活)。如果一个序列克隆在报道质粒的多接头中,所述报道细胞在zeocin选择下存活5周,则所述序列具有本发明的抗阻抑物活性。这种集落的细胞在zeocin选择5周后仍可以在含有zeocin的新培养基上增殖,而用没有抗阻抑物序列的报道质粒转染的细胞在含有zeocin的新培养基上不能增殖。在这个分析中在5周后不能赋予在zeocin上这种生长的任何序列不能认为是本发明具有抗阻抑物活性的序列或者其功能片段或者功能衍生物。例如,已知的边界序列如Van der Vlag等(2000)测试的那些序列,包括果蝇scs(Kellum and Schedl,1991)、鸡β-球蛋白基因座的5’-HS4(Chung et al,1993,1997)或者MatrixAttachment Regions(MARs)(Phi-Van et al.,1990),在这个分析中不存活。
另外,当与报道基因两侧无抗阻抑物或者具有较弱的阻抑封闭序列如Drosophila scs相对比时,优选位于整合进U-2OS或CHO细胞基因组中的报道基因(例如荧光素酶,GFP)两侧的所述抗阻抑物序列或者其功能片段或者衍生物产生较高比例的报道基因过表达克隆。这可以使用例如pSDH载体或者相似的载体证实,如WO03/004704的实施例1和图2所述。
本发明的抗阻抑物元件可具有生产蛋白质的三个结果的至少一个:(1)在工业可接受水平提高鉴别表达蛋白质的宿主细胞系的可预测性;(2)使得宿主细胞系的蛋白质产量增加;和/或(3)使得宿主细胞系在延长的培养期间呈现更稳定的蛋白质产生。这些特性在下文更详细地论述:(1)可预测性提高:转基因表达盒的整合可以在整个宿主细胞基因组的随机位置发生。然而,许多基因组是转录沉默的异染色质。当所述表达盒在转基因两侧包括抗阻抑物元件时,整合的位置对表达具有减弱的作用。所述抗阻抑物元件削弱相邻异染色质使转基因沉默的能力。因此,含有可接受表达水平的转基因的宿主细胞比例增加。当转染同量的DNA时,抗阻抑物序列的掺入与无抗阻抑物序列的相同转基因相比确实导致多至10倍的集落建立。
(2)产量:在转基因整合后立即测定原始重组宿主细胞群中蛋白质的表达水平。群体中的个体表达水平不同。然而,当所述转基因被抗阻抑物元件保护时,可变性降低。这种降低的可变性在回收低水平表达的较少克隆中是最显著的。另外,具有抗阻抑物元件的群体通常具有显著高水平表达的个体。这些高产量的个体对于蛋白质的产生是有利的,无论对于收获还是改变细胞或者包含这种细胞的生物体的表型均有利。
(3)增加的稳定性:抗阻抑物元件增加重组宿主细胞系中转基因的稳定性,通过保证转基因在延长的培养期间不被转录沉默而实现。对比试验表明,在未被抗阻抑物元件保护的转基因逐渐沉默的条件下(5-25传代培养),抗阻抑物元件保护的转基因持续高水平表达。这在蛋白质样分子的工业化生产期间是有利的,在此期间细胞培养时间持续延长,从几周延长至几个月。相似地,延长期间的表达稳定性在由于抗阻抑物保护的转基因的重组表达而产生的表型改变的植物或动物中是有利的。
STAR67
本发明提供了具有抗阻抑物活性的新序列,其被称作STAR67(SEQ.ID.NO.66)。当将这种抗阻抑物序列置于驱动感兴趣基因表达的启动子的上游时明显增加表达,如本发明提供的实施例所揭示,而迄今为止已知的有效抗阻抑物序列如STAR6或者STAR7看起来在这种构型中不太有利(它们特别在位于在转基因两侧时起作用,即当位于转基因的上游和下游时)。因此,STAR67提供了已知的抗阻抑物序列的一种替代,当其被置于启动子上游时与已知的这类抗阻抑物序列相对比时具有增加的益处。STAR67不是增强子-阻断剂,与测试这种性质的其它抗阻抑物序列相反(Kwaks et al,2003),其提供了STAR67与其它以前公开的抗阻抑物序列之间的另一种不同之处。STAR67可以双向方式操纵,如实施例7所示。根据本发明,表达盒中STAR67序列的存在提供了改良的可预测性和/或产量和/或表达稳定性。本发明论证了STAR67与多种启动子组合在不同细胞系中起作用。
表达盒
本发明的核酸分子,包括STAR67,可以是任何形式,例如是DNA片段,任选存在于克隆载体如质粒、优选表达载体上,并且可用于例如使用标准重组DNA技术进行克隆。在本发明优选的实施方案中,核酸包含表达盒,其可用于在例如宿主细胞中表达感兴趣的序列。
如本文所用,“表达盒”是指包含与希望表达的序列功能性连接的至少一个启动子的核酸序列,希望表达的序列优选是编码全部或部分感兴趣蛋白质的开放读框。所述启动子优选对于所述感兴趣核酸而言是异源启动子,异源启动子是指不是所述感兴趣序列的天然启动子的启动子。换而言之,已经使用了一些人类干预形式例如分子克隆将异源启动子与感兴趣核酸功能组合,在本文中异源启动子可以衍生自与感兴趣序列相同或者不同的生物体。优选地,表达盒进一步含有转录终止和聚腺苷酸化序列。也可以包括其它调节序列如增强子。本发明的表达单位进一步包含至少一个抗阻抑物序列,如STAR67。在某些优选的实施方案中,所述抗阻抑物序列,优选STAR67,被置于所述启动子的上游,优选所述抗阻抑物序列的3’末端与启动子序列起始点之间间隔少于2kb。在优选的实施方案中,所述抗阻抑物序列的3’末端与启动子序列的起始点之间间隔少于1kb,更优选少于500个核苷酸(nt),更优选少于大约200、100、50或者30个nt。在某些优选的实施方案中,所述抗阻抑物序列直接克隆在启动子的上游,导致抗阻抑物序列的3’末端与启动子序列起始点之间仅间隔大约0-20个nt。
为了获得编码重组蛋白质的核酸序列的表达,本领域技术人员熟知可以将能驱动这种表达的序列与编码所述蛋白质的核酸序列功能性连接,产生可表达形式的编码重组蛋白质的重组核酸分子。通常,所述启动子序列置于编码感兴趣蛋白质的序列的上游。可用的表达载体可在本领域获得,例如Invitrogen的pcDNA和pEF载体系列,BD Sciences的pMSCV和pTK-Hyg,Stratagene的pCMV-Script等等。
在编码感兴趣多肽的序列正确插入控制编码的多肽的转录和翻译的序列中的情况中,所得表达盒可用于产生感兴趣蛋白质,这即称作表达。驱动表达的序列可包括启动子、增强子等,及其组合。这些序列应能在宿主细胞中起作用,从而驱动与其功能性连接的核酸序列的表达。本领域技术人员知道可以使用多种启动子获得感兴趣基因在宿主细胞中的表达。启动子可以是组成型或者被调节的,可以得自多种来源,包括病毒、原核生物或者真核生物来源,或者是人工设计的。感兴趣核酸的表达可以从天然启动子或其衍生物或者从完全异源的启动子中表达(Kaufman,2000)。用于在真核细胞中表达的一些熟知和常用的启动子包含衍生自病毒如腺病毒的启动子,例如E1A启动子,衍生自巨细胞病毒(CMV)的启动子,如CMV立即早期(IE)启动子(在本文称作CMV启动子)(可得自例如pcDNA,Invitrogen),衍生自猿猴病毒40(SV40)的启动子(Das et al,1985)等等。合适的启动子也可以衍生自真核细胞,如金属硫蛋白(MT)启动子,延伸因子1a(EF-1α)启动子(Gill et al.,2001),遍在蛋白C或UB6启动子(Gill et al.,2001;Schorpp et al,1996),肌动蛋白启动子,免疫球蛋白启动子,热激启动子等等。适合本发明的在真核细胞中获得表达的一些优选启动子是CMV启动子,哺乳动物EF1-α启动子,哺乳动物遍在蛋白启动子如遍在蛋白C启动子,或者SV40启动子(例如可得自pIRES,cat.no.631605,BD Sciences)。测试启动子功能和强度由本领域技术人员常规进行,通常可例如包括在启动子序列之后克隆一个测试基因如lacZ、荧光素酶、GFP等,并测试该测试基因的表达。当然,启动子可以通过对序列进行缺失、添加、突变而改变,并测试其功能性以发现新的弱化的或者改良的启动子序列。
本发明的表达盒可以是单顺反子、双顺反子或者多顺反子的。术语“双顺反子基因”是指能提供编码两种蛋白质/多肽的RNA分子的基因。术语“单顺反子基因”是指能提供编码一种蛋白质/多肽的RNA分子的基因。术语“多顺反子基因”是指能提供编码两或多种蛋白质/多肽的RNA分子的基因,双顺反子基因因此包含在多顺反子基因的范畴内。本发明所用术语“基因”可包含染色体DNA,cDNA,人工DNA,其组合等,并且也可以是其它核酸形式,例如RNA。在某些实施方案中,蛋白质表达单位包含一个多顺反子基因。包含一些顺反子的单位可以转录为单一mRNA。该RNA上存在的第二个及其它编码区的翻译可以多种方式实现,包括使用翻译再引发位点或者内在核糖体进入位点,优选后者。双或多顺反子单位的一个优势是可以易于选择表达感兴趣蛋白质的克隆,通过将编码可选择标记蛋白的核酸置于编码感兴趣蛋白质或多肽的核酸下游而进行。
对于多聚体蛋白质的产生,可以使用两或多个表达盒。这个实施方案经证实提供良好结果,例如抗体重链和轻链的表达。根据本发明,至少一种表达盒,但优选每种表达盒,均应包含STAR序列。在另一个实施方案中,多聚体蛋白质的不同亚单位或部分存在于一个表达盒中。
代替或除了置于表达盒中启动子上游的抗阻抑物序列的存在之外,在表达盒的两侧具有抗阻抑物序列经证实是非常有益的,这样包含转基因的表达盒的两侧具有两个抗阻抑物序列,这两个序列在某些实施方案中基本上彼此相同。当然,这也可以用STAR67进行,获得在两侧具有两个STAR67序列的表达盒。表达盒中一个STAR67序列的其它位置例如在转基因之后也是可能的,优选在转录终止和聚腺苷酸化信号之后,STAR67序列的3’末端面对转基因。
本发明的表达盒可任选包含一个选择标记基因。术语“选择标记或者可选择标记”典型用于描述其存在可以直接或者间接在细胞中检测的基因和/或蛋白质,例如使选择剂失活并且保护宿主细胞免于该制剂的致死或者生长抑制作用的基因和/或蛋白质(例如抗生素抗性基因和/或蛋白质)。另一种可能性是所述选择标记诱导荧光或者颜色沉积(例如绿色荧光蛋白及衍生物,荧光素酶,lacZ,碱性磷酸酶等等)。在某些实施方案中,用于本发明的选择标记是zeocin,对于选择第二种表达盒使用嘌呤霉素。本领域技术人员已知可以获得及利用其它选择标记,例如新霉素、杀稻瘟素、嘌呤霉素、博来霉素、潮霉素、dhfr等等。
术语“选择”典型是指使用选择标记/可选择标记和选择剂鉴别具有特殊遗传性质的宿主细胞的过程(例如宿主细胞含有整合进其基因组中的转基因)。本领域技术人员明白可以将选择标记组合。可能的抗生素例子如上文提供。特别有利的一种抗生素是zeocin,因为zeocin-抗性蛋白(zeocin-R)通过结合药物并使其无害而起作用。因此,易于滴定测定杀死低水平表达zeocin-R的细胞的药物量,同时使得高水平表达的细胞存活。常用的所有其它抗生素抗性蛋白是酶,并因此通过催化起作用(与药物不是1∶1)。当进行两步选择时,因此优选使用具有这种1∶1结合作用模式的抗生素抗性蛋白。因此,抗生素zeocin是优选的选择标记。为方便起见,在两步选择方法中,zeocin抗生素可以组合例如嘌呤霉素、杀稻瘟素或者潮霉素,例如可存在于单顺反子基因中。
也可以将抗生素选择标记与提供诱导荧光或者提供颜色沉积的选择标记组合。可以使用不同的启动子,只要其在使用的细胞中起作用即可。
在某些实施方案中,提供了一种表达盒,其在例如感兴趣蛋白质的开放读框与选择标记开放读框之间具有(弱)内在核糖体结合位点(IRES)作为具有降低翻译效力的蛋白质翻译起始位点的例子。蛋白质从IRES元件中的翻译比帽依赖性翻译的效力低:从IRES依赖性开放读框(ORF)中翻译的蛋白质的量比从第一个ORF中翻译的蛋白质的量低20%-50%(Mizuguchi et al.,2000)。另外,IRES元件的突变可以使其活性弱化,并使从IRES依赖性ORF中的表达降低至低于从第一个ORF中表达的10%(Lopez de Quinto & Martinez-Salas,1998,Rees et al.,1996)。当IRES依赖性ORE编码一种可选择标记蛋白时,其相对低翻译水平意味着必须存在绝对高的转录水平以选择重组宿主细胞。因此,选择的重组宿主细胞分离株必需表达高量的转基因mRNA。因为重组蛋白质是从帽依赖性ORF中翻译的,因此其可以大量产生,导致高产物产量。
常规的表达系统是重组质粒或者重组病毒基因组形式的DNA分子。通过本领域已知方法将质粒或者病毒基因组导入(真核宿主)细胞中,并优选整合进其基因组中。在优选的实施方案中,本发明还使用这些类型的DNA分子输送其改良的转基因表达系统。本发明的一个优选实施方案是使用质粒DNA输送表达系统。质粒含有许多成分:本领域已知的常规成分是复制起点和可选择标记以使得质粒在细菌细胞中增殖;在真核细胞中起作用以鉴别和分离携带整合的转基因表达系统的宿主细胞的可选择标记;编码感兴趣蛋白质的核酸,其高水平转录通过在真核细胞中起作用的启动子进行(例如人巨细胞病毒主要立即早期启动子/增强子,pCMV(Boshart et al.,1985);及感兴趣的转基因和可选择标记的转录终止子(例如SV40聚腺苷酸化位点(Kaufman & Sharp,1982)。使用的载体可以是适于克隆DNA并且可用于转录感兴趣核酸的任何载体。当使用宿主细胞时,优选所述载体是一种整合载体。或者,所述载体可以是附加型复制载体。
图1提供了表达盒的可能构型的一些非限制性示意图。这是质粒中以及整合进基因组中之后表达盒的DNA元件的构型。构建体A含有包含编码蛋白质的开放读框的一个表达单位(基因)。其位于弱化的EMCV IRES(Martinez-Salas et al 1999;Mizuguchi et al 2000;Rees et al 1996)和编码zeocin抗性可选择标记蛋白(zeo)的开放读框的上游。所述基因盒在其3’末端具有SV40转录终止子(t)。这种双顺反子转基因从CMV启动子中高水平转录。构建体B衍生自构建体A,但是将STAR67克隆在CMV启动子的上游。构建体C衍生自构建体B,但是将两种抗阻抑物元件(在这种情况中是STAR7)克隆在完整表达盒的两侧。
表达盒中抗阻抑物序列的组合
本发明示出组合启动子上游的第一个抗阻抑物元件及表达盒两侧的两个其它抗阻抑物序列提供了极佳的结果。特别地,当在CHO细胞中使用SV40启动子时,在没有抗阻抑物序列的条件下表达已经非常高,但是当将STAR67置于所述启动子上游及在完整表达盒两侧具有两个抗阻抑物元件如STARβ、STAR7或STAR 40时,表达显著增强。
因此,本发明的一个目的是提供包含表达盒的重组核酸分子,所述表达盒包含(从5’至3’):抗阻抑物序列A-启动子-编码感兴趣蛋白质的核酸-抗阻抑物序列B,特征在于所述表达盒在所述抗阻抑物序列A与B之间进一步包含一个抗阻抑物序列C。在一个优选的实施方案中,所述抗阻抑物序列C存在于所述启动子的上游,如上述标题为“表达盒”的段落中描述的构型。抗阻抑物序列A与B之间的表达盒可进一步包含如上述表达盒的元件,例如转录终止子序列、聚腺苷酸化信号、选择标记基因、增强子等等,并且可以是如上述单顺反子、双顺反子或者多顺反子。
抗阻抑物序列A、B和C的两个或所有三个可以相同或所有三个可以不同。抗阻抑物序列A和B可以与抗阻抑物序列C相同或不同。在某些实施方案中,抗阻抑物序列A和B彼此(基本)相同。在一个实施方案中,抗阻抑物序列C是STAR67或者其功能片段或衍生物。抗阻抑物序列A和B可以是任何抗阻抑物序列,在某些实施方案中包含SEQ.ID.NO.1-65之一或其功能片段或衍生物。在某些实施方案中,表达盒含有一个多顺反子基因,在其优选的实施方案中,所述多顺反子基因包含编码感兴趣蛋白质和选择标记基因的序列。或者,选择标记基因在单独的启动子控制下存在。
在某些实施方案中,在STAR序列A与B之间可以存在第四个抗阻抑物序列D。在这种实施方案中,所述抗阻抑物序列D优选位于编码感兴趣蛋白质的核酸的下游。再者,这个抗阻抑物序列D与重组核酸分子中的其它抗阻抑物序列可以相同或不同,其可以是任何抗阻抑物序列,在某些实施方案中其选自SEQ.ID.NO.1-66任一序列或其功能片段或衍生物。
由于至少一些抗阻抑物序列可以是有方向的(WO 00/004704),因此在表达盒两侧的抗阻抑物序列(抗阻抑物序列A和B)可以彼此相反方向放置,由此这些抗阻抑物的3’末端向内面向表达盒(及彼此向内面向)。因此,在优选的实施方案中,抗阻抑物元件的5’末端面向DNA/染色质,其对转基因的影响通过所述抗阻抑物元件而降低。对于表达盒中启动子上游的抗阻抑物序列而言,3’末端面向启动子。除非特别指出,则序列表中的抗阻抑物元件的序列(SEQ.ID.NO.1-66)是以5’至3’方向提供的。
本发明的细胞
包含本发明的STAR序列和/或表达盒的核酸分子可用于改良核酸的表达,优选在宿主细胞中的表达。术语“细胞‘V’宿主细胞”及“细胞系‘V’宿主细胞系”典型分别是指通过本领域已知的方法在细胞培养中可以保持并且具有表达异源或者同源蛋白质的能力的细胞及其同种群。本发明的宿主细胞优选是真核细胞,更优选是哺乳动物细胞,如啮齿动物细胞或者人细胞或者不同细胞的融合体。在某些非限制性实施方案中,所述宿主细胞是U-2OS骨肉瘤、CHO(中国仓鼠卵巢)、HEK 293、HuNS-1骨髓瘤、WERI-Rb-1成视网膜细胞瘤、BHK、Vero、非分泌性小鼠骨髓瘤Sp2/0-Ag 14、非分泌性小鼠骨髓瘤NSO、NCI-H295R肾上腺癌或者PER.细胞。
在本发明的某些实施方案中,宿主细胞是表达腺病毒的至少E1A、优选也表达E1B的细胞。作为非限制性的例子,这种细胞可以衍生自例如人体细胞,例如衍生自肾(例如HEK 293细胞,见Graham et al,1977所述)、肺(例如A549,见例如WO 98/39411所述)或者视网膜(例如HER细胞,商品名为PER.见美国专利5,994,128所述),或者衍生自羊水(例如N52.E6,见美国专利6,558,948所述)及相似地衍生自其它细胞。获得这种细胞的方法见例如美国专利5,994,128和US 6,558,948所述。本发明应用的PER.细胞是在ECACC保藏号为96022940的细胞的上游或下游传代或者上游或下游传代的后代。先前已经示出这种细胞能高水平表达蛋白质(例如WO 00/63403及Jones et al,2003所述)。
表达本发明所需蛋白质的这种宿主细胞可以通过将本发明的核酸分子、优选表达盒形式导入细胞中而获得。在另一个实施方案中,将STAR67序列定向整合进染色体区域中以改良已经整合进该基因组中的感兴趣基因的表达,例如天然发生的基因,任选在靶向所述基因上游的异源启动子控制下调节所述基因的表达。
优选地,所述宿主细胞来自可以根据本领域技术人员已知的标准方法选择和增殖的稳定克隆。这种克隆的培养物能产生感兴趣的重组蛋白质。本发明的细胞优选能在无血清的培养基中悬浮生长。
本发明的感兴趣蛋白质可以是任何蛋白质,可以是单体蛋白质或者多聚体蛋白质。多聚体蛋白质包含至少两个多肽链。感兴趣蛋白质的非限制性例子是酶、激素、免疫球蛋白链、治疗性蛋白质如抗癌蛋白质、血液凝聚蛋白如因子VIII,、多功能蛋白质如红细胞生成素、诊断性蛋白质、或者用于接种目的的蛋白质或其片段,所有这些蛋白质均为本领域技术人员所已知。
在某些实施方案中,本发明的表达盒编码免疫球蛋白重链或轻链或其抗原结合部分、衍生物和/或相似物。在一个优选的实施方案中,提供了本发明的蛋白质表达单位,其中所述感兴趣蛋白质是免疫球蛋白重链。在另一个优选的实施方案中,提供了本发明的蛋白质表达单位,其中所述感兴趣蛋白质是免疫球蛋白轻链。当这两种蛋白质表达单位存在于同一(宿主)细胞中时,装配成多聚体蛋白质,更特别地装配成抗体。因此在某些实施方案中,感兴趣蛋白质是免疫球蛋白,如抗体,其是多聚体蛋白质。优选地,这种抗体是人或人源化抗体。在其某些实施方案中,这种抗体是IgG、IgA或者IgM抗体。免疫球蛋白可以由不同表达盒或者一个表达盒上的重链和轻链编码,其中编码每个链的基因可以在多顺反子转录单位中单独启动子的控制下,或者这两个链均可在多顺反子基因上编码。
感兴趣蛋白质可以来自任何来源,在某些实施方案中是哺乳动物蛋白质,人工蛋白质(例如融合蛋白或者突变蛋白),优选是人蛋白质。
显而易见,当最终的目的不是生产蛋白质而是RNA自身时,也可以使用本发明的抗阻抑物序列和表达盒构型,例如从表达盒中生产增加数量的RNA,这可用于调节其它基因(例如RNAi,反义RNA)、基因治疗、体外蛋白质产生等目的。
生产感兴趣蛋白质的方法
一方面,本发明提供了一种表达感兴趣序列、优选编码感兴趣蛋白质的序列的方法,通过提供具有本发明的核酸分子或者表达盒的宿主细胞、培养该细胞并表达感兴趣序列而进行。
术语“表达”典型用于描述细胞中特异的一或多种RNA产物或者特异的一或多种蛋白质的产生。在RNA产物的情况中,表达是指转录过程。在蛋白质产物的情况中,表达是指转录、翻译及任选翻译后修饰(例如糖基化、二硫键形成等)的过程。在分泌的蛋白质的情况中,表达是指转录、翻译、及任选翻译后修饰及随后的分泌过程。
导入要在细胞中表达的核酸可以通过如本领域技术人员已知的几种方法之一进行,也依赖于导入的核酸的形式。所述方法包括但不限于转染、感染、注射、转化等。
对细胞进行培养是使其能代谢和/或生长和/或分裂和/或产生感兴趣的重组蛋白质。这种培养可以通过本领域技术人员熟知的方法实现,包括但不限于为细胞提供营养。所述方法包括附着在表面生长、悬浮生长或其组合。培养可以例如在培养皿、滚瓶或者在生物反应器中进行,使用分批培养、补料分批培养、持续系统如灌注系统等方式进行。为了达到在细胞培养期间大规模(持续)产生重组蛋白质,优选使细胞能悬浮生长,及优选使细胞能在无得自动物或人的血清或者得自动物或人的血清成分的条件下培养。
生长或者繁殖细胞的条件(见例如Tissue Culture,Academic Press,Kruse and Paterson,editors(1973))及表达重组产物的条件为本领域技术人员所已知。通常,使哺乳动物细胞培养物的生产力最大化的原理、方案及实践技术可见于Mammalian Cell Biotechnology:aPractical Approach(M.Butler,ed.,IRL Press,1991)所述。
在一个优选实施方案中,从细胞或者培养基或者这两者中收集(分离)表达的蛋白质。然后使用本领域技术人员通常已知的方法进一步纯化,例如通过过滤、柱层析等。
新的选择方法
本发明揭示了一种产生表达两种感兴趣多肽的宿主细胞的新方法,所述方法提供了令人惊奇的良好结果,不使用抗阻抑物序列则几乎没有或没有集落出现,而存在抗阻抑物序列则导致克隆在选择下存活,这些克隆通常高水平表达感兴趣的两种多肽(实施例7,图11)。本发明因此提供了一种产生表达两种感兴趣多肽的宿主细胞的方法,所述方法包括:a)向宿主细胞中导入一或多种核酸分子,所述核酸分子包含:(i)与编码第一种感兴趣多肽和第一种可选择标记基因的序列功能性连接的启动子,及(ii)与编码第二种感兴趣多肽和第二种可选择标记的序列功能性连接的启动子,及(iii)至少一种抗阻抑物序列,其选自:(a)SEQ.ID.NO.1-66任一序列,(b)SEQ.ID.NO.1-66任一序列的片段,所述片段具有抗阻抑物活性,(c)与(a)或(b)至少70%相同并具有抗阻抑物活性的序列,及(d)与(a)-(c)任一序列互补的序列;b)通过基本上同时选择表达所述第一种和第二种可选择标记基因而选择宿主细胞。选择的宿主细胞可便利地用于表达所述两种多肽,通过培养所述选择的宿主细胞进行。在一个实施方案中,两种核酸分子用于导入宿主细胞中,所述分子之一含有(i),另一分子含有(ii)。在这个实施方案中,每个核酸分子优选含有至少一种所述抗阻抑物序列。在另一个实施方案中,使用含有(i)和(ii)两者的一个核酸分子,其然后必须含有至少一个所述抗阻抑物序列。在一个核酸分子上具有这两种多肽的编码序列的一个优势是在将核酸导入细胞之前仅需要一种核酸制品。另外,在这种实施方案中,一次整合对于两种多肽的编码序列即足够,从而避免了编码第一种多肽的核酸与编码第二种多肽的核酸整合位置不同或者具有不同拷贝数的可能性。在优选的实施方案中,所述两种多肽可以形成多聚体蛋白质如免疫球蛋白的部分。所述方法因此特别适于表达抗体。所述两个启动子可以相同或不同,可以是前述任何启动子。当使用含有(i)和(ii)两者的一个核酸分子时,这一个核酸分子上的两个转录单位的方向可例如是同向的或者彼此面向反向或者彼此向外反向的。在后者情况中,所述抗阻抑物序列可以置于两个启动子之间(例如图HB所示)。适合本发明这方面的一个抗阻抑物序列是SEQ.ID.NO.66(见实施例7),但是其它抗阻抑物序列也可以起作用。这可易于由本领域技术人员使用本文揭示的方法测试,因此本发明这方面使用其它抗阻抑物序列也包含在本发明范围内。另外,抗阻抑物序列可以添加在一或两个转录单位两侧。标记基因必须是不同的,可例如选自如前述的标记基因。在某些实施方案中,一种可选择标记是zeocin,另一可选择标记是例如嘌呤霉素。然而,应清楚可以使用其它组合,这也包含在本发明这方面范围内。标记的表达应优选依赖于感兴趣多肽的表达。这可以通过将标记基因的表达与感兴趣多肽的表达联系起来而建立,例如使用多顺反子基因进行,例如使用如前述IRES序列。“基本上同时”选择是指至少在部分时间、优选至少一天、更优选至少两天、更优选至少五天,这两种选择剂均存在,这可以通过将这两种选择剂同时加入培养基中或者加入包含这两种选择剂的培养基而进行(例如实施例7所述)。应清楚在第一种选择剂已经存在于培养基中之后只是几小时或几天加入第二种选择剂在本发明仍意味着是基本上同时选择。这种情况有别于其中将细胞首先用第一种选择剂选择,一旦集落形成则将细胞在加入了第二种选择剂而没有第一种选择剂的新的培养基上选择的情况(连续选择,例如实施例5和WO 03/106684所述)。通过基本上同时选择这两种可选择标记,本发明令人惊奇地提供了快速和强力的选择,从而消除了许多低产量的克隆,明显降低了发现具有所需表达特性的克隆的工作量。这对于生物技术工业特别有利,该行业在鉴别具有高表达水平的所需克隆之前通常需要筛选几百甚至几千个集落。
另外,该系统提供了测试抗阻抑物元件、至少STAR67但也可以是其它抗阻抑物序列在这个系统中起作用的部分的功能性的可能性。这个简单筛选在许多情况中提供了几乎或者甚至完全显而易见的差异,因此有助于鉴别抗阻抑物序列的功能部分或衍生物,和/或有助于鉴定新的抗阻抑物序列。所述筛选甚至可用于发现新的抗阻抑物和/或表达增强序列(因为这种类型的筛选不是仅针对抗阻抑物活性而是针对增强表达的活性进行选择,因此其也可以发现具有后者而非前者活性的序列)。因此,本发明的另一方面提供了一种鉴别抗阻抑物和/或表达增强序列或其功能片段或衍生物的方法,所述方法包括:a)向宿主细胞中导入一或多种核酸分子,所述一种核酸分子或多种核酸分子一起包含:(i)与第一种可选择标记基因功能连接的启动子,及(ii)与第二种可选择标记功能连接的启动子,及(iii)要测试抗阻抑物和/或表达增强活性的至少一个序列;b)通过基本同时选择所述第一种和第二种可选择标记基因的表达选择宿主细胞。经过这种筛选存活的细胞很可能含有功能性抗阻抑物和/或表达增强元件。然后对这种元件可易于进一步分析,例如通过确定其序列和/或通过将其进行如上述抗阻抑物活性的其它功能测试而分析。在一个实施方案中,(i)和(ii)均在一个核酸分子上,例如由启动子分隔(第一个和第二个可选择标记向外反向),在此之间可以克隆测试序列以进行分析。优选地,所述可选择标记基因不是高表达的,例如通过使用相对弱启动子直接驱动可选择标记基因,所述相对弱启动子是已知的和/或可以由本领域技术人员通过常规分析鉴别,或者例如使用强启动子进行转录,及使用IRES、优选如前述相对弱的IRES翻译标记基因。所述标记基因也可以便利地置于编码多肽的核酸序列的下游,并在多顺反子基因中例如通过IRES与其表达连接(例如实施例7所述,图11示出可能的构型)。这种多肽可同样是感兴趣的多肽,由此获得表达所述感兴趣多肽的直接可用克隆,但对于筛选目的也可以是其表达可易于量化的标记,例如GFP或其衍生物、SEAP、lacZ、荧光素酶等等。在这种组合中,多肽的表达可以直接量化以挑选在同时选择期间提供足够的集落及提供高转录水平的抗阻抑物和/或表达增强元件或其片段。当“随机”核酸(即仍未知其具有抗阻抑物或表达增强活性的核酸),例如基因组片段形式,用作测试序列测试抗阻抑物和/或表达增强活性时,可以发现新的抗阻抑物和/或表达增强序列。当测试已知抗阻抑物序列时,这个分析可用于对其进一步鉴定。当测试已知抗阻抑物序列的片段时,所述分析将提供这种已知抗阻抑物序列的功能片段。
除非特别指出,实践本发明应用本领域技术人员已知的免疫学、分子生物学、微生物学、细胞生物学及重组DNA等常规技术。见例如Sambrook,Fritsch and Maniatis,Molecular Cloning:ALaboratory Manual,2nd edition,1989;Current Protocols in MolecularBiology,Ausubel FM,et al,eds,1987;the series Methods inEnzymology(Academic Press,Inc.);PCR2:A Practical Approach,MacPherson MJ,Hams BD,Taylor GR,eds,1995;Antibodies:ALaboratory Manual,Harlow and Lane,eds,1988所述。
本发明在如下实施例中得以进一步解释。所述实施例非以任何方式限制本发明。所述实施例只是为了阐明本发明。
实施例
实施例1:STAR67载体的构建
使用如WO 03/004704所述遗传筛选方法分离到一种新的抗阻抑物序列,将这个新序列称作STAR67(SEQ.ID.NO.66)。测试了STAR67对转基因在哺乳动物细胞中表达的作用。在此我们描述了各种构建体的构建。
材料和方法
产生三种质粒(图1):
A)CMV-d2EGFP-ires-Zeo(CMV对照),
B)STAR67-CMV-d2EGFP-ires-Zeo(CMV-STAR67),
C)STAR7-STAR67-CMV-d2EGFP-ires-Zeo-STAR7(CMV-STAR67 7/7)
构建体A的构建如下所述。将质粒pd2EGFP(Clontech 6010-1)通过在BsiWI位点插入一个接头而修饰,产生pd2EGFP-link。通过退火寡核苷酸GTACGGATATCAGATCTTTAATTAAG(SEQ.ID.NO.67)和GTACCTTAATTAAAGATCTGATAT(SEQ.ID.NO.68)产生的这一接头导入PacI、BglII和EcoRV限制性核酸内切酶位点。这样产生了多克隆位点MCSII用以插入STAR元件。然后使用引物GATCAGATCTGGCGCGCCATTTAAATCGTCTCGCGCGTTTCGGTGATGACGG(SEQ.ID.NO.69)和(AGGCGGATCCGAATGTATTTAGAAAAATAAACAAATAGGGG(SEQ.ID.NO.70)扩增pd2EGFP中的一个0.37kb区域,将其插入在pIRES(Clontech 6028-1)的BglII位点,产生pIRES-stuf。这样在MCSI导入AscI和SwaI限制性核酸内切酶的位点,并且作为“填充片段”避免STAR元件与相邻启动子之间的潜在干扰。将pIRES-stuf用BglII和FspI消化以释放由填充片段、CMV启动子、IRES元件(两侧为多克隆位点MCS A和MCSB)及SV40聚腺苷酸化信号组成的DNA片段。将这个片段与通过BamHI和StuI消化产生的pd2EGFP-link的载体主链连接,产生pIRES-link。
如下所述将zeocin抗性基因的开放读框插入pIRES下游的BamHI/NotI位点:通过使用引物GATCGGATCCTTCGAAATGGCCAAGTTGACCAGTGC(SEQ.ID.NO.71)和AGGCGCGGCCGCAATTCTCAGTCCTGCTCCTC(SEQ.ID.NO.72)经PCR从质粒pCMV/zeo(Invitrogen,cat.no.V50120)中扩增zeocin-抗性ORF,用BamHI和NotI消化,并与BamHI/NotI-消化的pIRES-link连接,产生pIRES-link-zeo。将d2EGFP报道ORF导入pIRES-link-zeo中,这通过使用引物GATCGAATTCTCGCGAATGGTGAGCAAGCAGATCCTGAAG(SEQ.ID.NO.73)和AGGCGAATTCACCGGTGTTTAAACTTACACCCACTCGTGCAGGCTGCCCAGG(SEQ.ID.NO.74)扩增pd2EGFP(Clontech 6010-1),及将EcoRI-消化的d2EGFP表达盒插入pIRES-link-zeo质粒中的EcoRI位点而进行。这样产生构建体A,即CMV-d2EGFP-IRES-Zeo(CMV对照)。
将STAR67克隆在CMV启动子上游AscI位点(在STAR67与启动子之间保留大约15个核苷酸)。这样产生构建体B,即STAR67-CMV-d2EGFP-ires-Zeo(CMV-STAR67)。
还将STAR67置于还含有STAR7(SEQ.ID.NO.7)的表达盒中进行了测试,所述STAR7被定向克隆在5’SalI和XbaI位点以及3’BglII和PacI位点以使STAR7位于整个表达盒的两侧。这是构建体C(CMV-STAR67 7/7)。
实施例2:在稳定转染的CHO细胞中STAR67增强从CMV、EF1α和UB6启动子的表达水平
我们测试了CMV、EF1α和UB6启动子邻近存在STAR67是否影响这些启动子在CHO细胞中的表达水平。用于这个目的的构建体是实施例1所述的构建体A和B(图1),它们针对各自的启动子进行修饰:
1 CMV-d2EGFP-ires-Zeo(CMV对照)
2 STAR67-CMV-d2EGFP-ires-Zeo(CMV-STAR67)
3 EF1α-d2EGFP-ires-Zeo(EF1α对照)
4 STAR67-EF1α-d2EGFP-ires-Zeo(EF1α-STAR67)
5 UB6-d2EGFP-ires-Zeo(UB6对照)
6 STAR67-UB6-d2EGFP-ires-Zeo(UB6-STAR67).
材料和方法
将图1所述质粒中的CMV启动子更换为UB6和EF1α启动子。UB6启动子如下克隆。如实施例1所述,将pd2EGFP质粒的0.37kbDNA填充片段经使用SEQ.ID.NO.69和70引物进行PCR扩增。将所得DNA填充片段克隆进pUB6/V5-His[Invitrogen V250-20]的BglII位点,产生pUB6-stuf。从pUB6-stuf中,将一个AscI-SacI片段克隆进CMV-d2EGFP-IRES-Zeo中,从中除去CMV启动子。
用pEF1α/V5-His[Invitrogen V920-20]作为模板使用引物GATCGGCGCGCCATTTAAATCCGAAAAGTGCCACCTGACG(SEQ.ID.NO.79)和AGGCGGGACCCCCTCACGACACCTGAAATGGAAG(SEQ.ID.NO.80)经PCR扩增EF1α启动子。将PCR片段克隆进CMV-d2EGFP-IRES-Zeo的AscI和PpuMI位点,从中除去CMV启动子。
将中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)在HAMS-F12培养基+10%胎牛血清及2mM谷氨酰胺、100U/ml青霉素和100μg/ml链霉素中在37℃/5%CO2条件下培养。使用SuperFect(QIAGEN)根据厂商所述将细胞用质粒转染。简而言之,将细胞接种在培养容器中并生长过夜至70-90%铺满。将SuperFect试剂与质粒DNA以6μl/μg比率组合(例如对于10cm Petri培养皿,使用20μgDNA和120μl SuperFect)并加入细胞中。在过夜保温后,将转染混和物用新鲜培养基置换并进一步保温转染的细胞。在过夜培养后,将细胞经胰蛋白酶消化并接种在具有新鲜培养基的新鲜培养容器中。在再次过夜保温之后,加入zeocin至浓度为50μg/ml并进一步培养细胞。过三天后,将培养基用含有zeocin(100μg/ml)的新鲜培养基置换并进一步培养。当可见各个集落时(大约转染后10天),除去培养基,用无zeocin的新鲜培养基更换。分离各个克隆并移至无zeocin的24孔平板中。在分离集落1天后,向培养基中加入zeocin。在转染后大约3周评定d2EGFP报道基因的表达。两周后测定集落中的d2EGFP表达水平。当在转染后最初的两周后第一次测定d2EGFP时,将集落在无zeocin或者其它抗生素的培养基中培养。这持续至实验结束。
结果
图2示出了与无STAR67的“空白”对照CMV对照相比,含有克隆在CMV启动子上游的STAR67的构建体的转染产生了许多表达显著较高水平d2EGFP蛋白的CHO集落。当在转染后25天测定时,用CMV对照质粒转染的10个集落中d2EGFP信号平均值为34。在转染后60天,这10个集落中d2EGFP信号平均值降低为13,表明表达随着时间的推移是不稳定的。对比之下,当在转染后25天测定时用STAR67-CMV质粒转染的10个集落中d2EGFP信号的平均值为42,在转染后60天测定时为32。因此在转染后60天,在稳定转染的克隆中包含STAR67的CMV构建体比CMV启动子驱动的报道蛋白表达水平高2.5倍。重要的是在转染25天后,在第一次测定之后,通过将集落在无zeocin的培养基中培养而除去选择压力。因此,含有STAR67构建体的集落在无选择压力的条件下与不含STAR67构建体的集落相比随着时间的推移是更稳定的。
图3示出了与无STAR67的“空白”对照EF1α对照相比,含有克隆在EF1α启动子上游的STAR67的构建体的转染产生了表达显著较高水平d2EGFP蛋白的许多CHO集落。当在转染后25天测定时,用EF1α对照质粒转染的10个集落中d2EGFP信号平均值为31。在转染后60天,这10个集落中信号平均值为26。对比之下,当在转染后25天测定时用EF1α-STAR67质粒转染的10个集落中d2EGFP信号的平均值为60,在转染后60天测定时为76。因此在转染后25和60天,在稳定转染的克隆中包含STAR67的EF1α构建体比EF1α启动子驱动的报道蛋白表达水平高2.9倍。
图4示出了与无STAR67的“空白”对照UB6对照相比,含有克隆在UB6启动子上游的STAR67的构建体的转染产生了许多表达显著较高水平d2EGFP蛋白的CHO集落。当在转染后25天测定时,用UB6对照质粒转染的10个集落中d2EGFP信号平均值为51。在转染后60天,这10个集落中信号平均值为29,表明该表达随着时间的推移是不稳定的。对比之下,当在转染后25天测定时用UB6-STAR67质粒转染的10个集落中d2EGFP信号的平均值为218,在转染后60天测定时为224。因此在转染后25天,在稳定转染的克隆中包含STAR67的UB6构建体比UB6启动子驱动的报道蛋白表达水平高4.3倍。在60天后高7.7倍,这是由于对照集落的表达不稳定性和UB6-STAR67集落的稳定性所致。重要的是在转染25天后,在第一次测定后,通过将集落在无zeocin的培养基中培养而除去选择压力。因此,含有STAR67构建体的集落在无选择压力的条件下与不含有STAR67构建体的集落相比随着时间的推移是更稳定的。
总之,STAR67增加从三种不同的彼此不相关的启动子的表达。实施例3:在稳定转染的PER.C6细胞中STAR67增强从CMV、EF1α和UB6启动子的表达水平
我们测试了在CMV、EF1α和UB6启动子邻近存在STAR67是否影响这些启动子在除了CHO细胞之外的另一种细胞类型即人PER.C6细胞中的表达水平。使用如实施例1中的相同构建体。
材料和方法
PER.C6细胞的转染、培养和分析
将PER.细胞在DMEM培养基+吡哆醇+9%胎牛血清(非加热而失活)、8.9mM MgCl2、100U/ml青霉素和100μg/ml链霉素中在37℃/10%CO2条件下培养。使用Lipofectamine 2000(Invitrogen)如厂商所述将细胞用质粒转染。简而言之,将细胞接种在6孔平板中并生长过夜至70-90%铺满。将Lipofectamine试剂与质粒DNA以15μl/3μg比率组合(例如对于10cm Petri培养皿,使用20μg DNA和120μl Lipofectamine),在25℃保温30分钟之后加入细胞中。在保温β小时之后,将转染混合物用新鲜培养基置换,并进一步保温转染的细胞。在培养过夜后,将细胞经胰蛋白酶消化并接种于(1∶15、1∶30、1∶60、1∶120稀释)新鲜petri培养皿(90mm)中的含有100μg/ml浓度的zeocin的新鲜培养基,进一步培养细胞。当可见集落时,通过刮擦分离各个集落并移至24孔平板中的含有zeocin的培养基中。当生长至大约70%铺满时,将细胞移至6孔平板中。将稳定的集落在6孔平板中扩增2周,之后在XL-MCL Beckman Coulter流式细胞计量仪上确定d2EGFP信号。取d2EGFP信号的平均值作为d2EGFP表达水平的量值。2周后对集落再次测量。之后将集落在无zeocin的条件下进一步培养。
结果
图5示出了与无STAR67的“空白”对照CMV对照相比,含有克隆在CMV启动子上游的STAR67的构建体的转染产生了许多表达显著较高水平d2EGFP蛋白的PER.C6集落。当在转染后30天测定时,用CMV对照质粒转染的10个集落中d2EGFP信号平均值为37。在转染后60天,这10个集落中信号平均值降低为14,表明该表达随着时间的推移是不稳定的。对比之下,当在转染后30天测定时用STAR67-CMV质粒转染的10个集落中d2EGFP信号的平均值为101,在转染后60天测定时为45。因此在转染后60天,在稳定转染的克隆中包含STAR67的CMV构建体比CMV启动子驱动的报道蛋白表达水平高3.2倍。
图6示出与无STAR67的“空白”对照EF1α对照相比,含有克隆在EF1α-启动子上游的STAR67的构建体的转染产生了许多表达显著较高水平d2EGFP蛋白的PER.C6集落。在转染30天后测定时,用EF1α对照质粒转染的10个集落中d2EGFP信号的平均值为5。在转染60天后这10个集落中d2EGFP信号平均值为6。对比之下,当在30天后测定时,用EF1α-STAR67质粒转染的10个集落中d2EGFP信号平均值为25,在转染后60天测定时为20。因此,在转染后30和60天,在稳定转染的克隆中包含STAR67的EF1α构建体比EF1α启动子驱动的报道蛋白表达水平高4倍。
图7示出与无STAR67的“空白”对照UB6对照相比,含有克隆在UB6启动子上游的STAR67的构建体的转染产生了许多表达显著较高水平d2EGFP蛋白的PER.C6集落。在转染30天后测定时,用UB6对照质粒转染的10个集落中d2EGFP信号的平均值为4。在转染60天后这10个集落中d2EGFP信号平均值为2。对比之下,当在30天后测定时,用UB6-STAR67质粒转染的10个集落中d2EGFP信号平均值为27,在转染后60天测定时为18。因此,在转染后30和60天,在稳定转染的克隆中包含STAR67的UB6构建体比UB6启动子驱动的报道蛋白表达水平高7-9倍。
因此,与无STAR67的构建体相对比,将STAR67置于启动子上游在PER.C6细胞中产生显著较高的蛋白质表达水平。因此STAR67在不同的彼此不相关的细胞类型中均起作用。
实施例4:STAR67组合其它抗阻抑物元件的新构型在CHO细胞中增强SV40启动子
我们测试了SV40启动子邻近单独存在STAR67或者存在STAR67与另一种抗阻抑物元件(在这个实施例中是STAR7)的组合是否影响这个启动子的表达水平。用于这个目的的构建体是(见图8):
1 SV40-d2EGFP-ires-Zeo(SV40Control)
2 STAR67-SV40-d2EGFP-ires-Zeo(SV40-STAR67)
3 STAR7-SV40-d2EGFP-ires-Zeo-STAR7(SV40-STAR7/7)
4 STAR7-STAR67-SV40--d2EGFP-ires-Zeo-STAR7(SV40-STAR677/7)
材料和方法
使用pIRES作模板,使用如下引物将SV40启动子经PCR扩增:TTGGTTGGGGCGCGCCGCAGCACCATGGCCTGAAATAACCTCTGAAAGAGG(SEQ.ID.NO.81)和TTGGTTGGGAGCTCAAGCTTTTTGCAAAAGCCTAGGCCTCCAAAAAAGCCTCCTC(SEQ.ID.NO.82)。将PCR片段克隆进CMV-d2EGFP-IRES-Zeo的AscI和SacI位点,从中除去CMV启动子。如实施例2所述转染CHO细胞、分离集落及增殖和分析。
结果
图8示出了与无抗阻抑物元件的“空白”对照(SV40对照)相比,含有克隆在SV40启动子上游的STAR67的构建体(SV40-STAR67)或者含有克隆在完整构建体两侧的STAR7的构建体(SV40-STAR 7/7)的转染不产生表达明显较高水平d2EGFP蛋白的CHO集落。当在转染后40天测定时,用SV40对照质粒转染的18个集落中d2EGFP信号的平均水平为86。对比之下,当在40天后测定用SV40-STAR67质粒转染的18个集落中d2EGFP信号的平均水平为82,在40天后测定用SV40-STAR 7/7质粒转染的18个集落中信号平均水平为91。因此,观测到这些抗阻抑物元件对CHO细胞中SV40启动子无明显作用。
看起来在这些细胞中从SV40启动子的表达水平已经非常高,甚至高于用被认为是非常强的启动子的CMV启动子所观察到的表达水平。这种在CHO细胞中使用SV40启动子在无抗阻抑物元件的条件下的高背景表达,可以解释为什么观察到单独的STAR67或者位于转基因两侧的STAR7无明显作用。
然而,当在40天后测定时,用SV40-STAR67 7/7质粒转染的18个集落中d2EGFP信号的平均水平为209,这比18个对照集落的平均水平(86)高2.4倍。因此,当STAR67元件与另一种抗阻抑物元件组合使用时,产生了许多示出显著较高d2EGFP表达水平的稳定转染的CHO集落。
因此在这种新的构型中(5’-STAR序列A-STAR序列C-启动子-编码感兴趣蛋白质的核酸-STAR序列B-3’,其中在本实施例中STAR序列A和B是STAR 7,STAR序列C是STAR67),STAR元件的功能看起来均好于迄今为止揭示的构型。
我们进行了其中两侧的STAR7元件由两侧的STAR6元件(SEQ.ID.NO.6)或者两侧的STAR4元件(SEQ.ID.NO.4)置换,组合SV40启动子上游的STAR67(分别为SV40-STAR676/6和SV40-STAR674/4,使用如上述相同命名法)的实验,使用这些组合也观测到改良的表达。这证实了两侧的STAR7元件可以用其它STAR序列置换,并仍观测到具有STAR序列的表达盒的新构型的改良作用。
实施例5:STAR67与STAR7的组合在稳定转染的CHO细胞中增强UB6驱动的抗体表达水平
在实施例4中,我们示出STAR67与STAR7的组合增强了CHO细胞中d2EGFP蛋白的表达水平。在此我们测试了STAR67与STAR7的组合是否可用于产生抗体。我们选择抗EpCAM分子的抗体(Huls etal,1999)作为测试蛋白,并使用UB6启动子。
材料和方法
质粒
将重链cDNA(HC-EpCAM)克隆进包含UB6启动子的构建体中。将HC-EpCAM通过IRES序列与Zeocin抗性基因结合。将轻链cDNA(LC-EpCAM)也克隆进包含UB6启动子的构建体中。将LC-EpCAM通过IRES序列与嘌呤霉素抗性基因结合。这两个质粒代表UB6(HC+LC)对照质粒(图9)。
为了测试STAR67和STAR7的作用,将STAR67克隆进这两个HC+LC构建体中UB6启动子的上游。STAR7克隆在完整表达盒的两侧5’和3’末端(图9)。这两个质粒代表STAR7-STAR67-UB6(HC+LC)STAR7。
CHO细胞的转染和培养
将中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)如实施例2所述转染和培养,使用zeocin(100μg/ml)和嘌呤霉素(2.5μg/ml)进行选择。在转染后1天,向培养基中加入zeocin。当可见第一个集落时(大约加入zeocin 7天后),除去培养基并用含有嘌呤霉素的培养基置换。在大约7天后,分离集落并移至24孔平板中仅含有zeocin的培养基中。
结果
图9示出与没有STAR67和STAR7的“空白”对照UB6(HC+LC)对照相对比,含有克隆在UB6启动子上游的STAR67及克隆在完整表达盒两侧的两个STAR7元件的抗体构建体的转染产生了大量表达显著较高水平EpCAM抗体的CHO集落(使用抗人IgG抗体通过ELISA测定)。当在转染后25天测定时,用UB6(HC+LC)对照质粒转染的18个集落中EpCAM的产量平均为2.7pg/细胞/天。25天后除去选择剂zeocin和嘌呤霉素。转染后45天,这18个集落中EpCAM的产量平均为2.7pg/细胞/天。对比之下,当在转染后25天测定时,用STAR7-STAR67-UB6(HC+LC)-STAR7质粒转染的18个集落中EpCAM产量信号平均为6.7pg/细胞/天,在转染后45天测定时是7.7pg/细胞/天。因此,在转染30和45天后,在稳定转染的CHO克隆中包含STAR67/STAR7的UB6构建体与UB6启动子驱动的EpCAM表达水平相比高2.5-2.9倍。
因此,与不含STAR67/STAR7的构建体相比,将STAR67置于启动子上游及将两个STAR7元件置于表达盒两侧导致CHO细胞中显著较高的EpCAM抗体表达水平。
实施例6:STAR67不是增强子阻断剂(enhancer blocker),而STAR6和STAR7是增强子阻断剂
已对其性质进行了测试的迄今为止所有已知STAR元件,包括STAR6和STAR7,均是增强子阻断剂(WO 03/004704,Kwaks et al,2003)。增强子阻断剂活性是通过将STAR元件置于强增强子和启动子之间而测试。在此我们测试了STAR67是否是一种增强子阻断剂。
材料和方法
将d2EGFP基因使用引物TTGGTTGGTCATGAATGGTGAGCAAGGGCGAGGAGCTGTTC(SEQ.ID.NO.75)和ATTCTCTAGACTACACATTGATCCTAGCAGAAGCAC(SEQ.ID.NO.76)经PCR扩增,并克隆进质粒pGL3-启动子(Promega)中,使用NcoI和XbaI限制位点代替萤光素酶基因以产生质粒pGL3-promoter-GFP。将一接头(通过退火寡核苷酸CGATATCTTGGAGATCTACTAGTGGCGCGCCTTGGGCTAGCT(SEQ.ID.NO.77)和GATCAGCTAGCCCAAGGCGCGCCACTAGTAGATCTCCAAGATATCGAGCT(SEQ.ID.NO.78)而产生)克隆进SacI和BglII位点,产生多克隆位点。原始的BglII位点基于接头的连接而被破坏,产生接头DNA内一新的唯一的BglII位点。使用BsaBI和BamHI将SV40-增强子从质粒pGL3-basic(Promega)中切下,并使用EcoRV和BglII位点克隆进pGL3-linker-promoter-GFP中,产生质粒pGL3-enhancer-promoter-GFP。使用KpnI和SacI位点将STAR40元件(SEQ.ID.NO.40)置于SV40增强子上游,以防止增强子对上游序列的作用。最后,使用SpeI和AscI限制位点将抗阻抑物元件STAR6、STAR7和STAR67置于SV40增强子和SV40最小启动子之间。
CHO细胞的转染和培养
中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)如实施例2所述转染。在转染后1天,在Epics XL流式细胞计量仪(Beckman Coulter)上测定d2EGFP水平。
结果
图10示出STAR67不是增强子阻断剂,而STAR6和STAR7在相同分析中发挥增强子阻断剂作用。将STAR6、STAR7和STAR67克隆在d2EGFP基因上游的SV40增强子和最小SV40启动子之间。当在增强子与启动子之间无STAR元件克隆时,发生强转录激活作用(设定为100%)。当STAR6或STAR7置于增强子与启动子之间时,转录降低至背景水平,表明STAR6和STAR7是强增强子阻断剂。相反,当STAR67克隆在增强子与启动子之间时,相对的转录水平仍为对照组的80%,表明STAR67不是好的增强子阻断剂,这与如先前所述的STAR6和STAR 7以及其它抗阻抑物元件(WO 03/004704,Kwaks et al,2003)相反。
实施例7:STAR67增强稳定转染的CHO细胞中UB6和CMV驱动的抗体表达水平
在实施例5中,我们示出使用含有重链和轻链的两种不同的质粒,组合STAR67和STAR7增强CHO细胞中EpCAM抗体表达水平。在本实施例中,我们测试了当重链和轻链被置于一个质粒上时STAR67是否可以用于产生EpCAM抗体。我们针对每个选择标记使用同时选择方法。
材料和方法
质粒
重链cDNA(HC-EpCAM)在UB6启动子的控制下,并通过IRES序列与Zeocin抗性基因结合。轻链cDNA(LC-EpCAM)在CMV启动子的控制下,并通过IRES序列与嘌呤霉素抗性基因结合。基本上这些是实施例5中使用的构建体。将这两种表达盒置于一个质粒上,使这两个表达单位的转录具有相反方向。在对照质粒中,UB6与CMV启动子由一500bp填充片段间隔(EpCAM对照)(图10)。在另一个质粒中,将STAR67置于UB6与CMV启动子之间(EpCAM STAR67)(图10)。
CHO细胞的转染和培养
将中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)如实施例2所述转染和培养,使用zeocin(100μg/ml)和嘌呤霉素(2.5μg/ml)进行选择。在实施例5中,使用针对两种选择标记的相继选择方法。相反,在此这两种选择标记同时存在于培养基中。在转染后1天,向培养基中加入zeocin和嘌呤霉素。持续存在选择培养基直至分离集落(转染后大约14天)。在分离集落并移至24孔平板中之后,将细胞在存在zeocin和嘌呤霉素的条件下培养。
结果
图11示出含有克隆在UB6和CMV启动子之间的STAR67的抗体构建体的转染产生了许多表达EpCAM抗体的CHO集落(使用抗人IgG抗体通过ELISA测定)。当在转染后25天测定时,用EpCAM STAR67质粒转染的19个集落中EpCAM产量的平均值为9.8pg/细胞/天。
相反,令人惊奇地,用EpCAM对照质粒转染无集落存活。当只用zeocin或者嘌呤霉素进行选择时,EpCAM对照集落存活。然而,当通过对重链和轻链均施加选择压力而增加选择压力时,这些条件使得只有在转染的质粒中存在STAR67的集落存活。
该结果还示出掺入STAR67对置于一个STAR67元件的上游和下游的两种启动子(UB6和CMV启动子)均具有有益作用。这表明STAR67可以双向方式操纵。
EpCAM对照和EpCAM STAR67质粒之间的差异是显著的,当选择压力较高时,只有EpCAM STAR67转染导致集落建立。这使得有机会使用这种质粒构型鉴别STAR67中介导这种作用的区域。将STAR67的较小的重叠部分置于驱动EpCAM分子的UB6和CMV启动子之间。当STAR67的一部分有功能时,集落在zeocin和嘌呤霉素同时用作选择剂时存活。当STAR67的一部分没有功能时,在相同选择条件下无集落存活。
因此,将STAR67置于启动子上游导致与没有这种抗阻抑物元件的构建体对比在CHO细胞中明显较高的EpCAM抗体表达水平。进行相似实验使用SV40启动子驱动抗-EpCAM抗体的重链和轻链的表达。在其它实验中,将STAR67用其它STAR序列置换。在进一步的实验中,改变编码重链和轻链的两个表达单位的方向,由此这两个单位的方向一致。在另一个实验中,将重链和轻链的表达单位分别置于不同的核酸分子上(如实施例5所述),对所得克隆针对两个选择标记同时进行选择。在另一个实验中,改变宿主细胞类型。组合这些变化进行实验。
附图描述
图1::本发明的示意图。
A)含有(从5’至3’)转基因(编码例如d2EGFP基因)、IRES和可选择标记(zeo,赋予zeocin抗性)的在CMV启动子控制下的双顺反子基因。表达单位在其3’末端具有SV40转录终止子(t)。该构建体的名称是CMV-d2EGFP-ires-Zeo(CMV对照)。
B)如A的构建体,但是STAR 67克隆在CMV启动子的上游。该构建体的名称是STAR67-CMV-d2EGFP-ires-Zeo(CMV-STAR67)。
C)如B的构建体,但是上游和下游STAR7元件克隆在完整构建体的两侧。该构建体的名称是STAR7-STAR67-CMV-d2EGFP-ires-Zeo-STAR7(CMV-STAR67 7/7)。
图2:STAR67改良CHO细胞中CMV驱动的d2EGFP表达。对10个单独的稳定集落的d2EGFP信号平均值针对CHO细胞中指定构建体进行绘图。A)CMV对照;B)STAR67-CMV。X(10):10个集落的平均d2EGFP表达水平。见实施例2详述。
图3:STAR67改良CHO细胞中EF1α驱动的d2EGFP表达。与图2相同,但是使用EF1α启动子。A)EF1α对照;B)STAR67-EF1α。
图4:STAR67改良CHO细胞中UB6驱动的d2EGFP表达。与图2和3相同,但是使用UB6启动子。A)UB6对照;B)STAR67-UB6。
图5:STAR67改良PER.C6细胞中CMV驱动的d2EGFP表达。与图2相同,但是是在PER.C6细胞中。A)CMV对照;B)STAR67-CMV。
图6:STAR67改良PER.C6细胞中EF1α驱动的d2EGFP表达。与图3相同,但是是在PER.C6细胞中。A)EF1α对照;B)STAR67-EF1α。
图7:STAR67改良PER.Cβ细胞中UB6驱动的d2EGFP表达。与图4相同,但是是在PER.C6细胞中。A)UBβ对照;B)STAR67-UB6。
图8:STAR67组合其它STAR元件改良CHO-K1细胞中SV40驱动的d2EGFP表达。与图2相似,但在CHO细胞中使用SV40启动子及指定的构建体。对在转染60天后的18-20个单独的稳定集落的d2EGFP信号进行绘图。A)SV40对照,SV40-STAR67,SV40-STAR7/7;B)SV40对照及SV40-STAR67 7/7。见实施例4详述。
图9:STAR67改良CHO-K1细胞中UB6驱动的EpCAM抗体表达水平。见实施例5详述。A)无STAR元件的构建体;B)具有启动子上游STAR67和两侧STAR7元件的构建体。抗-EpCAM抗体浓度以pg/细胞/天表示。X(18):18个集落的平均产生水平。
图10:STAR67不是增强子阻断剂,而STAR 6和7是。见实施例6详述。
图11:STAR67增强稳定转染的CHO细胞中UB6和CMV-驱动的抗体表达水平。见实施例7详述。A)含有抗-EpCAM重链(HC)和轻链(LC)的DNA分子,所述重链和轻链均在启动子之后,均与不同的可选择标记基因连接(同时选择用于这两种标记):无STAR元件的构建体。未发现集落;B)相同构建体,在两个启动子之间具有STAR67。抗-EpCAM抗体浓度以pg/细胞/天表示。X(19):19个集落的平均产生水平。
参考文献
Boshart,M,Weber,F,Jahn,G,Dorsch-Hasler,K,Fleckenstein,B,and Schaffner,W.(1985)A very strong enhancer is located upstream ofan immediate early gene ofhuman cytomegalovirus Cell 41,521-530.
Chung JH,Whiteley M,and Felsenfeld G.(1993)A 5’element ofthe chicken beta-globin domain serves as an insulator in human erythroidcells and protects against position effect in Drosophila.Cell 74:505-514.
Chung JH,Bell AC,Felsenfeld G.(1997).Characterization of thechicken beta-globin insulator.Proc Natl Acad Sci USA 94:575-580.
Das,GC,Niyogi,SK,and Salzman,NP.(1985)SV40 promotersand their regulation Prog Nucleic Acid Res Mol Biol 32,217-236.
Gill DR,Smyth SE,Goddard CA,Pringle IA,Higgins CF,Colledge WH,and Hyde SC.(2001)Increased persistence of lung geneexpression using plasmids containing the ubiquitin C or elongation factor1αpromoter.Gene Therapy 8:1539-1546.
Gossen M,and Bujard H.(1992)Tight control of gene expressionin mammalian cells by tetracycline-responsive promoters.Proc Natl AcadSci USA 89:5547-5551.
Graham FO,Smiley J,Russell W and Nairn R.(1977).Characteristics of a human cell line transformed by DNA from humanadenovirus type 5.J.Gen.Virol.36,59-72.
Huls GA,Heijnen IAFM,Cuomo ME,Koningsberger JC,Wiegman L,Boel E,van der Vuurst-de Vries A-R,Loyson SAJ,HelfrichW,van Berge Henegouwen GP,van Meijer M,de Kruif J,Logtenberg T.(1999).A recombinant,fully human monoclonal antibody with antitumoractivity constructed from phage-displayed antibody fragments.NatBiotechnol.17,276-281.
Jones D,Kroos N,Anema R,Van Montfort B,Vooys A,Van DerKraats S,Van Der Helm E,Smits S,Schouten J,Brouwer K,Lagerwerf F,Van Berkel P,Opstelten D-J,Logtenberg T,Bout A(2003)High-levelexpression of recombinant IgG in the human cell line PER.C6.Biotechnol.Prog.19:163-168.
Kaufman,RJ.(2000)Overview of vector design for mammaliangene expression Mol Biotechnol 16,151-160.
Kaufman,RJ,and Sharp,PA.(1982)Construction of a modulardihydrofolate reductase cDNA gene:analysis of signals utilized forefficient expression Mol Cell Biol 2,1304-1319.
Kellum R,and Schedl P.(1991)A position-effect assay forboundaries of higher order chromosomal domains.Cell 64:941-950.
Kwaks TH,Barnett P,Hemrika W,Siersma T,Sewalt RG,SatijnDP,Brons JF,van Blokland R,Kwakman P,Kruckeberg AL,Kelder A,Otte AP.(2003)Identification of anti-repressor elements that confer highand stable protein production in mammalian cells.Nat Biotechnol 21,553-558.Erratum in:Nat Biotechnol 21,822(2003).
Phi-Van L,Von Kreis JP,Ostertag W,and WH.(1990)The chicken lysozyme 5’matrix attachment region increases transcriptionfrom a heterologous promoter in heterologous cells and dampens positioneffects on the expression of transfected genes.Mol.Cell.Biol.10:2302-2307.
Lopez de Quinto,S,and Martinez-Salas,E.(1998)Parametersinfluencing translational efficiency in aphthovirus IRES-basedbicistronic expression vectors Gene 217,51-56.
Martin,DI,and Whitelaw,E.(1996)The vagaries of variegatingtransgenes Bioessays 18,919-923.
Martinez-Salas,E.(1999)Internal ribosome entry site biology andits use in expression vectors Curr Opin Biotechnol 10,458-464.
McBurney,MW,Mai,T,Yang,X,and Jardine,K.(2002)Evidence for repeat-induced gene silencing in cultured Mammalian cells:inactivation of tandem repeats of transfected genes Exp Cell Res 274,1-8.
Migliaccio,AR,Bengra,C,Ling,J,Pi,W,Li,C,Zeng,S,Keskintepe,M,Whitney,B,Sanchez,M,Migliaccio,G,and Tuan,D.(2000)Stable and unstable transgene integration sites in the humangenome:extinction of the Green Fluorescent Protein transgene in K562cells Gene 256,197-214.
Mizuguchi,H,Xu,Z,Ishii-Watabe,A,Uchida,E,and Hayakawa,T.(2000)IRES-dependent second gene expression is significantly lowerthan cap-dependent first gene expression in a bicistronic vector Mol Ther1,376-382.
Rees,S,Coote,J,Stables,J,Goodson,S,Harris,S,and Lee,MG.(1996)Bicistronic vector for the creation of stable mammalian cell linesthat predisposes all antibiotic-resistant cells to express recombinantprotein Biotechniques 20,102-104,106,108-110.
Schorpp,M,Jager,R,Schellander,K,Schenkel,J,Wagner,EF,Weiher,H,and Angel,P.(1996)The human ubiquitin C promoter directshigh ubiquitous expression of transgenes in mice Nucleic Acids Res 24,1787-8.
Strutzenberger,K,Borth,N,Kunert,R,Steinfellner,W,andKatinger,H.(1999)Changes during subclone development and ageing ofhuman antibody-producing recombinant CHO cells J Biotechnol 69,215-26.
Van der Vlag,J,den Blaauwen,JL,Sewalt,RG,van Driel,R,andOtte,AP.(2000)Transcriptional repression mediated by polycomb groupproteins and other chromatin-associated repressors is selectively blockedby insulators J Biol Chem 275,697-704.
Whitelaw,E,Sutherland,H,Kearns,M,Morgan,H,Weaving,L,and Garrick,D.(2001)Epigenetic effects on transgene expressionMethods Mol Biol 158,351-68.
序列表
<110>科罗迈吉尼科斯公司
<120>改良核酸表达的新序列
<130>0111WO 00 ORD
<150>PCT/EP2004/051405
<151>2004-07-08
<160>82
<170>PatentIn version 3.2
<210>1
<211>749
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR1
<400>1
atgcggtggg ggcgcgccag agactcgtgg gatccttggc ttggatgttt ggatctttct 60
gagttgcctg tgccgcgaaa gacaggtaca tttctgatta ggcctgtgaa gcctcctgga 120
ggaccatctc attaagacga tggtattgga gggagagtca cagaaagaac tgtggcccct 180
ccctcactgc aaaacggaag tgattttatt ttaatgggag ttggaatatg tgagggctgc 240
aggaaccagt ctccctcctt cttggttgga aaagctgggg ctggcctcag agacaggttt 300
tttggccccg ctgggctggg cagtctagtc gaccctttgt agactgtgca cacccctaga 360
agagcaacta cccctataca ccaggctggc tcaagtgaaa ggggctctgg gctccagtct 420
ggaaaatctg gtgtcctggg gacctctggt cttgcttctc tcctcccctg cactggctct 480
gggtgcttat ctctgcagaa gcttctcgct agcaaaccca cattcagcgc cctgtagctg 540
aacacagcac aaaaagccct agagatcaaa agcattagta tgggcagttg agcgggaggt 600
gaatatttaa cgcttttgtt catcaataac tcgttggctt tgacctgtct gaacaagtcg 660
agcaataagg tgaaatgcag gtcacagcgt ctaacaaata tgaaaatgtg tatattcacc 720
ccggtctcca gccggcgcgc caggctccc 749
<210>2
<211>883
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR2
<400>2
gggtgcttcc tgaattcttc cctgagaagg atggtggccg gtaaggtccg tgtaggtggg 60
gtgcggctcc ccaggccccg gcccgtggtg gtggccgctg cccagcggcc cggcaccccc 120
atagtccatg gcgcccgagg cagcgtgggg gaggtgagtt agaccaaaga gggctggccc 180
ggagttgctc atgggctcca catagctgcc ccccacgaag acggggcttc cctgtatgtg 240
tggggtccca tagctgccgt tgccctgcag gccatgagcg tgcgggtcat agtcgggggt 300
gccccctgcg cccgcccctg ccgccgtgta gcgcttctgt gggggtggcg ggggtgcgca 360
gctgggcagg gacgcagggt aggaggcggg gggcagcccg taggtaccct gggggggctt 420
ggagaagggc gggggcgact ggggctcata cgggacgctg ttgaccagcg aatgcataga 480
gttcagatag ccaccggctc cggggggcac ggggctgcga cttggagact ggccccccga 540
tgacgttagc atgcccttgc ccttctgatc ctttttgtac ttcatgcggc gattctggaa 600
ccagatcttg atctggcgct cagtgaggtt cagcagattg gccatctcca cccggcgcgg 660
ccggcacagg tagcggttga agtggaactc tttctccagc tccaccagct gcgcgctcgt 720
gtaggccgtg cgcgcgcgct tggacgaagc ctgccccggc gggctcttgt cgccagcgca 780
gctttcgcct gcgaggacag agagaggaag agcggcgtca ggggctgccg cggccccgcc 840
cagcccctga cccagcccgg cccctccttc caccaggccc caa 883
<210>3
<211>2126
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR3
<400>3
atctcgagta ctgaaatagg agtaaatctg aagagcaaat aagatgagcc agaaaaccat 60
gaaaagaaca gggactacca gttgattcca caaggacatt cccaaggtga gaaggccata 120
tacctccact acctgaacca attctctgta tgcagattta gcaaggttat aaggtagcaa 180
aagattagac ccaagaaaat agagaacttc caatccagta aaaatcatag caaatttatt 240
gatgataaca attgtctcca aaggaacaag gcagagtcgt gctagcagag gaagcacgtg 300
agctgaaaac agccaaatct gctttgtttt catgacacag gagcataaag tacacaccac 360
caactgacct attaaggctg tggtaaaccg attcatagag agaggttcta aatacattgg 420
tccctcacag gcaaactgca gttcgctccg aacgtagtcc ctggaaattt gatgtccagt 480
atagaaaagc agagcagtca aaaaatatag ataaagctga accagatgtt gcctgggcaa 540
tgttagcagc accacactta agatataacc tcaggctgtg gactccctcc ctggggagcg 600
gtgctgccgg cggcgggcgg gctccgcaac tccccggctc tctcgcccgc cctcccgttc 660
tcctcgggcg gcggcggggg ccgggactgc gccgctcaca gcggcggctc ttctgcgccc 720
ggcctcggag gcagtggcgg tggcggccat ggcctcctgc gttcgccgat gtcagcattt 780
cgaactgagg gtcatctcct tgggactggt tagacagtgg gtgcagccca cggagggcga 840
gttgaagcag ggtggggtgt cacctccccc aggaagtcca gtgggtcagg gaactccctc 900
ccctagccaa gggaggccgt gagggactgt gcccggtgag agactgtgcc ctgaggaaag 960
gtgcactctg gcccagatac tacacttttc ccacggtctt caaaacccgc agaccaggag 1020
attccctcgg gttcctacac caccaggacc ctgggtttca accacaaaac cgggccattt 1080
gggcagacac ccagctagct gcaagagttg tttttttttt tatactcctg tggcacctgg 1140
aacgccagcg agagagcacc tttcactccc ctggaaaggg ggctgaaggc agggaccttt 1200
agctgcgggc tagggggttt ggggttgagt gggggagggg agagggaaaa ggcctcgtca 1260
ttggcgtcgt ctgcagccaa taaggctacg ctcctctgct gcgagtagac ccaatccttt 1320
cctagaggtg gagggggcgg gtaggtggaa gtagaggtgg cgcggtatct aggagagaga 1380
aaaagggctg gaccaatagg tgcccggaag aggcggaccc agcggtctgt tgattggtat 1440
tggcagtgga ccctcccccg gggtggtgcc ggaggggggg atgatgggtc gaggggtgtg 1500
tttatgtgga agcgagatga ccggcaggaa cctgccccaa tgggctgcag agtggttagt 1560
gagtgggtga cagacagacc cgtaggccaa cgggtggcct taagtgtctt tggtctcctc 1620
caatggagca gcggcggggc gggaccgcga ctcgggttta atgagactcc attgggctgt 1680
aatcagtgtc atgtcggatt catgtcaacg acaacaacag ggggacacaa aatggcggcg 1740
gcttagtcct acccctggcg gcggcggcag cggtggcgga ggcgacggca ctcctccagg 1800
cggcagccgc agtttctcag gcagcggcag cgcccccggc aggcgcggtg gcggtggcgc 1860
gcagccaggt ctgtcaccca ccccgcgcgt tcccaggggg aggagactgg gcgggagggg 1920
ggaacagacg gggggggatt caggggcttg cgacgcccct cccacaggcc tctgcgcgag 1980
ggtcaccgcg gggccgctcg gggtcaggct gcccctgagc gtgacggtag ggggcggggg 2040
aaaggggagg agggacaggc cccgcccctc ggcagggcct ctagggcaag ggggcggggc 2100
tcgaggagcg gaggggggcg gggcgg 2126
<210>4
<211>1625
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR4
<400>4
gatctgagtc atgttttaag gggaggattc ttttggctgc tgagttgaga ttaggttgag 60
ggtagtgaag gtaaaggcag tgagaccacg taggggtcat tgcagtaatc caggctggag 120
atgatggtgg ttcagttgga atagcagtgc atgtgctgta acaacctcag ctgggaagca 180
gtatatgtgg cgttatgacc tcagctggaa cagcaatgca tgtggtggtg taatgacccc 240
agctgggtag ggtgcatgtg gtgtaacgac ctcagctggg tagcagtgtg tgtgatgtaa 300
caacctcagc tgggtagcag tgtacttgat aaaatgttgg catactctag atttgttatg 360
agggtagtgc cattaaattt ctccacaaat tggttgtcac gtatgagtga aaagaggaag 420
tgatggaaga cttcagtgct tttggcctga ataaatagaa gacgtcattt ccagttaatg 480
gagacaggga agactaaagg tagggtggga ttcagtagag caggtgttca gttttgaata 540
tgatgaactc tgagagagga aaaacttttt ctacctctta gtttttgtga ctggacttaa 600
gaattaaagt gacataagac agagtaacaa gacaaaaata tgcgaggtta tttaatattt 660
ttacttgcag aggggaatct tcaaaagaaa aatgaagacc caaagaagcc attagggtca 720
aaagctcata tgccttttta agtagaaaat gataaatttt aacaatgtga gaagacaaag 780
gtgtttgagc tgagggcaat aaattgtggg acagtgatta agaaatatat gggggaaatg 840
aaatgataag ttattttagt agatttattc ttcatatcta ttttggcttc aacttccagt 900
ctctagtgat aagaatgttc ttctcttcct ggtacagaga gagcaccttt ctcatgggaa 960
attttatgac cttgctgtaa gtagaaaggg gaagatcgat ctcctgtttc ccagcatcag 1020
gatgcaaaca tttccctcca ttccagttct caaccccatg gctgggcctc atggcattcc 1080
agcatcgcta tgagtgcacc tttcctgcag gctgcctcgg gtagctggtg cactgctagg 1140
tcagtctatg tgaccaggag ctgggcctct gggcaatgcc agttggcagc ccccatccct 1200
ccactgctgg gggcctccta tccagaaggg cttggtgtgc agaacgatgg tgcaccatca 1260
tcattcccca cttgccatct ttcaggggac agccagctgc tttgggcgcg gcaaaaaaca 1320
cccaactcac tcctcttcag gggcctctgg tctgatgcca ccacaggaca tccttgagtg 1380
ctgggcagtc tgaggacagg gaaggagtga tgaccacaaa acaggaatgg cagcagcagt 1440
gacaggagga agtcaaaggc ttgtgtgtcc tggccctgct gagggctggc gagggccctg 1500
ggatggcgct cagtgcctgg tcggctgcaa gaggccagcc ctctgcccat gaggggagct 1560
ggcagtgacc aagctgcact gccctggtgg tgcatttcct gccccactct ttccttctaa 1620
gatcc 1625
<210>5
<211>1571
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR5
<400>5
cacctgattt aaatgatctg tctggtgagc tcactgggtc tttactcgca tgctgggtcc 60
acagctccac tgtcctgcag ggtccgtgag tgtgggcccc ttatctattt catcatcata 120
accctgcgtg tcctcaactc ctggcacata ttgggtggcc ccatccacac acggttgttg 180
agtgaatcca tgagatgaca aaggctatga tgtagactat atcatgagcc agaaccaggc 240
tttcctacct ccagacaatc aagggccttg atttgggatt gagggagaaa ggagtagaag 300
ccaggaagga gaagagattg aggtttacca agggtgcaaa gtcctggccc ctgactgtag 360
gctgaaaact atagaaatga tagaacaatt ttgcaatgaa atgcagaaga ccctgcatca 420
actttaggtg ggacttcggg tatttttatg gccacagaac atcctcccat ttacctgcat 480
ggcccagaca cagacttcaa aacagttgag gccagcaggc tccaggtaag tggtaggatt 540
ccagaatgcc ctcagagtgt tgtgggaggc agcaggcgat tttcctggac ttctgagttt 600
atgagaaccc caaaccccaa ttggcattaa cattgaggtc tcaatgtatc atggcaggaa 660
gcttccgagt ggtgaaaagg aaagtgaaca tcaaagctcg gaagacaaga gggtggagtg 720
atggcaacca agagcaagac ccttccctct cctgtgatgg ggtggctcta tgtgaagccc 780
ccaaactgga cacaggtctg gcagaatgag gaacccactg agatttagcg ccaacatcca 840
gcataaaagg gagactgaca tagaatttga gttagttaaa aataaggcac aatgcttttc 900
atgtattcct gagttttgtg gactggtgtt caatttgcag cattcttagt tgattaaatc 960
tgagatgaag aaagagtgtc caacactttc accttggaaa gctctggaaa agcaaaaggg 1020
agagacaatt agcttcatcc attaactcac ttagtcatta tgcattcatt catgtaacta 1080
ccaaacacgt actgagtgcc taacactcct gagacactga gaagtttctt gggaatacaa 1140
agatgaataa aaaccacgcc aggcaggagt tggaggaagg ttctggatgc caccacgctc 1200
tacctcctgg ctggacacca ggcaatgttg gtaaccttct gcctccaatt tctgcaaata 1260
cataattaat aaacacaagg ttatcttcta aacagttctt aaaatgagtc aactttgttt 1320
aaacttgttc tttttagaga aaaatgtatt tttgaaagag ttggttagtg ctaggggaaa 1380
tgtctgggca cagctcagtc tggtgtgaga gcaggaagca gctctgtgtg tctggggtgg 1440
gtacgtatgt aggacctgtg ggagaccagg ttgggggaag gcccctcctc atcaagggct 1500
cctttgcttt ggtttgcttt ggcgtgggag gtgctgtgcc acaagggaat acgggaaata 1560
agatctctgc t 1571
<210>6
<211>1173
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR6
<400>6
tgacccacca cagacatccc ctctggcctc ctgagtggtt tcttcagcac agcttccaga 60
gccaaattaa acgttcactc tatgtctata gacaaaaagg gttttgacta aactctgtgt 120
tttagagagg gagttaaatg ctgttaactt tttaggggtg ggcgagaggg atgacaaata 180
acaacttgtc tgaatgtttt acatttctcc ccactgcctc aagaaggttc acaacgaggt 240
catccatgat aaggagtaag acctcccagc cggactgtcc ctcggccccc agaggacact 300
ccacagagat atgctaactg gacttggaga ctggctcaca ctccagagaa aagcatggag 360
cacgagcgca cagagcaggg ccaaggtccc agggacagaa tgtctaggag ggagattggg 420
gtgagggtaa tctgatgcaa ttactgtggc agctcaacat tcaagggagg gggaagaaag 480
aaacagtccc tgtcaagtaa gttgtgcagc agagatggta agctccaaaa tttgaaactt 540
tggctgctgg aaagttttag ggggcagaga taagaagaca taagagactt tgagggttta 600
ctacacacta gacgctctat gcatttattt atttattatc tcttatttat tactttgtat 660
aactcttata ataatcttat gaaaacggaa accctcatat acccatttta cagatgagaa 720
aagtgacaat tttgagagca tagctaagaa tagctagtaa gtaaaggagc tgggacctaa 780
accaaaccct atctcaccag agtacacact cttttttttt ttccagtgta atttttttta 840
atttttattt tactttaagt tctgggatac atgtgcagaa ggtatggttt gttacatagg 900
tatatgtgtg ccatagtgga ttgctgcacc tatcaacccg tcatctaggt ttaagcccca 960
catgcattag ctatttgtcc tgatgctctc cctcccctcc ccacaccaga caggccttgg 1020
tgtgtgatgt tcccctccct gtgtccatgt gttctcactg ttcagctccc acttatgagt 1080
gagaacgtgt ggtatttggt tttctgttcc tgtgttagtt tgctgaggat gatggcttcc 1140
agcttcatcc atgtccctgc aaaggacacg atc 1173
<210>7
<211>2101
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR7
<400>7
aggtgggtgg atcacccgag gtcaggagtt caagaccagc ctggccaaca tggtaaaacc 60
tcgtctctac taaaaaatac gaaaaattag ctggttgtgg tggtgcgtgc ttgtaatccc 120
agctactcgg gaggctgagg caggagaatc acttgaatct gggaggcaga ggttgcagtg 180
agctgagata gtgccattgc actccagcct gggcaacaga cggagactct gtctccaaaa 240
aaaaaaaaaa aaatcttaga ggacaagaat ggctctctca aacttttgaa gaaagaataa 300
ataaattatg cagttctaga agaagtaatg gggatatagg tgcagctcat gatgaggaag 360
acttagctta actttcataa tgcatctgtc tggcctaaga cgtggtgagc tttttatgtc 420
tgaaaacatt ccaatataga atgataataa taatcacttc tgacccccct tttttttcct 480
ctccctagac tgtgaagcag aaaccccata tttttcttag ggaagtggct acgcactttg 540
tatttatatt aacaactacc ttatcaggaa attcatattg ttgccctttt atggatgggg 600
aaactggaca agtgacagag caaaatccaa acacagctgg ggatttccct cttttagatg 660
atgattttaa aagaatgctg ccagagagat tcttgcagtg ttggaggaca tatatgacct 720
ttaagatatt ttccagctca gagatgctat gaatgtatcc tgagtgcatg gatggacctc 780
agttttgcag attctgtagc ttatacaatt tggtggtttt ctttagaaga aaataacaca 840
tttataaata ttaaaatagg cccaagacct tacaagggca ttcatacaaa tgagaggctc 900
tgaagtttga gtttgttcac tttctagtta attatctcct gcctgtttgt cataaatgcg 960
tttagtaggg agctgctaat gacaggttcc tccaacagag tgtggaagaa ggagatgaca 1020
gctggcttcc cctctgggac agcctcagag ctagtgggga aactatgtta gcagagtgat 1080
gcagtgacca agaaaatagc actaggagaa agctggtcca tgagcagctg gtgagaaaag 1140
gggtggtaat catgtatgcc ctttcctgtt ttatttttta ttgggtttcc ttttgcctct 1200
caattccttc tgacaataca aaatgttggt tggaacatgg agcacctgga agtctggttc 1260
attttctctc agtctcttga tgttctctcg ggttcactgc ctattgttct cagttctaca 1320
cttgagcaat ctcctcaata gctaaagctt ccacaatgca gattttgtga tgacaaattc 1380
agcatcaccc agcagaactt aggttttttt ctgtcctccg tttcctgacc tttttcttct 1440
gagtgcttta tgtcacctcg tgaaccatcc tttccttagt catctaccta gcagtcctga 1500
ttcttttgac ttgtctccct acaccacaat aaatcactaa ttactatgga ttcaatccct 1560
aaaatttgca caaacttgca aatagattac gggttgaaac ttagagattt caaacttgag 1620
aaaaaagttt aaatcaagaa aaatgacctt taccttgaga gtagaggcaa tgtcatttcc 1680
aggaataatt ataataatat tgtgtttaat atttgtatgt aacatttgaa taccttcaat 1740
gttcttattt gtgttatttt aatctcttga tgttactaac tcatttggta gggaagaaaa 1800
catgctaaaa taggcatgag tgtcttatta aatgtgacaa gtgaatagat ggcagaaggt 1860
ggattcatat tcagttttcc atcaccctgg aaatcatgcg gagatgattt ctgcttgcaa 1920
ataaaactaa cccaatgagg ggaacagctg ttcttaggtg aaaacaaaac aaacacgcca 1980
aaaaccttta ttctctttat tatgaatcaa atttttcctc tcagataatt gttttattta 2040
tttattttta ttattattgt tattatgtcc agtctcactc tgtcgcctaa gctggcatga 2100
t 2101
<210>8
<211>1821
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR8
<400>8
gagatcacct cgaagagagt ctaacgtccg taggaacgct ctcgggttca caaggattga 60
ccgaacccca ggatacgtcg ctctccatct gaggcttgct ccaaatggcc ctccactatt 120
ccaggcacgt gggtgtctcc cctaactctc cctgctctcc tgagcccatg ctgcctatca 180
cccatcggtg caggtccttt ctgaagagct cgggtggatt ctctccatcc cacttccttt 240
cccaagaaag aagccaccgt tccaagacac ccaatgggac attccccttc cacctccttc 300
tccaaagttg cccaggtgtt catcacaggt tagggagaga agcccccagg tttcagttac 360
aaggcatagg acgctggcat gaacacacac acacacacac acacacacac acacacacac 420
acacgactcg aagaggtagc cacaagggtc attaaacact tgacgactgt tttccaaaaa 480
cgtggatgca gttcatccac gccaaagcca agggtgcaaa gcaaacacgg aatggtggag 540
agattccaga ggctcaccaa accctctcag gaatattttc ctgaccctgg gggcagaggt 600
tggaaacatt gaggacattt cttgggacac acggagaagc tgaccgacca ggcattttcc 660
tttccactgc aaatgaccta tggcgggggc atttcacttt cccctgcaaa tcacctatgg 720
cgaggtacct ccccaagccc ccacccccac ttccgcgaat cggcatggct cggcctctat 780
ccgggtgtca ctccaggtag gcttctcaac gctctcggct caaagaagga caatcacagg 840
tccaagccca aagcccacac ctcttccttt tgttataccc acagaagtta gagaaaacgc 900
cacactttga gacaaattaa gagtccttta tttaagccgg cggccaaaga gatggctaac 960
gctcaaaatt ctctgggccc cgaggaaggg gcttgactaa cttctatacc ttggtttagg 1020
aaggggaggg gaactcaaat gcggtaattc tacagaagta aaaacatgca ggaatcaaaa 1080
gaagcaaatg gttatagaga gataaacagt tttaaaaggc aaatggttac aaaaggcaac 1140
ggtaccaggt gcggggctct aaatccttca tgacacttag atataggtgc tatgctggac 1200
acgaactcaa ggctttatgt tgttatctct tcgagaaaaa tcctgggaac ttcatgcact 1260
gtttgtgcca gtatcttatc agttgattgg gctcccttga aatgctgagt atctgcttac 1320
acaggtcaac tccttgcgga agggggttgg gtaaggagcc cttcgtgtct cgtaaattaa 1380
ggggtcgatt ggagtttgtc cagcattccc agctacagag agccttattt acatgagaag 1440
caaggctagg tgattaaaga gaccaacagg gaagattcaa agtagcgact tagagtaaaa 1500
acaaggttag gcatttcact ttcccagaga acgcgcaaac attcaatggg agagaggtcc 1560
cgagtcgtca aagtcccaga tgtggcgagc ccccgggagg aaaaaccgtg tcttccttag 1620
gatgcccgga acaagagcta ggcttccgga gctaggcagc catctatgtc cgtgagccgg 1680
cgggagggag accgccggga ggcgaagtgg ggcggggcca tccttctttc tgctctgctg 1740
ctgccgggga gctcctggct ggcgtccaag cggcaggagg ccgccgtcct gcagggcgcc 1800
gtagagtttg cggtgcagag t 1821
<210>9
<211>1929
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR9
<400>9
cacttcctgg gagtggagca gaggctctgc gtggagcatc catgtgcagt actcttaggt 60
acggaaggga ttgggctaaa ccatggatgg gagctgggaa gggaagggac caacttcagg 120
ccccactggg acactggagc tgccaccctt tagagccctc ctaaccctac accagaggct 180
gagggggacc tcagacatca cacacatgct ttcccatgtt ttcagaaatc tggaaacgta 240
gaacttcagg ggtgagagtg cctagatatt gaatacaagg ctagattggg cttctgtaat 300
atcccaaagg accctccagc tttttcacca gcacctaatg cccatcagat accaaagaca 360
cagcttagga gaggttcacc ctgaagctga ggaggaggca gccggattag agttgactga 420
gcaaggatga ctgccttctc cacctgacga tttcagctgc tgcccttttc ttttcctggg 480
aatgcctgtc gccatggcct tctgtgtcca caggagagtt tgacccagat actcatggac 540
caggcaaagg tgctgttcct cccagcccag ggcccaccat gaagcatgcc tgggagcctg 600
gtaaggaccc agccactcct gggctgttga cattggcttc tcttgcccag cattgtagcc 660
acgccactgc attgtactgt gagataagtc aaggtgggct caccaggacc tgcactaaat 720
tgtgaaattc agctccaaag aactttggaa attacccatg catttaagca aaatgaatga 780
tacctgagca aaccctttca cattggcaca agttacaatc ctgtctcatc ctcttgatta 840
caaattccat ccaggcaaga gctgtatcac cctgaggtct ccccattcat gttttggtca 900
ataatattta gtttcctttt gaaaatagat ttttgtgtta ctccattatg atgggcagag 960
gccagatgct tatattctat ttaaatgact atgtttttct atctgtaact gggtttgtgt 1020
tcaggtggta aatgcttttt ttttgcagtc agaagattcc tggaaggcga ccagaaatta 1080
gctggcegct gtcagacctg aagttacttc taaagggcct ttagaaatga attctttttt 1140
atgccttctc tgaattctga gaagtaggct tgacttcccc taagtgtgga gttgggagtc 1200
aactcttctg aaaagaaagt ttcagagcat tttccaaagc catggtcagc tgtgggaagg 1260
gaagacgatg gatagtacag ttgccggaaa acactgatgg aggcggatgc tccagctcag 1320
ccaaagacct ttgttctgcc caccccagaa atgccccttc ctcaatcgca gaaacgttgc 1380
cccatggctc ctgatactca gaatgcagcc tctgaccagg accatctgca tcctccagga 1440
gctcgtaaga aatgcagcat cgtgggacct gctggcacct ggtgaaccca aacctgcagg 1500
gctcctgggt gtgcttgggg cggctgcagg ggaagaggga gtcagcagcc tcctcctgac 1560
cttcccgggg gctgcttttc tgaggggcca gaatgcaccg gttgaccttg ttgcatcact 1620
ggcccatgac tggctgcttt ggtcaggtgt aaaaaggtgt ttccagaggg tctgctcctc 1680
tcactatcgg accaggtttc catggagagc tcagcctccc agcaaggata gagaacttca 1740
aatggctcaa agaactgaga ggccacacat gtgtgacctg aatagtctct gctgcaaaac 1800
aaagggtttc ttaatgtaaa acgttctctt cctcacagag gggttcccag ctgctagtgg 1860
gcatgttgca ggcatttcct gggctgcatc aggttgtcat aagccagagg atcatttttg 1920
ggggctcat 1929
<210>10
<211>1167
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR10
<220>
<221>misc_feature
<222>(452)..(1143)
<223>n is a,c,g,or t on various positions
<400>10
aggtcaggag ttcaagacca gcctggccaa catggtgaaa ccctgtccct acaaaaaata 60
caaaaattag ccgggcgtgg tggggggcgc ctataatccc agctactcag gatgctgaga 120
caggagaatt gtttgaaccc gggaggtgga ggttgcagtg aactgagatc gcgccactgc 180
actccagcct ggtgacagag agagactccg tctcaacaac agacaaacaa acaaacaaac 240
aacaacaaaa atgtttactg acagctttat tgagataaaa ttcacatgcc ataaaggtca 300
ccttctacag tatacaattc agtggattta gtatgttcac aaagttgtac gttgttcacc 360
atctactcca gaacatttac atcaccccta aaagaagctc tttagcagtc acttctcatt 420
ctccccagcc cctgccaacc acgaatctac tntctgtctc tattctgaat atttcatata 480
aaggagtcct atcatatggg ccttttacgt ctaccttctt tcacttagca tcatgttttt 540
aagattcatc cacagtgtag cacgtgtcag ttaattcatt tcatcttatg gctggataat 600
gctctattgt atgcatatcc ctcactttgc ttatccattc atcaactgat tgacatttgg 660
gttatttcta ctttttgact attatgagta atgctgctat gaacattcct gtaccaatcg 720
ttacgtggac atatgctttc aattctcctg agtatgtaac tagggttgga gttgctgggt 780
catatgttaa ctcagtgttt catttttttg aagaactacc aaatggtttt ccaaagtgga 840
tgcaacactt tacattccca ccagcaagat atgaaggttc caatgtctct acatttttgc 900
caacacttgt gattttcttt tatttattta tttatttatt tatttttgag atggagtctc 960
actctgtcac ccaggctgga gtgcagtggc acaatttcag ctcactgcaa tctccacctc 1020
tcgggctcaa gcgatactcc tgcctcaacc tcccgagtaa ctgggattac aggcgcccac 1080
caccacacca agctaatttt ttgtattttt agtagagacg gggtttcatc atgtcggcca 1140
ggntgtactc gaactctgac ctcaagt 1167
<210>11
<211>1377
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR11
<400>11
aggatcactt gagcccagga gttcaagacc agcctgggca acatagcgag aacatgtctc 60
aaaaaggaaa aaaatggggg aaaaaaccct cccagggaca gatatccaca gccagtcttg 120
ataagctcca tcattttaaa gtgcaaggcg gtgcctccca tgtggatgat tatttaatcc 180
tcttgtactt tgtttagtcc tttgtggaaa tgcccatctt ataaattaat agaattctag 240
aatctaatta aaatggttca actctacatt ttactttagg ataatatcag gaccatcaca 300
gaatgtctga gatgtggatt taccctatct gtagctcact tcttcaacca ttcttttagc 360
aaggctagtt atcttcagtg acaacccctt gctgccctct actatctcct ccctcagatg 420
gactactctg attaagcttg agctagaata agcatgttat cccgggattt catatggaat 480
attttataca tgagtgagcc attatgagtt gtttgaaaat ttattatgtt gagggagggt 540
aaccgctgta acaaccatca ccaaatctaa tcgactgaat acatttgacg tttatttctt 600
gttcacctga cagttcagtg ttacctaaat ttacatgaag acccagaggc ccacgctcct 660
tcattttggg ctccaccgac ctccaaggtt tcagggccct ctgccccgcc ttctgcaccc 720
acaggggaag agagtggagg atgcacacgc ccaggcctgg aagtgacgca tgtggcttcc 780
ccgtccacag acttcaccca cagtccattg gccttcttaa gtcatggact cctgctgagc 840
tgccagggtg catgggaaat ccatgtgact gtgtgccctg gaggaagggg agcgtttcgg 900
tgagcacaca ggagtctttg ccactagacg ctgatgagga ttccccacag gcgatgaagc 960
atggagactc atcttgtaac aaacagatga gttgttgaca tctcttaagt ttactttgtg 1020
tgcagttttt attcagatag gaaaggctgt taaaatctta acacctaact ggaagaaggg 1080
ttttagagaa gtgtggtttt cagtaagcca gttctttcca caatccaaga aacgaaataa 1140
atttccagca tggagcagtt ggcaggtaag gtttttgttg tggtctcgcc caggcttgag 1200
tgtaaccggt gtggtcatag ctcactacat tctcaaactc ctggccttaa gtcatcctcc 1260
tgcctcagcc tcccaaaggc aagtaaggtt aagaataggg gaaaggtgaa gtttcacagc 1320
ttttctagaa ttctttttat tcaagggact ctcagatcat caaacccacc cagaatc 1377
<210>12
<211>1051
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR12
<400>12
atcctgcttc tgggaagaga gtggcctccc ttgtgcaggt gactttggca ggaccagcag 60
aaacccaggt ttcctgtcag gaggaagtgc tcagcttatc tctgtgaagg gtcgtgataa 120
ggcacgagga ggcaggggct tgccaggatg ttgcctttct gtgccatatg ggacatctca 180
gcttacgttg ttaagaaata tttggcaaga agatgcacac agaatttctg taacgaatag 240
gatggagttt taagggttac tacgaaaaaa agaaaactac tggagaagag ggaagccaaa 300
caccaccaag tttgaaatcg attttattgg acgaatgtct cactttaaat ttaaatggag 360
tccaacttcc ttttctcacc cagacgtcga gaaggtggca ttcaaaatgt ttacacttgt 420
ttcatctgcc tttttgctaa gtcctggtcc cctacctcct ttccctcact tcacatttgt 480
cgtttcatcg cacacatatg ctcatcttta tatttacata tatataattt ttatatatgg 540
cttgtgaaat atgccagacg agggatgaaa tagtcctgaa aacagctgga aaattatgca 600
acagtgggga gattgggcac atgtacattc tgtactgcaa agttgcacaa cagaccaagt 660
ttgttataag tgaggctggg tggtttttat tttttctcta ggacaacagc ttgcctggtg 720
gagtaggcct cctgcagaag gcattttctt aggagcctca acttccccaa gaagaggaga 780
gggcgagact ggagttgtgc tggcagcaca gagacaaggg ggcacggcag gactgcagcc 840
tgcagagggg ctggagaagc ggaggctggc acccagtggc cagcgaggcc caggtccaag 900
tccagcgagg tcgaggtcta gagtacagca aggccaaggt ccaaggtcag tgagtctaag 960
gtccatggtc agtgaggctg agacccaggg tccaatgagg ccaaggtcca gagtccagta 1020
aggccgagat ccagggtcca gggaggtcaa g 1051
<210>13
<211>1291
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR13
<400>13
agccactgag gtcctaactg cagccaaggg gccgttctgc acatgtcgct caccctctgt 60
gctctgttcc ccacagagca aacgcacatg gcaacgttgg tccgctcagc cactggttct 120
gtggtggaac ggtggatgtc tgcactgtga catcagctga gtaagtaaca acgactgagg 180
atgccgctga cccagggctg gggaagggga ctcccagctc agacaggctt ggctgtggtt 240
tgctttggga ggagagtgaa catcacaggg aatggctcat gtcagcccca ggagggtggg 300
ctggcccctg gtccccgggc tccttctggc cctgcaggcg atagagagcc tcaacctgct 360
gccgcttctc cttggcccgg gtgatggccg tctggaagag cctgcagtag aggtgcacag 420
ccagcggaga gtcgtcattg ccgggtacag ggtaggtgat gaggcagggg ttgcagttgg 480
tgtccacgat gcccactgtg gggatgttca tcttggctgc gtctctcacg gccacgtgtg 540
gctcaaagat gttgttgagc gtgtgcagga agatgatgag gtccggcagg cggaccgtgg 600
ggccaaagag gaggcgcgcg ttggtcagca tgccgcccct gaagtagcga gtgtgggcgt 660
actcgccaca gtcacgggcc atgttctcaa tcaggtacga gaactgccgg ttgcggctta 720
taaacaagat gatgcccttg cggtaggcca tgtgggcggt gaagttcaag gccagctgga 780
ggtgcgtggc tgtctgttcc aggtcgatga tgtcgtggtc caggcggctc ccaaagatgt 840
acggctccat aaacctgcca gagaccccac caaggcaagg gggatgagag ttcacggggc 900
catctccact ggctccttgc aggaacacag acgcccacca gggactcccg ggctcctctg 960
tgggggcact atgggctggg aagcacaatt tgcaacgctc cccgtgtgca tggacagcag 1020
tgcagaccca tccaggccac ccctctgcat gcctcgtctc gtggcttaac ccctcctacc 1080
ctctacctct tcccgaagga atcctaatag aactgacccc atatggatgt gtggacatcc 1140
aacatgacgc caaaaggaca ttctgccccg tgcagctcac agggcagccg cctccgtcac 1200
tgtcctcttc ccgaggcttt gcggatgagg cccctctggg gttggactta gcggggtgct 1260
ctgggccaaa agcattaagg gatcagggca g 1291
<210>14
<211>711
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR14
<400>14
ccctggacca gggtccgtgg tcttggtggg cactggcttc ttcttgctgg gtgttttcct 60
gtgggtctct ggcaaggcac tttttgtggc gctgcttgtg ctgtgtgcgg gaggggcagg 120
tgctctttcc tcttggagct ggaccctctg gggcgggtcc ccgtcggcct ccttgtgtgt 180
tttctgcacc tggtacagct ggatggcctc ctcaatgccg tcgtcgctgc tggagtcgga 240
cgcctcgggc gcctgtacgg cgctcgtgac tcgctttccc ctccttgcgg tgctggcgtt 300
ccttttaatc ccacttttat tctgtactgc ttctgaaggg cggtgggggt tgctggcttt 360
gtgctgccct ccttctcctg cgtggtcgtg gtcgtgacct tggacctgag gcttctgggc 420
tgcacgtttg tctttgctaa ccgggggagg tctgcagaag gcgaactcct tctggacgcc 480
catcaggccc tgccggtgca ccacctttgt agccggctct tggtgggatt tcgagagtga 540
cttcgccgaa ttttcatgtg tgtctggttt cttctccact gacccatcac atttttgggt 600
ctcatgctgt cttttctcat tcagaaactg ttctatttct gccctgatgc tctgctcaaa 660
ggagtctgct ctgctcatgc tgactgggga ggcagagccc tggtccttgc t 711
<210>15
<211>1876
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR15
<400>15
gagtccaaga tcaaggtgcc agcatcttgt gagggccttc ttgttacgtc actccctagc 60
gaaagggcaa agagagggtg agcaagagaa aggggggctg aactcgtcct tgtagaagag 120
gcccattccc gagacaatgg cattcatcca ttcactccac cctcatggcc tcaccacctc 180
tcatgaggct ccacctccca gccctggttt gttggggatt aaatttccaa cacatgcctt 240
ttgggggaca tgttaaaatt atagcacccc aaatgttaca ctatcttttg atgagcggta 300
gttctgattt taagtctagc tggcctactt tttcttgcac gtgggatgct ttctgcctgt 360
tccagggcag gcagctcttc tctgtccctc tgctggcccc acctcatcct ctgttgtcct 420
cttccctcct tctgtgccct ggggtcctgg tgggggtgtg actgtcaact gcgttgggct 480
aacttttttc cctgctggtg gcccgtaatg aaagaaagct tcttgctccc aagttcctta 540
aatccaagct catagacaac gcggtctcac agcaggcctg gggccagcct cacgtgagcc 600
ccttccctgg tgtagtcact ggcatggggg aatgggattt cctgttgccc tactgtgtgg 660
ctgaggtggg ggttgcttcc tggagccagg ccttgtggaa gggcagtgcc cactgcagtg 720
gatgctgggc cctgaatctg accccagtgt tcattggctc tgtgagaccc agtgagggca 780
gggagggaag tggagctggg gtgagaagta gaggccctgc agggcccacg tgccagccac 840
caggcctcag actaggctca gatgacggag agctgcacac ctgcccaacc caggccctgc 900
agtgcccaca tgccagccgc tggggcccag acttgctcca gagggcggag agctttacac 960
cggcccaacc caggccatgg ctccaaatgc gtgacagttt tgctgttgct tcttttagtc 1020
attgtcaagt tgatgcttgt tttgcagagg accaaggctt tatgaaccta ttaccctgtg 1080
tgaagagttt caccaggtta tggaaatttc tttaaaacca taccacagtt ttttcattat 1140
tcatgtatat ttttaaaaat aattactgca ctcagtagaa taacatgaaa atgttgcctg 1200
ttagcccttt tccagtttgc cccgagaata ctgggggcac ttgtggctgc aatgtttatc 1260
ctgcggcagc tttgccatga agtatctcac ttttattatt atttttgcat tgctcgagta 1320
tattgacttt ggaaacaaaa gacatcattc tatttatagc attatgtttt tagtagtggt 1380
atttccatat acaagataca gtaattttcc gtcaatgaaa atgtcaaatt ctagaaaatg 1440
taacattcct atgcgtggtg ttaacatcgt tctctaacag ttgttggccg aagattcgtt 1500
tgatgaatcc gatttttcca aaatagccga ttctgatgat tcagacgatt ctgatgttct 1560
gtttagaaat aattccaaga acagttttta cattttattt tcacattgaa aatcagtcag 1620
atttgcttca gcctcaaaga gcacgtttat gtaaaattaa atgagtgctg gcagccagct 1680
gcgctttgtt tttctaaatg ggaaaagggt taaatttcac tcagctttta aatgacagcg 1740
cacagcctgt gtcatagagg gttggaggag atgactttaa ctgcctgtgg ttaggatccc 1800
tttcccccag gaatgtctgg gagcccactg ccgggtttgc tgtccgtctc gtttggactc 1860
agttctgcat gtactg 1876
<210>16
<211>1282
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR16
<400>16
cgcccacctc ggctttccaa agtgctggga ttacaggcat gagtcactgc gcccatcctg 60
attccaagtc tttagataat aacttaactt tttcgaccaa ttgccaatca ggcaatcttt 120
gaatctgcct atgacctagg acatccctct ccctacaagt tgccccgcgt ttccagacca 180
aaccaatgta catcttacat gtattgattg aagttttaca tctccctaaa acatataaaa 240
ccaagctata gtctgaccac ctcaggcacg tgttctcagg acctccctgg ggctatggca 300
tgggtcctgg tcctcagatt tggctcagaa taaatctctt caaatatttt ccagaatttt 360
actcttttca tcaccattac ctatcaccca taagtcagag ttttccacaa ccccttcctc 420
agattcagta atttgctaga atggccacca aactcaggaa agtattttac ttacaattac 480
caatttatta tgaagaactc aaatcaggaa tagccaaatg gaagaggcat agggaaaggt 540
atggaggaag gggcacaaag cttccatgcc ctgtgtgcac accaccctct cagcatcttc 600
atgtgttcac caactcagaa gctcttcaaa ctttgtcatt taggggtttt tatggcagtt 660
ccactatgta ggcatggttg ataaatcact ggtcatcggt gatagaactc tgtctccagc 720
tcctctctct ctcctcccca gaagtcctga ggtggggctg aaagtttcac aaggttagtt 780
gctctgacaa ccagccccta tcctgaagct attgaggggt cccccaaaag ttaccttagt 840
atggttggaa gaggcttatt atgaataaca aaagatgctc ctatttttac cactagggag 900
catatccaag tcttgcggga acaaagcatg ttactggtag caaattcata caggtagata 960
gcaatctcaa ttcttgcctt ctcagaagaa agaatttgac caagggggca taaggcagag 1020
tgagggacca agataagttt tagagcagga gtgaaagttt attaaaaagt tttaggcagg 1080
aatgaaagaa agtaaagtac atttggaaga gggccaagtg ggcgacatga gagagtcaaa 1140
caccatgccc tgtttgatgt ttggcttggg gtcttatatg atgacatgct tctgagggtt 1200
gcatccttct cccctgattc ttcccttggg gtgggctgtc cgcatgcaca atggcctgcc 1260
agcagtaggg aggggccgca tg 1282
<210>17
<211>793
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR17
<400>17
atccgagggg aggaggagaa gaggaaggcg agcagggcgc cggagcccga ggtgtctgcg 60
agaactgttt taaatggttg gcttgaaaat gtcactagtg ctaagtggct tttcggattg 120
tcttatttat tactttgtca ggtttcctta aggagagggt gtgttggggg tgggggagga 180
ggtggactgg ggaaacctct gcgtttctcc tcctcggctg cacagggtga gtaggaaacg 240
cctcgctgcc acttaacaat ccctctatta gtaaatctac gcggagactc tatgggaagc 300
cgagaaccag tgtcttcttc cagggcagaa gtcacctgtt gggaacggcc cccgggtccc 360
cctgctgggc tttccggctc ttctaggcgg cctgatttct cctcagccct ccacccagcg 420
tccctcaggg acttttcaca cctccccacc cccatttcca ctacagtctc ccagggcaca 480
gcacttcatt gacagccaca cgagccttct cgttctcttc tcctctgttc cttctctttc 540
tcttctcctc tgttccttct ctttctctgt cataatttcc ttggtgcttt cgccacctta 600
aacaaaaaag agaaaaaaat aaaataaaaa aaacccattc tgagccaaag tattttaaga 660
tgaatccaag aaagcgaccc acatagccct ccccacccac ggagtgcgcc aagacgcacc 720
caggctccat cacagggccg agagcagcgc cactctggtc gtacttttgg gtcaagagat 780
cttgcaaaag agg 793
<210>18
<211>492
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR18
<400>18
atctttttgc tctctaaatg tattgatggg ttgtgttttt tttcccacct gctaataaat 60
attacattgc aacattcttc cctcaacttc aaaactgctg aactgaaaca atatgcataa 120
aagaaaatcc tttgcagaag aaaaaaagct attttctccc actgattttg aatggcactt 180
gcggatgcag ttcgcaaatc ctattgccta ttccctcatg aacattgtga aatgaaacct 240
ttggacagtc tgccgcattg cgcatgagac tgcctgcgca aggcaagggt atggttccca 300
aagcacccag tggtaaatcc taacttatta ttcccttaaa attccaatgt aacaacgtgg 360
gccataaaag agtttctgaa caaaacatgt catctttgtg gaaaggtgtt tttcgtaatt 420
aatgatggaa tcatgctcat ttcaaaatgg aggtccacga tttgtggcca gctgatgcct 480
gcaaatt atc ct 492
<210>19
<211>1840
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR19
<400>19
tcacttcctg atattttaca ttcaaggcta gctttatgca tatgcaacct gtgcagttgc 60
acagggcttt gtgttcagaa agactagctc ttggtttaat actctgttgt tgccatcttg 120
agattcatta taatataatt tttgaatttg tgttttgaac gtgatgtcca atgggacaat 180
ggaacattca cataacagag gagacaggtc aggtggcagc ctcaattcct tgccaccctt 240
ttcacataca gcattggcaa tgccccatga gcacaaaatt tgggggaacc atgatgctaa 300
gactcaaagc acatataaac atgttacctc tgtgactaaa agaagtggag gtgctgacag 360
cccccagagg ccacagttta tgttcaaacc aaaacttgct tagggtgcag aaagaaggca 420
atggcagggt ctaagaaaca gcccatcata tccttgttta ttcatgttac gtccctgcat 480
gaactaatca cttacactga aaatattgac agaggaggaa atggaaagat agggcaaccc 540
atagttcttt ttccttttag tctttcctta tcagtaaacc aaagatagta ttggtaaaat 600
gtgtgtgagt taattaatga gttagtttta ggcagtgttt ccactgttgg ggtaagaaca 660
aaatatatag gcttgtattg agctattaaa tgtaaattgt ggaatgtcag tgattccaag 720
tatgaattaa atatccttgt atttgcattt aaaattggca ctgaacaaca aagattaaca 780
gtaaaattaa taatgtaaaa gtttaatttt tacttagaat gacattaaat agcaaataaa 840
agcaccatga taaatcaaga gagagactgt ggaaagaagg aaaacgtttt tattttagta 900
tatttaatgg gactttcttc ctgatgtttt gttttgtttt gagagagagg gatgtggggg 960
cagggaggtc tcattttgtt gcccaggctg gacttgaact cctgggctcc agctatcctg 1020
ccttagcttc ttgagtagct gggactacag gcacacacca cagtgtctga cattttctgg 1080
attttttttt tttttttatt ttttttgtga gacaggttct ggctctgtta ctcaggttgc 1140
agtgcagtgg catgatagcg gctcactgca gcctcaacct cctcagctta agctactctc 1200
ccacttcagc ctcctgagta gccaggacta cagttgtgtg ccaccacacc tgtggctaat 1260
ttttgtagag atggggtctc tccacgttgc cgaggctggt ctccaactcc tggtctcaag 1320
cgaacctcct gacttggcct cccgaagtgc tgggattaca ggcttgagcc actgcatcca 1380
gcctgtcctc tgtgttaaac ctactccaat ttgtctttca tctctacata aacggctctt 1440
ttcaaagttc ccatagacct cactgttgct aatctaataa taaattatct gccttttctt 1500
acatggttca tcagtagcag cattagattg ggctgctcaa ttcttcttgg tatattttct 1560
tcatttggct tctggggcat cacactctct ttgagttact cattcctcat tgatagcttc 1620
ttcctagtct tctttactgg ttcttcctct tctccctgac tccttaatat tgtttttctc 1680
cccaggcttt agttcttagt cctcttctgt tatctattta cacccaattc tttcagagtc 1740
tcatccagag tcatgaactt aaacctgttt ctgtgcagat aattcacatt attatatctc 1800
cagcccagac tctcccgcaa actgcagact gatcctactg 1840
<210>20
<211>780
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR20
<400>20
gatctcaagt ttcaatatca tgttttggca aaacattcga tgctcccaca tccttaccta 60
aagctaccag aaaggctttg ggaactgtca acagagctac agaaaagtca gtaaagacca 120
atggacccct caaacaaaaa cagccaagct tttctgccaa aaagatgact gagaagactg 180
ttaaagcaaa aaactctgtt cctgcctcag atgatggcta tccagaaata gaaaaattat 240
ttcccttcaa tcctctaggc ttcgagagtt ttgacctgcc tgaagagcac cagattgcac 300
atctcccctt gagtgaagtg cctctcatga tacttgatga ggagagagag cttgaaaagc 360
tgtttcagct gggcccccct tcacctttga agatgccctc tccaccatgg aaatccaatc 420
tgttgcagtc tcctttaagc attctgttga ccctggatgt tgaattgcca cctgtttgct 480
ctgacataga tatttaaatt tcttagtgct ttagagtttg tgtatatttc tattaataaa 540
gcattatttg tttaacagaa aaaaagatat atacttaaat cctaaaataa aataaccatt 600
aaaaggaaaa acaggagtta taactaataa gggaacaaag gacataaaat gggataataa 660
tgcttaatcc aaaataaagc agaaaatgaa gaaaaatgaa atgaagaaca gataaataga 720
aaacaaatag caatatgaaa gacaaacttg accgggtgtg gtggctgatg cctgtaatcc 780
<210>21
<211>607
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR21
<400>21
gatcaataat ttgtaatagt cagtgaatac aaaggggtat atactaaatg ctacagaaat 60
tccattcctg ggtataaatc ctagacatat ttatgcatat gtacaccaag atatatctgc 120
aagaatgttc acagcaaatc tctttgtagt agcaaaaggc caaaaggtct atcaacaaga 180
aaattaatac attgtggcac ataatggcat ccttatgcca ataaaaatgg atgaaattat 240
agttaggttc aaaaggcaag cctccagata atttatatca tataattcca tgtacaacat 300
tcaacaacaa gcaaaactaa acatatacaa atgtcaggga aaatgatgaa caaggttaga 360
aaatgattaa tataaaaata ctgcacagtg ataacattta atgagaaaaa aagaaggaag 420
ggcttaggga gggacctaca gggaactcca aagttcatgg taagtactaa atacataatc 480
aaagcactca aaatagaaaa tattttagta atgttttagc tagttaatat cttacttaaa 540
acaaggtcta ggccaggcac ggtggctcac acctgtaatc ccagcacttt gggaggctga 600
ggcgggt 607
<210>22
<211>1380
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR22
<400>22
cccttgtgat ccacccgcct tggcctccca aagtgctggg attacaggcg tgagtcacta 60
cgcccggcca ccctccctgt atattatttc taagtatact attatgttaa aaaaagttta 120
aaaatattga tttaatgaat tcccagaaac taggatttta catgtcacgt tttcttatta 180
taaaaataaa aatcaacaat aaatatatgg taaaagtaaa aagaaaaaca aaaacaaaaa 240
gtgaaaaaaa taaacaacac tcctgtcaaa aaacaacagt tgtgataaaa cttaagtgcc 300
tgaaaattta gaaacatcct tctaaagaag ttctgaataa aataaggaat aaaataatca 360
catagttttg gtcattggtt ctgtttatgt gatggattat gtttattgat ttgtgtatgt 420
tgaacttatc tcaatagatg cagacaaggc cttgataaaa gtttttaaca ccttttcatg 480
ttgaaaactc tcaatagact aggtattgat gaaacatatc tcaaaataat agaagctatt 540
tatgataaac ccatagccaa tatcatactg agtgggcaaa agctggaagc attccctttg 600
aaaactggca caagacaagg atgccctctc tcaccactcc tattaaatgt agtattggaa 660
gttctggcca gagcaatcag gcaggagaaa gaaaaggtat taaaatagga agagaggaag 720
tcaaattgtc tctgtttgca gtaaacatga ttgtatattt agaaaacccc attgtctcat 780
cctaaaaact ccttaagctg ataaacaact tcagcaaagt ctcaggatac aaaatcaatg 840
tgcaaaaatc acaagcattc ctatacaccg ataatagaca gcagagagcc aaatcatgag 900
tgaagtccca ttcacaattg cttcaaagaa aataaaatac ttaggaatac aactttcacg 960
ggacatgaag gacattttca aggacaacta aaaaccactg ctcaaggaaa tgagagagga 1020
cacaaagaaa tggaaaaaca ttccatgctc atggaagaat caatatcatg aaaatggcca 1080
tactgcccaa agtaatttat agattcaatg ctaaccccat caagccacca ttgactttct 1140
tcacagaact agaaaaaaac tattttaaaa ctcatatgta gtcaaaaaga gtcggtatag 1200
ccaagacaat cctaagcata aagaacaaag ctggatgcat cacgctgact tcaaaccata 1260
ctacaaggct acagtaacca aaacagcatg gtactggtac caaaacagat agatagaccg 1320
atagaacaga acagaggcct cggaaataac accacacatc tacaaccctt tgatcttcaa 1380
<210>23
<211>1246
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR23
<400>23
atcccctcat ccttcagggc agctgagcag ggcctcgagc agctggggga gcctcactta 60
atgctcctgg gagggcagcc agggagcatg gggtctgcag gcatggtcca gggtcctgca 120
ggcggcacgc accatgtgca gccgccccca cctgttgctc tgcctccgcc acctggccat 180
gggcttcagc agccagccac aaagtctgca gctgctgtac atggacaaga agcccacaag 240
cagctagagg accttgtgtt ccacgtgccc agggagcatg gcccacagcc caaagaccag 300
tcaggagcag gcaggggctt ctggcaggcc cagctctacc tctgtcttca cacagatggg 360
agatttctgt tgtgattttg agtgatgtgc ccctttggtg acatccaaga tagttgctga 420
agcaccgctc taacaatgtg tgtgtattct gaaaacgaga acttctttat tctgaaataa 480
ttgatgcaaa ataaattagt ttggatttga aattctattc atgtaggcat gcacacaaaa 540
gtccaacatt gcatatgaca caaagaaaag aaaaagcttg cattccttaa atacaaatat 600
ctgttaacta tatttgcaaa tatatttgaa tacacttcta ttatgttaca tataatatta 660
tatgtatatg tatatataat atacatatat atgttacata taatatactt ctattatgtt 720
acatataata tttatctata agtaaataca taaatataaa gatttgagta gctgtagaac 780
attgtcttat gtgttatcag ctactactac aaaaatatct cttccactta tgccagtttg 840
ccatataaat atgatcttct cattgatggc ccagggcaag agtgcagtgg gtacttattc 900
tctgtgagga gggaggagaa aagggaacaa ggagaaagtc acaaagggaa aactctggtg 960
ttgccaaaat gtcaagtttc acatattccg agacggaaaa tgacatgtcc cacagaagga 1020
ccctgcccag ctaatgtgtc acagatatct caggaagctt aaatgatttt tttaaaagaa 1080
aagagatggc attgtcactt gtttcttgta gctgaggctg tgggatgatg cagatttctg 1140
gaaggcaaag agctcctgct ttttccacac cgagggactt tcaggaatga ggccagggtg 1200
ctgagcacta caccaggaaa tccctggaga gtgtttttct tactta 1246
<210>24
<211>939
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR24
<400>24
acgaggtcac gagttcgaga ccagcctggc caagatggtg aagccctgtc tctactaaaa 60
atacaacaag tagccgggcg cggtgacggg cgcctgtaat cccagctact caggaggctg 120
aagcaggaga atctctagaa cccaggaggc ggaggtgcag tgagctgaga ctgccccgct 180
gcactctagc ctgggcaaca cagcaagact ctgtctcaaa taaataaata aataaataaa 240
taaataaata aataaataaa tagaaaggga gagttggaag tagatgaaag agaagaaaag 300
aaatcctaga tttcctatct gaaggcacca tgaagatgaa ggccacctct tctgggccag 360
gtcctcccgt tgcaggtgaa ccgagttctg gcctccattg gagaccaaag gagatgactt 420
tggcctggct cctagtgagg aagccatgcc tagtcctgtt ctgtttgggc ttgatcctgt 480
atcacttgat tgtctctcct ggactttcca tggattccag ggatgcaact gagaagttta 540
tttttaatgc acttacttga agtaagagtt attttaaaac attttagcaa aggaaatgaa 600
ttctgacagg ttttgcactg aagacattca catgtgagga aaacaggaaa accactatgc 660
tagaaaaagc aaatgctgtt gagattgtct cacaaacaca aattgcgtgc cagcaggtag 720
gtttgagcct caggttgggc acattttacc ttaagcgcac tgttggtgga acttaaggtg 780
actgtaggac ttatatatac atacatacat ataatatata tacatattta tgtgtatata 840
cacacacaca cacacacaca cacacagggt cttgctatct tgcccagggt ggtctccaac 900
tctgggtctc aagcgatcct ctgcctcccc ttcccaaag 939
<210>25
<211>1067
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR25
<400>25
cagcccctct tgtgtttttc tttatttctc gtacacacac gcagttttaa gggtgatgtg 60
tgtataatta aaaggaccct tggcccatac tttcctaatt ctttagggac tgggattggg 120
tttgactgaa atatgttttg gtggggatgg gacggtggac ttccattctc cctaaactgg 180
agttttggtc ggtaatcaaa actaaaagaa acctctggga gactggaaac ctgattggag 240
cactgaggaa caagggaatg aaaaggcaga ctctctgaac gtttgatgaa atggactctt 300
gtgaaaatta acagtgaata ttcactgttg cactgtacga agtctctgaa atgtaattaa 360
aagtttttat tgagcccccg agctttggct tgcgcgtatt tttccggtcg cggacatccc 420
accgcgcaga gcctcgcctc cccgctgccc tcagcctccg atgacttccc cgcccccgcc 480
ctgctcggtg acagacgttc tactgcttcc aatcggaggc acccttcgcg ggagcggcca 540
atcgggagct ccggcaggcg gggaggccgg gccagttaga tttggaggtt caacttcaac 600
atggccgaag caagtagcgc caatctaggc agcggctgtg aggaaaaaag gcatgagggg 660
tcgtcttcgg aatctgtgcc acccggcact accatttcga gggtgaagct cctcgacacc 720
atggtggaca cttttcttca gaagctggtc gccgccggca ggtaaagtgg acgcagccgc 780
ggtgggagtg tttgttggca ccgaagctca aatcccgcga ggtcaggacg gccgcaggct 840
ggcgcgcggt gacgtgggtc cgcgttgggg gcggggcagt cggacgaggc gacccagtca 900
aatcctgagc cttaggagtc agggtattca cgcactgata acctgtagcg gaccgggata 960
gctagctact ccttcctaca ggaagccccg ttttcactaa aatttcaggt ggttgggagg 1020
aaagatagag cctttgcaaa ttagagcagg gttttttatt tttttat 1067
<210>26
<211>540
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR26
<400>26
ccccctgaca agccccagtg tgtgatgttc cccactctgt gtccatgcat tctcattgtt 60
caactcccat ctgtgagtga gaacatgcag tgtttggttt tctgtccttg agatagtttg 120
ctgagaatga tggtttccag cttcatccat gtccttgcaa aggaagtgaa cttatccttt 180
tttatggctt catagtattc catggcacat atgtgccaca tttttttaat ccagtctatc 240
attgatggac atttgggttg gttccaagtc tttgctattg tgaatagcac cacaattaac 300
atatgtgtgc atgtatacat ctttatagta gcatgattta taatccttcg ggtatatacc 360
ctgtaatggg atcgctgggt caaatggtat ttctagttct agatccttga ggaatcacca 420
cactgctttc cacaatggtt gaactaattt acgctcccac cagcagtgta aaagcattcc 480
tatttctcca cgtcctctcc agtatctgtt gtttcctgac tttttaatga tcatcattct 540
<210>27
<211>1520
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR27
<400>27
cttggccctc acaaagcctg tggccaggga acaattagcg agctgcttat tttgctttgt 60
atccccaatg ctgggcataa tgcctgccat tatgagtaat gccggtagaa gtatgtgttc 120
aaggaccaaa gttgataaat accaaagaat ccagagaagg gagagaacat tgagtagagg 180
atagtgacag aagagatggg aacttctgac aagagttgtg aagatgtact aggcaggggg 240
aacagcttaa ggagagtcac acaggaccga gctcttgtca agccggctgc catggaggct 300
gggtggggcc atggtagctt tcccttcctt ctcaggttca gagtgtcagc cttgaacttc 360
taattcccag aggcatttat tcaatgtttt cttctagggg catacctgcc ctgctgtgga 420
agactttctt ccctgtgggt cgccccagtc cccagatgag acggtttggg tcagggccag 480
gtgcaccgtt gggtgtgtgc ttatgtctga tgacagttag ttactcagtc attagtcatt 540
gagggaggtg tggtaaagat ggagatgctg ggtcacatcc ctagagaggt gttccagtat 600
gggcacatgg gagggctgga aggataggtt actgctagac gtagagaagc cacatccttt 660
aacaccctgg cttttcccac tgccaagatc cagaaagtcc ttgtggtttc gctgctttct 720
cctttttttt tttttttttt tttctgagat ggagtctggc tctgtcgccc aggctggagt 780
gcagtggcac gatttcggct cactgcaagt tccgcctcct aggttcatac cattctccca 840
cctcagcctc ccgagtagct gggactacag gcgccaccac acccagctaa ttttttgtat 900
ttttagtaga gacggcgttt caccatgtta gccaggatgg tcttgatccg cctgcctcag 960
cctcccaaag tgctgggatt acaggcgtga gccaccgcgc ccggcctgct ttcttctttc 1020
atgaagcatt cagctggtga aaaagctcag ccaggctggt ctggaactct tgacctcaag 1080
tgatctgcct gcctcagcct cccaaagtgc tgagattaca ggcatgagcc agtccgaatg 1140
tggctttttt tgttttgttt tgaaacaagg tctcactgtt gcccaggctg cagtgcagtg 1200
gcatacctca gctccactgc agcctcgacc tcctgggctc aagcaatcct cccaactgag 1260
cctccccagt agctggggct acaagcgcat gccaccacgc ctggctattt tttttttttt 1320
tttttttttt gagaaggagt ttcattcttg ttgcccaggc tggagtgcaa tggcacagtc 1380
tcagctcact gcagcctccg cctcctgggt tcaagcgatt ctcctgcctc agcctcccga 1440
gtagctggga ttataggcac ctgccaccat gcctggctaa tttttttgta tttttagtag 1500
ggatggggtt tcaccatgtt 1520
<210>28
<211>961
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR28
<400>28
aggaggttat tcctgagcaa atggccagcc tagtgaactg gataaatgcc catgtaagat 60
ctgtttaccc tgagaagggc atttcctaac tctccctata aaatgccaag tggagcaccc 120
cagatgaaat agctgatatg ctttctatac aagccatcta ggactggctt tatcatgacc 180
aggatattca cccactgaat atggctatta cccaagttat ggtaaatgct gtagttaagg 240
gggtcccttc cacatggaca ccccaggtta taaccagaaa gggttcccaa tctagactcc 300
aagagagggt tcttagacct catgcaagaa agaacttggg gcaagtacat aaagtgaaag 360
caagtttatt aagaaagtaa agaaacaaaa aaatggctac tccataagca aagttatttc 420
tcacttatat gattaataag agatggatta ttcatgagtt ttctgggaaa ggggtgggca 480
attcctggaa ctgagggttc ctcccacttt tagaccatat agggtatctt cctgatattg 540
ccatggcatt tgtaaactgt catggcactg atgggagtgt cttttagcat tctaatgcat 600
tataattagc atataatgag cagtgaggat gaccagaggt cacttctgtt gccatattgg 660
tttcagtggg gtttggttgg cttttttttt tttttaacca caacctgttt tttatttatt 720
tatttattta tttatttatt tatatttttt attttttttt agatggagtc ttgctctgtc 780
acccaggtta gagtgcagtg gcaccatctc ggctcactgc aagctctgcc tccttggttc 840
acgccattct gctgcctcag cctcccgagt agctgggact acaggtgcct gccaccatac 900
ccggctaatt ttttctattt ttcagtagag acggggtttc accgtgttag ccaggatggt 960
c 961
<210>29
<211>2233
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR29
<400>29
agcttggaca cttgctgatg ccactttgga tgttgaaggg ccgccctctc ccacaccgct 60
ggccactttt aaatatgtcc cctctgccca gaagggcccc agaggagggg ctggtgaggg 120
tgacaggagt tgactgctct cacagcaggg ggttccggag ggaccttttc tccccattgg 180
gcagcataga aggacctaga agggccccct ccaagcccag ctgggcgtgc agggccagcg 240
attcgatgcc ttcccctgac tcaggtggcg ctgtcctaaa ggtgtgtgtg ttttctgttc 300
gccagggggt ggcggataca gtggagcatc gtgcccgaag tgtctgagcc cgtggtaagt 360
ccctggaggg tgcacggtct cctccgactg tctccatcac gtcaggcctc acagcctgta 420
ggcaccgctc ggggaagcct ctggatgagg ccatgtggtc atccccctgg agtcctggcc 480
tggcctgaag aggaggggag gaggaggcca gcccctccct agccccaagg cctgcgaggc 540
tgcaagcccg gccccacatt ctagtccagg cttggctgtg caagaagcag attgcctggc 600
cctggccagg cttcccagct aggatgtggt atggcagggg tgggggacat tgaggggctg 660
ctgtagcccc cacaacctcc ccaggtaggg tggtgaacag taggctggac aagtggacct 720
gttcccatct gagattcaag agcccacctc tcggaggttg cagtgagccg agatccctcc 780
actgcactcc agcctgggca acagagcaag actctgtctc aaaaaaacag aacaacgaca 840
acaaaaaacc cacctctggc ccactgccta actttgtaaa taaagtttta ttggcacata 900
gacacaccca ttcatttaca tactgctgcg gctgcttttg cattaccctt gagtagacga 960
cagaccacgt ggccatggaa gccaaaaata tttactgtct ggccctttac agaagtctgc 1020
tctagaggga gaccccggcc catggggcag gaccactggg cgtgggcaga agggaggcct 1080
cggtgcctcc acgggcctag ttgggtatct cagtgcctgt ttcttgcatg gagcaccagg 1140
ggtcagggca agtacctgga ggaggcaggc tgttgcccgc ccagcactgg gacccaggag 1200
accttgagag gctcttaacg aatgggagac aagcaggacc agggctccca ttggctgggc 1260
ctcagtttcc ctgcctgtaa gtgagggagg gcagctgtga aggtgaactg tgaggcagag 1320
cctctgctca gccattgcag gggcggctct gccccactcc tgttgtgcac ccagagtgag 1380
gggcacgggg tgagatgtca ccatcagccc ataggggtgt cctcctggtg ccaggtcccc 1440
aagggatgtc ccatcccccc tggctgtgtg gggacagcag agtccctggg gctgggaggg 1500
ctccacactg ttttgtcagt ggtttttctg aactgttaaa tttcagtgga aaattctctt 1560
tcccctttta ctgaaggaac ctccaaagga agacctgact gtgtctgaga agttccagct 1620
ggtgctggac gtcgcccaga aagcccaggt actgccacgg gcgccggcca ggggtgtgtc 1680
tgcgccagcc atgggcacca gccaggggtg tgtctacgcc ggccaggggt aggtctccgc 1740
cggcctccgc tgctgcctgg ggagggccgt gcctgacact gcaggcccgg tttgtccgcg 1800
gtcagctgac ttgtagtcac cctgcccttg gatggtcgtt acagcaactc tggtggttgg 1860
ggaaggggcc tcctgattca gcctctgcgg acggtgcgcg agggtggagc tcccctccct 1920
ccccaccgcc cctggccagg gttgaacgcc cctgggaagg actcaggccc gggtctgctg 1980
ttgctgtgag cgtggccacc tctgccctag accagagctg ggccttcccc ggcctaggag 2040
cagccgggca ggaccacagg gctccgagtg acctcagggc tgcccgacct ggaggccctc 2100
ctggcgtcgc ggtgtgactg acagcccagg agcgggggct gttgtaattg ctgtttctcc 2160
ttcacacaga accttttcgg gaagatggct gacatcctgg agaagatcaa gaagtaagtc 2220
ccgcccccca ccc 2233
<210>30
<211>1851
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR30
<400>30
gggtgcattt ccacccaggg gacacttggc aatggtggga gacattgctt gttgtcacaa 60
ctgggcatgg gagtgctgct gcgtctagtg ggtagaggcc agagatgctc ctaatatcct 120
acaaggcaca gaacagcccc ccacaacaga gaattatcca gcctgaaaat gtccacagtg 180
ctgaggttgg gaaaccctat tctagagcca acaggctgtg aagcttgact catggttcca 240
tcaccaatag ctgcgtgacc ttggtgagtt ccttagctgc tctgtgcctc ggattcatgg 300
taggttttcc ttgttaggtt taaatgagtg aagttataca gagggcctga agtctcatgg 360
tattttacta gagcctcatt gtgttttagt tataattaga aattgggtaa ggtaaggaca 420
cagaagaagc catctgatct gggggcttca cacttagaag tgacctcgga gcaattgtat 480
tggggtggaa agggactaac agccaggagc agagggcaca ttggaattgg ggccagaggg 540
cacagactgc cttgtccatc aggcatagca atggacagag gaaggggaat gactagttat 600
ggctgcaagg ccaagtacag gggacttatt tctcatatct atctatctat ctacctaccg 660
tctatttatc tatcatctat ctacttattt atctatctat ttatgcatgt gtaccaaccg 720
aaagttttag taaatgcaca aactgcgata taatgaaaat ggaaattttc aaaagaagag 780
aaatcacctg ccacctgact accttaacaa atgagtggtt ttcatctctc cttccaggcc 840
tgtcattttt acagtgcttt agtcataaaa caggtcctct attctattgt tttatgtcac 900
atgaaattgt accataagca ttttccatga tgtgactcca ctgtttcatt ttccattttt 960
ttccagaatg aagataacct cattgttttt ttcctgattg taaaaatgct ctgtgctctt 1020
tttttttttt tttaacaatg caggcagtac caaaaagtat gaagaagaat gtaatagttc 1080
ccatttccca tctcactctt taaggccagc attttggtga acatccatcc gaacaaatct 1140
ccacgcgttt atcaatttgt tgacttactc cttcttttat gtaaatatga acatgattta 1200
actgccagtc catttggaac cttaaagtga aggtttttta ttgttggggt ttgctatggt 1260
ctgaatatgt gtgtcccccc aaaatttatg ttgaatccta acgcccaatg cgattaggag 1320
gtggggccat taggaggtga ttaagtcatg aagtcatcag ccctaatgaa tgggatttgt 1380
ggccttgaaa agggacccca gagagctgcc ttgccccttc tgccatgtaa ggacacagtg 1440
aggagctagg aagggggcct cagcagagac caaatgtgat ggtgcctcga tattggactt 1500
cccagcctcc agaatgtgag aaatgaattt ctgttgttta taagtcaccc agtctatagt 1560
attttgttct agcagcccaa acagactaag tcagggttgt tgttttagga agtggggaat 1620
ggggccatgc atgggtgtac gccagaacaa aggaagccag caagtcctga aagatactgg 1680
aaaagggaat agtgggcacg tgcagtgtgt tagtttcctg aggctgctat aacaaagcac 1740
cacaggttgg gtggcttaaa taacagaaat tcattctccc atcattctgg ggaccagacg 1800
tctgaaatca agactcctat gccatgctcc ttctgaaggc tccaggggag g 1851
<210>31
<211>1701
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR31
<220>
<221>misc_feature
<222>(159)..(1696)
<223>n is a,c,g,or t on various positions
<400>31
cacccgcctt ggccccccag agtgctggga ttacaagtgt aaaccaccat tcctggctag 60
atttaatttt ttaaaaaata aagagaagta ggaatagttc attttaggga gagcccctta 120
actgggacag gggcaggaca ggggtgaggc ttcccttant tcaagctcac ctcaaaccca 180
cccaggactg tgtgtcacat tctccaataa aggaaaggtt gctgcccccg cctgtgagtg 240
ctgcagtgga gggtagaggg ccgtgggcag agtgcttcat ggactgctca tcaagaaagg 300
cttcatgaca atcggcccag ctgctgtcat cccacattct acttccagct aggagaaggc 360
ggcttgccca cagtcaccca gccggcaagt gtcacccctg ggttggaccc agagctatga 420
tcctgcccag gggtccagct gagaatcagg cccacgttct aggcagaggg gctcacctac 480
tgggactcca gtagctgtag tgcatggagg catcatggct gcagcagcct ggacctggtc 540
tcacactggc tgtccctgtg ggcaggccat cctcaatgcc aggtcaggcc caagcatgta 600
tcccagacaa tgacaatggg gtggaatcct ctcttgtccc agaagccact cctcactgtt 660
ctacctgagg aaggcagggg catggtggaa tcctgaagcc tgctgtgagg gtctccagcg 720
aacttgcaca tggtcagccc tgccttctcc tccctgaact agattgagcg agagcaagaa 780
ggacattgaa ccagcaccca aagaattttg gggaacggcc tctcatccag gtcaggctca 840
cctccttttt aaaatttaat taattaatta attaattttt ttttagagac agagtcttac 900
tgtgtggccc aggctgtagt gcagtggcac aatcatagtt cactgcagcc tcaaactccc 960
cacctcagcc tctggattag ctgagactac aggtgcacca ccaccacacc cagctaatat 1020
ttttattttt gtagagagag ggtttcacca tcttgcccag gctggtctca aactcctggg 1080
ctcaagtgat cccgcccagg tctgaaagcc cccaggctgg cctcagactg tggggttttc 1140
catgcagcca cccgagggcg cccccaagcc agttcatctc ggagtccagg cctggccctg 1200
ggagacagag tgaaaccagt ggtttttatg aacttaactt agagtttaaa agatttctac 1260
tcgatcactt gtcaagatgc gccctctctg gggagaaggg aacgtgactg gattccctca 1320
ctgttgtatc ttgaataaac gctgctgctt catcctgtgg gggccgtggc cctgtccctg 1380
tgtgggtggg gcctcttcca tttccctgac ttagaaacca cagtccacct agaacagggt 1440
ttgagaggct tagtcagcac tgggtagcgt tttgactcca ttctcggctt tcttcttttt 1500
ctttccagga tttttgtgca gaaatggttc ttttgttgcc gtgttagtcc tccttggaag 1560
gcagctcaga aggcccgtga aatgtcgggg gacaggaccc ccagggaggg aaccccaggc 1620
tacgcacttt agggttcgtt ctccagggag ggcgacctga cccccgnatc cgtcggngcg 1680
cgnngnnacn aannnnttcc c 1701
<210>32
<211>771
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR32
<400>32
gatcacacag cttgtatgtg ggagctagga ttggaacccc agaagtctgg ccccaggttc 60
atgctctcac ccactgcata caatggcctc tcataaatca atccagtata aaacattaga 120
atctgcttta aaaccataga attagtagcg taagtaataa atgcagagac catgcagtga 180
atggcattcc tggaaaaagc ccccagaagg aattttaaat cagctttcgt ctaatcttga 240
gcagctagtt agcaaatatg agaatacagt tgttcccaga taatgcttta tgtctgacca 300
tcttaaactg gcgctgtttt tcaaaaactt aaaaacaaaa tccatgactc ttttaattat 360
aaaagtgata catgtctact tgggaggctg aggtggtggg aggatggctt gagtttgagg 420
ctgcagtatg ctactatcat gcctataaat agccgctgca ttccagcttg ggcaacatac 480
ccaggcccta tctcaaaaaa ataaaaagta atacatctac attgaagaaa attaatttta 540
ttgggttttt ttgcattttt attatacaca gcacacacag cacatatgaa aaaatgggta 600
tgaactcagg cattcaactg gaagaacagt actaaatcaa tgtccatgta gtcagcgtga 660
ctgaggttgg tttgtttttt cttttttctt ctcttctctt ctcttttctt tttttttgag 720
acggagcttt gctctttttg cccaggcttg attgcaatgg cgtgatctca g 771
<210>33
<211>1368
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR33
<400>33
gcttttatcc tccattcaca gctagcctgg cccccagagt acccaattct ccctaaaaaa 60
cggtcatgct gtatagatgt gtgtggcttg gtagtgctaa agtggccaca tacagagctc 120
tgacaccaaa cctcaggacc atgttcatgc cttctcactg agttctggct tgttcgtgac 180
acattatgac attatgatta tgatgacttg tgagagcctc agtcttctat agcactttta 240
gaatgcttta taaaaaccat ggggatgtca ttatattcta acctgttagc acttctgttc 300
gtattaccca tcacatccca acatcaattc tcatatatgc aggtacctct tgtcacgcgc 360
gtccatgtaa ggagaccaca aaacaggctt tgtttgagca acaaggtttt tatttcacct 420
gggtgcaggt gggctgagtc tgaaaagaga gtcagtgaag ggagacaggg gtgggtccac 480
tttataagat ttgggtaggt agtggaaaat tacaatcaaa gggggttgtt ctctggctgg 540
ccagggtggg ggtcacaagg tgctcagtgg gagagccttt gagccaggat gagccagaag 600
gaatttcaca aggtaatgtc atcagttaag gcagggactg gccattttca cttcttttgt 660
ggtggaatgt catcagttaa ggcaggaacc ggccattttc acttcttttg tgattcttca 720
cttgcttcag gccatctgga cgtataggtg caggtcacag tcacagggga taagatggca 780
atggcatagc ttgggctcag aggcctgaca cctctgagaa actaaagatt ataaaaatga 840
tggtcgcttc tattgcaaat ctgtgtttat tgtcaagagg cacttatttg tcaattaaga 900
acccagtggt agaatcgaat gtccgaatgt aaaacaaaat acaaaacctc tgtgtgtgtg 960
tgtgtgtgag tgtgtgtgta tgtgtgtgtg tgtgtattag agaggaaaag cctgtatttg 1020
gaggtgtgat tcttagattc taggttcttt cctgcccacc ccatatgcac ccaccccaca 1080
aaagaacaaa caacaaatcc caggacatct tagcgcaaca tttcagtttg catattttac 1140
atatttactt ttcttacata ttaaaaaact gaaaatttta tgaacacgct aagttagatt 1200
ttaaattaag tttgttttta cactgaaaat aatttaatat ttgtgaagaa tactaataca 1260
ttggtatatt tcattttctt aaaattctga acccctcttc ccttatttcc ttttgacccg 1320
attggtgtat tggtcatgtg actcatggat ttgccttaag gcaggagg 1368
<210>34
<211>755
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR34
<400>34
actgggcacc ctcctaggca ggggaatgtg agaactgccg ctgctctggg gctgggcgcc 60
atgtcacagc aggagggagg acggtgttac accacgtggg aaggactcag ggtggtcagc 120
cacaaagctg ctggtgatga ccaggggctt gtgtcttcac tctgcagccc taacacccag 180
gctgggttcg ctaggctcca tcctgggggt gcagaccctg agagtgatgc cagtgggagc 240
ctcccgcccc tccccttcct cgaaggccca ggggtcaaac agtgtagact cagaggcctg 300
agggcacatg tttatttagc agacaaggtg gggctccatc agcggggtgg cctggggagc 360
agctgcatgg gtggcactgt ggggagggtc tcccagctcc ctcaatggtg ttcgggctgg 420
tgcggcagct ggcggcaccc tggacagagg tggatatgag ggtgatgggt ggggaaatgg 480
gaggcacccg agatggggac agcagaataa agacagcagc agtgctgggg ggcaggggga 540
tgagcaaagg caggcccaag acccccagcc cactgcaccc tggcctccca caagccccct 600
cgcagccgcc cagccacact cactgtgcac tcagccgtcg atacactggt ctgttaggga 660
gaaagtccgt cagaacaggc agctgtgtgt gtgtgtgcgt gtatgagtgt gtgtgtgtga 720
tccctgactg ccaggtcctc tgcactgccc ctggg 755
<210>35
<211>1193
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR35
<220>
<221>misc_feature
<222>(312)..(1191)
<223>n is a,c,g,or t on various positions
<400>35
cgacttggtg atgcgggctc ttttttggtt ccatatgaac tttaaagtag tcttttccaa 60
ttctgtgaag aaagtcattg gtaggttgat ggggatggca ttgaatctgt aaattacctt 120
gggcagtatg gccattttca caatgttgat tcttcctatc catgatgatg gaatgttctt 180
ccattagttt gtatcctctt ttatttcctt gagcagtggt ttgtagttct ccttgaagag 240
gtccttcaca tcccttgtaa gttggattcc taggtatttt attctctttg aagcaaattg 300
tgaatgggag tncactcacg atttggctct ctgtttgtct gctgggtgta taaanaatgt 360
ngtgatnttn gtacattgat ttngtatccn tgagacttng ctgaatttgc ttnatcngct 420
tnngggaacc ttttgggctg aaacnatggg attttctaaa tatacaatca tgtcgtctgc 480
aaacagggaa caatttgact tcctcttttc ctaattgaat acactttatc tccttctcct 540
gcctaattgc cctgggcaaa acttccaaca ctatgntngn aataggagnt ggtgagagag 600
ggcatccctg ttcttgttgc cagnttttca aagggaatgc ttccagtttt ggcccattca 660
gtatgatatg ggctgtgggt ngtgtcataa atagctctta tnattttgaa atgtgtccca 720
tcaataccta atttattgaa agtttttagc atgaangcat ngttgaattt ggtcaaaggc 780
tttttctgca tctatggaaa taatcatgtg gtttttgtct ttggctcntg tttatatgct 840
ggatnacatt tattgatttg tgtatatnga acccagcctn ncatcccagg gatgaagccc 900
acttgatcca agcttggcgc gcngnctagc tcgaggcagg caaaagtatg caaagcatgc 960
atctcaatta gtcagcaccc atagtccgcc cctacctccg cccatccgcc cctaactcng 1020
nccgttcgcc cattctcgcc catggctgac taatnttttt annatccaag cggngccgcc 1080
ctgcttganc attcagagtn nagagnnttg gaggccnagc cttgcaaaac tccggacngn 1140
ttctnnggat tgaccccnnt taaatatttg gttttttgtn ttttcanngg nga 1193
<210>36
<211>1712
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR36
<400>36
gatcccatcc ttagcctcat cgatacctcc tgctcacctg tcagtgcctc tggagtgtgt 60
gtctagccca ggcccatccc ctggaactca ggggactcag gactagtggg catgtacact 120
tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc agtggactca 180
ggactagtga gccccacatg tacacttggc ctcaggggac tcaggattag tgagccccca 240
catgtacact tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc 300
aggggactca ggactagtga gccccacatg tacacttggc ctcaggggac tcagaactag 360
tgagccccac atgtacactt ggcttcaggg gactcaggat tagtgagccc cacatgtaca 420
cttggacacg tgaaccacat cgatgtgctg cagagctcag ccctctgcag atgaaatgtg 480
gtcatggcat tccttcacag tggcacccct cgttccctcc ccacctcatc tcccattctt 540
gtctgtcttc agcacctgcc atgtccagcc ggcagattcc accgcagcat cttctgcagc 600
acccccgacc acacacctcc ccagcgcctg cttggccctc cagcccagct cccgcctttc 660
ttccttgggg aagctccctg gacagacacc ccctcctccc agccatggct ttttcctgct 720
ctgccccacg cgggaccctg ccctggatgt gctacaatag acacatcaga tacagtcctt 780
cctcagcagc cggcagaccc agggtggact gctcggggcc tgcctgtgag gtcacacagg 840
tgtcgttaac ttgccatctc agcaactagt gaatatgggc agatgctacc ttccttccgg 900
ttccctggtg agaggtactg gtggatgtcc tgtgttgccg gccacctttt gtccctggat 960
gccatttatt tttttccaca aatatttccc aggtctcttc tgtgtgcaag gtattagggc 1020
tgcagcgggg gccaggccac agatctctgt cctgagaaga cttggattct agtgcaggag 1080
actgaagtgt atcacaccaa tcagtgtaaa ttgttaactg ccacaaggag aaaggccagg 1140
aaggagtggg gcatggtggt gttctagtgt tacaagaaga agccagggag ggcttcctgg 1200
atgaagtggc atctgacctg ggatctggag gaggagaaaa atgtcccaaa agagcagaga 1260
gcccacccta ggctctgcac caggaggcaa cttgctgggc ttatggaatt cagagggcaa 1320
gtgataagca gaaagtcctt gggggccaca attaggattt ctgtcttcta aagggcctct 1380
gccctctgct gtgtgacctt gggcaagtta cttcacctct agtgctttgg ttgcctcatc 1440
tgtaaagtgg tgaggataat gctatcacac tggttgagaa ttgaagtaat tattgctgca 1500
aagggcttat aagggtgtct aatactagta ctagtaggta cttcatgtgt cttgacaatt 1560
ttaatcatta ttattttgtc atcaccgtca ctcttccagg ggactaatgt ccctgctgtt 1620
ctgtccaaat taaacattgt ttatccctgt gggcatctgg cgaggtggct aggaaagcct 1680
ggagctgttt cctgttgacg tgccagacta gt 1712
<210>37
<211>1321
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR37
<400>37
aggatcacat ttaaggaagt gtgtggggtc cctggatgac accagcaccc agtgcggctc 60
tgtctggcaa ccgctcccaa ggtggcagga gtgggtgtcc cctgtgtgtc agtgggcagc 120
tcctgctgag cctacagctc actggggagc ctgacagcgg ggccatgtgc ctgacactcc 180
tctctgcttg tggacctggc aaggcaggga gcagaaaaca gagccacttg aaggctttct 240
gtctgcgtct gtgtgcagtg tggatttagt tgtgcttttt tcttgctggg agagcacagc 300
caccatttac aagcagtgtc accctcatgg gtggcgagga cagaacagga gcctctgctc 360
tctgtaccta tctgggcccg gtgggctccc ttgtcctggc ttccatctct gtctcagcga 420
ccattcagcc ctgcgcagga acacatgttg cttagaaaag ccaaattcag cccttgtctc 480
tgcctcctct ggtctcatga tgtgcatctg ttaccttgaa actggaaacc agtctatcaa 540
tgtctgtgcc aattttttat tccctcccca acctccttcc ccatacgact ttttatttat 600
gtaggatgtg tgctgtctaa tgatgggatg accacatttt tccatgttct aaaagtgctc 660
ctctcccgca gggtcccagg gctggtggtt gctttgggtc tacagctacg tcttacccgc 720
ctcctgcctc aacagcctgt gtggtggcaa agccggtgtg gggctgggga acgcagcgtt 780
ctccaggagg gggacccggc tctccttctg cagtgcaggc gaaggcctag atgccagtgt 840
gacctcccac aaggcgtggc ttccagactc cccggctgga agtgatgctt ttttgcctcc 900
ggccctgggt ttgaagcagc ctggctttct cttggtaagt ggctggtgtc ttagcagctg 960
caatctgagc tcagccacct acacaccacc gtggccgaca ctttcattaa aaagtttcct 1020
gagacgactt gcgtgcatgt tgacttcatg atcagcgccg ctgggaagaa cccctgagcc 1080
ggtggggtgg ggctggaagc agcaggtgca gtgatggggc tgggtgccca ggaggcctca 1140
gtgctcaatc aggccaaggt ggccaagccc aggctgcagg gaaggccggc ctgggggttg 1200
tgggtgagca caggcaggca ccagctgggc agtgttagga tgctggagca gcatccgtaa 1260
ccccactgag tggggtagtc tggttggggc agggaccgct gttgctttgg cagagagaga 1320
t 1321
<210>38
<211>1445
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR38
<220>
<221>misc_feature
<222>(348)..(949)
<223>n is a,c,g,or t on various positions
<400>38
gatctatggg agtagcttcc ttagtgagct ttcccttcaa atactttgca accaggtaga 60
gaattttgga gtgaaggttt tgttcttcgt ttcttcacaa tatggatatg catcttcttt 120
tgaaaatgtt aaagtaaatt acctctcttt tcagatactg tcttcatgcg aacttggtat 180
cctgtttcca tcccagcctt ctataaccca gtaacatctt ttttgaaacc agtgggtgag 240
aaagacacct ggtcaggaac gcggaccaca ggacaactca ggctcaccca cggcatcaga 300
ctaaaggcaa acaaggactc tgtataaagt accggtggca tgtgtatnag tggagatgca 360
gcctgtgctc tgcagacagg gagtcacaca gacacttttc tataatttct taagtgcttt 420
gaatgttcaa gtagaaagtc taacattaaa tttgattgaa caattgtata ttcatggaat 480
attttggaac ggaataccaa aaaatggcaa tagtggttct ttctggatgg aagacaaact 540
tttcttgttt aaaataaatt ttattttata tatttgaggt tgaccacatg accttaagga 600
tacatataga cagtaaactg gttactacag tgaagcaaat taacatatct accatcgtac 660
atagttacat ttttttgtgt gacaggaaca gctaaaatct acgtatttaa caaaaatcct 720
aaagacaata catttttatt aactatagcc ctcatgatgt acattagatc gtgtggttgt 780
ttcttccgtc cccgccacgc cttcctcctg ggatggggat tcattcccta gcaggtgtcg 840
gagaactggc gcccttgcag ggtaggtgcc ccggagcctg aggcgggnac tttaanatca 900
gacgcttggg ggccggctgg gaaaaactgg cggaaaatat tataactgna ctctcaatgc 960
cagctgttgt agaagctcct gggacaagcc gtggaagtcc cctcaggagg cttccgcgat 1020
gtcctaggtg gctgctccgc ccgccacggt catttccatt gactcacacg cgccgcctgg 1080
aggaggaggc tgcgctggac acgccggtgg cgcctttgcc tgggggagcg cagcctggag 1140
ctctggcggc agcgctggga gcggggcctc ggaggctggg cctggggacc caaggttggg 1200
cggggcgcag gaggtgggct cagggttctc cagagaatcc ccatgagctg acccgcaggg 1260
cggccgggcc agtaggcacc gggcccccgc ggtgacctgc ggacccgaag ctggagcagc 1320
cactgcaaat gctgcgctga ccccaaatgc tgtgtccttt aaatgtttta attaagaata 1380
attaataggt ccgggtgtgg aggctcaagc cttaatcccc agcacctggc gaggccgagg 1440
aggga 1445
<210>39
<211>2331
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR39
<400>39
gtgaaataga tcactaaagc tgattcctct tgtctaaatg aaactttcta ccctttgatg 60
gacagctatg ctttccccat cctctcccgt cccccagccc ttggtaacca tcatcctact 120
ctctacttgt aggagttcaa cttgtttaga ttttgtgagt gagaacatgt ggtatttgcc 180
tttagagtcc tctaggttta tccatattgt gttaaatgac aggattccct gcctttttaa 240
ggctgaatag tatttcattg taatatatat acatacacac acacatatac acacacatat 300
atatacatat atacatatat gtacatagat acatatatat gtacatatat acacacacat 360
atacacacat atatacacat atatacatat acatatatac acatatatgt acatatatat 420
aacttttttt catttatcca ttcacttaat acatatgatg gagggcttta tatatgccag 480
gctctgtgat gaatgctgga aattcaatag tgagaaagac tcagtctctg cctccaaaga 540
gcatcatggg ctaggtgctg caacgaggaa ttgccaactg ttgtcatgag agcacagaga 600
agggactcaa ccagccttga agaatcaggg gaggcttcta agctaatggt gtgtgcctgg 660
ggatcacatt gtttcaagca gcagtaacag gatgtgctca ggtccagatg tgagagagag 720
agagagcata tgtcttcaag aaactaacag tagctcccta tagctgaagc aggagtacaa 780
aatagtgagt ttaagtgatg aggcaagaga tatgaagaag cttgaccatg cagctacacc 840
gggcagcatg ccctctgaga catctcatgg aagccggaaa tgggagtgcc ttgataccaa 900
gccagagaaa ttataatact aagtagatag actgagcagc actcctcctg ggaagaatga 960
gacaagccct gaatttggag gtaagttgtg gattggtgat tagaggagag gtaacaggca 1020
ccaaagcaag aaatagtatt gatgcaaagc tgaggttaat tggatgacaa aatgaagagc 1080
ataaggggct cagacacaga ctgagcagaa aacgagtagc atctgaacct agattgagtt 1140
actaatggat gagaaagagt tcttaaagtt gatgaccacg ggatccatat ataagaatgt 1200
ccaatctccc caaattgatc cacgagttca gtgcaatgcc aatcaaaatc ccactaacaa 1260
gtttatttta aaatgtaaat gaaaatacaa aatttttaaa aagcaaagca atattgaaaa 1320
cccaggaaaa attaggagga cttacacaac ctgatctcaa aacttaccat tatcaagaca 1380
gagtgttatt gacacaagga gagacaaata gataaacgga atgtggtagt ctggagatgc 1440
acccacatgt atgtggtcaa ttgatttttg gccaaggcac caagtcaatt caaaggagca 1500
aggaaagtag tacagaaaca accaaatatt gttttggaaa ataatgacaa agggcttata 1560
accagaatat aagcatataa atataattct ttcaaatcaa taataagaag gcaaatatct 1620
aataaaaatg agcaaagact tgaaaagtca cttaaaaagg cttattaatt agaaatatgc 1680
aaatgttatt agtcttcagt ggaatttaca ttaaaccaca agggatacta ttatatctta 1740
tgcccactag aataaccaaa ggaaaaaaga cagacaaaac aaaatgctgg tgaggatgtg 1800
aagcaactgg aactctcata cattattggt ggtaatgtaa aatttataca accattatga 1860
ataaaggttt ggcagtttct tacaaagttg aatgcacttc tccacgatga ctaggctttt 1920
cactcatagg cgtctggctc cctagaactg aaaacatatg ttcacaagaa gacttgcaaa 1980
tatatattct cccacgtcag gagatatttg ctatgcattt aactgacata agattagtgc 2040
tagagtttat aatgaggttc ttcaaatcta aaagaaaatg caaagcatat aatagtaagg 2100
ggtgcaggcc aggcgcagtg gctcactctg taatcccagc actttgggag gccgaggtgg 2160
gcggatcaca aggtcaggag ttcgagacca acctggccaa catagtgaaa ccctgtctct 2220
actaaaaata caaaaactag ccaggtgcgg tgtcatgcac ctgtagtccc agctactcgg 2280
gaggccgagg caggagaatc acttgaacct gggaggtgga ggttgcagtg a 2331
<210>40
<211>1071
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR40
<400>40
gctgtgattc aaactgtcag cgagataagg cagcagatca agaaagcact ccgggctcca 60
gaaggagcct tccaggccag ctttgagcat aagctgctga tgagcagtga gtgtcttgag 120
tagtgttcag ggcagcatgt taccattcat gcttgacttc tagccagtgt gacgagaggc 180
tggagtcagg tctctagaga gttgagcagc tccagcctta gatctcccag tcttatgcgg 240
tgtgcccatt cgctttgtgt ctgcagtccc ctggccacac ccagtaacag ttctgggatc 300
tatgggagta gcttccttag tgagctttcc cttcaaatac tttgcaacca ggtagagaat 360
tttggagtga aggttttgtt cttcgtttct tcacaatatg gatatgcatc ttcttttgaa 420
aatgttaaag taaattacct ctcttttcag atactgtctt catgcgaact tggtatcctg 480
tttccatccc agccttctat aacccagtaa catctttttt gaaaccagtg ggtgagaaag 540
acacctggtc aggaacgcgg accacaggac aactcaggct cacccacggc atcagactaa 600
aggcaaacaa ggactctgta taaagtaccg gtggcatgtg tattagtgga gatgcagcct 660
gtgctctgca gacagggagt cacacagaca cttttctata atttcttaag tgctttgaat 720
gttcaagtag aaagtctaac attaaatttg attgaacaat tgtatattca tggaatattt 780
tggaacggaa taccaaaaaa tggcaatagt ggttctttct ggatggaaga caaacttttc 840
ttgtttaaaa taaattttat tttatatatt tgaggttgac cacatgacct taaggataca 900
tatagacagt aaactggtta ctacagtgaa gcaaattaac atatctacca tcgtacatag 960
ttacattttt ttgtgtgaca ggaacagcta aaatctacgt atttaacaaa aatcctaaag 1020
acaatacatt tttattaact atagccctca tgatgtacat tagatctcta a 1071
<210>41
<211>1135
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR41
<400>41
cgtgtgcagt ccacggagag tgtgttctcc tcatcctcgt tccggtggtt gtggcgggaa 60
acgtggcgct gcaggacacc aacatcagtc acgtatttca ttctggaaaa aaaagtagca 120
caagcctcgg ctggttccct ccagctctta ccaggcagcc taagcctagg ctccattccc 180
gctcaaggcc ttcctcaggg gcctgctcac cacaggagct gttcccatgc agggactaag 240
gacatgcagc ctgcatagaa accaagcacc caggaaaaca tgattggatg gagcgggggg 300
gtgtggtctc tagccttgtc cacctccggt cctcatgggt ctcacacctc ctgagaatgg 360
gcaccgcaga ggccacagcc catacagcca agatgacaga ctccgtaagt gacagggatc 420
cacagcagag tgggtgaaat gttccctata aactttacaa aattaatgag ggcaggggga 480
ggggagaaat gaaaatgaac ccagctcgca gcacatcagc atcagtcact aggtcggcgt 540
gctctctgac tgcttcctcg tagctgcttg gtgtctcatt gcctcagaag catgtagacc 600
ctgtcacaag attgtagttc ccctaactgc tccgtagatc acaacttgaa ccttaggaaa 660
tgctgttttc cctttgagat attcctttgg gtcctgtata ctgatggagc tactgactga 720
gctgctccga aggaccccac gaggagctga ctaaaccaag agtgcagttt gtacaccctg 780
atgattacat cccccttgcc ccaccaatca actctcccaa ttttccagcc cctcaccctc 840
cagtcccctt aaaagcccca gcccaggccg ggcacagtgg ctcatgcctg taatcccagc 900
actttgggag gccaaggtgg gcagatcacc tgagggcagg aatttgagac cagcctgacc 960
aacatgaaga aaccccgtct ctattacaaa tacaaaatta gccgggcgtg ttgctgcata 1020
ctggtaatcc cagctacttg ggagggtgag gcaggagaat cacttgaatc tgggaggcgg 1080
aggttgcgat gagccgagac agcgccattg cactgcagcc tgggcaacaa gagca 1135
<210>42
<211>735
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR42
<400>42
aagggtgaga tcactaggga gggaggaagg agctataaaa gaaagaggtc actcatcaca 60
tcttacacac tttttaaaac cttggttttt taatgtccgt gttcctcatt agcagtaagc 120
cctgtggaag caggagtctt tctcattgac caccatgaca agaccctatt tatgaaacat 180
aatagacaca caaatgttta tcggatattt attgaaatat aggaattttt cccctcacac 240
ctcatgacca cattctggta cattgtatga atgaatatac cataatttta cctatggctg 300
tatatttagg tcttttcgtg caggctataa aaatatgtat gggccggtca cagtgactta 360
cgcccgtagt cccagaactt tgggaggccg aggcgggtgg atcacctgag gtcgggagtt 420
caaaaccagc ctgaccaaca tggagaaacc ccgtctctgc taaaaataca aaaattaact 480
ggacacggtg gcgtatgcct gtaatcccag ctactcggga agctgaggca ggagaactgc 540
ttgaacccag gaggcggagg ttgtggtgag tcgagattgc gccattgcac tccagcctgg 600
gcaacaagag cgaaattcca tctcaaaaaa aagaaaaaag tatgactgta tttagagtag 660
tatgtggatt tgaaaaatta ataagtgttg ccaacttacc ttagggttta taccatttat 720
gagggtgtcg gtttc 735
<210>43
<211>1227
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR43
<400>43
caaatagatc tacacaaaac aagataatgt ctgcccattt ttccaaagat aatgtggtga 60
agtgggtaga gagaaatgca tccattctcc ccacccaacc tctgctaaat tgtccatgtc 120
acagtactga gaccaggggg cttattccca gcgggcagaa tgtgcaccaa gcacctcttg 180
tctcaatttg cagtctaggc cctgctattt gatggtgtga aggcttgcac ctggcatgga 240
aggtccgttt tgtacttctt gctttagcag ttcaaagagc agggagagct gcgagggcct 300
ctgcagcttc agatggatgt ggtcagcttg ttggaggcgc cttctgtggt ccattatctc 360
cagcccccct gcggtgttgc tgtttgcttg gcttgtctgg ctctccatgc cttgttggct 420
ccaaaatgtc atcatgctgc accccaggaa gaatgtgcag gcccatctct tttatgtgct 480
ttgggctatt ttgattcccc gttgggtata ttccctaggt aagacccaga agacacagga 540
ggtagttgct ttgggagagt ttggacctat gggtatgagg taatagacac agtatcttct 600
ctttcatttg gtgagactgt tagctctggc cgcggactga attccacaca gctcacttgg 660
gaaaacttta ttccaaaaca tagtcacatt gaacattgtg gagaatgagg gacagagaag 720
aggccctaga tttgtacatc tgggtgttat gtctataaat agaatgcttt ggtggtcaac 780
tagacttgtt catgttgaca tttagtcttg ccttttcggt ggtgatttaa aaattatgta 840
tatcttgttt ggaatatagt ggagctatgg tgtggcattt tcatctggct ttttgtttag 900
ctcagcccgt cctgttatgg gcagccttga agctcagtag ctaatgaaga ggtatcctca 960
ctccctccag agagcggtcc cctcacggct cattgagagt ttgtcagcac cttgaaatga 1020
gtttaaactt gtttattttt aaaacattct tggttatgaa tgtgcctata ttgaattact 1080
gaacaacctt atggttgtga agaattgatt tggtgctaag gtgtataaat ttcaggacca 1140
gtgtctctga agagttcatt tagcatgaag tcagcctgtg gcaggttggg tggagccagg 1200
gaacaatgga gaagctttca tgggtgg 1227
<210>44
<211>1586
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR44
<400>44
cacctgcctc agcctcccaa agtgctgaga ttcaaagaaa ttttcatgga gaggggacag 60
atggagtcaa ttcttgtggg gtgaacatga gtaccacagt tagactgagg ttgggaaaga 120
ttttccagac aattggaaga gcatgtgaaa gacacagatt ttgagaaatg ttaagtctag 180
ggaactgcaa ggcttttggc acaagaaagc cactgtagac tatagaggca ggatgcctag 240
attcaaatcc caactgctac acttctaagc tttgtaattt tggcaagttt ttaccctcta 300
ttttcttatc tataaaatat agattttata tatatagata tagatatata gatagataat 360
aattgtgcat gcctaataaa gttgtcaaag attaaatgtt atatgtgaag tattttgtac 420
ggtgatagga acccaggaag ggctctatga atattatgta ttattattat tctaaagtag 480
ctggaataca atgttcaaag gagatagtgg caggagataa gtttgaattg aaagattgag 540
gccagaacat aaagtgcctc ctatattata ttttacataa ttggaacatc attgaaaaat 600
ttaagtatta tttatgtgtg tatgtgtgtt ttatataatt aattctagtt catcatttta 660
aaatatcttt ctgatgtcac tgtgaacaac agatgagaag aagtgaatcc tgagttaagg 720
agaccagctc tctgattact gccataatcc agggagggta ccataaggat ttcaactgga 780
agtgaatcca tcatgatgga gaggaaggac agggctgaaa aatacttagg aagtagtatc 840
agtaggactg gttaagagag agcagaggca ggctacaggg gttggaggtg tcaatcacag 900
agatagggaa aatgggagga gaagcaggct ttgaaaaagt ggcttgtctt gtaaaattat 960
gtgctgttaa aacagtacaa gaaattaata tattcaatcc caaaatacag ggacaattct 1020
ttttgaaaga gttacccaga tagtcttcct tgaagttttc agttaaagaa atttcttgtt 1080
aacaaataat gtagtcatag aagaaaacac ttaaaacttt attgaataaa gctaataaat 1140
catttaatat aatttatagg aaattgttac ataacacaca cattcaatac tttttgctaa 1200
agtataaatt aatggaagga gagcacgcac acagaggttg aattatgttt atgactttat 1260
tagtcaagaa tacaaaattg agtagctaca tcaagcagaa gcacatgctt tacaatccag 1320
cacagaatcc cttgacatcc aaactcccga aacagacatg taaatacaga tgacattgtc 1380
agaacaaaat agggtctcac ccgacctata atgttctttt cttgatataa atatgcacat 1440
gaattgcata cggtcatatg gttccaatta ccattatttc ctctgggctt agctatccat 1500
ctaaggggaa tttacaccaa cactgtactt ctacttgcaa gaatatatga aagcatagtt 1560
aacttctggc ttaggacccc aactca 1586
<210>45
<211>1981
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR45
<400>45
atggatcata gggtaaataa atttataatt tcttgagaaa gcttcgtact gttttccaag 60
atggctgtac taatttccat tcctaccaac agtgtacagg gtttcttttt ctccacatcc 120
tcaccaacac ttatcttcca tcttttttta taatagccct agtaaaatgt gtgaggtgat 180
atctcattgt ggcattgatt tgcacttctc tgataattag gaatgtttat gattttttca 240
tgtacctggt tggccttttg tatgatgtag gaaatgtcta ttctgattct ttgcttattt 300
tttaataagc atagtttttt tcttattttt gagtaggttg agttgcttat atattattat 360
atgagcccct tacctgatgt atggtttaaa aatattatcc catttgtggg ttctcttaat 420
tctatcattg cttcttttcc tgtggaaaag ttttaagttt tatgcagtct catttgtgtg 480
ttttgctttt gttgcctttt ggaataatct acagaaaatc atagctcagg ccaatgtcat 540
acagtctcct tctatatttc cttgtagtag ttttacattt aaactttaat tttgatttga 600
tgcttgtata aagagcaaaa taaaagtcaa attttattct tctgtatgtg gatagtcagt 660
tttgtctaca ccatttattg aaaataattt tctttcttca ctgtgtattt ttagttattt 720
tatcaaaaaa tcaattgacc acagacacac ggatttattt acaggttcta tatccctttg 780
tactgtttta catgtctgtt tttatgccat tgctatgctg ttttaattcc tatagctttg 840
taatagagtt tggagtcagg tagtctgatg cctccagctt tgttcttttt gttcaagatt 900
gctttggttg gtccaggtct tttgtggttc catacaaatt ttagcagtaa tttttctatt 960
tctgtgaaga atgacattgg aatttgatag tggttgcatt taatctgtag attgctttgg 1020
gtagcattga cacttttaca atactaattt ttgaatccat caatgaagga tgtttctcca 1080
tttatttatg ccattttaat ttttttcatc aatgtgctat agttttcagt atgtaaatct 1140
tttatggttt tgattaaatt tactcctgtc ttttatatat ttatatatct gttttgattc 1200
tattataaat tgaattgcct ttatttttca ggtaatagtt tgtcattagt taatagaaac 1260
aataatgata tttgtatgtt gattttgtaa ctattaactt tattgaattt cttcatcagc 1320
tataaccatt tattttggtg gaatctttaa gattttctct atcttaagat tatattttca 1380
aaaaacagaa acaatcttac ctcttccttc cctatgtgga tttcttttac gtctttgtct 1440
tgtgtaactg ttctggctag gcaattacac ataatgtttt catcatttat aattttacat 1500
cacatccatc tattgtggca cattgattgc tacttttcaa gttgtaaacc tggacattta 1560
tcactactct tcctccaata caggagtcca tggcgtggtg tgggccctac tgtgccacag 1620
tccagggcac ggctgggctg aggttctctt gtgcaagagt ccgtggctct gcggagcaag 1680
agttctccag tgccttagtc cagggttagg caggggtggg gctccttcag tagcttagtc 1740
cagtgcgccg ccctgcgagg gtcctcctga gcaggagtac acgatgaggc agggtcctac 1800
tgtgccttag cccaggaagc ggggggctgg gtcctctggt gccatagtcc aggctgccgg 1860
gagctgggtc ctctggtgcc atagctcagg ccggcgggag ctgggtcctc tggtgccgta 1920
gtccagggtg cagcagaaca ggagtcctgc ggagcagtag tccagggcac gctggggcgt 1980
g 1981
<210>46
<211>1859
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR46
<400>46
attgtttttc tcgcccttct gcattttctg caaattctgt tgaatcattg cagttactta 60
ggtttgcttc gtctccccca ttacaaacta cttactgggt ttttcaaccc tagttccctc 120
atttttatga tttatgctca tttctttgta cacttcgtct tgctccatct cccaactcat 180
ggcccctggc tttggattat tgttttggtc ttttattttt tgtcttcttc tacctcaaca 240
cttatcttcc tctcccagtc tccggtaccc tatcaccaag gttgtcatta acctttcata 300
ttattcctca ttatccatgt attcatttgc aaataagcgt atattaacaa aatcacaggt 360
ttatggagat ataattcaca taccttaaaa ttcaggcttt taaagtgtac ctttcatgtg 420
gtttttggta tattcacaaa gttatgcatt gatcaccacc atctgattcc ataacatgtt 480
caatacctca aaaagaagtc tgtactcatt agtagtcatt tcacattcac cactccctct 540
ggctctgggc agtcactgat ctttgtgtct ctatggattt gcctagtcta ggtattttta 600
tgtaaatggc atcatacaac atgtgacctt ttgtttggct tttttcattt agcaaaatgt 660
tatcaaggtc tgtccctgtt gtagcatgta ttagcacttc atttcttata tgctgaatga 720
tatactttat ttgtccatca gttgttcatg ctttatttgt ccatcagttg atgaacattt 780
gcgtttttgc cactttgggc tattaagaat aatgctactg tgaacaagtg tgtacaagtt 840
cctctacaaa tttttgtgtg gacatatcct ttcagttctc tcaggtgtat atctgggaat 900
tgaattgctg ggtcgtgtag tagctatgtt aaacactttg agaaactgct ataatgttct 960
ccagagctgt accattttaa attctgtgta tgaggattcc acgttctcca cttcctcacc 1020
agtgtatgga tttgggggta tactttttaa aaagtgggat taggctgggc acagtggctc 1080
acacctgtaa tcccaacact tcaggaagct gaggtgggag gatcacttga gcctagtagt 1140
ttgagaccag cctgggcaac atagggagac cctgtctcta caaaaaataa tttaaaataa 1200
attagctggg cgttgtggca cacacctgta gtcccagcta catgggaggc tgaggtggaa 1260
ggattccctg agcccagaag tttgaggttg cagtgagcca tgatggcagc actatactgt 1320
agcctgggtg tcagagcaag actccgtttc agggaagaaa aaaaaaagtg ggatgatatt 1380
tttgacactt ttcttcttgt tttcttaatt tcatacttct ggaaattcca ttaaattagc 1440
tggtaccact ctaactcatt gtgtttcatg gctgcatagt aatattgcat aatataaata 1500
taccattcat tcatcaaagt tagcagatat tgactgttag gtgccaggca ctgctctaag 1560
cgttaaagaa aaacacacaa aaacttttgc attcttagag tttattttcc aatggagggg 1620
gtggagggag gtaagaattt aggaaataaa ttaattacat atatagcata gggtttcacc 1680
agtgagtgca gcttgaatcg ttggcagctt tcttagtagt ataaatacag tactaaagat 1740
gaaattactc taaatggtgt tacttaaatt actggaatag gtattactat tagtcacttt 1800
gcaggtgaaa gtggaaacac catcgtaaaa tgtaaaatag gaaacagctg gttaatgtt 1859
<210>47
<211>1082
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR47
<400>47
atcattagtc attagggaaa tgcaaatgaa aaacacaagc agccaccaat atacacctac 60
taggatgatt taaaggaaaa taagtgtgaa gaaggacgta aagaaattgt aaccctgata 120
cattgatggt agaaatggat aaagttgcag ccactgtgaa aaacagtctg cagtggctca 180
gaaggttaaa tatagaaccc ctgttggacc caggaactct actcttaggc accccaaaga 240
atagagaaca gaaatcaaac agatgtttgt atactaatgt ttgtagcatc acttttcaca 300
ggagccaaaa ggtggaaata atccaaccat cagtgaacaa atgaatgtaa taaaagcaag 360
gtggtctgca tgcaatgcta catcatccat ctgtaaaaaa cgaacatcat tttgatagat 420
gatacaacat gggtggacat tgagaacatt atgcttagtg aaataagcca gacacaaaag 480
gaatatattg tataattgta attacatgaa gtgcctagaa tagtcaaatt catacaagag 540
aaagtgggat aggaatcacc atgggctgga aataggggga aggtgctata ctgcttattg 600
tggacaaggt ttcgtaagaa atcatcaaaa ttgtgggtgt agatagtggt gttggttatg 660
caaccctgtg aatatattga atgccatgga gtgcacactt tggttaaaag gttcaaatga 720
taaatattgt gttatatata tttccccacg atagaaaaca cgcacagcca agcccacatg 780
ccagtcttgt tagctgcctt cctttacctt caagagtggg ctgaagcttg tccaatcttt 840
caaggttgct gaagactgta tgatggaagt catctgcatt gggaaagaaa ttaatggaga 900
gaggagaaaa cttgagaatc cacactactc accctgcagg gccaagaact ctgtctccca 960
tgctttgctg tcctgtctca gtatttcctg tgaccacctc ctttttcaac tgaagacttt 1020
gtacctgaag gggttcccag gtttttcacc tcggcccttg tcaggactga tcctctcaac 1080
ta 1082
<210>48
<211>1242
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR48
<400>48
atcatgtatt tgttttctga attaattctt agatacatta atgttttatg ttaccatgaa 60
tgtgatatta taatataata tttttaattg gttgctactg tttataagaa tttcattttc 120
tgtttacttt gccttcatat ctgaaaacct tgctgatttg attagtgcat ccacaaattt 180
tcttggattt tctatgggta attacaaatc tccacacaat gaggttgcag tgagccaaga 240
tcacaccact gtactccagc ctgggcgaca gagtgagaca ccatctcaca aaaacacata 300
aacaaacaaa cagaaactcc acacaatgac aacgtatgtg ctttcttttt ttcttcctct 360
ttctataata tttctttgtc ctatcttaac tgaactggcc agaaacccca ggacaatgat 420
aaatacgagc agtgtcaaca gacatctcat tccctttcct agcttttata aaaataacga 480
ttatgcttca acattacata tggtggtgtc gatggttttg ttatagataa gcttatcagg 540
ttaagaaatt tgtctgcgtt tcctagtttg gtataaagat tttaatataa atgaatgttg 600
tattttatca tcttattttt ttcctacatc tgctaaggta atcctgtgtt ttcccctttt 660
caatctccta atgtggtgaa tgacattaaa ataccttcta ttgttaaaat attcttgcaa 720
cgctgtatag aaccaatgcc tttattctgt attgctgatg gatttttgaa aaatatgtag 780
gtggacttag ttttctaagg ggaatagaat ttctaatata tttaaaatat tttgcatgta 840
tgttctgaag gacattggtg tgtcatttct ataccatctg gctactagag gagccgactg 900
aaagtcacac tgccggagga ggggagaggt gctcttccgt ttctggtgtc tgtagccatc 960
tccagtggta gctgcagtga taataatgct gcagtgccga cagttctgga aggagcaaca 1020
acagtgattt cagcagcagc agtattgcgg gatccccacg atggagcaag ggaaataatt 1080
ctggaagcaa tgacaatatc agctgtggct atagcagctg agatgtgagt tctcacggtg 1140
gcagcttcaa ggacagtagt gatggtccaa tggcgcccag acctagaaat gcacatttcc 1200
tcagcaccgg ctccagatgc tgagcttgga cagctgacgc ct 1242
<210>49
<211>1015
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR49
<400>49
aaaccagaaa cccaaaacaa tgggagtgac atgctaaaac cagaaaccca aaacaatggg 60
agggtcctgc taaaccagaa acccaaaaca atgggagtga agtgctaaaa ccagaaaccc 120
aaaacaatgg gagtgtcctg ctacaccaga aacccaaaac gatgggagtg acgtgataaa 180
accagacacc caaaacaatg ggagtgacgt gctaaaccag aaacccaaaa caatgggagt 240
gacgtgctaa aacctggaaa cctaaaacaa tgcgagtgag gtgctaacac cagaatccat 300
aacaatgtga gtgacgtgct aaaccagaac ccaaaacaat gggagtgacg tgctaaaaca 360
ggaacccaaa acaatgagag tgacgtgcta aaccagaaac ccaaaacaat gggaatgacg 420
tgctaaaacc ggaacccaaa acaatgggag tgatgtgcta aaccagaaac ccaaaacaat 480
gggaatgaca tgctaaaact ggaacccaaa acaatggtaa ctaagagtga tgctaaggcc 540
ctacattttg gtcacactct caactaagtg agaacttgac tgaaaaggag gatttttttt 600
tctaagacag agttttggtc tgtcccccag agtggagtgc agtggcatga tctcggctca 660
ctgcaagctc tgcctcccgg gttcaggcca ttctcctgcc tcagcctcct gagtagctgg 720
gaatacaggc acccgccacc acacttggct aattttttgt atttttagta gagatggggt 780
ttcaccatat tagcaaggat ggtctcaatc tcctgacctc gtgatctgcc cacctcaggc 840
tcccaaagtg ctgggattac aggtgtgagc caccacaccc agcaaaaagg aggaattttt 900
aaagcaaaat tatgggaggc cattgttttg aactaagctc atgcaatagg tcccaacaga 960
ccaaaccaaa ccaaaccaaa atggagtcac tcatgctaaa tgtagcataa tcaaa 1015
<210>50
<211>2355
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR50
<400>50
caaccatcgt tccgcaagag cggcttgttt attaaacatg aaatgaggga aaagcctagt 60
agctccattg gattgggaag aatggcaaag agagacaggc gtcattttct agaaagcaat 120
cttcacacct gttggtcctc acccattgaa tgtcctcacc caatctccaa cacagaaatg 180
agtgactgtg tgtgcacatg cgtgtgcatg tgtgaaagta tgagtgtgaa tgtgtctata 240
tgggaacata tatgtgattg tatgtgtgta actatgtgtg actggcagcg tggggagtgc 300
tggttggagt gtggtgtgat gtgagtatgc atgagtggct gtgtgtatga ctgtggcggg 360
aggcggaagg ggagaagcag caggctcagg tgtcgccaga gaggctggga ggaaactata 420
aacctgggca atttcctcct catcagcgag cctttcttgg gcaatagggg cagagctcaa 480
agttcacaga gatagtgcct gggaggcatg aggcaaggcg gaagtactgc gaggaggggc 540
agagggtctg acacttgagg ggttctaatg ggaaaggaaa gacccacact gaattccact 600
tagccccaga ccctgggccc agcggtgccg gcttccaacc ataccaacca tttccaagtg 660
ttgccggcag aagttaacct ctcttagcct cagtttcccc acctgtaaaa tggcagaagt 720
aaccaagctt accttcccgg cagtgtgtga ggatgaaaag agctatgtac gtgatgcact 780
tagaagaagg tctagggtgt gagtggtact cgtctggtgg gtgtggagaa gacattctag 840
gcaatgagga ctggggagag cctggcccat ggcttccact cagcaaggtc agtctcttgt 900
cctctgcact cccagccttc cagagaggac cttcccaacc agcactcccc acgctgccag 960
tcacacatag ttacacacat acaatcacat atatgttccc atatagacac attcacactc 1020
ataccttcac acatgcacac gcatgtgcac acacagtcac tcatttctgt gttggagatt 1080
gggtgaggac attcaatggg tgaggaccaa caggtgtgaa gattgctttc tagaaaatga 1140
ctcctgtctc tctttgccat tcttcccaat ccgatggagc tactaggctt ttccctcatt 1200
tcatgtttaa taaaccttcc caatggcgaa atgggctttc tcaagaagtg gtgagtgtcc 1260
catccctgcg gtggggacag gggtggcagc ggacaagcct gcctggaggg aactgtcagg 1320
ctgattccca gtccaactcc agcttccaac acctcatcct ccaggcagtc ttcattcttg 1380
gctctaattt cgctcttgtt ttctttttta tttttatcga gaactgggtg gagagctttt 1440
ggtgtcattg gggattgctt tgaaaccctt ctctgcctca cactgggagc tggcttgagt 1500
caactggtct ccatggaatt tcttttttta gtgtgtaaac agctaagttt taggcagctg 1560
ttgtgccgtc cagggtggaa agcagcctgt tgatgtggaa ctgcttggct cagatttctt 1620
gggcaaacag atgccgtgtc tctcaactca ccaattaaga agcccagaaa atgtggcttg 1680
gagaccacat gtctggttat gtctagtaat tcagatggct tcacctggga agccctttct 1740
gaatgtcaaa gccatgagat aaaggacata tatatagtag ctagggtggt ccacttctta 1800
ggggccatct ccggaggtgg tgagcactaa gtgccaggaa gagaggaaac tctgttttgg 1860
agccaaagca taaaaaaacc ttagccacaa accactgaac atttgttttg tgcaggttct 1920
gagtccaggg agggcttctg aggagagggg cagctggagc tggtaggagt tatgtgagat 1980
ggagcaaggg ccctttaaga ggtgggagca gcatgagcaa aggcagagag gtggtaatgt 2040
ataaggtatg tcatgggaaa gagtttggct ggaacagagt ttacagaata gaaaaattca 2100
acactattaa ttgagcctct actacgtgct cgacattgtt ctagtcactg agataggttt 2160
ggtatacaaa acaaaatcca tcctctatgg acattttagt gactaacaac aatataaata 2220
ataaaagtga acaaaagctc aaaacatgcc aggcactatt atttatttat ttatttattt 2280
atttatttat tttttgaaac agagtctcgc tctgttgccc aggctggagt gtagtggtgc 2340
gatctcggct cactg 2355
<210>51
<211>2289
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR51
<400>51
tcacaggtga caccaatccc ctgaccacgc tttgagaagc actgtactag attgactttc 60
taatgtcagt cttcattttc tagctctgtt acagccatgg tctccatatt atctagtaca 120
acacacatac aaatatgtgt gatacagtat gaatataata taaaaatatg tgttataata 180
taaatataat attaaaatat gtctttatac tagataataa tacttaataa cgttgagtgt 240
ttaactgctc taagcacttt acctgcagga aacagttttt tttttatttt ggtgaaatac 300
aactaacata aatttattta caattttaag catttttaag tgtatagttt agtggagtta 360
atatattcaa aatgttgtgc agccgtcacc atcatcagtc ttcataactc ttttcatatt 420
gtaaaattaa aagtttatgc tcatttaaaa atgactccca atttcccccc tcctcaacct 480
ctggaaacta ccattctatt ttctgcctcc gtagttttgc ccactctaag tacctcacat 540
aagtggaatt tgtcttattt gcctgtttgt gaccggctga tttcatttag tataatgtcc 600
tcaagtttta ttcacgttat atagcatatg tcataatttt cttcactttt aagcttgagt 660
aatatttcat cgtatgtatc tcacattttg cttatccatt catctctcag tggacacttg 720
agttgcttct acattttagc tgttgtgaat actgctgcta tgaacatggg tgtataaata 780
tctcaagacc tttttatcag ttttttaaaa tatatactca gtagtagttt agctggatta 840
tatggtaatt ttatttttaa tttttgagga actgtcctac ccttttattc aatagtagct 900
ataccaattg acaattggca ttcctaccaa cagggcataa gggttctcaa ttctccacat 960
attccctgat acttgttatt ttcaggtgtt tttttttttt tttttttttt atgggagcca 1020
tgttaatggg tgtaaggtga tatttcatta tagttttgat ttgcatttcc ctaatgatta 1080
gtgatgttaa gcatctcttc atgtgcctat tggccatttg tatatcttct ttaaaaatat 1140
atatatactc attcctttgc ccatttttga attatgttta ttttttgtta ttgagtttca 1200
atacttttct atataaccta ggtattaatc ctttatcaga cttaagattt gcaaatattc 1260
tctttcattc cacaggttgc taattctctc tgttggtaat atcttttgat gctgttgtgt 1320
ccagaattga ttcattcctg tgggttcttg gtctcactga cttcaagaat aaagctgcgg 1380
accctagtgg tgagtgttac acttcttata gatggtgttt ccggagtttg ttccttcaga 1440
tgtgtccaga gtttcttcct tccaatgggt tcatggtctt gctgacttca ggaatgaagc 1500
cgcagacctt cgcagtgagg tttacagctc ttaaaggtgg cgtgtccaga gttgtttgtt 1560
ccccctggtg ggttcgtggt cttgctgact tcaggaatga agccgcagac cctcgcagtg 1620
agtgttacag ctcataaagg tagtgcggac acagagtgag ctgcagcaag atttactgtg 1680
aagagcaaaa gaacaaagct tccacagcat agaaggacac cccagcgggt tcctgctgct 1740
ggctcaggtg gccagttatt attcccttat ttgccctgcc cacatcctgc tgattggtcc 1800
attttacaga gtactgattg gtccatttta cagagtgctg attggtgcat ttacaatcct 1860
ttagctagac acagagtgct gattgctgca ttcttacaga gtgctgattg gtgcatttac 1920
agtcctttag ctagatacag aacgctgatt gctgcgtttt ttacagagtg ctgattggtg 1980
catttacaat cctttagcta gacacagtgc tgattggtgg gtttttacag agtgctgatt 2040
ggtgcgtctt tacagagtgc tgattggtgc atttacaatc ctttagctag acacagagtg 2100
ctgattggtg cgtttataat cctctagcta gacagaaaag ttttccaagt ccccacctga 2160
ccgagaagcc ccactggctt cacctctcac tgttatactt tggacatttg tccccccaaa 2220
atctcatgtt gaaatgtaac ccctaatgtt ggaactgagg ccagactgga tgtggctggg 2280
ccatgggga 2289
<210>52
<211>1184
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR52
<400>52
ctcttctttg tttttttatt ttggggtgtg tgggtacgtg taagatgaga aatgtacaaa 60
cacaagtatt tcagaaactc caagtaatat tctgtctgtg agttcacggt aaataaataa 120
aaagggcaaa gtgacagaaa tacaggatta ttaaaagcaa aataatgttc tttgaaatcc 180
cccccttggt gtatttttta tcttaggatg cagcactttc agcatgccca agtattgaaa 240
gcagtgtttt tacgctacca cggtaatttt atttagaaac cccatgttca cttttagttt 300
taaaatggtc tttatgacat aaaattatca gcattcatat ttttgtgttt taatattcct 360
ttggctactt attgaaacag taaacattac gaaaattagt aaacaaatct ttgatagttg 420
cttatttttg tttaattgaa tgtttatttt attaggtaaa tatacaatca aatttattta 480
aaaataatga ggaaaagaat acttttcttt cgctttgcga aagcaaagtg atttttcatt 540
cttctccgtc cgattccttc tcttccagct gccacagccg actgacaggc tcccggcggc 600
ctgaggagta gtatgcaaat tttggatgat tgacacctac agtagaagcc aatcacgtca 660
aagtaggatg ctgattggtt gacaacaata ggcgtaaacc ttgacgtttt aaaaacctga 720
cacccaatcc aggcgattca tgcaaataaa ggaagggagt cacattacca ggggccagag 780
agacttgagt acgacctcac gtgttcagtg gtggatattg cacagacgtc tgcaaggtct 840
atataaacgc tacataatgt tcaactcaat tgcttgcctt ggcctttccc aaacttgtca 900
ctggaatata aattatccct tttttaaaaa taaaaaaata agaattatgt agtgcacata 960
tatgatggtt catgtagaaa tctaaatgga cttccaacgc atggaatttt cctatttccc 1020
cctttcttta aattaatcct cagtgaagga ggctgttttc ccctagattt caaaaggacg 1080
agatttacag agcctttcct tggagaaacc cgctctaggc acagatggtc agtaaattta 1140
gcttcttcag cgaagttcca catggcaccg ccagatggca taag 1184
<210>53
<211>1431
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR53
<400>53
ccctgaggaa gatgacgagt aactccgtaa gagaaccttc cactcatccc ccacatccct 60
gcagacgtgc tattctgtta tgatactggt atcccatctg tcacttgctc cccaaatcat 120
tcccttctta caattttcta ctgtacagca ttgaggctga acgatgagag atttcccatg 180
ctctttctac tccctgccct gtatatatcc ggggatcctc cctacccagg atgctgtggg 240
gtcccaaacc ccaagtaagc cctgatatgc gggccacacc tttctctagc ctaggaattg 300
ataacccagg cgaggaagtc actgtggcat gaacagatgg ttcacttcga ggaaccgtgg 360
aaggcgtgtg caggtcctga gatagggcag aatcggagtg tgcagggtct gcaggtcagg 420
aggagttgag attgcgttgc cacgtggtgg gaactcactg ccacttattt ccttctctct 480
tcttgcctca gcctcaggga tacgacacat gcccatgatg agaagcagaa cgtggtgacc 540
tttcacgaac atgggcatgg ctgcggaccc ctcgtcatca ggtgcatagc aagtgaaagc 600
aagtgttcac aacagtgaaa agttgagcgt catttttctt agtgtgccaa gagttcgatg 660
ttagcgttta cgttgtattt tcttacactg tgtcattctg ttagatacta acattttcat 720
tgatgagcaa gacatactta atgcatattt tggtttgtgt atccatgcac ctaccttaga 780
aaacaagtat tgtcggttac ctctgcatgg aacagcatta ccctcctctc tccccagatg 840
tgactactga gggcagttct gagtgtttaa tttcagattt tttcctctgc atttacacac 900
acacgcacac aaaccacacc acacacacac acacacacac acacacacac acacacacac 960
acacaccaag taccagtata agcatctgcc atctgctttt cccattgcca tgcgtcctgg 1020
tcaagctccc ctcactctgt ttcctggtca gcatgtactc ccctcatccg attcccctgt 1080
agcagtcact gacagttaat aaacctttgc aaacgttccc cagttgtttg ctcgtgccat 1140
tattgtgcac acagctctgt gcacgtgtgt gcatatttct ttaggaaaga ttcttagaag 1200
tggaattgct gtgtcaaagg agtcatttat tcaacaaaac actaatgagt gcgtcctcgt 1260
gctgagcgct gttctaggtg ctggagcgac gtcagggaac aaggcagaca ggagttcctg 1320
acccccgttc tagaggagga tgtttccagt tgttgggttt tgtttgtttg tttcttctag 1380
agatggtggt cttgctctgt ccaggctaga gtgcagtggc atgatcatag c 1431
<210>54
<211>975
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR54
<400>54
ccataaaagt gtttctaaac tgcagaaaaa tccccctaca gtcttacagt tcaagaattt 60
tcagcatgaa atgcctggta gattacctga ctttttttgc caaaaataag gcacagcagc 120
tctctcctga ctctgacttt ctatagtcct tactgaatta tagtccttac tgaattcatt 180
cttcagtgtt gcagtctgaa ggacacccac attttctctt tgtctttgtc aattctttgt 240
gttgtaaggg caggatgttt aaaagttgaa gtcattgact tgcaaaatga gaaatttcag 300
agggcatttt gttctctaga ccatgtagct tagagcagtg ttcacactga ggttgctgct 360
aatgtttctg cagttcttac caatagtatc atttacccag caacaggata tgatagagga 420
cttcgaaaac cccagaaaat gttttgccat atatccaaag ccctttggga aatggaaagg 480
aattgcgggc tcccattttt atatatggat agatagagac caagaaagac caaggcaact 540
ccatgtgctt tacattaata aagtacaaaa tgttaacatg taggaagtct aggcgaagtt 600
tatgtgagaa ttctttacac taattttgca acattttaat gcaagtctga aattatgtca 660
aaataagtaa aaatttttac aagttaagca gagaataaca atgattagtc agagaaataa 720
gtagcaaaat cttcttctca gtattgactt ggttgctttt caatctctga ggacacagca 780
gtcttcgctt ccaaatccac aagtcacatc agtgaggaga ctcagctgag actttggcta 840
atgttggggg gtccctcctg tgtctcccca ggcgcagtga gcctgcaggc cgacctcact 900
cgtggcacac aactaaatct ggggagaagc aacccgatgc cagcatgatg cagatatctc 960
agggtatgat cggcc 975
<210>55
<211>501
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR55
<400>55
cctgaactca tgatccgccc acctcagcct cctgaagtgc tgggattaca ggtgtgagcc 60
accacaccca gccgcaacac actcttgagc aaccaatgtg tcataaaaga aataaaatgg 120
aaatcagaaa gtatcttgag acagacaaaa atggaaacac aacataccaa aatttatggg 180
acacagcaaa agcagtttta ggagggaagt ttatagtgat gaatacctac ctcaaaatca 240
ttagcctgat tggatgacac tacagtgtat aaatgaattg aaaaccacat tgtgccccat 300
acatatatac aatttttatt tgttaattaa aaataaaata aaactttaaa aaagaagaaa 360
gagctcaaat aaacaaccta actttatacc tcaaggaaat agaagagcca gctaagccca 420
aagttgacag aaggaaaaaa atattggcag aaagaaatga aacagagact agaaagacaa 480
ttgaagagat cagcaaaact a 501
<210>56
<211>741
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR56
<400>56
acacaggaaa agatcgcaat tgttcagcag agctttgaac cggggatgac ggtctccctc 60
gttgcccggc aacatggtgt agcagccagc cagttatttc tctggcgtaa gcaataccag 120
gaaggaagtc ttactgctgt cgccgccgga gaacaggttg ttcctgcctc tgaacttgct 180
gccgccatga agcagattaa agaactccag cgcctgctcg gcaagaaaac gatggaaaat 240
gaactcctca aagaagccgt tgaatatgga cgggcaaaaa agtggatagc gcacgcgccc 300
ttattgcccg gggatgggga gtaagcttag tcagccgttg tctccgggtg tcgcgtgcgc 360
agttgcacgt cattctcaga cgaaccgatg actggatgga tggccgccgc agtcgtcaca 420
ctgatgatac ggatgtgctt ctccgtatac accatgttat cggagagctg ccaacgtatg 480
gttatcgtcg ggtatgggcg ctgcttcgca gacaggcaga acttgatggt atgcctgcga 540
tcaatgccaa acgtgtttac cggatcatgc gccagaatgc gctgttgctt gagcgaaaac 600
ctgctgtacc gccatcgaaa cgggcacata caggcagagt ggccgtgaaa gaaagcaatc 660
agcgatggtg ctctgacggg ttcgagttct gctgtgataa cggagagaga ctgcgtgtca 720
cgttcgcgct ggactgctgt g 741
<210>57
<211>1365
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR57
<400>57
tccttctgta aataggcaaa atgtatttta gtttccacca cacatgttct tttctgtagg 60
gcttgtatgt tggaaatttt atccaattat tcaattaaca ctataccaac aatctgctaa 120
ttctggagat gtggcagtga ataaaaaagt tatagtttct gattttgtgg agcttggact 180
ttaatgatgg acaaaacaac acattcttaa atatatattt catcaaaatt atagtgggtg 240
aattatttat atgtgcattt acatgtgtat gtatacataa atgggcggtt actggctgca 300
ctgagaatgt acacgtggcg cgaacgaggc tgggcggtca gagaaggcct cccaaggagg 360
tggctttgaa gctgagtggt gcttccacgt gaaaaggctg gaaagggcat tccaagaaaa 420
ggctgaggcc agcgggaaag aggttccagt gcgctctggg aacggaaagc gcacctgcct 480
gaaacgaaaa tgagtgtgct gaaataggac gctagaaagg gaggcagagg ctggcaaaag 540
cgaccgagga ggagctcaaa ggagcgagcg gggaaggccg ctgtggagcc tggaggaagc 600
acttcggaag cgcttctgag cgggtaaggc cgctgggagc atgaactgct gagcaggtgt 660
gtccagaatt cgtgggttct tggtctcact gacttcaaga atgaagaggg accgcggacc 720
ctcgcggtga gtgttacagc tcttaaggtg gcgcgtctgg agtttgttcc ttctgatgtt 780
cggatgtgtt cagagtttct tccttctggt gggttcgtgg tctcgctggc tcaggagtga 840
agctgcagac cttcgcggtg agtgttacag ctcataaaag cagggtggac tcaaagagtg 900
agcagcagca agatttattg caaagaatga aagaacaaag cttccacact gtggaagggg 960
accccagcgg gttgccactg ctggctccgc agcctgcttt tattctctta tctggcccca 1020
cccacatcct gctgattggt agagccgaat ggtctgtttt gacggcgctg attggtgcgt 1080
ttacaatccc tgcgctagat acaaaggttc tccacgtccc caccagatta gctagataga 1140
gtctccacac aaaggttctc caaggcccca ccagagtagc tagatacaga gtgttgattg 1200
gtgcattcac aaaccctgag ctagacacag ggtgatgact ggtgtgttta caaaccttgc 1260
ggtagataca gagtatcaat tggcgtattt acaatcactg agctaggcat aaaggttctc 1320
caggtcccca ccagactcag gagcccagct ggcttcaccc agtgg 1365
<210>58
<211>1401
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR58
<400>58
aagtttacct tagccctaaa ttatttcatt gtgattggca ttttaggaaa tatgtattaa 60
ggaatgtctc ttaggagata aggataacat atgtctaaga aaattatatt gaaatattat 120
tacatgaact aaaatgttag aactgaaaaa aaattattgt aactccttcc agcgtaggca 180
ggagtatcta gataccaact ttaacaactc aactttaaca acttcgaacc aaccagatgg 240
ctaggagatt cacctattta gcatgatatc ttttattgat aaaaaaatat aaaacttcca 300
ttaaattttt aagctactac aatcctatta aattttaact taccagtgtt ctcaatgcta 360
cataatttaa aatcattgaa atcttctgat tttaactcct cagtcttgaa atctacttat 420
ttttagttac atatatatcc aatctactgc cgctagtaga agaagcttgg aatttgagaa 480
aaaaatcaga cgttttgtat attctcatat tcactaattt attttttaaa tgagtttctg 540
caatgcatca agcagtggca aaacaggaga aaaattaaaa ttggttgaaa agatatgtgt 600
gccaaacaat cccttgaaat ttgatgaagt gactaatcct gagttattgt ttcaaatgtg 660
tacctgttta tacaagggta tcacctttga aatctcaaca ttaaatgaaa ttttataagc 720
aatttgttgt aacatgatta ttataaaatt ctgatataac attttttatt acctgtttag 780
agtttaaaga gagaaaagga gttaagaata attacatttt cattagcatt gtccgggtgc 840
aaaaacttct aacactatct tcaaatcttt ttctccattg ccttctgaac atacccactt 900
gggtatctca ttagcactgc aaattcaaca ttttcgattg ctaatttttc tccctaaata 960
tttatttgtt ttctcagctt tagccaatgt ttcactattg accatttgct caagtatagt 1020
gacgcttcaa tgaccttcag agagctgttt cagtccttcc tggactactt gcatgcttcc 1080
aacaaaatga agcactcttg atgtcagtca ctcaaataaa tggaaatggg cccatttact 1140
aggaatgtta acagaataaa aagatagacg tgacaccagt tgcttcagtc catctccatt 1200
tacttgctta aggcctggcc atatttctca cagttgatat ggcgcagggc acatgtttaa 1260
atggctgttc ttgtaggatg gtttgactgt tggattcctc atcttccctc tccttaggaa 1320
ggaaggttac agtagtactg ttggctcctg gaatatagat tcataaagaa ctaatggagt 1380
atcatctccc actgctcttg t 1401
<210>59
<211>866
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR59
<400>59
gagatcacgc cactgcactc cagcctgggg gacagagcaa gactccatct cagaaacaaa 60
caaacacaca aagccagtca aggtgtttaa ttcgacggtg tcaggctcag gtctcttgac 120
aggatacatc cagcacccgg gggaaacgtc gatgggtggg gtggaatcta ttttgtggcc 180
tcaagggagg gtttgagagg tagtcccgca agcggtgatg gcctaaggaa gcccctccgc 240
ccaagaagcg atattcattt ctagcctgta gccacccaag agggagaatc gggctcgcca 300
cagaccccac aacccccaac ccaccccacc cccacccctc ccacctcgtg aaatgggctc 360
tcgctccgtc aggctctagt cacaccgtgt ggttttggaa cctccagcgt gtgtgcgtgg 420
gttgcgtggt ggggtggggc cggctgtgga cagaggaggg gataaagcgg cggtgtcccg 480
cgggtgcccg ggacgtgggg cgtggggcgt gggtggggtg gccagagcct tgggaactcg 540
tcgcctgtcg ggacgtctcc cctcctggtc ccctctctga cctacgctcc acatcttcgc 600
cgttcagtgg ggaccttgtg ggtggaagtc accatccctt tggactttag ccgacgaagg 660
ccgggctccc aagagtctcc ccggaggcgg ggccttgggc aggctcacaa ggatgctgac 720
ggtgacggtt ggtgacggtg atgtacttcg gaggcctcgg gccaatgcag aggtatccat 780
ttgacctcgg tgggacaggt cagctttgcg gagtcccgtg cgtccttcca gagactcatc 840
cagcgctagc aagcatggtc ccgagg 866
<210>60
<211>2067
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR60
<220>
<221>misc_feature
<222>(92)..(1777)
<223>n is a,c,g,or t on various positions
<400>60
agcagtgcag aactggggaa gaagaagagt ccctacacca cttaatactc aaaagtactc 60
gcaaaaaata acacccctca ccaggtggca tnattactct ccttcattga gaaaattagg 120
aaactggact tcgtagaagc taattgcttt atccagagcc acctgcatac aaacctgcag 180
cgccacctgc atacaaacct gtcagccgac cccaaagccc tcagtcgcac caagcctctg 240
ctgcacaccc tcgtgccttc acactggccg ttccccaagc ctggggcata ctncccagct 300
ctgagaaatg tattcatcct tcaaagccct gctcatgtgt cctnntcaac aggaaaatct 360
cccatgagat gctctgctat ccccatctct cctgccccat agcttaggca nacttctgtg 420
gtggtgagtc ctgggctgtg ctgtgatgtg ttcgcctgcn atgtntgttc ttccccacaa 480
tgatgggccc ctgaattctc tatctctagc acctgtgctc agtaaaggct tgggaaacca 540
ggctcaaagc ctggcccaga tgccaccttt tccagggtgc ttccgggggc caccaaccag 600
agtgcagcct tctcctccac caggaactct tgcagcccca cccctgagca cctgcacccc 660
attacccatc tttgtttctc cgtgtgatcg tattattaca gaattatata ctgtattctt 720
aatacagtat ataattgtat aattattctt aatacagtat ataattatac aaatacaaaa 780
tatgtgttaa tggaccgttt atgttactgg taaagcttta agtcaacagt gggacattag 840
ttaggttttt ggcgaagtca aaagttatat gtgcattttc aacttcttga ggggtcggta 900
cntctnaccc ccatgttgtt caanggtcaa ctgtctacac atatcatagc taattcacta 960
cagaaatgtt agcttgtgtc actagtatct ccccttctca taagcttaat acacatacct 1020
tgagagagct cttggccatc tctactaatg actgaagttt ttatttatta tagatgtcat 1080
aataggcata aaactacatt acatcattcg agtgccaatt ttgccacctt gaccctcttt 1140
tgcaaaacac caacgtcagt acacatatga agaggaaact gcccgagaac tgaagttcct 1200
gagaccagga gctgcaggcg ttagatagaa tatggtgacg agagttacga ggatgacgag 1260
agtaaatact tcatactcag tacgtgccaa gcactgctat aagcgctctg tatgtgtgaa 1320
gtcatttaat cctcacagca tcccacggtg taattatttt cattatcccc atgagggaac 1380
agaaactcag aacggttcaa cacatatgcg agaagtcgca gccggtcagt gagagagcag 1440
gttcccgtcc aagcagtcag accccgagtg cacactctcg acccctgtcc agcagactca 1500
ctcgtcataa ggcggggagt gntctgtttc agccagatgc tttatgcatc tcagagtacc 1560
caaaccatga aagaatgagg cagtattcan gagcagatgg ngctgggcag taaggctggg 1620
cttcagaata gctggaaagc tcaagtnatg ggacctgcaa gaaaaatcca ttgtttngat 1680
aaatagccaa agtccctagg ctgtaagggg aaggtgtgcc aggtgcaagt ggagctctaa 1740
tgtaaaatcg cacctgagtc tcctggtctt atgagtnctg ggtgtacccc agtgaaaggt 1800
cctgctgcca ccaagtgggc catggttcag ctgtgtaagt gctgagcggc agccggaccg 1860
cttcctctaa cttcacctcc aaaggcacag tgcacctggt tcctccagca ctcagctgcg 1920
aggcccctag ccagggtccc ggcccccggc ccccggcagc tgctccagct tccttcccca 1980
cagcattcag gatggtctgc gttcatgtag acctttgttt tcagtctgtg ctccgaggtc 2040
actggcagca ctagccccgg ctcctgt 2067
<210>61
<211>1470
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR61
<220>
<221>misc_feature
<222>(130)..(976)
<223>n is a,c,g,or t on various positions
<400>61
cagcccccac atgcccagcc ctgtgctcag ctctgcagcg gggcatggtg ggcagagaca 60
cagaggccaa ggccctgctt cggggacggt gggcctggga tgagcatggc cttggccttc 120
gccgagagtn ctcttgtgaa ggaggggtca ggaggggctg ctgcagctgg ggaggagggc 180
gatggcactg tggcangaag tgaantagtg tgggtgcctn gcaccccagg cacggccagc 240
ctggggtatg gacccggggc cntctgttct agagcaggaa ggtatggtga ggacctcaaa 300
aggacagcca ctggagagct ccaggcagag gnacttgaga ggccctgggg ccatcctgtc 360
tcttttctgg gtctgtgtgc tctgggcctg ggcccttcct ctgctccccc gggcttggag 420
agggctggcc ttgcctcgtg caaaggacca ctctagactg gtaccaagtc tggcccatgg 480
cctcctgtgg gtgcaggcct gtgcgggtga cctgagagcc agggctggca ggtcagagtc 540
aggagaggga tggcagtgga tgccctgtgc aggatctgcc taatcatggt gaggctggag 600
gaatccaaag tgggcatgca ctctgcactc atttctttat tcatgtgtgc ccatcccaac 660
aagcagggag cctggccagg agggcccctg ggagaaggca ctgatgggct gtgttccatt 720
taggaaggat ggacggttgt gagacgggta agtcagaacg ggctgcccac ctcggccgag 780
agggccccgt ggtgggttgg caccatctgg gcctggagag ctgctcagga ggctctctag 840
ggctgggtga ccaggnctgg ggtacagtag ccatgggagc aggtgcttac ctggggctgt 900
ccctgagcag gggctgcatt gggtgctctg tgagcacaca cttctctatt cacctgagtc 960
ccnctgagtg atgagnacac ccttgttttg cagatgaatc tgagcatgga gatgttaagt 1020
ggcttgcctg agccacacag cagatggatg gtgtagctgg gacctgaggg caggcagtcc 1080
cagcccgagg acttcccaag gttgtggcaa actctgacag catgacccca gggaacaccc 1140
atctcagctc tggtcagaca ctgcggagtt gtgttgtaac ccacacagct ggagacagcc 1200
accctagccc cacccttatc ctctcccaaa ggaacctgcc ctttcccttc attttcctct 1260
tactgcattg agggaccaca cagtgtggca gaaggaacat gggttcagga cccagatgga 1320
cttgcttcac agtgcagccc tcctgtcctc ttgcagagtg cgtcttccac tgtgaagttg 1380
ggacagtcac accaactcaa tactgctggg cccgtcacac ggtgggcagg caacggatgg 1440
cagtcactgg ctgtgggtct gcagaggtgg 1470
<210>62
<211>1011
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR62
<400>62
agtgtcaaat agatctacac aaaacaagat aatgtctgcc catttttcca aagataatgt 60
ggtgaagtgg gtagagagaa atgcatccat tctccccacc caacctctgc taaattgtcc 120
atgtcacagt actgagacca gggggcttat tcccagcggg cagaatgtgc accaagcacc 180
tcttgtctca atttgcagtc taggccctgc tatttgatgg tgtgaaggct tgcacctggc 240
atggaaggtc cgttttgtac ttcttgcttt agcagttcaa agagcaggga gagctgcgag 300
ggcctctgca gcttcagatg gatgtggtca gcttgttgga ggcgccttct gtggtccatt 360
atctccagcc cccctgcggt gttgctgttt gcttggcttg tctggctctc catgccttgt 420
tggctccaaa atgtcatcat gctgcacccc aggaagaatg tgcaggccca tctcttttat 480
gtgctttggg ctattttgat tccccgttgg gtatattccc taggtaagac ccagaagaca 540
caggaggtag ttgctttggg agagtttgga cctatgggta tgaggtaata gacacagtat 600
cttctctttc atttggtgag actgttagct ctggccgcgg actgaattcc acacagctca 660
cttgggaaaa ctttattcca aaacatagtc acattgaaca ttgtggagaa tgagggacag 720
agaagaggcc ctagatttgt acatctgggt gttatgtcta taaatagaat gctttggtgg 780
tcaactagac ttgttcatgt tgacatttag tcttgccttt tcggtggtga tttaaaaatt 840
atgtatatct tgtttggaat atagtggagc tatggtgtgg cattttcatc tggctttttg 900
tttagctcag cccgtcctgt tatgggcagc cttgaagctc agtagctaat gaagaggtat 960
cctcactccc tccagagagc ggtcccctca cggctcattg agagtttgtc a 1011
<210>63
<211>1410
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR63
<400>63
ccacagcctg atcgtgctgt cgatgagagg aatctgctct aagggtctga gcggagggag 60
atgccgaagc tttgagcttt ttgtttctgg cttaaccttg gtggattttc accctctggg 120
cattacctct tgtccagggg aggggctggg ggagtgcctg gagctgtagg gacagagggc 180
tgagtggggg ggactgcttg ggctgaccac ataatattct gctgcgtatt aatttttttt 240
tgagacagtc tttctctgtt gcccaggctg gagtgtaatg gcttgatagc tcactgccac 300
ctccgcctcc tgggttcaag tgattctcct gcttcagctt ccggagtagc tgggactgca 360
ggtgcccgcc accatggctg gctaattttt gtatttttat tagcaatggg gttttgctat 420
gttgcccagg ccggtcccga actcctgccc tcaagtgata cacctgcctc ggcctcccaa 480
agtgctggga ttagaggctt gagccactgc gcctggccag ctgcatattg ttaattagac 540
ataaaatgca aaataagatg atataaacac aaaggtgtga aataagatgg acacctgctg 600
agcgcgcctg tcctgaagca tcgcccctct gcaaaagcag gggtcagcat gtgttctccg 660
gtccttgctc ttacagagga gtgagctgcc tatgcgtctt ccagccactt cctgggctgc 720
tcagaggcct ctcacgggtg ttctgggttg ctgccacttg caggggtgct gaggcggggc 780
tcctcccgtg cggggcatgt ccaggccgcc ctctctgaag gcttggcagg tacaggtggg 840
agtgggggtc tctgggctgc tgtggggact gggcaggctc ctggaagacc tccctgtgtt 900
tgggctgaaa gcgcagcccg aggggaggtc cccagggagg ccgctgtcgg gggtgggggc 960
ttggaggagg gaggggccga ggagccggcg acactccgtg acggcccagg aacgtcccta 1020
aacaaggcgc cgcgttctcg atggggtggg gtccgctttc ttttctcaaa agctgcagtt 1080
actccatgct cggaggactg gcgtccgcgc cctgttccaa tgctgccccg gggccctggc 1140
cttggggaat cggggccttg gactggaccc tgggggcttc gcggagccgg gcctggcggg 1200
gcgagcggag cagaggctgg gcagccccgg ggaagcgctc gccaaagccg ggcgctgctc 1260
ccagagcgcg aggtgcagaa ccagaggctg gtcccgcggc gctaacgaga gaagaggaag 1320
cgcgctgtgt agagggcgcc caccccgtgg ggcgaacccc cttcctcaac tccatggacg 1380
gggctcatgg gttcccagcg gctcagacgc 1410
<210>64
<211>1414
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR64
<400>64
tggatcagat ttgttttata ccctcccttc tactgctctg agagttgtac atcacagtct 60
actgtatctg tttcccatta ttataatttt tttgcactgt gcttgcctga agggagcctc 120
aagttcatga gtctccctac cctcctccca aatgagacat ggacctttga atgctttcct 180
gggaccacca ccccaccttt catgctgctg ttatccagga ttttagttca acagtgtttt 240
aaccccccaa atgagtcatt tttattgttt cgtatagtga atgtgtattt gggtttgctt 300
atatggtgac ctgtttattt gctcctcatt gtacctcatg ctctgctctt tccttctaga 360
ttcagtctct ttcctaatga ggtgtctcgc agcaattctt tacaagacag ccaagatagg 420
ccagctctca gagcacttgt tgtctgaaaa agtcttgtct tatttaattt ctttttctta 480
gagatggggt ctcattatgt tacccacact ggtctcaaac ttctggctta aagcggtcct 540
cccaccttgg cctcccaaag tgctaggatt acaggcgtga gcgacctcgt ccagcctgtc 600
tgagaaagcg tttgttttgc ccttgctctc agatgacagt ttggggatag aattctaggt 660
ggacggtttt tttccttcag ccctttgaag agtctgtatt ttcattatct ccctgcatta 720
gatgttcttt tgcaagtaac gtgtcttttc tctctgggta ttcttaaggt tttctctttg 780
cctttggtga gctgcagtgg atttgctttt ttcaagaggt caagagaaag gaaagtgtga 840
ggtttctgtt ttttactgac aatttgtttg ttgatttgtt ttcccaccca gaggttcctt 900
gccactttgc caggctggaa ggcagacttc ttctggtgtc ctgttcacag acggggcagc 960
ctgcggaagg ccctgccaca tgcagggcct cggtcctcat tcccttgcat gtggacccgg 1020
gcgtgactcc tgttcaggct ggcacttccc agagctgagc cccagcctga ccttcctccc 1080
atactgtctt cacaccccct cctttcttct gatacctgga ggttttcctt tctttcctgt 1140
cacctccact tggattttaa atcctctgtc tgtggaattg tattcggcac aggaagatgc 1200
ttgcaagggc caggctcatc agccctgtcc ctgctgctgg aagcagcaca gcagagcctc 1260
atgctcaggc tgagatggag cagaggcctg cagacgagca cccagctcag ctggggttgg 1320
cgccgatggt ggagggtcct cgaaagctct ggggacgatg gcagagctat tggcagggga 1380
gccgcagggt cttttgagcc cttaaaagat ctct 1414
<210>65
<211>1310
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR65
<400>65
gtgaatgttg atggatcaaa tatctttctg tgttgtttat caaagttaaa ataaatgtgg 60
tcatttaaag gacaaaagat gaggggttgg agtctgttca agcaaagggt atattaggag 120
aaaagcagaa ttctctccct gtgaagggac agtgactcct attttccacc tcatttttac 180
taactctcct aactatctgc ttaggtagag atatatccat gtacatttat aaaccacagt 240
gaatcatttg attttggaat aaagatagta taaaatgtgt cccagtgttg atatacatca 300
tacattaaat atgtctggca gtgttctaat tttacagttg tccaaagata atgttagggc 360
atactggcta tggatgaagc tccaatgttc agattgcaaa gaaacttaga attttactaa 420
tgaaaccaaa tacatcccaa gaaatttttc agaagaaaaa aagagaaact agtagcaaag 480
taaagaatca ccacaatatc atcagatttt ttttatatgt agaatattta ttcagttctt 540
ttttcaagta caccttgtct tcattcattg tactttattt tttgtgaagg tttaaattta 600
tttcttctat gtgtttagtg atatttaaaa tttttattta atcaagttta tcagaaagtt 660
ctgttagaaa atatgacgag gctttaattc cgccatctat attttccgct attatataaa 720
gataattgtt ttctcttttt aaaacaactt gaattgggat tttatatcat aattttttaa 780
tgtctttttt tattatactt taagttctgg gatacatgtg cagaacgtgc aggtgtgtta 840
catagatata cacgtgccat ggtggtttgc tgcacccact aacctgttat cgacattagg 900
tatttctcct aatgctatca ccccctattt ccccaccccc cgagaggccc cagtgtgtga 960
tgttctcctc cctgtgtcca tgtgttctca ttgttcatct cccacttatg gtatctacca 1020
taaccttgaa attgtcttat gcattcactt gtttggttgt tatatagcct ccatcaggac 1080
agggatattt gctgctgctt cttttttttt tctttttgag acagtcttgc tccgtcatcc 1140
aggctggagt gcttctcggc tcaatgcaac ctccacctcc caggtttaag cgattctcca 1200
acttcagcct cccaaatggc tgggactgca ggcatgcacc actacacctg gctaattttt 1260
gtatttgtaa tagagacaat gtttcaccat gttggccagg ctggtctcga 1310
<210>66
<211>1917
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<223>sequence of STAR67
<400>66
aggatcctaa aattttgtga ccctagagca agtactaact atgaaagtga aatagagaat 60
gaaggaatta tttaattaag tccagcaaaa cccaaccaaa tcatctgtaa aatatatttg 120
ttttcaacat ccaggtattt tctgtgtaaa aggttgagtt gtatgctgac ttattgggaa 180
aaataattga gttttcccct tcactttgcc agtgagagga aatcagtact gtaattgtta 240
aaggttaccc atacctacct ctactaccgt ctagcatagg taaagtaatg tacactgtga 300
agtttcctgc ttgactgtaa tgttttcagt ttcatcccat tgattcaaca gctatttatt 360
cagcacttac tacaaccatg ctggaaaccc aagagtaaat aggctgtgtt actcaacagg 420
actgaggtac agccgaactg tcaggcaagg ttgctgtcct ttggacttgc ctgctttctc 480
tctatgtagg aagaagaaat ggacataccg tccaggaaat agatatatgt tacatttcct 540
tattccataa ttaatattaa taaccctgga cagaaactac caagtttcta gacccttata 600
gtaccacctt accctttctg gatgaatcct tcacatgttg atacatttta tccaaatgaa 660
aattttggta ctgtaggtat aacagacaaa gagagaacag aaaactagag atgaagtttg 720
ggaaaaggtc aagaaagtaa ataatgcttc tagaagacac aaaaagaaaa atgaaatggt 780
aatgttggga aagttttaat acattttgcc ctaaggaaaa aaactacttg ttgaaattct 840
acttaagact ggaccttttc tctaaaaatt gtgcttgatg tgaattaaag caacacaggg 900
aaatttatgg gctccttcta agttctaccc aactcaccgc aaaactgttc ctagtaggtg 960
tggtatactc tttcagattc tttgtgtgta tgtatatgtg tgtgtgtgtg tgtgtttgta 1020
tgtgtacagt ctatatacat atgtgtacct acatgtgtgt atatataaat atatatttac 1080
ctggatgaaa tagcatatta tagaatattc ttttttcttt aaatatatat gtgcatacat 1140
atgtatatgc acatatatac ataaatgtag atatagctag gtaggcattc atgtgaaaca 1200
aagaagccta ttacttttta atggttgcat gatattccat cataggagta tagtacaact 1260
tatgtaacac acatttggct tgttgtaaaa ttttggtatt aataaaatag cacatatcat 1320
gcaaagacac ccttgcatag gtctattcat tctttgattt ttaccttagg acaaaattta 1380
aaagtagaat ttctgggtca agcagtatgc tcatttaaaa tgtcattgca tatttccaaa 1440
ttgtcctcca gaaaagtagt aacagtaaca attgatggac tgcgtgtttt ctaaaacttg 1500
catttttttc cttattggtg aggtttggca ttttccatat gtttattggc attttaattt 1560
tttttggttc atgtctttta ttcccttcct gcaaatttgt ggtgtgtctc aactttattt 1620
atactctcat tttcataatt ttctaaagga atttgacttt aaaaaaataa gacagccaat 1680
gctttggttt aatttcattg ctgctttttg aagtgactgc tgtgttttta tatactttta 1740
tattttgttg ttttagcaaa ttcttctata ttataattgt gtatgctgga acaaaaagtt 1800
atatttctta atctagataa aatatttcaa gatgttgtaa ttacagtccc ctctaaaatc 1860
atataaatag acgcatagct gtgtgatttg taattagtta tgtccattga tagatcc 1917
<210>67
<211>26
<212>DNA
<213>Artificial
<220>
<223>oligo for making linker containing MCSII of pd2EGFP-link
<400>67
gtacggatat cagatcttta attaag 26
<210>68
<211>24
<212>DNA
<213>Artificial
<220>
<223>oligo for making linker containing MCSII of pd2EGFP-link
<400>68
gtaccttaat taaagatctg atat 24
<210>69
<211>52
<212>DNA
<213>Artificial
<220>
<223>primer for amplification of 0.37kb from pd2EGFP
<400>69
gatcagatct ggcgcgccat ttaaatcgtc tcgcgcgttt cggtgatgac gg 52
<210>70
<211>41
<212>DNA
<213>Artificial
<220>
<223>primer for amplification of 0.37 kb from pd2EGFP
<400>70
aggcggatcc gaatgtattt agaaaaataa acaaataggg g 41
<210>71
<211>36
<212>DNA
<213>Artificial
<220>
<223>primer for amplifying zeocin resistance gene ORF
<400>71
gatcggatcc ttcgaaatgg ccaagttgac cagtgc 36
<210>72
<211>32
<212>DNA
<213>Artificial
<220>
<223>primer for amplifying zeocin resistance gene ORF
<400>72
aggcgcggcc gcaattctca gtcctgctcc tc 32
<210>73
<211>40
<212>DNA
<213>Artificial
<220>
<223>primer for amplifying d2EGFP ORF
<400>73
gatcgaattc tcgcgaatgg tgagcaagca gatcctgaag 40
<210>74
<211>52
<212>DNA
<213>Artificial
<220>
<223>primer for amplifying d2EGFP ORF
<400>74
aggcgaattc accggtgttt aaacttacac ccactcgtgc aggctgccca gg 52
<210>75
<211>41
<212>DNA
<213>Artificial
<220>
<223>primer for amplifying d2EGFP gene
<400>75
ttggttggtc atgaatggtg agcaagggcg aggagctgtt c 41
<210>76
<211>36
<212>DNA
<213>Artificial
<220>
<223>primer for amplifying d2EGFP gene
<400>76
attctctaga ctacacattg atcctagcag aagcac 36
<210>77
<211>42
<212>DNA
<213>Artificial
<220>
<223>oligo for preparing linker for creating MCS in pGL3-promoter-GFP
<400>77
cgatatcttg gagatctact agtggcgcgc cttgggctag ct 42
<210>78
<211>50
<212>DNA
<213>Artificial
<220>
<223>oligo for preparing linker for creating MCS in pGL3-promoter-GFP
<400>78
gatcagctag cccaaggcgc gccactagta gatctccaag atatcgagct 50
<210>79
<211>40
<212>DNA
<213>Artificial
<220>
<223>primer for amplification of EF-lalfa promoter
<400>79
gatcggcgcg ccatttaaat ccgaaaagtg ccacctgacg 40
<210>80
<211>34
<212>DNA
<213>Artificial
<220>
<223>primer for amplification of EF-lalfa promoter
<400>80
aggcgggacc ccctcacgac acctgaaatg gaag 34
<210>81
<211>51
<212>DNA
<213>Artificial
<220>
<223>primer for amplification of SV40 promoter
<400>81
ttggttgggg cgcgccgcag caccatggcc tgaaataacc tctgaaagag g 51
<210>82
<211>55
<212>DNA
<213>Artificial
<220>
<223>primer for amplification of SV40 promoter
<400>82
ttggttggga gctcaagctt tttgcaaaag cctaggcctc caaaaaagcc tcctc 55
Claims (16)
1.一种重组核酸分子,其包含如SEQ.ID.NO.66所示的具有抗阻抑物活性的核酸序列,所述重组核酸分子进一步包含表达盒,所述表达盒包含与感兴趣核酸连接的异源启动子,其中所述感兴趣核酸编码全部或者部分感兴趣蛋白质,并且其中具有抗阻抑物活性的所述核酸序列位于所述表达盒中所述启动子的上游,其中所述具有抗阻抑物活性的序列和所述启动子相隔少于2kb。
2.权利要求1的分子,其中所述编码感兴趣蛋白质的核酸存在于多顺反子基因中,所述多顺反子基因进一步编码一个可选择标记基因。
3.权利要求1的分子,进一步包含选自SEQ.ID.NO.1-65任一序列的至少一个其它的具有抗阻抑物活性的序列。
4.一种包含表达盒的重组核酸分子,所述表达盒包含:
5’-抗阻抑物序列A-启动子-编码全部或部分感兴趣蛋白质的核酸-抗阻抑物序列B-3’,其中抗阻抑物序列A和B可以相同或者不同并且选自SEQ.ID.NO.1-65任一序列组成的组,特征在于所述表达盒在所述抗阻抑物序列A和B之间进一步包含如SEQ.ID.NO.66所示的具有抗阻抑物活性的序列。
5.一种包含权利要求1-4任一项的分子的细胞。
6.权利要求5的细胞,其是哺乳动物细胞。
7.权利要求6的细胞,其是CHO细胞。
8.一种生产感兴趣蛋白质的方法,包括培养包含编码感兴趣蛋白质的重组核酸分子的细胞以及在所述细胞中表达编码感兴趣蛋白质的所述核酸,特征在于所述重组核酸分子包含如SEQ.ID.NO.66所示的具有抗阻抑物活性的核酸序列,其中所述具有抗阻抑物活性的核酸序列位于控制感兴趣蛋白质表达的启动子的上游并且其中所述具有抗阻抑物活性的所述序列和所述启动子间隔少于2kb。
9.权利要求8的方法,其进一步包括分离所述感兴趣蛋白质。
10.权利要求8的方法,其中编码感兴趣蛋白质的所述核酸存在于多顺反子基因中,所述多顺反子基因进一步编码一个可选择标记基因。
11.权利要求8-10任一项的方法,其中所述细胞是哺乳动物细胞。
12.权利要求11的方法,其中所述细胞是CHO细胞。
13.如SEQ.ID.NO.66所示的具有抗阻抑物活性的核酸序列在增加感兴趣核酸表达中的应用。
14.一种产生表达两种感兴趣多肽的宿主细胞的方法,所述方法包括:
a)向宿主细胞中导入一或多种核酸分子,所述一种核酸分子包含或多种核酸分子一起包含:
(i)与编码第一种感兴趣多肽和第一种可选择标记基因的序列功能连接的启动子,及
(ii)与编码第二种感兴趣多肽和第二种可选择标记基因的序列功能连接的启动子,及
(iii)如SEQ.ID.NO.66所示的具有抗阻抑物活性的序列;
b)通过同时选择所述第一种和第二种可选择标记基因的表达而选择宿主细胞,
其中所述具有抗阻抑物活性的序列位于控制每一个感兴趣蛋白质表达的每一个启动子的上游并且其中所述具有抗阻抑物活性的序列和所述每一个启动子间隔少于2kb。
15.一种表达两种感兴趣多肽的方法,所述方法包括:培养通过权利要求14的方法获得的宿主细胞以表达所述第一种和第二种多肽,任选分离所述多肽。
16.权利要求14或15的方法,其中所述两种多肽是多聚体蛋白质的部分。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US58700704P | 2004-07-08 | 2004-07-08 | |
EPPCT/EP2004/051405 | 2004-07-08 | ||
US60/587,007 | 2004-07-08 | ||
EP2004051405 | 2004-07-08 | ||
PCT/EP2005/053251 WO2006005718A2 (en) | 2004-07-08 | 2005-07-07 | Novel sequence for improving expression of nucleic acid |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1981057A CN1981057A (zh) | 2007-06-13 |
CN1981057B true CN1981057B (zh) | 2012-07-04 |
Family
ID=34971366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800229700A Expired - Fee Related CN1981057B (zh) | 2004-07-08 | 2005-07-07 | 改良核酸表达的新序列 |
Country Status (20)
Country | Link |
---|---|
US (1) | US7825232B2 (zh) |
JP (1) | JP4805262B2 (zh) |
KR (1) | KR101188013B1 (zh) |
CN (1) | CN1981057B (zh) |
AT (1) | ATE378426T1 (zh) |
AU (1) | AU2005261699B2 (zh) |
BR (1) | BRPI0512798A (zh) |
CA (1) | CA2573022C (zh) |
DE (1) | DE602005003369T2 (zh) |
DK (1) | DK1763586T3 (zh) |
EA (1) | EA011747B1 (zh) |
ES (1) | ES2296201T3 (zh) |
HK (1) | HK1097004A1 (zh) |
IL (1) | IL180531A (zh) |
MX (1) | MXPA06014553A (zh) |
NO (1) | NO341862B1 (zh) |
NZ (1) | NZ551510A (zh) |
PT (1) | PT1763586E (zh) |
WO (1) | WO2006005718A2 (zh) |
ZA (1) | ZA200610470B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1572994B1 (en) * | 2002-12-20 | 2007-02-21 | Chromagenics B.V. | Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors |
US8999667B2 (en) | 2004-11-08 | 2015-04-07 | Chromagenics B.V. | Selection of host cells expressing protein at high levels |
US20060195935A1 (en) | 2004-11-08 | 2006-08-31 | Chromagenics B.V. | Selection of host cells expressing protein at high levels |
US20100136616A1 (en) * | 2004-11-08 | 2010-06-03 | Chromagenics B.V. | Selection of Host Cells Expressing Protein at High Levels |
US8039230B2 (en) | 2004-11-08 | 2011-10-18 | Chromagenics B.V. | Selection of host cells expressing protein at high levels |
SI1809750T1 (sl) * | 2004-11-08 | 2012-08-31 | Chromagenics Bv | Izbira gostiteljskih celic, ki imajo visok nivo izraĹľanja proteina |
JP5291341B2 (ja) * | 2004-11-08 | 2013-09-18 | クロマジェニックス ベー ヴェー | タンパク質を高レベルで発現する宿主細胞の選定 |
WO2010147464A1 (en) | 2009-06-15 | 2010-12-23 | Cellagenics B.V. | Use of a cysteine synthesizing enzyme as selectable marker |
CN103038352B (zh) | 2010-06-15 | 2015-12-16 | 萨拉基尼克有限公司 | 用于增强基因表达的新型基因间元件 |
DK2611915T3 (da) | 2010-09-01 | 2015-06-22 | Cellagenics B V | Nukleinsyrefragmenter fra en ribosomal proteinpromoter til forstærkning af genekspression |
CN110484563B (zh) * | 2019-07-25 | 2023-04-07 | 新乡医学院 | 哺乳动物细胞组合表达载体、表达系统、制备方法和应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003004704A2 (en) * | 2001-07-04 | 2003-01-16 | Chromagenics B.V. | Method of selecting dna sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity |
WO2003106684A2 (en) * | 2002-06-14 | 2003-12-24 | Chromagenics B.V. | A method for simultaneous production of multiple proteins; vectors and cells for use therein |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1572994B1 (en) | 2002-12-20 | 2007-02-21 | Chromagenics B.V. | Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors |
-
2005
- 2005-07-07 MX MXPA06014553A patent/MXPA06014553A/es active IP Right Grant
- 2005-07-07 DK DK05756870T patent/DK1763586T3/da active
- 2005-07-07 KR KR1020067027165A patent/KR101188013B1/ko active IP Right Grant
- 2005-07-07 EA EA200700233A patent/EA011747B1/ru not_active IP Right Cessation
- 2005-07-07 CA CA2573022A patent/CA2573022C/en not_active Expired - Fee Related
- 2005-07-07 AT AT05756870T patent/ATE378426T1/de active
- 2005-07-07 BR BRPI0512798-0A patent/BRPI0512798A/pt not_active Application Discontinuation
- 2005-07-07 AU AU2005261699A patent/AU2005261699B2/en not_active Ceased
- 2005-07-07 US US11/632,012 patent/US7825232B2/en not_active Expired - Fee Related
- 2005-07-07 WO PCT/EP2005/053251 patent/WO2006005718A2/en active IP Right Grant
- 2005-07-07 ES ES05756870T patent/ES2296201T3/es active Active
- 2005-07-07 NZ NZ551510A patent/NZ551510A/en not_active IP Right Cessation
- 2005-07-07 JP JP2007519805A patent/JP4805262B2/ja not_active Expired - Fee Related
- 2005-07-07 PT PT05756870T patent/PT1763586E/pt unknown
- 2005-07-07 CN CN2005800229700A patent/CN1981057B/zh not_active Expired - Fee Related
- 2005-07-07 DE DE602005003369T patent/DE602005003369T2/de active Active
-
2006
- 2006-12-13 ZA ZA200610470A patent/ZA200610470B/xx unknown
-
2007
- 2007-01-03 IL IL180531A patent/IL180531A/en active IP Right Grant
- 2007-02-08 NO NO20070757A patent/NO341862B1/no not_active IP Right Cessation
- 2007-04-30 HK HK07104598A patent/HK1097004A1/xx not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003004704A2 (en) * | 2001-07-04 | 2003-01-16 | Chromagenics B.V. | Method of selecting dna sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity |
WO2003106684A2 (en) * | 2002-06-14 | 2003-12-24 | Chromagenics B.V. | A method for simultaneous production of multiple proteins; vectors and cells for use therein |
Non-Patent Citations (8)
Title |
---|
Ing Swie Goping and Gordon C. Shore.Interactions between Repressor and Anti-repressor Elementsin the Carbamyl Phosphate SynthetaseI Promoter..THE JOURNALO F BIOIJXICACLH EMISTRY269 5.1994,269(5),3891-3896. |
Ing Swie Goping and Gordon C. Shore.Interactions between Repressor and Anti-repressor Elementsin the Carbamyl Phosphate SynthetaseI Promoter..THE JOURNALO F BIOIJXICACLH EMISTRY269 5.1994,269(5),3891-3896. * |
Johan van der Vlag et al..Transcriptional Repression Mediated by PolycombGroup Proteins and Other Chromatin-associated Repressors IsSelectively Blocked by Insulators..THE JOURNAL OF BIOLOGICAL CHEMISTRY275 1.2000,275(1),697-704. |
Johan van der Vlag et al..Transcriptional Repression Mediated by PolycombGroup Proteins and Other Chromatin-associated Repressors IsSelectively Blocked by Insulators..THE JOURNAL OF BIOLOGICAL CHEMISTRY275 1.2000,275(1),697-704. * |
Kwaks TH et al..Identification of anti-repressor elements that confer high andstable protein production in mammalian cells..Nat Biotechnol.21 5.2003,21(5),553-558. |
Kwaks TH et al..Identification of anti-repressor elements that confer high andstable protein production in mammalian cells..Nat Biotechnol.21 5.2003,21(5),553-558. * |
Robert E. Kingston et al..Repression and activation by multiprotein complexes thatalter chromatin structure..Genes Dev.10 8.1996,10(8),905-920. |
Robert E. Kingston et al..Repression and activation by multiprotein complexes thatalter chromatin structure..Genes Dev.10 8.1996,10(8),905-920. * |
Also Published As
Publication number | Publication date |
---|---|
IL180531A (en) | 2011-04-28 |
NO20070757L (no) | 2007-02-08 |
ES2296201T3 (es) | 2008-04-16 |
EA011747B1 (ru) | 2009-06-30 |
AU2005261699A1 (en) | 2006-01-19 |
EA200700233A1 (ru) | 2007-06-29 |
US7825232B2 (en) | 2010-11-02 |
PT1763586E (pt) | 2008-02-25 |
KR101188013B1 (ko) | 2012-10-08 |
CA2573022A1 (en) | 2006-01-19 |
JP2008505626A (ja) | 2008-02-28 |
IL180531A0 (en) | 2007-06-03 |
KR20070042122A (ko) | 2007-04-20 |
ATE378426T1 (de) | 2007-11-15 |
DE602005003369T2 (de) | 2009-03-05 |
DK1763586T3 (da) | 2008-03-17 |
MXPA06014553A (es) | 2007-03-12 |
WO2006005718A3 (en) | 2006-08-17 |
NZ551510A (en) | 2009-10-30 |
NO341862B1 (no) | 2018-02-12 |
CN1981057A (zh) | 2007-06-13 |
DE602005003369D1 (de) | 2007-12-27 |
WO2006005718A2 (en) | 2006-01-19 |
HK1097004A1 (en) | 2007-06-15 |
ZA200610470B (en) | 2008-09-25 |
AU2005261699B2 (en) | 2009-07-23 |
CA2573022C (en) | 2012-03-06 |
JP4805262B2 (ja) | 2011-11-02 |
BRPI0512798A (pt) | 2008-04-08 |
US20070212755A1 (en) | 2007-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2581422C (en) | Selection of host cells expressing protein at high levels | |
CN101389763B (zh) | 高水平表达蛋白质的宿主细胞的选择 | |
CN1981057B (zh) | 改良核酸表达的新序列 | |
NZ553700A (en) | Selection of host cells expressing protein at high levels using a selectable marker with a non-optimal start codon | |
KR100942117B1 (ko) | 유전자 전사 조절 성질을 포함하는 디엔에이 서열 및 이러한 디엔에이 서열을 탐지하고 이용하는 방법 | |
Uchida et al. | AML1A and AML1B can transactivate the human IL-3 promoter. | |
DK2443239T3 (en) | New stringent selection markers | |
Sun et al. | Expression of dentin sialoprotein (DSP) and other molecular determinants by a new cell line from dental papillae, MDPC-23 | |
Steinert et al. | Analysis of the mouse selenoprotein P gene | |
Medina et al. | Tissue-specific N-terminal isoforms from overlapping alternate promoters of the human AE2 anion exchanger gene | |
KR100951759B1 (ko) | 유전자 전사 조절 성질을 포함하는 디엔에이 서열 및이러한 디엔에이 서열을 탐지하고 이용하는 방법 | |
CA2251262C (en) | Nucleic acid encoding a nervous tissue sodium channel | |
US6727222B2 (en) | Transcriptional regulator | |
US6635751B1 (en) | Isolated nucleic acids encoding activated and suppressive forms of ATF6 | |
US6346606B1 (en) | Protein containing a scavenger receptor cysteine rich domain | |
AU7823401A (en) | DNA-binding protein YB-1-containing collagen accumulation inhibitors | |
US6355775B1 (en) | Transcriptional inhibitor | |
US20230348916A1 (en) | Expression and purification of recombinant human isoferritins using a novel expression system | |
KR20090116979A (ko) | 애기장대 유래의 생체방어 기작 및 개화 조절에 관여하는단백질을 이용한 식물의 개화시기 조절 방법 | |
EP1763586B1 (en) | Novel sequence for improving expression of nucleic acid | |
JP2001054391A (ja) | 小胞体ストレス転写因子 | |
김연숙 | The APM-1 interacts SREBP-1 with to increase transcription activity of SREBP-1 responsive genes | |
US20040259204A1 (en) | Isolated human secreted proteins, nucleic acid molecules encoding human secreted proteins, and uses thereof | |
JP2003144179A (ja) | 核受容体の補−調節物質 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120704 |
|
CF01 | Termination of patent right due to non-payment of annual fee |