CN113383081A - 基质附着区和促进基因表达的用途 - Google Patents

基质附着区和促进基因表达的用途 Download PDF

Info

Publication number
CN113383081A
CN113383081A CN201980091439.0A CN201980091439A CN113383081A CN 113383081 A CN113383081 A CN 113383081A CN 201980091439 A CN201980091439 A CN 201980091439A CN 113383081 A CN113383081 A CN 113383081A
Authority
CN
China
Prior art keywords
mar
seq
nos
core
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980091439.0A
Other languages
English (en)
Inventor
尼基尔·高尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celltheon Corp
Original Assignee
Celltheon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celltheon Corp filed Critical Celltheon Corp
Publication of CN113383081A publication Critical patent/CN113383081A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/46Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及新鉴定的基质附着区(MAR)和嵌合序列。本发明还公开了核苷酸构建体,所述核苷酸构建体在相对于蛋白质编码序列的合适的位置包含MAR,以用于蛋白质的最佳表达。

Description

基质附着区和促进基因表达的用途
相关申请的交叉引用
本申请根据35 U.S.C. §119(e)要求2018年12月7日提交的美国临时申请序列号62/776,643的利益,其全部内容通过引用并入本文。
背景技术
基因序列的转录(即mRNA的生成)在许多不同的水平受到控制。转录起始位点或启动子具有不同的强度,并且给定基因的转录起始频率也可以通过增强子序列增加。转录过程中的暂停可以影响转录速率,从而影响在给定时间段内产生的转录物的量。前体mRNA剪接、聚腺苷酸化和切割的速率也可以影响由转录单位产生的mRNA的水平。此外,mRNA分子内的序列可以调节其从细胞核到细胞质的转运、以及其转换率(即其细胞质稳定性)。
体外的多肽(例如治疗性抗体、生长因子)的表达对于制药工业而言是重要的,并且使蛋白表达最大化的方法是有需要的。
概述
本发明描述了一种用于评估基质附着区(MAR)的强度的新技术,并且表明了该技术可用于鉴定以前未知的新的MAR序列。本发明还描述了嵌合MAR序列。
本发明还描述了核苷酸构建体,所述核苷酸构建体包括顺式MAR位置(placement)和相关的其他序列,以用于感兴趣的基因(GOI)的最佳表达。
因此,根据本发明的一个实施方案,提供了一种重组多核苷酸,其包含:编码序列;启动子,其被配置为启动编码序列的转录;以及基质附着区(MAR)核心,其选自SEQ ID NO:1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少75%序列同一性(sequenceidentity)的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
另一个实施方案提供了一种将编码序列转染到细胞的方法,其包含:在用于将第一和第二多核苷酸转染到细胞中的条件下,将细胞与包含编码序列和用于启动编码序列的转录的启动子的第一多核苷酸和包含选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列的基质附着区(MAR)核心的不连接的(unlinked)第二多核苷酸接触,其中MAR核心能够附着到哺乳动物细胞核基质。
本发明还提供了嵌合基质附着区(MAR),其包含:(a)MAR核心,其选自SEQ ID NO:1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质;(b)5’侧翼区,其选自SEQ ID NO: 2、6、10、14、18、22、26、30和34和与SEQ ID NO: 2、6、10、14、18、22、26、30和34中的任何一个具有至少75%序列同一性的核酸序列;以及(c)3’侧翼区,其选自SEQ ID NO: 3、7、11、15、19、23、27、31和35和与SEQ ID NO: 3、7、11、15、19、23、27、31和35中的任何一个具有至少75%序列同一性的核酸序列,其中MAR核心、5’侧翼区和3’侧翼区不是来自相同的天然MAR。
附图说明
图1比较了两种MAR序列(作为对照的MAR X29(一种已知的MAR),以及通过本发明的技术鉴定的MAR斑马鱼(Zebrafish))的强度。
图2展示了使用不包含任何MAR序列的构建体作为对照,MAR斑马鱼核心的强度。
图3是实施例2中所描述的含有MAR核心的构建体的载体图。
图4是如实施例2中所描述的不包含MAR核心元件的对照构建体的载体图。
详细描述
I. 定义
所有的数字标示(包括范围),例如pH、温度、时间、浓度和分子质量,都是近似值,其通过0.1的增量变化(+)或(-)。应当理解的是,尽管并非总是明确地表明,但术语“约”位于所有的数字标示之前。还应当理解的是,尽管并非总是明确地表明,但本文所述的试剂仅是示例性的,并且其等效物是本领域已知的。
如说明书和权利要求书中所使用的,除非上下文中明确地规定,否则单数形式“一个”、“一种”、“所述”包含复数形式。例如术语“一种/一个多核苷酸”包括多种多核苷酸,包括其混合物。
术语“多核苷酸”和“寡核苷酸”被可互换地使用,并且是指任何长度的核苷酸的聚合形式,无论是脱氧核糖核苷酸还是核糖核苷酸还是其类似物。多核苷酸可以包括被修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,则可以在组装多核苷酸之前或之后赋予对核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分打断。在聚合之后可以进一步修饰多核苷酸,例如通过与标记组分偶联。该术语也指双链和单链分子。除非另有说明或要求,否则本发明的多核苷酸的任何实施方案包括双链形式和已知或预测构成双链形式的两种互补单链形式中的每一种。
II. 新的基质附着区(MAR)序列
本发明描述了一种经由电脑(in silico)量化MAR元件的强度的方法,以及使用该方法量化从序列数据库中鉴定的新的MAR序列的强度。
通过序列比较和结构-活性分析,本发明人发现MAR元件可以由中央富含AT的核心区和含有转录因子结合基序的5'和3'侧翼区组成。
核心区可以富含(ATAT)n微卫星。结合基序可以靶向SATB1、NMP4、CEBP、Fast和Hox转录因子。MAR可以结合的其他细胞核基质蛋白包括:ARBP蛋白(附着区结合蛋白),其识别MAR中的共有序列ATTTCAC/GTTGTAAAA;NMP-2蛋白,仅定位于细胞核基质中;Sp1、ATF、CCAAT、C/EBP和AP-1转录因子;酵母ACBP蛋白(ARS共有结合蛋白),其与ARS元件相互作用;组织特异性人SATB1蛋白,其主要在胸腺中表达,其与特殊的一类一条链上有A、T或C,但没有G的富含AT的MAR的小沟结合;Matrin 3蛋白(一种人和大鼠细胞的内部细胞核基质网络的酸性蛋白),matrin F/G;转录蛋白因子RFP。
分析结果帮助发明人寻找新的MAR序列,从而发现了与阳性对照MAR X29相比在促进基因表达方面高效的四个新的MAR序列(Arope et al. (2013) PLoS ONE 8(11):e79262)。
本发明进一步证明,这些新鉴定的MAR序列的核心可以与来自其他MAR的5’和3’侧翼区形成功能性MAR,提供另外的有用的嵌合MAR序列。
因此,根据本发明的一个实施方案,提供了一种重组多核苷酸,其包含:编码序列;启动子,其被配置为启动编码序列的转录;以及本文所述的基质附着区(MAR)核心及其变体。这种新的MAR核心的实施例列于表1中。参见,例如,SEQ ID NO: 1、5、9和13。
基质附着区或MAR是真核生物的染色体的DNA中细胞核基质附着的序列。作为将真核生物的基因组在细胞核内组织成功能单元的结构DNA组件,MAR可以在细胞核内介导染色质的结构组织。这些元件构成染色质支架的DNA的锚点,并且用于将染色质组织成结构域。由MAR元件介导的染色质的动态和复杂组织在基因表达的调节中起着重要作用。
MAR核心的变体是与参考MAR核心(例如,SEQ ID NO: 1、5、9和13)具有一定序列同一性(例如,至少75%、80%、85%、90%、95%、97%、98%或99%)并具有预期的MAR功能(例如,附着到哺乳动物核基质的能力)的核酸序列。
在一些实施方案中,MAR核心的变体富含AT,例如在序列中具有至少75%、80%、85%、90%或95%的A或T。
MAR核心能够与MAR的5’侧翼区(例如SEQ ID NO: 2、6、10、14和18中的任何一个或其变体(与SEQ ID NO: 2、6、10、14和18中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列))一起存在。在一些实施方案中,5’侧翼区位于MAR核心的5’侧,并距离MAR核心100个核苷酸之内。
在一些实施方案中,MAR核心能够与MAR的3’侧翼区(例如SEQ ID NO: 3、7、11、15和19中的任何一个或其变体(与SEQ ID NO: 3、7、11、15和19中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列))一起存在。在一些实施方案中,3’侧翼区位于MAR核心的3’侧,并距离MAR核心100个核苷酸之内。
包括MAR核心、5’侧翼区和3’侧翼区的非限制性MAR序列包括SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
III. 嵌合MAR序列
正如所提供的,这些新鉴定的MAR序列的核心能够与来自其他MAR的5’和3’侧翼区形成功能性MAR,提供另外的有用的嵌合MAR序列。
在一个实施方案中,本发明的嵌合MAR包括如本文所公开的MAR核心,其在5’侧具有5’侧翼区。在一个实施方案中,本发明的嵌合MAR包括如本文所公开的MAR核心,其在3’侧具有3’侧翼区。在一个实施方案中,本发明的嵌合MAR包括如本文所公开的MAR核心,其在5’侧具有5’侧翼区且在3’侧具有3’侧翼区。
5’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区或3’侧翼区。在一些实施方案中,5’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区。
3’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区或3’侧翼区。在一些实施方案中,5’侧翼区能够选自本领域已知的或本文公开的任何3’侧翼区。
MAR核心、MAR 5’侧翼区和MAR 3’侧翼区中的每一个也能够被核酸变体(例如,与参考序列具有至少75%、80%、85%、90%、95%、97%、98%或99%的序列同一性)取代。
本文公开的MAR核心包括SEQ ID NO:1、5、9和13。本文公开的5’侧翼区包括SEQ IDNO:2、6、10、14、18、22、26、30和34。本文公开的3’侧翼区包括SEQ ID NO:3、7、11、15、19、23、27、31和35。
在一些实施方案中,本文新鉴定的MAR侧翼序列也能够与本文新发现的或已知的其他核心序列融合以产生新的嵌合MAR序列。在一些实施方案中,嵌合MAR序列包括表1的MAR核心区中的任何一个、表1的MAR 5’侧翼序列中的任何一个、以及表1的MAR 3’侧翼序列中的任何一个。
IV. 基因表达
本文公开的MAR序列和构建体能够被用于促进细胞中的基因表达。当感兴趣的基因被包含在含有MAR(单独的或具有5’和/或3’侧翼区的MAR)的构建体中时,可以将构建体导入宿主细胞中以表达感兴趣的基因。
本文公开的MAR序列还能够作为反式作用元件被用于以反式来促进基因表达。例如,可以将包含本文公开的任何MAR序列(单独的或具有5’和/或3’侧翼区的野生型或嵌合型MAR)的构建体导入到用包含感兴趣基因(GOI,或转基因)的构建体进一步转染(或已转染)的细胞中,使得MAR序列能够帮助GOI的表达。
因此,根据本文公开的一个实施方案,提供了一种将编码序列转染至细胞的方法,其包含:在用于将第一和第二多核苷酸转染到细胞中的条件下,将细胞与包含编码序列和用于启动编码序列的转录的启动子的第一多核苷酸和包含如本文所公开的基质附着区(MAR)核心的不连接的第二多核苷酸接触。在一些实施方案中,MAR核心选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
在一些实施方案中,第二多核苷酸进一步包含5’侧翼区,所述5’侧翼区选自SEQID NO: 2、6、10、14和18和与SEQ ID NO: 2、6、10、14和18中的任何一个具有至少75%序列同一性的核酸序列。在一些实施方案中,5’侧翼区位于MAR核心的5’侧,并距离MAR核心100个核苷酸之内。
在一些实施方案中,第二多核苷酸进一步包含3’侧翼区,所述3’侧翼区选自SEQID NO: 3、7、11、15和19和与SEQ ID NO: 3、7、11、15和19中的任何一个具有至少75%序列同一性的核酸序列。在一些实施方案中,3’侧翼区位于MAR核心的3’侧,并距离MAR核心100个核苷酸之内。
在一些实施方案中,完整的MAR序列选自SEQ ID NO: 4、8、12和16和与SEQ ID NO:4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列,其中MAR能够附着到哺乳动物细胞核基质。
本发明还提供了通过本发明公开的方法制备的转染细胞。
在本发明公开的任何构建体或载体中,能够包括另外的转录调控序列和/或转录后调控序列。转录调控序列能够包括例如启动子、增强子和聚腺苷酸化信号。转录后调控序列包括例如内含子和PRE。
在某些实施方案中,在载体中存在多克隆位点(MCS)(也被称为“多接头(polylinker)”),以便于插入异源序列。例如,可以将MCS置于启动子和聚腺苷酸化信号之间,以促进转基因序列的插入。在含有转基因序列的载体中,含有启动子、转基因序列、聚腺苷酸化信号的载体的部分被称为“表达盒(expression cassette)”。
在真核生物的细胞中有活性的启动子是本领域已知的。示例性的真核生物的启动子包括例如SV40早期启动子、SV40晚期启动子、巨细胞病毒(CMV)启动子、巨细胞病毒主要立即早期(CMV-MIE)启动子、EF1-α(翻译延长因子-1α子单元)启动子、Ubc(泛素C)启动子、PGK(磷酸甘油酸激酶)启动子、肌动蛋白启动子等。还可参见Boshart et al., GenBankAccession No.K03104; Uetsuki et al. (1989) J. Biol. Chem.264:5791-5798;Schorpp et al. (1996) Nucleic Acids Res.24:1787-1788; Hamaguchi et al. (2000)J. Virology74:10778-10784; Dreos et al. (2013) Nucleic Acids Res.41(D1):D157-D164以及http://epd.vital-it.ch(在2014年7月16日登入)的真核生物的启动子数据库。
载体上还可以包含增强子。非限制性实施例包括在CMV启动子和内含子A序列中的增强子。先前显示五种胚胎干细胞(ESC)转录因子占据了超增强子(Oct4、Sox2、Nanog、Klf4和Esrrb),并且还有许多另外的转录因子有助于ESC的控制。另外的六种转录因子(Nr5a2、Prdm14、Tcfcp2l1、Smad3、Stat3和Tcf3)占据了典型的增强子和超级增强子,并且所有这些都富含超级增强子。这些中的任一种或本领域中进一步已知的都可以在本发明中使用。
在真核生物的细胞中有活性的聚腺苷酸化信号是本领域已知的,包括但不限于SV40聚腺苷酸化信号、牛生长激素(BGH)聚腺苷酸化信号和单纯疱疹病毒胸苷激酶基因聚腺苷酸化信号。聚腺苷酸化信号指导前体mRNA的3’末端切割、在切割位点处前体mRNA的聚腺苷酸化、和聚腺苷酸化信号下游的转录终止。核心序列AAUAAA通常存在于聚腺苷酸化信号中。还可参见Cole et al. (1985) Mol. Cell. Biol. 5:2104-2113。
可以被用在本发明的载体中的示例性的内含子包括人类/小鼠/大鼠/其他物种巨细胞病毒主要立即早期(MIE)基因的β-珠蛋白(globin)内含子和第一内含子(也称为“内含子A”)。
可以被包括在本发明的载体中的另外的转录后调控元件包括但不限于CMV MIE的5’-非翻译区、人Hsp70基因、来自血管内皮生长因子(VEGF)基因的SP163序列、以及与腺病毒晚期mRNA相关的三联前导序列。参见例如Mariati et al. (2010) Protein Expression and Purification69:9-15。
在某些实施方案中,本文公开的载体含有编码在真核生物的细胞中起作用的选择标记物(即真核生物的选择标记物)的核苷酸序列,使得当施加适当的选择时,不含有该选择标记物的细胞死亡或者比含有该选择标记物的细胞明显慢得多地生长。在真核生物的细胞中起作用的示例性的选择标记物是谷氨酰胺合成酶(GS)基因;通过在缺乏谷氨酰胺的培养基中培养细胞、或者用L-蛋氨酸亚砜亚胺(L-Methioniene Sulfoximine)进行选择、或同时使用上述两者来施加选择。在真核生物的细胞中起作用的另一个示例性的选择标记物是编码对新霉素(neo)的抗性的基因;通过在含有新霉素、遗传霉素或G418的培养基中培养细胞而施加选择。另外的选择标记物包括二氢叶酸还原酶(DHFR,赋予对氨甲喋呤的抗性)、嘌呤霉素-N-乙酰转移酶(提供对嘌呤霉素的抗性)和潮霉素激酶(提供对潮霉素B的抗性)。在真核生物的细胞中起作用的另外的选择标记物是在本领域已知的。
编码上述选择标记物的序列被可操作地连接至启动子和聚腺苷酸化信号。如上所述,在真核生物的细胞中起作用的启动子和聚腺苷酸化信号是在本领域已知的。
在某些实施方案中,本文公开的载体可以含有两个或更多个表达盒。例如,含有两个表达盒(其中一个编码抗体重链,另一个编码抗体轻链)的载体可以被用于产生功能性抗体分子。
本文公开的载体还含有在原核细胞中起作用的复制起点(即原核复制起点)。在原核细胞中起作用的复制起点在本领域中是已知的,并且包括但不限于大肠杆菌的oriC起点;质粒起点,例如pSC101起点、pBR322起点(rep)和pUC起点;以及病毒(即噬菌体)复制起点。用于鉴定原核复制起点的方法被提供在例如Sernova & Gelfand (2008) Brief. Bioinformatics9(5):376-391。
本文公开的载体还含有在原核细胞中起作用的选择标记物(即原核选择标记物)。在原核细胞中起作用的选择标记物是在本领域中已知的,并且包括例如编码赋予对氨苄青霉素、卡那霉素、氯霉素或四环素中的任何一种的抗性的多肽的序列。赋予对氨苄青霉素(和其他β-内酰胺抗生素)的抗性的多肽的实施例是β-内酰胺酶(bla)酶。卡那霉素抗性可以由新霉素磷酸转移酶基因的活性产生;而氯霉素抗性是由氯霉素乙酰转移酶介导的。
示例性的转基因包括任何重组蛋白或例如激素(例如生长激素)、促红细胞生成素、抗体、多克隆、单克隆抗体(例如利妥昔单抗)、抗体缀合物、融合蛋白(例如IgG-融合蛋白)、白细胞介素、CD蛋白、MHC蛋白、酶和凝血因子。抗体重链和抗体轻链可以由单独的载体或由含有两个表达盒的相同载体表达。
本发明提供了用于在细胞中表达重组多肽的方法。所述方法包括将如本文所述的载体导入细胞中,并在其中载体被瞬时地或稳定地保持在细胞中的条件下培养细胞。细胞可以是原核生物的或真核生物的,例如通过与CRISP/Cas9的靶向整合而产生的稳定细胞系。可以被用于表达重组多肽的经培养的真核生物的细胞是在本领域中已知的。这样的细胞包括真菌细胞(例如酵母)、昆虫细胞、植物细胞和哺乳动物细胞。相应地,本发明提供了包含如本文所述的载体的细胞。
示例性的酵母细胞包括但不限于木霉属菌种(Trichoderma sp.)、巴斯德毕赤酵母(Pichiapastoris)、粟酒裂殖酵母(Schizosaccharomyces pombae)和酿酒酵母(Saccharomycescerevisiae)。示例性的昆虫细胞系包括但不限于Sf9、Sf21和果蝇(Drosophila)S2细胞。示例性的植物细胞包括但不限于拟南芥(Arabidopsis)细胞和烟草BY2细胞。
可用于表达重组多肽的经培养的哺乳动物细胞系包括中国仓鼠卵巢(CHO)细胞、人胚胎肾(HEK)细胞、病毒转化的HEK细胞(例如HEK293细胞)、NS0细胞、SP20细胞、CV-1细胞、幼仓鼠肾(BHK)细胞、3T3细胞、Jurkat细胞、HeLa细胞、COS细胞、PERC.6细胞、CAP®细胞和CAP-T®细胞(后两种细胞系可从德国科隆的Cevec Pharmaceuticals公司商业地获得)。CHO细胞的许多衍生物也是可用的,例如CHO-DXB11、CHO-DG-44、CHO-K1、CHO-S或工程化的CHO细胞,例如CHO-M、CK1 SV CHO和CHOZN。也可以使用哺乳动物原代细胞。
在某些实施方案中,在无血清培养基中培养细胞。例如,为了制造施用于患者的治疗性蛋白,表达细胞必须在无血清培养基中生长。在另外的实施方案中,在用于多肽表达之前,细胞已经预先适应无血清培养基中的生长。
可以使用本领域已知的方法将如本文所述的载体引入上述细胞中的任一个中。这样的方法包括但不限于聚乙二醇(PEG)介导的方法、电穿孔、生物射弹输送(即粒子轰击)、原生质体融合、DEAE-葡聚糖介导的方法、以及磷酸钙共沉淀。还可参见Sambrook et al.“Molecular Cloning: A Laboratory Manual,” 第三版, Cold Spring HarborLaboratory Press, 2001;以及Ausubel et al., “Current Protocols in MolecularBiology,” John Wiley & Sons, New York, 1987以及定期的更新。
用于细胞培养的标准方法在本领域中是已知的。参见例如R. I. Freshney“Culture of Animal Cells: A Manual of Basic Technique,” 第五版, Wiley, NewYork, 2005。
实施例
通过参考以下实施例进一步理解本发明,这些实施例旨在纯粹是本发明的示例。本发明的范围不受限于示例性的实施例,其仅意图作为本发明的单个方面的说明。任何功能上等同的方法都在本发明的范围内。根据前面的描述和附图,除本文所述的那些之外,本发明的各种修改对于本领域技术人员而言将变得显而易见。这些修改落入所附权利要求的范围内。
实施例1.寻找新的MAR
该实施例开发了一种经由电脑量化基质附着区(MAR)元件的强度的方法,以及使用该方法量化一些示例性MAR序列的强度。
基于基序的MAR鉴定
进行文献检索以识别与MAR鉴定相关的所有基序,特别是寻找MAR特异性转录因子、染色质结合域、DNA弯曲和DNA解旋序列。总结了潜在有用的特征并用于进一步的MAR评估。
MAR元件可以由中央富含AT的核心区和含有转录因子结合基序的5’和3’侧翼区组成。核心区可能富含(ATAT)n微卫星。
MAR可以包含“MAR识别特征”并通常通过包含“MAR识别特征”进行分类。二重(bipartite)元件由两个不同的序列AATAAYAA和AWRTAANNWWGNNNC组成。其他MAR指示序列由各种转录因子和DNA结构基序组成。示例性序列包括DNA解旋基序、AP-1、A-box和T-box、NMP-2、SATB1、Hox4D、TEF、Pit1和Fast。
通过检索鉴定出4个新的MAR元件,分别命名为MAR斑马鱼、MAR鲤鱼(CyprinusCarpio)、MAR 12-RP13和MAR 17XX_fos。它们以及一些已知元件(MAR 1-68、MAR S4、MARX29、小鼠c-myc 5MAR和SPR2A-MAR)的完整序列、核心以及核心的5’和3’侧翼区列于表1中。
表1. MAR序列
Figure 638119DEST_PATH_IMAGE001
Figure 273368DEST_PATH_IMAGE002
Figure 256368DEST_PATH_IMAGE003
Figure 854840DEST_PATH_IMAGE004
Figure 856162DEST_PATH_IMAGE005
Figure 616308DEST_PATH_IMAGE006
Figure 335871DEST_PATH_IMAGE007
Figure 738034DEST_PATH_IMAGE008
Figure 610175DEST_PATH_IMAGE009
Figure 56069DEST_PATH_IMAGE010
Figure 13660DEST_PATH_IMAGE011
Figure 219514DEST_PATH_IMAGE012
Figure 195429DEST_PATH_IMAGE013
Figure 828535DEST_PATH_IMAGE014
Figure 522691DEST_PATH_IMAGE015
注意:在全长序列中,核心区用粗体和下划线表示,侧翼区用下划线表示。
实施例2. MAR斑马鱼的测试
对鉴定的MAR元件中的一个(MAR斑马鱼)进行实验测试,并与来自文献的最强的已知的MAR进行比较,其示出高两倍的效力。
体外比较MAR斑马鱼(新鉴定的MAR元件)与MAR X29(对照,参考Arope et al.(2013) PLoS ONE 8(11): e79262)。
然后对不包括全长MAR斑马鱼的侧翼区的MAR斑马鱼核心进行实验测试,与不包含任何MAR序列的构建体进行比较。
材料与方法
Neon 转染是用CT MCB细胞进行的。使用BalanCD + 4 mM Gln 培养基用于转染。通过Bio-Rad(Gene Pulser II设置为900 uF,300 v,电阻0)进行的瞬时转染。细胞在转染的24小时前分裂。第0天生存力和VCD以百万个细胞/ml表示。使用5 μg重链和轻链DNA进行转染。10 μg GFP DNA被用作外部对照以检查转染效率。通过将甲硫氨酸亚砜亚胺(MSX)在导致有利于表达感兴趣的重组蛋白(利妥昔单抗轻链)的细胞生长的选择性压力的水平维持14天产生稳定的库(pool)。在14天补料分批(fed batch)定量分析中比较所得的重组库。通过生物层干涉仪或ELISA分析在收获当天和整个培养过程中的滴度。使用仅一种浓度的MSX(80 mM)重复上述库生成的实验方法以生成用于测试MAR斑马鱼核心的库。
结果
MAR X29和MAR斑马鱼的体外比较结果如图1所示。在两种选择标记物浓度(80 mM和100 mM的甲硫氨酸亚砜亚胺(MSX))下,MAR斑马鱼的表现均明显优于MAR X29。因此,该实施例验证了实施例1中开发的检索和经由电脑的方法。
在进一步的实验中,与没有任何MAR元件的构建体相比,测试了单独的MAR核心序列的效力。如图2所示,MAR斑马鱼核心序列比无MAR对照产生显著更高的滴度。
应该理解的是,虽然已经结合上述实施方案描述了本发明,但是前面的描述和实施例旨在进行说明而不是限制本发明的范围。本发明范围内的其他方面、优点和修改对于本发明所属领域的技术人员来说将是显而易见的。
序列表
<110> 赛尔希恩公司
<120> 基质附着区和促进基因表达的用途
<130> 21F-1869-CNP
<150> 62/776643
<151> 2018-12-07
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
aaataattaa ttagcaaata atttatatat ttatatattt atatatatat atatatatat 60
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 120
atatatatat atatatatat atatatatat aaatatataa atatatatat atatatatat 180
attggt 186
<210> 2
<211> 185
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 2
aaatatttca aaaattaagc aaagaaactt tcacagtatg actaataata ttttttcttc 60
tggagaaagt cttatttgtc ttatttcggc tagaataaaa acagttttta attttttaaa 120
caccatttta cggacaaaat tattagcccc tttaagctat atttattttc aatagtctac 180
agaac 185
<210> 3
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 3
gggagaagca gtccaatgtg gctgtatata tatattatta tttttttttt tttaaataca 60
aacaattaag ctgtcgaact gttgtataaa cacaatat 98
<210> 4
<211> 1879
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
atgcaaagga ctctttctgt aaaatatctg ctgtaaaaat ctaaaggatt tgagggttgc 60
actcccaaag gctcctgaga gcttgtgtaa aataagcctt cctaactgct gctttctcac 120
tttagtcaat tttggccttt tttatattca tatacagtaa atgttgctct aatcaatgtg 180
gatgatcatt atcagtatat gactcgaaaa atattttaaa cttctctttg cttctagacc 240
aggatttgaa ggaatattct atttttaatg acactgcttt gcaatattta tgattcttaa 300
agtcaaacag agtgaaacag aagtaaacat gtcatgatgt acactcacat gaaacaatct 360
ctgaaatgaa gaatgaatga agaaagttgt gttgctaaca aaatggagga agactcacga 420
atagacaaaa gcagggcaga aacgagacac gcacccgtgt acatatatac agttgaagtc 480
agacttatta gccccccttt gatttttttt tcttttttta aatatttcaa aaattaagca 540
aagaaacttt cacagtatga ctaataatat tttttcttct ggagaaagtc ttatttgtct 600
tatttcggct agaataaaaa cagtttttaa ttttttaaac accattttac ggacaaaatt 660
attagcccct ttaagctata tttattttca atagtctaca gaacaaataa ttaattagca 720
aataatttat atatttatat atttatatat atatatatat atatatatat atatatatat 780
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 840
atatatatat atataaatat ataaatatat atatatatat atatattggt gggagaagca 900
gtccaatgtg gctgtatata tatattatta tttttttttt tttaaataca aacaattaag 960
ctgtcgaact gttgtataaa cacaatatca ctcgagttgc agtccgatgt gactatatat 1020
tggcactggt gggagatttg cattcattgt gacaatatac agccacattg cattgctacg 1080
agtgtgatat tatgtttata caccagttca acagcataat cgtgtgtaat aaaaagataa 1140
tcaaacacgg aagaggaact actttcttcc gccattcatt cacatctgca gcttacgtca 1200
gaacagcaga agctgttgct cattcatata tataatatat ataaatttgt atacttacag 1260
acgacacagt ggctcagtgg ttagcactgt ctcctcacag caagaaggtc actgtttcaa 1320
gtccaggctg ggtccgccgg catttgtgtg tggagtttgc ttgtttttcc cgtgttaatg 1380
tgtatggatg tttcccagta ctgggttgca gctggaaggg catccgctgt gtaaaactta 1440
tgctggataa gttggcagtt cattccgctg tgtcaacccc tgatgaataa agggattaag 1500
ccaaatgaaa atgaatgaat gatttaatac tcttgtttaa gtcttagtgc cgattatata 1560
tagatatgtg gtgttagatc aaaccagtgt tcattttgac agcaaaattt gatttagttt 1620
tagtcatttt ttagtcttcc atattcgtta tagcatcagt ctatatacag tcaactaaat 1680
taaacatgat tttagtcaac ttcatgcatt ttcacatgga caaggtcatt aaaattctac 1740
aggatcaggt tgtaccaact ctatctcatg gaaatttgta actttttgat tgtggctaat 1800
tcgtatgaat ttgtatgatc tcatttgtac aatttagtat tatttgctca tcccccagtg 1860
atggttggat ttagggttg 1879
<210> 5
<211> 225
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
tatccaaata tatatatata tatatatata tatatactat atatatatat atatatatat 60
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 120
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 180
atatatatat atatatatat tttttttttt ttttttaaga aaaca 225
<210> 6
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 6
caaatttgct atacaaaaac ctaaatgtaa taaagttaca tccataaaag tgacttttta 60
ttacttttga aacacaacag atttatgccc tgtctatatc cagttc 106
<210> 7
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
gttataataa ttttataatc tctcacaata ttgctgtttt actgattttt gaataaatgc 60
agccttggtg agcataagag actttttcta aaaactttga aaagtctta 109
<210> 8
<211> 2679
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
tgttacatta ggctgaaaac acactgtgta tgtgcatatt ttcccttaaa tacataaaga 60
agtaatgggt ggcgtacctg tattggttat agactccagg gcagtataac atggctgtga 120
atagactctg ttgtggacat acactccata acaccaaact gatcccgtag aacgatgtca 180
ccaggaaaag aaggagcgtc aaaatgaact gcctgtgatt ggcttgacct acacagctgt 240
ttatcctgtc atggaaagtc acatacatac aagacacaaa taataagcaa cacatttaca 300
gatattttca ttcaaacaat ttagaacaat tatactattt tctctcttgt caatgtagct 360
ttaatgagaa ttatgtggct catggcatgt tcatatttat atttgtgcct gtgtgtgtgt 420
tgaagtagca tggagacaga ttggcctggt gagagctccc tttactgtgc tgaaaactgt 480
gttcctgttg cctttgcaca tgtctcacca gcctgcctgc tccagtgacg tcttttggga 540
atcagcttga acatatgtgt gtgtctgatg gggtagggaa cacatgcata caagtgtgaa 600
gagatcagaa aatgaatcaa atcattggca tgaccactaa tttaaacaat tcattttgga 660
attgttcagc tacttctgta gtaaggattt gcaataagcc agatatctta gaaggaaagg 720
cacaaatatc aacattaaaa ttaatatttg aaataacaga aaatatattc ggttgactga 780
ttatccaaca aacacaagtg taaagtgata tttttaatga acatctaaaa ttacaatgca 840
acggtaagtc tgtgaagctg agatgattaa aatgtgatct ttatgaatga aagcagatgg 900
ccacaatgct ctctctcctt ttattgttta taaatcataa atcatcaatt catatagtaa 960
cttttttaga ttttgaatat ttatttatgt aaagttttaa atattattga atagtaaata 1020
atttaatatg ataatcattt ataaaagtgt atatttgtaa atacaattat ttttaaaata 1080
tataaatgat gaaaaaaatt taaatataag aataaacact tttataaata atacaaggca 1140
aatttgctat acaaaaacct aaatgtaata aagttacatc cataaaagtg actttttatt 1200
acttttgaaa cacaacagat ttatgccctg tctatatcca gttctatcca aatatatata 1260
tatatatata tatatatata ctatatatat atatatatat atatatatat atatatatat 1320
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 1380
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 1440
atattttttt tttttttttt aagaaaacag ttataataat tttataatct ctcacaatat 1500
tgctgtttta ctgatttttg aataaatgca gccttggtga gcataagaga ctttttctaa 1560
aaactttgaa aagtcttacc gacaacatat tattgaatgg cagtgtaaat atagatcgtt 1620
ttgtcattta gagaatattt aattaatgtt taatacactt cacactagga atgaagtgct 1680
cgtactcaat ttttaaagaa gaaggaatga gaaacccacc aaacacagtg gtggtccatt 1740
cgaaggacac atgccccaca gatcctgcag tgccctgccc ttggtgggcg cacctgtcgg 1800
cacacagggc ataacttctt ctttccttcg ttttccccat ttgactgact gattcctttg 1860
cagggggcgg agtctccagg tatgtttgtg ctctgattgg ttgtacagat actgttaatt 1920
ccctgagcta atgactggga tttgacaaag cctggtcctt gtttggtgcg cacaagggag 1980
ataagggtca acatcatgcc tgtcgtcaca gtaaccagct gcagattact gacgtctcct 2040
ctgggaacga tctcagtaag gaaaagatag tacatgtagg caagggagaa aagtgccaag 2100
ctaaggaaaa acaatgtgcg tcttttcctt ctgtgagtca catagtaata ccaaagcacc 2160
agtcctggta gggcagttag gacaacaact cccaacatac agttaattgc tgctactcgc 2220
aacagaccag gaattaatac catgggaggt aagacagaga tttccaatcg aaggggtcct 2280
acggcacaac atggcaaacc caaacgatca gccatacaag agacgaaacg agagaagatg 2340
tctggcttgt cttgctctcc tctgactaac ctattgagaa agagtgacaa attcaccatt 2400
catcatttac acactattat gttatcagtt ttatgtatgg aaatgacaag gtgcaaacgg 2460
acaaaattat ttaattcaac tacacttttt aaagtgtaaa aatgtaaagt gtcaaaagtt 2520
tatatcaata aatgtaatgt aaaaccatct ctgcatgcca tgatcttaac tggttgacct 2580
ctgacctttc acaggcatca tctagttctt cacagtcaca gcagcagtac tctctttgct 2640
ggtcgatgtc tccacagcag cacagagggt catctggtt 2679
<210> 9
<211> 350
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
atatatatat gttagtgata tatatataaa atatatatca ctcttattat atattatata 60
tattatataa tatataatat attatattat ataatatatt atatattata taatatatat 120
aatatattat atattatata atataatata ttatatatta tataataata taatatatta 180
tatattatat aataatatat aatatattat ataataatat ataataatat ataatatatt 240
attatataat atataataat atataataat ataataatgt gattatatta tatataatat 300
gtaatataat aatgtatata tattatatat gcattatata taatgatttt 350
<210> 10
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
aattgcataa gccaatccct tgcaataaat aaaatagatc gagatgtaga tagacagaga 60
tccagatcct actggttcca ttttcctggc agaaccatga tggatatgat atatgtccca 120
taaagagcct cccagtggtg tctttttgtt ttgtaaagat ggttttaatc cacagattta 180
agagtg 186
<210> 11
<211> 153
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 11
ctatcaaatg tatatttaaa tctacctact tgtgttatat atttatatat gtgtgtgtga 60
tatgtataat tttaaaatat atctgtatag ctacttaatt tgtatttcca gcccaattca 120
gtctagtgac agaaaatata actcatcaag tct 153
<210> 12
<211> 4061
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 12
tacccagtaa ttcttaaact acttactcca gcacttggcc catggcaaat ttcctggtag 60
ccatatgtac atatacacat gcttttaaat acataaacgt atgtacatat acttttaatt 120
tactactaag attttataca ttttccagta gtttgtatga tgaacatgta tatacctccc 180
tttaaagtta aacaataaaa aaatcttaat ttttctacct taaaatctcc tctcatcacg 240
tcatccaatg atagccgctg ttaacatcat gttcctattt acttctgctt gtttctctga 300
agatgtacgt gagtgggtaa acacgatgta atttgacatt gcggttttta atagcatatc 360
acaaatattt tcctgttata atttcattca caaacatggt tctgatagtt acataatatt 420
acaccatatg atcatttcct agtttactta gctatttcct atggttggat attcttggct 480
tgtttccaat atttttctat tctaattcat ctccaacaaa agtcatcatc tgtgaatctt 540
tctctgcatc tctaagtatt tccttagaat aaactcctag agtgaatctg ttagcacatt 600
tgtttctctc ttttaattaa caactggaaa atgattattg cagacacatt ctcttcaagt 660
gaatatttct tctcggctga actttgcttt actgagtatt tttccctccc ttggctgcat 720
tttcattctt cttttgctgt tttgcgtttc actcccacct acaaaatatc caagttccct 780
ctcccaaaat aaaacccctc ttggttcatg gcagagtcaa ctttgttcag ctgtctttac 840
cctgcaggtc caaaggtcta ttgcccagag tatttgctga ggggataaga ggtgccaggt 900
cctcatcaga gtaatctttg catcttccat tttagatgat gaggctgagg ctaaataact 960
ttttgtgact tgaacaaaat cacgcccgtc attttggagc agagattgga cccagaccat 1020
ctgactgcag tgcacttggt tactacacaa cagccctgga agctgcaacc tgaggacctc 1080
cagcctcaca tgaatcatct tcatccacca accttctccc atctgggttc ccacactcct 1140
cccatcaccc agcatggggg gcctcatggt ggtggttgac ccttcctcta tctccacctg 1200
catatggggc acattctccc caaacctcac tccagtccaa tctcacctca accccactgt 1260
ctcgctcata gggttgagga aagacagaat aaaccctggc tgggaaaagt cactttagtc 1320
aatgtacggt cagttttacg tgtcagcttg gccaggctag agtccccagt catccaaacg 1380
cccagttgac tgtaagcaaa gactatccta gataatttgg tcggcctgag acattcagtt 1440
aaaagaccat aagagcagaa ctgaaaacag aaaattctgc ctgtggactg cagcgccagc 1500
tcctgcctga gagtttccag cctgaccttc ctaaacttgc ctactaatcc cccacaattg 1560
cataagccaa tcccttgcaa taaataaaat agatcgagat gtagatagac agagatccag 1620
atcctactgg ttccattttc ctggcagaac catgatggat atgatatatg tcccataaag 1680
agcctcccag tggtgtcttt ttgttttgta aagatggttt taatccacag atttaagagt 1740
gatatatata tgttagtgat atatatataa aatatatatc actcttatta tatattatat 1800
atattatata atatataata tattatatta tataatatat tatatattat ataatatata 1860
taatatatta tatattatat aatataatat attatatatt atataataat ataatatatt 1920
atatattata taataatata taatatatta tataataata tataataata tataatatat 1980
tattatataa tatataataa tatataataa tataataatg tgattatatt atatataata 2040
tgtaatataa taatgtatat atattatata tgcattatat ataatgattt tctatcaaat 2100
gtatatttaa atctacctac ttgtgttata tatttatata tgtgtgtgtg atatgtataa 2160
ttttaaaata tatctgtata gctacttaat ttgtatttcc agcccaattc agtctagtga 2220
cagaaaatat aactcatcaa gtctgggtaa tctcaaataa ttcggctaaa ttcctcaatt 2280
catcaatttc tccctcctcc agcctccgca taattgattc taactttcag ggagttgaag 2340
cagcactgcc ctggggggct ctcttccagc tctcagcccc tccctgcaca gctctggtgc 2400
ccacggggat gcgcccacgg ggatgcaagg ccctgtatga ccatcagacc tcctgtcctc 2460
acttgagatg tttatttcta gtccccagtc ctgccccaac cacaggatgt aacccagacc 2520
ctggtctcta ttccaagatt catccttgtc aagcggttct cagcagcatg cctctgccac 2580
gcccagtcac agaggacgat attggctccc ctctttatgg ggggaggata aaaaggatca 2640
tatcccagac ccctgggctt aaggcttcca tgttcccatc tctactcttt aatgccagga 2700
tgacataggg tactttctgc aggcatagac aaccaggcag gaagaggggc ccatgttcct 2760
tgtaatctca gatcacaagt accctctggg gatctatcac cccaagcttg gtgcatggac 2820
aaggggtacc ttattctctt cctttcttct aagactatgc actgcctctc ccccaggcaa 2880
atggaatctt gtcaattcca agtgagtttg gaaaaactca ttctttttta cttattgttt 2940
agatcggaac ctaaaatcga aagttccagg aagctcaagt tcttataact aaaaaggctt 3000
ttctctctca agagcattgg ctctgtcttt tccatgttct actttgaaac acaaaagctg 3060
agctcgacat tgatttaatt gctttttatt tgaatgattg ctataagtga caccttttgg 3120
ggcagtatgt cctagctggt tgaattagag ttgggaaaca cattgcaaga aagggtagaa 3180
agaggcatac tttattgaat cttttggagt aacttttgtg cctgttacca caagcttatt 3240
tttgataaga tgcttcctaa ctttcctcgc tcacccctac ctcatctcag ggccaagcac 3300
gaaagttgtt ttatacatgc taggtttggc tgatttcaat gtgacttccc cagggcagaa 3360
gagacagtgg ttgaaggatg aagaatcaac ctacccgggg gaatcaaaga ttgatcccag 3420
ggaatggagc agatataatt aaataagttt tttctttccc cagtgtatct aatattcatt 3480
tttgtattta cttggagcaa atgaatttaa atgaattttt agttagagtt aaatcaactc 3540
attaaaacac attgaaggaa ttagaaatgt aaaatcattt cctgctgcaa ttcattcatc 3600
tctaagtcta taactgactt gaatctaggt aaaggtcatt gcttaaaggg gacagtggcc 3660
cttattcttg caacctacaa acttttacag tttgcatgga gttttcacat ccatgaactc 3720
aagcaagact gaataggcct gtatggtgaa caaacaggag taaatgcctc cactattcag 3780
gggaggaaag tgagctcaaa aaagtttaat attgttgcct aaggatactc aaccagcaaa 3840
tggcaatatc gagacaggag caggtcttca gtccaaaccc acagagcaga gcttgcccag 3900
gaagctgatc attcttgtac caccttctcc atcactggac ctacaccctg cccttcttta 3960
cccagctctg acctctcaga tgctgaacct ggggtgccct tgtcattgaa cttcgagttg 4020
cattattttc ccattgtttt acctacaatt aacttgccgt c 4061
<210> 13
<211> 1700
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 13
agactctgtc tcaaatatat atatatttat atatatatat tttatattta atatatataa 60
tatatattat atataaattt attatatata atatatatta tatataaatt tattatatat 120
aatatatatt atatatatta tatgttatat atatttatta catataatat ataatatata 180
tttattatat ataatatata tttattatat attatatatt atatatttta tattttatat 240
atattatata attttatatt ttatatatat tatataatta atatttaata tatattatat 300
atatatatat aatatatatt tattatatat aatatatatt tattatatat tatatattat 360
atatttatat tttatatata ttatatattt atattttata tatattatat atttatattt 420
tatatatatt atatataata tatatattat atattttata tataatatat atttattata 480
catattttat attatatata atatatattt attatatatt tttatatata ttatatataa 540
tatatatata tttatatata tatattttat atttaatata tataatatat attatatata 600
aatttattat atataatata tattatatat aaatttatta tatataatat atattatata 660
tattatatgt tatatatatt tattacatat aatatataat atatatttat tatatataat 720
atatatttat tatatattat atattatata tttatatttt atatatatta tatatttata 780
ttttatatat attatatatt tatattttat atatattata tataatatat atattatatc 840
ttttatatat aatatatatt tattatacat attttatatt atatataata tatatattat 900
atatatatat atatatatat ttatatatat atatatttat atattttata tatatataat 960
atatattaat tatatataat atatatatta tatatatatt atatataata cgtaatatat 1020
atttattata tatattttgt atatattata tattatatat ttattatata tattttatat 1080
atattatgta tattttatat acaatacata atatatattt tatatacaat atataatata 1140
tattttatat acaatatata atatatattt tatataatat atttttatat aatatatatt 1200
ttatattata tataatatat attttatata ttatatataa tatatatttt atattatata 1260
taatatatat tttatactat atataatata tattttatac attatataat atatatttta 1320
tactatatat aatatatatt ttatacatta tataatatat attttatata ttatataata 1380
tatattttat gttatataat atatatttta tgtattatat aacatatatt ttatgtatta 1440
tataacgtat attttatata ttatgtaacg tatattttat atattatgta acgtatattt 1500
tatatattat gtaacgtata ttttatatat tatgtaatat atattttata tattatatat 1560
tttgtatatt atatattttg tatatgatat attatatatt ttatatatta tatattatat 1620
attttgtata ttatatatta tatattttat atataatata tcatatatat tttatatata 1680
tataaagcat cagtaaacaa 1700
<210> 14
<211> 177
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 14
taacatggtg aaatatcatc tctactaaaa atacaaaaaa ttagccaggc gtggtggcgg 60
gcgcctgtgg tcccagctac ttgggaggct gagggaggag aatggcgtga acccaggagg 120
catagcttgc agtgagccga gattgcacca ctgcactcca gcctgggcaa cagagca 177
<210> 15
<211> 249
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 15
ctctagagcc aggcaccgtg actcactcct gtgatcccag cttttcgaaa ggctgaggca 60
ggaggatcgc ttgaggccag gagttcaaga ccagccttgg caacatagtg agactctccc 120
gtctctaaaa caacaacaac aaaaggttaa ttaaaaatta aaagaaaaga aaactccaca 180
gccaccttct ccaggaaaat aagtcccaaa gccacttgcc actgatgcag aggtgcgcag 240
agcccgagg 249
<210> 16
<211> 5274
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 16
gacagatggg attattcatt tttataaaat atttaaccca acaaatccaa aatatcattt 60
cagcatgtaa ataatacaga tggtccccaa tttaaccatg gttccattaa aggatttttt 120
ttgactttaa taatggattt atcagaatat aacctcatca taagttgagg aacatctgta 180
taaaaatata ttaatgagat accctacatt cattatcctt tgtataccaa gtcttaccat 240
gtggattttg cacttcccac acatctcaat atggaccagc catatcacgt gccccctgcc 300
agatgcatct agtggctttc acatcggaca gctccacact agaatgacag taaggcacag 360
aaccagacag tccccccgct tccagctcct gatcaaccac ttgtagccat gggagctttg 420
gagactgcct taatagttat gaatctaagc taggtgtcat ggctcacacc tgtaatccca 480
actctttggg acgccaagat ggatggatag cttgaggctt tttttttttt tttttttttt 540
tttagacaag agtctcgctc tgttgccagg ctggagtgca gtggcacgat cttggctcac 600
tgcaacctcc gcctcccagg ttcaagggat tctcctgcct cagcctcccc ctgagtagct 660
gagactacag gtgcgcacca ccacgcccag ctaatttttg tatttttagt agagacagag 720
tttcaccatg ttggccagaa tggtctcgat cacttgacct catgatccac ccacctcagc 780
ctcacaaagt gctgggatta caggcgtgag ccaccgcgcc cggccagctt gacgcttgag 840
tccaggaatt caagaccagc ctgggcaaca tggtcgaaac cctgtctcta ctgaaaaaaa 900
aaaaaaaaaa ttatccgggc atggtgacac acgcctacag tcccagctac cccagaggct 960
gaggtgggag gatcattgaa cccctaaaag tcaaggctga agtgatccaa gattgcatca 1020
ctgaactcca gtctgggtga tgggagtgag accctgtctc aaaaaaaaaa aaaaatagaa 1080
aagctctgaa tctatgggtt ctagccctgg gaaattctgg ataacatgga gttaacagtt 1140
cacctgcctc aggtgagata atgtaaaact agaaaggtcc ataccattgt gatgtctaat 1200
tgaatctatt tatcaaaaca gtacccaaat gcagtatgtt cagaaacctt atactgttag 1260
gtaataataa ccataaacaa gataaaaaat atgggctggg tgtggtggct cccactgtta 1320
tcctagcatt ttgggaggcg aaggcaggag gatcacttga ggctgggagt ttgagaacaa 1380
cctgggcaac atagcaagac cccatctcta taaaaaaaca tataaatata atataaagat 1440
atatatattt tatatatata catatatttg tacctgttaa cgtggggtga ggggtgcagg 1500
gagggtggaa aggagaaagt cataatatta agcatcagta ggccgggcgc agtggctcat 1560
gcctgtaatc ccagcacttt gggaggctga ggcgggcaga tcacaaggtc aggagattga 1620
gatcatcctg gctaacatgg tgaaatatca tctctactaa aaatacaaaa aattagccag 1680
gcgtggtggc gggcgcctgt ggtcccagct acttgggagg ctgagggagg agaatggcgt 1740
gaacccagga ggcatagctt gcagtgagcc gagattgcac cactgcactc cagcctgggc 1800
aacagagcaa gactctgtct caaatatata tatatttata tatatatatt ttatatttaa 1860
tatatataat atatattata tataaattta ttatatataa tatatattat atataaattt 1920
attatatata atatatatta tatatattat atgttatata tatttattac atataatata 1980
taatatatat ttattatata taatatatat ttattatata ttatatatta tatattttat 2040
attttatata tattatataa ttttatattt tatatatatt atataattaa tatttaatat 2100
atattatata tatatatata atatatattt attatatata atatatattt attatatatt 2160
atatattata tatttatatt ttatatatat tatatattta tattttatat atattatata 2220
tttatatttt atatatatta tatataatat atatattata tattttatat ataatatata 2280
tttattatac atattttata ttatatataa tatatattta ttatatattt ttatatatat 2340
tatatataat atatatatat ttatatatat atattttata tttaatatat ataatatata 2400
ttatatataa atttattata tataatatat attatatata aatttattat atataatata 2460
tattatatat attatatgtt atatatattt attacatata atatataata tatatttatt 2520
atatataata tatatttatt atatattata tattatatat ttatatttta tatatattat 2580
atatttatat tttatatata ttatatattt atattttata tatattatat ataatatata 2640
tattatatct tttatatata atatatattt attatacata ttttatatta tatataatat 2700
atatattata tatatatata tatatatatt tatatatata tatatttata tattttatat 2760
atatataata tatattaatt atatataata tatatattat atatatatta tatataatac 2820
gtaatatata tttattatat atattttgta tatattatat attatatatt tattatatat 2880
attttatata tattatgtat attttatata caatacataa tatatatttt atatacaata 2940
tataatatat attttatata caatatataa tatatatttt atataatata tttttatata 3000
atatatattt tatattatat ataatatata ttttatatat tatatataat atatatttta 3060
tattatatat aatatatatt ttatactata tataatatat attttataca ttatataata 3120
tatattttat actatatata atatatattt tatacattat ataatatata ttttatatat 3180
tatataatat atattttatg ttatataata tatattttat gtattatata acatatattt 3240
tatgtattat ataacgtata ttttatatat tatgtaacgt atattttata tattatgtaa 3300
cgtatatttt atatattatg taacgtatat tttatatatt atgtaatata tattttatat 3360
attatatatt ttgtatatta tatattttgt atatgatata ttatatattt tatatattat 3420
atattatata ttttgtatat tatatattat atattttata tataatatat catatatatt 3480
ttatatatat ataaagcatc agtaaacaac tctagagcca ggcaccgtga ctcactcctg 3540
tgatcccagc ttttcgaaag gctgaggcag gaggatcgct tgaggccagg agttcaagac 3600
cagccttggc aacatagtga gactctcccg tctctaaaac aacaacaaca aaaggttaat 3660
taaaaattaa aagaaaagaa aactccacag ccaccttctc caggaaaata agtcccaaag 3720
ccacttgcca ctgatgcaga ggtgcgcaga gcccgaggaa cacggagtca tagcagctct 3780
gcaaattgat tttattccag gctaaaagat gctatttctc aaaaaaagga gctgggagcg 3840
tctctgttca tgaattcatt tttcaggggt ggggtgattt caagagtcca ggctgtttcc 3900
tgaccatgca cactgttccg gcctggaagc ctcagacccc agccaggctg accacgagcc 3960
agacccggag taagcttcgt cccatgcttc ctgtcggtcc gggcagcctg agtttcctgg 4020
tgacccttcc ctgcacccag ccaattcaaa ggtctggcaa ggcctggtgc cagccaagaa 4080
aatctgaggc agccaggttt gttatttcaa atctctaaac cttcagacct ctgtgcttgg 4140
cttacatatg tgaaagttaa aacaaggatg tgtgtcgcag tggtgattat aattcaagta 4200
agcaaagatc cctgcatgac cagccttcga atgtcagccc atgctgaagt taacacattt 4260
aactcataga acaaaatagt taaaatgagg agtggatgca aaatggtact gccattctag 4320
aaaacagttg gcagtttctt ataaagttaa acgtacgctt accacaagac ccagcaatca 4380
ccctcccaga gaaatgaaaa tttatgttca tataaaatat tgtacacaaa taattataac 4440
agctttattt gtaatagtca tgtatcaatc aggattctcc aaggaaacag gaccaataga 4500
agagagatat atacataata aatcatatat ataaatgata tatataagaa gttatatata 4560
tatacacaaa cacatacata tattgtgata acctaccttg ttttaacctg agtgactctc 4620
tcctagcaga gagagccaga cagactccat tttagtttct tcattcacag ccccctttat 4680
cccccttaag ggaataacta gtgcaagctg actctaagca catccagtaa tgcacctgct 4740
gataagatat tgaggcaggc tgtaccagca gctcctggga atgtgctcgg tggaaggtat 4800
ctaaaagccc ctgcatttat ctcttagtga tagtttaagc ccctgcacct ggaactgttt 4860
atcttttaca actgcttcta taaccaatta attttttaac tttttgcctg ttctgcttct 4920
gtaaaactgc ttcagttaaa ctccccctcc cctatttaga ccatagtata aaagagaatc 4980
tagccccttc ttcggggctg agagaatttt gagtgctagc tgtctctcag tcgccggcta 5040
ataaaggact ccataatttg tctcaaagtg tggcgtttct ctataactcg cttggttaca 5100
acactatctc tcagggatct ccaaagaaat agaacctata ggatatatct atctataata 5160
aatcattgcc aggcatggtg gctcacccag tactttggga ggccaagtca ggaggatcac 5220
ttgagcccag gagtttgagg ccacctgagc aacatagtga gaccctgtct ctac 5274
<210> 17
<211> 965
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
ccagctactc gggaggctga ggcaggagaa cggcttgaac ccaggaggtg gaggttgcag 60
tgagctgaga tcgcgccact gcactccagc ctgggcgaca gagcgagact ctgtctcaaa 120
aaaaaaatat atatatatat atatatacac atatatatat aaaatatata tatatacaca 180
catatatata taaaatatat atatatacac acatatatat aaaatatata tatatacaca 240
catatatata aaatatatat atacacacat atatataaaa tatatatata cacacatata 300
tataaaatat atatatacac acatatatat aaaatatata tatacacaca tatatataaa 360
atatatatat acacacatat atataaaata tatatataca cacatatata taaaatatat 420
atatacacac atatatataa aatatatata tacacacata tatataaaat atatatatac 480
acacatatat ataaaatata tatatacaca catatataaa atatatatat acacacatat 540
ataaaatata tatatacaca tatatataaa atatatatat acacatatat ataaaatata 600
tatacacaca tatatataaa atatatatat acacacatat atataaaata tatatataca 660
catatatata aaatatatat atacacatat atataaaata tatatatata cacatatata 720
taaaatatat atacacacat atatataaag tatatatata cacacatata tataaaatat 780
atatatacac atatatataa aatatatata tacacatata tataaaatat atatatacac 840
atatatataa aaatatatat atatattttt taaaatattc caattgtctc actttgtgga 900
tgagaaaaag aagtagttag aggtcaagta acttggccta catcttttct caagattgta 960
aactc 965
<210> 18
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
ctgtgctccc ttaacatcct attttatctg tatatatata tattcttcca aatatccatg 60
ggaaaaaaaa tctgatcata aaaatatttt aggctgggag tggtggctca cgcctgtaat 120
cccagcactt tgggaggctg aggtgggcgg atcatgaggt caagagatcg agaccatcct 180
gaccaatatg gtgaaacccc atctctacta aagatacaaa actattagct ggacgtggtg 240
gcacgtgcct gtagtc 256
<210> 19
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
ctagtgagca ataaccacat cttcattttc tttgtataaa acaagaaagt ttagcatgaa 60
aaaggtactc aattacaaat gtgttggatt gaattgaaga cccttggaag gggattttgt 120
acctgaggat ctctttcttt tggccatatt gttcaatgga caaaatttag ccttcgaagg 180
caggccgatt tgaggttaat actaccttta ccacttgata gctatgtgac cttggccatg 240
<210> 20
<211> 3612
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
gactctagat tataccaacc tcataaaata agagcatata taaaagcaaa tgctcttatc 60
ttgcagatcc ctgaactgag gaggcaagat cagtttggca gttgaagcag ctggaatctg 120
caattcagag aatctaagaa aagacaaccc tgaagagaga gacccagaaa cctagcagga 180
gtttctccaa acattcaagg ctgagggata aatgttacat gcacagggtg agcctccaga 240
ggcttgtcca ttagcaactg ctacagtttc attatctcag ggatcacaga ttgtgctacc 300
tattgcctac catctgaaaa cagttgcttc ctatatttca tccagtttaa tatttattta 360
aaccaagaag gttaatctgg caccagctat tccgttgtga gtggatgtga aagtaccaat 420
tccattctgt tttactatta actatccttt gccttaatat gtatcagtag gtggcttgtt 480
gctaggaaat attaaatgaa tggcatgttt cataggttgt gtttaaagtt gttttttgag 540
ttaaatcttt ctttaataat actttctgat gtcaaaaaca cttagaagtc atggtgttga 600
acatctatat agggttggat ctaaaatagc ttcttaacct ttcctaacca ctgtttttgt 660
ttgtttgttt ttaactaagc atccagtttg ggaaattctg aattagggga atcataaaag 720
gtttcatttt agctgggcca cataaggaaa gtaagatatc aaattgtaaa aatcgttaag 780
aacttctatc ccatctgaag tgtgggttag gtgcctcttc tctgtgctcc cttaacatcc 840
tattttatct gtatatatat atattcttcc aaatatccat gggaaaaaaa atctgatcat 900
aaaaatattt taggctggga gtggtggctc acgcctgtaa tcccagcact ttgggaggct 960
gaggtgggcg gatcatgagg tcaagagatc gagaccatcc tgaccaatat ggtgaaaccc 1020
catctctact aaagatacaa aactattagc tggacgtggt ggcacgtgcc tgtagtccca 1080
gctactcggg aggctgaggc aggagaacgg cttgaaccca ggaggtggag gttgcagtga 1140
gctgagatcg cgccactgca ctccagcctg ggcgacagag cgagactctg tctcaaaaaa 1200
aaaatatata tatatatata tatacacata tatatataaa atatatatat atacacacat 1260
atatatataa aatatatata tatacacaca tatatataaa atatatatat atacacacat 1320
atatataaaa tatatatata cacacatata tataaaatat atatatacac acatatatat 1380
aaaatatata tatacacaca tatatataaa atatatatat acacacatat atataaaata 1440
tatatataca cacatatata taaaatatat atatacacac atatatataa aatatatata 1500
tacacacata tatataaaat atatatatac acacatatat ataaaatata tatatacaca 1560
catatatata aaatatatat atacacacat atataaaata tatatataca cacatatata 1620
aaatatatat atacacatat atataaaata tatatataca catatatata aaatatatat 1680
acacacatat atataaaata tatatataca cacatatata taaaatatat atatacacat 1740
atatataaaa tatatatata cacatatata taaaatatat atatatacac atatatataa 1800
aatatatata cacacatata tataaagtat atatatacac acatatatat aaaatatata 1860
tatacacata tatataaaat atatatatac acatatatat aaaatatata tatacacata 1920
tatataaaaa tatatatata tattttttaa aatattccaa ttgtctcact ttgtggatga 1980
gaaaaagaag tagttagagg tcaagtaact tggcctacat cttttctcaa gattgtaaac 2040
tcctagtgag caataaccac atcttcattt tctttgtata aaacaagaaa gtttagcatg 2100
aaaaaggtac tcaattacaa atgtgttgga ttgaattgaa gacccttgga aggggatttt 2160
gtacctgagg atctctttct tttggccata ttgttcaatg gacaaaattt agccttcgaa 2220
ggcaggccga tttgaggtta atactacctt taccacttga tagctatgtg accttggcca 2280
tgtggtttca acagtctgaa cctcattttc tctgtgtatg tgtggtcctc cttacaagtt 2340
tgtgaaaaat gtgaagtcct tagccatgat agcccaatat aacaggctaa atgataatag 2400
gtttatgttc ttttccttta tattctcaga taagcactgt ccaagtttga ggtgttttga 2460
ggtctcgcct gatttggatt gtttgagttt atgctattct ttgaattctt tgagctgttc 2520
tgaagcagtg tatcatgaac aaaaacatcc ccagttcagt ccaaacccct ggttacatat 2580
cattcttatg ccatgttata accagtttga gagtgttccc tctgttattg catttaagtt 2640
tcagcctcac acagaaattc agcagccaat ttctaagccc taagcataaa atctggggtg 2700
gggggggggg atggcctgaa gagcagcatt atgaatagca ccattataat taatgatctc 2760
tcaggaagat ttacaatcac aggtagcaga taaaacaaat agtactgctt ctgcacttcc 2820
cctcctttta ttcgctatga aattttatgg gaaatcagtc cagtgaaaaa tgtaagctct 2880
taatctttcc cagaaatcct acctcatttg atgaatactt tgagggaatg aattagagca 2940
tttttttctt ttatagtcta cttcgcattt acgaagtgag gacggtagct taggctgcct 3000
ggccaactga tgagaaggtc agaggcattt ttagagacct ctgttgtctt tcattcatgt 3060
tcattttcca caaggcaagt aatttccaac aaatcagtgt cttcattagt aataagatta 3120
ttaacaacaa taatagtcat agtaactatt cagtgagagt ccattatata tcaggcattc 3180
tacaaggtac tttatataca tctgagtaaa cctcacacaa ttctacaggg aggtatttct 3240
atccccattt aacaaataag gaaacgaagt ccaagtaaat taacttgccc aaggtcacac 3300
agatagtacc tggcagaaca ggaatttaaa cctaaatttg tccaactcca aaagcagcct 3360
tctatttgtt ataaatgctg cctctcatta tcacatattt tattattaac aacaacaaac 3420
ataccaatta gcttaagata caatacaacc agataatcat gatgacaaca gtaattgtta 3480
tactattata ataaaataga tgttttgtat gttactataa tcttgaattt gaatagaaat 3540
ttgcatttct gaaagcatgt tcctgtcatc taatatgatt ctgtatctat taaaatagta 3600
ctacatctag ag 3612
<210> 21
<211> 599
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
atatgtatat atgtatatat gtatatatgt atatatgtat atatgtatat atgtatatat 60
gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atatatgtat 120
atatgtatat atgtatatat gtatatatgt atatatgtat atatgtatat atgtatatat 180
gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atatatgtat 240
atatgtatat atgtatatac gtatatatgc atatacgtat atatgtatat atgtatatat 300
gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atgtatgtat 360
gtatgtatgt atatatgtat atatgtatgt atgtatgtat gtatgtatgt atgtatatat 420
gtatatatat atgtatgtat gtatgtatgt atgtatgtat atgtgtatat gtgtatatgt 480
gtatatgtgt atatgtgtat atatgtatat atgtatatat gtatatatgt atatgtgtat 540
atgtgtatat gtgtatatat gtatatatgt atatatgtat atatgtatat atataacat 599
<210> 22
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
gctctttcct ttagttaagc ttatgaaata gtgtttctct catgtttcct ctatattctc 60
tcttttgcct tcctgtttct tcctgttgat tccatcccat tggagtgaaa tcttatgatc 120
ttttggcatc aacaaagtga tctgcatcca aataattcca catctcattc catgttgact 180
gtggatctat atatatatat atgta 205
<210> 23
<211> 352
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
agtattaaat tatatataca tatataagtg aaatgtcaca atcttctaga acttgctctg 60
tatgtccact taacatggta gagtgagcta tgtcagcatt ttctatttcc tgtgaatcat 120
tctgtgtgtt gccaagaaga aatatgatat attctgaggt tatgaaatga tattttggtc 180
atcatgtttc tcatcctatt ttcatattac ctaaatactt ttgcttttaa aattattatt 240
attaataata atataattat ttatacaata atatttaaat aatatattta tttaatataa 300
ttattatatt tcacataaaa gcaatagttc cagtgttaca aattgtaggc aa 352
<210> 24
<211> 5460
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60
agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120
tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180
aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240
cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300
cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360
ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420
tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480
agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540
gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600
ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660
ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720
ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780
agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840
tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900
ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960
ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020
ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080
tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140
ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200
aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260
ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320
gctctttcct ttagttaagc ttatgaaata gtgtttctct catgtttcct ctatattctc 1380
tcttttgcct tcctgtttct tcctgttgat tccatcccat tggagtgaaa tcttatgatc 1440
ttttggcatc aacaaagtga tctgcatcca aataattcca catctcattc catgttgact 1500
gtggatctat atatatatat atgtaatatg tatatatgta tatatgtata tatgtatata 1560
tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1620
tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata 1680
tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1740
tatatgtata tatgtatata tgtatatatg tatatatgta tatacgtata tatgcatata 1800
cgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1860
tatatgtata tatgtatgta tgtatgtatg tatgtatata tgtatatatg tatgtatgta 1920
tgtatgtatg tatgtatgta tatatgtata tatatatgta tgtatgtatg tatgtatgta 1980
tgtatatgtg tatatgtgta tatgtgtata tgtgtatatg tgtatatatg tatatatgta 2040
tatatgtata tatgtatatg tgtatatgtg tatatgtgta tatatgtata tatgtatata 2100
tgtatatatg tatatatata acatagtatt aaattatata tacatatata agtgaaatgt 2160
cacaatcttc tagaacttgc tctgtatgtc cacttaacat ggtagagtga gctatgtcag 2220
cattttctat ttcctgtgaa tcattctgtg tgttgccaag aagaaatatg atatattctg 2280
aggttatgaa atgatatttt ggtcatcatg tttctcatcc tattttcata ttacctaaat 2340
acttttgctt ttaaaattat tattattaat aataatataa ttatttatac aataatattt 2400
aaataatata tttatttaat ataattatta tatttcacat aaaagcaata gttccagtgt 2460
tacaaattgt aggcaatggg ctgttctgat tatctaagtt gggcccagga tatgtgctga 2520
atagttaaag cacatgccca gcatgtatga gggtaaaagg atgggtggat gtagtgaccc 2580
atttgtaatt taagccttag caggcagagg tgtgacccat agtgcaaagt acatagtcat 2640
tataaggtca tctatatcac aatctctgga ttagattgat tgaacctgct cagtgaccaa 2700
tgtgttagca atatacagga ggatgataac atcaacgtca gaagacacat tgaagggctt 2760
acaaatagtg cccatttact ttaatacaga aaaattcaat gtaccctcta ggcaatttca 2820
acttttagtc tcttggtagg atagtctaca tttagaatgg ctaattcata aattagaaag 2880
cttcttcacc ccctactttt ctggttattt ctctatgaat gtggtaggca tgagttagta 2940
cacatgtttc catgtacatg tgtttctatg tgtctgcatg catatggtag aatgtactca 3000
tattctatgt acagttagaa caatatttat attgtcaaag aaatcaaaag gagtattata 3060
agcttcagaa ataaggataa gtttgaaata ttcattgttt tattttttac agtatttttt 3120
cctttgagaa ttctatgtaa agtactttga acatatttgc cttcaactcc tccctcactt 3180
tcaccctctc ttcattcctc cctttccttt ccactcaaag ttgagattcc tttatttatt 3240
tatttatcct tcaaatatca ctggtactat ccacatgatc tcaggattga ggtctgctct 3300
gacgtgtcat cctgctttca tgcaatggcc ttataggtgg aacaacatta tgaactaacc 3360
agtaccccgg agctcttgac tctagctgca tatatatcaa aagatggcct agtcggccat 3420
cactggaaag agaggctcat tggacttgca aactttatat gccccagtac aggggaacac 3480
cagggccaaa aagggggagt gggtgggcag gggagtgggg gtgggtggat atgggggact 3540
tttggtatag cattggaaat gtaaatgagt taaataccta ataaaaaatg gaaaaaaaaa 3600
gtttctaatg tgtgtttcta gaaacttcct ctcttaaagc aacaacatgt ccatgagcaa 3660
tatagaattg aagatcacca tcaaatcctc tttattcctc attgtttcca tcatgtacta 3720
ccagacctct ttaaagtgta gtacagtgtg ttaggaaatg agcagattat cctgggtatg 3780
tgctaaatta gctactgagt caaaatacat tttttgctga acattaagtg tttggtcatt 3840
tctgggcaaa agaaagaaag aaagaaagaa aagaaagaaa gaaaggaagg aaggaaggaa 3900
ggaaggaagg aaggaaggaa agaaggaagg aaagaaaaaa tggatgtaaa ttgttctgac 3960
agcatctgtc tgagtcaggc agtggaatga aggaggaatc ctagagaatg cacaggaaag 4020
cagcccaagg agagtgtggg ctgaaaggca tcatgttaga aacatgcact cgatgacaga 4080
accttgagaa aaaggaactc aagcaaaagc acttatttaa aattgtaaaa cgcactttat 4140
tcatagccat gggggatgtc aatattccaa gcataagaat gatcagtttc caatcactgt 4200
gaacccccaa aacacaaagt gaaaacccac tactttattt gatgagattt ggggttgctc 4260
tattaattta taaaatcaga gtaagacacg atataaatga aacgattgta gttctaaagc 4320
agcggcactt ccctgaacag tgtcattttg acaagtaact gctaacatct tcaggtcaca 4380
gcgactgaag aaaaagtagg gaaagaaggc tggctgtgct gtttgacatt ttcttttctt 4440
atctggtgac atgaagagaa gctctgggtc cccctactct tgttcatata tctgttgctt 4500
ttatgctgca tcctgaggtt tgaagaaatg catttggcac tgagaaaaga tgaggagaga 4560
atgccttgga catggtccta acatgctttg gtactgagaa aagagagcag aggagatgac 4620
atagaatagg agagataatt tggcctattt tggccttcat ctgagtgata gattttactt 4680
aacaaataga aacaaagttt tacttataaa cagaaccaat gacctgtgtc atctctgata 4740
tattgagctt tgaattcagt gaaattatga actaaatata tcactccata attttctaag 4800
agggctattt gtatagtttc agtgatagtg tgacaaagtg taatctaaat ttctaaaaag 4860
taaaataagt agataaaata gtaggtagaa tagtataata atagaataag tataggtatg 4920
gactagaata aatagacaaa atagtagata aaatgctaat gattttgttg acagggtaat 4980
catgaatatt tttattattt agctaaagaa ccaatgttca tgtactcaag aagtgtattg 5040
aggaacttag gaaattagtc tgaacaggtg agagggtgcg ccagagaacc tgacagcttc 5100
tggaacaggc ggaagcacag aggcactgag gcagcaccct gtgtgggccg gggacagccg 5160
gccaccttcc ggaccggagg acaggtgccc gcccggctgg ggaggcgacc taagccacag 5220
cagcagcggt cgccatcttg gtccgggacc cgccgaactt aggaaattag tctgaacagg 5280
tgagagggtg cgccagagaa cctgacagct tctggaacag gcagaagcac agaggcgctg 5340
aggcagcacc ctgtgtgggc cggggacagc cggccacctt ccggaccgga ggacaggtgc 5400
ccacccggct ggggaggcgg cctaagccac agcagcagcg gtcgccatct tggtcccggg 5460
<210> 25
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
taggcaacag agtgagatca tgtgtcatat atatatatat atatatatat atatatatat 60
atatatacac acacacacac atatatatat acacatatat atacgtatat atatatatgt 120
atatatatac atatatatac atatatatat atacgtatat atatacgtat atatatatca 180
atgtaaatta tttgggaaat ttggtatgaa tagtcttccc 220
<210> 26
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
aaatacaaaa attagccagg tgtggtggca tgtgcctgta gtcctaccta ctcgggaggc 60
tgaggcacaa gaatcgcttg aatgtgggag gtggaggttg cagtgacctg agatcgtgcc 120
actgcactcc agcc 134
<210> 27
<211> 246
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
tgtgaacaca gatcataaaa tcatatatca agcagacaaa taagtagtag tcacttatat 60
gcttatactt gtaacttaaa gtaaaagaat tacaaaagca tatgacaaag actaatttta 120
agatatccta atttaaattg ttttctaaaa gtgtgtatac cattttacct atcatatgaa 180
taatttagaa acatgtttat aaaattaatg tccaaatcca ttcaaaagtt ttgtaatgca 240
gatcac 246
<210> 28
<211> 3361
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
agcgccgaat tcgatccctt tataaaacca caatataatg gagtgctata atttcaaaca 60
gtgtttggtc tgctggcaga gtggtcattc taacagcagt cacagtagag tagaaataag 120
actgcagtat atctaaggca aaaagctgag gtttcaggag cttgaaggta aagaggaaga 180
aagaaatggg aatgggaatt ggaaagacaa atatcgttaa gagaaaattg cttttaggag 240
aggggaaaga atctatgtgt acttaagact atggaatcaa tcccatttaa gctgggaaac 300
tagtttcata tataactaat aaattttatt tacagaatat ctatttacct gatctaggct 360
tcaagccaaa gggactgtgt gaaaaaccat cagttctgtc atattcctaa aaaaaaatta 420
aaaagttaaa aataaataaa taataaaact tcttttcttt caaaataatc aaggtgctta 480
ttcacatcca ttccaatttg gggaaatact tattttccta tgattagcga agagaaaagt 540
aacttgcatt tcaattcaag ttgatacatg tcacttttaa gaggtcaact aatatttgct 600
agttgagcta accatatagg ctttaaatac tttcatagta gaaagaaaat gaaaatcatt 660
agtgaactgt ataaaataga tcatactttt tgaaagaatc agactgaagt ttccgaaaaa 720
aagaagtaag cttcaatgaa aaggtaagtg aatttagcat ttactcagca tctactatgg 780
acttaacacc taacagtaga taatctgaag gcaaacatat ttgtataggg actgcagaat 840
gatagatgat aaatatcatc tcttctattt gaatgaatat tttttcaaat ctttcacaca 900
cagtggtttg ctatggaaag atttgtagta cattaaacaa atctgaagat ggagttagaa 960
agcttaggct atgttttgag cacaacatat aatttctctg tgattgtttc ttcatctttc 1020
aaatgaggtt actgtgaaga ttaaatgaga taactaaatg atgataaaat aatgtaatct 1080
tagcagcacc ttatttaatc tgtgcaacaa ctctgtgaag tgagtagggc tcagcttcag 1140
tcacttctct gccatttatt aactaagata gtttggaaag ttacccatct cttcagctgt 1200
aaaatgatga ggatcatacc tattttatgg ggctgctttt aggtacaaat atacaggcaa 1260
gcactttgtt aatactaaag cattacacca attagtttta ctcttttcca ttcacacatg 1320
aaattaatgt aatcagaatt ctgtagatta cctaaatctt ctgttaacac gtgatatgca 1380
gttcaggtta aatgtcagtt gagttaccaa agcacataca tactcaccac cctatccaaa 1440
tctacaagcc tcccagtttg tcttcactat tttggttaaa ttaatatgaa ttcctagatg 1500
aaaatttcac tgatccaaat gaaataaaaa atatattaca aaactcacac ctgtaatctc 1560
aacattttgg gaggccaagg caggtagatc acttgaggcc aggagttcaa gaccagcctg 1620
atcaacatgg tgaaaccctg tctctactaa aatacaaaaa ttagccaggt gtggtggcat 1680
gtgcctgtag tcctacctac tcgggaggct gaggcacaag aatcgcttga atgtgggagg 1740
tggaggttgc agtgacctga gatcgtgcca ctgcactcca gcctaggcaa cagagtgaga 1800
tcatgtgtca tatatatata tatatatata tatatatata tatatatata cacacacaca 1860
cacatatata tatacacata tatatacgta tatatatata tgtatatata tacatatata 1920
tacatatata tatatacgta tatatatacg tatatatata tcaatgtaaa ttatttggga 1980
aatttggtat gaatagtctt ccctgtgaac acagatcata aaatcatata tcaagcagac 2040
aaataagtag tagtcactta tatgcttata cttgtaactt aaagtaaaag aattacaaaa 2100
gcatatgaca aagactaatt ttaagatatc ctaatttaaa ttgttttcta aaagtgtgta 2160
taccatttta cctatcatat gaataattta gaaacatgtt tataaaatta atgtccaaat 2220
ccattcaaaa gttttgtaat gcagatcacc cacaacaaca aagaatccta gcctattaaa 2280
aaagcaacac cacctacata taatgaaata ttagcagcat ctatgtaacc aaagttacac 2340
agtgaatttg ggccatccaa cactttgagc aaagtgttga attcatcaaa tgaatgtgta 2400
atcatttact tactaatgcc aatacacttt aaggtaatct taagtagaag agatagagtt 2460
tagaattttt taaatttatc tcttgttgta aagcaataga cttgaataaa taaattagaa 2520
gaatcagtca ttcaagccac cagagtattt gatcgagatt tcacaaactc taactttctg 2580
atacccattc tcccaaaaac gtgtaacctc ctgtcgatag gaacaaccca ctgcagggat 2640
gtttctcgtg gaaaaaggaa atttcttttg cattggtttc agacctaact ggttacaaga 2700
aaaaccaaag gccattgcac aatgctgaag tacttttttc aaatttaaaa tttgaaagtt 2760
gttcttaaaa tctatcattt attttaaaat acggatgaat gagaaagcat agatttgata 2820
aagtgaattc ttttctgcaa tctacagaca cttccaaaaa tcactacaga cactacagac 2880
actacagaaa atcataaata aacaagtgct agtatcaata tttttaccaa aaaatggcat 2940
tcttagaatt ttttataggc tagaaggttt gtacaaacta atctgccacg gattttaaaa 3000
tatgagtgaa taaattatat tgcaaaaaaa atcaggttac agagaactgg caaggaagac 3060
tcttatgtaa aacacagaaa acatacaaaa cgtattttta agacaaataa aaacagaact 3120
tgtacctcag atgatactgg agattgtgtt gacatattag cattatcact gtcttgctaa 3180
aacataaaaa taaaaagatg gaagatgaaa ttacaataca aatgatgatt taaacatata 3240
aaaggaaaat aaaaattgtt ctgaccaact actaaaggaa gacctactaa agatatgcca 3300
tccagcacat tgccactcta catgtggtct gtaaaccagc agcataggcg gccgcattag 3360
c 3361
<210> 29
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
attcaacagc tgaatcctaa attgcaaact cagtggctaa taacaacttt gaacaatgag 60
caccttatac acgctactgt attttctttt ctttcttttt tttttttttt ttttttttta 120
aaccgggtag cagtgagaga ggt 143
<210> 30
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
tgtagtcatt ttgcaatcct taaagctgaa ttgtgcaatg agctcgatga aggaagatac 60
tatc 64
<210> 31
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
ttctttaagt gccttggggc gaggagtccg gaataagaag acttctttgg gttttaaagt 60
gtaggataag caa 73
<210> 32
<211> 1697
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
agccctgccc ccatccgacc tccgccctcg ttggcttcgc aacgctgtgg tctctgtggc 60
cagtagaggg cacacttact ttactttcac aaatccgaga gccacaaccc gggtggtggg 120
gggtgagggg gcggggaaag agtctctgca gcaaaacgca gactagggat tggtggctct 180
tggtgtttga ggcaaaatcc tagaggctgt agtcattttg caatccttaa agctgaattg 240
tgcaatgagc tcgatgaagg aagatactat cattcaacag ctgaatccta aattgcaaac 300
tcagtggcta ataacaactt tgaacaatga gcaccttata cacgctactg tattttcttt 360
tctttctttt tttttttttt tttttttttt aaaccgggta gcagtgagag aggtttcttt 420
aagtgccttg gggcgaggag tccggaataa gaagacttct ttgggtttta aagtgtagga 480
taagcaaatc ccgagggaat atgcattata taataaatct agaaccaatg cacagagcaa 540
aagactcatg tttctggttg gttaataagc tagattatcg tgtatatata aagtgtgtat 600
gtatacgttt ggggattgta cagaatgcac agcgtagtat tcaggaaaaa ggaaactggg 660
aaattaatgt ataaattaaa atcagctttt aattagctta acacacacat acgaaggcaa 720
aaatgtaacg ttactttgat ctgatcaggg ccgacttttt tttttaagtg cataattacg 780
attccagtaa taaaagggga aagcttgggt ttgtcctggg aggaaggggt taacggtttt 840
ctttattcta gggtctctgc aggctcccca gatctgggtt ggcaattcac tcctccccct 900
ttctgggaag tccgggtttt ccccaacccc ccaattcatg gcatattctc gcgtctagcg 960
ccttgatttt ccccacccca gctcctaaac cagagtctgc tgcaaactgg ctccacaggg 1020
gcaaagagga tttgcctctt gtgaaaaccg actgtggccc tggaactgtg tggaggtgta 1080
tggggtgtag accggcagag actcctcccg gaggagccgg gtagagcgca cccgccgcca 1140
ctttactgga ctgcgcaggg agacctacag gggaaagagc cgcctccaca ccacccgccg 1200
ggtggaagtc cgaaccggag gtgctggagt gtgtgtgtgg gggggggggg gaatctgcct 1260
tttggcagca aattgggggg gggggtcgtt ctggaaagaa tgtgcccagt caacataact 1320
gtacgaccaa aggcaaaata cacaatgcct tccccgcgag atggagtggc tgtttatccc 1380
taagtggctc tccaagtata cgtggcagtg agttgctgag caattttaat aaaattccag 1440
acatcgtttt tcctgcatag acctcatctg cggttgatca ccctctatca ctccacacac 1500
tgagcggggg ctcctagata actcattcgt tcgtccttcc ccctttctaa attctgtttt 1560
ccccagcctt agagagacgc ctggccgccc gggacgtgcg tgacgcggtc cagggtacat 1620
ggcgtattgt gtggagcgag gcagctgttc cacctgcggt gactgatata cgcagggcaa 1680
gaacacagtt cagccga 1697
<210> 33
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
tcacagacac tacagaatgt tttggagatt atgtaatatt taaaatattc aaattatact 60
aaaaatgtat gtaaaatgta ttgaacatag gcaagtttca atacatagat tttgagtgaa 120
tgcttgcaac tttggttcca ttctct 146
<210> 34
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
tctgactctg cactctgcaa cctactctaa tattacatat gataacatga gtctatgcag 60
ctgttctcta tagatat 77
<210> 35
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
ctacttcctt aaggtggtgt ccaagagtac atttttataa ataaaaagtt atagtacact 60
cctaagggca gcaagtagaa aacgtgctag ggagactcga tctcactttg 110
<210> 36
<211> 2195
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
aagcttcctt ggaattaatg gtcagataag gagctctagc aatatcactt taaatgctta 60
atatacaata tttagaaaac cttatgattg taaagagctt aaaaaagatg tgaaagaaca 120
atcactaaag cattgacaac atatgtgtgt tagtgaacaa tatgtaccaa aatggacaga 180
tgagaggtgt acattggggt gtgagttgat aatccagcag actgtgggac tagagggtct 240
acgaaaaaca aaggaagaac atacaaacaa attttaaaac actgtctttc aacactaaaa 300
ctgttggaat agagagcaag aatacatatt ggattcacat tcagtttatt tctcagattc 360
agactagtgc tctgactctg cactctgcaa cctactctaa tattacatat gataacatga 420
gtctatgcag ctgttctcta tagatattca cagacactac agaatgtttt ggagattatg 480
taatatttaa aatattcaaa ttatactaaa aatgtatgta aaatgtattg aacataggca 540
agtttcaata catagatttt gagtgaatgc ttgcaacttt ggttccattc tctctacttc 600
cttaaggtgg tgtccaagag tacattttta taaataaaaa gttatagtac actcctaagg 660
gcagcaagta gaaaacgtgc tagggagact cgatctcact ttggaatcta tcctgggaga 720
caaatgcctc tacaaatgga ttagagaaga cagttttaaa gaggaagata atcaggtaaa 780
atctggggtt ttatgagaga aagaaagagg tagaagaaaa aatttcaagc tcgaacatcg 840
gatcaggtgg cacaatgcgg tcaatgcctg caaactcagg gtaagtatta ttctccctgt 900
ttacagttcc gtggaggaga agtgacttgc ctgtggtcat acaacagagc aaagaaaagg 960
cttgagctag aactcaggcc tttgttaggt ctccccttcc tcctagcaca ttggcaaatt 1020
gcatgaggaa agtagaggta cagttgagtt catgtacaac aataaggcat tcaggtaaag 1080
tgaatgaggg cagaagtttt atgatttagg gaaggtgtaa gacaggaaaa tatctttgtt 1140
cccaattaag aaagagatcc cttgaccatc agttagagat tcccccaagt ccctctttgc 1200
cataagtcac tgaaactgag atccaaggca tggcttctgt gagtcaggag agcttaaccc 1260
agaggagaga tttcagaaca ggatatttcc tattttgagt atcctgctca tgccagtcat 1320
ggataaattt gcatctggct taagaaatta ctggatcagc attgttttgg gtagtttcac 1380
ttcctgctgg gtggggtagc aggctctata aagagatcct ctgctgcacg actcttaaac 1440
ccctggtacc tgagcactga tctgccttgg agaacctggt gagtcggctt ccttgagttc 1500
ctctgttctt tgtgccctga aatgttgagt ttaatctgaa tatggcaagt ttggtggatc 1560
caatcctatg aaaattgact tgatgctact tagtggatga aaatttaaga ttagagcaca 1620
attatatgct attttagctt tcttttgtta tacaggtagg tatccatatg gacagagaag 1680
ttaaggggta acctttgata tgaagaagaa aaaagaacaa agtatttttc tttattctct 1740
tgctttctag tgtcctttac aaaggtttgt gtcttagcag gtgtgaaaga ctacaattct 1800
ccctgagcag ccctttgctc tatgcccaag tcagcccact tggactttat aacagataat 1860
gatgatagga atagcatatt agattgccca gggtgtctga acttgtgact gcctttcttg 1920
aattggttat tttcagggaa ataagatgct tgattcttta taacagagat aatttatttg 1980
gaaaaattgt atgagaaaac acaggatttc ctagggacaa tgaagcaatt tgttaaagtg 2040
gaagggagaa accagaaagt cttgaaaagg taattaagaa tttaaataat ttcttggaga 2100
ttggagaaat aatatgccat ggtattacac aagctttggc ttctctctct ggaggattcc 2160
cttcccacga acactgttgt atcatttctt tcaga 2195

Claims (15)

1.一种重组多核苷酸,其包含:编码序列;启动子,其被配置为启动所述编码序列的转录;以及基质附着区(MAR)核心,其选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少90%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
2.根据权利要求1所述的多核苷酸,其进一步包含5’侧翼区,所述5’侧翼区选自SEQ IDNO: 2、6、10和14和与SEQ ID NO: 2、6、10和14中的任何一个具有至少75%序列同一性的核酸序列。
3.根据权利要求2所述的多核苷酸,其中所述5’侧翼区位于MAR核心的5’侧,并距离所述MAR核心100个核苷酸之内。
4.根据权利要求1至3中的任一项所述的多核苷酸,其进一步包含3’侧翼区,所述3’侧翼区选自SEQ ID NO: 3、7、11和15和与SEQ ID NO: 3、7、11和15中的任何一个具有至少75%序列同一性的核酸序列。
5.根据权利要求4所述的多核苷酸,其中所述3’侧翼区位于MAR核心的3’侧,并距离所述MAR核心100个核苷酸之内。
6.根据权利要求1所述的多核苷酸,其包含MAR,所述MAR选自SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列,其中所述MAR能够附着到哺乳动物细胞核基质。
7.一种包含如权利要求1至6中的任一项所述的多核苷酸的细胞。
8.一种将编码序列转染到细胞的方法,其包含:在用于将第一和第二多核苷酸转染到细胞中的条件下,将所述细胞与包含所述编码序列和用于启动所述编码序列的转录的启动子的第一多核苷酸和包含选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少90%序列同一性的核酸序列的基质附着区(MAR)核心的不连接的第二多核苷酸接触,其中MAR核心能够附着到哺乳动物细胞核基质。
9.根据权利要求8所述的方法,其中所述第二多核苷酸进一步包含5’侧翼区,所述5’侧翼区选自SEQ ID NO: 2、6、10和14和与SEQ ID NO: 2、6、10和14中的任何一个具有至少75%序列同一性的核酸序列。
10.根据权利要求9所述的方法,其中所述5’侧翼区位于所述MAR核心的5’侧,并距离所述MAR核心100个核苷酸之内。
11.根据权利要求8至10中的任一项所述的方法,其中所述第二多核苷酸进一步包含3’侧翼区,所述3’侧翼区选自SEQ ID NO: 3、7、11和15和与SEQ ID NO: 3、7、11和15中的任何一个具有至少75%序列同一性的核酸序列。
12.根据权利要求11所述的方法,其中所述3’侧翼区位于所述MAR核心的3’侧,并距离所述MAR核心100个核苷酸之内。
13.根据权利要求8所述的方法,其中所述第二多核苷酸进一步包含MAR,所述MAR选自SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列,其中所述MAR能够附着到哺乳动物细胞核基质。
14.一种通过权利要求8至13中的任一项所述的方法制备的转染细胞。
15.一种嵌合基质附着区(MAR),其包含:
(a)MAR核心,其选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少75%序列同一性的核酸序列,其中所述MAR核心能够附着到哺乳动物细胞核基质,
(b)5’侧翼区,其选自SEQ ID NO: 2、6、10、14、18、22、26、30和34和与SEQ ID NO: 2、6、10、14、18、22、26、30和34中的任何一个具有至少75%序列同一性的核酸序列,以及
(c)3’侧翼区,其选自SEQ ID NO: 3、7、11、15、19、23、27、31和35和与SEQ ID NO: 3、7、11、15、19、23、27、31和35中的任何一个具有至少75%序列同一性的核酸序列,
其中所述MAR核心、所述5’侧翼区和所述3’侧翼区不是来自相同的天然MAR。
CN201980091439.0A 2018-12-07 2019-12-06 基质附着区和促进基因表达的用途 Pending CN113383081A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862776643P 2018-12-07 2018-12-07
US62/776,643 2018-12-07
PCT/US2019/064910 WO2020118169A1 (en) 2018-12-07 2019-12-06 Matrix attachment regions and uses in promoting gene expression

Publications (1)

Publication Number Publication Date
CN113383081A true CN113383081A (zh) 2021-09-10

Family

ID=70974440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980091439.0A Pending CN113383081A (zh) 2018-12-07 2019-12-06 基质附着区和促进基因表达的用途

Country Status (8)

Country Link
US (1) US20220017916A1 (zh)
EP (1) EP3891288A4 (zh)
JP (1) JP2022511077A (zh)
KR (1) KR20210113222A (zh)
CN (1) CN113383081A (zh)
AU (1) AU2019395023A1 (zh)
CA (1) CA3161115A1 (zh)
WO (1) WO2020118169A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1863913A (zh) * 2003-10-24 2006-11-15 思兰克斯有限公司 通过mar序列的多次转染过程在哺乳动物细胞中实现高效基因转移和表达
WO2007107578A1 (en) * 2006-03-20 2007-09-27 Chromagenics B.V. Expression augmenting dna fragments, use thereof, and methods for finding thereof
CN101541959A (zh) * 2006-08-23 2009-09-23 思兰克斯有限公司 用于增加转录的基质附着区(mar)及其应用
US20170114363A1 (en) * 2015-10-27 2017-04-27 Celltheon Corporation Chimeric post-transcriptional regulatory element
CN107868781A (zh) * 2017-11-15 2018-04-03 新乡医学院 人工合成mar片段、表达载体、表达系统及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080125583A1 (en) * 2005-02-11 2008-05-29 International Business Machines Corporation Ribonucleic acid interference molecules
EP3293263A1 (en) * 2016-09-07 2018-03-14 Steinbeis Innovation gGmbH Inducible gene expression by linear at-rich dna fragments in mammalian cells and methods relating thereto

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1863913A (zh) * 2003-10-24 2006-11-15 思兰克斯有限公司 通过mar序列的多次转染过程在哺乳动物细胞中实现高效基因转移和表达
US20180187229A1 (en) * 2003-10-24 2018-07-05 Selexis S.A. High efficiency gene transfer and expression in mammalian cells by a multiple transfection procedure of mar sequences
WO2007107578A1 (en) * 2006-03-20 2007-09-27 Chromagenics B.V. Expression augmenting dna fragments, use thereof, and methods for finding thereof
CN101541959A (zh) * 2006-08-23 2009-09-23 思兰克斯有限公司 用于增加转录的基质附着区(mar)及其应用
US20170114363A1 (en) * 2015-10-27 2017-04-27 Celltheon Corporation Chimeric post-transcriptional regulatory element
CN107868781A (zh) * 2017-11-15 2018-04-03 新乡医学院 人工合成mar片段、表达载体、表达系统及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHUN-PENG ZHAO ET AL.: "Matrix attachment region combinations increase transgene expression in transfected Chinese hamster ovary cells", SCI REP, vol. 7, pages 1 - 7 *
李琴 等: "不同启动子和MAR组合对重组CHO细胞转基因表达的影响", 四川大学学报(医学版), vol. 49, no. 1, pages 18 - 23 *

Also Published As

Publication number Publication date
EP3891288A1 (en) 2021-10-13
US20220017916A1 (en) 2022-01-20
CA3161115A1 (en) 2020-06-11
JP2022511077A (ja) 2022-01-28
AU2019395023A1 (en) 2021-07-29
EP3891288A4 (en) 2022-09-28
WO2020118169A1 (en) 2020-06-11
KR20210113222A (ko) 2021-09-15

Similar Documents

Publication Publication Date Title
AU2019250224B2 (en) Enhanced transgene expression and processing
CA2658595C (en) Regulatory nucleic acid elements
Willis RNA polymerase III: genes, factors and transcriptional specificity
KR100880371B1 (ko) Cns 장애의 치료를 위한 tgf-r 시그널화 억제제
KR20090053893A (ko) 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도
WO2015160893A1 (en) Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)
AU2016203681B2 (en) DNA element having the activity of enhancing foreign gene expression
EP3368672A2 (en) Chimeric post-transcriptional regulatory element
KR102553990B1 (ko) Hspa5 유전자의 프로모터
AU2012344855B2 (en) Promoter derived from human gene
CN113383081A (zh) 基质附着区和促进基因表达的用途
KR20210042084A (ko) Hspa8 유전자의 프로모터
CN116234904A (zh) 用于治疗糖尿病的经修饰的胰岛素和葡萄糖激酶核酸
KR20230009388A (ko) 인간 게놈 유래 폴리뉴클레오타이드 및 이를 이용한 목적 폴리펩타이드의 생산 방법
CN1287861C (zh) 人源基因引导序列、基因载体及基因表达方法
US20230287460A1 (en) Mammalian cells comprising integrated cas9 genes to produce stable integration sites, and mammalian cells comprising stable integration sites and other sites
US20230193312A1 (en) Eukaryotic cells comprising adenovirus-associated virus polynucleotides
US6492155B2 (en) Isolated human kinase proteins, nucleic acid molecules encoding human kinase proteins, and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination