CN113439121A - 具有增强的插入位点选择特性的转座酶 - Google Patents

具有增强的插入位点选择特性的转座酶 Download PDF

Info

Publication number
CN113439121A
CN113439121A CN201980091933.7A CN201980091933A CN113439121A CN 113439121 A CN113439121 A CN 113439121A CN 201980091933 A CN201980091933 A CN 201980091933A CN 113439121 A CN113439121 A CN 113439121A
Authority
CN
China
Prior art keywords
ser
lys
leu
arg
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980091933.7A
Other languages
English (en)
Inventor
斯文·克鲁格纳
托马斯·罗斯
福尔克·桑迪希
卡斯滕·温克勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ProBioGen AG
Original Assignee
ProBioGen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ProBioGen AG filed Critical ProBioGen AG
Publication of CN113439121A publication Critical patent/CN113439121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01048Histone acetyltransferase (2.3.1.48)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Insects & Arthropods (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及包含转座酶和至少一个异源染色质阅读器元件(CRE)的多肽。此外,本发明涉及编码该多肽的多核苷酸。此外,本发明涉及包含该多核苷酸的载体。此外,本发明涉及包含转座酶和至少一个异源染色质阅读器元件(CRE)的试剂盒。

Description

具有增强的插入位点选择特性的转座酶
技术领域
本发明涉及包含转座酶和至少一个异源染色质阅读器元件(chromatin readerelement,CRE)的多肽。此外,本发明涉及编码该多肽的多核苷酸。此外,本发明涉及包含该多核苷酸的载体。此外,本发明涉及包含转座酶和至少一个异源染色质阅读器元件(CRE)的试剂盒。
背景技术
转座子最近被开发为有效的非病毒基因递送工具。特别是,当使用转座子支持质粒DNA的整合时,可以改善生成的生产细胞系的性能。例如,转座子允许更大尺寸的异源DNA的整合,并允许将更多数量的异源DNA拷贝整合至各基因组中。此外,经由转座子的整合提供了减少质粒骨架整合和/或减少串联体(concatemer)的有效方法。
转座元件或转座子是DNA片段,其可以从基因组的一个位点移动到另一部分。分为两类转座元件:通过RNA中间体进行复制的反转录转座子(第1类)和“剪切和粘贴”DNA转座子(第2类)。第2类转座子的特征在于短反向末端重复(ITR)和元件编码的转座酶(具有切除和插入活性的酶)。目前对23个DNA转座子超家族进行了描述[Bao等,2015[doi:10.1186/s13100-015-0041-9.]]。在天然构型中,转座酶基因位于反向重复之间。许多第2类转座子已被证明有助于将异源DNA插入真核生物的基因组中,例如来自蛾类粉纹夜蛾(Trichoplusia ni)的转座子(PiggyBac)、来自蝙蝠类小棕蝠(Myotis lucifugus)的转座子(PiggyBat)、来自鲑鱼种的重建转座子(睡美人)或来自青鳉(Oryzias latipes)的转座子(Tol2)。这些转座子在宿主基因组的遗传操作中具有许多应用,包括转基因递送和插入诱变。例如,PiggyBac(PB)DNA转座子(以前称为IFP2)因其在载体和染色体之间有效转座的特性而在技术和商业上用于基因工程[US 6218185 B1]。对于这些应用,待整合的DNA的侧翼是PB载体中的两个PB ITR。通过PB转座酶的共同递送,从PB载体中精确切除侧翼DNA,并在TTAA特异性位点整合至靶基因组中。
转座元件的基因组整合位点偏好在不同的超家族之间有所不同。例如,PiggyBac超家族的转座元件(例如PiggyBac和PiggyBat)在转录单元(transcriptional unit)、CpG岛和转录起始位点(TSS)处富集,并与主要在分化诱导基因附近发现的BRD4结合位点共定位(Gogol-
Figure BDA0003208511340000021
等,2016 doi:[10.1038/mt.2016.11];Galvan等,2009 doi:[10.1097/CJI.0b013e3181b2914c])。由于宿主细胞因子参与整合,PiggyBac转座酶的效率可能在细胞系之间存在实质性差异。
为了提高转化效率,开发了更具活性的转座酶。相较于野生型转座酶,这些高活性(hyperactive)转座酶产生了更高比例的整合了所提供的转座子的细胞以及每个细胞更多数量的转座子整合。本领域中对不同策略进行了描述:例如,US 8399643 B2描述了高活性PiggyBac转座酶;EP 2160461 B1描述了通过定点诱变生成的高活性睡美人转座酶;US9534234 B2提供了融合至异源核定位序列(NLS)的源自蚕类家蚕(Bombyx mori)和源自蛙类热带爪蟾(Xenopus tropicalis)的PiggyBac样转座酶;EP 1546322 B1公开了一种嵌合整合酶,该酶包含识别DNA着陆垫(landing pad)的结合结构域,以将转座子-转座酶复合物拖至着陆垫上并促进其附近的整合;EP 1594972 B1请求保护一种转座酶或其具有转座酶功能的片段或衍生物,其与多肽结合结构域融合,所述多肽结合结构域可与包含DNA靶向结构域的细胞多肽或工程化多肽缔合。
此外,通过定点诱变生成具有切除能力但有整合缺陷的PiggyBac转座酶,以避免在PiggyBac切除后由重新整合而导致的进一步的基因组修饰(US 9670503 B2)。
本领域中描述的高活性转座酶显示出提高的转座酶的切除和/或整合活性,或者它们通过融合异源核定位序列(NLS)而支持转座子-转座酶复合物输入细胞核中。一些描述的转座酶通过融合特定DNA结合结构域而支持转座子-转座酶复合物与宿主基因组特定位点的对接。这些位点特异性转座酶允许转座子在相应细胞系中在已知或先前插入的着陆垫处进行确定整合。通过这种修饰,转座酶能够以与位点特异性重组酶(如cre和flp)类似的方式来应用。然而,与上述重组酶相反,整合发生在位点附近而非在所选位点的确切位置处,与重组酶相比无明显优势。此外,整合位点并非必须位于转录活性染色体区域,从而导致低产物产率。
基于以上内容,非常需要将基因引导至具有高转录活性的随机位置,特别是需要生成生产细胞系,用于以高产率生产治疗性蛋白质或用于以高产率生产基于病毒颗粒的生物医药产品。
除了DNA本身的甲基化外,组蛋白的化学修饰也参与基因表达的表观遗传调控。虽然CpG二核苷酸的甲基化不仅在细胞谱系内稳定维持而且还通过传代而遗传,组蛋白修饰与DNA甲基化交织在一起,但通常寿命较短。发现了大量不同的组蛋白的翻译后修饰(PTM),并且通过组蛋白标记对特定蛋白质和蛋白质复合物的募集目前已经成为组蛋白修饰如何介导它们的功能的公认教条。组蛋白修饰可以影响转录以及影响其它DNA过程,如复制、重组和修复。
组蛋白甲基化主要发生在精氨酸和赖氨酸的侧链上。精氨酸可以被单甲基化、对称二甲基化或不对称二甲基化,而赖氨酸可以被单甲基化、二甲基化或三甲基化。虽然一些甲基化状态与增强的表达相关,但其它甲基化状态引起阻遏。组蛋白H3蛋白上的三甲基化赖氨酸4(H3K4me3)通常存在于活跃描述基因的启动子处。
赖氨酸的乙酰化是高度动态的,并响应于各种刺激而受组蛋白乙酰转移酶和组蛋白去乙酰化酶的调节。组蛋白上的正电荷通过乙酰化去除,从而减少组蛋白的N端与DNA带负电荷的磷酸基团的相互作用,这转而又与附近基因的更高水平转录相关。组蛋白修饰酶协同作用且平衡良好。在癌细胞和转化细胞系中,这种平衡被破坏,特别是亲本组蛋白再循环和从头组装(de novo assembly)的平衡被破坏。
染色质阅读器蛋白与组蛋白尾部结合,识别特定PTM以募集染色质重塑复合物和转录机器的组件。例如,在染色质相关蛋白(如组蛋白乙酰转移酶)中发现的溴结构域(bromodomain)特异性识别乙酰化赖氨酸残基,而其它染色质相关蛋白的植物同源结构域(plant homeodomain,PHD)锌指与H3K4me3结合。与通常倾向于与活性基因相关的CpG岛相反,所描述的组蛋白修饰提供短期表观遗传记忆,并且可能在几次细胞分裂后逆转,特别是在转化细胞系中。
如上所述,非常需要将基因引导至具有高转录活性的随机位置,特别是需要生成生产细胞系,用于以高产率生产治疗性蛋白质或用于以高产率生产基于病毒颗粒的生物医药产品。
本领域尚未描述或建议识别特定翻译后组蛋白修饰(甲基化和/或乙酰化)的转座子或转座酶。如果为了发生转座而必须置换组蛋白,则这种靶向不太可能产生任何影响。此外,转座本身很可能会干扰组蛋白修饰。
本发明人惊奇地发现,通过与至少一个异源染色质阅读器元件偶联的转座酶,可以将包含至少一种感兴趣的多核苷酸的人工转座元件有效地靶向至活性染色质。本发明人首次出人意料地建立了一种用于以高产率生产蛋白质和病毒的靶向系统,所述靶向系统包含:包含至少一种感兴趣的多核苷酸的人工转座元件;以及包含与至少一个异源染色质阅读器元件偶联的转座酶的多肽。本发明人发现,较高的蛋白质水平不是较高转基因拷贝数的结果,而是转基因有效整合至高活性基因组位点中的结果。
发明内容
在第一方面,本发明涉及一种多肽,所述多肽包含:转座酶或其具有转座酶功能的片段或衍生物;以及至少一个异源染色质阅读器元件(CRE)。
在第二方面,本发明涉及编码根据第一方面的多肽的多核苷酸。
在第三方面,本发明涉及包含根据第二方面的多核苷酸的载体。
在第四方面,本发明涉及一种用于生产转基因细胞的方法,所述方法包括以下步骤:
(i)提供细胞;以及
(ii)将包含至少一种感兴趣的多核苷酸的转座元件,以及
根据第一方面的多肽,
根据第二方面的多核苷酸,或
根据第三方面的载体
引入所述细胞,从而产生/获得所述转基因细胞。
在第五方面,本发明涉及通过根据第四方面的方法可获得的转基因细胞。
在第六方面,本发明涉及根据第五方面的转基因细胞用于生产蛋白质或病毒的用途。
在第七方面,本发明涉及一种试剂盒,所述试剂盒包含:
(i)包含用于插入至少一种感兴趣的多核苷酸的克隆位点的转座元件;以及
(ii)根据第一方面的多肽,
根据第二方面的多核苷酸,
根据第三方面的载体,或
至少一个异源CRE以及包含转座酶或其具有转座酶功能的片段或衍生物的多肽。
在第八方面,本发明涉及一种靶向系统,所述靶向系统包含:
(i)包含至少一种感兴趣的多核苷酸的转座元件以及根据第一方面的多肽;
(ii)包含至少一种感兴趣的多核苷酸的转座元件以及根据第二方面的多核苷酸;
(iii)包含至少一种感兴趣的多核苷酸的转座元件以及根据第三方面的载体;
(iv)包含至少一种感兴趣的多核苷酸的转座元件,
与所述转座元件缔合的至少一个异源CRE,以及
包含转座酶或其具有转座酶功能的片段或衍生物的多肽。
该发明内容不必描述本发明的所有特征。通过查阅随后的具体实施方式,其它实施方式将变得显而易见。
具体实施方式
定义
在下面详细描述本发明之前,应理解的是,本发明并不限于本文所述的特定的方法学、方案和试剂,因为它们可以变化。还应理解的是,本文使用的术语仅出于描述特定实施方式的目的,而不旨在限制本发明的范围,本发明的范围仅由所附的权利要求所限制。除非另有定义,本文所用的所有技术术语和科学术语具有与本领域普通技术人员通常所理解的含义相同的含义。
优选地,按“A multilingual glossary of biotechnological terms:(IUPACRecommendations)”,Leuenberger,H.G.W,Nagel,B.和
Figure BDA0003208511340000051
H.著(1995),HelveticaChimica Acta,CH-4010Basel,Switzerland中所述来定义本文使用的术语。
在本说明书的文本全文中引用了若干文献。不论在上文还是下文中,本文引用的各文献(包括所有专利、专利申请、科学出版物、制造商的说明书、使用说明、序列提交的GenBank登录号等)均通过引用的方式以其整体并入于此。不应将本文的任何内容解释为承认本发明无权借助在先发明而先于此类公开。如果此类并入的参考文献的定义或教导与本说明书中所列举的定义或教导之间冲突,本说明书的文本优先。
根据本发明,术语“包含/包括/含有(comprise)”或变化形式(例如包含/包括/含有(“comprises”或“comprising”))是指包含所说明的整体或整体的组,但不排除任何其它整体或整体的组。根据本发明,术语“基本上由……组成(consisting essentially of)”是指包含所说明的整体或整体的组,同时排除实质上会影响或改变所说明的整体的其它整体或变型。根据本发明,术语“由……组成(consisting of)”或变化形式(例如由……组成(“consists of”))是指包含所说明的整体或整体的组,并排除任何其它整体或整体的组。
除非本文另有指出或与上下文明显矛盾,在描述本发明的上下文中(尤其是权利要求的上下文中)所使用的术语“一个/种(a/an)”和“该/所述(the)”以及类似的指代应理解为涵盖单数和复数二者。
如本文所用,术语“染色质”是指在细胞(特别是真核细胞)中发现的DNA和蛋白质的复合物。染色质的主要功能是将DNA分子包装并折叠成更紧凑、更致密的形状。这可以防止DNA分子缠结,并在细胞分裂过程中的强化DNA、防止DNA损伤以及调节基因表达和DNA复制方面发挥重要作用。染色质的主要蛋白质成分是组蛋白,它与DNA结合并发挥所谓的“锚”的功能,DNA链围绕着它缠绕。一般来说,染色质组织具有三个层次:(i)DNA包裹在组蛋白周围,形成核小体和所谓的“串珠(beads on a string)”结构(常染色质);(ii)多个组蛋白包裹成由其最紧凑形式的核小体阵列组成的30纳米的纤维(异染色质);以及(iii)30nm纤维的更高水平DNA超螺旋产生中期染色体(在有丝分裂和减数分裂期间)。更高阶染色质的形成不仅会导致DNA凝缩,还会影响其功能性,因为对于例如要结合的转录机器的成分或效应蛋白而言,DNA的某些区域不再可接近,而其它一些区域将更易于接近。
如本文所用,术语“组蛋白”是指染色质的构筑单元。组蛋白是由球状结构域和非结构化N端或C端尾部组成的小型碱性三联(tripartite)蛋白。组蛋白可以通过其柔性N端或C端尾部以及其球状结构域处的甲基化(例如赖氨酸甲基化或精氨酸甲基化)、乙酰化、磷酸化和/或泛素化而进行共价修饰。组蛋白的翻译后修饰(PTM)是调节染色质功能的关键因素。常染色质代表具有转录活性、松散包装和基因丰富区域的染色质,而异染色质则代表高度致密和基因贫乏的染色质。常染色质和异染色质之间的转换很大程度上受到包括DNA甲基化、非编码RNA和RNA干扰(RNAi)、组蛋白变体的DNA复制非依赖性掺入和组蛋白翻译后修饰(PTM)在内的机制的影响。
正如“组蛋白编码假设”所建议的那样,组蛋白PTM的分布形成了指示给定位点的染色质的状态的标记(signature)。常染色质通常与高水平的组蛋白乙酰化和/或甲基化(特别是单甲基化)相关。特别地,乙酰化(例如赖氨酸残基的乙酰化)可以减少组蛋白的正电荷,从而削弱它与带负电荷的DNA的相互作用并增加核小体(DNA和组蛋白的复合物)的流动性。氨基酸乙酰化还可以降低核小体阵列的紧凑水平。
给定位点的染色质状态例如取决于以下分子:可以对组蛋白进行翻译后修饰(例如甲基化和/或乙酰化)的分子(所谓的“写入器(writer)”);可以对组蛋白去除翻译后修饰(例如甲基化和/或乙酰化)的分子(所谓的“擦除器(eraser)”);以及可以容易地识别组蛋白的翻译后修饰(例如甲基化和/或乙酰化)的分子(所谓的“阅读器(reader)”)。“阅读器”分子被募集到此类组蛋白修饰处并通过特定结构域(例如植物同源结构域(PHD)锌指、溴结构域或染色质结构域)结合。“写”、“读”、和“擦”的三重作用为转录调控、DNA损伤修复等创造了有利的局部环境。
如本文所用,术语“染色质阅读器元件(CRE)”是指提供可接近表面(例如腔或表面凹槽)以容纳修饰的组蛋白残基并确定翻译后组蛋白修饰的类型(例如乙酰化或甲基化和乙酰化相对于甲基化)或状态特异性(例如,如赖氨酸或精氨酸的单甲基化、二甲基化相对于三甲基化)的任何结构。“染色质阅读器元件”还与修饰氨基酸的侧翼序列相互作用,以区分序列环境。特别是,“染色质阅读器元件”结合组蛋白尾部并识别组蛋白上特定的翻译后修饰(PTM),例如甲基化(如赖氨酸或精氨酸甲基化)和/或乙酰化。因此,染色质阅读器元件将染色质重塑复合物和转录机器的组件募集到结合位置。“染色质阅读器元件”优选是识别组蛋白甲基化程度的元件,特别是例如赖氨酸和/或精氨酸残基的组蛋白单甲基化、二甲基化或三甲基化程度。或者,“染色质阅读器元件”是识别组蛋白乙酰化状态的元件。如上所述,转录活性常染色质通常与组蛋白乙酰化和/或甲基化(特别是组蛋白单甲基化)相关。优选染色质阅读器元件是“染色质阅读器结构域(CRD)”。染色质阅读器结构域可以是溴结构域、染色质结构域、植物同源结构域(PHD)锌指、WD40结构域、tudor结构域、双/串联tudor结构域、MBT结构域、锚蛋白重复结构域、zf-CW结构域或PWWP结构域。例如,在染色质相关蛋白(如特异性识别乙酰化赖氨酸残基的组蛋白乙酰转移酶)中发现了溴结构域。PHD(特别是PHD指)也被发现存在于染色质相关蛋白中,如植物同源结构域蛋白,如转录起始因子。它们还可以识别乙酰化赖氨酸残基。识别组蛋白甲基化的染色质阅读器结构域包括PHD结构域、染色质结构域、WD40结构域、tudor结构域、双/串联tudor结构域、MBT结构域、锚蛋白重复结构域、zf-CW结构域和PWWP结构域。更优选染色质阅读器结构域是溴结构域或植物同源结构域(PHD)锌指。或者,优选染色质阅读器元件是人工染色质阅读器元件。人工染色质阅读器元件可以是微抗体、单链抗体、抗体片段、亲和体(affibody)、affilin、anticalin、atrimer、DARPin、FN2支架、fynomer或Kunitz结构域。
在这方面,如本文所用,术语“微抗体”是指从全功能天然抗体复制的人工氨基酸短链。
如在本发明的上下文中所用,术语“抗体片段”是指至少包含能够特异性结合抗原的结构域的抗体片段,即至少一个VL和/或VH结构域或其结合部分的链。
在本发明的上下文中,染色质阅读器元件(特别是染色质阅读器结构域)与转座酶或其具有转座酶功能的片段或衍生物缔合。与染色质阅读器元件(特别是染色质阅读器结构域)相连的转座酶或其具有转座酶功能的片段或衍生物能够识别特定的组蛋白翻译后修饰(例如甲基化和/或乙酰化)并由此能够识别活性常染色质。
如本文所用,术语“转座酶”是指能够结合转座元件的末端并通过剪切粘贴机制或者复制转座机制催化其移动到基因组另一部分的任何酶。转座元件的末端优选是末端重复,例如反向末端重复(ITR)或长末端重复(LTR)。因此,转座酶不仅能够识别围绕移动元件的末端重复,它还能够识别例如新宿主DNA上的靶序列。
术语“具有转座酶功能”的转座酶“片段”是指来源于天然存在的转座酶的片段,相较于天然存在的转座酶,其缺少一个或多个氨基酸并具有转座酶功能。例如,天然存在的转座酶的所述片段仍然具有转座酶功能,特别是仍然介导核苷酸序列(例如DNA)切除和/或插入;或具有改进的转座酶功能,特别是改进的介导核苷酸序列(例如DNA)切除和/或插入的活性/能力。通常,氨基酸序列的片段比相应的全长序列含有更少的氨基酸,其中,存在的氨基酸序列与全长序列中的连续顺序相同。因此,片段不包含片段所代表的全长序列部分中的任何内部插入或删除。
术语“具有转座酶功能”的转座酶“衍生物”是指天然存在的转座酶的衍生物,相较于天然存在的转座酶,其中一个或多个氨基酸已被置换、删除和/或添加并具有转座酶功能。例如,天然存在的转座酶的所述衍生物仍然具有转座酶功能,特别是仍然介导核苷酸序列(例如DNA)切除和/或插入;或具有改进的转座酶功能,特别是改进的介导核苷酸序列(例如DNA)切除和/或插入的活性/能力。与片段不同,衍生物可以包含对应于全长序列的氨基酸中的内部插入或删除,或者可以与全长编码序列具有相似性。
上述修饰优选通过重组DNA技术来实现。还可以通过对转座酶施加化学变化来实现进一步的修饰。
转座酶(及其片段或衍生物)可以重组生产,并且还可以保留与天然存在的转座酶相同或基本上相同的特征,特别是关于核苷酸序列(例如DNA)切除和/或插入。例如,本文所指的转座酶片段或衍生物优选保持天然蛋白质活性的至少50%,更优选保持天然蛋白质活性的至少75%并且甚至更优选至少95%。这种生物活性可以容易地通过本领域已知的多种测定法(例如酶活性测定法)来确定。或者,转座酶(及其片段或衍生物)可以重组生产,并且相较于天然存在的转座酶还可以具有改进的特征,特别是关于核苷酸序列(例如DNA)切除和/或插入。例如,本文所指的转座酶片段或衍生物优选具有比天然蛋白质活性高至少20%的活性,更优选具有比天然蛋白质活性高至少50%并且甚至更优选高至少75%的活性。这种生物活性可以容易地通过本领域已知的多种测定法(例如酶活性测定法)来确定。
转座酶或其具有转座酶功能的片段或衍生物可以是重组的、人工的和/或异源的转座酶或其具有转座酶功能的片段或衍生物。
转座酶可以是I类转座酶(反转录转座酶)或II类转座酶(DNA转座酶)。在I类转座酶的情况下,该转座酶也可称为整合酶。
如本文所用,术语“转座元件”(也称为“转座子”或“跳跃基因”)是指可改变其在基因组内的位置的多核苷酸分子。通常,转座元件包含编码催化切除和插入的功能性转座酶的多核苷酸。然而,在本发明的上下文中描述的转座元件缺乏编码功能性转座酶的多核苷酸。本文所述的基于转座子的多核苷酸分子不再包含编码功能性转座酶、优选天然存在的转座酶的完整序列。优选地,从转座元件中删除编码功能性转座酶、优选天然存在的转座酶或其部分的完整序列。或者,使编码转座酶的基因突变,使得不再包含天然存在的转座酶或其具有转座酶功能(即介导转座子切除和/或插入至靶位点)的片段或衍生物。
本文所述的转座元件保留了以反式提供的转座酶动员(mobilization)所需的序列。这些是位于转座元件各端的包含转座酶结合位点的重复序列,允许切除和整合。所述重复序列也称为末端重复。优选地,末端重复是反向末端重复(ITR)或长末端重复(LTR)。
代替编码功能性转座酶的多核苷酸序列,外源多核苷酸序列(例如感兴趣的多核苷酸序列)/异源多核苷酸序列(例如功能基因和驱动表达的调控元件)是本文所述的转座元件的一部分。因此,所述转座元件也可称为重组/人工转座元件。
转座元件可以来源于细菌或真核生物的转座元件,其中优选后者。此外,转座元件可以来源于I类或II类转座元件。II类或基于DNA的转座元件对于基因转移应用是优选的,因为这些元件的转座不涉及反转录步骤(反转录步骤参与I类或反转录转座元件的转座)。
II类或基于DNA的转座元件在任一端包含反向末端重复(ITR)。保守的基于DNA的转座元件通过剪切和粘贴机制移动。这需要转座酶、转座元件末端的反向重复和新宿主DNA分子上的靶序列。如上所述,转座酶在本发明中以反式提供。在剪切和粘贴机制中,转座酶与转座元件的反向末端重复结合,并将转座元件从当前位置切下。然后,转座酶定位靶序列,在交错位置(staggered location)中切割DNA骨架,这在新宿主DNA分子上留下轻微的单链悬垂,然后插入转座元件。转座元件并不完全填补DNA的单链碎片。宿主生物体(例如宿主细胞)识别短单链DNA片段并填补空白。这个过程称为保守转座,并保持转座元件不变。在去除转座子的过程中,原始DNA遭受双链断裂,这通常会导致该分子毁灭。因此,转座受到严格管制。
优选地,转座酶识别转座元件各末端(特别是在转座元件的重复序列处)的TA二核苷酸,并例如从载体切除转座元件。通常,两个转座酶单体参与转座元件的切除,转座元件的每一端各有一个转座酶单体。最后,与切除的转座元件复合的转座酶二聚体通过识别靶序列中的TA二核苷酸,将转座元件重新整合至宿主生物体(例如宿主细胞)的DNA中。
转座元件可以是重组的、人工的和/或异源的转座元件。
本发明人发现,与包含转座酶和至少一个染色质阅读器元件的多肽组合的所述(重组/人工)转座元件允许将该转座元件靶向至基因组中具有高转录活性的随机位置中。换言之,本发明人发现,与包含转座酶和至少一个染色质阅读器结构域的多肽组合的所述(重组/人工)转座元件允许靶向活性染色质。这种靶向过程的结果是通过转座酶将包含感兴趣的多核苷酸(例如编码蛋白质或病毒颗粒)的转座元件整合至转录活性染色质中。这转而又使得能够产生用于生产蛋白质(例如治疗性蛋白质)或基于病毒颗粒的生物医药产品的高生产细胞系。
如本文所用,术语“多核苷酸”是指脱氧核糖核苷酸碱基或核糖核苷酸碱基的聚合物,并且包括DNA和RNA分子,正义链和反义链二者。具体而言,多核苷酸可为DNA(cDNA和基因组DNA)、RNA、mRNA、cRNA或杂交体(hybrid),其中多核苷酸序列可含有脱氧核糖核苷酸碱基或核糖核苷酸碱基的组合,以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤在内的碱基的组合。可通过化学合成方法或者通过重组方法获得多核苷酸。优选地,多核苷酸是DNA或mRNA分子。
在本发明的上下文中,术语“多肽”和“蛋白质”可以互换使用,并且是指氨基酸的长肽连接链。
如在本发明的上下文中所用,术语“多肽片段”是指相较于全长多肽具有缺失(例如氨基末端缺失和/或羧基末端缺失和/或内部缺失)的多肽。
如本文所用,术语“DNA结合/靶向结构域”是指能够与DNA区域(包括更高阶结构的染色体区域,例如细胞核中的重复区域)特异性结合,并且直接或间接参与介导转座元件整合至所述DNA区域中的部分。该DNA区域优选由在各自的基因组内可区分的核苷酸序列定义。
如本文所用,术语“核定位序列/信号(NLS)”是指标记多肽以用于通过核转运输入细胞核的结构。通常,该序列/信号由暴露在多肽表面上的一个或多个带正电荷的赖氨酸或精氨酸的短序列组成。
如本文所用,术语“多肽结合分子”是指能够特异性结合转座酶和染色质阅读器元件(特别是染色质阅读器结构域)两者的分子。在本发明的优选实施方式中,转座酶通过结合分子与染色质阅读器元件(特别是染色质阅读器结构域)相连,染色质阅读器元件(特别是染色质阅读器结构域)附接至所述结合分子。在这种情况下,多肽结合分子作为桥接分子(bridging molecule)发挥功能。
如本文所用,术语“异源的”是指衍生自另一天然来源(例如另一生物体);或从其天然环境取出(例如与另一分子融合、附接或偶联);或通常在自然界中不存在的元件。特别地,如在本发明的上下文中所用,术语“异源多肽”是指通常在自然界中不存在的多肽。例如,包含转座酶或其具有转座酶功能的片段或衍生物和至少一个异源染色质阅读器元件的多肽在自然界中(例如在给定细胞中)不存在。如在本发明的上下文中所用,术语“异源核苷酸序列”是指通常在自然界中(例如在给定细胞中)不存在的核苷酸序列。例如,编码包含转座酶或其具有转座酶功能的片段或衍生物和至少一个异源染色质阅读器元件的多肽的多核苷酸在自然界中(例如在给定细胞中)不存在。该术语涵盖符合以下至少一项的核酸:(a)外源性引入给定细胞的核酸(因此为“外源序列”,即使该序列对于受体细胞可以是外来的或天然的);(b)该核酸包含天然存在于给定细胞中的核苷酸序列(例如,该核酸包含对于细胞是内源的核苷酸序列)但该核酸在细胞中以非天然的(例如大于预期或大于天然存在的)量产生,或核苷酸序列与内源核苷酸序列不同而使得内源发现的相同的编码蛋白质(具有相同或实质上相同的氨基酸序列)在细胞中以非天然的(例如大于预期或大于天然存在的)量产生;或(c)该核酸包含两个以上核苷酸序列或片段,在自然界中未发现这些核苷酸序列或片段彼此处于相同的关系(例如,该核酸是重组的)。
如本文中与转座酶或其具有转座酶功能的片段或衍生物相关使用的术语“异源染色质阅读器元件(特别是染色质阅读器结构域)”是指通常在自然界中未发现其与转座酶或其具有转座酶功能的片段或衍生物密切相关的氨基酸序列。异源染色质阅读器元件可以在一条或多条多肽链内包含一个或超过一个蛋白质结构域。包含转座酶或其具有转座酶功能的片段或衍生物和染色质阅读器元件(特别是染色质阅读器结构域)的多肽也可被称为重组/人工多肽。
如本文中与转座酶或其具有转座酶功能的片段或衍生物相关使用的术语“异源DNA结合结构域”或“异源核定位序列(NLS)”或“异源结合分子”是指通常在自然界中未发现其与转座酶或其具有转座酶功能的片段或衍生物密切相关的氨基酸序列。
如本文所用,术语“接头”是指氨基酸(例如至少2、3、4或5个氨基酸)的蛋白质延伸段(stretch),其在宿主生物体(如细胞)内不履行生物学功能。接头的功能是将两个不同的多肽或结构域或多肽和结构域栓系在一起或结合在一起,使这些多肽或结构域或多肽和结构域能够发挥它们在未附接至所述接头的情况下将发挥的生物学功能(例如结合染色质靶序列、结合DNA或结合不同的多肽或切除和/或整合多核苷酸)。
如本文所用,术语“感兴趣的多核苷酸”是指核苷酸序列。核苷酸序列可以是RNA或DNA序列,优选核苷酸序列是DNA序列。根据本发明的方法,感兴趣的多核苷酸可以编码感兴趣的产物。感兴趣的产物可以是感兴趣的多肽,例如蛋白质;或感兴趣的RNA,例如mRNA或功能性RNA,例如双链RNA、microRNA或siRNA。功能性RNA经常用于沉默相应的靶基因。优选地,感兴趣的多核苷酸可操作地连接至合适的调控序列(例如启动子),合适的调控序列在本领域中众所周知并被充分描述,并且可以影响感兴趣的多核苷酸的转录。
期望产物在宿主生物体(例如宿主细胞)中的表达水平可以基于细胞中存在的相应mRNA的量或由感兴趣的多核苷酸编码的期望产物的量来确定。例如,从选定序列转录的mRNA可以通过PCR或通过Northern杂交来定量。多肽可以通过各种方法定量,例如通过测定多肽的生物活性(例如通过酶测定法)或通过利用识别并结合该蛋白质的抗体使用独立于这种活性的测定法(例如蛋白质印迹、ELISA或放射免疫测定法)。
优选地,感兴趣的多核苷酸选自于由编码多肽的多核苷酸、非编码多核苷酸、包含启动子序列的多核苷酸、编码mRNA的多核苷酸、编码标签的多核苷酸和病毒多核苷酸组成的组。优选地,感兴趣的多核苷酸是异源/外源多核苷酸。
如本文所用,术语“表达控制序列”是指影响编码序列(表达控制序列与其可操作地连接)在宿主生物体(例如宿主细胞)中的表达的核苷酸序列。表达控制序列是控制转录的序列,例如启动子、TATA盒、增强子、UCOE或MAR元件、聚腺苷酸化信号、转录后活性元件,例如RNA稳定元件、RNA转运元件和翻译增强子。
如本文所用,术语“可操作地连接”是指一个核苷酸序列与第二核苷酸序列以可以避免相应融合蛋白或杂合蛋白的框内表达受到移码或终止密码子影响这样的方式连接。该术语还表示将表达控制序列连接到感兴趣的编码核苷酸序列(例如编码蛋白质),以有效控制所述序列的表达。该术语进一步表示将编码亲和标签或标志物标签的核苷酸序列连接到感兴趣的编码核苷酸序列(例如编码蛋白质)。
如本文所用,术语“宿主细胞”是指可用于蛋白质和/或病毒生产的任何细胞。它还指可以作为本文描述的多肽、多核苷酸和/或转座元件的宿主的任何细胞。细胞可以是原核或真核细胞。优选地,细胞是真核细胞。更优选地,真核细胞是脊椎动物、酵母、真菌或昆虫细胞。脊椎动物细胞可以是哺乳动物、鱼、两栖动物、爬行动物细胞或禽类细胞。禽类细胞可以是鸡、鹌鹑、鹅或鸭细胞,如鸭视网膜细胞或鸭体节细胞。甚至更优选地,脊椎动物细胞是哺乳动物细胞。最优选地,哺乳动物细胞选自于由中国仓鼠卵巢(CHO)细胞(例如CHO-K1/CHO-S/CHO-DUX B11/CHO-DG44细胞)、人胚肾(HEK293)细胞、HeLa细胞、A549细胞、MRC5细胞、WI38细胞、BHK细胞和Vero细胞组成的组。细胞也可以包含于生物体中/作为生物体的一部分。所述生物体可以是原核或真核生物体。优选地,生物体是真核生物体。更优选地,所述生物体可以是真菌、昆虫或脊椎动物。脊椎动物可以是鸟类(如鸡、鹌鹑、鹅或鸭)、犬科动物、鼬属动物、啮齿动物(例如小鼠、大鼠或仓鼠)、绵羊、山羊、猪、蝙蝠(例如狐蝠科或微型蝙蝠)或人类/非人灵长类(例如猴或类人猿)。最优选地,生物体是哺乳动物,例如小鼠、大鼠、猪或人类/非人灵长类。
本发明的实施方式
本发明人惊奇地发现,通过与至少一个异源染色质阅读器元件偶联的转座酶,可以将包含至少一种感兴趣的多核苷酸的人工转座元件有效地靶向至活性染色质。本发明人首次出人意料地建立了一种用于以高产率生产蛋白质和病毒的靶向系统,所述靶向系统包含:包含至少一种感兴趣的多核苷酸的人工转座元件;以及包含与至少一个异源染色质阅读器元件偶联的转座酶的多肽。本发明人发现,较高的蛋白质水平不是较高转基因拷贝数的结果,而是转基因有效整合至高活性基因组位点中的结果。
因此,在第一方面,本发明涉及一种多肽,所述多肽包含:转座酶或其具有转座酶功能的片段或衍生物;以及至少一个染色质阅读器元件(CRE)(例如至少1或2个CRE)。所述多肽能够增强染色质结构中的插入位点选择。优选所述至少一个染色质阅读器元件(CRE)是异源染色质阅读器元件(CRE)。可选地或另外地,优选所述多肽是重组多肽。
多肽可以是包含转座酶和至少一个异源CRE的分子,其可以由同一核酸分子(例如mRNA分子)翻译为单链多肽,或者可以通过所述转座酶和所述至少一个异源CRE的分别翻译及随后的偶联(例如通过粘附力或化学方式)产生。在第一种情况下,所述至少一个CRE与所述转座酶融合/附接。在第二种情况下,所述至少一个CRE与所述转座酶连接/偶联。优选的连接是共价连接。所述多肽可以被称为重组/人工多肽。优选地,所述多肽是单链多肽,其也可以称为杂合多肽或融合多肽。
在一个实施方式中,所述至少一个异源CRE与转座酶相连。优选地,所述至少一个异源CRE通过接头与转座酶相连。相连可以是连接/偶联或融合/附接。特别地,当存在接头时,所述至少一个CRE通过接头与转座酶连接/偶联或融合/附接。如果多肽作为单链多肽(也可称为杂合多肽或融合多肽)产生,则CRE通过接头与转座酶附接/融合。如果多肽通过CRE和转座酶的分别翻译及随后的偶联(例如通过粘附力或化学方式)产生,则CRE通过接头与转座酶连接/偶联。优选的连接是共价连接。
在一个优选实施方式中,所述至少一个异源CRE与转座酶的N端相连、与转座酶的C端相连、或与转座酶的N端和C端相连。优选地,所述至少一个异源CRE通过接头与转座酶的N端相连、与转座酶的C端相连、或与转座酶的N端和C端相连。
在一个优选实施方式中,所述至少一个异源CRE形成多肽的N端、多肽的C端、或多肽的N端和C端,并且特别是通过接头与转座酶偶联。
形成转座酶/多肽的N端和转座酶/多肽的C端的异源CRE可以相同或不同。它们可以通过相同或不同的接头与转座酶/多肽偶联。
如上所述,一个或多个接头可包含于多肽中,以使一个或多个染色质阅读器元件与转座酶相连。例如,可以包含一个接头以使转座酶的N端与CRE相连;可以包含一个接头以使转座酶的C端与CRE相连;或者可以包含一个接头以使转座酶的N端与CRE相连并可以包含另一个(相同或不同的)接头以使转座酶的C端与另一个(相同或不同的)CRE相连。所述接头可包含至少2、3、4或5个氨基酸。优选地,接头是柔性接头。更优选地,接头是甘氨酸接头;丝氨酸-甘氨酸接头;具有根据SEQ ID NO:22的氨基酸序列或与其具有至少90%(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的氨基酸序列的接头;或具有根据SEQ ID NO:23的氨基酸序列或与其具有至少90%(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的氨基酸序列的接头。
在一个可选的优选实施方式中,CRE通过结合分子/部分(而非接头)与转座酶偶联/相连。结合CRE的分子/部分优选与转座酶的N端或C端相连。所述结合分子/部分与转座酶以及与CRE相互作用。
在一个优选实施方式中,所述至少一个异源CRE是染色质阅读器结构域(CRD)。优选地,所述至少一个异源CRD是天然存在的CRD。(天然存在的)染色质阅读器结构域可以是溴结构域、染色质结构域、植物同源结构域(PHD)锌指、WD40结构域、tudor结构域、双/串联tudor结构域、MBT结构域、锚蛋白重复结构域、zf-CW结构域或PWWP结构域。更优选地,(天然存在的)CRD识别组蛋白甲基化程度(例如,诸如赖氨酸或精氨酸等氨基酸的单甲基化、二甲基化或三甲基化)和/或组蛋白乙酰化状态。甚至更优选地,识别组蛋白甲基化程度的(天然存在的)CRD是植物同源结构域(PHD)型锌指,或者识别组蛋白乙酰化状态的(天然存在的)CRD是溴结构域。最优选地,PHD型锌指是转录起始因子TFIID亚基3PHD,例如具有根据SEQID NO:20的氨基酸序列或与其具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的氨基酸序列;或者溴结构域是组蛋白乙酰转移酶结构域,如组蛋白乙酰转移酶KAT2A结构域,例如具有根据SEQ ID NO:21的氨基酸序列或与其具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的氨基酸序列。结构域变体是功能活性结构域变体,即它们仍然能够发挥染色质阅读器结构域的功能。识别组蛋白甲基化程度的替代的(天然存在的)染色质阅读器结构域可以是例如染色质结构域、WD40结构域、tudor结构域、双/串联tudor结构域、MBT结构域、锚蛋白重复结构域、zf-CW结构域或PWWP结构域。
例如,
RHD或溴结构域形成转座酶的N端/包含于转座酶的N端,并且特别是通过接头与转座酶偶联;
RHD或溴结构域形成转座酶的C端/包含于转座酶的C端,并且特别是通过接头与转座酶偶联;
RHD形成转座酶的N端/包含于转座酶的N端,并且RHD形成转座酶的C端/包含于转座酶的C端,两者都特别是通过接头与转座酶偶联;
溴结构域形成转座酶的N端/包含于转座酶的N端,并且溴结构域形成转座酶的C端/包含于转座酶的C端,两者都特别是通过接头与转座酶偶联;
RHD形成转座酶的N端/包含于转座酶的N端,并且溴结构域形成转座酶的C端/包含于转座酶的C端,两者都特别是通过接头与转座酶偶联;或
溴结构域形成转座酶的N端/包含于转座酶的N端,并且RHD形成转座酶的C端/包含于转座酶的C端,两者都特别是通过接头与转座酶偶联。
包含转座酶和至少一个异源染色质阅读器结构域的优选多肽的核苷酸序列和相应的氨基酸序列如下所列:对于Taf3-haPB为SEQ ID NO:1和SEQ ID NO:2;对于KATA2A-PBw-TAF3为SEQ ID NO:3和SEQ ID NO:4;对于PBw为SEQ ID NO:5和SEQ ID NO:6;对于TAF3-PBw为SEQ ID NO:7和SEQ ID NO:8;对于PBw-TAF3为SEQ ID NO:9和SEQ ID NO:10;对于KAT2A-PBw为SEQ ID NO:11和SEQ ID NO:12;对于haPB为SEQ ID NO:13和SEQ ID NO:14;对于KATA2A-haPB-TAF3为SEQ ID NO:15和SEQ ID NO:16;对于KATA2A-haPB为SEQ ID NO:29和SEQ ID NO:30;以及对于haPB-TAF3为SEQ ID NO:31和SEQ ID NO:32。还涵盖上述序列的变体(在核苷酸序列以及氨基酸水平上)。所述变体与上述序列具有至少90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性。所述变体是功能活性变体或编码功能活性变体。功能活性变体仍然能够检测和结合转录活性染色质(常染色质),并且仍然能够切除和插入转座元件。
在一个备选的优选实施方式中,染色质阅读器元件是人工染色质阅读器元件(CRE)。优选地,人工CRE识别具有特定甲基化和/或乙酰化位点的组蛋白尾部。更优选地,人工CRE选自于由微抗体、单链抗体、抗体片段、亲和体、affilin、anticalin、atrimer、DARPin、FN2支架、fynomer和Kunitz结构域组成的组。
转座酶可以是I类转座酶(反转录转座酶)或II类转座酶(DNA转座酶)。在I类转座酶的情况下,该转座酶也可称为整合酶。在一个优选实施方式中,转座酶是II类转座酶(DNA转座酶)。在一个更优选的实施方式中,转座酶是PiggyBac转座酶、睡美人转座酶或Tol2转座酶。优选地,PiggyBac转座酶是野生型PiggyBac转座酶、高活性PiggyBac转座酶、野生型PiggyBac样转座酶或高活性PiggyBac样转座酶。更优选地,野生型PiggyBac转座酶具有根据SEQ ID NO:6的氨基酸序列或与其具有至少90%(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的氨基酸序列。野生型PiggyBac转座酶变体是功能活性变体,即它们仍然能够作为转座酶发挥功能(多核苷酸的切除和整合)。更优选地,PiggyBac样转座酶选自于由PiggyBat、来自热带爪蟾的PiggyBac样转座酶和来自家蚕的PiggyBac样转座酶组成的组。
在另一个优选实施方式中,所述多肽还包含至少一个异源DNA结合结构域(例如至少1或2个DNA结合结构域)。
在另一个优选实施方式中,所述多肽还包含异源核定位信号(NLS)。NLS可以形成转座酶/多肽的N端或C端。
上述多肽优选为异源多肽。
在第二方面,本发明涉及编码根据第一方面的多肽的多核苷酸。所述多核苷酸优选为DNA或RNA,例如mRNA。
在第三方面,本发明涉及包含根据第二方面的多核苷酸的载体。术语“载体”和“质粒”在本文中可以互换使用。载体可以是病毒载体或非病毒载体。优选地,载体是表达载体。编码根据第一方面的多肽的多核苷酸的表达优选由表达控制序列控制。表达控制序列可以是控制转录的序列,例如启动子、增强子、UCOE或MAR元件、聚腺苷酸化信号、转录后活性元件,例如RNA稳定元件、RNA转运元件和翻译增强子。所述表达控制序列是本领域技术人员已知的。例如,作为启动子,可以使用CMV启动子或PGK启动子。
在第四方面,本发明涉及一种用于生产细胞(特别是转基因细胞)的方法,所述方法包括以下步骤:
(i)提供细胞;以及
(ii)将包含至少一种感兴趣的多核苷酸的转座元件,以及
根据第一方面的多肽,
根据第二方面的多核苷酸,或
根据第三方面的载体
引入所述细胞,从而产生/获得所述细胞(特别是所述转基因细胞)。
所述方法可以是体外或体内方法。优选地,所述方法是体外方法。
天然地,转座元件包含编码催化切除和插入的功能性转座酶的多核苷酸。然而,上述方法的步骤(ii)中提到的转座元件缺乏编码功能性转座酶的多核苷酸。转座元件不包含编码功能性转座酶、优选天然存在的转座酶的完整序列。优选地,从转座元件中删除编码功能性转座酶、优选天然存在的转座酶或其部分的完整序列。代替编码功能性转座酶的多核苷酸,至少一种感兴趣的多核苷酸(例如至少一种外源/异源多核苷酸)是上述转座元件的一部分。因此,所述转座元件也可称为重组/人工转座元件。
与至少一个异源染色质阅读器元件(CRE)相连的转座酶或其具有转座酶功能的片段或衍生物在上述方法的步骤(ii)中以反式提供,例如作为根据第一方面的多肽、作为根据第二方面的多核苷酸或包含于根据第三方面的载体中。
包含至少一种感兴趣的多核苷酸的转座元件的引入可以通过电穿孔、转染、注射、脂质转染或(病毒)感染来实现。
可以将包含至少一种感兴趣的多核苷酸的转座元件瞬时或稳定地引入细胞中。在第一种情况下,将包含至少一种感兴趣的多核苷酸的转座元件作为染色体外元件(例如作为线性DNA分子、质粒DNA、游离DNA、病毒DNA或病毒RNA)引入。在第二种情况下,将包含至少一种感兴趣的多核苷酸的转座元件稳定地引入/插入细胞的基因组中。优选地,将包含至少一种感兴趣的多核苷酸的转座元件瞬时引入细胞中。更优选地,包含至少一种感兴趣的多核苷酸的转座元件包含于载体中。本领域技术人员熟知用于将转座元件引入细胞的分子生物学技术(如显微注射、电穿孔或脂质转染),并且知晓如何实施这些技术。
根据第一方面的多肽、根据第二方面的多核苷酸或根据第三方面的载体的引入也可以通过电穿孔、转染、注射、脂质转染和/或(病毒)感染来实现。
如果将多核苷酸引入细胞,则多核苷酸随后在细胞中转录并翻译成多肽。如果将包含多核苷酸的载体引入细胞,则多核苷酸随后在细胞中从载体转录并翻译成多肽。多核苷酸可以是DNA或RNA,例如mRNA。也可以引入病毒DNA或RNA。可以将多核苷酸瞬时或稳定地引入细胞中。在第一种情况下,将多核苷酸作为染色体外多核苷酸(例如作为线性DNA分子、环状DNA分子、质粒DNA、病毒DNA、体外合成/转录的RNA或病毒RNA)引入。在第二种情况下,将多核苷酸稳定地引入/插入细胞的基因组中。优选地,将多核苷酸瞬时引入细胞中。更优选地,多核苷酸包含于载体中,特别是表达载体中。病毒DNA或RNA序列也可以作为载体的一部分或以载体的形式引入。特别优选地,将多核苷酸可操作地连接至异源启动子,使得允许所述转座酶或其具有转座酶功能的片段或衍生物以及所述至少一个染色质阅读器元件在细胞内或从包含于细胞中的载体(例如表达载体或用于体外转录的载体)转录。
本领域技术人员熟知用于将多肽或编码多肽的核酸序列引入细胞的分子生物学技术(如显微注射、电穿孔或脂质转染),并且知晓如何实施这些技术。
在一个优选实施方式中,包含至少一种感兴趣的多核苷酸的转座元件包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。在这种情况下,根据第二方面的多核苷酸还优选地包含于(不同的)多核苷酸分子中/作为(不同的)多核苷酸分子的一部分,所述(不同的)多核苷酸分子优选为(不同的)载体。因此,优选地,根据第二方面的多核苷酸和转座元件位于各自的多核苷酸分子(优选载体)上。这使得能够调整转座酶和转座元件质粒的量,从而实现所期望的每个细胞的若干整合或尽可能多的整合。
在一个备选的优选实施方式中,包含至少一种感兴趣的多核苷酸的转座元件和根据第二方面的多核苷酸包含于(相同的)多核苷酸分子中/作为(相同的)多核苷酸分子的一部分,所述多核苷酸分子优选为载体。在这种情况下,优选地,根据第二方面的多核苷酸位于所述至少一种感兴趣的多核苷酸的区域外部。优选地,将所述多核苷酸可操作地连接至异源启动子,使得允许所述转座酶或其具有转座酶功能的片段或衍生物以及所述至少一个染色质阅读器元件从所述多核苷酸分子(优选载体)转录。
上述方法的步骤(ii)中提到的转座元件保留了以反式提供的转座酶动员所需的序列。这些是位于转座元件各端的包含转座酶结合位点的重复序列,允许从基因组切除。因此,在一个实施方式中,转座元件包含末端重复(TR)。在另一个实施方式中,所述至少一种感兴趣的多核苷酸的侧翼为TR。例如,上述方法的步骤(ii)中提到的转座元件包含第一转座元件特异性末端重复和位于所述第一转座元件特异性末端重复下游的第二转座元件特异性末端重复。所述至少一种感兴趣的多核苷酸位于第一转座元件特异性末端重复和第二转座元件特异性末端重复之间。优选地,所述末端重复是反向末端重复(ITR)或长末端重复(LTR)。在这方面,应注意的是,以反式提供的转座酶对转座元件具有特异性。换言之,转座元件被转座酶特异性识别。例如,II类转座酶(DNA转座酶)识别转座元件各末端处(特别是转座元件的重复序列/末端重复中)的TA二核苷酸。它还识别靶序列中的TA二核苷酸。
如上所述,包含至少一种感兴趣的多核苷酸的转座元件和根据第二方面的多核苷酸包含于(相同的)多核苷酸分子中/作为(相同的)多核苷酸分子的一部分,所述多核苷酸分子优选为载体。在这种情况下,优选地,根据第二方面的多核苷酸位于所述至少一种感兴趣的多核苷酸的区域外部。特别优选地,根据第二方面的多核苷酸位于在所述至少一种感兴趣的多核苷酸的侧翼的末端重复(例如反向末端重复(ITR)或长末端重复(LTR))的外面。
转座元件可以来源于原核或真核生物的转座元件,其中优选后者。
转座元件可以是II类或基于DNA/DNA的转座元件。基于DNA/DNA的转座元件包含反向末端重复(ITR)。它被II类转座酶(DNA转座酶)识别。转座元件也可以是I类或反转录转座元件。反转录转座元件可以是长末端重复(LTR)反转录转座元件。LTR反转录转座元件包含长末端重复(LTR)。它被I类转座酶(反转录转座酶)识别。所述转座酶也可称为整合酶。
如上所述,II类或基于DNA的转座元件在任一端包含反向末端重复(ITR)。保守的基于DNA的转座元件通过剪切和粘贴机制移动。这需要转座酶、转座元件末端的反向重复和新宿主DNA分子上的靶序列。转座酶在上述方法中以反式提供。它催化从当前位置切除转座元件并将切除的转座元件整合至细胞的基因组中。在剪切和粘贴机制中,转座酶与转座元件的反向末端重复特异性结合,并将转座元件从当前位置(例如载体)切下。然后,转座酶定位转座元件,切割靶DNA骨架,然后插入转座元件。通常,两个转座酶单体参与转座元件的切除,转座元件的每一端各有一个转座酶单体。最后,与切除的转座元件复合的转座酶二聚体将转座元件重新整合至细胞的DNA中。
在一个优选实施方式中,转座元件是II类或基于DNA的转座元件。在一个更优选的实施方式中,转座元件是PiggyBac转座元件、睡美人转座元件或Tol2转座元件。优选地,PiggyBac转座元件是野生型PiggyBac转座元件、高活性PiggyBac转座元件、野生型PiggyBac样转座元件或高活性PiggyBac样转座元件。更优选地,PiggyBac样转座元件选自于由PiggyBat转座元件、来自热带爪蟾的PiggyBac样转座元件和来自家蚕的PiggyBac样转座元件组成的组。例如,PiggyBac DNA转座元件因其在载体和染色体之间有效转座的特性而在技术和商业上用于基因工程。
在另一个优选实施方式中,转座子特异性反向末端重复包含PiggyBac最小ITR。在一个更优选的实施方式中,第一转座子特异性反向末端重复包含根据SEQ ID NO:24的序列或与其具有至少90%(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的序列;和/或第二转座子特异性反向末端重复包含根据SEQ ID NO:25的序列或与其具有至少90%(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性的序列。PiggyBac最小ITR变体是功能活性变体,即它们仍然可被PiggyBac最小ITR特异性转座酶识别。
细胞可以是原核或真核细胞。优选地,细胞是真核细胞。更优选地,真核细胞是脊椎动物、酵母、真菌或昆虫细胞。脊椎动物细胞可以是哺乳动物、鱼、两栖动物、爬行动物细胞或禽类细胞。禽类细胞可以是鸡、鹌鹑、鹅或鸭细胞,如鸭视网膜细胞或鸭体节细胞。甚至更优选地,脊椎动物细胞是哺乳动物细胞。最优选地,哺乳动物细胞选自于由中国仓鼠卵巢(CHO)细胞(例如CHO-K1/CHO-S/CHO-DUXB11/CHO-DG44细胞)、人胚肾(HEK293)细胞、HeLa细胞、A549细胞、MRC5细胞、WI38细胞、BHK细胞和Vero细胞组成的组。
细胞可以是分离的细胞(例如在细胞培养物中或在细胞系中,例如稳定细胞系)。细胞也可以是生物体外的组织的细胞。然而,随后可以将转基因细胞插入生物体中。可通过输注或注射或本领域技术人员熟知的其它方式来实现转基因细胞向生物体中的插入。
细胞也可以作为生物体的一部分/包含于生物体中,所述生物体例如为真核多细胞生物体。在这种情况下,包含至少一种感兴趣的多核苷酸的转座元件以及根据第一方面的多肽、根据第二方面的多核苷酸或根据第三方面的载体的插入在体内实现。体内多肽/多核苷酸/转座元件递送可以通过注射(局部或全身)来完成。多核苷酸/转座元件可以处于例如裸DNA,与脂质体、PEI或其它缩合剂(condensing agent)复合的DNA的形式,或者可以掺入感染性颗粒(病毒或病毒样颗粒)中。多核苷酸/转座元件递送也可以使用电穿孔或用基因枪或用气溶胶来进行。
所述生物体可以是原核或真核生物体。优选地,生物体是真核生物体。更优选地,所述生物体可以是真菌、昆虫或脊椎动物。脊椎动物可以是鸟类(如鸡、鹌鹑、鹅或鸭)、犬科动物、鼬属动物、啮齿动物(例如小鼠、大鼠或仓鼠)、绵羊、山羊、猪、蝙蝠(例如狐蝠科或微型蝙蝠)或人类/非人灵长类(例如猴或类人猿)。最优选地,生物体是哺乳动物,例如小鼠、大鼠、猪或人类/非人灵长类。
在一个实施方式中,所述至少一种感兴趣的多核苷酸选自于由编码多肽的多核苷酸、非编码多核苷酸、包含启动子序列的多核苷酸、编码mRNA的多核苷酸、编码标签的多核苷酸和病毒多核苷酸组成的组。
由多核苷酸编码的多肽可以是治疗性活性多肽,例如抗体、抗体片段、单克隆抗体、病毒蛋白、病毒蛋白片段、抗原、激素。该多肽还可用于例如单基因疾病的基因疗法。在这种情况下,编码多肽的多核苷酸与组织特异性启动子可操作地连接。该多肽还可用于细胞疗法,特别是离体的。细胞可以是多能干细胞(iPSC)、人胚胎干(hES)细胞、人造血干细胞(HSC)或人T淋巴细胞。
非编码多核苷酸可用于基因的靶向破坏。
如果转座子插入至靠近内源基因处,则包含启动子序列的多核苷酸可以允许基因表达的激活。
多核苷酸可被转录成mRNA或功能性非编码RNA,如miRNA或gRNA。
多核苷酸可包含序列标签以识别转座元件的插入位点。
病毒多核苷酸可用于生产基于病毒颗粒的生物医药产品。
转座元件和/或包含转座元件的载体还可包含增强表达的元件(例如核输出信号、启动子、内含子、终止子、增强子、影响染色质结构的元件、RNA输出元件、IRES元件、CHYSEL元件和/或Kozak序列)、选择标志物(例如DHFR、嘌呤霉素、潮霉素、博莱霉素(zeocin)、杀稻瘟菌素和/或新霉素)、体内监测标志物(例如GFP或β-半乳糖苷酶)、限制性核酸内切酶识别位点(例如用于插入外源核苷酸序列的位点,如多克隆位点)、重组酶识别位点(例如LoxP(由Cre识别)、FRT(由Flp识别)或AttB/AttP(由PhiC31识别))、绝缘子(例如MAR或UCOE)、病毒复制序列(例如SV40 ori)和/或与DNA结合结构域相容的序列,特别是用于通过具有染色质阅读器结构域和DNA结合结构域性质(“桥接”)的附加结合分子进行靶向。
在上述方法中,不仅可以将一个而且可以将超过一个转座元件插入细胞中。转座元件可以彼此不同,例如因为其包含不同的感兴趣的多核苷酸。在必须将编码抗体重链(HC)或抗体轻链(LC)的两个ORF引入细胞的情况下,这是特别需要的。在这种情况下,两个以上ORF包含于相同的转座元件上或各自的转座元件上,优选包含于各自的转座元件上。
在第五方面,本发明涉及通过第四方面的方法可获得/生产的细胞(特别是转基因细胞)。
在第六方面,本发明涉及第五方面的细胞(特别是转基因细胞)用于生产蛋白质或病毒的用途。蛋白质可以是治疗性蛋白质。病毒可以是载体(病毒载体)。
在第七方面,本发明涉及一种试剂盒,所述试剂盒包含:
(i)包含用于插入至少一种感兴趣的多核苷酸的克隆位点的转座元件;以及
(ii)根据第一方面的多肽,
根据第二方面的多核苷酸,
根据第三方面的载体,或
至少一个异源CRE以及包含转座酶或其具有转座酶功能的片段或衍生物的多肽。
随试剂盒提供/包含于试剂盒中的转座元件缺乏编码功能性转座酶的多核苷酸。转座元件不包含编码功能性转座酶、优选天然存在的转座酶的完整序列。优选地,从转座元件中删除编码功能性转座酶、优选天然存在的转座酶或其部分的完整序列。代替编码功能性转座酶的多核苷酸,转座元件包含用于插入至少一种感兴趣的多核苷酸的克隆位点(特别是至少一个克隆位点)。最终引入转座元件的感兴趣的多核苷酸的类型取决于最终用户。转座元件可以是重组的、人工的和/或异源的转座元件。
转座酶是试剂盒的一种独立(independent)或可区分(distinct)的组件。它随试剂盒提供/包含于试剂盒中,与异源染色质阅读器元件(CRE)相连,作为根据第一方面的多肽、作为根据第二方面的多核苷酸或包含于根据第三方面的载体中(见第(ii)项)。
在替代实施方式中,包含转座酶或其具有转座酶功能的片段或衍生物的多肽随试剂盒提供/包含于试剂盒中,而不与染色质阅读器元件(CRE)(特别是染色质阅读器结构域(CRD))相连。在该特定情况下,所述包含转座酶或其具有转座酶功能的片段或衍生物的多肽以及所述染色质阅读器元件(CRE)(特别是染色质阅读器结构域(CRD))随试剂盒提供/包含于试剂盒中作为独立或可区分的组件。优选地,CRE(特别是CRD)与结合分子/部分缔合,所述结合分子/部分在引入细胞后能够结合转座酶(例如通过N端或C端),形成转座酶、结合分子/部分和CRE(特别是CRD)复合物。这当然要求所述包含转座酶或其具有转座酶功能的片段或衍生物的多肽包含允许与CRE(特别是CRD)缔合的结合分子/部分结合的结合结构域。该结合结构域优选是蛋白质结合结构域。或者,CRE(特别是CRD)与结合分子/部分缔合,所述结合分子/部分在引入细胞后能够结合转座元件。这当然要求所述转座元件包含允许与CRE(特别是CRD)缔合的结合分子/部分结合的结合结构域。该结合结构域优选是DNA结合结构域。包含转座酶或其具有转座酶功能的片段或衍生物的多肽可以是重组的、人工的和/或异源的多肽。
转座元件可以作为线性DNA分子、质粒DNA、游离DNA、病毒DNA或病毒RNA随试剂盒提供/包含于试剂盒中。优选地,转座元件包含异源启动子,其允许在将所述至少一种感兴趣的多核苷酸整合至克隆位点后转录所述至少一种感兴趣的多核苷酸。优选地,转座元件包含于载体中。
根据第二方面的多核苷酸也可以作为线性DNA分子、环状DNA分子、质粒DNA、病毒DNA、体外合成/转录的RNA或病毒RNA随试剂盒提供/包含于试剂盒中。优选地,多核苷酸与异源启动子可操作地连接,其允许所述转座酶或其具有转座酶功能的片段或衍生物以及所述至少一个染色质阅读器元件的转录。优选地,多核苷酸包含于载体中,特别是表达载体或用于体外转录的载体。
根据第二方面的多核苷酸和转座元件可以是不同载体的一部分。这使得能够调整转座酶和转座元件质粒的量,从而实现所期望的每个细胞的若干整合或尽可能多的整合。
根据第二方面的多核苷酸和转座元件也可以是相同载体的一部分。在这种情况下,优选多核苷酸位于用于插入至少一种感兴趣的多核苷酸的克隆位点的外部。
随试剂盒提供/包含于试剂盒中的转座元件保留了以反式提供的转座酶动员所需的序列。这些是位于转座元件各端的包含转座酶结合位点的重复序列,允许从基因组切除。因此,在一个实施方式中,转座元件包含末端重复(TR)。在另一个实施方式中,所述至少一种感兴趣的多核苷酸的侧翼为TR。例如,上述方法的步骤(ii)中提到的转座元件包含第一转座元件特异性末端重复和位于所述第一转座元件特异性末端重复下游的第二转座元件特异性末端重复。用于插入至少一种感兴趣的多核苷酸的克隆位点位于第一转座元件特异性末端重复和第二转座元件特异性末端重复之间。优选地,所述末端重复是反向末端重复(ITR)或长末端重复(LTR)。在这方面,应注意的是,随试剂盒提供/包含于试剂盒中的转座酶对转座元件具有特异性。换言之,转座元件可以被转座酶特异性识别。例如,II类转座酶(DNA转座酶)识别转座元件各末端处(特别是转座元件的重复序列/末端重复中)的TA二核苷酸。它还识别靶序列中的TA二核苷酸。
如上所述,根据第二方面的多核苷酸和转座元件可以是相同载体的一部分。在这种情况下,优选多核苷酸位于用于插入至少一种感兴趣的多核苷酸的克隆位点的外部。特别优选地,根据第二方面的多核苷酸位于在用于插入所述至少一种感兴趣的多核苷酸的克隆位点的侧翼的末端重复(例如反向末端重复(ITR)或长末端重复(LTR))的外面。
随试剂盒提供/包含于试剂盒中的转座元件可以来源于原核或真核生物的转座元件,其中优选后者。
转座元件可以是II类或基于DNA/DNA的转座元件。基于DNA/DNA的转座元件包含反向末端重复(ITR)。它被II类转座酶(DNA转座酶)识别。转座元件也可以是I类或反转录转座元件。反转录转座元件可以是长末端重复(LTR)反转录转座元件。LTR反转录转座元件包含长末端重复(LTR)。它被I类转座酶(反转录转座酶)识别。所述转座酶也可称为整合酶。
在一个优选实施方式中,转座元件是II类或基于DNA/DNA的转座元件。在一个更优选的实施方式中,转座元件是PiggyBac转座元件、睡美人转座元件或Tol2转座元件。优选地,PiggyBac转座元件是野生型PiggyBac转座元件、高活性PiggyBac转座元件、野生型PiggyBac样转座元件或高活性PiggyBac样转座元件。更优选地,PiggyBac样转座元件选自于由PiggyBat转座元件、来自热带爪蟾的PiggyBac样转座元件和来自家蚕的PiggyBac样转座元件组成的组。
转座元件和/或包含转座元件的载体还可包含增强表达的元件(例如核输出信号、启动子、内含子、终止子、增强子、影响染色质结构的元件、RNA输出元件、IRES元件、CHYSEL元件和/或Kozak序列)、选择标志物(例如DHFR、嘌呤霉素、潮霉素、博莱霉素、杀稻瘟菌素和/或新霉素)、体内监测标志物(例如GFP或β-半乳糖苷酶)、限制性核酸内切酶识别位点(例如用于插入外源核苷酸序列的位点,如多克隆位点)、重组酶识别位点(例如LoxP(由Cre识别)、FRT(由Flp识别)或AttB/AttP(由PhiC31识别))、绝缘子(例如MAR或UCOE)、病毒复制序列(例如SV40 ori)和/或与DNA结合结构域相容的序列,特别是用于通过具有染色质阅读器结构域和DNA结合结构域性质(“桥接”)的附加结合分子进行靶向。
所述试剂盒不仅可以包含一个而且可以包含超过一个转座元件。转座元件可以彼此不同,例如关于克隆位点和/或额外元件的特定组成。这使得能够将不同的感兴趣的多核苷酸克隆到不同的转座元件中。
在一个实施方式中,所述试剂盒用于生成细胞(特别是转基因细胞)。
在另一个实施方式中,所述试剂盒进一步包含关于如何生成细胞(特别是转基因细胞)的说明。
试剂盒还可包含容器,其中包含试剂盒的单一组分。试剂盒还可包含从商业和用户角度来看所需的材料,包括缓冲液、试剂和/或稀释剂。
在第八方面,本发明涉及一种靶向系统,所述靶向系统包含:
(i)包含至少一种感兴趣的多核苷酸的转座元件以及根据第一方面的多肽;
(ii)包含至少一种感兴趣的多核苷酸的转座元件以及根据第二方面的多核苷酸;
(iii)包含至少一种感兴趣的多核苷酸的转座元件以及根据第三方面的载体;或
(iv)包含至少一种感兴趣的多核苷酸的转座元件,
任选地与所述转座元件缔合的至少一个异源染色质阅读器元件(CRE),以及
包含转座酶或其具有转座酶功能的片段或衍生物的多肽。
靶向系统可以包含于细胞中/作为细胞的一部分,或者可以引入细胞中。靶向系统向细胞中的引入可以通过电穿孔、转染、注射、脂质转染或(病毒)感染来实现。
细胞可以是分离的细胞(例如在细胞培养物中或在细胞系中,例如稳定细胞系)。细胞也可以是生物体外的组织的细胞。细胞也可以作为生物体的一部分/包含于生物体中,所述生物体例如为真核多细胞生物体。在这种情况下,靶向系统的插入在体内实现。
在替代实施方式中,包含转座酶或其具有转座酶功能的片段或衍生物的多肽包含于靶向系统中,而不与染色质阅读器元件(CRE)(特别是染色质阅读器结构域(CRD))相连(见(iv)下的内容)。在该特定情况下,所述包含转座酶或其具有转座酶功能的片段或衍生物的多肽以及所述染色质阅读器元件(CRE)(特别是染色质阅读器结构域(CRD))作为可区分的组分包含于靶向系统中。优选地,CRE(特别是CRD)与结合分子/部分缔合,所述结合分子/部分在引入细胞后能够结合转座酶(例如通过N端或C端),形成转座酶、结合分子/部分和CRE(特别是CRD)复合物。这当然要求包含转座酶或其具有转座酶功能的片段或衍生物的多肽包含允许与CRE(特别是CRD)缔合的结合分子/部分结合的结合结构域。该结合结构域优选是蛋白质结合结构域。或者,CRE(特别是CRD)与结合分子/部分缔合,所述结合分子/部分在引入细胞后能够结合转座元件。这当然要求转座元件包含允许与CRE(特别是CRD)缔合的结合分子/部分结合的结合结构域。该结合结构域优选是DNA结合结构域。
包含转座酶或其具有转座酶功能的片段或衍生物的多肽可以是重组的、人工的和/或异源的多肽。
在一个实施方式中,包含至少一种感兴趣的多核苷酸的转座元件包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
在一个替代实施方式中,包含至少一种感兴趣的多核苷酸的转座元件和根据第二方面的多核苷酸包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
转座元件可以是重组的、人工的和/或异源的转座元件。
在一个优选实施方式中,转座元件是II类或基于DNA/DNA的转座元件。在一个更优选的实施方式中,转座元件是PiggyBac转座元件、睡美人转座元件或Tol2转座元件。优选地,PiggyBac转座元件是野生型PiggyBac转座元件、高活性PiggyBac转座元件、野生型PiggyBac样转座元件或高活性PiggyBac样转座元件。更优选地,PiggyBac样转座元件选自于由PiggyBat转座元件、来自热带爪蟾的PiggyBac样转座元件和来自家蚕的PiggyBac样转座元件组成的组。
优选地,染色质阅读器元件(CRE)是染色质阅读器结构域(CRD)。
关于转座元件的进一步优选实施方式,参考本发明的第四方面或第七方面。
在另一方面,本发明涉及一种靶向系统,所述靶向系统包含:(i)包含至少一种感兴趣的多核苷酸的转座元件;以及(ii)包含转座酶或其具有转座酶功能的片段或衍生物的多肽,其特征在于,所述转座元件和/或所述包含转座酶或其具有转座酶功能的片段或衍生物的多肽与异源染色质阅读器元件(CRE)(优选染色质阅读器结构域(CRD))直接缔合(优选通过共价融合/附接)或间接缔合(优选通过结合分子)。
关于转座元件的优选实施方式,参考本发明的第四方面和/或第七方面。
在另一方面,本发明涉及一种(转基因)细胞,所述细胞包含:
包含至少一种感兴趣的多核苷酸的转座元件;以及
根据第一方面的多肽,
根据第二方面的多核苷酸,或
根据第三方面的载体。
关于细胞和转座元件的进一步优选实施方式,参考本发明的第四方面。
在另一方面,本发明涉及包含异源转座元件的(转基因)细胞,所述异源转座元件包含至少一种感兴趣的多核苷酸,其中,所述异源转座元件主要地(predominantly)、优选专一地(exclusively)整合于/位于转录活性基因组结构(常染色质)中。更优选地,所述异源转座元件主要地、优选专一地整合于/位于转录活性启动子区域中。所述细胞已经用根据第八方面的靶向系统进行处理。
关于细胞和转座元件的进一步优选实施方式,参考本发明的第四方面。
在不脱离本发明范围的情况下,本发明的各种修改和变化对本领域技术人员而言将是显而易见的。尽管结合具体的优选实施方式描述了本发明,但是应当理解,所要求保护的本发明不应不适当地限制于此类特定实施方式。实际上,本发明旨在覆盖对相关领域中的技术人员而言显而易见的用于实施本发明的所描述的方式的各种修改。
附图说明
以下附图和实施例仅为对本发明的说明,而不应解释为以任何方式限制如所附权利要求所指示的本发明的范围。
图1:合成的转座酶构建体。PiggyBac wt(PBw):wt PiggyBac转座酶,粉纹夜蛾,GenBank登录号#AAA87375.2;高活性PiggyBac(haPB):与根据GenBank登录号#AAA87375.2的wt PiggyBac转座酶相比,在I30V、G165S、M282V、N538K中突变的转座酶;TAF3 PHD:TafIID sub III PHD结构域,智人(Homo sapiens),GenBank登录号#NP_114129.1 855..929;KAT2A溴结构域:组蛋白乙酰转移酶KAT2A溴结构域,智人,GenBank登录号NP_066564.2 741..837;L1:肽接头,KLGGGAPAVGGGPKKLGGGAPAVGGGPK,SEQ ID NO:22;L2:肽接头,AAAKLGGGAPAVGGGPKAADKGAA,SEQ ID NO:23。Taf3-haPB的编码序列(CDS)示于SEQ IDNO:1,KATA2A-PBw-TAF3的编码序列(CDS)示于SEQ ID NO:3。SEQ ID NO:2示出了Taf3-haPB的氨基酸序列,SEQ ID NO:4示出了KATA2A-PBw-TAF3的氨基酸序列。
图2:PiggyBac融合蛋白的测试变体。PiggyBac wt(PBw):wt PiggyBac转座酶,粉纹夜蛾,GenBank登录号#AAA87375.2;高活性PiggyBac(haPB):与wt PiggyBac转座酶相比,在I30V、G165S、M282V、N538K中突变的转座酶;TAF3 PHD:TafIID sub III PHD结构域,智人,GenBank登录号#NP_114129.1 855..929;KAT2A溴结构域:组蛋白乙酰转移酶KAT2A溴结构域,智人,GenBank登录号NP_066564.2 741..837;L1:肽接头,KLGGGAPAVGGGPKKLGGGAPAVGGGPK,SEQ ID NO:22;L2:肽接头,AAAKLGGGAPAVGGGPKAADKGAA,SEQ ID NO:23。核苷酸序列和相应的氨基酸序列如下所列:对于KATA2A-PBw-TAF3为SEQ IDNO:3和SEQ ID NO:4;对于PBw为SEQ ID NO:5和SEQ ID NO:6;对于TAF3-PBw为SEQ ID NO:7和SEQ ID NO:8;对于PBw-TAF3为SEQ ID NO:9和SEQ ID NO:10;对于KAT2A-PBw为SEQ IDNO:11和SEQ ID NO:12;对于haPB为SEQ ID NO:13和SEQ ID NO:14;对于KATA2A-haPB-TAF3为SEQ ID NO:15和SEQ ID NO:16;对于KATA2A-haPB为SEQ ID NO:29和SEQ ID NO:30;以及对于haPB-TAF3为SEQ ID NO:31和SEQ ID NO:32。
图3:PBGGPEx2.0p_hc_PiggyBG和PBGGPEx2.0m_lc_PiggyBG的图谱。启动子区域显示为蓝色块:EF2/CMV杂合启动子=强重链启动子,CMV/EF1杂合启动子=强轻链启动子。聚腺苷酸化信号=pA显示为黄色框。抗生素抗性基因、选择标志物基因和针对轻链基因或者重链基因的编码区显示为橙色箭头:pac=嘌呤霉素-N-乙酰转移酶;dhfr=脱氢叶酸还原酶;aph=卡那霉素抗性。
图4:用不同PiggyBac融合蛋白生成的CHO-DG44克隆池的IgG抗体浓度。
图5:用不同高活性PiggyBac融合蛋白生成的CHO-DG44克隆池的IgG抗体滴度浓度。
图6:A:用或不用不同高活性PiggyBac转座酶生成的CHO-DG44克隆池的IgG抗体滴度浓度。B:用于分析和区分总转基因拷贝数和随机整合转基因的实时PCR策略。灰色箭头=用于检测随机整合转基因的PCR。白色箭头:用于检测源自随机整合和转座酶介导的整合的转基因拷贝的PCR。C:实时PCR结果。相对于在无转座酶的情况下生成的样品,源自于高活性转座酶或高活性融合结构域变体TAF3-haPB的样品的总转基因拷贝数和随机整合转基因拷贝数。
实施例
下面给出的实施例仅用于说明目的,绝不以任何方式限制上述发明。
实施例1
基因优化与合成
将PiggyBac wt转座酶(粉纹夜蛾;GenBank登录号#AAA87375.2;SEQ ID NO:6[Virology 172(1)156-169 1989])、高活性PiggyBac转座酶(与PiggyBac wt转座酶相比I30V、G165S、M282V、N538K;SEQ ID NO:6)、TafIID sub III PHD结构域(智人;GenBank登录号#NP_114129.1855..929;SEQ ID NO:20)、组蛋白乙酰转移酶KAT2A溴结构域(智人;GenBank登录号NP_066564.2 741..837;SEQ ID NO:21)和两个肽接头(接头1:KLGGGAPAVGGGPKKLGGGAPAVGGGPK,SEQ ID NO:22;接头2:AAAKLGGGAPAVGGGPKAADKGAA,SEQID NO:23)的氨基酸序列反向翻译,并将得到的核苷酸序列如图1所示进行连接。
核苷酸序列通过敲除隐蔽剪接位点和RNA去稳定序列元件而进行优化,优化以用于提高RNA稳定性并适应于匹配CHO细胞(中国仓鼠(Cricetulus griseus))针对密码子使用的要求。核苷酸序列由GeneArt Gene Synthesis(Life Technologies)合成。Taf3-haPB的编码序列(CDS)示于SEQ ID NO:1,KATA2A-PBw-TAF3的编码序列(CDS)示于SEQ ID NO:3。SEQ ID NO:2示出了Taf3-haPB的氨基酸序列,SEQ ID NO:4示出了KATA2A-PBw-TAF3的氨基酸序列。
实施例2
转座酶表达质粒的构建
使用标准克隆程序将合成的构建体用于生成图2a和图2b中所示的构建体。生成的构建体的核苷酸序列在此处如下所列:SEQ ID NO:3(KATA2A-PBw-TAF3)、SEQ ID NO:5(PBw)、SEQ ID NO:7(TAF3-PBw)、SEQ ID NO:9(PBw-TAF3)、SEQ ID NO:11(KAT2A-PBw)、SEQID NO:1(Taf3-haPB)、SEQ ID NO:13(haPB)、SEQ ID NO:15(KATA2A-haPB-TAF3)、SEQ IDNO:29(KATA2A-haPB)和SEQ ID NO:31(haPB-TAF3)。将构建体连接到表达载体中,这使得转座酶变体能够在CMV启动子的控制下瞬时表达。Sambrook,J.,E.F.Fritsch andT.Maniatis:Cloning I/II/III,A Laboratory Manual New York/Cold Spring HarborLaboratory Press,1989,第二版中对用于构建表达质粒的一般程序进行了描述。
实施例3
转座子质粒的构建
创建包含PiggyBac转座酶识别的PiggyBac ITR的转座子。通过使用如SEQ ID NO:17(V1028_Piggy_正向)和SEQ ID NO:18(V1029_Piggy_反向)或者SEQ ID NO:17(V1028_Piggy_正向)和SEQ ID NO:19(V1036Pbac_反向2)所列的引物V1028_Piggy_正向、V1029_Piggy_反向和V1036Pbac_反向2对细菌骨架进行扩增,并通过限制性酶消化使用NdeI+NheI(PBGGPEx2.0m)或者SfiI+NheI(PBGGPEx2.0p)将相应载体的骨架替换为PCR产物之一,在空表达载体PBGGPEx2.0m和PBGGPEx2.0p中将PiggyBac转座子的最小ITR序列整合至具有细菌复制起点和抗生素抗性基因的细菌骨架序列的5'和3'位置,生成PBGGPEx2.0p_PiggyBG和PBGGPEx2.0m_PiggyBG。
将组装有信号肽的单克隆抗体的合成重链或轻链片段连接至含有转座子的空表达载体PBGGPEx2.0p_PiggyBG和PBGGPEx2.0m_PiggyBG,生成PBGGPEx2.0p_hc_PiggyBG和PBGGPEx2.0m_lc_PiggyBG(图3)。Sambrook,J.,E.F.Fritsch and T.Maniatis:Cloning I/II/III,A Laboratory Manual New York/Cold Spring Harbor Laboratory Press,1989,第二版中对用于构建表达质粒的一般程序进行了描述。
实施例4
克隆池(Clone Pool)的生成和分析
使用二氢叶酸还原酶缺陷型CHO细胞系CHO/DG44[Urlaub等,1986,Proc NatlAcad Sci USA.83(2):337-341]作为起始细胞系。细胞系保持在无血清培养基中。通过电穿孔根据制造商说明(Neon Transfection System,Thermo Fisher Scientific)对含有PB转座子的质粒(PBGGPEx2.0p_hc_PiggyBG和PBGGPEx2.0m_lc_PiggyBG)和用于表达各个转座酶变体之一的瞬时表达载体进行转染。在每次转染中,使用1.5μg环状HC和LC转座子载体DNA和1.2μg环状转座酶DNA。用嘌呤霉素和甲氨蝶呤对转染子进行选择以消除未转染的细胞以及非生产者和低生产者。使用相同的载体组合、DNA量和选择条件进行两个连续系列的转染和选择。在两周的选择期之后,将选择压力移除,并以确定的接种细胞密度在通用条件下对所得克隆池进行分批补料工艺(Fed-batch process)。分批补料工艺在摇瓶(SF125,Corning)中在化学成分确定的培养基中进行,工作体积为30mL。按照通用补料方案,每两天施用化学成分确定的补料。细胞培养上清液样品的抗体浓度通过
Figure BDA0003208511340000361
RED96系统(Fortebio)针对所表达的抗体的纯化材料(作为标准曲线)来确定。
图4示出了源自于wt PiggyBac转座酶和wt PiggyBac融合变体的克隆池的分批补料结果。对于用KAT2A-PBw、TAF3-PBw、PBw-TAF3和KAT2A-PBw-TAF3融合变体以及wtPiggyBac转座酶生成的克隆池,在分批补料工艺的第14天测定抗体产率。对于融合至N端的TAF3观察到单个染色质阅读器引起最强增加(TAF3-PBw:基于各自池的算术平均值为8.4倍);当融合至C端时则略少(PBw-TAF3:5.7倍)。以相同方式融合的KAT2A(KAT2A-PBw)观察到非常温和的增加(1.3倍)。添加第二染色质阅读器结构域(在这种情况下为KAT2A)是有帮助的:与PBw-TAF3相比,用KAT2A-PBw-TAF3生成的池显示出1.7倍的更高表达。
图5示出了不同融合结构域对高活性(ha)转座酶的影响。源自于该转座酶的克隆池实现了为wt PiggyBac转座酶池约5.1倍高的抗体浓度。相比高活性PiggyBac转座酶池,发现KAT2A-haPB、TAF3-haPB、haPB-TAF3和KAT2A-haPB-TAF3融合变体克隆池的抗体产率为约2倍、约2.8倍、约2.4倍和2.9倍高。因此,染色质阅读器结构域不仅促进了引入有wt转座酶的盒的表达,而且还适用于高活性形式。值得注意的是,融合结构域不仅改善了wtPiggyBac和高活性PiggyBac转座酶二者,而且表达水平高度相似,不依赖于裸转座酶的活性。
实施例5
转座子的转座酶特异性基因组整合
尽管转染混合物中存在转座酶表达单元,但含有转座子的环状质粒也可以通过转座酶非依赖性方式整合至宿主基因组中。在这种情况下,将质粒随机线性化,并将骨架和转座子序列整合。与之不同,转座酶仅介导转座子序列的整合。转座酶非依赖性整合的频率在以相同转染和选择条件实施的转染之间相当相似,可以作为内部标准。对于整个质粒的这种随机整合,完全位于转座子内的片段和到达质粒骨架中的片段的丰度相同。在存在任何转座酶的情况下生成的池中,转座子序列将具有更高丰度。纯转座子片段(转座酶介导的和随机整合事件)与到达骨架中的片段(随机整合事件)的比率是转座酶活性的衡量标准。
通过实时qPCR对转座子的基因组整合进行分析。对于样品制备,除DNA量外,如实施例4中所述在分批补料工艺中产生克隆池并进行分析。转染了7μg转座子载体DNA和2.8μg转座酶载体DNA。使用仅环状转座子载体生成额外的克隆池。对于每个克隆池,使用QIAampDNA Blood Mini试剂盒(QIAGEN,REF:51104)和来自Blood or Body Fluids,SpinProtocol的DNA纯化从2E6个活细胞中纯化基因组DNA。基因组DNA浓度通过NanoPhotometerNP80(Implen)确定,基因组DNA样品用DEPC处理水(Invitrogen,REF:46-2224)稀释至10ng/μl的浓度。PCR反应混合物如下制备:90nM正向引物,90nM反向引物,50ng样品DNA,10μLPower SYBR Green PCR Master Mix(Applied Biosystems,REF:4367659),用DEPC处理水(Invitrogen,REF:46-2224)添加至20μL。使用StepOnePlus实时PCR系统(AppliedBiosystems)一式三份地对样品进行分析。对每个样品进行三个不同的引物组和PCR反应。
为了测量特异性整合转座子和随机整合质粒DNA的比率,使用引物V1075 PBG正向(TATTGGTAGCCCACAAGCTG;SEQ ID NO:26)和V1076 PBG反向1(TTTCTTTCAGTGCTATGTTATGGTG;SEQ ID NO:27)或者V1075 PBG正向(TATTGGTAGCCCACAAGCTG;SEQ ID NO:26)和V1077 PBG反向2(GGTTGTGCTGTGACGCT;SEQ IDNO:28)扩增转座子内的小片段(77bp片段,特异性针对转座子的整合和质粒DNA的随机整合)或包含5'PiggyBac ITR的片段(169bp片段,特异性针对质粒DNA的随机整合)(图6)。为了对不同样品进行归一化和比较,使用引物V455 qPCR-ALU-正向(TAAgAgCACCAACTgCTCTTCCA;SEQ ID NO:33)和V456 qPCR-ALU-反向(ACCAgAAgAgggCACCAgATCT;SEQ ID NO:34)扩增内源ALU序列。应用以下PCR条件:95℃10分钟,95℃15秒,60℃60秒,40个循环。使用比较CT(ΔΔCT)方法对实时PCR数据进行分析。
对3个池进行比较:第一个池用转座酶生成,第二个池用融合至TAF3结构域的相同转座酶(TAF3-haPB)生成,第三个池则未用任何转座酶生成。如图6A所示,在分批补料工艺中分别测量到1100μg/ml、2500μg/ml和115μg/ml的滴度。
使用图6B中所示的实时PCR检测策略,如图6C中所概括的,针对转座子特异性片段(所有整合事件(A)–转座酶介导的和随机的)与包含转座子和骨架序列二者的片段(仅随机(R))的相对拷贝数,对三个克隆池的基因组DNA样品进行了分析。转座酶介导的整合(T)的相对拷贝数可以计算为A-R=T。
在不存在转座酶的情况下A=R且T=0。因此,将针对R和A二者确定的相对拷贝数设置为1,以考虑不同长度的PCR片段。
在存在任何转座酶的情况下A>>R,可以确定转座酶依赖性整合与随机整合的比率。对于无融合结构域的转座酶,该比率为T/R=A-R/R=0.84。尽管在给定条件下随机整合在拷贝数方面仍然略占主导地位,但来自各个池的表达要高得多,显示出转座酶方法的益处。这可能是由于去除了转基因旁边的原核骨架序列以及转座酶本身对活性位点的选择。对于具有TAF3融合结构域的转座酶,该比率为T/R=A-R/R=1.86。此处,转座酶依赖性整合事件占主导地位。与随机方法相比,相应的细胞受益于选择标志物基因的更高表达,这引起在选择过程中更早的恢复和增殖,同时损失了含有随机整合拷贝的细胞。此外,与使用未修饰转座酶获得的滴度相比,使用该池获得的滴度为2.5倍高。引人注目的是,染色质阅读器结构域可以明显增强在此类选择的背景下转座酶本身对高活性位点的选择严格性。
序列表
<110> ProBioGen AG
<120> 具有增强的插入位点选择特性的转座酶
<130> 513-33 PCT
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 2120
<212> DNA
<213> 人工序列
<220>
<223> Taf3-haPB
<220>
<221> CDS
<222> (16)..(2109)
<400> 1
accggtggat ccggc atg gtc atc aga gat gag tgg ggc aat cag atc tgg 51
Met Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp
1 5 10
atc tgt ccc ggc tgc aac aag cct gac gac ggc tct cct atg atc ggc 99
Ile Cys Pro Gly Cys Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly
15 20 25
tgc gac gac tgt gac gac tgg tat cac tgg cct tgc gtg ggc atc atg 147
Cys Asp Asp Cys Asp Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met
30 35 40
acc gct cca cct gaa gag atg cag tgg ttc tgc ccc aag tgc gcc aac 195
Thr Ala Pro Pro Glu Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn
45 50 55 60
aag aag aag gat aag aag cac aag aag cgg aag cac aga gcc cac aag 243
Lys Lys Lys Asp Lys Lys His Lys Lys Arg Lys His Arg Ala His Lys
65 70 75
ctt gga ggt ggt gct cct gct gtt ggc ggc gga cct aaa aaa ctt gga 291
Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly
80 85 90
ggc gga gca cca gct gtc ggc gga ggt cct aaa gcc atg gga tct tct 339
Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser
95 100 105
ctg gac gac gag cac atc ctg tct gcc ctg ctg cag tct gac gat gaa 387
Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu
110 115 120
ctc gtg ggc gaa gat tcc gac tcc gag gtg tcc gac cat gtg tct gag 435
Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp His Val Ser Glu
125 130 135 140
gac gac gtg cag tcc gat acc gag gaa gcc ttc atc gac gag gtg cac 483
Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His
145 150 155
gaa gtg cag cct acc tct tcc ggc tct gag atc ctg gac gag cag aac 531
Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn
160 165 170
gtg atc gag cag cct gga tct tcc ctg gcc tcc aac aga atc ctg aca 579
Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr
175 180 185
ctg cct cag cgg acc atc cgg ggc aag aac aag cac tgc tgg tcc acc 627
Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr
190 195 200
tct aag agc acc cgg cgg tct aga gtg tcc gct ctg aat att gtg cgg 675
Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg
205 210 215 220
tcc cag agg ggc ccc acc aga atg tgc cgg aac atc tac gac cct ctg 723
Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu
225 230 235
ctg tgc ttc aag ctg ttc ttc acc gac gag atc atc tcc gag atc gtg 771
Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val
240 245 250
aag tgg acc aac gcc gag atc tct ctg aag cgg cgc gag tct atg acc 819
Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr
255 260 265
tct gcc acc ttc cgg gac acc aac gag gat gag atc tac gcc ttc ttc 867
Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe
270 275 280
ggc atc ctg gtc atg aca gcc gtg cgg aag gac aac cac atg tcc acc 915
Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn His Met Ser Thr
285 290 295 300
gac gac ctg ttc gac aga tcc ctg tcc atg gtg tac gtg tcc gtg atg 963
Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr Val Ser Val Met
305 310 315
tcc agg gac aga ttc gac ttc ctg atc cgg tgc ctg cgg atg gac gac 1011
Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp
320 325 330
aag tct atc aga ccc aca ctg cgc gag aac gac gtg ttc aca cct gtg 1059
Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val
335 340 345
cgg aag atc tgg gac ctg ttc atc cac cag tgc atc cag aac tac acc 1107
Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr
350 355 360
cct ggc gct cac ctg acc atc gac gaa cag ctg ctg ggc ttc aga ggc 1155
Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly
365 370 375 380
aga tgc cct ttc cgg gtg tac atc ccc aac aag ccc tct aag tac ggc 1203
Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly
385 390 395
atc aag atc ctg atg atg tgc gac tcc ggc acc aag tac atg atc aac 1251
Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn
400 405 410
ggc atg ccc tac ctc ggc aga ggc acc caa aca aat ggc gtg cca ctg 1299
Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu
415 420 425
ggc gag tac tac gtg aaa gaa ctg tcc aag cct gtg cac ggc tcc tgc 1347
Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys
430 435 440
aga aac atc acc tgt gat aac tgg ttc acc tcc att cct ctg gcc aag 1395
Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys
445 450 455 460
aac ctg ctg caa gag cct tac aag ctg aca atc gtg ggc acc gtg cgg 1443
Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg
465 470 475
tcc aac aag cgg gaa att cct gag gtg ctg aag aac tct cgg tcc aga 1491
Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg
480 485 490
cct gtg ggc acc tcc atg ttc tgt ttc gac ggc cct ctg aca ctg gtg 1539
Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val
495 500 505
tcc tac aag cct aag cct gcc aag atg gtg tac ctg ctg tcc tcc tgt 1587
Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys
510 515 520
gac gag gac gcc agc atc aat gag tcc acc ggc aag ccc cag atg gtc 1635
Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val
525 530 535 540
atg tac tac aac cag acc aaa ggc ggc gtg gac acc ctg gac cag atg 1683
Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met
545 550 555
tgc tct gtg atg acc tgc tcc aga aag acc aac aga tgg ccc atg gct 1731
Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala
560 565 570
ctg ctg tac ggc atg atc aat atc gcc tgc atc aac agc ttc atc atc 1779
Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile
575 580 585
tac tcc cac aac gtg tcc tcc aag ggc gag aag gtg cag tcc cgg aaa 1827
Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys
590 595 600
aag ttc atg cgg aac ctg tat atg tcc ctg acc tcc agc ttc atg aga 1875
Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg
605 610 615 620
aag cgg ctg gaa gcc cct aca ctg aag cgc tac ctg cgg gac aac atc 1923
Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile
625 630 635
tcc aac atc ctg cct aaa gag gtg ccc ggc acc agc gac gac tct aca 1971
Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser Asp Asp Ser Thr
640 645 650
gag gaa ccc gtg atg aag aag agg acc tac tgc acc tac tgt ccc tcc 2019
Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser
655 660 665
aag atc cgg cgg aag gcc aac gcc tct tgc aaa aag tgc aag aaa gtg 2067
Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val
670 675 680
atc tgc cgc gag cac aac atc gat atg tgc cag tcc tgc ttc 2109
Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser Cys Phe
685 690 695
tgagcggccg c 2120
<210> 2
<211> 698
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 2
Met Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly
1 5 10 15
Cys Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys
20 25 30
Asp Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro
35 40 45
Glu Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp
50 55 60
Lys Lys His Lys Lys Arg Lys His Arg Ala His Lys Leu Gly Gly Gly
65 70 75 80
Ala Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro
85 90 95
Ala Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu
100 105 110
His Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu
115 120 125
Asp Ser Asp Ser Glu Val Ser Asp His Val Ser Glu Asp Asp Val Gln
130 135 140
Ser Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln Pro
145 150 155 160
Thr Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln
165 170 175
Pro Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg
180 185 190
Thr Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr
195 200 205
Arg Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly
210 215 220
Pro Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys
225 230 235 240
Leu Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn
245 250 255
Ala Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Ser Ala Thr Phe
260 265 270
Arg Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val
275 280 285
Met Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe
290 295 300
Asp Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp Arg
305 310 315 320
Phe Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg
325 330 335
Pro Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp
340 345 350
Asp Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His
355 360 365
Leu Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe
370 375 380
Arg Val Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu
385 390 395 400
Met Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr
405 410 415
Leu Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr
420 425 430
Val Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr
435 440 445
Cys Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln
450 455 460
Glu Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg
465 470 475 480
Glu Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr
485 490 495
Ser Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro
500 505 510
Lys Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala
515 520 525
Ser Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn
530 535 540
Gln Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val Met
545 550 555 560
Thr Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly
565 570 575
Met Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn
580 585 590
Val Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg
595 600 605
Asn Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu
610 615 620
Ala Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu
625 630 635 640
Pro Lys Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val
645 650 655
Met Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg
660 665 670
Lys Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu
675 680 685
His Asn Ile Asp Met Cys Gln Ser Cys Phe
690 695
<210> 3
<211> 2546
<212> DNA
<213> 人工序列
<220>
<223> KAT2A-PBw-Taf3
<220>
<221> CDS
<222> (16)..(2538)
<400> 3
accggtggat ccggc atg aag gaa aag ggc aaa gag ctg aag gac ccc gac 51
Met Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp
1 5 10
cag ctg tac acc aca ctg aag aat ctg ctg gcc cag atc aag tct cac 99
Gln Leu Tyr Thr Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His
15 20 25
ccc tcc gcc tgg cct ttc atg gaa ccc gtg aag aag tct gag gcc cct 147
Pro Ser Ala Trp Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro
30 35 40
gac tac tac gaa gtg atc aga ttc ccc atc gac ctc aag acc atg acc 195
Asp Tyr Tyr Glu Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr
45 50 55 60
gag cgg ctg aga tcc cgg tac tac gtg acc aga aag ctg ttc gtg gcc 243
Glu Arg Leu Arg Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala
65 70 75
gac ctg cag aga gtg atc gcc aac tgt aga gag tac aac cct cct gac 291
Asp Leu Gln Arg Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp
80 85 90
tcc gag tac tgc aga tgc gcc tcc gct ctg gaa aag ttc ttc tac ttc 339
Ser Glu Tyr Cys Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe
95 100 105
aag ctg aaa gaa ggc ggc ctg atc gac aag aag ctt gga ggc gga gca 387
Lys Leu Lys Glu Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala
110 115 120
cca gct gtt ggc gga gga cct aaa aaa ctc gga ggt ggc gct cct gct 435
Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala
125 130 135 140
gtc gga ggc gga cct aaa gct atg ggc agc tct ctg gac gac gag cac 483
Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His
145 150 155
atc ctg tct gcc ctg ctg cag tcc gac gat gaa cta gtg ggc gaa gat 531
Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp
160 165 170
tcc gac tcc gag atc tcc gat cac gtg tcc gag gac gac gtg cag tct 579
Ser Asp Ser Glu Ile Ser Asp His Val Ser Glu Asp Asp Val Gln Ser
175 180 185
gat acc gag gaa gcc ttc atc gac gag gtg cac gaa gtg cag cct acc 627
Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr
190 195 200
tct tcc ggc tct gag atc ctg gac gag cag aac gtg atc gag cag cct 675
Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro
205 210 215 220
gga tcc tct ctg gcc tcc aac aga atc ctg aca ctg ccc cag aga acc 723
Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr
225 230 235
atc cgg ggc aag aac aag cac tgc tgg tcc acc tcc aag tct acc cgg 771
Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg
240 245 250
cgg tct aga gtg tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc 819
Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro
255 260 265
acc aga atg tgc cgg aac atc tac gac cct ctg ctg tgt ttc aag ctg 867
Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu
270 275 280
ttc ttc acc gac gag atc atc agc gag atc gtg aag tgg acc aac gcc 915
Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala
285 290 295 300
gag atc agc ctg aag cgg cgg gaa tct atg acc ggc gcc acc ttc aga 963
Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe Arg
305 310 315
gac acc aac gag gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg 1011
Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met
320 325 330
aca gcc gtg cgg aag gac aac cac atg tcc acc gac gac ctg ttc gac 1059
Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp
335 340 345
aga tcc ctg tcc atg gtg tac gtg tcc gtg atg agc cgg gac aga ttc 1107
Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe
350 355 360
gac ttc ctg atc cgg tgc ctg cgg atg gac gac aag tcc atc aga ccc 1155
Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro
365 370 375 380
aca ctg cgc gag aac gac gtg ttc aca cct gtg cgg aag atc tgg gac 1203
Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp
385 390 395
ctg ttc atc cac cag tgc atc cag aac tac acc cct ggc gct cac ctg 1251
Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu
400 405 410
acc atc gat gaa cag ctg ctg ggc ttc aga ggc aga tgc ccc ttc aga 1299
Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg
415 420 425
atg tac atc ccc aac aag ccc tct aag tac ggc atc aag atc ctg atg 1347
Met Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met
430 435 440
atg tgc gac tcc ggc acc aag tac atg atc aac ggc atg ccc tac ctc 1395
Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu
445 450 455 460
ggc aga ggc acc caa aca aat ggc gtg cca ctg ggc gag tac tat gtg 1443
Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val
465 470 475
aaa gaa ctg tcc aag cct gtg cac ggc tcc tgc aga aac atc acc tgt 1491
Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys
480 485 490
gac aac tgg ttc acc agc att cct ctg gcc aag aac ctg ctg caa gag 1539
Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu
495 500 505
ccc tac aag ctg aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa 1587
Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu
510 515 520
att cct gag gtg ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc 1635
Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser
525 530 535 540
atg ttc tgt ttc gac ggc cct ctg aca ctg gtg tcc tac aag cct aag 1683
Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys
545 550 555
cct gcc aag atg gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc 1731
Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser
560 565 570
atc aat gag tcc acc ggc aag ccc cag atg gtc atg tac tac aac cag 1779
Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln
575 580 585
acc aaa ggc ggc gtg gac acc ctg gac cag atg tgc tct gtg atg acc 1827
Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr
590 595 600
tgc tcc aga aag acc aac aga tgg ccc atg gct ctg ctg tac ggc atg 1875
Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met
605 610 615 620
atc aat atc gcc tgc atc aac agc ttc atc atc tac tcc cac aac gtg 1923
Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val
625 630 635
tcc tcc aag ggc gag aag gtg cag tcc cgg aag aaa ttc atg cgg aac 1971
Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn
640 645 650
ctg tat atg tcc ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc 2019
Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala
655 660 665
cct act ctg aag aga tac ctg cgg gac aac atc tcc aac atc ctg cct 2067
Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro
670 675 680
aac gag gtg ccc ggc acc agc gac gat tct aca gag gaa cct gtg atg 2115
Asn Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met
685 690 695 700
aag aag cgg acc tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag 2163
Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys
705 710 715
gcc aac gcc tct tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac 2211
Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His
720 725 730
aac atc gac atg tgc cag tct tgt ttc gcc gct gct aaa ctt ggt ggt 2259
Asn Ile Asp Met Cys Gln Ser Cys Phe Ala Ala Ala Lys Leu Gly Gly
735 740 745
ggc gcg ccg gca gtc ggc gga ggt cca aaa gct gct gat aag ggc gct 2307
Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Ala Ala Asp Lys Gly Ala
750 755 760
gcc gtg atc aga gat gag tgg ggc aat cag atc tgg atc tgt cct ggc 2355
Ala Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly
765 770 775 780
tgc aac aag cct gac gac ggc tct cct atg atc ggc tgc gac gac tgt 2403
Cys Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys
785 790 795
gac gat tgg tat cac tgg ccc tgc gtg ggc atc atg acc gct cca cct 2451
Asp Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro
800 805 810
gaa gaa atg cag tgg ttc tgc ccc aag tgc gcc aac aag aag aag gat 2499
Glu Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp
815 820 825
aag aag cac aag aag cgc aag cac agg gcc cac tga tga gcggccgc 2546
Lys Lys His Lys Lys Arg Lys His Arg Ala His
830 835
<210> 4
<211> 839
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
Met Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp Gln Leu Tyr Thr
1 5 10 15
Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His Pro Ser Ala Trp
20 25 30
Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro Asp Tyr Tyr Glu
35 40 45
Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr Glu Arg Leu Arg
50 55 60
Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala Asp Leu Gln Arg
65 70 75 80
Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp Ser Glu Tyr Cys
85 90 95
Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe Lys Leu Lys Glu
100 105 110
Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly
115 120 125
Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly
130 135 140
Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
145 150 155 160
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
165 170 175
Ile Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
180 185 190
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
195 200 205
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
210 215 220
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
225 230 235 240
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
245 250 255
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
260 265 270
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
275 280 285
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
290 295 300
Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu
305 310 315 320
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
325 330 335
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
340 345 350
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
355 360 365
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
370 375 380
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
385 390 395 400
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
405 410 415
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro
420 425 430
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
435 440 445
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
450 455 460
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
465 470 475 480
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
485 490 495
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
500 505 510
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
515 520 525
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
530 535 540
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
545 550 555 560
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
565 570 575
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
580 585 590
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
595 600 605
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
610 615 620
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
625 630 635 640
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
645 650 655
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
660 665 670
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro
675 680 685
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
690 695 700
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
705 710 715 720
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
725 730 735
Cys Gln Ser Cys Phe Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala
740 745 750
Val Gly Gly Gly Pro Lys Ala Ala Asp Lys Gly Ala Ala Val Ile Arg
755 760 765
Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys Asn Lys Pro
770 775 780
Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys Asp Asp Trp Tyr
785 790 795 800
His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro Glu Glu Met Gln
805 810 815
Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys Lys His Lys
820 825 830
Lys Arg Lys His Arg Ala His
835
<210> 5
<211> 1807
<212> DNA
<213> 人工序列
<220>
<223> PBw
<220>
<221> CDS
<222> (12)..(1799)
<400> 5
accggtccgg c atg ggc tct agc ctg gac gac gag cac att ctg tct gcc 50
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
1 5 10
ctg ctg cag tcc gac gat gaa ctc gtg ggc gaa gat tcc gac tcc gag 98
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
15 20 25
atc tct gac cac gtg tcc gag gac gac gtg cag tct gat acc gag gaa 146
Ile Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
30 35 40 45
gcc ttc atc gac gag gtg cac gaa gtg cag cct acc tct tcc ggc tct 194
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
50 55 60
gag atc ctg gac gag cag aac gtg atc gag cag cct gga tcc tct ctg 242
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
65 70 75
gcc tcc aac aga atc ctg aca ctg ccc cag aga acc atc cgg ggc aag 290
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
80 85 90
aac aag cac tgc tgg tcc acc tcc aag tct acc cgg cgg tct aga gtg 338
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
95 100 105
tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc acc aga atg tgc 386
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
110 115 120 125
cgg aac atc tac gac cct ctg ctg tgt ttc aag ctg ttc ttc acc gac 434
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
130 135 140
gag atc atc agc gag atc gtg aag tgg acc aac gcc gag atc agc ctg 482
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
145 150 155
aag cgg cgg gaa tct atg acc ggc gcc acc ttc aga gac acc aac gag 530
Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu
160 165 170
gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg aca gcc gtg cgg 578
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
175 180 185
aag gac aac cac atg tcc acc gac gac ctg ttc gac aga tcc ctg tcc 626
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
190 195 200 205
atg gtg tac gtg tcc gtg atg agc cgg gac aga ttc gac ttc ctg atc 674
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
210 215 220
cgg tgc ctg cgg atg gac gac aag tcc atc aga ccc aca ctg cgc gag 722
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
225 230 235
aac gac gtg ttc aca cct gtg cgg aag atc tgg gac ctg ttc atc cac 770
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
240 245 250
cag tgc atc cag aac tac acc cct ggc gct cac ctg acc atc gat gaa 818
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
255 260 265
cag ctg ctg ggc ttc aga ggc aga tgc ccc ttc aga atg tac atc ccc 866
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro
270 275 280 285
aac aag ccc tct aag tac ggc atc aag atc ctg atg atg tgc gac tcc 914
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
290 295 300
ggc acc aag tac atg atc aac ggc atg ccc tac ctc ggc aga ggc acc 962
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
305 310 315
caa aca aat ggc gtg cca ctg ggc gag tac tat gtg aaa gaa ctg tcc 1010
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
320 325 330
aag cct gtg cac ggc tcc tgc aga aac atc acc tgt gac aac tgg ttc 1058
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
335 340 345
acc agc att cct ctg gcc aag aac ctg ctg caa gag ccc tac aag ctg 1106
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
350 355 360 365
aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa att cct gag gtg 1154
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
370 375 380
ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc atg ttc tgt ttc 1202
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
385 390 395
gac ggc cct ctg aca ctg gtg tcc tac aag cct aag cct gcc aag atg 1250
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
400 405 410
gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc atc aat gag tcc 1298
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
415 420 425
acc ggc aag ccc cag atg gtc atg tac tac aac cag acc aaa ggc ggc 1346
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
430 435 440 445
gtg gac acc ctg gac cag atg tgc tct gtg atg acc tgc tcc aga aag 1394
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
450 455 460
acc aac aga tgg ccc atg gct ctg ctg tac ggc atg atc aat atc gcc 1442
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
465 470 475
tgc atc aac agc ttc atc atc tac tcc cac aac gtg tcc tcc aag ggc 1490
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
480 485 490
gag aag gtg cag tcc cgg aag aaa ttc atg cgg aac ctg tat atg tcc 1538
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
495 500 505
ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc cct act ctg aag 1586
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
510 515 520 525
aga tac ctg cgg gac aac atc tcc aac atc ctg cct aac gag gtg ccc 1634
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro
530 535 540
ggc acc agc gac gat tct aca gag gaa cct gtg atg aag aag cgg acc 1682
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
545 550 555
tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag gcc aac gcc tct 1730
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
560 565 570
tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac aac atc gac atg 1778
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
575 580 585
tgc cag tct tgt ttc tga tga gcggccgc 1807
Cys Gln Ser Cys Phe
590
<210> 6
<211> 594
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 7
<211> 2123
<212> DNA
<213> 人工序列
<220>
<223> Taf3-PBw
<220>
<221> CDS
<222> (16)..(2115)
<400> 7
accggtggat ccggc atg gtc atc aga gat gag tgg ggc aat cag atc tgg 51
Met Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp
1 5 10
atc tgt ccc ggc tgc aac aag cct gac gac ggc tct cct atg atc ggc 99
Ile Cys Pro Gly Cys Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly
15 20 25
tgc gac gac tgt gac gac tgg tat cac tgg cct tgc gtg ggc atc atg 147
Cys Asp Asp Cys Asp Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met
30 35 40
acc gct cca cct gaa gag atg cag tgg ttc tgc ccc aag tgc gcc aac 195
Thr Ala Pro Pro Glu Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn
45 50 55 60
aag aag aag gat aag aag cac aag aag cgg aag cac agg gcc cac aaa 243
Lys Lys Lys Asp Lys Lys His Lys Lys Arg Lys His Arg Ala His Lys
65 70 75
ctt gga ggt ggt gct cct gct gtt ggc ggc gga cct aaa aaa ctt ggt 291
Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly
80 85 90
ggc gga gca cca gct gtc ggc gga ggt cct aaa gcc atg ggc tct agc 339
Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser
95 100 105
ctg gac gac gag cac att ctg tct gcc ctg ctg cag tcc gac gat gaa 387
Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu
110 115 120
ctc gtg ggc gaa gat tcc gac tcc gag atc tct gac cac gtg tcc gag 435
Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp His Val Ser Glu
125 130 135 140
gac gac gtg cag tct gat acc gag gaa gcc ttc atc gac gag gtg cac 483
Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His
145 150 155
gaa gtg cag cct acc tct tcc ggc tct gag atc ctg gac gag cag aac 531
Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn
160 165 170
gtg atc gag cag cct gga tcc tct ctg gcc tcc aac aga atc ctg aca 579
Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr
175 180 185
ctg ccc cag aga acc atc cgg ggc aag aac aag cac tgc tgg tcc acc 627
Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr
190 195 200
tcc aag tct acc cgg cgg tct aga gtg tcc gct ctg aat att gtg cgg 675
Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg
205 210 215 220
tcc cag agg ggc ccc acc aga atg tgc cgg aac atc tac gac cct ctg 723
Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu
225 230 235
ctg tgt ttc aag ctg ttc ttc acc gac gag atc atc agc gag atc gtg 771
Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val
240 245 250
aag tgg acc aac gcc gag atc agc ctg aag cgg cgg gaa tct atg acc 819
Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr
255 260 265
ggc gcc acc ttc aga gac acc aac gag gat gag atc tac gcc ttc ttc 867
Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe
270 275 280
ggc atc ctg gtc atg aca gcc gtg cgg aag gac aac cac atg tcc acc 915
Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn His Met Ser Thr
285 290 295 300
gac gac ctg ttc gac aga tcc ctg tcc atg gtg tac gtg tcc gtg atg 963
Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr Val Ser Val Met
305 310 315
agc cgg gac aga ttc gac ttc ctg atc cgg tgc ctg cgg atg gac gac 1011
Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp
320 325 330
aag tcc atc aga ccc aca ctg cgc gag aac gac gtg ttc aca cct gtg 1059
Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val
335 340 345
cgg aag atc tgg gac ctg ttc atc cac cag tgc atc cag aac tac acc 1107
Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr
350 355 360
cct ggc gct cac ctg acc atc gat gaa cag ctg ctg ggc ttc aga ggc 1155
Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly
365 370 375 380
aga tgc ccc ttc aga atg tac atc ccc aac aag ccc tct aag tac ggc 1203
Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly
385 390 395
atc aag atc ctg atg atg tgc gac tcc ggc acc aag tac atg atc aac 1251
Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn
400 405 410
ggc atg ccc tac ctc ggc aga ggc acc caa aca aat ggc gtg cca ctg 1299
Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu
415 420 425
ggc gag tac tat gtg aaa gaa ctg tcc aag cct gtg cac ggc tcc tgc 1347
Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys
430 435 440
aga aac atc acc tgt gac aac tgg ttc acc agc att cct ctg gcc aag 1395
Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys
445 450 455 460
aac ctg ctg caa gag ccc tac aag ctg aca atc gtg ggc acc gtg cgg 1443
Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg
465 470 475
tcc aac aag cgg gaa att cct gag gtg ctg aag aac tct cgg tcc aga 1491
Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg
480 485 490
cct gtg ggc acc tcc atg ttc tgt ttc gac ggc cct ctg aca ctg gtg 1539
Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val
495 500 505
tcc tac aag cct aag cct gcc aag atg gtg tac ctg ctg tcc tcc tgt 1587
Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys
510 515 520
gac gag gac gcc agc atc aat gag tcc acc ggc aag ccc cag atg gtc 1635
Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val
525 530 535 540
atg tac tac aac cag acc aaa ggc ggc gtg gac acc ctg gac cag atg 1683
Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met
545 550 555
tgc tct gtg atg acc tgc tcc aga aag acc aac aga tgg ccc atg gct 1731
Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala
560 565 570
ctg ctg tac ggc atg atc aat atc gcc tgc atc aac agc ttc atc atc 1779
Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile
575 580 585
tac tcc cac aac gtg tcc tcc aag ggc gag aag gtg cag tcc cgg aag 1827
Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys
590 595 600
aaa ttc atg cgg aac ctg tat atg tcc ctg acc tcc agc ttc atg aga 1875
Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg
605 610 615 620
aag cgg ctg gaa gcc cct act ctg aag aga tac ctg cgg gac aac atc 1923
Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile
625 630 635
tcc aac atc ctg cct aac gag gtg ccc ggc acc agc gac gat tct aca 1971
Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser Asp Asp Ser Thr
640 645 650
gag gaa cct gtg atg aag aag cgg acc tac tgc acc tac tgt ccc tcc 2019
Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser
655 660 665
aag atc cgg cgg aag gcc aac gcc tct tgc aaa aag tgc aag aaa gtg 2067
Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val
670 675 680
atc tgc cgc gag cac aac atc gac atg tgc cag tct tgt ttc tga tga 2115
Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser Cys Phe
685 690 695
gcggccgc 2123
<210> 8
<211> 698
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
Met Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly
1 5 10 15
Cys Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys
20 25 30
Asp Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro
35 40 45
Glu Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp
50 55 60
Lys Lys His Lys Lys Arg Lys His Arg Ala His Lys Leu Gly Gly Gly
65 70 75 80
Ala Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro
85 90 95
Ala Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu
100 105 110
His Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu
115 120 125
Asp Ser Asp Ser Glu Ile Ser Asp His Val Ser Glu Asp Asp Val Gln
130 135 140
Ser Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln Pro
145 150 155 160
Thr Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln
165 170 175
Pro Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg
180 185 190
Thr Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr
195 200 205
Arg Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly
210 215 220
Pro Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys
225 230 235 240
Leu Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn
245 250 255
Ala Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe
260 265 270
Arg Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val
275 280 285
Met Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe
290 295 300
Asp Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp Arg
305 310 315 320
Phe Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg
325 330 335
Pro Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp
340 345 350
Asp Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His
355 360 365
Leu Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe
370 375 380
Arg Met Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu
385 390 395 400
Met Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr
405 410 415
Leu Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr
420 425 430
Val Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr
435 440 445
Cys Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln
450 455 460
Glu Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg
465 470 475 480
Glu Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr
485 490 495
Ser Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro
500 505 510
Lys Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala
515 520 525
Ser Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn
530 535 540
Gln Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val Met
545 550 555 560
Thr Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly
565 570 575
Met Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn
580 585 590
Val Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg
595 600 605
Asn Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu
610 615 620
Ala Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu
625 630 635 640
Pro Asn Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val
645 650 655
Met Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg
660 665 670
Lys Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu
675 680 685
His Asn Ile Asp Met Cys Gln Ser Cys Phe
690 695
<210> 9
<211> 2104
<212> DNA
<213> 人工序列
<220>
<223> PBw-Taf3
<220>
<221> CDS
<222> (12)..(2093)
<400> 9
accggtccgg c atg ggc tct agc ctg gac gac gag cac att ctg tct gcc 50
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
1 5 10
ctg ctg cag tcc gac gat gaa ctc gtg ggc gaa gat tcc gac tcc gag 98
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
15 20 25
atc tct gac cac gtg tcc gag gac gac gtg cag tct gat acc gag gaa 146
Ile Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
30 35 40 45
gcc ttc atc gac gag gtg cac gaa gtg cag cct acc tct tcc ggc tct 194
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
50 55 60
gag atc ctg gac gag cag aac gtg atc gag cag cct gga tcc tct ctg 242
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
65 70 75
gcc tcc aac aga atc ctg aca ctg ccc cag aga acc atc cgg ggc aag 290
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
80 85 90
aac aag cac tgc tgg tcc acc tcc aag tct acc cgg cgg tct aga gtg 338
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
95 100 105
tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc acc aga atg tgc 386
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
110 115 120 125
cgg aac atc tac gac cct ctg ctg tgt ttc aag ctg ttc ttc acc gac 434
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
130 135 140
gag atc atc agc gag atc gtg aag tgg acc aac gcc gag atc agc ctg 482
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
145 150 155
aag cgg cgg gaa tct atg acc ggc gcc acc ttc aga gac acc aac gag 530
Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu
160 165 170
gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg aca gcc gtg cgg 578
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
175 180 185
aag gac aac cac atg tcc acc gac gac ctg ttc gac aga tcc ctg tcc 626
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
190 195 200 205
atg gtg tac gtg tcc gtg atg agc cgg gac aga ttc gac ttc ctg atc 674
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
210 215 220
cgg tgc ctg cgg atg gac gac aag tcc atc aga ccc aca ctg cgc gag 722
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
225 230 235
aac gac gtg ttc aca cct gtg cgg aag atc tgg gac ctg ttc atc cac 770
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
240 245 250
cag tgc atc cag aac tac acc cct ggc gct cac ctg acc atc gat gaa 818
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
255 260 265
cag ctg ctg ggc ttc aga ggc aga tgc ccc ttc aga atg tac atc ccc 866
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro
270 275 280 285
aac aag ccc tct aag tac ggc atc aag atc ctg atg atg tgc gac tcc 914
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
290 295 300
ggc acc aag tac atg atc aac ggc atg ccc tac ctc ggc aga ggc acc 962
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
305 310 315
caa aca aat ggc gtg cca ctg ggc gag tac tat gtg aaa gaa ctg tcc 1010
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
320 325 330
aag cct gtg cac ggc tcc tgc aga aac atc acc tgt gac aac tgg ttc 1058
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
335 340 345
acc agc att cct ctg gcc aag aac ctg ctg caa gag ccc tac aag ctg 1106
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
350 355 360 365
aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa att cct gag gtg 1154
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
370 375 380
ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc atg ttc tgt ttc 1202
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
385 390 395
gac ggc cct ctg aca ctg gtg tcc tac aag cct aag cct gcc aag atg 1250
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
400 405 410
gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc atc aat gag tcc 1298
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
415 420 425
acc ggc aag ccc cag atg gtc atg tac tac aac cag acc aaa ggc ggc 1346
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
430 435 440 445
gtg gac acc ctg gac cag atg tgc tct gtg atg acc tgc tcc aga aag 1394
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
450 455 460
acc aac aga tgg ccc atg gct ctg ctg tac ggc atg atc aat atc gcc 1442
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
465 470 475
tgc atc aac agc ttc atc atc tac tcc cac aac gtg tcc tcc aag ggc 1490
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
480 485 490
gag aag gtg cag tcc cgg aag aaa ttc atg cgg aac ctg tat atg tcc 1538
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
495 500 505
ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc cct act ctg aag 1586
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
510 515 520 525
aga tac ctg cgg gac aac atc tcc aac atc ctg cct aac gag gtg ccc 1634
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro
530 535 540
ggc acc agc gac gat tct aca gag gaa cct gtg atg aag aag cgg acc 1682
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
545 550 555
tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag gcc aac gcc tct 1730
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
560 565 570
tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac aac atc gac atg 1778
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
575 580 585
tgc cag tct tgt ttc gcc gct gct aaa ctt ggt ggt ggc gcg ccg gca 1826
Cys Gln Ser Cys Phe Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala
590 595 600 605
gtc ggc gga ggt cca aaa gct gct gat aag ggc gct gcc gtg atc aga 1874
Val Gly Gly Gly Pro Lys Ala Ala Asp Lys Gly Ala Ala Val Ile Arg
610 615 620
gat gag tgg ggc aat cag atc tgg atc tgt cct ggc tgc aac aag cct 1922
Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys Asn Lys Pro
625 630 635
gac gac ggc tct cct atg atc ggc tgc gac gac tgt gac gat tgg tat 1970
Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys Asp Asp Trp Tyr
640 645 650
cac tgg ccc tgc gtg ggc atc atg acc gct cca cct gaa gaa atg cag 2018
His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro Glu Glu Met Gln
655 660 665
tgg ttc tgc ccc aag tgc gcc aac aag aag aag gat aag aag cac aag 2066
Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys Lys His Lys
670 675 680 685
aag cgc aag cac agg gcc cac tga tga gcggccgcga c 2104
Lys Arg Lys His Arg Ala His
690
<210> 10
<211> 692
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly
595 600 605
Gly Pro Lys Ala Ala Asp Lys Gly Ala Ala Val Ile Arg Asp Glu Trp
610 615 620
Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys Asn Lys Pro Asp Asp Gly
625 630 635 640
Ser Pro Met Ile Gly Cys Asp Asp Cys Asp Asp Trp Tyr His Trp Pro
645 650 655
Cys Val Gly Ile Met Thr Ala Pro Pro Glu Glu Met Gln Trp Phe Cys
660 665 670
Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys Lys His Lys Lys Arg Lys
675 680 685
His Arg Ala His
690
<210> 11
<211> 2252
<212> DNA
<213> 人工序列
<220>
<223> KAT2A-PBw
<220>
<221> CDS
<222> (16)..(2244)
<400> 11
accggtggat ccggc atg aag gaa aag ggc aaa gag ctg aag gac ccc gac 51
Met Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp
1 5 10
cag ctg tac acc aca ctg aag aat ctg ctg gcc cag atc aag tct cac 99
Gln Leu Tyr Thr Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His
15 20 25
ccc tcc gcc tgg cct ttc atg gaa ccc gtg aag aag tct gag gcc cct 147
Pro Ser Ala Trp Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro
30 35 40
gac tac tac gaa gtg atc aga ttc ccc atc gac ctc aag acc atg acc 195
Asp Tyr Tyr Glu Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr
45 50 55 60
gag cgg ctg aga tcc cgg tac tac gtg acc aga aag ctg ttc gtg gcc 243
Glu Arg Leu Arg Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala
65 70 75
gac ctg cag aga gtg atc gcc aac tgt aga gag tac aac cct cct gac 291
Asp Leu Gln Arg Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp
80 85 90
tcc gag tac tgc aga tgc gcc tcc gct ctg gaa aag ttc ttc tac ttc 339
Ser Glu Tyr Cys Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe
95 100 105
aag ctg aaa gaa ggc ggc ctg atc gac aag aag ctt gga ggc gga gca 387
Lys Leu Lys Glu Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala
110 115 120
cca gct gtt ggc gga gga cct aaa aaa ctc gga ggt ggc gct cct gct 435
Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala
125 130 135 140
gtc gga ggc gga cct aaa gct atg ggc agc tct ctg gac gac gag cac 483
Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His
145 150 155
atc ctg tct gcc ctg ctg cag tcc gac gat gaa cta gtg ggc gaa gat 531
Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp
160 165 170
tcc gac tcc gag atc tcc gat cac gtg tcc gag gac gac gtg cag tct 579
Ser Asp Ser Glu Ile Ser Asp His Val Ser Glu Asp Asp Val Gln Ser
175 180 185
gat acc gag gaa gcc ttc atc gac gag gtg cac gaa gtg cag cct acc 627
Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr
190 195 200
tct tcc ggc tct gag atc ctg gac gag cag aac gtg atc gag cag cct 675
Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro
205 210 215 220
gga tcc tct ctg gcc tcc aac aga atc ctg aca ctg ccc cag aga acc 723
Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr
225 230 235
atc cgg ggc aag aac aag cac tgc tgg tcc acc tcc aag tct acc cgg 771
Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg
240 245 250
cgg tct aga gtg tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc 819
Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro
255 260 265
acc aga atg tgc cgg aac atc tac gac cct ctg ctg tgt ttc aag ctg 867
Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu
270 275 280
ttc ttc acc gac gag atc atc agc gag atc gtg aag tgg acc aac gcc 915
Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala
285 290 295 300
gag atc agc ctg aag cgg cgg gaa tct atg acc ggc gcc acc ttc aga 963
Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe Arg
305 310 315
gac acc aac gag gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg 1011
Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met
320 325 330
aca gcc gtg cgg aag gac aac cac atg tcc acc gac gac ctg ttc gac 1059
Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp
335 340 345
aga tcc ctg tcc atg gtg tac gtg tcc gtg atg agc cgg gac aga ttc 1107
Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe
350 355 360
gac ttc ctg atc cgg tgc ctg cgg atg gac gac aag tcc atc aga ccc 1155
Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro
365 370 375 380
aca ctg cgc gag aac gac gtg ttc aca cct gtg cgg aag atc tgg gac 1203
Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp
385 390 395
ctg ttc atc cac cag tgc atc cag aac tac acc cct ggc gct cac ctg 1251
Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu
400 405 410
acc atc gat gaa cag ctg ctg ggc ttc aga ggc aga tgc ccc ttc aga 1299
Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg
415 420 425
atg tac atc ccc aac aag ccc tct aag tac ggc atc aag atc ctg atg 1347
Met Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met
430 435 440
atg tgc gac tcc ggc acc aag tac atg atc aac ggc atg ccc tac ctc 1395
Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu
445 450 455 460
ggc aga ggc acc caa aca aat ggc gtg cca ctg ggc gag tac tat gtg 1443
Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val
465 470 475
aaa gaa ctg tcc aag cct gtg cac ggc tcc tgc aga aac atc acc tgt 1491
Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys
480 485 490
gac aac tgg ttc acc agc att cct ctg gcc aag aac ctg ctg caa gag 1539
Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu
495 500 505
ccc tac aag ctg aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa 1587
Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu
510 515 520
att cct gag gtg ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc 1635
Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser
525 530 535 540
atg ttc tgt ttc gac ggc cct ctg aca ctg gtg tcc tac aag cct aag 1683
Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys
545 550 555
cct gcc aag atg gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc 1731
Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser
560 565 570
atc aat gag tcc acc ggc aag ccc cag atg gtc atg tac tac aac cag 1779
Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln
575 580 585
acc aaa ggc ggc gtg gac acc ctg gac cag atg tgc tct gtg atg acc 1827
Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr
590 595 600
tgc tcc aga aag acc aac aga tgg ccc atg gct ctg ctg tac ggc atg 1875
Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met
605 610 615 620
atc aat atc gcc tgc atc aac agc ttc atc atc tac tcc cac aac gtg 1923
Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val
625 630 635
tcc tcc aag ggc gag aag gtg cag tcc cgg aag aaa ttc atg cgg aac 1971
Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn
640 645 650
ctg tat atg tcc ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc 2019
Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala
655 660 665
cct act ctg aag aga tac ctg cgg gac aac atc tcc aac atc ctg cct 2067
Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro
670 675 680
aac gag gtg ccc ggc acc agc gac gat tct aca gag gaa cct gtg atg 2115
Asn Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met
685 690 695 700
aag aag cgg acc tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag 2163
Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys
705 710 715
gcc aac gcc tct tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac 2211
Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His
720 725 730
aac atc gac atg tgc cag tct tgt ttc tga tga gcggccgc 2252
Asn Ile Asp Met Cys Gln Ser Cys Phe
735 740
<210> 12
<211> 741
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
Met Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp Gln Leu Tyr Thr
1 5 10 15
Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His Pro Ser Ala Trp
20 25 30
Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro Asp Tyr Tyr Glu
35 40 45
Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr Glu Arg Leu Arg
50 55 60
Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala Asp Leu Gln Arg
65 70 75 80
Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp Ser Glu Tyr Cys
85 90 95
Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe Lys Leu Lys Glu
100 105 110
Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly
115 120 125
Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly
130 135 140
Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
145 150 155 160
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
165 170 175
Ile Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
180 185 190
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
195 200 205
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
210 215 220
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
225 230 235 240
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
245 250 255
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
260 265 270
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
275 280 285
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
290 295 300
Lys Arg Arg Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu
305 310 315 320
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
325 330 335
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
340 345 350
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
355 360 365
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
370 375 380
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
385 390 395 400
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
405 410 415
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro
420 425 430
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
435 440 445
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
450 455 460
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
465 470 475 480
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
485 490 495
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
500 505 510
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
515 520 525
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
530 535 540
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
545 550 555 560
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
565 570 575
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
580 585 590
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
595 600 605
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
610 615 620
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
625 630 635 640
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
645 650 655
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
660 665 670
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro
675 680 685
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
690 695 700
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
705 710 715 720
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
725 730 735
Cys Gln Ser Cys Phe
740
<210> 13
<211> 1804
<212> DNA
<213> 人工序列
<220>
<223> haPB
<220>
<221> CDS
<222> (12)..(1796)
<400> 13
accggtccgg c atg gga tct tct ctg gac gac gag cac atc ctg tct gcc 50
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
1 5 10
ctg ctg cag tct gac gat gaa ctc gtg ggc gaa gat tcc gac tcc gag 98
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
15 20 25
gtg tcc gac cat gtg tct gag gac gac gtg cag tcc gat acc gag gaa 146
Val Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
30 35 40 45
gcc ttc atc gac gag gtg cac gaa gtg cag cct acc tct tcc ggc tct 194
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
50 55 60
gag atc ctg gac gag cag aac gtg atc gag cag cct gga tct tcc ctg 242
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
65 70 75
gcc tcc aac aga atc ctg aca ctg cct cag cgg acc atc cgg ggc aag 290
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
80 85 90
aac aag cac tgc tgg tcc acc tct aag agc acc cgg cgg tct aga gtg 338
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
95 100 105
tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc acc aga atg tgc 386
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
110 115 120 125
cgg aac atc tac gac cct ctg ctg tgc ttc aag ctg ttc ttc acc gac 434
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
130 135 140
gag atc atc tcc gag atc gtg aag tgg acc aac gcc gag atc tct ctg 482
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
145 150 155
aag cgg cgc gag tct atg acc tct gcc acc ttc cgg gac acc aac gag 530
Lys Arg Arg Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu
160 165 170
gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg aca gcc gtg cgg 578
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
175 180 185
aag gac aac cac atg tcc acc gac gac ctg ttc gac aga tcc ctg tcc 626
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
190 195 200 205
atg gtg tac gtg tcc gtg atg tcc agg gac aga ttc gac ttc ctg atc 674
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
210 215 220
cgg tgc ctg cgg atg gac gac aag tct atc aga ccc aca ctg cgc gag 722
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
225 230 235
aac gac gtg ttc aca cct gtg cgg aag atc tgg gac ctg ttc atc cac 770
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
240 245 250
cag tgc atc cag aac tac acc cct ggc gct cac ctg acc atc gac gaa 818
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
255 260 265
cag ctg ctg ggc ttc aga ggc aga tgc cct ttc cgg gtg tac atc ccc 866
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro
270 275 280 285
aac aag ccc tct aag tac ggc atc aag atc ctg atg atg tgc gac tcc 914
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
290 295 300
ggc acc aag tac atg atc aac ggc atg ccc tac ctc ggc aga ggc acc 962
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
305 310 315
caa aca aat ggc gtg cca ctg ggc gag tac tac gtg aaa gaa ctg tcc 1010
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
320 325 330
aag cct gtg cac ggc tcc tgc aga aac atc acc tgt gat aac tgg ttc 1058
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
335 340 345
acc tcc att cct ctg gcc aag aac ctg ctg caa gag cct tac aag ctg 1106
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
350 355 360 365
aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa att cct gag gtg 1154
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
370 375 380
ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc atg ttc tgt ttc 1202
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
385 390 395
gac ggc cct ctg aca ctg gtg tcc tac aag cct aag cct gcc aag atg 1250
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
400 405 410
gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc atc aat gag tcc 1298
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
415 420 425
acc ggc aag ccc cag atg gtc atg tac tac aac cag acc aaa ggc ggc 1346
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
430 435 440 445
gtg gac acc ctg gac cag atg tgc tct gtg atg acc tgc tcc aga aag 1394
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
450 455 460
acc aac aga tgg ccc atg gct ctg ctg tac ggc atg atc aat atc gcc 1442
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
465 470 475
tgc atc aac agc ttc atc atc tac tcc cac aac gtg tcc tcc aag ggc 1490
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
480 485 490
gag aag gtg cag tcc cgg aaa aag ttc atg cgg aac ctg tat atg tcc 1538
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
495 500 505
ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc cct aca ctg aag 1586
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
510 515 520 525
cgc tac ctg cgg gac aac atc tcc aac atc ctg cct aaa gag gtg ccc 1634
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro
530 535 540
ggc acc agc gac gac tct aca gag gaa ccc gtg atg aag aag agg acc 1682
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
545 550 555
tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag gcc aac gcc tct 1730
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
560 565 570
tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac aac atc gat atg 1778
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
575 580 585
tgc cag tcc tgc ttc tga gcggccgc 1804
Cys Gln Ser Cys Phe
590
<210> 14
<211> 594
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 14
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 15
<211> 2545
<212> DNA
<213> 人工序列
<220>
<223> KAT2A-haPB-Taf3
<220>
<221> CDS
<222> (15)..(2537)
<400> 15
ccggtggatc cggc atg aag gaa aag ggc aaa gag ctg aag gac ccc gac 50
Met Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp
1 5 10
cag ctg tac acc aca ctg aag aat ctg ctg gcc cag atc aag tct cac 98
Gln Leu Tyr Thr Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His
15 20 25
ccc tcc gcc tgg cct ttc atg gaa ccc gtg aag aag tct gag gcc cct 146
Pro Ser Ala Trp Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro
30 35 40
gac tac tac gaa gtg atc aga ttc ccc atc gac ctc aag acc atg acc 194
Asp Tyr Tyr Glu Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr
45 50 55 60
gag cgg ctg aga tcc cgg tac tac gtg acc aga aag ctg ttc gtg gcc 242
Glu Arg Leu Arg Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala
65 70 75
gac ctg cag aga gtg atc gcc aac tgt aga gag tac aac cct cct gac 290
Asp Leu Gln Arg Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp
80 85 90
tcc gag tac tgc aga tgc gcc tcc gct ctg gaa aag ttc ttc tac ttc 338
Ser Glu Tyr Cys Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe
95 100 105
aag ctg aaa gaa ggc ggc ctg atc gac aag aag ctt gga ggc gga gca 386
Lys Leu Lys Glu Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala
110 115 120
cca gct gtt ggc gga gga cct aaa aaa ctc gga ggt ggc gct cct gct 434
Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala
125 130 135 140
gtc gga ggc gga cct aaa gct atg ggc agc tct ctg gac gac gag cac 482
Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His
145 150 155
atc ctg tct gcc ctg ctg cag tcc gac gat gaa cta gtg ggc gaa gat 530
Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp
160 165 170
tcc gac tcc gag gtg tcc gac cat gtg tct gag gac gac gtg cag tcc 578
Ser Asp Ser Glu Val Ser Asp His Val Ser Glu Asp Asp Val Gln Ser
175 180 185
gat acc gag gaa gcc ttc atc gac gag gtg cac gaa gtg cag cct acc 626
Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr
190 195 200
tct tcc ggc tct gag atc ctg gac gag cag aac gtg atc gag cag cct 674
Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro
205 210 215 220
gga tct tcc ctg gcc tcc aac aga atc ctg aca ctg cct cag cgg acc 722
Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr
225 230 235
atc cgg ggc aag aac aag cac tgc tgg tcc acc tct aag agc acc cgg 770
Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg
240 245 250
cgg tct aga gtg tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc 818
Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro
255 260 265
acc aga atg tgc cgg aac atc tac gac cct ctg ctg tgc ttc aag ctg 866
Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu
270 275 280
ttc ttc acc gac gag atc atc tcc gag atc gtg aag tgg acc aac gcc 914
Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala
285 290 295 300
gag atc tct ctg aag cgg cgc gag tct atg acc tct gcc acc ttc cgg 962
Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Ser Ala Thr Phe Arg
305 310 315
gac acc aac gag gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg 1010
Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met
320 325 330
aca gcc gtg cgg aag gac aac cac atg tcc acc gac gac ctg ttc gac 1058
Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp
335 340 345
aga tcc ctg tcc atg gtg tac gtg tcc gtg atg tcc agg gac aga ttc 1106
Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe
350 355 360
gac ttc ctg atc cgg tgc ctg cgg atg gac gac aag tct atc aga ccc 1154
Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro
365 370 375 380
aca ctg cgc gag aac gac gtg ttc aca cct gtg cgg aag atc tgg gac 1202
Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp
385 390 395
ctg ttc atc cac cag tgc atc cag aac tac acc cct ggc gct cac ctg 1250
Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu
400 405 410
acc atc gac gaa cag ctg ctg ggc ttc aga ggc aga tgc cct ttc cgg 1298
Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg
415 420 425
gtg tac atc ccc aac aag ccc tct aag tac ggc atc aag atc ctg atg 1346
Val Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met
430 435 440
atg tgc gac tcc ggc acc aag tac atg atc aac ggc atg ccc tac ctc 1394
Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu
445 450 455 460
ggc aga ggc acc caa aca aat ggc gtg cca ctg ggc gag tac tac gtg 1442
Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val
465 470 475
aaa gaa ctg tcc aag cct gtg cac ggc tcc tgc aga aac atc acc tgt 1490
Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys
480 485 490
gat aac tgg ttc acc tcc att cct ctg gcc aag aac ctg ctg caa gag 1538
Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu
495 500 505
cct tac aag ctg aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa 1586
Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu
510 515 520
att cct gag gtg ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc 1634
Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser
525 530 535 540
atg ttc tgt ttc gac ggc cct ctg aca ctg gtg tcc tac aag cct aag 1682
Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys
545 550 555
cct gcc aag atg gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc 1730
Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser
560 565 570
atc aat gag tcc acc ggc aag ccc cag atg gtc atg tac tac aac cag 1778
Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln
575 580 585
acc aaa ggc ggc gtg gac acc ctg gac cag atg tgc tct gtg atg acc 1826
Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr
590 595 600
tgc tcc aga aag acc aac aga tgg ccc atg gct ctg ctg tac ggc atg 1874
Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met
605 610 615 620
atc aat atc gcc tgc atc aac agc ttc atc atc tac tcc cac aac gtg 1922
Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val
625 630 635
tcc tcc aag ggc gag aag gtg cag tcc cgg aaa aag ttc atg cgg aac 1970
Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn
640 645 650
ctg tat atg tcc ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc 2018
Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala
655 660 665
cct aca ctg aag cgc tac ctg cgg gac aac atc tcc aac atc ctg cct 2066
Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro
670 675 680
aaa gag gtg ccc ggc acc agc gac gac tct aca gag gaa ccc gtg atg 2114
Lys Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met
685 690 695 700
aag aag agg acc tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag 2162
Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys
705 710 715
gcc aac gcc tct tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac 2210
Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His
720 725 730
aac atc gat atg tgc cag tcc tgc ttc gcc gct gct aaa ctt ggt ggt 2258
Asn Ile Asp Met Cys Gln Ser Cys Phe Ala Ala Ala Lys Leu Gly Gly
735 740 745
ggc gcg ccg gca gtc ggc gga ggt cca aaa gct gct gat aag ggc gct 2306
Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Ala Ala Asp Lys Gly Ala
750 755 760
gcc gtg atc aga gat gag tgg ggc aat cag atc tgg atc tgt cct ggc 2354
Ala Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly
765 770 775 780
tgc aac aag cct gac gac ggc tct cct atg atc ggc tgc gac gac tgt 2402
Cys Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys
785 790 795
gac gat tgg tat cac tgg ccc tgc gtg ggc atc atg acc gct cca cct 2450
Asp Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro
800 805 810
gaa gaa atg cag tgg ttc tgc ccc aag tgc gcc aac aag aag aag gat 2498
Glu Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp
815 820 825
aag aag cac aag aag cgc aag cac agg gcc cac tga tga gcggccgc 2545
Lys Lys His Lys Lys Arg Lys His Arg Ala His
830 835
<210> 16
<211> 839
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 16
Met Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp Gln Leu Tyr Thr
1 5 10 15
Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His Pro Ser Ala Trp
20 25 30
Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro Asp Tyr Tyr Glu
35 40 45
Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr Glu Arg Leu Arg
50 55 60
Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala Asp Leu Gln Arg
65 70 75 80
Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp Ser Glu Tyr Cys
85 90 95
Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe Lys Leu Lys Glu
100 105 110
Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly
115 120 125
Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly
130 135 140
Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
145 150 155 160
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
165 170 175
Val Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
180 185 190
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
195 200 205
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
210 215 220
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
225 230 235 240
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
245 250 255
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
260 265 270
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
275 280 285
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
290 295 300
Lys Arg Arg Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu
305 310 315 320
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
325 330 335
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
340 345 350
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
355 360 365
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
370 375 380
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
385 390 395 400
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
405 410 415
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro
420 425 430
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
435 440 445
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
450 455 460
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
465 470 475 480
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
485 490 495
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
500 505 510
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
515 520 525
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
530 535 540
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
545 550 555 560
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
565 570 575
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
580 585 590
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
595 600 605
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
610 615 620
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
625 630 635 640
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
645 650 655
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
660 665 670
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro
675 680 685
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
690 695 700
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
705 710 715 720
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
725 730 735
Cys Gln Ser Cys Phe Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala
740 745 750
Val Gly Gly Gly Pro Lys Ala Ala Asp Lys Gly Ala Ala Val Ile Arg
755 760 765
Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys Asn Lys Pro
770 775 780
Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys Asp Asp Trp Tyr
785 790 795 800
His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro Glu Glu Met Gln
805 810 815
Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys Lys His Lys
820 825 830
Lys Arg Lys His Arg Ala His
835
<210> 17
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 引物
<220>
<221> 引物
<222> (1)..(101)
<400> 17
tagtagctag cttaacccta gaaagataat catattgtga cgtacgttaa agataatcat 60
gcgtaaaatt gacgcatgtc gacgagcgtc acagcacaac c 101
<210> 18
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物
<220>
<221> 引物
<222> (1)..(72)
<400> 18
tagtacatat gttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg gtgcactctc 60
agtacaatct gc 72
<210> 19
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物
<220>
<221> 引物
<222> (1)..(43)
<400> 19
atcgtggcct cggtggcctg aattccctag aaagatagtc tgc 43
<210> 20
<211> 136
<212> PRT
<213> 智人
<400> 20
Val Ile Arg Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys
1 5 10 15
Asn Lys Pro Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys Asp
20 25 30
Asp Trp Tyr His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro Glu
35 40 45
Glu Met Gln Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys
50 55 60
Lys His Lys Lys Arg Lys His Arg Ala His Lys Leu Gly Gly Gly Ala
65 70 75 80
Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala
85 90 95
Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His
100 105 110
Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp
115 120 125
Ser Asp Ser Glu Ile Ser Asp His
130 135
<210> 21
<211> 117
<212> PRT
<213> 智人
<400> 21
Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp Gln Leu Tyr Thr Thr
1 5 10 15
Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His Pro Ser Ala Trp Pro
20 25 30
Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro Asp Tyr Tyr Glu Val
35 40 45
Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr Glu Arg Leu Arg Ser
50 55 60
Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala Asp Leu Gln Arg Val
65 70 75 80
Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp Ser Glu Tyr Cys Arg
85 90 95
Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe Lys Leu Lys Glu Gly
100 105 110
Gly Leu Ile Asp Lys
115
<210> 22
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> 肽
<400> 22
Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys Lys Leu
1 5 10 15
Gly Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys
20 25
<210> 23
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 肽
<400> 23
Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly Pro
1 5 10 15
Lys Ala Ala Asp Lys Gly Ala Ala
20
<210> 24
<211> 67
<212> DNA
<213> 粉纹夜蛾
<400> 24
ttaaccctag aaagataatc atattgtgac gtacgttaaa gataatcatg cgtaaaattg 60
acgcatg 67
<210> 25
<211> 39
<212> DNA
<213> 粉纹夜蛾
<400> 25
catgcgtcaa ttttacgcag actatctttc tagggttaa 39
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
tattggtagc ccacaagctg 20
<210> 27
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
tttctttcag tgctatgtta tggtg 25
<210> 28
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
ggttgtgctg tgacgct 17
<210> 29
<211> 2249
<212> DNA
<213> 人工序列
<220>
<223> Kat2a-haPB
<220>
<221> CDS
<222> (19)..(2241)
<400> 29
accggtggat ccggcatg aag gaa aag ggc aaa gag ctg aag gac ccc gac 51
Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp
1 5 10
cag ctg tac acc aca ctg aag aat ctg ctg gcc cag atc aag tct cac 99
Gln Leu Tyr Thr Thr Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His
15 20 25
ccc tcc gcc tgg cct ttc atg gaa ccc gtg aag aag tct gag gcc cct 147
Pro Ser Ala Trp Pro Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro
30 35 40
gac tac tac gaa gtg atc aga ttc ccc atc gac ctc aag acc atg acc 195
Asp Tyr Tyr Glu Val Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr
45 50 55
gag cgg ctg aga tcc cgg tac tac gtg acc aga aag ctg ttc gtg gcc 243
Glu Arg Leu Arg Ser Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala
60 65 70 75
gac ctg cag aga gtg atc gcc aac tgt aga gag tac aac cct cct gac 291
Asp Leu Gln Arg Val Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp
80 85 90
tcc gag tac tgc aga tgc gcc tcc gct ctg gaa aag ttc ttc tac ttc 339
Ser Glu Tyr Cys Arg Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe
95 100 105
aag ctg aaa gaa ggc ggc ctg atc gac aag aag ctt gga ggc gga gca 387
Lys Leu Lys Glu Gly Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala
110 115 120
cca gct gtt ggc gga gga cct aaa aaa ctc gga ggt ggc gct cct gct 435
Pro Ala Val Gly Gly Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala
125 130 135
gtc gga ggc gga cct aaa gct atg ggc agc tct ctg gac gac gag cac 483
Val Gly Gly Gly Pro Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His
140 145 150 155
atc ctg tct gcc ctg ctg cag tcc gac gat gaa cta gtg ggc gaa gat 531
Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp
160 165 170
tcc gac tcc gag gtg tcc gac cat gtg tct gag gac gac gtg cag tcc 579
Ser Asp Ser Glu Val Ser Asp His Val Ser Glu Asp Asp Val Gln Ser
175 180 185
gat acc gag gaa gcc ttc atc gac gag gtg cac gaa gtg cag cct acc 627
Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr
190 195 200
tct tcc ggc tct gag atc ctg gac gag cag aac gtg atc gag cag cct 675
Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro
205 210 215
gga tct tcc ctg gcc tcc aac aga atc ctg aca ctg cct cag cgg acc 723
Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr
220 225 230 235
atc cgg ggc aag aac aag cac tgc tgg tcc acc tct aag agc acc cgg 771
Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg
240 245 250
cgg tct aga gtg tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc 819
Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro
255 260 265
acc aga atg tgc cgg aac atc tac gac cct ctg ctg tgc ttc aag ctg 867
Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu
270 275 280
ttc ttc acc gac gag atc atc tcc gag atc gtg aag tgg acc aac gcc 915
Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala
285 290 295
gag atc tct ctg aag cgg cgc gag tct atg acc tct gcc acc ttc cgg 963
Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Ser Ala Thr Phe Arg
300 305 310 315
gac acc aac gag gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg 1011
Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met
320 325 330
aca gcc gtg cgg aag gac aac cac atg tcc acc gac gac ctg ttc gac 1059
Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp
335 340 345
aga tcc ctg tcc atg gtg tac gtg tcc gtg atg tcc agg gac aga ttc 1107
Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe
350 355 360
gac ttc ctg atc cgg tgc ctg cgg atg gac gac aag tct atc aga ccc 1155
Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro
365 370 375
aca ctg cgc gag aac gac gtg ttc aca cct gtg cgg aag atc tgg gac 1203
Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp
380 385 390 395
ctg ttc atc cac cag tgc atc cag aac tac acc cct ggc gct cac ctg 1251
Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu
400 405 410
acc atc gac gaa cag ctg ctg ggc ttc aga ggc aga tgc cct ttc cgg 1299
Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg
415 420 425
gtg tac atc ccc aac aag ccc tct aag tac ggc atc aag atc ctg atg 1347
Val Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met
430 435 440
atg tgc gac tcc ggc acc aag tac atg atc aac ggc atg ccc tac ctc 1395
Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu
445 450 455
ggc aga ggc acc caa aca aat ggc gtg cca ctg ggc gag tac tac gtg 1443
Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val
460 465 470 475
aaa gaa ctg tcc aag cct gtg cac ggc tcc tgc aga aac atc acc tgt 1491
Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys
480 485 490
gat aac tgg ttc acc tcc att cct ctg gcc aag aac ctg ctg caa gag 1539
Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu
495 500 505
cct tac aag ctg aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa 1587
Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu
510 515 520
att cct gag gtg ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc 1635
Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser
525 530 535
atg ttc tgt ttc gac ggc cct ctg aca ctg gtg tcc tac aag cct aag 1683
Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys
540 545 550 555
cct gcc aag atg gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc 1731
Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser
560 565 570
atc aat gag tcc acc ggc aag ccc cag atg gtc atg tac tac aac cag 1779
Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln
575 580 585
acc aaa ggc ggc gtg gac acc ctg gac cag atg tgc tct gtg atg acc 1827
Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr
590 595 600
tgc tcc aga aag acc aac aga tgg ccc atg gct ctg ctg tac ggc atg 1875
Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met
605 610 615
atc aat atc gcc tgc atc aac agc ttc atc atc tac tcc cac aac gtg 1923
Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val
620 625 630 635
tcc tcc aag ggc gag aag gtg cag tcc cgg aaa aag ttc atg cgg aac 1971
Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn
640 645 650
ctg tat atg tcc ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc 2019
Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala
655 660 665
cct aca ctg aag cgc tac ctg cgg gac aac atc tcc aac atc ctg cct 2067
Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro
670 675 680
aaa gag gtg ccc ggc acc agc gac gac tct aca gag gaa ccc gtg atg 2115
Lys Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met
685 690 695
aag aag agg acc tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag 2163
Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys
700 705 710 715
gcc aac gcc tct tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac 2211
Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His
720 725 730
aac atc gat atg tgc cag tcc tgc ttc tga gcggccgc 2249
Asn Ile Asp Met Cys Gln Ser Cys Phe
735 740
<210> 30
<211> 740
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 30
Lys Glu Lys Gly Lys Glu Leu Lys Asp Pro Asp Gln Leu Tyr Thr Thr
1 5 10 15
Leu Lys Asn Leu Leu Ala Gln Ile Lys Ser His Pro Ser Ala Trp Pro
20 25 30
Phe Met Glu Pro Val Lys Lys Ser Glu Ala Pro Asp Tyr Tyr Glu Val
35 40 45
Ile Arg Phe Pro Ile Asp Leu Lys Thr Met Thr Glu Arg Leu Arg Ser
50 55 60
Arg Tyr Tyr Val Thr Arg Lys Leu Phe Val Ala Asp Leu Gln Arg Val
65 70 75 80
Ile Ala Asn Cys Arg Glu Tyr Asn Pro Pro Asp Ser Glu Tyr Cys Arg
85 90 95
Cys Ala Ser Ala Leu Glu Lys Phe Phe Tyr Phe Lys Leu Lys Glu Gly
100 105 110
Gly Leu Ile Asp Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly
115 120 125
Gly Pro Lys Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly Gly Pro
130 135 140
Lys Ala Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu
145 150 155 160
Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val
165 170 175
Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala
180 185 190
Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu
195 200 205
Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala
210 215 220
Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn
225 230 235 240
Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser
245 250 255
Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg
260 265 270
Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu
275 280 285
Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys
290 295 300
Arg Arg Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp
305 310 315 320
Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys
325 330 335
Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met
340 345 350
Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg
355 360 365
Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn
370 375 380
Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln
385 390 395 400
Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln
405 410 415
Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn
420 425 430
Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly
435 440 445
Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln
450 455 460
Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys
465 470 475 480
Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr
485 490 495
Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr
500 505 510
Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu
515 520 525
Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp
530 535 540
Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val
545 550 555 560
Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr
565 570 575
Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val
580 585 590
Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr
595 600 605
Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys
610 615 620
Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu
625 630 635 640
Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu
645 650 655
Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg
660 665 670
Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly
675 680 685
Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr
690 695 700
Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys
705 710 715 720
Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys
725 730 735
Gln Ser Cys Phe
740
<210> 31
<211> 2101
<212> DNA
<213> 人工序列
<220>
<223> haPB-Taf3
<220>
<221> CDS
<222> (12)..(2090)
<400> 31
accggtccgg c atg gga tct tct ctg gac gac gag cac atc ctg tct gcc 50
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala
1 5 10
ctg ctg cag tct gac gat gaa ctc gtg ggc gaa gat tcc gac tcc gag 98
Leu Leu Gln Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu
15 20 25
gtg tcc gac cat gtg tct gag gac gac gtg cag tcc gat acc gag gaa 146
Val Ser Asp His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu
30 35 40 45
gcc ttc atc gac gag gtg cac gaa gtg cag cct acc tct tcc ggc tct 194
Ala Phe Ile Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser
50 55 60
gag atc ctg gac gag cag aac gtg atc gag cag cct gga tct tcc ctg 242
Glu Ile Leu Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu
65 70 75
gcc tcc aac aga atc ctg aca ctg cct cag cgg acc atc cgg ggc aag 290
Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys
80 85 90
aac aag cac tgc tgg tcc acc tct aag agc acc cgg cgg tct aga gtg 338
Asn Lys His Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val
95 100 105
tcc gct ctg aat att gtg cgg tcc cag agg ggc ccc acc aga atg tgc 386
Ser Ala Leu Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys
110 115 120 125
cgg aac atc tac gac cct ctg ctg tgc ttc aag ctg ttc ttc acc gac 434
Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp
130 135 140
gag atc atc tcc gag atc gtg aag tgg acc aac gcc gag atc tct ctg 482
Glu Ile Ile Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu
145 150 155
aag cgg cgc gag tct atg acc tct gcc acc ttc cgg gac acc aac gag 530
Lys Arg Arg Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu
160 165 170
gat gag atc tac gcc ttc ttc ggc atc ctg gtc atg aca gcc gtg cgg 578
Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg
175 180 185
aag gac aac cac atg tcc acc gac gac ctg ttc gac aga tcc ctg tcc 626
Lys Asp Asn His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser
190 195 200 205
atg gtg tac gtg tcc gtg atg tcc agg gac aga ttc gac ttc ctg atc 674
Met Val Tyr Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile
210 215 220
cgg tgc ctg cgg atg gac gac aag tct atc aga ccc aca ctg cgc gag 722
Arg Cys Leu Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu
225 230 235
aac gac gtg ttc aca cct gtg cgg aag atc tgg gac ctg ttc atc cac 770
Asn Asp Val Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His
240 245 250
cag tgc atc cag aac tac acc cct ggc gct cac ctg acc atc gac gaa 818
Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu
255 260 265
cag ctg ctg ggc ttc aga ggc aga tgc cct ttc cgg gtg tac atc ccc 866
Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro
270 275 280 285
aac aag ccc tct aag tac ggc atc aag atc ctg atg atg tgc gac tcc 914
Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser
290 295 300
ggc acc aag tac atg atc aac ggc atg ccc tac ctc ggc aga ggc acc 962
Gly Thr Lys Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr
305 310 315
caa aca aat ggc gtg cca ctg ggc gag tac tac gtg aaa gaa ctg tcc 1010
Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser
320 325 330
aag cct gtg cac ggc tcc tgc aga aac atc acc tgt gat aac tgg ttc 1058
Lys Pro Val His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe
335 340 345
acc tcc att cct ctg gcc aag aac ctg ctg caa gag cct tac aag ctg 1106
Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu
350 355 360 365
aca atc gtg ggc acc gtg cgg tcc aac aag cgg gaa att cct gag gtg 1154
Thr Ile Val Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val
370 375 380
ctg aag aac tct cgg tcc aga cct gtg ggc acc tcc atg ttc tgt ttc 1202
Leu Lys Asn Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe
385 390 395
gac ggc cct ctg aca ctg gtg tcc tac aag cct aag cct gcc aag atg 1250
Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met
400 405 410
gtg tac ctg ctg tcc tcc tgt gac gag gac gcc agc atc aat gag tcc 1298
Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser
415 420 425
acc ggc aag ccc cag atg gtc atg tac tac aac cag acc aaa ggc ggc 1346
Thr Gly Lys Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly
430 435 440 445
gtg gac acc ctg gac cag atg tgc tct gtg atg acc tgc tcc aga aag 1394
Val Asp Thr Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys
450 455 460
acc aac aga tgg ccc atg gct ctg ctg tac ggc atg atc aat atc gcc 1442
Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala
465 470 475
tgc atc aac agc ttc atc atc tac tcc cac aac gtg tcc tcc aag ggc 1490
Cys Ile Asn Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly
480 485 490
gag aag gtg cag tcc cgg aaa aag ttc atg cgg aac ctg tat atg tcc 1538
Glu Lys Val Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser
495 500 505
ctg acc tcc agc ttc atg aga aag cgg ctg gaa gcc cct aca ctg aag 1586
Leu Thr Ser Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys
510 515 520 525
cgc tac ctg cgg gac aac atc tcc aac atc ctg cct aaa gag gtg ccc 1634
Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro
530 535 540
ggc acc agc gac gac tct aca gag gaa ccc gtg atg aag aag agg acc 1682
Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr
545 550 555
tac tgc acc tac tgt ccc tcc aag atc cgg cgg aag gcc aac gcc tct 1730
Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser
560 565 570
tgc aaa aag tgc aag aaa gtg atc tgc cgc gag cac aac atc gat atg 1778
Cys Lys Lys Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met
575 580 585
tgc cag tcc tgc ttc gcc gct gct aaa ctt ggt ggt ggc gcg ccg gca 1826
Cys Gln Ser Cys Phe Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala
590 595 600 605
gtc ggc gga ggt cca aaa gct gct gat aag ggc gct gcc gtg atc aga 1874
Val Gly Gly Gly Pro Lys Ala Ala Asp Lys Gly Ala Ala Val Ile Arg
610 615 620
gat gag tgg ggc aat cag atc tgg atc tgt cct ggc tgc aac aag cct 1922
Asp Glu Trp Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys Asn Lys Pro
625 630 635
gac gac ggc tct cct atg atc ggc tgc gac gac tgt gac gat tgg tat 1970
Asp Asp Gly Ser Pro Met Ile Gly Cys Asp Asp Cys Asp Asp Trp Tyr
640 645 650
cac tgg ccc tgc gtg ggc atc atg acc gct cca cct gaa gaa atg cag 2018
His Trp Pro Cys Val Gly Ile Met Thr Ala Pro Pro Glu Glu Met Gln
655 660 665
tgg ttc tgc ccc aag tgc gcc aac aag aag aag gat aag aag cac aag 2066
Trp Phe Cys Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys Lys His Lys
670 675 680 685
aag cgc aag cac agg gcc cac tga tgagcggccg c 2101
Lys Arg Lys His Arg Ala His
690
<210> 32
<211> 692
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 32
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe Ala Ala Ala Lys Leu Gly Gly Gly Ala Pro Ala Val Gly Gly
595 600 605
Gly Pro Lys Ala Ala Asp Lys Gly Ala Ala Val Ile Arg Asp Glu Trp
610 615 620
Gly Asn Gln Ile Trp Ile Cys Pro Gly Cys Asn Lys Pro Asp Asp Gly
625 630 635 640
Ser Pro Met Ile Gly Cys Asp Asp Cys Asp Asp Trp Tyr His Trp Pro
645 650 655
Cys Val Gly Ile Met Thr Ala Pro Pro Glu Glu Met Gln Trp Phe Cys
660 665 670
Pro Lys Cys Ala Asn Lys Lys Lys Asp Lys Lys His Lys Lys Arg Lys
675 680 685
His Arg Ala His
690
<210> 33
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
taagagcacc aactgctctt cca 23
<210> 34
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
accagaagag ggcaccagat ct 22

Claims (54)

1.一种多肽,所述多肽包含:转座酶或其具有转座酶功能的片段或衍生物;以及至少一个异源染色质阅读器元件(CRE)。
2.根据权利要求1所述的多肽,其中,所述至少一个异源CRE与所述转座酶相连,优选通过接头相连。
3.根据权利要求1或2所述的多肽,其中,所述至少一个异源CRE与所述转座酶的N端和/或C端相连,优选通过接头相连。
4.根据权利要求1-3中任一项所述的多肽,其中,所述至少一个异源CRE是染色质阅读器结构域(CRD)。
5.根据权利要求4所述的多肽,其中,所述至少一个异源CRD是天然存在的CRD。
6.根据权利要求5所述的多肽,其中,所述天然存在的CRD识别组蛋白甲基化程度和/或组蛋白乙酰化状态。
7.根据权利要求6所述的多肽,其中,识别组蛋白甲基化程度的所述天然存在的CRD是植物同源结构域(PHD)型锌指。
8.根据权利要求7所述的多肽,其中,所述PHD型锌指是转录起始因子TFIID亚基3PHD。
9.根据权利要求8所述的多肽,其中,所述转录起始因子TFIID亚基3PHD具有根据SEQID NO:20的氨基酸序列。
10.根据权利要求6-9中任一项所述的多肽,其中,识别组蛋白乙酰化状态的所述天然存在的CRD是溴结构域。
11.根据权利要求10所述的多肽,其中,所述溴结构域是组蛋白乙酰转移酶KAT2A结构域。
12.根据权利要求11所述的多肽,其中,所述组蛋白乙酰转移酶KAT2A结构域具有根据SEQ ID NO:21的氨基酸序列。
13.根据权利要求1-12中任一项所述的多肽,其中,所述CRE是人工CRE。
14.根据权利要求13所述的多肽,其中,所述人工CRE识别具有特定甲基化和/或乙酰化位点的组蛋白尾部。
15.根据权利要求13或14所述的多肽,其中,所述人工CRE选自于由微抗体、单链抗体、抗体片段、亲和体、affilin、anticalin、atrimer、DARPin、FN2支架、fynomer和Kunitz结构域组成的组。
16.根据权利要求1-15中任一项所述的多肽,其中,所述转座酶选自于由野生型PiggyBac转座酶、高活性PiggyBac转座酶、野生型PiggyBac样转座酶、高活性PiggyBac样转座酶、睡美人转座酶和Tol2转座酶组成的组。
17.根据权利要求16所述的多肽,其中,所述PiggyBac样转座酶选自于由PiggyBat、来自热带爪蟾(Xenopus tropicalis)的PiggyBac样转座酶和来自家蚕(Bombyx mori)的PiggyBac样转座酶组成的组。
18.根据权利要求1-17中任一项所述的多肽,其中,所述多肽还包含至少一个异源DNA结合结构域。
19.根据权利要求1-18中任一项所述的多肽,其中,所述多肽还包含异源核定位信号(NLS)。
[DE:其中,所述CRE优选通过结合分子与所述转座酶偶联,
其中,结合所述CRE的所述分子与所述转座酶的N端或C端相连]
20.编码根据权利要求1-19中任一项所述的多肽的多核苷酸。
21.包含根据权利要求20所述的多核苷酸的载体。
22.一种用于生产转基因细胞的方法,所述方法包括以下步骤:
(i)提供细胞;以及
(ii)将包含至少一种感兴趣的多核苷酸的转座元件,以及
根据权利要求1-19中任一项所述的多肽,
根据权利要求20所述的多核苷酸,或
根据权利要求21所述的载体
引入所述细胞,从而生产所述转基因细胞。
23.根据权利要求22所述的方法,其中,所述引入通过电穿孔、转染、注射、脂质转染和/或(病毒)感染来实现。
24.根据权利要求22或23所述的方法,其中,所述包含至少一种感兴趣的多核苷酸的转座元件包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
25.根据权利要求22或23所述的方法,其中,所述包含至少一种感兴趣的多核苷酸的转座元件和根据权利要求20所述的多核苷酸包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
26.根据权利要求22-25中任一项所述的方法,其中,所述转座元件包含末端重复(TR)。
27.根据权利要求26所述的方法,其中,所述至少一种感兴趣的多核苷酸的侧翼为TR。
28.根据权利要求22-27中任一项所述的方法,其中,所述转座元件是DNA转座元件。
29.根据权利要求28所述的方法,其中,所述DNA转座元件包含反向末端重复(ITR)。
30.根据权利要求22-27中任一项所述的方法,其中,所述转座元件是反转录转座元件。
31.根据权利要求30所述的方法,其中,所述反转录转座元件是长末端重复(LTR)反转录转座元件。
32.根据权利要求31所述的方法,其中,所述LTR反转录转座元件包含长末端重复(LTR)。
33.根据权利要求22-32中任一项所述的方法,其中,所述细胞是真核细胞。
34.根据权利要求33所述的方法,其中,所述真核细胞是脊椎动物细胞、酵母细胞、真菌细胞、昆虫细胞。
35.根据权利要求34所述的方法,其中,所述脊椎动物细胞是哺乳动物细胞。
36.根据权利要求22-35中任一项所述的方法,其中,所述至少一种感兴趣的多核苷酸选自于由编码多肽的多核苷酸、非编码多核苷酸、包含启动子序列的多核苷酸、编码mRNA的多核苷酸、编码标签的多核苷酸和病毒多核苷酸组成的组。
37.通过根据权利要求22-36中任一项所述的方法可获得的转基因细胞。
38.根据权利要求37所述的转基因细胞用于生产蛋白质或病毒的用途。
39.一种试剂盒,所述试剂盒包含:
(i)包含用于插入至少一种感兴趣的多核苷酸的克隆位点的转座元件;以及
(ii)根据权利要求1-19中任一项所述的多肽,
根据权利要求20所述的多核苷酸,
根据权利要求21所述的载体,或
至少一个异源CRE以及包含转座酶或其具有转座酶功能的片段或衍生物的多肽。
40.根据权利要求39所述的试剂盒,其中,所述包含用于插入至少一种感兴趣的多核苷酸的克隆位点的转座元件包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
41.根据权利要求39所述的试剂盒,其中,所述包含用于插入至少一种感兴趣的多核苷酸的克隆位点的转座元件和根据权利要求20所述的多核苷酸包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
42.根据权利要求39-41中任一项所述的试剂盒,其中,所述转座元件包含末端重复(TR)。
43.根据权利要求42所述的试剂盒,其中,所述至少一种感兴趣的多核苷酸的侧翼为TR。
44.根据权利要求39-43中任一项所述的试剂盒,其中,所述转座元件是DNA转座元件。
45.根据权利要求44所述的试剂盒,其中,所述DNA转座元件包含反向末端重复(ITR)。
46.根据权利要求39-43中任一项所述的试剂盒,其中,所述转座元件是反转录转座元件。
47.根据权利要求46所述的试剂盒,其中,所述反转录转座元件是长末端重复(LTR)反转录转座元件。
48.根据权利要求47所述的试剂盒,其中,所述LTR反转录转座元件包含长末端重复(LTR)。
49.根据权利要求39-48中任一项所述的试剂盒,其中,所述试剂盒用于转基因细胞的生成。
50.根据权利要求49所述的试剂盒,其中,所述试剂盒还包含关于如何生成所述转基因细胞的说明。
51.一种靶向系统,所述靶向系统包含:
(i)包含至少一种感兴趣的多核苷酸的转座元件以及根据权利要求1-19中任一项所述的多肽;
(ii)包含至少一种感兴趣的多核苷酸的转座元件以及根据权利要求20所述的多核苷酸;
(iii)包含至少一种感兴趣的多核苷酸的转座元件以及根据权利要求21所述的载体;或
(iv)包含至少一种感兴趣的多核苷酸的转座元件;任选地与所述转座元件缔合的至少一个异源CRE;以及包含转座酶或其具有转座酶功能的片段或衍生物的多肽。
52.根据权利要求51所述的靶向系统,其中,所述包含至少一种感兴趣的多核苷酸的转座元件包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
53.根据权利要求51所述的靶向系统,其中,所述包含至少一种感兴趣的多核苷酸的转座元件和根据权利要求20所述的多核苷酸包含于多核苷酸分子中/作为多核苷酸分子的一部分,所述多核苷酸分子优选为载体。
54.根据权利要求51-53中任一项所述的靶向系统,其中,所述CRE是CRD。
CN201980091933.7A 2019-02-13 2019-02-13 具有增强的插入位点选择特性的转座酶 Pending CN113439121A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2019/053571 WO2020164702A1 (en) 2019-02-13 2019-02-13 Transposase with enhanced insertion site selection properties

Publications (1)

Publication Number Publication Date
CN113439121A true CN113439121A (zh) 2021-09-24

Family

ID=65443839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980091933.7A Pending CN113439121A (zh) 2019-02-13 2019-02-13 具有增强的插入位点选择特性的转座酶

Country Status (9)

Country Link
US (1) US20220090142A1 (zh)
EP (1) EP3924474A1 (zh)
JP (2) JP7390385B2 (zh)
KR (1) KR20210126564A (zh)
CN (1) CN113439121A (zh)
AU (1) AU2019429609A1 (zh)
CA (1) CA3126773A1 (zh)
SG (1) SG11202106900TA (zh)
WO (1) WO2020164702A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728477A (zh) * 2017-04-24 2018-11-02 华东理工大学 一种高效的转座突变系统及构建方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220090142A1 (en) * 2019-02-13 2022-03-24 Probiogen Ag Transposase with enhanced insertion site selection properties

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001278496A1 (en) * 2000-07-21 2002-02-05 Syngenta Participations Ag Zinc finger domain recognition code and uses thereof
CN1438323A (zh) * 2003-01-08 2003-08-27 中国人民解放军军事医学科学院生物工程研究所 锌指蛋白-dna相互作用的遗传筛选模型及其应用
US20060210977A1 (en) * 2002-07-24 2006-09-21 Kaminski Joseph M Transposon-based vectors and methods of nucleic acid integration
US20060252140A1 (en) * 2005-04-29 2006-11-09 Yant Stephen R Development of a transposon system for site-specific DNA integration in mammalian cells
CN101883500A (zh) * 2007-12-03 2010-11-10 先正达参股股份有限公司 工程化改造酶易感性蛋白质
GB201114806D0 (en) * 2011-08-26 2011-10-12 Univ Leicester Histone deacetylase
US20130196867A1 (en) * 2011-12-16 2013-08-01 The University Of North Carolina At Chapel Hill Combinatorial post-translationally-modified histone peptides, arrays thereof, and methods of using the same
GB201312819D0 (en) * 2012-07-19 2013-12-11 Eisai R&D Man Co Ltd Novel compounds
CN103981204A (zh) * 2014-03-24 2014-08-13 上海海洋大学 一种有活性的金鱼Tgf2转座子重组转座酶蛋白的表达方法
CN104402982A (zh) * 2014-12-03 2015-03-11 复旦大学 水稻组蛋白赖氨酸修饰识别蛋白及其编码基因与应用
CN105886530A (zh) * 2016-04-06 2016-08-24 中国农业大学 一种高效易感prrsv的bhk-21细胞系的构建方法
CN107095864A (zh) * 2011-06-10 2017-08-29 纽约市哥伦比亚大学理事会 组蛋白乙酰转移酶激活剂的用途
CN109863246A (zh) * 2016-08-19 2019-06-07 怀特黑德生物医学研究所 编辑dna甲基化的方法
CN109890841A (zh) * 2016-07-15 2019-06-14 波赛达治疗公司 嵌合抗原受体及使用方法
CN113508180A (zh) * 2018-12-21 2021-10-15 爱披萨佛公司 用于染色质作图测定的dna条形码化核小体
US20220090142A1 (en) * 2019-02-13 2022-03-24 Probiogen Ag Transposase with enhanced insertion site selection properties
CN115698268A (zh) * 2020-05-04 2023-02-03 萨利欧基因治疗公司 基于转座的疗法
US20230257778A1 (en) * 2020-07-17 2023-08-17 Probiogen Ag Hyperactive transposons and transposases
WO2023159045A1 (en) * 2022-02-15 2023-08-24 Epicypher, Inc. Engineered recombinant protein-binding domains as detection reagents

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6218185B1 (en) 1996-04-19 2001-04-17 The United States Of America As Represented By The Secretary Of Agriculture Piggybac transposon-based genetic transformation system for insects
DK1594972T3 (da) 2003-02-10 2011-04-18 Max Delbrueck Centrum Transposon-baseret målretningssystem
WO2009003671A2 (en) 2007-07-04 2009-01-08 Max-Delbrück-Centrum für Molekulare Medizin Hyperactive variants of the transposase protein of the transposon system sleeping beauty
SG174155A1 (en) 2009-02-25 2011-10-28 Univ Johns Hopkins Piggybac transposon variants and methods of use
WO2010099296A1 (en) 2009-02-26 2010-09-02 Transposagen Biopharmaceuticals, Inc. Hyperactive piggybac transposases
EP3670660A1 (en) 2014-04-09 2020-06-24 Dna Twopointo Inc. Enhanced nucleic acid constructs for eukaryotic gene expression
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001278496A1 (en) * 2000-07-21 2002-02-05 Syngenta Participations Ag Zinc finger domain recognition code and uses thereof
US20060210977A1 (en) * 2002-07-24 2006-09-21 Kaminski Joseph M Transposon-based vectors and methods of nucleic acid integration
CN1438323A (zh) * 2003-01-08 2003-08-27 中国人民解放军军事医学科学院生物工程研究所 锌指蛋白-dna相互作用的遗传筛选模型及其应用
US20060252140A1 (en) * 2005-04-29 2006-11-09 Yant Stephen R Development of a transposon system for site-specific DNA integration in mammalian cells
CN101883500A (zh) * 2007-12-03 2010-11-10 先正达参股股份有限公司 工程化改造酶易感性蛋白质
CN107095864A (zh) * 2011-06-10 2017-08-29 纽约市哥伦比亚大学理事会 组蛋白乙酰转移酶激活剂的用途
GB201114806D0 (en) * 2011-08-26 2011-10-12 Univ Leicester Histone deacetylase
US20130196867A1 (en) * 2011-12-16 2013-08-01 The University Of North Carolina At Chapel Hill Combinatorial post-translationally-modified histone peptides, arrays thereof, and methods of using the same
GB201312819D0 (en) * 2012-07-19 2013-12-11 Eisai R&D Man Co Ltd Novel compounds
CN103981204A (zh) * 2014-03-24 2014-08-13 上海海洋大学 一种有活性的金鱼Tgf2转座子重组转座酶蛋白的表达方法
CN104402982A (zh) * 2014-12-03 2015-03-11 复旦大学 水稻组蛋白赖氨酸修饰识别蛋白及其编码基因与应用
CN105886530A (zh) * 2016-04-06 2016-08-24 中国农业大学 一种高效易感prrsv的bhk-21细胞系的构建方法
CN109890841A (zh) * 2016-07-15 2019-06-14 波赛达治疗公司 嵌合抗原受体及使用方法
CN109863246A (zh) * 2016-08-19 2019-06-07 怀特黑德生物医学研究所 编辑dna甲基化的方法
CN113508180A (zh) * 2018-12-21 2021-10-15 爱披萨佛公司 用于染色质作图测定的dna条形码化核小体
US20220090142A1 (en) * 2019-02-13 2022-03-24 Probiogen Ag Transposase with enhanced insertion site selection properties
JP2022523166A (ja) * 2019-02-13 2022-04-21 プロバイオジェン アーゲー 挿入部位選択特性が向上したトランスポザーゼ
CN115698268A (zh) * 2020-05-04 2023-02-03 萨利欧基因治疗公司 基于转座的疗法
US20230257778A1 (en) * 2020-07-17 2023-08-17 Probiogen Ag Hyperactive transposons and transposases
CN117015600A (zh) * 2020-07-17 2023-11-07 普罗拜奥根股份公司 高活性转座子和转座酶
WO2023159045A1 (en) * 2022-02-15 2023-08-24 Epicypher, Inc. Engineered recombinant protein-binding domains as detection reagents

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
K.J.MARAGATHAVALLY: "Chimeric Mos1 and piggyBac transposases result in site-directed integration", 《THE FASEB JOURNAL》 *
KATRIN VOIGT 等: "Retargeting sleeping beauty transposon insertions by engineered zinc finger DNA-binding domains", 《MOLECULAR THERAPY》 *
MONTASER SHAHEEN 等: "Metnase/SETMAR:a domesticated primate transposase that enhances DNA repair,replication, and decatenation", 《GENETICA》, vol. 138, no. 5, pages 563 *
TING ZHAO;ZHENPING ZHAN;DANHUA JIANG;: "Histone modifications and their regulatory roles in plant development and environmental memory", JOURNAL OF GENETICS AND GENOMICS, no. 10, pages 142 - 147 *
WENTIAN LUO 等: "Comparative analysis of chimeric ZFP-, TALE- and Cas9-piggyBac transposase for integration into a single locus in human cells", 《NUCLEIC ACIDS RESEARCH》 *
WILSON M H 等: "Functional zinc finger/sleeping beauty transposase chimeras exhibit attenuated overproduction inhibition", 《FEBS LETTERS》 *
张晓芸;常人葆;韩大力;: "哺乳动物DNA去甲基化及生物学功能", 生命科学, no. 04 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728477A (zh) * 2017-04-24 2018-11-02 华东理工大学 一种高效的转座突变系统及构建方法

Also Published As

Publication number Publication date
KR20210126564A (ko) 2021-10-20
JP7390385B2 (ja) 2023-12-01
US20220090142A1 (en) 2022-03-24
JP2023145729A (ja) 2023-10-11
WO2020164702A1 (en) 2020-08-20
EP3924474A1 (en) 2021-12-22
SG11202106900TA (en) 2021-07-29
AU2019429609A1 (en) 2021-07-22
JP2022523166A (ja) 2022-04-21
CA3126773A1 (en) 2020-08-20

Similar Documents

Publication Publication Date Title
JP2023156355A (ja) 細胞または生物のゲノムへのDNA配列の標的化組み込みのためのCas9レトロウイルスインテグラーゼおよびCas9レコンビナーゼ系
JP4489424B2 (ja) 染色体に基くプラットホーム
JP7109547B2 (ja) 真核ゲノム修飾のための操作されたCas9システム
CN111163633B (zh) 包含人源化ttr基因座的非人类动物及其使用方法
KR20150123803A (ko) 향상된 이식유전자 발현 및 가공
JP2023145729A (ja) 挿入部位選択特性が向上したトランスポザーゼ
US20230257778A1 (en) Hyperactive transposons and transposases
JP7240007B2 (ja) 改良されたトランスポザーゼポリペプチドおよびその使用
CN113652445A (zh) 基因组编辑系统和方法
KR20220016869A (ko) 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법
JP2024032973A (ja) Crisprタンパク質をコードする合成自己複製rnaベクターおよびその使用
CN113166779A (zh) 调控的基因编辑系统
RU2782358C2 (ru) Экспрессирующие cas мышиные эмбриональные стволовые клетки и мыши и их применения
AU2003286577B2 (en) High expression locus vector based on ferritin heavy chain gene locus
WO2023234866A1 (en) Method for production of a eukaryotic host cell or cell line for lambda-integrase-mediated recombination
CN116622678A (zh) 一种基因编辑蛋白、其相应的基因编辑系统及应用
JP2024516153A (ja) 改良されたホスホトランスフェラーゼのための材料及び方法
JP4787960B2 (ja) セントロメア局在タンパク遺伝子のコンディショナルノックアウト細胞

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination