CN115803440A - 用于蛋白质制造的核酸构建体 - Google Patents

用于蛋白质制造的核酸构建体 Download PDF

Info

Publication number
CN115803440A
CN115803440A CN202180046877.2A CN202180046877A CN115803440A CN 115803440 A CN115803440 A CN 115803440A CN 202180046877 A CN202180046877 A CN 202180046877A CN 115803440 A CN115803440 A CN 115803440A
Authority
CN
China
Prior art keywords
nucleic acid
acid construct
cells
sequence
host cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180046877.2A
Other languages
English (en)
Inventor
格雷戈里·T·布勒克
拉谢尔·H·克拉维茨
查德·A·霍尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Catalent Pharma Solutions LLC
Original Assignee
Catalent Pharma Solutions LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Catalent Pharma Solutions LLC filed Critical Catalent Pharma Solutions LLC
Publication of CN115803440A publication Critical patent/CN115803440A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10041Use of virus, viral particle or viral elements as a vector
    • C12N2740/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/48Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明涉及核酸构建体和其开发用于生产目的蛋白的宿主细胞系的用途,并且特别涉及允许改进选择以开发高产细胞系的核酸构建物。

Description

用于蛋白质制造的核酸构建体
相关申请的交叉引用
本申请要求于2020年6月2日提交的美国临时申请63/033,514的优先权,其全部内容通过援引并入本文。
本申请要求于2020年6月2日提交的美国临时申请63/033,516的优先权,其全部内容通过援引并入本文。
技术领域
本发明涉及核酸构建体和其开发用于生产目的蛋白的宿主细胞系的用途,并且特别涉及允许改进选择以开发高产细胞系的核酸构建物。
背景技术
治疗性蛋白质药物是为最需要新型疗法的患者提供服务的一类重要药物。已开发出近期获得批准的重组蛋白治疗剂来治疗多种临床适应症,包括癌症、自身免疫性/炎症、暴露于传染物和遗传病症。蛋白质工程技术的最新进展使药物开发人员和制造商可以微调和利用目的蛋白的理想功能特性,同时保持(在某些情况下提高)产品安全性或功效或两者。
治疗性蛋白质的制造和生产是高度复杂的过程。例如,典型的蛋白质药物可能包括超过5000个关键工艺步骤,是制造小分子药物所需步骤数量的许多倍。
类似地,包括单克隆抗体以及大的蛋白质或融合蛋白在内的蛋白质治疗剂的大小可以比分子量超过100kDa的小分子药物大几个数量级。另外,蛋白质治疗剂表现出必须维持的复杂的二级和三级结构。蛋白质治疗剂不能完全通过化学工艺来合成,并且必须在活细胞或生物体中制造;因此,细胞系、物种来源和培养条件的选择都会影响最终产品的特性。而且,大多数的生物活性蛋白需要翻译后修饰,当使用异源表达系统时,这些修饰可能会受到损害。另外,由于产品是由细胞或生物体合成的,因此涉及复杂的纯化过程。此外,还实施病毒清除过程,诸如通过使用过滤器或树脂去除病毒颗粒,以及通过使用低pH值或清洁剂的灭活步骤,以防止蛋白质药物物质病毒污染的严重安全性问题。考虑到治疗性蛋白质在其大分子尺寸、翻译后修饰以及制造过程中涉及的多种生物材料方面的复杂性,增强特定功能属性同时保持通过蛋白质工程策略实现的产品安全性和功效的能力是非常合乎需要的。
尽管整合新颖策略和方法来修饰蛋白质药物产品并非易事,但是潜在的治疗优势已推动在药物开发过程中增加这类策略的使用。当前正在使用多种蛋白质工程平台技术来增加新的治疗性蛋白质药物的循环半衰期、靶向性和功能性,以及提高产量和产品纯度。例如,蛋白质缀合和衍生化方法,包括Fc融合、白蛋白融合和PEG化,目前正用于延长药物的循环半衰期。
蛋白质药物(生物制剂)的生产昂贵且耗时。在本领域中需要更有效的工具和方法来生产这类重要药物。
发明内容
本发明涉及核酸构建体和其开发用于生产目的蛋白的宿主细胞系的用途,并且特别涉及允许改进选择以开发高产细胞系的核酸构建物。
在一些优选的实施方式中,本发明提供了用于表达目的蛋白的核酸构建体,包括以下的5'至3'顺序的可操作的联接的元件:任选地,第一启动子序列;选择标记序列;第二启动子序列;可操作地连接至第二启动子序列的编码第一目的蛋白的核酸序列;和多聚A信号序列;所述核酸构建体进一步包括在选自由以下组成的组中的一个或多个位置处的至少一个插入元件:5'至任选的第一启动子或选择标记序列、3'至多聚A信号序列、在任选的第一启动子和多聚A信号序列之间、在选择标记和第二启动子序列之间、以及5'至任选的第一个启动子序列或选择标记序列和3'至多聚A信号序列两者。在一些实施方式中,核酸构建体包括第一启动子序列。在一些优选的实施方式中,所述构建体不包括在选择标记和第二启动子之间的多聚A信号序列。在一些优选的实施方式中,选择标记邻近第二启动子。在一些优选的实施方式中,第二启动子邻近编码第一目的蛋白的核酸序列。在一些优选的实施方式中,核酸构建体包括在第一启动子和选择标记之间的非编码区。在一些优选的实施方式中,非编码区包括多个潜在的Kozak序列和/或ATG翻译起始位点。在一些优选的实施方式中,核酸构建体包括在第一启动子和选择标记之间的延伸包装区(EPR)。在一些优选的实施方式中,EPR包括多个潜在的Kozak序列和/或ATG翻译起始位点。
在一些优选的实施方式中,第一启动子序列选自由以下组成的组:SIN-LTR、SV40、大肠杆菌(E.Coli)lac、大肠杆菌trp、噬菌体λPL、噬菌体λPR、T3、T7、巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、α-乳清蛋白、人延伸因子1α(hEF1α)和小鼠金属硫蛋白-I启动子序列。在一些优选的实施方式中,第一启动子序列不是逆转录病毒LTR启动子。
在一些优选的实施方式中,选择标记序列是选自由谷氨酰胺合酶(GS)和二氢叶酸还原酶(DHFR)序列组成的组的可扩增的选择标记序列。在一些优选的实施方式中,选择标记序列是选自由新霉素抗性基因(neo)、潮霉素B磷酸转移酶基因和嘌呤霉素N-乙酰转移酶基因序列组成的组的抗生素抗性标志物序列。
在一些优选的实施方式中,第二启动子序列选自由以下组成的组:SV40、大肠杆菌lac、大肠杆菌trp、噬菌体λPL、噬菌体λPR、T3、T7、巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、α-乳清蛋白、人延伸因子1α(hEF1α)和小鼠金属硫蛋白-I启动子序列。
在一些优选的实施方式中,编码目的蛋白的核酸序列编码选自由重链和轻链免疫球蛋白序列组成的组的蛋白质。
在一些优选的实施方式中,插入元件选自由转座子插入元件、重组酶插入元件和HDR插入元件组成的组。在一些优选的实施方式中,转座子插入元件是末端反向重复。在一些优选的实施方式中,构建体包括定位在5'至第一启动子以及3'至多聚A信号序列的两个末端反向重复。在一些优选的实施方式中,重组酶插入元件是附着位点(att)。在一些优选的实施方式中,附着位点(att)是attB。在一些优选的实施方式中,HDR插入元件包括AAVS1安全港基因座(safe harbor locus)序列。在一些优选的实施方式中,HDR插入元件是与染色体中靶位点同源的核酸序列。在一些优选的实施方式中,与染色体中靶位点同源的核酸序列的长度为约30至1000个碱基。在一些优选的实施方式中,构建体包括与染色体中定位在5'至第一启动子和3'至多聚A信号序列的靶位点同源的两个核酸序列。在一些优选的实施方式中,重组酶插入元件是Flp重组靶(FRT)位点。在一些优选的实施方式中,重组酶插入元件是LoxP序列。
在一些优选的实施方式中,构建体进一步包括RNA输出元件。在一些优选的实施方式中,RNA输出元件位于3'或5'至编码目的蛋白的核酸序列。在一些优选的实施方式中,RNA输出元件是前mRNA(pre-mRNA)加工增强子(PPE)。在一些优选的实施方式中,RNA输出元件是转录后调节元件(PRE)。在一些优选的实施方式中,PRE RNA输出元件是土拨鼠(Woodchuck)肝炎病毒转录后调节元件(WPRE)。
在一些优选的实施方式中,构建体进一步包括可操作地连接至第一目的蛋白的信号肽序列。在一些优选的实施方式中,信号肽序列选自由以下组成的组:组织纤溶酶原激活物、人生长激素、乳铁蛋白、α-酪蛋白和α-乳清蛋白信号肽序列。
在一些优选的实施方式中,构建体进一步包括蛋白质纯化标志物序列。在一些优选的实施方式中,蛋白质纯化标志物序列是六组氨酸标签或血凝素(HA)标签。
在一些优选的实施方式中,构建体还包括内部核糖体进入位点(IRES)序列和定位在3'至编码第一目的蛋白的核酸序列的编码至少第二目的蛋白(例如,包括第三、第四、第五等目的蛋白)的第二核酸序列。在一些优选的实施方式中,IRES序列选自由口蹄疫病毒(FDV)、脑心肌炎病毒和脊髓灰质炎病毒IRES序列组成的组。
在一些优选的实施方式中,核酸构建体进一步包括可操作地连接至编码第二目的蛋白的第二核酸序列的第三启动子,所述第二核酸序列定位在3'至编码第一目的蛋白的核酸序列。在一些优选的实施方式中,第三启动子序列选自由以下组成的组:SV40、大肠杆菌lac、大肠杆菌trp、噬菌体λPL、噬菌体λPR、T3、T7、巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、α-乳清蛋白、人延伸因子1α(hEF1α)和小鼠金属硫蛋白-I启动子序列。在一些优选的实施方式中,构建体进一步包括与编码第二目的蛋白的第二核酸序列可操作的联接的RNA输出元件。在一些优选的实施方式中,构建体进一步包括与编码第二目的蛋白的第二核酸序列可操作的联接的多聚A信号序列。
在一些优选的实施方式中,第一目的蛋白是抗体重链或轻链中的一个,并且第二目的蛋白是抗体重链和轻链中的另一个。
在一些优选的实施方式中,核酸构建体进一步包括可操作地连接至编码第二目的蛋白的第二核酸序列的内含子,所述第二核酸序列定位在3'至编码第一目的蛋白的核酸序列。在一些优选的实施方式中,构建体进一步包括与编码第二目的蛋白的第二核酸序列可操作的联接的RNA输出元件。在一些优选的实施方式中,构建体进一步包括与编码第二目的蛋白的第二核酸序列可操作的联接的多聚A信号序列。在一些优选的实施方式中,第一目的蛋白是抗体重链或轻链中的一个,并且第二目的蛋白是抗体重链和轻链中的另一个。
在一些优选的实施方式中,本发明提供了包括如上所述核酸构建体的载体。在一些优选的实施方式中,载体是质粒。
在一些优选的实施方式中,本发明提供了包括如上所述的核酸构建体或如上所述的载体的宿主细胞。在一些优选的实施方式中,宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞、CAP细胞、牛乳腺上皮细胞、由SV40转化的猴肾CV1系、幼仓鼠肾细胞、小鼠支持细胞、猴肾细胞、非洲绿猴肾细胞、人宫颈癌细胞、犬肾细胞、水牛大鼠(buffalo rat)肝细胞、人肺细胞、人肝细胞、小鼠乳腺肿瘤、TRI细胞、MRC5细胞、FS4细胞、大鼠成纤维细胞、MDBK细胞和人肝癌细胞系细胞。在一些优选的实施方式中,宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞和CAP细胞。在一些优选的实施方式中,宿主细胞系是GS敲除细胞系。在一些优选的实施方式中,宿主细胞系是DHFR敲除细胞系。在一些优选的实施方式中,宿主细胞包括约1个至1000个拷贝的核酸构建体。在一些优选的实施方式中,宿主细胞包括约10个至200个拷贝的核酸构建体。在一些优选的实施方式中,宿主细胞包括约10个至100个拷贝的核酸构建体。在一些优选的实施方式中,宿主细胞包括约20个至100个拷贝的核酸构建体。在一些优选的实施方式中,宿主细胞包括50个至500个拷贝的核酸构建体。在一些优选的实施方式中,宿主细胞包括50个至250个拷贝的核酸构建的。
在一些优选的实施方式中,宿主细胞进一步包括至少第二核酸构建体,其编码并允许表达第二目的蛋白。在一些优选的实施方式中,第二核酸构建体不包括选择标记。在一些优选的实施方式中,第二核酸构建体包括与第一核酸构建体中的选择标记不同的选择标记。在一些优选的实施方式中,第一核酸构建体中的第一目的蛋白是免疫球蛋白重链或轻链中的一个,并且第二核酸构建体中的第二蛋白质是免疫球蛋白重链或轻链中的另一个。在一些优选的实施方式中,第一目的蛋白是免疫球蛋白重链,并且第二目的蛋白是免疫球蛋白轻链。在一些优选的实施方式中,宿主细胞包括约1个至1000个拷贝的第二核酸构建体。在一些优选的实施方式中,宿主细胞包括约10个至200个拷贝的第二核酸构建体。在一些优选的实施方式中,宿主细胞包括约10个至100个拷贝的第二核酸构建体。在一些优选的实施方式中,宿主细胞包括约20个至100个拷贝的第二核酸构建体。在一些优选的实施方式中,宿主细胞包括50个至500个拷贝的第二核酸构建体。在一些优选的实施方式中,宿主细胞包括50个至250个拷贝的第二核酸构建体。
在一些优选的实施方式中,本发明提供一种包括如上所述的宿主细胞的宿主细胞培养物。
在一些优选的实施方式中,本发明提供了一种用于产生目的蛋白的方法,包括在使得一种或多种目的蛋白被表达的条件下培养如上所述的宿主细胞并且从宿主细胞培养物中纯化一种或多种目的蛋白。在一些优选的实施方式中,宿主细胞在包括选择标记的抑制剂的培养基中生长。在一些优选的实施方式中,选择标记是GS以及抑制剂是草丁膦或甲硫氨酸氨基亚砜(Msx)。在一些优选的实施方式中,选择标记是DHFR以及抑制剂是氨甲蝶呤。
在一些优选的实施方式中,本发明提供包括如上所述核酸构建体的载体。在一些优选的实施方式中,载体选自由质粒载体、逆转录病毒载体、慢病毒载体、AAV载体和转座子载体组成的组。
在一些优选的实施方式中,本发明提供包括以下的系统:如上所述的第一核酸构建体;以及编码酶的第二核酸构建体。在一些优选的实施方式中,在不同的载体上提供构建体。在一些优选的实施方式中,在相同的载体上提供构建体。在一些优选的实施方式中,酶选自由转座酶、整合酶、重组酶、核酸酶和切口酶组成的组。在一些优选的实施方式中,核酸酶是Cas核酸酶。在一些优选的实施方式中,切口酶是Cas切口酶。在一些优选的实施方式中,系统进一步包括一个或多个RNA指导序列。在一些优选的实施方式中,酶促进核酸构建体或其部分插入到宿主细胞的基因组中。
在一些优选的实施方式中,系统进一步包括至少如上所述的第三核酸构建体,所述第三核酸构建体编码与第一核酸构建体中的目的蛋白不同的目的蛋白。在一些优选的实施方式中,在单独的载体中提供第三核酸构建体。在一些优选的实施方式中,在与第一核酸构建体和第二核酸构建体相同的载体中提供第三核酸构建体。
在一些优选的实施方式中,本发明提供包括如上所述的至少第一核酸构建体和第二核酸构建体的系统;其中所述第一核酸构建体和第二核酸构建体各自编码不同的目的蛋白。在一些优选的实施方式中,在单独的载体中提供第一核酸构建体和第二核酸构建体。在一些优选的实施方式中,在相同的载体中提供第一核酸构建体和第二核酸构建体。在一些优选的实施方式中,系统进一步包括编码酶的第三核酸构建体。在一些优选的实施方式中,酶选自由转座酶、整合酶、重组酶、核酸酶和切口酶组成的组。在一些优选的实施方式中,核酸酶是Cas核酸酶。在一些优选的实施方式中,切口酶是Cas切口酶。在一些优选的实施方式中,系统进一步包括一个或多个RNA指导序列。在一些优选的实施方式中,酶促进核酸构建体或其部分插入到宿主细胞的基因组中。在一些优选的实施方式中,在单独的载体中提供第三核酸构建体。在一些优选的实施方式中,在与第一核酸构建体和第二核酸构建体相同的载体中提供第三核酸构建体。
在一些优选的实施方式中,本发明提供了一种用于产生目的蛋白的方法,包括:在使得核酸构建体被掺入到宿主细胞的基因组的条件下将如上所述的核酸构建体、载体或系统引入宿主细胞;发展表达目的蛋白的宿主细胞系;在使得目的蛋白由宿主细胞产生的条件下从宿主细胞系培养宿主细胞;以及从宿主细胞培养物中纯化目的蛋白。
在一些优选的实施方式中,宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞、CAP细胞、牛乳腺上皮细胞、由SV40转化的猴肾CV1系、幼仓鼠肾细胞、小鼠支持细胞、猴肾细胞、非洲绿猴肾细胞、人宫颈癌细胞、犬肾细胞、水牛大鼠(buffalo rat)肝细胞、人肺细胞、人肝细胞、小鼠乳腺肿瘤、TRI细胞、MRC 5细胞、FS4细胞、大鼠成纤维细胞、MDBK细胞和人肝癌细胞系细胞。在一些优选的实施方式中,宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞和CAP细胞。在一些优选的实施方式中,宿主细胞系是GS敲除细胞系。在一些优选的实施方式中,宿主细胞系是DHFR敲除细胞系。在一些优选的实施方式中,宿主细胞在包括选择标记的抑制剂的培养基中生长。在一些优选的实施方式中,选择标记是GS以及抑制剂是草丁膦或甲硫氨酸氨基亚砜(Msx)。在一些优选的实施方式中,选择标记是DHFR以及抑制剂是氨甲蝶呤。在一些优选的实施方式中,在使得目的蛋白由宿主细胞产生的条件下从宿主细胞系培养宿主细胞进一步包括在选自由培养皿、孔板、滚瓶、生物反应器、灌注系统和补料分批培养物组成的组的系统中培养。
附图说明
图中使用的缩写:
AmpR=细菌氨苄青霉素抗性基因
attB=细菌附着位点
attP=噬菌体附着位点
attR=重组的上游附着位点
骨架=质粒骨架
CDS=编码序列
EPR=MMLV延伸包装区
GCI=基因拷贝指数
GS=谷氨酰氨合成酶
H或HC=重链
hCMV=人巨细胞病毒立即早期启动子
I=内含子
L或LC=轻链
MoMuSV 5'LTR=莫洛尼(Moloney)鼠肉瘤病毒5'长末端重复序列
Neo=新霉素抗性基因PA或多聚A=多腺苷酸化信号
ProV SIN-LTR=前病毒自失活长末端重复序列
sCMV=猿巨细胞病毒立即早期启动子
SDS-PAGE=十二烷基硫酸钠-聚丙烯酰胺凝胶电泳
SIN-3'LTR=自失活3'长末端重复
SV40=猿病毒40
TK=胸苷激酶
UTR=非翻译区
W或WPRE=土拨鼠转录后调节元件
图1.用于本发明某些实施方式的核酸构建体设计。
图2.在谷氨酰胺的缺失下,转染和选择之后的细胞存活曲线图。显示了重复转染的平均值。
图3.描述使用不同质粒制备的合并的细胞系的生产率和拷贝数分析的图表。显示了重复转染的平均值。
图4.在谷氨酰胺的缺失下,转染和选择之后的细胞存活曲线图。显示了重复转染的平均值。
图5.PhiC31整合酶表达质粒图。
图6.PhiC31整合酶表达质粒序列。
图7.Dock质粒图。
图8.Dock质粒序列。
图9.Dock-WPRE质粒图。
图10.Dock-WPRE质粒序列。
图11.转基因-启动子-Anyway质粒图。在该质粒中,GS的表达由弱的莫洛尼鼠肉瘤病毒5'前病毒自灭活长末端重复驱动。
图12.转基因-启动子-Anyway质粒序列。在质粒和所有后续的转基因质粒中,在转基因质粒中不存在驱动GS表达的启动子。
图13.转基因-Anyway质粒图
图14.转基因-Anyway质粒序列
图15.转基因-MCS质粒图
图16.转基因-MCS质粒序列
图17.转基因-MCS-WPRE-内含子-MCS质粒图
图18.转基因-MCS-WPRE-内含子-MCS质粒序列
图19.转基因-MCS-WPRE-MCS-WPRE质粒图
图20.转基因-MCS-WPRE-MCS-WPRE质粒序列
图21.转基因-Yourway-HWIL质粒图
图22.转基因-Yourway-HWIL质粒序列
图23.转基因-Yourway-LWIH质粒图
图24.转基因-Yourway-LWIH质粒序列
图25.转基因-Yourway-HWLW质粒图
图26.转基因-Yourway-HWLW质粒序列
图27.转基因-Yourway-LWHW质粒图
图28.转基因-Yourway-LWHW质粒序列
图29.来自Dock细胞池(cell pool)的未选择的attR基因拷贝指数的图,所述细胞池平均包含约36个Dock/细胞,所述细胞以指示的比率用转基因-启动子-Anyway质粒转染。
图30.在图29中从选定池选择的活细胞随时间变化的百分比图。
图31.来自图30的所有池的attR基因拷贝指数和拷贝数的图表。
图32.从Dock细胞池选择的活细胞随时间变化的百分比图,所述细胞池平均包含约135个Dock/细胞,所述细胞以指示的比率用无启动子的转基因-Anyway质粒和整合酶质粒转染。显示重复池的平均值。
图33.来自图32的选择之后的池的attR基因拷贝指数图表。显示重复池的平均值。
图34.从Dock克隆细胞选择的活细胞随时间变化的百分比图,所述克隆细胞包含大约181个拷贝的Dock/细胞,所述细胞以指示的比率用转基因-Yourway-LWHW质粒和整合酶质粒转染。显示重复池的平均值。
图35.来自图34的选择之后的池的attR基因拷贝指数图表。显示重复池的平均值。
图36.attR(填充的dock)和attP(空的dock)基因拷贝指数、填充的Dock%以及由Dock池制备的克隆的补料分批生产率的最终滴度的图表,Dock池含有大约135个拷贝的Dock/细胞,所述细胞用转基因-Anyway质粒和整合酶质粒转染。
图37.在图36中所有25个克隆的Excell补料分批生产率滴度与attR基因拷贝指数的图。
图38.Dock克隆细胞的选择的活细胞随时间变化的百分比的图,克隆细胞包含约181个拷贝的Dock/细胞,所述细胞以指示的比率用转基因-Yourway-LWHW、Yourway-HWLW、Yourway-HWIL、Yourway-LWIH或Anyway质粒(单独地)和整合酶质粒转染。显示重复池的平均值。
图39.由来自图38的Dock池制备的克隆的补料分批生产率的最终滴度和attR基因拷贝指数的图表。显示重复池的平均值。
图40.在非还原(左)和还原条件(右)下运行的转基因-Yourway和转基因-Anyway产物的SDS-PAGE分析。
图41.使用表达Anyway的3个池的两种不同培养基/补料策略的补料分批生产率的40代的最终效价图。
定义
为了便于理解本发明,下面定义了许多术语。
如本文所用,术语“宿主细胞”是指任何真核细胞(例如哺乳动物细胞、禽类细胞、两栖动物细胞、植物细胞、鱼类细胞以及昆虫细胞),无论位于体外还是体内。
如本文所用,术语“细胞培养物”是指细胞的任何体外培养物。该术语中包括连续细胞系(例如,具有永生表型)、原代细胞培养物、有限细胞系(例如,非转化细胞),以及任何其他在体外维持的细胞群,包括卵母细胞和胚胎。
如本文所用,术语“载体”是指任何遗传元件,诸如质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒粒子等等,当与适当的控制元件结合时其能够复制,并且其能在细胞之间转移基因序列。因此,所述术语包括克隆和表达负载体以及病毒载体。
如本文所用,术语“基因组”是指生物体的遗传物质(例如染色体)。
术语“目的核苷酸序列”是指任何核苷酸序列(例如RNA或DNA),出于任何原因(例如治疗疾病、赋予改良的质量、在宿主细胞中表达目的蛋白、表达核酶等),本领域普通技术人员认为对其进行的操作是合乎需要的。这样的核苷酸序列包括但不限于结构基因的编码序列(例如报道基因、选择标志物基因、癌基因、耐药基因、生长因子等),以及不编码mRNA或蛋白质产物的非编码调节序列(例如启动子序列、多聚腺苷酸化序列、终止序列、增强子序列等)。
如本文所用,术语“目的蛋白”是指由目的核酸编码的蛋白质。
如本文所用,术语“编码......的核酸分子”、“编码......的DNA序列”、“编码......的DNA”、“编码......的RNA序列”和“编码......的RNA”是指沿着脱氧核糖核酸或核糖核酸的链的脱氧核糖核苷酸或核糖核苷酸的顺序或次序。这些脱氧核糖核苷酸或核糖核苷酸的顺序决定了沿着多肽(蛋白质)链的氨基酸的顺序。因此,DNA或RNA序列编码氨基酸序列。
如本文所用,术语“启动子”、“启动子元件”或“启动子序列”是指当与目的核苷酸序列连接时能够控制目的核苷酸序列转录成mRNA的DNA序列。尽管不是必须的,但是启动子通常位于其控制转录成mRNA的目的核苷酸序列的5'(即上游),并提供用于RNA聚合酶和其他转录因子特异性结合的位点以启动转录。
真核生物中的转录控制信号包含“启动子”和“增强子”元件。启动子和增强子由与参与转录的细胞蛋白特异性相互作用的DNA序列的短阵列组成(Maniatis et al.,Science236:1237[1987])。已经从多种真核来源分离了启动子和增强子元件,包括酵母、昆虫和哺乳动物细胞以及病毒中的基因(在原核生物中也发现了类似的控制元件,即启动子)。具体启动子和增强子的选择取决于要用来表达目的蛋白的细胞类型。一些真核启动子和增强子具有广泛的宿主范围,而其他的在有限子集的细胞类型中起作用(综述参见Voss et al.,Trends Biochem.Sci.,11:287[1986];and Maniatis et al.,在前)。例如,SV40早期基因增强子在来自许多哺乳动物物种的多种细胞类型中都非常活跃,并已被广泛用于在哺乳动物细胞中表达蛋白质(Dijkema et al.,EMBO J.4:761[1985])。在广泛的哺乳动物细胞类型中活跃的启动子/增强子元件的两个其他实例是来自人延伸因子1α基因的启动子/增强子元件(Uetsuki et al.,J.Biol.Chem.,264:5791[1989];Kim et al.,Gene 91:217[1990];和Mizushima and Nagata,Nuc.Acids.Res.,18:5322[1990])和劳斯肉瘤病毒的长末端重复序列(Gorman et al.,Proc.Natl.Acad.Sci.USA 79:6777[1982])和人巨细胞病毒(Boshart et al.,Cell 41:521[1985])。
如本文所用的术语“启动子/增强子”表示含有能够提供启动子和增强子功能(即,由启动子元件和增强子元件提供的功能,参见以上对这些功能的讨论)的序列的DNA区段。例如,逆转录病毒的长末端重复序列包含启动子和增强子功能。增强子/启动子可以是“内源的”或“外源的”或“异源的”。“内源的”增强子/启动子是天然地与基因组中给定的基因连接的增强子/启动子。“外源的”或“异源的”增强子/启动子”是如下的增强子/启动子:借助于遗传操作(即,分子生物学技术,诸如克隆和重组),其与基因并列放置,使得所述基因的转录由所连接的增强子/启动子指导。
如本文所用,术语“LTR”的“长末端重复序列”是指位于逆转录病毒基因组的U3区域5'和3'中或与之分离的转录控制元件。如本领域已知的,长末端重复序列可以用作逆转录病毒载体中的控制元件,或从逆转录病毒基因组中分离出来,并用于控制来自其他类型载体的表达。
如本文所用,术语“互补的”或“互补性”用于指通过碱基配对规则而相关的多核苷酸(即核苷酸的序列)。例如,序列"5'-A-G-T-3'与序列"3'-T-C-A-5'"互补。互补性可能是“部分的”,其中只有一些核酸的碱基是根据碱基配对规则匹配的。或者,核酸之间可能存在“完全”或“全部”互补性。核酸链之间的互补性程度对核酸链之间杂交的效率和强度具有显著影响。这在扩增反应以及依赖于核酸之间的结合的检测方法中特别重要。
当关于核酸使用时,术语“同源性”和“同一性百分比”是指互补性的程度。可能存在部分同源性(即部分同一性)或完全同源性(即完全同一性)。部分互补序列是至少部分抑制完全互补序列与靶核酸序列杂交的序列,并且使用功能性术语“基本上同源”来指代。可以在低严格性条件下使用杂交测定法(DNA印迹或RNA印迹、溶液杂交等)来检查完全互补序列与靶序列的杂交的抑制。基本上同源的序列或探针(即能够与另一目的寡核苷酸杂交的寡核苷酸)在低严格性条件下将与完全同源的序列竞争并抑制其与靶序列的结合(即杂交)。这并不是说低严格性的条件允许非特异性结合的条件;低严格性条件要求两个序列彼此的结合是特异性(即选择性)相互作用。可以通过使用甚至缺失部分程度的互补性(例如小于约30%同一性)的第二靶标来测试非特异性结合的不存在;在不存在非特异性结合的情况下,探针将不与第二非互补靶标杂交。
如本文所用,术语“以可操作的组合”、“以可操作的顺序”和“可操作地连接”是指以这样一种方式的核酸序列的连接:产生能够指导给定基因的转录和/或所需蛋白质分子的合成的核酸分子。所述术语还指以产生功能蛋白的方式的氨基酸序列的连接。
如本文所用,术语“选择标记”是指编码酶活性或其他蛋白质的基因,该酶活性或其他蛋白质赋予在缺乏原本将是必需营养素的培养基中生长的能力;另外,选择标记可以赋予表达选择标记的细胞对抗生素或药物的抗性。
如本文所用,术语“逆转录病毒”是指如下逆转录病毒颗粒,其能够进入细胞(即,该颗粒含有可以与宿主细胞表面结合并促进病毒颗粒进入宿主细胞的细胞质中的膜相关蛋白诸如包膜蛋白或病毒G糖蛋白),并将逆转录病毒基因组(作为双链前病毒)整合到宿主细胞的基因组中。术语“逆转录病毒”包括肿瘤病毒亚科(Oncovirinae)(例如莫洛尼鼠白血病病毒(MoMLV)、莫洛尼鼠肉瘤病毒(MoMSV)和小鼠乳腺肿瘤病毒(MMTV)、泡沫病毒亚科(Spumavirinae)和慢病毒(例如人免疫缺陷病毒、猿免疫缺陷病毒、马感染贫血病毒和山羊关节炎-脑炎病毒;参见例如美国专利第5,994,136号和第6,013,516号,两者通过引用并入本文)。
如本文所用,术语“逆转录病毒载体”是指已经被修饰成表达目的基因的逆转录病毒。逆转录病毒载体可用于通过利用病毒感染过程将基因有效地转移到宿主细胞中。克隆(即,使用分子生物学技术插入)到逆转录病毒基因组中的外源或异源基因可以被有效地递送至易受逆转录病毒感染的宿主细胞。通过众所周知的遗传操作,可以破坏逆转录病毒基因组的复制能力。所得到的复制缺陷载体可以用于将新的遗传物质引入细胞,但它们无法复制。辅助病毒或包装细胞系可以用于允许载体颗粒组装并从细胞中排出。这类逆转录病毒载体包含复制缺陷逆转录病毒基因组,其含有编码至少一个目的基因的核酸序列(即,多顺反子核酸序列可编码超过一个目的基因)、5'逆转录病毒长末端重复序列(5'LTR);和3'逆转录病毒长末端重复序列(3'LTR)。
如本文所用,术语“慢病毒载体”是指能够整合至非分裂细胞中的来源于慢病毒科(例如人免疫缺陷病毒、猿免疫缺陷病毒、马传染性贫血病毒和山羊关节炎-脑炎病毒)的逆转录病毒载体(参见例如美国专利第5,994,136号和第6,013,516号,其通过引用并入本文)。
如本文所用,术语“转座子”是指可从基因组中的一个位置移动或转座到另一位置的可转座元件(例如Tn5、Tn7和Tn10)。通常,转座由转座酶控制。如本文所用,术语“转座子载体”是指编码转座子末端两侧的目的核酸的载体。转座子载体的实例包括但不限于美国专利第6,027,722号、第5,958,775号、第5,968,785号、第5,965,443号和第5,719,055号(其全部通过引用并入本文)中描述的那些。
如本文所用,术语“腺相关病毒(AAV)载体”是指来源与腺相关病毒血清型的载体,包括但不限于AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAVX7等。AAV载体可全部或部分缺失AAV野生型基因中的一个或多个,优选rep和/或cap基因,但保留功能性侧翼ITR序列。
可以使用本领域已知的重组技术来构建AAV载体,以包括在两端(5'和3')两侧的具有功能性AAV ITR的一个或多个异源核苷酸序列。在本发明的实践中,AAV载体可包括位于异源核苷酸序列上游的至少一个AAV ITR和合适的启动子序列,以及位于异源序列下游的至少一个AAV ITR。“重组AAV载体质粒”是指重组AAV载体的一种类型,其中载体包含质粒。通常与AAV载体一样,5'和3'ITR位于选择的异源核苷酸序列的两侧。
如本文所用,术语“腺病毒载体”是指包括腺病毒骨架的非包膜双链DNA载体。
如本文所用,术语“纯化的”是指从其正常环境中去除、分离或分开的分子,无论是核酸序列还是氨基酸序列。因此,“分离的核酸序列”是纯化的核酸序列。“基本上纯化的”分子至少60%不含,优选至少75%不含,并且更优选至少90%不含与它们通常相关的其他组分。
具体实施方式
本发明涉及核酸构建体和其开发用于生产目的蛋白的宿主细胞系的用途,并且特别涉及允许改进选择以开发高产细胞系的核酸构建物。
在一些优选的实施方式中,本发明提供了用于在宿主细胞中表达一种或多种目的蛋白的核酸构建体。在一些优选的实施方式中,核酸构建体包括以5'至3'顺序可操作的联接的以下元件:
第一启动子序列-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-多聚A信号序列。
在一些优选实施方式中,根据本发明的所述构建体不包括在选择标记序列和第二启动子序列之间的多聚A信号序列。本发明不限于任何特定的作用机制。实际上,对作用机制的理解对于实施本发明并不是必要的。然而,已经发现在选择标记之后缺乏多聚A信号序列的构建体可以提供在宿主细胞培养物中目的蛋白的更好选择和生产。还在一些其他优选的实施方式中,选择标记邻近第二启动子。还在一些其他优选的实施方式中,第二启动子邻近编码第一目的蛋白的核酸序列。在这种情况下,术语“邻近”意味着在所列组分之间没有介于中间的功能元件或内含子。
核酸构建体可以与许多不同的载体和载体系统一起使用。合适的载体和载体系统包括但不限于病毒基因插入技术诸如逆转录病毒、慢病毒和AAV系统,以及非病毒基因插入技术诸如转座酶、重组酶、整合酶或CRISPR基因插入。可与本发明的核酸构建体一起使用的技术/酶的具体实例包括背驮(piggyback)转座酶系统、睡美人(sleeping beauty)转座酶系统、Mos1转座酶系统、Tol2转座酶系统、Leapin转座酶系统、λ重组酶系统、FLP/FRT系统、Cre/Lox系统、MMLV整合酶系统、Rep 78整合酶系统和CRISPR系统,其可以包括核酸酶或切口酶以及引导序列。在一些优选的实施方式中,系统是核酸整合系统,但条件是所述系统不是利用逆转录病毒或慢病毒LTR的逆转录病毒系统或慢病毒系统。
在一些实施方式中,构建体在包括美国临时申请63/033,516中所述的整合对接位点(docking site)的宿主细胞中是有用的,其全部内容通过援引并入本文。整合对接位点优选包括一个或多个插入元件(其可称为“dock位点插入元件(dock site insertionelement)”。dock位点插入元件优选是促进编码目的蛋白的核酸序列在dock位点处插入的核酸序列。下面详细描述可插入到本发明宿主细胞中dock位点的核酸构建体。
例如,在一些优选的实施方式中,重组酶dock位点插入元件包括附着位点(att)。在一些特别优选的实施方式中,附着位点是attP。这些附着位点被PhiC31整合酶利用,它是一种重组酶,并且在优选的实施方式中可以通过载体在宿主细胞中提供。这些dock位点用作受体,用于整合包括attB附着位点的核酸构建体。在其他优选的实施方式中,可以利用attR和attL附着位点。
在其他优选的实施方式中,重组酶dock位点插入元件包括Flp重组靶(FRT)位点。这些位点被酶翻转酶利用,翻转酶是一种重组酶,并且在优选的实施方式中其可以通过载体在宿主细胞中提供。这些dock位点用作受体,用于整合包括在FRT位点处的核酸构建体。
在其他优选的实施方式中,重组酶dock位点插入元件包括LoxP位点。这些位点被Cre重组酶利用,在优选的实施方式中其可以通过载体在宿主细胞中提供。这些dock位点用作受体,用于整合包括LoxP位点的核酸构建体。
在其他优选的实施方式中,插入元件是HDR(同源定向修复)dock位点插入元件。HDR dock位点插入组件是提供同源区域(“同源臂”)的核酸序列,该同源区域与在该位点插入的核酸构建体上的相应同源臂碱基配对。这些系统优选与内切核酸酶一起使用,内切核酸酶在一个或多个靶向位点,优选同源臂的两侧,引入双链断裂。在一些优选的实施方式中,HDR dock位点插入元件包括AAVS1安全港基因座。在这些实施方式中,dock位点被Rep78内切核酸酶(切口酶)利用,其可以通过载体被引入到宿主细胞中。Rep78蛋白切口酶促进核酸序列的位点特异性的整合,所述核酸序列携带与AAVS1安全港基因座对应的同源臂。
在其他优选的实施方式中,HDR dock位点插入元件包括一个或多个同源臂,所述同源臂是长度为30至1000个碱基对的外源序列。这些dock位点优选与CRISPR基因编辑系统一起使用。在一些实施方式中,dock位点还包括一个或多个与引导RNA序列同源的序列。在这些实施方式中,在dock位点处插入的核酸构建体优选包括与在dock位点处的同源臂同源并与之碱基配对的同源臂。为了与CRISPR基因编辑系统一起使用,将CRISPR基因编辑系统相容的核酸酶引入到宿主细胞中。CRISPR基因编辑系统相容的核酸酶可以是野生型内切核酸酶,其在由引导RNA确定的位置(和在对接位点内)处产生双链断裂,或者是突变的核酸酶(即切口酶),其在两个引导RNA限定的dock位点内交错的位置处产生单链断裂。合适的核酸酶将在下文讨论核酸表达构建体时详细描述。
在一些优选的实施方式中,dock位点可以优选地包括合适的启动子,以便在dock位点处引入合适的核酸构建体时利用启动子捕获方案。合适的启动子包括但不限于,SIN-LTR、SV40、EF1a、大肠杆菌lac、大肠杆菌trp、噬菌体λPL、噬菌体λPR、T3、T7、巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、α-乳清蛋白和小鼠金属硫蛋白-I启动子序列。在一些优选的实施方式中,启动子序列在dock位点处定向,以便启动子驱动插入的核酸构建体表达。在一些优选的实施方式中,启动子定向5'至dock位点。在一些优选的实施方式中,启动子是SIN LTR。在这些实施方式中,SIN-LTR和EPR被定位在5'至dock位点处,并且SIN LTR被定位在3'至dock位点处。
因此,在一些优选的实施方式中,核酸构建体进一步包括插入元件。优选地,插入元件可以位于5'至第一启动子、3'至多聚A信号序列、第一启动子和多聚A信号序列之间、选择标记和第二启动子序列之间、以及5'至第一启动子和3'至多聚A信号序列。合适的构建体在以下非限制性实例中显示:
表达构建体插入元件-第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二(即内部)启动子序列-编码第一目的蛋白的核酸序列-多聚A信号序列
第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-多聚A信号序列–表达构建体插入元件
表达构建体插入元件-第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-多聚A信号序列-表达构建体插入元件。
第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-表达构建体插入元件-第二启动子序列-编码第一目的蛋白的核酸序列-多聚A信号序列。
在一些优选的实施方式中,构建体可以包括编码多个目的蛋白的核酸序列,例如2、3、4或5个目的蛋白。表达两个目的蛋白的合适构建体见于以下非限制性实例。
表达构建体插入元件-第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二(即内部)启动子序列-编码第一目的蛋白的核酸序列-WPRE(任选的)-多聚A信号序列–第三启动子序列或IRES-编码第二目的蛋白的核酸序列–WPRE(任选的)-多聚A信号序列。
第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-WPRE(任选的)–多聚A信号序列–第三启动子序列–内含子(任选的)-编码第二目的蛋白的核酸序列-WPRE(任选的)-多聚A信号序列–表达构建体插入元件
表达构建体插入元件-第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-WPRE(任选的)-多聚A信号序列–第三启动子序列–内含子(任选的)-编码第二目的蛋白的核酸序列-WPRE(任选的)–多聚A信号序列-表达构建体插入元件。
第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-表达构建体插入元件-第二启动子序列-编码第一目的蛋白的核酸序列-WPRE-多聚A信号序列–第三启动子序列或IRES-编码第二目的蛋白的核酸序列–WPRE-多聚A信号序列。
表达构建体插入元件-第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-WPRE(任选的)–多聚A信号序列–第三启动子序列-编码第二目的蛋白的核酸序列-WPRE(任选的)-多聚A信号序列–表达构建体插入元件。
表达构建体插入元件-第一启动子序列(任选的,取决于dock位点是否已经包括外源启动子序列)-选择标记序列-第二启动子序列-编码第一目的蛋白的核酸序列-WPRE(任选的)-多聚A信号序列–第三启动子序列–内含子-编码第二目的蛋白的核酸序列-WPRE(任选的)–多聚A信号序列-表达构建体插入元件。
在一些优选的实施方式中,第一目的蛋白是抗体重链或轻链中的一个,并且第二目的蛋白是抗体重链和轻链中的另一个。
然而,任何合适的目的蛋白都可以通过本发明的宿主细胞、构建体和系统表达。示例性的目的蛋白包括免疫球蛋白、单链抗体、抗凝蛋白、血液因子蛋白、骨形态发生蛋白、工程蛋白支架、酶、Fc融合蛋白、生长因子、激素、干扰素、白细胞介素、抗原和溶栓蛋白。在其他优选的实施方式中,可以利用本发明的构建体来表达病毒载体。在这些实施方式中,上述示例性载体中描述的目的蛋白序列被替换为编码病毒载体骨架的核酸序列。可包括在本发明的构建体中的病毒载体包括但不限于,逆转录病毒载体、慢病毒载体、腺病毒载体和AAV载体。在一些优选的实施方式中,逆转录病毒载体本身包括由所述载体表达的编码上述目的蛋白的核酸序列。在一些特别优选的实施方式中,由载体表达的目的蛋白是用于在疫苗中使用的抗原序列。
在一些优选的实施方式中,插入元件是发现与转座子、整合酶、重组酶或CRISPR系统一起使用或被其识别的元件。合适的插入元件包括但不限于末端反向重复、整合酶附着位点(att)和同源重组臂,其在本文所述的构建体的背景下可以被描述为同源重组插入元件。
在一些优选的实施方式中,本发明的核酸构建体包括转座子插入元件,优选由转座子识别的末端反向重复。在一些优选的实施方式中,末端反向重复定位在构建体的5'和3'两端处。转座子是可移动的遗传元件,其可以从基因组中的一个位置移动或转座到另一个位置。基因组内的转座由转座子编码的转座酶控制。转座子的许多实例是本领域已知的,包括但不限于Tn5(参见例如de la Cruz et al.,J.Bact.175:6932-38[1993]、Tn7(参见例如Craig,Curr.Topics Microbiol.Immunol.Immunol.204:27-48[1996];和Tn10(参见例如,Morisato and Kleckner,Cell 51:101-111[1987])转座系统以及背驮转座酶系统、睡美人转座酶系统、Mos1转座酶系统、Tol2转座酶系统和Leapin转座酶系统。转座子整合到基因组中的能力已被用于创建转座子载体(参见,例如,美国专利No.5,719,055、5,968,785、5,958,775和6,027,722,所有这些都通过援引并入本文,以及由System Biosciences(PaloAlto,CA;piggybac系统),Creative Biolabs(Shirley,NY;睡美人系统)和ATUM(Nawark,CA;Leapin系统)提供的那些)。
转座涉及一系列有序的事件。(1)转座酶与存在于转座子末端的末端反向重复(IR)的序列特异性的结合;(2)在转座子的每个末端处裂解DNA的两条链;(3)通过转座酶-转座酶相互作用的末端的联合;(4)捕获靶DNA和(5)链转移以将元件插入靶标中。
转座酶是逆转录病毒整合酶超家族蛋白的成员。尽管这些蛋白质的催化结构域结构相似,但是这些蛋白质以不同的特性进行磷酰基转移反应。有些只裂解DNA的一条链,而RNase H则裂解在RNA:DNA杂化双链体中的一条RNA链。其他的产生了双链DNA断裂,并采用了各种机制。细菌转座子Tn5和Tn10的转座酶通过水解进行第一链裂解,以在元件的每一端形成3′羟基(3′OH),而第二链通过使用该3′OH作为攻击亲核试剂进行酯基转移反应被裂解。这在元件的每一端形成DNA发夹,其通过转座酶被水解以再生用于链转移所需的3′OH。真核元件Hermes(hAT家族的成员)的V(D)J重组和转座通过类似的机制进行,除了链裂解的顺序颠倒了,并且是在侧翼而不是在切除的DNA上形成发夹。另一种细菌转座子Tn7利用TnsB进行第一链裂解,并招募第二蛋白TnsA来裂解未转移的链。
因为转座子不具有感染性,所以通过本领域已知的方法(例如,电穿孔、脂质体转染或显微注射)将转座子载体引入到宿主细胞中。因此,可以调节转座子载体与宿主细胞的比率,以提供期望的感染复数以产生高拷贝数宿主细胞。适用于本发明的转座子载体通常包括在两个转座子插入序列之间插入的编码目的蛋白的核酸。一些载体还包括编码转座酶的核酸序列。在这些载体中,插入序列之一被定位在转座酶与编码目的蛋白的核酸之间,使得其在重组过程中不掺入宿主细胞的基因组中。或者,可以通过合适的方法(例如,脂质体转染或显微注射)提供转座酶。
在一些优选的实施方式中,本发明的核酸构建体包括由重组酶识别的重组酶插入元件。合适的重组酶插入元件包括但不限于附着位点(aat)、LoxP位点和MMLV LTR序列。
在一些优选的实施方式中,重组酶插入元件是attB,并且与phiC31整合酶(BioCatGmbH,Heidelberg,DE或System Biosciences,Palo Alto,CA)一起使用。phiC31整合酶是在噬菌体phiC31的基因组内被编码的序列特异性重组酶。phiC31整合酶介导在两个34个碱基对序列之间的重组,该34个碱基对序列称为附着位点(att),一个在噬菌体中发现,另一个在宿主中发现。这种丝氨酸整合酶已显示在包括哺乳动物细胞的许多不同的细胞类型中有效发挥作用。在phiC31整合酶的存在下,含有attB的供体质粒可以通过在与天然attP位点(称为伪attP位点)具有序列相似的位点处的重组单向整合到靶基因组中。phiC31整合酶可以以单拷贝整合任何大小的质粒,并且不需要辅因子。整合的转基因表达稳定并且可遗传。
还在一些其他优选的实施方式中,插入元件是与染色体诸如宿主细胞中的染色体中的靶位点同源的核酸序列,并且与重组酶或系统诸如CRISPR一起使用。合适的基于重组酶的系统包括CRE-Lox、FLP-FRT和λ重组酶系统。通常,与染色体中靶位点同源的核酸序列的长度为30至1000个碱基。
在一些优选的实施方式中,重组酶插入元件是lox序列。Cre-Lox重组是一种位点特异性重组酶技术,用于在细胞的DNA中的特定位点进行缺失、插入、易位和倒置。它允许DNA修饰靶向特定的细胞类型或由特定的外部刺激触发。它在真核和原核系统中实施。Cre-lox重组系统对于帮助神经科学家研究大脑特别有用,其中复杂的细胞类型和神经回路聚集在一起产生认知和行为。该系统由单酶,Cre重组酶组成,其重组了一对称为Lox序列的短的靶序列。这个系统可以在不插入任何额外的支持性蛋白质或序列的情况下实施。Cre酶和被称为LoxP序列的原始Lox位点来自噬菌体P1。参见,例如,Targeted integration of DNAusing mutant lox sites in embryonic stem cells.Araki,et al.Nucleic Acids Res,Feb 1997,Vol.25,Issue 4,pp.868-872;High-Resolution Labeling and FunctionalManipulation of Specific Neuron Types in Mouse Brain by Cre-Activated ViralGene Expression.Kuhlman,et al.PLos One,Apr 2008,Vol.3,e2005;When reversegenetics meets physiology:the use of site-specific recombinases inmice.Tronche,et al.FEBS Letters,Aug 2002,Vol.529,Issue 1,pp.116-121。
在一些优选的实施方式中,重组酶插入元件是FRT序列。FLP-FRT重组系统是另一种概念上与Cre-lox非常相似的定点重组技术,其中翻转酶(Flp)和短翻转酶识别靶(FRT)位点分别类似于Cre和loxP。参见,例如,Candice et al.,Cre/loxP,Flp/FRT Systems andPluripotent Stem Cell Lines(2012)Topics in Current Genetics,vol 23。FLP-FRT技术可以成为Cre-lox的有效替代品,并且也已与其一起使用,允许并行控制两个单独的重组事件。
还在一些其他优选的实施方式中,本发明的核酸构建体可以与CRISPR同源重组(HDR)系统一起使用。在这些系统中,HDR插入元件包括与基因组中靶序列同源或碱基配对的同源臂。HDR是由DNA中存在双链断裂(DSB)所启动的。CRISPR/Cas9系统优选用于通过引导RNA序列创建靶向的双链断裂,使得本发明的核酸构建体可以被插入。参见,例如,Zhangetal.,Efficient precise knockin with a double cut HDR donor after CRISPR/Cas9-mediated double-stranded DNA cleavage(2017)Genome Biol.18:35;Mali etal.,Cas9 as a versatile tool for engineering biology.Nature Methods10,957–963(2013);Mali et al.,RNA-Guided Human Genome Engineering via Cas9.Science339(6121),823-826(2013);Ran et al.,Double nicking by RNA-guided CRISPR Cas9 forenhanced genome editing specificity.Cell,155(2),479-480(2013)。如本领域所知,可以设计合适的引导RNA序列(gRNA)。在一些优选的实施方式中,用于HDR的CRISPR系统利用一个或两个引导序列。当利用一个引导RNA序列时,优选使用核酸酶诸如Cas9核酸酶,该核酸酶在引导RNA序列的引导下进行单个双链断裂。当使用两个引导序列时,优选使用切口酶,其可以是突变的Cas9核酸酶,该核酸酶在引导RNA序列之一的引导下在靶DNA中仅进行单链断裂。单链断裂优选被定位在靶DNA序列的不同链(即有义链和反义链)上的交错点处。这种安排通常会提高HDR效率。
一般来说,"CRISPR系统"是共同地指参与表达或指导CRISPR相关("Cas")基因活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式-激活CRISPR(trans-activating CRISPR))序列(例如,tracrRNA或活跃的部分tracrRNA)、tracr-伴侣序列(tracr-mate sequence)(在内源性CRISPR系统的背景下包括"同向重复"和tracrRNA加工的部分同向重复)、引导序列(在内源性CRISPR系统的背景下也被称为"间隔序列(spacer)"),或来自CRISPR基因座的其他序列和转录物。在一些实施方式中,CRISPR系统的一个或多个元件来自I型、II型或III型CRISPR系统。在一些实施方式中,CRISPR系统的一个或多个元件来自包括内源性CRISPR系统诸如化脓性链球菌(Streptococcus pyogenes)的特别生物体。一般来说,CRISPR系统的特点是促进在靶序列(在内源性CRISPR系统的背景下也被称为前间隔序列(protospacer))的位点处形成CRISPR复合物的元件。在CRISPR复合物形成的背景下,"靶序列"是指一种序列,引导序列被设计为与该序列具有互补性,其中靶序列和引导序列之间的杂交促进CRISPR复合物的形成。不一定需要完全互补,只要有足够的互补性来引起杂交并促进CRISPR复合物的形成。靶序列可以包括任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方式中,靶序列位于细胞的细胞核或细胞质中。在一些实施方式中,靶序列可以在真核细胞的一个细胞器内,例如线粒体或叶绿体。可用于重组到包括靶序列的靶向基因座中的序列或模板被称为"编辑模板"或"编辑多核苷酸"或"编辑序列"。在本发明的方面,外源性模板多核苷酸可以被称为编辑模板。在本发明的一个方面,重组是同源重组。
通常,在内源性CRISPR系统的背景下,CRISPR复合物(包括与靶序列杂交并且与一种或多种Cas蛋白络合的引导序列)的形成导致在靶序列中或靠近靶序列的一条或两条链的断裂(如在1、2、3、4、5、6、7、8、9、10、20、50或更多的碱基对之内)。在不希望受到理论约束的情况下,tracr序列,其可以包括以下或由以下组成:野生型tracr序列的全部或部分(例如野生型tracr序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸),也可以形成CRISPR复合物的一部分,诸如通过沿tracr序列的至少一部分与可操作地连接至引导序列的tracr伴侣序列的全部或部分杂交。在一些实施方式中,tracr序列与tracr伴侣序列有足够的互补性,以杂交并参与CRISPR复合物的形成。与靶序列一样,据认为不需要完全互补性,前提是有充足的功能性。在一些实施方式中,当最优比对时,tracr序列沿tracr伴侣序列的长度具有至少50%、60%、70%、80%、90%、95%或99%的序列互补性。在一些实施方式中,驱动CRISPR系统的一个或多个元件表达的一个或多个载体被引入到宿主细胞中,使得CRISPR系统的元件的表达指导在一个或多个靶位点处CRISPR复合物的形成。例如,Cas酶、与tracr伴侣序列连接的引导序列和tracr序列可以各自可操作地连接至单独载体上的单独调节元件。另外,由相同或不同的调节元件表达的两个或更多个元件,可以在单载体中组合,一个或多个其他载体提供第一载体中未包括的CRISPR系统的任何组分。组合在单载体中的CRISPR系统元件可以以任何合适的方向排列,诸如一个元件位于相对于第二元件的5′("上游")或相对于第二元件的3′("下游")。一个元件的编码序列可以位于第二元件的编码序列的相同或相反的链上,并且以相同或相反的方向定向。在一些实施方式中,单启动子驱动编码CRISPR酶的转录物以及以下中一个或多个的表达:引导序列、tracr伴侣序列(任选地可操作地连接至引导序列)和嵌入在一个或多个内含子序列中的tracr序列(例如,每个在不同的内含子中,两个或更多个在至少一个内含子中,或全部在一个内含子中)。在一些实施方式中,CRISPR酶、引导序列、tracr伴侣序列和tracr序列可操作地与同一启动子连接并从其表达。
可用于本发明的Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修改版本(modified version)。这些酶是已知的;例如,化脓性链球菌(S.pyogenes)Cas9蛋白的氨基酸序列可以在SwissProt数据库中找到,登录号为Q99ZW2。在一些实施方式中,未修饰的CRISPR酶具有DNA裂解活性,诸如Cas9。在一些实施方式中,CRISPR酶是Cas9,并且可以是来自化脓性链球菌或肺炎链球菌(S.pneumoniae)的Cas9。在一些实施方式中,CRISPR酶在靶序列的位置处指导一条或两条链的裂解,诸如在靶序列内和/或靶序列的互补物内。在一些实施方式中,CRISPR酶从靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内指导一条或两条链的裂解。在一些实施方式中,载体编码相对于相应的野生型酶是突变的CRISPR酶,使得突变的CRISPR酶缺乏裂解含有靶序列的靶多核苷酸的一条或两条链的能力。例如,来自化脓性链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)将Cas9从裂解两条链的核酸酶转化为切口酶(裂解单链)。使Cas9成为切口酶的突变的其他实例包括但不限于H840A、N854A和N863A。在本发明的方面,切口酶可用于通过同源重组进行基因组编辑。
在一些优选的实施方式中,HDR插入元件包括AAVS1安全港基因座并且与Rep 78整合酶一起使用。在特别优选的实施方式中,HDR插入元件包括与AAVS1安全港基因座碱基配对的同源臂。腺相关病毒血清型2(AAV2)Rep 78蛋白是链特异性内切核酸酶(切口酶),其促进转基因序列的位点特异性整合,所述转基因序列携带对应于AAVS1安全港基因座的同源臂。参见,例如,Ramachandra et al.,Efficient recombinase-mediated cassetteexchange at the AAVS1 locus in human embryonic stem cells using baculoviralvectors(2011)Nucleic Acids Research,39(16):e107;WO 1998027207)。
如上所述,在一些优选的实施方式中,本发明的核酸构建体包括第一和第二启动子序列。第一和第二启动子序列可以相同或不同。合适的第一和第二启动子序列包括但不限于MMLV LTR启动子、MoMuSV LTR启动子、RSV LTR启动子、SIN LTR启动子、SV40启动子、巨细胞病毒(CMV)立即早期启动子、单纯疱疹病毒(HSV)胸苷激酶启动子、α-乳清蛋白启动子、小鼠金属硫蛋白-I启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子序列,以及其组合。在一些优选的实施方式中,第一启动子序列不是逆转录病毒LTR启动子,即第一启动子是逆转录病毒LTR启动子序列以外的启动子序列。然而,当启动子是逆转录病毒启动子序列时,它可能是SIN(自失活)LTR启动子序列。例如,参见共同未决申请PCT/US2019/064423,该申请以其全文通过援引并入本文。合适的SinLTR启动子是本领域已知的并且通过去除LTR的U3区的全部或一部分来制备。
如在PCT/US2019/064423中所述,在一些优选的实施方式中,驱动选择标记的第一启动子是弱启动子。在一些优选的实施方式中,弱启动子是一种启动子,优选组成型启动子,当可操作地连接至选择标记序列时,其活性等于或小于在目的宿主(例如CHO细胞)中的SIN LTR启动子的活性。还在一些其他优选的实施方式中,弱启动子是一种启动子,优选是组成型启动子,当可操作地连接至选择标记序列时,其活性等于或小于在目的宿主(例如CHO细胞)中的人泛素C(UBC)启动子的活性。用于评估启动子强度的合适的方法是本领域已知的。参见,例如,Dandindorj et al.(2014)AComparative Analysis of ConstitutivePromoters Located in Adeno-Associated Viral Vectors,PLoS One 9(8):e106472;Zhang and Baum(2005)Evaluation of Viral and Mammalian Promoters for Use inGene Delivery to Salivary Glands Mol.Ther.12(3):528-536;Qin et al.(2010)Systematic Comparison of Constitutive Promoters and the Doxycycline-InduciblePromoter PLoS 5(5):e10611;Jeyaseelan et al.(2001)Real-time detection of genepromoter activity:quantitation of toxin gene transcription,Nucleic AcidsResearch.29(12):58e–58。在一些实施方式中,弱启动子已被改变以降低启动子活性。因此,在一些优选的实施方式中,本发明提供了用于表达目的蛋白的一种或多种载体,所述载体包括编码与第一弱启动子序列或第一启动子序列可操作的联接的选择标记的核酸序列和编码可操作地连接至第二启动子序列的目的蛋白的核酸序列,所述第一弱启动子序列或第一启动子序列已被改变成与第一启动子序列的未改变或野生型版本相比启动子活性降低。SIN LTR启动子序列是一个这样的例子。也可以将上述其他启动子序列改变以降低活性并且提供弱启动子或者弱启动子可以是天然存在的弱启动子诸如UBC启动子。
在一些优选的实施方式中,核酸构建体包括选择标记。合适的选择标记包括但不限于谷氨酰胺合成酶(GS)、二氢叶酸还原酶(DHFR)等。这些基因在美国专利第5,770,359号、第5,827,739号、第4,399,216号、第4,634,665号、第5,149,636号和第6,455,275号中描述;所有这些专利都通过引用并入本文。在一些优选的实施方式中,所利用的选择标记与缺乏由选择标记核酸序列编码的酶的产生的宿主细胞系相容。合适的宿主细胞系在下文更详细地描述。在其他实施方式中,选择标记是抗生素抗性标记,即产生蛋白质的基因,该蛋白质为表达该蛋白质的细胞提供对抗生素的抗性。合适的抗生素抗性标记包括提供对以下的抗性的基因:新霉素(新霉素抗性基因(neo))、潮霉素(潮霉素B磷酸转移酶基因)、嘌呤霉素(嘌呤霉素N-乙酰基转移酶)等。
在本发明的其他实施方式中,在希望分泌目的蛋白的情况下,核酸构建体包括与目的蛋白可操作的联接的信号肽序列。几种合适的信号肽的序列是本领域技术人员已知的,包括但不限于来源于组织纤溶酶原激活物、人生长激素、乳铁蛋白、α-酪蛋白和α-乳清蛋白的那些信号肽序列。
在本发明的其他实施方式中,核酸构建体包括3'或5'至编码目的蛋白的核酸序列的RNA输出元件(参见,例如,美国专利号5,914,267、6,136,597和5,686,120;和WO99/14310,其全部通过引用并入本文)。预期使用RNA输出元件允许目的蛋白的高水平表达,而无需将剪接信号或内含子掺入编码目的蛋白的核酸序列中。
在其他实施方式中,核酸构建体包括至少一个内部核糖体进入位点(IRES)序列。可获得几种合适的IRES的序列,包括但不限于来源于口蹄疫病毒(FDV)、脑心肌炎病毒和脊髓灰质炎病毒的那些序列。可以将IRES序列插入两个转录单元(例如编码不同的目的蛋白或多亚基蛋白诸如抗体的亚基的核酸)之间,以形成多顺反子序列,从而从同一启动子转录两个转录单元。
本发明不限于任何特定目的蛋白的表达。在一些优选的实施方式中,目的蛋白选自由以下组成的组:Fc融合蛋白、酶、白蛋白融合物、生长因子、蛋白受体、单链抗体(scFv)、单链Fc(scFv-Fc)、双特异抗体和微抗体(scFv-CH3)、Fab、单链Fab(scFab)、免疫球蛋白重链和免疫球蛋白轻链以及其他抗原结合蛋白。
在一些优选的实施方式中,将核酸构建体掺入核酸表达载体中。载体包括但不限于单链、双链或部分双链的核酸分子;包括一个或多个自由端、没有自由端(例如环形)的核酸分子;包括DNA、RNA或两者的核酸分子;以及本领域已知的其他种类的多核苷酸。载体的一种类型是"质粒",它是指环状双链DNA环,其可以被插入额外的DNA区段,诸如通过标准分子克隆技术。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于载体中,用于包装成病毒(例如逆转录病毒、复制缺陷逆转录病毒、腺病毒、复制缺陷腺病毒和腺相关病毒)。病毒载体还包括由病毒携带的多核苷酸,用于转染到宿主细胞中。某些载体能够在它们被引入的宿主细胞中进行自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞时被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导与它们可操作地连接的基因的表达。这样的载体在本文称为“表达载体”。重组DNA技术中常用的实用表达载体通常为质粒形式。
因此,合适的核酸表达载体包括但不限于上述的转座子载体,以及质粒载体、逆转录病毒载体、慢病毒载体、AAV载体、噬菌体载体等)。预期可以使用任何载体,只要它在宿主中可复制和可存活即可。在优选的实施方式中,载体是哺乳动物表达载体,除了本文描述的元件其还包括复制起点的、合适的启动子和增强子以及任何必需的核糖体结合位点、多腺苷酸化位点、剪接供体和受体位点、转录终止序列以及5'侧翼非转录序列。
可适用于掺入本发明的核酸构建体的合适的质粒载体包括用于转座子载体的特定质粒系统、FLP-FLT系统、Cre-lox系统、CRISPR-Cas9系统、重组酶(remonbinase)系统和整合酶系统,以及源自pCIneo、pVAX1、pACT、Gateway质粒、pAdvantage、pBIND、pG5luc、pTNT、pTarget、pCat3、pSI、pCMV、pSV等的质粒载体。
在一些优选的实施方式中,载体为逆转录病毒载体。最常使用的重组逆转录病毒载体来源于双嗜性莫洛尼鼠白血病病毒(MoMLV)(参见例如Miller和BaltimoreMol.Cell.Biol.6:2895[1986])。MoMLV系统具有几个优点:1)这种特定的逆转录病毒可以感染许多不同的细胞类型,2)建立的包装细胞系可用于产生重组MoMLV病毒颗粒,并且3)转移的基因永久地整合到靶细胞染色体中。建立的MoMLV载体系统包括DNA载体和包装细胞系,所述DNA载体含有逆转录病毒序列的一小部分(例如病毒长末端重复序列或“LTR”和包装或“psi”信号)。将要转移的基因插入DNA载体中。DNA载体上存在的病毒序列提供将载体RNA插入或包装到病毒颗粒中以及表达所插入基因所需的信号。包装细胞系提供颗粒组装所需的蛋白质(Markowitz etal.,J.Virol.62:1120[1988])。
在一些优选的实施方式中,逆转录病毒载体是伪型的,并且例如利用VSV的G蛋白作为膜相关蛋白。与结合特定细胞表面蛋白受体以进入细胞的逆转录病毒包膜蛋白不同,VSV G蛋白与质膜的磷脂组分相互作用(Mastromarino et al.,J.Gen.Virol.68:2359[1977])。因为VSV进入细胞并不依赖于特定蛋白质受体的存在,所以VSV具有极为广泛的宿主范围。带有VSV G蛋白的伪型逆转录病毒载体具有改变的VSV所特有的宿主范围(即,它们可以感染几乎所有种类的脊椎动物、无脊椎动物和昆虫细胞)。重要的是,VSV G伪型逆转录病毒载体可通过超速离心浓缩2000倍或更多倍,而不会显著损失感染性(Burns etal.Proc.Natl.Acad.Sci.USA90:8033[1993])。
在一些优选的实施方式中,载体为慢病毒载体。慢病毒(例如马传染性贫血病毒、山羊关节炎-脑炎病毒、人免疫缺陷病毒)是能够整合到非分裂细胞中的逆转录病毒的一个亚科。慢病毒基因组和前病毒DNA具有在所有逆转录病毒中发现的三个基因:gag、pol和env,其两侧有两个LTR序列。gag基因编码内部结构蛋白(例如基质蛋白、衣壳蛋白和核衣壳蛋白);pol基因编码逆转录酶、蛋白酶和整合酶蛋白;以及pol基因编码病毒包膜糖蛋白。5'和3'LTR控制病毒RNA的转录和聚腺苷酸化。慢病毒基因组中的另外的基因包括vif、vpr、tat、rev、vpu、nef和vpx基因。
许多种慢病毒载体和包装细胞系是本领域已知的,并且可以在本发明中使用(参见,例如,美国专利第5,994,136号和第6,013,516号,均通过引用并入本文)。此外,VSV G蛋白也已用于基于人免疫缺陷病毒(HIV)的伪型逆转录病毒载体(Naldini et al.,Science272:263[1996])。因此,VSV G蛋白可用于产生多种伪型逆转录病毒载体,并且不限于基于MoMLV的载体。慢病毒载体也可以如上所述被修饰,以含有各种调节序列(例如信号肽序列、RNA输出元件和IRES)。产生慢病毒载体后,如上文针对逆转录病毒载体所述,可将它们用于转染宿主细胞。
在一些优选的实施方式中,载体为腺相关病毒(AAV)载体。AAV基因组由含有大约4680个碱基的线性单链DNA分子构成。基因组包括在每个末端的反向末端重复序列(ITR),所述ITR顺式起到DNA复制起点和病毒的包装信号的作用。基因组的内部非重复部分包括两个大的开放阅读框,分别称为AAV rep和cap区。这些区域编码参与病毒粒子复制和包装的病毒蛋白。从AAV rep区合成至少四种病毒蛋白的家族,Rep 78、Rep 68、Rep 52和Rep 40,根据其表观分子量命名。AAV cap区编码至少三种蛋白质,VP1、VP2和VP3(对于AAV基因组的详细描述,参见例如Muzyczka,Current Topics Microbiol.Immunol.158:97-129[1992];Kotin,Human Gene Therapy 5:793-801[1994])。
AAV需要与无关的辅助病毒,诸如腺病毒、疱疹病毒或牛痘合并感染,以发生生产性感染。在没有这种合并感染的情况下,AAV通过将其基因组插入到宿主细胞染色体中来建立潜伏状态。辅助病毒随后的感染挽救了整合的拷贝,所述拷贝然后可以复制以产生感染性病毒后代。与非伪型逆转录病毒不同,AAV具有广泛的宿主范围,并且能够在任何物种的细胞中复制,只要与也会在该物种中繁殖的辅助病毒合并感染。因此,例如,人AAV将在与犬腺病毒合并感染的犬细胞中复制。此外,与逆转录病毒不同,AAV不与任何人或动物疾病相关,在整合后似乎不会改变宿主细胞的生物学特性,并且能够整合到非分裂细胞中。最近还发现,AAV能够位点特异地整合到宿主细胞基因组中。
鉴于以上描述的特性,已经开发了许多重组AAV载体用于基因传递(参见,例如,美国专利第5,173,414号;第5,139,941号;WO 92/01070和WO 93/03769,都通过引用并入本文;Lebkowski et al.,Molec.Cell.Biol.8:3988-3996[1988];Carter,Current Opinionin Biotechnology 3:533-539[1992];Muzyczka,Current Topics in Microbiol.andImmunol.158:97-129[1992];Kotin,(1994)Human Gene Therapy 5:793-801;Shellingand Smith,Gene Therapy 1:165-169[1994];以及Zhou et al.,J.Exp.Med.179:1867-1875[1994])。
可以在已用AAV辅助质粒和AAV载体转染的合适的宿主细胞中产生重组AAV病毒粒子。AAV辅助质粒通常包括AAV rep和cap编码区,但缺少AAV ITR。因此,辅助质粒既不能复制也不能自我包装。AAV载体通常包括由提供病毒复制和包装功能的AAV ITR界定的选择的目的基因。通过瞬时转染将辅助质粒和带有选择的基因的AAV载体都引入合适的宿主细胞中。然后,将转染的细胞用辅助病毒诸如腺病毒感染,所述辅助病毒可将存在于辅助质粒上的指导AAV rep和cap区的转录和翻译的AAV启动子反式激活。形成带有选择的基因的重组AAV病毒粒子,并且该重组AAV病毒粒子可以从制剂中纯化。一旦产生AAV载体,就可以将它们用于以期望的感染复数转染(参见,例如,美国专利5,843,742,通过引用并入本文)宿主细胞以产生高拷贝数宿主细胞。如本领域技术人员将理解的,AAV载体也可以如上所述被修饰以含有各种调节序列(例如,信号肽序列、RNA输出元件和IRES)。
在一些实施方式中,本发明提供了宿主细胞和宿主细胞培养物,其中宿主细胞表达来自上述核酸构建体的目的蛋白。在优选的实施方式中,宿主细胞是哺乳动物宿主细胞。许多哺乳动物宿主细胞系是本领域已知的。通常,当将这些宿主细胞置于含有适当营养物和生长因子的培养基中进行单层培养或悬浮培养时,它们能够生长和存活,如下文更详细地描述。通常,细胞能够表达大量特定的目的蛋白并将其分泌至培养基中。合适的哺乳动物宿主细胞的实例包括但不限于中国仓鼠卵巢细胞(CHO-K1、ATCC CCl-61);牛乳腺上皮细胞(ATCC CRL 10274;牛乳腺上皮细胞);由SV40转化的猴肾CV1系(COS-7,ATCC CRL 1651);人胚胎肾系(被亚克隆用于悬浮培养生长的293或293细胞;参见,例如,Graham et al.,J.GenVirol.36:59[1977]);幼仓鼠肾细胞(BHK,ATCC CCL 10);小鼠支持细胞(TM4,Mather,Biol.Reprod.23:243-251[1980]);猴肾细胞(CV1 ATCC CCL 70);非洲绿猴肾细胞(VERO-76,ATCC CRL-1587);人宫颈癌细胞(HELA,ATCC CCL 2);犬肾细胞(MDCK,ATCC CCL 34);水牛大鼠肝细胞(BRL 3A,ATCC CRL1442);人肺细胞(W138,ATCC CCL 75);人肝细胞(Hep G2,HB 8065);小鼠乳腺肿瘤(MMT 060562,ATCC CCL51);TRI细胞(Mather et al.,AnnalsN.Y.Acad.Sci.,383:44-68[1982]);MRC 5细胞;FS4细胞;大鼠成纤维细胞(208F细胞);MDBK细胞(牛肾细胞);CAP(CEVEC's Amniocyte Production)细胞;和人肝癌细胞系(HepG2)。
在一些特别优选的实施方式中,修饰宿主细胞,使得它们缺乏或天然缺乏在选择剂存在下细胞生长或存活所必需的并且由选择标记提供的酶活性。例如,中国仓鼠卵巢(CHO)细胞已被修饰为缺乏GS。在包括GS选择标记的载体的一些优选实施方式中,宿主细胞系缺乏GS。在一些特别优选的实施方式中,缺乏GS的宿主细胞系是可从Merck KGaA获得的
Figure BDA0004029364020000341
GS-/-细胞系。在其他实施方式中,在选择标记是例如DHFR的情况下,细胞系可优选缺乏DHFR活性(即,DHFR-)。合适的DHFR-细胞系包括但不限于CHO-DG44和它们的衍生物。
本发明的核酸构建体和载体可以通过任何合适的方式诸如通过转染、转化或转导引入到宿主细胞中。在一些实施方式中,在转染或转导后,使细胞增殖,然后进行胰蛋白酶消化和重新涂铺。然后选择单个集落以提供经过克隆选择的细胞系。在更进一步的实施方式中,通过DNA印迹或PCR测定筛选经过克隆选择的细胞系,以验证已经发生所需数目的整合事件。还预期克隆选择允许鉴定产生优质蛋白质的细胞系。在其他实施方式中,转染后不对细胞进行克隆选择。
在一些实施方式中,用编码不同目的蛋白的载体转染宿主细胞。编码不同目的蛋白的载体可以用于同时转染细胞(例如,使宿主细胞暴露于含有编码不同目的蛋白的载体的溶液),或者转染可以是连续的(例如,首先用编码第一目的蛋白的载体转染宿主细胞,经过一段时间,然后用编码第二目的蛋白的载体转染宿主细胞)。在一些优选的实施方式中,用编码第一目的蛋白的整合载体转染宿主细胞,选择(例如,克隆选择)含有整合载体的多个整合拷贝的高表达细胞系,并用编码第二目的蛋白的整合载体转染所选择的细胞系。可以重复这个过程以引入多种目的蛋白。在一些实施方式中,可以操纵(例如,增加或减少)感染复数以增加或减少目的蛋白的表达。同样,可以利用不同的启动子来改变目的蛋白的表达。预期这些转染方法可以用于构建含有完整外源代谢途径的宿主细胞系,或为宿主细胞提供增加的加工蛋白质的能力(例如,可为宿主细胞提供翻译后修饰所需的酶)。
在本发明的一些实施方式中,在合适的宿主株转化和宿主株在培养基中生长到适当的细胞密度之后,目的蛋白在宿主细胞培养期间分泌。在利用可扩增标记的一些优选实施方式中,预期在包含基因抑制剂的培养基中培养转导的宿主细胞。合适的抑制剂包括但不限于用于抑制DHFR的氨甲蝶呤和用于抑制GS的甲硫氨酸氨基亚砜(Msx)或草丁膦。预期随着在细胞培养系统中这些抑制剂的浓度的增加,选择具有较高拷贝数的可扩增标记(以及因此基因或目的基因)或含有更高产生插入的细胞。
因此,根据本领域已知的方法,优选培养含有如上所述载体的宿主细胞。用于哺乳动物细胞的合适培养条件在本领域中是众所周知的(参见例如,J.Immunol.Methods(1983)56:221-234[1983],Animal Cell Culture:A Practical Approach 2nd Ed.,Rickwood,D.and Hames,B.D.,eds.Oxford University Press,New York[1992])。
在适合于所培养的特定细胞的培养基中制备本发明的宿主细胞培养物。可商购的培养基诸如ActiPro培养基(HyClone)、ExCell Advanced补料分批培养基(SAFC)、Ham'sF10(Sigma,St.Louis,MO)、极限必需培养基(MEM,Sigma)、RPMI-1640(Sigma)和达尔伯克氏改良的伊格尔氏培养基(Dulbecco's Modified Eagle's Medium)(DMEM,Sigma)是示例性营养溶液。合适的培养基还描述在美国专利第4,767,704号、第4,657,866号、第4,927,762号、第5,122,469号、第4,560,655号以及WO 90/03430和WO 87/00195中;它们的公开内容通过引用并入本文。这些培养基中的任何一种可以根据需要补充血清、激素和/或其他生长因子(诸如胰岛素、转铁蛋白或表皮生长因子)、盐(诸如氯化钠、钙、镁和磷酸盐)、缓冲液(诸如HEPES)、核苷(诸如腺苷和胸苷)、抗生素(诸如庆大霉素(gentamicin))、微量元素(定义为通常以微摩尔范围的最终浓度存在的无机化合物)脂质(诸如亚油酸或其他脂肪酸)和其合适的运载体以及葡萄糖或同等的能量来源。在一些优选的实施方式中,在利用选择标记诸如GS的情况下,例如,培养基将缺乏谷氨酰胺。也可以以本领域技术人员已知的适当浓度包括任何其他必要的补充物。
本发明还考虑将许多种培养系统(例如,培养皿、96孔板、滚瓶和生物反应器)用于转染的宿主细胞。例如,可以在灌注系统中培养转染的宿主细胞。灌注培养是指通过保持在高细胞密度的培养物提供连续流动的培养基。将细胞悬浮,并且不需要固体支持物就可以继续生长。通常,必须连续提供新鲜营养物,同时去除有毒代谢物,并且理想情况下,选择性去除死细胞。过滤、截留和微胶囊化方法都适合以足够的速率更新培养环境。
作为另一实例,在一些实施方式中,可以采用补料分批培养程序。在优选的补料分批培养中,首先将哺乳动物宿主、细胞和培养基供应到培养器皿,并且在培养期间连续或以不连续的增量将另外的培养营养物供给至培养物,在终止培养之前有或没有定期的细胞和/或产物收获。补料分批培养可以包括,例如,半连续补料分批培养,其中定期去除整个培养物(包括细胞和培养基),并用新鲜培养基替换。补料分批培养不同于简单的分批培养,在简单的分批培养中,用于细胞培养的所有组分(包括细胞和所有培养营养物)都在培养过程开始时被供应到培养器皿中。补料分批培养还可以与灌注培养区别开来,不同之处在于在此过程中没有从培养器皿中去除上清液(在灌注培养中,通过,例如,过滤、囊封、锚定至微载体等将细胞限制在培养物中,并且将培养基连续或间断地引入培养器皿中并从培养器皿中去除)。在一些特别优选的实施方式中,分批培养在滚瓶中进行。
此外,可以根据可能适合于具体宿主细胞和所考虑的具体生产计划的任何方案或常规来繁殖培养物的细胞。因此,本发明考虑单步或多步培养程序。在单步培养中,将宿主细胞接种到培养环境中,并且在细胞培养的单个生产阶段期间采用本发明的方法。或者,设想多阶段培养。在多阶段培养中,细胞可以在许多个步骤或阶段中培养。例如,细胞可以在第一步或生长阶段培养中生长,其中将可能从储存库中移出的细胞接种到适合于促进生长和高生存力的培养基中。通过将新鲜培养基加入到宿主细胞培养物中,可以将细胞维持在生长阶段持续合适的时间段。
设计补料分批或连续细胞培养条件,以在细胞培养物的生长阶段增强哺乳动物细胞的生长。在生长阶段,细胞在生长最大化的条件下和时间内生长。培养条件诸如温度、pH值、溶解氧(dO2)等是用于特定宿主的培养条件,并且对普通熟练的技术人员将是显而易见的。通常,使用酸(例如,CO2)或碱(例如,Na2CO3或NaOH)将pH值调节至介于约6.5与7.5之间的水平。培养哺乳动物细胞诸如CHO细胞的合适的温度范围是约30°至38℃之间,并且合适的dO2是空气饱和度的5-90%。
在多肽产生阶段之后,使用本领域确定的技术从培养基中回收目的多肽。尽管目的蛋白也可以从宿主细胞裂解物中回收,但是优选从培养基中以分泌的多肽形式回收目的蛋白(例如,目的蛋白的分泌由信号肽序列指导)。第一步,将培养基或裂解物离心以除去颗粒状细胞碎片。此后,从污染物可溶的蛋白质和多肽中纯化多肽,以下程序是合适的纯化程序的示例:通过在免疫亲和或离子交换柱上的分级;乙醇沉淀;反相HPLC;在二氧化硅上或在阳离子交换树脂诸如DEAE上的色谱法;色谱聚焦;SDS-PAGE;硫酸铵沉淀;使用例如Sephadex G-75的凝胶过滤;以及蛋白A琼脂糖凝胶柱,以去除污染物诸如IgG。蛋白酶抑制剂诸如苯基甲基磺酰氟(PMSF)也可用于在纯化过程中抑制蛋白水解降解。另外,目的蛋白可以与允许纯化目的蛋白的标记序列框内融合。标记序列的非限制性实例包括六组氨酸标签,其可以由载体,优选pQE-9载体提供;和血凝素(HA)标签。HA标签对应于源自流感血凝素蛋白的表位(参见例如,Wilson et al.,Cell,37:767[1984])。
本领域技术人员将理解,顾及在重组细胞培养物中表达后多肽特性的变化,适合于目的多肽的纯化方法可能需要修改。
在一些优选的实施方式中,将核酸构建体掺入系统中。在一些实施方式中,所述系统包括旨在引入宿主细胞中的上述的多核酸构建体或载体。在其他优选的实施方式中,系统包括除了编码对于将核酸构建体掺入宿主细胞基因组是必需的酶的核酸或载体之外,旨在引入宿主细胞中的一种或多种如上所述的多核酸构建体或载体。示例性的酶包括但不限于,用于转座子载体系统的转座酶,用于利用整合序列的系统诸如PhiC31系统、MMLV系统等的整合酶,用于载体系统诸如Cre-loc、FLP-FRT等的重组酶,以及用于基于CRISP的系统的Cas9核酸酶。
实验
本发明提供了独特的方式,将SIN-LTR逆转录病毒表达盒与谷氨酰胺合成酶(GS)敲除的CHO细胞系系统结合起来,利用随机整合改善细胞系开发方法,获得更高的基因拷贝数和每个拷贝更高的生产率。它进一步提供了用于更严格的池选择的改进的和意想不到的方法,以进一步提高滴度并富集用于高产克隆的池。它还提供了一种快速有效的方法,通过将表达盒(转基因)靶向整合到整个CHO基因组的预定位点(dock)来开发高产细胞系。
实施例1:
从五个独立质粒的瞬时转染产生了三个合并的细胞系(图1),所有的被设计以表达测试蛋白"Anyway"。这些质粒是通过它们利用以驱动GS表达的启动子来指代。第一质粒SV40代表了传统的细胞系开发方法-含有由强SV40启动子驱动的选择标记基因(GS)并且还含有SV40内含子和多聚A信号的质粒。第二质粒WT-LTR利用前病毒野生型LTR来驱动在类似于GPEx载体插入态样的环境下建立的GS表达的表达。虽然认为这是相对的强启动子,但是来自该启动子的转录物不会在GS之后终止,而是继续穿过sCMV、Anyway和WPRE,利用TK多聚A序列。第三质粒SIN-LTR与第二构建体相同,只是它包含截断版本的LTR,SIN-LTR(自我失活-LTR),其具有较低的启动子活性。第四质粒pSIN与第一质粒相同,只是它不是驱动GS表达的强启动子,而是利用来自SIN-LTR的更弱的启动子元件。第五质粒表达GFP,但不包含GS基因,并且因此充当阴性对照。
通过这些质粒的转染产生的池被用于在谷氨酰胺的缺失下进行生存的选择。选择的池进行了通用的补料分批生产,以测量它们产生Anyway蛋白的能力。
CHOZN细胞系开发
CHOZn细胞的转染:通过使用Expifectamine CHO用指定的质粒转染细胞,制备含有随机整合了每种质粒的合并的细胞系。将20ug的质粒加入至1ml的OptiPro培养基中。将80ul的Expifectamine CHO加入至920ul的OptiPro中。将这两种溶液混合1分钟,然后加入至3ml的含有3000万个CHOZn细胞的CHO-Gro培养基中。将细胞在37度下温育过夜,以250RPM摇动。第二天早上加入15ml的补充有6mM谷氨酰胺的Excell CD Fusion培养基。将细胞在培养基中传代,直到它们从转染中恢复。
CHOZn细胞的选择:一旦细胞达到>96%的生存力,就通过全培养基替换将它们传代至补充有2% ClonaCell-CHO ACF但不含谷氨酰胺的Ex-Cell CD Fusion培养基中。定期监测细胞的生存力和活细胞密度。每周更换培养基,直到培养的细胞达到100万个细胞/ml,并按常规进行传代。
补料分批生产:在补料分批生产之前,将每个池适应ActiPro培养基至少三代。对于补料分批生产,将ActiPro培养基(HyClone)中以600,000个细胞/ml接种50ml自旋管,并且将管在5% CO2和37℃的温度(从第5天开始为34℃)下的加湿的(70-80%)振荡培养箱中以250rpm温育。在生产运行过程中,使用两种不同的补料补充剂对培养物补料六次。每天监测葡萄糖,如果水平降到低于5g/L,就补充葡萄糖。当生存力≤70%时终止培养。
结果
如图2所示,SV40、WT-LTR和SIN-LTR池显示显著不同的选择恢复曲线。SV40池显示最快的恢复(>90%生存力),表明未选择的池中相对大比例的细胞对选择具有抗性。WT-LTR池恢复较慢,表明未选择的池的较小部分具有抗性。SIN-LTR池显示出明显的延迟恢复,表明未选择的池中很小的一部分具有抗性。
如图3所示,与WT-LTR和SV40池相比,SIN-LTR池的滴度显著更高。相比之下,基因拷贝数显示出类似的趋势。这些数据表明,SIN-LTR质粒选择更高的拷贝数和更高活性的插入位点。
令人惊讶的是,在图4中所示的单独实验中,pSIN池的恢复时间与SV40或WT-LTR池的相似。因此,单独启动子活性并不能解释在恢复时间上的差异,因为pSIN具有非常弱的启动子,但仍然恢复得很快。SIN-LTR质粒中的其他元件必定对更强的选择压力起作用。虽然不限于任何特定的作用机制,但是可以预期弱启动子和长转录物(其还包含第二个开放阅读框)的组合可能影响GS的转录或翻译效率。同样,在不局限于任何特定机制的情况下,在EPR中已知的弱Kozak序列的存在可能会导致异常的翻译,降低GS蛋白的翻译效率。
实施例2:
GPEx Boost概念也可以与其他非病毒基因插入技术诸如转座酶、重组酶、整合酶或CRISPR基因插入组合使用。GPEx技术可以用于将非病毒插入技术的识别序列的许多拷贝放置在整个基因组的高活性位点。然后,可以用表达转座酶、重组酶、整合酶或Cas9的质粒与包含同源识别序列、GS选择标记和待表达基因产物的转基因质粒组合对所得的“Dock”细胞系进行瞬时共转染。转座酶、重组酶、整合酶或Cas9将介导部分或全部的转基因质粒插入Dock位点。产生的细胞系将具有插入整个基因组中高活性dock位点的转基因质粒的多个拷贝。可以使用的技术/酶的一些实例包括背驮转座酶、睡美人转座酶、Mos1转座酶、Tol2转座酶、Leapin转座酶、λ重组酶、FLP/FRT、Cre/Lox、MMLV整合酶、Rep 78整合酶、Bxb1整合酶和各种类型的CRISPR。我们首先使用PhiC31整合酶系统结合GPEx技术测试了这一概念。
逆转录载体产生和转导以创建Dock亲本细胞系:将Dock构建体(图7和8)引入HEK293细胞系中,所述细胞系组成性地产生MLV gag、pro和pol蛋白。还将含有表达质粒的包膜与每个基因构建体一起共转染。共转染引起无复制能力的高滴度逆转录载体的产生,所述载体通过超速离心浓缩并用于CHOZN中国仓鼠卵巢亲本细胞系的细胞转导(1,2)。进行5轮连续转导,并且将细胞常规维持在补充有6mM谷氨酰胺的培养基。还使用相同的方法成功产生了第二合并的dock细胞系。这是使用在图9和图10中所示的略有不同的dock基因构建体。
Dock合并的细胞系的转染和选择:将150万个细胞与含有1ug(总)的质粒转基因和整合酶DNA(分别为图11、12、5和6)和4微升的ExpiFectamine CHOTM(ThermoFisherScientific)的预复合混合物一起温育,最终体积250微升。允许合并的细胞系在补充有6mM谷氨酰胺的培养基存在下恢复,直到生存力恢复到大于95%。然后将细胞转移到缺乏谷氨酰胺的培养基中。监测生存力并每周更换培养基,直到所得选择的细胞池恢复到大于95%的生存力。
重组的定量:使用Qiagen DNEasy试剂盒分离来自300万个细胞的基因组DNA。AttR是在attP和attB之间重组的结果。使用sybr-green染料的定量聚合酶链反应(QPCR)使用dock中的attP序列中的正向引物和转基因质粒中的attB序列中的反向引物来进行以定量细胞中的attR。当转基因质粒重组至dock中并且不是自由、随机整合或不是伪attP整合的转基因质粒时,使用这个引物对的扩增将只检测转基因质粒。同样,这个引物对也不检测未重组的(空)dock序列。针对这个引物组以及内部CHO参考基因的引物组,确定跨越荧光强度阈值所需的PCR循环数(Ct值)。基因拷贝指数(GCI)是通过从attR引物组的Ct值中减去参考基因的Ct值来计算的。请注意,GCI值本质是对数的,而不是线性的,因此,在尺度的低端,例如从GCI=1到GCI=3,1个单位的变化只代表几个拷贝的差异,而在尺度的高端,例如从GCI=6到GCI=7,一个单位的变化可以代表无数个拷贝的差异。在某些情况下,含有所需扩增子和已知浓度的质粒也进行QPCR,并且对该数据进行线性回归分析以更精确地确定存在的拷贝数。
结果
使用GPEx技术进行了5轮连续的转导,含有PhiC31 attP识别序列的Dock(图7+8)被放置在CHOZN细胞的整个基因组中,得到的细胞池平均含有大约36个Dock拷贝/细胞。Dock细胞池用转基因-启动子-Anyway和整合酶质粒(分别为图11、12、5和6)以1:50至1:1范围的比率共转染,如已发表文献所建议的(Groth,2000:Andreas,2002:Farruggio,2012)。这种转基因-启动子-Anyway质粒含有PhiC31 attB识别序列、由弱的前病毒-SIN-LTR(自激活长末端重复)启动子驱动的谷氨酰胺合成酶(GS)基因、以及由强启动子驱动的Fc融合蛋白测试产物Anyway。转染后3天但在选择之前,进行QPCR以定量重组,但attR(在attP和attB之间重组的上游产物)水平在背景以上未检测到,基因拷贝指数(GCI)大约为-10。当转染的细胞通过撤回谷氨酰胺进行选择时,它们在超过25天后没有恢复,表明它们没有达到足够的整合和GS表达水平。
为了提高重组频率,我们推断整合酶与转基因质粒比率可能是高效重组的关键参数。为了探索这种可能性,我们用一系列比率的转基因-启动子-Anyway和整合酶质粒共转染Dock细胞池。在转染3天后但在选择之前,进行QPCR以定量重组,图29。文献中常用的含有低转基因:整合酶比率(1:20-100)的比率具有接近-10的背景水平的attR GCI。令人惊讶的是,我们发现高转基因:整合酶比率(5-100:1)具有-3的attR GCI,拷贝数比最低比率高大约200倍。
然后,我们通过撤回谷氨酰胺对预选attR GCI最高的样品进行选择,图30。这些池在选择的第9天开始恢复。完全恢复后,我们进行了QPCR,图31,发现这些池含有多达大约28个拷贝的转基因/细胞。这些数据表明,通过使用更高的转基因:整合酶比率,我们能够在一个平均包含大约36个dock的池中实现平均多达28个转基因/细胞的有效整合。此外,这种重组比使用文献中描述的较低比率看到的重组水平高出大约2个数量级。
实施例3:
在观察到在含有约36个拷贝/细胞的Dock池中大约80%填充后,我们接下来试图确定我们是否可以使用含有超过36个dock的Dock池进一步增加整合的转基因质粒的数量。我们还试图确定是否缺乏GS启动子的转基因质粒也可以用于该系统。这种质粒如果重新组合到Dock中,而不是随机整合或整合到伪attP位点中,则只会表达GS,从而有助于抗性。
逆转录载体产生和转导以创建Dock亲本细胞系:将Dock构建体(图7和8)引入HEK293细胞系中,该细胞系组成性地产生MLV gag、pro和pol蛋白。还将含有表达质粒的包膜与每个基因构建体一起共转染。共转染引起无复制能力的高滴度逆转录载体的产生,所述载体通过超速离心浓缩并用于CHOZN中国仓鼠卵巢亲本细胞系的细胞转导(1,2)。进行9轮连续转导,并且将细胞常规维持在补充有6mM谷氨酰胺的培养基中。
Dock合并的细胞系的转染和选择:将300万个细胞与含有2ug(总共)的质粒转基因和整合酶质粒DNA以及8微升的ExpiFectamine CHOTM(ThermoFisher Scientific)的预络合混合物在500微升的最终体积中一起温育。允许合并的细胞系在补充有6mM谷氨酰胺的培养基存在下恢复,直到生存力恢复到大于95%。然后将细胞转移到缺乏谷氨酰胺的培养基中。监测生存力并每周更换培养基,并且将细胞传代培养,直到所得选择的细胞池恢复到大于95%的生存力。
重组的定量:使用Qiagen DNEasy试剂盒分离来自300万个细胞的基因组DNA。AttR是在attP和attB之间重组的结果。使用sybr-green染料的定量聚合酶链反应(QPCR)使用dock中attP序列中的正向引物和转基因中attB序列中的反向引物来进行以定量细胞中的attR。当转基因质粒重组至dock中并且不是自由、随机整合或不是伪attP整合的转基因质粒时,使用这个引物对的扩增将只检测转基因质粒。同样,这个引物对也不检测未重组的(空)dock序列。针对这个引物组以及内部CHO参考基因的引物组,确定跨越荧光强度阈值所需的PCR循环数(Ct值)。基因拷贝指数(GCI)是通过从attR引物组的Ct值中减去参考基因的Ct值来计算的。请注意,GCI值本质是对数的,而不是线性的,因此,在尺度的低端,例如从GCI=1到GCI=3,1个单位的变化只代表几个拷贝的差异,而在尺度的高端,例如从GCI=6到GCI=7,一个单位的变化可以代表无数个拷贝的差异。在某些情况下,含有所需扩增子和已知浓度的质粒也进行QPCR,并且对该数据进行线性回归分析以更精确地确定存在的拷贝数。
结果
使用GPEx技术进行了9轮连续的转导,含有PhiC31 attP识别序列的Dock被放置在CHOZN细胞的整个基因组中,得到的细胞池具有6.7的EPR GCI以及平均含有大约135个Dock拷贝/细胞。用转基因-Anyway和整合酶质粒(分别为图13、14、5和6)以50:1至400:1范围的比率共转染该Dock细胞池,然后通过撤回谷氨酰胺进行选择。最低点(最小)生存力,图32,高于包含大约36个拷贝/细胞的Dock系。AttR GCI(图33)也高于大约36个拷贝Dock细胞系,并且随着转基因:整合酶比率的提高而增加,这表明在更高的转基因:整合酶比率和更高的Dock数量下,整合的转基因数量可能会进一步改善。此外,我们还使用转基因-Anyway质粒证明了来自选择的强大的恢复(图13和14),该质粒缺乏GS的启动子,因此必须依赖Dock中弱的SIN-LTR启动子。
实施例4:
已使用更多的Dock位点和更高的转基因:整合酶比率改善了整合的转基因数量,我们接下来试图确定我们是否可以通过从135个拷贝Dock池中分离出更高的Dock拷贝数克隆并且通过测试甚至更高的转基因:整合酶质粒比率来进一步增加整合的转基因质粒的数量。我们还试图确定是否也可以用这个系统插入更大的质粒尺寸。
Dock亲本细胞系的克隆:使用Beacon仪器的Berkeley Light克隆由9轮连续转导制成的Dock细胞池。通过QPCR对克隆进行扩增、筛选,并选择具有最多dock插入数量的克隆。
Dock合并的细胞系的转染和选择:将300万个细胞与含有2ug(总共)的质粒转基因和整合酶DNA以及8微升的ExpiFectamine CHOTM(ThermoFisher Scientific)的预络合混合物在500微升的最终体积中一起温育。允许合并的细胞系在补充有6mM谷氨酰胺的培养基存在下恢复,直到生存力恢复到大于95%。然后将细胞转移到缺乏谷氨酰胺的培养基中。监测生存力并每周更换培养基,直到所得选择的细胞池恢复到大于95%的生存力。
重组的定量:使用Qiagen DNEasy试剂盒分离来自300万个细胞的基因组DNA。AttR是在attP和attB之间重组的结果。使用sybr-green染料的定量聚合酶链反应(QPCR)使用dock中attP序列中的正向引物和转基因中attB序列中的反向引物来进行以定量细胞中的attR。当转基因质粒重组至dock中并且不是自由、随机整合或不是伪attP整合的转基因质粒时,使用这个引物对的扩增将只检测转基因质粒。同样,这个引物对也不检测未重组的(空)dock序列。针对这个引物组以及内部CHO参考基因的引物组,确定跨越荧光强度阈值所需的PCR循环数(Ct值)。使用对Dock的EPR部分特异的引物(图5和6)基于EPR GCI对克隆进行排序。基因拷贝指数值通过从attR引物组的Ct值中减去参考基因的Ct值来计算。请注意,GCI值本质是对数的,而不是线性的,因此,在尺度的低端,例如从GCI=1到GCI=3,1个单位的变化只代表几个拷贝的差异,而在尺度的高端,例如从GCI=6到GCI=7,一个单位的变化可以代表无数个拷贝的差异。在某些情况下,含有所需扩增子和已知浓度的质粒也进行QPCR,并且对该数据进行线性回归分析以更精确地确定存在的拷贝数。
补料分批生产:对于补料分批生产,将20ml的Ex-Cell Advanced CHO Fed-BatchTM培养基(MilliporeSigma)中以600,000个细胞/ml接种50ml离心管,并且将管在5% CO2和37℃的温度(从第4天开始为34℃)下的加湿的(70-80%)振荡培养箱中以250rpm温育。从第2天开始,每隔一天用6.25%(V:V)的含有66% Ex-cell Advanced CHO Feed 1TM和33%Cellvento4Feed(MilliporeSigma)的补料共混物补料培养物。每天监测葡萄糖,如果水平降到低于5g/L,就补充葡萄糖。当生存力≤70%时或在第20天末终止培养。
结果
为了分离高Dock拷贝数克隆,使用
Figure BDA0004029364020000451
仪器的Berkely Light对经过9轮转导制成的Dock细胞池进行单细胞克隆。将克隆分离、扩增,并使用对于Dock的EPR区域特异的引物进行QPCR。克隆1F7含有大约181个拷贝的Dock质粒/细胞,并且被选择用于进一步的实验。将Dock克隆1F7与表达抗体轻链和抗体重链的转基因-Yourway-LWHW质粒以及整合酶质粒,图27+28和5+6,用50:1至8,000:1范围的比率进行共转染。通过撤回谷氨酰胺对所得池进行选择,图34。比率为4000:1和8000:1的池在没有通过选择。对存活池的attR的QPCR分析(图35)表明,上至至少9.8千碱基的较大质粒可以用该技术有效地整合,并且该大小的最佳转基因:整合酶质粒比质粒为500:1。
实施例5:
在观察到1F7 Dock克隆中相对高的整合效率后,我们接下来试图确定是否来自具有高水平的整合的转基因的池的克隆可以包含甚至更高水平的转基因整合,并确定这些克隆的生产能力。
Dock合并的细胞系的转染和选择:将300万个细胞与含有2ug(总共)的质粒转基因和整合酶DNA(分别为图13、14、5和6)和8微升的ExpiFectamine CHOTM(ThermoFisherScientific)的预络合混合物在500微升的最终体积中一起温育。允许合并的细胞系在补充有6mM谷氨酰胺的培养基存在下恢复,直到生存力恢复到大于95%。然后将细胞转移到缺乏谷氨酰胺的培养基中。监测生存力并每周更换培养基,直到所得选择的细胞池恢复到大于95%的生存力。
具有整合的转基因的池的克隆:使用Beacon仪器的Berkeley Lights克隆具有整合的转基因的池。使用
Figure BDA0004029364020000461
测定来测量该克隆的相对生产率。将具有最高生产率的克隆从机器输出并扩增。
重组的定量:使用Qiagen DNEasy试剂盒分离来自300万个细胞的基因组DNA。AttR是在attP和attB之间重组的结果。使用sybr-green染料的定量聚合酶链反应(QPCR)使用dock中attP序列中的正向引物和转基因中attB序列中的反向引物来进行以定量细胞中的attR。当转基因质粒重组至dock中并且不是自由、随机整合或不是伪attP整合的转基因质粒时,使用这个引物对的扩增将只检测转基因质粒。同样,这个引物对也不检测未重组的(空)dock序列。针对这个引物组以及内部CHO参考基因的引物组,确定跨越荧光强度阈值所需的PCR循环数(Ct值)。只存在于未整合的Dock中的对attP特异的引物被用来估计填充docs的部分。基因拷贝指数值通过从attR引物组的Ct值中减去参考基因的Ct值来计算。请注意,GCI值本质是对数的,而不是线性的,因此,在尺度的低端,例如从GCI=1到GCI=3,1个单位的变化只代表几个拷贝的差异,而在尺度的高端,例如从GCI=6到GCI=7,一个单位的变化可以代表无数个拷贝的差异。在某些情况下,含有所需扩增子和已知浓度的质粒也进行QPCR,并且对该数据进行线性回归分析以更精确地确定存在的拷贝数。
结果
将Dock克隆1F7用转基因-Anyway和整合酶质粒共转染(分别为图13、14、5和6),并通过谷氨酰胺撤回对所得池进行选择。选择的池的attR GCI为6.9。使用Beacon仪器的Berkeley Light对该池进行单细胞克隆。使用
Figure BDA0004029364020000471
Assay,基于相对的Anyway表达对克隆进行排序和输出。扩增了27个克隆,并且这些克隆中的AttR GCI(图36)范围为5.2至7.5。还测量了这些克隆的AttP GCI(其测量空Dock),允许我们估计在每个克隆中填充的Dock的部分,图36。这些克隆中的平均填充百分比为65%。这代表了大约118个拷贝的整合的转基因质粒。克隆1B7的attR GCI为7.5,其与亲代Dock克隆1F7的attP(空Dock)GCI相当。令人惊讶的是,我们使用两种不同的引物对未能在该克隆中检测到attP。这些数据表明,令人惊讶的是,仅一次转染之后,我们就能够获得所有大约181个dock位点都填充了转基因的克隆。
为了确定它们的蛋白质生产能力,对所有这些克隆进行了通用的补料分批生产率分析,最终滴度也显示在图36中。高attR GCI水平与高的最终滴度相关,图37,表明,如所预期的,渐增量的转基因靶向整合到高活性的dock位点中导致细胞系的蛋白质生产能力增加。这些数据还表明,即使整合了大约181个拷贝,我们还没有使这些细胞的生产能力饱和。
实施例6:
在观察到1F7 Dock克隆中融合蛋白的相对高的整合效率和表达之后,我们接下来试图确定我们是否也可以使用这个系统在同一个转基因质粒上整合和表达具有重链和轻链的单克隆抗体。
Dock合并的细胞系的转染和选择:将300万个细胞与含有2ug(总共)的质粒转基因和整合酶DNA以及8微升的ExpiFectamine CHOTM(ThermoFisher Scientific)的预络合混合物在500微升的最终体积中一起温育。允许合并的细胞系在补充有6mM谷氨酰胺的培养基存在下恢复,直到生存力恢复到大于95%。然后将细胞转移到缺乏谷氨酰胺的培养基中。监测生存力并每周更换培养基,直到所得选择的细胞池恢复到大于95%的生存力。
重组的定量:使用Qiagen DNEasy试剂盒分离来自300万个细胞的基因组DNA。AttR和attL是在attP和attB之间重组的结果。使用sybr-green染料的定量聚合酶链反应(QPCR)使用dock中attP序列中的正向引物和转基因中attB序列中的反向引物来进行以定量细胞中的attR。当转基因质粒重组至dock中并且不是自由、随机整合或不是伪attP整合的转基因质粒时,使用这个引物对的扩增将只检测转基因质粒。同样,这个引物对也不检测未重组的(空)dock序列。针对这个引物组以及内部CHO参考基因的引物组,确定跨越荧光强度阈值所需的PCR循环数(Ct值)。只存在于未整合的Dock中的对attP特异的引物被用来估计填充docs的部分。基因拷贝指数值通过从attR引物组的Ct值中减去参考基因的Ct值来计算。请注意,GCI值本质是对数的,而不是线性的,因此,在尺度的低端,例如从GCI=1到GCI=3,1个单位的变化只代表几个拷贝的差异,而在尺度的高端,例如从GCI=6到GCI=7,一个单位的变化可以代表无数个拷贝的差异。在某些情况下,含有所需扩增子和已知浓度的质粒也进行QPCR,并且对该数据进行线性回归分析以更精确地确定存在的拷贝数。
补料分批生产:将20ml的Ex-Cell Advanced CHO Fed-BatchTM培养基(MilliporeSigma)中以600,000个细胞/ml接种50ml离心管,并且将管在5%CO2和37℃的温度(从第4天开始为34℃)下的加湿的(70-80%)振荡培养箱中以250rpm温育。从第2天开始,每隔一天用6.25%(V:V)的含有66%Ex-cell Advanced CHO Feed 1TM和33% Cellvento4Feed(MilliporeSigma)的补料共混物补料培养物。每天监测葡萄糖,如果水平降到低于5g/L,就补充葡萄糖。当生存力≤70%时或在第20天末终止培养。
蛋白质凝胶电泳。收获并澄清来自补料分批生产的上清液(见上文)。将3ug的每种抗体或Fc融合蛋白与LDS加样缓冲液混合,添加或不添加变性剂。在电泳之前,也将变性的样品加热到70度保持10分钟。将所有样品加载到NuPAGE Novex 4-12% Bis-Tris凝胶(Invitrogen)上,并在1X MES缓冲液中在60V下电泳15分钟,然后在100V下电泳105分钟。然后将凝胶用去离子水冲洗,并且用SYPRO-Ruby染色。将染色的凝胶成像,并且在图40中可以发现染色的凝胶的"负"像(颜色反转)。
结果
众所周知,单克隆抗体的表达和纯化都对所表达的轻链和重链的相对量敏感。我们的设计为以1:1的基因比率整合轻链和重链。为了优化每条链的相对表达,我们设计并测试了四种不同的表达构建体,其含有不同的基因顺序和增强子元件(参见图21、22、23、24、25、26、27和28)。所有测试的构建体均不含有GS启动子,并且含有强启动子以及重链基因和轻链基因的多聚A序列。在第一构建体中,称为HWIL(以突出构建体之间的差异),重链编码序列(H)从上游启动子表达,然后是土拨鼠转录后调节元件(W或WPRE)。轻链编码序列(L)从下游启动子表达,并且前面是内含子序列(I)。其余三个表达构建体遵循相同的命名法。将包含大约181个拷贝的Dock的Dock克隆1F7用所有四种转基因-Yourway质粒或转基因-Anyway质粒(单独地)和整合酶质粒(图5+6、21+22、23+24、25+26、27+28、13+14)共转染,并将所得池通过谷氨酰胺撤回进行选择,图38。有趣的是,用LWIH质粒转染的池从选择中恢复的速度比其他质粒慢。对所得池的QPCR分析(图38)表明,尽管这些质粒的尺寸较大,但是实现了高水平的转基因整合-与先前的实例相似。还进行了补料批次生产率以确定这些池的蛋白质生产能力,图39。四种表达质粒中有三种表现出稳定的表达,HWIL和LWHW提供最高的滴度。对所得蛋白质进行非还原和还原SDS-PAGE分析(图40),以评估重链和轻链的相对表达以及成熟抗体的组装。相对于游离轻链和重链,所有四种表达质粒均显示出在150kDa处高比例的成熟抗体形成。所有四种抗体表达质粒的轻链表达也略有过量,这对于蛋白A纯化是理想的,以最小化游离重链的纯化。类似地,单链融合蛋白Anyway的表达,既显示出高的滴度(图39),又显示出预测大小的成熟的、二聚化蛋白的高比例。
实施例7:
接下来,我们想确定使用该技术生成的池的生产稳定性,因为这是制造的必要属性。
逆转录载体产生和转导以创建Dock亲本细胞系:将Dock构建体(图7和8)引入HEK293细胞系中,所述细胞系组成性地产生MLV gag、pro和pol蛋白。还将含有表达质粒的包膜与每个基因构建体一起共转染。共转染引起无复制能力的高滴度逆转录载体的产生,所述载体通过超速离心浓缩并用于CHOZN中国仓鼠卵巢亲本细胞系的细胞转导(1,2)。进行5轮连续转导,并且将细胞常规维持在补充有6mM谷氨酰胺的培养基。
Dock合并的细胞系的转染和选择:将300万个细胞与含有2ug(总共)的质粒转基因和整合酶DNA以及8微升的ExpiFectamine CHOTM(ThermoFisher Scientific)的预络合混合物在500微升的最终体积中一起温育。允许合并的细胞系在补充有6mM谷氨酰胺的培养基存在下恢复,直到生存力恢复到大于95%。然后将细胞转移到缺乏谷氨酰胺的培养基中。监测生存力并每周更换培养基,直到所得选择的细胞池恢复到大于95%的生存力。
补料分批生产-Ex-cell:将20ml的Ex-Cell Advanced CHO Fed-BatchTM培养基(MilliporeSigma)中以600,000个细胞/ml接种50ml离心管,并且将管在5% CO2和37℃的温度(从第4天开始为34℃)下的加湿的(70-80%)振荡培养箱中以250rpm温育。从第2天开始,每隔一天用6.25%(V:V)的含有66% Ex-cell Advanced CHO Feed 1TM和33%Cellvento4Feed(MilliporeSigma)的补料共混物补料培养物。每天监测葡萄糖,如果水平降到低于5g/L,就补充葡萄糖。当生存力≤70%时或在第20天末终止培养。
补料分批生产-ActiPro:将20ml的Hyclone ActiProTM培养基(Activa LifeSciences)中以600,000个细胞/ml接种50ml离心管,并且将管在5% CO2和37℃的温度(从第4天开始为34℃)下的加湿的(70-80%)振荡培养箱中以250rpm温育。从第2天开始,每隔一天用3%(V:V)Hyclone Cell Boost 7A和.3% Hyclone Cell Boost 7b(Activa LifeSciences)补料培养物。每天监测葡萄糖,如果水平降到低于5g/L,就补充葡萄糖。当生存力≤70%时或在第20天末终止培养。
结果
为了确定表达Anyway融合蛋白的池的生产稳定性,将9轮转导制成的Dock细胞池用转基因-Anyway和整合酶质粒共转染,图13+14和5+6。所得池通过谷氨酰胺撤回来选择。三个池连续传代,并且每周冷冻等分试样持续超过40代。一旦所有池达到40代,就解冻先前冷冻的代的小瓶,并使用两种不同的培养基/补料策略进行补料分批生产率。来自补料分批生产率的最终滴度(图41)显示,即使在连续培养超过40代后,蛋白质滴度在所有三个池中仍保持稳定,这表明整合的转基因质粒的强大遗传稳定性以及从整合的转基因质粒的稳定表达,两者都是该技术在药物物质制造中应用的关键属性。
以上说明书中提到的所有出版物和专利以引用方式并入本文。本发明所描述的方法和系统的各种修改和变化对于本领域技术人员将是明显的,不背离本发明的范围和精神。虽然已结合特定优选实施方式描述了本发明,但是应当理解的是,要求保护的发明不应被不适当地局限于此类特定实施方式。实际上,对于本发明领域的技术人员来说明显的用于实施本发明的所述方式的各种修改旨在在以下权利要求书的范围内。
序列表
<110> 康泰伦特药物解决方案有限责任公司(Catalent Pharma Solutions, LLC)
<120> 用于蛋白质制造的核酸构建体
<130> PPI22172362US
<150> US 63/033,514
<151> 2020-06-02
<150> US 63/033,516
<151> 2020-06-02
<160> 12
<170> PatentIn version 3.5
<210> 1
<211> 7516
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 1
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660
cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720
agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780
agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840
gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900
ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960
cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020
aggtgtccac tcccagttca attacagctc ttaaaaattg gatctccatt cgccattcag 1080
gctgcgcaac tgctgggaag gacgatcaga gcgggcctct tcgctattac gccagctggc 1140
gaaagggacg tggcaagcaa ggcgattaag ttgagttacg ccaggatttt cccagtcacg 1200
acgttgtaaa acgacggcca gagaattata atacgactca ctatagggcg aattcggatc 1260
cgccgccacc atggtgacct acgccggagc ctacgacaga cagagccggg agagagagaa 1320
cagcagcgcc gccagccccg ccacccagag aagcgccaac gaggccaagg ccgccgccct 1380
gcagagagag atcgagaggg ccggcggcag attcagattt gtgggccact tcagcgaggc 1440
ccctggcacc agcgccttcg gcaccgccga gagacccgag ttcgagagaa tcctgaacga 1500
gtgtagggcc ggcaggctga acatgatcat cgtgtacgac gtgtcccggt tcagcaggct 1560
gaaggtgatg gacgccatcc ctatcgtgtc cgagctgctg gccctgggcg tgaccatcgt 1620
gtccacccag gaaggcgtct ttagacaggg caacgtgatg gacctgatcc acctgatcat 1680
gaggctggac gccagccaca aggagagcag cctgaagagc gccaagatcc tggacaccaa 1740
gaacctgcag agggagctgg gcggctatgt gggcggcaag gccccctacg gcttcgagct 1800
ggtgtccgag accaaggaga tcacccggaa cggcaggatg gtgaacgtgg tgatcaacaa 1860
gctggcccac agcaccaccc ccctgaccgg ccccttcgag tttgagcccg acgtgatcag 1920
gtggtggtgg cgggagatca agacccacaa gcacctgcct ttcaagcccg gcagccaggc 1980
cgccatccac cccggcagca tcaccggcct gtgtaagaga atggacgccg acgccgtgcc 2040
caccagaggc gagaccatcg gcaagaaaac cgccagcagc gcctgggacc ccgccaccgt 2100
gatgagaatc ctgagggacc ctaggatcgc cggcttcgcc gccgaggtga tctacaagaa 2160
gaagcccgac ggcaccccca ccaccaagat cgagggctac agaatccaga gagaccccat 2220
caccctgaga cctgtggagc tggactgtgg ccctatcatc gagcctgccg agtggtacga 2280
gctgcaggcc tggctggacg gcagaggcag aggcaagggc ctgagcagag gccaggccat 2340
cctgagcgcc atggacaagc tgtactgtga gtgtggcgcc gtgatgacca gcaagagagg 2400
cgaggagagc atcaaggaca gctaccggtg ccggagaaga aaggtggtgg accccagcgc 2460
ccctggccag cacgagggca cctgtaatgt gagcatggcc gccctggaca agttcgtggc 2520
cgagcggatc ttcaacaaga tccggcacgc cgagggcgac gaggagaccc tggccctgct 2580
gtgggaggcc gccagaagat tcggcaagct gaccgaggcc cccgagaaga gcggcgagag 2640
ggccaacctg gtggccgaga gagccgacgc cctgaacgcc ctggaggagc tgtacgagga 2700
cagagccgcc ggagcctatg acggccctgt gggcaggaag cacttcagaa agcagcaggc 2760
cgccctgacc ctgagacagc agggcgccga ggaaagactg gccgagctgg aggccgccga 2820
ggcccctaag ctgcccctgg atcagtggtt ccccgaggat gccgacgccg accccaccgg 2880
ccccaagtcc tggtggggca gagccagcgt ggacgacaag agggtgttcg tgggcctgtt 2940
cgtggataag atcgtggtga ccaagagcac caccggcagg ggccagggca cccccatcga 3000
gaagagagcc agcatcacct gggccaagcc tcccaccgac gacgacgagg atgacgccca 3060
ggacggcacc gaggacgtgg ccgcccctaa gaaaaagcgg aaagtgtgac tcgagacgcg 3120
tgatatcttt cccgggggta ccgtcgactg cggccgcgaa ttccaagctt gagtattcta 3180
tcgtgtcacc taaataactt ggcgtaatca tggtcatatc tgtttcctgt gtgaaattgt 3240
tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 3300
gcctaatgag tgagctaact cacattaatt gcgttgcgcg atgcttccat tttgtgaggg 3360
ttaatgcttc gagaagacat gataagatac attgatgagt ttggacaaac cacaacaaga 3420
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 3480
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 3540
cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 3600
cgataaggat cgattccgga gcctgaatgg cgaatggacg cgccctgtag cggcgcatta 3660
agcgcggcgg gtgtggtggt tacgcgcacg tgaccgctac acttgccagc gccctagcgc 3720
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 3780
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 3840
aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 3900
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 3960
cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 4020
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 4080
cgcttacaat ttcgcctgtg taccttctga ggcggaaaga accagctgtg gaatgtgtgt 4140
cagttagggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4200
ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg 4260
caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 4320
cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 4380
tatgcagagg ccgaggccgc ctcggcctct gagctattcc agaagtagtg aggaggcttt 4440
tttggaggcc taggcttttg caaaaagctt gattcttctg acacaacagt ctcgaactta 4500
aggctagagc caccatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 4560
tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 4620
tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 4680
ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 4740
cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 4800
aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 4860
tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 4920
aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 4980
atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 5040
cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 5100
tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 5160
accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 5220
gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 5280
tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 5340
agcgacgccc aacctgccat cacgatggcc gcaataaaat atctttattt tcattacatc 5400
tgtgtgttgg ttttttgtgt gcgtacgaag atccgcgtat ggtgcactct cagtacaatc 5460
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 5520
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 5580
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 5640
atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 5700
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 5760
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 5820
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 5880
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 5940
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 6000
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 6060
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 6120
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 6180
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 6240
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 6300
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 6360
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 6420
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 6480
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 6540
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 6600
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 6660
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 6720
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 6780
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 6840
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 6900
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 6960
aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 7020
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 7080
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 7140
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 7200
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 7260
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 7320
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 7380
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 7440
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 7500
atggctcgac agatct 7516
<210> 2
<211> 5043
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 2
gaattaattc ataccagatc accgaaaact gtcctccaaa tgtgtccccc tcacactccc 60
aaattcgcgg gcttctgcct cttagaccac tctaccctat tccccacact caccggagcc 120
aaagccgcgg cccttccgtt tctttgctgt ccggccatta gccatattat tcattggtta 180
tatagcataa atcaatattg gctattggcc attgcatacg ttgtatccat atcataatat 240
gtacatttat attggctcat gtccaacatt accgccatgt tgacattgat tattgactag 300
ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt 360
tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac 420
gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg 480
ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 540
tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat 600
gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 660
ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt 720
tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga 780
ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg 840
gtgggaggtc tatataagca gagctcaata aaagagccca caacccctca ctcggcgcgc 900
cagtcttccg atagactgcg tcgcccgggt acccgtattc ccaataaagc ctcttgctgt 960
ttgcatccga atcgtggtct cgctgttcct tgggagggtc tcctctgagt gattgactac 1020
ccacgacggg ggtctttcat ttgggggctc gtccgggatt tggagacccc tgcccaggga 1080
ccaccgaccc accaccggga ggtaagctgg ccagcaactt atctgtgtct gtccgattgt 1140
ctagtgtcta tgtttgatgt tatgcgcctg cgtctgtact agttagctaa ctagctctgt 1200
atctggcgga cccgtggtgg aactgacgag ttctgaacac ccggccgcaa ccctgggaga 1260
cgtcccaggg actttggggg ccgtttttgt ggcccgacct gaggaaggga gtcgatgtgg 1320
aatccgaccc cgtcaggata tgtggttctg gtaggagacg agaacctaaa acagttcccg 1380
cctccgtctg aatttttgct ttcggtttgg aaccgaagcc gcgcgtcttg tctgctgcag 1440
cgctgcagca tcgttctgtg ttgtctctgt ctgactgtgt ttctgtattt gtctgaaaat 1500
tagggccaga ctgttaccac tcccttaagt ttgaccttag gtcactggaa agatgtcgag 1560
cggatcgctc acaaccagtc ggtagatgtc aagaagagac gttgggttac cttctgctct 1620
gcagaatggc caacctttaa cgtcggatgg ccgcgagacg gcacctttaa ccgagacctc 1680
atcacccagg ttaagatcaa ggtcttttca cctggcccgc atggacaccc agaccaggtc 1740
ccctacatcg tgacctggga agccttggct tttgaccccc ctccctgggt caagcccttt 1800
gtacacccta agcctccgcc tcctcttcct ccatccgccc cgtctctccc ccttgaacct 1860
cctcgttcga ccccgcctcg atcctccctt tatccagccc tcactccttc tctaggcgcc 1920
ggaattgacg cgcgcgtagg cctgcggccg cagtactgac ggacacaccg aagccccggc 1980
ggcaaccctc agcggatgcc ccggggcttc acgttttccc aggtcagaag cggttttcgg 2040
gagtagtgcc ccaactgggg taacctttga gttctctcag ttgggggcgt agggtcgccg 2100
acatgacaca aggggttgtg accggggtgg acacgtacgc gggtgcttac gaccgtcagt 2160
cgcgcgagcg cgatagtctc gagttcgaca tcgataaaat aaaagatttt atttagtctc 2220
cagaaaaagg ggggaatgaa agaccccacc tgtaggtttg gcaagctagc ttaagtaacg 2280
ccattttgca aggcatggaa aaatacataa ctgagaatag aaaagttcag atcaaggtca 2340
ggaacagatg gaacagggtc gaccggtcga ccggtcgacc ctagagaacc atcagatgtt 2400
tccagggtgc cccaaggacc tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt 2460
cgcttctcgc ttctgttcgc gcgcttctgc tccccgagct caataaaaga gcccacaacc 2520
cctcactcgg ggcgccagtc ctccgattga ctgagtcgcc cgggtacccg tgtatccaat 2580
aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt tccttgggag ggtctcctct 2640
gagtgattga ctacccgtca gcgggggtct ttcatttggg ggctcgtccg ggatcgggag 2700
acccctgccc agggaccacc gacccaccac cgggaggtaa gctggctgcc tcgcgcgttt 2760
cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct 2820
gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg 2880
tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg gcttaactat 2940
gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga 3000
tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg 3060
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 3120
tccacagaat caggggataa cgcaggaaag aacatgtatg catgagcaaa aggccagcaa 3180
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 3240
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 3300
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 3360
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 3420
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 3480
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 3540
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 3600
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 3660
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 3720
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 3780
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 3840
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 3900
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 3960
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 4020
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 4080
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 4140
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 4200
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 4260
gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 4320
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 4380
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 4440
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 4500
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 4560
atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc gccacatagc 4620
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 4680
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 4740
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 4800
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 4860
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 4920
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 4980
accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctt 5040
caa 5043
<210> 3
<211> 5638
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 3
gaattaattc ataccagatc accgaaaact gtcctccaaa tgtgtccccc tcacactccc 60
aaattcgcgg gcttctgcct cttagaccac tctaccctat tccccacact caccggagcc 120
aaagccgcgg cccttccgtt tctttgctgt ccggccatta gccatattat tcattggtta 180
tatagcataa atcaatattg gctattggcc attgcatacg ttgtatccat atcataatat 240
gtacatttat attggctcat gtccaacatt accgccatgt tgacattgat tattgactag 300
ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt 360
tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac 420
gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg 480
ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 540
tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat 600
gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 660
ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt 720
tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga 780
ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg 840
gtgggaggtc tatataagca gagctcaata aaagagccca caacccctca ctcggcgcgc 900
cagtcttccg atagactgcg tcgcccgggt acccgtattc ccaataaagc ctcttgctgt 960
ttgcatccga atcgtggtct cgctgttcct tgggagggtc tcctctgagt gattgactac 1020
ccacgacggg ggtctttcat ttgggggctc gtccgggatt tggagacccc tgcccaggga 1080
ccaccgaccc accaccggga ggtaagctgg ccagcaactt atctgtgtct gtccgattgt 1140
ctagtgtcta tgtttgatgt tatgcgcctg cgtctgtact agttagctaa ctagctctgt 1200
atctggcgga cccgtggtgg aactgacgag ttctgaacac ccggccgcaa ccctgggaga 1260
cgtcccaggg actttggggg ccgtttttgt ggcccgacct gaggaaggga gtcgatgtgg 1320
aatccgaccc cgtcaggata tgtggttctg gtaggagacg agaacctaaa acagttcccg 1380
cctccgtctg aatttttgct ttcggtttgg aaccgaagcc gcgcgtcttg tctgctgcag 1440
cgctgcagca tcgttctgtg ttgtctctgt ctgactgtgt ttctgtattt gtctgaaaat 1500
tagggccaga ctgttaccac tcccttaagt ttgaccttag gtcactggaa agatgtcgag 1560
cggatcgctc acaaccagtc ggtagatgtc aagaagagac gttgggttac cttctgctct 1620
gcagaatggc caacctttaa cgtcggatgg ccgcgagacg gcacctttaa ccgagacctc 1680
atcacccagg ttaagatcaa ggtcttttca cctggcccgc atggacaccc agaccaggtc 1740
ccctacatcg tgacctggga agccttggct tttgaccccc ctccctgggt caagcccttt 1800
gtacacccta agcctccgcc tcctcttcct ccatccgccc cgtctctccc ccttgaacct 1860
cctcgttcga ccccgcctcg atcctccctt tatccagccc tcactccttc tctaggcgcc 1920
ggaattgacg cgcgcgtagg cctgcggccg cagtactgac ggacacaccg aagccccggc 1980
ggcaaccctc agcggatgcc ccggggcttc acgttttccc aggtcagaag cggttttcgg 2040
gagtagtgcc ccaactgggg taacctttga gttctctcag ttgggggcgt agggtcgccg 2100
acatgacaca aggggttgtg accggggtgg acacgtacgc gggtgcttac gaccgtcagt 2160
cgcgcgagcg cgatagtctc gagttcgaca tcgataatca acctctggat tacaaaattt 2220
gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 2280
ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 2340
ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 2400
tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 2460
agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 2520
cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 2580
tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc tggattctgc 2640
gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 2700
gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 2760
tctccctttg ggccgcctcc ccgcatcgat aaaataaaag attttattta gtctccagaa 2820
aaagggggga atgaaagacc ccacctgtag gtttggcaag ctagcttaag taacgccatt 2880
ttgcaaggca tggaaaaata cataactgag aatagaaaag ttcagatcaa ggtcaggaac 2940
agatggaaca gggtcgaccg gtcgaccggt cgaccctaga gaaccatcag atgtttccag 3000
ggtgccccaa ggacctgaaa tgaccctgtg ccttatttga actaaccaat cagttcgctt 3060
ctcgcttctg ttcgcgcgct tctgctcccc gagctcaata aaagagccca caacccctca 3120
ctcggggcgc cagtcctccg attgactgag tcgcccgggt acccgtgtat ccaataaacc 3180
ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 3240
attgactacc cgtcagcggg ggtctttcat ttgggggctc gtccgggatc gggagacccc 3300
tgcccaggga ccaccgaccc accaccggga ggtaagctgg ctgcctcgcg cgtttcggtg 3360
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 3420
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 3480
gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc 3540
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 3600
aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 3660
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 3720
agaatcaggg gataacgcag gaaagaacat gtatgcatga gcaaaaggcc agcaaaaggc 3780
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 3840
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 3900
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 3960
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 4020
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 4080
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 4140
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 4200
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 4260
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 4320
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 4380
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 4440
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 4500
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 4560
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 4620
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 4680
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 4740
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 4800
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 4860
tagtttgcgc aacgttgttg ccattgctgc aggcatcgtg gtgtcacgct cgtcgtttgg 4920
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 4980
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 5040
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 5100
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 5160
gcgaccgagt tgctcttgcc cggcgtcaac acgggataat accgcgccac atagcagaac 5220
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 5280
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 5340
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 5400
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 5460
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 5520
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 5580
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtcttcaa 5638
<210> 4
<211> 8348
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 4
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt catttaaatg aaagacccca 420
cctgtaggtt tggcaagcta gcttaagtaa cgccattttg caaggcatgg aaaaatacat 480
aactgagaat agaaaagttc agatcaaggt caggaacaga tggaacaggg tcgaccggtc 540
gaccggtcga ccctagagaa ccatcagatg tttccagggt gccccaagga cctgaaatga 600
ccctgtgcct tatttgaact aaccaatcag ttcgcttctc gcttctgttc gcgcgcttct 660
gctccccgag ctcaataaaa gagcccacaa cccctcactc ggggcgccag tcttccgata 720
gactgcgtcg cccgggtacc cgtattccca ataaagcctc ttgctgtttg catccgaatc 780
gtggtctcgc tgttccttgg gagggtctcc tctgagtgat tgactaccca cgacgggggt 840
ctttcatttg ggggctcgtc cgggatttgg agacccctgc ccagggacca ccgacccacc 900
accgggaggt aagctggcca gcaacttatc tgtgtctgtc cgattgtcta gtgtctatgt 960
ttgatgttat gcgcctgcgt ctgtactagt tagctaacta gctctgtatc tggcggaccc 1020
gtggtggaac tgacgagttc tgaacacccg gccgcaaccc tgggagacgt cccagggact 1080
ttgggggccg tttttgtggc ccgacctgag gaagggagtc gatgtggaat ccgaccccgt 1140
caggatatgt ggttctggta ggagacgaga acctaaaaca gttcccgcct ccgtctgaat 1200
ttttgctttc ggtttggaac cgaagccgcg cgtcttgtct gctgcagcgc tgcagcatcg 1260
ttctgtgttg tctctgtctg actgtgtttc tgtatttgtc tgaaaattag ggccagactg 1320
ttaccactcc cttaagtttg accttaggtc actggaaaga tgtcgagcgg atcgctcaca 1380
accagtcggt agatgtcaag aagagacgtt gggttacctt ctgctctgca gaatggccaa 1440
cctttaacgt cggatggccg cgagacggca cctttaaccg agacctcatc acccaggtta 1500
agatcaaggt cttttcacct ggcccgcatg gacacccaga ccaggtcccc tacatcgtga 1560
cctgggaagc cttggctttt gacccccctc cctgggtcaa gccctttgta caccctaagc 1620
ctccgcctcc tcttcctcca tccgccccgt ctctccccct tgaacctcct cgttcgaccc 1680
cgcctcgatc ctccctttat ccagccctca ctccttctct aggcgccgga attgccttcc 1740
accatggcca cctcagcaag ttcccacttg aacaaaaaca tcaagcaaat gtacttgtgc 1800
ctgccccagg gtgagaaagt ccaagccatg tatatctggg ttgatggtac tggagaagga 1860
ctgcgctgca aaacccgcac cctggactgt gagcccaagt gtgtagaaga gttacctgag 1920
tggaattttg atggctctag tacctttcag tctgagggct ccaacagtga catgtatctc 1980
agccctgttg ccatgtttcg ggaccccttc cgcagagatc ccaacaagct ggtgttctgt 2040
gaagttttca agtacaaccg gaagcctgca gagaccaatt taaggcactc gtgtaaacgg 2100
ataatggaca tggtgagcaa ccagcacccc tggtttggaa tggaacagga gtatactctg 2160
atgggaacag atgggcaccc ttttggttgg ccttccaatg gctttcctgg gccccaaggt 2220
ccgtattact gtggtgtggg cgcagacaaa gcctatggca gggatatcgt ggaggctcac 2280
taccgcgcct gcttgtatgc tggggtcaag attacaggaa caaatgctga ggtcatgcct 2340
gcccagtggg agttccaaat aggaccctgt gaaggaatcc gcatgggaga tcatctctgg 2400
gtggcccgtt tcatcttgca tcgagtatgt gaagactttg gggtaatagc aacctttgac 2460
cccaagccca ttcctgggaa ctggaatggt gcaggctgcc ataccaactt tagcaccaag 2520
gccatgcggg aggagaatgg tctgaagcac atcgaggagg ccatcgagaa actaagcaag 2580
cggcaccggt accacattcg agcctacgat cccaaggggg gcctggacaa tgcccgtcgt 2640
ctgactgggt tccacgaaac gtccaacatc aacgactttt ctgctggtgt cgccaatcgc 2700
agtgccagca tccgcattcc ccggactgtc ggccaggaga agaaaggtta ctttgaagac 2760
cgccgcccct ctgccaactg tgaccccttt gcagtgacag aagccatcgt ccgcacatgc 2820
cttctcaatg agactggcga cgagcccttc caatacaaaa actaaagatc cctatggcta 2880
ttggccaggt tcaatactat gtattggccc tatgccatat agtattccat atatgggttt 2940
tcctattgac gtagatagcc cctcccaatg ggcggtccca tataccatat atggggcttc 3000
ctaataccgc ccatagccac tcccccattg acgtcaatgg tctctatata tggtctttcc 3060
tattgacgtc atatgggcgg tcctattgac gtatatggcg cctcccccat tgacgtcaat 3120
tacggtaaat ggcccgcctg gctcaatgcc cattgacgtc aataggacca cccaccattg 3180
acgtcaatgg gatggctcat tgcccattca tatccgttct cacgccccct attgacgtca 3240
atgacggtaa atggcccact tggcagtaca tcaatatcta ttaatagtaa cttggcaagt 3300
acattactat tggaagtacg ccagggtaca ttggcagtac tcccattgac gtcaatggcg 3360
gtaaatggcc cgcgatggct gccaagtaca tccccattga cgtcaatggg gaggggcaat 3420
gacgcaaatg ggcgttccat tgacgtaaat gggcggtagg cgtgcctaat gggaggtcta 3480
tataagcaat gctcgtttag ggaaccgcca ttctgcctgg ggacgtcgga ggagctcgaa 3540
agcttctaga caattgccgc caccatgatg tcctttgtct ctctgctcct ggttggcatc 3600
ctattccatg ccacccaggc cagtgataca ggtagacctt tcgtagagat gtacagtgaa 3660
atccccgaaa ttatacacat gactgaagga agggagctcg tcattccctg ccgggttacg 3720
tcacctaaca tcactgttac tttaaaaaag tttccacttg acactttgat ccctgatgga 3780
aaacgcataa tctgggacag tagaaagggc ttcatcatat caaatgcaac gtacaaagaa 3840
atagggcttc tgacctgtga agcaacagtc aatgggcatt tgtataagac aaactatctc 3900
acacatcgac aaaccaatac aatcatagat gtcgttctga gtccgtctca tggaattgaa 3960
ctatctgttg gagaaaagct tgtcttaaat tgtacagcaa gaactgaact aaatgtgggg 4020
attgacttca actgggaata cccttcttcg aagcatcagc ataagaaact tgtaaaccga 4080
gacctaaaaa cccagtctgg gagtgagatg aagaagtttt tgagcacctt aactatagat 4140
ggtgtaaccc ggagtgacca aggattgtac acctgtgcag catccagtgg gctgatgacc 4200
aagaaaaaca gcacatttgt cagggtccat gaaaaagaca aaactcacac atgcccaccg 4260
tgcccagcac ctgaactcct ggggggaccc tcagtcttcc tcttcccccc aaaacccaag 4320
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 4380
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 4440
acaaagccac gggaggagca gtacaacagc acatatcgtg tggtcagcgt cctcaccgtc 4500
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 4560
ccagccccca tcgagaaaac catctccaaa gccaaagggc agccccgaga accacaggtg 4620
tacaccctgc ccccatcccg ggatgagctg accaagaacc aggtcagcct gacctgcctg 4680
gtcaaaggct tctatcccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag 4740
aacaactaca agaccacgcc tcccgtgctg gactccgacg gctccttctt cctctacagc 4800
aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg 4860
catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctcc cgggaaatga 4920
tgagatctcg agttcgacat cgataatcaa cctctggatt acaaaatttg tgaaagattg 4980
actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 5040
ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 5100
ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 5160
gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 5220
gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 5280
cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa 5340
tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 5400
ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 5460
gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 5520
gccgcctccc cgcatcgatg ggggaggcta actgaaacac ggaaggagac aataccggaa 5580
ggaacccgcg ctatgacggc aataaaaaga cagaataaaa cgcacgggtg ttgggtcgtt 5640
tgttcataaa cgcggggttc ggtcccaggg ctggcactct gtcgataccc caccgagacc 5700
ccattggggc caatacgccc gcgtttcttc cttttcccca ccccaccccc caagttcggg 5760
tgaaggccca gggctcgcag ccaacgtcgg ggcggcaggc cctgccatag cggtcgacga 5820
tgtaggtcac ggtctcgaag ccgcggtgcg ggtgccaggg cgtgcccttg ggctccccgg 5880
gcgcgtactc cacctcaccc atctggtcca tcatgatgaa cgggtcgagg tggcggtagt 5940
tgatcccggc gaacgcgcgg cgcaccggga agccctcgcc ctcgaaaccg ctgggcgcgg 6000
tggtcacggt gagcacggga cgtgcgacgg cgtcggcggg tgcggatacg cggggcagcg 6060
tcagcgggtt ctcgacggtc acggcgggca tgatttccac tgtacgcgta gcttggcgta 6120
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 6180
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 6240
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 6300
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 6360
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 6420
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6480
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6540
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6600
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6660
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 6720
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 6780
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 6840
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 6900
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 6960
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 7020
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7080
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7140
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7200
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7260
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 7320
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 7380
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 7440
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 7500
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 7560
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 7620
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 7680
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 7740
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 7800
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 7860
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 7920
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 7980
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 8040
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 8100
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 8160
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 8220
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 8280
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 8340
ctttcgtc 8348
<210> 5
<211> 7011
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 5
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaaagctt ctagacaatt gccgccacca 2520
tgatgtcctt tgtctctctg ctcctggttg gcatcctatt ccatgccacc caggccagtg 2580
atacaggtag acctttcgta gagatgtaca gtgaaatccc cgaaattata cacatgactg 2640
aaggaaggga gctcgtcatt ccctgccggg ttacgtcacc taacatcact gttactttaa 2700
aaaagtttcc acttgacact ttgatccctg atggaaaacg cataatctgg gacagtagaa 2760
agggcttcat catatcaaat gcaacgtaca aagaaatagg gcttctgacc tgtgaagcaa 2820
cagtcaatgg gcatttgtat aagacaaact atctcacaca tcgacaaacc aatacaatca 2880
tagatgtcgt tctgagtccg tctcatggaa ttgaactatc tgttggagaa aagcttgtct 2940
taaattgtac agcaagaact gaactaaatg tggggattga cttcaactgg gaataccctt 3000
cttcgaagca tcagcataag aaacttgtaa accgagacct aaaaacccag tctgggagtg 3060
agatgaagaa gtttttgagc accttaacta tagatggtgt aacccggagt gaccaaggat 3120
tgtacacctg tgcagcatcc agtgggctga tgaccaagaa aaacagcaca tttgtcaggg 3180
tccatgaaaa agacaaaact cacacatgcc caccgtgccc agcacctgaa ctcctggggg 3240
gaccctcagt cttcctcttc cccccaaaac ccaaggacac cctcatgatc tcccggaccc 3300
ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga ccctgaggtc aagttcaact 3360
ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa gccacgggag gagcagtaca 3420
acagcacata tcgtgtggtc agcgtcctca ccgtcctgca ccaggactgg ctgaatggca 3480
aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc ccccatcgag aaaaccatct 3540
ccaaagccaa agggcagccc cgagaaccac aggtgtacac cctgccccca tcccgggatg 3600
agctgaccaa gaaccaggtc agcctgacct gcctggtcaa aggcttctat cccagcgaca 3660
tcgccgtgga gtgggagagc aatgggcagc cggagaacaa ctacaagacc acgcctcccg 3720
tgctggactc cgacggctcc ttcttcctct acagcaagct caccgtggac aagagcaggt 3780
ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga ggctctgcac aaccactaca 3840
cgcagaagag cctctccctg tctcccggga aatgatgaga tctcgagttc gacatcgata 3900
atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 3960
cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 4020
tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt 4080
ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg 4140
gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta 4200
ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 4260
tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg 4320
cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca 4380
atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc 4440
gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat cgatggggga 4500
ggctaactga aacacggaag gagacaatac cggaaggaac ccgcgctatg acggcaataa 4560
aaagacagaa taaaacgcac gggtgttggg tcgtttgttc ataaacgcgg ggttcggtcc 4620
cagggctggc actctgtcga taccccaccg agaccccatt ggggccaata cgcccgcgtt 4680
tcttcctttt ccccacccca ccccccaagt tcgggtgaag gcccagggct cgcagccaac 4740
gtcggggcgg caggccctgc catagcccta gcagcttggc gtaatcatgg tcatagctgt 4800
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4860
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4920
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4980
cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 5040
gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 5100
ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca 5160
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 5220
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 5280
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 5340
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 5400
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 5460
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 5520
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 5580
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 5640
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 5700
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 5760
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 5820
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 5880
agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 5940
ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 6000
gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 6060
catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 6120
cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 6180
cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 6240
gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 6300
tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 6360
gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 6420
tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 6480
gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 6540
gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 6600
taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 6660
tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 6720
ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 6780
taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 6840
tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 6900
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta 6960
ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt c 7011
<210> 6
<211> 5680
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 6
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgcaagcttc aattgaggcc 2520
tcctaggtta attaagttta aacagatctc tcgagttcga catcgataat caacctctgg 2580
attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 2640
gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 2700
tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca 2760
ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg 2820
ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg 2880
aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca 2940
attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca 3000
cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc 3060
ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc 3120
agacgagtcg gatctccctt tgggccgcct ccccgcatcg atgggggagg ctaactgaaa 3180
cacggaagga gacaataccg gaaggaaccc gcgctatgac ggcaataaaa agacagaata 3240
aaacgcacgg gtgttgggtc gtttgttcat aaacgcgggg ttcggtccca gggctggcac 3300
tctgtcgata ccccaccgag accccattgg ggccaatacg cccgcgtttc ttccttttcc 3360
ccaccccacc ccccaagttc gggtgaaggc ccagggctcg cagccaacgt cggggcggca 3420
ggccctgcca tagccctagc agcttggccg taatcatggt catagctgtt tcctgtgtga 3480
aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 3540
tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 3600
cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc 3660
ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 3720
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 3780
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 3840
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 3900
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3960
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 4020
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 4080
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 4140
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 4200
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 4260
gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 4320
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 4380
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 4440
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 4500
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 4560
aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 4620
taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 4680
gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 4740
agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 4800
cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 4860
tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 4920
gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 4980
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 5040
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 5100
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 5160
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 5220
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 5280
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 5340
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 5400
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 5460
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 5520
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 5580
ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca 5640
ttaacctata aaaataggcg tatcacgagg ccctttcgtc 5680
<210> 7
<211> 8085
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 7
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccctaggg tttaaacaga 2520
tctatcgata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 2580
tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 2640
gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat 2700
gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca 2760
acccccactg gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc 2820
cccctcccta ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 2880
gctcggctgt tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct 2940
tggctgctcg cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct 3000
tcggccctca atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt 3060
ccgcgtcttc gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat 3120
cgattactaa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca 3180
cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt 3240
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 3300
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg 3360
aattcggacg gtgactgcag tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg 3420
agatttctgt cgccgactaa attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga 3480
tggcgatatt ggaaaaatcg atatttgaaa atatggcata ttgaaaatgt cgccgatgtg 3540
agtttctgtg taactgatat cgccattttt ccaaaagtga tttttgggca tacgcgatat 3600
ctggcgatag cgcttatatc gtttacgggg gatggcgata gacgactttg gtgacttggg 3660
cgattctgtg tgtcgcaaat atcgcagttt cgatataggt gacagacgat atgaggctat 3720
atcgccgata gaggcgacat caagctggca catggccaat gcatatcgat ctatacattg 3780
aatcaatatt ggccattagc catattattc attggttata tagcataaat caatattggc 3840
tattggccat tgcatacgtt gtatccatat cataatatgt acatttatat tggctcatgt 3900
ccaacattac cgccatgttg acattgatta ttgactagtt attaatagta atcaattacg 3960
gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 4020
ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 4080
atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 4140
gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 4200
gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 4260
tggcagtaca tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac 4320
atcaatgggc gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac 4380
gtcaatggga gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac 4440
tccgccccat tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga 4500
gctcgtttag tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat 4560
agaagacacc gggaccgatc cagcctccgc ggccgggaac ggtgcattgg aacgcggatt 4620
ccccgtgcca agagtgacgt aagtaccgcc tatagagtct ataggcccac ccccttggct 4680
tcttatgcat gctatactgt ttttggcttg gggtctatac acccccgctt cctcatgtta 4740
taggtgatgg tatagcttag cctataggtg tgggttattg accattattg accactcccc 4800
tattggtgac gatactttcc attactaatc cataacatgg ctctttgcca caactctctt 4860
tattggctat atgccaatac actgtccttc agagactgac acggactctg tatttttaca 4920
ggatggggtc tcatttatta tttacaaatt cacatataca acaccaccgt ccccagtgcc 4980
cgcagttttt attaaacata acgtgggatc tccacgcgaa tctcgggtac gtgttccgga 5040
catgggctct tctccggtag cggcggagct tctacatccg agccctgctc ccatgcctcc 5100
agcgactcat ggtcgctcgg cagctccttg ctcctaacag tggaggccag acttaggcac 5160
agcacgatgc ccaccaccac cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct 5220
gaaaatgagc tcggggagcg ggcttgcacc gctgacgcat ttggaagact taaggcagcg 5280
gcagaagaag atgcaggcag ctgagttgtt gtgttctgat aagagtcaga ggtaactccc 5340
gttgcggtgc tgttaacggt ggagggcagt gtagtctgag cagtactcgt tgctgccgcg 5400
cgcgccacca gacataatag ctgacagact aacagactgt tcctttccat gggtcttttc 5460
tgcagtcacc gtccttgaca cgaagttcga atcaggataa gggcgaattc cgacgtaggc 5520
ctattcgaag tctacttaat taaaagcttt ctagagcctc gagcgatggg ggaggctaac 5580
tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa taaaaagaca 5640
gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg tcccagggct 5700
ggcactctgt cgatacccca ccgagacccc attggggcca atacgcccgc gtttcttcct 5760
tttccccacc ccacccccca agttcgggtg aaggcccagg gctcgcagcc aacgtcgggg 5820
cggcaggccc tgccatagcc ctagcagctt ggccgtaatc atggtcatag ctgtttcctg 5880
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 5940
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6000
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6060
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6120
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6180
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6240
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6300
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6360
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6420
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6480
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6540
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6600
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6660
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6720
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6780
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6840
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6900
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6960
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7020
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7080
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7140
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7200
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7260
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7320
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7380
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7440
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7500
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7560
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7620
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7680
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7740
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7800
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7860
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7920
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7980
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8040
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 8085
<210> 8
<211> 7683
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 8
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccctaggg tttaaacaga 2520
tctatcgata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 2580
tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 2640
gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat 2700
gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca 2760
acccccactg gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc 2820
cccctcccta ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 2880
gctcggctgt tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct 2940
tggctgctcg cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct 3000
tcggccctca atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt 3060
ccgcgtcttc gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat 3120
cgattactaa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca 3180
cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt 3240
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 3300
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg 3360
aattcggacg gtgactgcag tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg 3420
agatttctgt cgccgactaa attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga 3480
tggcgatatt ggaaaaatcg atatttgaaa atatggcata ttgaaaatgt cgccgatgtg 3540
agtttctgtg taactgatat cgccattttt ccaaaagtga tttttgggca tacgcgatat 3600
ctggcgatag cgcttatatc gtttacgggg gatggcgata gacgactttg gtgacttggg 3660
cgattctgtg tgtcgcaaat atcgcagttt cgatataggt gacagacgat atgaggctat 3720
atcgccgata gaggcgacat caagctggca catggccaat gcatatcgat ctatacattg 3780
aatcaatatt ggccattagc catattattc attggttata tagcataaat caatattggc 3840
tattggccat tgcatacgtt gtatccatat cataatatgt acatttatat tggctcatgt 3900
ccaacattac cgccatgttg acattgatta ttgactagtt attaatagta atcaattacg 3960
gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 4020
ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 4080
atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 4140
gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 4200
gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 4260
tggcagtaca tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac 4320
atcaatgggc gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac 4380
gtcaatggga gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac 4440
tccgccccat tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga 4500
gctcgtttag tgaaccggat ccttaaccgt gaaagcttag gccttctaga gcctcgagtt 4560
cgacatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa 4620
ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat 4680
tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta 4740
tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc 4800
aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt 4860
ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg 4920
ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc 4980
ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 5040
ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 5100
tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca 5160
tcgatggggg aggctaactg aaacacggaa ggagacaata ccggaaggaa cccgcgctat 5220
gacggcaata aaaagacaga ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg 5280
gggttcggtc ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat 5340
acgcccgcgt ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc 5400
tcgcagccaa cgtcggggcg gcaggccctg ccatagccct agcagcttgg ccgtaatcat 5460
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 5520
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 5580
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 5640
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 5700
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 5760
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5820
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5880
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5940
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 6000
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 6060
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 6120
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 6180
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 6240
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 6300
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 6360
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6420
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6480
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6540
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6600
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 6660
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 6720
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6780
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6840
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6900
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6960
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 7020
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 7080
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 7140
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 7200
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 7260
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 7320
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 7380
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 7440
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 7500
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 7560
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 7620
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 7680
gtc 7683
<210> 9
<211> 10196
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 9
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520
ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggcccag gtgcagctgg 2580
tggagtccgg cggcggcgtc gtgcagcccg gccggtccct gcggctgtcc tgcgccgcct 2640
ccggcttcac cttctcctcc tacaccatgc actgggtgcg gcaggccccc ggcaagggcc 2700
tggagtgggt gactttcatc tcctacgacg gcaacaacaa gtactacgcc gactccgtga 2760
agggccggtt caccatctcc cgcgacaact ccaagaacac cctgtacctg cagatgaact 2820
ccctgcgggc cgaggacacc gccatctact actgcgcccg gaccggctgg ctgggcccct 2880
tcgactactg gggccagggc accctggtga ccgtgtcctc cgcctccacc aagggcccat 2940
cggtcttccc cctggcaccc tctagcaaga gcacctctgg gggcacagcg gccctgggct 3000
gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca ggcgccctga 3060
ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac tccctcagca 3120
gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc aacgtgaatc 3180
acaagcccag caacaccaag gtggacaagc gggttgagcc caaatcttgt gacaaaactc 3240
acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc ttcctcttcc 3300
ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca tgcgtggtgg 3360
tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac ggcgtggagg 3420
tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac cgtgtggtca 3480
gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag tgcaaggtct 3540
ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa gggcagcccc 3600
gagaaccaca ggtgtacacc ctgcctccat cccgcgatga gctgaccaag aaccaggtca 3660
gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag tgggagagca 3720
atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc gacggctcct 3780
tcttcctcta tagcaagctc accgtggaca agagcaggtg gcagcagggg aacgtcttct 3840
catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc ctctccctgt 3900
ctcctgggaa atgatgagat ctatcgataa tcaacctctg gattacaaaa tttgtgaaag 3960
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 4020
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 4080
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 4140
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 4200
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 4260
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 4320
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 4380
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 4440
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 4500
ttgggccgcc tccccgcatc gattactaat cagccatacc acatttgtag aggttttact 4560
tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt 4620
tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 4680
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 4740
tgtatcttat catgtctgga attcggacgg tgactgcagt gaataataaa atgtgtgttt 4800
gtccgaaata cgcgttttga gatttctgtc gccgactaaa ttcatgtcgc gcgatagtgg 4860
tgtttatcgc cgatagagat ggcgatattg gaaaaatcga tatttgaaaa tatggcatat 4920
tgaaaatgtc gccgatgtga gtttctgtgt aactgatatc gccatttttc caaaagtgat 4980
ttttgggcat acgcgatatc tggcgatagc gcttatatcg tttacggggg atggcgatag 5040
acgactttgg tgacttgggc gattctgtgt gtcgcaaata tcgcagtttc gatataggtg 5100
acagacgata tgaggctata tcgccgatag aggcgacatc aagctggcac atggccaatg 5160
catatcgatc tatacattga atcaatattg gccattagcc atattattca ttggttatat 5220
agcataaatc aatattggct attggccatt gcatacgttg tatccatatc ataatatgta 5280
catttatatt ggctcatgtc caacattacc gccatgttga cattgattat tgactagtta 5340
ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac 5400
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 5460
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 5520
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 5580
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 5640
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt 5700
gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc 5760
aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt 5820
tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg 5880
ggaggtctat ataagcagag ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc 5940
acgctgtttt gacctccata gaagacaccg ggaccgatcc agcctccgcg gccgggaacg 6000
gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct atagagtcta 6060
taggcccacc cccttggctt cttatgcatg ctatactgtt tttggcttgg ggtctataca 6120
cccccgcttc ctcatgttat aggtgatggt atagcttagc ctataggtgt gggttattga 6180
ccattattga ccactcccct attggtgacg atactttcca ttactaatcc ataacatggc 6240
tctttgccac aactctcttt attggctata tgccaataca ctgtccttca gagactgaca 6300
cggactctgt atttttacag gatggggtct catttattat ttacaaattc acatatacaa 6360
caccaccgtc cccagtgccc gcagttttta ttaaacataa cgtgggatct ccacgcgaat 6420
ctcgggtacg tgttccggac atgggctctt ctccggtagc ggcggagctt ctacatccga 6480
gccctgctcc catgcctcca gcgactcatg gtcgctcggc agctccttgc tcctaacagt 6540
ggaggccaga cttaggcaca gcacgatgcc caccaccacc agtgtgccgc acaaggccgt 6600
ggcggtaggg tatgtgtctg aaaatgagct cggggagcgg gcttgcaccg ctgacgcatt 6660
tggaagactt aaggcagcgg cagaagaaga tgcaggcagc tgagttgttg tgttctgata 6720
agagtcagag gtaactcccg ttgcggtgct gttaacggtg gagggcagtg tagtctgagc 6780
agtactcgtt gctgccgcgc gcgccaccag acataatagc tgacagacta acagactgtt 6840
cctttccatg ggtcttttct gcagtcaccg tccttgacac gaagttcgaa tcaggataag 6900
ggcgaattcc gacgtaggcc tattcgaagt ctacttaatt aaaagcttgc cgccaccatg 6960
atgtcctttg tctctctgct cctggttggc atcctattcc atgccaccca ggccgagatc 7020
gtgctgaccc agtcccccgg caccctgtcc ctgtcccccg gcgagcgggc caccctgtcc 7080
tgccgggcct cccagtccgt gggctcctcc tacctggcct ggtaccagca gaagcccggc 7140
caggcccccc ggctgctgat ctacggcgcc ttctcccgcg ccaccggcat ccccgaccgg 7200
ttctccggct ccggctccgg caccgacttc accctgacca tctcccggct ggagcccgag 7260
gacttcgccg tgtactactg ccagcagtac ggctcctccc cctggacctt cggccagggc 7320
accaaggtgg agatcaagcg aactgtggct gcaccatctg tcttcatctt cccgccatct 7380
gatgagcagc ttaagtccgg aactgctagc gttgtgtgcc tgctgaataa cttctatccc 7440
agagaggcca aagtacagtg gaaggtggat aacgccctcc aatcgggtaa ctcccaggag 7500
agtgtcacag agcaggacag caaggacagc acctacagcc tcagcagcac cctgacgctg 7560
agcaaagcag actacgagaa acacaaagtc tacgcctgcg aagtcaccca tcagggcctg 7620
agctcgcccg tcacaaagag cttcaacagg ggagagtgtt agtgagatct cgagcgatgg 7680
gggaggctaa ctgaaacacg gaaggagaca ataccggaag gaacccgcgc tatgacggca 7740
ataaaaagac agaataaaac gcacgggtgt tgggtcgttt gttcataaac gcggggttcg 7800
gtcccagggc tggcactctg tcgatacccc accgagaccc cattggggcc aatacgcccg 7860
cgtttcttcc ttttccccac cccacccccc aagttcgggt gaaggcccag ggctcgcagc 7920
caacgtcggg gcggcaggcc ctgccatagc cctagcagct tggccgtaat catggtcata 7980
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 8040
cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 8100
ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 8160
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 8220
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 8280
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 8340
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8400
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8460
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8520
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8580
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8640
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8700
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8760
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8820
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8880
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8940
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 9000
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 9060
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 9120
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 9180
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 9240
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9300
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9360
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9420
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9480
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9540
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9600
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9660
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9720
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9780
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9840
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9900
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9960
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 10020
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 10080
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 10140
cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtc 10196
<210> 10
<211> 10196
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 10
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520
ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggccgag atcgtgctga 2580
cccagtcccc cggcaccctg tccctgtccc ccggcgagcg ggccaccctg tcctgccggg 2640
cctcccagtc cgtgggctcc tcctacctgg cctggtacca gcagaagccc ggccaggccc 2700
cccggctgct gatctacggc gccttctccc gcgccaccgg catccccgac cggttctccg 2760
gctccggctc cggcaccgac ttcaccctga ccatctcccg gctggagccc gaggacttcg 2820
ccgtgtacta ctgccagcag tacggctcct ccccctggac cttcggccag ggcaccaagg 2880
tggagatcaa gcgaactgtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc 2940
agcttaagtc cggaactgct agcgttgtgt gcctgctgaa taacttctat cccagagagg 3000
ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca 3060
cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag 3120
cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc 3180
ccgtcacaaa gagcttcaac aggggagagt gttagtgaga tctatcgata atcaacctct 3240
ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 3300
atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 3360
tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt 3420
caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat 3480
tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc 3540
ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 3600
caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc 3660
cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga 3720
ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc 3780
tcagacgagt cggatctccc tttgggccgc ctccccgcat cgattactaa tcagccatac 3840
cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 3900
acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 3960
ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 4020
tggtttgtcc aaactcatca atgtatctta tcatgtctgg aattcggacg gtgactgcag 4080
tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg agatttctgt cgccgactaa 4140
attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga tggcgatatt ggaaaaatcg 4200
atatttgaaa atatggcata ttgaaaatgt cgccgatgtg agtttctgtg taactgatat 4260
cgccattttt ccaaaagtga tttttgggca tacgcgatat ctggcgatag cgcttatatc 4320
gtttacgggg gatggcgata gacgactttg gtgacttggg cgattctgtg tgtcgcaaat 4380
atcgcagttt cgatataggt gacagacgat atgaggctat atcgccgata gaggcgacat 4440
caagctggca catggccaat gcatatcgat ctatacattg aatcaatatt ggccattagc 4500
catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 4560
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 4620
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 4680
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 4740
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 4800
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 4860
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 4920
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 4980
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 5040
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 5100
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 5160
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca 5220
gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc 5280
cagcctccgc ggccgggaac ggtgcattgg aacgcggatt ccccgtgcca agagtgacgt 5340
aagtaccgcc tatagagtct ataggcccac ccccttggct tcttatgcat gctatactgt 5400
ttttggcttg gggtctatac acccccgctt cctcatgtta taggtgatgg tatagcttag 5460
cctataggtg tgggttattg accattattg accactcccc tattggtgac gatactttcc 5520
attactaatc cataacatgg ctctttgcca caactctctt tattggctat atgccaatac 5580
actgtccttc agagactgac acggactctg tatttttaca ggatggggtc tcatttatta 5640
tttacaaatt cacatataca acaccaccgt ccccagtgcc cgcagttttt attaaacata 5700
acgtgggatc tccacgcgaa tctcgggtac gtgttccgga catgggctct tctccggtag 5760
cggcggagct tctacatccg agccctgctc ccatgcctcc agcgactcat ggtcgctcgg 5820
cagctccttg ctcctaacag tggaggccag acttaggcac agcacgatgc ccaccaccac 5880
cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct gaaaatgagc tcggggagcg 5940
ggcttgcacc gctgacgcat ttggaagact taaggcagcg gcagaagaag atgcaggcag 6000
ctgagttgtt gtgttctgat aagagtcaga ggtaactccc gttgcggtgc tgttaacggt 6060
ggagggcagt gtagtctgag cagtactcgt tgctgccgcg cgcgccacca gacataatag 6120
ctgacagact aacagactgt tcctttccat gggtcttttc tgcagtcacc gtccttgaca 6180
cgaagttcga atcaggataa gggcgaattc cgacgtaggc ctattcgaag tctacttaat 6240
taaaagcttg ccgccaccat gatgtccttt gtctctctgc tcctggttgg catcctattc 6300
catgccaccc aggcccaggt gcagctggtg gagtccggcg gcggcgtcgt gcagcccggc 6360
cggtccctgc ggctgtcctg cgccgcctcc ggcttcacct tctcctccta caccatgcac 6420
tgggtgcggc aggcccccgg caagggcctg gagtgggtga ctttcatctc ctacgacggc 6480
aacaacaagt actacgccga ctccgtgaag ggccggttca ccatctcccg cgacaactcc 6540
aagaacaccc tgtacctgca gatgaactcc ctgcgggccg aggacaccgc catctactac 6600
tgcgcccgga ccggctggct gggccccttc gactactggg gccagggcac cctggtgacc 6660
gtgtcctccg cctccaccaa gggcccatcg gtcttccccc tggcaccctc tagcaagagc 6720
acctctgggg gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 6780
acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 6840
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 6900
acccagacct acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagcgg 6960
gttgagccca aatcttgtga caaaactcac acatgcccac cgtgcccagc acctgaactc 7020
ctggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc 7080
cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag 7140
ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag 7200
cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg 7260
aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa 7320
accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcctccatcc 7380
cgcgatgagc tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc 7440
agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta caagaccacg 7500
cctcccgtgc tggactccga cggctccttc ttcctctata gcaagctcac cgtggacaag 7560
agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac 7620
cactacacgc agaagagcct ctccctgtct cctgggaaat gatgagatct cgagcgatgg 7680
gggaggctaa ctgaaacacg gaaggagaca ataccggaag gaacccgcgc tatgacggca 7740
ataaaaagac agaataaaac gcacgggtgt tgggtcgttt gttcataaac gcggggttcg 7800
gtcccagggc tggcactctg tcgatacccc accgagaccc cattggggcc aatacgcccg 7860
cgtttcttcc ttttccccac cccacccccc aagttcgggt gaaggcccag ggctcgcagc 7920
caacgtcggg gcggcaggcc ctgccatagc cctagcagct tggccgtaat catggtcata 7980
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 8040
cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 8100
ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 8160
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 8220
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 8280
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 8340
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8400
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8460
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8520
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8580
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8640
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8700
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8760
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8820
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8880
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8940
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 9000
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 9060
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 9120
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 9180
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 9240
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9300
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9360
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9420
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9480
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9540
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9600
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9660
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9720
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9780
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9840
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9900
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9960
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 10020
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 10080
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 10140
cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtc 10196
<210> 11
<211> 9778
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 11
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520
ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggcccag gtgcagctgg 2580
tggagtccgg cggcggcgtc gtgcagcccg gccggtccct gcggctgtcc tgcgccgcct 2640
ccggcttcac cttctcctcc tacaccatgc actgggtgcg gcaggccccc ggcaagggcc 2700
tggagtgggt gactttcatc tcctacgacg gcaacaacaa gtactacgcc gactccgtga 2760
agggccggtt caccatctcc cgcgacaact ccaagaacac cctgtacctg cagatgaact 2820
ccctgcgggc cgaggacacc gccatctact actgcgcccg gaccggctgg ctgggcccct 2880
tcgactactg gggccagggc accctggtga ccgtgtcctc cgcctccacc aagggcccat 2940
cggtcttccc cctggcaccc tctagcaaga gcacctctgg gggcacagcg gccctgggct 3000
gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca ggcgccctga 3060
ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac tccctcagca 3120
gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc aacgtgaatc 3180
acaagcccag caacaccaag gtggacaagc gggttgagcc caaatcttgt gacaaaactc 3240
acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc ttcctcttcc 3300
ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca tgcgtggtgg 3360
tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac ggcgtggagg 3420
tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac cgtgtggtca 3480
gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag tgcaaggtct 3540
ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa gggcagcccc 3600
gagaaccaca ggtgtacacc ctgcctccat cccgcgatga gctgaccaag aaccaggtca 3660
gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag tgggagagca 3720
atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc gacggctcct 3780
tcttcctcta tagcaagctc accgtggaca agagcaggtg gcagcagggg aacgtcttct 3840
catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc ctctccctgt 3900
ctcctgggaa atgatgagat ctatcgataa tcaacctctg gattacaaaa tttgtgaaag 3960
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 4020
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 4080
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 4140
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 4200
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 4260
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 4320
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 4380
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 4440
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 4500
ttgggccgcc tccccgcatc gattactaat cagccatacc acatttgtag aggttttact 4560
tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt 4620
tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 4680
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 4740
tgtatcttat catgtctgga attcggacgg tgactgcagt gaataataaa atgtgtgttt 4800
gtccgaaata cgcgttttga gatttctgtc gccgactaaa ttcatgtcgc gcgatagtgg 4860
tgtttatcgc cgatagagat ggcgatattg gaaaaatcga tatttgaaaa tatggcatat 4920
tgaaaatgtc gccgatgtga gtttctgtgt aactgatatc gccatttttc caaaagtgat 4980
ttttgggcat acgcgatatc tggcgatagc gcttatatcg tttacggggg atggcgatag 5040
acgactttgg tgacttgggc gattctgtgt gtcgcaaata tcgcagtttc gatataggtg 5100
acagacgata tgaggctata tcgccgatag aggcgacatc aagctggcac atggccaatg 5160
catatcgatc tatacattga atcaatattg gccattagcc atattattca ttggttatat 5220
agcataaatc aatattggct attggccatt gcatacgttg tatccatatc ataatatgta 5280
catttatatt ggctcatgtc caacattacc gccatgttga cattgattat tgactagtta 5340
ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac 5400
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 5460
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 5520
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 5580
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 5640
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt 5700
gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc 5760
aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt 5820
tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg 5880
ggaggtctat ataagcagag ctcgtttagt gaaccggatc cttaaccgtg aaagcttgcc 5940
gccaccatga tgtcctttgt ctctctgctc ctggttggca tcctattcca tgccacccag 6000
gccgagatcg tgctgaccca gtcccccggc accctgtccc tgtcccccgg cgagcgggcc 6060
accctgtcct gccgggcctc ccagtccgtg ggctcctcct acctggcctg gtaccagcag 6120
aagcccggcc aggccccccg gctgctgatc tacggcgcct tctcccgcgc caccggcatc 6180
cccgaccggt tctccggctc cggctccggc accgacttca ccctgaccat ctcccggctg 6240
gagcccgagg acttcgccgt gtactactgc cagcagtacg gctcctcccc ctggaccttc 6300
ggccagggca ccaaggtgga gatcaagcga actgtggctg caccatctgt cttcatcttc 6360
ccgccatctg atgagcagct taagtccgga actgctagcg ttgtgtgcct gctgaataac 6420
ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca atcgggtaac 6480
tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct cagcagcacc 6540
ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga agtcacccat 6600
cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta gtgagatctc 6660
gagttcgaca tcgataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 6720
cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 6780
gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct 6840
ctttatgagg agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct 6900
gacgcaaccc ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc 6960
gctttccccc tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 7020
acaggggctc ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc 7080
tttccttggc tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac 7140
gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg 7200
cctcttccgc gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc 7260
ccgcatcgat gggggaggct aactgaaaca cggaaggaga caataccgga aggaacccgc 7320
gctatgacgg caataaaaag acagaataaa acgcacgggt gttgggtcgt ttgttcataa 7380
acgcggggtt cggtcccagg gctggcactc tgtcgatacc ccaccgagac cccattgggg 7440
ccaatacgcc cgcgtttctt ccttttcccc accccacccc ccaagttcgg gtgaaggccc 7500
agggctcgca gccaacgtcg gggcggcagg ccctgccata gccctagcag cttggccgta 7560
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 7620
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 7680
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 7740
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 7800
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 7860
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 7920
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 7980
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8040
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 8100
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 8160
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 8220
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 8280
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 8340
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 8400
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 8460
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 8520
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 8580
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 8640
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga caatctaaag tatatatgag 8700
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 8760
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 8820
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 8880
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 8940
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 9000
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 9060
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 9120
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 9180
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 9240
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 9300
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 9360
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 9420
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 9480
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 9540
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 9600
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 9660
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 9720
accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtc 9778
<210> 12
<211> 9788
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 12
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420
acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480
tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540
gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600
gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660
ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720
acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780
ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840
actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900
ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960
ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020
ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080
acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140
gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200
acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260
tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320
cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380
tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440
atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500
agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560
acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620
acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680
ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740
cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800
ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860
ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920
caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980
cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040
ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100
atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160
attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220
gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280
gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340
gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400
taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460
cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520
ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggccgag atcgtgctga 2580
cccagtcccc cggcaccctg tccctgtccc ccggcgagcg ggccaccctg tcctgccggg 2640
cctcccagtc cgtgggctcc tcctacctgg cctggtacca gcagaagccc ggccaggccc 2700
cccggctgct gatctacggc gccttctccc gcgccaccgg catccccgac cggttctccg 2760
gctccggctc cggcaccgac ttcaccctga ccatctcccg gctggagccc gaggacttcg 2820
ccgtgtacta ctgccagcag tacggctcct ccccctggac cttcggccag ggcaccaagg 2880
tggagatcaa gcgaactgtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc 2940
agcttaagtc cggaactgct agcgttgtgt gcctgctgaa taacttctat cccagagagg 3000
ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca 3060
cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag 3120
cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc 3180
ccgtcacaaa gagcttcaac aggggagagt gttagtgaga tctatcgata atcaacctct 3240
ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 3300
atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 3360
tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt 3420
caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat 3480
tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc 3540
ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 3600
caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc 3660
cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga 3720
ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc 3780
tcagacgagt cggatctccc tttgggccgc ctccccgcat cgattactaa tcagccatac 3840
cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 3900
acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 3960
ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 4020
tggtttgtcc aaactcatca atgtatctta tcatgtctgg aattcggacg gtgactgcag 4080
tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg agatttctgt cgccgactaa 4140
attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga tggcgatatt ggaaaaatcg 4200
atatttgaaa atatggcata ttgaaaatgt cgccgatgtg agtttctgtg taactgatat 4260
cgccattttt ccaaaagtga tttttgggca tacgcgatat ctggcgatag cgcttatatc 4320
gtttacgggg gatggcgata gacgactttg gtgacttggg cgattctgtg tgtcgcaaat 4380
atcgcagttt cgatataggt gacagacgat atgaggctat atcgccgata gaggcgacat 4440
caagctggca catggccaat gcatatcgat ctatacattg aatcaatatt ggccattagc 4500
catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 4560
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 4620
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 4680
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 4740
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 4800
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 4860
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 4920
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 4980
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 5040
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 5100
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 5160
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccggat 5220
ccttaaccgt gaaagcttgc cgccaccatg atgtcctttg tctctctgct cctggttggc 5280
atcctattcc atgccaccca ggcccaggtg cagctggtgg agtccggcgg cggcgtcgtg 5340
cagcccggcc ggtccctgcg gctgtcctgc gccgcctccg gcttcacctt ctcctcctac 5400
accatgcact gggtgcggca ggcccccggc aagggcctgg agtgggtgac tttcatctcc 5460
tacgacggca acaacaagta ctacgccgac tccgtgaagg gccggttcac catctcccgc 5520
gacaactcca agaacaccct gtacctgcag atgaactccc tgcgggccga ggacaccgcc 5580
atctactact gcgcccggac cggctggctg ggccccttcg actactgggg ccagggcacc 5640
ctggtgaccg tgtcctccgc ctccaccaag ggcccatcgg tcttccccct ggcaccctct 5700
agcaagagca cctctggggg cacagcggcc ctgggctgcc tggtcaagga ctacttcccc 5760
gaaccggtga cggtgtcgtg gaactcaggc gccctgacca gcggcgtgca caccttcccg 5820
gctgtcctac agtcctcagg actctactcc ctcagcagcg tggtgaccgt gccctccagc 5880
agcttgggca cccagaccta catctgcaac gtgaatcaca agcccagcaa caccaaggtg 5940
gacaagcggg ttgagcccaa atcttgtgac aaaactcaca catgcccacc gtgcccagca 6000
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 6060
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 6120
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 6180
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 6240
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 6300
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 6360
cctccatccc gcgatgagct gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 6420
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 6480
aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctatag caagctcacc 6540
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 6600
ctgcacaacc actacacgca gaagagcctc tccctgtctc ctgggaaatg atgagatctc 6660
gagttcgaca tcgataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 6720
cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 6780
gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct 6840
ctttatgagg agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct 6900
gacgcaaccc ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc 6960
gctttccccc tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 7020
acaggggctc ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc 7080
tttccttggc tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac 7140
gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg 7200
cctcttccgc gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc 7260
ccgcatcgat gggggaggct aactgaaaca cggaaggaga caataccgga aggaacccgc 7320
gctatgacgg caataaaaag acagaataaa acgcacgggt gttgggtcgt ttgttcataa 7380
acgcggggtt cggtcccagg gctggcactc tgtcgatacc ccaccgagac cccattgggg 7440
ccaatacgcc cgcgtttctt ccttttcccc accccacccc ccaagttcgg gtgaaggccc 7500
agggctcgca gccaacgtcg gggcggcagg ccctgccata gccctagcag cttggccgta 7560
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 7620
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 7680
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 7740
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 7800
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 7860
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 7920
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 7980
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8040
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 8100
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 8160
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 8220
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 8280
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 8340
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 8400
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 8460
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 8520
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 8580
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 8640
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 8700
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 8760
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 8820
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 8880
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 8940
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9000
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9060
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 9120
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 9180
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 9240
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 9300
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 9360
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 9420
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 9480
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 9540
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 9600
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 9660
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 9720
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 9780
ctttcgtc 9788

Claims (99)

1.一种用于表达目的蛋白的核酸构建体,包括以下5'至3'顺序的可操作的联接的元件:
任选地,第一启动子序列;
选择标记序列;
第二启动子序列;
编码第一目的蛋白的核酸序列,其可操作地连接至所述第二启动子序列;和
多聚A信号序列;
所述核酸构建体进一步包括在选自由以下组成的组中的一个或多个位置处的至少一个插入元件:5'至任选的第一启动子或选择标记序列、3'至所述多聚A信号序列、在所述任选的第一启动子和所述多聚A信号序列之间、在所述选择标记和所述第二启动子序列之间、以及5'至所述任选的第一启动子序列或所述选择标记序列和3'至所述多聚A信号序列二者。
2.根据权利要求1所述的核酸构建体,其中,所述核酸构建体不包括在所述选择标记和所述第二启动子之间的多聚A信号序列。
3.根据权利要求1至2中任一项所述的核酸构建体,其中,所述选择标记邻近所述第二启动子。
4.根据权利要求1至3中任一项所述的核酸构建体,其中,所述第二启动子邻近所述编码所述第一目的蛋白的核酸序列。
5.根据权利要求1至4中任一项所述的核酸构建体,其中,所述核酸构建体包括在所述第一启动子和所述选择标记之间的延伸包装区。
6.根据权利要求5所述的核酸构建体,其中,所述EPR包括多个潜在的Kozak序列和/或ATG翻译起始位点。
7.根据权利要求1至6中任一项所述的核酸构建体,其中,所述第一启动子序列是弱启动子序列。
8.根据权利要求1至7中任一项所述的核酸构建体,其中,所述第一启动子序列选自由以下组成的组:SIN-LTR、SV40、大肠杆菌lac、大肠杆菌trp、噬菌体λPL、噬菌体λPR、T3、T7、巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、α-乳清蛋白、人延伸因子1α(hEF1α)和小鼠金属硫蛋白-I启动子序列。
9.根据权利要求1至8中任一项所述的核酸构建体,其中,所述第一启动子序列不是逆转录病毒LTR启动子。
10.根据权利要求1至9中任一项所述的核酸构建体,其中,所述选择标记序列是选自由谷氨酰胺合酶(GS)序列和二氢叶酸还原酶(DHFR)序列组成的组的可扩增的选择标记序列。
11.根据权利要求1至10中任一项所述的核酸构建体,其中,所述选择标记序列是选自由新霉素抗性基因(neo)、潮霉素B磷酸转移酶基因和嘌呤霉素N-乙酰转移酶基因序列组成的组的抗生素抗性标志物序列。
12.根据权利要求1至11中任一项所述的核酸构建体,其中,所述第二启动子序列选自由以下组成的组:SV40、大肠杆菌lac、大肠杆菌trp、噬菌体λPL、噬菌体λPR、T3、T7、巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、α-乳清蛋白、人延伸因子1α(hEF1α)和小鼠金属硫蛋白-I启动子序列。
13.根据权利要求1至12中任一项所述的核酸构建体,其中,编码目的蛋白的核酸序列编码选自由重链和轻链免疫球蛋白序列组成的组的蛋白质。
14.根据权利要求1至13中任一项所述的核酸构建体,其中,所述插入元件选自由转座子插入元件、重组酶插入元件和HDR插入元件组成的组。
15.根据权利要求14所述的核酸构建体,其中,所述转座子插入元件是末端反向重复。
16.根据权利要求15所述的核酸构建体,其中,所述构建体包括定位在5'至所述第一启动子和3'至所述多聚A信号序列的两个末端反向重复。
17.根据权利要求14所述的核酸构建体,其中,所述重组酶插入元件是附着位点(att)。
18.根据权利要求17所述的核酸构建体,其中,所述附着位点(att)是attB。
19.根据权利要求14所述的核酸构建体,其中,所述HDR插入元件包括AAVS1安全港基因座序列。
20.根据权利要求14所述的核酸构建体,其中,所述HDR插入元件是与染色体中靶位点同源的核酸序列。
21.根据权利要求20所述的核酸构建体,其中,所述与染色体中靶位点同源的核酸序列的长度为约30至1000个碱基。
22.根据权利要求21所述的核酸构建体,其中,所述构建体包括定位在5'至所述第一启动子和3'至所述多聚A信号序列的与染色体中靶位点同源的两个核酸序列。
23.根据权利要求14所述的核酸构建体,其中,所述重组酶插入元件是Flp重组靶(FRT)位点。
24.根据权利要求14所述的核酸构建体,其中,所述重组酶插入元件是LoxP序列。
25.根据权利要求1至24中任一项所述的核酸构建体,进一步包括RNA输出元件。
26.根据权利要求25所述的核酸构建体,其中,所述RNA输出元件位于3'或5'至所述编码所述目的蛋白的核酸序列。
27.根据权利要求26所述的核酸构建体,其中,所述RNA输出元件是前mRNA加工增强子(PPE)。
28.根据权利要求26所述的核酸构建体,其中,所述RNA输出元件是转录后调节元件(PRE)。
29.根据权利要求28所述的核酸构建体,其中,所述PRE RNA输出元件是土拨鼠肝炎病毒转录后调节元件(WPRE)。
30.根据权利要求1至29中任一项所述的核酸构建体,进一步包括可操作地连接至所述第一目的蛋白的信号肽序列。
31.根据权利要求1至30中任一项所述的核酸构建体,其中,所述信号肽序列选自由以下组成的组:组织纤溶酶原激活物、人生长激素、乳铁蛋白、α-酪蛋白和α-乳清蛋白信号肽序列。
32.根据权利要求1至31中任一项所述的核酸构建体,进一步包括蛋白质纯化标志物序列。
33.根据权利要求32所述的核酸构建体,其中,所述蛋白质纯化标志物序列是六组氨酸标签或血凝素(HA)标签。
34.根据权利要求1至33中任一项所述的核酸构建体,进一步包括内部核糖体进入位点(IRES)序列和定位在3'至所述编码第一目的蛋白的核酸序列的编码第二目的蛋白的第二核酸序列。
35.根据权利要求34所述的核酸构建体,其中,所述IRES序列选自由口蹄疫病毒(FDV)、脑心肌炎病毒和脊髓灰质炎病毒IRES序列组成的组。
36.根据权利要求1至33中任一项所述的核酸构建体,其中,所述核酸构建体进一步包括可操作地连接至编码第二目的蛋白的第二核酸序列的第三启动子,所述第二核酸序列定位在3'至所述编码所述第一目的蛋白的核酸序列。
37.根据权利要求36所述的核酸构建体,进一步包括与所述编码第二目的蛋白的第二核酸序列可操作地联接的RNA输出元件。
38.根据权利要求36所述的核酸构建体,进一步包括与所述编码第二目的蛋白的第二核酸序列可操作的联接的多聚A信号序列。
39.根据权利要求36至38中任一项所述的核酸构建体,其中,所述第一目的蛋白是抗体重链或轻链中的一个,并且所述第二目的蛋白是抗体重链或轻链中的另一个。
40.根据权利要求1至33中任一项所述的核酸构建体,其中,所述核酸构建体进一步包括可操作地连接至编码第二目的蛋白的第二核酸序列的内含子,所述第二核酸序列定位在3'至所述编码所述第一目的蛋白的核酸序列。
41.根据权利要求40所述的核酸构建体,进一步包括与所述编码第二目的蛋白的第二核酸序列可操作的联接的RNA输出元件。
42.根据权利要求40所述的核酸构建体,进一步包括与所述编码第二目的蛋白的第二核酸序列可操作的联接的多聚A信号序列。
43.根据权利要求40至42中任一项所述的核酸构建体,其中,所述第一目的蛋白是抗体重链或轻链中的一个,并且所述第二目的蛋白是抗体重链或轻链中的另一个。
44.一种包括根据权利要求1至43中任一项所述的核酸构建体的质粒。
45.一种包括根据权利要求1至43中任一项所述的核酸构建体的宿主细胞。
46.根据权利要求45所述的宿主细胞,其中,所述宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞、CAP细胞、牛乳腺上皮细胞、由SV40转化的猴肾CV1系、幼仓鼠肾细胞、小鼠支持细胞、猴肾细胞、非洲绿猴肾细胞、人宫颈癌细胞、犬肾细胞、水牛大鼠肝细胞、人肺细胞、人肝细胞、小鼠乳腺肿瘤、TRI细胞、MRC 5细胞、FS4细胞、大鼠成纤维细胞、MDBK细胞和人肝癌细胞系细胞。
47.根据权利要求45至46中任一项所述的宿主细胞,其中,所述宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞和CAP细胞。
48.根据权利要求45至46中任一项所述的宿主细胞,其中,所述宿主细胞系是GS敲除细胞系。
49.根据权利要求45至47中任一项所述的宿主细胞系,其中,所述宿主细胞系是DHFR敲除细胞系。
50.根据权利要求45至49中任一项所述的宿主细胞,其中,所述宿主细胞包括约1至1000个拷贝的所述核酸构建体。
51.根据权利要求45至49中任一项所述的宿主细胞,其中,所述宿主细胞包括约10至200个拷贝的所述核酸构建体。
52.根据权利要求45至49中任一项所述的宿主细胞,其中,所述宿主细胞包括约10至100个拷贝的所述核酸构建体。
53.根据权利要求45至49中任一项所述的宿主细胞,其中,所述宿主细胞包括约20至100个拷贝的所述核酸构建体。
54.根据权利要求45至53中任一项所述的宿主细胞,其中,所述宿主细胞进一步包括至少第二核酸构建体,所述第二核酸构建体编码并允许表达第二目的蛋白,并且其中所述第二核酸构建体不包括选择标记。
55.根据权利要求45至53中任一项所述的宿主细胞,其中,所述宿主细胞进一步包括至少第二核酸构建体,所述第二核酸构建体编码并允许表达第二目的蛋白,并且其中所述第二核酸构建体包括与所述第一核酸构建体中的所述选择标记不同的选择标记。
56.根据权利要求54至55中任一项所述的宿主细胞,其中所述第一核酸构建体中的所述第一目的蛋白是免疫球蛋白重链或轻链中的一种,并且所述第二核酸构建体中的所述第二蛋白质是免疫球蛋白重链或轻链中的另一种。
57.根据权利要求56所述的宿主细胞,其中所述第一目的蛋白是免疫球蛋白重链,并且所述第二目的蛋白是免疫球蛋白轻链。
58.根据权利要求54至57中任一项所述的宿主细胞,其中,所述宿主细胞包括约1至1000个拷贝的所述第二核酸构建体。
59.根据权利要求54至57中任一项所述的宿主细胞,其中,所述宿主细胞包括约10至200个拷贝的所述第二核酸构建体。
60.根据权利要求54至57中任一项所述的宿主细胞,其中,所述宿主细胞包括约10至100个拷贝的所述第二核酸构建体。
61.根据权利要求54至57中任一项所述的宿主细胞,其中,所述宿主细胞包括约20至100个拷贝的所述第二核酸构建体。
62.一种包括根据权利要求45至61中任一项所述的宿主细胞的宿主细胞培养物。
63.一种用于生产目的蛋白的方法,包括培养根据权利要求45至61中任一项所述的宿主细胞并从所述宿主细胞培养物中纯化所述目的蛋白。
64.根据权利要求63所述的方法,其中,所述宿主细胞在包括所述选择标记的抑制剂的培养基中生长。
65.根据权利要求64所述的方法,其中,所述选择标记是GS并且所述抑制剂是草丁膦或甲硫氨酸氨基亚砜(Msx)。
66.根据权利要求64所述的方法,其中,所述选择标记是DHFR并且所述抑制剂是氨甲蝶呤。
67.一种包括根据权利要求1至43中任一项所述的核酸构建体的载体。
68.根据权利要求67所述的载体,其中,所述载体选自由质粒载体、逆转录病毒载体、慢病毒载体、AAV载体和转座子载体组成的组。
69.一种系统,包括:
根据权利要求1至30中任一项所述的第一核酸构建体;以及
编码酶的第二核酸构建体。
70.根据权利要求69所述的系统,其中,所述酶选自由转座酶、整合酶、重组酶、核酸酶和切口酶组成的组。
71.根据权利要求70所述的系统,其中,所述核酸酶是Cas核酸酶。
72.根据权利要求70所述的系统,其中,所述切口酶是Cas切口酶。
73.根据权利要求71至72中任一项所述的系统,进一步包括一个或多个RNA指导序列。
74.根据权利要求69至73中任一项所述的系统,其中,所述酶促进所述核酸构建体或其部分插入到宿主细胞的基因组中。
75.根据权利要求69至74中任一项所述的系统,其中,所述第一核酸构建体和第二核酸构建体在单独的载体中提供。
76.根据权利要求69至74中任一项所述的系统,其中,所述第一核酸构建体和第二核酸构建体在相同的载体中提供。
77.根据权利要求69至76中任一项所述的系统,进一步包括至少根据权利要求1至43所述的第三核酸构建体,所述第三核酸构建体编码与所述第一核酸构建体中的目的蛋白不同的目的蛋白。
78.根据权利要求77所述的系统,其中,所述第三核酸构建体在单独的载体中提供。
79.根据权利要求77所述的系统,其中,所述第三核酸构建体在与所述第一核酸构建体和第二核酸构建体相同的载体中提供。
80.一种系统,包括:
根据权利要求1至35中任一项所述的第一核酸构建体和第二核酸构建体,其中,所述第一核酸构建体和第二核酸构建体各自编码不同的目的蛋白。
81.根据权利要求80所述的系统,其中,所述第一核酸构建体和第二核酸构建体在单独的载体中提供。
82.根据权利要求80所述的系统,其中,所述第一核酸构建体和第二核酸构建体在相同的载体中提供。
83.根据权利要求80至82中任一项所述的系统,进一步包括编码酶的第三核酸构建体。
84.根据权利要求83所述的系统,其中,所述酶选自由转座酶、整合酶、重组酶、核酸酶和切口酶组成的组。
85.根据权利要求84所述的系统,其中,所述核酸酶是Cas核酸酶。
86.根据权利要求84所述的系统,其中,所述切口酶是Cas切口酶。
87.根据权利要求85至86中任一项所述的系统,进一步包括一个或多个RNA指导序列。
88.根据权利要求83至87中任一项所述的系统,其中,所述酶促进所述核酸构建体或其部分插入到宿主细胞的基因组中。
89.根据权利要求83至87中任一项所述的系统,其中,所述第三核酸构建体在单独的载体中提供。
90.根据权利要求83至87中任一项所述的系统,其中,所述第三核酸构建体在与所述第一核酸构建体和第二核酸构建体相同的载体中提供。
91.一种用于生产目的蛋白的方法,包括:
在使得核酸构建体掺入宿主细胞的基因组中的条件下将根据权利要求1至43中任一项所述的核酸构建体、根据权利要求67至68中任一项所述的载体、根据权利要求69至90中任一项所述的系统导入所述宿主细胞中;
发展表达所述目的蛋白的宿主细胞系;
在使得所述目的蛋白由所述宿主细胞产生的条件下培养来自所述宿主细胞系的宿主细胞;以及
从所述宿主细胞培养物中纯化所述目的蛋白。
92.根据权利要求91所述的方法,其中,所述宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞、CAP细胞、牛乳腺上皮细胞、由SV40转化的猴肾CV1系、幼仓鼠肾细胞、小鼠支持细胞、猴肾细胞、非洲绿猴肾细胞、人宫颈癌细胞、犬肾细胞、水牛大鼠肝细胞、人肺细胞、人肝细胞、小鼠乳腺肿瘤、TRI细胞、MRC 5细胞、FS4细胞、大鼠成纤维细胞、MDBK细胞和人肝癌细胞系细胞。
93.根据权利要求92所述的方法,其中,所述宿主细胞选自由以下组成的组:中国仓鼠卵巢(CHO)细胞、HEK 293细胞和CAP细胞。
94.根据权利要求91至93中任一项所述的方法,其中,所述宿主细胞系是GS敲除细胞系。
95.根据权利要求91至93中任一项所述的方法,其中,所述宿主细胞系是DHFR敲除细胞系。
96.根据权利要求91至95中任一项所述的方法,其中,所述宿主细胞在包括选择标记的抑制剂的培养基中生长。
97.根据权利要求96所述的方法,其中,所述选择标记是GS并且所述抑制剂是草丁膦或甲硫氨酸氨基亚砜(Msx)。
98.根据权利要求96所述的方法,其中,所述选择标记是DHFR并且所述抑制剂是氨甲蝶呤。
99.根据权利要求91至98中任一项所述的方法,其中,在使得所述目的蛋白由宿主细胞产生的条件下从所述宿主细胞系培养宿主细胞进一步包括在选自由培养皿、孔板、滚瓶、生物反应器、灌注系统和补料分批培养物组成的组的系统中培养。
CN202180046877.2A 2020-06-02 2021-06-02 用于蛋白质制造的核酸构建体 Pending CN115803440A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063033516P 2020-06-02 2020-06-02
US202063033514P 2020-06-02 2020-06-02
US63/033,516 2020-06-02
US63/033,514 2020-06-02
PCT/US2021/035404 WO2021247672A1 (en) 2020-06-02 2021-06-02 Nucleic acid constructs for protein manufacture

Publications (1)

Publication Number Publication Date
CN115803440A true CN115803440A (zh) 2023-03-14

Family

ID=78830554

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180046877.2A Pending CN115803440A (zh) 2020-06-02 2021-06-02 用于蛋白质制造的核酸构建体
CN202180059914.3A Pending CN116134136A (zh) 2020-06-02 2021-06-02 具有多个用于基因插入的Dock的细胞系

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180059914.3A Pending CN116134136A (zh) 2020-06-02 2021-06-02 具有多个用于基因插入的Dock的细胞系

Country Status (10)

Country Link
US (2) US20230227858A1 (zh)
EP (2) EP4158042A1 (zh)
JP (2) JP2023529376A (zh)
KR (2) KR20230021676A (zh)
CN (2) CN115803440A (zh)
AU (2) AU2021284288A1 (zh)
BR (2) BR112022024644A2 (zh)
CA (2) CA3180705A1 (zh)
MX (2) MX2022015208A (zh)
WO (2) WO2021247672A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113039270A (zh) * 2018-12-04 2021-06-25 康泰伦特药物解决方案有限责任公司 用于蛋白质制造的载体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6897066B1 (en) * 1997-09-26 2005-05-24 Athersys, Inc. Compositions and methods for non-targeted activation of endogenous genes
CN111647627A (zh) * 2014-04-28 2020-09-11 重组股份有限公司 多重基因编辑
AU2017250683A1 (en) * 2016-04-14 2018-11-01 Boco Silicon Valley, Inc. Genome editing of human neural stem cells using nucleases

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113039270A (zh) * 2018-12-04 2021-06-25 康泰伦特药物解决方案有限责任公司 用于蛋白质制造的载体

Also Published As

Publication number Publication date
CA3180217A1 (en) 2021-12-09
MX2022015202A (es) 2023-02-15
WO2021247671A3 (en) 2022-01-06
JP2023529376A (ja) 2023-07-10
EP4158041A2 (en) 2023-04-05
WO2021247671A2 (en) 2021-12-09
BR112022024625A2 (pt) 2023-02-23
KR20230021676A (ko) 2023-02-14
CA3180705A1 (en) 2021-12-09
CN116134136A (zh) 2023-05-16
US20230227858A1 (en) 2023-07-20
KR20230019156A (ko) 2023-02-07
BR112022024644A2 (pt) 2023-02-23
MX2022015208A (es) 2023-02-15
US20230212590A1 (en) 2023-07-06
JP2023528475A (ja) 2023-07-04
AU2021284288A1 (en) 2023-01-05
WO2021247672A1 (en) 2021-12-09
AU2021283272A1 (en) 2023-01-19
EP4158042A1 (en) 2023-04-05

Similar Documents

Publication Publication Date Title
AU2019203955B2 (en) Multipartite signaling proteins and uses thereof
ES2819976T3 (es) Composiciones y usos médicos para la reprogramación de TCR con proteínas de fusión
KR102319845B1 (ko) 조류 숙주 세포에 대한 crispr-cas 시스템
KR20210056329A (ko) 신규 cas12b 효소 및 시스템
US20030119104A1 (en) Chromosome-based platforms
CN101595228A (zh) 包括sorf构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法
US20050251872A1 (en) Lentiviral vectors, related reagents, and methods of use thereof
JP2024037917A (ja) 組換えt細胞受容体遺伝子を用いて細胞ベースの治療薬を製造するための技法
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
CN113396222A (zh) 腺相关病毒(aav)生产细胞系和相关方法
KR20160002880A (ko) 엔도솜 포집을 극복하기 위해 설계된 인공 전사 인자
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
WO2021050948A1 (en) Compositions and methods for tcr reprogramming using fusion proteins
KR20230010231A (ko) 생체내 형질도입을 위한 벡터 및 방법
KR20230019063A (ko) C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터
KR20240037185A (ko) 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도
KR20230021676A (ko) 단백질 제조를 위한 핵산 구조체
KR20070114761A (ko) Siv­pedf 벡터를 사용한 안조직 세포에 있어서의아포토시스 변성을 동반하는 질환의 치료제
KR20160003691A (ko) Opa1 단상부족에 의해 원인이 되는 질병 치료를 위한 인공전사인자
CN101160139A (zh) 含有pedf以及fgf2的伴随眼组织细胞凋亡变性的疾患的治疗药物
KR20240021906A (ko) 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법
KR20230117327A (ko) 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터
DK2921048T3 (en) SUS SCROFA V2G: SAFE HARBOR PLACE FOR LONG-TERM EXPRESSION AND HIGH INTEGRATION OF TRANSGENERS IN A PIG
CA2522166C (en) Lambda integrase mutein for use in recombination
Class et al. Patent application title: COMPOSITIONS AND METHODS OF USE THEREOF FOR IDENTIFYING ANTI-VIRAL AGENTS Inventors: Leor S. Weinberger (San Francisco, CA, US)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination