CN111902540A - 用于中国仓鼠卵巢细胞基因工程改造的htp平台 - Google Patents

用于中国仓鼠卵巢细胞基因工程改造的htp平台 Download PDF

Info

Publication number
CN111902540A
CN111902540A CN201980019507.2A CN201980019507A CN111902540A CN 111902540 A CN111902540 A CN 111902540A CN 201980019507 A CN201980019507 A CN 201980019507A CN 111902540 A CN111902540 A CN 111902540A
Authority
CN
China
Prior art keywords
promoter
host cell
leu
gene
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980019507.2A
Other languages
English (en)
Inventor
K·卡夫
A·辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zymergen Inc
Original Assignee
Zymergen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zymergen Inc filed Critical Zymergen Inc
Publication of CN111902540A publication Critical patent/CN111902540A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Ecology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文提出一种用于改良中国仓鼠卵巢CHO细胞中的治疗蛋白的产生的高通量(HTP)基因组工程改造平台。所公开的HTP基因组工程改造平台以计算方式驱动并且整合分子生物学、自动化和先进机器学习方案。所述平台使用一套独特的HTP基因工程改造工具来探索与治疗蛋白产生路径相关的基因组全景,以便阐明生物驱动因素并且理清负责优化CHO细胞中的治疗蛋白产生的非特征基因架构。

Description

用于中国仓鼠卵巢细胞基因工程改造的HTP平台
相关申请案的交叉参考
本申请案主张2018年3月20日申请的第62/645,708号美国临时申请案的优先权,所述申请案在此以全文引用的方式并入。
关于序列表的表述
以文本格式代替纸本拷贝提供与本申请案相关的序列表,并且在此以引用的方式并入本说明书中。含有序列表的文本文件的名称是:ZYMR_024_01WO_SeqList_ST25.txt。文本文件为约98KB,在2019年3月20日创建,并且通过EFS-Web以电子方式提交。
技术领域
本公开涉及用于改良CHO细胞中治疗蛋白的产生的高通量(HTP)基因组工程改造平台。所公开的HTP基因组工程改造平台由计算机驱动并且整合分子生物学、自动化和先进机器学习方案。
背景技术
中国仓鼠卵巢(Chinese hamster ovary;CHO)细胞代表用于重组蛋白治疗剂的工业制造的最频繁应用的宿主细胞系统。CHO细胞能够生产以克量展现类人类翻译后修改的高品质生物制品。鉴于此,CHO细胞中产生的治疗蛋白需求量极高并不出人意料。因此,为了满足对有效、安全和可负担的起的蛋白质治疗剂的不断增长的需求,数十年来一直致力于使CHO细胞中产生的重组蛋白的量和品质最大化。
然而,使用CHO细胞的生物医药的生产方法仍遭受细胞限制,例如生长受限、低生产率和抗应激性,以及与基于细菌或酵母的表达系统相比,更高的费用。最近,细胞工程改造努力具有改良的产物效价;然而,非特征细胞过程和基因调节机制仍妨碍细胞生长、比生产率和蛋白质品质。
因此,在所属领域中迫切需要将CHO细胞工程改造以用于生产人类治疗蛋白的新方法。
确切地说,迫切需要工程改造CHO细胞的方法,其能够阐明蛋白质生产的生物驱动因素并且理清妨碍细胞生长、比生产率和蛋白质品质的非特征细胞过程和基因调节机制。
发明内容
本公开涉及用于改良CHO细胞中治疗蛋白的产生的高通量(HTP)基因组工程改造平台。
本文所描述的CHO细胞基因组工程改造平台是基于HTP基因工程改造工具集,其并不依赖于潜在基因病因关系的知识。因此,所教示的平台能够以基因上不可知的方式探索CHO基因组前景,以便发现负责驱动治疗蛋白产生的关键路径的潜在基因架构。
在特定方面,本公开教示一种HTP启动子交换基因组工程改造工具,其适用于探索与治疗抗体产生相关的基因路径。HTP启动子交换工具允许对细胞路径基因的系统性扰动,其使得人们能够确定此类扰动对所关注的基因(例如治疗蛋白,如抗体)具有的影响。这种HTP分子工具可以与先进机器学习方案和HTP细胞构建工厂平台联接,其将实现用于抗体生产的更佳CHO细胞系的制造。
HTP启动子交换工具的通用性提供基因组工程师扰动和研究CHO细胞路径并且鉴别特定基因对治疗蛋白产生的影响的系统性方式。
从利用HTP启动子交换基因组工程改造工具,在各种“组学”路径中获得的数据将实现较大基因组信息库的开发,所述数据接着可以用于在先进机器学习模型中以理解最可能导致更好的CHO细胞治疗蛋白产生的基因扰动。这种信息可以与新兴的基因组编辑技术一起使用以合理地工程改造CHO细胞以进一步控制许多生物制品的量、品质和可负担性。
因此,所教示的平台利用合理和不可知的方法来工程改造更好执行的CHO细胞。作为一个实例,HTP启动子交换基因组工程改造工具可以首先在被认为最可能有助于所需治疗蛋白产生特征的路径内使用。从此类“合理改良”活动中获得的信息可以存储于基因数据库中,所述基因数据库接着形成用于先进机器学习方案的训练数据集的基础。将使用这些机器学习算法来预测可能对扰动重要的未来目标基因,并且所述未来目标基因不能使用纯粹合理设计的改良活动来确定。
此外,HTP启动子交换基因组工程改造工具可以初始“基因路径不可知方式”使用,其中认为与治疗蛋白产生不相关的基因受到扰动。这种信息,如从前述合理改良活动获得的基因信息,可以存储在数据库中并用于训练机器学习算法。
在实施例中,本公开的HTP基因组工程改造方法不需要先验基因知识来实现宿主细胞性能的显著增加。实际上,本公开教示了通过若干功能上不可知的方法产生多样性池的方法,其包括:鉴别预先存在的宿主细胞变异体中的基因多样性(例如测序CHO细胞系的基因组之间的比较);以及用启动子交换工具随机地靶向基因,而不偏好“已知路径”基因,以便以随机方式有效地“探索”基因组空间。
然而,在一些实施例中,本公开还教示了设计基因多样性的假设驱动型方法,所述多样性将用于下游HTP工程改造。也就是说,在一些实施例中,本公开教示了所选基因改变的定向设计。
在一实施例中,提供一种用于改良免疫球蛋白表达的HTP方法,其包含:a)提供针对宿主细胞具有内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;b)工程改造宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中每个细胞包含与可操作地连接到目标基因的启动子梯不同的启动子;以及c)针对所关注的免疫球蛋白和/或宿主细胞的表型特征筛选初始启动子交换宿主细胞库的细胞。在另一个实施例中,提供一种用于改良免疫球蛋白表达的HTP方法,其包含:a)提供针对宿主细胞具有内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;b)工程改造宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中多个宿主细胞包含个别宿主细胞,所述个别宿主细胞包含与可操作地连接到目标基因的启动子梯不同的启动子;以及c)针对所关注的免疫球蛋白和/或宿主细胞的表型特征筛选初始启动子交换宿主细胞库的细胞。在实施例中,宿主细胞是哺乳动物细胞、鼠类细胞或中国仓鼠卵巢细胞。在实施例中,目标基因编码具有选自由以下组成的群组的功能的分子:分泌、蛋白质转运、应激、糖基化、细胞凋亡、未折叠蛋白质反应、蛋白质折叠(例如伴侣蛋白)、ER相关的降解和代谢。在实施例中,目标基因编码选自由以下组成的群组的分子:SRP14、SRP9、SRP54、XBP-1、bcl-2、IGF1、COSMC、FUT8、BCL2、BAK、ATF6、PERK、IRE1α、BiP/GRP78(HSP70)、Dnajb9(ERdj4/HSP40)和LDHA。在实施例中,启动子梯包含至少两个选自由以下组成的群组的启动子:CMV、EF1α、SV40、RSV和PGK。在实施例中,启动子梯包含至少两个具有选自由SEQ ID NO 1-5组成的群组的核苷酸序列的启动子。在实施例中,免疫球蛋白选自由以下组成的群组:IgG、IgM、IgA、IgE和IgD。在实施例中,免疫球蛋白选自由以下组成的群组:IgG1、IgG2、IgG3和IgG4。在实施例中,工程改造宿主细胞的基因组包含使用CRISPR兼容的核酸内切酶和相关gRNA来靶向并且裂解目标基因上游的宿主细胞基因组。在一些实施例中,CRISPR兼容的核酸内切酶是选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物、突变体、变异体或经修饰版本。在实施例中,工程改造宿主细胞的基因组包含使用CRIPSR兼容的核酸内切酶和相关gRNA来靶向和裂解目标基因上游的宿主细胞基因组并且通过同源重组从启动子梯插入启动子。在实施例中,针对所关注的免疫球蛋白的表型特征筛选初始启动子交换宿主细胞库的细胞包含确认或表征:所关注的免疫球蛋白的效价、N端裂解和/或糖基化模式。在实施例中,针对宿主细胞的表型特征筛选初始启动子交换宿主细胞库的细胞包含确认或表征:细胞生长、培养期间的细胞存活模式、细胞密度和每天每个细胞产生的免疫球蛋白的细胞比生产率。在实施例中,提供超过一种细胞路径目标基因。在实施例中,重复步骤a)-c)。在实施例中,方法进一步包含:d)提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库。在实施例中,方法进一步包含:d)提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;以及e)针对所关注的免疫球蛋白和/或宿主细胞的表型特征筛选后续启动子交换宿主细胞库的个别宿主细胞。在实施例中,方法进一步包含:d)提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;e)针对所关注的免疫球蛋白和/或宿主细胞的表型特征筛选后续启动子交换宿主细胞库的个别宿主细胞;以及f)将步骤d)-e)重复进行一或多次。在实施例中,提供一种由所教示的方法衍生的宿主细胞群体。
在一些实施例中,提供一种用于改良所关注的产物的表达的HTP方法,其包含:a)提供针对宿主细胞具有内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;b)工程改造宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中每个细胞包含与可操作地连接到目标基因的启动子梯不同的启动子;以及c)针对所关注的产物和/或宿主细胞的表型特征筛选初始启动子交换宿主细胞库的细胞。在实施例中,所关注的产物是蛋白质。在其它实施例中,提供一种用于改良所关注的产物的表达的HTP方法,其包含:a)提供针对宿主细胞具有内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;b)工程改造宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中多个宿主细胞包含个别宿主细胞,所述个别宿主细胞包含与可操作地连接到目标基因的启动子梯不同的启动子;以及c)针对所关注的产物和/或宿主细胞的表型特征筛选初始启动子交换宿主细胞库的细胞。在实施例中,所关注的产物是蛋白质。在实施例中,工程改造宿主细胞的基因组包含使用CRISPR兼容的核酸内切酶和相关gRNA来靶向并且裂解目标基因上游的宿主细胞基因组。在一些实施例中,CRISPR兼容的核酸内切酶是选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cpf1和MAD7或其同源物、直系同源物、突变体、变异体或经修饰版本。在实施例中,所关注的产物是免疫球蛋白。在实施例中,所关注的产物是抗体。在实施例中,所关注的产物是生物分子。在实施例中,所关注的产物是酶。在实施例中,所关注的产物不是蛋白质。
附图说明
图1描绘本公开的自动化系统的一个实施例。本公开教示使用具有各种模块的自动化机器人系统,所述模块能够创建启动子梯、测序和构建DNA、CHO细胞转染、筛选、蛋白质测试/表征,以及CHO细胞克隆选择。
图2示图示了用于CHO细胞改良的本公开的实验室信息管理系统(LIMS)的实施例。
图3图示了本公开的LIMS系统的实施例的云计算实施方案。
图4描绘本公开的迭代预测设计工作流程的实施例。
图5图示了根据本公开实施例的计算机系统的实施例。
图6说明针对已鉴别的基因目标用于进行启动子交换方法的示例性启动子库。用于PRO交换(即启动子交换或PROSWAP)过程中的启动子被描绘为包含P1-P8(P1具有最高表达且P8具有最低表达)的启动子梯。然而,可以使用任何数目的启动子作为启动子梯,只要存在一系列的表达强度即可。P1-P8启动子梯是出于说明的目的以跨越启动子梯传达一系列表达强度的效用。启动子梯可以包含高>中>低的包含三个启动子的梯布置。
图7A、图7B和图7C说明实施HTP启动子交换基因组工程改造工具的各种实施例。使用CRISPR系统(或类似系统)基因编辑方法选择性地切割目标基因周围的DNA区。目标基因上游的启动子通过同源定向修复机制由启动子4替换。启动子替换片匣可以由各种部分组成,所述部分在A-C实施例中论述。图7A-构筑体携带三个标记。标记1在同源区外部并且在靶向整合期间丢失。其用作针对偏离目标整合的负选择/筛选标记。标记2和标记3将在目标基因座处成功整合后保持,并且可以单独地用于筛选(荧光)和选择(抗生素抗性)以用于快速表型分析。图7B-构筑体只携带针对偏离目标整合的负选择/筛选标记。无阳性标记在目标基因座处整合,使得所述标记在给定菌株中依序靶向多个基因。在不存在阳性标记的情况下,可以使用更广泛的基因分型来分离正确整合的克隆。图7C-构筑体类似于图7A中的构筑体,其在两个阳性标记2和3周围具有FRT或LoxP重组位点的附加特点。这些重组位点的存在可以用于选择性地循环出其内的区域。这将允许将这些标记再循环,并且允许在给定菌株中依序工程改造多个目标基因。
图8提供HTP启动子交换基因组工程改造工具之后的目标的说明。HTP工具允许对细胞路径基因的系统性扰动,其使得人们能够确定此类扰动对所关注的基因(例如治疗蛋白,如抗体)具有的影响。这种HTP分子工具可以与先进机器学习方案和HTP细胞构建工厂平台联接,其将实现用于抗体生产的更佳CHO细胞系的制造。
图9说明示例性HTP启动子交换基因组工程改造工具实施例。
图10说明用于探测/扰动与治疗蛋白产生相关的基因组路径的HTP启动子交换基因组工程改造工具的实施例。原始CHO细胞系首先用所关注的基因(GOI),例如抗体转染。一旦获得产生CHO细胞的稳定抗体,就选择编码具有以下八个代表性功能中的每一个的分子的目标基因:(1)分泌/蛋白质转运、(2)应激、(3)糖基化、(4)细胞凋亡、(5)未折叠蛋白质反应、(6)蛋白质折叠(例如伴侣蛋白)、(7)ER相关的降解和(8)代谢。接着,将具有展现不同表达谱的启动子的启动子梯可操作地连接到每个目标基因。在图示中,启动子梯包含三个启动子(例如高、中和低)。因此,对于目标基因中的每一个(总共八个,一个编码每个功能的分子),将CHO细胞系工程改造以将给定启动子可操作地连接到给定目标基因。因此,在示例性图示中,将产生总共24个独特CHO细胞系,其各自具有来自与目标路径基因相关的启动子梯的特定启动子的不同基因构筑,但以其它方式基因上相同。这使得观测到扰动特定路径目标的影响。将通过表征所关注的基因(GOI)(例如抗体)的表达来检查此类启动子扰动对给定路径目标的影响。
具体实施方式
定义
尽管相信所属领域的一般技术人员充分理解以下术语,但仍阐述以下定义以便于对本发明所公开的主题进行解释。
术语“一个(种)(a/an)”是指所述实体中的一或多个,即可以指多个提及物。因此,术语“一个(种)(a/an)”、“一或多个(种)”和“至少一个(种)”在本文中可互换地使用。另外,通过不定冠词“一个(a/an)”提及“一个元件”并不排除存在超过一个元件的可能性,除非上下文明确要求存在一个并且仅存在一个元件。
如本文所使用,术语“细胞生物体”、“微生物体”或“微生物”应该在广泛意义上使用。这些术语可互换地使用并且包括(但不限于)两种原核域:细菌和古细菌,以及某些真核真菌和原生生物。在一些实施例中,本公开是指存在于本公开中的清单/表格和图式中的“微生物体”或“细胞生物体”或“微生物”。这种表征不仅可以指所述表格和图式的已鉴别类属,而且指已鉴别的类种,以及所述表格或图式中的任何生物体的各种新颖和最新鉴别或设计菌株。对于这些术语在本说明书的其它部分(如实例)中的叙述来说,相同表征保持成立。
术语“原核生物”是所属领域公认的并且是指不含细胞核或其它细胞器的细胞。原核生物通常按照两种域(细菌和古细菌)中的一种分类。古细菌和细菌域生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的基本差异。
术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体类别,其典型地发现于异常环境中并且根据若干个准则而与原核生物的其余部分区分开来,所述若干个准则包括核糖体蛋白的数目和细胞壁中的胞壁酸的缺乏。基于ssrRNA分析,古细菌由两个系统发生学不同的群组组成:泉古菌门(Crenarchaeota)和广古菌门(Euryarchaeota)。古细菌基于其生理学可以组织成三种类型:产甲烷菌(产生甲烷的原核生物);极端嗜盐菌(extremehalophile)(在极高浓度的盐(NaCl)下存活的原核生物);和极端(超)嗜热菌(extreme(hyper)thermophilus)(在极高温度下存活的原核生物)。除将其与细菌区分开的统一古细菌特点(即,细胞壁中没有胞壁质、酯连型膜脂质等)以外,这些原核生物还展现出使其适应其特定栖息地的独特结构或生物化学属性。泉古菌门主要由极端嗜热性硫依赖性原核生物组成,且广古菌门含有产甲烷菌和极端嗜盐菌。
“细菌”或“真细菌”是指原核生物体域。细菌包括如下至少11种不同群组:(1)革兰氏阳性(革兰+)细菌,其存在两大亚门:(1)高G+C群组(放线菌(Actinomycetes)、分枝杆菌(Mycobacteria)、微球菌(Micrococcus)等),(2)低G+C群组(芽孢杆菌(Bacillus)、梭菌(Clostridia)、乳杆菌(Lactobacillus)、葡萄球菌(Staphylococci)、链球菌(Streptococci)、霉浆菌(Mycoplasmas));(2)变形菌门,例如紫色光合+非光合革兰氏阴性细菌(包括最“常见”的革兰氏阴性细菌);(3)蓝细菌,例如有氧光养型;(4)螺旋菌和相关物种;(5)浮霉状菌(Planctomyces);(6)拟杆菌(Bacteroide)、黄杆菌(Flavobacteria);(7)衣原体(Chlamydia);(8)绿色硫细菌;(9)绿色非硫细菌(也是厌氧性光养型);(10)耐放射性微球菌和相关菌种;(11)栖热孢菌(Thermotoga)和嗜热性热袍菌(Thermosiphothermophiles)。
“真核生物”是其细胞含有细胞核和包封于膜内的其它细胞器的任何生物体。真核生物属于真核或真核生物分类群。将真核细胞与原核细胞(前述细菌和古细菌)区分开来的限定性特点是其具有膜结合的细胞器,尤其是含有基因物质并且被核被膜包封的细胞核。
在本公开的意义中的“宿主细胞”可以包含任何原核或真核细胞。然而,本公开的特定实施例集中于真核细胞。举例来说,“宿主细胞”包含仓鼠细胞,如BHK21、BHK TK-、CHO、CHO-Kl、CHO-DUKX、CHO-DUKX Bl和CHO-DG44细胞或此类细胞系中的任一种的衍生物/后代。在本公开的另一个实施例中,宿主细胞还包含鼠类骨髓瘤细胞,例如NSO和Sp2/0细胞,或此类细胞系中的任一种的衍生物/后代。可以用于本公开的含义的鼠类和仓鼠细胞的实例也概述于表1中。然而,那些细胞的衍生物/后代和其它哺乳动物细胞(包括(但不限于):人类、小鼠、大鼠、猴、禽类或啮齿动物细胞系)或非哺乳动物真核细胞(包括(但不限于):酵母、昆虫和植物细胞)也可以本公开的含义使用,确切地说,用于生物医药和/或治疗蛋白的生产。
Figure BDA0002682783400000081
宿主细胞可以在无血清条件下并且任选地在不含任何来源于动物的蛋白质/肽的培养基中形成、调适和完全培养。市售培养基,如Ham's F 12(德国德森霍芬的西格玛(Sigma,Deisenhofen,Germany))、RPMI-1640(西格玛)、杜氏改良伊氏培养基(Dulbecco'sModified Eagle's Medium)(DMEM;西格玛)、最小必需培养基(MEM;西格玛)、伊斯科夫改良杜氏培养基(Iscove's Modified Dulbecco's Medium)(IMDM;西格玛)、CD-CHO(加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen,Carlsbad,Calif.))、CHO-S-英杰公司)、无血清CHO培养基(西格玛)和无蛋白质CHO培养基(西格玛)是示例性适当营养溶液。视需要任何培养基可以补充有用多种化合物,所述化合物的实例为激素和/或其它生长因子(如胰岛素、转铁蛋白、表皮生长因子、胰岛素样生长因子)、盐(如氯化钠、钙、镁、磷酸盐)、缓冲液(如HEPES)、核苷(如腺苷、胸苷)、谷氨酰胺、葡萄糖或其它等效能量源、抗生素、微量元素。还可以包括所属领域技术人员已知的适当浓度的任何其它必需补充剂。在本公开中,在各方面中可以使用无血清培养基。然而,补充有适合量的血清的培养基也可以用于宿主细胞的培养。对于表达可选基因的经基因修饰的细胞的生长和选择,可将适合的选择剂添加到培养基中。
术语“经基因修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用,并且是指已经通过本公开的克隆、转化、转化或以其它方式进行基因修饰的宿主细胞。因此,所述术语包括宿主细胞(例如细菌、酵母细胞、真菌细胞、CHO细胞、人类细胞等),相较于其所衍生的天然存在的生物体,所述宿主细胞已进行基因改变、修饰或工程改造,使得其展现经改变、修饰或不同的基因型和/或表型(例如当基因修饰影响微生物体的编码核酸序列时)。应理解,在一些实施例中,所述术语不仅指所讨论的特定重组宿主细胞,并且还指此类种宿主细胞的后代或潜在后代。
术语“野生型微生物体”或“野生型宿主细胞”描述自然界中存在的细胞,即尚未经基因修饰的细胞。
术语“基因工程改造”可以指对宿主细胞的基因组的任何操控(例如核酸的插入、缺失、突变或替换)。
术语“对照”或“对照宿主细胞”是指适当的比较宿主细胞,用于测定基因修饰或实验处理的效果。在一些实施例中,对照宿主细胞是野生型细胞。在其它实施例中,对照宿主细胞在基因上除了一或多个基因修饰之外,与经基因修饰的宿主细胞相同,从而有别于处理宿主细胞。
如本文所使用,术语“一或多种等位基因”意指基因的一或多种替代形式中的任一种,其所有等位基因涉及至少一种特性或特征。在二倍体细胞中,非定基因的两个等位基因占据一对同源染色体上的对应基因座。
如本文所使用,术语“基因座(locus)”(基因座(loci)的复数形式)意指发现有例如基因或基因标记的染色体上的一或多个特定位置或位点。
如本文所使用,术语“以基因方式连接”是指在育种期间,两种或更多种特性以高比率共同遗传,使得其难以通过杂交来分离。
如本文所使用,“重组”或“重组事件”是指染色体交叉或独立分类。
如本文所使用,术语“表型”是指个别细胞、细胞培养物、生物体或生物体群组的可观测特征,其由个体的基因组成(即基因型)与环境之间的相互相用产生。
如本文所使用,术语“嵌合”或“重组”当描述核酸序列或蛋白质序列时,是指使至少两个异源多核苷酸或两个异源多肽连接成单一大分子或使至少一种天然核酸或蛋白质序列的一或多个要素重排的核酸或蛋白质序列。举例来说,术语“重组”可以指序列中两个以其它方式分离的片段例如通过化学合成或通过基因工程改造技术操控核酸的经分离片段进行的人工组合。
如本文所使用,“合成核苷酸序列”或“合成多核苷酸序列”是已知不存在于自然界中或天然不存在的核苷酸序列。一般来说,当相较于任何其它天然存在的核苷酸序列时,此类合成核苷酸序列将包含至少一个核苷酸差异。
如本文所使用,术语“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式或其类似物。这个术语是指分子的一级结构,并且因此包括双链和单链DNA,以及双链和单链RNA。其还包括经修饰的核酸,如甲基化和/或封端核酸;含有经修饰的碱基、主链修饰的核酸等。术语“核酸”和“核苷酸序列”可互换地使用。
如本文所使用,术语“基因”是指与生物功能相关的任何DNA片段。因此,基因包括(但不限于)其表达所需的编码序列和/或调节序列。基因还可以包括未表达的DNA片段,其例如形成其它蛋白质的鉴别序列。基因可从多种来源获得,包括从所关注的来源克隆或从已知或预测的序列信息合成,并且可以包括设计成具有所需参数的序列。
如本文所使用,术语“同源”或“同源物”或“直系同源物”在所属领域中已知并且是指具有共同祖先或家族成员并且基于序列一致性程度确定的相关序列。术语“同源性”、“同源”、“基本上类似”和“基本上对应”在本文中可互换地使用。其是指核酸片段,其中一或多个核苷酸碱基的变化并不影响所述核酸片段介导基因表达或产生某种表型的能力。这些术语也指本公开的核酸片段的修饰,如一或多个与初始、未经修饰的片段相比不显著改变所得核酸片段的功能特性的核苷酸的缺失或插入。因此应理解,如所属领域的技术人员将了解,本公开涵盖除所述特定示例性序列以外的序列。这些术语描述了一种物种、亚种、变种、栽培品种或菌株中所发现的基因与另一种物种、亚种、变种、栽培品种或菌株中的对应或等效基因之间的关系。出于本公开的目的,对同源序列进行比较。“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能关系可以用多种方式中的任一种指定,包括(但不限于):(a)序列一致性程度和/或(b)相同或类似生物功能。优选地,指定(a)和(b)两者。可以使用所属领域中容易获得的软件程序获得的结果推测同源性,如现代分子生物学实验技术(Current Protocols in Molecular Biology)(F.M.奥斯贝(F.M.Ausubel)等人编,1987)副刊30,章节7.718,表7.71中所论述的那些软件程序。一些比对程序是MacVector(英国牛津的牛津分子有限公司(Oxford Molecular Ltd,Oxford,U.K.))、ALIGN Plus(宾夕法尼亚州的科学和教育软件(Scientific and EducationalSoftware,Pennsylvania))以及AlignX(Vector NTI,加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen,Carlsbad,CA))。另一种比对程序是Sequencher(密歇根安娜堡的基因编码(Gene Codes,Ann Arbor,Michigan)),其使用默认参数。
如本文所使用,术语“内源性”或“内源基因”是指天然存在的基因,在其所处位置发现其天然地存在于宿主细胞基因组内。在本公开的上下文中,将异源启动子可操作地连接到内源基因意指以基因方式将异源启动子序列插入现有基因之前,处于那个基因天然存在的位置。如本文所描述的内源基因可以包括天然存在的基因的等位基因,所述等位基因已经根据本公开的任何方法发生突变。
如本文所使用,术语“外源性”是指来自除其天然来源以外的某个来源的物质。举例来说,术语“外源蛋白质”或“外源基因”是指来自非天然来源并且已经通过人工方式提供到生物系统中的蛋白质或基因。
如本文所使用,术语“异源”是指来自除其天然来源或位置以外的某个来源或位置的物质。举例来说,术语“异源启动子”可以指已经从一种来源生物体获得并且在另一个生物体中利用的启动子,在另一个生物体中,启动子不是天然发现的。然而,术语“异源启动子”也可以指来自同一源生物体内但仅移动到所述启动子并不通常位于其中的新颖位置的启动子。
同源基因序列可以通过使用可以是真核表达载体(例如哺乳动物表达载体)的“表达载体”引入到目标细胞中。用于构筑载体的方法为所属领域的技术人员所熟知的并且描述于各种公开案中。确切地说,在现有技术中回顾了用于构筑适合载体的技术,包括如启动子、强化子、终止和多腺苷酸化信号、选择标记、复制起点和剪接信号的功能组件的描述。载体可以包括(但不限于):质粒载体、噬菌粒、粘粒、人工/微型染色体(例如ACE)或病毒载体,如杆状病毒、逆转录病毒(retrovirus)、腺病毒、腺相关病毒、单纯疱疹病毒、逆转录病毒(retroviruses)、噬菌体。真核表达载体将通常还含有有助于载体在细菌中的繁殖的原核序列,如用于细菌中的选择的复制起点和抗生素抗性基因。含有可以与多核苷酸以操作方式连接的克隆位点的多种真核表达载体是所属领域熟知的,并且一些真核表达载体可以购自如加利福尼亚州拉霍亚的斯塔津公司(Stratagene,La Jolla,Calif.);加利福尼亚州卡尔斯巴德的英杰公司;威斯康星州麦迪逊的普洛麦格公司(Promega,Madison,Wis.)或加利福尼亚州帕洛阿托的BD生物科学克隆科技公司(BD Biosciences Clontech,Palo Alto,Calif.)的公司。在一个实施例中,表达载体包含至少一个核酸序列,其为编码所关注的肽/多肽/蛋白质的核苷酸序列的转录和翻译所必需的调节序列。
如本文所使用,术语“表达”是指在宿主细胞内的异源核酸序列的转录和/或翻译。可以基于存在于细胞中的对应mRNA的量或由所选序列编码的所需多肽/蛋白质的量来确定宿主细胞中所关注的所需产物/蛋白质的表达水平。举例来说,可以通过北方印迹杂交(Northern blot hybridization)、核糖核酸酶RNA保护、与细胞RNA的原位杂交或通过PCR来定量从所选序列转录的mRNA。由所选序列编码的蛋白质可以通过多种方法定量,例如通过ELISA、通过蛋白质印迹法(Western blotting)、通过放射免疫分析、通过免疫沉淀、通过分析蛋白质的生物活性、通过蛋白质的免疫染色接着FACS分析或通过均匀时间分辨荧光(homogeneous time-resolved fluorescence;HTRF)分析。
可以通过所属领域中熟知的任何方法进行真核宿主细胞与多核苷酸或表达载体的“转染”,产生经基因修饰的细胞或转基因细胞。转染方法包括(但不限于):脂质体介导的转染、磷酸钙共沉淀、电穿孔、聚阳离子(如DEAE-葡聚糖)介导的转染、原生质体融合、病毒感染和显微注射。在各方面,需要转染是稳定转染。提供异源基因在特定宿主细胞系和类型中的最优转染频率和表达的转染方法是有利的。适合的方法可以通过常规程序确定。对于稳定转染物,构筑体要么整合到宿主细胞的基因组中,要么整合到人工染色体/微型染色体中或以游离基因体定位,以便稳定地维持在宿主细胞内。
如本文所使用,术语“核苷酸变化”是指例如核苷酸取代、缺失和/或插入,如在所属领域中充分理解。举例来说,突变含有产生沉默取代、添加或缺失,但不改变所编码的蛋白质的特性或活性或如何制得蛋白质的改变。
如本文所使用,术语“蛋白质修饰”是指例如氨基酸取代、氨基酸修饰、缺失和/或插入,如在所属领域中充分理解。
术语“蛋白质”可与多肽互换使用,并且是指任何长度的氨基酸的聚合物。这些术语还包括通过包括(但不限于)以下的反应进行翻译后修饰的蛋白质:糖基化、乙酰化、磷酸化或蛋白质处理。可以在多肽的结构中进行修饰和改变,例如:与其它蛋白质融合、氨基酸序列取代、缺失或插入,同时分子维持其生物功能活性。举例来说,可以在多肽或其潜在核酸编码序列中进行某些氨基酸序列取代,并且可以获得具有类似特性的蛋白质。一般来说,蛋白质由氨基酸长度定义并且长于多肽。术语“多肽”意指具有超过10个氨基酸的序列,并且术语“肽”意指具有至多10个氨基酸长度的序列。
本公开适合于产生用于生产生物医药多肽/蛋白质的宿主细胞。本公开尤其适合于通过展示增强的细胞生产率的细胞对大量不同所关注的基因的高产量表达。
“所关注的基因”(GOI)、“所选序列”或“产物基因”在本文中具有相同含义,并且是指编码所关注的产物或“所关注的蛋白质”(还由术语“所需产物”提及)的任何长度的多核苷酸序列。所选序列可以是全长或截短基因、融合或标记基因,并且可以是cDNA、基因组DNA或DNA片段,优选地cDNA。其可以是天然序列,即一或多种天然存在的形式,或可以视需要经突变或以其它方式修饰。这些修饰包括密码子优化以优化所选宿主细胞中的密码子使用、人类化或标记。所选序列可以编码分泌的多肽、细胞质的多肽、核的多肽、膜结合多肽或细胞表面多肽。
“所关注的蛋白质”可以包括可以在所选宿主细胞中表达的任何蛋白质、多肽、其片段或肽。所需蛋白质可以是例如:抗体、酶、细胞因子、淋巴因子、粘附分子、受体、其衍生物或片段、可以充当促效剂或拮抗剂的多肽和/或具有治疗性或诊断用途的任何蛋白质。在更复杂分子(如单克隆抗体)的情况下,GOI编码两个抗体链中的一个或两个。“所关注的产物”可以是在宿主细胞中可产生的任何所需分子(蛋白质或以其它方式)。
“所关注的蛋白质”或“所需蛋白质”的其它实例包括:胰岛素;胰岛素样生长因子;hGH;tPA;细胞因子,如白介素(IL)(例如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18)、干扰素(IFN)α、IFNβ、IFNγ、IFNω或IFNτ、肿瘤坏死因子(TNF)(如肿瘤坏死因子α和TNFβ、TNFγ、TRAIL);G-CSF;GM-CSF;M-CSF;MCP-1和VEGF。还包括产生红血球生成素或任何其它激素生长因子。根据本公开的方法还可以有利地用于生产抗体或其片段。此类片段包括例如Fab片段(抗原结合片段=Fab)。Fab片段由通过相邻恒定区保持在一起的两个链的可变区组成。这些可以通过蛋白酶消化(例如用木瓜蛋白酶)由常规抗体形成,但类似的Fab片段也可以通过基因工程改造同时产生。其它抗体片段包括F(ab')2片段,其可以通过用胃蛋白酶蛋白水解裂解来制备。所关注的蛋白质可以分泌的多肽形式从培养基中回收,或其可以在无分泌信号表达的情况下从宿主细胞溶解产物中回收。
可能有必要以基本上均质制备获得所关注的蛋白质的方式从其它重组蛋白和宿主细胞蛋白纯化所关注的蛋白质。作为第一个步骤,从培养基或溶解产物去除细胞和/或粒状细胞碎片。随后从污染物可溶蛋白质、多肽和核酸纯化所关注的产物,例如通过对免疫亲和力或离子交换柱、乙醇沉淀、反相HPLC、葡聚糖凝胶色谱、二氧化硅或阳离子交换树脂(如DEAE)上的色谱来纯化。一般来说,教示技术人员如何纯化由宿主细胞表达的蛋白质的方法在所属领域中是众所周知的。
使用基因工程改造方法,有可能产生仅由重链(VH)和轻链(VL)的可变区组成的缩短的抗体片段。这些称为Fv片段(片段变量=可变部分的片段)。由于这些Fv片段缺乏通过恒定链的半胱氨酸的两个链的共价键结,因此Fv片段通常是稳定的。有利的是通过例如10到30个氨基酸(例如15个氨基酸)的短肽片段连接重链和轻链的可变区。以此方式,获得由通过肽连接子连接的VH和VL组成的单肽链。这种抗体蛋白质被称为单链Fv(scFv)。所属领域中已知的这种类型的scFv抗体蛋白质的实例。
近年来,已经开发了各种策略以制备scFv作为多聚体衍生物。这旨在尤其涉及具有改良的药物动力学和生物分布特性以及增加的结合亲合力的重组抗体。为了实现scFv的多聚化,将scFv制备为具有多聚化域的融合蛋白。多聚化域可以是例如IgG或卷曲线圈结构(螺旋结构)的CH3区,如亮氨酸拉链域。然而,还存在scFv的VH/VL区之间的相互作用用于多聚化(例如,双链抗体、三链抗体和五链抗体)的策略。通过双链抗体,技术人员意指二价均二聚ScFv衍生物。将scFv分子中的连接子截短为5-10个氨基酸导致形成均二聚体,其中发生链间VH/VL-叠加。双链抗体可以额外通过并入二硫桥键而稳定。双链抗体的实例-抗体蛋白质在所属领域中是已知的。
通过微型抗体,技术人员意指二价均二聚ScFv衍生物。其由融合蛋白组成,所述融合蛋白含有免疫球蛋白的CH3区,优选IgG,最优选IgG1作为二聚化区,其通过铰链区(例如也来自IgG1)和连接子区连接到scFv。微型抗体的实例-抗体蛋白质在所属领域中是已知的。
通过三链抗体,技术人员意指三价均三聚ScFv衍生物。其中VH-VL直接融合而不具有连接子序列的ScFv衍生物导致形成三聚体。
技术人员也将熟悉所谓的具有二价、三价或四价结构并且衍生自scFv的微型抗体。多聚化是通过二聚、三聚或四聚物卷曲线圈结构实现。
所属领域的技术人员也将熟悉由衍生自羊驼或来自骆驼科的其它动物的单链抗体的一或多个可变域组成的多肽分子。此外,所属领域的技术人员了解此类骆驼科抗体的衍生物和变异体。此类分子也称为“域抗体”。域抗体变异体包括通过肽连接子共价连接的那些可变域中的数种。为了增加血清半衰期,可以产生域抗体,其融合到多肽部分(如抗体Fc-部分)或存在于血清中的另一种蛋白质(如白蛋白)。
通过“支架蛋白”,熟练的技术人员意指通过基因克隆或通过与另一种蛋白质或具有另一种功能的蛋白质的一部分的共翻译过程偶合的蛋白质的任何功能域。
如本文所使用,术语核酸或多肽的“至少一部分”或“片段”意指具有此类序列的最小尺寸特征的部分,或全长分子任何更大的片段,最多是并且包括全长分子。本公开的多核苷酸的片段可以编码基因调节元件的生物活性部分。基因调节元件的生物活性部分可以通过分离包含基因调节元件的本公开的多核苷酸中的一种的一部分并且如本文所描述评估活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,最多是全长多肽。待使用的部分的长度将视特定应用而定。适用作杂交探针的核酸的一部分可以短到12个核苷酸;在一些实施例中,其是20个核苷酸。适用作抗原决定基的多肽的一部分可以短到4个氨基酸。发挥全长多肽功能的多肽的一部分将通常长于4个氨基酸。
变异体多核苷酸还涵盖来源于诱变和诱重组程序(如DNA改组)的序列。此类DNA改组的策略在所属领域中是已知的。参见例如施特默尔(Stemmer)(1994)美国国家科学院院刊(PNAS)91:10747-10751;施特默尔(1994)自然(Nature)370:389-391;凯默瑞(Crameri)等人(1997)自然生物技术(Nature Biotech.)15:436-438;穆尔(Moore)等人(1997)分子生物学杂志(J.Mol.Biol.)272:336-347;张(Zhang)等人(1997)美国国家科学院院刊94:4504-4509;凯默瑞等人(1998)自然391:288-291;和第5,605,793号与第5,837,458号美国专利。
就本文所公开的多核苷酸的PCR扩增来说,可以设计用于PCR反应中的寡核苷酸引物以由从所关注的任何生物体提取的cDNA或基因组DNA扩增对应DNA序列。用于设计PCR引物和PCR克隆的方法是所属领域中通常已知的并且公开于萨布鲁克(Sambrook)等人(2001)分子克隆:实验指南(Molecular Cloning:A Laboratory Manual)(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约普莱恩维尤(Plainview,New York))中。还参见英尼斯(Innis)等人编(1990)PCR方案:方法和应用指南(PCR Protocols:AGuide to Methods and Applications)(学术出版社,纽约);英尼斯和吉尔凡(Gelfand)编(1995)PCR策略(PCR Strategies)(学术出版社,纽约);以及英尼斯和吉尔凡编(1999)PCR方法手册(PCR Methods Manual)(学术出版社,纽约)。已知的PCR方法包括(但不限于)使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
如本文所使用,术语“引物”是指一种寡核苷酸,其当放置在诱导引物延伸产物合成的条件下时(即,在核苷酸和聚合试剂(如DNA聚合酶)存在下并且在适合温度和pH下),能够与扩增目标粘接,从而允许DNA聚合酶附著,由此充当DNA合成的起始点。(扩增)引物优选是单链以获得最大的扩增效率。优选地,引物是寡脱氧核苷酸。引物必须足够长以在聚合试剂存在下引发延伸产物的合成。引物的确切长度将取决于多种因素,包括引物的温度和组成(A/T相对于G/C含量)。一对双向引物由如DNA扩增(如PCR扩增)领域中所常用的一个正向引物和一个反向引物组成。
如本文所使用,“启动子”是指能够控制编码序列或功能RNA的表达的DNA序列。在一些实施例中,启动子序列由近端和更远端上游元件组成,后者元件通常被称作强化子。因此,“强化子”是可以刺激启动子活性的DNA序列,并且可以是启动子的固有元件或被插入以增强启动子的含量或组织特异性的异源元件。启动子可以完全来源于天然基因,或由来源于自然界中所发现的不同启动子的不同元件构成,或甚至包含合成DNA片段。所属领域的技术人员应理解,不同启动子可以引导基因在不同组织或细胞类型中,或在不同的发育阶段,或响应于不同的环境条件来表达。进一步认识到,由于在大多数情况下,调节序列的确切边界尚未完全界定,因此一些变异形式的DNA片段可以具有相同的启动子活性。
如本文所使用,短语“重组构筑体”、“表达构筑体”、“嵌合构筑体”、“构筑体”和“重组DNA构筑体”在本文中可互换地使用。重组构筑体包含核酸片段的人工组合,例如自然界中未一同发现的调节和编码序列。举例来说,嵌合构筑体可以包含来源于不同来源的调节序列和编码序列,或来源于相同来源的调节序列和编码序列,但其以与自然界中所发现不同的方式排列。此类构筑体可以单独使用或可以与载体结合使用。如所属领域的技术人员众所熟知,如果使用载体,那么载体的选择取决于用于使宿主细胞转化的方法。举例来说,可以使用质粒载体。所属领域的技术人员深知,为了成功地转化、选择和繁殖包含本公开的任一个经分离核酸片段的宿主细胞,基因元件必须存在于载体上。所属领域的技术人员还将认识到不同的独立转化事件将引起不同的表达水平和模式(琼斯(Jones)等人,(1985)欧洲分子生物学杂志(EMBO J)4:2411-2418;德阿尔梅达(De Almeida)等人,(1989)分子基因遗传学(Mol.Gen.Genetics)218:78-86),并且因此必须对多个事件进行筛选以便获得呈现所期望表达水平和模式的株系。此类筛选可以通过DNA的南方分析、mRNA表达的北方分析、蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体等,其自主地复制或可以整合到宿主细胞的染色体中。载体还可以是非自主复制的裸RNA多核苷酸、裸DNA多核苷酸、由同一链内的DNA和RNA构成的多核苷酸、聚赖氨酸结合的DNA或RNA、肽结合的DNA或RNA、脂质体结合的DNA等。如本文所使用,术语“表达”是指功能性最终产物(例如mRNA或蛋白质(前驱物或成熟物))的产生。
在本文中,“可操作地连接”意指根据本公开的启动子多核苷酸与其它寡核苷酸或多核苷酸的依序排列,从而引起所述其它多核苷酸的转录。
术语“体积生产率”或“生产速率”定义为每体积培养基每单位时间形成的产物的量。体积生产率可以克/升/小时(g/L/h)为单位来报告。
术语“比生产率”定义为产物的形成速率。比生产率在本文中进一步定义为以克产物/克细胞干重(CDW)/小时(g/g CDW/h)为单位的比生产率。对于给定比生产率使用CDW与OD600的关系,比生产率还可以用克产物/升培养基/600nm处培养液光学密度(OD)/小时(g/L/h/OD)来表示。
术语“产量”定义为每单位重量的原材料所得的产物的量并且可以用g产物/g底物(g/g)来表示。产量可以表示为理论产量的百分比。“理论产量”定义为每给定量的底物可以产生的最大产物量,如根据用于制备产物的代谢路径的化学计量学所指定。
术语“滴度”或“效价”定义为溶液的强度或溶液中的物质的浓度。举例来说,发酵液中所关注的产物(例如小分子、蛋白质、肽、抗体、合成化合物、燃料、醇等)的效价描述为g溶液中所关注的产物/升发酵液(g/L)。
术语“总效价”定义为工艺中所产生的所有所关注的产物的总和,包括(但不限于)溶液中的所关注的产物、气相(如果适用)中的所关注的产物和从工艺中去除并且相对于工艺中的初始体积或工艺中的操作体积所回收的任何所关注的产物。
如本文所使用,术语“HTP基因设计库”或“库”是指根据本公开的基因扰动的集合。在一些实施例中,本发明的库可显现为i)在数据库或其它计算机文件中的序列信息的集合;ii)对前述系列的基因元件进行编码的基因构筑体的集合;或ⅲ)包含所述基因元件的宿主细胞(例如CHO细胞)。在一些实施例中,本公开的库可以指代个别元件的集合(例如,用于PRO交换库的启动子的集合)。在其它实施例中,本公开的库还可以指基因元件的组合,如特定启动子::基因的组合。在一些实施例中,本公开的库进一步包含与库中的每个成员应用于宿主生物体中的效果相关的元数据。举例来说,如本文所使用的库可以包括启动子::基因序列组合的集合,以及那些组合对特定CHO细胞的一或多种表型所产生的影响,从而在未来的启动子交换中使用所述组合来改良未来预测值。
如本文所使用,术语“SNP”是指一或多种小核多态性。在一些实施例中,本公开的SNP应广泛地解释,并且包括单核苷酸多态性、序列插入、缺失、倒位和其它序列替换。如本文所使用,术语“非同义”或非同义SNP是指引起宿主细胞蛋白中的编码变化的突变。
“高通量(HTP)”方法或基因组工程改造的“高通量(HTP)”方法可能涉及利用至少一件设备,其使得人们能够评估与非HTP方法(例如,自动化设备(例如,液体处理机或板处理机)相比相对大量的实验或条件以进行所述方法的至少一个步骤。
中国仓鼠卵巢细胞
CHO细胞代表最经常使用的治疗蛋白的哺乳动物产生宿主,这是因为与其它细胞类型相比具有以下若干关键优势:(i)在化学成分确定的和无血清悬浮培养物中的稳固生长;(ii)关于人类病原性病毒复制的合理安全性概况;和(iii)表达具有人类样翻译后修饰的r蛋白质的能力(金(Kim)等人,2012)。此外,CHO细胞系统的最重要特征之一为易于产生经工程改造的细胞克隆,所述经工程改造的细胞克隆能够以足以供人类使用的产量和可接受品质稳定地表达所关注的基因(GOI)。这可以在通过位点特异性整合或随机整合将靶向基因插入到宿主细胞基因组中,接着使用二氢叶酸还原酶(DHFR)或谷氨酰胺合成酶(GS)系统进行基因扩增之后实现(迪罗谢(Durocher)和布特勒(Butler),2009;克拉默(Kramer)等人,2010)。然而,因为糖基化模式与人类的糖基化模式不完全相同,所以来源于CHO细胞的r蛋白质有时展示为免疫原性的(布特勒和斯皮尔曼(Spearman),2014)。
整个“CHO细胞系统”涵盖多种不同细胞系,其可能全部来源于在1956年由西奥多·帕克(Theodore Puck)最初分离的克隆并且自发永生化中国仓鼠卵巢细胞(帕克等人,1958)。这个第一个CHO细胞和所有后续衍生的细胞系都缺乏脯胺酸合成的事实有力地支持共同克隆起源的概念(武尔姆(Wurm)和哈克(Hacker),2011)。当今,三种不同CHO细胞系通常用于生物医药制造:(i)仍拥有功能性DHFR基因的CHO-K1细胞系;(ii)具有单等位基因DHFR基因敲除的CHO-DXB11细胞系;以及(iii)CHO-DG44细胞系,其中物理上缺失DHFR等位基因两者(乌尔劳布和蔡辛(Chasin),1980;乌尔劳布等人,1983;武尔姆和哈克,2011)。
在2011年,第一个CHO基因组由徐(Xu)和来自CHO-K1细胞的同事测序,这显著加快了生物技术应用的研究工作(徐等人,2011)。然而,因为CHO细胞本质上易于基因组重排,所以需要包括事先染色体分选的进一步的测序工作以获得对基因组前景更详细的概述(布林克洛夫(Brinkrolf)等人,2013;路易斯(Lewis)等人,2013)。除基因组信息以外,转录组、miRnome以及蛋白质组/翻译组数据最近变得可用(巴辛-赫尔扎(Baycin-Hizal)等人,2012;贝克(Becker)等人,2011;克拉克(Clarke)等人,2012;库尔特(Courtes)等人,2013;哈克尔(Hackl)等人,2011)。最近,揭示转录起始位点(加科比(Jakobi)等人,2014),一旦这些起始位点最终引入到公开可用的CHO基因组数据库其便产生更详细的生物信息学分析(www.chogenome.org)。综合在一起,所有这些有价值的贡献显著有助于更好地表征这种生物技术工作马并且很大程度上支持细胞工程改造的研究工作。
前述“中国仓鼠卵巢细胞”章节大部分摘自:费舍尔(Fischer)等人,“CHO细胞工程改造领域:综合回顾和未来观点(The art of CHO cell engineering:A comprehensiveretrospect and future perspectives)”,生物技术进展(Biotechnology Advances),第33卷,(2015),第1878-1896页,其以全文引用的方式并入本文中。
CHO细胞菌株改良的传统方法
改良用于产生治疗蛋白的CHO细胞性能的传统方法可以分解成几个大类,其将在下文中简要地论述。
A.生物过程和转基因表达优化
在过去数十年内,生物过程和转基因表达优化使CHO细胞中的重组蛋白效价改良约100倍。体积产量的这种增加主要通过介质优化、克隆选择过程、表达载体、基因元件、生物过程控制和生物反应器设计来实现。郭(等人),“用于工程改造CHO细胞中蛋白质产生的系统生物学的新兴作用(The emerging role of systems biology for engineeringprotein production in CHO cells)”,生物技术新见(Current Opinion inBiotechnology),第51卷,(2018),第64-69页,其以全文引用的方式并入本文中。
B.CHO细胞的靶向工程改造
1.基因的引入
已频繁地利用改良哺乳动物产生细胞系的性能的有益基因的稳定基因组整合。一般来说,一旦鉴别出有利的GOI,就分离其(通常经密码子优化)不具有任何内含子序列的互补DNA(cDNA)并且将其克隆到哺乳动物表达载体中。在传递质粒DNA(pDNA)之后,使经转染的细胞经历抗生素选择压力以产生具有稳定地整合到其基因组中的质粒DNA的细胞池。为了确保GOI的高表达水平,其表达主要由强病毒或细胞启动子/强化子驱动,而选择性基因通常由弱启动子控制以增加总体表达水平。所选细胞培养物表示展示不同程度的转基因过度表达引起个别细胞之间的表型差异的细胞的非均相混合池。因此,必须从非均相细胞池形成单细胞克隆以获得展现强并且稳定的经工程改造的表型的克隆。参见同上,费舍尔等人(2015)(省略内部引用)。
2.基因敲除
除过度表达有利的GOI以改良CHO产生细胞的性能以外,不利基因的基因组敲除还表示宿主细胞工程改造的其它有前景的策略。例如通过化学或辐射诱导的随机突变诱发或使用精确基因组编辑方法,存在稳定地从基因组删除基因或切断其功能的不同方式。因此,具有高特异性的靶向基因组工程改造变得优于随机突变诱发,尤其从调节观点来看。在这一点上,所属领域技术的当前状态主要包含使用锌指核酸酶(ZFN)、转录活化因子样效应物核酸酶(TALEN)、大范围核酸酶或最近引入的成簇规则间杂短倒序重复(CRISPR/Cas9)(或Cpf1)系统。参见同上,费舍尔等人(2015)(省略内部引用)。
历史上,最终为CHO细胞用于生物医药制造的经济利用铺平道路的最重要的基因操控中的一个为二氢叶酸还原酶(DHFR)基因的基因组缺失/失活。尽管这些操控是通过化学突变诱发和电离辐射引入,产生分别命名为DXB11和DG44的不同DHFR缺乏的CHO子细胞系,但其在生物技术中标记CHO细胞的商业利用的起始点。稍后,基于可以由甲硫氨酸磺酰亚胺(MSX)抑制的谷氨酰胺合成酶(GS)酶引入另一种基因扩增系统,使得能够产生高表达重组CHO细胞。通过产生具有内源性GS基因的基因组敲除的CHO-K1SV细胞(CHO-GS)来扩增适用于代谢选择和基因扩增的CHO-GS细胞工厂的抗体库。如果细胞先前用编码转基因的表达载体与功能性DHFR或GS基因复制组合转染,那么可以分别针对缺乏次黄嘌呤/胸苷和L-谷氨酰胺的生长培养基中的稳定转染物选择CHO-DXB11/DG44和CHO-GS细胞。更重要的是,经稳定转染的细胞可以通过使细胞暴露于不断地增加浓度的二氢叶酸类似物甲氨蝶呤(MTX)(CHO-DXB11和-DG44)或甲硫氨酸磺酰亚胺(MSX)(CHO-GS)来进行基因扩增。参见同上,费舍尔等人(2015)(省略内部引用)。
C.RNAi介导的基因沉默
自从在秀丽隐杆线虫(Caenorhabditis elegans,C.elegans)中发现RNA干扰(RNAi)以来,使用小双链RNA(dsRNA)(其也称为小干扰RNA(siRNA))使基因沉默(也称为基因敲除)已成为细胞工程改造中频繁应用的技术。siRNA为展现与目标信使RNA(mRNA)完全序列互补的20-25个碱基对长的dsRNA分子。外源传递的siRNA由III型RNA酶切丁酶(DICER)裂解并且装载到阿高蛋白-2(Argonaute-2)(AGO2)上,所述蛋白构成细胞质中的RNA诱导的沉默复合物(RISC)的核心。值得注意的是,AGO2表示展现切割酶活性的唯一一种AGO家族蛋白质,其一旦由siRNA结合,就引起目标mRNA的立即裂解。在dsRNA的5′-末端处的热力学稳定性决定哪一条链作为引导链是有利的。尽管使靶向基因沉默的siRNA是人造的,但最近研究已揭示来源于内源性元件(如转座子转录物、重复序列、长茎环结构或正义-反义转录物)的真核细胞中天然存在的siRNA的存在。参见同上,费舍尔等人(2015)(省略内部引用)。
D.miRNA过度表达/阻抑
在过去的数十年中,生物医药生产细胞的基因工程改造集中于操控单一目标基因。然而,因为细胞表型的改变很可能不是改变个别基因的表达的结果而是改变相同或不同路径中涉及的大量基因的结果,所以可设想的是,整个信号传导路径的工程改造可能改良表型结果。微RNA最近已进入CHO细胞工程改造的领域,因为这些内源性小RNA能够调节整个细胞路径。有趣的是,大量miRNA可以实际上同时调节多个不同细胞路径,以便保持细胞内稳态。这些特性使得miRNA在未来对于下一代宿主细胞工程改造是极具吸引力的分子工具。然而,大量miRNA仍必须在CHO细胞中进行功能性评估,以便表征其表型影响。在这一点上,高含量功能性miRNA筛选方法以及miRnome剖析研究将有助于揭示待用于CHO细胞工程改造的新颖目标分子。参见同上,费舍尔等人(2015)(省略内部引用)。
尽管CHO细胞工程改造取得进展,但仍存在严重障碍
上文详述的CHO细胞工程改造的进展已提供增强蛋白质生产的强大工具。然而,单一蛋白质的合成和分泌取决于数百或数千种其它蛋白质的协同功能。因此,真正有效的工程改造策略可能需要宿主细胞的多个基因变化。
为了实现这一目标,已经作出努力以全面地研究发生的分子变化以实现高蛋白质分泌速率,因此揭示使得某些细胞成为高生产者的分子和生理学因素。组学数据已经广泛地用于研究生产性克隆。举例来说,差异蛋白质组分析鉴别谷胱甘肽生物合成的上调和DNA复制的下调为高产CHO细胞的特征。类似地,各种CHO细胞系的转录组分析指示某些有利代谢和糖基化模式与关键基因的差异表达相关。还使用核糖体分析和多聚核糖体分析来定量重组蛋白和内源性mRNA在抗体产生CHO细胞中的翻译。这些和许多额外研究展示组学数据已出现为有价值的分析,其提供基因、蛋白质和代谢物与CHO细胞中的蛋白质产生中的所要特性相关的见解。此外,其有助于鉴别用于增强蛋白质生产的细胞工程改造和生物工艺优化的潜在目标。参见同上,郭等人(2018)(省略内部引用)。
需要HTP工具和分析来探索组学领域
需要开发HTP基因工具和分析,其可以用于探究基因组前景并且使得充分使用的前述在CHO细胞组学数据中增加。这些HTP工具和分析将需要定制且适于在更大的数据科学和机器学习系统内操作,以便感测将产生的大量生物数据。
本公开提供此类HTP基因工具,例如HTP启动子交换基因组工程改造工具。这个工具可以用于系统地靶向所鉴别的路径中对于治疗蛋白产生来说重要的任何特定基因。
此外,所述工具在其可以用于调节未知功能的基因或未知是否与特定治疗蛋白产生路径相关的基因的事实中具有扩展效用。HTP启动子交换工具的通用性提供基因组工程师扰动和研究CHO细胞路径并且鉴别特定基因对治疗蛋白产生的影响的系统性方式。
为这个目的,本公开阐述了一种用计算机驱动并且整合了分子生物学、自动化、资料分析和先进机器学习方案的独特HTP基因组工程改造平台。这个整合平台利用一套HTP分子工具集,所述工具集用于构筑HTP基因设计库。这些基因设计库将在下文详细说明。
此外,本文教示的HTP平台能够鉴别、表征和量化个别基因变化对CHO细胞性能的影响。这一信息,即给定基因变化x对宿主细胞表型y(例如治疗蛋白的产生)的影响,能够产生并且接着存储于下文所论述的HTP基因设计库中。即,每种基因排列的序列信息和其对宿主细胞表型的影响存储于一或多个数据库中,并且可供后续分析使用(例如上位定位,如下文所论述)。本公开还教示了在物理上保存/存储有价值的基因排列的方法,所述基因排列呈基因插入构筑体形式或呈含有所述基因排列的一或多种宿主细胞生物体形式(例如参见下文所论述的库)。
当将这些HTP基因设计库联接到与复杂数据分析和机器学习过程整合的迭代过程中时,那么出现用于改良CHO细胞的显著不同的方法。所教示的HTP平台能够系统地探索具有高效并且最佳的HTP分子工具的CHO细胞基因前景,所述基因探索使得研究人员能够最大限度的使用在CHO领域中产生的组学数据的扩展集。参照下文所论述的HTP分子工具集和所衍生的基因设计库将显而易知这些和其它优势。
基因设计和CHO细胞工程改造:利用一套HTP分子工具和HTP基因设计库进行CHO细胞改良的系统性组合方法
如前所述,本公开提供一种通过迭代系统性引入和去除跨越CHO细胞基因组的基因变化对CHO细胞进行工程改造的新颖HTP平台和基因设计策略。所述平台由一套分子工具提供支持,其能够产生HTP基因设计库并且允许对给定CHO细胞高效实施基因改变。
本公开的HTP基因设计库充当可以引入特定CHO细胞基因背景中的可能基因改变的来源。通过这种方式,HTP基因设计库是基因多样性的存储库,或基因扰动的集合,其可以应用于对给定CHO细胞系进行初始或进一步的工程改造。用于对实施到宿主细胞的基因设计进行编程的技术描述于申请中第15/140,296号美国专利申请案中,所述申请以全文引用的方式并入本文中。
在这个平台中利用的HTP分子工具集尤其可以包括:HTP启动子交换基因组工程改造工具,在本文中也被称作“启动子交换”或“PRO交换”或“PROSWAP”工具。
本公开的HTP方法还教示了指导HTP工具集的合并/组合使用的方法,包括上位定位方案。如前所述,单独或组合的这套分子工具能够产生HTP基因设计CHO细胞库。
如将表明,在教示HTP CHO细胞工程改造平台的情形下利用前述HTP基因设计库使得与治疗蛋白产生高度相关的有益的基因扰动能够鉴别和合并到单个CHO细胞基因背景中。
在一些实施例中,本公开与已知CHO细胞改良方法不同之处在于,其分析了跨越多个不同基因组区的基因排列的全基因组组合效应,包括已表达和未表达的基因元件,并且使用所聚集的信息(例如实验结果)来预测预期会产生CHO细胞增强的基因组合。
在一些实施例中,本公开教示:i)能够通过所公开的平台改良的CHO细胞;ii)产生用于下游分析的CHO细胞多样性池;iii)用于大CHO细胞变异体池的高通量筛选和测序的方法和硬件;iv)用于机器学习计算和全基因组突变的协同效应的预测的方法和硬件;和v)用于高通量CHO细胞工程改造的方法。
现将论述HTP分子工具集,其能够产生用于CHO细胞工程改造平台的各种HTP基因设计库。
启动子交换:用于衍生启动子交换CHO细胞库的分子工具
在一些实施例中,本公开教示了选择具有最佳表达特性的启动子以对整体CHO细胞表型(例如治疗蛋白的产量或生产率)产生有益作用的方法。
举例来说,在一些实施例中,本公开教示了鉴别一或多个启动子和/或在CHO细胞内产生一或多个启动子的变异体的方法,所述启动子展现一系列表达强度(例如下文所论述的启动子梯)或优良调节特性(例如针对所选基因的更紧密调节)。已鉴别和/或产生的这些启动子的特定组合可以分组在一起作为启动子梯,其在下文更详细地解释。
接着使所讨论的启动子梯与所关注的给定基因关联。因此,如果一个启动子梯具有启动子P1-P3(表示已经鉴别和/或产生以展现一系列表达强度,例如高>中>低的三个启动子)并且将启动子梯与CHO细胞基因背景中所关注的单个基因关联(即,将具有给定启动子的CHO细胞基因工程改造可操作地连接到给定目标基因),那么在除与目标基因相关的一或多个特定启动子以外,被工程改造的CHO细胞具有以其它方式相同的基因背景的条件下,三个启动子中的每一个的作用可以通过表征从每个组合尝试产生的被工程改造的CHO细胞中的每一个来确认。
通过这种方法进行工程改造的所得CHO细胞形成HTP基因设计库。
HTP基因设计库可以指通过这种方法形成的实际物理CHO细胞集合,其中每个成员细胞表示以其它方式相同的基因背景可操作地连接到特定目标基因的给定启动子,所述库称为“启动子交换CHO细胞库”。
此外,HTP基因设计库可以指基因扰动的集合,在这种情况下,给定启动子x可操作地连接到给定基因y,所述集合称为“启动子交换库”。
此外,人们可以使用包含启动子P1-P3的相同启动子梯来对CHO细胞进行工程改造,其中三个启动子中的每一个可操作地连接到10个不同基因目标。这个程序将产生30个CHO细胞系,除特定启动子可操作地连接到所关注的目标基因以外,所述CHO细胞系以其它方式假定为基因上相同。可以对这些30个细胞系进行适当筛选和表征并且产生另一个HTP基因设计库。
三个启动子和10个目标基因的前述实例仅是说明性的,这是因为所述概念可以在基于展现一系列表达强度而已经分组在一起的任何给定数量的启动子和任何给定数量的目标基因的情况下应用。
所属领域中的技术人员还将认识到能够将两个或更多个启动子可操作地连接到任何基因目标之前。因此,在一些实施例中,本公开教示了启动子交换库,其中来自启动子梯的1、2、3或更多个启动子可操作地连接到一或多个基因。
启动子梯的大小可以是任何范围。启动子梯仅需要具有可定量范围的表达强度。因此,高>中>低设计的三个启动子梯仅是示例性的。可以在启动子梯中具有两个启动子、三个启动子、四个启动子、五个启动子、六个启动子、七个启动子、八个启动子、九个启动子、10个启动子或更多个启动子。图6说明包含可以在图中所列目标基因的每一个的前方利用的八个启动子的假设启动子梯。
HTP基因设计库中的CHO细胞系的表征产生可以存储于任何数据存储构筑体中的信息和数据,包括关系型数据库、面向对象数据库或高度分布式NoSQL数据库。这种数据/信息可以是例如当给定启动子(例如P1-Pn)可操作地连接到给定基因目标时的作用。这种数据/信息还可以是由启动子(例如P1-Pn)中的两个或更多个可操作地连接到给定基因目标产生的组合效果的更广泛集合。
综上所述,利用各种启动子来驱动各种基因在生物体中的表达是一种优化所关注的特性的强大工具。本发明人所开发的启动子交换分子工具使用启动子序列梯,所述启动子交换分子工具已经表明在至少一种条件下改变至少一个基因座的表达。接着,使用高通量基因组工程改造将这种梯系统性地应用于生物体中的一组基因。基于多种方法中的任一种方法,确定这组基因影响所关注的特性的可能性较高。这些方法可以包括基于已知功能或对所关注的特性的影响而进行的选择,或基于先前确定的有益基因多样性而进行的算法选择。在一些实施例中,基因的选择可以包括给定宿主中的所有基因。在其它实施例中,基因的选择可以是给定宿主中的所有基因的随机选择的子集。
并且,如前述,可以基于任何数目的组学数据集选择用HTP启动子交换基因组工程改造工具调节的基因的选择。
接着评估含有连接到基因的启动子序列的个别细胞的所得HTP基因设计启动子交换CHO细胞库在高通量筛选模型中的性能,并且确定产生增加的性能的启动子-基因键和将信息存储于数据库中。
如所论述,基因扰动的集合(即,给定启动子x可操作地连接到给定基因y)形成“启动子交换库”,其可以用作CHO细胞处理中所用的潜在基因改变的来源。随时间推移,当针对CHO细胞背景的更大多样性实施基因扰动的更大集合时,每个库变得更强大,因为构建了实验证实的数据库,出于改变任何所关注的表型(例如产生各种抗体类别)的目的,其可以用于针对所关注的任何CHO细胞背景更精确并且可预测地设计靶向变化。
生物体中的基因转录水平是影响生物体行为的控制关键点。转录与翻译(蛋白质表达)紧密关联,并且哪种蛋白质以什么量表达决定了生物体行为。细胞表达数千种不同类型的蛋白质,并且这些蛋白质以多种复杂的方式发生相互作用以产生功能。通过系统性地改变一组蛋白质的表达水平,功能可以以由于复杂性而难以预测的方式改变。一些更改可以增加性能并且因此联接到评估性能的机制,这种技术允许产生具有改良的功能的生物体,例如CHO细胞和治疗蛋白产生。
在小分子合成路径的情形下,酶通过其小分子底物与产物,在开始于底物并且结束于所关注的小分子的直链或支链中发生相互作用。由于这些相互作用依序连接,因此这个系统呈现分布式控制,并且增强一种酶的表达仅可以增加路径通量直到另一种酶变成速率限制型为止。
代谢控制分析(MCA)是一种用于根据实验数据和第一原理确定哪种酶是速率限制型的方法。然而,MCA受到限制,因为其在每种表达水平变化之后需要广泛的实验以确定新的速率限制酶。
在这种情形下,启动子交换是有利的,因为通过将启动子梯应用于路径中的每种酶,发现限制酶,并且同一件事可以随后进行多轮以找到变成速率限制型的新酶。此外,由于功能读数最好是所关注的小分子的产量,因此确定哪种酶是限制的实验与提高产量的工程改造相同,从而缩短开发时间。
在一些实施例中,本公开教示了将PRO交换应用于编码多单元酶的个别子单元的基因。在又其它实施例中,本公开教示了对负责调节个别酶或整个生物合成路径的基因应用PRO交换技术的方法。
在一些实施例中,本公开的启动子交换工具用于鉴别所选基因目标的最优表达。
在一些实施例中,启动子交换的目标可以是增强目标基因的表达,以减少代谢或基因路径中的瓶颈。
在其它实施例中,启动子交换的目标可以是减少目标基因的表达,以在所述目标基因的表达并不需要时,避免宿主细胞中不必要的能量消耗。
在其它细胞系统(如转录、转运或信号传导)的情形下,可以使用各种合理方法先验地尝试并且找出哪种蛋白质是表达变化的目标和那种变化应该是什么变化。这些合理方法减少了扰动数量,所述扰动必须进行测试以找到改良性能的扰动,但是这样做的成本相当大。基因缺失研究鉴别出其存在对特定功能关键的蛋白质,并且接着可以过度表达重要基因。由于蛋白质相互作用的复杂性,因此这对于增强性能而言通常是无效的。已经开发出不同类型的模型,其试图根据第一原理描述转录或信号传导行为与细胞中的蛋白质含量的关系。这些模型通常表明其中表达变化的目标可以产生不同或改良的功能。这些模型所基于的假设过分简单化并且参数难以测量,因此其所产生的预测通常是不正确的,尤其对于非模型生物体来说。在基因缺失与建模的情况下,确定如何影响某种基因所需的实验不同于产生使性能改良的变化的后续工作。启动子交换避开了这些挑战,原因是突显了特定扰动的重要性的所构筑CHO细胞也已经是改良的CHO细胞。
因此,在特定实施例中,启动子交换是一种多步骤方法,其包含:
1.选择一组“x”个启动子充当“梯”。理想的是,这些启动子已经展示产生跨越多个基因组基因座的高度可变化表达,但唯一的要求是其在一定程度上扰动基因表达,例如高、中和低基因表达。
2.针对目标选择一组“n”个基因。这个组可以是已知对于特定功能重要的路径中的任何基因。然而,这也可以是任何基因组区,其包括没有已知功能的基因。并且包括“偏离路径”基因。可以基于算法选择基因目标。举例来说,可以使用基于先前产生的扰动之间的上位相互作用的算法选择。可以使用基于关于对目标的有益基因或通过随机选择的假设的其它选择准则。在其它实施例中,“n”个靶向基因可以包含非蛋白质编码基因,包括非编码RNA。
3.快速并且在一些实施例中并行进行以下基因修饰的高通量高通量CHO细胞工程改造:当原生启动子存在于目标基因n之前并且其序列已知时,用所述梯中的x个启动子中的每一个替换原生启动子。当原生启动子不存在或其序列未知时,将所述梯中的x个启动子中的每一个插入基因n之前(参见例如图6)。以这种方式构筑CHO细胞“库”(也称为HTP基因设计库),其中库的每个成员是可操作地连接到n目标的x启动子以其它方式相同的基因背景下的例子。如先前所描述,可以插入启动子组合,从而在构筑库时,扩展组合可能性的范围。
4.在依据一或多种度量的CHO细胞性能指示性能优化的情形下,高通量筛选CHO细胞库。
尤其可以扩展这种基本方法以提供CHO细胞性能的进一步改良:(1)将多个有益扰动合并到单一CHO基因背景中,以互动式方法一次一个进行;或作为多个变化在单一步骤中进行。多个扰动可以是定义变化的特定集合或部分随机化的变化组合库。举例而言,如果目标集是路径中的每一个基因,那么将扰动库的依序再生为先前细胞库的一或多个成员,则可以优化路径中的每个基因的表达水平,而不管以任何给定迭代哪个基因是速率限制的;(2)将从库的个别和组合生成产生的性能数据馈入到使用所述数据的算法中来预测基于每个扰动的相互作用的扰动的最优集合;以及(3)实施上述两种方法的组合。
启动子交换低水平表达变化形式
上文所论述的分子工具或技术表征为启动子交换,但不限于启动子并且可以包括系统地改变一组目标的表达水平的其它序列变化。
用于改变一组基因的表达水平的其它方法可以包括:a)去除全部形成目标基因的启动子;b)核糖体结合位点梯(或真核生物中的克扎克序列(Kozak sequences));c)去除核糖体结合位点;d)替换起始密码子;e)去除起始密码子;f)将各种mRNA稳定或不稳定序列连接到转录物的5'或3'端或任何其它位置处;g)将各种蛋白质稳定或不稳定序列连接在蛋白质中之任何位置处。
此外,基因敲除的使用可以用于完全去除目标基因的表达。因此,工具的“低表达”分布可以包括极少或“无表达”。
此外,涵盖CRISPRi技术(或任何类型的沉默或干扰技术,例如RNAi)的使用以抑制目标基因的表达。
2.上位定位-能够实现有益基因合并的预测分析工具
在一些实施例中,本公开教示了用于预测有益基因改变并且将其组合到CHO宿主细胞中的上位定位方法。可以通过前述HTP分子工具集(例如启动子交换)中的任一个产生基因改变,并且那些基因改变的作用将从衍生的HTP基因设计细胞库的表征中已知。因此,如本文所使用,术语上位定位包括鉴别可能会引起宿主性能增强的基因改变的组合(例如有益启动子/目标基因关联)的方法。
在实施例中,本公开的上位定位方法是基于以下想法:与来自相同功能群组的基因改变的组合相比,来自两个不同功能群组的有益基因改变的组合更有可能改良宿主性能。参见例如考斯坦佐(Costanzo),细胞的基因前景(The Genetic Landscape of aCell),科学(Science),第327卷,第5964期,2010年1月22日,第425-431页(以全文引用的方式并入本文中)。
来自相同功能群组的基因改变更可能通过相同机制来运作,并且因此更可能对总体宿主性能展现负上位或中性上位。相比之下,来自不同功能群组的基因改变更可能通过独立机制来运作,从而能够引起宿主性能改良并且在一些情况下产生协同效应。
因此,在一些实施例中,本公开教示了分析预测属于不同功能组的基因改变的方法。在一些实施例中,通过计算基因改变相互作用概况的余弦相似度(类似于相关系数)来确定功能群组相似度。本公开还通过相似度矩阵或树状图来说明比较基因改变。
因此,上位定位程序提供了一种对在一或多种基因背景下所应用的多种多样的基因改变进行分组和/或评级的方法,目的是将所述改变高效并且有效地合并到一或多种基因背景中。
在各方面中,进行合并,其目标是产生针对目标生物分子的产生进行优化的新颖CHO细胞系。通过所教示的上位定位程序,有可能鉴别基因变化的功能分组,并且此类功能分组使得能够进行使非期望的上位效应降到最低的合并策略。
如先前所论述,CHO细胞基因工程改造的合理方法由生物学的基础复杂性所混淆。对因果机制的理解不充分,尤其当尝试将各自具有所观测到的有益效应的两种或更多种变化进行组合时。有时,基因变化的此类合并产生积极结果(根据所期望的表型活性的增强所测量),但是净积极结果可能低于预期并且在一些情况下高于预期。在其它情况下,此类组合产生净中性效应或净负效应。这种现象称为上位,并且是基因工程改造的基本挑战之一。
本发明的HTP基因组工程改造平台解决与传统CHO细胞基因工程改造方法相关的许多问题。本发明的HTP平台使用自动化技术来一次进行数百或数千个基因变化。在特定方面,不同于上文所描述的合理方法,所公开的HTP平台使得能够并行构筑数千个CHO细胞背景以更有效地探索相关基因组空间的大子集。通过以系统性方式尝试“所有事物”,本发明的HTP平台避开了我们的有限生物学理解所引起的困难。
然而,同时,本发明的HTP平台面对的问题是根本上局限于基因组空间的组合爆发性规模,以及计算机技术解释所产生的数据集的有效性(鉴于基因相互作用的复杂性)。需要以使产生所期望结果的组合的非随机选择达到最大的方式探索广大组合空间的子集的技术。
在酶优化的情况下,在某种程度上相似的HTP方法已证明是有效的。在这个小生境问题中,所关注的基因组序列(约1000个碱基)编码物理构形有些复杂的蛋白质链。精确构形是由其构成性原子组分之间的集体电磁相互作用来确定。短基因组序列与物理上受限的折叠问题的这种组合使得其自身特别渴望优化策略。也就是说,有可能使序列在每个残基处发生个别的突变并且使所得突变体改组,以与序列活性反应(Sequence ActivityResponse)建模兼容的分辨率有效地对局部序列空间取样。
然而,针对生物分子进行完整基因组优化时,此类以残基为中心的方法因一些重要原因而不充分。首先,由于与生物分子的基因组优化相关的相关序列空间的指数增加。其次,由于增加了生物分子合成中调节、表达和代谢相互作用的复杂性。本发明人已经通过所教示的上位定位程序解决了这些问题。
出于更高效并且有效地将所述基因变化合并到一或多种基因背景中的目的,用于对基因变化的集合之间的上位相互作用建模的所教示方法在所属领域中具有开创性并且是高度需要的。
当描述上位定位程序时,术语“更高效”和“更有效”是指相对于特定表型目标,避免合并CHO细胞间的不期望上位相互作用。
产生用于在基因设计和HTP CHO细胞工程改造平台中使用的基因多样性池
在一些实施例中,本公开的方法表征为基因设计。如本文所使用,术语基因设计是指通过鉴别和选择具体基因的最佳变异体、基因的一部分、启动子、停止密码子、5'UTR、3'UTR或其它DNA序列来重构或改变宿主生物体的基因组,以设计和产生新的优良宿主细胞。
在一些实施例中,本公开的基因设计方法中的第一步骤是获得具有多种序列变异的初始基因多样性池群体,由所述群体可以重新构筑新的宿主基因组。
在一些实施例中,本文所教示的基因设计方法中的后续步骤将使用前述HTP分子工具集(例如启动子交换)中的一或多种构筑HTP基因设计库,所述HTP基因设计库接着通过提供用于在宿主细胞中测试的特定基因组改变库来充当基因组工程改造方法的驱动因素。
利用来自现有CHO细胞系的多样性池
在一些实施例中,本公开教示了用于鉴定各种不同CHO细胞系中存在的序列多样性的方法。因此,多样性池可以是用于分析的CHO细胞系的给定数字n,其中所述细胞的基因组表示“多样性池”。
已知存在的各种CHO细胞系具有不同表型特性。因此,通过测序已知CHO细胞系,可以基于这些全基因组序列产生CHO细胞多样性的初始池。
产生多样性的单一基因座突变
在一些实施例中,本公开教示了通过引入、缺失或替换基因组DNA的所选部分来对CHO细胞群体进行基因工程改造。因此,在一些实施例中,本公开教示了针对特定基因座靶向基因改变的方法。在其它实施例中,本公开教示了使用基因编辑技术(如ZFN、TALENS或CRISPR)选择性地编辑目标DNA区。
在其它实施例中,本公开教示了使宿主生物体外部的所选DNA区发生改变并且接着将序列插回到宿主生物体中。举例来说,在一些实施例中,本公开教示了使原生或合成启动子发生改变/工程改造,以产生具有各种表达特性的一系列启动子变异体(参见下文的启动子梯)。在其它实施例中,本公开与单基因优化技术兼容,如ProSAR(福克斯(Fox)等人,2007,“通过ProSAR驱动型酶演变来改良催化功能(Improving catalytic function byProSAR-driven enzyme evolution)”,自然·生物技术(Nature Biotechnology)第25卷(3)338-343,所述文献以引用的方式并入本文中)。
在一些实施例中,通过天然变异体的基因改组或用合成寡核苷酸改组、质粒-质粒重组、病毒质粒重组、病毒-病毒重组,来在活体外产生DNA的所选区域。在其它实施例中,通过易错PCR来产生基因组区。
启动子梯
启动子调节基因转录的速率并且可以通过多种方式影响转录。举例来说,不论内部或外部细胞条件,构成性启动子均引导其关联基因按恒定速率转录,而可调节启动子增加或降低基因转录的速率却取决于内部和/或外部细胞条件,例如生长速率、温度、对特定环境化学品的反应和类似条件。启动子可以从其正常细胞环境中分离出来并且进行工程改造以调节几乎任何基因的表达,使得能够有效修饰细胞生长、产物产量和/或所关注的其它表型。
在一些实施例中,本公开教示了用于产生启动子梯库以供下游基因设计方法使用的方法。举例来说,在一些实施例中,本公开教示了鉴别一或多个启动子和/或在宿主细胞内产生一或多个启动子的变异体的方法,所述变异体展现了一定范围的表达强度或优良的调节特性。已鉴别和/或产生的这些启动子的特定组合可以分组在一起作为启动子梯,其在下文更详细地解释。
在一些实施例中,本公开教示了启动子梯的使用。在一些实施例中,本公开的启动子梯包含展现连续系列的表达谱的启动子。举例来说,在一些实施例中,通过鉴别响应于刺激而展现一系列表达强度的天然、原生或野生型启动子,或通过构成性表达来产生启动子梯。这些已鉴别的启动子可以分组在一起作为启动子梯。
在其它实施例中,本公开教示了启动子梯的产生,所述启动子梯跨越不同条件展现一系列表达谱。举例来说,在一些实施例中,本公开教示了启动子梯的产生,所述启动子梯具有遍布在发酵的不同阶段的表达峰。在其它实施例中,本公开教示了启动子梯的产生,其具有响应于特定刺激的不同表达峰动力学。所属领域的技术人员将认识到,本公开的调节启动子梯可以表示任何一或多个调节谱。
在一些实施例中,本公开的启动子梯经设计以跨越响应的连续范围可预测的方式扰动基因表达。在一些实施例中,启动子梯的连续性质赋予CHO细胞改良程序额外的预测能力。举例来说,在一些实施例中,所选代谢路径的交换启动子可以产生宿主细胞性能曲线,其鉴别最优表达率或概况;产生如下CHO细胞,其中靶向基因不再是特定反应或基因级联的限制因素,同时还避免了在不适当情形下发生的不必要过度表达或错误表达。
在一些实施例中,通过以下产生启动子梯:鉴别展现所期望曲线的天然、原生或野生型启动子。在其它实施例中,通过使天然存在的启动子发生突变以衍生多种突变启动子序列来产生启动子梯。测试这些突变启动子中的每一种对目标基因表达的影响。在一些实施例中,测试经编辑的启动子跨越多种条件的表达活性,以便记录/表征/标注每个启动子变异体的活性并且存储于数据库中。随后将所得经编辑的启动子变异体组织成基于其表达强度而排列的启动子梯(例如高表达性变异体靠近顶部,并且减弱的表达靠近底部,因此产生术语“梯”)。
在一些实施例中,本公开教示了启动子梯是已鉴别的天然存在的启动子与天然/原生启动子的突变变异体启动子的组合。
在一些实施例中,选择前述已鉴别的天然存在的启动子序列中的一或多种以用于基因编辑。在实施例中,本公开的启动子是通过合成具有所期望序列的新启动子变异体来编辑。
在一些实施例中,启动子梯并不基于/衍生于原生启动子的启动子变异体。确切地说,在这些实施例中,启动子梯是异源启动子的汇编,所述异源启动子基于其表达强度范围而被选择以形成所述梯。
本公开的的启动子的非穷尽性清单提供于下表2中。启动子序列中的每一个可以称为异源启动子或异源启动子多核苷酸。
表2.本公开的所选启动子序列.
Figure BDA0002682783400000311
在表2中,启动子PGK具有最低表达强度;RSV和SV40具有培养基表达强度;并且EF1α和CMV是最强启动子。因此,这五个启动子可以基于任何组合组装到启动子梯中。将选择启动子中的至少两个,使得可以利用表达强度的可变“梯”。对于视觉描绘,请参见图9。
在一些实施例中,本公开的启动子包含与上表启动子核苷酸序列展现至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%或75%序列一致性的核苷酸序列。
假设驱动型多样性池和爬山法(Hill Climbing)
本公开的HTP基因组工程改造方法不需要先验基因知识来实现宿主细胞性能的显著增加。实际上,本公开教示了通过若干功能上不可知的方法产生多样性池的方法,其包括:鉴别预先存在的宿主细胞变异体中的基因多样性(例如测序CHO细胞系的基因组之间的比较);以及用启动子交换工具随机地靶向基因,而不偏好“已知路径”基因,以便以随机方式有效地“探索”基因组空间。
然而,在一些实施例中,本公开还教示了设计基因多样性的假设驱动型方法,所述多样性将用于下游HTP工程改造。也就是说,在一些实施例中,本公开教示了所选基因改变的定向设计。
在一些实施例中,本公开教示了基于基因标注、假设(或证实的)基因功能或基因组内的位置,用启动子交换工具产生所引导的基因改变或靶向。本公开的多样性池可以包括假设涉及在文献中与宿主细胞的提高的性能相关的特定代谢或基因路径的基因中的基因改变。在又其它实施例中,本公开的多样性池还可以包括基于算法预测函数或其它基因标注的基因改变。
在一些实施例中,本公开教示了用于对假设驱动型基因改变的目标进行优先级排序的基于“壳”的方法。用于基因目标优先级排序的壳隐喻是基于以下假设:仅少数初始基因负责宿主细胞性能的大部分特定方面(例如单一生物分子的产生)。这些初始基因位于壳的核心处,接着为第二层中的二级效应基因、第三壳中的三级效应以及...等。举例来说,在一个实施例中,壳的核心可能包含编码所选代谢路径内的关键生物合成酶的基因。位于第二壳上的基因可能包含编码生物合成路径内的其它酶的基因,所述酶负责产物转移或反馈信号传导。在此说明性隐喻下的第三层基因将可能包含负责调节生物合成路径的表达的调节基因。
本公开还教示了用于优化来自每种所鉴别基因改变的性能增加的“爬山”方法。在一些实施例中,本公开教示了HTP多样性库中的随机、天然或假设驱动型基因改变可以导致与宿主细胞性能相关的基因的鉴别。举例来说,本发明方法可以使用启动子交换工具来探索与治疗蛋白产生效率相关的不先验的目标基因的表达的调节;然而,在使用启动子交换工具并且观测有利的表型效应后,那么基因的重要性可以与在生物体的组合基因空间中的性能“山”的发现类似。
在一些实施例中,本公开教示了探索围绕已鉴别山的组合空间的方法。即,在一些实施例中,本公开教示了扰动已鉴别的基因和相关调节序列以便优化由那个基因节点(即,爬山)获得的性能增加。
爬山的概念还可以扩展超出单一基因序列周围的组合空间的探索。在一些实施例中,特定基因中的基因改变可以揭露特定代谢或基因路径对于宿主细胞性能的重要性。
细胞培养和发酵
本公开的细胞可以在适当时经修饰的常规营养培养基中培养以用于任何所期望的生物合成反应或选择。在一些实施例中,本公开教示了在诱导型培养基中培养以用于活化启动子。在一些实施例中,本公开教示了具有选择剂的培养基,包括转化子(例如抗生素)的选择剂。在一些实施例中,本公开教示了使细胞培养物在中针对细胞生长优化的培养基中生长。在其它实施例中,本公开教示了使细胞培养物在针对产物产量优化的培养基中生长。在一些实施例中,本公开教示了培养物在能够诱导细胞生长的培养基中的生长,并且还含有最终产物产生所需的前驱物。
培养条件(如温度、pH等)是适合与选用于表达的宿主细胞一起使用的那些条件,并且对于所属领域的技术人员将是显而易见的。如所提及,对于许多细胞(包括细菌、植物、动物(包括哺乳动物)和古细菌来源的细胞)的培养和产生的许多参考文献是可获得的。参见例如萨布鲁克(Sambrook),奥斯贝(Ausubel)(所有均见上文)以及伯杰(Berger),分子克隆技术指南,酶学方法(Guide to Molecular Cloning Techniques,Methods inEnzymology),第152卷,学术出版社有限公司(Academic Press,Inc.),加利福尼亚州圣地亚哥;以及弗瑞旭尼(Freshney)(1994),动物细胞的培养:基本技术手册(Culture ofAnimal Cells,a Manual of Basic Technique),第三版,威立-利斯(Wiley-Liss),纽约和其中引用的参考文献;多伊尔(Doyle)和格里菲思(Griffiths)(1997),哺乳动物细胞培养:基本技术(Mammalian Cell Culture:Essential Techniques),约翰·威利父子出版公司(John Wiley and Sons),纽约;忽玛逊(Humason)(1979),动物组织技术(Animal TissueTechniques),第四版,W.H.弗里曼公司(W.H.Freeman and Company);以及里奇埃德尔(Ricciardelle)等人,(1989),活体外细胞(In Vitro Cell),发育生物学(Dev.Biol.)25:1016-1024,所有文献以引用的方式并入本文中。关于植物细胞培养和再生,参见派恩(Payne)等人(1992),液体系统中的植物细胞和组织培养(Plant Cell and TissueCulture in Liquid Systems),约翰·威利父子公司,纽约州纽约市;冈堡(Gamborg)和菲利浦(Phillips)(编)(1995),植物细胞、组织和器官培养:基本方法施普林格实验室手册(Plant Cell,Tissue and Organ Culture;Fundamental Methods Springer LabManual),施普林格出版社(Springer-Verlag)(柏林海德堡,纽约);琼斯(Jones)编(1984),植物基因转移和表达方案(Plant Gene Transfer and Expression Protocols),胡马纳出版社(Humana Press),新泽西州特图瓦市(Totowa,N.J.)以及植物分子生物学(PlantMolecular Biology)(1993)R.R.D.克洛(R.R.D.Croy)编,生物科学出版社(BiosScientific Publishers),英国牛津(Oxford,U.K.)ISBN 0 12 198370 6,所有文献均以引用的方式并入本文中。细胞培养基一般性地阐述于阿特拉斯(Atlas)和帕克斯(Parks)(编),微生物培养基手册(The Handbook of Microbiological Media)(1993)CRC出版社(CRC Press),佛罗里达州波卡拉顿(Boca Raton,Fla.),所述文献以引用的方式并入本文中。细胞培养的额外信息见于可获得的商业文献中,如来自西格玛-奥德里奇公司(Sigma-Aldrich,Inc)(密苏里州圣路易(St Louis,Mo.))的生命科学研究细胞培养目录(LifeScience Research Cell Culture Catalogue)(“西格马-LSRCCC”)以及例如也来自西格玛-奥德里奇公司(密苏里州圣路易)的植物培养目录和增刊(The Plant CultureCatalogue and supplement)(“西格马-PCCS”),所述文献都以引用的方式并入本文中。
产物回收和定量
用于对所关注的产物的产生进行筛选的方法是所属领域的技术人员已知的并且在本说明书中论述。当筛选本公开的CHO细胞时,可以使用此类方法。
在一些实施例中,本公开教示了改良细胞的方法,所述细胞被设计成产生非分泌性细胞内产物。举例来说,本公开教示了改良细胞培养物的稳健性、产量、效率或总体合意性的方法,所述细胞培养物产生细胞内酶、油、药品或其它有价值的小分子或肽。非分泌性胞内产物的回收或分离可以通过所属领域中已知的溶解和回收技术(包括本文所描述的那些技术)来实现。
举例来说,在一些实施例中,本公开的细胞可以通过离心、过滤、沉降或其它方法收集。所收集的细胞接着通过任何适宜的方法来破坏,所述方法包括冻融循环、超声处理、机械破坏或使用细胞溶解剂或所属领域的技术人员熟知的其它方法。
所关注的所得产物(例如多肽)可以通过所属领域中已知的多种方法中的任一种回收/分离并且任选地加以纯化。举例来说,可以通过常规程序从营养物培养基中分离出产物多肽,所述常规程序包括(但不限于):离心、过滤、萃取、喷雾干燥、蒸发、色谱(例如离子交换、亲和力、疏水性相互作用、色谱焦聚和尺寸排阻),或沉淀。最后,可以在最终纯化步骤中使用高效液相色谱法(HPLC)。(参见例如细胞内蛋白质的纯化(Purification ofintracellular protein),如帕瑞(Parry)等人,2001,生物化学杂志(Biochem.J.)353:117和洪(Hong)等人,2007,应用微生物学和生物技术(Appl.Microbiol.Biotechnol.)73:1331中所描述,两个文献均以引用的方式并入本文中)。
除上文提及的参考文献以外,多种纯化方法是所属领域中众所周知的,包括例如以下文献中所阐述的那些纯化方法:桑德纳(Sandana)(1997)蛋白质的生物分离(Bioseparation of Proteins),学术出版社有限公司(Academic Press,Inc.);博拉格(Bollag)等人(1996)蛋白质方法(Protein Methods)第2版,威立-利斯,纽约;沃克(Walker)(1996)蛋白质方案手册(The Protein Protocols Handbook),胡马纳出版社,新泽西州;哈里斯(Harris)和安格尔(Angal)(1990)蛋白质纯化应用:实用方法(ProteinPurification Applications:A Practical Approach),牛津IRL出版社,英国牛津;哈里斯和安格尔,蛋白质纯化方法:实用方法(Protein Purification Methods:A PracticalApproach),牛津IRL出版社(IRL Press at Oxford),英国牛津;斯科普斯(Scopes)(1993)蛋白质纯化:原理和实践(Protein Purification:Principles and Practice)第3版,斯普林格出版社,纽约;詹森(Janson)和赖登(Ryden)(1998)蛋白质纯化:原理、高解析度方法和应用(Protein Purification:Principles,High Resolution Methods andApplications),第二版,威立-VCH(Wiley-VCH),纽约;以及沃克(Walker)(1998)CD-ROM的蛋白质方案(Protein Protocols on CD-ROM),胡马纳出版社,新泽西州,所有文献以引用的方式并入本文中。
在一些实施例中,本公开教示了改良细胞的方法,所述细胞被设计成产生分泌性产物。举例来说,本公开教示了改良细胞培养物的稳健性、产量、效率或总体合意性的方法,所述细胞培养物产生有价值的小分子或肽。
在一些实施例中,免疫方法可以用于检测和/或纯化由本公开的细胞产生的分泌性或非分泌性产物。在一种实例方法中,将使用常规方法针对产物分子(例如针对胰岛素多肽或其免疫原性片段)产生的抗体固定于珠粒上,在使内切葡聚糖酶结合的条件下与细胞培养基混合,并且沉淀。在一些实施例中,本公开教示了酶联免疫吸附分析(ELISA)的使用。
在其它相关实施例中,使用如以下文献中所公开的免疫色谱法:第5,591,645号美国专利、第4,855,240号美国专利、第4,435,504号美国专利、第4,980,298号美国专利,以及赛旺佩克(Se-Hwan Paek)等人,“一步免疫色谱快速分析方法的开发(Development ofrapid One-Step Immunochromatographic assay,Methods)”,22,53-60,2000),所述文献中的每一个以引用的方式并入本文中。通用的免疫色谱法通过使用两种抗体来检测样本。第一抗体存在于测试溶液中或存在于由多孔膜制得的呈大致矩形形状的测试片末端部分处,其中将测试溶液滴落。这种抗体用乳胶颗粒或金胶态颗粒标记(这种抗体在下文中称为经标记抗体)。当所滴落的测试溶液包括待检测的样本时,经标记抗体识别样本以便与样本结合。样本与经标记抗体的复合物通过毛细作用流向吸收体,所述吸收体由滤纸制成并且连接到与具有包括经标记的抗体的末端相对的末端。在流动期间,样本与经标记抗体的复合物由存在于多孔膜中部的第二抗体(其在下文中称为轻敲抗体(tapping antibody))识别并且捕获,并且因此,复合物以可见信号的形式出现在多孔膜的检测部件上并且被检测到。
在一些实施例中,本公开的筛选方法是基于光度检测技术(吸收、荧光)。举例来说,在一些实施例中,检测可以基于荧光团检测剂(如结合到抗体的GFP)的存在。在其它实施例中,光度检测可以基于来自细胞培养物的所期望产物的积聚。在一些实施例中,产物可以通过培养物的UV或来自所述培养物的提取物来检测。
所属领域中的技术人员将认识到,本公开的方法可与产生任何期望的所关注的生物分子产物的宿主细胞兼容。
选择标准和目标
应用于本公开方法的选择标准将根据细胞改良程序的特定目标而变化。本公开可以经调适以满足任何程序目标。举例来说,在一些实施例中,程序目标可以是使由CHO细胞产生的治疗蛋白的量达到最大。其它目标可以是更有效地产生治疗蛋白。在一些实施例中,程序目标可以是改良性能特征,如产量、效价、生产率、副产物消除、对过程偏移的容许度、最佳生长温度和生长速率。在一些实施例中,程序目标是改良宿主性能,如根据所关注的产物的体积生产率、比生产率、产量或效价所测量。
测序
在一些实施例中,本公开教示了本文所描述的生物体的全基因组测序。在其它实施例中,本公开还教示了作为对本公开方法的品质对照组的质粒、PCR产物和其它寡核苷酸的测序。大型项目和小型项目的测序方法为所属领域的技术人员所熟知。
在一些实施例中,用于核酸测序的任何高通量技术可以用于本公开的方法中。在一些实施例中,本公开教示了全基因组测序。在其它实施例中,本公开教示了鉴别基因变异的扩增子测序超深度测序。在一些实施例中,本公开还教示了用于库制备的新颖方法,包括片段化的同时添加标签(tagmentation)(参见WO/2016/073690)。DNA测序技术包括使用经标记的终止子或引物并且在厚片或毛细管中进行凝胶分离的经典双脱氧测序反应(桑格方法(Sanger method));使用可逆封端的经标记的核苷酸的边合成边测序、焦磷酸测序;454测序;与经标记的寡核苷酸探针库进行等位基因特异性杂交;使用与经标记的克隆库的等位基因特异性杂交、随后进行接合的边合成边测序;在聚合步骤期间并入经标记的核苷酸的实时监视;聚合酶克隆测序(polony sequencing);以及SOLiD测序。
在本公开的一个方面中,使用高通量测序方法,其包含对在固体表面上的个别分子进行空间分离的步骤,其中在所述固体表面上对所述个别分子进行并行测序。此类固体表面可以包括无孔表面(如索莱萨测序(Solexa sequencing),例如本特雷(Bentley)等人,自然,456:53-59(2008),或全面基因组学测序(Complete Genomics sequencing),例如德尔马纳茨(Drmanac)等人,科学(Science),327:78-81(2010));孔阵列,其可以包括珠粒或颗粒结合的模板(如用454,例如马古利斯(Margulies)等人,自然,437:376-380(2005)或离子激流测序(Ion Torrent sequencing),美国专利公开案2010/0137143或2010/0304982);微机械加工的膜(如用SMRT测序,例如艾德(Eid)等人,科学,323:133-138(2009)),或珠粒阵列(如用SOLiD测序或聚合酶克隆测序,例如金(Kim)等人,科学,316:1481-1414(2007))。
在另一个实施例中,本公开的方法包含在对固体表面上的分子进行空间分离之前或之后,将经分离的分子扩增。先前扩增可以包含基于乳液的扩增,如乳液PCR,或滚环扩增。还教示了基于索莱萨的测序,其中对固体表面上的个别模板分子进行空间分离,随后通过桥式PCR对其进行并行扩增以形成单独的克隆群体或集群,并且接着测序,如本特雷等人(上文所引用)和制造商说明书(例如TruSeqTM样品制备套组和数据表,启迪公司(Illumina,Inc.),加利福尼亚州圣地亚哥(San Diego,Calif.),2010)中所描述;并且进一步如以下参考文献所描述:第6,090,592号美国专利、第6,300,070号美国专利、第7,115,400号美国专利;以及EP0972081B1,所述文献都以引用的方式并入。
在一个实施例中,安置于固体表面上并在固体表面上扩增的个别分子形成密度为至少105个集群/cm2、或密度为至少5×105个/cm2、或密度为至少106个集群/cm2的集群。在一个实施例中,使用具有相对较高错误率的测序化学反应。在此类实施例中,由此类化学反应产生的平均品质得分是序列读段长度的单调下降函数。在一个实施例中,此类下降相当于0.5%的序列读段在位置1-75中具有至少一个错误;1%的序列读段在位置76-100中具有至少一个错误;以及2%的序列读段在位置101-125中具有至少一个错误。
全基因组基因设计准则的计算分析和效果预测
在一些实施例中,本公开教示了对并入给定CHO细胞中的特定基因改变的效果进行预测的方法。在其它方面,本公开提供产生应该并入给定CHO细胞中的所提议的基因改变的方法,以便使所述细胞具有特定表型特性。在给定方面中,本公开提供可以用于设计新颖宿主细胞的预测模型。
在一些实施例中,本公开教示了分析每一轮筛选的性能结果的方法和产生新提议的全基因组序列修饰的方法,所述全基因组序列修饰经预测以增强在下一轮筛选中的宿主细胞性能。
在一些实施例中,本公开教示了所述系统基于先前筛选结果对宿主细胞产生所提出的序列修饰。在一些实施例中,本发明系统的建议是基于紧接前一次筛选的结果。在其它实施例中,本发明系统的建议是基于前述筛选的一或多次的累积结果。
在一些实施例中,本发明系统的建议是基于先前开发的HTP基因设计库。举例来说,在一些实施例中,本发明系统经设计以保存先前筛选的结果,并且将相同或不同CHO细胞背景中的那些结果应用于不同项目。
在其它实施例中,本发明系统的建议是基于科学见解。举例来说,在一些实施例中,建议是基于基因的已知特性(来自如经标注的基因数据库和相关文献的来源)、密码子优化、转录滑移、各种“组学”数据,或其它假设驱动序列和宿主优化。
在一些实施例中,通过使用所公开的分子工具集中的一或多个来进行对系统所推荐的宿主细胞或预测模型的所提议序列进行修饰,例如:启动子交换或上位定位。
如上位定位章节中所提及,有可能通过一些优选预测模型估计假想CHO细胞的性能(也称为得分),所述假想CHO细胞是通过将来自HTP基因设计库的基因改变的集合合并到特定背景中来获得的。鉴于此类预测模型,有可能通过组合合并对所有可获取的假想CHO细胞进行评分和评级。
表征所构建CHO细胞的线性回归
由于易于实施和解释,线性回归是一种用于所描述的HTP基因组工程改造平台的有吸引力的方法。所得回归系数可以解释为可归因于每个基因变化的存在的相对CHO细胞性能的平均增加或减小,例如每个启动子:来自启动子交换活动的基因组合。
所教示的方法因此使用线性回归模型对所构建的CHO细胞进行描述/表征和评级,所述所构建的CHO细胞的基因组中已引入来自各种所教示库的各种基因扰动。
预测设计建模
使用来自所构筑的CHO细胞的数据的上文所描述的线性回归模型可以用于对尚未构建的CHO细胞进行性能预测。
程序可以概述如下:电脑模拟产生所有可能的基因变化构形→使用回归模型预测相对细胞性能→按性能排序候选细胞设计。因此,通过利用回归模型预测迄今尚未构建的细胞的性能,所述方法允许较高性能细胞的产生,同时进行更少的实验。
产生构形
当构筑模型来预测尚未构建的CHO细胞的性能时,第一步骤是产生设计候选物的序列。这是如下进行:固定细胞中的基因变化的总数,并且接着界定基因变化的所有可能组合。举例来说,可以设置可能的基因变化/扰动的总数,并且接着决定设计潜在基因变化的所有可能组合,这将产生候选细胞设计。可以使用以下来计算来自n个可能成员的大小为r的非冗余分组的数目:n!/((n-r)!*r!)。
预测新CHO细胞设计的性能
使用以组合配置作为输入的以上所构筑的线性回归,接着可以预测每个候选设计的预期相对性能。
当使用新观测结果以迭代方式再训练和再拟合模型时,预测精确度应该随时间增加。模型预测品质可以通过若干种方法评估,包括指示预测值与观测值之间的关联强度的相关系数,或是平均模型误差的度量的均方根误差。使用所选度量标准进行模型评估,所述系统可以界定应该对模型再训练时所用的规则。
对以上模型的几个未陈述假设包括:(1)不存在上位相互作用;以及(2)用于构建预测模型的基因变化/扰动全部是在与所提议的基因变化组合相同的背景中作出。
针对二级特点进行过滤
上述说明性实例集中于基于所预测的宿主细胞性能的线性回归预测。在一些实施例中,本发明的线性回归方法还可以应用于非生物分子因素,如饱和生物质、抗性或其它可测量的宿主细胞特点。因此,本公开的方法还教示了在对待构建的候选物进行优先级排序时,考虑除所预测性能外的其它特点。假设存在额外的相关数据,那么回归模型中也包括非线性项。
变化的多样性
构筑前述模型时,由于上位相互作用的存在,因此不能确定基因变化真正具有叠加性(如根据线性回归所假定并且如上述假设所提及)。因此,对基因变化差异性的了解可以用于提高正叠加作用的可能性。如果知道例如来自上述评级靠前的CHO细胞的基因变化位于相同代谢路径具有具有相似的性能特征,那么这个信息可以用于选择变化组成有差异的另一种评级靠前的设计。如与上位定位有关的上述章节中所描述,可以过滤所预测的最佳基因变化以使选择限于响应曲线有充分差异的基因改变。可替代地,线性回归可以是使用相似度矩阵进行权重预测的加权最小二乘法回归。
所预测性能的多样性
最后,可以选择设计所预测性能居中或不良的CHO细胞,以便验证并且随后改良预测模型。
迭代CHO细胞设计优化
总之,参考图4的流程图,迭代预测CHO细胞设计工作流程可以描述如下:
·产生输入和输出变量的训练集,例如基因变化作为输入值和性能特点作为输出值(3302)。可以由分析设备214基于先前基因变化和并入那些基因变化的CHO细胞的对应测量性能来执行产生。
·开发基于训练集的初始模型(例如线性回归模型)(3304)。这可以由分析设备214执行。
·产生设计候选物(3306)
○在一个实施例中,分析设备214可以变化组合的形式确定对于背景细胞所产生的基因变化的数目。为了表示这些变化,分析设备214可以向解释器204提供表示那些变化组合的一或多个DNA规格表达。(这些基因变化或并入那些变化的宿主细胞可以称为“测试输入”。)解释器204解释一或多个DNA规格,并且执行引擎207执行DNA规格以将已解决的输出填入DNA规格,所述输出表示对于那些变化的个别候选设计细胞。
·基于所述模型,分析设备214预测每种候选设计的预期性能(3308)。
·分析设备214选择有限数目的具有最高预测性能的候选设计,例如100种(3310)。
○如本文在别处相对于上位定位所描述,分析设备214可以通过例如针对上位效应过滤最佳设计,或将上位纳入预测模型中来解释如上位的二级效应。
·基于由发订单引擎208产生的工厂订单构建经过滤的候选细胞(在工厂210处)(3312)。
·分析设备214测量所选细胞的实际性能,基于其优良的实际性能选择有限数目的那些所选细胞(3314),并且将设计变化和其所得性能添加到预测模型中(3316)。
·分析设备214接着迭代返回到新设计候选细胞的产生(3306),并且继续迭代直到满足停止条件为止。停止条件可以包含例如满足如所关注的治疗蛋白的产量的性能度量标准的至少一个细胞的所测量性能。
机器学习以优化CHO细胞设计
在上述实例中,CHO细胞设计的迭代优化采用反馈和线性回归来实施机器学习。一般来说,机器学习可以描述为在使用有限数目个经标记数据实例优化信息任务(如分类或回归)的性能准则,例如参数、技术或其它特点,并且接着对未知数据执行相同任务。
在受监督的机器学习(如上述线性回归实例中的机器学习)中,机器(例如计算装置)例如通过鉴别训练数据所展现的模式、类别、统计学关系或其它属性来学习。学习结果接着用于预测新数据是否展现相同的图案、类别、统计学关系或其它属性。
当可获得训练数据时,本公开的实施例可以使用其它受监督的机器学习技术。在缺乏训练数据的情况下,实施例可以使用无监督的机器学习。可替代地,实施例可以使用半监督机器学习,其使用少量的经标记数据和大量的未标记数据。实施例也可以使用特点选择来选择最相关特点的子集以优化机器学习模型的性能。取决于所选的机器学习方法的类型,作为线性回归的替代方案或除线性回归之外,实施例可以使用例如逻辑回归、神经网络、支持向量机(SVM)、决策树、隐式马尔可夫模型(hidden Markov model)、贝叶斯网络(Bayesian network)、格兰施密特正交化(Gram Schmidt)、基于强化的学习、基于集群的学习(包括层次集群)、基因算法,和所属领域中已知的任何其它适合的学习机器。确切地说,实施例可以使用逻辑回归以提供分类的概率(例如基因按照不同功能群组的分类)以及分类本身。参见例如席维德(Shevade),使用稀疏逻辑回归进行基因选择的简单高效算法(Asimple and efficient algorithm for gene selection using sparse logisticregression),生物信息学(Bioinformatics),第19卷,第17期,2003,第2246-2253页;冷(Leng)等人,对暂时基因表达数据使用功能数据分析的分类(Classification usingfunctional data analysis for temporal gene expression data),生物信息学,第22卷,第1期,牛津大学出版社(Oxford University Press)(2006),第68-76页,所有文献都以全文引用的方式并入本文中。
实施例可以使用图形处理单元(GPU)加速架构,已发现其在执行机器学习任务方面越来越流行,尤其是以称为深度神经网络(DNN)的形式。本公开的实施例可以使用基于GPU的机器学习,如以下文献中所描述的机器学习:基于GPU的深度学习推理:性能和能力分析(GPU-Based Deep Learning Inference:A Performance and Power Analysis),英伟达白皮书(NVidia Whitepaper),2015年11月;达耳(Dahl)等人,用于QSAR预测的多任务神经网络(Multi-task Neural Networks for QSAR Predictions),多伦多大学计算机科学系(Dept.of Computer Science,Univ.of Toronto),2014年6月(arXiv:1406.1231[stat.ML]),所有文献都以全文引用的方式并入本文中。适用于本公开实施例的机器学习技术也可以见于其它参考文献中:里伯莱奇特(Libbrecht)等人,机器学习在遗传学和基因组学中的应用(Machine learning applications in genetics and genomics),自然评论:遗传学(Nature Reviews:Genetics),第16卷,2015年6月;卡什亚普(Kashyap)等人,生物信息学中的大数据分析:机器学习视角(Big Data Analytics in Bioinformatics:AMachine Learning Perspective),Latex类文件杂志(Journal of Latex Class Files),第13卷,第9期,2014年9月;普隆浦纳姆(Prompramote)等人,生物信息学中的机器学习(Machine Learning in Bioinformatics),生物信息学技术(BioinformaticsTechnologies)的第5章,第117-153页,施普林格(Springer),柏林海德堡(BerlinHeidelberg),2005,所有文献都以全文引用的方式并入本文中。
基因组设计和工程改造即服务
在本公开的实施例中,图2的LIMS系统软件可以于图3的云计算系统3202中实施,以使得多个用户能够根据本公开的实施例设计并且构建CHO细胞。图3说明了根据本公开的实施例的云计算环境3204。客户端计算机3206,如图3中所说明的那些计算机,通过网络3208(如因特网)接入LIMS系统。在实施例中,LIMS系统应用软件3210驻留于云计算系统3202中。LIMS系统可以采用使用一或多个处理器的一或多种计算系统,所述计算系统的类型说明于图3中。云计算系统自身包括网络接口3212,以使LIMS系统应用3210通过网络3208介接到客户端计算机3206。网络接口3212可以包括应用程序编程接口(applicationprogramming interface;API)以使客户端计算机3206处的客户应用能够访问LIMS系统软件3210。特别地,通过API,客户端计算机3206可以访问LIMS系统200的组件,包括(但不限于):运行输入接口202、解释器204、执行引擎207、发订单引擎208、工厂210以及测试设备212和分析设备214的软件。软件即服务(software as a service;SaaS)软件模块3214向客户端计算机3206提供LIMS系统软件3210即服务。云管理模块3216管理客户端计算机3206对LIMS系统3210的访问。云管理模块3216可以实现采用多租户应用、虚拟化的云架构或所属领域中已知服务多个用户的其它架构。
基因组自动化
本公开方法的自动化能够同时对来自多个测试细胞系的目标产物进行高通量表型筛选和鉴别。
前述基因组工程改造预测建模平台是以如下事实为前提的:以高通量方式构筑数百和数千个细胞。下文所描述的机器人和计算机系统是借以执行此类高通量方法的结构性机构。
在一些实施例中,本公开教示了改良宿主细胞生产率的方法。作为这种方法的一部分,本公开教示了组装DNA、构建新细胞、在培养盘中筛选和在模型中筛选以用于工业治疗蛋白生产的方法。在一些实施例中,本公开教示了通过自动化机器人技术来辅助产生和测试新宿主细胞的一或多种上述方法。
HTP机器人系统
在一些实施例中,本公开的自动化方法包含机器人系统。本文概述的系统通常涉及96孔或384孔微量滴定盘的使用,但是如所属领域的技术人员将了解,可以使用任何数目的不同盘或配置。另外,本文所概述的步骤中的任一个或所有可以自动进行;因此,例如,系统可以完全或部分自动化。
在一些实施例中,本公开的自动化系统包含一或多个工作模块。举例来说,在一些实施例中,本公开的自动化系统包含经调适用于以下的模块:启动子梯产生、测序和构建DNA、转染、筛选、蛋白质测试/表征和CHO细胞克隆选择(参见图1)。
如所属领域的技术人员将了解,自动化系统可以包括广泛多种组件,包括(但不限于):液体处理器;一或多个机器人臂;用于放置微量盘的盘处理器;盘密封件、盘穿孔机、用于去除和替换非交叉污染盘上的孔盖的自动化盖处理器;用一次性吸头进行样品分配的一次性吸头组合件;用于样品分配的可洗吸头组合件;96孔加载块;集成式热循环仪;经冷却的试剂架;微量滴定盘移液管位置(任选地经冷却);用于盘和吸头的堆叠塔;磁珠处理站;过滤系统;盘振荡器;条形码阅读器和施加器;以及计算机系统。
在一些实施例中,本公开的机器人系统包括使得能够高通量移液的自动化液体和颗粒处理,以执行基因靶向和重组应用工艺中的所有步骤。这包括液体和颗粒操控,如抽吸、分配、混合、稀释、洗涤、精确体积转移;收回和丢弃移液管吸头;以及利用单次样品抽吸来重复吸移相同体积用于多次递送。这些操控是无交叉污染的液体、颗粒、细胞和生物体转移。仪器执行微量盘样品向过滤器、膜和/或子培养盘的自动化复制、高密度转移、全盘连续稀释以及高容量操作。
在一些实施例中,本公开的定制自动化液体处理系统是TECAN机器(例如定制的TECAN Freedom Evo)。
在一些实施例中,本公开的自动化系统与用于多孔盘、深孔盘、方孔盘、试剂槽、试管、小试管、微量离心管、冷冻管、过滤器、微阵列晶片、光纤、珠粒、琼脂糖和丙烯酰胺凝胶的平台兼容,并且将其它固相基质或平台容纳于可升级的模块化台板上。在一些实施例中,本公开的自动化系统含有至少一个模块化台板用于多位置工作表面,以便放置源样品和输出样品、试剂、样品和试剂稀释液、分析盘、样品和试剂储集器、移液管吸头和活动的吸头洗涤站。
在一些实施例中,本公开的自动化系统包括高通量电穿孔系统。在一些实施例中,高通量电穿孔系统能够在96孔或384孔盘中转化细胞。在一些实施例中,高通量电穿孔系统包括
Figure BDA0002682783400000431
高通量电穿孔系统、BTXTM
Figure BDA0002682783400000432
Gene Pulser MXcellTM或其它多孔电穿孔系统。
在一些实施例中,集成式热循环仪和/或热调节器是用于稳定热交换器,如受控区块或平台的温度,以对培育样品提供从0℃到100℃的精确温度控制。
在一些实施例中,本公开的自动化系统与能够以机器人方式操控液体、颗粒、细胞和多细胞生物体的可更换机器头(单通道或多通道)兼容,所述机器头具有单个或多个磁性探针、亲和探针、复制器或吸移管。多孔或多管式磁性分离器和过滤站以单个或多个样品形式操控液体、颗粒、细胞和生物体。
在一些实施例中,本公开的自动化系统与相机视觉和/或光谱仪系统兼容。因此,在一些实施例中,本公开的自动化系统能够检测和记录进行中的细胞培养物中的颜色和吸收变化。
在一些实施例中,本公开的自动化系统经设计对于多个硬件附件具有柔性和可适应性,以允许所述系统执行多个应用。软件程序模块允许方法的产生、修改和运行。系统的诊断模块允许设置、仪器校准和电动机操作。定制的工具、实验室器具以及液体和颗粒转移模式允许编程和执行不同应用。数据库允许方法和参数的存储。机器人和计算机接口允许仪器之间的通信。
所属领域中的技术人员将认识到,各种机器人平台能够进行本公开的HTP工程改造方法。
计算机系统硬件
图5说明了根据本公开实施例的计算机系统800的实例,其可以用于执行非暂时性计算机可读媒体(例如存储器)中所存储的程序代码。计算机系统包括输入/输出子系统802,其可以根据应用用于连接人类用户和/或其它计算机系统。I/O子系统802可以包括例如键盘、鼠标、图形用户接口、触摸屏,或用于输入的其它接口,以及例如LED或其它平面屏幕显示器,或用于输出的其它接口,包括应用程序接口(API)。本公开实施例的其它元件,如LIMS系统的组件,可以用计算机系统(如计算机系统800)实施。
程序代码可以存储于非暂时性媒体中,如辅助存储器810或主存储器808或这两者的永久性存储器中。主存储器808可以包括易失性存储器,如随机存取存储器(RAM),或非易失性存储器,如只读存储器(ROM),以及不同层次的高速缓存存储器以用于更快地访问指令和数据。辅助存储器可以包括永久性存储器,如固态驱动器、硬盘驱动器或光盘。一或多个处理器804从一或多个非暂时性媒体中读取程序代码并且执行所述代码以使计算机系统能够实现本文实施例所进行的方法。所属领域的技术人员将理解,一或多个处理器可以摄取源码,并且将源码解释或编译成在一或多个处理器804的硬件门级处可理解的机器代码。一或多个处理器804可以包括用于处理计算密集型任务的图形处理单元(GPU)。尤其是在机器学习中,一或多个CPU 804可以将大量数据的处理分流到一或多个GPU 804。
一或多个处理器804可以通过一或多个通信接口807(如网络接口卡、WiFi收发器等)与外部网络通信。总线805以通信方式联接I/O子系统802、一或多个处理器804、周边装置806、通信接口807、存储器808和永久性存储器810。本公开的实施例不限于这种代表性架构。替代实施例可以采用不同的配置和组件类型,例如用于输入-输出组件和存储器子系统的单独总线。
所属领域的技术人员将理解,本公开的实施例中的一些或全部元件和其伴随操作可以完全或部分地通过一或多个计算机系统来实施,所述计算机系统包括一或多个处理器和一或多个存储器系统,如计算机系统800的那些。确切地说,本文所描述的LIMS系统200和任何机器人和其它自动化系统或装置的元件可以计算机实施。一些元件和功能可以在本地实施并且其它元件和功能可以按通过不同服务器的网络分布方式,例如按客户端-服务器方式实施。确切地说,可以使服务器一侧的操作按软件即服务(SaaS)方式供多个客户使用,如图3中所示。
术语组件在此背景中大体上是指软件、硬件或固件(或其任何组合)组件。组件典型地是可以使用指定的一或多个输入来产生有用数据或其它输出的功能组件。组件可以是独立的或可以不是独立的。应用程序(也称为“应用”)可以包括一或多个组件,或组件可以包括一或多个应用程序。
一些实施例包括所述组件中的一些、全部或不包括以及其它模块或应用组件。再者,各种实施例可以将这些组件中的两种或更多种合并成单一模块和/或使这些组件中的一或多种的一部分功能与不同组件关联。
术语“存储器”可以是用于存储信息的任何装置或机构。根据本公开的一些实施例,存储器旨在涵盖(但不限于):易失性存储器、非易失性存储器和动态存储器中的任何类型。举例来说,存储器可以是随机存取存储器、存储器存储装置、光学存储器装置、磁性媒体、软盘、磁带、硬盘驱动器、SIMM、SDRAM、DIMM、RDRAM、DDR RAM、SODIMMS、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、光盘、DVD等。根据一些实施例,存储器可以包括一或多个磁盘驱动器、闪存驱动器、数据库、本地高速缓冲存储器、处理器高速缓存存储器、关系数据库、平面数据库、服务器、基于云的平台等。另外,所属领域的技术人员将了解,可以使用存储信息的许多其它装置和技术作为存储器。
存储器可以用于存储指令以便在处理器上运行一或多个应用或模块。举例来说,存储器在一些实施例中可以用于容纳执行本申请案中所公开的模块和/或应用中的一或多个的功能所需的全部或一些指令。
基于基因设计预测的HTP CHO细胞工程改造:示例性工作流程
在一些实施例中,本公开教示了基于本公开的计算分析系统的建议的新宿主生物体的定向工程改造。
在一些实施例中,本公开与所有基因设计和克隆方法兼容。也就是说,在一些实施例中,本公开教示了传统克隆技术的使用,如聚合酶链反应、限制酶消化、接合、同源重组、RT PCR以及所属领域中通常已知的并且揭示于例如以下文献中的其它技术:萨布鲁克(Sambrook)等人(2001),分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),普莱恩维尤(Plainview),纽约,所述文献以引用的方式并入本文中。
在一些实施例中,克隆序列可以包括来自本文所教示的HTP基因设计库中的任一个的可能序列,例如:来自启动子交换库的启动子。
此外,特定构筑体中应该包括的恰当序列组合可以通过上位定位功能知悉。
在其它实施例中,克隆序列还可以包括基于合理设计(假设驱动型)的序列和/或基于其它来源(如科学出版物)的序列。
构建特异性DNA寡核苷酸
在一些实施例中,本公开教示了插入和/或替换和/或改变和/或删除宿主细胞生物体的DNA片段。在一些方面中,本文所教示的方法涉及构建将并入宿主生物体基因组中的所关注的寡核苷酸(即,目标DNA片段)。在一些实施例中,本公开的目标DNA片段可以通过所属领域中已知的任何方法获得,所述方法包括:复制或从已知模板剪切、突变或DNA合成。在一些实施例中,本公开与用于产生目标DNA序列的市售基因合成产物(例如GeneArtTM、GeneMakerTM、GenScriptTM、AnagenTM、Blue HeronTM、EntelechonTM,GeNOsys有限公司,或QiagenTM)兼容。
在一些实施例中,目标DNA片段经设计以将启动子并入宿主生物体的所选DNA区中。
在一些实施例中,本发明方法中所用的寡核苷酸可以使用所属领域中已知的酶或化学合成方法中的任一种来合成。寡核苷酸可以在固体载体上合成,所述固体载体如受控孔玻璃(CPG)、聚苯乙烯珠粒,或由可以含有CPG的热塑性聚合物构成的膜。寡核苷酸还能够以并行的微尺度在阵列上使用微流体(田(Tian)等人,分子生物系统(Mol.BioSyst.),5,714-722(2009))或提供两者组合的已知技术(参见雅各布森(Jacobsen)等人,第2011/0172127号美国专利申请案)合成。
按阵列方式或通过微流体方式的合成通过减少试剂使用降低了成本而提供优于常规固体载体合成的优势。基因合成所需的规模较低,因此由阵列或通过微流体合成的寡核苷酸产物的规模是可接受的。然而,所合成的寡核苷酸的品质低于使用固体载体合成时(参见田,见下文;还参见施泰勒(Staehler)等人,第2010/0216648号美国专利申请案)。
自从二十世纪八十年代首次描述了传统的四步骤亚磷酰胺化学方法以来,所述化学方法已经实现大量的进展(参见例如丝兹查勒(Sierzchala)等人,美国化学学会杂志(J.Am.Chem.Soc.),125,13427-13441(2003),其使用过氧基阴离子脱除保护基;早川(Hayakawa)等人,第6,040,439号美国专利,其关于替代保护基团;阿杂叶维(Azhayev)等人,四面体(Tetrahedron)57,4977-4986(2001),其关于通用载体;考兹洛维(Kozlov)等人,核苷、核苷酸和核酸(Nucleosides,Nucleotides,and Nucleic Acids),24(5-7),1037-1041(2005),其关于通过使用大孔隙CPG改良较长寡核苷酸的合成;以及丹哈(Damha)等人,NAR,18,3813-3821(1990),其关于改良的衍生化)。
不论合成的类型,所得寡核苷酸接着可以形成用于较长寡核苷酸的较小构建嵌段。在一些实施例中,较小寡核苷酸可以使用所属领域中已知的方案连接在一起,如聚合酶链组装体(PCA)、连接酶链反应(LCR)和热力学平衡的由内而外合成(TBIO)(参见兹阿尔(Czar)等人,生物技术趋势(Trends in Biotechnology),27,63-71(2009))。在PCA中,在多个循环(典型地约55个循环)中粘接并且延伸跨越所要较长产物的整个长度的寡核苷酸,以最终获得全长产物。LCR使用接合酶将两个寡核苷酸连接,所述两个寡核苷酸均粘接到第三寡核苷酸。TBIO合成开始于所要产物的中心并且通过使用重叠寡核苷酸而在两个方向上逐渐地延伸,所述重叠寡核苷酸与位于基因的5'端的正向链同源并且与位于基因的3'端的反向链非同源。
另一种合成较大双链DNA片段的方法是通过顶端链PCR(TSP)合并较小寡核苷酸。在这种方法中,多种寡核苷酸跨越所要产物的整个长度并且含有与一或多个相邻寡核苷酸的重叠区域。可以使用通用正向和反向引物执行扩增,并且通过扩增的多个循环来形成全长双链DNA产物。这种产物接着可以经历任选的差错校正和进一步的扩增,产生所要双链DNA片段最终产物。
在TSP的一种方法中,经组合而形成所要全长产物的较小寡核苷酸集合的长度在40-200个碱基之间并且彼此重叠至少约15-20个碱基。出于实际目的,重叠区域的长度最小应该足以确保寡核苷酸的特异性粘接并且具有足够高的解链温度(Tm),以便在所用反应温度下粘接。重叠可以延伸到给定寡核苷酸被相邻寡核苷酸完全叠覆的程度。重叠的量似乎对最终产物的品质无任何影响。组装体中的第一个和最后一个寡核苷酸构建嵌段应该含有正向和反向扩增引物的结合位点。在一个实施例中,第一个和最后一个寡核苷酸的末端序列含有互补的相同序列以允许使用通用引物。
宿主细胞的转染
在一些实施例中,本公开教示了构筑能够将所要目标DNA区(例如含有特定启动子和/或GOI,如抗体)插入到宿主生物体(例如CHO细胞)的基因组中的载体的方法。
在一些实施例中,本公开与适合于转化或转染到宿主生物体中的任何载体兼容。
在一些实施例中,本公开教示了与宿主细胞兼容的穿梭载体的使用。本文所提供的方法中使用的穿梭载体可以包含如本文所描述用于选择和/或反向选择的标记。标记可以是所属领域中已知和/或本文所提供的任何标记。穿梭载体可以进一步包含任何一或多个调节序列和/或适用于如所属领域已知的所述穿梭载体的组装件的序列。调节序列可以是所属领域中已知或本文所提供的任何调节序列,例如由宿主细胞的基因机构所用的启动子、起始、停止、信号、分泌和/或终止序列。在某些情况下,可以将目标DNA插入从任何存储库或目录产物获得的载体、构筑体或质粒中,如商业载体(参见例如DNA2.0定制版或
Figure BDA0002682783400000481
载体)。在某些情况下,可以将目标DNA插入从任何存储库或目录产物获得的载体、构筑体或质粒中,如商业载体(参见例如DNA2.0定制版或
Figure BDA0002682783400000482
载体)。
在一些实施例中,本公开的组装/克隆方法可以采用以下组装策略中的至少一种:i)II型常规克隆;ii)II型S介导或“金门(Golden Gate)”克隆(参见例如恩格勒C.(Engler,C.),R.康德兹(R.Kandzia)和S.马里约内(S.Marillonnet),2008,“具有高通量能力的一锅一步精确克隆方法(A one pot,one step,precision cloning method with high-throughput capability)”,公共科学图书馆综合卷(PLos One)3:e3647;科特纳I.(Kotera,I.)和T.长井(T.Nagai),2008,“使用DNA聚合酶抑制剂和IIS型限制酶进行粗PCR产物的高通量和单管式重组(A high-throughput and single-tube recombination ofcrude PCR products using a DNA polymerase inhibitor and type IIS restrictionenzyme)”,生物技术杂志(J Biotechnol)137:1-7;韦伯E.(Weber,E.),R.格鲁兹勒(R.Gruetzner),S.沃尔纳(S.Werner),C.恩格勒(C.Engler)和S.马里约内(S.Marillonnet),2011,通过金门克隆组装设计者TAL效应子(Assembly of Designer TALEffectors by Golden Gate Cloning),公共科学图书馆综合卷6:e19722);iii)
Figure BDA0002682783400000483
重组;iv)
Figure BDA0002682783400000484
克隆、核酸外切酶介导的组装(艾斯兰迪斯(Aslanidis)和德迥(de Jong),1990,“PCR产物的非连接依赖性克隆(LIC-PCR)(Ligation-independentcloning of PCR products(LIC-PCR))”,核酸研究(Nucleic Acids Research),第18卷,第20 6069期);v)同源重组;vi)非同源末端连接;vii)吉布森组装(Gibson assembly)(吉布森等人,2009,“长达数百个千碱基的DNA分子的酶促组装(Enzymatic assembly of DNAmolecules up to several hundred kilobases)”,自然方法(Nature Methods),6,343-345)或其组合。基于IIS型的模块化组装策略公开于PCT公开案WO 2011/154147中,其公开内容以引用的方式并入本文中。
尽管质粒并不天然存在于哺乳动物中,但科学家仍可以使用合成载体和经培养的哺乳动物细胞再取得基于质粒的研究的益处。当然,这些哺乳动物载体必须与其转染成的细胞类型兼容-例如,细菌复制起点(ORI)将不允许在哺乳动物细胞中的质粒复制,并且杀死细菌的毒素可能对哺乳动物细胞不具有任何可辨别的作用。
将基因物质(如质粒)引入哺乳动物细胞中的方式是称为转染的方法。转染在某种程度上与细菌转化相当(将DNA引入到细菌细胞中);然而,技术和试剂不同。将质粒转染到哺乳动物细胞中相当简单,并且所得细胞可以瞬时地表达质粒DNA(类似于细菌)或将基因物质直接并入到基因组中以形成稳定转染。不同于细菌转化,科学家不会“选择”以相同方式携带质粒的细胞。下文所描述的选择方法通常在产生稳定细胞系时采用并且不用于一般质粒选择。实际上,通常采用报告基因来容易地监测细胞中的转染效率和表达水平。理想地,所选报告子对细胞是独特的,从质粒表达,并且可以方便地分析。对你所关注的基因的直接测试可以是评估转染成功的另一种方法。GFP通常用作报告子。
对于许多实验,经转染的质粒足够短暂地表达。因为转染过程中引入的DNA并不整合到核基因组中,所以在不存在质粒复制的情况下,外来DNA将随时间推移而降解或稀释。然而,这可能并不是取决于实验的持续时间或其它参数的问题。哺乳动物细胞在比细菌慢得多的速率下加倍(分别为约24小时和20分钟)。因此,确保质粒在细胞中复制不总是至关重要的,因为许多这些实验都在转染的48小时内结束。
当然,有可能不想要质粒耗尽,但仍想要使用瞬时转染方法。因为不存在“天然”哺乳动物ORI,所以科学家已经霸占基于病毒的ORI以填充空隙。然而,这些ORI需要在细胞内以反式表达的额外组分以用于有效复制。表达埃-巴二氏病毒(Epstein-Barr virus;EBV)核抗原1(EBNA1)或SV40较大T抗原(293E或293T细胞)的细胞系分别允许含有病毒EBV或SV40 ORI的质粒的游离扩增。这些病毒组分的存在极大地降低质粒稀释的速率,但不保证100%转染效率。
稳定转染
稳定转染用于产生细胞群体,所述细胞群体具有完全并且成功地并入到其基因组中的外来基因物质(GOI,所关注的基因)。不同于用于酵母和细菌中的表达的质粒,用于稳定转染的质粒很少含有ORI,因为经整合DNA将作为基因组的一部分复制。因为外来DNA变成对宿主基因组的永久附加物,所以细胞将连续地表达外来物质的基因特性,并且随后将其传递到未来世代。经稳定转染的细胞可以被视为来自原始亲本细胞的细胞系完全新的细胞系。
哺乳动物细胞中的正选择
为了实现稳定转染,应该存在迫使细胞将质粒DNA并入到基因组中的选择压力。正选择是拾取正特性的方式(即质粒含有使细胞对毒素具有抗性的片匣),而负选择是拾取负特性(即质粒含有使细胞对毒素具有敏感性的片匣)。负选择技术可以与正选择结合使用以确保基因靶向基因组内的特定位置。
哺乳动物细胞中的正选择与细菌中的正选择类似,并且最常用的选择标记的表如下所列:
表3-CHO细胞转染中常用的选择标记
Figure BDA0002682783400000501
*不全面。**在真核生物中。***用于选择的浓度通常比用于维持经转染细胞系的浓度更高(两倍)。
蛋白质测试和表征-测量PROSWAP诱导的基因扰动的影响
将评估利用HTP启动子交换基因组工程改造工具调节各种目标基因的表达的结果,以评估此类程序对GOI的影响,所述GOI在一些实施例中是治疗蛋白,如抗体(Ab)。
启动子交换工具允许HTP和系统性“探针”调节某些目标基因,并且接着测量此类调节对GOI产物的表型特征(例如所产生的抗体的特征)的影响。对GOI(即治疗蛋白和/或抗体)的产物的影响的评估将需要多个Ab表型表征,如:效价、N端裂解、糖基化等,以便确保基因扰动不会不利地干扰Ab的表达。
示例性所关注的基因-抗体
本公开教示了CHO细胞的HTP基因工程改造以改良所要的所关注的基因(GOI)的表达。一种此类所关注的基因类别为编码人类治疗蛋白的基因。举例来说,涵盖编码抗体的基因的改良表达和通过CHO细胞产生抗体。
术语“抗体”和“免疫球蛋白”在本文中可互换地使用。这些术语由所属领域的技术人员很好地理解,并且是指由特异性结合抗原的一或多种多肽组成的蛋白质。抗体的一种形式构成抗体的碱基结构单元。这种形式是四聚体并且由两个相同对的抗体链组成,每对具有一个轻链和一个重链。在每对中,轻链和重链可变区一起负责与抗原结合,并且恒定区对抗体效应子功能负责。
所识别的免疫球蛋白多肽包括κ和λ轻链以及α、γ(IgG1、IgG2、IgG3、IgG4)、δ、ε和μ重链或在其它物质中的等效物。全长免疫球蛋白“轻链”(约25kDa或约214个氨基酸)包含在NH2-末端处的约110个氨基酸的可变区和在COOH-末端处的κ或λ恒定区。全长免疫球蛋白“重链”(约50kDa或约446个氨基酸)类似地包含可变区(约116个氨基酸)和前述重链恒定区中的一个,例如γ(约330个氨基酸)。
术语“抗体”和“免疫球蛋白”包括任何同种型的抗体或免疫球蛋白、保持与抗原特异性结合的抗体的片段,包括但不限于Fab、Fv、scFv和Fd片段、嵌合抗体、人类化抗体、单链抗体和包含抗体的抗原结合部分和非抗体蛋白的融合蛋白。抗体可以例如用放射性同位素、产生可检测产物的酶、荧光蛋白等检测标记。抗体可以进一步结合到其它部分,如特异性结合对的成员,例如生物素(生物素-亲和素特异性结合对的成员)等。抗体还可以与固体载体结合,包括(但不限于)聚苯乙烯盘或珠粒等。还涵盖术语Fab′、Fv、F(ab′)2和或保持与抗原特异性结合的其它抗体片段。
抗体可以多种其它形式存在,包括例如Fv、Fab和(Fab')2以及双官能(即双特异性)杂交抗体(例如,兰扎韦基亚(Lanzavecchia)等人,欧洲免疫学杂志(Eur.J.Immunol.)17,105(1987)),和以单链形式存在(例如,休斯顿(Huston)等人,美国国家科学院院刊,85,5879-5883(1988);伯德(Bird)等人,科学,242,423-426(1988);参见胡德(Hood)等人,“免疫学(Immunology)”,纽约本杰明(Benjamin,N.Y.),第2版(1984),以及亨卡皮尔(Hunkapiller)和胡德,自然,323,15-16(1986))。
免疫球蛋白轻链或重链可变区由间杂有三个高变区(也被称为“互补决定区”或“CDR”)的“构架”区组成。不同轻链或重链的构架区的序列在物种内相对保守。抗体的构架区,即构成型轻链和重链的合并构架区,用以定位和对准CDR。CDR主要负责与抗原的抗原决定基结合。
嵌合抗体是轻链和重链基因已经通常通过基因工程改造,从属于不同物种的抗体可变和恒定区基因构筑的抗体。举例来说,来自兔单克隆抗体的基因的可变片段可以与人类恒定片段(如γ1和γ3)连接。治疗性嵌合抗体的实例为由来自兔抗体的可变或抗原结合域和来自人类抗体的恒定或效应域构成的杂交蛋白质。
如本文所使用,除非另外指明或从上下文清楚,否则抗体域、区域和片段符合如所属领域中众所周知的标准定义。参见例如阿巴斯,A.K.(Abbas,A.K.)等人,(1991)细胞和分子免疫学(Cellular and Molecular Immunology),W.B.桑德斯公司(W.B.SaundersCompany),宾夕法尼亚州费城(Philadelphia,Pa)。
如本文所使用,术语“人类化抗体”或“人类化免疫球蛋白”是指包含来自动物抗体的一或多个CDR的抗体,所述抗体已经以使得人类中的免疫原性比亲本动物抗体更小的方式修饰。可以使用多种方法使动物抗体人类化,包括嵌合抗体产生、CDR接枝(也被称为再成形)和抗体表面重修。
如本文所使用,术语“鼠化抗体”或“鼠化免疫球蛋白”是指包含来自动物抗体的一或多个CDR的抗体,所述抗体已经以使得小鼠中的免疫原性比亲本动物抗体更小的方式修饰。可以使用多种方法使动物抗体鼠化,包括嵌合抗体产生、CDR接枝(也被称为再成形)和抗体表面重修。
如本文所使用,术语“测定”、“测量”和“评估”以及“分析”可互换地使用,并且包括定量和定性测定两者。
如前述,在血清中发现存在五个免疫球蛋白类别(同种型)抗体分子:IgG、IgM、IgA、IgE和IgD。其区别在于其所含有的重链的类型。IgG分子具有称为γ-链的重链;IgM具有μ-链;IgA具有α-链;IgE具有ε-链;并且IgD具有δ-链。重链多肽的变化形式允许每个免疫球蛋白类别在不同类型的免疫反应中或在身体的防御的不同阶段期间起作用。赋予这些功能差异的氨基酸序列主要位于Fc域内。
抗体类别还在其价数方面不同,即可用于结合抗原的臂的数目。这由某些免疫球蛋白由J链通过其Fc域的连接形成多聚体的能力产生。举例来说,IgM为具有五个相同“Y”形单体的五聚体。因此,完整IgM蛋白质含有10个重链、10个轻链和10个抗原结合臂(得出IgM的价数为10)。
在人类中,仅存在两种轻链-κ和λ(基于VL区和CL区中的细微氨基酸差异)。κ链和λ链的出现率分别为67%和33%。任何抗体可以通过使一种重链类型与一种轻链类型缔合来形成。在每一个可能的组合中,抗体单元(单体)中将存在两个相同重链和轻链。因此,IgM五聚体可以包含(μ2κ2)5或(μ2λ2)5
如先前所提及,免疫球蛋白进一步分解为指示为IgG1、IgG2、IgG3和IgG4的四个子类(按血清中丰度的降序列出)。其在γ-重链的CH区中的序列同源性超过95%。还存在IgA的两个子类:IgA1(90%)和IgA2(10%)。血清IgA是单体,但以二聚体形式发现于分泌物(如泪液、粘液和唾液)中。在分泌物中,IgA具有J链和另一种称为与其相关的分泌片(或T片)的蛋白质。另外,已知存在κ和λ轻链的若干子类。
表4中的数据概述了关于人类抗体的前述信息中的一些信息。
表4-人类抗体特性
Figure BDA0002682783400000531
*轻链存在于所有免疫球蛋白类别上。在人类中,k链出现率为67%,并且λ链出现率为33%。
实例
出于说明本公开的各种实施例的目的给出以下实例,并且并不希望以任何方式限制本公开。所属领域的技术人员将认识到涵盖于如由权利要求书范围限定的本公开精神内的其中变化和其它用途。
下文仅出于辅助读者的目的提供目录简表。这个目录中的任何内容都不意图限制本申请的实例或公开内容的范围。
表5-实例章节的目录
Figure BDA0002682783400000541
实例1:用于实施启动子交换库以探索靶向路径基因的基因前景的一般工作流程
本实例说明HTP基因组工程改造程序的实施例,其使用HTP启动子交换基因组工程改造工具。
A.鉴别用于启动子交换的目标
如前述,启动子交换是多步骤方法,其包含选择一组“n”个基因来靶向的步骤。
在这个实例中,本发明人已鉴别一组八个功能,认为其在CHO细胞治疗蛋白生产中是重要的。从这八个广泛功能中的每一个内,本发明人接着选择单一特定基因以用启动子交换基因组工程改造工具来靶向。
因此,存在八个目标基因,从每个代表性功能选择一个用于实验。(参见关于目标基因的图6和实例2)。
B.启动子梯的创建
实施启动子交换方法中的另一步骤是选择一组“x”个启动子充当“梯”。理想的是,这些启动子已经展示引起跨越多个基因组基因座的高度可变表达,但唯一的要求是其一定程度上扰动基因表达。
在一些实施例中,这些启动子梯如下创建:鉴别与所关注的目标基因相关的天然、原生或野生型启动子并且接着使所述启动子发生突变/改变以衍生出多种合成启动子序列。测试这些经编辑启动子中的每一种对目标基因表达的影响。
在其它实施例中,启动子并非衍生自天然或原生CHO基因启动子,而是引入CHO细胞基因组中的异源启动子。
在一些实施例中,测试启动子跨越多种条件的表达活性,以便记录/表征/标注每个启动子的活性并且存储于数据库中。
启动子随后被组织到基于其表达的强度而布置的“梯”中(例如,在靠近顶部的高度表达启动子和靠近底部的减弱表达的情况下,因此产生术语“梯”)。
C.使来自所述梯的启动子与目标基因关联
启动子交换方法的实施方案中的另一步骤为包含来自与特定目标基因相关的启动子梯的给定启动子的各种CHO细胞的HTP工程改造。
如果原生启动子存在于目标基因n之前并且其序列已知,那么用梯中的x个启动子中的每一个替换原生启动子。
当原生启动子不存在或其序列未知时,那么将梯中的x个启动子中的每一个插入基因n之前。
通过这种方式,构筑CHO细胞库,其中库的每个成员为在以其它方式相同的基因情境中可操作地连接到n个目标基因的x启动子的例子。
D.CHO细胞的HTP筛选
启动子交换方法中的最终步骤是对前述库中的CHO细胞进行HTP筛选。所衍生的细胞中的每一种代表了在以其它方式相同基因背景下的连接到n目标的x启动子的例子。
通过实施每个细胞的HTP筛选,在表征其针对一或多个度量的性能的情境中,本发明人能够确定何种启动子/目标基因关联对于给定度量最有益(例如优化治疗蛋白的产生)。
实例2:启动子交换库的特定实施方案以探索路径抗体表达依赖性
本发明研究使用HTP启动子交换基因组工程改造工具以改良CHO细胞中的抗体表达。启动子交换工具用于清楚地鉴别路径与蛋白质表达和品质之间的关系。
为了评估靶向基因功能与抗体表达/分泌之间的关系,构筑在单个基因基因座中彼此不同的多个菌株。基因变化涉及用不同强度的一或多个异源启动子(即PROSWAP)替换驱动目标路径的基因的表达的内源启动子。图6-10中发现了示例性实施例的各种示意性描绘。
实现所要变化的总基因组编辑方法是用Cas9和sgRNA靶向基因组基因座以在所要位置处剪切基因组,并且在携带选择标记和所关注的启动子的DNA片匣的所述基因座处插入。还可使用其它CRISPR系统,例如Cpf1。
具有目标基因的CRISPR辅助的PROSWAP的CHO菌株的构筑和评估可以分成三个阶段:
阶段I-mAb产生克隆的构筑和分离*
用产生基因的GS-载体编码mAb(单克隆抗体)转染来自地平线探索(Horizondiscovery)的室内菌株(CHO-K1的衍生物)。宿主菌株缺乏功能性谷氨酰胺合成酶(GS),使其是对谷氨酰胺的营养缺陷型。在用携带载体的线性化GS转染后,随机插入载体产生谷氨酰胺原营养并且通过在不存在谷氨酰胺的情况下培养来分离整合体。选择压力通过用氨基亚砜蛋氨酸(MSX)补充培养基来增强针对GS的化学抑制剂。
将编码易于表达抗体(GOI,例如赫赛汀(Herceptin)、利妥昔单抗(Rituximab)等)**的模型的重链和轻链的基因克隆到以上GS载体中以获得产生稳定细胞池的mAb。此处针对分泌的抗体和池生长特征评估稳定选择的池。一般来说,IgG1和IgG4是最容易表达的抗体类别,因为其与其它类别相比具有相对简单的结构。然而,本公开适用于任何抗体类别。在图10中,原始CHO细胞系由开放圆表示,并且表达GOI的稳定经转染CHO细胞系由具有内部填充线的圆描绘。
由于CHO细胞的较大克隆间可变性,将稳定转染的池克隆并且独立地评估以用于生产。在这一阶段的表型评估包括mAb效价、糖基化模式、细胞生长、培养期间的存活模式、细胞密度和比生产率(pg mAb/细胞/天)。
另一个关注点是表达的稳定性,因此通过培养若干代(12-50代)来评估克隆的稳定性。通常可以通过在培养期间保持选择压力(+MSX)来增加表达稳定性的几率。
在一些实施例中,抗体重链和轻链基因可以通过FRT(或LoxP)位点侧接。使用这些重组位点,抗体基因可以稍后通过特定FLP(或Cre)重组酶循环出,产生不具有抗体基因的CHO宿主,但在某些基因组基因座处携带FRT(或LoxP)重组位点(称为“着陆垫”)。对于未来项目,不同抗体的重链和轻链基因可以针对整合到那些特定的着陆垫靶向,其将减少在筛选整合体期间所需的时间和工作量。
阶段II-CRISPR-靶向路径基因的辅助启动子交换
将编码具有表6中列出的预期影响蛋白质表达的功能的分子的基因针对启动子交换程序靶向。所述表还列出针对初始POC研究靶向的特定基因。
这些目标路径基因用HTP启动子交换基因组工程改造工具调节,并且评估此类基因调节对来自阶段I的前述所插入的GOI的影响。图10提供实例的示意性描绘,其中启动子梯(高、中、低)可操作地连接到以下八个目标路径基因中的每一个,其产生24个独特CHO细胞系。假设这些细胞系是基因上相同的,除了独特的启动子:基因目标元件。
对GOI(即治疗蛋白,抗体)的影响的评估需要多个Ab表型表征,如:效价、N端裂解、糖基化等,以便确保基因扰动不会不利地干扰Ab的表达。
表6-目标基因
功能 目标基因 替代基因
分泌/蛋白质转运 SRP14 SRP9、SRP54
应激 XBP-1 bcl-2、IGF1
糖基化 COSMC FUT8
细胞凋亡 BCL2 BAK
未折叠蛋白质反应 ATF6 PERK、IRE1α
蛋白质折叠(例如伴侣蛋白) BiP/GRP78(HSP70)
ER相关的降解 Dnajb9(ERdj4/HSP40)
代谢/能量 LDHA
CRISPR介导的整合片匣载体由以下部分组成*
驱动标记1的表达启动子,随后是多腺苷酸化信号。
靶向通过HDR到目标基因座整合的5'同源序列。同源性长度可以通常在100-3000bp之间变化。在POC研究中,同源性长度目标为约1000bp。
(任选的)标记2和3由其单独的启动子和随后其自身的多腺苷酸化信号和新霉素抗性标记驱动以选择正整合体。在一些实施例中,这些标记可以通过FRT或LoxP位点侧接,所述FRT或LoxP位点可以在稍后阶段使用以循环出这些标记。
在调节目标基因之前,用于PROSWAP的启动子4(高/中/低强度)。
靶向通过HDR到目标基因座整合的3'同源序列。同源性长度可以通常在100-3000bp之间变化。在POC研究中,同源性长度目标为约1000bp。
标记1和2优选地为允许细胞之间的区别的荧光标记(GFP/RFP/mCHERRY/BFP/YFP)。
偏离目标插入保持标记1和2两者,而仅标记2保持所需的正中目标插入。
标记3优选地为仅允许细胞生长的抗生素选择标记(新霉素/嘌呤霉素/杀稻瘟菌素/潮霉素),所述细胞具有成功整合的异源片匣。
启动子4插入目标基因的上游以调节其表达。启动子4可以是高、中或低强度(例如相对强度的CMV>EF1α>SV40>RSV>PGK次序,参见表2和图9)。
在一些实施例中,为了完全去除目标基因的表达,启动子4或核糖体结合位点或翻译起始信号从整合片匣内忽略。此外,如前述,可以使用目标基因的完整基因敲除,或可以用如CRISPRi或RNAi的干扰技术很大程度上抑制目标基因转录。多腺苷酸化序列可以选自SV40、hGH、BGH和rbGlob。
产生mAB的CHO细胞克隆用i)携带Cas9和sgRNA的载体转染以在目标基因座处剪切基因组DNA,和ii)用携带阳性标记和阳性标记以及所关注的启动子的上述整合载体转染。如先前所陈述,可以使用Cpf1或任何其它适当的CRISPR核酸内切酶。在96孔培养盘(1-10个培养盘/目标)中,在含或不含新霉素的培养基中,以1000-5000个细胞/孔的密度接种转染物,并且在37℃培育箱中培育。在这个步骤处保留对GS(和mAB)载体的MSX选择以避免对细胞施加多个选择压力。
预期CRISPR效率是可变的并且是基因座依赖性的。首先对所得菌落(即微池)进行荧光筛选,并且仅对具有标记2的菌落(例如红荧光、GFP等)使用接合位点的PCR扩增和PCR产物的桑格测序进行进一步筛选以在目标基因座处整合。PCR的引物可以被设计成结合到整合片匣的外部或内部。
任选地,针对mAb效价、糖基化模式、细胞生长、培养期间的存活模式、细胞密度和比生产率(pg mAb/细胞/天)评估具有正确整合的微池。
图7A、图7B和图7C可以表示为前述实验构筑体的说明并且描绘实施HTP启动子交换基因组工程改造工具的各种实施例。围绕目标基因的DNA区由sgRNA使用CRISPR(或类似物)基因编辑方法选择性地剪切。目标基因上游的启动子通过同源定向修复机制由启动子4替换。启动子替换片匣可以由各种部分组成,例如在图7A中,构筑体携带三个标记。标记1在同源区外部并且在靶向整合期间丢失。其用作针对偏离目标整合的负选择/筛选标记。标记2和标记3在目标基因座处成功整合后保持,并且可以单独地用于筛选(荧光)和选择(抗生素抗性)以用于快速表型分析。在图7B中,构筑体只携带针对偏离目标整合的负选择/筛选标记。无阳性标记在目标基因座处整合,使得所述标记在给定菌株中依序靶向多个基因。在不存在阳性标记的情况下,进行更广泛的基因分型来分离正确整合的克隆。并且在图7C中,构筑体类似于图7A实施例中的构筑体,其在两个阳性标记2和3周围具有FRT或LoxP重组位点的附加特点。这些重组位点的存在可以用于选择性地循环出其内的区域。这允许将这些标记再循环,并且允许在给定菌株中依序工程改造多个目标基因。
阶段III-PROSWAP微池的克隆和个别克隆的评估
将微池培养物连续稀释并且用于以0.3个细胞/孔的细胞密度接种96孔培养盘(1-2个/微池)以分离单细胞克隆。克隆性的证明需要通过Solentim(或类似物)装置对每个孔进行成像。
在96孔培养盘中生长之后,使菌落扩增、保存和评估生理特性,包括:mAb效价、糖基化模式、细胞生长、培养期间的存活模式、细胞密度和比生产率(pg mAb/细胞/天)。蛋白质测试和表征模块(参见图1)对于确保基因扰动并不不利地影响Ab的特性是重要的。
CRISPR靶向变化的稳定性也预期为可变的,并且因此通过连续培养约60代、随后在目标基因座处基因分型以及对mAB分泌的生产率评估来监测最有前景的克隆。
在标记2和3由FRT(或LoxP)位点侧接的实施例中,可以用携带FLP-重组酶(或Cre重组酶)的载体进行第二转染,随后对具有丢失标记2(和标记3)的转染物进行荧光筛选。这些无标记克隆可以稍后用于多个基因目标的依序PROSWAP。
注释:*所述方法被设计用于最快菌株构筑和评估。使用这种方法产生的细胞无法用于不同项目/抗体。仅包括RFP(荧光)和新霉素(选择)标记以简化POC实验期间的选择。在一些实施例中,这两个标记可以省略,其将需要稍后基因分型中的更多资源以鉴别正确整合的微池/克隆,因为预期CRISPR效率在宽范围(1%-60%)内变化。在某些实施例中,如上文所概述,这些标记可以由FRP或LoxP重组位点侧接,其将需要用特定重组酶(FLP或Cre重组酶)进行另一转染以在FLP或LoxP重组位点处循环出标记。**工作流程可以针对多个抗体自动化并且并行进行。
实例3:启动子交换库的合并和多因素组合测试
在这个实例中,在实例2中鉴别为对宿主性能具有积极作用的启动子交换以二阶组合合并到新库中。
合并给定启动子的决策:基因组合是基于对所关注的参数(例如生理特性,包括mAb效价、糖基化模式、细胞生长、培养期间的存活模式、细胞密度和比生产率(pg mAb/细胞/天)的整体积极影响,以及组合将产生叠加性、协同性或非有害性影响的可能性。
表7-序列文件中的序列表
Figure BDA0002682783400000591
Figure BDA0002682783400000601
Figure BDA0002682783400000611
本公开的编号实施例
不管所附权利要求书,本公开阐述以下编号实施例:
1.一种用于探索免疫球蛋白表达细胞路径依赖性的HTP方法,其包含:
a.提供针对宿主细胞具有内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;
b.工程改造所述宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中所述多个宿主细胞包含个别宿主细胞,所述个别宿主细胞包含来自可操作地连接到所述目标基因的所述启动子梯的启动子的独特组合;以及
c.针对所关注的免疫球蛋白和/或所述宿主细胞的表型特征,筛选所述初始启动子交换宿主细胞库的细胞。
2.根据实施例1所述的方法,其中所述宿主细胞是哺乳动物细胞。
3.根据实施例1所述的方法,其中所述宿主细胞是鼠类细胞。
4.根据实施例1所述的方法,其中所述宿主细胞是中国仓鼠卵巢细胞。
5.根据实施例1所述的方法,其中所述目标基因来自选自由以下组成的群组的细胞路径:分泌、蛋白质转运、应激、糖基化、细胞凋亡、未折叠蛋白质反应、蛋白质折叠、ER相关的降解和代谢。
6.根据实施例1所述的方法,其中所述目标基因选自由以下组成的群组:SRP14、SRP9、SRP54、XBP-1、bcl-2、IGF1、COSMC、FUT8、BCL2、BAK、ATF6、PERK、IRE1α、BiP/GRP78(HSP70)、Dnajb9(ERdj4/HSP40)和LDHA。
7.根据实施例1所述的方法,其中所述启动子梯包含至少两个选自由以下组成的群组的启动子:CMV、EF1α、SV40、RSV和PGK。
8.根据实施例1所述的方法,其中所述启动子梯包含至少两个选自由SEQ ID NO1-5组成的群组的启动子。
9.根据实施例1所述的方法,其中所述免疫球蛋白选自由以下组成的群组:IgG、IgM、IgA、IgE和IgD。
10.根据实施例1所述的方法,其中所述免疫球蛋白选自由以下组成的群组:IgG1、IgG2、IgG3和IgG4。
11.根据实施例1所述的方法,其中工程改造所述宿主细胞的基因组包含使用CRISPR兼容的核酸内切酶和相关gRNA来靶向并且裂解所述目标基因上游的所述宿主细胞基因组。
12.根据实施例1所述的方法,其中工程改造所述宿主细胞的所述基因组包含使用CRIPSR兼容的核酸内切酶和相关gRNA来靶向和裂解所述目标基因上游的宿主细胞基因组并且通过同源重组来插入来自所述启动子梯的启动子。
13.根据实施例1所述的方法,其中针对所关注的免疫球蛋白的表型特征筛选所述初始启动子交换宿主细胞库包含确认或表征:所关注的免疫球蛋白的效价、N端裂解和/或糖基化模式。
14.根据实施例1所述的方法,其中针对所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库包含确认或表征:细胞生长、培养期间的细胞存活模式、细胞密度和每天每个细胞产生的免疫球蛋白的细胞比生产率。
15.根据实施例1所述的方法,其中提供超过一个细胞路径目标基因。
16.根据实施例1所述的方法,其中重复步骤a)-c)。
17.根据实施例1所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库。
18.根据实施例1所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;以及
e.针对所关注的免疫球蛋白和/或所述宿主细胞的表型特征筛选所述后续初始启动子交换宿主细胞库的个别宿主细胞。
19.根据实施例1所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;
e.针对所关注的免疫球蛋白和/或所述宿主细胞的表型特征筛选所述后续初始启动子交换宿主细胞库的个别宿主细胞;以及
f.将步骤d)-e)重复进行一或多次。
20.一种宿主细胞群体,其由根据实施例1所述的方法衍生。
21.一种用于改良所关注的产物的表达的HTP方法,其包含:
a.提供针对宿主细胞具有内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;
b.工程改造所述宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中所述多个宿主细胞包含个别宿主细胞,所述个别宿主细胞包含与可操作地连接到所述目标基因的所述启动子梯不同的启动子;以及
c.针对所关注的产物和/或所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库的细胞。
22.根据实施例21所述的方法,其中所述宿主细胞是哺乳动物细胞。
23.根据实施例21所述的方法,其中所述宿主细胞是鼠类细胞。
24.根据实施例21所述的方法,其中所述宿主细胞是中国仓鼠卵巢细胞。
25.根据实施例21所述的方法,其中所述目标基因编码具有选自由以下组成的群组的功能的分子:分泌、蛋白质转运、应激反应、糖基化、细胞凋亡、未折叠蛋白质反应、蛋白质折叠、ER相关的降解和代谢。
26.根据实施例21所述的方法,其中所述目标基因编码选自由以下组成的群组的分子:SRP14、SRP9、SRP54、XBP-1、bcl-2、IGF1、COSMC、FUT8、BCL2、BAK、ATF6、PERK、IRE1α、BiP/GRP78(HSP70)、Dnajb9(ERdj4/HSP40)和LDHA。
27.根据实施例21所述的方法,其中所述启动子梯包含至少两个选自由以下组成的群组的启动子:CMV、EF1α、SV40、RSV和PGK。
28.根据实施例21所述的方法,其中所述启动子梯包含至少两个具有选自由SEQID NO 1-5组成的群组的核苷酸序列的启动子。
29.根据实施例21所述的方法,其中所述所关注的产物是蛋白质。
30.根据实施例21所述的方法,其中所述所关注的产物是免疫球蛋白。
31.根据实施例21所述的方法,其中所述所关注的产物选自由以下组成的群组:IgG、IgM、IgA、IgE和IgD。
32.根据实施例21所述的方法,其中所述所关注的产物选自由以下组成的群组:IgG1、IgG2、IgG3和IgG4。
33.根据实施例21所述的方法,其中工程改造所述宿主细胞的基因组包含使用CRISPR兼容的核酸内切酶和相关gRNA来靶向并且裂解所述目标基因上游的所述宿主细胞基因组。
34.根据实施例33所述的方法,其进一步包含通过同源重组来插入来自所述启动子梯的启动子。
35.根据实施例21所述的方法,其中针对所关注的产物的表型特征筛选所述初始启动子交换宿主细胞库的细胞包含确认或表征:所述所关注的产物的效价、N端裂解和/或糖基化模式。
36.根据实施例21所述的方法,其中针对所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库的细胞包含确认或表征以下中的一或多个:细胞生长、培养期间的细胞存活模式、细胞密度和每天每个细胞产生的所关注的产物的细胞比生产率。
37.根据实施例21所述的方法,其中提供超过一个细胞路径目标基因。
38.根据实施例21所述的方法,其中重复步骤a)-c)。
39.根据实施例21所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库。
40.根据实施例21所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;以及
e.针对所关注的产物和/或所述宿主细胞的表型特征筛选所述后续初始启动子交换宿主细胞库的个别宿主细胞。
41.根据实施例21所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;
e.针对所关注的产物和/或所述宿主细胞的表型特征筛选所述后续初始启动子交换宿主细胞库的个别宿主细胞;以及
f.将步骤d)-e)重复进行一或多次。
42.一种宿主细胞群体,其由根据实施例21所述的方法衍生。
43.一种所关注的产物,其由来自实施例42中的所述宿主细胞群体的宿主细胞产生。
*****
通过引用的方式并入
出于所有目的,本文所引用的所有参考文献、论文、公开案、专利、专利公开案和专利申请案全部以全文引用的方式并入。然而,提及本文所引用的任何参考文献、论文、公开案、专利、专利公开案和专利申请案不是并且不应该认为是承认或以任何形式暗示其构成有效现有技术或形成世界上任何国家的公共常识的一部分。为此目的,第15/396,230号美国申请案(第US 2017/0159045 A1号美国公开案)、第15/140,296号美国申请案(第US2017/0316353 A1号美国公开案)和PCT/US2016/065464(WO 2017/100376 A2)全部以引入的方式并入本文中。
序列表
<110> 齐默尔根公司(Zymergen Inc.)
<120> 用于中国仓鼠卵巢细胞基因工程改造的HTP平台
<130> ZYMR-024/01WO 327574-2112
<150> US 62/645,708
<151> 2018-03-20
<160> 61
<170> PatentIn版本3.5
<210> 1
<211> 508
<212> DNA
<213> 巨细胞病毒属
<400> 1
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480
acggtgggag gtctatataa gcagagct 508
<210> 2
<211> 1179
<212> DNA
<213> 智人
<400> 2
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720
ggcctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140
gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179
<210> 3
<211> 281
<212> DNA
<213> 猴病毒40
<400> 3
tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 60
tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa 120
gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta actccgccca 180
tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt 240
ttatttatgc agaggccgag gccgcctctg cctctgagct a 281
<210> 4
<211> 262
<212> DNA
<213> 劳氏肉瘤病毒(Rous sarcoma virus)
<400> 4
aatgtagtct tatgcaatac tcttgtagtc ttgcaacatg gtaacgatga gttagcaaca 60
tgccttacaa ggagagaaaa agcaccgtgc atgccgattg gtggaagtaa ggtggtacga 120
tcgtgcctta ttaggaaggc aacagacggg tctgacatgg attggacgaa ccactgaatt 180
ccgcattgca gagatattgt atttaagtgc ctagctcgat acaataaacg ccatttgacc 240
attcaccaca ttggtgtgca cc 262
<210> 5
<211> 500
<212> DNA
<213> 鼠属
<400> 5
gggtagggga ggcgcttttc ccaaggcagt ctggagcatg cgctttagca gccccgctgg 60
gcacttggcg ctacacaagt ggcctctggc ctcgcacaca ttccacatcc accggtaggc 120
gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct cccctagtca 180
ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg gaagtagcac 240
gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg gtaggccttt 300
ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg ctgggaaggg 360
gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc cgaaggtcct 420
ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg ttctcctctt 480
cctcatctcc gggcctttcg 500
<210> 6
<211> 110
<212> PRT
<213> 灰仓鼠
<400> 6
Met Val Leu Leu Glu Ser Glu Gln Phe Leu Thr Glu Leu Thr Arg Leu
1 5 10 15
Phe Gln Lys Cys Arg Ser Ser Gly Ser Val Tyr Ile Thr Leu Lys Lys
20 25 30
Tyr Asp Gly Arg Thr Lys Pro Thr Pro Arg Lys Ser Ala Val Glu Ser
35 40 45
Val Glu Pro Ala Glu Asn Lys Cys Leu Leu Arg Ala Thr Asp Gly Lys
50 55 60
Arg Lys Ile Ser Thr Val Val Ser Ser Lys Glu Val Asn Lys Phe Gln
65 70 75 80
Met Ala Tyr Ser Asn Leu Leu Arg Ala Asn Met Asp Gly Leu Lys Lys
85 90 95
Arg Asp Lys Lys Asn Lys Ser Lys Lys Thr Lys Pro Ala Gln
100 105 110
<210> 7
<211> 370
<212> PRT
<213> 灰仓鼠
<400> 7
Met Val Val Val Ala Ala Ser Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser
210 215 220
Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys
225 230 235 240
Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys
245 250 255
Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val
260 265 270
Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His
275 280 285
Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Glu Asp Phe
290 295 300
Ile Pro Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu
305 310 315 320
Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu
325 330 335
Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp
340 345 350
His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile
355 360 365
Ser Val
370
<210> 8
<211> 318
<212> PRT
<213> 灰仓鼠
<400> 8
Met Leu Ser Glu Ser Ser Ser Phe Leu Lys Gly Val Met Leu Gly Ser
1 5 10 15
Ile Phe Tyr Ala Leu Ile Thr Thr Leu Gly His Ile Arg Ile Gly His
20 25 30
Arg Asn Arg Thr His His His Glu His His His Leu Gln Ala Pro Asn
35 40 45
Lys Glu Asp Ile Ser Lys Ile Ser Ala Ala Glu Arg Met Glu Leu Ser
50 55 60
Lys Ser Phe Arg Val Tyr Cys Ile Val Leu Val Lys Pro Lys Asp Val
65 70 75 80
Ser Leu Trp Ala Ala Val Lys Glu Thr Trp Thr Lys His Cys Asp Lys
85 90 95
Ala Glu Phe Phe Ser Ser Glu Asn Val Lys Val Phe Glu Ser Ile Asn
100 105 110
Val Asp Thr Asp Asp Met Trp Leu Met Met Arg Lys Ala Tyr Lys Tyr
115 120 125
Ala Phe Asp Lys Tyr Lys Glu Gln Tyr Asn Trp Phe Phe Leu Ala Arg
130 135 140
Pro Ser Thr Phe Ala Val Ile Glu Asn Leu Lys Tyr Phe Leu Leu Lys
145 150 155 160
Lys Asp Pro Ser Gln Pro Phe Tyr Leu Gly His Thr Val Lys Ser Gly
165 170 175
Asp Leu Glu Tyr Val Ser Val Asp Gly Gly Ile Val Leu Ser Ile Glu
180 185 190
Ser Met Lys Arg Leu Asn Ser Leu Leu Ser Val Pro Glu Lys Cys Pro
195 200 205
Glu Gln Gly Gly Met Ile Trp Lys Ile Ser Glu Asp Lys Gln Leu Ala
210 215 220
Val Cys Leu Lys Tyr Ala Gly Val Phe Ala Glu Asn Ala Glu Asp Ala
225 230 235 240
Asp Arg Lys Asp Val Phe Asn Thr Lys Ser Val Gly Leu Phe Ile Lys
245 250 255
Glu Ala Met Ser Asn His Pro Asn Gln Val Val Glu Gly Cys Cys Ser
260 265 270
Asn Met Ala Val Thr Phe Asn Gly Leu Thr Pro Asn Gln Met His Val
275 280 285
Met Met Tyr Gly Val Tyr Arg Leu Arg Ala Phe Gly His Val Phe Asn
290 295 300
Asp Ala Leu Val Phe Leu Pro Pro Asn Gly Ser Asp Asn Asp
305 310 315
<210> 9
<211> 203
<212> PRT
<213> 灰仓鼠
<400> 9
Met Ala Gln Ala Gly Arg Thr Gly Tyr Asp Asn Arg Glu Ile Val Met
1 5 10 15
Lys Tyr Ile His Tyr Lys Leu Ser Gln Arg Gly Tyr Glu Trp Asp Val
20 25 30
Gly Asp Val Asp Ala Ala Pro Leu Gly Ala Ala Pro Thr Pro Gly Ile
35 40 45
Phe Ser Phe Gln Pro Glu Ser Asn Pro Thr Pro Ala Val His Arg Asp
50 55 60
Met Ala Ala Arg Thr Ser Pro Leu Arg Pro Ile Val Ala Thr Thr Gly
65 70 75 80
Pro Thr Leu Ser Pro Val Pro Pro Val Val His Leu Thr Leu Arg Arg
85 90 95
Ala Gly Asp Asp Phe Ser Arg Arg Tyr Arg Arg Asp Phe Ala Glu Met
100 105 110
Ser Ser Gln Leu His Leu Thr Pro Phe Thr Ala Arg Gly Arg Phe Ala
115 120 125
Thr Val Val Glu Glu Leu Phe Arg Asp Gly Val Asn Trp Gly Arg Ile
130 135 140
Val Ala Phe Phe Glu Phe Gly Gly Val Met Cys Val Glu Ser Val Asn
145 150 155 160
Arg Glu Met Ser Pro Leu Val Asp Asn Ile Ala Leu Trp Met Thr Glu
165 170 175
Tyr Leu Asn Arg His Leu His Thr Trp Ile Gln Asp Asn Gly Gly Trp
180 185 190
Leu Met Cys Ser Glu Asp Ser Ala Ser Pro Gln
195 200
<210> 10
<211> 766
<212> PRT
<213> 灰仓鼠
<400> 10
Met Thr Leu Ser Val Thr Thr Ser Leu Ala Gly Ser Val Gly Ala Thr
1 5 10 15
Arg Asn Gln Pro Arg Asp Ile Gly Ser Pro Cys Cys His Ala Arg Leu
20 25 30
Gly Glu Ala Gly Val Gly Asn Phe Leu Val Ala Asp Pro Gly Val Ile
35 40 45
Ala Leu Gln Gln Met Thr Ala Asn Leu Trp Ala Ser Pro Phe Ala Ser
50 55 60
Ala Arg Pro Pro Ser Val Ser Val Pro Gln Ile Leu Ser Ala Gly Arg
65 70 75 80
Arg Arg Phe Gly Leu Leu Thr Asp Pro Ser Ser Glu Gly Glu Ala Ser
85 90 95
Val Trp Arg Lys Pro Ala Gly Ala Ala Gly Thr Met Glu Ser Pro Phe
100 105 110
Ser Pro Gly Phe Pro His Gly Pro Glu Glu Asp Trp Glu Ser Thr Leu
115 120 125
Phe Ala Glu Leu Gly Tyr Phe Thr Asp Asn Asp Glu Val Gln Phe Asp
130 135 140
Ala Ala Asn Glu Thr Tyr Glu Asn Asn Phe Asp His Leu Asn Phe Asp
145 150 155 160
Leu Asp Leu Met Pro Trp Glu Ser Asp Ile Trp Ser Ser Ser Ser His
165 170 175
Phe Cys Ser Val Lys Asp Ile Lys Ala Glu Pro Gln Pro Leu Ser Pro
180 185 190
Ala Ser Ser Ser Cys Ser Val Ser Ser Pro Arg Ser Val Asp Ser Cys
195 200 205
Ser Ser Thr Gln His Val Pro Glu Glu Leu Asp Leu Ser Ser Ser Ser
210 215 220
Gln Ser Pro Leu Ser Leu Tyr Gly Glu Ser Cys Asn Ser Pro Ser Ser
225 230 235 240
Val Glu Pro Leu Lys Glu Asp Lys Pro Val Ile Gly Pro Gly Asn Lys
245 250 255
Thr Glu His Gly Leu Thr Pro Lys Lys Lys Asn Gln Met Ser Ser Lys
260 265 270
Pro Ser Val Gln Pro Lys Pro Leu Leu Leu Pro Ala Ala Pro Lys Thr
275 280 285
Gln Thr Asn Ala Gly Val Pro Ala Lys Thr Ile Ile Ile Gln Thr Leu
290 295 300
Pro Ala Leu Met Pro Leu Ala Lys Gln Gln Ser Ser Ile Ile Ser Ile
305 310 315 320
Gln Pro Ala Pro Thr Lys Gly Gln Thr Val Leu Leu Ser Gln Pro Ala
325 330 335
Val Val Gln Leu Gln Ala Pro Gly Val Leu Pro Ser Ala Gln Pro Val
340 345 350
Leu Ala Val Ala Gly Gly Ala Thr Gln Leu Pro Asn His Val Val Asn
355 360 365
Val Val Pro Ala Pro Val Val Asn Ser Pro Val Asn Gly Lys Leu Ser
370 375 380
Met Thr Lys Pro Val Leu Gln Ser Thr Thr Arg Ser Val Gly Ser Asp
385 390 395 400
Ile Ala Val Leu Arg Arg Gln Gln Arg Met Ile Lys Asn Arg Glu Ser
405 410 415
Ala Cys Gln Ser Arg Lys Lys Lys Lys Glu Tyr Met Leu Gly Leu Glu
420 425 430
Ala Arg Leu Lys Ala Ala Leu Ser Glu Asn Glu Gln Leu Lys Lys Glu
435 440 445
Asn Gly Ser Leu Lys Arg Gln Leu Asp Glu Val Val Ser Glu Asn Gln
450 455 460
Arg Leu Lys Val Pro Ser Pro Lys Arg Arg Ala Val Cys Val Met Ile
465 470 475 480
Val Leu Ala Phe Ile Met Leu Asn Tyr Gly Pro Met Ser Met Leu Glu
485 490 495
Gln Asp Ser Arg Arg Val Lys Pro Ser Val Asn Pro Ala Asn Gln Arg
500 505 510
Arg His Leu Leu Glu Phe Ser Ala Lys Glu Val Glu Asp Thr Ser Asp
515 520 525
Asp Ile Asn Gln Lys Asn Ser Tyr Arg Tyr Asp His Ser Val Ser Asn
530 535 540
Asp Lys Ala Leu Met Val Leu Thr Glu Glu Pro Leu Leu Tyr Ile Pro
545 550 555 560
Pro Pro Pro Cys Gln Pro Leu Ile Asn Thr Thr Glu Ser Leu Arg Leu
565 570 575
Asn His Glu Leu Arg Gly Trp Val His Arg His Glu Val Glu Arg Thr
580 585 590
Lys Ser Arg Arg Met Ile Asn Asn Gln Gln Lys Thr Arg Ile Leu Gln
595 600 605
Gly Ala Leu Glu Gln Gly Ser Asn Ser Gln Leu Met Ala Val Gln Tyr
610 615 620
Thr Glu Thr Thr Ser Ile Ser Arg Asn Ser Gly Asn Glu Leu Gln Val
625 630 635 640
Tyr Tyr Ala Ser Pro Gly Ser Tyr Gln Gly Phe Phe Glu Ala Ile Arg
645 650 655
Arg Arg Gly Asp Thr Phe Tyr Val Val Ser Phe Arg Arg Asp His Leu
660 665 670
Leu Leu Pro Ala Thr Thr His Asn Lys Thr Thr Arg Pro Lys Met Ser
675 680 685
Ile Val Leu Pro Ala Ile Asn Ile Asn Asp Asn Val Ile Asn Gly Gln
690 695 700
Asp Tyr Glu Val Met Met Gln Ile Asp Cys Gln Val Met Asp Thr Arg
705 710 715 720
Ile Leu His Ile Lys Ser Ser Ser Val Pro Pro Tyr Leu Arg Asp His
725 730 735
Gln Arg Asn Gln Thr Asn Thr Phe Phe Gly Ser Pro Pro Thr Ala Thr
740 745 750
Glu Thr Thr His Val Val Ser Thr Ile Pro Glu Ser Leu Gln
755 760 765
<210> 11
<211> 654
<212> PRT
<213> 灰仓鼠
<400> 11
Met Lys Phe Pro Met Val Ala Ala Ala Leu Leu Leu Leu Cys Ala Val
1 5 10 15
Arg Ala Glu Glu Glu Asp Lys Lys Glu Asp Val Gly Thr Val Val Gly
20 25 30
Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val Gly Val Phe Lys Asn Gly
35 40 45
Arg Val Glu Ile Ile Ala Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser
50 55 60
Tyr Val Ala Phe Thr Pro Glu Gly Glu Arg Leu Ile Gly Asp Ala Ala
65 70 75 80
Lys Asn Gln Leu Thr Ser Asn Pro Glu Asn Thr Val Phe Asp Ala Lys
85 90 95
Arg Leu Ile Gly Arg Thr Trp Asn Asp Pro Ser Val Gln Gln Asp Ile
100 105 110
Lys Phe Leu Pro Phe Lys Val Val Glu Lys Lys Thr Lys Pro Tyr Ile
115 120 125
Gln Val Asp Ile Gly Gly Gly Gln Thr Lys Thr Phe Ala Pro Glu Glu
130 135 140
Ile Ser Ala Met Val Leu Thr Lys Met Lys Glu Thr Ala Glu Ala Tyr
145 150 155 160
Leu Gly Lys Lys Val Thr His Ala Val Val Thr Val Pro Ala Tyr Phe
165 170 175
Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly
180 185 190
Leu Asn Val Met Arg Ile Ile Asn Glu Pro Thr Ala Ala Ala Ile Ala
195 200 205
Tyr Gly Leu Asp Lys Arg Glu Gly Glu Lys Asn Ile Leu Val Phe Asp
210 215 220
Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Thr Ile Asp Asn Gly
225 230 235 240
Val Phe Glu Val Val Ala Thr Asn Gly Asp Thr His Leu Gly Gly Glu
245 250 255
Asp Phe Asp Gln Arg Val Met Glu His Phe Ile Lys Leu Tyr Lys Lys
260 265 270
Lys Thr Gly Lys Asp Val Arg Lys Asp Asn Arg Ala Val Gln Lys Leu
275 280 285
Arg Arg Glu Val Glu Lys Ala Lys Arg Ala Leu Ser Ser Gln His Gln
290 295 300
Ala Arg Ile Glu Ile Glu Ser Phe Phe Glu Gly Glu Asp Phe Ser Glu
305 310 315 320
Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn Met Asp Leu Phe Arg
325 330 335
Ser Thr Met Lys Pro Val Gln Lys Val Leu Glu Asp Ser Asp Leu Lys
340 345 350
Lys Ser Asp Ile Asp Glu Ile Val Leu Val Gly Gly Ser Thr Arg Ile
355 360 365
Pro Lys Ile Gln Gln Leu Val Lys Glu Phe Phe Asn Gly Lys Glu Pro
370 375 380
Ser Arg Gly Ile Asn Pro Asp Glu Ala Val Ala Tyr Gly Ala Ala Val
385 390 395 400
Gln Ala Gly Val Leu Ser Gly Asp Gln Asp Thr Gly Asp Leu Val Leu
405 410 415
Leu Asp Val Cys Pro Leu Thr Leu Gly Ile Glu Thr Val Gly Gly Val
420 425 430
Met Thr Lys Leu Ile Pro Arg Asn Thr Val Val Pro Thr Lys Lys Ser
435 440 445
Gln Ile Phe Ser Thr Ala Ser Asp Asn Gln Pro Thr Val Thr Ile Lys
450 455 460
Val Tyr Glu Gly Glu Arg Pro Leu Thr Lys Asp Asn His Leu Leu Gly
465 470 475 480
Thr Phe Asp Leu Thr Gly Ile Pro Pro Ala Pro Arg Gly Val Pro Gln
485 490 495
Ile Glu Val Thr Phe Glu Ile Asp Val Asn Gly Ile Leu Arg Val Thr
500 505 510
Ala Glu Asp Lys Gly Thr Gly Asn Lys Asn Lys Ile Thr Ile Thr Asn
515 520 525
Asp Gln Asn Arg Leu Thr Pro Glu Glu Ile Glu Arg Met Val Asn Asp
530 535 540
Ala Glu Lys Phe Ala Glu Glu Asp Lys Lys Leu Lys Glu Arg Ile Asp
545 550 555 560
Thr Arg Asn Glu Leu Glu Ser Tyr Ala Tyr Ser Leu Lys Asn Gln Ile
565 570 575
Gly Asp Lys Glu Lys Leu Gly Gly Lys Leu Ser Ser Glu Asp Lys Glu
580 585 590
Thr Met Glu Lys Ala Val Glu Glu Lys Ile Glu Trp Leu Glu Ser His
595 600 605
Gln Asp Ala Asp Ile Glu Asp Phe Lys Ala Lys Lys Lys Glu Leu Glu
610 615 620
Glu Ile Val Gln Pro Ile Ile Ser Lys Leu Tyr Gly Ser Ala Gly Pro
625 630 635 640
Pro Pro Thr Gly Glu Glu Asp Thr Ser Glu Lys Asp Glu Leu
645 650
<210> 12
<211> 261
<212> PRT
<213> 灰仓鼠
<400> 12
Met Cys Ile Ala Phe Arg Met Leu Leu Ser Val Ile Pro Lys Val Cys
1 5 10 15
Trp Cys Asp Cys Phe Leu Glu Val Leu Ser Leu Ser Lys Thr Val Phe
20 25 30
Leu Ser Phe Leu Gly Leu Glu Met Ala Thr Pro Gln Ser Val Phe Val
35 40 45
Phe Ala Ile Cys Ile Leu Met Ile Thr Glu Leu Ile Leu Ala Ser Lys
50 55 60
Ser Tyr Tyr Asp Ile Leu Gly Val Pro Lys Ser Ala Ser Glu Arg Gln
65 70 75 80
Ile Lys Lys Ala Phe His Lys Leu Ala Met Lys Tyr His Pro Asp Lys
85 90 95
Asn Lys Ser Pro Asp Ala Glu Ala Lys Phe Arg Glu Ile Ala Glu Ala
100 105 110
Tyr Glu Thr Leu Ser Asp Ala His Arg Arg Lys Glu Tyr Asp Thr Val
115 120 125
Gly His Thr Ala Phe Thr Asn Gly Lys Gly Gln Arg Gly Ser Gly Ser
130 135 140
Pro Phe Glu Gln Ser Phe Asn Phe Asn Phe Asp Asp Leu Phe Lys Asp
145 150 155 160
Phe Asn Leu Phe Gly Gln Asn Gln Asn Thr Arg Ser Lys Lys His Phe
165 170 175
Glu Asn His Phe Gln Thr His Gln Asp Gly Ser Asn Arg Gln Arg His
180 185 190
His Phe Gln Glu Phe Ser Phe Gly Gly Gly Leu Phe Asp Asp Met Phe
195 200 205
Glu Asp Met Glu Lys Met Phe Ser Phe Ser Gly Phe Asp Thr Thr Asn
210 215 220
Arg His Thr Val Gln Thr Glu Asn Arg Phe His Gly Ser Ser Lys His
225 230 235 240
Cys Arg Thr Val Thr Gln Arg Arg Gly Asn Met Val Thr Thr Tyr Thr
245 250 255
Asp Cys Ser Gly Gln
260
<210> 13
<211> 332
<212> PRT
<213> 灰仓鼠
<400> 13
Met Ala Thr Leu Lys Asp Gln Leu Ile Val Asn Leu Leu Lys Glu Glu
1 5 10 15
Gln Thr Pro Gln Asn Lys Ile Thr Ile Val Gly Val Gly Ala Val Gly
20 25 30
Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu
35 40 45
Ala Leu Val Asp Val Met Glu Asp Lys Leu Lys Gly Glu Met Met Asp
50 55 60
Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly
65 70 75 80
Lys Asp Tyr Ser Val Thr Ala Asn Ser Lys Leu Val Ile Val Thr Ala
85 90 95
Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg
100 105 110
Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser
115 120 125
Pro Asp Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr
130 135 140
Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly
145 150 155 160
Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu
165 170 175
Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu
180 185 190
His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Val Asn Val Ala Gly
195 200 205
Val Ser Leu Lys Asn Leu Asn Pro Glu Leu Gly Thr Asp Thr Asp Lys
210 215 220
Glu Gln Trp Asn Glu Val His Lys Gln Val Val Asp Ser Ala Tyr Glu
225 230 235 240
Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val
245 250 255
Ala Asp Leu Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro
260 265 270
Ile Ser Thr Met Ile Lys Gly Leu Tyr Gly Ile Lys Asp Asp Val Phe
275 280 285
Leu Ser Val Pro Cys Val Leu Gly Gln Asn Gly Ile Ser Asp Val Val
290 295 300
Lys Val Thr Leu Thr Ser Glu Glu Glu Ala Arg Leu Lys Lys Ser Ala
305 310 315 320
Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe
325 330
<210> 14
<211> 678
<212> DNA
<213> 香菇珊瑚
<400> 14
atggcctcct ccgaggacgt catcaaggag ttcatgcgct tcaaggtgcg catggagggc 60
tccgtgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 120
acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 180
ctgtcccctc agttccagta cggctccaag gcctacgtga agcaccccgc cgacatcccc 240
gactacttga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 300
gacggcggcg tggtgaccgt gacccaggac tcctccctgc aggacggcga gttcatctac 360
aaggtgaagc tgcgcggcac caacttcccc tccgacggcc ccgtaatgca gaagaagacc 420
atgggctggg aggcctccac cgagcggatg taccccgagg acggcgccct gaagggcgag 480
atcaagatga ggctgaagct gaaggacggc ggccactacg acgccgaggt caagaccacc 540
tacatggcca agaagcccgt gcagctgccc ggcgcctaca agaccgacat caagctggac 600
atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgcgc cgagggccgc 660
cactccaccg gcgcctaa 678
<210> 15
<211> 225
<212> PRT
<213> 香菇珊瑚
<400> 15
Met Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val
1 5 10 15
Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu
20 25 30
Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val
35 40 45
Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln
50 55 60
Phe Gln Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro
65 70 75 80
Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
85 90 95
Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser
100 105 110
Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn
115 120 125
Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu
130 135 140
Ala Ser Thr Glu Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu
145 150 155 160
Ile Lys Met Arg Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala Glu
165 170 175
Val Lys Thr Thr Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Ala
180 185 190
Tyr Lys Thr Asp Ile Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr
195 200 205
Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly
210 215 220
Ala
225
<210> 16
<211> 678
<212> DNA
<213> 香菇珊瑚
<400> 16
atggcctcct ccgagaacgt catcaccgag ttcatgcgct tcaaggtgcg catggagggc 60
accgtgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 120
cacaacaccg tgaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 180
ctgtcccccc agttccagta cggctccaag gtgtacgtga agcaccccgc cgacatcccc 240
gactacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 300
gacggcggcg tggcgaccgt gacccaggac tcctccctgc aggacggctg cttcatctac 360
aaggtgaagt tcatcggcgt gaacttcccc tccgacggcc ccgtgatgca gaagaagacc 420
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 480
acccacaagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagtccatc 540
tacatggcca agaagcccgt gcagctgccc ggctactact acgtggacgc caagctggac 600
atcacctccc acaacgagga ctacaccatc gtggagcagt acgagcgcac cgagggccgc 660
caccacctgt tcctgtag 678
<210> 17
<211> 225
<212> PRT
<213> 香菇珊瑚
<400> 17
Met Ala Ser Ser Glu Asn Val Ile Thr Glu Phe Met Arg Phe Lys Val
1 5 10 15
Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu
20 25 30
Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys Val
35 40 45
Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln
50 55 60
Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro
65 70 75 80
Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
85 90 95
Met Asn Phe Glu Asp Gly Gly Val Ala Thr Val Thr Gln Asp Ser Ser
100 105 110
Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn
115 120 125
Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu
130 135 140
Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu
145 150 155 160
Thr His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu
165 170 175
Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr
180 185 190
Tyr Tyr Val Asp Ala Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr
195 200 205
Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu Phe
210 215 220
Leu
225
<210> 18
<211> 720
<212> DNA
<213> 维多利亚多管发光水母(Aequorea victoria)
<400> 18
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 19
<211> 239
<212> PRT
<213> 维多利亚多管发光水母(Aequorea victoria)
<400> 19
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 20
<211> 711
<212> DNA
<213> 香菇珊瑚
<400> 20
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctccaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta g 711
<210> 21
<211> 236
<212> PRT
<213> 香菇珊瑚
<400> 21
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 22
<211> 600
<212> DNA
<213> 白黑链霉菌(Streptomyces alboniger)
<400> 22
atgaccgagt acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta 60
cgcaccctcg ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac 120
cgccacatcg agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac 180
atcggcaagg tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag 240
agcgtcgaag cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt 300
tcccggctgg ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag 360
cccgcgtggt tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc 420
agcgccgtcg tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg 480
gagacctccg cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc 540
gacgtcgagg tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga 600
<210> 23
<211> 199
<212> PRT
<213> 白黑链霉菌(Streptomyces alboniger)
<400> 23
Met Thr Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp Val
1 5 10 15
Pro Arg Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro Ala
20 25 30
Thr Arg His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr Glu
35 40 45
Leu Gln Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys Val
50 55 60
Trp Val Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro Glu
65 70 75 80
Ser Val Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Pro Arg Met Ala
85 90 95
Glu Leu Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly Leu
100 105 110
Leu Ala Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr Val
115 120 125
Gly Val Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val Val
130 135 140
Leu Pro Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe Leu
145 150 155 160
Glu Thr Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly Phe
165 170 175
Thr Val Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp Cys
180 185 190
Met Thr Arg Lys Pro Gly Ala
195
<210> 24
<211> 795
<212> DNA
<213> 大肠杆菌
<400> 24
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180
caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 540
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780
gacgagttct tctga 795
<210> 25
<211> 267
<212> PRT
<213> 大肠杆菌
<400> 25
Met Gly Ser Ala Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala
1 5 10 15
Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile
20 25 30
Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro
35 40 45
Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln
50 55 60
Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys
65 70 75 80
Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu
85 90 95
Leu Gly Glu Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro
100 105 110
Ala Glu Lys Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr
115 120 125
Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile
130 135 140
Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp
145 150 155 160
Leu Asp Glu Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg
165 170 175
Leu Lys Ala Arg Met Pro Asp Gly Asp Asp Leu Val Val Thr His Gly
180 185 190
Asp Ala Cys Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly
195 200 205
Phe Ile Asp Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile
210 215 220
Ala Leu Ala Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala
225 230 235 240
Asp Arg Phe Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg
245 250 255
Ile Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe
260 265
<210> 26
<211> 399
<212> DNA
<213> 土曲霉(Aspergillus terreus)
<400> 26
atggccaagc ctttgtctca agaagaatcc accctcattg aaagagcaac ggctacaatc 60
aacagcatcc ccatctctga agactacagc gtcgccagcg cagctctctc tagcgacggc 120
cgcatcttca ctggtgtcaa tgtatatcat tttactgggg gaccttgtgc agaactcgtg 180
gtgctgggca ctgctgctgc tgcggcagct ggcaacctga cttgtatcgt cgcgatcgga 240
aatgagaaca ggggcatctt gagcccctgc ggacggtgcc gacaggtgct tctcgatctg 300
catcctggga tcaaagccat agtgaaggac agtgatggac agccgacggc agttgggatt 360
cgtgaattgc tgccctctgg ttatgtgtgg gagggctaa 399
<210> 27
<211> 132
<212> PRT
<213> 土曲霉(Aspergillus terreus)
<400> 27
Met Ala Lys Pro Leu Ser Gln Glu Glu Ser Thr Leu Ile Glu Arg Ala
1 5 10 15
Thr Ala Thr Ile Asn Ser Ile Pro Ile Ser Glu Asp Tyr Ser Val Ala
20 25 30
Ser Ala Ala Leu Ser Ser Asp Gly Arg Ile Phe Thr Gly Val Asn Val
35 40 45
Tyr His Phe Thr Gly Gly Pro Cys Ala Glu Leu Val Val Leu Gly Thr
50 55 60
Ala Ala Ala Ala Ala Ala Gly Asn Leu Thr Cys Ile Val Ala Ile Gly
65 70 75 80
Asn Glu Asn Arg Gly Ile Leu Ser Pro Cys Gly Arg Cys Arg Gln Val
85 90 95
Leu Leu Asp Leu His Pro Gly Ile Lys Ala Ile Val Lys Asp Ser Asp
100 105 110
Gly Gln Pro Thr Ala Val Gly Ile Arg Glu Leu Leu Pro Ser Gly Tyr
115 120 125
Val Trp Glu Gly
130
<210> 28
<211> 1026
<212> DNA
<213> 大肠杆菌
<400> 28
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780
cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
gaatag 1026
<210> 29
<211> 341
<212> PRT
<213> 大肠杆菌
<400> 29
Met Lys Lys Pro Glu Leu Thr Ala Thr Ser Val Glu Lys Phe Leu Ile
1 5 10 15
Glu Lys Phe Asp Ser Val Ser Asp Leu Met Gln Leu Ser Glu Gly Glu
20 25 30
Glu Ser Arg Ala Phe Ser Phe Asp Val Gly Gly Arg Gly Tyr Val Leu
35 40 45
Arg Val Asn Ser Cys Ala Asp Gly Phe Tyr Lys Asp Arg Tyr Val Tyr
50 55 60
Arg His Phe Ala Ser Ala Ala Leu Pro Ile Pro Glu Val Leu Asp Ile
65 70 75 80
Gly Glu Phe Ser Glu Ser Leu Thr Tyr Cys Ile Ser Arg Arg Ala Gln
85 90 95
Gly Val Thr Leu Gln Asp Leu Pro Glu Thr Glu Leu Pro Ala Val Leu
100 105 110
Gln Pro Val Ala Glu Ala Met Asp Ala Ile Ala Ala Ala Asp Leu Ser
115 120 125
Gln Thr Ser Gly Phe Gly Pro Phe Gly Pro Gln Gly Ile Gly Gln Tyr
130 135 140
Thr Thr Trp Arg Asp Phe Ile Cys Ala Ile Ala Asp Pro His Val Tyr
145 150 155 160
His Trp Gln Thr Val Met Asp Asp Thr Val Ser Ala Ser Val Ala Gln
165 170 175
Ala Leu Asp Glu Leu Met Leu Trp Ala Glu Asp Cys Pro Glu Val Arg
180 185 190
His Leu Val His Ala Asp Phe Gly Ser Asn Asn Val Leu Thr Asp Asn
195 200 205
Gly Arg Ile Thr Ala Val Ile Asp Trp Ser Glu Ala Met Phe Gly Asp
210 215 220
Ser Gln Tyr Glu Val Ala Asn Ile Phe Phe Trp Arg Pro Trp Leu Ala
225 230 235 240
Cys Met Glu Gln Gln Thr Arg Tyr Phe Glu Arg Arg His Pro Glu Leu
245 250 255
Ala Gly Ser Pro Arg Leu Arg Ala Tyr Met Leu Arg Ile Gly Leu Asp
260 265 270
Gln Leu Tyr Gln Ser Leu Val Asp Gly Asn Phe Asp Asp Ala Ala Trp
275 280 285
Ala Gln Gly Arg Cys Asp Ala Ile Val Arg Ser Gly Ala Gly Thr Val
290 295 300
Gly Arg Thr Gln Ile Ala Arg Arg Ser Ala Ala Val Trp Thr Asp Gly
305 310 315 320
Cys Val Glu Val Leu Ala Asp Ser Gly Asn Arg Arg Pro Ser Thr Arg
325 330 335
Pro Arg Ala Lys Glu
340
<210> 30
<211> 720
<212> DNA
<213> 维多利亚多管发光水母(Aequorea victoria)
<400> 30
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccttcggcta cggcctgaag tgcttcgccc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagct accagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 31
<211> 239
<212> PRT
<213> 维多利亚多管发光水母(Aequorea victoria)
<400> 31
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Phe Gly Tyr Gly Leu Lys Cys Phe Ala Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Tyr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 32
<211> 698
<212> DNA
<213> 香菇珊瑚
<400> 32
atgagcgagc tgattaagga gaacatgcac atgaagctgt acatggaggg caccgtggac 60
aaccatcact tcaagtgcac atccgagggc gaaggcaagc cctacgaggg cacccagacc 120
atgagaatca aggtggtcga gggcggccct ctccccttcg ccttcgacat cctggctact 180
agcttcctct acggcagcaa gaccttcatc aaccacaccc agggcatccc cgacttcttc 240
aagcagtcct tccctgaggg cttcacatgg gagagagtca ccacatacga agacgggggc 300
gtgctgaccg ctacccagga caccagcctc caggacggct gcctcatcta caacgtcaag 360
atcagagggg tgaacttcac atccaacggc cctgtgatgc agaagaaaac actcggctgg 420
gaggccttca ccgagacgct gtaccccgct gacggcggcc tggaaggcag aaacgacatg 480
gccctgaagc tcgtgggcgg gagccatctg atcgcaaaca tcaagaccac atatagatcc 540
aagaaacccg ctaagaacct caagatgcct ggcgtctact atgtggacta cagactggaa 600
agaatcaagg aggccaacaa cgagacctac gtcgagcagc acgaggtggc agtggccaga 660
tactgcgacc tccctagcaa actggggcac aagcttaa 698
<210> 33
<211> 233
<212> PRT
<213> 香菇珊瑚
<400> 33
Met Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu
1 5 10 15
Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly
20 25 30
Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly
35 40 45
Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr
50 55 60
Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe
65 70 75 80
Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr
85 90 95
Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp
100 105 110
Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser
115 120 125
Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr
130 135 140
Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met
145 150 155 160
Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr
165 170 175
Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val
180 185 190
Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu
195 200 205
Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu
210 215 220
Pro Ser Lys Leu Gly His Lys Leu Asn
225 230
<210> 34
<211> 1032
<212> DNA
<213> 噬菌体P1
<400> 34
atgtccaatt tactgaccgt acaccaaaat ttgcctgcat taccggtcga tgcaacgagt 60
gatgaggttc gcaagaacct gatggacatg ttcagggatc gccaggcgtt ttctgagcat 120
acctggaaaa tgcttctgtc cgtttgccgg tcgtgggcgg catggtgcaa gttgaataac 180
cggaaatggt ttcccgcaga acctgaagat gttcgcgatt atcttctata tcttcaggcg 240
cgcggtctgg cagtaaaaac tatccagcaa catttgggcc agctaaacat gcttcatcgt 300
cggtccgggc tgccacgacc aagtgacagc aatgctgttt cactggttat gcggcggatc 360
cgaaaagaaa acgttgatgc cggtgaacgt gcaaaacagg ctctagcgtt cgaacgcact 420
gatttcgacc aggttcgttc actcatggaa aatagcgatc gctgccagga tatacgtaat 480
ctggcatttc tggggattgc ttataacacc ctgttacgta tagccgaaat tgccaggatc 540
agggttaaag atatctcacg tactgacggt gggagaatgt taatccatat tggcagaacg 600
aaaacgctgg ttagcaccgc aggtgtagag aaggcactta gcctgggggt aactaaactg 660
gtcgagcgat ggatttccgt ctctggtgta gctgatgatc cgaataacta cctgttttgc 720
cgggtcagaa aaaatggtgt tgccgcgcca tctgccacca gccagctatc aactcgcgcc 780
ctggaaggga tttttgaagc aactcatcga ttgatttacg gcgctaagga tgactctggt 840
cagagatacc tggcctggtc tggacacagt gcccgtgtcg gagccgcgcg agatatggcc 900
cgcgctggag tttcaatacc ggagatcatg caagctggtg gctggaccaa tgtaaatatt 960
gtcatgaact atatccgtaa cctggatagt gaaacagggg caatggtgcg cctgctggaa 1020
gatggcgatt ag 1032
<210> 35
<211> 343
<212> PRT
<213> 噬菌体P1
<400> 35
Met Ser Asn Leu Leu Thr Val His Gln Asn Leu Pro Ala Leu Pro Val
1 5 10 15
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asp Met Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Gly Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ala Glu
165 170 175
Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr His Arg Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Asn Val Asn Ile
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 36
<211> 1269
<212> DNA
<213> 啤酒酵母
<400> 36
atgagccaat ttgatatatt atgtaaaaca ccacctaagg tcctggttcg tcagtttgtg 60
gaaaggtttg aaagaccttc aggggaaaaa atagcatcat gtgctgctga actaacctat 120
ttatgttgga tgattactca taacggaaca gcaatcaaga gagccacatt catgagctat 180
aatactatca taagcaattc gctgagtttc gatattgtca acaaatcact ccagtttaaa 240
tacaagacgc aaaaagcaac aattctggaa gcctcattaa agaaattaat tcctgcttgg 300
gaatttacaa ttattcctta caatggacaa aaacatcaat ctgatatcac tgatattgta 360
agtagtttgc aattacagtt cgaatcatcg gaagaagcag ataagggaaa tagccacagt 420
aaaaaaatgc ttaaagcact tctaagtgag ggtgaaagca tctgggagat cactgagaaa 480
atactaaatt cgtttgagta tacctcgaga tttacaaaaa caaaaacttt ataccaattc 540
ctcttcctag ctactttcat caattgtgga agattcagcg atattaagaa cgttgatccg 600
aaatcattta aattagtcca aaataagtat ctgggagtaa taatccagtg tttagtgaca 660
gagacaaaga caagcgttag taggcacata tacttcttta gcgcaagggg taggatcgat 720
ccacttgtat atttggatga atttttgagg aactctgaac cagtcctaaa acgagtaaat 780
aggaccggca attcttcaag caacaaacag gaataccaat tattaaaaga taacttagtc 840
agatcgtaca acaaggcttt gaagaaaaat gcgccttatc caatctttgc tataaagaat 900
ggcccaaaat ctcacattgg aagacatttg atgacctcat ttctgtcaat gaagggccta 960
acggagttga ctaatgttgt gggaaattgg agcgataagc gtgcttctgc cgtggccagg 1020
acaacgtata ctcatcagat aacagcaata cctgatcact acttcgcact agtttctcgg 1080
tactatgcat atgatccaat atcaaaggaa atgatagcat tgaaggatga gactaatcca 1140
attgaggagt ggcagcatat agaacagcta aagggtagtg ctgaaggaag catacgatac 1200
cccgcatgga atgggataat atcacaggag gtactagact acctttcatc ctacataaat 1260
agacgcata 1269
<210> 37
<211> 423
<212> PRT
<213> 啤酒酵母
<400> 37
Met Ser Gln Phe Asp Ile Leu Cys Lys Thr Pro Pro Lys Val Leu Val
1 5 10 15
Arg Gln Phe Val Glu Arg Phe Glu Arg Pro Ser Gly Glu Lys Ile Ala
20 25 30
Ser Cys Ala Ala Glu Leu Thr Tyr Leu Cys Trp Met Ile Thr His Asn
35 40 45
Gly Thr Ala Ile Lys Arg Ala Thr Phe Met Ser Tyr Asn Thr Ile Ile
50 55 60
Ser Asn Ser Leu Ser Phe Asp Ile Val Asn Lys Ser Leu Gln Phe Lys
65 70 75 80
Tyr Lys Thr Gln Lys Ala Thr Ile Leu Glu Ala Ser Leu Lys Lys Leu
85 90 95
Ile Pro Ala Trp Glu Phe Thr Ile Ile Pro Tyr Asn Gly Gln Lys His
100 105 110
Gln Ser Asp Ile Thr Asp Ile Val Ser Ser Leu Gln Leu Gln Phe Glu
115 120 125
Ser Ser Glu Glu Ala Asp Lys Gly Asn Ser His Ser Lys Lys Met Leu
130 135 140
Lys Ala Leu Leu Ser Glu Gly Glu Ser Ile Trp Glu Ile Thr Glu Lys
145 150 155 160
Ile Leu Asn Ser Phe Glu Tyr Thr Ser Arg Phe Thr Lys Thr Lys Thr
165 170 175
Leu Tyr Gln Phe Leu Phe Leu Ala Thr Phe Ile Asn Cys Gly Arg Phe
180 185 190
Ser Asp Ile Lys Asn Val Asp Pro Lys Ser Phe Lys Leu Val Gln Asn
195 200 205
Lys Tyr Leu Gly Val Ile Ile Gln Cys Leu Val Thr Glu Thr Lys Thr
210 215 220
Ser Val Ser Arg His Ile Tyr Phe Phe Ser Ala Arg Gly Arg Ile Asp
225 230 235 240
Pro Leu Val Tyr Leu Asp Glu Phe Leu Arg Asn Ser Glu Pro Val Leu
245 250 255
Lys Arg Val Asn Arg Thr Gly Asn Ser Ser Ser Asn Lys Gln Glu Tyr
260 265 270
Gln Leu Leu Lys Asp Asn Leu Val Arg Ser Tyr Asn Lys Ala Leu Lys
275 280 285
Lys Asn Ala Pro Tyr Pro Ile Phe Ala Ile Lys Asn Gly Pro Lys Ser
290 295 300
His Ile Gly Arg His Leu Met Thr Ser Phe Leu Ser Met Lys Gly Leu
305 310 315 320
Thr Glu Leu Thr Asn Val Val Gly Asn Trp Ser Asp Lys Arg Ala Ser
325 330 335
Ala Val Ala Arg Thr Thr Tyr Thr His Gln Ile Thr Ala Ile Pro Asp
340 345 350
His Tyr Phe Ala Leu Val Ser Arg Tyr Tyr Ala Tyr Asp Pro Ile Ser
355 360 365
Lys Glu Met Ile Ala Leu Lys Asp Glu Thr Asn Pro Ile Glu Glu Trp
370 375 380
Gln His Ile Glu Gln Leu Lys Gly Ser Ala Glu Gly Ser Ile Arg Tyr
385 390 395 400
Pro Ala Trp Asn Gly Ile Ile Ser Gln Glu Val Leu Asp Tyr Leu Ser
405 410 415
Ser Tyr Ile Asn Arg Arg Ile
420
<210> 38
<211> 122
<212> DNA
<213> 猴病毒40
<400> 38
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 39
<211> 494
<212> DNA
<213> 智人
<400> 39
cctggccttg gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg 60
catcattttg tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg 120
gagcaagggg caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag 180
ctggagtgca gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat 240
tcccctgcct cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta 300
atttttgttt ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc 360
ctaatctcag gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac 420
cactgctccc ttccctgtcc ttctgatttt aaaataacta taccagcagg aggacgtcca 480
gacacagcat aggc 494
<210> 40
<211> 225
<212> DNA
<213> 家牛
<400> 40
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225
<210> 41
<211> 56
<212> DNA
<213> 智人
<400> 41
aataaaggaa atttattttc attgcaatag tgtgttggaa ttttttgtgt ctctca 56
<210> 42
<211> 56
<212> DNA
<213> 单纯疱疹病毒
<400> 42
aataaaggaa atttattttc attgcaatag tgtgttggaa ttttttgtgt ctctca 56
<210> 43
<211> 462
<212> DNA
<213> 鼠属
<220>
<221> misc_feature
<222> (436)..(436)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (443)..(444)
<223> n是a、c、g或t
<400> 43
ctgtaagtct gcagaaattg atgatctatt aaacaataaa gatgtccact aaaatggaag 60
tttttcctgt catactttgt taagaagggt gagaacagag tacctacatt ttgaatggaa 120
ggattggagc tacgggggtg ggggtggggt gggattagat aaatgcctgc tctttactga 180
aggctcttta ctattgcttt atgataatgt ttcatagttg gatatcataa tttaaacaag 240
caaaaccaaa ttaagggcca gctcattcct cccactcatg atctatagat ctatagatct 300
ctcgtgggat cattgttttt ctcttgattc ccactttgtg gttctaagta ctgtggtttc 360
caaatgtgtc agtttcatag cctgaagaac gagatcagca gcctctgttc cacatacact 420
tcattctcag tattgntttg ccnngttcta attccatcag aa 462
<210> 44
<211> 996
<212> DNA
<213> 灰仓鼠
<220>
<221> misc_feature
<222> (501)..(557)
<223> n是a、c、g或t
<400> 44
agctttagaa ggattaagag gtatggcttt gttggaggaa gtgtgtcatg gtggtgggct 60
tagaggtttc aaaagcttaa gctaggccca gagtctgtct gtcaggatgt agaactctta 120
gctatttctc cagcaccatg tctgcctgtg tctagccatg gtccaagcca tgatgctaat 180
ggcctaacct ctcaaactgt aagcaggctt ccagttaaac ctttttttta taagagttgc 240
cttggtcatg gtgtctcttc tcagccatag aacaatgact aagacaaata gctaaagctt 300
agttagcact tctatgtacc agacagtatt ctatatttca atataaattc atctgctctt 360
cacagtcata ttgtgaaaag ggtactatca tcctcacttt aaaaaaagca aactgaggca 420
atggactctt ggataactta catgtttctc ttccttcctt ccttccttcc ttccttcctt 480
ccttccttcc ttccttcctt nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 540
nnnnnnnnnn nnnnnnncgg gtttctctgt gtagctttgg agcctatcct ggcactcgct 600
ctggagacca ggctggcctc gcactcacac agatccgcct gcctctgcct cccgagtgct 660
gggattaaag gcgtgcgcca ccaacgcccg gcaacttaca tatttctatc aagtcttttt 720
tttttttttt tttttttgct ctcattccct tccatagcct agggtgagca cagcaggcct 780
gacagtccaa gggcccaaag ggcctaagga ccgtggtgag ctggagtctt gccttttctg 840
ctttgttttc ttttaagtca gtctggctgt gaacttagtc tcctaaacag ctgaggtaca 900
ggtgcaacgc actcctcatc ctgggccggc tgaagggtgt gtctgcggtg gtgggggtcc 960
gagggcacat tggcggaaga agtgcaactg gaagcg 996
<210> 45
<211> 978
<212> DNA
<213> 灰仓鼠
<220>
<221> misc_feature
<222> (495)..(611)
<223> n是a、c、g或t
<400> 45
gaaagaaata ctgtcaaggc tggagacaca gttcagtgat atctctaatt tcatagataa 60
agtgggctga aggaatagtt gagtgtagaa cactaggttc tgggttcagg ctctagcact 120
gcaaaacaaa gataaccatg atgatataag cttataccag ggagtttaga tatacaaaca 180
aaatgaaact acatgtattc ccactatgca gacattattt atcaactcct tactacagtg 240
ttctggtttt tcttcttcgt ttaaatagct ctctctagcc taggcctccc tatgtagctc 300
aggctgtcct caaactggaa acaaagagct gagactacgg gtgagcatca ccatgcccga 360
ctacatttag ttactgaaat tatttgattt cctaaagact tattttgcaa aatttctcca 420
ggtgtgtgtg tgtgtgtgtg tgtttgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtggg 480
gggtgtgcgg ggggnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 600
nnnnnnnnnn ngtgtccgct aactccaagc cggatatgcc accggttcga ttttccgctg 660
ctctgggggc cgacgtggtc ccggacatta caatgtggtc aggctggggt aaagatctgt 720
gagactcagt ctggaagtct ggctagcgag aaaagccggg cattcccagc gtcagggagt 780
gggaacgcgt ttgtggaaga cccgggcctc cagcaacccc tctctgctgt ccactcgccc 840
tcaggcccag ctcgccaggc ggaggacagc tgtgcagcca cgctggacac ccacccctcc 900
cgcgctgggc ccgccctcta gcccgtagga ccaataggca ctgagaataa ccgtgcgtca 960
cgcggagcgg gcctatcg 978
<210> 46
<211> 983
<212> DNA
<213> 灰仓鼠
<400> 46
aaggagcaca gtggaacttt gtggagtcac agaggaaatt gggaaacgtt cagcctttac 60
taacaaaaat ggaaacctta ttttccacat gttttattta cattggcatt tctttcagtt 120
tctaattgaa attaaaaatg caggagtttt tctcccagtg tacctcccca aggaagaaaa 180
ttccttttga ggagataaaa atacttgtta atgtccccca aatataccta ccttaacttc 240
tttctccaaa caactttcca ttgtgggctt ttattacatc agtagttcgt gtactgtatt 300
gtaagacact tagtcgaaga atgatattaa caacatgtgg tattaaccac aagaaatgtg 360
atttagactg tttaaaatac cttaggacat tagccaccag ttaaataaag cacctttagt 420
cccaacattt cactcaggaa gcagaggcag agaggaactc tgagttcaag cccatcctga 480
tctccagagc aagttccagg acagccaggg atacacagag aagccctgac tcggaaaaga 540
aaagaaagaa ggaaaagaga agtttcaatg gaaattgagt atctgttcaa cttaaagtct 600
tttgtaatgg ccagaggtac ttcaaatcat agtgcaagtt tgtcacacaa atttttagag 660
aatgatggaa aaacaatctc tataactttg gtttctaggc taatgctttg atttcctctt 720
ggttaaataa atgatgatgt acaaacattg ctcccccccc ccactgcaaa ttgtactcca 780
tggaggagtt tctataatgt tgcagtttct acctaatggt gaccaaatgc cagtgaaagg 840
attgtaagag tacttgtcac atatactact cacctcattt caagaatgtg gacctgcttt 900
taaacattaa gagcaaatcg taattatata agaaataagc aaatgaaact attagactgt 960
ttgaaaagtc tttttcttta cag 983
<210> 47
<211> 1193
<212> DNA
<213> 灰仓鼠
<400> 47
ttaggaaaaa gaaggggggg ctaaaccctc ccccaccacc ttcttctccc gcagcgcacc 60
acacacagcg cgcgggctgc tcgctcggca cccggcggcc ccggcgcgtc cctgcctgca 120
tttatcaagc tgctcccccc caccccattt ttttcggaaa acgcattggc cttttggagt 180
ttaatcagaa gaggattttt gtccctgtcc cccccctctt tcatcgtccc cctcgcgtgt 240
ctctgccgtg gagggcttaa gcaatccagt ggagacggat ccatgcctgc gctcgagcgt 300
gtgtgtgcga gtgtaaattg ccgagaagcg ggggaaatca caggacttct tcaaatgctg 360
gactgaaaat tgtaattcat ctgccgccgc cgctgccttt ccggcccctc tgtcgtgctc 420
ttgagatctc cggttgggat tcctacggat tgacattttc agtgaagcca aaccgtgggg 480
acgggacgca atctggaaac cctcctgatt ttactctacc tagctctccc ccacctcctc 540
ctcattgcaa gtttcaaaga agcttatacc aggagacttc tgaagatcga tggtgtcgtt 600
gccttatata tttgtttggg ttttaccaaa aagcaaaaca aaaaaaagag ggggaaactt 660
gacagaagat catgctgtcc tttaaaaata agtaagtttt ttgcacagga atttggttta 720
gtttaacttt caacggacgc atttgatttt tttctttaaa tacattcgag caaatttaat 780
ttccaaacag tttaatgcag tctctttagt gtgtaacttg tagcggatat gcccttcctc 840
ccctgagtat ataaagaaca cacctgtttt taacttgcca agtcgtccct cccctcacct 900
ttcagcattg cggagtaagt agactgatat taacaaagct taataaataa tgtgcctcgt 960
gaaataaaga accgaaagga atttgaataa aaatttcctg catctaatgc caagggggaa 1020
acaccagaat caagtgttcc gcgtaactga agacaccccc tcatccagga atgcaaaagc 1080
acatccaata aaagagctgg attataacta tttttttttc ttttggggct gtggggcggg 1140
agtcaggacg agaagtgctg ttgatatacc tgcagctttt ttttcgggga agg 1193
<210> 48
<211> 1000
<212> DNA
<213> 灰仓鼠
<400> 48
ctacctgact ttcacctctc tctctgtaca tctgacttct tctgtgtctt gctggtgtca 60
atgcatctct tcttcctggc gacctctctt tccccggaag tcccacttat tccctcctgc 120
ctagctattg gccattcagc cctttgttaa accaatcaga agttacctta ggcagagaca 180
catctttaca gtatacgaag attatcccac aatagaggcc agcctggtct acagagcaag 240
ttccaggaca gccagggcta tacagagaaa ccctgtctca aaaaaccaaa aacaatcata 300
aaagacattg acatggaaat aatttttaaa taacttgaac aacaatcctc tttaagcatg 360
cctagttagt ttgggagggg tttactaatg attcttgaga aagacccctg tatatgactg 420
aaccctttgg aagcttgcat ataatatttc ttaaacaaga agaaattctt tcctttctgt 480
ctttcatgaa atgttctcac ccctttctcc ttcattatct cctcgaagca tttcaaaacc 540
tggtcaatcc atgagagtgc ccctttgtga gtgaaaaatg gttgaatagc cataatctca 600
tatggctcaa cttaacatct agccatccta caccatatag cagacagtag cccatttcat 660
ttgcatttgc atttttcagt ataatgtgta atgcacactg agaacatgtg tgcattattg 720
taggtgatat ggtgaataaa tcactgcttt tggctacata cattccagct ggaaggggca 780
ataccttttt gaaagctaat tgtactggag gaatggctgg gaaccctaac tatgtaaagt 840
ccagccagtc tggaggtgga ggcaggagga atcagttaaa ggtctttttg aactttgtag 900
ggagttggag caggggccag cctggctaca ggaacctcaa acaaatcaac agaaaaacaa 960
aacaaagtgc atgcatactg ctttggggcc attggacaac 1000
<210> 49
<211> 872
<212> DNA
<213> 灰仓鼠
<400> 49
gggaacatta tggggcgaca agctagagaa aaaaaatgat atattccagg gtggaaagtg 60
ctcgcttgac tattcataga acagaatagc cacagcatag cggggggctc agtactaggt 120
tgcaaatggc caggccaatt ctgggactta accccaagaa aagaaaaatt ggcaaggcca 180
ggatagacaa atgcagctgg cctaggggtg aagggaaaac agttggctga gaagagccac 240
gattcgcaga gaggcagaac acagactagg acccagctcg agacgtgcag gccgggtggg 300
taacatagag cccgggcgct cggctacccg agaacgtgag ggaggcttgg aagggcagag 360
atgcgttccc aggcgaccac agcatctatg ctgaggctga gcagctcggg acccgagggg 420
acttaggagg agaaaaggcc gcatactgct tcggggtaag ggacagaccg gggaaggacc 480
caagtcccac cgcccagagg gaactgacac gcagaccccg cagcagtccc cgggggccgg 540
gtgacgggag gacctggacg gttaccggcg gaaacggtct cgggttgaga ggtcacctga 600
gggacaggca gctgctgaac caataggacc ggcgcacagg gcggatgctg cctctcattg 660
gcggccgttg agagtaacca gtagccaatg agtcagcccg gggggcgtag cggtgacgta 720
agttgcggag gaggccgctt cgaatcggca gcggccagct tggtggcatg gaccaatcag 780
cgtcctccaa cgagaagcgc cttcaccaat cggaggcctc cacgacgggg ctggggggag 840
ggtatataag ccaagtcggc ggcggcgcgc tc 872
<210> 50
<211> 1121
<212> DNA
<213> 灰仓鼠
<400> 50
agctcactgt gcagaccatg ctggccttga actccaaagt aatccgcctg tccctgcctc 60
cctagtgcgg ggattaaagg catgtgccac tgtgcctgct ttgtgtcttt agaccaagag 120
gttgcacttt ctggttggtt acgcgtgact atgactaagt ctcaggaaaa aagtaaccta 180
cctgctaatt aagctcagaa taggccacag gagaggacga ctggcagttt ccacaaagca 240
cagtactttt tcgtcagcct atgtcatcat aggttattaa ggacttctgt ggttcagcat 300
tcaaaaaagc aaaccaggag agtattatca gtaattccaa gtaaaactta atgctttaaa 360
gagaaacggc ttacttcctg agtaacttgg aaaacctcct tatccacagt acaaacgatt 420
tccttcctct gggccttgtt ttttcttttt cttttttttt ttttgttttt ttgttttttt 480
gttttgtttt gttttccaag acagggtttc tctgtgtagc tttggagccc atcctggcac 540
tcgctctgga gacgaggctg gcctcgaact cgcagagatc cgcctgcttc tgcctcccca 600
gtgctggtat taaaggcgtg cacaaccaat tcccggctga tttggggctt taagcagaag 660
ttatttctga agtgtttcat acatatatga aaactgatta ttttaaccct tttaagagca 720
tatagaatta accaacttga gaaacatctt tccttcccca cctttgcctt gatactaaga 780
ttctagccaa acacagagaa aacagggatt ttcaatattt ttgtcatata ctgaagctag 840
atgtggttat gacagcattg agaaagctga ggtgggaata tcaggacatc taagccagct 900
agtacttctt aggatgatgc tgccttcaaa aatgttttgg agaggtaata atacctttaa 960
catcacaagc aaacaaaagt tgctttacat aaatagaaag ggtctttcct tcctaagaaa 1020
gtattaattt agctttcttt tcaacagatg aacaaaaggc ttgctagtag attcttaata 1080
ttagaaatac tgtcagtaca atatcatgag tatgtgatac t 1121
<210> 51
<211> 946
<212> DNA
<213> 灰仓鼠
<400> 51
ccggattccg gcttgttgga cctggctgcc tgcccggaga tccacttgct cttttggaac 60
aatttcagaa atagacgtag tgcttgctgg gggaaatata tccctcgtgg ttaggaaact 120
ctaggcctta gcccctctgt aacggtatac ccatttcgga acggaagaaa tttcccctta 180
ccggcctcat cctgggtgat gaggctccgc cctagctggt gggtggttac aagtccctgc 240
ttcctggtat agctgtttga aatttgaatc tggtgccaag ccaaggtggc tgccagcccc 300
ttctcaccgt gcttgcatgt gctttgggct ctagtaaggt ccgaagtctg ccccgaaatg 360
cctacttgga agtctcatcc atggccagca gccactagac ttatattact accctgctct 420
gaaattgcgc cagcgcatcg gcttgcccgg catggcctgt cagtcataga gatccccggc 480
tggtcataaa acttgtggtg ggggggggaa gcctgcgcat gcgcgggccc cagcacgtta 540
ctttgcctta gggtcgcacc ttgtggccgt tatcgggccc tctgctcttg atttttggta 600
cttactggag caacctggca ccctacttac tgtaggattc tgggtattaa gagcggaaga 660
gcagttctct gatggtgtcc aaggagaggc catctccttt cagagttaat caaaatgagt 720
gagtcctcgg aaggctacac ttacacggag acctcggtat tacttttacg tttcaaggtg 780
aggaccagag cagaccctgg tattaatgct ttccatgcta tggctactct catttcccac 840
ttccgccctt ttagtcaatg gaaagtagac caaaggatac aaagattata aacttggtga 900
ttatactttg gagtgacctc aatgacagga aatgcttcca ccttag 946
<210> 52
<211> 1074
<212> DNA
<213> 灰仓鼠
<400> 52
gaagccccgc ccatcgcagg cgagacttcc ggctgtaacc gcttgcagcg gcttctgctg 60
acggagtcgg aaccggcgga gctcaggatg gtgttgctcg agagcgagca ggtaccggct 120
gcccggaggg ccggggactc gagcgaatgg ggtcagctcg ggtcgcattt ccctctttgc 180
gggcgggcca gggccgtgac gcggcggggc gaggactgga ggctgcctaa ccgggcgtgt 240
tgtgttgcag ttcctgacgg agctgaccag gctcttccag aagtgccggt cgtcgggcag 300
cgtgtacatc accctgaaga agtgtaagca gcccccggga cgacggctgg gaggggccgc 360
tcactccggc ctcccggcac cggccacctc cggggctcag ggtcggggca gtggcgagtc 420
aggcagccca gcccctgctc cgtcagtgag gtcgcacatg ccttggggtc gcagtgtcaa 480
gtcgttgctc ccacgattga aacccccctg agtgacgatg agtgtggcga gtttatggga 540
ggcgagagca gtggtggtgg attggggtca ccctggaact cttctctgcc gttttcactt 600
tggagccggc agcaacgcct gtggcggtgg gtgttcccca ggttgtaact tttttttttt 660
tttttttaac gcagatgatg gtcgcaccaa acccactcca cggaagagtg cggtggagag 720
cgttgagccc gcagaaaaca agtgtctgtt gagagctacg gatgggaaaa ggaagatcag 780
caccgtggtg agctggagtc ctgtcttttc tgctttgcct tcttttaagt ctgtctgccg 840
tgaacttaat cctgtctcaa ataactgagg tacaggtgac ggtctatccc acggccggct 900
ggtaagctga attttaaaaa ctgtcacagc agacgcctcg gcctgtgccg gggtcacagt 960
gtatgttgtc agccgagaca gatacagtga tgatttctgt ggggctaaga gattgaatcc 1020
gggccagggt cttcattgtg tctgtcatca ccctgttact aagccacacc gcca 1074
<210> 53
<211> 1010
<212> DNA
<213> 灰仓鼠
<400> 53
atggtggtgg tggcagcgtc gccgagcgcg gccacggcgg ccccgaaagt actgcttcta 60
tcgggccagc ccgccgcgga cggccgggcg ctgccactca tggttccagg ctcgcgggca 120
gcagggtccg aggcgaacgg ggcgccacag gctcgcaagc ggcagcgcct cacgcacctg 180
agcccggagg agaaggcgct gcggaggtgg gctcggcggg cggggcggca aggccgggca 240
tgggaccctt tctcgtgtgg cggtcgggag ggctctgtgg ggtggcgtag atgagcctct 300
agtacctatt tctggaggga ggcacggagc tgaggtgaca gcccctccga aggtctgctt 360
agtctgtgtc ggggagtcta acacttgtca gacgggacct gacgctcagc cctctgtgaa 420
tgcttgctct tcttggagga cccatggcag ggtccgctct ggctgttgtt gcagccgctt 480
gggaacttaa cactgggatc cgagtcacca tcctccggca gcccgagttg agcttgggga 540
gggacggttg gtagcgcccc cgccgccttc acggagcctg ttggacagaa tcggaactag 600
aaagccgcgg gggaggaggg aagatgctta tgacgcaacg ggaatgtgtg tcagcccggt 660
ggtaaaataa gactcgagtg gacagcaaca tgggagagaa tcgagcaagt cttcaaggcc 720
cacgggcaga aaagctgtgg tttttgtctt tttgagagga ggagcctcag aatgtgttta 780
ccactgttta gtcttattct gtaaagtcag cgaaagcacc agctggccac atttacaaat 840
gaagatacag gaaagctgaa gatgactcgg ttcgttatgt gccctgtctt ccttcaggaa 900
actgaaaaac agagtagcag cgcagactgc ccgagatcga aagaaagccc ggatgagcga 960
gctggaacag caagtggtgg atttggaaga agaggtaaag ggatttaagg 1010
<210> 54
<211> 1087
<212> DNA
<213> 灰仓鼠
<400> 54
gaaaaatgct ttcagaaagc agttcatttt tgaaaggtgt gatgcttgga agcatcttct 60
atgccttgat cactacgcta ggccacatta ggattgggca cagaaacagg acacaccacc 120
atgagcatca ccacctgcaa gctcctaaca aagaagatat ctcgaaaatc tcagcggctg 180
agcgcatgga gctcagtaag agcttccggg tatactgtat agttcttgta aaacccaaag 240
atgtgagtct ttgggctgca gtgaaggaga cttggaccaa acactgtgac aaagcagagt 300
tcttcagttc tgaaaatgtt aaagtgtttg agtcaattaa cgtggacact gatgacatgt 360
ggttgatgat gaggaaagct tataaatatg cctttgataa atacaaagag cagtacaact 420
ggttcttcct tgcacgcccc agtacttttg ctgtgattga aaatctaaaa tattttttgt 480
taaaaaagga tccatcgcag cctttctatc taggacacac tgtaaaatct ggagaccttg 540
aatatgtgag tgtggatgga gggattgtct taagcataga gtcaatgaaa agactcaaca 600
gccttctcag tgttccggaa aagtgtcctg aacaaggtgg gatgatttgg aagatatctg 660
aagataagca gctagcagtc tgcctgaaat atgctggagt atttgcggaa aatgcggaag 720
acgctgatag aaaagatgta tttaatacca aatctgttgg gcttttcatt aaagaggcca 780
tgtctaacca cccgaaccag gtagtagaag gatgctgttc caatatggct gtcactttta 840
atggactaac tcctaatcag atgcatgtga tgatgtatgg ggtgtaccgg cttagggcct 900
ttggacatgt tttcaacgat gcgttggttt tcttacctcc aaacggttct gataatgact 960
gacaaaaagc aagagcatgc atttggtaac cacattaaga catgttatgc tttctaatcg 1020
ataatgcatc taacacagta gtgtgtttct tttccttatc tggtcacatt gaagtctact 1080
tgtacat 1087
<210> 55
<211> 1047
<212> DNA
<213> 灰仓鼠
<400> 55
atggctcaag ctgggagaac agggtatgat aaccgagaga tcgtgatgaa gtacatccat 60
tataagctgt cacagagggg ctacgagtgg gatgtgggag atgtggacgc cgcgcccctg 120
ggcgccgccc ccacccctgg catcttctcc ttccagcctg agagcaaccc aacgcccgct 180
gtgcaccggg acatggctgc caggacatcg ccactaaggc ccatagtcgc caccactggg 240
cctaccctta gccccgtgcc acctgtggtc cacctgaccc tccgccgggc tggggatgac 300
ttctcccgtc gctaccgtcg cgacttcgcg gagatgtcca gtcagctgca cctgacgccc 360
ttcaccgcga ggggacgctt tgctacggtg gtggaggaac tcttcaggga tggggtgaac 420
tgggggagga ttgtggcctt ctttgagttc ggtggggtca tgtgtgtgga gagcgtcaac 480
agggagatgt cacccctggt ggacaacatc gccctgtgga tgaccgagta cctgaaccgg 540
catctgcaca cctggatcca ggataacgga ggctgggtag gtgcatgtct gactgaatga 600
gtctgggctt tgctctcaaa gccaagatgc agagaggctg gggacttagt ggatcctggg 660
tcaaaatgag ccatgagcca atgaatgaaa atccagtttg tagctttgct ccccgtccca 720
gtacctttct ctggtcagat cacaccctgc caatactgtg ctagctcctg cctgcaggct 780
gtaaaagagc aaaggtccag tatttttgat ccagtaggat ctgaagataa atggtatccc 840
tccagtgagt cccagagtta cttgaagtct gagtagcttg ttgcagatgt tctggttcct 900
gggtaggaac cagacctcca gctttctctg catcttaggc tactctgttg gactaataac 960
tgacaaggtc caactagaca aataggctcc accagaggac gcaggcatac cttttctgac 1020
tcacttggga acattttccc aaagaaa 1047
<210> 56
<211> 980
<212> DNA
<213> 灰仓鼠
<400> 56
atgaccctga gtgtgactac ttcccttgct gggtcagttg gtgctaccag gaaccagcca 60
agagacattg gttctccgtg ttgtcatgct aggctcgggg aggctggtgt gggcaacttc 120
ctggtggctg atcctggagt aattgcccta cagcagatga cagccaacct ctgggcctct 180
ccagtgatta attttttttt tttttacaat ttcatttgtg tatacaatgc tttctgatca 240
cacatctcat tcttacacct ttcccaatct catacccctc caatcaccct cttactttca 300
tgtctttttg tttctcttgt gacccaatga acttaactag tactatctct gtgagcactg 360
atgtggtcac atccaaatta taatcaagac tgacatcaaa atctttcatt tctgtatctc 420
agtttggttt cacttttcag ggtaatatac attttaaaga tgtcacaccg aagtgctgat 480
ctaactaaaa tctaatagta ctgatgagac acaatataac aaggtgtaat ttcacccatc 540
agtttgtttt ttttttttaa ccagtgttca tctgtaggtt accactagag aacaaactaa 600
agcctactaa catctccagg ttacatatcc atgaccaata aatggtttta ttctcttaat 660
gatcatactt tcatagtgaa agtgaacttg gaggccaggt atgaatttag aagtgtgaag 720
tattcttgca aaaatgaagt gcactcccaa cccccagtct agcctctgtg taaatacggc 780
aggtttagga acaagttaaa cataactgtt aagataaagt cagcagactc acaaagtagg 840
cagttctcca ggacaagact gttttcttca gcatacggtg tccatcagag tgtggaagag 900
tgttgcagaa tacttgtttc cactgtgtga gcatgtgtcc ttgtgattgg ttaattaaag 960
agctgaatgg ccaatagcta 980
<210> 57
<211> 1227
<212> DNA
<213> 灰仓鼠
<400> 57
acactggcca agacaacagt gaccggagga cctgcctttg cggctccgag aggtaagcgc 60
cgcggcctgc tcttgccaga cctcctttga gcctgtctcg tggctcctcc tgacccgggg 120
ggcttctgtc gccctcagat cggaacgccg ccgcgctccg ggactacagc ctgttgctgg 180
acttcgagac tgcagacgga ccgaccgctg agcactggcc cacagcgccg gcaagatgaa 240
gttccctatg gtggcggcgg cgctgctgct gctctgcgcg gtgcgggccg aggaggagga 300
caagaaggag gatgtgggca cggtggtcgg catcgacctg gggaccacct attcctggtg 360
agtgggggag agagagtggg gcgtggcctc ctgggccggc gtgagagagt gaggtgctga 420
ttccttttct gtggggtgtt tccgtcagcg ttggtgtgtt caagaacggc cgcgtggaga 480
tcatagccaa cgatcagggc aaccgcatca cgccgtcgta tgtggccttc actcctgaag 540
gcgagcgtct gattggcgat gcggccaaga accagctcac ctccaatccc gagaacacgg 600
tcttcgacgc caagcgcctc atcggacgca cttggaatga cccttcagtg cagcaggaca 660
tcaagttctt gcctttcaag gtccaatccg tttttttttt ttttttttta acccacgctt 720
aaggggctgt tagggtggtg ggaaatttag aggttgaaac gaggcggaaa aacattcaaa 780
cggctaaaag gatgcagtcg gggtttacgt aacggtttta gatgtagtct cttttagtat 840
tatgagaaga gacacagtgt tacaatgtct aaaagttgga aggtagacta aaaactgtcg 900
atcggcccac aatacagctg tgcttagtct tagtcaagat ctccctaagg gaccaaaatg 960
aattcaagtt atggaagaga agaaacggat tattttttct ttaaactttg tggtgccatt 1020
gtttcaactt cggaaaaatt acctttaaat tattctttat cataggtggt tgaaaagaaa 1080
actaaaccat acattcaagt tgatattgga ggtgggcaaa ccaaaacatt tgccccagaa 1140
gaaatttctg ccatggttct cactaaaatg aaagaaactg ctgaagcata tttgggaaag 1200
aaggtaaata catgtgtggc atggtgt 1227
<210> 58
<211> 1039
<212> DNA
<213> 灰仓鼠
<400> 58
atgtgcatag cttttcgaat gctgctgtct gttataccaa aggtttgttg gtgtgattgt 60
tttctagaag tcttatcctt gagtaaaact gttttccttt cttttttagg attagaaatg 120
gctactcccc aatcagtttt tgtctttgca atttgcattt taatgataac agaattaatc 180
ctagcctcaa agagctacta tgatatctta ggtgtgccaa aatctgcctc agagcgacaa 240
atcaagaagg cctttcacaa attagcgatg aagtaccacc ccgacaaaaa taagagccct 300
gatgctgaag caaaattcag agagattgca gaaggtaagt aaatgattct gcagtctcat 360
gggtatttat agtaagtaac tgaaaatttt gtgtgctctt aaagatgtta tggaaattgg 420
agagtttatg tagatttttg caatttatct tgttagaata gatacctggc ttctgggtaa 480
gtaattgatt atagtaggta atttttgttg ttgttgttta caattctaaa atgcccgttt 540
cccttattta tttatgagat tactatgtat aaaatgaggt attagaaagt actgtgtata 600
aaatgaggga ttagaaagcc aaaattctta tcaagtaatt taaatgtatt tttactaagt 660
actgacttac tgtacacaaa ataggttaaa agtgtctatt gcatctacat ttcaaaacaa 720
tgtgtcttta aaaaattgtg aagtatgtta ctagttctaa aactaattgt acatccctgc 780
atattactta agtagttaat gggcctaact aggagttgga attaaaaatt tactttatct 840
agtaaagtga aaaacgtggt tttgtattag ttgaacacat ttgttaattt aattctttaa 900
tacaaataat agttttgcac aaataatatg aagatgaaca aattagtttt tcccacatgt 960
ttatttgtga taatggcagc atttaacaaa tatattaatt gaagaaataa ttattagaaa 1020
gacattattg ttctaacta 1039
<210> 59
<211> 1124
<212> DNA
<213> 灰仓鼠
<400> 59
gtcccaaaaa gttcaaagtc caagatggca acactcaagg accagctgat tgtgaatcta 60
cttaaggaag aacagacccc ccagaacaag attacgattg ttggggttgg tgctgttggc 120
atggcttgtg ccatcagtat cctcatgaag gtaagtgggg atccttcagg tcacaagccc 180
aagcattggg aggccctaca ttgtcacatt gtatataaaa ctatcaagtt tcaggcactc 240
attcaagaga gccttctatg aaacattttg caacatggtg atgcacaaag gattatccaa 300
agtaacatta taaaaggtta gcagactgag gcctttttaa aatgctctac agtatgttag 360
catgccctac cagcaagaaa gaatgcaggg agttgaagga acctagggtc tcccatatgg 420
taggtaacca ttggagctgt atgcccagct cttaagtaat ttttaattga aatgtatatg 480
tacctgtggt aaaaattaat atcctaccga atgggatatc ttgaatttct atccaatccc 540
taatgttccc tgacttataa tagttttcct ttgagaaaaa agtgtgtgtg tgtgtatgag 600
cacactgggt aactgagggt aattggcttc tctcctacct tgtgggttct gggggtcaaa 660
ctcagctcac caggcttgtg caggaattgc tttcccctcg agccatctca atcagagcta 720
aaatttaatt ggtcagataa ccacataatt gcattagaaa acacttgctg agacagggta 780
aatttttttt taagatttta tttatttatt atgtatacaa cattctgctt ccatatatat 840
ctacacacca gaagagggca ccagatctca taacgggtgg ttgtgaggca ctatgtggtt 900
tctgggaatt gaactcatga cctctggaag agcagtcagt gctcttaacc tcagagccat 960
ttctccagcc ctcagggtaa atgttaatat atatattttt atatatgggg ctaagacagg 1020
gtttctcttt gtaacccagg ctgttctgga actcattctg tagaccagac tggcctcaaa 1080
ctcatctgcc tgcctttgcc tcccaaatat taaaaataaa gttt 1124
<210> 60
<211> 34
<212> DNA
<213> 啤酒酵母
<400> 60
gaagttccta ttctctagaa agtataggaa cttc 34
<210> 61
<211> 34
<212> DNA
<213> 噬菌体P1
<220>
<221> misc_feature
<222> (14)..(16)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (19)..(21)
<223> n是a、c、g或t
<400> 61
ataacttcgt atannntann ntatacgaag ttat 34

Claims (42)

1.一种用于改良免疫球蛋白表达的HTP方法,其包含:
a.提供宿主细胞内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;
b.工程改造所述宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中所述多个宿主细胞包含个别宿主细胞,所述个别宿主细胞包含与可操作地连接到所述目标基因的所述启动子梯不同的启动子;以及
c.针对所关注的免疫球蛋白和/或所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库的细胞。
2.根据权利要求1所述的方法,其中所述宿主细胞是哺乳动物细胞。
3.根据权利要求1至2中任一权利要求所述的方法,其中所述宿主细胞是鼠类细胞。
4.根据权利要求1至3中任一权利要求所述的方法,其中所述宿主细胞是中国仓鼠卵巢细胞。
5.根据权利要求1至4中任一权利要求所述的方法,其中所述目标基因编码具有选自由以下组成的群组的功能的分子:分泌、蛋白质转运、应激反应、糖基化、细胞凋亡、未折叠蛋白质反应、蛋白质折叠、ER相关的降解和代谢。
6.根据权利要求1至5中任一权利要求所述的方法,其中所述目标基因编码选自由以下组成的群组的分子:SRP14、SRP9、SRP54、XBP-1、bcl-2、IGF1、COSMC、FUT8、BCL2、BAK、ATF6、PERK、IRE1α、BiP/GRP78(HSP70)、Dnajb9(ERdj4/HSP40)和LDHA。
7.根据权利要求1至6中任一权利要求所述的方法,其中所述启动子梯包含至少两个选自由以下组成的群组的启动子:CMV、EF1α、SV40、RSV和PGK。
8.根据权利要求1至7中任一权利要求所述的方法,其中所述启动子梯包含至少两个具有选自由SEQ ID NO 1-5组成的群组的核苷酸序列的启动子。
9.根据权利要求1至8中任一权利要求所述的方法,其中所述免疫球蛋白选自由以下组成的群组:IgG、IgM、IgA、IgE和IgD。
10.根据权利要求1至9中任一权利要求所述的方法,其中所述免疫球蛋白选自由以下组成的群组:IgG1、IgG2、IgG3和IgG4。
11.根据权利要求1至10中任一权利要求所述的方法,其中工程改造所述宿主细胞的所述基因组包含使用CRISPR相容性核酸内切酶和相关gRNA来靶向并且裂解所述目标基因上游的所述宿主细胞基因组。
12.根据权利要求11所述的方法,其进一步包含通过同源重组来插入来自所述启动子梯的启动子。
13.根据权利要求1至12中任一权利要求所述的方法,其中针对所关注的免疫球蛋白的表型特征筛选所述初始启动子交换宿主细胞库的细胞包含确认或表征以下:所述所关注的免疫球蛋白的效价、N端裂解和/或糖基化模式。
14.根据权利要求1至13中任一权利要求所述的方法,其中针对所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库的细胞包含确认或表征以下中的一或多个:细胞生长、培养期间的细胞存活模式、细胞密度和每天每个细胞产生的免疫球蛋白的细胞比生产率。
15.根据权利要求1至14中任一权利要求所述的方法,其中提供超过一个细胞路径目标基因。
16.根据权利要求1至15中任一权利要求所述的方法,其中重复步骤a)-c)。
17.根据权利要求1至16中任一权利要求所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库。
18.根据权利要求1至16中任一权利要求所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;以及
e.针对所关注的免疫球蛋白和/或所述宿主细胞的表型特征筛选所述后续启动子交换宿主细胞库的个别宿主细胞。
19.根据权利要求1至16中任一权利要求所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;
e.针对所关注的免疫球蛋白和/或所述宿主细胞的表型特征筛选所述后续启动子交换宿主细胞库的个别宿主细胞;以及
f.将步骤d)-e)重复进行一或多次。
20.一种宿主细胞群体,其由根据权利要求1至19中任一权利要求所述的方法衍生。
21.一种用于改良所关注的产物的表达的HTP方法,其包含:
a.提供宿主细胞内源性的细胞路径目标基因和包含展现不同表达谱的多个启动子的启动子梯;
b.工程改造所述宿主细胞的基因组,以产生包含多个宿主细胞的初始启动子交换宿主细胞库,其中所述多个宿主细胞包含个别宿主细胞,所述个别宿主细胞包含与可操作地连接到所述目标基因的所述启动子梯不同的启动子;以及
c.针对所关注的产物和/或所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库的细胞。
22.根据权利要求21所述的方法,其中所述宿主细胞是哺乳动物细胞。
23.根据权利要求21至22中任一权利要求所述的方法,其中所述宿主细胞是鼠类细胞。
24.根据权利要求21至23中任一权利要求所述的方法,其中所述宿主细胞是中国仓鼠卵巢细胞。
25.根据权利要求21至24中任一权利要求所述的方法,其中所述目标基因编码具有选自由以下组成的群组的功能的分子:分泌、蛋白质转运、应激反应、糖基化、细胞凋亡、未折叠蛋白质反应、蛋白质折叠、ER相关的降解和代谢。
26.根据权利要求21至25中任一权利要求所述的方法,其中所述目标基因编码选自由以下组成的群组的分子:SRP14、SRP9、SRP54、XBP-1、bcl-2、IGF1、COSMC、FUT8、BCL2、BAK、ATF6、PERK、IRE1α、BiP/GRP78(HSP70)、Dnajb9(ERdj4/HSP40)和LDHA。
27.根据权利要求21至26中任一权利要求所述的方法,其中所述启动子梯包含至少两个选自由以下组成的群组的启动子:CMV、EF1α、SV40、RSV和PGK。
28.根据权利要求21至27中任一权利要求所述的方法,其中所述启动子梯包含至少两个具有选自由SEQ ID NO 1-5组成的群组的核苷酸序列的启动子。
29.根据权利要求21至28中任一权利要求所述的方法,其中所述所关注的产物是蛋白质。
30.根据权利要求21至29中任一权利要求所述的方法,其中所述所关注的产物是免疫球蛋白。
31.根据权利要求21至30中任一权利要求所述的方法,其中所述所关注的产物选自由以下组成的群组:IgG、IgM、IgA、IgE和IgD。
32.根据权利要求21至31中任一权利要求所述的方法,其中所述所关注的产物选自由以下组成的群组:IgG1、IgG2、IgG3和IgG4。
33.根据权利要求21至32中任一权利要求所述的方法,其中工程改造所述宿主细胞的所述基因组包含使用CRISPR相容性核酸内切酶和相关gRNA来靶向并且裂解所述目标基因上游的所述宿主细胞基因组。
34.根据权利要求33所述的方法,其进一步包含通过同源重组来插入来自所述启动子梯的启动子。
35.根据权利要求21至34中任一权利要求所述的方法,其中针对所关注的产物的表型特征筛选所述初始启动子交换宿主细胞库的细胞包含确认或表征以下:所述所关注的产物的效价、N端裂解和/或糖基化模式。
36.根据权利要求21至35中任一权利要求所述的方法,其中针对所述宿主细胞的表型特征筛选所述初始启动子交换宿主细胞库的细胞包含确认或表征以下中的一或多个:细胞生长、培养期间的细胞存活模式、细胞密度和每天每个细胞产生的所关注的产物的细胞比生产率。
37.根据权利要求21至36中任一权利要求所述的方法,其中提供超过一个细胞路径目标基因。
38.根据权利要求21至37中任一权利要求所述的方法,其中重复步骤a)-c)。
39.根据权利要求21至38中任一权利要求所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库。
40.根据权利要求21至38中任一权利要求所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;以及
e.针对所关注的产物和/或所述宿主细胞的表型特征筛选所述后续启动子交换宿主细胞库的个别宿主细胞。
41.根据权利要求21至38中任一权利要求所述的方法,其进一步包含:
d.提供后续多个宿主细胞,所述后续多个宿主细胞各自包含选自存在于前述步骤中所筛选的至少两个个别宿主细胞中的基因变异的基因变异的独特组合,从而产生后续启动子交换宿主细胞库;
e.针对所关注的产物和/或所述宿主细胞的表型特征筛选所述后续启动子交换宿主细胞库的个别宿主细胞;以及
f.将步骤d)-e)重复进行一或多次。
42.一种宿主细胞群体,其由根据权利要求21至41中任一权利要求所述的方法衍生。
CN201980019507.2A 2018-03-20 2019-03-20 用于中国仓鼠卵巢细胞基因工程改造的htp平台 Pending CN111902540A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862645708P 2018-03-20 2018-03-20
US62/645,708 2018-03-20
PCT/US2019/023106 WO2019183183A1 (en) 2018-03-20 2019-03-20 A htp platform for the genetic engineering of chinese hamster ovary cells

Publications (1)

Publication Number Publication Date
CN111902540A true CN111902540A (zh) 2020-11-06

Family

ID=67987984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980019507.2A Pending CN111902540A (zh) 2018-03-20 2019-03-20 用于中国仓鼠卵巢细胞基因工程改造的htp平台

Country Status (7)

Country Link
US (3) US10988761B2 (zh)
EP (1) EP3768844A4 (zh)
JP (2) JP2021518128A (zh)
KR (1) KR20200132870A (zh)
CN (1) CN111902540A (zh)
CA (1) CA3091228A1 (zh)
WO (1) WO2019183183A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3768844A4 (en) 2018-03-20 2021-12-15 Zymergen Inc. HTP PLATFORM FOR GENETIC ENGINEERING OF OVARIAN CELLS FROM CHINESE HAMSTER
GB202001211D0 (en) * 2020-01-29 2020-03-11 Imperial College Innovations Ltd Methods
US20220154207A1 (en) * 2020-09-24 2022-05-19 Hoffmann-La Roche Inc. Mammalian cell lines with gene knockout

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015079053A2 (en) * 2013-11-29 2015-06-04 Ucb Biopharma Sprl Synthetic promoters
US20170159045A1 (en) * 2015-12-07 2017-06-08 Zymergen, Inc. Microbial strain improvement by a htp genomic engineering platform

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4435504A (en) 1982-07-15 1984-03-06 Syva Company Immunochromatographic assay with support having bound "MIP" and second enzyme
GB8406752D0 (en) 1984-03-15 1984-04-18 Unilever Plc Chemical and clinical tests
CA1303983C (en) 1987-03-27 1992-06-23 Robert W. Rosenstein Solid phase assay
US4855240A (en) 1987-05-13 1989-08-08 Becton Dickinson And Company Solid phase assay employing capillary flow
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
JPH1180185A (ja) 1997-09-05 1999-03-26 Res Dev Corp Of Japan オリゴヌクレオチドの化学合成法
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US8808986B2 (en) 2008-08-27 2014-08-19 Gen9, Inc. Methods and devices for high fidelity polynucleotide synthesis
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP2398915B1 (en) 2009-02-20 2016-08-24 Synthetic Genomics, Inc. Synthesis of sequence-verified nucleic acids
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
EP2395087A1 (en) 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
AU2013372026B2 (en) * 2013-01-03 2018-11-08 Merck Patent Gmbh Method for producing secretable antibodies by expression in saccharomyces cerevisiae
ES2947757T3 (es) 2014-11-05 2023-08-18 Illumina Inc Composiciones de transposasas para reducir el sesgo de inserción
BR112018011503A2 (pt) 2015-12-07 2018-12-04 Zymergen Inc promotores da corynebacterium glutamicum
US11151497B2 (en) 2016-04-27 2021-10-19 Zymergen Inc. Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
EP3768844A4 (en) 2018-03-20 2021-12-15 Zymergen Inc. HTP PLATFORM FOR GENETIC ENGINEERING OF OVARIAN CELLS FROM CHINESE HAMSTER

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015079053A2 (en) * 2013-11-29 2015-06-04 Ucb Biopharma Sprl Synthetic promoters
US20170159045A1 (en) * 2015-12-07 2017-06-08 Zymergen, Inc. Microbial strain improvement by a htp genomic engineering platform

Also Published As

Publication number Publication date
JP2024010245A (ja) 2024-01-23
EP3768844A1 (en) 2021-01-27
CA3091228A1 (en) 2019-09-26
JP2021518128A (ja) 2021-08-02
WO2019183183A1 (en) 2019-09-26
US20200347383A1 (en) 2020-11-05
EP3768844A4 (en) 2021-12-15
US10988761B2 (en) 2021-04-27
KR20200132870A (ko) 2020-11-25
US20230235318A1 (en) 2023-07-27
US20210254050A1 (en) 2021-08-19

Similar Documents

Publication Publication Date Title
Zhang et al. Function and evolution of upstream ORFs in eukaryotes
RU2711505C9 (ru) Улучшенные экспрессия и процессинг трансгена
Wuest et al. Genomics in mammalian cell culture bioprocessing
Kober et al. Development of a novel ER stress based selection system for the isolation of highly productive clones
JP5396653B2 (ja) Mar配列の多トランスフェクション手順による高効率の遺伝子導入および哺乳動物細胞における発現
Boscolo et al. Simple scale-up of recombinant antibody production using an UCOE containing vector
WO2021226077A2 (en) Compositions, systems, and methods for the generation, identification, and characterization of effector domains for activating and silencing gene expression
US20230235318A1 (en) A htp platform for the genetic engineering of chinese hamster ovary cells
KR20090053893A (ko) 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도
KR20120099376A (ko) 강화된 전이 유전자 발현과 공정 방법 및 그 산물
O’Neill et al. Protein-specific signal peptides for mammalian vector engineering
Assis et al. Identification of novel proteins and mRNAs differentially bound to the Leishmania Poly (A) Binding Proteins reveals a direct association between PABP1, the RNA-binding protein RBP23 and mRNAs encoding ribosomal proteins
Pei et al. Generation of designer receptors exclusively activated by designer drugs (DREADDs) using directed molecular evolution
Brüggemann et al. Strategies to obtain diverse and specific human monoclonal antibodies from transgenic animals
Li et al. Uncovering the “ZIP code” for bZIP dimers reveals novel motifs, regulatory rules and one billion years of cis-element evolution
Nozawa et al. Construction of a protein library of Arabidopsis transcription factors using a wheat cell-free protein production system and its application for DNA binding analysis
EP3351629A1 (en) Method for identifying bioactive protein, and bioactive protein obtained by said method
CN110804626B (zh) 高cg片段与低cg启动子联用构建高效表达载体的方法
Xu et al. Achievements and perspectives in Chinese hamster ovary host cell engineering
Liu From Past Achievements to Future Breakthroughs
Hughes Mapping and Functional Analysis of cis-Regulatory Elements in Mouse Photoreceptors
Pereira The use of site-directed integration to study genomic and transcriptional stability of recombinant promoters in CHO cells
Gadgil et al. Cell Line Development for Biomanufacturing Processes
TWI475109B (zh) 通過抑制報告基因表現量的手段進行高產量細胞株選殖之策略
Arab et al. Molecular Biology for the Clinician

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040080

Country of ref document: HK