CN109195986B - 基于使用表达增强性基因座来制备抗体的组合物和方法 - Google Patents

基于使用表达增强性基因座来制备抗体的组合物和方法 Download PDF

Info

Publication number
CN109195986B
CN109195986B CN201780024557.0A CN201780024557A CN109195986B CN 109195986 B CN109195986 B CN 109195986B CN 201780024557 A CN201780024557 A CN 201780024557A CN 109195986 B CN109195986 B CN 109195986B
Authority
CN
China
Prior art keywords
rrs
vector
nucleotide sequence
hcf
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780024557.0A
Other languages
English (en)
Other versions
CN109195986A (zh
Inventor
R·巴布
D·布拉科夫
陈刚
J·P·梵迪
Y·赵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Priority to CN202211606177.7A priority Critical patent/CN116515757A/zh
Publication of CN109195986A publication Critical patent/CN109195986A/zh
Application granted granted Critical
Publication of CN109195986B publication Critical patent/CN109195986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/468Immunoglobulins having two or more different antigen binding sites, e.g. multifunctional antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • C07K2317/526CH3 domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Reproductive Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及重组蛋白在真核细胞中的位点特异性整合和表达。具体地讲,本发明包括通过采用多个表达增强性基因座来改善真核细胞、尤其是中国仓鼠(灰仓鼠(Cricetulus griseus))细胞系中的抗原结合蛋白(包括单特异性抗体和双特异性抗体)表达的组合物和方法。

Description

基于使用表达增强性基因座来制备抗体的组合物和方法
相关申请的交叉引用
本申请要求2016年4月20日提交的美国临时申请No.62/325,400的优先权权益,其全部内容以引用方式并入本文。
发明领域
本公开涉及重组蛋白在真核细胞中的位点特异性整合和表达。具体地讲,本公开涉及通过采用表达增强性基因座来改善真核细胞、尤其是中国仓鼠(灰仓鼠(Cricetulusgriseus))细胞系中的抗原结合蛋白(包括单特异性抗体和双特异性抗体)表达的组合物和方法。
背景技术
细胞表达系统旨在提供用于制备给定蛋白(不论用于研究或治疗用途)的可靠且高效的来源。由于例如哺乳动物表达系统对重组蛋白进行适当的翻译后修饰的能力,哺乳动物细胞中的重组蛋白表达是用于制备治疗性蛋白的优选方法。
尽管可获得许多系统,但是仍存在用于表达重组蛋白的整合基因的高效基因转移和稳定性的挑战。对于目标转基因的长期表达,一个考虑因素是对细胞基因的破坏程度最小以避免细胞系表型的变化。
对稳定细胞系进行工程化以容纳用于表达的多个基因(例如多特异性抗体中的多条抗体链)是特别具有挑战性的。可能存在整合基因表达水平的大幅变化。整合额外基因可能由于局部遗传环境(即,位置效应)而引起表达的较大变化和不稳定性。用于产生多特异性抗原结合蛋白的表达系统通常需要旨在作为特异性多聚体形式配对的两个或更多个不同免疫球蛋白链的表达,并且可通常倾向于同型二聚体的产生,而非所需的异型二聚体或多聚体组合。因此,本领域中需要经改善的哺乳动物表达系统。
发明内容
在一个方面,本公开提供了一种细胞,所述细胞含有位点特异性地整合在两个表达增强性基因座中的多个外源核酸,其中所述多个外源核酸共同编码抗原结合蛋白。所述抗原结合蛋白可为双特异性抗原结合蛋白或常规的单特异性抗原结合蛋白。
在一些实施方案中,提供了一种细胞,所述细胞含有整合在第一表达增强的基因座中的第一外源核酸,以及整合在第二表达增强的基因座中的第二外源核酸;其中所述第一外源核酸和所述第二外源核酸共同编码抗原结合蛋白。
在一些实施方案中,第一外源核酸含有编码第一重链片段(HCF)的核苷酸序列,并且第二外源核酸含有编码第一轻链片段(LCF)的核苷酸序列。
在一些实施方案中,第二外源核酸还包括编码第二HCF(也为HCF*)的核苷酸序列。在双特异性抗原结合蛋白中的第一HCF和第二HCF可为相同的或不同的。每个HCF-或LCF-编码核苷酸序列可编码来自恒定区的氨基酸。在一些实施方案中,编码第一HCF的核苷酸序列编码第一CH3结构域,并且编码第二HCF(HCF*)的核苷酸序列编码第二CH3结构域。在一些实施方案中,第一CH3结构域和第二CH3结构域的差异可在于至少一个氨基酸位置,例如导致不同蛋白A结合特性的位置。在其他实施方案中,编码第一CH结构域和第二CH结构域的核苷酸序列彼此的差异在于所述核苷酸序列之一已经经过密码子修饰。
在一些实施方案中,第一外源核酸(含有第一HCF-编码核苷酸序列)还包含编码第二LCF的核苷酸序列。第二LCF可与第二外源核酸中的第一LCF相同或不同。
在本案提供的细胞的许多实施方案中,编码HCF或LCF的核苷酸序列中的每一者独立地可操作地连接至启动子,使得每个HCF或LCF编码序列的转录被单独地调控。
在一些实施方案中,第一RRS和第二RRS相对于第一外源核酸分别位于5'和3',并且第三RRS和第四RRS相对于第二外源核酸分别位于5'和3',其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同。通常,侧接外源核酸的一对RRS内的RRS不同,以避免所述外源核酸的非预期重组和去除。在一些实施方案中,第一RRS、第二RRS、第三RRS和第四RRS彼此均不同。
在第一基因座中的第一外源核酸包括第一HCF-编码核苷酸序列且第二基因座中的第二外源核酸包括第一LCF-编码序列和第二HCF-编码序列两者的实施方案中,第一附加RRS可存在于编码第一LCF的核苷酸序列与编码第二HCF的核苷酸序列之间。所述附加RRS可不同于第一RRS、第二RRS、第三RRS和第四RRS中的每一者。在一些实施方案中,第一附加RRS被包括在所述可选标志基因可操作地连接的启动子与可选标志基因之间,或附加RRS可被包括在可选标志基因中、或在可选标志基因的内含子内,所述内含子存在于第一LCF-编码序列与HCF-编码序列之间、或在第一HCF-编码序列与第二HCF-编码序列之间。
在第一基因座中的第一外源核酸包括第一HCF-编码核苷酸序列和第二HCF-编码核苷酸序列且第二基因座中的第二外源核酸包括第一LCF-编码序列和第二HCF-编码序列两者的实施方案中,第一RRS和第二RRS相对于第一外源核酸可分别存在于5'和3',并且第三RRS和第四RRS相对于第二外源核酸可分别存在于5'和3',其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同。在一些实施方案中,第一HCF和第二HCF相同,并且第一LCF和第二LCF相同,在所述实例中,所述RRS可被工程化,使得第一RRS和第三RRS相同,并且第二RRS和第四RRS相同。在一些实施方案中,第一HCF和第二HCF不同,并且第一LCF和第二LCF相同,在所述实例中,所述RRS可被工程化,使得第一RRS、第二RRS、第三RRS和第四RRS彼此均不同。无论两个HCF是相同还是不同,附加RRS可存在于第一LCF-编码序列与第二HCF-编码序列之间,和/或存在于第二LCF编码序列与第一HCF-编码序列之间。所述附加(中间)RRS不同于第一RRS、第二RRS、第三RRS和第四RRS中的每一者。所述附加RRS可被包括在可选标志基因内、或在可选标志基因的内含子内,被放置在两个HCF/LCF编码序列之间。
在另一个方面,提供了含有整合在两个表达增强性基因座内的成对RRS的细胞,所述成对RRS可用于通过RMCE来整合编码抗原结合蛋白的核酸。
在某些实施方案中,提供了含有整合在两个表达增强性基因座内的成对RRS的细胞,所述成对RRS可用于在重组酶的存在下通过RMCE来同时整合编码抗原结合蛋白的核酸。
在一些实施方案中,提供了一种细胞,所述细胞含有从5'至3'整合在第一表达增强的基因座内的:第一RRS、第一外源核酸和第二RRS;从5'至3'整合在第二表达增强的基因座内的:第三RRS、第二外源核酸和第四RRS;其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同。
在一些实施方案中,第一外源核酸包括第一可选标志基因,并且第二外源核酸包括第二可选标志基因,其中所述第一可选标志基因和所述第二可选标志基因不同。
在一些实施方案中,第一外源核酸和第二外源核酸中的一者或两者可包括附加RRS,即介于第一基因座的第一RRS与第二RRS之间的附加RRS、和/或介于第三RRS与第四RRS之间的附加RRS。所述附加的中间RRS与5'和3'处的RRS不同。当附加RRS被包括在5'RRS与3'RRS之间(例如介于第一RRS与第二RRS之间)时,一个可选标志基因可被包括在所述5'RRS与附加(中间)RRS之间,并且另一个不同的可选标志基因可被包括在所述附加RRS与3'RRS之间。
在另一个实施方案中,所述细胞提供第一外源核酸,所述第一外源核酸包括第三RRS,即介于第一基因座中的第一RRS与第二RRS之间的附加RRS,其中所述第一RRS和所述第二RRS在表达盒的5'和3'端侧接两个选择标志物。在其他实施方案中,第二外源核酸也可包括相同的第三RRS,即介于第二基因座中的第一RRS与第二RRS之间的附加RRS,其中所述第一RRS和所述第二RRS在表达盒的5'和3'端侧接两个选择标志物。包括在第一RRS、第三RRS和第二RRS之间的四个可选标志基因彼此不同。
在另一个实施方案中,所述细胞提供第一外源核酸,所述第一外源核酸包括第三RRS,即介于第一基因座中的第一RRS与第二RRS之间的附加RRS,其中所述第一RRS和所述第二RRS在表达盒的5'和3'端侧接两个选择标志物。在其他实施方案中,第二外源核酸可包括第六RRS,即介于第二基因座中的第四RRS与第五RRS之间的附加RRS,其中所述第四RRS和第五RRS在表达盒的5'和3'端侧接两个选择标志物。包括在RRS之间的四个可选标志基因彼此不同。
在许多实施方案中,本案提供的细胞为CHO细胞系的细胞。
在多个实施方案中,所利用的两个表达增强性基因座选自由下列各项所组成的组:含有与SEQ ID NO:1至少90%相同的核苷酸序列的基因座、含有与SEQ ID NO:2至少90%相同的核苷酸序列的基因座、以及含有与SEQ ID NO:3至少90%相同的核苷酸序列的基因座。
在又一个方面,载体组提供用于在细胞中整合和表达双特异性抗原结合蛋白。
在一些实施方案中,所述载体组包括:第一载体,其从5'至3'含有第一RRS、含有编码第一HCF的核苷酸序列的第一核酸、和第二RRS;第二载体,其从5'至3'含有第三RRS、含有编码第二HCF的核苷酸序列的第二核酸、第四RRS;以及编码第一LCF的核苷酸序列,所述核苷酸序列在第一载体中的第一核酸内、或在与第一载体和第二载体不同的第三载体中;其中所述第一RRS、所述第二RRS、所述第三RRS和所述第四RRS不同;其中所述双特异性抗原结合蛋白含有第一HCF、第二HCF和第一LCF,其中所述第一HCF和所述第二HCF不同。
在一些实施方案中,编码第一LCF的核苷酸序列在第一载体中的第一核酸内。在一些实施方案中,第一核酸还包括第一可选标志基因。
在一些实施方案中,编码第一LCF的核苷酸序列在第三载体内提供并侧接5'RRS和3'RRS,其中(i)所述3'RRS与第一RRS相同,并且所述5'RRS与第一RRS和第二RRS不同,或(ii)所述5'RRS与第二RRS相同,并且所述3'RRS与第一RRS和第二RRS不同。在一些实施方案中,所述载体可被设计成使得第一载体和第三载体所共用的共同RRS以断裂的可选标志基因形式(或断裂-内含子形式)提供,例如放置在位于第一载体和第三载体之一上的可选标志基因的5'部分的3'端,并且放置在位于另一载体上的可选标志基因的其余3'部分的5'端。
在一些实施方案中,所述载体组还包括编码第二LCF的核苷酸序列,所述核苷酸序列在第二载体中的第二核酸内、或在有别于第一载体、第二载体和第三载体的第四载体中提供。
在一些实施方案中,第一LCF和第二LCF相同。
在一些实施方案中,编码第一LCF的核苷酸序列被包括在第一载体中的第一核酸内,并且编码第二VL的核苷酸序列在第四载体上提供。在一些实施方案中,在第四载体上的编码第二LCF的核苷酸序列侧接5'RRS和3'RRS,其中(i)所述3'RRS与第三RRS相同,并且所述5'RRS与第三RRS和第四RRS不同,或(ii)所述5'RRS与第四RRS相同,并且所述3'RRS与第三RRS和第四RRS不同。在某些实施方案中,所述载体被设计成使得第二载体和第四载体所共用的共同RRS在断裂标志物(例如经由内含子)形式中提供,例如放置在位于第二载体和第四载体之一上的可选标志基因的5'部分的3'端,并且放置在位于另一载体中的可选标志基因的其余3'部分的5'端。
在一些实施方案中,编码第一LCF的核苷酸序列在第一载体中的第一核酸内,并且编码第二VL的核苷酸序列在第二载体上的第二核酸内。
在一些实施方案中,编码第一LCF的核苷酸序列在第三载体上,并且编码第二VL的核苷酸序列在第四载体上。在一些实施方案中,在第三载体上的编码第一LCF的核苷酸序列侧接5'RRS和3'RRS,其中(i)在第三载体上的3'RRS与第一RRS相同,并且在第三载体上的5'RRS与第一RRS和第二RRS不同,或(ii)在第三载体上的5'RRS与第二RRS相同,并且在第三载体上的3'RRS与第一RRS和第二RRS不同;其中在所述第四载体上的编码第二LCF的核苷酸序列侧接5'RRS和3'RRS,其中(i)在第四载体上的3'RRS与第三RRS相同,并且在第四载体上的5'RRS与第三RRS和第四RRS不同,或(i i)在第四载体上的5'RRS与第四RRS相同,并且在第四载体上的3'RRS与第三RRS和第四RRS不同。
在本文提供的载体组的许多实施方案中,编码第一HCF的核苷酸序列可编码第一CH3结构域,并且编码第二HCF的核苷酸序列可编码第二CH3结构域。在一些实施方案中,第一CH3结构域和第二CH3结构域的差异在于至少一个氨基酸。在一些实施方案中,编码第一CH3结构域和第二CH3结构域的核苷酸序列的差异在于所述核苷酸序列之一已经经过密码子修饰。
在本文提供的载体组的许多实施方案中,编码HCF或LCF的核苷酸序列中的每一者独立地连接启动子。
在一些实施方案中,载体组还可包括核苷酸序列,所述核苷酸序列编码识别所述RRS中的一个或多个的一种或多种重组酶,所述核苷酸序列可包括在LCF-或HCF-编码载体之一中或在单独的载体中提供。
在其他实施方案中,提供载体组,其包括:第一载体,所述第一载体含有第一核酸,所述第一核酸侧接5'同源臂和3'同源臂以整合到细胞的第一表达增强性基因座中;以及第二载体,所述第二载体含有第二核酸,所述第二核酸侧接5'同源臂和3'同源臂以整合到细胞的第二表达增强性基因座中;其中所述第一核酸和所述第二核酸共同编码抗原结合蛋白。
在又一个方面,本公开提供了系统,所述系统包括细胞(例如CHO细胞)和一个或多个载体的组合并可用于制备将外源核酸整合在两个表达增强性基因座内的细胞,所述外源核酸共同编码作为单特异性蛋白或双特异性蛋白的抗原结合蛋白。例如,所述系统可以试剂盒的形式提供。
在某些实施方案中,提供了一种系统,所述系统包含细胞和载体组,其中所述细胞含有整合到其基因组的两个单独的表达增强的基因座的一组RRS,所述一组RRS彼此不同且分隔在一个或多个外源核酸(例如选择标志物)之间,用于与载体组中的目标基因重组交换;并且其中所述载体组中的RRS包含与所述细胞中的RRS的排列相同的排列。
在一些实施方案中,提供了一种系统,所述系统包含细胞和载体组,其中所述细胞含有从5'至3'整合在第一表达增强的基因座内的:第一RRS、第一外源核酸和第二RRS,以及从5'至3'整合在第二表达增强的基因座内的:第三RRS、第二外源核酸和第四RRS;其中所述第一RRS和所述第二RRS不同,并且第三RRS和第四RRS不同;其中所述第一表达增强的基因座和所述第二表达增强的基因座不同;其中所述载体组包括(i)第一载体,其从5'至3'含有:第一载体5'RRS、第一核酸和第一载体3'RRS,其中所述第一载体5'和3'RRS不同;(ii)第二载体,其从5'至3'含有:第二载体5'RRS、第二核酸和第二载体3'RRS,其中所述第二载体5'和3'RRS不同;以及(iii)编码第一HCF的核苷酸序列和编码第一LCF的核苷酸序列,其中所述两条重链-编码核苷酸序列之一在第一核酸中且另一核苷酸序列在第二核酸中;其中所述第一HCF和所述第一LCF为抗原结合蛋白的区;并且其中在将所述载体引入所述细胞时,所述载体内的第一核酸和第二核酸通过所述RRS介导的重组而分别整合到第一表达增强的基因座和第二表达增强的基因座中。
在一些实施方案中,所述抗原结合蛋白为单特异性抗原结合蛋白。
在一些实施方案中,第一RRS和第三RRS相同,并且第二RRS和第四RRS相同。在某些实施方案中,第一附加RRS存在于第一基因座中的第一RRS与第二RRS之间。在一些实施方案中,第一载体5'RRS与第一RRS和第三RRS相同;并且第一载体3'RRS、第二载体5'RRS和第一附加RRS相同;并且第二载体3'RRS与第二RRS和第四RRS相同。在一些实施方案中,LCF-编码核苷酸序列在第一载体中,并且HCF-编码核苷酸序列在第二载体中。在一些实施方案中,第一载体3'RRS放置在可选标志基因的5'部分的3'端,并且第二载体5'RRS放置在所述可选标志基因的其余可选标志基因3'部分的5'端。在其他实施方案中,第一载体5'RRS与第一RRS相同,第一载体3'RRS与第二RRS相同;并且其中第二载体5'RRS与第三RRS相同,第二载体3'RRS与第四RRS相同。
在多个实施方案中,所述抗原结合蛋白为双特异性抗原结合蛋白。
在一些实施方案中,所述系统中的载体组还包括编码第二HCF的核苷酸序列,所述第二HCF与第一HCF不同。
在一些实施方案中,编码第一LCF的核苷酸序列和编码第二HCF的核苷酸序列均包括在第一载体中的第一核酸中,并且编码第一HCF的核苷酸序列在第二载体中。在一些实施方案中,第一载体5'RRS与第一RRS相同,第一载体3'RRS与第二RRS相同,第二载体5'RRS与第三RRS相同,并且第二载体3'RRS与第四RRS相同。
在一些实施方案中,编码第二HCF的核苷酸序列在第三单独载体上,侧接第三载体5'RRS和第三载体3'RRS。在一些实施方案中,编码第一LC的核苷酸序列在第一载体中,编码第一HCF的核苷酸序列在第二载体中,第一载体5'RRS与第一RRS相同,第一载体3'RRS与第二载体5'RRS相同并且与第一附加RRS相同,并且第二载体3'RRS与第二RRS相同,第三载体5'RRS与第三RRS相同,第三载体3'RRS与第四RRS相同,其中所述第一附加RRS被包括在第一基因座中、介于第一RRS与第二RRS之间。在一些实施方案中,所述载体系被设计成以断裂标志物形式提供共同RRS,例如第一载体3'RRS放置在包括于第一载体中的可选标志基因的5'部分的3'端,并且第二载体5'RRS放置在包括于第二载体中的其余可选标志基因的5'端。
在一些实施方案中,所述系统中的载体组还包括编码第二LCF的核苷酸序列,所述第二LCF可与第一LCF相同或不同。
在一些实施方案中,编码第二LCF的核苷酸序列在第二载体的第二核酸中,其中第一载体5'RRS与第一RRS相同,第一载体3'RRS与第二RRS相同,第二载体5'RRS与第三RRS相同,并且第二载体3'RRS与第四RRS相同。
在一些实施方案中,编码第二LCF的核苷酸序列在第三单独载体中,侧接第三载体5'RRS和第三载体3'RRS。在一些实施方案中,第一载体5'和3'RRS分别与第一基因座中的第一RRS和第二RRS相同;第三载体5'RRS与第三RRS相同,第三载体3'RRS与第二载体'5RRS相同并且与在第二基因座中介于第三RRS和第四RRS之间的附加RRS相同,并且第二载体3'RRS与第四RRS相同。在一些实施方案中,所述共同RRS被设计成断裂标志物形式,例如第三载体3'RRS放置在包括于第三载体中的可选标志基因的5'部分的3'端,并且第二载体'5RRS放置在包括于第二载体中的可选标志基因的其余3'部分的5'端。
在本文提供的系统的许多实施方案中,编码HCF或LCF的核苷酸序列可编码来自恒定区的氨基酸。在一些实施方案中,编码第一HCF的核苷酸序列可编码第一CH3结构域,并且编码第二HCF的核苷酸序列可编码第二CH3结构域。在一些实施方案中,第一CH3结构域和第二CH3结构域的差异在于至少一个氨基酸。在一些实施方案中,编码第一CH3结构域和第二CH3结构域的核苷酸序列的差异在于所述核苷酸序列之一已经经过密码子修饰。
在本文提供的系统的许多实施方案中,编码HCF或LCF的核苷酸序列中的每一者独立地连接至启动子。
在一些实施方案中,系统的载体组还可包括核苷酸序列,所述核苷酸序列编码识别所述RRS中的一个或多个的一种或多种重组酶,所述核苷酸序列可包括在HCF-或LCF-编码载体之一中或在单独的载体中提供。
在多个实施方案中,本文所提供的系统中的细胞为CHO细胞。
在多个实施方案中,所述两个表达增强的基因座选自由下列各项所组成的组:包含SEQ ID NO:1的核苷酸序列的基因座、包含SEQ ID NO:2的核苷酸序列的基因座、和包含SEQ ID NO:3的核苷酸序列的基因座。
在另一个方面,本公开还提供制备双特异性抗原结合蛋白的方法。在一个实施方案中,所述方法利用本文公开的系统并通过转染将所述系统的载体引入所述系统的细胞中。可筛选并鉴定经转染的细胞,其中外源核酸已通过RMCE适当地整合到所述细胞的两个表达增强性基因座中。含HCF的多肽和含LCF的多肽可从所述整合的核酸表达,并且目标抗原结合蛋白可从鉴定的经转染的细胞获得,并使用已知的方法进行纯化。
在另一个实施方案中,所述方法简单地利用上述细胞,所述细胞含有共同编码抗原结合蛋白的整合于两个表达增强的基因座处的外源核酸,并从所述细胞表达所述抗原结合蛋白。
附图说明
图1对于常规的单特异性抗体,用于整合在一个表达增强性基因座相较于多个表达增强性基因座中的示例性抗体克隆策略。将两种载体转染到宿主细胞中,第一载体携带编码抗体链1(AbC1)例如轻链的核酸,第二载体携带编码抗体链2(AbC2)例如重链的核酸,以及与整合在宿主细胞的靶向基因座中的标志物不同的选择标志物。从5'到3':载体构建体的RRS1、中间RRS3和RRS2位点匹配宿主细胞的基因座中侧接选择标志物的RRS位点。转染到宿主细胞中的附加载体编码重组酶。当第二载体的选择标志物是抗生素抗性基因时,由于两种载体被工程化以合并允许表达标志物,因此选择阳性重组克隆以在抗生素中生长。或者,荧光标志物使得能通过荧光激活细胞分选(FACS)分析来进行阳性克隆选择。相同的载体可用于在单个基因座,例如
Figure BDA0001834214000000091
基因座(基因座1)处的位点特异性整合。
图2使用双载体克隆策略整合在一个表达增强性基因座内相对于整合在两个基因座内,将抗体A和抗体B克隆到如图1所描绘的基因座中。细胞被分离并经受12天加料分批培养,随后收获,并使用蛋白A传感器进行Octet滴度测定。也观察到细胞是等基因型的和稳定的。观察到利用双位点整合方法的整体滴度增加0.5至0.9倍。
图3对于三条抗体链所编码的双特异性抗体,用于整合在一个表达增强性基因座中相较于整合在两个单独的表达增强性基因座中的示例性抗体克隆策略。三种载体用于此双特异性策略:第一载体,其携带核酸,所述核酸编码抗体链1(AbC1)例如共同轻链,侧接RRS1和RRS3,以整合到
Figure BDA0001834214000000101
(SEQ ID NO:1;基因座1)中;第二载体,其携带抗体链2(AbC2)例如重链,具有上游选择标志物,侧接RRS4和RRS6,以整合到SEQ ID NO:2基因座中;以及另外的第三载体,其携带核酸,所述核酸编码第二拷贝AbC1(所述第二拷贝AbC1连接至与第二载体中的选择标志物不同的选择标志物,并且连接至抗体链3(AbC3)例如第二(不同)重链),载体盒中的5’侧接RRS4且3'侧接RRS5(5'和3'RRS与宿主细胞中位于包含SEQ IDNO:2的基因座处的RRS位点匹配)。所示的双载体系统可用于单个基因座,例如
Figure BDA0001834214000000104
基因座(包含SEQ ID NO:1;基因座1)处的位点特异性整合。分析来自各个生产细胞系的滴度,参见图5。
图4对于三条或四条抗体链所编码的双特异性抗体,用于整合在一个表达增强性基因座中相较于整合在两个单独的表达增强性基因座中的示例性抗体克隆策略。四种载体用于此双特异性策略:第一载体,其携带核酸,所述核酸编码抗体链1(AbC1)例如第一轻链,侧接RRS1和RRS3,以整合到
Figure BDA0001834214000000102
(SEQ ID NO:1;基因座1)中;第二载体,其携带抗体链2(AbC2)例如重链,5′侧接RRS3且3′侧接RRS2,以同样整合到
Figure BDA0001834214000000103
(SEQ ID NO:1;基因座1)中;第三载体,其携带核酸,所述核酸编码与第二载体中的选择标志物不同的选择标志物并且连接至抗体链3(AbC3)例如第二(不同)重链),载体盒中的5’侧接RRS6且3'侧接RRS5(5'和3'RRS与宿主细胞中位于包含SEQ ID NO:2的基因座处的RRS位点匹配);以及另外的第四载体,其携带核酸,所述核酸编码第二轻链,例如抗体链1(AbC1)的核酸(然而,可与第一轻链相同或不同)。所示的四载体系统可用于两个基因座,例如
Figure BDA0001834214000000106
基因座(包含SEQID NO:1;基因座1)和包含SEQ ID NO:2或3的基因座处的位点特异性整合。将一个基因座(
Figure BDA0001834214000000105
基因座;基因座1)处的四载体系统系整合与双载体系统整合进行比较。
图5使用双载体克隆策略整合在一个表达增强性基因座内相对于整合在两个基因座内,克隆双特异性抗体C和双特异性抗体D,细胞被分离并经受12天加料分批培养,随后收获并使用固定化抗-Fc、和第二抗-Fc*(经修饰的Fc检测抗体,参见US 2014-0134719A1,2014年5月15日公开)进行Octet滴度测定。也观察到细胞是等基因型的和稳定的。相较于双特异性抗体(异型二聚体)在一个整合位点中的表达,利用双位点整合方法,观察到总双特异性滴度(异型二聚体形成)增加1.75至2倍。
图6A和6B.将双特异性抗体E(Ab E)、双特异性抗体F(Ab F)、双特异性抗体G(AbG)、和双特异性抗体H(Ab H)克隆至RSX或RSX2BP中。表达每个双特异性抗体的细胞包含在一个表达增强性基因座(RSX)或两个表达增强的基因座(RSX2BP)中的(共同)轻链核苷酸、重链核苷酸(野生型Fc)和经修饰的重链核苷酸(Fc*)。细胞被分离并经受13天加料分批培养、随后收获并进行HPLC洗脱方法,以测定整体抗体和双特异性抗体滴度(图6A)。将每个总抗体滴度的双特异性抗体物质滴度(从同型二聚体物质纯化出来)的比率确定为总Ab的百分比(图6B)。
图7.单特异性抗体J和K(分别为Ab J和Ab K)被克隆到RSX或RSX2中。细胞被分离并经受13天加料分批培养、随后收获并进行HPLC方法,以测定整体IgG滴度。
具体实施方式
定义
如本文所用,术语“抗体”包括包含通过二硫键相互连接的四条多肽链(两条重链(H)和两条轻链(L))的免疫球蛋白分子。每条重链可以包含重链可变区(本文中缩写为HCVR或VH)和重链恒定区。重链恒定区包含三个结构域:CH1、CH2、CH3和铰链。每条轻链包含轻链可变区(本文中缩写为LCVR或VL)和轻链恒定区。轻链恒定区包含一个结构域CL。VH和VL区还可细分成称为互补决定区(CDR)的高变区,其间插有称为构架区(FR)的更保守的区。每个VH和VL由从氨基末端到羧基末端按照下述次序排列的三个CDR和四个FR组成:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4(重链CDR可缩写为HCDR1、HCDR2和HCDR3;轻链CDR可缩写为LCDR1、LCDR2和LCDR3。
短语"抗原结合蛋白"包括具有至少一个CDR并且能够选择性地识别抗原,即能够结合带有至少在微摩尔的范围内的KD的抗原的蛋白。治疗性抗原结合蛋白(例如治疗性抗体)经常需要在纳摩尔或皮摩尔的范围内的KD。通常,抗原结合蛋白包括两个或更多个CDR,例如2、3、4、5、或6个CDR。抗原结合蛋白的例子包括抗体、抗体的抗原结合片段,例如含有抗体的重链和轻链的可变区的多肽(例如Fab片段、F(ab')2片段)、以及含有抗体的重链和轻链的可变区并含有来自重和/或轻链的恒定区(例如一个或多个恒定结构域,即CL、CH1、铰链、CH2、和CH3结构域中的一个或多个)的附加氨基酸的蛋白。
短语"双特异性抗原结合蛋白"包括能够选择性地结合两个或更多个表位或与所述两个或更多个表位具有不同特异性的抗原结合蛋白-在两个不同分子(例如抗原)上或在同一分子上(例如在同一抗原上)。此类蛋白的抗原结合部分或片段抗原结合(Fab)部分对特定抗原具有特异性,并且通常由免疫球蛋白的重链可变区和轻链可变区构成。在一些情况下,重链可变区和轻链可变区可能不是同源对,换句话说,具有不同的结合特异性。
双特异性抗原结合蛋白的例子是”双特异性抗体”,其包括能够选择性地结合两个或更多个表位的抗体。双特异性抗体一般包含两条不同的重链,其中每条重链特异性结合不同表位—在两个不同分子(例如抗原)上或在同一分子上(例如在同一抗原上)。如果双特异性抗原结合蛋白能够选择性地结合两个不同的表位(第一表位和第二表位),则第一重链可变区对第一表位的亲和力一般将比第一重链可变区对第二表位的亲和力低至少一个至两个或三个或四个数量级,反之也然。双特异性抗原结合蛋白,例如双特异性抗体可包括识别相同抗原的不同表位的重链可变区。典型的双特异性抗体具有两条重链以及免疫球蛋白轻链,所述两条重链各自具有三个重链CDR,随后为(N末端至C末端)CH1结构结构域、铰链、CH2结构结构域和CH3结构结构域,所述免疫球蛋白轻链不赋予抗原结合特异性,但可与每条重链结合,或者可与每条重链结合并且可结合由重链抗原结合区结合的一个或多个表位,或者可与每条重链结合并且使得重链之一或两者能够与一个或两个表位结合。在一个实施方案中,Fc结构域包括至少CH2和CH3。Fc结构域可包括铰链、CH2结构域和CH3结构域。
一种具体化的双特异性形式包括第一重链(HC)、具有经修饰CH3(HC*)的第二重链、和共同轻链(LC)(同一轻链的两个拷贝)。另一个实施方案包括第一重链(HC)、共同LC和HC-ScFv融合多肽(其中所述第二HC融合至ScFv的N末端)。另一个实施方案包括第一HC、同源LC、HC-ScFv融合多肽(其中所述第二HC融合至ScFv的N末端)。另一个实施方案包括第一重链(HC)、LC和Fc结构域。另一个实施方案包括第一HC、LC、ScFv-Fc融合多肽(其中所述Fc融合至ScFv的C末端)。另一个实施方案包括第一HC、共同LC、和Fc-ScFv融合多肽(其中所述Fc融合至ScFv的N末端)。另一个实施方案包括第一HC、LC和ScFv-HC(其中所述第二HC融合至ScFv的C末端)。
在某些实施方案中,一条重链(HC)可为天然的或"野生型"序列且第二重链可在Fc结构域中被修饰。在其他实施方案中,一条重链(HC)可为天然的或”野生型”序列且第二重链的密码子可以是经过密码子修饰的。
术语"细胞"包括适于表达重组核酸序列,并且具有允许外源核酸的稳定整合和增强表达的基因座的任何细胞。细胞包括哺乳动物细胞,诸如非人类动物细胞、人类细胞或细胞融合物,例如杂交瘤或四源杂交瘤。在一些实施方案中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中,细胞为选自下列细胞的哺乳动物细胞:CHO(例如CHO K1、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾(例如HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60、(例如BHK21)、Jurkat、Daudi、A431(表皮的)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT060562、Sertoli细胞、BRL 3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如PER.C6TM细胞)。
"细胞密度"是指单位样品体积中细胞的数量,例如总(活的和死的)细胞数/毫升。可以手动或自动(例如用流式细胞仪)对细胞的数量进行计数。已对自动细胞计数仪进行调适来使用例如标准台盼蓝摄取技术对活细胞的数量或死细胞的数量或活/死两种细胞的数量进行计数。短语"活细胞密度"或"活细胞浓度"是指每样品体积中活细胞的数量(也被称为"活细胞计数")。任意数量的众所周知的手册或自动技术可以用于确定细胞密度。可以测量培养物的在线生物质的量,其中电容或光密度与每体积中细胞的数量相关。细胞培养物例如生产培养物中最终细胞密度根据起始细胞系而变化,例如在约1.0至10×106个细胞/mL的范围内。在一些实施方案中,在从生产细胞培养物收获目标蛋白之前,最终细胞密度达到1.0至10×106个细胞/mL。在其他实施方案中,最终细胞密度达到大于5.0×106个细胞/mL,大于6×106个细胞/mL,大于7×106个细胞/mL,大于8×106个细胞/mL,大于9×106个细胞/mL,或大于10×106个细胞/mL。
术语"经过密码子修饰"意指编码蛋白的核苷酸序列已在一个或多个核苷酸(即一个或多个密码子)被修饰,而不改变所述密码子所编码的氨基酸,从而产生所述核苷酸序列的经过密码子修饰的形式。核苷酸序列的密码子修饰可为在基于核酸的测定(例如尤其是基于杂交的测定、PCR)中用于区分核苷酸序列与其经过密码子修饰的形式的便利基础。在一些情况下,通过采用本领域熟知的密码子优化技术使核苷酸序列经过密码子修饰,以提供所编码蛋白在宿主细胞中的改善或优化表达(Gustafsson,C.等人,2004,Trends inBiotechnology,22:346–353;Chung,B.K.-S.等人,2013,Journal of Biotechnology,167:326–333;Gustafsson,C.等人,2012,Protein Expr Purif,83(1):37–46)。使用此类技术的序列设计软件工具在本领域中也是众所周知的,包括但不限于密码子优化器(FuglsangA.2003,Protein Expr Purif,31:247–249),Gene Designer(Villalobos A等人,2006,BMCBioinforma,7:285),and OPTIMIZER(PuigbòP等人2007,Nucleic Acids Research,35:W126-W131)等等。
短语“互补决定区”或术语“CDR”包括由生物的免疫球蛋白基因的核酸序列编码的氨基酸序列,其通常(即在野生型动物中)出现在免疫球蛋白分子(例如抗体或T细胞受体)的轻链或重链的可变区中的两个构架区之间。CDR可由例如种系序列或者重排或未重排序列,以及例如天然或成熟的B细胞或T细胞编码。在一些情况下(例如对于CDR3),CDR可由两个或更多个序列(例如,种系序列)编码,所述两个或更多个序列是不邻接的(例如,未重排的核酸序列中),但在B细胞核酸序列中是邻接的,例如由于剪接或连接序列(例如,V-D-J重组以形成重链CDR3)。
术语”表达增强性基因座”是指细胞基因组中的基因座,所述基因座含有一序列或多个序列,当合适的基因或构建体是外源性地添加(即整合)至所述一个或多个序列中或接近所述一个或多个序列、或”可操作地连接”至所述一个或多个序列时,所述基因座表现出与所述基因组中的其他区或序列相比更高水平的表达。
术语“增强”在用于描述增强的表达时包括例如与相同表达构建体的单一拷贝的随机整合体池相比,超过通常通过将外源性序列随机整合到基因组中或通过整合在不同基因座所观察到的至少约1.5倍增强到至少约3倍增强的表达。采用本发明的序列所观察到的加倍表达增强是与在基本上相同的条件下、在本发明的序列不存在的情况下所测量的相同基因的表达水平相比,例如与整合到相同物种基因组中的另一基因座相比。增强的重组效率包括基因座重组能力的增强(例如,采用重组酶识别位点("RRS"))。增强是指超过随机重组(例如,不采用重组酶识别位点等)的重组效率,其通常是0.1%。优选增强的重组效率超过随机约10倍,或是约1%。除非规定,否则要求保护的发明不限于特定的重组效率。增强的表达基因座通常由宿主细胞支持目标蛋白的高生产率。因此,增强的表达包括每个细胞的目标蛋白的高产量(以蛋白克数计的升高滴度),而非简单地通过培养物中的细胞的高拷贝数得到高滴度。比生产率Qp(pg/细胞/日,即pcd)被视为可持续生产力的量度。表现出大于5pcd、或大于10pcd、或大于15pcd、或大于20pcd、或大于25pcd、或甚至大于30pcd之Qp的重组宿主细胞是合乎需要的。目标基因插入表达增强性基因座、或"热点"的宿主细胞表现出高的比生产率。
在关于目标基因座采用短语“外源性地添加的基因”或“外源性地添加的核酸”或简称为”外源核酸”的情况下,所述短语是指作为自然界中所发现的基因座目标在基因座内不存在的任何DNA序列或基因。例如,CHO基因座(例如包含SEQ ID NO:1或SEQ ID NO:2序列的基因座)内“外源核酸”可以是自然界中特定CHO基因座内未发现的仓鼠基因(即,仓鼠基因来自仓鼠基因组的另一基因座)、来自任何其他物种的基因(例如人类基因)、嵌合基因(例如人类/小鼠)或自然界中未发现的任何其他基因存在于目标CHO基因座内。
短语“重链”或“免疫球蛋白重链”包括来自任何生物的免疫球蛋白重链恒定区序列,并且除非另有说明,否则包括重链可变结构域。除非另有说明,否则重链可变结构域包括三个重链CDR和四个FR区。通常的重链在可变结构域之后具有(从N末端到C末端)CH1结构域、铰链、CH2结构域和CH3结构域。术语“重链的片段"包括重链的至少10、20、30、40、50、60、70、80、90、100或更多个氨基酸的肽,并且可包括一个或多个CDR、结合有一个或多个FR的一个或多个CDR、CH1、铰链、CH2或CH3中的一者或多者、可变区、恒定区、恒定区的片段(例如CH1、CH2CH3)、或它们的组合。HCF的例子包括VH,以及Fc区的全部或部分。短语"编码HCF的核苷酸序列"包括编码由HCF组成的多肽的核苷酸序列和编码含有HCF的多肽的核苷酸序列,例如可含有除了指定HCF以外的附加氨基酸的多肽。例如,编码HCF的核苷酸序列包括编码由VH组成、由连接到CH3的VH组成、由完整重链组成的多肽等的核苷酸序列。
在核酸序列的情况下,“同源序列”是指基本上与参考核酸序列同源的序列。在一些实施例中,如果两个序列的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的相应核苷酸在相关的残基序列段上是相同的,那么这两个序列被认为是基本上同源的。在一些实施例中,相关序列段是完全序列。
短语“轻链”包括来自任何生物的免疫球蛋白轻链恒定区序列,并且除非另有说明,否则包括人κ和λ轻链。除非另有说明,否则轻链可变(VL)结构域通常包括三个轻链CDR和四个构架(FR)区。一般地,全长轻链从氨基末端到羧基末端包括包含FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4的VL结构域和轻链恒定结构域。可用于本发明的轻链包括例如不选择性结合由双特异性抗体选择性结合的第一表位或第二表位的那些。合适的轻链还包括可结合或有助于结合抗体的抗原结合区所结合的表位中的一个或两个。术语"轻链的片段"或"轻链片段"(或"LCF")包括轻链的至少10、20、30、40、50、60、70、80、90、100或更多个氨基酸的肽,并且可包括一个或多个CDR、结合有一个或多个FR的一个或多个CDR、可变区、恒定区、恒定区的片段、或它们的组合。LCF的例子包括VL和轻链恒定区(“CL”)的全部或部分。短语"编码LCF的核苷酸序列"包括编码由LCF组成的多肽的核苷酸序列和编码含有LCF的多肽的核苷酸序列,例如可含有除了指定LCF以外的附加氨基酸的多肽。例如,编码LCF的核苷酸序列包括编码尤其由VL组成、或由完整轻链组成的多肽的核苷酸序列。
短语"可操作地连接"是指核酸或蛋白以所连接的分子如同预期般发挥作用的方式连接。DNA区当在功能上彼此相关时是可操作地连接的。例如,如果启动子能够参与编码序列的转录,那么所述启动子被可操作地连接到所述序列;如果核糖体结合位点经定位以便允许翻译,那么所述核糖体结合位点被可操作地连接到编码序列。一般来说,可操作地连接可以包括但并不要求邻接。就如分泌性前导序列的序列来说,邻接并且适当放置在阅读框中是典型的特征。在目标基因座的表达增强性序列在功能上与目标基因(GOI)相关的情况下,例如在其存在使得GOI的表达增强的情况下,其被可操作地连接到GOI。
当描述目标基因座,例如SEQ ID NO:1或SEQ ID NO:2或其片段时,“同一性百分比”意味着包括沿着邻接的同源区表现出所列举同一性的同源序列,但在相比较的序列中不具有同源性的间隙、缺失或插入的存在不纳入同一性百分比的计算中。
如本文所用,在例如SEQ ID NO:1或其片段与物种同源物之间的“同一性百分比”测定将不包括在比对中物种同源物无同源序列比较(即,SEQ ID NO:1或其片段在那一点处具有插入,或物种同系物具有间隙或缺失,视具体情况而定)的序列比较。因此,“同一性百分比”不包括间隙、缺失和插入的罚分。
“识别位点”或“识别序列”是由核酸酶或其他酶识别以结合并且引导DNA主链的位点特异性裂解的特定DNA序列。核酸内切酶在DNA分子内裂解DNA。识别位点在本领域中也被称为识别靶位点。
“重组酶识别位点”(或"RRS")是由重组酶,如Cre重组酶(Cre)或翻转酶(flp)识别的特定DNA序列。位点特异性重组酶在其一个或多个目标识别序列被战略性置于生物体基因组中时,可以进行DNA重排,包括缺失、倒位和易位。在一个实例中,Cre在其DNA目标识别位点loxP处特异性介导重组事件,所述识别位点是由通过8-bp间隔子分隔开的两个13-bp反向重复序列构成。可以采用不止一个重组酶识别位点,例如以有助于重组介导的DNA交换。也可以采用重组酶识别位点(例如lox位点)的变异体或突变体(Araki,N.等人,2002,Nucleic Acids Research,30:19,e103)。
“重组酶介导的盒式交换”或"RMCE”涉及一种用供体盒精确替换基因组目标盒的方法。通常为了进行此方法所提供的分子组合物包括1)5'和3’侧接对特定重组酶具有特异性的识别靶位点的基因组目标盒、2)侧接匹配的识别靶位点的供体盒和3)位点特异性重组酶。重组酶蛋白在本领域中是众所周知的(Turan,S.和Bode J.,2011,FASEB J.,25,第4088-4107页)并且能够精确裂解特定识别靶位点内的DNA(DNA的序列)而不增加或丢失核苷酸。常见重组酶/位点组合包括(但不限于)Cre/lox和Flp/frt。市售的试剂盒也提供含有R4-attP位点的载体和编码phiC31整合酶的载体,以用于RMCE。(也参见,例如美国公开申请No.US20130004946.)
"位点特异性整合"或"靶向插入"是指用于引导基因或核酸序列插入或整合到基因组中的特定位置,即,引导DNA到相连聚核苷酸链中两个核苷酸之间的特异性位点的基因靶向方法。位点特异性整合或靶向插入也可针对包括多个表达单元或盒的核定特酸,例如多个基因,各自具有其本身的调控元件(例如启动子、增强子和/或转录终止序列)。“插入”和“整合”可互换使用。应理解,基因或核酸序列(例如包含表达盒的核酸序列)的插入可能导致(或可能经工程化以使得)一个或多个核酸的替代或缺失,这取决于所采用的基因编辑技术。
"稳定整合"意指整合到宿主细胞基因组中的外源核酸在细胞培养物中维持整合持续一段时间,例如,至少7天、至少10天、至少15天、至少20天、至少25天、至少30天、至少35天、至少40天、至少45天、至少50天、至少55天、至少60天或更长。应当理解的是,大规模制造和纯化双特异性抗原结合蛋白是一项具有挑战性的任务。稳定性和克隆性对任何生物分子的再现性至关重要,尤其是治疗上使用的生物分子。通过本公开的方法所制备的表达双特异性抗体的稳定克隆提供了产生治疗性生物分子的相同且可再现的方式。
一般说明
本公开提供了通过在宿主细胞中采用多个(例如两个)表达增强性基因座来改善宿主细胞、尤其是中国仓鼠(灰仓鼠(Cricetulus griseus))中的多个多肽表达的组合物和方法。更具体地,本公开提供了被设计成以位点特异性方式使共同编码抗原结合蛋白的多个外源核酸整合到宿主细胞例如CHO细胞中的多个表达增强性基因座中的组合物和方法。具体地讲,本公开提供了含有整合到多个表达增强性基因座中的多个外源核酸的细胞,其中所述多个外源核酸共同编码抗原结合蛋白。本公开还提供被设计成将多个外源核酸位点特异性地整合到多个表达增强性基因座的核酸载体。本公开另外提供了系统,所述系统包括在多个表达增强性基因座中的每一者处含有多个重组酶识别位点(RRS)的宿主细胞,以及含有匹配的RRS和多个外源核酸的载体组,以供来自所述载体的多个外源核酸位点特异性地整合到多个表达增强性基因座中。另外,本公开提供了使用本文所公开的细胞、载体和系统制备抗原结合蛋白的方法。
具有位点特异性地整合到多个表达增强性基因座中的多个外源核酸的细胞
在一个方面,本公开提供了一种细胞,所述细胞含有位点特异性地整合在两个表达增强性基因座中的多个外源核酸,其中所述多个外源核酸共同编码抗原结合蛋白。所述抗原结合蛋白可为双特异性抗原结合蛋白或常规的(即单特异性)抗原结合蛋白。
本文提供的细胞能够产生具有高滴度和/或高比生产率(pg/细胞/日)的所需抗原结合蛋白。在一些实施方案中,细胞产生至少1g/L、1.5g/L、2.0g/L、2.5g/L、3.0g/L、3.5g/L、4.0g/L、4.5g/L、5.0g/L、10g/L或更大滴度的抗原结合蛋白。在一些实施方案中,产生抗原结合蛋白的细胞具有至少5、6、7、8、9、10、11、12、13、14、15皮克/细胞/日或更高的比生产率,所述比生产率是基于每日每个细胞产生的总抗原结合蛋白(以pg计)来测定。
包含共同编码抗原结合蛋白并整合在两个增强的表达基因座内的外源核酸的宿主细胞在生产培养物中表现出高细胞密度,例如,1至10×106个细胞/mL。在其他实施方案中,编码抗原结合蛋白的宿主细胞达到的最终细胞密度为至少5×106个细胞/mL、6×106个细胞/mL、7×106个细胞/mL、8×106个细胞/mL、9×106个细胞/mL或10×106个细胞/mL(在生产培养物中)。
在一些实施方案中,提供了一种细胞,其能够以双特异性抗原结合蛋白滴度相对于总抗原结合蛋白滴度为至少5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高的比率来产生双特异性抗原结合蛋白。在一些实施方案中,提供了一种细胞,其能够产生双特异性抗原结合蛋白,其中所述双特异性抗原结合蛋白滴度的比率为所述细胞所产生的总抗原结合蛋白滴度的至少50%。
在其他实施方案中,提供了一种细胞,其能够产生抗原结合蛋白,其中所述由两个基因座中的表达所产生的总抗原结合蛋白滴度相较于由一个基因座中的表达所产生的总抗原结合蛋白滴度为至少5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高。在某些实施方案中,提供了一种细胞,其能够产生抗原结合蛋白,其中所述由两个基因座中的表达所产生的总抗原结合蛋白滴度相较于由一个基因座中的表达所产生的总抗原结合蛋白滴度为至少0.5倍、0.75倍、1倍、1.5倍、1.75倍、2倍或更高。
在一些实施方案中,所述细胞含有第一外源核酸,其整合在第一表达增强的基因座内的特异性位点处;和第二外源核酸,其整合在第二表达增强的基因座内的特异性位点处;其中所述第一外源核酸和所述第二外源核酸共同编码抗原结合蛋白。第一外源核酸和第二外源核酸一起包括编码抗原结合蛋白的HCF或LCF(例如可变区)的多个核苷酸序列。例如,就单特异性抗体而言,对于单特异性抗原结合蛋白,可存在编码HCF(例如VH)的一个核苷酸序列和编码LCF(例如VL)的一个核苷酸序列、或每一者的多个拷贝(例如两个拷贝)。就双特异性抗体而言,可存在各自编码HCF(通常两个HCF彼此不同)的两个核苷酸序列、编码LCF的核苷酸序列的一个或两个拷贝、或编码两个不同LCF的两个核苷酸序列。取决于抗原结合蛋白是单特异性还是双特异性,编码HCF或LCF(例如可变区)的核苷酸序列可以不同变型或组合整合在两个表达增强的基因座中。例如,就单特异性抗原结合蛋白而言,在一个实例中,编码HCF的核苷酸序列和编码LCF的核苷酸序列可单独地整合在两个基因座中,一个核苷酸序列在每个基因座处;而在另一个实例中,编码HCF和LCF的核酸系整合在一个基因座处,并且编码相同HCF和相同LCF的单独核酸整合在另一基因座处。就双特异性抗原结合蛋白而言,在一个实例中,编码第一HCF和LCF的核苷酸序列可整合到第一基因座中,并且编码第二HCF的核苷酸序列整合到第二基因座中,其中所述两个HCF不同,所述LCF为双特异性抗原结合蛋白的共同LCF;而在另一个实例中,编码第一HCF和LCF的核苷酸序列整合到第一基因座中,并且编码第二HCF与相同LCF的核苷酸序列整合到第二基因座中。
在一些实施方案中,编码HCF或LCF的核苷酸序列可编码来自恒定区的氨基酸。例如,编码HCF或LCF的核苷酸序列可编码CL、CH1、CH2、CH3中的一个或多个、或CH1、CH2或CH3的组合、或可编码整个恒定区。在一些实施方案中,编码HCF的核苷酸序列编码CH3结构域。在特定实施方案中,编码HHCF的核苷酸序列编码重链。在一些实施方案中,编码LCF的核苷酸序列编码轻链。
在涉及两个HCF的实施方案中,编码第一HCF的核苷酸序列可编码来自第一恒定区的氨基酸,并且编码第二HCF的核苷酸序列可编码来自第二恒定区的氨基酸,其中来自所述两个恒定区的氨基酸可在至少一个位置相同或不同(例如产生不同的蛋白A结合特性的位置、或下文就各种双特异性抗原结合蛋白说明的其他位置)。与氨基酸的差异无关,编码来自两个恒定区的氨基酸的两个核苷酸序列可通过修饰一个核苷酸序列的一个或多个密码子来区分,这提供了在基于核酸的测定中区分所述两个核苷酸序列的便利基础。
在一些实施方案中,每个HCF-或LCF-编码核苷酸序列独立地并且可操作地连接至含有启动子的转录调控序列。所谓"独立地"是指每个编码序列可操作地连接至单独的转录调控序列,例如启动子,使得所述编码序列的转录处于单独的调控和控制之下。在一些实施方案中,引导所述两个含HCF多肽的转录的启动子相同。在一些实施方案中,引导所述两个含HCF多肽的转录的启动子,以及引导含VL多肽的转录的启动子均相同,例如CMV启动子。在一些实施方案中,每个HCF-或LCF-编码核苷酸序列独立地并且可操作地连接至诱导型或阻抑型启动子。诱导型和阻抑型启动子容许生产仅在生产期(加料分批培养)而不在生长期(种子培养)期间发生;或精确地以差异化方式控制在不同基因座中的抗体组分(HCF与LCF)的表达。每个基因产物的产生(表达)的精细控制可通过不同的启动子来实现。
在一个此类实例中,细胞首先被工程化以表达四环素阻遏蛋白(TetR),并且将每个HCF-和LCF-编码核苷酸序列置于活性受TetR调控的启动子的转录控制之下。两个串联的TetR操纵子(TetO)置于紧邻CMV启动子的下游。在一些实施方案中,每个HCF-和/或LCF-编码核苷酸序列独立地并且可操作地连接至至少一个TetR操纵子(TetO)或Arc操纵子(ArcO)上游的启动子。在其他实施方案中,每个HCF-和/或LCF-编码核苷酸序列独立地并且可操作地连接至CMV/TetO或CMV/ArcO杂合启动子。另外的合适的启动子在下文中描述。
在一些实施方案中,整合在两个基因座处的多个外源核酸侧接RRS。例如,第一RRS和第二RRS分别位于相对于整合在第一基因座处的第一外源核酸的5'和3',并且第三RRS和第四RRS分别位于相对于整合在第二基因座处的第二外源核酸的5'和3',其中所述第一RRS和所述第二RRS不同,并且第三RRS和第四RRS不同。在一些实施方案中,第一RRS、第二RRS、第三RRS和第四RRS彼此均不同。在其他实施方案中,第一RRS和第三RRS相同,并且第二RRS和第四RRS'相同,其中所述第一外源核酸编码HCF和LCF,并且所述第二外源核酸编码相同的HCF和LCF。
在一些实施方案中,当整合在基因座处的外源核酸包括两个HCF或LCF-编码核苷酸序列时,附加RRS可被包括在所述两个核苷酸序列之间。此类附加RRS应与侧接外源核酸的两个RRS不同。在一些实施方案中,附加RRS插入包括在整合的外源核酸中并位于两个HCF或LCF-编码核苷酸序列之间的可选标志基因的内含子中。在转录与转录后处理之后,所述内含子将被切除,从而生成编码所述可选标志物的mRNA。在整合在第一基因座处的外源核酸和整合在第二基因座处的外源核酸均包括两个HCF或LCF-编码序列(例如LCF-HCF1和LCF-HCF2)的实施方案中,附加RRS可被包括在每个基因座处的两个HCF或LCF-编码序列之间的第一外源核酸和第二外源核酸中的仅一者、或两者内。第一基因座的附加RRS可与第二基因座的附加RRS相同或不同。每个附加RRS应与侧接在整合在所述基因座处的外源核酸的两个RRS不同。每个附加RRS可任择地插入可选标志基因的内含子,并且在所述两个基因座中具有内含子的可选标志基因可不同。
在多个HCF或LCF-编码序列被包括在整合在基因座处的外源核酸的情况下,所述多个编码序列在所述基因座中的相对位置可变化。例如,在整合的外源核酸包括LCF-编码核苷酸序列和HCF-编码核苷酸序列的实施方案中,所述LCF-编码核苷酸序列可位于相对于所述HCF-编码核苷酸序列的上游或下游。在特定实施方案中,所述LCF-编码核苷酸序列位于相对于所述HCF-编码核苷酸序列的上游。在两个基因座包括LCF-编码核苷酸序列和HCF-编码核苷酸序列的情况下,在特定实施方案中,在两个基因座中,所述LCF-编码核苷酸序列均位于所述HCF-编码核苷酸序列的上游。
在另外的实施方案中,提供含有整合在第一表达增强的基因座内的第一对RRS和整合在第二表达增强的基因座内的第二对RRS的细胞,其中每对内的两个RRS不同。此类细胞可用于接收共同编码抗原结合蛋白的待被整合的多个外源核酸。
在一些实施方案中,第一外源核酸存在于第一基因座处的两个RRS之间,并且第二外源核酸存在于第二基因座处的两个RRS之间。第一外源核酸和第二外源核酸可各自编码一个或多个可选标志基因。可选标志基因可彼此不同。
在一些实施方案中,附加RRS存在于基因座处的所述对中的两个RRS(即5'RRS与3'RRS)之间,其中所述附加RRS与所述基因座处的5'RRS和3'RRS两者不同。在一些实施方案中,附加RRS存在于所述两个基因座之一处的5'RRS与3'RRS之间;在其他实施方案中,附加RRS存在于所述两个基因座中的每一个处的5'RRS与3'RRS之间。在附加RRS存在于5'RRS与3'RRS之间的情况下,可选标志基因可被包括在所述5'RRS和所述附加RRS之间,并且另一可选标志基因可被包括在所述附加RRS和所述3'RRS之间,并且所述两个可选标志物不同。
在所述许多实施方案中,所述细胞为CHO细胞,其中两个表达增强的基因座之一选自由下列各项所组成的组:与SEQ ID NO:1至少90%相同的核苷酸序列、与SEQ ID NO:2至少90%相同的核苷酸序列、以及与SEQ ID NO:3至少90%相同的核苷酸序列。
双特异性抗原结合蛋白
适于在本公开中所述的细胞、载体和系统中克隆和生产的双特异性抗原结合蛋白例如双特异性抗体并不限于双特异性抗原结合蛋白的任何特定形式。
在多个实施方案中,双特异性抗原结合蛋白包括各自含有抗原结合部分(例如HC)和CH3结构域的两个多肽,其中所述两个多肽的抗原结合部分具有不同抗原特异性,并且其中所述两个CH3结构域相对于彼此是异型二聚体,因为所述CH3结构域之一已在至少一个氨基酸位置处经过修饰,以生成所述两个多肽之间的区分性蛋白A结合特性。参见,例如美国专利8,586,713中所述的双特异性抗体。以此方式,可采用区分性蛋白A分离方案来容易地从异型二聚体中分离异型二聚体的双特异性抗原结合蛋白。
在一些实施方案中,双特异性抗原结合蛋白包括两条重链,所述两条重链具有不同抗原特异性并且差异在于CH3结构域中的至少一个氨基酸位置,以产生所述两条重链之间的区分性蛋白A结合特性。
在一些实施方案中,所述两个多肽含有人IgG的CH3结构域,其中所述两个多肽之一含有选自IgG1、IgG2和IgG4的人IgG的CH3结构域,所述两个多肽的另一个含有选自IgG1、IgG2和IgG4的人IgG的经修饰的CH3结构域,其中所述修饰减少或消除了经修饰的CH3区与蛋白A的结合。在特定实施方案中,所述两个多肽之一含有人IgG1的CH3结构域,所述两个多肽的另一个含有人IgG1的经修饰的CH3结构域,其中所述修饰选自由IMGT外显子编号系统中的(i)95R和(ii)95R和96F所组成的组。在其他特定实施方案中,经修饰的CH3结构域包含选自由IMGT外显子编号系统中的16E、18M、44S、52N、57M和82I所组成的组的一至五个附加修饰。
在其他各种实施方案中,所述两个多肽含有小鼠IgG的CH3结构域,其中所述两个多肽之一含有未修饰小鼠IgG的CH3结构域,并且所述两个多肽的另一个含有小鼠IgG的经修饰的CH3结构域,其中所述修饰减少或消除了经修饰的CH3区与蛋白A的结合。在多个实施方案中,小鼠IgG的CH3区经过修饰,以在特定位置处包含特定氨基酸(EU编号),其选自由下列各项组成的组:252T、254T、和256T;252T、254T、256T、和258K;247P、252T、254T、256T和258K;435R和436F;252T、254T、256T、435R和436F;252T、254T、256T、258K、435R和436F;24tP、252T、254T、256T、258K、435R和436F;以及435R。在特定实施方案中,进行特定的一组修饰,其选自由下列各项组成的组:M252T、S254T、S256T;M252T、S254T、S256T、I258K;I247P、M252T、S254T、S256T、I258K;H435R、H436F;M252T、S254T、S256T、H435R、H436F;M252T、S254T、S256T、I258K、H435R、H436F;I247P、M252T、S254T、S256T、I258K、H435R、H436F;以及H435R。
在多个实施方案中,双特异性抗原结合蛋白是小鼠和大鼠单克隆抗体或抗原结合蛋白的杂交体,例如小鼠IgG2a和大鼠IgG2b的杂交体。根据这些实施方案,双特异性抗体由两个抗体的异型二聚体构成,其包含各自通过Fc部分结合的一个重/轻链对。所需的异型二聚体可轻易地从两个亲本抗体同型二聚体和双特异性异型二聚体的混合物纯化,因为双特异性抗体和蛋白A的结合特性与亲代抗体和蛋白A的结合特性不同:大鼠IgG2b不会结合至蛋白A,而小鼠IgG2a会。因此,小鼠-大鼠异型二聚体结合至蛋白A,但以比小鼠IgG2a同型二聚体更高pH洗脱,并且这使得双特异性异型二聚体的选择性纯化成为可能。
在其他各式实施方案中,双特异性抗原结合蛋白具有本领域中称为"杵-进入-臼(knobs-into-holes)"的形式(参见,例如美国专利No.7,183,076)。在这些实施方案中,两个抗体的Fc部分被工程化,以产生一个突出的"杵",另一者为互补的"臼"。当在同一细胞中生产时,通过将工程化的"杵"与工程化的"臼"相连,据说重链优先形成异型二聚体,而非同型二聚体。
在另一个实施方案中,第一重链和第二重链包含在CH3结构域中的一个或多个氨基酸修饰,以实现两个重链之间的相互作用。CH3-CH3界面氨基酸残基可用带电荷的氨基酸置换,以提供不利静电的同型二聚体形成。(参见例如PCT公开号WO2009089004;和欧洲专利公开No.EP1870459。)
在其他实施方案中,第一重链包含同型IgA的CH3结构域,第二重链包含IgG的CH3结构域(或反之也然),以促进异型二聚体的优先形成。(参见例如.PCT公开号WO2007110205。)
在其他实施方案中,可通过工程化方法将各种形式并入免疫球蛋白链中,以促进异型二聚体的形成,例如Fab-臂交换(PCT公开号PCT公开号WO2008119353;PCT公开号WO2011131746)、卷曲螺旋结构域相互作用(PCT公开号WO2011034605)或亮氨酸拉链肽(Kostelny等人J.Immunol.1992,148(5):1547-1553)。
可用于生成双特异性抗原结合蛋白的免疫球蛋白重链片段(例如可变区)可使用本领域已知的任何方法生成。例如,第一重链包含由已用第一抗原免疫的第一动物的成熟B细胞的基因组所衍生的核酸编码的可变区,第一重链特异性识别第一抗原;并且第二重链包含由已用第二抗原免疫的第二动物的成熟B细胞的基因组所衍生的核酸编码的可变区,第二重链特异性识别第二抗原。免疫球蛋白重链可变区序列也可通过本领域已知的任何其他方法获得,例如通过噬菌体展示获得。在其他实例中,编码重链可变区的核酸包括这些在本领域已经描述或以其他方式可获得的抗体的核酸。在一些实施方案中,所述两个重链编码序列之一已经经过密码子修饰,以提供在基于核酸的测定中区分所述两个编码序列的便利基础。
包含识别两个不同表位(或两个不同抗原)的两条重链的双特异性抗体更易于分离,其中它们可与相同的轻链(即具有相同的可变和恒定结构域的轻链)配对。本领域已知多种方法用于生成可与两条不同特异性的重链配对的轻链,同时不干扰或实质上不干扰重链可变结构域与其靶抗原的选择性和/或亲和力,如描述于例如美国专利8,586,713和其中所述公开的技术。
所述双特异性抗原结合蛋白可具有多种双重抗原特异性和相关的有用应用。
在一些实例中,可制备包含针对肿瘤抗原和T细胞抗原的结合特异性的双特异性抗原结合蛋白,其靶向细胞上的抗原,例如CD20,也靶向T细胞上的抗原细胞,例如T细胞受体,例如CD3。以此方式,双特异性抗原结合蛋白靶向患者的目标细胞(例如,淋巴瘤患者的B细胞,经由CD20结合)以及患者的T细胞。在多个实施方案中,双特异性抗原结合蛋白被设计成在结合CD3时活化T细胞,从而将T细胞活化耦联至特定的选定肿瘤细胞。
就双特异性抗原结合蛋白而言,其中所述一个部分结合至T细胞受体,例如结合至CD3,并且另一部分结合至靶抗原,靶抗原可为肿瘤相关抗原。特定肿瘤相关抗原的非限制例子包括,例如例如AFP、ALK、BAGE蛋白、BIRC5(存活素)、BIRC7、β-连环蛋白、brc-abl、BRCA1、BCMA、BORIS、CA9、碳酸酐酶IX、半胱天冬酶-8、CALR、CCR5、CD19、CD20(MS4A1)、CD22、CD30、CD40、CDK4、CEA、CLEC-12、CTLA4、cyclin-B1、CYP1B1、EGFR、EGFRvIII、ErbB2/Her2、ErbB3、ErbB4、ETV6-AML、EpCAM、EphA2、Fra-1、FOLR1、GAGE蛋白(例如,GAGE-1、-2)、GD2、GD3、GloboH、磷脂酰肌醇蛋白聚糖-3、GM3、gp100、Her2、HLA/B-raf、HLA/k-ras、HLA/MAGE-A3、hTERT、LMP2、MAGE蛋白(例如,MAGE-1、-2、-3、-4、-6、and-12)、MART-1、间皮素、ML-IAP、Muc1、Muc2、Muc3、Muc4、Muc5、Muc16(CA-125)、MUM1、NA17、NY-BR1、NY-BR62、NY-BR85、NY-ESO1、OX40、p15、p53、PAP、PAX3、PAX5、PCTA-1、PLAC1、PRLR、PRAME、PSMA(FOLH1)、RAGE蛋白、Ras、RGS5、Rho、SART-1、SART-3、Steap-1、Steap-2、TAG-72、TGF-β、TMPRSS2、Thompson-nouvelle抗原(Tn)、TRP-1、TRP-2、酪氨酸酶、和尿路上皮分化特异糖蛋白-3。在一些实施方案中,双特异性抗原结合蛋白包含结合CD3的一个部分。例示的抗-CD3抗体部分描述于美国专利申请公开号US2014/0088295A1和US20150266966A1,以及在2017年3月30日公开的国际专利公开号WO2017/053856中,所有这些专利均以引用的方式并入本文)。在其他实施方案中,双特异性抗原结合蛋白包含结合至CD3的一个部分和结合至BCMA、CD19、CD20、CD28、CLEC-12、Her2、HLA蛋白、MAGE蛋白、Muc16、PSMA或Steap-2的一个部分。在其他实施方案中,双特异性抗原结合蛋白选自由下列各项组成的组:抗-CD3x抗-CD20双特异性抗体(如美国专利申请公开号US2014/0088295A1和US20150266966A1中所述,以引用方式并入本文),抗-CD3x抗粘蛋白16双特异性抗体(例如抗-CD3x抗-Muc16双特异性抗体)和抗-CD3x抗前列腺特异性膜抗原双特异性抗体(例如抗-CD3x抗-PSMA双特异性抗体)。
就双特异性抗原结合蛋白而言,其中所述一个部分结合至T细胞受体,例如结合至CD3,并且另一部分结合至靶抗原,靶抗原可为传染病相关抗原。传染病相关抗原的非限制例子包括,例如在病毒颗粒的表面上表达或优先在已感染病毒的细胞上表达的抗原,其中所述病毒选自由下列各项组成的组:HIV、肝炎(A、B或C)、疱疹病毒(例如HSV-1、HSV-2、CMV、HAV-6、VZV、EB病毒)、腺病毒、流感病毒、黄热病毒、埃可病毒、鼻病毒、柯萨奇病毒、冠状病毒、呼吸道融合病毒、腮腺炎病毒、轮状病毒、麻疹病毒、风疹病毒、细小病毒、牛痘病毒、HTLV、登革热病毒、乳头瘤病毒、软疣病毒、脊髓灰质炎病毒、狂犬病病毒、JC病毒和芳香病毒性脑炎病毒。或者,靶抗原可为在细菌表面上表达或优先在已感染细菌的细胞上表达的抗原,其中所述细菌选自由下列各项组成的组:衣原体、立克次体(rickettsia)、分枝杆菌、葡萄球菌、链球菌、肺炎球菌、脑膜炎球菌、淋球菌、克雷伯氏菌、变形杆菌、沙雷氏菌、假单胞菌、军团杆菌、白喉病菌、沙门氏菌、杆菌、霍乱杆菌、破伤风杆菌、肉毒杆菌、炭疽杆菌、鼠疫杆菌、钩端螺旋体和莱姆病菌。在某些实施方案中,靶抗原是在真菌表面上表达或优先在已感染真菌的细胞上表达的抗原,其中所述真菌选自由下列各项组成的组:念珠菌(白色念珠菌、克鲁斯氏(krusei,)念珠菌、光滑念珠菌、热带念珠菌等等)、新生隐球菌(Crytococcus neoformans)、曲霉(烟曲霉、黑曲霉等等)、毛霉菌目(毛霉属、犁头霉属、根霉属等等)、丝状芽孢杆菌(Sporothrix schenkii)、皮肤癣菌(Blastomycesdermatitidis)、巴西隐孢子菌(Paracoccidioides brasiliensis)、球孢子虫(Coccidioides immitis)和组织胞浆菌(Histoplasma capsulatum)。在某些实施方案中,靶抗原是在寄生虫的表面上表达或优先在已感染寄生虫的细胞上表达的抗原,其中所述寄生虫选自由下列各项组成的组:痢疾阿米巴原虫(Entamoeba histolytica)、大肠纤毛虫(Balantidium coli)、福氏耐格里变形虫(Naegleriafowleri)、棘阿米巴属(Acanthamoebasp.)、梨形鞭毛虫(Giardia lambia)、隐胞子虫属(Cryptosporidium sp.)、肺囊虫(Pneumocystis carinii)、间日疟原虫(Plasmodium vivax)、巴贝西虫(Babesiamicroti)、布氏锥虫(Trypanosoma brucei)、克氏锥虫(Trypanosoma cruzi)、杜氏利什曼原虫(Leishmania donovani)、弓形虫(Toxoplasma gondii)、巴西日圆线虫(Nippostrongylus brasiliensis)、肥头带绦虫(Taenia crassiceps)和马来丝虫(Brugiamalayi)。特异性病原体相关抗原的非限制例子包括例如HIV gp120、HIV CD4、乙型肝炎肝糖蛋白L、乙型肝炎糖蛋白M、乙型肝炎肝糖蛋白S、丙型肝炎E1、丙型肝炎E2、肝细胞特异性蛋白、单纯疱疹病毒gB、巨细胞病毒gB、和HTLV包膜蛋白。
也可制备包含两个结合部分的双特异性结合蛋白,这些结合部分各自指向同一细胞表面上的结合伴侣(即各自指向不同靶)。这种设计尤其适用于靶向在同一细胞表面上表达两种靶的特定细胞或细胞类型。尽管靶可能单独出现在其他细胞上,但是这些结合蛋白的结合部分被选择成使得每个结合部分以相对低的亲和力结合至其靶(例如,低的微摩尔或高的纳摩尔-例如超过一百纳摩尔KD,例如500、600、700、800纳摩尔)。以此方式,在两个靶在同一细胞上邻近的情况下,长期的靶结合是有利的。
可制备包含结合至相同靶的两个结合部分的双特异性结合蛋白,这些结合部分各自在同一靶的不同表位。这种设计尤其适用于将结合蛋白成功阻断靶的机率最大化。多个细胞外循环,例如跨膜通道或细胞表面受体可被同一双特异性结合分子靶向。
可制备包含两个结合部分的双特异性结合蛋白,这些结合部分簇集并激活免疫信号传导的负调控物,以产生免疫阻抑。当靶在同一细胞上时,可实现顺向阻抑;当靶在不同的细胞上时,可实现反向阻抑。顺向阻抑可用具有抗-IgGRIIb结合部分和抗-FelD1结合部分的双特异性结合蛋白来实现,使得IgGRIIb仅在FelD1的存在下簇集,以向下调控对FelD1的免疫反应。反向阻抑,例如可通过具有抗-BTLA结合部分和特异性结合目标组织特异性抗原的结合部分的双特异性结合蛋白来实现,使得抑制性BTLA分子的簇集仅发生在选定的靶组织中,这有可能解决自身免疫疾病。
可制备活化多组分受体的双特异性结合蛋白。在这种设计中,指向受体两个组分的两个结合部分结合、交联所述受体并活化所述受体的信号传导。这可例如使用具有结合IFNAR1的结合部分和结合IFNAR2的结合部分的双特异性结合蛋白来实现,其中所述结合使所述受体交联。此类双特异性结合蛋白可提供干扰素治疗的替代方案。
可制备跨越半渗透屏障,例如血脑屏障运送结合部分的双特异性结合蛋白。在这种设计中,一个结合部分结合能够运送特定选择性屏障的靶;另一个结合部分靶向具有治疗活性的分子,其中所述具有治疗活性的靶分子无法正常穿过屏障。这种双特异性结合蛋白可用于将治疗剂引入所述治疗剂不能到达的组织。一些例子包括靶向pIGR受体以将治疗剂运送到肠或肺中,或靶向转铁蛋白受体以跨越血脑屏障运送治疗剂。
可制备将结合部分运送到特定细胞或细胞类型的双特异性结合蛋白。在这种设计中,一个结合部分靶向容易内化到细胞中的细胞表面蛋白(例如受体)。另一个结合部分靶向细胞内蛋白,其中所述细胞内蛋白的结合产生治疗效果。
结合吞噬免疫细胞的表面受体和传染性病原体(例如酵母或细菌)的表面分子的双特异性结合蛋白将传染性病原体带往吞噬免疫细胞附近,从而促进病原体被吞噬。此类设计的例子是靶向CD64或CD89分子以及病原体的双特异性抗体。
双特异性结合蛋白具有作为一个结合部分的抗体可变区和作为第二结合部分的非Ig部分。抗体可变区实现了靶向,而非Ig部分是连接至Fc的效应子或毒素。以此方式,配体(例如效应子或毒素)被递送至由抗体可变区结合的靶。
双特异性结合蛋白具有各自结合至Ig区的两个部分(例如,含有CH2和CH3区的Ig序列),使得任何两个蛋白部分可相对于Fc邻近彼此。这种设计的例子包括圈套(trap),例如同-或异型二聚体圈套分子。
表达增强性基因座
适用于本发明的表达增强性基因座包括,例如,包含与SEQ ID NO:1具有实质同源性的核苷酸序列的基因座,如美国专利8,389,239所述(本文也称为"
Figure BDA0001834214000000281
基因座”或"基因座1")、包含与SEQ ID NO:2或SEQ ID NO:3具有实质同源性的核苷酸序列的基因座,如美国申请序列号14/919,300(本文也称为"YARS基因座"或"基因座2"),以及本领域中记载的其他表达增强性基因座和序列(例如US 20150167020A1和美国专利6,800,457)。
在一些实施方案中,用于本发明的两个表达增强的基因座选自由下列各项所组成的组:包含与SEQ ID NO:1具有实质同源性的核苷酸序列的基因座、包含与SEQ ID NO:2具有实质同源性的核苷酸序列的基因座、以及包含与SEQ ID NO:3具有实质同源性的核苷酸序列的基因座。这些基因座含有不仅提供可操作地连接至序列(即在所述序列内或紧邻所述序列)所整合的基因的增强表达的序列,相较于基因组中的其他序列,也表现出更高的重组效率和改善的整合稳定性。
已经从CHO细胞鉴定了SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3。发现其他哺乳动物物种(如人类或小鼠)对所鉴别的表达增强区具有有限的同源性,然而可以在来源于灰仓鼠的其他组织类型或其他同源物种的细胞系中发现同源序列,并且可以通过本领域中众所周知的技术分离出来。例如,有人可以通过交叉物种杂交或基于PCR的技术鉴别其他同源序列。此外,可通过本领域熟知的定位诱变或随机诱变技术来在SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3所示的核苷酸序列中进行改变。随后可测试所得序列变体的表达增强活性。具有表达增强活性、与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3在核酸同一性方面至少约90%相同的DNA可通过惯用的实验进行分离,并且预期表现出表达增强活性。
插入一个或多个外源核酸的整合位点、位点或核苷酸位置可在表达增强序列(例如SEQ ID NO:1、SEQ ID NO:2,SEQ ID NO:3)的任一者内或相邻的任何位置。在目标基因座中或相邻的特定染色体位置是否支持整合外源基因的稳定整合和有效转录可根据本领域熟知的标准程序来确定,例如如美国专利8,389,239和美国申请序列号14,919,300中所述。
本文所考虑的整合位点位于表达增强序列内、或紧邻所述序列,例如小于约1kb、500个碱基对(bp)、250bp、100bp、50bp、25bp、10bbp、或小于约5bp,其在相对于染色体DNA上的表达增强序列位置的上游(5')或下游(3')。在又一些其他实施例中,所采用的整合位点位在相对于染色体DNA上的表达增强序列位置的上游(5')或下游(3')的约1000、2500、5000或更多个碱基对处。
在本领域中应理解,为了高效复制和转录染色体DNA,采用大基因组区,如支架/基质附着区。支架/基质附着区(S/MAR),也称为支架附着区(SAR)或基质相关或基质附着区(MAR),是核基质附着的真核基因组DNA区。在不受任何一个理论束缚的情况下,S/MAR通常定位到非编码区,使给定转录区(例如染色质结构域)与其相邻者分开,并且还提供用于机器加工和/或结合实现转录的因子(如DNA酶或聚合酶的识别位点)的平台。一些S/MAR已表征为约14-20kb长(Klar等人,2005,Gene 364:79-89)。因此,整合在表达增强性基因座(例如在SEQ ID NO:1、或SEQ ID NO:2、或SEQ ID NO:3内或邻近)的基因被预期赋予增强的表达。在一些实施方案中,包含外源核酸序列的宿主细胞表现出高的比生产率,所述外源核酸序列编码整合在表达增强的基因座中的特异性位点处的双特异性抗原结合蛋白。在其他实施方案中,编码双特异性抗原结合蛋白的宿主细胞具有至少5、6、7、8、9、10、11、12、13、14、15、20、25、或30皮克/细胞/日(pcd)的比生产率。
在一些实施方案中,外源核酸整合在包含SEQ ID NO:1的核苷酸序列的基因座内的位点处。在特定实施方案中,所述整合位点在SEQ ID NO:1的核苷酸序列内或紧邻SEQ IDNO:1的核苷酸序列。在具体实施方案中,所述整合位点在SEQ ID NO:1内的位置,其选自跨越以下编号的位置的核苷酸:10-13,515;20-12,020;1,020-11,020;2,020-10,020;3,020-9,020;4,020-8,020;5,020-7,020;6,020-6,920;6,120-6,820;6,220-6,720;6,320-6,620;6,420-6,520;6,460-6,500;6,470-6,490;和6,475-6,485。在其他实施方案中,所述整合位点位于选自由下列各项组成的组的序列中:SEQ ID NO:1的核苷酸5,000-7,400、5,000-6,500、6,400-7,400;和SEQ ID NO:1的核苷酸6,400-6,500。在特定实施方案中,所述整合位点在SEQ ID NO:1的核苷酸6471至6473的"act"三联体之前、之后或内部。
在一些实施方案中,外源核酸整合在包含SEQ ID NO:2或SEQ ID NO:3的核苷酸序列的基因座内的位点处。在特定实施方案中,所述整合位点在SEQ ID NO:2的核苷酸序列内或紧邻SEQ ID NO:2的核苷酸序列。在具体实施方案中,所述整合位点在SEQ ID NO:3的核苷酸序列内或紧邻SEQ ID NO:3的核苷酸序列。在一些实施方案中,所述整合位点在SEQ IDNO:3的核苷酸1990-1991、1991-1992、1992-1993、1993-1994、1995-1996、1996-1997、1997-1998、1999-2000、2001-2002、2002-2003、2003-2004、2004-2005、2005-2006、2006-2007、2007-2008、2008-2009、2009-2010、2010-2011、2011-2012、2012-2013、2013-2014、2014-2015、2015-2016、2016-2017、2017-2018、2018-2019、2019-2020、2020-2021或2021-2022内。在特定实施方案中,所述整合在SEQ ID NO:3的核苷酸2001-2022处或在SEQ ID NO:3的核苷酸2001-2022内。在一些实施例中,外源核酸插入在SEQ ID NO:3的核苷酸2001-2002或核苷酸2021-2022处或所述核苷酸内,并且SEQ ID NO:3的核苷酸2002-2021由于插入而缺失。
位点特异性整合到表达增强性基因座中
将一个或多个外源核酸以位点特异性方式整合到表达增强性基因座中,即如本文所公开般整合到表达增强性基因座内的一个特异性位点可以若干种方式实现,包括,例如通过同源重组、和重组酶介导的盒式交换,如本领域所述(参见例如美国专利8,389,239和本文所述公开的技术)。
在一些实施方案中,提供了在表达增强性基因座内包含至少两个,即两个或更多个不同重组酶识别序列(RRS)的细胞,所述重组酶识别序列便于整合含有一个或多个目标外源核酸或基因的核酸序列。此类细胞可通过各种方式,包括同源重组,例如下文和本领域所述,例如美国专利8,389,239和其中所述公开的技术,将含有两个或更多个RRS的外源核酸序列引入所需的基因座而获得。
在特定实施方案中,提供了在表达增强性基因座中含有超过两个不同重组酶识别序列(RRS)的细胞,所述重组酶识别序列便于整合多个外源核酸。在具体实施方案中,提供了在表达增强性基因座内含有三个不同重组酶识别序列(RRS)的细胞,所述重组酶识别序列可介导两个单独外源核酸的整合,例如,其中所述基因组中的5'RRS和中间RRS匹配侧接待整合的第一外源核酸的5'RRS和3'RRS,并且基因组中的中间RRS和3'RRS匹配侧接待整合的第二外源核酸的5'RRS和3'RRS。
合适的RRS可选自包含下列各项的组:LoxP、Lox511、Lox5171、Lox2272、Lox2372、Loxm2、Lox-FAS、Lox71、Lox66及其突变体,其中所述位点特异性重组酶是Cre重组酶或其衍生物用于实现重组酶介导的盒式交换(RMCE)。在其他实例中,合适的RRS可选自包含下列各项的组:FRT、F3、F5、FRT突变体-10、FRT突变体+10及其突变体,在此情形下,位点特异性重组酶Flp重组酶或其衍生物用于实现RMCE。在另一个实例中,RRS可选自包含下列各项的组:attB、attP及其突变体,在此情况下,位点特异性重组酶phiC31整合酶或其衍生物用于实现RMCE。
在其他实施方案中,天然细胞通过同源重组技术修饰,以将含有一个或多个外源核酸的核酸序列整合到表达增强性基因座中的特异性位点中。
对于同源重组,同源聚核苷酸分子(即,同源臂)排列并交换它们的一段序列。如果转基因侧接同源基因组序列,那么可以在此交换期间引入转基因。在一个实例中,重组酶识别位点可经由同源重组引入宿主细胞基因组的整合位点处。在其他实例中,含有一个或多个目标外源核酸的核酸序列,例如各自编码HCF或LCF(例如可变区)的一个或多个核酸插入宿主基因组中,其中所述核酸序列侧接与靶基因座的序列同源的序列("同源臂")。
可以通过在染色体DNA中的整合位点处引入断裂来促进真核细胞中的同源重组。这可以通过将某些核酸酶靶向特定整合位点而实现。在目标基因座识别DNA序列的DNA结合蛋白是本领域中已知的。基因靶向载体也用于促进同源重组。
用以实现同源重组的基因靶向载体构建和核酸酶选择在本发明所属领域的技术人员的技术范围内。在一些实例中,具有模块化结构并含有单独锌指结构域的锌指核酸酶(ZFN)识别目标序列中的特定3-核苷酸序列(例如靶向整合的位点)。一些实施方案可利用具有靶向多个靶序列的单独锌指域的组合的ZFN。转录活化因子样(TAL)效应子核酸酶(TALEN)也可以用于位点特异性基因组编辑。TAL效应子蛋白DNA结合域通常与限制性核酸酶诸如FokI的非特异性裂解域组合使用。在一些实施方案中,将包含TAL效应子蛋白DNA结合域和限制性核酸酶裂解域的融合蛋白用于识别和裂解本发明基因座内的靶序列处的DNA(Boch J等人,2009Science 326:1509-1512)。RNA指导的核酸内切酶(RGEN)是从细菌适应性免疫机制开发的可编程的基因组工程化工具。在该系统(成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关性(Cas)免疫反应)中,蛋白Cas9当与两个RNA(其中一个引导靶选择)复合时形成序列特异性核酸内切酶。RGEN由组分(Cas9和tracrRNA)以及靶特异性CRISPRRNA(crRNA)组成。DNA靶裂解的效率以及裂解位点的位置均基于前间区序列邻近基序(PAM)的位置而变化,所述基序是针对靶识别的额外要求(Chen,H.等人,J.Biol.Chem.2014年3月14作为手稿M113.539726在线发表)。专门用于特异性靶向基因座(例如SEQ ID NO:1、SEQID NO:2、或SEQ ID NO:3)的序列可通过将这些序列中的许多序列与CHO基因组对齐来鉴定,其可以16-17个碱基对匹配来反映潜在的脱靶位点。
在一些实施方案中,携带目标核酸(例如,含有侧接一个或多个可选标志基因的一个或多个RRS的核酸、或含有一个或多个外源核酸的核酸,所述核酸各自编码HCF或LCF(例如可变区),侧接5'和3'同源臂)的靶向载体通过一个或多个附加载体或mRNA而引入细胞中。在一个实施方案中,所述一个或多个额外载体或mRNA含有编码位点特异性核酸酶的核苷酸序列,所述位点特异性核酸酶包括(但不限于)锌指核酸酶(ZFN)、ZFN二聚体、转录活化因子样效应子核酸酶(TALEN)、TAL效应子结构域融合蛋白和RNA指导的DNA核酸内切酶。在某些实施方案中,所述一个或多个载体或mRNA含有包括指导RNA、tracrRNA和编码Cas酶的核苷酸序列的第一载体,以及包含供体(外源)核苷酸序列的第二载体。此类供体序列含有编码目标基因的核苷酸序列,或识别序列,或包含旨在用于靶向插入的这些外源元件中的任一个的基因盒。在使用mRNA的情况下,mRNA可以借助于本领域的技术人员已知的常见转染方法转染到细胞中并且可以编码酶,例如转座酶或核酸内切酶。虽然引入到细胞中的mRNA可以是瞬时的并且未整合到基因组中,但是所述mRNA可以携载对于进行整合来说所必需或有益的外源性核酸。在一些情况下,如果仅需要短期表达来实现核酸的所需整合,那么选择mRNA是为了消除辅助性聚核苷酸副作用持久的任何风险。
用于位点特异性整合的载体
本文提供了用于经由位点特异性整合将外源核酸引入两个表达增强的基因座中的核酸载体。合适的载体包括:被设计成含有外源核酸序列的载体,所述外源核酸序列侧接RRS以经由RMCE进行整合;以及被设计成含有目标外源核酸序列的载体,所述目标外源核酸序列侧接同源臂以经由同源重组进行整合。
在多个实施方案中,提供了经由RMCE实现位点特异性整合的载体。在一些实施方案中,载体被设计成实现多个核酸同时整合到两个靶基因座中。与依序整合相比,同时整合允许高效且快速地分离所需克隆,这些克隆产生抗原结合蛋白、或其他目标多聚体蛋白,适用于大规模生产(制造)。
在一些实施方案中,提供了用于在细胞中表达双特异性抗原结合蛋白的载体组。
在一些实施方案中,载体组可包括两个"HCF载体",其各自含有侧接5'RRS与3'RRS的核酸,其中所述核酸包括编码HCF的核苷酸序列,并且其中所述两个HCF不同。所述两个HCF载体中的RRS彼此不同,并被设计成将HCF-编码核苷酸序列整合到两个表达增强性基因座。所述载体组还包括编码LCF的核苷酸序列,其可被包括在HCF载体之一中,或被包括在两个HCF载体中(由此提供相同LCF的两个拷贝),或者,在单独的"LCF载体"提供并侧接5'RRS与3'RRS。
在一些实施方案中,LCF-编码核苷酸序列被包括在HCF载体之一中并位于所述HCF载体上的5'RRS与3'RRS之间。所述LCF-编码序列可位于所述HCF-编码序列的上游或下游。
在一些实施方案中,所述LCF-编码核苷酸序列被包括在两个HCF载体并位于每个HCF载体上的5'RRS与3'RRS之间。类似地,所述LCF-编码序列可放置在每个载体中的HCF-编码序列的上游或下游。
在一些实施方案中,LCF-编码核苷酸序列在单独的载体-"LCF"载体中提供,并侧接5'RRS和3'RRS,其中两个RRS彼此不同。所述载体组的RRS可被设计成使得在与同样含有共同RRS的靶基因座的RMCE期间,LCF-编码序列可通过所述共同RRS而与所述HCF-编码序列之一"接合"。例如,LCF载体的3'RRS可与HCF载体之一的5'RRS相同,从而经由RMCE整合到靶基因座处之后产生LCF-HCF排列。在另一个实实例中,HCF载体的3'RRS可与LCF载体的5'RRS相同,从而经由RMCE整合到靶基因座处之后产生HCF-LCF排列。在一些实施方案中,所述共同RRS被设计成断裂可选标志物形式-也就是说,其被包括在一个载体中所包括的可选标志基因的5'部分的3'端,也被包括在另一载体中所包括的同一可选标志基因的其余3'部分的5'端,使得在"接合"并整合到靶基因座中时,适当地整合的核酸包括完整的可选标志基因以允许方便地鉴定转染子。在一些实施方案中,所述共同RRS被设计成断裂基因形式,即,被包括在此类断裂基因内的基因或内含子的5'部分的3'端,作为在一个载体中的所述基因的5'部分的一部分,并包括在此类断裂基因内的基因或内含子的其余部分的5'端,作为所述断裂基因的其余3'部分的一部分。在其他实施方案中,第一载体中的第三RRS或中间RRS被设计成介于其所操作地连接的启动子与可选标志基因之间(但在另一载体上,其被隔开);第一载体的第三RRS或中间RRS被设计成启动子的3';第二载体的第三RRS或中间RRS被设计成可选标志基因的5'。
在一些实施方案中,载体组可包括编码LCF的附加核苷酸序列。也就是说,载体组可包括两个HCF载体和两个LCF-编码核苷酸序列。所述两个LCF-编码序列可编码相同或不同的LCF。在一些实施方案中,所述两个LCF-编码序列可各自包括在HCF载体中,从而产生两种载体,其各自含有HCF-编码序列和LCF-编码序列。所述两种载体可被设计成具有适用于将所述两个载体序列靶向到两个基因座中的RRS。在其他实施方案中,所述两个LCF-编码序列之一被包括在HCF载体中并位于所述HCF载体上的5'RRS与3'RRS之间,并且另一个LCF-编码序列在单独的载体上提供-即,一个载体具有LCF和HC两者(呈LCF-HCF或HCF-LCF排列,或简称为"LCF/HCF载体"),一个HCF载体和一个LCF载体。在这些其他实施方案的一些中,载体RRS可被设计成允许HCF载体上的HCF-编码序列和LCF载体上的LCF-编码序列经由RMCE在靶基因座处接合。例如,LCF载体的3'RRS可与HCF载体的5'RRS相同,并且共同RRS可被设计成断裂可选标志物或断裂内含子形式,以促进转染子的选择与鉴定。在其他实施方案中,当所述两个LCF不同时,所述两个LCF-编码核苷酸序列可各自在单独的载体上提供-也就是说,所述载体组包括两个HCF载体和两个LCF载体。RRS可被设计成允许一个LCF-编码序列与一个HCF-编码序列在一个靶基因座处适当"接合",并且另一个LCF-编码序列与另一个HCF-编码序列在第二靶基因座处适当"接合"。图1、图3和图4说明不同载体形和与RRS/基因座组合,而非意味着限制。每个给定载体系统提供了在重组酶的存在下同时整合每个核苷酸序列的方式,以用于快速和方便地选择阳性整合体(所需克隆)。
编码HCF或LCF的核苷酸序列可编码来自恒定区的氨基酸或(多个)结构域,或编码整个恒定区。在特定实施方案中,编码HCF或LCF的核苷酸序列可编码一个或多个恒定结构域,例如CL、CH1、铰链、CH2、CH3或它们的组合。在某些实施方案中,编码HCF结构域的核苷酸序列可编码CH3结构域。例如,编码第一HCF的核苷酸序列可编码第一CH3结构域,并且编码第二HCF的核苷酸序列可编码第二CH3结构域。第一CH3结构域和第二CH3结构域可相同,或差异在于至少一个氨基酸。CH3结构域或恒定区中的差异可采用本文所述的双特异性抗原结合蛋白的任何形式,例如导致不同蛋白A结合特性、或导致"杵-进入-臼"形式的差异。与任何氨基酸序列差异无关,所述两个HCF-编码核苷酸序列的差异也可在于所述两个核苷酸序列之一已经经过密码子修饰。
在一些实施方案中,每个HCF或LCF-编码的核苷酸序列独立地并且可操作地连接至包括例如启动子的转录调控序列。在一些实施方案中,引导所述两个含HCF多肽的转录的启动子相同。在一些实施方案中,引导所述两个含HCF多肽的转录的启动子,以及引导含LCF之多肽转录的启动子均相同(例如CMV启动子,或本文所述的任何其他合适的启动子)。在一些实施方案中,每个HCF-或LCF-编码核苷酸序列独立地并且可操作地连接至诱导型或阻抑型启动子。诱导型或阻抑型启动子允许生产,例如,仅在生产期(加料分批培养)而不在生长期(种子培养)期间发生。诱导型或阻抑型启动子也允许一个或多个目标基因的差异化表达。在一些实施方案中,每个HCF-和/或LCF-编码核苷酸序列独立地并且可操作地连接至至少一个TetR操纵子(TetO)或Arc操纵子(ArcO)上游的启动子。在其他实施方案中,每个HCF-和/或LCF-编码核苷酸序列独立地并且可操作地连接至CMV/TetO或CMV/ArcO杂合启动子。杂合启动子(也称作调控融合蛋白)的例子可在2003年12月11日公开的国际专利公开号WO03101189A1中找到(以引用方式并入本文)。
在一些实施方案中,所述载体组包括编码识别一个或多个RRS的重组酶的核苷酸序列,所述核苷酸序列可包含在HCF或LCF-编码载体之一中或在单独的载体中提供。
在多个其他实施方案中,提供载体以经由同源重组实现位点特异性整合。
在一些实施方案中,提供了一种载体组,其包括两个载体,其各自含有外源核酸,所述外源核酸侧接5'同源臂和3'同源臂,以用于位点特异性地整合到细胞中的两个表达增强性基因座中,其中来自所述两个载体的外源核酸共同编码抗原结合蛋白。因此,一个载体中的同源臂被设计成用于整合到两个基因座之一中,另一载体中的同源臂被设计成用于整合到另一个基因座中。在这些实施方案中,抗原结合蛋白可为单特异性或双特异性。
选择与表达增强性基因座内的序列同源的序列并且包括选定的序列作为靶向载体中的同源臂完全在技术人员的技术范围内。在一些实施方案中,载体或构建体包含第一同源臂和第二同源臂,其中所述合并的第一同源臂和第二同源臂包含置换所述基因座内的内源性序列的靶向序列。在其他实施例中,第一同源臂和第二同源臂包含整合或插入在所述基因座内的内源性序列内的靶向序列。在一些实施方案中,所述同源臂含有与存在于SEQID NO:1、SEQ ID NO:2或SEQ ID NO:3中的核苷酸序列同源的核苷酸序列在特定实施方案中,所述载体含有:5'同源臂,其具有对应于SEQ ID NO:3的核苷酸1001-2001的核苷酸序列;和3'同源臂,其具有对应于SEQ ID NO:3的核苷酸2022-3022的核苷酸序列。同源臂,例如第一同源臂(也称为5'同源臂)和第二同源臂(也称为3’同源臂),与基因座内的靶向序列同源。5'到3’的同源臂可以扩增基因座内包含至少1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb的区或靶向序列。在其他实施例中,选择用于第一和第二同源臂的靶向序列的核苷酸总数包含至少1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb。在一些情况下,5'同源臂与3’同源臂(与靶向序列同源)之间的距离包含至少5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、或至少1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb。在SEQ ID NO:3的核苷酸1001-2001和2022-3022被选择作为5'和3'同源臂的情况下,所述两同源臂之间的距离可为20个核苷酸(对应于SEQID NO:3的核苷酸2002-2021);此类同源臂可介导外源核酸序列整合到包含SEQ ID NO:3的基因座中,例如在SEQ ID NO:3的核苷酸1990-2021或2002-2021内,并同时缺失SEQ ID NO:3的核苷酸2002-2021。
本文公开的用于以位点特异性地整合到表达增强性基因座中来引入外源核酸的载体可包括附加的基因和序列,以用于引导目标外源核酸和所编码多肽的表达,并且用于选择和鉴定目标外源核酸已成功整合进入的细胞。此类附加的序列包括,例如,转录和翻译调控序列、可选标志基因等等,下文也会说明。
调控序列
本文所公开的用于将外源核酸以位点特异性方式引入表达增强性基因座中的载体,和由于位点特异性整合而获得的细胞,可包括用于引导目标外源核酸和经编码的多肽的表达的调控序列。调控元件包括转录启动子、增强子、编码合适的mRNA核糖体结合位点的序列以及控制转录和翻译终止的序列。转录和翻译的控制序列可通过病毒来源提供。例如,常用的启动子和增强子源自多瘤病毒、腺病毒2、类人猿病毒40(SV40)、小鼠或人类巨细胞病毒(CMV)、CMV立即早期(CMV-IE)或CMV主要IE(CMV-MIE)启动子,以及RSV、SV40晚期启动子、SL3-3、MMTV、泛素(Ubi)、泛素C(UbC)、和HIV LTR启动子。病毒基因组启动子、控制和/或信号序列可用于驱动表达,所提供的这类控制序列与所选择的宿主细胞相容。还可以使用非病毒细胞启动子(例如β-球蛋白和EF-1α启动子),取决于其中将表达目标蛋白的细胞类型。来源于SV40病毒基因组的DNA序列,例如SV40起点、早期和晚期启动子、增强子、剪接和聚腺苷酸化位点可用于提供对外源DNA序列的表达有用的其他基因元件。早期和晚期启动子是特别有用的,因为二者可容易地从SV40病毒作为还包含SV40病毒复制起点的片段得到(Fiers等人,Nature 273:113,1978)。也可使用较小或较大的SV40片段。通常,包括从位于SV40复制起点中的Hind III位点向BglI位点延伸的大约250bp序列。可使用诱导型(例如,通过化合物、辅因子、调控蛋白诱导)和/或阻抑型(例如,通过化学化合物、辅因子、调控蛋白阻抑)启动子,并且尤其可用于允许产生抗原结合蛋白仅在生产期(加料分批培养)而不在生长期(种子培养)期间发生,或者精确地以差异化方式控制不同基因座中的抗体组分的表达。诱导型启动子的例子包括醇脱氢酶I基因启动子、四环素响应启动子系统、糖皮质激素受体启动子、雌激素受体启动子、蜕皮激素受体启动子、基于金属硫蛋白的启动子和基于T7-聚合酶的启动子。阻抑型启动子的例子包括杂合启动子(也称为调控融合蛋白),其包含可操作地连接至至少一个TetR操纵子(TetO)或Arc操纵子(ArcO)的CMV或其他启动子,并且在2003年12月11日公开的国际专利公开号WO03101189A1中有描述(以引用方式并入本文)。先前已经说明了适用于通过双顺反子载体表达多个转录体的序列(Kim S.K.和Wold B.J.,Cell 42:129,1985),并可用于本发明。用于以多顺反子表达蛋白的合适的策略的例子包括使用2A肽(Szymczak等人,Expert Opin Biol Ther 5:627–638(2005))和使用内核糖体进入位点("IRES"),两者都是本领域熟知的。其他类型的表达载体也将是有用的,例如,这些描述于美国专利No.4,634,665(Axel等人)和美国专利No.4,656,134(Ringold等人)。
可选标志物
本文所公开的用于将外源核酸以位点特异性方式引入表达增强性基因座中的载体,和由于位点特异性整合而获得的细胞,可包括一个或多个可选标志基因。
在一些实施方案中,可选标志基因赋予抗药性,例如描述于Kaufman,R.J.(1988)Meth.Enzymology185:537的表1中的那些,并且包括DHFR-MTX抗性、P-糖蛋白和多重抗药性(MDR)-各种亲脂性细胞毒性剂(例如阿霉素(adriamycin)、秋水仙碱、长春新碱)、和腺苷脱氨酶(ADA)-Xyl-A或腺苷和2'-脱氧柯福霉素(2'-deoxycoformycin)。其他显性可选标志物包括来源于微生物的抗生素抗性基因,例如新霉素、卡那霉素或潮霉素抗性。哺乳动物宿主存在数种合适的选择系统(Sambrook同上,第16.9-16.15页)。也已描述采用两个显性可选标志物的共转染方案(Okayama and Berg,Mol.Cell Biol 5:1136,1985)。
在其他实施方案中,可选标志基因编码提供或能够生成用于识别已经或尚未成功插入和/或置换的基因盒的可检测信号的多肽,视情况而定。合适的例子包括荧光标志物或蛋白、催化生成可检测信号的化学反应的酶等等。荧光标记的实例是本领域中众所周知的,包括(但不限于)Discosoma珊瑚(DsRed)、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、蓝绿色荧光蛋白(CFP)、增强型蓝绿色荧光蛋白(eCFP)、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)和远红外荧光蛋白(例如mKate、mKate2、mPlum、mRaspberry或E2-crimson。还参见例如Nagai,T.等人,2002Nature Biotechnology20:87-90;Heim,R.等人1995年2月23日Nature 373:663-664;和Strack,R.L.等人2009Biochemistry 48:8279-81。
用于制备抗原结合蛋白的系统
在又一个方面,本公开提供了系统,所述系统包括细胞(例如CHO细胞)和一个或多个载体的组合并可用于制备将外源核酸整合在两个表达增强性基因座内的细胞,所述外源核酸共同编码作为单特异性蛋白或双特异性蛋白的抗原结合蛋白。例如,所述系统可以试剂盒的形式提供。
在一些实施方案中,系统被设计成允许高效的载体构建和经由RMCE将多个外源核酸同时整合到两个表达增强的基因座内的特异性位点。同时整合允许快速分离所需的克隆,并且使用两个表达增强的基因座对于产生适用于生产蛋白的稳定细胞系(例如商业化的细胞系)也是重要的。
本文提供的系统包括细胞和载体组。所述细胞含有一对RRS(5'RRS与3'RRS),其整合在两个表达增强的基因座的每一个内。在一些实施方案中,外源核酸存在于每个基因座的5'RRS与3'RRS之间,并可包括例如一个或多个可选标志基因。所述载体组包括至少两个载体,每个载体含有侧接编码HCF或LCF的核苷酸序列的一对RRS(5'RRS与3'RRS),并且所述两个载体之一上的核苷酸序列编码HCF(HCF载体),所述两个载体之另一者上的核苷酸序列编码LCF(LCF载体),其中所述HCF和所述LCF是抗原结合蛋白的区。每对RRS内的5'RRS和3'RRS是不同的,并且所述系统中的RRS被设计成使得将载体引入细胞时,载体中的HCF或LCF-编码核苷酸序列通过RRS所介导的RMCE而整合到所述两个表达增强的基因座中,以表达抗原结合蛋白。取决于抗原结合蛋白,载体数量、HCF或LCF-编码序列的放置、以及RRS之间的关联性可以不同方式设计。
在一些实施方案中,所述系统被设计成用于整合到两个表达增强性基因座中并表达单特异性抗原结合蛋白。在一些实施方案中,在所述两个载体(即HCF载体和LCF载体)之一上的5'RRS和3'RRS分别与所述两个基因座之一的5'RRS和3'RRS相同,在另一载体上的5'RRS和3'RRS分别与另一个基因座的5'RRS和3'RRS相同,从而将HCF和LCF核酸基本上上单独地靶向到所述两个基因座,其中一个核酸到每个基因座。在其他实施方案中,在单独载体上的HCF编码序列和LCF编码序列被设计成联合地整合到所述两个基因座中的每一者中。根据这些实施方案,第一基因座中的5'RRS和3'RRS分别与第二基因座中的5'RRS和3'RRS相同;每个基因座也含有介于5'和3'RRS("中间RRS")之间的附加RRS。此外,前两个载体上的5'RRS与第一因座和第二基因座中的5'RRS相同,所述第一载体中的3'RRS与第二载体中的5'RRS相同并与第一因座和第二基因座中的中间RRS相同,并且第二载体中的3'RRS与两个基因座中的3'RRS相同。所述载体可被设计成具有断裂启动子和选择标志物形式(启动子在一个载体上,并且启动子可操作地连接的选择标志物在另一载体上)。所述载体可被设计成具有断裂可选标志物形式、或断裂内含子形式,如上所述,以促进以适当的整合选择转染子。另外,所述系统可被设计成允许LCF-编码序列和HCF-编码序列在整合后在不同的相对位置。在一些实施方案中,所述系统被设计成具有整合在HCF-编码序列上游的LCF-编码序列。在其他实施方案中,所述系统被设计成具有整合在HCF-编码序列上游的LCF-编码序列。
在一些实施方案中,所述系统被设计成用于整合到两个表达增强性基因座中并表达双特异性抗原结合蛋白。
在一些实施方案中,除了HCF载体(编码第一HCF)和LCF载体(编码第一LCF)以外,所述系统也包括编码第二HCF的核苷酸序列,所述第二HCF与第一HCF不同。编码第二HCF的核苷酸序列可被包括,例如,在LCF载体中、或在单独的载体,即第二HCF载体中。在一些实施方案中,第二HCF-编码序列被包括在所述LCF载体中、介于所述LCF载体上的5'RRS与3'RRS之间,在所述情况中,所述系统包括HCF载体和LCF/HCF载体。所述系统-尤其是RRS-可被设计成将所述HCF-编码序列整合到所述两个基因座之一中,并且将编码HCF和LCF两者的序列整合到另一基因座中。在其他实施方案中,编码第二HCF的核苷酸序列在单独的载体上、侧接5'RRS和3'RRS,在所述情况中,所述系统包括两个HCF载体和一个LCF载体。在这些其他实施方案中,所述系统中的RRS可被设计成使得所述LCF-编码序列可经由RMCE通过也存在于所述两个基因座之一中、在所述基因座的5'RRS与3'RRS之间的共同RRS而与所述HCF-编码序列之一"接合",并且另一个HCF-编码序列将整合到所述两个基因座中的另一个中。例如,LCF载体的3'RRS可与HCF载体之一的5'RRS相同并且也与所述两个基因座之一上的中间RRS相同-这种设计将产生在整合到所述基因座中之后具有中间RRS的LCF-HCF排列。在另一个实例中,HCF载体的3'RRS可与LCF载体的5'RRS相同并且与所述两个基因座之一上的中间RRS相同,从而产生在整合到所述基因座中之后具有中间RRS的HCF-LCF排列。在一些实施方案中,所述共同RRS被设计成断裂可选标志物形式或断裂内含子形式,如上文所述。
在一些实施方案中,所述系统也包括编码第二LCF的核苷酸序列,除了HCF载体(编码第一HCF)和LCF载体(编码第一LCF)以外,以及编码第二HCF的核苷酸序列,所述第二HCF与第一HCF不同。也就是说,所述系统包括四个单独的编码序列,两个编码HCF且两个编码LCF。所述两个LCF可相同或不同。所述四个编码序列可以不同设计放置在载体中。在一些实施方案中,所述四个序列放置在两个载体中:LCF/HCF、和LCF/HCF,其中LCF在任一载体中在HCF的上游或下游。所述系统(RRS)可被设计成使得一个载体序列整合到一个基因座中,并且另一载体序列整合到另一个基因座中。在一些实施方案中,所述四个序列放置在三个载体中:LCF、HCF和LCF/HCF(其中LCF在HCF的上游或下游)。所述系统中的RRS可被设计成使得所述LCF/HCF载体的序列整合到一个基因座中,在LCF载体中的LCF编码序列和在HCF载体中的HCF编码序列通过利用LCF载体、HCF载体和此另一个基因座共用的共同RRS而整合到另一个基因座中。类似地,所述共同RRS可被设计成断裂标志物或断裂内含子形式。在一些实施方案中,所述四个序列放置在四个载体中:LCF、HCF、LCF和HCF。所述系统中的RRS可被设计成使得在所述LCF载体之一中的LCF编码序列和在所述HCF载体之一中的HCF编码序列通过利用共同RRS而联合地整合到个基因座中,并且在所述LCF载体的另一个中的LCF编码序列和在所述HCF载体的另一个中的HCF编码序列通过利用共同RRS而联合地整合到一个基因座中。
在本文提供的系统的多个实施方案中,编码HCF或LCF的核苷酸序列可编码氨基酸,例如来自恒定区的氨基酸或(多个)结构域,或编码整个恒定区。在特定实施方案中,编码HCF或LCF的核苷酸序列可编码一个或多个恒定结构域,例如CL、CH1、CH2、CH3或它们的组合。在某些实施方案中,编码HCF结构域的核苷酸序列可编码CH3结构域。例如,编码第一HCF的核苷酸序列可编码第一CH3结构域,并且编码第二HCF的核苷酸序列可编码第二CH3结构域。第一CH3结构域和第二CH3结构域可相同,或差异在于至少一个氨基酸。CH3结构域或恒定区中的差异可采用本文所述的双特异性抗原结合蛋白的任何形式,例如导致不同蛋白A结合特性、或导致"杵-进入-臼"形式的差异。与任何氨基酸序列差异无关,所述两个HCF-编码核苷酸序列的差异也可在于所述两个核苷酸序列之一已经经过密码子修饰。
在本文提供的系统的多个实施方案中,每个HCF或LCF-编码的核苷酸序列独立地并且可操作地连接至包括例如启动子的转录调控序列。在一些实施方案中,引导所述两个含HCF多肽的转录的启动子相同。在一些实施方案中,引导所述两个含HCF多肽的转录的启动子,以及引导含LCF之多肽转录的启动子均相同(例如CMV启动子、诱导型启动子、阻抑型启动子、或本文所述的任何其他合适的启动子)。
在一些实施方案中,本系统还包括编码识别一个或多个RRS的重组酶的核苷酸序列,所述核苷酸序列可被包括在可变区-编码载体之一中或在单独的载体中提供。
本文公开的系统被设计成允许高效构建载体并快速分离所需的克隆,并且使用两个表达增强的基因座对于产生稳定的细胞系也是重要的。在一些实施方案中,系统被设计成利用负向选择来鉴定具有预期的位点特异性整合的转化体(例如在RMCE之后去除宿主基因组中的一个或多个荧光标志基因而导致荧光缺乏)。一轮的负向选择可能仅需两周;然而,分离带有预期重组的克隆的效率可能是有限的(约1%)。如果负向选择结合基于(多个)整合核酸所提供的新选择标志物的正向选择(例如新颖荧光标志物、或对药物或抗生素的抗性、断裂形式,例如),则分离带有预期重组的克隆的效率可得到显著改善(至约40%至高达约80%)。所述系统可包括附加的组分、试剂或信息,例如,通过转染将系统中的(多个)载体引入系统中的细胞的方案。非限制性转染方法包括基于化学的转染方法,包括使用脂质体;纳米颗粒;磷酸钙(Graham等人(1973).Virology 52(2):456-67,Bacchetti等人(1977)Proc Natl Acad Sci USA 74(4):1590-4和Kriegler,M(1991).Transfer andExpression:A Laboratory Manual.New York:W.H.Freeman and Company.第96-97页);树枝状聚合物;或阳离子聚合物,如DEAE-葡聚糖或聚乙烯亚胺。非化学法包括电穿孔;声穿孔;和光学转染。基于粒子的转染包括使用基因枪、磁体辅助转染(Bertram,J.(2006)Current Pharmaceutical Biotechnology 7,277-28)。还可以使用病毒方法进行转染。mRNA递送包括使用TransMessengerTM
Figure BDA0001834214000000431
的方法(Bire等人BMC Biotechnology2013,13:75)。将异源DNA引入到细胞中的一种常用方法是磷酸钙沉淀,如Wigler等人(Proc.Natl.Acad.Sci.USA 77:3567,1980)所述。聚乙烯诱导的细菌原生质体与哺乳动物细胞的融合(Schaffner等人,(1980)Proc.Natl.Acad.Sci.USA 77:2163)是另一种适用于引入异源DNA的方法。还可以使用电穿孔将DNA直接引入到宿主细胞的细胞质中,如Potter等人(Proc.Natl.Acad.Sci.USA 81:7161,1988)或Shigekawa等人(BioTechniques 6:742,1988)所述。已描述适用于将异源DNA引入到哺乳动物细胞中的其他试剂,如LipofectinTM试剂和LipofectamineTM试剂(Gibco BRL,Gaithersburg,Md.)。这两种可商购的试剂均用于形成脂质-核酸复合物(或脂质体),当应用于培养的细胞时,有利于核酸摄入细胞中。
用于制备抗原结合蛋白的方法
本公开还提供了制备双特异性抗原结合蛋白的方法。通过利用本文公开的方法,所需的抗原结合蛋白可以高滴度和/或高比生产率(pg/细胞/日)产生。在一些实施方案中,抗原结合蛋白以至少1g/L、1.5g/L、2.0g/L、2.5g/L、3.0g/L、3.5g/L、4.0g/L、4.5g/L、5.0g/L、10g/L或更大的滴度产生。在一些实施方案中,抗原结合蛋白以至少5、6、7、8、9、10、11、12、13、14、15皮克/细胞/日(pcd)或更高的比生产率产生,所述比生产率是基于每日每个细胞产生的总抗原结合蛋白(以pg计)来测定。在一些实施方案中,双特异性抗原结合蛋白以双特异性抗原结合蛋白滴度相对于总抗原结合蛋白滴度的比率为至少5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高来产生。
在一个实施方案中,所述方法利用本文公开的系统并通过转染将系统中的载体引入系统中的细胞。可筛选并鉴定经转染的细胞,其中外源核酸已通过RMCE适当地整合到所述细胞的两个表达增强性基因座中。在一些实施方案中,经转染的细胞的鉴定通过针对转染之前存在于宿主细胞中的一个或多个选择标志物的负向选择来实现。在其他实施方案中,经转染的细胞的鉴定通过针对转染之前存在于宿主细胞中的一个或多个选择标志物的负向选择,结合基于载体中被设计成待整合的核酸所提供的一个或多个选择标志物的正向选择来实现。含HCF的多肽和含LCF的多肽可从所述整合的核酸表达,并且目标抗原结合蛋白可从鉴定的经转染的细胞获得,并使用已知的方法进行纯化。
在另一个实施方案中,所述方法简单地利用上述细胞,所述细胞含有共同编码抗原结合蛋白的整合于两个表达增强的基因座处的外源核酸,并从所述细胞表达所述抗原结合蛋白。每个克隆的(多个)表达盒在每个特异性整合位点内是连续的。
通过以下实施例进一步说明本说明书,所述实施例不应解释为以任何方式具有限制性。所有引用文献(包括贯穿本申请所引用的参考文献、发布的专利和公布的专利申请)的内容特此以引用的方式明确并入。
实施例
实施例1:在两个特异性表达增强性基因座中表达单特异性抗体(Abs)(经由位点特异性整合)
将Ab链(AbC1、AbC2)克隆到载体中,其中所述RSS位点侧接Ab表达盒和用于可选标志物的表达盒,如图1所描绘。两条Ab链可克隆到单独载体中或合并至一个载体中,其中2个表达盒以任可能的顺序串联排列:AbC1、AbC2和可选标志物,例如,AbC1等同于常规的LC并且AbC2等同于常规的重链。
简言之,编码VH和VL结构域的DNA可通过PCR从单一抗原阳性B细胞直接分离。将重链和轻链PCR产物分别克隆到含有IgG重链恒定区和κ轻链恒定区的Sap I线性化抗体载体中。重链质粒(AbC2)具有侧接重链表达盒的RRS3和RRS2位点。此外,在重链质粒中,紧邻RRS3下游有断裂选择标志物基因(例如US7582298)。轻链质粒具有侧接轻链表达盒的RRS1和RRS3位点。此外,轻链质粒具有紧邻RRS3处的ATG之前的强启动子,使得在整合到宿主细胞基因座中时,来自轻链质粒的RRS3-近端启动子与起始ATG即被带至邻近于适当阅读框中的重链质粒的选择标志物基因,以允许所选择基因的转录和翻译。具有重链可变区序列的纯化重组质粒和具有来自相同B细胞的轻链可变区序列的质粒随后被合并且与表达重组酶的质粒共同转染到经修饰的CHO宿主细胞系中,所述细胞系在SEQ ID NO:1(EESYR?;基因座1)和SEQ ID NO:2基因座处具有适当的RSS和选择标志物。所述经修饰的CHO宿主细胞在两个转录活性基因座处含有4个不同的选择标志物。因此,当选择标志物是不同的荧光标志物时,CHO细胞生产可通过流式细胞术分离代表所需细胞重组的正向-负向组合。当表达重链和轻链基因的重组质粒与表达重组酶的质粒共同转染时,由所述重组酶介导的位点特异性重组导致抗体质粒整合在含有RRS的每个染色体基因座处并置换。因此,将表达单特异性抗体的重组细胞分离,并经受12天的加料分批生产、之后收获并使用固定化蛋白A进行Octet滴度测定。观察到所述细胞是等基因型的和稳定的。当利用双位点整合方法时,观察到小摇瓶中的单特异性抗体表达的整体滴度增加,其中抗体B导致显著增加,接近使滴度翻倍(图2)。
实施例2:在两个特异性表达增强性基因座中表达双特异性抗体(BsAb)(经由位点特异性整合)
就双特异性抗体的表达而言,将三条抗体链和两个可选标志物克隆到类似于实施例1的质粒中,使得AbC1、AbC2、和可选标志物1侧接与第一基因座兼容的RRS位点、或整合位点(
Figure BDA0001834214000000453
SEQ ID NO:1;基因座1),并且AbC1、AbC3、可选标志物2与第二基因座或整合位点(SEQ ID NO:2)相容。在我们的观察中,作为常规LC的AbC1并不需要两个基因拷贝来充分表达。对于每个位点,制备了1个或2个质粒,其中所述3个表达盒串联排列或排列到2个质粒中,其中所述2个表达盒被克隆到一个载体中,其余表达盒被克隆到第二载体中。参见图3。
当表达重链和轻链基因的重组质粒与表达重组酶的质粒共同转染时,由所述重组酶介导的位点特异性重组导致抗体质粒整合在含有RRS的每个染色体基因座处并置换。因此,将表达双特异性抗体的重组细胞分离,并经受12天的加料分批生产,之后收获并使用固定的抗-Fc和第二抗Fc*(经修饰的Fc检测抗体,参见US 2014-0134719A1,公开于2014年5月15日)进行Octet滴度测定。观察到细胞是等基因型的和稳定的。利用双位点整合方法,观察到小摇瓶中的整体滴度从1.75显著增加至超过2倍(图5)。
实施例3:在特异性整合后大规模生产双特异性和单特异性抗体
宿主细胞(CHO-K1)如上文类似于实施例1所述产生(也参见图3的双特异性抗体和图1的单特异性抗体)。将能够将基因盒RMCE到
Figure BDA0001834214000000451
基因座(基因座1)和SEQ ID NO:2(基因座2)中的宿主细胞与能够将基因盒RMCE到仅一个整合位点(基因座1/
Figure BDA0001834214000000452
)的宿主细胞进行比较。将携带抗体轻链和重链(AbC1、AbC2、AbC3)和必需RRS和选择标志核酸(参见图3)的载体重组到生产细胞系(RSX2BP)中,以产生表达Ab E、Ab F、Ab G、和Ab H的宿主细胞。因此,每个双特异性抗体宿主细胞表达一个共同轻链,以及结合不同抗原的两个重链,其中所述一个重链在其CH3结构域被工程化,以差异化地结合蛋白A(如美国专利No.8,586,713所述,以引用方式并入本文)。
就单特异性抗体而言,将抗体轻链和重链(AbC1、AbC2)克隆到载体中,其中所述RSS位点侧接Ab表达盒(表达盒也提供可选标志基因),如图1所描绘。进行重组,以产生表达Ab J和Ab K的宿主细胞(RSX2)。
2L、15L、或50L生物反应器被接种来源于CHO-K1的抗体生产细胞系RSX2的种子培养物。使接种的细胞在36.5℃下生长13天,并根据需要饲喂葡萄糖和其他补充营养物。使细胞生长在化学成分确定(无水解产物且无血清)的基质培养基中。将全部抗体收获并将其纯化。
总IgG抗体(滴度)在蛋白A/蛋白G层析之后测定。就双特异性抗体而言,总IgG抗体以及包括双特异性(杂二聚体Fc/Fc*)、带有野生型重链的同型二聚体(Fc/Fc)和带有经修饰重链的同型二聚体(Fc*/Fc*)的三种抗体物质中的每一者被测量,以测定所需双特异性抗体物质的比率。总滴度通过使用美国专利No.8,586,713所述的洗脱技术,利用蛋白A/蛋白G柱的HPLC方法测定。简言之,所述三个生物反应器物质在样品加载期间结合至柱,在离子性改性剂的存在下,采用pH阶梯式梯度,蛋白A柱最先洗脱出双特异性物质(Fc/Fc*)。双特异性物质在第一洗脱步骤期间收集,接着洗脱出两个同型二聚体物质。
表1显示,通过利用经由两个整合位点表达抗体的宿主细胞,在先导大规模生产培养中的整体(总)IgG滴度和双特异性抗体滴度(图6A)得到高度改善。
表1:总IgG和双特异性IgG滴度测量
Figure BDA0001834214000000461
双特异性滴度如上文所述进行测定。如表2中所见,由细胞产生的双特异性抗体的滴度与总IgG滴度的比率在具有两个整合位点构建的宿主细胞的生产培养物中显著更高。参见图6B。事实上,不可预期的是,一致地实现了50%或更高的双特异性比率。
表2:每次总IgG生产的双特异性抗体的比率
Figure BDA0001834214000000471
单特异性抗体使用双整合位点方法表达,以测定整体IgG滴度的改善。表3说明观察到大生物反应器规模的总滴度从0.6倍显著增加到1.3倍。也参见图7。对于用于制造的生产生物反应器来说,尤其是培养体积为500L至高达10,000L的生物反应器,通过使用这些改善的细胞系所观察到的滴度增加等同于每批次产物产量的显著增加。
表3:总IgG(单特异性)滴度测量
Figure BDA0001834214000000472
尽管已经通过图示和实施例对前述发明进行了详细说明,但对于本领域的技术人员显而易见的是,可在不脱离所附权利要求中定义的本发明精神或范围的情况下对其进行各种改动和修改。
Figure BDA0001834214000000481
Figure BDA0001834214000000491
Figure BDA0001834214000000501
Figure BDA0001834214000000511
Figure BDA0001834214000000521
Figure BDA0001834214000000531
Figure BDA0001834214000000541
Figure BDA0001834214000000551
Figure BDA0001834214000000561
Figure BDA0001834214000000571
Figure BDA0001834214000000581
Figure BDA0001834214000000591
Figure BDA0001834214000000601
Figure BDA0001834214000000611
Figure BDA0001834214000000621
Figure BDA0001834214000000631
Figure BDA0001834214000000641
Figure BDA0001834214000000651
序列表
<110> 瑞泽恩制药公司
<120> 基于使用表达增强性基因座来制备抗体的组合物和方法
<130> 33444PCT (10341WO01)
<150> 62/325,400
<151> 2016-04-20
<160> 3
<170> PatentIn 3.5版
<210> 1
<211> 13515
<212> DNA
<213> 中国仓鼠
<400> 1
tctagaaaca aaaccaaaaa tattaagtca ggcttggctt caggtgctgg ggtggagtgc 60
tgacaaaaat acacaaattc ctggctttct aaggcttttt cggggattca ggtattgggt 120
gatggtagaa taaaaatctg aaacataggt gatgtatctg ccatactgca tgggtgtgta 180
tgtgtgtgta tgtgtgtctg tgtgtgtgcc cagacagaaa taccatgaag gaaaaaaaca 240
cttcaaagac aggagagaag agtgacctgg gaaggactcc ccaatgagat gagaactgag 300
cacatgccag aggaggtgag gactgaacca ttcaacacaa gtggtgaata gtcctgcaga 360
cacagagagg gccagaagca ctcagaactc cagggggtca ggagtggttc tctggaggct 420
tctgcccttg gaggttcctg aggaggaggc ttccatattg aaaatgtagt tagtggccgt 480
ttccattagt acagtgacta gagagagctg agggaccact ggactgaggc ctagatgctc 540
agtcagatgg ccatgaaagc ctagacaagc acttccgggt ggaaaggaaa cagcaggtgt 600
gaggggtcag gggcaagtta gtgggagagg tcttccagat gaagtagcag gaacggagac 660
gcactggatg gccccacttg tcaaccagca aaagcttgga tcttgttcta agaggccagg 720
gacatgacaa gggtgatctc ggtttttaaa aggctttgtg ttacctaatc acttctatta 780
gtcagatact ttgtaacaca aatgagtact tggcctgtat tttagaaact tctgggatcc 840
tgaaaaaaca caatgacatt ctggctgcaa cacctggaga ctcccagcca ggccctggac 900
ccgggtccat tcatgcaaat actcagggac agattcttca ctaggtactg atgagctgtc 960
ttggatgcaa atgtggcctc ttcattttac tacaagtcac catgagtcag gaggtgctgt 1020
ttgcacagtg tgactaagtg atggagtgtt gactgcagcc attcccggcc ccagcttgtg 1080
agagagatcc ttttaaattg aaagtaagct caaagttacc acgaagccac acatgtataa 1140
actgtgtgaa taatctgtgc acatacacaa accatgtgaa taatctgtgt acatgtataa 1200
actgtgtgaa taatctgtgt gcagcctttc cttacctact accttccagt gatcaggttt 1260
ggactgcctg tgtgctactg gaccctgaat gtccccaccg ctgtcccctg tcttttacga 1320
ttctgacatt tttaataaat tcagcggctt cccctctgct ctgtgcctag ctataccttg 1380
gtactctgca ttttggtttc tgtgacattt ctctgtgact ctgctacatt ctcagatgac 1440
atgtgacaca gaaggtgttc cctctggaga catgtgatgt ccctgtcatt agtggaatca 1500
gatgccccca aactgttgtc cagtgtttgg gaaagtgaca cgtgaaggag gatcaggaaa 1560
agaggggtgg aaatcaagat gtgtctgagt atctcatgtc cctgagtggt ccaggctgct 1620
gacttcactc ccccaagtga gggaggccat ggtgagtaca cacacctcac acatactata 1680
tccaacacac acacacacac acacacacac acgcacgcac gcacgcacgc acgcacacat 1740
gcacacacac gaactacatt tcacaaacca catacgcata ttacacccca aacgtatcac 1800
ctatacatac cacacataca cacccctcca cacatcacac acataccaca cccacacaca 1860
gcacacacat acataggcac acattcacac accacacata tacatttgtg tatgcataca 1920
tgcatacaca cacaggcaca cagacaccac acacatgcat tgtgtacgca cacatgcata 1980
cacacacata ggcacacatt gagcacacac atacatttgt gtacgcacac tacatagaca 2040
tatatgcatt tgtatatgca cacatgcatg cacacataca taggcacaca tagagcacac 2100
acatacattt gtgtatgcac acatgcacac accaatcaca tgggaagact caggttcttc 2160
actaaggttc acatgaactt agcagttcct ggttatctcg tgaaacttgg aagattgctg 2220
tggagaagag gaagcgttgg cttgagccct ggcagcaatt aaccccgccc agaagaagta 2280
ggtttaaaaa tgagagggtc tcaatgtgga acccgcaggg cgccagttca gagaagagac 2340
ctacccaagc caactgagag caaaggcaga gggatgaacc tgggatgtag tttgaacctc 2400
tgtaccagct gggcttcatg ctattttgtt atatctttat taaatattct tttagtttta 2460
tgtgcgtgaa taccttgctt gcataaatgt atgggcactg tatgtgttct tggtgccggt 2520
ggaggccagg agagggcatg gatcctccgg agctggcgtt tgagacagtt gtgacccaca 2580
gtgtggggtc tgggaactgg gtcttagtgt tccgcaagtg cagctggggc tcttaacctc 2640
tgagccatcc ctccagcttc aagaaactta ttttcttagg acatggggga agggatccag 2700
ggctttaggc ttgtttgttc agcaaatact cttttcgtgt attttgaatt ttattttatt 2760
ttactttttt gggatagaat cacattctgc agctcaggct gggcctgaac tcatcaaaat 2820
cctcctgtct cagtctacca ggtgataaga ttactgatgt gagcctggct ttgacaagca 2880
ctttagagtc cccagccctt ctggacactt gttccaagta taatatatat atatatatat 2940
atatatatat atatatatat atatattgtg tgtgtgtgtt tgtgtgtgta tgagacactt 3000
gctctaaggg tatcatatat atccttgatt tgcttttaat ttatttttta attaaaaatg 3060
attagctaca tgtcacctgt atgcgtctgt atcatctata tatccttcct tccttctctc 3120
tctttctctc ttcttcttct cacccccaag catctatttt caaatccttg tgccgaggag 3180
atgccaagag tctcgttggg ggagatggtg agggggcgat acaggggaag agcaggagga 3240
aagggggaca gactggtgtg ggtctttgga gagctcagga gaatagcagc gatcttccct 3300
gtccctggtg tcacctctta cagccaacac cattttgtgg cctggcagaa gagttgtcaa 3360
gctggtcgca ggtctgccac acaaccccaa tctggcccca agaaaaggca cctgtgtgtg 3420
actctggggt taaaggcgct gcctggtcgt ctccagctgg acttgaaact cccgtttaat 3480
aaagagttct gcaaaataat acccgcagag tcacagtgcc aggttcccgt gctttcctga 3540
agcgccaggc acgggttccc taggaaatgg ggccttgctt gccaagctcc cacggcttgc 3600
cctgcaaacg gcctgaatga tctggcactc tgcgttgcca ctgggatgaa atggaaaaaa 3660
gaaaaagaag aagtgtctct ggaagcgggc gcgctcacac aaacccgcaa cgattgtgta 3720
aacactctcc attgagaatc tggagtgcgg ttgccctcta ctggggagct gaagacagct 3780
agtgggggcg gggggaggac cgtgctagca tccttccacg gtgctcgctg gctgtggtgc 3840
atgccgggaa ccgaaacgcg gaactaaagt caagtcttgc tttggtggaa ctgacaatca 3900
acgaaatcac ttcgattgtt ttcctctttt tactggaatt cttggatttg atagatgggg 3960
gaggatcaga gggggagggg aggggcgggg agacggaggg aggaggggag gaggggagga 4020
ggggaggagg ggaggagggg aagggatgga ggaaaatact aacttttcta attcaacatg 4080
acaaagattc ggagaaagtg caccgctagt gaccgggagg aggaatgccc tattgggcat 4140
tatattccct gtcgtctaat ggaatcaaac tcttggttcc agcaccaagg attctgagcc 4200
tatcctattc aagacagtaa ctacagccca cacggaagag gctatacaac tgaagaaata 4260
aaattttcac tttatttcat ttctgtgact gcatgttcac atgtagagag ccacctgtgt 4320
ctaggggctg atgtgctggg cagtagagtt ctgagcccgt taactggaac aacccagaac 4380
tcccaccaca gttagagctt gctgagagag ggaggccctt ggtgagattt ctttgtgtat 4440
ttatttagag acagggtctc atactgtagt ccaagctagc ctccagctca cagaaattct 4500
cctgttccgg tttccaaagt actggagtta tgagtgtgtg ttaattgaac gctaagaatt 4560
tgctgattga agaaaacctc aagtgggttt ggctaatccc cacgacccca gaggctgagg 4620
caggaggaat gagagaattc aaggtttgcc agagccacag ggtgagctca atgtggagac 4680
tgtgagggtg agctcaatgt ggagactgtg agggtgagct caatgtggag actgtgaggg 4740
tgagctcaat gtggagactg tgagggtgag ctcaatgtgg agactgtgag ggtgagctca 4800
atgtggagac ctgtatcaag ataataatag tagtagtaac aatgcaggcg agggtgtggt 4860
tgagtggtag agcagttagt tgatttgaca tgcttgaggt ctcccggtcc atctgtggcc 4920
ctgcaacagg aagggaggga ggaagggggg gaacgagaga gaggaaagag agacagaagc 4980
taagataggg aatgagagag gaaggaagaa acgggaagaa attcagactc cttcctgagt 5040
tccgccaacg cctagtgaca tcctgtgcac accctaaggt ggcctttgtg tggcactggc 5100
ttgggtggtc gggaaaggca ttttcagctt gttgcagaac tgccacagta gcatgctggg 5160
tccgtgaaag tttctgcccg ttaacaagaa gtctctacta cttgtgacct caccagtgaa 5220
aatttcttta attgtctcct ggtgttctgg gttttgcatt tttgtttcta aggatacatt 5280
cctgggtgat gtcatgaagt ccccaaagac acagtggggc tgtgttggat tgggaaagat 5340
gatttatctg gggtgtcaaa aggaaaagaa gggaaacagg cacttgggaa aatgtcctcc 5400
cgcccacccg aattttggct tggcaaccgt ggtggaggag caagaaacac gtggacgttt 5460
gaggaggcat ggggtcctag gaggacagga agcagaagga gagagctggg ctgacagcct 5520
gcaggcattg cacagtttca gaaggagatt acagcatgac tgagttttta gggatccaac 5580
agggacctgg gtagagattc tgtgggctct gaggcaactt gacctcagcc agatggtatt 5640
tgaataacct gctcttagag ggaaaacaga catagcaaac agagccacgt ttagtgatga 5700
aactctcact ttgcctgagt catgtgcggc catgcccagg ggtcaggctg acactcaact 5760
caaaaacaag tgagaaattg aagacaatcc gtggtggcag ctactggaag ggccaccaca 5820
tccccagaaa gagtggagct gctaaaaagc catttgtgat aggcacagtt atcttgaatg 5880
catggagcag agattacgga aaaatcgaga atgttaatga ggcaacattc gagttgagtc 5940
attcagtgtg ggaaacccag acgcttccat cccctaaaag gaacatcttg ctctcagtca 6000
aaatggaaat aaaaattggg gcttgaattt ggcaaatgat tcagaactct gtgtaggtat 6060
tttcacacgc acagtggata attttcatgt tggagtttat ttgtgctaaa aggcagaaaa 6120
gggtaaaaag cacatcttaa gagttatgag gttctacgaa taaaaataat gttacttaca 6180
gctattcctt aattagtacc cccttccacc tgtggtaatt tcctgagata gtcagtgggg 6240
aaaagatctc tccttctctt ctttctcccc ctcccctcct ctccctccct ccctccctcc 6300
ctccctcctc tccctccctc cccctttcct tctttctttg ctccttctcc tctgcctcct 6360
tctccctttc ttcttcattt attctaagta gcttttaaca gcacaccaat tacctgtgta 6420
taacgggaaa acacaggctc aagcagctta gagaagattg atctgtgttc actagcgtgc 6480
aattcagagg tgggtgaaga taaaaggcaa acatttgagg ccatttcctt atttggcacg 6540
gcacttagga agtggaacat gcctaatcta ctggtttgta ccacctttcc ctataatgga 6600
ctgtttggga agctcctggg caaccgattc tggcatctca ttggtcagag gcctgttaaa 6660
tggtactctt atttgcaaag aaggctgtaa cttgtagctt taaaagcctc tcctcaagaa 6720
agaagggaga aaggatatgg ctagacatat ctaatagact taaccactgt gaaaagcctt 6780
agtatgaatc agatagaacc tatttttaac tcagttttga aaaaaataat ctttatattt 6840
atttgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gaaccacatg 6900
tagcaggtgc tggaggaggc cagaagaggg caccagatct cctggaactg acaccacaca 6960
tggttatgag ctgcctgatg tgggtgctgg gaactgaact ctcgtgttct gcaagagcag 7020
caactgttct cttaactgat gagccatctc tccagccccc cccataattt taattgttca 7080
ttttagtaaa ttttattcat aatcaattat cacagtataa aacaatgatt ttatatatat 7140
catatacata tcaaggatga cagtgagggg gatatgtgtg tgtgtgtgtg tgtgtgtgtg 7200
tgtgtgtgtg tgtgttattt gtgtgtgtgc tttttaagaa ggtgccatag tcactgcatt 7260
tctctgaagg atttcaaagg aatgagacat gtctgtctgc caggaaccct atcttcctct 7320
ttgggaatct gacccaaatg aggtattctg aggaactgaa tgaagagctc aagtagcagt 7380
gtcttaaacc caaatgtgct gtctagagaa agtcaacgtc atcagtgagc tgaggagaga 7440
tttactgagc ggaagacaag cgctctttga tttaagtggc tcgaacagtc acggctgtgg 7500
agtggagcct gtgctcaggt ctgaggcagt ctttgctagc cagctgtgat gagcagtgaa 7560
gaaagggtgg agatggaggc agggtgggag cagggctatg gttcagacta ggtatcgtga 7620
gcacaccagc tggttgactt gtggtctgtg ggtcaggcgt tgtaaacgcc ctcagggtca 7680
ggcagtcaca ttgcttgaag ctgaatgggt gaggcaacac agagagtgca aagaaggcaa 7740
agtaccacct cttccccgac ccaggtcact tctgggttat agctgagact ccggacagca 7800
tgcaaccagc tggttagagc ttcagggaaa acttgatgtc tgcatgttgc tatgaaatgt 7860
gattcggtac atctggagaa aatttataat gctggctcag tcaagcactg aacaaaggta 7920
ccttggcttt gggagctaca tgacattgac ttgtaggcag actttttttt ttctgcccgc 7980
caattcccag ataaccaata tggaggctca atattaatta taaatgctcg gctgatagct 8040
caggcttgtt actagctaac tcttccaact taaatgaacc catttctatt atctacattc 8100
tgccacgtga ctttaccttg tacttcctgt ttcctctcct tgtctgactc tgcccttctg 8160
cttcccagag tccttagtct ggttctcctg cctaacctta tcctgcccag ctgctgacca 8220
agcatttata attaatatta agtctcccag tgagactctc atccagggag gacttgggtg 8280
ctcccccctc ctcattgcca tccgtgtctt cctcttccct cgcttccccc tcctcttcct 8340
gctcttcctc ctccacccct cctttcatag tattgatggc aagggtgttc tagaatggag 8400
gagtgcccat aggcatgcaa agaaaccagt taggatgctc tgtgaggggt tgtaatcata 8460
agcgatggac acaattcaag ccacagagtg aagacggaag gatgcactgt gctctagagc 8520
aacttctggg gcagaatcac agggtgagtt tctgacttga gggcgaagag gccacgagga 8580
agggagtgag tttgtctgag ctagaagcta cggcccacct cttggtagca gacctgccca 8640
caagcatgct ttgttaatca tgtgggatct gattttcctc taaatctatg ttcaactctt 8700
aagaaaatgt gaattctcac attaaaattt agatatacgt cttttggtgg ggggggtgta 8760
aaaaatcctc aagaatatgg atttctgggg gccggagaga tggctcagag gttaagagaa 8820
ctggttgctc ttctagacat tctgagttca attcccagca accacatggt ggctcacaac 8880
catctgtaat gcgacctggt gccatcttct gacatgcatg gatacatgca ggcagaaagc 8940
tgtatacata gtaaattgat aaatcttttt ttaaaaagag tatggattct gccgggtgtt 9000
ggtggcgcac gcctttaatc ccagcactct ggaggcagag gcaggtggat ctctgtgagt 9060
tcgagaccag cctggtctat aagagctagt tccaggacag cctccaaagc cacagagaaa 9120
ccctgtctcg aaaaaccaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga gtatggattc 9180
taagaaagcc gtaacagctg gagctgtgta cggagttcag cgtggtacta gaagaacaga 9240
cattcatgat gaaacacccc aggattttta cttagtatct agtttccatt gttgttttga 9300
gaccggctct tatgctctcc aggctggcct caaactgctg atcttcccgc ctctacctct 9360
caagtcctgg gactacttgg ctcataaaac agtttttgtc gggctccctg aagttatggt 9420
tgtacaaacc gtgggggtca atatactcac ttgggcagag agagaaggtc tgaatcccag 9480
acaatgactg catctcagga cagttgggaa gaggacaatg gcagaaggac ttagaaaaga 9540
tagactggag ggtggaaaag cagcaggaac agagaaacaa aacaggaagc ttgctatcca 9600
gggccactct ggagtcctgt ggcaagatgg aagcgggcta ggggaataca tttgtgctac 9660
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgat caatgcctat caatgttgaa 9720
ggggaaatat gtataccaca ttgattctgg gagcaattct cagtatctgg cctagagaaa 9780
ggaatggccc ctgcagaata gacagagtga atggtgccct ttatcatttg ctaaagtgaa 9840
ggagaaataa acatccttcc atagagtttc aggtaaatga accccacagt tcatctgtgc 9900
cgtggtggag gcctggccaa cagttaaaaa gattagacac ggacaaagtc tgaaggaaac 9960
acctcgaata ggaagaggag agccacctca ttctgtaact ttcctcaagg ggaagatgtt 10020
ccaagagtgg gaataaatgg tcaaaggggg gatttttaat taggaaaacg atttcctgta 10080
tcacttgtga aactggaggt tgatttgggg cataggacaa tagatttgat gctttgcaaa 10140
aagctgtttc aaagcagaga aatggaatag agacaattat gtagcgagga gggagggtgg 10200
ggcgaagatg gagacagaga agtggaagct gactttaggg aagaggaaca tagaccacag 10260
gggcggggcg gggggcaggg gcggggggcg gggctcaaag gaggcagtgg gaacgttgct 10320
agtgttcgca gcgtaagcgt gaatgtgcaa gcgtctttgt ggtgtgtgac caggagtagc 10380
gtggctggct tgtgtgctgc ttgtaatccc agtctttgag gtttccacac tgttccacag 10440
tgggtgtgat tttccctcgg agagcatgag ggctctgctt tccccacatc ctccccagcg 10500
ttcgttggta tttgtttcca agatgttagt gggtgagaca aagcctctct gttgatttgc 10560
ctttaacagg tgacaaaaaa agctcaacca ggagacattt ttgccttctt ggaaggtaat 10620
gctcccatgt agagcaatgg gacccatctc taaggtgagg ctactcttgc agtttgcacc 10680
cagctcttct gatgcaggaa ggaagttggt gggcaagcaa gactgtttgc ttcttgcgat 10740
ggacacattc tgcacacaaa ggctcaggag gggagaaggc tgtttgatgt ttagcactca 10800
ggaaggcccc tgatgcatct gtgattagct gtctccatct gtggagcaga cacggactaa 10860
ctaaaaacca gtgtttttaa attgtcaagc ctttaaggtg aggaaattga cttattgtgc 10920
tgggccatac gtagagcaag tgctctgcat tgggccaacc cccggctctg gtttctaggc 10980
accagaatgg cctagaacta actcacaatc ctcccattcc aggtctcagg tgctagaatg 11040
aaccactata ccagcctgcc tgcctgccta cctgccttcc taaattttaa atcatgggga 11100
gtaggggaga atacacttat cttagttagg gtttctattg ctgtgaagag acaccatgag 11160
catggcaact cttataaagg aaaacattta gttgggtggc agtttcagag gttttagtac 11220
attgtcatca tggctgggaa catgatggca tgcagacaga catggtgctg gagaaaggga 11280
tgagagtcct acatcttgca ggcaacagga cctcagctga gacactggct ggtaccctga 11340
gcataggaaa cctcacagcc caccctcaca gtgacatatt tccttcaaca aagccatacc 11400
tcctaatagt gccactccct atgagatgac agggccaatt acattcaaac tgctataaca 11460
ctttaaagta ttttattttt attattgtaa attatgtatg tagctgggtg gtggcagccg 11520
aggtgcacgc ctttaatccc agcacttggg aggcagaggc agatggatct ctgtgagttc 11580
aagaccagcc tggtctataa gagctagttg caaggaagga tatacaaaga acagttctag 11640
gatagccttc aaagccacag agaagtgctg tcttgaaaac caaaaattgt gctgggacct 11700
gtctctgctt tggttgcttc ccactccccc agagctggac tcttggtcaa cactgaatca 11760
gctgcaaaat aaactcctgg attcctctct tgtaacagga gcccgaagtc aggcgcccac 11820
ttgtcttctc gcaggattgc catagacttt ttctgtgtgc ccaccattcc agactgaagt 11880
agagatggca gtggcagaga ctgggaaggc tgcaacgaaa acaggaagtt attgcaccct 11940
gggaatagtc tggaaatgaa gcttcaaaac ttgcttcatg ttcagttgta cacagactca 12000
ctcccaggtt gactcacacg tgtaaatatt cctgactatg tctgcactgc ttttatctga 12060
tgcttccttc ccaaaatgcc aagtgtacaa ggtgagggaa tcacccttgg attcagagcc 12120
cagggtcgtc ctccttaacc tggacttgtc tttctccggc agcctctgac acccctcccc 12180
ccattttctc tatcagaagg tctgagcaga gttggggcac gctcatgtcc tgatacactc 12240
cttgtcttcc tgaagatcta acttctgacc cagaaagatg gctaaggtgg tgaagtgttt 12300
gacatgaaga cttggtctta agaactggag caggggaaaa aagtcggatg tggcagcatg 12360
tacccgaaat cccagaactg gggaggtaga gacggatgag tgcccggggc tagctggctg 12420
ctcagccagc ctagctgaat tgccaaattc caactcctat tgaaaaacct ttaccaaaca 12480
aacaaacaaa caaataataa caacaacaac aacaacaaac taccccatac aaggtgggcg 12540
gctcttggct cttgaggaat gactcaccca aacccaaagc ttgccacagc tgttctctgg 12600
cctaaatggg gtgggggtgg ggcagagaca gagacagaga gagacatgac ttcctgggct 12660
gggctgtgtg ctctaggcca ccaggaactt tcctgtcttg ctctctgtct ggcacagcca 12720
gagcaccagc acccagcagg tgcacacacc tccctccgtg cttcttgagc aaacacaggt 12780
gccttggtct gtctattgaa ccggagtaag ttcttgcaga tgtatgcatg gaaacaacat 12840
tgtcctggtt ttatttctac tgttgtgata aaaaccgggg aactccagga agcagctgag 12900
gcagaggcaa atgcaaggaa tgctgcctcc tagcttgctc cccatggctt gccgggcctg 12960
ctttctgcaa gcccttctct ccccattggc atgcctgaca tgaacagcgt ttgaaatgct 13020
ctcaaatgtc actttcaaag aaggcttctc tgatcttgct aactaaatca gaccatgttt 13080
caccgtgcat tatctttctg ctgtctgtct gtctgtctgt ctgtctatct gtctatcatc 13140
tatcaatcat ctatctatct atcttctatt tatctaccta tcattcaatc atctatcttc 13200
taactagtta tcatttattt atttgtttac ttactttttt tatttgagac agtatttctc 13260
tgagtgacag ccttggctgt cctggaaccc attctgtaac caggctgtcc tcaaactcac 13320
agagatccaa ctgcctctgc ctctctggtg ctggggttaa agacgtgcac caccaacgcc 13380
ccgctctatc atctatttat gtacttatta ttcagtcatt atctatcctc taactatcca 13440
tcatctgtct atccatcatc tatctatcta tctatctatc tatctatcta tctatcatcc 13500
atctataatc aattg 13515
<210> 2
<211> 14931
<212> DNA
<213> 中国仓鼠
<220>
<221> misc_feature
<222> (2716)..(2239)
<223> n为a、c、g、t或核苷酸缺失
<400> 2
catgtacact tatgcaagta tgatatggcc caacacagta ttttacacca atttttatct 60
ataaaatata catgtacatc aaaatatatt attaataata acatcattat tctttctttc 120
caagtaataa acacatacac tgaaattttg gttcttgtgg ataattttaa tgaaacagga 180
aatgcaaatt tatcttagca tgtttacttc actttctttg catagataac cagtaatcac 240
attgatggat catgtagtga aatgtatttt taggtatcta aggaattttg gcttcgtttt 300
gtgcttgttg acactgaatt ctattcctaa caacagtgtg taaggattct gtctgatttc 360
ttttaccagt atttgtccat ttgcattttc tttattattc atggctgctg ttctagaaag 420
tggaaggtag tgtgtcaagt ctgtttaaca tgtttccctg atgatcagtg tcttaacacc 480
tctctgagta catgttggcc aatgtcgttt ctagacccat ctattcttgc ttgacttatc 540
ctggtacatg cctgccaaga aatttctcct catcctttct gtctcttcac tgatttactt 600
gatgtgtgga tttcacattg atcatatgga aatagaagat acaattttct ttattcacag 660
tttggaagac tttcaatctc atagatcatc attatttttt gctactgttc cctatgctat 720
ggtgaaattt ccatttgaat aattgcttaa acaattaaca agaaagaatc tatttttact 780
tgcaataact tccatttcag aacatttact acactgttac tatatccaaa aactagtttt 840
atatatcatg tgagaaatga ctaattcata atttggccat gacatttttt tcagaaacag 900
aaaaagtgac caatacatac acaatgctat aaatattaag acttcagcaa attaaatatt 960
tattcatgat atcacataaa attcatttat tatgttttat ttaaatgtgt ttttaaaaca 1020
gtggtatcac taaatattaa gttagatgtg tttatgtgct taatgaattt atattttaga 1080
atgttataag ttgtatatag tcaaatatgt aataaatttt attttttagg tctttctcat 1140
taaggtattt taattttggg tcccttttcc agagtgactc tagctcatga tgagttgaca 1200
taaaaactaa acagtacaaa atgtacattg cattcagtat tgcacttgat ctttgcactg 1260
aagtttgagt cagttcatac atttagtact tgggaagtac attaagctaa ctttcattgc 1320
tctggcaaaa tgctcgataa gataagagtc tattgtggaa agccatggca gcaggaaagt 1380
aagactgctg atgatgttta atccatagtc aagacgcaga aggagatgaa tgctggtatc 1440
caacattttt tgctgttcat tttctctaga accctagtcc ataaagatgt atgacttgca 1500
ttcaaaatgc gtccccttca gttgttcaac ttttctgtaa atatcctttc aggcatgtct 1560
agaagattgt ttcgcaaata cttctcaatc cattcaagtt gatagtgcag attaatcact 1620
gcagaataaa agcctgtaac ttggctcacg tgccaaggaa tatgcacact cctgacacat 1680
caataagtaa atcaaagtgt agcttttgcc tttaacattg ccagacttat gtaatgttct 1740
gcacgttctt cctccatcac tttttattct aatggtgttt ccttgacatt gaatcacgct 1800
gtggaagctg cttagaatta acattgaaat ctactgatat atttatgatg cagcaattta 1860
gatttactat tttacttaga attttttata attgagagaa tataatattt tcacagttat 1920
ctatctgctg taaatagagg attttaaaaa aaatctctat aacttttttt tacaacacac 1980
agtaaaatta agttaaaatt taataaagtc actatgttga tttcaaagtg tgctacgccc 2040
acggtggtca cgcaggtgta gcagaagatg ccactaaggt gggctaaggc cgatgggttg 2100
gggtctgcgc tccctggaga tgagccccag gcggttccct ggcaatcagc tgcgatcatg 2160
atgcccgatg agccannnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2220
nnnnnnnnnn nnnnnnnnnc tgggtgactt tatggaaaga atttgataga tttcatgatg 2280
tagaagaatt ttattaggct tattttacag gagactaaga ccctgggacc taaagatatc 2340
tgggtcctga gaatcaggaa atgggtagag acgtggttga tggtatgaga cagattttag 2400
agaactctta gatcatgggc aatgaccgca atctgatgct tagaatagat catctataaa 2460
caattatgct gttctttttc tttctgttgt atgatctgat gatgtagccc ccttgccaag 2520
ttccctgatc ccccttgcca agttccctga ttgtaacagt atataagcat tgcttgagag 2580
catattcaac tacattgagt gtgtctgtct gtcatttcct cgccgattcc tgatttctcc 2640
ttgagccttt tcccttgttc tccctcggtc ggtggtctcc acgagaggcg gtccgtggca 2700
aaagtgtata aatgttctaa aacatttgaa ctctaaaaca tgcaaaatga aaaattaaaa 2760
taaataaaca tgaaaattaa aatatattag ctgctaaaag ttaaacaata ctatataata 2820
ttttgttatt agaattcaaa atcacattag ttggatttaa tttgaacatt gcattctttc 2880
aataataatt tcaataaaaa aagtttcccc atgatagtag aaaataataa catatgtatc 2940
tatctattta tttaactaca catatatagc atttgtttca actaaaataa atgaatgagc 3000
aaagcaccta agtaattggt gtctattata tttatgaagc caatagtttc aaataaatta 3060
tcatgcataa ggaggtattg caaatgttaa accttttttg aaacagatat tcccagttac 3120
agaaattata atttctaatc tttcctataa gtagaatgat gataattaat ataggccatt 3180
tgtaaataat gttcagatta aaatattctc tatttcacta gagaagaatg atattaaatg 3240
tattatattt tatttcccat tttgtttgca ccactattct atatccctca gcagtttaaa 3300
tttgtttcac catatgtgtg tgtgtttgta tcttaaatat ggcactaaaa ttagaataat 3360
ttaatataaa tctttaggag aaaagatatt gaattatttt atgttgatag gaaaatatct 3420
tttaattgtc caagaatact ttttcttcta ttttaggact gatcagaccc aggactaata 3480
ttttatatgt actaattcta tgtaccaaaa tatgttatta tctcatgaat tctgtctcaa 3540
tattgaggta ataaaaatag tccatcatga actttaaaat taaaataatg attaattaat 3600
ttttattcat attttgtttg tatgaatggt tatacatcac atgtgtgcct ggtgactgtg 3660
aatgtcagga gaaggtatga aagccactgg aattggaata agagataata tttgagatgt 3720
tatgtgggtg ctgagaatta gacgcaagcc atcttcaaga atagccagca tactatacca 3780
ctgagtaatc cattcatccc tcaataatta tctttgtaga cagtaaatat atttctaaac 3840
tataaatgac cagaaaaatt aatgtattat taatgaagac attcatctca tgtgacacac 3900
ttcacctgtc taaatcagta acactctctc cactaattaa gattttctaa gtgcatgaca 3960
cttactattt ctaaagctgt ccaatggggg ccagtcccca gtcagcaccc agtgagataa 4020
tccatgaatg catttatatc ttaggaaaaa ttcttatcta tgtagtattt agaacatttt 4080
catgtgaggg gataaacaag gaagcacaga tgctttctga tagaaacttt ctctttaatt 4140
catctagaaa aaaaaaacct ctcaggaaaa tctctcttgc tctcctccca atgctctatt 4200
cagcatcttc tccctactta attctagatc tttttctcta tgcctccttg ctgctgccct 4260
gctggctctg ctctatgcct ccccatgtca cttttctttg ctatctcacc gttaccttct 4320
ctgcctcact ctctgccttc ttctctgctt ctcacatggc caggctctgg acaattatag 4380
ttatatgtta cattctcata acacatgata tgtcacatag tttctctcag gctagggata 4440
tcacaatgac tggccaatga gcaagtggcc ttgcatgtag ctctaagttg gtgatggttc 4500
ccagacagta agtagccatt tggttgaaat ttgaggttgg gtagtacatg aagactgaat 4560
tttcttcaaa ctctggcctt gaaatagtaa aacaacacct atgaaaatga cgacctgtat 4620
ttgtctttag aggcaaccac atattgtctg cagggcctgc tttgaatttg ctctgaagtt 4680
agcttgtttg tgtaaaagga agaatcctat atcagcctga gaaatgtaaa atatcctagc 4740
atttcaagtc atcaaaatta tatggagagt ataaatcatc cttctgacta ttcatagtca 4800
tatttgtgtc caccaagtat aaaacacact accaaagggc tgtggaaaaa atcgccataa 4860
ctgttcttat tagggaggca tagcagtggt acctgaggaa gttacagcaa caaccagtca 4920
tccagtcaat aaccccatgg ctttgccact tggaggtacc caataatgtt tggctttgcc 4980
gagtaggact ccaacaaatt cagagggtca atttttaaat gctggttgtc actgctgaac 5040
agtcccattg ccctctgcat aattccacaa tggaaagctt tttacactga ttgccaatca 5100
ttaaacagcc tactcagcat aaacaggtat gatattattc tgcattttgt tacattacta 5160
gatgaattcc tatttcttcc tacaatagtg gaactgaaaa aagatacaca atcatactac 5220
ccctctacta atcttatgac ttatatcatt tcaattttca gaccataatg caaactattg 5280
accaaaacat gtgaagatga aaaatagaaa tgtagaataa tattacatat aaaaagaaaa 5340
ggcggactta ttttgtttta tttcttagca tgcatagcaa tacatgattt gaggtttata 5400
taataaaggg acaataaatc ttcaagaaac ttacccctac tgaattaaaa tattaaagaa 5460
ggtcacacat ttactcaaat atattagact actgggcaaa tagacatgaa aagtagagtt 5520
aatattgagg taggccttct gtgaaatgtc taaggaaatt atgtttcata cagtgtgtaa 5580
ccaagtggga atcatatcag aaagcagtca aaagcttata ttacaagtaa cagatgcttg 5640
gttatatgac ctcccagagc ttgactgtct atacacaaaa agtggtgtta ataaaactgt 5700
aatttgggct atgttttttt aaatggcttc accaacatga aaggaaggga atgagcatgt 5760
catggatgct tagagattat gcttccagca agaagaattg agctttggct cttattacag 5820
aaacatgaca aggtgtgagt tttatttatt agaaattata taatatttta agctggggac 5880
taaaaatttt attgaaacaa acaggcaagg gataggcatg tactagaagc aaaaatagga 5940
tgtcaatgct gtaatgttat tttttggacc aaaatagtat ttcctataga aatgacaatg 6000
atcttaggtt attattcttc ataaagatga caagttcaca agatatccta gttcattaaa 6060
atcgttttag tcatttaata gagtgctgtg atagattaca caaaggaaag cacttacgat 6120
gagaaataat gatatccaca attattttct taattcttag aaacattcta ttgttatatc 6180
tcaatctcag aagccactta ttgctttatt attgaaacat atgaaattgt aagttatata 6240
ttgtctatgg tgacatttca aagaacatgt gacgtacagt gtagcacaga taaagaacat 6300
aactgcagct gaatcagtaa ctaaacttac atacattaaa tctgccatgt tggcaacagt 6360
gtgtgcacta ccaaaggatg tactaatgct cacgacactc ccctatgtca ccctttgttc 6420
atcattacat cataggtcta ttttgtttgc ttttgaaatc tagaccaagt cttttgtgtc 6480
tttccaagca cagagctcat taatttacct catagacttg ttaaacttct tctggttcat 6540
caattgaata gaaatactca ctactaatta tgtgagaccc tgccagtacc atagcacatg 6600
gataattttt acataaaaca tgcatacaag taagattatt cagactgaac atgaatttta 6660
gagaaatcag gaaggagtat atgggagtgg ttggagtgag actagagaaa tgtaattaaa 6720
ctataatctc aatacaaaga tctactaagc aaaaaacatg aaacattgtc attcaagtga 6780
aacatcagtc ttcaaattgg aaagatattt ttactaggaa aatgtctggt agatggttat 6840
tatctagaaa acacaaaaat tagaaaacgg taaactttaa taaaaagaat aatacaatga 6900
gactacatga aaagttctta actaatgaaa caaatatctt gaaacttttt tcttaaaagt 6960
ttaatatcaa taaccatcat ggaaattcaa attaaaacta tttacatatt acccctgaaa 7020
taataactaa tacccaataa aaataatata aacaaaaaat ggcaatgcat gccatcatgg 7080
atttgggaga gagaatgttc attgcagttc tgaatggata ctggtgccac cacggtgaaa 7140
atctctgtat aggtccttcc aaaagctgaa aatagacata tcacaagacc tgccacacat 7200
ttttcaagca aatacccaaa ggactctacc tgactgcaga gacactttct cataaaatat 7260
tattgttgat ctattcataa tatctggaaa atagaaacag ccaagatgcc catcaactga 7320
ttaatagatg ataaaattat tgtacatttc agtgtaatat tattcagttt ttaagaaaaa 7380
tgaaattatg taataagcat gtaaatggat atatcttgaa acaaccattc cccattatat 7440
tacctaaaca ttgaaagtcc aaaatcatat gatcttttta gtggatctac taatcttttg 7500
ctatatgtat tttattgaac tacccatgga tgtgagataa ttggtaacaa cagcacatgg 7560
gagagcatgg gatcattcaa ggaagattag agagaatgca ttttttagga gataatggag 7620
gagcaataga aaggattaaa tgaggttact gatgaaagtg atggttagag aaggcaatat 7680
gaggagggat aactagcact tagggccttt tgaaaaagac atagagaaaa tactattgta 7740
gaaacttcct ataattggtg tatagttata tacaccaaag agctcagatg gagttaccct 7800
ataatggaaa tattaactac tttttatcac tgtgataaaa catcctgaac agagcaacat 7860
agattgggaa gcatttactt tggcttacag ttctaacggg ataaaaattc atgatgaaag 7920
aatgaatatg tcagcaaaca gcagtagcaa tggcctgaga agcaggtgag agctcacatc 7980
ttgaagtgta agaatgtagc agagagaaca aactgcaaat gaccagaaaa tgcttttgga 8040
tcagagccca tacccctctg actgacttct ccagaaattc tgaacaaata aaactcccca 8100
aacagagcca taactgaagg tccagtgtct gagactacta ggggtatttc ttattcaaac 8160
cactacaatg gggtgggggg agcaatcctc caagtaggca ctacacacag acaaataaaa 8220
actctagtaa ctggaatgga ttgacttatt tgaattactt gccagtggag ctacatagag 8280
cacaattatt gtatttaaat taccctttat gatcttacaa aacttgacag taagatcata 8340
ttgctaaaga aaccacatat ttgaatcagg gaacatggtg atatctagtt gttcttcaac 8400
tggaaacttc atgctttctg cccagcattc atgttgctgg aaagagcaat gtacactacc 8460
agtgtagaaa ttaaatcatc aatcttatca agatgtggat cctataagtt acaataaaaa 8520
ttagcctgat aagatatccc caccagaaga atattcacat aaatgctatg ggagcaacaa 8580
gctattttct aaattagctt taatcctatt ctacaagaga gaatccatat ctagaatagt 8640
tatagggatc aagaacccat ggcttgattg gtcataggcc caatgggaga tcctaatatt 8700
attgttctac aaaatgaaaa taactcctaa tgacttgttg ctgcagtaat aagttagtat 8760
gttgctcaac tctcacaaga gaagttttgt cttacaataa atggcaatta aagcagcccc 8820
acaagattta tatcataccg atctcctcat ggcctatgca tctagaagct aggaaacaaa 8880
gaggacccta agagagacat acatggtccc cctggagaag gggaaggggg caagacctcc 8940
aaagctaatt gggagcatgg gggaggggag agggagttag aagaaagaga aggggataaa 9000
aggagggaga ggaggacaag agagagaagg aagatctagt caagagaaga tagaggagag 9060
caagaaaaga gataccatag tagagggagc cttgtatgtt taaatagaaa actggcacta 9120
gggaattgtc caaagatcca caaggtccaa ctaataatct aagcaatagt cgagaggcta 9180
ccttaaaagc ctttctctga taatgagatt gatgactacc ttatatacca tcctagagcc 9240
ttcatccagt agctgatgga agcagaagca gacatctaca gctaaacact gagctagttg 9300
cagacaggga ggagtgatga gcaaagtcaa gaccaggctg gagaaacaca cagaaacagc 9360
agacctgaaa aaaatgttgc acatggaccc cagactgata gctgggagtc cagcatagga 9420
cttttctaga aaccctgaat gaggatatca gtttggaggt ctggttaatc tatggggaca 9480
ctggtagtgg atcaatattt atccctagtt catgactgga atttgggtac ccattccaca 9540
tggaggaatt ctctgtcagc ctagacacat gggggaggtt ctaggtcctg ctccaaataa 9600
tgtgttagac tttgaagaac tcccttgaga agactcaccc tccctgggga gcagaaaggg 9660
gatgggatga gggttggtga gggacaggag aggaggggag ggtgagggaa ctgggattga 9720
caagtaaatg atgcttgttt ctaatttaaa tgaataaagg aaaagtaaaa gaagaaaaga 9780
aaacaggcca aaagattata aaagacagag gtggtgggtg actataaaga aacactatta 9840
tctaaataaa aatatgtcag aagcacacat gaacttatag tgtttatgaa agtatgtata 9900
ataactacat aatctcaagc caagaaaaaa atatcatctt tcagtgatga aggtgatttt 9960
atttctccca gaattaaagc caaagaccta atgaaagtaa ttatcttcaa aaggttgaaa 10020
atacatactt tgcaatacac agatctgcct agaaatctca tgttcacaat acacatgatg 10080
ctcaattgaa ttccattcaa tgttacagtt tagataaaca gtttgtagat aaactcacaa 10140
tgtatcattt ctttttattt tttgaccaaa cagcttctca tctgttattc agaataattc 10200
ctcgatggca ggatatccat cccaattggg ggaaggggag aatttgaaga aaacctagac 10260
cacatacata tttgccattg ggaaacaaag tctaaaatga tgttgttcac atcttctcta 10320
ctagtcctct ccccgtccca aagaaccttg gtatatgtgc ctcattttac agagagagga 10380
aagcaggaac tgagcatccc ttacttgcca tcctcaaccc aaaatttgca tcattgctca 10440
gctctgccct tctcatatga cagttacaag tcaaggcttc caaagtccct ctgtcatgtt 10500
tggtgtcaat agtttataca gatgacttca tgtcttcata tctaatgtct tatatagatt 10560
aatattaaac aatgttattt ctctaaccac attttaaatt aatttaaaaa tccattaatt 10620
gtgtctataa aatgcagaca gagtgctgag acacaatata agcctgatga tctgaatttg 10680
aaactcacac ccaccacatg gagaatcaac ttccaaaaat tttcctatta cttccacact 10740
tacaccattg tacaaacaca ataataatga acaaaatgaa atgaaataaa aaattaagtc 10800
tctgtaggta atgctactgt gcagcaaaag taaaaatggc agcttaagct tgctttatgg 10860
ttacacttta ccatcttcca ttaattataa ggacttcaat catggcagaa ctatgctgtt 10920
attgtctcag tgtaacctaa ccaggtgttc cagatgttct taatgtggac acctaaacta 10980
tttgatattt gggttaagat ctttccctct ttcagaagaa acctcaggac agagggaatc 11040
ttgtctttta attttgagtc tgtagacttt ttccatttca aatatacatg aaacaagtga 11100
tgaagaaaat taatcaaaag gtgggaattg caatgatatt aggttcaata ttaagcttca 11160
atattatcat ggaatcgcct gttatacact gagtgtttgg caataaggga tttttagaag 11220
aaggagtttt tattctcaac aggttcctta agtttagctc aaataaatct aagcaatcca 11280
ctctagaatt aaatagtttc ctaagggcac agctatgaat agagctcaat ttacatataa 11340
aattttgttc accatttatg tcattccagt tttcattagt acaaggaaaa tacaaaatat 11400
ttagatgtca atatcaagtg aatagttcat ctcctttttt aatatatatc acctaaatca 11460
ccattttctc agaaaaatct ggcctgaagt tctgtctgga acttcaacat gaaaaatatg 11520
cacagcttgc tattataaat cctagttgat ttttaagatt catgtctggt gtctgactca 11580
gaggggccag aggctagaca aatatttttt gaatcttcat tgtgaagatt tttaatgatt 11640
attttaatat aaataacaaa gatgatggat aatgtaactt tgtacagttc atagacgctg 11700
aactactttg tgcttaaaat gttagttccc tatcataaat gataggtgat aagtgtatgt 11760
ttaatacttt ccctctgagc tatattcatg tactagagaa ttattttaaa catgaaaaga 11820
ctgtgtttat agtctcagct cctgagaact ggtccaacct taggcaggtg aatgccagga 11880
gcaacgtttt tcttctacag aggatgcttt gctgccaagc aacctggttg tgtggaaatg 11940
ttcctttttt aatcaagttt aaagggtctt catcatgctg ttgctccaca tattttcagg 12000
ttagagcttg gtccttggag tattatcttt taccagaaaa ttcatagtat tctttcaata 12060
actaacaact aaacttttcg ataaaaaaga attggaattt caattttaaa gcctgagtaa 12120
aattcttgtg aatcaggata ttttatttta agtcttatct tttaaaaagt tattttattt 12180
tttaaaaaat tataatatac tttcataatt tccctccttc acttttcttt acaaacactt 12240
ctatagatca ccatgtgttt ttttttttac atttatggcc tctttctgtt cattgttatt 12300
acatacaaat agtcttgcct atagaagaac accacaattt gttacctgat aacaaattat 12360
caacccttaa aacctacaaa ctattgatat tactgaaaag actatactta tagatgtaaa 12420
gatatatgtg tgtgcacata tatagataca catatatgta ggatttttaa ttttagattt 12480
tagacatcaa aattatttat atgactgaga aactagacac tataaatgag cattcagtat 12540
tcaacaccgt gattttagat attgtcacaa tgacagaaaa ttttcttata gaaaatttta 12600
agttttgtga ttgctctgtg cacttagtga agtctcacag aaaaagaatc atagtatttt 12660
tagtttataa taaaaagtac atataattaa aatggttggc acaaaacaac atttgagcat 12720
ttttcctatt tactatcaag tagtatcatt ttgaaataat aatttgacta gtttcaaaaa 12780
tgaaaacaaa atttaaacta aatgcctaat ctagcctgat aacattttta tgaatgaaat 12840
tattcaatag tgttatcaat taggggccca aaacttttcc taaaataaaa cttttaattt 12900
ttttccattt ttatttaaat tagaaacaaa attgttttac atgtaaatca gagtttcctc 12960
accctcccct tctccctgtc cctcactaac accctacttg tcccatacca tttctgctcc 13020
ccagggaggg tgaggccttc catggggaaa cttcagagtc tgtctatcct ttcggatagg 13080
gcctaggccc tcacccattt gtctaggcta aggctcacaa agtttactcc tatgctagtg 13140
ataagtactg atctactaca agagacacca tagatttcct aggcttcctc actgacaccc 13200
atgttcatgg ggtctggaac aatcatatgc tagtttccta ggtatcagtc tggggaccat 13260
gagctccccc ttgttcaggt caactgtttc tgtgggtttc accaccctgg tcttgactgc 13320
tttgctcatc actcctccct ttctgtaact gggttccagt acaattccgt gtttagctgt 13380
gggtgtctac ttctactttc atcagcttct gggatggagc ctctaggata gcatacaatt 13440
agtcatcatc tcattatcag ggaagggcat ttaaagtagc ctctccattg ttgcttggat 13500
tgttagttgg tgtcatcttt gtagatctct ggacatttcc ctagtgccag atatctcttt 13560
aaacctacaa gactacctct attatggtat ctcttttctt gctctcgtct attcttccag 13620
acaaaatctt cctgctccct tatattttcc tctcccctcc tcttctcccc ttctcattct 13680
cctagatcca tcttcccttc ccccatgctc ccaagagaga tgttgctcag gagatcttgt 13740
tccttaaccc ttttcttggg gatctgtctc tcttagggtt gtccttgttt cctagcttct 13800
ctggaagtgt ggattgtaag ctggtaatca tttgctccat gtctaaaatc catatatgag 13860
tgatgtttgt ctttttgtga ctgggttacc tcactcaaaa tggtttcttc catatgtctg 13920
tggatttcaa tagcacaaac aacatacagt atcttggggc aacactaacc aaacaagtga 13980
aagaccagta tagcaagaac tttgagttta aagaaagaaa ttaaagaaga taccagaaaa 14040
tggaaagatc tcccatgctc tttgataggc agaatcaaca tagtaaaaat ggcaatcttg 14100
ccaaaatcca tctacagact caatgcaatc cccattaaat accagcacac ttcttcacag 14160
acctgaaaga ataatactta actttatatg gagaaacaaa agacccagga taggccaaac 14220
aaccctgtac aatgaaggca cttccagagg catccccatc cctgacttca agctctatta 14280
tagagtaata atcctgaaaa cagcttggta atggcacaaa aatagacagg tagaccaatg 14340
gaattgagtt gaaaaccctg atattaaccc acatatctat gaacacctga ctttgacaaa 14400
gaagctaagg ttatacaatg taagaaagaa agcatcttca acaaatcgtg ctggcataac 14460
tggatgctgg catgtagaag actgcagata gatccatgtc taatgccatg cacaaaactt 14520
aagtccaaat ggatcaaaaa cctcaacata aatccagcca cactgaacct catagaagag 14580
aaagtgggaa gtatccttga ataaattggt acaggagacc acatcttgaa cttaacacca 14640
gtagcacaga caatcagatc aataatcaat aaatgggacc tcctgaaact gagaagcttc 14700
tgtaaggcaa tggataagtc aacaggacaa aatggcagcc cacggaatgg gaaaagatat 14760
tcaccaatcc tatatctgac agagggctgc tctctatttg caaagaacac aataagctag 14820
tttttaaaac accaattaat ccgattataa agttgggtag agaactaaat aaagaattgt 14880
taacagagca atctaacttg gcagaaagac acataagaaa gtgctcacca t 14931
<210> 3
<211> 4001
<212> DNA
<213> 中国仓鼠
<400> 3
ccaagatgcc catcaactga ttaatagatg ataaaattat tgtacatttc agtgtaatat 60
tattcagttt ttaagaaaaa tgaaattatg taataagcat gtaaatggat atatcttgaa 120
acaaccattc cccattatat tacctaaaca ttgaaagtcc aaaatcatat gatcttttta 180
gtggatctac taatcttttg ctatatgtat tttattgaac tacccatgga tgtgagataa 240
ttggtaacaa cagcacatgg gagagcatgg gatcattcaa ggaagattag agagaatgca 300
ttttttagga gataatggag gagcaataga aaggattaaa tgaggttact gatgaaagtg 360
atggttagag aaggcaatat gaggagggat aactagcact tagggccttt tgaaaaagac 420
atagagaaaa tactattgta gaaacttcct ataattggtg tatagttata tacaccaaag 480
agctcagatg gagttaccct ataatggaaa tattaactac tttttatcac tgtgataaaa 540
catcctgaac agagcaacat agattgggaa gcatttactt tggcttacag ttctaacggg 600
ataaaaattc atgatgaaag aatgaatatg tcagcaaaca gcagtagcaa tggcctgaga 660
agcaggtgag agctcacatc ttgaagtgta agaatgtagc agagagaaca aactgcaaat 720
gaccagaaaa tgcttttgga tcagagccca tacccctctg actgacttct ccagaaattc 780
tgaacaaata aaactcccca aacagagcca taactgaagg tccagtgtct gagactacta 840
ggggtatttc ttattcaaac cactacaatg gggtgggggg agcaatcctc caagtaggca 900
ctacacacag acaaataaaa actctagtaa ctggaatgga ttgacttatt tgaattactt 960
gccagtggag ctacatagag cacaattatt gtatttaaat taccctttat gatcttacaa 1020
aacttgacag taagatcata ttgctaaaga aaccacatat ttgaatcagg gaacatggtg 1080
atatctagtt gttcttcaac tggaaacttc atgctttctg cccagcattc atgttgctgg 1140
aaagagcaat gtacactacc agtgtagaaa ttaaatcatc aatcttatca agatgtggat 1200
cctataagtt acaataaaaa ttagcctgat aagatatccc caccagaaga atattcacat 1260
aaatgctatg ggagcaacaa gctattttct aaattagctt taatcctatt ctacaagaga 1320
gaatccatat ctagaatagt tatagggatc aagaacccat ggcttgattg gtcataggcc 1380
caatgggaga tcctaatatt attgttctac aaaatgaaaa taactcctaa tgacttgttg 1440
ctgcagtaat aagttagtat gttgctcaac tctcacaaga gaagttttgt cttacaataa 1500
atggcaatta aagcagcccc acaagattta tatcataccg atctcctcat ggcctatgca 1560
tctagaagct aggaaacaaa gaggacccta agagagacat acatggtccc cctggagaag 1620
gggaaggggg caagacctcc aaagctaatt gggagcatgg gggaggggag agggagttag 1680
aagaaagaga aggggataaa aggagggaga ggaggacaag agagagaagg aagatctagt 1740
caagagaaga tagaggagag caagaaaaga gataccatag tagagggagc cttgtatgtt 1800
taaatagaaa actggcacta gggaattgtc caaagatcca caaggtccaa ctaataatct 1860
aagcaatagt cgagaggcta ccttaaaagc ctttctctga taatgagatt gatgactacc 1920
ttatatacca tcctagagcc ttcatccagt agctgatgga agcagaagca gacatctaca 1980
gctaaacact gagctagttg cagacaggga ggagtgatga gcaaagtcaa gaccaggctg 2040
gagaaacaca cagaaacagc agacctgaaa aaaatgttgc acatggaccc cagactgata 2100
gctgggagtc cagcatagga cttttctaga aaccctgaat gaggatatca gtttggaggt 2160
ctggttaatc tatggggaca ctggtagtgg atcaatattt atccctagtt catgactgga 2220
atttgggtac ccattccaca tggaggaatt ctctgtcagc ctagacacat gggggaggtt 2280
ctaggtcctg ctccaaataa tgtgttagac tttgaagaac tcccttgaga agactcaccc 2340
tccctgggga gcagaaaggg gatgggatga gggttggtga gggacaggag aggaggggag 2400
ggtgagggaa ctgggattga caagtaaatg atgcttgttt ctaatttaaa tgaataaagg 2460
aaaagtaaaa gaagaaaaga aaacaggcca aaagattata aaagacagag gtggtgggtg 2520
actataaaga aacactatta tctaaataaa aacatgtcag aagcacacat gaacttatag 2580
tgtttatgaa agtatgtata ataactacat aatctcaagc caagaaaaaa atatcatctt 2640
tcagtgatga aggtgatttt atttctccca gaattaaagc caaagaccta atgaaagtaa 2700
ttatcttcaa aaggttgaaa atacatactt tgcaatacac agatctgcct agaaatctca 2760
tgttcacaat acacatgatg ctcaattgaa ttccattcaa tgttacagtt tagataaaca 2820
gtttgtagat aaactcacaa tgtatcattt ctttttattt tttgaccaaa cagcttctca 2880
tctgttattc agaataattc ctcgatggca ggatatccat cccaattggg ggaaggggag 2940
aatttgaaga aaacctagac cacatacata tttgccattg ggaaacaaag tctaaaatga 3000
tgttgttcac atcttctcta ctagtcctct ccccgtccca aagaaccttg gtatatgtgc 3060
ctcattttac agagagagga aagcaggaac tgagcatccc ttacttgcca tcctcaaccc 3120
aaaatttgca tcattgctca gctctgccct tctcatatga cagttacaag tcaaggcttc 3180
caaagtccct ctgtcatgtt tggtgtcaat agtttataca gatgacttca tgtcttcata 3240
tctaatgtct tatatagatt aatattaaac aatgttattt ctctaaccac attttaaatt 3300
aatttaaaaa tccattaatt gtgtctataa aatgcagaca gagtgctgag acacaatata 3360
agcctgatga tctgaatttg aaactcacac ccaccacatg gagaatcaac ttccaaaaat 3420
tttcctatta cttccacact tacaccattg tacaaacaca ataataatga acaaaatgaa 3480
atgaaataaa aaattaagtc tctgtaggta atgctactgt gcagcaaaag taaaaatggc 3540
agcttaagct tgctttatgg ttacacttta ccatcttcca ttaattataa ggacttcaat 3600
catggcagaa ctatgctgtt attgtctcag tgtaacctaa ccaggtgttc cagatgttct 3660
taatgtggac acctaaacta tttgatattt gggttaagat ctttccctct ttcagaagaa 3720
acctcaggac agagggaatc ttgtctttta attttgagtc tgtagacttt ttccatttca 3780
aatatacatg aaacaagtga tgaagaaaat taatcaaaag gtgggaattg caatgatatt 3840
aggttcaata ttaagcttca atattatcat ggaatcgcct gttatacact gagtgtttgg 3900
caataaggga tttttagaag aaggagtttt tattctcaac aggttcctta agtttagctc 3960
aaataaatct aagcaatcca ctctagaatt aaatagtttc c 4001

Claims (53)

1.一种细胞,其包含
整合在第一表达增强的基因座中的第一外源核酸;以及整合在第二表达增强的基因座中的第二外源核酸;
其中所述第一外源核酸和所述第二外源核酸共同编码抗原结合蛋白;并且
其中两个表达增强的基因座之一的核苷酸序列如SEQ ID NO:1所示,并且两个表达增强的基因座中的另一个的核苷酸序列如SEQ ID NO:2或SEQ ID NO:3所示。
2.如权利要求1所述的细胞,其中所述第一外源核酸包含编码第一重链片段(HCF)的核苷酸序列,并且所述第二外源核酸包含编码轻链片段(LCF)的核苷酸序列。
3.如权利要求2所述的细胞,其中所述第二外源核酸还包含编码第二HCF的核苷酸序列。
4.如权利要求3所述的细胞,其中所述第一HCF和所述第二HCF不同。
5.如权利要求3所述的细胞,其中编码所述第一HCF的所述核苷酸序列编码第一CH3结构域,并且其中编码所述第二HCF的所述核苷酸序列编码第二CH3结构域。
6.如权利要求5所述的细胞,其中所述第一CH3结构域和所述第二CH3结构域的差异在于至少一个氨基酸位置。
7.如权利要求5所述的细胞,其中编码所述第一CH3结构域和所述第二CH3结构域的所述核苷酸序列彼此的差异在于所述核苷酸序列之一已经经过密码子修饰。
8.如权利要求3所述的细胞,其中所述第一外源核酸还包含编码第二LCF的核苷酸序列。
9.如权利要求8所述的细胞,其中所述第一LCF和第二LCF包含相同的氨基酸序列。
10.如权利要求2、3、8中任一项所述的细胞,其中编码HCF或LCF的所述核苷酸序列中的每一者可操作地连接至启动子。
11.如权利要求2所述的细胞,其中第一重组酶识别位点(RRS)和第二RRS相对于所述第一外源核酸分别位于5'和3',并且第三RRS和第四RRS相对于所述第二外源核酸分别位于5'和3',其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同。
12.如权利要求11所述的细胞,其中所述第一RRS、所述第二RRS、所述第三RRS和所述第四RRS彼此不同。
13.如权利要求3所述的细胞,其中第一附加RRS存在于编码所述第一LCF的所述核苷酸序列与编码所述第二HCF的所述核苷酸序列之间,其中所述附加RRS与所述第一RRS、所述第二RRS、所述第三RRS和所述第四RRS中的每一者不同。
14.如权利要求8所述的细胞,其中第一RRS和第二RRS相对于所述第一外源核酸分别位于5'和3',并且第三RRS和第四RRS相对于所述第二外源核酸分别位于5'和3',其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同。
15.如权利要求14所述的细胞,其中所述第一HCF和所述第二HCF相同,并且所述第一LCF和所述第二LCF相同,并且其中所述第一RRS和所述第三RRS相同,并且所述第二RRS和所述第四RRS相同。
16.如权利要求14所述的细胞,其中所述第一HCF和所述第二HCF不同,并且所述第一LCF和所述第二LCF相同,并且其中所述第一RRS、所述第二RRS、所述第三RRS和所述第四RRS彼此不同。
17.如权利要求15或权利要求16所述的细胞,其中第一附加RRS存在于所述第二外源核酸中的编码所述第一LCF的所述核苷酸序列与编码所述第二HCF的所述核苷酸序列之间,其中所述第一附加RRS与所述第一RRS、所述第二RRS、所述第三RRS和所述第四RRS不同。
18.如权利要求17所述的细胞,其中第二附加RRS存在于编码所述第二LCF的所述核苷酸序列与编码所述第一HCF的所述核苷酸序列之间,其中所述第一RRS和所述第二RRS相同或不同,并且各自与所述第一RRS、所述第二RRS、所述第三RRS和所述第四RRS不同。
19.如权利要求2所述的细胞,其中所述抗原结合蛋白为单特异性的。
20.如权利要求4所述的细胞,其中所述抗原结合蛋白为双特异性的。
21.一种细胞,其包含
从5'至3'整合在第一表达增强的基因座内的:第一RRS、第一外源核酸和第二RRS;
从5'至3'整合在第二表达增强的基因座内的:第三RRS、第二外源核酸和第四RRS;
其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同;并且
其中两个表达增强的基因座之一的核苷酸序列如SEQ ID NO:1所示,并且两个表达增强的基因座中的另一个的核苷酸序列如SEQ ID NO:2或SEQ ID NO:3所示。
22.如权利要求21所述的细胞,其中所述第一外源核酸包含第一可选标志基因,并且所述第二外源核酸包含第二可选标志基因,其中所述第一可选标志基因和所述第二可选标志基因不同。
23.如权利要求22所述的细胞,其中所述第一外源核酸还包含第一附加RRS,其中所述第一附加RRS与所述第一RRS和所述第二RRS不同。
24.如权利要求23所述的细胞,其中所述第二外源核酸还包含第二附加RRS,并且所述第二附加RRS与所述第三RRS和所述第四RRS不同。
25.如权利要求21所述的细胞,其中所述第一外源核酸包含第一可选标志基因、第一附加RRS和第一附加可选标志基因,其中所述第一可选标志基因和所述第一附加可选标志基因不同,并且所述第一附加RRS与所述第一RRS和所述第二RRS不同。
26.如权利要求24所述的细胞,其中所述第二外源核酸包含第二可选标志基因、第二附加RRS和第二附加可选标志基因,其中所述第二可选标志基因和所述第二附加可选标志基因彼此不同并且也与所述第一可选标志基因和所述第一附加可选标志基因不同,并且其中所述第二附加RRS与所述第三RRS和所述第四RRS不同。
27.根据前述权利要求中任一项所述的细胞,其中所述细胞为CHO细胞。
28.一种系统,其包含细胞和载体组,
其中所述细胞包含
从5'至3'整合在第一表达增强的基因座内的:第一重组酶识别位点(RRS)、第一外源核酸和第二RRS;
从5'至3'整合在第二表达增强的基因座内的:第三RRS、第二外源核酸和第四RRS;
其中所述第一RRS和所述第二RRS不同,并且所述第三RRS和所述第四RRS不同;并且其中两个表达增强的基因座之一的核苷酸序列如SEQ ID NO:1所示,并且两个表达增强的基因座中的另一个的核苷酸序列如SEQ ID NO:2或SEQ ID NO:3所示;
其中所述载体组包含
第一载体,其从5'至3'包含第一载体5'RRS、第一核酸和第一载体3'RRS,其中所述第一载体5'RRS和所述第一载体3'RRS不同;
第二载体,其从5'至3'包含所述第二载体5'RRS、所述第二核酸和所述第二载体3'RRS,其中所述第二载体5'RRS和所述第二载体3'RRS不同;
编码第一重链片段(HCF)的核苷酸序列和与编码第一轻链片段(LCF)的核苷酸序列,其中所述核苷酸序列之一在所述第一核酸中并且另一核苷酸序列在所述第二核酸中;其中所述第一HCF和所述第一LCF为抗原结合蛋白的片段;并且
其中在将所述载体引入所述细胞之后,所述载体中的所述第一核酸和所述第二核酸通过所述RRS所介导的重组而分别整合到所述第一表达增强的基因座和所述第二表达增强的基因座中。
29.如权利要求28所述的系统,其中所述抗原结合蛋白为单特异性抗原结合蛋白。
30.如权利要求29所述的系统,其中所述第一RRS和所述第三RRS相同,并且所述第二RRS和所述第四RRS相同。
31.如权利要求30所述的系统,其中第一附加RRS存在于所述第一基因座中的所述第一RRS与所述第二RRS之间。
32.如权利要求31所述的系统,其中所述第一载体5'RRS与所述第一RRS和所述第三RRS相同;所述第一载体3'RRS、所述第二载体5'RRS和所述第一附加RRS相同;并且所述第二载体3'RRS与所述第二RRS和所述第四RRS相同。
33.如权利要求32所述的系统,其中所述LCF-编码核苷酸序列在所述第一载体中,并且所述HCF-编码核苷酸序列在所述第二载体中。
34.如权利要求29所述的系统,其中所述第一载体5'RRS与所述第一RRS相同,并且所述第一载体3'RRS与所述第二RRS相同;并且其中所述第二载体5'RRS与所述第三RRS相同,并且所述第二载体3'RRS与所述第四RRS相同。
35.如权利要求29所述的系统,其中所述抗原结合蛋白为双特异性抗原结合蛋白。
36.如权利要求35所述的系统,其还包含编码所述第二HCF的所述核苷酸序列,所述第二HCF与所述第一HCF不同。
37.如权利要求36所述的系统,其中编码所述第一LCF的所述核苷酸序列和编码所述第二HCF的所述核苷酸序列均包括在所述第一载体中的所述第一核酸中,并且编码所述第一HCF的所述核苷酸序列在所述第二载体中。
38.如权利要求37所述的系统,其中所述第一载体5'RRS与所述第一RRS相同、所述第一载体3'RRS与所述第二RRS相同、所述第二载体5'RRS与所述第三RRS相同,并且所述第二载体3'RRS与所述第四RRS相同。
39.如权利要求36所述的系统,其中编码所述第二HCF的所述核苷酸序列在第三单独载体上、侧接第三载体5'RRS和第三载体3'RRS。
40.如权利要求39所述的系统,其中编码所述第一LCF的所述核苷酸序列在所述第一载体中,编码所述第一HCF的所述核苷酸序列在所述第二载体中,所述第一载体5'RRS与所述第一RRS相同,所述第一载体3'RRS与所述第二载体5'RRS相同并且与第一附加RRS相同,并且所述第二载体3'RRS与所述第二RRS相同,所述第三载体5'RRS与所述第三RRS相同,并且所述第三载体3'RRS与所述第四RRS相同,其中所述第一附加RRS被包括在所述第一基因座中、介于所述第一RRS与所述第二RRS之间。
41.如权利要求37所述的系统,其还包含编码第二LCF的核苷酸序列。
42.如权利要求41所述的系统,其中所述第一LCF和所述第二LCF相同。
43.如权利要求42所述的系统,其中编码所述第二LCF的所述核苷酸序列在所述第二载体的所述第二核酸中,其中所述第一载体5'RRS与所述第一RRS相同,所述第一载体3'RRS与所述第二RRS相同、所述第二载体5'RRS与所述第三RRS相同,并且所述第二载体3'RRS与所述第四RRS相同。
44.如权利要求42所述的系统,其中编码所述第二LCF的所述核苷酸序列在第三单独载体中、侧接第三载体5'RRS和第三载体3'RRS。
45.如权利要求44所述的系统,其中所述第一载体5'和3'RRS分别与所述第一基因座中的所述第一RRS和所述第二RRS相同;所述第三载体5'RRS与所述第三RRS相同,所述第三载体3'RRS与所述第二载体'5RRS相同并且与存在所述第二基因座中的所述第三RRS与所述第四RRS之间的附加RRS相同,所述第二载体3'RRS与所述第四RRS相同。
46.如权利要求36所述的系统,其中编码所述第一HCF的所述核苷酸序列编码第一CH3结构域,并且编码所述第二HCF的所述核苷酸序列编码第二CH3结构域。
47.如权利要求46所述的系统,其中所述第一CH3结构域和所述第二CH3结构域的差异在于至少一个氨基酸。
48.如权利要求46所述的系统,其中编码所述第一CH3结构域和所述第二CH3结构域的所述核苷酸序列的差异在于所述核苷酸序列之一已经经过密码子修饰。
49.如权利要求28所述的系统,其中编码所述第一HCF的所述核苷酸序列与编码所述第一LCF的所述核苷酸序列各自可操作地连接至启动子。
50.如权利要求28所述的系统,其中所述细胞为CHO细胞。
51.一种方法,其包括:
(i)提供根据权利要求28-50中任一项所述的系统;
(ii)通过转染将所述载体引入所述细胞中;以及
(iii)筛选经转染的细胞,其中在所述载体中的所述核酸已通过所述RRS所介导的重组而整合到所述第一表达增强的基因座和所述第二表达增强的基因座中。
52.如权利要求51的方法,其还包括
(iv)从所选择的经转染的细胞表达并获得所述抗原结合蛋白。
53.一种制备抗原结合蛋白的方法,其包括:提供根据权利要求1-20中任一项所述的细胞,以及从所述细胞表达并获得所述抗原结合蛋白。
CN201780024557.0A 2016-04-20 2017-04-20 基于使用表达增强性基因座来制备抗体的组合物和方法 Active CN109195986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211606177.7A CN116515757A (zh) 2016-04-20 2017-04-20 基于使用表达增强性基因座来制备抗体的组合物和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662325400P 2016-04-20 2016-04-20
US62/325,400 2016-04-20
PCT/US2017/028555 WO2017184832A1 (en) 2016-04-20 2017-04-20 Compositions and methods for making antibodies based on use of expression-enhancing loci

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211606177.7A Division CN116515757A (zh) 2016-04-20 2017-04-20 基于使用表达增强性基因座来制备抗体的组合物和方法

Publications (2)

Publication Number Publication Date
CN109195986A CN109195986A (zh) 2019-01-11
CN109195986B true CN109195986B (zh) 2023-01-03

Family

ID=58701851

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211606177.7A Pending CN116515757A (zh) 2016-04-20 2017-04-20 基于使用表达增强性基因座来制备抗体的组合物和方法
CN201780024557.0A Active CN109195986B (zh) 2016-04-20 2017-04-20 基于使用表达增强性基因座来制备抗体的组合物和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211606177.7A Pending CN116515757A (zh) 2016-04-20 2017-04-20 基于使用表达增强性基因座来制备抗体的组合物和方法

Country Status (15)

Country Link
US (2) US11512144B2 (zh)
EP (1) EP3445781A1 (zh)
JP (3) JP7096770B2 (zh)
KR (2) KR102547738B1 (zh)
CN (2) CN116515757A (zh)
AR (1) AR109451A1 (zh)
AU (2) AU2017253241B2 (zh)
BR (1) BR112018071283A2 (zh)
CA (1) CA3015389A1 (zh)
EA (1) EA201892010A1 (zh)
IL (2) IL314779A (zh)
MX (1) MX2018012868A (zh)
SG (2) SG10202010155YA (zh)
TW (2) TWI827531B (zh)
WO (1) WO2017184832A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3015389A1 (en) * 2016-04-20 2017-10-26 Regeneron Pharmaceuticals, Inc. Compositions and methods for making antibodies based on use of expression-enhancing loci
AU2018392728A1 (en) * 2017-12-22 2020-07-09 Genentech, Inc. Targeted integration of nucleic acids
KR20210107057A (ko) * 2018-12-21 2021-08-31 제넨테크, 인크. 핵산의 표적화 통합
CA3134705A1 (en) * 2019-04-02 2020-10-08 Chugai Seiyaku Kabushiki Kaisha Method of introducing target-specific foreign gene
AU2020308002A1 (en) 2019-06-26 2022-01-20 Genentech, Inc. Randomized configuration targeted integration of nucleic acids
CN118451189A (zh) 2021-10-18 2024-08-06 瑞泽恩制药公司 包括用于产生稳定整合位点的整合的cas9基因的哺乳动物细胞,以及包括稳定整合位点和其它位点的哺乳动物细胞
TW202323529A (zh) 2021-10-18 2023-06-16 美商再生元醫藥公司 包括腺病毒相關病毒聚核苷酸的真核細胞
IL312148A (en) 2021-10-18 2024-06-01 Regeneron Pharma Controlled transcription of polynucleotides
KR20240117146A (ko) * 2021-12-22 2024-07-31 제넨테크, 인크. 다중 벡터 재조합효소 매개 카세트 교환
WO2023238949A1 (ja) * 2022-06-10 2023-12-14 富士フイルム株式会社 細胞の作出方法、ヘテロ多量体タンパク質の製造方法、バイスペシフィック抗体の製造方法、ベクターセット、哺乳動物細胞、cho細胞、及び細胞プールの作出方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008151219A1 (en) * 2007-06-04 2008-12-11 Regeneron Pharmaceuticals, Inc. Enhanced expression and stability regions
WO2010141478A1 (en) * 2009-06-02 2010-12-09 Regeneron Pharmaceuticals, Inc. Fucosylation-deficient cells
CN102575264A (zh) * 2009-09-18 2012-07-11 瑟莱克斯公司 增加的转基因表达和加工的产品和方法
WO2013190032A1 (en) * 2012-06-22 2013-12-27 Lonza Biologics Plc Site-specific integration
WO2014022540A1 (en) * 2012-08-02 2014-02-06 Regeneron Pharmaceuticals, Inc. Multivalent antigen-binding proteins

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US20020062010A1 (en) 1997-05-02 2002-05-23 Genentech, Inc. Method for making multispecific antibodies having heteromultimeric and common components
US6800457B2 (en) 1998-09-22 2004-10-05 Bristol-Myers Squibb Company Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
US6406863B1 (en) 2000-06-23 2002-06-18 Genetastix Corporation High throughput generation and screening of fully human antibody repertoire in yeast
DK1531666T3 (da) 2002-05-29 2014-01-13 Regeneron Pharma Inducerbart eukaryot-ekspressionssystem
US20050019925A1 (en) 2002-11-14 2005-01-27 Genentech, Inc. Intron fusion construct and method of using for selecting high-expressing production cell lines
EP3050963B1 (en) 2005-03-31 2019-09-18 Chugai Seiyaku Kabushiki Kaisha Process for production of polypeptide by regulation of assembly
JP5474531B2 (ja) 2006-03-24 2014-04-16 メルク パテント ゲゼルシャフト ミット ベシュレンクテル ハフツング 操作されたヘテロ二量体タンパク質ドメイン
PL2041177T3 (pl) 2006-06-02 2012-09-28 Regeneron Pharma Przeciwciała o wysokim powinowactwie przeciw ludzkiemu receptorowi IL 6
EP2115136A4 (en) 2006-12-21 2010-05-19 Glaxosmithkline Llc NOVEL PROCEDURE
WO2008089396A1 (en) 2007-01-19 2008-07-24 Invitrogen Corporation Compositions and methods for genetic manipulation and monitoring of cell lines
EP2626372B1 (en) 2007-03-29 2018-03-21 Genmab A/S Bispecific antibodies and methods for production thereof
HUE028536T2 (en) 2008-01-07 2016-12-28 Amgen Inc Method for producing antibody to FC heterodimer molecules using electrostatic control effects
EP3916011A1 (en) 2009-06-26 2021-12-01 Regeneron Pharmaceuticals, Inc. Readily isolated bispecific antibodies with native immunoglobulin format
CA2781519A1 (en) 2009-09-16 2011-03-24 Genentech, Inc. Coiled coil and/or tether containing protein complexes and uses thereof
PT2560993T (pt) 2010-04-20 2024-09-16 Genmab As Proteínas contendo anticorpo heterodimérico fc e métodos para a produção das mesmas
MX338953B (es) 2010-08-16 2016-05-06 Novimmune Sa Metodos para la generacion de anticuerpos multiespecificos y multivalentes.
TW201823460A (zh) 2012-05-29 2018-07-01 美商再生元醫藥公司 生產細胞株增強子
JOP20200236A1 (ar) 2012-09-21 2017-06-16 Regeneron Pharma الأجسام المضادة لمضاد cd3 وجزيئات ربط الأنتيجين ثنائية التحديد التي تربط cd3 وcd20 واستخداماتها
TWI675044B (zh) 2012-11-14 2019-10-21 美商再生元醫藥公司 重組細胞表面捕捉蛋白質
TWI682941B (zh) * 2013-02-01 2020-01-21 美商再生元醫藥公司 含嵌合恆定區之抗體
US20140308285A1 (en) 2013-03-15 2014-10-16 Amgen Inc. Heterodimeric bispecific antibodies
TWI670283B (zh) 2013-12-23 2019-09-01 美商建南德克公司 抗體及使用方法
TWI754319B (zh) 2014-03-19 2022-02-01 美商再生元醫藥公司 用於腫瘤治療之方法及抗體組成物
MX2017005306A (es) 2014-10-23 2018-01-09 Regeneron Pharma Novedosos sitios de integracion en celulas cho y usos de estos.
ES2901133T3 (es) 2015-09-23 2022-03-21 Regeneron Pharma Anticuerpos biespecíficos anti-CD3 optimizados y usos de los mismos
CA3015389A1 (en) * 2016-04-20 2017-10-26 Regeneron Pharmaceuticals, Inc. Compositions and methods for making antibodies based on use of expression-enhancing loci

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008151219A1 (en) * 2007-06-04 2008-12-11 Regeneron Pharmaceuticals, Inc. Enhanced expression and stability regions
WO2010141478A1 (en) * 2009-06-02 2010-12-09 Regeneron Pharmaceuticals, Inc. Fucosylation-deficient cells
CN102575264A (zh) * 2009-09-18 2012-07-11 瑟莱克斯公司 增加的转基因表达和加工的产品和方法
WO2013190032A1 (en) * 2012-06-22 2013-12-27 Lonza Biologics Plc Site-specific integration
WO2014022540A1 (en) * 2012-08-02 2014-02-06 Regeneron Pharmaceuticals, Inc. Multivalent antigen-binding proteins

Also Published As

Publication number Publication date
TW201803986A (zh) 2018-02-01
JP2019515666A (ja) 2019-06-13
IL262266B1 (en) 2024-09-01
US20190233544A1 (en) 2019-08-01
CN116515757A (zh) 2023-08-01
EP3445781A1 (en) 2019-02-27
KR20180134893A (ko) 2018-12-19
WO2017184832A1 (en) 2017-10-26
US11512144B2 (en) 2022-11-29
BR112018071283A2 (pt) 2019-02-12
JP2024023449A (ja) 2024-02-21
KR20230098361A (ko) 2023-07-03
JP7096770B2 (ja) 2022-07-06
TW202415767A (zh) 2024-04-16
CN109195986A (zh) 2019-01-11
AU2024220124A1 (en) 2024-10-17
KR102547738B1 (ko) 2023-06-26
US20230130799A1 (en) 2023-04-27
AR109451A1 (es) 2018-12-12
IL262266A (en) 2018-11-29
SG11201807885PA (en) 2018-10-30
EA201892010A1 (ru) 2019-03-29
AU2017253241B2 (en) 2024-07-04
MX2018012868A (es) 2019-03-11
IL314779A (en) 2024-10-01
JP2021164479A (ja) 2021-10-14
CA3015389A1 (en) 2017-10-26
TWI827531B (zh) 2024-01-01
AU2017253241A1 (en) 2018-09-20
SG10202010155YA (en) 2020-11-27

Similar Documents

Publication Publication Date Title
US20230322956A1 (en) Compositions and methods for making antibodies based on use of an expression-enhancing locus
CN109195986B (zh) 基于使用表达增强性基因座来制备抗体的组合物和方法
US20230151392A1 (en) Safe harbor loci
EA044725B1 (ru) Композиции и способы получения антител, основанные на применении локусов, обеспечивающих повышенную экспрессию
EA046654B1 (ru) Композиции и способы получения антител, основанные на применении локусов, обеспечивающих повышенную экспрессию

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant