CN110055593A - 与样品相关的多核苷酸的鉴定 - Google Patents

与样品相关的多核苷酸的鉴定 Download PDF

Info

Publication number
CN110055593A
CN110055593A CN201910010319.5A CN201910010319A CN110055593A CN 110055593 A CN110055593 A CN 110055593A CN 201910010319 A CN201910010319 A CN 201910010319A CN 110055593 A CN110055593 A CN 110055593A
Authority
CN
China
Prior art keywords
region
polynucleotides
sample
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910010319.5A
Other languages
English (en)
Inventor
W·H·罗宾森
陈衍璁
J·索科洛芙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leland Stanford Junior University
US Department of Veterans Affairs VA
Original Assignee
Leland Stanford Junior University
US Department of Veterans Affairs VA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leland Stanford Junior University, US Department of Veterans Affairs VA filed Critical Leland Stanford Junior University
Publication of CN110055593A publication Critical patent/CN110055593A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1203Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria
    • C07K16/1242Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria from Pasteurellaceae (F), e.g. Haemophilus influenza
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1267Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria
    • C07K16/1271Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria from Micrococcaceae (F), e.g. Staphylococcus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/76Antagonist effect on antigen, e.g. neutralization or inhibition of binding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/10Oligonucleotides as tagging agents for labelling antibodies
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Abstract

本文公开了用于测序、分析和利用样品如单一样品的组合物和方法。本文还公开了用于将来自样品的两个或更多个序列匹配在一起的组合物和方法。本文还公开了用于表达和筛选目标分子的组合物和方法。

Description

与样品相关的多核苷酸的鉴定
本申请是申请日为2012年04月27日和发明名称为“与样品相 关的多核苷酸的鉴定”的201280031099.0号发明专利申请的分案申 请。
相关申请的交叉引用
本申请与2011年4月28日提交的美国临时专利申请61/517,976 号、2011年8月24日提交的美国临时专利申请61/575,652号、2012 年2月16日提交的美国临时专利申请61/599,870号和2012年3月8 日提交的美国临时专利申请61/608,571号有关,其公开内容为所有 目的通过引用并入本文。
有关联邦赞助研究或开发的声明
本发明是利用由美国国立卫生研究院国家心肺和血液研究中心 给予的N01-HV-28183 NHLBI蛋白质组学中心和N01-HV-00242蛋 白质组学中心的政府支持而完成的。政府在本发明中具有某些权利。
序列表
本申请包含“冗长”的序列表,其通过CD-R提交以代替打印的纸 件,且通过引用全部并入本文中。刻录于2012年4月25目的所述 CD-R分别标记为“CRF”、“Copy 1-SEQUENCELISTING PART”、 “Copy 2-SEQUENCE LISTING PART”和“Copy 3-SEQUENCE LISTINGPART”,且各包含名称为 20786PCT_CRF_Sequencelising.EXE的单一自解压文件(138,571,776 字节),其随之包含名称为20786PCT_CRF_Sequencelisting.TXT的一 个未压缩的ASCII文本文件(795,566,080字节)。
背景技术
从人类来源产生治疗性的单克隆抗体是生物学和技术方面的挑 战。迄今为止,已经描述了几种方法,包括产生人杂交瘤、使用表 达人免疫球蛋白的转基因小鼠和使用人免疫球蛋白噬菌体展示文 库。
人杂交瘤可能难以产生,因为人骨髓瘤融合伴体与其小鼠对应 物不同,它在产生杂交瘤方面是无效的。人杂交瘤还具有在持续的 培养后自发丧失所表达的抗体基因的倾向。埃-巴二氏病毒(EBV)转 化使B细胞永生化,但所有EBV-转化的B细胞中仅极少的部分是亲 和力成熟的或识别靶抗原。杂交瘤的产生通常包括大量的筛选以获 得治疗性单克隆抗体。当前被美国FDA批准的治疗性单克隆抗体中 没有一种是通过人杂交瘤的生成或B细胞的EBV-转化而产生的,这 也证明了这些方法所面临的技术难题和挑战。
人抗体序列的噬菌体展示文库代表了用于产生治疗性人单克隆 抗体的另一种方法。这一方法利用重组DNA技术以随机地共同表达 人抗体重链和轻链序列以使得能够筛选结合靶抗原的组合。但是, 这一策略没有产生亲和力成熟的抗体,且以这种方式产生的抗体经 常以低亲和力和亲抗原性与抗原结合。然后需要后续的突变和选择/ 筛选步骤以产生高亲和力的抗体。
产生治疗性人单克隆抗体的另一种方式是通过产生或利用具有 人抗体谱(antibody repertoire)的转基因小鼠。当免疫时,这种小鼠 产生靶向于免疫的抗原的抗体,且随后可以产生杂交瘤以用于产生 治疗性人单克隆抗体。这种转基因小鼠是专有的且通常不可用于产 生人抗体。
因此本发明认识到对于例如可产生大量的亲和力成熟的人抗体 的组合物、试剂盒和方法的需要,从而避免了繁重和耗时的抗体人 源化的需要或进行大量筛选的需要。本文描述的组合物、试剂盒和 方法满足了这一需要。另外,本文描述的组合物、方便和方法可广 泛地应用于人抗体领域之外且可以用于多种不同的应用中,包括例 如,将源自于单一样品和存在于多核苷酸文库中的两个或更多个目 标多核苷酸匹配在一起。
发明内容
本文公开了包含多核苷酸的组合物,其中所述多核苷酸包含第 一区域和第二区域,其中所述第一区域包含表达的B细胞可变免疫 球蛋白区域和所述第二区域包含至少一个识别区域,且其中所述第 一区域与所述第二区域偶联。
在一些方面,所述可变免疫球蛋白区域包含从直径大于或等于8 μm的活化人B细胞分离的IgG免疫球蛋白核苷酸序列的VDJ区域, 且其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶联。在 一些方面,所述组合物包括在克隆家族(clonal family)中。
在一些方面,所述免疫球蛋白区域从B细胞分离,且其中所述 B细胞是活化B细胞。在一些方面,所述免疫球蛋白区域从B细胞 分离,且其中所述B细胞是浆母细胞。在一些方面,所述免疫球蛋 白区域从B细胞分离,且其中所述B细胞是单一B细胞。在一些方 面,所述免疫球蛋白区域从B细胞分离,且其中所述B细胞是单一 活化B细胞。在一些方面,所述免疫球蛋白区域从B细胞分离,且 其中所述B细胞是位于受试者的血液中的单一活化B细胞。在一些 方面,所述免疫球蛋白区域从B细胞分离,且其中所述B细胞是人 活化B细胞。在一些方面,所述免疫球蛋白区域从B细胞分离,且 其中所述B细胞是记忆B细胞。在一些方面,所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是浆细胞。在一些方面,所述免 疫球蛋白区域从B细胞分离,且其中所述B细胞是抗原特异性B细 胞。在一些方面,所述免疫球蛋白区域从哺乳动物B细胞分离。在 一些方面,所述免疫球蛋白区域从人B细胞分离。在一些方面,所 述免疫球蛋白区域从小鼠B细胞分离。在一些方面,所述免疫球蛋 白区域从来自于患有关注的疾病或病症的受试者的B细胞分离。在 一些方面,所述免疫球蛋白区域从来自于正从关注的疾病或病症恢 复或已从关注的疾病或病症恢复的受试者的B细胞分离。在一些方 面,所述免疫球蛋白区域从来自于施用至少一种目标抗原的受试者 的B细胞分离。在一些方面,所述免疫球蛋白区域从来自于施用至 少一种目标抗原和佐剂的受试者的B细胞分离。在一些方面,所述 免疫球蛋白区域从位于受试者的血液中的B细胞分离。在一些方面, 所述免疫球蛋白区域从位于受试者的骨髓中的B细胞分离。在一些 方面,所述免疫球蛋白区域从位于受试者的脾中的B细胞分离。在 一些方面,所述免疫球蛋白区域从位于受试者的至少一个淋巴结中 的B细胞分离。在一些方面,所述免疫球蛋白区域从位于受试者的 淋巴组织中的B细胞分离。在一些方面,所述免疫球蛋白区域从位 于受试者的肠中的B细胞分离。在一些方面,所述免疫球蛋白区域 从直径为约8-20μm的活化B细胞分离。在一些方面,所述免疫球 蛋白区域从直径为8、9、10、11、12、13、14、15、16、17、18、 19、20或大于20μm的活化B细胞分离。在一些方面,所述免疫球 蛋白区域从面积为约60、70、80、90、100、120、130、140、150、 200、250、300、350或大于350μm2的活化B细胞分离。在一些方 面,所述免疫球蛋白区域从体积为约250、268、300、400、500、600、 700、800、900、1000、2000、3000、4000或大于4000μm3的活化B 细胞分离。在一些方面,所述免疫球蛋白区域从直径尺寸比对照静 息B细胞的中值直径大10%或更大的活化B细胞分离。在一些方面, 所述免疫球蛋白区域从直径尺寸比对照静息B细胞的中值直径大 15%或更大的活化B细胞分离。在一些方面,所述免疫球蛋白区域 从直径尺寸比对照静息B细胞的中值直径大20%或更大的活化B细 胞分离。在一些方面,所述免疫球蛋白区域从能够分泌免疫球蛋白 的活化B细胞分离。在一些方面,所述免疫球蛋白区域从处于细胞 周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝分裂期(M) 的B细胞分离。在一些方面,所述免疫球蛋白区域从非处于细胞周期的静息期(G0)的B细胞分离。在一些方面,所述免疫球蛋白区域 从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的 1.2倍的FSC的B细胞分离。在一些方面,所述免疫球蛋白区域从 通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15倍 的FSC平均值的B细胞分离。在一些方面,所述免疫球蛋白区域从 单一CD19阳性B细胞分离。在一些方面,所述免疫球蛋白区域从 单一CD38阳性B细胞分离。在一些方面,所述免疫球蛋白区域从 单一CD27阳性B细胞分离。在一些方面,所述免疫球蛋白区域从 单一CD20阴性B细胞分离。在一些方面,所述免疫球蛋白区域从 单一CD19+CD20-CD27+CD38hiB细胞分离。
在一些方面,所述免疫球蛋白区域的5’端与所述识别区域的3’ 端偶联。
在一些方面,所述可变免疫球蛋白区域包含免疫球蛋白核苷酸 序列的VDJ区域。在一些方面,所述可变免疫球蛋白区域包含免疫 球蛋白核苷酸序列的VJ区域。在一些方面,所述可变免疫球蛋白区 域包含免疫球蛋白核苷酸序列的V、D和/或J区域。在一些方面,所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的重链和/或轻 链。在一些方面,所述可变免疫球蛋白区域包含IgG、IgM、IgD、 IgE或IgA免疫球蛋白序列。在一些方面,所述可变免疫球蛋白区域 包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。在一些方面, 所述可变免疫球蛋白区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免 疫球蛋白序列。在一些方面,所述免疫球蛋白区域长度为约200-2000 个核苷酸。在一些方面,所述免疫球蛋白区域长度为小于200、200、 300、400、500、600、700、800、900、1000、1100、1200、1300、 1400、1500、1600、1700、1800、1900、2000或大于2000个核苷酸。
在一些方面,所述识别区域包含多个识别区域。在一些方面, 所述识别区域包含多个识别区域,且其中该多个识别区域中的各识 别区域具有独特的序列。在一些方面,所述识别区域包含至少一个 样品识别区域和至少一个板识别区域(plate identificationregion)。在 一些方面,所述识别区域包含与所述免疫球蛋白区域的序列不同的 序列。在一些方面,所述识别区域长度为约2-100个核苷酸。在一些 方面,所述识别区域长度为2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、 100或大于100个核苷酸。在一些方面,所述识别区域长度为2-1,000 个核苷酸。在一些方面,所述识别区域长度等于或大于100个核苷 酸。在一些方面,所述识别区域包含连续的非编码核苷酸序列。在 一些方面,所述识别区域包含非编码核苷酸序列。在一些方面,所 述识别区域包含非连续的非编码核苷酸序列。在一些方面,所述识 别区域的序列长度小于所述免疫球蛋白区域的序列长度。
在一些方面,本文描述的组合物可以包括第三区域,其中所述 第三区域包含接合体区域。在一些方面,所述第三区域包含接合体 区域,且其中所述第三区域位于所述第一区域和所述第二区域之间。 在一些方面,所述第三区域包含接合体区域,且其中所述接合体区 域包含位于其3’端的至少一个G核苷酸。
在一些方面,所述识别区域为2-100个核苷酸长并具有不同于所 述免疫球蛋白区域序列的序列,且其中所述接合体区域包含在其3’ 端的至少一个G核苷酸并位于所述样品识别区域的3’侧和所述免疫 球蛋白区域的5’侧,且其中所述可变免疫球蛋白区域已发生超变而 不同于原始B细胞的种系序列。
在一些方面,所述组合物存在于容器中。在一些方面,多个所 述组合物存在于容器中。在一些方面,多个所述组合物存在于包含 多个孔的单一板的单一孔中。
在一些方面,所述组合物处于组合物文库中,其中各组合物存 在于单独的容器中,其中各组合物包含含有第一区域和第二区域的 多核苷酸,其中所述第一区域包含表达的B细胞可变免疫球蛋白区 域和所述第二区域包含识别区域,其中所述第一区域与所述第二区 域偶联,其中各识别区域的核苷酸序列不同于文库中存在的其它识 别区域的核苷酸序列,且文库中的多个可变免疫球蛋白区域的最后 核苷酸序列共有至少80-99%的序列同一性。
在一些方面,所述组合物包括在包含多个多核苷酸组合物的文 库中,其中各组合物存在于单独的容器中,其中各组合物包含多核 苷酸,其中所述多核苷酸包含第一区域和第二区域,其中所述第一 区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识 别区域,其中所述第一区域与所述第二区域偶联,且其中各识别区 域的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的 核苷酸序列。
本文还描述了包含多个多核苷酸组合物的多核苷酸组合物文 库,其中各组合物存在于单独的容器中,其中各组合物包含多核苷 酸,其中所述多核苷酸包含第一区域和第二区域,其中所述第一区 域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别 区域,其中所述第一区域与所述第二区域偶联,且其中各识别区域 的核苷酸序列不同于文库中各单独容器中存在的其它识别区域的核 苷酸序列。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中所述多 个多核苷酸的各多核苷酸存在于单独的容器中,其中所述多个多核 苷酸的各多核苷酸包含第一区域和第二区域,其中所述第一区域包 含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区 域,其中所述第一区域与所述第二区域偶联,其中各识别区域的核 苷酸序列不同于文库中存在的其它识别区域的核苷酸序列,且其中 所述多个多核苷酸中的至少两个可变免疫球蛋白区域共有至少 80-99%的序列同一性。
本文还描述了包含多核苷酸的克隆家族的多核苷酸文库,其中 所述文库中的各多核苷酸包含第一区域和第二区域,其中所述第一 区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识 别区域,其中所述第一区域与所述第二区域偶联,其中各识别区域 的核苷酸序列不同于家族中存在的其它识别区域的核苷酸序列,且 其中家族中的各可变免疫球蛋白区域表现出至少80-99%的序列同一 性。在一些方面,所述文库包含多个克隆家族。
本文还描述了免疫球蛋白序列的克隆家族,其中家族中的各序 列与识别区域偶联。在一些方面,各识别区域不同于其它识别区域。 在一些方面,所述免疫球蛋白序列包含重链免疫球蛋白序列。在一 些方面,所述免疫球蛋白序列包含轻链免疫球蛋白序列。在一些方 面,所述免疫球蛋白序列包含重链和轻链免疫球蛋白序列。在一些 方面,一个或多个所述识别区域包含轻链免疫球蛋白序列。在一些 方面,一个或多个所述识别区域包含重链免疫球蛋白序列。
本文还描述了本文所述的两个或更多个克隆家族的集合。
本文还描述了本文所述的2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19、20或更多个克隆家族的集合。
本文还描述了免疫球蛋白序列的克隆家族,其中所述家族中的 各序列可操作地与至少一个连续核苷酸序列偶联。在一些方面,所 述免疫球蛋白序列包含重链免疫球蛋白序列且所述的至少一个连续 核苷酸序列包含轻链免疫球蛋白序列。在一些方面,所述免疫球蛋 白序列包含轻链免疫球蛋白序列且所述的至少一个连续核苷酸序列 包含重链免疫球蛋白序列。
本文还描述了用于产生免疫球蛋白序列的克隆家族的方法,包 括获得多个免疫球蛋白序列,其各具有V、D和/或J区域且各与识 别区域偶联;和将该多个免疫球蛋白序列中的两个或更多个序列分 组以产生所述克隆家族,其中所述克隆家族中的各序列是具有V、D 和/或J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D 和/或J区域的种系免疫球蛋白序列。
在一些方面,各识别区域不同于其它识别区域。
本文还描述了产生免疫球蛋白序列的克隆家族的方法,包括获 得多个免疫球蛋白序列,其各具有V、D和/或J区域且各与识别区 域偶联,且其中各识别区域不同于其它识别区域;去除一个或多个 识别区域;和将该多个免疫球蛋白序列中的两个或更多个序列分组 以产生所述克隆家族,其中所述克隆家族中的各序列是具有V、D 和/或J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D 和/或J区域的种系免疫球蛋白序列。
本文还描述了鉴别与第一识别区域偶联的第二cDNA的方法, 包括选择与所述第一识别区域偶联的第一cDNA和基于与各cDNA 偶联的识别区域的共有同一性鉴别所述第二cDNA。
本文还描述了产生第二核苷酸序列上的3’尾的方法,包括获得 第一核苷酸序列和使该第一核苷酸序列与在低于50℃的温度下具有 模板转换活性的热稳定的RNA酶H-反转录酶接触,其中所述接触产 生所述3’尾和所述第二核苷酸序列。在一些方面,所述第一核苷酸 序列在约低于50、49、48、47、46、45、44、43、42或低于42℃ 下接触。在一些方面,所述第一核苷酸序列在42℃下接触。在一些 方面,所述第一核苷酸序列在45.5℃下接触。在一些方面,所述转 录酶是莫洛尼鼠白血病病毒(MMLV)RNA酶H-反转录酶。在一些方 面,所述转录酶是SuperScript III。
本文还描述了确定第一目标序列的天然存在序列的方法,包括 获得与该第一序列相关且各与第一识别区域偶联的多个序列,其中 各第一识别区域是相同的,且其中所述多个序列中的一个或多个序 列不同于所述天然存在的序列;和比较所述多个序列中的序列以确 定所述第一目标序列的天然存在的序列。在一些方面,所述多个序 列包含免疫球蛋白序列。在一些方面,多个序列包含免疫球蛋白序 列。在一些方面,所述多个序列包含免疫球蛋白序列。在一些方面, 所述多个序列各与第二识别区域偶联且各第二识别区域是相同的。 在一些方面,所述第一目标序列是免疫球蛋白序列。在一些方面, 所述多个序列是免疫球蛋白序列。
本文还描述了包含多核苷酸的组合物,该多核苷酸包含第一区 域和第二区域,其中所述第一区域包含B细胞源的可变免疫球蛋白 区域和第二区域包含识别区域,且其中所述第一区域与所述第二区 域偶联。
本文还描述了包含多个多核苷酸组合物的多核苷酸组合物文 库,其中各组合物存在于单独的容器中,其中各组合物包含含有B 细胞源的可变免疫球蛋白区域和识别区域的多核苷酸,其中所述可 变免疫球蛋白区域与所述识别区域偶联,其中各识别区域的核苷酸 序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序 列。
本文还描述了用于产生多核苷酸组合物的方法,包括:获得包 含第一区域的多核苷酸,其中所述第一区域包含与受试者相关的表 达的B细胞可变免疫球蛋白区域;和通过将所述第一区域与第二区 域偶联产生包含第一区域和第二区域的多核苷酸组合物,其中所述 第二区域包含识别区域。
在一些方面,获得所述多核苷酸包括获得与受试者相关的B细 胞和处理该细胞以制备所述多核苷酸。在一些方面,获得所述多核 苷酸包括直接或间接地从已经处理与受试者相关的B细胞以制备所 述多核苷酸的第三方接收所述多核苷酸。在一些方面,获得所述多 核苷酸包括直接或间接地从已经溶解与受试者相关的B细胞以制备 所述多核苷酸的第三方接收所述多核苷酸。在一些方面,获得所述 多核苷酸包括使用流式细胞仪获得B细胞。在一些方面,获得所述 多核苷酸包括使用微流体装置获得B细胞。
在一些方面,所述可变免疫球蛋白区域包含IgG免疫球蛋白核 苷酸序列的VDJ区域,其从直径大于或等于8μm的活化人B细胞 分离,且其中所述免疫球蛋白区域的5’端与所述识别区域的3’端偶 联。在一些方面,所述组合物包括在克隆家族中。
在一些方面,所述免疫球蛋白区域从B细胞分离,且其中所述 B细胞是活化B细胞。在一些方面,所述免疫球蛋白区域从B细胞 分离,且其中所述B细胞是浆母细胞。在一些方面,所述免疫球蛋 白区域从B细胞分离,且其中所述B细胞是单一B细胞。在一些方 面,所述免疫球蛋白区域从B细胞分离,且其中所述B细胞是单一 活化B细胞。在一些方面,所述免疫球蛋白区域从B细胞分离,且 其中所述B细胞是位于受试者的血液中的单一活化B细胞。在一些 方面,所述免疫球蛋白区域从B细胞分离,且其中所述B细胞是人 活化B细胞。在一些方面,所述免疫球蛋白区域从B细胞分离,且 其中所述B细胞是记忆B细胞。在一些方面,所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是浆细胞。在一些方面,所述免 疫球蛋白区域从B细胞分离,且其中所述B细胞是抗原特异性B细 胞。在一些方面,所述免疫球蛋白区域从哺乳动物B细胞分离。在 一些方面,所述免疫球蛋白区域从人B细胞分离。在一些方面,所 述免疫球蛋白区域从小鼠B细胞分离。在一些方面,所述免疫球蛋 白区域从来自于患有关注的疾病或病症的受试者的B细胞分离。在 一些方面,所述免疫球蛋白区域从来自于受试者的B细胞分离,该 受试者正从关注的疾病或病症恢复或已经恢复。在一些方面,所述 免疫球蛋白区域从来自于施用至少一种目标抗原的受试者的B细胞 分离。在一些方面,所述免疫球蛋白区域从来自于施用至少一种目 标抗原和佐剂的受试者的B细胞分离。在一些方面,所述免疫球蛋 白区域从位于受试者的血液中的B细胞分离。在一些方面,所述免疫球蛋白区域从位于受试者的骨髓中的B细胞分离。在一些方面, 所述免疫球蛋白区域从位于受试者的脾中的B细胞分离。在一些方 面,所述免疫球蛋白区域从位于受试者的至少一个淋巴结中的B细 胞分离。在一些方面,所述免疫球蛋白区域从位于受试者的淋巴组 织中的B细胞分离。在一些方面,所述免疫球蛋白区域从位于受试 者的肠中的B细胞分离。在一些方面,所述免疫球蛋白区域从直径 为约8-20μm的活化B细胞分离。在一些方面,所述免疫球蛋白区 域从直径为8、9、10、11、12、13、14、15、16、17、18、19、20 或大于20μm的活化B细胞分离。在一些方面,所述免疫球蛋白区 域从面积为约60、70、80、90、100、120、130、140、150、200、 250、300、350或大于350μm2的活化B细胞分离。在一些方面,所 述免疫球蛋白区域从体积为约250、268、300、400、500、600、700、 800、900、1000、2000、3000、4000或大于4000μm3的活化B细胞 分离。在一些方面,所述免疫球蛋白区域从直径尺寸比对照静息B 细胞的中值直径大10%或更大的活化B细胞分离。在一些方面,所 述免疫球蛋白区域从直径尺寸大于对照静息B细胞的中值直径15% 或更大的活化B细胞分离。在一些方面,所述免疫球蛋白区域从直 径尺寸大于对照静息B细胞的中值直径20%或更大的活化B细胞分 离。在一些方面,所述免疫球蛋白区域从能够分泌免疫球蛋白的活 化B细胞分离。在一些方面,所述免疫球蛋白区域从处于细胞周期 的合成前期(G1)、合成期(S)、合成后期(G2)或有丝分裂期(M)的B细 胞分离。在一些方面,所述免疫球蛋白区域从非处于细胞周期的静 息期(G0)的B细胞分离。在一些方面,所述免疫球蛋白区域从通过 流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的1.2倍 的FSC的B细胞分离。在一些方面,所述免疫球蛋白区域从通过流 式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15倍的FSC 平均值的B细胞分离。在一些方面,所述免疫球蛋白区域从单一 CD19阳性B细胞分离。在一些方面,所述免疫球蛋白区域从单一 CD38阳性B细胞分离。在一些方面,所述免疫球蛋白区域从单一CD27阳性B细胞分离。在一些方面,所述免疫球蛋白区域从单一 CD20阴性B细胞分离。在一些方面,所述免疫球蛋白区域从单一 CD19+CD20-CD27+CD38hi B细胞分离。
在一些方面,所述免疫球蛋白区域的5’端与所述识别区域的3’ 端偶联。
在一些方面,所述可变免疫球蛋白区域包含免疫球蛋白核苷酸 序列的VDJ区域。在一些方面,所述可变免疫球蛋白区域包含免疫 球蛋白核苷酸序列的VJ区域。在一些方面,所述可变免疫球蛋白区 域包含免疫球蛋白核苷酸序列的V、D和/或J区域。在一些方面,所述可变免疫球蛋白区域包含免疫球蛋白核苷酸序列的重链和/或轻 链。在一些方面,所述可变免疫球蛋白区域包含IgG、IgM、IgD、 IgE或IgA免疫球蛋白序列。在一些方面,所述可变免疫球蛋白区域 包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。在一些方面, 所述可变免疫球蛋白区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免 疫球蛋白序列。在一些方面,所述免疫球蛋白区域长度为约200-2000 个核苷酸。在一些方面,所述免疫球蛋白区域长度为小于200、200、 300、400、500、600、700、800、900、1000、1100、1200、1300、 1400、1500、1600、1700、1800、1900、2000或大于2000个核苷酸。
在一些方面,所述识别区域包含多个识别区域。在一些方面, 所述识别区域包含多个识别区域,且其中该多个识别区域中的各识 别区域具有独特的序列。在一些方面,所述识别区域包含至少一个 样品识别区域和至少一个板识别区域。在一些方面,所述识别区域 包含与所述免疫球蛋白区域的序列不同的序列。在一些方面,所述 识别区域长度为约2-100个核苷酸。在一些方面,所述识别区域长度 为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、30、40、50、60、70、80、90、100或大于100个核苷 酸。在一些方面,所述识别区域长度为2-1,000个核苷酸。在一些方 面,所述识别区域长度等于或大于100个核苷酸。在一些方面,所 述识别区域包含连续的非编码核苷酸序列。在一些方面,所述识别 区域包含非编码核苷酸序列。在一些方面,所述识别区域包含非连 续的非编码核苷酸序列。在一些方面,所述识别区域的序列长度小 于所述免疫球蛋白区域的序列长度。
在一些方面,本文所述的组合物包含第三区域,其中所述第三 区域包含接合体区域。在一些方面,所述第三区域包含接合体区域, 且其中所述第三区域位于所述第一区域和所述第二区域之间。在一 些方面,所述第三区域包含接合体区域,且其中所述接合体区域包 含位于其3’端的至少一个G核苷酸。
在一些方面,所述识别区域为2-100个核苷酸长并具有不同于所 述免疫球蛋白区域序列的序列,且其中所述接合体区域在其3’端包 含至少一个G核苷酸并位于所述样品识别区域的3’侧和所述免疫球 蛋白区域的5’侧,且其中所述可变免疫球蛋白区域已发生超变且不 同于原始B细胞的种系序列。
在一些方面,所述组合物存在于容器中。在一些方面,多个所 述组合物存在于容器中。在一些方面,多个所述组合物存在于包含 多个孔的单一板的单一孔中。
在一些方面,所述组合物处于组合物文库中,其中各组合物存 在于单独的容器中,其中各组合物包含含有第一区域和第二区域的 多核苷酸,其中所述第一区域包含表达的B细胞可变免疫球蛋白区 域和所述第二区域包含识别区域,其中所述第一区域与所述第二区 域偶联,其中各识别区域的核苷酸序列不同于文库中存在的其它识 别区域的核苷酸序列,且文库中的多个可变免疫球蛋白区域的最后 核苷酸序列共有至少80-99%的序列同一性。
在一些方面,所述组合物包括在包含多个多核苷酸组合物的文 库中,其中各组合物存在于单独的容器中,其中各组合物包含多核 苷酸,其中所述多核苷酸包含第一区域和第二区域,其中所述第一 区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识 别区域,其中所述第一区域与所述第二区域偶联,且其中各识别区 域的核苷酸序列不同于文库中各单独的容器中存在的其它识别区域 的核苷酸序列。
本文还描述了用于产生多核苷酸组合物的方法,包括:获得与 受试者相关的B细胞;从包含表达的B细胞可变免疫球蛋白区域的 所述细胞分离多核苷酸;和通过将所述可变免疫球蛋白区域与识别 区域偶联产生包含所述可变免疫球蛋白区域和识别区域的多核苷酸 组合物。
本文还描述了用于产生多核苷酸组合物的方法,包括:获得包 含受试者相关的B细胞源的可变免疫球蛋白区域的多核苷酸;和通 过将所述可变免疫球蛋白区域与识别区域偶联产生包含所述可变免 疫球蛋白区域和识别区域的多核苷酸组合物。
在一些方面,获得所述多核苷酸包括获得B细胞和处理该细胞 以制备所述多核苷酸。在一些方面,获得所述多核苷酸包括直接或 间接地从已经处理B细胞以制备所述多核苷酸的第三方接收所述多 核苷酸。
本文还描述了用于产生两个或更多个多核苷酸组合物的方法, 包括:获得包含与从一个或多个受试者获得的多个样品相关的多个 多核苷酸的多核苷酸文库,其中一个或多个多核苷酸包含表达的B 细胞可变免疫球蛋白区域,其中各样品与B细胞相关,且其中与各 样品相关的各多核苷酸存在于单独的容器中;和通过将所述多核苷 酸与所述识别区域偶联产生两个或更多个多核苷酸组合物,该多核 苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和识别区域, 其中各识别区域的序列不同于与文库中其它多核苷酸偶联的识别区 域的序列。
在一些方面,获得所述多核苷酸文库包括获得多个B细胞并处 理该细胞以制备所述多核苷酸文库。在一些方面,获得所述多核苷 酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷 酸文库的第三方接收所述多核苷酸文库。
本文还描述了用于产生两个或更多个多核苷酸组合物的方法, 包括:获得包含与从一个或多个受试者获得的多个样品相关的多个 多核苷酸的多核苷酸文库,其中一个或多个多核苷酸包含B细胞源 的可变免疫球蛋白区域,且其中与各样品相关的各多核苷酸存在于 单独的容器中;和通过将所述多核苷酸与所述识别区域偶联产生两 个或更多个多核苷酸组合物,该多核苷酸组合物各包含来自所述多 个多核苷酸的多核苷酸和识别区域,其中各识别区域的序列不同于 与文库中其它多核苷酸偶联的识别区域的序列。
在一些方面,获得所述多核苷酸文库包括获得多个B细胞并处 理该细胞以制备所述多核苷酸文库。在一些方面,获得所述多核苷 酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷 酸文库的第三方接收所述多核苷酸文库。
本文还描述了包含多个多核苷酸组合物的多核苷酸组合物文 库,其中各组合物存在于单独的容器中,其中各组合物包含单一样 品来源的eDNA区域和样品识别-接合体区域,所述cDNA区域包含 在该eDNA区域的3’端的核苷酸C,所述样品识别-接合体区域包含与接合体区域偶联的样品识别区域,其中各样品识别-接合体区域的 所述样品识别区域的核苷酸序列不同于文库中各单独的容器中存在 的其它样品识别-接合体区域的样品识别区域的核苷酸序列,其中所 述接合体区域包含在所述接合体区域的3’端的核苷酸G,且其中所 述样品识别-接合体区域通过所述C和G之间的结合连接于所述 cDNA区域。
在一些方面,所述cDNA区域包含与DNA多核苷酸杂交的RNA 多核苷酸。在一些方面,所述cDNA区域包含与cDNA多核苷酸杂 交的mRNA多核苷酸。在一些方面,所述cDNA区域包含在3’端的 至少一个C和其中所述接合体区域包含在3’端的至少一个G。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含样品识别区域、接合体区域和单一样品来源的cDNA区域, 其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中 所述cDNA区域与所述接合体区域的3’端偶联,其中来自第一单一 样品的各多核苷酸的样品识别区域的序列不同于来自于与所述第一 单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别 区域的序列,且其中所述样品识别区域是双链的。在一些方面,各 多核苷酸包含多个样品识别区域。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一 样品的扩增子区域,其中所述通用引物区域的3’端与所述样品识别 区域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域 的5’端偶联,其中所述扩增子区域可操作地与所述接合体区域偶联, 其中所述通用引物区域的序列在所述多个多核苷酸中的各多核苷酸 上是基本上相同的,且其中来自第一单一样品的各多核苷酸的所述 样品识别区域的序列不同于来自于与所述第一单一样品不同的一个 或多个样品的文库中其它多核苷酸的样品识别区域的序列。
在一些方面,所述扩增子区域的5’端与所述接合体区域的3’端 偶联,其中所述通用引物区域包含序列 CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。在一些方面,所述通用引物区域的序列不与任何人基因外 显子完全互补,且其中所述通用引物区域具有不干扰所述接合体区 域的最小二级结构。在一些方面,所述通用引物区域是序列 CACGACCGGTGCTCGATTTAG。在一些方面,所述扩增子区域包 含含有cDNA核苷酸序列的cDNA区域。在一些方面,来自于第一 单一样品的各多核苷酸的所述样品识别区域的序列与来自于与所述 第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品 识别区域的序列具有至少一个核苷酸的不同。在一些方面,来自于 第一单一样品的各多核苷酸的所述样品识别区域的序列与来自于与 所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的 样品识别区域的序列具有至少2个核苷酸的不同。在一些方面,所 述样品识别区域长度为至少10个核苷酸。在一些方面,所述样品识 别区域长度为至少1个核苷酸。在一些方面,各样品识别区域的序 列选自表2和7。在一些方面,所述接合体区域的序列包含在其3’ 端的至少一个G核苷酸。在一些方面,所述扩增子区域包含免疫球 蛋白重链扩增子序列、免疫球蛋白轻链扩增子序列、T细胞受体α 扩增子序列或T细胞受体β扩增子序列。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含序列5’-A-B-C-D-3’,其中A是通用引物区域,其中B是样 品识别区域,其中C是接合体区域,其中D是来自于单一样品的扩 增子区域,其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的,且其中来自第一单一样品的各多核苷 酸的所述样品识别区域的序列不同于来自与所述第一单一样品不同 的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。
本文还描述了包含通用引物区域、样品识别区域、接合体区域 和来自于单一样品的扩增子区域的多核苷酸,其中所述通用引物区 域的3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域 的3’端与所述接合体区域的5’端偶联,且其中所述扩增子区域可操 作地与所述接合体区域偶联。
在一些方面,所述扩增子区域的5’端与所述接合体区域的3’端 偶联,其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG, 且其中所述接合体区域包含至少一个G。
本文还描述了包含序列5’-A-B-C-D-3’的多核苷酸,其中A是通 用引物区域,其中B是样品识别区域,其中C是接合体区域,且其 中D是来自于单一样品的扩增子区域。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含第一板识别区域、通用引物区域、样品识别区域、接合体 区域和来自于单一样品的扩增子区域,其中所述通用引物区域的3’ 端与所述样品识别区域的5’端偶联,其中所述样品识别区域的3’端 与所述接合体区域的5’端偶联,其中所述第一板识别区域可操作地 与所述通用引物区域偶联,其中所述扩增子区域可操作地与所述接 合体区域偶联,其中所述通用引物区域的序列在所述多个多核苷酸 的各多核苷酸上是基本上相同的,且其中来自第一单一样品的各多 核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样 品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的 序列。
在一些方面,来自第一组单一样品的各多核苷酸的所述第一板 识别区域的序列不同于来自于与所述第一组单一样品不同的一个或 多个单一样品组的文库中其它多核苷酸的第一板识别区域的序列。 在一些方面,来自第一组单一样品的各多核苷酸的所述第一板识别 区域的序列与来自于与所述第一组单一样品不同的一个或多个单一 样品组的文库中其它多核苷酸的第一板识别区域的序列具有至少一 个核苷酸的不同。在一些方面,来自第一组单一样品的各多核苷酸 的所述第一板识别区域的序列与来自于与所述第一组单一样品不同 的一个或多个单一样品组的文库中其它多核苷酸的第一板识别区域 的序列具有至少2个核苷酸的不同。在一些方面,所述第一板识别 区域长度为至少10个多核苷酸。在一些方面,所述第一板识别区域 的序列选自表3和6。在一些方面,所述第一板识别区域的3’端与所 述通用引物区域的5’端偶联,其中所述扩增子区域的5’端与所述接 合体区域的3’端偶联,其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG,其中所述接合体区域包含至少一 个G,其中各多核苷酸进一步包含第二板识别区域、第一测序区域 和第二测序区域,其中所述第二板识别区域的5’端与所述扩增子区 域的3’端偶联,其中所述第一测序区域的3’端与所述第一板识别区 域的5’端偶联,且其中所述第二测序区域的5’端与所述第二板识别 区域的3’端偶联。在一些方面,所述第二板识别区域的序列与各多 核苷酸上所述第一板识别区域的序列相同。在一些方面,来自第一 组单一样品的各多核苷酸的所述第二板识别区域的序列不同于来自 于与所述第一组单一样品不同的一个或多个单一样品组的文库中其 它多核苷酸的第二板识别区域的序列。在一些方面,来自第一组单 一样品的各多核苷酸的所述第二板识别区域的序列与来自于与所述 第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷 酸的第二板识别区域的序列具有至少一个多核苷酸的不同。在一些 方面,来自第一组单一样品的各多核苷酸的所述第二板识别区域的 序列与来自于与所述第一组单一样品不同的一个或多个单一样品组 的文库中其它多核苷酸的第二板识别区域的序列具有至少2个多核 苷酸的不同。在一些方面,所述第二板识别区域长度为至少10个多 核苷酸。在一些方面,所述第二板识别区域的序列选自表3和6。在 一些方面,所述第一测序区域包含 GAGAGACTGACAGCGTATCGCCTCCCTCGCGCCATCAG。在一些 方面,所述第二测序区域包含 CTATGCGCCTTGCCAGCCCGCTCAG。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含序列5’-A-B-C-D-3’,其中A是板识别区域,其中B是通用 引物区域,其中C是样品识别区域,其中D是接合体区域,其中E 是来自于单一样品的扩增子区域,且其中所述通用引物区域的序列 在所述多个多核苷酸的各多核苷酸上是基本上相同的,且其中来自 第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自 于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷 酸的样品识别区域的序列。
本文还描述了包含第一板识别区域、通用引物区域、样品识别 区域、接合体区域和来自于单一样品的扩增子区域的多核苷酸,其 中所述通用引物区域的3’端与所述样品识别区域的5’端偶联,其中 所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中所述 第一板识别区域可操作地与所述通用引物区域偶联,且其中所述扩 增子区域可操作地与所述接合体区域偶联。
在一些方面,所述第一板识别区域的3’端与所述通用引物区域 的5’端偶联,其中所述扩增子区域的5’端与所述接合体区域的3’端 偶联,其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG, 其中所述接合体区域包含至少一个G,其中各多核苷酸进一步包含 第二板识别区域、第一测序区域和第二测序区域,其中所述第二板 识别区域的5’端与所述扩增子区域的3’端偶联,其中所述第一测序 区域的3’端与所述第一板识别区域的5’端偶联,且其中所述第二测 序区域的5’端与所述第二板识别区域的3’端偶联。
本文还描述了包含序列5’-A-B-C-D-E-3’的多核苷酸,其中A是 板识别区域,其中B是通用引物区域,其中C是样品识别区域,其 中D是接合体区域,且其中E是来自于单一样品的扩增子区域。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含第一限制性位点区域、通用引物区域、样品识别区域、接 合体区域、来自于单一样品的扩增子区域和第二限制性位点区域, 其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联,其 中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中所 述第一限制性位点区域可操作地与所述通用引物区域偶联,其中所 述扩增子区域可操作地与所述接合体区域偶联,其中所述第二限制 性位点区域可操作地与所述扩增子区域偶联,其中所述通用引物区 域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的,且 其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不 同于来自于与所述第一单一样品不同的一个或多个样品的文库中其 它多核苷酸的样品识别区域的序列。
在一些方面,所述第一限制性位点区域包含一个或多个限制性 位点。在一些方面,所述第一限制性位点区域包含选自NheI、XhoI、 BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、KpnI、Acc65I、 XmaI、BstEII、DraIII、PacI、FseI、AsiSI和AscI的一个或多个限制 性位点。在一些方面,所述第二限制性位点区域包含一个或多个限 制性位点。在一些方面,所述第二限制性位点区域包含选自NheI、 XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、KpnI、 Acc65I、XmaI、BstEII、DraIII、PacI、FseI、AsiSI和AscI的一个或 多个限制性位点。在一些方面,所述第一限制性位点区域的3’端与 所述通用引物区域的5’端偶联,其中所述接合体区域的3’端与所述 扩增子区域的5’端偶联,其中所述扩增子区域的3’端与所述第二限 制性位点区域的5’端偶联,其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含序列5’-A-B-C-D-E-F-3’,其中A是第一限制性位点区域, 其中B是通用引物区域,其中C是样品识别区域,其中D是接合体 区域,其中E是来自于单一样品的扩增子区域,其中F是第二限制 性位点区域,其中所述通用引物区域的序列在所述多个多核苷酸的 各多核苷酸上是基本上相同的,且其中来自第一单一样品的各多核 苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品 不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序 列。
本文还描述了用于插入载体中的多核苷酸,其包含第一限制性 位点区域、通用引物区域、样品识别区域、接合体区域、来自于单 一样品的扩增子区域和第二限制性位点区域,其中所述通用引物区 域的3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域 的3’端与所述接合体区域的5’端偶联,其中所述第一限制性位点区 域可操作地与所述通用引物区域偶联,其中所述扩增子区域可操作 地与所述接合体区域偶联,且其中所述第二限制性位点区域可操作 地与所述扩增子区域偶联。
在一些方面,所述第一限制性位点区域的3’端与所述通用引物 区域的5’端偶联,其中所述接合体区域的3’端与所述扩增子区域的 5’端偶联,其中所述扩增子区域的3’端与所述第二限制性位点区域 的5’端偶联,其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
本文还描述了用于插入载体中的多核苷酸,包含序列 5’-A-B-C-D-E-F-3’,其中A是第一限制性位点区域,其中B是通用 引物区域,其中C是样品识别区域,其中D是接合体区域,其中E 是来自于单一样品的扩增子区域,和其中F是第二限制性位点区域。
本文还描述了多核苷酸接合体分子,其包含通用引物区域、样 品识别区域和接合体区域,其中所述通用引物区域的3’端与所述样 品识别区域的5’端偶联,且其中所述样品识别区域的3’端与所述接 合体区域的5’端偶联。在一些方面,所述通用引物区域包含CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
本文还描述了多核苷酸引物,其包含通用引物区域和板识别区 域,且其中所述板识别区域的3’端与所述通用引物区域的5’端偶联。 在一些方面,所述通用引物区域包含CACGACCGGTGCTCGATTTAG,其中所述引物进一步包含测序区 域,且其中所述测序区域的3’端与所述板识别区域的5’端偶联。
本文还描述了包含本文所述的多核苷酸的载体。在一些方面, 所述载体包含多个多核苷酸。在一些方面,所述载体选自pEE6.4和 pEE12.4。
本文还描述了分离的宿主细胞,其包含本文所述的载体或本文 所述的多核苷酸。在一些方面,所述宿主细胞选自CHO细胞、 CHO-K1细胞、CHO-S细胞、NS0细胞、为dhfr-的CHO细胞、 CHO-dhfr-、DUKX-B11CHO细胞和DG44CHO细胞。
本文还描述了用于产生一个或多个目标多核苷酸的方法,包括: 获得包含与从一个或多个受试者获得的多个样品相关的多个cDNA 的cDNA文库,其中各cDNA与所述多个样品中的单一样品相关, 且其中与各样品相关的各cDNA存在于单独的容器中;和将接合体分子添加到与各样品相关的cDNA上以产生所述一个或多个目标多 核苷酸,其中所述接合体分子包含样品识别区域和接合体区域,其 中所述样品识别区域的3’端与所述接合体区域的5’端偶联,且其中 各接合体分子的所述样品识别区域的序列不同于文库中添加到各cDNA上的其它接合体分子的样品识别区域的序列。
在一些方面,所述方法进一步包括使所述接合体区域的3’端连 接到所述文库中各cDNA的3’端以产生所述一个或多个目标多核苷 酸。在一些方面,获得所述cDNA文库包括获得所述多个样品和处 理所述样品以制备所述cDNA文库。在一些方面,所述接合体分子进一步包含通用引物区域,其中所述通用引物区域的3’端与所述样 品识别区域的5’端偶联。在一些方面,各cDNA区域包含与cDNA 多核苷酸杂交的mRNA多核苷酸。在一些方面,各样品包含细胞。 在一些方面,所述细胞是B细胞。在一些方面,所述B细胞是浆母 细胞、记忆B细胞或浆细胞。在一些方面,各样品包含多个细胞。 在一些方面,获得所述cDNA文库包括直接或间接地从已经处理所 述多个样品以制备所述cDNA文库的第三方接收所述cDNA文库。在一些方面,通过将所述接合体与在反转录反应过程中生成的cDNA 的3’尾退火而添加所述接合体。在一些方面,各cDNA包含至少一 个C核苷酸,其中C位于各cDNA的3’端,其中所述接合体区域包 含至少一个G核苷酸,其中G位于所述接合体区域的3’端,且其中 所述接合体区域通过所述G和C之间的结合连接到各cDNA上。在 一些方面,所述接合体分子是单链的,且进一步包括通过允许酶将 所述接合体分子形成为双链而将所述接合体分子并入到各cDNA中。 在一些方面,所述接合体分子通过MMLV H-反转录酶并入到各 cDNA中以产生所述目标多核苷酸。
本文还描述了产生一个或多个用于测序的目标多核苷酸的方 法,包括:获得包含多个多核苷酸的多核苷酸文库,其中各多核苷 酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样 品的扩增子区域,其中所述通用引物区域的3’端与所述样品识别区 域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的 5’端偶联,且其中所述扩增子区域可操作地与所述接合体区域偶联, 其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上 是基本上相同的,且其中来自第一单一样品的各多核苷酸的所述样 品识别区域的序列不同于来自于与所述第一单一样品不同的一个或 多个样品的文库中其它多核苷酸的样品识别区域的序列;和利用引 物组扩增所述多核苷酸文库以产生所述一个或多个用于测序的多核 苷酸,其中所述一个或多个用于测序的目标多核苷酸包含第一测序 区域、第一板识别区域、通用引物区域、样品识别区域、接合体区 域、来自于单一样品的扩增子区域和第二测序区域,其中所述通用 引物区域的3’端与所述样品识别区域的5’端偶联,其中所述样品识 别区域的3’端与所述接合体区域的5’端偶联,其中所述第一板识别 区域可操作地与所述通用引物区域偶联,其中所述扩增子区域可操 作地与所述接合体区域偶联,其中所述第一测序区域位于所述目标 多核苷酸的5’端,且其中所述第二测序区域位于所述目标多核苷酸 的3’端。
在一些方面,所述方法进一步包括对所述一个或多个目标多核 苷酸进行测序。在一些方面,所述方法进一步包括利用454测序对 所述一个或多个目标多核苷酸进行测序。在一些方面,所述方法进 一步包括利用SMRT测序对所述一个或多个目标多核苷酸进行测序。在一些方面,所述方法进一步包括利用SOLiD测序对所述一个 或多个目标多核苷酸进行测序。在一些方面,所述方法进一步包括 利用SOLEXA测序对所述一个或多个目标多核苷酸进行测序。在一 些方面,所述方法进一步包括利用tSMS测序对所述一个或多个目标 多核苷酸进行测序。在一些方面,所述引物组选自表1和5中所示 的引物。在一些方面,获得所述多核苷酸文库包括在实验室中制备 所述多核苷酸文库。在一些方面,获得所述多核苷酸文库包括直接 或间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸 文库。
本文还描述了用于分析测序数据的方法,包括:获得与多个多 核苷酸相关的数据集,其中所述数据集包含所述多个多核苷酸的测 序数据,其中所述多个多核苷酸中的各多核苷酸包含样品识别区域, 且其中各多核苷酸上的各样品识别区域对于单一样品是独特的,其 中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同 于来自于与所述第一单一样品不同的一个或多个样品的所述多个多 核苷酸中其它多核苷酸的样品识别区域的序列;和分析所述数据集 以将具有相同样品识别区域的多核苷酸匹配在一起,其中匹配表示 所述多核苷酸源自于相同的样品。
在一些方面,所述多个多核苷酸中的各多核苷酸还包含第一板 识别区域,其中在各多核苷酸上各第一板识别区域与样品识别区域 的各个组合对于单一样品是独特的,其中来自第一组单一样品的各 多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组 单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它 多核苷酸的第一板识别区域的序列;和进一步包括分析所述数据集 以将具有相同的第一板识别区域和相同的样品识别区域的多核苷酸 匹配在一起,其中两个区域的匹配表示所述多核苷酸源自于相同的 样品。在一些方面,获得所述数据集包括获得所述多个多核苷酸并 对所述多个多核苷酸测序以通过实验确定所述数据集。在一些方面, 获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序 以通过实验确定所述数据集的第三方接收所述数据集。在一些方面, 所述数据集存储在电子存储介质上。在一些方面,所述单一样品是 单一细胞。在一些方面,所述单一样品包含单一细胞。在一些方面, 所述单一样品包含单一B细胞。在一些方面,所述单一样品包含多 个B细胞。在一些方面,进一步包括选择一个或多个多核苷酸用于 克隆。
本文还描述了用于基于第一目标多核苷酸的选择识别第二目标 多核苷酸的方法,包括:获得与多个多核苷酸相关的数据集,其中 所述数据集包含所述多个多核苷酸的测序数据,其中所述多个多核 苷酸的各多核苷酸包含样品识别区域,且其中各多核苷酸上的各样 品识别区域对于单一样品是独特的,从而将所述多个多核苷酸中的 各多核苷酸与独特的单一样品相关联,其中来自第一单一样品的各 多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一 样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的 样品识别区域的序列;和从所述数据集选择与第一单一样品相关的 第一目标多核苷酸和基于所述第一目标多核苷酸的样品识别区域识 别所述第一单一样品中的第二目标多核苷酸。
在一些方面,所述多个多核苷酸中的各多核苷酸还包含第一板 识别区域,其中在各多核苷酸上各第一板识别区域与样品识别区域 的各个组合对于单一样品是独特的,其中来自第一组单一样品的各 多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组 单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它 多核苷酸的第一板识别区域的序列;和进一步包括基于所述第一目 标多核苷酸的样品识别区域和第一板识别区域识别所述第一单一样 品中的第二目标多核苷酸。在一些方面,所述第一单一样品包含B 细胞。在一些方面,所述第一单一样品包含多个B细胞。在一些方 面,所述第一单一样品包含B细胞,其中所述第一目标多核苷酸包 含抗体重链核苷酸序列,且其中所述第二目标多核苷酸包含抗体轻 链核苷酸序列。在一些方面,所述第一单一样品包含B细胞,其中 所述第一目标多核苷酸包含抗体轻链核苷酸序列,且其中所述第二 目标多核苷酸包含抗体重链核苷酸序列。在一些方面,获得所述数 据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过 实验确定所述数据集。在一些方面,获得所述数据集包括直接或间 接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的 第三方接收所述数据集。在一些方面,所述数据集存储在电子存储 介质上。
本文还描述了产生用于克隆的一个或多个目标多核苷酸的方 法,包括:获得包含多个多核苷酸的多核苷酸文库,其中各多核苷 酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样 品的扩增子区域,其中所述通用引物区域的3’端与所述样品识别区 域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的 5’端偶联,且其中所述扩增子区域可操作地与所述接合体区域偶联, 其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上 是基本上相同的,且其中来自第一单一样品的各多核苷酸的所述样 品识别区域的序列不同于来自于与所述第一单一样品不同的一个或 多个样品的文库中其它多核苷酸的样品识别区域的序列;和利用引 物组扩增所述多核苷酸文库以产生所述一个或多个用于克隆的目标 多核苷酸,其中所述一个或多个用于克隆的目标多核苷酸包含第一 限制性位点区域、通用引物区域、样品识别区域、接合体区域、来 自于单一样品的扩增子区域和第二限制性位点区域,其中所述通用 引物区域的3’端与所述样品识别区域的5’端偶联,其中所述样品识 别区域的3’端与所述接合体区域的5’端偶联,其中所述扩增子区域 可操作地与所述接合体区域偶联,其中所述第一限制性位点区域位 于所述目标多核苷酸的5’端,且其中所述第二限制性位点区域位于 所述目标多核苷酸的3’端。
在一些方面,获得所述多核苷酸文库包括在实验室中制备所述 多核苷酸文库。在一些方面,获得所述多核苷酸文库包括直接或间 接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文 库。
本文还描述了产生目标分子的方法,包括:获得包含多核苷酸 的宿主细胞,该多核苷酸包含样品识别区域、接合体区域和来自于 单一样品的扩增子区域,其中所述样品识别区域的3’端与所述接合 体区域的5’端偶联,且其中所述扩增子区域可操作地与所述接合体 区域偶联;和在足以产生所述目标分子的条件下培养所述宿主细胞。 在一些方面,获得所述宿主细胞包括在实验室中制备所述包含多核 苷酸的宿主细胞。在一些方面,获得所述宿主细胞包括直接或间接 地从已经制备所述宿主细胞的第三方接收所述包含多核苷酸的宿主 细胞。在一些方面,所述目标分子是蛋白质。在一些方面,所述目 标分子是抗体。在一些方面,所述目标分子是人单克隆抗体。在一 些方面,进一步包括收集所述目标分子。
本文还描述了一种试剂盒,其包含本文所述的多核苷酸、多核 苷酸文库、载体或宿主细胞及使用说明。
本文还描述了连接和条码标记(barcoding)多个非连续的目标多 核苷酸序列的方法,所述方法包括:(a)提供多个cDNA分子;(b)物 理连接目标cDNA分子;和(c)在物理连接之前、期间或之后将条码 (barcode)序列添加到目标cDNA上。
在一些方面,所述物理连接是通过连接反应。在一些方面,所 述物理连接是通过重组。在一些方面,所述物理连接包括使用重叠- 延伸序列。在一些方面,所述条码序列位于物理连接的cDNA的一 端或两端。在一些方面,所述条码序列位于物理连接的cDNA之间。在一些方面,所述连接反应通过相容末端的退火和连接进行。在一 些方面,所述相容末端是限制性位点。在一些方面,所述连接反应 通过平端连接进行。在一些方面,所述重叠-延伸序列在使用包含重 叠-延伸尾的引物的扩增的过程中添加。在一些方面,所述重叠-延伸序列在使用包含重叠-延伸尾的引物的反转录的过程中添加。在一些 方面,所述重叠-延伸序列通过将接合体与在反转录过程中产生的 cDNA的3’尾退火来添加。在一些方面,所述条码序列通过连接反 应添加。在一些方面,所述连接反应通过相容末端的退火和连接进 行。在一些方面,所述相容末端是限制性位点。在一些方面,所述 连接反应通过包含条码序列的接合体的平端连接进行。在一些方面, 所述条码序列在使用包含所述条码序列的引物的扩增反应的过程中 添加。在一些方面,所述条码序列在使用包含所述条码序列的引物 的反转录反应的过程中添加。在一些方面,所述条码序列通过将接 合体与在反转录反应过程中产生的cDNA的3’尾退火来添加。在一 些方面,所述cDNA的3’端包含至少一个C核苷酸,且其中所述接 合体的3’端包含至少一个G核苷酸,且其中所述接合体通过所述C 和G之间的结合连接到各cDNA上。在一些方面,所述接合体是单 链的,且进一步包括通过允许酶将所述接合体分子形成为双链而将 所述接合体并入到各cDNA中。在一些方面,所述接合体通过MMLV H-反转录酶并入到各cDNA中。在一些方面,所述重叠-延伸序列包 含条码序列。在一些方面,所述目标多核苷酸序列包含抗体重链和 轻链。在一些方面,进一步包括(d)在物理连接之前、期间或之后将 测序区域添加到所述目标cDNA上。在一些方面,所述测序区域利用接合体添加。在一些方面,进一步包括(e)使用NextGen测序平台 对物理连接的目标cDNA分子进行测序。在一些方面,所述NextGen 测序平台是454测序。在一些方面,所述NextGen测序平台是SMRT 测序。在一些方面,所述NextGen测序平台是SOLiD测序。在一些 方面,所述NextGen测序平台是SOLEXA测序。在一些方面,所述 NextGen测序平台是tSMS测序。在一些方面,所述多个cDNA分子 来自于容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536个孔或更多个孔 的板中的单一样品。在一些方面,所述多个cDNA分子来自于容纳 在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、 十个、二十个、三十个、四十个、五十个、七十五个、一百个或更 多个各具有96个孔的板中的单一样品。
本文还描述了连接和条码标记包含目标多核苷酸序列的多个样 品的方法,所述方法包括:(a)将所述样品分布在多个容器中;(b)使 用来自所述样品的模板合成目标多核苷酸序列,其中所述合成导致 条码序列的添加;和(c)实现步骤(b)中合成的所述目标多核苷酸序列 的连接。
在一些方面,各样品包含细胞。在一些方面,所述细胞是B细 胞。在一些方面,所述B细胞是浆母细胞、记忆B细胞或浆细胞。 在一些方面,各样品包含多个细胞。在一些方面,所述目标多核苷 酸序列包含抗体重链和轻链。在一些方面,所述合成包括RT-PCR 扩增。在一些方面,所述RT-PCR扩增在单一步骤中进行。在一些 方面,所述目标核苷酸序列的连接在使用重叠-延伸引物的RT-PCR 扩增的过程中进行。在一些方面,进一步包括(d)在条码序列添加或 连接之前、期间或之后将测序区域添加到所述目标多核苷酸序列上。 在一些方面,所述测序区域利用接合体添加。在一些方面,进一步 包括(e)使用NextGen测序平台对所述连接的目标多核苷酸序列进行 测序。在一些方面,所述NextGen测序平台是454测序。在一些方 面,所述NextGen测序平台是SMRT测序。在一些方面,所述NextGen 测序平台是SOLiD测序。在一些方面,所述NextGen测序平台是 SOLEXA测序。在一些方面,所述NextGen测序平台是tSMS测序。 在一些方面,所述多个样品是容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、至少384个孔、至少1536 个孔或更多个孔的板中的单一样品。在一些方面,所述多个样品是 容纳在至少一个、两个、三个、四个、五个、六个、七个、八个、 九个、十个、二十个、三十个、四十个、五十个、七十五个、一百 个、两百个、五百个或更多个各具有96个孔的板中的单一样品。
本文还描述了连接和条码标记多个非连续的目标多核苷酸序列 的方法,所述方法包括:(a)将细胞分布在多个容器中以获得分离的 一个或多个细胞;(b)使用来自所述分离的一个或多个细胞的模板扩 增目标多核苷酸序列,其中所述扩增导致条码序列的添加;和(c)实 现步骤(b)中扩增的所述目标多核苷酸序列的连接。
在一些方面,所述目标核苷酸序列包含抗体重链和轻链。在一 些方面,所述扩增包括RT-PCR扩增。在一些方面,所述RT-PCR 扩增在单一步骤中进行。在一些方面,所述目标核苷酸序列的连接 在使用重叠-延伸引物的RT-PCR扩增的过程中进行。在一些方面, 进一步包括(d)在条码序列添加或连接之前、期间或之后将测序区域 添加到所述目标多核苷酸序列上。在一些方面,所述测序区域利用 接合体添加。在一些方面,进一步包括(e)使用NextGen测序平台对 所述连接的目标多核苷酸序列进行测序。在一些方面,所述NextGen测序平台是454测序。在一些方面,所述NextGen测序平台是SMRT 测序。在一些方面,所述NextGen测序平台是SOLiD测序。在一些 方面,所述NextGen测序平台是SOLEXA测序。在一些方面,所述 NextGen测序平台是tSMS测序。在一些方面,所述一个或多个细胞 容纳在具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、 至少96个孔、至少384个孔、至少1536个孔或更多个孔的板中。 在一些方面,所述一个或多个细胞容纳在至少一个、两个、三个、 四个、五个、六个、七个、八个、九个、十个、二十个、三十个、 四十个、五十个、七十五个、一百个或更多个各具有96个孔的板中。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含序列5’-A-B-C-D-3’,其中A是样品识别区域(条码序列), 其中B是来自于单一样品的第一cDNA区域,其中C是接头区域, 其中D是来自相同的单一样品的第二cDNA区域,且其中来自第一 单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与 所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的 样品识别区域的序列。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含序列5’-A-B-C-D-3’,其中A是来自于单一样品的第一 cDNA区域,其中B是接头区域,其中C是来自相同的单一样品的 第二cDNA区域,其中D是样品识别区域(条码序列),且其中来 自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来 自于与所述第一单一样品不同的一个或多个样品的文库中其它多核 苷酸的样品识别区域的序列。
本文还描述了包含多个多核苷酸的多核苷酸文库,其中各多核 苷酸包含序列5’-A-B-C-3’,其中A是来自于单一样品的第一eDNA 区域,其中B是包含样品识别区域(条码序列)的接头区域,其中 C是来自相同的单一样品的第二cDNA区域,且其中来自第一单一 样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述 第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品 识别区域的序列。
在一些方面,所述第一eDNA区域包含抗体重链和所述第二 cDNA区域包含抗体轻链。在一些方面,所述文库包含至少2个、至 少3个、至少10个、至少30个、至少100个、至少300个、至少 1000个、至少3000个、至少10,000个、至少30,000个、至少100,000 个、至少300,000个、至少1,000,000个、至少3,000,000个、至少 10,000,000个、至少30,000,000个或更多个成员。在一些方面,所述 文库包含细胞样品的整个转录组中的至少2个、至少3个、至少10 个、至少30个、至少100个、至少300个、至少1000个、至少3000 个、至少10,000个、至少30,000个或更多个基因。在一些方面,所 述文库包含存在于个体的血液中的至少1种、至少2种、至少3种、 至少10种、至少30种、至少100种、至少300种、至少1000种、 至少10,000种、至少100,000种、至少1,000,000种、至少10,000,000 种、至少100,000,000种或更多种不同的抗体种类。在一些方面,所 述抗体由浆母细胞、浆细胞、记忆B细胞、长寿浆细胞、其它B谱 系细胞或其组合表达。
特别地,本发明涉及以下各项:
1.一种包含多核苷酸的组合物,其中所述多核苷酸包含第一区 域和第二区域,其中所述第一区域包含表达的B细胞可变免疫球蛋 白区域,所述第二区域包含至少一个识别区域,且其中所述第一区 域与所述第二区域偶联。
2.第1项的组合物,其中所述可变免疫球蛋白区域包含从直径 大于或等于8μm的活化人B细胞分离的IgG免疫球蛋白核苷酸序列 的VDJ区域,且其中所述免疫球蛋白区域的5’端与所述识别区域 的3’端偶联。
3.第1-2项中任一项的组合物,其中所述组合物包括在克隆家 族中。
4.第1-3项中任一项的组合物,其中所述免疫球蛋白区域从B 细胞分离,且其中所述B细胞是活化B细胞。
5.第1-4项中任一项的组合物,其中所述免疫球蛋白区域从B 细胞分离,且其中所述B细胞是浆母细胞。
6.第1-5项中任一项的组合物,其中所述免疫球蛋白区域从B 细胞分离,且其中所述B细胞是单一B细胞。
7.第1-6项中任一项的组合物,其中所述免疫球蛋白区域从B 细胞分离,且其中所述B细胞是单一活化B细胞。
8.第1-7项中任一项的组合物,其中所述免疫球蛋白区域从B 细胞分离,且其中所述B细胞是位于受试者的血液中的单一活化B 细胞。
9.第1-8项中任一项的组合物,其中所述免疫球蛋白区域从B 细胞分离,且其中所述B细胞是人活化B细胞。
10.第1-9项中任一项的组合物,其中所述免疫球蛋白区域从 B细胞分离,且其中所述B细胞是记忆B细胞。
11.第1-10项中任一项的组合物,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是浆细胞。
12.第1-11项中任一项的组合物,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是抗原特异性B细胞。
13.第1-12项中任一项的组合物,其中所述免疫球蛋白区域 从哺乳动物B细胞分离。
14.第1-13项中任一项的组合物,其中所述免疫球蛋白区域 从人B细胞分离。
15.第1-14项中任一项的组合物,其中所述免疫球蛋白区域 从小鼠B细胞分离。
16.第1-15项中任一项的组合物,其中所述免疫球蛋白区域 从来自于患有关注的疾病或病症的受试者的B细胞分离。
17.第1-16项中任一项的组合物,其中所述免疫球蛋白区域 从来自于正从关注的疾病或病症恢复或已从关注的疾病或病症恢复 的受试者的B细胞分离。
18.第1-17项中任一项的组合物,其中所述免疫球蛋白区域 从来自于施用至少一种目标抗原的受试者的B细胞分离。
19.第1-18项中任一项的组合物,其中所述免疫球蛋白区域 从来自于施用至少一种目标抗原和佐剂的受试者的B细胞分离。
20.第1-19项中任一项的组合物,其中所述免疫球蛋白区域 从位于受试者的血液中的B细胞分离。
21.第1-20项中任一项的组合物,其中所述免疫球蛋白区域 从位于受试者的骨髓中的B细胞分离。
22.第1-21项中任一项的组合物,其中所述免疫球蛋白区域 从位于受试者的脾中的B细胞分离。
23.第1-22项中任一项的组合物,其中所述免疫球蛋白区域 从位于受试者的至少一个淋巴结中的B细胞分离。
24.第1-23项中任一项的组合物,其中所述免疫球蛋白区域 从位于受试者的淋巴组织中的B细胞分离。
25.第1-24项中任一项的组合物,其中所述免疫球蛋白区域 从位于受试者的肠中的B细胞分离。
26.第1-25项中任一项的组合物,其中所述免疫球蛋白区域 从直径为约8-20μm的活化B细胞分离。
27.第1-26项中任一项的组合物,其中所述免疫球蛋白区域 从直径为8、9、10、11、12、13、14、15、16、17、18、19、20或 大于20μm的活化B细胞分离。
28.第1-27项中任一项的组合物,其中所述免疫球蛋白区域 从面积为约60、70、80、90、100、120、130、140、150、200、250、300、350或大于350μm2的活化B细胞分离。
29.第1-28项中任一项的组合物,其中所述免疫球蛋白区域 从体积为约250、268、300、400、500、600、700、800、900、1000、 2000、3000、4000或大于4000μm3的活化B细胞分离。
30.第1-29项中任一项的组合物,其中所述免疫球蛋白区域 从直径尺寸比对照静息B细胞的中值直径大10%或更大的活化B细 胞分离。
31.第1-30项中任一项的组合物,其中所述免疫球蛋白区域 从直径尺寸比对照静息B细胞的中值直径大15%或更大的活化B细 胞分离。
32.第1-31项中任一项的组合物,其中所述免疫球蛋白区域 从直径尺寸比对照静息B细胞的中值直径大20%或更大的活化B细 胞分离。
33.第1-32项中任一项的组合物,其中所述免疫球蛋白区域 从能够分泌免疫球蛋白的活化B细胞分离。
34.第1-33项中任一项的组合物,其中所述免疫球蛋白区域 从处于细胞周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝 分裂期(M)的B细胞分离。
35.第1-34项中任一项的组合物,其中所述免疫球蛋白区域 从非处于细胞周期的静息期(G0)的B细胞分离。
36.第1-35项中任一项的组合物,其中所述免疫球蛋白区域 从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的 1.2倍的FSC的B细胞分离。
37.第1-36项中任一项的组合物,其中所述免疫球蛋白区域 从通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15 倍的FSC平均值的B细胞分离。
38.第1-37项中任一项的组合物,其中所述免疫球蛋白区域 从单一CD19阳性B细胞分离。
39.第1-38项中任一项的组合物,其中所述免疫球蛋白区域 从单一CD38阳性B细胞分离。
40.第1-39项中任一项的组合物,其中所述免疫球蛋白区域 从单一CD27阳性B细胞分离。
41.第1-40项中任一项的组合物,其中所述免疫球蛋白区域 从单一CD20阴性B细胞分离。
42.第1-41项中任一项的组合物,其中所述免疫球蛋白区域 从单一CD19+CD20-CD27+CD38hi B细胞分离。
43.第1-42项中任一项的组合物,其中所述免疫球蛋白区域 的5’端与所述识别区域的3’端偶联。
44.第1-43项中任一项的组合物,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的VDJ区域。
45.第1-44项中任一项的组合物,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的VJ区域。
46.第1-45项中任一项的组合物,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的V、D和/或J区域。
47.第1-46项中任一项的组合物,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的重链和/或轻链。
48.第1-47项中任一项的组合物,其中所述可变免疫球蛋白 区域包含IgG、IgM、IgD、IgE或IgA免疫球蛋白序列。
49.第1-48项中任一项的组合物,其中所述可变免疫球蛋白 区域包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。
50.第1-49项中任一项的组合物,其中所述可变免疫球蛋白 区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免疫球蛋白序列。
51.第1-50项中任一项的组合物,其中所述免疫球蛋白区域 长度为约200-2000个核苷酸。
52.第1-51项中任一项的组合物,其中所述免疫球蛋白区域 长度为小于200、200、300、400、500、600、700、800、900、1000、 1100、1200、1300、1400、1500、1600、1700、1800、1900、2000 或大于2000个核苷酸。
53.第1-52项中任一项的组合物,其中所述识别区域包含多 个识别区域。
54.第1-53项中任一项的组合物,其中所述识别区域包含多 个识别区域,且其中该多个识别区域中的各识别区域具有不同的序 列。
55.第1-54项中任一项的组合物,其中所述识别区域包含至 少一个样品识别区域和至少一个板识别区域。
56.第1-55项中任一项的组合物,其中所述识别区域包含与 所述免疫球蛋白区域的序列不同的序列。
57.第1-56项中任一项的组合物,其中所述识别区域长度为 约2-100个核苷酸。
58.第1-57项中任一项的组合物,其中所述识别区域长度为2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、30、40、50、60、70、80、90、100或大于100个核苷酸。
59.第1-58项中任一项的组合物,其中所述识别区域长度为 2-1,000个核苷酸。
60.第1-59项中任一项的组合物,其中所述识别区域长度等 于或大于100个核苷酸。
61.第1-60项中任一项的组合物,其中所述识别区域包含连 续的非编码核苷酸序列。
62.第1-61项中任一项的组合物,其中所述识别区域包含非 编码核苷酸序列。
63.第1-62项中任一项的组合物,其中所述识别区域包含非 连续的非编码核苷酸序列。
64.第1-63项中任一项的组合物,其中所述识别区域的序列 长度小于所述免疫球蛋白区域的序列长度。
65.第1-64项中任一项的组合物,进一步包含第三区域,其 中所述第三区域包含接合体区域。
66.第1-65项中任一项的组合物,进一步包含第三区域,其 中所述第三区域包含接合体区域,且其中所述第三区域位于所述第 一区域和所述第二区域之间。
67.第1-66项中任一项的组合物,进一步包含第三区域,其 中所述第三区域包含接合体区域,且其中所述接合体区域包含至少 一个位于其3’端的G核苷酸。
68.第1-67项中任一项的组合物,其中所述识别区域为2-100 个核苷酸长并具有不同于所述免疫球蛋白区域序列的序列,且其中 所述接合体区域包含在其3’端的至少一个G核苷酸并位于所述样 品识别区域的3’侧和所述免疫球蛋白区域的5’侧,且其中所述可变免疫球蛋白区域已发生超变而不同于原始B细胞的种系序列。
69.第1-68项中任一项的组合物,其中所述组合物存在于容 器中。
70.第1-69项中任一项的组合物,其中多个所述组合物存在 于容器中。
71.第1-70项中任一项的组合物,其中多个所述组合物存在 于包含多个孔的单一板的单一孔中。
72.第1-71项中任一项的组合物,其中所述组合物处于组合 物文库中,其中各组合物存在于单独的容器中,其中各组合物包含 含有第一区域和第二区域的多核苷酸,其中所述第一区域包含表达 的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域,其中所述第一区域与所述第二区域偶联,其中各识别区域的核苷酸序列 不同于文库中存在的其它识别区域的核苷酸序列,且其中文库中的 多个可变免疫球蛋白区域的最后核苷酸序列共有至少80-99%的序列 同一性。
73.第1-72项中任一项的组合物,其中所述组合物包括在包 含多个多核苷酸组合物的文库中,其中各组合物存在于单独的容器 中,其中各组合物包含多核苷酸,其中所述多核苷酸包含第一区域 和第二区域,其中所述第一区域包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域,其中所述第一区域与所述第二 区域偶联,且其中各识别区域的核苷酸序列不同于文库中各单独容 器中存在的其它识别区域的核苷酸序列。
74.一种包含多个多核苷酸组合物的多核苷酸组合物文库,其 中各组合物存在于单独的容器中,其中各组合物包含多核苷酸,其 中所述多核苷酸包含第一区域和第二区域,其中所述第一区域包含 表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域, 其中所述第一区域与所述第二区域偶联,且其中各识别区域的核苷 酸序列不同于文库中各单独容器中存在的其它识别区域的核苷酸序 列。
75.一种包含多个多核苷酸的多核苷酸文库,其中所述多个多 核苷酸的各多核苷酸存在于单独的容器中,其中所述多个多核苷酸 的各多核苷酸包含第一区域和第二区域,其中所述第一区域包含表 达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域,其 中所述第一区域与所述第二区域偶联,其中各识别区域的核苷酸序 列不同于文库中存在的其它识别区域的核苷酸序列,且其中所述多 个多核苷酸中的至少两个可变免疫球蛋白区域共有至少80-99%的序 列同一性。
76.一种包含多核苷酸的克隆家族的多核苷酸文库,其中所述 家族中的各多核苷酸包含第一区域和第二区域,其中所述第一区域 包含表达的B细胞可变免疫球蛋白区域和所述第二区域包含识别区 域,其中所述第一区域与所述第二区域偶联,其中各识别区域的核 苷酸序列不同于家族中存在的其它识别区域的核苷酸序列,且其中 家族中的各可变免疫球蛋白区域表现出至少80-99%的序列同一性。
77.第76项的文库,其中所述文库包含多个克隆家族。
78.一种免疫球蛋白序列的克隆家族,其中家族中的各序列与 识别区域偶联。
79.第78项的克隆家族,其中各识别区域不同于其它识别区 域。
80.第78-79项中任一项的克隆家族,其中所述免疫球蛋白序 列包含重链免疫球蛋白序列。
81.第78-80项中任一项的克隆家族,其中所述免疫球蛋白序 列包含轻链免疫球蛋白序列。
82.第78-81项中任一项的克隆家族,其中所述免疫球蛋白序 列包含重链和轻链免疫球蛋白序列。
83.第78-82项中任一项的克隆家族,其中一个或多个所述识 别区域包含轻链免疫球蛋白序列。
84.第78-83项中任一项的克隆家族,其中一个或多个所述识 别区域包含重链免疫球蛋白序列。
85.两个或更多个第78-84项中任一项的克隆家族的集合。
86.2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20或更多个第78-85项中任一项的克隆家族的集合。
87.一种免疫球蛋白序列的克隆家族,其中所述家族中的各序 列与至少一个连续核苷酸序列可操作地偶联。
88.第87项的克隆家族,其中所述免疫球蛋白序列包含重链 免疫球蛋白序列且所述的至少一个连续核苷酸序列包含轻链免疫球 蛋白序列。
89.第87项的克隆家族,其中所述免疫球蛋白序列包含轻链 免疫球蛋白序列且所述的至少一个连续核苷酸序列包含重链免疫球 蛋白序列。
90.一种产生免疫球蛋白序列的克隆家族的方法,包括获得多 个免疫球蛋白序列,其各具有V、D和/或J区域且各与识别区域偶 联;和将该多个免疫球蛋白序列中的两个或更多个序列分组以产生 所述克隆家族,其中所述克隆家族中的各序列是具有V、D和/或J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D和/或 J区域的种系免疫球蛋白序列。
91.第90项的方法,其中各识别区域不同于其它识别区域。
92.一种产生免疫球蛋白序列的克隆家族的方法,包括获得多 个免疫球蛋白序列,其各具有V、D和/或J区域且各与识别区域偶 联,且其中各识别区域不同于其它识别区域;去除一个或多个识别 区域;和将该多个免疫球蛋白序列中的两个或更多个序列分组以产 生所述克隆家族,其中所述克隆家族中的各序列是具有V、D和/或 J区域的相同种系免疫球蛋白序列的突变形式或者具有该V、D和/ 或J区域的种系免疫球蛋白序列。
93.一种识别与第一识别区域偶联的第二cDNA的方法,包括 选择与所述第一识别区域偶联的第一cDNA和基于与各cDNA偶联 的识别区域的共有同一性识别所述第二eDNA。
94.一种产生第二核苷酸序列上的3’尾的方法,包括获得第 一核苷酸序列和使该第一核苷酸序列与在低于50℃的温度下具有模 板转换活性的热稳定RNA酶H-反转录酶接触,其中所述接触产生 所述3’尾和所述第二核苷酸序列。
95.第94项的方法,其中所述第一核苷酸序列在约低于50、 49、48、47、46、45、44、43、42或低于42℃下接触。
96.第94-95项中任一项的方法,其中所述第一核苷酸序列在 42℃下接触。
97.第94-96项中任一项的方法,其中所述第一核苷酸序列在 45.5℃下接触。
98.第94-97项中任一项的方法,其中所述转录酶是莫洛尼鼠 白血病病毒(MMLV)RNA酶H-反转录酶。
99.第94-98项中任一项的方法,其中所述转录酶是 SuperScript III。
100.一种确定第一目标序列的天然存在序列的方法,包括获得 与该第一序列相关且各与第一识别区域偶联的多个序列,其中各第 一识别区域是相同的,且其中所述多个序列中的一个或多个序列不 同于所述天然存在的序列;和比较所述多个序列中的序列以确定所 述第一目标序列的天然存在的序列。
101.第100项的方法,其中所述多个序列包含免疫球蛋白序列。
102.第100-101项中任一项的方法,其中所述多个序列包含免 疫球蛋白序列。
103.第100-102项中任一项的方法,其中所述多个序列包含免 疫球蛋白序列。
104.第100-103项中任一项的方法,其中所述多个序列各与第 二识别区域偶联且各第二识别区域是相同的。
105.第100-104项中任一项的方法,其中所述第一目标序列是 免疫球蛋白序列。
106.第100-105项中任一项的方法,其中所述多个序列是免疫 球蛋白序列。
107.一种包含多核苷酸的组合物,该多核苷酸包含第一区域和 第二区域,其中所述第一区域包含B细胞源的可变免疫球蛋白区域 和所述第二区域包含识别区域,且其中所述第一区域与所述第二区 域偶联。
108.一种包含多个多核苷酸组合物的多核苷酸组合物文库,其 中各组合物存在于单独的容器中,其中各组合物包含含有B细胞源 的可变免疫球蛋白区域和识别区域的多核苷酸,其中所述可变免疫 球蛋白区域与所述识别区域偶联,其中各识别区域的核苷酸序列不 同于文库中各单独容器中存在的其它识别区域的核苷酸序列。
109.一种用于产生多核苷酸组合物的方法,包括:
获得包含第一区域的多核苷酸,其中所述第一区域包含与受试 者相关的表达的B细胞可变免疫球蛋白区域;和
通过将所述第一区域与第二区域偶联产生包含第一区域和第二 区域的多核苷酸组合物,其中所述第二区域包含识别区域。
110.第109项的方法,其中获得所述多核苷酸包括获得与受试 者相关的B细胞和处理该细胞以制备所述多核苷酸。
111.第109-110项中任一项的方法,其中获得所述多核苷酸包 括直接或间接地从已经处理与受试者相关的B细胞以制备所述多核 苷酸的第三方接收所述多核苷酸。
112.第109-111项中任一项的方法,其中获得所述多核苷酸包 括直接或间接地从已经溶解与受试者相关的B细胞以制备所述多核 苷酸的第三方接收所述多核苷酸。
113.第109-112项中任一项的方法,其中获得所述多核苷酸包 括使用流式细胞仪获得B细胞。
114.第109-113项中任一项的方法,其中获得所述多核苷酸包 括使用微流体装置获得B细胞。
115.第109-114项中任一项的方法,其中所述可变免疫球蛋白 区域包含从直径大于或等于8μm的活化人B细胞分离的IgG免疫球 蛋白核苷酸序列的VDJ区域,且其中所述免疫球蛋白区域的5’端 与所述识别区域的3’端偶联。
116.第109-115项中任一项的方法,其中所述组合物包括在克 隆家族中。
117.第109-116项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是活化B细胞。
118.第109-117项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是浆母细胞。
119.第109-118项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是单一B细胞。
120.第109-119项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是单一活化B细胞。
121.第109-120项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是位于受试者的血液中的单一活 化B细胞。
122.第109-121项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是人活化B细胞。
123.第109-122项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是记忆B细胞。
124.第109-123项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是浆细胞。
125.第109-124项中任一项的方法,其中所述免疫球蛋白区域 从B细胞分离,且其中所述B细胞是抗原特异性B细胞。
126.第109-125项中任一项的方法,其中所述免疫球蛋白区域 从哺乳动物B细胞分离。
127.第109-126项中任一项的方法,其中所述免疫球蛋白区域 从人B细胞分离。
128.第109-127项中任一项的方法,其中所述免疫球蛋白区域 从小鼠B细胞分离。
129.第109-128项中任一项的方法,其中所述免疫球蛋白区域 从来自于患有关注的疾病或病症的受试者的B细胞分离。
130.第109-129项中任一项的方法,其中所述免疫球蛋白区域 从来自于正从关注的疾病或病症恢复或已从关注的疾病或病症恢复 的受试者的B细胞分离。
131.第109-130项中任一项的方法,其中所述免疫球蛋白区域 从来自于施用目标抗原的受试者的B细胞分离。
132.第109-131项中任一项的方法,其中所述免疫球蛋白区域 从来自于施用目标抗原和佐剂的受试者的B细胞分离。
133.第109-132项中任一项的方法,其中所述免疫球蛋白区域 从位于受试者的血液中的B细胞分离。
134.第109-133项中任一项的方法,其中所述免疫球蛋白区域 从位于受试者的骨髓中的B细胞分离。
135.第109-134项中任一项的方法,其中所述免疫球蛋白区域 从位于受试者的脾中的B细胞分离。
136.第109-135项中任一项的方法,其中所述免疫球蛋白区域 从位于受试者的至少一个淋巴结中的B细胞分离。
137.第109-136项中任一项的方法,其中所述免疫球蛋白区域 从位于受试者的淋巴组织中的B细胞分离。
138.第109-137项中任一项的方法,其中所述免疫球蛋白区域 从位于受试者的肠中的B细胞分离。
139.第109-138项中任一项的方法,其中所述免疫球蛋白区域 从直径为约8-20μm的活化B细胞分离。
140.第109-139项中任一项的方法,其中所述免疫球蛋白区域 从直径为8、9、10、11、12、13、14、15、16、17、18、19、20或 大于20μm的活化B细胞分离。
141.第109-140项中任一项的方法,其中所述免疫球蛋白区域 从面积为约60、70、80、90、100、120、130、140、150、200、250、 300、350或大于350μm2的活化B细胞分离。
142.第109-141项中任一项的方法,其中所述免疫球蛋白区域 从体积为约250、268、300、400、500、600、700、800、900、1000、 2000、3000、4000或大于4000μm3的活化B细胞分离。
143.第109-142项中任一项的方法,其中所述免疫球蛋白区域 从直径尺寸大于对照静息B细胞的中值直径10%或更大的活化B细 胞分离。
144.第109-143项中任一项的方法,其中所述免疫球蛋白区域 从直径尺寸大于对照静息B细胞的中值直径15%或更大的活化B细 胞分离。
145.第109-144项中任一项的方法,其中所述免疫球蛋白区域 从直径尺寸大于对照静息B细胞的中值直径20%或更大的活化B细 胞分离。
146.第109-145项中任一项的方法,其中所述免疫球蛋白区域 从能够分泌免疫球蛋白的活化B细胞分离。
147.第109-146项中任一项的方法,其中所述免疫球蛋白区域 从处于细胞周期的合成前期(G1)、合成期(S)、合成后期(G2)或有丝 分裂期(M)的B细胞分离。
148.第109-147项中任一项的方法,其中所述免疫球蛋白区域 从非处于细胞周期的静息期(G0)的B细胞分离。
149.第109-148项中任一项的方法,其中所述免疫球蛋白区域 从通过流式细胞术鉴定为具有大于静息B淋巴细胞的FSC平均值的1.2倍的FSC平均值的B细胞分离。
150.第109-149项中任一项的方法,其中所述免疫球蛋白区域 从通过流式细胞术鉴定为具有人单核细胞的FSC平均值的0.7-1.15 倍的FSC的B细胞分离。
151.第109-150项中任一项的方法,其中所述免疫球蛋白区域 从单一CD19阳性B细胞分离。
152.第109-151项中任一项的方法,其中所述免疫球蛋白区域 从单一CD38阳性B细胞分离。
153.第109-152项中任一项的方法,其中所述免疫球蛋白区域 从单一CD27阳性B细胞分离。
154.第109-153项中任一项的方法,其中所述免疫球蛋白区域 从单一CD20阴性B细胞分离。
155.第109-154项中任一项的方法,其中所述免疫球蛋白区域 从单一CD19+CD20-CD27+CD38hi B细胞分离。
156.第109-155项中任一项的方法,其中所述免疫球蛋白区域 的5’端与所述识别区域的3’端偶联。
157.第109-156项中任一项的方法,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的VDJ区域。
158.第109-157项中任一项的方法,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的VJ区域。
159.第109-158项中任一项的方法,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的V、D和/或J区域。
160.第109-159项中任一项的方法,其中所述可变免疫球蛋白 区域包含免疫球蛋白核苷酸序列的重链和/或轻链。
161.第109-160项中任一项的方法,其中所述可变免疫球蛋白 区域包含IgG、IgM、IgD、IgE或IgA免疫球蛋白序列。
162.第109-161项中任一项的方法,其中所述可变免疫球蛋白 区域包含人IgG1、IgG2、IgG3或IgG4免疫球蛋白序列。
163.第109-162项中任一项的方法,其中所述可变免疫球蛋白 区域包含小鼠IgG1、IgG2a、IgG2b或IgG3免疫球蛋白序列。
164.第109-163项中任一项的方法,其中所述免疫球蛋白区域 长度为约200-2000个核苷酸。
165.第109-164项中任一项的方法,其中所述免疫球蛋白区域 长度为小于200、200、300、400、500、600、700、800、900、1000、 1100、1200、1300、1400、1500、1600、1700、1800、1900、2000 或大于2000个核苷酸。
166.第109-165项中任一项的方法,其中所述识别区域包含多 个识别区域。
167.第109-166项中任一项的方法,其中所述识别区域包含多 个识别区域,且其中该多个识别区域中的各识别区域具有不同的序 列。
168.第109-167项中任一项的方法,其中所述识别区域包含至 少一个样品识别区域和至少一个板识别区域。
169.第109-168项中任一项的方法,其中所述识别区域包含与 所述免疫球蛋白区域的序列不同的序列。
170.第109-169项中任一项的方法,其中所述识别区域长度为 约2-100个核苷酸。
171.第109-170项中任一项的方法,其中所述识别区域长度为 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、30、40、50、60、70、80、90、100或大于100个核苷酸。
172.第109-171项中任一项的方法,其中所述识别区域长度为 2-1,000个核苷酸。
173.第109-172项中任一项的方法,其中所述识别区域长度等 于或大于100个核苷酸。
174.第109-173项中任一项的方法,其中所述识别区域包含连 续的非编码核苷酸序列。
175.第109-174项中任一项的方法,其中所述识别区域包含非 编码核苷酸序列。
176.第109-175项中任一项的方法,其中所述识别区域包含非 连续的非编码核苷酸序列。
177.第109-176项中任一项的方法,其中所述识别区域的序列 长度小于所述免疫球蛋白区域的序列长度。
178.第109-177项中任一项的方法,进一步包含第三区域,其 中所述第三区域包含接合体区域。
179.第109-178项中任一项的方法,进一步包含第三区域,其 中所述第三区域包含接合体区域,且其中所述第三区域位于所述第 一区域和所述第二区域之间。
180.第109-179项中任一项的方法,进一步包含第三区域,其 中所述第三区域包含接合体区域,且其中所述接合体区域包含位于 其3’端的至少一个G核苷酸。
181.第109-180项中任一项的方法,其中所述识别区域为2-100 个核苷酸长并具有不同于所述免疫球蛋白区域序列的序列,且其中 所述接合体区域包含在其3’端的至少一个G核苷酸并位于所述样 品识别区域的3’侧和所述免疫球蛋白区域的5’侧,且其中所述可 变免疫球蛋白区域已发生超变且不同于原始B细胞的种系序列。
182.第109-181项中任一项的方法,其中所述组合物存在于容 器中。
183.第109-182项中任一项的方法,其中多个所述组合物存在 于容器中。
184.第109-183项中任一项的方法,其中多个所述组合物存在 于包含多个孔的单一板的单一孔中。
185.第109-184项中任一项的方法,其中所述组合物处于组合 物文库中,其中各组合物存在于单独的容器中,其中各组合物包含 含有第一区域和第二区域的多核苷酸,其中所述第一区域包含表达 的B细胞可变免疫球蛋白区域和所述第二区域包含识别区域,其中 所述第一区域与所述第二区域偶联,其中各识别区域的核苷酸序列 不同于文库中存在的其它识别区域的核苷酸序列,且其中文库中的 多个可变免疫球蛋白区域的核苷酸序列共有至少80-99%的序列同一 性。
186.一种用于产生多核苷酸组合物的方法,包括:
获得与受试者相关的B细胞;
从包含表达的B细胞可变免疫球蛋白区域的所述细胞分离多核 苷酸;和
通过将所述可变免疫球蛋白区域与识别区域偶联产生包含所述 可变免疫球蛋白区域和识别区域的多核苷酸组合物。
187.一种用于产生多核苷酸组合物的方法,包括:
获得包含受试者相关的B细胞源可变免疫球蛋白区域的多核苷 酸;和
通过将所述可变免疫球蛋白区域与识别区域偶联产生包含所述 可变免疫球蛋白区域和识别区域的多核苷酸组合物。
188.第187项的方法,其中获得所述多核苷酸包括获得B细胞 和处理该细胞以制备所述多核苷酸。
189.第187项的方法,其中获得所述多核苷酸包括直接或间接 地从已经处理B细胞以制备所述多核苷酸的第三方接收所述多核苷 酸。
190.一种用于产生两个或更多个多核苷酸组合物的方法,包 括:
获得包含多个多核苷酸的多核苷酸文库,该多个多核苷酸与从 一个或多个受试者获得的多个样品相关,其中一个或多个多核苷酸 包含表达的B细胞可变免疫球蛋白区域,其中各样品与B细胞相关, 且其中与各样品相关的各多核苷酸存在于单独的容器中;和
通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷 酸组合物,该多核苷酸组合物各包含来自所述多个多核苷酸的多核 苷酸和识别区域,其中各识别区域的序列不同于与文库中其它多核 苷酸偶联的识别区域的序列。
191.第190项的方法,其中获得所述多核苷酸文库包括获得多 个B细胞并处理该细胞以制备所述多核苷酸文库。
192.第190项的方法,其中获得所述多核苷酸文库包括直接或 间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接 收所述多核苷酸文库。
193.一种用于产生两个或更多个多核苷酸组合物的方法,包 括:
获得包含多个多核苷酸的多核苷酸文库,该多个多核苷酸与从 一个或多个受试者获得的多个样品相关,其中一个或多个多核苷酸 包含B细胞源可变免疫球蛋白区域,且其中与各样品相关的各多核 苷酸存在于单独的容器中;和
通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷 酸组合物,该多核苷酸组合物各包含来自所述多个多核苷酸的多核 苷酸和识别区域,其中各识别区域的序列不同于与文库中其它多核 苷酸偶联的识别区域的序列。
194.第193项的方法,其中获得所述多核苷酸文库包括获得多 个B细胞并处理该细胞以制备所述多核苷酸文库。
195.第193项的方法,其中获得所述多核苷酸文库包括直接或 间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接 收所述多核苷酸文库。
196.一种包含多个多核苷酸组合物的多核苷酸组合物文库,其 中各组合物存在于单独的容器中,其中各组合物包含单一样品来源 的cDNA区域和样品识别-接合体区域,所述cDNA区域包含在该 cDNA区域的3’端的核苷酸C,所述样品识别-接合体区域包含与接合体区域偶联的样品识别区域,其中各样品识别-接合体区域的所述 样品识别区域的核苷酸序列不同于文库中各单独的容器中存在的其 它样品识别-接合体区域的样品识别区域的核苷酸序列,其中所述接 合体区域包含在所述接合体区域的3’端的核苷酸G,且其中所述样 品识别-接合体区域通过所述C和G之间的结合连接于所述cDNA区 域。
197.第196项的文库,其中所述cDNA区域包含与DNA多核 苷酸杂交的RNA多核苷酸。
198.第196项或第197项的文库,其中所述cDNA区域包含与 cDNA多核苷酸杂交的mRNA多核苷酸。
199.第196-198项中任一项的文库,其中所述cDNA区域包含 在3’端的至少一个C和其中所述接合体区域包含在3’端的至少一 个G。
200.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含样品识别区域、接合体区域和单一样品来源的cDNA区域,其 中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中 所述cDNA区域与所述接合体区域的3’端偶联,其中来自第一单一样品的各多核苷酸的样品识别区域的序列不同于来自于与所述第一 单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别 区域的序列,且其中所述样品识别区域是双链的。
201.第200项的文库,其中各多核苷酸包含多个样品识别区域。
202.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含通用引物区域、样品识别区域、接合体区域和来自于单一样品 的扩增子区域,其中所述通用引物区域的3’端与所述样品识别区域 的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的 5’端偶联,其中所述扩增子区域可操作地与所述接合体区域偶联, 其中所述通用引物区域的序列在所述多个多核苷酸中的各多核苷酸 上是基本上相同的,且其中来自第一单一样品的各多核苷酸的所述 样品识别区域的序列不同于来自于与所述第一单一样品不同的一个 或多个样品的文库中其它多核苷酸的样品识别区域的序列。
203.第202项的文库,其中所述扩增子区域的5’端与所述接 合体区域的3’端偶联,其中所述通用引物区域包含序列 CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
204.第202-203项中任一项的文库,其中所述通用引物区域的 序列不与任何人基因外显子完全互补,且其中所述通用引物区域具 有不干扰所述接合体区域的最小二级结构。
205.第202-204项中任一项的文库,其中所述通用引物区域是 序列CACGACCGGTGCTCGATTTAG。
206.第202-205项中任一项的文库,其中所述扩增子区域包含 含有cDNA核苷酸序列的cDNA区域。
207.第202-206项中任一项的文库,其中来自于第一单一样品 的各多核苷酸的所述样品识别区域的序列与来自于与所述第一单一 样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域 的序列具有至少一个核苷酸的不同。
208.第202-207项中任一项的文库,其中来自于第一单一样品 的各多核苷酸的所述样品识别区域的序列与来自于与所述第一单一 样品的不同一个或多个样品的文库中其它多核苷酸的样品识别区域 的序列具有至少2个核苷酸的不同。
209.第202-208项中任一项的文库,其中所述样品识别区域长 度为至少10个核苷酸。
210.第202-209项中任一项的文库,其中所述样品识别区域长 度为至少1个核苷酸。
211.第202-210项中任一项的文库,其中各样品识别区域的序 列选自表2和7。
212.第202-211项中任一项的文库,其中所述接合体区域的序 列包含在其3’端的至少一个G核苷酸。
213.第202-211项中任一项的文库,其中所述扩增子区域包含 免疫球蛋白重链扩增子序列、免疫球蛋白轻链扩增子序列、T细胞受 体α扩增子序列或T细胞受体β扩增子序列。
214.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含序列5’-A-B-C-D-3’,其中A是通用引物区域,其中B是样 品识别区域,其中C是接合体区域,其中D是来自于单一样品的扩 增子区域,其中所述通用引物区域的序列在所述多个多核苷酸的各 多核苷酸上是基本上相同的,且其中来自第一单一样品的各多核苷 酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不 同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序 列。
215.一种多核苷酸,包含通用引物区域、样品识别区域、接合 体区域和来自于单一样品的扩增子区域,其中所述通用引物区域的 3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域的 3’端与所述接合体区域的5’端偶联,且其中所述扩增子区域可操作地与所述接合体区域偶联。
216.第215项的多核苷酸,其中所述扩增子区域的5’端与所 述接合体区域的3’端偶联,其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
217.一种包含序列5’-A-B-C-D-3’的多核苷酸,其中A是通 用引物区域,其中B是样品识别区域,其中C是接合体区域,且其 中D是来自于单一样品的扩增子区域。
218.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含第一板识别区域、通用引物区域、样品识别区域、接合体区域 和来自于单一样品的扩增子区域,其中所述通用引物区域的3’端与 所述样品识别区域的5’端偶联,其中所述样品识别区域的3’端与 所述接合体区域的5’端偶联,其中所述第一板识别区域可操作地与 所述通用引物区域偶联,其中所述扩增子区域可操作地与所述接合 体区域偶联,其中所述通用引物区域的序列在所述多个多核苷酸的 各多核苷酸上是基本上相同的,且其中来自第一单一样品的各多核 苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品 不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序 列。
219.第218项的文库,其中来自第一组单一样品的各多核苷酸 的所述第一板识别区域的序列不同于来自于与所述第一组单一样品 不同的一个或多个单一样品组的文库中其它多核苷酸的第一板识别 区域的序列。
220.第218-219项中任一项的文库,其中来自第一组单一样品 的各多核苷酸的所述第一板识别区域的序列与来自于与所述第一组 单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第 一板识别区域的序列具有至少一个核苷酸的不同。
221.第218-220项中任一项的文库,其中来自第一组单一样品 的各多核苷酸的所述第一板识别区域的序列与来自于与所述第一组 单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第 一板识别区域的序列具有至少2个核苷酸的不同。
222.第218-221项中任一项的文库,其中所述第一板识别区域 长度为至少10个多核苷酸。
223.第218-222项中任一项的文库,其中所述第一板识别区域 的序列选自表3和6。
224.第218-223项中任一项的文库,其中所述第一板识别区域 的3’端与所述通用引物区域的5’端偶联,其中所述扩增子区域的 5’端与所述接合体区域的3’端偶联,其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG,其中所述接合体区域包含至少一 个G,其中各多核苷酸进一步包含第二板识别区域、第一测序区域 和第二测序区域,其中所述第二板识别区域的5’端与所述扩增子区 域的3’端偶联,其中所述第一测序区域的3’端与所述第一板识别 区域的5’端偶联,且其中所述第二测序区域的5’端与所述第二板 识别区域的3’端偶联。
225.第218-224项中任一项的文库,其中所述第二板识别区域 的序列与各多核苷酸上所述第一板识别区域的序列相同。
226.第218-225项中任一项的文库,其中来自第一组单一样品 的各多核苷酸的所述第二板识别区域的序列不同于来自于与所述第 一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸 的第二板识别区域的序列。
227.第218-226项中任一项的文库,其中来自第一组单一样品 的各多核苷酸的所述第二板识别区域的序列与来自于与所述第一组 单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第 二板识别区域的序列具有至少一个多核苷酸的不同。
228.第218-227项中任一项的文库,其中来自第一组单一样品 的各多核苷酸的所述第二板识别区域的序列与来自于与所述第一组 单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第 二板识别区域的序列具有至少2个多核苷酸的不同。
229.第218-228项中任一项的文库,其中所述第二板识别区域 长度为至少10个多核苷酸。
230.第218-229项中任一项的文库,其中所述第二板识别区域 的序列选自表3和6。
231.第218-230项中任一项的文库,其中所述第一测序区域包 含GAGAGACTGACAGCGTATCGCCTCCCTCGCGCCATCAG。
232.第218-231项中任一项的文库,其中所述第二测序区域包 含CTATGCGCCTTGCCAGCCCGCTCAG。
233.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含序列5’-A-B-C-D-3’,其中A是板识别区域,其中B是通用 引物区域,其中C是样品识别区域,其中D是接合体区域,其中E 是来自于单一样品的扩增子区域,且其中所述通用引物区域的序列 在所述多个多核苷酸的各多核苷酸上是基本上相同的,且其中来自 第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自 于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷 酸的样品识别区域的序列。
234.一种包含第一板识别区域、通用引物区域、样品识别区域、 接合体区域和来自于单一样品的扩增子区域的多核苷酸,其中所述 通用引物区域的3’端与所述样品识别区域的5’端偶联,其中所述 样品识别区域的3’端与所述接合体区域的5’端偶联,其中所述第 一板识别区域可操作地与所述通用引物区域偶联,且其中所述扩增 子区域可操作地与所述接合体区域偶联。
235.第234项的多核苷酸,其中所述第一板识别区域的3’端 与所述通用引物区域的5’端偶联,其中所述扩增子区域的5’端与 所述接合体区域的3’端偶联,其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG,其中所述接合体区域包含至少一 个G,其中各多核苷酸进一步包含第二板识别区域、第一测序区域 和第二测序区域,其中所述第二板识别区域的5’端与所述扩增子区 域的3’端偶联,其中所述第一测序区域的3’端与所述第一板识别 区域的5’端偶联,且其中所述第二测序区域的5’端与所述第二板 识别区域的3’端偶联。
236.一种包含序列5’-A-B-C-D-E-3’的多核苷酸,其中A是 板识别区域,其中B是通用引物区域,其中C是样品识别区域,其 中D是接合体区域,且其中E是来自于单一样品的扩增子区域。
237.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含第一限制性位点区域、通用引物区域、样品识别区域、接合体 区域、来自于单一样品的扩增子区域和第二限制性位点区域,其中 所述通用引物区域的3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中所 述第一限制性位点区域可操作地与所述通用引物区域偶联,其中所 述扩增子区域可操作地与所述接合体区域偶联,其中所述第二限制 性位点区域可操作地与所述扩增子区域偶联,其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的,且 其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不 同于来自于与所述第一单一样品不同的一个或多个样品的文库中其 它多核苷酸的样品识别区域的序列。
238.第237项的文库,其中所述第一限制性位点区域包含一个 或多个限制性位点。
239.第237-238项中任一项的文库,其中所述第一限制性位点 区域包含选自NheI、XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、KpnI、Acc65I、XmaI、BstEII、DraIII、PacI、FseI、 AsiSI和AscI的一个或多个限制性位点。
240.第237-239项中任一项的文库,其中所述第二限制性位点 区域包含一个或多个限制性位点。
241.第237-240项中任一项的文库,其中所述第二限制性位点 区域包含选自NheI、XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、 AgeI、ApaI、KpnI、Acc65I、XmaI、BstEII、DraIII、PacI、FseI、 AsiSI和AscI的一个或多个限制性位点。
242.第237-241项中任一项的文库,其中所述第一限制性位点 区域的3’端与所述通用引物区域的5’端偶联,其中所述接合体区 域的3’端与所述扩增子区域的5’端偶联,其中所述扩增子区域的 3’端与所述第二限制性位点区域的5’端偶联,其中所述通用引物 区域包含CACGACCGGTGCTCGATTTAG,且其中所述接合体区域 包含至少一个G。
243.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含序列5’-A-B-C-D-E-F-3’,其中A是第一限制性位点区域,其 中B是通用引物区域,其中C是样品识别区域,其中D是接合体区 域,其中E是来自于单一样品的扩增子区域,其中F是第二限制性 位点区域,其中所述通用引物区域的序列在所述多个多核苷酸的各 多核苷酸上是基本上相同的,且其中来自第一单一样品的各多核苷 酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不 同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列。
244.一种用于插入载体中的多核苷酸,其包含第一限制性位点 区域、通用引物区域、样品识别区域、接合体区域、来自于单一样 品的扩增子区域和第二限制性位点区域,其中所述通用引物区域的 3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中所述第一限制性位点区 域可操作地与所述通用引物区域偶联,其中所述扩增子区域可操作 地与所述接合体区域偶联,且其中所述第二限制性位点区域可操作 地与所述扩增子区域偶联。
245.第244项的多核苷酸,其中所述第一限制性位点区域的3’ 端与所述通用引物区域的5’端偶联,其中所述接合体区域的3’端 与所述扩增子区域的5’端偶联,其中所述扩增子区域的3’端与所 述第二限制性位点区域的5’端偶联,其中所述通用引物区域包含CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
246.一种用于插入载体中的多核苷酸,包含序列5’ -A-B-C-D-E-F-3’,其中A是第一限制性位点区域,其中B是通用 引物区域,其中C是样品识别区域,其中D是接合体区域,其中E 是来自于单一样品的扩增子区域,和其中F是第二限制性位点区域。
247.一种多核苷酸接合体分子,其包含通用引物区域、样品识 别区域和接合体区域,其中所述通用引物区域的3’端与所述样品识 别区域的5’端偶联,且其中所述样品识别区域的3’端与所述接合 体区域的5’端偶联。
248.第247项的分子,其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG,且其中所述接合体区域包含至少 一个G。
249.一种多核苷酸引物,其包含通用引物区域和板识别区域, 且其中所述板识别区域的3’端与所述通用引物区域的5’端偶联。
250.第249项的引物,其中所述通用引物区域包含 CACGACCGGTGCTCGATTTAG,其中所述引物进一步包含测序区 域,且其中所述测序区域的3’端与所述板识别区域的5’端偶联。
251.一种包含第1-250项中任一项的多核苷酸的载体。
252.第251项的载体,其中所述载体包含多个多核苷酸。
253.第251-252项中任一项的载体,其中所述载体选自pEE6.4 和pEE12.4。
254.一种分离的宿主细胞,其包含第251-253项中任一项的载 体或第1-250项中任一项的多核苷酸。
255.第254项的宿主细胞,其中所述宿主细胞选自CHO细胞、 CHO-K1细胞、CHO-S细胞、NS0细胞、为dhfr-的CHO细胞、 CHO-dhfr-、DUKX-B11 CHO细胞和DG44 CHO细胞。
256.一种用于产生一个或多个目标多核苷酸的方法,包括:
获得包含与从一个或多个受试者获得的多个样品相关的多个 cDNA的cDNA文库,其中各cDNA与所述多个样品中的单一样品 相关,且其中与各样品相关的各cDNA存在于单独的容器中;和
将接合体分子添加到与各样品相关的cDNA上以产生所述一个 或多个目标多核苷酸,其中所述接合体分子包含样品识别区域和接 合体区域,其中所述样品识别区域的3’端与所述接合体区域的5’ 端偶联,且其中各接合体分子的所述样品识别区域的序列不同于文 库中添加到各cDNA上的其它接合体分子的样品识别区域的序列。
257.第256项的方法,进一步包括使所述接合体区域的3’端 连接到所述文库中各cDNA的3’端以产生所述一个或多个目标多核 苷酸。
258.第256-257项中任一项的方法,其中获得所述cDNA文库 包括获得所述多个样品和处理所述样品以制备所述cDNA文库。
259.第256-258项中任一项的方法,其中所述接合体分子进一 步包含通用引物区域,其中所述通用引物区域的3’端与所述样品识 别区域的5’端偶联。
260.第256-259项中任一项的方法,其中各cDNA区域包含与 cDNA多核苷酸杂交的mRNA多核苷酸。
261.第256-260项中任一项的方法,其中各样品包含细胞。
262.第256-261项中任一项的方法,其中所述细胞是B细胞。
263.第256-262项中任一项的方法,其中所述B细胞是浆母细 胞、记忆B细胞或浆细胞。
264.第256-263项中任一项的方法,其中各样品包含多个细胞。
265.第256-264项中任一项的方法,其中获得所述cDNA文库 包括直接或间接地从已经处理所述多个样品以制备所述cDNA文库 的第三方接收所述cDNA文库。
266.第256-265项中任一项的方法,其中通过将所述接合体与 在反转录反应过程中生成的cDNA的3’尾退火而添加所述接合体。
267.第256-266项中任一项的方法,其中各cDNA包含至少一 个C核苷酸,其中C位于各cDNA的3’端,其中所述接合体区域 包含至少一个G核苷酸,其中G位于所述接合体区域的3’端,且 其中所述接合体区域通过所述G和C之间的结合连接到各cDNA上。
268.第256-267项中任一项的方法,其中所述接合体分子是单 链的,且进一步包括通过允许酶将所述接合体分子形成为双链而将 所述接合体分子并入到各cDNA中。
269.第256-268项中任一项的方法,其中所述接合体分子通过 MMLV H-反转录酶并入到各cDNA中以产生所述目标多核苷酸。
270.一种产生一个或多个用于测序的目标多核苷酸的方法,包 括:
获得包含多个多核苷酸的多核苷酸文库,其中各多核苷酸包含 通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩 增子区域,其中所述通用引物区域的3’端与所述样品识别区域的5’ 端偶联,其中所述样品识别区域的3’端与所述接合体区域的5’端 偶联,且其中所述扩增子区域可操作地与所述接合体区域偶联,其 中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是 基本上相同的,且其中来自第一单一样品的各多核苷酸的所述样品 识别区域的序列不同于来自于与所述第一单一样品不同的一个或多 个样品的文库中其它多核苷酸的样品识别区域的序列;和
利用引物组扩增所述多核苷酸文库以产生所述一个或多个用于 测序的目标多核苷酸,其中所述一个或多个用于测序的目标多核苷 酸包含第一测序区域、第一板识别区域、通用引物区域、样品识别 区域、接合体区域、来自于单一样品的扩增子区域和第二测序区域, 其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联, 其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其 中所述第一板识别区域可操作地与所述通用引物区域偶联,其中所 述扩增子区域可操作地与所述接合体区域偶联,其中所述第一测序 区域位于所述目标多核苷酸的5’端,且其中所述第二测序区域位于 所述目标多核苷酸的3’端。
271.第270项的方法,进一步包括对所述一个或多个目标多核 苷酸进行测序。
272.第270项的方法,进一步包括利用454测序对所述一个或 多个目标多核苷酸进行测序。
273.第270项的方法,进一步包括利用SMRT测序对所述一个 或多个目标多核苷酸进行测序。
274.第270项的方法,进一步包括利用SOLiD测序对所述一 个或多个目标多核苷酸进行测序。
275.第270项的方法,进一步包括利用SOLEXA测序对所述 一个或多个目标多核苷酸进行测序。
276.第270项的方法,进一步包括利用tSMS测序对所述一个 或多个目标多核苷酸进行测序。
277.第270项的方法,其中所述引物组选自表1和5中所示的 引物。
278.第270项的方法,其中获得所述多核苷酸文库包括在实验 室中制备所述多核苷酸文库。
279.第270项的方法,其中获得所述多核苷酸文库包括直接或 间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文 库。
280.一种用于分析测序数据的方法,包括:
获得与多个多核苷酸相关的数据集,其中所述数据集包含所述 多个多核苷酸的测序数据,其中所述多个多核苷酸中的各多核苷酸 包含样品识别区域,且其中各多核苷酸上的各样品识别区域对于单 一样品是独特的,其中来自第一单一样品的各多核苷酸的所述样品 识别区域的序列不同于来自于与所述第一单一样品不同的一个或多 个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序 列;和
分析所述数据集以将具有相同样品识别区域的多核苷酸匹配在 一起,其中匹配表示所述多核苷酸源自于相同的样品。
281.第280项的方法,其中所述多个多核苷酸中的各多核苷酸 还包含第一板识别区域,其中各多核苷酸上的各第一板识别区域与 样品识别区域的各组合对于单一样品是独特的,其中来自第一组单 一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与 所述第一组单一样品不同的一个或多个单一样品组的所述多个多核 苷酸中其它多核苷酸的第一板识别区域的序列;和进一步包括分析 所述数据集以将具有相同的第一板识别区域和相同的样品识别区域 的多核苷酸匹配在一起,其中两个区域的匹配表示所述多核苷酸源 自于相同的样品。
282.第280项的方法,其中获得所述数据集包括获得所述多个 多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。
283.第280项的方法,其中获得所述数据集包括直接或间接地 从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三 方接收所述数据集。
284.第280项的方法,其中所述数据集存储在电子存储介质上。
285.第280项的方法,其中所述单一样品是单一细胞。
286.第280项的方法,其中所述单一样品包含单一细胞。
287.第280项的方法,其中所述单一样品包含单一B细胞。
288.第280项的方法,其中所述单一样品包含多个B细胞。
289.第280项的方法,进一步包括选择一个或多个多核苷酸用 于克隆。
290.一种用于基于第一目标多核苷酸的选择鉴别第二目标多 核苷酸的方法,包括:
获得与多个多核苷酸相关的数据集,其中所述数据集包含所述 多个多核苷酸的测序数据,其中所述多个多核苷酸中的各多核苷酸 包含样品识别区域,且其中各多核苷酸上的各样品识别区域对于单 一样品是独特的,从而将所述多个多核苷酸中的各多核苷酸与独特 的单一样品相关联,其中来自第一单一样品的各多核苷酸的所述样 品识别区域的序列不同于来自于与所述第一单一样品不同的一个或 多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序 列;和
从所述数据集选择与第一单一样品相关的第一目标多核苷酸和 基于所述第一目标多核苷酸的样品识别区域鉴别所述第一单一样品 中的第二目标多核苷酸。
291.第290项的方法,其中所述多个多核苷酸的各多核苷酸还 包含第一板识别区域,其中各多核苷酸上的各第一板识别区域与样 品识别区域的各组合对于单一样品是独特的,其中来自第一组单一 样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所 述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷 酸中其它多核苷酸的第一板识别区域的序列;和进一步包括基于所 述第一目标多核苷酸的样品识别区域和第一板识别区域鉴别所述第 一单一样品中的第二目标多核苷酸。
292.第291项的方法,其中所述第一单一样品包含B细胞。
293.第291项的方法,其中所述第一单一样品包含多个B细胞。
294.第291项的方法,其中所述第一单一样品包含B细胞,其 中所述第一目标多核苷酸包含抗体重链核苷酸序列,且其中所述第 二目标多核苷酸包含抗体轻链核苷酸序列。
295.第291项的方法,其中所述第一单一样品包含B细胞,其 中所述第一目标多核苷酸包含抗体轻链核苷酸序列,且其中所述第 二目标多核苷酸包含抗体重链核苷酸序列。
296.第291项的方法,其中获得所述数据集包括获得所述多个 多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。
297.第291项的方法,其中获得所述数据集包括直接或间接地 从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三 方接收所述数据集。
298.第291项的方法,其中所述数据集存储在电子存储介质上。
299.一种产生用于克隆的一个或多个目标多核苷酸的方法,包 括:
获得包含多个多核苷酸的多核苷酸文库,其中各多核苷酸包含 通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩 增子区域,其中所述通用引物区域的3’端与所述样品识别区域的5’ 端偶联,其中所述样品识别区域的3’端与所述接合体区域的5’端 偶联,且其中所述扩增子区域可操作地与所述接合体区域偶联,其 中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是 基本上相同的,且其中来自第一单一样品的各多核苷酸的所述样品 识别区域的序列不同于来自于与所述第一单一样品不同的一个或多 个样品的文库中其它多核苷酸的样品识别区域的序列;和
利用引物组扩增所述多核苷酸文库以产生所述用于克隆的一个 或多个目标多核苷酸,其中所述用于克隆的一个或多个目标多核苷 酸包含第一限制性位点区域、通用引物区域、样品识别区域、接合 体区域、来自于单一样品的扩增子区域和第二限制性位点区域,其 中所述通用引物区域的3’端与所述样品识别区域的5’端偶联,其 中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中 所述扩增子区域可操作地与所述接合体区域偶联,其中所述第一限 制性位点区域位于所述目标多核苷酸的5’端,且其中所述第二限制性位点区域位于所述目标多核苷酸的3’端。
300.第299项的方法,其中获得所述多核苷酸文库包括在实验 室中制备所述多核苷酸文库。
301.第299项的方法,其中获得所述多核苷酸文库包括直接或 间接地从已经制备所述多核苷酸文库的第三方接收所述多核苷酸文 库。
302.一种产生目标分子的方法,包括:
获得包含多核苷酸的宿主细胞,该多核苷酸包含样品识别区域、 接合体区域和来自于单一样品的扩增子区域,其中所述样品识别区 域的3’端与所述接合体区域的5’端偶联,且其中所述扩增子区域 可操作地与所述接合体区域偶联;和
在足以产生所述目标分子的条件下培养所述宿主细胞。
303.第302项的方法,其中获得所述宿主细胞包括在实验室中 制备包含所述多核苷酸的所述宿主细胞。
304.第302项的方法,其中获得所述宿主细胞包括直接或间接 地从已经制备所述宿主细胞的第三方接收包含所述多核苷酸的所述 宿主细胞。
305.第302项的方法,其中所述目标分子是蛋白质。
306.第302项的方法,其中所述目标分子是抗体。
307.第302项的方法,其中所述目标分子是人单克隆抗体。
308.第302项的方法,进一步包括收集所述目标分子。
309.一种试剂盒,包含第1-308项中任一项的多核苷酸、多核 苷酸文库、载体或宿主细胞及使用说明。
310.一种连接和条码标记多个非连续的目标多核苷酸序列的 方法,所述方法包括:
(a)提供多个cDNA分子;
(b)物理连接目标cDNA分子;和
(c)在物理连接之前、期间或之后将条码序列添加到目标cDNA 上。
311.第310项的方法,其中所述物理连接是通过连接反应。
312.第310项的方法,其中所述物理连接是通过重组。
313.第310项的方法,其中所述物理连接包括使用重叠-延伸 序列。
314.第310项的方法,其中所述条码序列位于物理连接的 cDNA的一端或两端。
315.第310项的方法,其中所述条码序列位于物理连接的cDNA之间。
316.第311项的方法,其中所述连接反应通过相容末端的退火 和连接进行。
317.第310项的方法,其中所述相容末端是限制性位点。
318.第310项的方法,其中所述连接反应通过平端连接进行。
319.第310项的方法,其中所述重叠-延伸序列在使用包含重 叠-延伸尾的引物进行的扩增的过程中添加。
320.第310项的方法,其中所述重叠-延伸序列在使用包含重 叠-延伸尾的引物进行的反转录的过程中添加。
321.第310项的方法,其中所述重叠-延伸序列通过将接合体 与在反转录过程中产生的cDNA的3’尾退火来添加。
322.第310项的方法,其中所述条码序列通过连接反应添加。
323.第310项的方法,其中所述连接反应通过相容末端的退火 和连接进行。
324.第310项的方法,其中所述相容末端是限制性位点。
325.第310项的方法,其中所述连接反应通过包含条码序列的 接合体的平端连接进行。
326.第310项的方法,其中所述条码序列使用包含所述条码序 列的引物在扩增反应的过程中添加。
327.第310项的方法,其中所述条码序列使用包含所述条码序 列的引物在反转录反应的过程中添加。
328.第310项的方法,其中所述条码序列通过将接合体与在反 转录反应过程中产生的cDNA的3’尾退火来添加。
329.第310项的方法,其中所述cDNA的3’端包含至少一个 C核苷酸,且其中所述接合体的3’端包含至少一个G核苷酸,且 其中所述接合体通过所述C和G之间的结合连接到各cDNA上。
330.第310项的方法,其中所述接合体是单链的,且进一步包 括通过允许酶将所述接合体分子形成为双链而将所述接合体并入到 各cDNA中。
331.第310项的方法,其中所述接合体通过MMLV H-反转录 酶并入到各cDNA中。
332.第310项的方法,其中所述重叠-延伸序列包含条码序列。
333.第310项的方法,其中所述目标多核苷酸序列包含抗体重 链和轻链。
334.第310项的方法,进一步包括(d)在物理连接之前、期间或 之后将测序区域添加到所述目标cDNA上。
335.第310项的方法,其中所述测序区域利用接合体添加。
336.第310项的方法,进一步包括(e)使用NextGen测序平台对 物理连接的目标cDNA分子进行测序。
337.第310项的方法,其中所述NextGen测序平台是454测序。
338.第310项的方法,其中所述NextGen测序平台是SMRT 测序。
339.第310项的方法,其中所述NextGen测序平台是SOLiD 测序。
340.第310项的方法,其中所述NextGen测序平台是SOLEXA 测序。
341.第310项的方法,其中所述NextGen测序平台是tSMS测 序。
342.第310项的方法,其中所述多个cDNA分子来自于容纳在 具有至少6个孔、至少12个孔、至少24个孔、至少48个孔、至少 96个孔、至少384个孔、至少1536个孔或更多个孔的板中的单一样 品。
343.第310项的方法,其中所述多个cDNA分子来自于容纳在 至少一个、两个、三个、四个、五个、六个、七个、八个、九个、 十个、二十个、三十个、四十个、五十个、七十五个、一百个或更 多个各具有96个孔的板中的单一样品。
344.一种连接和条码标记包含目标多核苷酸序列的多个样品 的方法,所述方法包括:(a)将所述样品分布在多个容器中;(b)使用 来自所述样品的模板合成目标多核苷酸序列,其中所述合成导致条 码序列的添加;和(c)实现步骤(b)中合成的所述目标多核苷酸序列的 连接。
345.第344项的方法,其中各样品包含细胞。
346.第344项的方法,其中所述细胞是B细胞。
347.第344项的方法,其中所述B细胞是浆母细胞、记忆B 细胞或浆细胞。
348.第344项的方法,其中各样品包含多个细胞。
349.第344项的方法,其中所述目标多核苷酸序列包含抗体重 链和轻链。
350.第344项的方法,其中所述合成包括RT-PCR扩增。
351.第344项的方法,其中所述RT-PCR扩增在单一步骤中进 行。
352.第344项的方法,其中所述目标核苷酸序列的连接在使用 重叠-延伸引物的RT-PCR扩增的过程中进行。
353.第344项的方法,进一步包括(d)在条码序列添加或连接之 前、期间或之后将测序区域添加到所述目标多核苷酸序列上。
354.第344项的方法,其中所述测序区域利用接合体添加。
355.第344项的方法,进一步包括(e)使用NextGen测序平台对 连接的目标多核苷酸序列进行测序。
356.第344项的方法,其中所述NextGen测序平台是454测序。
357.第344项的方法,其中所述NextGen测序平台是SMRT 测序。
358.第344项的方法,其中所述NextGen测序平台是SOLiD 测序。
359.第344项的方法,其中所述NextGen测序平台是SOLEXA 测序。
360.第344项的方法,其中所述NextGen测序平台是tSMS测 序。
361.第344项的方法,其中所述多个样品是容纳在具有至少6 个孔、至少12个孔、至少24个孔、至少48个孔、至少96个孔、 至少384个孔、至少1536个孔或更多个孔的板中的单一样品。
362.第344项的方法,其中所述多个样品是容纳在至少一个、 两个、三个、四个、五个、六个、七个、八个、九个、十个、二十 个、三十个、四十个、五十个、七十五个、一百个、两百个、五百 个或更多个各具有96个孔的板中的单一样品。
363.一种连接和条码标记多个非连续的目标多核苷酸序列的 方法,所述方法包括:(a)将细胞分布在多个容器中以获得分离的一 个或多个细胞;(b)使用来自所述分离的一个或多个细胞的模板扩增 目标多核苷酸序列,其中所述扩增导致条码序列的添加;和(c)实现 步骤(b)中扩增的所述目标多核苷酸序列的连接。
364.第363项的方法,其中所述目标核苷酸序列包含抗体重链 和轻链。
365.第363项的方法,其中所述扩增包括RT-PCR扩增。
366.第363项的方法,其中所述RT-PCR扩增在单一步骤中进 行。
367.第363项的方法,其中所述目标核苷酸序列的连接在使用 重叠-延伸引物的RT-PCR扩增的过程中进行。
368.第363项的方法,进一步包括(d)在条码序列添加或连接之 前、期间或之后将测序区域添加到所述目标多核苷酸序列上。
369.第363项的方法,其中所述测序区域利用接合体添加。
370.第363项的方法,进一步包括(e)使用NextGen测序平台对 连接的目标多核苷酸序列进行测序。
371.第363项的方法,其中所述NextGen测序平台是454测序。
372.第363项的方法,其中所述NextGen测序平台是SMRT 测序。
373.第363项的方法,其中所述NextGen测序平台是SOLiD 测序。
374.第363项的方法,其中所述NextGen测序平台是SOLEXA 测序。
375.第363项的方法,其中所述NextGen测序平台是tSMS测 序。
376.第363项的方法,其中所述一个或多个细胞容纳在具有至 少6个孔、至少12个孔、至少24个孔、至少48个孔、至少96个 孔、至少384个孔、至少1536个孔或更多个孔的板中。
377.第363项的方法,其中所述一个或多个细胞容纳在至少一 个、两个、三个、四个、五个、六个、七个、八个、九个、十个、 二十个、三十个、四十个、五十个、七十五个、一百个或更多个各 具有96个孔的板中。
378.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含序列5’-A-B-C-D-3’,其中A是样品识别区域(条码序列), 其中B是来自于单一样品的第一cDNA区域,其中C是接头区域, 其中D是来自相同的单一样品的第二cDNA区域,且其中来自第一 单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与 所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的 样品识别区域的序列。
379.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含序列5’-A-B-C-D-3’,其中A是来自于单一样品的第一cDNA 区域,其中B是接头区域,其中C是来自相同的单一样品的第二 cDNA区域,其中D是样品识别区域(条码序列),且其中来自第 一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于 与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸 的样品识别区域的序列。
380.一种包含多个多核苷酸的多核苷酸文库,其中各多核苷酸 包含序列5’-A-B-C-3’,其中A是来自于单一样品的第一cDNA 区域,其中B是包含样品识别区域(条码序列)的接头区域,其中 C是来自相同的单一样品的第二cDNA区域,且其中来自第一单一 样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述 第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品 识别区域的序列。
381.第378项的多核苷酸文库,其中所述第一cDNA区域包含 抗体重链和所述第二cDNA区域包含抗体轻链。
382.第378项的多核苷酸文库,其中所述文库包含至少2个、 至少3个、至少10个、至少30个、至少100个、至少300个、至 少1000个、至少3000个、至少10,000个、至少30,000个、至少100,000 个、至少300,000个、至少1,000,000个、至少3,000,000个、至少 10,000,000个、至少30,000,000个或更多个成员。
383.第378项的多核苷酸文库,其中所述文库包含细胞样品的 整个转录组中的至少2个、至少3个、至少10个、至少30个、至 少100个、至少300个、至少1000个、至少3000个、至少10,000 个、至少30,000个或更多个基因。
384.第378项的多核苷酸文库,其中所述文库包含个体的血液 中存在的至少1种、至少2种、至少3种、至少10种、至少30种、 至少100种、至少300种、至少1000种、至少10,000种、至少100,000 种、至少1,000,000种、至少10,000,000种、至少100,000,000种或 更多种不同的抗体种类。
385.第378项的抗体种类,其中所述抗体由浆母细胞、浆细胞、 记忆B细胞、长寿浆细胞、其它B谱系细胞或其组合表达。
附图说明
参照以下及附图,这些以及其它特征、方面和优势将更好理解, 其中:
图1.B细胞分化。成熟的原始B细胞是CD19+且可以在二级淋 巴组织如淋巴结和脾中受到抗原激发时被激活以增殖和分化。它们 在小结外位点(extra-follicular foci)中或在生发中心中增殖和分化。在 小结外位点中的分化B细胞通常分化成为短寿浆细胞且经常驻留在 它们所起源的二级淋巴组织中。在生发中心中分化的B细胞可以变 成记忆B细胞(其可以进一步经由随后的抗原激发进行刺激以分化) 或者具有成为长寿浆细胞的潜能的浆母细胞。这些浆母细胞可以进 入循环中并运输到长寿浆细胞驻留于其中的各种组织,如骨髓、粘 膜组织(对于IgA+浆细胞)和发炎的组织。一些运输的浆细胞也存 在于血液中。所有上述细胞类型也可以在血液的循环中发现。
图2.来自单一分选细胞的配对基因的高通量测序、克隆和表达 的图解。所需的细胞群体是基于其细胞表面标志物的表达分选到96- 孔板中的单一细胞。在反转录过程中,条码标记的(样品-ID)DNA 接合体分子利用MMLV H-反转录酶的模板转换特性添加到合成的第 一链cDNA上。来自各板的RT产物然后单独地汇合并进行2轮的 PCR以扩增特定的扩增子区域(扩增子)。PCR利用具有5’侧翼条 码的引物进行以将板识别区域(板-ID)添加到扩增子上。然后扩增 子发送用于454测序(a)。获得的序列在序列组装之前通过板-ID和样品-ID分成亚组(subset)。来自相同细胞的扩增子使用板-ID和样品-ID 配对在一起且选择所需的克隆用于克隆和表达(b)。特定的扩增子可 以通过使用与该特定扩增子的样品-ID互补的克隆引物从各合并的 扩增子板进行扩增。克隆引物也添加限制性位点区域(RS),其随后 用于将克隆插入到哺乳动物表达载体中用于下游表达和筛选。在该 实例中,扩增子是编码抗体的免疫球蛋白(Ig)重链和轻链基因。表达 的抗体然后可以用于下游筛选(c)。5’RS和3’RS:分别为5’和3’限 制性位点。HC和LC:分别为重链和轻链。
图3.反转录和PCR以添加样品-ID和板-ID到Ig扩增子上的 示意图。反转录(RT)利用Superscript II或Superscript III(其为MMLV H-反转录酶)进行。这些反转录酶具有3’加尾活性并将一对胞嘧啶 添加到新合成的第一链cDNA的3’端。以-GGG(接合体区域)结束的寡核苷酸可以与它互补碱基配对,且然后反转录酶切换模板到该 寡核苷酸并继续转录,从而导致样品-ID接合体并入到cDNA的3’ 端(a)。由于样品-ID接合体含有5’不可变序列(通用引物区域),与 该序列互补的正向引物可以用于后续的PCR。第一PCR利用Fw长 引物1、Fw短引物1和GSP1进行。Fw长引物1具有含板-ID条码 和用于454测序的454钛引物(Titanium Primer)A(它们被整合到 扩增子中)的5’侧翼区域。Fw短引物1具有与GSP1引物类似的Tm 并包括该Fw短引物1以略微提高PCR的效率。各GSP1(基因特异 性引物1)具有互补的基因特异性序列且用于扩增特定基因。此处, 基因特异性引物用于κ和λ轻链及γ重链以扩增这些基因。显示了 引物的序列(b)。第二PCR是嵌套PCR且利用Fw引物2、长GSP2 引物和RV引物2进行。用于引物的序列如所示。长GSP2引物具有 含板-ID条码和用于454测序的454钛引物B(其整合到扩增子中) 的5’侧翼区域。长GSP2引物再次扩增κ和λ轻链及γ重链。RV引 物2具有与Fw引物2类似的Tm并包括该RV引物2以略微提高PCR 效率。显示了引物的序列。在RT和2个PCR后,各扩增子将具有 用于454测序的454钛引物A和B、两个相同的板-ID(各确定该扩 增子为来自特定的单细胞分选的96-孔板)和确定其在96-孔板上的 位置的样品-ID(c)。
图4.使用测序和克隆引物成功扩增单一细胞分选的B细胞。96- 孔板的单一细胞分选的B细胞如图1和图2中所示进行反转录、汇合 和扩增。用于κ轻链、λ轻链和γ重链的条带在琼脂糖凝胶上可视化, 其具有预期的大小:对于κ和λ为~600bp和对于γ为~700bp(a)。γ重 链从5’端的Sanger测序的DNA色谱显示对应于汇合的板的多个样品 -ID的“可变”序列(b)。κ轻链从3’端的Sanger测序显示在恒定区之后 且在对应于多个轻链的VJ接合区处开始的“可变”序列(c)。对于孔A1 特异性的克隆引物对用于扩增κ轻链。Sanger测序显示,与(c)相反, 仅扩增了一个清晰的序列(d)。所有结果代表其它扩增的免疫球蛋白基因。M:100bp DNA梯状序列,K:κ轻链,L:λ轻链,G:γ重链。
图5.CCP+RA患者具有与疾病活动性和分泌的抗瓜氨酸自身 抗体相关的外周血浆母细胞百分比。浆母细胞是 CD19+CD20-CD27+CD38++且首先选通(gated on)CD3-细胞,然后如 所示的进行选通(a)。外周血从同意的RA患者获得且浆母细胞以总 PBMC的百分比作图。Mann-Whitney检验显示CCP+RA患者具有比 CCP-RA患者显著高(p<0.05)的浆母细胞百分比(b)。浆母细胞百分比 在CCP+患者中通过线性回归与临床活动性指数(CDAI)明显相关。线 性回归在对数转换的浆母细胞百分比上进行以实现数据集的正态性 (c)。CCP+浆母细胞也进行模拟分选或进行具有>95%浆母细胞清除 的浆母细胞-耗竭分选(d)并在补充10%FBS的RPMI中培养7天。收 集上清液并利用Luminex分析抗-瓜氨酸肽的反应性。抗各肽的抗体 反应性的平均荧光强度作为肽反应性作图(e)。
图6.选择和筛选用于中和抗体的克隆的策略。配对的LC和 HC抗体序列从454-测序的扩增子的生物信息学分析获得并基于其 LC和HC V(D)J使用(usage)分组成克隆家族。在各克隆家族中以最 高频率存在的克隆选择性地进行克隆、表达和使用ELISA筛选与目标靶抗原的结合。分泌结合抗体的来自整个克隆家族的代表性克隆 然后进行克隆和表达用于中和抗体的筛选。各个抗体图形代表克隆。
图7.免疫球蛋白重链V(D)J序列和源自单个人类受试者的克 隆家族的表征。血液从具有以下病症的人获得:(i)在未服用抗生素 (由于非顺应性)但其免疫系统在脱离抗生素的情况下在几个月内 有效抑制感染和防止暴发性感染的人中的慢性金黄色葡萄球菌骨髓 炎;(ii)患有需要转移到重症监护病房中的急性和暴发性金黄色葡萄 球菌菌血症且具有积极的静脉内抗生素治疗的人;(iii)患有慢性活动 性类风湿性关节炎(RA)(疾病活动性评分(DAS)>5)的3个人;(iv) 接受三价流感病毒疫苗(Fluzone,Sanofi)后7天的人;和(v)预期死亡 但其后的化疗进入长期非进展状态的患有转移性肺腺癌的人。在所 有情况中,人类患者表现出其外周血浆母细胞水平的升高(外周血B 细胞的1.5-6%是浆母细胞[CD20-CD19+CD38++CD27+],而正常人体 中的水平是外周血B细胞的0.1-0.2%),表明激活的免疫应答。浆 母细胞单一细胞分选到96-孔板中,且如图2和3中所描述的进行所 表达的免疫球蛋白cDNA的条码标记和454测序。生物信息学分析 用于配对由单个浆母细胞表达的重链和轻链免疫球蛋白。显示了单 个患者的重链V(D)J使用百分比的饼图-各楔形代表表达独特重链 V(D)J序列重排的浆母细胞的百分比。
图8.来自人类受试者的免疫球蛋白重链V(D)J序列的聚类表 明了克隆家族和克隆亚家族。图7中所述的研究中所产生的免疫球 蛋白重链序列数据集使用Clustal程序进行分级聚类。分级聚类产生 代表在各单个人体中的抗体反应的进化树。
图9.RT和PCR以添加样品-ID和板-ID到任何扩增子上及下 游利用的示意图。包含单一细胞或多细胞的单个样品在孔中单独地 反转录。反转录如前所述地将样品-ID和5’通用引物区域添加到所有 第一链cDNA上(a)。汇合来自板的所有孔的cDNA并进行2轮PCR。 第一PCR使用Fw短引物1、Fw长引物1作为正向引物,且添加用 于454测序的454钛引物A和板-ID到序列的5’端。Fw短引物1具 有类似于GSP1引物的Tm并包括该Fw短引物1以略微提高PCR的 效率。各GSP1引物具有基因特异性序列且可以特异性地扩增该基 因。显示了引物的序列。注意,无论扩增哪个基因,正向引物保持 恒定(b)。第二PCR是嵌套PCR。Fw引物2是正向引物,且反向引 物是长GSP2引物和Rv引物2。长GSP2是基因特异性的且仅扩增 特定基因。其还添加用于454测序的454钛引物B和板-ID到扩增子 的3’端。RV引物2具有类似于Fw引物2的Tm且包括该RV引物 2以略微提高PCR效率。显示了引物的序列。在RT和2轮PCR后, 汇合来自所有板的扩增子并进行454-测序。板-ID和样品-ID的组合 允许鉴别源自于相同样品的序列。这允许多个样品之间的序列比较。 来自于相同来源的序列也可以成对表达以获得来自原始细胞的准确 蛋白质,如T-细胞受体和其它Ig同种型如IgM、IgE和IgA(c)。
图10.用于免疫球蛋白重链和轻链的反转录(RT-GSP)的基因特 异性引物。在重链和轻链基因的反转录中使用RT-GSP而非寡(dT) 作为引物。然后cDNA通过PCR扩增并在琼脂糖凝胶上可视化。 RT-GSP引物IgKC_v3(a)、IgLC_v5、IgLC_v6、IgLC_v7和IgLC_v8 分别处于1-4道(b),IgHGC_v10、IgHGC_v11、IgHGC_v13和 IgGC_v15分别处于1-4道(c)和IgHGC_v16(d)。引物名称中的KC、 LC和GC表明引物分别对于κ链、λ链和γ重链是特异性的。凝胶照片中的白色条带表示已修剪掉非相关道的位置。
图11.接合体区域序列。RNA用包含处于3’末端的接合体区域 和通用引物区域的寡核苷酸反转录。cDNA然后使用通用引物区域序 列作为正向引物和使用基因特异性序列作为反向引物扩增。扩增的 产物在琼脂糖凝胶上可视化。接合体区域由分别在1和2道中的G (a)、GGGGG和rGrGrG组成(b)。rG表示RNA核苷酸而非DNA核 苷酸。
图12.通用引物序列。RNA用包含3’末端的接合体区域和通用 引物区域的寡核苷酸反转录。cDNA然后通过使用与通用引物区域互 补的正向引物和与基因特异性序列互补的反向引物的PCR扩增。 Univ_seq_4(a)、univ_seq_5(b)和univ_seq_f(c)。凝胶照片中的竖直 白色条带表示已修剪掉非相关道的位置。其它道属于相同的凝胶照 片。
图13.用于第一PCR反应的基因特异性引物序列。用于第一 PCR反应中的序列扩增的基因特异性引物。第一PCR反应或后续的 第二嵌套PCR产物进行分析并在琼脂糖凝胶上可视化。使用的反向 引物是分别在1-3道上的IgKC_v4、IgLC_v5、IgHGC_v13(a),分别 在1-3道上的K_GSP1、L_GSP1、G_GSP1(b),分别在1-2道上的 K_GSP1c、L_GSP1c(c),分别在1-2道上的G_GSP1(d)、L_GSP1d、 G_GSP1g(e),分别在1-4道上的G_GSP1h、G_GSP1k、L_GSP1f、 L_GSP1g(f),G_GSP1d(g)分别在1-8道上的L_GSP1h-o(h),分 别在1-6道上的G_GSP1m-q和G_GSP1t(i)。引物名称中的K、L和 G表示引物分别对于κ、λ和γ免疫球蛋白恒定区是特异性的。各凝 胶以左侧的道标记开始,之后是样品道。相同凝胶照片上道之间的 白色条表示已修剪掉其间的非相关道的位置。
图14.用于第二PCR反应的基因特异性序列。用于第二PCR 反应的序列扩增的基因特异性反向引物。PCR产物进行分析并在琼 脂糖凝胶上可视化。使用的反向引物是分别在1-3道上的K_GSP2、 L_GSP2、G_GSP2(a),分别在1-3道上的K_GSP2v2a、K_GSP2v2b、 L_GSP2v2(b),分别在1-4道上的K_GSP2v2c、K_GSP2v2c、 G_GSP2v2c1、G_GSP2v2c2(c),分别在1-3道上的K_GSP2v2d-f(d), 分别在1-3道上的K_GSP2v2g、L_GSP2v2d和G_GSP2b(e)。引物名称中的K、L、G表示它们分别对于κ、λ和γ免疫球蛋白恒定区 是特异性的。各凝胶以左侧的道标记开始,之后是样品道。相同凝 胶照片上道之间的白色条表示其间的非相关道已被修剪掉。
图15.鉴别连接的多核苷酸序列对的条码序列的潜在位置。示 意图显示了两个核酸片段A和B(例如两个cDNA)的物理连接。 条码(BC)附连于任一端或两端或连接A和B的序列中的任何位置。 在一个实施方式中,A和B代表免疫球蛋白重链和轻链序列。
图16.重叠-延伸尾的不同类型。粗线对应于基因特异性序列和 细线对应于重叠尾。如所示的,重叠可能完全是由于引物序列的重 叠或另外地由于与基因特异性序列的部分或全部重叠。如所示的, 重叠也可以包含条码序列。结构I、II和III表明重叠的潜在位置。
图17.连接的抗体轻链和重链对的外部条码添加的示意概图。 显示的是反转录反应的产物。LC基因特异性引物含有条码、测序引 物位点和限制性位点(RE1)以允许这些元件添加到所得PCR产物的 3’端。显示了具有重叠-延伸并编码限制性位点(RE3)的对于LC和HC 特异性的引物。也显示了含有测序引物位点和限制性位点(RE2)的对 于HC特异性的反向引物。扩增产生在一端具有条码的具有所示连 接结构的核酸。
图18.连接的抗体轻链和重链对的内部条码添加的示意概图。 显示的是使用包含延伸重叠的接合体接合通过使用寡(dT)引物的 mRNA反转录获得的cDNA的方法。所示的方法利用了反转录酶的3’加尾和模板转换活性以将重叠-延伸序列添加到待接合的cDNA 上。在该实例中,接合体之一将条码和重叠-延伸序列两者添加到待 接合的cDNA之一上,而仅重叠-延伸序列添加到待接合的另一cDNA 上。扩增后,生成了在连接的cDNA之间带有一个条码序列的连接 结构。
图19.使用通用序列重叠-延伸引物将两个内部条码添加到连 接的抗体轻链和重链对上的示意概图。显示的是使用包含通用序列 和条码两者的接合体接合由使用寡(dT)引物的mRNA反转录获得的 cDNA的方法。在该实例中,对于通用序列的PCR引物将重叠-延伸序列添加到待接合的各cDNA上。在所示的扩增方案后,生成了在 连接的cDNA之间带有两个条码的连接结构。
图20.使用重叠-延伸接合体将两个内部条码添加到连接的抗 体轻链和重链对上的示意概图。显示的是使用包含条码和重叠-延伸 序列两者的接合体接合通过使用基因特异性引物(GSP)的mRNA反 转录获得的cDNA的方法。在该实例中,添加到各cDNA上的接合 体上的重叠-延伸序列允许通过退火接合cDNA。在所示的扩增方案 后,生成了在连接的cDNA之间带有两个条码的连接结构。
图21.与模板转换添加的接合体结合在反转录过程中条码标记 的GSP的用途。RT利用总PBMC RNA及univ_seq_2模板转换寡聚 体和具有另外的5’侧翼序列的IgKC_v3GSP(道1-2)和IgLC_v5 GSP(道3-4)进行,其中第一部分是Fixed_PCR3序列,且最后8bp 是条码。等份的RT反应物用于后续PCR反应中,用5’VK(道1)或 VL(道3)引物或者Univ_seq_2(道2和4)作为5’引物,且Fixed_PCR3 作为3’引物。道2和4中的PCR产物产生弥散条带,表明条码标记 的GSP在RT反应中是非特异性的且不适合用于模板转换添加的接 合体。
图22.用于将单一细胞流式细胞分选到96-孔板中的选通方案。 浆母细胞定义为CD19+CD20-CD27+CD38++。单一PBMC首先基于其 FSC和SSC特性(未显示)选通。然后活的CD19+B细胞选通(左 图),且进一步缩窄到CD20-B细胞(左起第二图),并细化到 CD27+CD38++细胞。由此,IgG+浆母细胞确定为IgA-和IgM-,因为 IgG+浆母细胞不表达细胞表面IgG。这一群体是单一细胞分选到96- 孔板中。
图23.浆母细胞存在于经历免疫球蛋白激发的人中。浆母细胞 在代表性健康供体中占外周血B细胞的0.15%,且在发生多种免疫 球蛋白激发(包括感染(金黄色葡萄球菌和艰难梭菌感染)、癌症 (患有转移性黑素瘤的患者,其由于易普利单抗治疗而成为非进展者>4年,及患有肺的转移性腺癌的患者,其接受化疗后成为长期非 进展者>3年)和疫苗接种(接受流感病毒疫苗))的人中其范围为 0.5%-16.4%。这表明浆母细胞在广泛的发生目标免疫应答的受试者 中升高并可从这些受试者获得以用于单个浆母细胞的分离,其抗体 谱的高通量测序以鉴定主动体液反应。
图24.表达的重组抗体在瞬时转染中分泌2-3周。如图2中概 述的,配对的重链和轻链免疫球蛋白cDNA通过PCR克隆并以48- 孔规模共转染到293T细胞中。每隔一天收集上清液,持续18天。 进行抗-人IgG ELISA以测定收集的上清液中分泌抗体的量,并对一 组个体共转染体的上清液中抗体的浓度作图。分泌倾向于到第9天 达到峰值并基本上到第18天时消失。
图25.来自流感疫苗接种的人的配对抗体重链(HC)和轻链(LC) 表现出互补决定区(CDR)间的变异。图25A:流感病毒抗体的部分树 状图。在重链和轻链配对后,对于重链产生多序列比对,且对于轻 链产生另一多序列比对。两个多序列比对使用Clustalw2 2.1以缺省 参数产生。两个比对连结在一起并用于在CLC Sequence Viewer v. 6.5.2中采用具有100个引导(bootstrap)重复的邻接法构建树状图 (tree)。图25B:用于来自流感疫苗接种的患者的克隆家族的重链 CDR。图中的标识符如下对应于序列表中的序列名称:51.A11.1= NA.51.11.A11.1.454.heavy.3.nb-aa,49.A08.1=NA.49.8.A08.1.454.heavy.3.nb-aa,51.D07.1是通过翻译框1中的NA.51.40.D07.1.454.heavy.3.nb获得的氨基酸序列。图25C:用于来 自流感疫苗接种的患者的克隆家族的轻链CDR。图中的标识符如下 对应于序列表中的序列名称:51.A11.1=NA.51.11.A11.1.454.light.4.nb-aa,49.A08.1= NA.49.8.A08.1.454.light.4.nb-aa,51.D07.1= NA.51.40.D07.1.454.light.4.zerom50-aa。
图26.重组抗-流感病毒抗体结合Fluzone流感病毒疫苗。进行 了对于图7中所描述的流感疫苗接种的人产生的重链和轻链抗体谱 数据集的进化树(图8)的分析以选择所确定的克隆家族代表性的抗 体。代表两个克隆家族以及几个单一态分支的所选择抗体的重链和 轻链通过PCR克隆并共转染到293T细胞中(如图2中概述的), 且如图24中所述从转染体收集上清液。然后重组抗体通过ELISA测 试针对Fluzone流感病毒疫苗(Sanofi)的反应性,其中Fluzone疫苗涂 覆在ELISA板上。重组流感病毒抗体以100ng/ml在ELISA板中孵育,且辣根过氧化物酶(HRP)-偶联的抗-人IgG抗体用于检测抗体结 合。允许TMB底物反应进行30分钟,然后用酸停止液淬灭。读数 显示为450nm吸光度,因为没有提供标准品。代表所确定的克隆家 族的多个重组抗体结合流感病毒疫苗,而其它克隆家族代表性的重 组抗体和“死端(dead end)”不结合流感疫苗。
图27.克隆家族代表性的重组抗-流感病毒抗体以皮摩尔亲和 力结合流感病毒血凝素。在ELISA分析(图26)中结合流感疫苗的来 自于经Fluzone疫苗接种的人的克隆家族代表性的重组抗流感病毒 抗体使用表面等离子体共振(SPR)仪(ProteOn System,Bio-RadLaboratories)进行测试以测定其对于流感病毒血凝素的结合亲和力 (疫苗中存在H3N2A/Perth/16/2009和H1N1 A/California/07/2009 株)。重组抗流感病毒抗体使用EDAC-NHS化学作用结合到表面上, 且H3N2 Perth和H1N1 California血凝素独立地作为配体进行测试, 以血凝素作为分析物。Ka栏代表结合速率(on-rate),Kd栏代表解离 速率(off-rate)和KD代表解离常数。多个重组抗体以皮摩尔亲和力结 合H3N2Perth或H1N1California血凝素。
图28.重组抗-流感病毒抗体在微量中和分析中中和流感病毒 传染力。在FluzoneELISA上表现出反应性的六种抗体(图26)送到协 议研究机构(CRO)Virapur,LLC,(SanDiego,CA)以使用H1N1 California/07/2009流感病毒株和H3N2 A/Perth/16/2009流感病毒株 (Fluzone疫苗中三种流感病毒株中的两种)在微量中和分析中进行 测试。6种重组抗体中的5种在微量中和分析中中和流感病毒,从而 以微克/毫升水平和可能地亚微克/毫升的浓度阻止传染。重组抗体 F21中和H3N2Perth,且虽然其在ELISA分析中结合Fluzone,但其 在SPR分析中不显示结合(图27),很可能是由于所使用的血凝素分 析物的浓度太低以至于结合不能检测到。
图29.重组抗-金黄色葡萄球菌抗体通过流式细胞术结合固定 的金黄色葡萄球菌。对于从控制(无抗生素的情况下)慢性金黄色 葡萄球菌的骨髓炎(如图7中所述)的人产生的重链和轻链抗体谱数 据集的进化树(图8)的分析使得能够选择所确定的克隆家族代表性的 抗体。对于代表两个克隆家族以及几个单一态分支的所选择抗体的 重链和轻链通过PCR克隆并共转染到293T细胞中(如图2中概述 的),且如图24中所述从转染体收集上清液。重组抗-金黄色葡萄球 菌抗体然后测试针对固定的金黄色葡萄球菌的反应性。使用的第二 抗体是FITC-偶联的小鼠抗-人IgG,并在BD LSR II或LSR Fortessa 上分析样品。显示了阳性染色的百分比,其中两个抗流感病毒抗体 用作阴性对照。2°抗体单独不导致高于背景的结合,因为蛋白A很 弱地结合小鼠IgG1(其为2°抗体的同种型)。观察到的高于背景的 染色是由于重组抗-金黄色葡萄球菌抗体与小百分比的表达蛋白的金 黄色葡萄球菌Wood株的结合(a)。对于2个阳性结合抗-金黄色葡萄 球菌抗体S6和S11以及同种型匹配的阴性对照抗流感病毒抗体显示 了流式细胞分析图(b)。抗-金黄色葡萄球菌抗体与金黄色葡萄球菌的 结合水平与使用的抗体量成比例。黑色实线代表10ug/ml的抗体浓 度,黑色虚线代表5ug/ml的抗体浓度,和灰色虚线代表1ug/ml的 抗体浓度(c)。
图30.抗-金黄色葡萄球菌抗体减小金黄色葡萄球菌集落形成 单位的数目。重组抗-金黄色葡萄球菌抗体结合作为补体源的幼兔血 清与金黄色葡萄球菌一起孵育,然后系列稀释和在5%胰酪胨大豆琼 脂(TSA)血液琼脂板上生长过夜。然后计数集落形成单位(CFU)并作 图。两种重组抗-金黄色葡萄球菌抗体(Ab-a和Ab-b)导致杀死金黄色 葡萄球菌并因此导致CFU/ml数的降低。
图31.由发生针对慢性金黄色葡萄球菌感染的有效免疫应答的 人产生重组抗-金黄色葡萄球菌抗体的金黄色葡萄球菌抗体抗原靶 标的鉴别。从临床金黄色葡萄球菌分离菌株产生蛋白质裂解产物。 在来自发生免疫应答的人的抗体谱中鉴定的克隆家族代表性的重组 抗-金黄色葡萄球菌抗体(其阻止慢性金黄色葡萄球菌骨髓炎感染的 进展)用于免疫沉淀来自金黄色葡萄球菌Spa-临床分离菌株的蛋白 质。免疫沉淀物通过SDS-PAGE分离,切除鉴定的条带并使用质谱 法(Agilent XCT-Plus离子阱质谱仪)鉴别图中给出的免疫沉淀的蛋白 质。
图32.从作为长期非进展者的患转移性肺腺癌的人产生抗-肺 腺癌抗体。化疗后成为长期非进展者的患转移性肺腺癌的人表现出 持续升高的血液浆母细胞,表明持续活化的免疫反应(图7)。患者的 外周血浆母细胞进行分选,对抗体谱进行测序,并且克隆家族代表 性的抗体(图8)进行克隆和重组表达。表达的重组抗体之一(其为鉴 定的克隆家族之一代表性的)在免疫组织化学染色中结合独立的肺 腺癌。然后组织阵列用于进一步表征这一抗体的反应性。含多种独 立的肺腺癌、鳞状细胞癌和健康肺组织的组织阵列用100ug/ml的 F(ab)山羊抗-人抗体封闭过夜。载玻片用抗-肺腺癌抗体或作为阴性 对照的抗流感病毒抗体染色,并用Vector Red可视化。载玻片用苏 木精复染。使用Photoshop消除苏木精的蓝色,从而仅核和Vector Red (红色)染色在图像中显现为深灰色。这一重组抗体结合所测试的 (组织阵列中包含的)5个独立肺腺癌组织样品中的4个,但不结合 肺鳞状细胞癌或健康肺组织。
图33.鉴别的抗-肺腺癌抗体(图32)结合肺腺癌细胞系的表面。 重组抗-肺腺癌抗体(图32)强染色肺腺癌细胞系H1650的表面,并仅 显示低水平的肾上皮和肺鳞状细胞肿瘤细胞系的染色。这一抗-肺腺 癌抗体不结合第二种肺腺癌细胞系(H2009),这与我们通过免疫组织 化学测试观察到的这一抗体结合5种独立肺腺癌组织样品中的4种 的现象一致(图32)。
图34.由类风湿关节炎(RA)患者产生类风湿因子抗体。在从RA 患者产生的抗体谱的进化树(图8)中鉴定的克隆家族代表性的重组抗 体进行选择、克隆和重组表达。源自RA患者的重组抗体在直接 ELISA中用作第一抗体和抗-人IgG-HRP用作第二抗体,并且结合用TMB底物可视化。重组抗体RA2和RA3表现出反应性,且因此代 表类风湿因子抗体。
图35.从RA患者产生抗-CCP和抗-组蛋白2A抗体。从具有活 动性疾病的RA患者产生的另外的重组抗体使用组蛋白2A ELISA和 环-瓜氨酸化肽(CCP)ELISA(使用CCP2 ELISA试剂盒[Axis Shield]) 表征。重组抗体以125ug/ml使用。图(a)给出了来自组蛋白2AELISA 的结果,且多种重组抗体结合组蛋白2A。图(b)给出了CCP2 ELISA 的结果,且几种重组抗体表现出阳性反应性。抗-CCP2 ELISA包括 血清反应阴性的和两种血清反应阳性的对照。对于两种分析,吸光 度记录为读数。高于背景(虚线)的吸光度值被认为是阳性的。
图36.证明活动期RA患者的抗-组蛋白2A抗体产生的验证性 独立实验。源自RA患者进化树(图8和图35)的重组抗体在组蛋白 2A ELISA分析中进一步测试。抗体以30ug/ml(比图35中使用的浓 度低4倍)使用。吸光度记录为读数。高于背景的吸光度值被认为 是阳性的。
图37.使用RA抗原阵列鉴别抗-组蛋白和抗-瓜氨酸化蛋白抗 体。源自RA患者的抗体用于探测含原始和瓜氨酸化蛋白和肽的谱 的RA抗原阵列。在与Cy-3-标记的抗-人IgG第二抗体一起孵育后, 重组抗体的结合通过用Axon Instruments GenePix微阵列扫描仪扫描 来定量。反应性显示为热图(heatmap)。源自RA的重组抗体结合几 种独特的瓜氨酸化或原始抗原。
图38.Pacific Biosciences测序提供IgG重链扩增子的全长测序 阅读片段(read)。来自板44的IgG重链扩增子提供给Pacific Biosciences用于SMRT测序。显示了对应于所选择孔的具有条码的 环状共有序列(CCS)阅读片段。
图39.可选细胞表面标志物和其它细胞特征用于鉴定血液浆母 细胞。浆母细胞可以通过使用多种细胞表面标志物和/或细胞特征鉴 别和分选。图(a)表明浆母细胞表现出比静息B细胞高的前向散射 (FSC)。浆母细胞基于CD19+CD20-CD27+CD38hi染色鉴别,且这些结 果表明B细胞(灰色)小于浆母细胞(黑色)。图(b)表明与FSC结合使 用抗-CD19染色鉴别含72%浆母细胞的B细胞群体。图(c)表明,对 于CD19+B细胞群体(细胞被预选通为CD19阳性),侧向散射(SSC) 和FSC可以用于鉴别含37%浆母细胞的B细胞群体。图(d-f)给出了 鉴别在CD19+B细胞群体内的浆母细胞的几种途径。选通(gating on)FSChi细胞给出37%纯度的浆母细胞(c)。选通FSChiCD20-细胞给 出71%纯度的浆母细胞(d)。选通FSChiCD38+细胞给出浆母细胞的 80%纯度(e)。选通FSChiCD27+细胞给出浆母细胞的44%纯度(f)。
图40.人未成熟B细胞(浆母细胞)平均大于静息B细胞但小于 单核细胞。单一态单核细胞、B细胞和浆母细胞进行选通并对于侧 向散射和前向散射参数进行比较。单核细胞通过其特征性的FSC和 SSC特性定义,并定义为CD19-CD3-。B细胞定义为CD19+CD20+。 浆母细胞定义为CD19+CD20-CD27+CD38++。细胞显示在FSC-A(前向 散射面积)和SSC-A(侧向散射面积)轴上(a)。细胞显示在FSC-W(前向 散射宽度)和SSC-W(侧向散射宽度)轴上(b)。浆母细胞FSC-A、 SSC-A、FSC-W、SSC-W的中值除以静息B细胞或单核细胞的中值 以获得代表细胞类型之间的尺寸关系的比率(c)。浆母细胞的20分位 的FSC-A、SSC-A、FSC-W、SSC-W的中值除以静息B细胞或单核 细胞的中值以获得代表细胞类型之间的尺寸关系的比率,其中至少 80%的浆母细胞大于该比率(d)。误差棒表示95%置信区间。
图41.通过显微镜检与静息B细胞相比的人浆母细胞尺寸。浆 母细胞和静息B细胞分别分选为CD19+CD20-CD27+CD38++和 CD19+CD20+。然后细胞使用Olympus显微镜以200x成像。细胞面 积使用ImageJ测量和直径使用面积=π x r2确定,其中直径=2x半径, 且体积按照4/3xπr3确定。误差棒代表四分位数间距。≥8uM或 ≥50uM2或≥268uM3的截止值将包括96%的浆母细胞和排除92%的静 息B细胞。
图42.Superscript III在50℃或低于50℃的温度下具有模板转 换活性。使用以rGrGrG结束的接合体采用道上方所示的温度进行反 转录(RT)90分钟,且1轮PCR使用GAPDH作为3’引物(序列 ATGGTTCACACCCATGACG)进行。如可以看到的,在55℃下可以 观察到没有添加到接合体上的模板转换活性,且模板转换活性从 50℃下的最低活性提高到42℃(所测试的最低温度)下的最高活性, 如在~450bp处条带的亮度所表示的。标志物是100bp的标志物。 Superscript III是具有导致RNA酶H活性丧失的特定突变且具有导 致聚合酶结构域提高热稳定性的突变和在50℃的RT温度下具有 220分钟的半衰期的MMLV反转录酶。已工程化以具有更高热稳定 性的其它MMLV H-酶预期表现出相似的活性。
图43.用于人κ、λ和γ恒定区的另外的引物。这些引物用于第 一PCR,和然后使用表1的引物进行第二PCR,且PCR产物在2% 琼脂糖凝胶上分离并获取图像。用于第一PCR的引物分别是κGSP1、 κGSP1e、κGSP1f、λGSP1、λGSP1x和λGSP1y。序列在表10中。相 同凝胶照片上道之间的白色条表明其间的非相关道已修剪掉。
图44.用于其它人恒定区和基因的另外的引物。进行第一和第 二PCR且产物在2%琼脂糖凝胶上分析和成像。道从左到右为:标 志物、μ、α恒定区、TCRα(a)和标志物、TCRβ(b)。使用的引物和 序列在表10中。相同的凝胶照片上道之间的白色条表示其间的非相 关道已修剪掉。
图45.用于小鼠基因的另外的引物。进行第一和第二PCR且产 物在2%琼脂糖凝胶上分析跑样和成像。道从左到右是:标志物、κ、 λ、λ、λ、λ轻链和μ重链。4个λ道具有所使用引物的这一组合: 小鼠_λ_GSP1a与小鼠_λ_GSP2a,小鼠_λ_GSP 1a与小鼠λGSP2b, 小鼠_λ_GSP1b与小鼠_λ_GSP2a,及小鼠_λ_GSP1b与小鼠λGSP2a (a)。标志物和α重链(b)。分别使用mo_g12_GSP2d和mo_g12_GSP2e 的第二PCR的γ1、2a、2c重链,标志物(c)。标志物,分别使用mo_g3_GSP2d、mo_g3_GSP2e的第二PCR的γ3重链,之后是分别 使用mo_g2b_GSP2d、mo_g2b_GSP2e的第二PCR的γ2b重链(d)。 标志物,TCRα(e)。标志物,TCRβ(f)。相同凝胶照片上道之间的白 色条表示其间的非相关道已修剪掉。
图46.HL-60嗜中性白细胞细胞系的抗-金黄色葡萄球菌抗体介 导的金黄色葡萄球杀灭。各种重组抗-金黄色葡萄球菌抗体(staph 1、 staph 4、staph 6、staph 7、staph9、staph 12)在4℃下与金黄色葡萄 球菌一起孵育30分钟,然后洗掉未结合的抗体,且金黄色葡萄球菌 在37℃下与活化的HL-60细胞和幼兔补体一起孵育45分钟。细胞 然后洗涤两次并且细胞外细菌系列接种在5%TSA血液琼脂板上、 孵育过夜和计数集落形成单位(CFU)。重组抗体staph 6、stepha 9和 staph 12诱导超过20%的金黄色葡萄球菌杀灭。
具体实施方式
组合物
多核苷酸
在一些方面,组合物可以包括多核苷酸。术语“多核苷酸”是指 核酸如DNA分子和RNA分子及其类似物(例如,使用核苷酸类似 物或使用核酸化学作用生成的DNA或RNA)。需要时,多核苷酸 可以通过合成制备,例如使用本领域公认的核酸化学,或者使用例 如聚合酶通过酶学方法制备,且在需要时可以进行修饰。典型的修 饰包括甲基化、生物素化和其它本领域已知的修饰。另外多核苷酸 可以是单链的或双链的,且在需要时可以连接可检测部分。在一些 方面,多核苷酸可以包括杂交分子,例如,包含DNA和RNA。
一般地,“G”、“C”、“A”、“T”和“U”名各代表分别包含鸟嘌呤、胞 嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶作为碱基的核苷酸。但是,应理 解,术语“核糖核苷酸”或“核苷酸”也可以指修饰的核苷酸或替代的置 换部分。本领域技术人员都知道鸟嘌呤、胞嘧啶、腺嘌呤和尿嘧啶 可以被其它部分置换而不实质改变包含带有这种置换部分的核苷酸 的寡核苷酸的碱基配对性质。例如,非限制地,包含肌苷作为其碱 基的核苷酸可以与含有腺嘌呤、胞嘧啶或尿嘧啶的核苷酸碱基配对。 因此,含有尿嘧啶、鸟嘌呤或腺嘌呤的核苷酸可以在核苷酸序列中 被含有例如肌苷的核苷酸置换。在另一个实例中,寡核苷酸中任何 地方的腺嘌呤和胞嘧啶可以分别用鸟嘌呤和尿嘧啶置换以形成与靶 mRNA的G-U摆动碱基配对。含有这种置换部分的序列适合于本文 所述的组合物和方法。
如本文中所用的,且除非另外指明,术语“互补的”在用于相对 于第二核苷酸序列描述第一核苷酸序列时,如本领域技术人员所理 解的,是指包含第一核苷酸序列的多核苷酸在特定条件下与包含第 二核苷酸序列的多核苷酸杂交并形成双链结构的能力。这样的条件 可以是,例如,严格条件,其中严格条件可以包括:400mM NaCl、 40mM PIPES pH 6.4、1mM EDTA、50℃或70℃下12-16小时,随 后洗涤。可以应用其它条件,例如,如可在生物体体内见到的生理 相关条件。本领域技术人员能够按照杂交的核苷酸的最终应用确定 最适合两个序列的互补性测试的条件的集合。
互补的序列包括在一个或两个核苷酸序列的长度或一部分上, 包含第一核苷酸序列的多核苷酸区域与包含第二核苷酸序列的多核 苷酸区域的碱基配对。这样的序列在本文中可以称为彼此“互补的”。 然而,在本文中第一序列被称为与第二序列“基本上互补”的情况中, 两个序列可以互补,或它们可以在碱基配对的区域中包括一个或多 个,但通常不超过约5、4、3或2个错配的碱基对。对于具有错配 的碱基对的两个序列,该序列被认为是“基本上互补的”,只要两个 核苷酸序列通过碱基配对彼此结合。
如本文中所用的,“互补的”序列也可以包括非沃森-克里克碱基 对和/或由非天然和修饰的核苷酸形成的碱基对或者完全由这样的碱 基对形成,只要上述实施方式在其杂交的能力方面得到满足。这样 的非沃森-克里克碱基对包括,但不限于,G:U摆动或Hoogstein碱 基配对。
术语百分“同一性”在两个或更多个核酸或多肽序列的情况中是 指当对比或比对以获得最大对应性时具有指定百分比的相同核苷酸 或氨基酸的两个或更多个序列或子序列,如使用下面描述的序列对 比算法之一(例如,BLASTP和BLASTN或本领域技术人员可得的 其它算法)或通过目视检查测定的。取决于应用,百分“同一性”可 以存在于对比的序列的区域上,例如在功能域上,或者可选地存在 于待对比的两个序列的全长上。
对于序列对比,通常一个序列起到测试序列与其对比的参照序 列的作用,当使用序列对比算法时,测试和参照序列输入计算机中, 在必要时指定子序列坐标和指定序列算法程序参数。然后序列对比 算法基于指定的程序参数相对于参照序列计算测试序列的百分序列 同一性。
可以进行用于对比的序列的最佳比对,例如通过Smith& Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、通过 Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法、 通过Pearson&Lipman,Proc.Nat′l.Acad.Sci.USA 85:2444(1988)的 相似性检索方法、通过这些算法的计算机执行(Wisconsin Genetics Software Package,Genetics Computer Group,575Science Dr.,Madison, Wis.中的GAP、BESTFIT、FASTA和TFASTA)或通过目视检查(一 般地参见Ausubel等,下文)。
适合确定百分序列同一性和序列相似性的算法的一个实例是BLAST算法,其描述于Altschul等,J.Mol.Biol.215:403-410(1990) 中。用于执行BLAST分析的软件通过National Center for Biotechnology Information网站向公众提供。
相同的序列包括包含第一核苷酸序列的多核苷酸与包含第二核 苷酸序列的多核苷酸在一个或两个序列的整个长度上100%的同一 性。这样的序列在本文中可以称为彼此“完全相同”。但是,在一些 方面,在本文中第一序列被称为与第二序列“基本上相同”的情况中, 两个序列可以完全互补,或者它们在比对时可以具有一个或多个, 但通常不超过约5、4、3或2个错配的核苷酸。在一些方面,在本 文中第一序列被称为与第二序列“基本上相同”的情况中,两个序列 可以完全互补,或者它们可以是彼此约50、60、70、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98或99%相同。
在本文中第一序列相对于第二序列的同一性被称为“不同”的情 况中,两个序列在比对时具有至少一个或多个错配的核苷酸。在一 些方面,不同的序列在比对时可以具有2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50或更多个错配的核 苷酸。在一些方面,不同的序列可以是彼此约1、2、3、4、5、6、7、 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、 80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99或低于100%相同。在一些方面,在本文中第一 序列相对于第二序列被称为“不同”的情况中,两个序列可以具有基 本上或完全相同的序列,但另外基于序列内不同的修饰模式而彼此 不同。这样的修饰一般是本领域中已知的,例如甲基化。
在一些方面,多核苷酸可以存在于多核苷酸文库中。在一些方 面,多核苷酸文库可以包括多个多核苷酸。在一些方面,多个多核 苷酸中的各多核苷酸可以源自单一样品。在一些方面,单一样品可 以包括单一细胞如B细胞。
本文中常规符号标记用于描述核苷酸序列:单链核苷酸序列的 左手端是5′-端;双链核苷酸序列的左手方向称作5′-方向。核苷酸添 加至新生RNA转录物上的5′至3′添加方向称作转录方向。具有与 mRNA相同的序列的DNA链称作“编码链”;在具有与从该DNA转录的mRNA相同的序列的DNA链上且位于RNA转录物5′-端的5′ 侧的序列称作“上游序列”;在具有与RNA相同的序列的DNA链且 位于编码的RNA转录物3′-端的3′侧的序列称作“下游序列”。
术语“信使RNA”或“mRNA”是指没有内含子且可以翻译成多肽 的RNA。
术语“cDNA”是指与mRNA互补或与mRNA相同的DNA,其为 单链或双链形式。
术语“扩增子”是指核酸扩增反应,例如RT-PCR,的扩增产物。
术语“杂交”是指与互补核酸的序列特异性非共价结合相互作 用。杂交可以对核酸序列的全部或一部分发生。本领域技术人员会 认识到,核酸双链体或杂交体的稳定性可以通过Tm确定。关于杂交 条件的另外的教导可以在Current Protocols in MolecularBiology, John Wiley&Sons,N.Y.,1989,6.3.1-6.3.6和Sambrook等,MolecularCloning,a Laboratory Manual,Cold Spring Harbor Laboratory Press, 1989,Vol.3中找到。
如本文中所用的,“区域”是指多核苷酸的核苷酸序列的连续部 分。区域的实例在本文中描述并包括识别区域、样品识别区域、板 识别区域、接合体区域等等。在一些方面,多核苷酸可以包括一个 或多个区域。在一些方面,多核苷酸可以包括少于2个、2个、3个、 4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、 14个、15个、16个、17个、18个、19个、20个、21个、22个、 23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、 41个、42个、43个、44个、45个、46个、47个、48个、49个、 50个或更多个区域。在一些方面,区域可以偶联。在一些方面,区 域可以可操作地偶联。在一些方面,区域可以物理偶联。
如本文中所用的,“可变区域”是指由重组事件产生的可变核苷 酸序列,例如它可以包括免疫球蛋白的V、J和/或D区域或从目标T 细胞或B细胞(如活化的T细胞或活化的B细胞)分离的T细胞受 体序列。
如本文中所用的,“B细胞可变免疫球蛋白区域”是指从B细胞 分离的可变免疫球蛋白核苷酸序列。例如,可变免疫球蛋白序列可 以包括从目标B细胞(如记忆B细胞、活化B细胞或浆母细胞)分 离的免疫球蛋白序列的V、J和/或D区域。
如本文中所用的,“识别区域”是指可以与至少一个核苷酸序列 偶联以用于例如随后识别该至少一个核苷酸序列的核苷酸序列标记 (例如,独特的条码序列)。
如本文中所用的,“免疫球蛋白区域”是指来自抗体的一条或两 条链(重链和轻链)的核苷酸序列的连续部分。
如本文中所用的,“接合体区域”是指将第一核苷酸序列与第二 核苷酸序列偶联的接头。在一些方面,接合体区域可以包括作为接 头的核苷酸序列的连续部分。例如,接合体区域可以具有序列GGG 并通过GGG和CCC之间的结合将第一序列与第二序列偶联。
在一些方面,多核苷酸可以包括cDNA区域。在一些方面,多 核苷酸可以包括样品识别-接合体区域。在一些方面,多核苷酸可以 包括样品识别区域。在一些方面,多核苷酸可以包括接合体区域。 在一些方面,多核苷酸可以包括通用引物区域。在一些方面,多核苷酸可以包括扩增子区域。在一些方面,多核苷酸可以包括板识别 区域。在一些方面,多核苷酸可以包括第一板识别区域。在一些方 面,多核苷酸可以包括第二板识别区域。在一些方面,多核苷酸可 以包括限制性位点区域。在一些方面,多核苷酸可以包括第一限制 性位点区域。在一些方面,多核苷酸可以包括第二限制性位点区域。 在一些方面,多核苷酸可以包括测序区域。在一些方面,多核苷酸 可以包括第一测序区域。在一些方面,多核苷酸可以包括第二测序 区域。
在一些方面,多核苷酸可以包括多个本文中描述的任何区域。 例如多核苷酸可以包括第一样品识别区域和第二样品识别区域。在 一些方面,第一样品识别区域和第二样品识别区域相同或基本上相 同。在一些方面,第一样品识别区域和第二样品识别区域不同。在 一些方面,识别区域与可变免疫球蛋白区域偶联。
在一些方面,区域的序列至少足够长以在PCR反应中用作引物 或探针的靶序列。在一些方面,区域长度可以是1碱基对至大于5000 碱基对。例如,区域长度可以是1-10,000个核苷酸,例如2-30核苷 酸的长度,包括其间的所有子范围。作为非限制性的实例,区域可以是1-30个核苷酸、1-26个核苷酸、1-23个核苷酸、1-22个核苷酸、 1-21个核苷酸、1-20个核苷酸、1-19个核苷酸、1-18个核苷酸、1-17 个核苷酸、18-30个核苷酸、18-26个核苷酸、18-23个核苷酸、18-22 个核苷酸、18-21个核苷酸、18-20个核苷酸、19-30个核苷酸、19-26个核苷酸、19-23个核苷酸、19-22个核苷酸、19-21个核苷酸、19-20 个核苷酸、20-30个核苷酸、20-26个核苷酸、20-25个核苷酸、20-24 个核苷酸、20-23个核苷酸、20-22个核苷酸、20-21个核苷酸、21-30 个核苷酸、21-26个核苷酸、21-25个核苷酸、21-24个核苷酸、21-23 个核苷酸或21-22个核苷酸。在一些方面,区域长度可以是约1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、 35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50或更多个核苷酸。在一些方面,区域长度可以是小于50、50-100、 100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000或大于1000个核苷酸。在一些方面,区域长度 可以是小于1000、1000-2000、2000-3000、3000-4000、4000-5000、5000-6000、6000-7000、7000-8000、8000-9000、9000-10000或大于 10000个核苷酸。在一些方面,区域可以包括本文公开的多核苷酸的 至少两个核苷酸、至少3个、至少4个、至少5个、至少6个、至 少7个、至少8个、至少9个、至少10个、至少15个、至少20个 或更多个核苷酸。
术语“样品”可以包括取自受试者(例如,哺乳动物受试者、动 物受试者、人类受试者或非人类动物受试者)的RNA、DNA、单一 细胞或多细胞或细胞片段或等份的体液。样品可以由本领域技术人 员使用现在已知的或以后发现的方式选择,包括离心、静脉穿刺、 抽血、排泄、拭子、射精、按摩、活组织检查、针吸、灌洗样品、 刮擦、手术切开、激光捕获显微解剖、梯度分离或介入或者本领域 中已知的其它方式。样品也可以由本领域技术人员使用一种或多种 已知与目标样品相关的标志物来选择。样品也可以使用本领域已知 的方法(如细胞分选和FACS)来选择。样品选择方法的其它实例描 述在下面的“实施例”节中。
在一些方面,多核苷酸可以源自单一样品或与单一样品相关。 在一些方面,区域可以源自单一样品或与单一样品相关。在一些方 面,cDNA区域可以源自单一样品或与单一样品相关。在一些方面, 扩增子区域可以源自单一样品或与单一样品相关。“单一样品”包括 包含从单一来源获取的多核苷酸的样品。在一些方面,单一来源包 括在特定时间点或在特定位置(例如在受试者中或细胞瓶中或细胞 板中)获取的样品。在一些方面,第一单一样品在第一时间点从第 一受试者获取和第二单一样品在不同于第一时间点的第二时间点从 第一受试者获取。在一些方面,第一单一样品在第一位置从第一受 试者获取和第二单一样品在不同于第一位置的第二位置从第一受试 者获取。在一些方面,第一单一样品在某时间点从第一受试者获取 和第二单一样品在某时间点从第二受试者获取。在一些方面,第一 单一样品在某位置从第一受试者获取和第二单一样品在某位置从第 二受试者获取。在一个实施方式中,样品包含包括源自一个或多个B 细胞的mRNA的多核苷酸。在另一个实施方式中,样品包含包括源 自一个或多个B细胞的cDNA的多核苷酸。在另一个实施方式中,单一样品包含源自一个或多个分选到96-孔或384-孔板的单一孔中 的B细胞的mRNA。样品一般地源自原核细胞(例如,细菌细胞)、 真核细胞(例如,哺乳动物和酵母细胞)或遗传物质的其它来源如 病毒或噬菌体。术语“哺乳动物”或“哺乳动物的”,如本文中所用的, 包括人类和非人类,且包括,但不限于人类、非人灵长类、犬科动 物、猫科动物、鼠科动物、牛科动物、马科动物和猪科动物。在一 些方面,本发明的方法应用于具有至少96个孔、至少384个孔、至 少1536个孔或更多个孔的板中的单一样品。在进一步的方面,本发 明的方法应用于各具有至少96个孔的至少一个、两个、三个、四个、 五个、六个、七个、八个、十个、十五个、二十个、三十个或更多 个板中的单一样品。
在一些方面,5’接合体区域序列和/或样品识别区域添加到来自 于单一样品的所有cDNA上(例如在RT过程中)而不只是添加到 Ig基因上。在一些方面,3’基因特异性引物(GSP)可以用于扩增单一 样品中的任何表达的基因。在一些方面,扩增具有5’可变区域的基 因,例如T细胞受体和细胞受体,而不需要多个简并5’引物来扩增 目标基因。GSP可以包括对于IgG、IgM、IgD、IgA、IgE、TCR链 及其它目标基因特异性的引物。
在一些方面,也可以进行多轮PCR,例如使用嵌套GSP。对于 这种嵌套GSP,用于第二轮PCR的GSP在相对于第一轮PCR中使 用的GSP杂交的位置沿靶基因序列5′侧的位置处与靶基因序列杂 交。
在一些方面,cDNA区域或扩增子区域可以包括DNA多核苷酸。 在一些方面,cDNA区域或扩增子区域可以包括cDNA多核苷酸。 在一些方面,cDNA区域或扩增子区域可以包括与DNA多核苷酸杂 交的RNA多核苷酸。在一些方面,cDNA区域或扩增子区域可以包 括与cDNA多核苷酸的mRNA多核苷酸。
在一些方面,通用引物区域不与任何人外显子完全互补。在一 些方面,通用引物区域不与任何表达的人基因完全互补。在一些方 面,通用引物区域具有最低的二级结构。
在一些方面,扩增子区域包含免疫球蛋白重链扩增子序列。在 一些方面,扩增子区域包含免疫球蛋白轻链扩增子序列。在一些方 面,扩增子区域包含T细胞受体α扩增子序列。在一些方面,扩增 子区域包含T细胞受体β扩增子序列。
在一些方面,多核苷酸存在于多核苷酸文库中且可以基于多核 苷酸的区域与文库中存在的其它多核苷酸区分开。
在一些方面,源自第一单一样品的文库中各多核苷酸的样品识 别区域的序列不同于源自与该第一单一样品不同的一个或多个样品 的文库中其它多核苷酸的样品识别区域的序列。在一些方面,源自 第一单一样品的文库中各多核苷酸的样品识别区域的序列与源自与 该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样 品识别区域的序列具有至少一个核苷酸的不同。在一些方面,源自 第一单一样品的文库中各多核苷酸的样品识别区域的序列与源自与 该第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样 品识别区域的序列具有至少2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个核苷酸的不同。在一些 方面,源自第一单一样品的文库中各多核苷酸的样品识别区域的序 列可以与源自与该第一单一样品不同的一个或多个样品的文库中其 它多核苷酸的样品识别区域的序列约1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50、60、70、80、81、 82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、 97、98、99或低于100%相同。在一些方面,源自第一单一样品的文库中各多核苷酸的样品识别区域的序列与源自与该第一单一样品不 同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列 低于100%相同。在一些方面,样品识别区域用作从单一样品反转录 的所有第一链cDNA上的数字条码。在一些方面,样品识别区域长度为至少1个核苷酸。在一些方面,样品识别区域可以包含至少3 个核苷酸,且样品识别区域彼此可以具有至少1个核苷酸的不同。 在一个实施方式中,样品识别区域长度为3-15个核苷酸且彼此具有 至少1个核苷酸的不同。在一些方面,样品识别区域可以包含至少 64个变体(使用长度3个核苷酸的样品识别区域,其中各样品-ID 彼此具有至少1个核苷酸的不同),或在一些方面,包含更大数目 的变体。在一些方面,3’连接于样品识别区域的序列可以是包含至少 1个G的接合体区域。在优选的实施方式中,3’连接于样品识别区域 的序列可以是包含至少2个G的接合体区域。在一个实施方式中, 连接于样品识别区域的5’端的序列是可以在PCR扩增过程中使用的 通用引物区域,从而不需要后续添加5’通用引物序列(通过连接反 应或另一种方法)或者使用多个简并5’引物以扩增具有可变5’区域 的基因。样品识别区域的实例显示于表2和8中。
在一些方面,源自于第一组单一样品的文库中各多核苷酸的第 一板识别区域的序列不同于源自于与该第一组单一样品不同的一个 或多个单一样品组的文库中其它多核苷酸的第一板识别区域的序 列。在一些方面,源自于第一组单一样品的文库中各多核苷酸的第 一板识别区域的序列与源自于与该第一组单一样品不同的一个或多 个单一样品组的文库中其它多核苷酸的第一板识别区域的序列具有 至少1个核苷酸的不同。在一些方面,源自于第一组单一样品的文 库中各多核苷酸的第一板识别区域的序列与源自于与该第一组单一 样品不同的一个或多个单一样品组的文库中其它多核苷酸的第一板 识别区域的序列具有至少2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个核苷酸的不同。在一些 方面,源自于第一组单一样品的文库中各多核苷酸的第一板识别区 域的序列可以与源自于与该第一组单一样品不同的一个或多个单一 样品组的文库中其它多核苷酸的第一板识别区域的序列约1、2、3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、 35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50、60、70、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99或低于100%相同。在一些方面, 源自于第一组单一样品的文库中各多核苷酸的第一板识别区域的序 列与源自于与该第一组单一样品不同的一个或多个单一样品组的文 库中其它多核苷酸的第一板识别区域的序列低于100%相同。第一板 识别区域的实例显示于表3和7中。
在一些方面,源自于第一组单一样品的文库中各多核苷酸的第 二板识别区域的序列不同于源自于与该第一组单一样品不同的一个 或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序 列。在一些方面,源自于第一组单一样品的文库中各多核苷酸的第 二板识别区域的序列与源自于与该第一组单一样品不同的一个或多 个单一样品组的文库中其它多核苷酸的第二板识别区域的序列具有 至少1个核苷酸的不同。在一些方面,源自于第一组单一样品的文 库中各多核苷酸的第二板识别区域的序列与源自于与该第一组单一 样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板 识别区域的序列具有至少2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50或更多个核苷酸的不同。在一些 方面,第二板识别区域的序列与多核苷酸上第一板识别区域的序列 相同。在一些方面,源自于第一组单一样品的文库中各多核苷酸的 第二板识别区域的序列可以与源自于与该第一组单一样品不同的一 个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序 列约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、 47、48、49、50、60、70、80、81、82、83、84、85、86、87、88、 89、90、91、92、93、94、95、96、97、98、99或低于100%相同。 在一些方面,源自于第一组单一样品的文库中各多核苷酸的第二板 识别区域的序列可以与源自于与该第一组单一样品不同的一个或多个单一样品组的文库中其它多核苷酸的第二板识别区域的序列低于 100%相同。第二板识别区域的实例显示于表3和7中。
在一些方面,板识别区域(例如,第一板识别区域或第二板识 别区域)可以包含至少2个核苷酸,且板识别区域彼此具有至少1 个核苷酸的不同。在一个实施方式中,板识别区域长度为2-10个核 苷酸且彼此具有至少1个核苷酸的不同。在一些方面,仅在一些实 施方式中发现了板识别区域的使用,因为较大数目的不同样品识别 区域(每个待分析的单一样品一个)的使用可以消除对板识别区域 的需要。在一些方面,板识别区域用于减少需要合成的含样品识别 区域的独特寡核苷酸的数目。
在一些方面,多核苷酸包括一个或多个接合体区域。在一些方 面,接合体区域包括一个或多个G。在一些方面,接合体区域包括2、 3、4、5、6、7、8、9、10或更多个G。在一些方面,接合体区域利 用MMLV H-反转录酶的模板转换性质连接到cDNA的3’端。存在着 连接接合体区域的不同方法,包括,但不限于使用具有5’侧翼接合 体区域序列的引物进行PCR、粘端和平端连接、模板转换介导的核 苷酸添加或者其它将核苷酸共价连接到多核苷酸的5’端、到3’端或 到5’和3’端的方法。这些方法可以利用通常用于分子生物学中的酶 的特性。PCR可以使用例如耐热的DNA聚合酶。互补或基本上互补 的粘性末端通过用遗留悬端的限制性内切酶切割dsDNA产生或通过 酶(如TdT(末端转移酶))的3’加尾活性产生。粘端和平端然后可 以使用连接酶如T4连接酶与互补的接合体区域连接。模板转换利用 MMLV H-反转录酶的3’加尾活性以将一个或多个胞嘧啶(C)添加到 cDNA的3’端及利用其转换模板的能力以从mRNA转换到具有互补 的G的接合体区域。在一些方面,cDNA在其3’端包括1、2、3、4、 5、6、7、8、9、10或更多个C。
在一些方面,多核苷酸包括一个或多个限制性位点区域。限制 性位点区域包括一个或多个限制性位点。限制性位点可以包括: NheI、XhoI、BstBI、EcoRI、SacII、BbvCI、PspXI、AgeI、ApaI、 KpnI、Acc65I、XmaI、BstEII、DraIII、PacI、FseI、AsiSI和AscI。 在一些方面,可以使用任何稀有8-切点酶(rare 8-cutter enzyme)限 制性位点。
在一些方面,本文描述的多核苷酸的一个或多个区域可以可操 作地与多核苷酸的一个或多个其它区域偶联。在一些方面,单一多 核苷酸的两个或更多个独特区域可以可操作地偶联。例如,通用引 物区域可以可操作地与接合体区域偶联。在一些方面,序列上彼此 基本上相同或描述上相同的两个或更多个区域可以可操作地偶联在 一起。例如,第一样品识别区域可以可操作地与第二样品识别区域 偶联。在一些方面,第一样品识别区域和第二样品识别区域的序列 相同或基本上相同。在一些方面,第一样品识别区域和第二样品识 别区域的序列不同或相异。
在一些方面,本文描述的多核苷酸的一个或多个区域可以与多 核苷酸的一个或多个其它区域偶联。在一些方面,单一多核苷酸的 两个或更多个不同区域可以偶联。例如,通用引物区域可以与接合 体区域偶联。在一些方面,序列上彼此基本上相同或描述上相同的 两个或更多个区域可以偶联在一起。例如,第一样品识别区域可以 与第二样品识别区域偶联。在一些方面,第一样品识别区域和第二 样品识别区域的序列相同或基本上相同。在一些方面,第一样品识 别区域和第二样品识别区域的序列不同或相异。
在一些方面,多核苷酸包括序列5’-A-B-3’,其中A是样品识别 区域,和其中B是接合体区域。在一些方面,多核苷酸包括序列 5’-A-B-C-3’,其中A是通用引物区域,其中B是样品识别区域,和 其中C是接合体区域。在一些方面,多核苷酸包括序列5’-A-B-C-3’, 其中A是样品识别区域,其中B是接合体区域,和其中C是源自单 一样品的扩增子区域。在一些方面,多核苷酸包括序列 5’-A-B-C-D-3’,其中A是通用引物区域,其中B是样品识别区域,其中C是接合体区域,和其中D是源自单一样品的扩增子区域。在 一些方面,多核苷酸包括序列5’-A-B-C-D-E-3’,其中A是板识别区 域,其中B是通用引物区域,其中C是样品识别区域,其中D是接 合体区域,和其中E是源自单一样品的扩增子区域。在一些方面, 多核苷酸包括序列5’-A-B-C-D-E-F-3’,其中A是第一限制性位点区 域,其中B是通用引物区域,其中C是样品识别区域,其中D是接 合体区域,其中E是源自单一样品的扩增子区域,和其中F是第二 限制性位点区域。
在一些方面,上述序列中各序列的区域可以以不同的顺序重排, 例如,5’-C-A-D-B-3’或5’-E-A-C-B-D-F-3’或5’-B-A-3’。在一些方面, 上述序列的一个或多个区域可以被删除,例如5’-A-D-3’或 5’-B-C-3’。在一些方面,一个或多个另外的区域可以添加到上述序 列上,例如5’-A-A2-B-3’或5’-A-B-C-D-E-F-G-3’。在这样的实例中, 一个或多个另外的区域可以是本文公开的任何区域或其等同物。在 一些方面,上述序列的一个或多个区域可以被修饰,例如甲基化。
在一些方面,多核苷酸可以包括接合体分子。在一些方面,多 核苷酸接合体分子可以包括通用引物区域、样品识别区域和接合体 区域,其中通用引物区域的3’端与样品识别区域的5’端偶联,且其 中样品识别区域的3’端与接合体区域的5’端偶联。在一些方面,接 合体分子包括含有与通过反转录在第一链cDNA的3’端添加的C结 合的至少2个核苷酸。在一些方面,接合体分子包括包含3-6个G (DNA G)的脱氧核糖多核苷酸。在另一个实施方式中,接合体分子包 括由3-6个G(RNA G)组成的核糖多核苷酸。在其它实施方式中,接 合体分子可以利用核苷酸类似物,如锁核酸(LNA),例如LNA G。 在其它实施方式中,核苷酸碱基也可以是通用的或简并的碱基,如 可以与C碱基配对的5-硝基吲哚和3-硝基吡咯,以及任何组合的其 它核苷酸。
在一些方面,多核苷酸可以包括引物或探针。在一些方面,引 物可以包括通用引物区域和板识别区域,且其中板识别区域的3’端 与通用引物区域的5’端偶联。
在一些方面,组合物可以包括多核苷酸组合物文库。在一些方 面,多核苷酸组合物文库包括多个多核苷酸组合物。在一些方面, 各组合物存在于单独的容器中。在一些方面,容器可以是试管。在 一些方面,容器可以是板中的孔。在一些方面,容器可以是96-孔板中的孔。在一些方面,容器可以是384-孔板中的孔。在一些方面, 各组合物包含源自单一样品的cDNA区域。在一些方面,各组合物 包含含有与接合体区域偶联的样品识别区域的样品识别-接合体区 域。在一些方面,文库中各样品识别-接合体区域的样品识别区域的 序列不同于文库中各单独容器中存在的其它样品识别-接合体区域的 样品识别区域的核苷酸序列。在一些方面,样品识别-接合体区域连 接到cDNA区域上。在一些方面,样品识别-接合体区域通过其3’区 域间的结合连接到cDNA区域上。在一些方面,样品识别-接合体区 域通过G∶C结合连接到cDNA区域上。在一些方面,cDNA区域包 含与DNA多核苷酸杂交的RNA多核苷酸。在一些方面,cDNA区 域包含与cDNA多核苷酸杂交的mRNA多核苷酸。
在一些方面,多核苷酸文库中的多个多核苷酸组合物可以包含 至少2个、至少3个、至少10个、至少30个、至少100个、至少 300个、至少1000个、至少3000个、至少10,000个、至少30,000 个、至少100,000个、至少300,000个、至少1,000,000个、至少 3,000,000个、至少10,000,000个、至少30,000,000个或更多个成员。 在其它方面,多核苷酸文库中的多个多核苷酸组合物可以包含细胞 样品的整个转录组中的至少2个、至少3个、至少10个、至少30 个、至少100个、至少300个、至少1000个、至少3000个、至少 10,000个、至少30,000个或更多个基因。在其它方面,多核苷酸文 库中的多个多核苷酸组合物包含个体血液中存在的至少1个、至少2 个、至少3个、至少10个、至少30个、至少100个、至少300个、 至少1000个、至少10,000个、至少100,000个、至少1,000,000个、 至少10,000,000个、至少1,000,000,000个或更多个不同的抗体种类。 这些抗体种类可以由浆母细胞、浆细胞、记忆B细胞、长寿浆细胞、 原始B细胞、其它B谱系细胞或其组合表达。
载体
在一些方面,组合物可以包括载体。载体可以用于用核酸序列 转化宿主细胞。在一些方面,载体可以包括一个或多个本文所述的 多核苷酸。在一个实施方式中,编码目标多肽的核酸序列的文库可 以引入细胞群体中,从而允许文库的筛选。术语“载体”用于指核酸 序列可以插入其中的载体核酸分子以引入到其可以复制的细胞中。 核酸序列可以是“外源的”或“异源的”,这意味着它对于载体被引入其 中的细胞是外来的,或者该序列对于细胞中的序列是同源的但它处 于宿主细胞核酸内该序列原先不存在的位置中。载体包括质粒、粘 粒和病毒(例如噬菌体)。本领域技术人员可以通过标准重组技术 构建载体,其描述于Maniatis等,1988和Ausubel等,1994中,这两 篇参考文献通过引入并入本文。在一些方面,载体可以是具有预工 程化加入的抗体恒定区的载体。以这种方式,本领域技术人员可以 仅克隆目标抗体的VDJ区域并将那些区域克隆到预工程化的载体 中。
术语“表达载体”是指包含编码至少部分能够转录的基因产物的 核酸序列的载体。在一些情况中,RNA分子然后翻译成蛋白质、多 肽或肽。表达载体可以包含多个“控制序列”,其是指用于可操作地 连接的编码序列在特定宿主生物体中的转录及可能的翻译的核酸序 列。除了管理转录和翻译的控制序列外,载体和表达载体可以包含 也发挥其它功能的核酸序列。
在一些方面,载体可以包括启动子。在一些方面,载体可以包 括增强子。“启动子”是在该处控制转录的起始和速率的核酸序列的 区域。它可以包含在此处调控蛋白质和分子如RNA聚合酶和其它转 录因子可以结合的遗传元件。短语“可操作地定位”、“可操作地连接”、 “在控制下”和“在转录控制下”意思是启动子处于相对于核酸序列的 正确功能位置和/或方向以控制该序列的转录起始和/或表达。启动子 可以与“增强子”(其是指参与核酸序列的转录活化的顺式作用调控 序列)结合使用或不与其结合。
启动子可以是天然与基因或序列相关的启动子,如可以通过分 离位于编码片段和/或外显子上游的5′非编码序列获得的。这样的启 动子可以称作“内源的”。类似地,增强子可以是天然与核酸序列相 关的增强子,其位于该序列的下游或上游。或者,某些优势通过将 编码核酸片段定位在重组的或异源的启动子(其是指正常情况下在 其自然环境中不与核酸序列相关的启动子)的控制下而获得。重组 的或异源的增强子也指正常情况下在其自然环境中不与核酸序列相 关的增强子。这样的启动子或增强子可以包括其它基因的启动子或 增强子,和从任何其它原核细胞分离的启动子或增强子,和非“天然 存在的”启动子或增强子,即含有不同转录调控区域的不同元件和/ 或改变表达的突变。除了通过合成产生启动子和增强子的核酸序列 外,序列可以使用与本文描述的组合物相关的重组克隆和/或核酸扩 增技术(包括PCR)产生(参见U.S.专利号4,683,202,U.S.专利号 5,928,906,各通过引用并入本文)。
在一些方面,启动子和/或增强子有效地在选择用于表达的细胞 类型中指导DNA片段的表达。可以使用的这种启动子的实例是大肠 杆菌阿拉伯糖或T7启动子。分子生物学领域的那些技术人员通常熟 悉用于蛋白质表达的启动子、增强子和细胞类型组合的使用,例如, 参见Sambrook等(1989),其通过引用并入本文。使用的启动子可以 是组成型的、组织特异性的、诱导型的和/或可用于在适当条件下指 导引入的DNA片段的高水平表达,如在大规模生产重组蛋白质和/ 或肽中有利的。启动子可以是异源的或内源的。
在一些方面,载体可以包括起始信号和/或内部核糖体结合位点。 也可以包括用于有效翻译编码序列的特定的起始信号。这些信号包 括ATG起始密码子或邻接序列。可能需要提供外源翻译控制信号, 包括ATG起始密码子。本领域技术人员能够容易地确定这一点并提 供必要的信号。公知的是,起始密码子必须与所需编码序列的阅读 框是“同框(in-frame)”的以确保整个插入序列的翻译。外源翻译控制 信号和起始密码子可以是天然的或合成的。表达效率可以通过包括 适当的转录增强子元件而增强。
在一些方面,载体可以包括提高或优化编码目标基因的DNA片 段的表达水平的序列。这样的序列的例子包括在表达的mRNA中添 加内含子(Brinster,R.L.等(1988)Intronsincrease transcriptional efficiency in transgenic mice.Proc.Natl.Acad.Sci.USA85,836-40; Choi,T.等(1991)A generic intron increases gene expression intransgenic mice.Mol.Cell.Biol.11,3070-4)。用于优化DNA片段的 表达的方法的另一实例是“密码子优化”。密码子优化包括将沉默突 变插入到DNA片段中以减少稀有密码子的使用,从而优化蛋白质翻 译(Codon engineering for improved antibody expression inmammalian cells.Carton JM,Sauerwald T,Hawley-Nelson P,Morse B,Peffer N, BeckH,Lu J,Cotty A,Amegadzie B,Sweet R.Protein Expr Purif.2007 Oct;55(2):279-86.Epub 2007Jun 16.)。
在一些方面,载体可以包括多克隆位点。载体可以包括多克隆 位点(MCS),其是含有多个限制性酶切位点的核酸区域,其中的任何 限制性酶切位点可以结合标准重组技术使用以消化载体(参见 Carbonelli等,1999,Levenson等,1998和Cocea,1997,通过引用并入 本文)。“限制性酶消化”是指核酸分子用仅在核酸分子的特定位置发 挥功能的酶进行酶促切割。许多的这些限制性酶是商业可得的。本 领域技术人员知道这样的酶的使用。经常地,载体使用在MCS内切 割的限制性酶线性化或片段化以使得外源序列能够连接到载体上。 “连接反应”是指在两个核酸片段(其可以相对于彼此是连续的或不 连续的)之间形成磷酸二酯键的过程。涉及限制性酶和连接反应的 技术是重组技术领域的技术人员公知的。
在一些方面,载体可以包括终止信号。载体或构建体一般包含 至少一个终止信号。“终止信号”或“终止子”由参与由RNA聚合酶导 致的RNA转录物的特定终止的DNA序列构成。因此,在某些实施 方式中,设想了终止RNA转录物产生的终止信号。终止子可能是体 内需要的以实现所需的信息水平。
设想使用的终止子包括本文描述的或本领域技术人员已知的任 何已知转录终止子,包括但不限于,例如,rho依赖性或rho非依赖 性终止子。在某些实施方式中,终止信号可以缺乏可转录或可翻译 序列,如由于序列截断。
在一些方面,载体可以包括复制起点。
为了在宿主细胞中增殖载体,它可以包含一个或多个复制起点 位点(通常称作“ori”),其是复制起始的特定核酸序列。
在一些方面,载体可以包括一个或多个可选择和/或可筛选的标 记。在某些实施方式中,含有核酸构建体的细胞可以通过在表达载 体中包括标记而在体外或体内鉴别。这样的标记对细胞赋予允许容 易地识别包含表达载体的细胞的可鉴别的变化。一般地,可选择标 记是赋予允许对其进行选择的性质的标记。阳性可选择标记是其中 标记的存在允许对其进行选择的标记,而阴性可选择标记是其中其 存在阻止其选择的标记。阳性可选择标记的实例是药物抗性标记。
通常,包括药物选择标记有助于克隆和转化体的鉴别,例如, 赋予对新霉素、嘌呤霉素、潮霉素、DHFR、GPT、博来霉素(zeocin) 和组氨醇的抗性的基因是可用的选择标记。除了赋予允许基于条件 的执行区分转化体的表型的标记外,也设想了其它类型的标记(包括可筛选标记如GFP,其基础是比色分析)。或者,可以使用可筛 选的酶如氯霉素乙酰转移酶(CAT)。本领域技术人员也知道如何使用 免疫标志物,可能的话与FACS分析结合。使用的标志物据信不是 重要的,只要它能够与编码基因产物的核酸同时表达。可选择和可 筛选标记的进一步实例是本领域技术人员公知的。
在一个方面,载体可以表达编码多个目标多肽的DNA片段。例 如,编码免疫球蛋白重链和轻链两者的DNA片段可以通过单一载体 编码和表达。在一个方面,两个DNA片段可以包括在相同的表达 RNA上且和内部核糖体结合位点(IRES)序列用于使DNA片段能够 表达为独立的多肽(Pinkstaff JK,Chappell SA,Mauro VP,Edelman GM,Krushel LA.,Internal initiation of translation of five dendritically localized neuronalmRNAs.,Proc Natl Acad Sci U S A.2001 Feb 27;98(5):2770-5.Epub 2001 Feb 20.)。在另一个方面,各DNA片段具 有其自己的启动子区域,导致单独mRNA的表达(Andersen CR,Nielsen LS,Baer A,Tolstrup AB,Weilguny D.Efficient Expression from One CMVEnhancer Controlling Two Core Promoters.Mol Biotechnol.2010 Nov 27.[Epubahead of print])。
宿主细胞和表达系统
在一些方面,组合物可以包括宿主细胞。在一些方面,宿主细 胞可以包括本文描述的多核苷酸或载体。在一些方面,宿主细胞可 以包括真核细胞(例如,昆虫、酵母或哺乳动物)或原核细胞(例 如,细菌)。在表达异源核酸序列的情况中,“宿主细胞”可以指原 核细胞,且其包括能够复制载体和/或表达载体编码的异源基因的任 何可转化生物体。宿主细胞可以且已经用作载体的接受者。宿主细 胞可以是“转染的”或“转化的”,其是指外源核酸转移或引入到宿主细 胞中的过程。转化的细胞包括原代主体细胞或其后代。
在特定的实施方式中,宿主细胞是革兰氏阴性细菌细胞。这些 细菌适合使用,因为它们具有内膜与外膜之间的周质间隙和特别地 周质与细胞质之间的前述内膜,其也称作细胞质膜。如此,可以使 用具有这样的周质间隙的任何其它细胞。革兰氏阴性细菌的例子包 括,但不限于大肠杆菌(E.coli)、铜绿假单胞菌(Pseudomonas aeruginosa)、霍乱弧菌(Vibrio cholera)、鼠伤寒沙门氏菌(Salmonella typhimurium)、弗氏志贺氏菌(Shigella flexneri)、流感嗜血杆菌 (Haemophilus influenza)、百日咳杆菌(Bordotella pertussi)、解淀粉欧 文氏菌(Erwinia amylovora)、根瘤菌(Rhizobiumsp.)。革兰氏阴性细 菌细胞还可以进一步定义为已用编码包含能够结合所选择的配体的候选结合多肽的融合多肽的序列转化的细菌细胞。多肽锚定到胞质 膜的外表面上而面对周质间隙,且可以包含抗体编码序列或另一序 列。用于多肽表达的一种手段是通过将前导序列连接到能够引起这 种指引的多肽上。
多种原核细胞系和培养物可用作宿主细胞,且它们可以通过美 国典型培养物保藏中心(ATCC)获得,美国典型培养物保藏中心是用 作活培养物和遗传材料的储藏库的机构。适宜的宿主可以由本领域 技术人员基于载体骨架和所需的结果确定。例如,质粒或粘粒可以 引入用于许多载体的复制的原核宿主细胞中。用作用于载体复制和/ 或表达的宿主细胞的细菌细胞包括DH5-α、JM109和KC8,以及多 种商业可得的细菌宿主如SURETMCompetent Cells和SOLOPACKTMM Gold Cells(STRATAGENETM,La Jolla)。在一些方面,设想其它细菌 细胞如大肠杆菌LE392用作宿主细胞。
来自各种细胞类型和生物体的许多宿主细胞是可得的且是本领 域技术人员已知的。类似地,病毒载体可以与原核宿主细胞结合使 用,特别是允许载体的复制或表达的原核宿主细胞。一些载体可以 利用允许其在原核和真核细胞中复制和/或表达的控制序列。本领域 技术人员可以进一步理解用于孵育所有以上描述的宿主细胞以维持 它们和允许载体的复制的条件。还理解和知道允许大规模产生载体 以及产生载体所编码的核酸及其同源多肽、蛋白质或肽的技术和条 件。
在一些方面,宿主细胞是哺乳动物的。其实例包括CHO细胞、 CHO-K1细胞或CHO-S细胞。其它哺乳动物细胞包括NS0细胞和为 dhfr-的CHO细胞,例如CHO-dhfr-、DUKX-B 11CHO细胞和DG44 CHO细胞。
存在的多种表达系统可以包含本文公开的组合物的至少一部分 或全部。表达系统可以包括真核表达系统和原核表达系统。这样的 系统可以用于,例如,产生确定为能够结合特定配体的多肽产物。 基于原核生物的系统可以用于产生核酸序列或它们的同源多肽、蛋 白质和肽。许多这样的系统是商业上和普遍可得的。表达系统的其 它例子包括含有强原核启动子如T7、Tac、Trc、BAD、λpL、四环 素或Lac启动子的载体、pET表达系统和大肠杆菌表达系统。
多肽
在一些方面,组合物可以包括多肽。在一些方面,可以由例如 宿主细胞表达通过本文描述的多核苷酸编码的多肽。术语“多肽”或 “蛋白质”包括具有原始蛋白质的氨基酸序列的大分子,即由天然存 在的和非重组的细胞产生的蛋白质;或者它由遗传工程化的或重组 的细胞产生,且包含具有原始蛋白质的氨基酸序列的分子或具有原 始序列的一个或多个氨基酸的缺失、添加和/或置换的分子。该术语 还包括其中一个或多个氨基酸是相应的天然存在的氨基酸和聚合物 的化学类似物的氨基酸聚合物。术语“多肽”和“蛋白质”涵盖抗原结合 蛋白、抗体或具有抗原结合蛋白的一个或多个氨基酸的缺失、添加 和/或置换的序列。术语“多肽片段”是指与全长原始蛋白质相比具有 氨基端缺失、羧基端缺失和/或内部缺失的多肽。这样的片段与原始 蛋白质相比也可以包含修饰的氨基酸。在某些实施方式中,片段为 约5-500个氨基酸长。例如,片段可以是至少5、6、8、10、14、20、 50、70、100、110、150、200、250、300、350、400或450个氨基 酸长。可用的多肽片段包括抗体的免疫功能性片段,包括结合结构 域。在结合抗体的情况中,可用的片段包括,但不限于CDR区、重 链和/或轻链的可变结构域、抗体链的一部分或仅其可变区包括两个 CDR,等等。
术语“分离的蛋白质”意思是所述蛋白质(1)不含天然状态下与其 一起存在的至少一部分其它的蛋白质,(2)基本上不含来自相同来源 (例如,同一物种)的其它蛋白质,(3)由来自不同物种的细胞表达,(4)已经与其天然相关的多肽、脂质、碳水化合物或其它材料的至少 约50%分离,(5)可操作地与天然不相关的多肽关联(通过共价或非 共价相互作用)或(6)不是天然存在的。通常,“分离的蛋白质”占给 定样品的至少约5%、至少约10%、至少约25%或至少约50%。基因 组DNA、cDNA、mRNA或其它RNA、合成来源的核酸或其任何组合可以编码这样的分离的蛋白质。优选地,分离的蛋白质基本上不 含在其天然环境中存在的干扰其治疗、诊断、预防、研究或其它用 途的蛋白质或多肽或其它污染物。
在一些方面,多肽可以包括抗原结合蛋白(ABP)。如本文中所用 的,“抗原结合蛋白”(“ABP”)意思是结合指定的靶抗原的任何蛋白 质。“抗原结合蛋白”包括,但不限于抗体及其结合部分,如免疫功 能性片段。肽体(peptibody)是抗原结合蛋白的另一实例。如本文中所 用的,术语抗体或免疫球蛋白链(重链或轻链)抗原结合蛋白的“免 疫功能性片段”或(简称为“片段”)是包含缺乏全长链中存在的至少 一些氨基酸但其仍然能够特异性结合抗原的抗体一部分(无论该部 分是如何获得或合成的)的抗原结合蛋白物质。这样的片段是生物 活性的,因为它们结合靶抗原且可以与其它抗原结合蛋白(包括完 整抗体)竞争结合给定的表位。在一些实施方式中,片段是中和片 段。这些生物活性片段可以通过重组DNA技术产生,或可以通过抗 原结合蛋白质(包括完整抗体)的酶促或化学切割产生。免疫功能性免疫球蛋白片段包括,但不限于Fab、双特异抗体(在与轻链可变 结构域相同的多肽上的重链可变结构域,通过太短而不允许同一链 上的两个结构域之间配对的短肽接头连接)、Fab′、F(ab′)2、Fv、域 抗体和单链抗体,且可以源自任何哺乳动物来源,包括但不限于人、小鼠、大鼠、骆驼(camelid)或兔。进一步设想本文公开的抗原结合蛋 白质的功能性部分,例如一个或多个CDR,可以共价结合第二蛋白 质或小分子以产生针对身体中的特定靶标的治疗剂,从而具有双功 能治疗性能,或具有延长的血清半衰期。如本领域技术人员可以理解的,抗原结合蛋白可以包括非蛋白质成分。关于抗原结合蛋白和 抗体的其它细节如修饰、变体、制备方法和筛选方法可以在美国专 利公开20110027287中找到,其为了所有目的通过引用并入本文。
在一些方面,多肽可以包括抗体。术语“抗体”是指任何同种型 的完整免疫球蛋白或可以与完整抗体竞争与靶抗原的特异性结合的 其片段,且包括,例如嵌合的、人源化的、完全人的和双特异性的 抗体。“抗体”是抗原结合蛋白的种类。完整抗体一般包含至少两个全长重链和两个全长轻链,但在一些情况中,可以包括较少的链, 如天然存在于骆驼中的抗体,其可以仅包含重链。抗体可以只源自 单一来源,或可以是“嵌合的”,即抗体的不同部分可以源自两个不 同的抗体。抗原结合蛋白、抗体或结合片段可以在杂交瘤中产生, 通过重组DNA技术产生或通过完整抗体的酶促或化学切割产生。除 非另外表明,术语“抗体”除了包含两个全长重链和两个全长轻链的 抗体之外还包括其衍生物、变体、片段和突变蛋白。此外,除非明 确排除,抗体分别包括单克隆抗体、双特异性抗体、微抗体、域抗 体、合成抗体(有时在本文中称作“抗体模拟物”)、嵌合抗体、人 源化抗体、人抗体、抗体融合体(本文中有时称作“抗体偶联物”) 及其片段。在一些实施方式中,该术语还涵盖肽体。
治疗有效量的ABP可以施用于需要的受试者。ABP可以配制在 药物组合物中。这些组合物可以在一种或多种ABP之外另外包含药 学可接受的赋形剂、载体、缓冲剂、稳定剂或其它本领域技术人员 公知的材料。这样的材料应当是无毒的且不应干扰活性成分的效力。载体或其它材料的准确性质可以取决于施用途径,例如口服、静脉 内、皮肤或皮下、经鼻、肌肉内、腹膜内途径。
用于口服施用的药物组合物可以是片剂、胶囊、粉末或液体形 式。片剂可以包括固体载体如明胶或辅剂。液体药物组合物一般包 括液体载体如水、石油、动物或植物油、矿物油或合成油。可以包 括生理盐水溶液、右旋糖或其它糖溶液或二醇类如乙二醇、丙二醇或聚乙二醇。
对于静脉内、皮肤或皮下注射,或者在患病部位的注射,活性 成分为肠胃外可接受的水性溶液的形式,其为无热原的且具有适当 的pH、等渗性和稳定性。相关技术领域的技术人员能够使用例如等 渗媒介如氯化钠注射液、林格氏注射液、乳酸林格氏注射液制备合 适的溶液。按照需要,可以包括防腐剂、稳定剂、缓冲剂、抗氧化 剂和/或其它添加剂。
ABP施用优选以“治疗有效量”或“预防有效量”(视情况而定, 虽然预防可以视为治疗),这足以显示对个体的益处。施用的实际 量以及施用的速率和时程取决于待治疗疾病的性质和严重性。治疗 的处方,例如剂量的决定等,在一般实施者和其它医学医生的责任 范围内,且通常考虑待治疗的病症、个别患者的情况、递送的位点、 施用的方法和实施者已知的其它因素。上述技术和方案的实例可以 在Remington′s PharmaceuticalSciences,16th edition,Osol,A.(ed), 1980中找到。
组合物可以单独或与其它治疗结合施用,根据待治疗的病症同 时地或顺序地施用。
免疫细胞
样品可以包括免疫细胞。免疫细胞可以包括T细胞和B细胞。T 细胞(T淋巴细胞)包括,例如,表达T细胞受体的细胞。B细胞包括, 例如,活化B细胞、未成熟B细胞、浆细胞、浆母细胞、记忆B细 胞、B1细胞、B2细胞、边缘区B细胞和小结B细胞。T细胞包括 活化T细胞、未成熟T细胞、辅助性T细胞(效应T细胞或Th细胞)、 细月包毒性T细胞(CTL)、记忆T细胞、中枢记忆性T细胞、效应记忆 性T细胞和调节T细胞。样品可以在一些应用(例如定义相关T或 B细胞的校准测试)中包括单一细胞或更通常地包括至少1,000、至 少10,000、至少100,000、至少250,000、至少500,000、至少750,000 或至少1,000,000个细胞
B细胞
如本文中所用的,“B细胞”是指具有至少一个重排的免疫球蛋白 基因座的任何细胞。B细胞可以包括至少一个重排的免疫球蛋白重 链基因座或至少一个重排的免疫球蛋白轻链基因座。B细胞可以包 括至少一个重排的免疫球蛋白重链基因座和至少一个重排的免疫球 蛋白轻链基因座。B细胞是作为适应性免疫系统的部分的淋巴细胞。 B细胞可以包括表达作为细胞表面上的B细胞受体(BCR)的膜结合形 式的抗体或作为分泌的抗体的任何细胞。B细胞可以表达免疫球蛋 白(抗体、B细胞受体)。抗体可以包括由重和轻免疫球蛋白链形 成的异二聚体。重链由可变、多样和接合(VDJ)基因的基因重排形成 以形成可变区(其与恒定区结合)而形成。轻链由可变和接合(VJ) 基因的基因重排以形成可变区(其随后结合到恒定区)而形成。由 于大量可能的接合组合,抗体基因(其也是BCR)的可变区具有巨大的多样性,从而使得B细胞能够识别任何外来抗原并引起针对它 的反应。
B-细胞激活和分化
B细胞在炎症免疫反应的情况中识别抗原时激活和分化。它们 通常包括2个信号以成为活化的,一个通过BCR(重排的免疫球蛋 白的结合形式)递送的信号和另一个通过CD40或另一共刺激分子 递送的信号。这种第二信号可以通过与辅助性T细胞(其表达在其表面上的CD40的配体(CD40L))的相互作用提供。B细胞然后增殖 且可以发生体细胞超变,其中形成抗体基因的核苷酸序列的随机改 变,且选择其抗体具有较高亲和力的B细胞。它们也可以发生“类别 转换”,其中编码IgM同种型的重链的恒定区转换为编码IgG、IgA 或IgE同种型的恒定区。分化B细胞可以终止于记忆B细胞,其通 常具有较高亲和力和发生类型转换,尽管一些记忆B细胞仍然是IgM 同种型。记忆B细胞也可以变成活化的和分化成浆母细胞并最终分 化成浆细胞。分化B细胞也可以首先变成浆母细胞,其随后分化而 变成浆细胞。
亲和力成熟和克隆家族
克隆家族一般通过使用2个或更多个样品的相关免疫球蛋白重 链和/或轻链V(D)J序列定义。相关免疫球蛋白重链V(D)J序列可以 通过基因组中编码的其共有V(D)J基因片段的使用鉴定。在克隆家 族内一般存在着根据其V(D)J片段中的共有突变而变化的亚家族, 其可以在B细胞基因重组和体细胞超变的过程中产生。
活化的B细胞迁移并形成淋巴组织或其它组织内的生发中心, 在此处它们发生亲和力成熟。B细胞也可以在生发中心之外发生亲 和力成熟。在亲和力成熟过程中,B细胞在其抗体基因中发生随机 突变,其集中于编码直接与该B细胞针对其而激活的靶抗原结合并识别该靶抗原的抗体部分的基因的互补决定区(CDR)中。这产生了来 自原始增殖B细胞的亚克隆,该原始增殖B细胞表达与原始克隆及 彼此略有不同的免疫球蛋白。选择竞争抗原的克隆和较高亲和力的 克隆,而较低亲和力的克隆通过细胞凋亡死亡。这一过程导致B细胞的“亲和力成熟”并随后导致以较高亲和力与抗原结合的免疫球蛋 白的B细胞的产生。所有来源于相同“亲本”B细胞的B细胞形成克 隆家族,且这些克隆家族包括识别相同或相似抗原性表位的B细胞。 在一些方面,我们预期,以较高频率存在的克隆代表以较高亲和力与抗原结合的克隆,因为较高亲和力的克隆在亲和力成熟的过程中 选择。在一些方面,具有不同V(D)J片段使用的克隆表现出不同的 结合特征。在一些方面,具有相同的V(D)J片段但不同的突变的克 隆表现出不同的结合特征。
记忆B细胞
记忆B细胞通常是亲和力成熟的B细胞,且可以发生类别转换。 它们是可以更快速地对后续抗原激发作出响应的细胞,从而显著地 将天然生物体中针对该抗原的亲和力成熟抗体的分泌所需的约14天 的时间减少到约7天。
浆母细胞和浆细胞
浆细胞可以是长寿的或短寿的。长寿浆细胞可以存活生物体的 一生,而短寿浆细胞可以维持3-4天。长寿浆细胞驻留于炎症区域中、 粘膜区域中(在IgA-分泌浆细胞的情况中)、在二级淋巴组织(如 脾或淋巴结)中或在骨髓中。为达到这些分散的区域,注定变成长寿浆细胞的浆母细胞可以在利用各种趋化因子梯度运输到适宜区域 之前首先通过血流移动。浆母细胞是亲和力成熟的、通常类别转换 的且通常分泌抗体(尽管通常以比浆细胞产生的抗体量低的量分泌 抗体)的细胞。浆细胞是专性的抗体分泌者。
TCR和BCR基因的特征
由于识别的重组存在于各单个适应性免疫细胞的DNA中以及其 相关RNA转录物中,RNA或DNA可以测序。来自T细胞或B细胞 的重组序列也可以称为克隆型(clonotype)。DNA或RNA可以对应于 来自T细胞受体(TCR)基因或编码抗体的免疫球蛋白(Ig)基因的序列。例如,DNA和RNA可以对应于编码TCR的α、β、γ或δ链的 序列。在大多数T细胞中,TCR是由α-链和β-链构成的异二聚体。 TCR-α链通过VJ重组产生,且β链受体通过V(D)J重组产生。对于 TCR-β链,在人体中存在48个V片段、2个D片段和13个J片段。 在两个接合区的各接合区处可以删除几个碱基和添加其它的碱基 (称作N和P核苷酸)。在大多数T细胞中,TCR由γ和δ链组成。 TCRγ链通过VJ重组产生,且TCRδ链通过V(D)J重组产生(Kenneth Murphy,PaulTravers和Mark Walport,Janeway′s Immunology 7th edition,Garland Science,2007,其全文通过引用引入)。
在该方法中分析的DNA和RNA可以对应于编码具有恒定区(α、 δ、γ、ε或μ)的重链免疫球蛋白(IgH)或具有恒定区λ或κ的轻链免 疫球蛋白(IgK或IgL)的序列。各抗体可以具有两个相同的轻链和两 个相同的重链。各链由恒定(C)和可变区组成。对于重链,可变区由可变(V)、多样(D)和接合(J)片段组成。编码各类型的这些片段的几个 不同序列存在于基因组中。特定的VDJ组合事件在B细胞发育过程 中发生,标记该细胞以产生特定的重链。轻链中的多样性以相似的 方式产生,除了不存在D区之外,因而仅存在VJ重组。体细胞突变通常靠近重组的位点发生,从而导致几个核苷酸的添加或删除,进 一步增加由B细胞产生的重链和轻链的多样性。然后由B细胞产生 的抗体的可能的多样性是不同重链和轻链的产物。重链和轻链的可 变区导致形成抗原识别(或结合)区或位点。增加这种多样性的是 体细胞超变的过程,其可以在产生针对某些表位的特定应答后发生。 在这一过程中,突变在能够识别该特定表位的那些B细胞中发生, 从而导致在可能能够更强地结合特定表位的抗体中更高的多样性。 所有这些因素造成由B细胞产生的抗体的高度多样性。可以产生数 百万种和也许超过万亿种不同的抗体。产生T细胞多样性的基本前 提与由B细胞产生抗体的前提相似。T细胞和B细胞激活的要素是 其与表位的结合。特定细胞的激活导致更多的相同类型细胞的产生, 从而导致克隆扩增。
互补决定区(CDR)或高变区是可以结合抗原的抗原受体(例如, T细胞受体和免疫球蛋白)的可变结构域中的序列。各抗原受体的链 含有三个CDR(CDR1、CDR2和CDR3)。形成T细胞(α和β)和免疫 球蛋白(IgH和IgK或IgL)的两个多肽造成三个CDR的形成。
编码TCR-β的CDR1和CDR2的部分位于47个功能性V片段 之一内。CDR多样性主要发现于CDR3中,其中该多样性由T淋巴 细胞发育过程中的体细胞重组事件产生。
多种多样的BCR存在于个体之间和个体内。BCR由编码抗体重 链和轻链的两个基因IgH和IgK(或IgL)组成。结合抗原的三个互补 决定区(CDR)序列和MHC分子在IgH和IgK(或IgL)中具有最高的多 样性。编码IgH的CDR1和CDR2的部分位于44个功能性V片段之 一内。原始B细胞中的主要多样性出现于B淋巴细胞发育期间通过 体细胞重组事件生成CDR3的过程中。重组可以生成具有各V、D 和J片段之一的分子。在人体中,存在44个V、27个D和6个J 片段,因此存在着超过7,000种组合的理论可能性。在小部分BCR (约5%)中,发现了两个D片段。此外,在两个区中的各接合区处 可以删除几个碱基和添加其它的碱基(称为N和P核苷酸),从而 产生高度的多样性。在B细胞激活后,发生通过体细胞超变的亲和 力成熟的过程。在这个过程中,激活的B细胞的后代细胞在整个基 因内累积不同的体细胞突变,在CDR区中具有更高的浓度,导致产 生具有与抗原的更高亲和力的抗体。除了体细胞超变外,活化的B 细胞经历同种型转换的过程。具有相同可变片段的抗体根据恒定片 段的不同可以具有不同的形式(同种型)。尽管所有原始B细胞表 达IgM(或IgD),活化的B细胞大多表达IgG,但也表达IgM、IgA 和IgE。这种从IgM(和/或IgD)到IgG、IgA或IgE的表达转换通过 导致一个细胞专门产生特定同种型的重组事件而发生。对于IgM、 IgD和IgE各存在一个片段,对于IgA存在两个片段,和对于IgG存 在四个片段。
方法
应用于保健和生物技术用途
本文所述的组合物和方法用于识别抗体和TCR和用于将抗体和 TCR分组成克隆家族的用途具有许多保健和生物技术研究方面的有 利和新型的应用。抗体克隆家族可以包含亲和力成熟的非相同克隆 和TCR克隆家族可以包含相同的克隆。这些应用包括,但不限于: 1)抗体或抗体衍生疗法的发现和开发;2)诊断法的发现和开发;3) 可用于健康和生物技术研究的研究工具的发现和开发;和4)候选疫 苗的开发和评估及可用作疫苗成分的抗原的鉴别。
由于本发明可用于任何类型的B或T细胞,细胞来源和特定的 B或T细胞亚型基于所需的最终产品的特性选择。B或T细胞的特 定类别用项用途的实例描述于一般材料和方法章节的“细胞和细胞 亚群的分离和富集”小节中。一般地,细胞可以来自具有特定临床状态或病程或者接受了特定治疗方案或者已暴露于特定激发、免疫或 诱导免疫条件集的特定人或动物受试者。
应用于疗法、诊断法和研究工具的发现和开发
为了开发用作治疗、诊断或研究工具的抗体或源自抗体的分子, 可以首先鉴别和发现在体内或体外系统中结合某种或所需抗原或表 位和/或具有所需功能序列的抗体和/或抗体的抗原结合区域的衍生 物。这些候选抗体然后进一步筛选对于预期的产品特定的其它所需 性能。这些目标产品性能对于不同类型的治疗、诊断和研究工具抗 体是不同的,且本发明提供可用的鉴别用于针对任何这些产品途径 的进一步开发的候选者的手段。
基于最终产品性能的所需特征,相关B细胞的来源可以是,但 不限于患有疾病的患者,如感染性疾病、癌症或自身免疫性病症; 接受治疗的患者,如癌症治疗或疫苗;或患有疾病或以诱导免疫应 答的方式治疗的动物,如免疫或疾病模型的诱导/建立。
一般地,意图开发为治疗、诊断和研究工具的候选抗体或源自 抗体结合区域的候选大分子通过落在两种总体途径之一中的多种技 术发现:1)从人的或动物的免疫反应分离目标抗体;和2)源自异 源表达的或使用一种或多种展示技术筛选的免疫球蛋白分子或其衍 生物的展示文库的抗体分离(综述于Hoogenboom HR,Trends Biotechnol.,1997,15:62-70;Hammond PW,MAbs,2010,2:157-64; Nissim A,Chernajovsky Y,Handb ExpPharmacol.,2008,(181):3-18; Steinitz M,Hum Antibodies,2009;18:1-10;BradburyAR,Sidhu S, Dübel S和McCafferty,Nat Biotechnol.,2011,29245-54;AntibodyEngineering(Kontermann RE和Dübel S eds.,Springer,第2版))。
对于前一途径(#1),候选抗体选自如在例如一般材料和方法章节 中所述的从相关供体鉴别的特定克隆家族。本发明可以如所述的应 用于来自于适当人供体或动物的适当的B细胞(例如,未成熟B细胞) 以鉴别候选抗体。例如,对于癌症治疗抗体候选者,适当的人供体 可以是通过免疫反应成功抑制癌症进展的患者;或者对于特定的诊 断抗体候选者,适当的供体可以是具有抗诊断标志物的自身抗体的 患者或针对该标志物进行免疫的小鼠;或者对于抗体试剂工具候选 者,适当的供体可以是小鼠、兔、山羊、大鼠、马、鸡、狗或用抗 体试剂要识别的靶分子和/或表位免疫的其它动物。用于表达和调试 的抗体的序列和选择可以如一般材料和方法章节中所述的进行。这 样的技术应用可以提供通常经由更费力和费时的方法获得的候选抗 体(例如,杂交瘤技术、病毒诱导的B细胞永生化等)。
对于后一途径(#2),在#1途径中获得的来自于一个或多个人或 动物抗体谱的配对重链和轻链序列的亚集或整个集合用于作为含识 别区域的文库的种子(seed)以在文库和/或文库的选定/富集亚集使 用下一代测序平台测序时追踪样品来源和来自样品的原始同源对。 可变区和框架区信息可以整合到一个或多个抗体展示文库格式中以 发现候选抗体。Ig基因的可变区可以使用一般材料和方法章节的“克 隆及克隆的轻链和重链免疫球蛋白对的表达”小节中所述的方法克 隆和整合到表达载体中。例如来自如#1途径中获得的同源对重链和 轻链的片段和/或结构域可以用于作为Fab酵母(Weaver-Feldhaus JM, LouJ,Coleman JR等.,FEBS Lett,2004,564:24-34)或噬菌粒(Kashyap AK,Steel J,Oner AF等,Proc Natl Acad Sci U S A,2008,105:5986-91) 文库的种子,该文库具有追踪各链到适当的原始B细胞来源的识别 区域而无论不同重链和轻链组合匹配到非-内源(非-同源)配对中。 如#1途径中获得的同源对重链和轻链也可以超出噬菌粒或酵母以外 的其它展示平台,且可用于Fab片段表达构建体以外的其它抗体衍 生物表达构建体[AntibodyEngineering(Kontermann,RE和Dübel S编 辑,Springer,第2版)]。在识别区域的可选应用中,识别区域可以添 加到早已存在的展示文库上以提供识别区域追踪和下一代测序数据的错误校正的益处。取决于文库类型、格式和表达/展示系统,识别 区域可以使用PCR反应或反转录酶后的PCR反应并入(参见,例如, 一般材料和方法章节中的“来自单一B细胞的配对轻链和重链免疫 球蛋白基因的测序”小节)。
候选抗体,无论来自B细胞库(参见,例如,一般材料和方法 章节)或展示表达文库“集合”(Kashyap AK,Steel J,Oner AF等,Proc Natl Acad Sci U S A,2008,105:5986-91;Weaver-Feldhaus JM,Lou J, Coleman JR等,FEBS Lett,2004,564:24-34;Ravn U,Gueneau F, Baerlocher L等,Nucleic Acids Res,2010,38:e193;Antibody Engineering(Kontermann,RE和Dübel S编辑,Springer,第2版),都 通过表达和在用于结合所需抗原/靶标和/或表位的分析中或在用于 在体内或体外(包括离体样品/制备物)情况中测试功能结果的分析 中测试抗体或抗体衍生分子或者分子文库来鉴别。公布的报告已经 描述了识别区域用于追踪在表达文库中使用的获自B细胞库的抗体 序列的供体来源的用途(例如,Kashyap AK,Steel J,Oner AF等,Proc Natl Acad Sci U S A,2008,105:5986-91)。本文描述的识别区域技术特 别地提供了对于这种识别区域应用的有利改进。本发明1)提供了用 于追踪不仅各供体而且用于重链和轻链的同源配对的各供体的B细 胞的手段;2)提供了回溯到原始B细胞样品以获取更多样品用于克 隆和/或测试的手段;3)提供了追踪重链和轻链源而无论表达文库内 的非-同源组合配对的手段;4)提供了在多轮的选择-富集中追踪重链 和轻链源的手段(例如,当在体外合并选择过程中监测序列进化时, 如Ravn U,Gueneau F,Baerlocher L等,Nucleic Acids Res,2010, 38:e193)。
B细胞免疫应答库中最常表现的重链或轻链序列的鉴别及基于 单个链的等级次序频率将重链和轻链对组合已证明是鉴别一些候选 抗体的可行方式,尽管存在着在以这种方式进行时同源对信息未保 持在下一代序列分析中的事实(Reddy ST,Ge X,Miklos AE等,Nat Biotechnol,2010,28:965-9)。本发明也允许这种类型的频率分析技 术,但可以进一步提供使用下一代测序评估库中实际抗体的频率的 手段,而不是简单地分离,独立的重链和轻链。
此外,本发明提供了超越频率分析以外的重要应用的三个改进: 1)因为重链和轻链的同源配对可以被追踪,可以鉴别来自免疫应答的 实际抗体的发现和在免疫应答中由B细胞产生的实际抗体克隆家族 (克隆包括从相同细胞祖先共进化的特定的同源重链和轻链对且关 于亲和力成熟过程内的天然配对的信息在文献中描述的途径在基础 上改进以使用下一代测序分析免疫应答[例如,Wu X,Yang ZY,Li Y, Hogerkorp CM等,Science,2010,329:856-61]);2)识别区域提供了最 小化或甚至消除下一代测序平台共同的测序错误对序列分析的影响 (参见,例如,一般材料和方法章节中的“其它测序数据分析选项” 小节);和3)识别区域提供了在单一细胞水平连结和追踪区表达的≥2 个序列的能力。
对于那些已鉴别为具有所需的对抗原、靶标或表位的结合性能 的或具有所需功能效应的候选抗体,来自相应克隆家族的更多抗体 可以克隆和表达(参见,例如一般材料和方法章节)以测试相似的 但潜在地更佳的抗体或在结合或功能性质方面相似但含有对于最终 产品特征重要的其它差异的抗体的存在。
对于其中候选者从展示表达文库鉴别的情况,识别区域可以提 供通过识别不是在筛选富集中选择的而是含有鉴别的候选者的识别 区域且因此源自作为文库种子的相同的原始重链和/或轻链而鉴别具 有与候选者潜在相似的序列的抗体。在体外选择轮次中丧失但与选 择的候选抗体相似的抗体可以恢复或“拯救”用于作为潜在候选者进 行进一步分析。这样的拯救可以消除表达或分析系统中的偏向的影 响,这种偏向可能遗漏有用的和功能性的抗体(Ravn U,Gueneau F, Baerlocher L等,Nucleic Acids Res,2010,38:e193)。
一旦具有所需结合和/或功能性质的候选者被鉴别,它们随后可 以继续进行相关分析和基于所需的下游产品特征的其它评估。对于 意图用于被动免疫中的治疗性抗体,候选者继续用于分析和临床前 测试模型以确定用于人体中的临床测试或用于动物健康中的最佳候 选者,包括,但不限于如稳定性和凝聚的性能的评估、制剂和给药 简易性、蛋白质表达和生产、物种选择性、药理学、药代动力学、 安全性和毒性、吸收、代谢和靶-抗体周围率以及免疫原性[参见,例 如,Lynch CM,Hart BW和Grewal IS,MAbs,2009,1:2-11;Chapman K,Pullen N,Coney L等,mAbs,2009,1,505-516;S.Dübel,Handbook ofTherapeutic Antibodies:Technologies,Emerging Developments and ApprovedTherapeutics(John Wiley&Sons,2010);Therapeutic Monoclonal Antibodies:FromBench to Clinic,(Z.An ed.,John Wiley &Sons,2009)Antibody Engineering(Kontermann RE and Dübel S编辑, Springer,第2版)],因此,选择许多候选者是因为其中大多数对于 需要在人体测试前评估的许多性能中的至少一种来说不足以用于人 体测试(即损耗)。例如,如上所述,克隆家族可以挖掘与早已鉴 定的候选者相似的但可能携带相对于在临床前工作中评估的一种或 多种性质的差异的候选者。可能需要特定的抗体工程化策略以用于 优化特定性能[Antibody Engineering(Kontermann RE和Dübel S编辑,Springer,第2版)]。
对于诊断,本发明可以用于鉴别通过感染或用于检测感染剂的 疫苗接种产生的抗体、TCR和克隆家族(Selvarajah S,Chatterji U, Kuhn R等,2012,6:29-37;Berry JD,Vet J,2005,170:193-211),以及用 于任何非感染性疾病、病理状态或医学处理或治疗。这种的抗体、 TCR和/或克隆家族可以提供对于生物标志物的有用的探针或提供关 于人或动物的疾病状态或治疗效果的免疫系统信息。如此,特定的 抗体或TCR或者任一免疫受体类别的特定克隆家族可以提供用于诊 断工具和个性化医疗的功用。在用于诊断的另一应用中,已知疾病 或治疗反应标志物可以用作免疫原以对从其中收获B细胞以鉴别抗 体的小鼠或其它动物进行免疫(参见,例如,一般材料和方法章节), 所述抗体针对随后可用于诊断测试如ELISA或其它免疫分析中的生 物标志物(Selvarajah S,Chatterji U,Kuhn R等,2012,6:29-37)。一旦鉴 别为具有潜在的诊断功用,候选抗体、TCR和/或克隆家族可继续用于分析、模型和可能的与诊断产品的所需特征相关的试验中[Berry JD,Vet J,2005,170:193-211;Diagnostic and Therapeutic Antibodies in Methods in MolecularMedicine,Vol.40(George AJT和Urch CE编辑., Humana Press);Antibody Engineering(Kontermann RE和Dübel S编辑, Springer,第2版);Colwill K,Renewable ProteinBinder Working Group,和S,Nat Methods,2011,8:551-8;Pershad K,Pavlovic JD,S等,Protein Eng Des Sel,2010,23:279-88.]。可 能需要采用特定的抗体工程化策略以优化某些性能[Antibody Engineering(Kontermann RE和DübelS编辑,Springer,第2版)]。
对于研究工具抗体,例如,如上所述鉴别的抗体可以继续用于 测试它们如何在该研究工具抗体预期所用的研究应用中执行(例如, 免疫沉淀、免疫印迹、免疫染色和组织学、免疫亲和纯化、捕获-和 夹心-和检测免疫分析;例如,如Antibodies:A LaboratoryManual,E Harlow和D Lane(Cold Spring Harbor Laboratory Press,1988)中所述 的)。验证标准将基于最终的预期研究用途(Colwill K,Renewable Protein Binder WorkingGroup,和S,Nat Methods,2011, 8:551-8;Pershad K,Pavlovic JD,S等,Protein Eng Des Sel, 2010,23:279-88)。可能需要采用特定的抗体工程化策略来优化某些 性能[Antibody Engineering(Kontermann RE和Dübel S编辑.,Springer, 第2版)]。
用于疫苗发现和开发的应用
本发明可以用于针对人或动物中的疫苗激发鉴别抗体、TCR和 这些免疫类别中各类别的克隆家族。特定的抗体可以用作探针以鉴 别被抗体识别的疫苗成分及用作探针的抗体所属的克隆家族。关于 抗体和克隆家族的这一信息可以用于进行关于靶向疫苗的特定抗原 和/或表位的免疫应答的比例或强度。对于不同疫苗成分的抗体免疫 应答的评估可以补充所收集的关于对于疫苗的伴随TCR库应答的信 息(参见,例如,一般材料和方法章节中“对于其它类型”和“其它免 疫球蛋白重链和T细胞受体(TCR)链的PCR”小节)。这一信息随后 可以用于理解哪些疫苗成分或哪些疫苗变体或哪种佐剂从人或动物 的免疫系统产生了有效或更理想的应答(Haynes BF,Gilbert PB, McElrath MJ等.,N Engl J Med,2012,366:1275-86)。该途径也可用于 比较个体或群体对于疫苗的反应。
可进行类似的分析以鉴别和评估响应于实际的病原体而产生的 抗体、TCR和克隆家族,且其可能与感兴趣的临床后果如对于感染 的保持性反应相关(例如,从严重流感大流行的生存者鉴别抗体, Yu X,Tsibane T,McGraw PA等,Nature,2008,455:532-6或使用广 谱HIV-中和血清从HIV-感染的个体鉴别特定抗体,Wu X,Yang ZY, Li Y,Hogerkorp CM等,Science,2010,329:856-61和Walker LM, Phogat SK,Chan-Hui PY等,Science,2009,326:285-9)。这种保护相 关性的确认可以与如上所述由疫苗和/或特定成分产生的应答比较且 两个数据集可以比较以评估疫苗产生与实际感染情况中看到的所需 结果相关的免疫应答。
因此,本发明提供了在人或动物在实际感染激发之前通过抗体 和/或TCR库序列分析获得疾病保护和疫苗反应的代理读数的有用 手段。一旦克隆家族被确认为结合特定抗体或表位,在其中发现跨 库的相同或类似克隆家族的情况中鉴别被其它免疫反应库靶定的抗 原或表位而不进行分析是可能的。因此,在其中足够的关于克隆家 族的信息和其抗原/表位结合已知的那些情况中(参见,例如,一般 材料和方法章节中“表达的人抗体的筛选”小节),新分析的库的单 独序列分析就可提供该库的抗原对于其包含的已知克隆家族的读 数。这一应用可以提供监测疫苗临床试验中一个、一些或许多个体 的反应和在群体水平上监测一个、一些或许多人的免疫性的感染性 疾病关系的有用手段。
此外,与对抗病原体的保护相关的抗体、TCR和克隆家族可用 于识别介导对抗抗原的保护性的和/或有效的免疫应答的特定抗原和 抗原集(包括已知的新型的抗原)。在有效免疫应答中靶向的抗原 的鉴别可用于指导包括在疫苗中的预期在免疫的人或动物中产生保 护性的抗体-和TCR-介导反应的抗原的选择。
在分析中不结合已知抗原的抗体、TCR和克隆家族变成用于鉴 别抗体和/或TCR针对其提供保护的潜在新抗原和/或病原体的表位 的候选者。已知不结合早先已知的抗原的抗体可以与免疫分离和质 谱结合用作探针以鉴别先前未鉴别的抗原或表位(Zhu YZ,CaiCS, Zhang W等,PLoS One,2010,5:e13915;且参见,例如,一般材料和 方法章节中的“用源自葡萄球菌感染的患者的抗体免疫分离葡萄球 菌抗原”和“肽的质谱鉴别”)。这类新抗原或表位可以用作预期在免疫 的人或动物中产生保护性的抗体-和TCR-介导反应或导致其产生的 疫苗成分。
除了帮助开发针对微生物抗原的疫苗外,抗体、TCR和克隆家 族还可以用于开发肿瘤疫苗。发生针对癌症或癌前细胞的免疫反应 的人或动物可以产生可用于鉴别单个抗原的抗原组合的抗体、TCR 和克隆家族,且克隆家族也可以用于开发肿瘤疫苗。发生针对癌症 或前癌细胞的免疫应答的人或动物可以产生可用于鉴别可整合到癌 症的预防或治疗疫苗中的单个抗原和抗原组合的抗体、TCR和克隆 家族。
用于产生一个或多个目标多核苷酸的方法
在一些方面,方法包括获得包含多个与从一个或多个获得的多 个样品相关的cDNA的cDNA文库,其中各cDNA与多个样品中的 单一样品相关,且其中与各个样品相关的各cDNA存在于单独的容 器中;将接合体分子添加到与各个样品相关的cDNA上,其中接合 体分子包含样品识别区域和接合体区域,其中样品识别区域与接合 体区域偶联,且其中各接合体分子的样品识别区域的序列不同于添 加到文库中各cDNA上的其它接合体分子的样品识别区域的序列; 和使接合体区域连接到文库中各cDNA上以产生一个或多个目标多 核苷酸。
在一些方面,获得cDNA文库包括获得多个样品和处理样品以 制备cDNA文库。在一些方面,获得cDNA文库包括直接或间接地 从已经处理多个样品以制备cDNA文库的第三方接收cDNA文库。
在一些方面,接合体分子进一步包含通用引物区域,其中通用 引物区域的3’端与样品识别区域的5’端偶联。在一些方面,各cDNA 区域包含与cDNA多核苷酸杂交的mRNA多核苷酸。
在一些方面,各样品包含细胞。在一些方面,细胞是B细胞。 在一些方面,B细胞是浆母细胞、记忆B细胞或浆细胞。在一些方 面,各样品包含多个细胞。
在一些方面,各接合体区域通过结合,例如G:C结合连接到各 cDNA上。
在一些方面,接合体分子是单链的,且进一步包括通过允许酶 将接合体分子形成为双链而将接合体分子并入到各cDNA中。在一 些方面,接合体分子并入到各cDNA中以通过MMLV H-反转录酶产 生目标多核苷酸。
在一些方面,方法可以包括扩增步骤如PCR和其它本领域中通 常已知的扩增反应。
用于连接和条码标记目标多核苷酸的方法
在一些方面,方法包括两个目标多核苷酸序列的连接,例如来 自于单一样品的抗体轻链(LC)的抗体重链(HC),并提供一个或多个 条码或序列识别序列。在这一方面,提供了目标多核苷酸序列之间 的物理连接以及一个或多个条码以提供标识符,从而允许确定源自 特定来源或样品的多核苷酸序列,例如,单一细胞、样品孔、单一 样品等。单一样品可以包含一个或多个B-谱系细胞或其它细胞类型。 连接两个目标多核苷酸序列的方法的实例是本领域中已知的,例如 WO 99/16904、WO 93/03151和US 7,749,697,其通过引入并入本文。 与连接的多核苷酸序列中条码的使用相关的其它优势包括帮助高通 量测序和将序列映射回原始样品,以使得其可以再测序和PCR克隆 以表达多核苷酸序列,例如HC和LC免疫球蛋白多核苷酸。一些高 通量测序技术表现出1-10+%的测序误差率,且条码的使用使得能够 重复模板测序以利于生物信息学误差校正。这对于区分来自基因变 异的测序误差特别重要,如在免疫球蛋白多核苷酸中的那些。具体 地,可能难以确定是否密切相关的序列是事实上不同的序列或是否 它们反而代表由测序误差产生的人工制品。条码通过实现单个模板 重复测序的分析因而能够实现测序误差校正,因此提供序列是否相 对于来自测序误差的人工制品不同的确定。在一个实施方式中,多 核苷酸序列是由于体细胞超变而相异的免疫球蛋白HC和LC序列, 而且仅相差1个核苷酸。
关于这一点,通常获得如图15中所示的物理连接和条码标记的 结构。图15显示了两个核酸片段A和B(例如,两个cDNA)的物 理连接。条码(BC)附接于连接A和B的接头的任一末端或接头中。 A和B的这一物理连接以及条码的添加通过多种方式中的任一种完 成,包括通过连接反应、重组、扩增或重叠-延伸或者这些方法的组 合实现,如下面更详细地描述的。任选地,另外的条码可以添加到 如图15所示的结构上以提供条码标记的化合物而能够使用较少数目 的条码实现多个连接的多核苷酸的测序。并且,可以理解,根据用 于连接两个核酸片段的特定策略,可以获得相关于正义和反义定向 的片段的任何相关定向,即,片段(如cDNA)可以头至尾、头至头 或尾至头结合。
条码可以使用本领域中已知的方法在物理连接之前、期间或之 后添加到多核苷酸序列上。这些方法包括,但不限于,例如连接方 法(如条码接合体的平端连接),及通过相容性末端(如通过同聚 加尾产生的那些)的退火和连接、接头的限制性酶消化或通过反转录酶的cDNA 3’加尾。条码也可以使用携带条码序列的适当引物在 扩增反应中添加。条码也可以使用含条码序列的适当引物在反转录 反应中添加。条码也可以通过重叠-延伸尾或其它方法并入到将目标 基因连接到一起的寡核苷酸中而添加,以使得它们位于两个目标基 因之间。因此,使用这些方法,条码可以整合到物理连接的多核苷 酸序列的末端上或接合两个目标多核苷酸序列的接头序列中。
在一个实施方式中,连接是通过使用重叠-延伸完成的(参见图 16)。一般地,重叠延伸尾是添加到待接合的目标多核苷酸序列上 的互补序列。附接到目标多核苷酸分子上的重叠-延伸尾的退火允许 它们被连接(参见图17、18、19和20)。如以下所述的,重叠-延伸尾可以通过多种公知的方法添加,包括,但不限于多核苷酸合成 反应,如核酸扩增和反转录、连接反应和重组。因为可用于实现连 接的方法的多样性,将认识到的是,可以相对于正义和反义定向获 得多核苷酸片段的不同相对定向,即片段(例如,抗体重链和轻链) 可以头至尾、头至头或尾至头接合。
在一个实施方式中,重叠-延伸尾能够实现在多核苷酸合成反应 中产生的多核苷酸序列的连接。例如,重叠延伸尾可以在多核苷酸 合成反应如扩增或反转录反应的过程中通过使用携带重叠-延伸尾的 引物引入。或者,可以使用连接反应。如图17、18、19和20中所示,在互补的重叠延伸尾退火后,DNA沿5’-3’的方向在多核苷酸合 成反应(如PCR)的延伸阶段中填充以产生具有物理接合的两个目 标多核苷酸的双链多核苷酸。
在一些实施方式中,重叠-延伸RT-PCR方法允许序列与在单管 中进行反应的同时连接,因此避免了中间纯化的需要。在一些实施 方式中,重叠延伸尾包含条码序列。
图17总体示出了使用重叠-延伸尾接合编码抗体轻链和重链的 多核苷酸序列和提供至少一个条码的一个实例。可用于连接两个目 标多核苷酸序列的其它方法如下讨论。在这一实例中,在进行多核 苷酸合成(例如,反转录)后,使用含有条码、任选的测序引物位点和任选的限制性位点(RE1)的LC基因特异性PCR引物允许这些元 件添加到所得的PCR产物的末端。显示了具有延伸重叠的和编码任 选的限制性位点(RE3)的对于LC(在一个实施方式中,VL区域)和 HC(在一个实施方式中,VH区域)特异性的引物。在一个实施方式 中,LC包含具有或不具有短的恒定区片段的重排VJ,和HC包含具 有或不具有短的重链恒定区片段的重排V(D)J。在一个实施方式中, 重叠-延伸引物也包含条码序列。也使用含有任选的RE2的对于HC 特异性的反向引物。由于使用这些引物进行扩增,生成在一端具有 条码的具有所示的连接结构的核酸。来自在单一样品中进行的反应 的产物可以容易地集成到本文中公开的其它工作流程中。例如,任 选的第二条码可以添加并结合第一条码使用以进一步实现多重复 用,从而使用相对最少数目的条码鉴别大量的序列。对于测序,单 一条码可能是足够的。
图17中所示的一般方案的变化是清楚的,其实例在本文中阐明。 例如,条码可以放置在最终产物的另一端或在两端或在多核苷酸之 间。此外,条码可以包括作为延伸重叠的部分(例如,在RE3的另 一侧上或者条码可以被RE3序列分割)。
LC(包括VL序列)和HC(包括VH序列)序列可以利用寡dT 或基因特异性引物通过mRN的反转录产生。在一个实施方式中,反 转录和后续的扩增反应同时进行,即RT-PCR反应,以得到最终产 物。当使用反转录时,延伸重叠区域以及其它元件如限制性位点、 测序引物位点或通用序列可以通过包含一个或多个G残基的接合体 与在如例如图18、19和20中所示的反转录反应中生成的cDNA的3’ 加尾产生的一个、两个、三个或更多个C残基退火而添加。通过反 转录酶的类别转换允许延伸重叠区域(和其它序列元件)添加到 cDNA上。例如,如图18中所示,当利用反转录酶的3’加尾和模板 转换时,第一接合体可以用于添加延伸重叠序列和条码到第一目标 多核苷酸上,而具有与第一接合体的重叠-延伸互补的序列的第二接合体可以添加到第二目标cDNA上。互补的延伸重叠序列在后续的 核酸合成反应如PCR的过程中退火以接合两个目标多核苷酸。从重 叠点的延伸产生双链DNA分子,其中两个目标多核苷酸利用它们之 间的条码连接。允许在两个连接的多核苷酸序列之间生成两个内部 定位的条码的变型显示在图19和20中。
用于接合或连接目标多核苷酸序列的其它方法包括通过连接反 应。在这一实施方式中,用于扩增的引物混合物设计为使得扩增的 靶序列可以用适当的限制性酶切割,并且可以进行通过DNA连接的 共价连接。在用这种引物混合物扩增后,形成靶序列的相容性末端 所需的限制性酶添加到混合物中。然后靶序列用连接酶连接到一起。 在限制性酶消化或连接步骤之前不需要PCR产物的纯化,虽然可以 进化纯化。
在另一实施方式中,目标多核苷酸序列可以通过重组连接。在 这一途径中,扩增的目标多核苷酸序列可以使用相同的重组位点接 合。连接通过添加适当的重组酶以促进重组而进行。合适的重组酶 系统包括具有多个FRT位点的Flp重组酶、具有多个lox位点的Cre 重组酶、进行attP位点和attB位点之间的重组的整合酶□C31、□- 重组酶-6系统以及Gin-gix系统。通过重组的连接已经对于两个核苷 酸序列(与VL连接的VH)进行了示例(Chapal,N.等,1997 BioTechniques 23,518-524),其通过引用并入。
因此,在一个方面,该方法包括使用源自分离的单一细胞或同 基因细胞群体的模板通过PCT或RT-PCR扩增来扩增目标核苷酸序 列及(1)实现扩增的目标核苷酸序列的连接和(2)添加再一个条码到 连接的多核苷酸序列上。该方法包括进行连接产物的另外扩增的步 骤以例如添加另外的条码、限制性位点、测序引物位点等等。
在另一个方面,提供了产生来自供体的单一细胞的含条码标记 的连接抗体重链和轻链对的文库的方法。这一方面包括提供来自供 体的含淋巴细胞的细胞部分,其任选地从所述细胞部分富集特定的 淋巴细胞群体。此外,分离的单一细胞群体通过在多个器皿、容器 或孔之间分配来自含淋巴细胞的细胞部分或者富集的细胞部分的细 胞获得。进行分离的单一细胞群体包含的可变区编码序列的多重分 子扩增(例如,多重RT-PCR扩增),并完成重链和轻链对的连接 和条码添加。此外,在不同的实施方式中,方法可以包括两个任选的步骤:在第一步中,单一细胞群体中的单个分离细胞可以在进行 多重RT-PCR扩增之前扩增成同基因细胞的群体,从而提供具有同 基因细胞群体的多个器皿、容器或孔(一个同基因细胞群体在一个 器皿、容器或孔中)。另一个任选步骤包括进行连接的轻链和重链 编码序列的另外的扩增。这一另外的扩增步骤可用于简单地增加连 接的核酸的量,或者添加第一或第二条码序列或者其它序列元件到 连接的核酸上。
在一些方面,多重RT-PCR扩增作为两步骤过程进行(其中反 转录(RT)与多重PCR扩增(或可选的多重分子扩增)独立地进行) 或者作为单步骤过程进行(其中RT和多重PCR扩增步骤在一个管 中利用相同的引物进行)。
反转录(RT)利用含反转录酶活性的酶进行,从而导致从来自分 离的单一细胞的总RNA、mRNA或靶特异性RNA产生cDNA。可以 用于反转录的引物包括寡-dT引物、随机六聚物或对于目标核苷酸序 列特异性的引物。在一些实施方式中,这样的引物可包含如条码、 通用引发位点、限制性位点、测序引物位点等的元件。
两步的多重RT-PCR扩增程序允许在RT步骤中产生的cDNA分 配到超过一个容器中,从而允许在进行扩增(如果需要的话)之前 储存模板部分。另外,cDNA分配到超过一个管中允许进行源自相同 模板的核酸的超过一个多重PCR扩增。这一两步骤途径可以例如用于利用相同的模板扩增和连接在一个管中的重链可变区和κ轻链可 变区编码序列和在不同的管中的重链可变区和λ轻链可变区编码序 列。单一细胞通常仅表达轻链之一。但是,通常更容易同时进行反 应而不是在进行另一反应之前等待所述反应之一的结果。此外,κ 和λ两者的扩增用作内部阴性对照,因为预期仅κ或λ从单一细胞 扩增。
在单步骤多重RT-PCR过程中,反转录和多重PCR扩增在相同 的器皿、容器或孔中进行。在单步骤中进行反转录和多重PCR需要 的所有成分最初添加到器皿、容器或孔中并进行反应。一般地,一 旦反应开始,则不需要添加另外的成分。单步骤多重RT-PCR的优 点在于它减少甚至进一步产生本发明的条码连接的核苷酸序列所需 步骤的数目。当在单一细胞的阵列上进行多重RT-PCR时(其中相 同的反应在多个容器中进行),这是特别有用的。一般地,单步骤 多重RT-PCR需要的组合物包含核酸模板、具有反转录酶活性的酶、 具有DNA聚合酶活性的酶、脱氧核苷三磷酸混合物(包含dATP、 dCTP、dGTP和dTTP的dNTP混合物)和多重引物混合物。核酸模 板优选是源自分离的单一细胞的总RNA或mRNA,其为纯化的形式、 或作为细胞的裂解产物或包含在完整细胞中。
在一个方面,所述方法产生连接的和条码标记的目标多核苷酸 的文库。在一些方面,多核苷酸文库中的多个多核苷酸组合物可以 包含至少2、至少3、至少10、至少30、至少100、至少300、至少 1000、至少3000、至少10,000、至少30,000、至少100,000、至少 300,000、至少1,000,000、至少3,000,000、至少10,000,000、至少 30,000,000或更多个成员。在其它方面,多核苷酸文库中的多个多核 苷酸组合物可以包含细胞样品的全转录组的至少2、至少3、至少10、 至少30、至少100、至少300、至少1000、至少3000、至少10,000、 至少30,000或更多个基因。在其它方面,多核苷酸文库中的多个多 核苷酸组合物包含至少1、至少2、至少3、至少10、至少30、至少 100、至少300、至少1000、至少10,000、至少100,000、至少1,000,000、 至少10,000,000、至少1,000,000,000或更多个存在于个体的血液中 的不同抗体种类。这些抗体种类可以由浆母细胞、浆细胞、记忆B 细胞、长寿浆细胞、原始B细胞、其它B谱系细胞或其组合表达。
通过上述公开的方法产生的连接的和条码标记的多核苷酸组合 物可以有利地进行高通量的多重测序,优选地使用本文中描述的 NextGen测序平台。
通过上述公开的方法产生的连接的和条码标记的多核苷酸组合 物也可以用于如本文中所公开的克隆、产生目标多核苷酸和筛选。
产生一个或多个用于测序的目标多核苷酸的方法
在一些方面,所述方法包括获得包含多个多核苷酸的多核苷酸 文库,其中各多核苷酸包含通用引物区域、样品识别区域、接合体 区域和源自单一样品的扩增子区域,其中通用引物区域的序列在多 个多核苷酸的各多核苷酸上相同,且其中源自第一单一样品的各多 核苷酸的样品识别区域的序列不同于源自与第一单一样品不同的一 个或多个样品的文库中其它多核苷酸的样品识别区域的序列;并用 一组引物扩增多核苷酸文库以产生用于测序的一个或多个目标多核 苷酸,其中用于测序的一个或多个目标多核苷酸包含第一测序区域、 第一板识别区域、通用引物区域、样品识别区域、接合体区域、源 自单一样品的扩增子区域和第二测序区域。
在一些方面,方法进一步包括测序一个或多个目标多核苷酸。 在一些方面,测序是454测序。
在一些方面,测序包括较长的测序阅读片段(sequencing read)以 使得正向和反向测序阅读充分重叠以能够重构例如抗体轻链(LC)的 整个大约600个碱基对(bp)序列(其中精确的序列长度可取决于5’ 非翻译区(UTR)的长度)和重链(HC)的大约700bp序列。因此,在 一些方面,可以使用可产生至少350-400bp的测序阅读片段并因此获 得包括用于序列组装的重叠的任何测序技术,且能够获得600-700+ bp的阅读片段的测序技术允许仅使用正向引物测序(从5’端测序)。
可以使用本领域技术人员已知的任何用于核酸测序的技术。 DNA测序技术包括使用标记的终止子或引物的典型的双脱氧测序反 应(Sanger方法)和垂直板型或毛细管电泳的凝胶分离。在优选的 实施方式中,下一代(NextGen)测序平台有利地用于实施本发明。NextGen测序是指多种后经典Sanger型测序方法中的任何一种,其 能够同时地高通量、多重测序大量样品。当前的NextGen测序平台, 如下面更详细地描述的那些,能够在同一测序操作中从多个不同的 核酸产生阅读片段。通量是变化的,每次具有1亿碱基至6千亿碱 基,且由于技术的改进,通量快速提高。不同NextGen测序平台的 操作原理也发生变化,且包括:使用可逆地末端标记的核苷酸通过 合成测序、焦磷酸测序、454测序、与标记寡核苷酸探针的文库的等 位基因特异性杂交、使用与标记的克隆的文库等位基因特异性杂交 通过合成测序并接着连接、在聚合步骤过程中标记核苷酸并入的实 时监测、聚合酶克隆测序、单分子实时测序和SOLiD测序。测序使 用聚合酶或连接酶通过顺序或单一延伸反应以及通过使用探针文库 的单一或顺序杂交来演示。这些反应在许多克隆序列上平行地进行, 包括在超过1亿序列的当前商用应用中平行地演示。这些测序途径 因此可以用于研究T-细胞受体(TCR)和/或B-细胞受体(BCR)及其它 目标序列的库。
测序技术可以产生每次操作至少1000个阅读片段、每次操作至 少10,000个阅读片段、每次操作至少100,000个阅读片段、每次操 作至少500,000个阅读片段或每次操作至少1,000,000个阅读片段。
测序技术可以产生每阅读片段约30bp、约40bp、约50bp、约 60bp、约70bp、约80bp、约90bp、约100bp、约110、约120bp、 约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、 约450bp、约500bp、约550bp、约600bp、约650bp或约700bp 或更多bp。
测序技术可以产生每阅读片段至少30、40、50、60、70、80、 90、100、110、120、150、200、250、300、350、400、450、500、 550、600、650、700或更多个核苷酸。
可以使用的测序技术,例如Helicos True Single Molecule Sequencing(tSMS)(Harris T.D.等(2008)Science 320:106-109)。在 tSMS技术中,DNA样品切割成大约100-200核苷酸的链,且聚A 序列添加到各DNA链的3′端。各链通过添加荧光标记的腺嘌呤核苷酸进行标记。DNA链然后固定到流动池上,流动池含有固定在流动 池表面上的数百万寡聚-T捕获位点。模板可以为约1亿模板/cm2的 密度。流动池然后加载到仪器中,例如HeliScopeTM测序仪,且激光 照射流动池的表面,从而揭示各模板的位置。CCD相机可以映射流 动池表面上模板的位置。然后切割并洗掉模板荧光标记。测序反应 通过引入DNA聚合酶和荧光标记的核苷酸而开始。寡聚-T核酸用作 引物。聚合酶以模板指定的方式将标记的核苷酸合并到引物上。除 去聚合酶和未合并的核苷酸。已经指导荧光标记核苷酸的并入的模板通过流动池表面的成像来检测。在成像后,切割步骤移除荧光标 记,且揽胜其它的荧光标记核苷酸重复该过程直到获得所需的阅读 片段长度。序列信息用各个核苷酸添加步骤收集。
可以使用的DNA测序技术的另一实例是454测序(Roche) (Margulies,M等,2005,Nature,437,376-380)。454测序包括两个步 骤。在第一步骤中,DNA剪切成约300-800碱基对的片段,且片段 平端化。然后寡核苷酸接合体连接到片段的末端上。接合体用作用 于片段扩增和测序的引物。片段可以使用例如含5′-生物素标签的接 合体B连接到DNA捕获株例如抗生蛋白链菌素涂覆的珠上。连接到 珠上的片段在油-水乳液的小滴内PCR扩增。结果是在各珠上多个拷 贝的克隆扩增DNA片段。在第二步骤上,珠捕获在孔(皮大小的) 中。焦磷酸测序在各DNA片段上平行地进行。一个或多个核苷酸的 添加产生通过测序仪中的CCD相机记录的光信号。信号强度与并入 的核苷酸的数目成比例。
焦磷酸测序利用在核苷酸添加时释放的焦磷酸(PPi)。PPi在腺苷 5’磷酰硫酸存在下通过ATP硫酸化酶转化为ATP。萤光素酶利用 ATP将萤光素转化为氧化萤光素,且这一反应产生检测和分析的光。
可以使用的DNA测序技术的另一实例是SOLiD技术(Applied Biosystems)。在SOLiD测序中,基因组DNA剪切成片段,且接合 体连接到片段的5′和3′端上以产生片段文库。或者,内部接合体可 以通过将接合体连接到片段的5′和3′端上、使片段环化、消化环化的片段以产生内部接合体并将接合体连接到所得片段的5′和3′端上 以产生末端配对文库(mate-paired library)而引入。接着,克隆珠群体 在含珠、引物、模板和PCR成分的微型播放器中制备。在PCR后, 模板退火且珠富集以分离具有延伸的模板的珠。在选择的珠上的模板进行允许与玻璃载玻片粘结的3′修饰。
序列可以通过具有由荧光团识别的中央确定碱基(或碱基对) 的部分随机寡核苷酸的顺序杂交和连接测定。在记录颜色后。连接 的寡核苷酸被切割和去除,且随后重复该过程。
可以使用的DNA测序技术的另一实例是SOLEXA测序 (Illumina)。SOLEXA测序是基于使用折回PCR和锚定的引物在固体 表面上的DNA扩增。基因组DNA被断裂,且接合体添加到片段的 5′和3′端上。连接到流动池通道表面上的DNA片段被延伸和桥接扩 增。片段变成双链的,且双链分子退火。多个循环的固相扩增接着 退火可以在流动池的各通道中产生几百万个约1,000拷贝的相同模 板的单链DNA分子簇。引物、DNA聚合酶和四种荧光团标记的可 逆封端核酸用于进行连续的测序。在核苷酸并入后,激光用于激发 荧光团,且获取图像和记录第一碱基的身份。除去各并入的碱基的 3′终端和荧光团并重复并入、检测和识别的步骤。
可以使用的测序技术的另一实例包括Pacific Biosciences的单分 子、实时(SMRTTM)技术。在SMRT中,四种碱基中的各种连接到四 种不同荧光染料之一上。这些染料进行磷连接。单一DNA聚合酶使 用模板单链DNA的单一分子在零模波导(ZMW)的底部固定。ZMW是使得能够针对快速扩散进出ZMW(以微秒计)的荧光核苷酸的背 景观察单一核苷酸通过DNA聚合酶的并入。它花几毫秒将核苷酸并 入生长链中。在此期间,荧光标记被激发并产生荧光信号,且切除 荧光标签。相应的染料荧光的检测哪种碱基并入。重复该过程。
可以使用的测序技术的另一实例是纳米孔测序(Soni G V和 Meller A.(2007)Clin Chem 53:1996-2001)。纳米孔是直径约1纳米 的小孔。将纳米孔浸入电导液中和施加跨纳米孔的电位产生由于离 子通过纳米孔的传导而导致的轻微电流。流动的电流的量对于纳米 孔的尺寸是敏感的。随着DNA分子经过纳米孔,DNA分子上的各 核苷酸阻塞纳米孔到不同的程度。因此,在DNA分子经过纳米孔时 流过纳米孔的电流的变化代表DNA序列的阅读。
可以使用的测序技术的另一实例涉及使用化学敏感场效应晶体 管(chemFET)阵列以测序DNA(例如,如在美国专利申请公开No. 20090026082中所述的)。在该技术的一个实例中,DNA分子可以 置于反应室中,且模板分子可以与结合到聚合酶上的测序引物杂交。一个或多个三磷酸在测序引物的3’端并入到新核酸链中可以通过由 chemFET导致的电流变化检测。阵列可以具有多个chemFET传感器。 在另一实例中,单一核酸可以连接到珠上,和核酸可以在珠上扩增, 并且单个的珠可以转移到chemFET阵列上的单个反应室,其中各室 具有chemFET传感器,且核酸可以被测序。
可以使用的测序技术的另一实例涉及使用电子显微镜 (Moudrianakis E.N.和Beer M.Proc Natl Acad Sci USA.1965March; 53:564-71)。在该技术的一个实例中,单个DNA分子使用金属标记 进行标记,该金属标记可使用电子显微镜区分。这些分子然后在平面上伸展并使用电子显微镜成像以测定序列。
在一些方面,获得多核苷酸文库包括在实验室中制备多核苷酸 文库。在一些方面,获得多核苷酸文库包括直接或间接地从已制备 多核苷酸文库的第三方接收多核苷酸文库。
用于分析测序数据的方法
在一些方面,方法包含获得与多个多核苷酸相关的数据集,其 中该数据集包含多个多核苷酸的测序数据,其中多个多核苷酸中的 各多核苷酸包含样品识别区域,且其中各多核苷酸上的各样品识别 区域对于单一样品是独特的,其中源自第一单一样品的各多核苷酸 的样品识别区域的序列不同于源自于与第一单一样品不同的一个或 多个样品的多个多核苷酸中其它多核苷酸的样品识别区域的序列; 并分析数据集以将具有相同样品识别区域的多核苷酸匹配在一起, 其中匹配表示多核苷酸来源于相同的样品。
在一些方面,多个多核苷酸中各多核苷酸还包含第一板识别区 域,其中各多核苷酸上各第一板识别区域和样品识别区域的各种组 合对于单一样品是独特的,其中源自第一组单一样品的各多核苷酸 的第一板识别区域的序列不同于源自与第一组单一样品不同的一个 或多个单一样品组的多个多核苷酸中其它多核苷酸的第一板识别区 域的序列,且进一步包括分析数据集以将具有相同第一板识别区域 和相同样品识别区域的多核苷酸匹配在一起,其中两个区域之间的 匹配表示多核苷酸来源于相同的样品。
在一些方面,两个多核苷酸都包括可变区。在一些方面,一个 多核苷酸包括可变区。在一些方面,没有一个多核苷酸包括可变区。
在一些方面,获得数据集包括获得多个多核苷酸并测序多个多 核苷酸以通过试验测定该数据集。在一些方面,获得数据集包括直 接或间接地从已测序多个多核苷酸以通过试验测定数据集的第三方 接收数据集。在一些方面,数据集存储在电子存储介质上。在一些 方面,数据集在互联网上传递。
在一些方面,方法在计算机上执行,例如,其是计算机执行的 方法。
在一些方面,单一样品是单一细胞。在一些方面,单一样品包 含单一细胞。在一些方面,单一样品包含单一B细胞。在一些方面, 单一样品包含多个B细胞。在一些方面,单一样品包含单一B细胞 和一个或多个其它细胞。
在一些方面,由测序(例如,454测序)产生的数据可以通过 454GS FLX数据分析软件进行分析,且具有低质量评分的序列可以 过滤掉。良好质量的序列然后可以通过使用Python中的脚本在序列 使用生物信息学方法(例如通过使用Newbler)组装之前按照其样品 识别区域(且在一些实施方式中,其样品识别区域和板识别区域的 组合)细分。因为反向阅读片段在一些方面中可以仅具有第二板识 别区域,因此有可能在来自不同细胞的序列的正向和反向阅读片段 之间发生序列组装。为避免这一潜在的问题,正向和反向阅读片段 两者的重链和轻链V(D)J使用可以首先使用HighV-QUEST确定。然 后序列可以在组装之前按照其V(D)J使用进一步分组。在一些方面, 序列组装可能不耐受核苷酸错配,从而防止来自共有相同V(D)J使 用的不同细胞的正向和反向阅读片段的组装。在一些方面,序列然后可以通过使用计算机程序基于其V(D)J使用聚类在一起。
在一些方面,生物信息学方法可以用于鉴别形成克隆家族和亚 家族的序列的组,并因而鉴别目标免疫球蛋白序列。这样的生物信 息学方法包括测量序列相似性。这样的生物信息学方法可以用于鉴 别源自单个人、源自一个或多个人、源自具有病症的一个或多个人 或源自具有不同病症的一个或多个人的目标序列。
在一些方面,相关免疫球蛋白重链和/或轻链序列可以通过免疫 球蛋白重链和/或轻链V(D)J序列之间同源性的系统发生计算分析来 鉴别。在一些方面,代表单个V、D和/或J基因片段和/或其组合的 序列和/或源自免疫球蛋白重链和/或轻链的其它序列的标准分类方 法(即聚类)可以用于鉴别克隆家族或亚家族(例如,通过使用 ClustalX)。
如本文中所用的,“克隆家族”是指各具有V、D和/或J区域的 多个免疫球蛋白序列,其中各序列是具有V、D和/或J区域的相同 种系免疫球蛋白序列的突变形式或具有V、D和/或J区域的种系免 疫球蛋白序列。在一些方面,所述多个免疫球蛋白序列是多个重链序列。在一些方面,所述多个免疫球蛋白序列是多个轻链序列。在 一些方面,所述多个免疫球蛋白序列是多个配对的重链和轻链序列。 在一些方面,各序列具有V、D和J区域。在一些方面,各序列具有 V和D区域。在一些方面,各序列具有D和J区域。在一些方面, 各序列具有V和J区域。在一些方面,各序列具有V区域。在一些 方面,各序列具有D区域。在一些方面,各序列具有J区域。在一 些方面,一个或多个突变位于V、D和/或J区域内。在一些方面, 一个或多个突变位于V、D和/或J区域之间。
在一些方面,其重链全部使用相同V和J基因片段的一组抗体 是克隆家族。在一些方面,其重链全部使用相同V和J基因片段且 其P/N核苷酸和D核苷酸长度的总和为相同的长度的一组抗体是克 隆家族。在一些方面,其重链全部使用相同的V、D和J基因片段的 一组抗体是克隆家族。在一些方面,其重链全部使用相同的V、D 和J基因片段且其V和D基因片段之间的P/N核苷酸为相同的长度 且其D和J基因片段之间的P/N核苷酸为相同的长度的一组抗体是 克隆家族。在一些方面,其重链全部使用相同的V和J基因片段且 其轻链全部使用相同的V和J基因片段的一组抗体是克隆家族。在 一些方面,其重链全部使用相同的V和J基因片段且其P/N核苷酸 和D核苷酸长度的总和为相同长度,并且其轻链全部使用相同的V和J基因片段且其P/N核苷酸为相同的长度的一组抗体是克隆家族。 在一些方面,其重链全部使用相同的V、D和J基因片段且其轻链全 部使用相同的V和J基因片段的一组抗体是克隆家族。在一些方面, 其重链全部使用相同的V、D和J基因片段且V和D基因片段之间 的P/N核苷酸为相同的长度且其D和J基因片段之间的P/N核苷酸 为相同的长度。并且其轻链全部使用相同的V和J基因片段且其V 和J基因片段之间的P/N核苷酸为相同的长度的一组抗体是克隆家 族。
用于构建克隆家族的方法
T细胞受体(TCR)或免疫球蛋白可变基因查询序列的V、D和J 使用可以通过鉴别最有可能产生该序列的种系V、D(如果可用的话) 和J基因片段确定。D片段存在于一些TCR和免疫球蛋白序列(例 如,TCRβ、TCRδ和抗体重链序列)中但不存在于其它序列(例如, TCRα、TCRγ和抗体轻链序列)中。以下描述包括D片段,但相同 的途径可应用于缺乏D片段的可变序列。在所有情况中,V(D)J使 用的确定使用种系V、D和J基因片段序列的参考数据库如IMGT/GENE-DB(Giudicelli V,Chaume D,Lefranc MP. IMGT/GENE-DB:a comprehensivedatabase for human and mouse immunoglobulin and T cell receptor genes.NucleicAcids Res.2005Jan 1;33(Database issue):D256-61.)。
在确定V(D)J使用的一种途径中,查询序列独立地与各V、D 和J种系基因片段顺次地比较且各型(V、D或J)的最相似基因片段 选择为最可能已产生该查询序列。V-QUEST和High V-QUEST是这 一途径的实例(Giudicelli V,Chaume D,Lefranc MP.IMGT/V-QUEST,an integrated software program for immunoglobulin and T cell receptor V-J andV-D-J rearrangement analysis.Nucleic Acids Res.2004Jul 1;32(Web Serverissue):W435-40.;Brochet X,Lefranc MP,Giudicelli V. IMGT/V-QUEST:the highlycustomiZed and integrated system for IG and TR standardized V-J and V-D-Jsequence analysis.Nucleic Acids Res.2008Jul 1;36(Web Server issue):W503-8.)。V-QUEST首先产生查 询序列和各V基因片段序列的逐对比对。然后它产生V片段的推导 3’端下游查询序列区域和各J基因片段序列的逐对比对。如果D片 段存在,则V-QUEST产生在匹配V和J片段的区域之间存在的查询 序列区域与各D片段序列的逐对比对。V-QUEST也可以推断V-D、 V-J和/或D-J接合区的边界。
在确定V(D)J使用的另一途径中,最可能已产生查询序列的种 系V、D和J片段的组合在单一步骤中而不是在分别用于V、D和J 的三个独立步骤中鉴别。这一途径具有一种类型的片段(V、D或J) 的鉴别可以考虑关于与另两种类型的片段的潜在匹配的信息的优 势。例如,最佳匹配的D片段可能取决于考虑哪种V片段匹配。SoDA 是这一途径的实例(VolpeJM,Cowell LG,Kepler TB.SoDA: implementation of a 3D alignment algorithm forinference of antigen receptor recombinations.Bioinformatics.2006Feb15;22(4):438-44.)。 SoDA首先选择候选V、D和J片段。它产生查询序列和各V基因片 段序列的逐对局部比对,且然后仅保持满足评分域值的比对的V片 段。对于J片段和D片段重复这些步骤。然后对于各可能的候选V、 D和J片段的组合产生最佳比对。比对使用广泛用于序列比对中的相 同的一般动态编程方式产生(Needleman,S.B.和Wunsch,C.D.(1970)A general methodapplicable to the search for similarities in the amino acid sequence of twoproteins.J.Mol.Biol.,48,443-453.),但允许在V-D、 V-J和/或D-J接合区插入另外的核苷酸。这样的插入通常发生在 V(D)J重组的生物学过程中。在通过动态编程的序列比对中,通常存 在与插入、缺失和错配相关的罚分。但是,在确定V(D)J使用的这 一途径中,对于片段之间接合区处核苷酸的插入不应用罚分。选择 产生最高评分的比对的V(D)J组合以表示查询序列的V(D)J使用。 这一途径也可以鉴别接合序列区域的边界。
从克隆家族和亚克隆家族,多种途径可用于选择特定的克隆用 于表达其编码的配对重链和轻链免疫球蛋白基因和表征其结合特 性。在一些方面,来自克隆家族和/或克隆亚家族的最高频率克隆以 及来自克隆家族和克隆亚家族的其它代表性克隆进行表达和其结合 特性的筛选。克隆也可以从所有克隆、从所有或选择的克隆家族和/ 或从所有或选择的克隆亚家族随机地选择用于表达和其结合特性的 表征。克隆也可以基于在抗体的可变区中具有大量变异进行选择。 可以构建系统发生树,且可以基于系统发生树的特征选择克隆,例 如,通过系统发生树下行总是选择具有最多数目的下方叶节点的分 支。
在一些方面,方法进一步包括选择一个或多个用于克隆的多核 苷酸。
用于基于第一目标的选择鉴别第二目标多核苷酸的方法
在一些方面,方法包括获得与多个多核苷酸相关的数据集,其 中数据集包含多个多核苷酸的测序数据,其中多个多核苷酸中的各 多核苷酸包含样品识别区域,且其中各多核苷酸上的各样品识别区 域对于单一样品是独特的,因而将多核苷酸中的各多核苷酸与独特 的单一样品相关联,其中源自于第一单一样品的各多核苷酸的样品 识别区域的序列不同于源自与第一单一样品不同的一个或多个样品 的多个多核苷酸中其它多核苷酸的样品识别区域的序列,并从数据 集选择与第一单一样品相关的第一目标多核苷酸并基于第一目标多 核苷酸的样品识别区域鉴别第一单一样品中的第二目标多核苷酸。
在一些方面,多个多核苷酸中的各多核苷酸进一步包含第一板 识别区域,其中各多核苷酸上的各第一板识别区域和样品识别区域 的各种组合对于单一样品是独特的,其中源自第一组单一样品的各 多核苷酸的第一板识别区域的序列不同于源自与第一组单一样品不 同的一个或多个单一样品组的多个多核苷酸中其它多核苷酸的第一 板识别区域的序列,且进一步包括基于第一目标多核苷酸的样品识 别区域和第一板识别区域鉴别第一单一样品中的第二目标多核苷 酸。
在一些方面,两个多核苷酸都包括可变区。在一些方面,一个 多核苷酸包括可变区。在一些方面,没有任何一个多核苷酸包括可 变区。
在一些方面,方法在计算机上执行,例如,它是计算机执行的 方法。
在一些方面,第一单一样品包含B细胞。在一些方面,第一单 一样品包含单一B细胞和一个或多个其它细胞。在一些方面,第一 单一样品包含多个B细胞。在一些方面,第一单一样品包含B细胞, 其中第一目标多核苷酸包含抗体重链核苷酸序列,且其中第二目标多核苷酸包含抗体轻链核苷酸序列。在一些方面,第一单一样品包 含B细胞,其中第一目标多核苷酸包含抗体轻链核苷酸序列,且其 中第二目标多核苷酸包含抗体重链核苷酸序列。
在一些方面,获得数据集包括获得多个多核苷酸并测序该多个 多核苷酸以通过试验测定该数据集。在一些方面,获得数据集包括 直接或间接地从已经测序多个多核苷酸以通过试验测定该数据集的 第三方接收数据集。在一些方面,数据集存储在电子存储介质上。
产生一个或多个用于克隆的目标多核苷酸的方法
在一些方面,方法包括获得包含多个多核苷酸的多核苷酸文库, 其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和 源自单一样品的扩增子区域,其中通用引物区域的序列在多个多核 苷酸的各多核苷酸上是基本上相同的,且其中源自第一单一样品的 各多核苷酸的样品识别区域的序列不同于源自与第一单一样品不同 的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列; 和使用一组引物扩增多核苷酸文库以产生用于克隆的一个或多个目 标多核苷酸,其中用于克隆的一个或多个目标多核苷酸包含第一限 制性位点区域、通用引物区域、样品识别区域、接合体区域、源自 单一样品的扩增子区域和第二限制性位点区域。
在一些方面,获得多核苷酸文库包括在实验室中制备多核苷酸 文库。在一些方面,获得多核苷酸文库包括直接或间接地从已经制 备多核苷酸文库的第三方接收多核苷酸文库。
在一些方面,方法进一步包括克隆一个或多个多核苷酸,例如 克隆到本文中公开的载体中。
产生目标分子的方法
在一些方面,方法包括获得包含目标多核苷酸的宿主细胞;和 在足以产生目标分子的条件下培养宿主细胞。
在一些方面,获得宿主细胞包括在实验室中制备包含多核苷酸 的宿主细胞。在一些方面,获得宿主细胞包括直接或间接地从已经 制备宿主细胞的第三方接收包含多核苷酸的宿主细胞。
在一些方面,目标分子是多肽。在一些方面,目标分子是抗体。 在一些方面,目标分子是人单克隆抗体。
在一些方面,方法进一步包括收集目标分子。
在一些方面,希望的是“重折叠”特定多肽,例如包含一个或多 个ABP成分或ABP本身的多肽。在某些实施方式中,这样的多肽使 用本文中讨论的表达系统产生。在某些实施方式中,多肽“重折叠” 和/或氧化以形成所需的三级结构和/或产生二硫键。在某些实施方式 中,这种结构和/或连接与多肽的特定生物活性相关。在某些实施方 式中,重折叠使用本领域中已知的多种过程中的任一种完成。示例 性的方法包括,但不限于将溶解的多肽试剂在离液剂存在下暴露于 通常高于7的pH。示例性的离液剂是胍。在某些实施方式中,重折叠和氧化溶液还含有还原剂和该还原剂的氧化形式。在某些实施方 式中,还原剂及其氧化形式以产生允许二硫重排发生的特定氧化还 原电位的比率存在。在某些实施方式中,这样的重排允许形成半胱 氨酸桥。示例性的氧化还原对包括,但不限于半胱氨酸/胱胺、谷胱甘肽/二硫双GSH、氯化铜、二硫苏糖醇DTT/二噻烷DTT和2-巯基 乙醇(bME)/二硫代-bME。在某些实施方式中,共溶剂用于提高重折 叠的效率。示例性的共溶剂包括,但不限于甘油、各种分子量的聚 乙二醇和精氨酸。
在某些实施方式中,充分地纯化多肽,例如包含一个或多个ABP 成分或ABP本身的多肽。特定的蛋白质纯化技术是本领域技术人员 已知的。在某些实施方式中,蛋白质纯化包括从非-多肽部分粗分馏 多肽级分。在某些实施方式中,多肽使用色谱和/或电泳技术纯化。 示例性的纯化方法包括,但不限于硫酸铵沉淀、PEG沉淀、免疫沉 淀、热变性后离心、色谱法(包括,但不限于亲和色谱(例如,蛋 白-A-琼脂糖凝胶)、离子交换色谱、排阻色谱和反相色谱)、凝胶 过滤、羟磷灰石色谱、等电聚焦、聚丙烯酰胺凝胶电泳及这些技术 和其它技术的组合。在某些实施方式中,多肽通过快速蛋白液相色 谱或通过高压液相色谱(HPLC)纯化。在某些实施方式中,纯化步骤 可以改变或特定步骤可以省略而仍获得用于制备基本上纯化的多肽 的适当方法。
在某些实施方式中,定量多肽制备物的纯化程度。用于定量纯 化程度的特定方法是本领域技术人员已知的。特定的示例性方法包 括,但不限于测定制备物的特异性结合活性和通过SDS/PAGE分析 评估制备物中多肽的量。用于评估多肽制备物的纯化量的特定示例 性方法包括计算制备物的结合活性和将其与初始提取物的结合活性 比较。在某些实施方式中,这种计算的结果表示为“纯化倍数”。用 于代表结合活性的量的单位取决于进行的特定分析。
在某些实施方式中,包含一个或多个ABP成分或ABP本身的多 肽被部分纯化。在某些实施方式中,部分纯化可以通过使用较少的 纯化步骤或通过利用相同的一般纯化方案的不同形式完成。例如, 在某些实施方式中,利用HPLC设备进行的阳离子交换柱色谱一般产生比利用低压色谱系统的相同技术更高的“纯化倍数”。在某些实 施方式中,产生较低纯化程度的方法可以具有多肽总回收率或保持 多肽的结合活性方面的优势。
在某些情况中,多肽的电泳迁移可以随SDS/PAGE的不同条件 而变化,有时是显著地变化。参见,例如Capaldi等,Biochem.Biophys. Res.Comm.,76:425(1977)。应当理解,在不同的电泳条件下,纯化 的或部分纯化的多肽的表观分子量可以是不同的。
筛选方法
在一些方面,筛选目标分子的活性。在一些方面,目标分子是 ABP。在一些方面,目标分子是抗体。
在一些方面,筛选本文中公开的文库的方法用于鉴别能够结合 所需的靶标的ABP。设想了允许基于结合靶分子的ABP从文库选择 ABP的任何体外或体内筛选方法。
在一个实施方式中,文库可以使用本领域公认的体外无细胞表 型-基因型关联展示进行筛选。这样的方法是本领域中公知的且描述 于例如U.S.专利No.7,195,880;6,951,725;7,078,197;7,022,479; 6,518,018;7,125,669;6,846,655;6,281,344;6,207,446;6,214,553;6,258,558;6,261,804;6,429,300;6,489,116;6,436,665;6,537,749; 6,602,685;6,623,926;6,416,950;6,660,473;6,312,927;5,922,545和 6,348,315中。这些方法包括以使得蛋白质与其所来源的核酸物理关 联或结合的方式从核酸体外转录蛋白质。通过用靶分子选择表达的 蛋白质,也可以选择编码该蛋白质的核酸。
为提高scFv蛋白质的表达,以上所指的体外筛选分析可以包括 特定试剂的添加或移除。在一个实施方式中,蛋白质二硫化物异构 酶可以添加到体外表达系统中以提高功能性scFv分子的产生。在另 一实施方式中,温和氧化剂(例如,GSSG(氧化的谷胱甘肽)/GSH(还原的谷胱甘肽),例如100mM GSSG/10mM GSH)可以添加到 scFv蛋白质的体外翻译反应混合物中以允许在scFv分子的VH和 VL区域中形成链内二硫键。在另一实施方式中,还原剂(例如,二 硫苏糖醇(DTT))可以从scFv的体外翻译反应混合物移除。
在另一实施方式中,一个或多个标记的氨基酸或其衍生物可以 添加到体外翻译系统以使得标记的氨基酸变为并入到所得抗体中。 设想了任何本领域公认的标记氨基酸,例如放射标记的氨基酸,例 如35S-标记的甲硫氨酸或半胱氨酸。
在一个实施方式中,体外筛选分析可以包括在一个或多个抗体 的体外选择后,与所述一个或多个抗体物理关联的mRNA可以反转 录以产生编码所述一个或多个抗体的cDNA。设想了用于反转录的任 何合适的方法,例如,酶介导的,例如莫洛尼鼠白血病病毒反转录 酶。
筛选方法可以包括扩增编码特异性结合所需靶标的抗体的核 酸。在一个实施方式中,与一个或多个抗体物理相关的mRNA可以 扩增以产生更多的mRNA。设想了任何本领域公认的RNA复制方法, 例如,使用RNA复制酶。在另一实施方式中,与一个或多个抗体物 理相关的mRNA在通过PCR扩增前首先反转录成cDNA。在一个实 施方式中,PCR扩增使用高保真校读聚合酶,例如来自Thermococcus kodakaraensis的KOD1热稳定DNA聚合酶或PlatinumTaq DNA Polymerase High Fidelity(Invitrogen,Carlsbad,Calif.)。在另一实施方 式中,PCR扩增可以在导致突变引入扩增的DNA中的条件下进行, 即易错PCR。
筛选方法也可以包括提高靶结合筛选方法的严格性以选择具有 提高的靶标亲和力的抗体。设想了提高抗体-靶标相互作用分析的严 格性的任何本领域公认的方法。在一个实施方式中,一个或多个分 析条件可以变化(例如,分析缓冲液的盐浓度)以降低抗体分子对 所需靶标的亲和力。在另一实施方式中,可以缩短允许抗体结合所 需靶标的时间长度。在另一实施方式中,竞争结合步骤可以添加到 抗体-靶标相互作用分析中。例如,可以首先使得抗体结合所需的固 定靶标。然后可以添加特定浓度的非固定靶标,其用于竞争结合固 定的靶标以使得具有对抗原的最低亲和力的抗体从固定的靶标洗 脱,导致富集具有改善的抗原结合亲和力的抗体。在一个实施方式 中,分析条件的严格性可以进一步通过提高添加到分析中的非固定 靶标的浓度而提高。
筛选方法也可以包括多轮的选择以富集具有改善的靶结合的一 种或多种抗体。在一个实施方式中,在各轮选择中,进一步的氨基 酸突变可以使用本领域公认的方法引入抗体中。在另一实施方式中, 在各轮选择中,可以提高结合所需靶标的严格性以选择具有对所需 靶标的更高亲和力的抗体。
筛选方法可以包括从体外翻译系统的成分纯化RNA-抗体融合 蛋白。这可以使用任何本领域公认的分离方法完成。在一个实施方 式中,RNA-抗体融合蛋白可以使用聚脱氧腺苷(polydT)树脂通过 色谱法分离。在另一实施方式中,RNA-抗体融合蛋白可以使用对RNA-抗体融合蛋白的抗体成分中存在的表位特异性的抗体通过色 谱法分离。在一个实施方式中,表位可以是氨基酸序列标签,例如 FLAG或HA标签,其整合到RNA-抗体融合蛋白的抗体成分的氨基 酸序列中,例如在可变区间接头的N-末端、C-末端或其中。
从文库选择抗体可以包括使用固定的靶分子。在一个实施方式 中,靶分子可以直接连接固体基质,例如琼脂糖珠。在另一实施方 式中,靶分子可以首先进行修饰,例如生物素化,且修饰的靶分子 可以通过对固体载体的修饰结合,例如抗生蛋白链菌素-M280、neutravidin-M280、SA-M270、NA-M270、SA-MyOne、NA-MyOne、 SA-琼脂糖和NA-琼脂糖。
在一些方面,荧光-标记的抗原用于单一细胞分选仅浆母细胞或 具有针对特定的标记抗原的反应性的其它B谱系细胞。在其它方面 中,荧光-标记的抗原用于在进行单一细胞分选前富集浆母细胞或具 有针对特定的标记抗原的反应性的其它B谱系细胞。在一些方面, 产荧光或生色分子可用于鉴别和分选B谱系细胞。在一些方面,所 需的浆母细胞或其它B谱系细胞可以通过磁激活的细胞分选(MACS) 或甚至通过淘选分离。所得的产物一般是针对多种靶标(包括但不 限于:癌症抗原、细胞因子、趋化因子、生长因子、分泌的蛋白质、细胞表面和其它抗原)的单克隆抗体以耗竭具有特定意义的细胞类 型、微生物、细菌、分枝杆菌、寄生虫和病毒。其它筛选方法描述 于下面的实施例章节中。
计算机执行
在一些方面,一种或多种本文描述的方法可以在计算机上执行。 在一个实施方式中,计算机包含与芯片偶联的至少一个处理器。还 与芯片偶联的有存储器、存储装置、键盘、图形适配器、点击设备 和网络适配器。显示器与图形适配器偶联。在一个实施方式中,芯 片的功能性由内存控制中心和I/O控制中心提供。在另一实施方式 中,存储器直接与处理器而不是芯片偶联。
存储装置是能够保持数据的任何装置,如硬盘驱动器、光盘只 读存储器(CD-ROM)、DVD或固态存储装置。存储器保持由处理器 使用的指令和数据。点击设备可以是鼠标、轨迹球或其它类型的点 击设备,且用于与键盘组合以将数据输入计算机系统中。图形适配 器在显示器上显示图像和其它信息。网络适配器将计算机系统与局 域网或广域网偶联。
如本领域中已知的,计算机可以具有不同的和/或先前描述的那 些以外的其它部件。另外,计算机可以缺少特定的部件。而且,存 储装置可以对于计算机是本地的和/或远程的(如在存储区域网(SAN) 中实施)。
如本领域中已知的,计算机适应于执行用于提供本文中描述的 功能性的计算机程序模块。如本文中所用的,术语“模块”是指用于 提供特定功能性的计算机程序逻辑。因此,模块可以在硬件、固件 和/或软件中执行。在一个实施方式中,程序模块存储在存储装置上、 加载到存储器中和通过处理器执行。
本文中描述的实体的实施方式可以包括此处描述的模块以外的 其它的和/或不同的模块。另外,归因于模块的功能性可以在其它实 施方式中通过其它的或不同的模块执行。此外,本说明书偶尔省略 术语“模块”以达到清楚和方便的目的。
试剂盒
试剂盒可以包括本文中公开的多核苷酸、多核苷酸文库、载体 和/或宿主细胞及使用说明。试剂盒可以在适当的容器中包含本文中 公开的多核苷酸、多核苷酸文库、载体和/或宿主细胞,一个或多个 对照及本领域中公知的各种缓冲剂、试剂、酶和其它标准成分。
容器可以包括含有一个或多个孔的板上的至少一个孔。容器可 以包括至少一个小瓶、试管、烧瓶、瓶子、注射器或其它容器装置, 其中可以放置多核苷酸、多核苷酸文库、载体和/或宿主细胞且在一 些情况中适当地等分。在提供另外的成分的情况中,试剂盒可以包 含可以在其中放置这种成分的另外的容器。试剂盒还可以包括用于 容纳多核苷酸、多核苷酸文库、载体和/或宿主细胞的装置和紧密封 闭以用于商业售卖的任何其它试剂容器。这样的容器可以包括在其 中保持所需小瓶的注塑或吹塑塑料容器。容器可以包括具有使用说 明和/或警告的标签。
实施例
实施例仅用于示例说明的目的而不意图以任何方式限制本发明 的任何实施方式的范围。已经努力确保使用的数字(例如,量、温 度等)的精确性,但当然应当允许一些试验误差和变异。
除非另外指明,各种方法可以采用本领域技术范围内的蛋白质 化学、生物化学、重组DNA技术和药理学的常规方法。这样的技术 在文献中充分地解释。参见,例如,T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman andCompany,1993);A.L. Lehninger,Biochemistry(Worth Publishers,Inc.,currentaddition); Sambrook等,Molecular Cloning:A Laboratory Manual(2nd Edition,1989);Methods In Enzymology(S.Colowick and N.Kaplan编辑, Academic Press,Inc.);Remington′s Pharmaceutical Sciences,第18版 (Easton,Pennsylvania:MackPublishing Company,1990);Carey和 Sundberg Advanced Organic Chemistry第3版.(Plenum Press)Vols A and B(1992);Current Protocols in Molecular Biology(2002-;Wiley; Online ISBN:9780471142720;DOI:10.1002/04711142727);CurrentProtocols in Immunology(2001-;Wiley;Online ISBN:9780471142737; DOI:10.1002/0471142735)。
一般材料和方法
血液收集和PBMC的分离
所有人类样品在知情同意后和按照研究审查委员会(IRB)-批准 的人类受试者方案收集。血液收集在肝素管(Beckton Dickinson and Company,目录号BD366664)中或在CPT管(Beckton Dickinson and Company,目标号BD362761)中。对于肝素管的处理,一毫升血液转 移到微离心管中并以12,000rpm旋转3分钟,收集血浆和在-80℃ 下冷冻(用于后面抗体反应性的测试),剩余的血液在Ficoll上成 层并在室温下、以最小加速度和不使用制动器的情况下在具有 SX4750Swinging Bucket Rotor的Beckman Coulter Allegra X-15R台 式离心机中对肝素管离心20分钟,并收集外周血单核细胞(PBMC) 层。或者,CPT管在室温下、以最小加速度和不使用制动器的情况 下以1,500g直接离心20分钟,并收集PMBC层。收集的PBMC然 后在使用前用PBS洗涤两次。
PBMC也可以冷冻以用于进一步的使用和B-细胞、记忆B-细胞、 浆母细胞、浆细胞或其它B-细胞群体的分离。用于冷冻PBMC的一 种方法包括重悬PBMC在冷冻管中的90%胎牛血清(FBS)和10%二甲 亚砜中,且随后在Mr.Frosty(Sigma C1562-1EA)中缓慢地在-80℃下 冷冻容纳在小瓶中的细胞过夜。冷冻细胞的小瓶然后转移到液氮中 用于长期储存,并可以在较晚时间解冻以用于单个B细胞的分离和 配对的免疫球蛋白基因的高通量测序。解冻的细胞在含有过量DNase I(通常25ug/ml)(Sigma D4513)的培养基中孵育直到第一分选的结 束以防止细胞结块。
细胞和细胞亚群的分离和富集
浆母细胞。对于一些样品,PBMC首先通过使用改良的浆细胞 分离试剂盒II(Miltenyi 130-093-628)富集浆母细胞。这是任选的步 骤。这产生较少的用于后续分选的总细胞,从而具有较短的分选时 间。这主要在需要在同一天对多个样品进行单一细胞分选时使用。 也可能使用不同试剂盒以富集不同B细胞群体(参见下文)。对于 每5x107个PBMC,细胞悬浮在200μL冰冷的MACS缓冲液(具有 0.5%FBS的PBS)中。添加50uL的非-浆细胞生物素-抗体混合物, 且细胞在冰箱(4℃)中孵育10分钟。添加100μL的MACS缓冲液、 100μL的非-浆细胞微珠混合物和50μL的CD56微珠并在冰箱中孵 育另外10分钟。然后细胞用7mLMACS缓冲液洗涤,以300g在 4℃下离心5分钟,重悬在500μL MACS缓冲液中并在磁场中的平衡的LS柱上分析。该柱用4x3mL的MACS缓冲液洗涤且富集的 细胞处于阴性级分中。
记忆B-细胞。CD19+微珠(Miltenyi 130-050-301)和CD27+微珠 (130-051-601)可以用于在细胞分选前富集记忆B-细胞以缩短分选时 间。也可以使用其它富集方法如记忆B-细胞分离试剂盒(Miltenyi 130-093-546),只要它们富集CD19+CD27+细胞。对于每5x107个 PBMC,300μL的冰冷MACS缓冲液用于重悬。然后添加100μL的CD19微珠和100μL的CD27微珠,且样品在4℃下孵育15分钟。 然后细胞用7mL的MACS缓冲液洗涤,以300g在4℃下离心5分 钟,并重悬在500μL MACS缓冲液中。然后细胞在磁场中通过平衡 的LS柱分析,并用2x3mL的MACS缓冲液洗涤。LS柱然后从磁 场移除,且细胞用5mL的MACS缓冲液洗掉以洗脱富集的细胞。
总B-细胞。CD19+微珠(Miltenyi 130-050-301)可以用于在细胞分 选前富集总B细胞,例如以缩短分选时间。其它富集方法也可以使 用,只要它们富集CD19+细胞。对于每5x107个PBMC,将细胞重悬 在400μL的冰冷MACS缓冲液中。添加100μL的CD19+微珠并在 冰箱(4℃)中孵育15分钟。然后细胞用7mL的MACS缓冲液洗涤, 以300g在4℃下离心5分钟,并重悬在500μL MACS缓冲液中。 然后细胞在磁场中通过平衡的LS柱分析,并用2x 3mL的MACS缓冲液洗涤。LS柱然后从磁场移除,且细胞用5mL的MACS缓冲 液洗脱脱,从而产生富集的细胞。
其它细胞类型。虽然不是必需的,所需细胞群体的MACS富集 可以缩短分选时间。其它细胞群体包括浆细胞、其它B-细胞群体和 非B-细胞群体也可以使用MACS或其它使用适宜试剂的系统富集。 例如,总T-细胞可以使用CD3+微珠富集,且效应T-细胞和辅助T- 细胞分别使用CD8+和CD4+微珠分离。CD45RO微珠可以用于分离 记忆T-细胞,并与CD8+或CD4+珠结合,用于分别分离记忆效应 T-细胞或记忆辅助T-细胞。
单一-细胞分选
MACS富集不是分选所需的,但可以进行浆母细胞的MACS富 集以缩短分选时间。如果PBMC已进行MACS富集,等份的未富集 PBMC(~1百万细胞)也串联地分析,允许确定样品中的基线浆母 细胞百分比。为了分选浆母细胞,细胞用制造商推荐体积的 CD3-V450(BD560365)、IgA-FITC(AbD Serotec STAR142F)、 IgM-FITC(AbD Serotec STAR146F)或IgM-PE(AbD Serotec STAR146PE)、CD20-PerCP-Cy5.5(BD 340955)、CD38-PE-Cy7(BD 335808)、CD19-APC(BD 340437)和CD27-APC-H7(BD 560222)在50 μL的FACS缓冲液(具有2%FBS的PBS或HBSS)在冰上黑暗中染 色20分钟。一些细胞也可以替代地与IgM-FITC一起用IgG-PE(BD 555787)、CD138-PE(eBioscience 12-1389-42)或HLA-DR-PE(BD 555812)染色。对于浆母细胞、记忆B-细胞和原始B-细胞的同时分选, 使用以下染色方案:IgD-FITC(Biolegend348205)、IgG-PE(BD 555787)、CD20-PerCP-Cy5.5、CD38-PECy7、IgM-APC(BD 551062)、CD27-APC-H7、IgA-biotin(AbD Serotec 205008),之后链霉亲和素 -eFluor710(eBioScience 49-4317-82)和CD19-BV421(Biolegend 302233)。记忆B-细胞也分选为CD19+CD27+IgG+或 CD19+CD20+IgG+,原始B-细胞分选为CD19+IgD+IgM+。IgA+浆母细 胞也进行分选,并定义为CD19+CD20-CD27+CD38++IgA+IgM-。也可 以使用其它细胞表面标志物,只要B-细胞或其它细胞群体可使用细 胞表面标志物通过表型鉴别,群体可进行单一细胞分选。参见下文。 然后细胞用2mL的FACS缓冲液洗涤一次并以适宜体积重悬以进行 FACS。细胞首先在BD Aria II上分选到5mL圆底管中。通常,>80% 的纯度从第一分选获得。单一细胞分选到含有6.65μL低渗缓冲液 (10mM Tris-HCl pH7.6)的96-孔PCR板的前11列中,低渗缓冲液包含2mM dNTP(NEB N0447L)、5μM寡(dT)20VN和1单位的Ribolock (Fermentas EO0384),RNA酶抑制剂。作为阴性对照,最后一列保持 不含细胞。对于IgG+浆母细胞,选通(细胞的选择)策略是 CD19+CD20-CD27+CD38++IgA-IgM-。分选的板用铝板密封剂(Axygen PCR-AS-600)密封并立即在干冰上冷冻和在-80℃下储存。
单一细胞分选选通策略
B-细胞。对于B-细胞,选通方式包括分选一种或多种以下标志 物:IgM、IgG、IgA、IgD、CD19或CD20。对于总IgG+B-细胞, 选通方式包括分选IgG+。对于总IgA+B-细胞,选通方式包括分选 IgA+。对于总IgM+B-细胞,选通方式包括分选IgM+
活化B细胞。活化B细胞包括通过其膜抗原受体与同源抗原的 结合刺激的和/或从识别源自相同的大分子抗原的表位的T细胞接受 T细胞辅助的B细胞。活化B细胞也可以通过多种性质包括增大的 细胞尺寸(例如,“未成熟B细胞”,参见下文)、一种或多种细胞 表面标志物的表达、一种或多种细胞内标志物的表达、一种或多种 转录因子的表达、退出细胞周期的G0期、进展通过细胞周期、细胞 因子或其它因子的产生和/或一种或多种特定细胞表面标志物、一种 或多种细胞内标志物、一种或多种转录因子或其它因子的下调来鉴别。鉴别活化B细胞的一种方法是结合B细胞标志物(如CD19或 免疫球蛋白)与活化标志物(如增大的细胞尺寸或体积、细胞表面 活化标志物CD69或者基于细胞渗透性吖啶橙DNA染色或另一细胞 周期分析的进展通过细胞周期的检测)的检测。
不成熟B细胞。“不成熟B细胞”是活化的和相对于静息B细胞 尺寸增大的B细胞。不成熟B细胞包括浆母细胞群体以及其它活化 B细胞群体,且不成熟B细胞在尺寸上物理大于静息B细胞。不成 熟B细胞可以使用几种不同的途径进行单一细胞分选,包括按照细 胞直径、细胞体积、电阻抗、FSC、FSC脉冲的积分(面积)(FSC-A)、 FSC高度(FSC-H)、前向散射脉冲宽度(FCS-W)、侧向散射(SSC)、侧 向散射脉冲面积(SSC-A)、侧向散射高度(SSC-H)、侧向散射宽度 (SSC-W)、自发荧光和/或细胞尺寸的其它量度而基于其物理较大而 进行B细胞的选通(选择)。
在流式细胞术中,前向散射(FSC)使用与细胞流一致的光束测量 并提供有关各细胞的比例尺寸和直径的信息。使用FSC,可以选择 具有大于静息B细胞的中值FSC的FSC的B细胞,例如大于静息B 细胞5%、大于静息B细胞10%、大于静息B细胞15%、大于静息B 细胞20%、大于静息B细胞30%、大于静息B细胞40%、大于静息 B细胞50%、大于静息B细胞60%的FSC-A或FSC-H。通过分析特 定尺寸的校准珠,可以使用FSC确定B细胞相对于校准珠的相对尺 寸。由此,可以特别地选通并因此选择具有约8um、>8um、>9um、 >10μm、>11μm、>12μm、>13μm、>14μm、>15μm、>16μm、 >17um、>18um、>19um或>20um的直径的B细胞。
细胞尺寸的另一量度是细胞体积。细胞体积的“金标准”使用基 于电测量的Coulter原理(Tzur等,PLoS ONE,6(1):e16053. doi:10.1371/journal.pone.0016053,2011)。虽然通过小滴带电和折射分 选的方法首先用于通过阻抗测量细胞体积的装置中,当前可用的流 式细胞仪仅进行光学测量。FSC测量,特别是FSC-A(FSC积分面积) 通常用于评估细胞尺寸,虽然FSC测量可受微粒和流体之间的折射 率差异影响(Tzur等,PLoS ONE,6(1):e16053. doi:10.1371/journal.pone.0016053,2011)。有人已经证明体积评估可通过组合光学参数改善,包括FSC-W、SSC和450/50-A自发荧光(Tzur 等,PLoS ONE,6(1):e16053.doi:10.1371/journal.pone.0016053, 2011)。
例如,基于增大的尺寸选择活化B细胞可以通过使用标志物如 CD19鉴别B细胞和通过FSC或FSC-A评估其尺寸来实现。其它B 细胞标志物和/或用于尺寸评估的参数在本文中描述。
浆母细胞。对于浆母细胞的分离,选通方式包括分选 CD19+CD38++B-细胞。对于IgG+浆母细胞的分离,选通方式包括分 选CD19+CD38++IgA-IgM-B-细胞。对于IgA+浆母细胞的分离,选通 方式包括分选CD19+CD38++IgA+B-细胞。对于IgM+浆母细胞的分 离,选通方式包括分选CD19+CD38++IgM+B-细胞。另外,其它选通 策略可以用于分离足够数目的浆母细胞以完成本文中描述的方法。 浆母细胞也使用以下标志物表达谱CD19low/+、CD20low/-、CD27+和CD38++分离。一般来说,虽然所有这些标志物的使用导致从单一细 胞分选产生最纯的浆母细胞群体,但不是所有上述标志物都需要使 用。例如,浆母细胞也可以使用以下选通策略分离:用于较大细胞 FSChiCD19lo细胞、FSChi和CD27+、CD38++或CD20-细胞的前向散射 高度(FSChi)。任何这些标志物或发现能够区分浆母细胞与其它B细 胞的其它标志物的组合一般地提高分选的浆母细胞的纯度,但是任 何一种上述标志物单独(包括FSChi)可以区分浆母细胞与其它B细 胞,尽管具有较低的纯度。
对于记忆B-细胞。对于IgG+记忆B-细胞,选通途径包括分选 CD19+CD27+IgG+或CD19+CD20+IgG+。对于IgA+记忆B-细胞,选通 策略包括CD19+CD27+IgA+或CD19+CD20+IgA+。对于IgM+记忆B- 细胞,选通策略包括CD19+CD27+IgM+或CD19+CD20+IgM+
对于其它细胞类型。只要B-细胞、T-细胞或其它细胞群体可使 用细胞标志物通过表型鉴别,它就可以进行单一细胞分选。例如, T-细胞可以鉴别为CD3+或TCR+,原始T-细胞鉴别为CD3+CD45RA+, 记忆T-细胞鉴别为CD3+CD45RO+。效应T-细胞和辅助T-细胞可以 分别鉴别为CD3+CD8+和CD3+CD4+。细胞群体可以通过使用标志物 的组合进一步细分,如对于记忆辅助T细胞的CD3+CD4+CD45RO+
来自单一B细胞的配对轻链和重链免疫球蛋白基因的测序
接合体分子的反转录
单一细胞分选的板在冰上解冻并在使用前简短地离心。板在热 循环仪中55℃下孵育3分钟、42℃下孵育2分钟和4℃下不定时孵 育。板简短地再次离心并小心地打开以避免气溶胶形成。1μL的适 当接合体分子(各接合体分子一般具有样品识别区域(样品-ID))的 10μM溶液添加到各孔中,所有阴性对照孔(仅含有RNA防腐缓冲 液或非-B细胞)接受相同的接合体分子。添加2.35μL含有0.75μL H2O、1μL 10x M-MuLV RT缓冲液(NEB B0253S)、0.6μL 50mM MgCl2、0.25μL Ribolock(40U/μL)和0.125μL Superscript III(200 U/μL)(Invitrogen 18080-085)的混合物并通过吸液混合。板简短地离 心并使用热板振荡器在42℃下孵育120分钟至8小时和然后保持在 -20℃下。在反应后,来自所有孔的RT产物汇合在微离心管中。汇 合的RT产物然后使用具有~0.1%8-羟基氯喹(Sigma 77617)的苯酚-氯仿-异丙醇提取,然后在凝胶-锁相管(5PRIME 2302820)中用氯仿 萃取进行提取。RT产物然后浓缩并用Amicon Ultra-0.530kDa (Millipore UFC503096)或Ultra-0.5100kDa(Millipore UFC510096)通 过以14000g旋转5分钟,接着用TE(10mM Tris-HCl pH 7.6,具有1mM EDTA)以14000g旋转5分钟并最终用EB(Qiagen 19086)以14 000g旋转5分钟脱盐。RT产物通过在新离心管中反转Amicon Ultra 柱洗脱并以1000g离心2分钟。此时,将RT产物保持在-20℃或-80℃ 下。
降落PCR(Touchdown PCR)
对于454测序操作1和2,降落PCR方法如下使用。对于PCR 操作3和4中的一些样品,改变PCR方法,从而导致更多数目的配 对重链和轻链。这一改变在以下“非-降落PCR”小节中详细说明。
对于第一PCR和嵌套的第二PCR,Phusion Hot Start II DNA聚 合酶(NEB F-549L)用于提供的GC缓冲液中。对于IgG,引物和接合 体分子显示于表1中。样品-ID序列显示于表2中。板-ID序列显示 于表3中。也参见图3和9。反应条件包括1.8mM的最终MgCl2浓度、200μM dNTP、0.2μM的所有引物、0.2U的Phusion聚合物、 作为添加剂的变化量的DMSO和25μL最终体积中的2μL模板。对 于第一PCR,λ和κ轻链及γ重链在不同的孔中扩增,且DMSO分 别以8%、5%和10%的最终浓度使用。用于第一PCR中的正向引物 是FW长引物1和FW短引物1。因为FW长引物1添加板识别区域 (板-ID)到扩增子区域(扩增子)的5’端,含不同板-ID的FW长引物 1添加到不同的样品中。基因特异性反向引物用于扩增κ、λ和γ链, 其分别为κGSP1、λGSP1和γGSP1。用于第一PCR的循环条件包括 98℃下30”的初始变性步骤,接着2个循环的98℃下10”,72℃ 下25”;7个降落循环,98℃下10”,71.5℃至68.5℃下15”和72℃下20”,各后续退火步骤具有0.5℃的下降;30个循环的98℃下10”, 68℃下15”和72℃下20”,接着72℃下5’的最终延伸并保持在4℃ 下不定时。来自第一PCR的产物在TE中稀释100x且2μL用于嵌 套的第二PCR。对于第二PCR,5%DMSO在所有样品中用作添加 剂。正向引物是FW引物2而反向引物是RV引物2和GSP长引物 2。κGSP长引物2、λGSP长引物2和γ长引物2用于扩增其相应的 扩增子。因为GSP长引物2也添加板-ID到扩增子的3’端,具有板 特异性的板-ID的不同GSP长引物2添加到各汇合的板样品。用于 嵌套第二PCR的循环条件包括98℃下30”的初始变性步骤,30-40 个循环的98℃下10”,67℃下15”和72℃下20”,接着72℃下5’ 的最终延伸和保持在4℃下不定时。
非-降落PCR
对于非-降落PCR,除非另外说明,条件与降落PCR相同。第一 PCR循环参数是95℃下5′的初始变性,15-25个循环的98℃下30″, 62℃下30″,72℃下30″,72℃下5′的最终延伸和保持在4℃下不 定时。第一PCR是多重PCR,其中所有3个基因特异性反向引物, κ、λ和γ恒定区反向引物分别以0.2、0.2和0.24μM结合使用。使 用的所有其它引物与降落PCR中相同。基因特异性引物可以是用于 降落PCR中的那些,且也可以是指明为适合第一PCR的那些中的任 一种(表6)。DMSO以5%的最终浓度使用;0.1mg/ml的BSA(NEB B9001S)和ET-SSB(NEB M2401S)也可以以1∶100添加用于PCR反 应。在第一PCR过程中,4-6ul的cDNA模板用于总共80或90ul反 应体积中。各PCR1反应分成八或九个10ul的反应,各反应在不同 的孔中发生。第一PCR在PCR后再次汇合并在TE0.1中稀释100x, 且2ul用于第二PCR。第二PCR是对于各基因特异性引物的单独反 应(非多重的),且反应混合物除了以下外与降落第二PCR相同: 可以使用指定为用于第二PCR的任何基因特异性恒定区引物(表 6),引物始终以0.2μM或0.4μM使用,或者基因特异性引物以0.2μM 使用和其余以0.4μM使用。0.1mg/ml BSA添加到反应中且ET-SSB 也可以以1∶100使用。第二半嵌套PCR循环参数是95℃下5′的初始 变性,20-35循环的98℃下30″,67℃下30″,72℃下30″,72℃下 5′的最终延伸和保持在4℃下不定时。结合的第一和第二PCR的PCR 循环总数对于非-降落PCR通常在50-60循环之间。由于发生PCR 循环的不同汇合孔倾向于使用不同数目的循环以获得合理的DNA 产物量(通常1-12ng/ul之间),对于各第二PCR进行4种不同的 PCR循环,例如23、26、30和33个循环,5ul在2%琼脂糖凝胶上 分析并进行比较。基于PCR产物量的定性判断,仅来自第二PCR循 环数之一的PCR产物用于各汇合孔第二PCR以准备用于454测序操 作。
对于人中的其它免疫球蛋白重链、小鼠中的免疫球蛋白重链和 轻链及人和小鼠中的TCR链的PCR,PCR条件与上述非-降落PCR 节相同,除了第一PCR是非多重的,其中各cDNA单独地扩增。以 下表10和表11中的3′引物用于PCR1和2中。
准备用于454 XLR70测序操作
对于第一和第二454操作,用于454钛测序操作的测序引物(分 别为钛引物A和B)在第一和嵌套第二PCR期间添加到扩增子上。 5μL的各扩增子在具有质量DNA梯状序列的琼脂糖凝胶(Fermentas SM0383)上分析,获取图像,并分析条带强度和用AlphaFC Imager 软件(Cell Biosciences)定量。5ng的各κ、λ和γ扩增子单独地汇合, 在0.8%琼脂糖凝胶上分析,并用GelGreen(Biotium 41005)可视化。 切割适当大小(对于κ和λ为~600bp,和对于γ为~750bp)的条带 并按照制造商的指示以轻微的改进用MinElute Gel Extraction试剂盒 (Qiagen 28606)纯化。简单地说,琼脂糖凝胶在QG缓冲液中不加热 的条件下熔解,并进行另外的QG洗涤步骤。使PE洗涤缓冲液在离 心前静置5分钟。也进行另外的PE洗涤步骤。样品用25uL的EB 缓冲液洗脱。对于454第二操作样品也使用1∶0.65的DNA体积:珠 体积比例用SPRI珠清洁一次。DNA浓度用Picogreen DNA分析试剂 盒(Invitrogen P11496)测定,且样品汇合以使得γ:κ:λ的DNA浓度为 2∶1∶1。汇合的样品为>0.5ng/μL的浓度并运送到454DNA测序机构 进行454测序。
对于第三和后续的454测序操作,改变方案。扩增子仍然单独 地汇合以对来自各PCR反应的DNA量进行标准化,但首先按照制 造商的指示进行SPRI珠清洁以除去小DNA片段。扩增子在3%琼脂 糖凝胶上分析,并切割适当的条带和如前用MinElute GelExtraction 试剂盒纯化。此后,扩增子进行另2轮的SPRI珠清洁以除去甚至更 小的DNA片段,并用Picogreen定量,用Nanodrop检验质量以确保 OD260/280比率>1.8且1μl在凝胶上分析以确保没有小DNA片段。 λ和κ扩增子以1∶1的比率汇合,γ原样使用。DNA然后按照454的 说明稀释到1x 109拷贝,并发送到测序机构(Roche)用于以1cpb进 行emPCR和测序;γ重链在一个区域中和汇合的轻链在picotiter板 的另一区域中。
准备用于454 XL+测序操作
当前454 XL+测序操作不支持用于XLR70操作的Lib-A测序试 剂盒。XL+当前仅支持Lib-L试剂盒,其为单向测序。为使我们的方 案适应于进行XL+测序,按照用于XLR70操作的方案,但在凝胶清 洁步骤后,各扩增子(κ、λ和γ)进行两个独立的PCR(各5个循 环长)以添加到Lib-L A和B接合体上。PCR条件如下:使用Phusion 聚合酶,5x GC缓冲液和最终浓度5%的DMSO。引物以0.2uM使用。 0.1mg/ml BSA添加到反应中。PCR循环参数是95℃下5′的初始变性、 20-35个循环的98℃下30″,67℃下30″,72℃下30″,72℃下5′ 的最后延伸和保持在4℃下不定时。对于各扩增子进行两个PCR: 一个PCR中5LIB-LA和3LIB-LB,和另一个PCR中5LIB-LB和 3LIB-LA。添加接合体以使得各扩增子变成5’-LibA-扩增子-LibB-3’ 或5’-LibB-扩增子-LibA-3’。这些扩增子在5’端上具有LibA“A”或 “B”接合体(和在3’端上具有对应的“B”或“A”接合体),这允许双向 测序。然后具有新Lib A接合体的扩增子在按照用于XLR70操作的 方案进行3轮SPRI珠清洁以定量DNA和检验DNA质量,之后稀释 到1x 109拷贝并发送到454测序机构(Roche)用于1cpb下的emPCR 和测序。
准备用于PacBio测序操作
对于PacBio测序操作,降落PCR如上使用。DNA汇合和清洁 如以上“准备用于454XLR70操作”节中进行。为获得测序所需的足 够的DNA(500ng),最少1ug的DNA汇合用于凝胶和SPRI清洁。 不进行Picogreen定量和1x 109稀释,因为它不是PacBio测序所需要 的。如果从第二PCR未获得足够的DNA,重复第二PCR和汇合步 骤直到获得足够的DNA。最少500ng的清洁的DNA发送到PacBio 测序机构用于测序。
其它测序途径
本文中公开的方法不依赖于454或PacBio测序。λ和κ轻链为 ~600bp和γ重链为~700bp。因此,一般希望的是具有较长的测序阅 读片段的能力以使得正向和反向测序阅读片段足够重叠以能够重构 全部的轻链(LC)的约600bp序列(精确的序列长度取决于5’非翻译 区(UTR)的长度)和重链(HC)的约700bp序列。因此,可以利用可 产生至少约350-400bp的测序阅读片段并因而获得用于序列组装的 重叠的任何测序技术,且能够实现约600-700+bp阅读片段的测序技 术允许只使用正向(Fw)引物测序(从5’端测序)。
序列
用于上述操作的序列数据从相关机构接收并如下所述进行处 理。
序列命名法
序列表中对应于测序阅读片段、序列组装或序列的氨基酸翻译 的各序列具有标识符。各个这样的标识符具有由句点“.”分隔的9个 字段。字段从1-9编号并给出以下信息:
1.阅读片段ID。与用于确定阅读片段的测序技术相关的软件赋 予的阅读片段ID,或者如果序列不是原始阅读片段,则为“NA”。
2.板号。序列与之相关的板号。对应的生物样品信息参见表12 (板-样品对映表)。
3.样品ID。表示序列与之相关的孔的样品ID。样品ID号在1-89 (包括)之间。样品ID和孔名称之间的对应参见表2。
4.孔名称。包含序列与之相关的孔的孔名称。孔名称对应于通 常的96孔板名称,例如D07。孔名称和样品ID是指明板上的特定 孔的等同方式。
5.重叠群ID。重叠群ID区分来自给定的组装和链类型的与孔 相关的不同序列。
6.平台。平台字段表明序列所来源的测序技术。用于平台的可 能值是454、Sanger和PacBio。
7.链类型。链类型字段表明序列是否与一组重链抗体序列、轻 链抗体序列或含重链和轻链抗体序列的组相关。可能的值是“重”、 “轻”或“CMB”。
8.操作ID。特定平台上的一组阅读片段的标识符。
9.序列类型。序列的类型。可能的值对于原始测序技术阅读片 段是“原始”,对于组装的阅读片段(参见“序列的组装”章节)是“nb”、 “urt”、“multim50”、“zerom50”或“pb”,或者对于源自各种不同nt组 装共有序列的氨基酸序列为“nb-aa”、“urt-aa”、“multim50-aa”、 “zerom50-aa”或“sanger-aa”。
用于分析的序列的制备
从454测序产生的数据通过454GS FLX数据分析软件进行分 析,且返回通过过滤器的高质量序列。由于454GS FLX数据分析软 件使用的默认扩增子过滤器的严格性,过滤器严格性可能需要放松 以获得足够长的阅读片段。一种方式是按照454技术公告APP No.001-2010的建议。将扩增子过滤器的<vfScanAllFlows>从“TiOnly” 改变为“False”可能导致通过过滤器的具有良好质量的序列的大的增 加。另一选项是将<vfTrimBackScaleFactor>改变为较低的数。对于 454操作1,使用标准散弹处理,和对于操作2,<vfScanAllFlows> 改变为“False”,且对于操作3和4使用标准扩增子流水线处理。
由Pacific Biosciences测序产生的数据作为具有相关质量评分的 CircularConsensus Sequence阅读片段从Pacific Biosciences接收。
序列到孔的分配
来自样品的cDNA用454或Pacific Biosciences测序技术测序。 阅读片段是序列表中其序列类型为“原始”的那些。分析测序阅读片 段并分配到源板和孔或者放弃。
用于阅读片段的板和孔的分配通过使用常规表达比较观察的阅 读片段序列与可能的板识别区域、通用引物区域和样品识别区域序 列来进行。比较使用表13、14和15中所列的常规表达在三个阶段 中进行。
在阶段1(可能的板识别区域的分析)中,阅读片段针对表13 中“板识别区域常规表达”列中所列的所有常规表达进行检验,需要 匹配以序列的第一核苷酸开始。如果没有发现匹配,则放弃该阅读 片段,并继续用下一可得的阅读片段进行板/孔分配(如果有的话)。 如果发现匹配,则为该序列分配来自“板ID”列的相应ID作为其板 ID。记录与板常规表达匹配的阅读片段的核苷酸用于在匹配的后面 阶段中或在组装过程中使用。
在阶段2(通用引物区域的分析)中,阅读片段针对“通用引物 常规表达”“CACGACCGGTGCTCGATT+AG”进行检验,要求阅读片 段匹配以板常规表达匹配的最后阅读片段核苷酸后的第一核苷酸开 始。如果阅读片段不匹配通用引物常规表达,则放弃该阅读片段, 并继续用下一可得的阅读片段进行板/孔分配(如果有的话)。否则 记录与通用引物常规表达匹配的阅读片段的核苷酸用于在匹配的最 后阶段中和在组装过程中使用。
在阶段3(可能的样品识别区域的分析)中,阅读片段针对表 14中“样品识别区域常规表达”列中所列的所有常规表达进行检验, 要求匹配以与通用引物常规表达匹配的最后阅读片段核苷酸后的第 一核苷酸开始。如果没有发现匹配,则放弃该阅读片段,并继续用 下一可得的阅读片段进行板/孔分配(如果有的话)。如果发现匹配 且样品ID列仅包含单一标识符,则阅读片段的样品ID分配为在样 品ID列中发现的ID。如果样品ID列包含超过单一标识符,那些标 识符被认为是“候选样品ID”。然后阅读片段顺序地针对表15的“样 品识别区域常规表达”列中所列的所有常规表达进行检验,其中至少 一个表15的“样品ID”列中的相应样品ID与候选样品ID匹配。如果 阅读片段匹配该常规表达,且匹配以与通用引物常规表达匹配的最 后阅读片段核苷酸之后的第一核苷酸开始,则候选样品ID的最右标 识符分配为阅读片段的样品ID。否则,最右标识符从候选样品ID 的列表去除并以较小的候选样品ID列表重复该过程直到发现匹配, 或者如果在表15的常规表达列表中没有发现匹配的常规表达,则最 后的候选样品ID(即,候选样品ID原始列表中最左的)分配为用于 阅读片段的样品ID。
在板ID和样品ID分配过程中放弃的阅读片段不包括在序列表 中。
序列的组装
分配到与孔相关的样品ID的所有序列阅读片段进行组装以产生 共有序列。这些共有序列对应于在分选的细胞中表达的重链和轻链 mRNA序列。
序列采用Newbler 2.5组装(操作1和2),且对于其它序列采 用Newbler版本2.6和/或Mira版本3.4.0。
在列表中具有平台字段“454”、链类型字段“混合的”、操作ID“1” 或“2”和序列类型“nb”的序列是使用newbler的组装产生的重叠群。 为组装这些序列,来自454测序的sff输出文件(其含有序列和各核 苷酸的质量评分)使用Biopython包和根据如上所述的其化合物条码 (样品-ID+板-ID)细分的序列读入Python中并输出到单独的sff 文件中。然后这些文件通过sfffile(由GS FLX数据分析软件提供) 使用“-force”、“-cdna”和“-urt”选项再解析成具有Newbler(在GS FLX 数据分析软件套装中提供的序列组装器)理解的文件头的sff文件。 然后Newbler组装具有共有的化合物条码的正向阅读片段。因为反 向阅读片段仅具有3’板-ID,有可能序列组装可以发生在来自不同细 胞的序列的正向和反向阅读片段之间。为避开这一潜在问题,组装 的正向阅读片段和未组装的反向阅读片段两者的重链和轻链V(D)J 使用可以首先使用HighV-QUEST (http://imgt.cines.fr/HighV-QUEST/index.action)鉴别。然后序列可以 在使用一个组装的正向阅读片段和共有相同的V(D)J使用的反向阅 读片段用Newbler再次组装之前进一步按照其V(D)J使用分组。这 可以对于所有组装的正向阅读片段重复。也可以进行序列组装以对 于核苷酸错配为不耐受的,从而防止共有相同的V(D)J使用的来自 不同细胞的正向阅读片段和反向阅读片段的组装。以这种方式,来 自不同细胞的高度相似序列之间反向阅读片段的不当序列组装可以 大部分避免。
在列表中具有平台字段“454”、链类型字段“重”或“轻”、操作 ID“3”或“4”和序列类型“nb”的序列是从454阅读片段的组装产生的 重叠群,使用这一命令行:runAssembly-cdna-o执行newbler输出 seqs.fastaq(其中seqs.fastq含FastQ格式的单一孔的修剪阅读片段)。
对于Newbler不产生恰好一个重链重叠群或恰好一个轻链重叠 群的操作ID 3或操作ID 4的任何孔通过用mira组装进行再分析。 在列表中具有平台字段“454”、链类型字段“重”或“轻”、操作ID“3” 或“4”和序列类型“multim50”或“zerom50”的序列是由这些组装产生 的重叠群,使用这一命令行:mira--project=seqs --job=denovo,est,accurate,454454_SETTINGS-ED:ace=yes -AL:egp=no-CL:pvlc=yes--fastq-notraceinfo执行mira。
名称为seqs_in.454.fastq的文件含有FastQ格式的单一孔的修剪 阅读片段。
对于其中Newbler和mira使用上述组装命令都未产生重叠群的 操作ID 3或操作ID 4的孔,执行不同的Newbler命令。在列表中具 有平台字段“454”、链类型字段“重”或“轻”、操作ID“3”或“4”和序列 类型“urt”的序列是由这些组装产生的重叠群,其中Newbler用这一 命令行:runAssembly-cdna-ud-urt-o执行输出seqs.fastaq,其中 seqs.fastq含FastQ格式的单一孔的修剪阅读片段。
在列表中具有平台字段“PacBio”、链类型“重”和序列类型“pb”的 序列是由来自PacBio平台的阅读片段的组装产生的重叠群,用这一 命令行:mira--project=seqs--job=denovo,est,accurate,454 454_SETTINGS-ED:ace=yes-AL:egp=no-CL:pvlc=yes--fastq -notraceinfo执行mira。
名称为seqs_in.454.fastq的文件含FastQ格式的单一孔的修剪阅 读片段。
氨基酸序列
在列表中具有平台字段“454”和序列类型“nb-aa”、“urt-aa”、 “multim50-aa”或“zerom50-aa”的序列是通过翻译如“序列的组装”中 描述的454阅读片段的组装的核苷酸序列确定的氨基酸序列。
在列表中具有平台字段“PacBio”和序列类型“pb-aa”的序列是通 过翻译如“序列的组装”中描述的Pacifc Biosciences阅读片段的组装 的核苷酸序列确定的氨基酸序列。
在列表中具有序列类型“sanger-aa”的序列是通过直接翻译通过 Sanger测序确定的阅读片段而确定的氨基酸序列。
其它测序数据分析选项
以上描述的数据分析的工程流程可用于准确地确定各细胞的重 链和轻链序列。但是,这一信息对于我们的“选择筛选”方式(参见“表 达的人抗体的筛选”)不是绝对必须的。为了使选择筛选起作用,我 们首先将配对的抗体序列基于其重链V(D)J使用和轻链VJ使用聚类 成克隆家族。因此,我们不需要免疫球蛋白重链和轻链的全序列, 且可以使用充分的序列信息以确定V(D)J使用。因此,我们可以忍 受测序错误且可以通过454或任何其它测序技术产生的低质量阅读 片段。正向阅读片段的序列组装一般不是问题,因为所有序列可以 在被组装之前首先按照其化合物条码分组。因为各化合物条码来自 一个样品/细胞,因此对于具有相同化合物条码的各免疫球蛋白链仅 具有一个“正确”的序列。不同链中的测序错误然后可以平均,因为 不太可能所有测序错误在相同的碱基处发生,意味着获取共有碱基 序列将给出最准确的序列。在模糊的情况中,一般改为选择具有高 Phred质量评分的碱基。因为454从3’端修剪序列阅读片段直到仅保 留较高质量的阅读片段,这可以导致非常短的阅读片段。利用我们 的方法,我们可以忍受低质量阅读片段并因此使用由454产生的长 得多的阅读片段(400-500bp)。使用这些较长的阅读片段,我们可以 确定V(D)J使用而不需要正向阅读片段与反向阅读片段的组装,从 而在一些方面使得3’板-ID为非必要的。此外,最后一代454测序可 以测序直到746bp的平均值和800bp的模式。因此,从仅正向阅读 片段测序可能足以覆盖整个重链和轻链免疫球蛋白扩增子,也在一 些方面使得3’板-ID为非必要的,因为不再需要将正向阅读片段与反 向阅读片段组装。
抗体的选择和克隆
组装后,分析重链和轻链序列以选择用于表征的抗体。抗体基 于预测的V(D)J种系使用和源自抗体序列的进化树的检查来选择。 选择的抗体进行克隆、表达和以不同分析方法表征。
V(D)J分配
来自操作1和2的重链和轻链序列用V-QUEST(Brochet,X.等, Nucl.AcidsRes.36,W503-508(2008))软件(将抗体链序列与种系序 列的已知等位基因的数据库比较,并预测用于抗体中的种系等位基 因、种系序列如何重组及抗体中的相对于种系的突变的软件)进行 分析。表18显示对于选择用于进一步表征的抗体的V-QUEST V(D)J 分配的结果,对于来自操作1和操作2的所有其它序列组装也获得 相同的数据。来自操作3和操作4组装的一些序列也用SoDA(Volpe, Cowell和Kepler,Bioinformatics(2006)22(4):438-444)(类似于 V-QUEST的软件)进行分析。
如果患者的基因组已经被测序,则基因组序列数据可以用作用 于VDJ分配分析的种系序列,从而进一步提高可靠地鉴别患者的抗 体序列中的体细胞超变的能力。
进化树和克隆家族
对应于来自操作1和2的重链的成熟肽的核苷酸序列分成对应 于其所来源的患者的集合。从这些单个集合,软件clustalx2(Larkin MA,Blackshields G,Brown NP,ChennaR,McGettigan PA,McWilliam H,Valentin F,Wallace IM,Wilm A,Lopez R,Thompson JD,Gibson TJ, Higgins DG.(2007)Bioinformatics,23,2947-2948)用于使用所有参数 的默认设置产生分配和树。
来自患者的序列的进化树也可以从来自单个克隆家族的序列集 合构建。对于该家族的推定的祖先抗体重链和轻链序列可以推断, 并且如果它们原先不存在于序列集合中则添加到该集合。对于该集 合的进化树可以使用例如最大简约法、最大似然法或任何合适的算 法构建,且树可以以祖先抗体的序列为根。树可以在仅重链或仅轻 链的基础上构建或优选通过同时基于单个重链和轻链构建树,以使 得树代表重链和轻链的共进化。
抗体选择
对于各患者,与从操作1或操作2序列构建的树结合来考察 V-QUEST结果的表格(在TreeViewX: http://darwin.zoology.gla.a.c.uk/~rpage/treeviewx中观察)。基于V-QUEST数据选择代表性序列以覆盖存在的VDJ的不同家族,从而 检查树上的相应序列以选择表现为进化枝的代表的序列。通常一个 序列从各进化枝选择。一些选择的序列来自具有许多成员的家族, 但一些也选自具有少数成员或一个成员的家族。选择的序列描述于表18中。对于表18中的各抗体,“抗体”列与序列表中的序列相关 的名称的重叠群ID字段中“-”后的文字相同。
克隆的轻链和重链免疫球蛋白对的克隆和表达
载体
一种系统是从Invitrogen载体pcDNA3.3和pOptivec改进的新霉 素和二氢叶酸还原酶(DHFR)选择载体系统。可选的系统是Lonza GS 系统,其中可扩增的选择标记是谷氨酰胺合成酶(GS)(参见下文)。 编码免疫球蛋白κ轻链、λ轻链和γ重链的序列插入载体中。Kozak 共有序列和先导序列已存在于克隆中,且因此不需要工程化到载体 中。合成恒定区以包含5’-侧翼限制性位点和一个或多个其它内部限 制性位点。为利于改变的免疫球蛋白重链和轻链的克隆,插入片段 被工程化而具有提高克隆本身不包含限制性位点且因此不被内部切 割的可能性的多个限制性位点。插入片段在插入区域的5’端和在两 个工程化到恒定区中的不同限制性位点处具有两个不同的8-切点限 制性位点。5’限制性位点对于两种轻链是FseI和PacI,且对于γ重 链是AscI和AsiSI。工程化到恒定区本身中的限制性位点对于两种 轻链是NheI和XhoI,且对于γ重链是EcoRI和SacII。对于包含限 制性位点的恒定区插入片段的序列参见表16。来自第一PCR反应的 重链或轻链克隆然后利用克隆引物(其具有并入到克隆中的5’侧翼 限制性位点)进行第二轮PCR。适宜的限制性酶用于切割表达载体 和克隆,其现在具有互补性末端且使用T4 DNA连接酶连接到一起。 Invitrogen和Lonza GS载体系统都含可扩增选择标记。这一标记在 Invitrogen系统中是DHFR和在LonzaGS系统中是GS。在适宜的选 择剂(对于DHFR是甲氨喋呤和对于葡萄糖合成酶(GS)是L-蛋氨酸 亚砜亚胺)的选择压力下,与选择标记连接的基因与其一起扩增。 利用更多拷贝的免疫球蛋白基因,存在更多的抗体分泌。当需要纯 化大量的抗体用于后续的对于中和抗体的体内筛选时,这是有用的。
克隆和表达
假定在生发中心成熟过程中选择最高亲和力的浆母细胞,我们 预期最高亲和力克隆家族也具有最高的克隆数目。此外,各克隆家 族内的最高亲和力克隆也是该家族内最常见的克隆。在这些假设的 基础上,在一些方面,我们选择从来自各患者样品的前5个最大克 隆家族表达最高频率的克隆。克隆从第一PCR cDNA扩增,其中来 自相同板的所有样品(各含单一细胞)已汇合到一起。正向引物包 含样品-ID且因此仅扩增用该特定样品-ID条码标记的DNA。这是高 度特异性的,因为样品-ID包含彼此之间的核苷酸差异。一些样品-ID可具有相同的克隆正向引物且通过这些引物扩增的克隆然后也必须 通过细菌集落选择彼此区分。正向引物和反向引物两者包含允许克 隆整合(利用对准的编码框)到已包含κ、λ或γ恒定区的载体中的 侧翼限制性位点(第一和第二限制性位点区域)。克隆引物序列参 见表4和5。轻链克隆到修饰的pcDNA3.3中,且重链克隆到修饰的 pOptivec中,或两个链克隆到Lonza GS双重表达载体中。哺乳动物 细胞用编码免疫球蛋白重链和轻链基因的单独表达载体双重转染, 或者用含重链和轻链基因两者的双重表达载体单一转染。然后收集 含分泌的抗体的上清液并对所需的性能进行筛选。
在一些情况中,Ig基因的可变区可通过DNA合成进行克隆,并 使用限制性酶和标准分子生物学将合成的DNA并入到含适宜恒定 区的载体中。在合成过程中,不需要遵循精确的核苷酸序列,只要 氨基酸序列不改变,除非诱变是需要的。这允许可导致更高表达水平的密码子优化。这也允许添加用于克隆目的的限制性位点。非翻 译序列如5’UTR和条码序列不需要合成,且前导序列也可以交换为 已知用于更高表达水平的其它信号肽序列。这些导致可以与高通量 阅读片段非常不同但在表达时给出相同氨基酸序列的Ig核苷酸序列。
在一些情况中,在反转录过程中添加的样品-ID条码接合体也早 已整合限制性酶位点。这产生PCR扩增子池中具有样品-ID条码3’ 侧的限制性位点的接合体。在用克隆引物克隆过程中,所需的扩增 子使用与样品-ID条码序列互补的5’引物和链特异性3’引物(用于κ、 λ和γ链)从板特异性扩增子池扩增。3’引物将添加3’限制性位点。 5’引物不需要添加限制性位点,因为5’引物早已包含孔-ID条码3’ 侧的限制性位点。在这一扩增后,限制性酶用于切割扩增子用于连 接到含恒定区插入片段的载体中。在限制性酶消化过程中,添加到 Ig基因序列的5’端的序列如条码和通用序列被切割,因为它们在5’ 限制性位点的5’侧。
用于克隆和表达的可选方法
在另一个方面,Ig基因的可变区可以通过DNA合成进行克隆, 并使用限制性酶和标准分子生物学将合成的DNA并入到含合适恒 定区的载体中。在合成过程中,不需要遵循精确的核苷酸序列,只 要氨基酸序列不改变,除非诱变是需要的。这允许可导致更高表达水平的密码子优化。这也允许添加用于克隆目的的限制性位点。非 翻译序列如5’UTR和条码序列不需要合成,前导序列也可以交换为 已知用于更高表达水平的其它信号肽序列。这些产生可以与高通量 阅读片段非常不同但在表达时给出相同氨基酸序列的Ig核苷酸序列。
在另一个方面,在反转录过程中添加的孔-ID条码接合体也早已 整合限制性酶位点。这产生PCR扩增子池中具有孔-ID条码3’侧的 限制性位点的接合体。在用克隆引物克隆过程中,所需的扩增子使 用与孔-ID条码序列互补的5’引物和链特异性3’引物(用于κ、λ和γ链)从板特异性的扩增子池扩增。3’引物将添加3’限制性位点。不 需要5’引物以添加限制性位点,因为5’引物早已包含孔-ID条码3’ 侧的限制性位点。在这一扩增后,限制性酶用于切割扩增子以用于 连接到含恒定区插入片段的载体中。在限制性酶消化过程中,添加到Ig基因序列的5’端的序列如条码和通用序列被去除,因为它们在 5’限制性位点的5’侧。
重链和轻链克隆到Lonza载体中
克隆免疫球蛋白恒定区
Lonza载体通过斯坦福大学与Lonza的学术许可协议获得。κ和 λ轻链插入载体pEE12.4中且γ重链插入载体pEE6.4中。重链和轻 链序列以两个步骤克隆:第一,恒定区被克隆到其中,之后是免疫 球蛋白链的5’端(前导和V(D)J序列)。恒定区插入片段通过Intergrated DNA Technologies(IDT)进行基因合成,并包含用于基因 优化和限制性位点并入的合适静默突变。插入片段从IDT在其专有 的pIDTSmart载体中获得。插入序列在表17中。IgG1用作γ重链恒 定区。使用的等位基因对于κ、λ和γ链分别是Km3、Mcg-Ke-Oz-和G1m3。为将恒定区整合到Lonza载体中,Lonza载体和pIDTSmart- 恒定区插入片段全都单独地转化到感受态的dam-dcm-大肠杆菌中且 质粒使用Qiagen miniprep试剂盒按照制造商的说明纯化。然后质粒 使用HindIII和BclI在37℃下消化1小时并在1.2%琼脂糖凝胶上以150V运行1小时。消化的Lonza载体和恒定区插入片段进行凝胶纯 化和使用T4 DNA连接酶在RT下以3∶1的插入片段:载体比率连接(具有Km3或Mcg-Ke-Oz-轻链的pEE12.4和具有G1m3γ1重链的 pEE6.4)10分钟。T4 DNA连接酶然后在70℃下灭活8分钟且5ul 的连接混合物使用标准的分子生物学技术转化到热休克的感受态 TOP10细胞中。挑取集落并通过Sanger测序验证插入。
克隆免疫球蛋白可变区
接着,含λ或κ轻链的pEE12.4在37℃下使用AscI和XmaI消 化5小时并凝胶纯化。含γ1重链的pEE6.4在37℃下使用AscI和 AgeI消化5小时并凝胶纯化。选择的扩增子使用孔-ID特异性正向 引物和恒定区特异性反向引物(表4和5)从第一PCR的特定板-ID 100x稀释液选择性扩增。正向引物具有引物的5’端上的限制性位点 AscI,且反向引物分别对于轻链和重链引物恒定区引物含XmaI或 AgeI限制性位点。PCR循环使用98℃下30秒的初始变性及35-45 个循环的98℃下10秒、68℃下15秒和72℃下20秒进行。最终延 伸是72℃下5分钟和保持在4℃下不定时。PCR产物使用来自 Millipore的PCRu96超滤板按照制造商的说明纯化。这之后,PCR产 物对于轻链使用AscI和XmaI及对于γ1重链使用AscI和AgeI在37℃ 下双重消化3小时。消化的产物然后在2.5%低熔琼脂糖上用gelgeen (Biotium)分析并在蓝光下可视化。切除含适宜尺寸的条带的凝胶条。 在凝胶中,连接通过在65℃下熔化凝胶条并添加适宜的消化和 Antarctic磷酸酶(NEB)处理的含恒定区插入片段的Lonza载体,并且 与T4 DNA连接酶在RT下孵育1-3小时而进行。热休克的感受态细 菌然后转化和接种在氨苄青霉素琼脂上。挑取每构建体6个克隆并 生长在2xLB(2x浓缩的Luria-Bertani肉汤)中。Miniprep使用 Millipore的Multiscreen 96-孔过滤板按照制造商的说明(www.millipore.com/techpublications/tecg1/tn004)进行以获得质粒 DNA。菌落PCR使用95℃下5分钟的初始变性,以及40个循环的 95℃下1分钟、50℃下2分钟、72℃下1分钟及72℃下5分钟的 最终延伸和保持在4℃下不定时而进行。具有适宜插入片段的克隆 发送用于在Sequetech,Mountain View,CA,USA处进行Sanger测序。 克隆VDJ鉴别使用IMGTHIGHV-Quest进行且正确的克隆保持作为 细菌原种(用15%甘油储存在-80℃下)和质粒两者。
单克隆抗体在293T中的表达
配对的pEE12.4-轻链和pEE6.4-重链构建体的瞬时双重转染使用 Lipofectamine2000按照制造商的方案进行。转染在48-孔、24-孔、 6-孔、60mm和100mm盘中进行。简而言之,293T细胞在 DMEM+10%超低IgG FBS(Invitrogen)中培养以在下游蛋白A纯化步 骤防止牛IgG与分泌的人IgG竞争。293T细胞培养20代,然后解 冻和使用新的等份的液N2。对于48-孔板转染,各孔在前一天用8x104个细胞接种,并允许在下一天生长到~90%汇合。50ng的各重链和轻 链构建体在50ul最终体积的Optimem培养基中孵育,并且 Lipofectamine2000也用50ul的Optimem培养基单独地孵育。两次孵 育都是5-25分钟。Lipofectamine2000和构建体然后通过温和吸液进 行混合,并在添加到293T细胞之前孵育20分钟和温和地混合。第 二天更换培养基,并在两周时间内每隔一天(例如,星期一、星期 三和星期五)收集培养上清液。对于其它大小的转染,使用以下量 的构建体和Lipofectamine 2000:对于24-孔板转染,使用100ng的 各构建体及1.25ul的Lipofectamine2000。对于60mm盘,使用625ng 的各构建体及12.5ul的Lipofectamine 2000。对于100mm盘转染, 3ug的各构建体在37.5ul的Lipofectamine 2000中使用。
抗-人IgG ELISA
在一些情况中,对样品进行人IgG ELISA以定量培养上清液中 表达的IgG的量,且培养上清液在抗体量标准化后直接用于下游应 用。抗-人IgG ELISA定量试剂盒购自Bethyl Laboratories并按照制 造商的说明进行。简而言之,100ul的捕获抗体在4℃下涂布在Nunc Maxisorp板上过夜并用PBST(具有0.05%Tween20的PBS)洗涤 5x。孔用PBS中的1%BSA封闭1小时,然后用PBST洗涤5x。孔 然后在RT下与来自试剂盒的适当标准稀释液或稀释的培养上清液 孵育1小时,然后用PBST洗涤5x。100ul稀释的HRP检测抗体添 加到各孔中并在RT下孵育1小时,然后用PBST洗涤5x。添加50ul 的TMB底物溶液并用50ul的终止液停止反应。吸光度在SpectraMax M5分光光度计上450nm处读取,并用4-参数曲线生成标准曲线。 抗体在具有0.1%叠氮化钠作为防腐剂的PBS中保持在4℃下。
表达的单克隆抗体的蛋白A-IgG纯化
在其它情况中,抗体首先从培养上清液纯化并在使用前使用 BCA定量。简而言之,在两周时间内培养上清液一周3次收集到50ml 管中并以0.1%叠氮化钠作为添加剂储存在4℃下直到蛋白A-IgG纯 化。培养上清液离心并倾倒以除去任何细胞聚集物。1M pH 9.0Tris 添加到培养上清液中以确保pH在7.5-8.0之间,如通过pH试纸条测 定的。蛋白A+琼脂糖珠(Pierce)用PBS洗涤2x,然后400ul的50% 浆液添加到培养上清液中并在4℃下在旋转器上孵育过夜以确保珠 的均匀混合。珠通过以1000g旋转培养上清液5分钟回收并从管的底部吸出珠到5ml重力流柱中。珠用4x2ml的PBS洗涤,然后用 2x 1.5ml的IgG洗脱缓冲液(Pierce)(其为低pH洗脱缓冲液)洗脱到 Amicon-4100kDa浓缩柱中。洗脱的抗体立即用400ul的1M Tris pH8.0中和。抗体然后通过在Amicon-4 100kDa浓缩器中以1000g旋 转10分钟进行浓缩,接着是PBS的2mL洗涤和具有1%叠氮化钠的 PBS的2mL洗涤。抗体浓度通过BCA分析测定,并调节到0.5mg/ml。 蛋白A+琼脂糖通过用1x2ml的PBS、3x2ml的IgG洗脱缓冲液洗涤 和具有0.1%叠氮化钠的3ml PBS洗涤进行再生,并保持在4℃下。 柱可以再生最多5次。
表达的人抗体的筛选
抗体-抗原结合的筛选
选择的抗体(参见以上“克隆和表达”章节)首先筛选其结合 目标抗原的能力,然后表达整个克隆家族的抗体并筛选其阻断或中 和抗原的能力(参见以下“功能筛选”)。含目标抗体的上清液中的 IgG浓度首先通过IgG ELISA测定,以使得相同量的IgG可用于抗体-抗原结合筛选中的各样品。在其它情况中,IgG使用蛋白A琼脂 糖珠从上清液纯化,并使用牛免疫球蛋白作为标准利用BCA分析定 量。纯化的IgG然后在用于筛选抗体之前标准化到相同的浓度。为 筛选结合抗原的抗体,我们进行间接ELISA。96-孔板用目标抗原涂 覆过夜,且然后洗掉过量抗原。含目标抗体的上清液然后添加到孔 中并孵育4小时,之后孔进行洗涤。作为阳性对照,对抗原特异性 的已知量的商业可得抗体(来自非人物种)添加到含抗原的单独的 孔中。作为阴性对照,对于不相关抗原特异性的商业可得抗体添加 到含目标抗原的单独的孔中。HRP-偶联的第二抗体然后添加到孔中, 孵育30分钟并洗掉过量的抗体。四甲联苯胺(TMB)然后添加到板上, 且允许反应继续进行直到在阳性孔中观察到颜色。然后反应用酸终 止,并测量吸光度。如果特定的孔上清液产生的吸光度读数显著高 于在阴性对照中观察到的,则它们视为包含结合目标抗原的抗体。
Fluzone ELISA
志愿者施用来自Fluzone的2010/2011季流感疫苗,其由3株灭 活病毒(A/California/7/2009、A/Perth/16/2009、B/Brisbane/60/2008 株)组成。进行FluzoneELISA以确定是否源自疫苗接种的志愿者的 单克隆抗体结合流感疫苗本身以作为具有结合活性的表达抗体的初 始筛选。Fluzone疫苗在pH9碳酸盐缓冲液中稀释100x并在RT下 涂布在Nunc Maxisorp板上1小时或在4℃下过夜。板然后用PBST (PBSw/0.05%Tween20)洗涤5x并在RT下用PBS w/1%BSA封闭1 小时。100ul的100ng/ml表达的流感抗体然后在RT下添加到孔中1 小时,之后用PBST洗涤5x和在RT下添加稀释的HRP检测抗体(来 自Bethyl Labs人IgG ELISA定量试剂盒)1小时。板用PBST洗涤 5x并添加50ul的TMB底物。使得显色最多30min,然后用50ul的 终止溶液终止反应。板在SpectroMax M5分光光度计上读取450nm 处吸光度。这一分析中使用的抗体描述于表19中。抗体的序列可以 在主表表18中提到。
流感抗体亲和力的表面等离子体共振测定
单克隆抗体(mAb)与HA分子的结合在25℃下使用ProteOn表 面等离子体共振生物传感器(BioRad Labs)分析。源自流感疫苗接种 的供体的浆母细胞的表达流感单克隆抗体(25nM在pH 4.5乙酸盐缓 冲液中)使用EDAC-NHS化学利用氨基偶联在测试流动池中以800共振单位(RU)的目标密度偶联到GLC传感器芯片上。未反应的活性 酯基团用乙醇胺淬灭。纯化的重组血细胞凝集素H3 (HA(ΔTM)(H3N2/Perth/16/2009)和H1 (HA(ΔTM)(A/California/07/2009)(H1N1))购自Immune Technology Corp.(New York,NY)并稀释到100、50、25、12.5、6.25nM,其与 空白缓冲液对照一起以30μL/min的流速注射,接触时间为120秒和 解离时间为2000秒。结合动力学和数据分析采用BioRad ProteON管 理软件进行。亲和力测量使用二价分析物算法计算,因为HA由几 个重复单元组成。拟合的曲线的准确性通过检验各拟合的优度的χ2值低于峰结合值(Rmax)的10%而证实。用于这一分析中的抗体描述 于表20中。抗体的序列可以在主表表18中提到。
在RA抗原微阵列上的RA抗体反应性
为打印抗原微阵列,抗原在磷酸盐缓冲盐水中稀释到0.2mg/mL 并使用ArrayItNanoPrint Protein LM210系统连接到ArrayIt SuperEpoxy载玻片上。载玻片用疏水性标记免疫组化笔(hydrophobic marker pap pen)标记并在具有3%胎牛血清和0.05%Tween20的PBS 中在4℃下封闭过夜,以30rpm轻轻振摇。阵列用400uL的40ug/mL 单克隆抗体在4℃下探测1小时,以30rpm轻轻振摇。然后阵列进 行洗涤并在以1∶2500稀释的Cy3偶联抗人IgG/IgM第二抗体中在 4℃下孵育45分钟,以30rpm轻轻振摇。在另一洗涤后,载玻片使 用GenePix 4300A微阵列扫描仪扫描。GenePix 7软件用于发现各特 征的中值荧光强度和背景。
为分析数据,从各特征减去背景荧光强度并表示为各阵列上四 个抗原特征的中值。中值强度以10的截止值对数转换。这些值使用 Cluster软件基于彼此的相似性以排列抗原而进行分级聚类。关系使 用Java TreeView软件展示为热图。用于这一分析中的抗体描述于表21中。抗体的序列可以在主表表18中提到。
抗-组蛋白2A ELISA
直接ELISA用于针对组蛋白2A的抗体的检测。微滴定板(Nunc Maxisorp)以20μg/ml在碳酸盐缓冲液中用100μl的重组H2A涂覆, 并在4℃下孵育过夜。在含1%牛血清白蛋白(BSA)的PBS中封闭后, RA患者来源的抗体在稀释缓冲液(含0.1%BSA和0.1%Tween-20 的PBS)中以15ug/ml至250ug/ml的滴度使用,以100μl/孔一式两 份添加到板上,并在室温下孵育2小时。样品然后在室温下与单克 隆体辣根过氧化物酶标记的山羊抗人抗体的1∶5,000稀释液孵育1小 时。反应通过应用3,3′,5,5′-四甲基联苯胺底物(TMB)(Sigma-Aldrich) 进行15分钟,并通过添加50μl的2N H2SO4终止。针对的抗体的相 对定量使用已知血清型RA血清作为阳性对照通过光密度测量法在 450nm处进行。用于这一分析中的抗体描述于表22中。抗体的序列 可以在主表表18中提到。
抗-CCP2 ELISA
抗-CCP2 ELISA按照制造商的说明(Eurodiagnostica,Malmo, Sweden)进行。简而言之,源自RA患者的抗体在稀释缓冲液(含0.1% BSA和0.1%Tween-20的PBS)中稀释至大约125ug/ml,以100μl/ 孔添加到预封闭的商业CCP2 ELISA板,并在室温下孵育2小时。 样品然后在室温下与单克隆辣根过氧化物酶标记的山羊抗人抗体的 1∶5,000稀释液孵育1小时。反应通过应用3,3′,5,5′-四甲基联苯胺底 物(TMB)(Sigma-Aldrich)进行15分钟,并通过添加50μl的2N H2SO4终止。针对的抗体的相对定量通过光密度测量法使用由零售商提供的标准品和已知阳性RA血清进行。用于这一分析中的抗体描述于 表22中。抗体的序列可以在主表表18中提到。
抗-类风湿因子ELISA
对于针对类风湿因子(RF)的抗体的检测,微滴定板(Nunc Maxisorp)用碳酸盐缓冲液中10ug/ml的兔IgG涂覆,并在4℃下孵 育过夜。在含0.1%胎牛血清(BSA)的PBS中封闭后,RA患者来源的 抗体为5ug/ml稀释缓冲液(含0.1%BSA和0.1%Tween-20的PBS), 以100μl/孔一式两份添加到板上,并在室温下孵育2小时。样品然 后在室温下与单克隆辣根过氧化物酶标记的山羊抗人抗体的1∶5,000 稀释液孵育1小时。反应通过应用3,3′,5,5′-四甲基联苯胺底物(TMB) (Sigma-Aldrich)进行15分钟,并通过添加50μl的2N H2SO4终止。 针对的抗体的相对定量通过光密度测量法使用两个已知的RF+对照 血清作为阳性对照在450nm处进行。用于这一分析中的抗体描述于 表23中。抗体的序列可以在主表表18中提到。
来自肺腺癌患者的抗体在肺癌组织阵列上的免疫组织化学
两种不同类型的组织微阵列载玻片购自US Biomax。它们是VLC 12和BS0481。多种肺癌组织核包括在载玻片上,包括肺腺癌,且也 包括正常肺组织对照。载玻片在柠檬酸盐pH6.0抗原修复缓冲液中 95-99℃下加热40分钟,之后使其冷却到RT。载玻片用0.02%Triton-X和0.6%H2O2预处理20分钟。然后载玻片用10%正常山羊 血清在TBST(具有0.05%Tween20的TBS)中封闭2小时,之后进 一步在100ug/ml的F(ab)山羊-抗人IgG(JacksonImmunoresearch)中 4℃下封闭过夜。然后载玻片按照制造商的说明进行抗生物素蛋白/生物素封闭(Vector Laboratories)。然后载玻片在5或10ug/ml的表达 肺抗体中在室温下孵育1小时,用TBST洗涤3x5分钟,且然后与 生物素化的山羊-抗人第二抗体在RT下孵育20分钟。然后载玻片用 TBST洗涤3x5分钟并与制备的Vectastain ABC试剂在RT下孵育30 分钟。然后载玻片用TBST洗涤3x5分钟并用Vector Red(Vector Laboratories)染色和用光学显微镜追踪显色。在适当的染色时间后, 反应通过用蒸馏水洗涤终止并用苏木精复染。载玻片被水性加载并 用BX-51显微镜拍照。用于这一分析中的抗体描述于表24中。抗体 的序列可以在主表表18中提到。
由肺腺癌患者表达的抗体与肺癌细胞系结合的流式细胞术测定
使用的肺癌细胞系是A549、H226、H441、H23、H1975、H1437、 H2126、H1650和H2009。HEK 293T细胞也用作阴性对照。细胞通 过在不含Ca2+和Mg2+含2mM EDTA的PBS中37℃下孵育1小时脱 离。这是为防止用胰蛋白酶消化或任何其它蛋白水解消化以脱离细 胞可能造成的细胞表面抗原损伤。细胞用FACS缓冲液(具有2%FCS 的HBSS)洗涤一次,之后悬浮在50ul的FACS缓冲液中并与10ug/ml、 3ug/ml、1ug/ml、0.2ug/ml的表达的肺抗体孵育以滴定剂量。最佳浓 度发现为0.2-1ug/ml的范围。因此,随后使用1ug/ml、0.5ug/ml、 0.25ug/ml的肺抗体。肺抗体在4℃下孵育30分钟,之后在96-孔板 中用2x 200ul的FACS缓冲液洗涤。然后添加抗-人IgG-PE并在黑 暗中4℃下孵育15分钟。然后样品用FACS缓冲液洗涤2x200ul并 重悬在200ul的FACS缓冲液中和在BD LSR II或LSR Fortessa上进 行分析。Sytox蓝用作活/死染色。用于这一分析中的抗体描述于表 24中。抗体的序列可以在主表表18中提到。
葡萄球菌流式细胞术
固定的金黄色葡萄球菌颗粒(Wood菌株)从Invitrogen获得。 Wood菌株是由一些细菌表达最小蛋白A的菌株。颗粒以10x106细 胞/50ul悬浮在50ul的FACS缓冲液中,并用源自葡萄球菌个体的 10ug/ml、5ug/ml或1ug/ml滴度的表达抗体在4℃下孵育1小时。固 定的葡萄球菌颗粒然后用FACS缓冲液洗涤两次,之后在黑暗中4℃ 下与抗-人IgG-FITC抗体孵育15min。颗粒然后用1ml的FACS缓冲 液洗涤并重悬在200ul的FACS缓冲液用于在BD LSRII或LSR Fortessa上的分析。用于这一分析中的抗体描述于表25中。抗体的 序列可以在主表表18中提到。
功能筛选
对于受体-配体相互作用的阻断抗体
为筛选抗体阻断配体-受体相互作用(例如,细胞因子-受体相互 作用)的能力,我们用编码适当受体的载体转染293T细胞。这些293T 细胞也用NF-κB-依赖性萤光素酶受体稳定地转染-从而在NF-κB激 活时这些稳定转染的293T细胞表达萤光素酶。我们然后在候选抗体 存在或不存在的情况下用适宜的抗体培养转染的293T细胞。293T 细胞最后通过测量萤光素酶依赖性光发射对萤光素酶表达进行分 析。配体与其受体之间的相互作用,例如IL-17A与IL-17R之间的 相互作用,激活NF-KB。阻断抗体阻止配体-受体结合的NF-κB信号传导并因此消除萤光素酶的表达,在其中配体-受体相互作用不激活 NF-κB的情况中,其它转录反应元件用于驱动萤光素酶基因的启动 子,例如AP-1反应元件等。
筛选抗体抑制细胞因子功能或抑制功能分析的能力
功能分析也可以用于筛选患者血清中或克隆和表达的抗体中的 抗-细胞因子抗体。在这一途径中,表达的人抗体测试其抑制细胞因 子或其它的细胞反应的免疫介质诱导。
靶向细菌、病毒感染的细胞、寄生虫或癌症细胞的抗体
为筛选杀灭或中和细菌、病毒感染的细胞、寄生虫或癌症细胞 的抗体,我们在抗体存在或不存在的情况下与非热灭活血清(其包 含补体因子)一起培养适宜的细胞类型。如果抗体是中和抗体,其 调理(opsonize)细菌、其它微生物或癌症细胞并激活形成膜攻击复合 体(MAC)(其诱导细胞死亡)的补体成分。为测试中和作用,我们 进行荧光活/死分析(Invitrogen),其中活细胞和死细胞用不同的荧光 团染色。细胞可以通过使用流式细胞术分析活细胞和死细胞的百分 比。导致最高死细胞百分比的抗体将是良好的候选中和抗体,其进 一步在体内筛选中进行分析。
中和病毒的抗体
为筛选中和病毒的抗体,我们进行标准的空斑减少分析或其它 体外细胞感染分析。中和抗体预期减少细胞的病毒感染。候选抗体 然后在体内模型中测试。
流感病毒微中和分析
显示出与Fluzone ELISA的结合活性的一些表达的流感病毒抗 体发送到外部CRO,Virapur,LLC用于微中和分析。简而言之,各 抗体的两倍稀释(从100ug/ml开始)在96孔板的孔中一式四份地与 等体积的约100TCID50感染单位的滴定原病毒悬液混合。病毒/抗体 溶液孵育2小时并随后混合物转移到含80%汇合的MDCK细胞的96 孔板。细胞、抗体和病毒在37℃下孵育另外的2小时,这之后除去 病毒,冲洗单层并将病毒生长培养基添加到各孔。孔在72小时后用 显微镜观察流感病毒感染的存在。用于这一分析中的抗体描述于表26中。抗体的序列可以在主表表18中提到。
葡萄球菌抑制分析
使用处于对数期生长的金黄色葡萄球菌。它们添加到96-孔聚丙 烯板中,且来自葡萄球菌患者的抗葡萄球菌抗体以10ug/ml添加。幼 兔补体(Cedarlane)以制造商推荐的量添加并充分混合。板在以1∶10、 1∶100和1∶1000稀释之前在37℃下孵育45分钟,并接种在5%TSA 血液琼脂板上和生长过夜。计数细菌CFU并在第二天制表 (tabulated)。用于这一分析中的抗体描述于表27中。抗体的序列可 以在主表表18中提到。
葡萄球菌抗原与源自葡萄球菌感染患者的抗体的免疫沉淀
葡萄球菌蛋白质裂解液通过使用具有100ng/ml的溶葡萄菌素的 B-PerBacterial Protein Extraction Reagent(Pierce)在RT下与1x Halt 蛋白质抑制剂一起裂解金黄色葡萄球菌30分钟而制备,并通过在微 量离心机中以15000rpm离心与不溶性部分分离。裂解液通过在RT 下与蛋白G Dynabeads孵育1小时预清洁。5ug的源自葡萄球菌患者 的抗体通过在RT下孵育1小时结合到蛋白G Dynabeads上。蛋白 G-结合的抗体然后在4℃下与预清洁的葡萄球菌裂解液孵育过夜。 珠然后用PBST(含0.1%Tween20的PBS)洗涤3x并在95℃下用 5x还原性泳道样品缓冲液(Thermo Scientific)加热5分钟,之后在 4-12%Criterion Bis-Tris凝胶上运行SDS-PAGE。蛋白质用 RAPIDStain Reagent(Calbiochem)可视化。用于这一分析中的抗体描 述于表28中。抗体的序列可以在主表表18中提到。
肽的质谱鉴别
染色的目标蛋白质条带从凝胶切除,浸入含10mM DTT和100 mM碘乙酰胺的10mM碳酸氢铵中,用100%乙腈处理,且然后在37℃下在含10%乙腈的10 mM乙酸铵中用0.1 mg胰蛋白酶 (Sigma-Aldrich)消化过夜。胰蛋白酶消化的蛋白质如先前描述的 (Lopez-AvilaV,SharpeO,Robinson WH:Determinationof ceruloplasminin human serum bySEC-ICPMS.Anal Bioanal Chem 2006,386:180-7.)通过使用Agilent 1100 LC系统和Agilent XCT Ultra Ion Trap(Agilent Technologies,Santa Clara,CA)用LCMS鉴别。LCMS 数据通过使用SpectrumMill软件(Agilent)针对SwissProt或NCBInr 数据库进行扫描以检测用于鉴别蛋白质的肽。用于该分析中的抗体 描述于表29中。
实施例1:来自单个B细胞的配对重链和轻链序列的高通量测序
我们开发了添加化合物条码(样品-ID+板-ID)到序列上以明 确地鉴别哪些序列来源于板中的相同孔的方法。我们使用这一途径 以测序来自单个B细胞的配对重链和轻链免疫球蛋白基因。单个B 细胞可以通过流式细胞术从血液、整批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B细胞或其它B细胞群体分选 (图1)。
首先,B细胞经单细胞分选到96-孔PCR板中,一列孔保持为空 作为阴性对照。含不同样品-ID条码的寡核苷酸在反转录(RT)过程中 添加到不同的孔中。在反转录mRNA后,MMLV H-反转录酶转换模 板并转录寡核苷酸,从而将其和样品-ID条码并入第一链cDNA的3’ 端中(图2a)。来自一个板的所有cDNA(用样品-ID条码标记的)然 后汇合并进行两轮PCR。在PCR过程中,454测序引物(第一和第 二测序区域)和板-ID条码通过使用具有5’-侧翼条码序列的PCR引 物添加到扩增子的5’和3’端上。来自不同板的扩增子(扩增子区域)现在具有n个不同板-ID,且包含板-ID和样品-ID的化合物条码明确 地鉴别序列为来自特定的细胞,从而允许测序的重链和轻链基因的 配对(图2b-c)。
图3描述了使用的一般方法和相关的序列。引物和接合体分子 显示于表1中。样品-ID序列显示于表2中。板-ID序列显示于表3 中。克隆引物显示于表4中,其中克隆正向引物的3’序列显示于表5 中。
我们获得预期大小的PCR产物:对于κ和λ轻链~600bp和对于 γ重链~700bp(图4a)。接着,我们将材料发送用于Sanger测序。我 们获得通过NCBI BLAST鉴定为κ、λ和γ链的序列(数据未显示)。 DNA色谱的进一步研究显示在样品-ID条码处开始的几个峰的混合,表明我们在RT过程中成功地将样品-ID条码添加到来自不同孔的细 胞的cDNA并成功地在两轮后续PCR中扩增它们(图4b)。来自3’端 的Sanger测序链也显示在VJ接合区处开始的几个峰的混合(由于 来自不同细胞的基因的扩增),其由于不同V和J基因的插入和删 除和随机重组而在VJ接合区后不同。此外,当我们用对于孔A1样 品-ID特异性的克隆引物进行PCR时,我们获得单一峰而不是几个 峰的混合,表明我们事实上可以扩增来自池内的特定细胞的序列(图 4c-d)。
实施例2:用于浆母细胞的单一细胞分选的选通方案
对于该实验,浆母细胞定义为CD19+CD20-CD27+CD38++。图22 显示用于单一浆母细胞流式细胞分选到96-孔板中的选通方案。
制备单一PBMC并如上所述染色。细胞首先基于其FSC和SSC 特性选通(数据未显示)。活的CD19+B细胞然后选通(左图), 并进一步缩窄到CD20-B细胞(从左数第二图)和优化到 CD27+CD38++细胞。由此,IgG+浆母细胞确定为IgA-和IgM-,因为 IgG+浆母细胞不表达细胞表面IgG。这一群体单一细胞分选到96-孔 板中。
实施例3:浆母细胞存在于经历免疫激发的受试者中
浆母细胞在健康供体中一般代表B细胞的约0.15%,但在经历 多种免疫激发包括感染(例如,金黄色葡萄球菌和艰难梭菌感染)、 与非进展相关的癌症(例如,转移性黑素瘤和肺的转移性腺癌,其 中患者在介入(在肺腺癌患者的情况中的化疗和在转移性黑素瘤患者的情况中的易普利单抗(ipilimumab))后变成与活性B细胞反应相 关的长期非进展者)和疫苗接种(例如,流感)的受试者中的范围 为约3.3%-16.4%。
图23显示浆母细胞存在于广泛的受试者中并可从其获得以用于 配对的抗体谱的高通量测序和活性体液反应抗体谱的表征。这证明 本文中公开的方法可用于获得重链和轻链(H&L)的进化树并使用这 一信息以克隆和/或表达抗体用于:例如,a)新抗原的发现;b)为疫 苗设计提供信息-例如,使用免疫系统以使我们知道哪些是已知的和 新抗原很可能可用于调理和吞噬作用和/或杀死/抑制目标病原体或 靶标,并任选地将其用于疫苗设计中;c)例如,从疫苗制备中和单克 隆抗体;d)制备结合单克隆抗体;e)制备针对微生物病原体的抗体; 和f)制备针对癌症的抗体。这些的实例更详细地在下面描述。
实施例4:CCP+RA中的疾病活动性与循环浆母细胞相关
已经证明我们的方法可以用于可鉴别对中免疫球蛋白基因的测 序,我们使用我们的方法研究CCP+RA患者中浆母细胞的抗体谱。 我们从同意的RA患者获得血液样品并通过流式细胞术对浆母细胞 染色(图5a)。循环浆母细胞表示为总PBMC的百分比。我们发现CCP+ RA患者具有显著高于CCP-RA患者的外周血浆母细胞百分比(图 5b)。此外,CCP+患者中的浆母细胞百分比与疾病活动性相关(r=0.35 和p=0.028),但在CCP-患者中不相关(图5c)。
实施例5:浆母细胞产生抗-CCP抗体
虽然CCP+患者具有与疾病活动性相关的浆母细胞百分比,这些 患者可以具有正在发生的感染或提升其循环浆母细胞百分比的其它 因素。为确定CCP+患者中循环浆母细胞的特异性,来自患者的 RosetteSep-富集的B细胞在补充10%FBS的RPMI中培养。不使用其它培养基补充剂如抗-IgM、IL-6、BAFF等以使得浆母细胞为分泌 抗体的仅有细胞(其它B细胞保持失活)。为证实仅浆母细胞产生 抗体,我们耗竭一些样品的浆母细胞(图5d)。然后B细胞在收集上 清液和在Luminex肽阵列上分析之前培养几天。阵列分析抗体对瓜 氨酸化肽的反应性。与伪耗竭B细胞的上清液相比,抗体反应性不 存在于浆母细胞耗竭样品的上清液中,表明浆母细胞分泌大量的抗- 瓜氨酸肽自身抗体(图5e)。此外,当对于各样品计数具有高于60的 平均荧光强度(MFI)的肽时,在循环浆母细胞百分比和抗体与之反应 的肽的数目之间发现强相关性(r=0.90和p=0.0139)。选择60的 MFI,因为这是其之下>99%的肽反应性落在浆母细胞耗竭样品的上 清液中的域值。
实施例6:454测序和序列的分析
来自患者的浆母细胞如上所述单一细胞分选到96-孔板中,且其 RNA按照在“材料和方法”章节中的“降落PCR”反转录并PCR扩增 以使得它们包含样品-ID(样品识别区域)和板-ID(板识别区域)条 码,如上所述。参见图3。cDNA的序列然后从454-测序机构(DNASequencing Center,Brigham Young University和454测序中心,Roche) 获得。
序列使用散弹途径从第一454测序操作获得。具有可接受质量 的序列通过454 GSFLX数据分析套装的改进的扩增子过滤器从第 二454测序操作获得。改进扩增子过滤器以使<vfScanAllFlows>设定 为“假”和<vfBadFlowThreshold>改变为“6”。来自第三和第四操作的 序列使用标准454扩增子过滤器获得。经过过滤器的序列然后如在 “材料和方法”中的“序列分配到孔”节中描述的进行处理,且各孔中的 序列如在“材料和方法”中的“序列的组装”中描述的单个组装。然后组 装的序列用IMGT HighV-Quest解析以获得所使用的VDJ区域的鉴 别。
在序列组装和V(D)J使用鉴别后,ClustalX用于将序列聚类成克 隆家族(图6)。或者,序列可以使用正向和反向阅读片段两者组装。 在这种情况中,细分的正向序列首先如上所述组装。正向和反向序 列V(D)J使用然后利用HighV-QUEST鉴别且正向和反向序列按照板 -ID和V(D)J使用分成亚集,且正向和反向序列使用Newbler组装。 因为免疫球蛋白序列大部分相似,来自较小序列亚集的组装避免来 自不同细胞的序列不正确配对的潜在问题。
实施例7:序列群聚到进化树中
外周血单核细胞(PBMC)从具有所示诊断的或在疫苗接种后的 人类受试者分离。浆母细胞单一细胞分选到96-孔板的单个孔中,使 得各孔中生成单一细胞样品,然后各孔中的mRNA反转录,且然后 汇合孔内容物并进行两轮PCR以扩增免疫球蛋白重链和轻链cDNA。 反转录将识别样品-ID添加到从各单一样品产生的所有cDNA上,且 第一轮和第二轮将板-ID及随后将454钛引物A和B分别添加到每 一扩增子上,如在“材料和方法”章节中“降落PCR和非-降落PCR” 中所描述的。一般方法在图3中概述。汇合的扩增子用454测序技 术测序,如上所述获得具有可接受质量的阅读片段。如在“材料和方 法”的“阅读片段分配到孔”和“序列的组装”节中描述的阅读片段分配 到孔中并组装。组装的序列中的V(D)J片段然后使用HighV-QUEST 识别。具有共有化合物条码的鉴别的重链和轻链序列然后可以通过将组装的序列与匹配的化合物条码放在一起简单地配对。
来自单个人类受试者的扩增子基于这些V(D)J片段聚类,并且 表达相同V(D)J片段的序列分类为来自相同的克隆家族(图7)。各饼 图代表源自表达相同V(D)J基因片段的单个人类受试者的单个浆母 细胞的克隆的百分比(即,各克隆家族中的克隆百分比)。人类受 试者包括具有脓毒症(2个受试者)、类风湿性关节炎(3个受试者)、 肺癌(1个受试者)和针对流感的疫苗接种后(1个受试者)的那些 受试者。选择这些受试者以证明克隆家族可以从经历急性状况(脓 毒症和流感疫苗)和慢性状况(类风湿性关节炎和肺癌)的受试者 的浆母细胞分离。
来自图7的单个人类受试者的免疫球蛋白重链V(D)J序列利用 ClustalX聚类并用Treeview展示为无根的放射状树(图8)。各放射状 树代表源自单个人类受试者的重链序列。对于各放射状树,末端代 表独特的序列。主要分支代表克隆家族,且较小分支代表由于突变 而彼此不同的克隆亚家族,所述突变经由接合区多样性(P-核苷酸 或N-核苷酸的添加或者核苷酸删除)、体细胞超变和亲和力成熟产 生。
实施例8:抗体的克隆、表达和纯化
所有选择的抗体如以上“材料和方法”章节中所述进行克隆、表 达和分离(参见章节:重链和轻链克隆到Lonza载体中;单克隆抗 体在293T中的表达;抗-人IgG ELISA;和表达的单克隆抗体的蛋白 A-IgG纯化)。纯化的抗体然后用于进一步研究,如下面所讨论的。
实施例9:来自流感疫苗接种后的受试者的抗体的表征
如上所述选择和分离来自施用流感疫苗的人的抗体。选择用于 下面的进一步表征的抗体显示于适当的章节中。
Fluzone ELISA
志愿者施用来自Fluzone的2010/2011季流感疫苗,其由3株灭 活病毒(A/California/7/2009、A/Perth/16/2009、B/Brisbane/60/2008 株)组成。如上所述进行Fluzone ELISA以确定是否源自疫苗接种的 志愿者的单克隆抗体结合流感疫苗本身以作为具有结合活性的表达 抗体的初始筛选。结合Fluzone ELISA的31种抗体中的14种(图26)和它们的亚集随后选择并使用表面等离子体共振测试与血球凝集素 的结合活性。通过Fluzone ELISA表征的抗体是:Flul4-Flu23、Flu25 -Flu27、Flu29、Flu30、Flu34、Flu35、Flu37、Flu39-Flu41、Flu43 -Flu46。S1和S2用作阴性对照。
流感病毒抗体亲和力的表面等离子体共振测定
单克隆抗体(mAb)与HA分子的结合如上所述使用ProteOn表面 等离子体共振生物传感器(BioRad Labs)在25℃下分析。结合Fluzone ELISA的14种抗体中,10种结合H3和1种结合H1,而3种不结 合(图27)。选择非结合者之一、H1结合者和4种其它的随机选择的 H3结合者并发送给合同研究机构(CRO)以在微中和分析中测试中和 活性。通过SPR表征的抗体是:Flu14-Flu22、Flu26、Flu29、Flu34、 Flu35、Flu46。
流感病毒微中和分析
在Fluzone ELISA中显示结合活性的一些表达的流感病毒抗体 发送到外部CRO,Virapur LLC,用于如上所述的微中和分析。分析 的结果表明在前面的分析中结合H1的抗体中和H1,而在前面的分 析中结合H3的抗体中和H3。非结合者不中和流感病毒(图28)。通过微中和分析表征的抗体是Flu15、Flu16、Flu18、Flu19、Flu20、 Flu21。
CDR变异
流感抗体如上所述获得。图25显示为清楚起见放大的部分树状 图(a)。克隆家族清楚可见且加阴影的克隆家族具有如灰色框中所示 的分配的V(D)J。重链和轻链的CDR(加框的区域)上的氨基酸序 列分别如图25(b)和(c)中所示,显示出链之间的一些残基差异。
以上的这些结果证明进化树可以使用本文中描述的组合物和方 法获得。完全人单克隆抗体可以使用本文中描述的组合物和方法从 发生急性状况的受试者的活化B细胞如浆母细胞分离。这些完全人 单克隆抗体也可以是使用本文中描述的组合物和方法的中和抗体。 结果也证明本文中公开的组合物和方法也可以分离用于靶向外源抗 原的mAb。
实施例10:来自患有RA的受试者的抗体的表征
如上所述选择和分离来自患有类风湿性关节炎(RA)的人的抗 体。选择用于以下的进一步表征的抗体示出在适当的章节中。
在RA抗原微阵列上的RA抗体反应性
源自RA患者的抗体如“材料和方法”的“RA抗原阵列上的RA抗 体反应性”节中所述的在RA抗原阵列上探测并用GenePix仪进行荧 光扫描。确认的关系使用Java TreeView软件显示为热图(图37)。通 过这一分析表征的抗体是:RA1、RA2、RA3、RA4、RA8-RA13、 RA16、RA19、RA22和RA23。Flu14和Flu26用作阴性对照。
抗-组蛋白2A ELISA
对于针对H2A的抗体的检测,如“材料和方法”章节的“抗-组蛋 白2A ELISA”中描述的进行直接ELISA。图35a显示对各测试的抗 体检测的吸光度值。在图35a中和在以下的抗-CCP2 ELISA中表征 的抗体是:RA1、RA2、RA4-RA16、RA 19、RA23-RA24。图36显 示使用30ug/ml的抗体在另一独立ELISA上的选择抗体(RA1、RA2、 RA8、RA9)。
抗-CCP2 ELISA
抗-CCP2 ELISA如“材料和方法”章节的“抗-CCP2 ELISA”中描 述的进行。图35b显示对各测试抗体检测的吸光度值。
抗-类风湿因子ELISA
源自RA患者的抗体在直接ELISA中用作第一抗体,且抗-人 IgG-HRP用作第二抗体,并用TMB底物可视化。对于针对类风湿因 子(RF)的抗体的检测,抗-RF ELISA如“材料和方法”章节的“抗-类风 湿因子ELISA”中描述的进行。图34表明抗体RA2和RA3显示反应 性。这里表征的抗体是:RA1-RA6、RA8-RA12、RA14。
上述这些结果证明抗体可以使用本文中描述的组合物和方法从 发生慢性状况的受试者的活化B细胞如浆母细胞分离。结果也证明 本文中公开的组合物和方法也可以用于分离靶向自身抗原的mAb。
实施例11:来自患肺癌的受试者的抗体的表征
如上所述选择和分离来自患有转移性肺腺癌的长期非进展的人 的抗体。该个人发生转移性肺腺癌并预期死于癌症,但是在化疗后, 这一患者进入与占所有外周血B细胞的3.1%的浆母细胞相关的长期 非进展状态超过4年。这一患者中升高的外周血浆母细胞水平表示 正在发生的免疫应答可造成其长期非进展。以下抗体选择用于下面 的进一步表征:LC1、LC5-LC7、LC9-LC18。Flu16用作阴性对照。
在肺癌组织阵列上来自肺腺癌患者的抗体的免疫组织化学
使用两种不同类型的组织微阵列载玻片的免疫组织化学如“材 料和方法”章节的“在肺癌组织阵列上来自肺腺癌患者的抗体的免疫 组织化学”中描述的进行。我们的结果证明表达的抗体之一结合肺腺 癌(图32)。
由肺腺癌患者表达的抗体与肺腺癌细胞系结合的流式细胞测定
抗体与各种肺癌细胞系的结合如“材料和方法”章节的“由肺腺癌 患者表达的抗体与肺癌细胞系结合的流式细胞测定”中描述的进行。 我们的结果表明一种抗体结合肺腺癌细胞系并可以对于肺腺癌是特 异性的(图33)。
上述的这些结果证明抗体可以使用本文中描述的组合物和方法 从发生慢性状况如癌症的受试者的活化B细胞如浆母细胞分离。结 果也证明本文中公开的组合物和方法也可以用于分离靶向自身抗原 的mAb。
实施例12:来自具有金黄色葡萄球菌感染的受试者的抗体的表征
具有金黄色葡萄球菌感染的人,包括具有在不存在抗生素的情 况下的免疫介导的感染控制的慢性金黄色葡萄球菌骨髓炎的人,用 作染色和分选的外周血浆母细胞的外周血来源。用条码标记处理 cDNA、454测序和生物信息学分析产生在发生针对金黄色葡萄球菌 的有效免疫应答的人中抗体谱的进化树。如上所述选择和分离来自 发生针对金黄色葡萄球菌的有效免疫应答的人的抗体。选择用于下 面的进一步表征的抗体示出在适当的章节中。
葡萄球菌流式细胞术
抗-葡萄球菌抗体如“材料和方法”的“葡萄球菌流式细胞术”中所 描述的用于染色固定的金黄色葡萄球菌。我们的结果表明抗体S6和 S11结合金黄色葡萄球菌的表面且可以是用于调理的候选者,从而导 致金黄色葡萄球菌的吞噬作用和杀死/抑制(图29)。在这一分析中表 征的抗体是:S1-S4、S6-S13,以F26作为阴性对照。
葡萄球菌抑制分析
处于对数期生长的金黄色葡萄球菌与抗-葡萄球菌抗体结合以如 “材料和方法”的“葡萄球菌抑制分析”中描述的抗体的抑制性活性。我 们的结果证明几种克隆和表达的抗体显示出对金黄色葡萄球菌的强 效杀灭/抑制活性(图30)。通过这一分析表征的抗体是S6和S9,以 LC1作为阴性对照。
葡萄球菌抗原与源自葡萄球菌感染的患者的抗体的免疫沉淀
抗体用于如“材料和方法”的“葡萄球菌抗原与源自葡萄球菌感染 的患者的抗体的免疫沉淀”中所描述的免疫沉淀各种候选葡萄球菌 抗原。免疫沉淀的蛋白质然后如下所述用质谱鉴定。通过这一分析 表征的抗体是S1-S13。
肽的质谱鉴定
选择染色的目标蛋白质条带并如“材料和方法”的“肽的质谱鉴定”中所描述的进行质谱分析。结果确认酚可溶性调控蛋白α1肽或δ- 溶血素为抗体S4的可能的结合靶标。这证明本文公开的方法可用于 进行新抗原的发现(图31)。通过这一分析表征的抗体是S4。
上述这些结果证明抗体可以使用本文中描述的组合物和方法从 发生急性状况如细菌感染的受试者的活化B细胞如浆母细胞分离。 结果也证明本文中公开的组合物和方法可用于分离靶向外来抗原的 mAb和确定选择的抗体所结合的抗原的身份。
实施例13:未成熟细胞和浆母细胞表征
来自由正在发生的免疫应答激活的B细胞的免疫球蛋白序列可 用于产生正在发生的免疫应答的进化树,如上所述。这一进化树通 常通过代表来自多个后代系的活化B细胞的多个克隆家族表征。来 自原始B细胞的序列一般不能够用于产生这种进化树,因为它们不 被激活且因此提供很少或不提供关于活性的正在发生的免疫应答的 信息。活化B细胞首先变成未成熟细胞,其被活化并尺寸较大。这 些未成熟细胞然后继续变成记忆B细胞或浆细胞。在人体中,虽然 记忆B细胞和浆细胞由免疫应答产生,但它们加入已由对先前的免 疫侮辱的反应产生的记忆B细胞和浆细胞的大的池,使得难以区分 针对当前的和先前的免疫应答的记忆B细胞和浆细胞。因此,在人 体中,未成熟细胞是用于测序的优选候选者以获得正在发生的免疫 应答的进化树。然而,在受控条件下繁育的研究动物(例如,小鼠)中,未成熟B细胞、记忆B细胞和浆细胞是用于测序的所有候选者 以获得进化树,因为它们在清洁环境中繁育,使得这在严厉的针对 该免疫侮辱的免疫反应后大多数记忆B细胞和浆细胞是可能的,特 别是在加强注射后,因为它们不具有之前已观察到任何主要免疫激 发的大的记忆或浆细胞群体。
对于T细胞类似地,在人体中,进行测序以获得正在发生的免 疫应答的进化树的优选细胞是未成熟T细胞。对于小鼠,活化的、 未成熟和记忆T细胞都是进行测序以获得进化树的优选候选者。
未成熟B细胞已知大于典型的B细胞。小的淋巴细胞(静息B 细胞是其中之一)的尺寸通常在6-8μm之间。未成熟淋巴细胞(T 和B细胞)尺寸通常在8-14μm之间(参见图41,也见Tzur等,PLoS ONE,6(1):e16053.doi:10.1371/journal.pone.0016053,2011;Teague等,Cytometry,14:7 2005)。浆母细胞可具有以下表达谱:CD19low/+、 CD20low/-、CD27+和CD38high。虽然所有这些标志物的使用产生用于 单一细胞分选的最纯群体,但不是所有上述标志物需要用于分离浆 母细胞。
如图39中例示的,浆母细胞可以通过使用对于较大细胞的FSChi选通,从而产生37%纯的浆母细胞群体。选通FSChiCD19hi细胞给出 72%浆母细胞纯度。选通FSChi和CD27+、CD38hi或CD20-分别给出 44、80和71%的浆母细胞纯度。任何这些标志物或发现能够区分浆母细胞与其它B细胞的其它标志物可用于提高分选的浆母细胞的纯 度,但是这些标志物中的任何一种可以单独地区分浆母细胞与其它B 细胞,尽管是以较低的纯度。
实施例14:用于测序和分析的可选平台
来自单一板(板44)的重链阅读片段制备以使用“材料和方法” 的“降落PCR”中描述的方法进行PacBio测序操作以扩增γ重链 cDNA。进行48个第二PCR以获得足够的DNA以进行PacBio操作。 DNA的汇合和清洁如“准备用于PacBio测序操作”中描述的进行。 DNA发送到PacBio用于制备和测序。CCS阅读片段从PacBio获得 并按照“材料和方法”的“序列分配到孔”和“序列的组装”分配到孔和 组装。分配的结果在图38中。这表明我们的方法和组合物对于高通 量测序不是平台特异性的。
实施例15:对于454 XL+操作的测序和分析
测序可以通过按照“准备用于454 XL+测序操作”中描述的方法 适应于454 XL+操作。这需要进行,因为454 XL+操作目前仅支持 Lib-L化学,而我们的454 XLR70操作利用Lib-A化学。这一般也可 以适应于其中Lib-L化学对于用于在XLR70操作上的扩增子测序的典型Lib-A化学为优选的情况中。来自454 XL+操作的阅读片段仍可 以按照“序列分配到孔”和“序列的组装”中描述的方法分配到孔和组 装。来自454过滤后的XLR70和XL+操作的阅读片段可以相同的方 式使用,即用于克隆和表达及抗体功能特性的分析的抗体的下游选 择仍可按照图6和9进行。
实施例16:配对的免疫球蛋白基因的克隆
假定各克隆家族识别相同的表位且各家族内的序列变异是由于 体细胞超变,我们可以首先克隆和表达各克隆家族的最常见的克隆 用于筛选结合目标抗原的抗体(图6)。我们使用最常见的克隆,因为 在亲和力成熟和在生发中心中的选择的过程中,以最高亲和力结合 抗原的中心细胞与其它中心细胞竞争存活因子。因此,我们预期最 高频率克隆也具有最高结合亲和力。一旦克隆已确认为能够结合抗 原的抗体,则克隆、表达来自整个克隆家族的代表性配对免疫球蛋 白序列和筛选为中和抗体(图6)。这一过程可以包括克隆和表达代表 克隆家族内的多个亚克隆或者编码克隆家族内不同同种型的抗体的 序列,以使得能够直接测试和比较代表克隆家族内包含的抗体谱的 特定克隆的结合和功能特性。表现所需的结合和功能特性的特定克 隆然后选择用于进一步表征和考虑用于开发为治疗性人抗体。
从家族(或任何其它目标抗体集合)选择用于克隆的候选者的 替代方式是构建抗体的系统树(在克隆家族的情况中以种系序列为 根)。在这种树中的叶节点对应于抗体家族成员。用于克隆的候选 者然后通过从树的顶部下降进行选择,从而总是选择具有最大数目 的下方叶节点的分支(在持平(tie)的情况中随机选择),然后在叶上 方的最后节点处选择具有最大数目的突变的叶或在持平的事件中随 机选择。如果需要的话,另外的候选者可以通过重复选择候选者直 到获得所需数目而进行选择,如下所述。对于树中的每一节点,如 果没有选择到作为节点的派生物的叶,则计数作为派生物的叶的数 目。对于具有最大的这种计数的节点(在持平的情况中随机选择), 下降,从而总是选择具有最大数目的派生叶节点的分支(在分支之 间持平的情况中随机选择)。然后,在叶上方的最后节点处,选择 具有最大数目的突变的叶或在持平的情况中随机选择。
从抗体的家族(或任何其它目标抗体集合)选择候选者的再另 一途径是通过使相对于种系的非-静默突变的数目下降来列举抗体和 从列表中按顺序选择,从而选择最高进化的抗体。
实施例17:持久转染和候选人抗体的表达
所需的克隆通过使用对于给定样品-ID特异性的克隆引物从序 列的汇合板选择性扩增;这些引物也将不同的5’和3’限制性位点并 入克隆中。这些限制性位点然后用于将克隆插入载体中。因为扩增 的克隆可以仅包含部分恒定区序列,载体早已包含κ、λ或γ恒定区, 其具有需要在开放阅读框中插入扩增的克隆中的适宜限制性位点。 因为克隆具有可变序列,多个限制性位点工程化到载体中以避免也 存在于克隆本身(其随后也通过限制性酶切割)中的限制性位点的 潜在问题。这允许尽可能多的克隆被插入。使用的载体是具有不同 哺乳动物选择标记的两个独立的载体(含具有工程化限制性位点的 恒定区基因的修饰的Invitrogen pcDNA3.3或pOptivec载体)或含两 种基因的双重表达载体(Lonza GS系统;pEE6.4和pEE12.4)。恒定区 插入片段的序列分别参见表16和17。选择标记是可扩增的,如 pOptivec中的二氢叶酸还原酶(DHFR)或Lonza GS系统中的谷氨酰胺 合成酶(GS),以允许基因扩增和抗体的有效产生以用于需要大量抗 体的进一步筛选目的(例如,体内筛选)。哺乳动物细胞使用双重 转染(轻链在一个载体中和重链在另一载体中)(修饰的pOptivec 和pcDNA3.3)或含两个基因的双重表达载体(Lonza GS系统)进行 转染。
修饰的Invitrogen载体。载体是具有不同哺乳动物选择标记和工 程化限制性位点的两个独立载体。pcDNA3.3具有新霉素抗性基因作 为选择标记,和pOptivec具有DHFR-选择标记。CHO DHFR-细胞在 遗传霉素选择下用修饰的pcDNA3.3和pOptivec共转染。仅用pOptivec(其含有DHFR的拷贝)转染的DHFR-细胞存活,且 pcDNA3.3中的新霉素抗性基因赋予对遗传霉素的抗性。这允许选择 用两种载体(在一个载体中含轻链和在另一载体中含重链)成功转 染的细胞,并因此将产生功能性免疫球蛋白。
Lonza GS系统。Lonza GS系统利用载体pEE 12.4和pEE6.4。载 体pEE 12.4包含GS基因作为可扩增的选择标记,且pEE6.4是补充 载体。轻链将克隆到载体之一中和重链将克隆到另一载体中。之后, 两个载体用限制性酶切割并连接到一起以形成可在单独启动子上表 达重链和轻链基因两者的单一载体。因此,是双重表达载体系统, 从而允许从单一载体表达两个基因。CHO细胞在蛋氨酸亚砜亚胺选 择下用双重表达载体转染。因此转染的细胞选择用于。
基因扩增
二氢叶酸还原酶(DHFR)和GS两者是可扩增选择标记。在相应 的提高量的氨甲喋呤和蛋氨酸亚砜亚胺选择压力下,具有含DHFR 和GS基因的重复基因组区域的转染细胞系会存活,因为它们对选择 试剂具有更高抗性。靠近选择标记的基因如插入的重链和轻链免疫 球蛋白基因也扩增,从而产生更高的基因拷贝和更高的免疫球蛋白 产生率。产生在体外筛选(参见以下)中发现具有中和性能的抗体 的克隆被扩增以使得可获得更多的抗体用于后续的体内研究。
实施例18:确定表达的人抗体的特异性
抗体筛选以两个阶段发生。我们利用新的“选择性筛选”过程, 其中我们首先选择适当的克隆家族以用于中和抗体的筛选中。我们 筛选各克隆家族的最常见的1-3个克隆结合抗原的能力。我们的筛选 通常采取间接ELISA的方式,虽然流式细胞术可用于鉴别细胞结合 抗体。这包括首先将适宜的抗原结合到ELISA板上,然后将其与含 表达的抗体的上清液一起孵育。结合抗原的抗体通过特定的第二抗 体检测。
一旦结合抗体被确认,该克隆的整个克隆家族在“选择筛选”的 筛选阶段中克隆和表达。虽然克隆家族中的所有抗体预期结合相同 的表位,它们在抗原结合的亲和力和其在抗原上的定位中可以轻微 不同,差异可以影响抗体的结合性能和/或中和能力;因此,在大多 数情况中,表达几种不同的抗体(在其CDR3区域中具有较小差异) 并筛选其结合和中和性能。
对于靶向于特定配体/受体对的中和抗体,293T细胞首先用信息 传导途径报告构建体稳定地转染,如含与NF-kB转录响应元件连接 的萤光素酶基因的质粒。转染的细胞中NF-kB的激活诱导萤光素酶 的表达,其水平可以在萤光素酶分析中测定。这测量通过配体-受体 结合激活的NF-kB信号传导。NF-kB是选择的信号传导元件,因为 大多数信号传导事件激活NF-kB。对于分析其它信号传导途径,例 如,萤光素酶基因启动子区域包含适宜的转录结合位点,如对于AP-1 的转录结合位点。接着,293T细胞用靶受体转染。293T细胞然后在96-孔板中与配体和目标结合抗体一起孵育。在24或48小时后,进 行萤光素酶分析以测定萤光素酶基因的表达。具有中和抗体的孔具 有最小的萤光素酶表达至没有萤光素酶表达。结果通过Western印迹 验证NF-kB信号传导途径中的磷酸化信号传导蛋白质。中和抗体防止配体-受体信号传导;且因此取消信号传导蛋白质的磷酸化。
对于存在于活细胞上的抗原,如癌抗原和细菌抗原,体外中和 分析采取检测活/死细胞的分析的形式,且可以以高通量形式进行。 癌细胞或细菌在96-孔板中与候选抗体一起孵育。区分活细胞与死细 胞并与流式细胞术相容的染色剂然后可以应用于各孔。活细胞和死 细胞用不同的荧光团染色并使用流进行筛选以给出活细胞和死细胞 的百分比。通过体外筛选的抗体随后体内筛选其中和活性。
病毒体外中和分析可以使用标准空斑中和分析进行。通过在96- 孔板中进行空斑中和分析,各孔可以使用显微镜成像且空斑计数可 以用图像分析软件自动进行。中和抗体减少空斑形成。这些抗体然 后进一步体内筛选中和活性。
对于使用ELISA(实施例7)和流式细胞术(实施例9和10) 的结合活性的成功分析参见实施例9“Fluzone ELISA”节、实施例 11“流式细胞术…”节和实施例12“葡萄球菌流式细胞术”节。对于具有 中和活性的抗体的成功分析参见实施例9“流感病毒微中和分析”节。
实施例19:每孔具有超过一个细胞的B细胞的测序
具有多个B细胞的单个样品在容器中单独地反转录。反转录将 样品-ID和5’通用引物区域添加到所有第一链eDNA上。汇合来自一 组容器的所有容器的eDNA并进行2轮PCR。步骤如“材料和方法” 的“降落PCR和非-降落PCR”、“准备用于454 XLR70测序操作”中所 描述的。引物的序列也显示于图9中。注意,无论哪个基因被扩增, 正向引物保持恒定(b)。在RT和2轮PCR后,来自所有容器组的扩 增子汇合并进行454-测序。序列分配到孔和序列的组装按照“材料和 方法”的“序列分配到孔”和“序列的组装”中所描述的方案。板-ID和样 品-ID的组合允许鉴别来源于相同样品的序列。
即使一个孔中存在多个细胞,我们可以配对单个重链与轻链。 来自于源自共同祖先的B细胞的重链将是克隆相关的,正如轻链一 样。因此,我们可以通过观察孔间的相关性将重链克隆家族与轻链 克隆家族相关联。一旦在克隆家族的重链和克隆家族的轻链之间建 立关联性,链对通过选择作为重链克隆家族的成员的重链和作为轻 链克隆家族的成员的轻链在各孔中分配。当在孔中存在仅单一例的 重链家族和仅单一例的轻链家族时,对的选择是明确的。在确定哪 些重链和轻链彼此相关后,可以绘制进化树和选择抗体用于其功能 特性的下游表征。
实施例20:每孔具有一个或多个细胞的B细胞的测序
样品可以在一些板中用每孔一个B细胞分选,和在其它板中用 每孔多个B细胞分选,而重链和轻链仍可以对于具有超过一个B细 胞的那些孔配对。我们检验由上述实施例9的流感疫苗接种患者产 生的序列,其中一些孔具有观察到的超过一个的独特重链序列组装 或超过一个的独特轻链序列组装。RT、PCR、测序及序列分配到孔 和序列组装按照上述实施例9中的方案。为确定哪些重链和轻链彼 此关联,重链通过将所有具有相同的V和J基因使用和在V基因片 段的末端与J基因片段的开始之间的相同数目的核苷酸的重链分组而分配到克隆家族。轻链通过将所有具有相同的V和J基因使用和 在V基因片段的末端与J基因片段的开始之间的相同数目的核苷酸 的轻链分组而分配到克隆家族。重链和轻链之间的配对关系首先基 于其共有一个孔(即具有相同的化合物条码)对于具有恰好一个重链和一个轻链的孔分配。然后,对于重链克隆家族与轻链克隆家族 的各可能的配对计算评分。评分通过计数重链家族和轻链家族的成 员共有一个孔的次数确定。然后,各重链家族与获得最高评分的轻 链家族相关联,或者如果超过一个轻链家族获得最高评分,则重链家族不与轻链家族相关联。单个重链和轻链然后通过以总体最高评 分重链家族开始而配对,并通过家族分配对逐孔进行,然后继续进 行到下一重链家族。对于给定的重链家族,对于各孔,如果在孔内 存在作为重链家族成员的单一重链,则属于重链家族的相关轻链家族的来自该孔的轻链分配为重链的对。如果存在超过一个这样的轻 链,没有配对被分配。这一将重链与轻链相关联的过程继续直到所 有家族和这些家族中的所有链已被考虑,如果对于给定的重链或轻 链,该过程产生超过一个候选者用于配对,则重链和轻链都被放弃。 进化树从配对的链产生,且抗体选择用于其功能特性的下游表征。 一部分进化树显示于图25A中。
实施例21:分选的浆母细胞产生人单克隆抗体的用途
从具有导致急性、亚急性或正在发生的循环浆母细胞产生的最 近或当前状况的受试者,在外周血(全血或外周血单核细胞(PBMC)) 上进行流式细胞术以鉴别浆母细胞群体。这一B细胞群体然后通过 流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的 孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生 cDNA。在RT过程中,孔特异性的样品-ID接合体寡核苷酸添加到 反应中。这些接合体具有可鉴别序列为来源于不同的孔的孔特异性 条码序列(样品-ID)。利用MMLV H-反转录酶的3’加尾和模板转 换活性,样品-ID添加到第一链cDNA的3’端。来自各板的cDNA 汇合在一起。在第一轮PCR过程中,板特异性FW长引物1添加板 -ID到扩增子的5’端。因此,具有不同板-ID的FW长引物1添加到不同的板上以给予各PCR产物识别条码序列。基因特异性反向引物 用于扩增κ、λ和γ链,它们分别是κGSP1、λGSP1和γGSP1。这些 引物结合免疫球蛋白基因的恒定区。来自第一轮PCR的产物被稀释 和用于第二嵌套PCR。FW引物2用作正向引物且反向引物κ、λ和 γGSP长引物用于扩增其相应的扩增子。值得注意的是,用于各板的 GPS长引物2添加共同的板ID到对于各板的各扩增子的3’端,因此 各自终止于具有两个板-ID和样品-ID条码。对于RT、第一和第二 PCR的进一步细节见于“材料和方法”的“非-降落PCR”中。然后多个 板按照“准备用于454 XLR70测序操作”中详细描述的方法汇合和进 行高通量454 DNA测序,且单个序列利用用作识别符的其条码确认 哪个重链和/或轻链从各孔获得,因此按照“材料和方法”的“序列分配 到孔”和“序列的组装”中详细描述的方法提供用于将源自相同初始细 胞的单个可变重链和轻链匹配的指导。然后绘制进化树和选择抗体 用于克隆、表达和功能活性的测定(参见图6-8)。
来自特定细胞来源的候选重链和轻链基因然后克隆和表达用于 如实施例8中的所需性质的筛选。一旦稳定或瞬时转染,配对的重 链和轻链的表达将导致重演初始分选细胞的特异性的单克隆抗体的 产生。含分泌的抗体的上清液然后筛选所需的性能,包括但不限于 针对目标靶抗原的抗原特异性以及适当功能分析的功能性。图9和6 各提供用于实施这一方法的一般方法的一个实例。图26-27表明这如 何使用本发明的组合物和方法进行以获得针对来自流感疫苗接种的 人的单一细胞分选的浆母细胞的人单克隆抗体。
实施例22:分选的无偏或抗原特异性记忆B细胞用于产生人单克隆抗体
从具有证明的或疑似的目标抗原暴露的受试者,在外周血(全 血或分离外周血单核细胞,PBMC)上进行FACS以鉴别记忆B细胞 群体(定义为CD19+CD20+CD27+)。另外,对目标抗原特异性的记 忆B细胞也可以通过用记忆B细胞表面标志物和用荧光团偶联抗原 (CD19+CD20+CD27+抗原+)染色外周血或PBMC来分选。这一细胞群 体然后通过FACS分选为单一细胞或多个细胞到孔中。重复实施例 21中详细描述的过程以条码标记和从454测序获得序列并将序列分 配到孔和组装序列。HighV-QUEST用于鉴别VDJ基因使用,且进化 树上各克隆家族的多个成员选择用于如实施例8中的克隆和表达。 克隆和表达如实施例8中详细描述的进行。一旦转染,整个配对重 链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗 体。含抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适 当功能分析的功能性。图9和6各提供用于完成该方法的一般方法 的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能 表征获得人单克隆抗体的另一实例。
实施例23:分选的无偏或抗原特异性总B细胞用于产生人单克隆抗体
从具有证明的或疑似的先前目标抗原暴露的受试者,在外周血 (全血或分离的外周血单核细胞,PBMC)上进行FACS以鉴别CD19+ B细胞群体。这一细胞群体然后通过FACS分选为单一细胞或多个 细胞到孔中。重复实施例21中详细描述的过程。重复实施例21中 详细描述的过程以进行条码标记,并从454测序获得序列及分配序 列到孔和组装序列。HighV-QUEST用于鉴别VDJ基因使用,且进化 树上各克隆家族的多个成员如实施例8中选择用于克隆和表达。一 旦转染,配对的重链和轻链的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含表达的抗体的上清液筛选针对目标靶抗原的 抗原特异性以及通过适当功能分析的功能性。图9和6各提供用于 完成该方法的一般方法的一个实例。图26-27提供从进化树选择的克 隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。
实施例24:浆细胞用于产生人单克隆抗体
从具有证明的或疑似的先前目标抗原暴露的受试者,在外周血 (全血或分离的外周血单核细胞,PBMC)或骨髓细胞上进行FACS 以鉴别CD138+浆细胞群体。这一细胞群体然后通过FACS分选为单 一细胞或多个细胞到孔中。重复实施例21中详细描述的过程以进行条码标记,并从454测序获得序列及分配序列到孔和组装序列。 HighV-QUEST用于鉴别VDJ基因使用,且进化树上各克隆家族的多 个成员选择用于克隆和表达。一旦转染,配对的重链和轻链的表达 导致产生重演初始分选细胞的特异性的单克隆抗体。含表达的抗体 的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分析 的功能性。图9和6各提供用于完成该方法的一般方法的一个实例。 图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得人 单克隆抗体的另一实例。
实施例25:未成熟B细胞用于产生人单克隆抗体
从具有证明的或疑似的先前目标抗原暴露的受试者,在外周血 (全血或分离的外周血单核细胞,PBMC)上进行FACS以鉴别FSChi未成熟B细胞群体。未成熟细胞是活化B细胞,且因此是已针对抗 原作出反应并活跃增殖的细胞。这些B细胞由克隆家族组成且其配 对的重链和轻链可用于获得进化树。B细胞激活的其它标志物如 CD69hi和CD44hi也可以结合使用。另外地,DNA内容物(其可以使 用细胞渗透性DNA染色剂如SYTO Blue(Invitrogen)染色以确定活化 的细胞)、增殖和处于细胞周期中也可以结合使用以描绘未成熟B 细胞。这一细胞群体然后通过FACS分选为单一细胞或多个细胞到 孔中。重复实施例21中详细描述的过程以进行条码标记,并从454 测序获得序列及分配序列到孔和组装序列。HighV-QUEST用于鉴别 VDJ基因使用,且进化树上各克隆家族的多个成员选择用于克隆和 表达。一旦转染,配对的重链和轻链的表达导致产生重演初始分选 细胞的特异性的单克隆抗体。含表达的抗体的上清液筛选针对目标 靶抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各 提供用于完成该方法的一般方法的一个实例。图26-27提供从进化树 选择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实 例。
实施例26:鼠B细胞用于产生单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠B细胞。鼠B细胞可以从血液、从脾细胞或从骨髓获得。 进行流式细胞术以获得CD19+或B220+B细胞。这一B细胞群体然 后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓 冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产 生cDNA。RT、第一和第二PCR如“材料和方法”的“非-降落PCR” 中详细描述的进行。小鼠基因特异性引物在表11中找到,且用于 RT和PCR的其它引物在表1中找到。然后多个板按照“准备用于454 XLR70测序操作”中详细说明的方法汇合并进行高通量454 DNA测 序,且按照“材料和方法”的“序列分配到孔”和“序列的组装”中详细描 述的方法,单个序列用它们的条码(其用作哪个重链和/或轻链从各 孔获得的标识符)鉴别,因此提供匹配源自相同初始细胞的单个可 变重链和轻链的指导。然后绘制进化树且选择抗体用于克隆、表达 和功能活性的测定。
用于克隆的序列可以通过合成基因的合成获得或使用克隆引物 从第一PCR产物扩增。正向克隆引物是样品特异性的且可以从扩增 子的池扩增特异性序列。各重链和轻链的序列然后克隆到含对于通 过克隆引物引入的限制性位点互补的限制性位点的表达载体中。载 体也含有重链或轻链恒定区,该重链或轻链序列克隆到(对准的阅 读框)中以产生整个抗体。含重链或轻链克隆的载体然后双重转染 到哺乳动物表达系统中,或者两个扩增子可以克隆到双重表达载体 中以允许单一转染到哺乳动物细胞中。
来自特定细胞源的候选重链和轻链基因然后使用表达以如上所 述用于所需性能的筛选。一旦稳定或瞬时转染,配对的重链和轻链 的表达导致产生重演初始分选细胞的特异性的单克隆抗体。含分泌 的抗体的上清液然后筛选所需的性质,包括,但不限于针对目标靶 抗原的抗原特异性以及通过适当功能分析的功能性。图9和6各提 供用于完成该方法的一般方法的一个实例。图26-27提供从进化树选 择的克隆和表达的抗体的功能表征获得人单克隆抗体的另一实例。
实施例27:鼠浆细胞用于产生单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠B细胞。鼠浆细胞可以从血液、从脾细胞或从骨髓获得, 虽然通常使用脾细胞和骨髓。进行流式细胞术以获得 CD19low/-B220low/-CD138+浆细胞。这一浆细胞群体然后通过流式细胞 术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分 选的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、 第一和第二PCR如“材料和方法”的“非-降落PCR”中详细描述的进 行。小鼠基因特异性引物在表11中找到,且用于RT和PCR的其它 引物在表1中找到。然后多个板按照“准备用于454 XLR70测序操作” 中详细说明的方法汇合并进行高通量454DNA测序,且按照“材料和 方法”的“序列分配到孔”和“序列的组装”中详细描述的方法,单个序 列用它们的条码(其用作哪个重链和/或轻链从各孔获得的标识符) 鉴别,因此提供匹配源自相同初始细胞的单个可变重链和轻链的指 导。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。
用于克隆的序列可以通过合成基因的合成获得或使用如实施例 26中描述的克隆引物从第一PCR产物扩增。来自特定细胞源的候选 重链和轻链基因然后使用表达以如上所述用于所需性能的筛选。一 旦稳定或瞬时转染,配对的重链和轻链的表达导致产生重演初始分 选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后筛选所 需的性质包括,但不限于针对目标靶抗原的抗原特异性以及通过适 当功能分析的功能性。图9和6各提供用于完成该方法的一般方法 的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能 表征获得单克隆抗体的另一实例。
实施例28:无偏的或抗原特异性鼠记忆B细胞用于产生单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠B细胞。鼠记忆B细胞通常可以从脾细胞或淋巴结获得。 进行流式细胞术以获得CD19+或B220+和CD38+IgG+记忆B细胞。也 可以使用其它标志物如CD45RO。抗原特异性记忆B细胞也可以使用荧光团偶联的抗原染色来可视化和分选。这一记忆B细胞群体然 后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓 冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产 生cDNA。RT、第一和第二PCR,之后的测序、序列分配到孔和序 列组装如实施例26中进行。然后绘制进化树且选择抗体用于克隆、 表达和功能活性的测定。
用于克隆的序列可以通过合成基因的合成获得或使用如实施例 26中描述的克隆引物从第一PCR产物扩增。来自特定细胞源的候选 重链和轻链基因然后使用表达以如上所述用于所需性能的筛选。一 旦稳定或瞬时转染,配对的重链和轻链的表达导致产生重演初始分 选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后筛选所 需的性质,包括,但不限于针对目标靶抗原的抗原特异性以及通过 适当功能分析的功能性。图3和9各提供用于完成该方法的一般方 法的一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功 能表征获得单克隆抗体的另一实例。
实施例29:鼠短寿浆母细胞用于产生单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠B细胞。鼠短寿浆母细胞通常可以从脾细胞获得。这些 浆母细胞多样化地描述为CD19low/-B220low/-和CD22low或CDllc+,且 也描述为CD138+。进行流式细胞术以获得浆母细胞。这一浆母细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的 低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR 以产生cDNA。RT、第一和第二PCR,之后的测序、序列分配到孔 和序列组装如实施例26中进行。然后绘制进化树且选择抗体用于克 隆、表达和功能活性的测定。
用于克隆的序列可以通过合成基因的合成获得或如实施例26中 描述的使用克隆引物从第一PCR产物扩增。来自特定细胞源的候选 重链和轻链基因然后使用其进行表达以如上所述用于所需性能的筛 选。一旦稳定或瞬时转染,配对的重链和轻链的表达导致产生重演 初始分选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后 筛选所需的性质,包括,但不限于针对目标靶抗原的抗原特异性以 及通过适当功能分析的功能性。图9和6各提供用于完成该方法的 一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗 体的功能表征获得单克隆抗体的另一实例。
实施例30:鼠未成熟B细胞用于产生单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠B细胞。鼠未成熟B细胞通常可以从脾细胞获得。未成 熟细胞是活化B细胞,且因此是针对抗原作出响应并活跃增殖扩增 的细胞。这些B细胞由克隆家族组成且其配对的重链和轻链可以用于获得进化树。未成熟B细胞可以分选为FSChi,且也可以进一步经 由细胞表面标志物如CD44hiCD69hi鉴别,并作为未成熟B细胞增殖, 它们也可以通过具有如通过细胞渗透性DNA染色剂如SYTO Blue 染色的增加的DNA含量而鉴别为已进入细胞周期。进行流式细胞术 以获得未成熟B细胞。这一浆母细胞群体然后通过流式细胞术分选 为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细 胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第一和 第二PCR,之后的测序、序列分配到孔和序列组装如实施例26中进 行。然后绘制进化树且选择抗体用于克隆、表达和功能活性的测定。
用于克隆的序列可以通过合成基因的合成获得或如实施例26中 描述的使用克隆引物从第一PCR产物扩增。来自特定细胞源的候选 重链和轻链基因然后使用其进行表达以如上所述用于所需性能的筛 选。一旦稳定或瞬时转染,配对的重链和轻链的表达导致产生重演 初始分选细胞的特异性的单克隆抗体。含分泌的抗体的上清液然后 筛选所需的性质,包括,但不限于针对目标靶抗原的抗原特异性以 及通过适当功能分析的功能性。图9和6各提供用于完成该方法的 一般方法的一个实例。图26-27提供从进化树选择的克隆和表达的抗 体的功能表征获得单克隆抗体的另一实例。
实施例31:从无偏或抗原特异性人IgA+B细胞获得单克隆抗体
从具有或不具有证明的或疑似的先前目标抗原暴露的受试者, 在外周血(全血或分离的外周血单核细胞,PBMC)上或在骨髓上进 行FACS以分离IgA+B细胞。这些B细胞可以是记忆B细胞、浆细 胞或浆母细胞。这些IgA+B细胞也可以是抗原特异性的,通过使用 荧光团偶联的抗原染色IgA+B细胞而对抗原阳性B细胞进行分选。 这一细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。 重复实施例21中详细描述的过程以条码标记和从454测序获得序 列,并分配序列到孔和组装序列,且用于PCR的IgA恒定区特异性 引物在表10中。HighV-QUEST用于鉴别VDJ基因使用,且进化树 上各克隆家族的多个成员如实施例8中选择用于克隆和表达。含表 达的抗体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当 功能分析的功能性。图9和6各提供用于完成该方法的一般方法的 一个实例。图26-27提供从进化树选择的克隆和表达的抗体的功能表 征获得人单克隆抗体的另一实例。
实施例32:从无偏的或抗原特异性的人IgM+B细胞获得单克隆抗体
从具有或不具有证明的或疑似的先前目标抗原暴露的受试者, 在外周血(全血或分离的外周血单核细胞,PBMC)上进行FACS以 分离IgM+B细胞。这些B细胞可以是记忆B细胞、浆细胞或未成 熟B细胞。这些IgM+B细胞也可以是抗原特异性的,通过使用荧光 团偶联的抗原染色IgM+B细胞而对抗原阳性B细胞进行分选。这一 细胞群体然后通过FACS分选为单一细胞或多个细胞到孔中。重复 实施例21中详细描述的过程以条码标记和从454测序获得序列,并 分配序列到孔和组装序列,且用于PCR的IgM恒定区特异性引物在 表10中。HighV-QUEST用于鉴别VDJ基因使用,且进化树上各克 隆家族的多个成员如实施例8中选择用于克隆和表达。含表达的抗 体的上清液筛选针对目标靶抗原的抗原特异性以及通过适当功能分 析的功能性。图9和6各提供用于完成该方法的一般方法的一个实 例。图26-27提供从进化树选择的克隆和表达的抗体的功能表征获得 人单克隆抗体的另一实例。
实施例33:从无偏的或抗原特异性的鼠IgA+B细胞获得单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠IgA+B细胞。这些B细胞可以是记忆B细胞、浆细胞、 浆母细胞或未成熟B细胞,且通常可以从脾细胞获得。这些IgA+B 细胞也可以是抗原特异性的,通过使用荧光团偶联的抗原染色IgA+ B细胞而对抗原阳性B细胞进行分选。这一IgA+B细胞群体然后通 过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液 的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生 cDNA。RT、第一和第二PCR,之后的测序、序列分配到孔和序列 组装如实施例26中进行,且用于PCR的IgA恒定区特异性引物在 表11中。然后绘制进化树且选择抗体用于克隆、表达和功能活性的 测定。图9和6提供用于完成该方法的一般方法的一个实例。
实施例34:从无偏的或抗原特异性的鼠IgM+B细胞获得单克隆抗体
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠IgM+B细胞。这些B细胞可以是记忆B细胞、浆细胞、 浆母细胞或未成熟B细胞,且通常可以从脾细胞获得。这些IgM+B 细胞也可以是抗原特异性的,通过使用荧光团偶联的抗原染色IgM+ B细胞而对抗原阳性B细胞进行分选。这一IgM+B细胞群体然后通 过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液 的孔中。分选的细胞可以在此时冷冻或立即用于RT-PCR以产生 cDNA。RT、第一和第二PCR,之后的测序、序列分配到孔和序列 组装如实施例26中进行,且用于PCR的IgA恒定区特异性引物在 表11中。然后绘制进化树且选择抗体用于克隆、表达和功能活性的 测定。图9和6提供用于完成该方法的一般方法的一个实例。
实施例35:来自人T细胞的多于一个序列的测序
从具有导致急性、亚急性或正在发生的循环T细胞产生的最近 或当前状况的受试者,在外周血(全血或外周血单核细胞(PBMC)) 上进行流式细胞分析以鉴别目标T细胞群体。这一T细胞群体可以 是活化T细胞或未成熟T细胞。活化T细胞可以使用CD44hi、CD69hi、CD154+、CD137+或未成熟T细胞鉴别,其也是可以通过其大小或 FSChi描绘的活化T细胞,且也可以使用细胞渗透DNA染料如SYTO Blue鉴别为处于细胞周期中。活化T细胞应当由随后可以群集成进 化树的克隆家族组成,在克隆家族中具有相同的家族成员,其可以 用于选择用于下游功能分析的克隆。T细胞然后通过流式细胞术分选 为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细 胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT和PCR以 条码标记TCR基因详述于“材料和方法”的“非-降落PCR”中,测序准 备详述于“材料和方法”的“准备用于454 XLR70测序操作”中,且序 列分配到孔和阅读片段的组装详述于“材料和方法”的“序列分配到 孔”和“序列的组装”中,TCR基因特异性引物见于表10中。然后构 建进化树且随后选择来自特定细胞源的候选基因以克隆和表达用于 所需性质的筛选。用于克隆的序列可以基因合成或用克隆引物从第 一PCR产物扩增。特定的克隆可以通过具有对于样品-ID条码序列 特异性的正向克隆引物从克隆的池分离。反向克隆引物对于适当基 因是互补的。正向和反向引物都包含侧翼限制性位点以将克隆(对 准的阅读框)整合到载体中。细胞用两个表达载体(各包含任一目 标基因)双重转染或用表达两个目标基因(例如,T细胞α和β链) 的双重表达载体单一转染。
一旦稳定或瞬时转染,目标基因可以表达和使用所需的筛选方 法进行功能性质的筛选。
实施例36:来自鼠T细胞的多于一个序列的测序
小鼠用目标抗原激发,并可以给予几次加强注射,然后处死小 鼠以获得鼠T细胞。T细胞是CD3+,且辅助T细胞是CD4+和细胞 毒性T细胞是CD8+。这一T细胞群体可以是记忆或活化T细胞或者 未成熟T细胞。记忆T细胞可以鉴别为CD45RO+。活化T细胞可以 使用CD44hi、CD69hi或未成熟T细胞鉴别,其也是可以通过其大小 或FSChi描绘的活化T细胞,且也可以使用细胞渗透DNA染料如 SYTO Blue确认为处于细胞周期中。在重复的抗原暴露之后保持在清洁环境中的小鼠中的所有这些T细胞应当具有随后可以显示为进 化树的大部分的克隆家族,进化树然后可以用于选择TCR用于克隆 和表达及下游功能分析。
T细胞使用以上提出的标志物通过流式细胞术分选为单一细胞 到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此 时冷冻或立即用于RT-PCR以产生cDNA。进行RT和PCR以条码 标记TCR基因详述于“材料和方法”的“非-降落PCR”中,测序准备详 述于“材料和方法”的“准备用于454 XLR70测序操作”中,且序列分 配到孔和阅读片段的组装详述于“材料和方法”的“序列分配到孔”和 “序列的组装”中,TCR基因特异性引物见于表11中。然后构建进化 树且随后选择来自特定细胞源的候选基因以克隆和表达用于所需性 质的筛选。用于克隆的序列可以基因合成或用克隆引物从第一PCR 产物扩增。特定的克隆可以通过具有对于样品-ID条码序列特异性的 正向克隆引物从克隆的池分离。反向克隆引物对于适当基因是互补 的。正向和反向引物都包含侧翼限制性位点以将克隆(对准的阅读框)整合到载体中。细胞用两个表达载体(各包含任一目标基因) 双重转染或用表达两个目标基因(例如,T细胞α和β链)的双重 表达载体单一转染。
一旦稳定或瞬时转染,目标基因可以表达和使用所需的筛选方 法进行功能性质的筛选。
实施例37:来自样品的多于一个序列的测序
鉴别包含目标核酸的单一样品。单一样品可以具有单一细胞或 细胞群体。样品可以通过流式细胞术分选为单一细胞到含具有RNA 酶抑制剂的低渗缓冲液的孔中。分选的细胞可以在此时冷冻或立即 用于RT-PCR以产生cDNA。这一B细胞群体然后通过流式细胞术分选为单一细胞到含具有RNA酶抑制剂的低渗缓冲液的孔中。分选 的细胞可以在此时冷冻或立即用于RT-PCR以产生cDNA。RT、第 一和第二PCR如“材料和方法”的“非-降落PCR”中详细描述的进行。 然后多个板按照“准备用于454 XLR70测序操作”中详细描述的方法 汇合和进行高通量454 DNA测序,且单个序列利用用作识别符的其 条码确认哪个重链和/或轻链从各孔获得,因此按照“材料和方法”的 “序列分配到孔”和“序列的组装”中详细描述的方法提供用于将源自 相同初始细胞的单个可变重链和轻链匹配的指导。然后绘制进化树和选择抗体用于克隆、表达和功能活性的测定。
来自特定细胞源的候选基因然后选择进行克隆和表达以用于所 需性质的筛选或其它需要。用于克隆的序列可以基因合成或用克隆 引物从第一PCR产物扩增。特定的克隆可以通过具有对于样品-ID 条码序列特异性的正向克隆引物从克隆的池分离。反向克隆引物对 于适当基因是互补的。正向和反向引物都包含侧翼限制性位点以将 克隆(对准的阅读框)整合到载体中。细胞用两个或更多个表达载 体(各包含任一目标基因)转染或用表达目标基因的表达载体单一 转染。
一旦稳定或瞬时转染,目标基因可以表达和在需要的情况下进 行筛选。图9和6提供用于完成该方法的一般方法的一个实例。
实施例38:通过DNA合成克隆免疫球蛋白V(D)J区域
所需的免疫球蛋白轻链和重链V(D)J区域可以通过DNA合成来 合成产生而用于克隆到表达载体中。用于合成的序列可以直接源自 高通量454序列,或者编码来自目标样品的重链和轻链免疫球蛋白 的cDNA可以从单个样品或合并有样品重测序以进一步确认序列, 且这一序列用于合成选择的轻链和重链V(D)J区域。Ig基因的可变 区可以通过DNA合成克隆,并使用限制性酶和标准分子生物学将合 成的DNA并入含适当恒定区的载体中。在合成过程中,不需要遵循 精确的核苷酸序列,只要氨基酸序列不发生变化,除非诱变是需要 的。这允许可导致更高表达水平的密码子优化。这也允许加入用于 克隆目的的限制性位点。非翻译序列如5’UTR和条码序列不需要合 成,前导序列也可以交换为已知用于更高表达水平的其它信号肽序 列。这些导致可以与高通量阅读片段非常不同但在表达时给出相同 氨基酸序列的Ig核苷酸序列。
在一个实施方式中,扩增的V(D)J区域插入早已含有κ、λ、γ 或其它重链同种型恒定区的载体中,其具有将扩增的克隆插入开放 阅读框中需要的适当限制性位点。在另一实施方式中,整个可变区 可以用恒定区合成并克隆到表达载体中的基因用于表达和抗体性能 的下游功能测试。
实施例39:通过使用早已存在于样品识别区别接合体中的限制性位点克隆免疫球 蛋白V(D)J区域
在另一方面,所需的免疫球蛋白轻链和重链V(D)J区域可以使 用在反转录过程中添加的早已并入样品-ID接合体中的限制性位点 进行克隆。这产生在PCR扩增子池中具有孔-ID条码3’侧的限制性 位点的接合体。在用克隆引物克隆过程中,所需的扩增子使用与孔 -ID条码序列互补的5’引物和链特异性的3’引物(对于κ、λ和γ链) 从板特异性扩增子池扩增。3’引物添加3’限制性位点。5’引物不需要 添加限制性位点,因为5’引物早已包含孔-ID条码3’侧限制性位点。 在这一扩增后,限制性酶用于切割扩增子以连接到含恒定区插入片 段的载体中。在限制性酶消化过程中,添加到Ig基因序列的5’端上 的序列如条码和通用序列被切割,因为它们在5’限制性位点的5’侧。
实施例40:通过测序仅一条免疫球蛋白链(重链或轻链),然后通过克隆配对的免 疫球蛋白重链和轻链V(D)J区域鉴别克隆家族
抗体重链和轻链从mRNA反转录,从而将独特的样品-ID并入 到从各样品产生的cDNA上,且汇合样品cDNA用于扩增PCR。扩 增免疫球蛋白cDNA且使用454高通量测序对免疫球蛋白重链或轻 链进行测序,并且序列按照表现出相同基因组编码V(D)J片段的使 用的其免疫球蛋白重链V(D)J或轻链V(D)J序列的使用分组。生物 信息学用于鉴别目标克隆家族,且来自相同样品的所需免疫球蛋白 轻链和重链V(D)J区域然后选择性扩增用于测序和/或克隆。对于 PCR扩增,正向引物包括样品-ID和反向引物对于轻链或重链恒定区 是特异性的。引物可以将限制性位点并入扩增子中。然后扩增子可 以插入早已包含重链或轻链恒定区的适当表达载体中。然后抗体可 以表达和筛选所需性质。
实施例41:仅使用样品-ID(不使用无板-ID)鉴别用于抗体的克隆和表达的来自免 疫球蛋白重链和轻链V(D)J测序的克隆家族
抗体重链和轻链从各样品中的mRNA反转录,从而将独特的样 品-ID并入到从各样品产生的cDNA中。各样品-ID长度为至少6个 核苷酸长且具有1碱基对的差异,从而产生4096个独特的潜在样品 -ID。独特的样品-ID用于各样品,且独特的样品-ID鉴别源自不同样 品的cDNA并使配对测序和单个样品中表达的2个或更多个cDNA 的克隆成为可能。重链和轻链扩增子使用PCR扩增,其添加454高 通量测序所需的钛接合体A和B且然后所有样品发送用于测序。序 列按照“材料和方法”中“序列分配到孔”和“序列的组装”节分配到孔 和组装。V(D)J分配使用HighV-QUEST进行并基于其V(D)J使用分 组到克隆家族中。选择的克隆然后用克隆引物特异性扩增,克隆引 物也将限制性位点添加到扩增子中。扩增子然后同框插入早已含用 于表达筛选所需性质的抗体的适当重链或轻链恒定区的表达载体 中。
实施例42:通过连接在通用引物序列上克隆配对的序列
抗体重链和轻链基因从mRNA反转录,其添加3′序列到由接合 体区域和样品-ID条码组成的新合成cDNA上。样品然后汇合到一起 且通用引物序列使用T4 DNA连接酶和5′磷酸化反义通用引物寡核 苷酸添加到第一链cDNA的3′端。或者,可以进行第二链cDNA合 成以获得双链cDNA而不是mRNA/cDNA杂合体,随后连接在通用 引物序列上。然后进行两轮PCR以扩增cDNA并添加板-ID和用于 454测序的钛引物A和B。或者,板-ID和钛引物也可以通过DNA 连接添加而不是在PCR过程中通过使用T4 DNA连接酶并入。在454 测序后,组装序列并鉴别克隆家族。从克隆家族选择的克隆可以使 用添加限制性位点到扩增子上的克隆引物特异性克隆。然后序列同 框插入早已具有适当重链或轻链恒定区的表达载体中。然后表达抗 体并筛选所需的性质。
实施例43:用于免疫球蛋白重链和轻链的反转录的基因特异性引物(RT-GSP)的测
在重链和轻链基因的反转录中使用RT-GSP代替寡(dT)作为引 物。cDNA然后通过PCR扩增并在琼脂糖凝胶上可视化。RT-GSP 引物在道1-4中分别是IgKC_v3(a)、IgLC_v5、IgLC_v6、IgLC_v7 和IgLC_v8(b),在道1-4中分别是IgHGC_v10、IgHGC_v11、 IgHGC_v13和IgGC_v15(c)及IgHGC_v16(d)。引物名称中的KC、 LC和GC表示引物分别对于κ链、λ链和γ重链是特异性的。凝胶 照片中的白色条带表示非-相关道被修剪掉的位置。参见图10和表6。
实施例44:接合体区域序列的测试
RNA用在3’末端包含通用引物区域和接合体区域的寡核苷酸反 转录。然后eDNA使用通用引物区域序列作为正向引物和基因特异 性序列作为反向引物扩增。扩增的产物在琼脂糖凝胶上可视化。接 合体区域由G(a)、分别在道1和2中的GGGGG和rGrGrG(b)组成。 rG表示RNA核苷酸而非DNA核苷酸。参见图11和表6。
实施例45:通用引物序列的测试
RNA用在3’末端包含通用引物区域和接合体区域的寡核苷酸反 转录。然后cDNA使用与通用引物区域互补的正向引物和与基因特 异性序列互补的反向引物的PCR扩增。Univ_seq_4(a)、univ_seq_5(b) 和univ_seq_f(c)。凝胶照片中的竖直白色条带表示非相关条带被修 剪掉的位置。另外的道属于相同的凝胶照片。参见图12和表6。
实施例46:用于第一PCR反应的基因特异性引物序列的测试
基因-特异性反向引物在第一PCR反应中用于序列的扩增中。 第一PCR反应或后续的第二嵌套PCR产物进行分析并在琼脂糖凝胶 上可视化。使用的反向引物是分别在道1-3上的IgKC_v4、IgLC_v5、 IgHGC_v13(a),分别在道1-3上的K_GSP1、L_GSP1、G_GSP1(b), 分别在道1-2上的K_GSP1c、L_GSP1c(c),分别在道1-2上的G_GSP1 (d)、L_GSP1d、G_GSP1g(e),分别在道1-4上的G_GSP1h、G_GSP1k、 L_GSP1f、L_GSP1g(f),分别在道1-8上的G_GSP1d(g)L_GSP1h-o (h),分别在道1-6上的G_GSP1m-q和G_GSP1t(引物名称中的K、L 和G指示引物分别对于κ、λ和γ免疫球蛋白恒定区是特异性的)。 各凝胶以左侧的道标记开始,之后是样品道。相同凝胶照片上的道 之间的白色条表示其间的非相关道被修剪掉的位置。参见图13。另 外,更多的引物在图43中测试。这些引物用于第一PCR,且然后第 二PCR使用来自表1的引物进行且PCR产物在2%琼脂糖凝胶上分 析和获取图像。用于第一PCR的引物分别是κGSP1、κGSP1e、 κGSP1f、λGSP1、λGSP1x和λGSP1y。使用的序列也参见表6。
实施例47:用于第二PCR反应的基因特异性序列的测试
基因特异性反向引物在第二PCR反应中用于序列的扩增中。 PCR产物进行分析并在琼脂糖凝胶上可视化。使用的反向引物是分 别在道1-3中的K_GSP2、L_GSP2、G_GSP2(a),分别在道1-3中的 K_GSP2v2a、K_GSP2v2b、L_GSP2v2(b),分别在道1-4中的 K-GSP2v2c、K-GSP2v2c、G_GSP2v2c1、G_GSP2v2c2(c),分别在 道1-3中的K_GSP2v2d-f(d),分别在道1-3中的K_GSP2v2g、 L_GSP2v2d和G_GSP2b(e)。引物名称中的K、L和G指示它们分别 对于κ、λ和γ免疫球蛋白恒定区是特异性的。各凝胶以左侧的道标 记开始,之后是样品道。相同凝胶照片上的道之间的白色条表示其 间的非相关道被修剪掉。参见图14和表6。
实施例48:用于其它人可变区基因的基因特异性引物的测试
第一和第二PCR使用基因-特异性反向引物进行,且产物在2% 琼脂糖凝胶上分析和成像。从左起的道为:标志物、μ、α恒定区、 TCRα(a)和标志物、TCRβ(b)。使用的3′引物的序列在表10中。相 同凝胶照片上的道之间的白色条表示其间的非相关道被修剪掉的位置。参见图44。
实施例49:用于小鼠可变区基因的基因特异性引物的测试
进行第一和第二PCR且产物在2%琼脂糖凝胶上分析和成像。 从左起的道为:标志物、κ、λ、λ、λ、λ轻链和μ重链(a)。4个λ道 具有所使用引物的这一组合:小鼠_λ_GSP1a与小鼠e_λGSP2a、小 鼠_λ_GSP1a与小鼠_λGSP2b、小鼠_λ_GSP1b与小鼠_λGSP2a和小 鼠_λ_GSP1b与小鼠_λGSP2a。标志物和α重链(b)。分别使用 mo_g12_GSP2d和mo_g12_GSP2e的第二PCR的γ1、2a、2c重链, 标志物(c)。分别使用mo_g3_GSP2d、mo_g3_GSP2e的第二PCR的γ3 重链,之后是分别使用mo_g2b_GSP2d、mo_g2b_GSP2e的第二PCR 的γ2b重链,接着是标志物(d)。标志物、TCRα(e)。标志物、TCRβ(f)。 相同凝胶照片上的道之间的白色条表示其间的非相关道被修剪掉的 位置。参见图45和表11。
实施例50:在一端具有条码的连接的抗体重链和轻链对的产生
如图1中所示的,单个B细胞可以通过流式细胞术从血液、整 批外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆 B细胞或其它B细胞群体分选。B细胞经单一细胞分选到96-孔PCR 板中,留下一列孔空白作为阴性对照。图17描述了可用于连接两个 目标多核苷酸和在一端添加条码的方法的一般方法学。
单步骤多重重叠-延伸RT-PCR可以使用商购的一步RT-PCR试 剂盒(例如,Qiagen一步RT-PCR试剂盒)按照制造商的推荐进行。 在这一特定实例中,多核苷酸合成反应如反转录反应用于从mRNA 样品产生cDNA模板。参见图17,用于RT-PCR反应的正向基因特 异性引物包含限制性酶位点(RE1)、测序引物位点和条码以将这些元 件添加到第一目标cDNA上。两个另外的引物(显示为含RE3)具 有互补的重叠-延伸尾。这些引物用于PCR反应中产生携带重叠延伸 尾的两个目标cDNA,其允许两个目标cDNA退火并在扩增过程中 连接。在所示的实例中,产生具有所示结构的产物,其中LC和HC 链在一端用条码物理连接。
RE1和RE2限制性位点可以用于克隆PCR产物到用于测序的适 宜载体中。
实施例51:具有内部条码的连接的抗体重链和轻链对的产生
如图1中所示,单个B细胞可以通过流式细胞术从血液、整批 外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B 细胞或其它B细胞群体分选。B细胞单一细胞分选到96-孔PCR板 中,留下一列空白孔作为阴性对照。图18描述了可用于连接具有位 于其间的条码的两个目标多核苷酸的方法的一般方法学。可用于抗 体重链和轻链的引物和寡核苷酸显示于表30中。限制性位点AsiSI 和PacI包括在RT寡核苷酸中。样品-ID序列显示于表2中。
图18显示的方法依赖于cDNA合成反应过程中反转录酶的3’ 加尾和模板转换活性。添加到合成的cDNA上的3’C尾可用于带有 重叠延伸序列和条码的接合体分子的退火。两种类型的接合体分子 用于连接两个cDNA。携带重叠延伸和条码序列的第一接合体添加到 第一cDNA上。携带重叠延伸的反向互补序列而没有条码序列的第 二接合体添加到第二cDNA上。反转录酶的模板转换性质添加这些 序列到其相应cDNA的3’端上。
在PCR反应中,如图18中所示,互补重叠延伸序列退火和对应 的DNA链从退火的位点合成。使用外部引物的后续轮的PCR导致 连接的cDNA分子的扩增。
通过适当限制性位点的添加和并入到用于扩增反应的引物中的 测序引物位点的添加或者之后通过连接反应,PCR产物可以克隆到 用于测序的合适载体中。
实施例52:使用通用序列重叠-延伸引物产生具有两个内部条码的连接的抗体重 链和轻链对
如图1中所示,单个B细胞可以通过流式细胞术从血液、整批 外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B 细胞或其它B细胞群体分选。B细胞单一细胞分选到96-孔PCR板 中,留下一列空白孔作为阴性对照。图19描述了可用于在两个连接 的目标多核苷酸之间引入两个内部条码的方法的一般方法学。可用 于抗体重链和轻链的引物和寡核苷酸显示于表31中。限制性位点 AsiSI和PacI包括在RT寡核苷酸中。样品-ID序列显示于表2中。
图19中显示的方法依赖于cDNA合成反应过程中反转录酶的3’ 加尾和模板转换活性。在这一实例中,添加到寡(dT)引发的cDNA 上的3’C尾可用于携带通用序列和条码的接合体分子与待接合的各 cDNA退火。反转录酶的模板转换性质添加这些序列到其相应cDNA的3’端。使用带有互补重叠-延伸序列的针对通用序列的引物与外部 LC和HC特异性引物结合进行的后续重叠-延伸PCR产生其中LC 用LC和HC之间的两个内部条码连接到HC上的结构,如图19中 所示。
通过适当限制性位点的添加和并入到用于扩增反应的引物中的 测序引物位点的添加或者之后通过连接反应,PCR产物可以克隆到 用于测序的合适载体中。
实施例53:使用重叠-延伸接合体产生具有两个内部条码的连接的抗体重链和轻 链对
如图1中所示,单个B细胞可以通过流式细胞术从血液、整批 外周血单核细胞(PBMC)、整批B细胞、浆母细胞、浆细胞、记忆B 细胞或其它B细胞群体分选。B细胞经单一细胞分选到96-孔PCR 板中,留下一列空白孔作为阴性对照。图20描述了可用于在两个连 接的目标多核苷酸之间引入两个内部条码的另一方法的一般方法 学。可用于抗体重链和轻链的引物和寡核苷酸显示于表32中。限制 性位点AsiSI和PacI包括在RT寡核苷酸中。样品-ID序列显示于表中。
图20中显示的方法也依赖于cDNA合成反应过程中反转录酶的 3’加尾和模板转换活性。在这一实例中,添加到使用基因特异性引物 合成的cDNA上的3’C尾可用于带有自身互补或回文重叠-延伸序列 和条码的接合体分子与待接合的各cDNA退火。反转录酶的模板转 换性质添加这些序列到其相应cDNA的3’端。添加到LC和HC cDNA 上的重叠-延伸序列的后续退火在重叠的位点将它们连接到一起。使 用对于LC和HC的外部引物的重叠-延伸PCR导致其中LC用LC 和HC之间的两个内部条码连接到HC上的结构,如图20中所示。
通过适当限制性位点的添加和并入到用于扩增反应的引物中的 测序引物位点的添加或者之后通过连接反应,PCR产物可以克隆到 用于测序的合适载体中。
实施例54:添加条码的不同方法的研究
我们研究了可以在反转录或扩增反应过程中使用包含条码序列 的寡核苷酸添加条码序列的多种方法。我们测试了通过将条码并入 基因特异性引物(GSP)中和可通过模板转换添加到cDNA的3’端的含 一个或多个G的寡核苷酸中的条码添加。基于文献和我们的科学知 识,我们的预期是我们能够使用5’条码标记的寡核苷酸或3’条码标 记的GSP有效地条码标记cDNA。
如图21中表明的,RT用1μg总PBMC RNA和0.5μM univ_seq_2模板转换寡聚体及具有另外的5’侧翼序列的0.1μM IgKC_v3GSP(道1-2)和IgLC_v5GSP(道3-4)进行,其中第一部分是 Fixed_PCR3序列,且最后8bp AACAATAC是条码。RT反应使用 NucleoTraPCR(Macherey-Nagel)清洁并溶解在50μl终体积中。2μl 的这一反应用于各后续PCR反应中,其使用内部5’VK(道1)或VL (道3)引物或Univ_seq_2(道2和4)作为5’引物及Fixed_PCR3作为3’ 引物。注意,VK引物对于κV基因1和2是特异性的,且VL引物对 于λV基因2是特异性的。序列在表33中。如可看到的,道2和4 中的PCR产物分析为弥散条带。相反地,内部5’引物产生明显不同 的条带(道1和3),表明引物对发挥作用,且在道1和3中显示的弥 散可能不归因于设计不良的引物。由于寡核苷酸添加到所有全长反 转录eDNA序列上,当在使用univ_seq_2和3’条码标记的GSP的 PCR扩增过程中获得弥散条带时,这表明使用条码标记的GSP的反 转录在RT反应中产生非特异性引发的核酸序列。我们的结果表明5’ 通用序列接合体和3’条码标记的引物的使用不是用于B细胞或其它 细胞表达的免疫球蛋白或其它基因的条码标记和特异性扩增的良好 策略。
事后看来,DNA的几种生物学性质和使用的分子反应可能导 致我们观察的现象。反转录通常在低温如42℃或56℃下进行。与 PCR不同,在退火步骤通常在仅略低于引物的Tm的温度下进行以 促进引发的特异性的情况中,这不能对于反转录进行,因为反转录 酶在高温下失活。因此,在RT过程中使用的基因特异性引物通常对 于目标基因不是非常特异的,因为反应在比引物的Tm高得多的温度 下进行。在这种情况下,引物也可以结合具有一些错配的脱靶mRNA 序列,并发生错误引发(mispriming)。如果条码添加到GSP上, 引物也必须具有用于后续PCR中的条码5’侧的固定序列。这使得引 物非常长(~60nt),从而产生具有甚至高得多的错误引发程度的引物。 但是,PCR过程中的特异性扩增通常仍可通过使用高度基因特异性 正向引物实现;只要引物对的一个成员是特异性的,通常可以存在 特异性扩增,如道1和3中所示。
如果模板转换技术用于添加接合体,该接合体添加到经合成以 形成第一链cDNA的所有mRNA上。如上所述,条码标记的GSP将 具有显著量的错误引发,特别地由于RT酶Superscript III在56℃下 丧失其模板转换活性且反转录在42℃下进行。特定的嵌套5’或3’ 引物不能使用,因为其将丧失其PCR扩增所有免疫球蛋白基因(因 此由于可变V基因必须借助于使用多个简并5’引物的多重PCR)的 能力或丧失3’条码。因此,条码标记的GSP不适合用于模板转换添 加的接合体或任何其它5’接合体,因为添加5’接合体的其它方法如TdT加尾或平端克隆也无区别地添加接合体。因此,内部3’引物或 者嵌套或半嵌套的PCR扩增策略也是需要的,且条码标记的3’GSP 不允许使用这些策略进行来自B细胞或其它细胞的基因的特异性扩 增。基于我们的结果,也预计条码标记的寡(dT)出于我们认为条码标记的GSP表现不良的多种相同理由而表现不良。这些理由包括但不 限于不能使用内部3’引物或者用于来自B细胞或其它细胞的基因的 特异性扩增的嵌套或半嵌套PCR策略。
相反,我们的结果(参见其它实施例)证明了使用包含条码序 列和与在反转录反应过程中生成的cDNA的3’尾退火的接合体的引 物在反转录反应过程中进行条码序列添加的优越性。在这样的实施 方式中,接合体序列可以包含条码序列且可以用于标记编码抗体重 链和轻链的基因。因此,如本文中公开的,模板转换或任何其它cDNA 加尾的方法添加可用于PCR扩增的序列而无需预先了解5’序列本 身,使得能够有效和无偏地表示抗体谱。此外,这一途径允许获得 编码抗体以外的蛋白质的其它共表达基因的组库。另外,使用模板转换接合体的途径具有优于本领域中公开的使用简并正向引物组扩 增多个V基因的方法的明显优势。这些方法也不能捕获整个抗体谱, 因为已知的5′引物组:a)覆盖大多数而不是整个谱集合;b)不能够覆 盖人类群体中迄今为止已知的V基因变异体(多态性);和c)可能 不能有效扩增已发生广泛体细胞超变(SHM)的抗体序列。SHM效应 的实例参见,例如,Scheid等,Sciencexpress,14July 2011。
因此,模板转换接合体用于制备表达的基因(例如抗体重链和 轻链)的文库通过允许无偏地表示特定基因家族和其它共表达基因 而提供了优于本领域中已知的其它方法的明显优势。模板转换接合 体或使用任何其它方法(例如但不限于TdT加尾和平端连接)添加 的5’接合体的使用也与条码标记的5’接合体而不是条码标记的3’ GSP或条码标记的寡(dT)更相容,理由如上所述。
实施例55:在流式细胞仪上通过前向散射和/或侧向散射和/或与其它细胞标志物 结合分选浆母细胞
浆母细胞是激活的、已增殖/正在增殖和已发生亲和力成熟的未 成熟B细胞。浆母细胞代表活性免疫应答,且通过实施本发明的方 法和组合物允许利用结合目标靶抗原(无论是感染、疫苗、自身免 疫或癌抗原)的抗体的克隆家族来生物信息学构建进化树。
浆母细胞是未成熟B细胞且大于静息B细胞(图40A-B)。因此 浆母细胞可以在流式细胞仪上使用其前向散射和侧向散射性质分 选。如图40c中所示,浆母细胞具有大于其它CD20+B细胞的中值 FSC-A~1.29-1.66x的中值FSC-A,具有大于静息CD20+B细胞的 1.04-1.16x的中值FSC-W。浆母细胞也具有单核细胞中值FSC-A的 0.85-0.98x的中值FSC-A和单核细胞中值FSC-W的0.92-1.02x的中 值FSC-W,如通过95%置信区间确定的。此处FSC-A和FSC-H可 以是可互换的且是等同的,因为FSC-A和FSC-H在校准的流式细胞 仪上缩放以给出相同的值。对于SSC-A(和SSC-H,由于缩放)和 SSC-W类似地,浆母细胞具有作为CD20+B细胞中值SSC-A的 0.74-2.56x和单核细胞中值SSC-A的0.21-0.84x的中值SSC-A,和作 为CD20+B细胞中值SSC-W的1.01-1.20x和单核细胞中值SSC-W 的0.82-1.03x的中值SSC-W。浆母细胞与B细胞的比率是与淋巴细 胞的比率典型的,因为静息淋巴细胞尺寸上是相似的。
鉴别浆母细胞的可选方式是使用浆母细胞的20分位FSC或SSC 与CD20+B细胞或单核细胞的中值FSC或SSC(图40D),其是CD20+ B细胞中值FSC-A(FSC-W)的1.04-1.50x(1.02-1.11x)和单核细胞中值 FSC-A(FSC-W)的0.70-0.88x(0.88-1.00x)。浆母细胞具有作为CD20+ B细胞中值SSC-A(SSC-W)的0.67-1.89x(0.99-1.11x)和单核细胞中值 SSC-A(SSC-W)的0.20-0.62x(0.77-0.99x)的20分位SSC-A(SSC-W)。 这些数值允许包括80%的浆母细胞和排除其它淋巴细胞的选通截止。 这允许与单色或双色染色剂结合使用FSC(和/或SSC)以在单一细胞 分选的浆母细胞中选通浆母细胞。这样的组合可以包括 FSChiCD19lo(图39b)、CD19+FSChi(图39c)、CD19+FSChiCD20-(图39d)、 CD19+FSChiCD38hi(图39e)和CD19+FSChiCD27+(图39f)。分选的细胞 然后可以进行RT、用于条码标记的PCR,如在“材料和方法”的“非降 落PCR”中完成的。用于测序、克隆和表达的下游准备按照实施例6 和8中进行。注意给出的比率是95%置信区间的比率,或其中95%的 比率应落入该范围。
实施例56:在任何筛分装置如微流体装置上通过大小分选浆母细胞
浆母细胞是激活的、已增殖/正在增殖和已发生亲和力成熟的未 成熟B细胞。浆母细胞代表活性免疫应答,且通过实施本发明的方 法和组合物允许利用结合目标靶抗原(无论是感染、疫苗、自身免 疫或癌抗原)的抗体的克隆家族来生物信息学构建进化树。
浆母细胞是未成熟B细胞且大于静息B细胞。浆母细胞和CD20+ B细胞经FACS分选并用台盼蓝染色以排除死细胞和以200x放大倍 率成像。成像52个浆母细胞和51个CD20+B细胞并用ImageJ测量 细胞面积。成像的浆母细胞的直径为7.8-13uM,面积为48-121uM2和体积为251-996uM3。CD20+B细胞不是未成熟的且是较小的,大 部分的直径为6-8uM,或小于50uM2,或小于268uM3,其中51个 细胞中仅4个细胞大于该值(图41)。能够分离直径大于或小于8uM 或者面积大于或小于50uM2或者体积大于或小于268uM3的筛分装置 能够将浆母细胞与CD20+静息B细胞分离,捕获96%的浆母细胞和 筛分掉92%的静息B细胞。这样的装置可以是具有8uM直径孔的细 筛或具有仅允许或阻止直径大于8uM或者面积大于50uM2或者体积 大于268uM3的细胞通过的微流体装置。这些细胞然后可以在微流体 装置中通过致动器/泵分选到孔中,以使得仅存在一个或一些细胞/ 孔,且然后RT、用于条码标记的PCR使用相同试剂浓度如“材料和 方法”的“非降落PCR”中进行。用于测序、克隆和表达的下游制备如 实施例6和8中进行。
实施例57:抗金黄色葡萄球菌抗体增强嗜中性细胞系的金黄色 葡萄球菌细胞吞噬
发生针对其金黄色葡萄球菌感染的有效免疫应答的具有金黄色 葡萄球菌感染的人,例如清除金黄色葡萄球菌感染而不需要抗生素 疗法的人,用作染色和分选外周血浆母细胞的外周血的来源。浆母 细胞如“材料和方法”的“非降落PCR”中详细描述的进行单一细胞分 选条码标记,并如“材料和方法”的“准备用于454 XLR70测序”中详 细描述的准备用于测序。进化树通过生物信息学方法构建且各克隆 家族的一些选择的代表性克隆如实施例8中进行选择和克隆用于表 达为重组抗体。金黄色葡萄球菌Wood菌株(其为~5%蛋白质A阳 性的)接种在5%胰酶解酪蛋白大豆琼脂(TCA)血液琼脂上且集落生 长并保持在4℃下作为原种。这一原种每周通过挑取另一集落更新。 1mL的这一原种用于接种金黄色葡萄球菌生长直到OD550=0.5,其 为大致对数生长中期。金黄色葡萄球菌在室温下在4%多聚甲醛(PFA) 中轻度固定15分钟并用Hanks平衡盐溶液(HBSS)洗涤一次,然后室 温下用1uMCFSE染色15分钟。固定的细菌然后洗涤并与10ug/ml 表达的重组抗金黄色葡萄球菌抗体或作为阴性对照的10ug/ml表达 的抗流感病毒抗体一起孵育。然后细菌洗涤两次。HL-60(一种嗜中 性细胞系)用25uM视黄酸活化96hr,并用1∶1至1∶100比率的标记 的固定细菌在37℃下孵育45分钟,在96孔板中以300rpm轻轻振 摇。HL-60然后洗涤两次并在流式细胞仪上分析。HL-60中标记的 CFSE的量是细胞吞噬的金黄色葡萄球菌量的指示。一些表达的抗金黄色葡萄球菌抗体将结合葡萄球菌细胞表面蛋白质和调理细菌,从 而导致细胞吞噬增加。
实施例58:抗金黄色葡萄球菌抗体增强嗜中性白细胞介导的金黄色葡萄球菌杀灭
能够有效控制和/或清除其金黄色葡萄球菌感染的人如在上述相 关实施例中进行选择,且分离浆母细胞并单一细胞分选以用于如在 上述相关实施例中测序及克隆和表达。金黄色葡萄球菌临床分离物 接种在5%TCA血液琼脂上且集落生长和作为原种保持在4℃下。 这一原种通过挑取另一集落每周更新。1mL的这一原种用于接种金 黄色葡萄球菌生长直到OD550=0.5,其为大致对数生长中期。金黄 色葡萄球菌然后与2ug/ml的表达抗金黄色葡萄球菌抗体在4C下孵 育30分钟,然后洗涤两次。HL-60嗜中性白细胞用25uM视黄酸活化96hr,并用1∶1至1∶100比率的幼兔补体和金黄色葡萄球菌在37℃ 下孵育45分钟,在96孔板中以300rpm振摇。HL-60细胞然后快速 置于冰上并洗涤3x以移除松散连接的金黄色葡萄球菌。细胞外金黄 色葡萄球菌然后系列稀释并接种在5%TSA血液琼脂上和在37℃下 培养过夜。第二天计数集落以确定集落形成单位(CFU)的数目。通过 特定抗金黄色葡萄球菌重组抗体(在与金黄色葡萄球菌孵育后)的 CFU的降低证明那些抗体有效介导增强的细胞吞噬作用和通过细胞 HL-60杀灭金黄色葡萄球菌或降低其生长(图46)。
实施例59:在小鼠模型中使用表达的抗金黄色葡萄球菌抗体治疗金黄色葡萄球菌 感染的小鼠
如在实施例58中表现出体外杀灭、降低生长或结合活性的抗金 黄色葡萄球菌抗体也可以具有体内活性。具有杀灭活性的抗金黄色 葡萄球菌抗体如实施例55-58中从能够控制其葡萄球菌感染的金黄 色葡萄球菌感染的人分离。小鼠给予致死剂量的金黄色葡萄球菌且 然后使用对照抗体或表现出体外杀灭、降低生长或结合活性的重组 抗金黄色葡萄球菌抗体治疗。如果小鼠如通过Kaplan-Meier生存测 试确定的具有较长生存期或降低的感染严重性,它们视为获得保护。 源自控制或减轻其金黄色葡萄球菌感染的严重性的抗金黄色葡萄球 菌抗体因而评价其赋予针对金黄色葡萄球菌的被动保护的能力。
实施例60:有效的抗金黄色葡萄球菌免疫应答的抗原靶标用于 开发疫苗
由表现出杀灭、降低生长或结合活性的金黄色葡萄球菌抗体所 靶向的金黄色葡萄球菌抗原是金黄色葡萄球菌疫苗的良好候选。发 生针对那些特异性抗原的强应答的疫苗可以获得针对金黄色葡萄球 菌感染的保护或表现出降低的金黄色葡萄球菌感染的严重程度。具 有杀灭、降低生长或结合活性的抗金黄色葡萄球菌抗体从能够控制 其金黄色葡萄球菌感染的金黄色葡萄球菌感染的人分离,且如实施 例55-58中使用质谱鉴别其靶抗原。小鼠用模拟载体进行疫苗接种或 用候选金黄色葡萄球菌抗原进行疫苗接种,且然后在两个月时间内 加强两次。小鼠可以单独地或组合地用候选金黄色葡萄球菌抗原进 行免疫。抗金黄色葡萄球菌抗原抗体效价通过ELISA证实。小鼠然 后用致死剂量的金黄色葡萄球菌激发。如果小鼠如通过Kaplan-Meier 生存测试确定的具有较长生存期,它们视为获得针对金黄色葡萄球 菌的保护。因此针对这些选择的金黄色葡萄球菌抗原的免疫赋予保 护或降低感染的严重性,从而表明本文中的组合物和方法可有助于 疫苗设计。
实施例61:使用在人体中具有体内杀灭、降低生长或结合活性的重组抗金黄色葡 萄球菌抗体治疗金黄色葡萄球菌感染的人
源自控制其金黄色葡萄球菌感染的人,并且如实施例55-59中表 现体外和体内杀灭、减少生长或结合活性的抗体可以用于治疗金黄 色葡萄球菌感染的患者。获得抗体并如实施例55-59中测试体外和体 内杀灭活性。良好生产作业(GMP)生产的抗金黄色葡萄球菌单克隆抗 体可以静脉内或皮下给予金黄色葡萄球菌感染的人,特别是被甲氧 西林抗性金黄色葡萄球菌(MRSA)或其它药物抗性金黄色葡萄球菌 感染的患者,并与抗生素一起进行效力比较。如果患者获得针对侵 袭性金黄色葡萄球菌感染的保护,具有较不严重的金黄色葡萄球菌 感染和/或与单独给予抗生素或未给予抗生素的患者相比更快地恢 复,则抗金黄色葡萄球菌抗体视为具有治疗效用。重组抗金黄色葡 萄球菌抗体可以治疗性地给予具有活性金黄色葡萄球菌感染的患者 以降低感染的严重程度和/或增强感染的清除以及预防性地给予高风 险患者群体如进行肾衰竭的血液透析的患者、接收住院的患者或对 金黄色葡萄球菌或MRSA筛选阳性的患者。
实施例62:使用鉴别的金黄色葡萄球菌抗原的金黄色葡萄球菌 疫苗接种以在人体中产生保护性免疫
由在体内表现出杀灭或结合活性的金黄色葡萄球菌抗体所靶向 的且在小鼠模型中进行疫苗接种时产生针对金黄色葡萄球菌激发的 保护的金黄色葡萄球菌抗原可能是人体中预防性疫苗的良好候选。 抗金黄色葡萄球菌抗体源自控制其金黄色葡萄球菌感染的人,并且 如实施例55-58和59中在小鼠中作为疫苗候选者被克隆、表达和测 试其体内杀灭、减少生长或结合活性。然后给予人含作为抗金黄色 葡萄球菌抗体靶标的金黄色葡萄球菌抗原的金黄色葡萄球菌疫苗, 该金黄色葡萄球菌抗体具有杀灭、减少生长或结合活性,以安慰剂 作为对照。追踪同龄组的金黄色葡萄球菌感染的发生率或严重程度。 如果其降低疫苗接种的同龄组与安慰剂同龄组相比的金黄色葡萄球 菌感染的发生率或严重程度,则疫苗被视为成功的。
实施例63:由作为关联保护的候选金黄色葡萄球菌疫苗诱导的免疫应答的监测
在如实施例62中用候选金黄色葡萄球菌疫苗对人进行免疫后, 免疫应答可以通过确定是否诱生抗目标金黄色葡萄球菌靶抗原的稳 定克隆家族来监测。血液在疫苗接种后7-14天抽取,且浆母细胞如 “材料和方法”的“非降落PCR”和“准备用于454 XLR70测序”中详细 描述的进行单一细胞分选、条码标记和454测序。绘制进化树且然 后各克隆家族的2-3个成员如实施例8中进行克隆和表达,并在 ELISA中测试其与目标葡萄球菌抗原的结合。我们预期具有强的疫 苗诱导抗金黄色葡萄球菌免疫应答的人表现出针对有效人免疫应答 中靶向的金黄色葡萄球菌抗原的大的克隆家族。这一途径具有提供 金黄色葡萄球菌疫苗的关联保护的潜力且如此能够使得临床试验和 开发更为流畅。这一抗体和/或TCR免疫组库监测使得能够快速评估 候选疫苗提供疗效的可能性。
实施例64:使用重组抗-肺腺癌抗体治疗患有肺腺癌的小鼠
结合细胞表面蛋白质或其它肺腺癌蛋白质的抗-肺腺癌抗体可以 用作将毒素靶向于肺腺癌细胞或靶向肺腺癌细胞表达的其它分子的 载体。具有细胞表面结合活性的抗-肺腺癌抗体或其它肺腺癌抗原如 实施例11中从长期非进展者肺腺癌患者分离。裸鼠给予皮下注射的 H 1650肺腺癌细胞系,且允许肿瘤生长一周。抗肺腺癌抗体然后与 毒素如缺乏R-结构域(其为细胞结合结构域并允许白喉毒素进入细 胞)的白喉毒素偶联。因此缺乏R-结构域的白喉毒素仅对于抗体与 之结合并递送白喉毒素有效负载的肺腺癌细胞是致死性的。与无R 结构域的白喉毒素偶联的对照抗体用作对照。如果肿瘤负荷比对照 中降低更多,则肺腺癌抗体视为已成功递送其有效负载以杀死肺腺 癌细胞。或者,在某些情况中,重组抗体本身可能能够介导肿瘤细 胞杀灭或防止肿瘤细胞生长(在不存在偶联的毒素的情况下)。
实施例65:使用表达的抗-肺腺癌抗体治疗肺腺癌患者
结合细胞表面抗原的抗-肺腺癌抗体可以用作将毒素靶向于肺腺 癌细胞的载体。具有细胞表面结合活性的抗-肺腺癌抗体如实施例11 中从长期非进展者肺腺癌患者分离。GMP单克隆抗体或其它抗-肺腺 癌单克隆抗体可以静脉内或皮下给予肺腺癌患者,特别是给予其活 检的肺腺癌细胞表达高水平的被该单克隆抗体靶向的细胞表面抗原 的患者。重组单克隆抗体肺腺癌抗原或来自其所来源的克隆家族的 其它成员可以用于免疫组织化学染色单个患者的肺腺癌的活检样本 以得到关于肿瘤抗原表达水平的信息,且该信息可用于确定是否单 个患者可能对该单克隆抗体治疗有反应。抗-肺腺癌抗体可以与毒素 偶联,如缺乏R-结构域(其为细胞结合结构域并允许白喉毒素进入 细胞中)的白喉毒素。因此缺乏R-结构域的白喉毒素仅对于抗体与 之结合并递送白喉毒素有效负载的肺腺癌细胞是致死性的。标准护 理的化疗用于治疗对比者组。如果患者存活较长时间或者在复发或 进展前表现出较长的时间,抗-腺癌抗体视为已递送其有效负载且具 有治疗效用。或者,在某些情况中,抗肺腺癌抗原的重组抗体本身 可能能够介导肿瘤细胞杀灭或防止肿瘤细胞生长(在不存在偶联的 毒素的情况下)。
实施例66:人中使用鉴别的抗原的肺腺癌治疗性疫苗接种
由抗肺腺癌抗体结合的细胞表面抗原可以用于治疗性疫苗中以 治疗确立的肺腺癌或保护以避免肺腺癌的发生。具有细胞表面结合 活性的抗肺腺癌抗体如实施例11中从长期非进展者肺腺癌患者分 离,并使用免疫沉淀或免疫印迹和质谱鉴别靶抗原。受接种者给予 含目标肺腺癌抗原的疫苗或对照疫苗。然后遵循同龄组并追踪肺腺 癌的发生率或进展。如果用靶抗原接种的人与标准护理对比者组相 比具有延长的存活期或延长的复发时间,则疫苗被视为成功的。
实施例67:肺腺癌疫苗接种用于应答效力的免疫监测
在如实施例66中用肺腺癌疫苗对人进行免疫后,疫苗反应可以 通过确定是否诱生抗疫苗中的目标腺癌抗原的稳定克隆家族而监 测。在疫苗接种后7-14天之间抽血且浆母细胞进行单一细胞分选和 条码标记,并且如“材料和方法”的“非降落-PCR”和“准备用于454 XLR70测序”中详细描述的进行454测序。绘制进化树并且各克隆家 族的2-3个成员然后如实施例8中克隆和表达并在ELISA中测试其 与目标葡萄球菌抗原的结合。我们预期具有强免疫应答的人将具有 针对目标肺腺癌抗原的大的克隆家族和/或许多抗目标肺腺癌抗原的 克隆家族。这种免疫监测允许我们快速预测候选疫苗的效力。
实施例68.Superscript III在反转录过程中用于模板转换的用途
在我们的方法中,样品识别区域和接合体区域在反转录过程中 添加。这利用了RNA酶H-反转录酶的3′加尾活性和模板转换活性。 最通常地,反转录酶如Superscript II(Invitrogen)在其42℃的工作温 度下使用。也已针对热稳定性工程化的具有50℃的推荐工作温度的 MMLV H-反转录酶如Superscript III报告为不具有这种3′加尾活性且 因此不具有模板转换能力 (http://tools.invitrogen.com/content/sfs/ProductNotes/F_Superscript%20 III%20Enzyme%20RD-MKT-TL-HL0506021.pdf?ProductNoteId=36)。但是,在图42中,我们证明Superscript III确实具有3′加尾和模板转 换活性。这种性能在50℃(Superscript III的推荐反转录温度)下是 弱的,且可以解释为什么SuperscriptIII的3′加尾活性之前未报道。 但是,随着RT温度从50℃降低到45.5℃再降低到42℃,3′加尾活 性和模板转换显著提高。我们预期所有已针对热稳定性工程化的 MMLV RNA酶H-反转录酶在较低工作温度(即42℃至50℃)下也 具有3′加尾活性。
实施例69.共表达基因的分析以鉴别与记忆B细胞和浆细胞反应相关的以及归巢 于特定组织的抗体
由B细胞、T细胞或如所描述的通过本发明的方法和组合物分 选到单独孔中的其它细胞产生的所有cDNA的条码标记使得能够表 征浆母细胞、其它B细胞、T细胞和单一细胞水平的其它细胞中的 基因共表达。这使得能够使用共表达的基因以鉴别由已经过诱导以分化成记忆B细胞、浆细胞、记忆T细胞、特定类型的效应T细胞 (例如Th1、Th2、Th17或T-调节T细胞)或诱导以归巢到特定组 织或位点(例如,胃肠道、皮肤或脑)的B和T细胞表达的特定抗 体和TCR。由特定样品中的单个细胞或细胞集产生的所有cDNA的 条码标记使得能够对于第一和第二PCR使用另外的3’PCR引物以鉴 定特定的这类基因的共表达。5’引物保持与用于扩增可变区基因的那 些相同。此外,共表达的基因的分析使克隆家族的亲和力成熟和与B 细胞分化成记忆B细胞、短寿浆母细胞和长寿浆细胞相关的基因的 共表达(表34)、原始或记忆T细胞分化成Tregs或Th1、Th2、Th17 细胞(表35)或者B或T细胞归巢到特定位点之间关系的生物信息 学分析成为可能。这样的分析可进一步准确地确定介导有效免疫应答的关键抗体或TCR。
例如,源自发生免疫应答的个体的PMBC用于单一细胞分选浆 母细胞。本文的方法和组合物用于分析与浆母细胞归巢到不同组织 中相关的基因的共表达(参见表36)。数据集的生物信息学分析鉴 别与不同身体位置处的分泌相关的抗体。这些抗体基因然后重组地 表达以如实施例8中在体外筛选分析中表征。
相关领域的技术人员应当理解,可以在本发明中进行形式和细 节的各种变化而不脱离本发明各个方面的精神和范围。
必须注意,如说明书和所附权利要求中使用的,单数形式“一”、 “一个”和“该”包括复数指代,除非上下文明确指示另外的情况。
本说明书文本中引用的所有参考文献、授权的专利和专利申请 为了所有目的通过引用全文并入本文。
表格
一般参考文献
Burbelo,P.D.,S.K.Browne等(2010).″Anti-cytokine autoantibodies areassociated with opportunistic infection in patients with thymic neoplasia.″Blood116(23):4848-4858.
Hua,J.,K.Kirou等(2006).″Functional assay of type I interferon insystemic lupus erythematosus plasma and association with anti-RNA bindingprotein autoantibodies.″Arthritis Rheum54(6):1906-1916.
May,L.T.,R.Neta等(1993).″Antibodies chaperone circulating IL-6.Paradoxical effects of anti-IL-6″neutralizing″antibodies in Vivo.″ J Immunol151(6):3225-3236.
Mostbock,S.(2009).″Cytokine/Antibody complexes:an emerging class ofimmunostimulants.″Curr Pharm Des15(7):809-825.
Robinson,W.H.,C.DiGennaro等(2002).″Autoantigen microarrays formultiplex characterization of autoantibody responses.″ Nat Med8(3):295-301.
Watanabe,M.,K.Uchida等(2007).″Anti-cytokine autoantibodies areubiquitous in healthy individuals.″FEBS Lett581(10):2017-2021.
Wildbaum,G.,M.A.Nahir等(2003).″Beneficial autoimmunity toproinflammatory mediators restrains the consequences of self-destructiveimmunity.″Immunity19(5):679-688.
Wrammert,J.,K.Smith等(2008).″Rapid cloning of high-affinity humanmonoclonal antibodies against influenza virus.″Nature 453(7195):667-671.

Claims (68)

1.一种包含多个组合物的多核苷酸文库,其中所述多个组合物包含编码属于相同克隆家族的可变区域的cDNA,其中
各组合物存在于单独的容器中;
所述组合物包含单一样品来源的cDNA分子,该单一样品包含单一亲和力成熟的B细胞,其中所述cDNA分子与样品识别区域共价连接,且所述样品识别区域的核苷酸序列不同于文库中其它单独容器中存在的其它组合物的样品识别区域的核苷酸序列;和
其中所述单一样品来源的cDNA分子包含编码免疫球蛋白重链可变区的cDNA分子和编码免疫球蛋白轻链可变区的cDNA分子,且
其中所述单独的容器中的cDNA分子编码免疫球蛋白重链和轻链可变区的同源对。
2.权利要求1的文库,其中所述cDNA分子通过接合体区域连接于所述样品识别区域。
3.权利要求2的文库,其中所述cDNA分子包含在其3’端的核苷酸C。
4.权利要求1的文库,其中所述属于相同克隆家族的可变区域是B细胞免疫球蛋白可变区。
5.权利要求1的文库,其中所述组合物还包含连接于所述样品识别区域的通用引物区域,且其中所述通用引物区域在各单独容器中是基本上相同的。
6.权利要求1的文库,其中所述单一样品是单一B细胞。
7.权利要求6的文库,其中来自单一B细胞的所述cDNA分子包含编码免疫球蛋白重链和轻链可变区的同源对的cDNA分子。
8.权利要求6的文库,其中所述单一B细胞是单一浆母细胞。
9.权利要求8的文库,其中来自单一浆母细胞的所述多个cDNA分子包含编码免疫球蛋白重链和轻链可变区的同源对的cDNA分子。
10.一种包含多个组合物的多核苷酸文库,其中
各组合物存在于单独的容器中;
所述组合物包含:
单一样品来源的多个cDNA分子,该单一样品包含单一亲和力成熟的B细胞,各cDNA分子包含3’端的核苷酸C,和
样品识别-接合体区域,其包含与接合体区域偶联的样品识别区域;
各样品识别-接合体区域的所述样品识别区域的核苷酸序列不同于文库中其它单独容器中存在的其它组合物的样品识别-接合体区域的样品识别区域的核苷酸序列;且
所述样品识别-接合体区域共价连接于所述组合物中的cDNA分子,
其中所述单一样品来源的cDNA分子包含编码免疫球蛋白重链可变区的cDNA分子和编码免疫球蛋白轻链可变区的cDNA分子,且
其中所述单独的容器中的cDNA分子编码(a)免疫球蛋白重链和轻链可变区的同源对或(b)T细胞受体α链和β链序列的同源对。
11.权利要求10的文库,其中各cDNA分子包含可变区域。
12.权利要求11的文库,其中所述可变区域是B细胞免疫球蛋白可变区。
13.权利要求10的文库,其中各组合物还包含与所述样品识别-接合体区域的所述样品识别区域连接的通用引物区域,且其中所述通用引物区域在各单独容器中是基本上相同的。
14.权利要求10的文库,其中所述单一B细胞是浆母细胞。
15.一种用于产生一个或多个目标多核苷酸的方法,包括:
获得权利要求1-14中任一项所述的文库;和
利用引物组扩增所述多核苷酸文库以产生所述一个或多个目标多核苷酸。
16.权利要求15的方法,进一步包括:对所述一个或多个目标多核苷酸测序;和选择一个或多个目标多核苷酸。
17.权利要求15的方法,其中所述引物组包含一个或多个3’基因特异性引物及任选的5’通用引物。
18.一种用于分析和使用测序数据的方法,包括:
获得与获自权利要求1-9中任一项的文库的多个多核苷酸相关的数据集,其中所述数据集包含所述多个多核苷酸的测序数据,其中所述多个多核苷酸中的各多核苷酸包含样品识别区域,其中各多核苷酸的样品识别区域对于单一样品是独特的,使得来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于所述多个多核苷酸中其它多核苷酸的样品识别区域的序列,该其它多核苷酸来自于与所述第一单一样品不同的一个或多个样品;
通过计算机分析所述数据集以将与具有相同样品识别区域的多核苷酸相关的数据匹配在一起,其中匹配表示所述多核苷酸来源于相同的样品;和
选择一个或多个多核苷酸并克隆该一个或多个多核苷酸。
19.权利要求1的文库,其中所述cDNA分子和所述样品识别区域合并到相同的DNA链中。
20.权利要求1的文库,其中所述cDNA分子使用逆转录酶与所述样品识别区域共价连接。
21.权利要求1的文库,其中所述组合物进一步包含与(i)所述cDNA分子的至少一部分和(ii)所述样品识别区域互补的DNA分子。
22.权利要求3的文库,其中所述cDNA分子包含在其3’端的序列CCC。
23.权利要求1的文库,其中所述组合物中编码可变区域的所有cDNA分子来源于相同的细胞。
24.权利要求1的文库,其中一部分的所述重链可变区和轻链可变区显示出至少80-99%的序列同一性。
25.权利要求1的文库,其中所有所述重链可变区和轻链可变区显示出至少80-99%的序列同一性。
26.权利要求1或10的文库,其中所述重链可变区和轻链可变区是误差校正的。
27.权利要求26的文库,其中所述文库与非源自包含单一B细胞的单一样品的文库相比包含降低的测序误差。
28.一种基于第一目标多核苷酸的选择识别第二目标多核苷酸的方法,包括:
(a)获得与多个多核苷酸相关的数据集,其中所述数据集包含所述多个多核苷酸的测序数据,其中所述多个多核苷酸的各多核苷酸包含样品识别区域,且其中各多核苷酸上的各样品识别区域对于单一样品是独特的,从而将所述多个多核苷酸中的各多核苷酸与单一样品相关联,其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列;和
(b)从所述数据集选择与第一单一样品相关的第一目标多核苷酸和基于所述第一目标多核苷酸的样品识别区域识别所述第一单一样品中的第二目标多核苷酸。
29.权利要求28的方法,其中所述第一单一样品包含多个B细胞。
30.权利要求28的方法,其中所述第一单一样品包含单一B细胞。
31.权利要求28的方法,其中所述第一单一样品包含多个T细胞。
32.权利要求28的方法,其中所述第一单一样品包含单一T细胞。
33.权利要求29的方法,其中:
(a)其中所述第一目标多核苷酸包含抗体轻链可变区核苷酸序列,且其中所述第二目标多核苷酸包含抗体重链可变核苷酸序列;或
(b)所述第一目标多核苷酸包含抗体重链可变区核苷酸序列,且其中所述第二目标多核苷酸包含抗体轻链可变区核苷酸序列。
34.权利要求28-33任一项的方法,其中所述多核苷酸是cDNA。
35.权利要求28-34任一项的方法,其中获得所述数据集包括获得所述多个多核苷酸并对所述多个多核苷酸测序以通过实验确定所述数据集。
36.权利要求28-35任一项的方法,其中获得所述数据集包括直接或间接地从已经对所述多个多核苷酸测序以通过实验确定所述数据集的第三方接收所述数据集。
37.一种获得包含多个与从一个或多个受试者获得的多个样品相关的cDNA的cDNA文库的方法,其中各cDNA与所述多个样品中的单一样品相关,且其中与各个样品相关的cDNA存在于单独的容器中;
(a)将接合体分子添加到与各个样品相关的cDNA上,其中所述接合体分子包含样品识别区域和接合体区域,其中所述样品识别区域与所述接合体区域偶联,且其中各接合体分子的所述样品识别区域的序列不同于添加到存在于其它单独的容器中的与所述样品相关的cDNA上的其它接合体分子的所述样品识别区域的序列;和
(b)使所述接合体区域连接到所述文库中的各cDNA上以产生所述一个或多个目标多核苷酸。
38.权利要求37的方法,其中获得所述cDNA文库包括获得所述多个样品和处理所述样品以制备所述cDNA文库。
39.权利要求37-38任一项的方法,其中所述接合体分子进一步包含通用引物区域,其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联。
40.权利要求37-39任一项的方法,其中各样品包含细胞。
41.权利要求37-40任一项的方法,其中所述细胞是B细胞。
42.权利要求37-41任一项的方法,其中所述B细胞是浆母细胞、记忆B细胞或浆细胞。
43.权利要求37-42任一项的方法,其中各样品包含多个细胞。
44.权利要求41-43任一项的方法,其中所述cDNA包含编码抗体轻链可变区的序列和/或编码抗体重链可变区的序列。
45.权利要求37-44任一项的方法,其中获得所述cDNA文库包括直接或间接地从已经处理所述多个样品以制备所述cDNA文库的第三方接收所述cDNA文库。
46.一种用于产生一个或多个目标多核苷酸的方法,包括:
(a)获得包含与从一个或多个受试者获得的多个样品相关的多个cDNA的cDNA文库,其中各cDNA与所述多个样品中的单一样品相关,且其中与各样品相关的各cDNA存在于单独的容器中;和
(b)将接合体分子添加到与各样品相关的cDNA上以产生所述一个或多个目标多核苷酸,其中所述接合体分子包含样品识别区域和接合体区域,其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,且其中各接合体分子的所述样品识别区域的序列不同于添加到存在于其它单独的容器中的与所述样品相关的cDNA上的其它接合体分子的所述样品识别区域的序列。
47.权利要求46的方法,其中各样品包含细胞。
48.权利要求46或47的方法,其中所述细胞是B细胞。
49.权利要求46-48任一项的方法,其中各样品包含多个细胞。
50.权利要求48或49的方法,其中所述cDNA包含编码抗体轻链可变区的序列和/或编码抗体重链可变区的序列。
51.一种用于产生两个或更多个多核苷酸组合物的方法,包括:获得包含与从一个或多个受试者获得的多个样品相关的多个多核苷酸的多核苷酸文库,其中一个或多个多核苷酸包含表达的可变区多核苷酸,其中各样品与细胞相关,且其中与各样品相关的所述多核苷酸存在于单独的容器中;和通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷酸组合物,该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和所述识别区域,其中各识别区域的序列不同于文库中与其它样品相关的其它多核苷酸偶联的识别区域的序列。
52.一种用于产生两个或更多个多核苷酸组合物的方法,包括:获得包含与从一个或多个受试者获得的多个样品相关的多个多核苷酸的多核苷酸文库,其中一个或多个多核苷酸包含可变区,且其中与各样品相关的所述多核苷酸存在于单独的容器中;和通过将所述多核苷酸与识别区域偶联产生两个或更多个多核苷酸组合物,该多核苷酸组合物各包含来自所述多个多核苷酸的多核苷酸和所述识别区域,其中各识别区域的序列不同于与文库中其它多核苷酸偶联的识别区域的序列。
53.权利要求51或52的方法,其中所述可变区是B细胞免疫球蛋白可变区。
54.权利要求53的方法,其中获得所述多核苷酸文库包括获得多个B细胞并处理该细胞以制备所述多核苷酸文库。
55.权利要求53的方法,其中获得所述多核苷酸文库包括直接或间接地从已经处理多个B细胞以制备所述多核苷酸文库的第三方接收所述多核苷酸文库。
56.权利要求53-55任一项的方法,其中所述B细胞是记忆B细胞、活化B细胞或浆母细胞。
57.权利要求53-56任一项的方法,其中所述B细胞免疫球蛋白可变区包括抗体轻链区或抗体重链区。
58.权利要求53-57任一项的方法,其中所述B细胞免疫球蛋白可变区包括抗体轻链区和抗体重链区。
59.一种产生一个或多个用于测序的目标多核苷酸的方法,包括:
a.获得包含多个多核苷酸的多核苷酸文库,其中各多核苷酸包含通用引物区域、样品识别区域、接合体区域和来自于单一样品的扩增子区域,其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,且其中所述扩增子区域可操作地与所述接合体区域偶联,其中所述通用引物区域的序列在所述多个多核苷酸的各多核苷酸上是基本上相同的,且其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的文库中其它多核苷酸的样品识别区域的序列;和
b.利用引物组扩增所述多核苷酸文库以产生所述一个或多个用于测序的目标多核苷酸,其中所述一个或多个用于测序的目标多核苷酸包含第一测序区域、第一板识别区域、通用引物区域、样品识别区域、接合体区域、来自于单一样品的扩增子区域和第二测序区域,其中所述通用引物区域的3’端与所述样品识别区域的5’端偶联,其中所述样品识别区域的3’端与所述接合体区域的5’端偶联,其中所述第一板识别区域可操作地与所述通用引物区域偶联,其中所述扩增子区域可操作地与所述接合体区域偶联,其中所述第一测序区域位于所述目标多核苷酸的5’端,且其中所述第二测序区域位于所述目标多核苷酸的3’端。
60.权利要求59的方法,还包括对所述一个或多个目标多核苷酸进行测序。
61.一种用于分析测序数据的方法,包括:
a.获得与多个多核苷酸相关的数据集,其中所述数据集包含所述多个多核苷酸的测序数据,其中所述多个多核苷酸中的各多核苷酸包含样品识别区域,且其中各多核苷酸上的各样品识别区域对于单一样品是独特的,其中来自第一单一样品的各多核苷酸的所述样品识别区域的序列不同于来自于与所述第一单一样品不同的一个或多个样品的所述多个多核苷酸中其它多核苷酸的样品识别区域的序列;和
b.分析所述数据集以将具有相同样品识别区域的多核苷酸匹配在一起,其中匹配表示所述多核苷酸源自于相同的样品。
62.权利要求61的方法,其中所述多个多核苷酸中的各多核苷酸还包含第一板识别区域,其中在各多核苷酸上各第一板识别区域与样品识别区域的各个组合对于单一样品是独特的,其中来自第一组单一样品的各多核苷酸的所述第一板识别区域的序列不同于来自于与所述第一组单一样品不同的一个或多个单一样品组的所述多个多核苷酸中其它多核苷酸的第一板识别区域的序列;和进一步包括分析所述数据集以将具有相同的第一板识别区域和相同的样品识别区域的多核苷酸匹配在一起,其中两个区域之间的匹配表示所述多核苷酸源自于相同的样品。
63.权利要求61或62的方法,其中所述单一样品是单一细胞。
64.权利要求61或62的方法,其中所述单一样品包含单一B细胞。
65.权利要求61或62的方法,其中所述单一样品包含多个B细胞。
66.权利要求61或62的方法,还包括选择一个或多个多核苷酸用于克隆。
67.一种测序来自单个B细胞的配对的重链和轻链的方法,包括以下步骤:
a.通过流式细胞术分选单个B细胞;
b.在反转录期间添加条码;
c.汇合带条码的cDNA;和
d.测序汇合的cDNA。
68.权利要求67的方法,其中所述条码是包含样品-ID和板-ID的化合物条码。
CN201910010319.5A 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定 Pending CN110055593A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161517976P 2011-04-28 2011-04-28
US61/517,976 2011-04-28
US201161575652P 2011-08-24 2011-08-24
US61/575,652 2011-08-24
US201261599870P 2012-02-16 2012-02-16
US61/599,870 2012-02-16
US201261608571P 2012-03-08 2012-03-08
US61/608,571 2012-03-08
CN201280031099.0A CN103732738A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280031099.0A Division CN103732738A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定

Publications (1)

Publication Number Publication Date
CN110055593A true CN110055593A (zh) 2019-07-26

Family

ID=47072978

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201280031099.0A Pending CN103732738A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定
CN201910010319.5A Pending CN110055593A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定
CN202211461711.XA Pending CN117026386A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280031099.0A Pending CN103732738A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202211461711.XA Pending CN117026386A (zh) 2011-04-28 2012-04-27 与样品相关的多核苷酸的鉴定

Country Status (21)

Country Link
US (2) US11098302B2 (zh)
EP (6) EP3421591B1 (zh)
JP (8) JP5998203B2 (zh)
KR (6) KR102112205B1 (zh)
CN (3) CN103732738A (zh)
AU (6) AU2012249158B2 (zh)
BR (1) BR112013027540A2 (zh)
CA (2) CA2833917C (zh)
DK (3) DK3415619T3 (zh)
ES (3) ES2861595T3 (zh)
HK (4) HK1257815A1 (zh)
IL (3) IL229122B (zh)
MX (1) MX346359B (zh)
NZ (1) NZ616956A (zh)
PL (3) PL3418380T3 (zh)
PT (3) PT2702146T (zh)
RU (1) RU2644681C2 (zh)
SG (2) SG10201900183VA (zh)
SI (3) SI2702146T1 (zh)
WO (1) WO2012148497A2 (zh)
ZA (1) ZA201308027B (zh)

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104195227B (zh) 2008-11-07 2017-04-12 适应生物技术公司 通过序列分析监测状况的方法
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
EP2387627B1 (en) 2009-01-15 2016-03-30 Adaptive Biotechnologies Corporation Adaptive immunity profiling and methods for generation of monoclonal antibodies
WO2011021102A2 (en) 2009-08-20 2011-02-24 Population Genetics Technologies Ltd Compositions and methods for intramolecular nucleic acid rearrangement
WO2013033721A1 (en) 2011-09-02 2013-03-07 Atreca, Inc. Dna barcodes for multiplexed sequencing
CA2858070C (en) 2011-12-09 2018-07-10 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
SG11201405274WA (en) 2012-02-27 2014-10-30 Cellular Res Inc Compositions and kits for molecular counting
ES2662128T3 (es) 2012-03-05 2018-04-05 Adaptive Biotechnologies Corporation Determinación de cadenas de receptor inmunitario emparejadas a partir de la frecuencia de subunidades coincidentes
ES2582554T3 (es) 2012-05-08 2016-09-13 Adaptive Biotechnologies Corporation Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas
EP2861761A1 (en) * 2012-06-15 2015-04-22 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
MX364957B (es) 2012-08-14 2019-05-15 10X Genomics Inc Composiciones y metodos para microcapsulas.
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20150376609A1 (en) 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
CA2894694C (en) 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2900481A1 (en) 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
CN114107458A (zh) 2013-03-15 2022-03-01 血统生物科学公司 测序免疫组库的方法
GB2525568B (en) 2013-03-15 2020-10-14 Abvitro Llc Single cell barcoding for antibody discovery
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
SG10201806890VA (en) 2013-08-28 2018-09-27 Cellular Res Inc Massively parallel single cell analysis
ES2912183T3 (es) 2013-12-30 2022-05-24 Atreca Inc Análisis de ácidos nucleicos asociados a células individuales utilizando códigos de barras de ácidos nucleicos
CA2941612A1 (en) 2014-03-05 2015-09-11 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
AU2015243445B2 (en) 2014-04-10 2020-05-28 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
AU2015318011B2 (en) * 2014-09-15 2020-07-23 Abvitro Llc High-throughput nucleotide library sequencing
US10392663B2 (en) 2014-10-29 2019-08-27 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from a large number of samples
US20160122817A1 (en) 2014-10-29 2016-05-05 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
EP3213080B1 (en) * 2014-10-30 2019-04-24 Erasmus University Medical Center Rotterdam Reagents, methods and kits for diagnosing primary immunodeficiencies
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
US10246701B2 (en) * 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
SG11201705615UA (en) 2015-01-12 2017-08-30 10X Genomics Inc Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
EP3262188B1 (en) 2015-02-24 2021-05-05 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
EP3262407B1 (en) 2015-02-24 2023-08-30 10X Genomics, Inc. Partition processing methods and systems
ES2858306T3 (es) 2015-02-24 2021-09-30 Adaptive Biotechnologies Corp Método para determinar el estado de HLA mediante secuenciación del repertorio inmunitario
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
EP3277843A2 (en) 2015-03-30 2018-02-07 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
WO2016161273A1 (en) 2015-04-01 2016-10-06 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
WO2016176322A1 (en) * 2015-04-27 2016-11-03 Abvitro Llc Methods of sequencing, determining, pairing, and validating therapeutic agents and disease specific antigens
US10829820B2 (en) 2015-08-31 2020-11-10 The United States Government As Represented By The Secretary Of The Army Methods for molecularly characterizing cervical cell samples
CN108603190B (zh) 2015-09-08 2023-05-23 美国冷泉港实验室 使用经破碎的核苷酸的高通量多重测序确定基因拷贝数
WO2017044574A1 (en) 2015-09-11 2017-03-16 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
KR20180097536A (ko) 2015-11-04 2018-08-31 아트레카, 인크. 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트
SG11201804086VA (en) 2015-12-04 2018-06-28 10X Genomics Inc Methods and compositions for nucleic acid analysis
KR102632796B1 (ko) 2016-03-10 2024-02-02 비엘라 바이오, 인크. Ilt7 결합 분자 및 이의 사용 방법
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
EP3472355A4 (en) * 2016-06-15 2020-07-29 Genecapture, Inc. COMPOSITIONS, METHODS AND DEVICES INCLUDING ROD LOOP MOLECULES-SENSORS
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
WO2018058073A2 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
WO2018081113A1 (en) * 2016-10-24 2018-05-03 Sawaya Sterling Concealing information present within nucleic acids
WO2018089550A1 (en) 2016-11-10 2018-05-17 Takara Bio Usa, Inc. Methods of producing amplified double stranded deoxyribonucleic acids and compositions and kits for use therein
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) * 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
JP7360324B2 (ja) 2016-12-23 2023-10-12 ビステラ, インコーポレイテッド 結合ポリペプチドおよびそれを作製する方法
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
CN110418648B (zh) * 2017-02-22 2023-09-08 丁恩雨 一种编码人GM-CSF与多串连表位融合的mRNA癌症疫苗
KR102281923B1 (ko) * 2017-03-13 2021-07-27 기가젠, 인코포레이티드 단일 세포들의 초병렬 조합 분석을 위한 시스템들 및 방법들
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CN116064732A (zh) 2017-05-26 2023-05-05 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
WO2018222741A1 (en) * 2017-05-31 2018-12-06 Oklahoma Medical Research Foundation Bispecific antibodies for the treatment of streptococcus pneumonia
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
EP3641806A4 (en) 2017-06-22 2021-06-23 University of Maryland, Baltimore BROAD NEUTRALIZING ANTIBODIES AGAINST HIV
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
WO2019169028A1 (en) * 2018-02-28 2019-09-06 10X Genomics, Inc. Transcriptome sequencing through random ligation
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
US11066663B2 (en) 2018-10-31 2021-07-20 Zymergen Inc. Multiplexed deterministic assembly of DNA libraries
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
SG11202106810UA (en) * 2018-12-28 2021-07-29 Nat Univ Singapore Methods for targeted complementary dna enrichment
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
DE19913048T1 (de) * 2019-01-31 2022-01-27 Nantbio, Inc. Mrna-display-antikörper-bibliothek und verfahren
CN110020726B (zh) * 2019-03-04 2023-08-18 武汉希望组生物科技有限公司 一种对组装序列排序的方法及系统
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
JP2023511440A (ja) 2020-01-22 2023-03-17 アトレカ インコーポレイテッド 複数の転写産物のハイスループット連結
WO2021168427A1 (en) * 2020-02-20 2021-08-26 The Trustees Of Columbia University In The City Of New York Compositions and methods for rapid detection of sars-cov-2
WO2021231237A2 (en) * 2020-05-11 2021-11-18 Augmenta Bioworks, Inc. Antibodies for sars-cov-2 and uses thereof
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
US20230227816A1 (en) * 2020-06-15 2023-07-20 Chan Zuckerberg Biohub, Inc. Methods and compositions for selective pcr and cloning of antibody sequences
GB2596803A (en) * 2020-07-06 2022-01-12 Petmedix Ltd Expression vector production & high-throughput cell screening
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022081643A2 (en) * 2020-10-13 2022-04-21 10X Genomics, Inc. Compositions and methods for generating recombinant antigen binding molecules from single cells
WO2022082225A2 (en) * 2020-10-16 2022-04-21 The Board Of Trustees Of The Leland Stanford Junior University Genetic tools for recombining transgenes at the same locus
CN116635533A (zh) 2020-11-20 2023-08-22 贝克顿迪金森公司 高表达的蛋白和低表达的蛋白的谱分析
WO2022232258A1 (en) * 2021-04-29 2022-11-03 Pioneer Hi-Bred International, Inc. Clubroot resistance in brassica
EP4355774A1 (en) 2021-06-17 2024-04-24 Atreca, Inc. Anti-csp antibodies
WO2023154305A2 (en) * 2022-02-10 2023-08-17 Amgen Inc. Antibody protein product expression constructs for high throughput sequencing
WO2024015862A1 (en) * 2022-07-13 2024-01-18 10X Genomics, Inc. Methods for characterization of antigen-binding molecules from biological samples

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011137A (en) * 1996-04-03 2000-01-04 University Of North Carolina At Chapel Hill Identification and isolation of novel polypeptides having WW domains and methods of using same
US6274321B1 (en) * 1999-12-03 2001-08-14 The Regents Of The University Of California High throughput functional screening of cDNAs
CN101845500A (zh) * 2010-05-18 2010-09-29 苏州众信生物技术有限公司 一种利用dna序列条码矫正二代高通量测序的序列丰度偏差的方法
CN101854950A (zh) * 2007-09-11 2010-10-06 航道生物技术有限责任公司 供体特异性抗体文库

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
CA2114950A1 (en) 1991-08-10 1993-02-11 Michael J. Embleton Treatment of cell populations
US5922545A (en) 1993-10-29 1999-07-13 Affymax Technologies N.V. In vitro peptide and antibody display libraries
US5928906A (en) 1996-05-09 1999-07-27 Sequenom, Inc. Process for direct sequencing during template amplification
KR100566859B1 (ko) 1997-01-21 2006-04-03 제너럴 하스피톨 코포레이션 Rna-단백질 융합물을 이용한 단백질의 선별
US6261804B1 (en) 1997-01-21 2001-07-17 The General Hospital Corporation Selection of proteins using RNA-protein fusions
EP0975748B1 (en) 1997-04-23 2006-03-29 Universität Zürich Methods for identifying nucleic acid molecules encoding (poly)peptides that interact with target molecules
US6927025B1 (en) * 1997-09-03 2005-08-09 Biovation Limited Methods for protein screening
ATE361377T1 (de) 1997-09-29 2007-05-15 Hope City Leistungstarke verknüpfung von nukleinsäuresegmenten
IL138668A0 (en) 1998-04-03 2001-10-31 Phylos Inc Addressable protein arrays
US6846655B1 (en) 1998-06-29 2005-01-25 Phylos, Inc. Methods for generating highly diverse libraries
CA2334946A1 (en) 1998-08-17 2000-02-24 Phylos, Inc. Methods for producing nucleic acids lacking 3'-untranslated regions and optimizing cellular rna-protein fusion formation
JP4278872B2 (ja) 1998-08-17 2009-06-17 フィロス インク. 蛋白質・核酸融合分子ライブラリーを用いた化合物・蛋白質相互作用の同定
ATE354675T1 (de) 1998-12-02 2007-03-15 Adnexus Therapeutics Inc Dna-protein fusionen sowie anwendungen derselben
CA2366559C (en) * 1999-03-23 2011-03-08 Biovation Limited Protein isolation and analysis
US6623926B1 (en) 1999-06-01 2003-09-23 Phylos, Inc. Methods for producing 5′-nucleic acid-protein conjugates
US20090233806A1 (en) * 1999-07-06 2009-09-17 Carr Francis J Protein isolation and analysis
AU778194B2 (en) 1999-07-12 2004-11-18 Bristol-Myers Squibb Company C-terminal protein tagging
US6429300B1 (en) 1999-07-27 2002-08-06 Phylos, Inc. Peptide acceptor ligation methods
AU779653B2 (en) 1999-08-27 2005-02-03 Bristol-Myers Squibb Company Methods for encoding and sorting in vitro translated proteins
WO2001053539A1 (en) 2000-01-24 2001-07-26 Phylos, Inc. Sensitive, multiplexed diagnostic assays for protein analysis
US7022479B2 (en) 2000-01-24 2006-04-04 Compound Therapeutics, Inc. Sensitive, multiplexed diagnostic assays for protein analysis
WO2003000856A2 (en) 2001-06-21 2003-01-03 Phylos, Inc. In vitro protein interaction detection systems
US20040161741A1 (en) * 2001-06-30 2004-08-19 Elazar Rabani Novel compositions and processes for analyte detection, quantification and amplification
US7125669B2 (en) 2001-11-27 2006-10-24 Compound Therapeutics, Inc. Solid-phase immobilization of proteins and peptides
JP4324649B2 (ja) * 2001-11-28 2009-09-02 福井県 繊維強化熱可塑性樹脂シート及びそれを用いた構造材並びに繊維強化熱可塑性樹脂シートの製造方法
US20100069614A1 (en) 2008-06-27 2010-03-18 Merus B.V. Antibody producing non-human mammals
CA2536565A1 (en) * 2003-09-10 2005-05-12 Althea Technologies, Inc. Expression profiling using microarrays
TWI333977B (en) 2003-09-18 2010-12-01 Symphogen As Method for linking sequences of interest
WO2007094842A2 (en) * 2005-12-02 2007-08-23 Genentech, Inc. Binding polypeptides and uses thereof
KR101130597B1 (ko) 2005-09-13 2012-04-02 다카라 바이오 가부시키가이샤 T 세포 리셉터 및 그 리셉터를 코드하는 핵산
US8642513B2 (en) * 2005-09-15 2014-02-04 Crucell Holland B.V. Method for preparing immunoglobulin libraries
WO2007062064A2 (en) 2005-11-23 2007-05-31 Regents Of The University Of California, San Diego Methods and compositions for controlling parasitic infections with bt crystal proteins
JP2009520468A (ja) 2005-12-23 2009-05-28 ヴィヴェンティア バイオテック インコーポレーティッド 融合タンパク質ライブラリーの作製法およびスクリーニング法、ならびにそれらの使用
JP2006271390A (ja) 2006-05-15 2006-10-12 Kudo Norio 短縮型ミッドカイン(tMK)タンパク質特異的モノクローナル抗体の製造方法
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
ATE521704T1 (de) * 2007-03-01 2011-09-15 Symphogen As Verfahren zur klonierung verwandter antikörper
JP5205597B2 (ja) 2007-06-01 2013-06-05 静岡県 1細胞レベルでの抗体遺伝子の解析・同定方法
JOP20080381B1 (ar) 2007-08-23 2023-03-28 Amgen Inc بروتينات مرتبطة بمولدات مضادات تتفاعل مع بروبروتين كونفيرتاز سيتيليزين ككسين من النوع 9 (pcsk9)
US9328172B2 (en) * 2008-04-05 2016-05-03 Single Cell Technology, Inc. Method of obtaining antibodies of interest and nucleotides encoding same
JP2011528905A (ja) 2008-07-25 2011-12-01 セラクローン サイエンシーズ, インコーポレイテッド 抗体レパートリーアレイ(ara)を使用する標的特異的抗体を発見するための方法および組成物
TW201028432A (en) * 2008-09-30 2010-08-01 Abbott Lab Improved antibody libraries
KR101069146B1 (ko) * 2008-10-01 2011-09-30 주식회사에이앤알쎄라퓨틱스 인간 항체 scFv 라이브러리 제작용 재조합 벡터, 발현벡터 및 이의 제조방법
CA2742968C (en) * 2008-11-07 2020-06-09 Fabrus Llc Combinatorial antibody libraries and uses thereof
US20120010091A1 (en) * 2009-03-30 2012-01-12 Illumina, Inc. Gene expression analysis in single cells
AU2010232439C1 (en) 2009-04-02 2017-07-13 Fluidigm Corporation Multi-primer amplification method for barcoding of target nucleic acids
RU2569187C2 (ru) * 2009-05-29 2015-11-20 МорфоСис АГ Коллекция и способы ее применения
CA2772298A1 (en) 2009-08-26 2011-03-03 Research Development Foundation Methods for creating antibody libraries
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011137A (en) * 1996-04-03 2000-01-04 University Of North Carolina At Chapel Hill Identification and isolation of novel polypeptides having WW domains and methods of using same
US6274321B1 (en) * 1999-12-03 2001-08-14 The Regents Of The University Of California High throughput functional screening of cDNAs
CN101854950A (zh) * 2007-09-11 2010-10-06 航道生物技术有限责任公司 供体特异性抗体文库
CN101845500A (zh) * 2010-05-18 2010-09-29 苏州众信生物技术有限公司 一种利用dna序列条码矫正二代高通量测序的序列丰度偏差的方法

Also Published As

Publication number Publication date
SG194233A1 (en) 2013-12-30
AU2012249158B2 (en) 2017-06-29
ES2925799T3 (es) 2022-10-19
KR20140057692A (ko) 2014-05-13
SI3415619T1 (sl) 2021-04-30
KR20190014575A (ko) 2019-03-04
AU2018286622A1 (en) 2019-01-24
DK2702146T3 (en) 2019-03-11
EP3418380B1 (en) 2022-05-25
EP3421592B1 (en) 2023-09-13
IL264056B (en) 2022-04-01
IL290935A (en) 2022-04-01
AU2018286623B2 (en) 2021-07-15
PL3415619T3 (pl) 2021-06-14
SG10201900183VA (en) 2019-05-30
EP2702146A2 (en) 2014-03-05
EP3415619A3 (en) 2019-01-02
KR20190012280A (ko) 2019-02-18
KR102151655B1 (ko) 2020-09-03
PT3418380T (pt) 2022-08-30
HK1257812A1 (zh) 2019-11-01
EP3421592A1 (en) 2019-01-02
HK1257815A1 (zh) 2019-11-01
PT2702146T (pt) 2019-04-22
JP2014518618A (ja) 2014-08-07
HK1257813A1 (zh) 2019-11-01
EP3421591B1 (en) 2023-09-27
BR112013027540A2 (pt) 2016-09-20
KR20170104154A (ko) 2017-10-10
AU2018286624B2 (en) 2021-10-21
NZ616956A (en) 2016-04-29
AU2012249158A1 (en) 2013-11-07
DK3418380T3 (da) 2022-08-08
JP7357661B2 (ja) 2023-10-06
IL290935B2 (en) 2023-05-01
US11098302B2 (en) 2021-08-24
MX2013012493A (es) 2014-07-28
RU2644681C2 (ru) 2018-02-13
JP5998203B2 (ja) 2016-09-28
ES2716013T3 (es) 2019-06-07
EP4286855A2 (en) 2023-12-06
JP6703567B2 (ja) 2020-06-03
KR102112204B1 (ko) 2020-06-05
AU2018286625A1 (en) 2019-01-24
JP2022028726A (ja) 2022-02-16
CN117026386A (zh) 2023-11-10
ES2861595T3 (es) 2021-10-06
CA2833917A1 (en) 2012-11-01
PL2702146T3 (pl) 2019-06-28
JP2018193389A (ja) 2018-12-06
JP7251985B2 (ja) 2023-04-04
IL229122A0 (en) 2013-12-31
EP3418380A1 (en) 2018-12-26
KR101776192B1 (ko) 2017-09-13
EP2702146B1 (en) 2018-11-28
HK1257814A1 (zh) 2019-11-01
JP2019077708A (ja) 2019-05-23
IL229122B (en) 2019-01-31
ZA201308027B (en) 2015-04-29
EP2702146A4 (en) 2015-01-21
AU2018286623A1 (en) 2019-01-24
EP4286855A3 (en) 2024-02-28
US20150133317A1 (en) 2015-05-14
CA2833917C (en) 2020-04-28
AU2017232235B2 (en) 2019-11-07
EP3415619B1 (en) 2020-12-16
SI2702146T1 (sl) 2019-06-28
SI3418380T1 (sl) 2022-10-28
JP2016220687A (ja) 2016-12-28
US20240035019A1 (en) 2024-02-01
JP2019094336A (ja) 2019-06-20
JP2019077706A (ja) 2019-05-23
IL264056A (en) 2019-01-31
MX346359B (es) 2017-03-15
CA3078215A1 (en) 2012-11-01
IL290935B1 (en) 2023-01-01
AU2018286622B2 (en) 2021-07-15
WO2012148497A2 (en) 2012-11-01
EP3421591A1 (en) 2019-01-02
AU2017232235A1 (en) 2017-10-12
PT3415619T (pt) 2021-03-22
KR20190012281A (ko) 2019-02-25
AU2018286624A1 (en) 2019-01-24
RU2013150707A (ru) 2015-06-10
AU2018286625B2 (en) 2021-07-22
DK3415619T3 (da) 2021-03-08
EP3415619A2 (en) 2018-12-19
KR102112205B1 (ko) 2020-06-12
WO2012148497A3 (en) 2013-02-21
CN103732738A (zh) 2014-04-16
KR102151656B1 (ko) 2020-09-03
JP6660271B2 (ja) 2020-03-11
JP2019077707A (ja) 2019-05-23
KR102033659B1 (ko) 2019-10-31
KR20190014574A (ko) 2019-03-11
PL3418380T3 (pl) 2022-09-19

Similar Documents

Publication Publication Date Title
JP7357661B2 (ja) 試料に関連するポリヌクレオチドの同定
US20230287392A1 (en) Identification of Polynucleotides Associated with a Sample

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination