CN116234927A - 用于测定多种多肽的系统和方法 - Google Patents

用于测定多种多肽的系统和方法 Download PDF

Info

Publication number
CN116234927A
CN116234927A CN202180066419.5A CN202180066419A CN116234927A CN 116234927 A CN116234927 A CN 116234927A CN 202180066419 A CN202180066419 A CN 202180066419A CN 116234927 A CN116234927 A CN 116234927A
Authority
CN
China
Prior art keywords
polypeptide
nucleic acid
ligase
microbeads
capture moiety
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180066419.5A
Other languages
English (en)
Inventor
迈克尔·罗伊·戈特里克
柯蒂斯·詹姆斯·雷顿
帕瓦那普雷桑·普什帕吉里·威德亚纳森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Protiryn Biosciences
Original Assignee
Protiryn Biosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Protiryn Biosciences filed Critical Protiryn Biosciences
Publication of CN116234927A publication Critical patent/CN116234927A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1062Isolating an individual clone by screening libraries mRNA-Display, e.g. polypeptide and encoding template are connected covalently
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/91Transferases (2.)
    • G01N2333/912Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开内容提供了用于测定多种多肽的功能或特性的组合物和方法。特别地,本公开内容提供了用于高通量表征大量多肽群体的方法。每种多肽展示在固体表面如微珠上,其中固体表面也展示编码多肽的核酸。例如,每种多肽可以与编码该多肽的核酸共价连接。在优选的实施方案中,用同一仪器平行地测定多肽和核酸。

Description

用于测定多种多肽的系统和方法
相关申请的交叉引用
本申请要求于2020年7月28日提交的美国临时专利申请号63/057,754的权益;其公开内容通过引用以其全文并入本文。
序列表
本申请包含以ASCII格式电子提交的序列表,在此以其全文并入本文。所述ASCII副本在2020年7月13日创建,命名为51351-005001_Sequence_Listing_7_13_20_ST25,大小为7,496字节。
背景技术
定向进化(DE)是目前用于工程化具有所需特性(例如,大小、稳定性、折叠效率)和/或功能(例如,结合亲和力、特异性、酶活性)的新蛋白质的唯一系统且可靠的方法。从生物分子的大的候选文库开始,DE模拟天然选择的过程,以根据特定的用户定义的目标通过通常迭代的选择循环来鉴定或进化功能性蛋白质和其他生物分子。然而,通过DE鉴定的类似富集的生物分子在其性质上可以有很大变化,因此通过DE鉴定的分子仍然通常需要使用低通量定量方法进行另外的功能表征。此外,DE在实践中可能是费力的和非常麻烦的,并且可能需要由高度熟练的从业者进行数周的工作以产生可接受的结果。
高通量DNA测序方法和仪器可在自动化仪器上在微米至亚微米DNA特征(例如,阵列上的微珠或聚合酶群落)上平行测序DNA的大文库。自动化的大规模平行蛋白质功能表征的一种方法是开发方法和组合物,其中蛋白质与编码其同一性(identity)的DNA共定位,使得用于对DNA测序的相同自动化仪器也用于测量相同微珠上的蛋白质生物物理特性(例如,结合亲和力)。此外,为了在宽范围的环境条件(pH、温度、盐或化学变性剂浓度等)下进行蛋白质测定,希望这种DNA/蛋白质展示方法使用强共价连接而不是非共价相互作用。
因此,对于允许对生物分子的大文库进行定量高通量表征的组合物和方法存在未满足的需求。还需要比DE更快、更有效和更自动化的方法。
发明内容
本公开内容提供了用于测定多种多肽的功能和/或特性的组合物和方法。特别地,本公开内容提供了用于定量高通量表征大量多肽群体的方法。本文所述的方法更快、更有效且/或允许增强多肽文库的定向进化和表征的自动化。
本公开内容的组合物和方法至少部分地基于将基因型(例如,核酸如DNA或RNA)与编码的表型(例如,多肽)以高通量和与大规模进行的自动化测定相容的方式相连接的方法。在具体的实施方案中,本发明的组合物和方法在每颗微珠的基础上将核酸与其各自编码的多肽连接,其中对核酸进行测序用于可靠地鉴定微珠上展示的多肽。此外,所述方法允许每颗微珠显示足够拷贝的核酸以提供足够的信号用于核酸测序和鉴定编码的多肽。另外,所述方法允许每颗微珠显示足够的多肽分子,以提供足够的信号用于蛋白质功能测定。在一些实施方案中,通过测序鉴定核酸和相应多肽的一种或多种功能测定在同一仪器中在基于微珠的文库上进行,使得能够在对多肽的大文库进行功能表征中实现高通量和高效率。
在本文所述的组合物和方法的一些实施方案中,每种多肽展示在固体表面如微珠上,并且固体表面还展示了编码多肽的同一性的核酸。例如,每种多肽可以与编码该多肽的核酸共价连接,并且其中该核酸本身与微珠连接。在优选的实施方案中,用同一仪器平行地测定多肽和核酸。这使得能够表征多肽的大文库。可以在同一多肽文库上在迭代循环中进行多重测定,而不需要选择,因此与现有技术的方法相比,允许以低成本和时间密集的方式跨多个参数表征每个成员。
在一个方面,本公开内容提供了一种测定多种多肽的功能或特性的方法。该方法包括多颗微珠,其中每颗微珠与编码多肽的核酸分子缀合,并且每颗微珠进一步与编码的多肽缀合。此外,该方法以任何顺序包括,平行测序缀合到每颗微珠的核酸分子以鉴定缀合到每颗微珠的多肽,以及平行测定缀合到每颗微珠的每种多肽的一种或多种功能或特性。此外,该方法包括将每种多肽的一种或多种功能或特性与编码该多肽的核酸分子的序列连接,从而确定多种多肽中每种多肽的同一性和一种或多种功能或特性。
在一个方面,本公开内容提供了一种高通量分析多种多肽的方法,其包括:提供多颗微珠,其中多颗微珠中的微珠与编码多肽的不同的核酸分子缀合;加工编码多肽的核酸分子以产生编码的多肽,其中多颗微珠中的微珠与编码的多肽缀合;测定编码的多肽以鉴定编码的多肽的一种或多种特性;对编码多肽的核酸分子进行测序以鉴定编码该多肽的核酸分子的序列;以及将每种多肽的一种或多种特性与编码该多肽的核酸分子的序列联系起来。
在一些实施方案中,多颗微珠包括至少1×105颗微珠(例如,至少1×106颗微珠、1×107颗微珠、1×108颗微珠或1×109颗微珠以及其间的值),其中每颗微珠与多肽缀合(例如,每种多肽具有独特的氨基酸序列)。
在一些实施方案中,核酸分子的测序和每种多肽的一种或多种功能或特性的测定(例如,以任何顺序相继地)在同一机器、设备或仪器上进行。在一些实施方案中,进行多重测定以确定每种多肽的两种或多种功能或特性,或进行多重测定以确定在不同条件下每种多肽的单一功能或特性。可以在同一机器、设备或仪器上同时或依次进行多次测定。例如,可以使用单个机器、设备或仪器对与每颗微珠缀合的核酸分子测序,以便鉴定与该微珠缀合的多肽;以及进行一种或多种测定以表征每种多肽(例如,结合亲和力、结合特异性、酶活性、稳定性,例如在包括例如温度和/或pH的不同实验条件下)。在优选的实施方案中,测序和一种或多种测定产生通过单个机器、设备或仪器测量的荧光特征(fluorescencesignature)。
在一些实施方案中,编码的多肽与微珠直接缀合(例如,共价或非共价连接)。在其他实施方案中,编码的多肽与核酸分子缀合,该核酸分子直接与微珠缀合(例如,共价或非共价连接),由此将多肽与微珠缀合。
在一些实施方案中,将每颗微珠与核酸分子缀合、表达核酸分子以产生多肽以及将多肽与微珠缀合(例如,直接或通过与核酸缀合)的步骤在第一区室(例如,第一微乳液液滴、管或微孔)中进行。在一些实施方案中,该方法还包括扩增每个区室中(例如,每个微乳液液滴中)的每个核酸分子,从而在每颗微珠上产生核酸分子的同质群体。扩增的核酸分子可以在第一区室(例如,第一微乳液液滴)内与微珠缀合。
在一些实施方案中,表达核酸分子以产生多肽;以及
将多肽与微珠缀合(例如,直接或通过与核酸缀合)在第二区室(例如,第二微乳液液滴)中进行。
在一些实施方案中,表达核酸分子以产生多肽在体外无细胞系统中发生。
在一些实施方案中,核酸是DNA、cDNA或RNA。当核酸是DNA或cDNA时,表达核酸是指DNA转录为RNA以及RNA翻译以产生编码的多肽(例如,体外转录和翻译(IVTT))。当核酸是RNA时,核酸的表达是指RNA的翻译以产生编码的多肽(例如,体外翻译(IVT))。
本公开内容提供了将多肽与微珠缀合(例如,通过与核酸缀合,核酸进一步与微珠缀合)的方法。这类方法产生了将多肽和核酸连接到微珠上的更小和/或更稳定的方法。这允许在增加的条件范围(例如,温度、pH或盐浓度)下进行测定。此外,微珠上较小的装配降低了与缀合装配组分的非特异性或脱靶相互作用,从而产生多种多肽的更精确表征。
在另一方面,本公开内容提供了一种将多肽与微珠缀合的方法,该方法包括:在第一区室(例如,微乳液液滴)中,将编码多肽的核酸分子与微珠缀合;并且在第二区室(例如,微乳液液滴)中,表达核酸分子以产生多肽,并且将多肽与核酸分子缀合,从而将多肽与微珠缀合。
在一个方面,本公开内容提供了一种将多肽与微珠缀合的方法,该方法包括:在第一微乳液液滴中将编码多肽的核酸分子与微珠缀合;以及在第二微乳液液滴中加工核酸分子,其中加工包括:表达核酸分子以产生多肽;以及将多肽与核酸分子缀合。
在一些实施方案中,多肽与核酸分子的缀合由连接酶催化。在一些实施方案中,多肽通过表达的蛋白质连接或通过蛋白质反式剪接与核酸分子缀合。在一些实施方案中,多肽通过形成亮氨酸拉链与核酸分子缀合;
在一些实施方案中,微珠或核酸分子与捕获部分缀合,并且多肽包括连接标签,其中捕获部分和连接标签缀合,从而使微珠与多肽缀合或使核酸分子与多肽缀合。
在一些实施方案中,捕获部分和连接标签的缀合由连接酶催化。在一些实施方案中,连接酶由第二核酸编码。在一些实施方案中,通过在IVTT或IVT期间加入编码核酸(例如,通过在第二区室化步骤(例如,第二微乳液步骤)期间加入编码连接酶的核酸),使连接酶与多肽同时表达。
在一些实施方案中,连接酶为分离的酶(例如,引入第二区室化步骤(例如,第二微乳液液滴)的纯化的重组酶)。
在一些实施方案中,连接酶为分选酶、环化酶(butelase)、胰蛋白酶连接酶(trypsiligase)、肽连接酶(peptiligase)、甲酰甘氨酸生成酶、转谷氨酰胺酶、微管蛋白酪氨酸连接酶、磷酸泛酰巯基乙胺基转移酶、SpyLigase或SnoopLigase。
在一些实施方案中,连接酶为分选酶A。在其他实施方案中,当连接酶为分选酶A时,捕获部分或连接标签之一包含含有游离N-末端甘氨酸残基的多肽。在另一个实施方案中,捕获部分或连接标签中的另一个包含含有氨基酸序列LPXTG(SEQ ID NO:1)的多肽,其中X为任何氨基酸。
在一些实施方案中,连接酶为环化酶1。在另一个实施方案中,当连接酶为环化酶1时,捕获部分或连接标签之一包含含有氨基酸序列X1X2XX(SEQ ID NO:2)的多肽,其中X1为除P、D或E以外的任何氨基酸;X2为I、L、V或C;并且X为任何氨基酸。在其他实施方案中,捕获部分或连接标签中的另一个包含含有氨基酸序列DHV或NHV的多肽。
在一些实施方案中,连接酶为胰蛋白酶连接酶。在另一个实施方案中,当连接酶为胰蛋白酶连接酶时,捕获部分或连接标签之一包含含有氨基酸序列RHXX(SEQ ID NO:3)的多肽,其中X为任何氨基酸。在另一个实施方案中,捕获部分或连接标签中的另一个包含含有氨基酸序列YRH的多肽。
在一些实施方案中,连接酶为全连接酶(Omniligase)。当连接酶为全连接酶时,捕获部分可包括甲酰胺基甲基(OCam)。在另一个实施方案中,连接标签包含多肽,该多肽包括作为酰基受体亲核剂的游离N-末端氨基酸。
在一些实施方案中,连接酶为甲酰甘氨酸生成酶。在其他实施方案中,当连接酶为甲酰甘氨酸时,捕获部分包括醛反应性基团。例如,连接标签可以包含含有氨基酸序列CXPXR(SEQ ID NO:4)的多肽,其中X为任何氨基酸。
在一些实施方案中,连接酶为转谷氨酰胺酶。当连接酶为转谷氨酰胺酶时,捕获部分或连接标签之一可以包含含有赖氨酸残基或游离N-末端胺基的多肽。在另一个实施方案中,捕获部分或连接标签中的另一个包含含有氨基酸序列LLQGA(SEQ ID NO:5)的多肽。
在一些实施方案中,连接酶为微管蛋白酪氨酸连接酶。在其他实施方案中,当连接酶为微管蛋白酪氨酸连接酶时,捕获部分或连接标签之一包含含有游离N-末端酪氨酸残基的多肽。例如,捕获部分或连接标签中的另一个可以包含含有C-末端氨基酸序列VDSVEGEEEGEE(SEQ ID NO:6)的多肽。
在一些实施方案中,连接酶为微管蛋白磷酸泛酰巯基乙胺基转移酶。在一个实施方案中,当连接酶为微管蛋白磷酸泛酰巯基乙胺基转移酶时,捕获部分可包括辅酶A(CoA)。在另一个实施方案中,连接标签包含含有氨基酸序列DSLEFIASKLA(SEQ ID NO:7)的多肽。
在一些实施方案中,连接酶为SpyLigase。当连接酶为SpyLigase时,捕获部分或连接标签之一可以包含含有氨基酸序列ATHIKFSKRD(SEQ ID NO:8)的多肽。在其他实施方案中,捕获部分或连接标签中的另一个包含含有氨基酸序列AHIVMVDAYKPTK(SEQ ID NO:9)的多肽。
在一些实施方案中,连接酶为SnoopLigase。在另一个实施方案中,当连接酶为SnoopLigase时,捕获部分或连接标签之一包含含有氨基酸序列DIPATYEFTDGKHYITNEPIPPK(SEQ ID NO:10)的多肽。在其他实施方案中,捕获部分或连接标签中的另一个包含含有氨基酸序列KLGSIEFIKVNK(SEQ ID NO:11)的多肽。
在一些实施方案中,捕获部分包括双链DNA,连接标签包含多肽,其中捕获部分和连接标签形成亮氨酸拉链。在一些实施方案中,捕获部分包括核酸序列TGCAAGTCATCGG(SEQID NO:12)。在一个实施方案中,捕获部分包括核酸序列TGCAAGTCATCGG(SEQ ID NO:12),连接标签可包括氨基酸序列DPAALKRARNTEAARRSRARKGGC(SEQ ID NO:13)。
在以上任一项的一些实施方案中,当连接标签或捕获部分包含多肽序列时,多肽序列与示例性多肽序列共有至少70%、75%、80%、85%、90%、95%或98%的序列同一性或序列。
在一些实施方案中,每颗微珠与核酸分子的100个或更多个拷贝(例如,150个、200个、250个、300个、350个、400个、500个、1000个或更多个拷贝)缀合。
在一些实施方案中,每颗微珠与编码的多肽的100个或更多个拷贝(例如,150个、200个、250个、300个、350个、400个、500个、1000个或更多个拷贝)缀合。
在一些实施方案中,多颗微珠包括1×106-1×1010颗微珠(例如,2×106-9×109颗微珠、4×106-7×109颗微珠、6×106-5×109颗微珠、8×106-2×109颗微珠、1×107-1×1010颗微珠、1×108-1×1010颗微珠或1×109-1×1010颗微珠)。在另一个实施方案中,每颗微珠与具有独特氨基酸序列的多肽缀合(例如,每颗微珠展示独特多肽的多个拷贝)。
在一些实施方案中,多颗微珠包含含有独特氨基酸序列的1×106-1×1010种多肽(例如,2×106-9×109、4×106-7×109个独特多肽、6×106-5×109个独特多肽、8×106-2×109个独特多肽、1×107-1×1010个独特多肽、1×108-1×1010个独特多肽或1×109-1×1010个独特多肽)。每个独特多肽可以在文库中展示多次(例如,通过将独特多肽的多个拷贝与单颗或多颗微珠缀合)。
每种多肽氨基酸序列可以在一颗或多颗微珠上与多颗微珠一起展示。在一些实施方案中,多颗微珠包括与具有独特氨基酸序列的多肽的一个或多个拷贝缀合的一颗或多颗、两颗或多颗、三颗或多颗、四颗或多颗、五颗或多颗、六颗或多颗、七颗或多颗、八颗或多颗、九颗或多颗或十颗或多颗微珠。在一些实施方案中,多颗微珠包括与具有独特氨基酸序列的多肽的一个或多个拷贝缀合的1-15颗微珠(例如,1-5颗、1-10颗、1-15颗、2-5颗、2-10颗、2-15颗、5-10颗或10-15颗微珠)。
在一些实施方案中,在高温(例如,大于或等于40℃、大于或等于50℃、大于或等于60℃、大于或等于70℃、大于或等于80℃、大于或等于90℃或大于或等于100℃,例如约45℃-约100℃、约50℃-约90℃、约60℃-约80℃或约65℃-约75℃)下测定每种多肽的功能或特性。
在一些实施方案中,在高pH(例如,大于或等于pH 8.0、大于或等于pH 8.5、大于或等于pH 9.0、大于或等于pH 9.5或大于或等于pH10.0,例如约pH 8.0-约pH 10.0、约pH8.1-约pH 9.9或在约pH 8.2-约pH 9.8)下测定每种多肽的功能或特性。
在一些实施方案中,在低pH(例如,小于或等于pH 6.0、小于或等于pH 5.0、小于或等于pH 4.0或小于或等于pH 3.0,例如约pH 3.0-约pH 6.0、或约pH 3.1-约pH 5.9、或约pH3.2-约pH 5.8)下测定每种多肽的功能或特性。
在一些实施方案中,在中性pH(例如,约pH 6.0-约pH 8.0,例如约pH 7.0-约pH7.5)测定每种多肽的功能或特性。
在一些实施方案中,多肽的一种或多种功能或特性是结合特性,例如与分子或大分子结合的定量(例如,如本文所述的配体结合、平衡结合或动力学结合)。在一些实施方案中,功能或特性是酶活性或特异性(例如,如本文所述的酶活性或酶抑制)。在一些实施方案中,功能或特性是蛋白质表达水平(例如,给定基因的表达水平)。在一些实施方案中,多肽的功能或特性是稳定性(例如,热稳定性,例如如通过热变性所测量;化学稳定性,例如如通过化学变性所测量;或在不同pH下的稳定性)。在一些实施方案中,多肽的功能或特性是多肽的聚集。
在一些实施方案中,该方法包括测定多种多肽中每种多肽的多种功能或特性(例如,在单个机器、仪器或设备上)。例如,该方法可包括在竞争性分子存在下测定与靶标的竞争性结合;测量对多个不同靶标的结合;测量平衡结合和结合动力学;测量结合和蛋白质稳定性;或其任意组合。本方法还可包括在不同条件下测定每种多肽的多种功能或特性,例如在多种pH条件下的结合;在多个温度条件下结合;在多种盐浓度下的结合;和/或在多种缓冲条件下结合。在不同条件下在单个仪器上进行多重测定的能力是本公开内容的组合物和方法的显著优点,其中仪器还进行了(缀合核酸分子的)测序步骤以鉴定被测定的多肽。此外,可以在同一多肽文库上进行多重测定,因此相对于现有技术方法提高了效率和速度。
在一些实施方案中,多种多肽包括抗原、抗体、酶、底物或受体的文库。在一些实施方案中,抗原文库包括一种或多种病毒的病毒蛋白表位。在一些实施方案中,多种多肽包括酶(例如,候选酶)文库,该酶文库来源于自然界、来源于生物体的基因组数据或先前通过定向进化发现。在一些实施方案中,多种多肽包括用于探测新的或修饰的酶活性的酶底物文库。在一些实施方案中,多种多肽可编码与互补蛋白质片段相互作用以形成完整的功能性蛋白质(例如,蛋白质-片段互补)的部分或不完整的蛋白质结构。
定义
为了便于理解本发明,下面定义了许多术语。本文定义的术语具有与本发明相关领域的普通技术人员通常理解的含义。诸如“一(a、an)”和“该(the)”之类的术语并不旨在仅指单数实体,而是包括其具体示例可用于说明的一般类别。本文中的术语用于描述本发明的特定实施方案,但它们的使用不限制本发明,除非如权利要求中所概述。
如本文所用,术语“约(about)”是指高于或低于所述值10%内的值。
如本文所用,在数值范围内提供的任何数值包括上限和下限,以及包含在上限和下限内的任何数值。
如本文所用,术语“测定(assay或assaying)”是指测量分子的生物学和/或化学和/或物理性质和/或功能。测定的实例例如在一定范围的条件如温度、pH或盐浓度下测量蛋白质的结合亲和力、酶活性或热稳定性。
如本文所用,术语“扩增(amplification或amplify)”或其衍生物是指本领域已知的用于拷贝靶核酸或模板核酸的一种或多种方法,从而增加所选核酸序列的拷贝数。扩增可以是指数的或线性的。“靶核酸(target nucleic acid)”是指待扩增、检测和/或测序的核酸或其部分。靶核酸或模板核酸可以是任何核酸,包括DNA或RNA。以这种方式扩增的序列形成“扩增的靶核酸”、“扩增区域”或“扩增子”,其在本文中可互换使用。可以容易地设计引物和/或探针以靶向特定的模板核酸序列。示例性扩增方法包括但不限于聚合酶链反应(PCR)、连接酶链反应(LCR)、多重置换扩增(MDA)、链置换扩增(SDA)、滚环扩增(RCA)、环介导等温扩增(LAMP)、基于核酸序列的扩增(NASBA)、解旋酶依赖性扩增、重组酶聚合酶扩增、切口酶扩增反应和分支扩增(RAM)。
如本文所用,“微珠(bead)”是指大致球形或椭球形颗粒。微珠可以是固体或半固体颗粒。微珠可由多种材料中的任一种构成,包括玻璃、石英、二氧化硅、金属、陶瓷、塑料、尼龙、聚丙烯酰胺、树脂、水凝胶及其复合材料。微珠可以是凝胶珠(例如,水凝胶珠)。微珠可以由聚合物材料形成。微珠可以是磁性的或非磁性的。另外,可将基质添加至微珠的表面以促进DNA模板的附着(例如,用于固定携带末端丙烯酰胺基团的DNA模板的聚丙烯酰胺基质)。
如本文所用,术语“微珠等分试样(bead aliquot)”是指使用流式细胞仪测量的包含约10,000-50,000颗微珠的微珠体积。等分试样的实际体积可根据指示步骤处微珠的浓度而变化。
如本文所用,术语“捕获部分(capture moiety)”是指任何天然的、合成的或重组产生的分子或其部分,其具有与靶剂结合或以其他方式缔合的能力。合适的捕获部分包括但不限于核酸、抗体、抗体的抗原结合区、抗原、表位、细胞受体(例如,细胞表面受体)及其配体,例如肽生长因子(参见例如,Pigott和Power(1993),The Adhesion Molecule FactsBook(Academic Press New York);以及Receptor Ligand Interactions:APracticalApproach,Rickwood和Hames(丛书编辑)Hulme(编辑)(Oxford Press NY的IRL Press))。类似地,捕获部分还可包括但不限于毒素、毒液、细胞内受体(例如,介导各种小配体(包括类固醇、激素、类视黄醇和维生素D、肽)及其配体的作用的受体)、药物(例如,阿片制剂、类固醇等)、凝集素、糖、寡糖、其他蛋白质、磷脂和结构化核酸如适体等。本领域技术人员容易理解,除以上列出的那些之外的分子相互作用在文献中有充分描述,并且也可以用作捕获部分/靶剂相互作用。在某些实施方案中,捕获部分与支架缔合,而在其他实施方案中,捕获部分与捕获相关的寡核苷酸缀合。
如本领域所公认的,术语“无细胞系统(cell free system)”或“体外转录/翻译系统(in vitro transcription/translation system)”或“体外转录/翻译反应混合物(invitro transcription/translation reaction mixture)”或简称为“反应混合物(reaction mixture)”在本文中同义使用,并且是指用于进行体外转录和/或翻译的所需组分的复杂混合物。这种反应混合物可以是细胞裂解物,例如大肠杆菌S30提取物,优选来自缺乏一种或多种释放因子的大肠杆菌(E.coli),例如释放因子I(RF-I)、释放因子II(RF-II)和/或释放因子III(RF-III)(Short,Biochemistry 1999,38,第8808-8819页),或来自缺乏特定tRNA的细胞,其中相应的密码子将在本发明的方法中用作终止密码子。反应混合物可另外包括抑制组分或成分,其减少了不需要的副产物的形成。此外,反应混合物可包括主动除去一种或多种不需要的副产物的特定酶。此外,反应混合物可包括有助于连接或改善多肽折叠或展示的特异性酶。其他这类反应混合物可由可从天然或重组来源纯化的单一组分人工重构。
如本文所用,术语“克隆群体(clonal population)”是指就特定核苷酸序列而言同质的核酸群体。同源序列可以是至少10个核苷酸长或更长(例如,至少50个、100个、250个、500个、1000个、2000个或4000个核苷酸长)。克隆群体可来源于单个靶核酸或模板核酸。克隆群体中基本上所有的核酸分子具有相同的核苷酸序列。应当理解,在克隆群体中可发生少数突变(例如,由于PCR扩增假象)而不偏离克隆性。
“编码序列(coding sequence)”或“编码”所选多肽的序列是(在DNA的情况下)转录和(在mRNA的情况下)翻译成多肽的核酸分子。编码序列的边界可由5′(氨基)末端的起始密码子和3′(羧基)末端的翻译终止密码子确定。编码序列可包括但不限于来自病毒、原核或真核mRNA的cDNA、来自病毒或原核DNA的基因组DNA序列、甚至合成DNA序列。转录终止序列可以位于编码序列的3′。
如本文所用,术语“区室(compartment)”是指一种或多种组分与一种或多种其他组分的物理分离。例如,区室化可用于进行特定的生物学和/或化学反应,例如核酸分子的扩增、核酸分子与物理支持物(例如,微珠)的缀合、核酸分子编码的多肽的表达(例如,IVTT或IVT)或多肽与物理支持物的缀合(例如,通过与核酸分子缀合)中的一种或多种。示例性的区室包括例如反应管和微乳液液滴。
如本文所用,“缀合”是指通过共价键、非共价键附着或结合和/或通过范德华力、氢键和/或其他分子间力连接。
如本文所用,术语“表达”是指以下事件中的一个或多个:(1)(例如,通过转录)从DNA序列产生RNA模板;(2)(例如,通过剪接、编辑,5′帽形成和/或3′端加工)加工RNA转录物;(3)将RNA翻译成多肽或蛋白质;和(4)多肽或蛋白质的翻译后修饰。
如本文所用,术语“表达的蛋白质连接”或“EPL”是指一种蛋白质半合成方法,其允许将蛋白质的化学合成C-末端片段体外连接到通过其C-末端与内含肽蛋白质剪接元件融合的重组N-末端片段。如本文所用,术语“功能”和“特性”是指天然存在和/或非天然存在的分子(包括蛋白质或肽或其片段)的结构、调节或生物化学活性。例如,片段的功能可包括酶活性(例如,激酶、蛋白酶、磷酸酶、糖苷酶、乙酰酯酶或转移酶)或功能蛋白质结构域的结合活性(例如,结合DNA、RNA、蛋白质、激素、配体或抗原)。
如本文所用,术语“分离的酶”是指外部纯化的酶,其形成将感兴趣的多肽与其编码核酸分子连接的反应的一部分。分离的酶作为补充基因引入反应中,使得其与感兴趣的蛋白质同时产生或作为单独的纯化组分产生。
如本文所用,术语“连接酶”是指可用于连接标签与捕获部分之间的连接反应的酶。本文详细描述了示例性的连接酶。
如本文所用,术语“连接标签”是指与捕获部分相互作用的部分(例如,多肽或小分子)。当捕获部分与第一实体(例如,微珠、核酸或多肽)结合且连接标签与第二实体(例如,微珠、核酸或多肽)结合时,捕获部分与连接标签的相互作用使第一实体与第二实体缀合。在优选的实施方案中,连接标签和捕获部分的相互作用形成共价键。在优选的实施方案中,连接标签是多肽(例如约1-40个、约1-30个、约1-20个、约1-15个或约1-10个氨基酸残基的短多肽)。连接标签与捕获部分的共价缀合可如本文所述进行,例如通过连接酶缀合。
如本文所用,术语“微乳液”是指在介质中包含液滴的组合物,该液滴通常具有100nm-10μm范围内的直径,其以热力学稳定的单相液体溶液形式存在。
本文可互换使用的术语“核酸”和“多核苷酸”是指任何长度的核苷的聚合形式。通常,多核苷酸由通过磷酸二酯键连接的天然存在于DNA或RNA中的核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)组成。该术语包含含有核苷或核苷类似物的分子,该核苷或核苷类似物含有化学或生物修饰的碱基、修饰的主链等,无论是否在天然存在的核酸中发现,并且这种分子对于某些应用可能是优选的。术语核酸还包括在合成、缀合和/或测序期间或之后修饰的天然核酸。当本申请涉及多核苷酸时,应当理解,提供了DNA(包括cDNA)、RNA以及在每种情况下的单链和双链形式(以及每种单链分子的互补形式)。如本文所用,“多核苷酸序列”可指多核苷酸材料本身和/或生物化学上定义特定核酸的序列信息(即,用作碱基缩写的字母序列)。还包括核酸分子的各种盐、混合盐和游离酸形式。
本文可互换使用的术语“多肽”、“肽”、“寡肽”和“蛋白质”是指任何化合物,包括天然存在的或合成的氨基酸聚合物或氨基酸样分子,包括但不限于包括氨基和/或亚氨基分子的化合物。术语“肽”、“寡肽”、“多肽”或“蛋白质”的使用不暗示特定大小。如本文所用,术语“蛋白质”是指全长蛋白质、蛋白质的一部分或肽。包括在该定义内的是,例如,含有氨基酸的一种或多种类似物(包括,例如,非天然氨基酸等)的多肽、具有取代的键的多肽以及本领域已知的其他修饰,包括天然存在的和非天然存在的(例如,合成的)。因此,合成的寡肽、二聚体、多聚体(例如,串联重复、多抗原肽(MAP)形式、线性连接的肽)、环化的、分支的分子等包括在定义内。该术语还包括包含一种或多种拟肽(peptoid)(例如,N-取代的甘氨酸残基)和其他合成氨基酸或肽的分子(参见,例如,美国专利号5,831,005;5,877,278;和5,977,301;Nguyen等人,(2000)Chem.Biol.7(7):463-473;以及Simon等人,(1992)Proc.Natl.Acad.Sci.USA 89(20):9367-9371对于拟肽的描述)。适用于本发明的肽的非限制性长度包括3-5个残基长度、6-10个残基长度(或其间的任何整数)、11-20个残基长度(或其间的任何整数)、21-75个残基长度(或其间的任何整数)、75-100个残基长度(或其间的任何整数)的肽或大于100个残基长度的多肽。通常,可用于本发明的多肽可具有适合于预期应用的最大长度。此外,本文所述的多肽,例如合成多肽,可包括另外的分子,例如标记物或其他化学部分。这些部分可进一步增强肽与配体的相互作用和/或增强对展示的多肽的检测。因此,提及蛋白质、多肽或肽还包括氨基酸序列的衍生物,包括一个或多个非天然存在的氨基酸。
如果第一多肽(i)由衍生自编码第二多肽的第二多核苷酸的第一多核苷酸编码,或(ii)显示与本文所述的第二多肽的序列同一性,则第一多肽衍生自第二多肽。序列(或百分比)同一性可以如下所述确定。优选地,衍生物表现出与衍生它们的序列至少约50%的百分比同一性、更优选至少约80%、甚至更优选约85%-99%(或其间的任何值)。此类衍生物可包括多肽的表达后修饰,例如糖基化、乙酰化、磷酸化等。氨基酸衍生物还可包括对天然序列的修饰,例如缺失、添加和取代(通常在性质上是保守的),只要多肽保持所需的活性。这些修饰可以是有意的,如通过定点诱变,或可以是偶然的,如通过产生蛋白质的宿主的突变或通过PCR扩增期间的错误。此外,可以进行具有一个或多个以下效果的修饰:增加多肽的展示、体外翻译、功能或稳定性的效率。
如本文所用,术语“蛋白质反式剪接(protein trans-splicing)”是指涉及分裂内含肽系统(split intein system)的蛋白质剪接反应。分裂内含肽系统是指任何内含肽系统,其中肽键断裂存在于氨基末端和羧基末端氨基酸序列之间,使得N-末端和C-末端序列成为单独的分子,其可以再缔合或重构为功能性反式剪接元件。分裂内含肽系统可以是天然存在的分裂内含肽系统,其包括存在于天然生物体中的任何分裂内含肽系统。分裂内含肽系统也可以是工程分裂内含肽系统,其包括通过本领域已知的任何标准方法将非分裂内含肽分离成N-内含肽和C-内含肽而产生的任何分裂内含肽系统。作为非限制性实例,工程改造的分裂内含肽系统可通过将天然存在的非分裂内含肽断裂成合适的N-末端和C-末端序列而产生。优选地,这种改造的内含肽系统仅包括反式剪接反应所必需的氨基酸序列。
术语“测序”是指用于确定核酸(例如,DNA)如靶核酸或扩增的靶核酸的核苷酸顺序的任何方法。示例性测序方法包括但不限于大规模平行测序(例如,通过合成的测序(例如,ILLUMINATM染料测序、离子半导体测序或焦磷酸测序)或通过连接的测序(例如,寡核苷酸连接和检测(SOLiDTM)测序或基于聚合酶群落的测序))、长读取或单分子测序(例如,HelicosTM测序、单分子实时(SMRTTM)测序和纳米孔测序)和Sanger测序。大规模平行测序在本领域中也称为下一代或第二代测序,并且通常涉及大量(例如,数千、数百万或数十亿)空间分离的、克隆扩增的模板或单个核酸分子的平行测序。短读取(read)通常用于大规模平行测序。参见,例如Metzker,Nature Reviews Genetics11:31-36,2010。长读取测序和/或单分子测序有时称为第三代测序。也可以使用杂交方法(例如,大规模平行和单分子方法或大规模平行和长读取方法)。应当了解,一些方法可属于一个以上类别,例如,一些方法可视为第二代和第三代方法两者,且一些来源将第二代和第三代测序两者称为“下一代”测序。
附图说明
图1是示出了测定多种多肽的示例性方法的图。在用短DNA寡核苷酸修饰的微珠表面上(步骤1),进行乳液PCR以展示感兴趣的多肽基因(GOI)和与反向引物共价连接的相关捕获部分(CM)(步骤2)。进行乳液体外转录翻译(IVTT)以产生连接酶和含有连接标签的感兴趣的靶蛋白(POI)(LT,步骤3)。在该步骤期间,连接酶将CM共价融合至LT,导致POI的共价附着。将乳液破碎并将多颗微珠定位并物理寻址在仪器上(步骤4)。将微珠与感兴趣的荧光靶标(TOI)孵育以通过荧光测量来测定POI结合(步骤5)。然后微珠经历变性以仅留下单链DNA(ssDNA,步骤6)。ssDNA通过合成进行测序(步骤7)以确定其同一性,该同一性被固定到步骤4中确定的地址。测序后,分析产生起始DNA文库中编码的全部多肽的生物物理数据。
图2是显示DNA寡聚物上的生物分子和/或肽基序的结构和序列的示意图(用星号表示),并展示在用于将感兴趣的蛋白质与其编码DNA共价缀合的蛋白质上(用箭头表示)。
图3A和图3B显示了在用红色激光(633nm)激发时通过流式细胞术在APC(660±20nm)荧光通道中记录的事件的直方图。(图3A)在与Alexa Fluor 647标记的DNA孵育时从SA微珠收集10,000个事件。(图3B)当使用20mM氢氧化钠除去Alexa Fluor 647标记的反义DNA链时,微珠恢复到基线荧光水平。
图4A和图4B是显示在用蓝色激光(488nm)激发时在610±20nm荧光通道中掺入荧光ddNTP(测序)后微珠群体的分布的图(图4A)。在用红色激光(633nm)激发时,测序后微珠群体在660±20nm荧光通道中的分布(图4B)。
图5A-图5C显示了示例性流式细胞术结果。图5A是示例性流式细胞仪分析的示意性概述。展示双链DNA,其所编码的多肽和任何结合的荧光抗FLAG M2抗体的微珠被引导通过流式细胞仪并被三个连续的激光(蓝色、红色和紫色)激发。蓝色激光激发产生的信号产生了关于与M2抗体结合的量(测定,FITC通道)和荧光ddUTP掺入的量(U,PE通道)的信息。红色激发产生的信号产生了关于荧光ddCTP或ddGTP(C/G,APC通道)掺入量的信息。紫色激光激发产生的信号产生了关于荧光ddATP(A,AmCyan通道)掺入量的信息。图5B是显示相关通道(APC,PE,AmCyan通道)中每颗微珠的荧光信号的图。分析每个通道中的荧光信号,并给微珠分配碱基调用,该碱基调用鉴定单克隆展示在微珠上的寡核苷酸。由于产生异源信号,一些微珠不能产生足够的荧光,从而它们展示的寡核苷酸是未确定的。图5C是一组显示测定通道(FITC通道)中荧光信号的图。对于每个寡核苷酸群,荧光信号被聚集,并且平均值被拟合以获得结合亲和力的精确测量(彩色线)。重叠的小提琴图显示了几何平均数(白色圆圈)、从第一(25%)四分位数延伸至第三(75%)四分位数的条(粗线)、以及延伸至四分位数间距1.5倍的须(细线)。
具体实施方式
本公开内容提供了用于测定多种多肽的功能或特性的组合物和方法。特别地,本公开内容提供了用于高通量表征大量多肽群体的方法。每种多肽展示在固体表面如微珠上,其中固体表面也展示编码多肽的核酸。例如,每种多肽可以与编码该多肽的核酸共价连接。在优选的实施方案中,用同一仪器平行地测定多肽和核酸。这使得能够表征多肽的大文库。可以在同一多肽文库上一个接一个地或同时地进行多重测定,而不需要选择,因此与现有技术的方法相比,允许以低成本和时间密集的方式跨多个参数表征每个成员。
用于微珠上的高通量多肽测定的方法
本文描述了直接在微珠上进行的高通量蛋白质测定的方法。在一些实施方案中,本文所述的高通量蛋白质测定方法包括:1)产生多颗微珠,每颗微珠展示编码蛋白质的DNA的独特克隆群体;2)转录和翻译每颗微珠上展示的DNA以产生对应于每颗微珠的克隆DNA群体的蛋白质变体的独特克隆群体;3)将克隆蛋白质分子化学连接至微珠上展示的DNA分子以产生微珠-DNA-蛋白质缀合物;4)在通用机器和/或仪器和/或设备中表征微珠-DNA-蛋白质缀合物的蛋白质的多种物理化学性质和/或生物化学功能;5)读取微珠-DNA-蛋白质缀合物的DNA分子的序列以鉴定所述粒-DNA-蛋白质缀合物的DNA序列并由此鉴定粒-DNA-蛋白质缀合物的蛋白质序列;以及6)以自动化和/或最小用户干预执行所有步骤。这些方法的成功实施产生了蛋白质测定的高通量方法,消除了对多轮常规定向进化的要求。下面提供方法的步骤和用途的更详细的概述。
微珠上展示多核苷酸
描述了用于在多颗微珠的表面上展示多核苷酸的克隆群体的方法。在一些实施方案中,将含有核酸(优选DNA或cDNA(例如,至少1×105个变体、至少1×106个变体、至少1×107个变体、至少1×108个变体、至少1×109个变体或至少1×1010个变体,例如1×105-1×1010个变体、5×105-5×108个变体、1×106-1×108个变体、5×106-5×107个变体、1×107-4×107个变体或2×107-3×107个变体))文库的水溶液、表面官能化的微珠(例如,具有添加到每颗微珠表面以促进核酸模板附着的化学基团的微珠)和用于将核酸连接到官能化微珠表面的试剂组合以产生混合物。混合物优选在含水介质中。在一些实施方案中,核酸变体将具有促进核酸变体固定到表面官能化微珠上的末端反应基团。例如,每颗微珠可以用表面上的聚丙烯酰胺基质官能化,用于固定携带末端丙烯酰胺基团的DNA模板。
在一些实施方案中,核酸变体将具有末端小分子部分,其促进固定至表面官能化的微珠。例如,每颗微珠可以用链霉亲和素功能化,以固定含有末端生物素部分的DNA模板。在一些实施方案中,每颗微珠可以用羧酸官能团官能化,用于共价固定含有末端胺基的DNA模板。在一些实施方案中,DNA模板可以通过亚磷酰胺化学法在微珠表面上完全或部分合成,如Diamante等人(2013)Protein Engineering Design and Selection 26(10):713-724、Sepp等人(2002)FEBS Letters 532(2002):455-458、以及Griffiths和Tawfik(2003)EMBOJ 22(1):24-35中所述,其全部内容通过引用并入本文。混合物可以被乳化,例如,在第一微乳液中,以产生大量(例如,多于1×105个、1×106个、1×107个、1×108个、1×109个或1×1010个,例如1×105-1×1012个)油包水液滴。如本文所述,可以调节混合物的组分以确保每个液滴平均含有一颗微珠和一个或更少的核酸模板拷贝。
在一些实施方案中,微珠可由各种材料中的任一种构成,包括玻璃、石英、二氧化硅、金属、陶瓷、塑料、尼龙、聚丙烯酰胺、树脂、水凝胶及其复合材料。微珠可以是凝胶珠(例如,水凝胶珠)。微珠可以由聚合物材料形成。微珠可以是磁性的或非磁性的。在特定的实施方案中,微珠在大小上是基本上均匀的(加/减5%变化)并且包含足够的功能性手柄以展示例如每颗微珠约103-106个DNA分子。
在一些实施方案中,每个液滴中的核酸在微珠的表面上通过延伸固定的DNA寡核苷酸直接扩增。在一些实施方案中,核酸可以在不含微珠的液滴中单独扩增,然后在微流体通道中与含有微珠的单独液滴融合。在一些实施方案中,在产生乳液液滴时,通过聚合酶链式反应扩增每个液滴中的核酸以产生每个核酸变体的克隆群体。扩增的核酸在每个微乳液液滴中的物理固定可以例如通过连接或延伸固定的DNA寡核苷酸以产生核酸包被的微珠(例如,DNA包被的微珠)来实现。
微珠上展示多肽
本文描述了在多颗微珠的表面上展示多肽的方法。从使用在微珠上展示多核苷酸的方法制备的核酸包被的微珠(例如,DNA包被的微珠)开始,编码的多肽可被表达并与微珠缀合(例如,通过与核酸缀合,核酸与微珠缀合)。多肽与微珠的缀合(例如,直接或经由与核酸的附着)可以在第二微乳液步骤中进行。
例如,DNA包被的微珠以及包括用于无细胞体外转录和翻译(IVTT)方法的试剂的混合物在第二微乳液中乳化,导致DNA在微珠上转录和翻译并产生所编码的多肽和/或蛋白质。在一些实施方案中,第二微乳液含有用于IVTT的试剂以及催化酶或编码催化酶并催化多肽附着于核酸上的捕获部分的溶液相DNA。如本文所述,可以调节混合物的组分以确保平均一个DNA包被的微珠和足够的IVTT试剂。
可以使用体外无细胞表达系统进行蛋白质表达。可以使用来自提供翻译所需的所有组分(包括酶、tRNA和辅助因子(不包括释放因子)、氨基酸和能量供应(例如,GTP))的任何生物体的粗裂解物在体外进行翻译。通常使用来源于大肠杆菌、小麦胚芽和兔网织红细胞的无细胞表达系统。基于大肠杆菌的系统提供更高的产量,但基于真核生物的系统优选用于生产翻译后修饰的蛋白质。可选地,人工重构的无细胞系统可用于蛋白质生产。为了最佳的蛋白质生产,可以优化DNA模板的ORF中的密码子使用以在选择用于蛋白质翻译的特定无细胞表达系统中表达。此外,可将标记或标签添加到蛋白质中以促进高通量筛选。参见,例如,Katzen等人(2005)Trends Biotechnol.23:150-156;Jermutus等人(1998)Curr.Opin.Biotechnol.9:534-548;Nakano等人(1998)Biotechnol.Adv.16:367-384;Spirin(2002)Cell-Free Translation Systems,Springer;Spirin和Swartz(2007)Cell-free Protein Synthesis,Wiley-VCH;Kudlicki(2002)Cell-Free Protein Expression,Landes Bioscience;其全部内容通过引用并入本文。在一些实施方案中,无细胞表达系统使用由纯化组分(例如,PURExpress)重构的原核IVTT混合物。在一些实施方案中,IVTT包括基于大肠杆菌裂解物的系统(例如,S30)以促进规模增加(例如,109-1010颗微珠)。在一些实施方案中,使用真核系统(例如,小麦胚芽、兔网织红细胞、基于裂解物的HeLa细胞)进行体外细胞表达,以实现待展示的蛋白质的适当折叠或翻译后修饰(PTM)。在一些实施方案中,使用IVTT方法表达的多核苷酸包含非天然氨基酸。
在其他实施方案中,可以将多种多肽连接到DNA-微珠缀合物上以产生蛋白质-DNA-微珠缀合物。在一些实施方案中,使用三部分酶促连接系统(three-part enzymaticlinkage system)实现蛋白质与DNA包被的微珠的连接。在一些实施方案中,三部分酶促连接系统由以下组成:1)连接酶;2)DNA包被的微珠上的DNA的捕获部分(例如,小分子或肽捕获部分);和3)蛋白质的连接标签(例如,肽连接标签)(参见,例如图2)。使用三部分酶促连接系统可能需要修饰编码蛋白质的多核苷酸序列以包括编码捕获部分的多核苷酸序列。同时,通过对编码蛋白质的序列进行修饰,可以实现包含连接标签部分。
本公开内容还提供了用于将多肽与微珠缀合(例如,通过与核酸缀合,核酸进一步与微珠缀合)的方法。这类方法产生了将多肽和核酸连接到微珠上的更小和/或更稳定的方法。这允许在增加的条件范围(例如,温度、pH或盐浓度)下进行测定。此外,微珠上较小的组装降低了脱靶效应,允许更准确地表征多种多肽。
在一些实施方案中,用于将多肽与微珠缀合(例如,通过与核酸缀合,核酸进一步与微珠缀合)的方法包括:在第一微乳液液滴中,将编码多肽的核酸分子与微珠缀合;以及在第二微乳液液滴中表达核酸分子以产生多肽,并且同时将多肽与核酸分子缀合,从而将多肽与微珠缀合。
在其他实施方案中,多肽与微珠上展示的核酸的缀合由连接酶催化。例如,连接酶可以选自分选酶、环化酶、胰蛋白酶连接酶、肽连接酶、甲酰甘氨酸生成酶、转谷氨酰胺酶、微管蛋白酪氨酸连接酶、磷酸泛酰巯基乙胺基转移酶、SpyLigase或SnoopLigase。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用Sortase A作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一可包含含有游离N-末端甘氨酸残基的多肽,而捕获部分或连接标签中的另一个可包含含有氨基酸序列LPXTG(SEQ ID NO:1)的多肽,其中X为任何氨基酸(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用环化酶1作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一包含含有氨基酸序列X1X2XX(SEQ ID NO:2)的多肽,其中X1为除P、D或E以外的任何氨基酸;X2为I、L、V或C;X为任何氨基酸,并且捕获部分或连接标签中的另一个可包括包含氨基酸序列DHV或NHV的多肽(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods andProtocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用胰蛋白酶连接酶作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一可包含含有氨基酸序列RHXX(SEQ IDNO:3)的多肽,其中X为任何氨基酸,而捕获部分或连接标签中的另一个可包含含有氨基酸序列YRH的多肽(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用枯草杆菌蛋白酶衍生的酶(例如,全连接酶)作为连接酶来实现。在该实施方案中,捕获部分可包括甲酰胺基甲基(OCam),连接标签可包含含有游离N-末端氨基酸的多肽,该游离N-末端氨基酸充当酰基受体亲核剂(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用甲酰甘氨酸生成酶(FGE)作为连接酶来实现。在该实施方案中,捕获部分可包括醛反应性基团,并且连接标签可包含含有氨基酸序列CXPXR(SEQ ID NO:4)的多肽,其中X为任何氨基酸(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods andProtocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用转谷氨酰胺酶作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一可包含含有赖氨酸残基或游离N-末端胺基的多肽,而捕获部分或连接标签中的另一个可包含含有氨基酸序列LLQGA(SEQ ID NO:5)的多肽(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用微管蛋白酪氨酸连接酶作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一可包括包含游离N-末端酪氨酸残基的多肽,而捕获部分或连接标签中的另一个可包括包含C-末端氨基酸序列VDSVEGEEEGEE(SEQ ID NO:6)的多肽(参见,例如Schmidt等人(2017)Current Opinion inChemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用微管蛋白磷酸泛酰巯基乙胺基转移酶作为连接酶来实现。在该实施方案中,捕获部分可包括辅酶A(CoA),连接标签可以包含含有氨基酸序列DSLEFIASKLA(SEQ ID NO:7)的多肽(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用SpyLigase作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一可包含含有氨基酸序列ATHIKFSKRD(SEQIDNOL 8)的多肽,而捕获部分或连接标签中的另一个可包含含有氨基酸序列AHIVMVDAYKPTK(SEQ ID NO:9)的多肽(参见,例如Schmidt等人(2017)Current Opinion in ChemicalBiology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
蛋白质与微珠上展示的DNA分子的酶促连接可以使用SnoopLigase作为连接酶来实现。在该实施方案中,捕获部分或连接标签之一可包括包含氨基酸序列DIPATYEFTDGKHYITNEPIPPK(SEQ ID NO:10)的多肽,而捕获部分或连接标签中的另一个可包括包含氨基酸序列KLGSIEFIKVNK(SEQ ID NO:11)的多肽(参见,例如Schmidt等人(2017)Current Opinion in Chemical Biology 38:1-7、Falck和Muller(2018)Antibodies 7(1):4以及Massa和Devoogdt(2019)Bioconjugation:Methods and Protocols,其全部内容通过引用并入本文)。
在一个实施方案中,捕获部分包括双链DNA,连接标签包括多肽,其中捕获部分和连接标签形成亮氨酸拉链。在另一个实施方案中,捕获部分包括核酸序列TGCAAGTCATCGG(SEQ ID NO:12),连接标签包括氨基酸序列DPAALKRARNTEAARRSRARKGGC(SEQ ID NO:13)(参见,例如Stanojevic和Verdine(1995)Nat Struct Biol 2(6):450-7,其全部内容通过引用并入本文。
在一些实施方案中,将连接酶作为纯化组分引入第二微乳液的混合物中。在一些实施方案中,将连接酶以补充基因的形式引入第二微乳液中,该补充基因与蛋白质变体文库同时表达。将DNA包被的微珠上的DNA连接蛋白质的连接标签的连接以实现103-106分子/μm2微珠表面积的蛋白质密度。
在其他实施方案中,蛋白质-DNA-微珠缀合物展示抗原、抗体、酶、底物或受体。在一些实施方案中,展示在蛋白质-DNA-微珠缀合物上的抗原的文库包括针对一种或多种病原体或癌症的蛋白质表位(例如,1-10个表位变体,1-9个表位变体,1-8个表位变体、1-7个表位变体、1-6个表位变体、1-5个表位变体、1-4个表位变体、1-3个表位变体、1-2个表位变体、1个表位变体、2个表位变体、3个表位变体、4个表位变体、5个表位变体、6个表位变体、7个表位变体、8个表位变体、9个表位变体或10个表位变体)。
在一些实施方案中,蛋白质-DNA-微珠缀合物展示与癌症相关的蛋白质。例如,缀合物可以展示与癌症相关的蛋白质,癌症选自急性成淋巴细胞性白血病、急性髓性白血病、肾上腺皮质癌、AIDS相关癌症、AIDS相关淋巴瘤、肛门癌、阑尾癌、星形细胞瘤、基底细胞癌、胆管癌、膀胱癌、骨癌、脑肿瘤如小脑星形细胞瘤、大脑星形细胞瘤/恶性神经胶质瘤、室管膜瘤、成神经管细胞瘤、幕上原始神经外胚层肿瘤、视觉通路和下丘脑神经胶质瘤、乳腺癌、支气管腺瘤、伯基特淋巴瘤、原发性不明恶性肿瘤、中枢神经系统淋巴瘤、小脑星形细胞瘤、宫颈癌、儿童癌症、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性骨髓增生性病症、结肠癌、皮肤T细胞淋巴瘤、促结缔组织增生性小圆细胞肿瘤、子宫内膜癌、室管膜瘤、食道癌、尤因氏肉瘤、生殖细胞肿瘤、胆囊癌、胃癌、胃肠类癌肿瘤、胃肠基质肿瘤、神经胶质瘤、毛细胞性白血病、头颈癌、心脏癌、肝细胞(肝)癌、霍奇金淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞癌、卡波西肉瘤、肾癌、喉癌、唇和口腔癌、脂肪肉瘤、肝癌、肺癌如非小细胞和小细胞肺癌、淋巴瘤、白血病、巨球蛋白血症、骨的恶性纤维组织细胞瘤/骨肉瘤、成神经管细胞瘤、黑色素瘤、间皮瘤、转移性鳞状颈癌伴隐匿性原发性口腔癌、多发性内分泌瘤形成综合征、脊髓发育不良综合征、髓样白血病、鼻腔和鼻旁窦癌、鼻咽癌、成神经细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌、口咽癌、骨肉瘤/骨的恶性纤维组织细胞瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、胰腺癌、胰岛细胞胰腺癌、鼻旁窦和鼻腔癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、松果体星形细胞瘤、松果体生殖细胞瘤、垂体腺瘤、胸膜肺母细胞瘤、浆细胞瘤、原发性中枢神经系统淋巴瘤、前列腺癌、直肠癌、肾细胞癌、肾盂和输尿管移行细胞癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、肉瘤、皮肤癌、默克尔细胞皮肤恶性肿瘤、小肠癌、软组织肉瘤、鳞状细胞癌、胃癌、T细胞淋巴瘤、咽喉癌、胸腺瘤、胸腺癌、甲状腺癌、滋养细胞肿瘤(妊娠期)、原发灶不明癌症、尿道癌、子宫肉瘤、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症和维尔姆斯氏肿瘤。
在一些实施方案中,蛋白质-DNA-微珠缀合物展示与感染剂相关的蛋白质(例如,病毒蛋白质、细菌蛋白质、真菌蛋白质或寄生虫蛋白质)。例如,缀合物可展示与选自COVID-19、HIV、登革热、西尼罗病毒(WNV)、梅毒、乙型肝炎病毒(HBV)、正常血液、溪谷热和丙型肝炎病毒的病毒相关的蛋白质。
在一些实施方案中,蛋白质-DNA-微珠缀合物展示与炎性和/或自身免疫性疾病相关的蛋白质。在一些实施方案中,炎性或自身免疫性疾病选自HIV、类风湿性关节炎、1型糖尿病、系统性红斑狼疮、硬皮病、多发性硬化、重度联合免疫缺陷(SCID)、DiGeorge综合征、共济失调性毛细血管扩张症、季节性过敏、常年性过敏、食物过敏、过敏性反应、肥大细胞增多症、过敏性鼻炎、特应性皮炎、帕金森病、阿尔茨海默病、脾机能亢进、白细胞粘附缺陷、X连锁淋巴组织增生病、X连锁无丙种球蛋白血症、选择性免疫球蛋白A缺陷、高IgM综合征、自身免疫性淋巴组织增生综合征、维斯科特-奥尔德里奇综合征、慢性肉芽肿病、常见变异型免疫缺陷病(CVID)、高免疫球蛋白E综合征、桥本甲状腺炎和/或细胞信号传导过程的破坏。
微乳液液滴
制备用于化学和生化反应目的的微乳液液滴的方法是本领域技术人员已知的。通常,微乳液液滴含有悬浮在油相中的水相(例如,油包水乳液)。在一个实施方案中,油相由95%矿物油、4.5%司盘80、0.45%吐温80和0.05%曲拉通X-100组成。在一些实施方案中,微乳液经由水相和油相的直接混合和/或涡旋形成。在一些实施方案中,微乳液通过在含有油相的微流体通道中挤压水相的压电泵形成。在一些实施方案中,使用分散仪器或均化器经由水相和油相的机械混合形成微乳液。在一个实施方案中,每个乳液液滴平均含有单个引物包被的微珠、一个模板DNA分子和多个PCR引物分子。温度循环可用于产生从微珠上的模板扩增的克隆DNA。
蛋白质特性和功能的高通量表征
本文描述了在一个自动化仪器上高通量测定大量多个蛋白质变体(例如,至少1×105个变体、至少1×106个变体、1×107个变体、1×108个变体、或1×109个变体,例如1×105-1×1010个变体、1×106-1×1010个变体或10×107-1×1010个变体)的方法。
在特定的实施方案中,在第二微乳液中产生和展示蛋白质后,可以破坏乳液,留下展示蛋白质的许多拷贝和编码该蛋白质的DNA的许多克隆拷贝的微珠群体。然后,可以将微珠引入到仪器中,该仪器被配置为对每颗微珠的DNA进行测序并且还以高通量方式分析展示的蛋白质的特性和/或功能。在一个实施方案中,微珠可以固定在固体表面上(例如,收集到纳米孔中)。固定的多肽文库然后可以用可以在微珠上流动的各种试剂(例如,靶药物、表位、互补位或抗原)呈递,多肽的功能和/或特性可以通过检测(例如,荧光成像)和定量的荧光信号来测定。在若干实施方案中,试剂随后被洗出并且可以重复该过程(例如,2次、3次、4次、5次、6次、7次、8次、9次或10次)。在一些实施方案中,单次测定运行可包括测量与第一靶标(靶标“A”)的平衡结合的第一步骤、测量与靶标A的结合动力学的第二步骤、测量与第二靶标(靶标“B”)的平衡结合的第三步骤、测量与靶标B的结合动力学的第四步骤,随后是测量在多种环境条件(例如,温度、pH和/或张力)下的蛋白质稳定性(例如,变性)的第五步骤。在一些情况下,可选择测定的顺序以确保对多肽的任何所得改变(例如,对多肽的不可逆改变,例如变性)将不影响读出。在一些实施方案中,可以在每次测定后进行再生步骤以制备用于后续测定的微珠。再生步骤可以被配置为在低pH溶液(例如,pH=4.5)中孵育微珠以使任何结合的分子解离,随后是例如洗涤步骤,以及使微珠返回到可以用于下一测定中使用的状态(例如,中性pH)的步骤。由于蛋白质-DNA-微珠缀合物的成分之间的共价键合的性质,经由低pH的再生呈现了本公开内容的方法的和优于现有技术方法的进步。在本领域先前建立的方法中用低pH再生是不可能的,因为这种暴露于低pH导致蛋白质-DNA缀合物的不可逆破坏,这限制或排除了进行后续测定的可能性。
在一些实施方案中,本文所述的方法可被配置为进行多种测定以表征多肽(例如,平衡结合测定(Kd)、动力学结合测定(缔合,kon)、动力学结合测定(解离,koff)、检测限测定(LoD)、热变性(平衡解折叠,Tm)和/或化学变性(平衡解折叠,C1/2))。在一些实施方案中,多肽的动力学稳定性通过将试剂(例如,靶药物、抗原、表位、互补位或正交抗体)添加至展示蛋白的第一步骤和增加变性剂的温度和/或增加变性剂的浓度直到结合信号(例如,荧光信号)消失的第二步骤来测量。
在一些实施方案中,评价蛋白质-DNA-微珠缀合物的蛋白质变体的性质,包括例如热稳定性和pH稳定性。
在一些实施方案中,蛋白质-DNA-微珠缀合物的蛋白质变体的热稳定性通过表征蛋白质变体响应于升高的温度(例如,大于45℃、45℃-100℃之间、55℃-90℃之间、65℃-80℃之间、45℃-90℃之间、55℃-80℃之间、65℃-70℃之间、45℃-55℃之间、55℃-65℃之间、65℃-75℃之间、75℃-85℃之间、85℃-95℃之间、95℃-100℃之间、40℃-45℃之间、46℃-50℃之间、50℃-55℃之间、55℃-60℃之间、60℃-65℃之间、65℃-70℃之间、70℃-75℃之间、75℃-80℃之间、80℃-85℃之间、85℃-90℃之间、90℃-95℃之间、95℃-100℃之间或等于或高于46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃或100℃)的变性来进行。在一些实施方案中,使用变性蛋白的荧光检测(例如,FACS分选)评价蛋白质变体响应于升高的温度的变性。
在一些实施方案中,蛋白质-DNA-微珠缀合物的蛋白质变体的pH稳定性通过表征蛋白质变体响应于低pH(例如,低于pH 6.0,如pH3.0-6.0之间、或pH 4.0-5.0之间、或pH3.0-3.5之间、或pH 3.5-4.0之间、或pH 4.0-4.5之间、或pH 4.5-5.0之间、或pH 5.0-5.5之间、或pH 5.5-6.0之间、或pH 3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9或6.0)的变性来进行。在一些实施方案中,使用变性蛋白的荧光检测(例如,FACS分选)评价蛋白质变体响应于低pH的变性。
在一些实施方案中,蛋白质-DNA-微珠缀合物的蛋白质变体的pH稳定性通过表征蛋白质变体响应于高pH(例如,高于pH 8.0,如pH8.0-10.0之间、或pH 8.0-8.5之间、或pH8.5-9.0之间、pH 9.0-9.5之间、或pH 9.5-10.0之间、或pH 8.1、8.2、8.3、8.4、8.5、8.6、8.7、8.8、8.9、9.0、9.1、9.2、9.3、9.4、9.5、9.6、9.7、9.8、9.9或10.0)的变性来进行。在一些实施方案中,使用变性蛋白的荧光检测(例如,FACS分选)评价响应于高pH的蛋白质变体的变性。
在一些实施方案中,在一个自动化仪器上表征展示在蛋白质-DNA-微珠缀合物上的大量蛋白质变体的生物活性(例如,结合亲和力、结合特异性和/或酶活性)。在一个实施方案中,使用荧光检测蛋白质变体与荧光标记的靶分子之间的结合来确定蛋白质变体的结合亲和力(例如,激动剂、拮抗剂、竞争性抑制剂和/或变构抑制剂)。在另一个实施方案中,使用荧光检测蛋白质变体和荧光标记的靶分子之间的结合来确定蛋白质变体的结合特异性(例如,激动剂、拮抗剂、竞争性抑制剂和/或变构抑制剂)。在一些实施方案中,在一个自动化仪器上以任何顺序依次确定大量蛋白质变体的结合亲和力和结合特异性。在一些实施方案中,在一个自动化仪器上表征展示在蛋白质-DNA-微珠缀合物上的大量蛋白质变体的酶活性。在一个实施方案中,使用反应产物增加的荧光检测和/或使用反应物试剂减少的荧光检测来确定酶活性。
蛋白质-DNA-微珠缀合物可用于探询生物分子(例如,抗体、互补位、抗原、酶、底物或受体)与药物(例如,抗病毒药物、阿昔单抗、阿达木单抗、阿法赛特(Alefacept)、阿仑单抗、巴利昔单抗、贝利木单抗、贝洛托舒单抗(Bezlotoxumab)、康纳克单抗、赛妥珠单抗(Certolizumab pegol)、西妥昔单抗、达克珠单抗、地诺单抗、依法珠单抗、戈利木单抗、英夫利单抗(Inflectra)、易普利姆玛、依奇珠单抗(Ixekizumab)、那他珠单抗、纳武利尤单抗、奥拉单抗(Olaratumab)、奥拉单抗、帕利珠单抗、帕尼单抗、派姆单抗、利妥昔单抗、托珠单抗、曲妥珠单抗、派姆单抗、派姆单抗或卡普赛珠单抗(Cabliv))的相互作用。
在其他实施方案中,蛋白质-DNA-微珠缀合物可用于诊断和/或伴随诊断过程。在一些实施方案中,蛋白质-DNA-微珠缀合物可展示多种患者特异性药物靶标以测试与蛋白质-DNA-微珠缀合物结合的药物的有效性,作为该药物的伴随诊断的一部分。在一些实施方案中,蛋白质-DNA-微珠缀合物可用于展示患者特异性癌症表位变体(例如,新抗原)以测试针对患者的癌症特异性变体的药物有效性。在一些实施方案中,蛋白质-DNA-微珠缀合物可用于展示与感染因子相关的患者特异性表位或群体特异性表位,以表征细菌或病毒药物抗性和药物有效性。
在一些实施方案中,蛋白质-DNA-微珠缀合物可用于展示生物标志物或其他诊断表位,然后与患者血清孵育,其中血清中的患者抗体与蛋白质-DNA-微珠缀合物结合,并且用第二抗人抗体检测以测定患者的抗体应答作为诊断。在一些实施方案中,为了诊断和表征对象的变态反应,可以将蛋白质-DNA-微珠缀合物配置成展示变应原表位。在一些实施方案中,可以将蛋白质-DNA-微珠缀合物配置成展示来自一大组感染剂的多种表位,以测试患者的血清并诊断活动性感染,并且还表征免疫保护(例如,免疫)。
在一些实施方案中,多肽的功能或特性是与靶标结合(例如,如本文所述的配体结合、平衡结合或动力学结合)。在一些实施方案中,功能或特性是酶活性或特异性(例如,如本文所述的酶活性或酶抑制)。在一些实施方案中,功能或特性是蛋白质表达水平(例如,给定基因的表达水平)。在一些实施方案中,多肽的功能或特性是稳定性(例如,通过热变性测量的热稳定性或通过化学变性测量的化学稳定性)。在一些实施方案中,多肽的功能或特性是多肽的聚集。
在一些实施方案中,在同一仪器上进行多于一种测定(例如,2种或更多种、3种或更多种、4种或更多种或5种或更多种测定)。可以在同一仪器上同时或依次进行多次测定。这提供了以高效率同时测定整个多肽文库的优点。例如,该方法可包括在竞争性分子存在下测定与靶标的竞争性结合;测量对多个不同靶标的结合;测量平衡结合和结合动力学;测量结合和蛋白质稳定性;或其任意组合。本方法还可包括在不同条件下测定每种多肽的多种功能或特性,例如在多种pH条件下的结合;在多个温度条件下结合;和/或在多种缓冲条件下结合。
多肽的特性或功能的示例性测定提供于表1中。这些测定中的一种或多种可以在同一多肽文库上进行。当进行多于一种测定时,可以同时或依次进行测定。
表1.多肽特性或功能的测定
Figure BDA0004148753770000311
/>
Figure BDA0004148753770000321
/>
Figure BDA0004148753770000331
/>
Figure BDA0004148753770000341
/>
Figure BDA0004148753770000351
微珠上DNA的高通量测序
本文描述了高通量测定微珠上展示的大量DNA变体的序列的方法。本文所述的方法可允许在一个自动化仪器上高通量分析大量蛋白质-DNA-微珠缀合物中的蛋白质,如所述蛋白质-DNA-微珠缀合物中DNA的测序。在其他实施方案中,该方法可用于在一个自动化仪器上进行高通量蛋白质分析和高通量测序。在其他实施方案中,在测序之前将多个展示肽的微珠装载并固定在固体表面上。可以使用高通量测序方法和技术实现蛋白质-DNA-微珠缀合物上展示的大量DNA变体的测序(例如,通过合成的测序(例如,ILLUMINATM染料测序、离子半导体测序或焦磷酸测序)或通过连接的测序(例如,寡核苷酸连接和检测(SOLiDTM)测序或基于聚合酶群落的测序))、长读取或单分子测序(例如,HelicosTM测序、单分子实时(SMRTTM)测序和纳米孔测序)和Sanger测序。在其他实施方案中,通过荧光检测每个固定微珠上掺入的碱基(通过合成测序)实现高通量测序。
单个仪器多核苷酸的测序和多肽的测定
如本文所述的多核苷酸的单个仪器测序和测定可以从将蛋白质-DNA-微珠缀合物引入仪器(例如,引入微孔或随机排列在流动池表面上)开始。在一些实施方案中,测序仪/分析仪器可以被配置成包括以下部件:流通池,其用于(1)固定微珠以允许在单颗微珠水平进行分析,和(2)以自动化方式引入液相试剂;以及用于测量测序和蛋白质测定两者的信号的高通量机制(例如,自动化荧光显微仪),其中跨所有微珠记录来自测序和结合的荧光信号。在一些实施方案中,测序和/或结合事件产生跨所有微珠检测到的pH变化,例如如美国专利号8,936,763中所述,其全部内容通过引用并入本文。
在一些实施方案中,将不同浓度的试剂引入到测序和分析仪器中,并且荧光或pH信号报告试剂与蛋白质-DNA-微珠缀合物的结合。在蛋白质和/或多肽测定之后,在一些实施方案中,编码蛋白质的DNA的测序通过除去DNA的互补链(例如,甲酰胺或NaOH)、去除连接的蛋白质以及留下结合至微珠的多个克隆单链DNA(ssDNA)分子来进行。然后可将引物与ssDNA分子退火并可进行测序(例如,通过合成测序或通过连接测序)以测定DNA的序列和测定的蛋白质的同一性。在一些实施方案中,可以以任何顺序进行蛋白质的测定和编码蛋白质的DNA的测序。在一些实施方案中,首先进行DNA测序并且可能需要在测序过程开始之前存在预退火的引物。
实施例
提出以下实施例以便为本领域普通技术人员提供如何使用、制备和评价本文所述的组合物和方法的描述,并且这些实施例仅旨在作为本发明的示例而不旨在限制发明人所认为的其发明的范围。
实施例1.单个仪器上多肽文库的平行鉴定和功能表征
通过将每个微珠与编码多肽的DNA分子缀合产生大约3×107颗微珠的文库(实施例1,步骤a)。如本文详细描述的,通过PCR扩增每个核酸分子产生DNA连接的微珠,其中一个引物是微珠连接的,以在每颗微珠上产生该核酸分子的约105个拷贝的同质群体。通过在核酸序列中掺入荧光团,通过单碱基测序鉴定每颗微珠(实施例1,步骤b)。每颗微珠上由核酸编码的多肽通过无细胞转录和翻译表达,所得多肽随后在由分选酶A催化的酶促反应中与微珠缀合(实施例1,步骤c)。每颗微珠平行地(1)通过与微珠缀合的核酸分子的序列鉴定;以及(2)被测定以确定缀合的多肽与荧光标记的抗体的结合;其中序列鉴定和功能表征在单个仪器上进行(实施例1,步骤d)。
本实施例证明了将每种多肽的结合特性与编码该多肽的核酸分子的序列相联系的能力,从而在同一仪器上平行测定多种多肽中每种多肽的同一性和结合功能。本实施例并不意味着限制发明人认为是本发明的范围。步骤的顺序、核酸鉴定的方法和/或多肽的功能表征的方法可根据本文所述的方法并基于本领域技术人员的知识进行修改。
材料和试剂
DNA寡核苷酸
本文所述方法中使用的基因块(gBlock)和寡核苷酸(oligo)提供于表2中。
表2.用于表达多肽表位的寡核苷酸的列表。
Figure BDA0004148753770000371
/>
Figure BDA0004148753770000381
/>
Figure BDA0004148753770000391
/>
Figure BDA0004148753770000401
以下肽用于本文所述的方法中。
·由CPC Scientific(Sunnyvale,California,USA)合成的GLSSK-N3缓冲液
以下缓冲液用于本文所述的方法中。
·链霉亲和素结合缓冲液(SABB):1M NaCl,5mM Tris pH 8,1mM EDTA,0.05%吐温-20
·TNaTE:140mM NaCl,10mM Tris pH 8,0.05%吐温-20,1mM EDTA·磷酸盐缓冲盐水(PBS):1×PBS pH 7.4
·TE:10mM Tris,1mM EDTA pH 7.2
·10×分选酶缓冲液:500mM Tris pH 8,100mM CaCl2,1.5M NaCl
·抗体结合缓冲液(ABB):10mM Tris pH 8,140mM NaCl,2mM MgCl2,5mM KCl,0.02%吐温-20
·孵育缓冲液:1×PBS pH 7.4,10mM MgCl2,0.02%(v/v)吐温-20,0.01%(w/v),0.01%(w/v)牛血清白蛋白(BSA)
测序核苷酸
以下定制的双脱氧核苷酸(ddNTP)用于本文所述的方法中。
·7-炔丙基氨基-7-脱氮-ddATP-ATTO-425
·7-炔丙基氨基-7-脱氮-ddGTP-Cy5
·5-炔丙基氨基-ddCTP-ATTO-647N
·5-炔丙基氨基-ddUTP-DY-480XL
体外转录翻译(IVTT混合物)
以下IVTT混合物用于本文所述的方法中。
·
Figure BDA0004148753770000411
体外蛋白合成试剂盒(New England Biolabs(NEB),Ipswich,Massachusetts,USA)
DNA聚合酶
以下聚合酶用于本文所述的方法中。
·Bsm DNA聚合酶,大片段(ThermoFisher Scientific.Waltham,Massachusetts,USA)
·Therminator DNA聚合酶(NEB.Ipswich,Massachusetts,USA)
·测序酶2.0版DNA聚合酶(ThermoFisher Scientific.Waltham,Massachusetts,USA)
·Phire热启动II DNA聚合酶(ThermoFisher Scientific.Waltham,Massachusetts,USA)
步骤a.微珠上的DNA展示
通过每个核酸分子的PCR扩增产生DNA连接的微珠(表2),其中一个引物是微珠连接的,以在每颗微珠上产生约105个核酸分子的同质群体。将微珠分成三管,每管含有不同的多肽编码DNA模板。单独的管中的区室化类似于将微乳液中的每颗微珠区室化。PCR后,这产生了约3×107颗微珠的群体,每颗微珠展示三种多肽编码模板中的一种。根据本领域技术人员已知的方法,还可以使用微乳液区室化PCR来实现这种微珠上的管区室化PCR以产生微珠上展示的许多独特序列。使用流式细胞仪通过单碱基延伸读取序列的一个碱基来对DNA进行测序。使用流式细胞仪可以读出4种多肽的理论最大值(通过单碱基读取上的A、C、T或G来鉴定)。在多颗微珠的每颗微珠上展示三个独特的序列。可以使用本领域技术人员已知的现有测序平台和微乳液方法来实现用于表征大量独特蛋白质群体的通量扩展。
具体地,在含有标准缓冲液和1μM引物bt-微珠_FP和AF647-微珠_RP的单独的反应瓶中,使用Phire热启动II聚合酶,PCR扩增编码功能上不同的FLAG肽表位(3x-OKFLAG、3xwtFLAG和3x-superFLAG)的三种寡核苷酸。将这些基因块置于热循环条件(98℃持续2分钟;随后进行98℃持续15秒,57℃持续15秒和72℃持续30秒的18个循环;然后在72℃下最终延伸2分钟)。通过将40μM的DBCO-微珠_RP与40×过量(1.6mM)的GLSSK-N3肽于室温下在PBS缓冲液中孵育过夜以产生GLSSK-BA_RP来制备连接就绪的反向引物。将3×-OKFLAG、3×-wtFLAG和3×-superFLAG的纯化的PCR产物分别与~107
Figure BDA0004148753770000421
链霉亲和素C1微球(ThermoFisher Scientific,Waltham,Massachusetts,USA)以500μM在25μL的SABB中于室温下孵育30分钟。然后将来自前一步骤的微珠用SABB洗涤两次并重悬于TNaTE中。然后通过流式细胞术分析微珠的等分试样,以通过在用红色激光(618nm,图3A)激发时APC(660±20nm)通道中的高信号证实DNA捕获。然后用以下物质连续洗涤所有微珠以去除Alexa Fluor 647标记的反义DNA链:/>
1.PBS(一次洗涤)
2.TNaTE(一次洗涤)
3.20mM氢氧化钠(NaOH,三次洗涤)
然后将洗涤的微珠悬浮在TNaTE中,并通过流式细胞术证实反义链的去除(图3B)。群体与未包被的微珠无法区分,证实去除了第二条链。此时,三个单独的微珠群体展示了编码它们各自FLAG表位(3x-OKFLAG、3x-wtFLAG、3x-superFLAG)的ssDNA克隆群体。以类似于在乳液PCR过程中分离微珠的方式在空间上分离微珠。
步骤b.微珠上DNA的单碱基测序
然后制备在编码区中展示编码FLAG肽的三种变体(3x-OKFLAG、3x wtFLAG和3x-superFLAG)的三种DNA模板的微珠,用于合成测序。DNA模板被特别设计成在紧接测序引物杂交位点之后的核苷酸处序列不同。使用流式细胞仪作为DNA测序仪,将读取通量限制为单个碱基。在用不同荧光标记的核苷酸(ATTO647N-ddCTP、Cy5-ddGTP和DY480XL-ddUTP)单碱基延伸后,制备微珠以通过细胞仪读取,以基于不同通道中的荧光信号区分微珠上的DNA序列。
DNA寡核苷酸被设计成通过微珠_RP上游紧邻的单个碱基而彼此不同(参见表2中3x-OKFLAG、3x-wtFLAG和3x-superFLAG的下划线碱基)。因此,DNA的同一性可以通过在测序后鉴定在每颗微珠上展示的修饰的ddNTP来确定。具体地,ddGTP的掺入表示互补(有义)链上的胞嘧啶(C),ddUTP的掺入表示有义链上的腺苷(A),ddCTP的掺入表示有义链上的鸟苷(G),以及ddATP的掺入表示有义链上的胸腺嘧啶(T)。将展示编码其各自FLAG表位的ssDNA克隆群体的微珠用100μL SABB洗涤一次并且重悬浮于含有500nM GLSSK-BA_RP的20μLSABB中。然后将微珠与500nM GLSSK-BA_RP在20μL SABB中孵育,加热至63℃持续45秒,并在冰上快速冷却。然后将微珠用50μL的1×Therminator缓冲液洗涤并悬浮于50μL的冷Jena测序缓冲液中,该缓冲液含有1×Therminator(Sigma Aldrich)缓冲液、1μM/ea Jena ddNTP、10nM的GLSSK-RP、0.032U/μL的Bsm酶(Fisher Scientific)和0.008U/μL的Therminator酶(Sigma Aldrich)。然后将微珠加热至65℃持续5分钟,63℃持续20分钟,并在冰上冷却。此时,微珠物理分离成三个群体,每个克隆展示编码FLAG表位的三个DNA序列(3x-OKFLAG、3x-wtFLAG或3x-superFLAG)中的一个和终止核苷酸,终止核苷酸的附着荧光团指示展示哪个表位。该步骤不需要通过微乳液的空间分离,因为每颗微珠仅拾取依赖于已经展示的DNA序列的荧光团标记的ddNTP。具体地,3x-OKFLAG募集ATTO647N-ddCTP(644/669nm激发/发射),3x-wtFLAG募集Cy5-ddGTP(647/665nm激发/发射),以及3x-superFLAG募集DY480XL-ddUTP(500/630nm激发/发射)。虽然ATTO647N和Cy5具有相似的荧光光谱,但FACS仪器足够灵敏以基于APC通道中的相对强度彼此区分(图4A和图4B)。步骤c.肽与DNA包被的微珠上的编码基因的共价附着
使用IVTT实现微珠缀合的DNA分子的表达以产生多肽,随后用分选酶A将产生的多肽与微珠缀合的DNA分子共价缀合。为了建立这种连接,微珠上的核酸分子具有作为捕获部分的5'-GLSSK肽(具有游离的N-末端甘氨酸),并且多肽在DNA中遗传编码具有作为连接标签的N-末端LPETG序列。类似于将微珠分成第二微乳液区室,将微珠区室化为三个单独的管,每个管含有三种不同的DNA构建体。在这些管中,微珠连接的DNA的IVTT表达产生通过分选酶A与核酸连接的多肽,产生与两种DNA连接的微珠。分选酶A由添加到IVTT反应中以与多肽同时产生酶的外源DNA编码。
为了在IVTT期间与生物机制相容,含有编码其各自多肽表位的部分双链DNA的微珠群体的DNA必须通过退火和延伸上游反向引物而成为完全双链。将微珠在含有1×Bsm缓冲液、250μM/ea dNTP、500nM微珠_上游-RP和0.06U/μL Bsm酶的缓冲液中在60℃延伸20分钟。然后将微珠用TNaTE洗涤两次并用水洗涤一次。然后按照制造商的方案将微珠重悬浮于10μL的NEB
Figure BDA0004148753770000441
体外蛋白质合成混合物(IVTT混合物)中,并在37℃孵育2小时。将编码分选酶A的dsDNA(200ng)加入到20μL的NEB IVTT混合物中,并在37℃孵育2小时。孵育后,将4μL分选酶IVTT混合物加入到10μL的各微珠IVTT混合物中。将10×分选酶缓冲液(1.55μL)加入到每个管中(总共三个管)并在4℃孵育过夜。然后将微珠在不同的管中空间分离。
步骤d.在DNA包被的微珠上展示的离散肽表位的序列和结合活性的平行测定
对展示多肽和核酸的微珠群体进行结合测定。将先前经区室化(以便在鉴定DNA时忠实地展示多肽)的微珠混合并与一系列浓度的肽结合抗体进行结合孵育。抗体对微珠展示的多肽具有不同的亲和力。然后将展示具有荧光掺入的碱基的DNA(通过合成测序)和与荧光标记的抗体结合的多肽(多肽结合功能的测定)的微珠置于测序仪器(此处为流式细胞仪)上,以便在同一仪器上读取每颗微珠的序列和结合。
为了确定DNA包被的微珠上的离散肽表位的序列和结合活性,用孵育缓冲液进行洗涤步骤(重复2次)并在孵育缓冲液中重悬浮以除去用过的IVTT混合物和任何非共价附着的多肽。然后将三个微珠群体以相等的比率在新的管中混合。在孵育缓冲液中稀释FITC标记的M2抗FLAG抗体(ThermoFisher Scientific.Waltham,Massachusetts,USA),并制备含有以下浓度的M2抗FLAG抗体的1:2稀释系列:200nM、100nM、50nM、25nM、12.5nM、6.25nM、3.125nM和0nM(无靶标对照)。然后将微珠混合物分入8个管中,去除上清液,并将100uL的给定浓度的M2抗FLAG抗体稀释系列加入到每个管中。然后将微珠在室温孵育1小时。然后对微珠进行两次使用100μL PBS的15分钟洗涤,并重悬于200μL PBS中,并使用流式细胞仪进行测定(图5A-图5C)。此时,使用流式细胞术测定的每颗微珠在15个可能的激发/发射通道的每一个中具有与其相关的荧光值。来自所有微珠的值跨这些通道的分布允许我们高度确定每颗微珠展示哪个FLAG表位。然后,我们门控这些微珠并绘制这些离散群体跨不同浓度的FIT标记的M2抗FLAG抗体的趋势,以确定这些表位的结合特征。在可能的情况下,使用每颗微珠的跨多个通道的荧光来确定掺入的ddNTP的同一性,从而确定每颗微珠上展示的寡核苷酸和肽的同一性。将在相同抗体浓度下含有相同寡核苷酸的微珠聚集,并将其平均荧光信号拟合至以下方程式:
F 平均([T])=F背景+F 最大*([T]/([T]+Kd ))
其中F 平均([T])是肽在给定靶标浓度[T]下的平均荧光信号,F背景是当[T]=0时的背景荧光信号,F 最大是肽在完全结合饱和下观察到的最大荧光信号,以及Kd 是肽的平衡解离常数。将显示三种可能的肽表位之一的微珠的单个混合物分开,并在不同浓度的荧光抗FLAG M2抗体下孵育,并用流式细胞术分析。在每个浓度下从每颗微珠获得的荧光信号足以确定微珠上展示的寡核苷酸的同一性,并且获得微珠上展示的肽的精确平衡结合测量(解离常数)。生物物理测定的准确性通过其与先前测量的这三种肽的亲和力的相关性来证明。
示出了通过两个区室化步骤的过程产生共价展示多肽的同质群体以及其编码DNA的同质群体的微珠的方法:PCR扩增以及多肽表达和缀合。此外,通过在单个仪器上对DNA测序并测定每颗微珠的多肽结合,证明了每种多肽的结合特性与编码该多肽的核酸分子的序列相联系,从而在每颗微珠的基础上确定每种单独多肽的同一性和结合功能。
其他实施方案
在本说明书中提到的所有出版物、专利和专利申请都通过引用并入本文,其程度与每个单独的出版物或专利申请被具体地和单独地指出通过引用并入的程度相同。
虽然本发明已经结合其具体实施方案进行了描述,但是应当理解,它能够进一步修改,并且本申请意欲涵盖本发明的任何变化、用途或适应性改变,这些变化、用途或适应性改变总体遵循本发明的原理,并且包括来自本发明所属领域之内的已知或常规实践的对本发明的偏离,并且可以应用于上文所述的基本特征,并且遵循权利要求的范围。其他实施方案均属于权利要求之内。
序列表
<110> 普罗蒂琳生物科学公司
<120> 用于测定多种多肽的方法
<130> 51351-005001
<160> 23
<170> PatentIn版本3.5
<210> 1
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<220>
<221> MISC_特征
<222> (3)..(3)
<223> Xaa是任何氨基酸
<400> 1
Leu Pro Xaa Thr Gly
1 5
<210> 2
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<220>
<221> MISC_特征
<222> (1)..(1)
<223> Xaa是除Pro、Asp或Glu之外的任何氨基酸
<220>
<221> MISC_特征
<222> (2)..(2)
<223> Xaa是Ile、Leu、Val或Cys
<220>
<221> MISC_特征
<222> (3)..(4)
<223> Xaa是任何氨基酸
<400> 2
Xaa Xaa Xaa Xaa
1
<210> 3
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<220>
<221> MISC_特征
<222> (3)..(4)
<223> Xaa是任何氨基酸
<400> 3
Arg His Xaa Xaa
1
<210> 4
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<220>
<221> MISC_特征
<222> (2)..(2)
<223> Xaa是任何氨基酸
<220>
<221> MISC_特征
<222> (4)..(4)
<223> Xaa是任何氨基酸
<400> 4
Cys Xaa Pro Xaa Arg
1 5
<210> 5
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 5
Leu Leu Gln Gly Ala
1 5
<210> 6
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 6
Val Asp Ser Val Glu Gly Glu Glu Glu Gly Glu Glu
1 5 10
<210> 7
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 7
Asp Ser Leu Glu Phe Ile Ala Ser Lys Leu Ala
1 5 10
<210> 8
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 8
Ala Thr His Ile Lys Phe Ser Lys Arg Asp
1 5 10
<210> 9
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 9
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10
<210> 10
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 10
Asp Ile Pro Ala Thr Tyr Glu Phe Thr Asp Gly Lys His Tyr Ile Thr
1 5 10 15
Asn Glu Pro Ile Pro Pro Lys
20
<210> 11
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 11
Lys Leu Gly Ser Ile Glu Phe Ile Lys Val Asn Lys
1 5 10
<210> 12
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 12
tgcaagtcat cgg 13
<210> 13
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 13
Asp Pro Ala Ala Leu Lys Arg Ala Arg Asn Thr Glu Ala Ala Arg Arg
1 5 10 15
Ser Arg Ala Arg Lys Gly Gly Cys
20
<210> 14
<211> 314
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 14
gggctactac tataatacga ctcactatag ggtaagtgtg gaaggagata tacatatgga 60
ttataaatta gatgatggcg attacaagct cgacgatatt gactataaac tggatgacga 120
caagggttcc ggaagttacc cttatgatgt gcctgactat gccggatctg gcagtgatta 180
taaactcgat gatggagact ataaattaga cgacatcgac tataaactgg acgacgacaa 240
ggggtccggc tcgttacctg aaacaggatg atgagcgggc cgcagggttt tttgctgccg 300
tatgactcat atgc 314
<210> 15
<211> 314
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 15
gggctactac tataatacga ctcactatag ggtaagtgtg gaaggagata tacatatgga 60
ttataaagat gaagatggag actacaaaga cgaagacatt gactacaaag acgaggacct 120
tctcgggagt ggttcttatc cttacgatgt gcccgactac gccgggagcg gctcagatta 180
caaagatgag gacggagatt acaaagatga agatattgac tataaagacg aagatctctt 240
agggtccggc tcgttacctg aaacaggatg atgagcgagc cgcagggttt tttgctgccg 300
tatgactcat atgc 314
<210> 16
<211> 314
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 16
gggctactac tataatacga ctcactatag ggtaagtgtg gaaggagata tacatatgga 60
ttataaagat catgatggtg attacaagga ccatgatatc gactataaag acgacgacga 120
caagggatcg ggtagctatc catatgacgt gccggactat gctggatcag gcagtgacta 180
taaagaccac gatggcgact acaaagacca cgacatcgat tacaaagacg acgacgataa 240
agggtccggc tcgttacctg aaacaggatg atgagcgcgc cgcagggttt tttgctgccg 300
tatgactcat atgc 314
<210> 17
<211> 743
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 17
gggctactac tataatacga ctcactatag ggtaagtgtg gaaggagata tacatatgaa 60
gaagtggacc aaccgtctga tgacgatcgc tggtgtggta ctgatcctgg tagcagcata 120
tctgttcgct aaaccacata tcgataacta cctgcacgat aaagataagg atgaaaagat 180
cgaacaatac gataaaaacg taaaggaaca ggcaagtaaa gataaaaagc agcaggctaa 240
gcctcaaatc ccgaaagaca agtcgaaagt ggcaggttac atcgaaatcc cagatgctga 300
tatcaaagaa ccagtatacc caggtccagc aacgcctgaa caactgaatc gtggtgtaag 360
cttcgcagaa gaaaacgaaa gtctggatga tcaaaatatt agcattgcag gccacacttt 420
cattgaccgt ccgaactatc aatttacaaa tctgaaagca gcaaagaaag gtagtatggt 480
gtacttcaaa gttggtaatg aaacacgtaa gtataaaatg accagcattc gtgatgttaa 540
acctacagat gttggtgttc tggatgaaca aaagggtaaa gataaacaac tgacactgat 600
cacttgtgat gattacaatg aaaagacagg tgtatgggaa aaacgtaaga tcttcgtggc 660
aaccgaggtc aagtgatagc ataacccctt ggggcctcta aacgggtctt gaggggtttt 720
ttgctgccgt atgactcata tgc 743
<210> 18
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 18
gggctactac tataatacga ctcactatag gg 32
<210> 19
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 19
gggctactac tataatacga ctcactatag gg 32
<210> 20
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 20
gcatatgagt catacggcag caaaaaaccc tgcggc 36
<210> 21
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 21
gcatatgagt catacggcag caaaaaac 28
<210> 22
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 22
gcatatgagt catacggcag caaaaaaccc tgcggc 36
<210> 23
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 23
gctcatcatc ctgtttcagg taacgagccg gacc 34

Claims (60)

1.一种高通量分析多种多肽的方法,所述方法包括:
a)提供多颗微珠,其中所述多颗微珠中的微珠与编码多肽的不同的核酸分子缀合;
(b)加工所述编码多肽的核酸分子以产生编码的多肽,其中所述多颗微珠中的所述微珠与所述编码的多肽缀合;
(c)测定所述编码的多肽以鉴定所述编码的多肽的一种或多种特性;
(d)对编码所述多肽的所述核酸分子进行测序以鉴定编码所述多肽的所述核酸分子的序列;以及
(d)将每种多肽的所述一种或多种特性与编码所述多肽的所述核酸分子的所述序列相连接。
2.根据权利要求1所述的方法,其中所述编码的多肽直接与所述微珠缀合。
3.根据权利要求1所述的方法,其中所述编码的多肽与核酸分子缀合,从而使所述多肽与所述微珠缀合。
4.根据权利要求1所述的方法,其中(a)包括将所述多颗微珠中的每颗微珠与核酸分子缀合,每个所述核酸分子编码所述多种多肽中的一种多肽。
5.根据权利要求1所述的方法,其中(b)包括表达所述核酸分子以产生所述多肽并将所述多肽与所述微珠缀合或将所述多肽与所述核酸分子缀合。
6.根据权利要求4所述的方法,其中步骤(a)在第一微乳液液滴中进行。
7.根据权利要求6所述的方法,其中步骤(a)还包括扩增每个所述微乳液液滴内的每个所述核酸分子,从而在每颗所述微珠上产生核酸分子的同质群体。
8.根据权利要求4-7中任一项所述的方法,其中步骤(b)和(c)在第二微乳液液滴中进行。
9.根据权利要求4-8中任一项所述的方法,其中步骤(b)在体外无细胞系统中发生。
10.根据权利要求1-9中任一项所述的方法,其中所述核酸为DNA、cDNA或RNA。
11.根据权利要求1-10中任一项所述的方法,其中所述核酸分子和所述多肽通过表达的蛋白质连接或通过蛋白质反式剪接缀合。
12.根据权利要求1-11中任一项所述的方法,其中所述微珠或所述核酸分子与捕获部分缀合,并且所述多肽包含连接标签,其中所述捕获部分和所述连接标签缀合,从而使所述微珠与所述多肽缀合或使所述核酸分子与所述多肽缀合。
13.根据权利要求12所述的方法,其中所述捕获部分与所述连接标签的缀合由连接酶催化。
14.根据权利要求13所述的方法,其中所述连接酶由第二核酸编码。
15.根据权利要求13所述的方法,其中所述连接酶为分离的酶。
16.根据权利要求13所述的方法,其中所述连接酶为分选酶、环化酶、胰蛋白酶连接酶、肽连接酶、甲酰甘氨酸生成酶、转谷氨酰胺酶、微管蛋白酪氨酸连接酶、磷酸泛酰巯基乙胺基转移酶、SpyLigase或SnoopLigase。
17.根据权利要求16所述的方法,其中:
所述连接酶为分选酶A;
所述捕获部分或所述连接标签之一包含含有游离N-末端甘氨酸残基的多肽;以及
所述捕获部分或所述连接标签中的另一个包含含有氨基酸序列LPXTG(SEQ ID NO:1)的多肽,其中X为任何氨基酸。
18.根据权利要求16所述的方法,其中:
所述连接酶为环化酶1;
所述捕获部分或所述连接标签之一包含含有氨基酸序列X1X2XX(SEQ ID NO:2)的多肽,其中X1为除P、D或E以外的任何氨基酸;X2为I、L、V或C;并且X为任何氨基酸;以及
所述捕获部分或所述连接标签中的另一个包含含有氨基酸序列DHV或NHV的多肽。
19.根据权利要求16所述的方法,其中:
所述连接酶为胰蛋白酶连接酶;
所述捕获部分或所述连接标签之一包含含有氨基酸序列RHXX(SEQ ID NO:3)的多肽,其中X为任何氨基酸;以及
所述捕获部分或所述连接标签中的另一个包含含有氨基酸序列YRH的多肽。
20.根据权利要求16所述的方法,其中:
所述连接酶为全连接酶;
所述捕获部分包含羧酰氨基甲基(OCam);以及
所述连接标签包含多肽,所述多肽包含作为酰基受体亲核剂的游离N-末端氨基酸。
21.根据权利要求16所述的方法,其中:
所述连接酶为甲酰甘氨酸生成酶;
所述捕获部分包含醛反应性基团;以及
所述连接标签包含含有氨基酸序列CXPXR(SEQ ID NO:4)的多肽,其中X为任何氨基酸。
22.根据权利要求16所述的方法,其中:
所述连接酶为转谷氨酰胺酶;
所述捕获部分或所述连接标签之一包含含有赖氨酸残基或游离N-末端胺基的多肽;以及
所述捕获部分或所述连接标签中的另一个包含含有氨基酸序列LLQGA(SEQ ID NO:5)的多肽。
23.根据权利要求16所述的方法,其中:
所述连接酶为微管蛋白酪氨酸连接酶;
所述捕获部分或所述连接标签之一包含含有游离N-末端酪氨酸残基的多肽;以及
所述捕获部分或所述连接标签中的另一个包含含有C-末端氨基酸序列VDSVEGEEEGEE(SEQ ID NO:6)的多肽。
24.根据权利要求16所述的方法,其中:
所述连接酶为微管蛋白磷酸泛酰巯基乙胺基转移酶;
所述捕获部分包含辅酶A(CoA);以及
所述连接标签包含含有氨基酸序列DSLEFIASKLA(SEQ ID NO:7)的多肽。
25.根据权利要求16所述的方法,其中:
所述连接酶为SpyLigase;
所述捕获部分或所述连接标签之一包含含有氨基酸序列ATHIKFSKRD(SEQ ID NO:8)的多肽;以及
所述捕获部分或所述连接标签中的另一个包含含有氨基酸序列AHIVMVDAYKPTK(SEQID NO:9)的多肽。
26.根据权利要求16所述的方法,其中:
所述连接酶为SnoopLigase;
所述捕获部分或所述连接标签之一包含含有氨基酸序列DIPATYEFTDGKHYITNEPIPPK(SEQ ID NO:10)的多肽;以及
所述捕获部分或所述连接标签中的另一个包含含有氨基酸序列KLGSIEFIKVNK(SEQ IDNO:11)的多肽。
27.根据权利要求16所述的方法,其中所述捕获部分包含双链DNA,并且所述连接标签包含多肽,其中所述捕获部分和所述连接标签形成亮氨酸拉链。
28.根据权利要求27所述的方法,其中:
所述捕获部分包含核酸序列TGCAAGTCATCGG(SEQ ID NO:12);以及
所述连接标签包含氨基酸序列DPAALKRARNTEAARRSRARKG GC(SEQ ID NO:13)。
29.根据权利要求1-28中任一项所述的方法,其中每颗所述微珠与100个或更多个拷贝的所述核酸分子缀合。
30.根据权利要求1-29中任一项所述的方法,其中每颗所述微珠与100个或更多个拷贝的所述编码的多肽缀合。
31.根据权利要求1-30中任一项所述的方法,其中步骤(a)的所述多颗微珠包含1×106颗与1×1010颗之间的微珠,其中每颗所述微珠与具有独特氨基酸序列的多肽缀合。
32.根据权利要求1-31中任一项所述的方法,其中将一个或多个拷贝的具有独特氨基酸序列的所述多肽与步骤(a)的所述多颗微珠中的两颗或更多颗微珠中的每一颗缀合。
33.根据权利要求32所述的方法,其中将所述一个或多个拷贝的具有独特氨基酸序列的所述多肽与步骤(a)的所述多颗微珠中的2颗与15颗之间的微珠缀合。
34.根据权利要求1-33中任一项所述的方法,其中在大于40℃的温度下、在大于8.0的pH下和/或在小于6.0的pH下测定每种所述多肽的一种或多种功能或特性中的至少一种。
35.根据权利要求1-34中任一项所述的方法,其中所述多肽的功能或特性是所述多肽的生物活性。
36.根据权利要求1-34中任一项所述的方法,其中所述多肽的一种或多种功能或特性中的至少一种是所述多肽的结合特性。
37.根据权利要求36所述的方法,其中所述结合特性通过配体结合测定、平衡结合测定和/或动力学结合测定来定量。
38.根据权利要求1-34中任一项所述的方法,其中所述多肽的一种或多种功能或特性中的至少一种是所述多肽的酶活性。
39.根据权利要求1-34中任一项所述的方法,其中所述多肽的一种或多种功能或特性中的至少一种是所述多肽的稳定性。
40.根据权利要求39所述的方法,其中所述多肽的稳定性通过热变性测定、化学变性测定或pH变性测定定量。
41.根据权利要求1-40中任一项所述的方法,其中(b)(ii)包括测定所述多肽的两种或更多种、三种或更多种、四种或更多种或五种或更多种特性或功能。
42.根据权利要求41所述的方法,其中测定所述多肽的两种或更多种、三种或更多种、四种或更多种或五种或更多种特性或功能是同时或依次进行的。
43.根据权利要求1-42中任一项所述的方法,其中在多个温度、多个pH水平、多个盐浓度和/或多个缓冲液中测定至少一种功能或特性。
44.根据权利要求1-43中任一项所述的方法,其中所述多种多肽包含抗原文库、抗体文库、酶文库、底物文库或受体文库。
45.根据权利要求44所述的方法,其中所述抗原文库包含一种或多种病毒的病毒蛋白表位。
46.一种将多肽与微珠缀合的方法,所述方法包括:
(a)在第一微乳液液滴中将编码所述多肽的核酸分子与微珠缀合;以及
(b)在第二微乳液液滴中加工所述核酸分子,其中所述加工包括:
(i)表达所述核酸分子以产生所述多肽;以及
(ii)将所述多肽与所述核酸分子缀合。
47.根据权利要求46所述的方法,其中所述多肽与所述核酸分子的缀合由连接酶催化。
48.根据权利要求46所述的方法,其中所述多肽通过表达的蛋白质连接或通过蛋白质反式剪接与所述核酸分子缀合。
49.根据权利要求46所述的方法,其中所述多肽通过形成亮氨酸拉链与所述核酸分子缀合。
50.根据权利要求46所述的方法,其中(a)还包括在所述第一微乳液液滴内扩增所述核酸分子,从而在所述微珠上产生所述核酸分子的克隆群体。
51.根据权利要求46-50中任一项所述的方法,其中(b)(i)在体外无细胞系统中发生。
52.根据权利要求46-51中任一项所述的方法,其中所述核酸为DNA、cDNA或RNA。
53.根据权利要求46-52中任一项所述的方法,其中步骤b(ii)中所述多肽与所述核酸分子的缀合由连接酶催化。
54.权利要求46-53中任一项所述的方法,其中所述连接酶由第二核酸编码。
55.根据权利要求46-54中任一项所述的方法,其中所述连接酶为分离的酶。
56.根据权利要求46-55中任一项所述的方法,其中所述连接酶为分选酶、环化酶、胰蛋白酶连接酶、肽连接酶、甲酰甘氨酸生成酶、转谷氨酰胺酶、微管蛋白酪氨酸连接酶、磷酸泛酰巯基乙胺基转移酶、SpyLigase或SnoopLigase。
57.根据权利要求46-56中任一项所述的方法,其中所述核酸分子与捕获部分缀合,并且所述多肽包含连接标签,其中所述捕获部分和所述连接标签缀合,从而使所述核酸分子与所述多肽缀合。
58.根据权利要求57所述的方法,其中所述连接酶催化所述捕获部分和所述连接标签的缀合,从而催化所述多肽与所述核酸的缀合。
59.根据权利要求57所述的方法,其中所述捕获部分包含双链DNA,并且所述连接标签包含多肽,其中所述捕获部分和所述连接标签形成亮氨酸拉链。
60.根据权利要求46-52中任一项所述的方法,其中b(ii)中所述多肽通过表达的蛋白质连接或通过蛋白质反式剪接与所述核酸分子缀合。
CN202180066419.5A 2020-07-28 2021-07-27 用于测定多种多肽的系统和方法 Pending CN116234927A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063057754P 2020-07-28 2020-07-28
US63/057,754 2020-07-28
PCT/US2021/043297 WO2022026458A1 (en) 2020-07-28 2021-07-27 Systems and methods for assaying a plurality of polypeptides

Publications (1)

Publication Number Publication Date
CN116234927A true CN116234927A (zh) 2023-06-06

Family

ID=80036155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180066419.5A Pending CN116234927A (zh) 2020-07-28 2021-07-27 用于测定多种多肽的系统和方法

Country Status (7)

Country Link
US (1) US20230287490A1 (zh)
EP (1) EP4189085A1 (zh)
JP (1) JP2023537341A (zh)
CN (1) CN116234927A (zh)
AU (1) AU2021318522A1 (zh)
CA (1) CA3187408A1 (zh)
WO (1) WO2022026458A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008005310A2 (en) * 2006-06-30 2008-01-10 Ambit Biosciences Corp. Detectable nucleic acid tag
ES2425066T3 (es) * 2007-04-05 2013-10-11 Speedx Pty Ltd Enzimas y complejos de ácidos nucleicos y métodos para su uso
EP2809783A2 (en) * 2012-02-02 2014-12-10 Invenra, Inc. High throughput screen for biologically active polypeptides
US10876177B2 (en) * 2013-07-10 2020-12-29 President And Fellows Of Harvard College Compositions and methods relating to nucleic acid-protein complexes

Also Published As

Publication number Publication date
EP4189085A1 (en) 2023-06-07
CA3187408A1 (en) 2022-02-03
US20230287490A1 (en) 2023-09-14
JP2023537341A (ja) 2023-08-31
WO2022026458A1 (en) 2022-02-03
AU2021318522A1 (en) 2023-03-23

Similar Documents

Publication Publication Date Title
CA2419490C (en) Functional protein arrays
JP5415264B2 (ja) 検出可能な核酸タグ
EP3857222A1 (en) High throughput epitope identification and t cell receptor specificity determination using loadable detection molecules
Jackson et al. Cell-free protein synthesis for proteomics
US10011830B2 (en) Devices and methods for display of encoded peptides, polypeptides, and proteins on DNA
US20150065382A1 (en) Method for Producing and Identifying Soluble Protein Domains
Girish et al. Site-specific immobilization of proteins in a microarray using intein-mediated protein splicing
US20210254047A1 (en) Proximity interaction analysis
US20220073904A1 (en) Devices and methods for display of encoded peptides, polypeptides, and proteins on dna
AU2002341204A1 (en) Method for producing and identifying soluble protein domains
CN116234927A (zh) 用于测定多种多肽的系统和方法
JP5049136B2 (ja) N末端アミノ酸が標識されたタンパク質の効率的な合成方法
WO2005001086A1 (ja) 固定化mRNA-ピューロマイシン連結体及びその用途
JP2015227806A (ja) 磁性体ゲルビーズを用いた標的分子の高感度検出方法及び検出用キット
He et al. Detection of protein–protein interactions by ribosome display and protein in situ immobilisation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination