CN116802494A - 高通量药物筛选方法 - Google Patents

高通量药物筛选方法 Download PDF

Info

Publication number
CN116802494A
CN116802494A CN202180089376.2A CN202180089376A CN116802494A CN 116802494 A CN116802494 A CN 116802494A CN 202180089376 A CN202180089376 A CN 202180089376A CN 116802494 A CN116802494 A CN 116802494A
Authority
CN
China
Prior art keywords
nuclease
fusion protein
ser
seq
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180089376.2A
Other languages
English (en)
Inventor
伊凡·巴比克
埃尔马·努尔马马多夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nard Biology Co ltd
Original Assignee
Nard Biology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nard Biology Co ltd filed Critical Nard Biology Co ltd
Publication of CN116802494A publication Critical patent/CN116802494A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/536Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
    • G01N33/542Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase with steric inhibition or signal modification, e.g. fluorescent quenching
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L3/00Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
    • B01L3/50Containers for the purpose of retaining a material to be analysed, e.g. test tubes
    • B01L3/508Containers for the purpose of retaining a material to be analysed, e.g. test tubes rigid containers not provided for above
    • B01L3/5085Containers for the purpose of retaining a material to be analysed, e.g. test tubes rigid containers not provided for above for multiple samples, e.g. microtitration plates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/08Geometry, shape and general structure
    • B01L2300/0809Geometry, shape and general structure rectangular shaped
    • B01L2300/0829Multi-well plates; Microtitration plates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/916Hydrolases (3) acting on ester bonds (3.1), e.g. phosphatases (3.1.3), phospholipases C or phospholipases D (3.1.4)
    • G01N2333/922Ribonucleases (RNAses); Deoxyribonucleases (DNAses)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/02Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)

Landscapes

  • Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Clinical Laboratory Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本文提供了适用于部分使用经修饰酶互补测定进行高通量多路复用的方法,该方法可用于筛选测试化合物文库并鉴定抑制感兴趣的靶多肽变性的化合物。

Description

高通量药物筛选方法
相关专利申请
本专利申请要求于2020年11月17日提交的临时专利申请63/114,927的权益,其全部内容通过引用并入本文,包括所有文本、表格和图纸。
序列表
根据37C.F.R 1.821(c),序列表作为ASCII兼容文本文件提交,名称为“062554-0562965_SL_ST25.txt”,创建于2021年11月17日,并且大小为43,786字节。上述文件的内容通过引用全文并入本文。
技术领域
本发明的实施方案涉及用于检测和鉴定与感兴趣的靶多肽相互作用或结合的测试化合物的新型高通量筛选方法。本文所示的方法相对较快,适用于自动化和多路复用。
发明内容
本文提供的方法部分基于一种改进类型的酶互补测定法,该测定法需要组装两个组分,即核酸酶受体和核酸酶供体,它们可组装成能够裂解标记的核酸底物的功能性核酸酶复合物。核酸酶受体作为融合蛋白提供,该融合蛋白包含核酸酶受体(例如,S-标签受体肽)和感兴趣的靶多肽(例如,病毒外壳蛋白)。在某些实施方案中,测定在存在测试化合物和使融合蛋白变性并防止活性核酸酶复合物组装的变性剂(例如,热)的情况下进行。如果测试化合物与靶多肽相互作用和/或结合到靶多肽并抑制融合蛋白的变性,则形成活性核酸酶复合物并且能够检测到标记底物的裂解,从而鉴定与靶多肽(例如病毒外壳蛋白)相互作用的潜在候选药物(即测试化合物)。
在某些方面,本文提供了确定测试化合物是否能够与靶多肽相互作用的方法,该方法包括(a)使融合蛋白与下列物质接触:(i)测试化合物,(ii)变性剂,(iii)核酸酶供体,和(iv)核酸底物;(b)检测由核酸底物产生的裂解产物的量,或从裂解反应中剩余的未裂解(未裂解)底物的量。
在某些实施方案中,(a)的接触包括使细胞或源自细胞的裂解物与下列物质接触:(i)测试化合物、(ii)变性剂、(iii)核酸酶供体和/或(iv)核酸底物,其中细胞或细胞裂解物包含融合蛋白。在一些实施方案中,核酸底物包含一对FRET标记。在一些实施方案中,裂解产物的量包括检测从裂解产物发射的荧光信号的量并获得数据点,并且荧光信号允许鉴定目标饱和剂量、表观平衡解离常数(KD)、靶多肽和测试化合物之间目标结合的半数最大有效浓度(EC50)。
在一些方面,本文示出高通量测定,其包括在多个容器中进行本文所示的方法中的任一种,其中每个容器包含融合蛋白。在一些实施方案中,每个容器包含不同的融合蛋白。在一些实施方案中,该多个容器包括至少96个、至少384个或至少1536个容器。
在一些方面,本文示出包含多个容器的试剂盒,第一容器包含融合蛋白,第二容器包含核酸酶供体,并且第三容器包含核酸底物。
在以下描述、示例、权利要求和附图中进一步描述了本技术的某些方面。
附图说明
附图说明了本技术的实施方案并且不是限制性的。为了清楚和易于说明,附图未按比例绘制,并且在一些情况下,各个方面可被夸大或放大地示出以有利于对具体实施方案的理解。
图1示出了S标签互补策略的一个实施方案的示意图。
图2示出了优化的荧光底物6-FAM-dArUdAdA-6-TAMRA的一个实施方案的化学结构,其中6-FAM是指6-羧基荧光素,6-TAMRA是指6-羧基-四甲基罗丹明。鉴定了在与S-tag互补时被活性RNase S裂解的“易断裂键”。
图3示出了荧光底物被S蛋白与S标签受体肽互补时形成的活性RNase S裂解所导致的荧光发射的示意图。该图示出一对FRET标记的受体荧光染料(A)和供体荧光染料(D)。
图4示出了HEK-293细胞中示例性表达的免疫印迹,其中融合蛋白包含S-tag受体肽(S-tag)和靶多肽(MTH1),其具有或不具有任选的3个氨基酸接头(3aa)或10个氨基酸接头(10aa)。
图5示出了由不具有接头(MTH1-S-标签)或不同大小的接头(MTH1-3aa-S-标签或MTH1-10aa-S-标签)的融合蛋白产生的荧光信号(y轴)随温度变化(x轴)的比较结果。在该测定中,单独的S-标签(即未结合到融合蛋白中的S-标签)无法产生任何信号。不受理论的限制,可能的是S-标签肽在热力学上不稳定,因此当未结合到融合蛋白中时,在热激发下缺乏热熔融曲线。该特性使得S-标签对融合的靶蛋白的贡献最小,并且也使其对于靶结合研究而言是理想的。
图6示出了不同MTH1-S-标签融合蛋白构建体的核酸酶供体量(S蛋白,x轴)和荧光信号(相对光单位,RLU)(y轴)之间的关系。
图7示出了不同细胞数量(图例)的稀释测试结果,其示出了荧光信号(Y轴)随时间(x轴)的变化。该测定中的细胞过表达MTH1-3aa-S标签融合蛋白)。
图8示出了增加温度(x轴)对荧光信号(y轴)的结果以确定细胞中MTH1-3aa-S-标签的聚集温度(Tagg)。
图9示出了在存在抑制剂(测试化合物)的情况下在Tagg下加热细胞后增加抑制剂(测试化合物)浓度(x轴)对荧光信号(y轴)的结果。
图10示出了在50℃下增加抑制剂浓度(y轴)对蛋白质稳定性(y轴)的结果。
图11示出了温育时间(图例)对信号分离的影响随温度(x轴)的变化,其中加热了50μg由MTH1-3aa-S-标签表达细胞制备的细胞裂解物。
图12示出了温育时间(图例)对荧光信号(y轴)的影响随与50μg由MTH1-3aa-S-标签表达细胞制备的细胞裂解物一起温育的克唑替尼(测试化合物和MTH1抑制剂)浓度(x轴)的变化。
图13示出了温育时间(图例)对荧光信号(y轴)的影响随与10μg由MTH1-3aa-S-标签表达细胞制备的细胞裂解物一起温育的克唑替尼(测试化合物和MTH1抑制剂)浓度(x轴)的变化。
图14示出了裂解物(由表达MTH1-3aa-S-标签的细胞制备)的量(图例)对荧光信号(y轴)的影响随温育0.5分钟的克唑替尼(测试化合物和MTH1抑制剂)浓度(x轴)的变化。
图15示出了裂解物(由表达MTH1-3aa-S-标签的细胞制备)的量(图例)对荧光信号(y轴)的影响随温育5分钟的克唑替尼(测试化合物和MTH1抑制剂)浓度(x轴)的变化。
图16示出了裂解物(由表达MTH1-3aa-S-标签的细胞制备)的量(图例)对荧光信号(y轴)的影响随温育10分钟的克唑替尼(测试化合物和MTH1抑制剂)浓度(x轴)的变化。
图17提供了如何使用这些方法产生在一个板中显示出SARS-CoV2病毒的所有蛋白质的分散阵列的示例。
图18提供了如何使用这些方法产生在一个板中显示出SARS-CoV2病毒的所有蛋白质的成排阵列的示例。
图19示出了用于筛选源自例如冠状病毒的病原体蛋白质阵列的示例性策略。微流控芯片是被设计用于更快的信号开发和高含量药物筛选的阵列的另一实施方案。
图20示出了用于筛选源自各种病原体的肽阵列的示例性策略,其示出了病原体阵列(图A)(例如,来自图17-19)如何能够用于测试多种药物(图B),以便测量阵列病原体的每个蛋白质(即靶多肽)的靶结合反应(板C和D)。
图21示出了用于针对小分子化合物(测试化合物)与病原体衍生肽相互作用的能力来筛选该小分子化合物(测试化合物)阵列的示例性策略,以努力鉴定用于药物发现的潜在候选药物。如所展示的,阵列(例如,参见图20)允许通过病毒蛋白(即靶)对变性剂和测试化合物的一般反应来对该病毒蛋白进行排名。阵列允许通过多种药物(测试化合物)的结合效力(诸如有效剂量和/或EC50)对该多种药物进行排名。因此,该系统能够针对病原体的最敏感靶选择最有效的药物。现有的疗法也可使用病原体阵列进行筛选,因此可重新用于治疗,例如COVID-19。
图22示出了对测定的随时间推移的荧光信号产生进行示例性实时监测。S-标签(微标签)荧光信号的产生在20分钟过程中的动力学轨迹。信号的动力学是核酸酶供体(S蛋白)和融合到核酸酶受体(S标签)的靶多肽(MTH1)的酶互补后FRET标记的底物裂解的酶催化反应的结果。
图23A-23C示出了几种微标签(S标签)融合蛋白构建体的示例性热分布图,其揭示了这些标记蛋白的独特热特征。图23A示出EGFR微标记蛋白在热挑战中确定了最大信号温度(Tmax)为59℃。图23B示出MTH1微标记蛋白在热挑战中确定了聚集温度(Tagg)为55℃。图23C示出BCL6微标记蛋白在热挑战中确定了最小信号温度(Tmin)为46.5℃。
图24示出在Tagg温度下加热或未加热的MTH1微标签(S-标签)融合蛋白随时间推移的示例性荧光信号(每分钟相对光单位(RLU))。未加热的样品迅速产生荧光信号,该信号在前3分钟内达到峰值,之后由于FRET标记底物的耗尽(通过裂解)导致荧光信号产生减少。加热后的样品含有较少的微标签蛋白(MTH1-3aa-S-标签融合蛋白),并且示出底物的消耗(裂解)较慢。
图25A-25B示出了BCL6-微标签(BCL6-S-标签融合蛋白)与BI-3812和BI-5273抑制剂的示例性测试。微标记的BCL6在HEK293细胞中表达,并且用抑制剂(图25A)BI-3812和无活性类似物(图25B)BI-5273处理来自这些细胞的裂解物。将样品在Tmin下加热,并在与S蛋白(核酸酶供体)和FRET标记的底物一起温育4分钟后到检测荧光信号(相对光单位)。
图26A-26C示出在15分钟后,荧光峰确定目标饱和剂量。图26A示出了15分钟后检查图25A中所示反应以确定目标饱和剂量。图26B示出去除高于饱和剂量的数据点允许S形(Sigmodial)剂量反应曲线拟合来确定靶结合的EC50,该EC50与在早期时间点(在图25A-25C中)确定的相同。图26C示出可观察到的荧光信号数据也可使用GraphPad Prism拟合到饱和结合方程(单点总数)以确定药物与蛋白质靶标结合的表观平衡解离常数(表观KD)。
图27A-27E显示了目标饱和剂量、Emax(最大效应(最大荧光信号))、靶结合的EC50和表观KD的示例性确定。图27A示出了测试抑制剂的每种浓度随时间推移的荧光的动力学轨迹。图27B示出在较高的药物浓度下,较晚的时间点(5分钟)具有低于较早的时间点(0分钟,动力学轨迹开始时的第一次检测)的信号。这种在较高药物浓度下的信号减小导致了钟形曲线。图27C示出确定产生最大效果(Emax)的药物饱和浓度(目标饱和剂量)的钟形曲线。图27D示出靶结合的EC50可通过将S形剂量响应曲线拟合到早期时间点数据来确定。图27E示出饱和结合曲线可由确定目标饱和剂量产生,并且曲线拟合的非线性回归分析可确定表观平衡解离常数KD。靶结合的EC50和表观KD相同,从而展示出荧光读数与药物结合成正比,并且可用于确定表观亲和结合常数。
图28A-28C示出了目标饱和剂量、Emax、靶结合的EC50和(S)-克唑替尼与MTH1微标签蛋白结合的表观KD的示例性确定。图28A示出了在抑制剂(S)-克唑替尼浓度增加的情况下在55℃下加热MTH1微标签蛋白(MTH1-3aa-S-标签融合蛋白)后,在酶互补反应2分钟后的得自荧光检测的靶结合的EC50。图28B示出了10分钟后反应的荧光检测和钟形曲线拟合以确定目标饱和剂量和Emax。图28C示出了使用GraphPad Prism的饱和结合曲线拟合(一个位点-总计)以确定表观KD
图29A-29B示出了由UV-B暴露诱导的示例性变性和由UV诱导损失引起的蛋白质药物稳定化。在图29A中,使细胞裂解物暴露于UV-B并持续指定时间,并通过离心去除聚集和不溶性部分。显示的是蛋白质GSK3β和肌动蛋白的免疫印迹。在暴露于UV-B增加后,这两种蛋白质都变性并变得不溶。在图29B中,在存在GSK3β抑制剂(CHIR99021)的情况下,当裂解物暴露于UV-B并持续4分钟时,靶结合由GSK3β蛋白的稳定化表示。非特异性对照GAPDH在由GSK3β特异性抑制剂的UV-B诱导变性中不稳定。
图30示出了蛋白质的示例性微波辐射(MWI)诱导变性。将细胞裂解物暴露于微波辐射并持续指定的时间,并通过离心去除变性和聚集的不溶性蛋白质。可溶性级分用于蛋白质GSK3β的免疫印迹分析。
具体实施方式
在一些实施方案中,本文提供了用于监测细胞内药物-靶结合的靶独立性平台。在一些实施方案中,该平台基于以下前提利用细胞热转移测定(CTSA)的修改,即在加热时,随着掩埋的疏水性位点变得暴露,蛋白质将开始展开、变性并形成不溶性聚集体。发生蛋白质熔融和聚集的平均温度或绝对温度通常被描述为Tagg(或Tm)。热诱导的聚集有时被一个小分子改变,该小分子可多肽间接与相互作用或直接结合,从而导致Tagg的可检测偏移(称为热偏移)。对于一些CTSA检测,不溶性聚集蛋白通过离心去除,而通过小分子的相互作用或结合稳定的可溶性蛋白保留在可溶性级分中。剩余的可溶性蛋白质的量可通过各种蛋白质检测方法诸如蛋白质印迹来确定。此类方法通常是耗时、昂贵且冗长的;需要特殊训练来进行;因此不适用于高通量药物筛选方法。高通量药物发现需要一种快速且廉价的方法,该方法可用于在相对较短的时间内筛选大量化合物以鉴定出新的药物候选者。
本文提供了一种改进的酶互补测定,其可用于化合物的高通量筛选,所述化合物在暴露于热(例如,CTSA)或其他变性剂(例如,紫外线、微波、辐射或化学变性剂)时稳定选定的靶多肽。本文利用的改进的酶互补测定部分地基于(i)核酸酶供体和(ii)核酸酶受体的组装,当组装时,它们形成功能性核酸酶复合物,该功能性核酸酶复合物能够裂解侧接有一对FRET标记的小核酸底物(例如,FRET标记的核酸底物)。在一些实施方案中,本文利用的改进的酶互补测定部分地基于(i)核糖核酸酶(RNase)供体和(ii)S标签受体肽的组装,当组装时,它们形成功能性RNase酶复合物,该功能性RNase酶复合物能够裂解侧接有一对FRET标记的核酸底物(例如,FRET标记的DNA/RNA底物)。通过检测裂解的核酸FRET标记底物的存在或量(图1)来监测该测定,该底物在裂解时提供可检测信号。S-标签受体肽作为融合蛋白提供,该融合蛋白包含S-标签受体肽和感兴趣的靶多肽。如果靶多肽由于变性剂的存在而变性和聚集,则聚集的融合蛋白的S-标签受体肽部分不能与RNase受体结合。因此,当靶多肽变性时,不形成活性RNase复合物,也检测不到裂解产物。如果测试化合物与靶多肽相互作用,并且由于该相互作用,阻止了靶多肽的变性,则形成功能性RNase酶复合物,并检测到FRET标记的DNA/RNA底物的裂解。使用这种方法,可鉴定出与感兴趣的靶多肽(诸如病原体的蛋白质)相互作用的测试化合物,以鉴定出例如药物候选者。本文所示的测定方法可用作高通量平台,以快速有效的方式筛选测试化合物库。
在一些实施方案中,测定的融合蛋白可使用合适的方法由细胞表达。然后可在存在变性剂(例如热)的情况下使包含融合蛋白的细胞与测试化合物接触以确定测试化合物是否可防止靶多肽变性。与传统筛选方法相比,本文所示的测定方法有许多优点。例如,(i)本文的测定方法非常快速,使得裂解的FRET标记的DNA/RNA底物可在几秒到几分钟内检测到,(ii)S-标签受体肽相对较小,并且如本文所确定的,不干扰融合蛋白的较大靶多肽部分的变性,(iii)该测定消除了对进行蛋白质印迹分析的需要,(iv)该测定相对便宜,(v)该测定可作为多重测定实施以筛选数百甚至数千种测试化合物,(vi)可实时监测该测定,(vii)测定设计和实时监测可提供药物与靶多肽结合的定量测量,并且(viii)该测定适用于自动化。
融合蛋白
在一些实施方案中,该方法包括使融合蛋白与测试化合物、变性剂、核酸酶供体和核酸底物中的一种或多种接触。在一些实施方案中,该方法包括使融合蛋白与测试化合物、变性剂、RNase供体和侧接有一对FRET标记的核酸底物(例如,FRET标记的RNA底物)中的一种或多种接触。在某些实施方案中,融合蛋白包含靶多肽和核酸酶受体。在一些实施方案中,核酸酶受体为S标签受体结构域。在一些实施方案中,融合蛋白包含靶多肽和S标签受体肽。
融合蛋白可包含一个或多个或两个或更多个核酸酶受体。在一些实施方案中,融合蛋白可包含一个或多个或两个或更多个S-标签。任何合适的感兴趣靶多肽均可用于本文的方法。靶多肽和核酸酶受体(例如,S-标签受体肽)可通过合适的共价键或接头连接。接头的非限制性示例包括一个或多个氨基酸、肽接头、烷烃、PEG、任选取代的C1-C50烷基、任选取代的C2-C50烯基、炔基、酰基、酰氧基、烷氧基、芳氧基、环烷基、环烯基、环烷氧基、芳基、氨基羰基、叠氮基、羧基、硅烷、硫醇、亚砜、砜、磺酸酯、氰基、酰胺、氨基、酯、膦酸、其他合适的聚合物、其衍生物等以及它们的组合。在一些实施方案中,接头包含肽,该肽含两个或更多个氨基酸、2至100个氨基酸、5至100个氨基酸、2至50个氨基酸、5至50个氨基酸、2至25个氨基酸、5至25个氨基酸的肽酸、2至20个氨基酸、5至20个氨基酸、2至10个氨基酸或5至10个氨基酸。在一些实施例中,接头包含具有1至20个、1至10个或1至5个氨基酸的肽。在一些实施方案中,融合蛋白通过将靶多肽附接至核酸酶受体(例如,S-标签受体肽)来组装,例如通过使用合适的连接化学。在一些实施方案中,融合蛋白使用合适的表达系统表达为包含核酸酶受体(例如,S-标签受体肽)和靶多肽的单个连续多肽。在一些实施方案中,靶多肽附接到核酸酶受体(例如,S-标签受体肽)的C端。在一些实施方案中,靶多肽附接到核酸酶受体(例如,S-标签受体肽)的N端。
在一些实施方案中,融合蛋白包含靶多肽和核酸酶受体。在一些实施方案中,融合蛋白包含靶多肽和核酸酶。在一些实施方案中,融合蛋白包含靶多肽、核酸酶的N-端结构域和第一结构域,该第一结构与允许N-端结构域二聚化为相同核酸酶的与第二结构域融合的C端结构域,该第二结构域与允许二聚化的结构域互补。在一些实施方案中,核酸酶受体是S标签供体肽并且核酸酶是S蛋白。在一些实施方案中,设计了分裂-Cas9系统,其中核酸酶结构域和螺旋结构域被单独地克隆和表达,然后在受控反应中互补。这实现了更加可控的Cas9酶的核酸酶活性。这些结构域或其子结构域中的任一者均可与靶多肽融合,然后与细胞靶结合系统中的其余酶互补(Wright AV et al.“Rational design of a split-Cas9enzyme complex.”Proceedings of the National Academy of Sciences of the UnitedStates of America vol.112,10(2015):2984-9.doi:10.1073/pnas.1501698112)。在一些实施方案中,核酸酶选自Cas9、微球菌核酸酶、RNase H、非天然核酸酶杂交体诸如Cas9-Fok1和Cpf1/Cas12a。在一些实施方案中,核酸酶是Cas9,允许二聚化的第一结构域是Coh2,而第二结构域是DocS。Coh2和DocS是两种以高亲和力相互作用的热纤梭菌蛋白。可设计Coh2-DocS互补系统,其中这些蛋白质或其结构域或子结构域中的任一者与靶多肽融合,然后与细胞靶结合系统中的Coh2-DocS复合物的其余部分互补(Yu Y et al.Engineering afar-red light-activated split-Cas9 system for remote-controlled genomeediting of internal organs and tumors.Sci Adv.2020;6(28):eabb1777.Published2020Jul 10.doi:10.1126/sciadv.abb1777)。
在一些实施方案中,信号控制剂是任何任选的化合物或兴奋剂,其可控制互补活性酶的酶活性、控制靶结合反应的开始、控制该反应的速度和/或控制反应的持续时间/成熟度。在一些实施方案中,信号控制剂为抗体、化学品、肽、温度、UV、微波或光。在一些实施方案中,信号控制剂为远红光。在一些实施方案中,Coh2和DocS结构域的结合通过信号控制剂实现,其中信号控制剂为远红光。
融合蛋白可包含一个或多个接头。在一些实施方案中,融合蛋白包含靶多肽和核酸酶受体结构域之间的一个或多个接头。在一些实施方案中,融合蛋白包含靶多肽和核酸酶之间的一个或多个接头。在一些实施方案中,融合蛋白包含靶多肽和核酸酶的N端结构域以及第一结构域之间的一个或多个接头,该第一结构域允许N端结构域二聚化为融合至相同核酸酶的C端结构域,该C端结构域融合到与允许二聚化的结构域互补第二结构域。
核酸酶
本文的方法部分依赖于功能性核酸酶复合物的组装,其中第一核酸酶的N-端结构域和第二核酸酶的C-端结构域可组装以形成能够裂解核酸底物的活性酶复合物。本文的方法部分依赖于功能性RNase酶复合物的组装,其中第一RNase酶的N端结构域和第二RNase酶的C端结构域可组装以形成能够裂解FRET标记的RNA或DNA/RNA底物的活性酶复合物。一些实施方案中,合适的RNase具有结构域结构,使得(i)蛋白质的N端部分可以与蛋白质的C端部分分开,(ii)分离的N端和C端部分没有酶活性,并且(iii)RNase的分离的N端部分和分离的C端部分可以在非共价方式自组装以形成功能性RNase酶。可用于本文方法的合适的RNase蛋白质的非限制性示例包括牛RNase A(登录号AAB35594;UniprotKB P61823));人类RNase A(NCBI登录号NP_002924.1);黑猩猩RNase A(NCBI登录号XP_520673.1);犬RNase A(NCBI登录号XP_532618.2);小鼠RNase A(NCBI登录号NP_035401.2);大鼠RNase A(NCBI登录号XP_223969.2);它们的同源物等,及其具有RNase活性的衍生物。在一些实施方案中,RNase是牛胰腺RNaseA(例如,UniProtKB P61823)或其衍生物,其具有以下成熟蛋白质的序列:KETAAAKFERQHMDSSTSAASSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFDASV(SEQ ID NO:21),其中划线部分代表蛋白质的S-标签肽序列。
在一些实施方案中,核酸酶是核糖核酸酶或脱氧核糖核酸酶。在一些实施方案中,核酸酶是核糖核酸酶。在一些实施方案中,核酸酶是脱氧核糖核酸酶。
在一些实施方案中,核酸酶是序列特异性核酸酶。在一些实施方案中,核酸酶是成簇规则间隔的短回文重复序列(CRISPR)缔合蛋白质(即,Cas蛋白)。在一些实施方案中,Cas蛋白是Cas9(Csn1)、Cas12a(Cpf1)、Cas12b(C2c1)、Cas13a(C2c2)、Cas13b(C2c6)或Cas13c(C2c7)。在一些实施方案,Cas蛋白是Cas9。
在一些实施方案中,核酸酶是非天然核酸酶杂交体。在一些实施例中,非天然核酸酶杂交体是Cas9-Fok1。
在一些实施方案中,核酸酶是RNase。在一些实施方案中,RNase是RNase A、RNaseH或RNase S。
在一些实施方案中,核酸酶是微球菌核酸酶。
核酸酶供体
在一些实施方案中,核酸酶供体是核酸酶。在一些实施方案中,核酸酶供体包含合适的核酸酶的C端部分或由其组成。在一些实施方案中,核酸酶供体是RNase供体。在一些实施方案中,RNase供体包含合适的RNase的C端部分或由其组成。在一些实施方案中,RNase供体是RNase S蛋白。在一些实施方案中,RNase供体是RNase S复合物的S蛋白。在一些实施方案中,RNase S是包含RNase A的两个蛋白水解片段的复合物。可使用合适的方法制备RNase供体(例如,RNase S蛋白)。在一个非限制性示例中,通过用枯草杆菌蛋白酶处理RNase A来制备RNase供体,该枯草杆菌蛋白酶在适当条件下裂解RNase的单个肽键,从而提供N端部分(即S-肽,例如,约15-25个氨基酸)和C端部分(即S蛋白,例如约90至120个氨基酸)。在另一个非限制性示例中,使用重组技术制备RNase供体,使得RNase的C端(S蛋白)部分使用合适表达系统表达。分离的RNase供体基本上没有酶活性(例如RNase活性)直至其接触合适的S标签受体肽。
在一些实施方案中,RNase供体包含与以下氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%或100%同一性的氨基酸序列:MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKN GQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPV HFDASV(SEQ ID NO:19)或MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKN GQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFD(SEQ ID NO:20)。在一些实施方案中,RNA酶供体包含多肽,该多肽包含SEQ ID NO:19或SEQ ID NO:20的氨基酸序列的至少85个、至少90个、至少95个或至少100个连续氨基酸。
核酸酶供体的衍生物可包含保守氨基酸取代物或氨基酸类似物。在一些实施方案中,核酸酶供体包含合适的氨基酸标签(例如,组氨酸标签、Flag标签等)。在一些实施方案中,RNase供体的衍生物可包含保守氨基酸取代物或氨基酸类似物。在一些实施方案中,RNase供体包含合适的氨基酸标签(例如,组氨酸标签、Flag标签等)。
核酸酶受体
在一些实施方案中,核酸酶受体或核酸酶受体结构域是允许组装功能性核酸酶复合物的结构域,其中第一核酸酶的N-端结构域和第二核酸酶或相同的第一核酸酶的C-端结构域可组装以形成能够裂解核酸底物的活性酶复合物。在一些实施方案中,核酸酶受体是包含合适的S-标签的受体肽。核酸酶受体肽通常包含核酸酶蛋白的相对小的N端部分或由其组成。S-标签受体肽通常包含RNase蛋白的相对小的N端部分或由其组成。当S-标签肽与RNase供体(例如S蛋白)非共价缔合时,其赋予RNase酶活性。任何合适的S-标签受体肽和RNase供体组合都可用于本文的方法。S-标签受体肽和RNase供体的各种组合可很容易地测试用于本文的方法而不需要过度的实验。通常,源自一个物种的S-标签受体肽将与源自另一物种的RNase供体缔合,以形成功能性酶复合物。在一些实施方案中,S标签肽的衍生物和/或RNase供体的衍生物可用于本文的方法。
在一些实施方案中,核酸酶受体肽的长度在10至60个氨基酸、10至40个氨基酸、15至30个氨基酸、15至25个氨基酸、10至25个氨基酸或8至25个氨基酸的范围内。在一些实施方案中,核酸酶受体肽包含约15至25个氨基酸、由其组成或基本上由其组成。在某些实施方案中,核酸酶受体肽没有可检测的二级结构。在某些实施方案中,核酸酶受体肽是高度可溶的。在某些实施方案中,核酸酶受体肽在中性pH下没有净电荷。
在一些实施方案中,S标签受体肽的长度在10至60个氨基酸、10至40个氨基酸、15至30个氨基酸、15至25个氨基酸、10至25个氨基酸或8至25个氨基酸的范围内。在一些实施方案中,S标签受体肽包含约15至25个氨基酸、由其组成或基本上由其组成。在某些实施方案中,S-标签受体肽没有可检测的二级结构。在某些实施方案中,S-标签受体肽是高度可溶的。在某些实施方案中,S-标签受体肽在中性pH下没有净电荷。
在一些实施方案中,S-标签受体肽包含具有氨基酸序列的肽或由其组成,该氨基酸序列与选自以下的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%或100%同一性:KETAAAKFERQHMDSSTSAA(SEQ ID NO.:1),KETNWAWFWDQHMDSSTSA(SEQ ID NO:2),KETGWALFVQQHMDSSTSA(SEQ ID NO:3),KETVMANFQMQHMDSSTSA(SEQ ID NO:4),KETGDAVFARQHMDSSTSA(SEQ ID NO:5),KETGWAAFVKQHMDSSTSA(SEQ ID NO:6),KETGWATFVEQHMDSSTSA(SEQ ID NO:7),KETKLAFFLKQHMDSSTSA(SEQ ID NO:8),KETWWAWFFGQHMDSSTSA(SEQ ID NO:9);KETTWAEFTWQHMDSSTSA(SEQ ID NO:10),KETPWASFNKQHMDSSTSA(SEQ ID NO:11),KETAMAMFVTQHMDSSTSA(SEQ ID NO:12),KETLWAWFMWQHMDSSTSA(SEQ ID NO:13),KETAAAKFERQHMDS(SEQ ID NO:14),KETAAAKFERQHMNS(SEQ IDNO:15),NRAWSEFLWQHLAPV(SEQ ID NO:16),NRGWSEFLWQHHAPV(SEQ ID NO:17)和NRAWSVFQWQHIAPA(SEQ ID NO:18),及其衍生物。在一些实施方案中,S-标签受体肽包含选自下列的氨基酸序列的至少10个、至少11个、至少12个、至少13个、至少14个或至少15个连续氨基酸:SEQ ID NO.:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17和SEQ ID NO:18,及其衍生物。在一些实施方案中,S-标签受体肽是下列中所公开的S-肽:Backer et al.(2002)Protein Expression andPurification 26:455-461;Dwyer et al.(2001)Biochemistry40(45):13491-500;Kimand Raines(1993)Protein Science 2:348-356;以及Beintema,J.J.(1987)LifeChem.Rep.4:333-389,其通过引用并入本文。S-标签受体肽的衍生物可包含保守氨基酸取代物或氨基酸类似物。在某些实施方案中,可使用Yu and Smith(1996)Methods inEnzymology 267,3-27;以及Goldberg et al.(1999)PNAS 96:2019–2024中描述的方法制备和/或选择S-标签受体肽。
靶多肽
融合蛋白可包含感兴趣的合适靶多肽。在一些实施方案中,靶多肽的长度在10至1000个、10至500个、10至250个、10至125个或10至50个氨基酸的范围内。在某些实施方案中,靶多肽包含源自合适病原体的多肽或其部分,其非限制性示例包括病毒、细菌、真菌和寄生虫。病毒的非限制性示例包括腺病毒科、乳多空病毒科、细小病毒科、疱疹病毒科、痘病毒科、环斑病毒科、多脂多糖病毒科、呼肠孤病毒科、小核糖核酸病毒科、杯状病毒科、披膜病毒科、沙粒病毒科、黄病毒科、正粘病毒科(例如流感病毒)、副粘病毒科的病毒病毒科、布尼亚病毒科、弹状病毒科、丝状病毒科、冠状病毒科(例如SARS、SARS-CoV-2、MERS、HKU1)、星状病毒科、博尔病毒科、动脉病毒科、轮状病毒和肝炎病毒科。在某些实施方案中,该病毒是SARS-Cov2冠状病毒。在某些实施方案中,病毒是流感病毒。在某些实施方案中,病毒是甲型、乙型或丙型肝炎病毒。在某些实施方案中,病毒是疱疹病毒。在一些实施方案中,病原体是细菌。在某些实施方案中,细菌是幽门螺杆菌、结核分枝杆菌或分枝杆菌。
在一些实施例中,靶多肽被修饰。多肽的修饰的非限制性示例包括一个或多个氨基酸取代、缺失或添加。例如,在一些实施方案中,本文的方法作为使用多个容器(例如,微量滴定孔)的多重或高通量测定进行,其中每个孔包含不同的融合蛋白,每个融合蛋白包含不同的靶多肽。不同的靶多肽可以为不同的蛋白质和/或靶多肽的修饰。在一个非限制性示例中,靶多肽是病毒衣壳蛋白(例如,SARS-Cov2的刺突蛋白,或流感病毒的血凝素蛋白),并且每个容器或微量滴定孔都包含病毒衣壳蛋白的不同修饰(例如,随机或计算机生成的突变)。
在一些实施方案中,靶多肽是天然存在的多肽或其一部分。在一些实施方案中,靶多肽是合成的。在一些实施方案中,靶多肽是天然产生或重组产生的。在一些实施方案中,靶多肽包含蛋白质或蛋白质的一部分,即分离、纯化和/或重组表达为可溶性蛋白质(例如,分离、纯化或表达为可溶性融合蛋白)。在一些实施方案中,靶多肽或融合蛋白在细胞中或细胞上表达。在一些实施方案中,靶多肽或融合蛋白在细胞表面上表达。在某些实施方案中,细胞是合适的真核细胞(例如,哺乳动物细胞)。在某些实施方案中,细胞是原核细胞(例如,细菌)。
在一些实施方案中,靶多肽是mutT同源物1(MTH1)。在一些实施方案中,核酸酶受体是S标签肽。在一些实施方案中,在MTH1和S-tag肽之间没有接头。在一些实施方案中,MTH1-S-标签构建体的氨基酸序列以SEQ ID NO:25示出。
测试化合物
本文的方法可用于筛选任何合适的测试化合物或测试化合物库。
如本文所用,短语“测试化合物”是指可使用本文所述方法针对与感兴趣的靶多肽相互作用或结合的能力被筛选的任何合适的化合物。测试化合物的非限制性示例包括小化合物(例如有机或无机小分子)、大化合物(例如大于5000Da)、多糖、碳水化合物、糖、脂肪酸、脂质、生物大分子(例如肽、多肽、蛋白质、肽类似物和衍生物、肽模拟物、核酸、核苷酸、核苷酸类似物)、天然存在的或合成的化合物、结合剂(例如抗体或其结合片段,包括非天然存在的和合成的结合剂(例如,TandAbs、纳米抗体、核酸适体、BiTEs、SMIPs、DARPins、DNLs、亲合体、Duocalins、adnectins、fynomers、Kunitz Domains Albu-dabs、DARTs、DVD-IG、Covx-bodies、肽体、scFv-Igs、SVD-Igs、dAb-Ig、Knob-in-Holes、triomAb等)、其衍生物、其聚合物、其盐、其异构体、其多晶型物以及它们的组合。在一些实施方案中,测试化合物包含在由生物材料制成的提取物中,例如细菌、植物、真菌、动物细胞或动物组织的提取物。在一些实施方案中,测试化合物包含在生物流体中。因此,在一些实施方案中,测试化合物包含提取物或生物流体。小化合物包括分子量大于约40道尔顿(Da)但小于5000Da、小于3000Da或小于1000Da的分子。小化合物可包含任何合适的化学部分或基团,其非限制性示例包括烷烃、烯烃、炔烃、醇、卤素、酮、醛、羧酸、醚、酯、胺、酰胺、饱和、部分饱和或不饱和环结构、核苷酸、核苷、多原子非金属(例如,P、S、Se)、过渡金属、后过渡金属、准金属等、其盐、以及它们的组合。
在某些实施方案中,测试化合物包括合适文库的合成或天然存在的化合物。许多小分子文库是本领域已知的,其中一些可商购获得。可商购获得的化合物文库可获自例如ArQule、Pharmacopia、graffinity、Panvera、Vitas-M Lab、Biomol International和Oxford。用于开发基于小分子、聚合物和基因组的文库的方法在例如Ding,et al.JAm.Chem.Soc.124:1594-1596(2002)以及Lynn,et al.,J.Am.Chem.Soc.123:8155-8156(2001)中有所描述。也可使用来自例如NIH Roadmap、分子文库筛选中心网络(MLSCN)的化合物文库。可使用任何合适的方法来制作小化合物文库。可使用本文所述的合适方法筛选化合物文库。
在某些实施方案中,测试化合物的分子量为40至500,000Da、40至200,000Da、40至100,000Da、40至50,000Da、40至25,000Da、40至10,000Da、40至5000Da或40至1000Da。在某些实施方案中,测试化合物的分子量为5000至500,000Da、10,000至500,000Da、25,000至500,000Da或5000至100,000Da。
测试化合物可在任何合适的浓度下测试。在一些实施方案中,测试化合物在至少1pM、至少10pM、至少100pm、至少1nM、至少10nM、至少100nM、至少1μM、至少10μM,至少100μM或至少1mM的浓度下测试。在一些实施方案中,测试化合物在1pM至100mM、1pM至10mM、1pM至1mM、10pM至100mM、10pM至10mM、10pM至1mM、100pM至100mM、100pM至10mM或100pM至1mM范围内的浓度下测试。在一些实施方案中,测试化合物以小于100mM、小于10mM、小于1mM或小于100nM的浓度进行测试。在一些实施方案中,测试化合物在一种或多种不同浓度下进行测试或测定。
底物
在一些实施方案中,融合蛋白和/或核酸酶供体,或包含融合蛋白和核酸酶供体的混合物或细胞与合适的核酸底物接触。在一些实施方案中,融合蛋白和/或RNase供体,或包含融合蛋白和RNase供体的混合物或细胞与合适的核酸底物接触。在一些实施方案中,核酸底物是可由本文公开的核酸酶或本文所示的组装的核酸酶酶复合物裂解的核酸。在一些实施方案中,核酸底物是可由本文公开的RNase或由本文所述的组装的RNase复合物(例如,包含S-标签受体肽和RNase供体)裂解的核酸。在一些实施方案中,核酸底物包含RNA和/或DNA。在一些实施方案中,核酸底物包含核糖核苷酸、脱氧核糖核苷酸、其类似物或其混合物。核酸底物可以是单链或双链的。在某些实施方案中,核酸底物包含2个或更多个、3个或更多个、5个或更多个或10个或更多个核苷酸。在某些实施方案中,核酸底物包含至少1个嘧啶核苷酸。在某些实施方案中,核酸底物包含至少2个、至少3个或至少4个相邻的嘧啶核苷酸。在一些实施方案中,融合蛋白包含核酸酶或与核酸酶供体接触的核酸酶受体结构域,其中核酸酶或核酸酶供体是核糖核酸酶,诸如Cas9或Cpf1。在一些实施方案中,使核糖核酸酶例如Cas9或Cpf1与指导RNA接触。在一些实施方案中,指导RNA(gRNA)将核糖核酸酶引导至靶核酸底物。
在某些实施方案中,核酸底物包含合适的可检测标记。在某些实施方案中,底物的可检测标记提供可检测信号、可检测信号的变化(例如,信号的增加或减少,或波长偏移),或在标记底物被核酸酶(例如RNase)裂解时可检测信号的损失。在一些实施方案中,从核酸底物的标记发出的可检测信号在底物裂解之前是不可检测的。在一些实施方案中,从核酸底物的标记发出的可检测信号在底物裂解后增强。在某些实施方案中,从核酸底物的标记发出的可检测信号在底物裂解后减少。
可检测标记的非限制性示例包括金属标记、荧光标记、荧光蛋白(例如,绿色荧光蛋白(GFP))、PH敏感蛋白或PH敏感GFP(例如,PHlourin等)、任何合适的荧光团(例如,mCherry)、发色团、化学发光标记、电化学发光标记(例如,OrigenTM)、磷光标记、猝灭剂(例如,荧光团猝灭剂)、荧光共振能量转移(FRET)对(例如供体和受体)、蛋白质(例如酶(例如辣根过氧化物酶、β-半乳糖苷酶、萤光素酶、碱性磷酸酶等))、抗原或其部分、接头、结合对的成员)、酶底物、小分子(例如,生物素、抗生物素蛋白)、质量标签、量子点、纳米粒子等或它们的组合。任何合适的荧光团或发光材料都可以用作可检测标记。荧光标记的非限制性示例包括荧光素、罗丹明、得克萨斯红、藻红蛋白、别藻蓝蛋白、6-羧基荧光素(6-FAM)、2,7-二甲氧基-4',5'-二氯-6-羧基荧光素(JOE)、6-羧基-X-罗丹明(ROX)、6-羧基-2',4',7,4,7-六氯荧光素(HEX)、5-羧基荧光素(5-FAM)或N.N.N',N'-四甲基-6-羧基罗丹明(TAMRA)、花青染料,诸如Cy3、Cy5、Alexa 542、Bodipy 630/650、荧光颗粒、荧光半导体纳米晶体等,以及它们的组合。可检测标记可通过多种合适的技术检测和/或定量,所述技术诸如数字摄影、流式细胞术、凝胶电泳、芯片分析(例如,任何芯片方法)、微阵列、质谱、细胞荧光分析、荧光显微术、共焦激光扫描显微术、激光扫描细胞术、合适的读板器等、以及它们的组合。
在一些实施方案中,核酸底物包含合适的荧光能量转移(FRET)标记。FRET标记的核酸的一个优点是它们可容易地进入完整的细胞,从而可检测整个细胞中底物的裂解。在某些实施方案中,核酸底物包含一对FRET标记,其包含由包含RNA酶可裂解序列的多核苷酸分开的合适的荧光供体/受体对,使得供体的荧光发射被淬灭,直至底物被组装的RNA酶复合物裂解。在某些实施方案中,一对FRET标记包含6-羧基荧光素(6-FAM)和6-羧基-四甲基罗丹明(6-TAMRA)(图2),其通过两个或更多个连续的核苷酸分开。在一些实施方案中,核酸底物包含(6-FAM)-X-(6-TAMRA),其中X包含含有2至10个核苷酸的多核苷酸。在一些实施方案中,核酸底物包含6-FAM-dArUdAdA-6-TAMRA(图2),其中rU是尿苷,dA是脱氧腺嘌呤。
在本文所示的方法的某些实施方案中,使用合适的方法确定底物的裂解量。在某些实施方案中,使用合适的方法确定核酸底物的裂解产物的是否存在。在一些实施方案中,使用合适的方法确定一对FRET标记标记的核酸底物是否存在裂解或裂解量。可在细胞或混合物与核酸底物或核酸酶供体接触后在适当时间确定标记的核酸底物是否存在裂解或裂解量。可在细胞或混合物与核酸底物或RNase供体接触后在适当时间确定标记的核酸底物是否存在裂解或裂解量。在一些实施方案中,经标记的核酸底物是否存在裂解或裂解量在一段时间内动态确定,例如以确定裂解速率。可使用合适的阳性对照来确定预定量的裂解产物。例如,阳性对照可利用包含已知蛋白质的融合蛋白和已知在暴露于变性剂时与已知蛋白质相互作用并稳定已知蛋白质的测试化合物,从而允许S-标签受体肽与RNase供体蛋白的互补形成活性核酸酶复合物。被阳性对照的活性核酸酶复合物裂解的核酸底物的存在或量可用作检测与靶多肽相互作用的其他测试化合物的基线。
一对标记有FRET标记的核酸底物的裂解和裂解物检测非常迅速(通常需要少于30秒)(例如,参见图11-13)。因此,在某些实施方案中,FRET标记的底物用于本文所述的高通量方法并允许本文所述方法的自动化。
变性剂
一些实施方案中,融合蛋白与变性剂接触。变性剂的非限制性实例包括(i)热,(ii)紫外光,(iii)微波,(iv)辐射和(iv)化学变性剂。
在某些实施方案中,使融合蛋白与变性剂接触包括使融合蛋白或包含融合蛋白的细胞或混合物与热接触。在一些实施方案中,融合蛋白与足以使融合蛋白变性和/或聚集的量的热接触。在某些实施方案中,使融合蛋白与热接触包括将融合蛋白或包含融合蛋白的细胞或混合物加热到40℃至90℃、40℃至80℃、40℃至75℃、45℃至75℃、50℃至75℃,或55℃至70℃范围内的温度。在某些实施方案中,使融合蛋白与热接触包括将融合蛋白或包含融合蛋白的细胞或混合物加热到至少40℃、至少50℃、至少60℃、至少65℃,或至少70℃的温度。在某些实施方案中,使融合蛋白与热接触包括将融合蛋白或包含融合蛋白的细胞或混合物从约30℃-40℃的温度加热至约50℃至70℃的温度。在某些实施方案中,使融合蛋白与热接触包括使融合蛋白或包含融合蛋白的细胞或混合物暴露于30℃至90℃、30℃至80℃、30℃至75℃、37℃至75℃、37℃至70℃范围内的温度梯度。在一些实施方案中,使融合蛋白与温度梯度接触包括以每分钟至少约1至10℃,或每分钟约1至5℃的速率增加融合蛋白或包含融合蛋白的细胞或混合物的温度。在一些实施方案中,使融合蛋白与热接触包括将融合蛋白或包含融合蛋白的细胞或混合物暴露于热或增加的温度梯度并持续至少30秒、至少1分钟、至少3分钟或至少5分钟的时间段。
在某些实施方案中,使融合蛋白与变性剂接触或暴露于变性剂一段时间。在一些实施方案中,使融合蛋白与变性剂接触或暴露于变性剂并持续至少20秒、至少30秒、至少1分钟、至少3分钟、至少5分钟、至少10分钟、至少15分钟、至少20分钟或至少30分钟的时间段。
在某些实施方案中,使融合蛋白与变性剂接触包括使融合蛋白或包含融合蛋白的细胞或混合物经历一次或多次冻融循环。
在某些实施方案中,使融合蛋白与变性剂接触包括将融合蛋白或包含融合蛋白的细胞或混合物暴露于足以使蛋白质变性的适量电磁辐射,其非限制性示例包括紫外光(例如,图29A和B)、微波(例如,图30)或辐射(例如,β或γ辐射)。在一些实施方案中,蛋白质的变性可用250nm或0.1焦耳/cm2的UV进行5分钟。
在某些实施方案中,使融合蛋白与变性剂接触包括使融合蛋白或包含融合蛋白的细胞或混合物与化学变性剂接触,化学变性剂的非限制性示例包括氧化剂、毒素、酸、碱、致癌物和化疗剂。可以进行简单的常规测试以快速确定使融合蛋白变性所需的化学变性剂的量。在一些实施方案中,融合蛋白或包含融合蛋白的细胞或混合物在存在测试化合物的情况下与化学变性剂接触,并且在使融合蛋白与核酸酶供体(例如RNase供体蛋白)接触之前基本上除去化学变性剂(例如,通过结合洗涤步骤)。在某些实施方案中,使融合蛋白与变性剂接触包括使融合蛋白或包含融合蛋白的细胞或混合物与浓度在1fM至500mM、1pM至100mM、1nM至10mM、1nM至1mM或1nM至100μM范围内的化学变性剂接触。
示例性方法
在一些实施方案中,使融合蛋白与测试化合物和变性剂接触。一些实施方案中,使分离的融合蛋白与测试化合物和/或变性剂接触。在一些实施方案中,使位于细胞内或细胞上或混合物(例如,细胞裂解物)中的融合蛋白与测试化合物和/或变性剂接触。在一些实施方案中,在融合蛋白与变性剂接触之前或之后,使融合蛋白与测试化合物接触。在一些实施方案中,使融合蛋白同时或基本上同时与测试化合物和变性剂接触。在一些实施方案中,使融合蛋白同时与测试化合物和变性剂接触。在一些实施方案中,使融合蛋白同时与测试化合物和变性剂接触。在一些实施方案中,融合蛋白基本上同时与测试化合物和变性剂接触(例如,在前一次接触的几分钟内,融合蛋白依次与测试化合物和变性剂接触)。在一些实施方案中,融合蛋白在细胞中或细胞上(例如,在细胞表面上)表达并且使细胞与测试化合物和/或变性剂接触。
在某些实施方案中,方法包括使细胞与编码或指导融合蛋白表达的核酸接触。例如,在一些实施方案中,方法包括用编码或指导融合蛋白表达的核酸(例如,载体)转染或转化细胞,之后使细胞或细胞裂解物与测试化合物、变性剂、核酸酶供体(例如,RNase供体)和/或核酸底物接触。在某些实施方案中,方法包括使用合适的方法将编码或指导融合蛋白表达的核酸引入细胞中。例如,可使用病毒载体将核酸引入真核细胞中,或使用噬菌体将核酸引入细菌细胞中。
在一些实施方案中,使融合蛋白与核糖核酸酶(RNase)供体和/或核酸底物接触。在某些实施方案中,使包含融合蛋白、测试化合物和/或变性剂的混合物与RNase供体和/或核酸底物接触。在一些实施方案中,使位于细胞内或细胞上或混合物(例如细胞裂解物,例如包含融合蛋白、测试化合物和/或变性剂的混合物)中的融合蛋白与RNase供体和/或核酸底物接触。在一些实施方案中,在融合蛋白与核酸底物接触之前或之后,使该融合蛋白与RNase供体接触。在一些实施方案中,融合蛋白与RNase供体和核酸底物同时或基本上同时接触。
在某些实施方案中,使包含融合蛋白的细胞与变性剂和测试化合物接触,变性剂任选被去除或取出,细胞暴露于核酸酶供体和核酸底物,检测或定量核酸底物的裂解。在某些实施方案中,使包含融合蛋白的细胞与变性剂和测试化合物接触,变性剂任选被去除或取出,细胞暴露于RNase供体和核酸底物,并检测或定量核酸底物的裂解。在一些实施方案中,使包含融合蛋白的混合物或细胞与测试化合物、RNase供体、核酸底物和变性剂基本上同时接触,并且检测和/或定量底物的裂解。例如,细胞可重组产生以表达融合蛋白、RNase供体和/或核酸底物,在一些实施方案中,该表达受一个或多个诱导型启动子控制。然后使细胞或其裂解物与测试化合物和变性剂接触,例如通过添加测试化合物并施加热,同时实时监测包含一对FRET标记的核酸底物的裂解。本文也考虑了这种方法的变型。
在一些实施方案中,在融合蛋白与热接触期间或之后,测定融合蛋白的绝对、平均(average)或平均(mean)聚集温度(Tagg)、最大信号的平均温度(Tmax)或最小信号的平均温度(Tmin)。在一些实施方案中,在不存在测试化合物的情况下测定Tagg、Tmax或Tmin。在一些实施方案中,在存在溶剂对照或对照化合物(例如,已知对融合蛋白的Tagg、Tmax或Tmin没有影响的化合物,或已知增加或减少融合蛋白的Tagg、Tmax或Tmin的化合物)的情况下测定Tagg、Tmax或Tmin。此类对照可用于测定阈值Tagg、Tmax或Tmin(例如,预定阈值),在一些实施方案中,其用于鉴定与靶多肽相互作用或结合的化合物。例如,在某些实施方案中,将融合蛋白的Tagg、Tmax或Tmin改变或移动至高于预定阈值的量的测试化合物通常被鉴定为与靶多肽相互作用或结合的测试化合物。
当电磁辐射、冻融或化学品用作变性剂时,类似的方法可用于鉴定与靶多肽相互作用或结合的测试化合物。例如,可在不存在测试化合物的情况下和/或存在对照化合物的情况下测定临界暴露时间、变性剂浓度、解冻温度、波长或使融合蛋白变性所需的能量以确定预定阈值量。在一些实施方案中,引起阈值量偏移或变化的任何测试化合物均被确定为与融合蛋白的靶多肽相互作用或结合的化合物。
在某些实施方案中,本文所述的方法或测定作为多重测定和/或高通量测定进行,其包括在至少96个、至少100个、至少384个、至少500个、至少1000个、至少1536个、至少5000个或至少10,000个单独的容器中进行该方法。在某些实施方案中,本文所述的方法或测定作为多重测定和/或高通量测定进行,其中该方法的一些或所有步骤在多个容器中基本上同时进行,或同时进行。在一些实施方案中,用于多重测定和/或高通量测定的多个单独容器中的一些或全部与下列物质接触或包含下列物质:不同融合蛋白、不同变性剂、不同测试化合物、不同核酸酶供体、和/或不同核酸底物。在一些实施方案中,用于多重测定和/或高通量测定的多个单独容器中的一些或全部与下列物质接触或包含下列物质:不同融合蛋白、不同变性剂、不同测试化合物、不同RNase供体、和/或不同核酸底物。在一些实施方案中,用于多重测定和/或高通量测定的多个单独容器中的一些或全部接触下列物质或包含下列物质:相同融合蛋白、相同变性剂、相同测试化合物、相同核酸酶供体、和/或相同核酸底物。在一些实施方案中,用于多重测定和/或高通量测定中的多个单独容器中的一些或全部接触下列物质或包含下列物质:相同融合蛋白、相同变性剂、相同测试化合物、相同RNase供体、和/或相同核酸底物。如本文所用,“容器”是指任何合适的容器、管或孔。容器可以是孔,例如微量滴定板中的孔。
在某些实施方案中,本文所述的方法或测定作为多重测定和/或高通量测定进行,其使用表面结合的融合蛋白阵列,融合蛋白阵列通常位于合适的底物(例如,芯片)上的可寻址位置。在一些实施方案中,阵列包含与合适底物的表面结合的至少20个、至少96个、至少100个、至少384个、至少500个、至少1000个、至少1536个、至少5000个或至少10,000个不同融合蛋白。
本文所述的方法和测定提供了比其他类型的互补测定更高的响应性和灵敏度。本文提供的方法可检测低于纳摩尔(nM)水平的活性测试化合物的存在。
在一些实施方案中,在本文所述的方法中,核酸底物包含一种或多种可检测标记。在一些实施方案中,核酸底物包含一种或多种FRET标记。在一些实施方案中,核酸底物包含一对FRET标记,其中裂解产物的量包括检测从裂解产物发出的荧光信号的量并获得数据点,并且其中荧光信号允许鉴定目标饱和剂量、表观平衡解离常数(KD)、靶多肽和测试化合物之间的靶结合的半数最大有效浓度(EC50)。
在一些实施方案中,测试化合物的目标饱和剂量通过酶反应中核酸FRET标记的底物的裂解/耗尽后的峰值荧光值(Emax)来确定。在一些实施方案中,靶多肽和测试化合物之间的表观平衡解离常数(KD)通过绘制饱和结合曲线来确定,其中超过Emax的数据点被排除在曲线图之外。在一些实施方案中,靶结合的EC50由存在过量核酸FRET标记底物的反应中的早期数据点确定。
试剂盒
在一些实施方案中,提供了试剂盒。在一些实施方案中,试剂盒包含多个容器,第一容器包含融合蛋白,第二容器包含核酸酶供体,并且第三个容器包含核酸FRET标记的底物。
在一些实施方案中,融合蛋白包含靶多肽和核酸酶受体。在一些实施方案中,核酸酶受体是S标签受体肽并且核酸酶供体是RNase S。
实施例
实施例1
材料:试剂、细胞系和构建体
以下抗体获自Cell Signaling Technology:兔mAb S-Tag(D2K2V)XP(目录号12774)、抗MTH1(D6V4O)兔mAb(目录号43918)。HEK-293细胞来自ATCC(目录号CRL-1573),并在补充有10%胎牛血清(FBS)(Millipore SIGMA目录号F2442)和1x青霉素/链霉素(Millipore SIGMA目录号P4333)的DMEM(Millipore SIGMA目录号D5796)中培养。胰蛋白酶-EDTA溶液1X(0.05%胰蛋白酶,0.02%EDTA)来自Millipore SIGMA(目录号59417C),并且20X TBS溶液来自Teknova(目录号T1680)。Triton-X-100来自Millipore SIGMA(目录号X100)。MTH1抑制剂(S)-克唑替尼(克唑替尼)来自Millipore SIGMA(目录号PZ0240)。DMSO来自Millipore SIGMA(目录号673439)。96孔板来自CELLTREAT Scientific(目录号229196);白色PCR板来自BIORAD(目录号MLL9651),并且用于密封PCR板的Microseal“B”膜来自BIORAD(目录号MSB1001);来自COSTAR(目录号3915)的黑色96孔板。根据制造商推荐的方案,使用Lipofectamine 2000转染试剂(Thermo Fisher Scientific,目录号11668027)对细胞进行转染。优化的荧光底物(5'-6FAM/ArUAA/3'TAMRA_(NHS酯)(v3))购自IDT。S蛋白在羧基末端处用6xHis标签(SEQ ID NO:34)克隆到载体pET-30a(+)中,以用于使用SynbioTechnologies Inc的KPN1 GGTACC和BamH1 GGATCC克隆位点进行细菌表达。S蛋白His标签融合蛋白从Synbio Technologies Inc.的细菌进行表达和纯化。
编码RNase供体的克隆构建体的序列如下:
编码6x His标签的序列(SEQID NO:34)为粗体,并且TAG终止密码子有下划线。
His标记的RNase供体蛋白(S蛋白)的相应翻译氨基酸序列为:MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKN GQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPV HFDASVHHHHHH(SEQ ID NO:23)。
Synbio Technologies Inc.进行了用mutT同系物(MTH1)蛋白(即靶多肽)对S-标签受体肽进行克隆。如下在载体pcDNA3.1(+)中将S-标签受体肽克隆到MTH1的羧基末端:克隆位点KPN1 GGTACC和BamH1GGATCC(粗体)。
生成的编码构建体在MTH1和S标签肽(带下划线)之间没有接头,如下所示:
包含MTH1和羧基末端S-标签受体肽的所得融合蛋白的翻译氨基酸序列如下所示。S-标签受体肽的20个氨基酸序列标有下划线。确定S-标签可缩短到前15个氨基酸,并且仍然充当S-标签受体肽。
MGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTVKETAAAKFERQHMDSSTSAA(SEQ ID NO:25)。
还生成了融合蛋白的编码构建体,该融合蛋白包含MTH1靶多肽和S-标签受体肽(下划线)之间的3个氨基酸接头(加框),如下所示:
所得融合蛋白的翻译氨基酸序列如下所示,该融合蛋白包含具有3个氨基酸间隔子和羧基末端S-标签受体肽的MTH1靶多肽。S-标签加下划线,3个氨基酸间隔子加框。
还如下所示构建了包含MTH1靶多肽和S-标签受体肽(下划线)之间的10个氨基酸接头(加框)的编码构建体:
/>
具有10个氨基酸间隔子和羧基末端S-标签受体肽的MTH1靶多肽的翻译氨基酸序列如下所示。S标签加下划线,10个氨基酸间隔子加框。
MGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTVAAAAAAAAAAKETAAAKFERQHMDSSTSAA(SEQID NO:29)。
方法:使用S标签(微标签)系统评估药物靶结合的方案
A.动力学读数中的测试细胞数
HEK-293细胞使用Lipofectamine 2000用MTH1-S-标签融合构建体转染。该方案使用反向转染修改,从而将细胞提起并用转染试剂连同DNA一起重新接种。转染后24小时,用胰蛋白酶提起细胞,用1XTBS洗涤并对细胞计数。测试了一系列稀释的细胞数。
在1xTBS(冷TBS)中将细胞稀释至1x106个细胞/ml(即1000个细胞/μl)。在96孔板中使用冷TBS在50μl的最终体积中测试50,000个细胞到1000个细胞范围内的细胞计数。向含有50μl细胞的每个孔中添加50μl室温1%-Triton-X 100的TBS溶液以获得0.5%Triton-X-100的最终浓度。细胞通过上下移液混合,并使其在室温下温育10分钟以温和裂解细胞膜。将每个孔中的80μl转移到黑色costar板中,同时避免气泡,并添加10μl的10XS蛋白(RNase供体)至最终浓度为1ng/μl,然后加入10μl的10X底物(核酸FRET-标记的底物)以获得50nM的最终底物浓度。10X S蛋白(10ng/μl)正好在使用之前在室温下在0.5%triton-X的TBS溶液中制备。10X底物(500nM)正好在使用之前在室温下用dH20制备。
使用PolarStar Omega 96孔板读取器以动力学模式(激发=485nm,发射=520nm)立即读取板。每个板每分钟读取一次,持续10分钟(生成11个时间点)。选择适当的细胞稀释度,在6分钟内提供最高信号而不使信号饱和。
B.通过运行热梯度确定实验的Tagg
将细胞在1xTBS(冷TBS)中稀释至1x106个细胞/ml(1000个细胞/ul)。
在白色PCR板中用冷TBS制备最终体积为50μl的正确细胞稀释液。将板暴露于40℃至64℃的热梯度下并持续15分钟。使用热循环仪(MJ Research PTC-200Peltier ThermalCycler)并允许在室温下静置1分钟,然后添加50μl室温1%Triton-X-100的TBS溶液,最终得到0.5%Triton-X-100。细胞通过上下移液混合,然后将其在室温下温育10分钟。
将来自每个孔的80ul裂解物转移到黑色costar板上,同时避免气泡,然后添加10μl 10X S蛋白(RNase供体)以获得1ng/μl的最终浓度,然后添加10μl 10X底物(核酸底物)以获得50nM最终浓度。使用PolarStar Omega 96孔板读取器以动力学模式(ex=485nm,em=520nm)立即读取板。板每分钟读取一次,持续10分钟。MTH1-S-标签融合蛋白的Tagg被确定为约50℃。
C.测试给定细胞数和Tagg的抑制剂剂量
使用从上述实验确定的最佳细胞数和Tagg来测试抑制剂(即测试化合物)剂量。在1xTBS(冷TBS)中将细胞稀释至1x106个细胞/ml(1000个细胞/ul)。在白色PCR板中用冷TBS制备最终体积为50ul的正确细胞稀释液。添加0.5ul的100X克唑替尼(多靶点小分子酪氨酸激酶抑制剂)的DMSO溶液(或其他待测抑制剂)。对于克唑替尼,EC50在大约50nM的范围内进行测试。对照孔包括在Tagg(50℃)下测试的DMSO(0%稳定性对照)和在40℃下测试的DMSO(100%稳定性对照)。
细胞与抑制剂一起温育40分钟。然后,在冰上,在Tagg下于热循环仪中放置15分钟。(对照孔单独在40℃下加热15分钟),然后在室温下加热1分钟,然后添加50ul室温1%Triton-X-100的TBS溶液,最终得到0.5%Triton-X-100。细胞通过上下移液混合,然后在室温下温育10分钟。将80μl转移到黑色costar板上,同时避免气泡,然后添加10μl的10X S蛋白以获得最终1ng/μl,并添加10μl的10X底物以获得最终50nM。使用PolarStar Omega 96孔板读取器以动力学模式(ex=485nm,em=520nm)立即读板,每分钟读取一次,持续10分钟。荧光单位与相应的抑制剂(测试化合物)剂量一起绘制以确定蛋白质稳定的EC50。
结果
用三种MTH-1-S-标签肽融合蛋白构建体转染HEK293哺乳动物细胞以确定靶多肽和S-标签受体肽之间的间隔子长度是否影响功能性RNase S互补的检测。图4示出了构建体在HEK293细胞中的相等表达,如通过蛋白质印迹确定的。
测试50μg转染细胞裂解物输入并比较不同长度的间隔子示出,间隔子长度对荧光信号没有显著影响(图5)。间隔子长度似乎对靶蛋白的信号水平或聚集温度(Tagg)没有显著影响。S-标签的结构和惰性以及热不敏感性对靶蛋白的生物物理稳定性没有贡献。这极大地改善了这种S-标签技术的下游应用,及其在宽范围靶蛋白情况下的用途。此外,数据示出,在不存在S-标签融合表达的情况下,没有可检测的信号证明了S-标签S蛋白互补的特异性。
为了确定S蛋白浓度是否影响荧光信号,测试了具有不同S标签融合的S蛋白的增加的浓度。图6示出S蛋白浓度在约1-2ng/ul S蛋白时开始使信号饱和。数据证明该系统的敏感性,因为它仅需要最低水平的S蛋白来驱动酶互补。
类似地测试了FRET核酸底物的增加的浓度,并且观察到理想浓度在50nM或更高的范围内(表1)。
荧光底物的裂解动力学是快速的并且检测是灵敏的。图7示出了荧光信号相对于细胞数的变化。一旦确定了最佳细胞数,则融合蛋白的Tagg就通过进行改进的细胞热转移测定(CTSA)来确定。图8证明,对于MTH1-S-标签融合,Tagg为大约50℃。使用Tagg,执行剂量反应曲线以确定小分子克唑替尼与融合蛋白的结合。将用MTH1-S-标签融合蛋白转染的细胞与增加浓度的MTH1抑制剂(S)克唑替尼一起温育(图9)。克唑替尼稳定了MTH1融合蛋白,如荧光信号的增加所示(图9)。使用下文所示的蛋白质稳定化公式确定EC50,并指示蛋白质稳定化的EC50为大25nM(图10)。
蛋白质稳定性公式:(1-((RLU40℃-RLU50℃)–(RLUx-RLU50℃))/(RLU40℃-RLU50℃)))*100,其中RLU为相对光单位。
表2-热挑战后在不离心情况下检测到的信号。在波长ex=475nm/em=500-550nm下检测荧光。
表3-热挑战后在离心情况下检测到的信号。在波ex(激发)=475nm/em(发射)=500-550nm处检测到荧光。热挑战后将板以12K rpm离心。
*应注意,表2和表3中的信号水平没有差异。去除离心步骤加快了信号检测,减少了样品分配和信号读取之间的时间,并且重要的是大大改进了这种S标签(Micro标签)技术的下游应用。
裂解物与S蛋白和底物的短温育时间足以产生完整的信号(图11)。最短的温育时间(0.5分钟)足以产生完整的信号。在较长的温育时间下,信号质量不受到影响。此类快速信号产生对于该技术的下游应用非常重要,特别是对于阵列和芯片应用。
低裂解物/细胞输入与短温育时间的结合产生了敏感信号,从而证明了靶蛋白(MTH1-3aa-S-标签)与其配体(克唑替尼)结合时,该靶蛋白的熔融曲线(图12和13)。对于克唑替尼–MTH1接合,高裂解物输入和低裂解物输入之间的信号模式是相同。尽管信号饱和,但这些数字证明在较长的温育时间下信号模式的持久性。裂解物/细胞输入的这种灵活性与温育时间的结合可用于检测各种靶结合效力的配体的结合EC50。
图14-16展示出裂解物/细胞输入与孵育时间的组合对信号模式和持久性的影响,从而展示出靶蛋白(MTH1-3aa-S-标签)与其配体(克唑替尼)结合时,该该靶蛋白的熔融曲线。应注意,对于克唑替尼-MTH1结合而言,短温育时间和长温育时间之间的信号模式是相同的(图14-16)。尽管信号饱和,但请注意在较长温育时间内信号模式的持久性。还应注意,在0.5分钟的短温育时间内信号分离较宽,在较长的温育时间内信号分离较窄。还应注意裂解物输入和温育时间之间的互惠关系。这种裂解物/细胞输入与温育时间的组合的灵活性可用于检测各种靶结合效力的配体的结合EC50,以及可优选各种裂解物输入量或温育时间的各种应用。
实施例2-板阵列形式的靶结合
在本文所述的方法或测定的一个实施方案中,靶多肽是由病原体编码的蛋白质或其修饰的蛋白质(非限制性示例包括冠状病毒、流感病毒、肝炎病毒,甚至噬菌体)。融合蛋白包含用N-端和/或C-端S-标签(例如,S-标签受体肽)表达的靶病原体蛋白。病原体蛋白的表达构建体可包括密码子优化的cDNA以允许融合蛋白的最大表达。在该示例中,使用阵列使得编码融合蛋白的DNA以多孔形式(96或384或1536孔形式)提供给细胞以用于在感兴趣的细胞系中表达。可将DNA转染到位于多孔板每个孔中的细胞中,以允许蛋白质表达。板阵列可用于在单次运行中针对所有融合蛋白测试单个或多个试剂(药物,即测试化合物)。此外,阵列还可用多剂量的单个或多个测试化合物进行测试。该阵列可用于高通量方法,该方法用于针对病原体的整个蛋白质组测试化合物文库。该阵列可用于筛选在各种生理条件下(例如,不同的缓冲液、存在血清组分、生长因子或其他刺激剂)结合的测试化合物。然后可以对板进行梯度加热变性步骤,然后添加用于酶互补和FRET标记的底物裂解检测的RNase供体。使用板读取器的荧光检测将以动力学模式进行,以监测随时间推移的任何潜在的荧光增加。
实施例3-在靶结合阵列中掺入潜在的病毒突变
在这个示例中,阵列包含各种计算机生成的SARS-Cov2冠状病毒蛋白或其他病原体的高度突变/诱变区域的组合。例如,使用计算机工具生成的Spike蛋白的各种潜在突变,并且融合到S-标签受体肽的靶多肽变体显示在阵列上用于药物结合。该阵列将由编码标记蛋白质的质粒DNA组成。随后将DNA转染到选定的细胞中,然后使用一种或多种测试化合物进行药物筛选。可使用热梯度变性步骤筛选随机或集中的药物化合物库以进行结合,然后进行酶互补、底物裂解和荧光检测。
此类阵列可鉴定结合各种病毒蛋白靶中的一种或多种的测试化合物。该阵列可解决病毒突变对治疗的反应。该阵列还可探索规避病毒突变的治疗方案,并潜在地预防未来来自相同或相关冠状病毒家族的大流行。
实施例4-流感病毒阵列,完整或部分的
流感病毒的每一种蛋白质都与S-标签肽受体融合。所选流感病毒蛋白的所有组成部分可限于流感病毒家族的高度突变蛋白。该阵列可显示来自历史流感大流行和季节性爆发的高度突变靶;此类靶可包括血凝素(HA)、神经氨酸酶(NA)、M1、核蛋白或其他流感靶。该阵列可类似地包括流感病毒高度突变蛋白的计算机生成型式。该阵列用于筛选与病毒蛋白直接结合的一组药物化合物。
这样的阵列可鉴定与现有和预测的流感病毒的各种潜在靶结合的药物。阵列测定可解决潜在病毒突变对潜在治疗性测试化合物的反应。它还可解决某些突变对病原体未来突变型式的活力的影响。药物和病毒蛋白都可根据结合效力进行排名。该阵列还将确定规避病毒突变的治疗方案,并潜在地预防未来来自相同的流感病毒家族的大流行。最有效的、具有广泛特异性的药物也可被鉴定为未来大流行病的潜在疗法。
实施例5-病原体家族的组合阵列
该阵列在一次多重检测中提供了甲型、乙型和丙型肝炎病毒的组合显示。三种病毒的重要治疗靶被展示,并在宿主肝细胞中表达。以单剂量或多剂量模式对一组药物的靶结合进行测试。该阵列可扩展到其他病原体家族,如疱疹病毒和轮状病毒等。靶结合将使用每个靶的S-标签互补分析来确定。
组合病原体检测为多谱疗法提供了加速发现途径。药物根据每个病原体亚类中每个靶的靶结合效力进行排名。在这种特殊情况下,这种方法能够发现针对肝炎病毒家族的多特异性/多谱药物。它对于临床和研究目的的现有疗法和新疗法的测试、发现、排名和验证特别有用。
实施例6-噬菌体蛋白阵列
选择的噬菌体可以是感染特定致病菌的噬菌体,注入幽门螺杆菌、多重耐药结核分枝杆菌或广泛类型病原体诸如分枝杆菌科。在每种情况下,噬菌体的单个蛋白质都被克隆为S-标签融合蛋白,并如上所示显示在阵列中。该阵列可包括来自单类或多类噬菌体的变体。该阵列可类似地包括代表细菌表面受体的蛋白质。使用针对每个靶的S-标签互补测定,可测试一组药物与单个噬菌体蛋白或噬菌体-细菌蛋白对的结合。
此类阵列用于发现蛋白质组稳定药物以增强噬菌体对宿主细菌的活性。该阵列还用于经由增强的噬菌体-受体相互作用来坚定可增强细菌宿主感染力的试剂。使用这种方法,有可能发现可以增强噬菌体对临床重要病原体(诸如多重耐药结核分枝杆菌)活性的药物和治疗剂。此类药物可在临床上用于清除人类宿主的耐药病原体。
实施例7-基因随机化病原体靶的阵列。
病原体的选定蛋白质靶,注入SARS-CoV2冠状病毒的刺突蛋白、Nuc蛋白或Memb蛋白,使用基因组编辑工具(诸如CRISPR-Cas9)进行基因随机化,并与S-标签受体肽融合。此类蛋白质的文库显示在阵列中;代表了病毒靶的每个单独的随机版本。可筛选一组药物以与这些病毒蛋白结合。
该阵列将鉴定与现有和预测的病原体靶的各种潜在型式结合的药物。该阵列可解决潜在病毒突变对治疗的反应。它还可解决某些突变对病原体未来突变型式的活力的影响。药物和病毒蛋白都可针对结合效力进行排名。该阵列还将鉴定规避病毒突变的治疗方案,并潜在地预防未来来自相同冠状病毒家族的大流行。可鉴定最有效的药物;广泛特异性药物也可被鉴定为未来来自相同病原体家族的大流行的潜在疗法。
实施例8-用于筛选药物靶结合的SARS-CoV-2蛋白质组阵列
在阵列的一个实施方案中,形式可包括SARS-CoV-2蛋白质组的蛋白质组。该病毒表达来自病毒RNA基因组的28种预测蛋白。该阵列可涉及用于标记有S-标签受体肽的病毒蛋白中每一者的单独表达构建体(例如,参见图17)。然后表达构建体可以为多孔板形式以用于在感兴趣的细胞系中表达。然后可使用针对每个靶的S-标签互补测定,利用单个或多个测试试剂筛选病毒靶结合阵列板以进行直接结合。病毒阵列可包括多行板,其具有用于表达的有相同标记的病毒蛋白,从而允许在板的每一行中在不同生理条件下测试试剂(例如,参见图18)。
实施例9-用于发现针对选定的单个病原体靶(诸如SARS-CoV2冠状病毒的刺突蛋白)的药物制剂的阵列。
这种类型的阵列代表有限数量的病原体靶。一组药物化合物可以各种制剂形式进行测试,以代表现实的药物方案。此类制剂可包括增强剂、填充剂、补充活性成分以及它们的组合。使用S-标签互补测定,可以在宿主细胞模型中的病毒靶上测试此类药物制剂的结合。
预期成果6:此类筛选将鉴定可增强活性药物化合物与病原体靶结合的活性的制剂。此类筛选将代表药物开发,并可加速疗法从研究到临床的转变。它将特别用于现有药物的再利用。
实施例10-用于药物靶结合的多病毒阵列
在阵列的一些实施方案中,来自不同病毒的几种病毒病原体蛋白可用S-标签受体肽标记并组合在单个阵列中。该阵列将包括多孔形式,其具有针对由不同病毒编码的蛋白质的表达构建体,每种融合蛋白在板的单独孔中表达(例如,参见图19)。然后,该阵列可用于在不同病毒病原体编码的蛋白质(例如,来自冠状病毒的蛋白质:SARS、MERS、HKU1;或来自甲型、乙型和丙型肝炎的蛋白质)中筛选单个或多个测试试剂。
实施例11-病原体家族的组合阵列。
该阵列在一个设置中提供了甲型、乙型和丙型肝炎病毒的组合显示。显示出了三种病毒的重要治疗靶,并在宿主肝细胞中表达。一组药物以单剂量或多剂量模式进行靶结合测试。该阵列可扩展到其他病原体家族,诸如疱疹病毒或轮状病毒等。将使用S-标签互补测定来读取靶结合。
组合的病原体检测为多谱疗法提供了加速发现途径。药物根据每个病原体亚类中每个靶的靶结合效力进行排名。在这种特殊情况下,这种方法能够发现针对肝炎病毒家族的多特异性/多谱药物。它对于临床和研究目的的现有疗法和新疗法的测试、发现、排名和验证特别有用。
实施例12-病毒进入所需的宿主蛋白阵列。
在该实施方案中,阵列可包括表达病原体结合和/或感染所必需的人或哺乳动物蛋白质;并且可包括已知感染所必需的人类蛋白质和病毒蛋白质的混合物。例如,该阵列可包括人血管紧张素转换酶2(ACE2)和人跨膜丝氨酸蛋白酶2(TMPRSS2)作为靶多肽。这些蛋白质在内皮细胞表面上表达,在SARS-CoV-2病毒进入和感染中起关键作用。该测定然后可测试不同剂量的单一或多种试剂以鉴定与靶中的一者或两者的直接靶结合。
该阵列允许利用单个或多个测试试剂所测试的蛋白质靶的多路复用。可用不同剂量的多种测试剂筛选病毒靶结合阵列。每个单独的病毒蛋白的荧光读数然后可鉴定测试试剂结合哪个蛋白并在热梯度下稳定融合蛋白(例如,参见图20A-20C)。该阵列还可聚焦于具有特定病毒蛋白的特定孔,该特定病毒蛋白用多种试剂以多种剂量进行测试,以针对在热梯度下结合和稳定靶的能力来鉴定药物并对其排序(例如,参见图20D)。
实施例13-病毒-宿主相互作用蛋白质组的阵列
来自SARS-Cov2冠状病毒和人类宿主的代表性蛋白质显示为包含S-标签受体肽的融合蛋白。例如,病毒膜蛋白(Nuc、Memb、Spike)与受体ACE2、来自ACE受体家族的其他成员、AT1受体、AT2受体和其他潜在的细胞表面受体一起显示。可包括各种宿主受体以代表各种宿主组织。病毒蛋白可单独或与宿主蛋白成对显示。可测试一组药物与病毒或宿主的单个蛋白质或其对的结合。
这种显示可发现将干扰病毒对接以及病毒与各种宿主细胞组织整合的治疗选择。该阵列还可探索病毒与其他较少探索的宿主组织的潜在感染性。此类组织可以是肾脏、心脏、脾脏、脑或肝脏。
实施例14-全活病毒阵列
在该实施方案中,阵列可包括嵌合活病毒颗粒的表达,该嵌合活病毒颗粒允许与一种或多种组分蛋白组装,该组分蛋白与S-标签受体肽融合。该阵列可用于在活病毒颗粒背景下评估药物与感兴趣的蛋白质的结合。
实施例15-嵌合活病毒颗粒的阵列
阵列的该实施方案代表组装成活病毒颗粒的S标签融合病毒蛋白。将表达这些单独病毒蛋白的细胞裂解物系统地添加到复制有毒SARS-CoV2冠状病毒的细胞中。S标记的病毒蛋白通过宿主细胞结合到活的组装冠状病毒颗粒中。这产生活嵌合冠状病毒的阵列;该阵列是可扩展的。该阵列能够在活病毒的背景下直接对单独病毒靶进行药物测试。
这种阵列用于在活病毒的情况下测试药物与单独毒蛋白的结合。该系统的优点是能够将S标签蛋白结合到到活病毒中,并针对宿主体内的这些活病毒颗粒测试药物。使用S-标签互补,可以:1)测量作为药物相互作用的结果的病毒复制,2)将靶结合与病毒复制相关联,3)鉴定对病毒复制影响最大的病毒蛋白,以及4)发现对病毒复制影响最大的最临床相关药物。
实施例16-具有S-标签(微标签)的融合蛋白的不同热特征表征
材料和方法:
HEK-293细胞来自ATCC(目录号CRL-1573),并在补充有10%胎牛血清(FBS)(Millipore SIGMA目录号F2442)和1x青霉素/链霉素(Millipore SIGMA目录号P4333)的DMEM(Millipore SIGMA目录号D5796)中培养。胰蛋白酶-EDTA溶液1X(0.05%胰蛋白酶,0.02%EDTA)来自Millipore SIGMA(目录号59417C),且20X TBS溶液来自Teknova(目录号T1680)。Triton-X-100来自Millipore SIGMA(目录号X100)。洗涤剂正十二烷基β-D-麦芽糖苷(DDM)来自Millipore SIGMA(目录号D4641)。MTH1抑制剂(S)-克唑替尼来自MilliporeSIGMA(目录号PZ0240)。BCL6抑制剂BI-3812和BI-5273来自Boehringer Ingelheim。DMSO来自Millipore SIGMA(目录号673439)。96孔板来自CELLTREAT Scientific(目录号229196);白色PCR板来自BIORAD(目录号MLL9651),并且用于密封PCR板的Microseal“B”膜来自BIORAD(目录号MSB1001);黑色96孔板来自COSTAR(目录号3915)。根据制造商推荐的方案,使用Lipofectamine 2000转染试剂(Thermo FisherScientific目录号11668027)实现细胞转染。优化的荧光底物(5'-6FAM/ArUAA/3'TAMRA_(NHS酯)(v3))购自IDT。使用SynbioTechnologiesInc的KPN1 GGTACC和BamH1 GGATCC克隆位点,将S蛋白在羧基末端连同6xHis标签(SEQ ID NO:34)克隆到载体pET-30a(+)中进行细菌表达。S蛋白His标签融合蛋白由Synbio Technologies Inc.从细菌中表达和纯化。
编码RNase供体的克隆构建体的序列如下:
编码6x His标签的序列(SEQ ID NO:34)为粗体,并且TAG终止密码子带下划线。
His标记的RNase供体蛋白(S蛋白)的相应翻译氨基酸序列为:
MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFDASVHHHHHH(SEQ ID NO:23)。
Synbio Technologies Inc.克隆了带有mutT同系物(MTH1)蛋白(即靶多肽)的S-标签受体肽。如下在载体pcDNA3.1(+)中将S-标签受体肽克隆到MTH1的羧基末端:克隆位点KPN1 GGTACC和BamH1 GGATCC(粗体)。
生成在MTH1和S标签肽(带下划线)之间没有接头的编码构建体,如下所示:
包含MTH1和羧基末端S-标签受体肽的所得融合蛋白的翻译氨基酸序列如下所示。S-标签受体肽的20个氨基酸序列带下划线。确定S-标签可缩短到前15个氨基酸,并且仍然充当S-标签受体肽。
MGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTVKETAAAKFERQHMDSSTSAA(SEQ ID NO:25)。
还生成了融合蛋白的编码构建体,该融合蛋白包含MTH1靶多肽和S-标签受体肽(带下划线)之间的3个氨基酸接头(加框),如下所示:
BCL6(B细胞淋巴瘤6)S肽微标签构建体的合成在Twist Biosciences处进行,并且相应的核苷酸序列为:
ATGGCCTCGCCGGCTGACAGCTGTATCCAGTTCACCCGCCATGCCAGTGATGTTCTTCTCAACCTTAATCGTCTCCGGAGTCGAGACATCTTGACTGATGTTGTCATTGTTGTGAGCCGTGAGCAGTTTAGAGCCCATAAAACGGTCCTCATGGCCTGCAGTGGCCTGTTCTATAGCATCTTTACAGACCAGTTGAAATGCAACCTTAGTGTGATCAATCTAGATCCTGAGATCAACCCTGAGGGATTCTGCATCCTCCTGGACTTCATGTACACATCTCGGCTCAATTTGCGGGAGGGCAACATCATGGCTGTGATGGCCACGGCTATGTACCTGCAGATGGAGCATGTTGTGGACACTTGCCGGAAGTTTATTAAGGCCAGTGAAGCAGAGATGGTTTCTGCCATCAAGCCTCCTCGTGAAGAGTTCCTCAACAGCCGGATGCTGATGCCCCAAGACATCATGGCCTATCGGGGTCGTGAGGTGGTGGAGAACAACCTGCCACTGAGGAGCGCCCCTGGGTGTGAGAGCAGAGCCTTTGCCCCCAGCCTGTACAGTGGCCTGTCCACACCGCCAGCCTCTTATTCCATGTACAGCCACCTCCCTGTCAGCAGCCTCCTCTTCTCCGATGAGGAGTTTCGGGATGTCCGGATGCCTGTGGCCAACCCCTTCCCCAAGGAGCGGGCACTCCCATGTGATAGTGCCAGGCCAGTCCCTGGTGAGTACAGCCGGCCGACTTTGGAGGTGTCCCCCAATGTGTGCCACAGCAATATCTATTCACCCAAGGAAACAATCCCAGAAGAGGCACGAAGTGATATGCACTA
CAGTGTGGCTGAGGGCCTCAAACCTGCTGCCCCCTCAGCCCGAAATGCC
CCCTACTTCCCTTGTGACAAGGCCAGCAAAGAAGAAGAGAGACCCTCCT
CGGAAGATGAGATTGCCCTGCATTTCGAGCCCCCCAATGCACCCCTGAA
CCGGAAGGGTCTGGTTAGTCCACAGAGCCCCCAGAAATCTGACTGCCA
GCCCAACTCGCCCACAGAGTCCTGCAGCAGTAAGAATGCCTGCATCCTC
CAGGCTTCTGGCTCCCCTCCAGCCAAGAGCCCCACTGACCCCAAAGCCT
GCAACTGGAAGAAATACAAGTTCATCGTGCTCAACAGCCTCAACCAGA
ATGCCAAACCAGAGGGGCCTGAGCAGGCTGAGCTGGGCCGCCTTTCCC
CACGAGCCTACACGGCCCCACCTGCCTGCCAGCCACCCATGGAGCCTGA
GAACCTTGACCTCCAGTCCCCAACCAAGCTGAGTGCCAGCGGGGAGGA
CTCCACCATCCCACAAGCCAGCCGGCTCAATAACATCGTTAACAGGTCC
ATGACGGGCTCTCCCCGCAGCAGCAGCGAGAGCCACTCACCACTCTACA
TGCACCCCCCGAAGTGCACGTCCTGCGGCTCTCAGTCCCCACAGCATGC
AGAGATGTGCCTCCACACCGCTGGCCCCACGTTCCCTGAGGAGATGGGA
GAGACCCAGTCTGAGTACTCAGATTCTAGCTGTGAGAACGGGGCCTTCT
TCTGCAATGAGTGTGACTGCCGCTTCTCTGAGGAGGCCTCACTCAAGAG
GCACACGCTGCAGACCCACAGTGACAAACCCTACAAGTGTGACCGCTG
CCAGGCCTCCTTCCGCTACAAGGGCAACCTCGCCAGCCACAAGACCGTC
CATACCGGTGAGAAACCCTATCGTTGCAACATCTGTGGGGCCCAGTTCA
ACCGGCCAGCCAACCTGAAAACCCACACTCGAATTCACTCTGGAGAGA
AGCCCTACAAATGCGAAACCTGCGGAGCCAGATTTGTACAGGTGGCCC
ACCTCCGTGCCCATGTGCTTATCCACACTGGTGAGAAGCCCTATCCCTG
TGAAATCTGTGGCACCCGTTTCCGGCACCTTCAGACTCTGAAGAGCCAC
CTGCGAATCCACACAGGAGAGAAACCTTACCATTGTGAGAAGTGTAAC
CTGCATTTCCGTCACAAAAGCCAGCTGCGACTTCACTTGCGCCAGAAGC
ATGGCGCCATCACCAACACCAAGGTGCAATACCGCGTGTCAGCCACTG
ACCTGCCTCCGGAGCTCCCCAAAGCCTGCaaggaaactgcagcagccaagtttgagcggc
agcacatggactccagcacttccgctgccTGA(SEQ ID NO:30)。
小写字母标识羧基末端的S肽核苷酸残基。所得的表达蛋白的氨基酸序列如下所示,S-肽序列带下划线:
MASPADSCIQFTRHASDVLLNLNRLRSRDILTDVVIVVSREQFRAHKTVLMACSGLFYSIFTDQLKCNLSVINLDPEINPEGFCILLDFMYTSRLNLREGNIMAVMATAMYLQMEHVVDTCRKFIKASEAEMVSAIKPPREEFLNSRMLMPQDIMAYRGREVVENNLPLRSAPGCESRAFAPSLYSGLSTPPASYSMYSHLPVSSLLFSDEEFRDVRMPVANPFPKERALPCDSARPVPGEYSRPTLEVSPNVCHSNIYSPKETIPEEARSDMHYSVAEGLKPAAPSARNAPYFPCDKASKEEERPSSEDEIALHFEPPNAPLNRKGLVSPQSPQKSDCQPNSPTESCSSKNACILQASGSPPAKSPTDPKACNWKKYKFIVLNSLNQNAKPEGPEQAELGRLSPRAYTAPPACQPPMEPENLDLQSPTKLSASGEDSTIPQASRLNNIVNRSMTGSPRSSSESHSPLYMHPPKCTSCGSQSPQHAEMCLHTAGPTFPEEMGETQSEYSDSSCENGAFFCNECDCRFSEEASLKRHTLQTHSDKPYKCDRCQASFRYKGNLASHKTVHTGEKPYRCNICGAQFNRPANLKTHTRIHSGEKPYKCETCGARFVQVAHLRAHVLIHTGEKPYPCEICGTRFRHLQTLKSHLRIHTGEKPYHCEKCNLHFRHKSQLRLHLRQKHGAITNTKVQYRVSATDLPPELPKACKETAAAKFERQHMDSSTSAA-(SEQ ID NO:31)。
EGFR S肽标签构建体的合成在Twist Biosciences处进行,并且相应的核苷酸序列为:
/>
/>
羧基末端处的S肽核苷酸序列带下划线。所表达蛋白质的所得蛋白质氨基酸序列为:
MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHF LSLQRMFNNCEVVLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTSTVQLIMQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGRAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDSIDDTFLPVPEYINQSVPKRPAGSVQNPVYHNQPLNPAPSRDPHYQDPHSTAVGNPEYLNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRVAPQSSEFIGAKETAAAKFERQHMDSSTSAA-(SEQ ID NO:33)。
S-羧基末端处的肽序列带下划线。
A.细胞转染和裂解物制备
HEK293细胞根据制造商方案使用Lipofectamine 2000转染。转染两天后,移除培养基并使用1X TBS上下移液以提起细胞。将细胞以400g离心4分钟。去除TBS洗涤液,并且细胞裂解对于MTH1和BCL6使用1%Triton X 100的TBS溶液,或对于EGFR表达细胞使用0.5%DDM的TBS溶液。细胞在4℃下在旋转器上裂解1小时,并通过以6000rpm温和离心1分钟去除细胞碎片。将裂解物转移到新管中,将未立即用于测定的等分试样在-80℃冷冻以备将来使用。
B.热特征
将从过表达构建体的细胞制备的裂解物用1X TBS稀释1/10并将40ul等分到PCR管或板中并在热循环仪中以热梯度加热15分钟。加热后,立即对样品进行酶互补测定。将1.25μg/ml S蛋白和250nM FRET标记的核酸底物在1X TBS和0.5%DMSO中的混合物与加热的样品混合,并使用微板读取器检测荧光。使用PolarStar Omega 96孔板读取器以动力学模式(激发=485nm,发射=520nm)读取板。每个板每分钟读取一次,持续20分钟(生成21个时间点)。
为了测定热特征和测定Tagg、Tmax或Tmin,将每分钟产生的RAW荧光或荧光信号与温度的关系作图。S形图标识聚集温度、最大信号或最小信号。
C.小分子靶结合筛选
小分子化合物以10mM溶解在DMSO中,并有该原液制备100X浓度的在DMSO中的系列稀释液。来自表达微标签(S-肽标签)蛋白质的细胞的裂解物用冷的1X TBS以1/10稀释并按39.6ul等分到PCR板中;添加0.4ul的100X小分子,密封板,涡旋并离心2分钟。然后将板在适当的温度下加热15分钟,然后在25℃下冷却1分钟。制备反应缓冲液(1.25μg/ml S蛋白结合伴侣和250nM FRET标记的底物在1X TBS与0.5%DMSO中的溶液)并将120ul转移到黑色96孔板。添加加热的样品(30ul)并使用微板读取器检测荧光。使用PolarStar Omega 96孔板读取器以动力学模式(激发=485nm,发射=520nm)读取板。
为了进行分析,使用GraphPad Prism在半对数刻度上绘制了每分钟的RAW荧光信号或荧光变化与抑制剂剂量的关系图。非线性回归分析用于曲线拟合以确定靶结合的EC50或表观KD
结果
微标签(S-标签)在细胞靶结合中的应用依赖于蛋白质热熔融的原理。将表达微标签构建体的细胞或细胞裂解物置于热梯度中以确定聚集温度。这是一部分蛋白质变性和聚集从而变得不溶的温度。在热转移测定中,可通过结合影响蛋白质构象的配体,使蛋白质免于这种热变性,从而使其在诸如热挑战等变性条件下更加稳定。
A.微标记靶的热特征
为了筛选将结合到微标记构建体的配体,将表达构建体的细胞或由这些细胞制备的非变性裂解物置于热梯度中以确定蛋白质的聚集温度。然而,该微标签系统的一个有趣特征是,对标记蛋白质的热挑战确定了几种不同的热特征:聚集温度(Tagg)、最大信号温度(Tmax)和最小信号温度(Tmin)(图23A-23C)。
在55℃(Tagg)下加热细胞或过表达MTH1微标签(S肽标签)蛋白的细胞的裂解物可用于筛选将结合并稳定MTH1微标签蛋白的分子,从而产生更高的荧光信号。微标签(S-肽)测定系统检测到的荧光增加与反应中微标签蛋白量成正比。实时监测荧光信号产生的能力与活性全RNase酶(与S蛋白互补的S肽)的快速酶动力学的组合,提供了其他类似靶结合策略情况下不可能的独特特征;监测FRET标记的底物消耗。如图24所示,该系统可用于检查荧光随时间推移的发展(每分钟的相对光单位(RLU)变化),这是由FRET标记的底物裂解直接产生的。反应前3分钟内荧光信号的增加、约3分钟至4分钟时的峰值荧光以及4分钟后荧光的下降都与测定中微标记蛋白的量成正比。这显示了该测定在提供不同方式以直接量化微标记蛋白水平方面的灵活性。
B.筛选与微标记蛋白结合的分子
一旦确定了感兴趣蛋白的最大信号温度(Tmax)、聚集温度(Tagg)或最小信号温度(Tmin),则配体结合可在这些温度下进行评估。如果配体结合微标记蛋白,则由于结合事件会发生构象变化,这将在热或其他变性挑战中稳定微标记蛋白。在此,使用了BCL6微标记蛋白连同良好表征的Boehringer Ingelheim抑制剂BI-3812,其体外IC50为约3nM。BI-3812的相似结构类似物是无活性化合物BI-5273,其体外IC50为约10uM。将这些抑制剂与细胞或来自过表达BCL6微标签的HEK293细胞的裂解物一起温育导致确定靶结合的EC50(图25A-25B)。
温育4分钟后,可将检测到的荧光与在半对数标度上测试的抑制剂剂量的关系作图。使用非线性回归分析并使用GraphPad Prism拟合S形剂量反应曲线(具有可变斜率)确定了靶结合的EC50。BCL6特异性抑制剂BI-3812以0.63nM的靶结合EC50结合到BCL6微标签蛋白(图25A-25B)。无活性类似物不结合靶。允许S蛋白反应进行更长的时间段(10-15分钟)导致FRET标记的底物缺失,这由在已稳定靶的BI-3812浓度下每分钟荧光增加(RLU/min)的减少来证明。峰值荧光信号确定了使微标签蛋白靶饱和的抑制剂剂量。在抑制剂浓度高于该饱和剂量时,FRET标记的底物存在快速裂解,从而导致荧光信号随时间推移损失(每分钟相对光单位(RLU/min))并检测到较少的荧光。在低于该饱和剂量的浓度下,微标签构建体在热挑战中变性并且可用于酶互补的微标签较少,从而导致较低的荧光信号(图26A)。去除超出目标饱和剂量的数据点允许:(1)确定靶结合的EC50,和(2)确定药物与蛋白质靶结合的表观平衡解离常数(表观KD)(图26B和26C)。通过这种方法确定的靶结合的EC50非常接近表观KD,分别为0.9nM和1.6nM。
C.生理学背景下的定量结合动力学数据
该方法可用于确定蛋白质靶被药物饱和以产生最大荧光时的药物剂量。如图27A-C中的时间进程所示,目标饱和剂量可通过该方法来确定。在较长温育时间的情况下,拐点通过荧光信号随时间推移的下降而确定,这发生在5分钟后(图27B)。较长时间温育后信号达到峰值的剂量是目标饱和剂量(图27C)。这是一个拐点,其中较长时间的温育开始导致荧光信号随时间推移推移减少。峰值荧光被称为Emax值(最大效应)。已知使给定靶饱和的药物浓度是药物发现的重要参数,因为它可用于定义靶占用率。靶结合的EC50由使用在较高药物浓度下发生任何信号降低之前的早期时间点(0分钟),从荧光信号对药物浓度关于半对数刻度的S形剂量响应曲线确定(图27D)。用GraphPad Prism软件拟合S形剂量反应曲线的非线性回归分析确定了靶结合的EC50(图27D和图26B)。还可使用GraphPad Prism将可观察的荧光信号数据拟合到饱和结合方程(单点总数)(图27E和图26C)。这确定了药物与蛋白质靶结合的表观平衡解离常数(表观KD),其类似于观察到的靶结合的EC50(图27E和图26C)。可将可观察到的荧光数据拟合到饱和结合方程,因为预期靶结合和荧光响应之间的关系成正比,直至药物的饱和浓度。
作为确定目标饱和剂量、Emax和表观KD的另一示例,测试了MTH1微标记蛋白和抑制剂(S)-克唑替尼。在热挑战期间将抑制剂与蛋白质一起温育,然后进行酶互补和荧光检测导致在2分钟后鉴定靶结合的EC50(图28A)。在较长的温育时间(10分钟)下,对于较高药物剂量而言,荧光随时间推移降低。较长时间温育后信号达到峰值的剂量是目标饱和剂量(图28B)。峰值荧光被称为Emax值(图28B)。使用GraphPad Prism软件拟合S形剂量反应曲线的非线性回归分析确定了靶结合的EC50为约43nM(图28A)。还可使用GraphPad Prism将可观察的荧光信号数据拟合到饱和结合方程(单点总数)(图28C)。这确定了表观平衡解离常数(表观KD)为32nM,这类似于使用S形剂量反应曲线拟合在2分钟时间点处确定的靶结合的EC50(43nM)。
讨论
采用S-肽标签(微标签)的方法与其他酶互补策略相比有几个优点。首先,短标签(15至20个氨基酸)足够小,其不干扰折叠、定位、蛋白质-蛋白质相互作用和标记蛋白质靶的功能。其次,采用与S蛋白的酶互补和使用FRET标记的核酸底物来产生荧光信号具有快速反应的优势,这可实时监测(图22)。这种方法连同荧光检测一起为该技术提供了一些独特的特征。确定蛋白质熔融的最高温度和最低温度的一些靶的热特征具有优点(图23A-23C)。可以在通常显著低于聚集温度的那些温度下针对配体结合筛选具有Tmax和Tmin的蛋白质。
该技术的一个特征是反应速度快(图24)。FRET标记底物的快速酶促裂解允许在酶互补的前5分钟内确定靶结合的EC50。然后可随时间推移对其进行跟踪,以确定小分子使蛋白质靶饱和的剂量。FRET标记底物耗尽后的荧光峰值(Emax)用于确定饱和剂量。FRET标记的核酸底物的这种RNase裂解速度导致FRET标记的底物在10至20分钟内耗尽。这被实时检测为荧光信号随时间推移的减少。当来自稳定靶蛋白的信号增加通过来自过量稳定蛋白靶(例如,快速FRET耗尽)的信号减少平衡时,导致这种峰值荧光(靶饱和剂量)。小分子饱和其靶时的剂量可用于量化靶占有率,这是与药物发现高度相关的特征。
在生理设定下对结合其蛋白质靶的小分子进行定量动力学分析的能力以荧光读数形式提供,这是配体结合稳定化微标记蛋白质的直接结果。由于在反应中确定了目标饱和剂量,因此可确定表观平衡解离常数(KD)。消除超过饱和剂量的剂量允许获得饱和结合曲线,该饱和结合曲线可提供小分子与靶结合的表观KD。由FRET标记的底物耗尽之前的早期时间点确定的靶结合的EC50与由饱和结合曲线确定的表观KD测量相关。
***
本文引用的每个专利、专利申请、出版物或任何其他参考文献或文件的全部内容均以引用方式并入。如果发生冲突,将以说明书(包括定义)为准。
引用任何专利、专利申请、出版物或任何其他文件并不表示承认上述任一项是相关的现有技术,也不构成对这些出版物或文件的内容或日期的任何承认。
除非另有定义,否则本文使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。尽管与本文所述那些相似或等同的方法和材料可用于本发明的实践或测试,但本文描述了合适的方法和材料。
本文公开的所有特征可以以任何组合方式组合。说明书中公开的每个特征可由服务于相同、等同或相似目的的另选特征代替。因此,除非另有明确说明,否则所公开的特征(例如抗体)是等同或相似特征的一个示例。
如本文所用,所有数值或数值范围包括此类范围内的整数和这些值的分数或范围内的整数,除非上下文另有明确说明。此外,当本文描述值列表时(例如,约50%、60%、70%、80%、85%或86%),该列表包括其所有中间值和分数值(例如,54%、85.4%)。因此,为了说明,提及80%或更多,包括81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%等,以及81.1%、81.2%、81.3%、81.4%、81.5%等,82.1%、82.2%、82.3%、82.4%、82.5%等等。
提及具有多于(大于)或少于的整数分别包括大于或小于参考数的任何数。因此,例如,提及小于100时,包括99、98、97等,一直到数一(1);并且小于10,包括9、8、7等,一直到数一(1)。
如本文所用,所有数值或范围包括在此类范围内的值和整数的分数以及在此类范围内的整数的分数,除非上下文中另有明确说明。因此,为了说明,提及数值范围,诸如1-10包括1、2、3、4、5、6、7、8、9、10,以及1.1、1.2、1.3、1.4、1.5等等。因此,提及1-50的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20等,最多并包括50,以及1.1、1.2、1.3、1.4、1.5等,2.1、2.2、2.3、2.4、2.5等等。
对一系列范围的提及包括组合该系列内不同范围的边界值的范围。因此,为了说明对一系列范围的提及,例如1-10、10-20、20-30、30-40、40-50、50-60、60-75、75-100、100-150、150-200、200-250、250-300、300-400、400-500、500-750,750-1,000、1,000-1,500、1,500-2,000、2,000-2,500、2,500-3,000、3,000-3,500、3,500-4,000、4,000-4,500、4,500-5,000、5,500-6,000、6,000-7,000、7,000-8,000或8,000-9,000,包括10-50、50-100、100-1,000、1,000-3,000、2,000-4,000等的范围。
在不脱离本技术的基本方面的情况下,可对前述内容进行修改。尽管结合一个或多个具体实施方案对本技术进行了相当详细的描述,但是本领域的普通技术人员应当认识到,可对本申请具体公开的实施方案进行更改,但是这些修改和改进都在该技术的范围和精神内。
本发明在本文中整体公开,使用肯定的语言来描述多个实施方案和方面。本发明还特别包括其中全部或部分排除特定主题的实施方案,例如物质或材料、方法步骤和条件、方案或程序。例如,在本发明的某些实施方案或方面中,材料和/或方法步骤被排除。因此,即使基于本发明不包括的方面,本发明通常未在本文中表述,然而本发明未明确排除的各方面仍然在本发明中公开。
本文适当说明性描述的技术可在不存在本文未具体公开的任何要素的情况下实施。因此,例如,在本文的每个实例中,术语“包含”、“基本上由……组成”和“由……组成”中任一者都可用其他两个术语中的任一个代替。所使用的术语和表达用作描述而非限制,并且使用此类术语和表达不排除所示和描述的特征或其片段的任何等同物,并且在要求保护的技术范围内可以进行各种修改。术语“a”或“an”可指其修饰的一个或多个要素(例如,“areagent”可表示一种或多种试剂),除非上下文清楚德描述了一个要素或多于一个要素。如本文所使用的,术语“约”是指基础参数的10%以内的值(即,正负10%),并且在一串值的开头使用术语“约”修饰每个值(即,“约1、2和3”是指约1、约2和约3)。例如,“约100克”的重量可包括介于90克至110克之间的重量。如本文所用,术语“基本上”是指值修饰符,其意指“至少95%”、“至少96%”、“至少97%”、“至少98%”或“至少99%”并且可包括100%。例如,基本上不含X的组合物可以包括小于5%、小于4%、小于3%、小于2%或小于1%的X,和/或X可不存在或在组合物中检测不到。短语“基本上同时”意指在该时间下,或在几秒的时间框内发生(例如在0至10秒的窗内)。
因此,应当理解,虽然本技术已经通过代表性实施方案和任选特征具体公开,但是本领域技术人员可采用本文公开的概念的修改和变化,并且此类修改和变化被认为在该技术的范围内。
非正式序列表
KETAAAKFERQHMDSSTSAA(SEQ ID NO.:1)
KETNWAWFWDQHMDSSTSA(SEQ ID NO:2)
KETGWALFVQQHMDSSTSA(SEQ ID NO:3)
KETVMANFQMQHMDSSTSA(SEQ ID NO:4)
KETGDAVFARQHMDSSTSA(SEQ ID NO:5)
KETGWAAFVKQHMDSSTSA(SEQ ID NO:6)
KETGWATFVEQHMDSSTSA(SEQ ID NO:7)
KETKLAFFLKQHMDSSTSA(SEQ ID NO:8)
KETWWAWFFGQHMDSSTSA(SEQ ID NO:9)
KETTWAEFTWQHMDSSTSA(SEQ ID NO:10)
KETPWASFNKQHMDSSTSA(SEQ ID NO:11)
KETAMAMFVTQHMDSSTSA(SEQ ID NO:12)
KETLWAWFMWQHMDSSTSA(SEQ ID NO:13)
KETAAAKFERQHMDS(SEQ ID NO:14)
KETAAAKFERQHMNS(SEQ ID NO:15)
NRAWSEFLWQHLAPV(SEQ ID NO:16)
NRGWSEFLWQHHAPV(SEQ ID NO:17)
NRAWSVFQWQHIAPA(SEQ ID NO:18)
MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQ KNVACKNGQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACE GNPYVPVHFDASV(SEQ ID NO:19)
MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQ KNVACKNGQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACE GNPYVPVHFD(SEQ ID NO:20)
KETAAAKFERQHMDSSTSAASSSNYCNQMMKSRNLTKDRCKP VNTFVHESLADVQAVCSQKNVACKNGQTNCYQSYSTMSITDCRETGSSKY PNCAYKTTQANKHIIVACEGNPYVPVHFDASV(SEQ ID NO:21)
GGTACCATGAGCAGCTCCAACTACTGTAACCAGATGATGAAGAGCCGGAACCTGACCAAAGATCGATGCAAGCCAGTGAACACCTTTGTGCACGAGTCCCTGGCTGATGTCCAGGCCGTGTGCTCCCAGAAAAATGTTGCCTGCAAGAATGGGCAGACCAATTGCTACCAGAGCTACTCCACCATGAGCATCACCGACTGCCGTGAGACCGGCAGCTCCAAGTACCCCAACTGTGCCTACAAGACCACCCAGGCGAATAAACACATCATTGTGGCTTGTGAGGGAAACCCGTACGTGCCAGTCCACTTTGATGCTTCAGTGCATCACCATCACCATCACTAGGGATCC(SEQ ID NO:22)
MSSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFDASVHHHHHH(SEQ ID NO:23)
GGTACCATGGGCGCCTCCAGGCTCTATACCCTGGTGCTGGTCCTGCAGCCTCAGCGAGTTCTCCTGGGCATGAAAAAGCGAGGCTTCGGGGCCGGCCGGTGGAATGGCTTTGGGGGCAAAGTGCAAGAAGGAGAGACCATCGAGGATGGGGCTAGGAGGGAGCTGCAGGAGGAGAGCGGTCTGACAGTGGACGCCCTGCACAAGGTGGGCCAGATCGTGTTTGAGTTCGTGGGCGAGCCTGAGCTCATGGACGTGCATGTCTTCTGCACAGACAGCATCCAGGGGACCCCCGTGGAGAGCGACGAAATGCGCCCATGCTGGTTCCAGCTGGATCAGATCCCCTTCAAGGACATGTGGCCCGACGACAGCTACTGGTTTCCACTCCTGCTTCAGAAGAAGAAATTCCACGGGTACTTCAAGTTCCAGGGTCAGGACACCATCCTGGACTACACACTCCGCGAGGTGGACACGGTCAAGGAAACTGCAGCAGCCAAGTTTGAGCGGCAGCACATGGACTCCAGCACTTCCGCTGCCTAGGCTGCCTAGGGATCC(SEQ ID NO:24)
MGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTVKETAAAKFERQHMDSSTSAA(SEQ ID NO:25)
GGTACCATGGGCGCCTCCAGGCTCTATACCCTGGTGCTGGTCCTGCAGCCTCAGCGAGTTCTCCTGGGCATGAAAAAGCGAGGCTTCGGGGCCGGCCGGTGGAATGGCTTTGGGGGCAAAGTGCAAGAAGGAGAGACCATCGAGGATGGGGCTAGGAGGGAGCTGCAGGAGGAGAGCGGTCTGACAGTGGACGCCCTGCACAAGGTGGGCCAGATCGTGTTTGAGTTCGTGGGCGAGCCTGAGCTCATGGACGTGCATGTCTTCTGCACAGACAGCATCCAGGGGACCCCCGTGGAGAGCGACGAAATGCGCCCATGCTGGTTCCAGCTGGATCAGATCCCCTTCAAGGACATGTGGCCCGACGACAGCTACTGGTTTCCACTCCTGCTTCAGAAGAAGAAATTCCACGGGTACTTCAAGTTCCAGGGTCAGGACACCATCCTGGACTACACACTCCGCGAGGTGGACACGGTCGCCGCCGCCAAGGAAACTGCAGCAGCCAAGTTTGAGCGGCAGCACATGGACTCCAGCACTTCCGCTGCCTAGGCTGCCTAGGGATCC(SEQ ID NO:26)
MGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTVAAAKETAAAKFERQHMDSSTSAA(SEQ ID NO:27)
GGTACCATGGGCGCCTCCAGGCTCTATACCCTGGTGCTGGTCCTGCAGCCTCAGCGAGTTCTCCTGGGCATGAAAAAGCGAGGCTTCGGGGCCGGCCGGTGGAATGGCTTTGGGGGCAAAGTGCAAGAAGGAGAGACCATCGAGGATGGGGCTAGGAGGGAGCTGCAGGAGGAGAGCGGTCTGACAGTGGACGCCCTGCACAAGGTGGGCCAGATCGTGTTTGAGTTCGTGGGCGAGCCTGAGCTCATGGACGTGCATGTCTTCTGCACAGACAGCATCCAGGGGACCCCCGTGGAGAGCGACGAAATGCGCCCATGCTGGTTCCAGCTGGATCAGATCCCCTTCAAGGACATGTGGCCCGACGACAGCTACTGGTTTCCACTCCTGCTTCAGAAGAAGAAATTCCACGGGTACTTCAAGTTCCAGGGTCAGGACACCATCCTGGACTACACACTCCGCGAGGTGGACACGGTCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCAAGGAAACTGCAGCAGCCAAGTTTGAGCGGCAGCACATGGACTCCAGCACTTCCGCTGCCTAGGCTGCCTAGGGATCC(SEQ ID NO:28)
MGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTVAAAAAAAAAAKETAAAKFERQHMDSSTSAA(SEQ ID NO:29)
ATGGCCTCGCCGGCTGACAGCTGTATCCAGTTCACCCGCCATGCCAGTGATGTTCTTCTCAACCTTAATCGTCTCCGGAGTCGAGACATCTTGACTGATGTTGTCATTGTTGTGAGCCGTGAGCAGTTTAGAGCCCATAAAACGGTCCTCATGGCCTGCAGTGGCCTGTTCTATAGCATCTTTACAGACCAGTTGAAATGCAACCTTAGTGTGATCAATCTAGATCCTGAGATCAACCCTGAGGGATTCTGCATCCTCCTGGACTTCATGTACACATCTCGGCTCAATTTGCGGGAGGGCAACATCATGGCTGTGATGGCCACGGCTATGTACCTGCAGATGGAGCATGTTGTGGACACTTGCCGGAAGTTTATTAAGGCCAGTGAAGCAGAGATGGTTTCTGCCATCAAGCCTCCTCGTGAAGAGTTCCTCAACAGCCGGATGCTGATGCCCCAAGACATCATGGCCTATCGGGGTCGTGAGGTGGTGGAGAACAACCTGCCACTGAGGAGCGCCCCTGGGTGTGAGAGCAGAGCCTTTGCCCCCAGCCTGTACAGTGGCCTGTCCACACCGCCAGCCTCTTATTCCATGTACAGCCACCTCCCTGTCAGCAGCCTCCTCTTCTCCGATGAGGAGTTTCGGGATGTCCGGATGCCTGTGGCCAACCCCTTCCCCAAGGAGCGGGCACTCCCATGTGATAGTGCCAGGCCAGTCCCTGGTGAGTACAGCCGGCCGACTTTGGAGGTGTCCCCCAATGTGTGCCACAGCAATATCTATTCACCCAAGGAAACAATCCCAGAAGAGGCACGAAGTGATATGCACTACAGTGTGGCTGAGGGCCTCAAACCTGCTGCCCCCTCAGCCCGAAATGCCCCCTACTTCCCTTGTGACAAGGCCAGCAAAGAAGAAGAGAGACCCTCCTCGGAAGATGAGATTGCCCTGCATTTCGAGCCCCCCAATGCACCCCTGAACCGGAAGGGTCTGGTTAGTCCACAGAGCCCCCAGAAATCTGACTGCCAGCCCAACTCGCCCACAGAGTCCTGCAGCAGTAAGAATGCCTGCATCCTCCAGGCTTCTGGCTCCCCTCCAGCCAAGAGCCCCACTGACCCCAAAGCCTGCAACTGGAAGAAATACAAGTTCATCGTGCTCAACAGCCTCAACCAGAATGCCAAACCAGAGGGGCCTGAGCAGGCTGAGCTGGGCCGCCTTTCCCCACGAGCCTACACGGCCCCACCTGCCTGCCAGCCACCCATGGAGCCTGAGAACCTTGACCTCCAGTCCCCAACCAAGCTGAGTGCCAGCGGGGAGGACTCCACCATCCCACAAGCCAGCCGGCTCAATAACATCGTTAACAGGTCCATGACGGGCTCTCCCCGCAGCAGCAGCGAGAGCCACTCACCACTCTACATGCACCCCCCGAAGTGCACGTCCTGCGGCTCTCAGTCCCCACAGCATGCAGAGATGTGCCTCCACACCGCTGGCCCCACGTTCCCTGAGGAGATGGGAGAGACCCAGTCTGAGTACTCAGATTCTAGCTGTGAGAACGGGGCCTTCTTCTGCAATGAGTGTGACTGCCGCTTCTCTGAGGAGGCCTCACTCAAGAGGCACACGCTGCAGACCCACAGTGACAAACCCTACAAGTGTGACCGCTGCCAGGCCTCCTTCCGCTACAAGGGCAACCTCGCCAGCCACAAGACCGTCCATACCGGTGAGAAACCCTATCGTTGCAACATCTGTGGGGCCCAGTTCAACCGGCCAGCCAACCTGAAAACCCACACTCGAATTCACTCTGGAGAGAAGCCCTACAAATGCGAAACCTGCGGAGCCAGATTTGTACAGGTGGCCCACCTCCGTGCCCATGTGCTTATCCACACTGGTGAGAAGCCCTATCCCTGTGAAATCTGTGGCACCCGTTTCCGGCACCTTCAGACTCTGAAGAGCCACCTGCGAATCCACACAGGAGAGAAACCTTACCATTGTGAGAAGTGTAACCTGCATTTCCGTCACAAAAGCCAGCTGCGACTTCACTTGCGCCAGAAGCATGGCGCCATCACCAACACCAAGGTGCAATACCGCGTGTCAGCCACTGACCTGCCTCCGGAGCTCCCCAAAGCCTGCaaggaaactgcagcagccaagtttgagcggcagcacatggactccagcacttccgctgccTGA(SEQ ID NO:30)
MASPADSCIQFTRHASDVLLNLNRLRSRDILTDVVIVVSREQFRAHKTVLMACSGLFYSIFTDQLKCNLSVINLDPEINPEGFCILLDFMYTSRLNLREGNIMAVMATAMYLQMEHVVDTCRKFIKASEAEMVSAIKPPREEFLNSRMLMPQDIMAYRGREVVENNLPLRSAPGCESRAFAPSLYSGLSTPPASYSMYSHLPVSSLLFSDEEFRDVRMPVANPFPKERALPCDSARPVPGEYSRPTLEVSPNVCHSNIYSPKETIPEEARSDMHYSVAEGLKPAAPSARNAPYFPCDKASKEEERPSSEDEIALHFEPPNAPLNRKGLVSPQSPQKSDCQPNSPTESCSSKNACILQASGSPPAKSPTDPKACNWKKYKFIVLNSLNQNAKPEGPEQAELGRLSPRAYTAPPACQPPMEPENLDLQSPTKLSASGEDSTIPQASRLNNIVNRSMTGSPRSSSESHSPLYMHPPKCTSCGSQSPQHAEMCLHTAGPTFPEEMGETQSEYSDSSCENGAFFCNECDCRFSEEASLKRHTLQTHSDKPYKCDRCQASFRYKGNLASHKTVHTGEKPYRCNICGAQFNRPANLKTHTRIHSGEKPYKCETCGARFVQVAHLRAHVLIHTGEKPYPCEICGTRFRHLQTLKSHLRIHTGEKPYHCEKCNLHFRHKSQLRLHLRQKHGAITNTKVQYRVSATDLPPELPKACKETAAAKFERQHMDSSTSAA-(SEQ ID NO:31)
atgcgaccctccgggacggccggggcagcgctcctggcgctgctggctgcgctctgcccggcgagtcgggctctggaggaaaagaaagtttgccaaggcacgagtaacaagctcacgcagttgggcacttttgaagatcattttctcagcctccagaggatgttcaataactgtgaggtggtccttgggaatttggaaattacctatgtgcagaggaattatgatctttccttcttaaagaccatccaggaggtggctggttatgtcctcattgccctcaacacagtggagcgaattcctttggaaaacctgcagatcatcagaggaaatatgtactacgaaaattcctatgccttagcagtcttatctaactatgatgcaaataaaaccggactgaaggagctgcccatgagaaatttacaggaaatcctgcatggcgccgtgcggttcagcaacaaccctgccctgtgcaacgtggagagcatccagtggcgggacatagtcagcagtgactttctcagcaacatgtcgatggacttccagaaccacctgggcagctgccaaaagtgtgatccaagctgtcccaatgggagctgctggggtgcaggagaggagaactgccagaaactgaccaaaatcatctgtgcccagcagtgctccgggcgctgccgtggcaagtcccccagtgactgctgccacaaccagtgtgctgcaggctgcacaggcccccgggagagcgactgcctggtctgccgcaaattccgagacgaagccacgtgcaaggacacctgccccccactcatgctctacaaccccaccacgtaccagatggatgtgaaccccgagggcaaatacagctttggtgccacctgcgtgaagaagtgtccccgtaattatgtggtgacagatcacggctcgtgcgtccgagcctgtggggccgacagctatgagatggaggaagacggcgtccgcaagtgtaagaagtgcgaagggccttgccgcaaagtgtgtaacggaataggtattggtgaatttaaagactcactctccataaatgctacgaatattaaacacttcaaaaactgcacctccatcagtggcgatctccacatcctgccggtggcatttaggggtgactccttcacacatactcctcctctggatccacaggaactggatattctgaaaaccgtaaaggaaatcacagggtttttgctgattcaggcttggcctgaaaacaggacggacctccatgcctttgagaacctagaaatcatacgcggcaggaccaagcaacatggtcagttttctcttgcagtcgtcagcctgaacataacatccttgggattacgctccctcaaggagataagtgatggagatgtgataatttcaggaaacaaaaatttgtgctatgcaaatacaataaactggaaaaaactgtttgggacctccggtcagaaaaccaaaattataagcaacagaggtgaaaacagctgcaaggccacaggccaggtctgccatgccttgtgctcccccgagggctgctggggcccggagcccagggactgcgtctcttgccggaatgtcagccgaggcagggaatgcgtggacaagtgcaaccttctggagggtgagccaagggagtttgtggagaactctgagtgcatacagtgccacccagagtgcctgcctcaggccatgaacatcacctgcacaggacggggaccagacaactgtatccagtgtgcccactacattgacggcccccactgcgtcaagacctgcccggcaggagtcatgggagaaaacaacaccctggtctggaagtacgcagacgccggccatgtgtgccacctgtgccatccaaactgcacctacggatgcactgggccaggtcttgaaggctgtccaacgaatgggcctaagatcccgtccatcgccactgggatggtgggggccctcctcttgctgctggtggtggccctggggatcggcctcttcatgcgaaggcgccacatcgttcggaagcgcacgctgcggaggctgctgcaggagagggagcttgtggagcctcttacacccagtggagaagctcccaaccaagctctcttgaggatcttgaaggaaactgaattcaaaaagatcaaagtgctgggctccggtgcgttcggcacggtgtataagggactctggatcccagaaggtgagaaagttaaaattcccgtcgctatcaaggaattaagagaagcaacatctccgaaagccaacaaggaaatcctcgatgaagcctacgtgatggccagcgtggacaacccccacgtgtgccgcctgctgggcatctgcctcacctccaccgtgcagctcatcatgcagctcatgcccttcggctgcctcctggactatgtccgggaacacaaagacaatattggctcccagtacctgctcaactggtgtgtgcagatcgcaaagggcatgaactacttggaggaccgtcgcttggtgcaccgcgacctggcagccaggaacgtactggtgaaaacaccgcagcatgtcaagatcacagattttgggcgggccaaactgctgggtgcggaagagaaagaataccatgcagaaggaggcaaagtgcctatcaagtggatggcattggaatcaattttacacagaatctatacccaccagagtgatgtctggagctacggggtgactgtttgggagttgatgacctttggatccaagccatatgacggaatccctgccagcgagatctcctccatcctggagaaaggagaacgcctccctcagccacccatatgtaccatcgatgtctacatgatcatggtcaagtgctggatgatagacgcagatagtcgcccaaagttccgtgagttgatcatcgaattctccaaaatggcccgagacccccagcgctaccttgtcattcagggggatgaaagaatgcatttgccaagtcctacagactccaacttctaccgtgccctgatggatgaagaagacatggacgacgtggtggatgccgacgagtacctcatcccacagcagggcttcttcagcagcccctccacgtcacggactcccctcctgagctctctgagtgcaaccagcaacaattccaccgtggcttgcattgatagaaatgggctgcaaagctgtcccatcaaggaagacagcttcttgcagcgatacagctcagaccccacaggcgccttgactgaggacagcatagacgacaccttcctcccagtgcctgaatacataaaccagtccgttcccaaaaggcccgctggctctgtgcagaatcctgtctatcacaatcagcctctgaaccccgcgcccagcagagacccacactaccaggacccccacagcactgcagtgggcaaccccgagtatctcaacactgtccagcccacctgtgtcaacagcacattcgacagccctgcccactgggcccagaaaggcagccaccaaattagcctggacaaccctgactaccagcaggacttctttcccaaggaagccaagccaaatggcatctttaagggctccacagctgaaaatgcagaatacctaagggtcgcgccacaaagcagtgaatttattggagcaaaggaaactgcagcagccaagtttgagcggcagcacatggactccagcacttccgctgcctga(SEQ ID NO:32)
MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTSTVQLIMQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGRAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDSIDDTFLPVPEYINQSVPKRPAGSVQNPVYHNQPLNPAPSRDPHYQDPHSTAVGNPEYLNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRVAPQSSEFIGAKETAAAKFERQHMDSSTSAA-(SEQ ID NO:33)
HHHHHH(SEQ ID NO:34)
序列表
<110> 纳尔德生物有限责任公司
<120> 高通量药物筛选方法
<130> 062554-0562965
<150> 63/114,927
<151> 2020-11-17
<160> 34
<170> 专利版本 3.5
<210> 1
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 1
Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala Ala
20
<210> 2
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 2
Lys Glu Thr Asn Trp Ala Trp Phe Trp Asp Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 3
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 3
Lys Glu Thr Gly Trp Ala Leu Phe Val Gln Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 4
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 4
Lys Glu Thr Val Met Ala Asn Phe Gln Met Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 5
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 5
Lys Glu Thr Gly Asp Ala Val Phe Ala Arg Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 6
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 6
Lys Glu Thr Gly Trp Ala Ala Phe Val Lys Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 7
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 7
Lys Glu Thr Gly Trp Ala Thr Phe Val Glu Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 8
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 8
Lys Glu Thr Lys Leu Ala Phe Phe Leu Lys Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 9
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 9
Lys Glu Thr Trp Trp Ala Trp Phe Phe Gly Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 10
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 10
Lys Glu Thr Thr Trp Ala Glu Phe Thr Trp Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 11
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 11
Lys Glu Thr Pro Trp Ala Ser Phe Asn Lys Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 12
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 12
Lys Glu Thr Ala Met Ala Met Phe Val Thr Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 13
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 13
Lys Glu Thr Leu Trp Ala Trp Phe Met Trp Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala
<210> 14
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 14
Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
1 5 10 15
<210> 15
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 15
Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asn Ser
1 5 10 15
<210> 16
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 16
Asn Arg Ala Trp Ser Glu Phe Leu Trp Gln His Leu Ala Pro Val
1 5 10 15
<210> 17
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 17
Asn Arg Gly Trp Ser Glu Phe Leu Trp Gln His His Ala Pro Val
1 5 10 15
<210> 18
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 18
Asn Arg Ala Trp Ser Val Phe Gln Trp Gln His Ile Ala Pro Ala
1 5 10 15
<210> 19
<211> 105
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 19
Met Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu
1 5 10 15
Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu
20 25 30
Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn
35 40 45
Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp
50 55 60
Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr
65 70 75 80
Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr
85 90 95
Val Pro Val His Phe Asp Ala Ser Val
100 105
<210> 20
<211> 102
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 20
Met Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu
1 5 10 15
Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu
20 25 30
Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn
35 40 45
Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp
50 55 60
Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr
65 70 75 80
Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr
85 90 95
Val Pro Val His Phe Asp
100
<210> 21
<211> 124
<212> PRT
<213> Bos taurus
<400> 21
Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala Ala Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser
20 25 30
Arg Asn Leu Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His
35 40 45
Glu Ser Leu Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala
50 55 60
Cys Lys Asn Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser
65 70 75 80
Ile Thr Asp Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala
85 90 95
Tyr Lys Thr Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly
100 105 110
Asn Pro Tyr Val Pro Val His Phe Asp Ala Ser Val
115 120
<210> 22
<211> 348
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 22
ggtaccatga gcagctccaa ctactgtaac cagatgatga agagccggaa cctgaccaaa 60
gatcgatgca agccagtgaa cacctttgtg cacgagtccc tggctgatgt ccaggccgtg 120
tgctcccaga aaaatgttgc ctgcaagaat gggcagacca attgctacca gagctactcc 180
accatgagca tcaccgactg ccgtgagacc ggcagctcca agtaccccaa ctgtgcctac 240
aagaccaccc aggcgaataa acacatcatt gtggcttgtg agggaaaccc gtacgtgcca 300
gtccactttg atgcttcagt gcatcaccat caccatcact agggatcc 348
<210> 23
<211> 111
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 23
Met Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu
1 5 10 15
Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu
20 25 30
Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn
35 40 45
Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp
50 55 60
Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr
65 70 75 80
Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr
85 90 95
Val Pro Val His Phe Asp Ala Ser Val His His His His His His
100 105 110
<210> 24
<211> 552
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 24
ggtaccatgg gcgcctccag gctctatacc ctggtgctgg tcctgcagcc tcagcgagtt 60
ctcctgggca tgaaaaagcg aggcttcggg gccggccggt ggaatggctt tgggggcaaa 120
gtgcaagaag gagagaccat cgaggatggg gctaggaggg agctgcagga ggagagcggt 180
ctgacagtgg acgccctgca caaggtgggc cagatcgtgt ttgagttcgt gggcgagcct 240
gagctcatgg acgtgcatgt cttctgcaca gacagcatcc aggggacccc cgtggagagc 300
gacgaaatgc gcccatgctg gttccagctg gatcagatcc ccttcaagga catgtggccc 360
gacgacagct actggtttcc actcctgctt cagaagaaga aattccacgg gtacttcaag 420
ttccagggtc aggacaccat cctggactac acactccgcg aggtggacac ggtcaaggaa 480
actgcagcag ccaagtttga gcggcagcac atggactcca gcacttccgc tgcctaggct 540
gcctagggat cc 552
<210> 25
<211> 176
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 25
Met Gly Ala Ser Arg Leu Tyr Thr Leu Val Leu Val Leu Gln Pro Gln
1 5 10 15
Arg Val Leu Leu Gly Met Lys Lys Arg Gly Phe Gly Ala Gly Arg Trp
20 25 30
Asn Gly Phe Gly Gly Lys Val Gln Glu Gly Glu Thr Ile Glu Asp Gly
35 40 45
Ala Arg Arg Glu Leu Gln Glu Glu Ser Gly Leu Thr Val Asp Ala Leu
50 55 60
His Lys Val Gly Gln Ile Val Phe Glu Phe Val Gly Glu Pro Glu Leu
65 70 75 80
Met Asp Val His Val Phe Cys Thr Asp Ser Ile Gln Gly Thr Pro Val
85 90 95
Glu Ser Asp Glu Met Arg Pro Cys Trp Phe Gln Leu Asp Gln Ile Pro
100 105 110
Phe Lys Asp Met Trp Pro Asp Asp Ser Tyr Trp Phe Pro Leu Leu Leu
115 120 125
Gln Lys Lys Lys Phe His Gly Tyr Phe Lys Phe Gln Gly Gln Asp Thr
130 135 140
Ile Leu Asp Tyr Thr Leu Arg Glu Val Asp Thr Val Lys Glu Thr Ala
145 150 155 160
Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser Thr Ser Ala Ala
165 170 175
<210> 26
<211> 561
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 26
ggtaccatgg gcgcctccag gctctatacc ctggtgctgg tcctgcagcc tcagcgagtt 60
ctcctgggca tgaaaaagcg aggcttcggg gccggccggt ggaatggctt tgggggcaaa 120
gtgcaagaag gagagaccat cgaggatggg gctaggaggg agctgcagga ggagagcggt 180
ctgacagtgg acgccctgca caaggtgggc cagatcgtgt ttgagttcgt gggcgagcct 240
gagctcatgg acgtgcatgt cttctgcaca gacagcatcc aggggacccc cgtggagagc 300
gacgaaatgc gcccatgctg gttccagctg gatcagatcc ccttcaagga catgtggccc 360
gacgacagct actggtttcc actcctgctt cagaagaaga aattccacgg gtacttcaag 420
ttccagggtc aggacaccat cctggactac acactccgcg aggtggacac ggtcgccgcc 480
gccaaggaaa ctgcagcagc caagtttgag cggcagcaca tggactccag cacttccgct 540
gcctaggctg cctagggatc c 561
<210> 27
<211> 179
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 27
Met Gly Ala Ser Arg Leu Tyr Thr Leu Val Leu Val Leu Gln Pro Gln
1 5 10 15
Arg Val Leu Leu Gly Met Lys Lys Arg Gly Phe Gly Ala Gly Arg Trp
20 25 30
Asn Gly Phe Gly Gly Lys Val Gln Glu Gly Glu Thr Ile Glu Asp Gly
35 40 45
Ala Arg Arg Glu Leu Gln Glu Glu Ser Gly Leu Thr Val Asp Ala Leu
50 55 60
His Lys Val Gly Gln Ile Val Phe Glu Phe Val Gly Glu Pro Glu Leu
65 70 75 80
Met Asp Val His Val Phe Cys Thr Asp Ser Ile Gln Gly Thr Pro Val
85 90 95
Glu Ser Asp Glu Met Arg Pro Cys Trp Phe Gln Leu Asp Gln Ile Pro
100 105 110
Phe Lys Asp Met Trp Pro Asp Asp Ser Tyr Trp Phe Pro Leu Leu Leu
115 120 125
Gln Lys Lys Lys Phe His Gly Tyr Phe Lys Phe Gln Gly Gln Asp Thr
130 135 140
Ile Leu Asp Tyr Thr Leu Arg Glu Val Asp Thr Val Ala Ala Ala Lys
145 150 155 160
Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser Thr
165 170 175
Ser Ala Ala
<210> 28
<211> 582
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 28
ggtaccatgg gcgcctccag gctctatacc ctggtgctgg tcctgcagcc tcagcgagtt 60
ctcctgggca tgaaaaagcg aggcttcggg gccggccggt ggaatggctt tgggggcaaa 120
gtgcaagaag gagagaccat cgaggatggg gctaggaggg agctgcagga ggagagcggt 180
ctgacagtgg acgccctgca caaggtgggc cagatcgtgt ttgagttcgt gggcgagcct 240
gagctcatgg acgtgcatgt cttctgcaca gacagcatcc aggggacccc cgtggagagc 300
gacgaaatgc gcccatgctg gttccagctg gatcagatcc ccttcaagga catgtggccc 360
gacgacagct actggtttcc actcctgctt cagaagaaga aattccacgg gtacttcaag 420
ttccagggtc aggacaccat cctggactac acactccgcg aggtggacac ggtcgccgcc 480
gccgccgccg ccgccgccgc cgccaaggaa actgcagcag ccaagtttga gcggcagcac 540
atggactcca gcacttccgc tgcctaggct gcctagggat cc 582
<210> 29
<211> 186
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 29
Met Gly Ala Ser Arg Leu Tyr Thr Leu Val Leu Val Leu Gln Pro Gln
1 5 10 15
Arg Val Leu Leu Gly Met Lys Lys Arg Gly Phe Gly Ala Gly Arg Trp
20 25 30
Asn Gly Phe Gly Gly Lys Val Gln Glu Gly Glu Thr Ile Glu Asp Gly
35 40 45
Ala Arg Arg Glu Leu Gln Glu Glu Ser Gly Leu Thr Val Asp Ala Leu
50 55 60
His Lys Val Gly Gln Ile Val Phe Glu Phe Val Gly Glu Pro Glu Leu
65 70 75 80
Met Asp Val His Val Phe Cys Thr Asp Ser Ile Gln Gly Thr Pro Val
85 90 95
Glu Ser Asp Glu Met Arg Pro Cys Trp Phe Gln Leu Asp Gln Ile Pro
100 105 110
Phe Lys Asp Met Trp Pro Asp Asp Ser Tyr Trp Phe Pro Leu Leu Leu
115 120 125
Gln Lys Lys Lys Phe His Gly Tyr Phe Lys Phe Gln Gly Gln Asp Thr
130 135 140
Ile Leu Asp Tyr Thr Leu Arg Glu Val Asp Thr Val Ala Ala Ala Ala
145 150 155 160
Ala Ala Ala Ala Ala Ala Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg
165 170 175
Gln His Met Asp Ser Ser Thr Ser Ala Ala
180 185
<210> 30
<211> 2181
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 30
atggcctcgc cggctgacag ctgtatccag ttcacccgcc atgccagtga tgttcttctc 60
aaccttaatc gtctccggag tcgagacatc ttgactgatg ttgtcattgt tgtgagccgt 120
gagcagttta gagcccataa aacggtcctc atggcctgca gtggcctgtt ctatagcatc 180
tttacagacc agttgaaatg caaccttagt gtgatcaatc tagatcctga gatcaaccct 240
gagggattct gcatcctcct ggacttcatg tacacatctc ggctcaattt gcgggagggc 300
aacatcatgg ctgtgatggc cacggctatg tacctgcaga tggagcatgt tgtggacact 360
tgccggaagt ttattaaggc cagtgaagca gagatggttt ctgccatcaa gcctcctcgt 420
gaagagttcc tcaacagccg gatgctgatg ccccaagaca tcatggccta tcggggtcgt 480
gaggtggtgg agaacaacct gccactgagg agcgcccctg ggtgtgagag cagagccttt 540
gcccccagcc tgtacagtgg cctgtccaca ccgccagcct cttattccat gtacagccac 600
ctccctgtca gcagcctcct cttctccgat gaggagtttc gggatgtccg gatgcctgtg 660
gccaacccct tccccaagga gcgggcactc ccatgtgata gtgccaggcc agtccctggt 720
gagtacagcc ggccgacttt ggaggtgtcc cccaatgtgt gccacagcaa tatctattca 780
cccaaggaaa caatcccaga agaggcacga agtgatatgc actacagtgt ggctgagggc 840
ctcaaacctg ctgccccctc agcccgaaat gccccctact tcccttgtga caaggccagc 900
aaagaagaag agagaccctc ctcggaagat gagattgccc tgcatttcga gccccccaat 960
gcacccctga accggaaggg tctggttagt ccacagagcc cccagaaatc tgactgccag 1020
cccaactcgc ccacagagtc ctgcagcagt aagaatgcct gcatcctcca ggcttctggc 1080
tcccctccag ccaagagccc cactgacccc aaagcctgca actggaagaa atacaagttc 1140
atcgtgctca acagcctcaa ccagaatgcc aaaccagagg ggcctgagca ggctgagctg 1200
ggccgccttt ccccacgagc ctacacggcc ccacctgcct gccagccacc catggagcct 1260
gagaaccttg acctccagtc cccaaccaag ctgagtgcca gcggggagga ctccaccatc 1320
ccacaagcca gccggctcaa taacatcgtt aacaggtcca tgacgggctc tccccgcagc 1380
agcagcgaga gccactcacc actctacatg caccccccga agtgcacgtc ctgcggctct 1440
cagtccccac agcatgcaga gatgtgcctc cacaccgctg gccccacgtt ccctgaggag 1500
atgggagaga cccagtctga gtactcagat tctagctgtg agaacggggc cttcttctgc 1560
aatgagtgtg actgccgctt ctctgaggag gcctcactca agaggcacac gctgcagacc 1620
cacagtgaca aaccctacaa gtgtgaccgc tgccaggcct ccttccgcta caagggcaac 1680
ctcgccagcc acaagaccgt ccataccggt gagaaaccct atcgttgcaa catctgtggg 1740
gcccagttca accggccagc caacctgaaa acccacactc gaattcactc tggagagaag 1800
ccctacaaat gcgaaacctg cggagccaga tttgtacagg tggcccacct ccgtgcccat 1860
gtgcttatcc acactggtga gaagccctat ccctgtgaaa tctgtggcac ccgtttccgg 1920
caccttcaga ctctgaagag ccacctgcga atccacacag gagagaaacc ttaccattgt 1980
gagaagtgta acctgcattt ccgtcacaaa agccagctgc gacttcactt gcgccagaag 2040
catggcgcca tcaccaacac caaggtgcaa taccgcgtgt cagccactga cctgcctccg 2100
gagctcccca aagcctgcaa ggaaactgca gcagccaagt ttgagcggca gcacatggac 2160
tccagcactt ccgctgcctg a 2181
<210> 31
<211> 726
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述
<400> 31
Met Ala Ser Pro Ala Asp Ser Cys Ile Gln Phe Thr Arg His Ala Ser
1 5 10 15
Asp Val Leu Leu Asn Leu Asn Arg Leu Arg Ser Arg Asp Ile Leu Thr
20 25 30
Asp Val Val Ile Val Val Ser Arg Glu Gln Phe Arg Ala His Lys Thr
35 40 45
Val Leu Met Ala Cys Ser Gly Leu Phe Tyr Ser Ile Phe Thr Asp Gln
50 55 60
Leu Lys Cys Asn Leu Ser Val Ile Asn Leu Asp Pro Glu Ile Asn Pro
65 70 75 80
Glu Gly Phe Cys Ile Leu Leu Asp Phe Met Tyr Thr Ser Arg Leu Asn
85 90 95
Leu Arg Glu Gly Asn Ile Met Ala Val Met Ala Thr Ala Met Tyr Leu
100 105 110
Gln Met Glu His Val Val Asp Thr Cys Arg Lys Phe Ile Lys Ala Ser
115 120 125
Glu Ala Glu Met Val Ser Ala Ile Lys Pro Pro Arg Glu Glu Phe Leu
130 135 140
Asn Ser Arg Met Leu Met Pro Gln Asp Ile Met Ala Tyr Arg Gly Arg
145 150 155 160
Glu Val Val Glu Asn Asn Leu Pro Leu Arg Ser Ala Pro Gly Cys Glu
165 170 175
Ser Arg Ala Phe Ala Pro Ser Leu Tyr Ser Gly Leu Ser Thr Pro Pro
180 185 190
Ala Ser Tyr Ser Met Tyr Ser His Leu Pro Val Ser Ser Leu Leu Phe
195 200 205
Ser Asp Glu Glu Phe Arg Asp Val Arg Met Pro Val Ala Asn Pro Phe
210 215 220
Pro Lys Glu Arg Ala Leu Pro Cys Asp Ser Ala Arg Pro Val Pro Gly
225 230 235 240
Glu Tyr Ser Arg Pro Thr Leu Glu Val Ser Pro Asn Val Cys His Ser
245 250 255
Asn Ile Tyr Ser Pro Lys Glu Thr Ile Pro Glu Glu Ala Arg Ser Asp
260 265 270
Met His Tyr Ser Val Ala Glu Gly Leu Lys Pro Ala Ala Pro Ser Ala
275 280 285
Arg Asn Ala Pro Tyr Phe Pro Cys Asp Lys Ala Ser Lys Glu Glu Glu
290 295 300
Arg Pro Ser Ser Glu Asp Glu Ile Ala Leu His Phe Glu Pro Pro Asn
305 310 315 320
Ala Pro Leu Asn Arg Lys Gly Leu Val Ser Pro Gln Ser Pro Gln Lys
325 330 335
Ser Asp Cys Gln Pro Asn Ser Pro Thr Glu Ser Cys Ser Ser Lys Asn
340 345 350
Ala Cys Ile Leu Gln Ala Ser Gly Ser Pro Pro Ala Lys Ser Pro Thr
355 360 365
Asp Pro Lys Ala Cys Asn Trp Lys Lys Tyr Lys Phe Ile Val Leu Asn
370 375 380
Ser Leu Asn Gln Asn Ala Lys Pro Glu Gly Pro Glu Gln Ala Glu Leu
385 390 395 400
Gly Arg Leu Ser Pro Arg Ala Tyr Thr Ala Pro Pro Ala Cys Gln Pro
405 410 415
Pro Met Glu Pro Glu Asn Leu Asp Leu Gln Ser Pro Thr Lys Leu Ser
420 425 430
Ala Ser Gly Glu Asp Ser Thr Ile Pro Gln Ala Ser Arg Leu Asn Asn
435 440 445
Ile Val Asn Arg Ser Met Thr Gly Ser Pro Arg Ser Ser Ser Glu Ser
450 455 460
His Ser Pro Leu Tyr Met His Pro Pro Lys Cys Thr Ser Cys Gly Ser
465 470 475 480
Gln Ser Pro Gln His Ala Glu Met Cys Leu His Thr Ala Gly Pro Thr
485 490 495
Phe Pro Glu Glu Met Gly Glu Thr Gln Ser Glu Tyr Ser Asp Ser Ser
500 505 510
Cys Glu Asn Gly Ala Phe Phe Cys Asn Glu Cys Asp Cys Arg Phe Ser
515 520 525
Glu Glu Ala Ser Leu Lys Arg His Thr Leu Gln Thr His Ser Asp Lys
530 535 540
Pro Tyr Lys Cys Asp Arg Cys Gln Ala Ser Phe Arg Tyr Lys Gly Asn
545 550 555 560
Leu Ala Ser His Lys Thr Val His Thr Gly Glu Lys Pro Tyr Arg Cys
565 570 575
Asn Ile Cys Gly Ala Gln Phe Asn Arg Pro Ala Asn Leu Lys Thr His
580 585 590
Thr Arg Ile His Ser Gly Glu Lys Pro Tyr Lys Cys Glu Thr Cys Gly
595 600 605
Ala Arg Phe Val Gln Val Ala His Leu Arg Ala His Val Leu Ile His
610 615 620
Thr Gly Glu Lys Pro Tyr Pro Cys Glu Ile Cys Gly Thr Arg Phe Arg
625 630 635 640
His Leu Gln Thr Leu Lys Ser His Leu Arg Ile His Thr Gly Glu Lys
645 650 655
Pro Tyr His Cys Glu Lys Cys Asn Leu His Phe Arg His Lys Ser Gln
660 665 670
Leu Arg Leu His Leu Arg Gln Lys His Gly Ala Ile Thr Asn Thr Lys
675 680 685
Val Gln Tyr Arg Val Ser Ala Thr Asp Leu Pro Pro Glu Leu Pro Lys
690 695 700
Ala Cys Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp
705 710 715 720
Ser Ser Thr Ser Ala Ala
725
<210> 32
<211> 3693
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多核苷酸
<400> 32
atgcgaccct ccgggacggc cggggcagcg ctcctggcgc tgctggctgc gctctgcccg 60
gcgagtcggg ctctggagga aaagaaagtt tgccaaggca cgagtaacaa gctcacgcag 120
ttgggcactt ttgaagatca ttttctcagc ctccagagga tgttcaataa ctgtgaggtg 180
gtccttggga atttggaaat tacctatgtg cagaggaatt atgatctttc cttcttaaag 240
accatccagg aggtggctgg ttatgtcctc attgccctca acacagtgga gcgaattcct 300
ttggaaaacc tgcagatcat cagaggaaat atgtactacg aaaattccta tgccttagca 360
gtcttatcta actatgatgc aaataaaacc ggactgaagg agctgcccat gagaaattta 420
caggaaatcc tgcatggcgc cgtgcggttc agcaacaacc ctgccctgtg caacgtggag 480
agcatccagt ggcgggacat agtcagcagt gactttctca gcaacatgtc gatggacttc 540
cagaaccacc tgggcagctg ccaaaagtgt gatccaagct gtcccaatgg gagctgctgg 600
ggtgcaggag aggagaactg ccagaaactg accaaaatca tctgtgccca gcagtgctcc 660
gggcgctgcc gtggcaagtc ccccagtgac tgctgccaca accagtgtgc tgcaggctgc 720
acaggccccc gggagagcga ctgcctggtc tgccgcaaat tccgagacga agccacgtgc 780
aaggacacct gccccccact catgctctac aaccccacca cgtaccagat ggatgtgaac 840
cccgagggca aatacagctt tggtgccacc tgcgtgaaga agtgtccccg taattatgtg 900
gtgacagatc acggctcgtg cgtccgagcc tgtggggccg acagctatga gatggaggaa 960
gacggcgtcc gcaagtgtaa gaagtgcgaa gggccttgcc gcaaagtgtg taacggaata 1020
ggtattggtg aatttaaaga ctcactctcc ataaatgcta cgaatattaa acacttcaaa 1080
aactgcacct ccatcagtgg cgatctccac atcctgccgg tggcatttag gggtgactcc 1140
ttcacacata ctcctcctct ggatccacag gaactggata ttctgaaaac cgtaaaggaa 1200
atcacagggt ttttgctgat tcaggcttgg cctgaaaaca ggacggacct ccatgccttt 1260
gagaacctag aaatcatacg cggcaggacc aagcaacatg gtcagttttc tcttgcagtc 1320
gtcagcctga acataacatc cttgggatta cgctccctca aggagataag tgatggagat 1380
gtgataattt caggaaacaa aaatttgtgc tatgcaaata caataaactg gaaaaaactg 1440
tttgggacct ccggtcagaa aaccaaaatt ataagcaaca gaggtgaaaa cagctgcaag 1500
gccacaggcc aggtctgcca tgccttgtgc tcccccgagg gctgctgggg cccggagccc 1560
agggactgcg tctcttgccg gaatgtcagc cgaggcaggg aatgcgtgga caagtgcaac 1620
cttctggagg gtgagccaag ggagtttgtg gagaactctg agtgcataca gtgccaccca 1680
gagtgcctgc ctcaggccat gaacatcacc tgcacaggac ggggaccaga caactgtatc 1740
cagtgtgccc actacattga cggcccccac tgcgtcaaga cctgcccggc aggagtcatg 1800
ggagaaaaca acaccctggt ctggaagtac gcagacgccg gccatgtgtg ccacctgtgc 1860
catccaaact gcacctacgg atgcactggg ccaggtcttg aaggctgtcc aacgaatggg 1920
cctaagatcc cgtccatcgc cactgggatg gtgggggccc tcctcttgct gctggtggtg 1980
gccctgggga tcggcctctt catgcgaagg cgccacatcg ttcggaagcg cacgctgcgg 2040
aggctgctgc aggagaggga gcttgtggag cctcttacac ccagtggaga agctcccaac 2100
caagctctct tgaggatctt gaaggaaact gaattcaaaa agatcaaagt gctgggctcc 2160
ggtgcgttcg gcacggtgta taagggactc tggatcccag aaggtgagaa agttaaaatt 2220
cccgtcgcta tcaaggaatt aagagaagca acatctccga aagccaacaa ggaaatcctc 2280
gatgaagcct acgtgatggc cagcgtggac aacccccacg tgtgccgcct gctgggcatc 2340
tgcctcacct ccaccgtgca gctcatcatg cagctcatgc ccttcggctg cctcctggac 2400
tatgtccggg aacacaaaga caatattggc tcccagtacc tgctcaactg gtgtgtgcag 2460
atcgcaaagg gcatgaacta cttggaggac cgtcgcttgg tgcaccgcga cctggcagcc 2520
aggaacgtac tggtgaaaac accgcagcat gtcaagatca cagattttgg gcgggccaaa 2580
ctgctgggtg cggaagagaa agaataccat gcagaaggag gcaaagtgcc tatcaagtgg 2640
atggcattgg aatcaatttt acacagaatc tatacccacc agagtgatgt ctggagctac 2700
ggggtgactg tttgggagtt gatgaccttt ggatccaagc catatgacgg aatccctgcc 2760
agcgagatct cctccatcct ggagaaagga gaacgcctcc ctcagccacc catatgtacc 2820
atcgatgtct acatgatcat ggtcaagtgc tggatgatag acgcagatag tcgcccaaag 2880
ttccgtgagt tgatcatcga attctccaaa atggcccgag acccccagcg ctaccttgtc 2940
attcaggggg atgaaagaat gcatttgcca agtcctacag actccaactt ctaccgtgcc 3000
ctgatggatg aagaagacat ggacgacgtg gtggatgccg acgagtacct catcccacag 3060
cagggcttct tcagcagccc ctccacgtca cggactcccc tcctgagctc tctgagtgca 3120
accagcaaca attccaccgt ggcttgcatt gatagaaatg ggctgcaaag ctgtcccatc 3180
aaggaagaca gcttcttgca gcgatacagc tcagacccca caggcgcctt gactgaggac 3240
agcatagacg acaccttcct cccagtgcct gaatacataa accagtccgt tcccaaaagg 3300
cccgctggct ctgtgcagaa tcctgtctat cacaatcagc ctctgaaccc cgcgcccagc 3360
agagacccac actaccagga cccccacagc actgcagtgg gcaaccccga gtatctcaac 3420
actgtccagc ccacctgtgt caacagcaca ttcgacagcc ctgcccactg ggcccagaaa 3480
ggcagccacc aaattagcct ggacaaccct gactaccagc aggacttctt tcccaaggaa 3540
gccaagccaa atggcatctt taagggctcc acagctgaaa atgcagaata cctaagggtc 3600
gcgccacaaa gcagtgaatt tattggagca aaggaaactg cagcagccaa gtttgagcgg 3660
cagcacatgg actccagcac ttccgctgcc tga 3693
<210> 33
<211> 1230
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述
<400> 33
Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala
1 5 10 15
Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val Cys Gln
20 25 30
Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp His Phe
35 40 45
Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu Gly Asn
50 55 60
Leu Glu Ile Thr Tyr Val Gln Arg Asn Tyr Asp Leu Ser Phe Leu Lys
65 70 75 80
Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn Thr Val
85 90 95
Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn Met Tyr
100 105 110
Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp Ala Asn
115 120 125
Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu Ile Leu
130 135 140
His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn Val Glu
145 150 155 160
Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser Asn Met
165 170 175
Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys Asp Pro
180 185 190
Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn Cys Gln
195 200 205
Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg Cys Arg
210 215 220
Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala Gly Cys
225 230 235 240
Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe Arg Asp
245 250 255
Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr Asn Pro
260 265 270
Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser Phe Gly
275 280 285
Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr Asp His
290 295 300
Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met Glu Glu
305 310 315 320
Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg Lys Val
325 330 335
Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn
340 345 350
Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp
355 360 365
Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr
370 375 380
Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu
385 390 395 400
Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg Thr Asp
405 410 415
Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr Lys Gln
420 425 430
His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr Ser Leu
435 440 445
Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile Ile Ser
450 455 460
Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys Lys Leu
465 470 475 480
Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg Gly Glu
485 490 495
Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys Ser Pro
500 505 510
Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys Arg Asn
515 520 525
Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu Glu Gly
530 535 540
Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys His Pro
545 550 555 560
Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg Gly Pro
565 570 575
Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His Cys Val
580 585 590
Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu Val Trp
595 600 605
Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His Pro Asn Cys
610 615 620
Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro Thr Asn Gly
625 630 635 640
Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala Leu Leu Leu
645 650 655
Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met Arg Arg Arg His
660 665 670
Ile Val Arg Lys Arg Thr Leu Arg Arg Leu Leu Gln Glu Arg Glu Leu
675 680 685
Val Glu Pro Leu Thr Pro Ser Gly Glu Ala Pro Asn Gln Ala Leu Leu
690 695 700
Arg Ile Leu Lys Glu Thr Glu Phe Lys Lys Ile Lys Val Leu Gly Ser
705 710 715 720
Gly Ala Phe Gly Thr Val Tyr Lys Gly Leu Trp Ile Pro Glu Gly Glu
725 730 735
Lys Val Lys Ile Pro Val Ala Ile Lys Glu Leu Arg Glu Ala Thr Ser
740 745 750
Pro Lys Ala Asn Lys Glu Ile Leu Asp Glu Ala Tyr Val Met Ala Ser
755 760 765
Val Asp Asn Pro His Val Cys Arg Leu Leu Gly Ile Cys Leu Thr Ser
770 775 780
Thr Val Gln Leu Ile Met Gln Leu Met Pro Phe Gly Cys Leu Leu Asp
785 790 795 800
Tyr Val Arg Glu His Lys Asp Asn Ile Gly Ser Gln Tyr Leu Leu Asn
805 810 815
Trp Cys Val Gln Ile Ala Lys Gly Met Asn Tyr Leu Glu Asp Arg Arg
820 825 830
Leu Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Val Lys Thr Pro
835 840 845
Gln His Val Lys Ile Thr Asp Phe Gly Arg Ala Lys Leu Leu Gly Ala
850 855 860
Glu Glu Lys Glu Tyr His Ala Glu Gly Gly Lys Val Pro Ile Lys Trp
865 870 875 880
Met Ala Leu Glu Ser Ile Leu His Arg Ile Tyr Thr His Gln Ser Asp
885 890 895
Val Trp Ser Tyr Gly Val Thr Val Trp Glu Leu Met Thr Phe Gly Ser
900 905 910
Lys Pro Tyr Asp Gly Ile Pro Ala Ser Glu Ile Ser Ser Ile Leu Glu
915 920 925
Lys Gly Glu Arg Leu Pro Gln Pro Pro Ile Cys Thr Ile Asp Val Tyr
930 935 940
Met Ile Met Val Lys Cys Trp Met Ile Asp Ala Asp Ser Arg Pro Lys
945 950 955 960
Phe Arg Glu Leu Ile Ile Glu Phe Ser Lys Met Ala Arg Asp Pro Gln
965 970 975
Arg Tyr Leu Val Ile Gln Gly Asp Glu Arg Met His Leu Pro Ser Pro
980 985 990
Thr Asp Ser Asn Phe Tyr Arg Ala Leu Met Asp Glu Glu Asp Met Asp
995 1000 1005
Asp Val Val Asp Ala Asp Glu Tyr Leu Ile Pro Gln Gln Gly Phe
1010 1015 1020
Phe Ser Ser Pro Ser Thr Ser Arg Thr Pro Leu Leu Ser Ser Leu
1025 1030 1035
Ser Ala Thr Ser Asn Asn Ser Thr Val Ala Cys Ile Asp Arg Asn
1040 1045 1050
Gly Leu Gln Ser Cys Pro Ile Lys Glu Asp Ser Phe Leu Gln Arg
1055 1060 1065
Tyr Ser Ser Asp Pro Thr Gly Ala Leu Thr Glu Asp Ser Ile Asp
1070 1075 1080
Asp Thr Phe Leu Pro Val Pro Glu Tyr Ile Asn Gln Ser Val Pro
1085 1090 1095
Lys Arg Pro Ala Gly Ser Val Gln Asn Pro Val Tyr His Asn Gln
1100 1105 1110
Pro Leu Asn Pro Ala Pro Ser Arg Asp Pro His Tyr Gln Asp Pro
1115 1120 1125
His Ser Thr Ala Val Gly Asn Pro Glu Tyr Leu Asn Thr Val Gln
1130 1135 1140
Pro Thr Cys Val Asn Ser Thr Phe Asp Ser Pro Ala His Trp Ala
1145 1150 1155
Gln Lys Gly Ser His Gln Ile Ser Leu Asp Asn Pro Asp Tyr Gln
1160 1165 1170
Gln Asp Phe Phe Pro Lys Glu Ala Lys Pro Asn Gly Ile Phe Lys
1175 1180 1185
Gly Ser Thr Ala Glu Asn Ala Glu Tyr Leu Arg Val Ala Pro Gln
1190 1195 1200
Ser Ser Glu Phe Ile Gly Ala Lys Glu Thr Ala Ala Ala Lys Phe
1205 1210 1215
Glu Arg Gln His Met Asp Ser Ser Thr Ser Ala Ala
1220 1225 1230
<210> 34
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成6xHis标签
<400> 34
His His His His His His
1 5

Claims (73)

1.一种确定测试化合物是否可与靶多肽相互作用的方法,所述方法包括:
(a)使融合蛋白与下列物质接触:
(i)测试化合物,
(ii)变性剂,
(iii)核酸酶供体,和
(iv)核酸底物,
(b)检测从所述核酸底物产生的裂解产物的量。
2.根据权利要求1所述的方法,其包括使所述融合蛋白与(v)信号控制器接触。
3.根据权利要求1所述的方法,其中所述融合蛋白包含所述靶多肽和核酸酶受体。
4.根据权利要求1所述的方法,其中所述融合蛋白包含所述靶多肽和核酸酶或核酸酶结构域。
5.根据权利要求1所述的方法,其中所述融合蛋白包含所述靶多肽、核酸酶的N-端结构域和第一结构域,所述第一结构域允许所述N-端结构域二聚化为融合到第二结构域的相同核酸酶的C-端结构域,所述第二结构域与允许二聚化的结构域互补。
6.根据权利要求3所述的方法,其中所述核酸酶受体为S-标签受体肽并且所述核酸酶供体为RNase S复合物的S蛋白。
7.根据权利要求4所述的方法,其中所述核酸酶或核酸酶结构域为核糖核酸酶或脱氧核糖核酸酶。
8.根据权利要求4所述的方法,其中所述核酸酶或核酸酶结构域为序列特异性核酸酶。
9.根据权利要求7所述的方法,其中所述核酸酶为CRISPR缔合(Cas)蛋白。
10.根据权利要求9所述的方法,其中所述Cas蛋白为Cas9(Csn1)、Cas12a(Cpf1)、Cas12b(C2c1)、Cas13a(C2c2)、Cas13b(C2c6)或Cas13c(C2c7)。
11.根据权利要求10所述的方法,其中所述Cas蛋白为Cas9。
12.根据权利要求4所述的方法,其中所述核酸酶为非天然核酸酶杂合体。
13.根据权利要求12所述的方法,其中所述非天然核酸酶杂合体为Cas9-Fok1。
14.根据权利要求7所述的方法,其中所述核酸酶为RNase。
15.根据权利要求14所述的方法,其中所述RNase为RNase A、RNase H或RNase S。
16.根据权利要求7所述的方法,其中所述核酸酶为微球菌核酸酶。
17.根据权利要求5所述的方法,其中所述核酸酶为Cas9,所述允许二聚化的第一结构域为Coh2,并且所述第二结构域为DocS。
18.根据权利要求17所述的方法,其中所述信号控制器为远红光。
19.根据权利要求1所述的方法,其中所述变性剂选自(i)热、(ii)紫外光、(iii)微波、(iv)辐射和(iv)化学变性剂。
20.根据权利要求1所述的方法,其中所述(a)的接触包括使细胞或源自所述细胞的裂解物与(i)所述测试化合物、(ii)所述变性剂、(iii)所述核酸酶供体和/或(iv)所述核酸底物接触,其中所述细胞或所述细胞裂解物包含所述融合蛋白。
21.根据权利要求20所述的方法,其中所述融合蛋白由所述细胞表达。
22.根据权利要求20所述的方法,其中所述(a)的接触包括使所述细胞或源自所述细胞的裂解物与所述变性剂或所述核酸底物接触。
23.根据权利要求1所述的方法,其中在所述融合蛋白与所述变性剂接触之后或同时使所述融合蛋白与所述核酸酶供体和/或上所述核酸底物接触。
24.根据权利要求20所述的方法,其中所述细胞包含所述核酸酶供体,或者所述核酸酶供体由所述细胞表达。
25.根据权利要求19所述的方法,其中所述变性剂为热,并且所述(a)的接触包括将所述融合蛋白加热至至少40℃、至少50℃或至少60℃的温度。
26.根据权利要求25所述的方法,其中在不存在所述测试化合物的情况下,所述温度足以使所述融合蛋白或所述靶多肽变性或聚集。
27.根据权利要求25所述的方法,其中所述加热持续至少20秒、至少30秒、至少1分钟、至少3分钟、至少5分钟、至少10分钟或至少15分钟的时间段。
28.根据权利要求21所述的方法,其中所述加热包括使所述电池暴露于温度梯度,所述温度梯度包括以至少约5℃/分钟的速率升高温度。
29.根据权利要求19所述的方法,其中所述化学变性剂选自氧化剂、酸、碱、毒素、致癌物和化学治疗剂。
30.根据权利要求1所述的方法,其中所述测试化合物为小分子化合物。
31.根据权利要求1所述的方法,其中所述核酸底物包含核糖核苷酸和/或脱氧核糖核苷酸。
32.根据权利要求1所述的方法,其中所述核酸底物包含可检测标记。
33.根据权利要求32所述的方法,其中所述可检测标记为荧光标记。
34.根据权利要求32所述的方法,其中所述核酸底物包含一对FRET标记。
35.根据权利要求34所述的方法,其中所述核酸底物包括6-羧基荧光素(6-FAM)和6-羧基-四甲基罗丹明(6-TAMRA)。
36.根据权利要求34所述的方法,其中所述核酸底物包括(6-FAM)-X-(6-TAMRA),其中X为包含序列Y-dA-R的多核苷酸,其中Y为一个或多个嘧啶,dA为脱氧腺苷,并且R为一个或多个嘌呤。
37.根据权利要求34所述的方法,其中所述核酸底物包括(6-FAM)-dA-rU-dA-dA-(6-TAMRA),其中rU为尿苷。
38.根据权利要求6所述的方法,其中所述S标签受体肽包含8-20个氨基酸。
39.根据权利要求38所述的方法,其中所述S-标签受体肽包含RNase S的S-肽或其衍生物。
40.根据权利要求39所述的方法,其中所述RNase S为胰腺RNase。
41.根据权利要求38所述的方法,其中所述S标签受体肽包含具有与氨基酸序列KETAAAKFERQHMDSSTSAA(SEQ ID NO.:1)至少90%同一性的氨基酸序列的肽。
42.根据权利要求6所述的方法,其中所述S-标签受体肽包含含有氨基酸序列KETAAAKFERQHMDSSTSAA(SEQ ID NO.:1)的至少14个连续氨基酸的肽。
43.根据权利要求6所述的方法,其中所述S标签受体肽包含具有与选自以下的氨基酸序列至少90%同一性的氨基酸序列的肽:
KETNWAWFWDQHMDSSTSA(SEQ ID NO:2),
KETGWALFVQQHMDSSTSA(SEQ ID NO:3),
KETVMANFQMQHMDSSTSA(SEQ ID NO:4),
KETGDAVFARQHMDSSTSA(SEQ ID NO:5),
KETGWAAFVKQHMDSSTSA(SEQ ID NO:6),
KETGWATFVEQHMDSSTSA(SEQ ID NO:7),
KETKLAFFLKQHMDSSTSA(SEQ ID NO:8),
KETWWAWFFGQHMDSSTSA(SEQ ID NO:9),
KETTWAEFTWQHMDSSTSA(SEQ ID NO:10),
KETPWASFNKQHMDSSTSA(SEQ ID NO:11),
KETAMAMFVTQHMDSSTSA(SEQ ID NO:12),
KETLWAWFMWQHMDSSTSA(SEQ ID NO:13),
KETAAAKFERQHMDS(SEQ ID NO:14),
KETAAAKFERQHMNS(SEQ ID NO:15),
NRAWSEFLWQHLAPV(SEQ ID NO:16),
NRGWSEFLWQHHAPV(SEQ ID NO:17)和
NRAWSVFQWQHIAPA(SEQ ID NO:18)。
44.根据权利要求6所述的方法,其中所述S-标签受体肽共价结合到所述靶多肽的N-端。
45.根据权利要求6所述的方法,其中所述S-标签受体肽共价结合到所述靶多肽的C-端。
46.根据权利要求6所述的方法,其中所述靶多肽包含所述靶多肽和所述S标签受体肽之间的接头。
47.根据权利要求46所述的方法,其中所述接头为包含1至10个氨基酸的肽。
48.根据权利要求1所述的方法,其中所述核酸酶供体包含RNase S蛋白或其衍生物。
49.根据权利要求1所述的方法,其中根据所述在(b)中检测到的所述裂解产物的量来确定所述测试化合物与所述靶多肽相互作用。
50.根据权利要求49所述的方法,其中所述检测在(b)中的所述裂解产物的量包括检测从所述裂解产物发出的荧光信号或从所述未裂解核酸底物发出的荧光信号的存在或量。
51.根据权利要求50所述的方法,其中所述在(b)中检测的所述裂解产物的量包括高于预定阈值量的量。
52.根据权利要求51所述的方法,其中所述在(b)中检测到的所述裂解产物的量比预定阈值量高至少20%、至少30%或至少50%。
53.根据权利要求51所述的方法,其中所述预定阈值量通过(i)在不存在测试化合物的情况下进行步骤(a)和(b),或(ii)在存在不与所述靶多肽相互作用或结合的化合物的情况下进行步骤(a)和(b)来确定。
54.根据权利要求20所述的方法,其还包括使细胞与编码和/或指导所述融合蛋白表达的核酸接触。
55.根据权利要求54所述的方法,其中所述细胞为细菌并且所述方法包括使所述细菌与包含编码和/或指导所述融合蛋白表达的所述核酸的噬菌体接触。
56.根据权利要求1所述的方法,其中所述靶多肽是源自病原体或由病原体表达的蛋白质、修饰的蛋白质或其部分。
57.根据权利要求56所述的方法,其中所述病原体为病毒或细菌。
58.一种高通量测定,其包括在多个容器中进行根据权利要求1所述的方法,其中每个容器包含所述融合蛋白。
59.根据权利要求58所述的测定,其中每个容器包含不同的融合蛋白。
60.根据权利要求58所述的测定,其中每个容器包含表达不同融合蛋白的细胞。
61.根据权利要求58所述的测定,其中使一些或所有容器与不同测试化合物接触。
62.根据权利要求58所述的测定,其中所述多个容器包括至少96个容器、至少384个容器或至少1536个容器。
63.根据权利要求58所述的测定,其中所述容器为微量滴定板中的孔。
64.根据权利要求58所述的测定,其中所述每个容器中的融合蛋白与所述测试化合物、所述变性剂、所述核酸酶供体和/或所述核酸底物的接触基本上同时发生或同时发生。
65.根据权利要求58所述的测定,其中所述(b)的检测步骤包括基本上同时或同时检测每个容器中的所述核酸底物的裂解产物的量。
66.根据权利要求58所述的测定,其中所述测定包括使每个容器中的细胞与表达、编码或指导所述融合蛋白表达的核酸接触。
67.根据权利要求1所述的方法,其中所述核酸底物包含一对FRET标记,其中所述裂解产物的量包括检测从所述裂解产物发出的荧光信号的量并获得数据点,并且其中所述荧光信号允许确定所述靶多肽和所述测试化合物之间的目标饱和剂量、表观平衡解离常数(KD)、靶结合的半数最大有效浓度(EC50)。
68.根据权利要求67所述的方法,其中所述测试化合物的目标饱和剂量由耗尽所述核酸底物后的荧光峰值(Emax)确定。
69.根据权利要求67所述的方法,其中通过绘制饱和结合曲线来确定所述靶多肽和所述测试化合物之间的表观平衡解离常数(KD),其中超出所述Emax的数据点从所述曲线图中排除。
70.根据权利要求67所述的方法,其中所述靶标结合的EC50从耗尽所述核酸底物之前的早期数据点确定。
71.一种试剂盒,其包含多个容器,第一容器包含融合蛋白,第二容器包含核酸酶供体,第三容器包含核酸底物。
72.根据权利要求71所述的试剂盒,其中所述融合蛋白包含靶多肽和核酸酶受体。
73.根据权利要求72所述的试剂盒,其中所述核酸酶受体为S标签受体肽并且所述核酸酶供体为RNase S的S蛋白。
CN202180089376.2A 2020-11-17 2021-11-17 高通量药物筛选方法 Pending CN116802494A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063114927P 2020-11-17 2020-11-17
US63/114,927 2020-11-17
PCT/US2021/059743 WO2022109039A1 (en) 2020-11-17 2021-11-17 High throughput drug screening methods

Publications (1)

Publication Number Publication Date
CN116802494A true CN116802494A (zh) 2023-09-22

Family

ID=81586592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180089376.2A Pending CN116802494A (zh) 2020-11-17 2021-11-17 高通量药物筛选方法

Country Status (9)

Country Link
US (1) US20220155286A1 (zh)
EP (1) EP4248210A1 (zh)
JP (1) JP2023549484A (zh)
KR (1) KR20230110298A (zh)
CN (1) CN116802494A (zh)
AU (1) AU2021382589A1 (zh)
CA (1) CA3197529A1 (zh)
IL (1) IL302739A (zh)
WO (1) WO2022109039A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102628529B1 (ko) * 2021-07-13 2024-01-24 한국생명공학연구원 수용체형 단백질 티로신 탈인산화효소의 이량체화 억제제의 스크리닝 방법
WO2023091588A1 (en) * 2021-11-17 2023-05-25 Nerd Bio Llc Systems and methods for real-time cellular drug-target engagement

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2196496A1 (en) * 1997-01-31 1998-07-31 Stephen William Watson Michnick Protein fragment complementation assay for the detection of protein-protein interactions
US20030059814A1 (en) * 2001-07-05 2003-03-27 Whitehorn Erik A. Methods for ribonuclease complementation assays
WO2007089591A2 (en) * 2006-01-27 2007-08-09 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for high throughput screening of pharmacological chaperones

Also Published As

Publication number Publication date
US20220155286A1 (en) 2022-05-19
AU2021382589A1 (en) 2023-06-08
EP4248210A1 (en) 2023-09-27
CA3197529A1 (en) 2022-05-27
JP2023549484A (ja) 2023-11-27
WO2022109039A1 (en) 2022-05-27
IL302739A (en) 2023-07-01
KR20230110298A (ko) 2023-07-21

Similar Documents

Publication Publication Date Title
CN116802494A (zh) 高通量药物筛选方法
KR20020059370A (ko) 융합 라이브러리의 제작 및 사용을 위한 방법 및 조성물
JP2008259496A (ja) Dnaアプタマーを用いて標的タンパク質を検出する方法及びキット
US20150065382A1 (en) Method for Producing and Identifying Soluble Protein Domains
Jaimes et al. A fluorogenic peptide cleavage assay to screen for proteolytic activity: applications for coronavirus spike protein activation
EP2437055A2 (en) Method for screening for a drug candidate substance which inhibits target protein-protein interaction for developing a novel concept drug
Canale et al. Synonymous mutations at the beginning of the influenza A virus hemagglutinin gene impact experimental fitness
US20220073904A1 (en) Devices and methods for display of encoded peptides, polypeptides, and proteins on dna
US20070224615A1 (en) Methods for assaying protein-protein interactions
Yumerefendi et al. Library-based methods for identification of soluble expression constructs
WO2007127538A1 (en) Methods for assaying protein-protein interaction
US20200407467A1 (en) Protease activity profiling via programmable phage display of comprehensive proteome-scale peptide libraries
AU2012289869A1 (en) Cell free translation system for compound screening and related uses
US20200308559A1 (en) Composition for detecting protein-protein interactions comprising fragments of secreted alkaline phosphatase (SEAP) and method for detecting protein-protein interactions using the same
Hinz et al. Simplifying the detection of surface presentation levels in yeast surface display by intracellular tGFP Expression
Davidson et al. Directed evolution of proteins in vitro using compartmentalization in emulsions
US20230204594A1 (en) Systems and methods for real-time cellular drug-target engagement
US20230287490A1 (en) Systems and methods for assaying a plurality of polypeptides
US20230340582A1 (en) Compositions and methods relating to nucleic acid interaction reporters
CN114507690A (zh) 源自鲎属的重组蛋白及编码该重组蛋白的dna
Lee et al. Proximity Labelling Confirms the Involvement of Papain-Like Cysteine Proteases and Chaperones in Cyclotide Biosynthesis
Matsuura-Suzuki et al. Human-rabbit Hybrid Translation System to Explore the Function of Modified Ribosomes
EP1160332A1 (en) Methods for detecting enzymatic activity or detecting resistance to enzyme inhibitors
WO2023150742A2 (en) Methods for generating nucleic acid encoded protein libraries and uses thereof
JP2024506538A (ja) 分子接着剤スクリーニングアッセイおよびその実施方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination