CN116438307A - 针对SARS-CoV-2的适体 - Google Patents

针对SARS-CoV-2的适体 Download PDF

Info

Publication number
CN116438307A
CN116438307A CN202180051012.5A CN202180051012A CN116438307A CN 116438307 A CN116438307 A CN 116438307A CN 202180051012 A CN202180051012 A CN 202180051012A CN 116438307 A CN116438307 A CN 116438307A
Authority
CN
China
Prior art keywords
aptamer
seq
cov
sars
aptamers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180051012.5A
Other languages
English (en)
Inventor
A·托利
D·邦克
E·巴恩斯
B·巴兰塞图帕蒂
H·弗林
J·罗博特姆
L·米尔本
P·奥哈拉
J·里德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fitness Diagnostics Ltd
Original Assignee
Fitness Diagnostics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fitness Diagnostics Ltd filed Critical Fitness Diagnostics Ltd
Publication of CN116438307A publication Critical patent/CN116438307A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5306Improving reaction conditions, e.g. reduction of non-specific binding, promotion of specific binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3517Marker; Tag
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/08RNA viruses
    • G01N2333/165Coronaviridae, e.g. avian infectious bronchitis virus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2469/00Immunoassays for the detection of microorganisms
    • G01N2469/10Detection of antigens from microorganism in sample from host
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54366Apparatus specially adapted for solid-phase testing
    • G01N33/54373Apparatus specially adapted for solid-phase testing involving physiochemical end-point determination, e.g. wave-guides, FETS, gratings
    • G01N33/5438Electrodes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54366Apparatus specially adapted for solid-phase testing
    • G01N33/54386Analytical elements
    • G01N33/54387Immunochromatographic test strips
    • G01N33/54388Immunochromatographic test strips based on lateral flow

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Virology (AREA)
  • Genetics & Genomics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及针对SARS‑CoV‑2刺突蛋白的一种或多种分离的适体及其使用方法。本发明的某些实施例涉及使用本文所述的一种或多种适体检测样本中SARS‑CoV‑2的存在、不存在或含量的方法。在某些实施例中,本发明涉及一种或多种能够特异性结合SARS‑CoV‑2蛋白的适体,包括能够特异性结合S1亚基(包括受体结合域(RBD))和/或S2亚基的适体,该S1亚基和/或S2亚基以其天然构象作为三聚体形式的SARS‑CoV‑2刺突蛋白的一部分,或作为单独的单体。

Description

针对SARS-CoV-2的适体
技术领域
本发明的实施例涉及分离的一种或多种针对SARS-CoV-2刺突蛋白的适体及其使用方法。本发明的某些实施例涉及使用本文所述的一种或多种适体检测样本中SARS-CoV-2的存在、不存在或含量的方法。在某些实施例中,本发明涉及一种或多种能够特异性结合SARS-CoV-2蛋白的适体,包括能够特异性结合S1亚基(包括受体结合域(receptor bindingdomain,RBD))和/或S2亚基的适体,该S1亚基和/或S2亚基以其天然构象作为三聚体形式的SARS-CoV-2刺突蛋白的一部分,或作为单独的单体。
背景技术
严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)是于2019年12月发现的一种以前未知的冠状病毒。人们认为,SARS-CoV-2的人传人主要通过呼吸道飞沫传播,感染的是新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)的病原体。2020年3月,世界卫生组织宣布此次非典型肺炎疫情为大流行。
这种可能致命的非典型肺炎是由SARS-CoV-2在下呼吸道中复制引发的。COVID-19的病理生理学表现为侵袭性炎症反应,可导致急性炎症和肺功能障碍。因此,在某些情况下,患者的疾病严重程度会因宿主的免疫反应而加剧,促炎细胞因子的过量产生(也称为细胞因子风暴)会导致患者出现急性呼吸窘迫综合征。
COVID-19的大规模诊断测试对于切断SARS-CoV-2感染链至关重要。针对各种SARS-CoV-2抗原(包括形成病毒外壳的蛋白质),已经开发了许多SARS-CoV-2单克隆抗体。此类SARS-CoV-2抗体正在开发,例如,作为即时测试试剂盒。然而,此类测试可能依赖于一对抗体(很难分离,生产成本也很高)。此外,迄今为止分离的许多抗体存在导致假阳性结果的特异性问题;或导致假阴性结果的灵敏性问题。
本发明一些实施例的目的是开发出与基于抗体的测试相比更可靠、更准确和/或更便宜的检测试剂,至少部分缓解现有技术中识别的一些问题。
发明内容
本发明涉及一种或多种针对SARS-CoV-2蛋白(包括其天然三聚体形式的刺突蛋白)的适体的开发及其使用方法。
在某些实施例中,本发明涉及能够结合SARS-CoV-2刺突蛋白(包括其天然三聚体形式)内的S1亚基的适体。在某些实施例中,本发明涉及能够结合S1亚基内RBD的适体。
在某些实施例中,本发明涉及能够结合SARS-CoV-2刺突蛋白(包括其天然三聚体形式)内的S2亚基的适体。
在某些实施例中,本发明涉及两种或更多种适体(例如,一对、三联或四联适体),其中至少一种适体结合SARS-CoV-2刺突蛋白内的S1亚基,并且至少一种适体结合S1亚基的不同区域或结合S2亚基。此类适体特别适合用于“夹心测定(sandwich assay)”形式,例如本文进一步描述的酶联免疫吸附测定(enzyme linked immunosorbent assay,ELISA)或侧流设备。
在某些实施例中,本发明的适体结合SARS-CoV-2,并且还与其他冠状病毒(例如SARS-CoV和/或MERS-CoV)交叉反应。
在某些实施例中,本发明的适体特异性结合SARS-CoV-2,但不与其他冠状病毒(例如SARS-CoV和/或MERS-CoV)交叉反应。
本文所述适体被证明有效,并且提供了一种采用简单的信号增益测定形式测试样本中SARS-CoV-2的存在、不存在或含量的简单快速方法。具体地,本发明提供能够以意想不到的高亲和力和特异性结合SARS-CoV-2刺突蛋白(包括其天然三聚体形式)内的S1亚基(包括RBD)和/或S2亚基的适体。本文所述的适体可以检测生物流体(例如唾液)中的SARS-CoV-2病毒载量。
在某些实施例中,本发明提供一种或多种能够特异性结合SARS-CoV-2刺突蛋白的S1和/或S2亚基的适体,其中所述一种或多种适体包括:
(a)选自SEQ ID NO:4、8、9或43中任一个或多个序列的核酸序列;
(b)选自SEQ ID NO:134、140或144中任一个或多个序列的核酸序列;
(c)选自SEQ ID NO:146、150或171中任一个或多个序列的核酸序列;
(d)选自SEQ ID NO:177、179、183、188、190或191中任一个或多个序列的核酸序列;
(e)与(a)至(d)序列中的任一个或多个序列具有至少约85%、90%、95%或99%或以上同一性的核酸序列;或
(f)具有(a)至(e)序列中任一个或多个序列的至少约15、20、25、30、35、40、45、50、55、60、65、70、75个或更多个连续核苷酸的核酸序列。
有利的是,这些适体在SARS-CoV-2病毒的诊断测定中非常有效。正如本文所述,与其他适体相比,这些适体表现出意想不到的广泛的有利性质,并且还显示出在类ELISA(ELISA-like)测定、侧流设备和/或电化学传感器形式中特别有效。例如,这些适体能够以意想不到的高亲和力结合SARS-CoV-2刺突蛋白(包括其天然三聚体形式)的S1和/或S2亚基。这些适体能够结合唾液样本中存在的SARS-CoV-2刺突蛋白。这些适体不与SARS-CoV和/或MERS-CoV的同源刺突蛋白发生交叉反应。
在某些实施例中,本发明的一种或多种适体可包括:
(a)选自SEQ ID NO 4、8或9中任一个序列的核酸序列;或
(b)与(a)中的任一个或多个序列具有至少约85%、90%、95%或99%或以上同一性的核酸序列。
此类适体能够特异性结合SARS-CoV-2刺突蛋白的S1亚基。这些适体表现出意想不到的广泛的有利性质(包括结合唾液样本中存在的SARS-Cov-2刺突蛋白及其天然三聚体形式),并且还显示出在类ELISA形式或侧流测定中特别有效。
在某些实施例中,本发明的一种或多种适体可包括:
(a)选自SEQ ID NO 177、183或191中任一个序列的核酸序列;或
(b)与(a)中的任一个或多个序列具有至少约85%、90%、95%或99%或以上同一性的核酸序列。
此类适体能够特异性结合SARS-CoV-2刺突蛋白的S2亚基。
在某些实施例中,本发明的一种或多种适体可包括:
(a)选自SEQ ID NO 179、188或190中任一个序列的核酸序列;或
(b)与(a)中的任一个或多个序列具有至少约85%、90%、95%或99%或以上同一性的核酸序列。
此类适体意想不到地能够结合天然三聚体形式的SARS-CoV-2刺突蛋白的S2亚基。
在某些实施例中,本发明提供如本文所述的任何一种或多种适体的一个或多个最小有效片段。
在优选的实施例中,本发明适体的一个或多个最小有效片段包括选自本文所述SEQ ID NO:134、140或144或其变体的核酸序列。它们表现出意想不到的广泛的有利性质,并且还显示出在类ELISA形式中特别有效。正如本文所述,此类适体能够以高亲和力结合S1亚基,而不结合S2亚基(或仅以低亲和力结合)。
在优选的实施例中,本发明适体的一个或多个最小有效片段包括选自本文所述SEQ ID NO:146、150或171或其变体中任一个序列的核酸序列。它们能够以高亲和力结合S2亚基,而不结合S1亚基(或仅以低亲和力结合)。有利的是,此类适体可与本文所述的S1结合适体(或其变体)组合用于夹心测定平台(例如,类ELISA测定)。
在某些实施例中,本发明提供能够结合本文所述的SARS-CoV-2刺突蛋白(包括其三聚体形式)的两个或更多个(例如,二个、三个、四个、五个或更多个)不同区域的两种或更多种适体(例如,两种、三种、四种、五种或更多种适体)。例如,本发明提供两种或更多种适体,其包括本文所述的任何第一适体和本文所述的任何第二适体,该第一适体能够结合SARS-CoV-2刺突蛋白的S1和/或RBD(例如S1亚基和/或其RBD)的第一区域,该第二适体结合SARS-CoV-2刺突蛋白(例如,S1亚基和/或其RBD)的不同或非竞争区域。换句话说,两种或更多种适体不竞争结合SARS-CoV-2刺突蛋白的相同表位。
在某些实施例中,本发明提供两种或更多种适体,其中第一适体能够结合SARS-CoV-2刺突蛋白的S1亚基,第二适体能够结合SARS-CoV-2刺突蛋白S1亚基的不同(非重叠)区域或结合SARS-CoV-2刺突蛋白的S2亚基。
在某些实施例中,本发明提供至少一对适体,其包括:
(a)第一适体,其包括选自SEQ ID NO:4、8、9、43、134、144或140中任一个序列的核酸序列,或与SEQ ID NO:4、8、9、43、134、144或140中任一个序列具有至少约85%、90%、95%或99%或以上同一性的序列;和
(b)第二适体,其包括选自SEQ ID NO:146、150、171、177、179、183、188、190或191中任一个序列的核酸序列或与SEQ ID NO:146、150、171、177、179、183、188、190或191中任一个序列具有至少约85%、90%、95%或99%或以上同一性的序列。
在某些实施例中,所述的至少一对适体包括:
(a)第一和第二适体,其包括分别选自SEQ ID NO:4和146、4和150、4和171、4和177、4和179、4和183、4和188、4和190或4和191的核酸序列;
(b)第一和第二适体,其包括分别选自SEQ ID NO:8和146、8和150、8和171、8和177、8和179、8和183、8和188、8和190或8和191的核酸序列;
(c)第一和第二适体,其包括分别选自SEQ ID NO:9和146、9和150、9和171、9和177、9和179、9和183、9和188、9和190或9和191的核酸序列;
(d)第一和第二适体,其包括分别选自SEQ ID NO:43和146、43和150、43和171、43和177、43和179、43和183、43和188、43和190或43和191的核酸序列;
(e)第一和第二适体,其包括分别选自SEQ ID NO:134和146、134和150、134和171、134和177、134和179、134和183、134和188、134和190或134和191的核酸序列;
(f)第一和第二适体,其包括分别选自SEQ ID NO:144和146、144和150、144和171、144和177、144和179、144和183、144和188、144和190或144和191的核酸序列;
(g)第一和第二适体,其包括分别选自SEQ ID NO:140和146、140和150、140和171、140和177、140和179、140和183、140和188、140和190或140和191的核酸序列;
(h)第一和/或第二适体,其包括与(a)至(g)中任一种适体具有至少约85%、90%、95%或99%或以上同一性的核酸序列;或
(i)第一和/或第二适体,其包括具有(a)至(g)中任一种适体的至少约15、20、25、30、35、40、45、50、55、60、65、70、75个或更多个连续核苷酸的核酸序列。
在优选的实施例中,所述的一种或多种适体包括:
(a)选自SEQ ID NO:140和/或SEQ ID NO:190的核酸序列;或
(b)一种或多种适体,其包括与(a)中任一种适体具有至少约85%、90%、95%或99%或以上同一性的核酸序列;或
(c)一种或多种适体,其包括具有(a)至(b)中任一种适体的至少约15、20、25、30或31个连续核苷酸的核酸序列。
在某些实施例中,分离所述一种或多种适体。
在某些实施例中,所述一种或多种适体是DNA适体。
在某些实施例中,所述一种或多种适体包括可检测标记。
在某些实施例中,本发明提供一种或多种适体,其与本文所述的任何适体(或其变体)竞争结合SARS-CoV-2刺突蛋白(包括其天然形式)。
在某些实施例中,本发明提供一种复合物,其包括本文所述的任何一种或多种适体和一种或多种可检测分子。通常,所述复合物还包括SARS-Cov-2病毒或其至少一部分。例如,所述复合物还可包括该刺突蛋白的S1或S2亚基、SARS-Cov-2刺突蛋白单体、SARS-Cov-2刺突蛋白三聚体等。
在某些实施例中,本发明提供包括本文所述的任何一种或多种适体和一种或多种可检测分子的生物传感器、测定板或测试条。
在某些实施例中,本发明提供包括本文所述的一种或多种适体的侧流设备。
在某些实施例中,本发明提供包括本文所述的一种或多种适体的功能化电极或生物传感器表面。
在优选的实施例中,所述功能化电极或生物传感器包括:
(a)包括选自SEQ ID NO:10、20、24或44的核酸序列的适体;或
(b)与SEQ ID NO:10、20、24或44具有至少约85%、90%、95%或以上序列同一性的序列。
如本文进一步所述,由于其结构性质,此类适体在功能化电极或生物传感器中特别有效(例如,其中适体固定在电极表面上)。
在某些实施例中,本发明提供用于检测样本中SARS-CoV-2的存在、不存在或含量的装置,所述装置包括本文所述的任何一种或多种适体。
在某些实施例中,本发明提供用于在ELISA或类ELISA测定、侧流设备或功能化电极或传感器表面中检测样本中SARS-CoV-2的存在、不存在或含量的试剂。
在某些实施例中,本发明提供本文所述的任何一种或多种适体、本文所述的任何复合物、本文所述的任何生物传感器或测试条、本文所述的任何装置、本文所述的任何侧流设备或本文所述的任何功能化电极用于检测、富集、分开和/或分离SARS-CoV-2的用途。
在某些实施例中,本发明提供检测样本中SARS-CoV-2的存在、不存在或含量的方法,所述方法包括:
(i)使样本与本文所述的任何一种或多种适体相互作用;和
(ii)检测SARS-CoV-2的存在、不存在或含量。
在某些实施例中,本发明提供用于检测、定量和/或富集SARS-CoV-2的试剂盒,所述试剂盒包括本文所述的任何一种或多种适体。
在某些实施例中,本发明提供能够抑制SARS-CoV-2刺突蛋白内S1亚基的RBD与人血管紧张素转换酶2(human receptor angiotensin-converting enzyme 2,ACE2)受体之间相互作用的一种或多种适体。
在某些实施例中,能够抑制S1亚基的RBD与ACE2受体之间相互作用的一种或多种适体是一种或多种治疗性适体。
在某些实施例中,本发明提供本文所述的针对SARS-CoV-2刺突蛋白的S1亚基的任何一种或多种适体用作药物的用途。
在某些实施例中,本发明提供本文所述的针对SARS-CoV-2刺突蛋白的S1亚基的任何一种或多种适体用于治疗和/或预防涉及SARS-CoV-2的疾病或病症的用途。
在某些实施例中,本发明提供包括本文所述的针对SARS-CoV-2刺突蛋白的S1亚基的任何一种或多种适体的药物组合物。
在某些实施例中,本发明提供包括本文所述的针对SARS-CoV-2刺突蛋白的S1亚基的任何一种或多种适体的疫苗。
在某些实施例中,本发明提供包括本文所述的针对SARS-CoV-2刺突蛋白的S1亚基的任何一种或多种适体的适体-药物偶联物。
附图说明
下面将参考附图更详细地描述本发明的某些实施例,其中:
图1示出了用于产生针对SARS-CoV-2刺突蛋白S1亚基的适体的筛选严格性图(Selection Stringency Map)。该表包括所用适体文库的数量、所用靶标蛋白的数量、逆向筛选靶标的数量、孵育时间、洗涤次数等的详细信息。
图2示出了分离的针对来自SARS-CoV-2(COVID-19)刺突蛋白S1亚基的适体群C1S结合来自SARS、SARS-CoV-2(COVID-19)和MERS的相关S1亚基的生物膜层干涉测量数据。
图3示出的生物膜层干涉(Biolayer Interferometry,BLI)数据表明,固定在传感器探针上的单个适体克隆与来自SARS-CoV-2(COVID-19)刺突蛋白的S1亚基之间存在相互作用;但与来自SARS和MERS的相关S1亚基并无明显相互作用。该代表性数据获得自示例性适体克隆S1_A8(上)(SEQ ID NO:9)、S1_A3-A(中)(SEQ ID NO:4)和S1_A6(下)(SEQ ID NO:8)。
图4示出的生物膜层干涉数据表明,固定在传感器探针上的单个适体克隆与来自SARS-CoV-2(COVID-19)刺突蛋白的S1亚基之间存在相互作用;但与来自MERS而不是来自SARS的相关S1亚基仅存在比较弱的交叉反应。该代表性数据获得自示例性适体克隆S1_A3-B(上)(SEQ ID NO:5)、S1_C1-A(中)(SEQ ID NO:19)和S1_C8(下)(SEQ ID NO:25)。
图5示出的生物膜层干涉数据表明了固定在传感器探针上的单个适体与来自SARS-CoV-2(COVID-19)、MERS和SARS刺突蛋白的S1亚基之间的相互作用。该代表性数据获得自示例性适体克隆S1_D11-B(SEQ ID NO:36)。
图6示出的生物膜层干涉测定数据表明了来自SARS-CoV-2(COVID-19)刺突蛋白的S1亚基与采用适体克隆S1_A3-A(SEQ ID NO:4)和S1_A6(SEQ ID NO:8)固定的传感器探针的浓度依赖性结合;以及它们重叠的动力学拟合(虚线)。计算的结合参数在每个图的表中示出。
图7的生物膜层干涉测定数据表明了来自SARS-CoV-2(COVID-19)刺突蛋白的S1亚基与采用适体克隆S1_A8(SEQ ID NO:9)和S1_F2(SEQ ID NO:43)固定的传感器探针的浓度依赖性结合;以及它们重叠的动力学拟合(虚线)。计算的结合参数在每个图的表中示出。
图8示出了最小适体片段鉴定(Minimal Aptamer Fragment Identification,MAFI)生物膜层干涉测定数据,比较了一组适体S1_A8(SEQ ID NO:9)的固定片段和来自SARS-CoV-2(COVID-19)刺突蛋白的S1亚基之间的相互作用。保留靶标结合能力的片段(在0-120秒可见)用于鉴定最小功能片段。预测的二级结构给出了完整适体和鉴定的最小结合片段——“Optimer(优化片段)”S1_A8_F21(SEQ ID NO:140)。
图9示出了加载到BLI传感器探针上的示例性单个适体克隆(上)及其各自的Optimer(下)的“参考校正”生物膜层干涉测定数据;与缓冲唾液样本(10%和50%(v/v)唾液;分别用黑色和白色痕迹示出)相互作用,该唾液样本掺入了来自SARS-CoV-2(COVID-19)棘突蛋白的S1亚基,掺入的最终浓度为0.5μM。分别提供了适体S1_A3(SEQ ID NO:4)、S1_A6(SEQ ID NO:8)和S1_A8(SEQ ID NO:9)以及它们各自的Optimer S1_A3_F18(SEQ ID NO:134)、S1_A6_F14(SEQ ID NO:144)和S1_A8_F21(SEQ ID NO:140)的数据。
图10示出的生物膜层干涉测定数据表明了来自SARS-CoV-2(COVID-19)的刺突蛋白三聚体与采用Optimer S1_A3_F18(SEQ ID NO:134)、S1_A6_F14(SEQ ID NO:144)和S1_A8_F21(SEQ ID NO:140)固定的传感器探针的浓度依赖性结合;以及它们重叠的动力学拟合。计算的结合参数在包含的表中示出。
图11示出了间接的酶联寡聚核苷酸测定(Enzyme-linked Oligonucleotideassay,ELONA)数据,表明了单个适体克隆S1_A3(SEQ ID NO:4)、S1_A6(SEQ ID NO:8)、S1_A8(SEQ ID NO:9)和Optimer S1_A3_F18(SEQ ID NO:134)特异性结合来自SARS-CoV-2(COVID-19)棘突蛋白的S1亚基(左柱)。未看到结合SAR-CoV(中柱)或MERS(右柱)的相关S1亚基。
图12示出了用于产生针对来自SARS-CoV-2(COVID-19)的刺突蛋白S2亚基的适体的筛选严格性图。与图1类似,该表包括所用适体文库的数量、所用靶标蛋白的数量、逆向筛选靶标的数量、孵育时间、洗涤次数等的详细信息。
图13示出的生物膜层干涉测定数据表明了来自SARS-CoV-2(COVID-19)的刺突蛋白三聚体与采用Optimer S2_A2_F12(SEQ ID NO:179)、S2_B1_F12(SEQ ID NO:188)、S2_G1_F21(SEQ ID NO:190)固定的传感器探针的浓度依赖性结合;以及它们重叠的动力学拟合。计算的结合参数在包含的表中示出。
图14示出的生物膜层干涉测定数据表明了来自SARS-CoV-2(COVID-19)WT(SARS-CoV-2WT)和受关注的SARS-CoV-2D14G、SARS-CoV-2B.1.1.7、SARS-CoV-2B.1.351和SARS-CoV-2P.1变体的刺突蛋白的S1亚基与采用Optimer S1_A8_F21(SEQ ID NO:140)固定的传感器探针的浓度依赖性结合;以及它们各自的重叠的动力学拟合。计算的结合参数在包含的表中示出。
图15示出的生物膜层干涉测定数据表明了来自SARS-CoV-2WT或受关注的SARS-CoV-2B.1.1.7和SARS-CoV-2B.1.351变体的辐照病毒材料与采用Optimer S1_A8_F21(SEQID NO:140)或S2_G1_F21(SEQ ID NO:190)固定的传感器探针的浓度依赖性结合;(分别是上图和下图)。
图16示出的夹心ELONA)数据表明了当S1结合用作捕获试剂的Optimer S1_A3_F18(SEQ ID NO:134),并且SARS-CoV-2S2结合用作检测试剂的适体克隆S2_A2(SEQ ID NO:146)(中偏左柱)、S2_B1(SEQ ID NO:150)(中偏右柱)、S2_G1(SEQ ID NO:171)(右柱)或亲本适体池S2_8R(左柱)时,SARS-CoV-2三聚体的浓度依赖性检测结果。
图17示出的夹心ELONA数据表明了当S1适体克隆S1_A3(SEQ ID NO:4);或OptimerS1_A3_F18(SEQ ID NO:134)用作捕获试剂,并且S2结合Optimer S2_A2_F17(SEQ ID NO:177)(右柱)、S2_B1_F18(SEQ ID NO:183)(中柱)或S2_G1_F22(SEQ ID NO:191)(左柱)用作检测试剂时,SARS-CoV-2三聚体的浓度依赖性检测结果。
图18示出了使用固定在“检测线”中的S1结合Optimer“S1_A8_F21”(SEQ ID NO:140)和固定在金纳米颗粒上的S2结合Optimer“S2_G1_F21”(SEQ ID NO:190),用于检测侧流设备中辐照的SARS-CoV-2病毒材料的浓度依赖性检测结果。在模拟鼻拭子样本中加入1x105-3x103 PFU/ml的辐照的SARS-CoV-2。在仅有缓冲液的“阴性对照”(最右侧)中未发现“检测线”,这表明检测线的形成对病毒材料具有特异性。
具体实施方式
下面对本发明某些实施例的进一步特征进行说明。除非另有说明,否则本发明实施例的实施将采用分子生物学、微生物学、重组DNA技术和免疫学的常规技术,这些技术是本领域技术人员熟悉的。
大多数通用分子生物学、微生物学、重组DNA技术和免疫学技术都可以在《实验室手册》(Sambrook et al,Molecular Cloning,ALaboratory Manual(2001)Cold Harbor-Laboratory Press,Cold Spring Harbor,N.Y.)或Ausubel et al.,Current protocolsin molecular biology(1990)John Wiley and Sons,N.Y.中找到。除非另有限定,本文使用的所有技术和科学术语的意义与本公开所属领域技术人员通常理解的相同。例如,《生物医学与分子生物学简明词典》(Concise Dictionary of Biomedicine and MolecularBiologyJuo,Pei-Show,2nd ed.,2002,CRC Press);《细胞与分子生物学词典》(TheDictionary of Cell and Molecular Biology,3rd ed.,Academic Press;以及牛津大学出版社为本领域技术人员提供了本公开中使用的许多术语的通用词典。
单位、前缀和符号以国际单位制(SI)公认的形式表示。数字范围包括定义范围的数字。除非另有说明,氨基酸序列以氨基到羧基的方向从左到右书写,核酸序列以5'到3'的方向从左到右书写。
如本文所用,术语“抗原”是指能够在受试生物体(即宿主)(例如人或动物)中诱导免疫应答的分子,通常是毒素或其他外来物质。有时,抗原由病原体产生,例如细菌或病毒;在其他情况下,抗原是由宿主生物体自身产生,抗原可能引发或导致宿主生物体出现疾病或病症。
此外,如本文所用,术语“抗原”是指适体的分子靶标,其在组织、细胞或病毒中表达和/或在体液(例如尿液、唾液、鼻拭子、痰、泪液、血液、精液和脑脊液)中分泌。
如本文所用,术语“病毒”是指小的传染因子(infectious agent)。通常,病毒是无生命的复杂分子,只能在宿主生物体的活细胞内复制。病毒感染各种生物体,例如动物、植物、人类、细菌等,导致各种疾病和病症。
如本文所用,术语“冠状病毒(coronavirus)”是指冠状病毒(Coronaviridae)科的病毒。通常,这些大型单链RNA病毒包括一个布满棒状刺突蛋白的脂质包膜。这些病毒可能导致哺乳动物和鸟类疾病。具体而言,这些病毒可能导致人类轻微至致命的呼吸道感染。
在下文中,将通过具体实施例的非限制性实例对本发明进行更详细的说明。在示例性实验中,采用无污染的标准试剂和缓冲液。
SARS-CoV-2刺突蛋白
在某些实施例中,本发明提供能够结合SARS-CoV-2刺突蛋白(包括其天然三聚体形式)的一种或多种适体。
人们认为,SARS-CoV-2病毒进入人体细胞是由跨膜刺突蛋白介导的,该蛋白位于病毒体上并从病毒表面突出。刺突蛋白是同源三聚体糖蛋白(例如本文所述的“三聚体”),每个单体约180kDa,并且包括两个功能亚基(S1和S2),它们分别负责宿主细胞受体识别(S1)和病毒——细胞的膜融合(S2)。刺突S1亚基包括受体结合域(RBD),RBD可识别并结合人血管紧张素转换酶2(ACE2)受体。RBD与ACE2的肽酶结构域(peptidase domain,PD)的直接结合可以实现刺突蛋白的高亲和力结合。
尽管刺突蛋白的RBD可能是冠状病毒基因组中最可能变化的部分,但ACE2结合所需的氨基酸残基在SARS-CoV和SARS-CoV-2之间是保守的。
在某些实施例中,本发明的适体能够结合SARS-CoV-2,也可能结合其他冠状病毒(例如SARS-CoV和/或MERS-CoV)。换句话说,本发明的适体可能与同源冠状病毒刺突蛋白(例如SARS-CoV和MERS-CoV的刺突蛋白)交叉反应。
在某些实施例中,本发明的适体能够特异性结合SARS-CoV-2,但不能特异性结合其他冠状病毒(例如SARS-CoV和/或MERS-CoV)。换句话说,本发明的适体对SARS-CoV-2刺突蛋白具有高度选择性,并且可能不会与同源冠状病毒的刺突蛋白(例如SARS-CoV和MERS-CoV的刺突蛋白)交叉反应。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117或其变体所示的全长SARS-CoV-2刺突蛋白的一种或多种适体。在某些实施例中,本发明的适体特异性结合与SEQ ID NO:117序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少9约7%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明提供能够特异性结合全长SARS-CoV-2刺突蛋白(即如SEQID NO:117或其变体所示)的一种或多种适体,该SARS-CoV-2刺突蛋白以其天然构象作为三聚体(即同源三聚体糖蛋白)的一部分。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸1至1213的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸1214至1273的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸686至1213的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:119和/或其变体所示的SARS-CoV-2刺突蛋白的S2亚基的一种或多种适体。在某些实施例中,本发明的适体特异性结合与SEQ ID NO:119序列具有至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸1至685的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸16至685的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸300至600的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117(或其变体)的氨基酸319至541的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:119(或其变体)的氨基酸1至528的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:119的氨基酸1至528(例如SARS-CoV-2刺突蛋白S2亚基氨基酸序列的Ser686至Pro1213)(或其变体)的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:117的变体的一种或多种适体,所述SEQ ID NO:117的变体包括一个或多个以下点突变:
(a)435位处丙氨酸突变为丝氨酸(A435S);
(b)342位处苯丙氨酸突变为亮氨酸(F342L);
(c)458位处赖氨酸突变为精氨酸(K458R);
(d)354位处天门冬酰胺突变为天冬氨酸(N354D);
(e)367位处缬氨酸突变为苯丙氨酸(V367F);
(f)483位处缬氨酸突变为丙氨酸(V483A);
(g)614位处天冬氨酸突变为甘氨酸(D614G);和/或
(h)484位处谷氨酸突变为赖氨酸(E484K)。
在某些实施例中,本发明提供能够结合一种或多种新出现的SARS-CoV-2变体的一种或多种适体。在某些实施例中,所述适体能够结合与SARS-CoV-2的原始谱系相比更能逃避免疫系统的和/或对宿主细胞受体具有不同结合亲和力或特异性的一种或多种SARS-CoV-2变体。
在优选的实施例中,本发明的适体能够结合B.1.1.7变体、B.1.351变体、P.1变体和/或D614G变体。
在某些实施例中,本发明的适体能够结合其他新出现的主要变体。例如,本发明的适体还可以结合B.1.617.2(德尔塔变体)或可能出现的任何其他变体。
在某些实施例中,本发明提供能够结合SEQ ID NO:118的一个或多个等效的点突变(例如,对应于SEQ ID NO:117的Val16-Arg685)的一种或多种适体。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:118或其变体所示的SARS-CoV-2刺突蛋白的S1亚基的一种或多种适体。在某些实施例中,本发明的适体特异性结合与SEQ ID NO:118序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明提供一种或多种适体,其能够特异性结合SARS-CoV-2刺突蛋白S1亚基的一个或多个氨基酸,所述氨基酸位于SARS-CoV-2刺突蛋白S1亚基的RBD之外。例如,在某些实施例中,所述适体能够特异性结合SEQ ID NO:117所示全长刺突蛋白的氨基酸1至318或542至685中的一个或多个氨基酸。在某些实施例中,所述适体能够特异性结合SEQ ID NO:118所示S1亚基的氨基酸1至303或542至685中的一个或多个氨基酸。
在某些实施例中,本发明提供一种或多种能够特异性结合以下的适体:
(a)SEQ ID NO:117或其变体所示的全长SARS-CoV-2刺突蛋白;和/或
(b)SEQ ID NO:118或其变体所示的SARS-CoV-2刺突蛋白的S1亚基;
其中所述适体不能特异性结合SEQ ID NO:120或其变体所示的SARS-CoV-2刺突蛋白S1亚基的RBD。
在某些实施例中,本发明的适体不能特异性结合与SEQ ID NO:120序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明提供一种或多种适体,其能够特异性结合SARS-CoV-2刺突蛋白S1亚基的一个或多个氨基酸,所述氨基酸位于SARS-CoV-2刺突蛋白S1亚基的RBD内。例如,在某些实施例中,所述适体能够特异性结合SEQ ID NO:117所示全长刺突蛋白的氨基酸319至541中的一个或多个氨基酸。在某些实施例中,所述适体能够特异性结合SEQ IDNO:118所示S1亚基的氨基酸304至526中的一个或多个氨基酸。
在某些实施例中,本发明提供一种或多种能够与以下特异性结合的适体:
(a)SEQ ID NO:117或其变体所示的全长SARS-CoV-2刺突蛋白;和/或
(b)SEQ ID NO:118或其变体所示的SARS-CoV-2刺突蛋白的S1亚基;
其中所述适体能够特异性结合SEQ ID NO:120或其变体所示的SARS-CoV-2刺突蛋白S1亚基的RBD。
在某些实施例中,本发明提供能够特异性结合SEQ ID NO:120或其变体所示的SARS-CoV-2刺突蛋白S1亚基的受体结合域(RBD)的一种或多种适体。在某些实施例中,本发明的适体特异性结合与SEQ ID NO:120序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体能够特异性结合SARS-CoV-2刺突蛋白的S1亚基,包括S1亚基的RBD。
“特异性”结合SARS-CoV-2刺突蛋白(例如SARS-CoV-2刺突蛋白的S1亚基和/或其RBD)的适体是优先或以高亲和力结合SARS-CoV-2刺突蛋白(或其亚基和/或RBD)但不结合(或以较低亲和力结合)其他冠状病毒的同源刺突蛋白(或亚基和/或RBD)的适体。
在某些实施例中,本发明的适体优先或以高亲和力结合SARS-CoV-2刺突蛋白S1(和/或其RBD),而不结合(或仅以低亲和力结合)其他冠状病毒的同源刺突蛋白。
在某些实施例中,本发明的适体可能不结合(或仅以低亲和力结合)SARS冠状病毒(2003年鉴定的SARS-CoV)和/或中东呼吸综合征冠状病毒(MERS-CoV)。
在某些实施例中,与结合其他冠状病毒(例如SARS-CoV和/或MERS-CoV)的等效蛋白相比,优先或以高亲和力结合SARS-CoV-2刺突蛋白的适体可以以至少约2倍、3倍、4倍、5倍、10倍、20倍、50倍、100倍或1000倍的更高的亲和力结合。
在某些实施例中,本文所述的“强”结合剂是基于BLI测定的信号响应,靶标相互作用大于1nm的适体。在某些实施例中,本文所述的“中”结合剂是基于BLI测定的信号响应,靶标相互作用为0.5nm至1nm的适体。在某些实施例中,本文所述的“低”结合剂是基于BLI测定的信号响应,靶标相互作用小于0.5nm(例如小于0.3nm)的适体。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:121或其变体所示的全长SARS-CoV刺突蛋白。在某些实施例中,本发明的适体可能不会特异性结合(或仅以低亲和力结合)与SEQ ID NO:121序列具有至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:122或其变体所示的SARS-CoV刺突蛋白的S1亚基。在某些实施例中,本发明的适体可能不会特异性结合(或仅以低亲和力结合)与SEQ ID NO:122序列具有至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:123或其变体所示的SARS-CoV刺突蛋白的S2亚基。在某些实施例中,本发明的适体可能不会特异性结合(或仅以低亲和力结合)与SEQ ID NO:123序列具有至少约90%、至少约91%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:124或其变体所示的SARS-CoV刺突蛋白S1亚基的RBD。在某些实施例中,本发明的适体可能不会特异性结合(或仅以低亲和力结合)与SEQ ID NO:124序列具有至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:125或其变体所示的全长MERS-CoV刺突蛋白。在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)与SEQ ID NO:125序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:126或其变体所示的MERS-CoV刺突蛋白的S1亚基。在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)与SEQ ID NO:126序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:127或其变体所示的MERS-CoV刺突蛋白的S2亚基。在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)与SEQ ID NO:127序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)SEQ ID NO:128或其变体所示的MERS-CoV刺突蛋白S1亚基的RBD。在某些实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)与SEQ ID NO:128序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体以高亲和力结合SARS-CoV-2刺突蛋白(包括S1亚基和/或其RBD),并且还以高亲和力结合其他冠状病毒的同源刺突蛋白。
在某些实施例中,本发明的适体以高亲和力结合SARS-CoV-2刺突蛋白(包括S1亚基和/或其RBD),并且还以高亲和力结合SARS冠状病毒(2003年鉴定的SARS-CoV)和/或中东呼吸综合征冠状病毒(MERS-CoV)的同源刺突蛋白(包括S1亚基和/或者其RBD)。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:121或其变体所示的全长SARS-CoV刺突蛋白。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:121序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:122或其变体所示的SARS-CoV刺突蛋白的S1亚基。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:122序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:123或其变体所示的SARS-CoV刺突蛋白的S2亚基。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:123序列具有至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:124或其变体所示的SARS-CoV刺突蛋白S1亚基的RBD。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:124序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少9约9%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:125或其变体所示的全长MERS-CoV刺突蛋白。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:125序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:126或其变体所示的MERS-CoV刺突蛋白的S1亚基。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:126序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:127或其变体所示的MERS-CoV刺突蛋白的S2亚基。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:127序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
在某些实施例中,本发明的适体可以结合(或以高亲和力结合)SEQ ID NO:128或其变体所示的MERS-CoV刺突蛋白S1亚基的RBD。在某些实施例中,本发明的适体可以结合(或以高亲和力结合)与SEQ ID NO:128序列具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或以上序列同一性的蛋白。
如本文所用,术语“高亲和力”理解为适体结合蛋白的结合解离平衡常数(KD)例如小于约100nM、小于约90nM、小于约80nM、小于约70nM、小于约60nM、小于约50nM、小于约40nM、小于约30nM、小于约20nM、小于约10nM、小于约5nM、小于约1nM、小于约0.9nM、小于约0.8nM、小于约0.7nM、小于约0.6nM、小于约0.5nM,小于约0.4nM、小于约0.3nM、小于约0.2nM、小于约0.1nM、小于约90pM、小于约80pM、小于约70pM、小于约60pM、小于约50pM、小于约40pM、小于约30pM、小于约20pM、小于约10pM、小于约5pM、小于约4pM、小于约3pM、小于约2pM、小于约1pM或更小。
在某些实施例中,本发明的适体能够以小于约100nM或更小的KD特异性结合SARS-CoV-2刺突蛋白(包括S1亚基和/或其RBD和/或S2亚基)。例如,本发明的适体针对天然三聚体形式的SARS-CoV-2刺突蛋白的KD优选小于约90nM、80nM、70nM、60nM、50nM、40nM、30nM、20nM、10nM或更小。在某些实施例中,本发明的适体针对天然三聚体形式的SARS-CoV-2刺突蛋白的KD是约20-40nM。
适体的结合亲和力可采用本领域技术人员已知的任何方法测定,包括例如表面等离子体共振(SPR)、生物膜层干涉(Biolayer Interferometry,BLI)、ELISA、荧光测定(例如荧光各向异性或荧光偏振)、微量热泳动等。
如本文所用,术语“低亲和力”理解为适体结合蛋白的结合解离平衡常数(KD)例如大于约1μM、大于约2μM、大于约3μM、大于约4μM、大于约5μM、大于约6μM、大于约7μM、大于约8μM、大于约9μM、大于约10μM或没有可检测的响应。
在某些实施例中,本发明的适体具有快速的结合速率(例如,约0-120秒)和缓慢的解离速率(例如约120-240秒)。测量结合速率常数(Ka)和解离速率常数(Kd)的方法在本领域中进行了很好的描述。
在某些实施例中,本发明的适体能够结合(例如,以高亲和力结合)任何类型细胞中表达的SARS-CoV-2蛋白(例如,S1亚基(包括其RBD)和/或S2亚基)。合适的细胞可以包括原核细胞(例如细菌细胞(例如大肠杆菌等))或真核细胞(例如昆虫(例如杆状病毒昆虫细胞等))。
在某些实施例中,本发明的适体能够结合(例如,以高亲和力结合)哺乳动物细胞(例如CHO细胞、HEK293细胞等)中表达的SARS-CoV-2蛋白(例如,S1亚基(包括其RBD)和/或S2亚基)。通常,本发明的适体能够以高亲和力结合COVID-19病毒感染期间哺乳动物(例如人类)宿主细胞中产生的SARS-CoV-2刺突蛋白。
有利的是,本发明的适体能够结合(例如,以高亲和力结合)与其宿主(例如人类)细胞环境中产生的天然SARS-CoV-2刺突蛋白相比具有真实的蛋白折叠、糖基化和/或翻译后修饰的SARS-CoV-2刺突蛋白。因此,与针对非哺乳动物细胞系(例如本文进一步描述的原核或昆虫细胞表达系统)中表达的靶标SARS-CoV-2刺突蛋白而产生的任何其他类型的适体相比,本发明的适体(例如针对哺乳动物细胞系中表达的靶标SARS-CoV-2刺突蛋白而产生的适体)可显示出对于天然靶标蛋白结合的改进。
SARS-CoV-2刺突蛋白可经历几种翻译后修饰(post-translationalmodification,PTM),包括N-连接的糖基化和棕榈酰化。合适的是,本发明的适体能够结合(例如,以高亲和力结合)翻译后修饰的(例如,特异性N-糖基化的)SARS-CoV-2刺突蛋白。在此类实施例中,本发明的适体可能不会结合(或仅以低亲和力结合)非翻译后修饰的SARS-CoV-2刺突蛋白(例如,使用原核或昆虫表达系统产生的刺突蛋白)。
适体
本文所述的适体是小的人工配体,包括DNA、RNA或其修饰物,能够以高亲和力和特异性,特异性结合SARS-CoV-2刺突蛋白。通常,本发明的适体能够特异性结合SARS-CoV-2刺突蛋白S1和/或该S1亚基的RBD和/或S2亚基。
如本文所用,“适体”、“核酸分子”或“寡核苷酸”可互换使用,指的是对靶标分子(即SARS-CoV-2刺突蛋白,特别是S1和/或其RBD和/或S2)具有所需作用的非天然核酸分子。
本发明的适体可以是DNA适体。例如,所述适体可以由单链DNA(ssDNA)形成。或者,本发明的适体可以是RNA适体。例如,所述适体可以由单链RNA(ssRNA)形成。本发明的适体可包括本文所述的修饰的核酸。
在优选的实施例中,本发明的适体是DNA适体(例如ssDNA适体)。
在某些实施例中,本发明的适体采用本领域已知的体外筛选原理制备,包括靶标结合的迭代循环、靶标结合序列的划分和优先扩增。
在某些实施例中,本发明提供单个适体。在某些实施例中,本发明提供一种以上的适体,例如两种、三种、四种、五种或更多种适体。在某些实施例中,本发明提供能够结合本文所述的SARS-CoV-2刺突蛋白的两个或更多个不同区域的至少两种或更多种适体(例如,适体对、三联适体或更多联适体)。换句话说,两种或更多种适体不竞争结合SARS-CoV-2刺突蛋白的相同表位。
在某些实施例中,本发明提供能够结合本文所述SARS-CoV-2刺突蛋白S1亚基的两个或更多个不同区域的至少两种或更多种适体(例如,适体对、三联适体或更多联适体)。
在某些实施例中,本发明提供能够结合本文所述SARS-CoV-2刺突蛋白S2亚基的两个或更多个不同区域的至少两种或更多种适体(例如,适体对、三联适体或更多联适体)。
在优选的实施例中,本发明提供至少两种或更多种适体(例如,适体对、三联适体或更多联适体),其中至少一种适体能够结合本文所述SARS-CoV-2刺突蛋白的S1亚基和至少一种适体能够结合本文所述SARS-CoV-2刺突蛋白的S2亚基。
在某些实施例中,正如本文进一步所述,针对S1亚基的适体用于“捕获”,而针对S2亚基的适体用于“检测”。或者,正如本文进一步所述,针对S2亚基的适体用于“捕获”,而针对S1亚基的适体用于“检测”。
正如本文所述,本发明的“第一适体”可用于捕获或检测。如果第一适体用于捕获,则“第二适体”可用于检测。如果第一适体用于检测,则“第二适体”可用于捕获。
在某些实施例中,适体选自核酸分子文库,例如单链DNA或RNA核酸分子文库。通常,适体选自文库,所述文库设计成使任何选择的适体几乎不需要改变就可以转换成任何列出的测定形式。在某些实施例中,所述文库至少包括以下功能部分:第一引物结合区(P1)、至少一个随机区(R)和第二引物结合区(P2)。
合适的是,至少一部分随机区(R)参与靶标分子结合。随机区可以是任何合适的长度。通常,随机区的长度约为30至60个核酸碱基。例如,随机区的长度可为约40个核苷酸。
合适的是,引物区可作为文库和筛选适体PCR扩增的引物结合位点。一旦进行选择,适体可在使用前进一步修饰,例如去除靶标结合不需要的一个或两个引物序列和/或部分随机区。
本领域技术人员将理解的是,可以根据例如初始文库和/或适体选择方案来选择不同的引物序列。例如,本发明的适体可包括SEQ ID NO:114和/或115。因此,在某些实施例中,本发明的适体可以使用SEQ ID NO:114和116所示的正向和反向引物对来进行筛选。在本文所述的任何适体序列中,这些引物序列可以采用任何替代的合适引物序列代替。
第一引物区和/或第二引物区可包括本文所述的可检测标记。例如,第一和/或第二引物区可采用荧光(例如FAM)标记。在某些实施例中,第一和/或第二引物区的引物采用磷酸盐(PO4)标记。
在某些实施例中,本发明的适体进一步包括接头序列。例如,本发明的适体可采用本文所述的一个或多个接头序列固定到载体上。
在某些实施例中,本发明的适体包括或由选自SEQ ID NO:1至113中任一个序列或其片段(例如SEQ ID NO:129至144中任一个序列)的核酸序列组成。
在某些实施例中,本发明的适体包括或由选自SEQ ID NO:145至176中任一个序列或其片段(例如SEQ ID NO:177至192中任一个序列)的核酸序列组成。
S1适体
在某些实施例中,本发明的适体包括或由选自SEQ ID NO:1至53中任一个序列的核酸序列组成(即针对SARS-CoV-2刺突蛋白S1亚基产生的适体)。
在某些实施例中,本发明的适体包括或由选自SEQ ID NO:54至113中任一个序列的核酸序列组成(即针对SARS-CoV-2刺突蛋白S1亚基的RBD产生的适体)。
在某些实施例中,本发明的适体包括或由SEQ ID NO:1、2、4至6、8至14、16至26、28至46或48至49(或其变体)中任一个序列组成。本发明的适体可包括或由SEQ ID NO:4、5、6、14、17、18、21、29、32、38、45或50(或其变体)中任一个序列组成。正如本文进一步所述,这些适体能够结合SARS-CoV-2刺突蛋白S1亚基内的RBD的可接近区域(即能够结合RBD,该RBD以其天然构象作为S1亚基的一部分)。
在某些实施例中,本发明的适体包括或由SEQ ID NO:1、2、4至6、8至12、14、16至17、19至25、29、31至32、35至38、43至45或48至49(或其变体)中任一个序列组成。例如,本发明的适体可包括或由SEQ ID NO:4、5、6、14、17、21、29、32、38或45中任一个序列组成。正如本文进一步所述,这些适体能够以高亲和力结合SARS-CoV-2刺突蛋白S1亚基内的RBD的可接近区域。
在某些实施例中,本发明的适体包括或由选自SEQ ID NO:2、4、6、8、9、13、16、17、18、20、21、22、23、24、26、31、34、35、40至46、48或49(或其变体)中任一个序列的核酸序列组成。例如,本发明的适体可包括或由SEQ ID NO:4、6、17、18、21或45中任一个序列组成。正如本文进一步所述,这些适体能够特异性结合SARS-CoV-2刺突蛋白亚基S1内的RBD的可接近区域。换句话说,这些适体结合SARS-CoV-2刺突蛋白S1亚基内的RBD的可接近区域,但不结合(或以低亲和力结合)MERS-CoV和/或SARS-CoV的同源蛋白。
在某些实施例中,本发明的适体包括或由SEQ ID NO:2、4、6、8、9、16、17、20、21、22、23、24、31、35、43至45、48或49(或其变体)中任一个序列组成。例如,本发明的适体包括或由SEQ ID NO:4、8、9或43(或其变体)中任一个序列组成。正如本文进一步所述,这些适体能够以高亲和力特异性结合SARS-CoV-2刺突蛋白的S1亚基。
在某些实施例中,本发明的适体包括或由SEQ ID NO:4、8、9、16、21、23、31、43或48(或其变体)中任一个序列组成。正如本文进一步所述,这些适体特异性结合唾液样本中的SARS-CoV-2刺突蛋白。
在某些实施例中,本发明的适体包括或由SEQ ID NO:4、8、9(或其变体)中任一个序列组成。正如本文进一步所述,这些适体以高亲和力特异性结合SARS-CoV-2刺突蛋白的S1亚基。此外,这些适体特异性结合天然三聚体形式的SARS-CoV-2刺突蛋白,并且在类ELISA测定形式中特别有效。
在某些实施例中,本发明的适体包括或由SEQ ID NO:21、23、24或31(或其变体)中任一个序列组成。正如本文进一步所述,这些适体也特异性结合天然三聚体形式的SARS-CoV-2刺突蛋白。
在某些实施例中,本发明的适体包括或由SEQ ID NO:9、21、23或31(或其变体)中任一个序列组成。正如本文进一步所述,这些适体特异性结合天然三聚体形式的SARS-CoV-2刺突蛋白,并且特异性结合唾液样本中的SARS-CoV-2刺突蛋白。
在某些实施例中,本发明的适体包括或由SEQ ID NO:1、5、10、11、12、14、19、25、28至30、32、33、36至39(或其变体)中任一个序列组成。例如,本发明的适体包括或由SEQ IDNO:36或38(或其变体)中任一个序列组成。正如本文进一步所述,这些适体结合SARS-CoV-2刺突蛋白的S1亚基,并且也结合SARS-CoV和/或MERS-CoV中的等效蛋白。
在某些实施例中,本发明的适体包括或由与本文所述任一个序列的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或以上序列同一性的核酸序列组成。
如本文所用,“序列同一性(sequence identity)”是指所定义序列(SEQ ID NO)整个长度上的核苷酸同一性(或同源性)百分数。序列同一性基于以下计算:比对序列并引入空位(gap)(如有必要的话)以实现最大百分数的序列同一性之后,候选序列中与所述序列中的核苷酸相同的核苷酸的百分数。用于确定核酸序列同一性百分数的比对可以通过本领域熟悉的各种方式实现,例如,使用公开可用的计算机软件,例如BLAST、BLAST-2、ALIGN、CLUSTALW或MegAlign(DNASTAR)软件。例如,%核酸序列同一性数值可以使用欧洲生物信息学研究所网站(http://www.ebi.ac.uk)上的序列比较计算机程序产生。
至于任何蛋白序列,“序列同一性”也指所定义序列(SEQ ID NO)整个长度上的氨基酸同一性(或同源性)百分数。序列同一性基于以下计算:比对序列并引入空位(gap)(如有必要的话)以实现最大百分数的序列同一性之后,序列中与所述序列中的氨基酸残基相同的氨基酸残基的百分数。用于确定氨基酸序列同一性百分数的比对可以通过本领域熟悉的各种方式实现,例如,使用公开可用的计算机软件,例如BLASTP。
在某些实施例中,本发明的适体包括或由本文所述任一个序列的最小有效片段组成。例如,适体可包括或由以下任一个序列的最小有效片段组成:
-SEQ ID NO:1至53;
-SEQ ID NO:54至113;
-SEQ ID NO:1、2、4至6、8至14、16至26、28至46或48至49;
-SEQ ID NO:4、5、6、14、17、18、21、29、32、38、45、50;
-SEQ ID NO:1、2、4至6、8至12、14、16至17、19至25、29、31至32、35至38、43至45或48至49;
-SEQ ID NO:4、5、6、14、17、21、29、32、38或45;
-SEQ ID NO:2、4、6、8、9、13、16、17、18、20、21、22、23、24、26、31、34、35、40至46、48或49;
-SEQ ID NO:4、6、17、18、21或45;
-SEQ ID NO:2、4、6、8、9、16、17、20、21、22、23、24、31、35、43至45、48或49;
-SEQ ID NO:4、6、17、21或45;
-SEQ ID NO:4、8、9或43;
-SEQ ID NO:4、8或9;
-SEQ ID NO:1、5、10、11、12、14、19、25、28至30、32、33、36至39;
-SEQ ID NO:36或38;
-SEQ ID NO:4、8、9、16、21、23、31、43或48;
-SEQ ID NO:9、21、23、24或31;
-SEQ ID NO:9、21、23或31;或
-SEQ ID NO:10、20、24或44。
在优选的实施例中,适体可包括或由SEQ ID NO 4、8、9或43中的任一个或多个序列的最小有效片段组成。
在甚至更优选的实施例中,适体可包括或由SEQ ID NO 4、8或9中的任一个或多个序列的最小有效片段组成。
在本文中,“最小有效片段”理解为指与全长适体相比至少能够以相同(或改进)的特异性和/或亲和力结合SARS-CoV-2刺突蛋白S1(和/或S1的RBD亚单位)的全长适体的片段(例如,部分)。最小有效片段可与全长适体竞争结合SARS-CoV-2刺突蛋白的S1亚基。
在某些实施例中,本发明的适体包括或由SEQ ID NO:129至144(或其变体)中的任一个序列组成。
在某些实施例中,所述适体可包括或由SEQ ID NO:129、130、131、132、133或134(或其变体)中的一个或多个序列组成。正如本文进一步所述,这些序列对应于S1适体A3(S1_A3,SEQ ID NO:4)的最小有效片段。
在某些实施例中,所述适体可包括或由SEQ ID NO:142、143或144(或其变体)中的一个或多个序列组成。正如本文进一步所述,这些序列对应于S1适体A6(S1_A6,SEQ ID NO:8)的最小有效片段。
在某些实施例中,所述适体可包括或由SEQ ID NO:135、136、137、138、139、140和141(或其变体)中的一个或多个序列组成。正如本文进一步所述,这些序列对应于S1适体A8(S1_A8,SEQ ID NO:9)的最小有效片段。
在某些实施例中,所述适体包括或由SEQ ID NO:132、134、140、142或144(或其变体)中的一个或多个序列组成。正如本文进一步所述,这些最小有效片段有利地能够结合唾液样本中的SARS-CoV-2刺突蛋白。
在优选的实施例中,适体可包括或由SEQ ID NO:134、144或140(或其变体)组成。正如本文进一步所述,这些片段是保留结合其靶标(例如SARS-CoV-2刺突蛋白的S1亚基)的能力的最短片段。合适的是,这些片段也在类ELISA测定中起作用。
在优选的实施例中,所述适体可包括或由本文所述的SEQ ID NO:4、8、9、134、140和/或144或其变体组成。
在甚至更优选的实施例中,所述适体可包括或由本文所述的SEQ ID NO:140或其变体组成。
S2适体
在某些实施例中,本发明的适体包括或由选自SEQ ID NO:145至176中任一个序列的核酸序列组成(即针对SARS-CoV-2刺突蛋白S2亚基产生的适体)。
在某些实施例中,本发明的适体包括或由与SEQ ID NO:145至176中任一个序列的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或以上序列同一性的核酸序列组成。例如,本发明的适体可包括或由与SEQ ID NO:146、150和171(或其变体)中任一个序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或以上序列同一性的核酸序列组成。
在某些实施例中,本发明的适体包括或由SEQ ID NO:145至176中任一个序列的最小有效片段组成。如上所述,“最小有效片段”理解为指与全长适体相比至少能够以相同(或改进)的特异性和/或亲和力结合SARS-CoV-2刺突蛋白S2的全长适体的片段(例如,部分)。最小有效片段可与全长适体竞争结合SARS-CoV-2刺突蛋白的S2。
在某些实施例中,本发明的适体可包括或由包括本文所述任一个序列的至少约15、20、25、30、35、40、45、50、55、60、65、70、75、80个或更多个连续核苷酸的核酸序列组成。在此上下文中,术语“约”通常指提及的核苷酸序列长度加上或减去该提及长度的10%。
在某些实施例中,本发明的适体包括或由以下核酸序列组成,该核酸序列包括与本文所述任一个序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或以上序列同一性的序列的至少约15、20、25、30、35、40、45、50、55、60个或更多个连续核苷酸。
在优选的实施例中,本发明的适体包括或由SEQ ID NO:146、150和171(或其变体)中任一个序列组成。在所有测序的S2结合适体克隆之间的比较中,这些适体代表最普遍的序列。这些适体以高亲和力特异性结合SARS-CoV-2刺突蛋白的S2亚基。
在优选的实施例中,所述适体可包括或由SEQ ID NO:146、150和171(或其变体)中任一个序列的最小有效片段组成。例如,本发明的适体可包括或由SEQ ID NO:177至192(或其变体)中的任一个序列组成。
在某些实施例中,所述适体可包括或由SEQ ID NO:177至182(或其变体)中的任一个序列组成。正如本文进一步所述,这些序列对应于S2适体S2_A2(SEQ ID NO:146)的最小有效片段。
在优选的实施例中,所述适体可包括或由SEQ ID NO:177(或其变体)组成。这些适体以高亲和力特异性结合SARS-CoV-2刺突蛋白的S2亚基。
在优选的实施例中,本发明的适体包括或由SEQ ID NO:179(或其变体)组成。这些适体特异性结合天然三聚体形式的SARS-CoV-2刺突蛋白。
在某些实施例中,所述适体可包括或由SEQ ID NO:183至187(或其变体)中任一个序列组成。正如本文进一步所述,这些序列对应于S2适体S2_B1(SEQ ID NO:150)的最小有效片段。
在优选的实施例中,所述适体可包括或由SEQ ID NO:183(或其变体)组成。这些适体以高亲和力特异性结合SARS-CoV-2刺突蛋白的S2亚基。
在优选的实施例中,本发明的适体包括或由SEQ ID NO:188(或其变体)组成。正如本文进一步所述,这些适体特异性结合天然三聚体形式的SARS-CoV-2刺突蛋白。
在某些实施例中,所述适体可包括或由SEQ ID NO:189至192(或其变体)中的一个或多个序列组成。正如本文进一步所述,这些序列对应于S2适体_S2_G1(SEQ ID NO:171)的最小有效片段。
在优选的实施例中,所述适体可包括或由SEQ ID NO:191组成。这些适体以高亲和力特异性结合SARS-CoV-2刺突蛋白的S2亚基。
在优选的实施例中,本发明的适体可包括或由SEQ ID NO:190(或本文所述的其变体)组成。正如本文进一步所述,这些适体特异性结合天然三聚体形式的SARS-CoV-2刺突蛋白。
在优选的实施例中,所述适体可包括或由本文所述的SEQ ID NO:146、150、171、179、188和/或190或其变体组成。
本发明的适体可包括天然或非天然核苷酸和/或碱基衍生物(或其组合)。在某些实施例中,适体包括一个或多个修饰,使得它们包括除脱氧核糖、核糖、磷酸盐、腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)或尿嘧啶(U)以外的化学结构。适体可以在核碱基、糖或磷酸盐主链上修饰。
在某些实施例中,适体包括一个或多个修饰的核苷酸。示例性修饰包括例如包括烷基化、芳基化或乙酰化、烷氧基化、卤化、氨基或其他官能团的核苷酸。修饰的核苷酸的实例包括用于RNA适体的2'-氟核糖核苷酸、2'-NH2-、2'-OCH3-和2'-O-甲氧基乙基核糖核苷酸。
本发明的适体可以全部或部分是硫代磷酸酯或DNA、二硫代磷酸酯或DNA、硒代磷酸酯或DNA、二硒代磷酸酯或DNA、锁核酸(LNA)、肽核酸(PNA)、N3'-P5'磷酰胺RNA/DNA、环己烯核酸(cyclohexene nucleic acid,CeNA)、三环DNA(tricyclo DNA,tcDNA)或镜像异构体(spiegelmer),或磷酰胺吗啉(phosphoramidate morpholine,PMO)组分或本领域技术人员已知的任何其他修饰(也参见“临床和实验药理学和生理学”,Chan et al.,Clinical andExperimental Pharmacology and Physiology(2006)33,533-540)。
一些修饰使适体对核酸切割酶稳定。在适体的稳定化过程中,通常可以区分适体的后续修饰和对已修饰的RNA/DNA的选择。该稳定化不一定影响修饰的RNA/DNA适体的亲和力,但可防止适体在生物体或生物溶液中被RNA酶/DNA酶快速分解。在本发明的上下文中,如果适体在样本(例如生物培养基)中的半衰期大于1分钟,优选大于1小时,更优选大于1天,则适体被称为是稳定的。适体也可以采用报告分子修饰,该报告分子除了检测被标记的适体外,还可以有助于增加稳定性。
适体的特征在于形成基于核酸序列的特定三维结构。适体的三维结构是由于沃森和克里克分子内碱基配对(Watson and Crick intramolecular base pairing)、胡斯坦碱基配对(四重)(Hoogsteen base pairing;quadruplex)、摆动配对形成(wobble-pairformation)或其他非典型碱基相互作用而产生的。这种结构使适体(类似于抗原-抗体结合)能够准确结合靶标结构。适体的核酸序列具有在规定条件下对定义的靶标结构具有特异性的三维结构。
本发明还提供与本文所述适体竞争结合SARS-CoV-2刺突蛋白的适体。在某些实施例中,本发明提供与本文所述任一个序列中所示适体竞争结合SARS-CoV-2刺突蛋白S1(和/或S1亚基的RBD)和/或S2亚基的适体。
在某些实施例中,竞争测定可用于鉴定竞争结合SARS-CoV-2刺突蛋白S1和/或S2的适体。在示例性竞争测定中,固定的SARS-CoV-2刺突蛋白S1和/或S2在溶液中孵育,该溶液包括结合刺突蛋白S1和/或S2的第一标记适体和第二未标记适体,测试第二适体与第一适体竞争结合SARS-CoV-2刺突蛋白S1和/或S2的能力。作为对照,固定的SARS-CoV-2刺突蛋白S1和/或S2可在包括第一标记适体但不包括第二未标记适体的溶液中孵育。在允许第一适体结合SARS-CoV-2刺突蛋白S1和/或S2的条件下进行孵育后,可除去多余的未结合适体,并测量结合固定的SARS-CoV-2刺突蛋白S1和/或S2的标记的数量。如果测试样本中结合固定的SARS-CoV-2刺突蛋白S1和/或S2的标记的数量相对于对照样本显著减少,则表明第二适体与第一适体竞争结合SARS-CoV-2刺突蛋白的S1和/或S2。
适体对
在某些实施例中,本发明提供一种以上的适体,例如两种、三种、四种、五种或更多种适体。
在某些实施例中,本发明提供结合本文所述SARS-CoV-2刺突蛋白(包括其三聚体形式)的两个或更多个不同区域的两种或更多种适体。仅作为示例,第一适体可结合S1亚基内的RBD,第二适体可结合S1亚基的不同区域。或者,第一适体可结合S1亚基的RBD内的第一区域,第二适体可结合RBD内不同的第二区域。
在某些实施例中,本发明提供结合本文所述SARS-CoV-2刺突蛋白的两个或更多个不同亚基的两种或更多种适体。仅作为示例,第一适体可结合S1亚基,第二适体可结合S2亚基。本文进一步描述了能够特异性结合S1亚基或S2亚基的适体。
在某些实施例中,本发明提供用于双位点结合测定(例如夹心测定)的两种或更多种适体。示例性夹心测定(sandwich assay)包括但不限于ELISA、侧流测定和本领域技术人员已知的许多其他测定。此类测定可利用能够结合本文所述SARS-CoV-2刺突蛋白的不同区域(例如表位)和/或亚基的适体兼容对(compatible pair)。换句话说,(兼容对的)一种适体结合SARS-CoV-2刺突蛋白可能不会干扰(或影响)(兼容对的)第二种适体结合等效的蛋白。
在某些实施例中,本发明提供选自任意两种或更多种核酸的两种或更多种适体(例如,适体兼容对、三联适体或更多联适体),所述核酸选自:
-SEQ ID NO:1至53(或其变体);
-SEQ ID NO:54至113(或其变体);
-SEQ ID NO:1、2、4至6、8至14、16至26、28至46或48至49(或其变体);
-SEQ ID NO:4、5、6、14、17、18、21、29、32、38、45、50(或其变体);
-SEQ ID NO:1、2、4至6、8至12、14、16至17、19至25、29、31至32、35至38、43至45或48至49(或其变体);
-SEQ ID NO:4、5、6、14、17、21、29、32、38或45(或其变体);
-SEQ ID NO:2、4、6、8、9、13、16、17、18、20、21、22、23、24、26、31、34、35、40至46、48或49(或其变体);
-SEQ ID NO:4、6、17、18、21或45(或其变体);
-SEQ ID NO:2、4、6、8、9、16、17、20、21、22、23、24、31、35、43至45、48或49(或其变体);
-SEQ ID NO:4、6、17、21或45(或其变体);
-SEQ ID NO:4、8、9或43(或其变体);
-SEQ ID NO:1、5、10、11、12、14、19、25、28至30、32、33、36至39(或其变体);
-SEQ ID NO:36或38(或其变体);
-SEQ ID NO:4、8、9、16、21、23、31、43或48(或其变体);
-SEQ ID NO:9、21、23、24或31(或其变体);
-SEQ ID NO:9、21、23或31(或其变体);
-SEQ ID NO:129、130、131、132、133、134、135、136、137、138、139、140、141、142、143或144(或其变体);
-SEQ ID NO:132、134、140、142或144(或其变体)。
在某些实施例中,本发明提供选自任意两种或更多种核酸的两种或更多种适体(例如,适体兼容对、三联适体或更多联适体),所述核酸选自SEQ ID NO:1至113或129至144(或其变体)中的任一个序列和SEQ ID NO:145至192中的任一个序列。
在某些实施例中,本发明提供两种或更多种适体,其选自SEQ ID NO:1至113或129至144(或其变体)中的任一个序列和SEQ ID NO:145、148、150、152至154、156至159、162至170、172、173、175或177至192中的任一个序列。
在优选的实施例中,本发明提供选自以下任一个序列的两种或更多种适体:
-SEQ ID NO:4(或其变体)和SEQ ID NO:146(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:150(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:171(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:177(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:179(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:183(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:188(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:190(或其变体);
-SEQ ID NO:4(或其变体)和SEQ ID NO:191(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:146(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:150(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:171(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:177(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:179(或其变体);-SEQID NO:8(或其变体)和SEQ ID NO:183(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:188(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:190(或其变体);-SEQ ID NO:8(或其变体)和SEQ ID NO:191(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:146(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:150(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:171(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:177(或其变体);-SEQID NO:9(或其变体)和SEQ ID NO:179(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:183(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:188(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:190(或其变体);-SEQ ID NO:9(或其变体)和SEQ ID NO:191(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:146(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:150(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:171(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:177(或其变体);-SEQ ID NO:43(或其变体)和SEQID NO:179(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:183(或其变体);-SEQ IDNO:43(或其变体)和SEQ ID NO:188(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:190(或其变体);-SEQ ID NO:43(或其变体)和SEQ ID NO:191(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:146(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:150(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:171(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:177(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:179(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:183(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:188(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:190(或其变体);-SEQ ID NO:134(或其变体)和SEQ ID NO:191(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:146(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:150(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:171(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:177(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:179(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:183(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:188(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:190(或其变体);-SEQ ID NO:144(或其变体)和SEQ ID NO:191(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:146(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:150(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:171(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:177(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:179(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:183(或其变体);-SEQ ID NO:140(或其变体)和SEQ ID NO:188(或其变体);
-SEQ ID NO:140(或其变体)和SEQ ID NO:190(或其变体);
-SEQ ID NO:140(或其变体)和SEQ ID NO:191(或其变体);
在甚至更优选的实施例中,本发明提供至少两种适体,其中所述适体选自SEQ IDNO:140(或其变体)和SEQ ID NO:190(或其变体)。
正如本文所述,所述适体在夹心测定等中特别有用。在替代实施例(例如,生物传感器应用等)中,可以使用本文所述的任何一种适体。
接头序列
在某些实施例中,本发明的一种或多种适体进一步包括一种或多种接头序列。例如,接头序列可包括经配置与适体的至少一部分杂交的核酸序列。接头序列可以经配置与本发明适体的至少一部分形成双链双工结构(double-stranded duplex structure)。
在某些实施例中,接头序列的长度是约10个至约20个核苷酸,例如长度是约10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。通常,接头序列在其长度的至少一部分上与适体互补。
在某些实施例中,接头序列包括合适的功能部分以允许表面附着到适体。功能部分可选自生物素、硫醇和胺或本领域技术人员已知的任何其他合适基团。
在某些实施例中,接头序列或适体包括间隔分子,例如,选自多核苷酸分子、C6间隔分子、C12间隔分子、另一长度C间隔分子、六乙二醇分子、己二醇和/或聚乙二醇的间隔分子。接头可以是例如生物素接头。在某些实施例中,接头序列或适体可以偶联链霉抗生物素蛋白、抗生物素蛋白和/或中性抗生物素蛋白。
在某些实施例中,接头序列或适体可经修饰以附着到载体表面。例如,接头序列或适体可通过硅烷键附着。接头序列或适体可经琥珀酰化(例如,将接头序列或适体附着到氨基苯基或氨基丙基衍生的玻璃)。合适的是,载体是氨基苯基或氨基丙基的衍生物。在某些实施例中,接头序列或适体包括NH2修饰(例如,附着到涂布环氧硅烷或异硫氰酸酯的玻璃)。通常,载体表面涂布有环氧硅烷或异硫氰酸酯。在某些实施例中,接头序列或适体经酰肼修饰以附着到醛或环氧化物分子。
载体
在某些实施例中,适体或接头序列附着到载体(support)。通常,载体是固体载体,例如薄片、载玻片、板、膜或珠粒。载体可以是二维载体(例如微孔板)或三维载体(例如珠粒)。在某些实施例中,载体可包括至少一个或多个二氧化硅薄片、纤维、磁珠等。在某些实施例中,固体载体是采用本发明的一种或多种适体衍生的拭子的一部分。在优选的实施例中,固体载体是采用本发明的一种或多种适体衍生的侧流设备的一部分。
在某些实施例中,载体可包括至少一种纳米颗粒,例如金纳米颗粒等。在另一个实施例中,载体包括微量滴定板或其他测定板、条带、膜、薄膜、凝胶、芯片、微粒、纳米纤维、纳米管、胶束、微孔、纳米孔、二氧化硅-纤维或形成拭子的类似基材或生物传感器表面。在某些实施例中,生物传感器表面可以是探针表面、生物传感器流道或类似物。
在某些实施例中,适体或接头序列可直接或间接附着到磁珠,磁珠可以是例如羧基封端的、抗生物素蛋白修饰的或环氧活化的或采用亲合性反应基团(compatiblereactive group)修饰的磁珠。
将寡核苷酸固定到载体(例如固相载体)上可通过本领域技术人员已知的用于将DNA或RNA固定在固体上的多种方式和任何方式来完成。适体在纳米颗粒上的固定是例如如WO2005/13817中所述的。例如,可以用液相的适体润湿固相(纸或多孔材料),随后液相挥发,将适体留在纸或多孔材料中。
在某些实施例中,载体包括膜,例如硝化纤维素、聚乙烯(PE)、聚四氟乙烯(PTFE)、聚丙烯(PP)、醋酸纤维素(CA)、聚丙烯腈(PAN)、聚酰亚胺(PI)、聚砜(PS)、聚醚砜(PES)膜或包括氧化铝(Al2O3)、氧化硅(SiO2)和/或氧化锆(ZrO2)的无机膜。特别合适的载体制造材料包括例如无机聚合物、有机聚合物、玻璃、有机和无机晶体、矿物、氧化物、陶瓷、金属(特别是贵金属)、碳和半导体。特别适合的有机聚合物是基于聚苯乙烯的聚合物。可官能化的生物聚合物,例如纤维素、葡聚糖、琼脂、琼脂糖和交联葡聚糖,尤其是硝化纤维素或溴化氰交联葡聚糖,可用作提供固体载体的聚合物。
可检测标记
在某些实施例中,本发明的适体用于检测和/或定量样本中SARS-CoV-2的数量。通常,所述适体包括可检测的标记。本文可使用能够方便适体检测和/或定量的任何标记。
在某些实施例中,可检测标记是荧光部分,例如荧光/猝灭剂化合物。荧光/猝灭剂化合物是本领域已知的,例如,参见“荧光能量转移核酸探针:设计和方案”,MaryKatherine Johansson,Methods in Molecular Biol.335:Fluorescent Energy TransferNucleic Acid Probes:Designs and Protocols,2006,Didenko,ed.,Humana Press,Totowa,NJ,and Marras et al.,2002,Nucl.Acids Res.30,el22(通过引用并入本文)。
在某些实施例中,可检测标记是FAM(荧光素)。在某些实施例中,FAM标记位于适体的第一或第二引物区。本领域技术人员将理解的是,该标记可位于适体内的任何适当位置。本文也可以使用彼此接近时导致可检测信号增加的部分,例如由于荧光共振能量转移(fluorescence resonance energy transfer,“FRET”)的结果;合适的配对包括但不限于例如荧光素和四甲基罗丹明;罗丹明6G和孔雀绿,以及FITC(异硫氰酸荧光素)和缩氨基硫脲等。
在某些实施例中,可检测标记选自荧光团、纳米颗粒、量子点、酶、放射性同位素、预定义序列部分、生物素、脱硫生物素、硫醇基、氨基、叠氮化物、氨基烯丙基、地高辛、抗体、催化剂、胶体金属颗粒,胶体非金属颗粒、有机聚合物、乳胶颗粒、纳米纤维、纳米管、树状聚合物、蛋白质和脂质体。
在某些实施例中,可检测标记是荧光蛋白,例如绿色荧光蛋白(GFP)或本领域技术人员已知的任何其他荧光蛋白。
在某些实施例中,可检测标记是酶。例如,所述酶可选自辣根过氧化物酶、碱性磷酸酶、脲酶、β-半乳糖苷酶或本领域技术人员已知的任何其他酶。
在某些实施例中,检测的性质将取决于所使用的可检测标记。例如,标记可以通过其颜色(例如,金纳米颗粒)检测。颜色可由光学读取器或相机(例如带有成像软件的相机)定量检测。
在某些实施例中,可检测标记是荧光标记,例如量子点。在此类实施例中,检测手段可包括荧光板读取器、条带读取器或类似装置,经配置记录荧光强度。
在可检测标记是酶标记的实施例中,检测手段可以例如是比色、化学发光和/或电化学(例如,采用电化学检测器)。通常,电化学传感是通过将氧化还原报告物(例如亚甲基蓝或二茂铁)的一端偶联适体,另一端偶联传感器表面。通常,靶标结合时适体构象发生变化,改变了报告物和传感器之间的距离,从而提供读数。
在某些实施例中,可检测标记可进一步包括酶,例如辣根过氧化物酶(HRP)、碱性磷酸酶(APP)或类似物,以催化翻转底物而提供放大信号。
在某些实施例中,本发明提供包括本发明适体和可检测分子的复合物(例如偶联物)。通常,本发明的适体共价地或物理地偶联可检测分子。
在某些实施例中,可检测分子是可视的、光学的、光子的、电子的、声学的、光声的、质量的、电化学的、电光的、光谱的、酶的或其他物理的、化学的或生物化学的可检测标记。
在某些实施例中,可检测分子通过发光、UV/VIS光谱、酶法、电化学或放射性进行检测。发光是指发射光。例如,光致发光、化学发光和生物发光用于检测标记。在光致发光或荧光中,激发是通过吸收光子而发生。示例性荧光团包括但不限于可与适体共价偶合的双苯并咪唑、荧光素、吖啶橙、Cy5、Cy3或碘化丙啶、四甲基-6-羧基罗丹明(TAMRA)、德克萨斯红(TR)、罗丹明、Alexa荧光染料(不同公司生产的不同波长的荧光染料等)、量子点或其他相关的半导体粒子。
在某些实施例中,可检测分子是非荧光颗粒,例如金纳米颗粒、胶体非金属颗粒、有机聚合物、乳胶颗粒、纳米纤维(例如碳纳米纤维)、纳米管(例如碳纳米管)、树状聚合物、蛋白质或具有信号产生物质的脂质体。胶体颗粒可以用比色法检测。
在某些实施例中,可检测分子是酶。在某些实施例中,酶可将底物转化成有色产物,例如过氧化物酶、荧光素酶、β-半乳糖苷酶或碱性磷酸酶。例如,无色底物X-gal通过β-半乳糖苷酶的活性转化为颜色可肉眼检测的蓝色产物。
在某些实施例中,可检测分子是放射性同位素。检测也可以通过标记适体的放射性同位素进行,所述放射性同位素包括但不限于3H、14C、32P、33P、35S或125I,更优选32P、33P或125I。在闪烁计数中,间接地测量放射性标记适体-靶标复合物的放射性辐射。闪烁体物质被同位素的放射性发射激发。在闪烁材料转变回到基态的过程中,激发能以闪光的形式再次释放,并被光电倍增管放大和计数。
在某些实施例中,可检测分子选自地高辛和生物素。因此,适体也可被地高辛或生物素标记,地高辛或生物素例如被携带有标记(例如酶偶联物)的抗体或链霉抗生物素蛋白结合。现有技术中,适体与酶的共价连接(偶联)可以通过几种已知的方式实现。适体结合的检测也可以通过在RIA(放射性免疫测定)中采用放射性同位素(优选采用125I)标记适体来实现,或通过在FIA(荧光免疫测定)中采用荧光团(优选采用荧光素或FITC)发射荧光来实现。
装置
本发明所述的装置可以以多种不同的形式提供。在某些实施例中,本发明提供用于检测样本中SARS-CoV-2的存在、不存在或含量的装置,所述装置包括本文所述的适体。
在某些实施例中,所述装置包括本文所述的载体。例如,在SARS-CoV-2不存在的情况下,适体可以直接或间接固定在载体上以进行固定。
在某些实施例中,所述装置包括本文所述的接头序列。
在某些实施例中,本发明的适体可以直接或间接(例如通过接头)附着到载体表面。例如,适体可以通过与适体末端化学附着的接头固定,以允许直接固定适体。
在某些实施例中,接头序列是DNA或RNA分子或混合的DNA/RNA分子,其中任选地,接头分子包括一个或多个修饰的核苷酸。
在某些实施例中,所述装置可以是生物传感器。生物传感器有许多不同的形式。在某些实施例中,生物传感器包括适体和将适体与SARS-CoV-2刺突蛋白S1和/或S2之间的结合事件转化为电学上可定量信号的传感器。生物传感器可以包括在容器或探针等中。
此外,所述装置还可以包括其他元件,例如信号处理设备、输出电子设备、显示设备、数据处理设备、数据存储设备和与其他设备的接口。在某些实施例中,使包含SARS-CoV-2的样本与生物传感器接触。然后,通过SARS-CoV-2刺突蛋白S1和/或S2与适体特异性结合后适体特性的变化来鉴定SARS-CoV-2。
传感器的灵敏度可能受所使用的传感器的影响。传感器将来自结合事件的信号(与样本中靶标分子的浓度成比例)转换为电学上可定量的测量信号。由于适体和SARS-CoV-2之间的分子相互作用而产生信号。利用本发明的生物传感器,可以获得定性、定量和/或半定量的分析信息。
光学换能器的测量可以基于光度学原理,由此,例如检测颜色或发光强度的变化。光学方法包括荧光、磷光、生物发光和化学发光、红外跃迁和光散射的测量。光学方法还包括测量SARS-CoV-2刺突蛋白S1结合适体时的层厚变化。例如,层厚可以通过表面等离子体共振(SPR)、反射干涉光谱法(RIfS)、生物膜层干涉(BLI)或类似方法测量。
此外,可以测量薄层上的干涉(SPR或RlfS)和渐逝场(evanescent field)的变化。声学换能器利用压电石英晶体的频率变化,压电石英晶体能检测到靶标结合适体时发生的高度敏感的质量变化。将使用的石英晶体置于振荡电场中,并测量晶体的谐振频率。对石英晶体表面的质量变化进行定量。
在某些实施例中,所述装置是BLI(生物膜层干涉)装置或类似的装置。BLI是一种用于测量生物分子相互作用的无标记技术。它是一种光学分析技术,可分析从两个表面(生物传感器尖端上的固定配体层和内部的参考层)反射的白光干涉图的变化。结合生物传感器尖端的分子数量的任何变化都会引起可被测量的干涉图的实时变化。只有与生物传感器结合或解离的分子才能改变干涉图并在BLI传感器上生成响应曲线。未结合的分子、周围介质折射率的变化或流速的变化不会影响干涉图。
在某些实施例中,所述装置可以包括纳米孔检测平台(例如,电阻式脉冲传感(RPS)等)。通常,此类检测平台允许通过使用互补DNA发夹检测本发明的任何适体。例如,通过孔移动的任何适体都可能受到蛋白结合的影响,从而提供蛋白结合的间接测量。
一些测定形式(例如电化学传感器)依赖于传感器表面周围局部环境的变化,从而给出可定量的读数。一些传感器仅检测靶标(此处为SARS-CoV-2)结合表面固定的配体(适体或Optimer)时环境的变化。一些传感器包括固定配体上的官能团,例如氧化还原报告物,例如亚甲基蓝、二茂铁或纳米粒子,以改善信号。
许多适体在靶标结合时经历构象变化。这会改变氧化还原报告物和传感器表面之间的距离,导致这种响应增加。适体序列的比较表明,本文所述的一些适体形成紧密结构,在靶标结合时不太可能经历显著的结构重排。其他适体序列不太可能形成这种强结构,因此可能更容易发生结构重排。
在某些实施例中,本发明提供包括SEQ ID NO:10、20、24或44中的至少一个或多个序列的功能化电极或生物传感器表面。应该理解的是,与本文所述的其他适体序列相比,这些序列不太可能形成G-四分体(G-quartet)结构,但并不受限于此理论。
制备了该结构类别的几种适体(SEQ ID NO:10、20、24或44),其一端具有硫醇基团以允许固定在金传感器电极上,另一端具有亚甲基蓝氧化还原报告物以允许检测。已经评估了两种标记方向(5'端硫醇与3'端亚甲基蓝,以及5'端亚甲基蓝与3'端硫醇)。有利的是,这种结构类别的适体在电化学传感器形式中特别有效。
因此,在优选的实施例中,本发明提供包括SEQ ID NO:10、20、24或44(或本文别处所述的其变体)中的任一个或多个序列的适体,其中所述适体固定在电极的(金)表面上。
本发明还提供包括本文所述任何适体或复合物的测试条和/或侧流设备。侧流设备也可称为侧流试验、侧流测定和侧流免疫测定。
在某些实施例中,侧流设备包括接头序列附着在其上的载体。接头序列可以经配置与本文所述适体的至少一部分杂交。可引入本文所述的任何样本(例如,拭子、血液、痰或血浆样本)。如果样本包括SARS-CoV-2,则适体可结合SARS-CoV-2刺突蛋白并经历构象变化,导致适体与接头序列分离。然而,通常,侧流设备包括传统的LFD形式,其中SARS-CoV-2在“检测线”上被“捕获”,从而破坏固定的适体;随后采用偶联合适的检测分子(例如乳胶珠、金纳米颗粒、荧光团或类似物)的第二适体(其可以与第一适体相同)或抗体进行检测。
在某些实施例中,该装置可适用于例如ELISA(酶联免疫吸附测定)的测定以及本领域技术人员已知的不同测定。当采用适体代替抗体时,所开展的测定通常被称为“ELONA”(酶联寡核苷酸测定)、“ELASA”(酶联适体吸附测定)、“ELAA”(酶联适体测定)或类似叫法。由于适体可以与包括荧光团、猝灭分子和/或本文所述的任何其他检测部分的多种报告分子偶联,因此,在这些类ELISA测定平台中引入适体可以提高灵敏度,允许检测更多的分析物;包括没有可用抗体和大范围输出的分析物。
在优选的实施例中,本发明提供一种侧流设备,其包括(1)第一适体,其包括选自SEQ ID NO:4、8、9、43、134、140或144(或本文所述的其任何变体)中的任一个序列的核酸序列和(2)(i)第二适体,其包括选自SEQ ID NO:4、8、9、43、134、140或144(或本文所述的其任何变体)中的任一个序列的核酸序列,其中第二适体与第一适体不同;或者(ii)第二适体,其包括选自SEQ ID NO:146、150、171、177、179、183、188、190或191(或本文所述的其任何变体)中的任一个序列的核酸序列。正如本文所述,此类适体对在类ELISA形式和/或侧流设备中特别有效。
在甚至更优选的实施例中,适体对包括SEQ ID NO:140(或本文所述的其任何变体)和SEQ ID NO:190(或本文所述的其任何变体)。SEQ ID NO:140(或其变体)所示的适体可以与固体载体(例如测试条)结合而SEQ ID NO:190(或其变体)可以与可检测标记偶联。或者,SEQ ID NO:190(或其变体)可以与固体载体(例如测试条)结合而SEQ ID NO:140(或其变体)可以与可检测标记偶联。
在某些实施例中,所述装置可以包括容器。本发明的适体可以通过与容器(例如容器的表面)中的接头序列杂交而被固定。或者,本发明的适体可以通过适体末端的接头或官能团直接固定在容器表面上。
检测SARS-CoV-2的方法
在某些实施例中,本发明提供用于检测样本中SARS-CoV-2的存在、不存在或含量的方法。
可以使用任何合适的样本。此外,样本可以使用本领域已知的任何相关方法或技术获得。
在某些实施例中,样本是生物样本。例如,所样本可包括全血、白细胞、外周血单核细胞、血浆、血清、痰、呼气、尿液、精液、唾液、脑膜液、羊水、腺液、淋巴液、乳头抽吸物、支气管抽吸物、滑液、关节抽吸物、细胞、细胞提取物、粪便、组织、组织活检或脑脊液。
在某些实施例中,样本是血液(例如血浆)样本。或者,样本可以是唾液或痰(粘液或痰)样本。样本可以进行预处理,例如通过混合,添加酶、缓冲液、盐溶液或标记物,或纯化。
在某些实施例中,样本是非强迫性呼吸样本。例如,与拭子样本相比,呼吸样本可能不需要强迫性采集。通常,使用标准呼吸分析仪获得非强迫性呼吸样本。
在某些实施例中,样本是粪便样本。例如,样本可以代表来自监测群体中COVID-19感染爆发的区域的粪便样本池。
在某些实施例中,通过拭子采集(例如,咽喉和/或鼻拭子,鼻拭子包括例如鼻咽拭子、前鼻拭子和/或前鼻孔拭子)获得样本。例如,样本可以包括来自同一受试者至少两个不同区域(例如,喉咙后部和鼻子内部)的样本。或者,样本可以是血液或尿液样本。
在某些实施例中,样本获得自患有或怀疑患有COVID-19感染的受试者。通常,受试者是人类。通常,受试者患有或怀疑患有SARS-CoV-2感染;症状包括但不限于干咳、呼吸短促或呼吸困难、发烧、发冷、肌肉和/或关节疼痛、头痛/头晕、喉咙痛和味觉或嗅觉丧失。在某些实施例中,样本获得自无症状但随后可能有发展(和/或传播)感染风险的受试者。在某些实施例中,受试者被确认为容易感染COVID-19感染。在某些实施例中,受试者被确认为具有发展成重症的风险。
在检测样本中SARS-CoV-2的存在、不存在或含量的方法中,使样本与本文所述的适体相互作用(即接触)。例如,可以将样本和本文所述的适体在足以使适体的至少一部分结合样本中的任何SARS-CoV-2刺突蛋白(例如,SARS-CoV-2刺突蛋白的S1和/或S2亚基)的条件下孵育。
可以使用本文所述的适体与SARS-CoV-2刺突蛋白(例如SARS-CoV-2刺突蛋白的S1和/或S2亚基)之间结合的任何合适条件。在某些实施例中,样本和适体可在温度约20℃至约37℃的条件下孵育。在某些实施例中,可采用合适的缓冲液(例如PBS或本领域技术人员已知的任何其他缓冲液组合物)将样本和适体稀释至不同浓度(例如至少约1%、5%、10%、20%、25%、30%、40%、50%、60%、70%、80%v/v或以上)。在某些实施例中,样本和适体可在振动和/或混合的条件下孵育。在某些实施例中,将样本和适体孵育至少1分钟、至少5分钟、至少15分钟、至少1小时或更长时间。
在某些实施例中,适体与SARS-CoV-2刺突蛋白S1和/或S2的结合导致形成适体——SARS-CoV-2刺突蛋白S1和/或S2复合物。如本文所述,可以检测结合或结合事件,例如通过视觉、光学、光子、电子、声学、光声、质量、电化学、电光、光谱、酶或其他化学、生物化学或物理的方法。
适体与SARS-CoV-2刺突蛋白(例如SARS-CoV-2刺突蛋白的S1和/或S2亚基)的结合可以使用任何合适的技术检测。如上所述,例如,适体与SARS-CoV-2刺突蛋白(例如SARS-CoV-2刺突蛋白的S1和/或S2亚基)的结合可以使用生物传感器检测。在某些实施例中,使用本文所述的SPR、RlfS、BLI、LFD或ELONA或本领域技术人员已知的其他技术检测适体与SARS-CoV-2刺突蛋白(例如SARS-CoV-2刺突蛋白的S1和/或S2亚基)的结合。
有利的是,本发明的适体允许检测SARS-CoV-2刺突蛋白S1和/或S2的临床病理量。通常,本发明适体的检测限小于约10000pg/ml SARS-CoV-2,例如,小于约9000pg/ml,小于约8000pg/ml,小于约7000pg/ml,小于约6000pg/ml,小于约5000pg/ml,小于约4000pg/ml,小于约3000pg/ml,小于约2000pg/ml,小于约1000pg/ml,小于约900pg/ml,小于约800pg/ml,小于约700pg/ml,小于约600pg/ml,小于约500pg/ml,小于约400pg/ml,小于约300pg/ml,小于约200pg/ml,小于约100pg/ml或小于约50pg/ml SARS-CoV-2。通常,本发明适体的检测范围从约50pg/ml至约10000pg/ml SARS-CoV-2,例如从约50pg/ml至约5000pg/mlSARS-CoV-2。因此,适体能够以高特异性和/或亲和力结合SARS-CoV-2,并允许样本中活性SARS-CoV-2的病理和/或感染范围可以被检测。
有利的是,本发明的适体允许在例如小于约60分钟、小于约50分钟、小于约40分钟、小于约30分钟、小于约20分钟、小于约10分钟或更少的时间内检测样本中活性SARS-CoV-2的病理和/或感染范围。
富集、分开和/或分离SARS-CoV-2的方法
在某些实施例中,本发明提供富集(例如浓缩)、分开和/或分离本文所述样本中SARS-CoV-2的方法。
通常,本发明提供一种将本文所述的适体、复合物、生物传感器、测试条或装置与本文所述的样本接触的方法。然后,适体与样本中的任何SARS-CoV-2刺突蛋白S1和/或S2的结合可以允许在任何后续处理之前富集、分开和/或分离样本中的病毒。
在某些实施例中,本发明的适体用于结合和浓缩样本中的SARS-CoV-2病毒。然后,所得浓缩物可用于提高任何COVID-19诊断方法(例如qRT-PCR测试等)的灵敏度。
在某些实施例中,本发明的适体允许在采用任何技术检测和/或定量原始样本中的病毒之前,将样本中的病毒量浓缩至少5倍、10倍、100倍、1000倍或更多倍。
在某些实施例中,本发明的适体被固定(例如,在鼻拭子或口腔拭子中)以从相应的样本中捕获更多的病毒。在进一步的实施例中,适体固定在毛细管、管、纤维、膜、板或珠粒内(或表面)。合适的是,固定在表面的适体可以随后与患者样本混合,从而“捕获”病毒。例如,珠粒随后可以被浓缩,并在更浓缩的样本中从珠粒中释放出病毒和/或病毒基因组。
在某些实施例中,本发明的适体可以用作亲和纯化试剂,例如在亲和层析中。在此类实施例中,适体用于捕获、纯化和富集感兴趣的靶标(病毒),而不是任何其他非靶标材料。与原始样本相比,洗脱材料中的靶标(病毒)量可以更纯和/或更浓。
在某些实施例中,本发明提供本文所述的任何适体、复合物、生物传感器、测试条或装置用于检测、富集、分开和/或分离SARS CoV-2的用途。
治疗性适体
在某些实施例中,本发明的适体能够抑制SARS-CoV-2刺突蛋白(包括其天然三聚体形式)的S1亚基内的受体结合域(RBD)与宿主细胞表面上的血管紧张素转换酶2(ACE2)受体之间的相互作用。因此,本发明的适体可用于限制病毒进入宿主细胞和随后的病毒感染。
可以使用任何合适的技术测试适体抑制刺突蛋白和ACE2细胞表面受体之间相互作用的能力。此类技术包括例如配体结合测定,例如放射性配体结合测定、饱和结合测定、竞争结合测定、荧光偏振(FP)测定、荧光共振能量转移(FRET)测定、表面等离子体共振(SPR)测定、生物膜层干涉(BLI)、液相配体结合测定、免疫沉淀测定、固相配体结合测定、多孔板测定、珠上配体结合测定、柱上配体结合测定、过滤器测定、实时细胞结合测定等。
适体与SARS-CoV-2刺突蛋白S1的结合可以抑制靶标抗原的活性,而不会引起任何不需要的副作用。此外,适体在生理条件下良好地发挥作用,保质期长,同时仍能在仅仅几分钟内以经济高效的方式化学合成。此外,由于其尺寸小,适体可以穿透膜并靶向尺寸更小的抗原。
在某些实施例中,本发明进一步提供针对SARS-CoV-2刺突蛋白S1亚基的适体,其能够治疗和/或缓解COVID-19感染的症状。
在某些实施例中,本发明提供一种或多种针对SARS-CoV-2刺突蛋白S1亚基的治疗性适体,其包括本文所述的任一个序列所示的核酸序列。
在某些实施例中,本发明提供一种或多种治疗性适体,其结合来自几种相关冠状病毒的刺突蛋白的S1亚基,而不是只特异性结合SARS-CoV-2刺突蛋白。例如,该治疗性适体可能能够与来自其他冠状病毒(例如SARS和/或MERS)的刺突蛋白的S1亚基交叉反应。有利的是,此类适体可能能够治疗多种冠状病毒感染。
在某些实施例中,本发明的治疗性适体可包括或由SEQ ID NO:1、5、10、11、12、14、19、25、28至30、32、33、36至39(或其变体)所示的核酸序列组成。例如,本发明的治疗性适体可包括或由SEQ ID NO:36或38(或其变体)组成。
在某些实施例中,本发明提供能够特异性结合SARS-CoV-2刺突蛋白S1亚基的一种或多种治疗性适体。例如,所述一种或多种治疗性适体可以特异性结合SARS-CoV-2刺突蛋白的RBD。换句话说,该治疗性适体可能不与来自其他冠状病毒(例如SARS和/或MERS)的刺突蛋白交叉反应。有利的是,此类适体可能能够特异性治疗COVID-19。
在某些实施例中,本发明的治疗性适体可包括或由SEQ ID NO:54至113中任一个序列所示的核酸序列组成。在某些实施例中,治疗性适体可包括或由一个或多个核酸序列组成,该核酸序列如以下序列中的任一个序列所示:
-SEQ ID NO:1、2、4至6、8至14、16至26、28至46或48至49(或其变体);
-SEQ ID NO:4、5、6、14、17、18、21、29、32、38、45、50(或其变体);
-SEQ ID NO:1、2、4至6、8至12、14、16至17、19至25、29、31至32、35至38、43至45或48至49(或其变体);
-SEQ ID NO:4、5、6、14、17、21、29、32、38或45(或其变体);
-SEQ ID NO:2、4、6、8、9、13、16、17、18、20、21、22、23、24、26、31、34、35、40至46、48或49(或其变体);
-SEQ ID NO:4、6、17、18、21或45(或其变体);
-SEQ ID NO:2、4、6、8、9、16、17、20、21、22、23、24、31、35、43至45、48或49(或其变体);
-SEQ ID NO:4、6、17、21或45(或其变体);
-SEQ ID NO:4、8、9或43(或其变体);
-SEQ ID NO:4、8、9、16、21、23、31、43或48(或其变体);
-SEQ ID NO:9、21、23、24或31(或其变体);
-SEQ ID NO:9、21、23或31(或其变体);
-SEQ ID NO:129、130、131、132、133、134、135、136、137、138、139、140、141、142、143或144(或其变体);或
-SEQ ID NO:132、134、140、142或144(或其变体)。
在某些实施例中,本发明的针对SARS-CoV-2刺突蛋白S1亚基的一种或多种适体作为药物使用。
在某些实施例中,本发明的针对SARS-CoV-2刺突蛋白S1亚基的一种或多种适体作为疫苗使用。
在某些实施例中,本发明的针对SARS-CoV-2刺突蛋白S1亚基的一种或多种适体与一种或多种治疗剂偶联。
在某些实施例中,本发明的针对SARS-CoV-2刺突蛋白S1亚基的一种或多种适体用于帮助将另一种药剂(例如抗病毒剂)递送至COVID-19病毒。
在某些实施例中,本发明的针对SARS-CoV-2刺突蛋白S1亚基的一种或多种适体用于治疗和/或预防涉及SARS-CoV-2的任何疾病或病症。此类疾病和/或病症包括但不限于急性呼吸窘迫综合征、肺炎、急性心脏损伤、干咳、呼吸短促或呼吸困难、发烧、发冷、肌肉和/或关节疼痛、头痛/头晕、喉咙痛和/或味觉或嗅觉丧失。
在某些实施例中,本发明提供向患者施用治疗有效量的针对SARS-CoV-2刺突蛋白S1亚基的一种或多种适体的方法。
“患者”包括接受预防性或治疗性治疗的任何人类或其他哺乳动物受试者。如果向容易感染SARS-CoV-2或存在SARS-CoV-2感染风险的个体施用,则认为是预防性的治疗。如果向怀疑患有或已经患有与SARS-CoV-2感染相关的疾病和/或病症(例如COVID-19)的个体施用,则认为是治疗性的治疗。
患者可能无症状。或者,患者可能出现本文所述的COVID-19感染症状。
“治疗有效量”是在患者中产生所需治疗效果(例如预防或治疗目标病症或缓解与病症相关的症状)的适体或组合物(例如,本文所述的药物组合物或适体-药物偶联物)的用量。精确的治疗有效量是在给定受试者的治疗功效方面产生最有效结果的组合物的用量。该用量将根据多种因素变化,包括但不限于治疗化合物的特征(包括活性、药代动力学、药效学和生物利用度)、受试者的生理状况(包括年龄、性别、疾病类型和阶段、一般身体状况、对给定剂量的反应性和药物类型)、制剂中一种或多种药学上可接受的载体的性质以及施用途径。临床和药理学领域的技术人员将能够通过常规实验,即通过监测患者对化合物施用的反应并相应调整剂量,来确定所施用适体的治疗有效量。其他指南参见《雷明顿:药学技术与实践》(Remington:The Science and Practice of Pharmacy,21st Edition,Univ.ofSciences in Philadelphia(USIP),Lippincott Williams&Wilkins:Philadelphia,PA,2005)。
在某些实施例中,本发明提供包括本发明的针对SARS-CoV-2刺突蛋白S1亚基的适体的药物组合物。例如,在某些实施例中,本发明提供包括本发明的针对SARS-CoV-2刺突蛋白S1亚基的适体和至少一种药学上可接受的赋形剂、佐剂或载体的药物组合物。
药物组合物的制备是本领域技术人员已知的。通常,此类组合物可制备成注射剂、片剂或其他口服固体(包括缓释胶囊);或本领域当前使用的任何其他形式,包括但不限于滴眼液、霜剂、乳液、软膏、吸入剂等。此外,注射剂可以制备成液体溶液(或悬浮液)形式,或适合在注射前配制为液体溶液(或悬浮液)的固体形式。
本文所述的针对SARS-CoV-2刺突蛋白S1亚基的适体或药物组合物可以以连续或间歇的方案施用。例如,该方案可以包括在一段时间内多次施用治疗剂。
本文所述的针对SARS-CoV-2刺突蛋白S1亚基的适体或药物组合物可以通过任何合适的施用途径施用,任选没有过度的毒性。施用途径可指本领域已知的任何施用途径,包括但不限于气雾剂、肠内、鼻内、眼内、口服、肠外、直肠、经皮或阴道施用。
在本发明的某些实施例中,药学上可接受的赋形剂选自一种或多种水溶性试剂,例如乳糖、甘露醇、硫酸钙、糊精、葡萄糖结合剂、葡萄糖、蔗糖、聚维酮等;水分散性稀释剂,例如微晶纤维素、粉状纤维素、淀粉(玉米淀粉、预胶化淀粉)、粘土或粘土矿(高岭土、膨润土、凹凸棒土);助滑剂,例如碳酸钙、硬脂酸镁、硬脂酸等;抗粘连剂,例如滑石粉、二氧化钛、红色和黄色氧化铁、十二烷基硫酸钠等;润滑剂,例如二氧化硅、氢化植物油等;防腐剂,例如丁基羟基茴香醚等;悬浮剂,例如羧甲基纤维素钠、甲基纤维素等。
在本发明的某些实施例中,药学上可接受的佐剂可选自缓冲剂,例如柠檬酸、柠檬酸钠等;防腐剂,例如苯甲酸钠等;防裂剂,例如胶体二氧化硅等;掩盖苦味的调味料;悬浮剂,例如黄原胶、卡拉胶等;消泡剂,例如西甲硅油等;以及着色剂,例如氧化铁等。
在本发明的某些实施例中,适体或药物组合物与一种或多种其他治疗剂组合向患者施用。例如,本发明的针对SARS-CoV-2刺突蛋白S1亚基的适体或药物组合物可与另一种抗-SARS-CoV-2疗法组合施用。例如,该抗-SARS-CoV-2疗法可用于治疗急性呼吸窘迫综合征和/或与急性呼吸窘迫综合症相关的症状。
在某些实施例中,抗-SARS-CoV-2疗法是细胞疗法治疗(例如,采用从另一患者处获得和/或纯化的针对SARS-CoV-2疗法产生的抗体进行治疗)。在某些实施例中,抗-SARS-CoV-2疗法是药学上有效量的瑞德西韦(remdesivir)、氯喹、羟氯喹、洛匹那韦(lopinavir)、利托那韦(ritonavir)和/或干扰素β。在某些实施例中,抗SARS-CoV-2疗法是地塞米松(dexamethasone)。在某些实施例中,抗SARS-CoV-2疗法是阿奇霉素(azithromycin)与羟氯喹、法匹拉韦(favipiravir)、美珀珠单抗(meplazumab)或托珠单抗(tocilizumab)的组合。在某些实施例中,抗SARS-Cov-2疗法是托珠单抗或任何其他合适的抗IL-6疗法。
在某些实施例中,本发明提供一种检测本文所述样本中SARS-CoV-2的存在、不存在或含量的方法,其中如果在从受试者获得的样本中检测到SARS-CoV-2,则该方法进一步包括采用本文所述的抗SARS-CoV-2疗法或组合疗法治疗受试者。例如,所述方法可进一步包括施用本发明的治疗性适体。所述方法可进一步包括施用细胞疗法。所述方法可进一步包括施用药学上有效量的瑞德西韦、氯喹、羟氯喹、洛匹那韦、利托那韦和/或干扰素β。
在适体或药物组合物与一种或多种其他治疗剂组合使用的实施例中,适体或药物组合物和其他治疗剂可以通过相同的途径或通过不同的途径施用。例如但不限于此,适体或药物组合物可通过气雾剂施用,而组合的其他治疗剂可通过注射施用。
试剂盒
本发明还提供一种用于检测和/或定量SARS-CoV-2的试剂盒,其中所述试剂盒包括本文所述的一种或多种适体。通常,试剂盒还包括本文所述的可检测分子。
在一些实施例中,试剂盒还包括本文所述任何方法的使用说明。
在某些实施例中,试剂盒还包括本文所述的接头和/或载体。
通常,试剂盒包括用于试剂盒预期反应或待执行方法的其他组分,例如用于富集、分开和/或分离程序预期检测的组分。例如缓冲溶液、显色反应底物、染料或酶底物。在试剂盒中,适体可以以多种形式提供,例如预先固定在载体(例如固体载体)上、冷冻干燥或在液体介质中。
本发明的试剂盒可用于执行本文所述的任何方法。应该理解的是,试剂盒的各部分可以单独包装在小瓶中,或者在容器或多容器单元中组合。通常,试剂盒的制造遵循本领域技术人员已知的标准程序。
正如本文进一步所述,在某些实施例中,试剂盒可用于捕获和/或浓缩病毒。例如,本发明可包括试剂盒,该试剂盒包括本文所述的适体以帮助提高任何COVID-19诊断测试的灵敏度。应该理解的是,本公开的特征很容易组合在各种组合中,而并不背离所附权利要求限定的本公开的范围。
本发明还提供以下编号段落的主题:
1.一种能够结合SARS-CoV-2刺突蛋白的适体,其中所述适体包括:
(a)选自SEQ ID NO:1至113或129至144中任一个序列的核酸序列;
(b)选自SEQ ID NO:145至192中任一个序列的核酸序列;
(c)与(a)或(b)序列中的任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(d)具有(a)至(c)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
2.根据段落1所述的适体,其中所述适体包括:
(a)选自SEQ ID NO:1、2、4至6、8至14、16至26、28至46或48至49中任一个序列的核酸序列;
(b)与(a)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(c)具有(a)或(b)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
3.根据段落1所述的适体,其中所述适体能够结合SARS-CoV-2刺突蛋白的S1亚基的受体结合域(RBD),并且包括:
(a)选自SEQ ID NO:4、5、6、14、17、18、21、29、32、38、45或50中任一个序列的核酸序列;
(b)选自SEQ ID NO:1、2、4至6、8至12、14、16至17、19至25、29、31至32、35至38、43至45或48至49中任一个序列的核酸序列;
(c)选自SEQ ID NO:4、5、6、14、17、21、29、32、38或45中任一个序列的核酸序列;
(d)与(a)至(c)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(e)具有(a)至(d)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
4.根据段落1所述的适体,其中所述适体能够特异性结合SARS-CoV-2刺突蛋白的S1亚基的RBD,并且包括:
(a)选自SEQ ID NO:2、4、6、8、9、13、16、17、18、20、21、22、23、24、26、31、34、35、40至46、48或49中任一个序列的核酸序列;
(b)选自SEQ ID NO:4、6、17、18、21或45中任一个序列的核酸序列;
(c)选自SEQ ID NO:2、4、6、8、9、16、17、20、21、22、23、24、31、35、43至45、48或49中任一个序列的核酸序列;
(d)选自SEQ ID NO:4、6、17、21或45中任一个序列的核酸序列;
(e)选自SEQ ID NO:4、8、9或43中任一个序列的核酸序列;
(f)选自SEQ ID NO:4、8或9中任一个序列的核酸序列;
(g)与(a)至(f)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(h)具有(a)至(g)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
5.根据段落4所述的适体,其中所述适体包括:
(a)选自SEQ ID NO:4、8、9、16、21、23、31、43或48中任一个序列的核酸序列;
(b)选自SEQ ID NO:9、21、23、24或31中任一个序列的核酸序列;
(c)选自SEQ ID NO:9、21、23或31中任一个序列的核酸序列;
(d)与(a)至(c)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(e)具有(a)至(d)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
6.根据段落1所述的适体,其中所述适体能够结合SARS-CoV-2刺突蛋白的S1亚基以及SARS和/或MERS中的同源蛋白,其中所述适体包括:
(a)选自SEQ ID NO:1、5、10、11、12、14、19、25、28至30、32、33、36至39中任一个序列的核酸序列;
(b)选自SEQ ID NO:36或38的核酸序列;
(c)与(a)至(b)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(d)具有(a)至(c)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
7.根据段落1所述的适体,其中所述适体包括:
(a)选自SEQ ID NO:129、130、131、132、133或134中任一个序列的核酸序列;
(b)选自SEQ ID NO:135、136、137、138、139、140或141中任一个序列的核酸序列;
(c)选自SEQ ID NO:142、143或144中任一个序列的核酸序列;
(d)选自SEQ ID NO:132、134、140、142或144中任一个序列的核酸序列;
(e)选自SEQ ID NO:134、140和144中任一个序列的核酸序列;或
(f)与(a)至(e)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列。
8.根据段落7所述的适体,其中所述适体包括:
(a)SEQ ID NO:140;或
(b)与SEQ ID NO:140具有至少约85%、90%、95%或99%同一性的核酸序列。
9.根据段落1所述的适体,其中所述适体能够特异性结合SARS-CoV-2刺突蛋白的S2亚基,并且包括:
(a)选自SEQ ID NO:145至192中任一个序列的核酸序列;
(b)选自SEQ ID NO:146、150或171中任一个序列的核酸序列;
(c)选自SEQ ID NO:177、183或191中任一个序列的核酸序列;
(d)选自SEQ ID NO:179、188或190中任一个序列的核酸序列;
(e)与(a)至(d)序列中任一个序列具有至少约85%、90%、95%或以上序列同一性的核酸序列;或
(f)具有(a)至(e)序列中任一个序列的至少约15个连续核苷酸的核酸序列。
10.根据段落9所述的适体,其中所述适体包括:
(a)SEQ ID NO:190;或
(b)与SEQ ID NO:190具有至少约85%、90%、95%或99%同一性的核酸序列。
11.适体对,其包括段落1至8中任一项定义的能够结合SARS-CoV-2刺突蛋白的S1亚基的第一适体,以及段落1至8中任一项定义的能够结合S1亚基的不同或非竞争区域的第二适体或段落9至10中任一项定义的能够结合SARS-CoV-2刺突蛋白的S2亚基的第二适体。
12.根据段落11所述的适体对,其中所述适体包括:
(a)第一适体,其包括选自SEQ ID NO:4、8、9、134、144或140中任一个序列的核酸序列或与SEQ ID NO:4、8、9、134、144或140中任一个序列具有至少约85%、90%、95%或以上序列同一性的序列;和
(b)(i)第二适体,其包括选自SEQ ID NO:4、8、9、134、144或140中任一个序列的核酸序列或与SEQ ID NO:4、8、9、134、144或140中任一个序列具有至少约85%、90%、95%或以上序列同一性的序列,其中所述第二适体与所述第一适体不同;或
(ii)第二适体,其包括选自SEQ ID NO:146、150、171、177、179、183、188、190或191中任一个序列的核酸序列或与SEQ ID NO:146、150、171、177、179、183、188、190或191中任一个序列具有至少约85%、90%、95%或以上序列同一性的序列。
13.根据段落12所述的适体对,其中所述适体包括:
(a)第一和第二适体,其包括分别选自SEQ ID NO:4和146、4和150、4和171、4和177、4和179、4和183、4和188、4和190或4和191的核酸序列;
(b)第一和第二适体,其包括分别选自SEQ ID NO:8和146、8和150、8和171、8和177、8和179、8和183、8和188、8和190或8和191的核酸序列;
(c)第一和第二适体,其包括分别选自SEQ ID NO:9和146、9和150、9和171、9和177、9和179、9和183、9和188、9和190或9和191的核酸序列;
(d)第一和第二适体,其包括分别选自SEQ ID NO:43和146、43和150、43和171、43和177、43和179、43和183、43和188、43和190或43和191的核酸序列;
(e)第一和第二适体,其包括分别选自SEQ ID NO:134和146、134和150、134和171、134和177、134和179、134和183、134和188、134和190或134和191的核酸序列;
(f)第一和第二适体,其包括分别选自SEQ ID NO:144和146、144和150、144和171、144和177、144和179、144和183、144和188、144和190或144和191的核酸序列;
(g)第一和第二适体,其包括分别选自SEQ ID NO:140和146、140和150、140和171、140和177、140和179、140和183、140和188、140和190或140和191的核酸序列;
(h)第一和/或第二适体,其包括与(a)至(g)中任一种适体具有至少约85%、90%、95%或以上同一性的核酸序列;或
(i)第一和/或第二适体,其包括具有(a)至(g)中任一种适体的至少约15个或更多个连续核苷酸的核酸序列。
14.根据段落13所述的适体对,其中所述适体包括:
(a)第一适体,其包括选自SEQ ID NO:140的核酸序列或与SEQ ID NO:140具有至少约85%、90%、95%、99%或以上序列同一性的序列;和
(b)第二适体,其包括选自SEQ ID NO:190的核酸序列或与SEQ ID NO:190具有至少85%、90%、95%、99%或以上序列同一性的序列。
15.根据段落1至14中任一项所述的适体,其中所述适体是DNA适体。
16.一种适体,其与段落1至15中任一项所述的适体竞争结合SARS-CoV-2刺突蛋白。
17.根据段落1至16中任一项所述的适体,其中所述一种或多种适体包括可检测标记,任选地,其中所述可检测标记选自荧光团、纳米颗粒、量子点、酶、放射性同位素、预定义序列部分、生物素、脱硫生物素、硫醇基、氨基、叠氮化物、氨基烯丙基、地高辛、抗体、催化剂、胶体金属颗粒、胶体非金属颗粒、有机聚合物、乳胶颗粒、纳米纤维、纳米管、树状聚合物、蛋白质和脂质体。
18.一种复合物,包括前述任一段所述的一种或多种适体和可检测分子。
19.一种生物传感器、测定板或测试条,包括段落1至17中任一项所述的一种或多种适体。
20.检测样本中SARS-CoV-2的存在、不存在或含量的装置,所述装置包括段落1至17中任一项所述的一种或多种适体,任选地,其中所述装置还包括载体。
21.一种侧流设备,包括段落1至17中任一项所述的一种或多种适体。
22.根据段落21所述的侧流设备,其中所述装置包括:
(a)第一适体,其包括选自SEQ ID NO:140的核酸序列或与SEQ ID NO:140具有至少约85%、90%、95%、99%或以上序列同一性的序列;和
(b)第二适体,其包括选自SEQ ID NO:190的核酸序列或与SEQ ID NO:190具有至少85%、90%、95%、99%或以上序列同一性的序列。
23.根据段落22所述的设备,其中所述第一适体或第二适体与固体载体结合,任选地,其中所述固体载体是测试条。
24.根据段落23所述的设备,其中:
(i)如果所述第一适体与所述固体载体结合,则所述第二适体与可检测标记偶联;或
(ii)如果所述第二适体与所述固体载体结合,则所述第一适体与可检测标记偶联。
25.根据段落24所述的设备,其中所述可检测标记是金或乳胶纳米颗粒。
26.一种功能化电极或生物传感器表面,包括段落1至17中任一项所述的一种或多种适体。
27.根据段落26所述的功能化电极或生物传感器,其中所述功能化电极或生物传感器包括:
(a)包括选自SEQ ID NO:10、20、24、44或134的核酸序列的适体;或
(b)与SEQ ID NO:10、20、24、44或134具有至少约85%、90%、95%、99%或以上序列同一性的序列。
28.根据段落27所述的功能化电极或生物传感器,其中所述功能化电极或生物传感器包括:
(a)包括选自SEQ ID NO:134的核酸序列的适体;或
(b)与SEQ ID NO:134具有至少约85%、90%、95%、99%或以上序列同一性的序列。
29.根据段落27或28所述的功能化电极或生物传感器,其中所述适体固定在所述电极的表面上,任选地,其中所述电极的表面是金。
30.段落1至17中任一项所述的一种或多种适体、段落18所述的复合物、段落19所述的生物传感器或测试条、段落20所述的装置、段落21至25中任一项所述的侧流设备或段落26至29中任一项所述的功能化电极或生物传感器用于检测、富集、分开和/或分离SARS-CoV-2的用途。
31.根据段落30所述的用途,其中在检测样本中SARS-CoV-2的存在、不存在或含量之前,先富集样本中的SARS-CoV-2。
32.一种检测样本中SARS-CoV-2的存在、不存在或含量的方法,所述方法包括:
(i)使样本与段落1至17中任一项所述的适体相互作用;和
(ii)检测SARS-CoV-2的存在、不存在或含量。
33.根据段落32所述的方法,其中所述样本获得自患有或怀疑患有COVID-19的受试者。
34.根据段落33所述的方法,其中所述样本是唾液、血液或鼻拭子。
35.根据段落32至34中任一项所述的方法,其中检测SARS-CoV-2的感染病毒载量。
36.一种用于检测、定量和/或富集SARS-CoV-2的试剂盒,所述试剂盒包括段落1至17中任一项所述的一种或多种适体。
37.根据段落36所述的试剂盒,其中所述试剂盒包括接头、载体和/或可检测分子。
实施例
在下文中,将通过特定实施例的非限制性实例对本发明进行更详细地说明。在实例的实验中,采用无污染的标准试剂和缓冲液。
实例1-适体筛选
适体筛选的靶标蛋白制备
重组的、His标记的SARS-CoV-2/2019-nCoV刺突蛋白S1亚基(SEQ ID NO:118)由北京义翘神州公司提供(SinoBiological;货号40591-V08B1)。His标记的S1亚基的RBD(SEQID NO:120)也由北京义翘神州公司提供(货号40592-VO8H)。
为了质量控制目的,通过紫外光谱和SDS-PAGE分析对该蛋白进行表征。根据制造商的方案,将刺突蛋白固定在不同批次的DynabeadsTMHis-Tag分离和下拉磁珠(英国赛默飞世尔科技公司)上。采用分光光度法测定蛋白负载密度。采用SARS-CoV刺突蛋白的S1亚基和MERS-CoV刺突蛋白的S1亚基(同样由北京义翘神州公司提供)重复该过程。
适体文库和寡核苷酸
适体筛选过程从适体文库(由比利时IDT建立)的合成ssDNA寡核苷酸序列开始。适体文库的核苷酸序列具有以下结构(5'至3'方向):
P1-R-P2,
其中P1是第一引物区,R是随机区(在此情况下长度是40个核苷酸),P2是另一个引物区,其中R或其一部分参与靶标分子结合。
以下修饰引物用于通过PCR扩增低聚物:荧光素(FAM)标记的正向引物(P1),其序列为:5'-/56FAM/CCAGTGTAGACTACTCAATG-3'(SEQ ID NO:114),和PO4-修饰的反向引物(P2),其序列为:5'-/5Phos/GGTTGACCTGTGGATAGTAC-3'(SEQ ID NO:116)。
建立适体筛选参数
进行初步研究,确定针对SARS-CoV-2刺突蛋白S1亚基和单独针对RBD的筛选过程中最合适的筛选缓冲液和所需的过量靶标。将初始适体文库(
Figure SMS_1
aptamer library)稀释到三份适体筛选缓冲液中的每一份中,并在96孔板上等分,使得每个孔包含1.65皮摩尔的缓冲的适体文库。制备S1或RBD固定的Dynabead的浓度梯度,并在单独的96孔板上等分,得到由不同的“倍数过量”靶标(和一排“靶标阴性”对照)组成的七点靶标梯度。还制备了靶标阴性磁珠(未进行任何固定的空白Dynabead)的等效梯度。结合测定在Biomek NX液体处理机器人(Beckman Coulter)上进行。在该结合测定中,将缓冲的适体文库添加到磁珠梯度中,将它们混合并在室温下孵育一小时,使适体结合靶标固定磁珠或结合空白磁珠。孵育后,在96孔磁性板架上分离磁珠,除去未结合的适体。磁珠采用相应的缓冲液洗涤,除去任何弱结合的适体。将磁珠重新悬浮在PCR混合物中,并进行热循环(根据标准的制造商方案),从磁珠中回收结合的适体。这导致结合的适体洗脱和扩增。然后通过qPCR对从每个靶标浓度回收的适体的数量进行定量。比较“回收数据”以确定每份筛选缓冲液中结合靶标固定磁珠和结合空白磁珠的适体数量。基于适体结合靶标负载磁珠与适体结合空白磁珠的比率来选择“最佳的”筛选缓冲液。基于回收的适体数量,还从该测定中选择筛选中使用的靶标数量。对于针对SARS-CoV-2刺突蛋白S1亚基和RBD的适体筛选,最佳缓冲液为50mM MESpH6.2、5mM MgCl2、1mM CaCl2、20mM NaCl、4.5mM KCl、20mM Na2SO4、0.01%(v/v)吐温-20、0.01%(w/v)BSA。在这两种情况下,第一轮筛选选择的过量靶标为50倍。
针对SARS-CoV-2刺突蛋白S1亚基的适体群的体外筛选
筛选过程由越来越严格的筛选条件(如图1所定义)下的几轮迭代筛选组成。在第1轮中,使用初步结合研究中建立的结合条件,将166pmol的初始适体文库与靶标固定磁珠一起孵育。洗涤磁珠,除去松散结合的适体,然后在PCR混合物中洗脱剩余的适体,并如初步结合研究中进行的那样进行扩增。使用AxyPrep Mag PCRClean-up试剂盒(美国AxygenBiosciences)纯化回收的扩增适体文库,并根据制造商的方案在37℃下采用Lambda核酸外切酶(波兰EURx)消化。使用AxyPrep Mag PCR Clean-up试剂盒纯化刚得到的ssDNA,产生纯化和富集的单链DNA文库,用于后续各轮适体筛选。在第2轮(以及随后所有轮次)中,遵循相同的过程,但适体-靶标孵育在越来越严格的条件下进行。图1中定义了该“严格性图(stringency map)”的细节(靶标比率、孵育时间、洗涤等)。在第6轮,引入针对MERS刺突蛋白S1亚基的逆向筛选。在该轮筛选中,将适体文库与MERS刺突蛋白S1亚基衍生的磁珠一起孵育。孵育后,分离MERS磁珠,回收不与MERS蛋白结合的适体,并与负载SARS-CoV-2S1靶标的磁珠一起孵育。图1所示的筛选严格性图给出了逆向筛选步骤的详细信息。随着适体筛选的进行,靶标过量和阳性孵育时间减少,阴性/逆向过量和阴性孵育时间增加。为了提高筛选的严格性,洗涤次数也会增加。
针对SARS-CoV-2刺突蛋白S2亚基的适体群的体外筛选
针对SARS-CoV-2刺突蛋白S2亚基的适体筛选使用图12所描述的筛选条件,按照SARS-CoV-2刺突蛋白S1亚基的适体筛选(如上所述)进行。
实例2-适体群的表征
在适体筛选后,使用生物膜层干涉评估精制的适体群结合相应SARS-CoV-2蛋白的能力。本文所述的实验使用Octet RED384仪器(ForteBio,Pall Life Sciences,美国)基于制造商定义的方案进行。适体群使用生物素化引物(SEQ ID NO:114)在PCR反应中制备。然后按照制造商方案将生物素化的ssDNA固定在链霉抗生物素蛋白包被的生物传感器探针(streptavidin SADip&Read Biosensors,ForteBio,Pall Life Sciences,美国)表面上。在1x“高盐”适体筛选缓冲液(50mM MES pH6.2,5mM MgCl2,1mM CaCl2,220mM NaCl,4.5mMKCl,20mM Na2SO4,0.01%(v/v)吐温-20,0.01%(w/v)BSA)中制备50nM适体群。还在1x“高盐”适体筛选缓冲液中制备靶标蛋白储备液。所有缓冲液/空白/基线的相互作用均在1x“高盐”适体筛选缓冲液中进行,不添加刺突蛋白等。监测固定的适体群与SARS-COV-2、SARS或MERS刺突蛋白S1亚基之间的相互作用(图2)。使用空白传感器探针(没有固定适体)对所有数据进行参考校正,以校正缓冲效应。
克隆
在确认所筛选适体群结合靶标后;使用未修饰的正向和反向引物(SEQ ID NO:114和SEQ ID NO:116)通过PCR扩增回收的适体文库。按照制造商的方案(英国赛默飞世尔科技公司的CloneJET PCR克隆试剂盒)将纯化的dsDNA克隆到pJET1.2/平末端(blunt)克隆载体中,并用于转化大肠杆菌(NEB 5-α大肠杆菌C2987H细胞)的测序菌株,采用质粒特异性引物(pJET正向引物和pJET反向引物(英国赛默飞世尔科技公司CloneJET PCR克隆试剂盒))通过“菌落PCR”对96个阳性转化体/克隆进行了“挑选”和分析。同时,使用适体特异性FAM标记的正向引物和PO4修饰的反向引物,通过“适体PCR”从相同的转化体/克隆产生适体DNA。
单个适体的鉴定
根据上述克隆方案,制备来源于适体池的每种单独适体的单链DNA。然后,使用上述BLI测定,分析每个克隆与来自SARS-CoV-2、SARS、MERS的刺突蛋白S1亚基或来自SARS-CoV-2的RBD蛋白的结合。适体大致分为许多不同的类别;例如,与来自SARS-CoV-2的刺突蛋白S1亚基结合,但不与来自SARS或MERS的S1亚基结合的适体(图3);与来自SARS-CoV-2的刺突蛋白S1亚基结合,但与MERS交叉反应弱的适体(图4);以及与来自SARS-CoV-2的刺突蛋白S1亚基结合,亦与SARS和MERS交叉反应的适体(图5)。所有筛选克隆的DNA序列通过DNA测序和服务公司(英国邓迪大学)对“菌落PCR”产物(如上所述)进行桑格测序(SangerSequencing)确定。使用EBI网络服务器(http://www.ebi.ac.uk/Tools/msa/clustalw2/)提供的网络工具ClustalW对获得的序列数据进行分析和比对。
如上所述,图3至图5包括属于不同类别的适体的代表性实例。下表1示出了所筛选适体(包括与在筛选过程中鉴定的其他适体相比显示出意料之外的改善的结合和/或亲和力的那些适体)的各种性质的概述。
Figure SMS_2
/>
Figure SMS_3
/>
Figure SMS_4
表1说明:
++ 最强结合
+ 中等结合
- 低结合或无明显结合
S1靶向适体的分类使用通过固相合成产生的适体(在适体序列的5'端加入生物素基团)进行。这样得到了更清楚的结合数据,并可对分离的单个适体进行清楚的表征和分类。因此,分析了适体(其序列为通过针对刺突蛋白S1亚基的适体筛选所鉴定的序列)针对各种靶点(包括SARS-CoV-2(RBD和S1亚基)、MERS和SARS)的结合,并将结合分类为最强、中等或低结合(或无明显结合)。基于BLI测定中的信号响应,将适体分为这些类别。与靶标的相互作用响应大于1nm的适体被分类为“强”;~0.5nm被分类为“中等”;小于~0.3nm被分类为“低结合或无明显结合”。
适体与SARS-CoV-2刺突蛋白S1亚基的结合亲和力的测定
根据上述方案,使用BLI测定确定了四种所选适体(适体S1_A3-A(SEQ ID NO:4);适体S1_A6(SEQ ID NO:8);适体S1_A8(SEQ ID NO:9);适体S1_F2(SEQ ID NO:43))的亲和力。将生物素化的适体固定在链霉抗生物素蛋白生物传感器探针上(如上所述),然后监测其与一系列浓度(250nM、125nM、62.5nM、31.25nM、15.63nM、7.81nM、0nM,在1x“高盐”适体筛选缓冲液中稀释)的SARS-CoV-2刺突蛋白的S1的相互作用。KD值使用2:1结合模型,使用ForteBio软件(ForteBio数据分析8.0)计算(图6和图7)。
最小功能适体片段的鉴定
鉴定了几种分离和表征的适体的最小功能适体片段(OptimerTM)。简而言之,通过固相合成(同样加入5′生物素基团)产生了一组代表全长适体不同区域的片段。将这些单个片段中的每一个片段固定在单独的链霉抗生物素蛋白包被的BLI传感器探针上,并使用BLI测定(根据上述方案)监测与缓冲的SARS-CoV-2刺突蛋白S1亚基的相互作用。BLI筛选表明了哪些片段保留了其结合亲和力,哪些片段失去了其结合功能。将这些结合和非结合片段映射到全长适体序列上,以鉴定最小功能片段(OptimerTM)。适体S1_A8(SEQ ID NO:9)和S1_A8_F21(SEQ ID NO:140)的实例数据在图8中给出,清楚地证明了对保留结合SARS-CoV-2蛋白能力的最小适体片段的鉴定。
实例3-针对SARS-CoV-2刺突蛋白S1亚基的分离Optimer结合全刺突蛋白
本文所述的适体已使用代表全病毒表面刺突蛋白部分(SEQ ID NO:117)的重组蛋白进行分离。对于适体的诊断和治疗应用,希望适体和/或最小功能片段Optimer能够结合全三聚体形式的刺突蛋白。例如,任何与三聚体刺突中不可接近的单体区域结合的适体或Optimer可能不能与病毒结合,并且不太可能发挥良好的诊断或治疗作用。使用上述BLI测定,评估了针对SARS-CoV-3刺突蛋白S1亚基的几种分离的Optimer与全三聚体刺突蛋白的结合。简而言之,将示例性Optimer固定在BLI传感器探针上,并评估其与一系列浓度(500nM、166nM、55nM、18.5nM、6.1nM、2nM和0.6nM,在1x“高盐”适体筛选缓冲液中)的全SARS-CoV-2刺突蛋白三聚体结合的能力。图10所示的数据表明,固定的Optimer和刺突蛋白之间存在明显的浓度依赖性相互作用;表明每种适体对全刺突蛋白三聚体具有高亲和力(~20-40nM)。重要的是,每种适体(SEQ ID NO:134、140和144)具有快的结合速率(0-120秒)和慢的解离速率(120-240秒);这对于许多诊断应用来说可能是重要的。
实例4-适体和Optimer结合缓冲唾液中SARS-CoV-2刺突蛋白的S1亚基
为了在简单的即时诊断中使用所选适体;希望适体和Optimer能够识别并结合它们在样本基质中的靶标,这些样本基质应容易得到且只需最少的处理。为了证明这一概念,将适体和相应的Optimer固定在BLI传感器探针上,并评估其在掺入到缓冲唾液样本中时与SARS-CoV-2刺突蛋白S1亚基结合的能力。简而言之;获取来自健康志愿者的唾液样本,以等体积混合,然后用1x“高盐”适体筛选缓冲液缓冲(最终浓度为1x)。配制10%和50%(v/v)唾液的缓冲唾液,掺入SARS-CoV-2刺突蛋白S1亚基(0.5μM)。将掺入SARS-CoV-2刺突蛋白S1亚基的唾液样本与固定的适体或Optimer一起孵育,并使用上述BLI结合测定监测相互作用(图9)。BLI数据表明,固定的适体和Optimer与唾液中SARS-CoV-2刺突蛋白S1亚基之间存在明显的相互作用。这证明了这些适体和Optimer识别和结合患者唾液样本中的病毒的能力;并不需要昂贵或繁琐的样本处理步骤。
所选适体片段(包括显示与S1最强结合和/或与掺入唾液中的刺突S1结合(如上所述)的那些适体片段)的各种性质的概述在下表3中示出:
Figure SMS_5
/>
Figure SMS_6
实例5-S1结合适体特异性结合SARS-CoV-2刺突蛋白的S1亚基(ELONA测定)
在进行夹心分析之前;通常以更简单的测定形式评估任何亲和配体(适体、抗体或其他)的性能。在这种情况下,首先进行间接ELONA测定,以评估SARS-CoV-2S1结合适体的结合和特异性。将来自SARS-Cov-2、SARS和MERS的刺突蛋白的S1亚基分别固定在标准蛋白结合ELISA板(MaxiSorpTM板,
Figure SMS_7
)的各孔中。将一排孔留空(无蛋白质)以允许减去非特异性适体结合的背景值。孵育过夜后,采用1x“高盐”适体筛选缓冲液洗涤孔,除去未结合的蛋白。在封闭板上的剩余位点(采用溶于1x PBS的1%BSA)后,将蛋白固定的孔与全长S1结合适体A3-A、适体A6或适体A8(分别是SEQ ID NO:4、8、9);或最小功能片段A3_F18(SEQ IDNO:134)一起孵育。每种适体在5'端采用生物素基团合成,以允许后续捕获链霉抗生物素蛋白-HRP偶联蛋白。在室温下孵育适体90分钟后;采用1x“高盐”适体筛选缓冲液洗涤孔,除去未结合的适体。然后将孔与strep-HRP(0.2μg/ml,溶于1x PBS)一起孵育,以捕获任何蛋白结合适体上的酶。洗涤孔以除去未结合的Strep-HRP后;将每个孔与底物3,3',5,5'-四甲基联苯胺(TMB)一起孵育,当被HRP裂解时,TMB产生蓝色。(采用1M HCl)终止酶活性,产生黄色产物,这种黄色产物可通过测量450nm处的吸光度进行定量。黄色表明存在Strep-HRP,这进而表明存在与孔或固定蛋白结合的适体。
通过从每个相应孔的数据中减去“无蛋白”对照孔的数据,对吸光度数据进行背景校正;只留下由于适体与固定蛋白结合而产生的响应。将每种适体与来自相应病毒的刺突蛋白的每个S1亚基结合的校正数据进行绘图(图11)。吸光度值≤0表明背景信号高于蛋白结合信号;表明没有适体相互作用。结果表明,每种适体与来自SARS-CoV-2的刺突蛋白的S1亚基相互作用(左柱),但不与来自SARS或MERS的相应蛋白相互作用(分别为中柱和右柱)。这证明了适体的特异性,也表明了它们在间接ELONA中的表现。
实例6-针对SARS-CoV-2刺突蛋白S2亚基的分离Optimer结合来自SARS-CoV-2的全刺突蛋白
本文所述的适体已使用代表全病毒表面刺突蛋白部分(SEQ ID NO:117)的重组蛋白进行分离。具体地,采用包括SEQ ID NO:119的残基Ser686至Pro1213的氨基酸序列分离针对来自SARS-CoV-2刺突蛋白的S2亚基的适体。对于适体的诊断和治疗应用,希望适体能够结合全三聚体形式的刺突蛋白。例如,任何与三聚体刺突中不可接近的单体区域结合的适体可能不能与病毒结合,因此不太可能发挥良好的诊断或治疗作用。使用上述BLI测定,评估了针对SARS-CoV-2刺突蛋白S2亚基(SEQ ID NO:119)的几个分离的适体和Optimer与全三聚体刺突蛋白的结合。简而言之,将示例性Optimer固定在BLI传感器探针上,并评估其与一系列浓度(500nM、166nM、55nM、18.5nM、6.1nM、2nM和0.6nM,在1x“高盐”适体筛选缓冲液中)的全SARS-CoV-2刺突蛋白三聚体结合的能力。图13所示的数据表明,固定的适体和刺突蛋白三聚体之间存在明显的浓度依赖性相互作用;表明每个适体对全刺突蛋白具有高亲和力(~26-82nM)。重要的是,S2_A2_F12:(SEQ ID NO:179)、S2_B1_F12(SEQ ID NO:188)和S2_G1_F21(SEQ ID NO:190)中每个适体都具有快的结合速率(0-120秒)和慢的解离速率(120-240秒);这对于许多诊断应用来说可能是重要的。
性能最佳的S2亚基结合适体及其片段的各种性质的概述在下表5中示出:
SEQ ID NO: 克隆名称 S2 三聚体结合
146 S2_A2 ++
150 S2_B1 ++
171 S2_G1 ++
177 S2_A2_F17 ++ +
179 S2_A2_F12 ++ ++
183 S2_B1_F18 ++ +
188 S2_B1_F12 ++ ++
190 S2_G1_F21 ++ ++
191 S2_G1_F22 ++ +
实例7-针对SARS-CoV-2刺突蛋白S1亚基的分离Optimer结合来自野生型SARS-CoV-2和受关注变体的刺突蛋白的S1区域
本文所述的适体已使用代表来自SARS-CoV-2的全病毒表面刺突蛋白部分(SEQ IDNO:117)的重组蛋白进行分离。对于适体的诊断和治疗应用,希望适体和/或最小功能片段Optimer能够结合来自“原始”野生型SARS-CoV-2和所有主要“受关注变体”的刺突蛋白。例如,基于仅结合SARS-CoV-2的“野生型”,但不识别受关注变体的适体对或Optimer的诊断设备;如果样本取自感染COVID-19变体的个体,则可能会给出“假阴性”检测结果。因此,适体和Optimer必须识别SARS-CoV-2刺突蛋白的所有变体。
采用上述BLI测定,评估了优选的针对SARS-CoV-2刺突蛋白S1亚基的分离OptimerS1_A8_F21(SEQ ID NO:140)与来自“野生型”SARS-CoV-2,以及B.1.1.7变体、D14G变体、B.1.351变体和P.1变体的刺突蛋白S1亚基的结合。简而言之,将示例性Optimer固定在BLI传感器探针上,并评估其与一系列浓度(500nM、166nM、55nM、18.5nM、6.1nM、2nM和0.6nM,在1x“高盐”适体筛选缓冲液中)的来自每个SARS-CoV-2变体的刺突蛋白S1亚基结合的能力。图14所示的数据表明,固定的Optimer与来自每个SARS-CoV-2变体的刺突蛋白S1亚基之间存在明显的浓度依赖性相互作用;表明Optimer以高亲和力(~10-62nM)识别野生型SARS-CoV-2和每个受关注变体。重要的是,Optimer具有快的结合速率(0-120秒)和慢的解离速率(120-240秒);这对于许多诊断应用来说可能是重要的,并且该Optimer识别本文测试的所有变体;这对于可行的诊断产品至关重要。其他受关注变体将在它们出现后,并可以获得其相应的S1亚基蛋白时进行测试。
实例8-针对SARS-CoV-2刺突蛋白S1或S2亚基的分离Optimer结合来自野生型SARS-CoV-2和受关注变体的辐照病毒材料
本文所述的适体已使用代表来自SARS-CoV-2的全病毒表面刺突蛋白部分(SEQ IDNO:117)的重组蛋白进行分离。对于适体的诊断和治疗应用,希望适体和/或最小功能片段Optimer能够结合“原始”野生型SARS-CoV-2和所有主要“受关注变体”。例如,基于仅结合SARS-CoV-2的“野生型”,但不识别受关注变体的适体对或Optimer的诊断设备;如果样本取自感染COVID-19变体的个体,则可能会给出“假阴性”检测结果。因此,适体和Optimer必须识别SARS-CoV-2的所有变体。Optimer识别存在于病毒表面的蛋白相应区域同样重要。
采用上述BLI测定,评估了优选的分别针对SARS-CoV-2刺突蛋白S1和S2亚基的分离Optimer S1_A8_F21(SEQ ID NO:140)与S2_G1_F21(SEQ ID NO:190),与来自“野生型”SARS-CoV-2,以及B.1.1.7变体和B.1.351变体的辐照培养病毒材料的结合。简而言之,将示例性Optimer固定在BLI传感器探针上,并评估其与一系列浓度(2.52e5、1.26e5、6.30e4、3.15e4、1.58e4和7.88e3空斑形成单位(plaque forming unit,pfu)/ml,在1x“高盐”适体筛选缓冲液中)的来自每个SARS-CoV-2变体的辐照病毒材料结合的能力。图15所示的数据表明,固定的Optimer与来自每个SARS-CoV-2变体的刺突蛋白S1亚基之间存在明显的浓度依赖性相互作用;表明Optimer识别野生型SARS-CoV-2和每个受关注变体。重要的是,这两个Optimer都具有快的结合速率(0-120秒)和慢的解离速率(120-240秒);这对于许多诊断应用来说可能是重要的,并且这两个Optimer识别本文测试的所有变体;这对于可行的诊断产品至关重要。其他受关注变体将在它们出现后,并可以获得其辐照病毒材料时进行测试。
实例9-鉴定结合SARS-CoV-2刺突蛋白S1或S2亚基的非竞争性适体对(Optimer夹心ELONA)
因为使用两个亲和配体通常会提高特异性,夹心ELONA测定通常优于使用单一亲和配体的其他测定(例如,直接或间接ELONA)。
在本实例中,鉴定的S1结合适体A3-A(SEQ ID NO:4);或其最小功能片段A3_F18(SEQ ID NO:134)采用5'生物素标签制备。生物素标签用于将适体/Optimer固定在链霉抗生物素蛋白包被的各ELISA板(StreptaWell板,Roche)的所有孔上。在除去未结合的适体并封闭未结合的结合位点后(用1mM生物素,溶于含0.01%(v/v)吐温-20的1x PBS中);将各板与梯度的SARS-CoV-2刺突蛋白三聚体(15.6-1000ng/ml)一起孵育。将每个板上的一排孔留空(无蛋白质)以允许减去非特异性适体结合的背景值。孵育后(室温下90分钟);除去未结合的蛋白,采用1x“高盐”适体筛选缓冲液充分洗涤孔。
然后,将一块(采用S1结合适体A3固定的)ELONA板与固定浓度(0.5μM)的针对SARS-CoV-2刺突蛋白S2亚基的分离适体群(S2_8R池)或全长适体克隆S2_A2(SEQ ID NO:146)、S2_B1(SEQ ID NO:150)和S2_G1(SEQ ID NO:171)一起孵育(图16)。
其他两块ELONA板(一块采用S1结合适体A3固定;另一块采用S1结合Optimer A3_F18固定)与固定浓度(0.5μM)的最小功能片段S2_A2_F17、S2_B1_F18或S2_G1_F22(分别为SEQ ID NO:177、183和191)一起孵育(图17)。
以上列出的三块板孵育(室温下90分钟)后;采用1x“高盐”适体筛选缓冲液洗涤孔,除去未结合的适体。然后将孔与strep HRP(0.2μg/ml,溶于1x PBS中)一起孵育,以捕获任何蛋白结合适体上的酶。洗涤孔以除去未结合的Strep-HRP后;将每个孔与底物3,3',5,5'-四甲基联苯胺(TMB)一起孵育,当被HRP裂解时,TMB产生蓝色。(采用1M HCl)终止酶活性,产生黄色产物,这种黄色产物可通过测量450nm处的吸光度进行定量。黄色表明存在Strep-HRP,这转而表明存在与孔或固定蛋白结合的适体。
通过从每个相应孔的数据中减去“无蛋白”对照孔的数据,对吸光度数据进行背景校正;只留下由于适体与固定蛋白结合而产生的响应。将每种适体/Optimer校正后的蛋白浓度依赖性数据进行绘图。吸光度值≤0表明背景信号高于蛋白结合信号;表明没有适体相互作用。
图16中的结果表明,当一系列浓度的SARS-CoV-2刺突蛋白三聚体被捕获在采用全长S1结合适体A3(SEQ ID NO:4)固定的板上时,每种S2结合适体(S2_A2、S2_B1和S2_G1;分别是SEQ ID NO:146、150和171)能够与其结合并对其进行检测。这表明,这些全长适体中的每一种都可以用于夹心ELONA和类似的诊断平台,例如侧流设备(LFD)。
图17中的结果表明,当一系列浓度的SARS-CoV-2刺突蛋白三聚体被捕获在采用全长S1结合适体A3(SEQ ID NO:4)或最小功能S1结合Optimer A3_F18(SEQ ID NO:134)固定的板上时,每种S2结合Optimer(S2_A2_F17、S2_B1_F18和S2_G1_F22;分别是SEQ ID NO:177、183和191)能够与其结合并对其进行检测。这表明,这些最小功能Optimer中的每一种都可以与全长S1适体或相应的最小功能片段一起用于夹心ELONA。
在这些实例中,已经表明,在夹心ELONA或类似测定中,S1结合适体和Optimer可用作“捕获试剂”,而S2结合适体和Optimer可用作“检测试剂”。预计所述适体和Optimer可以是其他方向,即S2“捕获”而S1“检测”。
实例10-针对SARS-CoV-2刺突蛋白S1或S2亚基的分离Optimer结合简单侧流设备检测形式中来自野生型SARS-CoV-2的辐照病毒材料
侧流设备是简单的检测形式,无需特殊实验室设备即可运行。它们是对大量样本进行简单、快速大规模筛选的优选测定形式。在这种测试形式中,Optimer结合对中的其中一种Optimer固定到“检测线”上,另一个Optimer固定到金纳米颗粒的表面上,并沉积在“结合垫(conjugate pad)”中。当开展测试时,将样本施加到“样本垫(sample pad)”。材料通过毛细管作用沿侧流膜流动。如果样本中存在病毒,则其被捕获到“检测线(test line)”中的固定的Optimer上。Optimer包被的金纳米颗粒是检测颗粒,它们与“检测线”上捕获的病毒结合,发出可视信号。在病毒不存在的情况下,Optimer包被的金纳米颗粒不会捕获到“检测线”上,得到“空白”检测线。“对照线(control line)”用于显示测试运行正常。在这种情况下,“对照线”由固定的与金纳米颗粒上的Optimer互补的“捕获寡核苷酸(captureoligonucleotide)”组成。固定的“捕获寡核苷酸”和金纳米颗粒上的Optimer之间的杂交导致形成“对照线”。
本文所述的适体已使用代表来自SARS-CoV-2的全病毒表面刺突蛋白部分的重组蛋白进行分离。分离了分别针对SARS-CoV-2刺突蛋白的S1和S2亚基的优选的Optimer S1_A8_F21(SEQ ID NO:140)和S2_G1_F21(SEQ ID NO:190)。
金纳米颗粒的制备
在该实例中,针对SARS-CoV-2刺突蛋白S2亚基的优选的分离Optimer S2_G1_F21(SEQ ID NO:190)采用5'硫醇基制备,以使Optimer固定在40nm OD5金纳米颗粒上(英国BBISolutions)。简而言之,将1ml OD5金胶体转移到1.5ml微量离心管中,并以4000x g离心10分钟,以沉淀金纳米颗粒。除去500μl上清液,将沉淀再悬浮在剩余的500μl溶液中,制备OD10纳米颗粒储备液。将0.5mg适体储备液直接施加到1ml OD10金胶体储备液中,并通过移液混合,然后在振荡器(Heidolph,Titramix 100,S/N 544-11200-00-3)上室温孵育1分钟。将25μl 0.5M柠檬酸三钠添加到金/适体溶液中,通过移液轻轻混合,并在室温下再孵育10分钟。将17.5μl 2M氯化钠缓慢(逐滴)加入到适体/金溶液中,并通过移液轻轻混合,然后在室温下在平板振荡器上搅动混合物,再孵育20分钟。将50μl 2M氯化钠缓慢(逐滴)加入到适体/金溶液中,并通过移液轻轻混合,然后在室温下在平板振荡器上搅动混合物,再孵育40分钟。然后将适体偶联的金胶体以4000x g离心15分钟,形成沉淀。小心除去并丢弃上清液,并用500μl含0.05%吐温-20的1x磷酸盐缓冲盐水(PBS)重新悬浮该沉淀。再次将适体/金混合物以4000x g离心15分钟,再次形成沉淀。除去上清液,将沉淀重新悬浮在500μl补充1mM氯化镁的1x PBS中。将适体/金混合物在4000x g下最后离心15分钟沉淀,并将沉淀重悬在333μl金干燥缓冲液(20mM Taps(pH 7.5)、5%蔗糖、3%BSA、1%吐温-20)中,以制备最终的OD15金。使用以下参数设置喷雾等流量分配器(Imagene technologies S/N 120731/108363):喷嘴高度(从结合垫开始)为15mm,在30cm带上的分配速率为0.6μl/ml,喷雾压力为5PSI。通过在60℃下以5mm/c的速度通过干燥通道(Hedinar,S/N 0596109)来干燥喷雾结合垫。所有垫在组装前都存放在包含干燥剂的热密封箔袋中。
衍生硝化纤维素膜的制备
检测线和对照线适体的制备遵循相同的初始程序。优选的S1结合Optimer S1_A8_F21(SEQ ID NO:140)和“捕获寡核苷酸”(SEQ ID NO:193)各自采用5'生物素基团合成。制备每种寡核苷酸的单独混合物,其中包含33.4μM的相应寡核苷酸和1mg/ml的链霉抗生物素蛋白(polystreptavidin,BioTez Berlin Buch Gmbh,货号10312116),例如,用于200μl最终体积的“检测线”或“对照线”储备液;将55.6μl的120μM生物素化寡核苷酸储备液与87.3μl 1x磷酸盐缓冲盐水和57.1μl的3.5mg/ml链霉抗生物素蛋白储备液混合。通过移液混合将各组分合并,并在室温下孵育1小时(无需另外混合)。使用以下参数设置等流量分配器(Imagene技术S/N 120731/108363):“检测线”分配喷嘴为7mm,“对照线”分配喷嘴为13mm。这两条线均以半速(0.05μl/mm)在30cm长的带上分配。对绘制的NC进行标记,指示绘制线的开始和结束,以及沿带长度的任何可能的不恒定绘制。然后,通过在60℃下以10mm/秒的速度通过干燥通道(Hedinar,S/N 0596109)来干燥膜。所有膜在组装前都存放在包含干燥剂的热密封箔袋中。
试条的层压
采用S2适体胶体(BBITMSolutions,货号EM/GC40)制备金结合垫(17mm宽)。从背板(单面粘合剂(Kenosha,KN-PS1060.197,S/N 45253420)取下胶带覆盖物,并将层压机高度设置为从背板底部到NC底部有20mm的间隙。放置NC,“检测线”位于最下面的位置。22mm宽的“接收垫(sink pad)”(Ahlstrom,222级22mm x 100m)靠着背板的顶部边缘放置,从而与NC形成7mm的重叠(见下图)。“结合垫”放置在离背板底部5mm处,以与NC形成2mm的重叠(见下图)。然后,将玻璃纤维“样本垫”(Ahlstrom,8951级12mm x 100m)与背板底部对齐,从而与“结合垫”形成7mm的重叠(见下图)。然后,将该带进行层压,并切割成单独的5mm试条,并组装到标准的单个样本孔外壳中。
运行测试测定
在所示测试中(图18),由6.3x 10^5pfu/ml辐照病毒颗粒的储备母液,在萃取缓冲液(如上所述)中制备一定浓度(1x 10^5、5x 10^4、2.5x 10^4、1.25x 10^4、6.1x 10^3和3x10^3pfu/ml;以及不含病毒材料的阴性对照样本)的系列稀释的病毒材料。将稀释系列中的每个样本(80μl)移取到单独的设备上。然后,测试运行10分钟。在此时间之后的任何读数均被归类为无效,并确保在运行时间内形成对照线。
图18中的结果清楚地显示了每个测试(包括阴性对照,“neg(阴性)”)中存在“对照线”(上条带),表明所有测试都成功运行。“检测线”(下条带)显示出明显的浓度依赖性响应。3x 10^3测试中出现假条带,表明检测下限在~1-5x 10^3pfu/ml范围内。
运行测试测定–临床样本
采集样本前,要求捐献者轻轻擤鼻涕,然后用无菌拭子(Miraclean,无菌泡沫头,93050L)轻轻擦拭前鼻腔(每个鼻孔约转5下)。将拭子立即置于包含400μl萃取缓冲液(1MNaCl、300mM Tris、0.1%吐温-20、0.2%BSA、1mM MgCl2、0.05% NaN3 pH 8.5)的萃取管中,并来回转动10次。从萃取管中取出拭子时,轻轻挤压拭子,以最大限度地提高样本回收率。将萃取管上的盖子盖好,然后倒置萃取管约5秒,以使样本汇集到滴管喷嘴内的过滤器中。然后轻轻挤压瓶子,将3滴样本缓慢加入到侧流设备的样本孔中。注意确保在应用最初的10秒内将样本放入装置中。如果未运行,则添加第四滴。然后,检测运行10分钟。在此时间之后的任何读数均被归类为无效,并确保在运行时间内形成对照线。
读者应注意与此说明书同时提交、或在本说明书之前提交的与本申请有关的、可供公众查阅的所有论文和文件,所有这些论文和文件均通过引用并入本文。
序列表
<110> 适体诊断有限公司
<120> 针对SARS-CoV-2的适体
<130> P050251WO
<140> GB2009351.4
<141> 2020-06-18
<140> GB2017437.1
<141> 2020-11-04
<140> GB2105379.8
<141> 2021-04-15
<160> 193
<170> PatentIn version 3.5
<210> 1
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A1-A (S1_A0
<400> 1
ccagtgtaga ctactcaatg ccgatgggtc gggtgggtgg gtaggcattg atcgctcctt 60
ccgtactatc cacaggtcaa cc 82
<210> 2
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A1-B (S1_A1-B)
<400> 2
ccagtgtaga ctactcaatg cggctgtgtg acttgacctc tggatatggg agggagggcg 60
ggtactatcc acaggtcaac c 81
<210> 3
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A2 (S1_A2)
<400> 3
ccagtgtaga ctactcaatg cttcggcgct cctaatttta tcccctagat tcatattttc 60
cgtactatcc acaggtcaac c 81
<210> 4
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3-A (S1_A3-A)
<400> 4
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
tgtactatcc acaggtcaac c 81
<210> 5
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3-B (S1_A3-B)
<400> 5
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcgctcctt 60
tcgtactatc cacaggtcaa cc 82
<210> 6
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A4 (S1_A4)
<400> 6
ccagtgtaga ctactcaatg cgtgggaagg gtgggcggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 7
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A5 (S1_A5)
<400> 7
ccagtgtaga ctactcaatg cggtgactgc tgagatagac agagtccgag gaccgtttaa 60
agtactatcc acaggtcaac c 81
<210> 8
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A6 (S1_A6)
<400> 8
ccagtgtaga ctactcaatg ctgttatgac ttgaccttgg gttatgggtt tgggcgggag 60
ggtactatcc acaggtcaac c 81
<210> 9
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8)
<400> 9
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggtc 60
gggtactatc cacaggtcaa cc 82
<210> 10
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A9 (S1_A9)
<400> 10
ccagtgtaga cttacacctg cagtgttcac gagggccggc ggtatatggg cggttgatac 60
gagtactatc cacaggtcaa cc 82
<210> 11
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A12 (S1_A12)
<400> 11
ccagtgtaga ctactcaatg ccgtgtggtg accttgatcc tgtggtatat gggtgggagg 60
ggcgggtact atccacaggt caacc 85
<210> 12
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B1 (S1_B1)
<400> 12
ccagtgtaga ctactcaatg ccgatgggtc gggtgggtgg gtaggcattg atcgctcctc 60
agtactatcc acaggtcaac c 81
<210> 13
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B3 (S1_B3)
<400> 13
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg attcctcctt 60
tcgtactatc cacaggtcaa cc 82
<210> 14
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B4 (S1_B4)
<400> 14
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggag 60
ggtactatcc acaggtcaac c 81
<210> 15
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B8 (S1_B8)
<400> 15
ccagtgtaga ctactcaatg ctgagatgac ttgatcctgt cgtagatggg gggaaggtcg 60
ggtactatcc acaggtcaac c 81
<210> 16
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B9 (S1_B9)
<400> 16
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggcg 60
ggtactatcc acaggtcaac c 81
<210> 17
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B-11A (S1_B11-A)
<400> 17
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctt ggattatggg tttgggcggg 60
agggtactat ccacaggtca acc 83
<210> 18
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 B12-B (S1_B12-B)
<400> 18
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggat 60
gggtactatc cacaggtcaa cc 82
<210> 19
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C1-A (S1_C1-A)
<400> 19
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatttggg tgggaggggc 60
gggtactatc cacaggtcaa cc 82
<210> 20
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C1-B (S1_C1-B)
<400> 20
ccagtgtaga ctactcaatg ccgcttctcg accgcccctt gttttggttc ttttgtccgt 60
agtactatcc acaggtcaac c 81
<210> 21
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C2 (S1_C2)
<400> 21
ccagtgtaga ctactcaatg cggctgtgtg acttgacctc tggatatggg tgggagggat 60
gggtactatc cacaggtcaa cc 82
<210> 22
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C3-A (S1_C3-A)
<400> 22
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggcatatggg tgggagggcg 60
ggtactatcc acaggtcaac c 81
<210> 23
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C3-B (S1_C3-B)
<400> 23
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcgctcctt 60
ccgtactatc cacaggtcaa cc 82
<210> 24
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C4 (S1_C4)
<400> 24
ccagtgtaga ctactcaatg ctactgattc atctgccgaa tccaaacccg accagtccac 60
ggtactatcc acaggtcaac c 81
<210> 25
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C8 (S1_C8)
<400> 25
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcattcctt 60
tcgtactatc cacaggtcaa cc 82
<210> 26
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C9 (S1_C9)
<220>
<221> misc_feature
<222> (44)..(44)
<223> n 是 a, c, g, 或 t
<400> 26
ccagtgtaga ctactcaatg cgtgggtaag ggtgggtggg agcnttgata actcggagga 60
gcgtactatc cacaggtcaa cc 82
<210> 27
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C10 (S1_C10)
<400> 27
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgc gggatatggg tggcattgag 60
ggtactatcc acaggtcaac c 81
<210> 28
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C11 (S1_C11)
<400> 28
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag atgaatccag 60
tagtactatc cacaggtcaa cc 82
<210> 29
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 C12 (S1_C12)
<400> 29
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 30
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D1 (S1_D1)
<400> 30
ccagtgtaga ctactcaatg cattcctttt gctacctata ttccgtctcc agcataatcc 60
cgtactatcc acaggtcaac c 81
<210> 31
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D2 (S1_D2)
<400> 31
ccagtgtaga ctactcaatg ctaggtccgt gggatgggtg ggggggagga ccagccagcg 60
agtactatcc acaggtcaac c 81
<210> 32
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D4 (S1_D4)
<400> 32
ccagtgtaga ctactcaatg cggcttcggg agggggggcg ggtaaaaagc ccattgccct 60
agtactatcc acaggtcaac c 81
<210> 33
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D6 (S1_D6)
<400> 33
ccagtgtaga ctactcaatg ctactgactc atctgccgaa tccaaacccg accagtccac 60
ggtactatcc acaggtcaac c 81
<210> 34
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D8 (S1_D8)
<400> 34
cagtgtaaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag atgaatcagt 60
agtactatcc acaggtcaac c 81
<210> 35
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D10-A (S1_D10-A)
<220>
<221> misc_feature
<222> (47)..(47)
<223> n 是 a, c, g, 或 t
<400> 35
ccagtgtaga ctactcaatg cggctgtgtg acttgacctc tggatanggg agggagggcg 60
ggtactatcc acaggtcaac c 81
<210> 36
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 D11-B (S1_D11-B)
<400> 36
ccagtgtaga ctactcaatg ccggccggga gggaggggtg ggtaaagccg cgcaacatat 60
agtactatcc acaggtcaac c 81
<210> 37
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 E2 (S1_E2)
<400> 37
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctc tggatatggg tgggaggggc 60
gggtactatc cacaggtcaa cc 82
<210> 38
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 E3 (S1_E3)
<400> 38
ccagtgtaga ctactcaatg ccgatgggtc gggtgggtgg gtaggcattg atcgctcctc 60
cgtactatcc acaggtcaac c 81
<210> 39
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 E5 (S1_E5)
<400> 39
ccagtgtaga ctactcaatg ccacctcctt ttccgtttct tgtatcatgc tactatcctg 60
tgtactatcc acaggtcaac c 81
<210> 40
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 E6 (S1_E6)
<400> 40
ccagtgtaga ctactcaatg cccagtggcg agcgactttt tatgtaagaa catcgatttt 60
ccatggtact atccacaggt caacc 85
<210> 41
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 E9 (S1_E9)
<400> 41
ccagtgtaga ctactcaatg cggcttcgag agggggggcg ggtaaaaagt ccattgccct 60
agtactatcc acaggtcaac c 81
<210> 42
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 E10 (S1_E10)
<400> 42
ccagtgtaga ctactcaatg ctgtgttgac ttgaccttgg attatgggtt tgggcgggag 60
ggtactatcc acaggtcaac c 81
<210> 43
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F2 (S1_F2)
<400> 43
ccagtgtaga ctactcaatg ctgcgttgac ttgatcctgt ggtatatggg tgggagggtc 60
gggtactatc cacaggtcaa cc 82
<210> 44
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F3-A (S1_F3-A)
<400> 44
ccagtgtaga ctactcaatg cggtatgaat atgatcggcc ctatcccttc agctattccg 60
ggtactatcc acaggtcaac c 81
<210> 45
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F3-B (S1_F3-B)
<400> 45
ccagtgtaga ctactcaatg cgtgggatgg gtgggtggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 46
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F5 (S1_F5)
<400> 46
ccagtgtaga ctactcaatg cgtgtggtaa ccttgacctt ggattatggg tttgggcggg 60
cgggtactat ccacaggtca acc 83
<210> 47
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F7 (S1_F7)
<400> 47
ccagtgtaga ctactcaatg cccgccctcc ctcccatatc cagaggtcaa ggtcaccaca 60
cccataacgc cgtactatcc acaggtcaac c 91
<210> 48
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F11 (S1_F11)
<400> 48
ccagtgtaga ctactcaatg cgtgggaagg gtgggcggga gcattgataa cttcggagga 60
gcgtactatc cacaggtcaa cc 82
<210> 49
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 F12 (S1_F12)
<400> 49
ccagtgtaga ctactcaatg cgtgggaagg gagggcggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 50
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 G4 (S1_G4)
<400> 50
ccagtgtaga ctactcaatg ccgcattact agaatcctgt ggtatatggg tgggaggggc 60
gggtactatc cacaggtcaa cc 82
<210> 51
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 G5 (S1_G5)
<400> 51
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctt tggatatgga agggagggtg 60
ggtactatcc acaggtcaac c 81
<210> 52
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 G6 (S1_G6)
<400> 52
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggaggggc 60
gggtactatc cacaggtcaa cc 82
<210> 53
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 H12 (S1_H12)
<400> 53
tgcatagtct cagctgccgt ggacaatcga tgttcttgga gggtactatc cacaggtcaa 60
cc 62
<210> 54
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A1 (RBD_A1)
<400> 54
ccagtgtaga ctactcaatg ctgtgttgac ttgaccttgg attatgggtt tgggcgggcg 60
ggtactatcc acaggtcaac c 81
<210> 55
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A2 (RBD_A2)
<400> 55
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
agtactatcc acaggtcaac c 81
<210> 56
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A4 (RBD_A4)
<400> 56
ccagtgtaga ctactcaatg cgcattcgtg ttcctttatt ttttgttttt ccttcgctct 60
cgtactatcc acaggtcaac c 81
<210> 57
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A5 (RBD_A5)
<400> 57
ccagtgtaga ctactcaatg cgtgggatgg gtgggtggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 58
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A6 (RBD_A6)
<400> 58
ccagtgtaga ctactcaatg cggctgtgtg gcttgacctc tggatatggg tgggagggat 60
gggtactatc cacaggtcaa cc 82
<210> 59
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A7 (RBD_A7)
<400> 59
ccagtgtaga ctactcaatg cggcttcggg agggggggcg ggtaaaaagc ccattgccct 60
agtactatcc acaggtcaac c 81
<210> 60
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A8 (RBD_A8)
<400> 60
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 61
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A9 (RBD_A9)
<400> 61
ccagtgtaga ctactcaatg cggggaaagg agggcgggag cattgatagc tcggaggaga 60
gtactatcca caggtcaacc 80
<210> 62
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A10 (RBD_A10)
<400> 62
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggag 60
ggtactatcc acaggtcaac c 81
<210> 63
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 A12-B (RBD_A12-B)
<400> 63
ccagtgtaga ctactcaatg ccgatgggtc gggcgggtgg gtaggcattg atcgctcctc 60
cgtactatcc acaggtcaac c 81
<210> 64
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B1 (RBD_B1)
<400> 64
ccagtgtaga ctactcaatg cgtgggaagg gtggggggga gcttgataac tcgcaggaga 60
gtactatcca caggtcaacc 80
<210> 65
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B2 (RBD_B2)
<400> 65
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
tgtactatcc acaggtcaac c 81
<210> 66
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B3 (RBD_B3)
<400> 66
ccagtgtaga ctactcaatg cgtgggaagg gtgggcggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 67
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B4-A (RBD_B4-A)
<400> 67
ccagtgtaga ctactcaatg ccgatgggtc gggtgggtgg gtaggcattg atcgctcctc 60
cgtactatcc acaggtcaac c 81
<210> 68
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B4-5 (RBD_B4-B)
<400> 68
ccagtgtaga ctactcaatg cagggcgggg gggagggtat tgcattgctt aatcgagggt 60
agtactatcc acaggtcaac c 81
<210> 69
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B6-B (RBD_B6-B)
<400> 69
ccagtgtaga ctactcaatg ccgcattact agaatcctgt ggtatatggg tgggaggggc 60
gggtactatc cacaggtcaa cc 82
<210> 70
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B10 (RBD_B10)
<400> 70
ccagtgtaga ctactcaatg cgtggtatat tgatcctgtg cattgataat gcgaaggatg 60
gtactatcca caggtcaacc 80
<210> 71
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 B12 (RBD_B12)
<400> 71
ccagtgtaga ctactcaatg ccgtgtggtg accttgatcc tgtggtatat gggtgggagg 60
gagggtacta tccacaggtc aacc 84
<210> 72
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 C1 (RBD_C1)
<400> 72
ccagtgtaga ctactcaatg cgtgggaagg gtgggcggga gcattgataa ctcggaggag 60
agtactatcc acaggtcaac c 81
<210> 73
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 C7-A (RBD_C7-A)
<400> 73
ccagtgtaga ctactcaatg ccgatgggtc gggtgggtgg gtaggcattg gtcgctcctc 60
cgtactatcc acaggtcaac c 81
<210> 74
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 C7-B (RBD_C7-B)
<400> 74
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctc tggatatggg tgggagggag 60
ggtactatcc acaggtcaac c 81
<210> 75
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 C8-A (RBD_C8-A)
<400> 75
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgatag ctcggaggag 60
agtactatcc acaggtcaac c 81
<210> 76
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 C11-B (RBD_C11-B)
<400> 76
ccagtgtaga ctactcaatg cgttaggtga ccttgacctc cggatatggg agggagggcg 60
ggtactatcc acaggtcaac c 81
<210> 77
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D1 (RBD_D1)
<400> 77
ccagtgtaga ctactcaatg cacctagtgc ccgctattca caataattac tactatctcg 60
tgtactatcc acaggtcaac c 81
<210> 78
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D2 (RBD_D2)
<400> 78
ccagtgtaga ctactcaatg ctaggtgtgg tgaccttgac ctctggatac gggtgggagg 60
ggcgggtact atccacaggt caacc 85
<210> 79
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D3 (RBD_D3)
<400> 79
ccagtgtaga ctactcaatg cgtgggaagg gtgggcggga gcattgataa ctcggagggg 60
cgtactatcc acaggtcaac c 81
<210> 80
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D4 (RBD_D4)
<400> 80
ccagtgtaga ctactcaatg cggcctcggg agggggggcg ggtaaaaggc ccattgccct 60
agtactatcc acaggtcaac c 81
<210> 81
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D5 (RBD_D5)
<400> 81
ccagtgtaga ctactcaatg cgtgggatgg gtgggtggga gcattgataa ctcggaggag 60
agtactatcc acaggtcaac c 81
<210> 82
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D7 (RBD_D7)
<400> 82
ccagtgtaga ctactcaatg ccgtggtggt gaccttgatc ctgtggtata tgggtgggag 60
gggcgggtac tatccacagg tcaacc 86
<210> 83
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D8 (RBD_D8)
<400> 83
ccagtgtaga ctactcaatg cagggtggga gggagggtat tgcattgcct aatcggggag 60
agtactatcc acaggtcaac c 81
<210> 84
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D9 (RBD_D9)
<400> 84
ccagtgtaga ctactcaatg ccgtgtggtg accttgacct tggattatgg gtttgggcgg 60
gagggtacta tccacaggtc aacc 84
<210> 85
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D10 (RBD_D10)
<400> 85
ccagtgtaga ctactcaatg cagggtggga gggaagggag tgcattgcct aatcggggca 60
gagtactatc cacaggtcaa cc 82
<210> 86
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D12-A (RBD_D12-A)
<400> 86
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggat 60
gggtactatc cacaggtcaa cc 82
<210> 87
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 D12-B (RBD_D12-B)
<400> 87
ccagtgtaga ctactcaatg ccgtgtggtg accttgatcc tgtggtatat gggtgggggg 60
gagggtacta tccacaggtc aacc 84
<210> 88
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 E1 (RBD_E1)
<400> 88
ccagtgtaga ctactcaatg cggcttcggg agggggggcg ggtaaaaagt ccattgccct 60
agtactatcc acaggtcaac c 81
<210> 89
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 E3 (RBD_E3)
<400> 89
ccagtgtaga ctactcaatg cgtggggggg gtgggtggga gcattgataa gtcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 90
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 E5 (RBD_E5)
<400> 90
ccagtgtaga ctactcaatg cgtgggatgg gtgggtggga gcattgatag ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 91
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 E6 (RBD_E6)
<400> 91
ccagtgtaga ctactcaatg cgtgggatgg gtggggggga gcattgataa ctcgggggag 60
cgtactatcc acaggtcaac c 81
<210> 92
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 E8-B (RBD_E8-B)
<400> 92
ccagtgtaga ctactcaatg ccgatgggtt gggggggtgg gtaggcattg atcgctcctc 60
cgtactatcc acaggtcaac c 81
<210> 93
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 E11 (RBD_E11)
<400> 93
ccagtgtaga ctactcaatg cagggtggga gggagggtat tgcattgcct aatcgagggg 60
agtactatcc acaggtcaac c 81
<210> 94
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 F5 (RBD_F5)
<400> 94
ccagtgtaga ctactcaatg ccgtgtggtg accttgaccc tgtggtatat gggtgggagg 60
ggtgggtact atccacaggt caacc 85
<210> 95
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 F12 (RBD_F12)
<400> 95
ccagtgtaga ctactcaatg ctagggcggg agggagggta tttagcattt acacgttaga 60
tagtactatc cacaggtcaa cc 82
<210> 96
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G1-A (RBD_G1-A)
<400> 96
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ccctgatagt 60
actatccaca ggtcaacc 78
<210> 97
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G1-B (RBD_G1-B)
<400> 97
ccagtgtaga ctactcaatg ccgatgggtt ggggggtggg taggcattga tcgctccttt 60
cgtactatcc acaggtcaac c 81
<210> 98
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G2 (RBD_G2)
<400> 98
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctt ggattatggg tttgggcggg 60
cgggtactat ccacaggtca acc 83
<210> 99
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G9-A (RBD_G9-A)
<400> 99
ccagtgtaga ctactcaatg cgagggatgg gtgggtggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 100
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G9-B (RBD_G9-B)
<400> 100
ccagtgtaga ctactcaatg ctgtgttgac ttgaccttgg attatgggtt tgggcgggtg 60
ggtactatcc acaggtcaac c 81
<210> 101
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G10-B (RBD_G10-B)
<400> 101
ccagtgtaga ctactcaatg cggcttcggg agggggggcg ggtaaaaagc ccattaccct 60
agtactatcc acaggtcaac c 81
<210> 102
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G11 (RBD_G11)
<400> 102
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcgtaggag 60
agtactatcc acaggtcaac c 81
<210> 103
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 G12-B (RBD_G12-B)
<400> 103
ccagtgtaga ctactcaatg cggctgtgtg acttgacctc tggatatggg tgggaggggg 60
ggtactatcc acaggtcaac c 81
<210> 104
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H1 (RBD_H1)
<400> 104
ccagtgtaga ctactcaatg cagggtggga gggagggtat tgcattgcct aatcgaggag 60
agtactatcc acaggtcaac c 81
<210> 105
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H2 (RBD_H2)
<400> 105
ccagtgtaga ctactcaatg cggggggggg ggggggggga ggattgataa cggggaggag 60
ggtactatac cgggtcccat 80
<210> 106
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H4 (RBD_H4)
<400> 106
ccaggtagac tactcaatgc gtgggaaggg tgggcgggag catgataact cggaggagag 60
tactatccac aggtcacgc 79
<210> 107
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H5 (RBD_H5)
<400> 107
ccagtgtaga ctactcaatg cgtgtggtga ccttgaaatg atgatatggg tgggaggggc 60
gtactatcca gaggtcaacc 80
<210> 108
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H6-A (RBD_H6-A)
<400> 108
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcgctcctt 60
tcgtactatc cacaggtcaa cc 82
<210> 109
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H6-B (RBD_H6-B)
<400> 109
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggaaggat 60
gggtactatc cacaggtcaa cc 82
<210> 110
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H7-A (RBD_H7-A)
<400> 110
ccagtgtaga ctactcaatg ccgtgtggtg accttgactc tgtggtatat gggtgggagg 60
ggcgggtact atccacaggt caacc 85
<210> 111
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H7-B (RBD_H7-B)
<400> 111
ccagtgtaga ctactcaatg cggctgtgtg acttgacctc tggatatggg tgggagggat 60
gggtactatc cacaggtcaa cc 82
<210> 112
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H8 (RBD_H8)
<400> 112
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctt ggattatggg tttgggcggg 60
agggtactat ccacaggtca acc 83
<210> 113
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> RBD 适体 H9 (RBD_H9)
<400> 113
ccagtgtaga ctactcaatg cccgtattct ctagatttat gcttatccat cttcttccta 60
agtactatcc acaggtcaac c 81
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 第一引物区 (P1)
<400> 114
ccagtgtaga ctactcaatg 20
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 第二引物区 (P2)
<400> 115
gtactatcca caggtcaacc 20
<210> 116
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向的第二引物区 (P2)
<400> 116
ggttgacctg tggatagtac 20
<210> 117
<211> 1273
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV-2刺突蛋白氨基酸序列 (P0DTC2, UniProtKB
version 1)
<400> 117
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 118
<211> 670
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV-2 刺突蛋白 S1 亚基氨基酸序列 (P0DTC2,
Val16- Arg685, UniProtKB version 1)
<400> 118
Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser
1 5 10 15
Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val
20 25 30
Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr
35 40 45
Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe
50 55 60
Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr
65 70 75 80
Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp
85 90 95
Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val
100 105 110
Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val
115 120 125
Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val
130 135 140
Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe
145 150 155 160
Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu
165 170 175
Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His
180 185 190
Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu
195 200 205
Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln
210 215 220
Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser
225 230 235 240
Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln
245 250 255
Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp
260 265 270
Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu
275 280 285
Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg
290 295 300
Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu
305 310 315 320
Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr
325 330 335
Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val
340 345 350
Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser
355 360 365
Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser
370 375 380
Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr
385 390 395 400
Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly
405 410 415
Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly
420 425 430
Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro
435 440 445
Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro
450 455 460
Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr
465 470 475 480
Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val
485 490 495
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro
500 505 510
Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe
515 520 525
Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe
530 535 540
Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala
545 550 555 560
Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser
565 570 575
Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
580 585 590
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala
595 600 605
Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly
610 615 620
Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His
625 630 635 640
Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys
645 650 655
Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
<210> 119
<211> 588
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV-2 刺突蛋白 S2 亚基氨基酸序列 (P0DTC2,
Ser686- Thr1273, UniProtKB version 1)
<400> 119
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
1 5 10 15
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
20 25 30
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
35 40 45
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
50 55 60
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
65 70 75 80
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
85 90 95
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
100 105 110
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
115 120 125
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
130 135 140
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
145 150 155 160
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
165 170 175
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
180 185 190
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
195 200 205
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
210 215 220
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
225 230 235 240
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
245 250 255
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
260 265 270
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
275 280 285
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
290 295 300
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
305 310 315 320
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
325 330 335
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
340 345 350
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
355 360 365
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
370 375 380
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
385 390 395 400
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
405 410 415
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
420 425 430
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
435 440 445
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys
450 455 460
Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp
465 470 475 480
Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
485 490 495
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu
500 505 510
Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
515 520 525
Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
530 535 540
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
545 550 555 560
Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser
565 570 575
Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
580 585
<210> 120
<211> 223
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV-2 刺突蛋白受体结合域 (RBD) 氨基酸
序列 (P0DTC2, Arg319- Phe541, UniProtKB version 1)
<400> 120
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
1 5 10 15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
20 25 30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
35 40 45
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
50 55 60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65 70 75 80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
85 90 95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
100 105 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
115 120 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
130 135 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145 150 155 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
165 170 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
180 185 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
195 200 205
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
210 215 220
<210> 121
<211> 1255
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV 刺突蛋白全序列氨基酸序列 (P59594,
UniProtKB version 1)
<400> 121
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1 5 10 15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
20 25 30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
35 40 45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
50 55 60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65 70 75 80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
85 90 95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
100 105 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
115 120 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
130 135 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145 150 155 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
165 170 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
180 185 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
195 200 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
210 215 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225 230 235 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
245 250 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
275 280 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
325 330 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
420 425 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
435 440 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
450 455 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465 470 475 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
530 535 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545 550 555 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
580 585 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
610 615 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
660 665 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
675 680 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
690 695 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705 710 715 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
725 730 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
740 745 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
755 760 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
770 775 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785 790 795 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
805 810 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
820 825 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
835 840 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
850 855 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865 870 875 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
885 890 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
900 905 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
915 920 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
930 935 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945 950 955 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
965 970 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
980 985 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
995 1000 1005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1010 1015 1020
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala
1025 1030 1035
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln
1040 1045 1050
Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys
1055 1060 1065
Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser
1070 1075 1080
Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr
1085 1090 1095
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1100 1105 1110
Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1115 1120 1125
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1130 1135 1140
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1145 1150 1155
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1160 1165 1170
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1175 1180 1185
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile
1190 1195 1200
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys
1205 1210 1215
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly
1220 1225 1230
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1235 1240 1245
Gly Val Lys Leu His Tyr Thr
1250 1255
<210> 122
<211> 667
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV 刺突蛋白 S1亚基氨基酸序列 (P59594,
Met1-Arg667, UniProtKB version 1)
<400> 122
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1 5 10 15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
20 25 30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
35 40 45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
50 55 60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65 70 75 80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
85 90 95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
100 105 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
115 120 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
130 135 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145 150 155 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
165 170 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
180 185 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
195 200 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
210 215 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225 230 235 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
245 250 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
275 280 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
325 330 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
420 425 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
435 440 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
450 455 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465 470 475 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
530 535 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545 550 555 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
580 585 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
610 615 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg
660 665
<210> 123
<211> 588
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV 刺突蛋白S2 亚基氨基酸序列 (P59594,
Ser668- Thr1255, UniProtKB version 1)
<400> 123
Ser Thr Ser Gln Lys Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala
1 5 10 15
Asp Ser Ser Ile Ala Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn
20 25 30
Phe Ser Ile Ser Ile Thr Thr Glu Val Met Pro Val Ser Met Ala Lys
35 40 45
Thr Ser Val Asp Cys Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
50 55 60
Ala Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
65 70 75 80
Ala Leu Ser Gly Ile Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val
85 90 95
Phe Ala Gln Val Lys Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe
100 105 110
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr
115 120 125
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
130 135 140
Asp Ala Gly Phe Met Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn
145 150 155 160
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
165 170 175
Pro Pro Leu Leu Thr Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu
180 185 190
Val Ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala
195 200 205
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
210 215 220
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn
225 230 235 240
Gln Phe Asn Lys Ala Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr
245 250 255
Ser Thr Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
260 265 270
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
275 280 285
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
290 295 300
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
305 310 315 320
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
325 330 335
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
340 345 350
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
355 360 365
Gln Ala Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
370 375 380
Ser Gln Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly
385 390 395 400
Lys Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser
405 410 415
Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr Thr
420 425 430
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Ile
435 440 445
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys
450 455 460
Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp
465 470 475 480
Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
485 490 495
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu
500 505 510
Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
515 520 525
Trp Tyr Val Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
530 535 540
Val Thr Ile Leu Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
545 550 555 560
Gly Ala Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser
565 570 575
Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
580 585
<210> 124
<211> 222
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV 刺突蛋白受体结合域 (RBD) 氨基酸
序列 (P59594, Arg306- Phe527, UniProtKB version 1)
<400> 124
Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr Asn
1 5 10 15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val
20 25 30
Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser
35 40 45
Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val
50 55 60
Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp
65 70 75 80
Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly Gln
85 90 95
Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met
100 105 110
Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser Thr
115 120 125
Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu Arg
130 135 140
Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly Lys
145 150 155 160
Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp Tyr
165 170 175
Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val Val
180 185 190
Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly Pro
195 200 205
Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe
210 215 220
<210> 125
<211> 1353
<212> PRT
<213> 人工序列
<220>
<223> MERS-CoV 刺突蛋白全序列氨基酸序列 (K9N5Q8,
UniProtKB version 1)
<400> 125
Met Ile His Ser Val Phe Leu Leu Met Phe Leu Leu Thr Pro Thr Glu
1 5 10 15
Ser Tyr Val Asp Val Gly Pro Asp Ser Val Lys Ser Ala Cys Ile Glu
20 25 30
Val Asp Ile Gln Gln Thr Phe Phe Asp Lys Thr Trp Pro Arg Pro Ile
35 40 45
Asp Val Ser Lys Ala Asp Gly Ile Ile Tyr Pro Gln Gly Arg Thr Tyr
50 55 60
Ser Asn Ile Thr Ile Thr Tyr Gln Gly Leu Phe Pro Tyr Gln Gly Asp
65 70 75 80
His Gly Asp Met Tyr Val Tyr Ser Ala Gly His Ala Thr Gly Thr Thr
85 90 95
Pro Gln Lys Leu Phe Val Ala Asn Tyr Ser Gln Asp Val Lys Gln Phe
100 105 110
Ala Asn Gly Phe Val Val Arg Ile Gly Ala Ala Ala Asn Ser Thr Gly
115 120 125
Thr Val Ile Ile Ser Pro Ser Thr Ser Ala Thr Ile Arg Lys Ile Tyr
130 135 140
Pro Ala Phe Met Leu Gly Ser Ser Val Gly Asn Phe Ser Asp Gly Lys
145 150 155 160
Met Gly Arg Phe Phe Asn His Thr Leu Val Leu Leu Pro Asp Gly Cys
165 170 175
Gly Thr Leu Leu Arg Ala Phe Tyr Cys Ile Leu Glu Pro Arg Ser Gly
180 185 190
Asn His Cys Pro Ala Gly Asn Ser Tyr Thr Ser Phe Ala Thr Tyr His
195 200 205
Thr Pro Ala Thr Asp Cys Ser Asp Gly Asn Tyr Asn Arg Asn Ala Ser
210 215 220
Leu Asn Ser Phe Lys Glu Tyr Phe Asn Leu Arg Asn Cys Thr Phe Met
225 230 235 240
Tyr Thr Tyr Asn Ile Thr Glu Asp Glu Ile Leu Glu Trp Phe Gly Ile
245 250 255
Thr Gln Thr Ala Gln Gly Val His Leu Phe Ser Ser Arg Tyr Val Asp
260 265 270
Leu Tyr Gly Gly Asn Met Phe Gln Phe Ala Thr Leu Pro Val Tyr Asp
275 280 285
Thr Ile Lys Tyr Tyr Ser Ile Ile Pro His Ser Ile Arg Ser Ile Gln
290 295 300
Ser Asp Arg Lys Ala Trp Ala Ala Phe Tyr Val Tyr Lys Leu Gln Pro
305 310 315 320
Leu Thr Phe Leu Leu Asp Phe Ser Val Asp Gly Tyr Ile Arg Arg Ala
325 330 335
Ile Asp Cys Gly Phe Asn Asp Leu Ser Gln Leu His Cys Ser Tyr Glu
340 345 350
Ser Phe Asp Val Glu Ser Gly Val Tyr Ser Val Ser Ser Phe Glu Ala
355 360 365
Lys Pro Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu Cys Asp
370 375 380
Phe Ser Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn Phe Lys
385 390 395 400
Arg Leu Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu Leu Ser
405 410 415
Leu Phe Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro Ala Ala
420 425 430
Ile Ala Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe Ser Tyr
435 440 445
Pro Leu Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly Pro Ile
450 455 460
Ser Gln Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys Leu Ile
465 470 475 480
Leu Ala Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro Leu Lys
485 490 495
Tyr Ser Tyr Ile Asn Lys Cys Ser Arg Phe Leu Ser Asp Asp Arg Thr
500 505 510
Glu Val Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys Val Ser
515 520 525
Ile Val Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg Lys Gln
530 535 540
Leu Ser Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly Ser Thr
545 550 555 560
Val Ala Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr Val Gln
565 570 575
Tyr Gly Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe Ala Asn
580 585 590
Asp Thr Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr Ser Leu
595 600 605
Tyr Gly Val Ser Gly Arg Gly Val Phe Gln Asn Cys Thr Ala Val Gly
610 615 620
Val Arg Gln Gln Arg Phe Val Tyr Asp Ala Tyr Gln Asn Leu Val Gly
625 630 635 640
Tyr Tyr Ser Asp Asp Gly Asn Tyr Tyr Cys Leu Arg Ala Cys Val Ser
645 650 655
Val Pro Val Ser Val Ile Tyr Asp Lys Glu Thr Lys Thr His Ala Thr
660 665 670
Leu Phe Gly Ser Val Ala Cys Glu His Ile Ser Ser Thr Met Ser Gln
675 680 685
Tyr Ser Arg Ser Thr Arg Ser Met Leu Lys Arg Arg Asp Ser Thr Tyr
690 695 700
Gly Pro Leu Gln Thr Pro Val Gly Cys Val Leu Gly Leu Val Asn Ser
705 710 715 720
Ser Leu Phe Val Glu Asp Cys Lys Leu Pro Leu Gly Gln Ser Leu Cys
725 730 735
Ala Leu Pro Asp Thr Pro Ser Thr Leu Thr Pro Arg Ser Val Arg Ser
740 745 750
Val Pro Gly Glu Met Arg Leu Ala Ser Ile Ala Phe Asn His Pro Ile
755 760 765
Gln Val Asp Gln Leu Asn Ser Ser Tyr Phe Lys Leu Ser Ile Pro Thr
770 775 780
Asn Phe Ser Phe Gly Val Thr Gln Glu Tyr Ile Gln Thr Thr Ile Gln
785 790 795 800
Lys Val Thr Val Asp Cys Lys Gln Tyr Val Cys Asn Gly Phe Gln Lys
805 810 815
Cys Glu Gln Leu Leu Arg Glu Tyr Gly Gln Phe Cys Ser Lys Ile Asn
820 825 830
Gln Ala Leu His Gly Ala Asn Leu Arg Gln Asp Asp Ser Val Arg Asn
835 840 845
Leu Phe Ala Ser Val Lys Ser Ser Gln Ser Ser Pro Ile Ile Pro Gly
850 855 860
Phe Gly Gly Asp Phe Asn Leu Thr Leu Leu Glu Pro Val Ser Ile Ser
865 870 875 880
Thr Gly Ser Arg Ser Ala Arg Ser Ala Ile Glu Asp Leu Leu Phe Asp
885 890 895
Lys Val Thr Ile Ala Asp Pro Gly Tyr Met Gln Gly Tyr Asp Asp Cys
900 905 910
Met Gln Gln Gly Pro Ala Ser Ala Arg Asp Leu Ile Cys Ala Gln Tyr
915 920 925
Val Ala Gly Tyr Lys Val Leu Pro Pro Leu Met Asp Val Asn Met Glu
930 935 940
Ala Ala Tyr Thr Ser Ser Leu Leu Gly Ser Ile Ala Gly Val Gly Trp
945 950 955 960
Thr Ala Gly Leu Ser Ser Phe Ala Ala Ile Pro Phe Ala Gln Ser Ile
965 970 975
Phe Tyr Arg Leu Asn Gly Val Gly Ile Thr Gln Gln Val Leu Ser Glu
980 985 990
Asn Gln Lys Leu Ile Ala Asn Lys Phe Asn Gln Ala Leu Gly Ala Met
995 1000 1005
Gln Thr Gly Phe Thr Thr Thr Asn Glu Ala Phe His Lys Val Gln
1010 1015 1020
Asp Ala Val Asn Asn Asn Ala Gln Ala Leu Ser Lys Leu Ala Ser
1025 1030 1035
Glu Leu Ser Asn Thr Phe Gly Ala Ile Ser Ala Ser Ile Gly Asp
1040 1045 1050
Ile Ile Gln Arg Leu Asp Val Leu Glu Gln Asp Ala Gln Ile Asp
1055 1060 1065
Arg Leu Ile Asn Gly Arg Leu Thr Thr Leu Asn Ala Phe Val Ala
1070 1075 1080
Gln Gln Leu Val Arg Ser Glu Ser Ala Ala Leu Ser Ala Gln Leu
1085 1090 1095
Ala Lys Asp Lys Val Asn Glu Cys Val Lys Ala Gln Ser Lys Arg
1100 1105 1110
Ser Gly Phe Cys Gly Gln Gly Thr His Ile Val Ser Phe Val Val
1115 1120 1125
Asn Ala Pro Asn Gly Leu Tyr Phe Met His Val Gly Tyr Tyr Pro
1130 1135 1140
Ser Asn His Ile Glu Val Val Ser Ala Tyr Gly Leu Cys Asp Ala
1145 1150 1155
Ala Asn Pro Thr Asn Cys Ile Ala Pro Val Asn Gly Tyr Phe Ile
1160 1165 1170
Lys Thr Asn Asn Thr Arg Ile Val Asp Glu Trp Ser Tyr Thr Gly
1175 1180 1185
Ser Ser Phe Tyr Ala Pro Glu Pro Ile Thr Ser Leu Asn Thr Lys
1190 1195 1200
Tyr Val Ala Pro Gln Val Thr Tyr Gln Asn Ile Ser Thr Asn Leu
1205 1210 1215
Pro Pro Pro Leu Leu Gly Asn Ser Thr Gly Ile Asp Phe Gln Asp
1220 1225 1230
Glu Leu Asp Glu Phe Phe Lys Asn Val Ser Thr Ser Ile Pro Asn
1235 1240 1245
Phe Gly Ser Leu Thr Gln Ile Asn Thr Thr Leu Leu Asp Leu Thr
1250 1255 1260
Tyr Glu Met Leu Ser Leu Gln Gln Val Val Lys Ala Leu Asn Glu
1265 1270 1275
Ser Tyr Ile Asp Leu Lys Glu Leu Gly Asn Tyr Thr Tyr Tyr Asn
1280 1285 1290
Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Val
1295 1300 1305
Ala Leu Ala Leu Cys Val Phe Phe Ile Leu Cys Cys Thr Gly Cys
1310 1315 1320
Gly Thr Asn Cys Met Gly Lys Leu Lys Cys Asn Arg Cys Cys Asp
1325 1330 1335
Arg Tyr Glu Glu Tyr Asp Leu Glu Pro His Lys Val His Val His
1340 1345 1350
<210> 126
<211> 725
<212> PRT
<213> 人工序列
<220>
<223> MERS-CoV 刺突蛋白 S1 亚基氨基酸序列 (K9N5Q8,
Met1-Glu725, UniProtKB version 1)
<400> 126
Met Ile His Ser Val Phe Leu Leu Met Phe Leu Leu Thr Pro Thr Glu
1 5 10 15
Ser Tyr Val Asp Val Gly Pro Asp Ser Val Lys Ser Ala Cys Ile Glu
20 25 30
Val Asp Ile Gln Gln Thr Phe Phe Asp Lys Thr Trp Pro Arg Pro Ile
35 40 45
Asp Val Ser Lys Ala Asp Gly Ile Ile Tyr Pro Gln Gly Arg Thr Tyr
50 55 60
Ser Asn Ile Thr Ile Thr Tyr Gln Gly Leu Phe Pro Tyr Gln Gly Asp
65 70 75 80
His Gly Asp Met Tyr Val Tyr Ser Ala Gly His Ala Thr Gly Thr Thr
85 90 95
Pro Gln Lys Leu Phe Val Ala Asn Tyr Ser Gln Asp Val Lys Gln Phe
100 105 110
Ala Asn Gly Phe Val Val Arg Ile Gly Ala Ala Ala Asn Ser Thr Gly
115 120 125
Thr Val Ile Ile Ser Pro Ser Thr Ser Ala Thr Ile Arg Lys Ile Tyr
130 135 140
Pro Ala Phe Met Leu Gly Ser Ser Val Gly Asn Phe Ser Asp Gly Lys
145 150 155 160
Met Gly Arg Phe Phe Asn His Thr Leu Val Leu Leu Pro Asp Gly Cys
165 170 175
Gly Thr Leu Leu Arg Ala Phe Tyr Cys Ile Leu Glu Pro Arg Ser Gly
180 185 190
Asn His Cys Pro Ala Gly Asn Ser His Thr Ser Phe Ala Thr Tyr His
195 200 205
Thr Pro Ala Thr Asp Cys Ser Asp Gly Asn Tyr Asn Arg Asn Ala Ser
210 215 220
Leu Asn Ser Phe Lys Glu Tyr Phe Asn Leu Arg Asn Cys Thr Phe Met
225 230 235 240
Tyr Thr Tyr Asn Ile Thr Glu Asp Glu Ile Leu Glu Trp Phe Gly Ile
245 250 255
Thr Gln Thr Ala Gln Gly Val His Leu Phe Ser Ser Arg Tyr Val Asp
260 265 270
Leu Tyr Gly Gly Asn Met Phe Gln Phe Ala Thr Leu Pro Val Tyr Asp
275 280 285
Thr Ile Lys Tyr Tyr Ser Ile Ile Pro His Ser Ile Arg Ser Ile Gln
290 295 300
Ser Asp Arg Lys Ala Trp Ala Ala Phe Tyr Val Tyr Lys Leu Gln Pro
305 310 315 320
Leu Thr Phe Leu Leu Asp Phe Ser Val Asp Gly Tyr Ile Arg Arg Ala
325 330 335
Ile Asp Cys Gly Phe Asn Asp Leu Ser Gln Leu His Cys Ser Tyr Glu
340 345 350
Ser Phe Asp Val Glu Ser Gly Val Tyr Ser Val Ser Ser Phe Glu Ala
355 360 365
Lys Pro Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu Cys Asp
370 375 380
Phe Ser Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn Phe Lys
385 390 395 400
Arg Leu Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu Leu Ser
405 410 415
Leu Phe Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro Ala Ala
420 425 430
Ile Ala Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe Ser Tyr
435 440 445
Pro Leu Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly Pro Ile
450 455 460
Ser Gln Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys Leu Ile
465 470 475 480
Leu Ala Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro Leu Lys
485 490 495
Tyr Ser Tyr Ile Asn Lys Cys Ser Arg Leu Leu Ser Asp Asp Arg Thr
500 505 510
Glu Val Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys Val Ser
515 520 525
Ile Val Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg Lys Gln
530 535 540
Leu Ser Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly Ser Thr
545 550 555 560
Val Ala Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr Val Gln
565 570 575
Tyr Gly Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe Ala Asn
580 585 590
Asp Thr Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr Ser Leu
595 600 605
Tyr Gly Val Ser Gly Arg Gly Val Phe Gln Asn Cys Thr Ala Val Gly
610 615 620
Val Arg Gln Gln Arg Phe Val Tyr Asp Ala Tyr Gln Asn Leu Val Gly
625 630 635 640
Tyr Tyr Ser Asp Asp Gly Asn Tyr Tyr Cys Leu Arg Ala Cys Val Ser
645 650 655
Val Pro Val Ser Val Ile Tyr Asp Lys Glu Thr Lys Thr His Ala Thr
660 665 670
Leu Phe Gly Ser Val Ala Cys Glu His Ile Ser Ser Thr Met Ser Gln
675 680 685
Tyr Ser Arg Ser Thr Arg Ser Met Leu Lys Arg Arg Asp Ser Thr Tyr
690 695 700
Gly Pro Leu Gln Thr Pro Val Gly Cys Val Leu Gly Leu Val Asn Ser
705 710 715 720
Ser Leu Phe Val Glu
725
<210> 127
<211> 602
<212> PRT
<213> 人工序列
<220>
<223> MERS-CoV 刺突蛋白S2 亚基氨基酸序列 (K9N5Q8,
Ser752-His1353, UniProtKB version 1)
<400> 127
Ser Val Pro Gly Glu Met Arg Leu Ala Ser Ile Ala Phe Asn His Pro
1 5 10 15
Ile Gln Val Asp Gln Leu Asn Ser Ser Tyr Phe Lys Leu Ser Ile Pro
20 25 30
Thr Asn Phe Ser Phe Gly Val Thr Gln Glu Tyr Ile Gln Thr Thr Ile
35 40 45
Gln Lys Val Thr Val Asp Cys Lys Gln Tyr Val Cys Asn Gly Phe Gln
50 55 60
Lys Cys Glu Gln Leu Leu Arg Glu Tyr Gly Gln Phe Cys Ser Lys Ile
65 70 75 80
Asn Gln Ala Leu His Gly Ala Asn Leu Arg Gln Asp Asp Ser Val Arg
85 90 95
Asn Leu Phe Ala Ser Val Lys Ser Ser Gln Ser Ser Pro Ile Ile Pro
100 105 110
Gly Phe Gly Gly Asp Phe Asn Leu Thr Leu Leu Glu Pro Val Ser Ile
115 120 125
Ser Thr Gly Ser Arg Ser Ala Arg Ser Ala Ile Glu Asp Leu Leu Phe
130 135 140
Asp Lys Val Thr Ile Ala Asp Pro Gly Tyr Met Gln Gly Tyr Asp Asp
145 150 155 160
Cys Met Gln Gln Gly Pro Ala Ser Ala Arg Asp Leu Ile Cys Ala Gln
165 170 175
Tyr Val Ala Gly Tyr Lys Val Leu Pro Pro Leu Met Asp Val Asn Met
180 185 190
Glu Ala Ala Tyr Thr Ser Ser Leu Leu Gly Ser Ile Ala Gly Val Gly
195 200 205
Trp Thr Ala Gly Leu Ser Ser Phe Ala Ala Ile Pro Phe Ala Gln Ser
210 215 220
Ile Phe Tyr Arg Leu Asn Gly Val Gly Ile Thr Gln Gln Val Leu Ser
225 230 235 240
Glu Asn Gln Lys Leu Ile Ala Asn Lys Phe Asn Gln Ala Leu Gly Ala
245 250 255
Met Gln Thr Gly Phe Thr Thr Thr Asn Glu Ala Phe His Lys Val Gln
260 265 270
Asp Ala Val Asn Asn Asn Ala Gln Ala Leu Ser Lys Leu Ala Ser Glu
275 280 285
Leu Ser Asn Thr Phe Gly Ala Ile Ser Ala Ser Ile Gly Asp Ile Ile
290 295 300
Gln Arg Leu Asp Val Leu Glu Gln Asp Ala Gln Ile Asp Arg Leu Ile
305 310 315 320
Asn Gly Arg Leu Thr Thr Leu Asn Ala Phe Val Ala Gln Gln Leu Val
325 330 335
Arg Ser Glu Ser Ala Ala Leu Ser Ala Gln Leu Ala Lys Asp Lys Val
340 345 350
Asn Glu Cys Val Lys Ala Gln Ser Lys Arg Ser Gly Phe Cys Gly Gln
355 360 365
Gly Thr His Ile Val Ser Phe Val Val Asn Ala Pro Asn Gly Leu Tyr
370 375 380
Phe Met His Val Gly Tyr Tyr Pro Ser Asn His Ile Glu Val Val Ser
385 390 395 400
Ala Tyr Gly Leu Cys Asp Ala Ala Asn Pro Thr Asn Cys Ile Ala Pro
405 410 415
Val Asn Gly Tyr Phe Ile Lys Thr Asn Asn Thr Arg Ile Val Asp Glu
420 425 430
Trp Ser Tyr Thr Gly Ser Ser Phe Tyr Ala Pro Glu Pro Ile Thr Ser
435 440 445
Leu Asn Thr Lys Tyr Val Ala Pro Gln Val Thr Tyr Gln Asn Ile Ser
450 455 460
Thr Asn Leu Pro Pro Pro Leu Leu Gly Asn Ser Thr Gly Ile Asp Phe
465 470 475 480
Gln Asp Glu Leu Asp Glu Phe Phe Lys Asn Val Ser Thr Ser Ile Pro
485 490 495
Asn Phe Gly Ser Leu Thr Gln Ile Asn Thr Thr Leu Leu Asp Leu Thr
500 505 510
Tyr Glu Met Leu Ser Leu Gln Gln Val Val Lys Ala Leu Asn Glu Ser
515 520 525
Tyr Ile Asp Leu Lys Glu Leu Gly Asn Tyr Thr Tyr Tyr Asn Lys Trp
530 535 540
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Val Ala Leu Ala
545 550 555 560
Leu Cys Val Phe Phe Ile Leu Cys Cys Thr Gly Cys Gly Thr Asn Cys
565 570 575
Met Gly Lys Leu Lys Cys Asn Arg Cys Cys Asp Arg Tyr Glu Glu Tyr
580 585 590
Asp Leu Glu Pro His Lys Val His Val His
595 600
<210> 128
<211> 240
<212> PRT
<213> 人工序列
<220>
<223> MERS-CoV 刺突蛋白受体结合域 (RBD) 氨基酸
序列 (K9N5Q8, Glu367- Tyr606, UniProtKB version 1)
<400> 128
Glu Ala Lys Pro Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu
1 5 10 15
Cys Asp Phe Ser Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn
20 25 30
Phe Lys Arg Leu Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu
35 40 45
Leu Ser Leu Phe Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro
50 55 60
Ala Ala Ile Ala Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe
65 70 75 80
Ser Tyr Pro Leu Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly
85 90 95
Pro Ile Ser Gln Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys
100 105 110
Leu Ile Leu Ala Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro
115 120 125
Leu Lys Tyr Ser Tyr Ile Asn Lys Cys Ser Arg Phe Leu Ser Asp Asp
130 135 140
Arg Thr Glu Val Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys
145 150 155 160
Val Ser Ile Val Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg
165 170 175
Lys Gln Leu Ser Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly
180 185 190
Ser Thr Val Ala Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr
195 200 205
Val Gln Tyr Gly Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe
210 215 220
Ala Asn Asp Thr Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr
225 230 235 240
<210> 129
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3 (S1_A3) 的核酸片段 (F9)
<400> 129
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga 40
<210> 130
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3 (S1_A3) 的核酸片段 (F10)
<400> 130
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgat 48
<210> 131
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3 (S1_A3) 的核酸片段 (F11)
<400> 131
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctc 53
<210> 132
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3 (S1_A3) 的核酸片段 (F12)
<400> 132
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
tgta 64
<210> 133
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3 (S1_A3) 的核酸片段 (F17)
<400> 133
aatgcgtggg aagggtgggt gggag 25
<210> 134
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A3 (S1_A3) 的核酸片段 (F18)
<400> 134
aatgcgtggg aagggtgggt gggagcattg ata 33
<210> 135
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F2)
<400> 135
gtatatgggt gggagggtcg ggtactatcc acaggtcaac 40
<210> 136
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F12)
<400> 136
ccagtgtaga ctactcaatg ctgtgttgac ttgatcctgt ggtatatggg tgggagggtc 60
gggt 64
<210> 137
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F13)
<400> 137
aatgctgtgt tgacttgatc ctgtggtata tgggtgggag ggtcgggtac tatccacagg 60
tcaac 65
<210> 138
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F14)
<400> 138
acttgatcct gtggtatatg ggtgggaggg tcgggtacta tccacaggtc aac 53
<210> 139
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F20)
<400> 139
acttgatcct gtggtatatg ggtgggaggg tcgggt 36
<210> 140
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F21)
<400> 140
gatcctgtgg tatatgggtg ggagggtcgg gt 32
<210> 141
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A8 (S1_A8) 的核酸片段 (F22)
<400> 141
ggtatatggg tgggagggtc gggt 24
<210> 142
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A6 (S1_A6) 的核酸片段 (F12)
<400> 142
ccagtgtaga ctactcaatg ctgttatgac ttgaccttgg gttatgggtt tgggcgggag 60
ggta 64
<210> 143
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A6 (S1_A6) 的核酸片段 (F13)
<400> 143
aatgctgtta tgacttgacc ttgggttatg ggtttgggcg ggagggtact atccacaggt 60
caacc 65
<210> 144
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> S1 适体 A6 (S1_A6) 的核酸片段 (F14)
<400> 144
acttgacctt gggttatggg tttgggcggg agggtactat ccacaggtca acc 53
<210> 145
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A1 (S2_A1)
<400> 145
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcgtgggag 60
cgtactatcc acaggtcaac c 81
<210> 146
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2)
<400> 146
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcgctcctt 60
tcgtactatc cacaggtcaa cc 82
<210> 147
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A6 (S2_A6)
<400> 147
ccagtgtaga ctactcaatg cggcttcggg agggggggcg ggtaaaaagc ccattgccct 60
agtactatcc acaggtcaac c 81
<210> 148
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A10 (S2_A10)
<400> 148
ccagtgtaga ctactcaatg ccggtgggtc gggggggtgg gtaggcattg atcgctcctt 60
ccgtactatc cacaggtcaa cc 82
<210> 149
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A12 (S2_A12)
<400> 149
ccagtgtaga ctactcaatg ccgatgggtc gggtgggtgg gtaggcattg atcgctcctc 60
cgtactatcc acaggtcaac c 81
<210> 150
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1)
<400> 150
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag atgaatcagt 60
agtactatcc acaggtcaac c 81
<210> 151
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B2 (S2_B2)
<400> 151
ccagtgtaga ctactcaatg ccgtgtggtg accttgatcc tgtggtatat gggtgggagg 60
ggcgggtact atccacaggt caacc 85
<210> 152
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B4 (S2_B4)
<400> 152
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atccttcctt 60
tcgtactatc cacaggtcaa cc 82
<210> 153
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B6 (S2_B6)
<400> 153
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag gtgaatcagt 60
agtactatcc acaggtcaac c 81
<210> 154
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B11 (S2_B11)
<400> 154
ccagtgtaga ctactcaatg cattagaccc ctaatatacg atttccaccc aatttttccc 60
acgtactatc cacaggtcaa cc 82
<210> 155
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B12 (S2_B12)
<400> 155
ccagtgtaga ctactcaatg ctactgattc atctgccgaa tccaaacccg accagtccac 60
ggtactatcc acaggtcaac c 81
<210> 156
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 C6 (S2_C6)
<400> 156
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattccccac atgaatcagt 60
agtactatcc acaggtcaac c 81
<210> 157
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 C9 (S2_C9)
<400> 157
ccagtgtaga ctactcaatg ctgctgtgtc gacttgatcc tgtggtatat gggtgggagg 60
gagggtacta tccacaggtc aacc 84
<210> 158
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 D4 (S2_D4)
<400> 158
ccagtgtaga ctactcaatg ctgtccgggt gggagggggg gtttgacagc atctgcaggt 60
agtactatcc acaggtcaac c 81
<210> 159
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 D5 (S2_D5)
<400> 159
actcaatgct aggtgtggtg accttgacct ctggatatgg gagggagggt gggtactatc 60
cacaggtcaa cc 72
<210> 160
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 D7 (S2_D7)
<400> 160
ccagtgtaga ctactcaatg ctgtgttgac ttgaccttgg attatgggtt tgggcgggcg 60
ggtactatcc acaggtcaac c 81
<210> 161
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 D8 (S2_D8)
<400> 161
ccagtgtaga ctactcaatg cgtgggaagg gtgggtggga gcattgataa ctcggaggag 60
cgtactatcc acaggtcaac c 81
<210> 162
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 D10 (S2_D10)
<400> 162
ccagtgtaga ctactcaatg cggcttcggg agggggggca ggtaaaaagc ccattgctct 60
agtactatcc acaggtcaac c 81
<210> 163
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 D11 (S2_D11)
<400> 163
ccagtgtaga ctactcaatg ccgtgtggtg accttgatcc tgtggtatat gggtgggagg 60
gatgggtact atccacaggt caacc 85
<210> 164
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 E2 (S2_E2)
<400> 164
ccagtgtaga ctactcaatg cctccggaag ttctgtatca ttaaactcca tcctcccacg 60
cgtactatcc acaggtcaac c 81
<210> 165
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 E3 (S2_E3)
<400> 165
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag atgaattagt 60
agtactatcc acaggtcaac c 81
<210> 166
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 E5 (S2_E5)
<400> 166
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcattccct 60
tcgtactatc cacaggtcaa cc 82
<210> 167
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 E8 (S2_E8)
<400> 167
ccagtgtaga ctactcaatg ctaggtgtgg tgaccttgac ctctggatat gggagggagg 60
gcgggtacta tccacaggtc aacc 84
<210> 168
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 E9 (S2_E9)
<400> 168
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggctg atgaaacagt 60
agtactatcc acaggtcaac c 81
<210> 169
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 E10 (S2_E10)
<400> 169
ccagtgtaga ctactcaatg ctcatatatt cacctctctc cccaacccta atccacatca 60
cgtactatcc acaggtcaac c 81
<210> 170
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 F10 (S2_F10)
<400> 170
ccagtgtaga ctactcaatg ccgtgtggtg accttgacct ctggatatgg gtgggaggga 60
gggtactatc cacaggtcaa cc 82
<210> 171
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G1 (S2_G1)
<400> 171
ccagtgtaga ctactcaatg cggctgtgtg acttgacctc tggatatggg tgggagggat 60
gggtactatc cacaggtcaa cc 82
<210> 172
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G7 (S2_G7)
<400> 172
ccagtgtaga ctactcaatg ccgtggactg gttgggtttg gattcggcag gtgaatcagt 60
agtactatcc acaggtcaac c 81
<210> 173
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G9 (S2_G9)
<400> 173
ccagtgtaga ctactcaatg cgtgtggtga ccttgacctc tggatatggg tgggaggggg 60
ggtactatcc acaggtcaac c 81
<210> 174
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 H3 (S2_H3)
<400> 174
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcgctcctt 60
ccgtactatc cacaggtcaa cc 82
<210> 175
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 H6 (S2_H6)
<400> 175
ccagtgtaga ctactcaatg ccgtgggctg gtcgggtttg gattcggcag atgaatcagt 60
agtactatcc acaggtcaac c 81
<210> 176
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 H9 (S2_H9)
<400> 176
ccagtgtaga ctactcaatg ctgtgttgac ttgaccttgg attatgggtt tgggcgggcg 60
ggtactatcc acaggtcaac c 81
<210> 177
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2) 的核酸片段 (F17)
<400> 177
aatgccgatg ggtcgggggg gtggg 25
<210> 178
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2) 的核酸片段 (F18)
<400> 178
aatgccgatg ggtcgggggg gtgggtaggc att 33
<210> 179
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2) 的核酸片段 (F12)
<400> 179
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atcgctcctt 60
tcgt 64
<210> 180
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2) 的核酸片段 (F11)
<400> 180
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg gtaggcattg atc 53
<210> 181
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2) 的核酸片段 (F1)
<400> 181
ccagtgtaga ctactcaatg ccgatgggtc gggggggtgg g 41
<210> 182
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 A2 (S2_A2) 的核酸片段 (F19)
<400> 182
aatgccgatg ggtcgggggg gtgggtaggc attgatcg 38
<210> 183
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1) 的核酸片段 (F18)
<400> 183
aatgccgtgg actggtcggg tttggattcg gca 33
<210> 184
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1) 的核酸片段 (F19)
<400> 184
aatgccgtgg actggtcggg tttggattcg gcagatga 38
<210> 185
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1) 的核酸片段 (F23)
<400> 185
aatgccgtgg actggtcggg tttggattcg gcagatgaat cagtagta 48
<210> 186
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1) 的核酸片段 (F10)
<400> 186
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggc 48
<210> 187
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1) 的核酸片段 (F11)
<400> 187
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag atg 53
<210> 188
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 B1 (S2_B1) 的核酸片段 (F12)
<400> 188
ccagtgtaga ctactcaatg ccgtggactg gtcgggtttg gattcggcag atgaatcagt 60
agta 64
<210> 189
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G1 (S2_G1) 的核酸片段 (F20)
<400> 189
gtgacttgac ctctggatat gggtgggagg gatgggt 37
<210> 190
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G1 (S2_G1) 的核酸片段 (F21)
<400> 190
ttgacctctg gatatgggtg ggagggatgg gt 32
<210> 191
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G1 (S2_G1) 的核酸片段 (F22)
<400> 191
tggatatggg tgggagggat gggt 24
<210> 192
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> S2 适体 G1 (S2_G1) 的核酸片段 (F13)
<400> 192
aatgcggctg tgtgacttga cctctggata tgggtgggag ggatgggtac tatccacagg 60
tcaac 65
<210> 193
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于在侧流设备“对照线”中捕获S2 适体 G1 (S2_G1)的片段(F21)的示例性序列
<400> 193
acccatccct cccacccata tccagaggtc 30

Claims (27)

1.一种或多种能够特异性结合SARS-CoV-2刺突蛋白的S1和/或S2亚基的适体,其中所述适体包括:
(a)选自SEQ ID NO:4、8、9或43中任一个序列的核酸序列;
(b)选自SEQ ID NO:10、20、24或44中任一个序列的核酸序列;
(c)选自SEQ ID NO:134、140或144中任一个序列的核酸序列;
(d)选自SEQ ID NO:146、150或171中任一个序列的核酸序列;
(e)选自SEQ ID NO:177、179、183、188、190或191中任一个序列的核酸序列;
(f)具有(a)至(e)序列中任一个序列的至少约15个连续核苷酸的核酸序列;和/或
(g)与(a)至(f)序列中任一个序列具有至少约85%或以上序列同一性的核酸序列。
2.根据权利要求1所述的一种或多种适体,其中所述适体包括:
(a)能够特异性结合SARS-CoV-2刺突蛋白的S1亚基的核酸序列,其中所述序列选自SEQID NO:140;
(b)能够特异性结合SARS-CoV-2刺突蛋白的S2亚基的核酸序列,其中所述序列是选自SEQ ID NO:190的核酸序列;
(c)具有(a)或(b)序列的至少约25个连续核苷酸的核酸序列;和/或
(d)与(a)至(c)序列中任一个序列具有至少约85%或以上序列同一性的核酸序列。
3.根据权利要求1所述的至少两种或更多种适体,包括:
(a)第一适体,其包括选自SEQ ID NO:4、8、9、43、134、10或144中任一个序列的核酸序列或与SEQ ID NO:4、8、9、43、134、140或144中任一个序列具有至少约90%或以上序列同一性的序列;和
(b)(i)第二适体,其包括选自SEQ ID NO:4、8、9、43、134、140或144中任一个序列的核酸序列或与SEQ ID NO:4、8、9、43、134、140或144中任一个序列具有至少约90%或以上序列同一性的序列,其中所述第二适体与所述第一适体不同;或
(ii)第二适体,其包括选自SEQ ID NO:146、150、171、177、179、183、188、190或191中任一个序列的核酸序列或与SEQ ID NO:146、150、171、177、179、183、188、190或191中任一个序列具有至少约90%或以上序列同一性的序列。
4.根据权利要求3所述的至少两种或更多种适体,其中所述适体包括:
(a)第一适体,其包括选自SEQ ID NO:140的核酸序列或与SEQ ID NO:140具有至少约95%或以上序列同一性的序列;和
(b)第二适体,其包括选自SEQ ID NO:190的核酸序列或与SEQ ID NO:190具有至少约85%或以上序列同一性的序列。
5.根据权利要求1至4中任一项所述的适体,其中所述适体是DNA适体。
6.一种适体,其与权利要求1至5中任一项所述的适体竞争结合SARS-CoV-2刺突蛋白的S1和/或S2亚基。
7.根据权利要求1至6中任一项所述的适体,其中所述一种或多种适体包括可检测标记,任选地,其中所述可检测标记选自荧光团、纳米颗粒、量子点、酶、放射性同位素、预定义序列部分、生物素、脱硫生物素、硫醇基、氨基、叠氮化物、氨基烯丙基、地高辛、抗体、催化剂、胶体金属颗粒、胶体非金属颗粒、有机聚合物、乳胶颗粒、纳米纤维、纳米管、树状聚合物、蛋白质和脂质体。
8.一种复合物,其包括前述权利要求中任一项所述的一种或多种适体和可检测分子。
9.根据权利要求8所述的复合物,其中所述复合物包括SARS-CoV-2刺突蛋白的S1和/或S2亚基、SARS-CoV-2刺突蛋白的单体、SARS-CoV-2刺突蛋白的三聚体和/或SARS-CoV-2病毒。
10.一种生物传感器、测定板或测试条,其包括权利要求1至7中任一项所述的一种或多种适体。
11.检测样本中SARS-CoV-2的存在、不存在或含量的装置,所述装置包括权利要求1至7中任一项所述的一种或多种适体,任选地,其中所述装置还包括载体。
12.一种侧流设备,其包括权利要求1至7中任一项所述的一种或多种适体。
13.根据权利要求12所述的侧流设备,其中所述设备包括:
(a)第一适体,其包括选自SEQ ID NO:140的核酸序列或与SEQ ID NO:140具有至少约85%或以上序列同一性的序列;和
(b)第二适体,其包括选自SEQ ID NO:190的核酸序列或与SEQ ID NO:190具有至少约85%或以上序列同一性的序列。
14.根据权利要求13所述的设备,其中所述第一适体或第二适体与固体载体结合,任选地,其中所述固体载体是测试条。
15.根据权利要求14所述的设备,其中:
(i)如果所述第一适体与固体载体结合,则所述第二适体与可检测标记偶联;或
(ii)如果所述第二适体与固体载体结合,则所述第一适体与可检测标记偶联。
16.根据权利要求15所述的设备,其中所述可检测标记是金或乳胶纳米颗粒或荧光纳米颗粒、荧光团或量子点。
17.一种功能化电极或生物传感器表面,其包括权利要求1至7中任一项所述的一种或多种适体。
18.根据权利要求17所述的功能化电极或生物传感器,其中所述功能化电极或生物传感器包括:
(a)包括选自SEQ ID NO:10、20、24或44的核酸序列的适体;或
(b)与SEQ ID NO:10、20、24或44具有至少约85%或以上序列同一性的序列。
19.根据权利要求18所述的功能化电极或生物传感器,其中所述适体固定在所述电极的表面上,任选地,其中所述电极的表面是金。
20.根据权利要求1至7中任一项所述的一种或多种适体、权利要求9或10所述的复合物、权利要求10所述的生物传感器或测试条、权利要求11所述的装置、权利要求12至16中任一项所述的侧流设备或权利要求17至19中任一项所述的功能化电极或生物传感器用于检测、富集、分开和/或分离SARS-CoV-2的用途。
21.根据权利要求20所述的用途,其中在检测样本中SARS-CoV-2的存在、不存在或含量之前,先富集样本中的SARS-CoV-2。
22.一种检测样本中SARS-CoV-2的存在、不存在或含量的方法,所述方法包括:
(i)使样本与权利要求1至7中任一项所述的一种或多种适体相互作用;和
(ii)检测SARS-CoV-2的存在、不存在或含量。
23.根据权利要求22所述的方法,其中所述样本获得自患有或怀疑患有COVID-19感染的受试者。
24.根据权利要求23所述的方法,其中所述样本是唾液、血液或鼻拭子,任选地,其中所述鼻拭子是鼻咽拭子、前鼻拭子和/或前鼻孔拭子。
25.根据权利要求22至24中任一项所述的方法,其中检测SARS-CoV-2的感染病毒载量。
26.一种用于检测、定量和/或富集SARS-CoV-2的试剂盒,所述试剂盒包括权利要求1至7中任一项所述的一种或多种适体。
27.根据权利要求26所述的试剂盒,其中所述试剂盒包括接头、载体和/或可检测分子。
CN202180051012.5A 2020-06-18 2021-06-18 针对SARS-CoV-2的适体 Pending CN116438307A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
GBGB2009351.4A GB202009351D0 (en) 2020-06-18 2020-06-18 Aptamers against SARS-CoV-2
GB2009351.4 2020-06-18
GB2017437.1 2020-11-04
GBGB2017437.1A GB202017437D0 (en) 2020-06-18 2020-11-04 Aptamers against sars-cov-2
GB2105379.8 2021-04-15
GBGB2105379.8A GB202105379D0 (en) 2020-06-18 2021-04-15 Aptamers against SARS-CoV-2
PCT/GB2021/051559 WO2021255479A1 (en) 2020-06-18 2021-06-18 Aptamers against sars-cov-2

Publications (1)

Publication Number Publication Date
CN116438307A true CN116438307A (zh) 2023-07-14

Family

ID=71838338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180051012.5A Pending CN116438307A (zh) 2020-06-18 2021-06-18 针对SARS-CoV-2的适体

Country Status (5)

Country Link
US (1) US20230228751A1 (zh)
EP (1) EP4168551A1 (zh)
CN (1) CN116438307A (zh)
GB (3) GB202009351D0 (zh)
WO (1) WO2021255479A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114585740A (zh) * 2019-06-05 2022-06-03 利夫加工有限公司 针对艰难梭菌的适配体
EP4019637A1 (en) * 2020-12-23 2022-06-29 Rheinische Friedrich-Wilhelms-Universität Bonn Aptamers and use of the aptamers in the diagnosis and treatment of a sars-cov-2 infection
CN114807148B (zh) * 2022-03-14 2023-09-01 湖南大学 一种检测新冠病毒SARS-CoV-2的核酸适体及其应用
WO2023230590A2 (en) * 2022-05-27 2023-11-30 Bowling Green State University Dna aptamers as universal inhibitors of spike protein/hace2 interactions
CN114814216B (zh) * 2022-06-30 2022-10-18 中国科学院基础医学与肿瘤研究所(筹) 用于鉴别新冠核衣壳蛋白的核酸适体-抗体混合夹心法

Also Published As

Publication number Publication date
EP4168551A1 (en) 2023-04-26
US20230228751A1 (en) 2023-07-20
GB202105379D0 (en) 2021-06-02
GB202009351D0 (en) 2020-08-05
GB202017437D0 (en) 2020-12-16
WO2021255479A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
CN116438307A (zh) 针对SARS-CoV-2的适体
Zhao et al. Advancements in electrochemical biosensing for respiratory virus detection: A review
CN111693712B (zh) 一种采用核酸适配体检测新冠病毒SARS-CoV-2 N蛋白的方法
US20190391149A1 (en) Glycan arrays for high throughput screening of viruses
US9562907B2 (en) Aptamers screening method based on graphene without target immobilization and the aptamers obtained from the method
KR102351653B1 (ko) 사스 코로나바이러스 2 스파이크 단백질과 결합하는 수용체와 항체를 포함하는 사스 코로나바이러스 2 진단 키트
CN113195722B (zh) 与基孔肯雅热病毒e2特异性结合的dna适体及其用途
Fernandes et al. Recent advances in point of care testing for COVID-19 detection
CN113227377B (zh) 与黄热病病毒ediii特异性结合的dna适体及其用途
CN112462061A (zh) 检测h1n1、rsv-a和adv3的试剂盒及其应用
Isaacs et al. Nucleocapsid specific diagnostics for the detection of divergent SARS-CoV-2 variants
Sinha et al. COVID-19 rhapsody: Rage towards advanced diagnostics and therapeutic strategy
Ellipilli et al. Proof-of-concept for speedy development of rapid and simple at-home method for potential diagnosis of early COVID-19 mutant infections using nanogold and aptamer
CN113227378B (zh) 与登革病毒ediii特异性结合的dna适配体及其用途
KR101032956B1 (ko) 수청바이러스 유래 뉴클레오캡시드 단백질을 이용하여 신증후출혈열 특이 IgM과 IgG를 검출하는 신속 진단 키트
KR20220016769A (ko) 신종 코로나바이러스 특이적 압타머 및 이의 이용
KR101402316B1 (ko) 핵산 앱타머 및 항체를 이용한 에디포카인의 ELAAS(Enzyme-Linked Antibody Aptamer Sandwich) 검출방법
KR20210097176A (ko) 이마티닙에 대한 압타머
Kulabhusan et al. Aptamer-based emerging tools for viral biomarker detection: A focus on SARS-CoV-2
US20220049258A1 (en) Aptamer against irinotecan
Kumar et al. Analytical performances of different diagnostic methods for SARS-CoV-2 virus-A review
KR20190066811A (ko) 오담(ODAM, Odontogenic Ameloblast-Associated protein)에 특이적으로 결합하는 DNA 앱타머 및 그의 용도
KR102373670B1 (ko) 신종 인플루엔자 바이러스에 고특이적 고선택적 결합이 가능한 펩타이드 리셉터 및 그를 이용한 바이러스 검출용 바이오칩의 제작방법
GÜLTEKİN Nucleic acid based lateral flow test (LFT) for COVID-19 diagnosis
Park et al. Aptamers and Nanobodies as New Bioprobes for SARS-CoV-2 Diagnostic and Therapeutic System Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination