CN114539422B - 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用 - Google Patents

核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用 Download PDF

Info

Publication number
CN114539422B
CN114539422B CN202011340377.3A CN202011340377A CN114539422B CN 114539422 B CN114539422 B CN 114539422B CN 202011340377 A CN202011340377 A CN 202011340377A CN 114539422 B CN114539422 B CN 114539422B
Authority
CN
China
Prior art keywords
nucleic acid
artificial sequence
sequence
pairing
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011340377.3A
Other languages
English (en)
Other versions
CN114539422A (zh
Inventor
杨凡
周界文
周柳娟
汪焰兵
曹婵
闰长青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ansheng Shanghai Medicine Technology Co ltd
Original Assignee
Ansheng Shanghai Medicine Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN202011340377.3A priority Critical patent/CN114539422B/zh
Application filed by Ansheng Shanghai Medicine Technology Co ltd filed Critical Ansheng Shanghai Medicine Technology Co ltd
Priority to JP2023532213A priority patent/JP2023551827A/ja
Priority to EP21897098.6A priority patent/EP4253609A1/en
Priority to AU2021390000A priority patent/AU2021390000A1/en
Priority to CA3200188A priority patent/CA3200188A1/en
Priority to KR1020237021280A priority patent/KR20230123972A/ko
Priority to PCT/CN2021/133254 priority patent/WO2022111598A1/zh
Priority to CN202180079161.2A priority patent/CN116600823A/zh
Priority to US18/254,495 priority patent/US20240294674A1/en
Publication of CN114539422A publication Critical patent/CN114539422A/zh
Application granted granted Critical
Publication of CN114539422B publication Critical patent/CN114539422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/19Cytokines; Lymphokines; Interferons
    • A61K38/193Colony stimulating factors [CSF]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/385Haptens or antigens, bound to carriers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/549Sugars, nucleosides, nucleotides or nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/55Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound the modifying agent being also a pharmacologically or therapeutically active agent, i.e. the entire conjugate being a codrug, i.e. a dimer, oligomer or polymer of pharmacologically or therapeutically active compounds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6801Drug-antibody or immunoglobulin conjugates defined by the pharmacologically or therapeutically active agent
    • A61K47/6803Drugs conjugated to an antibody or immunoglobulin, e.g. cisplatin-antibody conjugates
    • A61K47/6811Drugs conjugated to an antibody or immunoglobulin, e.g. cisplatin-antibody conjugates the drug being a protein or peptide, e.g. transferrin or bleomycin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6835Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site
    • A61K47/6843Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site the antibody targeting a material from animals or humans
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/53Colony-stimulating factor [CSF]
    • C07K14/535Granulocyte CSF; Granulocyte-macrophage CSF
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/10Nucleic acid folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6025Nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Zoology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Toxicology (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Communicable Diseases (AREA)
  • Diabetes (AREA)
  • Hematology (AREA)
  • Oncology (AREA)

Abstract

本发明提供了核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用。具体地,本发明提供了一种基于互配核酸骨架的多聚体复合物,所述复合物是3‑6个具有互配核酸骨架的单体复合成的多聚体,其中,每个单体为具有所述的核酸单链的多肽;在所述多聚体中,每个单体的核酸单链与另外两个单体的核酸单链通过碱基互补形成双链,从而形成互配核酸骨架结构。本发明还提供含所述多聚体复合物的药物组合物,用于构建所述多聚体复合物的核酸序列文库,以及对互配核酸骨架进行优化的方法。本发明可将现成的短效蛋白药物或抗原,在无需重新构建融合蛋白或化学修饰和交联的条件下,完成蛋白药物或抗原的多价化,提高其半衰期和活性、和/或免疫原性。

Description

核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
技术领域
本发明涉及生物技术药物领域,具体地涉及核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用。
背景技术
对于很多生物大分子来说,它们的聚集或多价状态直接影响它们体内的活性和半衰期。例如,大部分免疫受体的激活涉及受体在细胞膜上聚集,从而激活细胞内部下游的信号通路。所以,这些受体的天然配体或抗体在形成多价或高价时往往能够显著提高激活受体的能力。另外,有些分子量较低的蛋白药物(MW 40kDa),如细胞因子、生长激素、合成多肽等药物的肾脏清除率高,体内半衰期短;这些蛋白药物也可以通过形成高价而增加分子量,提高半衰期。
因此,将蛋白多价化是生物医药领域的较收关注的一种工艺,现有的方法也很多,但是多数的化学交联方法存在连接特异性差,连接多聚体不均一的问题。目前最为广泛应用的方法是将蛋白以多价融合蛋白的形式由细胞表达生产,就是将有药功能的蛋白区域与能够形成寡聚体的蛋白融合形成嵌合体,如Fc二价融合蛋白,GCN4三价融合蛋白等。这些融合蛋白都能形成均一的寡聚体,但是融合蛋白的细胞表达量和活性往往比原始的蛋白药物差,并且Fc区域的存在带来了激活免疫系统,诱导细胞因子释放,造成细胞毒性的风险。因此,本领域亟待开发一种简单、灵活、高效的方法,可将已经被验证的蛋白药物以非融合蛋白方式形成均一的,特异性高的多价蛋白。
另外,蛋白多价化对疫苗研发也有重要意义。首先,在基于B细胞的疫苗设计里,用病毒或细菌的蛋白作为抗原激活B细胞受体(BCR)是至关重要的一步。BCR和以上所述的免疫受体一样,其有效激活需要受体在细胞膜上聚集,所以高价抗原在激活B细胞方便相比单体抗原具有绝对的优势。其次,高价抗原未必一定是单一种抗原形成寡聚体;高价抗原可以含有某种病毒里不同的蛋白或不同病毒株的相同蛋白的突变型和亚型;如此,多元化的抗原呈递理论上可以诱导宿主免疫系统的多株B細胞反应(polyclonal response),产生更广泛性的中和抗体。
发明内容
本发明的目的一是提供一种高效且稳定组装的n阶核酸寡聚体装配骨架设计,适用于将核酸偶联的蛋白药物高效且稳定的组装,形成多价药物或疫苗。
本发明的目的二是提供一种简单、高效的将蛋白药物形成多价大分子的方法用于延长药物半衰期,增加药物活性。
本发明的目的三是提供一种简单、灵活、高效、模块化的方法将相同或不同的蛋白抗原形成多价大分子复合物,用于激活免疫细胞,提高疫苗的免疫原性。
在本发明的第一方面,提供了一种基于互配核酸骨架的多聚体复合物,所述的复合物是n个具有互配核酸骨架的单体复合形成的多聚体,其中,每个单体为具有所述的核酸单链的多肽,而n为3-6的正整数;在所述多聚体中,每个单体的核酸单链与另外两个单体的核酸单链通过碱基互补形成互配双链,从而形成互配核酸骨架结构。
在另一优选例中,n为3、4、5或6。
在另一优选例中,所述的复合物为三聚体、四聚体、或五聚体,较佳地所述复合物的结构如图1所示。
在另一优选例中,所述的单体具有式I结构:
Z1-W (I)
式中,
Z1为多肽部分(moiety);
W为单链核酸序列;
“-”为接头或键。
在另一优选例中,“-”为共价键。
在另一优选例中,所述核酸序列选自下组:左旋核酸、肽核酸、锁核酸、硫代修饰核酸、2'-氟修饰核酸、5-羟甲基胞嘧啶核酸、吗啉磷酸酯(phosphorodiamidate morpholino)核酸、或其组合;
在另一优选例中,在所述多聚体中,每个单体的Z1是相同或不同的。
在另一优选例中,在所述多聚体中,每个单体的W是不同的。
在另一优选例中,所述的单体具有式II结构
D–[L–W]m (2)
其中,
D为蛋白药物元件部分;
W为核酸序列;
L为无或接头;
“-”为共价键;
m为1、2或3。
在另一优选例中,m为1。
在另一优选例中,所述的单体具有式II结构
A–[L–W]m (2)
其中,
A为多肽抗原元件部分;
W为核酸序列;
L为无或接头;
“-”为共价键;
m为1、2或3。
在另一优选例中,m为1。
在另一优选例中,所述的核酸序列W具有式1所示的结构:
X1–R1–X2–R2–X3 (1)
其中,
R1为碱基互补配对区域1;
R2为碱基互补配对区域2;
X1、X2和X3各自独立地为无或冗余核酸;
“-”为键。
在另一优选例中,R1和R2的长度各自独立地为10-20碱基,较佳地14-16碱基。
在另一优选例中,X1的长度为0-5碱基。
在另一优选例中,X3的长度为0-5碱基。
在另一优选例中,X2的长度为0-3碱基。
在另一优选例中,X2的序列选自下组:A,AA,AGA或AAA。
在另一优选例中,每个单体的R1与左邻(或左侧)单体的R2形成碱基互补配对结构;而R2与右邻(或右侧)单体的R1形成碱基互补配对结构。
在本发明的第二方面,提供了一种药物组合物,所述药物组合物包括:
(a)第一方面中所述的基于互配核酸骨架的多聚体复合物;和
(b)药学上可接受的载体。
在另一优选例中,所述的药物组合物包括疫苗组合物。
在另一优选例中,所述的药物组合物包括治疗性和/或预防性的药物组合物。
在另一优选例中,所述的多聚体复合物包括三聚体复合物、四聚体复合物和五聚体复合物。
在本发明的第三方面,提供了一种核酸序列文库,所述的核酸文库包括用于形成第一方面所述的基于互配核酸骨架的多聚体复合物的核酸序列。
在另一优选例中,所述的核酸序列包括:
(a)用于形成基于互配核酸骨架的三聚体复合物的核酸序列;
(b)用于形成基于互配核酸骨架的四聚体复合物的核酸序列;和/或
(c)用于形成基于互配核酸骨架的五聚体复合物的核酸序列。
在另一优选例中,所述的核酸序列W具有式1所示的结构:
X1-R1-X2-R2-X3 (1)
其中,
R1为碱基互补配对区域1;
R2为碱基互补配对区域2;
X1、X2和X3各自独立地为无或冗余核酸;
“-”为键。
在本发明的第四方面,提供了第三方面所述的核酸序列文库的用途,用于制备第一方面所述的多聚体复合物或含所述的多聚体复合物的药物组合物。
在本发明的第五方面,提供了一种确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法,包括步骤:
(a)设置退火算法参数:
设置退火初始温度、退火终止温度和退火温度衰减系数ΔT;
设置优化约束参数:
①核酸单链的数量n,较佳地为3-6的正整数;
②配对序列长度L,较佳地L为12-16碱基;
③配对区域解离温度阈值Tm
④特异性配对区域序列自由能阈值
⑤非特异性配对自由能阈值
⑥连接元X2,较佳地为为A、AA和AAA,
⑦二级结构(hairpin)解离温度阈值Tm-H
⑧配对序列中CG比例PCG,较佳地,PCG的范围为[0.4,0.6),
⑨任选地,对于n=4时,使用对称序列,根据以上参数初始化序列集合S={S1,S2,...,Sn};
(b)计算前一步骤所述集合S的目标函数值E0,即计算序列之间与序列自身的非特异性配对自由能之和,同时得到非特异性配对自由能矩阵Cn×n,搜索其上三角矩阵中的最小值所对应的Si和Sj(1≤i≤n,1≤j≤n),根据Si和Sj非特异性配对自由能随机选择Si或Sj进行更新操作,于是得到一条新的核酸序列,进而得到更新的序列集合S’;
(c)判断前一步骤所述集合S’中的序列是否满足步骤(a)中所设置的优化约束参数条件,验证以下参数,包括特异性配对区域解离温度Tm,特异性配对区域序列自由能二级结构解离温度Tm-H和CG比例PCG,如若以上参数满足约束条件则执行步骤(d),否则重复执行步骤(c),如果在某一退火温度下,连续执行15次步骤(b)都未得到满足条件的S’则,为防止死循环,集合S成为集合S’,执行下一步;
(d)计算前一步骤所述集合S’的目标函数值E1,比较E0与E1,若E1≥E0,表明非特异性配对自由能得到优化,序列集合S’成为序列集合S,若E1<E0,,表明非特异性配对自由能未得到优化,此时需要根据Metropolis准则,判断是否接受S’集合成为S;和
(e)退火温度根据步骤(a)设置的衰减系数ΔT进行衰减,对前一步骤所述的S重复执行步骤(b)、(c)和(d),即基于蒙特卡洛的退火算法,直至退火温度达到退火终止温度,前一步骤所述的S={S1,S2,...,Sn}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列。
在另一优选例中,在步骤(a)设置退火算法参数中,包括:
例如,设置退火初始温度To=50℃±2℃,退火终止温度Tf=0.12℃±0.02℃,退火温度衰减系数ΔT视情况而定,一般为0.98±0.01;
设置优化约束参数:
①核酸单链的数量n为3-6的正整数,
②配对序列长度L,视情况而定(较佳地,L为12-16碱基),
③配对区域解离温度阈值Tm,根据配对序列长度而定(如,L=14碱基时,Tm>50℃;L=16碱基时,Tm>52℃),
④特异性配对区域序列自由能阈值根据配对序列长度而定(较佳地,L=14碱基时,kcal/mol;L=16碱基时,kcal/mol),
⑤非特异性配对自由能阈值根据序列长度而定(较佳地, kcal/mol),
⑥连接元X2,视情况而定(可以为A、AA和AAA等),
⑦二级结构(hairpin)解离温度阈值Tm-H,视情况而定(较佳地,Tm-H<40℃±2℃),
⑧配对序列中CG比例PCG,的范围为[0.4,0.6),
⑨特殊地,对于n=4时,可使用对称序列,根据以上参数初始化序列集合S={S1,S2,...,Sn}。
在另一优选例中,所述的各个单链核酸序列W具有式1所示的结构:
X1-R1-X2-R2-X3 (1)
其中,
R1为碱基互补配对区域1;
R2为碱基互补配对区域2;
X1、X2和X3各自独立地为无或冗余核酸;
“-”为键。
在另一优选例中,在步骤(d)中,所述的优化集合是满足以下条件的集合:
(C1)互配核酸骨架结构中,目标配对形成的DNA双链结构的自由能较小或最小;和
(C2)互配核酸骨架结构中,非目标配对的较大或最大化。
在另一优选例中,在步骤(d)中,所述的优势集合还满足以下条件:
(C3)R1和R2区域的配对解离温度Tm>50℃(L=14碱基时)。
在另一优选例中,在步骤(c)中,通过最近邻的方法计算DNA寡聚体(即互配核酸骨架结构)的自由能
在另一优选例中,在步骤(c)中,将DNA寡聚体(即互配核酸骨架结构)分解为10种不同的最近邻的成对相互作用,这些成对的相互作用是:AA/TT;AT/TA;TA/AT;CA/GT;GT/CA;CT/GA;GA/CT;CG/GC;GC/CG;和GG/CC;并基于这些成对的相互作用的焓(enthalpy,ΔH°)和熵(entropy,ΔS°)计算得到相应的各自的ΔG°值;然后将互配核酸骨架结构所包括的成对的相互作用的自由能合并(或求和),获得互配核酸骨架结构的自由能。
在另一优选例中,所述方法包括重复步骤(b)、(c)和(d)多次(即进行n1次迭代),从而在迭代过程中获得全局最优解。
在另一优选例中,在所述迭代过程中,根据Metropolis准则有限度地接受较差的解且接受较差解的概率慢慢趋向于0,从而使得算法终止时尽可能找到全局最优解。
在另一优选例中,使用以下优化目标函数进行模拟退火算法的迭代,从而优化非目标配对区域的自由能:
ΔG°(Si,Sj)为序列Si和序列Sj非目标配对自由能,为所有序列之间非目标配对自由能之和,其值为负;其中,此负值越大越有利于减少非目标配对。
在本发明的第六方面,提供了一种用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列集合,所述的单链核酸序列集合是用第五方面所述的方法所确定的。
在另一优选例中,所述的集合选自下组:
(S1)用于形成基于互配核酸骨架的三聚体复合物的单链核酸序列:
表9-1
(S2)用于形成基于互配核酸骨架的四聚体复合物的单链核酸序列:
表9-2
(S3)用于形成基于互配核酸骨架的五聚体复合物的单链核酸序列:
表9-3
在本发明的第七方面,提供了一种确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的装置,所述装置包括:
(M1)输入模块,所述输入模块用于输入退火算法参数、优化约束参数和任选的待优化的核酸序列;
其中,所述的设置退火算法参数包括:退火初始温度、退火终止温度和退火温度衰减系数ΔT;
所述的优化约束参数包括:
①核酸单链的数量n,较佳地为3-6的正整数;
②配对序列长度L,较佳地L为12-16碱基;
③配对区域解离温度阈值Tm
④特异性配对区域序列自由能阈值
⑤非特异性配对自由能阈值
⑥连接元X2,较佳地为为A、AA和AAA,
⑦二级结构(hairpin)解离温度阈值Tm-H
⑧配对序列中CG比例PCG,较佳地,PCG的范围为[0.4,0.6),
(M2)优化运算模块,所述优化运算模块被配置为执行以下子步骤,从而获得经优化的单链核酸序列或其集合:
(z1)计算初始集合S的目标函数值E0,即计算序列之间与序列自身的非特异性配对自由能之和,同时得到非特异性配对自由能矩阵Cn×n,搜索其上三角矩阵中的最小值所对应的Si和Sj(1≤i≤n,1≤j≤n),根据Si和Sj非特异性配对自由能随机选择Si或Sj进行更新操作,于是得到一条新的核酸序列,进而得到更新的序列集合S’;
(z2)判断前一步骤所述集合S’中的序列是否满足所设置的优化约束参数条件,验证以下参数,包括特异性配对区域解离温度Tm,特异性配对区域序列自由能二级结构解离温度Tm-H和CG比例PCG,如若以上参数满足约束条件则执行步骤(z3),否则重复执行步骤(z2),如果在某一退火温度下,连续执行15次步骤都未得到满足条件的S’则,为防止死循环,集合S成为集合S’,执行下一步;
(z3)计算前一步骤所述集合S’的目标函数值E1,比较E0与E1,若E1≥E0,表明非特异性配对自由能得到优化,序列集合S’成为序列集合S,若E1<E0,,表明非特异性配对自由能未得到优化,此时需要根据Metropolis准则,判断是否接受S’集合成为S;和
(z4)退火温度根据设置的衰减系数ΔT进行衰减,对前一步骤所述的S重复执行步骤(z1)、(z2)和(z3),即基于蒙特卡洛的退火算法,直至退火温度达到退火终止温度,前一步骤所述的S={S1,S2,...,Sn}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列;和
(M3)输出模块,所述输出模块用于输出经优化的单链核酸序列或其集合。
在另一优选例中,所述的优化约束参数还包括:对于四聚体(n=4),使用对称序列,根据以上参数初始化序列集合S={S1,S2,...,Sn};
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了多聚体示意图。
图2显示了本专利涉及的退火算法流程图。
图3显示了三聚体序列特异性配对示意图。
图4显示了三聚体优化序列核酸骨架组装跑胶图。
图5显示了四聚体优化后序列特异性配对示意图。
图6显示了四聚体优化序列间非特异性配对区域自由能之和统计图。
图7显示了四聚体优化序列核酸骨架组装跑胶图。
图8显示了四聚体转化五聚体示意图。
图9显示了五聚体转化方案1优化后序列非配对区域自由能之和统计图。
图10显示了五聚体转化方案1优化后序列核酸骨架组装跑胶示意图。
图11显示了五聚体方案2优化后序列特异性配对示意图。
图12显示了五聚体转化方案2优化后序列非配对区域自由能之和统计图。
图13显示了五聚体转化方案2优化后序列核酸骨架组装跑胶示意图。
图14显示了G-CSF与L-DNA的偶联。
图15显示了(L-DNA)-G-CSF偶联物纯化效果图。
图16显示了一价、二价和三价G-CSF复合物组装效果图。
图17显示了L-DNA四聚体框架对G-CSF体外活性的影响。
图18显示了L-DNA四聚体组装的二价和三价G-CSF的体外活性评价。
具体实施方式
本发明人经过广泛而深入的研究,首次开发了一种多价蛋白药物及其文库、以及制备方法和应用。采用本发明药物文库、制备方法可根据需要,快速、高效、低成本、高得率地将短效蛋白药物形成多价复合物提高药物半衰期,或将单体抗原形成高价抗原提高其免疫原性(immunogenicity)。在此基础上完成本发明。
具体地,本发明提供一种多价蛋白药物,它包括n蛋白药物单元,其中,每个药物单元包括同一种的药物元件部分以及与所述药物元件部分相连的不同的核酸元件部分;n为≥2的正整数;n不同的核酸元件部分通过核酸碱基互补方式形成n聚体,从而构成所述的多价蛋白药物;本发明的多价蛋白药物仅通过快速组装(如1分钟)形成稳定的核酸碱基互补的配对结构(而非复杂的肽键或其它化学修饰等)。实验表明,本发明药物可以通过高价化增加分子量,从而延长在动物体内的半衰期。
另外,基于同样的实施方式,所述的药物元件也可以是用于疫苗研发的抗原;不同的是每个抗原单元包括同一种或不同的抗原元件部分以及与所述抗原元件部分相连的不同的核酸元件部分;n不同的核酸元件部分通过核酸碱基互补方式形成n聚体,从而构成所述的多价抗原。
最后,本发明提供了高度优化的核酸序列文库,包括高效,精准组装成2-5聚体的核酸序列组,用于快速,精准的将以上所述的药物或抗原单元自组装成多价大分子复合物。
术语
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
药物D
本发明中,所述药物元件部分为蛋白类药物、多肽类药物。
典型地,所述蛋白类药物包括但不限于细胞因子、激素(例如胰岛素、生长激素等)、抗体药物、多肽。
在本发明的一个优选的实施例中,所述蛋白类药物为治疗白细胞减少症的G-CSF。
抗原文库A
本发明提供一种抗原文库,所述抗原文库包括N抗原单元;
其中,所述的抗原单元包括抗原元件部分以及与所述抗原元件部分相连的核酸元件部分;不同的核酸元件部分通过核酸碱基互补方式形成n聚体,从而构成多价抗原;
其中,所述抗原元件部分为蛋白类抗原、多肽类抗原;
典型地,所述的蛋白类、多肽类抗原包括但不限于病毒,细菌蛋白,其结构区域,和片段;
本发明中,所述的抗原元件部分选自于文库里M种不同抗原蛋白,M≤N;M种不同抗原蛋白含有某种病毒里不同的蛋白或不同病毒株的相同蛋白的突变体;
在本发明的一个优选的实施例中,所述蛋白类抗原来自新型冠状病毒SARS-CoV-2;具体的,是病毒刺突蛋白的受体结合结构域(RBD)形成的高价抗原。
左旋核酸
左旋核酸是指相对自然界存在的右旋核酸(D-核酸)而言,成镜像存在,可分为左旋DNA(L-DNA)和左旋RNA(L-RNA)。左旋(手性中心)主要存在于核酸的脱氧核糖或核糖部分,呈镜像翻转。因此,左旋核酸无法被血浆中无处不在的核酸酶(如核酸外切酶、核酸内切酶)所降解。
制备方法
1.L-核酸链框架的设计与制备
根据本发明,L-核酸链框架由两条及以上的L-核酸单链通过碱基配对形成。每条L-核酸单链的5'或3'端均活化成可供后续修饰的基团(如NH2等),然后用连接物(如SMCC、SBAP等)的一端与L-核酸单链上的活化基团偶联。带连接物的L-核酸可组装成所需的L-核酸链框架。在另一优选例中,L-核酸单链的5'或3'端的活化官能团(如aldehyde,maleimide等)在核酸合成中已经包括在内。在确定带连接物的L-核酸可以成功自组装成框架后,则可将带连接物的L-核酸单链分别偶联抗体进行后续的组装。本发明L-核酸框架基本上可通过如下步骤制备。
1.1设计可快速自组装的L-核酸单链
确定所需的多价数目n(如三聚体,四聚体);根据多价数目n确定所需的L-核酸单链数目n;设计相应数目的L-核酸单链序列,通过优化碱基配对调节目的核酸框架稳定性,减少核酸链间非特异性配对的可能性。核酸序列设计细节在发明内容和实施例里有具体描述。
1.2L-DNA或L-RNA的活化
L-核酸的活化包括其5'端(X1)或3'端(X3)的活性基团修饰和后续的连接物偶联。活性基团修饰可由核酸合成公司订制完成;连接物一般拥有双功能基团,即一端可偶联核酸的活性基团,另一端可与蛋白上的特异性位点(如NH3,SH)连接。
根据本发明一个优选的实施方式,组成框架的所有L-核酸在5'端添加醛修饰,至此完成L-核酸的活化,可后续偶联蛋白的N端α-amine。
2.蛋白-L-核酸复合物的制备方法
首先L-核酸的5'或3'端用醛修饰,然后在低pH(5-6)的条件下,通过还原性的胺反应(reductive amination reaction),将L-核酸的醛基特异性地与蛋白N端NH3连接。
算法和经算法优化的核酸序列
本发明还提供了确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法和装置。优选地,所述方法包括了本发明的优选算法。
典型地,本发明的用计算机算法优化的核酸序列文库,可包括:(a)可通过碱基互补配对自组装形成三聚体的核酸序列;(b)可通过碱基互补配对自组装形成四聚体的核酸序列;和(c)可通过碱基互补配对自组装形成五聚体的核酸序列。
代表性的的核酸序列所形成的复合物是例如如图1所示的三聚体,四聚体,五聚体分子。
优选地,本发明的所述的核酸序列W具有式1所示的结构:
W=X1–R1–X2–R2–X3 (1)
其中,
R1为碱基互补配对区域1;
R2为碱基互补配对区域2;
X1、X2和X3为各自独立地为无或冗余核酸;
R1和R2的长度为14-16碱基;
X1,X3的长度为0-5碱基;
X2的长度为0-3碱基,序列为A,AA,AGA或AAA;
其中,核酸序列的R1与不同核酸序列的R2形成目标配对,而核酸序列的R2与另一条核酸序列的R1形成目标配对。
在本发明中,所述核酸序列的任何区域的自配都属于非目标配对,是在设计中需要避免的。
优选地,本发明的所述的核酸序列可通过退火算法(Simulated Annealing,SA)的计算机算法进行设计或优化。
所述的计算机算法将目标配对形成的DNA双链结构的自由能(free energy,ΔG°)最小化,同时将非目标配对的ΔG°最大化;
具体地,DNA双链结构的稳定性取决于序列中各个最近邻的碱基对;任何沃森-克里克DNA双链结构中可能都存在10种不同的最近邻相互作用,这些成对的相互作用是:AA/TT;AT/TA;TA/AT;CA/GT;GT/CA;CT/GA;GA/CT;CG/GC;GC/CG;GG/CC;
更具体地,以上所述的10种碱基对的ΔG°值,在任意温度下,可以通过焓(enthalpy,ΔH°)和熵(entropy,ΔS°)计算得到;表1统计了10种序列的焓、熵和自由能数据。
表1. 10种序列的热力学数据
注:ΔH°、ΔS°和都是在1M Nacl,25℃,pH为7的条件下测得。从IDT网站(https://sg.idtdna.com/calc/analyzer)测得。
用表1的热力学值,DNA寡聚体的焓值ΔH°和自由能值ΔG°都可以通过最近邻的方法进行有效得预测。以GGAATTCC/CCTTAAGG的互补配对为例,通过最近邻的方法计算,ΔG°=-14.63kcal/mol。
所述的退火算法除了优化值,还实施了核酸序列配对解离温度(Tm)的约束,确保R1和R2区域的Tm>50℃(L=14碱基时)。
最近邻模型以热力学计算为基础,对DNA双链稳定性做出了精确的预测,该模型对于给定碱基序列的预测基于最近邻的碱基对。其解链温度的计算涉及到焓(enthalpy,ΔH°)和熵(entropy,ΔS°),其计算方法如下:
其中,R是一个常数(1.987cal K-1mol-1),CT是链浓度给定为0.1μM,ΔS°[Na+]是在给定钠离子浓度下的DNA双链的熵值,ΔH°是给定条件下的焓值。
模拟退火是一种通用概率算法,它是一种基于蒙特卡洛思想设计的近似求解最优化问题的方法,旨在一定时间内寻找在一个很大搜寻空间中的近似最优解。模拟退火算法的思想源于物理中固体物质退火过程:先对固体充分加温,再让其缓慢冷却,加温时,固体内部粒子自由运动内能增大,以后随着温度的逐渐下降粒子趋于有序,在每个温度都达到平衡态,若在凝结点附近温度下降速率足够慢则达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为exp(-ΔE/(KT)),其中E为温度T时的内能,ΔE为其改变量,K为波尔兹曼(Boltzmann)常数。对于组合优化问题也存在类似过程,将固体微观状态i模拟为一个解X,目标函数等价于状态i时的内能Ei,并以控制参数T模拟固体温度。对于T的每一个取值重复进行“产生新解→计算目标函数差→判断是否接受→接受/舍弃”的迭代过程,并逐步衰减T值,在迭代过程中根据Metropolis准则有限度地接受较差的解,且接受较差解的概率慢慢趋向于0,使得算法终止时尽可能找到全局最优解。
在本发明中,将多聚体核酸单链之间非目标配对区域的自由能模拟为内能,在保证核酸单链之间目标配对区域的自由能与解离温度的情况下,经过模拟退火算法的迭代,优化非目标配对区域的自由能,最后经过优化的单链更有利于多聚体的组装。使用的优化目标函数如下:
ΔG°(Si,Sj)为序列Si和序列Sj非目标配对自由能,为所有序列之间非目标配对自由能之和,其值为负,此值越大越有利于减少非目标配对。因此,依据退化算法求解能量最小化的思路构建目标函数,在ΔG°(Si,Sj)之前加入负号,将其转化为正数,此时的值越小越有利于减少非目标配对。
一种代表性的本发明的算法的流程图如图2所示。
在本发明中,模拟退火算法引入了随机因素,在每一次迭代更新的过程中,会以一定的概率来接受一个比当前要差的解,因此有可能跳出局部最优解,达到全局最优解。
多价大分子复合物
本发明还提供了用以上算法设计的核酸多聚体介导蛋白药物形成多价大分子复合物,所述的复合物具有提高的药物半衰期和活性。
优选地,所述的核酸序列是核酸序列文库里特异性组装成n聚体的核酸序列组;
优选地,在本发明中,所述的蛋白药物是需要形成多价来提高半衰期或活性的蛋白药物。
典型地,所述的核酸序列组的每条核酸链分别与所述的蛋白药物连接,形成蛋白药物-核酸链单元,具有式2所示的结构:
D–[L–Wi],i=1至n (2)
其中,
D为蛋白药物元件部分;
每个Wi独立地为核酸序列;所述核酸序列选自下组:左旋核酸、肽核酸、锁核酸、硫代修饰核酸、2'-氟修饰核酸、5-羟甲基胞嘧啶核酸、或其组合;所述核酸序列具有式1所示的结构,选自以上所述的能形成n聚体的核酸序列组;
L为连接物;所述连接物部分在Wi的合成或制备中已经包括在内,连接在Wi的X1或X3上(见式1);
“-”为共价键;
在另一优选例中,所述的药物元件部分选自下组:需要增加分子量而提高半衰期的蛋白药物和多肽药物,需要形成多价而提高活性的蛋白药物和多肽药物;
在另一优选例中,L靠近D端具有aldehyde,NHS ester或类似的官能团,用于连接D上的N端的α-amine或lysineε-amine;
在另一优选例中,L靠近D端具有maleimide官能团或haloacetyl(如bromoacetyl,iodoacetyl等)官能团,用于连接D上的free thiol(-SH)官能团;
在另一优选例中,D选自下组:天然蛋白,重组蛋白,化学修饰过的蛋白,合成的多肽;
在另一优选例中,D可以有定点修饰或定点加入非天然氨基酸用于连接式1的L-Wi
所述的蛋白药物分别连接不同的可以组装成n聚体的L–Wi,形成蛋白药物自组装单元,D–[L–W1],D–[L–W2],…,D–[L–Wn];
蛋白药物自组装单元,D–[L–W1],D–[L–W2],…,D–[L–Wn]通过等摩尔在溶液中混合,组装成蛋白药物多价分子复合物。
本发明还提供了用以上算法设计的核酸多聚体介导一种或多种抗原形成多价大分子复合物,提高疫苗在体内诱导中和性抗体产生的效果;
其中,所述的核酸序列是核酸序列文库里特异性组装成n聚体的核酸序列组;
其中,所述的抗原是一种抗原或抗原文库;所述的抗原文库包括M种不同抗原蛋白,1≤M≤n;
所述的核酸序列组的每条核酸链分别与所述的抗原文库里的抗原连接,形成抗原–核酸链单元,具有式3所示的结构:
Ak–[L–Wi],i=1-n,k=1-M (3)
其中,
Ak为所述抗原文库里抗原k;一种Ak分别对应一种或多种L–Wi(如:A1–[L–W1],A1–[L–W2],A2–[L–W3],A3–[L–W4]);
式3的其它方面和以上的式3一样;
所述的抗原蛋白分别连接不同的可以组装成n聚体的L–Wi,形成抗原自组装单元,如A1–[L–W1],A2–[L–W2],…,A3–[L–WN];
抗原自组装单元通过等摩尔在溶液中混合,组装成多价抗原复合物。
本发明的主要优点在于:
(1)本发明可以将现成的短效蛋白药物,在无需重新构建融合蛋白或复杂化学修饰和交联的条件下,完成蛋白药物的多价化,提高其半衰期和活性;L-核酸的aldehyde修饰可以特异性的连接蛋白的N端amine,形成可以自组装成寡聚体的蛋白药物单元;
(2)本发明蛋白药物单元(蛋白-核酸连接体)在一分钟内即可利用左旋核酸链介导完成蛋白药物多价化;
(3)在疫苗开发方面,本发明可以将单体蛋白抗原形成高价,提高其免疫原性;
(4)在疫苗开发方面,本发明也可以将不同病毒或细菌毒株的抗原突变型和亚型组装成多元性高价抗原,以诱更广泛性的中和抗体。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
实施例1:三聚体核酸骨架装配设计、合成及验证
设计三条可按照图1(A)形状配对的核酸。具体地,R1核酸单链与R6核酸单链进行特异性互补配对,而不与其他核酸单链配对,同样地,R3、R5分别与R2、R4进行特异性互补配对,而不与其他核酸单链配对,且特异性互补配对的自由能要远小于非特异性配对自由能特异性互补配对的自由能小于-29kcal/mol,而非特异性配对自由能则均大于-7kcal/mol,如此,三聚体的形式在反应体系中最为稳定。三聚体优化的具体实施步骤如示意图2所描述;其退火参数是:退火初始温度To=50℃,退火终止温度Tf=0.12℃,退火温度衰减系数ΔT=0.98(退火初始温度每一次衰减为当前的0.98);优化参数约束为:配对序列长度L=16碱基,解离温度阈值Tm>54℃,配对序列自由能阈值:kcal/mol,非特异性配对自由能阈值:kcal/mol。优化的具体实施步骤如下:
序列初始化:根据参数初始化配对序列R={R1,R3,R5},依据碱基互补配对得到R6、R2和R4,六条序列经过如图1(A)所示的拼接,最终得到初始化序列集合S={S1,S2,S3}。
新解产生:新解S’都是对序列集合S更新得到的。首先计算||-ΔG°(Si,Sj)||,这是为了找出集合S非特异性配对中对目标配对影响最大的两条序列Si和Sj,然后根据ΔG°(Si,Sj)非目标配对区域随机选择Si或Sj进行更新,于是得到一条新的核酸序列,检验这条核酸序列的配对区域解离温度(Tm)是否大于54℃,同时配对区域自由能是否小于-29kcal/mol,若没有达到解离温度和配对区域自由能的约束要求则重复更新,若达到解离温度和配对区域自由能的约束要求,根据碱基互补配对原则对S进行更新,最终得到新的序列集合S’。若经过十五次更新,得到的新核酸序列始终未达到解离温度和配对区域自由能的约束要求,为了防止死循环,集合S成为新解S’。
优化判断:根据公式2分别计算集合S和S’的目标函数值Ei和Ei+1,若Ei+1-Ei≥0,说明更新对非目标配对自由能进行了优化则S←S’,新解S’成为S。若Ei+1-Ei<0,说明更新得到了恶化解,根据Metropolis准则,计算概率p=exp(-ΔE/To),同时随机生成r,r∈[0,1),如果p>r,则接受这个恶化解,否则拒绝恶化解。最后退火初始温度衰减为当前的0.98,产生下一个新解,直至衰减到退火终止温度,得到优化后的序列集合S。
表21中优化后序列是经过以上算法优化得到,每条序列5’端A目的是活性基团修饰和后续的连接物偶联。在非目标配对自由能矩阵表与目标配对区域参数指标表中,统计的是一些主要参数值。三聚体优化后序列特异性配对示意图详见图3,从对应的核酸骨架跑胶图(图4)可看出,Lane9为人工设计的三聚体,其条带不清晰且拖尾,Lane10为优化后序列S1、S2和S3形成的主条带,表明形成了三聚体,且表现出极高的稳定性。
表2_1.三聚体初始化序列与优化后序列
序列编号 初始化序列 SEQ ID No:
S1 AGTGATCCGAAGTCGACAAACGTATTAGCGCTCGAT 241
S2 AATCGAGCGCTAATACGAAAGTGCAATGCGTCGATG 242
S3 ACATCGACGCATTGCACAAAGTCGACTTCGGATCAC 243
序列编号 优化后序列
S1 ACCACCGTGTATGACCTAAAAGTGACAGCACATCGC 244
S2 AGCGATGTGCTGTCACTAAAACAGGCTCTACGAGGA 245
S3 ATCCTCGTAGAGCCTGTAAAAGGTCATACACGGTGG 246
表2_2.三聚体初始化序列与优化后化序列自由能矩阵
表2_3.三聚体优化后序列目标配对区域参数指标
实施例2:四聚体核酸骨架装配设计、合成及验证
设计四条可按照图1(B)形状配对的核酸。其中,核酸单链R1、R3、R5和R7分别与核酸单链R8、R2、R4和R6进行特异性互补配对,而不与其他核酸单链配对,且特异性互补配对的自由能要远小于非特异性配对自由能特异性互补配对的自由能小于-27.4kcal/mol,而非特异性配对自由能则均大于-7kcal/mol,如此,四聚体的形式在反应体系中最为稳定。四聚体优化的具体实施步骤如示意图2所描述;其退火参数是:退火初始温度To=50℃,退火终止温度Tf=0.12℃,退火温度衰减系数ΔT=0.98(退火初始温度每一次衰减为当前的0.98);优化参数约束为:配对序列长度L=14碱基,解离温度阈值Tm>52℃,配对序列自由能阈值:kcal/mol,非特异性配对自由能阈值kcal/mol。
优化的具体实施步骤如下:
序列初始化:根据参数初始化配对序列R={R1,R3,R5,R7},依据碱基互补配对得到R8、R2、R4和R6,八条序列经过如图l(B)所示的拼接,最终得到初始化序列集合S={S1,S2,S3,S4}。在四聚体实验过程中,发现一种固定核结构可以有效提升核酸序列的组装效率,在核酸序列式1基础之上发展核酸序列W2,W2具有式4的结构:
W2=X1-Q1-C1-X2-C2-Q2-X3 (4)
其中,C1和C2为固定核结构部分,Q1和Q2为除固定核结构之外的序列。
表3.包含固定核结构的核酸序列S1、S2、S3和S4
S1 X1-Q1-AATCC-X2-TGAGC-Q2-X3
S2 X1-Q3-GCTCA-X2-CCGAA-Q4-X3
S3 X1-Q5-TTCGG-X2-ACTAT-Q6-X3
S4 X1-Q7-ATAGT-X2-GGATT-Q8-X3
新解产生:同实施例1中新解产生。不同地,若使用固定核结构,则更新不包括固定核结构部分;要严格遵守参数约束,新核酸序列配对区域的解离温度(Tm)应大于52℃,同时配对区域自由能小于-27.4kcal/mol。
优化判断:同实施例1的优化判断。
表4_1优化后序列是经过以上算法优化得到,其特异性配对示意图如图5所示,四聚体优化序列在优化过程中非配对目标自由能的折线统计图如6所示,本发明寻求在加入连接元的情况下,不会对未加入连接元的优化序列自由能产生较大影响,不管是否加入连接元优化后序列的自由能矩阵之和都尽量大,因此在优化过程中统计了未加入连接元优化序列的目标函数值,只对加入连接元优化序列做最后检测,从对应的核酸骨架跑胶图(图7)可看出,Lane15为人工设计四聚体的条带,有拖尾现象,Lane16为算法优化后序列S1、S2、S3和S4形成的主条带在100bp左右,表明形成了四聚体,且表现出极高的稳定性。
以上四聚体实施步骤主要优化的是序列之间非特异性配对自由能,而序列自身折叠形成的二级结构对四聚体的组装也有较大影响。如果序列自身形成的二级结构解离温度太高,则一旦形成这种稳定的二级结构就很难打破这种状态,导致四聚体不易组装。因此,需要控制组装四聚体的四条序列对应的二级结构解离温度不能太高。对于四聚体而言,需要控制四条核酸序列的二级结构解离温度,如果使用对称结构(图1中的R1,R3,R5,R7分别与R4,R6,R8,R2保持对称),两两序列之间会出现相似的二级结构,并且两者二级结构解离温度相差不大,此时只需控制两条核酸序列的二级结构即可达到之前的效果,因此,对称在四聚体优化中有利于对二级结构的控制。
表4_1:四聚体初始化序列与优化后序列
序列编号 初始化序列 SEQ ID No:
S1 AACCTGGTACAATCCAAATGAGCTACACTAGC 247
S2 AGCTAGTGTAGCTCAAAACCGAAGTATCGATT 248
S3 AAATCGATACTTCGGAAAACTATAGTGAGTTG 249
S4 ACAACTCACTATAGTAAAGGATTGTACCAGGT 250
序列编号 优化后序列
S1 AGGCGATCACAATCCAAATGAGCGTGTTACGG 251
S2 ACCGTAACACGCTCAAAACCGAAGTGCCAATT 252
S3 AAATTGGCACTTCGGAAAACTATGCGGCTGCT 253
S4 AAGCAGCCGCATAGTAAAGGATTGTGATCGCC 254
表4_2:四聚体初始化序列与优化后序列自由能矩阵
表4_3:四聚体优化序列配对区域参数指标
实施例3:五聚体核酸骨架装配设计、合成及验证
四聚体的优化序列表现出非常良好的组装效果,很大程度上是因为四聚体中心部位没有形成配对,也就是固定核结构给予了四聚体充分的自由度,不会在中心区域形成复杂的复合物。因此,为在五聚体序列的优化中整合四聚体序列及固定核结构,探索、设计出两种利用实施例2四聚体序列与固定核结构的方案。
第一种转化方案:设计五条可按照图8(B)形状配对的核酸,此方案保留了实施例2中四聚体的部分序列和完整的固定核结构,并且核结构没有被打开。在原四聚体的R1和R8处除核结构之外打开四聚体,加入两条长度为14的核酸序列R9和R10。其中,核酸单链R1、R3、R5、R7和R9分别与核酸单链R10、R2、R4、R6和R8进行特异性互补配对,而不与其他核酸单链配对。特异性互补配对的自由能小于-27.4kcal/mol,而非特异性配对自由能则均大于-7kcal/mol,如此,五聚体的形式在反应体系中最为稳定。五聚体第一种转化方案优化的具体实施步骤如示意图2所描述;其退火参数是:退火初始温度To=50℃,退火终止温度Tf=0.12℃,退火温度衰减系数ΔT=0.9(退火初始温度每一次衰减为当前的0.9,因使用四聚体部分序列故更新区域变少退火温度衰减更快);优化参数约束为:配对序列长度L=14碱基,解离温度阈值Tm>52℃,配对序列自由能阈值:kcal/mol,非特异性配对自由能阈值kcal/mol。
此种方案中使用了完整的四聚体固定核结构,在核酸序列式4基础之上发展核酸序列W5,在核酸序列式4基础之上发展核酸序列W6,W5具有式7的结构,W6具有式8的结构:
W3=X1-R1-X2-C1-X2-C2-Q1-X3 (5)
W4=X1-Q1-C1-X2-C2-X2-R1-X3 (6)
此种方案包含式1、式4、式5和式6,四种结构的序列。
表5.包含部分核结构的核酸序列S1、S2、S3、S4和S5
S1 X1-R9-X2-R10-X3
S2 X1-R1-X2-AATCC-X2-TGAGC-Q1-X3
S3 X1-Q2-GCTCA-X2-CCGAA-Q3-X3
S4 X1-Q4-TTCGG-X2-ACTAT-Q5-X3
S5 X1-Q6-ATAGT-X2-GGATT-X2-R8-X3
优化的具体实施步骤如下:
根据参数初始化配对序列R={R9,Rl0},依据碱基互补配对得到R8和R1,R2、R3、R4、R5、R6和R7来自于实施例2四聚体优化后序列的同名序列。R9与R10拼接得到S1,R1与R2按式5拼接得到S2,R3与R4拼接得到S3,R5与R6拼接得到S4,R7与R8按式6拼接得到S5,最终得到初始化序列集合S={S1,S2,S3,S4,S5}。
新解产生:随机在R1、R8、R9和R10中选择一条序列进行更新,于是得到一条新的核酸序列,检验这条核酸序列的解离温度是否大于52℃,同时配对区域自由能是否小于-27.4kcal/mol,若没有达到解离温度和配对区域自由能的约束要求则重复更新,若达到解离温度和配对区域自由能的约束要求,根据碱基互补配对原则对S进行更新,最终得到新的序列集合S’。若经过十五次更新,得到的新核酸序列始终未达到解离温度和配对区域自由能的约束要求,为了防止死循环,集合S成为新解S’。因为此种方案使用了完整的固定核结构及部分四聚体序列,在新解产生的过程中要保证固定核结构和保留的四聚体序列部分不变。
优化判断:同实施例1的优化判断。不同地,退火初始温度衰减为当前的0.9。
表6_1中五聚体第一种转化方案优化后序列是经过此算法优化得到,图9为在此优化过程中序列间非目标配对区域自由能值之和折线统计图(S3与S3,S3与S4,S4与S4之间的非目标配对区域自由能未参与统计),图10中Lane9为优化后序列组装形成的主条带,表明形成了五聚体,且表现出极高的稳定性。
表6_1.五聚体第一种转化方案初始化序列与优化后序列
序列编号 初始化序列 SEQ ID No:
S1 ATCACAGAGCGCGTAAAAACGCCACTCATGGA 255
S2 ATCCATGAGTGGCGTAAAAATCCAAATGAGCGTGTTACGG 256
S3 ACCGTAACACGCTCAAAACCGAAGTGCCAATT 257
S4 AAATTGGCACTTCGGAAAACTATGCGGCTGCT 258
S5 AAGCAGCCGCATAGTAAAGGATTAAATACGCGCTCTGTGA 259
序列编号 优化后序列
S1 ATTCAGGCGACTCCTAAAAGCACGACGATGGT 260
S2 AACCATCGTCGTGCTAAAAATCCAAATGAGCGTGTTACGG 261
S3 ACCGTAACACGCTCAAAACCGAAGTGCCAATT 262
S4 AAATTGGCACTTCGGAAAACTATGCGGCTGCT 263
S5 AAGCAGCCGCATAGTAAAGGATTAAAAGGAGTCGCCTGAA 264
表6_2.五聚体第一种转化方案初始化序列与优化后序列自由能矩阵
表6_3.五聚体优化序列1配对区域参数指标
第二种转化方案:设计五条可按照图8(C)形状配对的核酸,此种方案只保留了四聚体的固定核结构序列,为了适应五聚体,核结构在R1和R2处打开,其他部分需要随机产生然后进行五聚体优化。其中,核酸单链R10、R2、R4、R6和R8分别与核酸单链R1、R3、R5、R7和R9进行特异性互补配对,而不与其他核酸单链配对。特异性互补配对的自由能小于-27.4kcal/mol,而非特异性配对自由能则均大于-7.2kcal/mol,如此,五聚体的形式在反应体系中最为稳定。五聚体第二种转化方案优化的具体实施步骤如示意图2所描述;其退火参数是:退火初始温度To=50℃,退火终止温度Tf=0.12℃,退火温度衰减系数ΔT=0.98(退火初始温度每一次衰减为当前的0.98);优化参数约束为:配对序列长度L=14碱基,解离温度阈值Tm>52℃,配对序列自由能阈值:kcal/mol,非特异性配对自由能阈值kcal/mol。
表7:包含部分核结构的核酸序列S1、S2、S3、S4和S5
S1 X1-Q1-AATCC-X2-R10-X3
S2 X1-R2-X2-TGAGC-Q2-X3
S3 X1-Q3-GCTCA-X2-CCGAA-Q4-X3
S4 X1-Q5-TTCGG-X2-ACTAT-Q6-X3
S5 X1-Q7-ATAGT-X2-GGATT-Q8-X3
优化的具体实施步骤如下:
序列初始化:根据优化参数约束初始化配对序列R9和除核结构之外长度为9的序列集合Q={Q1,Q3,Q5,Q7},依据碱基互补配对的原则得到R8、Q2、Q4、Q6和Q8,按表7拼接,最终得到初始化序列集合S={S1,S2,S3,S4,S5}。
新解产生:同实施例1的新解产生。不同地,因为此种方案使用了四聚体的固定核结构,在新解产生的过程中要保证固定核结构部分不变。同时严格遵守参数约束,更新核酸序列配对区域的解离温度大于52℃,同时配对区域自由能小于-27.4kcal/mol。
优化判断:同实施例1的优化判断。
表81中五聚体第二种转化方案的优化后序列是经过此算法优化得到,其特异性配对示意图如图11所示,图12为在此优化过程中序列间非目标配对区域自由能值之和折线统计图,图13中Lane35为序列S1、S2、S3、S4和S5形成的主条带,虽然五聚体有些拖尾但组装效果良好。
表8_1.五聚体第二种转化方案初始化序列与优化后序列
序列编号 初始化序列 SEQ ID No:
S1 ATGAGTGCGCAATCCAAATCGCCAGTCATGCA 265
S2 ATGCATGACTGGCGAAAATGAGCGCTCGTTGA 266
S3 ATCAACGAGCGCTCAAAACCGAAGTGCCAACT 267
S4 AAGTTGGCACTTCGGAAAACTATCGCGCGACT 268
S5 AAGTCGCGCGATAGTAAAGGATTGCGCACTCA 269
序列编号 优化后序列
S1 ATCACGCAGCAATCCAAATCGCCATCACAACG 270
S2 ACGTTGTGATGGCGAAAATGAGCACGAGCCTT 271
S3 AAAGGCTCGTGCTCAAAACCGAAGGTTGCACT 272
S4 AAGTGCAACCTTCGGAAAACTATGCCGCTCCA 273
S5 ATGGAGCGGCATAGTAAAGGATTGCTGCGTGA 274
表8_2.五聚体第二种转化方案初始化序列与优化后序列自由能矩阵
表8_3.五聚体优化序列2配对区域参数指标
此外,重复实施例1、2和3,从而获得了表9-1、表9-2和表9-3(见上文)所示的用于形成基于互配核酸骨架的三、四和五聚体复合物的单链核酸序列及其集合。
实施例4:G-CSF与L-DNA的偶联
G-CSF与L-DNA的偶联采用还原胺化反应的方式将5’端带有醛基修饰的L-DNA有选择性地偶联在G-CSF的N末端。用稀释法或凝胶过滤层析等方法将G-CSF的缓冲液置换为醋酸盐缓冲液(20mM acetate,150mM NaCl,pH 5.0)并将样品浓缩至30mg/ml。取100OD(1OD=33μg)5’端带有醛基修饰的L-DNA干粉溶解于60μL醋酸盐缓冲液。取30mg氰基硼氢化钠,用醋酸盐缓冲液溶解,将浓度调整为800mM。分别取50μL,60μL,20μL上述浓度的G-CSF,L-DNA,氰基硼氢化钠并混合均匀,避光室温旋转孵育反应48小时。反应前后的样品用聚丙烯酰胺凝胶电泳验证偶联反应效果,(L-DNA)-(G-CSF)偶联物相比未偶联的G-CSF在电泳胶图上发生了明显偏移,偶联效率可达70%~80%(图14)。
实施例5:(L-DNA)-(G-CSF)偶联物的纯化
(L-DNA)-(G-CSF)偶联物的纯化分为2个步骤。第一步,利用Hitrap Q HP除去未反应的G-CSF以及连上2条L-DNA的(L-DNA)2-(G-CSF)偶联物(图15a)。将实施例5获得的反应混合液用Q柱的上样缓冲液稀释10倍后上样,用上样缓冲液洗脱10倍柱体积以除去未反应的G-CSF,之后采用0-100%线性梯度洗脱的方式洗脱50倍柱体积以分离(L-DNA)-(G-CSF)偶联物和(L-DNA)2-(G-CSF)偶联物,运用聚丙烯酰胺凝胶电泳鉴定各A280吸收峰所属组分类型(图15b),收集(L-DNA)-(G-CSF)偶联物(含未反应的核酸)。第二步利用HiscreenCapto MMC除去未反应的核酸,最终分离获得纯度较高的(L-DNA)-(G-CSF)偶联物(图15c)。将步骤一收集的样品直接上样至Hiscreen Capto MMC柱子,用上样缓冲液洗脱10倍柱体积以除去未反应的核酸,之后用100%洗脱缓冲液洗脱(L-DNA)-(G-CSF)偶联物。
纯化条件如下表:
经过两步纯化法获得的(L-DNA)-(G-CSF)偶联物样品用2%的琼脂糖凝胶电泳鉴定样品纯度(图15d),胶图显示样品中仅有一条核酸条带且(L-DNA)-(G-CSF)偶联物相比未偶联的L-DNA在电泳胶图上发生了明显偏移,表明未反应的核酸以及(L-DNA)2-(G-CSF)偶联物已清除干净。
实施例6:一价、二价和三价G-CSF复合物的组装
分别用Nanodrop测定S1-G-CSF、S3-G-CSF、S4-G-CSF、S2、S3、S4的核酸浓度。按照一、二价和三价蛋白复合物的结构设计取适量上述组分,按照1:1:1:1摩尔比例混合,混合后各组装单元根据碱基互补配对原则自动完成组装。组装前后样品用聚丙烯酰胺凝胶电泳鉴定组装效果和样品纯度(图16)。
实施例7:G-CSF体外活性评价
将M-NFS-60细胞(小鼠白血病淋巴细胞/G-CSF依赖性细胞)接种于复苏培养液(RPMI1640+10%FBS+15ng/ml G-CSF+1X青霉素-链霉素)中,37℃,5%CO2条件下进行细胞复苏,待细胞密度达80%-90%进行传代,传代两到三次后,接种于96孔板中进行细胞铺板。细胞铺板实验采用corning 3599#96孔板,细胞铺板密度为6000个/孔。对不同的样品(GCSF,NAPPA4-GCSF,NAPPA4-GCSF2,NAPPA4-GCSF3)进行梯度稀释,工作浓度为(0.001,0.01,0.1,1 10,100ng/ml),终体积为100μL,使用PBS作为对照。在恒温培养箱中培养48小时后,向每孔加入10μL CCK8溶液,将培养板在培养箱内孵育1-4小时,用酶标仪测定在450nm处的吸光度,计算不同样品的细胞增殖率。
细胞增殖率(%)=[A(加药)-A(0加药)]/[A(0加药)-A(空白)]×100
A(加药):具有细胞、CCK溶液和药物溶液的孔的吸光度
A(空白):具有培养基和CCK8溶液而没有细胞的孔的吸光度
A(0加药):具有细胞、CCK8溶液而没有药物溶液的孔的吸光度
用以上的活性测试方法对一个G-CSF连接L-DNA四聚体框架进行了活性评价,发现L-DNA四聚体框架对G-CSF的活性没有影响(图17)。用同样的活性测试方法发现用L-DNA四聚体组装的二价和三价G-CSF对G-CSF的活性也没有负面影响(图18)。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 安升(上海)医药科技有限公司
<120> 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
<130> P2020-0999-1CNCN
<140> CN2020113403773
<141> 2020-11-25
<160> 274
<170> PatentIn version 3.5
<210> 1
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
acacctggtt gttggataaa tcgttgaagg ctagga 36
<210> 2
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atcctagcct tcaacgaaaa aactagagtc cgccga 36
<210> 3
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atcggcggac tctagttaaa atccaacaac caggtg 36
<210> 4
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atgcgttgag ttccagtaaa ggcaacatca ccacat 36
<210> 5
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aatgtggtga tgttgccaaa tctgaatcct cgtgct 36
<210> 6
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aagcacgagg attcagaaaa actggaactc aacgca 36
<210> 7
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
attccaatcg tcctgtgaaa agttccgctc tgagtt 36
<210> 8
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aaactcagag cggaactaaa ctggcagatg gatgaa 36
<210> 9
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
attcatccat ctgccagaaa cacaggacga ttggaa 36
<210> 10
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
acgaggcaag ttctgtgaaa atgactacca ggtccg 36
<210> 11
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
acggacctgg tagtcataaa atccactgac gctgaa 36
<210> 12
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
attcagcgtc agtggataaa cacagaactt gcctcg 36
<210> 13
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atagttcgtt gctcggaaaa ggcattgaga ggacct 36
<210> 14
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aaggtcctct caatgccaaa atggtgatgt cgcttg 36
<210> 15
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
acaagcgaca tcaccataaa tccgagcaac gaacta 36
<210> 16
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
agtcgtgtgc ttccaagaaa tagccaggtg aggact 36
<210> 17
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aagtcctcac ctggctaaaa aacagcggag tgtcat 36
<210> 18
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aatgacactc cgctgttaaa cttggaagca cacgac 36
<210> 19
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
aacgcatcgc ttgatagaaa agaggagcac ggttat 36
<210> 20
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aataaccgtg ctcctctaaa gtaggcaatc caccat 36
<210> 21
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aatggtggat tgcctacaaa ctatcaagcg atgcgt 36
<210> 22
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
agtcgttcca ccgaacaaaa tggctctggt cattga 36
<210> 23
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atcaatgacc agagccaaaa aatcgcacat ctcagg 36
<210> 24
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
acctgagatg tgcgattaaa tgttcggtgg aacgac 36
<210> 25
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
agcggagtga ccatagtaaa aggcaggaca ttgttc 36
<210> 26
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
agaacaatgt cctgcctaaa gtgctcgtcg tgaaga 36
<210> 27
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
atcttcacga cgagcacaaa actatggtca ctccgc 36
<210> 28
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aattggaccg ctctactaaa atggcaccac agtcaa 36
<210> 29
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
attgactgtg gtgccataaa caggctatca gcatcc 36
<210> 30
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
aggatgctga tagcctgaaa agtagagcgg tccaat 36
<210> 31
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
accattgagc cagtgataaa aaccgttgtg agttgc 36
<210> 32
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
agcaactcac aacggttaaa tcgcacacct gtcgta 36
<210> 33
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
atacgacagg tgtgcgaaaa atcactggct caatgg 36
<210> 34
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
aagtgaagaa gcagcctaaa gttgtcatcg cacacc 36
<210> 35
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
aggtgtgcga tgacaacaaa atgtcgtaac cgtgga 36
<210> 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
atccacggtt acgacataaa aggctgcttc ttcact 36
<210> 37
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
aatagcgtct tgagcctaaa tggaggacat accgac 36
<210> 38
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
agtcggtatg tcctccaaaa ggtcacagtt gctgct 36
<210> 39
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
aagcagcaac tgtgaccaaa aggctcaaga cgctat 36
<210> 40
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atgccgtgtt cagattcaaa tgtgcgtctg gattga 36
<210> 41
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
atcaatccag acgcacaaaa agacaggtgg tccgat 36
<210> 42
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
aatcggacca cctgtctaaa gaatctgaac acggca 36
<210> 43
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
attcaggaca gcgtcataaa accgactgga gcaact 36
<210> 44
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
aagttgctcc agtcggtaaa gatgccttcg tgtgag 36
<210> 45
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
actcacacga aggcatcaaa atgacgctgt cctgaa 36
<210> 46
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
agcagccaag gttatctaaa caatgacacg gaggat 36
<210> 47
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
aatcctccgt gtcattgaaa gtgattcgca ccagac 36
<210> 48
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
agtctggtgc gaatcacaaa agataacctt ggctgc 36
<210> 49
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
accaccgtgt atgacctaaa agtgacagca catcgc 36
<210> 50
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
agcgatgtgc tgtcactaaa acaggctcta cgagga 36
<210> 51
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
atcctcgtag agcctgtaaa aggtcataca cggtgg 36
<210> 52
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
aactacggag cgaagataaa tcctgaccaa cttgct 36
<210> 53
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
aagcaagttg gtcaggaaaa gactggctga acacga 36
<210> 54
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
atcgtgttca gccagtcaaa atcttcgctc cgtagt 36
<210> 55
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
agttcctgat ccagcctaaa catccttgtc ttgcca 36
<210> 56
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
atggcaagac aaggatgaaa cacgaccgct tagaag 36
<210> 57
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
acttctaagc ggtcgtgaaa aggctggatc aggaac 36
<210> 58
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
atatcgcact ccagcataaa ccgtgtgaac atcagg 36
<210> 59
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
acctgatgtt cacacggaaa agcctacgag acttgg 36
<210> 60
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
accaagtctc gtaggctaaa atgctggagt gcgata 36
<210> 61
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
aagcgtcgtg aatccaaatg agcctgccaa tg 32
<210> 62
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
acattggcag gctcaaaacc gaagtcaacg ct 32
<210> 63
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
aagcgttgac ttcggaaaac tatggacggc ga 32
<210> 64
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
atcgccgtcc atagtaaagg attcacgacg ct 32
<210> 65
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
aatggcgagc aatccaaatg agcctggacc aa 32
<210> 66
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
attggtccag gctcaaaacc gaacgctgtg at 32
<210> 67
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
aatcacagcg ttcggaaaac tatcgtgcgg ca 32
<210> 68
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
atgccgcacg atagtaaagg attgctcgcc at 32
<210> 69
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
atgaccacgc aatccaaatg agccaacctc ca 32
<210> 70
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
atggaggttg gctcaaaacc gaacagcagc tt 32
<210> 71
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
aaagctgctg ttcggaaaac tatctgccgc ct 32
<210> 72
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
aaggcggcag atagtaaagg attgcgtggt ca 32
<210> 73
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
atgtcgcacc aatccaaatg agcaagcctc gt 32
<210> 74
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
aacgaggctt gctcaaaacc gaacgctgtc at 32
<210> 75
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
aatgacagcg ttcggaaaac tatgtggcgg ca 32
<210> 76
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
atgccgccac atagtaaagg attggtgcga ca 32
<210> 77
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
atgctggcac aatccaaatg agcgacgagg tt 32
<210> 78
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
aaacctcgtc gctcaaaacc gaagtgccag tt 32
<210> 79
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
aaactggcac ttcggaaaac tatgaggcgg ct 32
<210> 80
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
aagccgcctc atagtaaagg attgtgccag ca 32
<210> 81
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
atgtcgcacc aatccaaatg agcaggttgg ca 32
<210> 82
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
atgccaacct gctcaaaacc gaacgctgtc aa 32
<210> 83
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
attgacagcg ttcggaaaac tatcagccgc ct 32
<210> 84
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
aaggcggctg atagtaaagg attggtgcga ca 32
<210> 85
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
atgtggtcgc aatccaaatg agcacctgcc aa 32
<210> 86
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
attggcaggt gctcaaaacc gaacgtgacg at 32
<210> 87
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
aatcgtcacg ttcggaaaac tatcaacgcc gc 32
<210> 88
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
agcggcgttg atagtaaagg attgcgacca ca 32
<210> 89
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
aagcgtcgtc aatccaaatg agcacggcaa tg 32
<210> 90
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
acattgccgt gctcaaaacc gaagtgaacg ct 32
<210> 91
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
aagcgttcac ttcggaaaac tatggctcgc ct 32
<210> 92
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
aaggcgagcc atagtaaagg attgacgacg ct 32
<210> 93
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
atgtggcgac aatccaaatg agcaagcctc ca 32
<210> 94
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
atggaggctt gctcaaaacc gaagacgctg tt 32
<210> 95
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
aaacagcgtc ttcggaaaac tatcgtgcgg ca 32
<210> 96
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
atgccgcacg atagtaaagg attgtcgcca ca 32
<210> 97
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
atgctgccac aatccaaatg agcctggaac ca 32
<210> 98
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
atggttccag gctcaaaacc gaacgcagtc at 32
<210> 99
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
aatgactgcg ttcggaaaac tatcgccgct ct 32
<210> 100
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
aagagcggcg atagtaaagg attgtggcag ca 32
<210> 101
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
atgcgtcgtc aatccaaatg agcttggcaa gg 32
<210> 102
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
accttgccaa gctcaaaacc gaacgtgctg tt 32
<210> 103
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
aaacagcacg ttcggaaaac tatggagcgg ct 32
<210> 104
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
aagccgctcc atagtaaagg attgacgacg ca 32
<210> 105
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
aactgccagc aatccaaatg agcctcgttc ca 32
<210> 106
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
atggaacgag gctcaaaacc gaagttggca gt 32
<210> 107
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
aactgccaac ttcggaaaac tatcgccgct tg 32
<210> 108
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
acaagcggcg atagtaaagg attgctggca gt 32
<210> 109
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
atgcgtcgtc aatccaaatg agcctccagg tt 32
<210> 110
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
aaacctggag gctcaaaacc gaatgacacg ct 32
<210> 111
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
aagcgtgtca ttcggaaaac tatggcggca gt 32
<210> 112
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
aactgccgcc atagtaaagg attgacgacg ca 32
<210> 113
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
aagcgtcgtg aatccaaatg agccatcgtc ca 32
<210> 114
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
atggacgatg gctcaaaacc gaatgtgctg gt 32
<210> 115
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
aaccagcaca ttcggaaaac tatgcggcaa cc 32
<210> 116
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
aggttgccgc atagtaaagg attcacgacg ct 32
<210> 117
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
attgccagga tgctgaatca cggtcggaca 30
<210> 118
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
atgtccgacc gtgatagtcg cagaaggcat 30
<210> 119
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
aatgccttct gcgacatagt acaacgccgc 30
<210> 120
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
agcggcgttg tactaacagc atcctggcaa 30
<210> 121
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
aggcgatcac aatccaaatg agcgtgttac gg 32
<210> 122
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 123
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 124
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
aagcagccgc atagtaaagg attgtgatcg cc 32
<210> 125
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
atggtccaac acgctaagcc tcaccgtctt 30
<210> 126
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
aaagacggtg aggctatcgc acaacctggt 30
<210> 127
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
aaccaggttg tgcgaatcgg agtggcagaa 30
<210> 128
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
attctgccac tccgaaagcg tgttggacca 30
<210> 129
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
aaccttggtg tgcgaaactc ctggcagcaa 30
<210> 130
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
attgctgcca ggagtaagcg tgtggttcca 30
<210> 131
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
atggaaccac acgctatgag gaccgtcgtt 30
<210> 132
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
aaacgacggt cctcaatcgc acaccaaggt 30
<210> 133
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
atgccaagtc cgagaatgct gcgaactggt 30
<210> 134
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
aaccagttcg cagcaaagag cctgaaccgt 30
<210> 135
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
aacggttcag gctctaacga cgcttgacca 30
<210> 136
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
atggtcaagc gtcgtatctc ggacttggca 30
<210> 137
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
aagcagcctc gttgaatcgc caagacacct 30
<210> 138
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
aaggtgtctt ggcgaaagtt gctccgacga 30
<210> 139
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
atcgtcggag caactaagcg gttctgtgga 30
<210> 140
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
atccacagaa ccgctatcaa cgaggctgct 30
<210> 141
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 141
atcaggcgac ctcttaaaac caccatcgtt gc 32
<210> 142
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 142
agcaacgatg gtggtaaaaa tccaaatgag cgtgttacgg 40
<210> 143
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 143
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 144
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 144
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 145
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 145
aagcagccgc atagtaaagg attaaaaaga ggtcgcctga 40
<210> 146
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 146
aggcgacgat gtcttaaaac ctggttgctg ga 32
<210> 147
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 147
atccagcaac caggtaaaaa tccaaatgag cgtgttacgg 40
<210> 148
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 148
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 149
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 149
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 150
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 150
aagcagccgc atagtaaagg attaaaaaga catcgtcgcc 40
<210> 151
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 151
atggaacctg gtgctaaatg ctcgcctgtc aa 32
<210> 152
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 152
attgacaggc gagcaaaaaa tccaaatgag cgtgttacgg 40
<210> 153
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 153
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 154
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 154
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 155
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 155
aagcagccgc atagtaaagg attaaaagca ccaggttcca 40
<210> 156
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 156
atggtcaggc gacttaaaag gacgaggttg ct 32
<210> 157
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 157
aagcaacctc gtcctaaaaa tccaaatgag cgtgttacgg 40
<210> 158
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 158
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 159
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 159
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 160
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 160
aagcagccgc atagtaaagg attaaaaagt cgcctgacca 40
<210> 161
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 161
atgctggacc accttaaatc agatggaggc ga 32
<210> 162
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 162
atcgcctcca tctgaaaaaa tccaaatgag cgtgttacgg 40
<210> 163
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 163
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 164
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 164
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 165
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 165
aagcagccgc atagtaaagg attaaaaagg tggtccagca 40
<210> 166
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 166
aaacgtccag gagctaaatc tcgtcgcctg aa 32
<210> 167
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 167
attcaggcga cgagaaaaaa tccaaatgag cgtgttacgg 40
<210> 168
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 168
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 169
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 169
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 170
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 170
aagcagccgc atagtaaagg attaaaagct cctggacgtt 40
<210> 171
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 171
accacgacca ttgctaaaaa cttcaggcga cg 32
<210> 172
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 172
acgtcgcctg aagttaaaaa tccaaatgag cgtgttacgg 40
<210> 173
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 173
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 174
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 174
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 175
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 175
aagcagccgc atagtaaagg attaaaagca atggtcgtgg 40
<210> 176
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 176
aaggcgaggt cttcaaaatg gttgctggac ga 32
<210> 177
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 177
atcgtccagc aaccaaaaaa tccaaatgag cgtgttacgg 40
<210> 178
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 178
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 179
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 179
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 180
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 180
aagcagccgc atagtaaagg attaaatgaa gacctcgcct 40
<210> 181
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 181
atcaaggcga ccagtaaaaa gctcctcgac ga 32
<210> 182
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 182
atcgtcgagg agcttaaaaa tccaaatgag cgtgttacgg 40
<210> 183
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 183
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 184
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 184
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 185
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 185
aagcagccgc atagtaaagg attaaaactg gtcgccttga 40
<210> 186
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 186
attcaggcga ctcctaaaag cacgacgatg gt 32
<210> 187
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 187
aaccatcgtc gtgctaaaaa tccaaatgag cgtgttacgg 40
<210> 188
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 188
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 189
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 189
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 190
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 190
aagcagccgc atagtaaagg attaaaagga gtcgcctgaa 40
<210> 191
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 191
aagcacctgc aatccaaatc gccaggacaa gt 32
<210> 192
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 192
aacttgtcct ggcgaaaatg agcaaccatg cc 32
<210> 193
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 193
aggcatggtt gctcaaaacc gaacgtcgtg at 32
<210> 194
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 194
aatcacgacg ttcggaaaac tatggagcgg ct 32
<210> 195
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 195
aagccgctcc atagtaaagg attgcaggtg ct 32
<210> 196
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 196
aacctgctgc aatccaaatc gccacctcaa ga 32
<210> 197
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 197
atcttgaggt ggcgaaaatg agcctggacg tt 32
<210> 198
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 198
aaacgtccag gctcaaaacc gaactggtgc tt 32
<210> 199
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 199
aaagcaccag ttcggaaaac tatgccgctc ct 32
<210> 200
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 200
aaggagcggc atagtaaagg attgcagcag gt 32
<210> 201
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 201
aagctggtgc aatccaaatc gcctcctgac aa 32
<210> 202
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 202
attgtcagga ggcgaaaatg agcaaggttg gc 32
<210> 203
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 203
agccaacctt gctcaaaacc gaacgcagat gt 32
<210> 204
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 204
aacatctgcg ttcggaaaac tatggagcgg ca 32
<210> 205
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 205
atgccgctcc atagtaaagg attgcaccag ct 32
<210> 206
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 206
atgcacgcac aatccaaatc gccatcagag gt 32
<210> 207
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 207
aacctctgat ggcgaaaatg agctgcctcc at 32
<210> 208
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 208
aatggaggca gctcaaaacc gaacgtcgtc at 32
<210> 209
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 209
aatgacgacg ttcggaaaac tatcgagcgg ct 32
<210> 210
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 210
aagccgctcg atagtaaagg attgtgcgtg ca 32
<210> 211
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 211
aagcgtcgtg aatccaaatc gccatcagac ca 32
<210> 212
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 212
atggtctgat ggcgaaaatg agcaaggctc gt 32
<210> 213
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 213
aacgagcctt gctcaaaacc gaaccagctt gt 32
<210> 214
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 214
aacaagctgg ttcggaaaac tatgcggcag gt 32
<210> 215
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 215
aacctgccgc atagtaaagg attcacgacg ct 32
<210> 216
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 216
atcagcacgc aatccaaatc gccagttcaa cc 32
<210> 217
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 217
aggttgaact ggcgaaaatg agcaagcagg ct 32
<210> 218
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 218
aagcctgctt gctcaaaacc gaacgtggtg tt 32
<210> 219
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 219
aaacaccacg ttcggaaaac tatggagcgg ca 32
<210> 220
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 220
atgccgctcc atagtaaagg attgcgtgct ga 32
<210> 221
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 221
aagctgcacc aatccaaatc gccagaaggt ca 32
<210> 222
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 222
atgaccttct ggcgaaaatg agcacgacgc at 32
<210> 223
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 223
aatgcgtcgt gctcaaaacc gaacaacctg ct 32
<210> 224
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 224
aagcaggttg ttcggaaaac tatggagcgg ca 32
<210> 225
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 225
atgccgctcc atagtaaagg attggtgcag ct 32
<210> 226
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 226
aacgctcgtc aatccaaatc gcctcaggac aa 32
<210> 227
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 227
attgtcctga ggcgaaaatg agccaacgac ct 32
<210> 228
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 228
aaggtcgttg gctcaaaacc gaagctggtg tt 32
<210> 229
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 229
aaacaccagc ttcggaaaac tatgccgcac ct 32
<210> 230
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 230
aaggtgcggc atagtaaagg attgacgagc gt 32
<210> 231
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 231
aagtgcgtcg aatccaaatc gccaagacct ca 32
<210> 232
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 232
atgaggtctt ggcgaaaatg agcaggctgg aa 32
<210> 233
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 233
attccagcct gctcaaaacc gaagcaacgt gt 32
<210> 234
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 234
aacacgttgc ttcggaaaac tatgccgctc ct 32
<210> 235
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 235
aaggagcggc atagtaaagg attcgacgca ct 32
<210> 236
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 236
atcacgcagc aatccaaatc gccatcacaa cg 32
<210> 237
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 237
acgttgtgat ggcgaaaatg agcacgagcc tt 32
<210> 238
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 238
aaaggctcgt gctcaaaacc gaaggttgca ct 32
<210> 239
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 239
aagtgcaacc ttcggaaaac tatgccgctc ca 32
<210> 240
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 240
atggagcggc atagtaaagg attgctgcgt ga 32
<210> 241
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 241
agtgatccga agtcgacaaa cgtattagcg ctcgat 36
<210> 242
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 242
aatcgagcgc taatacgaaa gtgcaatgcg tcgatg 36
<210> 243
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 243
acatcgacgc attgcacaaa gtcgacttcg gatcac 36
<210> 244
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 244
accaccgtgt atgacctaaa agtgacagca catcgc 36
<210> 245
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 245
agcgatgtgc tgtcactaaa acaggctcta cgagga 36
<210> 246
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 246
atcctcgtag agcctgtaaa aggtcataca cggtgg 36
<210> 247
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 247
aacctggtac aatccaaatg agctacacta gc 32
<210> 248
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 248
agctagtgta gctcaaaacc gaagtatcga tt 32
<210> 249
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 249
aaatcgatac ttcggaaaac tatagtgagt tg 32
<210> 250
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 250
acaactcact atagtaaagg attgtaccag gt 32
<210> 251
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 251
aggcgatcac aatccaaatg agcgtgttac gg 32
<210> 252
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 252
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 253
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 253
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 254
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 254
aagcagccgc atagtaaagg attgtgatcg cc 32
<210> 255
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 255
atcacagagc gcgtaaaaac gccactcatg ga 32
<210> 256
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 256
atccatgagt ggcgtaaaaa tccaaatgag cgtgttacgg 40
<210> 257
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 257
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 258
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 258
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 259
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 259
aagcagccgc atagtaaagg attaaatacg cgctctgtga 40
<210> 260
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 260
attcaggcga ctcctaaaag cacgacgatg gt 32
<210> 261
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 261
aaccatcgtc gtgctaaaaa tccaaatgag cgtgttacgg 40
<210> 262
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 262
accgtaacac gctcaaaacc gaagtgccaa tt 32
<210> 263
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 263
aaattggcac ttcggaaaac tatgcggctg ct 32
<210> 264
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 264
aagcagccgc atagtaaagg attaaaagga gtcgcctgaa 40
<210> 265
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 265
atgagtgcgc aatccaaatc gccagtcatg ca 32
<210> 266
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 266
atgcatgact ggcgaaaatg agcgctcgtt ga 32
<210> 267
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 267
atcaacgagc gctcaaaacc gaagtgccaa ct 32
<210> 268
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 268
aagttggcac ttcggaaaac tatcgcgcga ct 32
<210> 269
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 269
aagtcgcgcg atagtaaagg attgcgcact ca 32
<210> 270
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 270
atcacgcagc aatccaaatc gccatcacaa cg 32
<210> 271
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 271
acgttgtgat ggcgaaaatg agcacgagcc tt 32
<210> 272
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 272
aaaggctcgt gctcaaaacc gaaggttgca ct 32
<210> 273
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 273
aagtgcaacc ttcggaaaac tatgccgctc ca 32
<210> 274
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 274
atggagcggc atagtaaagg attgctgcgt ga 32

Claims (14)

1.一种确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法,其特征在于,包括步骤:
(a)设置退火算法参数:
设置退火初始温度、退火终止温度和退火温度衰减系数ΔT;
设置优化约束参数:
①核酸单链的数量n,其中n为3-6的正整数;
②配对序列长度L,其中L为12-16碱基;
③配对区域解离温度阈值Tm,所述Tm根据配对序列长度而定,其中L=14碱基时,Tm>50℃;L=16碱基时,Tm>52℃;
④特异性配对区域序列自由能阈值所述根据配对序列长度而定,其中L=14碱基时,L=16碱基时,
⑤非特异性配对自由能阈值其中
⑥连接元X2,所述连接元X2选自下组:A、AA、AAA;
⑦二级结构(hairpin)解离温度阈值Tm-H,所述Tm-H<40℃;
⑧配对序列中CG比例PCG,其范围为[0.4,0.6),
根据以上参数初始化序列集合S={S1,S2,…,Sn};
(b)计算前一步骤所述集合S的目标函数值E0,即计算序列之间与序列自身的非特异性配对自由能之和,同时得到非特异性配对自由能矩阵Cn×n,搜索其上三角矩阵中的最小值所对应的Si和Sj,其中1≤i≤n,1≤j≤n,根据Si和Sj非特异性配对自由能随机选择Si或Sj进行更新操作,于是得到一条新的核酸序列,进而得到更新的序列集合S’;
(c)判断前一步骤所述集合S’中的序列是否满足步骤(a)中所设置的优化约束参数条件,验证以下参数,包括特异性配对区域解离温度Tm,特异性配对区域序列自由能二级结构解离温度Tm-H和CG比例PCG,如若以上参数满足约束条件则执行步骤(d),否则重复执行步骤(c),如果在某一退火温度下,连续执行15次步骤(b)都未得到满足条件的S’则,为防止死循环,集合S成为集合S’,执行下一步;
(d)计算前一步骤所述集合S’的目标函数值E1,比较E0与E1,若E1≥E0,表明非特异性配对自由能得到优化,序列集合S’成为序列集合S,若E1<E0,表明非特异性配对自由能未得到优化,此时需要根据Metropolis准则,判断是否接受S’集合成为S;和
(e)退火温度根据步骤(a)设置的衰减系数ΔT进行衰减,对前一步骤所述的S重复执行步骤(b)、(c)和(d),即基于蒙特卡洛的退火算法,直至退火温度达到退火终止温度,前一步骤所述的S={S1,S2,…,Sn}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列;
其中,在步骤(d)中,所述的优化集合是满足以下条件的集合:
(C1)核酸骨架结构中,序列之间目标配对形成的DNA双链结构的自由能小于或最小;和
(C2)核酸骨架结构中,序列之间非目标配对的大于-7kcal/mol或最大化。
2.如权利要求1所述的方法,其特征在于,在步骤(c)中,将互配核酸骨架结构分解为10种不同的最近邻的成对相互作用,这些成对的相互作用是:AA/TT;AT/TA;TA/AT;CA/GT;GT/CA;CT/GA;GA/CT;CG/GC;GC/CG;和GG/CC;并基于这些成对的相互作用的焓ΔH°和熵ΔS°计算得到相应的各自的ΔG°值;然后将互配核酸骨架结构所包括的成对的相互作用的自由能合并或求和,获得互配核酸骨架结构的自由能。
3.如权利要求1所述的方法,其特征在于,所述方法包括重复步骤(b)、(c)和(d)多次,从而在迭代过程中获得全局最优解。
4.如权利要求3所述的方法,其特征在于,使用以下优化目标函数进行模拟退火算法的迭代,从而优化非目标配对区域的自由能:
ΔG°(Si,Sj)为序列Si和序列Sj非目标配对自由能,为所有序列之间非目标配对自由能之和,其值为负;其中,此负值越大越有利于减少非目标配对。
5.如权利要求1所述的方法,其特征在于,所述优化约束参数进一步包括:对于n=4时,使用对称序列。
6.一种用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列集合,其特征在于,所述的单链核酸序列集合是用权利要求1所述的方法所确定的,并且所述的集合选自Group1-Group3中所示的用于形成基于互配核酸骨架的三、四或五聚体复合物的单链核酸序列集合:
(Group1)用于形成基于互配核酸骨架的三聚体复合物的单链核酸序列:
(Group2)用于形成基于互配核酸骨架的四聚体复合物的单链核酸序列:
(Group3)用于形成基于互配核酸骨架的五聚体复合物的单链核酸序列:
7.一种基于互配核酸骨架的多聚体复合物,其特征在于,所述的复合物是n个具有互配核酸骨架的单体复合形成的多聚体,其中,每个单体为具有核酸单链的多肽,而n为3-5的正整数;在所述多聚体中,每个单体的核酸单链与另外两个单体的核酸单链通过碱基互补形成互配双链,从而形成互配核酸骨架结构,
其中,所述多聚体复合物中的单链核酸序列由如权利要求6所述的单链核酸序列集合组成。
8.如权利要求7所述的多聚体复合物,其特征在于,所述的单体具有式I结构:
Z1-W(I)
式中,
Z1为多肽部分(moiety);
W为单链核酸序列;
“-”为接头或键。
9.如权利要求8所述的多聚体复合物,其特征在于,所述的核酸序列W具有式1所示的结构:
X1–R1–X2–R2–X3(1)
其中,
R1为碱基互补配对区域1;
R2为碱基互补配对区域2;
X1、X2和X3各自独立地为无或冗余核酸;
“-”为键。
10.一种药物组合物,其特征在于,所述药物组合物包括:
(a)权利要求7中所述的基于互配核酸骨架的多聚体复合物;和
(b)药学上可接受的载体。
11.一种核酸序列文库,其特征在于,所述的核酸文库包括用于形成权利要求7所述的基于互配核酸骨架的多聚体复合物的核酸序列。
12.如权利要求11所述的核酸序列文库,其特征在于,所述的核酸序列W具有式1所示的结构:
X1–R1–X2–R2–X3 (1)
其中,
R1为碱基互补配对区域1;
R2为碱基互补配对区域2;
X1、X2和X3各自独立地为无或冗余核酸;
“-”为键。
13.如权利要求11所述的核酸序列文库的用途,其特征在于,用于制备权利要求7所述的多聚体复合物或含权利要求7所述的多聚体复合物的药物组合物。
14.一种用于如权利要求1所述的确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法的装置,所述装置包括:
(M1)输入模块,所述输入模块用于输入退火算法参数、优化约束参数;
其中,所述的设置退火算法参数包括:退火初始温度、退火终止温度和退火温度衰减系数ΔT;
所述的优化约束参数包括:
①核酸单链的数量n,其中n为3-6的正整数;
②配对序列长度L,其中L为12-16碱基;
③配对区域解离温度阈值Tm,所述Tm根据配对序列长度而定,其中L=14碱基时,Tm>50℃;L=16碱基时,Tm>52℃;
④特异性配对区域序列自由能阈值所述根据配对序列长度而定,其中L=14碱基时,L=16碱基时,
⑤非特异性配对自由能阈值其中
⑥连接元X2,所述连接元X2选自下组:A、AA、AAA;
⑦二级结构(hairpin)解离温度阈值Tm-H,所述Tm-H<40℃;
⑧配对序列中CG比例PCG,其范围为[0.4,0.6),
(M2)优化运算模块,所述优化运算模块被配置为执行以下子步骤,从而获得经优化的单链核酸序列或其集合:
(z1)计算初始集合S的目标函数值E0,即计算序列之间与序列自身的非特异性配对自由能之和,同时得到非特异性配对自由能矩阵Cn×n,搜索其上三角矩阵中的最小值所对应的Si和Sj,其中1≤i≤n,1≤j≤n,根据Si和Sj非特异性配对自由能随机选择Si或Sj进行更新操作,于是得到一条新的核酸序列,进而得到更新的序列集合S’;
(z2)判断前一步骤所述集合S’中的序列是否满足所设置的优化约束参数条件,验证以下参数,包括特异性配对区域解离温度Tm,特异性配对区域序列自由能二级结构解离温度Tm-H和CG比例PCG,如若以上参数满足约束条件则执行步骤(z3),否则重复执行步骤(z2),如果在某一退火温度下,连续执行15次步骤都未得到满足条件的S’则,为防止死循环,集合S成为集合S’,执行下一步;
(z3)计算前一步骤所述集合S’的目标函数值E1,比较E0与E1,若E1≥E0,表明非特异性配对自由能得到优化,序列集合S’成为序列集合S,若E1<E0,表明非特异性配对自由能未得到优化,此时需要根据Metropolis准则,判断是否接受S’集合成为S;和
(z4)退火温度根据设置的衰减系数ΔT进行衰减,对前一步骤所述的S重复执行步骤(z1)、(z2)和(z3),即基于蒙特卡洛的退火算法,直至退火温度达到退火终止温度,前一步骤所述的S={S1,S2,…,Sn}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列;和
(M3)输出模块,所述输出模块用于输出经优化的单链核酸序列或其集合。
CN202011340377.3A 2020-11-25 2020-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用 Active CN114539422B (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN202011340377.3A CN114539422B (zh) 2020-11-25 2020-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
EP21897098.6A EP4253609A1 (en) 2020-11-25 2021-11-25 Construction method for and application of nucleic acid multimerization-mediated multivalent protein drug and vaccine
AU2021390000A AU2021390000A1 (en) 2020-11-25 2021-11-25 Construction method for and application of nucleic acid multimerization-mediated multivalent protein drug and vaccine
CA3200188A CA3200188A1 (en) 2020-11-25 2021-11-25 Construction method for and application of nucleic acid multimerization-mediated multivalent protein drug and vaccine
JP2023532213A JP2023551827A (ja) 2020-11-25 2021-11-25 核酸多量化を介した多価タンパク質薬物およびワクチンの構築方法と適用
KR1020237021280A KR20230123972A (ko) 2020-11-25 2021-11-25 핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도
PCT/CN2021/133254 WO2022111598A1 (zh) 2020-11-25 2021-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
CN202180079161.2A CN116600823A (zh) 2020-11-25 2021-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
US18/254,495 US20240294674A1 (en) 2020-11-25 2021-11-25 Constructed Method for and Application of Nucleic Acid Multimerization-Mediated Multivalent Protein Drug and Vaccine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011340377.3A CN114539422B (zh) 2020-11-25 2020-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

Publications (2)

Publication Number Publication Date
CN114539422A CN114539422A (zh) 2022-05-27
CN114539422B true CN114539422B (zh) 2024-03-29

Family

ID=81659911

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202011340377.3A Active CN114539422B (zh) 2020-11-25 2020-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
CN202180079161.2A Pending CN116600823A (zh) 2020-11-25 2021-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180079161.2A Pending CN116600823A (zh) 2020-11-25 2021-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

Country Status (8)

Country Link
US (1) US20240294674A1 (zh)
EP (1) EP4253609A1 (zh)
JP (1) JP2023551827A (zh)
KR (1) KR20230123972A (zh)
CN (2) CN114539422B (zh)
AU (1) AU2021390000A1 (zh)
CA (1) CA3200188A1 (zh)
WO (1) WO2022111598A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995000665A1 (en) * 1993-06-17 1995-01-05 The Research Foundation Of State University Of New York Thermodynamics, design, and use of nucleic acid sequences
US5561043A (en) * 1994-01-31 1996-10-01 Trustees Of Boston University Self-assembling multimeric nucleic acid constructs
CN1533441A (zh) * 2001-06-20 2004-09-29 ղ��� 核酸三链体和四链体形成
WO2009057702A1 (ja) * 2007-10-31 2009-05-07 Eisai R & D Management Co., Ltd. 標的物質検出用ポリマー及び標的物質の検出方法
WO2018205755A1 (zh) * 2017-05-09 2018-11-15 安升(上海)医药科技有限公司 多特异性蛋白药物及其文库、以及制备方法和应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5124246A (en) * 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US7569341B2 (en) * 1994-01-31 2009-08-04 Trustees Of Boston University Nucleic acid directed immobilization arrays and methods of assembly
US20030027194A1 (en) * 2001-07-31 2003-02-06 Markus Kurz Modular assembly of nucleic acid-protein fusion multimers
CN101866388B (zh) * 2009-04-16 2012-07-04 北京大学 一种dna计算编码系统及其方法
CN112746331A (zh) * 2019-10-29 2021-05-04 安升(上海)医药科技有限公司 半衰期延长的药物及其文库、以及制备方法和应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995000665A1 (en) * 1993-06-17 1995-01-05 The Research Foundation Of State University Of New York Thermodynamics, design, and use of nucleic acid sequences
US5561043A (en) * 1994-01-31 1996-10-01 Trustees Of Boston University Self-assembling multimeric nucleic acid constructs
CN1533441A (zh) * 2001-06-20 2004-09-29 ղ��� 核酸三链体和四链体形成
WO2009057702A1 (ja) * 2007-10-31 2009-05-07 Eisai R & D Management Co., Ltd. 標的物質検出用ポリマー及び標的物質の検出方法
WO2018205755A1 (zh) * 2017-05-09 2018-11-15 安升(上海)医药科技有限公司 多特异性蛋白药物及其文库、以及制备方法和应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
刘文斌,王淑栋,许进.DNA计算中的编码方法研究.计算机工程与应用.2003,(第27期),全文. *
吕鸣 ; 张晓东 ; 潘家奎 ; 张治洲 ; 胡钧 ; .一种基于关键路径法的DNA计算用寡核苷酸序列设计算法.生物信息学.2007,(第02期),摘要,第2节. *
崔光照 ; 周君和 ; 王延峰 ; .DNA计算中的编码序列设计问题.郑州轻工业学院学报(自然科学版).2007,(第Z1期),全文. *
崔光照 ; 张勋才 ; 王延峰 ; .DNA计算中编码序列的优化设计方案.计算机应用研究.2007,(第07期),全文. *
张凯等.基于多目标进化策略算法的DNA核酸编码设计.电子与信息学报.2020,第42卷(第6期),摘要,第2节. *

Also Published As

Publication number Publication date
AU2021390000A1 (en) 2023-06-29
CN116600823A (zh) 2023-08-15
US20240294674A1 (en) 2024-09-05
KR20230123972A (ko) 2023-08-24
AU2021390000A9 (en) 2023-08-17
WO2022111598A1 (zh) 2022-06-02
CA3200188A1 (en) 2022-06-02
CN114539422A (zh) 2022-05-27
JP2023551827A (ja) 2023-12-13
EP4253609A1 (en) 2023-10-04

Similar Documents

Publication Publication Date Title
CA1341595C (en) Procedure for obtaining dna, rna, peptides, polypeptides, or proteins byrecombinant dna techniques
CN103002923B (zh) 稳定化的纤连蛋白结构域组合物、方法和使用
US7838629B2 (en) Ubiquitin or gamma-crystalline conjugates for use in therapy, diagnosis and chromatography
Hartzell et al. Modular hepatitis B virus-like particle platform for biosensing and drug delivery
KR102237130B1 (ko) 향상된 특성을 갖는 변형된 코일드 코일 유형 단백질
CN111848798B (zh) 可结合bcma的纳米抗体及其应用
JP2011507521A (ja) ヒト非抗体ペプチド又はタンパク質ファージライブラリ
CN105646710B (zh) 一种全人源化抗vegfr-2单克隆抗体及其制备方法
Kasaraneni et al. Retargeting lentiviruses via SpyCatcher-SpyTag chemistry for gene delivery into specific cell types
CN114276452A (zh) 可结合bcma的纳米抗体及其应用
US20220370626A1 (en) FN3 Domain-siRNA Conjugates and Uses Thereof
CN114539422B (zh) 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
CA2456105A1 (en) Modular assembly of nucleic acid-protein fusion multimers
CN113366104B (zh) mRNA展示抗体文库和方法
WO2023070317A1 (zh) 基于dc细胞的双功能纳米抗体及其构建方法和应用
JP2016163565A (ja) 抗体特異性をリダイレクトするための高親和性アダプター分子
WO2022116528A1 (zh) 环状rna、包含环状rna的疫苗及用于检测新型冠状病毒中和抗体的试剂盒
WO2021194999A1 (en) Monoclonal antibodies to chemically-modified nucleic acids and uses thereof
JP2011507520A (ja) M13ファージのpIXとの融合によってヒト非抗体ペプチド又はタンパク質ファージライブラリを設計及び生成するための、操作されたハイブリッドファージベクター
WO2020204151A1 (ja) Fgf9に対するアプタマー及びその使用
Tan et al. Aptamer properties, functions, and applications
Mahmoodi et al. Phage display as a bio-technique for cancer immunotherapy
CN114805494A (zh) 一种鸡dec-205受体亲和肽dl及其制备方法和应用
CN106928357B (zh) 一种CD105纳米抗体Nb86
CN106916224B (zh) 抗b淋巴细胞刺激因子单克隆抗体及其制备方法和用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40074057

Country of ref document: HK

CB02 Change of applicant information

Address after: 201203 Floor 2-3, Building 1, No. 88 Darwin Road, Pudong New Area, Shanghai

Applicant after: ANSHENG (SHANGHAI) MEDICINE TECHNOLOGY Co.,Ltd.

Address before: Room 1107, No. 781 Cailun Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 201203

Applicant before: ANSHENG (SHANGHAI) MEDICINE TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant