KR20230123972A - 핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도 - Google Patents

핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도 Download PDF

Info

Publication number
KR20230123972A
KR20230123972A KR1020237021280A KR20237021280A KR20230123972A KR 20230123972 A KR20230123972 A KR 20230123972A KR 1020237021280 A KR1020237021280 A KR 1020237021280A KR 20237021280 A KR20237021280 A KR 20237021280A KR 20230123972 A KR20230123972 A KR 20230123972A
Authority
KR
South Korea
Prior art keywords
nucleic acid
sequence
dna
numbered
artificial sequence
Prior art date
Application number
KR1020237021280A
Other languages
English (en)
Inventor
판 양
제임스 제이원 초우
리우주옌 조우
얀빙 왕
찬 차오
창칭 룬
Original Assignee
어셈블리 메디슨 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어셈블리 메디슨 엘엘씨 filed Critical 어셈블리 메디슨 엘엘씨
Publication of KR20230123972A publication Critical patent/KR20230123972A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/19Cytokines; Lymphokines; Interferons
    • A61K38/193Colony stimulating factors [CSF]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/385Haptens or antigens, bound to carriers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/549Sugars, nucleosides, nucleotides or nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/55Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound the modifying agent being also a pharmacologically or therapeutically active agent, i.e. the entire conjugate being a codrug, i.e. a dimer, oligomer or polymer of pharmacologically or therapeutically active compounds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6801Drug-antibody or immunoglobulin conjugates defined by the pharmacologically or therapeutically active agent
    • A61K47/6803Drugs conjugated to an antibody or immunoglobulin, e.g. cisplatin-antibody conjugates
    • A61K47/6811Drugs conjugated to an antibody or immunoglobulin, e.g. cisplatin-antibody conjugates the drug being a protein or peptide, e.g. transferrin or bleomycin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6835Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site
    • A61K47/6843Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site the antibody targeting a material from animals or humans
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/53Colony-stimulating factor [CSF]
    • C07K14/535Granulocyte CSF; Granulocyte-macrophage CSF
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/10Nucleic acid folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6025Nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Zoology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Toxicology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Communicable Diseases (AREA)
  • Mycology (AREA)
  • Diabetes (AREA)
  • Physiology (AREA)

Abstract

핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도에 관한 것으로, 구체적으로 상보적 핵산 골격 기반의 다량체 복합체를 제공하며, 상기 복합체는 상보적 핵산 골격을 갖는 3-6개의 단량체가 복합되어 형성된 다량체이되, 각각의 단량체는 상기 핵산 단일 사슬을 갖는 폴리펩티드이고; 상기 다량체에서, 각각의 단량체의 핵산 단일 사슬과 다른 두 개의 단량체의 핵산 단일 사슬은 염기 상보성을 통해 이중 사슬을 형성하여 상보적 핵산 골격 구조를 형성한다. 또한 상기 다량체 복합체를 포함하는 약학적 조성물, 상기 다량체 복합체를 구축하기 위한 핵산 서열 라이브러리, 및 상보적 핵산 골격의 최적화 방법을 제공한다. 상기 방법은 융합 단백질의 재구축 또는 화학적 변형 및 가교 없이 기존의 단기 작용 단백질 약물 또는 항원에 대해 단백질 약물 또는 항원의 다가를 완료하여 반감기 및 활성 및/또는 면역원성을 향상시킬 수 있다.

Description

핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도
본 발명은 생명공학 의약 분야에 관한 것으로, 구체적으로 핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도에 관한 것이다.
많은 생체 거대분자의 경우, 이들의 응집 또는 다가 상태는 이들 체내의 활성 및 반감기에 직접적인 영향을 미친다. 예를 들어, 대부분의 면역 수용체의 활성화는 수용체가 세포막에 응집하여 세포 내부 다운스트림의 신호 전달 경로를 활성화하는 것을 포함한다. 따라서, 이러한 수용체의 천연 리간드 또는 항체는 다가 또는 고가 형성 시 종종 수용체를 활성화하는 능력을 크게 향상시킬 수 있다. 또한, 분자량이 낮은 일부 단백질 약물(MW 40 kDa), 예를 들어 사이토카인, 성장 호르몬, 합성 폴리펩티드 등 약물의 신장 청소율이 높고 체내 반감기가 짧으며; 이러한 단백질 약물은 또한 고가를 형성하여 분자량을 증가시키고 반감기를 향상시킬 수 있다.
따라서, 단백질 다가는 생물의약 분야에서 비교적 주목받는 공정으로, 기존의 방법도 많지만 대부분의 화학적 가교 방법은 연결 특이성이 좋지 않고 연결 다량체가 불균일한 문제가 존재한다. 현재 가장 널리 응용되고 있는 방법은 세포로부터 단백질을 다가 융합 단백질의 형태로 발현 및 생성하는 것으로, 유효 기능의 단백질 영역과 올리고머를 형성할 수 있는 단백질을 융합하여 Fc 2가 융합 단백질, GCN4 3가 융합 단백질과 같은 키메라를 형성하는 것이다. 이러한 융합 단백질은 모두 균일한 올리고머를 형성할 수 있지만, 융합 단백질의 세포 발현량 및 활성은 종종 원래의 단백질 약물보다 좋지 않고, Fc 영역의 존재는 면역 시스템을 활성화하고 사이토카인 방출을 유도하며 세포 독성을 초래하는 위험을 가져다준다. 따라서, 본 분야는 검증된 단백질 약물을 비융합 단백질 형태로 균일하고 특이성이 높은 다가 단백질을 형성할 수 있는 간단하고 유연하며 효율적인 방법을 개발하는 것이 시급한 실정이다.
또한, 단백질 다가는 백신의 연구 개발에도 중요한 의미가 있다. 먼저, B 세포 기반의 백신 설계에서 바이러스 또는 세균의 단백질을 항원으로 사용하여 B 세포 수용체(BCR)를 활성화하는 것이 중요한 단계이다. BCR는 상술한 면역 수용체와 같이 필요한 수용체가 세포막에 응집하도록 효과적으로 활성화하므로, 고가 항원은 B 세포 활성화 측면에서 단량체 항원에 비해 절대적인 이점이 있다. 다음, 고가 항원은 올리고머를 형성하기 위해 반드시 단일 항원일 필요는 없고; 고가 항원은 특정 바이러스 내 상이한 단백질 또는 상이한 바이러스주의 동일한 단백질의 돌연변이형 및 아형을 포함할 수 있으며; 이로부터, 다원화 항원 제시는 이론적으로 숙주 면역 시스템의 다클론 B 세포 반응(polyclonal response)을 유도하여 더 광범위한 중화 항체를 생성할 수 있다.
본 발명의 첫 번째 목적은 핵산 커플링 단백질 약물을 효율적이고 안정적으로 조립하여 다가 약물 또는 백신을 형성하는 데 적용되는 효율적이고 안정적으로 조립된 n-단계 핵산 올리고머 어셈블리 골격 설계를 제공하는 것이다.
본 발명의 두 번째 목적은 약물 반감기를 연장시키고 약물 활성을 증가시키기 위해 단백질 약물을 다가 거대분자로 형성하는 간단하고 효율적인 방법을 제공하는 것이다.
본 발명의 세 번째 목적은 면역 세포를 활성화하고 백신의 면역원성을 향상시키기 위해 동일하거나 상이한 단백질 항원을 다가 거대분자 복합체로 형성하는 간단하고 유연하며 효율적인 모듈식 방법을 제공하는 것이다.
본 발명의 제1 양태에서, 상보적 핵산 골격 기반의 다량체 복합체를 제공하며, 상기 복합체는 상보적 핵산 골격을 갖는 n개의 단량체가 복합되어 형성된 다량체이되, 각각의 단량체는 상기 핵산 단일 사슬을 갖는 폴리펩티드이고, n은 3-6의 양의 정수이며; 상기 다량체에서, 각각의 단량체의 핵산 단일 사슬과 다른 두 개의 단량체의 핵산 단일 사슬은 염기 상보성을 통해 상보적 이중 사슬을 형성하여 상보적 핵산 골격 구조를 형성한다.
다른 바람직한 예에서, n은 3, 4, 5 또는 6이다.
다른 바람직한 예에서, 상기 복합체는 3량체, 4량체, 또는 5량체이고, 바람직하게는 상기 복합체의 구조는 도 1에 도시된 바와 같다.
다른 바람직한 예에서, 상기 단량체는 식 I로 표시되는 구조를 가지고,
Z1-W (I)
상기 식에서,
Z1은 폴리펩티드 모이어티(moiety)이며;
W는 단일 사슬 핵산 서열이고;
"-"는 링커 또는 결합이다.
다른 바람직한 예에서, "-"는 공유 결합이다.
다른 바람직한 예에서, 상기 핵산 서열은 L-핵산, 펩티드 핵산, 잠금 핵산, 포스포로티오에이트 핵산, 2'-플루오로 변형 핵산, 5-히드록시메틸시토신 핵산, 포스포로디아미데이트 모르폴리노(phosphorodiamidate morpholino) 핵산, 또는 이들의 조합으로 이루어진 군으로부터 선택되고;
다른 바람직한 예에서, 상기 다량체에서, 각각의 단량체의 Z1은 동일하거나 상이하다.
다른 바람직한 예에서, 상기 다량체에서, 각각의 단량체의 W는 상이하다.
다른 바람직한 예에서, 상기 단량체는 식 II로 표시되는 구조를 가지고,
D-[L-W]m (II)
상기 식에서,
D는 단백질 약물 요소 모이어티이며;
W는 핵산 서열이고;
L은 없거나 링커이며;
"-"는 공유 결합이고;
m은 1, 2 또는 3이다.
다른 바람직한 예에서, m은 1이다.
다른 바람직한 예에서, 상기 단량체는 식 III로 표시되는 구조를 가지고,
A-[L-W]m (III)
상기 식에서,
A는 폴리펩티드 항원 요소 모이어티이며;
W는 핵산 서열이고;
L은 없거나 링커이며;
"-"는 공유 결합이고;
m은 1, 2 또는 3이다.
다른 바람직한 예에서, m은 1이다.
다른 바람직한 예에서, 상기 핵산 서열 W는 식 1로 표시되는 구조를 가지고,
X1-R1-X2-R2-X3 (1)
상기 식에서,
R1은 염기 상보적 페어링 영역 1이며;
R2는 염기 상보적 페어링 영역 2이고;
X1, X2 및 X3은 각각 독립적으로 없거나 중복 핵산이며;
"-"는 결합이다.
다른 바람직한 예에서, R1 및 R2의 길이는 각각 독립적으로 10-20 염기이고, 바람직하게는 14-16 염기이다.
다른 바람직한 예에서, X1의 길이는 0-5 염기이다.
다른 바람직한 예에서, X3의 길이는 0-5 염기이다.
다른 바람직한 예에서, X2의 길이는 0-3 염기이다.
다른 바람직한 예에서, X2의 서열은 A, AA, AGA 또는 AAA로 이루어진 군으로부터 선택된다.
다른 바람직한 예에서, 각각의 단량체의 R1은 왼쪽에 인접한(또는 왼쪽) 단량체의 R2와 염기 상보적 페어링 구조를 형성하고; R2는 오른쪽에 인접한(또는 오른쪽) 단량체의 R1과 염기 상보적 페어링 구조를 형성한다.
다른 바람직한 예에서, 상기 단량체 서열은 상보적 핵산 골격 기반의 3량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 1-60(표 9-1 참조)으로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트이다.
다른 바람직한 예에서, 상기 단량체 서열은 상보적 핵산 골격 기반의 4량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 61-140(표 9-2 참조)으로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트이다.
다른 바람직한 예에서, 상기 단량체 서열은 상보적 핵산 골격 기반의 5량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 141-240(표 9-3 참조)으로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트이다.
다른 바람직한 예에서, 상기 단량체 서열은 포스포로디아미데이트 모르폴리노(phosphorodiamidate morpholino) 핵산이다.
다른 바람직한 예에서, 상기 단량체 서열은 상보적 핵산 골격 기반의 4량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 275-278로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트이다.
본 발명의 제2 양태에서, 약학적 조성물을 제공하며, 상기 약학적 조성물은,
(a) 제1 양태에 따른 상보적 핵산 골격 기반의 다량체 복합체; 및
(b) 약학적으로 허용 가능한 담체를 포함한다.
다른 바람직한 예에서, 상기 약학적 조성물은 백신 조성물을 포함한다.
다른 바람직한 예에서, 상기 약학적 조성물은 치료적 및/또는 예방적인 약학적 조성물을 포함한다.
다른 바람직한 예에서, 상기 다량체 복합체는 3량체 복합체, 4량체 복합체 및 5량체 복합체를 포함한다.
본 발명의 제3 양태에서, 핵산 서열 라이브러리를 제공하며, 상기 핵산 서열 라이브러리는 제1 양태에 따른 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 핵산 서열을 포함한다.
다른 바람직한 예에서, 상기 핵산 서열은,
(a) 상보적 핵산 골격 기반의 3량체 복합체를 형성하기 위한 핵산 서열;
(b) 상보적 핵산 골격 기반의 4량체 복합체를 형성하기 위한 핵산 서열; 및/또는
(c) 상보적 핵산 골격 기반의 5량체 복합체를 형성하기 위한 핵산 서열을 포함한다.
다른 바람직한 예에서, 상기 핵산 서열 W는 식 1로 표시되는 구조를 가지고,
X1-R1-X2-R2-X3 (1)
상기 식에서,
R1은 염기 상보적 페어링 영역 1이며;
R2는 염기 상보적 페어링 영역 2이고;
X1, X2 및 X3은 각각 독립적으로 없거나 중복 핵산이며;
"-"는 결합이다.
본 발명의 제4 양태에서, 제1 양태에 따른 다량체 복합체 또는 상기 다량체 복합체를 포함하는 약학적 조성물의 제조에서의, 제3 양태에 따른 핵산 서열 라이브러리의 용도를 제공한다.
본 발명의 제5 양태에서, 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열의 결정 방법을 제공하며, 하기와 같은 단계를 포함하되,
단계 (a)에서, 어닐링 알고리즘 파라미터를 설정하고:
어닐링 초기 온도, 어닐링 종료 온도 및 어닐링 온도 감쇠 계수 를 설정하며;
최적화 제약 파라미터를 설정하고:
① 핵산 단일 사슬의 수 n, 바람직하게는 3-6의 양의 정수;
② 페어링 서열 길이 L, 바람직하게는 L 은 12-16 염기;
③ 페어링 영역의 해리 온도 임계값 ;
④ 특이적 페어링 영역의 서열 자유 에너지 임계값 ;
⑤ 비특이적 페어링 자유 에너지 임계값 ;
⑥ 연결 요소 X2, 바람직하게는 A, AA 및 AAA;
⑦ 이차 구조(hairpin)의 해리 온도 임계값 ;
⑧ 페어링 서열 중 CG 비율 P CG , 바람직하게는 P CG 의 범위 [0.4, 0.6),
⑨ 선택적으로, n=4일 때, 대칭 서열을 사용하고, 위의 파라미터에 따라 서열 세트 를 초기화하며;
단계 (b)에서, 이전 단계에 따른 세트 S의 목적 함수값 E0을 계산하고, 즉 서열 사이 및 서열 자체의 비특이적 페어링 자유 에너지 의 합을 계산함과 동시에 비특이적 페어링 자유 에너지 행렬 을 획득하며, 이의 상삼각행렬 중의 최소값에 대응되는 S iS j(1≤i≤n, 1≤j≤n)를 검색하고, S iS j의 비특이적 페어링 자유 에너지 에 따라 S i 또는 S j를 무작위로 선택하여 업데이트 조작을 수행하여, 하나의 새로운 핵산 서열을 얻으며, 나아가 업데이트된 서열 세트 S'를 얻고;
단계 (c)에서, 이전 단계에 따른 세트 S' 중의 서열이 단계 (a)에서 설정된 최적화 제약 파라미터 조건을 충족하는지 여부를 판단하여, 특이적 페어링 영역의 해리 온도 , 특이적 페어링 영역의 서열 자유 에너지 , 이차 구조의 해리 온도 및 CG 비율 P CG 를 포함하는 파라미터를 검증하며, 위의 파라미터가 제약 조건을 충족하면 단계 (d)를 수행하고, 그렇지 않으면 단계 (c)를 반복 수행하며, 특정 어닐링 온도에서 단계 (b)를 15회 연속 수행해도 조건을 충족하는 S'를 얻지 못하면 무한 루프를 방지하기 위해 세트 S가 세트 S'로 되어 다음 단계를 수행하고;
단계 (d)에서, 이전 단계에 따른 세트 S'의 목적 함수값 E1을 계산하여 E0과 E1을 비교하며, E1≥E0이면, 비특이적 페어링 자유 에너지가 최적화됨을 나타내고, 서열 세트 S'가 서열 세트 S로 되며, E1<E0이면, 비특이적 페어링 자유 에너지가 최적화되지 않음을 나타내고, 이때 Metropolis 규칙에 따라 S' 세트를 S로 받아들일지 여부를 판단해야 하며; 및
단계 (e)에서, 어닐링 온도는 단계 (a)에서 설정된 감쇠 계수 에 따라 감쇠시키고, 이전 단계에 따른 S에 대해 단계 (b), (c) 및 (d)를 반복 수행하며, 즉 몬테카를로의 어닐링 알고리즘을 기반으로 어닐링 온도가 어닐링 종료 온도에 도달할 때까지 이전 단계에 따른 가 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열로 된다.
다른 바람직한 예에서, 어닐링 알고리즘 파라미터를 설정하는 단계 (a)에서 다음을 포함하되,
예를 들어, 어닐링 초기 온도 , 어닐링 종료 온도 를 설정하고, 어닐링 온도 감쇠 계수 는 상황에 따라 다르지만 일반적으로 0.98±0.01이며;
최적화 제약 파라미터를 설정하고:
① 핵산 단일 사슬의 수 n은 3-6의 양의 정수이며,
② 페어링 서열 길이 L은 상황에 따라 다르고(바람직하게는, L은 12-16 염기임),
③ 페어링 영역의 해리 온도 임계값 은 페어링 서열 길이에 따라 다르며(예를 들어, L=14 염기인 경우, ; L=16 염기인 경우, ),
④ 특이적 페어링 영역의 서열 자유 에너지 임계값 는 페어링 서열 길이에 따라 다르고(바람직하게는, L=14 염기인 경우, <-27 kcal/mol; L=16 염기인 경우, <-29 kcal/mol),
⑤ 비특이적 페어링 자유 에너지 임계값 은 서열 길이에 따라 다르며(바람직하게는, >-7 kcal/mol),
⑥ 연결 요소 X2는 상황에 따라 다르고(A, AA 및 AAA 등일 수 있음),
⑦ 이차 구조(hairpin)의 해리 온도 임계값 은 상황에 따라 다르며(바람직하게는, ),
⑧ 페어링 서열 중 CG 비율 P CG 의 범위는 [0.4, 0.6)이고,
⑨ 특히, n=4일 때, 대칭 서열을 사용할 수 있고, 위의 파라미터에 따라 서열 세트 를 초기화한다.
다른 바람직한 예에서, 상기 각 단일 사슬 핵산 서열 W는 식 1로 표시되는 구조를 가지고,
X1-R1-X2-R2-X3 (1)
상기 식에서,
R1은 염기 상보적 페어링 영역 1이며;
R2는 염기 상보적 페어링 영역 2이고;
X1, X2 및 X3은 각각 독립적으로 없거나 중복 핵산이며;
"-"는 결합이다.
다른 바람직한 예에서, 단계 (d)에서, 상기 최적화 세트는,
(C1) 상보적 핵산 골격 구조에서, 표적 페어링에 의해 형성된 DNA 이중 사슬 구조의 자유 에너지()가 작거나 가장 작은 조건; 및
(C2) 상보적 핵산 골격 구조에서, 비표적 페어링의 가 크거나 가장 큰 조건을 충족하는 세트이다.
다른 바람직한 예에서, 단계 (d)에서, 상기 이점 세트는 또한,
(C3) R1 및 R2 영역의 페어링 해리 온도 (L=14 염기인 경우)인 조건을 충족한다.
다른 바람직한 예에서, 단계 (c)에서, 최근접 이웃법을 통해 DNA 올리고머(즉, 상보적 핵산 골격 구조)의 자유 에너지()를 계산한다.
다른 바람직한 예에서, 단계 (c)에서, DNA 올리고머(즉, 상보적 핵산 골격 구조)를 10개의 상이한 최근접 이웃의 쌍별 상호작용으로 분해하고, 이러한 쌍별 상호작용은 AA/TT; AT/TA; TA/AT; CA/GT; GT/CA; CT/GA; GA/CT; CG/GC; GC/CG; 및 GG/CC이며; 이러한 쌍별 상호작용의 엔탈피(enthalpy, ) 및 엔트로피(entropy, )에 기반하여 상응한 각 값을 계산하여 얻고; 그런 다음 상보적 핵산 골격 구조에 포함된 쌍별 상호작용의 자유 에너지를 합하여(또는 합산) 상보적 핵산 골격 구조의 자유 에너지를 얻는다.
다른 바람직한 예에서, 상기 방법은 단계 (b), (c) 및 (d)를 여러 회 반복하여(즉, n1회 반복 수행) 반복 과정에서 전역 최적 해를 얻는 것을 포함한다.
다른 바람직한 예에서, 상기 반복 과정에서, Metropolis 규칙에 따라 열악한 해를 제한적으로 수용하고 열악한 해를 수용할 확률은 점차 0이 되는 경향이 있으므로 알고리즘이 종료될 때 전역 최적 해를 최대한 찾을 수 있다.
다른 바람직한 예에서, 하기 최적화 목적 함수를 사용하여 시뮬레이션 어닐링 알고리즘의 반복을 수행함으로써 비표적 페어링 영역의 자유 에너지를 최적화한다.
는 서열 S i 및 서열 S j의 비표적 페어링 자유 에너지이고, 는 모든 서열 사이의 비표적 페어링 자유 에너지의 합이며, 그 값은 음수이고; 여기서 음수 값이 클수록 비표적 페어링을 줄이는 데 유리하다.
본 발명의 제6 양태에서, 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열 세트를 제공하며, 상기 단일 사슬 핵산 서열 세트는 제5 양태에 따른 방법에 의해 결정된다.
다른 바람직한 예에서, 상기 세트는 하기 군으로부터 선택된다.
(S1) 상보적 핵산 골격 기반의 3량체 복합체를 형성하기 위한 단일 사슬 핵산 서열:
표 9-1
(S2) 상보적 핵산 골격 기반의 4량체 복합체를 형성하기 위한 단일 사슬 핵산 서열:
표 9-2
(S3) 상보적 핵산 골격 기반의 5량체 복합체를 형성하기 위한 단일 사슬 핵산 서열:
표 9-3
본 발명의 제7 양태에서, 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열의 결정 장치를 제공하며, 상기 장치는 (M1) 입력 모듈, (M2) 최적화 운산 모듈, (M3) 출력 모듈을 포함하되,
상기 입력 모듈은 어닐링 알고리즘 파라미터, 최적화 제약 파라미터 및 선택적인 최적화할 핵산 서열을 입력하고;
여기서, 상기 설정 어닐링 알고리즘 파라미터는 어닐링 초기 온도, 어닐링 종료 온도 및 어닐링 온도 감쇠 계수 를 포함하며;
상기 최적화 제약 파라미터는,
① 핵산 단일 사슬의 수 n, 바람직하게는 3-6의 양의 정수;
② 페어링 서열 길이 L, 바람직하게는 L 은 12-16 염기;
③ 페어링 영역의 해리 온도 임계값 ;
④ 특이적 페어링 영역의 서열 자유 에너지 임계값 ;
⑤ 비특이적 페어링 자유 에너지 임계값 ;
⑥ 연결 요소 X2, 바람직하게는 A, AA 및 AAA;
⑦ 이차 구조(hairpin)의 해리 온도 임계값 ;
⑧ 페어링 서열 중 CG 비율 P CG , 바람직하게는 P CG 의 범위 [0.4, 0.6);를 포함하고,
상기 최적화 운산 모듈은 하기 하위 단계를 수행하여 최적화된 단일 사슬 핵산 서열 또는 이의 세트를 얻도록 구성되되,
단계 (z1)에서, 초기 세트 S의 목적 함수값 E0을 계산하고, 즉 서열 사이 및 서열 자체의 비특이적 페어링 자유 에너지()의 합을 계산함과 동시에 비특이적 페어링 자유 에너지 행렬 을 획득하며, 이의 상삼각행렬 중의 최소값에 대응되는 S iS j(1≤i≤n, 1≤j≤n)를 검색하고, S iS j의 비특이적 페어링 자유 에너지 에 따라 S i 또는 S j를 무작위로 선택하여 업데이트 조작을 수행하여, 하나의 새로운 핵산 서열을 얻으며, 나아가 업데이트된 서열 세트 S'를 얻고;
단계 (z2)에서, 이전 단계에 따른 세트 S' 중의 서열이 설정된 최적화 제약 파라미터 조건을 충족하는지 여부를 판단하여, 특이적 페어링 영역의 해리 온도 , 특이적 페어링 영역의 서열 자유 에너지 , 이차 구조의 해리 온도 및 CG 비율 P CG 를 포함하는 파라미터를 검증하며, 위의 파라미터가 제약 조건을 충족하면 단계 (z3)을 수행하고, 그렇지 않으면 단계 (z2)를 반복 수행하며, 특정 어닐링 온도에서 15회 연속 수행해도 조건을 충족하는 S'를 얻지 못하면 무한 루프를 방지하기 위해 세트 S가 세트 S'로 되어 다음 단계를 수행하고;
단계 (z3)에서, 이전 단계에 따른 세트 S'의 목적 함수값 E1을 계산하여 E0과 E1을 비교하며, E1≥E0이면, 비특이적 페어링 자유 에너지가 최적화됨을 나타내고, 서열 세트 S'가 서열 세트 S로 되며, E1<E0이면, 비특이적 페어링 자유 에너지가 최적화되지 않음을 나타내고, 이때 Metropolis 규칙에 따라 S' 세트를 S로 받아들일지 여부를 판단해야 하며;
단계 (z4)에서, 어닐링 온도는 설정된 감쇠 계수 에 따라 감쇠시키고,이전 단계에 따른 S에 대해 단계 (z1), (z2) 및 (z3)을 반복 수행하며, 즉 몬테카를로의 어닐링 알고리즘을 기반으로 어닐링 온도가 어닐링 종료 온도에 도달할 때까지 이전 단계에 따른 가 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열로 되고;
상기 출력 모듈은 최적화된 단일 사슬 핵산 서열 또는 이의 세트를 출력한다.
다른 바람직한 예에서, 상기 최적화 제약 파라미터는 4량체(n=4)의 경우, 대칭 서열을 사용하고, 위의 파라미터에 따라 서열 세트 를 초기화하는 것을 더 포함한다.
본 발명의 범위 내에서, 본 발명의 상기 각 기술특징과 하기(예를 들어, 실시예)에서 구체적으로 설명되는 각 기술특징 사이는 서로 조합되어, 새로운 또는 바람직한 기술적 해결수단을 구성할 수 있다. 편폭에 한하여, 여기에서는 더 이상 일일이 설명하지 않는다.
도 1은 다량체의 모식도를 보여준다.
도 2는 본 특허에 관련된 어닐링 알고리즘의 흐름도를 보여준다.
도 3은 3량체 서열 특이적 페어링의 모식도를 보여준다.
도 4는 3량체 최적화 서열 핵산 골격 조립의 겔 실행도를 보여준다.
도 5는 4량체 최적화 후 서열 특이적 페어링의 모식도를 보여준다.
도 6은 4량체 최적화 서열 간의 비특이적 페어링 영역의 자유 에너지 합의 통계도를 보여준다.
도 7은 4량체 최적화 서열 핵산 골격 조립의 겔 실행도를 보여준다.
도 8은 4량체에서 5량체로의 변환에 대한 모식도를 보여준다.
도 9는 5량체 변환 방안 1의 최적화 후 서열 비페어링 영역의 자유 에너지 합의 통계도를 보여준다.
도 10은 5량체 변환 방안 1의 최적화 후 서열 핵산 골격 조립의 겔 실행 모식도를 보여준다.
도 11은 5량체 방안 2의 최적화 후 서열 특이적 페어링의 모식도를 보여준다.
도 12는 5량체 변환 방안 2의 최적화 후 서열 비페어링 영역의 자유 에너지 합의 통계도를 보여준다.
도 13은 5량체 변환 방안 2의 최적화 후 서열 핵산 골격 조립의 겔 실행 모식도를 보여준다.
도 14는 G-CSF와 L-DNA의 커플링을 보여준다.
도 15는 (L-DNA)-G-CSF 접합체 정제 효과도를 보여준다.
도 16은 1가, 2가 및 3가 G-CSF 복합체 조립 효과도를 보여준다.
도 17은 G-CSF의 시험관내 활성에 대한 L-DNA 4량체 프레임워크의 영향을 보여준다.
도 18은 L-DNA 4량체 조립 2가 및 3가 G-CSF의 시험관내 활성 평가를 보여준다.
도 19는 a. HiTrap Capto MMC를 이용한 SM(PEG)2-PMO1의 정제; b. SM(PEG)2-PMO1과 anti-HSA 나노바디의 커플링 효율의 겔 전기영동도를 보여준다.
도 20은 양이온 모드에서 액체 크로마토그래피-질량 분석법에 의한 PMO1(a), SM(PEG)2-PMO1(b), anti-HSA Nb(c), anti-HSA Nb-PMO1(d)의 동정을 보여준다.
도 21은 SuperdexTM 75 Increase 10/300 GL을 이용한 나노바디와 PMO-나노바디 접합체의 분리를 보여준다.
도 22는 NAPPA-PMO 조립 샘플의 겔 전기영동도 및 모식도를 보여준다. 왼쪽: pmo-NAPPA4- HSA(1,2,3); 오른쪽: pmo-NAPPA4- HSA(1).
도 23은 ELISA를 이용한 anti-HSA Nb, anti-HSA Nb-PMO1 및 pmo-NAPPA4-HSA(1)와 인간 혈청 알부민(human serum albumin) 단백질의 결합 활성의 검출을 보여준다.
도 24는 pmo-NAPPA4-HSA(1)의 뉴클레아제 분해 저항성 실험을 보여준다. 왼쪽: 3개의 뉴클레아제로 처리된 pmo-NAPPA4-HSA(1)의 SDS-PAGE 겔 전기영동도; 오른쪽: 3개의 뉴클레아제로 처리된 DDNA-NAPPA4의 아가로스 겔 전기영동도.
본 발명자들은 광범위하고 심층적인 연구 끝에 최초로 다가 단백질 약물 및 이의 라이브러리, 제조 방법과 용도를 개발하였다. 본 발명의 약물 라이브러리, 제조 방법을 사용하여 필요에 따라 신속하고 효율적이며 저비용 및 고수율로 단기 작용 단백질 약물을 다가 복합체로 형성하여 약물 반감기를 향상시키거나 단량체 항원을 고가 항원으로 형성하여 이의 면역원성(immunogenicity)을 향상시킬 수 있다. 이 기초상에서 본 발명을 완료하였다.
구체적으로, 본 발명은 다가 단백질 약물을 제공하며, 이는 n 단백질 약물 유닛을 포함하고, 여기서 각각의 약물 유닛은 동일한 약물 요소 모이어티 및 상기 약물 요소 모이어티에 연결된 상이한 핵산 요소 모이어티를 포함하며; n은 ≥2의 양의 정수이고; n이 상이한 핵산 요소 모이어티는 핵산 염기 상보성 방식을 통해 n량체를 형성하여 상기 다가 단백질 약물을 구성하며; 본 발명의 다가 단백질 약물은 단지 신속한 조립(예를 들어, 1분)을 통해 안정적인 핵산 염기 상보성의 페어링 구조(복잡한 펩티드 결합 또는 기타 화학적 변형 등이 아닌)를 형성한다. 실험에 따르면 본 발명의 약물은 고가를 통해 분자량을 증가시켜 동물 체내의 반감기를 연장시킬 수 있다.
또한, 동일한 실시형태에 기반하여 상기 약물 요소는 또한 백신의 연구 개발을 위한 항원일 수 있고; 다른 점은 각각의 항원 유닛이 동일하거나 상이한 항원 요소 모이어티 및 상기 항원 요소 모이어티에 연결된 상이한 핵산 요소 모이어티를 포함하는 것이며; n이 상이한 핵산 요소 모이어티는 핵산 염기 상보성 방식을 통해 n량체를 형성하여 상기 다가 항원을 구성한다.
마지막으로, 본 발명은 상술한 약물 또는 항원 유닛을 다가 거대분자 복합체로 신속하고 정확하게 자가조립하기 위해 2-5량체로 효율적이고 정확하게 조립된 핵산 서열 그룹을 포함하는 고도로 최적화된 핵산 서열 라이브러리를 제공한다.
용어
달리 정의된지 않는 한, 본문에서 사용되는 모든 기술적 및 과학적 용어는 모두 당업자에 의해 통상적으로 이해되는 의미와 동일한 의미를 갖는다. 본문에 사용된 바와 같이, 구체적으로 인용된 값과 관련하여 사용되는 경우, 용어 "약"은 상기 값이 인용된 값으로부터 1% 이하로 변할 수 있음을 의미한다. 예를 들어, 본문에 사용된 바와 같이, "약 100"이라는 표현은 99와 101 사이의 모든 값(예를 들어, 99.1, 99.2, 99.3, 99.4 등)을 포함한다.
약물 D
본 발명에서, 상기 약물 요소 모이어티는 단백질계 약물, 폴리펩티드계 약물이다.
전형적으로, 상기 단백질계 약물은 사이토카인, 호르몬(예를 들어 인슐린, 성장 호르몬 등), 항체 약물, 폴리펩티드를 포함하지만 이에 한정되지 않는다.
본 발명의 일 바람직한 실시예에서, 상기 단백질계 약물은 백혈구 감소증을 치료하는 G-CSF이다.
항원 라이브러리 A
본 발명은 항원 라이브러리를 제공하고, 상기 항원 라이브러리는 N 항원 유닛을 포함하며;
여기서, 상기 항원 유닛은 항원 요소 모이어티 및 상기 항원 요소 모이어티에 연결된 핵산 요소 모이어티를 포함하고; 상이한 핵산 요소 모이어티는 핵산 염기 상보성 방식을 통해 n량체를 형성하여 다가 항원을 구성하며;
여기서, 상기 항원 요소 모이어티는 단백질계 항원, 폴리펩티드계 항원이고;
전형적으로, 상기 단백질계, 폴리펩티드계 항원은 바이러스, 세균 단백질, 이의 구조적 영역, 및 단편을 포함하지만 이에 한정되지 않으며;
본 발명에서, 상기 항원 요소 모이어티는 라이브러리 내 M개의 상이한 항원 단백질로부터 선택되고, M≤N이며; M개의 상이한 항원 단백질은 특정 바이러스 내 상이한 단백질 또는 상이한 바이러스주의 동일한 단백질의 돌연변이체를 포함하고;
본 발명의 일 바람직한 실시예에서, 상기 단백질계 항원은 신종 코로나바이러스 SARS-CoV-2로부터 유래되며; 구체적으로, 바이러스 스파이크 단백질의 수용체 결합 도메인(RBD)에 의해 형성된 고가 항원이다.
L-핵산
L-핵산은 자연계에 존재하는 우선성 핵산(D-핵산)에 대해 거울상으로 존재하는 것을 말하고, 좌선성 DNA(L-DNA) 및 좌선성 RNA(L-RNA)로 나뉠 수 있다. 좌선성(키랄 중심)은 주로 핵산의 데옥시리보스 또는 리보스 모이어티에 존재하고 거울상 반전을 나타낸다. 따라서, L-핵산은 혈장에 편재하는 뉴클레아제(예를 들어 엑소뉴클레아제, 엔도뉴클레아제)에 의해 분해될 수 없다.
제조 방법
1. L-핵산 사슬 프레임워크의 설계와 제조
본 발명에 따르면, L-핵산 사슬 프레임워크는 2개 이상의 L-핵산 단일 사슬의 염기 페어링에 의해 형성된다. 각각의 L-핵산 단일 사슬의 5' 또는 3' 말단은 모두 후속 변형을 제공할 수 있는 기(group)(예를 들어, NH2 등)로 활성화된 후 연결체(예를 들어 SMCC, SBAP 등)의 일단으로 L-핵산 단일 사슬의 활성화된 기에 커플링된다. 연결체가 있는 L-핵산은 원하는 L-핵산 사슬 프레임워크로 조립될 수 있다. 다른 바람직한 예에서, L-핵산 단일 사슬의 5' 또는 3' 말단의 활성화 관능기(예를 들어 알데히드, 말레이미드 등)는 핵산 합성에 포함되어 있다. 연결체가 있는 L-핵산이 프레임워크로 성공적으로 자가조립될 수 있는 것으로 결정된 후, 연결체가 있는 L-핵산 단일 사슬은 후속 조립을 위해 항체에 각각 커플링될 수 있다. 본 발명의 L-핵산 프레임워크는 기본적으로 하기 단계를 통해 제조될 수 있다.
1.1 신속한 자가조립을 위한 L-핵산 단일 사슬의 설계
필요한 다가 수 n(예를 들어 3량체, 4량체)을 결정하고; 다가 수 n에 따라 필요한 L-핵산 단일 사슬 수 n을 결정하며; 상응한 수의 L-핵산 단일 사슬 서열을 설계하고, 염기 페어링을 최적화하여 표적 핵산 프레임워크 안정성을 조절하며, 핵산 사슬 간의 비특이적 페어링 가능성을 감소시킨다. 핵산 서열 설계의 세부사항은 발명의 내용과 실시예에서 구체적으로 설명되어 있다.
1.2 L-DNA 또는 L-RNA의 활성화
L-핵산의 활성화는 이의 5' 말단(X1) 또는 3' 말단(X3)의 활성기 변형 및 후속 연결체 커플링을 포함한다. 활성기 변형은 핵산 합성 회사에서 맞춤 제작하여 완료될 수 있고; 연결체는 일반적으로 이중 기능 기를 가지며, 즉 일단은 핵산의 활성기에 커플링될 수 있고, 타단은 단백질의 특이적 부위(예를 들어 NH3, SH)에 연결될 수 있다.
본 발명의 일 바람직한 실시형태에 따르면, 프레임워크를 구성하는 모든 L-핵산은 5' 말단에 알데히드 변형을 추가하여 L-핵산의 활성화를 완료하고 후속적으로 단백질의 N 말단 α-아민을 커플링할 수 있다.
2. 단백질-L-핵산 복합체의 제조 방법
먼저 L-핵산의 5' 또는 3' 말단을 알데히드로 변형시킨 다음, 낮은 pH(5-6) 조건에서 환원성 아민화 반응(reductive amination reaction)을 통해 L-핵산의 알데히드기를 단백질 N 말단 NH3에 특이적으로 연결한다.
알고리즘 및 알고리즘 최적화된 핵산 서열
본 발명은 또한 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열의 결정 방법 및 장치를 제공한다. 바람직하게는, 상기 방법은 본 발명의 바람직한 알고리즘을 포함한다.
전형적으로, 본 발명의 컴퓨터 알고리즘으로 최적화된 핵산 서열 라이브러리는 (a) 염기 상보적 페어링을 통해 3량체로 자가조립될 수 있는 핵산 서열; (b) 염기 상보적 페어링을 통해 4량체로 자가조립될 수 있는 핵산 서열; 및 (c) 염기 상보적 페어링을 통해 5량체로 자가조립될 수 있는 핵산 서열을 포함할 수 있다.
대표적인 핵산 서열에 의해 형성된 복합체는 도 1에 도시된 바와 같은 3량체, 4량체, 5량체 분자이다.
바람직하게는, 본 발명의 상기 핵산 서열 W는 식 1로 표시되는 구조를 가지고,
W=X1-R1-X2-R2-X3 (1)
여기서,
R1은 염기 상보적 페어링 영역 1이며;
R2는 염기 상보적 페어링 영역 2이고;
X1, X2 및 X3은 각각 독립적으로 없거나 중복 핵산이며;
R1 및 R2의 길이는 14-16 염기이고;
X1, X3의 길이는 0-5 염기이며;
X2의 길이는 0-3 염기이고, 서열은 A, AA, AGA 또는 AAA이며;
여기서, 핵산 서열의 R1과 상이한 핵산 서열의 R2는 표적 페어링을 형성하고, 핵산 서열의 R2와 다른 핵산 서열의 R1은 표적 페어링을 형성한다.
본 발명에서, 상기 핵산 서열의 임의의 영역의 자가구성은 모두 비표적 페어링에 속하고, 설계상 피해야 할 필요가 있다.
바람직하게는, 본 발명의 상기 핵산 서열은 어닐링 알고리즘(S imulated Annealing, SA)의 컴퓨터 알고리즘을 통해 설계 또는 최적화될 수 있다.
상기 컴퓨터 알고리즘은 표적 페어링에 의해 형성된 DNA 이중 사슬 구조의 자유 에너지(free energy, )를 최소화하는 동시에 비표적 페어링의 를 최대화하고;
구체적으로, DNA 이중 사슬 구조의 안정성은 서열의 각 최근접 이웃의 염기쌍에 따라 다르고; 임의의 Watson-Crick DNA 이중 사슬 구조에는 10개의 상이한 최근접 이웃 상호작용이 있을 수 있으며, 이러한 쌍별 상호작용은 AA/TT; AT/TA; TA/AT; CA/GT; GT/CA; CT/GA; GA/CT; CG/GC; GC/CG; GG/CC이고;
보다 구체적으로, 상술한 10개의 염기쌍의 값은 임의의 온도에서 엔탈피(enthalpy, ) 및 엔트로피(entropy, )를 통해 계산하여 얻으며; 표 1에는 10개의 서열의 엔탈피, 엔트로피 및 자유 에너지 데이터가 요약되어 있다.
표 1 10개의 서열의 열역학적 데이터
참고: , 은 모두 1 M NaCl, 25℃, pH 7의 조건에서 측정된다. 는 IDT 웹사이트(https://sg.idtdna.com/calc/analyzer)에서 측정된다.
표 1의 열역학적 값을 사용하여 DNA 올리고머의 엔탈피 값 및 자유 에너지 값 은 모두 최근접 이웃법을 통해 효과적으로 예측할 수 있다. GGAATTCC/CCTTAAGG의 상보적 페어링을 예로 들어, 최근접 이웃법을 통해 계산하면, =-14.63 kcal/mol이다.
상기 어닐링 알고리즘은 값을 최적화하는 것 외에도 핵산 서열 페어링 해리 온도()의 제약을 실시하여 R1 및 R2 영역의 (L=14 염기인 경우)를 확보한다.
최근접 이웃 모델은 열역학적 계산을 기반으로, DNA 이중 사슬의 안정성을 정확하게 예측하고, 주어진 염기 서열에 대한 상기 모델의 예측은 최근접 이웃의 염기쌍을 기반으로 한다. 녹는 온도의 계산은 엔탈피(enthalpy, ) 및 엔트로피(entropy, )에 관련되고, 이의 계산 방법은 하기와 같다.
여기서, R는 상수(1.987 cal K-1mol-1)이고, CT는 0.1 μM로 주어진 사슬 농도이며, 는 주어진 나트륨 이온 농도에서의 DNA 이중 사슬의 엔트로피 값이고, 는 주어진 조건에서의 엔탈피 값이다.
시뮬레이션 어닐링은 범용 확률 알고리즘이고, 이는 몬테카를로 아이디어를 기반으로 설계된 최적화 문제에 대해 근사적으로 해를 구하는 방법으로, 일정 시간 내에 넓은 탐색 공간에서 근사적인 최적 해를 찾는 것을 목표로 한다. 시뮬레이션 어닐링 알고리즘의 아이디어는 물리학에서 고체 물질의 어닐링 과정에서 유래되는 바, 먼저 고체를 충분히 가열한 후 천천히 냉각시키고, 가열 시 고체 내부 입자의 자유 이동 내부 에너지가 증가하며, 그 후 온도가 점차 낮아지면서 입자가 질서정연해지는 경향이 있고, 각 온도에서 평형 상태에 도달하며, 응결점 근처의 온도 강하 속도가 충분히 느리면 기저 상태에 도달하고 내부 에너지가 최소화된다. Metropolis 규칙에 따르면, 온도 T일 때 입자가 평형을 이룰 확률은 이고, 여기서 E는 온도 T일 때의 내부 에너지이며, 는 변화량이고, K는 볼츠만(Boltzmann) 상수이다. 조합 최적화 문제에 대해서도 유사한 과정이 존재하고, 고체 미시 상태 i를 해 X로 시뮬레이션하며, 목적 함수는 상태 i일 때의 내부 에너지 E i와 동일하고, 제어 파라미터 T로 고체 온도를 시뮬레이션한다. T의 각각의 값에 대해 "새로운 해 생성→목적 함수 차이 계산→수용 여부 판단→수용/폐기"의 반복 과정을 반복하고, T 값을 점차 감쇠시키고, 반복 과정에서 Metropolis 규칙에 따라 열악한 해를 제한적으로 수용하고 열악한 해를 수용할 확률은 점차 0이 되는 경향이 있으므로 알고리즘이 종료될 때 전역 최적 해를 최대한 찾을 수 있다.
본 발명에서, 다량체 핵산 단일 사슬 간의 비표적 페어링 영역의 자유 에너지를 내부 에너지로 시뮬레이션하고, 핵산 단일 사슬 간의 표적 페어링 영역의 자유 에너지와 해리 온도를 보장하는 경우, 시뮬레이션 어닐링 알고리즘의 반복을 통해 비표적 페어링 영역의 자유 에너지를 최적화하며, 최종적으로 최적화된 단일 사슬은 다량체의 조립에 더 유리하다. 사용된 최적화 목적 함수는 하기와 같다.
는 서열 S i 및 서열 S j의 비표적 페어링 자유 에너지이고, 는 모든 서열 사이의 비표적 페어링 자유 에너지의 합이며, 그 값은 음수이고, 이 값이 클수록 비표적 페어링을 줄이는 데 유리하다. 따라서, 어닐링 알고리즘으로 에너지 최소화에 대한 해를 구하는 아이디어에 따라 목적 함수를 구축하고, 앞에 음의 부호를 추가하여 양수로 변환하며, 이때 의 값이 작을수록 비표적 페어링을 줄이는 데 유리하다.
대표적인 본 발명의 알고리즘의 흐름도는 도 2에 도시된 바와 같다.
본 발명에서, 시뮬레이션 어닐링 알고리즘은 랜덤 요인을 도입하고, 각 반복 업데이트 과정에서 일정한 확률로 현재보다 열악한 해를 수용하므로, 국소 최적 해를 뛰어넘어 전역 최적 해에 도달할 수 있다.
다가 거대분자 복합체
본 발명은 또한 위의 알고리즘에 의해 설계된 핵산 다량체로 단백질 약물을 매개하여 다가 거대분자 복합체를 형성하는 것을 제공하고, 상기 복합체는 향상된 약물 반감기 및 활성을 갖는다.
바람직하게는, 상기 핵산 서열은 핵산 서열 라이브러리 내 n량체로 특이적으로 조립된 핵산 서열 그룹이고;
바람직하게는, 본 발명에서, 상기 단백질 약물은 반감기 또는 활성을 향상시키기 위해 다가를 형성해야 하는 단백질 약물이다.
전형적으로, 상기 핵산 서열 그룹의 각각의 핵산 사슬은 상기 단백질 약물에 각각 연결되어 단백질 약물-핵산 사슬 유닛을 형성하고, 식 2로 표시되는 구조를 가지며,
D-[L-Wi], i=1 내지 n (2)
상기 식에서,
D는 단백질 약물 요소 모이어티이고;
각각의 Wi는 독립적으로 핵산 서열이며; 상기 핵산 서열은 L-핵산, 펩티드 핵산, 잠금 핵산, 포스포로티오에이트 핵산, 2'-플루오로 변형 핵산, 5-히드록시메틸시토신 핵산, 또는 이들의 조합으로 이루어진 군으로부터 선택되고; 상기 핵산 서열은 식 1로 표시되는 구조를 가지며, 상술한 n량체를 형성할 수 있는 핵산 서열 그룹으로부터 선택되고;
L은 연결체이며; 상기 연결체 모이어티는 Wi의 합성 또는 제조에 포함되어 있고, Wi의 X1 또는 X3에 연결되어 있으며(식 1 참조);
"-"는 공유 결합이고;
다른 바람직한 예에서, 상기 약물 요소 모이어티는 반감기 향상을 위해 분자량을 증가시켜야 하는 단백질 약물 및 폴리펩티드 약물, 활성 향상을 위해 다가를 형성해야 하는 단백질 약물 및 폴리펩티드 약물로 이루어진 군으로부터 선택되며;
다른 바람직한 예에서, D 말단에 근접한 L은 알데히드(aldehyde), NHS 에스테르(ester) 또는 유사한 관능기를 가지고, D 상의 N 말단의 α-아민(amine) 또는 라이신 ε-아민(lysine ε-amine)을 연결하기 위해 사용되며;
다른 바람직한 예에서, D 말단에 근접한 L은 말레이미드(maleimide) 관능기 또는 할로아세틸(haloacetyl)(예를 들어 브로모아세틸(bromoacetyl), 요오도아세틸(iodoacetyl) 등) 관능기를 가지고, D 상의 자유 티올(free thiol,-SH) 관능기를 연결하기 위해 사용되며;
다른 바람직한 예에서, D는 천연 단백질, 재조합 단백질, 화학적 변형된 단백질, 합성된 폴리펩티드로 이루어진 군으로부터 선택되고;
다른 바람직한 예에서, D는 식 1의 L-Wi를 연결하기 위한 위치-특이적 변형 또는 비천연 아미노산의 위치-특이적 추가가 있을 수 있으며;
상기 단백질 약물은 n량체로 조립될 수 있는 상이한 L-Wi에 각각 연결되어 단백질 약물 자가조립 유닛, D-[L-W1], D-[L-W2], …, D-[L-Wn]을 형성하고;
단백질 약물 자가조립 유닛, D-[L-W1], D-[L-W2], …, D-[L-Wn]은 용액에서 등몰로 혼합되어 단백질 약물 다가 분자 복합체로 조립된다.
본 발명은 체내에서 중화 항체 생성을 유도하는 백신의 효과를 향상시키기 위해 위의 알고리즘에 의해 설계된 핵산 다량체로 하나 이상의 항원을 매개하여 다가 거대분자 복합체를 형성하는 것을 제공하고;
여기서, 상기 핵산 서열은 핵산 서열 라이브러리 내 n량체로 특이적으로 조립된 핵산 서열 그룹이며;
여기서, 상기 항원은 항원 또는 항원 라이브러리이고; 상기 항원 라이브러리는 M개의 상이한 항원 단백질을 포함하며, 1≤M≤n이고;
상기 핵산 서열 그룹의 각각의 핵산 사슬은 상기 항원 라이브러리 내의 항원에 각각 연결되어 항원-핵산 사슬 유닛을 형성하며, 식 3으로 표시되는 구조를 가지고,
Ak-[L-Wi], i=1-n, k=1-M (3)
상기 식에서,
Ak는 상기 항원 라이브러리 내 항원 k이며; Ak는 하나 이상의 L-Wi(예: A1-[L-W1], A1-[L-W2], A2-[L-W3], A3-[L-W4])에 각각 대응되고;
식 3의 다른 양태는 위의 식 3과 같으며;
상기 항원 단백질은 n량체로 조립될 수 있는 L-Wi에 각각 연결되어 항원 자가조립 유닛, 예를 들어 A1-[L-W1], A2-[L-W2], …, A3-[L-WN]을 형성하고;
항원 자가조립 유닛은 용액에서 등몰로 혼합되어 다가 항원 복합체로 조립된다.
본 발명의 주요 장점은 하기와 같다.
(1) 본 발명은 융합 단백질의 재구축 또는 복잡한 화학적 변형 및 가교 없이 기존의 단기 작용 단백질 약물에 대해 단백질 약물의 다가를 완료하여 반감기 및 활성을 향상시킬 수 있고; L-핵산의 알데히드 변형은 단백질의 N 말단 아민을 특이적으로 연결하여 올리고머로 자가조립될 수 있는 단백질 약물 유닛을 형성할 수 있으며;
(2) 본 발명의 단백질 약물 유닛(단백질-핵산 연결체)는 일분 내에 L-핵산 사슬을 이용하여 단백질 약물 다가를 매개하고 완료할 수 있으며;
(3) 백신 개발 측면에서, 본 발명은 단량체 단백질 항원을 고가로 형성하여 면역원성을 향상시킬 수 있고;
(4) 백신 개발 측면에서, 본 발명은 또한 상이한 바이러스 또는 세균 균주의 항원 돌연변이형 및 아형을 다원성 고가 항원으로 조립하여 더 광범위한 중화 항체를 유도할 수 있다.
이하, 구체적인 실시예를 결부하여 본 발명을 더 설명한다. 이러한 실시예는 본 발명을 설명하기 위한 것일 뿐, 본 발명의 범위를 한정하기 위한 것이 아님을 이해해야 한다. 하기 실시예에서 구체적인 조건을 제시하지 않은 실험 방법은 통상적으로 Sambrook 등, 분자 클로닝: 실험실 매뉴얼(New York: Cold Spring Harbor Laboratory Press, 1989)에서 기재된 조건과 같은 일반적인 조건을 따르거나, 또는 제조업체에서 권장하는 조건을 따른다. 다른 설명이 없는 한, 백분율 및 분량은 중량 백분율 및 중량부에 따라 계산된다.
실시예 1: 3량체 핵산 골격 어셈블리의 설계, 합성 및 검증
도 1(A)의 형상에 따라 페어링될 수 있는 3개의 핵산을 설계하였다. 구체적으로, R 1 핵산 단일 사슬은 R 6 핵산 단일 사슬과 특이적 상보적 페어링을 수행하고, 다른 핵산 단일 사슬과 페어링하지 않으며, 마찬가지로 R 3, R 5R 2, R 4와 각각 특이적 상보적 페어링을 수행하고, 다른 핵산 단일 사슬과 페어링하지 않으며, 특이적 상보적 페어링의 자유 에너지()는 비특이적 페어링 자유 에너지()보다 훨씬 작고, 특이적 상보적 페어링의 자유 에너지()는 -29 kcal/mol 미만이며, 비특이적 페어링 자유 에너지()는 모두 -7 kcal/mol보다 크므로, 3량체의 형태는 반응 시스템에서 가장 안정적이다. 3량체 최적화의 구체적인 실시 단계는 도 2에 설명되어 있고; 어닐링 파라미터는 어닐링 초기 온도 , 어닐링 종료 온도 , 어닐링 온도 감쇠 계수 (어닐링 초기 온도는 매번 현재의 0.98로 감쇠됨)이며; 최적화 제약 파라미터는 페어링 서열 길이 L=16 염기, 해리 온도 임계값 , 페어링 서열 자유 에너지 임계값: <-29 kcal/mol, 비특이적 페어링 자유 에너지 임계값: >-7 kcal/mol이다. 최적화의 구체적인 실시 단계는 하기와 같다.
서열 초기화: 파라미터에 따라 페어링 서열 을 초기화하고, 염기 상보적 페어링에 따라 R6, R2 및 R4를 얻으며, 6개의 서열을 도 1(A)에 도시된 바와 같이 스플라이싱하여 최종적으로 초기화 서열 세트 를 얻었다.
새로운 해 생성: 새로운 해 S'는 모두 서열 세트 S를 업데이트하여 얻은 것이다. 먼저 를 계산하는데, 이는 세트 S의 비특이적 페어링에서 표적 페어링에 영향이 가장 큰 2개의 서열 S iS j를 찾기 위한 것이며, 그런 다음 비표적 페어링 영역에 따라 S i 또는 S j를 랜덤으로 선택하여 업데이트하여, 하나의 새로운 핵산 서열을 얻고, 이 핵산 서열의 페어링 영역의 해리 온도()가 54℃보다 큰지 여부와 페어링 영역의 자유 에너지()가 -29 kcal/mol 미만인지 여부를 확인하며, 해리 온도 및 페어링 영역의 자유 에너지()의 제약 조건을 충족하지 않으면 업데이트를 반복하고, 해리 온도 및 페어링 영역의 자유 에너지()의 제약 조건을 충족하면, 염기 상보적 페어링 원칙에 따라 S를 업데이트하며, 최종적으로 새로운 서열 세트 S'를 얻었다. 15회 업데이트 후에도 얻은 새로운 핵산 서열이 해리 온도 및 페어링 영역의 자유 에너지()의 제약 조건을 충족하지 못하면 무한 루프를 방지하기 위해 세트 S가 새로운 해 S'로 된다.
최적화 판단: 공식 2에 따라 세트 S 및 S'의 목적 함수값 Ei 및 Ei+1을 각각 계산하며, Ei+1-Ei≥0이면, 업데이트에서 비표적 페어링 자유 에너지()를 최적화한 다음 이고, 새로운 해 S'가 S로 됨을 나타낸다. Ei+1-Ei<0이면, 업데이트에서 악화 해를 얻음을 나타내며, Metropolis 규칙에 따라 확률 을 계산하는 동시에 r를 랜덤으로 생성하고 이며, p>r이면 이 악화 해를 수용하고, 그렇지 않으면 악화 해를 거부한다. 최종적으로 어닐링 초기 온도는 현재의 0.98로 감쇠되고, 어닐링 종료 온도로 감쇠될 때까지 다음의 새로운 해를 생성하여 최적화된 서열 세트 S를 얻었다.
표 2_1의 최적화 후 서열은 위의 알고리즘 최적화를 통해 얻은 것이고, 각 서열의 5' 말단 A의 목적은 활성기 변형 및 후속 연결체 커플링을 위한 것이다. 비표적 페어링 자유 에너지() 행렬표와 표적 페어링 영역의 파라미터 지표표에는 일부 주요 파라미터 값이 요약되어 있다. 3량체 최적화 후 서열 특이적 페어링의 모식도는 도 3을 참조바라며, 대응되는 핵산 골격의 겔 실행도(도 4)로부터 볼 수 있다시피, Lane9는 인공적으로 설계된 3량체로 밴드가 불분명하고 테일링(tailing)이 있으며, Lane10은 최적화 후 서열 S 1, S 2S 3에 의해 형성된 메인 밴드로 3량체를 형성하고 매우 높은 안정성을 나타냄을 보여준다.
표 2_1 3량체 초기화 서열과 최적화 후 서열
표 2_2 3량체 초기화 서열과 최적화 후 서열의 자유 에너지() 행렬
표 2_3 3량체 최적화 후 서열 표적 페어링 영역의 파라미터 지표
실시예 2: 4량체 핵산 골격 어셈블리의 설계, 합성 및 검증
도 1(B)의 형상에 따라 페어링될 수 있는 4개의 핵산을 설계하였다. 여기서, 핵산 단일 사슬 R 1, R 3, R 5R 7은 각각 핵산 단일 사슬 R 8, R 2, R 4R 6과 특이적 상보적 페어링을 수행하고, 다른 핵산 단일 사슬과 페어링하지 않으며, 특이적 상보적 페어링의 자유 에너지()는 비특이적 페어링 자유 에너지()보다 훨씬 작고, 특이적 상보적 페어링의 자유 에너지()는 -27.4 kcal/mol 미만이며, 비특이적 페어링 자유 에너지()는 모두 -7 kcal/mol보다 크므로, 4량체의 형태는 반응 시스템에서 가장 안정적이다. 4량체 최적화의 구체적인 실시 단계는 도 2에 설명되어 있고; 어닐링 파라미터는 어닐링 초기 온도 , 어닐링 종료 온도 , 어닐링 온도 감쇠 계수 (어닐링 초기 온도는 매번 현재의 0.98로 감쇠됨)이며; 최적화 제약 파라미터는 페어링 서열 길이 L=14 염기, 해리 온도 임계값 , 페어링 서열 자유 에너지 임계값: <-27.4 kcal/mol, 비특이적 페어링 자유 에너지 임계값 >-7 kcal/mol이다.
최적화의 구체적인 실시 단계는 하기와 같다.
서열 초기화: 파라미터에 따라 페어링 서열 을 초기화하고, 염기 상보적 페어링에 따라 R 8, R 2, R 4R 6을 얻으며, 8개의 서열을 도 1(B)에 도시된 바와 같이 스플라이싱하여 최종적으로 초기화 서열 세트 를 얻었다. 4량체 실험 과정에서, 고정 핵 구조가 핵산 서열의 조립 효율을 효과적으로 향상시킬 수 있음이 발견되었고, 핵산 서열 식 1의 기초상에서 핵산 서열 W2를 발전시키며, W2는 식 4로 표시되는 구조를 가지고,
W2=X1-Q1-C1-X2-C2-Q2-X3 (4)
여기서, C1 및 C2는 고정 핵 구조 부분이고, Q1 및 Q2는 고정 핵 구조 이외의 서열이다.
표 3 고정 핵 구조를 포함하는 핵산 서열 S 1, S 2, S 3S 4
새로운 해 생성: 실시예 1의 새로운 해 생성과 같다. 다르게는, 고정 핵 구조를 사용하는 경우 고정 핵 구조를 포함하지 않는 부분을 업데이트하고; 파라미터 제약을 엄격히 따라야 하며, 새로운 핵산 서열 페어링 영역의 해리 온도()는 52℃보다 커야 하는 동시에 페어링 영역의 자유 에너지()는 -27.4 kcal/mol 미만이어야 한다.
최적화 판단: 실시예 1의 최적화 판단과 같다.
표 4_1의 최적화 후 서열은 위의 알고리즘 최적화를 통해 얻은 것이고, 특이적 페어링의 모식도는 도 5에 도시된 바와 같으며, 최적화 과정에서 4량체 최적화 서열의 비페어링 표적 자유 에너지의 꺽은선 통계도는 도 6에 도시된 바와 같고, 본 발명은 연결 요소 추가 시 연결 요소를 추가하지 않은 최적화 서열 자유 에너지()에 큰 영향을 미치지 않으며, 연결 요소 추가 여부와 관계 없이 최적화 후 서열의 자유 에너지() 행렬의 합은 가능한 한 크므로, 최적화 과정에서 연결 요소를 추가하지 않은 최적화 후 서열의 목적 함수값을 통계하고, 연결 요소를 추가한 최적화 서열만 최종 검출하며, 대응되는 핵산 골격의 겔 실행도(도 7)로부터 볼 수 있다시피, Lane15는 인공적으로 설계된 4량체의 밴드로 테일링 현상이 있고, Lane16은 알고리즘 최적화 후 서열 S 1, S 2, S 3S 4에 의해 형성된 메인 밴드로 약 100 bp이며, 4량체를 형성하고 매우 높은 안정성을 나타냄을 보여준다.
위의 4량체 실시 단계는 주로 서열 간의 비특이적 페어링 자유 에너지를 최적화하고, 서열 자체 폴딩에 의해 형성된 이차 구조도 4량체의 조립에 큰 영향을 미친다. 서열 자체에 의해 형성된 이차 구조의 해리 온도가 너무 높으면, 이러한 안정적인 이차 구조가 형성되는 한 이러한 상태를 깨뜨리기 어려워 4량체 조립이 어렵다. 따라서, 조립된 4량체의 4개의 서열에 대응되는 이차 구조의 해리 온도가 너무 높지 않도록 제어해야 한다. 4량체의 경우, 4개의 핵산 서열의 이차 구조의 해리 온도를 제어해야 하는데, 대칭 구조(도 1 중의 R 1, R 3, R 5, R 7은 각각 R 4, R 6, R 8, R 2와 대칭을 유지함)를 사용하면, 두 서열 사이에 유사한 이차 구조가 나타나게 되고, 양자의 이차 구조의 해리 온도는 크게 다르지 않으며, 이때 2개의 핵산 서열의 이차 구조를 제어하기만 하면 이전의 효과를 달성할 수 있으므로, 대칭은 4량체 최적화에서 이차 구조의 제어에 유리하다.
표 4_1 4량체 초기화 서열과 최적화 후 서열
표 4_2 4량체 초기화 서열과 최적화 후 서열의 자유 에너지() 행렬
표 4_3 4량체 최적화 서열 페어링 영역의 파라미터 지표
실시예 3: 5량체 핵산 골격 어셈블리의 설계, 합성 및 검증
4량체의 최적화 서열은 매우 우수한 조립 효과를 나타냈는데, 이는 주로 4량체의 중앙 부위에 페어링이 형성되지 않았기 때문이고, 즉 고정 핵 구조가 4량체에 충분한 자유도를 제공하고 중앙 영역에서 복잡한 복합체를 형성하지 않는다. 따라서, 5량체 서열의 최적화에서 4량체 서열 및 고정 핵 구조를 통합하기 위해 실시예 2의 4량체 서열과 고정 핵 구조를 이용한 두 가지 방안을 탐색하여 설계하였다.
첫 번째 변환 방안: 도 8(B)의 형상에 따라 페어링될 수 있는 5개의 핵산을 설계하고, 이 방안은 실시예 2의 4량체의 일부 서열과 완전한 고정 핵 구조를 유지하며, 핵 구조를 열지 않았다. 원래 4량체의 R 1R 8에서 핵 구조를 제외하고 4량체를 열며, 길이가 14인 2개의 핵산 서열 R 9R 10을 추가하였다. 여기서, 핵산 단일 사슬 R 1, R 3, R 5, R 7R 9는 각각 핵산 단일 사슬 R 10, R 2, R 4, R 6R 8과 특이적 상보적 페어링을 수행하고, 다른 핵산 단일 사슬과 페어링하지 않았다. 특이적 상보적 페어링의 자유 에너지()는 -27.4 kcal/mol 미만이고, 비특이적 페어링 자유 에너지()는 모두 -7 kcal/mol보다 크므로, 5량체의 형태는 반응 시스템에서 가장 안정적이다. 5량체의 첫 번째 변환 방안의 최적화의 구체적인 실시 단계는 도 2에 설명되어 있고; 어닐링 파라미터는 어닐링 초기 온도 , 어닐링 종료 온도 , 어닐링 온도 감쇠 계수 (어닐링 초기 온도는 매번 현재의 0.9로 감쇠되는데, 4량체의 일부 서열을 사용하기 때문에 업데이트 영역이 적어지고 어닐링 온도 감쇠가 더 빠름)이며; 최적화 제약 파라미터는 페어링 서열 길이 L=14 염기, 해리 온도 임계값 , 페어링 서열 자유 에너지 임계값: <-27.4 kcal/mol, 비특이적 페어링 자유 에너지 임계값 >-7 kcal/mol이다.
이 방안에서는 완전한 4량체 고정 핵 구조를 사용하고, 핵산 서열 식 4의 기초상에서 핵산 서열 W5를 발전시키며, 핵산 서열 식 4의 기초상에서 핵산 서열 W6을 발전시키고, W5는 식 7로 표시되는 구조를 가지며, W6은 식 8로 표시되는 구조를 가지고,
W3=X1-R1-X2-C1-X2-C2-Q1-X3 (5)
W4=X1-Q1-C1-X2-C2-X2-R1-X3 (6)
이 방안은 식 1, 식 4, 식 5 및 식 6, 네 가지 구조의 서열을 포함한다.
표 5 일부 핵 구조를 포함하는 핵산 서열 S 1, S 2, S 3, S 4S 5
최적화의 구체적인 실시 단계는 하기와 같다.
파라미터에 따라 페어링 서열 을 초기화하고, 염기 상보적 페어링에 따라 R 8R 1을 얻으며, R 2, R 3, R 4, R 5, R 6R 7은 실시예 2의 사량체 최적화 후 서열의 동형 서열로부터 유래된다. R 9R 10을 스플라이싱하여 S 1을 얻고, R 1R 2를 식 5에 따라 스플라이싱하여 S 2를 얻으며, R 3R 4를 스플라이싱하여 S 3을 얻고, R 5R 6을 스플라이싱하여 S 4를 얻으며, R 7R 8을 식 6에 따라 스플라이싱하여 S 5를 얻고, 최종적으로 초기화 서열 세트 를 얻었다.
새로운 해 생성: R 1, R 8, R 9R 10에서 하나의 서열을 랜덤으로 선택하여 업데이트하여, 하나의 새로운 핵산 서열을 얻고, 이 핵산 서열의 해리 온도가 52℃보다 큰지 여부와 페어링 영역의 자유 에너지()가 -27.4 kcal/mol 미만인지 여부를 확인하며, 해리 온도 및 페어링 영역의 자유 에너지()의 제약 조건을 충족하지 않으면 업데이트를 반복하고, 해리 온도 및 페어링 영역의 자유 에너지()의 제약 조건을 충족하면, 염기 상보적 페어링 원칙에 따라 S를 업데이트하며, 최종적으로 새로운 서열 세트 S'를 얻었다. 15회 업데이트 후에도 얻은 새로운 핵산 서열이 해리 온도 및 페어링 영역의 자유 에너지()의 제약 조건을 충족하지 못하면 무한 루프를 방지하기 위해 세트 S가 새로운 해 S'로 된다. 이 방안은 완전한 고정 핵 구조 및 일부 사량체 서열을 사용하기 때문에, 새로운 해 생성 과정에서 고정 핵 구조와 유지된 4량체 서열 부분이 변하지 않도록 보장해야 한다.
최적화 판단: 실시예 1의 최적화 판단과 같다. 다르게는, 어닐링 초기 온도는 현재의 0.9로 감쇠된다.
표 6_1의 5량체의 첫 번째 변환 방안의 최적화 후 서열은 이 알고리즘 최적화를 통해 얻은 것이고, 도 9는 이 최적화 과정에서 서열 간의 비표적 페어링 영역의 자유 에너지 값의 합의 꺽은선 통계도(S 3S 3, S 3S 4, S 4S 4 간의 비표적 페어링 영역의 자유 에너지는 통계에 관여하지 않음)이고, 도 10의 Lane9는 최적화 후 서열 조립에 의해 형성된 메인 밴드로 5량체를 형성하고 매우 높은 안정성을 나타냄을 보여준다.
표 6_1 첫 번째 변환 방안에서 5량체 초기화 서열과 최적화 후 서열
표 6_2 첫 번째 변환 방안에서 5량체 초기화 서열과 최적화 후 서열의 자유 에너지() 행렬
표 6_3 5량체 최적화 서열 1 페어링 영역의 파라미터 지표
두 번째 변환 방안: 도 8(C)의 형상에 따라 페어링될 수 있는 5개의 핵산을 설계하고, 이 방안은 4량체의 고정 핵 구조 서열만 유지하며, 5량체에 적응하기 위해 R 1R 2에서 핵 구조를 열고, 다른 부분은 랜덤으로 생성한 다음 5량체 최적화를 수행해야 한다. 여기서, 핵산 단일 사슬 R 10, R 2, R 4, R 6R 8은 각각 핵산 단일 사슬 R 1, R 3, R 5, R 7R 9와 특이적 상보적 페어링을 수행하고, 다른 핵산 단일 사슬과 페어링하지 않았다. 특이적 상보적 페어링의 자유 에너지()는 -27.4 kcal/mol 미만이고, 비특이적 페어링 자유 에너지()는 모두 -7.2 kcal/mol보다 크므로, 5량체의 형태는 반응 시스템에서 가장 안정적이다. 5량체의 두 번째 변환 방안의 최적화의 구체적인 실시 단계는 도 2에 설명되어 있고; 어닐링 파라미터는 어닐링 초기 온도 , 어닐링 종료 온도 , 어닐링 온도 감쇠 계수 (어닐링 초기 온도는 매번 현재의 0.98로 감쇠됨)이며; 최적화 제약 파라미터는 페어링 서열 길이 L=14 염기, 해리 온도 임계값 , 페어링 서열 자유 에너지 임계값: <-27.4 kcal/mol, 비특이적 페어링 자유 에너지 임계값 >-7.2 kcal/mol이다.
표 7 일부 핵 구조를 포함하는 핵산 서열 S 1, S 2, S 3, S 4S 5
최적화의 구체적인 실시 단계는 하기와 같다.
서열 초기화: 최적화 제약 파라미터에 따라 페어링 서열 R 9 및 핵 구조 이외의 길이가 9인 서열 세트 를 초기화하고, 염기 상보적 페어링 원칙에 따라 R 8, Q 2, Q 4, Q 6Q 8을 얻으며, 표 7에 따라 스플라이싱하여 최종적으로 초기화 서열 세트 를 얻었다.
새로운 해 생성: 실시예 1의 새로운 해 생성과 같다. 다르게는, 이 방안은 4량체의 고정 핵 구조를 사용하기 때문에 새로운 해 생성 과정에서 고정 핵 구조 부분이 변하지 않도록 보장해야 한다. 아울러 파라미터 제약을 엄격히 따라야 하고, 업데이트 핵산 서열 페어링 영역의 해리 온도()는 52℃보다 커야 하는 동시에 페어링 영역의 자유 에너지()는 -27.4 kcal/mol 미만이어야 한다.
최적화 판단: 실시예 1의 최적화 판단과 같다.
표 8_1의 5량체의 두 번째 변환 방안의 최적화 후 서열은 이 알고리즘 최적화를 통해 얻은 것이고, 특이적 페어링의 모식도는 도 11에 도시된 바와 같으며, 도 12는 이 최적화 과정에서 서열 간의 비표적 페어링 영역의 자유 에너지 값의 합의 꺽은선 통계도이고, 도 13의 Lane35는 서열 S 1, S 2, S 3, S 4S 5에 의해 형성된 메인 밴드로 5량체는 다소 테일링이 있지만 조립 효과가 우수하다.
표 8_1 두 번째 변환 방안에서 5량체 초기화 서열과 최적화 후 서열
표 8_2 두 번째 변환 방안에서 5량체 초기화 서열과 최적화 후 서열의 자유 에너지() 행렬
표 8_3 5량체 최적화 서열 2 페어링 영역의 파라미터 지표
이 밖에, 실시예 1, 2 및 3을 반복하여 표 9-1, 표 9-2 및 표 9-3(상기 참조)에 나타낸 상보적 핵산 골격 기반의 3, 4 및 5량체 복합체를 형성하기 이한 단일 사슬 핵산 서열 및 이의 세트를 얻었다.
실시예 4: G-CSF와 L-DNA의 커플링
G-CSF와 L-DNA의 커플링은 환원성 아민화 반응의 방식을 사용하여 5' 말단에 알데히드기로 변형된 L-DNA를 G-CSF 말단에 선택적으로 커플링하였다. 희석법 또는 겔 여과 크로마토그래피 등 방법을 사용하여 G-CSF 완충액을 아세테이트 완충액(20 mM 아세테이트, 150 mM NaCl, pH 5.0)으로 교체하고 샘플을 30 mg/mL로 농축하였다. 5' 말단에 알데히드기로 변형된 L-DNA 건조 분말 100 OD(1 OD=33 μg)를 취하여 60 μL의 아세테이트 완충액에 용해시켰다. 30 mg의 나트륨 시아노보로하이드리드를 취하여 아세테이트 완충액으로 용해시키고 농도를 800 mM로 조정하였다. 50 μL, 60 μL, 20 μL의 상기 농도의 G-CSF, L-DNA, 나트륨 시아노보로하이드리드를 각각 취하여 골고루 혼합하고, 암실에서 실온 하에 48시간 동안 회전 배양하면서 반응시켰다. 반응 전 후의 샘플을 폴리아크릴아미드 겔 전기영동으로 커플링 반응 효과를 검증하고, (L-DNA)-(G-CSF) 접합체는 커플링되지 않은 G-CSF에 비해 겔 전기영동도에서 유의한 오프셋이 나타나며, 커플링 효율은 70%~80%에 달할수 있다(도 14)
실시예 5: (L-DNA)-(G-CSF) 접합체의 정제
(L-DNA)-(G-CSF) 접합체의 정제는 2개의 단계로 나뉜다. 첫 번째 단계에서, Hitrap Q HP를 이용하여 미반응 G-CSF 및 2개의 L-DNA가 연결된(L-DNA)2-(G-CSF) 접합체를 제거하였다. 실시예 5에서 얻은 반응 혼합액을 Q 컬럼의 로딩 완충액으로 10배 희석한 후 로딩하고, 로딩 완충액으로 10배 컬럼 부피를 용출하여 미반응 G-CSF를 제거하며, 그 후 0-100% 선형 구배 용출 방식을 사용하여 50배 컬럼 부피를 용출하여 (L-DNA)-(G-CSF) 접합체와 (L-DNA)2-(G-CSF) 접합체를 분리하고, 폴리아크릴아미드 겔 전기영동을 이용하여 각 A280 흡수 피크에 속하는 성분 유형을 동정하며(도 15b), (L-DNA)-(G-CSF) 접합체(미반응 핵산 포함)를 수집하였다. 두 번째 단계에서, Hiscreen Capto MMC를 이용하여 미반응 핵산을 제거하고, 최종적으로 분리하여 순도가 높은 (L-DNA)-(G-CSF) 접합체를 얻었다(도 15c). 첫 번째 단계에서 수집된 샘플을 Hiscreen Capto MMC 컬럼에 직접 로딩하고, 로딩 완충액으로 10배 컬럼 부피를 용출하여 미반응 핵산을 제거하며, 그 후 100% 용출 완충액으로 (L-DNA)-(G-CSF) 접합체를 용출하였다.
정제 조건은 하기 표와 같다.
두 단계 정제법을 통해 얻은 (L-DNA)-(G-CSF) 접합체 샘플은 2% 아가로스 겔 전기영동으로 샘플 순도를 동정하고(도 15d), 겔 이미지는 샘플에 하나의 핵산 밴드만 있고 커플링되지 않은 L-DNA에 비해 (L-DNA)-(G-CSF) 접합체가 겔 전기영동도에서 유의한 오프셋이 있음을 보여주고, 이는 미반응 핵산 및 (L-DNA)2-(G-CSF) 접합체가 깨끗하게 제거됨을 나타낸다.
실시예 6: 1가, 2가 및 3가 G-CSF 복합체의 조립
Nanodrop으로 S1-G-CSF, S3-G-CSF, S4-G-CSF, S2, S3, S4의 핵산 농도를 각각 측정하였다. 1가, 2가 및 3가 단백질 복합체의 구조 설계에 따라 적정량의 상기 성분을 취하고, 1:1:1:1의 몰비에 따라 혼합하며, 혼합 후 각 조립 유닛은 염기 상보적 페어링 원칙에 따라 자동으로 조립 완료되었다. 조립 전후의 샘플은 폴리아크릴아미드 겔 전기영동으로 조립 효과 및 샘플 순도를 동정하였다(도 16).
실시예 7: G-CSF 시험관내 활성 평가
M-NFS-60 세포(마우스 백혈병 림프구/G-CSF 의존성 세포)를 소생 배양액(RPMI1640 + 10% FBS + 15 ng/mL G-CSF + 1X페니실린-스트렙토마이신)에 접종하고, 37℃, 5% CO2 조건에서 세포 소생을 수행하며, 세포 밀도가 80%-90%에 도달한 후 계대하고, 2회 내지 3회 계대한 후, 96웰 플레이트에 접종하여 세포 플레이팅을 수행하였다. 세포 플레이팅 실험은 corning 3599# 96웰 플레이트를 사용하고, 세포 플레이팅 밀도는 6000개/웰이다. 상이한 샘플(GCSF, NAPPA4-GCSF, NAPPA4-GCSF2, NAPPA4-GCSF3)을 구배 희석하고, 작업 농도는 (0.001, 0.01, 0.1, 1, 10, 100 ng/mL)이며, 최종 부피는 100 μL이고, PBS를 대조군으로 사용하였다. 항온배양기에서 48시간 동안 배양한 후, 웰당 10 μL의 CCK8 용액을 첨가하고, 배양기에서 배양 플레이트를 1-4시간 동안 배양하며, 마이크로플레이트 리더로 450 nm에서의 흡광도를 측정하고, 상이한 샘플의 세포 증식률을 계산하였다.
세포 증식률(%)=[A(투여)-A(0투여)]/[A(0투여)-A(블랭크)]×100
A(투여): 세포, CCK 용액 및 약물 용액이 있는 웰의 흡광도
A(블랭크): 배지 및 CCK8 용액이 있지만 세포가 없는 웰의 흡광도
A(0투여): 세포, CCK8 용액이 있지만 약물 용액이 없는 웰의 흡광도
위의 활성 테스트 방법으로 G-CSF에 연결된 L-DNA 4량체 프레임워크의 활성을 평가하였고, L-DNA 4량체 프레임워크는 G-CSF의 활성에 영향을 미치지 않음을 발견하였다(도 17). 동일한 활성 테스트 방법으로 L-DNA 4량체로 조립된 2가 및 3가 G-CSF도 G-CSF의 활성에 부정적인 영향을 미치지 않음을 발견하였다(도 18).
실시예 8: SM(PEG) 2 -PMO 접합체의 커플링 및 정제
본 실시예에서, 포스포로디아미데이트 모르폴리노(phosphorodiamidate morpholino) 핵산을 사용하여 실험하였다. 구체적으로, 하기 4개의 PMO 단일 사슬 서열(5'에서 3')을 선택하였다.
사슬 1(PMO1): SEQ ID NO: 275
5'- AGCAGCCTCGTTGAATCGCCAAGACACC -3'
사슬 2(PMO2): SEQ ID NO: 276
5'- AGGTGTCTTGGCGAAAGTTGCTCCGACG -3'
사슬 3(PMO3): SEQ ID NO: 277
5'- ACGTCGGAGCAACTAAGCGGTTCTGTGG -3'
사슬 4(PMO4): SEQ ID NO: 278
5'- ACCACAGAACCGCTATCAACGAGGCTGC -3'
5' 말단에 NH2기 변형이 있고, SM(PEG)2의 NHS 활성기를 커플링하기 위해 사용된다.
인산염 완충액(50 mM NaH2PO4, 150mM NaCl, pH 7.4)으로 5' 말단 NH2 변형을 포함하는 PMO단일 사슬을 용해시켜 최종 농도가 1 mM인 모액을 조제하였다. 디메틸술폭시드(DMSO)로 SM(PEG)2(연결체 분자) 분말을 용해시키고, 250 mM의 SM(PEG)2 모액을 새로 조제하였다. PMO 단일 사슬 모액에 10~50배 몰량의 SM(PEG)2 모액을 첨가하고, 빠르게 혼합한 후 실온에서 30분~2시간 동안 반응시켰다. 반응이 완료된 후 반응액 10% 부피의 1M Tris-HCl(pH 7.0)을 첨가하고, 혼합 후 실온에서 20분 동안 배양하며, 과량의 SM(PEG)2를 정지시키고 반응을 계속하였다. 배양이 종료된 후, Hitrap Capto MMC로 SM(PEG)2-PMO를 정제하고, 미반응 SM(PEG)2는 컬럼에 결합하지 않고 직접 통과시키며, 상부 컬럼에 결합된 SM(PEG)2-PMO를 완충액(25 mM BICINE, 200mM NH4Cl, 1M Arginine monohydrochloride, pH 8.5)으로 용출하고, 용출 결과는 도 19a에 도시된 바와 같다.
양이온 모드의 액체 크로마토그래피-질량 분석기로 커플링 전후의 PMO 샘플을 분석하였다. 도 20a 및 도 20b에 도시된 바와 같이, 결과에 따르면 최종적으로 얻은 SM(PEG)2-PMO 분자량은 이론값과 일치하고 커플링 반응 효율이 높다.
실시예 9: 나노바디 돌연변이체의 제조
핵산 커플링을 위해 나노바디의 카르복실 말단에 시스테인 돌연변이를 도입하였다. 항-HSA 나노바디의 유전자 서열은 효모가 선호하는 코돈으로 최적화한 다음, pPICZ alpha A 플라스미드에 서브클로닝하였다. 항-HSA 나노바디 아미노산 서열은 SEQ ID NO: 279이다. 정제의 편의를 위해 나노바디의 N 말단에 His 태그를 추가하였다.
SEQ ID NO: 279, 항-HSA 나노바디 돌연변이체 아미노산 서열:
HHHHHHAVQLVESGGGLVQPGNSLRLSCAASGFTFRSFGMSWVRQAPGKEPEWVSSISGSGSDTLYADSVKGRFTISRDNAKTTLYLQMNSLKPEDTAVYYCTIGGSLSRSSQGTQVTVSSGSC
플라스미드를 선형화한 후 피치아 파스토리스 균주 X33에 전기형질전환시키고, Zeocin 농도 구배 YPD 아가 플레이트로 스크리닝하여 표적 유전자의 높은 사본을 가진 균주를 얻었다. 30℃, 250 rpm 조건에서 GMGY 배지로 단클론 균주를 배양하고, 충분한 균체를 얻은 후 20℃, 250 rpm 조건에서 GMGY 배지로 표적 나노바디의 분비 및 발현을 유도하며, 24시간마다 1% 메탄올을 보충하였다.
높은 사본으로 스크리닝된 균주는 실험실 등급 유리 플라스크에서 나노바디의 발현 수율이 40-80 mg/L에 달할 수 있다.
SDS-PAGE 동정 및 분석에 따르면, 유도 72시간 후 배양 상층액에 대량의 표적 나노바디 단량체 및 나노바디 2량체가 포함되어 있다. His 태그 친화성 컬럼으로 배양 상층액의 나노바디를 정제하였다.
실시예 10: 나노바디-PMO 접합체의 커플링 및 정제
환원제를 포함하는 투석 완충액(20 mM Tris, 15 mM NaCl, pH 7.4)으로 His 태그 친화성 크로마토그래피에 의해 용출된 나노바디 샘플을 투석하고(실시예 9), 투석 과정에서 C 말단의 메르캅토기가 환원되는 동시에 유리된 -SH기 등 불순물 소분자가 제거되었다. 1:1~2의 몰비에 따라 환원된 나노바디와 SM(PEG)2-PMO 단일 사슬을 혼합하고(실시예 8에서 제조), 골고루 혼합한 후 실온에서 2시간 동안 반응시켰다.
SDS-PAGE 동정을 통해 도 19b에 도시된 결과는 커플링 효율이 90% 이상에 달할 수 있음을 보여준다.
His 태그 친화성 컬럼을 이용하여 미반응 SM(PEG)2-PMO 단일 사슬을 제거하고, 나노바디 및 나노바디-PMO 혼합물을 수집하였다.
SuperdexTM 75 Increase 10/300 GL을 이용하여 나노바디와 나노바디-PMO를 분리하고, 도 21에 도시된 바와 같이, 나노바디와 나노바디-PMO는 효과적으로 분리되었다.
양이온 모드의 액체 크로마토그래피-질량 분석기로 핵산 커플링 전후의 나노바디를 분석하고, 도 20c 및 도 20d의 결과에 따르면, 최종적으로 얻은 나노바디-PMO 분자량은 이론값과 일치하다.
실시예 11: NAPPA-PMO 약물의 자가조립
이하 pmo-NAPPA4-HSA(1)을 예로 들고, NAPPA-PMO 약물의 자가조립 과정을 소개한다.
anti-HSA Nb-PMO1, PMO2, PMO3 및 PMO4의 농도를 각각 측정하였다. 적정량의 상기 성분을 취하여 37도에서 5분 동안 예열한 다음 37도 조건에서 1:1의 몰비로 혼합하고 1분 동안 배양하였다. 즉 pmo-NAPPA4-HSA(1)의 조립이 완료되었다.
pmo-NAPPA4-HSA(1,2,3)의 조립은 동일하고, 필요한 조립 모듈은 anti-HSA Nb-PMO1, anti-HSA Nb-PMO2, anti-HSA Nb-PMO3 및 PMO4이다.
저온 조건에서 SDS-PAGE로 샘플의 조립 상황을 동정하고, 도 22의 결과에 따르면 조립된 샘플의 밴드는 균일하다.
실시예 12: 나노바디-PMO 단량체 및 조립 후 NAPPA-PMO 약물의 결합 활성 검증
이하 pmo-NAPPA4-HSA(1)을 예로 들고, ELISA 방법을 이용하여 Anti-HSA 나노바디, Anti-HSA Nb-PMO1 단량체 및 조립된 pmo-NAPPA4-HSA(1)과 HSA단백질(ACROBiosystems, HSA-H5220)의 결합 능력을 검출하였다.
96웰 ELISA 플레이트의 웰당 100 ng의 HSA 단백질을 코팅하고, 4℃에서 밤새 두었다. 세척액(0.05% Tween-20을 포함하는 PBS)으로 세척하고 차단액(3% BSA 및 0.05% Tween-20을 포함하는 PBS)으로 차단한 후 구배 희석된 Anti-HSA 나노바디, PMO-커플링된 나노바디 Anti-HSA Nb-PMO1 및 조립된 pmo-NAPPA4-HSA(1)을 첨가하며, 실온에서 1시간 동안 배양하였다. 3회 세척 후 1:5000으로 희석된 양고추냉이 퍼옥시다아제-커플링된 토끼 항 낙타 VHH 항체(GenScript, A02016)를 첨가하고, 실온에서 1시간 동안 배양하였다. 3회 세척 후 테트라메틸벤지딘 기질 용액(Beyotime, P0209)을 첨가하여 발색하고, 정지액(Beyotime, P0215)을 사용하여 발색을 정지시키며, 마이크로플레이트 리더(MolecularDevices, SpectraMax i3x)를 사용하여 각 웰의 450 nm에서의 흡광도를 판독하고 상응한 EC50을 계산하였다.
도 23의 계산 결과에 따르면 Anti-HSA 나노바디, Anti-HSA Nb-PMO1 및 조립된 pmo-NAPPA4-HSA(1)과 HSA 단백질의 결합 EC50은 각각 0.577 nM, 0.391 nM 및 0.529 nM이고, 이는 나노바디에 대한 PMO의 커플링 방법이 나노바디와 상응한 항원의 결합 활성에 영향을 미치지 않고 PMO 조립 방법도 나노바디와 상응한 항원이 결합 활성에 영향을 미치지 않음을 나타낸다.
실시예 13: NAPPA-PMO 약물의 뉴클레아제 분해 저항성 실험
핵산 유도체로서 PMO가 다양한 뉴클레아제의 분해에 내성이 있는지 여부, 조립된 NAPPA-PMO 약물이 뉴클레아제 또는 해중합에도 내성이 있는지 여부를 검증하기 위해, 하기 실험을 설계하였다. 실험은 세 가지 일반적인 뉴클레아제 DNase I(Thermo Scientific, EN0523), T7 Endonuclease I(NEB, M0302S), S1 Nuclease(Thermo Scientific, EN0321)를 선택하여 PMO 조립 샘플 pmo-NAPPA4-HSA(1) 및 D-DNA 조립 샘플 DDNA-NAPPA4(대조군)에 대해 37도에서 1시간 동안 배양하였다. 배양된 pmo-NAPPA4-HSA(1) 및 DDNA-NAPPA4는 각각 SDS-PAGE 및 2% 아가로스 전기영동으로 분석하였다.
도 24에 도시된 바와 같이, pmo-NAPPA4-HSA(1)은 세 가지 뉴클레아제에 의해 분해되지 않고(왼쪽 도면), DDNA-NAPPA4는 DNase I 및 S1 Nuclease에 의해 완전히 분해되며, T7 Endonuclease I에 의해 짧은 단편으로 절단된다. 따라서, 실험은 NAPPA-PMO 약물이 일반적인 뉴클레아제의 분해에 내성이 있음을 보여준다.
본 발명에서 언급된 모든 문헌은 한 편의 문헌이 별도로 참조로서 인용되는 바와 같이 본 발명에서 참조로서 인용된다. 이 밖에, 본 발명의 상기 교시 내용을 열독한 후, 당업자는 본 발명에 대해 다양한 변동 또는 수정을 진행할 수 있고, 이러한 등가 형태는 마찬가지로 본 발명의 특허청구범위에 의해 한정되는 범위에 속함을 이해해야 한다.
Sequence Listing <110> ASSEMBLY MEDICINE, LLC. <120> CONSTRUCTION METHOD FOR AND APPLICATION OF NUCLEIC ACID MULTIMERIZATION-MEDIATED MULTIVALENT PROTEIN DRUG AND VACCINE <130> P2023-1023 <140> PCT/CN2021/133254 <141> 2021-11-25 <150> CN202011340377.3 <151> 2020-11-25 <160> 279 <170> PatentIn version 3.5 <210> 1 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-1 <400> 1 acacctggtt gttggataaa tcgttgaagg ctagga 36 <210> 2 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-1 <400> 2 atcctagcct tcaacgaaaa aactagagtc cgccga 36 <210> 3 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-1 <400> 3 atcggcggac tctagttaaa atccaacaac caggtg 36 <210> 4 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-2 <400> 4 atgcgttgag ttccagtaaa ggcaacatca ccacat 36 <210> 5 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-2 <400> 5 aatgtggtga tgttgccaaa tctgaatcct cgtgct 36 <210> 6 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-2 <400> 6 aagcacgagg attcagaaaa actggaactc aacgca 36 <210> 7 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-3 <400> 7 attccaatcg tcctgtgaaa agttccgctc tgagtt 36 <210> 8 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-3 <400> 8 aaactcagag cggaactaaa ctggcagatg gatgaa 36 <210> 9 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-3 <400> 9 attcatccat ctgccagaaa cacaggacga ttggaa 36 <210> 10 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-4 <400> 10 acgaggcaag ttctgtgaaa atgactacca ggtccg 36 <210> 11 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-4 <400> 11 acggacctgg tagtcataaa atccactgac gctgaa 36 <210> 12 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-4 <400> 12 attcagcgtc agtggataaa cacagaactt gcctcg 36 <210> 13 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-5 <400> 13 atagttcgtt gctcggaaaa ggcattgaga ggacct 36 <210> 14 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-5 <400> 14 aaggtcctct caatgccaaa atggtgatgt cgcttg 36 <210> 15 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-5 <400> 15 acaagcgaca tcaccataaa tccgagcaac gaacta 36 <210> 16 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-6 <400> 16 agtcgtgtgc ttccaagaaa tagccaggtg aggact 36 <210> 17 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-6 <400> 17 aagtcctcac ctggctaaaa aacagcggag tgtcat 36 <210> 18 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-6 <400> 18 aatgacactc cgctgttaaa cttggaagca cacgac 36 <210> 19 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-7 <400> 19 aacgcatcgc ttgatagaaa agaggagcac ggttat 36 <210> 20 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-7 <400> 20 aataaccgtg ctcctctaaa gtaggcaatc caccat 36 <210> 21 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-7 <400> 21 aatggtggat tgcctacaaa ctatcaagcg atgcgt 36 <210> 22 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-8 <400> 22 agtcgttcca ccgaacaaaa tggctctggt cattga 36 <210> 23 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-8 <400> 23 atcaatgacc agagccaaaa aatcgcacat ctcagg 36 <210> 24 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-8 <400> 24 acctgagatg tgcgattaaa tgttcggtgg aacgac 36 <210> 25 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-9 <400> 25 agcggagtga ccatagtaaa aggcaggaca ttgttc 36 <210> 26 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-9 <400> 26 agaacaatgt cctgcctaaa gtgctcgtcg tgaaga 36 <210> 27 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-9 <400> 27 atcttcacga cgagcacaaa actatggtca ctccgc 36 <210> 28 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-10 <400> 28 aattggaccg ctctactaaa atggcaccac agtcaa 36 <210> 29 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-10 <400> 29 attgactgtg gtgccataaa caggctatca gcatcc 36 <210> 30 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-10 <400> 30 aggatgctga tagcctgaaa agtagagcgg tccaat 36 <210> 31 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-11 <400> 31 accattgagc cagtgataaa aaccgttgtg agttgc 36 <210> 32 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-11 <400> 32 agcaactcac aacggttaaa tcgcacacct gtcgta 36 <210> 33 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-11 <400> 33 atacgacagg tgtgcgaaaa atcactggct caatgg 36 <210> 34 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-12 <400> 34 aagtgaagaa gcagcctaaa gttgtcatcg cacacc 36 <210> 35 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-12 <400> 35 aggtgtgcga tgacaacaaa atgtcgtaac cgtgga 36 <210> 36 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-12 <400> 36 atccacggtt acgacataaa aggctgcttc ttcact 36 <210> 37 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-13 <400> 37 aatagcgtct tgagcctaaa tggaggacat accgac 36 <210> 38 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-13 <400> 38 agtcggtatg tcctccaaaa ggtcacagtt gctgct 36 <210> 39 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-13 <400> 39 aagcagcaac tgtgaccaaa aggctcaaga cgctat 36 <210> 40 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-14 <400> 40 atgccgtgtt cagattcaaa tgtgcgtctg gattga 36 <210> 41 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-14 <400> 41 atcaatccag acgcacaaaa agacaggtgg tccgat 36 <210> 42 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-14 <400> 42 aatcggacca cctgtctaaa gaatctgaac acggca 36 <210> 43 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-15 <400> 43 attcaggaca gcgtcataaa accgactgga gcaact 36 <210> 44 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-15 <400> 44 aagttgctcc agtcggtaaa gatgccttcg tgtgag 36 <210> 45 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-15 <400> 45 actcacacga aggcatcaaa atgacgctgt cctgaa 36 <210> 46 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-16 <400> 46 agcagccaag gttatctaaa caatgacacg gaggat 36 <210> 47 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-16 <400> 47 aatcctccgt gtcattgaaa gtgattcgca ccagac 36 <210> 48 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-16 <400> 48 agtctggtgc gaatcacaaa agataacctt ggctgc 36 <210> 49 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-17 <400> 49 accaccgtgt atgacctaaa agtgacagca catcgc 36 <210> 50 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-17 <400> 50 agcgatgtgc tgtcactaaa acaggctcta cgagga 36 <210> 51 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-17 <400> 51 atcctcgtag agcctgtaaa aggtcataca cggtgg 36 <210> 52 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-18 <400> 52 aactacggag cgaagataaa tcctgaccaa cttgct 36 <210> 53 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-18 <400> 53 aagcaagttg gtcaggaaaa gactggctga acacga 36 <210> 54 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-18 <400> 54 atcgtgttca gccagtcaaa atcttcgctc cgtagt 36 <210> 55 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-19 <400> 55 agttcctgat ccagcctaaa catccttgtc ttgcca 36 <210> 56 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-19 <400> 56 atggcaagac aaggatgaaa cacgaccgct tagaag 36 <210> 57 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-19 <400> 57 acttctaagc ggtcgtgaaa aggctggatc aggaac 36 <210> 58 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 3-20 <400> 58 atatcgcact ccagcataaa ccgtgtgaac atcagg 36 <210> 59 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 3-20 <400> 59 acctgatgtt cacacggaaa agcctacgag acttgg 36 <210> 60 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 3-20 <400> 60 accaagtctc gtaggctaaa atgctggagt gcgata 36 <210> 61 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-1 <400> 61 aagcgtcgtg aatccaaatg agcctgccaa tg 32 <210> 62 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-1 <400> 62 acattggcag gctcaaaacc gaagtcaacg ct 32 <210> 63 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-1 <400> 63 aagcgttgac ttcggaaaac tatggacggc ga 32 <210> 64 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-1 <400> 64 atcgccgtcc atagtaaagg attcacgacg ct 32 <210> 65 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-2 <400> 65 aatggcgagc aatccaaatg agcctggacc aa 32 <210> 66 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-2 <400> 66 attggtccag gctcaaaacc gaacgctgtg at 32 <210> 67 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-2 <400> 67 aatcacagcg ttcggaaaac tatcgtgcgg ca 32 <210> 68 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-2 <400> 68 atgccgcacg atagtaaagg attgctcgcc at 32 <210> 69 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-3 <400> 69 atgaccacgc aatccaaatg agccaacctc ca 32 <210> 70 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-3 <400> 70 atggaggttg gctcaaaacc gaacagcagc tt 32 <210> 71 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-3 <400> 71 aaagctgctg ttcggaaaac tatctgccgc ct 32 <210> 72 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-3 <400> 72 aaggcggcag atagtaaagg attgcgtggt ca 32 <210> 73 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-4 <400> 73 atgtcgcacc aatccaaatg agcaagcctc gt 32 <210> 74 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-4 <400> 74 aacgaggctt gctcaaaacc gaacgctgtc at 32 <210> 75 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-4 <400> 75 aatgacagcg ttcggaaaac tatgtggcgg ca 32 <210> 76 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-4 <400> 76 atgccgccac atagtaaagg attggtgcga ca 32 <210> 77 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-5 <400> 77 atgctggcac aatccaaatg agcgacgagg tt 32 <210> 78 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-5 <400> 78 aaacctcgtc gctcaaaacc gaagtgccag tt 32 <210> 79 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-5 <400> 79 aaactggcac ttcggaaaac tatgaggcgg ct 32 <210> 80 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-5 <400> 80 aagccgcctc atagtaaagg attgtgccag ca 32 <210> 81 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-6 <400> 81 atgtcgcacc aatccaaatg agcaggttgg ca 32 <210> 82 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-6 <400> 82 atgccaacct gctcaaaacc gaacgctgtc aa 32 <210> 83 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-6 <400> 83 attgacagcg ttcggaaaac tatcagccgc ct 32 <210> 84 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-6 <400> 84 aaggcggctg atagtaaagg attggtgcga ca 32 <210> 85 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-7 <400> 85 atgtggtcgc aatccaaatg agcacctgcc aa 32 <210> 86 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-7 <400> 86 attggcaggt gctcaaaacc gaacgtgacg at 32 <210> 87 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-7 <400> 87 aatcgtcacg ttcggaaaac tatcaacgcc gc 32 <210> 88 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-7 <400> 88 agcggcgttg atagtaaagg attgcgacca ca 32 <210> 89 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-8 <400> 89 aagcgtcgtc aatccaaatg agcacggcaa tg 32 <210> 90 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-8 <400> 90 acattgccgt gctcaaaacc gaagtgaacg ct 32 <210> 91 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-8 <400> 91 aagcgttcac ttcggaaaac tatggctcgc ct 32 <210> 92 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-8 <400> 92 aaggcgagcc atagtaaagg attgacgacg ct 32 <210> 93 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-9 <400> 93 atgtggcgac aatccaaatg agcaagcctc ca 32 <210> 94 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-9 <400> 94 atggaggctt gctcaaaacc gaagacgctg tt 32 <210> 95 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-9 <400> 95 aaacagcgtc ttcggaaaac tatcgtgcgg ca 32 <210> 96 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-9 <400> 96 atgccgcacg atagtaaagg attgtcgcca ca 32 <210> 97 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-10 <400> 97 atgctgccac aatccaaatg agcctggaac ca 32 <210> 98 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-10 <400> 98 atggttccag gctcaaaacc gaacgcagtc at 32 <210> 99 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-10 <400> 99 aatgactgcg ttcggaaaac tatcgccgct ct 32 <210> 100 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-10 <400> 100 aagagcggcg atagtaaagg attgtggcag ca 32 <210> 101 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-11 <400> 101 atgcgtcgtc aatccaaatg agcttggcaa gg 32 <210> 102 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-11 <400> 102 accttgccaa gctcaaaacc gaacgtgctg tt 32 <210> 103 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-11 <400> 103 aaacagcacg ttcggaaaac tatggagcgg ct 32 <210> 104 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-11 <400> 104 aagccgctcc atagtaaagg attgacgacg ca 32 <210> 105 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-12 <400> 105 aactgccagc aatccaaatg agcctcgttc ca 32 <210> 106 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-12 <400> 106 atggaacgag gctcaaaacc gaagttggca gt 32 <210> 107 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-12 <400> 107 aactgccaac ttcggaaaac tatcgccgct tg 32 <210> 108 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-12 <400> 108 acaagcggcg atagtaaagg attgctggca gt 32 <210> 109 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-13 <400> 109 atgcgtcgtc aatccaaatg agcctccagg tt 32 <210> 110 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-13 <400> 110 aaacctggag gctcaaaacc gaatgacacg ct 32 <210> 111 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-13 <400> 111 aagcgtgtca ttcggaaaac tatggcggca gt 32 <210> 112 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-13 <400> 112 aactgccgcc atagtaaagg attgacgacg ca 32 <210> 113 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-14 <400> 113 aagcgtcgtg aatccaaatg agccatcgtc ca 32 <210> 114 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-14 <400> 114 atggacgatg gctcaaaacc gaatgtgctg gt 32 <210> 115 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-14 <400> 115 aaccagcaca ttcggaaaac tatgcggcaa cc 32 <210> 116 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-14 <400> 116 aggttgccgc atagtaaagg attcacgacg ct 32 <210> 117 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-15 <400> 117 attgccagga tgctgaatca cggtcggaca 30 <210> 118 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-15 <400> 118 atgtccgacc gtgatagtcg cagaaggcat 30 <210> 119 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-15 <400> 119 aatgccttct gcgacatagt acaacgccgc 30 <210> 120 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-15 <400> 120 agcggcgttg tactaacagc atcctggcaa 30 <210> 121 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-16 <400> 121 aggcgatcac aatccaaatg agcgtgttac gg 32 <210> 122 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-16 <400> 122 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 123 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-16 <400> 123 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 124 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-16 <400> 124 aagcagccgc atagtaaagg attgtgatcg cc 32 <210> 125 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-17 <400> 125 atggtccaac acgctaagcc tcaccgtctt 30 <210> 126 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-17 <400> 126 aaagacggtg aggctatcgc acaacctggt 30 <210> 127 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-17 <400> 127 aaccaggttg tgcgaatcgg agtggcagaa 30 <210> 128 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-17 <400> 128 attctgccac tccgaaagcg tgttggacca 30 <210> 129 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-18 <400> 129 aaccttggtg tgcgaaactc ctggcagcaa 30 <210> 130 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-18 <400> 130 attgctgcca ggagtaagcg tgtggttcca 30 <210> 131 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-18 <400> 131 atggaaccac acgctatgag gaccgtcgtt 30 <210> 132 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-18 <400> 132 aaacgacggt cctcaatcgc acaccaaggt 30 <210> 133 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-19 <400> 133 atgccaagtc cgagaatgct gcgaactggt 30 <210> 134 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-19 <400> 134 aaccagttcg cagcaaagag cctgaaccgt 30 <210> 135 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-19 <400> 135 aacggttcag gctctaacga cgcttgacca 30 <210> 136 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-19 <400> 136 atggtcaagc gtcgtatctc ggacttggca 30 <210> 137 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 4-20 <400> 137 aagcagcctc gttgaatcgc caagacacct 30 <210> 138 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 4-20 <400> 138 aaggtgtctt ggcgaaagtt gctccgacga 30 <210> 139 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 4-20 <400> 139 atcgtcggag caactaagcg gttctgtgga 30 <210> 140 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 4-20 <400> 140 atccacagaa ccgctatcaa cgaggctgct 30 <210> 141 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-1 <400> 141 atcaggcgac ctcttaaaac caccatcgtt gc 32 <210> 142 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-1 <400> 142 agcaacgatg gtggtaaaaa tccaaatgag cgtgttacgg 40 <210> 143 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-1 <400> 143 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 144 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-1 <400> 144 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 145 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-1 <400> 145 aagcagccgc atagtaaagg attaaaaaga ggtcgcctga 40 <210> 146 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-2 <400> 146 aggcgacgat gtcttaaaac ctggttgctg ga 32 <210> 147 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-2 <400> 147 atccagcaac caggtaaaaa tccaaatgag cgtgttacgg 40 <210> 148 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-2 <400> 148 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 149 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-2 <400> 149 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 150 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-2 <400> 150 aagcagccgc atagtaaagg attaaaaaga catcgtcgcc 40 <210> 151 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-3 <400> 151 atggaacctg gtgctaaatg ctcgcctgtc aa 32 <210> 152 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-3 <400> 152 attgacaggc gagcaaaaaa tccaaatgag cgtgttacgg 40 <210> 153 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-3 <400> 153 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 154 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-3 <400> 154 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 155 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-3 <400> 155 aagcagccgc atagtaaagg attaaaagca ccaggttcca 40 <210> 156 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-4 <400> 156 atggtcaggc gacttaaaag gacgaggttg ct 32 <210> 157 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-4 <400> 157 aagcaacctc gtcctaaaaa tccaaatgag cgtgttacgg 40 <210> 158 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-4 <400> 158 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 159 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-4 <400> 159 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 160 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-4 <400> 160 aagcagccgc atagtaaagg attaaaaagt cgcctgacca 40 <210> 161 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-5 <400> 161 atgctggacc accttaaatc agatggaggc ga 32 <210> 162 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-5 <400> 162 atcgcctcca tctgaaaaaa tccaaatgag cgtgttacgg 40 <210> 163 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-5 <400> 163 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 164 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-5 <400> 164 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 165 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-5 <400> 165 aagcagccgc atagtaaagg attaaaaagg tggtccagca 40 <210> 166 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-6 <400> 166 aaacgtccag gagctaaatc tcgtcgcctg aa 32 <210> 167 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-6 <400> 167 attcaggcga cgagaaaaaa tccaaatgag cgtgttacgg 40 <210> 168 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-6 <400> 168 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 169 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-6 <400> 169 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 170 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-6 <400> 170 aagcagccgc atagtaaagg attaaaagct cctggacgtt 40 <210> 171 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-7 <400> 171 accacgacca ttgctaaaaa cttcaggcga cg 32 <210> 172 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-7 <400> 172 acgtcgcctg aagttaaaaa tccaaatgag cgtgttacgg 40 <210> 173 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-7 <400> 173 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 174 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-7 <400> 174 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 175 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-7 <400> 175 aagcagccgc atagtaaagg attaaaagca atggtcgtgg 40 <210> 176 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-8 <400> 176 aaggcgaggt cttcaaaatg gttgctggac ga 32 <210> 177 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-8 <400> 177 atcgtccagc aaccaaaaaa tccaaatgag cgtgttacgg 40 <210> 178 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-8 <400> 178 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 179 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-8 <400> 179 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 180 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-8 <400> 180 aagcagccgc atagtaaagg attaaatgaa gacctcgcct 40 <210> 181 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-9 <400> 181 atcaaggcga ccagtaaaaa gctcctcgac ga 32 <210> 182 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-9 <400> 182 atcgtcgagg agcttaaaaa tccaaatgag cgtgttacgg 40 <210> 183 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-9 <400> 183 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 184 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-9 <400> 184 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 185 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-9 <400> 185 aagcagccgc atagtaaagg attaaaactg gtcgccttga 40 <210> 186 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-10 <400> 186 attcaggcga ctcctaaaag cacgacgatg gt 32 <210> 187 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-10 <400> 187 aaccatcgtc gtgctaaaaa tccaaatgag cgtgttacgg 40 <210> 188 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-10 <400> 188 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 189 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-10 <400> 189 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 190 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-10 <400> 190 aagcagccgc atagtaaagg attaaaagga gtcgcctgaa 40 <210> 191 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-11 <400> 191 aagcacctgc aatccaaatc gccaggacaa gt 32 <210> 192 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-11 <400> 192 aacttgtcct ggcgaaaatg agcaaccatg cc 32 <210> 193 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-11 <400> 193 aggcatggtt gctcaaaacc gaacgtcgtg at 32 <210> 194 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-11 <400> 194 aatcacgacg ttcggaaaac tatggagcgg ct 32 <210> 195 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-11 <400> 195 aagccgctcc atagtaaagg attgcaggtg ct 32 <210> 196 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-12 <400> 196 aacctgctgc aatccaaatc gccacctcaa ga 32 <210> 197 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-12 <400> 197 atcttgaggt ggcgaaaatg agcctggacg tt 32 <210> 198 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-12 <400> 198 aaacgtccag gctcaaaacc gaactggtgc tt 32 <210> 199 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-12 <400> 199 aaagcaccag ttcggaaaac tatgccgctc ct 32 <210> 200 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-12 <400> 200 aaggagcggc atagtaaagg attgcagcag gt 32 <210> 201 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-13 <400> 201 aagctggtgc aatccaaatc gcctcctgac aa 32 <210> 202 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-13 <400> 202 attgtcagga ggcgaaaatg agcaaggttg gc 32 <210> 203 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-13 <400> 203 agccaacctt gctcaaaacc gaacgcagat gt 32 <210> 204 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-13 <400> 204 aacatctgcg ttcggaaaac tatggagcgg ca 32 <210> 205 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-13 <400> 205 atgccgctcc atagtaaagg attgcaccag ct 32 <210> 206 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-14 <400> 206 atgcacgcac aatccaaatc gccatcagag gt 32 <210> 207 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-14 <400> 207 aacctctgat ggcgaaaatg agctgcctcc at 32 <210> 208 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-14 <400> 208 aatggaggca gctcaaaacc gaacgtcgtc at 32 <210> 209 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-14 <400> 209 aatgacgacg ttcggaaaac tatcgagcgg ct 32 <210> 210 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-14 <400> 210 aagccgctcg atagtaaagg attgtgcgtg ca 32 <210> 211 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-15 <400> 211 aagcgtcgtg aatccaaatc gccatcagac ca 32 <210> 212 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-15 <400> 212 atggtctgat ggcgaaaatg agcaaggctc gt 32 <210> 213 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-15 <400> 213 aacgagcctt gctcaaaacc gaaccagctt gt 32 <210> 214 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-15 <400> 214 aacaagctgg ttcggaaaac tatgcggcag gt 32 <210> 215 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-15 <400> 215 aacctgccgc atagtaaagg attcacgacg ct 32 <210> 216 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-16 <400> 216 atcagcacgc aatccaaatc gccagttcaa cc 32 <210> 217 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-16 <400> 217 aggttgaact ggcgaaaatg agcaagcagg ct 32 <210> 218 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-16 <400> 218 aagcctgctt gctcaaaacc gaacgtggtg tt 32 <210> 219 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-16 <400> 219 aaacaccacg ttcggaaaac tatggagcgg ca 32 <210> 220 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-16 <400> 220 atgccgctcc atagtaaagg attgcgtgct ga 32 <210> 221 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-17 <400> 221 aagctgcacc aatccaaatc gccagaaggt ca 32 <210> 222 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-17 <400> 222 atgaccttct ggcgaaaatg agcacgacgc at 32 <210> 223 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-17 <400> 223 aatgcgtcgt gctcaaaacc gaacaacctg ct 32 <210> 224 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-17 <400> 224 aagcaggttg ttcggaaaac tatggagcgg ca 32 <210> 225 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-17 <400> 225 atgccgctcc atagtaaagg attggtgcag ct 32 <210> 226 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-18 <400> 226 aacgctcgtc aatccaaatc gcctcaggac aa 32 <210> 227 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-18 <400> 227 attgtcctga ggcgaaaatg agccaacgac ct 32 <210> 228 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-18 <400> 228 aaggtcgttg gctcaaaacc gaagctggtg tt 32 <210> 229 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-18 <400> 229 aaacaccagc ttcggaaaac tatgccgcac ct 32 <210> 230 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-18 <400> 230 aaggtgcggc atagtaaagg attgacgagc gt 32 <210> 231 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-19 <400> 231 aagtgcgtcg aatccaaatc gccaagacct ca 32 <210> 232 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-19 <400> 232 atgaggtctt ggcgaaaatg agcaggctgg aa 32 <210> 233 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-19 <400> 233 attccagcct gctcaaaacc gaagcaacgt gt 32 <210> 234 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-19 <400> 234 aacacgttgc ttcggaaaac tatgccgctc ct 32 <210> 235 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-19 <400> 235 aaggagcggc atagtaaagg attcgacgca ct 32 <210> 236 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S1 in sequence set 5-20 <400> 236 atcacgcagc aatccaaatc gccatcacaa cg 32 <210> 237 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S2 in sequence set 5-20 <400> 237 acgttgtgat ggcgaaaatg agcacgagcc tt 32 <210> 238 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S3 in sequence set 5-20 <400> 238 aaaggctcgt gctcaaaacc gaaggttgca ct 32 <210> 239 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S4 in sequence set 5-20 <400> 239 aagtgcaacc ttcggaaaac tatgccgctc ca 32 <210> 240 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid single strand numbered S5 in sequence set 5-20 <400> 240 atggagcggc atagtaaagg attgctgcgt ga 32 <210> 241 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Trimer initial S1 sequence <400> 241 agtgatccga agtcgacaaa cgtattagcg ctcgat 36 <210> 242 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Trimer initial S2 sequence <400> 242 aatcgagcgc taatacgaaa gtgcaatgcg tcgatg 36 <210> 243 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Trimer initial S3 sequence <400> 243 acatcgacgc attgcacaaa gtcgacttcg gatcac 36 <210> 244 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Trimer optimized S1 sequence <400> 244 accaccgtgt atgacctaaa agtgacagca catcgc 36 <210> 245 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Trimer optimized S2 sequence <400> 245 agcgatgtgc tgtcactaaa acaggctcta cgagga 36 <210> 246 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Trimer optimized S3 sequence <400> 246 atcctcgtag agcctgtaaa aggtcataca cggtgg 36 <210> 247 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer initial S1 sequence <400> 247 aacctggtac aatccaaatg agctacacta gc 32 <210> 248 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer initial S2 sequence <400> 248 agctagtgta gctcaaaacc gaagtatcga tt 32 <210> 249 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer initial S3 sequence <400> 249 aaatcgatac ttcggaaaac tatagtgagt tg 32 <210> 250 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer initial S4 sequence <400> 250 acaactcact atagtaaagg attgtaccag gt 32 <210> 251 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer optimized S1 sequence <400> 251 aggcgatcac aatccaaatg agcgtgttac gg 32 <210> 252 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer optimized S2 sequence <400> 252 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 253 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer optimized S3 sequence <400> 253 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 254 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Tetramer optimized S4 sequence <400> 254 aagcagccgc atagtaaagg attgtgatcg cc 32 <210> 255 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S1 sequence for the first conversion scheme of pentamers <400> 255 atcacagagc gcgtaaaaac gccactcatg ga 32 <210> 256 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Initial S2 sequence for the first conversion scheme of pentamers <400> 256 atccatgagt ggcgtaaaaa tccaaatgag cgtgttacgg 40 <210> 257 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S3 sequence for the first conversion scheme of pentamers <400> 257 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 258 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S4 sequence for the first conversion scheme of pentamers <400> 258 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 259 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Initial S5 sequence for the first conversion scheme of pentamers <400> 259 aagcagccgc atagtaaagg attaaatacg cgctctgtga 40 <210> 260 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S1 sequence for the first conversion scheme of pentamers <400> 260 attcaggcga ctcctaaaag cacgacgatg gt 32 <210> 261 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Optimized S2 sequence for the first conversion scheme of pentamers <400> 261 aaccatcgtc gtgctaaaaa tccaaatgag cgtgttacgg 40 <210> 262 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S3 sequence for the first conversion scheme of pentamers <400> 262 accgtaacac gctcaaaacc gaagtgccaa tt 32 <210> 263 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S4 sequence for the first conversion scheme of pentamers <400> 263 aaattggcac ttcggaaaac tatgcggctg ct 32 <210> 264 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Optimized S5 sequence for the first conversion scheme of pentamers <400> 264 aagcagccgc atagtaaagg attaaaagga gtcgcctgaa 40 <210> 265 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S1 sequence for the second conversion scheme of pentamers <400> 265 atgagtgcgc aatccaaatc gccagtcatg ca 32 <210> 266 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S2 sequence for the second conversion scheme of pentamers <400> 266 atgcatgact ggcgaaaatg agcgctcgtt ga 32 <210> 267 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S3 sequence for the second conversion scheme of pentamers <400> 267 atcaacgagc gctcaaaacc gaagtgccaa ct 32 <210> 268 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S4 sequence for the second conversion scheme of pentamers <400> 268 aagttggcac ttcggaaaac tatcgcgcga ct 32 <210> 269 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Initial S5 sequence for the second conversion scheme of pentamers <400> 269 aagtcgcgcg atagtaaagg attgcgcact ca 32 <210> 270 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S1 sequence for the second conversion scheme of pentamers <400> 270 atcacgcagc aatccaaatc gccatcacaa cg 32 <210> 271 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S2 sequence for the second conversion scheme of pentamers <400> 271 acgttgtgat ggcgaaaatg agcacgagcc tt 32 <210> 272 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S3 sequence for the second conversion scheme of pentamers <400> 272 aaaggctcgt gctcaaaacc gaaggttgca ct 32 <210> 273 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S4 sequence for the second conversion scheme of pentamers <400> 273 aagtgcaacc ttcggaaaac tatgccgctc ca 32 <210> 274 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Optimized S5 sequence for the second conversion scheme of pentamers <400> 274 atggagcggc atagtaaagg attgctgcgt ga 32 <210> 275 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PMO single strand 1 nucleic acid sequence <400> 275 agcagcctcg ttgaatcgcc aagacacc 28 <210> 276 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PMO single strand 2 nucleic acid sequence <400> 276 aggtgtcttg gcgaaagttg ctccgacg 28 <210> 277 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PMO single strand 3 nucleic acid sequence <400> 277 acgtcggagc aactaagcgg ttctgtgg 28 <210> 278 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PMO single strand 4 nucleic acid sequence <400> 278 accacagaac cgctatcaac gaggctgc 28 <210> 279 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of anti-HSA nanoantibody mutant <400> 279 His His His His His His Ala Val Gln Leu Val Glu Ser Gly Gly Gly 1 5 10 15 Leu Val Gln Pro Gly Asn Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 20 25 30 Phe Thr Phe Arg Ser Phe Gly Met Ser Trp Val Arg Gln Ala Pro Gly 35 40 45 Lys Glu Pro Glu Trp Val Ser Ser Ile Ser Gly Ser Gly Ser Asp Thr 50 55 60 Leu Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 65 70 75 80 Ala Lys Thr Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 85 90 95 Thr Ala Val Tyr Tyr Cys Thr Ile Gly Gly Ser Leu Ser Arg Ser Ser 100 105 110 Gln Gly Thr Gln Val Thr Val Ser Ser Gly Ser Cys 115 120

Claims (15)

  1. 상보적 핵산 골격 기반의 다량체 복합체로서,
    상기 복합체는 상보적 핵산 골격을 갖는 n개의 단량체가 복합되어 형성된 다량체이되, 각각의 단량체는 상기 핵산 단일 사슬을 갖는 폴리펩티드이고, n은 3-6의 양의 정수이며; 상기 다량체에서, 각각의 단량체의 핵산 단일 사슬과 다른 두 개의 단량체의 핵산 단일 사슬은 염기 상보성을 통해 상보적 이중 사슬을 형성하여 상보적 핵산 골격 구조를 형성하는 것을 특징으로 하는 다량체 복합체.
  2. 제1항에 있어서,
    상기 단량체는 식 I로 표시되는 구조를 갖는 것을 특징으로 하는 다량체 복합체:
    Z1-W (I)
    상기 식에서,
    Z1은 폴리펩티드 모이어티(moiety)이며;
    W는 단일 사슬 핵산 서열(nucleic acid single strand sequence)이고;
    "-"는 링커 또는 결합이다.
  3. 제2항에 있어서,
    상기 핵산 서열 W는 식 1로 표시되는 구조를 갖는 것을 특징으로 하는 다량체 복합체:
    X1-R1-X2-R2-X3 (1)
    상기 식에서,
    R1은 염기 상보적 페어링 영역(complementary base pairing region) 1이며;
    R2는 염기 상보적 페어링 영역 2이고;
    X1, X2 및 X3은 각각 독립적으로 없거나 중복 핵산이며;
    "-"는 결합이다.
  4. 제2항에 있어서,
    X2의 서열은 A, AA, AGA 또는 AAA로 이루어진 군으로부터 선택되는 것을 특징으로 하는 다량체 복합체.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 단량체 서열은 상보적 핵산 골격 기반의 3량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 1-60으로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트인 것을 특징으로 하는 다량체 복합체.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 단량체 서열은 상보적 핵산 골격 기반의 4량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 61-140으로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트인 것을 특징으로 하는 다량체 복합체.
  7. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 단량체 서열은 상보적 핵산 골격 기반의 5량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 141-240으로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트인 것을 특징으로 하는 다량체 복합체.
  8. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 단량체 서열은 상보적 핵산 골격 기반의 4량체 복합체를 형성하는 단일 사슬 핵산 서열 SEQ ID No: 275-278로부터 선택되는 어느 하나의 서열 또는 이의 서열 세트인 것을 특징으로 하는 다량체 복합체.
  9. (a) 제1항에 따른 상보적 핵산 골격 기반의 다량체 복합체; 및
    (b) 약학적으로 허용 가능한 담체
    를 포함하는 것을 특징으로 하는 약학적 조성물.
  10. 제1항에 따른 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 핵산 서열을 포함하는 것을 특징으로 하는 핵산 서열 라이브러리.
  11. 제10항에 있어서,
    상기 핵산 서열 W는 식 1로 표시되는 구조를 갖는 것을 특징으로 하는 핵산 서열 라이브러리:
    X1-R1-X2-R2-X3 (1)
    상기 식에서,
    R1은 염기 상보적 페어링 영역 1이며;
    R2는 염기 상보적 페어링 영역 2이고;
    X1, X2 및 X3은 각각 독립적으로 없거나 중복 핵산이며;
    "-"는 결합이다.
  12. 제1항에 따른 다량체 복합체 또는 제1항에 따른 다량체 복합체를 포함하는 약학적 조성물의 제조에서의, 제10항에 따른 핵산 서열 라이브러리의 용도.
  13. 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열의 결정 방법으로서,
    하기와 같은 단계를 포함하는 방법:
    (a) 하기와 같이 어닐링 알고리즘 파라미터를 설정하는 단계:
    어닐링 초기 온도, 어닐링 종료 온도 및 어닐링 온도 감쇠 계수 를 설정하며;
    하기와 같은 최적화 제약 파라미터를 설정하고:
    ① 핵산 단일 사슬의 수 n, 바람직하게는 3-6의 양의 정수;
    ② 페어링 서열 길이 L, 바람직하게는 L 은 12-16 염기;
    ③ 페어링 영역의 해리 온도 임계값 ;
    ④ 특이적 페어링 영역의 서열 자유 에너지 임계값 ;
    ⑤ 비특이적 페어링 자유 에너지 임계값 ;
    ⑥ 연결 요소 X2, 바람직하게는 A, AA 및 AAA;
    ⑦ 이차 구조(hairpin)의 해리 온도 임계값 ;
    ⑧ 페어링 서열 중 CG 비율 P CG , 바람직하게는 P CG 의 범위 [0.4, 0.6),
    ⑨ 선택적으로, n=4일 때, 대칭 서열을 사용하고, 위의 파라미터에 따라 서열 세트 를 초기화함;
    (b) 이전 단계에 따른 세트 S의 목적 함수값 E0을 계산하고, 즉 서열 사이 및 서열 자체의 비특이적 페어링 자유 에너지 의 합을 계산함과 동시에 비특이적 페어링 자유 에너지 행렬 을 획득하며, 이의 상삼각행렬 중의 최소값에 대응되는 S iS j(1≤i≤n, 1≤j≤n)를 검색하고, S iS j의 비특이적 페어링 자유 에너지 에 따라 S i 또는 S j를 무작위로 선택하여 업데이트 조작을 수행하여, 하나의 새로운 핵산 서열을 얻으며, 나아가 업데이트된 서열 세트 S'를 얻는 단계;
    (c) 이전 단계에 따른 세트 S' 중의 서열이 단계 (a)에서 설정된 최적화 제약 파라미터 조건을 충족하는지 여부를 판단하여, 특이적 페어링 영역의 해리 온도 , 특이적 페어링 영역의 서열 자유 에너지 , 이차 구조의 해리 온도 및 CG 비율 P CG 를 포함하는 파라미터를 검증하며, 위의 파라미터가 제약 조건을 충족하면 단계 (d)를 수행하고, 그렇지 않으면 단계 (c)를 반복 수행하며, 특정 어닐링 온도에서 단계 (b)를 15회 연속 수행해도 조건을 충족하는 S'를 얻지 못하면 무한 루프를 방지하기 위해 세트 S가 세트 S'로 되어 다음 단계를 수행하는 단계;
    (d) 이전 단계에 따른 세트 S'의 목적 함수값 E1을 계산하여 E0과 E1을 비교하며, E1≥E0이면, 비특이적 페어링 자유 에너지가 최적화됨을 나타내고, 서열 세트 S'가 서열 세트 S로 되며, E1<E0이면, 비특이적 페어링 자유 에너지가 최적화되지 않음을 나타내고, 이때 Metropolis 규칙에 따라 S' 세트를 S로 받아들일지 여부를 판단해야 하는 단계; 및
    (e) 어닐링 온도를 단계 (a)에서 설정된 감쇠 계수 에 따라 감쇠시키고, 이전 단계에 따른 S에 대해 단계 (b), (c) 및 (d)를 반복 수행하며, 즉 몬테카를로의 어닐링 알고리즘을 기반으로 어닐링 온도가 어닐링 종료 온도에 도달할 때까지 이전 단계에 따른 가 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열로 되게 하는 단계.
  14. 상보적 핵산 골격 기반의 다량체 복합체를 형성하기 위한 단일 사슬 핵산 서열 세트로서,
    상기 단일 사슬 핵산 서열 세트는 제13항에 따른 방법에 의해 결정되는 것을 특징으로 하는 단일 사슬 핵산 서열 세트.
  15. 제14항에 있어서,
    상기 세트는 하기 군으로부터 선택되는 것을 특징으로 하는 단일 사슬 핵산 서열 세트:
    (S1) 상보적 핵산 골격 기반의 3량체 복합체를 형성하기 위한 단일 사슬 핵산 서열:


    (S2) 상보적 핵산 골격 기반의 4량체 복합체를 형성하기 위한 단일 사슬 핵산 서열:



    (S3) 상보적 핵산 골격 기반의 5량체 복합체를 형성하기 위한 단일 사슬 핵산 서열:


    .
KR1020237021280A 2020-11-25 2021-11-25 핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도 KR20230123972A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011340377.3A CN114539422B (zh) 2020-11-25 2020-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用
CN202011340377.3 2020-11-25
PCT/CN2021/133254 WO2022111598A1 (zh) 2020-11-25 2021-11-25 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

Publications (1)

Publication Number Publication Date
KR20230123972A true KR20230123972A (ko) 2023-08-24

Family

ID=81659911

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237021280A KR20230123972A (ko) 2020-11-25 2021-11-25 핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도

Country Status (8)

Country Link
US (1) US20240294674A1 (ko)
EP (1) EP4253609A1 (ko)
JP (1) JP2023551827A (ko)
KR (1) KR20230123972A (ko)
CN (2) CN114539422B (ko)
AU (1) AU2021390000A1 (ko)
CA (1) CA3200188A1 (ko)
WO (1) WO2022111598A1 (ko)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5124246A (en) * 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
CA2165163A1 (en) * 1993-06-17 1995-01-05 Michael J. Lane Thermodynamics, design, and use of nucleic acid sequences
US7569341B2 (en) * 1994-01-31 2009-08-04 Trustees Of Boston University Nucleic acid directed immobilization arrays and methods of assembly
US5561043A (en) * 1994-01-31 1996-10-01 Trustees Of Boston University Self-assembling multimeric nucleic acid constructs
US6927027B2 (en) * 1999-12-21 2005-08-09 Ingeneus Corporation Nucleic acid multiplex formation
EP1419274A4 (en) * 2001-07-31 2006-02-08 Phylos Inc MODULAR CONSTRUCTION OF NUCLEIC ACID PROTEIN FUSION MULTIMERS
US20110171639A1 (en) * 2007-10-31 2011-07-14 Eisai R&D Management Co., Ltd. Polymer for detection of target substance, and method for detection of target substance
CN101866388B (zh) * 2009-04-16 2012-07-04 北京大学 一种dna计算编码系统及其方法
CN108866635B (zh) * 2017-05-09 2021-11-26 安升(上海)医药科技有限公司 多特异性蛋白药物及其文库、以及制备方法和应用
CN112746331A (zh) * 2019-10-29 2021-05-04 安升(上海)医药科技有限公司 半衰期延长的药物及其文库、以及制备方法和应用

Also Published As

Publication number Publication date
AU2021390000A1 (en) 2023-06-29
JP2023551827A (ja) 2023-12-13
EP4253609A1 (en) 2023-10-04
CN114539422A (zh) 2022-05-27
WO2022111598A1 (zh) 2022-06-02
CN116600823A (zh) 2023-08-15
CN114539422B (zh) 2024-03-29
AU2021390000A9 (en) 2023-08-17
CA3200188A1 (en) 2022-06-02
US20240294674A1 (en) 2024-09-05

Similar Documents

Publication Publication Date Title
Rodrigues et al. Functionalizing ferritin nanoparticles for vaccine development
US9775912B2 (en) Designed repeat proteins binding to serum albumin
US7838629B2 (en) Ubiquitin or gamma-crystalline conjugates for use in therapy, diagnosis and chromatography
ES2379189T3 (es) Método de presentación de ribosomas o presentación en mRNA con selección en cuanto a una estabilidad aumentada de la proteína
CA2730742C (en) Hiv vaccine based on targeting maximized gag and nef to dendritic cells
CN101652386B (zh) Ob-fold作为支架用于工程化新的特异性结合物
TWI508736B (zh) 結合至il-23之以纖維連接蛋白為主之架構域蛋白質
US9441017B2 (en) Water-soluble polypeptides comprised of repeat modules, method for preparing the same and method for a target-specific polypeptide and analysis of biological activity thereof
JP2021019595A (ja) 非天然コンセンサスアルブミン結合ドメイン
JP2018520675A (ja) ジユビキチン変異タンパク質をベースとした新規結合タンパク質及びその生成方法
CA2837804C (en) Dimeric binding proteins based on modified ubiquitins
AU2004284090A1 (en) LDL receptor class A and EGF domain monomers and multimers
CN103002923A (zh) 稳定化的纤连蛋白结构域组合物、方法和使用
KR102237130B1 (ko) 향상된 특성을 갖는 변형된 코일드 코일 유형 단백질
CN105246503A (zh) Pcsk9的新颖结合蛋白
JP2019526526A (ja) ペプチドリンカーを含む化学的部分の部位特異的カップリングのための標的化合物
Kim et al. Tribody: robust self-assembled trimeric targeting ligands with high stability and significantly improved target-binding strength
US11517616B2 (en) Composite polypeptide monomer, aggregate of said composite polypeptide monomer having cell penetration function, and norovirus component vaccine for subcutaneous, intradermal, percutaneous, or intramuscular administration and having said aggregate as effective component thereof
KR20230123972A (ko) 핵산 다량체화-매개된 다가 단백질 약물 및 백신의 제조 방법 및 용도
JP2023507884A (ja) 半減期が延長した薬物およびそのライブラリー、ならびに製造方法と使用
KR20230116720A (ko) 뉴클레아제 내성을 갖는 구조 전환성 압타머-펩타이드 복합체 및 이의 제조방법
KR20230044256A (ko) Il-5의 결합 분자 및 그 제조 방법과 응용
Gell et al. A comparative study of synthetic and semisynthetic approaches for ligating the epidermal growth factor to a bivalent scaffold
US20230041904A1 (en) Method for enhancing water solubility of target protein by whep domain fusion
EP4190358A1 (en) Polypeptide as carrier for intestinal barrier crossing

Legal Events

Date Code Title Description
A201 Request for examination