KR20210005932A - 양이온성 폴리머 및 생분자 전달을 위한 이용 - Google Patents

양이온성 폴리머 및 생분자 전달을 위한 이용 Download PDF

Info

Publication number
KR20210005932A
KR20210005932A KR1020207034232A KR20207034232A KR20210005932A KR 20210005932 A KR20210005932 A KR 20210005932A KR 1020207034232 A KR1020207034232 A KR 1020207034232A KR 20207034232 A KR20207034232 A KR 20207034232A KR 20210005932 A KR20210005932 A KR 20210005932A
Authority
KR
South Korea
Prior art keywords
group
lys
leu
polymer
formula
Prior art date
Application number
KR1020207034232A
Other languages
English (en)
Inventor
이근우
산타누 마이티
Original Assignee
진에딧 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 진에딧 인코포레이티드 filed Critical 진에딧 인코포레이티드
Publication of KR20210005932A publication Critical patent/KR20210005932A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08GMACROMOLECULAR COMPOUNDS OBTAINED OTHERWISE THAN BY REACTIONS ONLY INVOLVING UNSATURATED CARBON-TO-CARBON BONDS
    • C08G69/00Macromolecular compounds obtained by reactions forming a carboxylic amide link in the main chain of the macromolecule
    • C08G69/02Polyamides derived from amino-carboxylic acids or from polyamines and polycarboxylic acids
    • C08G69/08Polyamides derived from amino-carboxylic acids or from polyamines and polycarboxylic acids derived from amino-carboxylic acids
    • C08G69/10Alpha-amino-carboxylic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/08Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing oxygen, e.g. ethers, acetals, ketones, quinones, aldehydes, peroxides
    • A61K47/10Alcohols; Phenols; Salts thereof, e.g. glycerol; Polyethylene glycols [PEG]; Poloxamers; PEG/POE alkyl ethers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/549Sugars, nucleosides, nucleotides or nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/55Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound the modifying agent being also a pharmacologically or therapeutically active agent, i.e. the entire conjugate being a codrug, i.e. a dimer, oligomer or polymer of pharmacologically or therapeutically active compounds
    • A61K47/551Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound the modifying agent being also a pharmacologically or therapeutically active agent, i.e. the entire conjugate being a codrug, i.e. a dimer, oligomer or polymer of pharmacologically or therapeutically active compounds one of the codrug's components being a vitamin, e.g. niacinamide, vitamin B3, cobalamin, vitamin B12, folate, vitamin A or retinoic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • A61K47/645Polycationic or polyanionic oligopeptides, polypeptides or polyamino acids, e.g. polylysine, polyarginine, polyglutamic acid or peptide TAT
    • A61K47/6455Polycationic oligopeptides, polypeptides or polyamino acids, e.g. for complexing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/69Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit
    • A61K47/6921Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere
    • A61K47/6927Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores
    • A61K47/6929Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores the form being a nanoparticle, e.g. an immuno-nanoparticle
    • A61K47/6931Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores the form being a nanoparticle, e.g. an immuno-nanoparticle the material constituting the nanoparticle being a polymer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/14Particulate form, e.g. powders, Processes for size reducing of pure drugs or the resulting products, Pure drug nanoparticles
    • A61K9/19Particulate form, e.g. powders, Processes for size reducing of pure drugs or the resulting products, Pure drug nanoparticles lyophilised, i.e. freeze-dried, solutions or dispersions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/513Organic macromolecular compounds; Dendrimers
    • A61K9/5138Organic macromolecular compounds; Dendrimers obtained by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyvinyl pyrrolidone, poly(meth)acrylates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/513Organic macromolecular compounds; Dendrimers
    • A61K9/5146Organic macromolecular compounds; Dendrimers obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyethylene glycol, polyamines, polyanhydrides
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08GMACROMOLECULAR COMPOUNDS OBTAINED OTHERWISE THAN BY REACTIONS ONLY INVOLVING UNSATURATED CARBON-TO-CARBON BONDS
    • C08G69/00Macromolecular compounds obtained by reactions forming a carboxylic amide link in the main chain of the macromolecule
    • C08G69/02Polyamides derived from amino-carboxylic acids or from polyamines and polycarboxylic acids
    • C08G69/04Preparatory processes
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08GMACROMOLECULAR COMPOUNDS OBTAINED OTHERWISE THAN BY REACTIONS ONLY INVOLVING UNSATURATED CARBON-TO-CARBON BONDS
    • C08G69/00Macromolecular compounds obtained by reactions forming a carboxylic amide link in the main chain of the macromolecule
    • C08G69/40Polyamides containing oxygen in the form of ether groups
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08GMACROMOLECULAR COMPOUNDS OBTAINED OTHERWISE THAN BY REACTIONS ONLY INVOLVING UNSATURATED CARBON-TO-CARBON BONDS
    • C08G69/00Macromolecular compounds obtained by reactions forming a carboxylic amide link in the main chain of the macromolecule
    • C08G69/48Polymers modified by chemical after-treatment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Organic Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Polymers & Plastics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Nanotechnology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Chemical & Material Sciences (AREA)
  • Optics & Photonics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Dermatology (AREA)
  • Immunology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Medicinal Preparation (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)

Abstract

화학식 1의 구조를 포함하는 폴리머:
[화학식 1]
Figure pct00098

및 상기 폴리머를 제조하는 방법이 제공된다. 또한 폴리머 및 핵산 및/또는 폴리펩티드를 포함하는 조성물, 및 핵산 및/또는 폴리펩티드를 세포에 전달하는 방법이 제공된다.

Description

양이온성 폴리머 및 생분자 전달을 위한 이용
관련 출원에 대한 상호 참조
본 출원은 2018년 4월 27일에 출원된 미국 가특허출원 제62/663,985호 및 2018 년 10 월 24 일에 출원된 미국 가특허출원 제 62/750,097호에 대한 우선권을 주장하며 이들의 전체 개시 내용이 본 명세서에 참조로 통합된다.
전자적으로 제출된 자료를 참조하여 포함
여기에 전체가 참조로서 포함된 것은 컴퓨터 판독 가능한 뉴클레오티드/아미노산 서열 목록으로서 본 명세서와 동시에 제출되고 다음과 같이 확인되는 것이다: 2019년 4월 29일에 생성된 "512879.TXT"로 명명된 62527 바이트 ASCII (텍스트) 파일 1 개.
펩티드, 단백질 및 핵산 기반 기술은 질병을 예방, 치료 및 처치하기 위해 수많은 응용 분야를 가지고 있다. 그러나, 큰 분자 (예를 들어, 폴리펩티드 및 핵산)를 그 표적 조직으로 안전하고 효과적으로 전달하는 것은 문제로 남아있다.
따라서, 치료 분자 전달에 유용한 새로운 조성물 및 방법에 대한 요구가 계속되고 있다.
본 명세서에서는 화학식 1의 구조를 포함하는 폴리머가 제공된다.
[화학식 1]
Figure pct00001
여기서:
m1 및 n1은 각각 0 내지 1000의 정수이고;
m2 및 n2는 각각 0 내지 1000의 정수인데, 다만 m2 + n2의 합이 5보다 크고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
A1 및 A2는 각각 독립적으로 다음 화학식의 기
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
B1과 B2는 각각 독립적으로
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R4-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R4-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R4-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-CH2-CHOH-R5;
-(CH2)p2-N[-(CH2)q2-NR2-CH2-CHOH-R5;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2-CH2-CHOH-R5;
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-CH2-CHOH-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R5]2}2;
-(CH2)p1-[N{(CH2)s1-R4-R5}-(CH2)q1-]r1NR2 2; 또는
-(CH2)p1-[N{(CH2)s1-R5}-(CH2)q1-]r1NR2 2이고,
여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이며; R5의 각 경우는 독립적으로 치환 또는 비치환된 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합이 선택적으로 1 내지 8 (예를 들어, 2 내지 8)개의 2 차 또는 3 차 아민을 포함하거나 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함한다.
화학식 2 폴리머도 또한 제공된다:
[화학식 2]
Figure pct00002
여기서:
m1과 n1은 각각 0 내지 1000의 정수인데, 다만 m1과 n1의 합이 10내지 2000이고;
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 절단 가능한 링커이고;
R1은 수소, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 아민과 같은, 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
R8은 조직-특이적 또는 세포-특이적 표적화 모이어티고; 및
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
본 개시 내용은 또한 화학식 1의 구조 및/또는 화학식 2의 폴리머, 및 핵산 및/또는 폴리펩티드를 포함하는 조성물을 제공한다. 추가적으로, 화학식 1의 구조 또는 화학식 2의 폴리머를 포함하는, 폴리머를 제조하는 방법, 뿐만 아니라 그 폴리머, 및 그것을 포함하는 조성물을 사용하여, 예를 들어 핵산 또는 단백질을 세포에 전달하는 방법이 제공된다.
도 1은 Streptococcus pyogene (서열 번호 1)에서 유래한 Cas9의 아미노산 서열을 제공한다.
도 2는 Francisella tularensis sub. Novicida U112 (서열 번호 2)에서 유래한 Cpf1의 아미노산 서열을 제공한다.
도 3은 폴리머/Cas9 조성물의 상이한 투여량으로 GFP-HEK 세포 내에서 녹색 형광 단백질 ("GFP") 음성 %에 의해 측정된 Cas9 RNP 전달 수준의 그래프이다.
도 4는 ai9 리포터 대립 유전자의 개략도이다.
도 5는 상이한 농도의 폴리머/Cre 조성물에서 RFP + 발현의 양에 의해 측정된 일차 근육모세포로의 Cre 재조합효소의 전달 수준을 보여준다.
도 6은 적색 형광 단백질에 의해 시각화된 마우스 근육에서 Cre 재조합효소 전달의 수준을 예시한다 (밝은 색 부분은 형광을 나타낸다).
도 7은 Cas9 전달에 의해 나타난 인간 신경 줄기 세포의 인델 돌연변이율을 보여준다.
도 8은 HEK 293T에서의 신호등 리포터(traffic light reporter)의 개략도이다.
도 9는 상이한 농도의 폴리머/Cre 조성물에서 RFP + 발현량에 의해 측정된 TLR-HEK 293T 로의 Cre 재조합효소 전달의 수준을 보여준다.
도 10은 폴리머/Cas9 조성물의 상이한 투여량으로 GFP-HEK 세포에서의 녹색 형광 단백질 ("GFP") %에 의해 측정된 Cas9 RNP 전달 수준의 그래프이다.
도 11은 GFP %로 측정된 HEK 293T 세포로의 eGFP mRNA 전달의 수준을 도시한다.
도 12는 GFP %로 측정된 HEK 293T 세포로의 eGFP mRNA 전달 수준의 인큐베이션 시간 의존성을 보여준다.
도 13은 1.5kDa PEG-PAsp (DET) 폴리머의 유무 둘 다에서 RFP + 발현에 의해 측정된 HEK 293T 세포로의 적색 형광 단백질 ("RFP") mRNA 전달의 수준을 도시한다.
도 14는 1.5 kDa PEG-PAsp (DET) 폴리머의 유무 둘 다에서 RFP + 발현에 의해 측정된 HEK 293T 세포에 대한 적색 형광 단백질 ("RFP") mRNA의 수준을 도시한다.
도 15는 완충액 중의 폴리머/Cas9 나노입자에 대해 GFP-HEK 세포에서의 녹색 형광 단백질 ("GFP") %에 의해 측정된 Cas9 RNP 전달 수준의 그래프이다.
도 16은 AsCpf1의 서열 (서열 번호 19)을 제공한다.
도 17은 LbCpf1의 서열 (서열 번호 20)을 제공한다.
본 발명은 화학식 1의 구조를 포함하는 폴리머를 제공한다:
[화학식 1]
Figure pct00003
여기서:
m1 및 n1은 각각 0 내지 1000의 정수이고;
m2 및 n2는 각각 0 내지 1000의 정수인데, 다만 m2 + n2의 합이 5보다 크고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
A1 및 A2는 각각 독립적으로 다음 화학식의 기
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
B1과 B2는 각각 독립적으로
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R4-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R4-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R4-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-CH2-CHOH-R5;
-(CH2)p2-N[-(CH2)q2-NR2-CH2-CHOH-R5;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2-CH2-CHOH-R5;
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-CH2-CHOH-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R5]2}2;
-(CH2)p1-[N{(CH2)s1-R4-R5}-(CH2)q1-]r1NR2 2; 또는
-(CH2)p1-[N{(CH2)s1-R5}-(CH2)q1-]r1NR2 2이고,
여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이며;
R5의 각 경우는 독립적으로 치환 또는 비치환된 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합이 선택적으로 1 내지 8 또는 2 내지 8개의 2 차 또는 3 차 아민을 포함하거나 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함한다.
본 명세서에 사용된, "알킬"은 치환 또는 비치환된 탄화수소 사슬을 의미한다. 알킬기는 임의의 수의 탄소 원자(예를 들어, C1-C100 알킬, C1-C50 알킬, C1-C12 알킬, C1-C8 알킬, C1-C6 알킬, C1-C4 알킬, C1-C2 알킬 등)를 가질 수 있다. 탄화수소 사슬은 포화될 수 있거나, 일부 구체예에서 임의의 정도로 불포화될 수 있고 (예를 들어, 알케닐 또는 알키닐기를 제공함), 선형, 분지형, 직쇄형, 고리형 (예를 들어, 시클로알킬 또는 시클로알케닐) 또는 이들의 조합일 수 있다. 고리형 기는 모노시클릭이거나 융합되어 결합으로 연결된 비시클릭(bicyclic) 또는 트리시클릭기를 형성하거나, 스피로시클릭일 수 있다. 고리형 기는 3 개 이상의 탄소 (예를 들어, C3-C12, C3-C10, C3-C8, C3-C6, 또는 C5-C6)를 포함한다. 일부 구체예에서, 탄화수소 사슬은 하나 이상의 헤테로원자 (예를 들어, 1, 2, 3, 4 또는 5 개 이상의 산소, 질소 및/또는 황 원자)에 의해 중단되어 헤테로알킬, 헤테로알케닐, 헤테로알키 닐, 또는 헤테로시클릴 (즉, 헤테로시클릭기)을 제공할 수 있다. 일부 구체예에서, 알킬, 알케닐, 알키닐은 하나 이상의 치환기로 치환된다.
용어 "헤테로시클릴" 또는 "헤테로시클릭기"는 시클릭기, 예를 들어 방향족 (예를 들어, 헤테로아릴) 또는 비방향족(non-aromatic)을 의미하며, 여기서 그 시클릭기는 하나 이상의 헤테로원자 (예를 들어, 1, 2, 3, 4, 또는 5 개 이상의 산소, 질소 및/또는 황 원자)를 갖는 것이다. 일부 구체예에서, 헤테로시클릴 또는 헤테로시클릭기 (즉, 시클릭기, 예를 들어, 방향족 (예를 들어, 헤테로아릴) 또는 시클릭기가 하나 이상의 헤테로원자를 갖는 비방향족)는 하나 이상의 치환기로 치환된다.
용어 "아릴"은 임의의 적절한 수의 고리 원자 및 임의의 적절한 수의 고리를 갖는 방향족 고리계를 지칭한다. 아릴기는 임의의 적합한 수의 고리 원자, 예컨대 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16 개의 고리 원자, 뿐만 아니라 6 내지 10, 6 내지 12, 6 내지 14고리 구성원을 포함할 수 있다. 아릴기는 모노시클릭이거나 융합되어 바이시클릭 또는 트리시클릭기를 형성하고, 또는 결합에 의해 연결되어 비아릴기(biaryl group)를 형성할 수 있다. 대표적인 아릴기에는 페닐, 나프틸 및 비페닐이 포함된다. 일부 구체예에서, 아릴기는 아릴알킬기 (예를 들어, 벤질기)를 형성하기 위해 알킬렌 연결기를 포함한다. 일부 아릴기는 페닐, 나프틸 또는 비 페닐과 같은 6 내지 12 개의 고리 구성원을 갖는다. 다른 아릴기는 페닐 또는 나프틸과 같은 6 내지 10 개의 고리 구성원을 갖는다. 일부 구체예에서, 아릴 치환기는 하나 이상의 헤테로원자 (예를 들어, 1, 2, 3, 4, 또는 5 개 이상의 산소, 질소 및/또는 황 원자)를 포함하고 이에 의해 헤테로아릴기임을 입증한다. 일부 구체예에서, 아릴은 하나 이상의 치환기로 치환된다.
전술한 기들 중 임의의 기는 1가, 2가, 또는 다가 (예를 들어, 알킬렌, 알케 닐렌, 알키닐렌, 아릴렌, 헤테로알킬렌, 헤테로알케닐렌, 헤테로알키닐렌, 헤테로시클릴렌, 헤테로아릴렌 등) 일 수 있음이 이해된다.
본 명세서에 사용된 용어 "치환된"은 지정된 원자의 정상 원자가가 초과되지 않는 한 지정된 원자 또는 기 (예를 들어, 치환된 알킬기)상의 하나 이상의 수소가 다른 기로 대체됨을 의미할 수 있다. 예를 들어, 치환기가 옥소 (즉, = O) 인 경우, 원자에 있는 두 개의 수소가 대체된다. 치환기는 하나 이상의 알데히드, 에스테르, 아미드, 케톤, 니트로, 시아노, 플루오로알킬 (예를 들어, 트리플루오로메탄), 할로 (예를 들어, 플루오로), 아릴 (예를 들어, 페닐), 헤테로시클릴 또는 헤테로시클릭기 (즉, 시클릭기, 예를 들어 방향족 (예를 들어, 헤테로아릴) 또는 시클릭기가 하나 이상의 헤테로원자를 갖는 비-방향족), 옥소, 또는 이들의 조합을 포함할 수 있다. 치환체 및/또는 변수의 조합은 치환이 화합물의 합성 또는 사용에 크게 악영향을 미치지 않는 한 허용된다.
화학식 1에 따르면, m1 및 n1은 각각 0-500, 0-200, 0-100, 또는 0-50과 같이 0 내지 1000의 정수이다. 또한 m2 및 n2는 각각 0-500, 또는 0-100과 같은 0-1000의 정수인데, 다만 m2 + n2의 합이 5보다 크다(예를 들어, 5-2000, 5-1000, 5-500, 5-200, 5-100, 또는 5-50). 다시 말해서, 폴리머는 B1 및/또는 B2기를 포함하는 일부 모노머 단위를 적어도 포함하며, 여기서 총칭하여 "B 모노머"라고 한다. 일부 구체예에서, m1 및 n1은 0이고, 따라서 폴리머는 A1 또는 A2기를 포함하지 않는다. 다른 구체예에서, 폴리머는 일부 A1 및/또는 A2 기 및 일부 B1 및/또는 B2기를 포함한다. 이러한 구체예에서, (m1 + n1)/(m2 + n2)의 비는 약 20 이하 (예를 들어, 약 10 이하, 약 5 이하, 약 2 이하, 또는 심지어 약 1 이하)이다. 또한, 일부 구체예에서, (m1 + n1)/(m2 + n2)의 비는 약 0.2 이상, 예컨대 약 0.5 이상이다.
폴리머는 임의의 적합한 구조 유형으로 존재할 수 있다. 예를 들어, 폴리머는 교대 폴리머, 랜덤 폴리머, 블록 폴리머, 그래프트 폴리머, 선형 폴리머, 분지형 폴리머, 환형(cyclic) 폴리머, 또는 이들의 조합으로 존재할 수 있다. 특정 구체예에서, 폴리머는 랜덤 폴리머, 블록 폴리머, 그래프트 폴리머, 또는 이들의 조합이다.
따라서, 화학식 1의 구조에서, 모노머 (각각의 측쇄 A1, A2, B1 및 B2로 지칭될 수 있음)는 무작위 또는 임의의 순서로 배열될 수 있다. 정수 m1, n1, m2, 및 n2는 단지 그 사슬에 전체적으로 나타나는 각각의 모노머의 수를 나타내며, 주어진 모노머의 블록 또는 스트레치가 일부 구체예에서 존재할 수 있지만 반드시 이들 모노머의 블록을 나타내는 것은 아니다. 예를 들어, 화학식 1의 구조는 -A1-A2-B1-B2-, -A2-A1-B2-B1-, -A1-B1-A2-B2- 등의 순서로 모노머를 포함할 수 있다. 일부 구체예에서 , 폴리머는 "1" 및 "2" 모노머가 번갈아 오도록(예를 들어, -A1-A2-B1-B2-, -A2-A1-B2-B1-, -A1-B2-B1-A2-, -A2-B1-B2-A1-, -B1-A2-B1-A2-, 등) 알파/베타 배열로 배열된 폴리펩티드(예를 들어, 폴리아스파르타미드) 주골격을 갖는다. 그러나, "A" 및 "B" 모노머 또는 측쇄 (예를 들어, A1/A2 및 B1/B2)는 폴리머 주골격 전체에 무작위로 분산될 수 있거나, 또는 블록으로 배열되거나 이들의 일부 조합으로 배열될 수 있다.
추가적인 설명을 위해 폴리머는 화학식 1.1로 대신 설명할 수 있다.
[화학식 1.1]
Figure pct00004
또는, 주골격이 화학식 1.2와 같이 알파, 베타 구조인 경우:
[화학식 1.2]
Figure pct00005
여기서
m1 및 n1은 이전에 설명한 것과 같다.
m3은 5-2000의 정수(예를 들어, 5-1000, 5-500, 5-100, 25-2000, 25-500, 25-100, 50-2000, 50-1000, 50-500, 또는 50-100)이고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
각 A3는 독립적으로 다음 화학식의 기이다.
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R4-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R4-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R4-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-CH2-CHOH-R5;
-(CH2)p2-N[-(CH2)q2-NR2-CH2-CHOH-R5;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2-CH2-CHOH-R5;
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-CH2-CHOH-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R5]2}2;
-(CH2)p1-[N{(CH2)s1-R4-R5}-(CH2)q1-]r1NR2 2; 또는
-(CH2)p1-[N{(CH2)s1-R5}-(CH2)q1-]r1NR2 2
여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고;
R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이고; 및
R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 선택적으로 1 내지 8 개 또는 2 내지 8 개의 2 차 또는 3 차 아민을 포함하는 것 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이고;
다만 A3기의 약 5 % 이상 (예를 들어, 약 10 % 이상, 약 25 % 이상, 약 30 % 이상, 약 35 % 이상, 약 40 % 이상, 약 45 % 이상, 약 50 % 이상 %, 약 55 % 이상, 약 60 % 이상, 약 65 % 이상, 약 70 % 이상, 약 75 % 이상, 약 80 % 이상, 약 85 % 이상, 약 90 % 이상, 약 95 % 이상, 또는 심지어 100 %)은
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R4-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R4-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R4-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-CH2-CHOH-R5;
-(CH2)p2-N[-(CH2)q2-NR2-CH2-CHOH-R5;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2-CH2-CHOH-R5;
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-CH2-CHOH-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R5]2}2;
-(CH2)p1-[N{(CH2)s1-R4-R5}-(CH2)q1-]r1NR2 2; 또는
-(CH2)p1-[N{(CH2)s1-R5}-(CH2)q1-]r1NR2 2
으로부터 선택된다.
또 다른 구체예에서, 폴리머는 다음으로부터 선택되는 A3 기를 일부 또는 심지어 대부분 (약 5 % 이상, 약 10 % 이상, 약 25 % 이상, 약 30 % 이상, 약 35 % 이상, 약 40 %, 약 45 % 이상, 약 50 % 이상, 약 55 % 이상, 약 60 % 이상, 약 65 % 이상, 약 70 % 이상, 약 75 % 이상, 약 80 % 이상 , 약 85 % 이상, 약 90 % 이상, 또는 약 95 % 이상) 갖는다:
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
전술한 폴리머 구조 중 임의의 것에서, R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이다. 일부 구체예에서, R3a는 에틸렌기이고 R3b는 메틸렌기이고; 또는 R3a는 메틸렌기이고 R3b는 에틸렌기이다. 특정 구체예에서, R3a 및 R3b는 각각 에틸렌기이다. 바람직한 구체예에서, R3a 및 R3b는 각각 메틸렌기이다.
그룹 A1 및 A2는 독립적으로 선택되므로 서로 같거나 다를 수 있다. 유사하게, B1 및 B2기는 독립적으로 선택되며 서로 같거나 다를 수 있다. 또한 A3의 각 경우는 다른 A3기와 같거나 다를 수 있다.
A1, A2, A3, B1 및 B2기에서 정수 p1 내지 p4 (즉, p1, p2, p3, 및 p4), q1 내지 q6 (즉, q1, q2, q3, q4, q5, 및 q6), r1 및 r2는 각각 독립적으로 1 내지 5의 정수 (예를 들어, 1, 2, 3, 4, 또는 5)이다. 일부 구체예에서, p1 내지 p4 (즉, p1, p2, p3, 및 p4), q1 내지 q6 (즉, q1, q2, q3, q4, q5, 및 q6), 및/또는 r1 및 r2는 각각 독립적으로 1내지 3의 정수 (예를 들어, 1, 2 또는 3)이다. 특정 구체예에서, p1 내지 p4 (즉, p1, p2, p3, 및 p4) 및/또는 q1 내지 q6 (즉, q1, q2, q3, q4, q5, 및 q6)은 각각 2이다. 일부 구체예에서, p1 내지 p4 (즉, p1, p2, p3, 및 p4) 및/또는 q1 내지 q6 (즉, q1, q2, q3, q4, q5, 및 q6)은 각각 2이고, r1 및 r2는 각각 1이다. 일부 구체예에서, s1-s4는 각각 독립적으로 1, 2, 3, 4, 또는 5의 정수, 예컨대 1, 2, 또는 3, 또는 1-2이다.
폴리머 구조에서 R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이다. 일부 구체예에서, R4의 각 경우는 독립적으로 -C(O)O- 또는 -C(O)NH-이다. 특정 구체예에서, R4의 각 경우는 -C(O)O-이다. 특정 구체예에서, R4의 각 경우는 -C(O)NH-이다.
화학식 1의 일부 구체예에서, A1 및 A2 각각은 화학식 -(CH2)p1-[NH-(CH2)q1-]r1NH2의 기, 예를 들어 -(CH2)2-NH-(CH2)2-NH2 기이다. 추가로, 또는 대안적으로, B1 및 B2 각각은 화학식 -(CH2)p1-[NH-(CH2)q1-]r1NH-(CH2) 2-R4-R5, 예를 들어 -(CH2)2-NH-(CH2)2-NH-(CH2)2-R4-R5 기, 또는 -(CH2)2-NH-(CH2)2-NH-(CH2)2-C(O)-O-R5기이다. 일부 구체예에서, B1 및 B2 각각은 화학식 ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-(CH2)s1-R5 또는 ―(CH2)2―NR2―(CH2)2―NR2-(CH2)2-R5 의 기이고, 여기서 선택적으로 각각의 R2는 독립적으로 C1-C3 알킬 (예, 메틸)이고, 선택적으로 R5는 C1-C3 알킬아미노 또는 C1-C3 디알킬아미노 (예를 들어, R5는- CH2-NH-CH3 또는 -CH2-N-(CH3)2)이다.
화학식 1.1의 일부 구체예에서, A3은 화학식 -(CH2)p1-[NH-(CH2)q1-]r1NH2의 기, 예를 들어 -(CH2)2-NH-(CH2)2-NH2 기이고; 또는 화학식 -(CH2)p1-[NH-(CH2)q1-]r1NH-(CH2)2-R4-R5 기, 예를 들어 -(CH2)2-NH-(CH2)2-NH-(CH2)2-R4-R5 기이고; -(CH2)2-NH-(CH2)2-NH-(CH2)2-C(O)-O-R5; 또는 -(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5기, 예를 들어,-(CH2)2-NR2-(CH2)2-NR2-(CH2)2-R5, 선택적으로 각각의 R2는 독립적으로 C1-C3 알킬 (예를 들어, 메틸)이고, 선택적으로 여기서 R5는 C1-C3 알킬 아미노 또는 C1-C3 디알킬아미노 (예를 들어, R5는 -CH2-NH-CH3 또는 -CH2-N-(CH3)2)이고; 다만 A3기의 약 5 % 이상 (예를 들어, 약 10 % 이상, 약 25 % 이상, 약 30 % 이상, 약 35 % 이상, 약 40 % 이상, 약 45 % 이상, 약 50 % 이상 %, 약 55 % 이상, 약 60 % 이상, 약 65 % 이상, 약 70 % 이상, 약 75 % 이상, 약 80 % 이상, 약 85 % 이상, 약 90 % 이상, 약 95 % 이상, 또는 심지어 100 %)은 -(CH2)p1-[NH-(CH2)q1-]r1NH-(CH2)2-R4-R5, 예를 들어 -(CH2)2-NH-(CH2)2-NH-(CH2)2-R4-R5 기, 또는 -(CH2)2-NH-(CH2)2-NH-(CH2)2-C(O)-O-R5 기; 또는 -(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5 기, 예를 들어,-(CH2)2-NR2-(CH2)2-NR2-(CH2)2-R5 , 선택적으로 여기서 각각의 R2는 독립적으로 C1-C3 알킬 (예를 들어, 메틸)이고, 선택적으로 여기서 R5는 C1-C3 알킬 아미노 또는 C1-C3 디알킬아미노 (예를 들어, R5는 -CH2-NH-CH3 또는 -CH2-N-(CH3)2)이다. 추가적으로, 일부 구체예에서, 폴리머는 다음으로부터 선택되는 A3 기를 일부 또는 심지어 대부분 (약 5 % 이상, 약 10 % 이상, 약 25 % 이상, 약 30 % 이상, 약 35 % 이상, 약 40 %, 약 45 % 이상, 약 50 % 이상, 약 55 % 이상, 약 60 % 이상, 약 65 % 이상, 약 70 % 이상, 약 75 % 이상, 약 80 % 이상 , 약 85 % 이상, 약 90 % 이상, 또는 약 95 % 이상) 갖는다:
―(CH2)p1―[NH―(CH2)q1-]r1NH-(CH2)2-R4-R5, 예를 들어 -(CH2)2-NH-(CH2)2-NH-(CH2)2-R4-R5 기, 또는 -(CH2)2-NH-(CH2)2-NH-(CH2)2-C(O)-O-R5 기; 또는 ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-(CH2)s1-R5 기, 선택적으로 여기서 각각의 R2는 독립적으로 C1-C3 알킬 (예를 들어, 메틸)이고, 선택적으로 여기서 R5는 C1-C3 알킬 아미노 또는 C1-C3 디알킬아미노 (예를 들어, R5는 -CH2-NH-CH3 또는 -CH2-N-(CH3)2)이다.
또한, 폴리머 구조에서, R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합이며, 선택적으로 1 내지 8 개 (또는 2 내지 8 개)의 2 차 또는 3 차 아민을 포함한다. 전술한 R5기 중 임의의 것은 치환되거나 비치환될 수 있다. R5는 또한 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기일 수 있다. 일부 구체예에서, R5는 약 1 내지 약 50 개의 탄소 원자 (예를 들어, 약 2 내지 약 50 개의 탄소 원자, 예컨대 약 2 내지 약 40 개의 탄소 원자, 약 2 내지 약 30 개의 탄소 원자, 약 2 내지 약 20 개의 탄소 원자, 약 1 내지 약 16개 또는 약 2 내지 약 16 개의 탄소 원자, 약 1 내지 약 12개 또는 약 2 내지 약 12 개의 탄소 원자, 약 1 내지 약 10개 또는 약 2 내지 약 10 개의 탄소 원자, 또는 약 1 내지 약 8개 또는 약 2 내지 약 8 개의 탄소 원자)를 포함할 수 있다. 일부 구체예에서, R5는 1 내지 8개 또는 2 내지 8개 (즉, 1, 2, 3, 4, 5, 6, 7, 또는 8개)의 2 차 또는 3 차 아민을 포함하는 헤테로알킬기이다. 2 차 또는 3 차 아민은 헤테로알킬 주골격의 일부 즉, 헤테로알킬기에서 가장 긴 연속 원자 사슬, 또는 펜던트 치환기일 수 있다. 따라서, 예를 들어, 2 차 또는 3 차 아민을 포함하는 헤테로알킬기는 1 내지 8개 (또는 2-8개)의 2 차 또는 3 차 아민을 포함하는 알킬아미노기, 디알킬아미노기, 아미노 알킬기, 알킬아미노알킬기, 디알킬아미노 알킬기, 아미노알킬아미노기 등일 수 있다.
일부 구체예에서, 각각의 R5는 다음으로부터 독립적으로 선택된다:
Figure pct00006
Figure pct00007
Figure pct00008
여기서
R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
R7은 하나 이상의 아민으로 선택적으로 치환된 C1-C50 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
z는 1 내지 5의 정수이고;
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 절단 가능한 링커이고;
n은 0 내지 50의 정수이고; 및
R8은 조직-특이적 또는 세포-특이적 표적화 모이어티, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
R2의 각각의 경우는 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기일 수 있다. 일부 구체예에서, R2는 C1-C12 (예를 들어, C1-C10 알킬기; C1-C8 알킬기; C1-C6 알킬기; C1-C4 알킬기, C1-C3 알킬기, 또는 C1 또는 C2 알킬기) 선형 또는 분지형 알킬기이다. 특정 구체예에서, R2는 메틸 또는 수소이다. .
R7은 선택적으로 하나 이상의 아민으로 치환된 C1-C50 (예를 들어, C1-C40, C1-C30, C1-C20, C1-C10, C4-C12, 또는 C6-C8) 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기일 수 있다. 일부 구체예에서, R7은 선택적으로 하나 이상의 아민으로 치환된 C6-C8와 같은 C4-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐 기이다. 일부 구체예에서, R7은 하나 이상의 아민으로 치환되어 있다. 특정 구체예에서, R7은 1 내지 8 또는 2 내지 8개 (즉, 1, 2, 3, 4, 5, 6, 7, 또는 8개)의 2 차 또는 3 차 아민으로 치환되어 있다. 아민은 알킬기의 일부 (즉, 알킬기 주골격에 포함됨) 또는 펜던트 치환기일 수 있다.
R13은 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기일 수 있다. 일부 구체예에서, R13은 C1-C12 (예를 들어, C1-C10 알킬기; C1-C8 알킬기; C1-C6 알킬기; C1-C4 알킬기, C1-C3 알킬기, 또는 C1 또는 C2 알킬기)의 선형 또는 분지형 알킬기이다. 특정 구체예에서, R13은 메틸이다. 다른 구체예에서, R13은 수소일 수 있다. 전형적으로는, 주어진 폴리머 내에서 각 R13은 동일하다 (예를 들어, 모두 메틸 또는 모두 수소); 그러나 각 R13은 독립적으로 선택되며 동일하거나 상이할 수 있다.
Y의 각 경우는 선택적으로 존재한다. 본 명세서에서 사용되는 "선택적으로 존재하는"이라는 문구는 선택적으로 존재하는 것으로 지정된 치환기가 존재하거나 존재하지 않을 수 있으며, 그 치환기가 존재하지 않을 때 인접한 치환기가 서로 직접 결합됨을 의미한다. Y가 존재하면 Y는 절단 가능한 링커이다. 본 명세서에 사용된 "절단 가능한 링커"라는 문구는 두 종을 분리하기 위해 절단될 수 있는 두 종을 연결하는 임의의 화학적 원소를 지칭한다. 예를 들어, 절단 가능한 링커는 가수 분해 공정, 광화학 공정, 라디칼 공정, 효소 공정, 전기 화학 공정, 또는 이들의 조합에 의해 절단 될 수 있다. 예시적인 절단 가능한 링커는 다음을 포함하지만 이에 제한되지는 않는다:
Figure pct00009
Figure pct00010
여기서 R14의 각 경우는 독립적으로 C1-C4 알킬기이고, R15의 각 경우는 독립적으로 수소, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고, R16은 하나 이상의 -OCH3, -NHCH3, -N (CH3) 2, -SCH3, -OH, 또는 이들의 조합으로 선택적으로 치환된 6-원 방향족 또는 헤테로방향족 기이다.
폴리머는 폴리머의 일부로서 상기 폴리머 구조를 포함하는 경우라면 임의의 적합한 폴리머라도 될 수 있다. 일부 구체예에서, 폴리머는 화학식 1, 1.1, 또는 1.2의 구조를 갖는 폴리머 블록, 및 하나 이상의 다른 폴리머 블록 (예를 들어, 에틸렌 옥사이드 서브유닛, 또는 프로필렌 옥사이드 서브유닛)을 포함하는 블록 공폴리머이다. 다른 구체예에서, 화학식 1, 1.1, 또는 1.2의 구조는 폴리머의 유일한 폴리머 단위이며, 이는 적합한 말단으로 양 말단이 "캡핑"될 수 있다. 특정 구체예에서, 폴리머는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 추가로 포함한다.
일부 구체예에서, 폴리머는 화학식 1A의 구조를 갖는다:
[화학식 1A]
Figure pct00011
여기서 Q는 다음 식이다:
Figure pct00012
또는 화학식 1A1:
[화학식 1A1]
Figure pct00013
여기서
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 전술한 바와 같은 절단 가능한 링커이고;
R1은 수소, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 아민과 같은 하나 이상의 치환체로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이다.
R6은 수소, 아미노기, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이다;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
다른 모든 치환기 (예를 들어, m1, n1, m2, n2, R2, R3a, R3b, R4, R5 및 R13)는 전술한 바와 같다.
유사하게, 폴리머는 화학식 1.1A의 구조를 가질 수 있다.
[화학식 1.1A]
Figure pct00014
또는 주골격이 화학식 1.2A와 같이 알파, 베타 구조인 경우:
[화학식 1.2A]
Figure pct00015
여기서
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 전술한 바와 같은 절단 가능한 링커이고;
R1은 수소, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 선택적으로 하나 이상의 아민과 같은 하나 이상의 치환체로 치환된 C1-C12 선형 또는 분지형 알킬기이다;
R6은 수소, 아미노기, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이다;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
다른 모든 치환기 (예를 들어, m3, R3a, R3b 및 A3)는 전술한 바와 같다.
전술한 내용의 일부 구체예에서, R1 및/또는 R6은 하나 이상의 치환기로 치환된 C1-C12 (예를 들어, C1-C10 알킬기; C1-C8 알킬기; C1-C6 알킬기; C1-C4 알킬기, C1 -C3 알킬기, 또는 C1 또는 C2 알킬기) 선형 또는 분지형 알킬기이다. 특정 구체예에서, 헤테로알킬 또는 알킬기는 하나 이상의 아민, 예를 들어 1 내지 8개 또는 2 내지 8 (즉, 1, 2, 3, 4, 5, 6, 7, 또는 8)개의 2 차 또는 3 차 아민을 포함하거나 그로 치환되어 있다. 아민은 헤테로알킬 주골격 사슬 또는 펜던트 치환기의 일부일 수 있다.
본 명세서에서 제공되는 폴리머의 비제한적인 예는 예를 들어 다음을 포함한다:
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
여기서 a, b, c 및 d는 각각 독립적으로 0 내지 1000 사이의 정수, 예를 들어 0-500, 0-200, 0-100, 또는 0-50이며, 다만 (a + b + c + d) > 약 5이다. 일부 구체예에서, (a + b)는 약 0 내지 약 75 (예를 들어, 약 5 내지 약 75, 약 20 내지 약 75, 약 40 내지 약 75, 약 40 내지 약 60, 약 50 내지 약 75, 약 60 내지 약 75, 또는 약 70 내지 약 75)이고, (c + d)는 약 5 내지 약 80 (예를 들어, 약 5 내지 약 75, 약 5 내지 약 60, 약 5 내지 약 40, 약 20 내지 약 40, 약 5 내지 약 30, 약 5 내지 약 20, 또는 약 5 내지 약 10)이다. 특정 구체예에서, (a + b)는 (c + d)보다 크다. 예를 들어, 일부 구체예에서, (a + b)/(c + d)의 비는 약 1 내지 약 3이다 (예를 들어, (a + b)는 약 55이고 (c + d)는 약 25 임), 또는 (a + b)/(c + d)의 비는 약 3 내지 약 10이다 (예를 들어, (a + b)는 약 70이고 (c + d)는 약 10 임). 다른 구체예에서, (a + b)는 (a + b)/(c + d)의 비가 1 미만 (예를 들어, 약 0.1 이상, 그러나 1 미만)이 되도록 (c + d) 미만이다. 다시, 이들 예시적인 폴리머에서 단위의 수 ("a", "b", "c" 및 "d")의 표시가 블록 공폴리머 구조를 의미하지는 않는다; 오히려 이 숫자는 전체 단위 수를 나타내며, 그 단위는 화학식에서 "/"기호로 표시된 바대로 무작위로 배열할 수 있다.
본 발명은 또한 화학식 2의 구조를 포함하는 폴리머를 제공한다:
[화학식 2]
Figure pct00029
여기서:
a는 10 내지 2,000의 정수이고;
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 본 명세서에서 전술한 바와 같이 절단 가능한 링커이고;
R1, R2, 및 R13 및 모든 다른 치환기는 다른 폴리머 화학식 (예를 들어, 화학식 1, 1A, 1A1, 1.1A 및 1.2A)에 대해 본 명세서에서 전술한 바와 같고;
R8은 조직-특이적 또는 세포-특이적 표적화 모이어티다.
본 발명은 또한 화학식 4의 구조를 포함하는 폴리머를 제공한다.
[화학식 4]
Figure pct00030
여기서
m1 및 n1은 각각 0 내지 1000의 정수이고; 다만 m1 + n1의 합이 2보다 크고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
A1 및 A2는 각각 독립적으로 다음 화학식의 기
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고;
R2의 각 경우는 독립적으로 수소, C1-C12 알킬기, C1-C12 알케닐기, C3-C12 시클로알킬기 또는 C3-C12 시클로알케닐기이고, 다만 A1 및 A2는 하나 이상 (예를 들어, 2 개 이상, 3 개 이상, 4 개 이상, 또는 심지어 5 개 이상)의 3 차 아민 (예를 들어, R2의 적어도 일부의 경우는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐 기임)을 포함하고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고; 및
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
본 발명은 화학식 4A의 구조를 갖는 폴리머를 추가적으로 제공한다:
[화학식 4A]
Figure pct00031
여기서
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 절단 가능한 링커이고;
m1 및 n1은 각각 0 내지 1000의 정수이고; 다만 m1 + n1의 합이 2보다 크고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
A1 및 A2는 각각 독립적으로 다음 화학식의 기
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고;
R1은 수소, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
R2의 각 경우는 독립적으로 수소, C1-C12 알킬기, C1-C12 알케닐기, C3-C12 시클로알킬기, 또는 C3-C12 시클로알케닐기이고, 다만 A1 및 A2는 하나 이상 (예를 들어, 2 개 이상, 3 개 이상, 4 개 이상, 또는 심지어 적어도 5 개)의 3 차 아민 (예를 들어, R2의 적어도 일부의 경우는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기임)이고;
R3a 및 R3a는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R6은 수소, 아미노기, 아릴기, 헤테로시클릭기 (예를 들어, 방향족 또는 비-방향족), C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이고; 및
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
화학식 4의 구조를 포함하는 폴리머 및 화학식 4A의 구조를 갖는 폴리머의 구체예에서, R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, C1-C12 알케닐기, C3-C12 시클로알킬기, 또는 C3-C12 시클로알케닐기이고, 다만 A1 및 A2는 각각 하나 이상의 3 차 아민 (예를 들어, 2 개 이상, 3 개 이상, 4 개 이상, 또는 심지어 5 개 이상 의 3 차 아민)을 포함한다. 일부 구체예에서, R2의 각 경우는 독립적으로 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다. 따라서, 화학식 4의 구조를 포함하는 폴리머 및 화학식 4A의 구조를 갖는 폴리머의 구체예에서, R2 치환기를 함유하는 각각의 질소는 3 차 아민이고, 다만 말단 아민은 1 차, 2 차, 또는 3 차 아민, 바람직하게는 2 차 아민 또는 3 차 아민일 수 있음은 예외적이다. 화학식 4의 구조 및 화학식 4A의 구조를 갖는 폴리머를 포함하는 폴리머의 일부 구체예에서, A1 및 A2는 각각 화학식 -(CH2)2-NR2-(CH2)2-NR2 2의 기이고, 여기서 R2의 각 경우는 말단 아민이 1 차, 2 차 또는 3 차 아민, 바람직하게는 2 차 또는 3 차 아민 일 수 있다는 점을 예외로 하고 독립적으로 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다. 화학식 4의 구조를 포함하는 폴리머 및 화학식 4A의 구조를 갖는 폴리머의 특정 구체예에서, R2의 각각의 경우는 에틸 또는 메틸이고, 다만 선택적으로 말단 아민이 1 차, 2 차 또는 3 차 아민, 바람직하게는 2 차 또는 3 차 아민일 수 있음은 예외적이다.
화학식 4의 구조를 포함하는 폴리머 및 화학식 4A의 구조를 갖는 폴리머의 구체예에서, R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다. 일반적으로 R13의 각 경우는 독립적으로 수소 또는 메틸 치환기이다. 특정 구체예에서, 각 경우의 R13은 수소이다.
상기 중 임의의 것에 따르면, A1 및 A2 기의 예는, 예를 들어 -NH-CH2-CH2-N (CH3)-CH2-CH2-N(CH3)2; -N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)2; -NH-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)2; -N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)2; -NH-CH2-CH2-N(CH3)-CH2-CH2-NH(CH3); -N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-NH(CH3); -NH-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-NH(CH3); -N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-N(CH3)-CH2-CH2-NH(CH3)이다.
따라서, 본 명세서에서 제공되는 폴리머의 비제한적인 예는, 예를 들어 다음을 포함한다:
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
여기서 a 및 b는 각각 독립적으로 0-500, 0-200, 0-100, 또는 0-50과 같은 0-1000의 정수이다. 따라서, a 또는 b는 일부 구체예에서 0일 수 있거나, 폴리머는 a 및 b의 어떠한 비(ratio)를 가질 수 있다. 일부 구체예에서, (a + b)는 약 5 이상 (예를 들어, 약 5 내지 약 160, 약 5 내지 약 140, 약 5 내지 약 120, 약 5 내지 약 100, 약 5 내지 약 80, 또는 약 5 내지 약 60) 또는 약 25 이상 (예를 들어, 약 25 내지 약 160, 약 25 내지 약 140, 약 25 내지 약 120, 약 25 내지 약 100, 약 25 내지 약 80, 또는 약 25 내지 약 60) 또는 심지어 약 50 이상 (예를 들어, 약 50 내지 약 160, 약 50 내지 약 140, 약 50 내지 약 120, 약 50 내지 약 100, 또는 약 50 내지 약 80)이다. 추가적인 예는 폴리머 30-33을 포함하며, 여기서 한쪽 또는 양쪽 측쇄의 말단 3 차 아민은 탈메틸화되어 2 차 아민 (예를 들어, -NHCH3)을 제공하고:
Figure pct00036
Figure pct00037
Figure pct00038
여기서 a 및 b는 전술한 바와 같다.
전술한 폴리머 중 어느 것이든 기재된 화학식에 표시된 위치에서 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함할 수 있거나, 폴리머는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하도록 달리 개질될 수 있다. 조직-특이적 또는 세포-특이적 표적화 모이어티를 부착하는 방법은 관련 업계에 공지되어 있으며, 그 중 일부는 마이클(Michael) 첨가, 에폭시드 개환, 대체 반응, 또는 조직-특이적 또는 세포-특이적 표적화 모이어티와 적절한 작용기를 사용하는 "클릭" 화학 (예를 들어, CuAAC, SPAAC, SPANC, 또는 스트레인드 알켄의 반응)을 포함한다. 조직-특이적 또는 세포-특이적 표적화 모이어티는 임의의 소분자, 단백질 (예를 들어, 항체 또는 항원), 아미노산 서열, 당, 올리고뉴클레오티드, 금속 기반 나노입자, 또는 이들의 조합 일 수 있으며, 주어진 표적 조직 또는 세포를 인지할 수 있는(예를 들어, 특이적으로 결합하는) 것이다 (예를 들어, 표적 조직 또는 세포 및 다른 비표적 조직 또는 세포를 포적화 모리어티가 구별 할 수 있게 하는 특정 리간드, 수용체, 또는 다른 단백질 또는 분자에 특이적으로 결합함). 일부 구체예에서, 조직-특이적 또는 세포-특이적 표적화 모이어티는 리간드에 대한 수용체이다. 일부 구체예에서, 조직-특이적 또는 세포-특이적 표적화 모이어티는 수용체에 대한 리간드이다.
조직-특이적 또는 세포-특이적 표적화 모이어티는 임의의 원하는 조직 또는 세포 유형을 표적화하기 위해 사용될 수 있다. 일부 구체예에서, 조직-특이적 또는 세포-특이적 표적화 모이어티는 폴리머를 개체의 말초 신경계, 중추 신경계, 간, 근육 (예를 들어, 심장 근육), 폐, 뼈 (예를 들어, 조혈 세포), 또는 눈의 조직에 국재화시킨다. 특정 구체예에서, 조직-특이적 또는 세포-특이적 표적화 모이어티는 폴리머를 종양 세포에 국재화시킨다. 예를 들어, 조직-특이적 또는 세포-특이적 표적화 모이어티는 특정된 조직 또는 세포의 수용체에 결합하는 당일 수 있다.
일부 구체예에서, 조직-특이적 또는 세포-특이적 표적화 모이어티는 다음과 같다:
Figure pct00039
여기서 R9, R10, R11, 및 R12는 각각 독립적으로 수소, 할로겐, C1-C4 알킬, 또는 C1-C4 알콕시이며, 하나 이상의 아미노기로 선택적으로 치환된다. 특정 조직-특이적 또는 세포-특이적 표적화 모이어티는 본 명세서에 기재된 조직에 폴리머를 국재화하기 위해 선택할 수 있다. 예를 들어, 알파-d-만노스는 말초 신경계, 중추 신경계, 또는 면역 세포에 폴리머를 국재화시키기 위해 사용할 수 있으며, 알파-d-갈락토스 및 N-아세틸갈락토사민은 간의 간세포에 폴리머를 국재화시키기 위해 사용할 수 있고, 엽산은 종양 세포에 폴리머를 국재화시키기 위해 사용할 수 있다.
전형적으로는 폴리머는 양이온성 (즉, pH 7 및 23 ℃에서 양전하)이다. 본 명세서에 사용된 "양이온성" 폴리머는 폴리머가 양이온성 모노머 단위만을 포함하거나 양이온성 모노머 단위와 비이온성 또는 음이온성 모노머 단위의 조합을 포함하는지 여부에 관계없이 전체 네트로 양전하를 갖는 폴리머를 지칭한다.
특정 구체예에서, 폴리머는 약 5 kDa 내지 약 2000 kDa, 예컨대 약 10 kDa 내지 약 2,000 kDa의 중량 평균 분자량을 갖는다. 폴리머는 중량 평균 분자량 약 2,000 kDa 이하, 예를 들어 약 1,800 kDa 이하, 약 1,600 kDa 이하, 약 1,400 kDa 이하, 약 1,200 kDa 이하, 약 1,000 kDa 이하, 약 900 kDa 이하, 약 800 kDa 이하, 약 700 kDa 이하, 약 600 kDa 이하, 약 500 kDa 이하, 약 100 kDa 이하, 또는 약 50 kDa 이하 또는 심지어 약 40 kDa 이하 , 예를 들어 약 30kDa 이하 또는 25kDa 이하를 갖는다. 대안적으로, 또는 추가적으로, 폴리머는 약 5 kDa 이상 또는 약 10 kDa 이상, 예를 들어 약 50 kDa 이상, 약 100 kDa 이상, 약 200 kDa 이상, 약 300 kDa 이상, 또는 약 400 kDa 이상의 중량 평균 분자량을 갖는다. 따라서, 폴리머는 전술한 종점 중 임의의 2 개에 의해 제한되는 중량 평균 분자량을 가질 수 있다. 예를 들어, 폴리머는 약 5 kDa 내지 약 50 kDa, 약 10 kDa 내지 약 50 kDa, 약 10 kDa 내지 약 100 kDa, 약 10 kDa 내지 약 500 kDa , 약 50 kDa 내지 약 500 kDa, 약 100 kDa 내지 약 500 kDa, 약 200 kDa 내지 약 500 kDa, 약 300 kDa 내지 약 500 kDa, 약 400 kDa 내지 약 500 kDa, 약 400 kDa 내지 약 600 kDa, 약 400 kDa 내지 약 700 kDa, 약 400 kDa 내지 약 800 kDa, 약 400 kDa 내지 약 900 kDa, 약 400 kDa 내지 약 1,000 kDa, 약 400 kDa 내지 약 1,200 kDa, 약 400 kDa 내지 약 1,400 kDa, 약 400 kDa 내지 약 1,600 kDa, 약 400 kDa 내지 약 1,800 kDa, 약 400 kDa 내지 약 2,000 kDa, 약 200 kDa 내지 약 2,000 kDa, 약 500 kDa 내지 약 2,000 kDa, 또는 약 800 kDa 내지 약 2,000 kDa의 중량 평균 분자량을 가질 수 있다.
중량 평균 분자량은 임의의 적절한 기술에 의해 결정될 수 있다. 일반적으로 중량 평균 분자량은 TSKgel Guard, GMPW, GMPW, G1000PW 및 Waters 2414 (Waters Corporation, Milford, Massachusetts) 굴절지수 검출기에서 선택된, 컬럼이 장착된 크기 배제 크로마토그래피를 사용하여 결정된다. 또한 중량 평균 분자량은 150-875,000 달톤 범위의 폴리에틸렌 옥사이드/폴리에틸렌 글리콜 표준으로 보정하여 결정된다.
제조 방법
본 명세서에서 제공되는 폴리머는 임의의 적절한 방법에 의해 제공될 수 있다. 일부 구체예에서, 폴리머는 화학식 3의 구조를 포함하는 폴리머의 기 A1 및/또는 A2의 적어도 일부를 개질하는 것을 포함하는 방법에 의해 제조될 수 있다.
[화학식 3]
Figure pct00040
여기서:
m1 및 n1은 각각 0 내지 1000의 정수이며, 다만 m1 + n1이 5보다 크고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
A1 및 A2는 각각 독립적으로 다음 화학식의 기이다.
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고,
화학식 1의 구조를 포함하는 폴리머를 제조하기 위해:
[화학식 1]
Figure pct00041
여기서 m1 및 n1은 0 내지 1000의 정수이고;
m2 및 n2는 각각 0 내지 1000의 정수이고, 다만 m2 + n2의 합이 5보다 크고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
A1 및 A2는 각각 독립적으로 화학식의 기이고
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
B1과 B2는 각각 독립적으로
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R4-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R4-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R4-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-CH2-CHOH-R5;
-(CH2)p2-N[-(CH2)q2-NR2-CH2-CHOH-R5;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2-CH2-CHOH-R5;
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-CH2-CHOH-R5]2}2;
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R5]2}2;
-(CH2)p1-[N{(CH2)s1-R4-R5}-(CH2)q1-]r1NR2 2; 또는
-(CH2)p1-[N{(CH2)s1-R5}-(CH2)q1-]r1NR2 2이고,
여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH- 또는 -S(O)(O)-이며; R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 선택적으로 1 내지 8 개 또는 2 내지 8 개의 2 차 또는 3 차 아민을 포함하는 것 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함한다.
상기 방법에 의해 생성된 화학식 1의 구조를 포함하는 폴리머는 화학식 1.1, 1.2, 1A1, 1A, 1.1A, 1.2A, 4 또는 4A 뿐만 아니라 본 발명의 폴리머와 관련하여 기재된 바와 같은 그의 임의의 및 모든 구체예를 포함하는 화학식 1의 임의의 폴리머일 수 있다.
화학식 3의 구조를 포함하는 폴리머는 이러한 기준을 충족하는 임의의 적합한 폴리머일 수 있다. 일부 구체예에서, 폴리머는 대신 화학식 3.1로 기술될 수 있다:
[화학식 3.1]
Figure pct00042
또는, 주골격이 화학식 3.2와 같이 알파, 베타 구조인 경우:
[화학식 3.2]
Figure pct00043
여기서
m3은 5-2000의 정수 (예를 들어, 5-1000, 5-500, 5-100, 25-2000, 25-500, 25-100, 50-2000, 50-1000, 50-500, 또는 50- 100)이고;
기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
각 A3는 독립적으로 다음 화학식의 기이고
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다. 이 경우, 상기 방법은 본 명세서에 기재된 바와 같이 화학식 1.1 또는 1.2의 구조를 갖는 폴리머를 제공하기에 충분한 A3 기의 적어도 일부를 개질시키는 것을 포함할 수 있다. 다음 구조 중 하나를 포함하는 폴리머의 예는 pAsp (DET) (폴리 (2-[(2-아미노에틸)아미노]에틸 아스파르트아미드)) 또는 PEG-pAsp (DET)(폴리에틸렌 글리콜-b-폴리 {N'-[N-(2-아미노에틸)-2-아미노에틸]아스파르트아미드})이다.
A1 및/또는 A2로 지정된 기 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)은 임의의 적합한 수단에 의해 개질되어 B1 및/또는 B2 (또는 화학식 1.1 또는 1.2의 폴리머의 기 A3)로 지정된 기를 생성할 수 있다. 예를 들어, A1 및/또는 A2로 지정된 기 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)는 마이클 첨가 반응, 에폭시드 개환, 또는 대체 반응에 의해 개질될 수 있다. 바람직한 구체예에서, A1 및/또는 A2로 지정된 기 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)는 마이클 첨가 반응에 의해 개질된다.
한 구체예에서, 화학식 3의 구조를 포함하는 폴리머의 기 A1 및/또는 A2, 또는 화학식 3.1 또는 3.2의 폴리머의 기 A3은 화학식 3의 구조를 포함하는 폴리머와 α,β-불포화 카르보닐 화합물 사이의 마이클 첨가 반응에 의해 개질된다. 본 명세서에 사용된 용어 "마이클 첨가"는 폴리머의 친핵체 (예를 들어, 탄소 음이온(carbanion), 산소 음이온, 질소 음이온, 산소 원자, 질소 원자, 또는 이들의 조합)의 친핵성 첨가를 의미한다. 따라서, 마이클 첨가 반응은 화학식 3의 구조를 포함하는 폴리머와 α,β-불포화 카르보닐 화합물 사이에서 일어난다. 일부 구체예에서, 폴리머의 친핵체는 질소 음이온, 질소 원자, 또는 이들의 조합이다.
α,β-불포화 카르보닐 화합물은 친핵체로부터 마이클 첨가를 수용할 수 있는 임의의 α,β-불포화 카르보닐 화합물일 수 있다. 일부 구체예에서, α,β-불포화 카르보닐 화합물은 아크릴레이트, 아크릴아미드, 비닐 술폰, 또는 이들의 조합이다. 따라서, 마이클 첨가 반응은 화학식 3의 구조를 포함하는 폴리머와 아크릴레이트, 아크릴아미드, 비닐 술폰 또는 이들의 조합 사이에 있을 수 있다. 따라서, 일부 구체예에서, 상기 방법은 화학식 3의 구조를 포함하는 폴리머 및 아크릴레이트를 접촉시키는 단계; 화학식 3의 구조를 포함하는 폴리머 및 아크릴아미드를 접촉시키는 단계; 또는 화학식 3의 구조를 포함하는 폴리머 및 비닐 술폰을 접촉시키는 단계를 포함한다.
A1 및/또는 A2로 지정된 기 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)가 마이클 첨가 반응에 의해 개질되는 구체예에서, 이들은 화학식 1, 1.1., 1.2, 1A, 1A1 등 (또는 화학식 1.1 또는 1.2의 폴리머의 기 A3)과 관련하여 본 명세서에 기재된 바와 같이 B1 및/또는 B2로 지정된기를 생성하고,. 예를 들어 B1 및/또는 B2는 다음 화학식이 될 수 있고:
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R4-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R4-R5};
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R4-R5]2}2;
여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이고; R5의 각각의 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 선택적으로 1 내지 8 개 또는 2 내지 8 개의 2 차 또는 3 차 아민을 포함하는 것 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함하고; 또는 기 및 치환기가 본 발명의 폴리머와 관련하여 본 명세서에서 다르게 기재된 바와 같을 수 있다.
사용하기에 적합한 아크릴레이트, 아크릴아미드, 및 비닐 술폰의 예에는 다음 화학식의 아크릴레이트가 포함된다.
Figure pct00044
여기서 R5는 화학식 1, 1.1, 1.2, 1A, 1.1A 또는 1.2A 중 임의의 것에 대해 기재된 바와 같다.
일부 구체예에서, 마이클 첨가 반응은 산 및/또는 염기에 의해 촉진된다. 산 및/또는 염기는 임의의 적합한 pKa를 갖는 임의의 적합한 산 및/또는 염기 일 수 있다. 산 및/또는 염기는 유기산 (예를 들어, p-톨루엔술폰산), 유기 염기 (예를 들어, 트리에틸아민), 무기산 (예를 들어, 티타늄 사염화물), 무기 염기 (예를 들어, 탄산 칼륨), 또는 이들의 조합일 수 있다.
일부 구체예에서, 마이클 첨가 반응은 산에 의해 촉진된다. 산은 브뢴스 테드 산 또는 루이스 산일 수 있다. 산이 브뢴스테드산인 구체예에서, 산은 약산 (즉, 약 4 내지 약 7의 pKa) 또는 강산 (즉, 약 -2 내지 약 4의 pKa) 일 수 있다. 전형적으로는 산은 약산이다. 특정 구체예에서, 산은 루이스 산이다. 예를 들어, 산은 비스(트리플루오로메탄술폰)이미드 또는 p-톨루엔술폰산일 수 있다.
일부 구체예에서, 마이클 첨가 반응은 염기에 의해 촉진된다. 염기는 약 염기 (즉, 약 7 내지 약 12의 pKa) 또는 강 염기 (즉, 약 12 내지 약 50의 pKa) 일 수 있다. 전형적으로는 염기는 약염기이다. 예를 들어, 염기는 트리에틸아민, 디이소프로필에틸아민, 피리딘, N-메틸 모르폴린, 또는 N,N-디메틸-피페라진, 또는 이의 유도체일 수 있다.
일부 구체예에서, 마이클 첨가 반응은 용매에서 수행된다. 용매는 반응할 폴리머 및 α,β-불포화 카르보닐 화합물을 용해시킬 수 있는 임의의 적합한 용매, 또는 용매 혼합물일 수 있다. 예를 들어, 용매는 물, 양성자성 유기 용매 및/또는 비양성자성 유기 용매를 포함할 수 있다. 용매의 예시 목록에는 물, 디클로로메탄, 디에틸 에테르, 디메틸 술폭시드, 아세토니트릴, 메탄올, 및 에탄올이 포함된다.
하나의 구체예에서, 폴리머의 기 A1 및/또는 A2 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)는 폴리머와 에폭시드 화합물 사이의 에폭시드 개환 반응에 의해 개질된다. 본 명세서에 사용된 용어 "에폭시드 개환"은 에폭시드 화합물에 대한 폴리머의 친핵체 (예를 들어, 탄소 음이온, 산소 음이온, 질소 음이온, 산소 원자, 질소 원자, 또는 이들의 조합)의 친핵성 첨가를 의미하며 이에 의해 에폭시드가 열린다. 따라서, 에폭시드 개환 반응은 폴리머와 에폭시드 화합물 사이에서 일어난다. 일부 구체예에서, 폴리머의 친핵체는 질소 음이온, 질소 원자, 또는 이들의 조합이다.
A1 및/또는 A2로 지정된 기 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)가 에폭시드 개환 반응에 의해 개질되는 구체예에서, 이들은 B1 및/또는 B2로 지정된 기 (또는 화학식1.1 또는 1.2의 폴리머의 기 A3)을 생성한다:
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-CH2-CHOH-R5;
-(CH2)p2-N[-(CH2)q2-NR2-CH2-CHOH-R5;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2-CH2-CHOH-R5;
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-CH2-CHOH-R5]2}2;
여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R5의 각각의 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 선택적으로 1 내지 8 개 또는 2 내지 8 개의 2 차 또는 3 차 아민을 포함하는 것 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함한다.
사용하기에 적합한 에폭시드의 예는 다음 화학식의 에폭시드를 포함한다:
Figure pct00045
여기서 R5는 본 발명의 임의의 폴리머 (예를 들어, 화학식 1, 1.1, 1.2, 1A, 1.1A, 또는 1.2A)에 대해 기재된 바와 같다.
일부 구체예에서, 에폭시드 개환 반응은 산 및/또는 염기에 의해 촉진된다. 산 및/또는 염기는 임의의 적합한 pKa를 갖는 임의의 적합한 산 및/또는 염기일 수 있다. 산 및/또는 염기는 유기산 (예를 들어, p-톨루엔술폰산), 유기 염기 (예를 들어, 트리에틸아민), 무기산 (예를 들어, 티타늄 사염화물), 무기 염기 (예를 들어, 탄산 칼륨), 또는 이들의 조합일 수 있다.
일부 구체예에서, 에폭시드 개환 반응은 산에 의해 촉진된다. 산은 브뢴스테드산 또는 루이스 산일 수 있다. 산이 브뢴스테드산인 구체예에서, 산은 약산 (즉, 약 4 내지 약 7의 pKa) 또는 강산 (즉, 약 -2 내지 약 4의 pKa) 일 수 있다. 전형적으로는 산은 약산이다. 특정 구체예에서, 산은 루이스 산이다. 예를 들어, 산은 비스(트리플루오로메탄술폰)이미드 또는 p-톨루엔술폰산일 수 있다.
일부 구체예에서, 에폭시드 개환 반응은 염기에 의해 촉진된다. 염기는 약 염기 (즉, 약 7 내지 약 12의 pKa) 또는 강염기 (즉, 약 12 내지 약 50의 pKa) 일 수 있다. 일반적으로 염기는 약염기이다. 예를 들어, 염기는 트리에틸아민, 디이소프로필에틸아민, 피리딘, N-메틸 모르폴린, 또는 N,N-디메틸-피페라진, 또는 이들의 유도체일 수 있다.
일부 구체예에서, 에폭시드 개환 반응은 용매 내에서 수행된다. 용매는 반응 할 폴리머 및 에폭시드 화합물을 가용화 할 수 있는, 임의의 적합한 용매 또는 용매의 혼합물일 수 있다. 예를 들어, 용매는 물, 양성자성 유기 용매 및/또는 비양성자성 유기 용매를 포함할 수 있다. 용매의 예시 목록에는 물, 디클로로메탄, 디에틸 에테르, 디메틸 술폭시드, 아세토니트릴, 메탄올, 및 에탄올이 포함된다.
한 구체예에서, 폴리머의 기 A1 및/또는 A2 (또는 화학식 3.1 또는 3.2의 폴리머의 기 A3)는 폴리머와 이탈기를 포함하는 화합물 (예를 들어, 염화물 원자, 브롬화물 원자, 요오드화물 원자, 토실레이트, 트리플레이트, 메실레이트 등) 사이의 대체 반응에 의해 개질된다. 본 명세서에서 사용되는 용어 "대체(displacement)"는 폴리머의 친핵체(nucleophile) (예를 들어, 탄소 이온, 산소 음이온, 질소 음이온, 산소 원자, 질소 원자 또는 이들의 조합)의, 이탈기를 포함하는 화합물에 대한 친핵성 첨가를 의미한다. 따라서, 대체 반응은 폴리머와 이탈기를 포함하는 화합물 사이에 일어난다. 일부 구체예에서, 폴리머의 친핵체는 질소 음이온, 질소 원자, 또는 이들의 조합이다.
A1 및/또는 A2로 지정된 기 (또는 화학식 3.1 또는 3.2의 폴리머의 A3기)가 대체 반응에 의해 개질되는 구체예에서, 이들은 다음 화학식의 B1 및/또는 B2 (또는 화학식 1.1 또는 1.2의 폴리머의 기 A3)로 지정된 기를 생성한다:
-(CH2)p1-[NR2-(CH2)q1-]r1NR2-(CH2)s1-R5;
-(CH2)p2-N[-(CH2)q2-NR2-(CH2)s2-R5]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2(CH2)s3-R5}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2-(CH2)s4-R5]2}2,
여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R5의 각각의 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 선택적으로 1 내지 8 개 또는 2 내지 8 개의 2 차 또는 3 차 아민을 포함하는 것 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이다.
일부 구체예에서, 상기 방법은 화학식 A의 화합물로부터 화학식 5의 구조를 포함하는 폴리머를 제조하는 것을 포함한다:
[화학식 A]
Figure pct00046
여기서
R3b는 메틸렌 또는 에틸렌 기이고;
W는 -NR14- 또는 -O-이고, 여기서 R14는 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
Z는 A1, 또는 1 내지 8 개 또는 2 내지 8 개의 2 차 또는 3 차 아민을 포함하는 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 아릴알킬기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함하고;
A1은 다음 화학식의 기이고
-(CH2)p1-[NR2-(CH2)q1-]r1NR2 2;
-(CH2)p2-N[-(CH2)q2-NR2 2]2;
-(CH2)p3-N{[-(CH2)q3-NR2 2][-(CH2)q4-NR2-]r2R2}; 또는
-(CH2)p4-N{-(CH2)q5-N[-(CH2)q6-NR2 2]2}2,
여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
일반적으로, 화학식 A의 화합물로부터 화학식 5의 구조를 포함하는 폴리머를 형성하는 단계를 포함하는 방법은 화학식 A화합물의 개환 중합을 포함한다. 화학식 A의 화합물의 개환 중합은 임의의 적합한 방법 (예를 들어, 온도, 광, 촉매, 화합물 등)에 의해 개시될 수 있다. 일부 구체예에서, 화학식 A의 화합물의 개환 중합은 아민-함유 화합물로 개시된다.
특정 구체예에서, 화학식 A의 화합물의 개환 중합은 하기 화학식의 아민-함유 화합물로 개시된다:
Figure pct00047
여기서
c는 0 내지 50의 정수이고;
Y는 선택적으로 존재하고 절단 가능한 링커이고; 및
R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이다. 바람직한 구체예에서, 상기 아민-함유 화합물은
Figure pct00048
일부 구체예에 있어서, 화학식 A의 화합물에서, Y는 -O-이고, Z는 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 아릴알킬기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 1 내지 8 또는 2 내지 8 개의 2 차 또는 3 차 아민을 선택적으로 포함한다. 일부 구체예에서, Z는 벤질과 같은 아릴알킬기이다. 이어서, 화학식 5의 폴리머를 제조하는 방법은 개환 중합 후, 생성된 중간 폴리머를 화학식 NHR17-A1의 화합물로 처리하는 단계를 더 포함하는데, 여기서 A1은 화학식 1에 대해 정의된 바와 같다. 화학식 NHR17-A1의 화합물은 선택적으로 디에틸렌아민 트리아민이다. 일부 구체예에서, 화학식 NHR17-A1의 화합물은 디에틸렌아민 트리아민이 아니다.
R17은 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기일 수 있다. 일부 구체예에서, R17은 C1-C12 (예를 들어, C1-C10 알킬기; C1-C8 알킬기; C1-C6 알킬기; C1-C4 알킬기, C1-C3 알킬기, 또는 C1 또는 C2 알킬기) 선형 또는 분지형 알킬기이다. 특정 구체예에서, R17은 메틸이다. 다른 구체예에서, R17은 수소일 수 있다. 전형적으로 주어진 폴리머 내에서 각 R17은 동일하되(예를 들어, 모두 메틸 또는 모두 수소); 그러나 각 R17은 독립적으로 선택되며 동일하거나 상이할 수 있다.
사용하기에 적합한, 이탈기를 함유하는 화합물의 예는 다음 화학식의 화합물을 포함한다:
Figure pct00049
여기서 LG는 이탈기 (예를 들어, 염?d물 원자, 브롬화물 원자, 요오드화물 원자, 토실레이트, 트리플레이트, 메실레이트 등)이고 R5는 임의의 화학식 1, 1.1, 1.2, 1A, 1.1A 또는 1.2A에 대해 기재한 바대로이다.
일부 구체예에서, 대체 반응은 산 및/또는 염기에 의해 촉진된다. 산 및/또는 염기는 임의의 적합한 pKa를 갖는 임의의 적합한 산 및/또는 염기일 수 있다. 산 및/또는 염기는 유기산 (예를 들어, p-톨루엔술폰산), 유기 염기 (예를 들어, 트리에틸아민), 무기산 (예를 들어, 티타늄 사염화물), 무기 염기 (예를 들어, 탄산 칼륨), 또는 이들의 조합일 수 있다.
일부 구체예에서, 대체 반응은 산에 의해 촉진된다. 산은 브뢴스테드산 또는 루이스 산일 수 있다. 산이 브뢴스테드산인 구체예에서, 산은 약산 (즉, 약 4 내지 약 7의 pKa) 또는 강산 (즉, 약 -2 내지 약 4의 pKa)일 수 있다. 전형적으로는 산은 약산이다. 특정 구체예에서, 산은 루이스산이다. 예를 들어, 산은 비스(트리플루오로메탄술폰)이미드 또는 p-톨루엔술폰산일 수 있다.
일부 구체예에서, 대체 반응은 염기에 의해 촉진된다. 염기는 약 염기 (즉, 약 7 내지 약 12의 pKa) 또는 강 염기 (즉, 약 12 내지 약 50의 pKa)일 수 있다. 일반적으로 염기는 약염기이다. 예를 들어, 염기는 트리에틸아민, 디이소프로필 에틸아민, 피리딘, N-메틸모르폴린, 또는 N,N-디메틸-피페라진 또는 이의 유도체 일 수 있다.
일부 구체예에서, 대체 반응은 용매에서 수행된다. 용매는 반응할 이탈기를 포함하는 화합물 및 폴리머를 가용화 할 수 있는 임의의 적합한 용매 또는 용매의 혼합물 일 수 있다. 예를 들어, 용매는 물, 양성자성 유기 용매 및/또는 비양성자성 유기 용매를 포함할 수 있다. 용매의 예시 목록에는 물, 디클로로 메탄, 디 에틸 에테르, 디메틸 술폭시드, 아세토니트릴, 메탄올 및 에탄올이 포함된다.
일부 구체예에서, 방법은 화학식 1의 구조를 포함하는 폴리머를 단리하는 단계를 추가로 포함한다. 화학식 1의 구조를 포함하는 폴리머는 임의의 적절한 수단에 의해 분리 될 수 있다. 예를 들어, 화학식 1의 구조를 포함하는 폴리머는 추출, 결정화, 재결정, 컬럼 크로마토 그래피, 여과 또는 이들의 임의 조합에 의해 분리 될 수 있다.
조성물
본 명세서에서 제공되는 폴리머는 임의의 목적으로 사용될 수 있다. 그러나, 상기 폴리머는 핵산 및/또는 폴리펩티드 (예를 들어, 단백질)를 세포에 전달하는데에 특히 유용한 것으로 여겨진다. 따라서, 본 명세서에서 제공되는 바와 같은 폴리머 및 핵산 및/또는 폴리펩티드 (예를 들어, 단백질)를 포함하는 조성물이 본 명세서에서 제공된다.
일부 구체예에서, 상기 조성물은 핵산을 포함한다. 임의의 핵산을 사용할 수 있다. 핵산의 예시 목록에는 CRISPR 시스템의 가이드 및/또는 공여자 핵산, siRNA, microRNA, 간섭 RNA 또는 RNAi, dsRNA, mRNA, DNA 벡터, 리보자임, 안티센스 폴리뉴클레오티드, 및 siRNA, microRNA, dsRNA, 리보자임 또는 안티센스 핵산을 코딩하는 DNA 발현 카세트가 포함된다. SiRNA는 전형적으로 15-50 개 염기쌍, 바람직하게는 19-25 개 염기쌍을 함유하고 세포 내에서 발현된 표적 유전자 또는 RNA와 동일하거나 거의 동일한 뉴클레오티드 서열을 갖는 이중 가닥 구조를 포함한다. siRNA는 두 개의 어닐링된 폴리뉴클레오티드 또는 헤어핀 구조를 형성하는 단일 폴리뉴클레오티드로 구성될 수 있다. MicroRNA (miRNA)는 mRNA 표적의 직접적인 파괴 또는 번역 억제를 지시하는 약 22 개 뉴클레오티드 길이의 작은 비코딩 폴리뉴클레오티드이다. 안티센스 폴리뉴클레오티드는 유전자 또는 mRNA에 상보적인 서열을 포함한다. 안티센스 폴리뉴클레오티드는 모르폴리노, 2'-O-메틸 폴리뉴클레오티드, DNA, RNA 등을 포함하나 이에 제한되지 않는다. 폴리뉴클레오티드 기반 발현 억제제는 시험관 내(in vitro)에서 중합되고, 재조합될 수 있으며, 키메라 서열, 또는 이들 기의 유도체를 함유할 수 있다. 폴리뉴클레오티드-기반 발현 억제제는 리보뉴클레오티드, 데옥시리보뉴클레오티드, 합성 뉴클레오티드, 또는 임의의 적합한 조합으로서 표적 RNA 및/또는 유전자가 억제되도록 하는 것을 함유할 수 있다. 폴리뉴클레오티드는 또한 시험관 내(in vitro) 또는 생체 내(in vivo) 전달을 추적하는 것과 같은 목적을 위해 "바코드" 역할을 하는 서열일 수도 있다.
상기 조성물은 핵산에 더하여 또는 핵산 대신에 전달을 위한 임의의 단백질을 포함할 수도 있다. 폴리펩티드는 임의의 적합한 폴리펩티드일 수 있다. 예를 들어, 상기 폴리펩티드는 징크 핑거 뉴클레아제, 전사 활성자-유사 이펙터 뉴클레아제 ("TALEN"), 재조합효소, 데아미나아제, 엔도뉴클레아제, 또는 이들의 조합일 수 있다. 일부 구체예에서, 폴리펩티드는 RNA-유도되는 엔도뉴클레아제 (예를 들어, Cas9 폴리펩티드, Cpf1 폴리펩티드, 또는 이들의 변이체) 또는 DNA 재조합효소 (예를 들어, Cre 폴리펩티드)이다.
본 명세서에서 제공되는 폴리머는 CRISPR 시스템의 하나 이상의 성분을 전달하는 데에 특히 유용한 것으로 생각된다. 따라서, 일부 구체예에서, 상기 조성물은 가이드 RNA, RNA-가이드된 엔도뉴클레아제 또는 이를 코딩하는 핵산, 및/또는 공여자(donor) 핵산을 포함한다. 상기 조성물은 본 명세서에 기재된 폴리머와 함께 1 개, 2 개 또는 3 개의 성분 모두를 포함할 수 있다. 더욱이, 조성물은 복수의 가이드 RNA, RNA-가이드된 엔도뉴클레아제 또는 이를 인코딩하는 핵산, 및/또는 공여자 핵산을 포함할 수 있다. 예를 들어, 상이한 표적 부위에 대한 다수의 상이한 가이드 RNA가, 선택적으로 다수의 상이한 공여자 핵산 및 심지어 다수의 상이한 RNA 가이드된 엔도뉴클레아제 또는 이를 코딩하는 핵산과 함께 포함될 수 있다.
또한, CRISPR 시스템의 구성 요소는 (다중 구성 요소가 존재할 때) 서로 결합될 수 있으며 폴리머는 특정 방식 또는 순서로 결합 될 수 있다. 일부 구체예에서, 가이드 RNA는 폴리머와 결합하기 전에 RNA 엔도뉴클레아제와 복합체화된다. 더하여 또는 대신으로, 가이드 RNA는 폴리머와 결합하기 전에 공여자 핵산에 (공유적으로 또는 비공유적으로) 연결될 수 있다.
조성물은 다수가 공지된 임의의 특정 CRISPR 시스템 (즉, 임의의 특정 가이드 RNA, RNA-가이드된 엔도뉴클레아제, 또는 공여자 핵산)에 제한되지 않는다. 그럼에도 불구하고 추가적인 설명을 위해 이러한 시스템의 구성 요소가 아래에 설명된다.
공여자(Donor) 핵산
공여자 핵산 (또는 "공여자 서열" 또는 "공여자 폴리뉴클레오티드" 또는 "공여자 DNA")은 RNA-지향 엔도뉴클레아제 (예를 들어, Cas9 폴리펩티드 또는 Cpf1 폴리펩티드)에 의해 유도된 절단 부위에 삽입되는 핵산 서열이다. 공여자 폴리뉴클레오티드는 절단 부위에서 표적 게놈 서열에 대해 충분한 상동성, 예를 들어 절단 부위 옆에있는 뉴클레오티드 서열과의 70 %, 80 %, 85 %, 90 %, 95 %, 또는 100 % 상동성을 포함할 것이며, 절단 부위의 염기와 예를 들어 약 30 개 염기 이내, 약 15 개 염기 이내, 약 10 개 염기 이내, 약 5 개 염기 이내, 또는 절단 부위 바로 옆에 위치하여 그것과, 상동성을 갖는 게놈 서열 사이의 상동성-지향성 복구를 지원한다. 공여자와 게놈 서열 사이의 약 25 개, 50 개, 100 개, 또는 200 개 뉴클레오티드, 또는 200 개 이상 (또는 10 개 내지 200 개 뉴클레오티드 이상의 임의의 정수값)의 뉴클레오티드의 서열 상동성은 상동성-지향성 복구를 지원한다. 공여자 서열은 임의의 길이, 예를 들어 10 뉴클레오티드 이상, 50 뉴클레오티드 이상, 100 뉴클레오티드 이상, 250 뉴클레오티드 이상, 500 뉴클레오티드 이상, 1000 뉴클레오티드 이상, 5000 뉴클레오티드 이상 등일 수 있다.
공여자 서열은 일반적으로 그것이 대체하는 게놈 서열과 동일하지 않다. 오히려, 공여자 서열은 상동성-지향성 복구를 지원하기에 충분한 상동성이 존재하는 한 게놈 서열과 관련하여 하나 이상의 단일 염기 변경, 삽입, 결실, 반전 또는 재배열을 포함할 수 있다. 일부 구체예에서, 공여자 서열은 표적 DNA 영역과 2 개의 측면 서열 사이의 상동성-지향성 복구가 표적 영역에서 비-상동성 서열의 삽입을 초래하도록 2 개의 상동성 영역이 측면에 있는 비-상동성 서열을 포함한다. 공여자 서열은 또한 관심 DNA 영역과 상동성이 없고 관심 DNA 영역으로의 삽입을 의도하지 않는 서열을 포함하는 벡터 주골격을 포함할 수 있다. 일반적으로, 공여자 서열의 상동성 영역 (들)은 재조합이 요망되는 게놈 서열에 대해 적어도 50 % 서열 동일성을 가질 것이다. 특정 구체예에서, 60 %, 70 %, 80 %, 90 %, 95 %, 98 %, 99 %, 또는 99.9 % 서열 동일성이 존재한다. 공여자 폴리뉴클레오티드의 길이에 따라 1 % 내지 100 % 서열 동일성 사이의 임의의 값이 존재할 수 있다.
공여자 서열은 게놈 서열과 비교하여 특정 서열 차이, 예를 들어 제한 부위, 뉴클레오티드 다형성, 선택 가능한 마커 (예를 들어, 약물 내성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이는 절단 부위에 공여자 서열의 삽입이 성공적인지 평가하는 데 사용될 수 있고 또는 일부 구체예에서 다른 목적을 위해(예를 들어, 표적화된 게놈 유전자좌에서의 발현을 의미하기 위해) 사용될 수 있다. 일부 구체예에서, 코딩 영역에 위치하는 경우, 이러한 뉴클레오티드 서열 차이는 아미노산 서열을 변경하지 않거나 침묵 아미노산 변경 (즉, 단백질의 구조 또는 기능에 영향을 미치지 않는 변경)을 만들 것이다. 대안적으로, 이러한 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 FLP, loxP 서열 등과 같은 측면 재조합 서열을 포함할 수 있다.
공여자 서열은 단일 가닥 DNA, 단일 가닥 RNA, 이중 가닥 DNA, 또는 이중 가닥 RNA로서 세포에 제공될 수 있다. 선형 또는 원형 형태로 세포에 도입될 수 있다. 선형 형태로 도입되는 경우, 공여자 서열의 말단은 통상의 기술자에게 공지된 방법에 의해 (예를 들어, 핵산말단분해적인 분해(exonucleolytic degradation)로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 추가되고 /되거나 자기 상보성 올리고 뉴클레오티드가 한쪽 또는 양쪽 말단에 라이게이션된다. 예를 들어, Chang et al. (1987)proc. Natl. Acad Sci USA 84: 4959-4963; Nehls et al. (1996)science272: 886-889 참조. 롤링 서클 증폭과 같은 증폭 절차도 본 명세서에서 예시된 바와 같이 유리하게 사용될 수 있다. 외인성 폴리뉴클레오티드를 분해로부터 보호하기 위한 추가적인 방법은 말단 아미노기 (들)의 첨가 및 예를 들어 포스포로티오에이트, 포스포라미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 개질된 뉴클레오티드 간 연결의 사용을 포함하지만 이에 제한되지는 않는다.
선형 공여자 서열의 말단을 보호하는 대안으로서, 재조합에 영향을 주지 않고 분해될 수 있는 상동성 영역 외부에 추가적인 길이의 서열이 포함될 수 있다. 공여자 서열은 예를 들어 복제 원점, 프로모터 및 항생제 내성을 코딩하는 유전자와 같은 추가 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여자 서열은 네이키드 핵산으로서, 리포솜 또는 폴리머와 같은 제제와 복합된 핵산으로서 도입될 수 있거나 또는 바이러스 (예를 들어, 아데노바이러스, AAV)에 의해 전달될 수 있는데, 이는 Cas9 가이드 RNA 및/또는 Cas9 융합 폴리펩티드 및/또는 공여자 폴리뉴클레오티드를 코딩하는 핵산에 대해 본 명세서에 기재된 바와 같다.
가이드 핵산
일부 구체예에서, 조성물은 가이드 핵산을 포함한다. 본 개시 내용의 조성물에 포함시키기에 적합한 가이드 핵산은 단일 분자 가이드 RNA ("단일 가이드 RNA"/"sgRNA") 및 이중 분자 가이드 핵산 ("이중-가이드 RNA"/"dgRNA")을 포함한다.
본 개시 내용의 복합체에 포함시키기에 적합한 가이드 핵산 (예를 들어, 가이드 RNA)은 RNA-가이드된 엔도뉴클레아제 (예를 들어, Cas9 또는 Cpf1 폴리펩티드)의 활성을 표적 핵산 내의 특정 표적 서열로 안내한다. 가이드 핵산 (예를 들어, 가이드 RNA)은 다음을 포함한다: 제 1 세그먼트 (본 명세서에서 "핵산 표적화 세그먼트" 또는 단순히 "표적화 세그먼트"라고도 지칭됨); 및 제 2 세그먼트 (본 명세서에서 "단백질-결합 세그먼트"라고도 함). 용어 "제 1" 및 "제 2"는 가이드 RNA에서 세그먼트가 발생하는 순서를 의미하지 않는다. 서로에 대한 요소의 순서는 사용되는 특정 RNA-가이드된 폴리펩티드에 따라 다르다. 예를 들어, Cas9에 대한 가이드 RNA는 일반적으로 표적화 세그먼트의 3'에 위치한 단백질-결합 세그먼트를 갖는 반면, Cpf1에 대한 가이드 RNA는 일반적으로 표적화 세그먼트의 5' 에 위치한 단백질-결합 세그먼트를 갖는다.
가이드 RNA는 선형 또는 원형 형태로 세포에 도입될 수 있다. 선형 형태로 도입되는 경우, 가이드 RNA의 말단은 통상의 기술자에게 공지된 방법에 의해 (예를 들어, 핵산말단분해적인 분해로부터) 보호될 수 있다. 롤링 서클 증폭과 같은 증폭 절차도 본 명세서에서 예시된 바와 같이 유리하게 사용될 수 있다.
제 1 세그먼트: 표적화 세그먼트
가이드 핵산의 제 1 세그먼트 (예를 들어, 가이드 RNA)는 표적 핵산의 서열 (표적 부위)에 상보적인 뉴클레오티드 서열을 포함한다. 다시 말하여, 가이드 핵산 (예를 들어, 가이드 RNA)의 표적화 세그먼트는 혼성화(즉 염기 짝짓기)를 통해 서열 특이적 방식으로 표적 핵산 (예를 들어, RNA, DNA, 이중 가닥 DNA)과 상호 작용할 수 있다. 이와 같이, 표적화 세그먼트의 뉴클레오티드 서열은 다양할 수 있고 가이드 핵산 (예를 들어, 가이드 RNA) 및 표적 핵산이 상호 작용할 표적 핵산 내의 위치를 결정할 수 있다. 가이드 핵산 (예를 들어, 가이드 RNA)의 표적화 세그먼트는 (예를 들어, 유전 공학에 의해) 개질되어 표적 핵산 내의 임의의 원하는 서열 (표적 부위)에 혼성화될 수 있다.
표적화 세그먼트는 12 개 뉴클레오티드 내지 100 개 뉴클레오티드의 길이를 가질 수 있다. 표적 핵산의 뉴클레오티드 서열 (표적 부위)에 상보적인 표적화 세그먼트의 뉴클레오티드 서열 (표적화 서열, 가이드 서열이라고도 함)은 12 nt 이상의 길이를 가질 수 있다. 예를 들어, 표적 핵산의 표적 부위에 상보적인 표적화 세그먼트의 표적화 서열은 12 nt 이상, 15 nt 이상, 17 nt 이상, 18 nt 이상, 19 nt 또는 이상, 20 nt 이상, 25 nt 이상, 30 nt 이상, 35 nt 이상 또는 40 nt의 길이를 가질 수 있다.
표적화 세그먼트의 표적화 서열 (즉, 가이드 서열)과 표적 핵산의 표적 부위 간의 상보성 백분율은 60 % 이상 (예를 들어, 65 % 이상, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 97 % 이상, 98 % 이상, 99 % 이상, 또는 100 %)일 수 있다. 일부 구체예에서, 표적화 세그먼트의 표적화 서열과 표적 핵산의 표적 부위 사이의 상보성 백분율은 표적 핵산의 표적 부위의 7 개의 인접한 5'-최다 뉴클레오티드에 걸쳐 100 %이다. 일부 구체예에서, 표적화 세그먼트의 표적화 서열과 표적 핵산의 표적 부위 사이의 상보성 백분율은 20 개의 연속 뉴클레오티드에 걸쳐 60 % 이상이다. 일부 구체예에서, 표적화 세그먼트의 표적화 서열과 표적 핵산의 표적 부위 사이의 상보성 백분율은 표적 핵산의 표적 부위의 17 개, 18 개, 19 개 또는 20 개의 인접한 5'-최다 뉴클레오티드에 걸쳐 100 %이며 나머지에 대해서는 0 % 이상으로 낮다. 이러한 경우, 표적화 서열은 각각 길이가 17, 18, 19 또는 20 뉴클레오티드로 간주될 수 있다.
제 2 세그먼트: 단백질-결합 세그먼트
가이드 핵산 (예를 들어, 가이드 RNA)의 단백질-결합 세그먼트는 RNA-가이드된 엔도뉴클레아제와 상호작용(결합)한다. 가이드 핵산 (예를 들어, 가이드 RNA)은 결합된 엔도뉴클레아제를 상기 언급된 표적화 세그먼트/표적화 서열/가이드 서열을 통해 표적 핵산 (표적 부위) 내의 특정 뉴클레오티드 서열로 안내한다. 가이드 핵산 (예를 들어, 가이드 RNA)의 단백질-결합 세그먼트는 서로 상보적인 두 개의 뉴클레오티드의 스트레치를 포함한다. 단백질-결합 세그먼트의 상보적 뉴클레오티드는 혼성화하여 이중 가닥의 RNA 이중나선 (dsRNA)를 형성한다.
단일 및 이중 가이드 핵산
이중 가이드 핵산 (예를 들어, 가이드 RNA)은 두 개의 개별 핵산 분자를 포함한다. 개체 이중 가이드 핵산 (예를 들어, 가이드 RNA)의 두 분자 각각은 두 분자의 상보적 뉴클레오티드가 혼성화하여 단백질-결합 세그멘트의 이중 가닥 RNA 이중체를 형성하도록 서로 상보적인 뉴클레오티드의 스트레치를 포함한다.
일부 구체예에서, 활성자의 이중체-형성 세그먼트는 국제 특허 출원 번호 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물과 8 개 이상의 연속 뉴클레오티드 (예를 들어, 8 개 이상의 연속 뉴클레오티드, 10 개 이상의 연속 뉴클레오티드, 12 개 이상의 연속 뉴클레오티드, 15 개 이상의 연속 뉴클레오티드, 또는 20 개 이상의 연속 뉴클레오티드)에 걸쳐 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상 동일하거나 100 % 동일하다.
일부 구체예에서, 표적자의 이중형성-세그먼트는 국제 특허 출원 번호 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물과 8 개 이상의 연속 뉴클레오티드 (예를 들어, 8 개 이상의 연속 뉴클레오티드, 10 개 이상의 연속 뉴클레오티드, 12 개 이상의 연속 뉴클레오티드, 15 개 이상의 연속 뉴클레오티드, 또는 20 개 이상의 연속 뉴클레오티드)에 걸쳐 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상 동일하거나 100 % 동일하다..
이중 가이드 핵산 (예를 들어, 가이드 RNA)은 활성자에 대해 표적자의 제어된 (즉, 조건부) 결합을 허용하도록 설계될 수 있다. 이중 가이드 핵산 (예를 들어, 가이드 RNA)은 활성자와 표적자가 모두 Cas9와 기능적 복합체로 결합되지 않는 한 기능적이지 않기 때문에 이중 가이드 핵산 (예를 들어, 가이드 RNA)은 활성제와 표적자 사이의 결합을 유도가능하게 함으로써 유도가능할 수 있다 (예를 들어, 약물 유도성 ). 하나의 비제한적인 예로서, RNA 압타머는 표적자와 활성자의 결합을 조절 (즉, 제어)하기 위해 사용될 수 있다. 따라서, 활성자 및/또는 표적자는 RNA 압타머 서열을 포함할 수 있다.
압타머 (예를 들어, RNA 압타머)는 관련 업계에 공지되어 있으며 일반적으로 리보 스위치의 합성 버전이다. 용어 "RNA 압타머" 및 "리보 스위치"는 자기들이 그 일부인 핵산 분자 (예를 들어, RNA, DNA/RNA 하이브리드 등)의 구조 (및 따라서 특이적 서열의 이용 가능성)의 유도성 조절을 제공하는 합성 및 천연 핵산 서열을 모두 포함하기 위해 본 명세서에서 상호 교환적으로 사용된다. RNA 압타머는 일반적으로 특정 약물 (예를 들어, 소분자)에 특이적으로 결합하는 특정 구조 (예를 들어, 헤어핀)로 접히는 서열을 포함한다. 약물의 결합은 RNA의 접힘에 구조적 변화를 일으켜 압타머가 일부인 핵산의 특징을 변화시킨다. 비제한적인 예로서: (i) 압타머를 갖는 활성자는 압타머가 적절한 약물에 의해 결합되지 않는 한 동족 표적자에 결합 못할 수 있다; (ii) 압타머가 있는 표적자는 압타머가 적절한 약물에 의해 결합되지 않는 한 동족 활성자에 결합 못할 수 있다. 및 (iii) 다른 약물에 결합하는 다른 압타머를 각각 포함하는 표적자 및 활성자는 두 약물이 모두 존재하지 않는 한 서로 결합하지 못할 수 있다. 이들 실시예에 의해 예시된 바와 같이, 이중 가이드 핵산 (예를 들어, 가이드 RNA)은 유도 가능하도록 설계될 수 있다.
압타머 및 리보스위치의 예는 예를 들어 Nakamura et al., Genes Cells. 2012 May;17(5):344-64; Vavalle et al., Future Cardiol. 2012 May;8(3):371-82; Citartan et al., Biosens Bioelectron. 2012 Apr 15;34(1):1-11; and Liberman et al., Wiley Interdiscip Rev RNA. 2012 May-Jun;3(3):369-84에서 찾을 수 있는데 이들 모두는 그 전체가 본 명세서에 참조로서 포함된다.
이중 가이드 핵산 (예를 들어, 가이드 RNA)에 포함될 수 있는 뉴클레오티드 서열의 비제한적인 예는 국제 특허 출원 번호 PCT/US2016/052690 및 PCT/US2017/062617, 또는 혼성화하여 단백질-결합 세그먼트를 형성 할 수 있는 이들의 부가물에 포함되어 있다.
개체 단일 가이드 핵산 (예를 들어, 가이드 RNA)은 서로 상보적인 2 개의 뉴클레오티드 스트레치 (이중 가이드 핵산의 "표적자" 및 "활성자"와 매우 유사함)를 포함하고, 혼성화하여 단백질-결합 세그먼트의 이중 가닥 RNA 이중체 (dsRNA 이중체)을 형성하고(따라서 스템-루프 구조를 생성함), 개재 뉴클레오티드 ("링커" 또는 "링커 뉴클레오티드")에 의해 공유적으로 연결된다. 따라서, 개체 단일 가이드 핵산 (예를 들어, 단일 가이드 RNA)은 표적자 및 활성자를 포함할 수 있으며, 이들 각각은 이중체-형성 세그먼트를 가지며, 여기서 표적자 및 활성자의 이중체-형성 세그먼트는 서로 혼성화하여 dsRNA 이중체를 형성한다. 표적자와 활성자는 표적자의 3' 말단과 활성자의 5' 말단을 통해 공유적으로 연결될 수 있다. 대안적으로, 표적자와 활성자는 표적자의 5' 말단 및 활성자의 3' 말단을 통해 공유적으로 연결될 수 있다.
단일 가이드 핵산의 링커는 3 개 뉴클레오티드 내지 100 개 뉴클레오티드의 길이를 가질 수 있다. 일부 구체예에서, 단일 가이드 핵산 (예를 들어, 가이드 RNA)의 링커는 4 nt이다.
예시적인 단일 가이드 핵산 (예를 들어, 가이드 RNA)은 dsRNA 이중체를 형성하기 위해 혼성화하는 2 개의 상보적 뉴클레오티드 스트레치를 포함한다. 일부 구체예에서, 단일 가이드 핵산 (예를 들어, 가이드 RNA) (또는 스트레치를 코딩하는 DNA)의 뉴클레오티드의 2 개의 상보적 스트레치 중 하나는 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 활성자(트레이서 RNA) 분자 중 하나와 8 개 이상의 인접한 뉴클레오티드 (예를 들어, 8 개 이상의 인접한 뉴클레오티드, 10 개 이상의 인접한 뉴클레오티드, 12 개 이상의 인접한 뉴클레오티드, 15 개 이상의 인접한 뉴클레오티드, 또는 20 개 이상의 인접한 뉴클레오티드)에 걸쳐 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상 동일하거나 100 % 동일하다.
일부 구체예에서, 단일 가이드 핵산 (예를 들어, 가이드 RNA) (또는 스트레치를 코딩하는 DNA)의 뉴클레오티드의 2 개의 상보적 스트레치 중 하나는 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 표적자 (crRNA) 서열 중 하나와 8 개 이상의 인접한 뉴클레오티드 (예를 들어, 8 개 이상의 인접한 뉴클레오티드, 10 개 이상의 인접한 뉴클레오티드, 12 개 이상의 인접한 뉴클레오티드, 15 개 이상의 인접한 뉴클레오티드, 또는 20 개 이상의 인접한 뉴클레오티드)에 걸쳐 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상 동일하거나 100 % 동일하다.
일부 구체예에서, 단일 가이드 핵산 (예를 들어, 가이드 RNA) (또는 스트레치를 코딩하는 DNA)의 뉴클레오티드의 2 개의 상보적 스트레치 중 하나는 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 표적자 (crRNA) 서열 또는 활성자 (트레이서 RNA) 서열 중 하나와 8 개 이상의 인접한 뉴클레오티드 (예를 들어, 8 개 이상의 인접한 뉴클레오티드, 10 개 이상의 인접한 뉴클레오티드, 12 개 이상의 인접한 뉴클레오티드, 15 개 이상의 인접한 뉴클레오티드, 또는 20 개 이상의 인접한 뉴클레오티드)에 걸쳐 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상 동일하거나 100 % 동일하다.
표적자 및 활성자의 적절한 동족 쌍(cognate pairs)은 종 이름 및 염기 쌍 (단백질-결합 도메인의 dsRNA 이중체의 경우)을 고려하여 일상적으로 결정될 수 있다. 어떠한 활성자/표적자 쌍이라도 이중 가이드 핵산(예를 들어, 가이드 RNA)의 일부로서 또는 단일 가이드 핵산(예를 들어, 가이드 RNA)의 일부로서 사용될 수 있다.
일부 구체예에서, 이중 가이드 핵산 (예를 들어, 가이드 RNA) (예를 들어, 이중 가이드 RNA) 또는 단일 가이드 핵산 (예를 들어, 가이드 핵산) (예를 들어, 단일 가이드 RNA)의 활성자 (예를 들어, trRNA, trRNA-유사 분자 등)는 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 활성자 (tracrRNA) 분자와 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상, 또는 100 % 서열 동일성을 갖는 뉴클레오티드 스트레치를 포함한다.
일부 구체예에서, 이중 가이드 핵산 (예를 들어, 이중 가이드 RNA) 또는 단일 가이드 핵산 (예를 들어, 단일 가이드 RNA)의 활성자 (예를 들어, trRNA, trRNA-유사 분자 등)는 30 개 이상의 뉴클레오티드 (nt) (예를 들어, 40 개 이상, 50 개 이상, 60 개 이상, 70 개 이상, 75 개 이상의 nt)를 포함한다. 일부 구체예에서, 이중 가이드 핵산 (예를 들어, 이중 가이드 RNA) 또는 단일 가이드 핵산 (예를 들어, 단일 가이드 RNA)의 활성자 (예를 들어, trRNA, trRNA-유사 분자 등)는 30 내지 200 개 뉴클레오티드 (nt) 범위의 길이를 갖는다.
단백질-결합 세그먼트는 10 개 뉴클레오티드 내지 100 개 뉴클레오티드의 길이를 가질 수 있다.
또한 개체 단일 가이드 핵산 (예를 들어, 단일 가이드 RNA) 및 개체 이중 가이드 핵산 (예를 들어, 이중 가이드 RNA) 둘 다와 관련하여, 단백질-결합 세그먼트의 dsRNA 이중체는 6 염기쌍(bp) 내지 50bp 의 길이를 가질 수 있다. 단백질-결합 세그먼트의 dsRNA 이중체를 형성하기 위해 혼성화하는 뉴클레오티드 서열 간의 상보성 백분율은 60 % 이상일 수 있다. 예를 들어, 혼성화하여 단백질-결합 세그먼트의 dsRNA 이중체를 형성하는 뉴클레오티드 서열 간의 상보성 백분율은 65 % 이상, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 98 % 이상 또는 99 % 이상일 수 있으며, 예를 들어, 일부 구체예에서, 혼성화하지 않고 따라서 dsRNA 이중체 내에 돌출부를 생성하는 일부 뉴클레오티드가 있다. 일부 구체예에서, 단백질-결합 세그먼트의 dsRNA 이중체를 형성하기 위해 혼성화하는 뉴클레오티드 서열 사이의 상보성 백분율은 100 %이다.]
하이브리드 가이드 핵산
일부 구체예에서, 가이드 핵산은 2 개의 RNA 분자 (이중 가이드 RNA)이다. 일부 구체예에서, 가이드 핵산은 하나의 RNA 분자 (단일 가이드 RNA)이다. 일부 구체예에서, 가이드 핵산은 DNA/RNA 하이브리드 분자이다. 이러한 구체예에서, 가이드 핵산의 단백질-결합 세그먼트는 RNA이고 RNA 이중체를 형성한다. 따라서 활성자와 표적자의 이중체-형성 세그먼트는 RNA이다. 그러나 가이드 핵산의 표적화 세그먼트는 DNA 일 수 있다. 따라서, DNA/RNA 하이브리드 가이드 핵산이 이중 가이드 핵산 인 경우, "표적자" 분자는 하이브리드 분자 일 수 있다 (예를 들어, 표적화 세그먼트는 DNA일 수 있고 이중체-형성 세그먼트는 RNA일 수 있음). 이러한 구체예에서, (예를 들어, 표적 분자의 이중체-형성 세그먼트와 함께 RNA-이중체를 형성하기 위해) "활성자" 분자의 이중체-형성 세그먼트는 RNA일 수 있는 반면, 이중체-형성 세그먼트의 외부에 있는 "활성자" 분자의 뉴클레오티드는 DNA (이 경우 활성자 분자가 하이브리드 DNA/RNA 분자임)이거나 RNA (이 경우 활성자 분자가 RNA임)일 수 있다. DNA/RNA 하이브리드 가이드 핵산이 단일 가이드 핵산인 경우, 표적 세그먼트는 DNA일 수 있고, 이중체-형성 세그먼트 (단일 가이드 핵산의 단백질-결합 세그먼트를 구성)는 RNA일 수 있으며, 표적화 및 이중체-형성 세그먼트 외부의 뉴클레오티드는 RNA 또는 DNA일 수 있다.
DNA/RNA 하이브리드 가이드 핵산은 일부 구체예에서 유용할 수 있는데 예를 들어 표적 핵산이 RNA 인 경우이다. Cas9은 통상 표적 DNA와 혼성화하는 가이드 RNA와 결합하여 표적 부위에서 DNA-RNA 이중체를 형성한다. 따라서 표적 핵산이 RNA 인 경우, RNA 대신 DNA 인 (가이드 핵산의) 표적화 세그먼트를 이용하여 표적 부위에서 DNA-RNA 이중체를 개괄하는 것이 때때로 유리하다. 그러나 가이드 핵산의 단백질-결합 세그먼트는 RNA-이중체이기 때문에 표적자 분자는 표적화 세그먼트에서는 DNA이고 이중체-형성 세그먼트에서는 RNA이다. 하이브리드 가이드 핵산은 이중 가닥 표적 핵산에 비해 단일 가닥 표적 핵산에 Cas9 결합을 편향시킬 수 있다.
예시적인 가이드 핵산
임의의 가이드 핵산을 사용할 수 있다. 많은 상이한 유형의 가이드 핵산이 관련 업계에 공지되어있다. 선택된 가이드 핵산은 사용되는 특정 CRISPR 시스템에 적절하게 쌍을 이룬다(예를 들어, 특정 RNA 가이드된 엔도뉴클레아제가 사용됨). 따라서, 가이드 핵산은 예를 들어 본 명세서에 기술되거나 관련 업계에 공지된 임의의 RNA 가이드된 엔도뉴클레아제에 상응하는 가이드 핵산일 수 있다. 가이드 핵산 및 RNA 가이드된 엔도뉴클레아제는 예를 들어 국제 특허 출원 번호 PCT/US2016/052690 및 PCT/US2017/062617에 기재되어 있다.
일부 구체예에서, 적합한 가이드 핵산은 2 개의 개별 RNA 폴리뉴클레오티드 분자를 포함한다. 일부 구체예에서, 2 개의 분리된 RNA 폴리뉴클레오티드 분자 중 제 1 (활성자)은 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 뉴클레오티드 서열 중 어느 하나와 8 개 이상의 인접한 뉴클레오티드 (예를 들어, 8 개 이상의 인접한 뉴클레오티드, 10 개 이상의 인접한 뉴클레오티드, 12 개 이상의 인접한 뉴클레오티드, 15 개 이상의 인접한 뉴클레오티드, 또는 20 개 이상의 인접한 뉴클레오티드)에 걸쳐 60 % 이상(예를들어, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상, 또는 100 %) 뉴클레오티드 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 일부 구체예에서, 2 개의 분리된 RNA 폴리뉴클레오티드 분자 중 제 2 (표적자)는 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 뉴클레오티드 서열 중 어느 하나와 8 개 이상의 인접한 뉴클레오티드 (예를 들어, 8 개 이상의 인접한 뉴클레오티드, 10 개 이상의 인접한 뉴클레오티드, 12 개 이상의 인접한 뉴클레오티드, 15 개 이상의 인접한 뉴클레오티드, 또는 20 개 이상의 인접한 뉴클레오티드)에 걸쳐 60 % 이상(예를들어, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상, 또는 100 %) 뉴클레오티드 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구체예에서, 적합한 가이드 핵산은 단일 RNA 폴리뉴클레오티드이고 PCT/US2016/052690 및 PCT/US2017/062617, 또는 이의 부가물에 개시되어 있는 뉴클레오티드 서열 중 어느 하나와 8 개 이상의 인접한 뉴클레오티드 (예를 들어, 8 개 이상의 인접한 뉴클레오티드, 10 개 이상의 인접한 뉴클레오티드, 12 개 이상의 인접한 뉴클레오티드, 15 개 이상의 인접한 뉴클레오티드, 또는 20 개 이상의 인접한 뉴클레오티드)에 걸쳐 60 % 이상(예를들어, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % 이상, 또는 100 %) 뉴클레오티드 서열 동일성을 갖는 제 1 및 제 2 뉴클레오티드 서열을 포함한다.
일부 구체예에서, 가이드 RNA는 Cpf1 및/또는 Cas9 가이드 RNA이다. Cpf1 및/또는 Cas9 가이드 RNA는 30 개 뉴클레오티드(nt) 내지 100 nt, 예를 들어 30 nt 내지 40 nt, 40 nt내지 45 nt, 45 nt내지 50 nt, 50 nt 내지 60 nt, 60 nt내지 70 nt, 70 nt내지 80 nt, 80 nt내지 90 nt, 또는 90 nt내지 100 nt의 총 길이를 가질 수 있다. 일부 구체예에서, Cpf1 및/또는 Cas9 가이드 RNA는 35 nt, 36 nt, 37 nt, 38 nt, 39 nt, 40 nt, 41 nt, 42 nt, 43 nt, 44 nt, 45 nt, 46 nt, 47 nt, 48 nt, 49 nt, 또는 50 nt 의 총 길이를 가질 수 있다. Cpf1 및/또는 Cas9 가이드 RNA는 표적 핵산-결합 세그먼트 및 이중체-형성 세그먼트를 포함할 수 있다.
Cpf1 및/또는 Cas9 가이드 RNA의 표적 핵산 결합 세그먼트는 15 nt 내지 30 nt, 예를 들어 15 nt, 16 nt, 17 nt, 18 nt, 19 nt, 20 nt, 21 nt의 길이를 가질 수 있다. , 22 nt, 23 nt, 24 nt, 25 nt, 26 nt, 27 nt, 28 nt, 29 nt, 또는 30 nt의 길이를 가질 수 있다. 일부 구체예에서, 표적 핵산-결합 세그먼트는 23 nt의 길이를 갖는다. 일부 구체예에서, 표적 핵산-결합 세그먼트는 24 nt의 길이를 갖는다. 일부 구체예에서, 표적 핵산-결합 세그먼트는 25 nt의 길이를 갖는다.
Cpf1 및/또는 Cas9 가이드 RNA의 표적 핵산-결합 세그먼트는 상응하는 길이의 표적 핵산 서열과 100 % 상보성을 가질 수 있다. 표적화 세그먼트는 상응하는 길이의 표적 핵산 서열과 100 % 미만의 상보성을 가질 수 있다. 예를 들어, Cpf1 및/또는 Cas9 가이드 RNA의 표적 핵산 결합 세그먼트는 표적 핵산 서열에 상보적이 지 않은 1, 2, 3, 4, 또는 5 개의 뉴클레오티드를 가질 수 있다. 예를 들어, 표적 핵산-결합 세그먼트가 25 개의 뉴클레오티드 길이를 갖고, 표적 핵산 서열이 25 개의 뉴클레오티드 길이를 갖는 일부 구체예에서, 일부 구체예에서는 표적 핵산-결합 세그먼트는 표적 핵산 서열에 100 % 상보성을 갖는다.. 또 다른 예로서, 표적 핵산-결합 세그먼트가 25 개 뉴클레오티드의 길이를 갖고 표적 핵산 서열이 25 개 뉴클레오티드의 길이를 갖는 일부 구체예에서, 일부 구체예에서 표적 핵산-결합 세그먼트는 표적 핵산 서열과 1 개의 비-상보적 뉴클레오티드 및 24개의 상보적 뉴클레오티드를 갖는다.
Cpf1 및/또는 Cas9 가이드 RNA의 이중체-형성 세그먼트는 15 nt내지 25 nt, 예를 들어 15 nt, 16 nt, 17 nt, 18 nt, 19 nt, 20 nt, 21 nt, 22 nt, 23 nt, 24 nt, 또는 25 nt 의 길이를 가질 수 있다..
일부 구체예에서, Cpf1 가이드 RNA의 이중체-형성 세그먼트는 뉴클레오티드 서열 5'-AAUUUCUACUGUUGUAGAU-3'를 포함할 수 있다.
추가적인 요소
일부 구체예에서, 가이드 핵산 (예를 들어, 가이드 RNA)은 추가적인 하나의 세그먼트 또는 세그먼트들 (일부 구체예에서 5' 말단, 일부 구체예에서 3' 말단, 일부 구체예에서 5' 또는 3' 말단, 일부 실시예에서는 서열 내에 묻혀있고(즉, 5' 및/또는 3' 말단이 아님), 일부 실시예에서는 5' 말단과 3' 말단 모두에, 일부 실시예에서는 5' 말단 및/또는 3' 말단에 묻혀있는 등)을 포함한다. 예를 들어, 적합한 추가적인 세그먼트는 5'캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화된 꼬리 (즉, 3' 폴리 (A) 꼬리); 리보자임 서열 (예를 들어, 가이드 핵산 또는 가이드 핵산의 성분, 예를 들어 표적자, 활성자 등의 자가 절단을 허용하기 위해); 리보스위치 서열 (예를 들어, 조절 된 안정성 및/또는 단백질 및 단백질 복합체에 의한 조절된 접근성을 허용하기 위해); dsRNA 이중체(즉, 헤어핀)를 형성하는 서열; RNA를 세포하위의 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적하는 서열; 추적을 제공하는 개질 또는 서열 (예를 들어, 형광 분자 (예를 들어, 형광 염료)와 같은 표지, 형광 검출을 용이하게하는 서열 또는 기타 모이어티, 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸기전이효소, DNA 탈메틸화 효소, 히스톤 아세틸기 전이효소, 히스톤 탈아세틸화 효소, RNA에 결합하는 단백질 (예를 들어, RNA 압타머), 표지된 단백질, 형광표지된 단백질 등)에 대한 결합 부위를 제공하는 서열), 증가된, 감소된 및/또는 제어가능한 안정성을 제공하는 개질 또는 서열, 및 이들의 조합을 포함할 수 있다.
RNA-가이드된 엔도뉴클레아제
가이드 핵산에 추가하여 또는 대신에, 조성물은 RNA-가이드된 엔도뉴클레아제 단백질 또는 이를 코딩하는 핵산 (예를 들어, mRNA 또는 벡터)을 포함할 수 있다. 어떠한 RNA-가이드된 엔도뉴클레아제라도 사용할 수 있다. 사용되는 RNA-가이드된 엔도뉴클레아제의 선택은 사용되는 CRISPR 시스템의 의도 된 최종 용도에 적어도 부분적으로 의존적일 것이다.
일부 구체예에서, 폴리펩티드는 Cas 9 폴리펩티드이다. 본 개시 내용의 조성물에 포함시키기에 적합한 Cas9 폴리펩티드는 자연적으로 발생하는 Cas9 폴리펩티드 (예를 들어, 박테리아 및/또는 고세균 세포에서 자연적으로 발생함), 또는 비-자연적으로 발생하는 Cas9 폴리펩티드 (예를 들어, Cas9 폴리펩티드는 변이체 Cas9 폴리펩티드, 아래에서 논의되는 키메라 폴리펩티드 등)를 포함하는데 하기하는 바와 같다. 일부 구체예에서, 통상의 기술자는 본 명세서에 개시된 Cas9 폴리펩티드가 임의의 공급원으로부터 유래되거나 단리된 임의의 변이체일 수 있음을 이해할 수 있다. 다른 구체예에서, 본 개시 내용의 Cas9 펩티드는 문헌에 기재된 돌연변이 중 하나 이상을 포함할 수 있으며, 다음 문헌에 기재된 기능적 돌연변이를 포함하나 이에 제한되지는 않으며: Fonfara et al. Nucleic Acids Res. 2014 Feb;42(4):2577-90; Nishimasu H. et al. Cell. 2014 Feb 27;156(5):935-49; Jinek M. et al. Science. 2012 337:816-21; and Jinek M. et al. Science. 2014 Mar 14;343(6176); see also U.S. Pat. App. No. 13/842,859, filed March 15, 2013, which is hereby incorporated by reference; further, see U.S. Pat. Nos. 8,697,359; 8,771,945; 8,795,965; 8,865,406; 8,871,445; 8,889,356; 8,895,308; 8,906,616; 8,932,814; 8,945,839; 8,993,233; and 8,999,641, 이는 모두 본 명세서에 참조로 포함된다. 따라서, 일부 구체예에서, 본 명세서에 개시된 시스템 및 방법은 이중 가닥 뉴클레아제 활성을 갖는 야생형 Cas9 단백질, 단일 가닥 닉카제로서 작용하는 Cas9 돌연변이체, 또는 개질된 뉴클레아제 활성을 갖는 다른 돌연변이체와 함께 사용될 수 있다. 이와 같이, 본 개시 내용의 조성물에 포함시키기에 적합한 Cas9 폴리펩티드는 효소적으로 활성인 Cas9 폴리펩티드일 수 있으며, 예를 들어 표적 핵산에서 단일- 또는 이중-가닥 절단을 만들 수 있거나, 대안적으로는 야생형 Cas9 폴리펩티드에 비하여 감소된 효소 활성을 가질 수 있다.
자연적으로 발생하는 Cas9 폴리펩티드는 가이드 핵산에 결합하여 표적 핵산 (표적 부위) 내의 특이적 서열로 유도되고, 표적 핵산을 절단한다 (예를 들어, 이중 가닥 절단 생성을 위한 dsDNA 절단, ssDNA 절단, ssRNA 절단 등). 개체 Cas9 폴리펩티드는 RNA-결합 부분과 활성 부분의 두 부분을 포함한다. RNA-결합 부분은 개체 가이드 핵산과 상호 작용하고, 활성 부분은 부위-지정(site-directed) 효소 활성 (예를 들어, 뉴클레아제 활성, DNA 및/또는 RNA 메틸화 활성, DNA 및/또는 RNA 절단 활성, 히스톤 아세틸화 활성, 히스톤 메틸화 활성, RNA 개질 활성, RNA-결합 활성, RNA 스플라이싱 활성 등)을 나타낸다. 일부 구체예에서 활성 부분은 야생형 Cas9 폴리펩티드의 상응하는 부분에 비해 감소된 뉴클레아제 활성을 나타낸다. 일부 구체예에서, 활성 부분은 효소적으로 불활성이다.
단백질에 개체 가이드 핵산과 상호 작용하는 RNA-결합 부분이 있는지를 결정하는 분석은 단백질과 핵산 사이의 결합을 테스트하는 어떠한 편리한 결합 분석이라도 될 수 있다. 예시적인 결합 분석은 가이드 핵산 및 Cas9 폴리펩티드를 표적 핵산에 첨가하는 것을 포함하는 결합 분석 (예를 들어, 겔 이동 분석)을 포함한다.
단백질이 활성 부분을 갖는지 여부를 결정하기 위한 (예를 들어, 폴리펩티드가 표적 핵산을 절단하는 뉴클레아제 활성을 갖는지를 결정하기 위한) 분석은 핵산 절단을 테스트하는 어떠한 편리한 핵산 절단 분석이라도 될 수 있다. 예시적인 절단 분석은 표적 핵산에 가이드 핵산 및 Cas9 폴리펩티드를 첨가하는 것을 포함한다.
일부 구체예에서, 본 개시 내용의 조성물에 포함시키기에 적합한 Cas9 폴리펩티드는 표적 핵산을 개질시키는 효소 활성 (예를 들어, 뉴클레아제 활성, 메틸기 전이효소 활성, 탈메틸화 효소 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 데퓨리네이션 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 중합 효소 활성, 리가아제 활성, 헬리카제 활성, 광분해 효소 활성 또는 글리코실라제 활성)을 갖는다.
다른 구체예에서, 본 개시 내용의 조성물에 포함시키기에 적합한 Cas9 폴리펩티드는 표적 핵산과 관련된 폴리펩티드 (예를 들어, 히스톤)를 개질시키는 효소 활성 (예를 들어, 메틸기 전이효소 활성, 탈메틸화 효소 활성, 아세틸기 전이효소 활성, 탈아세틸화 효소 활성, 인산화 효소 활성, 탈인산화 효소 활성, 유비퀴틴 리가아제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMOyl화 활성, 탈SUMOyl화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다.
다양한 종으로부터 많은 Cas9 오르톨로그가 확인되었으며 일부 구체예에서 단백질은 단지 몇 개의 동일한 아미노산을 공유한다. 확인된 모든 Cas9 오르톨로그는 중앙 HNH 엔도뉴클레아제 도메인 및 분할 RuvC/RNaseH 도메인이 있는 동일한 도메인 구조를 가지고 있다. Cas9 단백질은 보존된 구조로 4 가지 주요 모티프를 공유한다. 모티프 1, 2 및 4는 RuvC와 유사한 모티프이고 모티프 3은 HNH-모티프이다.
일부 구체예에서, 적합한 Cas9 폴리펩티드는 4 개의 모티프를 갖는 아미노산 서열을 포함하고, 각각의 모티프 1-4는 도 1 (서열 번호 1)에 도시된 Cas9 아미노산 서열; 또는 대안적으로 아래 표 1에 도시된 Cas9 아미노산 서열의 모티프 1-4 (서열 번호 1의 모티프 1-4는 아래 표 1에 제시된 바와 같이 각각 서열 번호 3-6 임); 또는 대안적으로 도 1(서열 번호 1)에 도시된 Cas9 아미노산 서열의 아미노산 7-166 또는 731-1003에 대해 60 % 이상, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 도 1에 도시 된 Cas9 아미노산 서열과 % 이상, 95 % 이상, 99 % 이상 또는 100 % 의 아미노산 서열 동일성을 갖는다.
일부 구체예에서, Cas9 폴리펩티드는 도 1에 도시되고 서열번호 1로 개시된 아미노산 서열에 대해 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상 또는 98 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고; 서열 번호 1에 제시된 아미노산 서열에 대한 N497, R661, Q695, 및 Q926의 아미노산 치환을 포함하고; 또는 서열 번호 1에 개시된 아미노산 서열에 대한 K855의 아미노산 치환을 포함하거나; 또는 서열 번호 1에 개시된 아미노산 서열에 대한 K810, K1003, 및 R1060의 아미노산 치환을 포함하거나; 또는 서열 번호 1에 개시된 아미노산 서열에 대한 K848, K1003, 및 R1060의 아미노산 치환을 포함한다.
본 명세서에 사용된 용어 "Cas9 폴리펩티드"는 용어 "변이체 Cas9 폴리펩티드"를 포함하고; 용어 "변이체 Cas9 폴리펩티드"는 용어 "키메라 Cas9 폴리펩티드"를 포함한다.
변이체 Cas9 폴리펩티드
본 개시 내용의 조성물에 포함시키기에 적합한 Cas9 폴리펩티드는 변이체 Cas9 폴리펩티드를 포함한다. 변이체 Cas9 폴리펩티드는 야생형 Cas9 폴리펩티드(예를 들어, 상기 기재된 바와 같은 자연적으로 발생하는 Cas9 폴리펩티드)의 아미노산 서열과 비교할 때 하나의 아미노산이 다른 (예를 들어, 결실, 삽입, 치환, 융합을 가짐) (즉, 하나 이상의 아미노산이 다른) 아미노산 서열을 가지고 있다. 일부 경우에 있어서, 변이체 Cas9 폴리펩티드는 Cas9 폴리펩티드의 뉴클레아제 활성을 감소시키는 아미노산 변화 (예를 들어, 결실, 삽입, 또는 치환)를 갖는다. 예를 들어, 일부 경우에 있어서, 변이체 Cas9 폴리펩티드는 상응하는 야생형 Cas9 폴리펩티드의 뉴클레아제 활성의 50 % 미만, 40 % 미만, 30 % 미만, 20 % 미만, 10 % 미만, 5 % 미만, 또는 1 % 미만을 갖는다. 일부 구체예에서, 변이체 Cas9 폴리펩티드는 실질적인 뉴클레아제 활성을 갖지 않는다. Cas9 폴리펩티드가 실질적인 뉴클레아제 활성이 없는 변이체 Cas9 폴리펩티드인 경우 "dCas9"라고 할 수 있다.
일부 구체예에서, 변이체 Cas9 폴리펩티드는 감소된 뉴클레아제 활성을 갖는다. 예를 들어, 본 개시 내용의 결합 방법에 사용하기에 적합한 변이체 Cas9 폴리펩티드는 야생형 Cas9 폴리펩티드, 예를 들어 도 1에 도시된 아미노산 서열(서열 번호 1)을 포함하는 야생형 Cas9 폴리펩티드의 엔도뉴클레아제 활성의 약 20 % 미만, 약 15 % 미만, 약 10 % 미만, 약 5 % 미만, 약 1 % 미만, 또는 약 0.1 % 미만을 나타낸다.
일부 구체예에서, 변이체 Cas9 폴리펩티드는 표적 핵산의 상보적 가닥을 절단할 수 있지만 이중 가닥 표적 핵산의 비-상보적 가닥을 절단하는 능력이 감소되었다. 예를 들어, 변이체 Cas9 폴리펩티드는 RuvC 도메인 (예를 들어, 도 1의 "도메인 1")의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다. 비-제한적인 예로서, 일부 구체예에서는, 변이체 Cas9 폴리펩티드가 D10A 돌연변이 (예를 들어, 서열 번호 1의 위치 10에 상응하는 아미노산 위치에서 아스파테이트로부터 알라닌으로)를 갖고, 따라서 표적 핵산의 상보적 가닥을 절단할 수 있지만 이중 가닥 표적 핵산의 비-상보적 가닥을 절단하는 능력이 감소되었다 (따라서 변이체 Cas9 폴리펩티드가 이중 가닥 핵산을 절단할 때 이중 가닥 절단 (DSB) 대신 단일 가닥 절단 (SSB)이 발생). (예를 들어, Jinek et al., Science. 2012 Aug 17; 337 (6096): 816-21참조).
일부 구체예에서, 변이체 Cas9 폴리펩티드는 이중 가닥 표적 핵산의 비-상보적 가닥을 절단할 수 있지만 표적 핵산의 상보적 가닥을 절단하는 능력이 감소되었다. 예를 들어, 변이체 Cas9 폴리펩티드는 HNH 도메인 (RuvC/HNH/RuvC 도메인 모티프, 도 1의"도메인 2")의 기능을 감소시키는 돌연변이 (아미노산 치환)를 가질 수 있다. 비제한적인 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 H840A 돌연변이 (예를 들어, 서열 번호 1의 위치 840에 상응하는 아미노산 위치에서 히스티딘으로부터 알라닌으로) (도 1)를 가질 수 있으며, 따라서 표적 핵산의 비-상보적 가닥을 절단하지만 표적 핵산의 상보적 가닥을 절단하는 능력이 감소했다 (따라서 변이체 Cas9 폴리펩티드가 이중 가닥 표적 핵산을 절단할 때 DSB 대신 SSB가 생성됨). 이러한 Cas9 폴리펩티드는 표적 핵산 (예를 들어, 단일 가닥 표적 핵산)을 절단하는 능력이 감소되었지만 표적 핵산 (예를 들어, 단일 가닥 또는 이중 가닥 표적 핵산)에 결합하는 능력은 보유한다. .
일부 구체예에서, 변이체 Cas9 폴리펩티드는 이중 가닥 표적 핵산의 상보적 및 비-상보적 가닥 둘 모두를 절단하는 능력이 감소되었다. 비제한적인 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 D10A 및 H840A 돌연변이 (예를 들어, RuvC 도메인 및 HNH 도메인 둘 다에서의 돌연변이) 둘 다를 보유하여 폴리펩티드가 이중 가닥 표적 핵산의 상보적 및 비-상보적 가닥 둘 모두를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 폴리펩티드는 표적 핵산 (예를 들어, 단일-가닥 표적 핵산 또는 이중-가닥 표적 핵산)을 절단하는 능력이 감소되었지만 표적 핵산 (예를 들어, 단일-가닥 표적 핵산 또는 이중-가닥 표적 핵산)에 결합하는 능력은 유지한다.
또 다른 비제한적 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 폴리펩티드가 표적 핵산을 절단하는 능력을 감소되게 갖도록 W476A 및 W1126A 돌연변이를 보유한다. 이러한 Cas9 폴리펩티드는 표적 핵산을 절단하는 능력이 감소되지만 표적 핵산에 결합하는 능력은 유지된다.
또 다른 비제한적 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 폴리펩티드가 표적 핵산을 절단하는 능력이 감소되게 갖도록 P475A, W476A, N477A, D1125A, W1126A 및 D1127A 돌연변이를 보유한다. 이러한 Cas9 폴리펩티드는 표적 핵산을 절단하는 능력이 감소되지만 표적 핵산에 결합하는 능력은 유지된다.
또 다른 비제한적 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 폴리펩티드가 표적 핵산을 절단하는 능력을 감소되게 갖도록 돌연변이인 H840A, W476A 및 W1126A를 보유한다. 이러한 Cas9 폴리펩티드는 표적 핵산을 절단하는 능력이 감소되지만 표적 핵산에 결합하는 능력은 유지된다.
또 다른 비제한적 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 폴리펩티드가 표적 핵산을 절단하는 능력을 감소되게 갖도록 돌연변이인 H840A, D10A, W476A, 및 W1126A를 보유한다. 이러한 Cas9 폴리펩티드는 표적 핵산을 절단하는 능력이 감소되지만 표적 핵산에 결합하는 능력은 유지된다.
또 다른 비제한적 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 폴리펩티드가 표적 핵산을 절단하는 능력을 감소되게 갖도록 H840A, P475A, W476A, N477A, D1125A, W1126A 및 D1127A 돌연변이를 보유한다. 이러한 Cas9 폴리펩티드는 표적 핵산을 절단하는 능력이 감소되지만 표적 핵산에 결합하는 능력은 유지된다.
또 다른 비제한적 예로서, 일부 구체예에서, 변이체 Cas9 폴리펩티드는 폴리펩티드가 표적 핵산을 절단하는 능력을 감소되게 갖도록 D10A, H840A, P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유한다. 이러한 Cas9 폴리펩티드는 표적 핵산을 절단하는 능력이 감소되지만 표적 핵산에 결합하는 능력은 유지된다.
상기 효과(즉, 하나 또는 다른 뉴클레아제 부분을 비활성화)를 달성하기 위해 다른 잔기를 돌연변이시킬 수 있다. 비제한적인 예로서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986 및/또는 A987이 변경 (즉, 치환) 될 수 있다 (즉, Cas9 아미노산 잔기의 보존에 관한 자세한 내용은 표 1 참조). 또한, 알라닌 치환 이외의 돌연변이도 적합하다.
일부 구체예에서, 감소된 촉매 활성을 갖는 변이체 Cas9 폴리펩티드 (예를 들어, Cas9 단백질이 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986 및/또는 A987 돌연변이를 갖는 경우 예를 들어, D10A, G12A, G17A, E762A, H840A, N854A, N863A, H982A, H983A, A984A 및/또는 D986A), 변이체 Cas9 폴리펩티드는 가이드 핵산과 상호 작용할 수 있는 능력을 유지하는 한 여전히 부위-특이적 방식으로 표적 핵산에 결합할 수 있다(왜냐하면 가이드 핵산에 의해 표적 핵산 서열로 계속 안내되기 때문).
표 1. 표 1은 다양한 종의 Cas9 서열에 존재하는 4 개의 모티프를 나열한다. 여기에 나열된 아미노산은 S. pyogenes (서열 번호 1).
모티프 모티프 아미노산(잔기번호) 고도로 보존
1 RuvC IGLDIGTNSVGWAVI (7-21)
(서열번호 3)
D10, G12, G17
2 RuvC IVIEMARE (759-766)
(서열번호 4)
E762
3 HNH-motif DVDHIVPQSFLKDDSIDNKVLTRSDKN (837-863) (서열번호 5) H840, N854, N863
4 RuvC HHAHDAYL (982-989)
(서열번호 6)
H982, H983, A984, D986, A987
상기에 추가하여, 변이체 Cas9 단백질은 Cas9 폴리펩티드에 대해 상기 상술한 바와 같이 서열 동일성에 대해 동일한 매개 변수를 가질 수 있다. 따라서, 일부 구체예에서, 적합한 변이체 Cas9 폴리펩티드는 4 개의 모티프를 갖는 아미노산 서열을 포함하고, 각각의 모티프 1-4는 도 1(서열 번호 1)에 도시된 Cas9 아미노산 서열에 대해, 또는 대안적으로 모티프 1-4(서열번호 1의 모티프 1-4는 표 1에 나타낸 바와 같이 각각 서열 번호 3-6 임); 또는 대안적으로 도 1(서열 번호 1)에 도시된 Cas9 아미노산 서열의 아미노산 7-166 또는 731-1003에 대해60 % 이상, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 99 % 이상 또는 100 %의 아미노산 서열 동일성을 갖는다. 상기 정의된 바와 같은 임의의 Cas9 단백질은 국제 특허 출원 번호 PCT/US2016/052690 및 PCT/US2017/062617에서 특별히 언급된 것들을 포함하여 본 개시 내용의 조성물에 Cas9 폴리펩티드로서, 또는 키메라 Cas9 폴리펩티드의 일부로서 사용될 수 있다.
일부 구체예에서, 적합한 변이체 Cas9 폴리펩티드는 도 1에 도시된 Cas9 아미노산 서열(서열 번호 1)에 대해 60 % 이상, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 99 % 이상, 또는 100 % 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 상기 정의된 바와 같은 임의의 Cas9 단백질은 국제 특허 출원 번호 PCT/US2016/052690 및 PCT/US2017/062617에서 특별히 언급된 것들을 포함하여 본 개시 내용의 조성물에 변이체 Cas9 폴리펩티드로서, 또는 키메라 변이체 Cas9 폴리펩티드의 일부로서 사용될 수 있다.
키메라 폴리펩티드 (융합 폴리펩티드)
일부 구체예에서, 변이체 Cas9 폴리펩티드는 키메라 Cas9 폴리펩티드 (본 명세서에서 융합 폴리펩티드, 예를 들어"Cas9 융합 폴리펩티드"라고도 함)이다. Cas9 융합 폴리펩티드는 표적 핵산 (예를 들어, 절단, 메틸화, 탈메틸화 등) 및/또는 표적 핵산과 관련된 폴리펩티드 (예를 들어, 히스톤 꼬리 등에 대해 메틸화, 아세틸화 등)에 결합 및/또는 개질할 수 있다.
Cas9 융합 폴리펩티드는 야생형 Cas9 폴리펩티드 (예를 들어, 자연 발생 Cas9 폴리펩티드)와 서열이 상이하다는 점에서 변이체 Cas9 폴리펩티드다. Cas9 융합 폴리펩티드는 공유 결합된 이종 폴리펩티드 ("융합 파트너"로도 언급됨)에 융합된 Cas9 폴리펩티드 (예컨대, 야생형 Cas9 폴리펩티드, 변이체 Cas9 폴리펩티드, 뉴클레아제 활성이 감소된 변이체 Cas9 폴리펩티드(위에 설명됨) 등)이다. 일부 구체예에서, Cas9 융합 폴리펩티드는 공유 결합된 이종 폴리펩티드에 융합된 감소된 뉴클레아제 활성을 갖는 변이체 Cas9 폴리펩티드(예를 들어, dCas9)이다. 일부 구체예에서, 이종성 폴리펩티드는 Cas9 융합 폴리펩티드에 의해 또한 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸기 전이효소 활성, 아세틸기 전이효소 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낸다(따라서 제공한다). 이러한 일부 구체예에서, 예를 들어 Cas9 폴리펩티드가 표적 핵산을 개질시키는 활성 (예를 들어, 효소 활성)을 갖는 융합 파트너 (즉, 이종 폴리펩티드를 가짐)를 갖는 변이체 Cas9 폴리펩티드인 결합 방법, 그 방법은 또한 표적 핵산을 개질하는 방법으로도 간주할 수 있다. 일부 구체예에서, 표적 핵산 (예를 들어, 단일 가닥 표적 핵산)에 결합하는 방법은 표적 핵산의 개질을 초래할 수 있다. 따라서, 일부 구체예에서, 표적 핵산 (예를 들어, 단일 가닥 표적 핵산)에 결합하는 방법은 표적 핵산을 개질하는 방법일 수 있다.
일부 구체예에서, 이종 서열은 서브세포의 국재화를 제공하는데, 즉, 이종 서열은 서브세포의 국재화 서열 (예를 들어, 핵에 대한 표적화를 위한 핵 국재화 신호 (NLS), 핵 외부에 융합 단백질을 유지하기 위한 서열, 예를 들어, 핵 수출 서열 (NES), 융합 단백질을 세포질에 유지하기 위한 서열, 미토콘드리아에 대한 표적화를 위한 미토콘드리아 국재화 신호, 엽록체에 대한 표적화를 위한 엽록체 국재화 신호, 소포체 (ER) 체류 신호 등)이다. 일부 구체예에서, 변이체 Cas9는 NLS를 포함하지 않으므로 그 단백질은 핵에 표적화되지 않는다 (예를 들어 표적 핵산이 세포질에 존재하는 RNA 인 경우 유리할 수 있음). 일부 구체예에서, 이종 서열은 추적 및/또는 정제의 용이성을 위해 태그 (즉, 이종 서열이 검출 가능한 표지임)를 제공할 수 있다(예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그; 등등). 일부 구체예에서, 이종성 서열은 증가된 또는 감소된 안정성을 제공할 수 있다 (즉, 이종성 서열은 안정성 제어 펩티드, 예를 들어, 일부 구체예에서 제어 가능한 데그론이다 (예를 들어, 온도 민감성 또는 약물 제어 가능한 데그론 서열, 이하 참조)). 일부 구체예에서, 이종성 서열은 표적 핵산으로부터 증가된 또는 감소된 전사를 제공할 수 있다 (즉, 이종성 서열은 전사 조절 서열, 예를 들어 전사 인자/활성자 또는 이의 단편, 전사 인자/활성자 또는 이의 단편을 동원하는 단백질 또는 단편, 전사 억제자 또는 이의 단편, 전사 억제자를 동원하는 단백질 또는 이의 단편, 소분자/약물-반응성 전사 조절자 등). 일부 구체예에서, 이종성 서열은 결합 도메인을 제공할 수 있다 (즉, 이종성 서열은 단백질 결합 서열, 예를 들어 Cas9 융합 폴리펩티드가 다른 관심 단백질, 예를 들어 DNA 또는 히스톤 개질 단백질, 전사 인자 또는 전사 억제자, 동원 단백질, RNA 변형 효소, RNA-결합 단백질, 번역 개시 인자, RNA 스플라이싱 인자 등에 결합하는 능력을 제공하기 위한 것임). 이종 핵산 서열은 (예를 들어, 유전 공학에 의해) 다른 핵산 서열에 연결되어 키메라 폴리펩티드를 코딩하는 키메라 뉴클레오티드 서열을 생성할 수 있다.
개체 Cas9 융합 폴리펩티드 (Cas9 융합 단백질)는 상기의 임의의 조합으로 다중 (1 개 이상, 2 개 이상, 3 개 이상 등) 융합 파트너를 가질 수 있다. 예시적인 예로서, Cas9 융합 단백질은 활성 (예를 들어, 전사 조절, 표적 개질, 표적 핵산과 관련된 단백질의 개질 등을 위한 것)을 제공하는 이종 서열을 가질 수 있고 또한 서브세포 국재화 서열도 가질 수 있다 . 일부 구체예에서, 이러한 Cas9 융합 단백질은 또한 추적 및/또는 정제의 용이성을 위한 태그 (예를 들어, 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예를 들어, 6XHis 태그; 헤마글 루티닌 (HA) 태그, FLAG 태그, Myc 태그 등)를 가질 수도 있다. 또 다른 예시적인 예로서, Cas9 단백질은 하나 이상의 NLS (예를 들어, 2 개 이상, 3 개 이상, 4 개 이상, 5 개 이상, 1, 2, 3, 4 또는 5 개의 NLS)를 가질 수 있다. 일부 구체예에서 융합 파트너 (또는 다중 융합 파트너) (예를 들어, NLS, 태그, 활성을 제공하는 융합 파트너 등)는 Cas9의 C-말단에 또는 그 근처에 위치한다. 일부 구체예에서 융합 파트너 (또는 다중 융합 파트너) (예를 들어, NLS, 태그, 활성을 제공하는 융합 파트너 등)는 Cas9의 N- 말단에 위치한다. 일부 구체예에서 Cas9는 N- 말단 및 C- 말단 모두에 융합 파트너 (또는 다중 융합 파트너) (예를 들어, NLS, 태그, 활성을 제공하는 융합 파트너 등)를 갖는다.
증가된 또는 감소된 안정성을 제공하는 적합한 융합 파트너는 데그론 서열을 포함하지만 이에 제한되지 않는다. 데그론은 이들이 속한 단백질의 안정성을 조절하는 아미노산 서열인 것으로 통상의 기술자에 의해 쉽게 이해된다. 예를 들어, 데그론 서열을 포함하는 단백질의 안정성은 데그론 서열에 의해 부분적으로 제어된다. 일부 구체예에서, 적합한 데그론은 데그론이 실험 대조군과 무관하게 단백질 안정성에 영향을 미치도록 구성적이다 (즉, 데그론은 약물 유도성, 온도 유도성 등이 아님). 일부 구체예에서, 데그론은 제어 가능한 안정성으로 변이체 Cas9 폴리펩티드가 원하는 조건에 따라 "on"(즉, 안정) 또는 "off"(즉, 불안정, 분해)될 수 있도록 변이체 Cas9 폴리펩티드를 제공한다. 예를 들어, 데그론이 온도에 민감한 데그론이라면 변이체 Cas9 폴리펩티드는 역치 온도 (예를 들어, 42℃, 41℃, 40℃, 39℃, 38℃, 37℃, 36℃, 35℃, 34℃, 33℃, 32℃, 31℃, 30℃ 등) 미만에서 기능적 (즉, "on", 안정) 이지만 역치 온도 초과에서는 비기능적 (즉, "off" , 분해)일 수 있다. 다른 예로서, 데그론이 약물 유도성 데그론이라면 약물의 존재 또는 부재는 단백질을 "off"(즉, 불안정) 상태에서 "on"(즉, 안정) 상태로 또는 그 반대로 전환시킬 수 있다. 예시적인 약물 유도성 데그론은 FKBP12 단백질에서 유래한다. 데그론의 안정성은 데그론에 결합하는 소분자의 유무에 의해 제어된다.
적합한 데그론의 예는 Shield-1, DHFR, 옥신 및/또는 온도에 의해 제어되는 데그론을 포함하지만 이에 제한되지 않는다. 적합한 데그론의 비제한적인 예는 관련업계에 공지되어 있다 (예를 들어, Dohmen et al., Science, 1994. 263(5151): p. 1273-1276: Heat-inducible degron: a method for constructing temperature-sensitive mutants; Schoeber et al., Am J Physiol Renal Physiol. 2009 Jan;296(1):F204-11 : Conditional fast expression and function of multimeric TRPV5 channels using Shield-1 ; Chu et al., Bioorg Med Chem Lett. 2008 Nov 15;18(22):5941-4: Recent progress with FKBP-derived destabilizing domains ; Kanemaki, Pflugers Arch. 2012 Dec 28: Frontiers of protein expression control with conditional degrons; Yang et al., Mol Cell. 2012 Nov 30;48(4):487-8: Titivated for destruction: the methyl degron; Barbour et al., Biosci Rep. 2013 Jan 18;33(1).: Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase; and Greussing et al., J Vis Exp. 2012 Nov 10;(69): Monitoring of ubiquitin-proteasome activity in living cells using a Degron (dgn)-destabilized green fluorescent protein (GFP)-based reporter protein; 이들 모두는 그 전체가 참조로 본 명세서에 포함된다).
예시적인 데그론 서열은 세포와 동물 모두에서 잘 특성화되고 테스트되었다. 따라서, Cas9 (예를 들어, 야생형 Cas9; 변이체 Cas9; 감소된 뉴클레아제 활성을 갖는 변이체 Cas9, 예를 들어 dCas9 등)를 데그론 서열에 융합하면 "조정 가능한" 및 "유도 가능한" Cas9 폴리펩티드가 생성된다. 본 명세서에 기재된 임의의 융합 파트너는 임의의 바람직한 조합으로 사용될 수 있다. 이 점을 설명하기위한 하나의 비제한적인 예로서, Cas9 융합 단백질 (즉, 키메라 Cas9 폴리펩티드)은 검출을 위한 YFP 서열, 안정성을 위한 데그론 서열, 및 표적 핵산의 전사를 증가시키기 위한 전사 활성자 서열을 포함할 수 있다. Cas9 폴리펩티드 (예를 들어, 야생형 Cas9, 변이체 Cas9, 뉴클레아제 기능이 감소 된 변이체 Cas9 등)에 대한 융합 파트너로서 사용하기에 적합한 리포터 단백질은 다음의 예시적인 단백질 (또는 이들의 기능적 단편)을 포함하지만 이에 제한되지는 않는다: his3, β-갈락토시다제, 형광 단백질 (예를 들어, GFP, RFP, YFP, 체리, 토마토 등, 및 이들의 다양한 유도체), 루시페라제, β-글루쿠로니다제, 및 알칼리성 포스파타제. 또한 Cas9 융합 단백질에서 사용할 수 있는 융합 파트너의 수는 무제한적이다. 일부 구체예에서, Cas9 융합 단백질은 하나 이상 (예를 들어, 2 개 이상, 3 개 이상, 4 개 이상 또는 5 개 이상)의 이종 서열을 포함한다.
적합한 융합 파트너는 메틸기 전이효소 활성, 탈메틸화 효소 활성, 아세틸기 전이효소 활성, 탈아세틸화 효소 활성, 인산화 효소 활성, 탈인산화 효소 활성, 유비퀴틴 리가아제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMOyl화 활성, 탈SUMOyl화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하지만 이에 제한되지는 않는데 상기 중 어떤 것이든 핵산을 직접 개질(예를 들어, DNA 또는 RNA의 메틸화)하거나 핵산 관련 폴리펩티드 (예를 들어, 히스톤 , DNA 결합 단백질 및 RNA 결합 단백질 등)를 개질하는 것으로 유도될 수 있다. 더욱 적합한 융합 파트너는 경계 요소 (예를 들어, CTCF), 주변 동원을 제공하는 단백질 및 이의 단편 (예를 들어, Lamin A, Lamin B 등) 및 단백질 도킹 요소(예를 들어, FKBP/FRB, Pil1/Aby1 등)를 포함하지만 이에 제한되지는 않는다.
개체 변이체 Cas9 폴리펩티드에 대한 다양한 추가의 적합한 융합 파트너 (또는 이의 단편)의 예는 다음 PCT 특허 출원에 기재된 것들을 포함하지만 이에 제한되지는 않는다: WO2010/075303, WO2012/068627 및 WO2013/155555 이들 전체가 본 명세서에 참조로서 통합됨.
적합한 융합 파트너에는 표적 핵산 또는 표적 핵산과 관련된 폴리펩티드 (예를 들어, 히스톤, DNA-결합 단백질, RNA-결합 단백질, RNA 편집 단백질 등)에 직접 작용하여 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩티드가 포함되나 이에 제한되지는 않는다. 적합한 융합 파트너는 메틸기 전이효소 활성, 탈메틸화 효소 활성, 아세틸기 전이효소 활성, 탈아세틸화 효소 활성, 인산화 효소 활성, 탈인산화 효소 활성, 유비퀴틴 리가아제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMOyl화 활성, 탈SUMOyl화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하지만 이에 제한되지는 않는다.
추가적인 적합한 융합 파트너는 표적 핵산의 증가된 전사 및/또는 번역을 직접 제공하는 폴리펩티드 (예를 들어, 전사 활성자 또는 이의 단편, 전사 활성자를 동원하는 단백질 또는 이의 단편, 소분자/약물-반응성 전사 및/또는 번역 조절제, 번역-조절 단백질 등)를 포함하지만 이에 제한되지는 않는다.
증가된 또는 감소된 전사를 달성하기 위한 융합 파트너의 비제한적인 예는 전사 활성자 및 전사 억제자 도메인 (예를 들어, Kr
Figure pct00050
ppel 연관 박스 (KRAB 또는 SKD); Mad mSIN3 상호 작용 도메인 (SID); ERF 억제자 도메인 (ERD) 등)을 포함한다. 일부 이러한 구체예에서, Cas9 융합 단백질은 가이드 핵산에 의해 표적 핵산의 특정 위치 (즉, 서열)로 표적화되고, 프로모터에 대한 RNA 중합 효소의 결합을 차단하는 것(이는 전사 활성자 기능을 선택적으로 저해함) 및/또는 국소 염색질 상태의 개질(예를 들어, 표적 핵산을 개질하거나 표적 핵산과 관련된 폴리펩티드를 개질하는 융합 서열이 사용되는 경우)과 같은 유전자좌-특이적 조절 (전사를 선택적으로 억제함)을 발휘한다. 일부 구체예에서, 변화는 일시적이다(예를 들어, 전사 억제 또는 활성화). 일부 구체예에서, 변화는 유전적이다 (예를 들어, 표적 핵산 또는 표적 핵산과 관련된 단백질, 예를 들어 뉴클레오솜 히스톤에 후성적 개질(epigenetic modifications)이 이루어지는 경우).
ssRNA 표적 핵산을 표적화할 때 사용하기 위한 융합 파트너의 비제한적인 예는 다음을 포함한다(다만 이에 한정되는 것은 아님): 스플라이싱 인자 (예를 들어, RS 도메인); 단백질 번역 성분 (예를 들어, 번역 개시, 신장 및/또는 방출 인자, 예를 들어 eIF4G); RNA 메틸라아제; RNA 편집 효소 (예를 들어, RNA 데아미나아제, 예를 들어 RNA (ADAR)에 작용하는 아데노신 데아미나아제, A에서 I 및/또는 C에서 U 편집 효소 포함); heliembodiments; RNA-결합 단백질; 등. 융합 파트너는 전체 단백질을 포함할 수 있거나 일부 구체예에서 단백질의 단편 (예를 들어, 기능적 도메인)을 포함할 수 있는 것으로 이해된다.
일부 구체예에서, 이종 서열은 Cas9 폴리펩티드의 C-말단에 융합될 수 있다. 일부 구체예에서, 이종성 서열은 Cas9 폴리펩티드의 N-말단에 융합될 수 있다. 일부 구체예에서, 이종성 서열은 Cas9 폴리펩티드의 내부 부분 (즉, N- 또는 C-말단 이외의 부분)에 융합될 수 있다.
또한, 키메라 Cas9 폴리펩티드의 융합 파트너는 ssRNA와 상호 작용할 수 있는 임의의 도메인일 수 있는데(이는 본 개시의 목적을 위해, 분자 내 및/또는 분자간 이차 구조, 예를 들어 헤어핀, 스템-루프와 같은 이중 가닥 RNA 이중체를 포함함), 일시적으로 또는 비가역적으로, 직접적으로 또는 간접적으로 다음을 포함하는 군으로부터 선택된 효과자 도메인을 포함하나 이에 제한되지 않는다; 엔도뉴클레아제 (예를 들어, RNase I, CRR22 DYW 도메인, Dicer 및 SMG5 및 SMG6와 같은 단백질의 PIN (PilT N-말단) 도메인); RNA 절단을 자극하는 단백질 및 단백질 도메인 (예를 들어, CPSF, CstF, CFIm 및 CFIIm); 엑소뉴클레아제 (예를 들어, XRN-1 또는 엑소뉴클레아제 T); 데아데닐라제 (예를 들어, HNT3); 넌센스 매개 RNA 붕괴를 담당하는 단백질 및 단백질 도메인 (예를 들어, UPF1, UPF2, UPF3, UPF3b, RNP S1, Y14, DEK, REF2, 및 SRm160); RNA 안정화를 담당하는 단백질 및 단백질 도메인 (예를 들어, PABP); 번역 억제를 담당하는 단백질 및 단백질 도메인 (예를 들어, Ago2 및 Ago4); 번역을 자극하는 단백질 및 단백질 도메인 (예를 들어, Staufen); 번역을 조절하는 (예를 들어, 조절할 수 있는) 단백질 및 단백질 도메인 (예를 들어, 개시 인자, 신장 인자, 방출 인자 등과 같은 번역 인자 등, 예를 들어 eIF4G); RNA의 폴리아데닐화를 담당하는 단백질 및 단백질 도메인 (예를 들어, PAP1, GLD-2 및 Star-PAP); RNA의 폴리우리디닐화를 담당하는 단백질 및 단백질 도메인 (예를 들어, CI D1 및 말단 우리딜레이트 전이효소); RNA 국재화를 담당하는 단백질 및 단백질 도메인 (예를 들어, IMP1, ZBP1, She2p, She3p, 및 Bicaudal-D); RNA의 핵 보유를 담당하는 단백질 및 단백질 도메인 (예를 들어, Rrp6); RNA의 핵 수출을 담당하는 단백질 및 단백질 도메인 (예를 들어, TAP, NXF1, THO, TREX, REF 및 Aly); RNA 스플라이싱 억제를 담당하는 단백질 및 단백질 도메인 (예를 들어, PTB, Sam68 및 hnRNP A1); RNA 스플라이싱의 자극을 담당하는 단백질 및 단백질 도메인 (예를 들어, 세린 /아르기닌-풍부(SR) 도메인); 전사 효율을 감소시키는 단백질 및 단백질 도메인 (예를 들어, FUS (TLS)); 및 전사 자극을 담당하는 단백질 및 단백질 도메인 (예를 들어, CDK7 및 HIV Tat). 대안적으로, 효과자 도메인은 다음을 포함하는 군으로부터 선택될 수 있다; 엔도뉴클레아제; RNA 절단을 자극할 수 있는 단백질 및 단백질 도메인; 엑소뉴클레아제; 데아데닐라제; 넌센스 매개된 RNA 붕괴 활성을 갖는 단백질 및 단백질 도메인; RNA를 안정화할 수 있는 단백질 및 단백질 도메인; 번역을 억제 할 수 있는 단백질 및 단백질 도메인; 번역을 자극할 수 있는 단백질 및 단백질 도메인; 번역을 조절할 수 있는 단백질 및 단백질 도메인 (예를 들어, 개시 인자, 신장 인자, 방출 인자 등과 같은 번역 인자 등, 예를 들어 eIF4G); RNA의 폴리아데닐화를 할 수 있는 단백질 및 단백질 도메인; RNA의 폴리우리디닐화를 할 수 있는 단백질 및 단백질 도메인; RNA 국소화 활성을 갖는 단백질 및 단백질 도메인; RNA의 핵 보유를 할 수 있는 단백질 및 단백질 도메인; RNA 핵 수출 활성을 갖는 단백질 및 단백질 도메인; RNA 스플라이싱을 억제할 수 있는 단백질 및 단백질 도메인; RNA 스플라이싱을 자극할 수 있는 단백질 및 단백질 도메인; 전사 효율을 감소시킬 수 있는 단백질 및 단백질 도메인; 및 전사를 자극할 수 있는 단백질 및 단백질 도메인. 또 다른 적합한 융합 파트너는 WO2012068627에 더 자세히 설명되어 있는 PUF RNA-결합 도메인이다.
Cas9 폴리펩티드에 대한 융합 파트너로서 (전체 또는 이의 단편으로) 사용될 수 있는 일부 RNA 스플라이싱 인자는 별도의 서열-특이적 RNA 결합 모듈 및 스플라이싱 효과자 도메인과 함께 모듈식 조직을 가지고 있다. 예를 들어, 세린/아르기닌-풍부 (SR) 단백질 패밀리의 구성원은 exon 내포(inclusion)를 촉진하는 pre-mRNA 및 C-말단 RS 도메인에서 exonic splicing Enhancer (ESE)에 결합하는 N-말단 RNA 인식 모티프 (RRM)를 포함한다. 또 다른 예로서, hnRNP 단백질 hnRNP Al은 RRM 도메인을 통해 엑손 스플라이싱 사일런서 (ESS)에 결합하고 C-말단 글리신- 풍부 도메인을 통해 엑손 내포를 억제한다. 일부 스플라이싱 인자는 두 개의 대안적인 부위 사이의 조절 서열에 결합하여 스플라이스부위 (ss)의 대안적인 사용을 조절할 수 있다. 예를 들어, ASF/SF2는 ESE를 인식하고 인트론 근위 부위의 사용을 촉진 할 수 있는 반면, hnRNP Al은 ESS에 결합하고 스플라이싱을 인트론 원위 부위의 사용으로 전환할 수 있다. 이러한 인자에 대한 한 가지 적용은 내인성 유전자, 특히 질병 관련 유전자의 대안적 스플라이싱을 조절하는 ESF를 생성하는 것이다. 예를 들어, Bcl-x pre-mRNA는 반대 기능의 단백질을 코딩하기 위해 두 개의 대안적 5' 스플라이스 부위를 가진 두 개의 스플라이싱 이소폼을 생성한다. 긴 스플라이싱 이소폼 Bcl-xL은 수명이 긴 유사 분열 후 세포에서 발현되는 강력한 아폽토시스 억제제이며 많은 암세포에서 상향 조절되어 아폽토시스 신호로부터 세포를 보호한다. 짧은 이소폼 Bcl-xS는 프로-아폽토시스 이소폼이며 높은 교체율 (turnover rate)을 가진 세포 (예를 들어, 발생 중의 림프구)에서 높은 수준으로 발현된다. 2 개의 Bcl-x 스플라이싱 이소폼의 비율은 코어 엑손 영역 또는 엑손 확장 영역 (즉, 두 개의 대안적 5' 스플라이스 부위 사이)에 위치한 여러 cþ- 요소에 의해 조절된다. 더 많은 예는 WO2010075303을 참조.
일부 구체예에서, Cas9 폴리펩티드 (예를 들어, 야생형 Cas9, 변이체 Cas9, 뉴클레아제 활성이 감소된 변이체 Cas9 등)는 펩티드 스페이서를 통해 융합 파트너에 연결될 수 있다.
일부 구체예에서, Cas9 폴리펩티드는 지질 이중층, 미셀, 세포막, 소기관 막 또는, 소포 막 횡단을 용이하게 하는 폴리펩티드, 폴리뉴클레오티드, 탄수화물, 또는 유기 또는 무기 화합물을 지칭할 수 있는 "단백질 도입 도메인(Protein Transduction Domain)" 또는 PTD (CPP - cell penetrating peptide로도 알려져 있음)를 포함한다. 작은 극성 분자에서부터 큰 거대 분자 및/또는 나노입자에까지 이를 수 있는, 다른 분자에 부착된 PTD는 예를 들어 세포 외 공간으로부터 세포 내 공간으로 이동하거나 세포질액(cytosol)으로부터 세포 소기관 내로 이동하는 것과 같이 분자가 막을 통과하는 것을 용이하게 한다. 일부 구체예에서, 다른 분자에 부착된 PTD는 분자의 핵으로의 진입을 용이하게한다(예를 들어, 일부 구체예에서, PTD는 핵 국재화 신호 (NLS)를 포함한다). 일부 구체예에서, Cas9 폴리펩티드는 2 개 이상의 NLS, 예를 들어 2 개 이상의 NLS를 직렬로(in tandem) 포함한다. 일부 구체예에서, PTD는 Cas9 폴리펩티드의 아미노 말단에 공유적으로 연결된다. 일부 구체예에서, PTD는 Cas9 폴리펩티드의 카르복실 말단에 공유적으로 연결된다. 일부 구체예에서, PTD는 Cas9 폴리펩티드의 아미노 말단 및 카르복실 말단에 공유적으로 연결된다. 일부 구체예에서, PTD는 핵산 (예를 들어, 가이드 핵산, 가이드 핵산을 코딩하는 폴리뉴클레오티드, Cas9 폴리펩티드를 코딩하는 폴리뉴클레오티드 등)에 공유적으로 연결된다. 예시적인 PTD는 다음을 포함 하나 이에 제한되지는 않는다: 최소한의 운데카펩티드 단백질 형질 도입 도메인 (YGRKKRRQRRR(서열 번호: 7)을 포함하는 HIV-1 TAT의 잔기 47-57에 상응함); 세포로의 직접 진입에 충분한 다수의 아르기닌을 포함하는 폴리 아르기닌 서열(예를 들어, 3, 4, 5, 6, 7, 8, 9, 10 또는 10-50 아르기닌); VP22 도메인 (Zender et al. (2002) Cancer Gene Ther. 9 (6): 489-96); 초파리 안테나페디아 단백질 형질 도입 도메인 (Noguchi et al. (2003) Diabetes 52 (7): 1732-1737); 절단된 인간 칼시토닌 펩티드 (Trehin et al. (2004) pharm. Research 21: 1248-1256); 폴리라이신 (Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008); RRQRRTSKLMKR (서열 번호 8); 트랜스포탄 GWTLNSAGYLLGKINLKALAALAKKIL (서열 번호 9); KALAWEAKLAKALAKALAKHLAKALAKALKCEA (서열 번호 10); 및 RQIKIWFQNRRMKWKK (서열 번호: 11). 예시적인 PTD는 다음을 포함하지만 이에 한정되지 않는다: YGRKKRRQRRR (서열 번호 12), RKKRRQRRR (서열 번호 13); 3 개의 아르기닌 잔기 내지 50 개의 아르기닌 잔기의 아르기닌 호모폴리머; 예시적인 PTD 도메인 아미노산 서열은 다음 중 임의의 것을 포함하지만 이에 제한되지 않는다: YGRKKRRQRRR (서열 번호 14); RKKRRQRR (서열 번호: 15); YARAAARQARA (서열 번호: 16); THRLPRRRRRR (서열 번호 17); 및 GGRRARRRRRR (서열 번호 18). 일부 구체예에서, PTD는 활성화 가능한 CPP (ACPP)이다 (Aguilera et al. (2009) Integr Biol (Camb) June; 1 (5-6): 371-381). ACPP는 절단 가능한 링커를 통해 매칭되는 폴리 음이온 (예를 들어, Glu9 또는 "E9")에 연결된 다가 양이온성 CPP (예를 들어, Arg9 또는"R9")를 포함하는데, 이는 네트 전하를 거의 0으로 감소시켜 세포로의 부착 및 흡수를 억제한다. 링커가 절단되면 폴리음이온이 방출되어 폴리아르기닌과 그 고유의 접착성을 국재적으로 드러내게 하고, 따라서 막을 가로 지르는 ACPP를 "활성화"한다.
일부 구체예에서, 조성물은 Cpf1 RNA-유도되는 엔도뉴클레아제를 포함할 수 있으며, 그 예는 도 2, 16, 또는 17에 제공된다. Cpf1 RNA-가이드된 엔도뉴클레아제의 또 다른 이름은 Cas12a이다. 본 개시 내용의 Cpf1 CRISPR 시스템은 i) 단일 엔도뉴클레아제 단백질, 및 ii) crRNA를 포함하고, 여기서 crRNA의 3 ‘ 말단의 일부는 표적 핵산에 상보적인 가이드 서열을 함유한다. 이 시스템에서 Cpf1 뉴클레아제는 crRNA에 의해 표적 DNA에 직접 동원된다. 일부 구체예에서, Cpf1에 대한 가이드 서열은 검출 가능한 DNA 절단을 달성하기 위해 적어도 12nt, 13nt, 14nt, 15nt 또는 16nt이어야하고, 효율적인 DNA 절단을 달성하기 위해 최소 14nt, 15nt, 16nt, 17nt, 또는 18nt이어야한다.
본 개시 내용의 Cpf1 시스템은 다양한 방식에서 Cas9와 상이하다. 첫째, Cas9와 달리 Cpf1은 절단을 위해 별도의 tracrRNA가 필요하지 않다. 일부 구체예에서, Cpf1 crRNA는 약 42-44 염기 길이만큼 짧을 수 있으며, 이 중 23-25 nt는 가이드 서열이고 19 nt는 구성적 직접 반복 서열이다. 대조적으로, 결합된 Cas9 tracrRNA 및 crRNA 합성 서열은 약 100 염기 길이일 수 있다.
둘째, Cpf1은 표적의 5' 상류에 위치한 "TTN" PAM 모티프를 선호한다. 이것은 Cas9 시스템에 대한 표적 DNA의 3'에 위치한 "NGG" PAM 모티프와 대조적이다. 일부 구체예에서, 가이드 서열 바로 앞의 우라실 염기는 치환될 수 없다 (Zetsche, B. et al. 2015."Cpf1은 클래스 2 CRISPR-Cas 시스템의 단일 RNA-가이드된 엔도뉴클레아제이다" Cell 163, 759-771, 이는 모든 목적을 위해 그 전체가 본 명세서에 참조로 포함됨).
셋째, Cpf1를 위한 절단 부위는 약 3 ~ 5 개의 염기가 엇갈리게 되어 "끈적한 끝(sticky ends)"을 만든다(Kim et al., "유전체 분석 결과 인간 세포에서 Cpf1 엔도뉴클레아제의 특이성이 밝혀졌다." 2016 년 6 월 6 일 온라인 발행). 3-5 bp 돌출부가 있는 이러한 끈적한 끝은 NHEJ-매개-라이게이션을 촉진하고 매칭되는 끝을 갖는 DNA 단편의 유전자 편집을 개선하는 것으로 생각된다. 절단 부위는 PAM이있는 5' 말단에서 먼 표적 DNA의 3' 말단에 있다. 절단 위치는 통상적으로 비-혼성화된 가닥의 18 번째 염기와 crRNA에 혼성화된 상보적 가닥의 해당 23 번째 염기를 따른다.
넷째, Cpf1 복합체에서 "시드(seed)" 영역은 가이드 서열의 처음 5nt 내에 위치한다. Cpf1 crRNA 시드 영역은 돌연변이에 매우 민감하며 이 영역의 단일 염기 치환조차도 절단 활성을 크게 감소시킬 수 있다 (Zetsche B. et al. 2015 "Cpf1은 클래스 2 CRISPR-Cas 시스템의 단일 RNA-가이드된 엔도뉴클레아제이다" Cell 163, 759-771 참조). 결정적으로 Cas9 CRISPR 타겟과 달리 Cpf1 시스템의 절단 부위와 시드 영역는 겹쳐지지 않는다. 올리고를 표적화하는 Cpf1 crRNA 설계에 대한 추가 지침은 (Zetsche B. et al. 2015. "Cpf1은 Class 2 CRISPR-Cas 시스템의 단일 RNA-가이드된 엔도뉴클레아제이다" Cell 163, 759-771)에서 확인할 수 있다.
통상의 기술자는 본 명세서에 개시된 Cpf1이 임의의 소스로부터 유래되거나 단리된 임의의 변이체일 수 있으며, 이들 중 다수는 관련업계에 공지되어 있음을 이해할 것이다. 예를 들어, 일부 구체예에서, 본 개시 내용의 Cpf1 펩티드는 도 2에 개시되어 있는 FnCPF1 (예를 들어, 서열 번호 2), AsCpf1 (예를 들어, 도 16), LbCpf1 (예를 들어, 도 17) 또는 다양한 다른 미생물 종으로부터의 많은 공지된 Cpf1 단백질, 및 이들의 합성 변이체를 포함할 수 있다.
일부 구체예에서, 조성물은 Cpf1 폴리펩티드를 포함한다. 일부 구체예에서, Cpf1 폴리펩티드는 효소적으로 활성이고, 예를 들어 Cpf1 폴리펩티드는 가이드 RNA에 결합될 때 표적 핵산을 절단한다. 일부 구체예에서, Cpf1 폴리펩티드는 야생형 Cpf1 폴리펩티드에 비해 (예를 들어, 도 2, 16, 또는 17에 도시된 아미노산 서열을 포함하는 Cpf1 폴리펩티드에 비해) 감소된 효소 활성을 나타내고, DNA 결합 활성을 유지한다.
일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 % 이상, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열의 100 개의 아미노산 내지 200 개의 아미노산 (aa), 200 aa 내지 400 aa, 400 aa 내지 600 aa, 600 aa 내지 800 aa, 800 aa 내지 1000 aa, 1000 aa 내지 1100 aa, 1100 aa 내지 1200 aa, 또는 1200 aa 내지 1300 aa의 연속적인 스트레치에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열의 Cpf1 폴리펩티드의 RuvCI 도메인에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열의 Cpf1 폴리펩티드의 RuvCII 도메인에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열의 Cpf1 폴리펩티드의 RuvCIII 도메인에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구체예에서, Cpf1 폴리펩티드는 야생형 Cpf1 폴리펩티드에 비해 (예를 들어, 도 2, 16 또는 17에 도시된 아미노산 서열을 포함하는 Cpf1 폴리펩티드에 비해) 감소된 효소 활성을 나타내고, DNA 결합 활성을 유지한다. 일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고; 도 2, 16, 또는 17에 도시된 아미노산 서열의 아미노산 917에 상응하는 아미노산 잔기에서 하나의 아미노산 치환 (예를 들어, D → A 치환)을 포함한다. 일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고; 도 2, 16, 또는 17에 도시된 아미노산 서열의 아미노산 1006에 상응하는 아미노산 잔기에서 하나의 아미노산 치환 (예를 들어, E → A 치환)을 포함한다. 일부 구체예에서, Cpf1 폴리펩티드는 도 2, 16, 또는 17에 도시된 아미노산 서열에 대해 30 % 이상, 35 % 이상, 40 % 이상, 45 % 이상, 50 % 이상, 55 % 이상, 60 % 이상, 65 %, 70 % 이상, 75 % 이상, 80 % 이상, 85 % 이상, 90 % 이상, 95 % 이상, 90 % 이상, 또는 100 %의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고; 도 2, 16, 또는 17에 도시된 아미노산 서열의 아미노산 1255에 상응하는 아미노산 잔기에서 하나의 아미노산 치환 (예를 들어, D → A 치환)을 포함한다.
일부 구체예에서, Cpf1 폴리펩티드는 융합 폴리펩티드이며, 예를 들어 여기서 Cpf1 융합 폴리펩티드는 a) Cpf1 폴리펩티드; 및 b) 이종 융합 파트너를 포함한다. 일부 구체예에서, 이종 융합 파트너는 Cpf1 폴리펩티드의 N-말단에 융합된다. 일부 구체예에서, 이종 융합 파트너는 Cpf1 폴리펩티드의 C-말단에 융합된다. 일부 구체예에서, 이종 융합 파트너는 Cpf1 폴리펩티드의 N-말단 및 C-말단 둘다에 융합된다. 일부 구체예에서, 이종 융합 파트너는 Cpf1 폴리펩티드 내에 내부적으로 삽입된다.
적합한 이종 융합 파트너는 NLS, 에피토프 태그, 형광 폴리펩티드 등을 포함한다.
연결(link)된 가이드 RNA 및 공여자 핵산
한 측면에서, 본 발명은 RNA-가이드된 엔도뉴클레아제 (예를 들어, Cas9 또는 Cpf1 폴리펩티드), 가이드 RNA 및 공여자 폴리뉴클레오티드를 포함하는 CRISPR 시스템을 포함하는 복합체를 제공하며, 여기서 가이드 RNA 및 공여자 폴리뉴클레오티드는 연결된다. 본 명세서에서 예시되는 바와 같이, 가이드 RNA 및 공여자 폴리뉴클레오티드는 공유 또는 비공유적으로 연결될 수 있다. 한 구체예에서, 가이드 RNA 및 공여자 폴리뉴클레오티드는 화학적으로 라이게이션된다. 또 다른 구체예에서, 가이드 RNA 및 공여자 폴리뉴클레오티드는 효소적으로 라이게이션된다. 한 구체예에서, 가이드 RNA 및 공여자 폴리뉴클레오티드는 서로 혼성화한다. 또 다른 구체예에서, 가이드 RNA 및 공여자 폴리뉴클레오티드는 둘 다 브릿지 서열에 혼성화한다. 이러한 혼성화 방식이 얼마든지 가능하다.
디아미나제
일부 구체예에서, 복합체 또는 조성물은 디아미나제 (예를 들어, 아데닌 염기 편집기)를 추가로 포함한다. 본 명세서에 사용된 용어 "디아미나제" 또는 "디아미나제 도메인"은 분자로부터 아민기의 제거 또는 탈아미노화를 촉매하는 효소를 지칭한다. 일부 구체예에서, 디아미나제는 시티딘 디아미나제이며, 시티딘 또는 데옥시시티딘의 가수 분해적 탈아미노화를 촉매하여 각각 우리딘 또는 데옥시우리딘으로 하는 것이다. 일부 구체예에서, 디아미나제는 시토신의 디아미나제이며, 시토신의 가수 분해적 탈아미노화를 촉매하여 우라실 (예를 들어, RNA에서) 또는 티민 (예를 들어, DNA에서)으로 하는 것이다.
일부 구체예에서, 디아미나제는 아데닌 또는 아데노신의 가수분해적 탈 아미노화를 촉매하는 아데노신 디아미나제다. 일부 구체예에서, 디아미나제 또는 디아미나제 도메인은 아데노신 또는 데옥시아데노신의 가수분해성 탈아미노화를 각각 이노신 또는 데옥시이노신으로 촉매하는 아데노신 디아미나제다. 일부 구체예에서, 아데노신 디아미나제는 데옥시리보핵산(DNA)에서 아데닌 또는 아데노신의 가수분해적 탈아미노화를 촉매한다. 본 명세서에서 제공되는 아데노신 데아민 (예를 들어, 조작된 아데노신 데아미나제, 진화된 아데노신 데아미나제)은 박테리아와 같은 임의의 유기체로부터 유래될 수 있다. 일부 구체예에서, 디아미나제 또는 디아미나제 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 쥐 또는 마우스와 같은 유기체로부터의 자연적으로 발생하는 디아미나제의 변이체이다.
일부 구체예에서, 디아미나제 또는 디아미나제 도메인은 자연에서 발생하지 않는다. 예를 들어, 일부 구체예에서, 디아미나제 또는 디아미나제 도메인은 자연적으로 발생하는 디아미나제에 대해 50 % 이상, 55 % 이상, 60 % 이상, 65 % 이상, 70 % 이상, 75 % 이상 80 % 이상, 85 % 이상 90 % 이상, 95 % 이상, 96 % 이상, 97 % 이상, 98 % 이상, 99 % 이상 또는 99.5 % 이상 동일하다. 일부 구체예에서, 아데노신 디아미나제는 E. coli, S. aureus, S. typhi, S. putrefaciens, H. influenzae, or C. crescentus 와 같은 박테리아에서 유래한다. 일부 구체예에서, 아데노신 디아미나제는 TadA 디아미나제다. 일부 구체예에서, TadA 디아미나제는 E. coli TadA 디아미나제 (ecTadA)이다. 일부 구체예에서, TadA 디아미나제는 절단된 E. coli TadA 디아미나제다. 예를 들어, 절단된 ecTadA는 전장 ecTadA에 비해 하나 이상의 N- 말단 아미노산이 누락될 수 있다. 일부 구체예에서, 절단된 ecTadA는 전장 ecTadA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20 N-말단 아미노산 잔기가 누락될 수 있다. 일부 구체예에서, 절단된 ecTadA는 전장 ecTadA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20 C-말단 아미노산 잔기가 누락될 수 있다. 일부 구체예에서, ecTadA 디아미나제는 N-말단 메티오닌을 포함하지 않는다. 일부 구체예에서, 디아미나제는 APOBEC1 또는 그의 변이체이다.
디아미나제는 본 명세서에 기재된(즉, 조성물로서) 임의의 다른 CRISPR 요소와 접합에 사용될 수 있거나, 또는 디아미나제는 본 명세서에 기재된(즉, 복합체로서) 임의의 다른 CRISPR 요소(예를 들어, Cas9 또는 Cpf1)에 융합될 수 있다 (즉, 복잡한). 특정 구체예에서, 디아미나제는 Cas9, Cpf1, 또는 이의 변이체에 융합된다.
기타 구성 요소
조성물은 핵산 또는 단백질 전달 제제에 전형적으로 사용되는 임의의 다른 성분을 추가로 포함할 수 있다. 예를 들어, 조성물은 지질, 지단백질 (예를 들어, 콜레스테롤 및 유도체), 인지질, 폴리머 또는 리포솜 또는 미셀 전달 비히클의 다른 성분을 추가로 포함할 수 있다. 조성물은 또한 포유 동물 또는 인간과 같은 세포 또는 숙주에 투여하기에 적합한 용매 또는 담체도 포함할 수 있다.
일부 구체예에서, 조성물은 폴리에틸렌 옥사이드 (PEG)를 포함하는 제 2 폴리머를 포함한다. 예를 들어, 조성물은 PEG-pAsp (DET), PEG-pAsp, PEG-pAsp (DET)의 유도체, PEG-pAsp의 유도체, 또는 이들의 조합을 포함할 수 있다. 특정 이론에 얽매이지 않고, 이러한 PEG화된 폴리머는 나노입자의 크기와 혈청 단백질 및 표적 세포와의 상호 작용을 제어할 수 있다고 생각된다. 폴리에틸렌 옥사이드 폴리머는 임의의 방식 및 임의의 순서로도 다른 성분과 결합될 수 있다.
일부 구체예에서, 조성물은 하나 이상의 계면 활성제를 추가로 포함한다. 계면 활성제는 비이온성 계면 활성제 및/또는 양쪽성 이온성(zwitterionic) 계면활성제일 수 있다. 예시적인 계면 활성제의 목록은 다음을 포함하지만 이에 한정되지 않는다: 폴리옥시에틸렌 소르비탄 에스테르 계면 활성제 (통상 Tweens라고 함), 특히 폴리소르베이트 20 및 폴리소르베이트 80; 에틸렌 옥사이드 (EO), 프로필렌 옥사이드 (PO) 및/또는 부틸렌 옥사이드 (BO), 선형 EO/PO 블록 공폴리머와 같이 DOWFAX ™ 상품명으로 판매됨; 옥톡시놀, 이는 반복되는 에톡시(옥시-1,2-에탄디일) 기의 수에서 다양할 수 있는 있는데, 특히 옥톡시놀-9 (Triton X-100, 또는 t-옥틸 페녹시폴리에톡시에탄올)이 특히 중요; (옥틸페녹시)폴리에톡시에탄올 (IGEPAL CA-6301NP-40); 포스파티딜콜린(레시틴)과 같은 인지질; 트리에틸렌글리콜 모노라우릴에테르(Brij 30)와 같은 라우릴, 세틸, 스테아릴 및 올레일 알코올 (Brij 계면 활성제로 알려짐)로부터 유도된 폴리옥시에틸렌 지방에테르; 폴리옥시에틸렌-9-라 우릴 에테르, 및 소르비탄 트리올레이트(Span 85) 및 소르비탄 모노라우레이트와 같은 소르비탄 에스테르(일반적으로 Spans이라고 함). 일부 구체예에서, 계면 활성제는 항응고제 (예를 들어, 헤파린 등)이다. 일부 구체예에서, 조성물은 하나 이상의 제약 상 허용되는 담체 및/또는 부형제를 추가로 포함한다.
일부의 예에서, 성분 (예를 들어, 핵산 성분 (예를 들어, 가이드 핵산 등); 단백질 성분 (예를 들어, Cas9 또는 Cpf1 폴리펩티드, 변이체 Cas9 또는 Cpf1 폴리펩티드); 등)은 표지 모이어티를 포함한다. 본 명세서에 사용된 용어 "표지", "검출 가능한 표지" 또는 "표지 모이어티"는 신호 검출을 제공하는 임의의 모이어티를 지칭하고 분석의 특별한 성질에 따라 크게 달라질 수 있다. 관심있는 표지 모이어티는 직접적으로 감지 가능한 표지 (직접 표지) (예를 들어, 형광 표지) 및 간접적으로 감지 가능한 표지 (간접 표지) (예를 들어, 결합 쌍 구성원)를 모두 포함한다. 형광 표지는 임의의 형광 표지 (예를 들어, 형광 염료 (예를 들어, 플루오레세인, 텍사스 레드, 로다 민, ALEXAFLUOR® 표지, 등)), 형광 단백질 (예를 들어, 녹색 형광 단백질 (GFP), 강화 GFP (EGFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP), 시안 형광 단백질 (CFP), 체리, 토마토, 귤, 및 이의 임의의 형광 유도체) 등)일 수 있다. 본 명세서 방법에서 사용하기에 적합한 (직접적으로 또는 간접적으로) 검출 가능한 표지 모이어티는 분광, 광화학, 생화학, 면역 화학, 전기, 광학, 화학, 또는 기타 수단에 의해 검출될 수 있는 임의의 모이어티를 포함한다. 예를 들어, 적절한 간접 표지는 비오틴 (결합 쌍 구성원)을 포함하는데, 이는 스트렙타비딘 (그 자체가 직접적으로 또는 간접적으로 표지될 수 있음)에 의해 결합될 수 있는 것이다. 표지는 또한 다음을 포함할 수 있다: 방사성 표지 (직접 표지) (예를 들어, 3H, 125I, 35S, 14C 또는 32P); 효소 (간접 표지) (예를 들어, 퍼옥시다제, 알칼리성 포스파타제, 갈락토시다제, 루시페라제, 글루코스 산화효소, 등); 형광 단백질 (직접 표지) (예를 들어, 녹색 형광 단백질, 적색 형광 단백질, 황색 형광 단백질, 및 이의 편리한 임의의 유도체); 금속 표지 (직접 표지); 비색(colorimetric) 표지; 결합 쌍 구성원; 등. "결합 쌍의 파트너" 또는 "결합 쌍 구성원"은 제 1 및 제 2 모이어티 중 하나를 의미하며, 여기서 제 1 및 제 2 모이어티는 서로에 대한 특이적 결합 친화성을 갖는다. 적합한 결합 쌍은 다음을 포함하되 이에 한정되지는 않는다: 항원/항체 (예를 들어, 디곡시게닌/항-디곡시게닌, 디니트로페닐(DNP)/항-DNP, 단실-X-항-단실, 플루오레세인/항-플루오레세인, 루시퍼 옐로우/항-루시퍼 옐로우 및 로다민 항-로다민), 비오틴/아비딘(또는 비오틴/스트렙타비딘) 및 칼모듈린 결합 단백질(CBP)/칼모듈린. 임의의 결합 쌍 구성원이 간접적으로 검출 가능한 표지 모이어티로서 사용하기에 적합할 수 있다.
임의의 주어진 구성원, 또는 구성원의 조합은 표지되지 않거나, 또는 표지 모이어티로 검출 가능하게 표지될 수 있다. 일부 구체예에서, 2 개 이상의 성분이 표지 될 때, 이들은 서로 구별될 수 있는 표지 모이어티로 표지될 수 있다.
캡슐화 및 나노입자
조성물의 일부 구체예에서, 폴리머는 핵산 및/또는 폴리펩티드와 결합하고 핵산 및/또는 폴리펩티드를 부분적으로 또는 완전히 캡슐화한다. 조성물은 일부 제제에서는 폴리머 및 핵산 및/또는 폴리펩티드를 포함하는 나노입자를 제공할 수 있다.
일부 구체예에서, 조성물은 본 명세서에 기재된 폴리머 및 핵산 또는 폴리펩티드 이외에 코어 나노입자를 포함할 수 있다. 금속 (예를 들어, 금) 나노입자 또는 폴리머 나노입자를 포함하여, 임의의 적합한 나노입자가 사용될 수 있다.
본 명세서에 기재된 폴리머 및 핵산 (예를 들어, 가이드 RNA, 공여자 폴리뉴클레오티드, 또는 둘 다) 또는 폴리펩티드는 나노입자 표면에 직접 또는 간접적으로 접합될 수 있다. 예를 들어, 본 명세서에 기재된 폴리머 및 핵산 (예를 들어, 가이드 RNA, 공여자 폴리뉴클레오티드, 또는 둘 다) 또는 폴리펩티드는 나노입자의 표면에 직접적으로 또는 개재 링커를 통해 간접적으로 접합될 수 있다.
모든 유형의 분자를 링커로 사용할 수 있다. 예를 들어 링커는 2 개 이상의 탄소 원자 (예를 들어, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 탄소 원자)를 포함하는 지방족 사슬일 수 있으며, 케톤, 에테르, 에스테르, 아미드, 알코올, 아민, 우레아, 티오우레아, 술폭시드, 술폰, 술폰 아미드, 및 이황화 작용기를 포함하는 하나 이상의 작용기로 치환될 수 있다. 한다. 나노입자가 금을 포함하는 구체예에서, 링커는 임의의 티올-함유 분자일 수 있다. 티올기와 금의 반응은 공유 황화물(-S-) 결합을 생성한다. 링커 설계 및 합성은 관련업계에 잘 알려져있다.
일부 구체예에서, 나노입자에 접합된 핵산은 본 명세서에 기술된 하나 이상의 요소 (예를 들어, Cas9 폴리펩티드, 및 가이드 RNA, 공여자 폴리뉴클레오티드, 및 Cpf1 폴리펩티드)에 비공유 결합하도록 역할을 하여 나노입자-핵산 접합체로 하는 링커 핵산이다. 예를 들어, 링커 핵산은 가이드 RNA 또는 공여자 폴리뉴클레오티드에 혼성화하는 서열을 가질 수 있다.
나노입자(예를 들어, 콜로이드 금속 (예를 들어, 금) 나노입자; 생체 적합성 폴리머를 포함하는 나노입자)에 접합된 핵산은 임의의 적절한 길이를 가질 수 있다. 핵산이 가이드 RNA 또는 공여자 폴리뉴클레오티드인 경우, 그러한 길이는 본 명세서에서 논의되고 관련업계에 공지된 바와 같이 이러한 분자에 적합할 것이다. 핵산이 링커 핵산인 경우, 그것은 링커에 적합한 임의의 길이, 예를 들어 10 개 뉴클레오티드 (nt) 내지 1000 nt, 예를 들어 약 1 nt 내지 약 25 nt, 약 25 nt 내지 약 50 nt, 약 50 nt 내지 약 100 nt, 약 100 nt 내지 약 250 nt, 약 250 nt 내지 약 500 nt, 또는 약 500 nt 내지 약 1000 nt 의 길이를 가질 수 있다. 일부 예에서, 나노입자 (예를 들어, 콜로이드성 금속 (예를 들어, 금) 나노입자; 생체 적합성 폴리머를 포함하는 나노입자)에 접합된 핵산은 1000 nt보다 긴 길이를 가질 수 있다.
나노입자에 연결된 (예를 들어, 공유적으로 연결된; 비공유적으로 연결된) 핵산이 본 개시 내용의 복합체에 존재하는 가이드 RNA 또는 공여자 폴리뉴클레오티드의 적어도 일부에 혼성화하는 뉴클레오티드 서열을 포함하는 경우, 그것은 혼성화를 촉진하기에 충분한 가이드 RNA 또는 공여자 폴리뉴클레오티드 서열의 보체의 영역에 대한 서열 동일성의 영역을 갖는다. 일부 구체예에서, 본 개시 내용의 복합체에서 나노입자에 연결된 핵산은 복합체 내에 존재하는 가이드 RNA 또는 공여자 폴리뉴클레오티드의 10 개 내지 50 개의 뉴클레오티드 (예를 들어, 10 개 뉴클레오티드 (nt) 내지 15 nt, 15 nt 내지 20 nt, 20 nt 내지 25 nt, 25 nt 내지 30 nt, 30 nt 내지 40 nt, 또는 40 nt 내지 50 nt)에 대해 50 % 이상, 60 % 이상, 70 % 이상, 80 % 이상, 90 % 이상, 95 % 이상, 98 % 이상, 99 % 이상, 또는 100 %의 뉴클레오티드 서열 동일성을 갖는다.
일부 구체예에서, 나노입자에 연결된 (예를 들어, 공유적으로 연결된; 비공유적으로 연결된) 핵산은 공여자 폴리뉴클레오티드거나, 또는 공여자 폴리뉴클레오티드와 동일하거나 실질적으로 동일한 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 나노입자에 연결된 (예를 들어, 공유적으로 연결된; 비공유적으로 연결된) 핵산은 공여자 DNA 주형에 상보적인 뉴클레오티드 서열을 포함한다.
사용 방법
본 명세서에서 제공된 폴리머는 임의의 목적으로 사용될 수 있지만, 다양한 목적을 위해 생물학적 분자 (예를 들어, 핵산 및 폴리펩티드)와 조합하고 일부 구체예에서는 캡슐화하는데에 특히 유용한 것으로 여겨진다. 한 측면에서, 본 명세서에 기재된 바와 같은 본 발명의 폴리머를 생물학적 분자와 조합함으로써 폴리펩티드 또는 핵산과 같은 생물학적 분자를 캡슐화하는 방법이 제공되고, 이에 의해 폴리머는 생분자를 부분적으로 또는 완전히 캡슐화한다. 폴리머에 의해 부분적으로 또는 완전히 캡슐화된 생분자는 때때로 나노입자로 지칭된다.
또한 핵산 및/또는 폴리펩티드를 세포에 전달하는 방법이 본 명세서에 제공되며, 여기서 세포는 시험관 내(in vitro) 또는 생체 내(in vivo)일 수 있다. 상기 방법은 본 명세서에 기재된 바와 같은 폴리머 및 핵산 및/또는 폴리펩티드를 포함하는 조성물을 세포 또는 세포를 함유하는 개체에 투여하는 것을 포함한다. 이 방법은 모든 유형의 세포 또는 개체에 대해 사용될 수 있지만, 특히 포유류 세포 (예를 들어, 인간 세포)에 유용하다. 일부 구체예에서, 폴리머는 핵산 및/또는 폴리펩티드가 표적 세포 또는 조직 (예를 들어, 말초 신경계의 세포 또는 조직, 중추 신경계, 개체의 눈, 간, 근육, 폐, 뼈 (예를 들어, 조혈 세포), 또는 종양 세포 또는 조직)에 주로 또는 배타적으로 전달되도록 표적화제를 포함한다.
CRISPR 시스템의 하나 이상의 성분을 포함하는 조성물과 함께 사용될 때, 본 방법은 표적 핵산 또는 유전자의 편집을 유도하기 위해 사용될 수 있다. 일부 구체예에서, 표적 핵산을 개질하는 방법은 상동성-유도성 수복 (homology-directed repair, HDR)을 포함한다. 일부 구체예에서, HDR을 수행하기 위한 본 개시 내용의 복합체의 사용은 HDR의 효율을 적어도 1 %, 적어도 2 %, 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 10%, 적어도 15 %, 적어도 20 %, 적어도 25 % 또는 25 % 이상으로 제공한다. 일부 구체예에서, 표적 핵산을 개질하는 방법은 비-상동 말단 결합 (non-homologous end joining, NHEJ)을 포함한다. 일부 구체예에서, HDR을 수행하기 위한 본 개시 내용의 복합체의 사용은 적어도 1 %, 적어도 2 %, 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 10%, 최소 15 %, 최소 20 %, 최소 25 %, 또는 25 % 이상의 NHEJ의 효율을 제공한다.
하기 실시예는 본 발명을 추가로 설명하지만, 물론 그 범위를 제한하는 것으로 해석되어서는 안된다.
실시예 1
이 실시예는 본 명세서에 기술된 폴리머의 합성에 대한 지침을 제공한다. 합성에는 아크릴레이트와의 함께 마이클 첨가반응이 포함된다. 예시적인 절차는 다음과 같다.
반응식 1.
Figure pct00051
유리 바이알에 pAsp (DET) (5 mg, 0.22 μmol)를 디메틸 술폭시드 ("DMSO"; 700 mL)로 현탁했다. 현탁액에 30 μL의 트리메틸아민 ("TEA")을 첨가하고 생성된 현탁액을 모든 폴리머가 완전히 용해될 때까지 교반하였다. 반응 혼합물에 아크릴레이트 1 (1.15 mg, 5.5 μmol)을 첨가하고 반응 혼합물을 실온에서 40 시간 동안 교반하였다. 조 생성물을 아세토니트릴로 침전시켜 정제하고 아세토니트릴로 3 회 세척하여 4mg의 폴리머 5를 수득하였으며, 여기서 (a + b)는 55이고 (c + d)는 25이다. 1H NMR (400MHz, D2O): δ 4.8-4.6 (bs, 4H), 4.2 (t, 2H), 3.4-2.4 (m, 40H).
반응식 1에 의해 입증된 바와 같이, 아크릴레이트 1을 사용한 마이클 첨가는 아민계 결합을 생성한다(예를 들어, 폴리머 5 참조). 따라서 pAsp (DET)의 원래 아민 기능은 그대로 유지된다.
유사한 절차를 사용하여 화학식 1의 추가 폴리머 (예를 들어, 폴리머 1-4 및 6-12)를 제조할 수 있다. 친핵성 치환을 사용하여 폴리머 28 및 29를 제공할 수 있다.
또한, 상기 절차는 상이한 시작 폴리머, 예를 들어 실시예 7에 나타낸 바와 같이 제조된 폴리머에 적용하여 화학식 1의 다른 폴리머를 제공할 수 있다 (예를 들어, 폴리머 30 또는 32로 시작하여 말단 질소에서 탈메틸화되어 1차 또는 2 차 아민ㄷ을 제공하고, 상기 방법은 폴리머 13-24)를 제공할 수 있다.
실시예 2
이 실시예는 본 명세서에 기술된 폴리머의 합성에 대한 지침을 제공한다. 합성에는 아크릴레이트와의 함께 마이클 첨가반응이 포함된다. 예시적인 절차는 다음과 같다.
반응식 2.
Figure pct00052
유리 바이알에 pASP (DET) (5mg, 0.22 μmol)를 무수 메탄올 (300 μL)로 현탁하고 30 μL의 트리에틸아민 ("TEA")을 현탁액에 첨가했다. 생성된 용액을 실온에서 10 분 동안 교반하여 폴리머를 완전히 용해시켰다. 용액을 300μL의 DCM으로 희석했다. 반응 혼합물에 30 μ L의 DCM 중의 아크릴레이트 2 (1.05 mg, 5.5 μmol)를 첨가하고, 반응 혼합물을 실온에서 48시간 동안 교반하였다. 조 생성물을 과량의 디에틸 에테르에서 침전시켜 정제하여 4.3 mg의 폴리머 8을 수득하였으며, 여기서 (a + b)는 55이고 (c + d)는 25이다. 1H NMR (400MHz, D2O): δ 4.8-4.6 (bs, 4H), 4.03 (t, 2H), 3.8-2.5 (m, 27H), 1.5 (t, 2H), 1.25 (s, 12H), 0.7 (t, 3H).
반응식 2에 의해 입증된 바와 같이, 아크릴레이트 2를 사용한 마이클 첨가반응은 아민계 결합을 생성한다 (예를 들어, 폴리머 8 참조). 따라서 pAsp (DET)의 원래 아민 기능은 그대로 유지된다.
실시예 3
이 실시예는 Cas9 리보핵단백질 ("Cas9 RNP")을 세포로 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다. Cas9 RNP 전달의 수준은 녹색 형광 단백질 ("GFP") 유도성 HEK293T ("GFP-HEK") 세포를 사용하여 평가되었다.
10pmole의 Cas9 RNP를 대조군으로서의 (i) 폴리머 5, (ii) 폴리머 8, 및 (iii)pAsp (DET)와 혼합했다. GFP-HEK 세포는 비혈청 조건에서 생성된 혼합물로 처리되었다. 폴리머를 0.375 μg, 0.75 μg, 1.25 μg, 2.5 μg, 5 μg, 및 10 μg의 용량으로 첨가하여 최고의 효능과 최소 독성을 제공하는 최적의 용량을 스크리닝했다. 결과는 도 3에 제시되어 있다.
도 3은 세 가지 혼합물로 처리된 GFP-HEK 세포의 GFP (-) 퍼센트로 측정된 Cas9 RNP 전달의 수준을 보여준다. 3 가지 폴리머 (즉, 폴리머 5, 폴리머 8, 및 pAsp (DET)) 모두 0.375 μg 내지 2.5 μg의 폴리머 투여량에서 유사한 수준의 유전자 편집을 나타냈다. 그러나 폴리머 8과 pAsp (DET)는 폴리머 용량이 5μg 및 10μg 일 때 유의한 수준의 세포 독성 (세포 생존율 50 % 미만)을 나타냈다. 반면, 폴리머 5는 GFP % 수준에서 입증된 바와 같이 5 μg의 폴리머 투여량에서 유의한 독성없이 최적의 전달을 보여주었다.
실시예 4
이 실시예는 loxP 서열을 변화시킬 수 있는 Cre 재조합효소를 세포로 전달하기 위한 본 명세서에 기재된 폴리머의 능력을 입증한다.
loxP (도 4의 회색 화살표 참조) 사이에 정지 서열을 갖는 ai9 마우스의 1 차 근아세포를 사용하여 전달된 Cre 재조합효소의 수준을 RFP 발현에 의해 측정할 수 있다. Ai9 리포터 대립 유전자는 loxP 서열이 측면에 있는 STOP 카세트를 포함하는데 이에 의해 RFP 전사를 방지한다. Cre 재조합효소는 loxP 서열 옆에 있는 STOP 카세트를 제거하고 RFP의 전사를 허용한다.
Cre 재조합효소(2 ug)를 대조군으로서의 (i) 폴리머 5 및 (ii)pAsp (DET)와 혼합하여 나노입자를 생성하였다. 폴리머를 1.25 μg, 2.5 μg, 5 μg, 10 μg 및 20 μg의 용량으로 첨가하여 의 효능과 최소 독성을 제공하는 최적의 용량을 선별했다. Ai9 근모세포를 생성된 나노입자로 처리하고, RFP+ 집단은 처리 4 일 후 유세포 분석을 사용하여 정량하였다. 결과는 도 4에 제시되어 있다.
도 5는 RFP+ 발현량에 의해 측정된 바와 같이 1차 근모세포로의 Cre 재조합효소 전달의 수준을 보여준다. 도 5에 도시된 바와 같이. 5, 폴리머 5는 5μg, 10μg, 및 20μg의 폴리머 투여량에서 대조군 (pAsp (DET))보다 더 높은 수준의 RFP+ 발현을 생성였고, 그에 의해 폴리머 5가 더 높은 투여량에서 pAsp (DET)보다 Cre 재조합효소 전달에 있어서 더 효능이 있음을 입증했다.
실시예 5
이 실시예는 마우스에서 생체 내(in vivo) Cre 재조합효소를 전달하는 본 명세서에 기재 된 폴리머의 능력을 입증한다.
Ai9 마우스에 대해 (i) 오로지 Cre 재조합효소 및 (ii) Cre 재조합효소를 캡슐화하는 PEG화된 폴리머 나노입자 (즉, 폴리머 5 및 PEG-폴리머의 혼합물)를 주사했다. Cre 재조합효소(35ug)를 폴리머 5 및 PEG-PAsp (DET) 혼합물 (100ug)과 함께 전달했다. 폴리머 5와 PEG-PAsp (DET)의 동시-혼합(Co-mixing)은 폴리머 나노입자의 크기를 제어하는데에 도움이 된다. 장딴지근을 주사 2 주 후 ai9 마우스로부터 채취하였다. 채취된 근육 단면을 이미지화하여 DNA 재조합의 결과로 생성된 적색 형광 단백질을 시각화했다. 결과는 도 6에 제시되어 있다.
도 6은 마우스 근육에서 Cre 재조합효소 전달이 폴리머 나노입자에 의해 향상되었음을 보여준다. Cre 재조합효소를 사용한 주사는 적은 적색 형광 단백질이 덜 시각화된 것에서 보는 바와 같이 RFP 발현이 제한된 근육 영역에서만 되도록 하였다. 반면에 폴리머 나노입자에 의해 캡슐화된 Cre 재조합효소를 주입하면 장딴지근의 대부분의 영역에서 RFP 발현이 나타난다.
단백질 전달의 문제는 단백질이 얼마나 광범위하게 전달되고 조직의 넓은 영역에 영향을 미치는가이다. 폴리머 5와 PEG-폴리머의 혼합물에서 유래된 나노입자는 ai9 마우스에서 Cre 재조합효소를 효능적으로 전달하고 분포를 도울 수 있다.
실시예 6
이 실시예는 Cas9를 GFP 발현 뉴런 세포로 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다.
뉴런 전구 세포로부터 분화된 GFP 발현 뉴런 세포를 사용하여 폴리머 5가 Cas9 RNP를 뉴런 세포로 전달할 수 있는지 여부를 조사했다. GFP 발현 뉴런 세포를 전달 방법으로서 본 명세서에 기재된 폴리머를 사용하여 sgRNA 및 Cas9 단백질로 처리하였다. 처리 7 일 후, 세포에서 게놈 DNA를 추출하고 GFP 유전자의 PCR 증폭을 수행하였다. Cas9에 의한 유전자 편집으로 인한 인델(indel) 돌연변이의 빈도를 측정하기 위해 TIDE 분석 (Desktop Genetics, Netherlands Cancer Institute의 TIDE 소프트웨어)을 수행했다. 결과는 도 7에 제시되어 있다.
도 7에 의해 입증되는 바와 같이, 폴리머 5는 Cas9 RNP를 전달할 수 있었고 뉴런 세포에서 11 % 인델 돌연변이를 유도했다.
실시예 7
이 실시예는 본 명세서에 기재된 폴리머의 합성에 대한 지침을 제공한다. 합성은 화학식 4의 폴리머를 생성하기 위해 개환 중합 후 추가 개질을 포함한다. 예시적인 절차는 다음과 같다.
반응식 3.
Figure pct00053
폴리머 33의 합성: (a) 토실 클로리드, TEA, DCM; (b) N,N,N-트리메틸에틸렌디아민, K2CO3, 아세토니트릴, 환류; (c) LiAlH4, THF; (d) 7, K2CO3, 아세토니트릴, 환류; (e) LiAlH4, THF; (f) 부틸아민, DCM-DMF (9: 1), 48 시간; (g) 9, NMP, 6 시간.
반응식 3에 의해 입증되는 바와 같이, 화합물 10의 개환 중합은 발전하여 n = 63 인 화합물 11을 형성하는데, 이는 화합물 9로 처리할 때 폴리머 33을 형성하도록 추가로 개질될 수 있다.
유사한 절차를 사용하여 화학식 4의 다른 폴리머 (예를 들어, 폴리머 30-32)를 제조할 수 있다. 추가로, 폴리머의 측쇄상의 말단 3 차 아민은 폴리머 39-42를 제공하기 위해 일상적인 기술에 의해 탈메틸화될 수 있다.
실시예 8
이 실시예는 loxP 서열을 변화시킬 수 있는 Cre 재조합효소를 세포로 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다.
HEK 293T (도 8 참조)에서 신호등 리포터의 바이러스 형질 도입으로 생성 된 신호등 리포터 (TLR)-HEK 293T 세포를 사용하여, 전달된 Cre 재조합효소의 수준을 적색 형광 단백질 ("RFP")의 발현으로 측정할 수 있다. HEK 293T의 신호등 리포터는 STOP 카세트, 및 GFP 서열 옆에 있는 두 개의 loxP 서열이 포함되어 있으므로 이에 의해 RFP 전사를 방지하고, 결과적으로 Cre가 없을 때 GFP를 발현한다. Cre 재조합효소는 loxP 서열을 제거하고, RFP의 전사를 허용한다.
Cre 재조합효소 (1ug)를 실시예 7에서 제조한 폴리머 33, 또는 비교용으로서 pAsp (DET)와 혼합하여 나노입자를 생성하였다. 폴리머를 1.25 μg 또는 2.5 μg의 용량으로 첨가하여 최고의 효능과 최소 독성을 제공하는 최적의 용량을 스크리닝했다. TLR-HEK293T 세포를, 생성된 나노입자로 처리하고, RFP+ 집단을 처리 3 일 후 유세포 분석을 사용하여 정량했다. 결과는 도 9에 제시되어 있다.
도 9는 RFP+ 발현량에 의해 측정된 (TLR)-HEK 293T 세포로의 Cre 재조합효소 전달의 수준을 보여준다. 도 9에 도시된 바와 같이, 폴리머 33은 1.25μg 및 2.5μg의 폴리머 투여량에서 Cre 만 포함된 샘플 및 비교 대상인 pAsp (DET)에 비해 향상된 전달을 제공했다.
실시예 9
이 실시예는 Cas9 리보핵단백질 ("Cas9 RNP")을 세포로 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다. Cas9 RNP 전달의 수준은 녹색 형광 단백질 ("GFP") 유도성 HEK293T ("GFP-HEK") 세포를 사용하여 평가되었다.
15 pmole의 Cas9 RNP (sgRNA + Cas9 단백질)를 실시예 7에서 제조한 폴리머 33, 또는 비교용으로서의 pAsp (DET)와 혼합하여 나노입자를 생성하였다. 폴리머는 2.5 ㎍의 투여량으로 첨가되었다. GFP-HEK 세포는 비-혈청 조건에서 생성된 혼합물로 처리되었다. 결과는 도 10에 제시되어 있다.
도 10은 두 혼합물로 처리된 GFP-HEK 세포의 GFP %에 의해 측정된 Cas9 RNP 전달의 수준을 보여준다. 두 폴리머 (즉, 폴리머 33 및 pAsp (DET))는 대조군에 비해 2.5㎍의 폴리머 투여량에서 Cas9 RNP를 전달하는 능력을 나타냈다. 그러나 폴리머 33은 폴리머 용량 2.5μg에서 pAsp (DET)를 능가했다.
실시예 10
이 실시예는 핵산을 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다. HEK 293T 세포로의 eGFP mRNA 전달의 수준은 녹색 형광 단백질 ("GFP")을 사용하여 평가되었다.
eGFP mRNA (200ng)를 실시예 7에서 제조된 폴리머 33 (600ng)과 혼합하고 5 분 동안 인큐베이션하였다. 생성된 폴리머 나노입자는 OptiMEM 배지에서 HEK 293T 세포에 처리되었다. 24 시간 후, 세포를 플레이트에서 분리하고 유세포 분석으로 분석하였다. 리포펙타민은 eGFP mRNA 전달을 위한 양성 대조군으로 사용되었다. 결과는 도 11에 제시되어 있다.
도 11은 대조군에 비하여 폴리머 33이 HEK 293T 세포에 eGFP mRNA의 증가된 전달을 제공함을 보여준다.
실시예 11
이 실시예는 핵산을 전달하는 본 명세서에 기술된 폴리머의 능력에 인큐베이션 시간이 미치는 영향을 입증한다. HEK 293T 세포로의 eGFP mRNA 전달의 수준은 녹색 형광 단백질 ("GFP")을 사용하여 평가되었다.
eGFP mRNA (200ng)를 실시예 7에서 제조한 폴리머 33 (1.2μg)과 혼합하고 2 분, 5 분, 10 분, 및 30 분 동안 인큐베이션하였다. 생성된 폴리머 나노입자는 OptiMEM 배지에서 HEK 293T 세포에 처리되었다. 24 시간 후, 세포를 플레이트에서 분리하고 유세포 분석으로 분석하였다. 리포펙타민은 eGFP mRNA 전달을 위한 양성 대조군으로 사용되었다. 결과는 도 12에 제시되어 있다.
도 12는 인큐베이션 2 분 내에 형성된 나노입자 및 폴리머 33이 모든 인큐베이션 시간에서 eGFP mRNA의 효율적인 전달을 제공했음을 보여준다.
실시예 12
이 실시예는 mRNA를 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다. HEK 293T 세포로의 적색 형광 단백질 ("RFP") mRNA 전달의 수준은 RFP+ 발현을 사용하여 평가되었다.
RFP mRNA (200ng)를 실시예 7에서 제조된 폴리머 33, 또는 비교용으로서의 pAsp (DET)와 혼합하여 나노입자를 생성하였다. 폴리머 33 및 pAsp (DET)를 120ng의 1.5kDa PEG-PAsp (DET) 폴리머와 조합하여 (i) 600ng 또는 (ii) 480ng의 투여량으로 첨가하였다. 1.5kDa PEG-PAsp (DET) 폴리머는 나노입자의 크기를 조절하는 역할을 할 수 있다. TLR-HEK293T 세포를 생성된 나노입자로 처리하고 처리 24 시간 후 유세포 분석을 사용하여 RFP+ 집단을 정량했다. 결과는 도 13에 제시되어 있다.
도 13은 비교 폴리머 (PAsp (DET))에 비해 폴리머 33이 1.5 kDa PEG-PAsp (DET) 폴리머의 부재하에 HEK 293T 세포로의 mRNA 전달을 개선했음을 보여준다. 또한, 도 13은 600ng의 폴리머 33이 120ng의 1.5kDa PEG-PAsp (DET) 폴리머와 조합하여 480ng 폴리머 33보다 HEK 293T 세포에 mRNA를 더 효율적으로 전달한다는 것을 보여준다.
실시예 13
이 실시예는 mRNA를 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다. HEK 293T 세포로의 적색 형광 단백질 ("RFP") mRNA 전달의 수준은 RFP+ 발현을 사용하여 평가되었다.
RFP mRNA (200ng)를 실시예 7에서 제조된 폴리머 33, 또는 비교용으로서의 pAsp (DET)와 혼합하여 나노입자를 생성하였다. 폴리머 33 및 pAsp (DET)를 1.5 kDa PEG-PAsp (DET) 폴리머 200ng과 조합하여 (i) 1μg 또는 (ii) 800ng의 투여량으로 첨가하였다. 1.5kDa PEG-PAsp (DET) 폴리머는 나노입자의 크기를 조절하는 역할을 할 수 있다. TLR-HEK293T 세포를 생성된 나노입자로 처리하고 처리후 24 시간에 유세포 분석을 사용하여 RFP+ 집단을 정량했다. 결과는도 14에 제시되어 있다.
도 14는 비교 폴리머 (PAsp (DET))에 비하여, 폴리머 33이 1.5kDa PEG-PAsp (DET) 폴리머의 존재 및 부재 둘다에서 200 ng의 1.5 kDa PEG-PAsp (DET) 폴리머와 조합하여 i)1 μg 또는 (ii) 800 ng의 투여량으로 HEK 293T 세포에 대해 mRNA의 유사한 전달을 제공함을 보여준다.
실시예 14
이 실시예는 상이한 완충액을 사용하여 Cas9 리보핵단백질 ("Cas9 RNP")을 세포 내로 전달하는 본 명세서에 기재된 폴리머의 능력을 입증한다. Cas9 RNP 전달의 수준은 녹색 형광 단백질 ("GFP") 유도성 HEK293T ("GFP-HEK") 세포를 사용하여 평가되었다.
30 pmole의 Cas9 RNP (sgRNA + Cas9 단백질)를 실시예 7에서 제조한 4 μg의 폴리머 33, 또는 비교용으로서의 5 μg의 또는 pAsp (DET)와 혼합하여 나노입자를 생성하였다. GFP-HEK 세포 (200,000 개 세포)를 세 가지 상이한 완충 조건, 즉 (i) (4-(2-히드록시에틸)-1-피페라진 에탄술폰산) ("HEPES"; 20mM), (ii) Opti-MEMTM (Thermo Fisher Scientific; Waltham, MA로부터 구매가능) 또는 Dulbecco Modified Eagle's Medium(Thermo Fisher Scientific; Waltham, MA로부터 구매가능)으로 처리했다. 결과는도 15에 제시되어 있다.
도 15는 세가지 상이한 완충조건 하에서 두 가지 혼합물 (즉, 폴리머 33의 4μg 또는 5μg 또는 pAsp (DET))으로 처리된 GFP-HEK 세포의 GFP(-) 퍼센트로 측정한 Cas9 RNP 전달의 수준을 보여준다. 두 폴리머(즉, 폴리머 33 및 pAsp (DET))는 세 가지 상이한 완충액에 대해 동일한 경향을 나타내었는데 다만 HEPES가 Opti-MEMTM 을 능가하고 Opti-MEMTM 이 DMEM을 능가하였다. 또한 폴리머 33은 세 가지 완충액 모두에서 pAsp (DET)를 능가했다.
실시예 15
이 실시예는 핵산을 안정적으로 캡슐화하는 본 명세서에 기재된 폴리머의 능력을 입증한다.
본 개시 내용의 폴리머 2, 5, 및 33 (1 ug/uL, 10 mM HEPES)을 올리고뉴클레오티드(1 ug/uL, 10 mM HEPES)와 5: 1 질량비로 피펫 혼합한 후 실온에서 10 분 동안 방치하여 나노입자를 형성하였다. 그것들은 사용하지 않을 때 4C에 보관되었다. 저장품(stock)으로부터의 나노입자를 10mM HEPES로 ~ 1: 20 비율로 희석하고 준비 후 0, 3, 5 및 7 일 (n = 1)에 동적 광산란 (DLS)로 특성을 규명하였다. 평균 입자 크기의 강도는 도 18에 게시되어 있다.
150 nm 내지 350 nm 의 나노입자 크기가 관찰되었다. 폴리머는 7 일 동안 최소한의 크기 변화를 보여 나노입자가 안정적임을 나타내었다. pAsp [DET]는 대조군으로서 주행시켰고(데이터는 표시되지 않음), 테스트된 다른 나노입자보다 7 일 째에 크기 변화를 다소 보여주었다.
실시예 16
이 실시예는 본 개시내용에 따른 폴리머의 제조를 설명한다
100 mg (0.0074 mmol)의 폴리(β-벤질 1-아스파테이트) (PBLA)를 3 mL의 NMP에 용해시켰다. 이 반응 혼합물에 1.5 gm의 1,4,7,10-테트라메틸-트리에틸렌 테트라아민을 첨가하고 반응물을 실온(RT)에서 16 시간 동안 교반하였다. 조 반응 혼합물을 디에틸 에테르에 침전시키고 조 생성물을 원심 분리(15 분 동안 5000g)를 통해 수집하였다. 조 생성물을 3 mL의 1M HCl에 용해시키고 물에 대해 투석하여 pH = 6을 얻었다. 생성된 폴리머 용액을 동결 건조하여 백색 분말로서 폴리머 41을 얻었다.
실시예 17
이 실시예는 mRNA를 세포에 전달하기 위해 본 명세서에 기재된 폴리머의 사용을 설명한다.
녹색 또는 적색 형광 단백질을 코딩하는 mRNA를 테스트 폴리머와 혼합하고 표 2에 표시된 여러 다른 세포 유형 중 하나와 결합했다. 형질 감염은 형광의 함수로 측정되었다. 결과는 표 2에 제시되어 있으며, 이는 거의 모든 폴리머가 하나 이상의 세포 유형에서 일정 수준의 형질 감염을 생성했음을 보여준다.
폴리머 간세포 마우스 일차 근 모세포 인간 신경 줄기 세포 HEK293 조혈 줄기 세포
HUH-7 HEPG2 혈청 없음 혈청 혈청 없음 혈청 혈청 없음 혈청 없음
1 0 0 0 0 0 1 0 0.0
2 0 0 0 0 0 1 0 4.1
3 0 0 0 1 12 1 0 0.3
4 0 0 0 0 0 1 1 0.0
5 0 0 3 1 19 3 12 0.2
6 0 0 0 0 0 0 0 0.0
7 9 0 0 1 7 3 6 1.9
8 7 0 N/A N/A N/A N/A N/A N/A
9 0 0 25 0 4 2 3 0.9
10 0 0 8 0 25 3 19 0.7
11 0 0 23 0.5 18 4 25 0.2
12 N/A N/A N/A N/A N/A N/A 9 N/A
33 0 0 26 2 41 4 27 N/A
리포펙타민 84 43 39 52 49 N/A 26 0.0
Mock 0 0 0 0 N/A N/A N/A N/A
pAsp [DET] 0 0 N/A N/A 39 3 28 0.0
N/A = 테스트되지 않음
Mock = mRNA없는 폴리머
녹색 형광 단백질을 코딩하는 mRNA를 사용하여 마우스 1차 근모세포 시험을 수행하였다. 다른 모든 세포 유형은 적색 형광 단백질을 코딩하는 mRNA를 사용하여 테스트되었다.
본 발명을 수행하기 위해 본 발명자들에게 알려진 최상의 모드를 포함하여 본 발명의 바람직한 실시예가 본 명세서에 기술되어 있다. 이러한 바람직한 실시예의 변형은 전술한 설명을 읽을 때 통상의 기술자에게 명백할 수 있다. 본 발명자들은 숙련된 기술자가 이러한 변형을 적절히 사용하기를 기대하고, 본 발명자들은 본 발명이 본 명세서에 구체적으로 설명된 것과 다르게 실시되기를 의도한다. 따라서, 본 발명은 적용가능한 법률에 의해 허용되는 바와 같이 여기에 첨부된 청구 범위에 인용 된 주제의 모든 개질 및 균등물을 포함한다. 더욱이, 모든 가능한 변형에서 전술한 요소의 임의의 조합은 본 명세서에서 달리 지시되거나 문맥에 의해 달리 명백히 모순되지 않는 한 본 발명에 포함된다.
값의 범위가 제공되는 경우, 문맥이 명확하게 달리 명시하지 않는 한, 해당 범위의 상한 및 하한 사이에서 중간에 개재되는 각각의 값은 하한 단위의 10 분의 1까지 그리고 달리 설명되거나 그 설명된 범위 내에서의 중간값은 본 발명에 포함되는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있으며, 또한 언급된 범위에서 특별히 배제된 제한에 따라 본 발명에 포함된다. 명시된 범위가 한계 중 하나 또는 둘 다를 포함하는 경우, 포함된 한계 중 하나 또는 둘 다를 제외한 범위도 본 발명에 포함된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 균등한 임의의 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있지만, 바람직한 방법 및 물질이 이제 기술된다. 본 명세서에 언급된 모든 간행물은 본 명세서에 간행물이 인용되는 연결점에서 그 방법 및/또는 자료를 개시하고 설명하기 위해 참조로 포함된다.
본 명세서 및 첨부된 청구 범위에서 사용된 바와 같이, 단수 형태 "하나", "하나의" 및 "그"는 문맥이 명백하게 달리 지시하지 않는 한 복수 지시 대상을 포함한다는 점에 유의해야한다. 따라서, 예를 들어, "복합체"에 대한 언급은 다수의 그러한 복합체를 포함하고 "Cas9 폴리펩티드"에 대한 언급은 하나 이상의 Cas9 폴리펩티드 및 통상의 기술자에게 공지된 그것의 균등물 등등에 대한 언급을 포함한다. 청구 범위는 임의의 선택적 요소를 배제하기 위해 작성될 수 있다는 점에 유의한다. 따라서, 이 진술은 청구항 구성요소의 인용, 또는 "부정적인" 제한의 사용과 관련하여 "오직", "단독" 등과 같은 배타적 용어 사용에 대한 전제로서 사용되도록 의도되었다.
명확성을 위해 별개의 실시예의 맥락에서 설명된 본 발명의 어떠한 특성은 또한 단일 실시예에서 조합되어 제공될 수도 있다는 것이 이해된다. 반대로, 간결함을 위해 단일 실시예의 맥락에서 설명된 본 발명의 다양한 특징은 또한 개별적으로 또는 임의의 적절한 하위 조합으로 제공될 수 있다. 본 발명에 속하는 실시예들의 모든 조합은 본 발명에 의해 구체적으로 포함되며 마치 각각의 모든 조합이 개별적이고 명시적으로 개시된 것처럼 여기에 개시된다. 또한, 다양한 실시예의 모든 하위 조합 및 이의 요소는 또한 본 발명에 의해 구체적으로 포함되며, 마치 각각의 모든 하위 조합이 개별적으로 명시적으로 본 명세서에 개시된 것처럼 본 명세서에 개시된다.
본 명세서에서 논의된 간행물은 본 출원의 출원일 이전에 그것들의 공개를 위해서만 제공된다. 본 명세서의 어떠한 것도 본 발명이 선행 발명으로 인해 그러한 간행물보다 선행할 자격이 없음을 인정하는 것으로 해석되어서는 안된다. 또한 제공되는 발행일은 개별적으로 확인이 필요한 실제 발행일과 다를 수 있다.
SEQUENCE LISTING <110> GenEdit Inc. <120> CATIONIC POLYMER AND USE FOR BIOMOLECULE DELIVERY <130> 512879 <150> 62663985 <151> 2018-04-27 <150> 62750097 <151> 2018-10-24 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <220> <221> MISC_FEATURE <222> (1)..(1368) <223> AKP81606.1 <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Ser Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 2 <211> 2560 <212> PRT <213> Francisella tularensis <400> 2 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Ser Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Met Ser Ile 1250 1255 1260 Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg 1265 1270 1275 Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala 1280 1285 1290 Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys 1295 1300 1305 Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu 1310 1315 1320 Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn 1325 1330 1335 Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn 1340 1345 1350 Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln 1355 1360 1365 Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe 1370 1375 1380 Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu 1385 1390 1395 Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe 1400 1405 1410 Lys Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile 1415 1420 1425 Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His 1430 1435 1440 Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser 1445 1450 1455 Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu 1460 1465 1470 Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala 1475 1480 1485 Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu Thr 1490 1495 1500 Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe 1505 1510 1515 Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu 1520 1525 1530 Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys 1535 1540 1545 Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr 1550 1555 1560 Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys 1565 1570 1575 Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu 1580 1585 1590 Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val 1595 1600 1605 Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys 1610 1615 1620 Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe 1625 1630 1635 Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe 1640 1645 1650 Lys Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp 1655 1660 1665 Asp Tyr Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln 1670 1675 1680 Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln 1685 1690 1695 Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu 1700 1705 1710 Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His Arg Asp 1715 1720 1725 Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe Ala 1730 1735 1740 Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn 1745 1750 1755 Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp 1760 1765 1770 Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp 1775 1780 1785 Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe 1790 1795 1800 His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp 1805 1810 1815 Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala 1820 1825 1830 Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln 1835 1840 1845 Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser 1850 1855 1860 Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr 1865 1870 1875 Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met 1880 1885 1890 Asn Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu 1895 1900 1905 Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro 1910 1915 1920 Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser 1925 1930 1935 Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn 1940 1945 1950 His Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu 1955 1960 1965 Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp Phe 1970 1975 1980 Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly 1985 1990 1995 Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe 2000 2005 2010 Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn 2015 2020 2025 Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu 2030 2035 2040 Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys 2045 2050 2055 Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp 2060 2065 2070 Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala 2075 2080 2085 Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His 2090 2095 2100 Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys 2105 2110 2115 Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe 2120 2125 2130 Thr Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe 2135 2140 2145 Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu 2150 2155 2160 Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg 2165 2170 2175 Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly 2180 2185 2190 Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg 2195 2200 2205 Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys Asp 2210 2215 2220 Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys 2225 2230 2235 Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala 2240 2245 2250 Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu 2255 2260 2265 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val 2270 2275 2280 Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu 2285 2290 2295 Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg 2300 2305 2310 Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly 2315 2320 2325 Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser 2330 2335 2340 Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys 2345 2350 2355 Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp 2360 2365 2370 Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe 2375 2380 2385 Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr 2390 2395 2400 Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp 2405 2410 2415 Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu 2420 2425 2430 Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly 2435 2440 2445 Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe 2450 2455 2460 Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg 2465 2470 2475 Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val 2480 2485 2490 Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys 2495 2500 2505 Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly 2510 2515 2520 Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu 2525 2530 2535 Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu 2540 2545 2550 Phe Val Gln Asn Arg Asn Asn 2555 2560 <210> 3 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 3 Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile 1 5 10 15 <210> 4 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 4 Ile Val Ile Glu Met Ala Arg Glu 1 5 <210> 5 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 5 Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1 5 10 15 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 20 25 <210> 6 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 6 His His Ala His Asp Ala Tyr Leu 1 5 <210> 7 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 7 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 8 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 8 Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg 1 5 10 <210> 9 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 9 Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu 1 5 10 15 Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu 20 25 <210> 10 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 10 Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala 1 5 10 15 Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu 20 25 30 Ala <210> 11 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 11 Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys 1 5 10 15 <210> 12 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 12 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 13 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 13 Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 <210> 14 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 14 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 15 Arg Lys Lys Arg Arg Gln Arg Arg 1 5 <210> 16 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 16 Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala 1 5 10 <210> 17 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 17 Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg 1 5 10 <210> 18 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 18 Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg 1 5 10 <210> 19 <211> 1307 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 19 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 <210> 20 <211> 1228 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <220> <221> misc_feature <222> (162)..(162) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (188)..(188) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (457)..(457) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (532)..(532) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (559)..(559) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (593)..(593) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (604)..(604) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (627)..(627) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (702)..(702) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (723)..(723) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (747)..(747) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (950)..(950) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (958)..(958) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (987)..(987) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (1036)..(1036) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (1129)..(1129) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (1132)..(1132) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (1135)..(1135) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (1138)..(1138) <223> Xaa can be any naturally occurring amino acid <400> 20 Ala Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys 1 5 10 15 Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile 20 25 30 Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr 35 40 45 Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn 50 55 60 Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser 65 70 75 80 Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu 85 90 95 Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly 100 105 110 Ala Ala Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile 115 120 125 Leu Pro Glu Ala Ala Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser 130 135 140 Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu 145 150 155 160 Asn Xaa Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys 165 170 175 Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Xaa Asp Ile Phe Glu 180 185 190 Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu 195 200 205 Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu 210 215 220 Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala 225 230 235 240 Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu 245 250 255 Asn Glu Tyr Ile Asn Leu Tyr Asn Ala Lys Thr Lys Gln Ala Leu Pro 260 265 270 Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu 275 280 285 Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val 290 295 300 Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys 305 310 315 320 Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly 325 330 335 Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile 340 345 350 Phe Gly Glu Trp Asn Leu Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp 355 360 365 Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp 370 375 380 Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln 385 390 395 400 Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys 405 410 415 Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser 420 425 430 Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys 435 440 445 Lys Asn Asp Ala Val Val Ala Ile Xaa Lys Asp Leu Leu Asp Ser Val 450 455 460 Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu 465 470 475 480 Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp 485 490 495 Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val 500 505 510 Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn 515 520 525 Pro Gln Phe Xaa Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg 530 535 540 Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Xaa Asp 545 550 555 560 Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn 565 570 575 Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys 580 585 590 Xaa Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Xaa Ala Tyr Tyr Asn 595 600 605 Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys 610 615 620 Gly Asp Xaa Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe 625 630 635 640 Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe 645 650 655 Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg 660 665 670 Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys 675 680 685 Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Xaa Phe Gln 690 695 700 Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu 705 710 715 720 His Thr Xaa Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln 725 730 735 Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Xaa Arg Arg Ala Ser Leu 740 745 750 Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn 755 760 765 Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val 770 775 780 Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro 785 790 795 800 Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu 805 810 815 Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile 820 825 830 Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys 835 840 845 Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe 850 855 860 Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys 865 870 875 880 Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn 885 890 895 Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile 900 905 910 Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu 915 920 925 Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr 930 935 940 Gln Lys Phe Glu Lys Xaa Leu Ile Asp Lys Leu Asn Tyr Xaa Val Asp 945 950 955 960 Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln 965 970 975 Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Xaa Ser Thr Gln Asn Gly 980 985 990 Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser 995 1000 1005 Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala 1010 1015 1020 Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Xaa Tyr Val 1025 1030 1035 Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe 1040 1045 1050 Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser 1055 1060 1065 Tyr Gly Asn Arg Ile Arg Ile Phe Ala Ala Ala Lys Lys Asn Asn 1070 1075 1080 Val Phe Ala Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu 1085 1090 1095 Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg 1100 1105 1110 Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe 1115 1120 1125 Xaa Ala Leu Xaa Ser Leu Xaa Leu Gln Xaa Arg Asn Ser Ile Thr 1130 1135 1140 Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser 1145 1150 1155 Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn 1160 1165 1170 Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile 1175 1180 1185 Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu 1190 1195 1200 Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu 1205 1210 1215 Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys 1220 1225

Claims (50)

  1. 화학식 1의 구조를 포함하는 폴리머:
    [화학식 1]
    Figure pct00054

    여기서:
    m1 및 n1은 각각 0 내지 1000의 정수이고;
    m2 및 n2는 각각 0 내지 1000의 정수이고, 단 m2 + n2의 합이 5보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌기이고;
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기 또는 시클로알케닐기이고;
    A1 및 A2는 각각 독립적으로 다음 화학식의 기
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    B1 및 B2 는 각각 독립적으로
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
    ―(CH2)p2―N[―(CH2)q2―NR2-(CH2)s2-R4-R5]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-] r2(CH2)s3-R4-R5};
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2-(CH2)s4-R4-R5]2}2;
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-CH2-CHOH-R5;
    ―(CH2)p2―N[―(CH2)q2―NR2-CH2-CHOH-R5;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-] r2-CH2-CHOH-R5;
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2-CH2-CHOH-R5]2}2;
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-(CH2)s1-R5;
    ―(CH2)p2―N[―(CH2)q2―NR2-(CH2)s2-R5]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-] r2(CH2)s3-R5};
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2-(CH2)s4-R5]2}2;
    ―(CH2)p1―[N{(CH2)s1-R4-R5}―(CH2)q1-]r1NR2 2; 또는
    ―(CH2)p1―[N{(CH2)s1-R5}―(CH2)q1-]r1NR2 2,
    여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이고; R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서, 선택적으로 1 내지 8 개의 2 차 또는 3 차 아민을 포함하거나 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함한다.
  2. 청구항 1에 있어서, 화학식 1A의 구조를 갖는 것인 폴리머:
    [화학식 1A]
    Figure pct00055

    여기서
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단가능한 링커이고;
    m1 및 n1은 각각 0 내지 1000의 정수이고;
    m2 및 n2는 각각 0 내지 1000의 정수인데 m2 + n2의 합이 5보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    R1은 수소, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R3a 및 R3a는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R4의 각 경우는 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이고;
    R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서, 선택적으로 1 내지 8 개의 2 차 또는 3 차 아민을 포함하거나, 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함하고; 및
    R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이다.
  3. 청구항 1 또는 청구항 2에 있어서, 각각의 R5는 독립적으로:
    Figure pct00056

    Figure pct00057

    Figure pct00058

    여기서
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R7은 C1-C50 알킬기, 알케닐기, 시클로알킬기 또는 시클로알케닐기로서, 하나 이상의 아민으로 선택적으로 치환되고; 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기 또는 시클로알케닐기이고,
    z는 1 내지 5의 정수이고;
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고;
    n은 0 내지 50의 정수이고; 및
    R8은 조직-특이적 또는 세포-특이적 표적화 모이어티인 것인 폴리머.
  4. 청구항 1 내지 청구항 3 중 어느 한 항에 있어서, A1 및 A2 각각은 화학식 -(CH2)2-NH-(CH2)2-NH2의 기이고, B1 및 B2 각각은 화학식 -(CH2)2-NH-(CH2)2-NH-(CH2)2-R4-R5 의 기인 것인 폴리머.
  5. 청구항 1 내지 청구항 4 중 어느 한 항에 있어서, R4가 -C(O)-O-인 것인 폴리머.
  6. 청구항 1 내지 청구항 5 중 어느 한 항에 있어서, R5
    Figure pct00059

    또는
    Figure pct00060

    인 것인 폴리머.
  7. 청구항 1 내지 청구항 6 중 어느 한 항에 있어서, (m1 + n1) / (m2 + n2)의 비가 약 20 이하, 및 선택적으로, 약 0.2 이상인 것인 폴리머.
  8. 화학식 2의 폴리머:
    [화학식 2]
    Figure pct00061

    여기서
    m1과 n1은 각각 0 내지 1000의 정수이고, 단 m1과 n1의 합이 10 내지 2000이고;
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고;
    R1은 수소, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R8은 조직-특이적 또는 세포-특이적 표적화 모이어티이고; 및
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
  9. 청구항 1 내지 청구항 5, 청구항 7 또는 청구항 8 중 어느 한 항에 있어서, 조직-특이적 또는 세포-특이적 표적화 모이어티가
    Figure pct00062

    여기서 R9, R10, R11, 및 R12는 각각 독립적으로 수소, 할로겐, C1-C4 알킬, 또는 C1-C4 알콕시이며, 하나 이상의 아미노기로 선택적으로 치환된 것인 폴리머.
  10. 청구항 1 내지 청구항 9 중 어느 한 항에 있어서, 폴리머가 양이온성 폴리머인 것인 폴리머.
  11. 청구항 1에 있어서, 하기 화학식을 갖는 것인 폴리머:
    Figure pct00063


    Figure pct00064

    Figure pct00065

    Figure pct00066

    Figure pct00067

    Figure pct00068

    Figure pct00069

    Figure pct00070

    Figure pct00071

    Figure pct00072

    Figure pct00073

    Figure pct00074

    Figure pct00075

    여기서 (a+b)는 약 0 내지 약 75이고 (c+d)는 약 5 내지 약 80이다.
  12. 화학식 4의 구조를 포함하는 폴리머:
    [화학식 4]
    Figure pct00076

    여기서
    m1 및 n1은 각각 0 내지 1000의 정수이고, 단 m1 + n1의 합이 2보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    A1 및 A2는 각각 독립적으로 다음 화학식의 기
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고;
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고, 다만 A1 및 A2가 각각 적어도 하나의 3 차 아민을 포함하고;
    R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고; 및
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
  13. 청구항 12에 있어서, 화학식 4A의 구조를 갖는 폴리머:
    [화학식 4A]
    Figure pct00077

    여기서
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고;
    m1 및 n1은 각각 0 내지 1000의 정수이고, 단 m1 + n1의 합이 2보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    A1 및 A2는 각각 독립적으로 다음 화학식의 기
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; 및 R2의 각 경우는 독립적으로 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R1은 수소, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고, 다만 A1 및 A2가 각각 적어도 하나의 3 차 아민을 포함하고;
    R3a 및 R3a는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
    R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이거나; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이고; 및
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
  14. 청구항 12 또는 청구항 13에 있어서, A1 및 A2는 각각 화학식 -(CH2)2-NR2-(CH2)2-NR2 2의 기이고, 여기서 R2의 각 경우는 독립적으로 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고, 다만, 말단 아민이 1 차, 2 차, 또는 3 차 아민인 것인 폴리머.
  15. 청구항 14에 있어서, R2의 각 경우가 메틸인 것인 폴리머.
  16. 청구항 13 내지 청구항 15 중 어느 한 항에 있어서, 조직-특이적 또는 세포-특이적 표적화 모이어티가
    Figure pct00078

    이고, 여기서 R9, R10, R11 및 R12는 각각 독립적으로 수소, 할로겐, C1-C4 알킬, 또는 C1-C4 알콕시로서, 하나 이상의 아미노기로 선택적으로 치환된 것인 폴리머.
  17. 청구항 12 내지 청구항 16 중 어느 한 항에 있어서, 폴리머가 양이온성 폴리머인 것인 폴리머.
  18. 청구항 12에 있어서, 하기 화학식을 갖는 폴리머:
    Figure pct00079

    Figure pct00080

    Figure pct00081

    Figure pct00082


    Figure pct00083

    Figure pct00084

    Figure pct00085

    여기서 (a + b)는 약 5 내지 약 160이다.
  19. 청구항 1 내지 청구항 11 중 어느 한 항의 폴리머를 제조하는 방법으로서, 화학식 3의 구조를 포함하는 폴리머의 기 A1 및/또는 A2의 적어도 일부를 개질하여 화학식 1의 구조를 포함하는 폴리머를 제조하는 단계를 포함하는 것인 방법:
    [화학식 3]
    Figure pct00086

    여기서:
    m1 및 n1은 각각 0 내지 1000의 정수이고, 단 m1 + n1이 5보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    A1 및 A2는 각각 독립적으로 다음 화학식의 기이고
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고,
    [화학식 1]
    Figure pct00087

    여기서:
    m1 및 n1은 각각 0 내지 1000의 정수이고;
    m2 및 n2는 각각 0 내지 1000의 정수이고, 단 m2 + n2의 합이 5보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    R3a 및 R3b는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    A1 및 A2는 각각 독립적으로 다음 화학식의 기
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    B1 및 B2 는 각각 독립적으로
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-(CH2)s1-R4-R5;
    ―(CH2)p2―N[―(CH2)q2―NR2-(CH2)s2-R4-R5]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-] r2(CH2)s3-R4-R5};
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2-(CH2)s4-R4-R5]2}2;
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-CH2-CHOH-R5;
    ―(CH2)p2―N[―(CH2)q2―NR2-CH2-CHOH-R5;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-] r2-CH2-CHOH-R5;
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2-CH2-CHOH-R5]2}2;
    ―(CH2)p1―[NR2―(CH2)q1-]r1NR2-(CH2)s1-R5;
    ―(CH2)p2―N[―(CH2)q2―NR2-(CH2)s2-R5]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2-] r2(CH2)s3-R5};
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2-(CH2)s4-R5]2}2;
    ―(CH2)p1―[N{(CH2)s1-R4-R5}―(CH2)q1-]r1NR2 2; 또는
    ―(CH2)p1―[N{(CH2)s1-R5}―(CH2)q1-]r1NR2 2,
    여기서 p1 내지 p4, q1 내지 q6, r1 및 r2, 및 s1 내지 s4는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; R4의 각 경우는 독립적으로 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이고; R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서, 선택적으로 1 내지 8 개의 2 차 또는 3 차 아민을 포함하거나, 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함한다.
  20. 청구항 19에 있어서, 화학식 3의 구조를 포함하는 폴리머의 기 A1 및/또는 A2는 화학식 3의 구조를 포함하는 폴리머와 아크릴레이트, 아크릴아미드, 비닐 술폰, 또는 이들의 조합 간의 마카엘 첨가 반응에 의해 개질되는 것인 방법.
  21. 청구항 20에 있어서, 아크릴레이트, 아크릴아미드 또는 비닐 술폰이 하기 화학식인 것인 방법:
    Figure pct00088

    여기서 R5는 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서, 선택적으로 1 내지 8 개의 2 차 또는 3 차 아민을 포함하거나 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함한 것이다.
  22. 청구항 19 내지 청구항 21 중 어느 한 항에 있어서, 화학식 3의 구조를 포함하는 폴리머가 화학식 3A의 폴리머인 것인 방법:
    [화학식 3A]
    Figure pct00089

    여기서
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고;
    m1 및 n1은 각각 0 내지 1000의 정수이고; 다만 m1 + n1의 합이 5보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    R1은 수소, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R3a 및 R3a는 각각 독립적으로 메틸렌 또는 에틸렌 기이고; 및
    R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이거나; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이고;
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고; 및
    화학식 1의 구조를 포함하는 폴리머는 화학식 1A의 폴리머이다:
    [화학식 1A]
    Figure pct00090

    여기서
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고;
    m1 및 n1은 각각 0 내지 1000의 정수이고;
    m2 및 n2는 각각 0 내지 1000의 정수이고, 단 m2 + n2의 합이 5보다 크고;
    기호 "/"는 그에 의해 분리된 단위가 무작위로 또는 임의의 순서로 연결됨을 나타내고;
    R1은 수소, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
    R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    R3a 및 R3a는 각각 독립적으로 메틸렌 또는 에틸렌 기이고;
    R4의 각 경우는 -C(O)O-, -C(O)NH-, 또는 -S(O)(O)-이고;
    R5의 각 경우는 독립적으로 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서, 선택적으로 1 내지 8 개의 2 차 또는 3 차 아민을 포함하거나 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함하고;
    R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이거나; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이고; 및
    R13의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
  23. 청구항 19 내지 청구항 22 중 어느 한 항에 있어서, A1 및 A2 각각은 화학식 -(CH2)2-NH-(CH2)2-NH2의 기이고, B1 및 B2 각각은 화학식 -(CH2)2-NH-(CH2)2-NH-(CH2)2-R4-R5의 기인 것인 방법.
  24. 청구항 19 내지 청구항 23 중 어느 한 항에 있어서, R4가 -C(O)-O- 인 것인 방법.
  25. 청구항 23 또는 청구항 24에 있어서, R5
    Figure pct00091

    또는
    Figure pct00092

    인 것인 방법.
  26. 청구항 19 내지 청구항 25 중 어느 한 항에 있어서, 화학식 3의 구조를 포함하는 폴리머의 충분한 수의 A1 및/또는 A2 기가 개질되어 화학식 1의 구조를 포함하는 폴리머를 제공하는 방법으로서, 여기서 (m1 + n1)/(m2 + n2)의 비가 약 20 이하, 선택적으로 약 0.2 이상인 것인 방법.
  27. 청구항 1 내지 청구항 18 중 어느 한 항의 폴리머 및 핵산 및/또는 폴리펩티드를 포함하는 조성물.
  28. 청구항 27에 있어서, 상기 조성물은 가이드 핵산 및/또는 공여자 핵산을 포함하는 것인 조성물.
  29. 청구항 27 또는 청구항 28에 있어서, 상기 조성물은 엔도뉴클레아제를 포함하는 것인 조성물.
  30. 청구항 29에 있어서, 조성물이 RNA-유도되는 엔도뉴클레아제 또는 이를 코딩하는 핵산을 포함하는 것인 조성물.
  31. 청구항 30 항에 있어서, RNA-유도되는 엔도뉴클레아제가 Cas9, Cpf1, 또는 이들의 조합인 것인 조성물.
  32. 청구항 27 내지 청구항 31 중 어느 한 항에 있어서, 조성물이 DNA 재조합효소를 포함하는 것인 조성물.
  33. 청구항 32에 있어서, DNA 재조합효소가 Cre 재조합효소인 것인 조성물.
  34. 청구항 27 내지 청구항 33 중 어느 한 항에 있어서, 조성물이 징크 핑거 뉴클레아제를 포함하는 것인 조성물.
  35. 청구항 27 내지 청구항 34 중 어느 한 항에 있어서, 조성물이 전사 활성자-유사 이펙터 뉴클레아제를 포함하는 것인 조성물.
  36. 청구항 27 내지 청구항 35 중 어느 한 항에 있어서, 조성물이 청구항 1 내지 청구항 9 중 어느 한 항의 폴리머 및 핵산 또는 폴리펩티드를 포함하는 나노입자를 포함하는 것인 조성물.
  37. 청구항 27 내지 청구항 36 중 어느 한 항에 있어서, 조성물이 폴리에틸렌 옥사이드를 포함하는 제 2 폴리머를 포함하는 것인 조성물.
  38. 핵산 및/또는 폴리펩티드를 세포에 전달하는 방법으로서, 청구항 27 내지 청구항 37 중 어느 한 항의 조성물을 세포에 투여하는 것을 포함하는 방법.
  39. 청구항 38에 있어서, 세포가 개체내에 있고 청구항 27 내지 청구항 37 중 어느 한 항의 조성물이 그 개체에게 투여되는 것인 방법.
  40. 청구항 38 또는 청구항 39 항에 있어서, 폴리머가 그 폴리머를 개체의 말초 신경계, 중추 신경계, 간, 근육, 폐, 뼈, 또는 눈의 조직에 국재화하는 조직-특이적 표적화 모이어티를 포함하는 것인 방법.
  41. 청구항 40에 있어서, 폴리머가 종양 세포에 우선적으로 결합하는 표적화 모이어티를 포함하는 것인 방법.
  42. 청구항 38 내지 청구항 41 중 어느 한 항에 있어서, 조성물이 RNA-가이드된 엔도뉴클레아제 또는 이를 코딩하는 핵산, 가이드 핵산, 및 공여자 핵산 중 하나 이상을 포함하고, 조성물이 세포 내 표적 유전자의 편집을 용이하게 하는 것인 방법.
  43. 청구항 38 내지 청구항 42 중 어느 한 항에 있어서, 세포가 숙주, 선택적으로 인간 내에 있고, 조성물을 그 숙주에 투여함으로써 조성물이 세포에 전달되는 것인 방법.
  44. 화학식 A의 화합물의 개환 중합을 포함하는, 화학식 A의 화합물로부터 화학식 5의 구조를 포함하는 폴리머를 제조하는 방법:
    [화학식 5]
    Figure pct00093

    여기서
    m1은 1 내지 2000의 정수이고;
    R3b는 메틸렌 또는 에틸렌 기이고;
    R17은 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    A1은 다음 식의 기
    ―(CH2)p1―[NR2―(CH2)q1―]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2―]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고,
    [화학식 A]
    Figure pct00094

    여기서
    R3b는 메틸렌 또는 에틸렌 기이고;
    W는 -NR14- 또는 -O-이고, 여기서 R14는 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    Z는 A1, 또는 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 아릴알킬기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서, 선택적으로 1 내지 8 개의 2 차 또는 3 차 아민을 포함하거나 또는 조직-특이적 또는 세포-특이적 표적화 모이어티를 포함하는 치환기를 포함하고;
    A1은 다음 식의 기
    ―(CH2)p1―[NR2―(CH2)q1―]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2―]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
  45. 청구항 44에 있어서, 화학식 5의 구조를 포함하는 폴리머가 화학식 5A의 폴리머인 것인 방법:
    [화학식 5A]
    Figure pct00095

    여기서
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고;
    m1은 1 내지 2000의 정수이고;
    R3a는 메틸렌 또는 에틸렌 기이고;
    R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이며;
    R1은 수소, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 또는 하나 이상의 치환기로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고;
    R17은 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이고;
    A1은 다음 식의 기
    ―(CH2)p1―[NR2―(CH2)q1―]r1NR2 2;
    ―(CH2)p2―N[―(CH2)q2―NR2 2]2;
    ―(CH2)p3―N{[―(CH2)q3―NR2 2][―(CH2)q4―NR2―]r2R2}; 또는
    ―(CH2)p4―N{―(CH2)q5―N[―(CH2)q6―NR2 2]2}2,
    여기서 p1 내지 p4, q1 내지 q6, 및 r1 및 r2는 각각 독립적으로 1 내지 5의 정수이고; R2의 각 경우는 독립적으로 수소 또는 C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기이다.
  46. 청구항 44 또는 청구항 45에 있어서, A1이 화학식 -(CH2)2-NR2-(CH2)2-NR2 2의 기인 것인 방법.
  47. 청구항 44 내지 청구항 46 중 어느 한 항에 있어서, 화학식 A 화합물의 개환 중합이 아민-함유 화합물로 개시되는 것인 방법.
  48. 청구항 47에 있어서, 아민-함유 화합물이 하기 화학식을 갖는 것인 방법:
    Figure pct00096

    여기서
    c는 0 내지 50의 정수이고;
    Y는 선택적으로 존재하고 절단 가능한 링커이고; 및
    R6은 수소, 아미노기, 아릴기, 헤테로시클릭기, C1-C12 알킬기, 알케닐기, 시클로알킬기, 또는 시클로알케닐기, 하나 이상의 아민으로 선택적으로 치환된 C1-C12 선형 또는 분지형 알킬기이고; 또는 조직-특이적 또는 세포-특이적 표적화 모이어티이다.
  49. 청구항 47 또는 청구항 48에 있어서, 아민-함유 화합물이
    Figure pct00097

    인 것인 방법.
  50. 청구항 44 내지 청구항 49 중 어느 한 항에 있어서,
    화학식 A의 화합물에서 W는 -O-이고, Z는 알킬기, 시클로알킬기, 알케닐기, 시클로알케닐기, 아릴기, 아릴알킬기, 헤테로알킬기, 헤테로시클릭기, 또는 이들의 조합으로서 선택적으로 1 내지 8개의 2 차 또는 3 차 아민을 포함하고; 상기 방법은 개환 중합 후 생성된 중간 폴리머를 화학식 NHR14-A1의 화합물(여기서 A1은 화학식 5에 대해 정의된 바와 같다)로 처리하는 단계를 추가로 포함하는 것인 방법.
KR1020207034232A 2018-04-27 2019-04-29 양이온성 폴리머 및 생분자 전달을 위한 이용 KR20210005932A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862663985P 2018-04-27 2018-04-27
US62/663,985 2018-04-27
US201862750097P 2018-10-24 2018-10-24
US62/750,097 2018-10-24
PCT/US2019/029746 WO2019210326A2 (en) 2018-04-27 2019-04-29 Cationic polymer and use for biomolecule delivery

Publications (1)

Publication Number Publication Date
KR20210005932A true KR20210005932A (ko) 2021-01-15

Family

ID=66794073

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207034232A KR20210005932A (ko) 2018-04-27 2019-04-29 양이온성 폴리머 및 생분자 전달을 위한 이용

Country Status (11)

Country Link
US (1) US20210238347A1 (ko)
EP (1) EP3788094A2 (ko)
JP (1) JP2021522385A (ko)
KR (1) KR20210005932A (ko)
CN (1) CN112334510A (ko)
AU (1) AU2019261647A1 (ko)
CA (1) CA3098127A1 (ko)
IL (1) IL278209A (ko)
MX (1) MX2020011339A (ko)
SG (1) SG11202010631UA (ko)
WO (1) WO2019210326A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020263474A1 (en) * 2019-04-23 2021-11-25 Genedit Inc. Cationic polymer with alkyl side chains
WO2021217082A1 (en) * 2020-04-23 2021-10-28 Genedit Inc. Polymer with cationic and hydrophobic side chains
CA3222341A1 (en) 2021-06-11 2022-12-15 Kunwoo Lee Biodegradable polymer comprising side chains with polyamine and polyalkylene oxide groups
JPWO2023282296A1 (ko) * 2021-07-07 2023-01-12

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075303A1 (en) 2008-12-23 2010-07-01 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same
US8546487B2 (en) * 2009-02-13 2013-10-01 The University Of Tokyo Cationic poly (amino acids) and uses thereof
JP5804453B2 (ja) * 2009-05-14 2015-11-04 国立大学法人 東京大学 結晶性ポリオール微粒子及びその調製方法
JP5463531B2 (ja) * 2009-07-22 2014-04-09 国立大学法人 東京大学 Phd2発現抑制物質搭載ポリイオンコンプレックス
JP4655298B1 (ja) * 2010-02-23 2011-03-23 ナノキャリア株式会社 短鎖のカチオン性ポリアミノ酸およびその使用
WO2012068627A1 (en) 2010-11-24 2012-05-31 The University Of Western Australia Peptides for the specific binding of rna targets
US20120237565A1 (en) * 2011-03-14 2012-09-20 Intezyne Technologies, Incorporated Pegylated polyplexes containing two or more different polymers for polynucleotide delivery
AU2013248928A1 (en) 2012-04-16 2014-12-04 The State Board Of Higher Education On Behalf Of The University Of Oregon Peptides for the binding of nucleotide targets
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
JP2016504026A (ja) 2012-12-12 2016-02-12 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
DK3252160T3 (da) 2012-12-12 2021-02-01 Broad Inst Inc Systemer, fremgangsmåder og sammensætninger med crispr-cas-bestanddele til sekvensmanipulation
ES2576126T3 (es) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
AU2014321215B2 (en) * 2013-09-23 2020-07-16 Rensselaer Polytechnic Institute Nanoparticle-mediated gene delivery, genomic editing and ligand-targeted modification in various cell populations
US20170362609A1 (en) * 2016-05-02 2017-12-21 Massachusetts Institute Of Technology AMPHIPHILIC NANOPARTICLES FOR CODELIVERY OF WATER-INSOLUBLE SMALL MOLECULES AND RNAi

Also Published As

Publication number Publication date
SG11202010631UA (en) 2020-11-27
WO2019210326A3 (en) 2019-12-19
AU2019261647A1 (en) 2020-11-26
CA3098127A1 (en) 2019-10-31
WO2019210326A2 (en) 2019-10-31
CN112334510A (zh) 2021-02-05
EP3788094A2 (en) 2021-03-10
JP2021522385A (ja) 2021-08-30
MX2020011339A (es) 2021-02-09
US20210238347A1 (en) 2021-08-05
IL278209A (en) 2020-11-30

Similar Documents

Publication Publication Date Title
US11268092B2 (en) Structure-engineered guide RNA
US10494620B2 (en) Methods and compositions for modifying a single stranded target nucleic acid
US20220042047A1 (en) Compositions and methods for modifying a target nucleic acid
US20200347387A1 (en) Compositions and methods for target nucleic acid modification
CN109072235B (zh) 通过核递送crispr/cas9追踪并操纵细胞rna
EP3352795B1 (en) Compositions and methods for target nucleic acid modification
KR20210005932A (ko) 양이온성 폴리머 및 생분자 전달을 위한 이용
EP3870628B1 (en) Cationic polymer with alkyl side chains and use for biomolecule delivery
US20220340712A1 (en) Polymer comprising multiple functionalized sidechains for biomolecule delivery
US20230147779A1 (en) Polymer with cationic and hydrophobic side chains
US20220340711A1 (en) Cationic polymer with alkyl side chains
EA046334B1 (ru) Катионный полимер и применение для доставки биомолекул
EP4352131A1 (en) Biodegradable polymer comprising side chains with polyamine and polyalkylene oxide groups
CA3209539A1 (en) Strategies to develop genome editing spherical nucleic acids (snas)
EA045278B1 (ru) Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения