KR20210148187A - 기능장애 RNA(dysfunctional RNA) 분자에 침묵 활성(silencing activity) 도입 및 관심 유전자에 대한 특이성(specificity) 변형 - Google Patents

기능장애 RNA(dysfunctional RNA) 분자에 침묵 활성(silencing activity) 도입 및 관심 유전자에 대한 특이성(specificity) 변형 Download PDF

Info

Publication number
KR20210148187A
KR20210148187A KR1020217033294A KR20217033294A KR20210148187A KR 20210148187 A KR20210148187 A KR 20210148187A KR 1020217033294 A KR1020217033294 A KR 1020217033294A KR 20217033294 A KR20217033294 A KR 20217033294A KR 20210148187 A KR20210148187 A KR 20210148187A
Authority
KR
South Korea
Prior art keywords
rna
cell
rna molecule
molecule
nucleic acid
Prior art date
Application number
KR1020217033294A
Other languages
English (en)
Inventor
에얄 마오리
야론 갈란티
크리스티나 피그노치
안젤라 차파로 가르시아
오피르 메이어
Original Assignee
트로픽 바이오사이언시즈 유케이 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 트로픽 바이오사이언시즈 유케이 리미티드 filed Critical 트로픽 바이오사이언시즈 유케이 리미티드
Publication of KR20210148187A publication Critical patent/KR20210148187A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1131Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
    • C12N15/1132Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses against retroviridae, e.g. HIV
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8283Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for virus resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8285Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for nematode resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • AIDS & HIV (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 방법은 다음을 포함한다: (a) RISC와 결합된 RNA 분자를 암호화하는 핵산 서열에 대해 완전한 동일성을 포함하지 않는, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열을 확인하는 단계; (b) RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해, RNA 분자를 암호화하는 핵산 서열의 전사를 결정하는 단계; (c) 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 전사체의 작은(small) RNA로의 가공 능력(processability)을 결정하는 단계; (d) RISC와 결합하고 제 1 표적 RNA(first RNA) 또는 관심 표적 RNA(target RNA of interest)에 상보적인 작은 RNA에 가공 능력을 부여하기 위해 비정상적으로 처리되고 전사 가능한 핵산 서열의 핵산 서열로 변경시키는 단계.

Description

기능장애 RNA(dysfunctional RNA) 분자에 침묵 활성(silencing activity) 도입 및 관심 유전자에 대한 특이성(specificity) 변형
본 발명의 일부 구현예에서, 본 발명은 진핵 세포에서 침묵-기능장애 RNA 분자(silencing-dysfunctional RNA molecule)(예, miRNA -유사 분자)에 침묵 활성을 부여하고 및 가능하게는 관심 내인성 또는 외인성 표적 RNA의 침묵에 대한 RNA 분자의 침묵 특이성을 변형시키는 것에 관한 것이다.
관련 출원
본 출원은 2019년 3월 14일에 출원된 영국 특허 출원 번호 1903519.5의 우선권을 주장하며, 그 내용은 전문이 참조로서 본 명세서에 포함된다.
서열 목록 진술
2020년 3월 12일에 생성된 81320 Sequence Lising.txt라는 제목의 ASCII 파일은 221,283 byte로 구성되며 본 출원의 제출과 동시에 제출되었으며 참조로써 본 명세서에 포함된다.
발명의 분야 및 배경
최근 지놈 편집 기술의 발전으로 살아있는 세포의 지놈에 있는 수십억 개의 뉴클레오타이드 중 단지 몇 개만 편집하여 DNA 서열을 변경하는 것이 가능케 되었다. 지난 10년 동안, 인간 체세포 및 다능성 세포에서와 같은 지놈 편집을 사용하기 위한 방법(tool) 및 전문지식이 이제는 인간의 질병을 치료하기 위한 전략으로써 널리 사용되고 있는 정도로 증가하였다. 기본 과정은 지놈에서 부위-특이적 DNA 이중 가닥 파손(break)(DSB)를 생성한 다음 세포의 내인성 DSB 복구 시스템이 파손을 고치도록 하는데 달려 있다. (예를 들어 non-homologous end-joining (NHEJ) 또는 상동 재조합(homologous recombination, HR)에 의한 것으로, 후자는 외인적으로 제공된 공여자 주형을 사용하여 DNA 서열에 정확한 뉴클레오타이드 변화가 만들어지도록 할 수 있다. [Porteus, Annu Rev Pharmacol Toxicol. (2016) 56:163-90])
세 가지 주요한 접근 방식은 잠재적 치료제와 같이, 세포의 돌연변이 유발 지놈 편집(NHEJ)를 사용한다: (a) 공간적으로 정확한 삽입 및 결손을 생성함으로써 기능적 유전 요소를 넉아웃(knock-out) 하고, (b) 근본적인 프레임시프트(frameshift) 돌연변이를 보상하는 삽입 및 결손을 생성하며; 따라서 부분적으로 기능적인 또는 기능하지 않는 유전자를 재활성화하고, 및 (c) 정의된 유전적 결손을 생성한다. 여러 다른 응용에서 NHEJ에 의한 편집을 사용하지만, 상동 재조합(HR)에 의한 지놈 편집이 가장 광범위한 적용 범위를 제공할 것이다. 비록 드문 경우이지만, HR은 복구 가공 중에 미리 정해진 특정 서열을 복사하기 위해 외부에서 제공된 주형에 의존하므로 매우 정확하기 때문이다.
현재 HR 매개 지놈 편집에 대한 4 가지 주요 유형의 응용은 다음과 같다: (a) 유전자 교정 (즉, 단일 유전자의 포인트 돌연변이로 인한 질병의 교정), (b) 기능적 유전자 교정 (즉, 유전자 전체에 흩어져 있는 돌연변이로 인한 질병의 교정), (c) 세이프 하버(safe harbor) 유전자 추가 (즉, 정확한 조절이 필요하지 않거나 또는 비생리학적 수준의 도입유전자가 필요한 경우), 및 (d) 표적화된 도입 유전자의 추가 (즉, 정확한 조절이 필요한 경우) [Porteus (2016), supra].
다양한 진핵생물(예, 쥐, 인간, 새우, 식물)에서 RNA 분자의 지놈 편집에 대한 이전 작업은 miRNA 유전자 활성을 녹아웃시키거나 또는 표적 RNA에서 결합 부위를 변경하는데 중점을 두었다, 예를 들면 다음과 같다:
인간 세포의 지놈 편집과 관련하여, Jiang 외 [Jiang 외, RNA Biology (2014) 11 (10): 1243-9]는 HeLa 세포의 5' 영역을 표적으로 하여 클러스터에서 인간 miR-93을 제거하기 위해 CRISPR/Cas9을 사용하였다. 다양한 작은 삽입결손(indel)은 Drosha 가공 부위(즉, 이중 가닥 RNA 특이적 RNase III 효소인 Drosha가 결합하고 손상하여 숙주 세포의 핵에서 본래의 miRNA(pri-miRNA)를 pre-miRNA로 가공하는 위치) 및 시드(seed) 서열(즉, 일반적으로 miRNA 5'-말단에서 2-7위치에 적합한 miRNA와 mRNA의 결합에 필수적인 보존된 헵타메트릭(heptametrical) 서열)을 포함하는 표적 영역에서 유도되었다. Jiang et al에 따르면, 단일 뉴클레오타이드 결손조차도 높은 특이성을 갖는 표적 miRNA의 완전한 녹아웃을 이끌어냈다.
쥐 종의 지놈 편집과 관련하여, Zhao 외 [Zhao 외, Scientific Reports (2014) 4:3943]은 쥐 세포에서 CRISPR/Cas9 시스템을 사용하여 miRNA 억제 전략을 제공하였다. Zhao는 Cas9 뉴클레아제에 의한 단일 부위에서 miRNA 유전자를 손상하기 위해 특별히 설계된 sgRNA를 사용하여, 이러한 세포에서 miRNA가 녹아웃되도록 하였다.
식물 지놈 편집과 관련하여, Bortesi 및 Fischer [Bortesi and Fischer, Biotechnology Advances (2015) 33: 41-52]는 ZFN 및 TALEN과 비교하여 식물에서 CRISPR-Cas9 기술을 사용에 대해 논의하였고, 및 Basak 및 Nithin [Basak and Nithin, Front Plant Sci. (2015) 6: 1001]은 CRISPR/Cas9 기술이 애기장대 및 담배와 같은 모델 식물 및 밀, 옥수수, 및 벼를 포함하는 작물에서 단백질을 암호화하는 유전자의 녹다운에 적용되었다고 가르친다.
miRNA 활성 또는 표적 결합 부위의 파괴 외에도, 내인성 및 외인성 표적 유전자의 유전자 침묵이 매개된 인공 miRNA (amiRNA)를 사용한 유전자 침묵이 달성되었다 [Tiwari 외 Plant Mol Biol (2014) 86: 1]. miRNA와 -마찬가지로, amiRNA는 약 21 뉴클레오타이드 (nt) 길이의 단일 가닥이며, 및 pre-miRNA내 이중체의 성숙 miRNA 서열을 교체하여 설계되었다 [Tiwari 외 (2014) supra]. 이러한 amiRNA는 인공의 발현 카세트(프로모터, 터미네이터 등을 포함) 내 도입유전자로 도입되고 [Carbonell 외, Plant Physiology (2014) pp.113.234989], 작은(small) RNA 생성 및 침묵 시스템을 따라 가공되며 및 표적 발현을 하향 조절한다. Schwab 외 [Schwab 외 The Plant Cell (2006) Vol. 18, 1121-1133]에 따르면, amiRNA는 조직 특이적 또는 유도성 프로모터 하에 발현될 때 활성화되고 및 특히 여러 관련이 있지만, 동일하지는 않은 표적 유전자가 하향조절 되어야 할 때, 식물에서 특정 유전자 침묵에 사용될 수 있다.
Senis 외 [Senis 외, Nucleic Acids Research (2017) Vol. 45(1): e3]은 프로모터가 없는 항바이러스 RNAi 헤어핀(hairpin)을 내인성 miRNA 유전자좌로 조작하는 것을 개시하고 있다. 구체적으로, Senis 외는 Cas9 또는 TALEN 뉴클레아제와 같은 서열 특이적 뉴클레아제에 의해 유도되는 상동성 지정(directed) DNA 재조합에 의한 자연 발생 miRNA 유전자 (예를 들어 miR122)에 인접한 miRNA 전구체 도입유전자 (헤어핀 pri-amiRNA)를 삽입한다. 이러한 접근법은 자연의 miRNA (miR122)를 발현하는 전사활성 DNA, 즉, 내인성 프로모터 및 터미네이터가 삽입된 amiRNA 도입유전자의 전사를 유도하고 조절하는 전사활성 DNA를 활용하여 프로모터 및 터미네이터가 없는 amiRNA를 사용한다.
RNA 및/또는 단백질을 세포내로 도입하는 다양한 DNA가 없는 방법은 이전에 설명되었다. 예를 들어, 전기천공법(electroporation) 및 리포펙션(lipofection)을 사용한 RNA 형질주입은 미국 특허 출원 번호 20160289675에 명시되어 있다. Cas9 단백질 및 sgRNA 복합체의 미세주입에 의한 Cas9/sgRNA 리보핵단백질 (RNP) 복합체의 세포로의 직접 부여는 Cho에 의해 설명되었다 [Cho 외, "Heritable gene knockout in Caenorhabditis elegans by direct injection of Cas9-sgRNA ribonucleoproteins," Genetics (2013) 195:1177-1180]. 전기천공법을 통한 Cas9 단백질/sgRNA 복합체의 부여는 Kim에 의해 설명되었다 [Kim 외, "Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins" Genome Res. (2014) 24:1012-1019]. 리포솜을 통한 Cas9 단백질 관련 sgRNA 복합체의 부여는 Zuris에 의해 설명되었다 [Zuris 외, "Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo" Nat Biotechnol. (2014) doi: 10.1038/nbt.3081].
본 발명의 일부 구현예의 측면에 따르면 세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 방법이 제공되며, 다음의 방법을 포함한다: (a) RNA-유도된 침묵 복합체(RNA-induced silencing complex, RISC) 와 결합된 RNA 분자를 암호화하는 핵산서열과 관련하여, 완전한 동일성을 포함하지 않는, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열을 확인하는 단계; (b) 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해, RNA 분자를 암호화하는 핵산 서열의 전사를 결정하는 단계; (c) 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 전사체의 작은(small) RNA로의 가공 능력(processability)을 결정하고, 여기에서 RNA 분자는 비정상적으로 가공되는 것인, 단계; RISC와 결합하고 제 1 표적 RNA에 상보적인 작은 RNA로의 가공 능력을 부여하기 위해, 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 핵산 서열을 변형시키는 단계, 이로써 세포 내에서 침묵 활성을 갖는 RNA 분자를 생성하는 단계.
본 발명의 일부 구현예의 측면에 따르면 RNA 분자를 RISC와 결합된 작은 RNA로 가공되도록 하는 핵산 서열 변경을 갖는 RNA 분자를 암호화하는 폴리뉴클레오타이드 서열을 포함하는 지놈을 포함하는 유전적으로 변형된 세포가 제공되며, RNA 분자의 가공은 핵산 서열 변경이 없는 동일한 기원의 야생형 세포에는 존재하는 않는다.
본 발명의 일부 구현예의 측면에 따르면, 본 발명의 일부 구현예의 방법에 따라 생성된 식물 세포가 제공된다.
본 발명의 일부 구현예의 측면에 따르면 본 발명의 일부 구현예의 식물 세포를 포함하는 식물체가 제공된다.
본 발명의 일부 구현예의 측면에 따르면 표적 유전자의 발현이 감소된 식물체를 생산하는 방법이 제공되며, 다음의 방법을 포함한다: (a) 본 발명의 일부 구현예의 식물체를 육종하는 단계; 및 (b) 관심 표적 RNA의 발현이 감소된 자손 식물체, 또는 관심 표적 RNA에 대한 RNA 분자의 침묵 특이성을 포함하고, 및 DNA 편집제(editing agent)를 포함하지 않는 자손 식물체를 선택하는 단계, 이로써 표적 유전자의 발현이 감소된 식물체를 생산하는 단계.
본 발명의 일부 구현예 측면에 따르면 관심 표적 RNA에 대한 침묵 활성을 갖는 RNA 분자를 포함하는 식물체를 생산하는 방법이 제공되며, 다음의 방법을 포함한다: (a) 본 발명의 일부 구현예의 식물체를 육종하는 단계; 및 (b) 관심 표적 RNA에 대한 침묵 활성을 갖는 RNA 분자를 포함하는 자손 식물체, 또는 관심 표적 RNA에 대한 RNA 분자 내 침묵 특이성을 포함하고, 및 DNA 편집제를 포함하지 않는 자손 식물체를 선택하는 단계, 이로써 관심 표적 RNA에 대한 침묵 활성을 갖는 RNA 분자를 포함하는 식물체를 생산하는 단계.
본 발명의 일부 구현예의 측면에 따르면 번식을 허용하는 조건 하에 상기 식물체 또는 식물 세포를 성장시키는 단계를 포함하는 본 발명의 일부 구현예의 식물체 또는 식물 세포를 생산하는 방법이 제공된다.
본 발명의 일부 구현예의 측면에 따르면 본 발명의 일부 구현예의 식물체의 종자, 또는 본 발명의 일부 구현예에 의해 생산된 식물체의 종자가 제공된다.
본 발명의 일부 구현예의 측면에 따르면 이를 필요로 하는 대상에서 질병을 치료하는 방법이 제공되고, 이 방법은 본 발명의 일부 구현예의 방법에 따라 침묵 활성 및/또는 특이성을 갖는 RNA분자를 생성하는 단계를 포함하며, 여기에서 RNA 분자는 질병의 발병 또는 진행과 관련된 유전자의 전사체에 대한 침묵 활성을 포함하여 대상을 치료하는 것인, 방법이다.
본 발명의 일부 구현예의 측면에 따르면 세포 내 첫번째 RNA 분자의 침묵 활성을 도입하는 방법이 제공되며, 다음의 방법을 포함한다:
(a) 세포 내에서 제 1 핵산 서열을 선택하는 단계, 여기에서:
i. 제 1 핵산 서열은 세포 내에서 제 1 RNA 분자로 전사되고;
ii. 제 1 RNA 분자의 서열은 서열 동일성을 제외하고, 제 2 RNA 분자의 서열과 부분적으로 상동성을 가지며; 여기에서 제 2 RNA 분자는 침묵 활성을 갖는 제 3 RNA 분자로 가공 될 수 있고; 및 여기에서 제 2 RNA 분자는 세포 내 제 2 핵산 서열에 의해 암호화되며; 및
iii. 제 1 RNA 분자는 가공 될 수 없거나, 또는 제 2 RNA 분자와 다르게 가공 될 수 있어, 제 1 RNA 분자는 제 3 RNA와 동일한 성질의 침묵 활성을 갖는 RNA 분자로 가공되지 않고;
(b) 변형된 제 1 RNA 분자를 암호화하도록 제 1 핵산 서열을 변형시키는 단계; 변형된 제 1 RNA 분자를 제 2 RNA 분자가 제 3 RNA 분자로 가공될 수 있는 동일한 방식으로 제 4 RNA 로 가공될 수 있는 것으로, 제 4 RNA 분자는 제 3 RNA 분자와 동일한 성질의 침묵 활성을 가지며,
이로써 제 1 RNA 분자에 침묵 활성을 도입하는 단계.
본 발명의 일부 구현예에 따르면, 확인된 핵산 서열에 의해 암호화되는 단계(a)의 RNA 분자는 RISC와 결합되고 및/또는 RISC와 결합된(engaged) 분자로 가공된 RNA 분자에 대해 완전한 동일성을 포함하지 않는, 미리 정해진 서열 상동성 범위를 나타낸다.
본 발명의 일부 구현예에 따르면, 단계(d)에서 가공 능력 부여는 RNA-유도된 침묵 복합체(RNA-induced silencing complex, RISC)와 결합된 RNA 분자를 암호화하는 핵산 서열의 핵산 서열에 의해 암호화되는 RNA 분자에 관하여 정형적인 가공을 부여하는 것을 포함한다;
본 발명의 일부 구현예에 따르면, 본 방법은 추가적으로 단계(a)의 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열의 지놈 위치(genomic location)를 결정하는 것을 포함한다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 비 암호화 유전자 내에 있다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 비 암호화 유전자의 인트론 내에 있다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 암호화 유전자 내에 있다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 암호화 유전자의 엑손 내에 있다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 암호화 유전자의 비번역 영역(UTR)을 암호화하는 엑손 내에 있다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 암호화 유전자의 인트로 내에 있다.
본 발명의 일부 구현예에 따르면, RNA 분자는 비 암호화 유전자에 위치한 핵산 서열에 의해 암호화된다.
본 발명의 일부 구현예에 따르면, RNA 분자는 암호화 유전자에 위치한 핵산 서열에 의해 암호화된다.
본 발명의 일부 구현예에 따르면, RNA 분자는 암호화 유전자의 엑손 내에 위치한 핵산 서열에 의해 암호화된다.
본 발명의 일부 구현예에 따르면, RNA 분자는 암호화 유전자의 비번역 영역(UTR)을 암호화하는 엑손 내에 위치한 핵산 서열에 의해 암호화된다.
본 발명의 일부 구현예에 따르면, RNA 분자는 암호화 유전자의 인트론에 위치한 핵산 서열에 의해 암호화된다.
본 발명의 일부 구현예에 따르면, 지놈 위치는 비 암호화 유전자의 인트론 내에 있다.
본 발명의 일부 구현예에 따르면, 서열 상동성 범위는 RISC와 결합된 RNA 분자를 암호화하는 핵산 서열에 대해 75% - 99.6% 동일성을 포함한다.
본 발명의 일부 구현예에 따르면, 단계(b) 및/또는 단계(c)는 상기 세포의 지놈에 대한 작은 RNA 발현 테이터의 얼라인먼트(alignment) 및 각 지놈의 위치에 맵핑되는 리드(read)의 양을 결정하는 것에 의해 영향을 받는다.
본 발명의 일부 구현예에 따르면, 작은(small) RNA의 얼라인먼트는 미스매치가 없는 세포의 지놈 내의 미리 정해진 위치에 대한 얼라인먼트다.
본 발명의 일부 구현예에 따르면, 전사 가능한 핵산 서열의 핵산 서열을 변형시키는 단계는 비정상적으로 가공된 RNA 분자의 구조를 부여하고, 이는 RNA 분자를 RISC와 결합되는 작은 RNA로 가공되게 한다.
본 발명의 일부 구현예에 따르면, 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사가능한 핵산 서열의 핵산 서열을 변형시키는 단계는 제 1 표적 RNA에 대한 결합 부위에 상응하는 핵산 이외의 핵산에서 영향을 받는다.
본 발명의 일부 구현예에 따르면, 가공 능력은 다이서(Dicer, 아르고노트(Argonaute) tRNA 손상 효소, 및 Piwi-상호작용RNA(Piwi-interacting RNA, piRNA) 관련 단백질로 이루어진 군으로부터 선택된 세포 뉴클레아제에 의해 영향을 받는다.
본 발명의 일부 구현예에 따르면, 단계(d)에서의 변형은 제 1 표적 RNA에 대한 비정상적으로 가공된 RNA 분자에서 침묵 활성을 재활성화하는 DNA 편집제를 세포 내로 도입하여 세포 내에서 침묵 활성을 갖는 RNA 분자를 생성하는 것을 포함한다.
본 발명의 일부 구현예에 따르면, 본 방법은 추가적으로 세포 내 침묵 활성을 갖는 RNA 분자의 특이성을 변형시키는 단계를 포함하고, RNA 분자의 침묵 특이성을 관심 표적 RNA로 재유도시키는 DNA 편집제를 세포 내로 도입하는 것을 포함하는 방법으로, 관심 표적 RNA는 제 1 표적 RNA와는 구별되어, 이로써 세포 내 침묵 활성을 갖는 RNA 분자의 특이성을 변형시킨다.
본 발명의 일부 구현예에 따르면, 본 방법은 추가적으로 세포 내 침묵 활성을 갖는 RNA 분자의 특이성을 변형시키는 단계를 포함하고, 여기에서 DNA 편집제는 RNA 분자의 침묵 특이성을 관심 표적 RNA(target RNA of interest)에 재유도시키며, 관심 표적 RNA는 첫번째 표적 RNA와는 구별되어, 이로써 세포 내 침묵 활성을 갖는 RNA 분자의 특이성을 변형시킨다.
본 발명의 일부 구현예에 따르면, 세포 내 침묵 활성을 갖는 RNA 분자의 특이성을 변형시키는 단계를 포함하는 추가적인 방법으로, 상기 방법은 RNA 분자의 침묵 특이성을 관심 표적 RNA로 재유도시키는 DNA 편집제를 세포 내로 도입하는 것을 포함하고, 상기 관심 표적 RNA는 제 1 표적 RNA와는 구별되어, 이로써 세포 내 침묵 활성을 갖는 RNA 분자의 특이성을 변형시키는 방법.
본 발명의 일부 구현예에 따르면, 단계(a)의 RNA 분자를 암호화하는 확인된 핵산 서열은 침묵 활성 및/또는 소형 침묵 RNA로의 가공하는 것이 그의 2차 구조에 의존하는 침묵 RNA 분자를 암호화하는 유전자와 상동이다.
본 발명의 일부 구현예에 따르면, 단계(a)의 RNA 분자를 암호화하는 핵산 서열은 miRNA 전구체를 암호화하는 유전자와 상동이다.
본 발명의 일부 구현예에 따르면, 침묵 활성 및/또는 소형 침묵 RNA로 가공하는 것이 2차 구조에 의존적인 침묵 RNA 분자는 다음으로 이루어진 군으로부터 선택된 것이다: 마이크로 RNA(microRNA, miRNA), 짧은 헤어핀 RNA(short hairpin RNA, shRNA), 소형 핵 RNA(small nuclear RNA, snRNA or U-RNA), 소형 핵소체 RNA(small nucleolar RNA, snoRNA), 소형 카잘체 RNA(Small Cajal body RNA, scaRNA), 운반 RNA(transfer RNA, tRNA), 리보솜 RNA(ribosomal RNA, rRNA), 반복-유래 RNA(repeat-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 인자-유래 RNA(autonomous and non-autonomous transposable and retro-transposable element-derived RNA, 자율 및 비-자율 전이성 및 레트로-전이성 인자 RNA(autonomous and non-autonomous transposable and retro-transposable element RNA) 및 긴 비-암호화 RNA(long non-coding RNA, lncRNA).
본 발명의 일부 구현예에 따르면, 가공은 정형적인(canonical) 가공이다.
본 발명의 일부 구현예에 따르면, RNA 분자는 침묵 활성을 가진다.
본 발명의 일부 구현예에 따르면, RNA 분자는 마이크로 RNA(microRNA, miRNA), 소형 간섭 RNA(small interfering RNA, siRNA), 짧은 헤어핀 RNA(short hairpin RNA, shRNA), Piwi-상호작용 RNA (Piwi-interacting RNA, piRNA), 단계적 작은 간섭 RNA(phased small interfering RNA, phasiRNA), 트랜스-작용 siRNA(trans-acting siRNA, tasiRNA), 운반 RNA 단편(transfer RNA fragment, tRF), 소형 핵 RNA(small nuclear RNA, snRNA), 전이성 및/또는 레트로-전이성 유래 RNA(transposable and/or retro-transpossable derived RNA), 자율 및 비-자율 전이성 및/또는 레트로-전이성 RNA(autonomous and non-autonomous transposable and/or retro-transpossable RNA)로 이루어진 군으로부터 선택된다.
본 발명의 일부 구현예에 따르면, 본 방법은 추가적으로 세포 내로 공여자 올리고뉴클레오타이드를 도입하는 단계를 포함한다.
본 발명의 일부 구현예에 따르면, DNA 편집제는 적어도 하나의 sgRNA를 포함한다.
본 발명의 일부 구현예에 따르면, DNA 편집제는 엔도뉴클레아제를 포함하지 않는다.
본 발명의 일부 구현예에 따르면, DNA 편집제는 엔도뉴클레아제를 포함한다.
본 발명의 일부 구현예에 따르면, DNA 편집제는 메가뉴클레아제(meganuclease), zinc finger 뉴클레아제(zinc finger nucleases (ZFN)), 전사-활성 유사 이펙터 뉴클레아제(transcription-activator like effector nucleases, TALEN), CRISPR-엔도뉴클레아제(CRISPR-endonuclease), dCRISRP-엔도뉴클레아제(dCRISPR-endonuclease), 및 호밍 엔도뉴클레아제(homing endonuclease)로 이루어진 군으로부터 선택된 DNA 편집 시스템이다.
본 발명의 일부 구현예에 따르면, 엔도뉴클레아제는 Cas9을 포함한다.
본 발명의 일부 구현예에 따르면, DNA 편집제는 DNA, RNA 또는 RNP로써 세포에 적용된다.
본 발명의 일부 구현예에 따르면, DNA 편집제는 세포 내 발현을 모니터링하기 위한 리포터(reporter)에 연결되어 있다.
본 발명의 일부 구현예에 따르면, 리포터는 형광 단백질이다.
본 발명의 일부 구현예에 따르면, 관심 표적 RNA는 세포에 대해 내인성이다.
본 발명의 일부 구현예에 따르면, 관심 표적 RNA는 세포에 대해 외인성이다.
본 발명의 일부 구현예에 따르면, RNA 분자의 침묵 특이성은 관심 표적 RNA의 RNA 또는 단백질 수준을 측정함으로써 결정된다.
본 발명의 일부 구현예에 따르면, RNA 분자의 침묵 특이성은 표현형으로 결정된다.
본 발명의 일부 구현예에 따르면, RNA 분자의 특이성은 세포 크기, 성장률/억제, 세포 모양, 세포막 완전성, 종양 크기, 유기체의 색소 침착, 유기체의 크기, 작물 수확량, 대사 프로필(metabolic profile), 과실 특성, 생물학적 스트레스 저항성, 비생물학적 스트레스 저항성, 감염 매개변수, 및 염증 매개변수로 이루어진 군으로부터 선택된 적어도 하나의 표현형의 결정에 의해 표현형적으로(phenotypically) 결정된다.
본 발명의 일부 구현예에 따르면, RNA 분자의 침묵 특이성은 표현형으로 결정된다.
본 발명의 일부 구현예에 따르면, 세포는 진핵 세포이다.
본 발명의 일부 구현예에 따르면, 진핵 세포는 식물, 포유동물, 무척추동물, 곤충, 선충류, 조류(bird), 파충류, 어류, 갑각류, 진균류, 조류(algae)로 이루어진 군으로부터 선택된 진핵 유기체로부터 얻어진 것이다.
본 발명의 일부 구현예에 따르면, 진핵 세포는 식물 세포이다.
본 발명의 일부 구현예에 따르면, 식물 세포는 원형질체이다.
본 발명의 일부 구현예에 따르면, 식물체는 유전자가 도입되지 않은 것이다.
본 발명의 일부 구현예에 따르면, 식물체는 유전자가 도입된 식물체이다.
본 발명의 일부 구현예에 따르면, 식물체는 유전적으로 변형되지 않은 것(non-GMO)이다.
본 발명의 일부 구현예에 따르면, 식물체는 유전적으로 변형된 것(GMO)이다.
본 발명의 일부 구현예에 따르면, 육종은 교배 또는 자가번식을 포함한다.
본 발명의 일부 구현예에 따르면, 진핵 세포는 비인간 동물 세포이다.
본 발명의 일부 구현예에 따르면, 진핵 세포는 비인간 포유동물 세포이다.
본 발명의 일부 구현예에 따르면, 진핵 세포는 인간 세포이다.
본 발명의 일부 구현예에 따르면, RNA 분자를 암호화하는 핵산 서열은 서열번호 352 내지 392 중 어느 하나에 명시된 핵산 서열로 이루어진 군으로부터 선택된다.
본 발명의 일부 구현예에 따르면, 진핵 세포는 전형성능 줄기 세포이다.
본 발명의 일부 구현예에 따르면, 질병의 발병 또는 진행과 관련된 유전자는 병원체의 유전자를 포함한다.
본 발명의 일부 구현예에 따르면, 질병의 발병 또는 진행과 관련된 유전자는 대상의 유전자를 포함한다.
본 발명의 일부 구현예에 따르면, 질병은 감염성 질환, 단일유전자 열성 장애, 자가면역 질환 및 암성 질환으로 이루어진 군으로부터 선택된다.
본 발명의 일부 구현예에 따르면, 제 2 RNA 분자는 침묵 활성을 갖는 RNA로 가공될 수 있게 하는 2차 구조를 가진 RNA 분자이며, 선택적으로 여기에서 침묵 활성은 RISC와 결합함으로써 매개된다.
본 발명의 일부 구현예에 따르면, 침묵 활성을 갖는 RNA로 가공될 수 있게 하는 2차 구조를 가진 RNA 분자는 다음으로 이루어진 군으로부터 선택된다: 마이크로RNA (microRNA, miRNA), 짧은-헤어핀 RNA (short-hairpin RNA, shRNA), 소형 핵 RNA (small nuclear RNA, snRNA or URNA), 소형 핵소체 RNA(small nucleolar RNA, snoRNA), 소형 카잘체 RNA(Small Cajal body RNA, scaRNA), 운반 RNA(transfer RNA, tRNA), 리보솜 RNA(ribosomal RNA, rRNA), 반복-유래 RNA(repeat-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 요소-유래 RNA(autonomous and non-autonomous transposable and retro-transposable element-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 인자 RNA(autonomous and non-autonomous transposable 및 retro-transposable element RNA) 및 긴 비-암호화 RNA(long non-coding RNA, lncRNA).
본 발명의 일부 구현예에 따르면, 제 1 핵산 서열은 변형된 제 1 RNA 분자가 제 4 RNA 분자로 가공될 수 있게 하는 2차 구조를 생성한다.
본 발명의 일부 구현예에 따르면, 제 1 핵산 서열을 변형시키는 단계는 변형된 제 1 RNA 분자가 본질적으로 제 2 RNA 분자의 것과 동일한 2차 구조를 갖도록 서열을 변형시키는 단계를 포함한다.
일부 구현예에 따르면, 2차 구조는 제 2 RNA 분자의 2차 구조와 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9% 또는 100% 동일하다 (예를 들어, 제 1 RNA 분자의 2차 구조가 선형의 끈 형태로 번역되고 및 제 2 RNA 분자의 2차 구조의 선형과 비교되는 경우).
본 발명의 일부 구현예에 따르면, 제 1 핵산 분자는 H.sapiens로부터의 유전자이고, 여기에서 유전자는 서열 번호 352 내지 392 중 어느 하나에 명시된 서열을 갖는 유전자로 이루어진 군으로부터 선택된다.
본 발명의 일부 구현예에 따르면, 대상은 인간 대상이다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및/또는 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 사람이 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 명시된 방법 및 재료와 유사하거나 또는 등가인 방법 및 재료가 본 발명의 구현예의 실시 또는 시험에 이용될 수 있으나, 예시적인 방법 및/또는 재료들은 하기에 명시된다. 상충의 경우에, 정의를 비롯하여 본 특허 명세서를 우위를 가질 것이다. 또한, 재료, 방법, 및 실시예들은 단지 예시에 불과하며 반드시 한정적인 것으로 의도되지는 않는다.
본 발명의 일부 구현예는 첨부 도면을 참조하여, 단지 예시로서 본 명세서에 명시된다. 이제, 구체적으로, 특정 도면을 참조하여, 제시된 상세한 내용이 본 발명의 구현예의 예시로서, 이의 설명적인 논의의 목적을 위한다는 것이 강조된다. 이러한 점에서, 도면과 함께 취해진 상세한 설명은 당 업계의 통상의 기술자에게 본 발명의 구현예가 어떻게 실시될 수 있는지를 명백하게 할 것이다.
도면에서:
도 1은 기능장애 비-암호화 RNA 분자의 침묵 활성을 부여하고 그들의 침묵 특이성을 재유도하기 위한 실시 컴퓨테이션 파이프라인(embodiment computational pipeline)의 흐름도이다. 참고로, 컴퓨테이션 지놈 편집 유도 유전자 침묵(Computational Genome Editing Induced Gene Silencing, GEiGS) 경로는 생물학적 메타데이터를 적용하고 miRNA 유전자를 최소한으로 편집하는데 사용되는 GEiGS DNA 주형의 자동 생성을 가능케 하여 새로운 기능의 획득, 즉, 그들의 침묵 능력을 관심 표적 서열로 재유도한다.
도 2는 기능적인 miRNA의 small RNAseq 프로파일링의 miRbase 표현을 보여주는 사진이다. 2 개의 성숙 miRNA 가닥의 다른 검출에 주목한다. 많은 수의 리드(read)가 있는 miRNA는 일반적으로 기능적인 것(가이드 가닥) 및 리드(read)가 거의 또는 전혀 없는 다른 miRNA는 일반적으로 세포에서 분해된다(패신저 가닥). 그러나 성숙 miRNA의 두 가닥이 모두 기능하는 일부 경우가 있다(각각 다른 전사체를 표적으로 함).
도 3은 miRNA-유사 서열을 포함하는 RNA-seq 리드(read)의 수를 나타내는 그래프이다. x축은 다른 종에서 발현되는 miRNA-유사 서열을 나타낸다. y축은 miRNA-유사 서열을 포함하는 별개의 RNAseq 리드(read)의 수를 나타내며, 여기서 'has'는 인간(H.sapiens), 'ath'는 애기장대(A.thaliana) 및 'cel'은 예쁜꼬마선충(C.elegans)를 의미한다.
도 4는 GEiGS 주형을 생성하기 위한 컴퓨테이션 경로의 구현예 흐름도이다. 컴퓨테이션 GEiGS 경로는 생물학적 메타데이터를 적용하고 내인성 비-암호화 RNA 유전자(예를 들어 miRNA 유전자)를 최소한으로 편집하는데 사용되는 GEiGS DNA 공여자 주형의 자동 생성을 가능케 하여 새로운 기능의 획득, 즉, 그들의 침묵 능력을 관심 표적 유전자 발현으로 재유도한다.
도 5는 내인성 miRNA를 PDS 유전자를 표적으로 하는 siRNA로 대체하여 내인성 PDS 유전자의 유전자 침묵을 유도하는 GEiGS(Genome Editing Induced Gene Silencing)의 구현예 흐름도이다. 변형을 도입하기 위해, 두 개의 구성 요소 시스템이 사용된다. 첫째, GFP를 포함하는 벡터의 CRISPR/CAS9 시스템은 설계된 특정 가이드 RNA를 통해 선택된 유전자좌에서 손상을 생성하여 해당 부위의 상동 DNA 복구(HDR)를 촉진한다. 둘째, 새롭게 할당된 유전자를 표적으로 하기 위해, 목적하는 miRNA 서열의 변형을 가진 공여자 서열이 HDR을 위한 주형으로 도입된다. 이러한 시스템은 원형질체 형질전환에 사용되고, CRISPR/CAS9 벡터에서 GFP 신호로 인해 FACS에 의해 농축되고, 회수되며, 및 식물체로 재생된다.
도 6A-C는PDS 유전자의 침묵이 광표백을 유발하는 것을 보여주는 사진이다. 담배(Nicotiana) (도 6A-B) 및 애기장대(Arabidopsis) (도 6C)식물에서 PDS 유전자의 침묵은 담배(N. benthamiana) (도 6B) 및 애기장대(Arabidopsis) (도 6C, 오른쪽)에서 광표백을 유발한다. 사진은 PDS 침묵 후 3.5주 후에 촬영되었다.
도 7은 본 발명의 따른 RNA 전사체에서 침묵 활성을 재활성화 또는 재유도화하기 위한 가공의 구현예의 개략도를 제공한다.
도 8A-B는 하기 실시예 2에 명시된 바와 같이 A. thaliana 원형질체를 형질주입시키기 위해 사용된 벡터의 개략도를 제공하며, 다음의 가공 능력 및 침묵 활성을 시험한다: (도 8A) 야생형 mRNA 전구체, “죽은” miRNA-유사 분자의 전구체 및 침묵 활성이 재활성화된 “죽은” miRNA-유사 분자의 전구체, (도 8B) 침묵 활성이 재활성화된 “죽은” miRNA-유사 분자의 전구체, 및 침묵 활성이 PDS3 유전자를 표적으로 재유도된 “죽은” miRNA-유사 분자 전구체
도 9A-H는 다음을 제공한다: (도 9A) 다음 miRNA 또는 miRNA-유사 유전자에 의해 암호화되는 다음의 A. thaliana 전구체에 대해 예측된 2차 구조의 도식적 표현: 야생형 miR405a, miRNA-유사 miR859-Dead, 침묵 활성이 재활성화된 miRNA-like miR859_Dead (miR859_Reactivated) 및 침묵 활성이 활성화되고 PDS3 유전자로 재유도된 miRNA-like miR859_Dead (miR859_Redirected). 각 구조의 회색 상자는 성숙 miRNA의 가이드 가닥 또는 miRNA-유사 전구체의 해당 위치를 표시한다 - 각 가이드 가닥과 표적 서열에 대한 정렬은 도 9B에 추가로 제시되어 있다. (도 9C) 및 (도 9D) A. thaliana 원형질체를 (도 9A)에 묘사된 벡터를 발현하는 벡터로 형질주입시켰을 때 관찰되는 (루시페라제, LUC, 및 보정된 형광 단백질, FP간의 비율 감소에 의해 측정되는) 침묵 활성을 비교하는 막대 그래프. 어두운 색 막대는 실험 처리군을 나타내고 및 밝은 색 막대는 각각의 대조군을 나타낸다; student's t-test에 따라 그래프에서 괄호 안에 기록된 p-value; 오차 막대는 정형적인 오차를 나타낸다. (도 9E) 다음의 miRNA 또는 miRNA-유사 유전자에 의해 암호화되는 다음의 A. thaliana 전구체에 대해 예측된 2차 구조의 도식적 표현: 야생형 miR8174, miRNA-유사 miR1334_Dead, 침묵 활성이 재활성화된 miRNA (miR1334_Reactivated) 및 침묵 활성이 활성화되고 PDS3 유전자로 재유도된 miR1334_Dead (miR1334_Redirected). 각 구조의 회색 상자는 성숙 miRNA의 가이드 가닥 또는 miRNA-유사 전구체의 해당 위치를 표시한다 - 각 가이드 가닥과 표적 서열에 대한 정렬은 도 9F에 추가로 제시되어 있다. (도 9G) 및 (도 9H) 애기장대(A. thaliana) 원형질체를 (도 9E)에 묘사된 벡터를 발현하는 벡터로 형질주입시켰을 때 관찰되는 (루시페라제, LUC, 및 보정된 형광 단백질, FP간의 비율 감소에 의해 측정되는) 침묵 활성을 비교하는 막대 그래프. 어두운 색 막대는 실험 처리군을 나타내고 및 밝은 색 막대는 각각의 대조군을 나타낸다; student's t-test에 따라 그래프에서 괄호 안에 기록된 p-value; 오차 막대는 정형적인 오차를 나타낸다.
도 10A-N은 애기장대(Arabidopsis thaliana)의 miRNA-유사 유전자 ath_dead_mir1334 및 그에 상응하는 WT miRNA ath-mir-8174 (MI0026804)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 10A는 WT 전구체 서열(chr3부위의 16589414-16589527에 위치한 miRNA 유전자 ath-mir-8174)와 완벽하게 일치하는 모든 뿌리의 20 bp 길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 도 10G는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. Figure 10H는 chr5 부위의 13644905-1364500에 위치하는 mir-유사 유전자 전구체 서열과 완벽하는 일치하는 모든 뿌리의 20bp길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 10N은 mir-유사 전구체 ath_dead_mir1334의 2차 구조를 나타낸다.
도 11A-J는 애기장대(Arabidopsis thaliana)의 miRNA-유사 유전자 ath_dead_mir247 및 그에 상응하는 WT miRNA ath-mir-8180 (MI0026810)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 11E는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. 도 11F는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 뿌리의 21 bp 길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 11J는 mir-유사 전구체 ath_dead_mir247의 2차 구조를 보여준다.
도 12A-I는 애기장대(Arabidopsis thaliana)의 miRNA-유사 유전자 ath_dead_mir859 및 그에 상응하는 WT miRNA ath-mir-405a (MI0001074)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 12A는 WT 전구체 서열(miRNA gene ath-mir-405a)와 완벽하게 일치하는 모든 24 bp 길이의 뿌리의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 도 12D는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. Figure 12E는 mir-유사 유전자 전구체 서열과 완벽하는 일치하는 모든 23bp길이의 뿌리의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 12I는 mir-유사 전구체 ath_dead_mir859의 2차 구조를 나타낸다.
도 13A-H는 예쁜꼬마선충(C. elegans)의 miRNA-유사 유전자 cel_dead_mir219 및 그에 상응하는 WT miRNA cel-mir-5545 (MI0019066)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 13A는 WT miRNA 유전자 cel-mir-5545의 전구체 서열과 완벽하게 일치하는 모든 배아의 21 bp길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 마찬가지로, 도 13B는 WT 전구체 서열과 완벽하게 일치하는 모든 22 bp 길이의 배아의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 13E는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. 도 13F는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 어린 성체의 22 bp 길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 13H는 mir-유사 전구체 cel_dead_mir219의 2차 구조를 보여준다.
도 14A-H는 예쁜꼬마선충(C. elegans)의 miRNA-유사 유전자 cel_dead_mir363 및 그에 상응하는 WT miRNA cel-mir-5545 (MI0019066)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 14A는 WT miRNA 유전자 cel-mir-5545의 전구체 서열과 완벽하게 일치하는 모든 배아의 21 bp길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 마찬가지로, 도 14B는 WT 전구체 서열과 완벽하게 일치하는 모든 22 bp 길이의 배아의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 14E는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. 도 14F는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 L4단계의 22 bp 길이의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 14H는 mir-유사 전구체 cel_dead_mir363의 2차 구조를 보여준다.
도 14A-H는 예쁜꼬마선충(C. elegans)의 miRNA-유사 유전자 cel_dead_mir537 및 그에 상응하는 WT miRNA cel-mir-8196b (MI0026837)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 및 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 15A는 WT miRNA 서열(miRNA gene cel-mir-8196b)와 완벽하게 일치하는 모든 23 bp길이의 배아의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 도 15F는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. 도 15G는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 배아의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 15H는 mir-유사 전구체 cel_dead_mir537의 2차 구조를 보여준다. 참고로, WT 서열 및 mir-유사 서열은 매우 적은 수의 염기에서만 차이가 있다. 따라서, 이들의 2차 구조는 매우 유사하거나 또는 동일할 것으로 예상된다.
도 16A-J는 H. sapiens의 miRNA-유사 유전자 hsa_dead_mir54024 및 그에 상응하는 WT miRNA hsa-mir-523 (MI0003153)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 16A는 WT miRNA 유전자 hsa-mir-523의 전구체 서열과 완벽하게 일치하는 모든 21 bp길이의 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 마찬가지로, 도 16B는 WT 전구체 서열과 완벽하게 일치하는 모든 22 bp 길이의 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 16E는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. 도 16I는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 폐의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 16F는 mir-유사 전구체 hsa_dead_mir54024의 2차 구조를 보여준다.
도 16A-J는 H. sapiens의 miRNA-유사 유전자 hsa_dead_mir54573 및 그에 상응하는 WT miRNA hsa-mir-663b (MI0006336)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 17A는 WT miRNA 유전자 hsa-mir-663b의 전구체 서열과 완벽하게 일치하는 모든 21 bp길이의 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 마찬가지로, 도 17B는 WT 전구체 서열과 완벽하게 일치하는 모든 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 17C는 WT miRNA 전구체 hsa-mir-663b의 2차 구조를 나타낸다. 도 17D는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 22 bp 길이의 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 17J는 mir-유사 전구체 hsa_dead_mir54573의 2차 구조를 보여준다.
도 18A-E는 H. sapiens의 miRNA-유사 유전자 hsa_dead_mir50078및 그에 상응하는 WT miRNA hsa-mir-1273h (MI0025512)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 각 mir-유사 유전자 및 그에 상응하는 WT miRNA에 대해, 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 해당 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 18A는 WT miRNA 유전자 hsa-mir-1273h의 전구체 서열과 완벽하게 일치하는 모든 23 bp길이의 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 마찬가지로, 도 18B는 WT 전구체 서열과 완벽하게 일치하는 모든 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 18C는 앞서 언급한 WT miRNA 전구체의 2차 구조를 나타낸다. 도 18D는 mir-유사 유전자 전구체 서열과 완벽하게 일치하는 모든 뇌의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 18E는 mir-유사 전구체 hsa_dead_mir50078의 2차 구조를 보여준다.
도 19A-H는 예쁜꼬마선충(C. elegans)의 miRNA cel-mir-71 (MI0000042)의 작은(small) RNA 분포 및 2차 구조도를 제공한다. 19-24 bp 길이의 7개의 다른 리드(read) 크기 군 및 모든 크기의 small RNA seq 리드(read)를 나타내는 small로 표시된 군을 사용하여 miRNA 전구체 서열과 완벽하게 일치하는 리드(read)의 분포를 도식화하였다. 리드 계수(Read count)는 RPKM으로 보정되었고 도표는 해당 전구체 서열와 완벽하게 일치하는 리드(read)가 10개 이상 있는 경우 특정 크기 군에 대하여 생성되었다. 각 전구체 서열의 2차 구조는 ViennaRNA 패키지의 RNAplot 모듈을 사용하여 생성되었다. 구체적으로, 도 19A는 WT miRNA 유전자 cel-mir-71의 전구체 서열과 완벽하게 일치하는 모든 21 bp길이의 배아의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 각 도면의 하단의 막대 그림은 표시된 전구체의 성숙 서열의 위치를 표시하고 및 범례는 성숙 서열의 크기를 나타낸다. 마찬가지로, 도 19B는 전구체 서열과 완벽하게 일치하는 모든 23 bp 길이의 배아의 small RNA seq 리드(read)에 대한 분포도를 보여준다. 도 19H는 miRNA cel-mir-71의 2차 구조를 나타낸다.
본 발명은, 그의 일부 구현예에서, 진핵 세포에서 침묵-기능장애 RNA 분자(예를 들어 miRNA-유사 분자)에 침묵 활성을 부여하고 및 가능하게는 내인성 또는 외인성 관심 표적 RNA의 침묵에 대한 RNA 분자의 침묵 특이성을 변형시키는 것에 관한 것이다.
본 발명의 원리 및 작용은 상기도면 및 첨부한 상세한 설명을 참조하여 더 잘 이해될 수 있다.
본 발명의 적어도 하나의 구현예를 상세히 설명하기 전에, 본 발명은 다음의 설명에 기재되거나 또는 실시예에 의해 예시된 세부사항으로의 적용에 있어서 반드시 한정되는 것은 아님을 이해해야 한다. 본 발명은 다른 구현예가 가능하거나 또는 다양한 방식으로 및 다른 유기체에서 실행 또는 수행될 수 있다. 또한, 본 명세서에 사용된 어구 및 용어는 설명을 위한 것이며 및 제한하는 것으로 간주되어서는 안 됨을 이해해야 한다.
다양한 유기체(예를 들어 쥐, 인간, 식물)에서 RNA 분자의 지놈 편집에 대한 이전 작업은 형질전환을 이용하여 miRNA 활성 또는 표적 결합 부위의 파괴에 중점을 두었다. 식물에서의 지놈 편집은 모델 식물에서의 유전자 넉아웃 및 삽입을 위해 CRISPR-Cas9 기술, ZFN 및 TALEN과 같은 뉴클레아제의 사용에 집중하였다. 또한, 내인성 및 외인성 표적 유전자를 침묵시키 위해 인공 miRNA 이식유전자를 사용하는 식물에서의 유전자 침묵이 기술되었다 [Molnar A 외 Plant J. (2009) 58(1):165-74. Doi: 10.1111/j.1365-313X.2008.03767.x. Epub 2009 Jan 19; Borges and Martienssen, Nature Reviews Molecular Cell Biology | AOP, published online 4 November 2015; doi:10.1038/nrm4085]. 인공 miRNA 이식유전자는 (프로모터, 터미네이터, 선택 마커 등을 포함하는) 인공 발현 카세트 내의 식물 세포에 도입되어 표적 발현을 하향조절한다.
포유류 유기체에서 개발된 유전자 치료 기술 (예를 들어 인간 치료를 위해)에는 바이러스 전이유전자 발현(viral transgene expression), 및 표적 mRNA의 넉다운(knockdown)에 의해 결함 유전자의 억제를 매개하는 RNAi에 의한 결여 유전자 기능의 복원을 가능케 한 유전자 치료법이 포함된다. 지놈 편집 기술의 최근 발전은 인간 환자의 세포에서 하나 이상의 뉴클레오타이드를 편집함으로써, 예를 들어, 지놈 내 목적하는 위치에서 부위-특이적 이중-가닥 절단(DSBs) 유도한 후, 지놈 편집(NHEJ 및 HR)에 의해 살아있는 세포의 DNA 서열을 변경하는 것을 가능하게 하였다. NHEJ는 주로, 독점적이지는 않지만, 넉아웃 목적으로 사용되고, HR은 점 돌연변이(point mutation)와 같이 특정 부위의 정교한 편집을 도입하거나 또는 자연적으로 발생하거나 유전적으로 부여되는 유해한 돌연변이를 교정하는데 사용된다.
본 발명은 부분적으로 RNA 분자를 암호화하는 유전자의 확인에 기초하며, 여기에서: (1) 확인된 유전자에 의해 암호화된 RNA 분자는 동일한 유기체의 상응하는 정형적인 침묵 RNA 분자(예를 들어 miRNA 및/또는 miRNA 전구체)의 상동성을 나타내고; (2) 확인된 유전자는 RNA분자로 전사되며; 및 (3) 확인된 유전자에 의해 발현된 RNA는 상응하는 상동 정형적인 침묵 분자와 같이 RNA로 가공되지 않는다(즉, 확인된 유전자에 의해 발현된 RNA는 비정상적으로 가공되거나 또는 가공되지 않는다). 본 명세서의 하기에 예시된 바와 같이, 이러한 유전자는 다양한 유기체에서 확인되었다. 이론이나 방법에 얽매이지 않고, 비정상적으로 가공된 RNA는 침묵 활성을 갖는 RNA 분자로 가공되지 않고, 따라서 확인된 유전자는 침묵-기능장애 RNA 분자로 암호화된다.
본 발명을 실시하기 위해 축소하는 반면, 본 발명자들은 기능장애 RNA 분자(예를 들어 다이서(Dicer)와 같은 RNAi 인자에 의해 가공되는 것)로 정형적인 가공성을 부여하기 위한 지놈 편집 기술을 고안했고, 여기에서 기능장애 RNA 분자는 동일 유기체에서 정형적인으로 가공된 RNA 분자를 암호화하는 상동성 핵산 서열과 관련하여 적어도 하나의 핵산 서열 변경을 포함하고, 추가로 기능장애 RNA 분자는 세포에서 전사된다.
본 발명자들은 침묵 RNA에 의해 원래 표적화되지 않은 관심 표적 유전자(세포에 대해 내인성 또는 외인성)를 표적화하고 및 발현을 방해하도록 가공가능한 RNA 분자의 침묵 특이성을 재유도하는 유전자 편집 기술을 추가로 이용하였다. 구체적으로, 본 발명자들은 예를 들어 비-암호화 RNA 분자(예를 들어 RNA 침묵 분자, 예를 들어 siRNA, miRNA, piRNA, tasiRNA, tRNA, rRNA, antisense RNA 등)을 포함하는 진핵 세포의 내인성 RNA 분자를 활용할 수 있고 및 관심 대상의 임의의 RNA 표적을 표적화 하도록 변형시킬 수 있는 지놈 편집 유도된 유전자 침묵(GEiGS) 플랫폼을 설계하였다. GEiGS를 이용하여, 본 발명은 이러한 내인성 RNA 분자에서 몇 개의 뉴클레오타이드를 편집할 수 있게 하고, 및 이로써 관심 있는 임의의 RNA를 효과적이고 구체적으로 표적화 하기 위해 이들의 활성 및/또는 특이성을 재유도할 수 있게 한다. 본 명세서에 기재된 유전자 편집 기술은 프로모터, 터미네이터, 선택 마커를 갖는 발현 카세트(expression cassette)를 포함하는 전형적인 분자 유전학적인 전이 유전자 도구를 필요로 하지 않는다. 더욱이, 본 발명의 일부 구현예의 유전자 편집 기술은 RNA 분자(예, 내인성)의 지놈 편집을 포함하지만 이는 안정적이고 유전가능하다.
따라서, 본 발명의 측면에 따르면 세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 방법이 제공되며, 다음의 방법을 포함한다: (a) RNA-유도된침묵 복합체(RNA-induced silencing complex, RISC)와 결합된 RNA 분자를 암호화하는 핵산 서열과 관련하여, 완전한 동일성을 포함하지 않는, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열을 확인하는 단계; (b) 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해 RNA 분자를 암호화하는 핵산 서열의 전사를 결정하는 단계; (c) 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 전사체의 작은(small) RNA로의 가공성을 결정하고, 여기에서 RNA 분자는 비정상적으로 가공되는 단계; (d) RISC와 결합되고 제 1 표적 RNA에 상보적인 작은 RNA에 가공 능력을 부여하기 위해 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 핵산 서열을 변형시키는 단계, 이로써 세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 단계.
일부 구현예에 따르면, 본 명세서에 제공된 방법은 세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 방법이고, 다음의 방법을 포함한다: (a) RNA-유도된 침묵 복합체(RISC)와 결합된 RNA 분자를 암호화하는 핵산 서열과 관련하여, 미리 정해진 서열 상동성 범위를 나타내고, 완전한 동일성을 포함하지 않는, RNA 분자를 암호화하는 핵산 서열을 선택하는 단계; 여기에서 선택은 다음을 포함한다: (1) 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사가능한 핵산 서열을 선택하기 위해 RNA 분자를 암호화하는 핵산 서열의 전사를 결정하는 단계 및 (2) 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 전사체의 작은 RNA로의 가공 능력을 결정하는 단계이고, 여기에서 RNA 분자는 비정상적으로 가공되는 단계; 및 (b) RISC와 결합되고 제 1 표적 RNA에 상보적인 작은 RNA에 가공 능력을 부여하기 위해 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사 가능한 핵산 서열의 핵산 서열을 변형시키는 단계, 이로써 세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 단계.
한 구현예에 따르면, 세포는 진핵 세포다.
본원에 사용된 용어 "진핵 세포(eukaryotic cell)"는 진핵 유기체의 임의의 세포를 지칭한다. 진핵 유기체는 단세포 및 다세포 유기체를 포함한다. 단세포 진핵 유기체는 효모, 원생동물, 점균류 및 조류(algae)를 포함하지만, 이에 제한되지는 않는다. 다세포 진핵 유기체는 동물(예를 들어 포유류, 곤충, 무척추동물, 선충류, 조류(bird), 어류, 파충류 및 갑각류(crustaceans)), 식물, 진균 및 조류(algae) (예를 들어 갈조류, 홍조류, 녹조류)를 포함하지만, 이에 한정되지 것은 아니다.
한 구현예에 따르면, 세포는 식물 세포이다.
특정 구현예에 따르면, 식물 세포는 원형질체이다.
원형질체는 임의의 식물 조직 예를 들어, 과실, 꽃, 뿌리, 잎, 배아, 배아 세포 현탁액, 캘러스 또는 유식물(seedling) 조직(하기에 논의됨)으로부터 유래된다.
특정 구현예에 따르면, 식물 세포는 배발생 세포(embryogenic cell)이다.
특정 구현예에 따르면, 식물 세포는 체세포 배발생 세포(somatic embryogenic cell)이다.
한 구현예에 따르면, 진핵 세포는 식물의 세포가 아니다.
한 구현예에 따르면, 진핵 세포는 동물 세포이다(예를 들어 비-인간 동물 세포).
한 구현예에 따르면, 진핵 세포는 척추동물(vertebrate)의 세포이다.
한 구현예에 따르면, 진핵 세포는 무척추 동물(invertebrate)의 세포이다.
특정 구현예에 따르면, 무척추 동물 세포는 곤충, 달팽이, 조개, 문어, 불가사리, 성게(sea-urchin), 해파리 및 벌레(worm)의 세포이다.
특정 구현예에 따르면, 무척추 동물 세포는 갑각류(crustacean)의 세포이다. 예시적인 갑각류는 새우(shrimp), 새우(prawn), 게, 바닷가재 및 크레이피쉬(crayfish)를 포함하지만, 이에 한정되는 것은 아니다.
특정 구현예에 따르면, 무척추 동물 세포는 어류의 세포이다. 예시적인 어류는 연어, 참치, 폴락(Pollock), 메기(Catfish), 코드(Cod), 해덕(Haddock), 새우(prawn), 농어(Sea bass), 틸라피아(Tilapia), 북극 곤들매기(Arctic char) 및 잉어(Carp)를 포함하지만, 이에 한정되는 것은 아니다.
한 구현예에 따르면, 진핵 세포는 포유류 세포(예를 들어 비-인간 포유류 세포)이다.
특정 구현예에 따르면, 포유류 세포는 설치류(rodent), 토끼, 돼지, 염소, 반추동물(ruminant) (예를 들어 소, 양, 영양(antelope), 사슴 및 기린), 개, 고양이, 말, 및 비-인간 영장류(primate)와 같은 비-인간 유기체의 세포이나, 이에 한정되는 것은 아니다.
특정 구현예에 따르면, 진핵 세포는 인간의 세포이다.
한 구현예에 따르면, 진핵 세포는 1차 세포(primary cell), 세포주(cell line), 체세포(somatic cell), 생식세포(germ cell), 줄기세포(stem cell), 배아 줄기세포(embryonic stem cell), 성체 줄기세포(adult stem cell), 조혈 줄기세포(hematopoietic stem cell), 중간엽 줄기세포(mesenchymal stem cell), 유도 만능 줄기세포(induced pluripotent stem cell , iPS), 배우자 세포(gamete cell), 접합체 세포(zygote cell), 배반포 세포(blastocyst cell), 배아(embryo), 태아(fetus) 및/또는 공여 세포(donor cell)이다.
본 명세서에 사용된 바와 같이, "줄기세포(stem cell)"라는 문구는 특정하고, 전문화된 기능을 갖는 다른 세포 유형(예, 완전히 분화된 세포)으로 분화하도록 유도되기 전까지, 연장된 배양 기간 동안에 미분화 상태로 유지할 수 있는 세포(예를 들어 전능성(totipotent), 만능성(pluripotent) 또는 다능성(multipotent) 줄기세포)를 의미한다. 수정(fertilization) 후 처음 2회의 세포 분열 이내의 배아 세포와 같은 전능성 세포는 배아 및 배아 외(extra-embryonic) 세포로 분화할 수 있고, 생육가능한(viable) 인간으로 발달할 수 있는 유일한 세포이다. 바람직하게, "만능성 줄기 세포"라는 문구는 모든 이러한 세 가지 배아 배엽(embryonic germ layer), 즉 외배엽(ectoderm), 내배엽(endoderm) 및 중배엽(mesoderm)으로 분화할 수 있거나, 또는 미분화된 상태로 유지하는 세포를 의미한다. 만능성 줄기 세포는 배아 줄기세포(ESCs) 및 유도 만능 줄기세포(iPS)를 포함한다. 다능성 줄기세포는 성체 줄기세포 및 조혈 줄기세포를 포함한다.
"배아 줄기세포(embryonic stem cell)"라는 문구는 모든 세 가지 배아 배엽(즉, 외배엽, 내배엽 및 중배엽)의 세포들로 분화할 수 있거나 또는 미분화 상태로 유지하는 배아세포를 의미한다. "배아 줄기세포"라는 문구는 임신(gestation) 후 배아의 착상(implantation) 전에 형성된 배아 조직 형성된 배아 조직(예, 배반포) (즉, 착상-전 배반포(pre-implantation blastocyst))로부터 얻어진 세포; 착상-후/낭배형성-전(pre-gastrulation) 단계 배반포로부터 얻어진 확장 배반포 세포(extended blastocyst cell (EBCs)) (국제특허공보 WO2006/040763를 참고); 임신 동안의 임의의 시기, 바람직하게, 임신의 10주차 전의 태아의 생식기 조직(genital tissue)로부터 얻어진 배아 생식(embryonic germ, EG) 세포; 및 단성생식(parthenogenesis) (반수성 개체(parthenotes))에 의해 촉진된 미수정 난자(unfertilized ova)로부터 유래한 세포;를 포함할 수 있다.
본 발명의 일부 구현예의 배아 줄기세포는 알려진 세포-배양 방법을 이용하여 얻을 수 있다. 예를 들어, 인간 배아 줄기세포는 인간 배반포로부터 분리될 수 있다. 인간 배반포는 통상적으로 인간 생체 내(in vivo) 착상전 배아로부터 또는 시험관 내 수정된 (in vitro fertilized, IVF) 배아로부터 얻어진다. 대안적으로는, 단세포 인간 배아가 배반포 단계로 확장될 수 있다.
또한, 본 발명의 일부 구현예에 따르면, 상업적으로 이용가능한 줄기세포가 사용될 수 있다는 것이 인식될 것이다. 인간 ES 세포는 NIH 인간 배아 줄기세포 등록소(human embryonic stem cells registry) [www(dot)grants(dot)nih(dot) gov/stem_cells/registry/current(dot)html]로부터 구입할 수 있다.
더욱이, 인간 줄기세포는 마우스(Mills 및 Bradley, 2001); 골든 햄스터 [Doetschman 외, 1988, Dev Biol. 127: 224-7]; 랫트(rat)[Iannaccone 외, 1994, Dev Biol. 163: 288-92]; 토끼 [Giles 외, 1993, Mol Reprod Dev. 36: 130-8; Graves & Moreadith, 1993, Mol Reprod Dev. 1993, 36: 424-33]; 몇몇 가축 종 [Notarianni 외, 1991, J Reprod Fertil Suppl. 43: 255-60; Wheeler 1994, Reprod Fertil Dev. 6: 563-8; Mitalipova 외, 2001, Cloning. 3: 59-67]; 및 비-인간 연장류 종 (레서스 원숭이(Rhesus monkey) 및 마모셋(marmoset)) [Thomson 외, 1995, Proc Natl Acad Sci U S A. 92: 7844-8; Thomson 외, 1996, Biol Reprod. 55: 254-9]; 을 포함하는 다양한 종으로부터 얻을 수 있다.
"유도 만능 줄기세포(induced pluripotent stem cell)" (iPS; 배아-유사 줄기세포 (embryonic-like stem cells))는 만능성(pluripotency)를 타고난 성체 체세포의 역-분화에 의해 얻어진 세포를 의미한다 (즉, 세 가지 배아 배엽층, 즉 외배엽, 내배엽 및 중배엽으로 분화할 수 있음). 본 발병의 일부 구현예에 따라, 이러한 세포는 분화된 조직 (예, 피부와 같은 체세포 조직)으로부터 얻어지고, 배아 줄기세포 특징을 회복하도록 세포를 재프로그래밍하는(reprogram) 유전자 조작에 의해 역-분화를 겪는다. 본 발명의 일부 구현예에 따라, 유도 만능 줄기세포는 체세포 줄기세포에서 Oct-4, Sox2, Kfl4 및 c-Myc의 발현을 유도함으로써 형성된다.
유도 만능 줄기세포 (iPS) (배아-유사 줄기세포)는 체세포의 유전자 조작에 의해, 예를 들어, Oct-3/4, Sox2, c-Myc, 및 KLF4와 같은 전사 인자를 갖는, 예를 들어, 섬유아세포(fibroblast), 간세포(hepatocyte), 위 상피세포(gastric epithelial cell)과 같은 체세포의 레트로바이러스 형질도입(transduction)에 의해 체세포로부터 생성될 수 있다 [예를 들어, Park 외 Reprogramming of human somatic cells to pluripotency with defined factors. Nature (2008) 451:141-146에 명시됨].
"성체 줄기세포(adult stem cell)" (또한 "조직 줄기세포(tissue stem cell)" 또는 체조직(somatic tissue)으로부터의 줄기세포라고 불림)라는 문구는 (생후(postnatal) 또는 생전(prenatal) 동물 (특히, 인간) 중 하나의) 체조직으로부터 유래된 임의의 세포를 의미한다. 성체 줄기세포는 일반적으로, 다양한 세포 유형으로 분화될 수 있는 다능성 줄기세포인 것으로 생각된다. 생체 줄기세포는 임의의 성인, 신생아(neonatal) 또는 태아(fetal) 조직, 예를 들어 지방(adipose) 조직, 피부, 신장, 간(prostate) 췌장(pancreas), 소장(intestine), 골수(bone marrow) 및 태반(placenta)으로부터 유래될 수 있다.
한 구현예에 따르면, 본 발명의 일부 구현예에 의해 이용된 줄기세포는 조혈모 줄기세포, 기질(stromal) 줄기세포 또는 중간엽 줄기세포를 포함하는 골수 (BM)-유래 줄기세포이다 [Dominici, M 외, (2001) J. Biol. Regul. Homeost. Agents. 15: 28-37]. BM-유래 줄기세포는 장골능선(iliac crest), 대퇴부(femora), 경골(tibiae), 척추(spine), 늑골(rib) 또는 기타 속질 공간(medullar space)로부터 얻어질 수 있다.
성체 조직 줄기세포라고 또한 일컬어지는 조혈모 세포(hematopoietic stem cell, HSCs)는 임의의 나이의 개체의 혈액 또는 골수 조직으로부터, 또는 신생아 개체의 제대혈 (cord blood)로부터 얻어진 줄기세포를 포함한다. 본 발명의 일부 구현예의 이러한 측면에 따른, 바람직한 줄기세포는 배아 줄기세포, 바람직하게 인간 또는 영장류 (예, 원숭이) 기원의 배아 줄기세포이다.
또한, 태반(placental) 및 제대혈(umbilical cord blood) 줄기세포는 "유체 줄기세포(young stem cell)"를 의미한다.
형성 만능성 모세포(formative pluripotent blast cell)인 중간엽 줄기세포(MSC)는 하나 이상의 중간엽 조직 (예, 지방, 골(osseous), 연골(cartilaginous), 탄성(elastic) 및 섬유성(fibrous) 결합조직(connective tissue), 근원세포(myoblast)) 및 사이토카인과 같은 생리활성 인자로부터 다양한 영향에 의존하는 배아 중배엽(embryonic mesoderm)에서 유래한 조직 외의 조직 (예, 신경세포)을 야기한다.
성체 조직 줄기세포는 Alison, M.R. [J Pathol. (2003) 200(5): 547-50]이 기술한 방법과 같은, 당해 분야에 공지된 다양한 방법을 이용하여 분리될 수 있다. 태아 줄기세포는 Eventov-Friedman S, 등. [PloS Med. (2006) 3: e215에 의해 기술된 방법과 같은, 당해 분야에 공지된 다양한 방법을 이용하여 분리될 수 있다.
조혈모 세포는 Gerald J Spangrude 및 William B Stayton에 의한 "Handbook of Stem Cells" edit by Robert Lanze, Elsevier Academic Press, 2004, Chapter 54, pp609-614, isolation and characterization of hematopoietic stem cells에 기술된 방법과 같은, 당해 분야에 공지된 다양한 방법을 이용하여 분리될 수 있다.
중간엽 세포 (mesenchymal stem cell, MSCs)를 분리, 정제 및 증식시키는 방법은 당해 분야에 공지되어 있으며, 예를 들어, 미국 특허 제5,486,359호에서 Caplan 및 Haynesworth; Jones E.A. 외, 2002, Isolation and characterization of bone marrow multipotential mesenchymal progenitor cells, Arthritis Rheum. 46(12): 3349-60에 의해 개시된 방법들을 포함한다.
한 구현예에 따르면, 진핵 세포는 이의 자연적인 환경 (예, 인체)으로부터 얻어진다.
한 구현예에 따르면, 진핵 세포는 건강한 세포이다.
한 구현예에 따르면, 진핵 세포는 병든 세포(diseased cell) 또는 질병에 걸리기 쉬운 세포이다.
한 구현예에 따르면, 진핵 세포는 암세포이다.
한 구현예에 따르면, 진핵 세포는 면역 세포 (예, T 세포, B 세포, 대식세포(macrophage), NK 세포 등)이다.
한 구현예에 따르면, 진핵 세포는 병원체 (예, 박테리아, 바이러스 또는 진균 병원체)에 의해 감염된 세포이다.
용어 "침묵 활성을 갖는 RNA 분자(RNA molecule having a silencing activity)" 또는 "RNA 침묵 분자(RNA silencing molecule)"는 비-암호화 RNA (ncRNA) 분자, 즉, RNA 침묵 또는 RNA 간섭 (RNAi)를 매개할 수 있는, 아미노산 서열로 번역되지 않고 단백질을 암호화하지 않는 RNA 서열을 의미한다.
용어 "RNA 침묵" 또는 "RNAi"는 비-암호화 RNA분자 (상기 "침묵 활성을 갖는 RNA 분자" 또는 "RNA 침묵 분자")가 서열 특이적인 방식으로 유전자 발현 또는 번역의 전사-공동(co-transcriptional) 또는 전사-후 억제 (post-transcriptional inhibition)를 매개하는, 세포 조절 메커니즘을 의미한다.
한 구현예에 따르면, RNA 침묵 분자는 전사가 일어나는 동안에 RNA억제를 매개할 수 있다 (전사-공동 유전자 침묵(co-transcriptional gene silencing)).
특정 구현예에 따르면, 전사-공동 유전자 침묵은 후생유전적(epigenetic) 침묵을 포함한다 (예, 유전자 발현을 막는 염색질 상태(chromatic state)).
한 구현예에 따르면, RNA 침묵 분자는 전사 후에 RNA억제를 매개할 수 있다 (전사-후 유전자 침묵 (post-transcriptional gene silencing)).
전사-후 유전자 침묵 (post-transcriptional gene silencing, PTGS)는 일반적으로, 메신저 RNA(messenger RNA, mRNA) 분자의 분해 또는 절단 (일반적으로 세포 세포질(cytoplasm)에서 일어나는) 과정으로서, 번역을 막아 이들의 활성을 감소시키는 것을 의미한다. 예를 들어, 하기에 상술되는, RNA 침묵 분자의 가이드 가닥(guide strand)이 mRNA분자의 상보적인 서열과 쌍을 이루고, 예컨대 아르고노트 2(Argonaute 2, Ago2)에 의한 절단을 유도한다. 구체적으로, 아르고노트(Ago) 단백질 패밀리의 구성원은 RNA-유도 침묵 복합 (RISC) 내에서 RNA 침묵 분자의 직접적인 상호작용 파트너 역할을 한다. RNA 침묵 분자는 RISC를 표적 mRNA로 안내하는 역할을 하는 반면, Ago 단백질 복합체는 mRNA 번역을 억제하고 디아데닐화-의존성(deadenylation-dependent) mRNA 분해(decay)를 유도하여 유전자 발현을 침묵시킨다.
전사-공동 유전자 침묵(co-transcriptional gene silencing)은 일반적으로 유전자 활성의 불활성화 (즉, 전사 억제)를 의미하며, 및 일반적으로 세포 핵 내에서 일어난다. 이러한 유전자 활성 억제는, 예를 들면 표적 DNA 및 히스톤(histone)을 메틸화하는 메틸-전이효소(mythyl-transferases)와 같은 후생유전(epigenetic)-관련 인자에 의해 매개된다. 따라서, 전사-공동 유전자 침묵에서, 표적 RNA 와의 작은(small) RNA의 결합 (작은 RNA-전사체 상호작용)은 상기 표적 신생 전사체(nascent transcript)를 불안정화시키고, 유전자 활성 및 전사를 억제하는 구조로 염색질(chromatin) 리모델링을 유도하는 DNA- 및 히스톤-변형 효소 (즉, 후생유전적 인자)를 리크루트한다. 또한, 전사-공동 유전자 침묵에서, 염색질-관련 긴 비-암호화 RNA 스캐폴드(chromatin-associated long non-coding RNA scaffold)는 작은 RNA와 독립적으로 염색질-변형 복합체를 리크루트할 수 있다. 이들 전사-공동 침묵 메커니즘은 부적절한 전사 사건을 검출하고 침묵시키는 RNA 감시 시스템(surveillance system)을 형성하고, 자가-보강 후생유전적 고리(self-reinforcing epigenetic loops)를 통해 이들 사건의 기억을 제공한다 [D. Hoch and D. Moazed, RNA-mediated epigenetic regulation of gene expression, Nat Rev Genet. (2015) 16(2): 71-84에 기재됨].
다음은 RNA-유도 침묵 복합체 (RNA-induced silencing complex, RISC)와 결합되고 본 발명의 특정 구현예에 따라 사용될 수 있는 고유(intrinsic) RNAi 활성(예를 들어, RNA 침묵 분자이다)을 포함하는 RNA 침묵 분자에 대한 상세한 설명이다.
완전한 및 불완전한 염기쌍의 RNA (즉, 이중가닥 RNA(double stranded RNA); dsRNA), siRNA 및 shRNA - 세포 내 긴 dsRNA (long dsRNA)의 존재는 다이서(dicer)라고 하는 리보뉴클레아제 III(ribonuclease III) 효소의 활성을 촉진한다. 다이서 (또한 엔도리보뉴클레아제 다이서(endoribonuclease Dicer) 또는 Rnase 모티프(motif)를 갖는 헬리카제(helicase)로 알려져 있음)는 식물에서 일반적으로 다이서-유사(DCL) 단백질이라고 하는 효소이다. 식물마다 DCL 유전자 수가 다르므로, 예를 들어 애기장대(Arabidopsis) 지놈은 일반적으로 4개의 DCL 유전자를 가지고, 벼는 8개의 DCL 유전자를 가지며, 및 옥수수 지놈은 5개의 DCL 유전자를 가진다. 다이서는 dsRN를 짧은 간섭 RNA들 (siRNAs)로 알려진 dsRNA의 짧은 조각으로 처리하는데 관여한다. 다이서 활성으로부터 유래된 siRNA는 일반적으로 길이가 약 21 내지 23개의 뉴클레오타이드이고 2개의 3' 뉴클레오타이드 오버행(overhang)이 있는 약 19개의 염기쌍 이중구조 (duplex)를 포함한다.
한 구현예에 따르면 21 bp보다 긴 dsRNA 전구체가 사용된다. 다양한 연구들이 상기 긴 dsRNA가 스트레스 반응의 유도 또는 유의한 비-표적 효과(off-target effect)의 유발 없이 유전자 발현을 침묵시키는데 사용될 수 있음을 증명하였다 - 예를 들어, 다음을 참고한다: [Strat 외, Nucleic Acids Research, 2006, Vol. 34, No. 13 3803-3810; Bhargava A 외, Brain Res. Protoc. 2004;13:115-125; Diallo M. 외, Oligonucleotides. 2003;13:381-392; Paddison P.J. 외, Proc. Natl Acad. Sci. USA. 2002;99:1443-1448; Tran N. 외, FEBS Lett. 2004;573:127-134].
용어 "siRNA"는 RNA 간섭 (RNA interference, RNAi) 경로를 유도하는 소형 억제성 RNA 이중나선 (small inhibitory RNA duplexes) (일반적으로 18 내지30개 염기쌍)을 지칭한다. 통상적으로, siRNA는 중앙의 19 bp 이중나선 영역 및 말단에 대칭적인 2-염기 3'-오버행을 가진 21 mer로 화학적으로 합성되지만, 최근에 25 내지 30의 염기 길이의 화학적으로 합성된 RNA 이중나선이 동일한 위치의 21 mer에 비해서 효능의 100배의 증가를 가질 수 있다는 것이 기술되었다. RNAi를 유발시키는데 있어서, 더 긴 RNA를 이용하여 얻어진 관찰되고 증가된 효능은, 다이서를 산물 (21 mer) 대신에 기질 (27 mer)과 함께 제공한 것과 이러한 제공이 siRNA이중나선의 RISC로의 도입 속도 또는 효율을 개선시킨다는 것으로부터 비롯된 결과로 제안되었다.
3'-오버행의 조성이 아닌 위치가 siRNA의 효능에 영향을 준다는 것이 밝혀졌으며, 안티센스 가닥(antisense starnd) 상에 3'-오버행을 가진 비대칭 이중구조(asymmetric duplexes)는 일반적으로 센스 가닥(sense strand) 상에 3'-오버행을 가진 것들보다 더 효능이 있다는 것이 밝혀졌다(Rose 외, 2005).
이중-가닥 간섭 RNA(double-stranded interfering RNA) (예, siRNA)의 가닥들은 연결되어 헤어핀(hairpin) 또는 줄기-고리(stem-loop) 구조 (예, shRNA)를 형성할 수 있다. 따라서, 언급된 대로, 본 발명의 일부 구현예의 RNA 침묵 분자는 또한 짧은 헤어핀 RNA (shRNA)일 수 있다.
본 명세서에서 사용된, 짧은 헤어핀 RNA(short-hairpin RNA), 'shRNA"라는 용어는 상보적인 서열의 제 1 및 제 2 영역을 포함하는 줄기-고리 구조를 갖는 RNA 분자를 의미하고, 상기 영역들 사이에서 염기쌍이 발생하도록 상기 영역들의 상보성 및 배향(orientation) 정도가 충분하며, 상기 제 1 및 제 2 영역이 고리 영역에 의해 연결되고, 상기 고리는 고리 영역 내에 뉴클레오타이드(또는 뉴클레오타이드 유사체(analogs))들 사이에서 염기쌍이 결여된 것으로부터 야기된다. 고리 내 뉴클레오타이드의 수는 3 내지 23개, 또는 5 내지 15개, 또는 7 내지 13개, 또는 4 내지 9개, 또는 9 내지 11개 사이 및 이들을 포함하는 수이다. 상기 고리 내 뉴클레오타이드의 일부는 그 고리 내의 다른 뉴클레오타이드와의 염기-쌍 상호작용에 관여할 수 있다. 고리를 형성하는데 사용될 수 있는 올리고뉴클레오타이드 서열의 예는 5'-CAAGAGA-3' 및 5'-UUACAA-3'을 포함한다 (국제 특허 출원 WO2013126963 및 WO2014107763). 당업계의 통상의 기술자는 생성되는 단일 사슬 올리고뉴클레오타이드가 RNAi 기구와 상호작용할 수 있는 이중-가닥 영역을 포함하는 줄기-고리 또는 헤어핀 구조를 형성하는 것을 인식할 것이다.
본 발명의 일부 구현예의 RNA 침묵 분자는 단지 RNA만 함유하는 분자들로 한정될 필요가 없으나, 화학적으로-변형된 뉴클레오타이드 및 비-뉴클레오타이드를 추가로 아우른다.
트랜스-작용 siRNA(trans-acting siRNA, Ta-siRNAs 또는 TasiRNA), 반복서열-관련 siRNA(repeat-associated siRNA, Ra-siRNA) 및 자연적인-안티센스 전사체-유래 siRNA(natural-antisense transcript-derived siRNA, Nat-siRNA)를 포함한, 다양한 유형의 siRNA가 본 발명에 의해 고려된다.
한 구현예에 따르면, 침묵 RNA는 길이가 약 26개 및 31개의 뉴클레오타이드의 Piwi-상호작용 RNA(Piwi-interacting RNA)의 한 종류인 "piRNA"를 포함한다. piRNA는 일반적으로 piwi 단백질과의 상호작용을 통해 RNA-단백질 복합체를 형성한다, 즉, 안티센스 piRNA는 일반적으로 piwi 단백질 (예, Piwi, Ago3 및 오버진(aubergine, Aub))에 로딩된다(loaded).
miRNA - 또 다른 구현예에 따르면 RNA 침묵 분자는 miRNA일 수도 있다.
용어 "microRNA", "miRNA", 및 "miR"은 동의어이며, 유전 발현을 조절하는 길이가 약 19 내지 24개의 뉴클레오타이드의 비-암호화 단일-가닥 RNA 분자의 집합을 의미한다. miRNA는다양한 유기체 (예, 곤충, 포유류, 식물, 선충류)에서 발견되며 및 발달, 항상성, 및 질병 병인(disease etiology)에서 역할을 하는 것으로 나타났다.
초기에 pre-miRNA는 길고 불완전한 이중-가닥의 줄기 고리 RNA로 존재하는데, 이는 다이서에 의해 성숙 가이드 가닥 (miRNA) 및 패신저 가닥 (miRNA*)으로 알려진 유사-크기의 단편을 포함하는 siRNA-유사 이중구조(siRNA-like duplex)으로 더 가공되어진다. miRNA 및 miRNA*는 pre-miRNA의 대립하는 팔(opposing arm) 및 pre-miRNA로부터 유래될 수 있다. miRNA* 서열은 복제된 miRNA의 라이브러리(libraries)에서 찾을 수 있지만, 통상적으로 miRNA보다 낮은 빈도로 발견된다.
초기에는 miRNA*를 가진 이중-가닥 종(species)으로 존재하지만, miRNA는 결국 단일-가닥 RNA로서, RNA-유도 침묵 복합체(RNA-induced silencing complex, RISC)로 알려진 리보핵단백질 복합체(ribonucleoprotein complex)에 혼입되게 된다(incorporated). 다양한 단백질이 RISC를 형성할 수 있으며, 이는 miRNA/miRNA* 이중나선에 대한 특이성, 표적 유전자의 결합 부위, miRNA의 활성(억제 또는 활성화), 및 상기 miRNA/miRNA* 이중나선 중 어느 가닥이 RISC에 로딩될 것인지에 대한 가변성을 초래할 수 있다.
miRNA:miRNA* 이중가닥의 miRNA 가닥이 RISC에 로딩될 때, miRNA*는 제거되고 분해된다. RISC에 로딩된 miRNA:miRNA*의 이중구조의 가닥은 5' 말단이 덜 촘촘하게 쌍이 형성된 가닥이다. miRNA:miRNA*의 양 말단이 거의 등가인 5' 염기쌍 형성(5' pairing)이 되는 곳인 경우에, miRNA 및 miRNA* 모두 유전자 침묵 활성을 가질 수 있다.
RISC는 특히 miRNA의 2 내지 8개의 뉴클레오타이드("종자 서열(seed sequence)"라고 지칭됨)에 의한, miRNA 및 mRNA간의 높은 수준의 상보성에 기초하여 표적 핵산을 확인한다.
많은 연구가 번역의 효율적인 억제를 달성하기 위한 miRNA 및 이의 miRNA 표적 사이의 염기쌍 형성 요건을 조사하였다 (Bartel 2004, Cell 116-281에서 검토됨). 전체 지놈에 대한 miRNA 결합을 분석한 컴퓨테이션(computational)연구는 표적 결합에서 miRNA의 5'에서 2 내지 8개 염기 ("종자 서열"이라고도 지칭됨)에 대한 특정한 역할을 제시하였지만, 또한, 일반적으로 "A"라고 밝혀진 제 1 뉴클레오타이드의 역할을 확인하였다 (Lewis 외 2005 Cell 120-15). 마찬가지로, 1 내지 7개 또는 2 내지 8개의 뉴클레오타이드는 Krek 외, (2005, Nat Genet 37-495)에 의한 표적을 확인하고 검증하는 데 사용되었다. miRNA 내의 표적 부위는 5'UTR, 3'UTR 또는 암호화 영역에 존재할 수 있다. 흥미롭게도, 다양한 miRNA는 동일한 또는 다양한 부위를 인식하여, 동일한 mRNA 표적을 조절할 수 있다. 대부분 유전적으로 확인된 표적 내 다양한 miRNA 결합 부위의 존재는 다양한 RISC의 협력적 작용(cooperative action)이 가장 효율적인 번역 억제를 제공한다는 것을 나타낼 수 있다.
miRNA는 RISC가 두 가지 메커니즘인 miRNA 절단(cleavage) 또는 번역 억제(translational repression) 중 하나에 의해 유전자 발현을 하향조절하도록 지시할 수 있다. miRNA가 miRNA에 대해 어느 정도의 상보성을 가지는 경우, miRNA는 miRNA의 절단을 특정할 수 있다. miRNA가 절단을 안내하는 경우, 절단은 일반적으로 miRNA의 10번 및 11번 잔기에 쌍을 형성하는 뉴클레오타이드 사이에서 일어난다. 대안적으로는, miRNA가 miRNA에 대해 필요한 정도의 상보성을 가지지 않는 경우에, miRNA는 번역을 억제할 수 있다. 동물은 miRNA및 결합 부위간의 낮은 정도의 상보성을 가질 수 있기 때문에. 번역 억제가 동물에서 더 일반적일 수 있다.
임의의 miRNA 및 miRNA* 쌍의 5' 및 3' 말단에 가변성이 있을 수 있다는 점에 주목해야 한다. 이러한 가변성은 절단 부위와 관련하여 드로샤(Drosha) 및 다이서(Dicer)의 효소 가공의 가변성 때문일 수 있다. 또한, miRNA 및 miRNA*의 5' 및 3' 말단에서의 가변성은 pri-miRNA 및 pre-miRNA의 줄기 구조에서의 불일치때문일 수 있다.줄기 가닥의 불일치는 상이한 헤어핀 구조의 집단을 초래할 수 있다. 또한, 줄기 구조내 가변성은 드로샤 및 다이서에 의한 절단 산물의 가변성을 초래할 수 있다.
한 구현예에 따르면, miRNA는 다이서, 예를 들면 아르고노트2(Argonaute 2)에 의해 독립적으로 가공될 수 있다.
Pre-miRNA 서열은 45 내지 90개, 60 내지 80개 또는 60 내지 70개의 뉴클레오타이드를 포함할 수 있는 반면, pri-miRNA 서열은 45 내지 30,000개, 50 내지 25,000개, 100 내지 20,000개, 1,000 내지 1,500개 또는 80 내지 100개의 뉴클레오타드를 포함할 수 있다는 것을 이해할 것이다.
안티센스(antisense) - 안티센스는 유전자의 발현을 막거나 억제하도록 설계된 단일 가닥 RNA로서, 이 유전자의 mRNA에 특이적으로 혼성화(hybridizing)하여 유전자의 발현을 막거나 억제한다. 표적 RNA의 하향조절(Downregulation)은 표적 RNA를 암호화하는 mRNA 전사체와 특이적으로 혼성화할 수 있는 안티센스 폴리뉴클레오타이드를 사용하여 수행할 수 있다.
전이성 인자 RNA(Transposable element RNA)
전이성 유전적 인자(Trasposable genetic elements, Tes)는 광범위한 DNA 서열을 포함하며, 모두 절단-및-붙여넣기 메커니즘(트랜스포존(transposons))에 의해 직접적으로 또는 RNA 중간체(intermediate) (레트로트랜스포존(retrotransposons))를 통해 간접적으로 지놈의 새로운 위치로 이동할 수 있는 능력을 가지고 있다. Tes는 전위(transpositiona)에 필요한 단백질을 암호화하는 ORF를 가지고 있는지 여부에 따라 자율(autonomous) 및 비-자율(non-autonomous) 종류로 나누어진다. RNA-매개 유전자 침묵은 지놈이 Tes 활성, 및 지놈 유전 및 후생유전적(epigenetic) 불안정성에서 유래된 유해한(deleterious) 영향를 제어하는 메커니즘 중 하나이다.
한 구현예에 따르면, RNA 침묵 분자는 RISC와 결합될 수 있지만 정형적인(canonical)(내재적인(intrinsic)) RNAi 활성을 포함하지 않을 수 있다 (예를 들어, 정형적인 RNA 침묵 분자가 아니거나, 또는 이의 표적이 확인되지 않았음). 이러한 RNA 침묵 분자는 다음을 포함한다:
한 구현예에 따르면, RNA 침묵 분자는 운반 RNA(transfer RNA, tRNA) 또는 운반 RNA 단편(transfer RNA fragment, tRF)이다. 용어 "tRNA"는 핵산의 뉴클레오타이드 및 단백질의 아미노산 서열 사이의 물리적인 연결로 작용하는 RNA 분자를 지칭하며, 이전에는 가용성 RNA(soluble RNA) 또는 sRNA로 불렸다. tRNA는 일반적으로 길이가 약 76 내지 90개의 뉴클레오타이드이다.
한 구현예에 따르면, RNA 침묵 분자는 리보솜 RNA(ribosomal RNA, rRNA)이다. 용어 "rRNA"는 리보솜의, 즉, 리보솜 소단위체(small ribosomal subunit) 또는 리보솜 대단위체(large ribosomal subunit) 중 하나의, RNA성분을 지칭한다.
한 구현예에 따르면, RNA 침묵 분자는 소형 핵 RNA(small nuclear RNA, snRNA 또는 U-RNA)이다. 용어 "sRNA" 또는 "U-RNA"는 진핵 세포의 세포 핵의 스플라이싱 반점(splicing speckles) 및 카잘체(Cajal bodies) 내에서 발견되는 작은(small) RNA 분자를 지칭한다. snRNA는 일반적으로 길이가 약 150 개의 뉴클레오타이드이다.
한 구현예에 따르면, RNA 침묵 분자는 소형 핵소체 RNA(small nucleolar RNA, snoRNA)이다. 용어 "snoRNA"는 기타 RNA, 예를 들어, rRNA, tRNA 및 snRNAdml 화학적 변형을 주로 가이드하는 작은 RNA 분자의 종류를 지칭한다. snoRNA는 일반적으로 두 가지 종류 중 하나로 분류된다: C/D 박스(box) snoRNA는 일반적으로 길이가 약 70 내지 120개의 뉴클레오타이드이고, 메틸화(methylation)와 관련이 있으며; 및 H/ACA 박스 snoRNA는 일반적으로 길이가 약 100 내지 200개의 뉴클레오타이드이고 슈도우리딘화(pseudouridylation)과 관련이 있다.
snoRNA와 유사한 것은 RNA 성숙에서 snoRNA와 유사한 역할을 수행하는 scaRNA (즉, 소형 카잘체 RNA 유전자(Small Cajal body RNA genes))가 있으나, 이들의 표적은 스플라이세오솜 snRNA(spliceosomal snRNA)이고, 이들은 (핵의 카잘체에서) 스플라이세오솜 snRNA 전구체의 부위-특이적 변형(site-specific modification)을 수행한다.
한 구현예에 따르면, RNA 침묵 분자는 세포 외 RNA(extracellular RNA, exRNA)이다. 용어 "exRNA"는 이들이 전사된 세포 외부에 존재하는 RNA 종(species) (예, 엑소좀 RNA(exosomal RNA))을 의미한다.
한 구현예에 따르면, RNA 침묵 분자는 긴 비-암호화 RNA(long non-coding RNA, lncRNA)이다. 용어 "lncRNA" 또는 "긴 ncRNA(long ncRNA)"는 일반적으로 200개의 뉴클레오타이드보다 긴, 비-단백질 암호화 전사체를 지칭한다.
특정 구현에에 따르면, RISC와 결합된 RNA 분자의 비-한정적 예시는 마이크로RNA (microRNA, miRNA), piwi-상호작용 RNA (piwi-interacing RNA, piRNA), 소형 간섭 RNA (short interfering RNA, siRNA), 짧은-헤어핀 RNA (short-hairpin RNA, shRNA), 단계적 작은 간섭 RNA,(phased small interfering RNA, phasiRNA), 트랜스-작용 siRNA (trans-acting siRNA, tasiRNA), 소형 핵 RNA (small nuclear RNA, snRNA or URNA), 전이성 인자 RNA(transposable element RNA) (예, 자율 및 비자율 전이성 RNA (autonomous andnon-autonomous) transposableRNA), 운반 RNA (transfer RNA, tRNA), 소형 핵소체 RNA (small nucleolar RNA, snoRNA), 소형 카잘체 RNA (Small Cajal body RNA, scaRNA), 리보솜 RNA (ribosomal RNA, rRNA), 세포 외 RNA (extracellular RNA, exRNA), 반복-유래 RNA(repeat-derived RNA), 및 긴 비-암호화 RNA (long non-coding RNA, lncRNA)을 포함하지만, 이들에 한정되지 않는다.
특정 구현예에 따르면, RISC와 결합된RNAi 분자의 비-한정적 예시는 소형 간섭 RNA (small interfering RNA, siRNA), 짧은 헤어핀 RNA (short-hairpin RNA, shRNA), 마이크로RNA (microRNA, miRNA), Piwi-상호작용 RNA (Piwi-interacting RNA, piRNA), 단계적 작은 간섭 RNA,(phased small interfering RNA, phasiRNA), 및 트랜스-작용 siRNA (trans-acting siRNA, tasiRNA)를 포함하지만, 이들에 한정되지 않는다.
한 구현예에 따르면, 상기 방법은 RISC과 결합된 RNA분자를 암호화하는 핵산 서열 (예, RNAi-유사 또는 miRNA-유사 서열)과 관련하여, 완전한 동일성을 포함하지 않는, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열을 확인하는 단계를 포함한다.
한 구현예에 따르면, 단계 (a)의 RNA 분자는 RISC와 결합된 RNA 분자 및/또는 RISC와 결합된 분자로 가공되는 RNA 분자와 관련하여, 완전한 동일성을 포함하지 않는, 미리 정해진 서열 상동성 범위를 나타낸다.
용어 "RNAi-유사"는 RNA 침묵 분자에 대해 서열 상동성을 포함하지만, RNA침묵 분자 서열과 동일하지는 않는 지놈 내 서열을 지칭한다.
용어 "miRNA-유사"는 miRNA에 대해 서열 상동성을 포함하지만, miRNA서열과 동일하지는 않는 지놈 내 서열을 지칭한다.
이러한 비-암호화 RNA-관련 분자 (즉, miRNA-유사 분자)는 기능적일 수 있고 (예를 들어, 하기 논의되는 바와 같이, 가공될 수 있고/또는 침묵 활성을 가지는 것), 또는 대안적으로, 기능장애일 수 있다 (예를 들어, 하기 논의된 바와 같이, 비-가공되고, 또는 비정상적으로 가공되고.또는 침묵 활성을 가지지 못한 것). 한 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 50% 내지 99.9%, 60% 내지 99.9%, 70% 내지 99.9%, 75% 내지 99.9%, 80% 내지 99.9%, 85% 내지 99.9%, 90% 내지 99.9%, 95% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 50% 내지 75%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 50% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 70% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 75% 내지 99.6%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 85% 내지 99.6%의 동일성을 포함한다.
한 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 RNA 분자를 암호화하는 핵산 서열과 관련하여, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.6% 또는 99.9%의 동일성을 포함한다.
한 구현예에 따르면, 서열 상동성 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 50% 내지 99.9%, 60% 내지 99.9%, 70% 내지 99.9%, 75% 내지 99.9%, 80% 내지 99.9%, 85% 내지 99.9%, 90% 내지 99.9%, 95% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 50% 내지 75%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 50% 내지 99.6%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 70% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 75% 내지 99.6%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 85% 내지 99.6%의 동일성을 포함한다.
한 구현예에 따르면, 서열 상동성은 범위는 RISC-결합 RNA 분자로 가공되고 암호화하는 핵산 서열과 관련하여, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.6% 또는 99.9%의 동일성을 포함한다.
한 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 50% 내지 99.9%, 60% 내지 99.9%, 70% 내지 99.9%, 75% 내지 99.9%, 80% 내지 99.9%, 85% 내지 99.9%, 90% 내지 99.9%, 95% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 50% 내지 75%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 50% 내지 99.6%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 70% 내지 99.9%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 75% 내지 99.6%의 동일성을 포함한다.
특정 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 85% 내지 99.6%의 동일성을 포함한다.
한 구현예에 따르면, 서열 상동성 범위는 RISC와 결합되는 성숙 RNA 침묵 분자의 핵산 서열과 관련하여, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.6% 또는 99.9%의 동일성을 포함한다.
일부 구현예에 따르면, 본 명세서에서 사용된 "미리 정해진 서열 상동성 범위"라는 문구는 서열 적용범위(sequence coverage) 및 서열 상동성의 조합을 의미한다. 통상의 기술자에게 알려진 바와 같이, "서열 적용범위"라는 용어는 지놈 영역과 같은 제 2의 서열과 완벽하게 일치하는 적어도 일부 뉴클레오타이드를 포함하는 쿼리(query)서열의 길이를 의미한다 (예를 들어, 100개의 염기 쿼리 서열의 마지막 90개 염기에만 제 2의 서열과 일치하는 뉴클레오타이드를 포함하고 있는 경우, 90% 적용범위가 있다). 통상의 기술자에게 알려진 바와 같이, 적용되는(covered) 서열 내에 상이한 정도의 상동성이 있을 수 있다 (예를 들어, 90%의 적용범위를 갖는 서열은 상이한 수의 동일한 뉴클레오타이드, 상이한 갭(gap) 등을 가질 수 있고, 따라서 상이한 정도의 상동성을 가질 수 있다). 당업계에 공지된 임의의 방법을 사용하여 서열 적용범위 및 서열 상동성을 평가할 수 있고, 예를 들어 블라스트(Blast)와 같은 서열 정렬 프로그램은 서열 적용범위(sequence coverage)가 추출할 수 있는 것으로부터 서열의 길이 및 정렬 영역의 길이를 제공한다.
일부 구현예에 따르면, 상기 미리 정해진 서열 상동성 범위는 정렬된 서열의 약 50% 내지 100% 사이의, 가능하게는 정렬된 서열의 70% 내지 100% 사이의 서열 적용범위를 포함한다. 다른 구현예에 따르면, 상기 미리 정해진 서열 상동성 범위는 약 5% 내지 100%, 25% 내지 100%, 40% 내지 100%, 50% 내지 100%, 70% 내지 100% 또는 75% 내지 100% 사이의 서열 적용범위를 포함한다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.
일부 구현예에 따르면, 상기 미리 정해진 서열 상동성 범위는 다음을 포함한다: (1) 정렬된 서열의 약 50% 내지 100% 사이의, 가능하게는 정렬된 서열의 약 70% 내지 100% 사이의 서열 적용범위; 및 (2) 약 75% 내지 100% 사이의, 가능하게는 85% 내지 100% 사이의 서열 상동성. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다. 일부 구현예에 따르면, 상기 미리 정해진 서열 상동성 범위는 적어도 약 75%의 상동성과 함께 적어도 약 50%의 적용범위를 포함한다.
일부 구현예에 따르면, RNA 분자를 암호화하는 핵산 서열은 다음과 같은 경우에 상응하는 침묵 RNA (예, miRNA)를 암호화하는 핵산 서열에 대해 미리 정해진 서열 상동성 범위를 갖는다. (a) 해당 ncRNA(예, miRNA)에 대한 기본 매개변수 (예, www(dot)arabidopsis(dot)org/Blast/BLASToptions(dot)jsp)를 사용하여 해당 침묵 RNA (또는 이의 일부)를 사용한 블라스트 검색에서 발견되는 경우; 및 (b) 이의 서열이 해당 침묵 RNA (예, 성숙 miRNA 서열)의 성숙 서열의 적어도 50% 적용되고, 여기에서 성숙 서열은 가능하게는 19 내지 24 nt 길이, 가능하게는 19 내지 21 nt 길이인 경우. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.
한 구현예에 따르면, 서열 상동성은 100%의 동일성을 포함하지 않는다.
상동성 (예를 들어, 퍼센트(percent) 상동성, 서열 동일성 + 서열 유사성)은 쌍별(pairwise) 서열 정렬을 계산하는 임의의 상동성 비교 소프트웨어를 사용하여 결정될 수 있다.
본 명세서에 사용된 바와 같이, 2개의 핵산 또는 폴리펩타이드 서열의 맥락에서 "서열 상동성" 또는 "동일성"은 정렬될 때 동일한 2개의 서열 내의 잔기에 대한 언급을 포함한다. 서열 동일성의 백분율(percentage)이 단백질과 관련하여 사용될 때, 동일하지 않은 잔기 위치는, 아미노산 잔기가 유사한 특성 (예, 전하 또는 소수성(hydrophobicity))을 갖는 다른 아미노산 잔기로 치환되므로 분자의 기능적 특성은 변하지 않는, 보존적(conservative) 아미노산 치환에 따라 종종 달라지는 것으로 여겨진다. 서열이 보존적 치환에서 다른 경우, 퍼센트(percent) 서열 동일성은 치환의 보존적 성질을 수정하기 위해 상향(upward) 조절될 수 있다. 이러한 보존적 치환에 따라 상이한 서열은 "서열 유사성" 또는 "유사성"을 갖는 것으로 간주된다. 이러한 조정을 위한 수단은 당업계의 통상의 기술자에게 잘 알려져 있다. 일반적으로 이는 완전한 불일치 보다는 부분적으로 보존적 치환을 점수화하여, 서열 동일성의 백분율을 증가시키는 것을 포함한다. 따라서, 예를 들어, 동일한 아미노산에 1점이 주어지고 비-보존적 치환에 0점이 주어지는 경우, 보존적 치환에는 0 및 1 사이의 점수가 주어진다. 보존적 치환의 점수는, 예를 들어, Henikoff S 및 Henikoff JG. [Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. U.S.A. 1992, 89(22): 10915-9의 알고리즘에 따라 계산된다.
동일성 (예, 퍼센트 백분율)은 예를 들어 기본 매개변수(parameter)를 사용하는 것과 같이 미국 국립생물정보센터(National Center of Biotechnology Information, NCBI)의 블라스트엔 소프트웨어(BlastN software)를 포함하는 임의의 상동성 비교 소프트웨어를 사용하여 결정될 수 있다.
본 발명의 일부 구현예에 따르면, 동일성은 전체적 동일성, 즉, 본 발명의 전체 아미노산 또는 핵산 서열에 대한 동일성이며 이의 일부에 대한 동일성은 아니다.
본 발명의 일부 구현예에 따르면, "상동성" 또는 "상동의"라는 용어는 2개 이상의 핵산 서열의 동일성; 또는 2개 이상의 아미노산 서열의 동일성; 또는 1개 이상의 핵산 서열에 대한 아미노산 서열의 동일성을 의미한다.
본 발명의 일부 구현예에 따르면, 상동성은 전체적 상동성, 즉, 본 발명의 전체 아미노산 서열 또는 핵산 서열에 대한 상동성이며 이의 일부에 대한 상동성은 아니다.
2개 이상의 서열 간의 상동성 또는 동일성의 정도는 다양한 공지된 서열 비교 도구를 사용하여 결정될 수 있다. 다음은 본 발명의 일부 구현예와 함께 사용될 수 있는 이러한 도구에 대한 비제한적인 설명이다.
폴리펩타이드 서열로 시작하여 다른 폴리뉴클레오타이드 서열과 비교할 때, EMBOSS-6.0.1 Needleman-Wunsch 알고리즘 (emboss(dot)sourceforge(dot)net/apps/cvs/emboss/apps/needle(dot)html에서 사용 가능)은 다음의 기본 매개변수와 함께 사용될 수 있다: (EMBOSS-6.0.1) 갭오픈(gapopen)=10; 갭확장(gapextend)=0.5; 데이터파일(datafile)= EDNAFULL; brief=YES.
본 발명의 일부 구현예에 따르면, EMBOSS-6.0.1 Needleman-Wunsch 알고리즘과 함께 사용되는 매개변수는 gapopen=10; gapextend=0.2; datafile= EDNAFULL; brief=YES이다.
본 발명의 일부 구현예에 따르면, 폴리뉴클레오타이드와 폴리뉴클레오타이드를 비교하기 위해 EMBOSS-6.0.1 Needleman-Wunsch 알고리즘을 사용하여 상동성을 결정하는 데 사용되는 역치는 80%, 81%, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 또는 100 % 이다.
일부 구현예에 따르면, 상동성 정도의 결정은 Smith-Waterman 알고리즘 (단백질-단백질 비교 또는 뉴클레오타이드-뉴클레오타이드 비교를 위해)을 사용하는 것을 추가로 필요로 한다.
GenCore 6.0 Smith-Waterman 알고리즘의 기본 매개변수는 다음을 포함한다: model =sw.model.
본 발명의 일부 구현예에 따르면, Smith-Waterman 알고리즘을 사용하여 상동성을 결정하는 데 사용되는 역치는 80%, 81%, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 또는 100 % 이다.
본 발명의 일부 구현예에 따르면, 전체 상동성은, 폴리펩타이드 또는 관심 폴리펩타이드에 대한 전체(global) 상동성 (예를 들어, 전체 서열에 대한 80%의 전체 상동성)이 수행되기 전에, 폴리펩타이드 또는 관심 폴리펩타이드에 대한 국부적(local) 상동성 (예를 들어, 서열 길이의 60%에 걸쳐 60%의 동일성)에 의해 미리-선택되는 서열에서 수행된다. 예를 들어, 첫 번째 단계의 필터로 Blastp 및 tBlastn 알고리즘과 함께 BLAST 소프트웨어를 사용하고, 및 제 2 단계로 니들(needle) (EMBOSS 패키지) 또는 프레임(Frame) + 알고리즘 정렬을 사용하여 상동의 서열이 선택된다. 국부적 동일성(블라스트 정렬)은 전체 정렬 단계에 대한 필터로만 사용되기 때문에 서열 길이의 60% 범위에서 60% 동일성으로 매우 관대한(permissive) 컷오프(cutoff)로 정의된다. 이러한 특정 구현예에서 (국부적 동일성이 사용될 때), BLAST 패키지의 기본 필터링은 (매개변수 "-F F"를 설정함으로써) 사용되지 않는다.
두 번째 단계에서, 상동체는 핵심 유전자 폴리펩타이드 서열에 대해 적어도 80%의 전체적인 동일성을 기반으로 정의된다. 일부 구현예에 따르면 상동성은 국부 상동성 또는 국부 동일성이다.
국부적 정렬 도구는 미국 국립생물정보센터(National Center of Biotechnology Information, NCBI)의 BlastP, BlastN, BlastX 또는 TBLASTN 소프트웨어, FASTA, 및 Smith-Waterman 알고리즘을 포함하지만, 이에 한정되지 않는다.
특정 구현예에 따르면, 상동성은 BlastN 버전 2.7.1+를 다음의 기본 매개변수와 함께 사용하여 결정됩니다: 작업(task) = blastn, evalue = 10, 가닥(strand) = both, 갭 개방 패널티(gap opening penalty) = 5, 갭 확장 패널티(gap extension penalty) = 2, 일치(match) = 1, 불일치(mismatch) = -1, 단어 크기(word size) = 11, 최대 점수(max scores) - 25, 최대 정렬(max alignments) = 15, 쿼리 필터(query filter) = dust, 쿼리 유전 코드(query genetic code) - n/a, 행렬(matrix) = no default.
한 구현예에 따르면, 방법은 단계(a)의 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열의 지놈 위치를 결정하는 단계를 추가로 포함한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 비-암호화 유전자 (예, 비-단백질 암호화 유전자)에 위치한다. 지놈의 예시적인 비-암호화 부분은 비-암호화 RNA의 유전자, 인핸서(enhancer) 및 유전자좌(locus) 제어 영역, 절연체(insulator), S/MAR 서열, 비-암호화 슈도유전자(pseudogene), 비-자율 트랜스포존(non-autonomous transposon) 및 레트로트랜스포존(retrotransposon), 및 염색체의 중심체(centromeric) 및 텔로머(telomeric) 영역의 비-코딩 단순 반복을 포함하지만, 이에 한정되지 않는다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 비-암호화 유전자의 인트론 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 어디에서나 발현되는 비-암호화 유전자에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 조직-특이적인 방식으로 발현되는 비-암호화 유전자에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 유도성 방식으로 발현되는 비-암호화 유전자에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 발달적으로 조절되는 비-암호화 유전자에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 유전자 사이의, 즉, 유전자간(intergenic) 영역에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 암호화 유전자 (예, 단백질-암호화 유전자)에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 암호화 유전자 (예, 단백질-암호화 유전자)의 엑손 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 암호화 유전자 (예, 단백질-암호화 유전자)의 비번역 영역(untranslated region, UTR)을 암호화하는 엑손 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 암호화 유전자 (예, 단백질-암호화 유전자)의 번역되는 엑손 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 암호화 유전자 (예, 단백질-암호화 유전자)의 인트론 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 어디에서나 발현되는 암호화 유전자 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 조직-특이적 방식으로 발현되는 암호화 유전자 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 유도성 방식으로 발현되는 암호화 유전자 내에 위치한다.
한 구현예에 따르면, RNAi-유사 분자 (예, miRNA-유사 분자)를 암호화하는 핵산 서열은 발달적으로 조절되는 암호화 유전자 내에 위치한다.
한 구현예에 따르면, 방법은 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사가능한 핵산 서열을 선택하기 위해, RNA 분자를 암호화하는 핵산 서열의 전사를 결정하는 단계를 포함한다.
"전사가능한 핵산 서열"이라는 문구는 RNA로 전사될 수 있는 DNA 단편(segment)를 의미한다.
핵산 서열의 전사 평가는 , RT-PCR, Northern-blot, RNA-seq, small RNA seq과 같은 당업계에 공지된 임의의 방법을 사용하여 수행할 수 있다.
명시된 바와 같이, 본 발명의 일부 구현예의 방법은 전사될 수 있지만 RISC와 결합된 작은 RNA로 가공되지 않는 RNA 침묵 분자의 식별을 가능케 한다.
한 구현예에 따르면, 상기 방법은 미리 정해진 서열 상동성 범위를 나타내는 RNA분자를 암호화하는 비정상적으로 가공되고 (예, 가공될 수 없는(non-processable)), 전사가능한 핵산 서열을 선택하기 위해, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 전사가능한 핵산 서열의 전사체의 작은(small) RNA로의 가공성(processability)를 결정하는 단계를 포함한다.
"가공(processing)" 또는 "가공성(processbility)"라는 용어는 RNA분자가 RNA-유도 침묵 복합체(RNA-induced silencing complex, RISC)와 결합할 수 있는 작은 RNA 형태로 절단되는 것에 의한 생물발생(biogenesis)를 의미한다. 예시적인 가공 메커니즘은 예를 들어, 하기에 더 논의되는 바와 같이, 다이서(Dicer) 및 아르고노트(Argonaute)를 포함한다. 예를 들어, pre-miRNA는 다이서에 의해 성숙 miRNA로 가공된다.
"정형적인(canonical) 가공"이라는 용어는 특정 종류의 침묵 RNA (예, miRNA)에 대한 RNA 전구체와 관련하여 본 명세서에서 사용되며, RNA 분자가 작은 RNA 분자로의 가공되는 것을 의미하고, 여기에서 가공 패턴 (예를 들어, 생성되는 작은 RNA 분자의 수, 크기 및/또는 위치)는 침묵 RNA 분자의 해당 유형에서의 전구체에 일반적이다. 일반적으로, 정형적인 가공의 결과인 작은 RNA 분자는 RISC와 결합할 수 있고 이의 자연적인(natural) 표적 RNA (즉, 제 1의 표적 RNA)와 결합할 수 있다. 일부 구현예에 따르면, 본 명세서에서 사용된 야생형(wild-type) 가공에 대한 언급은 정형적인 가공을 의미한다. 일부 구현예에 따르면, 야생형 침묵 분자에 대한 언급은 정형적인 침묵 분자 (즉, 작용하고, 구조를 가지며/또는 당업계에서 해당 유형의 침묵 분자의 공지된 행동(behavior)에 따라 가공되는)를 의미한다.
본 명세서에서 "비정상적으로 가공된(aberrantly processed)"이라는 용어는 비교 용어이며, RNA 분자를 작은 RNA 분자로 가공하는 것을 의미하고, 이러한 가공은 특정 유형 (예, miRNA)에서 침묵 RNA의 RNA 전구체와 관련하여 정형적인 가공이 아니다. 비-제한적인 예에서, 특정 유형 (예, miRNA 전구체)의 침묵 RNA 분자에 대한 전구체와 상동의 RNA 분자는 해당 전구체(정형적으로 가공되는)와 다르게 가공되고 비정상적으로 가공된다.
특정 구현예에 따르면, 비정상적으로 가공되는 것은 다음으로 이루어진 군으로부터 선택된다: 비-가공된 (즉, 임의의 작은 RNA 분자를 생성하지 않음) 및 정형적인 가공과 비교하여 다르게 가공됨 (즉, 정형적인 가공에서 달성된 것과 다른 수, 크기 및/또는 위치에서 작은 RNA 분자로 가공됨). 비정상적인 가공으로 인한 작은 RNA 분자는 일반적으로 비정상적인 크기 (정형적인 가공으로 인한 작은 RNA 분자와 비교하여)이고, RISC와 결합되지 않고/또는 이의 자연적인 표적 RNA (즉, 제 1의 표적 RNA)에 상보적이지 않다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.
본 명세서에서 사용된, "작은 RNA 형태(small RNA form)" 또는 "작은 RNA(small RNA)" 또는 작은 RNA 분자(small RNA molecule)"라는 용어는 표적 RNA (또는 이의 단편)과 혼성화(hybridizing)할 수 있는 성숙 작은 RNA(mature small RNA)를 의미한다.
본 명세서에서 사용된, "기능장애(dysfunctional) RNA 분자"라는 문구는 RISC와 결합할 수 있는 작은 RNA로 가공되지 않고 자연적인 표적 RNA (즉, 제 1의 표적 RNA)를 침묵시킬 수 없는 RNA 분자 (예, 비-암호화 RNA 분자, 예, RNAi 분자)를 의미한다. 한 구현예에 따르면, 기능장애 RNA 분자는 이의 2차 RNA 구조를 변경하고 이를 비정상적으로 가공되게 (예를 들어, 비-가공될 수 있는) 서열 변경 (예를 들어, 전구체 서열에서의 서열 변경)을 포함한다.
한 구현예에 따르면, 작은 RNA 형태는 침묵 활성을 가진다.
한 구현예에 따르면, 작은(small) RNA는 길이가 250개 이하의 뉴클레오타이드, 예를 들어, 15 내지 250, 15 내지 200, 15 내지 150, 15 내지 100, 15 내지 50, 15 내지 40, 15 내지 30, 15 내지 25, 15 내지 20, 20 내지 30, 20 내지 25, 30 내지 100, 30 내지 80, 30 내지 60, 30 내지 50, 30 내지 40, 30 내지 35, 50 내지 150, 50 내지 100, 50 내지 80, 50 내지 70, 50 내지 60, 100 내지 250, 100 내지 200, 100 내지 150, 150 내지 250, 150 내지 200 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 20 내지 50개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 20 내지 30개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 21 내지 29개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 21 내지 23개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 21개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 22개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 23개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 24개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 25개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, 작은 RNA 분자는 20 내지 50개의 뉴클레오타이드로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 20 내지 30개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 21 내지 29개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 21 내지 23개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 21개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 22개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 23개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 24개의 뉴클레오타이드 로 구성된다.
특정 구현예에 따르면, 작은 RNA 분자는 25개의 뉴클레오타이드 로 구성된다.
일반적으로, 가공성은 RNA 분자의 구조에 따라 달라지며, 또한 본 명세서에서는 구조의 독창성, 즉 2차 RNA 구조(즉, 염기쌍 프로파일(profile))이라고 지칭되는 RNA 구조에 따라 달라진다. 2차 RNA 구조는 RNA 분자를 순전히 서열 의존적이지 않고 구조 의존적인 작은(small) RNA(예, siRNA 또는 miRNA)로 정확하고 효율적으로 가공하는데 중요하다.
따라서, 한 구현예에 따르면, 단계 (a)의 RNA 분자를 암호화하는 선택되고 또는 확인된 핵산 서열은 그의 침묵 활성 및/또는 소형 침묵 RNA(small silencing RNA)로의 가공되는 것이 그의 2차 구조에 의존하는 침묵 RNA 분자를 암호화하는 유전자와 상동이다.
일부 구현예에 따르면, 그의 침묵 활성 및/또는 소형 침묵 RNA로 가공되는 것이 그의 2차 구조에 의존하는 침묵 RNA 분자는 다음으로 이루어진 군으로부터 선택된다: 마이크로 RNA(microRNA, miRNA), 짧은-헤어핀 RNA(short-hairpin RNA, shRNA), 소형 핵 RNA(small nuclear RNA, snRNA 또는 U-RNA), 소핵체 RNA(small nucleolar RNA, snoRNA), 소형 카잘체 RNA(small Cajal body RNA, scaRNA), 트랜스퍼 RNA(transfer RNA, tRNA). 리보솜 RNA(ribosomal RNA. rRNA), 반복-유래 RNA(repeat-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 인자-유래 RNA(autonomous and non-autonomous transposable and retro-transposable element-derived RNA), 자율 및 비자율 전이성 및 레트로-전이성 인자 RNA(autonomous and non-autonomous transposable and retro-transposable element RNA) 및 긴 비-암호화 RNA(long non-coding RNA, lncRNA).
한 구현예에 따르면, 세포의 RNAi 가공 기구, 즉 세포의 RNAi가공 및 실행 인자는 RNA 분자를 작은 RNA로 가공한다.
한 구현예에 따르면, 세포의 RNAi가공 기구는 다이서(DICER) 단백질 군(예, DCR1 및 DCR2), 다이서-유사(DICER-LIKE) 단백질 군(예, DCL1, DCL2, DCL3, DCL4), 아르고노트(ARGONAUTE) 단백질 군(예, AGO1, AGO2, AGO3, AGO4), tRNA 절단 효소(cleavage enzymes) (예, RNY1, ANGIOGENIN, Rnase P, Rnase P- like, SLFN3, ELAC1 및 ELAC2), 및 Piwi-상호작용 RNA (piRNA) 관련 단백질 (예, AGO3, AUBERGINE, HIWI, HIWI2, HIWI3, PIWI, ALG1 및 ALG2)을 포함하나 이에 한정되지 않는 리보뉴클레아제(ribonuclease)를 포함한다.
한 구현예에 따르면, 세포의 RNAi 가공 기구는 RNA 침묵 분자를 생성하지만, 특정 표적을 확인되지 않았다.
한 구현예에 따르면, 작은(small) RNA 분자는 전구체로부터 가공된다.
한 구현예에 따르면, 작은 RNA 분자는 단일 가닥의 RNA(ssRNA) 전구체로부터 가공된다.
한 구현예에 따르면, 작은 RNA 분자는 이중-구조화된 단일-가닥의 RNA 전구체로부터 가공된다.
한 구현예에 따르면, 작은 RNA 분자는 비-구조화된 RNA 전구체로부터 가공된다.
한 구현예에 따르면, 작은 RNA 분자는 단백질-암호화 RNA 전구체로부터 가공된다.
한 구현예에 따르면, 작은 RNA 분자는 비-암호화 RNA 전구체로부터 가공된다.
한 구현예에 따르면, 작은 RNA 분자는 (예를 들어, 완전하고 불완전한 염기 쌍을 포함하는)ds RNA 전구체로부터 가공된다.
한 구현예에 따르면, dsRNA는 2개의 상이한 상보적 RNA로부터, 또는 dsRNA를 형성하기 위해 자체적으로 접히는 단일 RNA로부터 유래될 수 있다.
가공의 평가는 small RNA seq, 노던 블랏(Northern-blot), small RNA qRT-PCR 및 Rapid Amplifiction of cDNA Ends(RACE)와 같은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
예를 들어, 비정상적으로 가공된(예, 가공 불가능한) 핵산 서열의 선택을 위해, small RNA seq, 노덧 블랏(Northern-blot), small RNA qRT-PCR 및 Rapid Amplification of cDNA Ends(RACE) 방법이 적용될 수 있다.
또한 기능적 가공성은 비교 구조 분석을 통해서 결정될 수 있다. 예를 들어, 기능 장애 pre-miRNA-유사의 구조는 RISC와 결합된 작은 RNA 분자로 가공될 수 있는 상응하는 pre-miRNA와 비교된다(예, 전구체 구조 비교). 변형된 기능 장애 구조는 RISC와 결합된 작은 RNA 분자로 가공될 수 있는 상응하는 pre-miRNA와 다르게 가공되거나, 또는 가공되지 않을 것임을 나타낸다. 가공은 작은 RNA 분석에 의해 검증될 수 있다.
한 구현예에 따르면, 단계 (a) 및/또는 (c)는 세포의 지놈에 대한 작은 RNA 발현 데이터의 정렬 및 각각의 지놈 위치에 맵핑되는 리드(read)의 양을 결정함으로써 영향을 받는다.
일부 구현예에 따르면, 가공을 결정하기 위한 작은 RNA 분석은 특정 세포 또는 조직에서 발현된 작은 RNA의 서열을 상응하는 지놈 위치(예를 들어, 잠재적인 기능 장애 pre-miRNA-유사 분자를 암호화하는 유전자 내)와 정렬하여, 각각의 sRNA가 발현되는 위치 및 각 위치에서 sRNA 리드(read)의 수를 결정하는 것을 포함한다. 특정 구현예에 따르면, 발현된 작은 RNA의 서열과 상응하는 지놈의 위치(즉, 미리 정해진 위치)의 정렬은 불일치가 없는 정렬이다.
명시된 바와 같이, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 비정상적으로 처리되고, 전사가능한 핵산 서열이 선택된다.
한 구현예에 따르면, 방법은 RISC와 결합되고 제 1의 표적 RNA(예, 하기에 논의되는 자연의 표적 RNA), 또한 본 명세서에서 침묵 활성의 "재활성화(reactivation)" 로 지칭되는 제 1의 표적 RNA에 상보적인 작은 RNA에 가공성을 부여하기 위해, 비정상적으로 가공된(예, 처리 불가능한) 전사가능한 핵산 서열의 핵산 서열을 변형하는 단계를 포함한다.
한 구현예에 따르면, 단계(d)에서 변형은 비정상적으로 가공된 RNA 분자에서 제 1의 표적 RNA에 대한 침묵 활성을 재활성화하는 DNA 편집제를 세포 내로 도입함으로써 세포에서 침묵 활성을 갖는 RNA 분자를 생성하는 것을 포함한다.
한 구현예에 따르면, 방법은 세포에서 침묵 활성을 갖는 RNA 분자의 특이성을 변형시키는 단계를 추가로 포함하고, 여기에서 DNA 편집제는 RNA 분자의 침묵 특이성을 관심 표적 RNA로 재유도시키고, 관심 표적 RNA는 제 1의 표적 RNA와 구별되어, 세포에서 침묵 활성을 갖는 RNA 분자의 특이성을 변형시킨다.
한 구현예에 따르면, 제 1의 표적 RNA에 대한 침묵을 활성화하도록 변형시키는 것과 특이성을 변형시키는 것 사이의 차이는 GEiGS를 수행할 때 상이한 GEiGS 올리고의 사용일 수 있다(즉, 특이성을 변형시키기 위한 GEiGS 올리고는 특이성을 변화시키기 위한 성숙 miRNA 서열의 변형을 추가로 포함할 것이다).
다음은 본 개시내용의 특정 구현예에 따라 사용될 수 있는 RNA 침묵 분자를 암호화하는 유전자 및 이를 구현하기 위한 제제에 핵산 변경을 도입하기 위해 사용되는 방법 및 DNA 편집제의 다양한 비-제한적 예시에 대한 설명이다.
조작된 엔도뉴클레아제(engineered endonuclease)를 사용하는 지놈 편집 - 이 접근 방식은 일반적으로 지놈 내의 목적하는 위치(들)에서 특정 이중-가닥 절단(DSB)를 절단 및 생성하는, 인공적으로 조작된 뉴클레아제를 사용하는 역유전학 방법(reverse genetics method)을 의미하며, 상기 이중가닥 손상은 상동 재조합(homologous recombination, HR) 또는 비-상동 말단 연결(non-homologous end-joining, NHEJ)과 같은, 세포의 내인성 과정에 의해 복원된다. NHEJ는 최소한의 말단 트리밍(trimming)과 함께 또는 말단 트리밍 없이 이중-가닥 절단(DSB) 내의 DNA 말단을 직접 연결하는 반면, HR은 상동성 공여자 서열을 주형으로 사용하여(즉, S-기 동안 형성된 자매 염색분체(sister chromatid)), 손상 부위에서 잃어버린 DNA 서열을 재생시키거나 복제한다. 지놈의 DNA에 특이적 뉴클레오타이드 변형을 도입하기 위해서 목적하는 서열을 포함하는 공여 DNA 복구 주형은 HR 동안 존재해야 한다(외인성으로 제공된 단일 가닥의 또는 이중 가닥의 DNA).
지놈 편집은 전통적인 제한 엔도뉴클레아제(restriction endonucleases)를 사용하여 수행될 수 없는데, 이는 대부분의 제한 효소가 DNA상의 약간의 염기쌍을 이들의 표적으로 인식하고, 이들 서열들은 종종 지놈에 걸쳐 많은 위치에서 발견되어 목적하는 위치에 한정되지 않은 복수의 절단을 초래할 것이기 때문이다. 이러한 문제점을 극복하고 부위-특이적인(site-specific) 단일- 또는 이중-가닥 절단(DSB)를 생성하기 위해, 현재까지 몇 가지 별개의 종류의 뉴클레아제가 발견 및 생명공학에 의해 생성되었다. 이들은 메가뉴클레아제, Zinc finger 뉴클레아제 (ZFN), 전사-활성자 유사 이펙터 뉴클레아제(transcription-acrivation like effector nucleases, TALENs) 및 CRISPR/Cas9 시스템을 포함한다.
메가뉴클레아제(Meganucleases) - 메가뉴클레아제는 통상적으로, 4 가지 군으로 그룹화된다: LAGLIDADG 군, GIY-YIG 군, His-Cys 박스 군 및 HNH 군. 이들 군은 촉매 활성(catalytic activity) 및 인식 서열에 영향을 미치는 구조적 모티프(structural motif)를 특징으로 한다. 예를 들어, LAGLIDADG 군의 멤버는 보존된 LAGLIDADG 모티프의 한 개 또는 두 개의 사본(copy)를 가지는 것을 특징으로 한다. 메가뉴클레아제의 4 가지 군은 넓게는, 보존된 구조적 요소 면에서 서로 구분되고, 결과적으로, DNA 인식 서열 특이성 및 촉매 활성이 구분된다. 메가뉴클레아제는 통상적으로, 미생물 종에서 발견되고, 매우 긴 인식 서열(>14bp)을 갖는 고유의 특징을 가지므로, 이들을 목적하는 위치에서 절단하는 것에 대해 자연적으로 매우 특이적이게 만든다.
이는 지놈 편집에서 부위-특이적 이중-가닥 절단(DSB)을 만드는데 이용될 수 있다. 통상의 기술자는 자연적으로 존재하는 메가뉴클레아제를 사용할 수 있으나, 이와 같은 자연적으로 존재하는 메가뉴클레아제의 수는 한정적이다. 이 문제점을 극복하기 위해, 돌연변이 생성(mutagenesis) 및 고속 대량 스크리닝 방법(high throughput screening method)를 사용하여, 고유의 서열을 인식하는 메가뉴클레아제 변이체(variant)를 만들었다. 예를 들어, 다양한 메가뉴클레아제를 융합하여 새로운 서열을 인식하는 하이브리드 효소(hybrid enzymes)를 만들었다.
대안적으로는, 메가뉴클레아제의 DNA 상호작용 아미노산을 변형시켜 서열 특이적 메가뉴클레아제를 설계할 수 있다(예를 들어, 미국 특허 제8,021,867호를 참고). 메가뉴클레아제는, 예를 들면, Certo, MT 외. Nature Methods (2012) 9:073-975; 미국 특허 제8,304,222호; 제8,021,867호; 제8,119,381호; 제8,124,369호; 제8,129,134호; 제8,133,697호; 제8,143,015호; 제8,143,016호; 제8,148,098호; 또는 제8,163,514호;에 기재된 방법들을 사용하여 설계할 수 있으며, 상기 각 문헌의 내용은 전문이 본 명세서에 참고로 포함된다. 대안적으로는, 상업적으로 이용가능한 기술, 예를 들어, Precision Biosciences의 Directed Nuclease Editor™ 지놈 편집 기술을 사용하여, 부위 특이적 절단 특성을 가진 메가뉴클레아제를 얻을 수 있다.
ZFN 및 TALEN - 두 가지 별개의 종류의 조작된(engineered) 뉴클레아제인, zinc-finger 뉴클레아제(ZFN) 및 전사 활성자-유사 이펙터 뉴클레아제(transcription activator-like effector nucleases, TALEN) 모두가 표적화 된 이중-가닥 절단(DSB)의 생산에 효과적이라는 것이 증명되었다 (Christian 외, 2010; Kim 외, 1996; Li 외, 2011; Mahfouz 외, 2011; Miller 외, 2010).
기본적으로, ZFN 및 TALEN 제한 엔도뉴클레아제 기술(restriction endonuclease technology)은 특정한 DNA 결합 도메인(각각, 일련의 zing finger 도메인 또는 TALE 반복 서열)에 연결된 비-특이적 DNA절단 효소를 사용한다. 일반적으로, DNA 인식 부위 및 절단 부위가 서로 분리되어 있는 제한 효소가 선택된다. 절단 부위(cleaving portion)는 분리된 후에, DNA 결합 도메인에 연결되어, 목적하는 서열에 대한 매우 높은 특이성을 갖는 엔도뉴클레아제를 생산한다. 이러한 특성을 가진 예시적인 제한 효소는 Fokl이다. 또한, Fokl은 뉴클레아제 활성을 가지기 위해 이량체화(dimerization)를 필요로 한다는 이점을 가지는데, 이는 각 뉴클레아제 파트너가 고유의 DNA 서열을 인식함에 따라, 특이성이 극적으로 증가하는 것을 의미한다. 이러한 효과를 강화하기 위해, Fokl 뉴클레아제는 이형 이량체(heterodimer)로만 기능할 수 있고, 증가된 촉매 활성을 갖도록 조작되었다. 이형 이량체로 기능하는 뉴클레아제는 원하지 않은 동형 이량체(homodimer) 활성의 가능성을 피할 수 있으므로, 이중-가닥 절단(DSB)의 특이성을 증가시킨다.
따라서, 예를 들면, 특정한 부위를 표적하기 위해, ZFN 및 TALEN은 뉴클레아제 쌍(pairs)으로 제작되며, 쌍의 각 멤버는 표적 부위에서 인접한 서열에 결합하도록 설계된다. 세포에서 일시적으로 발현되면, 뉴클레아제는 이들의 표적 부위에 결합하고, FokI 도메인이 이형 이량체화하여(heterodimerize), 이중-가닥 절단(DSB)을 생성한다. 비-상동 말단-연결(non-homologous end-joining, NHEJ) 경로를 통한 이중-가닥 절단(DSB)의 복원은 종종 작은 결실 또는 작은 서열 삽입(삽입-결실(Indels))을 초래한다. NHEJ에 의해 만들어진 각 복원은 고유하기 때문에, 단일 뉴클레아제 쌍의 사용은 표적 부위에서 다양한 삽입 또는 결실이 있는, 대립유전자 시리즈(allelic series)를 생산할 수 있다.
대체로, NHEJ는 상대적으로 정확하고 (검출 후 약 30분 이내에, 사람 세포 내의 약 75-85%의 DSB가 NHEJ에 의해 복원됨) 유전자 편집에서 잘못된(erroneous) NHEJ는, 복원이 정확한 경우에, 복원 산물이 돌연변이를 유발(mutagenic)하고 인식/절단 부위/PAM 모티프가 소멸(gone)/돌연변이되거나, 또는 일시적으로 도입된 뉴클레아제가 더 이상 존재하지 않을 때까지 뉴클레아제가 절단을 계속하는 경우와 마찬가지로 의존된다.
결실은 일반적으로, 길이가 대략 수 개 내지 수 백개의 염기쌍에 이르지만, 세포배양시 두 쌍의 뉴클레아제를 동시에 사용하여, 더 큰 결실이 성공적으로 생성될 수 있다 (Carlson 외, 2012; Lee 외, 2010). 또한, 표적 영역에 대해 상동성이 있는 DNA의 단편이 뉴클레아제 쌍과 함께 도입되는 경우에, 이중-가닥 절단(DSB)이 상동 재조합(HR)(예를 들어, 공여자 주형의 존재)을 통해 복원되어, 특이적인 변형을 생성할 수 있다 (Li 외, 2011; Miller 외, 2010; Urnov 외, 2005).
ZFN과 TALEN 모두의 뉴클레아제 부분이 유사한 특성을 가질지라도, 이들 조작된 뉴클레아제들 사이의 차이는 이들의 DNA 인식 펩타이드(recognition peptide)에 있다. ZFN은 Cys2-His2 zinc finger에 의존하고, TALEN은 TALE에 의존한다. 이들 DNA 인식 펩타이드 도메인은 모두, 이들의 단백질 내에서 함께, 자연적으로 발견된다는 특징을 갖는다. Cys2-His2 zinc finger는 일반적으로, 3bp 간격의 반복 서열에서 발견되며 다양한 핵산 상호작용 단백질에서 다양한 조합으로 발견된다. 반면 TALE는 아미노산 및 인식된 뉴클레오타이드 쌍 사이의 일대일 인식 비율을 가지는 반복 서열로 발견된다. Zinc finger 및 TALE는 모두 반복된 패턴으로 나타나기 때문에, 상이한 조합을 시도하여 매우 대앙?h 서열 특이성을 생성할 수 있다. 부위-특이적 zinc finger 엔도뉴클레아제를 만드는 접근 방식은, 예를 들어, 모듈식 조립(modular assembly) [트리플렛 서열(triplet sequence)과 연관된 zinc finger들이 연이어 부착되어, 필요한 서열을 커버함(covering)], OPEN(트리플렛 뉴클레오타이드에 대한 펩타이드 도메인의 낮은-엄격성 선택(low-stringency selection) 후 박테리아 시스템 내 최종 표적에 대한 펩타이드 조합의 높은-엄격성 선택(high-stringency selection)), 및, 특히, zinc finger 라이브러리의 박테리아 원-하이브리드 스크리닝(bacterial one-hybrid screening)을 포함한다. 또한, 예를 들면, Sangamo Biosciences™ (캘리포니아주, 리치먼드 소재)로부터 ZFN을 상업적으로 설계하고 얻을 수 있다.
TALEN을 설계 및 획득하는 방법은 예를 들면 Reyon 외, Nature Biotechnology 2012 May; [0239] 30(5):460-5; Miller 외, Nat Biotechnol. (2011) 29: 143-148; Cermak 외, Nucleic Acids Research (2011) 39 (12): e82 및 Zhang 외, Nature Biotechnology (2011) 29 (2): 149-53에 기재되어 있다. 모조 핸드(Mojo Hand)라고 이름 붙여진, 최근 개발된 웹-기반 프로그램은 지놈 편집 적용을 위해 TAL 및 TALEN 제작물을 설계하기 위한 메이오 클리닉(Mayo Clinic)에 의해 도입되었다 (www(dot)talendesign(dot)org를 통해 접속할 수 있다). 또한, TALEN은 예를 들면 Sangamo Biosciences™ (캘리포니아주, 리치먼드 소재)로부터 상업적으로 설계 및 얻을 수 있다.
T-GEE 시스템 (TargetGene's Genome Editing Engine) - 표적 세포에서 생체 내(in- 조립되고, 미리 정해진 표적 핵산 서열과 상호작용할 수 있는 폴리펩타이드 모이어티(moiety) 및 특이성 부여 핵산(specificity conferring nucleic acid, SCNA)을 포함하는, 프로그래밍 가능한 핵단백질 분자 복합체(programmable nucleoprotein molecular complex)가 제시된다. 프로그래밍 가능한 핵단백질 분자 복합체는 표적 핵산 서열 내의 표적 부위를 특이적으로 변형 및/또는 편집하고/하거나, 표적 핵산 서열의 기능을 변형시킬 수 있다. 핵단백질 조성은 다음을 포함한다: (i) 표적 부위를 변형시킬 수 있는 기능적 도메인 및 (ii) 특이성 부여 핵산과 상호작용할 수 있는 연결 도메인을 포함하는, (a) 키메라 폴리펩타이드(chimeric polypeptide)를 암호화하는 폴리뉴클레오타이드 분자; 및 (i) 표적 부위 측면에 있는(flanking) 표적 핵산의 영역에 상보적인 핵산 서열 및 (ii) 폴리펩타이드의 연결 도메인에 특이적으로 부착할 수 있는 인식 영역을 포함하는, (b) 특이성 부여 핵산(specificity conferring nucleic acid, SCNA). 상기 조성은, 특이성-부여 핵산 및 표적 핵산의 염기쌍 형성을 통한 분자 복합체의 표적 핵산에 대한 높은 특이성 및 결합 능력으로, 미리 정해진 핵산 서열 표적을 정확하고, 확실하며, 비용면에서 효과적으로 변형시킬 수 있다. 상기 조성은 유전독성(genotoxic)이 덜하고, 이들의 조립이 모듈식이며, 맞춤화(customization) 없이 단일 플랫폼을 이용하고, 특화된 핵심-시설(core-facility) 밖에서 독립적인 사용에 알맞고, 개발 기간이 짧고 비용이 절감된다.
CRISPR-Cas 시스템 및 이의 모든 변형물 (본원에서는 "CRISPR"라고 지칭함) - 많은 박테리아 및 고세균(archaea)은, 침입한 파지(phages) 및 플라스미드의 핵산을 분해할 수 있는 내인성 RNA-기반 적응 면역 체계(RNA-based adaptive immune system)를 가지고 있다. 이들 체계는 단백질 성분을 암호화하는 CRISPR 관련(CRISPR associated, Cas) 유전자 및 RNA 성분을 생산하는 크리스퍼(clustered regularly interspaced short palindromic repeat, CRISPR) 뉴클레오타이드 서열로 이루어져 있다. CRISPR RNA(crRNA)는 특정한 바이러스 및 플라스미드의 DNA에 대해 상동성의 짧은 구간(stretches)를 포함하며, Cas 뉴클레아제가 대응하는 병원체의 상보적인 핵산을 분해하도록 지시하는 가이드 역할을 한다. 화농연쇄상구균(Streptococcus pyogenes)의 유형 II CRISPR/Cas 시스템에 관한 연구는 세 가지 성분이 RNA/단백질 복합체를 형성하고, 함께 서열-특이적 뉴클레아제 활성에 충분하다는 것을 밝혔다: Cas9 뉴클레아제, 표적 서열에 상동성이 있는 20개의 염기쌍을 포함하는 crRNA, 및 트랜스-작용 crRNA(trans-activating crRNA, tracrRNA)(Jinek 외 Science (2012) 337: 816-821).
crRNA와 tracrRNA 사이에서의 융합으로 구성된, 합성 키메라 가이드 RNA(synthetic chimeric guide RNA(gRNA))는 시험관에서 (in vitro) Cas9이 crRNA에 상보적인 DNA 표적을 절단하도록 지시할 수 있다는 것이 추가로 입증되었다. 또한, 합성 sgRNA와 결합한 Cas9의 일시적인 발현이 여러 상이한 종(species)에서 표적화된 이중-가닥 절단(DSB)을 생산하는 데 사용될 수 있다는 것이 입증되었다 (Cho 외, 2013; Cong 외, 2013; DiCarlo 외, 2013; Hwang 외, 2013a,b; Jinek 외, 2013; Mali 외, 2013).
지놈 편집을 위한 CRISPR/Cas 시스템은 다음의 두 가지 별개의 성분을 포함한다: sgRNA 및 엔도뉴클레아제(예, Cas9).
sgRNA(또한 본 명세서에서 짧은 가이드 RNA(short guide RNA, sgRNA)라고도 지칭함)는 일반적으로 20개의 뉴클레오타이드 서열로, 표적 상동성 서열(target homologous sequence, crRNA) 및 단일 키메라 전사체 내에서 crRNA를 Cas9 뉴클레아제(tracrRNA)에 연결하는 내인성 박테리아 RNA의 조합을 암호화한다. gRNA/Cas9 복합체는 sgRNA 서열과 상보적 지놈 DNA 사이의 염기쌍 형성에 의해 표적 서열로 리크루트된다. Cas9의 성공적인 결합을 위해, 표적 지놈 서열은 또한 정확한 프로토스페이서 인근 모티프(Protospacer Adjacent Motif, PAM) 서열을 표적 서열 바로 다음에 포함해야 한다. Cas9이 DNA의 양 가닥을 절단해 이중-가닥 절단(DSB)을 유발할 수 있도록, gRNA/Cas9 복합체의 결합은 Cas9을 표적 지놈 서열에 배치시킨다. ZFN 및 TALEN과 마찬가지로, CRISPR/Cas에 의해 생산된 이중-가닥 절단(DSB)은 상동 재조합 또는 NHEJ를 겪을 수 있으며, DNA 복원이 일어나는 동안의 특이적 서열 변형에 감수성이다(susceptible).
Cas9 뉴클레아제는 다음의 두 가지 기능적 도메인을 가진다: 각각의 상이한 DNA를 절단하는 RuvC 및 HNH. 두 도메인이 모두 활성 상태일 때, Cas9은 지놈의 DNA에서 이중-가닥 절단(DSB)를 유발한다.
CRISPR/Cas의 중요한 이점은 이 시스템의 높은 효율이, 합성 gRNA를 쉽게 생성할 수 있는 능력과 결부된다는 것이다. 이는 상이한 지놈 부위의 변형을 표적으로 하고/하거나 동일한 부위의 상이한 변형을 표적으로 하도록 용이하게 변형될 수 있는 시스템을 생성한다. 또한, 복수의 유전자를 동시에 표적 할 수 있는 프로토콜이 확립되었다. 돌연변이를 가지고 있는 대부분의 세포가 표적이 된 유전자 내에서 이중 대립 형질 돌연변이(biallelic mutation)를 나타낸다.
그러나, sgRNA 서열 및 지놈의 DNA 표적 서열 간의 염기쌍 형성 상호작용의 명백한 유연성이 Cas9에 의해 절단되는 표적 서열에 대한 불완전한 매치를 용인한다.
불활성 촉매 도메인(inactive catalytic domain)인 RuvC- 또는 HNH-를 하나 포함하는 변형된 버전의 Cas9 효소를 '니카제(nickases)'라고 한다. 단 하나의 활성 뉴클레아제 도메인으로, Cas9 니카제는 표적 DNA의 단 하나의 가닥을 절단하여, 단일-가닥 절단 또는 '닉(nick)'을 생성한다. 단일-가닥 절단, 또는 닉은 PARP(감지자(sensor)) 및 XRCC1/LIG III 복합체(라이게이션(ligation))와 같은, 그러나 이에 한정되지 않는, 단백질들을 수반한 단일 가닥 절단 복원 메커니즘에 의해 대부분 복원된다. 토포아이소머라제 I(topoisomerase I) 독극물 또는 PARP1을 자연적으로 발생한 SSB에 가두는 약물에 의해 단일 가닥 절단(single strand break, SSB)이 생성되는 경우에, 이들이 지속될 수 있고, 세포가 S-기(S-phase)에 진입하고 복제 분기점(replication fork)이 이러한 SSB를 마주하는 경우에, 이들은 HR에 의해서만 복원될 수 있는, 단일 말단을 가진 DSB가 될 것이다. 그러나, Cas9 니카제에 의해 도입된, 두 개의 근접한 반대 가닥의 닉은 이중-가닥 절단으로, '이중 닉(double nick)' CRISPR 시스템이라고 종종 불리는 것에서 처리된다. 기본적으로 비-평행(nonparallel) DSB인 이중-닉은 다른 DSB처럼, 표적 유전자에 대한 목적하는 효과 및 공여자 서열(donor sequence)의 존재 및 세포주기 단계(cell cycle stage)에 따라서 HR 또는 NHEJ에 의해 복원될 수 있다(HR은 훨씬 덜 일어나며, 세포주기의 S 및 G2 단계에서만 일어날 수 있다). 따라서, 특이성 및 감소된 비-표적 효과(off-target effect)가 중요한 경우에, 지놈 DNA의 반대 가닥 상에서 서로 근접하게 있는 표적 서열들로 두 개 gRNA를 설계함으로써, Cas9 니카제를 이용하여 이중-닉을 생성하는 것은, 두 gRNA 중 어느 한 gRNA가 단독으로, 지놈 DNA를 변화시키지 않을 것 같은, 심지어, 이들 사건은 불가능한 것이 아닌, 닉을 야기함에 따라, 비-표적 효과를 감소시킬 것이다.
두 개의 불활성 촉매 도메인을 가진 Cas9 효소의 변형된 버전(dead Cas9또는 dCas9)은 뉴클레아제 활성이 없는 반면, 여전히 sgDNA 특이성에 기초하여 DNA에 결합할 수 있다. dCas9은 불활성 효소를 알려진 조절 도메인과 융합함으로써, 유전자 발현을 활성화 또는 억제하는 DNA 전사 조절자를 위한 플랫폼으로 사용될 수 있다. 예를 들어, 지놈의 DNA 내의 표적 서열에 dCas9 단독의 결합은 유전자 전사를 간섭할 수 있다.
본 발명의 일부 구현예에서 사용될 수 있는 Cas9의 추가적인 변이체(variant)는 CasX 또는 Cpf1을 포함하지만 이에 한정되지는 않는다. CasX 효소는, Cas9에 비해 크기가 더 작고 박테리아에서 발견되는(일반적으로 인간에서는 발견되지 않는) RNA-guided 지놈 편집기의 별개의 군을 포함하고 있어 인간의 면역계/반응을 유발한 가능성이 적다. 또한, CasX는 Cas9과 다른 PAM 모티프를 활용하므로 Cas9 모티프가 발견되지 않는 표적 서열에도 사용할 수 있다(Liu JJ 외, Nature. (2019) 566(7743):218-223을 참조). Cas12a로 지칭되는 Cpf1은 Cas9 PAM(NGG)이 훨씬 덜 풍부한 AT rich 영역을 편집하는데 특히 유리하다(Li T 외, Biotechnol Adv. (2019) 37(1):21-27; Murugan K 외, Mol Cell. (2017) 68(1):15-25 참조).
다른 구현예에 따르면, CRISPR 시스템은 DNA 절단 도메인과 같은 다양한 이펙터 도메인과 함께 융합될 수 있다. DNA 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 얻을 수 있다. DNA 절단 도메인이 유래될 수 있는 엔도뉴클레아제의 비제한적인 예는 제한 엔도뉴클레아제 및 호밍(homing) 엔도뉴클레아제를 포함하지만 이에 제한되지는 않는다(예를 들어, New England Biolabs Catalog 또는 Belfort 외. (1997) Nucleic Acids Res를 참고). 예시적인 구현예에서, CRISPR 시스템의 절단 도메인은 FokI 엔도뉴클레아제 도메인 또는 변형된 FokI 엔도뉴클레아제 도메인이다. 또한, 호밍 엔도뉴클레아제(HE)을 사용하는 것도 또 다른 대안이다. Hes는 박테리아, 고세균(archaea), 단세포(unicellular) 진핵생물에서 발견되는 작은 단백질(300개 아미노산 미만)이다. Hes의 구별되는 특징은 제한 효소(4 내지 8 bp)와 같은 다른 부위-특이적 엔도뉴클레아제에 비해 상대적으로 긴 서열(14 내지 40 bp)을 인식한다는 것이다. Hes는 역사적으로 보존된 작은 아미노산 모티프에 의해 분류되었다. 적어도 5개의 이러한 패밀리가 확인되었다: LAGLIDADG; GIY-YIG; HNH; His-Cys Box 및 PD-(D/E)xK, 이들은 EdxHD 효소와 관련이 있으며 일부에서는 별도의 패밀리로 간주된다. 구조적 수준에서, HNH 및 His-Cys Box는 PD-(D/E)xK 및 EdxHD 효소와 마찬가지로 공통 접힘(fold) (ββα-금속으로 지정)을 공유한다. 각 패밀리에 대한 촉매 및 DNA 인식 전략은 다양하며 다양한 응용 분야에 대한 엔지니어링에 다른 수준을 부여한다. 예를 들어, Methods Mol Biol. (2014)을 참고한다. 본 발명의 일부 구현예에 따라 사용될 수 있는 예시적인 호밍 엔도뉴클레아제는 I-CreI, I-TevI, I-HmuI, I-PpoI 및 I-Ssp68031을 포함하나, 이에 제한되지는 않는다.
CRISPR의 변형된 버전, 예를 들어 dead CRISPR (dCRISPR-엔도뉴클레아제)는 CRISPR 전사 억제(CRISPRi) 또는 CRISPR 전사 활성(CRISPRa)에도 사용될 수 있고, [예를 들어, Kampmann M., ACS Chem Biol. (2018) 13(2):406-416; La Russa MF 및 Qi LS., Mol Cell Biol. (2015) 35(22):3800-9을 참고]
본 발명의 일부 구현예에 따라 사용될 수 있는 CRISPR의 다른 버전은 세포 DNA 또는 RNA에 점 돌연변이(point mutation)을 직접 설치하기 위해 다른 효소와 함께 CRISPR 시스템의 구성요소를 사용하는 지놈 편집(genome editing)을 포함한다.
따라서, 한 구현예에 따르면, 편집제는 DNA 또는 RNA 편집제(DNA or RNA editing agent)이다.
한 구현예에 따르면, DNA 또는 RNA 편집제는 염기 편집을 유도한다.
본 명세서에서 사용되는 "염기 편집(base editing)"이라는 용어는 이중 가닥 또는 단일 가닥 DNA 절단 없이 세포 DNA 또는 RNA에 점 돌연변이를 설치하는 것을 의미한다/
염기 편집에서, DNA 염기 편집기는 일반적으로 촉매적으로 손상된 Cas 뉴클레아제와 단일 가닥 DNA(ssDNA)에서 작동하는 염기 변형 효소 간의 융합을 포함한다. 그것의 표적 DNA 유전자좌(locus)에 결합하면, gDNA와 표적 DNA 가닥 사이의 염기 쌍이 'R 루프'에서 단일-가닥 DNA의 작은 부분을 변위시킨다. 이 ssDNA 버블 내의 DNA 염기는 염기-편집 효소(예, 디아미나제(deaminase) 효소)에 의해 변형된다. 진핵 세포의 효율성을 향상시키기 위해, 촉매적으로 비활성화된 뉴클레아제는 편집되지 않은 DNA 가닥에 틈(nick)을 생성하여 편집된 가닥을 주형으로 사용하여 세포가 편집되지 않은 가닥을 복원하도록 유도한다.
두 종류의 DNA 염기 편집기는 다음에 설명되어 있다: 시토신 염기 편집기(cytosine base editors, CBEs)는 C-G 염기쌍을 T-A 염기 쌍으로 변환하고, 아데닌 염기 편집기(adenine base editors, ABEs)는 A-T 염기쌍을 C-G 염기 쌍으로 변환한다. 종합적으로, CBE 및 ABE는 모두 4 가지 가능한 전이 돌연변이 (C에서 T, A에서 G, T에서 C 및 G에서 A)를 모두 매개할 수 있다.
한 구현예에 따르면, DNA 또는 RNA 편집제는 촉매적으로 불활성인 엔도뉴클레아제(예, CRISPR-dCas)를 포함한다.
한 구현예에 따르면, 촉매적으로 불활성인 엔도뉴클레아제는 불활성 Cas9(예, dCas9)이다.
한 구현예에 따르면, 촉매적으로 불활성인 엔도뉴클레아제는 불활성 Cas13(예, dCas13)이다.
한 구현예에 따르면, DNA 또는 RNA 편집제는 후성유전학적(epigenetic) 편집(즉, DNA, RNA 또는 히스톤 단백질에 화학적 변화를 제공)이 가능한 효소를 포함한다.
예시적인 효소는 DNA 메틸트랜스퍼라제(DNA methyltransferases), 메틸라제(methylases), 아세틸트랜스퍼라제(acetyltransferases)를 포함하지만, 이에 제한되지는 않는다. 보다 구체적으로, 예시적인 효소는 예를 들어, DNA(시토신5)-메틸트랜스퍼라제 3A(DNA (cytosine-5)-methyltransferase 3A, DNMT3a), 히스톤 아세틸트랜스퍼라제 p300(Histone acetyltransferase p300), 텐-일레븐 전위 메틸시토신 디옥시게나제 1(Ten-eleven translocation methylcytosine dioxygenase 1, TET1), 라이신(K)-특이적 데메틸라제 1A(Lysine (K)-specific demethylase 1A, LSD1) 및 칼슘 및 인테그린 결합 단백질 1(Calcium and integrin binding protein 1, CIB1)을 포함한다.
촉매적으로 비활성화된 뉴클레아제 이외에, 본 발명의 DNA 또는 RNA 편집제는 또한 핵염기 디아미나제 효소(nucleobase deaminase enzyme) 및/또는 DNA 글리코실라제 억제제(DNA glycosylase inhibitor)를 포함할 수 있다.
특정 구현예에 따르면, DNA 또는 RNA 편집제는 sgRNA와 함께 BE1 (APOBEC1-XTEN-dCas9), BE2 (APOBEC1-XTEN-dCas9-UGI) 또는 BE3 (APOBEC-XTEN-dCas9(A840H)-UGI)을 포함한다. APOBEC1은 디아미나제(deaminase) 전체 길이 또는 촉매 활성 단편이고, XTEN은 단백질 링커(linker)이며, UGI은 후속적인 U:G불일치가 C:G 염기쌍으로 다시 복구되는 것을 막기 위한 우라실 DNA 글리코실라제 억제제(uracil DNA glycosylase inhibitor)이고, dCas9(A840H)는 dCas9가 HNH 도메인의 촉매 활성을 복원하도록 되돌려 편집되지 않은 가닥에만 틈(nick)을 내는 니카제(nickase)로, DNA를 새롭게 합성하고 목적하는 U:A 산물을 이끌어낸다.
본 발명의 일부 구현예에 따른 염기 편집에 사용될 수 있는 추가적인 효소는 Rees 및 Liu, Nature Reviews Genetics (2018) 19:770-788에 명시되어 있으며, 이는 그 전문이 본 명세서에 참조로 포함된다.
Feng Zhang 연구실의 Target Finder, Michael Boutros 연구실의 Target Finer(E-CRISPR), R GEN Tool: Cas-OFFinder, CasFinder: 지놈에서 특정 Cas9 표적을 식별하기 위한 유연한 알고리즘 및 CRISPR Optimal Target Finer(이에 국한되지는 않음)와 같이 다양한 종의 서로 다른 유전자에 대해 생물학적으로 결정된 고유한 sgRNA 목록뿐만 아니라 표적 서열을 선택 및/또는 설계하는데 도움이 되는 공개적으로 사용 가능한 도구(tool)가 많이 있다.
CRISPR 시스템을 사용하기위해, sgRNA 및 Cas 엔도뉴클레아제(예, Cas9, Cpf1, CasX)가 모두 표적 세포에서 발현되거나 (예, 리보핵단백질 복합체(ribonucleoprotein complex)로써) 존재해야한다. 삽입 벡터는 단일 플라스미드에 두 카세트를 모두 포함할 수 있거나 두 개의 별개의 플라스미드에서 카세트가 발현된다. CRISPR 플라스미드는 Addgene(75 Sidney St, Suite 550A Cambridge, MA 02139)의 px330 플라스미드와 같이 상업적으로 이용가능하다. CRISPR(clustered regularly interspaced short palindromic repeats)-관련 (Cas)-가이드 RNA 기술 및 식물 지놈을 변형시키기 위한 Cas 엔도뉴클레아제의 사용은 Svitashev 외, 2015, Plant Physiology, 169 (2): 931-945; Kumar 및 Jain, 2015, J Exp Bot 66: 47-57; 및 미국 특허출원 공개번호 제 20150082478호에 기술되어 있으며, 이는 그 전문이 참고로 본 명세서에 포함된다. sgRNA와 함께 DNA 편집을 수행하는데 사용될 수 있는 Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX (Zetsche 외, 2015, Cell. 163(3):759-71), C2c1, C2c2, 및 C2c3 (Shmakov 외, Mol Cell. 2015 Nov 5;60(3):385-97)를 포함하나, 이에 제한되지는 않는다.
"히트 앤 런(Hit and run)" 또는 "인-아웃(in-out)" - 은 두 단계의 재조합 과정을 수반한다. 첫 번째 단계에서, 이중 양성/음성 선별 마커 카세트를 포함하는 삽입형 벡터가 목적하는 서열 변형을 도입하는 데 이용된다. 삽입 벡터는 표적 유전자위(locus)에 대해 상동성이 있는 단일의 연속적인 영역을 포함하고, 관심 있는 돌연변이를 지니도록 변형된다. 이 표적 제작물을 상동성 영역 내의 한 부위에서 제한 효소로 선형화하고, 세포에 도입하였으며, 양성 선택을 수행하여, 상동 재조합-매개된 사건을 분리한다. 상동 서열을 지닌 DNA는 플라스미드, 단일 또는 이중 가닥의 올리고로 제공될 수 있다. 이들 상동 재조합체는 선택 카세트를 포함하는, 사이에 존재하는 벡터서열(intervening vector sequence)에 의해 분리된 국소적인 중복을 포함한다. 두 번째 단계에서, 표적 클론은 음성 선택되어, 중복된 서열 사이의 염색체-내(intra-chromosoma) 재조합을 통한 선택 카세트를 상실한 세포를 확인한다. 재조합 사건은 상기 중복을 제거하고, 재조합 부위에 따라서, 대립 유전자는 도입된 돌연변이를 보유하거나 또는 야생형으로 복귀한다. 최종 결과는 임의의 외인성 서열의 보유 없이, 목적하는 변형의 도입이 일어나는 것이다.
"이중-치환(double-replacement)" 또는 "태그(tag) 및 교환(exchange)" 전략 - 은 히트 앤 런(hit and run) 접근법과 유사한 두 단계의 선택 과정을 수반하지만, 두 개의 상이한 표적 제작물을 필요로 한다. 첫 번째 단계에서, 3' 및 5' 상동성 아암(homology arm)을 가진 표준 표적 벡터를 사용해 돌연변이가 도입될 위치 근처에 이중 양성/음성 선별 카세트를 삽입한다. 이 시스템의 구성 요소들이 세포 내로 도입된 후 양성 선택을 적용했고, HR-매개된 사건이 확인될 수 있었다. 다음으로, 목적하는 돌연변이와 상동성의 영역을 포함하는 제 2 표적 벡터를 표적 클론에 도입하고, 음성 선택을 적용하여, 선택 카세트를 제거하고 돌연변이를 도입한다. 최종 대립유전자는 목적하는 돌연변이를 포함하는 반면, 원하지 않은 외인성 서열은 제거된다.
특정 구현예에 따르면, DNA 편집제(DNA editing agent)는 DNA 표적 모듈(예, gRNA)를 포함한다.
특정 구현예에 따르면, DNA 편집제는 엔도뉴클레아제를 포함하지 않는다.
특정 구현예에 따르면, DNA 편집제는 엔도뉴클레아제를 포함한다.
특정 구현예에 따르면, DNA 편집제는 촉매 불활성 엔도뉴클레아제를 포함한다.
특정 구현예에 따르면, DNA 편집제는 뉴클레아제(예, 엔도뉴클레아제) 및 DNA 표적 모듈(예, sgRNA)를 포함한다.
특정 구현예에 따르면, DNA 편집제는 CRISPR/엔도뉴클레아제이다.
특정 구현예에 따르면, DNA 편집제는 CRISPR/Cas, 예를 들어, sgRNA 및 Cas9 또는 sgRNA 및 dCas9이다.
특정 구현예에 따르면, DNA 편집제는, 예를 들어, 그 전문이 참조로 본 명세서에 포함되는 WO 2019/058255에 개시된 바와 같은 CRISPR/Cas9이다.
특정 구현예에 따르면, DNA 또는 RNA 편집제는 염기 편집을 유도한다.
특정 구현예에 따르면, DNA 또는 RNA 편집제는 후성유전학적(epoigenetic) 편집을 위한 효소를 포함한다.
특정 구현예에 따르면, DNA 편집제는 TALEN이다.
특정 구현예에 따르면, DNA 편집제는 ZFN이다.
특정 구현예에 따르면, DNA 편집제는 메가뉴클레아제이다.
특정 구현예에 따르면, DNA 편집제는 세포(예, 진핵 세포)에서 발현을 모니터링하기 위한 리포터에 연결된다.
특정 구현예에 따르면, 리포터는 형광 리포터 단백질이다.
"형광 단백질(fluorescent protein)"이라는 용어는 형광을 방출하는 폴리펩타이드를 의미하고, 일반적으로 유세포분석(flow cytometry), 현미경 관찰 또는 임의의 형광 촬영 시스템(fluorescent imaging system)에 의해 검출 가능하므로, 이러한 단백질을 발현하는 세포의 선별에 대한 기준으로 사용할 수 있다.
리포터로 사용할 수 있는 형광 단백질의 예시로, 녹색 형광 단백질(GFP), 청색 형광 단백질(BFP) 및 적색 형광 단백질(예, dsRed, mCherry, RFP)가 있으나, 이들에 한정되지 않는다. 형광 또는 기타 리포터의 비-제한적인 목록은 발광(luminescence)에 의해 검출 가능한 단백질(예, 루시퍼라제(luciferase)) 또는 비색 분석법(colorimetric assay)에 의해 검출 가능한 단백질 (예, GUS)을 포함한다. 특정 구현예에 따르면, 상기 형광 리포터는 적색 형광 단백질(예, dsRed, mCherry, RFP) 또는 GFP이다.
새로운 종류의 형광 단백질 및 그 적용에 관한 검토를 Trends in Biochemical Sciences에서 확인할 수 있다 [Rodriguez, Erik A.; Campbell, Robert E.; Lin, John Y.; Lin, Michael Z.; Miyawaki, Atsushi; Palmer, Amy E.; Shu, Xiaokun; Zhang, Jin; Tsien, Roger Y. "The Growing and Glowing Toolbox of Fluorescent and Photoactive Proteins". Trends in Biochemical Sciences. Doi:10.1016/j.tibs.2016.09.010].
또 다른 구현예에 따르면, 리포터는 식물의 내인성 유전자이다. 예시적인 리포터는 카로티노이드 생합성 경로에서 중요한 효소 중 하나를 암호화하는 피토엔 불포화 효소 유전자(phytoene desaturase gene, PDS3)이다. 그것의 침묵은 알비노/표백(albino/bleached) 표현형을 생성한다. 따라서, PDS3의 발현이 감소된 식물체는 엽록소 수치를 감소시켜, 완전한 알비노 및 왜소증을 보인다. 본 교시에 따라 사용할 수 있는 추가 유전자는 작물 보호에 참여하는 유전자를 포함하지만, 이에 제한되지 않는다.
또 다른 구현예에 따르면, 리포터는 항생제 선별 마커이다. 리포터로 사용될 수 있는 항생제 선별 마커의 예시로, 네오마이신 인산전이효소 II(neomycin phosphotransferase II, nptII) 및 하이그로마이신 인산전이효소(hygromycin phosphotransferase, hpt)가 있으나, 이들에 한정되지 않는다. 본 교시에 따라 사용할 수 있는 추가의 마커 유전자는 젠타마이신 아세틸트랜스퍼라제 (gentamycin acetyltransferase, accC3) 저항성 및 블레오마이신(bleomycin) 및 플레오마이신(phleomycin) 저항성 유전자를 포함하지만, 이들에 한정되지 않는다.
NPTII 효소가 카나마이신(kanamycin), 네오마이신(neomycin), 제네티신(geneticin, 또는 G418) 및 파로모마이신(paromomycin)과 같은 다수의 아미노글리코사이드(aminoglycoside) 항생제를 인산화시킴으로써, 불활성화한다는 것을 이해할 것이다. 이들 중, 카나마이신, 네오마이신 및 파로모마이신은 다양한 식물 종에서 이용되고, 및 G418은 형질전환된 포유류 세포의 선별에 통상적으로 이용된다.
또 다른 구현예에 따르면, 리포터는 독성 선별 마커(toxic selection marker)이다. 리포터로 사용될 수 있는 예시적인 독성 선별 마커는, 제한 없이, 알코올 탈수소효소(alcohol dehydrogenase, ADH1) 유전자를 사용한 알릴(allyl) 알코올 선별이다. ADH1은 NAD+ 또는 NADP+의 동시 환원과 함께 알코올과 알데히드 또는 케톤 간의 상호전환을 촉매하는 탈수소효소 그룹을 포함하고, 조직 내 알코올 독성 물질을 분해한다. ADH1 발현이 감소된 식물은 알릴(allyl) 알코올에 대한 내성 증가를 나타낸다. 따라서, ADH1이 감소된 식물은 알릴 알코올의 독성 효과에 내성이 있다.
사용된 DNA 편집제에 관계없이, 본 발명의 방법은 비정상적으로 가공된(aberrantly processed)(예, 가공 불가능한(non-processable)), 전사 가능한 RNA 침묵 분자를 암호화하는 유전자가 결실, 삽입 또는 점 돌연변이 중 적어도 하나에 의해 변형되도록 사용된다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 구조적인(structured) 영역에 있다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 줄기(stem) 영역에 있다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 고리(loop) 영역에 있다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 줄기 영역 및 고리 영역에 있다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 비-구조적인(non-structured) 영역에 있다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 줄기 영역 및 고리 영역 및 비-구조적인 영역에 있다.
한 구현예에 따르면, 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사가능한 핵산 서열의 핵산 서열의 변형은 제 1의 표적 RNA (예, 자연적인 표적 RNA)에 대한 결합 부위에 상응하는 것 이외의 핵산, 예를 들어 자연적인 표적에 결합할 수 있는 RNAi의 성숙 서열을 암호화하는 핵산 이외의 핵산에 영향을 받는다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 RISC와 결합되는 작은(small) RNA 분자로의 가공성(processability)를 부여한다.
특정 구현예에 따르면, 변형은 약 1 내지 500개, 약 1 내지 250개, 약 1 내지 150개, 약 1 내지 100개, 약 1 내지 50개, 약 1 내지 25개, 약 1 내지 10개, 약 10 내지 250개, 약 10 내지 200개, 약 10 내지 150개, 약 10 내지 100개, 약 10 내지 50개, 약 1 내지 50개, 약 1 내지 10개, 약 50 내지 150개, 약 50 내지 100개 또는 약 100 내지 200개의 뉴클레오타이드의 변형을 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
한 구현예에 따르면, 변형은 최대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450 또는 최대 500개의 뉴클레오타이드의 변형을 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
한 구현예에 따르면, 변형은 연속적인 핵산 서열 (예를 들어, 적어도 5, 10, 20, 30, 40, 50, 100, 150, 200, 300, 400, 500개의 염기)에서 있을 수 있다.
한 구현예에 따르면, 변형은 비-연속적인 방식으로, 예를 들어 20, 50, 100, 150, 200, 500, 1000, 2000, 5000의 핵산 서열 전반에 걸쳐 있을 수 있다.
특정 구현예에 따르면, 변형은 최대 200개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 150개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 100개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 50개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 25개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 24개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 23개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 22개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 21개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 20개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 15개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 10개의 뉴클레오타이드의 변형을 포함한다.
특정 구현예에 따르면, 변형은 최대 5개의 뉴클레오타이드의 변형을 포함한다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 인식/절단/PAM 모티프(motif)가, 원래의(original) PAM 인식 부위(recognition site)가 없어지도록 변형된 것과 같다.
특정 구현예에 따르면, 변형은 PAM 모티프에서 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 핵산에 있다
한 구현예에 따르면, 변형은 삽입(insertion)을 포함한다.
특정 구현예에 따르면, 삽입은 약 1 내지 500개, 약 1 내지 250개, 약 1 내지 150개, 약 1 내지 100개, 약 1 내지 50개, 약 1 내지 25개, 약 1 내지 10개, 약 10 내지 250개, 약 10 내지 200개, 약 10 내지 150개, 약 10 내지 100개, 약 10 내지 50개, 약 1 내지 50개, 약 1 내지 10개, 약 50 내지 150개, 약 50 내지 100개 또는 약 100 내지 200개의 뉴클레오타이드의 삽입을 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
한 구현예에 따르면, 삽입은 최대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400 또는 최대 500개의 뉴클레오타이드의 삽입을 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
특정 구현예에 따르면, 삽입은 최대 200개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 150개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 100개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 50개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 25개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 24개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 23개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 22개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 21개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 20개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 15개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 10개의 뉴클레오타이드의 삽입을 포함한다.
특정 구현예에 따르면, 삽입은 최대 5개의 뉴클레오타이드의 삽입을 포함한다.
한 구현예에 따르면, 변형은 결손(deletion)을 포함한다.
특정 구현예에 따르면, 결손은 약 1 내지 500개, 약 1 내지 250개, 약 1 내지 150개, 약 1 내지 100개, 약 1 내지 50개, 약 1 내지 25개, 약 1 내지 10개, 약 10 내지 250개, 약 10 내지 200개, 약 10 내지 150개, 약 10 내지 100개, 약 10 내지 50개, 약 1 내지 50개, 약 1 내지 10개, 약 50 내지 150개, 약 50 내지 100개 또는 약 100 내지 200개의 뉴클레오타이드의 결손을 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
한 구현예에 따르면, 결손은 최대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450 또는 최대 500개의 뉴클레오타이드의 결손을 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
특정 구현예에 따르면, 결손은 최대 200개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 150개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 100개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 50개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 25개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 24개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 23개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 22개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 21개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 20개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 15개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 10개의 뉴클레오타이드의 결손을 포함한다.
특정 구현예에 따르면, 결손은 최대 5개의 뉴클레오타이드의 결손을 포함한다.
한 구현예에 따르면, 변형은 점 돌연변이(point mutation)을 포함한다.
특정 구현예에 따르면, 점 돌연변이는 약 1 내지 500개, 약 1 내지 250개, 약 1 내지 150개, 약 1 내지 100개, 약 1 내지 50개, 약 1 내지 25개, 약 1 내지 10개, 약 10 내지 250개, 약 10 내지 200개, 약 10 내지 150개, 약 10 내지 100개, 약 10 내지 50개, 약 1 내지 50개, 약 1 내지 10개, 약 50 내지 150개, 약 50 내지 100개 또는 약 100 내지 200개의 뉴클레오타이드의 점 돌연변이를 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
한 구현예에 따르면, 점 돌연변이는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450 또는 최대 500개의 뉴클레오타이드의 점 돌연변이를 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 200개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 150개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 100개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 50개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 25개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 24개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 23개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 22개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 21개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 20개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 15개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 10개의 뉴클레오타이드의 점 돌연변이를 포함한다.
특정 구현예에 따르면, 점 돌연변이는 최대 5개의 뉴클레오타이드의 점 돌연변이를 포함한다.
한 구현예에 따르면, 변형은 임의의 결손, 삽입 및/또는 점 돌연변이의 조합을 포함한다.
한 구현예에 따르면, 변형은 뉴클레오타이드 치환(replacement) (예, 뉴클레오타이드 교체(swapping))을 포함한다.
특정 구현예에 따르면, 교체는 약 1 내지 500개, 1 내지 450개, 1 내지 400개, 1 내지 350개, 1 내지 300개, 1 내지 250개, 1 내지 200개, 1 내지 150개, 1 내지 100개, 1 내지 90개, 1 내지 80개, 1 내지 70개, 1 내지 60개, 1 내지 50개, 1 내지 40개, 1 내지 30개, 1 내지 20개, 1 내지 10개, 10 내지 100개, 10 내지 90개, 10 내지 80개, 10 내지 70개, 10 내지 60개, 10 내지 50개, 10 내지 40개, 10 내지 30개, 10 내지 20개, 10 내지 15개, 20 내지 30개, 20 내지 50개, 20 내지 70개, 30 내지 40개, 30 내지 50개, 30 내지 70개, 40 내지 50개, 40 내지 80개, 50 내지 60개, 50 내지 70개, 50 내지 90개, 60 내지 70개, 60 내지 80개, 70 내지 80개, 70 내지 90개, 80 내지 90개, 90 내지 100개, 100 내지 110개, 100 내지 120개, 100 내지 130개, 100 내지 140개, 100 내지 150개, 100 내지 160개, 100 내지 170개, 100 내지 180개, 100 내지 190개, 100 내지 200개, 110 내지 120개, 120 내지 130개, 130 내지 140개, 140 내지 150개, 160 내지 170개, 180 내지 190개, 190 내지 200개, 200 내지 250개, 250 내지 300개, 300 내지 350개, 350 내지 400개, 400 내지 450개, 또는 약 450 내지 500개의 뉴클레오타이드의 교체를 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
한 구현예에 따르면, 뉴클레오타이드 교체(swap)는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450 또는 최대 500개의 뉴클레오타이드의 치환(replacement)를 (비정상적으로 가공되고, 전사가능한 RNA 침묵 분자와 비교하여) 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 200 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 150 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 100 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 50 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 25 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 24 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 23 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 22 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 21 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 20 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 15 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 10 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
특정 구현예에 따르면, 뉴클레오타이드 교체는 최대 5 뉴클레오타이드에서 뉴클레오타이드 대체를 포함한다.
한 구현예에 따르면, 변형이 삽입 또는 교환인 경우, 공여 올리고뉴클레오타이드가 사용된다(하기에 논의됨).
한 구현예에 따르면, RISC와 결합된작은 RNA로 RNA 분자의 가공성을 부여하기 위해 상기 기재된 변형 중 임의의 하나 또는 조합이 수행될 수 있다.
특정 구현예에 따르면, 기능장애 RNA 침묵 분자의 가공성 및 침묵 활성이 얻어지도록, 결실 및 삽입 변형(예, 교체(swapping))은 공여자 올리고뉴클레오타이드(하기 논의됨)와 조합된 유전자 편집(예, CRISPR/Cas9 기술을 사용)에 의해 영향을 받는다. 이러한 방법은 예를 들어 WO 2019/058255에 기재되어 있으며, 그 전문이 참고로 본 명세서에 포함된다.
한 구현예에 따르면, RNA 분자는 세포에 대해 내인성(자연적으로 발생하는, 예, 타고난)이다. RNA 분자는 또한 세포에 대해 외인성일 수 있다(즉, 외부에서 추가되고 세포에서 자연적으로 발생하지 않음).
일부 구현예에 따르면, RNA 분자는 고유한(intrinsic) 번역 억제 활성을 포함한다.
특정 구현예에 따르면, RNA 분자는 고유한 RNA 간섭(RNAi) 활성을 포함한다.
특정 구현예에 따르면, RNA 침묵 분자(즉, RNAi분자, 예를 들어, miRNA, siRNA, piRNA, shRNA 등)의 전구체 핵산 서열은 구조의 독창성을 보존하고, 세포 RNAi 가공 및 실행 인자(executing factor)에 의해 인식 및 가공되도록 변형된다.
특정 구현예에 따르면, 기능장애 RNA 침묵 분자(즉, miRNA, rRNA, tRNA, lncRNa, snoRNA 등)의 전구체 핵산 서열은 세포 RNAi 처리 및 실행 인자에 의해 인식 및 가공되도록 변형된다.
특정 구현예에 따르면, RISC와 결합된 작은 RNA에 가공성을 부여하는 단계는, 예를 들어, 기능장애 RNA 침묵 분자의 2차 구조가 선형의 스트링 형태로 번역되고 RISC-결합된 RNA 분자(예, 야생형 전구체)로 가공된 상동의 RNA 침묵 분자의 2차 구조의 스트링 형태와 비교될 때, 기능장애 RNA 침묵 분자의 구조를 (예를 들어, RISC-결합된 RNA 분자(예, 야생형 전구체))로 가공된 상응하는 상동의 RNA 침묵 분자의 구조의 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 복원함으로써 수행된다. 당업계에 공지된 임의의 방법을 사용하여 2차 구조를 일련의 스트링으로 번역할 수 있으며, 이는 RNAfold와 같은(이에 국한되지 않음), 다른 일련의 스트링과 비교될 수 있다.
특정 구현예에 따르면, 기능장애 RNA 침묵 분자(즉, tasiRNA 등)의 핵산 서열은 침묵 활성 및/또는 침묵 분자로의 가공을 가능하게 하는 인자 및/또는 올리고뉴클레오타이드(예, miRNA)에 결합하도록 변형된다. 비제한적인 예에서, 기능장애 RNA 침묵 분자는 트랜스-활성화 RNA(trans-activating RNA, tasiRNA) 분자와 상동이지만 증폭기(amplifier) RNA 분자에 결합할 수 없고 따라서 작은 RNA를 침묵시키기 위해 가공될 수 없다. 따라서, 이러한 RNA 침묵 분자는 침묵 활성을 가능케 하는 요소(예, 증폭기)에 결합하도록 변형된다.
일부 구현예에 따르면, RNA-유사 분자(예, miRNA-유사)는 고유 번역 억제 활성 또는 고유 RNAi 활성을 포함하지 않는다(즉, RNA-유사 분자는 고유 RNA 침묵 활성을 갖지 않는다.)
특정 구현예에 따르면, 세포가 애기장대(A. thaliana)의 세포인 경우, 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 비정상적으로 가공되고, 전사가능한 핵산 서열은 하기 본 명세서의 표 2에 열거된 모든 것들을 포함한다.
특정 구현에에 따르면, 세포가 예쁜꼬마선충(C.elegans, Caenorhabditis elegans)의 세포인 경우, 미리 정해진 상동성 범위를 나타내는 RNA 분자를 암호화하는 비정상적으로 가공되고, 전사가능한 핵산 서열은 하기 본 명세서의 표 3에 열거된 모든 것들을 포함한다.
특정 구현예에 따르면, 세포가 인간(H. sapiens)의 세포인 경우, 미리 정해진 상동성 범위를 나타내는 RNA 분자를 암호화하는 비정상적으로 가공되고, 전사가능한 핵산 서열은 하기 본 명세서의 표 4에 열거된 모든 것들을 포함한다.
한 구현예에 따르면, 변형은 RNA 침묵 분자의 가공성을 제 1 표적 RNA에 결합하는 작은 RNA에 부여한다.
본 발명의 구현예에 따르면, RNA 분자는 제 1 표적 RNA(예, 자연의 표적 RNA)에 특이적이고, 표적 유전자에 대해 100% 전체 상동성 또는 그보다 적은 전체 상동성, 예를 들어, 표적 유전자에 대해 99%, 98 %, 97 %, 96 %, 95 %, 94 %, 93 %, 92 %, 91 %, 90 %, 89 %, 88 %, 87 %, 86 %, 85 %, 84 %, 83 %, 82 %, 81 % 보다 적은 전체 상동성을 나타내는 (아래 논의된 바와 같이) 그렇게 하도록 설계되지 않는 한, 관심 표적 RNA를 교차 억제 또는 침묵시키지 않는다; 표적유전자에 대한 전제 상동성은 RT-PCR, 웨스턴 블랏(Western blot), 면역조직화학(Immunohistochemistry) 및/또는 유세포분석(flow cytometry), 시퀀싱 또는 다른 검출 방법에 의해 RNA 또는 단백질 수준에서 결정된다.
한 구현예에 따르면, 방법은 세포에서 침묵 활성을 갖는 RNA 분자(예, 침묵 활성이 부여된 RNA 분자)의 특이성을 변형시키는 단계를 추가로 포함하고, 상기 방법은 관심 표적 RNA로 RNA 분자의 침묵 특이성을 재유도하는 DNA 편집제를 세포 내로 도입하는 것을 포함하고, 관심 표적 RNA는 제 1 표적 RNA와 구별되어 세포에서 침묵 활성을 갖는 RNA 분자의 특이성을 변형시킨다.
본 명세서에서 사용된, "침묵 특이성을 재유도한다(redirects a silencing specificity)"는 용어는 RNA 침묵 분자의 비-자연 표적으로 RNA 침묵 분자의 원래(original) 특이성을 재프로그래밍하는 것(또한 본명세서에서 침묵 활성의 "재유도(redirection)"를 의미함)을 의미한다. 따라서, RNA 침묵 분자의 원래 특이성은 파괴되고(즉, 기능 상실) 새로운 특이성은 자연 표적(즉, 관심 RNA)과 구별되는 표적 RNA, 즉, 기능의 획득에 대한 것이다.
본 명세서에서 사용된, "제 1 표적 RNA(first target RNA)"이라는 용어는 RNA 침묵 분자에 의해 자연적으로 결합된 RNA 서열을 의미한다. 따라서, 제 1 표적 RNA는 RNA 침묵 분자에 대한 기질(예를 들어, 그 RNA 침묵 분자에 의해 침묵되어지는 것)로서 당업자에 의해 고려된다.
일부 구현예에 따르면, RNAi-유사 분자(예, miRNA-유사 분자)를 언급할 때, 제 1 표적 RNA는 RNAi-유사 분자에 의해 표적이되었을 RNA 서열이 이러한 RNAi-유사 분자의 정형적인(canonical) 상동체와 같이 가공되었음을 의미한다(예를 들어, 제 1 표적 RNA는 miRNA-유사 분자의 성숙 miRNA이었을 서열에 상응하는 RNA 서열이다).
본 명세서에서 사용된, "관심 표적 RNA(target RNA of interest)"라는 용어는 설계된 RNA 침묵 분자에 의해 침묵될 RNA 서열(암호화 또는 비암호화)를 의미한다.
본 명세서에 사용된, "표적 유전자를 침묵시키는(silencing a target gene)"이라는 문구는 표적 유전자로부터 단백질 및/또는 mRNA 산물의 수준에서 부재 또는 관찰 가능한 감소를 의미한다. 따라서, 표적 유전자의 침묵은 본 발명의 설계된 RNA 침묵 분자에 의해 표적화되지 않은 표적 유전자와 비교하여 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % 또는 100 % 일 수 있다.
한 구현예에 따르면, 미리 정해진 서열 상동성 범위를 나타내는 비정상적으로 가공된 RNA 분자를 암호화하는 전사가능한 핵산 서열의 핵산 서열을 변형시키는 것은 RISC와 결합되고 관심 표적 RNA와 상보적인 작은 RNA에 가공성을 부여한다.
한 구현예에 따르면, 전사가능한 핵산 서열의 핵산 서열을 변형시키는 것은 비정상적으로 가공된 RNA 분자의 구조를 부여하고, 이는 RNA 분자를 RISC와 결합되고 관심 RNA를 표적화하는 작은 RNA로 가공되게 한다.
침묵의 결과는 진핵 세포 또는 유기체(예, 식물 세포 또는 전체 식물)의 외적 특성을 조사하거나, 또는 생화학적 기술(하기 논의됨)에 의해 확인할 수 있다.
본 발명의 일부 구현예의 설계된 RNA 침묵 분자는 진핵 세포 또는 유기체의 생장(growth), 분화(differentiation) 또는 기능(function)에 영향을 미치지 않는다면, 예를 들어 식물의 농업적으로 가치있는 특성(예, 생물량(biomass), 수확량(yield) 생장 등)에 영향을 미치지 않는다면, 일부 표적 외(off-target) 특이성 효과(들)을 가질 수 있음이 이해될 것이다.
한 구현예에 따르면, 관심 표적 RNA는 진핵 세포에 대해 내인성이다.
동물 세포(예, 포유동물 세포)에서 예시적인 내인성의 관심 표적 RNA는 암 및/또는 세포자연사(apoptosis)와 관련된 유전자를 포함하지만 이에 제한되지는 않는다. 암과 관련된 예시적인 표적 유전자는 하기 본명세서에서 자세히 설명되는 p53, BAX, PUMA, NOXA 및 FAS 유전자를 포함하지만 이에 제한되지는 않는다.
식물 세포에서 예시적인 내인성의 관심 표적 RNA는 하기 본명세서에서 더 논의되는, 스트레스, 감염, 제초제에 대한 감수성을 부여하는 유전자의 산물, 또는 식물 생장률, 작물 수확량과 관련된 유전자의 산물을 포함하지만 이에 제한되지는 않는다.
한 구현예에 따르면, 관심 표적 RNA는 진핵 세포, 예를 들어 식물 세포에 대해 외인성이다(또한 본 명세서에서 이종성으로 지칭됨). 이러한 경우, 관심 표적 RNA는 자연적으로 진핵 세포 지놈(예, 식물 지놈)의 일부가 아닌 유전자의 산물이다.
동물 세포(예, 포유동물 세포)에서 예시적인 외인성의 표적 RNA는 하기 본명세서에서 더 논의되는, 병원체(예, 곤충, 바이러스, 박테리아, 진균, 선충)의 유전자와 같은, 감염성 질병과 관련된 유전자의 산물을 포함하지만 이에 제한되지는 않는다.
식물 세포의 예시적인 외인성의 표적 RNA 는 하기 본명세서에서 더 논의되는, 곤충, 박테리아, 진균(fungi), 선충과 같은 식물 병원체의 유전자의 산물을 포함하지만 이에 제한되지는 않는다.
외인성의 표적 RNA(암호화 또는 비-암호화)는 진핵 유기체(예, 식물)의 내인성의 RNA 서열(예를 들어, 내인성의 핵산 서열과 부분적으로 상동일 수 있음)과 서열 동일성을 공유하는 핵산 서열을 포함할 수 있다.
표적 RNA와 RNA 침묵 분자의 특이적 결합은 컴퓨터 알고리즘(블라스트(BLAST)와 같은)에 의해 결정될 수 있고, 예를 들어 노던 블랏(Northern blot), 가시적분자결합화(In Situ hybridization), QuantiGene 플렉스 검사(QuantiGene Plex Assay) 등을 포함하는 방법에 의해 검증될 수 있다.
"상보성(complementarity)" 또는 "상보적(complementrary)"이라는 용어의 사용은 RNA 침묵 분자(또는 가공된 작은 RNA형태로 존재하는 그것의 적어도 일부, 또는 이중-가닥 폴리뉴클레오타이드의 적어도 하나의 가닥 또는 이의 일부, 또는 단일 가닥 폴리뉴클레오타이드의 일부)가 생리학적 조건 하에 표적 RNA, 또는 그것의 단편에 혼성화하여 표적 유전자의 조절 또는 기능 또는 억제에 영향을 미치는 것을 의미한다. 예를 들어, 일부 구현예에서, RNA 침묵 분자는 표적 RNA(또는 주어진 표적 유전자의 패밀리 구성원)에서 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 70, 80, 90, 100, 150, 200, 300, 400, 500 또는 그 이상의 연속 뉴클레오타이드와 비교하여, 100% 서열 동일성 또는 적어도 약 30, 40, 45, 50, 55, 60, 65, 70, 75, 80, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 서열 동일성을 가진다.
본 명세서에서 사용된, RNA 침묵 분자, 또는 그것의 가공된 작은 RNA 형태는 서열 중 5'에서 3'으로 판독되는 서열 중 하나의 모든 뉴클레오타이드가 3'에서 5'으로 판독될 때의 다른 서열의 모든 뉴클레오타이드와 상보적인 경우, "완전한 상보성"나타낸다고 한다. 참고 뉴클레오타이드 서열과 완전히 상보적인 뉴클레오타이드 서열은 참조 뉴클레오타이드 서열의 역보체(reverse complement) 서열과 동일한 서열을 나타낼 것이다.
서열 상보성을 결정하는 방법은 당업계에 잘 알려져 있으며 당업계에 잘 알려진 생물정보학 도구(tool)(예를 들어, 블라스트(BLAST), 다중 서열 정렬(multiple sequence alignment))를 포함하지만 이제 제한되지는 않는다.
한 구현예에 따르면, RNA 침묵 분자는 siRNA이거나 또는 siRNA로 가공된 경우, 상보성은 그것의 표적 서열에 대해 90 내지 100%(예를 들어, 100%)의 범위에 있다.
한 구현예에 따르면, , RNA 침묵 분자는 miRNA또는 piRNA이거나 또는 miRNA또는 piRNA로 가공된 경우, 상보성은 그것의 표적 서열에 대해 33 내지 100%의 범위에 있다.
한 구현예에 따르면, RNA 침묵 분자가 miRNA인 경우, 종자 서열(seed sequence) 상보성(즉, 5'으로부터 뉴클레오타이드 2 내지 8)은 그것의 표적 서열에 대해 85 내지 100%(예를 들어, 100%)의 범위에 있다.
한 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA의 서열에 대해 적어도 약 33 %, 40 %, 45 %, 50 %, 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % 또는 심지어100 %의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 33%의 상보성(예를 들어, 85 내지 100%의 종자 일치)을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 40%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 50%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 60%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 70%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 80%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 90%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 95%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 96%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 97%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 98%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 99%의 상보성을 포함하도록 설계된다.
특정 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 대해 최소 100%의 상보성을 포함하도록 설계된다.
상기 명시된 DNA 편집제 중 임의의 것은 침묵 활성을 갖는 RNA 분자의 특이성을 변형시키는 데 사용될 수 있다.
한 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 약 50 내지 100% 상보성을 포함하도록 가이드 가닥(침묵 가닥)에서 변형된다.
한 구현예에 따르면, RNA 침묵 분자는 관심 표적 RNA에 약 50 내지 100% 상보성을 포함하도록 패신저(passenger) 가닥(상보적 가닥)에서 변형된다.
한 구현예에 따르면, RNA 침묵 분자는 종자 서열(예를 들어 5' 말단으로부터 miRNA 뉴클레오타이드 2 내지 8에 대해)이 표적 서열에 상보적이도록 변형된다.
한 구현예에 따르면, 작은 RNA로 가공성을 부여하기 위해 핵산 서열을 변형시키는 것은 RNA 침묵 분자의 특이성을 변형시키기 전에 수행된다.
한 구현예에 따르면, 작은 RNA로 가공성을 부여하기 위해 핵산 서열을 변형시키는 것은 RNA 침묵 분자의 특이성을 변형시키는 것과 동시에 수행된다.
한 구현예에 따르면, RNA 침묵 분자의 특이성을 변형시키는 것은 가공성을 손상시키지 않으면서 수행된다.
따라서, RNA 침묵 분자가 비-필수 구조(즉, 적절한 생합성 및/또는 기능에 역할을 하지 않는 RNA 침묵 분자의 2차 구조)를 포함하거나 순수하게 dsRNA(즉, 완전하거나 거의 완전한 dsRNA를 갖는 RNA 침묵 분자)일 때, 가공성을 부여하고 RNA 침묵 분자의 특이성을 선택적으로 변형시키기 위하여 몇 가지 변형(예를 들어 20 내지 30개의 뉴클레오타이드, 예를 들어 1 내지 10개의 뉴클레오타이드, 예를 들어 5개의 뉴클레오타이드)이 도입된다.
또 다른 구현예에 따르면, RNA 침묵 분자가 필수 구조(즉, RNA 침묵 분자의 적절한 생합성 및/또는 활성이 2차 구조에 의존적임)를 가질 때, 가공성을 부여하고 RNA 침묵 분자의 특이성을 선택적으로 변형시키기 위하여 더 큰 변형(예를 들어, 1 내지 500개의 뉴클레오타이드, 10 내지 250개의 뉴클레오타이드, 50 내지 150개의 뉴클레오타이드, 30개를 초과하고 200개를 넘지 않는 뉴클레오타이드, 30 내지 200개의 뉴클레오타이드, 35 내지 200개의 뉴클레오타이드, 35 내지 150개의 뉴클레오타이드, 35 내지 100개의 뉴클레오타이드)이 도입된다.
한 구현예에 따르면, RNA 침묵 분자를 암호화하는 유전자는 내인성의 RNA 침묵 분자(예, miRNA)의 서열을 선택된 RNA 침묵 서열(예, siRNA)로 교체함으로써 변형된다.
한 구현예에 따르면, miRNA 전구체(pri/pre-miRNA) 또는 siRNA 전구체(dsRNA)와 같은, RNA 침묵 분자의 가이드 가닥은 구조의 독창성(originality)을 보존하고 동일한 염기 쌍 형성 프로파일(base pairing profile)을 유지하도록 변형된다.
한 구현예에 따르면, miRNA 전구체 또는 siRNA 전구체와 같은, RNA 침묵 분자의 패신저 가닥은 구조의 독창성을 보존하고 동일한 염기 쌍 형성 프로파일을 유지하도록 변형된다.
추가 돌연변이는 편집의 추가 이벤트(즉, 동시에 또는 순차적으로)에 의해 도입될 수 있음이 이해될 것이다.
본 발명의 DNA 편집제는 DNA 전달 방법(예, 발현 벡터에 의해)을 사용하거나 또는 DNA가 없는(DNA-free) 방법을 사용하여 세포(예, 진핵 세포)내로 도입될 수 있다.
한 구현예에 따르면, sgRNA(또는 사용되는 DNA 편집 시스템에 따라 사용되는 임의의 다른 DNA 인식 모듈)은 RNA로서 세포에 제공될 수 있다.
따라서, 본 기술은 RNA 형질주입(transfection)(예, mRNA+sgRNA 형질주입), 또는 리보핵단백질(ribonucleoprotein, RNP) 형질주입(예, 단밸직-RNA복합체 형질주입, 예 Cas9/gRNA 리보핵단백질(RNP) 복합체 형질주입)과 같은 일시적인 DNA 또는 DNA가 없는 방법을 사용하여 DNA 편집제를 도입하는 것에 관한 것으로 이해될 것이다.
예를 들어, Cas9은 DNA 발현 플라스미드, 시험관 내(in vitro) 전사체(즉, RNA), 또는 리보핵단백질 입자(RNP)의 RNA 부분에 결합된 재조합 단백질로서 도입될 수 있다. 예를 들어, sgRNA는 DNA 플리스미드 또는 시험관 내(in vitro) 전사체(즉, RNA)로 전달될 수 있다.
RNA 또는 RNP 형질주입에 대한 당업계에 공지된 임의의 방법, 예를 들어 미세주입법(microinjection)[Cho 외에 의해 서술된 "Heritable gene knockout in Caenorhabditis elegans by direct injection of Cas9-sgRNA ribonucleoproteins," Genetics (2013) 195:1177-1180, 참고로 본 명세서에 포함됨], 전기천공법(electroporation) [Kim 외에 의해 서술된 "Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins" Genome Res. (2014) 24:1012-1019, 참고로 본 명세서에 포함됨], 또는 예를 들어 리포좀(liposome)을 사용하는 지질-매개 형질주입(lipid-mediated transfection) [Zuris 외에 의해 기재된 "Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo" Nat Biotechnol. (2014) doi: 10.1038/nbt.3081, 참고로 본 명세서에 포함됨]과 같은 방법이 본 발명의 교시에 따라 사용될 수 있으나, 이에 제한되지는 않는다. RNA 형질주입의 추가 방법은 미국 특허 출원 번호 20160289675에 기술되어 있으며, 그 전문은 본 명세서에 참고로 포함된다.
본 발명의 RNA 형질주입 방법의 한 가지 이점은 RNA 형질주입이 본질적으로 일시적이고 벡터가 없다는 것이다. RNA 이식유전자(transgene)은 임의의 추가적인 서열(예, 바이러스 서열)에 대한 필요없이 최소 발현 벡터로서 세포에 전달되고 세포 내에서 발현될 수 있다.
한 구현예에 따르면, 세포에서 본 발명의 외인성 DNA 편집제의 발현을 위해, DNA 편집제를 암호화하는 폴리뉴클레오타이드 서열은 세포 발현에 적합한 핵산 컨스트럭트(construct)에 결찰된다(ligated). 이러한 핵산 컨스트럭트는 구성적 또는 유도적 방식으로 세포에서 폴리뉴클레오타이드 서열의 전사를 유도하기 위한 포로모터 서열을 포함한다.
본 발명의 일부 구현예의 핵산 컨스트럭트(또한 본 명세서에서 "발현 벡터'로도 지칭됨)는 이 벡터를 진핵생물에서 복제 및 통합(integration)에 적합하게 만드는(예, 셔틀 벡터) 추가 서열을 포함한다. 또한, 전형적인 클로닝 벡터는 전사 및 번역 개시 서열, 전사 및 번역 종결자 및 폴리아데닐화(polyadenylation) 신호를 포함할 수 있다. 예를 들어, 이러한 컨스트럭트는 일반적으로 a 5' LTR, a tRNA 결합 부위, 패키징 신호, 제 2-가닥 DNA 합성의 기원, 및 3' LTR 또는 그것의 일부를 포함할 것이다.
진핵생물 프로모터는 일반적으로 TATA 박스 및 상류의(upstream) 프로모터 요소(element)의 두 가지 유형의 인식 서열을 포함한다. 전사 개시 부위의 상류에 있는 25 내지 30개의 염기쌍에 위치한 TATA 박스는 RNA 중합효소가 RNA 합성을 시작하도록 지시하는데 관여하는 것으로 생각된다. 다른 상류의 프로모터 요소는 전사가 개시되는 속도를 결정한다.
바람직하게, 본 발명의 일부 구현예의 핵산 컨스트럭트에 의해 이용되는 프로모터는 형질전환된 특정 세포 집단에서 활성이다. 세포 유형-특이적 및/또는 조직-특이적 프로모터의 예는 간 특이적[Pinkert 외, (1987) Genes Dev. 1:268-277]인 알부민(albumin)과 같은 프로모터, 림프구(lymphoid) 특이적 프로모터[Calame 외, (1988) Adv. Immunol. 43:235-275]; 특히 T-세포 수용체의 프로모터[Winoto 외, (1989) EMBO J. 8:729-733] 및 면역글로블린(immunoglobulin); [Banerji 외. (1983) Cell 33729-740], 뉴로필라멘트(neurofilament) 프로모터와 같은 뉴런-특이적 프로모터[Byrne 외. (1989) Proc. Natl. Acad. Sci. USA 86:5473-5477], 췌장(pancreas)-특이적 프로모터[Edlunch 외. (1985) Science 230:912-916] 또는 유장(milk whey) 프로모터와 같은 유선 특이적(mammary gland-specific)프로모터 (미국 특허출원 번호 4,873,316 및 유럽 특허 출원 번호 264,166)를 포함한다.
식물 세포에서 발현의 위해, 사용된 식물 프로모터는 항시적인(constitutive) 프로모터, 조직 특이적 프로모터, 유도성 프로모터, 키메라(chimeric) 프로모터 또는 발달적으로 조절되는 프로모터일 수 있다.
(식물 세포에서) 본 발명의 일부 구현예의 방법에 유용한 바람직한 프로모터의 예는 표 I, II, III 및 IV에 제시되어 있다.
표I: 식물 세포에서 본 발명의 일부 구현예의 수행에 사용하기 위한 예시적인 항구적인(constitutive) 프로모터
유전자 출처 발현 양상 참고문헌
Actin 항구적인(constitutive) McElroy et al, Plant Cell, 2: 163-171, 1990
CAMV 35S 항구적인 Odell et al, Nature, 313: 810-812, 1985
CaMV 19S 항구적인 Nilsson 외, Physiol. Plant 100:456-462, 1997
GOS2 항구적인 de Pater et al, Plant J Nov;2(6):837-44, 1992
ubiquitin 항구적인 Christensen et al, Plant Mol. Biol. 18: 675-689, 1992
Rice cyclophilin 항구적인 Bucholz et al, Plant Mol Biol. 25(5):837-43, 1994
Maize H3 histone 항구적인 Lepetit et al, Mol. Gen. Genet. 231: 276-285, 1992
Actin 2 항구적인 An et al, Plant J. 10(1);107121, 1996
CVMV (Cassava Vein Mosaic Virus 항구적인 Lawrenson et al, Gen Biol 16:258, 2015
U6 (AtU626; TaU6) 항구적인 Lawrenson et al, Gen Biol 16:258, 2015
표 II: 식물 세포에서 본 발명의 일부 구현예의 수행에 사용하기 위한 예시적인 종자-바람직한 프로모터
유전자 출처 발현 양상 참고문헌
Seed specific genes 종자 Simon, 외, Plant Mol. Biol. 5. 191,
1985;
Scofield,
외, J. Biol. Chem. 262: 12202,
1987; Baszczynski, 외, Plant Mol. Biol.
14: 633, 1990.
Brazil Nut albumin 종자 Pearson' 외, Plant Mol. Biol. 18: 235- 245, 1992.
Legumin 종자 Ellis, 외Plant Mol. Biol. 10: 203-214, 1988
Glutelin (rice) 종자 Takaiwa, 외, Mol. Gen. Genet. 208: 15-22, 1986; Takaiwa, 외, FEBS Letts. 221:
43-47, 1987
Zein 종자 Matzke et al Plant Mol Biol, 143).323-32 1990
napA 종자 Stalberg, et al, Planta 199: 515-519, 1996
wheat LMW and HMW, glutenin-1 내배유(endosperm) Mol Gen Genet 216:81-90, 1989; NAR 17:
461-2,
Wheat SPA 종자 Albanietal, Plant Cell, 9: 171- 184, 1997
wheat a, b and g gliadins 내배유 EMBO3:1409-15, 1984
Barley ltrl promoter 내배유
barley B1, C, D hordein 내배유 Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-
60, 1996
Barley DOF 내배유 Mena et al, The Plant Journal, 116(1): 53- 62, 1998
Biz2 내배유 EP99106056.7
Synthetic promoter 내배유 Vicente-Carbajosa 외, Plant J. 13: 629-640, 1998
 rice prolamin NRP33 내배유 Wu et al, Plant Cell Physiology 39(8) 885- 889, 1998
rice -globulin Glb-1 내배유 Wu et al, Plant Cell Physiology 398) 885-889, 1998
rice OSH1 배아(embryo) Sato et al, Proc. Nati. Acad. Sci. USA, 93: 8117-8122
rice alpha-globulin
REB/OHP-1
내배유 Nakase 외 Plant Mol. Biol. 33: 513-S22,
1997
rice ADP-glucose PP 내배유 Trans Res 6:157-68, 1997
maize ESR gene family 내배유 Plant J 12:235-46, 1997
sorgum gamma- kafirin 내배유 PMB 32:1029-35, 1996
KNOX 배아 Postma-Haarsma ef al, Plant Mol. Biol. 39:257-71, 1999
rice oleosin 배아 및 알루톤(aleuton) Wu et at, J. Biochem., 123:386, 1998
sunflower oleosin  종자 (배아 및 건조 종자) Cummins, 외, Plant Mol. Biol. 19: 873-
876, 1992
표III 식물세포에서 본 발명의 수행에 사용하기 위한 예시적인 꽃-특이적 프로모터
유전자 출처 발현 양상 참고문헌
AtPRP4 www(dot)salus(dot)
medium(dot)edu/m mg/inaliz/html
chalene synthase (chsA) Van der Meer, 외, Plant Mol. Biol.
15: 95-109, 1990.
LAT52 꽃밥(anther) Twell et al Mol. Gen Genet. 217:240-
245 (1989)
apetala- 3
표 IV 식물 세포에서 본 발명의 수행에 사용하기 위한 대안적인 벼 프로모터
PRO # 유전자 발현
PR00001 Metallothionein Mte 배아 + 캘러스의 전이층
PR00005 putative beta-amylase 배아의 전이층
PR00009 Putative cellulose synthase 뿌리에서 약함
PR00012 lipase (putative)
PR00014 Transferase (putative)
PR00016 peptidyl prolyl cis-trans isomerase (putative)
PR00019 unknown
PR00020 prp protein (putative)
PR00029 noduline (putative)
PR00058 Proteinase inhibitor Rgpi9 종자
PR00061 beta expansine EXPB9 어린꽃에서 약함
PR00063 Structural protein 어린조직+캘러스+배아
PR00069 xylosidase (putative)
PR00075 Prolamine 10Kda 내배유에 저장
PR00076 allergen RA2 내배유에 저장
PR00077 prolamine RP7 내배유에 저장
PR00078 CBP80
PR00079 starch branching enzyme I
PR00080 Metallothioneine-like ML2 배아 + 캘러스의 전이층
PR00081 putative caffeoyl- CoA 3-0 methyltransferase 정단부(shoot)
PR00087 prolamine RM9 내배유에 저장
PR00090 prolamine RP6 내배유에 저장
PR00091 prolamine RP5 내배유에 저장
PR00092 allergen RA5
PR00095 putative methionine aminopeptidase 배아
PR00098 ras-related GTP binding protein
PR00104 beta expansine EXPB1
PR00105 Glycine rich protein
PR00108 metallothionein like protein (putative)
PR00110 RCc3 strong root
PR00111 uclacyanin 3-like protein 약한 차이중앙부 / 정단부 분열조직
PR00116 26S proteasome regulatory particle non-ATPase subunit 11 매우 약한 분열조직 특이적
PR00117 putative 40S ribosomal protein 내배유에서 약함
PR00122 chlorophyll a/lo-binding protein precursor (Cab27) 정단부에서 매우 약함
PR00123 putative protochlorophyllide reductase 강한 잎
PR00126 metallothionein RiCMT 강한 차이중앙부 정단부 분열조직
PR00129 GOS2 강한 항구적인
PR00131 GOS9
PR00133 chitinase Cht-3 매우 약한 분열조직 특이적
PR00135 alpha- globulin 내배유에서 강한
PR00136 alanine aminotransferase 내배유에서 약함
PR00138 Cyclin A2
PR00139 Cyclin D2
PR00140 Cyclin D3
PR00141 Cyclophyllin 2 정단부 및 종자
PR00146 sucrose synthase SS1 (barley) 중간의 항구적인
PR00147 trypsin inhibitor ITR1 (barley) 내배유에서 약함
PR00149 ubiquitine 2 with intron 강한 항구적인
PR00151 WSI18 배아 및 스트레스
PR00156 HVA22 homologue (putative)
PR00157 EL2
PR00169 aquaporine 어린 식물에서 중간의 항구적인
PR00170 High mobility group protein 강한 항구적인
PR00171 reversibly glycosylated protein RGP1 약한 항구적인
PR00173 cytosolic MDH 정단부
PR00175 RAB21 배아 및 스트레스
PR00176 CDPK7
PR00177 Cdc2-1 분열조직에서 매우 약함
PR00197 sucrose synthase 3
PRO0198 OsVP1
PRO0200 OSH1 어린 식물 분열조직에서매우 약함
PRO0208 putative chlorophyllase
PRO0210 OsNRT1
PRO0211 EXP3
PRO0216 phosphate transporter OjPT1
PRO0218 oleosin 18kd 호분(aleurone) + 배아
PRO0219 ubiquitine 2 without intron
PRO0220 RFL
PRO0221 maize UBI delta intron not detected
PRO0223 glutelin-1
PRO0224 fragment of prolamin RP6 promoter
PRO0225 4xABRE
PRO0226 glutelin OSGLUA3
PRO0227 BLZ-2_short (barley)
PR00228 BLZ-2_long (barley)
유도성 프로모터는 특정 식물 조직에서 발달 단계에 의해 또는 예를 들어, 빛, 온도, 화학물질, 가뭄, 높은 염도, 삼투압 충격, 산화제 조건 또는 병원성(pathogenicity)의 경우를 포함하는 스트레스 조건과 같은 특정 자극에 의해 유도되는 프로모터이고, 완두콩 rbcS 유전자에서 유래한 광-유도성 프로모터, 알팔파 rbcS 유전자에서 유래한 프로모터, 가뭄에 활성인 DRE, MYC 및 MYB 프로모터; 높은 염도 및 삼투압 스트레스에서 활성인 프로모터 INT, INPS, prxEa, Ha hsp17.7G4 및 RD21, 및 병원성 스트레스에서 활성인 프로모터 hsr203J 및 str246C를 포함하나 이에 제한되지는 않는다.
한 구현예에 따르면, 프로모터는 병원체-유도성 프로모터이다. 이들 프로모터는 박테리아, 진균(fungi), 바이러스, 선충 또는 곤충과 같은 병원체에 감염된 후 식물에서 유전자 발현을 유도한다. 이러한 프로모터는 병원체에 의한 감염 후에 유도되는 병인-관련 단백질(pathogenesis-related protein, PR protein)으로부터의 프로모터를 포함한다; 예를 들어, PR 단백질, SAR 단백질, 베타-1,3-클루카나아제, 키티나아제 등이다. 예를 들어, Redolfi 외. (1983) Neth. J. Plant Pathol 89:245-254; Uknes 외. (1992) Plant Cell 4:645-656; 및 Van Loon (1985) Plant Mol. Virol. 4:111-116을 참고.
한 구현예에 따르면, 하나 이상의 프로모터가 발현 벡터에 사용되는 경우, 프로모터는 동일하다(예를 들어, 모두 동일, 적어도 두 개는 동일함).
한 구현예에 따르면, 하나 이상의 프로모터가 발현 벡터에서 사용되는 경우, 프로모터는 상이하다(예를 들어, 적어도 두 개는 상이하고, 모두 상이함).
한 구현예에 따르면, 식물 세포에서 발현을 위한 발현 벡터의 프로모터는 CaMV 35S, 2x CaMV 35S, CaMV 19S, ubiquitin, AtU626 또는 TaU6를 포함하나 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물 세포에서 발현을 위한 발현 벡터의 프로모터는 35S프로모터를 포함한다.
특정 구현예에 따르면, 식물 세포에서 발현을 위한 발현 벡터의 프로모터는 U6 프로모터를 포함한다.
인핸서 요소는 연결된 동종의 또는 이종의 프로모터로부터 최대 1,000배까지 전사를 자극할 수 있다. 인핸서는 전사 개시 부위의 하류의(downstream) 또는 상류의(upstream)에 배치될 때 활성화된다. 바이러스에서 유래된 많은 인핸서 요소는 광범위한 숙주 범위를 갖고 다양한 조직에서 활성이다. 예를 들어, SV40 초기 유전자 인핸서는 많은 세포 유형에 적합하다. 본 발명의 일부 구현예에 적합한 다른 인핸서/프로모터 조합은 폴리오마 바이러스(polyoma virus), 인간 또는 쥐 사이토메갈로바이러스(murine cytomegalovirus, CMV),쥐 백혈병 바이러스(murine leukemia virus), 쥐 또는 라우스 육종 바이러스(Rous sarcoma virus) 및 HIV와 같은 다양한 레트로바이러스(retrovirus)로부터의 장기 반복체(long term repeat)로부터 유래된 것을 포함한다. Enhancers and Eukaryotic Expression, Cold Spring Harbor Press, Cold Spring Harbor, N.Y. 1983을 참조하고 이는 본 명세서에 참고로 포함된다.
발현 벡터의 제작(construction)에서, 프로모터는 바람직하게 자연적인 조건(natural setting)에서의 전사 시작 부위로부터와 같이 이종의 전사 시작 부위로부터 대략 동일한 거리에 위치된다. 그러나, 당업계에 공지된 바와 같이, 이 거리의 일부 변화는 프로모터 기능의 손실 없이 수용될 수 있다.
폴리아데닐화(polyadenylation) 서열은 또한 mRNA 번역의 효율을 증가시키기 위해 발현 벡터에 추가될 수 있다. 정확하고 효율적인 폴리아데닐화를 위해서는 두 개의 별개의 서열 요소가 피요하다: 폴리아데닐화 부위로부터 상류에 위치한 GU 또는 U가 많은 서열 및 11개 내지 30개의 뉴클레오타이드 상류에 위치한 6개의 뉴클레오타이드(AAUAAA)의 매우 보존된 서열. 본 발명의 일부 구현예에 적합한 종결 및 폴리아데닐화 신호는 SV40으로부터 유도된 것을 포함한다.
특정 구현예에 따르면, 식물 세포에서 발현을 위한 발현 벡터는 G7 종결 서열, AtuNos 종결 서열 또는 CaMV-35S 종결 서열과 같은 종결 서열을 포함하나 이에 제한되지는 않는다.
이미 기재된 요소 이외에, 본 발명의 일부 구현예의 발현 벡터는 일반적으로 클로닝된 핵산의 발현 수준을 증가시키거나 DNA를 보유하는 세포의 식별을 용이하게 하도록 의도된 다른 특수화된 요소를 포함할 수 있다. 예를 들어, 많은 동물 바이러스는 허용 세포 유형에서 바이러스 지놈의 추가 염색체 복제를 촉진하는 DNA 서열이 포함된다. 이러한 바이러스 복제물을 포함하는 플라스미드는 적절한 인자가 플라스미드에 또는 숙주 세포의 지놈과 함께 운반되는 유전자에 의해 제공되는 한, 에피솜으로 복제된다(replicated episomally).
벡터는 진핵 생물 레플리콘(replicon)을 포함하거나 포함하지 않을 수 있다. 진핵 생물 레플리콘이 존재하는 경우, 적절한 선택 마커를 사용하여 진핵 생물 세포에서 벡터를 증폭할 수 있다. 벡터가 진핵 생물의 레플리콘을 포함하지 않는 경우, 에피솜 증폭이 불가능하다. 대신에, 재조합 DNA는 프로모터가 목적하는 핵산의 발현을 유도하는 조작된 세포의 지놈에 통합된다.
본 발명의 일부 구현예의 발현 벡터는, 예를 들어 내부 리보솜 진입 부위(internal ribosome entry site, IRES)과 같은 단일 mRNA로부터 여러 단백질의 번역 및 프로모터-키메라 폴리펩타이드(promoter-chimeric polypeptide)의 지놈 통합을 위한 서열을 허용하는 추가 폴리뉴클레오타이드 서열을 추가로 포함할 수 있다.
발현 벡터에 포함된 개별 요소는 다양한 구성으로 배열될 수 있음이 이해될 것이다. 예를 들어, 인핸서 요소, 프로모터 및 DNA 편집제를 암호화하는 폴리뉴클레오타이드 서열(들)조차도 "머리에서 꼬리까지(head-to-tail)" 구성으로 배열될 수 있고, 역보체로서 또는 상보적 구성에서 역평행 가닥으로 존재할 수 있다. 이러한 다양한 구성은 발현 벡터의 비-암호화 요소와 함께 발생할 가능성이 더 높지만, 발현 벡터 내의 암호화 서열의 대안적 구성도 또한 구상된다.
포유 동물 발현 벡터의 예는 Invitrogen에서 이용할 수 있는 pcDNA3, pcDNA3.1(+/-), pGL3, pZeoSV2(+/-), pSecTag2, pDisplay, pEF/myc/cyto, pCMV/myc/cyto, pCR3.1, pSinRep5, DH26S, DHBB, pNMT1, pNMT41, pNMT81, Pomega에서 이용할 수 있는 pCI, stratagene에서 이용할 수 있는 pMbac, pPbac, pBK-RSV 및 pBK-CMV, Clontech에서 이용할 수 있는 pTRES, 및 이들의 유도체(derivatives)을 포함하나 이에 제한되지는 않는다.
또한, 레트로바이러스와 같은 진핵 바이러스의 조절 요소를 함유하는 발현 벡터가 사용될 수 있다. SV40 벡터는 pSVT7 및 pMT2를 포함한다. 소 유두종 바이러스(bovine papilloma virus) 유래 벡터는 pBV-1MTHA를 포함하고, 및 엡스타인 바 바이러스(Epstein Bar virus) 유래 벡터는 pHEBO 및 p205를 포함한다. 기타 예시적인 벡터는 pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, 베큘로바이러스(baculovirus) pDSVE, 및 SV-40 초기 프로모터, SV-40 후기 프로모터, 메탈로티오네인 프로모터(metallothionein promoter), 뮤린 유선 종양 바이러스 프로모터 (murine mammary tumor virus promoter), 라우스 육종 바이러스 프로모터 (Rous sarcoma virus promoter), 75inalized75 프로모터(75inalized75 promoter), 또는 진핵 세포에서의 발현에 효과적인 것으로 보여지는 기타 프로모터의 지시 하에 단백질의 발현을 허용하는 임의의 다른 벡터를 포함한다.
바이러스는 많은 경우에 숙주 방어 기제를 회피하도록 진화된 매우 특화된 감염성 물질이다. 통상적으로, 바이러스는 특정 세포 유형을 감염시키고, 이 세포 유형에서 번식한다. 바이러스 벡터의 표적화 특이성은 자연적 특이성을 이용하여 미리 정해진 세포 유형을 특이적으로 표적화함으로써 재조합 유전자를 감염된 세포에 도입시킨다. 따라서, 본 발명의 일부 구현예에 의해 사용되는 벡터의 유형은 형질전환된 세포 유형에 의존할 것이다. 형질전환된 세포 유형에 따라 적합한 벡터를 선택하는 능력은 통상의 기술자의 능력 내에 있으며 선택 고려 사항에 대한 일반적인 설명은 본 명세서에는 제공되지 않는다. 예를 들어, 골수 세포는 인간 T 세포 백혈병 바이러스(leukemia virus) I 형(HTLV-I)을 사용하여 표적화될 수 있고 신장 세포는 Liang CY 외, 2004 (Arch Virol. 149: 51-60)에 기재된 바큘로바이러스 오토그라파 캘리포니아 뉴클레오폴리헤드로바이러스(baculovirus Autographa californica nucleopolyhedrovirus, AcMNPV)에 존재하는 이종 프로모터를 사용하여 표적화 될 수 있다.
재조합 바이러스 벡터는 측면 감염 및 표적화 특이성과 같은 이점을 제공하기 때문에 DNA 편집제의 생체 내 발현에 유용하다. 측면 감염은 예를 들어 레트로바이러스의 수명 주기에 내재되어 있으며 단일 감염된 세포가 싹을 띄우고 인접한 세포를 감염시키는 많은 자손 비리온을 생성하는 과정이다. 그 결과로 넓은 지역에 빠르게 감염되고, 그것의 0대부분은 원래 바이러스 입자에 의해 초기에 감염되지 않았다. 이는 감염원이 딸 자손을 통해서만 퍼지는 수직형(vertical-type) 감염과 대조된다. 측면으로 퍼질 수 없는 바이러스 벡터도 생성될 수 있다. 이 특성은 원하는 목적이 특정 유전자를 국부화된 수의 표적화된 세포에만 도입하는 것인 경우, 유용할 수 있다.
한 구현예에 따르면, 식물 세포에서 발현을 위한 핵산 컨스트럭트는 이원 벡터(binary vector)이다. 이원 벡터의 예는 pBIN19, pBI101, pBinAR, pGPTV, pCAMBIA, pBIB-HYG, pBecks, pGreen 또는 pPZP (Hajukiewicz, P. 외, Plant Mol. Biol. 25, 989 (1994), 및 Hellens 외, Trends in Plant Science 5, 446 (2000))이다.
식물 세포에서 DNA 전달의 다른 방법(예, 하기에 논의되는 형질주입(transfection), 전기천공(electroporation), 충격(bombardment), 바이러스 접종)에 사용되는 다른 벡터의 예는 다음과 같다: pGE-sgRNA (Zhang 외. Nat. Comms. 2016 7:12697), pJIT163-Ubi-Cas9 (Wang 외. Nat. Biotechnol 2004 32, 947-951), pICH47742::2x35S-5'UTR-hCas9(STOP)-NOST (Belhan 외. Plant Methods 2013 11;9(1):39), pAHC25 (Christensen, A.H. & P.H. Quail, 1996. Ubiquitin promoter-based vectors for high-level expression of selectable and/or screenable marker genes in monocotyledonous plants. Transgenic Research 5: 213-218), pHBT-sGFP(S65T)-NOS (Sheen 외. Protein phosphatase activity is required for light-inducible gene expression in maize, EMBO J. 12 (9), 3497-3505 (1993).
한 구현예에 따르면, 기능적 DNA 편집제를 발현하기 위해, 절단 모듈(뉴클레아제)이 DNA 인식 유닛의 필수적인(integral) 부분이 아닌 경우, 발현 벡터는 DNA 인식 유닛(예, CRISPR/Cas의 경우 sgRNA) 뿐만 아니라 절단 모듈도 암호화할 수 있다.
대안적으로, 절단 모듈(뉴클레아제) 및 DNA 인식 유닛(예, sgRNA)는 별도의 발현 벡터로 클로닝될 수 있다. 이러한 경우, 적어도 2개의 상이한 발현 베터가 동일한 진핵 세포로 형질전환되어야 한다.
대안적으로, 뉴클레아제가 이용되지 않는 경우(즉, 외인성 공급원으로부터 세포로 투여되지 않는 경우), DNA 인식 유닛(예, sgRNA)는 단일 발현 벡터를 사용하여 클로닝되고 발현될 수 있다.
한 구현예에 따르면, DNA 편집제는 진핵 세포에서 활성인 시스-작용 조절 요소(cis-acting regulatory element)(예, 프로모터)에 작동가능하게(operatively) 연결된 적어도 하나의 DNA 인식 유닛을 암호화하는 핵산 제제를 포함한다.
한 구현예에 따르면, 뉴클레아제(예, 엔도뉴클레아제) 및 DNA 인식 유닛(예, sgRNA)는 동일한 발현 벡터로부터 암호화된다. 이러한 벡터는 뉴클레아제 및 DNA 인식 유닛 둘 모두의 발현을 위해 진핵 세포에서 활성인 시스-작용 조절 요소(예, 프로모터)를 포함할 수 있다. 대안적으로, 뉴클레아제 및 DNA 인식 유닛은 각각 진핵 세포에서 활성인 시스-작용 조절 요소(예, 프로모터)에 작동가능하게 연결될 수 있다.
한 구현예에 따르면, 뉴클레아제(예, 엔도뉴클레아제) 및 DNA 인식 유닛(예, sgRNA)는 상이한 발현 벡터로부터 암호화되며, 이에 의해 각각은 진핵 세포에서 활성인 시스-작용 조절 요소(예, 프로모터)에 작동가능하게 연결된다.
한 구현예에 따르면, 본 발명의 일부 구현예의 방법은 세포 공여자 올리고뉴클레오타이드를 도입하는 것을 포함하지 않는다.
한 구현예에 따르면, 본 발명의 일부 구현예의 방법은 세포 공여자 올리고뉴클레오타이드를 도입하는 것을 추가로 포함한다.
한 구현예에 따르면, 변형이 삽입인 경우, 방법은 세포 공여자 올리고뉴클레오타이드를 도입하는 것을 추가로 포함한다.
한 구현예에 따르면, 변형이 결실인 경우, 방법은 세포 공여자 올리고뉴클레오타이드를 도입하는 것을 추가로 포함한다.
한 구현예에 따르면, 변형이 결실 및 삽입(예, 교체(swapping))인 경우, 방법은 세포 공여자 올리고뉴클레오타이드를 도입하는 것을 추가로 포함한다.
한 구현예에 따르면, 변형이 점 돌연변이(point mutation)인 경우, 방법은 세포 공여자 뉴클레오타이드를 도입하는 것을 추가로 포함한다.
본 명세서에서 사용된, "공여자 뉴클레오타이드" 또는 "공여자 올리고"라는 용어는 외인성 뉴클레오타이드, 즉, 지놈에서 정확한 변화를 생성하기 위해 외부적으로 도입된 것으로 의미한다. 한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 합성이다.
한 구현예에 따르면, 공여자 올리고는 RNA 올리고이다.
한 구현예에 따르면, 공여자 올리고는 DNA 올리고이다.
한 구현예에 따르면, 공여자 올리고는 합성 올리고이다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 단일-가닥 공여자 올리고뉴클레오타이드(single-stranded donor oligonucleotide, ssODN)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 이중-가닥 공여자 올리고뉴클레오타이드(double-stranded donor oligonucleotide, dsODN)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 이중-가닥 DNA(dsDNA)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 이중-가닥 DNA-RNA 이중체(DNA-RNA duplex)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 이중-가닥 DNA-RNA 하이브리드를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 단일-가닥 DNA-RNA 하이브리드를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 단일-가닥 DNA(ssDNA)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 이중-가닥 RNA(dsRNA)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 단일-가닥 RNA(ssRNA)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 (상기 논의된 바와 같이) 교체(swapping)을 위한 DNA 또는 RNA 서열을 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 비-발현된 벡터 형식 또는 올리고로 제공된다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 DNA 공여자 플라스미드(예를 들어, 원형 또는 선형화된 플라스미드)를 포함한다.
한 구현예에 따르면, 공여자 올리고뉴클레오타이드는 키메라 DNA-RNA 하이브리드 뿐만 아니라 단일 가닥 또는 이중 가닥 DNA의 약 50 내지 5000개, 약 100 내지 5000개, 약 250 내지 5000개, 약 500 내지 5000개, 약 750 내지 5000개, 약 1000 내지 5000개, 약 1500 내지 5000개, 약 2000 내지 5000개, 약 2500 내지 5000개, 약 3000 내지 5000개, 약 4000 내지 5000개, 약 50 내지 4000개, 약 100 내지 4000개, 약 250 내지 4000개, 약 500 내지 4000개, 약 750 내지 4000개, 약 1000 내지 4000개, 약 1500 내지 4000개, 약 2000 내지 4000개, 약 2500 내지 4000개, 약 3000 내지 4000개, 약 50 내지 3000개, 약 100 내지 3000개, 약 250 내지 3000개, 약 500 내지 3000개, 약 750 내지 3000개, 약 1000 내지 3000개, 약 1500 내지 3000개, 약 2000 내지 3000개, 약 50 내지 2000개, 약 100 내지 2000개, 약 250 내지 2000개, 약 500 내지 2000개, 약 750 내지 2000개, 약 1000 내지 2000개, 약 1500 내지 2000개, 약 50 내지 1000개, 약 100 내지 1000개, 약 250 내지 1000개, 약 500 내지 1000개, 약 750 내지 1000개, 약 50 내지 750개, 약 150 내지 750개, 약 250 내지 750개, 약 500 내지 750개, 약 50 내지 500개, 약 150 내지 500개, 약 200 내지 500개, 약 250 내지 500개, 약 350 내지 500개, 약 50 내지 250개, 약 150 내지 250개, 또는 약 200 내지 250개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, ssODN(예, ssDNA 또는 ssRNA)를 포함하는 공여자 올리고뉴클레오타이드는 약 200 내지 500개의 뉴클레오타이드를 포함한다.
특정 구현예에 따르면, dsODN(예, dsDNA 또는 dsRNA)를 포함하는 공여자 올리고뉴클레오타이드는 약 250 내지 5000개의 뉴클레오타이드를 포함한다.
본 발명의 일부 구현예에 따라 사용될 수 있는 예시적인 공여자 DNA 및 sgRNA는 본 명세서의 하기 표 1A 및 1B에 기재되어 있다.
한 구현예에 따르면, 내인성 RNA 침묵 분자(예, miRNA)와 선택된 RNA 침묵 서열(예, siRNA)의 유전자 교체(swapping)을 위해, ssODN(예, ssDNA 또는 ssRNA) 또는 dsODN(예, dsDNA 또는 dsRNA)는 세포에서 발현될 필요가 없고 비-발현 주형으로 작용할 수 있다. 특정 구현예에 따르면, 이러한 경우에 DNA 편집제(예, Cas9/sgRNA 모듈)은 DNA 형태로 제공된다면 발현될 필요가 없다.
일부 구현예에 따르면, 뉴클레아제의 사용 없이 내인성 RNA 침묵 분자의 유전자 편집을 위해, DNA 편집제(예, gRNA)는 (본 명세서에서 논의된 바와 같이, 예를 들어 올리고뉴클레오타이드 공여자 DNA 또는 RNA)와 함께 또는 없이 진핵 세포 내로 도입될 수 있다.
한 구현예에 따르면, 세포 공여자 올리고뉴클레오타이드를 도입하는 것은 상기 명시된 임의의 방법을 사용하여(예를 들어 발현 벡터 또는 RNP 형질주입을 사용하여) 수행된다.
한 구현예에 따르면, sgRNA 및 DNA 공여자 올리고뉴클레오타이드는 세포(예, 진핵 세포) 내로 공동-도입된다. 임의의 추가 요소(예, 뉴클레아제)가 함께 도입될 수 있음이 이해될 것이다.
한 구현예에 따르면, sgRNA 및 DNA 공여자 올리고뉴클레오타이드는 (예를 들어, 충격(bombardment)를 통해) 식물 세포 내로 공동-도입된다. 임의의 추가 요소(예, 뉴클레아제)가 함께 도입될 수 있음이 이해될 것이다.
한 구현예에 따르면, sgRNA는 DNA 공여자 올리고뉴클레오타이드보다 먼저(예를 들어, 몇 분 또는 몇 시간 내에) 세포 내로 도입된다. 임의의 추가 요소(예, 뉴클레아제)가 sgRNA 또는 DNA 공여자 올리고뉴클레오타이드 이전에, 이와 동시에, 또는 이후에 도입될 수 있음이 이해될 것이다.
한 구현예에 따르면, sgRNA는 DNA 공여자 올리고뉴클레오타이드 다음에(예를 들어 몇 분 또는 몇 시간 내에) 세포 내로 도입된다. 임의의 추가 요소(예, 뉴클레아제)가 sgRNA 또는 DNA 공여자 올리고뉴클레오타이드 이전에, 이와 동시에, 또는 이후에 도입될 수 있음이 이해될 것이다.
한 구현예에 따르면, 지놈 편집을 위한 적어도 하나의 sgRNA 및 DNA 공여자 올리고뉴클레오타이드를 포함하는 조성물이 제공된다.
한 구현예에 따르면, 지놈 편집을 위한 적어도 하나의 sgRNA, 뉴클레아제(예, 엔도뉴클레아제) 및 DNA 공여자 올리고뉴클레오타이드를 포함하는 조성물이 제공된다.
한 구현예에 따르면, 적어도 하나의 sgRNA는 식물 발현가능한 프로모터에서 작동가능하게 연결된다.
본 발명의 일부 구현예의 DNA 편집제 및 선택적으로(optionally) 공여자 올리고는 단일 세포, 세포 그룹(예를 들어, 상기 논의된 바와 같은 식물 세포, 1차 세포(primary cell) 또는 세포주) 또는 유기체(예를 들어, 상기 논의된 바와 같이 식물, 포유동물, 조류(bird), 어류(fish), 및 곤충)에 투여될 수 있다.
다양한 방법을 사용하여 본 발명의 일부 구현예에의 발현 벡터 또는 공여자 올리고를 진핵 세포(예, 줄기세포 또는 식물 세포)내로 도입할 수 있다. 이러한 방법은 일반적으로 Sambrook 외, Molecular Cloning: A Laboratory Manual, Cold Springs Harbor Laboratory, New York (1989, 1992), in Ausubel 외, Current Protocols in Molecular Biology, John Wiley 및 Sons, Baltimore, Md. (1989), Chang 외, Somatic Gene Therapy, CRC Press, Ann Arbor, Mich. (1995), Vega 외, Gene Targeting, CRC Press, Ann Arbor Mich. (1995), Vectors: A Survey of Molecular Cloning Vectors and Their Uses, Butterworths, Boston Mass. (1988) 및 Gilboa 외. [Biotechniques 4 (6): 504-512, 1986]에 기재되어 있고, 예를 들어 안정적 또는 일시적 형질주입, 리포펙션(lipofection), 전기천공(electroporation), 미세주입(microinjection), 미세입자 충격(microparticle bombardment), 재조합 바이러스 벡터와의 감염을 포함한다. 또한, 양성-음성 선택 방법에 대해서, 미국 특허 제5,464,764호 및 제5,487,992호를 참고한다
따라서, 핵산 전달은 예를 들어 비제한적으로 다음을 포함하는 당업자에게 공지된 임의의 방법에 의해 본 발명의 구현예에서 세포 내로 도입될 수 있다: 원형질체의 형질전환(예를 들어 미국 특허 제5,508,184호를 참고); 건조/억제-매개 DNA 흡수(desiccation/inhibition-mediated DNA uptake)(미국 특허 제5,508,184호를 참고); 전기천공법(electroporation)(미국 특허 제5,384,253호를 참고); 탄화규소 섬유와의 교반(agitation with silicon carbide fiber)(미국 특허 제5,302,523호 및 제5,464,765호를 참고); 아그로박테리움-매개 형질전환(미국 특허 제5,563,055호, 제5,591,616호, 제5,693,512호, 제5,824,877호, 제5,981,840호, 및 제6,384,301호를 참고); DNA-코팅된 입자의 가속도(acceleration of DNA-coated particle)(미국 특허 제5,015,580호, 제5,550,318호, 제5,538,880호, 제6,160,208호, 제6,399,861호, 및 제6,403,865호를 참고) 및 DNA, RNA, 펩타이드 및/또는 단백질 또는 핵산 및 펩타이드의 조합을 세포로 전달하는 방법에서 나노입자(nanoparticle), 나노운반체(nanocarrier) 및 세포 투과 펩타이드(cell penetrating peptide)( WO201126644A2; WO2009046384A1; WO2008148223A1)
다른 형질주입 방법에는 형질주입 제제(예, 리포펙틴(lipofectin), Termofisher), 덴드리머(dendrimer)(Kukowska-Latallo, J.F. 외, 1996, Proc. Natl. Acad. Sci. USA93, 4897-902), 세포 투과 펩타이드(M
Figure pct00001
e 외, 2005, Internalisation of cell-penetrating peptides into tobacco protoplasts, Biochimica et Biophysica Acta 1669(2):101-7) 또는 폴리아민(polyamine)(Zhang 및 Vinogradov, 2010, Short biodegradable polyamines for gene delivery and transfection of brain capillary endothelial cells, J Control Release, 143(3):359-366)의 사용을 포함한다.
특정 구현예에 따르면, DNA를 세포(예를 들어, 식물 세포, 예를 들어 원형질체) 내로 도입하기 위한 방법은 폴리에틸렌 글리콜(polyethylene glycol, PEG)-매개 DNA 흡수를 포함한다. 자세한 내용은 Karesch 외. (1991) Plant Cell Rep. 9:575-578; Mathur 외. (1995) Plant Cell Rep. 14:221-226; Negrutiu 외. (1987) Plant Cell Mol. Biol. 8:363-373를 참고.
바이러스 감염에 의한 세포(예, 진핵 세포)에 핵산의 도입은, 바이러스 감염 특성으로 인해 더 높은 형질주입 효율을 얻을 수 있기 때문에, 리포펙션 및 전기천공과 같은 다른 방법에 비해 몇 가지 이점을 제공한다.
현재 바람직한 생체 내(in vivo) 핵산 전달 기술은 아데노바이러스(adenovirus), 렌티바이러스(lentivirus), 헤르페스 심플레스 I 바이러스(Herpes simplex I virus) 또는 아데노 관련 바이러스(adeno-associated virus, AAV) 및 지질 기반 시스템(lipid-based system)과 같은 바이러스 또는 비-바이러스 컨스트럭트(construct)를 사용한 형질주입을 포함한다. 유전자의 지질-매개 전달에 유용한 지질은, 예를 들어, DOTMA, DOPE, 및 DC-Chol [Tonkinson 외, Cancer Investigation, 14(1): 54-65 (1996)]이다. 유전자 요법의 경우, 바람직한 컨스트럭트는 바이러스, 가장 바람직하게는 아데노바이러스, AAV, 렌티바이러스 또는 레트로바이러스이다. 레트로바이러스 컨스트럭트와 같은 바이러스 컨스트럭트는 적어도 하나의 전사 프로모터/인핸서 또는 유전자좌-정의 요소(locus-defining element), 또는 대체 스플라이싱(alternate splicing), 핵의 RNA 방출(nuclear RNA export), 또는 메신저의 번역 후 변형(post-translational modification of messenger)과 같은 다른 수단에 의해 유전자 발현을 제어하는 기타 요소를 포함한다. 이러한 벡터 컨스트럭트는 또한, 바이러스 컨스트럭트에 미리 존재하지 않는 한, 패키징 신호(packaging signal), 긴 말단 반복서열(long terminal repeats, LTRs) 또는 이의 부분, 및 이용된 바이러스에 적합한 양성 및 음성 가닥 프라이머 결합 부위를 포함한다. 또한, 이렇나 컨스트럭트는 일반적으로 그것이 위치하는 숙주 세포로부터 펩타이드의 분비를 위한 신호 서열을 포함한다. 바람직하게 이러한 목적을 위한 신호 서열은 포유동물 신호 서열(mammalian signal sequence) 또는 본 발명의 일부 구현예의 폴리펩타이드 변이체의 신호 서열이다. 선택적으로, 컨스트럭트는 또한 폴리아데닐화(polyadenylation)을 유도하는 신호뿐만 아니라, 하나 이상의 제한 부위 및 번역 종결 서열을 포함할 수 있다. 예를 들어, 이러한 컨스트럭트는 일반적으로 일반적으로 5'LTR, tRNA 결합 부위, 패키징 신호, 제 2가닥 DNA 합성의 기원, 및 3'LTR 또는 그의 일부를 포함할 것이다. 양이온성 지질(cationic lipid), 폴리리신(polylysine), 및 덴드리머(dendrimer)와 같은 비-바이러스성의 다른 벡터가 사용될 수 있다. 삽입된 암호화 서열의 전사 및 번역에 필요한 요소를 함유하는 것 외에, 본 발명의 일부 구현예의 발현 컨스트럭트는 또한 발현된 펩타이드의 안정성, 생산, 정제, 수율 또는 독성을 향상시키도록 조작된 서열을 포함할 수 있다.
특정 구현예에 따르면, 충격(bombardement) 방법은 외래 유전자를 진핵 세포(예를 들어 비-식물 세포, 예를 들어 동물 세포, 예를 들어 포유동물 세포)에 도입하기 위해 사용된다. 한 구현예에 따르면, 방법은 일시적이다. 진핵 세포(예를 들어 포유동물 세포)의 충격은 또한, 참고로 본 명세서에 포함된, Uchida M 외, Biochim Biophys Acta. (2009) 1790(8):754-64에 의해 교시된다.
한 구현예에 따르면, 식물 세포는 본 발명의 일부 구현예의 핵산 컨스트럭트와 함께 안정적으로 또는 일시적으로 형질전환될 수 있다. 안정적인 형질전환에서, 본 발명의 일부 구현예의 핵산 분자는 식물 지놈에 통합되고, 그 자체로 안정하고 유전된 형질을 나타낸다. 일시적인 형질전환에서, 핵산 분자는 형질전환된 세포에 의해 발현되지만 지놈에 통합되지 않으므로 일시적인 형질을 나타낸다.
단자엽(monocotyledonous) 및 쌍자엽(dicotyledonous) 식물 모두에 외래 유전자를 도입하는 다양한 방법이 있다(Potrykus, I., Annu. Rev. Plant. Physiol., Plant. Mol. Biol. (1991) 42:205-225; Shimamoto 외, Nature (1989) 338:274-276).
식물 지놈 DNA에 외인성 DNA를 안정적으로 통합하는 주요 방법에는 두 가지 주요 접근 방식을 포함한다:
(i) 아그로박테리움-매개 유전자 전달: Klee 외. (1987) Annu. Rev. Plant Physiol. 38:467-486; Klee 및 Rogers in Cell Culture and Somatic Cell Genetics of Plants, Vol. 6, Molecular Biology of Plant Nuclear Genes, eds. Schell, J., 및 Vasil, L. K., Academic Publishers, San Diego, Calif. (1989) p. 2-25; Gatenby, in Plant Biotechnology, eds. Kung, S. 및 Arntzen, C. J., Butterworth Publishers, Boston, Mass. (1989) p. 93-112.
(ii) 직접적인DNA 흡수: Paszkowski 외, in Cell Culture and Somatic Cell Genetics of Plants, Vol. 6, Molecular Biology of Plant Nuclear Genes eds. Schell, J., 및 Vasil, L. K., Academic Publishers, San Diego, Calif. (1989) p. 52-68; DNA를 원형질체로 직접 흡수하는 방법 포함, Toriyama, K. 외, (1988) Bio/Technology 6:1072-1074식물 세포의 짧은 전기 충격에 의해 유도된 DNA 흡수: Zhang 외, Plant Cell Rep. (1988) 7:379-384. Fromm 외, Nature (1986) 319:791-793. 입자 충격(bombardment)에 의한 식물 세포 또는 조직으로의 DNA 주입, Klein 외, Bio/Technology (1988) 6:559-563; McCabe 외, Bio/Technology (1988) 6:923-926; Sanford, Physiol. Plant. (1990) 79:206-209; 마이크로피펫(micropipette) 시스템의 사용: Neuhaus 외, Theor. Appl. Genet. (1987) 75:30-36; Neuhaus 및 Spangenberg, Physiol. Plant. (1990) 79:213-217; 세포 배양, 배야 또는 캘러스 조직의 유리섬유(glass fibers) 또는 탄화규소 위스커 변형(silicon carbide whisker transformation), 미국 특허 제5,464,765호 또는 발아 꽃가루와 DNA의 직접 배양에 의해, DeWet 외, in Experimental Manipulation of Ovule Tissue, eds. Chapman, G. P. 및 Mantell, S. H. 및 Daniels, W. Longman, London, (1985) p. 197-209; 및 Ohta, Proc. Natl. Acad. Sci. USA (1986) 83:715-719.
아그로박테리움 시스템은 식물 지놈 DNA에 통합되는 정의된 DNA 세그먼트(segment)를 포함하는 플라스미드 벡터의 사용이 포함된다. 식물체 조직의 접종 방법은 식물 종과 아그로박테리움 전달 시스템에 따라 다양하다. 널리 사용되는 접근 방식은 전체 식물체 분화의 시작을 위한 좋은 소스를 제공하는 임의의 조직 외식편(explant)로 수행할 수 있는 잎 디스크(leaf disc) 절차이다. Horsch 외 in Plant Molecular Biology Manual A5, Kluwer Academic Publishers, Dordrecht (1988) p. 1-9. 추가되는 접근방식은 진공 침투(vacuum infiltration)과 함께 아그로박테리움 전달 시스템을 사용한다. 아그로박테리움 시스템은 특히 형질전환 쌍자엽(dicotyledonous) 식물체의 생성에서 실행 가능하다.
한 구현예에 따르면, 아그로박테리움을 사용하지 않는(agrobacterium-free) 발현 방법을 사용하여 외래 유전자를 식물 세포에 도입한다. 한 구현예에 따르면, 아그로박테리움을 사용하지 않는 발현 방법은 일시적이다. 특정 구현예에 따르면, 충격(bombardment) 방법은 외래 유전자를 식물세포에 도입하기 위해 사용된다. 또 다른 특정 구현예에 따르면, 식물체 뿌리의 충격은 외래 유전자를 식물 세포 내로 도입하기 위해 사용된다. 본 발명의 일부 구현예에 따라 사용될 수 있는 예시적인 충격 방법은 다음의 예시 섹션에서 논의된다.
또한, 다양한 클로닝 키트 또는 유전자 합성이 본 발명의 일부 구현예의 교시에 따라 사용될 수 있다.
안정적인 형질전환 후, 식물 번식이 수행된다. 식물 번식의 가장 일반적인 방법은 종자에 의한 것이다. 그러나, 종자 번식에 의한 재생은 종자가 멘델의 법칙에 의해 지배되는 유전자 변이에 따른 식물에 의해 생산되기 때문에 이형접합성(heterozygosity)으로 인해 작물에 균일성(uniformity)이 결여되어 있다는 단점이 있다. 기본적으로 각 종자는 유전적으로 다르며 각각 고유한 특성을 가지고 자란다. 따라서, 형질전환된 식물체는 재생된 식물체 모 형질전환 식물체와 동일한 형질 및 특성을 갖도록 생산하는 것이 바람직하다. 그러므로, 형질전환된 식물체는 유전적으로 동일한 형질전환된 식물체의 신속하고 일관된 번식을 제공하는 미세증식(micropropagation)에 의해 재생되는 것이 바람직하다.
미세증식은 선택된 부모 식물체 또는 품종에서 절제된 단일 조직 조각으로부터 새로운 세대의 식물체를 성장시키는 과정이다. 이 과정은 원하는 특성을 가진 식물체를 대량으로 번식할 수 있다. 새로 생성된 식물체는 원래 식물체와 유전적으로 동일하고 모든 특성을 가지고 있다. 미세증식(또는 클로닝)은 단기간에 고품질의 식물체 재료의 대량 생산을 가능하게 하고 원래의 형질전환 또는 형질전환된 식물체의 특성을 보존하면서 선택된 품종의 신속한 증식을 제공한다. 식물체 복제(cloning)의 장점은 식물체 증식(multiplication) 속도 및 생산되는 식물체의 품질 및 균일성이다.
미세증식은 단계 사이의 배양 배지 또는 생장 조건의 변경이 요구되는 다단계 절차이다. 따라서, 미세증식 과정은 4 가지 기본 단계를 포함한다: 1단계, 초기 조직 배양; 2단계, 조직 배양 증식; 3단계, 분화 및 식물체 형성; 및 4단계, 온실 배양 및 경화. 1단계 초기 조직 배양 동안 조직 배양이 확립되고 오염 물질이 없는 것(contaminant-free)으로 인증된다. 2단계 동안, 초기 조직 배양은 생산 목표를 충족하기에 충분한 수의 조직 샘플이 생산될 때가지 증식된다. 3단계 동안, 2단계에서 자라난 조직 샘플은 분할되어 개별 묘목으로 성장된다. 4단계에서, 형질전환된 묘목은 자연 환경에서 자랄 수 있도록 식물체의 빛에 대한 내성이 점차 증가하는 경화를 위해 온실로 옮겨진다.
현재 안정적인 형질전환이 바람직하지만, 잎 세포, 분열세포 또는 전체 식물체의 일시적인 형질전환도 본 발명의 일부 구현예에 의해 예상된다.
일시적인 형질전환은 상기 기재된 임의의 직접적인 DNA 전달 방법 또는 변형된 식물체 바이러스를 사용한 바이러스 감염에 의해 수행될 수 있다.
식물 숙주의 형질전환에 유용한 것으로 밝혀진 바이러스는 CaMV, TMV, TRV 및 BV을 포함한다. 식물 바이러스를 사용한 식물체의 형질전환은 미국 특허 제 4,855,237호 (BGV), 유럽 특허 제67,553호 (TMV), 일본 공개 출원 제63-14693호 (TMV), EPA 194,809 (BV), EPA 278,667 (BV); 및 Gluzman, Y. 외, Communications in Molecular Biology: Viral Vectors, Cold Spring Harbor Laboratory, New York, pp. 172-189 (1988)에 기재되어 있다. 식물을 포함하는 많은 숙주에서 외래 DNA를 발현하는데 사용하기 위한 슈도바이러스(pseudovirus) 입자는 WO 87/06261에 기재되어 있다.
식물에서 비-바이러스 외인성 핵산 서열의 도입 및 발현을 위한 식물 RNA 바이러스의 구축(construction)은 상기 참고문헌뿐만 아니라 Dawson, W. O. 외, Virology (1989) 172:285-292; Takamatsu 외. EMBO J. (1987) 6:307-311; French 외. Science (1986) 231:1294-1297; 및 Takamatsu 외. FEBS Letters (1990) 269:73-76에 의해 입증된다.
바이러스가 DNA 바이러스인 경우, 바이러스 자체에 적절한 변형이 이루어질 수 있다. 대안적으로, 바이러스는 외래 DNA로 원하는 바이러스 벡터를 쉽게 구성할 수 있도록 먼저 박테리아 플라스미드로 클로닝 될 수 있다. 그런 다음 바이러스는 플라스미드에서 절단될 수 있다. 바이러스가 DNA 바이러스인 경우, 복제(replication)의 박테리아 기원이 바이러스 DNA에 부착될 수 있으며, 이는 박테리아 의해 복제된다. 이 DNA의 전사 및 번역은 바이러스 DNA를 캡슐화할 외피 단백질을 생성할 것이다. 바이러스가 RNA 바이러스인 경우, 일반적으로 cDNA로 복제되어 플라스미드에 삽입된다. 그런 다음 플라스미드는 모든 구축(construction)을 이루는데 사용된다. 그런 다음 RNA 바이러스는 플라스미드의 바이러스 서열을 전사하고 바이러스 유전자를 번역하여 바이러스 RNA를 캡슐화하는 외피 단백질(들)을 생성함으로써 생산된다.
본 발명의 일부 구현예의 컨스트럭트(construct)에 포함된 것과 같은 비-바이러스 외인성 핵산 서열의 식물에서의 도입 및 발현을 위한 식물 RNA 바이러스의 구축(construction)은 상기 참고문헌뿐만 아니라 미국 특허 제5,316,931호에 의해 입증된다.
한 구현예에서, 천연 외피 단백질 암호화 서열이 바이러스 핵산으로부터 결실되고, 식물 숙주에서 발현할 수 있고, 재조합 식물 바이러스 핵산을 패키징하고, 및 재조합 식물 바이러스 핵산에 의해 숙주의 전신 감염(systemic infection)을 보장할 수 있는 비-천연 식물 바이러스 외피 단백질 암호화 서열 및 비-천연 프로모터, 바람직하게 비-천연 외피 단백질 암호화 서열의 서브지놈(subgenomic) 프로모터가 삽입된 식물 바이러스 바이러스 핵산이 제공된다. 대안적으로, 외피 단백질 유전자는 단백질이 생성되도록, 그 안에 비-천연 핵산 서열의 삽입에 의해 불활성화될 수 있다. 재조합 식물 바이러스 핵산은 하나 이상의 추가적인 비-천연 서브지놈 프로모터를 포함할 수 있다. 각각의 비-천연 서브지놈 프로모터는 식물 숙주에서 인접한 유전자 또는 핵산 서열을 전사하거나 발현할 수 있고, 서로 및 천연 서브지놈 프로모터와 재조합할 수 없다. 비-천연(외래의) 핵산 서열은 천연 식물 바이러스 서브지놈 프로모터 또는 하나 이상의 핵산 서열이 포함되는 경우 천연 및 비-천연 식물 바이러스 서브지놈 프로모터에 인접하여 삽입될 수 있다. 비-천연 핵산 서열은 원하는 산물을 생산하기 위해 서브지놈 프로모터의 조절 하에 숙주 식물에서 전사되거나 발현된다.
두 번째 구현예에서, 천연 외피 단백질 암호화 서열이 비-천연 외피 단백질 암호화 서열 대신에 비-천연 외피 단백 서브지놈 프로모터 중 하나에 인접하게 배치되는 것을 제외하고는 재조합 식물 바이러스 핵산이 첫 번째 구현예에서와 같이 제공된다.
세 번째 구현예에서, 천연 외피 단백질 유전자가 그것의 서브지놈 프로모터에 인접하고 하나 이상의 비-천연 서브지놈 프로모터가 바이러스 핵산 내로 삽입된 재조합 식물 바이러스 핵산이 제공된다. 삽입된 비-천연 서브지놈 프로모터는 식물 숙주에서 인접한 유전자를 전사 또는 발현할 수 있고 서로 및 천연 서브지놈 프로모터와 재조합할 수 없다. 비-천연 핵산 서열은 비-천연 서브지놈 식물 바이러스 프로모터에 인접하여 삽입되어 서열이 서브지놈 프로모터의 조절 하에 숙주 식물에서 전사되거나 발현되어 원하는 산물을 생성할 수 있다.
네 번째 구현예에서, 재조합 식물 바이러스 핵산은 천연 외피 단백질 암호화 서열이 비-천연 외피 단백질 암호화 서열로 대체된 것을 제외하고는 세 번째 구현예에서와 같이 제공된다.
바이러스 벡터는 재조합 식물 바이러스 생산하기 위해 재조합 식물 바이러스 핵산에 의해 암호화된 외피 단백질에 의해 캡슐화된다. 재조합 식물 바이러스 핵산 또는 재조합 식물 바이러스는 적절한 숙주 식물을 감염시키는데 사용된다. 재조합 식물 바이러스 핵산은 숙주에서 복제할 수 있고, 숙주에서 전신 확산이 가능하고, 및 숙주에서 외래 유전자(들)(분리된 핵산)의 전사 또는 발현을 통해 원하는 단백질을 생성할 수 있다.
상기에 더하여, 본 발명의 일부 구현예의 핵산 분자는 또한 엽록체 지놈 내로 도입되어 엽록체 발현을 가능하게 할 수 있다.
엽록체의 지놈에 외인성 핵산 서열을 도입하는 기술은 공지되어 있다. 이 기술은 다음의 절차를 포함한다. 첫 번째로, 식물 세포를 화학적으로 처리하여 세포 당 엽록체의 수를 약 1개로 줄여준다. 그런다음, 외인성 핵산은 적어도 하나의 외인성 핵산 분자를 엽록체 내로 도입할 목적으로 입자 충격을 통해 세포 내로 도입된다. 외인성 핵산은 엽록체 고유의 효소에 의해 용이하게 수행되는 상동 재조합을 통해 엽록체의 지놈에 통합될 수 있도록 선택된다. 마지막으로, 외인성 핵산은, 관심 유전자 이외의, 엽록체의 지놈에서 유래한 적어도 하나의 핵산 스트레치(stretch)를 포함한다. 또한, 외인성 핵산은 선택 가능한 마커를 포함하며, 이는 순차적인 선택 절차에 의해 이러한 선택에 따른 엽록체 지놈의 모든 또는 실질적으로 모든 사본(copy)이 외인선 핵산에 포함될 것임을 확인하는 역할을 한다. 이 기술과 관련된 추가 세부사항은 미국 특허 제 4,945,050호; 및 제5,693,507호에 기술되어 있으며, 이는 참고로 본 명세서에 포함된다. 따라서 폴리펩타이드는 엽록체의 단백질 발현 시스템에 의해 생성되어 엽록체의 내막에 통합될 수 있다.
사용된 형질전환/감염 방법에 관계없이, 본 교시는 지놈 편집 이벤트를 포함하는 형질전환된 세포를 추가로 선택한다.
특정 구현예에 따르면, 선택은 특정 유전자좌에서 성공적인 정확한 변형(예를 들어, 교체(swapping), 삽입, 결실, 점 돌연변이)를 포함하는 세포만이 선택되도록 선택이 수행된다. 따라서, 의도하지 않은 유전자좌에 변형(예를 들어, 삽입, 결실, 점 돌연변이)을 포함하는 임의의 이벤트를 포함하는 세포는 선택되지 않는다.
한 구현예에 따르면, 변형된 세포의 선택은 표현형 수준(phenotypic level)에서, 분자 이벤트의 검출에 의해, 혀왕성 리포터의 검출에 의해, 선택(예를 들어 항생제 또는 내성과 같은 다른 선택 마커, 즉, TP53 침묵의 경우에는 Nutlin3)의 존재 하의 성장(growth)에 의해 수행될 수 있다.
한 구현예에 따르면, 변형된 세포의 선택은 새롭게 편집된 RNA 침묵 분자(예를 들어, 신규 편집된 miRNA, siRNA, piRNA tasiRNA 등의 존재)의 생합성 및 발생을 분석함으로써 수행된다.
한 구현예에 따르면, 변형된 세포의 선택은 RNA 침묵 분자의 침묵 활성 및/또는 특이성, 또는 관심 표적 RNA를 암호화하는 유기체의 하나의 진핵 세포 또는 유기체의 표현형, 예를 들어 세포 크기, 생장률/억제, 세포 모양, 세포 막 완전성, 종양 크기, 종양 모양, 유기체의 착색(pigmentation), 유기체의 크기, 유기체의 감염 매개변수(예를 들어, 바이러스 부하 또는 박테리아 부하) 또는 유기체의 염증 매개변수(예를 들어, 발열(fever) 또는 발적(redness)), 식물 잎 색깔, 예를 들어 잎 및 다른 기관에서 엽록소의 부분적 또는 완전한 소식(표백(bleaching)), 괴사 패턴의 유무, 꽃 색깔, 과실 특성(예를 들어, 저장 수명(shelf life), 견고함 및 풍미), 생장률, 식물체 크기(예, 왜소증(dwarfism)), 작물 수확량, 생물학적 스트레스 저항성(예를 들어, 병 저항성, 선충류 사망률(mortality)), 딱정벌레의 알 낳는 속도(beetle's egg laying rate), 또는 박테리아, 바이러스, 진균(fungi), 기생충, 곤충, 잡초 및 재배 또는 자생 식물과 관련된 기타 저항성 표현형), 작물 수확량, 대사 프로필(metabolic profile), 생물학적 스트레스 저항성, 비생물적 스트레스 저항성(예를 들어, 내열성/내한성, 가뭄 저항성, 염 저항성, 알릴 알코올 저항성, 또는 영양분 예, 인(Phosphorus(P))의 결핍 저항성) 을 검증함으로써 관심 표적 RNA에 대한 그것의 가공된 작은 RNA 형태를 분석함으로써 수행된다.
한 구현예에 따르면, RNA 침묵 분자의 침묵 특이성은 유전형으로(genotypically), 예를 들어 유전자의 발현 또는 발현의 결핍에 의해 결정된다.
한 구현예에 따르면, RNA 침묵 분자의 침묵 특이성은 표현형으로(phenotypically) 결정된다.
한 구현예에 따르면, 진핵 세포 또는 유기체의 표현형은 유전자형 이전에 결정된다.
한 구현예에 따르면, 진핵 세포 또는 유기체의 유전자형은 표현형 이전에 결정된다.
한 구현예에 따르면, 변형된 세포의 선택은 관심 표적 RNA의 RNA 수준을 측정함으로써 관심 표적 RNA에 대한 RNA 침묵 분자의 침묵 활성 및/또는 특이성을 분석함으로써 수행된다. 이것은 당업계에 공지된 임의의 방법, 예를 들어, 노던 블랏(Northern blotting), 뉴클레아제 보호 실험(Nuclease Protection Assays), In Situ hybridization, 정량적(quantitative) RT-PCR 또는 이뮤노블랏(immunoblotting)을 사용하여 수행될 수 있다.
한 구현예에 따르면, 변형된 세포의 선택은 추구되는 편집 유형, 예를 들어 삽입, 결실, 삽입-결실(Indel), 역전(inversion), 치환(substitution) 및 이들의 조합에 따라 본 명세서에서 "돌연변이" 또는 "편집"으로도 지칭되는 DNA 편집 이벤트를 포함하는 진핵 세포 또는 클론을 분석함으로써 수행된다.
서열 변경을 검출하는 방법은 당업계에 잘 알려져 있으며 DNA 및 RNA 시퀀싱(예, 차세대 시퀀싱(next generation sequencing)), 전기영동(electrophoresis), 효소 기반 미스매치 검출 검정(enzyme-based mismatch detection assay) 및 혼성화 검정(hybridization assay), 예를 들어 PCR, RT-PCR, Rnase protection, in-situ hybridization, 프라이머 확장(primer extension), 서던 블랏(Southern blot), 노던 블랏(Northern Blot) 및 닷 블랏(dot blot) 분석을 포함하지만 이에 제한되지는 않는다. PCR 기반 T7 엔도뉴클레아제, 헤테로듀플렉스(Heteroduplex) 및 생어 시퀀싱(Sanger sequencing), 또는 PCR 후 제한 다이제스트(digest)를 수행하여 고유한 제한 부위의 출연 또는 소멸을 검출하는 것과 같이 단일 염기 다형성(single nucleotide polymorphisms, SNPs) 검출에 사용되는 다양한 방법도 사용할 수 있다.
DNA 편집 이벤트, 예를 들어 Indel의 존재를 검증하는 또 다른 방법은 불일치(mismatched) DNA를 인식하고 절단하는 구조 선택 효소(예, 엔도뉴클레아제)를 사용하는 불일치 절단 분석(mismatch cleavage assay)를 포함한다.
한 구현예에 따르면, 형질전환된 세포의 선택은 형광 리포터에 의해 방출되는 형광을 나타내는 형질전환된 세포를 선택하는 유세포분석(flow cytometry, FACS)에 의해 수행된다. FACS 분류 후, 형광 마커를 표시하는 형질전환된 진핵 세포의 양성으로 선택된 풀(pool)이 수집되고 부분 표본(aliquot)은 상기 논의된 바와 같이 DNA 편집 이벤트를 테스트하는데 사용할 수 있다.
항생제 선택 마커가 사용된 경우, 형질전환 후 진핵 세포는 선택(예, 항생제)의 존재 하에, 예를 들어 세포 배양에서 또는 식물 세포가 콜로니, 즉, 클론 및 마이크로-캘리(micro-calli)로 발달할 때까지 배양된다. 그런 다음 상기 논의된 바와 같이, 세포 배양 또는 캘러스 세포의 일부를 DNA 편집 이벤트에 대해 분석(검증)한다.
본 발명의 한 구현예에 따르면, 방법은 관심 표적 RNA에 대한 내인성 RNA 침묵 분자의 형질전환된 세포 상보성(complementarity)를 검증하는 단계를 추가로 포함한다.
상기 언급된 바와 같이, RNA 침묵 분자를 암호화하는 유전자의 변형 후, RNA 침묵 분자는 관심 표적 RNA의 서열에 대해 적어도 약 30 %, 33 %, 40 %, 50 %, 60 %, 70 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % 또는 심지어 100 %의 상보성을 포함한다.
관심 표적 RNA와 설계된 RNA 침묵 분자, 또는 그것의 가공된 작은 RNA 형태의 특이적 결합은 컴퓨터 알고리즘(예, 블라스트(BLAST))와 같은 당업계에 알려진 임의의 방법에 의해 결정될 수 있으며, 예를 들어 노덧 블랏(Northern blot), In situ hybridization, QuantiGene Plex Assay 등을 포함하는 방법에 의해 검증될 수 있다.
양성 진핵 세포 또는 클론(예, 식물 세포 클론)은 DNA 편집 이벤트에 대해 동형접합(homozygous) 또는 이형접합(heterozygous)일 수 있음이 이해될 것이다. 이형접합(heterozytous) 세포인 경우, 세포(예, 이배체(diploid) 식물 세포인 경우)는 RNA 침묵 분자의 변형된 유전자의 카피 및 비-변형된 유전자의 카피를 포함할 수 있다. 숙련된 기술자는 의도된 용도에 따라 추가 배양/재생을 위해 세포를 선택할 것이다.
한 구현예에 따르면, 일시적인 방법이 요망되는 경우, 원하는 바와 같이 DNA 편집 이벤트가 있음을 나타내는 진핵 세포 또는 클론(예, 식물 세포 클론)이 DNA 편집제의 존재, 즉 DNA 편집제에 대해 암호화하는 DNA 서열의 손실에 대해 추가로 분석되고 선택된다. 이는, 예를 들어 GFP의 형광 검출 또는 q-PCR, HPLC에 의해 DNA 편집제(예를 들어, mRNA, 단백질에서)의 발현 손실을 분석함으로써 수행될 수 있다.
한 구현예에 따르면, 일시적인 방법이 요망되는 경우, 진핵 세포 또는 클론(예, 식물 세포 클론)은 본 명세서에 기재된 바와 같은 핵산 컨스트럭트 또는 그의 일부, 예를 들어 DNA 편집제를 암호화하는 핵산 서열의 존재에 대해 분석될 수 있다. 이것은 형광 현미경, q-PCR, FACS, 및 또는 서던 블랏(Southern blot), PCR, 시퀀싱(sequencing), HPLC와 같은 임의의 다른 방법으로 확인할 수 있다.
양성 진핵 세포 클론을 저장할 수 있다(예, 냉동보존(cryopreserved)).
대안적으로, 진핵 세포는, 예를 들어, 연장된 기간 동안 미분화 상태로 추가 배양 및 유지될 수 있거나 필요에 따라 다른 세포 유형, 조직, 기관 또는 유기체로 분화되도록 유도될 수 있다.
한 구현예에 따르면, 진핵 유기체가 식물체인 경우, 하기에 논의된 바와 같이, DNA 편집제(예, 엔도뉴클레아제)가 없는 식물체를 수득하기 위해 식물체를 교배시킨다.
대안적으로, 식물 세포(예, 원형질체(protoplast))는 먼저 캘러스로 발달하는 식물 세포의 군으로 성장한 다음 식물체 조직 배양 방법을 사용하여 캘러스로부터 싹(shoot)의 재싱(칼로제네시스(callogenesis))에 의해 전체 식물체로 재생될 수 있다. 원형질체의 캘러스로의 성장 및 싹의 재생은 각 식물 종에 대해 맞춤화되어야 하는 조직 배양 배지에서 식물 생장 조절제의 적절한 균형을 필요로 한다.
원형질체는 또한 원형질체 융합이라는 기술을 사용하여 식물 육종에 사용될 수 있다. 다른 종의 원형질체는 전기장(electric field) 또는 폴리에틸렌 글리콜(polyethylene glycol) 용액을 사용하여 융합되도록 유도된다. 이 기술은 조직 배양에서 체세포 잡종(somatic hybrid)를 생성하는 데 사용될 수 있다.
원형질체 재생 방법은 당업계에 잘 알려져 있다. 유전자형(genotype), 공여자 조직 및 그 전처리, 원형질체 분리를 위한 효소 처리, 원형질체 배양 방법, 배양, 배양 배지, 및 물리적 환경 등 원형질체의 분리, 배양, 및 재생에 영향을 미치는 여러 요인들이 있다. 철저한 검토에 대하여 Maheshwari 외. 1986 Differentiation of Protoplasts and of Transformed Plant Cells: 3-36. Springer-Verlag, Berlin을 참고한다.
재생된 식물체는 숙련된 기술자가 적합하다고 생각하는 대로 추가 육종 및 선택을 받을 수 있다.
따라서, 본 발명의 구현예는 추가로 본 발명의 교시에 따라 생성되는 관심 표적 RNA를 침묵시킬 수 있는 RNA 침묵 분자를 포함하는 식물체, 식물 세포 및 식물체의 가공 산물에 관한 것이다.
본 발명의 한 측면에 따르면, 다음을 포함하는 표적 유전자의 발현이 감소된 식물체를 생산하는 방법이 제공된다: (a) 본 발명의 일부 구현예의 식물체를 육종하는 단계, 및 (b) 관심 표적 RNA의 발현이 감소된 자손 식물체, 또는 관심 표적 RNA에 대한 RNA 분자의 침묵 특이성을 포함하고, 및 DNA 편집제를 포함하지 않는 자손 식물체를 선택하는 단계, 이로써 유전자의 발현이 감소된 식물체를 생산하는 단계.
본 발명의 한 측면에 따르면, 다음을 포함하는 관심 표적 RNA에 대해 침묵 활성을 갖는 RNA 분자를 포함하는 식물체를 생산하는 방법이 제공된다:
(a) 본 발명의 일부 구현예의 식물체를 육종하는 단계; 및
(b) 관심 표적 RNA에 대한 침묵 활성을 갖는 RNA 분자를 포함하는 자손 식물체, 또는 관심 표적 RNA에 대한 RNA 분자의 침묵 특이성을 포함하고 DNA 편집제를 포함하지 않는 자손 식물체를 선택하는 단계, 이로써 관심 표적 RNA에 대해 침묵 활성을 갖는 RNA 분자를 포함하는 식물체를 생산하는 단계.
본 발명의 한 측면에 따르면, 번식을 허용하는 조건 하에 식물체 또는 식물 세포를 성장시키는 것을 포함하는, 본 발명의 일부 구현예의 식물체 또는 식물 세포를 생산하는 방법이 제공된다.
본 명세서에 사용되는 "식물체"이라는 용어는 전체 식물체, 접목된 식물체(grafted plant), 식물체의 조상 및 자손 및 종자, 싹, 줄기, 뿌리(괴경 포함), 대목(rootstock), 접수(scion), 및 식물 세포, 조직 및 기관을 포함하는 식물체 부분을 포함한다. 식물체는 현탁 배양물(suspension culture), 배아(embryos), 분열조직 영역(meristematic region), 캘러스 조직, 잎, 배우자체(gametophyte), 포자체(sporophyte), 꽃가루(pollen), 및 미세포자(microspore)를 포함하는 임의의 형태일 수 있다. 본 발명의 방법에서 유용할 수 있는 식물체는 상과의 녹색식물(superfamily Viridiplantee)에 속하는 모든 식물체, 특히 아카시아 종(Acacia spp.), 에이서 종(Acer spp.), 악티니디아 종(Actinidia spp.), 에스큘러스 종(Aesculus spp.), 카우리 소나무(Agathis australis), 알비지아 아마라(Albizia amara), 알소필라 트리칼라(Alsophila tricolor), 안드로포곤 종(Andropogon spp.), 아라키스 종(Arachis spp.), 아레카 카테추(Areca catechu), 아스텔리아 프라그란스(Astelia fragrans), 아스트라갈루스 사이서(Astragalus cicer), 바이키에아 플루리주가(Baikiaea plurijuga), 베툴랒 종(Betula spp.), 브라시카 종(Brassica spp.), 브루기에라 짐노르리자(Bruguiera gymnorrhiza), 부르케아 90inalize(Burkea 90inalize), 브테아 프론도사(Butea frondosa), 카다바 90inalize(Cadaba 90inalize), 칼리안드라 종(Calliandra spp), 동백나무(Camellia sinensis), 대마초과(Cannabaceae), 칸나비스 인디카(Cannabis indica), 대마초(Cannabis), 칸나비스 사비타(Cannabis sativa), 대마(Hemp), 산업용 대마(industrial Hemp), 고추 종(Capsicum spp.), 카시아 종(Cassia spp.), 센트로에마 푸베센스(Centroema pubescens), 차쿠멜레스 종(Chacoomeles spp.), 계피 계수나무(Cinnamomum cassia), 커피 아라비카(Coffea arabica), 콜로포스페르멈 모파네(Colophospermum mopane), 콜로닐리아 변종(Coronillia varia), 코토네스터 90inalize(Cotoneaster 90inalize), 크라태구스 종(Crataegus spp.), 쿠쿠미스 종(Cucumis spp.), 쿠프레수스 종(Cupressus spp.), 시아테아 딜바타(Cyathea dealbata), 시도니아 오블롱가(Cydonia oblonga), 크립토메리아 자포니카(Cryptomeria japonica), 심보포곤 종(Cymbopogon spp.), 신시아 딜바타(Cynthea dealbata), 시도니아 오블롱가(Cydonia oblonga), 달베르지아 모네타리아(Dalbergia monetaria), 달바리아 90inalized90(Davallia 90inalized90), 데스모디움 종(Desmodium spp.), 딕소니아 스콰로사(Dicksonia squarosa), 디베테로포곤 암플렉텐스(Dibeteropogon amplectens), 디오클레아 종(Dioclea spp), 돌리코스 종(Dolichos spp.), 도리크늄 렉툼(Dorycnium rectum), 에키노클로아 피라미달리스(Echinochloa pyramidalis), 에라피아 종(Ehraffia spp.), 엘레우신 코라카나(Eleusine coracana), 에라그레스티스 종(Eragrestis spp.), 에리트리나 종(Erythrina spp.), 유칼립푸스 종(Eucalypfus spp.), 유클레아 쉬페리(Euclea schimperi), 에울랄리아 비/로사(Eulalia vi/losa), 파고피룸 종(Pagopyrum spp.), 페이조아 셀로라나(Feijoa sellowlana), 프라가리아 종(Fragaria spp.), 플레밍지아 종(Flemingia spp), 프레이시네티아 뱅크슬리(Freycinetia banksli), 제라늄 툰베리(Geranium thunbergii), 진아고 빌로바(GinAgo biloba), 글리신 자바니카(Glycine javanica), 글리리시디아 종(Gliricidia spp), 고시피움 히르수툼(Gossypium hirsutum), 글리리시디아 종(Grevillea spp.), 귀부르시아 콜레오스페마(Guibourtia coleosperma), 헤디사룸 종(Hedysarum spp.), 헤마피아 알티시마(Hemaffhia altissima), 헤테로포곤 콘토퍼스(Heteropogon contoffus), 호르둠 불가레(Hordeum vulgare), 히퍼레니아 루파(Hyparrhenia rufa), 히페리쿰 에렉툼(Hypericum erectum), 히페펠리아 디솔루트(Hypeffhelia dissolute), 인디고 잉카마타(Indigo incamata), 아이리스 종(Iris spp.), 렙타레나 파이롤리폴리아(Leptarrhena pyrolifolia), 레스페디자 종(Lespediza spp.), 상추 종(Lettuca spp.), 류카에나 류코케팔라(Leucaena leucocephala), 루데티아 심플렉스(Loudetia simplex), 로토누스 바이네슬리(Lotonus bainesli), 로터스 종(Lotus spp.), 마크로틸로마 악실라레(Macrotyloma axillare), 말루스 종(Malus spp.), 매니핫 에스큘렌타(Manihot esculenta), 메디카고 살리바(Medicago saliva), 메타세쿼이아 글립토스트로보이데스(Metasequoia glyptostroboides), 무사 사피엔툼(Musa sapientum), 바나나, 니코티아눔 종(Nicotianum spp.), 오노브리키스 종(Onobrychis spp.), 오르니토푸스 종(Ornithopus spp.), 오리자 종(Oryza spp.), 펠토포룸 아프리카눔(Peltophorum africanum), 페니세툼 종(Pennisetum spp.), 페르세아 그라티시마(Persea gratissima), 페튜니아 종(Petunia spp.), 파세울루스 종(Phaseolus spp.), 피닉스 카나리엔시스(Phoenix canariensis), 포르뮴 쿠키아눔(Phormium cookianum), 포티니아 종(Photinia spp.), 피시아 클라우카(Picea glauca), 파이너스 종(Pinus spp.), 피숨 사티밤(Pisum sativam), 포도카르푸스 토타라(Podocarpus totara), 포고나르트리아 플렉키(Pogonarthria fleckii), 포고나프리아 스퀘어로사(Pogonaffhria squarrosa), 포풀루스 종(Populus spp.), 프로소피스 시네라리아(Prosopis cineraria), 슈도츠가 멘지에시(Pseudotsuga menziesii), 프테로로비움 스텔라툼(Pterolobium stellatum), 피루스 코뮤니스(Pyrus communis), 참나무 종(Quercus spp.), 라피올렙시스 90inalized(Rhaphiolepsis 90inalized), 로팔로스틸리스 사피다(Rhopalostylis sapida), 루스 나탈렌시스(Rhus natalensis), 리베스 그로스룰라리아(Ribes grossularia), 리베스 종(Ribes spp.), 로비니아 슈도아카시아(Robinia pseudoacacia), 로사 종(Rosa spp.), 루부스 종(Rubus spp.), 살릭스 종(Salix spp.), 쉬자키리움 생귀니움(Schyzachyrium sanguineum), 스시아도피티스 베피실라타(Sciadopitys vefficillata), 세쿼이아 셈페르비렌스(Sequoia sempervirens), 세쿼이아덴드론 기간테움(Sequoiadendron giganteum), 소굼 바이컬러(Sorghum bicolor), 스피나시아 종(Spinacia spp.), 스포로볼루스 핌브리아투스(Sporobolus fimbriatus), 스티부러스 아로페쿠로이데스(Stiburus alopecuroides), 스타일로산토스 휴밀리스(Stylosanthos humilis), 타데하기 종(Tadehagi spp), 탁소디움 디스티쿰(Taxodium distichum), 테마 트리안드라(Themeda triandra), 트리폴리움 종(Trifolium spp.), 트리티쿰 종(Triticum spp.), 쓰가 헤테로필라(Tsuga heterophylla), 백시늄 종(Vaccinium spp.), 비시아 종(Vicia spp.), 비티스 비니페라(Vitis vinifera), 왓슨니아 피라미다타(Watsonia pyramidata), 잔테데스키아 에티오피카(Zantedeschia aethiopica), 제아 메이스(Zea mays), 아마란스, 아티초크, 아스파라거스, 브로콜리, 방울양배추, 양배추, 캐놀라, 당근, 콜리플라워, 셀러리, 콜라드 그린, 아마, 케일, 렌즈콩, 유지종자 평지, 오크라 양파, 감자, 쌀, 콩, 짚, 사탕무, 사탕수수, 해바라기, 토마토, 호박차, 나무를 포함하는 목록에서 선택된 사료(fodder) 또는 마초 콩과 식물(forage legume), 관상용 식물, 식용 작물, 나무 또는 관목(shrub)을 포함하는 단자엽(monocotyledonous) 및 쌍자엽(dicotyledonous) 식물체를 포함한다. 대안적으로, 조류(algae) 및 기타-녹색식물(viridiplantae)이 본 발명의 일부 구현예의 방법에 사용될 수 있다.in
특정 구현예에 따르면, 식물체는 작물, 꽃 또는 나무이다.
특정 구현예에 따르면, 식물체는 목본 식물 중, 예를 들어 Actinidia chinensis (Actinidiaceae), Manihotesculenta (Euphorbiaceae), 피리오덴드론 튤립과(Firiodendron tulipifera) (Magnoliaceae), 포풀루스(Populus) (Salicaceae), 산딸기과(Santalum album) (Santalaceae), Ulmus (Ulmaceae) 및 다른 종의 장미과(Rosaceae) (Malus, Prunus, Pyrus) 및 Rutaceae (Citrus, Microcitrus), Gymnospermae 예를 들어, Picea glauca 및 Pinus taeda, 산림 나무(예, Betulaceae, Fagaceae, Gymnospermae 및 열대 나무 종), 과실 나무, 관목(shrubs) 또는 허브, 예를 들어, (바나나, 코코아, 코코넛, 커피, 대추, 포도 및 차) 및 기름 야자(oil palm)이다.
특정 구현예에 따르면, 식물체는 열대 작물 중, 예를 들어, 커피, 마카다미아, 바나나, 파인애플, 타로(taro), 파파야, 망고, 보리, 콩, 카사바, 병아리콩(chickpea), 코코아(초콜렛), 동부콩(cowpea), 옥수수(maize)(옥수수(corn)), 기장(millet), 벼, 수수(sorghum), 사탕수수, 고구마, 담배, 타로, 차(tea), 참마(yam)이다.
"곡물", "종자", 또는 "콩" 은 다른 식물체로 발달할 수 있는 꽃 피는 식물체의 번식 단위를 나타낸다. 본 명세서에서 사용되는 용어는 동의어(synonymously) 및 상호 교환 가능하게(interchangeably) 사용된다.
특정 구현예에 따르면, 식물체는 식물 세포, 예를 들어 배아 세포 현택액 중의 식물 세포이다.
특정 구현예에 따르면, 식물체는 본 발명의 특정 구현예의 방법에 의해 생성되는 식물 세포를 포함한다.
한 구현예에 따르면, 번식은 교배(crossing) 또는 자가 번식(selfing)을 포함한다.
본 명세서에서 사용되는 "교배(crossing)"이라는 용어는 수컷 식물(또는 배우체(gamete))에 의한 암컷 식물(또는 배우체)의 수정을 의미한다. "배우체(gamete)"라는 용어는 배우자체(gametophyte)로부터 유사 분열(mitosis)에 의해 식물체에서 생성되고 유성 생식(sexual reproduction)에 관여하는 반수체 생식 세포(haploid reproductive cell)(난자(egg) 또는 정자(sperm))를 의미하며, 이 동안 이성의 두 배우자가 융합하여 이배체 접합체(diploid zygote)를 형성한다. 이 용어는 일반적으로 꽃가루(정자 세포 포함) 및 난자(ovule)(난자(ovum) 포함)에 대한 언급을 포함한다. 따라서 "교배(crossing)"은 일반적으로 하나의 개개의 난자(ovule)를 다른 개개의 꽃가루로 수정하는 것을 의미하는 반면, "자가 번식(selfing)"은 동일한 개개의 꽃가루로 개개의 난자를 수정하는 것을 의미한다. 교배는 식물체 육종에 널리 사용되며 두 식물체 사이의 지놈 정보가 혼합되어 어머니의 염색체 하나와 아버지의 염색체 하나가 교차한다. 이것은 유전적으로 유전된 특성의 새로운 조합을 초래할 것이다.
상기 언급된 바와 같이, 식물체는 바람직하지 않은 인자, 예를 들어 DNA 편집제(예, 엔도뉴클레아제)가 없는 식물체를 얻기 위해 교배될 수 있다.
본 발명의 일부 구현예에 따르면, 식물체는 비-유전자이식(non-transgenic)이다.
본 발명의 일부 구현예에 따르면, 식물체는 유전자이식 식물체다.
한 구현예에 따르면, 식물체는 비-유전자 변형(비-GMO) 식물체다.
한 구현예에 따르면, 식물체는 유전적으로 변형된(GMO) 식물체다.
한 구현예에 따르면, 본 발명의 일부 구현예의 방법에 따라 생성된 식물체의 종자가 제공된다.
한 구현예에 따르면, 다음을 포함하는 증가된 스트레스 내성, 증가된 수확량, 증가된 성장률 또는 증가된 수확량 품질을 갖는 식물체를 생성하는 방법이 제공된다: (a) 본 발명의 일부 구현예의 식물체를 육종하는 단계, 및 (b) 증가된 스트레스 내성, 증가된 수확량, 증가된 성장률 또는 증가된 수확량 품질을 갖는 자손 식물체를 선택하는 단계.
본 명세서에 사용된 "스트레스 내성(stress tolerance)"라는 문구는 대사(metabolism), 생장, 생산성 및/또는 생존력(viability)의 실질적인 변화를 겪지 않고 생물적 또는 비생물적 스트레스를 견디는 식물체의 능력을 지칭한다.
본 명세서에 사용된 "비생물적 스트레스(abiotic stress)"라는 문구는 식물체, 식물 세포 등을 대사, 생장, 발달, 번식, 또는 식물체 생존(총칭하여, "생장")에 악영향(adverse effect)를 미치는 무생물("비생물(abiotic)")의 물리적 또는 화학적 제제에 노출시키는 것을 의미한다. 비생물적 스트레스는, 예를 들어, 수분(예, 홍수, 가뭄, 또는 탈수), 혐기성 조건(anaerobic condition)(예, 낮은 수준의 산소 또는 높은 수준의 CO2), 비정상적인 삼투 조건(abnormal osmotic condition)(예, 삼투압 스트레스(osmotic stress)), 염분(salinity), 또는 온도(예, 고온/더위, 추위, 동결 또는 서리(frost)), 오염물질에 대한 노출(예, 중금속(heavy metal toxicity)), 혐기성(anaerobiosis), 영양 결핍(예, 질소 결핍 또는 제한된 질소), 대기 오염 또는 UV 조사(UV irradiation)와 같은 환경적인 요인으로 인해 식물체에 부과될 수 있다.
본 명세서에 사용된 "생물적 스트레스(biotic stress)"라는 문구는 식물체, 식물 세포 등을 생물체의 대사, 생장, 발달, 번식 또는 식물체의 생존(총칭하여, "생장")에 악영향을 미치는 살아있는("생물적")유기체에 노출시키는 것을 의미한다. 생물적 스트레스는, 예를 들어, 박테리아, 바이러스, 진균(fungi), 기생충, 이로운 곤충 및 해로운 곤충, 잡초, 및 재배 또는 자생 식물체에 의해 유발될 수 있다.
본 명세서에 사용된 "수율(yield)" 또는 "식물체 수확량"이라는 문구는 증가된 식물체 생장(생장률), 증가된 작물 생장, 증가된 바이오매스, 및/또는 증가된 식물체 산물 생산(곡물, 과실, 종자 등을 포함함)을 지칭한다.
한 구현예에 따르면, 증가된 식물체 내성, 증가된 수확량, 증가된 생장률 또는 증가된 수확량 품질을 갖는 식물체를 생성하기 위해, RNA 침묵 분자는 스트레스에 대한 감수성, 감소된 수확량, 감소된 생장률 또는 감소된 수확량 품질을 부여하는 식물의 유전자의 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 표적화될(예를 들어 넉아웃되는) 예시적인 감수성 식물 유전자는 감수성 S-유전자, 예컨대, MLO(Mildew Locus O)로 알려진 유전자좌에 존재하는 것을 포함하지만 이에 제한되지 않는다.
한 구현예에 따르면, 본 방법에 의해 생성된 식물체는 본 방법에 의해 생성되지 않은 식물체와 비교하여, 적어도 약 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % 또는 100 %만큼의 증가된 식물 내성, 증가된 수확량, 증가된 수확량 품질, 증가된 생장률을 포함한다.
증가된 스트레스 내성을 평가하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따라 사용될 수 있다. 증가된 스트레스 내성을 평가하는 예시적인 방법은 Yoon, SK., Bae, EK., Lee, H. 외. Trees (2018) 32: 823. www(dot)doi(dot)org/10.1007/s00468-018-1675-2에 기재된 바와 같이 증가된 염 스트레스 내성을 위한 포플라(poplar)에서의 PagSAP1의 하향조절(downregulation), 및 SlbZIP38의 하향조절에 의한 토마토에서의 증가된 가뭄 내성(Pan Y 외 Genes 2017, 8, 402; doi:10.3390/genes8120402)을 포함하지만, 이에 제한되지는 않고, 이는 본 명세서에 참조로 포함된다.
증가된 수확량을 평가하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따라 사용될 수 있다. 증가된 수확량을 평가하는 예시적인 방법은 Ar-Rafi Md. Faisal, 외, AJPS> Vol.8 No.9, August 2017 DOI: 10.4236/ajps.2017.89149에 기재된 바와 같이, 벼에서 감소된 DST 발현; 및 카놀라에서 BnFTA의 하향조절은 Wang Y 외, Mol Plant. 2009 Jan; 2(1): 191-200.(doi: 10.1093/mp/ssn088)에 기재된 바와 같이 수확량을 증가시키는 것을 포함하지만, 이에 제한되지는 않으며, 둘 다 본 명세서에 참조로 포함된다.
증가된 생장률을 평가하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따라 사용될 수 있다. 증가된 생장률를 평가하는 예시적인 방법은 애기장대(Arabidopsis)에서 BIG BROTHER 또는 GA2-OXIDASE의 감소된 발현이 Marcelo de Freitas Lima 외. Biotechnology Research and Innovation(2017)1,14---25에 기재된 바와 같이 생장 및 바이오매스(biomass)를 증가시키는 것을 포함하지만, 이에 제한되지 않고, 이는 본 명세서에 참조로 포함된다.
증가된 수확량 품질을 평가하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따라 사용될 수 있다. 증가된 수확량 품질을 평가하는 예시적인 방법은 벼에서 OsCKX2의 하향조절이 Yeh S_Y 외. Rice (N Y). 2015; 8: 36에 기재된 바와 같이 더 많은 경작자(tiller)의 생산, 더 많은 곡물, 및 곡물의 중량이 증가하도록 하고; 및 많은 식물체에서 감소된 OMT 수준은 리그닌 축적을 변화시키어 Verma SR 및 Dwivedi UN, South African Journal of Botany Volume 91, March 2014, Pages 107-125에 기재된 바와 같이 산업적 목적을 위한 물질의 소화율(digestibility)를 증가시키는 것을 포함하지만, 이에 제한되지는 않으며, 둘 다 본 명세서에 참조로 포함된다.
한 구현예에 따르면, 상기 방법은 증가된 당도, 증가된 당 함량, 증가된 풍미, 향상된 숙성 제어, 증가된 수분 스트레스 내성, 증가된 열 스트레스 내성, 및 증가된 염 내성을 포함하는 식물체의 생성을 추가로 가능하게 한다. 당업자는 변형을 위한 표적 RNA 서열을 선택하기 위해 본 명세서에 기재된 방법을 이용하는 방법을 알 것이다.
한 구현예에 따르면, 다음을 포함하는 병원체 또는 해충 내성의(tolerant) 또는 저항성의(resistant) 식물체를 생성하는 방법이 제공된다: (a) 본 발명의 일부 구현예의 식물체를 육종하는 단계, 및 (b) 병원체 또는 해충 내성 또는 저항성인 자손 식물체를 선택하는 단계.
한 구현예에 따르면, 관심 표적 RNA는 병원체 또는 해충에 감수성(sensitivity)를 부여하는 식물의 유전자의 것이다.
한 구현예에 따르면, 관심 표적 RNA는 병원체의 유전자의 것이다.
한 구현예에 따르면, 관심 표적 RNA는 해충의 유전자의 것이다.
본 명세서에 사용된 "병원체(pathogen)"이라는 용어는 식민지화(colonizing), 손상, 공격, 또는 그들을 감염시킴으로써 식물체에 부정적인 영향을 미치는 유기체를 지칭한다. 따라서, 병원체는 식물의 생장, 발달, 번식, 수확 또는 수확량에 영향을 미칠 수 있다. 이는 질병을 퍼뜨리고/또는 숙주를 손상시키고/또는 숙주 영샹소를 놓고 경쟁하는 유기체가 포함된다. 식물 병원체는 진균(fungi), 난균류(oomycete), 박테리아, 바이러스, 바이로이드, 바이러스-유사 유기체, 파이토플라즈마(phytoplasma), 원생동물(protozoa), 선충류, 곤충 및 기생 식물이 포함되지만, 이에 제한되지는 않는다.
병원체의 비-제한적 예는 장뿔 천공충(long horned borer)과 같은 둥근머리 천공충(Roundheaded Borer); 레드 검 러프 실리드(red gum lerp psyllids) (글리카스피스 브림블컴베이)(Glycaspis brimblecombei)), 블루 검 실리드(blue gum psyllid), 점무늬 검 러프 실리드(spotted gum lerp psyllids), 레몬 검 러프 실리드(lemon gum lep psyllids) 와 같은 실리드(psyllids); 토르토이즈 비틀(tortoise beetles); 스노우트 비틀(snout beetles); 잎 딱정벌레(leaf beetles); 꿀 곰팡이(honey fungus); 타우마스토코리스 페레그라누스(Thaumastocoris peregrinus); 렙토사이브 인바사(Leptocybe invasa), 이펠리무스 마스첼리(Ophelimus maskelli) 셀리트리코드 글로블레스(Selitrichodes globules)와 같은 세씰레 갈 말벌(sessile gall wasps) (시니피과(Cynipidae)); 옴니보로우스 루퍼(Omnivorous looper) 및 오렌지 토트릭스(Orange tortrix)와 같은 잎-먹는 애벌레(Foliage-feeding caterpillars); 글래시-윈지드 샤프슈터(Glassy-winged sharpshooter); 및 자이언트 화이트플라이(Giant whitefly)와 같은 화이트플라이를 포함하지만, 이에 제한되지는 않는다. 병원체의 다른 비-제한적인 예는 차이토포루스 종(Chaitophorus spp.), 구름날개 미루나무(Cloudywinged cottonwood) 및 페리필루스 종(Periphyllus spp.)과 같은 진딧물(Aphid); 오이스터쉘 스케일(Oystershell scale) 및 산 호세 스케일(San Jose scale)과 같은 아르모레드 스케일(Armored scales); 목수벌레(Carpenterworm); 미국말벌나방(American hornet moth) 및 웨스턴 포플러 클리어윙(Western poplar clearwing) 과 같은 클리어윙 나방 천공충(Clearwing moth borers); 청동 자작나무 천공충(Bronze birch borer) 및 청동 포플라 천공충(Bronze poplar borer)과 같은 납작한머리의 천공충(Flatheaded borers); 폴 웹웜(Fall webworm), 과일-나무 리프롤러(Fruit-tree leafroller), 레드험프 애벌래(Redhumped caterpillar), 새틴 나방 애벌레(Satin moth caterpillar), 가시느릅나무 애벌레(Spiny elm caterpillar), 텐트 애벌레(Tent caterpillar), 터석나방(Tussock moths) 및 웨스턴 타이거 스왈로우테일(Western tiger swallowtail)과 같은 잎-먹는 애벌레(Foliage-feeding caterpillars); 포플러 쉴드 천공충(Poplar shield beare)과 같은 잎 마이너(Foliage miners); 미루나무 갈 마이트(Cottonwood gall mite) 과 같은 갈 및 블리스터 마이트(Gall and blister mites); 포플라 페티올레갈 진딧물(Poplar petiolegall aphid) 과 같은 갈 진딧물(Gall aphids); 글래시-윈지드 샤프슈터(Glassy-winged sharpshooter); 잎 딱정벌레(Leaf beetles) 및 벼룩딱정벌레(flea beetles); 메뚜기(Mealybugs); 포플라 및 버드나무 천공충(Poplar and willow borer); 둥근머리 천공충(Roundheaded borers); 잎벌(Sawflies); 블랙 스케일(Black scale), 브라운 소프트 스케일(Brown soft scale), 카투니 메이플 스케일(Cottony maple scale) 및 유로피안 프룻 레카늄(European fruit lecanium)과 같은 소프트 스케일(Soft scales); 버팔로 트리호퍼(Buffalo treehopper) 과 같은 트리호퍼(Treehoppers); 및 레이스 버그(Lace bugs) 및 리구스 버그(Lygus bugs)과 같은 트루 버그(True bugs)를 포함한다.
바이러스성 식물 병원체의 다른 비-제한적 예는 다음의 종을 포함하지만, 이에 제한되지는 않는다: 완두콩 조기-갈변 바이러스(Pea early-browning virus, PEBV), 속(Genus): 토브라바이러스(Tobravirus). 종(Species): 페퍼 링스팟 바이러스(Pepper ringspot virus, PepRSV), 속: 토브라바이러스(Tobravirus). 종: 수박 모자이크 바이러스(Watermelon mosaic virus, WMV), 속: 포티바이러스(Potyvirus) 및 포티 바이러스 속의 기타 바이러스. 종: 토바코 모자이크 바이러스 속(Tobacco mosaic virus Genus, TMV), 토바모바이러스(Tobamovirus) 및 토바모바이러스 속의 기타 바이러스. 종: 감자 바이러스 X 속(Potato virus X Genus, PVX), 포텍스 바이러스(Potexvirus) 및 포텍스 바이러스 속의 기타 바이러스. 따라서, 본 교시는 RNA뿐만 아니라 DNA 바이러스(예를 들어 제미니 바이러스(Gemini virus) 또는 비제미니바이러스(Bigeminivirus))의 표적화를 가정한다(envisage). 표적으로 삼을 수 있는 제미니비리대 바이러스(Geminiviridae virus)는 아부틸론 모자이크 비제미니바이러스(Abutilon mosaic bigeminivirus), 아제라툼 옐로우 베인 비제미니바이러스(Ageratum yellow vein bigeminivirus), 콩 칼리코 모자이크 비제미니바이러스(Bean calico mosaic bigeminivirus), 콩 골든 모자이크 비제미니바이러스(Bean golden mosaic bigeminivirus), 벤디 옐로우 베인 모자이크 비제미니바이러스(Bhendi yellow vein mosaic bigeminivirus), 카사바 아프리칸 모자이크 비제미니바이러스(Cassava African mosaic bigeminivirus), 카사바 인디안 모자이크 비제미니바이러스(Cassava Indian mosaic bigeminivirus), 치노 델 95inali 비제미니바이러스 (Chino del 95inali bigeminivirus), 목화잎 구겨짐 비제미니바이러스(Cotton leaf crumple bigeminivirus), 목화잎 말림 비제미니바이러스(Cotton leaf curl bigeminivirus), 크로톤 옐로우 베인 모자이크 비제미니바이러스(Croton yellow vein mosaic bigeminivirus), 돌리초스 옐로우 모자이크 비제미니바이러스(Dolichos yellow mosaic bigeminivirus), 유포비아 모자이크 비제미니바이러스(Euphorbia mosaic bigeminivirus), 호스그램 옐로우 모자이크 비제미니바이러스(Horsegram yellow mosaic bigeminivirus), 자트로파 모자이크 비제미니바이러스(Jatropha mosaic bigeminivirus), 리마 콩 골든 모자이크 비제미니바이러스(Lima bean golden mosaic bigeminivirus), 멜론 잎말림 비제미니바이러스(Melon leaf curl bigeminivirus), 녹두 옐로우 모자이크 비제미니바이러스(Mung bean yellow mosaic bigeminivirus), 오크라 잎-말림 비제미니바이러스(Okra leaf-curl bigeminivirus), 페퍼 하우스테코 비제미니바이러스(Pepper hausteco bigeminivirus), 페퍼 텍사스 비제미니바이러스(Pepper Texas bigeminivirus), 감자 옐로우 모자이크 비제미니바이러스(Potato yellow mosaic bigeminivirus), 린코시아 모자이크 비제미니바이러스(Rhynchosia mosaic bigeminivirus), 세라노 골든 모자이크 비제미니바이러스(Serrano golden mosaic bigeminivirus), 호박 잎말림 비제미니바이러스(Squash leaf curl bigeminivirus), 담배 잎말림 비제미니바이러스(Tobacco leaf curl bigeminivirus), 토마토 오스트레일리안 잎말림 비제미니바이러스(Tomato Australian leafcurl bigeminivirus), 토마토 골든 모자이크 비제미니바이러스(Tomato golden mosaic bigeminivirus), 토마토 인디안 잎말림 비제미니바이러스(Tomato Indian leafcurl bigeminivirus), 토마토 잎 크럼블 비제미니바이러스(Tomato leaf crumple bigeminivirus), 토마토 반점 비제미니바이러스(Tomato mottle bigeminivirus), 토마토 옐로우 잎말림 비제미니바이러스(Tomato yellow leaf curl bigeminivirus), 토마토 옐로우 모자이크 비제미니바이러스(Tomato yellow mosaic bigeminivirus), 수박 백화 스턴트 비제미니바이러스(Watermelon chlorotic stunt bigeminivirus) 및 수박 말림 반점 비제미니바이러스(Watermelon curly mottle bigeminivirus)을 포함하지만, 이에 제한되지는 않는다.
본 명세서에서 사용된 "해충(pest)"라는 용어는 식물에 직접적으로 또는 간접적으로 해를 끼치는 유기체를 지칭한다. 직접적인 영향은 예를 들어 식물 잎을 먹는 것을 포함한다. 간접적인 영향은 예를 들어 질병 인자(예, 바이러스, 박테리아 등)를 식물에 전파(transmission)하는 것을 포함한다. 후자의 경우 해충은 병원체 전파의 매개체(vector) 역할을 한다.
한 구현예에 따르면, 해충은 무척추동물(invertebrate) 유기체이다.
예시적인 해충은 곤충, 선충류, 달팽이, 민달팽이(slug), 거미, 애벌레, 전갈, 응애(mite), 진드기(tick), 진균(fungi), 등을 포함하지만, 이에 제한되지는 않는다.
곤충 해충은 딱정벌레목(orders Coleoptera) (예, 딱정벌레(beetles)), 파리목(Diptera) (예, 파리, 모기), 벌목목(Hymenoptera) (예, 잎벌(sawflies), 말벌(wasp), 벌, 및 개미), 나비목(Lepidoptera) (예, 나비 및 나방), 말로파가(Mallophaga) (예, 이(lice), 예, 씹는 이(chewing lice), 무는 이(biting lice) 및 새 이(bird lice)), 노린재목(Hemiptera) (예, true bugs), 스터노르린차 아목을 포함하는 동종목(Homoptera including suborders Sternorrhyncha) (예, 진딧물(aphid), 가루이(whiteflies), 및 스케일 곤충(scale insects)), 오체노르린차(Auchenorrhyncha) (예, 매미(cicadas), 잎벌레(leafhoppers), 나무딱벌레(treehoppers), 식물벌레(planthoppers), 및 침벌레(spittlebugs)), 및 콜레오르린차(Coleorrhyncha) (예, 이끼 벌레(moss bugs) 및 딱정벌레 버그(beetle bugs)), 오쓰롭테라(Orthroptera) (예, 메뚜기(grasshoppers), 메뚜기(locust) 및 귀뚜라미(cricket), 여치(katydid) 및 웨타스(wetas)를 포함), 티사노프테라(Thysanoptera) (예, 총채벌레(Thrip)), 데르마프테라(Dermaptera) (예, 집게벌레(Earwig)), 이소프테라(Isoptera) (예, 흰개미(Termit)), 아노플루라(Anoplura) (예, 빠는 이(Sucking lice)), 시포나프테라(Siphonaptera) (예, 벼룩(Flea)), 트리코프테라(Trichoptera) (예, 캐디스플라이(caddisflies)) 등을 포함하지만, 이에 제한되지는 않는다.
본 발명의 곤충 해충에는 옥수수: 오스트리아 누발라리스(Ostrinia nubilalis), 유럽 옥수수 천공충(European corn borer); 아그로티스 입실론(Agrotis ipsilon), 블랙 컷웜(black cutworm); 헬리코버파 지아(Helicoverpa zea), 옥수수 귀지렁이(corn earworm); 스포도프테라 프루기페르다(Spodoptera frugiperda), 가을 군대벌레(fall armyworm); 디아트라이아 그란디오셀라(Diatraea grandiosella), 남서부 옥수수 천공충(southwestern corn borer); 엘라스모팔푸스 리그노셀루스(Elasmopalpus lignosellus), 작은 옥수수 줄기 천공충(lesser cornstalk borer); 디아트라에아 사카리스(Diatraea saccharalis), 사탕수수 천공충(sugarcane borer); 디아브로티카 비르기페라(Diabrotica virgifera), 서부 옥수수 뿌리벌레(western corn rootworm); 디아브로티카 롱기코르니스 바르베리(Diabrotica longicornis barberi), 북부 옥수수 뿌리벌레(northern corn rootworm); 디아브로티카 언데시문타타 하워드(Diabrotica undecimpunctata howardi), 남부 옥수수 뿌리벌레(southern corn rootworm); 멜라노투스 종(Melanotus spp.), 선충(wireworms); 사이클로체팔라 보리얼리스(Cyclocephala borealis), 북부 가면 풍뎅이과 꽃(northern masked chafer 흰색 땅벌레(white grub)); 사이클로체팔라 96inalized96(Cyclocephala 96inalized96), 남부 가면 풍뎅이과(southern masked chafer 흰색 땅벌레(white grub)); 포필리아 자포니카(Popillia japonica), 일본 딱정벌레(Japanese beetle); 채토크네마(Chaetocnema pulicaria), 옥수수 벼룩 딱정벌레(corn flea beetle); 스페노포러스 마이디스(Sphenophorus maidis), 옥수수 빌버그(maize billbug); 로팔로시품 마이디스(Rhopalosiphum maidis), 옥수수 잎 진딧물(corn leaf aphid); 아누라피스 메이드라디시스(Anuraphis maidiradicis), 옥수수 뿌리 진딧물(corn root aphid); 블리스 류콥테루스 류콥테루스(Blissus leucopterus leucopterus), 빈대 벌레(chinch bug); 멜라노플러스 페머루브럼(Melanoplus femurrubrum), 붉은다리 메뚜기(redlegged grasshopper); 멜라노플러스 산귀니페스(Melanoplus sanguinipes), 미그라토리 메뚜기(migratory grasshopper); 하일레미아 플라투라(Hylemya platura), 종자옥수수 구더기(seedcorn maggot); 아그로마이자 파르비코니스(Agromyza parvicornis), 옥수수 블랏 잎나방벌렐(corn blot leafminer); 아나포트립스 옵스크루스(Anaphothrips obscrurus), 총채 벌레(grass thrips); 솔레놉시스 마일스타(Solenopsis milesta), 도둑 개미(thief ant); 테트라니쿠스 우르티카에(Tetranychus urticae), 점박이 진드기(twospotted spider mite); 수수:칠로 파르텔루스(Sorghum: Chilo partellus), 수수 천공충(sorghum borer); 스포도프테라 프루기페르다(Spodoptera frugiperda), 가을 군대벌레(fall armyworm); 헬리코버파 지아(Helicoverpa zea), 옥수수 귀지렁이(corn earworm); 엘라스모팔푸스 리그노셀루스(Elasmopalpus lignosellus), 작은 옥수수 줄기 천공충(lesser cornstalk borer); 펠리타 96inalized9696n(Feltia 96inalized9696n), 알갱이 땅벌레(granulate cutworm); 필로파가 96inaliz(Phyllophaga 96inaliz), 흰색 땅벌레(white grub); 엘레오데스(Eleodes), 코노데루스(Conoderus), 및 에올루스 종(Aeolus spp.), 선충(wireworms); 오울레마 멜라노푸스(Oulema melanopus), 시리얼 잎벌레(cereal leaf beetle); 채토크네마 펄라카리아(Chaetocnema pulicaria), 옥수수 벼룩 딱정벌레(corn flea beetle); 스페노포러스 마이디스(Sphenophorus maidis), 옥수수 빌버그(maize billbug); 로팔로시품 마이디스(Rhopalosiphum maidis); 옥수수 잎 진딧물(corn leaf aphid); 시파 플라바(Sipha flava), 노란 사탕수수 진딧물(yellow sugarcane aphid); 블리스 류콥테루스 류콥테루스(Blissus leucopterus leucopterus), 빈대 벌레(chinch bug); 콘타리니아 소르기콜라(Contarinia sorghicola), 수수 각다귀(sorghum midge); 테트라니쿠스 신나바리누스(Tetranychus cinnabarinus), 카민 거미 진드기(carmine spider mite); 테트라니쿠스 우티카에(Tetranychus urticae), 두점박이 거미 진드기(twospotted spider mite); 밀: 슈달레티카 우니펀타타(Wheat: Pseudaletia unipunctata), 군대 벌레(army worm); 스포도프테라 프루기페르다(Spodoptera frugiperda), 가을 군대벌레(fall armyworm); 엘라스모팔푸스 리그노셀룻,(Elasmopalpus lignosellus), 작은 옥수수 줄기 천공충(lesser cornstalk borer); 아그로티스 오르소고니아(Agrotis orthogonia), 서부 야도충(western cutworm); 엘라스모팔푸스 리그노셀루스(Elasmopalpus lignosellus), 작은 옥수수 줄기 천공충(lesser cornstalk borer); 오울레마 멜라노푸스(Oulema melanopus), 시리얼 잎벌레(cereal leaf beetle);하이페라 96inalized (Hypera 96inalize), 클로버 잎 바구미(clover leaf weevil); 디아브로티카 언데시문타타 하워드(Diabrotica undecimpunctata howardi), 남부 옥수수 뿌리 벌레(southern corn rootworm); 러시아 밀 진딧물(Russian wheat aphid); 쉬자피스 그라미늄(Schizaphis graminum), 그린버그(greenbug); 마크로시품 아베나에(Macrosiphum avenae), 영국 곡물 진딧물(English grain aphid); 멜라노플러스 페머루브럼(Melanoplus femurrubrum), 붉은다리 메뚜기(redlegged grasshopper); 멜라노플러스 디퍼렌티알리스(Melanoplus differentialis), 차동의 메뚜기(differential grasshopper); 멜라노플러스 산귀니페스(Melanoplus sanguinipes), 철새 메뚜기(migratory grasshopper); 마예티올라 데스트럭터(Mayetiola destructor), 헤시안 파리(Hessian fly); 시토디플로시스 모셀라나(Sitodiplosis mosellana), 밀 야도충(wheat midge); 메로미자 97inalized(Meromyza 97inalized), 밀 줄기 구더기(wheat stem maggot); 하일레미야 코아크타테(Hylemya coarctate), 밀 구근 파리(wheat bulb fly); 플랭클리니엘라 푸스카(Frankliniella fusca), 담배 총채벌레(tobacco thrips); 세푸스 싱투스(Cephus cinctus), 밀 줄기 잎벌(wheat stem sawfly); 아세리아 튤리패(Aceria tulipae), 밀 말림 진드기(wheat curl mite); 해바라기: 술레이마 헬리안타나(Sunflower: Suleima helianthana), 해바라기 꽃봉오리 나방(sunflower bud moth); 호모어소마 일렉텔럼(Homoeosoma electellum), 해바라기 나방(sunflower moth); 키고그라마 익스클라마티오니스(zygogramma exclamationis), 해바라기 딱정벌레(sunflower beetle); 보티루스 리보숫,(Bothyrus gibbosus), 당근 딱정벌레(carrot beetle); 네올라시옵테라 무르트펠트티아나(Neolasioptera murtfeldtiana), 해바라기 종자 구더기(sunflower seed midge); 목화: 헬리오티스 비레센스(Cotton: Heliothis virescens), 목화 싹벌레(cotton budworm); 헬리코버파 지아(Helicoverpa zea), 목화 볼웜(cotton bollworm); 스포돕테라 엑시구아(Spodoptera exigua), 비트 군대벌레(beet armyworm); 펙티노포라 고시피엘라(Pectinophora gossypiella), 핑크 볼웜(pink bollworm); 안토노무스 그란디스(Anthonomus grandis), 볼 바구미(boll weevil); 에이피스 고시피(Aphis gossypii), 목화 진딧물(cotton aphid); 슈다토모셀리스 세리아투스(Pseudatomoscelis seriatus), 목화 플리호퍼(cotton fleahopper); 트리알레우로데스 아틸로네아(Trialeurodes abutilonea), 띠를두른 흰가루이 (bandedwinged whitefly); 리구스 리네올라리스(Lygus lineolaris), 변색된 식물벌레(tarnished plant bug); 멜라노플러스 페머루브럼(Melanoplus femurrubrum), 붉은다리 메뚜기(redlegged grasshopper); 멜라노플러스 디퍼렌티알리스(Melanoplus differentialis), 차동의 메뚜기(differential grasshopper); 총채벌레 타바시(Thrips tabaci), 양파 총채벌레(onion thrips); 프랭클린키엘라 푸스카(Franklinkiella fusca), 담배 총채벌레(tobacco thrips); 테트라니쿠스 신나바리누스(Tetranychus cinnabarinus), 카민 거미 진드기(carmine spider mite); 테트라니쿠스 우르티카에(Tetranychus urticae), 두점박이 거미 진드기(twospotted spider mite); 쌀: 디아그라에아 사카리스(Rice: Diatraea saccharalis), 사탕수수 천공충(sugarcane borer); 스포도프테라 프루기페르다(Spodoptera frugiperda), 가을 군대벌레(fall armyworm); 헬리코버파 지아(Helicoverpa zea), 옥수수 귀지렁이(corn earworm); 콜라피스 브루네아(Colaspis brunnea), 그레이프 콜라피스(grape colaspis); 리소롭트러스 오리조필루스(Lissorhoptrus oryzophilus), 쌀 물 바구미(rice water weevil); 시토필루스 오리자에(Sitophilus oryzae), 쌀 바구미(rice weevil); 네포테틱스 니그로픽투스(Nephotettix nigropictus), 벼 잎벌레(rice leafhopper); 블리스 류콥테루스 류콥테루스(Blissus leucopterus leucopterus), 빈대 벌레(chinch bug); 아크로스터눔 힐라레(Acrosternum hilare), 녹색 노린재(green stink bug); 대두(soybean): 슈도플러시아 97inalize(Soybean: Pseudoplusia 97inalize), 콩 루퍼(soybean looper); 안티카르시아 젬마탈리스(Anticarsia gemmatalis), 벨벳빈 애벌레 (velvetbean caterpillar); 플라티페나 스캄(Plathypena scabs), 녹색 클로버벌레(green cloverworm); 오스트리니아 누빌랄리스(Ostrinia nubilalis), 유럽 옥수수 천공충(European corn borer); 아그로티스 입실론(Agrotis ipsilon), 검은 야도충(black cutworm); 스포돕테라 엑시구아(Spodoptera exigua), 비트 군대벌레(beet armyworm); 헬리오티스 비레센스(Heliothis virescens), 면봉벌레(cotton budworm); 헬리코버파 지아(Helicoverpa zea), 목화 볼웜(cotton bollworm); 에필라크나 바리베스티스(Epilachna varivestis), 멕시코 콩 딱정벌레(Mexican bean beetle); 미주스 페르시카에(Myzus persicae), 녹색 복숭아 진딧물(green peach aphid); 엠포아스카 파바에(Empoasca fabae), 감자 잎벌레(potato leafhopper); 아크로스터눔 힐라레(Acrosternum hilare), 녹색 노린재(green stink bug); 멜라노플러스 페머루브럼(Melanoplus femurrubrum), 붉은다리 메뚜기(redlegged grasshopper); 멜라노플러스 디퍼렌티알리스(Melanoplus differentialis), 차동의 메뚜기(differential grasshopper); 하일레미아 플라투라(Hylemya platura), 종자옥수수 구더기(seedcorn maggot); 세리코트립스 바리아빌리스(Sericothrips variabilis), 대두 총채벌레(soybean thrips); 총채벌레 타바시(Thrips tabaci), 양파 총채벌레(onion thrips); 테트라니쿠스 투르케스탄(Tetranychus turkestani), 딸기 거미 진드기(strawberry spider mite); 테트라니쿠스 우르티카에(Tetranychus urticae), 두점박이 거미 진드기(twospotted spider mite); 보리: 오스트리니아 누빌랄리스(Barley: Ostrinia nubilalis), 유럽 옥수수 천공충(European corn borer); 아그로티스 입실론(Agrotis ipsilon), 검은 야도충(black cutworm); 쉬자피스 그라미늄(Schizaphis graminum), 녹색벌레(greenbug); 블리스 류콥테루스 류콥테루스(Blissus leucopterus leucopterus), 빈대 벌레(chinch bug); 아크로스터눔 힐라레(Acrosternum hilare), 녹색 노린재(green stink bug); 유스키스투스 세르부스(Euschistus servus), 갈색 노린재(brown stink bug); 델리아 플라투라(Delia platura), 종자옥수수 구더기(seedcorn maggot); 마예티올라 디스트럭터(Mayetiola destructor), 헤시안 파리(Hessian fly); 페트로비아 라텐스(Petrobia latens), 갈색 밀 진드기(brown wheat mite); 유채: 브레비코린 브라시카에(Oil Seed Rape: Brevicoryne brassicae), 양배추 진딧물(cabbage aphid); 필로트레타 크루시페라에(Phyllotreta cruciferae), 벼룩 딱정벌레(Flea beetle); 마메스트라 콘피구라타(Mamestra configurata), 베르타 군대벌레(Bertha armyworm); 플루텔라 자일로스텔라(Plutella xylostella), 다이아몬드-등 나방(Diamond-back moth); 델리아 종(Delia ssp.), 뿌리 구더기(Root maggots)을 포함하지만, 이에 제한되지는 않는다. 한 구현예에 따르면, 병원체는 선충이다.
예시적인 선충류는 굴을파는 선충(burrowing nematode) (라도폴루스 시밀리스(Radopholus similis)), 예쁜꼬마선충(Caenorhabditis elegans), 라도폴루스 아라보코페아(Radopholus arabocoffeae), 프라틸렌쿠스 코페애(Pratylenchus coffeae), 뿌리혹선충(root-knot nematode) (멜로이도진 종(Meloidogyne spp.)), 낭종 선충(cyst nematode) (헤테로데라 및 글로보데라 종(Heterodera and Globodera spp.)), 뿌리 병변 선충(root lesion nematode) (프라틸렌쿠스 종(Pratylenchus spp.)), 줄기 선충(stem nematode) (디틸렌쿠스 딥사시(Ditylenchus dipsaci)), 소나무재선충(pine wilt nematode) (부르사펠렌쿠스 실로필루스(Bursaphelenchus xylophilus)), 레니폼 선충(reniform nematode) (로틸렌쿨루스 레니포르미스(Rotylenchulus reniformis)), 시피네마 인덱스(Xiphinema index), 나코부스 아버란스(Nacobbus aberrans) 및 아펠렌코이데스 베세이(Aphelenchoides besseyi)를 포함하지만, 이에 제한되지 않는다.
한 구현예에 따르면, 병원체는 진균(fungus)이다. 예시적인 진균(fungi)은 푸라시움 옥시스포룸(Fusarium oxysporum), 렙토스파에리아 마쿨란스(Leptosphaeria maculans) (포마 링감(Phoma lingam)), 스켈레로티니아 스클레로티오룸(Sclerotinia sclerotiorum), 피라쿨라리아 그리세아(Pyricularia grisea), 지베렐라 후지쿠로이(Gibberella fujikuroi) (푸사리움 모닐리포르메(Fusarium moniliforme)), 마그나포르테 오리재(Magnaporthe oryzae), 보트리티스 시네리얼(Botrytis cinereal), 푸치니아 종(Puccinia spp.), 푸사리움 그라미네아룸(Fusarium graminearum), 블루메리아 그라미니스(Blumeria graminis), 미코스파에렐라 그라미니콜라(Mycosphaerella graminicola), 콜레토트리쿰 종(Colletotrichum spp.), 우스틸라고 메이디스(Ustilago maydis), 멜람소라 리니(Melampsora lini), 파콤소라 파키리지(Phakopsora pachyrhizi)  리조토니아 솔라니(Rhizoctonia solani)을 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 해충은 개미, 벌, 말벌(wasp), 애벌레, 딱정벌레, 달팽이, 민달팽이(slug), 선충, 벌레(bug), 파리, 가루이(whitefly), 모기, 메뚜기, 집게벌레(earwig), 진딧물(aphid), 스케일(scale), 총채벌레(thrip), 거미, 진드기(mite), 실리드(psyllid), 및 전갈이다.
한 구현예에 따르면, 병원체 또는 해충 저항성 또는 내성 식물을 생성하기 위해, RNA 침묵 분자는 병원체 또는 해충에 감수성(sensitivity)을 부여하는 식물의 유전자의 관심 RNA를 표적화하도록 설계된다.
바람직하게, 병원체 또는 해충 유전자의 침묵은 병원체 또는 해충이 식물체에 야기하는 손상을 제한하는 결과를 초래하는 병원체 또는 해충의 억제, 방제(control), 및/또는 사멸을 초래한다. 해충의 방제는 해충을 죽이는 것, 해충이 식물체에 덜 손상을 주는 방식으로 해충의 번식력 또는 성장을 변경하는 것, 생산되는 자손의 수를 줄이는 것, 덜 적합한 해충을 생산하는 것, 포식자(predator) 공격에 더 민감한 해충을 생성하는 것, 해충이 식물체를 먹는 것을 억제하는 것을 포함하지만, 이에 제한되지는 않는다.
한 구현예에 따르면, 표적화될 예시적인 식물의 유전자는 오이에서 바이러스 감염에 대한 감수성을 부여하는 유전자 eIF4E를 포함하지만, 이제 제한되지는 않는다.
한 구현예에 따르면, 병원체 저항성 또는 내성 식물을 생성하기 위해, RNA 침묵 분자는 병원체의 유전자의 관심 RNA를 표적화하도록 설계된다.
식물 또는 병원체 표적 유전자의 결정은 통상적인 생물정보학(bioinformatics) 분석과 같은 당업계에 공지된 임의의 방법을 사용하여 달성될 수 있다.
한 구현예에 따르면, 선충 병원체 유전자는 라도폴루스 시밀리스(Radopholus similis) 유전자 Calreticulin13 (CRT) 또는 collagen 5 (col-5)를 포함한다.
한 구현예에 따르면, 진균 병원체 유전자는 푸사리움 옥시스포룸(Fusarium oxysporum) 유전자 FOW2, FRP1, 및 OPR를 포함한다.
한 구현예에 따르면, 병원체 유전자는, 예를 들어, 액포의(vacuolar) ATPase (vATPase), dvssj1 및 dvssj2, α-tubulin snf7을 포함한다.
특정 구현예에 따르면, 식물이 브라시카 나푸스(Brassica napus) (유채(rapeseed))인 경우, 관심 표적 RNA는 렙토스파에리아 마쿨란스(Leptosphaeria maculans) (포마 링감(Phoma lingam))의 유전자(예를 들어, 포마 지고병(Phoma stem canker)을 유발함) (예를 들어, GenBank Accession No: AM933613.1에 명시된 바와 같음); 벼룩 딱정벌레(Flea beetle) (필로트레타 비툴라(Phyllotreta vittula) 또는 크리소멜과(Chrysomelidae)의 유전자, 예를 들어 GenBank Accession No: KT959245.1에 명시된 바와 같음); 또는 스클레로티니아 스클레로티오룸(Sclerotinia sclerotiorum) (예를 들어, 경화증 줄기 썩음(Sclerotinia stem rot)을 유발함) (예를 들어, GenBank Accession No: NW_001820833.1에 명시된 바와 같음)에 의한 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 시트러스 x 시넨시스(Citrus x sinensis) (오렌지)인 경우, 관심 표적 RNA는 감귤류 캔커(Citrus Canker, CCK)의 유전자(예를 들어, GenBank Accession No: AE008925에 명시된 바와 같음); 칸디다투스 리베리박터 종(Candidatus Liberibacter spp.)의 유전자(예를 들어, 감귤녹화병(Citrus greening disease)을 유발함) (예를 들어, GenBank Accession No: CP001677.5에 명시된 바와 같음); 또는 아르밀라리아 뿌리썩음병(Armillaria root rot)의 유전자(예를 들어, GenBank Accession No: KY389267.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 엘라이스 기넨시스(Elaeis guineensis) (기름야자(Oil palm))인 경우, 관심 표적 RNA는 영지 종(Ganoderma spp.) 의 유전자(예를 들어, 영지 엉덩이 썩음(Ganoderma butt rot)으로 알려진 뿌리 줄기 썩음(Basal stem rot, BSR)을 유발함) (예를 들어, GenBank Accession No: U56128.1에 명시된 바와 같음), 쐐기풀 애벌레(Nettle Caterpillar)의 유전자 또는 푸사리움 종(Fusarium spp.), 파이토프토라 종(Phytophthora spp.), 파이티움 종(Pythium spp.), 라이족토니아 솔라니(Rhizoctonia solani) (예를 들어, 뿌리 썩음(Root rot)을 유발함)중 임의의 하나의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 프라가리아 베스카(Fragaria vesca) (야생 딸기(Wild strawberry))인 경우, 관심 표적 RNA는 버티실리움 다알리아(Verticillium dahlia)의 유전자(예를 들어, 버티실리움 마름병(Verticillium Wilt)을 유발함) (예를 들어, GenBank Accession No: DS572713.1에 명시된 바와 같음); 또는 푸사리움 옥시스포럼 f.sp. 프라가리애(Fusarium oxysporum f.sp. fragariae)의 유전자(예를 들어, 푸사리움 마름병(Fusarium wilt)을 유발함) (예를 들어, GenBank Accession No: KR855868.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다;
특정 구현예에 따르면, 식물이 글리신 맥스(Glycine max) (대두)인 경우, 관심 표적 RNA는 P. 파키리지(P. pachyrhizi)의 유전자 (예를 들어, 아시안 녹병(Asian rust)로 알려진 대두 녹병(Soybean rust)를 유발함) (예를 들어, GenBank Accession No: DQ026061.1에 명시된 바와 같음); 대두 진딧물(Soybean Aphid) 의 유전자(예를 들어, GenBank Accession No: KJ451424.1에 명시된 바와 같음); 대두 왜성 바이러스(Soybean Dwarf Virus, SbDV) 의 유전자(예를 들어, GenBank Accession No: NC_003056.1에 명시된 바와 같음); 또는 녹색 노린재(Green Stink Bug) (아크로스터늄 힐라레(Acrosternum hilare))의 유전자(예를 들어, GenBank Accession No: NW_020110722.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 고시피움 라이몬디(Gossypium raimondii) (목화)인 경우, 관심 표적 RNA는 푸사리움 옥시스포룸 f.sp. 바신펙툼(Fusarium oxysporum f.sp. vasinfectum)의 유전자(예를 들어, 푸사리움 마름병(Fusarium wilt)를 유발함) (예를 들어, GenBank Accession No: JN416614.1에 명시된 바와 같음); 대두 진딧물(Soybean Aphid)의 유전자(예를 들어, GenBank Accession No: KJ451424.1에 명시된 바와 같음); 또는 핑크 볼웜(Pink bollworm) (펙티노포라 고시피엘라(Pectinophora gossypiella))의 유전자(예를 들어, GenBank Accession No: KU550964.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 오리자 사비타(Oryza sativa) (Rice)인 경우, 관심 표적 RNA는 피리쿨라리아 그리세아(Pyricularia grisea)의 유전자(예를 들어, 라이스 블라스트(Rice Blast)를 유발함) (예를 들어, GenBank Accession No: AF027979.1에 명시된 바와 같음); 지베렐라 후지쿠로이(Gibberella fujikuroi) (푸사리움 모닐리포메(Fusarium moniliforme))의 유전자(예를 들어, 바카나에 병(Bakanae Disease)을 유발함) (예를 들어, GenBank Accession No: AY862192.1에 명시된 바와 같음); 또는 줄기 천공충(Stem borer), 예를 들어, 시르포파가 인세툴라스 워커(Scirpophaga incertulas Walker) - 노란 줄기 천공충(Yellow Stem Borer), S.이노타 워커(S. innota Walker) - 하얀 줄기 천공충(White Stem Borer), 칠로 서프레쌀리스 워커(Chilo suppressalis Walker) - 줄무늬 줄기 천공충(Striped Stem Borer), 세사-미아 인페렌스 워커(Sesa- mia inferens Walker) - 분홍 줄기 천공충(Pink Stem Borer)의 유전자(예를 들어, GenBank Accession No: KF290773.1에 명시된 바와 같음)를 포함하지만, 이제 제한되지는 않는다.
특정 구현예에 따르면, 식물이 솔라눔 라이코퍼시쿰(Solanum lycopersicum) (토마토)인 경우, 관심 표적 RNA는 파이토프토라 인페스탄스(Phytophthora infestans)의 유전자(예를 들어, 역병(Late blight)을 유발함) (예를 들어, GenBank Accession No: AY855210.1에 명시된 바와 같음); 흰가루이 베미시아 타바시(whitefly Bemisia tabaci)의 유전자(예를 들어, 겐나디우스(Gennadius), 예를 들어, GenBank Accession No: KX390870.1에 명시된 바와 같음); 또는 토마토 노란잎말림 제미니바이러스(Tomato yellow leaf curl geminivirus, TYLCV)의 유전자(예를 들어, GenBank Accession No: LN846610.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 솔라눔 투베로숨(Solanum tuberosum)(감자)인 경우, 관심 표적 RNA는 파이토프토라 인페스탄스(Phytophthora infestans)의 유전자(예를 들어, 역병(Late Blight)을 유발함) (예를 들어, GenBank Accession No: AY050538.3에 명시된 바와 같음); 어위니아 종(Erwinia spp.)의 유전자(예를 들어, 감자줄기검은병(Blackleg) 및 무름병(Soft Rot)을 유발함) (예를 들어, GenBank Accession No: CP001654.1에 명시된 바와 같음); 또는 낭포 선충(Cyst Nematodes)의 유전자(예를 들어, 글로보데라 팔리다(Globodera pallida) 및 글로보데라 로스토키엔시스(G.rostochiensis)) (예를 들어, GenBank Accession No: KF963519.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 테오브로마 카카오(Theobroma cacao) (카카오)인 경우, 관심 표적 RNA는 담자균류(basidiomycete) 모니리오프토라 로레리(Moniliophthora roreri)의 유전자(예를 들어, 꼬투리 썩음병(Frosty Pod Rot)을 유발함) (예를 들어, GenBank Accession No: LATX01001521.1에 명시된 바와 같음); 모니리오프토라 페르니시오사(Moniliophthora perniciosa)의 유전자(예를 들어, 빗자루병(Witches' Broom disease)을 유발함); 또는 미리드(Mirids) 예를 들어, 디스탄티엘라 100inalized (Distantiella 100inalized) 및 살베르겔라 싱귤라리스(Sahlbergella singularis), 헬로펠티스 종(Helopeltis spp.), 모나로니온 종(Monalonion specie)의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 비티스 비니페라(Vitis vinifera) (포도) 또는 포도 덩굴(Grapevine))인 경우, 관심 표적 RNA는 클로스테로바이러스(closterovirus, GVA)의 유전자(예를 들어, 루고스 목재병(Rugose wood disease)을 유발함) (예를 들어, GenBank Accession No: AF007415.2에 명시된 바와 같음); 그레이프바인 리프롤 바이러스(Grapevine leafroll virus)의 유전자(예를 들어, GenBank Accession No: FJ436234.1에 명시된 바와 같음); 그레이프바인 판리프 퇴화증 바이러스(Grapevine fanleaf degeneration disease virus, GFLV)의 유전자(예를 들어, GenBank Accession No: NC_003203.1에 명시된 바와 같음); 또는 그레이프바인 플렉병(Grapevine fleck disease, GFkV)의 유전자(예를 들어, GenBank Accession No: NC_003347.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 옥수수(Zea mays) (옥수수(maize))는 또한 콘(corn)으로 지칭함)인 경우, 관심 표적 RNA는 가을 군대벌레(Fall Armyworm)의 유전자(예를 들어, 스포도프테라 프루기페르다(Spodoptera frugiperda)) (예를 들어, GenBank Accession No: AJ488181.3에 명시된 바와 같음); 유럽 옥수수 천공충(European corn borer)의 유전자(예를 들어, GenBank Accession No: GU329524.1에 명시된 바와 같음); 북부 및 서부 옥수수 뿌리벌레(Northern and western corn rootworms)의 유전자(예를 들어, GenBank Accession No: NM_001039403.1에 명시된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 사탕수수(sugarcane)인 경우, 관심 표적 RNA는 절간 천공충(Internode Borer)의 유전자(예를 들어, 칠로 사카리파구스 인디쿠스(Chilo Saccharifagus Indicus)), 잔토모나스 알빌레네안스(Xanthomonas Albileneans)의 유전자(예를 들어, 흰줄무늬병(Leaf Scald)을 유발함) 또는 사탕수수 황엽 바이러스(Sugarcane Yellow Leaf Virus, SCYLV)의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 밀인 경우, 관심 표적 RNA는 Puccinia striiformis의 유전자(예를 들어, stripe rust을 유발함) 또는 진딧물(Aphid)의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 보리(barley)인 경우, 관심 표적 RNA는 Puccinia hordei의 유전자(예를 들어, Leaf rust을 유발함), 푸치니아 스트리이포르미스 f. sp. 호르데이(Puccinia striiformis f. sp. Hordei)의 유전자(예를 들어, 줄무늬 녹병(stripe rust)을 유발함), 또는 진딧물(Aphid)의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 해바라기인 경우, 관심 표적 RNA는 푸치니아 헬리안신(Puccinia helianthin)의 유전자(예를 들어, 녹병(Rust disease)을 유발함); 보에레마 맥도날디(Boerema macdonaldii)의 유전자(예를 들어, 포마 검은 줄기(Phoma black stem)을 유발함); 종자 바구미(Seed weevil)의 유전자(예를 들어, 붉은색 및 회색), 예를 들어, 스미크로닉스 풀부스(Smicronyx fulvus) (붉은색); 스미크로닉스 소디더스(Smicronyx sordidus) (회색); 또는 스클레로티니아 스클레로티오룸드(Sclerotinia sclerotiorumd)의 유전자(예를 들어, 스클레로티니아 줄기 및 머리 썩음병(Sclerotinia stalk and head rot disease)을 유발함)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 고무나무(rubber plant)인 경우, 관심 표적 RNA는 마이크로사이클루스 울레이(Microcyclus ulei)의 유전자(예를 들어, 남아메리카 잎마름병(South American leaf blight, SALB)을 유발함); 리기도포러스 마이크로포러스(Rigidoporus microporus)의 유전자(예를 들어, 흰뿌리병(White root disease)을 유발함); 가노더마 슈도페륨(Ganoderma pseudoferreum)의 유전자(예를 들어, Red root disease를 유발함)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 식물이 사과 식물인 경우, 관심 표적 RNA는 네오넥트리아 디티씨마(Neonectria ditissima)의 유전자(예를 들어, 사과 탄저병(Apple Canker)를 유발함), 포도스파에라 류코트리차(Podosphaera leucotricha)의 유전자(예를 들어, 사과 흰가루병(Apple Powdery Mildew)을 유발함), 또는 벤튜리아 이나에큐알리스(Venturia inaequalis)의 유전자(예를 들어, 사과 딱지(Apple Scab)를 유발함)를 포함하지만, 이에 제한되지는 않는다.
한 구현예에 따르면, 본 발명의 방법에 의해 생성되는 식물체는 본 발명의 방법에 의해 생성되지 않는 식물체와 비교하여(즉, 야생형 식물과 비교하여) 병원체에 대하여 적어도 약 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % 또는 100 % 더 큰 저항성 또는 내성이다.
식물의 병원체에 대한 내성 또는 저항성을 평가하기 위해 당업계에 공지된 임의의 방법이 본 발명에 따라 사용될 수 있다. 예시적인 방법은 Ram*?*rez V1, Garc
Figure pct00002
a-Andrade J, Vera P., Plant Signal Behav. 2011 Jun;6(6):911-3. Epub 2011 Jun 1에 기재된 바와 같이, Botrytis cinerea에 대한 내성을 증가시키는 결과가 되는, 애기장대(Arabidopsis)에서 MYB46 발현을 감소시키는 것; 또는 Gallego-Giraldo L. 외. New Phytologist (2011) 190: 627-639 doi: 10.1111/j.1469-8137.2010.03621.x)에 기재된 바와 같이 알파파(alfalfa)에서 HCT의 하향조절이 방어 반응의 활성을 촉진하는 것을 포함하지만, 이에 제한되지는 않으며, 본 명세서에서 참고로 포함된다.
한 구현예에 따르면, 다음의 방법을 포함하는 제초제(herbicide) 저항성 식물을 생성하는 방법이 제공된다: (a) 본 발명의 일부 구현예의 식물체를 육종하는 단계, 및 (b) 제초제 저항성인 자손 식물체를 선택하는 단계.
한 구현예에 따르면, 제초제는 색소체(plastid) 내에(예를 들어, 엽록체(chloroplast) 내에) 존재하는 경로를 표적으로 한다.
따라서 제초제 저항성 식물을 생성하기 위해, RNA 침묵 분자는 엽록체 유전자 psbA (이는 제초제 아트라진(atrazine)의 표적인 광합성 퀴논 결합 막 단백질(photosynthetic quinone-binding membrane protein) QB를 암호화함) 및 EPSP 합성효소에 대한 유전자 (핵 단백질, 그러나 엽록체에서의 과발현 도는 축적은 EPSP의 전사 속도를 증가시키고 효소의 회전율(ternover)를 감소시키기 때문에 제초제 글리포세이트(glyphosate)에 대한 식물 내성을 가능하게 함)를 포함하지만, 이에 제한되지는 않는 관심 표적 RNA를 표적으로 하도록 설계된다.
한 구현예에 따르면, 본 발명의 방법에 의해 생성되는 식물체는 본 발명의 방법에 의해 생성되지 않는 식물체와 비교하여, 제초제에 대해 적어도 약 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % 또는 100 % 더 큰 저항성을 갖는다.
한 구현예에 따르면, 본 발명의 일부 구현예의 방법에 따라 생성되는 식물체가 제공된다.
한 구현예에 따르면, RISC와 결합되는 작은 RNA로 RNA 분자가 가공되도록 하고, 핵산 서열 변형이 없는 동일한 기원(origin)의 야생형 세포에서는 없도록 가공되도록 하는 핵산 서열 변형을 가진 RNA 분자를 암호화하는 폴리뉴클레오타이드 서열을 포함하는 지놈을 포함하는 유전적으로 변형된 세포가 제공된다.
본 발명의 한 측면에 따르면, 이를 필요로 하는 대상에서 질병을 치료하는 방법이 제공되며, 이 방법은 본 발명의 일부 구현예의 방법에 따른 침묵 활성 및/또는 특이성을 갖는 RNA 분자를 생성하는 것을 포함하고, 여기에서 RNA 분자는 질병의 발병(onset) 또는 진행(progression)과 관련된 유전자의 전사체에 대한 침묵 활성을 포함하여, 대상을 치료한다.
본 발명의 한 측면에 따르면, 이를 필요로 하는 대상에서 질병을 치료하기 위한, 본 발명의 일부 구현예의 방법에 따라 생성되는 침묵 활성 및/또는 특이성을 갖는 RNA 분자가 제공되며, 여기에서 RNA 분자는 질병의 발병 또는 진행과 관련된 유전자의 전사체에 대한 침묵 활성을 포함함으로써 대상을 치료한다.
한 구현예에 따르면, 질병은 감염성 질병, 단일유전자 열성 장애(monogenic recessive disorder), 자가면역 질환(autoimmune disease) 및 암성 질환(cancerous disease)이다.
"치료하는(treating)"이라는 용어는 병리학(질병, 장애 또는 상태)의 발달을 억제, 예방 또는 저지하고/하거나 병리학의 감소, 관해(remission), 또는 퇴행(regression)을 유발하는 것을 의미한다. 당업자는 다양한 방법론(methogology) 및 검정(assay)이 병리의 발달을 평가하기 위해 사용될 수 있고, 유사하게 다양한 방법론 및 검정이 병리의 감소, 관래 또는 퇴행을 평가하기 위해 사용될 수 있음을 이해할 것이다.
본 명세서에서 사용되는 "예방하는(preventing)"이라는 용어는 질병에 대한 위험이 있을 수 있지만 아직 질병을 갖는 것으로 진단되지 않은 대상에서 질병, 장애 또는 상태가 발생하지 않도록 하는 것을 의미한다.
본 명세서에서 사용된, "대상(subject)" 또는 "필요로 하는 대상(subject in need thereof)"라는 용어는 병리를 앓고 있는 임의의 연령 또는 성별의 포유동물, 바람직하게 인간을 비롯한 모든 동물을 포함한다. 바람직하게, 이 용어는 병리를 발병할 위험이 있는 개인을 포함한다.
한 구현예에 따르면, 질병은 바이러스, 진균, 박테리아, 트리파노소마(trypanosoma) 또는 원생동물 기생충(protozoan parasite)(예를 들어, 변형체(plasmodium))로부터 유래된다.
본 명세서에서 사용되는 "감염성 질환(infectious disease)"라는 용어는 만성 감염성 질환(chronic infectious disease), 아급성 감염성 질환(subacute infectious disease), 급성 감염성 질환(acute infectious disease), 바이러스성 질환, 박테리아성 질환, 원생동물성 질환, 기생충 질환, 진균성 질환, 마이코플라즈마 질환(mycoplasma disease) 및 프리온 질환(prion disease) 중 어느 하나를 지칭한다.
한 구현예에 따르면, 대상에서 감염성 질환을 치료하기 위해, RNA 침묵 분자는 감염성 질환의 발병 또는 진행과 관련된 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 질병의 발병 또는 진행과 관련된 유전자는 하기 논의되는 바와 같이 병원체의 유전자를 포함한다.
한 구현예에 따르면, 질병의 발병 또는 진행과 관련된 유전자는 하기 논의된 바와 같이 대상의 유전자를 포함한다.
한 구현예에 따르면, 관심 표적 RNA는 병원체(예, 바이러스, 박테리아, 진균 등)에 저항성을 부여하는 진핵 세포의 유전자의 산물을 포함한다. 예시적인 유전자에는 CyPA- (Cyclophilins (CyPs)), Cyclophilin A (예를 들어, Hepatitis C virus 감염용), CD81, scavenger receptor class B type I (SR-BI), ubiquitin specific peptidase 18 (USP18), phosphatidylinositol 4-kinase III alpha (PI4K-IIIα) (예를 들어, HSV 감염용) 및 CCR5- (예를 들어, HIV 감염용)을 포함하지만, 이에 제한되지는 않는다. 한 구현예에 따르면, 관심 표적 RNA는 병원체의 유전자의 산물을 포함한다.
한 구현예에 따르면, 바이러스는 아르보바이러스(arbovirus)(예를 들어, 인디아나 수포성 구내염 바이러스(Vesicular stomatitis Indiana virus) - VSV)이다. 한 구현예에 따르면, 관심 표적 RNA는 VSV 유전자의 산물, 예를 들어 G 단백질 (G), 거대 단백질(large protein) (L), 인단백질(phosphoprotein), 기질 단백질(matrix protein) (M) 또는 핵단백질(nucleoprotein)을 포함한다.
한 구현예에 따르면, 관심 표적 RNA는 gag 및/또는 vif 유전자(즉, HIV-1에서 보존된 서열); P 단백질(즉, RSV에서 바이러스 RNA-의존성 RNA 중합효소(viral RNA-dependent RNA polymerase)의 필수 단위); P mRNA(즉 PIV에서); core, NS3, NS4B 및 NS5B(즉 HCV에서); VAMP-연관 단백질(hVAP-A), La 항원 및 폴리피리미딘 관 결합 단백질(polypyrimidine tract binding protein)(PTB)(즉, HCV용)을 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 사람인 경우, 관심 표적 RNA는 말라리아를 유발하는 병원체의 유전자; HIV 바이러스의 유전자(예를 들어, GenBank Accession No: NC_001802.1에 기재된 바와 같음); HCV 바이러스의 유전자(예를 들어, GenBank Accession No: NC_004102.1에 기재된 바와 같음); 및 기생 벌레의 유전자(parasitic worm)(예를 들어, GenBank Accession No: XM_003371604.1에 기재된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 인간인 경우, 관심 표적 RNA는 암성질환과 관련된 유전자(예를 들어, bcr/abl e8a2융합 단백질에 대한 인간(Homo sapiens) mRNA, GenBank Accession No: AB069693.1에 기재된 바와 같음) 또는 골수이형성 증후군(myelodyplastic syndrome, MDS) 및 혈관 질환(vascular disease)와 관련된 유전자(예를 들어, 인간 헤파린 결합 혈관 내피 성장 인자(Human heparin-binding vascular endothelial growth factor, VEGF) mRNA, GenBank Accession No: M32977.1에 기재된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 소(cattle)인 경우, 관심 표적 RNA는 감염성 소 비기관지염 바이러스(Infectious bovine rhinotracheitis virus)(예를 들어, GenBank Accession No: AJ004801.1에 기재된 바와 같음), BRD (소 호흡기 질환 복합체(Bovine Respiratory Disease complex))를 유발하는 유형 1 소 헤르페스 바이러스(type 1 bovine herpesvirus, BHV1)의 유전자; 청설병(Bluetongue disease)(BTV 바이러스)의 유전자(예를 들어, GenBank Accession No: KP821170.1에 기재된 바와 같음); Bovine Virus Diarrhhoea (BVD)의 유전자(예를 들어, GenBank Accession No: NC_001461.1에 기재된 바와 같음); 구제역(Foot & Mouth disease)을 유발하는 피코르나바이러스(picornavirus)의 유전자(예를 들어, GenBank Accession No: NC_004004.1에 기재된 바와 같음); BRD를 유발하는 파라인플루엔자 바이러스 유형 3(Parainfluenza virus type 3, PI3)의 유전자(예를 들어, GenBank Accession No: NC_028362.1에 기재된 바와 같음); 소 결핵(Bovine Tuberculosis, bTB)을 유발하는 미코바테리움 보비스(Mycobacterium bovis, M. bovis)의 유전자(예를 들어, GenBank Accession No: NC_037343.1에 기재된 바와 같음)을 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 양(sheep)인 경우, 관심 표적 RNA는 촌충병(Tapeworms disease)을 유발하는 병원체의 유전자(단방조충(E. granulosus) 생활 주기, 단방조충(Echinococcus granulosus), 양조충(Taenia ovis), 태니아 히다티지나(Taenia hydatigena), 모니에지아(Moniezia) 종)(예를 들어, GenBank Accession No: AJ012663.1에 기재된 바와 같음); 편형동물 질환(Flatworms disease)을 유발하는 병원체의 유전자(파시올라 헤파티카(Fasciola hepatica), 파시올라 기간티카(Fasciola gigantica), 파리올로이데스 마그나(Fascioloides magna), 디크로코엘리움 덴드리티쿰(Dicrocoelium dendriticum), 보비스 주혈흡충(Schistosoma bovis))(예를 들어, GenBank Accession No: AY644459.1에 기재된 바와 같음); 청설병(Bluetongue disease)을 유발하는 유전자(BTV 바이러스, 예를 들어, GenBank Accession No: KP821170.1에 기재된 바와 같음); 및 회충병(Roundworms disease)을 유발하는 병원체의 유전자("후즈(hoose"라고도 알려진 기생충 기관지염(Parasitic bronchitis), 엘라오포라 슈나이데리(Elaeophora schneideri), 해몬쿠스 콘토르투스(Haemonchus contortus), 트리코스트롱길루스 종(Trichostrongylus species), 텔라도르사기아 써큠신타(Teladorsagia circumcincta), 쿠레리아 종(Cooperia species), 네마토디루스 종(Nematodirus species), 딕티오카울루스 105inalize (Dictyocaulus 105inalize), 프로토스트롱길루스 레페센스(Protostrongylus refescens), 뮬레리우스 캐필라리스(Muellerius capillaris), 오에소파고스토믐 종(Oesophagostomum species), 네오스트롱길루스 리니어리스(Neostrongylus linearis), 차베르티아 오비나(Chabertia ovina), 트리큐리스 오비스(Trichuris ovis)) (예를 들어, GenBank Accession No: NC_003283.11에 기재된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 돼지(pig)인 경우, 관심 표적 RNA는 아프리카 돼지 열병 바이러스(African swine fever virus, ASFV)의 유전자 (예를 들어, 아프리카 돼지 열병을 유발) (예를 들어, GenBank Accession No: NC_001659.2에 기재된 바와 같음); 고전 돼지 열병 바이러스(Classical swine fever virus)의 유전자(예를 들어, 고전 돼지 열병을 유발함) (예를 들어, GenBank Accession No: NC_002657.1에 기재된 바와 같음); 및 피코르나바이러스(picornavirus)의 유전자(예를 들어 구제역 유발)(예를 들어, GenBank Accession No: NC_004004.1에 기재된 바와 같음)를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 닭(chicken)인 경우, 관심 표적 RNA는 조류 독감(Bird flue)의 유전자(또는 조류 인플루엔자(Avian influenza)), 조류 파라믹소바이러스 1(avian paramyxovirus 1, APMV-1)의 변이 유전자(예를 들어 뉴캐슬 병(Newcastle disease) 유발), 또는 마렉병(Marek's disease)를 유발하는 병원체의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 미국투구새우(tadpole shrimp)인 경우, 관심 표적
RNA는 백색 반점 증후군 바이러스(White Spot Syndrome Virus, WSSV)의 유전자, 황두 바이러스(Yellow Head Virus, YHV), 또는 타우라 증후군 바이러스(Taura Syndrome Virus, TSV)의 유전자를 포함하지만, 이에 제한되지는 않는다.
특정 구현예에 따르면, 유기체가 연어(salmon)인 경우, 관심 표적 RNA는 감염성 연어 빈혈(Infectious Salmon Anaemia, ISA)의 유전자, 감염성 조혈 괴사(Infectious Hematopoietic Necrosis, IHN)의 유전자, 바다 이(Sea lice)의 유전자(예를 들어, 레페오프테이루스(Lepeophtheirus) 및 칼리구스(Caligus) 속의 체외 기생 요각류(ectoparasitic copepod))를 포함하지만, 이에 제한되지는 않는다.
치료의 효능을 평가하는 것은 피험자의 신체적 건강(physical well-being)을 평가하거나, 혈액 검사를 통해, 바이러스/박테리아 부하(load ) 등을 평가하는 것과 같은 당업계에 알려진 임의의 방법을 사용하여 수행할 수 있다.
본 명세서에서 사용된, "단일 유전자 열성 질환(monogenic recessive disorder)"라는 용어는 상염색체(autosome) 상의 단일 결함 유전자(single defective gene)의 결과로 야기되는 질병 또는 상태를 지칭한다.
한 구현예에 따르면, 단일 유전자 열성 질환은 자발적(spontaneous) 또는 유전적(hereditary) 돌연변이의 결과이다.
한 구현예에 따르면, 단일 유전자 열성 질환은 상염색체 우성(autosomal dominant), 상염색체 열성(autosomal recessive) 또는 X-연관 열성(X-linked recessive)이다.
예시적인 단일 유전자 열성 질환은 중증 복합 면역결핍(severe combined immunodeficiency, SCID), 혈우병(hemophilia), 효소 결핍(enzyme deficiency), 파킨슨병(Parkinson's Disease), 비스콧-알드리치 증후군(Wiskott-Aldrich syhndrome), 낭포성 섬유증(Cystic Fibrosis), 페닐케톤뇨증(Phenylketonuria), 프리드리히 운동실조증(Friedrich's Ataxia), 뒤센 근이영양증(Duchenne Muscular Dystrophy), 헌터병(Hunter disease), 아이카르디 증후군(Aicardi Syndrome), 클라인펠터 증후군(Klinefelter's Syndrome), 레버 유전성 시신경증(Leber's hereditary optic neuropathy, LHON)을 포함하나, 이제 제한되지 않는다.
한 구현예에 따르면, 대상에서 단일 유전자 열성 질환을 치료하기 위해, RNA 침묵 분자는 단일 유전자 열성 질환과 관련된 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 장애가 파킨슨 병인 경우, 관심 표적 RNA는 SNCA (PARK1 = 4), LRRK2 (PARK8), Parkin (PARK2), PINK1 (PARK6), DJ-1 (PARK7), 또는 ATP13A2 (PARK9) 유전자의 산물을 표함한다.
한 구현예에 따르면, 장애가 혈우병 또는 폰 빌레브란트병(von Willebrand disease)인 경우, 관심 표적 RNA는, 예를 들어, 항-트롬빈(anti-thrombin) 유전자, 응고인자(coagulation factor) VIII 유전자 또는 인자 IX 유전자의 산물을 포함한다.
치료의 효능을 평가하는 것은 피험자의 신체적 건강을 평가하거나, 혈액 검사, 골수 흡인(bone marrow aspirate) 등을 통해 당업계에 알려진 임의의 방법을 사용하여 수행할 수 있다.
자가면역 질환의 비-제한적인 예는 심혈관 질환(cardiovascular disease), 류마티스 질환(rheumatoid disease), 선 질환(glandular disease), 위장 질환(gastrointestinal disease), 피부 질환(cutaneous disease), 간 질환(hepatic disease), 신경계 질환(neurological disease), 근육 질환(muscular disease), 신장 질환(nephric disease), 생식 관련 질환, 결합 조직 질환(connective tissue disease) 및 전신 질환(systemic disease)를 포함하지만, 이에 제한되지는 않는다.
자가면역 심혈관 질환(autoimmune cardiovascular disease)의 예는 죽상경화증(atherosclerosis) (Matsuura E. 외, Lupus. 1998;7 Suppl 2:S135), 심근경색증(myocardial infarction) (Vaarala O. Lupus. 1998;7 Suppl 2:S132), 혈전증(thrombosis) (Tincani A. 외, Lupus 1998;7 Suppl 2:S107-9), 베게너 육아종증(Wegener's granulomatosis), 타가야수 동맥염(Takayasu's arteritis), 가와사키 증후군(Kawasaki syndrome) (Praprotnik S. 외, Wien Klin Wochenschr 2000 Aug 25;112 (15-16):660), 항-인자 VIII 자가면역 질환(anti-factor VIII autoimmune disease) (Lacroix-Desmazes S. 외, Semin Thromb Hemost.2000;26 (2):157), 괴사성 소혈관 혈관염(necrotizing small vessel vasculitis), 현미경적 다발혈관염(microscopic polyangiitis), 처그와 슈트라우스 증후군(Churg and Strauss syndrome), pauci-immune focal necrotizing 및 초승달 사구체신염(crescentic glomerulonephritis) (Noel LH. Ann Med Interne (Paris). 2000 May;151 (3):178), 항인지질 증후군(antiphospholipid syndrome) (Flamholz R. 외, J Clin Apheresis 1999;14 (4):171), 항체 유도성 심부전(antibody-induced heart failure) (Wallukat G. 외, Am J Cardiol. 1999 Jun 17;83 (12A):75H), 혈소판 감소성 자반병(thrombocytopenic purpura) (Moccia F. Ann Ital Med Int. 1999 Apr-Jun;14 (2):114; Semple JW. 외, Blood 1996 May 15;87 (10):4245), 자가면역 용혈성 빈혈(autoimmune hemolytic anemia) (Efremov DG. 외, Leuk Lymphoma 1998 Jan;28 (3-4):285; Sallah S. 외, Ann Hematol 1997 Mar;74 (3):139), 샤가스병의 심장 자가면역(cardiac autoimmunity in Chagas' disease) (Cunha-Neto E. 외, J Clin Invest 1996 Oct 15;98 (8):1709) 및 항-헬퍼 T 림프구 자가면역(anti-helper T lymphocyte autoimmunity) (Caporossi AP. 외, Viral Immunol 1998;11 (1):9)를 포함하나, 이에 제한되지는 않는다.
자가면역 류마티스 질환(autoimmune rheumatoid disease)의 예는 류마티스 관절염(rheumatoid arthritis) (Krenn V. 외, Histol Histopathol 2000 Jul;15 (3):791; Tisch R, McDevitt HO. Proc Natl Acad Sci units S A 1994 Jan 18;91 (2):437) 및 강직성 척추염(ankylosing spondylitis) (Jan Voswinkel 외, Arthritis Res 2001; 3 (3): 189)를 포함하나, 이에 제한되지는 않는다.
자가면역 선 질환(autoimmune glandular disease)의 예는 췌장 질환(pancreatic disease), 제 1형 당뇨병(Type I diabetes), 갑상선 질환(thyroid disease), 그레이브스병(Graves' disease), 갑상선염(thyroiditis), 자발성 자가면역 갑상선염(spontaneous autoimmune thyroiditis), 하시모토 갑상선염(Hashimoto's thyroiditis), 특발성 점액종(idiopathic myxedema), 난소 자가면역(ovarian autoimmunity), 자가면역 항-정자 불임(autoimmune anti-sperm infertility), 자가면역 전립선염(autoimmune prostatitis) 및 제 1형 자가면역 다선 증후군(Type I autoimmune polyglandular syndrome)을 포함하나, 이에 제한되지는 않는다. 질병은 췌장의 자가면역(autoimmune diseases), 제 1형 당뇨병(Type 1 diabetes) (Castano L. 및 Eisenbarth GS. Ann. Rev. Immunol. 8:647; Zimmet P. Diabetes Res Clin Pract 1996 Oct;34 Suppl:S125), 자가면역 갑상선 질환(autoimmune thyroid diseases), 그레이브스병(Graves' disease) (Orgiazzi J. Endocrinol Metab Clin North Am 2000 Jun;29 (2):339; Sakata S. 외, Mol Cell Endocrinol 1993 Mar;92 (1):77), 자발성 자가면역 갑상선염(spontaneous autoimmune thyroiditis) (Braley-Mullen H. and Yu S, J Immunol 2000 Dec 15;165 (12):7262), 하시모토 갑상선염(Hashimoto's thyroiditis) (Toyoda N. 외, Nippon Rinsho 1999 Aug;57 (8):1810), 특발성 점액종(idiopathic myxedema) (Mitsuma T. Nippon Rinsho. 1999 Aug;57 (8):1759), 난소 자가면역(ovarian autoimmunity) (Garza KM. 외, J Reprod Immunol 1998 Feb;37 (2):87), 자가면역 항-정자 불임(autoimmune anti-sperm infertility) (Diekman AB. 외, Am J Reprod Immunol. 2000 Mar;43 (3):134), 자가면역 전립선염(autoimmune prostatitis) (Alexander RB. 외, Urology 1997 Dec;50 (6):893) 및 제 1형 자가면역 다선 증후군(Type I autoimmune polyglandular syndrome) (Hara T. 외, Blood. 1991 Mar 1;77 (5):1127)을 포함하나, 이에 제한되지는 않는다.
자가면역 위장 질환(autoimmune gastrointestinal diseases)의 예는 만성 염증성 장 질환(chronic inflammatory intestinal diseases) (Garcia Herola A. 외, Gastroenterol Hepatol. 2000 Jan;23 (1):16), 체강 질환(celiac disease) (Landau YE. 및 Shoenfeld Y. Harefuah 2000 Jan 16;138 (2):122), 대장염(colitis), 회장염(ileitis) 및 크론병(Crohn's disease)을 포함하나, 이에 제한되지는 않는다.
자가면역 피부 질환(autoimmune cutaneous diseases)의 예는 자가면역 수포성 피부 질환(autoimmune bullous skin diseases), 예를 들어, 심상성 천포창(pemphigus vulgaris), 수포성 유사 천포창(bullous pemphigoid) 및 낙엽상천포창(pemphigus foliaceus)을 포함하나, 이에 제한되지는 않는다.
자가면역 간 질환(autoimmune hepatic disease)의 예는 간염(hepatitis), 자가면역 만성 활동성 간염(autoimmune chronic active hepatitis) (Franco A. 외, Clin Immunol Immunopathol 1990 Mar;54 (3):382), 원발성 담즙성 간경변(primary biliary cirrhosis) (Jones DE. Clin Sci (Colch) 1996 Nov;91 (5):551; Strassburg CP. 외, Eur J Gastroenterol Hepatol. 1999 Jun;11 (6):595) 및 자가면역 간염(autoimmune hepatitis) (Manns MP. J Hepatol 2000 Aug;33 (2):326)을 포함하나, 이에 제한되지는 않는다.
자가면역 신경계 질환(autoimmune neurological disease)의 예는 다발성 경화증(multiple sclerosis) (Cross AH. , J Neuroimmunol 2001 Jan 1;112 (1-2):1), 알츠하이머병(Alzheimer's disease) (Oron L. 외, J Neural Transm Suppl. 1997;49:77), 중증 근무력증(myasthenia gravis) (Infante AJ. And Kraig E, Int Rev Immunol 1999;18 (1-2):83; Oshima M. 외, Eur J Immunol 1990 Dec;20 (12):2563), 신경병증(neuropathies), 운동 신경병증(motor neuropathies) (Kornberg AJ. J Clin Neurosci. 2000 May;7 (3):191); 길랭-바레증후군(Guillain-Barre syndrome) 및 자가면역 신경병증(autoimmune neuropathies) (Kusunoki S. Am J Med Sci. 2000 Apr;319 (4):234), 근무력증(myasthenia), 람베르트-이튼 근무력 증후군(Lambert-Eaton myasthenic syndrome) (Takamori M. Am J Med Sci. 2000 Apr;319 (4):204); 부종양 신경계 질환(paraneoplastic neurological diseases), 소뇌 위축증(cerebellar atrophy), 부종양 소뇌 위측증(paraneoplastic cerebellar atrophy) 및 강직-인간 증후군(stiff-man syndrome) (Hiemstra HS. 외, Proc Natl Acad Sci units S A 2001 Mar 27;98 (7):3988); 비-부종양 강직 인간 증후군(non-paraneoplastic stiff man syndrome), 진행성 소뇌 위측증(progressive cerebellar atrophies), 뇌염(encephalitis), 라스무센 뇌염(Rasmussen's encephalitis), 근위축성 측삭 경화증(amyotrophic lateral sclerosis), 시데남 무도병(Sydeham chorea), 질드라 투렛 증후군(Gilles de la Tourette syndrome) 및 자가면역 다내분비병증(autoimmune polyendocrinopathies) (Antoine JC. 및 Honnorat J. Rev Neurol (Paris) 2000 Jan;156 (1):23); 면역이상 신경병증(dysimmune neuropathies)(Nobile-Orazio E. 외, Electroencephalogr Clin Neurophysiol Suppl 1999;50:419); 후천성 신경근 긴장증(acquired neuromyotonia), 선천성 다발관절 만곡증(arthrogryposis multiplex 108inalized108)(Vincent A. 외, Ann N Y Acad Sci. 1998 May 13;841:482), 신경염(neuritis), 시신경염(optic neuritis) (Soderstrom M. 외, J Neurol Neurosurg Psychiatry 1994 May;57 (5):544) 및 신경퇴행성 질환(neurodegenerative diseases)을 포함하나, 이에 제한되지는 않는다.
자가면역 근육 질환(autoimmune muscular disease)의 예는 근염(myositis), 자가면역 근염(autoimmune myositis) 및 원발성 쇼그렌 증후군(primary Sjogren's syndrome) (Feist E. 외, Int Arch Allergy Immunol 2000 Sep;123 (1):92) 및 평활근 자가면역 질환(smooth muscle autoimmune disease) (Zauli D. , Biomed Pharmacother 1999 Jun;53 (5-6):234)를 포함하나, 이에 제한되지 않는다.
자가면역 신장 질환(autoimmune nephric diseases)의 예는 신염(nephritis) 및 자가면역 간질 신염(autoimmune interstitial nephritis) (Kelly CJ. J Am Soc Nephrol 1990 Aug;1 (2):140)을 포함하나, 이에 제한되지 않는다.
생식과 관련된 자가면역 질환의 예는 반복적인 태아 상실(repeated fetal loss) (Tincani A. 외, Lupus 1998;7 Suppl 2:S107-9)을 포함하나, 이에 제한되지 않는다.
자가면역 결합 조직 질환(autoimmune connective tissue disease)의 예는 귀 질환(ear diseases), 자가면역 귀 질환(autoimmune ear diseases) (Yoo TJ. 외, Cell Immunol 1994 Aug;157 (1):249) 및 내이의 자가면역 질환(autoimmune diseases of the inner ear) (Gloddek B. , Ann N Y Acad Sci 1997 Dec 29;830:266)를 포함하지만, 이에 제한되지 않는다.
자가면역 전신 질환(autoimmune systemic disease)의 예는 전신 홍반성 루프스(lupus erythematosus) (Erikson J. 외, Immunol Res 1998;17 (1-2):49) 및 전신 경화증(systemic sclerosis) (Renaudineau Y. 외, Clin Diagn Lab Immunol. 1999 Mar;6 (2):156); Chan OT. 외, Immunol Rev 1999 Jun;169:107)을 포함하나, 이에 제한되지 않는다.
한 구현예에 따르면, 자가면역 질환은 전신성 홍반성 루푸스(systemic lupus erythematosus, SLE)를 포함한다.
한 구현예에 따르면, 대상에서 자가면역 질환을 치료하기 위해, RNA 침묵 분자는 자가면역 질환과 관련된 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 질환이 루푸스인 경우, 관심 표적 RNA는 B 세포에 의해 병리학적으로 생성된 것과 같은 항핵 항체(antinuclear antibody, ANA)를 포함한다.
치료의 효능을 평가하는 것은 피험자의 신체적 건강을 평가하거나, 혈액 검사, 골수 흡인(bone marrow aspirate) 등을 통해 당업계에 알려진 임의의 방법을 사용하여 수행할 수 있다.
본 발명의 일부 구현예의 방법에 의해 치료될 수 있는 암의 비-제한적 예는 임의의 고형 또는 비-고형 암 및/또는 암 전이(cancer metastasis) 또는 전암(precancer)일 수 있으며, 이는 위장관의 종양 [결장 암종(colon carcinoma), 직장 암종(rectal carcinoma), 결장 직장 암종(colorectal carcinoma), 결장 직장암(colorectal cancer), 결장 직장 선종(colorectal adenoma), 제 1형 유전성 비-폴립(hereditary nonpolyposis type 1), 제 2형 유전성 비-폴립(hereditary nonpolyposis type 2), 제 3형 유전성 비-폴립(hereditary nonpolyposis type 3), 제6형 유전성 비-폴립(hereditary nonpolyposis type 6); 결장 직장암, 제7형 유전성 비-폴립(hereditary nonpolyposis type 7), 소장 및/또는 대장 암종, 식도 암종(esophageal carcinoma), 식도암을 수반한 비후화(tylosis with esophageal cancer), 위 암종(stomach carcinoma), 췌장 암종(pancreatic carcinoma), 췌장 내분비 종양(pancreatic endocrine tumors)], 자궁내막 암종(endometrial carcinoma), 융기성 피부 섬유육종(dermatofibrosarcoma protuberans), 담낭 암종(gallbladder carcinoma), 담관 종양(Biliary tract tumors), 전립선암(prostate cancer), 전립선 선암종(prostate adenocarcinoma), 신장암(renal cancer) (예를 들어, 제 2형 또는 제 2형 윌름스 종양(Wilms' tumor)), 간암(liver cancer) (예를 들어, 간모세포종(hepatoblastoma), 간세포 암종(hepatocellular carcinoma), 간세포암(hepatocellular cancer)), 방광암(bladder cancer), 배아 횡문근육종(embryonal rhabdomyosarcoma), 생식세포 종양(germ cell tumor), 영양막 종양(trophoblastic tumor), 고환 생식세포 종양(testicular germ cells tumor), 난소의 미성숙 기형종(immature teratoma of ovary), 자궁의(uterine), 상피성 난소의(epithelial ovarian), 엉치꼬리종양(sacrococcygeal tumor), 융모암(choriocarcinoma), 태반 부위 영양막 종양(placental site trophoblastic tumor), 상피 성인 종양(epithelial adult tumor), 난소 암종(ovarian carcinoma), 장액선 난소암(serous ovarian cancer), 난소 성대 종양(ovarian sex cord tumors), 자궁경부 암종(cervical carcinoma), 자궁경부암(uterine cervix carcinoma), 소세포 및 비소세포 폐암종(small-cell and non-small cell lung carcinoma), 비인두의(nasopharyngeal), 유방암종(breast carcinoma) (예를 들어, 유관 유방암(ductal breast cancer), 침윤성 관내 유방암(invasive intraductal breast cancer), 산발성(sporadic) ; 유방암(breast cancer), 유방암에 대한 감수성(susceptibility to breast cancer), 4형 유방암(type 4 breast cancer), 유방암-1(breast cancer-1), 유방암-3(breast cancer-3); 유방-난소암(breast-ovarian cancer)), 편평세포 암종(squamous cell carcinoma) (예를 들어, 두경부에서), 신경성 종양(neurogenic tumor), 성상세포종(astrocytoma), 신경절모세포종(ganglioblastoma), 신경모세포종(neuroblastoma), 림프종(lymphomas) (예를 들어, 호지킨병(Hodgkin's disease), 비-호지킨 림프종(non-Hodgkin's lymphoma), B 세포, 버킷(Burkitt), 피부 T 세포(cutaneous T cell), 조직구(histiocytic), 림프모구(lymphoblastic), T 세포, 흉선(thymic)), 신경아교종(gliomas), 선암종(adenocarcinoma), 부신 종양(adrenal tumor), 유전성 부신피질암종(hereditary adrenocortical carcinoma), 뇌 악성 종양(brain malignancy) (종양(tumor)), 다양한 기타 암종 (예를 들어, 기관지 생성 대세포(bronchogenic large cell), 관의(ductal), 에를리히-레트르 복수(Ehrlich-Lettre ascites), 표피모양(epidermoid), 대세포(large cell), 루이스 폐(Lewis lung), 수질의(medullary), 점막 표피모양(mucoepidermoid), 귀리 세포(oat cell), 소 세포(small cell), 방추 세포(spindle cell), 유극세포(spinocellular), 이행 세포(transitional cell), 미분화(undifferentiated), 암육종(carcinosarcoma), 융모막 암종(choriocarcinoma), 낭선암종(cystadenocarcinoma)), 뇌실막모세포종(ependimoblastoma), 상피종(epithelioma), 적백혈병(erythroleukemia) (예를 들어, 프렌드(Friend), 림프아구(lymphoblast)), 섬유육종(fibrosarcoma), 거대 세포 종양(giant cell tumor), 신경교 종양(glial tumor), 교모세포종(glioblastoma) (예를 들어, 다형성(multiforme), 성상세포종(astrocytoma)), 간신경교종(glioma hepatoma), 이종하이브리도종(heterohybridoma), 이종골수종(heteromyeloma), 조직구종(histiocytoma), 하이브리도마(hybridoma) (예를 들어, B 세포), 부신종(hypernephroma), 인슐린종(insulinoma), 섬 종양(islet tumor), 각막종(keratoma), 평활근모세포종(leiomyoblastoma), 평활근육종(leiomyosarcoma), 백혈병(leukemia) (예를 들어, 급성 림프성(acute lymphatic), 급성 림프아구성(acute lymphoblastic), 급성 림프아구성 전 B세포(acute lymphoblastic pre-B cell), 급성 림프아구성 T-세포 백혈병(acute lymphoblastic T cell leukemia), 급성거대모구성(acute - megakaryoblastic), 단핵구성(monocytic), 급성 골수성(acute myelogenous), 급성 골수양성(acute myeloid), 호산구 증가증을 수반한 급성 골수양성(acute myeloid with eosinophilia), B 세포(B cell), 호염기성(basophilic), 만성 골수양성(chronic myeloid), 만성의(chronic), B 세포, 호산구 증가증(eosinophilic), 프렌드(Friend), 과립구(granulocytic) 또는 골수성(myelocytic), 모세포(hairy cell), 림프구(lymphocytic), 거핵모세포(megakaryoblastic), 단핵구(monocytic), 단핵구-대식세포(monocytic-macrophage), 골수모구성(myeloblastic), 골수성(myeloid), 골수단핵구(myelomonocytic), 형질세포(plasma cell), 전구B-세포(pre-B cell), 전골수구성(promyelocytic), 아급성(subacute), T 세포(T cell), 림프성 신생물(lymphoid neoplasm), 골수성 악성종양 소인(predisposition to myeloid malignancy), 급성 비림프구성 백혈병(acute nonlymphocytic leukemia), 림프육종(lymphosarcoma), 흑색종(melanoma), 유방 종양(mammary tumor), 비만세포종(mastocytoma), 수모세포종(medulloblastoma), 중피종(mesothelioma), 전이성 종양(metastatic tumor), 단핵구 종양(monocyte tumor), 다발성 골수종(multiple myeloma), 골수이형성 증후군(myelodysplastic syndrome), 골수종(myeloma), 신모세포종(nephroblastoma), 신경 조직 신경교 종양(nervous tissue glial tumor), 신경 조직 신경 종양(nervous tissue neuronal tumor), 신경종(neurinoma), 신경모세포종(neuroblastoma), 희소돌기아교종(oligodendroglioma), 골연골종(osteochondroma), 골수종(osteomyeloma), 골육종(osteosarcoma) (예를 들어, 유잉(Ewing's)), 유두종(papilloma), 이행 세포(transitional cell), 갈색세포종(pheochromocytoma), 뇌하수체종양(pituitary tumor) (침습성의(invasive)), 형질세포종(plasmacytoma), 망막모세포종(retinoblastoma), 횡문근 육종(rhabdomyosarcoma), 육종(sarcoma) (예를 들어, 유잉(Ewing's), 조직구 세포(histiocytic cell), 옌센(Jensen), 골형성(osteogenic), 망상세포(reticulum cell)), 신경초증(schwannoma), 피하종양(subcutaneous tumor), 기형암종(teratocarcinoma) (예를 들어, 다능성(pluripotent)), 기형육종(teratoma), 고환 종양(testicular tumor), 흉선종(thymoma) 및 모포상피종(trichoepithelioma), 위암(gastric cancer), 섬유육종(fibrosarcoma), 다형성 교모세포종(glioblastoma multiforme); 다발성 사구체 종양(multiple glomus tumors), 리프라우메니 증후군(Li-Fraumeni syndrome), 지방육종(liposarcoma), 린치 암 가족 증후군 II(lynch cancer family syndrome II), 남성 생식 세포 종양(male germ cell tumor), 비말 세포 백혈병(mast cell leukemia), 갑상선 수질(medullary thyroid), 다발성 수막종(multiple meningioma), 내분비 종양 점액육종(endocrine neoplasia myxosarcoma), 부신경절종(paraganglioma), 가족성 비크로마핀(familial nonchromaffin), 모기질종(pilomatricoma), 유두상의(papillary), 가족성(familial) 및 산발성(sporadic), 횡문근 소인 증후군(rhabdoid predisposition syndrome), 가족성(familial), 횡문근 종양(rhabdoid tumors), 연조직 육종(soft tissue sarcoma), 및 교모세포종을 동반한 터콧 증후군(Turcot syndrome with glioblastoma)을 포함하지만, 이에 제한되지는 않는다.
한 구현예에 따르면, 본 발명의 일부 구현예의 방법에 의해 치료될 수 있는 암은 혈액 암성종양(hematologic malignancy)를 포함한다. 예시적인 혈액 암성종양은 ABL 티로신 키나제(ABL tyrosine kinase)의 상이한 다른 염색체 대한 악성 융합(malignant fusion)을 포함하여 BCR-ABL로 명명되는 것을 생성하고, 이는 차례로 악성 융합 단백질을 생성한다. 따라서, mRNA의 융합점(fusion point)을 표적으로 하는 것은 하향 조절을 위해 융합 mRNA만을 침묵시킬 수 있는 반면, 세포에 필수적인 정상 단백질은 보존될 것이다.
한 구현예에 따르면, 대상에서 암성 질환을 치료하기 위해, RNA 침묵 분자는 암성 질환과 관련된 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 관심 표적 RNA는 종양 유전자(oncogene) (예, 돌연변이된 종양유전자(mutated oncogene))의 산물을 포함한다.
한 구현예에 따르면, 관심 표적 RNA는 종양 억제인자의 기능을 회복시킨다.
한 구현예에 따르면, 관심 표적 RNA는 RAS, MCL-1 또는 MYC 유전자의 산물을 포함한다.
한 구현예에 따르면, 관심 표적 RNA는 세포자멸사-관련 유전자(apoptosis-related gene)의 BCL-2 군의 산물을 포함한다.
예시적인 표적 유전자는 돌연변이 우성 음성(mutant dominant negative) TP53, Bcl-x, IAPs, Flip, Faim3 및 SMS1을 포함하지만, 이에 제한되지 않는다.
한 구현예에 따르면, 암이 흑색종(melanoma)인 경우, 관심 표적 RNA는 BRAF를 포함한다. BRAF 돌연변이의 여러 형태가 예를 들어, V600E, V600K, V600D, V600G, 및 V600R을 포함하는 본 명세서에서 고려된다.
한 구현예에 따르면, 상기 방법은 면역 세포가 악성 세포(malignant cell) (예를 들어, 혈액학상 악성 세포(cells of a hematological malignancy))를 (직접적으로 또는 간접적으로) 사멸시킬 수 있도록 관심 표적 RNA를 표적으로 하는 백혈구, 예를 들어, T 세포, B 세포 또는 NK 세포 (예, 환자 또는 세포 기증자)와 같은 건강한 면역 세포의 RNA 침묵 분자를 표적화함으로써 영향을 받는다.
한 구현예에 따르면, 상기 방법은 암 인자(cancer factor)에 의해 조작되는(manipulated) (즉, 악성을 인식하는 면역 반응을 억제하기 위해) 단백질 (즉, 관심 표적 RNA)을 침묵시키기 위해 RNA 침묵 분자를 표적화함으로써 영향을 받아, 암이 천연 면역계(native immune system)에 의해 인식되고 근절될 수 있다.
치료의 효능을 평가하는 것은 종양 성장 또는 신생물(neoplasms)의 수 또는 전이(metastases)를, 예를 들어 MRI, CT, PET-CT에 의해, 혈액검사, 초음파(ultrasound), x-ray 등에 의해 평가하는 것과 같이 당업계에 공지된 임의의 방법을 사용하여 수행할 수 있다.
본 발명의 한 측면에 따르면, 이를 필요로 하는 대상에서 화학요법제(chemotherapeutic agent)의 효능 및/또는 특이성을 향상시키는 방법이 제공되며, 상기 방법은 본 발명의 일부 구현예의 방법에 따라 침묵 활성 및/또는 특이성을 갖는 RNA 분자를 생성하는 것을 포함하며, 여기에서 RNA 침묵 분자는 화학요법제의 효능 및/또는 특이성의 향상과 관련된 유전자의 전사체에 대한 침묵 활성을 포함한다.
본 명세서에서 사용된 바와 같이, "화학요법제(chemotherapeutic agent)"라는 용어는 신생물(enoplams)의 성장 또는 전이(metastases)를 감소, 예방, 완화(mitigate), 제한 및/또는 지연시키거나, 신생물 또는 다른 임의의 기전의 괴사(necrosis) 또는 세포사멸사(apoptosis)에 의해 직접적으로 신생물 세포(neoplastic cell)을 사멸시키는 제제, 또는, 그렇지 않으면 신생물 질환(예, 암)이 있는 대상에서 신생물의 성장 또는 전이를 감소, 예방, 완화, 제한, 및/또는 지연시키기 위해 약학적 유효량(pharmaceutically-effective)으로 사용될 수 있는 제제를 의미한다.
화학요법제는 플루오로피리미딘(fluoropyrimidines); 피리미딘 뉴클레오사이드(pyrimidine nucleosides); 퓨린 뉴클레오사이드(purine nucleosides); 항-엽산제(anti-folates), 백금제(platinum agents); 안트라사이클린/안트라세네디온(anthracyclines/anthracenediones); 에피포도필로톡신(epipodophyllotoxins); 캄프토테신(camptothecins) (예, 카레니테신(Karenitecin)); 호르몬; 호르몬 복합체(hormonal complexes); 항호르몬제(antihormonals); 효소, 단백질, 펩타이드 및 다클로 및 또는 단론 항체; 면역제제(immunological agents); 빈카 알카로이드(vinca alkaloids); 탁산(taxanes); 에포틸론(epothilones); 항미세관제(antimicrotubule agents); 알킬화제(alkylating agents); 길항물질(antimetabolites); 토포이소머라제 억제제(topoisomerase inhibitors); 항바이러스제(antivirals); 및 다양한 기타 페소독성제(cytotoxic) 및 세포증식 억제제(cytostatic agents)를 포함하나, 이에 제한되지 않는다.
특정 구현예에 따르면, 화학요법제는 아바렐릭스(abarelix), 알데스류킨(aldesleukin), 알데스류킨(aldesleukin), 알렘투주맙(alemtuzumab), 알리트레티노인(alitretinoin), 알로퓨리놀(allopurinol), 알트레타민(altretamine), 아미포스틴(amifostine), 아나스트로졸(anastrozole), 삼산화비소(arsenic trioxide), 아스파라기나제(asparaginase), 아자시티딘(azacytidine), 베바쿠지맙(bevacuzimab), 벡사로텐(bexarotene), 블레오마이신(bleomycin), 보르테조밉(bortezomib), 부설판(busulfan), 칼루스테론(calusterone), 카페시타빈(capecitabine), 카르포플라틴(carboplatin), 카르무스틴(carmustine), 셀레콕시브(celecoxib), 세툭시맙(cetuximab), 시스플라틴(cisplatin), 클라드리빈(cladribine), 클로파라빈(clofarabine), 시클로포스파미드(cyclophosphamide), 시타라빈(cytarabine), 다카르바진(dacarbazine), 닥티노마이신(dactinomycin), 악티노마이신 D(actinomycin D), 다르베포에틴 알파(Darbepoetin alfa), 다베포에틴 알파(Darbepoetin alfa), 다우노루비신 리포솜(daunorubicin liposomal), 다우노루비신(daunorubicin), 데시타빈(decitabine), (데닐류킨디프티톡스)Denileukindiftitox, 덱스라족산(dexrazoxane), 덱스라존산(dexrazoxane), 도세탁셀(docetaxel), 독소루비신(doxorubicin), 드로모스타놀로 프로피오네이트(dromostanolone propionate), 엘리엇 B 용액(Elliott's B Solution), 에피루비신(epirubicin), 에포에틴 알파(Epoetin alfa), 에를로티닙(erlotinib), 에스트라무스틴(estramustine), 에토포시드(etoposide), 엑세메스탄(exemestane), 필그라스팀(Filgrastim), 플록수리딘(floxuridine), 플루다라빈(fludarabine), 플루오로우라실 5-FU(fluorouracil 5-FU), 풀베스트란트(fulvestrant), 게피티닙(gefitinib), 젬시타빈(gemcitabine), 젬투주마보조가미신(gemtuzumabozogamicin), 고세렐린 아세테이트(goserelin acetate), 히스트렐린 아세테이트(histrelin acetate), 하이드록시우레아(hydroxyurea), 이브리투모맙티욱세탄(IbritumomabTiuxetan), 이다루비신(idarubicin), 이포스파미드(ifosfamide), 이마티닙메실레이트(imatinibmesylate), 인터페론 알파 2a(interferon alfa 2a), 인터페론 알파-2b(Interferon alfa-2b), 이리노테칸(irinotecan), 레날리도마이드(lenalidomide), 레트로졸(letrozole), 류코보린(leucovorin), 류프롤리드 아세테이트(Leuprolide Acetate), 레바미솔(levamisole), 로무스틴(lomustine), CCNU, 메클로레타민(meclorethamine), 질소 머스타드(nitrogen mustard), 메게스트롤 아세테이트(megestrol acetate), 멜팔란(melphalan), L-PAM, 머캅토퓨린 6-MP(mercaptopurine 6-MP), 메스나(mesna), 메토트렉세이트(methotrexate), 미토마이신 C(mitomycin C), 미토탄(mitotane), 미톡산트론(mitoxantrone), 난드롤론펜프로피오네이트(nandrolonephenpropionate), 넬라라빈(nelarabine), 노페투모맙(Nofetumomab), 오프렐베킨(Oprelvekin), 오프렐베킨(Oprelvekin), 옥살리플라틴(oxaliplatin), 파클리탁셀(paclitaxel), 팔리퍼민(palifermin), 파미드로네이트(pamidronate), 페가데마제(pegademase), 페가스파가제(pegaspargase), 페그필그라스팀(Pegfilgrastim), 페메트렉세드 이나트륨(pemetrexed disodium), 펜토스타틴(pentostatin), 피포브로만(pipobroman), 플리카마이신미트라마이신(plicamycinmithramycin), 포르피머 나트륨(porfimer sodium), 프로카바진(procarbazine), 퀴나크린(quinacrine), 라스부리카제(Rasburicase), 리툭시맙(Rituximab), 사그라모스팀(sargramostim), 소라페닙(sorafenib), 스트렙토조신(streptozocin), 수니티닙 말레에이트(sunitinib maleate), 타목시펜(tamoxifen), 테모졸로미드(temozolomide), 테니포사이드 VM-26(teniposide VM-26), 테스토락톤(testolactone), 티오구아닌 6-TG(thioguanine 6-TG), 티오테파(thiotepa), 티오테파(thiotepa), 토포테칸(topotecan), 토레미펜(toremifene), 토시투모맙(Tositumomab), 트라스투주맙(Trastuzumab), 트레티노 ATRA(tretinoin ATRA), 우라실 머스타드(Uracil Mustard), 발루비신(valrubicin), 빈블라스틴(vinblastine), 비노렐빈(vinorelbine), 졸레드로네이트(zoledronate) 및 졸레드론산(zoledronic acid)을 포함하지만, 이에 제한되지 않는다.
한 구현예에 따르면, 화학요법제의 효능은 관심 표적 RNA에 대해 RNA 침묵 분자의 침묵 활성 및/또는 특이성을 부여하도록 설계된 DNA 편집제로 치료되지 않은 대상에서 화학요법제의 효과와 비교하여, 약 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 99 % 또는 100 % 만큼 향상된다.
화학요법제의 효능 및/또는 특이성을 평가하는 것은 종양 성장 또는 신생물의 수 또는 전이를 MRI, CT, PET-CT에 의해, 혈액검사, 초음파(ultrasound), x-ray 등에 의해 평가 하는 것과 같이 당업계에 공지된 임의의 방법을 사용하여 수행할 수 있다.
한 구현예에 따르면, 상기 방법은 면역 세포가 화학요법에 대한 암의 저항성을 감소시킬 수 있도록 관심 RNA를 표적으로 하는 백혈구, 예를 들어, T 세포, B 세포 또는 NK 세포 (예, 환자로부터 또는 세포 기증자로부터)와 같은 건강한 면역 세포의 RNA 침묵 분자를 표적화함으로써 영향을 받는다.
한 구현예에 따르면, 상기 방법은 면역 세포가 화학요법에 대한 저항성이 있도록 관심 RNA 를 표적으로 하는 백혈구, 예를 들어, T 세포, B 세포 또는 NK 세포 (예, 환자로부터 또는 세포 기증자로부터)와 같은 건강한 면역 세포의 RNA 침묵 분자를 표적화함으로써 영향을 받는다.
한 구현예에 따르면, 대상에서 화학요법제의 효능 및/또는 특이성을 향상시키기 위해, RNA 침묵 분자는 화학요법제의 효능 및/또는 특이성의 억제와 관련된 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 관심 표적 RNA는 약물 대사 효소 유전자(drug-metabolising enzyme gne)의 산물 (예를 들어, 시토크롬(cytochrome) P450 [CYP] 2C8, CYP2C9, CYP2C19, CYP2D6, CYP3A4, CYP3A5, 디하이드로피리미딘 탈수소효소(dihydropyrimidine dehydrogenase), 우리딘 이인산 글루쿠로노실트랜스퍼라제(uridine diphosphate glucuronosyltransferase, UGT) 1A1, 글루타티온-S-트랜스퍼라제(glutathione S-transferase), 설포트랜스퍼라제(sulfotransferase, SULT) 1A1, N-아세틸트랜스퍼라제(N-acetyltransferase, NAT), 티오퓨린 메틸트랜스퍼라제(thiopurine methyltransferase, TPMT) 및 약물 수송체(drug transporters) (P-당단백질(P-glycoprotein) [다제 내성1(multidrug resistance 1)], 다제 내성 단백질 2(multidrug resistance protein 2, MRP2), 유방암 저항성 단백질(breast cancer resistance protein, BCRP)을 포함한다.
한 구현예에 따르면, 관심 표적 RNA는 항-자가소멸 유전자(anti-apoptotic gene)를 포함한다. 예시적인 표적 유전자는 Bcl-2 군 구성원, 예를 들어, Bcl-x, IAPs, Flip, Faim3 및 SMS1을 포함하나, 이에 제한되지는 않는다.
본 발명의 한 측면에 따르면, 이를 필요로 하는 대상에서 세포 사멸을 유도하는 방법이 제공되며, 상기 방법은 본 발명의 일부 구현예의 방법에 따라 침묵 활성 및/또는 특이성을 갖는 RNA 분자를 생성하는 방법을 포함하며, 여기에서 RNA 분자는 세포사멸(apoptosis)와 관련된 유전자의 전사체에 대한 침묵 활성을 포함하여 대상체에서 세포사멸을 유도한다.
본 명세서에 사용되는 "세포자멸사(cell apoptosis)"라는 용어는 프로그램된 세포 사멸의 세포 과정을 지칭한다. 세포자멸(Apoptosis)은 세포질 및 핵의 뚜렷한 형태적 변화(morphologic alteration), 규칙적으로 간격을 둔 부위에서 염색질 전달(chromatin cleavage), 및 뉴클레오솜 사이 부위(internucleosomal site)에서 지놈 DNA의 핵내 분해 절단(endonucleolytic cleavage)을 특징으로 한다. 이러한 변화에는 수포(blebbing), 세포 수축(cell shrinkage), 핵 단편화(nuclear fragmentation), 염색질 응축(chromatin condensation), 및 염색체 DNA 단편화(chromosomal DNA fragmentation)가 포함된다.
한 구현예에 따르면, 세포자멸사는 관심 표적 RNA에 대해 RNA 침묵 분자의 침묵 활성 및/또는 특이성을 부여하는 DNA 편집제에 의해 치료되지 않은 대상에서의 세포 사멸과 비교하여, 약 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 99 % 또는 100 %만큼 향상된다.
세포자멸사를 평가하는 것은 당업계에 공지된 임의의 방법, 예를 들어, 세포 증식 분석(cell proliferation assay), FACS 분 등을 사용하여 수행할 수 있다.
한 구현예에 따르면, 대상에서 세포자멸사를 유도하기 위해, RNA 침묵 분자는 세포 사멸과 관련된 관심 RNA를 표적화하도록 설계된다.
한 구현예에 따르면, 관심 표적 RNA는 세포자멸사-관련 유전자(apoptosis-related gene)의 BCL-2 군의 산물을 포함한다.
한 구현예에 따르면, 관심 표적 RNA는 항-자멸 유전자(anti-apoptotic gene)을 포함한다. 예시적인 유전자는 돌연변이 우성 음성(mutant dominant negative) TP53, Bcl-x, IAPs, Flip, Faim3 및 SMS1을 포함하나, 이에 제한되지 않는다.
본 발명의 한 측면에 따르면, 진핵의 비-인간 유기체를 생성하는 방법이 제공되면, 여기에서 진핵의 비-인간 유기체의 세포 중 적어도 일부는, 핵산 서열 변형이 없는 동일한 기원의 야생형 세포에서는 가공이 이루어지지 않고, RNA 분자가 RISC와 결합된 작은 RNA로 가공되도록 하는 핵산 서열 변형을 갖는 RNA 분자를 암호화하는 폴리뉴클레오타이드 서열을 포함하는 지놈을 포함한다.
본 발명의 일부 구현예의 DNA 편집제, RNA 편집제 또는 선택적으로 공여자 올리고(또는 이를 포함하는 발현 벡터 또는 RNP 복합체)는 유기체 그 자체로(per se), 또는 적합한 담체(carrier)와 혼합되는 제약 조성물(pharmaceutical composition) 또는 부형제(excipient)로 투여될 수 있다.
본 명세서에서 사용되는 "약제학적 조성물(pharmaceutical composition)"은 생리학적으로 적합한 담체 및 부형제와 같은 다른 화항성분과 함께, 본 명세서에 기재된 하나 이상의 활성 성분의 제제를 지칭한다. 약제학적 조성물의 목적은 유기체에 대한 화합물의 투여를 용이하게 하는 것이다.
본 명세서에서 "활성 성분(active ingredient)"라는 용어는 생물학적 효과에 대해 책임이 있는 DNA 편집제 및 선택적으로 공여자 올리고를 지칭한다.
이하, "생리학적으로 허용되는 담체(physiologically acceptable carrier)" 및 "약학적으로 허용되는 담체(pharmaceutically acceptable carrier)"라는 문구는 혼용될 수 있으며, 유기체에 현저한 자극(irritation)을 일으키지 않고 투여되는 화합물의 생물학적 활성 및 특성을 저해하지 않는 담체 또는 희석제를 의미한다. 이 문구 아래에 보조제(adjuvant)가 포함된다.
본 명세서의 "부형제(excipient)"라는 용어는 활성 성분의 투여를 더욱 용이하게 하기 위해 약제학적 조성물에 첨가되는 불활성 물질을 의미한다. 부형제의 예는 탄산칼슘(calcium carbonate), 인산칼슘(calcium phosphate), 다양한 당 및 유형의 전분, 셀룰로스 유도체(cellulose derivatives), 젤라틴(gelatin), 식물성 오일 및 폴리에틸렌 글리콜(polyethylene glycol)을 포함하지만, 이에 제한되지는 않는다.
약물의 제형화 및 투여를 위한 기술은 "Remington's Pharmaceutical Sciences," Mack Publishing Co., Easton, PA, 최신판에서 찾을 수 있으며, 이는 참조로 본 명세서에 포함된다.
적절한 투여 경로는, 예를 들어 경구(oral), 직장(rectal), 경점막(transmucosal), 특히 비강(transnasal), 장(intestinal), 또는 근육내(intramuscular), 피하(subcutaneous) 및 골수내(intramedullary) 주사(injection)뿐만 아니라 척수강내(intrathecal), 직접 뇌실내(direct intraventricular), 심장내(intracardiac), 예를 들어, 우심실 또는 좌심실간 내(into the right or left venitricular cavity), 총 관상동맥 내(into the common coronary artery), 정맥내(intravenous), 복강내(intraperitoneal), 비강내(intranasal), 또는 안구내(intraoculrar) 주사를 포함하는 비경구 전달(parenteral delivery)을 포함할 수 있다.
경구 투여를 위해, 약제학적 조성물은 활성 성분을 당업계에 널리 공지된 약제학적으로 허용되는 담체와 조합함으로써 용이하게 제형화될 수 있다. 이러한 담체는 약제학적 조성물이 환자에 의한 경구 섭취를 위해 정제(tablets), 환제(pills), 당의정(dragees), 캡슐, 액체, 겔(gels), 시럽, 슬러리(slurries), 현탁액(suspension) 등으로 제형화될 수 있게 한다. 경구용 약제학적 제제는 고체 부형제를 사용하여 제조할 수 있으며, 선택적으로 생성된 혼합물을 분쇄하고, 원하는 경우 적합한 보조제(auxiliaries)를 첨가한 후 과립(granules) 혼합물을 가공하여 정제 또는 당의정 코어를 수득할 수 있다. 적합한 부형제는 특히 충전제(filler), 예컨대, 락토스(lactose), 수크로스(sucrose), 만니톨(mannitol), 또는 소비톨(sorbitol)을 포함하는 당류; 예를 들어, 옥수수 전분, 밀 전분, 쌀 전분, 감자 전분, 젤라틴, 트라가칸트 검(gum tragacanth), 메틸 셀룰로오스(methyl cellulose), 하이드록시프로필메틸-셀룰로오스(hydroxyprophylmethyl-cellulose), 나트륨 카르보메틸셀루로오스(sodium carbomethylcellulose)와 같은 셀룰로오스 제제; 및/또는 폴리비닐피롤리돈(polyvinylphrrolidone, PVP)와 같은 생리학적으로 허용 가능한 폴리머(polymer)이다. 원한다면, 가교된 폴리비닐필로리돈(cross-linked polyvinylpyrrolidone), 한천(agar), 또는 알긴산(alginic acid) 또는 알긴산 나트륨(sodium alginate)과 같은 이들의 염과 같은 붕해제(disintegrating agent)가 첨가될 수 있다.
당의정(Dragee) 코어는 적절한 코팅이 제공된다. 이를 위해, 검 인알리(gum inali), 폴리비닐피롤리돈(polyvinylpyrrolidone), 카보폴 겔(carbopol gel), 폴리에틸렌 글리콜(polyethylene glycol), 이산화티타늄(titanium dioxide), 래커 용액(lacquer solution) 및 적합한 유기용매 또는 용매 혼합물을 임의로 함유할 수 있는 농축된 당 용액이 사용될 수 있다. 식별을 위해 또는 활성 성분 용량의 다양한 조합을 특성화하기 위해 염료(dyestuff) 또는 안료를 정제 또는 당의정 코팅에 첨가할 수 있다.
경구로 사용될 수 있는 약제학적 조성물은 젤라틴으로 만들어진 푸시-핏 캡슐(push-fit capsule)뿐만 아니라 젤라틴 및 글리세롤 또는 소비톨과 같은 기소제(plasticizer)로 만들어진 연질, 밀봉 캡슐을 포함한다. 푸시-핏 캡슐은 락토스와 같은 충전제(filler), 전분과 같은 결합제(binder), 활석(talc) 또는 마그네슘 스테아레이트(magnesium stearate)와 같은 윤활제(lubricant), 및 선택적으로 안정화제(stabilizer)와 혼합된 활성 성분을 함유할 수 있다. 연질 캡슐에서 활성 성분은 지방 오일(fatty oil), 액체 파라핀, 또는 액체 폴리에틸렌 글리콜과 같은 적적한 액체에 용해되거나 현탁될 수 있다. 또한 안정제를 첨가할 수 있다. 경구 투여(oral administration)를 위한 모든 제형(formulation)은 선택한 투여 경로에 적합한 용량이어야 한다.
협측 투여(buccal administration)를 위해, 조성물은 통상적인 방식으로 제형화된 정제(tablet) 또는 로젠지(lozenge)의 형태를 취할 수 있다.
비강 흡힙(nasal inhalation)에 의한 투여의 경우, 본 발명의 일부 구현예에 따라 사용하기 위한 활성 성분은 적합한 추진제(propellant), 예를 들어, 디클로로디플루오로메탄(dichlorodifluoromethane), 트리클로로플루오로메탄(trichlorofluoromethane), 디클로로-테트라플루오로에탄(dichloro-tetrafluoroethane) 또는 이산화탄소(carbon dioxide)를 사용하여 가압 팩(pressurized pack) 또는 분무기(nebulizer)로부터 에어로졸 스프레이 제공 형태로 편리하게 전달된다. 기압 에어로졸의 경우, 투여 단위(dosage unit)은 계량된 양을 전달하기 위한 밸브를 제공함으로써 결정될 수 있다. 예를 들어, 디스펜서에 사용하기 위한 젤라틴의 캡슐 및 카트리지(catridge)는 화합물의 분말 혼합물 및 락토스 또는 전분과 같은 적합한 분말 베이스를 포함하여 제형화될 수 있다.
본 명세서에 기재된 약제학적 조성물은, 예를 들어 볼루스 주사(bolus injection) 또는 연속 주입(continuous infusion)에 의한 비경구 투여(parenteral administration)용으로 제형화될 수 있다. 주사용 제제는 단위 투여 형태, 예를 들어 앰플(ampoule) 또는 임의로 첨가된 방부제(preservative)와 함께 다중 투여 용기(multidose container)로 제공될 수 있다. 조성물은 유성(oily) 또는 수성(aqueous) 매개체(vehicle)에서 현탁액, 용액 또는 유탁액(emulsion)일 수 있고, 현탁제, 안정화제, 및/또는 분산제와 같은 제제화제(formulatory agent)를 포함할 수 있다.
비경구 투여용 약제학적 조성물은 수용성 형태의 활성 제제의 수용액을 포함한다. 추가로, 활성 성분의 현탁액은 적절한 유성 또는 수성 기반의 주사 현탁액으로 제조될 수 있다. 적합한 친유성(lipophilic) 용매 또는 매개체는 참기름(sesame oil), 또는 에틸 올레에이트(ethyl oleate), 트리글리세이드(triglyceride) 또는 리포솜(liposome)과 같은 합성 지방산 에스테르를 포함한다. 수성 주사 현탁액은 나트륨 카르복시메틸 셀룰로오스(sodium carboxymethyl cellulose), 소비톨 또는 덱스트란(dextran)과 같이 현탁액의 점도(viscosity)를 증가시키는 물질이 포함될 수 있다. 선택적으로, 현탁액은 또한 고농축 용액의 제조를 가능하게 하는 활성 성분의 용해도를 증가시키는 적합한 안정제 또는 제제를 포함할 수 있다.
대안적으로, 활성 성분은 사용 전에 적합한 매개체, 예를 들어, 살균되고(sterile), 발열원이 없는(phyrogen-free) 수성 기반의 용액으로 구성하기 위한 분말 형태일 수 있다.
본 발명의 일부 구현예의 약제학적 조성물은 또한, 예를 들어 코코아 버터 또는 기타 글리세리드(glyceride)와 같은 통상적인 좌약기제(suppository base)를 사용하여 좌제(suppository) 또는 정체 관장제(retention enemas)와 같은 직장 조성물(rectal composition)로 제제화될 수 있다.
본 발명의 일부 구현예의 맥락에서 사용하기에 적합한 약제학적 조성물은 활성 성분이 의도된 목적을 달성하기에 효과적인 양으로 함유된 조성물을 포함한다. 보다 구체적으로, 치료적 유효량은 장애의 증상(예, 암 또는 감염성 질환)의 증상을 예방, 완화(alleviate) 또는 개선(ameliorate)하거나 치료되는 대상의 생존을 연장하는데 효과적인 활성 성분(예, DNA 편집제)의 양을 의미한다.
치료적 유효량의 결정은 특히 본 명세서에 제공된 상세한 개시내용에 비추어 당업자의 능력 범위에 내에 있다.
본 발명의 방법에 사용되는 임의의 제제에 대해, 치료학적 유효량 또는 용량은 시험관 내(in vitro) 및 세포 배양 검정(cell culture assay)로부터 초기에 추정될 수 있다. 예를 들어, 원하는 농도 또는 역가(titer)를 달성하기 위해 용량을 동물 모델에서 제형화할 수 있다. 이러한 정보는 사람에게 유용한 용량을 보다 정확하게 결정하는데 사용할 수 있다.
암성 질환에 대한 동물 모델은 예를 들어, Yee 외, Cancer Growth Metastasis. (2015) 8(Suppl 1): 115-118에 기재되어 있다. 감염성 질환에 대한 동물 모델은 예를 들어, Shevach, Current Protocols in Immunology, Published Online: 1 APR 2011, DOI: 10.1002/0471142735.im1900s93에 기재되어 있다.
본 명세서에 기재된 활성 성분의 독성 및 치료 효능은 시험관 내, 세포배양 또는 실험 동물에서 표준 제약 절차에 의해 결정될 수 있다. 이러한 시험관 내 및 세포 배양 분석 및 동물 실험 연구에서 얻은 데이터는 인간에서 사용하기 위한 용량 범위를 공식화하는데 사용할 수 있다. 투여량(dosage)은 사용된 투여형태 및 사용된 투여 경로에 따라 달라질 수 있다. 정확한 제형, 투여 경로 및 용량은 환자의 상태를 고려하여 개개의 의사가 선택할 수 있다(예를 들어, Fingl, 외, 1975, in "The Pharmacological Basis of Therapeutics", Ch. 1 p.1을 참고).
투여량 및 투여 간격은 생물학적 효과(최소 유효 농도(minimal effective concentraton, MEC))를 유도하거나 억제하기에 충분한 양의 활성 성분을 제공하기 위해 개별적으로 조정될 수 있다. MEC sms 각 제제에 따라 다르지만, 시험관 내 데이터에서 추정할 수 있따. MEC를 달성하는 데 필요한 용량은 개개의 특성 및 투여 경로에 따라 다르다. 검출 분석을 사용하여 혈장 농도(plasma concentration)를 결정할 수 있다.
치료될 상태의 중증도(severity) 및 반응성(responsiveness)에 따라, 투여는 단일(single) 또는 복수(plurality) 투여일 수 있으며, 치료 과정은 수일 내지 수주 또는 치료가 이루어지거나 질병 상태의 감소가 달성될 때까지 지속된다.
투여될 조성물의 양은 물론 치료되는 대상, 고통(affliction)의 중증도, 투여 방식, 처방을 주는 의사의 판단 등에 따라 달라질 것이다.
본 발명의 일부 구현예의 조성물은, 원하는 경우, 활성 성분을 함유하는 하나 이상의 단위 투여 형태를 포함할 수 있는 FDA 승인 키드와 같은 팩 또는 디스펜서 장치로 제공될 수 있다. 팩은, 예를 들어, 블리스터 팩(blister pack)과 같은 금속 또는 플라스틱 호일을 포함할 수 있다. 팩 또는 디스펜서 장치에는 투여 지침이 포함될 수 있다. 팩 또는 디스펜서는 의약품의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해 규정한 형식으로(in a form prescribed) 컨테이너와 관련된 고지(notice)에 의해 수용될 수 있고, 이러한 고지(notice)는 조성물의 형태 또는 인간 또는 수의학적 투여에 대한 기관의 승인을 반영한다. 예를 들어, 이러한 고지는 처방약에 대한 미국 식품 의약국(U.S. Food and Drug Administration)에 의해 승인된 라벨 또는 승인된 제품 삽입에 대한 것일 수 있다. 상용성 약제학적 담체로 제형화된 본 발명의 제제를 포함하는 조성물은 또한 제조되고, 적절한 용기에 배치될 수 있고, 상기에 추가로 상세히 기재된 바와 같이 지시된 상태의 치료를 위해 라벨링될 수 있다.
추가적으로 다음이 제공된다:
일부 구현예에 따르면, 본 명세서에서 사용된 침묵 RNA의 침묵 활성은 RNA-유도 침묵 복합체(RNA-induced silencing complex, RISC)에 결합할 수 있는 RNA로 가공되는 침묵 RNA에 의해 매개된다. 일부 구현예에 따르면, 확인된 유전자는 그의 침묵 활성 및/또는 small 침묵 RNA로의 가공이 그것의 2차 구조에 의존하고, RNA-유도 침묵 복합체(RISC)와 결합할 수 있는 RNA로 가공되는 RNA 분자를 코딩하는 침묵 RNA 분자를 암호화하는 유전자와 상동이다.
본 발명은 또한 확인된 유전자에 의해 암호화된 RNA 분자에 침묵 활성을 부여할 수 있는 방법의 개발에 부분적으로 기반한다. 일부 구현예에 따르면, 확인된 유전자는 RNA 분자를 침묵시키는 데 상동인 RNA 분자를 암호화하는 확인된 유전자 요소를 추가로 포함한다. 비-제한적인 예에서, 이러한 유전자 요소는 인트론 또는 RNA 분자의 UTR을 암호화하는 영역일 수 있다.
일부 구현예에 따르면, 침묵 활성을 부여하는 것은 뉴클레오타이드 변화를 확인된 유전자에 도입하여, 이에 의해 암호화된 RNA가 RISC-결합 RNA로 가공되도록 하는 것을 포함한다. 일부 구현예에 따르면, 뉴클레오타이드 변화는 상동의 정형화된 RNA (RISC-결합 RNA로 가공될 수 있음)의 2차 구조에 상응하도록 확인된 유전자에 의해 암호화된 RNA의 2차 구조를 변형하는 것을 가능하게 한다. 일부 구현예에 따르면, 확인된 유전자에 의해 암호화된 RNA 분자의 성숙 서열은 상응하는 상동의 정형화된 침묵 RNA 내의 성숙 서열에 대해 서열 위치가 상응하는 서열을 지칭한다.
일부 구현예에 따르면, 부여된 침묵 활성은 확인된 유전자에 의해 암호화된 침묵-기능장애 RNA의 성숙 서열에 상응하는 서열에 대한 것이다. (또한 본 명세서에서 침묵 활성의 "재활성화(reactivation)"으로 지칭됨). 다른 구현예에 따르면, 부여된 침묵 활성은 선택된 표적 유전자에 대한 것이며, 이로써 침묵-기능장애 RNA의 성숙 서열이 변경되고 (또한 본 명세서에서 침묵 활성의 "재유도(redirection)"으로 지칭됨), 여기에서 다른 표적 유전자는 침묵이 부여되는 세포에 내인성 또는 외인성일 수 있다. 이론 또는 메커니즘에 얽매이지 않고, 침묵 활성의 재활성화는 일부 구현예에 따라, 확인된 유전자에 뉴클레오타이드 변화를 도입함으로써 수행되어, 침묵 활성을 갖는 침묵 RNA로 가공될 수 있는 상동 RNA 분자의 것과 실질적으로 동일한 2차 구조를 갖는 RNA 분자를 (이전에 침묵-기능장애 RNA 내에서 성숙 서열의 표적화 특이성을 유지하면서) 암호화하도록한다. 일부 구현예에 따르면, 2차 구조의 이러한 변화는 확인된 유전자에 의해 암호화된 RNA가 RISC와 결합할 수 있는 침묵 RNA로 가공될 수 있게 한다. 일부 구현예에 따르면, 뉴클레오타이드 변화를 도입하는 것은 예를 들어, 본 명세서에 참조로 포함된 WO 2019/058255에 개시된 바와 같이 잠재적으로 주형의 도입과 조합하여 유전자 편집 (예를 들어, CRISPR/Cas9 기술을 사용하여)을 통해 이루어진다.
일부 구현예에 따르면, "확인된 유전자(identified gene)"라는 용어는 엑손, 인트론 또는 UTR (즉, 침묵 분자에 의해 가공가능한 RNA에 상동성인 RNA를 암호화하는 화깅ㄴ된 서열은 독립형(strand-alone) 유전자가 아님)과 같은 유전자 요소를 추가로 포함하나, 이제 제한되지는 않는다.
일부 구현예에 따르면, 침묵 활성을 갖는 RNA로 가공가능한 RNA 분자는 RISC와 결합함으로써 매개되는 침묵 활성을 갖는 RNA 분자로 가공된다. 일부 구현예에 따르면, 침묵 활성을 갖는 RNA 분자는 RNA-유도 침묵 복합체(RISC)와 결합할 수 있는 RNA 분자이다.
일부 구현예에 따르면, 침묵 활성 및/또는 small 침묵 RNA로 가공이 RNA 분자의 2차 구조에 의존하는 RNA 분자는 마이크로RNA(miRNA) 분자이다.
한 구현예에 따르면, 침묵 활성을 갖는 RNA로 가공될 수 있는 2차 구조를 갖는 RNA 분자는 다음으로 이루어진 군으로부터 선택된다: 마이크로 RNA(miRNA), 짧은-헤어핀 RNA(short-hairpin RNA), 소형 핵 RNA(small nuclear RNA, snRNA 또는 URNA), 소핵체 RNA(small nucleolar RNA, snoRNA), 소형 카잘체 RNA(small Cajal body RNA, scaRNA), 트랜스퍼 RNA(transfer RNA, tRNA). 리보솜 RNA(ribosomal RNA. rRNA), 반복-유래 RNA(repeat-derived RNA), 자율(autonomous) 및 비자율(non-autonomous) 전이성(transposable) 및 레트로-전이성 인자-유래(retro-transposable element-derived) RNA, 자율 및 비자율 전이성 및 레트로-전이성 인자 RNA 및 긴 비-암호화 RNA(long non-coding RNA, lncRNA).
본 발명의 한 측면에 따르면, 본 명세서에서 세포 내 제 1 RNA 분자에 침묵 활성을 도입하는 방법(또한 본 명세서에서 "침묵 활성을 도입하는 방법"으로 지칭됨)이 제공되며, 다음의 방법을 포함한다:
(a) 세포 내에서 제 1 핵산 서열을 선택하는 단계, 여기에서:
i. 제 1 핵산 서열은 세포 내에서 제 1 RNA 분자로 전사 되고;
ii. 제 1 RNA 분자의 서열은 서열 동일성을 제외하고 제 2 RNA 분자의 서열과 부분적으로 상동성을 가지며; 여기에서 제 2 RNA 분자는 침묵 활성을 갖는 제 3 RNA 분자로 가공되고; 및 여기에서 제 2 RNA 분자는 세포에서 제 2 핵산 서열에 의해 암호화되고; 및
iii. 제 1 RNA 분자는 가공될 수 없거나, 또는 제 2 RNA 분자와 다르게 가공될 수 있어 (즉, 비-정형화된 가공), 따라서 제 1 RNA 분자는 제 3 RNA 분자와 동일한 성질의 침묵 활성을 갖는 RNA 분자로 가공되지 않는다.
(b) 변형된 제 1 RNA 분자를 암호화하도록 제 1핵산서열을 변형시키고, 변형된 제 1 RNA 분자는 제 2 RNA 분자가 제 3 RNA 분자로 가공될 수 있는 것과 동일한 방식으로 제 4 RNA로 가공가능하며, 제 4 RNA 분자는 제 3 RNA 분자와 동일한 성질의 침묵 활성을 가지므로, 제 1 RNA 분자에 침묵 활성을 도입하는 단계.
일부 구현예에 따르면, 제 2핵산 서열은 마이크로RNA(miRNA)를 암호화하는 유전자이다. 일부 구현예에 따르면 제 2 RNA 분자는 miRNA에 대한 전구체이다.
일부 구현예에 따르면, 제 2 RNA 분자와 상이하게 가공가능한 제 1 RNA 분자는 제 2 RNA 분자와 관련하여 정형화된 가공을 겪지 않는다.
일부 구현예에 따르면, 제 1 RNA 분자는 침묵 활성을 가질 수 있게 하는 2차 구조를 갖지 않기 때문에 침묵 활성을 갖지 않는다. 일부 구현예에 따르면, 제 1 RNA 분자의 2차 구조가 이러한 침묵 활성을 가진 RNA 분자로 가공될 수 없도록 하기 때문에, 제 1 RNA 분자는 제 3 RNA 분자의 침묵 활성에 상응하는 침묵 활성을 갖는 RNA 침묵 분자로 가공될 수 없다. 비-제한적인 예에서, 제 1 RNA 분자는 마이크로-RNA 전구체인 제 2 RNA 분자와 상동이지만, 제 1 RNA 분자는 침묵 활성을 갖는 마이크로RNA로 가공될 수 있게 하는 2차 구조를 갖지 않는다.
일부 구현예에 따르면, 제 1 RNA 분자는 제 2 RNA 분자와 상이한 2차 구조를 갖고, 따라서 제 1 RNA 분자는 가공가능하지만, 제 2 RNA 분자와는 상이하게 가공 가능하여, 제 1 RNA 분자는 제 3 RNA 분자에 상응하는 침묵 활성을 갖는 RNA 분자로 가공되지 않도록 한다. 비-제한적인 예에서, 제 2 RNA 분자는 마이크로RNA의 전구체이지만, 제 1 RNA 분자의 2차 구조는 제 2 RNA 분자와 상이하므로 제 1 RNA 분자는 마이크로 RNA와 상응하는 침묵 활성을 갖는 작은 RNA로 가공될 수 없다.
일부 구현예에 따르면, 제 1 핵산 서열을 변형시키는 것은 변형된 제 1 RNA 분자가 침묵 활성을 갖는 제 4 RNA 분자로 가공될 수 있게 하는 2차 구조를 갖도록 서열을 변형시키는 것을 포함한다.
일부 구현예에 따르면, 제 1 핵산 서열을 변형시키는 것은 변형된 제 1 RNA 분자가 본질적으로 제 2 RNA 분자의 것과 동일한 2차 구조, 선택적으로 제 2 RNA 분자와 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9% 또는 100% 동일한 2차 구조, 바람직하게 제 2 RNA 분자와 적어도 99%, 99.5%, 99.9% 또는 100% 동일한 2차 구조를 갖도록 서열을 변형시키는 것을 포함한다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.
일부 구현예에 따르면, 2차 구조는 제 2 RNA 분자의 2차 구조와 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9% 또는 100% 동일하다(예를 들어, 제 1 RNA 분자의 2차 구조는 선형의 스트링 형태로 번역되고 제 2 RNA 분자의 2차 구조의 스트링 형태와 비교된다). 당엽계에 공지된 임의의 방법을 사용하여 2차 구조는 일련의 스트링으로 번역될 수 있으며, 이는 RNAfold와 같은(이에 제한되지는 않음) 다른 일련의 스트링과 비교할 수 있다.
일부 구현예에 따르면, 제 2 RNA 분자는 침묵 활성을 갖는 제 3 RNA 분자로 가공될 수 있는 2차 구조를 갖고; 및 제 1 핵산 서열을 변형시키는 단계는 변형된 제 1 RNA 분자가 실질적으로 제 2 RNA 분자와 동일한 2차 구조를 갖도록 서열을 변형시키는 것을 포함한다.
일부 구현예에 따르면, (i) 제 2 RNA 분자는 침묵 활성을 갖는 제 3 RNA 분자로 가공될 수 있는 2차 구조를 갖고; (ii) 제 1 핵산 서열을 변형시키는 단계는 변형된 제 1 RNA 분자가 실질적으로 제 2 RNA 분자와 동일한 2차 구조를 갖도록 서열을 변형시키는 것을 포함하며; 및 (iii) 제 1 핵산서열을 변형시키는 것은 제 3 RNA 분자의 위치에 상응하는 뉴클레오타이드를 변형시키는 것을 배제하여, 침묵 활성을 갖는 제 4 RNA 분자로 가공될 수 있는 변형된 제 1 RNA 분자를 생성한다. 이 구현예는 제 1 RNA 분자 내에서 그것을 선택한 표적으로 유도하지 않고, 침묵 활성의 "재활성화(reactivation)"을 설명한다. 다른 구현예에 따르면, (i) 제 2 RNA 분자는 침묵 확성을 갖는 제 3 RNA 분자로 가공될 수 있는 2차 구조를 갖고; (ii) 제 1 핵산 서열을 변형시키는 단계는 변형된 제 1 RNA 분자가 실질적으로 제 2 RNA 분자와 동일한 2차 구조를 갖도록 서열을 변형시키는 것을 포함하며; 및 (iii) 제 1 핵산서열을 변형시키는 것은 제 3 RNA 분자의 위치에 상응하는 뉴클레오타이드를 변형시키는 것을 포함하여, 제 4 RNA 분자가 선택된 표적에 대해 침묵 활성을 갖도록 한다. 이 구현예는 내인성 또는 외인성일 수 있는 선택 표적으로 이를 유도하는 제 1 RNA 분자 내 침묵 활성의 "재유도화(redirection)"을 설명한다.
일부 구현예에 따르면, 침묵 활성을 도입하는 방법은 그들의 뉴클레오타이드 서열에 기초하여 제 1 RNA 분자 및 제 2 RNA 분자의 2차 구조를 예측하는 단계를 추가로 포함한다. 일부 구현예에 따르면, 침묵 활성을 도입하는 방법은 제 1 RNA 분자의 2차 구조를 제 2 RNA의 2차 구조와 본질적으로 동일하도록 변화시키는데 필요한 뉴클레오타이드 변화를 결정하는 단계를 추가로 포함한다.
일부 구현예에 따르면, 제 1 핵산 서열을 변형시키는 것은 변형된 제 1 RNA 분자가 RISC와 결합함으로써 매개되는 침묵 활성을 갖는 제 4 RNA 분자로 가공가능하도록 서열을 변형시키는 것을 포함한다.
일부 구현예에 따르면, 제 1 RNA 분자의 서열은 완전한 동일성을 제외하고, 제 3 RNA 분자를 암호화하는 서열과 제 1 RNA 분자 내의 상응하는 위치에 있는 서열 사이에 적어도 부분적인 상동성이 있도록 제 2 RNA 분자의 서열과 부분적으로 상동성을 갖는다.
한 구현예에 따르면, 제 1 핵산 서열은 H. sapiens로부터의 유전자이고, 여기에서 유전자는 서열 번호 352 내지 392 중 임의로 제시된 서열을 갖는 유전자로 이루어진 군으로부터 선택된다.
본 명세서에서 사용된 "약(about)"이라는 용어는 ± 10 %을 의미한다.
용어 "포함하다(comprise)", "포함하는(comprising)", "포함하다(include)", "포함하는(including)", "갖는(having)" 및 이들의 활용형은 "-를 포함하나, 이에 제한되지 않는"을 의미한다.
용어 "-로 이루어진"은 "-를 포함하고, -에 제한되는"을 의미한다.
용어 "-로 본질적으로(essentially) 이루어진"은 추가의 성분들, 단계들 및/또는 부분들이, 청구된 조성물, 방법 또는 구조체의 기본적이고 신규한 특징을 물질적으로(materially) 변형하지 않는 경우에만, 조성물, 방법 또는 구조체가 추가의 성분들, 단계들 및/또는 부분들을 포함할 수 있다는 것을 의미한다.
문맥이 명백하게 달리 지시하지 않는 한, 본 명세서에 기재된 단수형 ("a", "an" 및 "the")은 복수의 참조를 포함한다. 예를 들어, 용어 "화합물" 또는 "적어도 하나의 화합물"은 복수의 화합물 - 이들의 혼합물을 포함하는-을 포함할 수 있다.
본 출원 전반에서, 본 발명의 다양한 양태는 범위 형식(range format)으로 제시될 [0607] 수 있다. 범위 형식의 기재는 단지 편의와 간결함을 위한 것이고, 본 발명의 범위에 대한 변경될 수 없는 한계(inflexible limitation)로해석되어서는 안 된다는 것을 이해해야 한다. 따라서, 범위의 기재는 구체적으로 개시된 모든 가능한 하위 범위들 및 이 범위 내 개별적인 수치들을 갖는 것으로 고려되어야 한다. 예를 들어, 1 내지 6과 같은 범위의 기재는, 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 구체적으로 개시된 하위 범위 및 이 범위 내 개별적인 숫자들, 예를 들어, 1, 2, 3, 4, 5, 및 6을 갖는 것으로 고려되어야 한다. 이는 범위의 너비(breadth)와 관계없이 적용된다.
숫자로 나타낸 범위가 본 명세서에 명시되는 경우마다, 명시된 범위 내 임의의 인용된 숫자(분수 또는 정수)를 포함하는 것으로 의도된다. 문구 제 1의 명시된 수 내지 제 2의 명시된 수 "사이의 범위에 이르는/이른다" 및 제 1의 명시된 수"로부터" 제 2의 명시된 수"의 범위에 이르는/이른다"는 본 명세서에서 상호 교환적으로 이용되고, 상기 제 1의 명시된 수와 제 2의 명시된 수 및 이들 사이의 모든 분수 및 정수를 포함하는 것으로 의도된다.
본 명세서에 사용된 용어 "방법"은 주어진 과업을 달성하는 방식, 수단, 기법 및 절차를 의미하며, 화학, 약학, 생물학, 생화학 및 의학분야의 종사자에게 공지되거나, 또는 이들에 의해 공지된 방식, 수단, 기법 및 절차로부터 용이하게 개발된 방식, 수단, 기법 및 절차를 포함하나, 이들에 한정되는 것은 아니다.
본 명세서 사용된 용어 "치료하는"은 병태(condition)의 진행을 폐지(abrogating), 실직적으로 억제, 감속 또는 역전시키거나, 병태의 임상적(clinical) 또는 미적(aesthetical) 증상을 실질적으로 개선하거나(ameliorating), 병태의 임상적 또는 미적 증상의 출현을 실질적으로 예방하는 것을 포함한다.
명료함을 위해, 별도의 구현예의 문맥에서 기재된 본 발명의 특정한 특징들이 결합되어 단일 구현예로 또한 제시될 수 있다는 것이 인식된다. 역으로, 간결함을 위해, 단일 구현예의 문맥에서 기재된 본 발명의 다양한 특징들이 별도로, 또는 임의의 적합한 하위 결합으로, 또는 본 발명의 임의의 다른 기재된 구현예에서 적합한 것으로 또한 제시될 수 있다. 다양한 구현예들의 문맥에서 기재된 특정한 특징들은 이들 요소 없이 구현예가 무효하지 않는 한, 이러한 구현예들의 본질적인 특징으로 고려되지 않는다.
이상에서 서술되고, 아래의 청구범위에서 청구되는 본 발명의 다양한 구현예 및 측면은 다음의 실시예에서 실험적인 뒷받침을 확인한다.
본 출원에 개시된 임의의 서열번호(Sequence Identification Number, 서열번호)는, 그 서열번호가 단지 DNA 서열 형식으로만 또는 RNA 서열 형식으로만 표현된 경우에도, 그 서열번호가 언급된 맥락에 따라서 DNA 서열 또는RNA 서열을 나타낼 수 있다는 것을 이해할 것이다. 예를 들어, 서열번호 1이 DNA 서열 형식으로 표현되어 있으나 (예를 들어, 티민(thymine)을 T로 나열함), 그것은 핵산 서열에 상응하는 DNA 서열 또는 RNA 분자 핵산 서열의 RNA 서열을 나타낼 수 있다. 마찬가지로, 일부 서열이 RNA 서열 형식으로 표현되어 있더라도 (예를 들어, 우라실(uracil)을 U로 나열함), 이는 기재된 분자의 실제 유형에 따라서, dsRNA를 포함하는 RNA 분자의 서열, 또는 제시낸 RNA 서열에 대응하는 DNA 분자의 서열을 나타낼 수 있다. 어떠한 경우에도, 임의의 대체물(substitutes)로 개시된 서열을 갖는 DNA 및 RNA 분자가 모두 구상된다.
실시예
이제, 상기 설명과 함께 본 발명을 비제한적인 방식으로 설명하는 다음 실시예들이 참조된다.
일반적으로, 본 명세서에서 사용된 명명법 및 본 발명에서 활용된 실험 과정은 분자, 생화학, 미생물학적, 현미경 및 재조합 DNA(recombinant DNA) 기법을 포함한다. 이러한 기법들은 문헌에 완전히 설명되어 있다. 예를 들어, "Molecular Cloning: A laboratory Manual" Sambrook 외, (1989); "Current Protocols in Molecular Biology" Volumes I-III Ausubel, R. M., ed. (1994); Ausubel 외., "Current Protocols in Molecular Biology", John Wiley 및 Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson 외., "Recombinant DNA", Scientific American Books, New York; Birren 외. (eds) "Genome Analysis: A Laboratory Manual Series", Vols. 1-4, Cold Spring Harbor Laboratory Press, New York (1998); methodologies as set forth in U.S. Pat. Nos. 4,666,828; 4,683,202; 4,801,531; 5,192,659 and 5,272,057; "Cell Biology: A Laboratory Handbook", Volumes I-III Cellis, J. E., ed. (1994); "Current Protocols in Immunology" Volumes I-III Coligan J. E., ed. (1994); Stites 외. (eds), "Basic and Clinical Immunology" (8th Edition), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (eds), "Selected Methods in Cellular Immunology", W. H. Freeman and Co., New York (1980)을 참고한다; 이용 가능한 면역분석(immunoassay)은 특허 및 과학 문헌에 광범위하게 기술되어 있다. 예를 들어, U.S. Pat. Nos. 3,791,932; 3,839,153; 3,850,752; 3,850,578; 3,853,987; 3,867,517; 3,879,262; 3,901,654; 3,935,074; 3,984,533; 3,996,345; 4,034,074; 4,098,876; 4,879,219; 5,011,771 and 5,281,521; "Oligonucleotide Synthesis" Gait, M. J., ed. (1984); "Nucleic Acid Hybridization" Hames, B. D., and Higgins S. J., eds. (1985); "Transcription and Translation" Hames, B. D., and Higgins S. J., Eds. (1984); "Animal Cell Culture" Freshney, R. I., ed. (1986); "Immobilized Cells and Enzymes" IRL Press, (1986); "A Practical Guide to Molecular Cloning" Perbal, B., (1984) and "Methods in Enzymology" Vol. 1-317, Academic Press; "PCR Protocols: A Guide To Methods And Applications", Academic Press, San Diego, CA (1990); Marshak 외., "Strategies for Protein Purification and Characterization - A Laboratory Course Manual" CSHL Press (1996)를 참고한다; 상기 문헌들 모두 본 명세서에 완전히 명시된 경우와 마찬가지로 본 명세서에 참고로 포함된다. 기타 일반 참고문헌은 이 문서 전체에 걸쳐 제공된다. 본 문서 내 절차들은 당업계에 주지된 것으로 여겨지며 독자의 편의를 위해 제시된다. 본 문서 내 포함된 모든 정보는 참고로 본 명세서에 포함된다.
일반 재료 및 실험 방법
비-암호화(non-coding) RNA의 침묵(silencing) 활성을 부여하고 재유도(redirect)하기 위한 설계
단계 A: miRNA-유사 전구체의 식별
도 1 단계 (A)에 예시된 바와 같이, 실험방법의 순서는 다음과 같이 비-암호화 RNA(ncRNA) 전구체, 예를 들어 miRNA 전구체와 관련되지만 동일하지 않은 서열의 식별로 시작한다.
Figure pct00003
다양한 숙주 종들, 예를 들어 애기장대(Arabidopsis, A. thaliana), 인간(Human, H. sapiens) 및 예쁜꼬마선충(Caenorhabditis elegans, C. elegans)의 알려진 miRNA에서 유래된 서열이 이러한 유기체의 잠재적인 miRNA-유사 전구체를 찾기 위해 사용되었다.
Figure pct00004
간략하게, 특정 유기체의 기능적 miRNA 전구체 및/또는 성숙 miRNA 서열을 사용한 블라스트(Blast) 검색은 상응하는 숙주 지놈에 대응하여 수행되어 기능적 miRNA와 유사하지만 동일하지 않은 전구체 서열(즉, miRNA-유사 서열)을 식별한다. 검색 매개 변수는 하기 "후보 세트 구성"에 자세히 설명되어 있다.
Figure pct00005
확인된 miRNA-유사 서열 중, 각각의 염기서열이 단백질을 암호화하는(protein-coding) 유전자에서 유래한 것인지 또는 비-암호화 유전자에서 유래되는지 결정되었다.
Figure pct00006
아래에 자세히 설명된 대로, miRNA-유사 전구체를 암호화하는 후보 유전자의 초기 목록은 발현 데이터에 따라 추가로 필터링되어 침묵 활성의 재활성화(및 아마도 재유도(redirection))의 기반이 될 수 있는 ncRNA 전구체를 식별하였다.
단계B: 전사된 miRNA-유사 분자를 위한 필터
다음으로, 도1 단계 (B)에서 예시된 바와 같이, 실험방법의 순서는 다음과 같이 전사된 ncRNA-유사 분자, 예. miRNA-유사분자를 위한 필터링으로 계속된다.
Figure pct00007
기능적으로 유사한 miRNA 전구체의 검출을 피하기 위해, 공개적으로 사용 가능한 여러 sRNAseq 데이터 세트에서 기능 장애 전구체에 대한 엄격한 검색을 수행하였다.
Figure pct00008
총 142개의 공개적으로 사용 가능한 sRNAseq 샘플이 민감한 발현 검출에 사용되었다(발현이 유비쿼터스하지 않은(non-ubiquitous) 경우).f
Figure pct00009
총 142개의 small RNA-seq 시퀀싱(sequencing) 샘플이 공개적으로 이용 가능한 리소스(resources)에서 추출되었다. H.sapiens 데이터 세트는 간 샘플 7개, 혈액 샘플 18개, 뇌 샘플 34개, 폐 샘플 24개 및 방광 샘플 3개를 포함하였다. 분석에 사용된 모든 인간 샘플은 건강한 개인의 것이었다. 예쁜꼬마선충(C. elegans) 샘플은 여러 발달 단계에서 유래되었다 - 배아(24개 샘플), 어린 성체(9개 샘플), L4(6개 샘플) 및 혼합 단계로부터 3개의 샘플. A.thaliana의 샘플은 식물체의 다양한 부분에서 유래되었다 - 뿌리(5 개 샘플), 새순(22개 샘플), 잎(3개 샘플) 및 묘목(7개 샘플).
Figure pct00010
특정 시퀀싱 프라이머(primer)을 찾고 다듬기(trim)기 위해, fastqc를 사용하여 각 sRNAseq 샘플에 대해 QC 분석을 수행하였다. 각 샘플의 어댑터(adapter) 시퀀스는 cutadapt를 사용하여 식별되고 다듬어졌다 (M. Martin. Cutadapt는 높은 처리량의 시퀀싱 읽기로부터 어댑터 서열을 제거한다. EMBnet.journal 17(1):10-12, May 11).
Figure pct00011
모든 sRNAseq 샘플은 해당 종의 지놈에 미스매치 없이 정렬되었고 출력(output) bam 정렬은 가공되지 않은 miRNA-유사 분자를 찾기 위해 분류되었다.
단계 C: 가공되지 않은 miRNA-유사 분자에 대한 필터
다음으로, 도1의 단계 (C)에 예시되어 있고, 및 "발현된 후보의 검출(detection of expressed candidates)" 및 "발현된 가공되지 않은 후보의 검출(detection of expressed non-processed candidates)"에서 추가로 논의된 바와 같이, 실험방법의 순서는 가공되지 않은 ncRNA, 예를 들어, miRNA-유사 분자에 대한 필터링이 계속되어, 야생형(wild-type) 대응물처럼 가공되지 않지만 발현이 되는 ncRNA만 선택된다. 간략하게, 필터링 과정은 다음과 같다:
Figure pct00012
야생형 상동체(homolog) (예를 들어 miRNA 전구체)에 상응하는 침묵 기능을 갖는 짧은 RNA(short RNA)를 생성하는 테스트된 지놈에서 후보 유전자의 검출을 피하기 위해, 작은(small) RNA(19-24 nt)에 대응하여 후보 유전자의 엄격한 검색이 앞서 언급한 sRNAseq 샘플에서 수행되었다 (sRNA와 후보 유전자가 완전히 일치하는 경우에만). sRNA는 miRNA와 같이 전구체로부터 가공된 성숙 침묵 RNA의 길이이므로 19-24 nt이었다.
Figure pct00013
일반적으로, miRNA 가공은 성숙 miRNA 서열을 만드는 두 가지 유형의 작은 RNA을 생성한다: 가이드(guide) 가닥 및 패신저(passenger) 가닥. 도2에서 예시된 바와 같이, 성숙 miRNA의 한 가닥은 일반적으로 sRNA-seq 데이터(도2에서 인간의 miR-100의 가이드 서열)를 검사할 때 더 풍부하고, 반면에 다른 가닥은 일반적으로 세포 내에서 분해되고 및 낮거나 또는 감지할 수 없는 수준이다.
Figure pct00014
따라서, 성숙 miRNA로부터 가공되지 않는 miRNA-유사 전구체는 검사된 지놈 내에서 후보 ncRNA를 필터링하여 선택되었고(이 예에서는 miRNA-유사 분자), 이는 정형적인 침묵 활성을 갖는 상동의 대응물과 같이 가공된 것이다.
Figure pct00015
이를 위해, 다양한 sRNAseq 데이터 세트는 ncRNA 상동체(homolog)의 발현 양상을 민감하게 감지하기 위해 사용되었다. (발현이 어디에나 있지 않은, 즉, 모든 조직에서 발현되지 않는 경우).
단계 D: 가공되지 않은 miRNA의 구조적 변화 검증
다음으로, 도1의 단계(D)에 예시된 바와 같이, 실험방법의 순서는 다음과 같이 단계 C로부터 가공되지 않은 ncRNA, 예를 들어 miRNA의 구조적 변화의 검증이 계속된다.
Figure pct00016
miRNA 전구체의 2차 RNA 구조 및 확인된 가공되지 않은 ncRNA는 뉴클레오타이드 서열을 기반으로 예측되었다.
Figure pct00017
같은 길이의 가공되지 않은 miRNA-유사 분자(즉, 기능장애 miRNA)의 전구체 및 기능적 전구체 간의 구조 비교 분석이 수행되었다.
Figure pct00018
단계 C에서 발현되었지만 가공되지 않은 것으로 확인되었고, 정형적인 miRNA 구조에서 변경된 구조를 추가로 나타내는 후보 miRNA-유사 전구체가 선택되었다.
Figure pct00019
참고로, 이러한 검증 단계는 침묵 활성이 2차 구조에 의해 영향을 받는, 예를 들어 miRNA, ncRNA의 상동체를 확인하려는 경우에만 관련이 있다.
단계 E: 후보자의 직접적인 침묵 활성 및 구조 복원
다음으로, 도1의 단계E에 예시된 바와 같이, 실험방법의 순서는 선택된 표적으로 확인된 ncRNA의 침묵 활성을 복원하고 잠재적으로 재유도 하는 것이 계속된다. 이를 위해서, 침묵 활성을 회복하는데 필요한 ncRNA 서열의 뉴클레오타이드 변화가 결정되었다. 침묵 활성이 2차 구조에 적어도 부분적으로 의존하는 침묵 분자에 대한 상동성을 통해 밝혀진 ncRNA(예를 들어 miRNA)의 경우, 침묵 활성의 복원 및/또는 재유도를 위해 필요한 뉴클레오타이드 변화는 상동의 침묵 분자의 구조와 상응하도록 ncRNA의 2차 구조의 복목적하는이데 필요한 것으로 구성되었다.
침묵 활성의 복원 및/또는 재유도를 위해 필요한 뉴클레오타이드 변화는, 예를 들어, my Genome Editing 방법과 같이 도입될 수 있다. 구체적으로, Genome Editing induced Gene Silencing(GEiGS)은, (본 명세서의 참고로 포함된)WO 2019/058255에 명시된 바와 같이, 및 본 명세서의 하기 예시된 바와 같이, 필수적인 변화를 도입하는데 사용될 수 있다. 이는 목적하는 위치에서 ncRNA를 암호화하는 유전자를 손상(예를 들어 CRISPR/Cas9 기술을 사용하여)하고 상동의 DNA 복구(HDR)를 통해 이를 운반하는 DNA 기증자를 제공함으로써 뉴클레오타이드 변화를 도입하여 수행될 수 있다. 간단히 말해서 필터링된 후보에 대해 다음과 같이 수행될 수 있다:
Figure pct00020
후보 유전자에 의해 발현되는 기능장애miRNA-유사 전구체 분자의 구조는 그 서열을 기반으로 예측된다(예를 들어 도 10A-N, 11A-J 및 12A-I의 애기장대(Arabidopsis thaliana)에서 확인된 miRNA-유사 유전자의 예측 구조 참조).
Figure pct00021
2차 구조가 상응하는 기능적 miRNA의 구조와 일치하도록(및 따라서 침묵 활성을 도입하기 위해)필수적인 후보 miRNA-유사 RNA 분자의 서열 내의 변화가 결정된다. 이것은 뉴클레오타이드 변화의 다른 조합을 반복적으로 시험하여 계산적으로 수행될 수 있다. 참고로, 변경된 뉴클레오타이드는 상응하는 기능적 miRNA 분자에서 성숙 miRNA의 위치에 해당하는 위치의 뉴클레오타이드는 제외하였다.
Figure pct00022
재활성화된 miRNA 분자의 침묵 특이성을 관심 RNA로 향하게 하기 위해, 확인된 miRNA-유사 RNA 분자의 서열내에서 추가적으로 필요한 변화가 결정된다. 이러한 변화는 (하기 논의된) 상응하는 기능적 miRNA내에서 성숙 miRNA의 위치에 해당하는 위치에 있다. 이러한 변화는 관심 표적에 대해 강력한 miRNA/siRNA의 서열을 도입한다.
Figure pct00023
miRNA-유사 분자의 2차 구조를 복목적하는이데 필요한 뉴클레오타이드 변화를 도입하고 선택한 표적 유전자를 사일런스시키도록 재유도하기 위해, Genome Editing induced Gene Silencing(GEiGS)가 사용될 수 있다. 상기 명시된 바와 같이, 이는 Cas9 시스템, miRNA-유사 유전자를 암호화하는 유전자를 표적으로 하는 sgRNA 및 공여자 DNA를 세포내로 도입함으로써 달성될 수 있다. 공여자 DNA는 목적하는 변화를 가진 miRNA-유사 유전자의 서열을 포함하여 그것을 재활성시키고 선택한 표적으로 유도한다. (본 명세서의 참고로 포함된)WO 2019/058255에 명시된 바와 같이, 및 본 명세서의 하기 예시된 바와 같이, HDR의 사용을 통해 목적하는 변화를 도입할 수 있도록 한다.
Figure pct00024
아래의 표 1A-B는, 상기 명시된, GeiGS와 함께 사용될 수 있는 sgRNA및 공여자 DNA의 설계를 나열하여 (애기장대(Arabidopsis thaliana)에서 확인되어진) miRNA-유사 유전자 Dead_mir859 및 Dead_mir1334에 침묵 활성을 도입하고 이를 애기장대(Arabidopsis thaliana)의 PDS3를 표적으로 재유도한다. 본 명세서의 하기 실시예2에서 입증된 바와 같이, 침묵 활성의 재활성화 및 재유도는 이들의 공여자 DNA 및 sgRNA를 사용하여 얻을 수 있는 것에 상응하는 miRNA를 사용하여 이루어졌다.
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
지놈, 지놈 주석(annotation) 및 miRNA 서열
모든 알려진 전구체 miRNA 서열 및 인간(H. sapiens), 예쁜꼬마선충(C. elegans) 및 애기장대(A. thaliana)에 대해 상응하는 성숙 가이드 및 패신저 서열 목록은 miRBase (version 22)에서 다운로드 되었다 [The microRNA Registry. Griffiths-Jones S. Nucleic Acids Res (2004) 32: D109-D111]. 다음으로, 각 종의 상응하는 지놈 및 주석(annotation) 파일도 얻어졌다. 예쁜꼬마선충(C.elegans)의 경우, 앙상블 지놈(release-95)이 다운로드 되었다. 인간(H.sapiens)의 경우, GRCh38.p12 (version 29)가 genecode로부터 다운로드 되었다. 애기장대(A.thaliana)의 지놈은 TAIR (version 10)에서 다운로드되었다.
후보 세트의 구성
(단계A에 대해) 상기 명시된 바와 같이, 알려진 miRNA의 전구체 및/또는 성숙 서열을 사용하여 miRNA-유사 분자를 암호화하는 후보 유전자의 초기 목록을 확인하기 위해 각 종의 상응하는 지놈에 대응하는 블라스트(blast) 검색을 수행하였고, 그것의 발현 양상은 추가로 검토될 것이다. 각 후보에 대해, 지놈 좌표를 기반으로 서열이 추출되었고 블라스트 검색에 따라 매핑된(which it mapped) 알려진 miRNA가 기록되었다. 해당하는 알려진 miRNA에 대한 후보의 정렬 및 가이드 및 패신저 서열의 위치를 기반으로, 후보의 추정 가이드 및 패신저 서열이 추출되었고 해당 알려진 miRNA의 가이드 및 패신저 서열과 비교하여 비정상적으로 가공되었는지 여부가 표시되었다. 또한, 지놈 주석 파일을 사용하여 후보가 인트론 또는 엑손 영역 내에 있는지 여부가 결정되었다.
애기장대(A. thaliana), 예쁜꼬마선충(C. elegans) 및 인간(H. sapiens)의 후보 유전자 목록은 다음과 같이 생성되었다. 일부 구현예에 따르면, 상기 단계A에 적합하고, sRNA 발현이 결정되어야 하는 초기 후보 유전자는 기존 ncRNA(예를 들어 miRNA)에 대해 적어도 다음의 미리 정해진 상동성 매개변수(parpameter)를 가져야 한다.
1. 초기 후보 유전자는 해당 ncRNA(예를 들어 miRNA)와 관련한 기본 매개변수(www(dot)Arabidopsis(dot)org/Blast/BLASToptions(dot)jsp)를 사용하여 블라스트 검색을 통해 식별되는 RNA 분자를 암호화한다.
2. 초기 후보 유전자는 동일한 유기체로부터의 야생형 miRNA의 성숙 miRNA 서열의 적어도 50%를 커버하는 서열을 포함한다. 일부 구현예에 따르면 이 서열은 19-24 nt, 가능하게는 19-21 nt이다.
애기장대(A. thaliana)
miRbase의 알려진 A. thaliana miRNA의 전구체 서열은 기본 매개변수(www(dot)arabidopsis(dot)org/Blast/BLASToptions(dot)jsp)를 사용하여 A. thaliana의 지놈에 대한 블라스트 검색을 수행하기위해 사용되었다. 알려진 miRNA 유전자의 지놈 좌표와 교차하는 지놈 영역은 버려졌다. 초기 후보의 결과 세트는 795개의 별개의 지놈 위치로 구성되었다. 각 후보는 블라스트 검색에서 일치하는 miRbase miRNA에 따라 명명되었다. 예를 들어, ath-mir-8174를 기반으로 식별된 miRNA-유사 분자는 ath_dead_mir1334로 명명되었다. 따라서, miRNA-유사 분자의 전체 이름은 ath-mir-8174-MI0026804.ath_dead_mir1334로 명명되었다.
다음으로, 각 후보의 fasta 서열이 얻어졌고, WT miRNA(및 WT miRNA 성숙 가이드 및/또는 패신저 서열의 위치)에 상응하는 후보의 정렬을 기반으로, 성숙 miRNA의 위치에 상응하는 후보의 서열이 확인되었다(또한 본 명세서에서 후보의 "성숙"서열로 언급됨). 또한, 상응하는 지놈 주석 파일을 사용하여, 후보가 인트론 또는 엑손 영역 내에 있는 여부가 결정되었다.
하기 표2는 상기 명시된 대로 밝혀진 A. thalian 후보 목록을 제공한다.
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
예쁜꼬마선충(C. elegans)
miRbase로부터 알려진 예쁜꼬마선충(C. elegans) miRNA의 성숙 가이드 및/또는 패신저 서열은 알려진 모든 miRNA(13,522 일치)가 제거된 예쁜꼬마선충(C. elegans)의 지놈(13,971 일치)에 대한 블라스트 검색을 수행하는데 사용되었다. 성숙 miRNA 서열(잠재적으로 '가이드' 또는 '패신저' 가닥)의 적어도 70%가 일치하는 각 위치에 대해, 야생형(WT) miRNA의 가이드 및 패신저 서열간의 거리가 20% 이상 길거나 또는 짧지 않은 거리 내에서 상보적 서열이 지놈에 맵핑되는지 확인하였다. 앞서 언급한 기준과 일치하는 385개의 쌍이 발견되었고 이러한 쌍을 포함하는 후보 유전자가 후보로 간주되었다. 385개의 발견된 쌍을 포함하는 후보 서열의 fasta 서열(각 후보에 상동의 야생형 miRNA의 길이에 상응하는 fasta 서열의 길이)이 추출되었고, 그들의 지놈 위치를 기록하였으며 상응하는 지놈 주석 파일을 기반으로 후보가 인트론 또는 엑손 영역 내에 위치하는지 여부가 결정되었다.
하기 표3은 상기 명시된 대로 밝혀진 예쁜꼬마선충(C. elegans) 후보 목록을 제공한다.
Figure pct00035
Figure pct00036
인간 (H. sapiens)
후보의 초기 목록을 생성하기 위해, miRbase에서 알려진 모든 인간의 miRNA 전구체의 목록이 인간 지놈에 대해 블라스트 되었다. 그 결과 알려진 모든 miRNA 및 특성화되지 않은 지놈 영역에 맵핑된 사례가 제거된 것으로부터 85,399 개의 후보 위치 목록이 생성되었으며, 및 73,340개의 초기 후보가 남겨졌다. 다음으로 알려진 모든 인간 miRNA의 성숙 가이드 및 패신저 서열이 인간 지놈에 맵핑되었다. 초기 후보 목록 내 위치 중 어느 하나에 맵핑된 성숙 서열이 적어도 50%의 서열 유사성을 갖는 경우, 이는 후보로 간주되었다. 최종 후보 목록은 5406개의 후보로 구성되었다. 다음으로, WT miRNA에서 성숙 miRNA의 위치가 후보 내 확인된 서열의 위치와 상응하도록, 각 후보의 서열은 처음에 일치했던 WT miRNA의 길이와 일치하도록 확장되었다. 마지막으로 각각의 최종 후보의 fasta 서열이 추출되었고 성숙 서열의 위치는 그들이 초기에 유래된 것에 따라 miRbase miRNA의 성숙 서열의 위치를 기반으로 표시되었다. 또한, 상응하는 지놈 주석 파일을 사용하여, 후보가 인트론 또는 엑손 영역 내에 위치하는지 여부가 결정되었다.
하기 표4는 상기 명시된 대로 밝혀진 인간(H. sapiens) 후보 목록을 제공한다.
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
발현된 후보의 검출(Detection)
발현된 후보를 확인하기 위해, IntersectBed 소프트웨어가 관련 유기체의 모든 small RNAseq 샘플를 갖는 각각의 후보의 지놈 좌표 간의 중복을 판단하기 위해 고립된(stranded) 방식으로 사용되었고 및 각 후보 유전자 내의 각각의 지놈 위치와 일치하는 작은(small) RNA 리드(small RNA read)의 수를 기록하였다. 그 다음에 처리되지 않은 리드 계수(Raw read counts)는 다음 공식을 사용하여 RPKM(Reads Per Kilobase Million)으로 보정되었다(were normalized).
Figure pct00043
동일한 지놈 위치 상에 적어도 10개의 리드(read)가 있었던 후보는 발현된 것으로 간주되었다. 각각의 상응하는 WT mirRNA의 발현 또한 정확히 동일한 방식으로 결정되었다.
발현된 후보를 확인하기 위해, 후보의 지놈 위치 또는 상응하는 알려진 WT miRNA와 완벽하게 일치하는 19-24 bp 및 19 bp 이상의 길이를 갖는 small RNA-seq 리드(read)의 수가 기록되었다. 모든 small RNA-seq 샘플이 모든 후보 및 상응하는 알려진 miRNA에 맵핑되면, 그들의 각각의 지놈 위치를 따라 해당 커버리지 플롯(coverage plot)이 생성되고 분석되었다. 상기 논의된 바와 같이, 이 분석에 따라 발현된 후보자만 선발되었다.
발현되는 비-가공된 후보의 발견
일반적으로, 상기 명시된 분석을 사용하여, 정형적인 방식으로 가공된 miRNA는 성숙 가이드 및/또는 패신저 서열의 길이(일반적으로 21-22 bp 길이)와 일치하는 작은 RNA 리드(small RNA read)의 정점(peak)을 두 개는 아니더라도, 적어도 하나는 가지고, 따라서, 논-가공된 miRNA를 확인하기 위해, 각 후보의 작은 RNA발현 플롯(plot)을 조사하였으며 (침묵 miRNA로서 가공되므로 침묵 재활성/재유도에 사용될 수 없음을 뜻하는)정형적인(canonical) miRN와 유사한 발현 양상을 보이는지 또는 가공되지 않았는지(즉, 야생형 miRNA와 다른 발현 양상을 나타내는지) 여부를 판단하였다.
예를 들어, 도13A-H는 야생형 miRNA cel-mir-5545 (MI0019066) 및 상응하는 miRNA-유사 유전자인 경우, cel_dead_mir219의 sRNA의 발현을 보여준다. 도 13A는 21bp 길이의 리드(read)에 대한 배아에서의 cel-mir-5545의 small RNA seq 발현 플롯을 나타낸다. x축은 5'에서 3'방향으로 전구체 서열의 지놈 위치(chrI, 전방 가닥에서 11885596 및 11885706사이의 위치)를 나타내고 y축은 RPKM의 발현값을 나타낸다. 하단 플롯은 miRbase에 따라 정의된 성숙 miRNA 서열의 위치를 표시한다. 3' miRNA는 3p 성숙 miRNA를 표시하는 x축 위치를 따라 검은색 막대로 표시되고 5' miRNA는 5p 성숙 miRNA를 표시하는 x축 위치를 따라 흰색 막대로 표시된다. 하단 플롯의 범례는 miRbase에 따른 성숙 miRNA의 길이를 나타낸다. 가공된 miRNA는 발현된 작은 RNA의 위치가 성숙 miRNA의 위치와 정렬되는 발현 양상을 보여준다. 도 13C alc 13D에서 성숙 miRNA의 위치 및 miRNA의 위치를 살펴보면, cel-mir-5545가 가공되었음을 확인할 수 있다. 유사한 방식으로, 도 13F 및 13G는 추정되는 전구체 서열의 지놈 위치를 따라 mir-유사 cel_dead_mir219에 대한 작은 RNA의 발현을 묘사한다. 검은색 및 흰색 막대는 성숙 miRNA의 위치를 나타내고 상단 플롯은 발현 양상이 성숙 miRNA의 위치에 있지 않고 오히려 mir-유사 전구체 서열의 중앙 부분을 따라 위치한다는 것을 보여준다. 따라서 cel_dead_mir219가 발현되지만 상응하는 야생형의 miRNA와 같이 가공되지 않음을 명확히 나타낸다.
도 10A-N은 A. thaliana의 miRNA 후보 유전자 ath_dead_mir1334(상기 명시된 것과 같이 확인된 miRNA유사 분자를 암호화하는, 도 10H-M) 및 상응하는 야생형 miRNA ath-mir-8174 (Figures 10A-F)에 대한 새순(shoot) 및 뿌리 조직으로부터 다양한 크기의 작은 RNA의 분포를 보여준다. 보여지는 바와 같이, 야생형 miRNA에 대한 플롯은 작은 RNA 발현(각 플롯의 상단 그래프)이 miRNA의 성숙한 서열(각 플롯의 하단 그래프)의 지놈 위치와 일치한다는 것을 보여주지만, ath_dead_mir1334와 상응하는 sRNA는 "성숙한" 서열이 있었던 지놈 위치와 교차하지 않는다. 서열을 기반으로 예측된 RNA의 2차 구조의 분석은 야생형 miRNA의 전구체가 정형적인 miRNA처럼 접히는 반면(도 10G), 이 분야에서 잘 알려진 것처럼, miRNA유사 유전자의 RNA는 그렇지 않고(도 10N), 이는 야생형 대응물에 상응하는 침묵 활성도 갖지 않음을 추가로 확인해주었다. 성숙 miRNA의 가이드 가닥은 도 10G에서 회색으로 강조 표시되고, 및 miRNA-유사 후보의 RNA "전구체"의 상응하는 서열은 도 10N에서 강조 표시된다.
Figure pct00044
도 11A-J 및 12A-I는 A. thaliana의 다른 miRNA-유사 유전자의 유사한 분석을 나타내고, 예쁜꼬마선충(C. elegans)로부터 도 13A-H, 14A-H 및 15A-H에서 및 H. sapiens로부토 도16A-J, 17A-J 및 18A-E에서 나타내며, miRNA-유사 유전자가 발현되지만 대응하는 야생형 miRNA처럼 가공되지 않음을 보여준다. 도 19A-G는 예쁜꼬마선충(C. elegans)로부터의 정형적인 야생형 miRNA의 발현 분석을 나타내고 도 19H는 야생형 miRNA cel-mir-71의 예측된 RNA 2차 구조를 나타낸다.
siRNA 설계
표적 특이적 siRNA는 ThermoFisher Scientific의 "BLOCK-iT?? RNAi Designer" 및 Invivogen의 "Find siRNA sequences"와 같은 공개적으로 이용가능한 siRNA-설계자(designer)에 의해 설계되었다.
sgRNA 설계
상기 명시된 바와 같이, miRNA-유사 분자를 암호화하는 유전자와 같이 (상응하는 야생형 침묵 분자와 같이 발현되지만 가공되지 않는 ncRNA를 암호화하는) 확인된 후보 유전자의 침묵 활성은 유전자 서열에 뉴클리오타이드 변화을 도입함으로써 재활성화 될 수 있다(가능하게는 재유도 될 수 있다). 필요한 뉴클레오타이드 변경은 GEiGS 기술을 사용하여 도입될 수 있다. 이를 위해, Cas9과 같은 엔도뉴클레아제는 목적하는 뉴클레오타이드 변화을 갖는 후보 유전자의 관련 서열을 암호화하는 공여자 DNA 분자와 함께 세포 내로 도입된다. Cas9 엔도뉴클레아제는 세포 내에 추가로 도입되는 sgRNA의 서열을 기반으로 세포 내의 후보 유전자의 서열을 손상할 것이다. sgRNA는 Park 외, Bioinformatics, (2015) 31(24): 4014-4016에서 이전에 서술될 것처럼, 공개적으로 이용 가능한 sgRNA 설계자(designer)를 사용하여 miRNA-유사 분자를 암호화하는 내인성의 후보 유전자를 표적화하도록 설계되었다. 각각의 카세트에 대해 2개의 sgRNA는 설계되고, 및 세포 당 하나의 sgRNA가 발현되어 도입된 공여자 DNA와 스와핑(swapping)을 시작한다. sgRNA는 스와핑 후에 변경되려는 이전 miRNA-유사 서열과 해당한다.
효율적인 sgRNA 선택의 기회를 최대화하기 위해, 공개적으로 이용 가능한 2개 이상의 다른 알고리즘(CRISPER Design: www(dot)crispr(dot)mit(dot)edu:8079/ 및 CHOPCHOP: www(dot)chopchop(dot)cbu(dot)uib(dot)no/)이 사용되고 각 알고리즘에서 최고 점수를 받은 sgRNA가 선택된다.
ssDNA 올리고 설계 교체(Swapping)
GEiGS와 함께 사용되는 공여자 DNA를 설계하기 위해서, 상기 명시된 바와 같이, GEiGS 올리고를 먼저 설계한다. 400 nt ssDNA(100-1000 bp 사이의 크기) 올리고는 miRNA-유사 후보 유전자의 지놈 DNA 서열을 기반으로 설계된다. 표적 유전자의 이전 miRNA-유사 서열은 (침묵 활성을 재활성화하고/재유도 하기 위해 목적하는 뉴클레오타이드 변화를 포함하는) 공여자 올리고의 중앙에 위치하고, 후보 유전자의 성숙-유사 miRNA 서열은 선택된 표적에 대한 이중 가닥 siRNA 서열로 대체되어, 가이드(침묵) siRNA 가닥은 표적에 대해 70-100% 상보적으로 유지된다(표적 유전자의 이전 miRNA-유사 서열을 따른 추가 뉴클레오타이드 변화는 본 명세서에 언급된 바와 같이, 침묵 특이성을 재활성 하거나 또는 재유도 하기 위한 변경을 수행하기 위해 도입될 수 있다).
plasmidDNA 설계 교체(Swapping)
4000 bp(200-4000 bp 사이의 범위) ds DNA 단편은 miRNA 유전자의 지놈 DNA 서열을 기반으로 설계된다. 상기 명시된 바와 같이, GEiGS 올리고는 dsDNA 단편의 중앙에 위치한다. 단편은 정형적인 벡터(예를 들어 형광 마커를 포함하거나 포함하지 않는 Bluescript)로 복제되고 Cas9 시스템 구성요소를 가진 세포로 형질주입된다.
재유도된 ncRNA에 대한 가능한 표적 유전자
상기 명시된 ncRNA는 표적화하는 siRNA로 변형된다, 예를 들어:
Figure pct00045
애기장대 (Arabidopsis) 숙주: TuMV, Luciferase (표적 및 대조군)
Figure pct00046
인간(Human) 숙주: HIV, Luciferase (표적 및 대조군)
Figure pct00047
예쁜꼬마선충(C. elegans) 숙주: UNC-22, Luciferase (표적 및 대조군)
(하기 표5에서 논의된 바와 같이)
Figure pct00048
GEiGS 주형(template)을 생성하기 위한 컴퓨테이션 파이프라인(Computtional pipeline)
컴퓨테이션 GEiGS 경로는 생물학적 메타데이터(biological metadata)를 적용하고, 비-암호화RNA 유전자(예를 들어 miRNA 유전자)를 최소한으로 편집하여, 사용되는 GEiGS DNA 주형의 자동 생성을 가능케하여 새로운 기능을 얻을 수 있게 한다. 즉, 침묵 능력을 관심 표적 서열로 재유도한다.
도4에 예시된 바와 같이, 경로는 인풋(input)을 채우고 제출하는 것으로 시작한다: a) GEiGS에 의해 사일런스되는 표적 서열; b) 유전자가 편집되고 GEiGS를 발현하는 숙주 유기체; c) GEiGS가 어디에서나 발현될지 여부를 선택할 수 있는 숙주 유기체. 특정 GEiGS 발현이 필요한 경우, 몇 가지 옵션으로부터 선택될 수 있다(특정 조직에 대한 특이적 발현, 발달 단계, 스트레스, 열/한랭 쇼크 등).
필요한 모든 인풋(input)이 제출되면, 컴퓨테이션 가공은 mRNA (또는 다른 비-암호화 RNA) 데이터세트(예를 들어 작은 RNA 시퀀싱(small RNA sequencing), 마이크로어레이(microarray) 등)를 검색하고 인풋 기준과 일치하는 관련 miRNA만 필터링하는 것으로 시작된다. 다음으로, 선택된 성숙 miRNA 서열은 표적 서열에 대해 정렬되고 가장 높은 상보적 수준을 갖는 miRNA가 필터링된다. 이러한 자연적으로 표적-상보적인 성숙 miRNA 서열은 표적의 서열과 완벽하게 일치하도록 변형된다. 그런 다음, 변형된 성숙 miRNA 서열은 siRNA 효능을 예측하는 알고리즘을 통해 실행되고 가장 높은 침묵 점수를 갖는 상위 20개가 필터링 된다. 이러한 최종 변형된 miRNA 유전자는 다음과 같이 200-500 nt ssDNA 또는 250-5000 nt dsDNA 서열을 생성하는데 사용된다:
200-500 nt ssDNA 올리고 및 250-5000 nt dsDNA 단편은 변형된 miRNA 옆에 있는 지놈 DNA 서열을 기반으로 설계된다. 이전의 miRNA 서열은 올리고 중앙에 위치한다. 변형된 miRNA의 가이드 가닥(침묵) 서열은 표적에 100% 상보적이다. 그러나, 변형된 패신저 miRNA 가닥의 서열은 동일한 염기 쌍 프로파일(profile)을 유지하면서, 원형의 (변형되지 않은) miRNA 구조를 보호하기 위해 추가로 수정된다.
다음으로, 차등의 sgRNA는 변형된 교체(swapping) 버전이 아닌, 원형의 변형되지 않은 miRNA 유전자를 특이적으로 표적으로 하도록 설계된다. 마지막으로, 변형된 miRNA 유전자 및 원형의 miRNA 유전자 사이에 비교 제한 효소 부위 분석을 수행하여 차별적인 제한 부위가 요약된다.
그러므로, 경로 아웃풋(output)은 다음을 포함한다:
a) 최소한의 변형된 miRNA를 가진 200-500 nt ssDNA 올리고 또는 250-5000 nt dsDNA 단편 서열
b) 변형되지 않고 원형의 miRNA 유전자를 특이적으로 표적으로 하는 2-3개의 차등 sgRNA
c) 변형된 miRNA 유전자 및 원형의 miRNA 유전자 사이의 차등의 제한 효소 부위 목록.
서열
표적 올리고(“Luc-센서 벡터”에 사용):
1. Dead/Reactivated _859 - 서열번호: 6 및 9
GAGTTATGGGTTGACCGAACCCAT
2. Dead/Reactivated _1334 - 서열번호: 20 및 23
GATTAGCTTCCCTATACACAT
3. WT_Active_405a - 서열번호: 3
AGTTATGGGTTAGACCCAACTCAT
4. WT_Active_8174 - 서열번호: 17
GATTAGCTTCCCTATACACAT
5. Redirected _859 - 서열번호: 12
CAATTCGTAAATCAAAATTTTAAT
6. Redirected _1334 - 서열번호: 26
CCAGTTATTAATGTTCATATA
"GEiGS-올리고" ( "GEiGS-올리고" 벡터에 사용)
1. miR405a_Active - 서열번호: 1
TCAAAATGGGTAACCCAACCCAACCCAACTCATAATCAAATGAGTTTATGATTAAATGAGTTATGGGTTGACCCAACTCATTTTGTTAAATGAGTTGGGTCTAACCCATAACTCATTTCATTTGATGGGTTGAGTTGTTAAATGGGTTAACCATTTA
2. miR8174_Active - 서열번호: 15
CGGCCCATCCGTTGTCTTTCCTGGTACGCATGTGCCATGGCTTTCTCGTAAGGGACTGGATTGTCCGTATTTCTCATGTGTATAGGGAAGCTAATCGTCTTGTAGATGGGTTG
3. miR859_Dead - 서열번호: 4
TCAAAATGGGTAATCCAACTCAACTCAACTCATAATCAAATGAGTTTAGGATTAAATGAGTTATGGGTTGACCCAACTCATTTTGTTAAATGGGTTCGGTCAACCCATAACTCAATTAATTTGATGGATTGAGTTGGTAAATGAGTTAACCCATTTA
4. miR1334_Dead - 서열번호: 18
ATTCGCATTCTCTGTCTTTCCTAGTACGTTTATGTTATGGCTTCATTTCGAAGGACTAGATTGTCCGAATTACTCATGTGTATAGGGAAGCTAATCGTCTCGCAGATGAATTA
5. miR859_ Reactivated - 서열번호: 7
CCAGATTGGATTGCCTCACACCACACACGACTCAATTCACTAAGACGAGGATTAAATTGGGTTATGGGTGACCGAACTCATTTTGCCAAatgggttcggtcaacccataactcAATTTTGGTGAAGGTCGTGGGTGGAAAAGGAGGCAACCCAGTCA
6. miR1334_ Reactivated - 서열번호: 21
TCACGCATTCGTTGACTTCCCTAGTACGCATATTGAACTGCTGTAAGGTGAAGGACGTTAATGTACCAAAAACTTatgtgtatagggaagctaatcGTCCCGCAGATGTGTGA
7. miR859_ Redirected - 서열번호: 10
TCAAATTGGGTAAACTACCCCAACATCTCTCAAAATCCAAGGTTGTTAGGACCAAATGTGGTTTGTGGACAGAGTTTTCATTTTGCTAAatgaaaattttgatttacgaattgCATTATCTTGGGTGAGGGAGGTTGCAAATTAGTTTAGCCAGTTA
8. miR1334_ Redirected - 서열번호: 24
ATGTGCATCGCAGTGATTGGTGTGTTATATGACTAAAAGTCTTTATCGCGAAGGGCTATATCGACCTAGGTACTTtatatgaacattaataactggCCCCCCCAGATGCATGT
miRNA 올리고 증폭을 위한 PCR
The miRNA oligos were amplified from synthetic template ordered from Genewiz in order to introduce compatible ends for in-fusion cloning. CloneAmp HiFi PCR Premix (Takara Bio) was used according to the manufacturer´s instructions.
miRNA 올리고는 인퓨전(in-fusion) 클로닝을 위한 호환 가능한 말단을 도입하기 위해 Genewiz로부터 주문된 합성 주형으로부터 증폭되었다. CloneAmp HiFi PCR Premix (Takara Bio)는 제조사의 지침에 따라 사용되었다.
정방향 올리고 프라이머에 추가하기 위한:
5´ AAACGAGCTCGCTAG (서열번호: 29)
역방향 표적 프라이머에 추가하기 위한:
5´ GCAGGTCGACTCTAG (서열번호: 30)
각 PCR 반응은 물(H2O)이 포함된 음성 대조군이 포함되었다(주형 없음).
Figure pct00049
PCR 산물은 0.8% 아가로즈 겔에 로딩하고 특정 PCR 밴드는 절제되고 제조사의 지침에 따라 Monarch DNA Gel Extraction Kit (NEB)을 사용하여 정제되었다.
Figure pct00050
다양한_클로닝_사이트_표적(Multiple_Cloning_Site_Target)으로 어닐링된 표적의 클로닝
Luc-센서 벡터는 XmaI 및 HpaI으로 절단된(digested) 제한 효소였다.
Figure pct00051
37 °C에서 4 시간 동안 배양하였다.
볼륨은0.8% 아가로즈 겔에서 실행되었고 제한된 밴드는 제조사의 지침에 따라 Monarch DNA Gel Extraction Kit (NEB)을 사용하여 정제되었다.
XmaI 및 HpaI로 제한된 Luc-센서 벡터로 어닐링된(annealed) 표적 올리고의 인퓨전(In-fusion) 클로닝
어닐링된 표적은 제조사의 지침에 따라 In-Fusion HD Cloning Kit (Takara Bio)을 사용하여 Luc-센서 벡터의 제한된 MCS로 복제되었다. 최종 플라스미드는 제조사의 지침에 따라 Stellar Competent Cells (Takara Bio)로 전환되고 세포는 선택을 위해 LB 카르베니실린 한천 플레이트(plate)에 도말하여 37°C에서 하룻밤 동안 배양하였다. 각 반응으로부터 얻어진 3개의 클론데 대해 배양을 시작하였고 플라스미드 DNA는 제조사의 지침에 따라 QIAprep Spin Miniprep Kit (QIAGEN)을 사용하여 추출되었다. 클로닝된 DNA 서열의 확인은 Sanger 시퀀싱(sequencing)에 의해 획득되었다. 시퀀싱 결과는 Snapgene 소프트웨어를 사용하여 분석되었다.
형질주입(transfection)에 필요한 벡터의 양은 제조사의 지침에 따라 QIAGEN Plasmid Plus Kits (QIAGEN)을 사용하여 획득하였다.
다양한_클로닝_사이트_GEiGS_올리고(Multiple_Cloning_Site_GEiGS_Oligo)로 GEiGS-올리고의 클로닝
Luc-센서 벡터는 NheI 및 XbaI으로 절단된(digested) 제한 효소였다.
Figure pct00052
37 °C에서 4 시간 동안 배양하였다.
볼륨은0.8% 아가로즈 겔에서 실행되었고 제한된 밴드는 제조사의 지침에 따라 Monarch DNA Gel Extraction Kit (NEB)을 사용하여 정제되었다.
NheI 및 XbaI로 제한된 GEiGS-올리고 벡터로 GEiGS-올리고의 인퓨전(I
n-fusion) 클로닝
정제된 PCR 산물은 제조사의 지침에 따라 In-Fusion HD Cloning Kit (Takara Bio)을 사용하여 GEiGS 올리고 벡터의 제한된 MCS로 복제되었다.
최종 플라스미드는 제조사의 지침에 따라 Stellar Competent Cells (Takara Bio)로 전환되고 세포는 선택을 위해 LB 카르베니실린 한천 플레이트(plate)에 도말하여 37°C에서 하룻밤 동안 배양하였다.
형질주입(transfection)에 필요한 벡터의 양은 제조사의 지침에 따라 QIAGEN Plasmid Plus Kits (QIAGEN)을 사용하여 획득하였다.
원형질체 분리
애기장대(Arabidopsis) (Col-0 ecotype) 원형질체는 분해 효소 (1% 셀룰라아제, 0.3% 마세로자임, 0.4 M 만니톨, 154 mM NaCl, 20 mM KCl, 20 mM MES pH 5.6, 10 mM CaCl2)에서 식물체 물질 (예를 들어 잎, 캘러스, 세포 현탁액)을 실온에서 4-24시간 동안 배양하고 부드럽게 흔들어 줌으로써 분리되었다. 분해 후, 남아있는 식물체 물질은 W5 용액 (154 mM NaCl, 125 mM CaCl2, 5 mM KCl, 2 mM MES pH5.6)으로 세척하고 원형질체 현탁액은 40 μm 여과기(strainer)를 통해 여과되었다. 실온에서 3분 동안 80g에서 원심분리한 후, 원형질체는 2 ml의 W5 완충액(buffer)에 재현탁하고 얼음에서 중력에 의해 침전시켰다. 최종 원형질체 펠렛(pellet)은 2 ml MMg (0.4 M mannitol, 15 mM MgCl2, 4 mM MES pH 5.6)에 재현탁시키고 원형질체 농도는 혈구계(hemocytometer)를 사용하여 측정되었다. 원형질체의 생존력은 Trypan Blue staining을 사용하여 평가되었다.
Polyethylene glycol (PEG) 매개 플라스미드 형질주입(transfection)
원형질체의 PEG 형질주입은 Wang [Wang 외, Scientia Horticulturae (2015) 191: p. 82-89]에 의해 보고된 방법의 변형된 버전을 사용하여 수행되었다. 원형질체는 MMg 용액에서 2-5 Х 106 원형질체/ml의 밀도로 재현탁시켰다. 100-200 μl의 원형질체 현탁액을 플라스미르를 포함한 튜브에 첨가하였다. 플라스미드:원형질체 비율은 형질전환 효율에 크게 영향을 미치므로 원형질체 현탁액의 농도 범, 5-300 μg/μl 가 분석되었다. PEG 용액 (100-200 μl)은 혼합물에 첨가되었고 10-60분 범위의 다양한 시간 동안 23 °C에서 배양되었다. PEG4000 농도가 최적화되었고, 200-400 mM 만니톨(mannitol), 100-500 mM CaCl2 용액 중 20-80 % PEG4000 범위가 분석되었다. 그런 다음 원형질체를 W5로 세척하고 3분동안 80g에서 원심분리하였고, 사전에 1 ml W5에 재현탁하고 23 °C의 암실에서 배양되었다. 24-72시간 동안 배양 후에 형광이 현미경으로 검출되었다.
재활성화 실험을 위한 PEG 형질주입
몰비 Luc-센터 벡터: GEiGS 올리고 벡터는 1:4였다. 이는 형질주입당 5 μg의 Luc 센서 벡터 및 약 20.5 μg의 GEiGS 올리고 벡터로 해석된다.
Figure pct00053
형질주입은 모든 실험 조건에 대해 독립적인 3반복으로 수행되었다.
재활성화를 실험을 위한 PEG 형질주입
몰비 Luc-센터 벡터: GEiGS 올리고 벡터는 1:4였다. 이는 형질주입당 5 μg의 Luc 센서 벡터 및 약 20.5 μg의 GEiGS 올리고 벡터로 해석된다.
Figure pct00054
형질주입은 모든 실험 조건에 대해 독립적인 3반복으로 수행되었다.
충격(Bombardment) 및 식물체 재생
애기장대(Arabidopsis) 뿌리 준비
염소 가스로 멸균된 애기장대 (cv. Col-0) 종자를 수크로오즈가 없는 MS 플레이트에 파종하고 4 °C의 어둠 속에서 3일간 춘화처리를 한 다음, 일정한 빛이 있는 25 °C에서 수직으로 발아시킨다. 2주 후, 뿌리는 1 cm 뿌리 조각으로 손상하고 캘러스 유도 배지(Callus Induction Media) (CIM: B5 비타민이 포함된 1/2 MS, 2 % 글루코오즈, pH 5.7, 0.8 % 한천, 2 mg/l IAA, 0.5 mg/l 2,4-D, 0.05 mg/l 키네틴) 플레이트에 놓아두었다. 25 °C의 암실에서 6일 동안 배양한 후, 뿌리 조각은 여과지 디스크로 옮기어 CIMM (비타민이 포함되지 않은 1/2 MS, 2 % 글루코오즈, 0.4 M 만니톨, pH 5.7 및 0.8 % 한천) 플레이트에 4-6시간 동안 충격 (Bombardment)를 위한 준비로 놓아두었다.
충격
플라스미드 컨스트럭트(construct) PDS-1000/He 입자 부여(Bio-Rad; PDS-1000/He System #1652257)을 통해 뿌리 조직 내로 도입되었고, 이 절차를 수행하기 위해서, 하기 요약된 바와 같이, 몇 가지 준비 단계가 필요하다
골드 스톡(Gold stock) 준비
40 mg의 0.6 μm gold (Bio-Rad; Cat: 1652262)을 1 ml의 100% 에탄올과 혼합하고, 진동 원심분리하여 펠렛으로 만들고 에탄올은 제거된다. 이러한 세척 과정을 2번 반복한다.
세척 후, 펠렛은 1 ml의 멸균 증류수에 재현탁하고 1.5 ml 튜브에 50 μl 분취액(aliquot)의 작용 볼륨(working volume)으로 나누어 주었다.
비드(Bead) 준비
간단히 말해서, 다음이 수행된다:
하나의 튜브는 2 플레이트의 애기장대 뿌리에 충격을 주기에 충분한 금이므로 (한 플레이트 당 2번의 샷(shot)), 각 튜브는 4 (1,100 psi)개의 바이오리스틱 럽처 디스크(Biolistic Rupture disks) (Bio-Rad; Cat: 1652329) 사이에 분포된다.
동일한 샘플의 여러 플레이트가 필요한 충격의 경우, 샘플 일관성을 유지하고 전체 준비를 최소화하기 위하여, 튜브는 결합되고 DNA 및 CaCl2/스페르미딘(spermidine) 혼합물의 볼륨은 절적하게 조정되었다.
다음 프로토콜은 하나의 금 튜브를 준비하는 과정을 요약하였고, 사용된 금 튜브의 수에 따라 조정되어야 한다.
모든 후속 공정은 Eppendorf thermomixer에서 4 °C에서 수행된다.
플라스미드 DNA 샘플, 1000 ng/μl 농도로 첨가된 11 μg의 DNA를 포함하는 각 튜브가 준비된다.
1) 493 μl의 ddH2O을1 분취액 (7 μl)의 스페르미딘(spermidine) (Sigma-Aldrich; S0266)에 첨가하여 0.1 M 농도의 스페르미딘을 제공한다. 1250 μl의 2.5M CaCl2을 스페르미딘 혼합물에 첨가하고, 볼텍싱(vortexed)하고 얼음 위에 놓아두었다.
2) 미리 준비한 금 튜브는 써모믹서(thermomixer)에 넣고, 1400 rpm의 속도로 회전시킨다.
3) 11 μl의 DNA를 튜브에 첨가하고, 볼텍싱한 다음, 회전하는 써모믹서에 다시 넣어준다.
4) 결합하기 위해, DNA/금 입자, 70 μl의 스페르미딘 CaCl2 혼합물을 (써모믹서 내) 각 튜브에 첨가한다.
5) 튜브를 15-30초 동안 강하게 볼텍싱하고 약 70-80초 동안 얼음 위에 놓아둔다.
6) 혼합물은 7000 rpm에서 1분 동안 원심분리하고, 상층액을 제거하고 얼음 위에 놓아둔다
7) 100 % 에탄올 500 μl을 각 튜브에 첨가하고 펠렛은 피펫팅하여 재현탁하고 볼텍싱한다.
8) 튜브는 7000 rpm에서 1분 동안 원심분리한다.
9) 상층액을 제거하고 펠렛은 100 % 에탄올50 μl에 재현탁하고, 및 얼음에 보관한다.
거대 담체(Macro carrier) 준비
다음은 클린벤치(laminar flow cabinet)내에서 수행된다:
1) 거대 담체 (Bio-Rad; 1652335), 정지 스크린 (Bio-Rad; 1652336), 및 거대 담체 디스크 홀더를 멸균 및 건조한다.
2) 거대 담체는 거대 담체 디스크 홀더에 평평하게 배치된다.
3) 금으로 코팅된 DNA 혼합물은 볼텍싱하고 및 각 바이로리스틱 럽처 디스크의 중앙에 (5 μl) 퍼뜨린다.
에탄올을 증발시킨다.
PDS-1000 (헬륨 입자 부여 시스템)
간단히 말해서, 다음이 수행된다:
헬륨 보틀의 조절 밸브는 최소 1300 psi의 유입 압력으로 조정된다.
진공은 vac/vent/hold 스위치를 누르고 및 3초 동안 화재 스위치를 누름으로써 생성된다. 이렇게 하면 헬륨이 배관으로 유입된다.
1100 psi 럽처 디스크를 이소프로판올에 넣고 혼합하여 정전기를 제거한다.
1) 하나의 럽처 디스크를 디스크 고정 캡에 넣는다.
2) 미세 담체 론치 어셈블리(launch assembly)가 (정지스크린 및 미세 담체(microcarrier)를 함유한 금과 함께) 만들어진다.
3) 페트리 접시의 애기장대 뿌리 캘러스를 론치 어셈블리 아래 6 cm에 놓는다.
4) 진공 압력은 Hg (수은)의 27 인치로 설정하고 헬륨 밸브를 (약 1100 psi에서) 연다.
5) 진공이 풀리고, 미세 담체 론치 어셈블리 및 럽처 디스크 고정 캡이 제거된다.
6) 동일한 조직에 충격 (즉, 각 플레이트에 2회 충격을 준다).
7) 충격을 받은 뿌리는 후속적으로 CIM 플레이트에서 추가 24시간 동안 25 °C의 암실에 놓아둔다.
공동 충격(Co-bombardments)
GEiGS 플라스미드 조합을 충격할 때, 5 μg (1000 ng/μl)의 sgRNA 플라스미드는 8.5 μg (1000 ng/μl)의 swap plasmid (예를 들어 공여자)와 혼합하고, 이 혼합물 11 μl를 샘플에 첨가한다. 더 많은 GEiGS 플라스미드를 동시에 충격하는 경우, swap 플라스미드(예를 들어 공여자) 대한 sgRNA 플라스미드의 농도 비율은 1:1.7이고 이 혼합물의 11 μg (1000 ng/μl)을 샘플에 첨가한다. GEiGS 교체와 관련이 없는 플라스미드를 공동 충격하는 경우, 동일한 비율로 혼합하고 혼합물의 11 μg (1000 ng/μl)을 각 샘플에 첨가한다.
원형질체 현미경
Leica DM6000 형광 현미경은 형질주입 효율을 정성적으로 평가하기 위해 형질주입 48시간 후에 형광 단백질(FP 및 FP2) 형광을 시각화하는데 사용되었다.
형질주입된 원형질체에 대한 루시퍼라제(Luciferase) 분석 및 세포 분석
플라스미드 부여 24-72시간 후, 세포를 수집하고 D-PBS 배지에 재현탁시켰다. 용액의 절반은 루시퍼라제 활성 분석에 사용하고, 및 절반은 작은 RNA 시퀀싱(small RNA sequencing)에 사용되었다. 이중(dual) 루시퍼라제 분석은 제조사의 지침에 따라 Dual-Glo® Luciferase Assay System (Promega, USA)을 사용하여 수행되었다. 전체 RNA는 제조사의 지침에 따라 Total RNA Purification Kit (Norgene Biotek Corp., Canada)로 추출되었다. 이들 샘플에서 목적하는 성숙 작은 RNA(mature small RNA)를 확인하기 위하여 작은 RNA 시퀀싱이 수행되었다.
식물체 재생
새순 재생의 경우, Valvekens [Valvekens, D. 외, Proc Natl Acad Sci U S A (1988) 85(15): 5536-5540]의 수정된 프로토콜이 수행된다. 충격된 뿌리는 새순 유도 배지(Shoot Induction Media (SIM)) 플레이트에 놓아두고, 이 배지에는 B5 비타민이 포함된 1/2 MS, 2 % 글루코오즈, pH 5.7, 0.8 % 한천, 5 mg/l 2 iP, 0.15 mg/l IAA이 포함된다. 플레이트는 25 °C에서 16시간 광주기-23 °C에서 8시간 암주기에 놓아둔다. 10일 후, 플레이트는 3% 수크로오즈, 0.8% 한천을 포함하는 MS 플레이트로 일주일 동안 옮기고, 그런 다음 새로운 -유사한 플레이트로 옮겨준다. 일단 식물체가 재생되면, 뿌리를 잘라내고 분석할 때까지 3% 수크로오즈, 0.8% 한천을 가진 MS 플레이트에 놓아둔다.
유전형 분석 (Genotyping)
조직 샘플이 처리되고, 암플리콘(amplicon)은 Phire Plant Direct PCR Kit (Thermo Scientific; F-130WH)를 사용하여 제조사의 지침에 따라 증폭되었다. 이러한 증폭에 사용된 올리고는 DNA 조합(incorporation)과 구별하기 위해서, GEiGS 시스템의 변형된 서열에 있는 영역에서 HDR 주형으로 사용되는 영역 외부까지 걸쳐있는 지놈 영역을 증폭하도록 설계된다. 변형된 유전자좌(loci)의 다른 변형은 특이적으로 선택된 제한 효소에 의해 주어진 암플리콘의 다양한 손상 양상을 통해 확인된다.
DNA 및 RNA 분리
샘플은 액체질소로 수확하고 처리될 때까지 -80 °C에서 보관한다. 조직 분쇄는 plastic Tissue Grinder Pestles (Axygen, US)을 사용하여 드라이아이스에 넣은 튜브에서 수행한다. 분쇄된 조직으로부터 DNA 및 RNA 분리는 제조사의 지침에 따라 RNA/DNA Purification kit (cat. 48700; Norgen Biotek Corp., Canada)를 사용하여 수행된다. RNA 프랙션(RNA fraction)의낮은260/230 비율 (< 1.6)의 경우, 분리된 RNA는 1 μl의 glycogen (cat. 10814010; Invitrogen, US), 10 % V/V의 3M sodium acetate, pH 5.5 (cat. AM9740, Invitrogen, US) 및 3배 볼륨의 에탄올과 함께 -20 °C에서 밤새 침전시킨다. 용액을 4 °C에서 최대 속도로 30분 동안 원심분리한다. 이어서 70% 에탄올로 2회 세척하고, 15분 동안 공기 건조해주며 뉴클레아제가 없는 물(cat. 10977035; Invitrogen, US)로 재현탁한다.
역전사(Reverse transcription (RT)) 및 정량적 실시간(quantitative Real-Time)PCR (qRT-PCR)
분리된 총 RNA의 1 마이크로그램에 제조사의 매뉴얼(AMPD1; Sigma-Aldrich, US)에 따라 DNase I을 처리한다. 샘플은 High-Capacity cDNA Reverse Transcription Kit (cat 4368814; Applied Biosystems, US)의 제조사의 매뉴얼에 따라 역전사된다.
유전자 발현에 대해, Quantitative Real Time PCR (qRT-PCR) 분석이 제조사의 프로토콜에 따라 CFX96 Touch?? Real-Time PCR Detection System (BioRad, US) 및 SYBR® Green JumpStart?? Taq ReadyMix?? (S4438, Sigma-Aldrich, US)으로 수행되고, 및 Bio-RadCFX manager program (version 3.1)로 분석된다.
단백질 샘플 준비
단백질 분석을 위해, 단백질은 다음 프로토콜을 사용하여 추출된다.
1. 1xPBS로 플레이트의 세포를 세척한다.
2. 플레이트에 남아있는 PBS를 빼낸다/빨아낸다.
3. 용해 완충액(6 cm 디쉬(dish) 당 150 μl, 예를 들어 용해 완충액: 50 mM Tris-Hcl pH 7.5, 2 % SDS, 20 mM NEM (N-Ethylmaleimide), 프로테아제 억제제 칵테일(Protease Inhibitor Cocktail) (50 ml의 용해 완충액에 Roche의 cOmplete?? 프로테아제 억제제 칵테일(Protease Inhibitor Cocktail)의 1 타블렛을 사용), 포스파타제 억제제 칵테일(Phosphatase inhibitor cocktails) (SIGMA)를 1:100으로 사용)을 사용하여 실온에서 플레이트의 세포를 용해한다.
4. 에펜도르프(Eppendorf) 튜브에 용해물을 모은다.
5. 점도를 줄이기 위해 95 °C에서 5분 동안 샘플을 끓여준다.
6. 제조사의 지침에 따라 usingQuantiPro?? BCA Assay Kit, QPBCA (Sigma Aldrich, USA)을 사용하여단백질의 농도를 측정한다.
7. 모든 샘플을 균등화한다(용해 완충액를 사용하여 동일한 볼륨 및 동일한 농도).
단백질 전기영동 및 트랜스퍼(Transfer)
1. SDS 로딩 버퍼(loading buffer)를 첨가한다 (x1- 50 mM Tris-Cl (pH 6.8), 2 % (w/v) SDS (sodium dodecyl sulfate; 전기영동급 등급), 0.1 % (w/v) 브로모페놀 블루(bromophenol blue), 100 mM
Figure pct00055
-mercaptoethanol)
2. 샘플을 95 °C에서 5분동안 끓여준다.
3. 적절한 프리캐스트 SDS-PAGE gel(NuPAGE?? 4-12 % Bis-Tris Protein Gels; TheromFisher, USA)에 샘플 및 프로테인 래더(ladder)를 로딩해준다.
4. 러닝 버퍼(running buffer) (NuPAGE MOPS SDS Running Buffer; ThermoFisher, USA)를 사용하여 SDS-PAGE gel을 실행한다.
5. 젤 카세트를 분해하고 트랜스퍼 카세트를 준비한다.
6. 니트로셀룰로스(nitrocellulose) 멤브레인(membrane), 필터 페이퍼 및 패드(pad)를 트랜스퍼 버퍼(transfer buffer)에 미리 적셔둔다. 카세트에 패드 및 두 겹의 필터 페이퍼를 놓는다(검은 부분 (-), 단백질은 - 에서 +로 트랜스퍼된다).
7. 여과지에 젤을 놓고 조심스럽게 펴준다.
8. 유리막대를 사용하여 기포를 조심스럽게 굴려 젤 위에 니트로셀룰로스 멤브레인을 놓는다.
9. 카세트를 닫기 전에 니트로셀룰로스 멤브레인의 위에 두 겹의 필터 페이퍼를 놓고, 미리 적신 패드를 놓는다.
10. 100V에서 1시간 동안 블롯(blot)을 실행한다. 온도를 낮게 유지하기 위해 아이스 박스에 넣어둔다.
11. 단백질 밴드를 시각화하기 위해, 1-3분 동안1x 폰슈(Ponceau) 용액(3% Acetic acid 내 0.1%)으로 멤브레인을 염색한다. 사진을 찍는다. 폰슈 용액을 제거하고(다음 사용을 위해 용액을 재활용한다) 폰슈 밴드가 사라질 때까지 0.1 M NaOH로 세척한다. DDW로 세척한다.
면역블랏분석법(Immunoblotting)
1. PBS로 각각 5분씩 3회 세척한다.
2. 쉐이커 위의 터퍼웨어(Tupperware) 접시에 20 ml의 1xPBS + 5 %의 무지방 분유에서 멤브레인을 1시간 동안 블록(Block)시켜준다. 0.05 % TWEEN20 (5 μl/10ml)을 포함한 PBS로 각각 5분씩 3회 세척한다.
3. 팔콘 튜브에 멤브레인을 넣고 50 ml의 blocking 용액(50 ml의 PBS/0.05 % Tween20내 2.5 g의 무지방 분유)을 첨가한다. 실온에서 최소한 30-60분 동안 부드럽게 흔들어서 배양한다 (예를 들어, 밤새도록).
4. 1차 비오틴화된 항체(AB) 배양: 약 35 ml의 세척 용액 (25 ml의 blocking 용액 내지-250 ml의 PBS/0.05 % Tween20)으로 멤브레인이 있는 팔콘을 간단히 세척한다. 용액은 버려준다.
5. 5 ml의 세척용액을 첨가하고 표지된 1차 항체 비오틴(일반적으로 1:1000-5000 희석) (Abcam, Cambridge, UK)을 추가한다. 최소 1시간 동안 실온에서 배양한다.
6. 약 35 ml의 세척 용액으로 멤브레인이 있는 팔콘을 간단히 세척한다. 용액은 버려준다.
7. 35 ml의 세척용액을 첨가하고 10분 동안 배양한다; 세척을 3회 반복한다.
8. 35 ml의 인산염 세척 용액(250의 ml TBST (Tween 20이 포함된 Tris 완충 식염수)내1.25 g의 분유, pH=8)으로 멤브레인이 있는팔콘을 간단히 세척한다. 용액은 버려준다.
35 ml의 인산염 세척 용액을 첨가하고 10분 동안 배양한다; 이 단계를 3번 반복한다.
9. 4 μl의 Avidin-AP (Sigma-Aldrich, USA)을 4 ml의 인산염 세척용액에 추가하고(1:1000 희석) 최소한 1시간 동안 배양한다.
10. 세척: Avidin-AP. 약 35 ml의 TBST로 멤브레인이 있는 팔콘을 간단히 세척한다. 용액은 버려준다. 35 ml의 TBST 용액을 첨가하고 10분 동안 배양한다: 세척을 3회 반복한다.
11. 검출: 제조사의 프로토콜(Sigma-Aldrich, USA)에 따라 Alkaline Phosphatase Substrate를 사용하여 멤브레인의 발색(development)를 수행한다.
TuMV 감염 및 질병으로부터 애기장대의 보호
식물체 재료
목적하는 GEiGS 서열이 있는 식물체로부터 수집된 애기장대 종자는 염소가스로 멸균되고 MS-S 한천 플레이트에서 well 당 1개의 종자로 파종된다. 2주 된 seedling은 흙으로 옮겨준다. 식물체는 24 °C에서 16시간/8시간의 명암주기에서 재배된다. 야생형의 변형되지 않은 (식물체)은 대조군으로 동시에 재배 및 처리된다.
TuMV를 이용한 식물체 접종 및 분석
TuMV 벡터를 사용한 식물체의 접종 및 분석 절차는 이전에 설명된 대로 수행된다 (Sardaru, P. 외, Molecular Plant Pathology (2018) 19: 1984-1994. doi:10.1111/mpp.12674). 간단히 말해서, 4주 된 애기장대 seedling은 이전에 설명된 대로 바이러스 벡터를 발현하는 TuMV [S
Figure pct00056
nchez, F. 외 (1998) Virus Research, 55(2): 207-219]를 접종하거나 또는 이전에 설명된 대로 TuMV-GFP[Touri
Figure pct00057
o, A., 외 (2008) Spanish Journal of Agricultural Research, 6(S1), p.48]를 접종한다. TuMV의 경우, 증상의 점수화는 접종 후 10-28일에 이루어진다. TuMV-GFP의 경우, GFP 신호 분석이 접종 후 7-14일에 이루어진다.
더불어, 접종 14일 후, 접종 부위에서 자라는 새 잎을 수확하고 전체 RNA를 제조사의 지침에 따라 Total RNA Purification Kit (Norgene Biotek Corp., Canada)를 사용하여 추출한다. 작은 RNA 분석 및 RNA-seq은 이 샘플에 대한 유전자 발현 및 작은 RNA 발현 프로파일링을 위해 수행된다.
HIV 감염으로부터 인간 세포의 보호
세포주
HIV-1 감수성 인간 세포주 [Reil, H. 외, Virology (1994) 205(1): 371-375]는 제조사의 지침에 따라 GEiGS 컨스트럭트와 함께 Expi293 Expression System (Thermo Fisher, USA)을 사용하여 형질주입된다. HIV-1의 역가(titer)는 qRT-PCR, 웨스턴 블롯(Western blot)에 의해 측정된다. 통합된 HIV-1 카피 수 분석은 서던 블롯(Southern-blot)을 사용하여 수행된다.
예쁜꼬마선충(C. elegans)에서 내인성 유전자의 넉다운(knock-down)
C. elegans의 변형
C. elegans의 변형은 이전에 설명된 대로 수행된다 [Germline transformation of Caenorhabditis elegans by injection. Methods Mol Biol. (2009) 518: 123-133. doi:10.1007/978-1-59745-202-1_10]. 유전자 넉다운은 qRT_PCR, RNA-seq 및 small RNA-Seq에 의해 평가된다.
실시예 1A
유전자 침묵이 유도된 유전자 편집 (GEiGS)
GEiGS 올리고를 설계하기위해, small 침묵 RNA 분자 (성숙)를 유도하고 가공되는 주형 비-암호화 RNA 분자(전구체)가 필요하다. GEiGS 올리고를 생성하기 위해 전구체 및 이에 상응하는 성숙 서열의 두 소스(source)가 사용된다. miRNA의 경우, 서열은 miRbase 데이터베이스 [Kozomara, A. and Griffiths-Jones, S., Nucleic Acids Res (2014) 42: D68??
Figure pct00058
μD73]에서 얻어졌다. tasiRNA 전구체 및 성숙체는 tasiRNAdb 데이터베이스 [Zhang, C. et al, Bioinformatics (2014) 30: 1045??
Figure pct00059
μ1046]에서 얻어졌다.
침묵 표적은 다양한 숙주 유기체에서 선택되었다 (데이터는 표시되지 않음). siRNA는 siRNArules 소프트웨어 [Holen, T., RNA (2006) 12: 1620??
Figure pct00060
μ1625.]를 사용하여 이러한 표적에 대해 설계되었다. 이러한 siRNA 분자 각각은 각 전구체에 존재하는 성숙 서열을 대체하는데 사용되어, "자연적인(native)' GEiGS 올리고를 생성하였다.
야생형 전구체에 대한 CRISPR/cas9 small guide RNAs (sgRNAs)는 CasOT 소프트웨어 [Xiao, A. 외, Bioinformatics (2014) 30: 1180??
Figure pct00061
μ1182]를 사용하여 생성되었다. sgRNA는 GEiGS 올리고를 생성하기 위해 적용된 변형이 sgRNA의 PAM 영역에 영향을 주어, 변형된 올리고에 효과가 없게 만드는 곳에서 선택되었다.
실시예 1B
내인성 식물 유전자의 유전자 침묵 - PDS
유전자 침묵이 유도된 유전자 편집 (GEiGS)을 사용하여 내인성 유전자 침묵의 정량적 평가를 위한 초고속 스크리닝법(high-throughput screening)을 확립하기 위해, 본 발명자들은 몇 가지 잠재적인 시각적 마커(marker)를 고려하였다. 본 발명자들은 피토엔 불포화효소(phytoene desaturase, PDS)를 암호화하는 유전자와 같은, 색소 침착에 관여하는 유전자에 초점을 맞추었다. PDS의 침묵은 개념 증명(proof-of-comcept, POC)으로 유전자 편집 후 강력한 유식물(seedling) 스크리닝으로써 사용할 수 있는 광표백(photobleaching)을 유발한다(도 6B). 도 6A-C는 PDS에 대해 침묵된 담배(N. benthamiana) 및 애기장대 잎에 대한 대표적인 실험을 보여준다. 식물체는 카로티노이드(carotenoid)의 양이 감소된 식물체에서 관찰되는 특징적인 광표백 표현형(phenotype)을 보여준다.
POC 실험에서, siRNA의 선택은 다음과 같이 수행되었다:
GEiGS 응용 프로그램을 사용하여 PDS 유전자에 대한 애기장대 또는 담배(N. benthamiana)에서의 RNAi 시스템을 시작하기 위해, PDS를 표적으로 하는 효과적인 21-24 bp의 siRNA를 확인할 필요가 있다. 활성화된 siRNA 서열을 찾기 위해 두 가지 접근 방식이 사용된다: 1) 문헌 스크리닝 - PDS 침묵은 많은 식물에서 잘 알려져 있기 때문에, 본 발명자는 다른 식물에서 애기장대 또는 담배(N. benthamiana)의 유전자와 100% 일치할 수 있는 잘 특성화된 짧은 siRNA 서열을 확인을 확인한다. 2) 주어진 유전자에 대한 유전자 침묵을 시작하는데 어떤 siRNA가 효과적인 지 예측하는 데 사용되는 많은 공개 알고리즘이 있다. 이러한 알고리즘의 예측이 100%가 아니기 때문에, 본 발명자들은 적어도 두 개의 상이한 알고리즘의 결과인 서열만을 사용하고 있다.
본 발명자들은 PDS 유전자를 침묵하는 siRNA 서열을 사용하기 위해, CRISPR/Cas9 시스템을 사용하여 그것들을 알려진 내인성 비-암호화 RNA 유전자 서열로 교체하고 있다. (예를 들어 miRNA 서열 변경, 긴 dsRNA 서열 변경, 안티센스(antisense)RNA 생성, tRNA 변경 등). 특성화된 비-암호화 RNA의 많은 데이터베이스가 있다, 예를 들어 miRNA; 본 발명자들은 (예를 들어 낮은 항구적(constitutive) 발현, 높게 발현되는, 스트레스에 의해 유도되는 등) 상이한 발현 프로파일을 갖는 몇 가지 알려진 애기장대 또는 담배(Nicotiana benthamiana) 내인성 비-암호화 RNAs, 예를 들어 miRNA을 선택하고 있다. 예를 들어, 내인성 miRNA 서열을 PDS 유전자를 표적으로 하는 siRNA로 교체하기 위해, 본 발명자들은 HR 접근법 (동종 재조합(Homologous Recombination))을 사용하고 있다. HR을 사용하면 두 가지 선택이 고려된다: 예를 들어, 중간에 변형된 miRNA 서열을 포함하는 약 250-500 nt의 공여자 ssDNA 올리고 서열을 사용하거나, 또는 2 x 21 bp의 miRNA 및 PDS의 siRNA로 변경된 *miRNA (도 5와 같이 siRNA의 상하 500-2000 bp)를 제외한 식물 지놈을 둘러싸고 있는 miRNA와 관련하여 최소한의 변화만을 포함하는 1 Kb - 4 Kb의 삽입물을 운반하는 플라스미드를 사용한다. 형질주입은 다음 구성물을 포함한다: 양성의 형질전환된 세포를 강화하고 추적하기 위한 CRISPR:Cas9/GFP 센서, 삽입 벡터/올리고에 따라 HR에 의해 복구되는 이중 가닥 파손 (DSB)을 생성하는 Cas9을 안내하는 gRNA. 삽입 벡터/올리고는 대체된 (즉, miRNA) 및 관심 돌연변이 (즉, siRNA)을 운반하도록 변형된 표적 유전자좌를 둘러싼 두 개의 연속적인 상동성 영역을 포함한다. 플라스미드가 사용되는 경우, 표적화 구성물은 제한 효소 인식 부위를 포함하거나 또는 포함하지 않으며 및 miRNA를 선택한 siRNA로 교체하는 것으로 끝나는 상동 재조합을 위한 주형으로 사용된다. 원형질체로의 형질주입 후, FACS를 사용하여 Cas9/sgRNA-형질주입된 이벤트를 강화하고, 원형질체를 식물체로 재생성하고, 표백된 유식물(seedling)을 스크리닝하고 점수를 매긴다 (도 5를 참고). 대조군으로서, 원형질체는 임의의 비-PDS 표적화 서열을 운반하는 올리고로 형질주입된다. 양성의 편집된 식물체는 PDS를 표적으로 하는 siRNA을 생성할 것으로 예상되므로 PDS 유전자가 침묵되고 seedling은 gRNA가 없는 대조군과 비교하여 흰색으로 보인다. 교체 후, 편집된 miRNA는 원래의 염기쌍 프로필이 유지되기 때문에 여전히 miRNA로써 가공된다는 점에 유의하는 것이 중요하다. 그러나, 새롭게 편집되어 가공되는 miRNA는 표적과의 높은 상보성(예를 들어 100%)를 가지므로, 실제로 새롭게 편집된 작은 RNA는 siRNA의 역할을 할 것이다.
실시예 1C
TuMV 바이러스 감염에 대한 애기장대 식물의 식물의 내성
애기장대 지놈의 변화는 Turnip Mosaic Virus (TuMV), 또는 무작위 서열(음성의 TuMV-침묵 대조군)을 표적으로 하는 기능장애 비-암호화 RNA에 침묵 특이성을 도입하도록 설계된다. 지놈 유전자좌의 맥락에서 확장된 상동성 팔(arm)과 함께 이들 서열은 "공여자"로 명명된, PUC57 벡터에 도입된다. 목적하는 유전자좌에서 DNA 손상을 생성하기 위해, 가이드RNA는 CRISPR/CAS9 벡터 시스템에 도입된다. CRISPR/CAS9 벡터 시스템은 유전자 충격 프로토콜을 통해 "공여자" 벡터와 함께 식물체에 공동 도입되어 상동 DNA 복구 (HDR)를 통해 목적하는 변형을 도입한다.
지놈 내에 목적하는 변화가 있는 애기장대 seedling은 유전형 분석을 통해 확인되고, 및 TuMV 또는 TuMV-GFP를 포함하는 아그로박테리움(agrobacterium)을 접종하고 바이러스 반응에 대해 점수를 매긴다.
실시예 2
재활성화 및 재유도된 식물 침묵 RNA의 기능
miRNA -유사 비-암호화 RNA가 침묵 활성이 재활성화되거나 또는 재유도 될 때, 침묵 활성을 얻을 수 있음을 입증하기 위해, 애기장대 원형질체 내의 일시적인 시스템에서 생물 발생 및 활성을 테스트하였다.
사용된 시스템은 야생형 miRNA, 야생형 miRNA와 상동의 miRNA-유사 후보 분자 및 침묵 활성이 재활성화되거나 (즉, 원형의 miRNA -유사 분자 서열 내에 존재하는 가이드 가닥의 것과 상보적인 표적 서열의 표적화) 또는 재활성되고 재유도된 miRNA -유사 분자 (즉, 선택의 다른 표적 서열의 표적화)의 효율을 비교하는 것을 목표로 하였다. 상기 명시된 바와 같이, (발현되지만 상응하는 야생형 침묵 분자와 같이 처리되지 않는 ncRNA를 암호화하는) 후보 유전자에서 침묵 활성의 재활성화 (또는 재활성화 및 재유도화)는, 상기 언급되고, 예를 들어 WO 2019/058255에서 개시된 GEiGS 플랫폼을 사용하여 달성될 수 있다. 침묵 특이성의 재활성화/재유도화를 위해 GEiGS를 사용하여, "GEiGS-올리고"라고 명명된 DNA 올리고뉴클레오타이드가 설계되었다. GEiGS-올리고의 서열은 목적하는 뉴클레오타이드 변화 (예를 들어 해당 유전자에 의해 암호화된 RNA의 침묵 특이성을 선택한 표적 유전자로 재유도하는 데 필요한 뉴클레오타이드 변화)를 포함하여, 유전적으로 편집될 유전자의 서열을 포함한다. 다음으로, "GEiGS-공여자(GEiGS-donor)" (또한 본 명세서에서 "공여자"로 지칭됨)로 명명된 DNA 올리고뉴클레오타이드는 GEiGS-올리고에 의해 표적화된 영역에 인접하는 편집될 유전자의 서열에 상응하는 두 개의 서열 사이에 위치하는 "GEiGS-올리고"를 포함하도록 설계된다. GEiGS-공여자를 포함하는 벡터가 Cas9과 같은 엔도뉴클레아제 및 편집될 유전자를 표적으로 하는 sgRNA와 함께 세포에 도입되면, GEiGS-올리고가 (HDR에 의해 매개되는)세포의 지놈 내로 도입되어, 편집된 유전자는 이제 목적하는 변화(예를 들어 재활성화되고 재유도되는 침묵 활성을 가진 miRNA -유사 유전자를 암호화)를 포함한다.
그러므로 또한 본 명세서에서 사용된 시스템은, 상기 명시된 바와 같이, 재활성화/재유도화를 위해 필요한 뉴클레오타이드 변화를 암호화하는 GEiGS-올리고를 사용하여 세포 내로 재활성화되거나 또는 재유도화 될 침묵 활성을 가진 miRNA -유사 분자의 침묵 효율을 정량화하기 위한 비교 실험 분석을 제공한다. 따라서, 야생형 miRNA 또는 miRNA -유사 분자의 전구체를 발현하기 위해 하기 명시된 시스템에서 사용된 "GEiGS-올리고 벡터"로 명명된 벡터 내의 서열은 또한, 이러한 전구체 서열이 상기 명시된 바와 같이, GEiGS-올리고를 사용하여 세포 내로 도입될 수 있기 때문에 "GEiGS-올리고"로 지칭된다.
사용된 일시적 시스템에서, 두 개의 플라스미드의 공동 형질주입이 원형질체에서 수행되었다:
i) "Luc-센서 벡터" - 테스트된 miRNA 또는 miRNA -유사 (또한 본 명세서에서 "GEiGS-sRNA 표적 부위"로 지칭됨)에 의해 침묵 될 표적 서열이 클로닝 된 MCS(다중 클로닝 부위)에 융합된 루시퍼라제(luciferase, LUC) 코딩 리포터 서열을 포함한다. 벡터는 또한 LUC 신호의 보정을 위해 사용되는 추가 형광 단백질 (FP) 마커 (또한 본 명세서에서 "보정기(normalizer)로써 지칭됨)를 포함한다.
ii) "GEiGS-올리고 벡터" - (1) MCS에서 복제된 "GEiGS 컨스트럭트" (즉, GEiGS-올리고의 사용에 의해 생성될 수 있는 miRNA 전구체, miRNA -유사 전구체 또는 재활성화/재유도된 miRNA -유사 전구체); 및 (2) 다른 형광 단백질 (FP2) 마커를 포함한다.
"GEiGS-올리고" (miRNA/miRNA--유사 전구체)가 세포 내 RNAi 시스템에 의해 가공되면, sRNA가 생성된다. 해당 sRNA가 침묵 활성을 갖고 LUC 전사체에 융합된 표적과 일치하면, 해당 mRNA가 분해되고 루시퍼라제 수준이 감소될 것이다. sRNA가 표적과 일치하지 않으면 침묵이 일어나지 않고 루시퍼라제가 축적되어 더 높은 검출 가능한 신호가 생성될 것이다. sRNA의 정체(identity) 및 침묵 특이성에 관계없이 형광 단백질 (FP 및 FP2)에 대한 침묵은 예상되지 않았다. 두 플라스미드에 대한 정성적 형질주입 효율은 형질주입 2일 째에 시작하는 형광 단백지을 검출하기 위하여 형광 현미경에 의해 시각화되었다.
GEiGS-올리고 벡터에 클로닝된 miRNA/miRNA -유사 전구체의 발현 결과와 같이 Luc-센서 벡터에 클로닝된 표적 서열의 침묵을 측정하기 위해, Luc-센서 및 보정기 신호 (발광 및 형광, 각각)는 형질 감염 3일 후 측정되었다. 그 다음으로, 하기 자세히 설명된 바와 같이, 다양한 실험 조건에 대해 LUC/FP 비율을 계산한 다음, 동일한 Luc-센서 벡터를 사용하여 처리 대 대조군 처리의 활성을 고려하여 침묵 값이 계산되었다.
표 1A 및 1B에서 볼 수 있고, 및 하기 추가로 명시된 바와 같이, (Luc-센서 벡터 내) 표적 서열 및 (GEiGS-올리고 벡터 내) 테스트된 miRNA/miRNA -유사 전구체의 다음 조합이 검사되었다:
1. 성숙 miRNA 서열과 상응하는 표적 서열을 갖는 야생형 (정형적인(canonical)) miRNA (miR405a 또는 miR8174). 음성 대조군으로서, 동일한 표적 벡터는 어떠한 miRNA 전구체 서열도 발현하지 않는 두 번째 벡터와 함께 사용되었다.
2. 성숙 miRNA가 (각각 상응하는 야생형 miRNA, miR405a 또는 miR8174에 대한 정렬에 따라) 위치했을 위치에 상응하는 표적 서열을 갖고, 상기 명시된 대로 밝혀진, 해당 정형적인 miRNA (Dead_miR859 또는 Dead_mir_1334)로써 처리되지 않는 침묵이 결여된(silencing-deficient) miRNA -유사 분자의 전구체 서열. 음성 대조군으로서, 동일한 표적 벡터는 어떠한 miRNA 전구체 서열도 발현하지 않는 두 번째 벡터와 함께 사용되었다.
3. 성숙 miRNA와 상응하는 표적 서열을 갖는 재활성화된 (원래 침묵이 결여된) miRNA -유사 분자 (Dead_miR859)의 전구체 서열 ((2)에서와 동일한 것). 음성 대조군으로서, 동일한 표적 벡터는 어떠한 miRNA 전구체 서열도 발현하지 않는 두 번째 벡터와 함께 사용되었다.
4. 재활성화 및 재유도된 miRNA -유사 분자(Dead_miR859 또는 Dead_mir_1334)의 전구체 서열로서, 이는 AtPDS3 유전자의 표적 서열과 함께 AtPDS3 유전자의 표적 서열을 침묵하도록 재활성화 및 재유도된 것이다. 음성 대조군으로서, 동일한 표적 벡터는 AtPDS3에 대해 표적화되지 않는 재활성화된 침묵이 결여된 miRNA -유사 분자 (Dead_miR859 또는 Dead_mir_1334)를 발현하는 두 번째 벡터와 함께 사용되었다. GEiGS 유전자 편집 방법을 사용하여 Dead_miR859 또는 Dead_mir_1334을 암호화하는 유전자의 AtPDS3로의 재유도화를 수행하기 위해 세포 내에서 사용될 수 있는 GEiGS 공여자 올리고뉴클레오타이드 및 sgRNA의 서열은 상기 표 1A 및 1B에 나와 있다.
5. 모의(Mock) - 형질주입되지 않은 세포.
예상되는 (하기 결과에 의해 확인된 것과 같이) 침묵 결과를 포함하는 상기 조합은 도 8A-B에 요악되어 있다. 이 실시예에서 사용된, 죽은 상태에서 재활성화되거나 또는 재활성화 및 재유도화되는 miRNA -유사 전사체의 변화에 대한 이론적 근거는 도 7에 도식적으로 묘사되어 있다. 상기 명시된 바와 같이, 테스트된 miRNA/miRNA -유사 분자의 예측된 2차 구조는 도 9A-B 및 9E-F에 나와 있다.
상기 명시된 시스템을 사용하여 얻어진 실험 절차 및 결과는 다음과 같다:
원형질체 현미경 - 결과
형질주입된 모든 처리에서 형광 단백질 (FP 및 FP2)에 대해 양호한 신호가 검출되었으며, 이는 원형질체 세포 집단의 상당 부분이 Luc-센서 벡터 및 GEiGS-올리고 벡터와 함께 성공적으로 공동 형질주입되었음을 나타낸다. 음성대조군 (모의)에 대해 형광 단백질 신호(FP 및 FP2)가 검출되지 않았다.
miRNA -유사 분자의 재기능(재활성화) - 결과
각 처리에 대해, Col-0 원형질체는 상기 및 도 8A-B에 명시된 바와 같이 Luc-센서 벡터 및 GEiGS-올리고 벡터와 함께 형질주입되었다.
전구체가 있거나 없는 처리의 비율을 비교할 때(각각 어두운 회색 대 밝은 회색 막대), 야생형 miRNA miR405a(도 9C) 및 miR8174(도 9G)에 대해 LUC/FP 비율의 상당한 감소가 관찰되었다. 값은 각 분석에서 대조군 처리에 대하여 보정되었고 침묵은 대조군과 비교하여 측정된다. 이 결과에 따르면 miR405a및 miR8174가 표적 서열을 침묵시키는 효능은 각각 38% 및 64%였다.
전구체가 있거나 없는 처리에 대한 비율을 비교할 때, “죽은” miRNA -유사 전구체 miR859 (도 9C) 및 miR1334 (도 9G)에 대해 LUC/FP 비율의 유의미한 감소가 관찰되지 않았다. 이는 이러한 miRNA -유사 전구체가 침묵 활성을 갖는 sRNA로 가공될 것으로 예측되지 않았기 때문에 예상한 대로였다.
전구체의 유무에 관계없이, 재활성화된 miR859 (도 9C)에서 LUC/FP 비율의 통계적으로 유의미한 감소가 관찰되었다. 재활성화된 miR859의 침묵 효능은 32%였다.
재활성화된 miRNA의 재유도화 - 결과
각 처리에 대해, Col-0 원형질체는 상기 및 도 8A-B에 명시된 바와 같이 Luc-센서 벡터 및 GEiGS-올리고 벡터와 함께 형질주입되었다.
AtPDS3 서열의 침묵이 테스트되었을 때, AtPDS3에 대해 재활성화 및 재유도된 miR859 및 miR1334의 비율과 재활성화된 miR859 및 miR1334의 비율을 비교할 때 LUC/FP 비율의 상당한 감소가 관찰되었다 (도 9D 및 9H). 재활성화 및 재유도화된 miR859 및 miR1334에 대한 항-PDS 침묵 효능은 각각 55% 및 33%였다. miR859 및 miR1334에 대한 예상 sRNA의 길이는 각각 24nt 및 21nt였다. 관찰된 침묵 효과는 재유도화된 올리고가 적절하게 가공되고 성숙 sRNA가 PDS3 유전자에 대해 각각의 새로운 표적 서열을 표적화할 수 있음을 의미하였다.
실시예 3
인간 세포에서 재활성화된 침묵 RNA의 기능
재활성화된 비-암호화 RNA가 인간에서 기능하는지 확인하기 위해, pmirGLO Dual-Luciferase miRNA Target Expression Vector kit (Promega, USA)를 사용하여, 일시적인 시스템에서 그 생물 발생 및 활성을 테스트한다. 표적 서열은 제조사의 지침에 따라 fLUC 서열의 다운스트림에 있는 MCS에 도입된다. 테스트된 GEiGS-올리고는 일시적인 과발현을 위해 T-REx 시스템 (Thermo Fisher, USA)을 사용하여 클로닝된다. 인간 세포주는 Expi293 Expression System (Thermo Fisher, USA)을 사용하여 형질주입된다. 플라스미드 부여 24-72시간 후, 세포의 절반이 루시퍼라제 활성에 대해 분석되고, 및 나머지 절반은 작은(small) RNA 시퀀싱 분석이 수행된다. 이중 루시퍼라제 분석은 Dual-Glo® Luciferase Assay System (Promega, USA)을 사용하여 제조사의 지침에 따라 수행된다. 총 RNA는 제조사의 지침에 따라 MirVanaTM miRNA isolation kit (Thermo Fisher, USA)로 추출된다. 이러한 샘플에서 목적하는 성숙 작은 RNA(mature small RNA)를 확인하기 위해 소형 RNA 시퀀싱(small RNA sequencing) 분석이 수행된다. 기능적인 재활성화된 비-암호화 RNA는 기능장애 비-암호화 RNA 또는 비-LUC-특이적 siRNA로 가공되는 재활성화된 비-암호화 RNA를 발현하는 대조군 컨스트럭트와 비교하여 LUC 유전자를 하향 조절한다(down-regulate).
실시예 4
인간 세포에서 재활성화된 침묵 RNA에 의한 HIV-1에 대한 면역
HIV-1 감수성 인간 세포주 [Reil, H. 외, Virology (1994) 205(1): 371-375]는 제조사의 지침에 따라 GEiGS 컨스트럭트와 함께 Expi293 Expression System (Thermo Fisher, USA)을 사용하여 형질주입된다. 성공적인 GEiGS 이벤트를 확인하기 위하여 단일 콜로니를 분리하여 유전자형을 분석하고 및 추가적으로 유지된다. qRT-PCR에 의한 전사 수준 분석뿐 아니라, 바이러스 단백질 p24 및 gp120의 정량화를 위한 웨스턴블롯분석이 바이러스 복제를 모니터링하는 데 사용된다. 통합 HIV-1 카피 수는 서던 블롯에 의해 평가된다.
실시예 5
예쁜꼬마선충(C. elegans)에서 재활성화된 침묵 RNA의 기능
재활성화된 비-암호화 RNA가 C.elegans에서 기능하는지 확인하기 위해, 어디에서나 발현되는 GPF 마커를 사용하여, 안정적인 유전자 마커 시스템에서 그 생물 발생 및 활성을 테스트한다. 재활성화된 비-암호화 RNA를 갖는 선충은 GFP 이식유전자(transgene) 서열을 표적으로 하기 위해 생성된다. 편집된 벌레는 GFP 발현 및 강도에 대해 테스트된다. 기능적인 재활성화된 비-암호화 RNA를 갖는 선충은 기능장애 비-암호화 RNA 또는 비-GFP-특이적 siRNA로 가공되는 재활성화된 비-암호화 RNA를 발현하는 대조군 동물과 비교하여 GFP 유전자를 하향 조절한다. GFP 발현은 현미경 분석, qRT-PCR, RNA-seq 및 small RNA-seq에 의해 평가된다.
실시예 6
예쁜꼬마선충(C. elegans)에서 GEiGS 시스템을 통한 내인성 유전자의 넉다운
C. elegans 지놈의 변화는 내인성 UNC-22 유전자를 표적으로 하는 비-암호화 RNA를 생성하도록 설계된다. 지놈 유전자좌의 맥락에서 확장된 상동성 팔과 함께, 이들 서열이 생성되고 및 "공여자"로 명명된다. 가이드 RNA는 목적하는 유전자좌에서 DNA를 손상하기 위해 CRISPR/CAS9 벡터 시스템에 도입된다. 이들은 유전자 충격 프로토콜을 통해 "공여자" 벡터와 함께 식물체에 공동 도입되어 상동 DNA 복구 (HDR)를 통해 목적하는 변형을 도입한다. 예쁜꼬마선충(C. elegans) 개체군은 이들 두 개의 서열로 형질전환되어 지놈에 필요한 변화를 포함하는 예쁜꼬마선충(C. elegans) 개체군을 생성한다. 주사 후 24-72시간에 해부 현미경으로 NGM 플레이트에서 선충은 분석된다. "Twiching" 표현형은 UNC-22의 넉다운에 대한 증거로 기록된다. 또한, 이러한 선충은 qRT-PCR, RNA-seq 및 작은(small) RNA 분석에 의한 UNC-22 발현 수준을 분석하기 위해 수집된다.
본 발명이 그 특정 실시예와 관련하여 명시되었지만, 많은 대안, 수정 및 변형이 당업계의 기술자에게 자명할 것임이 분명하다. 따라서, 첨부된 청구항의 의미(spirit) 및 넓은 범위 내에 속하는 이러한 모든 대안, 수정 및 변형을 포함하도록 의도된다.
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은, 각 간행물, 특허 또는 특허 출원이 참조에 의해 본 명세서에 포함되는 것으로 구체적이고 및 개별적으로 나타난 것과 동일한 정도로, 본 명세서에 전체적으로 포함된다. 또한, 본 출원에서 어떠한 참조의 인용 또는 식별은 이러한 참조가 본 발명에 대한 선행 기술로서 이용 가능하다고 인정하는 것으로 해석되지 않는다. 섹션 제목이 사용되는 범위 내에서 반드시 제한적인 것으로 해석되어서는 않된다.
또한, 본 출원의 우선권 문서(들)은 그 전문이 참조로 여기 본 명세서에 포함된다.
SEQUENCE LISTING <110> TROPIC BIOSCIENCES UK LIMITED MAORI, Eyal GALANTY, Yaron PIGNOCCHI, Cristina CHAPARRO GARCIA, Angela MEIR, Ofir <120> INTRODUCING SILENCING ACTIVITY TO DYSFUNCTIONAL RNA MOLECULES AND MODIFYING THEIR SPECIFICITY AGAINST A GENE OF INTEREST <130> 81320 <150> UK 1903519.5 <151> 2019-03-14 <160> 527 <170> PatentIn version 3.5 <210> 1 <211> 157 <212> DNA <213> Artificial sequence <220> <223> Wt sequence miR405a <400> 1 tcaaaatggg taacccaacc caacccaact cataatcaaa tgagtttatg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgagttgggt ctaacccata actcatttca 120 tttgatgggt tgagttgtta aatgggttaa ccattta 157 <210> 2 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Mature sequence miR405a <400> 2 atgagttggg tctaacccat aact 24 <210> 3 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Target of miR405a analysed <400> 3 agttatgggt tagacccaac tcat 24 <210> 4 <211> 157 <212> DNA <213> Artificial sequence <220> <223> Wt sequence Dead miR859 <400> 4 tcaaaatggg taatccaact caactcaact cataatcaaa tgagtttagg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgggttcggt caacccataa ctcaattaat 120 ttgatggatt gagttggtaa atgagttaac ccattta 157 <210> 5 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Mature sequence Dead miR859 <400> 5 atgggttcgg tcaacccata actc 24 <210> 6 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Target analysed of Dead miR859 <400> 6 gagttatggg ttgaccgaac ccat 24 <210> 7 <211> 157 <212> DNA <213> Artificial sequence <220> <223> Reactivated (RmiR) Sequence <400> 7 ccagattgga ttgcctcaca ccacacacga ctcaattcac taagacgagg attaaattgg 60 gttatgggtg accgaactca ttttgccaaa tgggttcggt caacccataa ctcaattttg 120 gtgaaggtcg tgggtggaaa aggaggcaac ccagtca 157 <210> 8 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Reactivated (RmiR) Mature sequence <400> 8 atgggttcgg tcaacccata actc 24 <210> 9 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Target analysed Reactivated (RmiR) <400> 9 gagttatggg ttgaccgaac ccat 24 <210> 10 <211> 157 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) <400> 10 tcaaattggg taaactaccc caacatctct caaaatccaa ggttgttagg accaaatgtg 60 gtttgtggac agagttttca ttttgctaaa tgaaaatttt gatttacgaa ttgcattatc 120 ttgggtgagg gaggttgcaa attagtttag ccagtta 157 <210> 11 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) Mature sequence <400> 11 atgaaaattt tgatttacga attg 24 <210> 12 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) Target analysed (PDS3- At4g14210) <400> 12 caattcgtaa atcaaaattt taat 24 <210> 13 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) sgRNA <400> 13 attaatttga tggattgagt tgg 23 <210> 14 <211> 1200 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) DONOR (1.2 kb) <400> 14 gtcaaaatat gtcaaaattc atgcgtcaaa ctcaactcaa ctcaacccat gaaccctaat 60 gagttaaaaa tttggactca aatgggttga tgagtcaaat gagttattga gtcaattggt 120 ttgatgagta aaatgagttg ggttgtaatg attaatggtt tcaatggttt acccaattaa 180 ctcatcaagt tttgtaaaat tgaactaaac caactaaaat ctttaaacca atgccaattt 240 aagtttaacc aacatatcta aaccaattta ataaaatcaa tatttttcca aatttcttaa 300 atatacaagc gataaaattg agaaaaagta aactcgtaat ttttccacca aaaaacataa 360 acccgtgatt ttcccgccaa aaccgtaaac ccgtgatttt cccgcccaaa acgtaaaccc 420 ttgatttttc cgcccaaaac gtaaatatcc taagtttgat gataatgaat taataattat 480 tatttattat tttttataat aataattaat taaattatta cttaactggc taaactaatt 540 tgcaacctcc ctcacccaag ataatgcaat tcgtaaatca aaattttcat ttagcaaaat 600 gaaaactctg tccacaaacc acatttggtc ctaacaacct tggattttga gagatgttgg 660 ggtagtttac ccaatttgac acccctaatg acaatatgag tttaaagttc attagttcat 720 atgtatgaca atataagttt atatgaacta acaaaaataa atactttaag atcatagtaa 780 taaatacgtg aatatcataa taatatagaa aaatcgtata tatatataca tagacctcaa 840 atgcaacaaa aatactaaag aaaaactttt atcaaattac gtgataaata aataattgtt 900 cttttatcaa aattactaaa aacaattcat tccttcttct tatttttttt aataatacta 960 taataactag gatacgacac agcaggttaa atattttatt tatttttctt ttttataaac 1020 gaaatttatt gtttattgtt atttgtgttt attaataatt atctataaaa ctgtgtatat 1080 ttttattgag tcgtacttat gatattagta agtctaatag gttattttat cttttaggat 1140 ttgactcgtg ctagaccaca ccacgtgata atttttactt ttagtgtttt tagattaatg 1200 <210> 15 <211> 113 <212> DNA <213> Artificial sequence <220> <223> Wt sequence miR8174 <400> 15 cggcccatcc gttgtctttc ctggtacgca tgtgccatgg ctttctcgta agggactgga 60 ttgtccgtat ttctcatgtg tatagggaag ctaatcgtct tgtagatggg ttg 113 <210> 16 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Mature sequence miR8174 <400> 16 atgtgtatag ggaagctaat c 21 <210> 17 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Target of miR8174 analysed <400> 17 gattagcttc cctatacaca t 21 <210> 18 <211> 113 <212> DNA <213> Artificial sequence <220> <223> Wt sequence Dead miR1334 <400> 18 attcgcattc tctgtctttc ctagtacgtt tatgttatgg cttcatttcg aaggactaga 60 ttgtccgaat tactcatgtg tatagggaag ctaatcgtct cgcagatgaa tta 113 <210> 19 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Mature sequence Dead miR1334 <400> 19 atgtgtatag ggaagctaat c 21 <210> 20 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Target analysed of Dead miR1334 <400> 20 gattagcttc cctatacaca t 21 <210> 21 <211> 113 <212> DNA <213> Artificial sequence <220> <223> Reactivated (RmiR) Sequence <400> 21 tcacgcattc gttgacttcc ctagtacgca tattgaactg ctgtaaggtg aaggacgtta 60 atgtaccaaa aacttatgtg tatagggaag ctaatcgtcc cgcagatgtg tga 113 <210> 22 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Reactivated (RmiR) Mature sequence <400> 22 atgtgtatag ggaagctaat c 21 <210> 23 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Reactivated (RmiR) Target analysed <400> 23 gattagcttc cctatacaca t 21 <210> 24 <211> 113 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) Sequence <400> 24 atgtgcatcg cagtgattgg tgtgttatat gactaaaagt ctttatcgcg aagggctata 60 tcgacctagg tactttatat gaacattaat aactggcccc cccagatgca tgt 113 <210> 25 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) Mature sequence <400> 25 tatatgaaca ttaataactg g 21 <210> 26 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) Target analysed (PDS3- At4g14210) <400> 26 ccagttatta atgttcatat a 21 <210> 27 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) sgRNA <400> 27 atgttatggc ttcatttcga agg 23 <210> 28 <211> 1200 <212> DNA <213> Artificial sequence <220> <223> Redirected (Anti PDS-PDSmiR) DONOR (1.2 kb) <400> 28 gttatatgtg ttctttacac aatcattgct tgaatgggta tacagtaatt tgggagaaca 60 agaacttgtc ggaggttatc cgtgggctac tttattcgct ttggcagcat ggtggggttg 120 gaaacggcgc tgcagaaatg tgtttgggga gaataggaaa tgtcgagata gagttcgttt 180 cctaaaggat tcagcgaaag aggtggtgga ggctcactcg ctgcttggga gtaatcgagg 240 taatgtaact agggtggaga gacaaatagc atgagttccg ccaggagatg gttggctgaa 300 gttaaacacg gatggcgcat cacgtggaaa tccgggttta gcaatagctg gtggtgtttt 360 acgggataat gagggtattt ggtgtggtgg ttttgcggga atctcggagt ttgttcggct 420 cctttagtta agttatgagg tgtgtattac gggcttttca tagcttggga gaaaaaggct 480 acgcgggtgt agctggaagt ggattcagat atggtggtgg gttttcttaa aacatggatt 540 agcgatgtgc atcgcagtga ttggtgtgtt atatgactaa aagtctttat cgcgaagggc 600 tatatcgacc taggtacttt atatgaacat taataactgg cccccccaga tgcatgtgca 660 aaccatgctt ttttgttacc tttggggttt catagttttc cccttaggcc tgattttgct 720 acttcgatta tttttgagga tgctagtagt gctacgcgcc cacggaatgt tcgtgtgtaa 780 tttttttatt ttgtttttta ataatatggg agactagtct ccctcattct aaaaaaaata 840 aaaaattata attatataaa atagatataa aattattaat tacataataa tacacacaaa 900 aaatgaatat caagaaaaat ctctctctct ctaaatcaaa atcaaatgag agaagagagg 960 cgatacgacg aacgattgca tctcttcgat tcctacggct gtctctcgct cgccgagagt 1020 tttcttcgcc agtttccggc ggttacttca gggatgaata acggtagaac ggttgtggac 1080 cccataactg cttctcaacc aaacctattt ataccctgcg catgtctctg ttctcgttgg 1140 gttgatcaga gtgaaagtac acaaattcct ttgttcatat tgacaatggc agataatctc 1200 <210> 29 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 29 aaacgagctc gctag 15 <210> 30 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 30 gcaggtcgac tctag 15 <210> 31 <211> 48 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 31 aaacgagctc gctagtcaaa atgggtaatc caactcaact caactcat 48 <210> 32 <211> 52 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 32 gcaggtcgac tctagtaaat gggttaactc atttaccaac tcaatccatc aa 52 <210> 33 <211> 43 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 33 aaacgagctc gctagattcg cattctctgt ctttcctagt acg 43 <210> 34 <211> 44 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 34 gcaggtcgac tctagtaatt catctgcgag acgattagct tccc 44 <210> 35 <211> 45 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 35 aaacgagctc gctagtcaaa atgggtaacc caacccaacc caact 45 <210> 36 <211> 50 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 36 gcaggtcgac tctagtaaat ggttaaccca tttaacaact caacccatca 50 <210> 37 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 37 aaacgagctc gctagcggcc catccgttgt ct 32 <210> 38 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 38 gcaggtcgac tctagcaacc catctacaag acgattagct 40 <210> 39 <211> 45 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 39 aaacgagctc gctagtcaaa ttgggtaaac taccccaaca tctct 45 <210> 40 <211> 45 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 40 gcaggtcgac tctagtaact ggctaaacta atttgcaacc tccct 45 <210> 41 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 41 aaacgagctc gctagatgtg catcgcagtg attggt 36 <210> 42 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 42 gcaggtcgac tctagacatg catctggggg gg 32 <210> 43 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 43 aaacgagctc gctagccaga ttggattgcc tcacacc 37 <210> 44 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 44 gcaggtcgac tctagtgact gggttgcctc cttttcc 37 <210> 45 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 45 aaacgagctc gctagtcacg cattcgttga cttccctagt 40 <210> 46 <211> 38 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 46 gcaggtcgac tctagtcaca catctgcggg acgattag 38 <210> 47 <211> 9835 <212> DNA <213> Turnip mosaic virus <400> 47 aaaaaatata aaaactcaac ataacataca caaaacgatt aaagcaaaca caaatctttc 60 aaagcattca agcaatcaaa gattctcaaa tctttcatcg ttatcaaagc aatcaccaac 120 agcaaaccaa atggcagcag ttacattcgc atcagctatc accaacgcca tcaccagcaa 180 accagcactc accggaatgg tgcagtttgg gagtttccca ccaatgccat tgcgatccac 240 caccgtcacc acagtcgcca cttcagtggc gcaacctaaa ctgtacacag tgcagtttgg 300 aagccttgac ccagtagtcg tcaagagtgg agcagggtcc cttgctaagg caacacgcca 360 gcagcctaac gttgaaatag acgttagcct cagtgaagcc gcagctctgg aggttgcgaa 420 acctagatcg aatgccgtgt tgaggatgca cgaggaagca aacaaggaga gagcactctt 480 tttggactgg gaggctagtt tgaagagaag ctcgtatgga attgctgagg acgagaaggt 540 tgtaatgaca actcatggcg tcagcaagat agtgcccaga agttcaaggg caatgaagct 600 aaagcgcgca agggagaggc gtagagcgca gcaaccaatt atattaaagt gggagcccaa 660 attgagcggg atctcaatcg gaggagggct ctctgcgagc gtaatcgaag cagaagaggt 720 tcgcacaaag tggccgcttc ataagacacc gtcaatgaag aagaggacgg tgcacagaat 780 atgcaagatg aacgaccaag gagttgacat gttgacacga tccctggtta agattttcaa 840 gactaagagt gccaacattg aatacatcgg aaagaagtcg attaaggtcg atttcatcag 900 aaaagaacga acgaaattcg caagaatcca agtagcacac ttactcggga agagagcaca 960 gcgcgacttg ttaactggaa tggaagaaaa ccattttatt gacattctca gtaagtactc 1020 aggtaacaaa acaaccataa atcctggagt agtttgcgca ggttggagtg gcatagtcgt 1080 tggaaatgga attctaaccc agaaacgaag cagaagtcca tcagaggcct ttgtaattag 1140 aggtgagcac gaaggcaagt tgtacgatgc caggatcaaa gtcacgagga caatgagtca 1200 caagattgtg cactttagtg cagcaggagc caacttctgg aaaggcttcg acagatgctt 1260 tctcgcatac cgtagtgaca atcgcgagca tacatgctat tcagggctag atgtcactga 1320 gtgcggcgag gtggcagcac tgatgtgttt ggctatgttc ccatgcggaa agataacctg 1380 ccctgactgt gtaacagata gtgagctatc ccaaggacaa gcaagcggac catctatgaa 1440 gcacaggttg acacagctac gcgatgtcat caagtcaagc tacccacgct tcaagcatgc 1500 agtgcagata ctagataggt atgagcaatc actgagcagt gcaaacgaga actaccaaga 1560 tttcgcagaa atccagagca taagcgatgg agttgaaaaa gctgcattcc cacacgtcaa 1620 caagctaaac gcaatattga tcaaaggggc cacagtaaca ggagaggaat tctcgcaggc 1680 tacgaagcac ttgctcgaga tagcacgata cctgaagaac agaaccgaga acattgagaa 1740 gggttcactg aagtcctttc gcaacaagat ttcccagaaa gcgcacatca acccaacact 1800 aatgtgtgac aaccagctcg atagaaatgg aaatttcata tggggtgaga gaggatacca 1860 tgcaaaacga ttcttcagca actactttga aataatcgat ccaaagaaag gctacaccca 1920 atacgagaca agagcggtac caaatgggtc acggaaactt gcaatcggca aactaatagt 1980 cccaacgaac ttcgaagttt taagggaaca gatgaaaggc gaaccggtag aaccataccc 2040 agtaacagtc gagtgtgtga gcaagttaca gggtgacttc gtccatgcat gttgttgtgt 2100 cacaacagaa tcaggcgacc cagtcttgtc tgagatcaaa atgccaacca aacaccatct 2160 agtgattggt aacagcggtg atccaaagta catagatctc cctgagatcg aggagaataa 2220 aatgtacata gcgaaagaag gttattgtta catcaatatc ttcctagcca tgttggtaaa 2280 tgtcaaggag tcgcaggcaa aggagttcac gaaagttgtt agggacaaac tagttggcga 2340 acttggcaag tggcccactc tgttagatgt agcaaccgct tgttatttcc tgaaagtatt 2400 ttacccagac gttgctaacg ccgaattgcc acgcatgcta gtggaccata agacaaagat 2460 aattcatgtc gttgattcat atgggtcact gtcaactgga tatcatgtcc ttaagacaaa 2520 cactgtggaa caactcatca aattcacgag atgtaatttg gagtcaagct tgaaacacta 2580 ccgcgttgga ggaacagaat gggaggacac tcatggatcc agcaacatag ataatccaca 2640 gtggtgcatc aagaggctca taaaaggagt ctacaaacca aagcaactga aagaagacat 2700 gttggcaaac cctttcttac cactatatgc tctactgtca ccaggtgtca tcctggcatt 2760 ttacaatagt ggctctctag agtacttgat gaaccattac atcagggtgg acagcaacgt 2820 cgccgttttg ttggtcgttt tgaaatctct agcgaagaag gtgtcaacta gtcagagtgt 2880 gttagcccag cttcaaatca ttgaacgaag tctaccagaa ctcatcgaag caaaggctaa 2940 tgttaatggg ccagatgacg cagccactcg cgcgtgtaac agattcatgg gcatgcttct 3000 gcatatggca gaaccaaact gggagcttgc ggatggtgga tacacaattc tgagggatca 3060 tagcatctcc attttggaaa aaagttatct acaaatcttg gacgaagcat ggaacgagtt 3120 aagttggtcg gagcgctgtg ctataagata ctactcgtca aagcaagcaa tctttacaca 3180 gaaagatttg ccaatgaaaa gcgaagccga tttaggcggc agatacagcg tgtcagtcat 3240 gtcatcttac gaacggagta agcaatgtat gaaaagcgtg cactctagta taggtaatag 3300 attacgtagt agtatgtctt ggactagtag caaggtgtcg aatagtgtgt gtaggactat 3360 taactattta gtaccagatg tgttcaagtt tatgaatgta ctcgtttgta tcagcttact 3420 aatcaagatg actgccgagg cgaatcacat cgtcaccacg caaagaaggc tcaaactaga 3480 tgtcgaggag acagagcgca ggaaaataga atgggagctt gcattccacc atgccattct 3540 gacgcagagt gcaggtcaac acccaacgat agacgagttc agagcgtaca tcgccgacaa 3600 ggcaccacat ctaagtgagc atatcgagcc tgaagaaaag gcggtggttc atcaagcgaa 3660 gagacaatcc gagcaagaac tcgagcgtat aatagcattt gttgcattgg tgctcatgat 3720 gttcgatgca gaacgaagcg actgtgtcac aaagattctc aacaagctta agggactagt 3780 cgccactgtg gaacctacag tctaccatca gactctcaat gatatagagg atgacttgag 3840 tgagaggaac ctcttcgtcg attttgagct tagcagcgat ggagatatgc tccaacagct 3900 tccagccgaa aagacatttg cctcatggtg gagtcatcaa ctaagcagag gattcacaat 3960 cccacactac aggacagaag ggaagttcat gactttcacc agagcaactg ccacggaagt 4020 cgcgggtaaa atagcacacg agagtgacaa agacatatta ctaatgggag cagtaggatc 4080 aggtaagtca actggcttgc catatcatct ctccagaaaa gggaacgtat tactccttga 4140 gccgactcgg ccacttgcag aaaacgtaca caagcagttg tcgcaggcac cgttccatca 4200 gaacacaact cttaggatgc gcggactaac agcattcggg tcggcaccaa tctcagtgat 4260 gaccagtggt tttgcactca attactttgc aaacaacaga atgcgaattg aagaatttga 4320 ctttgtcata tttgatgaat gtcacgttca tgacgccaat gcaatggcga tgagatgttt 4380 gctacatgag tgtgactatt ctggcaaaat tatcaaagtt tcagccacac caccaggtcg 4440 agaagttgag ttctccactc aataccccgt gtcgataagc acagaagaca cactatcgtt 4500 tcaggatttt gtgaacgcac agggtagtgg aagcaattgt gatgtgattt caaaaggaga 4560 caatatcctc gtgtatgtag caagctacaa tgaggtagac gcgctttcaa aacttctaat 4620 tgaaagagac ttcaaagtca cgaaggttga tggaagaacg atgaaagttg gaaacatcga 4680 gatcaccaca agtggaacac ctagtaagaa gcacttcata gttgcaacca acatcataga 4740 gaacggtgtt actctagaca tcgatgtggt tgctgatttt ggaacgaagg tactcccata 4800 tcttgataca gacagcagaa tgctgagcac aactaagaca agcatcaatt atggggaacg 4860 tatccaaagg ctaggaagag tcggaaggca caagccaggt cacgctctgc gaataggtca 4920 cacagagaag gggttgagcg aagttccaag ttgtattgca acagaagcag ctttaaagtg 4980 cttcacttat gggcttccag tgatcaccaa caacgtctcg acaagtattc ttggtaatgt 5040 aacggtaaag caggcacgaa caatgtctgt atttgagata acaccgttct acacaagcca 5100 agtggtgaga tatgatggct ccatgcatcc acaggtgcac gcactcttaa agagattcaa 5160 actcagagac tctgagattg ttttgaataa attagccata cctcaccgag gagtgaacgc 5220 ttggctcaca gctagtgagt atgcacgact tggcgcgaat gttgaagata ggcgtgacgt 5280 tcgaattcct tttatgtgtc gcgacatccc agaaaaactt catctagaca tgtgggatgt 5340 gattgttaaa ttcaaaggtg atgcaggttt tggtcggctt tcaagcgcca gtgcgagcaa 5400 ggtagcttat actctacaga cggacgtcaa ctccatacag cgaacagtca ctatcataga 5460 tacactaatc gctgaggaga gaaggaagca ggaatacttc aagacggtaa cctccaactg 5520 tgtctcttct tcgaacttct cactgcagag cataacaaat gcgataaaat ctcgtatgat 5580 gaaagatcac acgtgcgaga acatatcagt gcttgaagga gcgaagtcac agttactcga 5640 gtttagaaac ctgaatgctg atcactcatt tgctacaaaa accgatggaa tatctcggca 5700 tttcatgagt gagtatggag ctcttgaggc agttcaccat caaaacacca gcgacatgag 5760 caaattcctc aagcttaagg gcaaatggaa taaaacgcta atcacgcgag atgtgctggt 5820 actttgtgga gttcttggag gtggattgtg gatggttatt cagcacctgc ggtcaaagat 5880 gtccgaaccc gtaacccatg aagcgaaagg taagaggcaa aggcagaaac taaaatttcg 5940 caatgcccga gacaacaaaa tgggtagaga agtgtacgga gatgatgata ccatagagca 6000 tttcttcggt gatgcctaca caaagaaagg gaagagcaag ggtaggacac gtggtatcgg 6060 acacaaaaac aggaagttca tcaacatgta tgggtttgat cctgaagatt tctctgcagt 6120 tcgtttcgtg gatccactca caggagcgac gttggacgac aacccgctca cagacatcac 6180 ccttgtgcaa gagcacttcg gcaacataag aatggactta ctcggggagg atgagctgga 6240 ctcaaatgaa atacgtgtga ataagactat tcaagcctac tacatgaaca ataaaacagg 6300 caaggctttg aaggtggatc tgacaccaca catacctctc aaggtgtgtg atcttcacgc 6360 aaccattgct ggattcccag agcgagaaaa cgagctgagg cagactggaa aggctcagcc 6420 catcaacata gacgaagtgc caagagctaa caacgaactc gtcccagtgg accacgagag 6480 taactccatg ttcagagggt tgcgtgacta caacccaata tcaaacaaca tttgtcatct 6540 cacaaatgtt tcagatggag catcaaactc gttatatgga gtcggtttcg gaccactcat 6600 attaacgaac cgacacctct ttgagcggaa taacggtgaa ctcgtaataa aatcacgaca 6660 tggtgagttc gtgattaaaa acacaactca gctacacttg ctaccgattc cagacagaga 6720 tcttctgcta atccggttac caaaggacgt cccacccttt ccacagaaat tgggtttcag 6780 gcaacctgag aaaggtgaac gaatttgcat ggtggggtcc aatttccaaa ccaagagcat 6840 aacgagtata gtctctgaga ctagtacaat aatgccagtg gagaacagtc agttttggaa 6900 acactggatt agcactaaag acggccaatg cggaagtcca atggtgagca cgaaagacgg 6960 gaaaatactc ggattacaca gcctagcgaa cttccagaac tccatcaatt actttgctgc 7020 tttcccagat gattttgccg agaagtatct tcataccatt gaagcacacg agtgggtcaa 7080 gcactggaag tataacacta gcgccatcag ttggggctct ttgaatatac aagcatcgca 7140 accgtccggc ttgttcaaag taagcaagct aatctcagac ctcgacagca cggcagtcta 7200 cgcacaaacc cagcagaatc ggtggatgtt cgagcagctc aacgggaacc taaaagcgat 7260 agcacactgc cctagccagc ttgtgacaaa gcacacagtt aaaggaaaat gtcagatgtt 7320 tgacttgtat ctcaagttgc atgatgaagc acgagagtat ttccaaccga tgctgggcca 7380 gtatcaaaag agcaaactca atcgagaagc atatgcaaag gatcttctga aatatgcaac 7440 gccaatcgaa gcaggaaaca tcgactgtga tctgtttgaa aagacagttg aaatagtcgt 7500 atcagatctg cgaggttatg gtttcgaaac atgcaattat gtcactgatg agaatgacat 7560 attcgaagct cttaacatga aatccgcagt tggagcgttg tataaaggaa agaagaagga 7620 ttacttcgct gagttcacac ccgagatgaa agaagaaata ctgaaacaaa gttgtgaacg 7680 gctcttccta ggaaagatgg gagtgtggaa cggctcgctg aaggcagagt tgcgaccact 7740 agaaaaagtg gaagcaaaca aaacacggac gtttactgcc gcaccactag acacactgtt 7800 gggtggaaaa gtttgcgtgg atgatttcaa caaccagttc tatgatcaca accttagagc 7860 tccttggagc gttggcatga caaagtttta ttgtggttgg gatcgcttgt tggagtcgtt 7920 gccagatggt tgggtgtatt gcgatgctga tggctcacag ttcgacagct cgctatcgcc 7980 atacttgatc aacgcagtac tcaacatccg cttaggattc atggaagagt gggacatagg 8040 ggaggtaatg ctgagaaatt tgtacaccga aatcgtgtat acccctattt ctacaccaga 8100 tggtacactc gtcaagaagt tcaaaggaaa caatagcgga cagccatcga ctgttgtgga 8160 caacacgctc atggtcatat tggcagtcaa ctattcactc aagaaaagcg gaattccaag 8220 tgagttgcgc gacagcatca tcagattctt cgtcaacgga gatgatttac tgctaagcgt 8280 acacccagag tatgagtata ttcttgacac tatggcagac aactttcgtg aactgggcct 8340 gaagtatact ttcgactcaa gaaccaggga aaaaggagac ctctggttta tgtcgcacca 8400 ggggcacaaa agagagggaa tctggattcc caagctcgag ccagagcgaa tagtatcgat 8460 tctagaatgg gatcggtcga aagagccatg ccatcgacta gaggcaatct gcgcagcgat 8520 gattgagtcg tggggatacg acaagttaac tcacgagata cgcaagttct acgcgtggat 8580 gattgaacaa gctccattta gctccctagc acaagaaggg aaagctcctt acatagcgga 8640 aacagcgctg aggaagctct accttgataa ggaaccagct caagaggatc tcacccatta 8700 tttgcaagca atctttgagg attatgaaga tggtgctgag gcttgtgttt atcaccaggc 8760 aggtgaaacg cttgatgcag gtttgacaga cgagcaaaag caggcagaga aggagaagaa 8820 ggagagagag aaggcagaaa aggaacgaga gaggcaaaag cagttggcac tcaagaaagg 8880 caaggatgtt gcacaagaag agggaaaacg cgacaaggaa gtaaacgctg gaacctctgg 8940 aactttcagt gtacccagac tcaagagtct gacaagcaag atgcgcgtgc caagatacga 9000 gaaaagagtg gctctaaacc tcgatcatct aatcctatac acgccggagc agacggatct 9060 atccaacaca cgttcaacgc gaaagcagtt tgacacatgg tttgaaggtg taatggctga 9120 ttacgaactg acggaggaca aaatgcaaat cattctcaat ggtttaatgg tctggtgcat 9180 tgagaacgga acctccccga acataaacgg aatgtgggtg atgatggacg gcgacgatca 9240 ggtggaattc ccgatcaaac cgctcattga ccacgccaaa cccacattta ggcagataat 9300 ggcccatttc agtgacgtag ctgaagcgta cattgaaaag cgtaaccaag accgaccata 9360 catgccacga tatggtcttc agcgcaattt aaccgacatg agcttagctc gatacgcatt 9420 tgatttctat gaaatgactt ctaggactcc aatacgtgcg agagaggcac acatccagat 9480 gaaagcagca gcactgcgtg gcgcaaataa taatttgttc ggcttggatg gaaacgttgg 9540 tacaacggta gagaacacgg agaggcatac gaccgaggac gttaatcgga acatgcataa 9600 cttactgggc gttcaggggt tgtgaagttg tatgctggta gactataagt atttaagttt 9660 actcgttagt attctcgctt atgggaaata tgtaagtttg ttaaagcagc cagtgtgact 9720 ttgtcatgtg tgttgttgtt actttctgta ttttcgccga acattttatt ggtgttagcg 9780 catgtagtga ggatcgtcct cgattgcctt aacatttgat aggatgcaag ggaca 9835 <210> 48 <211> 12651 <212> DNA <213> Artificial sequence <220> <223> Arabidopsis Luciferase (AP018660.1 Gateway vector R4L1pMpGWB435 DNA, complete sequence) <400> 48 tttcacgccc ttttaaatat ccgattattc taataaacgc tcttttctct taggtttacc 60 cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac gacaatctga 120 tccaagctca agctgctcta gcattcgcca ttcaggctgc gcaactgttg ggaagggcga 180 tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 240 ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgcc 300 aagcttgtgg atcccccatc acaactttgt atagaaaagt tgaacgagaa acgtaaaatg 360 atataaatat caatatatta aattagattt tgcataaaaa acagactaca taatactgta 420 aaacacaaca tatccagtca ctatggcggc cacatttaaa tgtcgagggg ccgcattagg 480 caccccaggc tttacacttt atgcttccgg ctcgtataat gtgtggattt tgagttagga 540 tccgtcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca ctggatatac 600 caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc agtcagttgc 660 tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa agaccgtaaa 720 gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc tgatgaatgc 780 tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg atagtgttca 840 cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct ggagtgaata 900 ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt gttacggtga 960 aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct cagccaatcc 1020 ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact tcttcgcccc 1080 cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc cgctggcgat 1140 tcaggttcat catgccgttt gtgatggctt ccatgtcggc agaatgctta atgaattaca 1200 acagtactgc gatgagtggc agggcggggc gtaaagatct ggatccggct tactaaaagc 1260 cagataacag tatgcgtatt tgcgcgctga tttttgcggt ataagaatat atactgatat 1320 gtatacccga agtatgtcaa aaagaggtgt gctatgaagc agcgtattac agtgacagtt 1380 gacagcgaca gctatcagtt gctcaaggca tatatgatgt caatatctcc ggtctggtaa 1440 gcacaaccat gcagaatgaa gcccgtcgtc tgcgtgccga acgctggaaa gcggaaaatc 1500 aggaagggat ggctgaggtc gcccggttta ttgaaatgaa cggctctttt gctgacgaga 1560 acaggggctg gtgaaatgca gtttaaggtt tacacctata aaagagagag ccgttatcgt 1620 ctgtttgtgg atgtacagag tgatattatt gacacgcccg ggcgacggat ggtgatcccc 1680 ctggccagtg cacgtctgct gtcagataaa gtctcccgtg aactttaccc ggtggtgcat 1740 atcggggatg aaagctggcg catgatgacc accgatatgg ccagtgtgcc ggtctccgtt 1800 atcggggaag aagtggctga tctcagccac cgcgaaaatg acatcaaaaa cgccattaac 1860 ctgatgttct ggggaatata aatgtcaggc tcccttatac acagccagtc tgcaggtcga 1920 ccaacgctag catggatctc gggccccaaa taatgatttt attttgactg atagtgacct 1980 gttcgttgca acaaattgat gagcaatgct tttttataat gccaactttg tacaaaaaag 2040 caggctcaag catggaagac gccaaaaaca taaagaaagg cccggcgcca ttctatccgc 2100 tggaagatgg aaccgctgga gagcaactgc ataaggctat gaagagatac gccctggttc 2160 ctggaacaat tgcttttaca gatgcacata tcgaggtgga catcacttac gctgagtact 2220 tcgaaatgtc cgttcggttg gcagaagcta tgaaacgata tgggctgaat acaaatcaca 2280 gaatcgtcgt atgcagtgaa aactctcttc aattctttat gccggtgttg ggcgcgttat 2340 ttatcggagt tgcagttgcg cccgcgaacg acatttataa tgaacgtgaa ttgctcaaca 2400 gtatgggcat ttcgcagcct accgtggtgt tcgtttccaa aaaggggttg caaaaaattt 2460 tgaacgtgca aaaaaagctc ccaatcatcc aaaaaattat tatcatggat tctaaaacgg 2520 attaccaggg atttcagtcg atgtacacgt tcgtcacatc tcatctacct cccggtttta 2580 atgaatacga ttttgtgcca gagtccttcg atagggacaa gacaattgca ctgatcatga 2640 actcctctgg atctactggt ctgcctaaag gtgtcgctct gcctcataga actgcctgcg 2700 tgagattctc gcatgccaga gatcctattt ttggcaatca aatcattccg gatactgcga 2760 ttttaagtgt tgttccattc catcacggtt ttggaatgtt tactacactc ggatatttga 2820 tatgtggatt tcgagtcgtc ttaatgtata gatttgaaga agagctgttt ctgaggagcc 2880 ttcaggatta caagattcaa agtgcgctgc tggtgccaac cctattctcc ttcttcgcca 2940 aaagcactct gattgacaaa tacgatttat ctaatttaca cgaaattgct tctggtggcg 3000 ctcccctctc taaggaagtc ggggaagcgg ttgccaagag gttccatctg ccaggtatca 3060 ggcaaggata tgggctcact gagactacat cagctattct gattacaccc gagggggatg 3120 ataaaccggg cgcggtcggt aaagttgttc cattttttga agcgaaggtt gtggatctgg 3180 ataccgggaa aacgctgggc gttaatcaaa gaggcgaact gtgtgtgaga ggtcctatga 3240 ttatgtccgg ttatgtaaac aatccggaag cgaccaacgc cttgattgac aaggatggat 3300 ggctacattc tggagacata gcttactggg acgaagacga acacttcttc atcgttgacc 3360 gcctgaagtc tctgattaag tacaaaggct atcaggtggc tcccgctgaa ttggaatcca 3420 tcttgctcca acaccccaac atcttcgacg caggtgtcgc aggtcttccc gacgatgacg 3480 ccggtgaact tcccgccgcc gttgttgttt tggagcacgg aaagacgatg acggaaaaag 3540 agatcgtgga ttacgtcgcc agtcaagtaa caaccgcgaa aaagttgcgc ggaggagttg 3600 tgtttgtgga cgaagtaccg aaaggtctta ccggaaaact cgacgcaaga aaaatcagag 3660 agatcctcat aaaggccaag aagggcggaa agatcgccgt gtaagcttag agctcgaatt 3720 tccccgatcg ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc 3780 ttgcgatgat tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt 3840 aatgcatgac gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt 3900 aatacgcgat agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt 3960 catctatgtt actagatcgg gaattggttc cggaaccaat tcgtaatcat ggtcatagct 4020 gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 4080 aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaggct gaattaggcg 4140 cgcctatttc tgaattcaac acattgcgga cgtttttaat gtactgaatt aacgccgaat 4200 taattcgggg gatctggatt ttagtactgg attttggttt taggaattag aaattttatt 4260 gatagaagta ttttacaaat acaaatacat actaagggtt tcttatatgc tcaacacatg 4320 agcgaaaccc tataggaacc ctaattccct tatctgggaa ctactcacac attattatgg 4380 agaaactcga gcttgtcgat cgactctagc tagaggatcg atccgaaccc cagagtcccg 4440 ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 4500 taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 4560 gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 4620 atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgtgtca 4680 cgacgagatc ctcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 4740 cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 4800 tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 4860 gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 4920 gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 4980 cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 5040 gcgctgcctc gtcctggagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 5100 ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 5160 gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 5220 catcttgttc aatccccatg gtcgatcgac agatctgcga aagctcgaga gagatagatt 5280 tgtagagaga gactggtgat ttcagcgtgt cctctccaaa tgaaatgaac ttccttatat 5340 agaggaaggg tcttgcgaag gatagtggga ttgtgcgtca tcccttacgt cagtggagat 5400 atcacatcaa tccacttgct ttgaagacgt ggttggaacg tcttcttttt ccacgatgct 5460 cctcgtgggt gggggtccat ctttgggacc actgtcggca gaggcatctt gaacgatagc 5520 ctttccttta tcgcaatgat ggcatttgta ggtgccacct tccttttcta ctgtcctttt 5580 gatgaagtga cagatagctg ggcaatggaa tccgaggagg tttcccgata ttaccctttg 5640 ttgaaaagtc tcaatagccc tttggtcttc tgagactgta tctttgatat tcttggagta 5700 gacgagagtg tcgtgctcca ccatgttcac atcaatccac ttgctttgaa gacgtggttg 5760 gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg ggaccactgt 5820 cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat ttgtaggtgc 5880 caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa tggaatccga 5940 ggaggtttcc cgatattacc ctttgttgaa aagtctcaat agccctttgg tcttctgaga 6000 ctgtatcttt gatattcttg gagtagacga gagtgtcgtg ctccaccatg ttggcaagct 6060 gctctagcca atacgcaaac cgaattcaga aataaattca gcctaattcg gcgttaattc 6120 agtacattaa aaacgtccgc aatgtgttat taagttgtct aagcgtcaat ttgtttacac 6180 cacaatatat cctgccacca gccagccaac agctccccga ccggcagctc ggcacaaaat 6240 caccactcga tacaggcagc ccatcagtcc gggacggcgt cagcgggaga gccgttgtaa 6300 ggcggcagac tttgctcatg ttaccgatgc tattcggaag aacggcaact aagctgccgg 6360 gtttgaaaca cggatgatct cgcggagggt agcatgttga ttgtaacgat gacagagcgt 6420 tgctgcctgt gatcaattcg ggcacgaacc cagtggacat aagcctgttc ggttcgtaag 6480 ctgtaatgca agtagcgtat gcgctcacgc aactggtcca gaaccttgac cgaacgcagc 6540 ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg actgtttttt tggggtacag 6600 tctatgcctc gggcatccaa gcagcaagcg cgttacgccg tgggtcgatg tttgatgtta 6660 tggagcagca acgatgttac gcagcagggc agtcgcccta aaacaaagtt aaacatcatg 6720 ggggaagcgg tgatcgccga agtatcgact caactatcag aggtagttgg cgtcatcgag 6780 cgccatctcg aaccgacgtt gctggccgta catttgtacg gctccgcagt ggatggcggc 6840 ctgaagccac acagtgatat tgatttgctg gttacggtga ccgtaaggct tgatgaaaca 6900 acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg cttcccctgg agagagcgag 6960 attctccgcg ctgtagaagt caccattgtt gtgcacgacg acatcattcc gtggcgttat 7020 ccagctaagc gcgaactgca atttggagaa tggcagcgca atgacattct tgcaggtatc 7080 ttcgagccag ccacgatcga cattgatctg gctatcttgc tgacaaaagc aagagaacat 7140 agcgttgcct tggtaggtcc agcggcggag gaactctttg atccggttcc tgaacaggat 7200 ctatttgagg cgctaaatga aaccttaacg ctatggaact cgccgcccga ctgggctggc 7260 gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt acagcgcagt aaccggcaaa 7320 atcgcgccga aggatgtcgc tgccgactgg gcaatggagc gcctgccggc ccagtatcag 7380 cccgtcatac ttgaagctag acaggcttat cttggacaag aagaagatcg cttggcctcg 7440 cgcgcagatc agttggaaga atttgtccac tacgtgaaag gcgagatcac caaggtagtc 7500 ggcaaataat gtctagctag aaattcgttc aagccgacgc cgcttcgcgg cgcggcttaa 7560 ctcaagcgtt agatgcacta agcacataat tgctcacagc caaactatca ggtcaagtct 7620 gcttttatta tttttaagcg tgcataataa gccctacaca aattgggaga tatatcatgc 7680 atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 7740 atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 7800 aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 7860 aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 7920 ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 7980 ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 8040 tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 8100 ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 8160 acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 8220 gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 8280 cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 8340 aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 8400 atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 8460 gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 8520 gaagagcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata 8580 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 8640 tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 8700 cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 8760 gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag ggtgccttga 8820 tgtgggcgcc ggcggtcgag tggcgacggc gcggcttgtc cgcgccctgg tagattgcct 8880 ggccgtaggc cagccatttt tgagcggcca gcggccgcga taggccgacg cgaagcggcg 8940 gggcgtaggg agcgcagcga ccgaagggta ggcgcttttt gcagctcttc ggctgtgcgc 9000 tggccagaca gttatgcaca ggccaggcgg gttttaagag ttttaataag ttttaaagag 9060 ttttaggcgg aaaaatcgcc ttttttctct tttatatcag tcacttacat gtgtgaccgg 9120 ttcccaatgt acggctttgg gttcccaatg tacgggttcc ggttcccaat gtacggcttt 9180 gggttcccaa tgtacgtgct atccacagga aagagacctt ttcgaccttt ttcccctgct 9240 agggcaattt gccctagcat ctgctccgta cattaggaac cggcggatgc ttcgccctcg 9300 atcaggttgc ggtagcgcat gactaggatc gggccagcct gccccgcctc ctccttcaaa 9360 tcgtactccg gcaggtcatt tgacccgatc agcttgcgca cggtgaaaca gaacttcttg 9420 aactctccgg cgctgccact gcgttcgtag atcgtcttga acaaccatct ggcttctgcc 9480 ttgcctgcgg cgcggcgtgc caggcggtag agaaaacggc cgatgccggg atcgatcaaa 9540 aagtaatcgg ggtgaaccgt cagcacgtcc gggttcttgc cttctgtgat ctcgcggtac 9600 atccaatcag ctagctcgat ctcgatgtac tccggccgcc cggtttcgct ctttacgatc 9660 ttgtagcggc taatcaaggc ttcaccctcg gataccgtca ccaggcggcc gttcttggcc 9720 ttcttcgtac gctgcatggc aacgtgcgtg gtgtttaacc gaatgcaggt ttctaccagg 9780 tcgtctttct gctttccgcc atcggctcgc cggcagaact tgagtacgtc cgcaacgtgt 9840 ggacggaaca cgcggccggg cttgtctccc ttcccttccc ggtatcggtt catggattcg 9900 gttagatggg aaaccgccat cagtaccagg tcgtaatccc acacactggc catgccggcc 9960 ggccctgcgg aaacctctac gtgcccgtct ggaagctcgt agcggatcac ctcgccagct 10020 cgtcggtcac gcttcgacag acggaaaacg gccacgtcca tgatgctgcg actatcgcgg 10080 gtgcccacgt catagagcat cggaacgaaa aaatctggtt gctcgtcgcc cttgggcggc 10140 ttcctaatcg acggcgcacc ggctgccggc ggttgccggg attctttgcg gattcgatca 10200 gcggccgctt gccacgattc accggggcgt gcttctgcct cgatgcgttg ccgctgggcg 10260 gcctgcgcgg ccttcaactt ctccaccagg tcatcaccca gcgccgcgcc gatttgtacc 10320 gggccggatg gtttgcgacc gctcacgccg attcctcggg cttgggggtt ccagtgccat 10380 tgcagggccg gcagacaacc cagccgctta cgcctggcca accgcccgtt cctccacaca 10440 tggggcattc cacggcgtcg gtgcctggtt gttcttgatt ttccatgccg cctcctttag 10500 ccgctaaaat tcatctactc atttattcat ttgctcattt actctggtag ctgcgcgatg 10560 tattcagata gcagctcggt aatggtcttg ccttggcgta ccgcgtacat cttcagcttg 10620 gtgtgatcct ccgccggcaa ctgaaagttg acccgcttca tggctggcgt gtctgccagg 10680 ctggccaacg ttgcagcctt gctgctgcgt gcgctcggac ggccggcact tagcgtgttt 10740 gtgcttttgc tcattttctc tttacctcat taactcaaat gagttttgat ttaatttcag 10800 cggccagcgc ctggacctcg cgggcagcgt cgccctcggg ttctgattca agaacggttg 10860 tgccggcggc ggcagtgcct gggtagctca cgcgctgcgt gatacgggac tcaagaatgg 10920 gcagctcgta cccggccagc gcctcggcaa cctcaccgcc gatgcgcgtg cctttgatcg 10980 cccgcgacac gacaaaggcc gcttgtagcc ttccatccgt gacctcaatg cgctgcttaa 11040 ccagctccac caggtcggcg gtggcccata tgtcgtaagg gcttggctgc accggaatca 11100 gcacgaagtc ggctgccttg atcgcggaca cagccaagtc cgccgcctgg ggcgctccgt 11160 cgatcactac gaagtcgcgc cggccgatgg ccttcacgtc gcggtcaatc gtcgggcggt 11220 cgatgccgac aacggttagc ggttgatctt cccgcacggc cgcccaatcg cgggcactgc 11280 cctggggatc ggaatcgact aacagaacat cggccccggc gagttgcagg gcgcgggcta 11340 gatgggttgc gatggtcgtc ttgcctgacc cgcctttctg gttaagtaca gcgataacct 11400 tcatgcgttc cccttgcgta tttgtttatt tactcatcgc atcatatacg cagcgaccgc 11460 atgacgcaag ctgttttact caaatacaca tcaccttttt agacggcggc gctcggtttc 11520 ttcagcggcc aagctggccg gccaggccgc cagcttggca tcagacaaac cggccaggat 11580 ttcatgcagc cgcacggttg agacgtgcgc gggcggctcg aacacgtacc cggccgcgat 11640 catctccgcc tcgatctctt cggtaatgaa aaacggttcg tcctggccgt cctggtgcgg 11700 tttcatgctt gttcctcttg gcgttcattc tcggcggccg ccagggcgtc ggcctcggtc 11760 aatgcgtcct cacggaaggc accgcgccgc ctggcctcgg tgggcgtcac ttcctcgctg 11820 cgctcaagtg cgcggtacag ggtcgagcga tgcacgccaa gcagtgcagc cgcctctttc 11880 acggtgcggc cttcctggtc gatcagctcg cgggcgtgcg cgatctgtgc cggggtgagg 11940 gtagggcggg ggccaaactt cacgcctcgg gccttggcgg cctcgcgccc gctccgggtg 12000 cggtcgatga ttagggaacg ctcgaactcg gcaatgccgg cgaacacggt caacaccatg 12060 cggccggccg gcgtggtggt gtcggcccac ggctctgcca ggctacgcag gcccgcgccg 12120 gcctcctgga tgcgctcggc aatgtccagt aggtcgcggg tgctgcgggc caggcggtct 12180 agcctggtca ctgtcacaac gtcgccaggg cgtaggtggt caagcatcct ggccagctcc 12240 gggcggtcgc gcctggtgcc ggtgatcttc tcggaaaaca gcttggtgca gccggccgcg 12300 tgcagttcgg cccgttggtt ggtcaagtcc tggtcgtcgg tgctgacgcg ggcatagccc 12360 agcaggccag cggcggcgct cttgttcatg gcgtaatgtc tccggttcta gtcgcaagta 12420 ttctacttta tgcgactaaa acacgcgaca agaaaacgcc aggaaaaggg cagggcggca 12480 gcctgtcgcg taacttagga cttgtgcgac atgtcgtttt cagaagacgg ctgcactgaa 12540 cgtcagaagc cgactgcact atagcagcgg aggggttgga tcaaagtact ttgatcccga 12600 ggggaaccct gtggttggca tgcacataca aatggacgaa cggataaacc t 12651 <210> 49 <211> 9181 <212> DNA <213> Artificial Sequence <220> <223> AF033819.3 HIV-1, complete genome <400> 49 ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60 tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120 gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180 gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 240 gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 300 aaaaattttg actagcggag gctagaagga gagagatggg tgcgagagcg tcagtattaa 360 gcgggggaga attagatcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 420 ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 480 gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 540 agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 600 atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 660 acaaaagtaa gaaaaaagca cagcaagcag cagctgacac aggacacagc aatcaggtca 720 gccaaaatta ccctatagtg cagaacatcc aggggcaaat ggtacatcag gccatatcac 780 ctagaacttt aaatgcatgg gtaaaagtag tagaagagaa ggctttcagc ccagaagtga 840 tacccatgtt ttcagcatta tcagaaggag ccaccccaca agatttaaac accatgctaa 900 acacagtggg gggacatcaa gcagccatgc aaatgttaaa agagaccatc aatgaggaag 960 ctgcagaatg ggatagagtg catccagtgc atgcagggcc tattgcacca ggccagatga 1020 gagaaccaag gggaagtgac atagcaggaa ctactagtac ccttcaggaa caaataggat 1080 ggatgacaaa taatccacct atcccagtag gagaaattta taaaagatgg ataatcctgg 1140 gattaaataa aatagtaaga atgtatagcc ctaccagcat tctggacata agacaaggac 1200 caaaggaacc ctttagagac tatgtagacc ggttctataa aactctaaga gccgagcaag 1260 cttcacagga ggtaaaaaat tggatgacag aaaccttgtt ggtccaaaat gcgaacccag 1320 attgtaagac tattttaaaa gcattgggac cagcggctac actagaagaa atgatgacag 1380 catgtcaggg agtaggagga cccggccata aggcaagagt tttggctgaa gcaatgagcc 1440 aagtaacaaa ttcagctacc ataatgatgc agagaggcaa ttttaggaac caaagaaaga 1500 ttgttaagtg tttcaattgt ggcaaagaag ggcacacagc cagaaattgc agggccccta 1560 ggaaaaaggg ctgttggaaa tgtggaaagg aaggacacca aatgaaagat tgtactgaga 1620 gacaggctaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc 1680 ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga 1740 caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc 1800 tcaggtcact ctttggcaac gacccctcgt cacaataaag ataggggggc aactaaagga 1860 agctctatta gatacaggag cagatgatac agtattagaa gaaatgagtt tgccaggaag 1920 atggaaacca aaaatgatag ggggaattgg aggttttatc aaagtaagac agtatgatca 1980 gatactcata gaaatctgtg gacataaagc tataggtaca gtattagtag gacctacacc 2040 tgtcaacata attggaagaa atctgttgac tcagattggt tgcactttaa attttcccat 2100 tagccctatt gagactgtac cagtaaaatt aaagccagga atggatggcc caaaagttaa 2160 acaatggcca ttgacagaag aaaaaataaa agcattagta gaaatttgta cagagatgga 2220 aaaggaaggg aaaatttcaa aaattgggcc tgaaaatcca tacaatactc cagtatttgc 2280 cataaagaaa aaagacagta ctaaatggag aaaattagta gatttcagag aacttaataa 2340 gagaactcaa gacttctggg aagttcaatt aggaatacca catcccgcag ggttaaaaaa 2400 gaaaaaatca gtaacagtac tggatgtggg tgatgcatat ttttcagttc ccttagatga 2460 agacttcagg aagtatactg catttaccat acctagtata aacaatgaga caccagggat 2520 tagatatcag tacaatgtgc ttccacaggg atggaaagga tcaccagcaa tattccaaag 2580 tagcatgaca aaaatcttag agccttttag aaaacaaaat ccagacatag ttatctatca 2640 atacatggat gatttgtatg taggatctga cttagaaata gggcagcata gaacaaaaat 2700 agaggagctg agacaacatc tgttgaggtg gggacttacc acaccagaca aaaaacatca 2760 gaaagaacct ccattccttt ggatgggtta tgaactccat cctgataaat ggacagtaca 2820 gcctatagtg ctgccagaaa aagacagctg gactgtcaat gacatacaga agttagtggg 2880 gaaattgaat tgggcaagtc agatttaccc agggattaaa gtaaggcaat tatgtaaact 2940 ccttagagga accaaagcac taacagaagt aataccacta acagaagaag cagagctaga 3000 actggcagaa aacagagaga ttctaaaaga accagtacat ggagtgtatt atgacccatc 3060 aaaagactta atagcagaaa tacagaagca ggggcaaggc caatggacat atcaaattta 3120 tcaagagcca tttaaaaatc tgaaaacagg aaaatatgca agaatgaggg gtgcccacac 3180 taatgatgta aaacaattaa cagaggcagt gcaaaaaata accacagaaa gcatagtaat 3240 atggggaaag actcctaaat ttaaactgcc catacaaaag gaaacatggg aaacatggtg 3300 gacagagtat tggcaagcca cctggattcc tgagtgggag tttgttaata cccctccctt 3360 agtgaaatta tggtaccagt tagagaaaga acccatagta ggagcagaaa ccttctatgt 3420 agatggggca gctaacaggg agactaaatt aggaaaagca ggatatgtta ctaatagagg 3480 aagacaaaaa gttgtcaccc taactgacac aacaaatcag aagactgagt tacaagcaat 3540 ttatctagct ttgcaggatt cgggattaga agtaaacata gtaacagact cacaatatgc 3600 attaggaatc attcaagcac aaccagatca aagtgaatca gagttagtca atcaaataat 3660 agagcagtta ataaaaaagg aaaaggtcta tctggcatgg gtaccagcac acaaaggaat 3720 tggaggaaat gaacaagtag ataaattagt cagtgctgga atcaggaaag tactattttt 3780 agatggaata gataaggccc aagatgaaca tgagaaatat cacagtaatt ggagagcaat 3840 ggctagtgat tttaacctgc cacctgtagt agcaaaagaa atagtagcca gctgtgataa 3900 atgtcagcta aaaggagaag ccatgcatgg acaagtagac tgtagtccag gaatatggca 3960 actagattgt acacatttag aaggaaaagt tatcctggta gcagttcatg tagccagtgg 4020 atatatagaa gcagaagtta ttccagcaga aacagggcag gaaacagcat attttctttt 4080 aaaattagca ggaagatggc cagtaaaaac aatacatact gacaatggca gcaatttcac 4140 cggtgctacg gttagggccg cctgttggtg ggcgggaatc aagcaggaat ttggaattcc 4200 ctacaatccc caaagtcaag gagtagtaga atctatgaat aaagaattaa agaaaattat 4260 aggacaggta agagatcagg ctgaacatct taagacagca gtacaaatgg cagtattcat 4320 ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga 4380 cataatagca acagacatac aaactaaaga attacaaaaa caaattacaa aaattcaaaa 4440 ttttcgggtt tattacaggg acagcagaaa tccactttgg aaaggaccag caaagctcct 4500 ctggaaaggt gaaggggcag tagtaataca agataatagt gacataaaag tagtgccaag 4560 aagaaaagca aagatcatta gggattatgg aaaacagatg gcaggtgatg attgtgtggc 4620 aagtagacag gatgaggatt agaacatgga aaagtttagt aaaacaccat atgtatgttt 4680 cagggaaagc taggggatgg ttttatagac atcactatga aagccctcat ccaagaataa 4740 gttcagaagt acacatccca ctaggggatg ctagattggt aataacaaca tattggggtc 4800 tgcatacagg agaaagagac tggcatttgg gtcagggagt ctccatagaa tggaggaaaa 4860 agagatatag cacacaagta gaccctgaac tagcagacca actaattcat ctgtattact 4920 ttgactgttt ttcagactct gctataagaa aggccttatt aggacacata gttagcccta 4980 ggtgtgaata tcaagcagga cataacaagg taggatctct acaatacttg gcactagcag 5040 cattaataac accaaaaaag ataaagccac ctttgcctag tgttacgaaa ctgacagagg 5100 atagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac 5160 actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct 5220 ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc 5280 cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata 5340 gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta 5400 gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa 5460 aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc 5520 aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct 5580 ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca 5640 ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg 5700 aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa 5760 gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg 5820 gggcaccatg ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac 5880 agtctattat ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga 5940 tgctaaagca tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac 6000 agaccccaac ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa 6060 aaatgacatg gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa 6120 gccatgtgta aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga 6180 tactaatacc aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg 6240 ctctttcaat atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta 6300 taaacttgat ataataccaa tagataatga tactaccagc tataagttga caagttgtaa 6360 cacctcagtc attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta 6420 ttgtgccccg gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg 6480 accatgtaca aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac 6540 tcaactgctg ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt 6600 cacggacaat gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac 6660 aagacccaac aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt 6720 tgttacaata ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa 6780 atggaataac actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa 6840 aacaataatc tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa 6900 ttgtggaggg gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa 6960 tagtacttgg agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc 7020 atgcagaata aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc 7080 tcccatcagt ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga 7140 tggtggtaat agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga 7200 caattggaga agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc 7260 acccaccaag gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc 7320 tttgttcctt gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct 7380 gacggtacag gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag 7440 ggctattgag gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca 7500 ggcaagaatc ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg 7560 ttgctctgga aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa 7620 atctctggaa cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa 7680 ttacacaagc ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga 7740 acaagaatta ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa 7800 ttggctgtgg tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat 7860 agtttttgct gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt 7920 tcagacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg 7980 tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg 8040 ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat 8100 tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg 8160 gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc 8220 cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg 8280 tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata 8340 agatgggtgg caagtggtca aaaagtagtg tgattggatg gcctactgta agggaaagaa 8400 tgagacgagc tgagccagca gcagataggg tgggagcagc atctcgagac ctggaaaaac 8460 atggagcaat cacaagtagc aatacagcag ctaccaatgc tgcttgtgcc tggctagaag 8520 cacaagagga ggaggaggtg ggttttccag tcacacctca ggtaccttta agaccaatga 8580 cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 8640 taattcactc ccaaagaaga caagatatcc ttgatctgtg gatctaccac acacaaggct 8700 acttccctga ttagcagaac tacacaccag ggccaggggt cagatatcca ctgacctttg 8760 gatggtgcta caagctagta ccagttgagc cagataagat agaagaggcc aataaaggag 8820 agaacaccag cttgttacac cctgtgagcc tgcatgggat ggatgacccg gagagagaag 8880 tgttagagtg gaggtttgac agccgcctag catttcatca cgtggcccga gagctgcatc 8940 cggagtactt caagaactgc tgacatcgag cttgctacaa gggactttcc gctggggact 9000 ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat 9060 aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120 ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180 c 9181 <210> 50 <211> 7350 <212> DNA <213> Artificial sequence <220> <223> Human Luciferase (FJ376737.1 Cloning vector pmirGLO, complete sequence) <400> 50 catgcaagct gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac 60 cgctgagcaa taactagcat aaccccttgg ggcggccgct tcgagcagac atgataagat 120 acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg 180 aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca 240 acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag gtttttttaa 300 gcaagtaaaa cctctacaaa tgtggtaaaa tcgaatttta acaaaatatt aacgcttaca 360 atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgcg 420 gatctgcgca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt taggtacctt 480 ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg 540 ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg 600 aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 660 aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca 720 ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc 780 ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa 840 gcttgattct tctgacacaa cagtctcgaa ccaaaggctg gagccaccat ggcttccaag 900 gtgtacgacc ccgagcaacg caaacgcatg atcactgggc ctcagtggtg ggctcgctgc 960 aagcaaatga acgtgctgga ctccttcatc aactactatg attccgagaa gcacgccgag 1020 aacgccgtga tttttctgca tggtaacgct gcctccagct acctgtggag gcacgtcgtg 1080 cctcacatcg agcccgtggc tagatgcatc atccctgatc tgatcggaat gggtaagtcc 1140 ggcaagagcg ggaatggctc atatcgcctc ctggatcact acaagtacct caccgcttgg 1200 ttcgagctgc tgaaccttcc aaagaaaatc atctttgtgg gccacgactg gggggcttgt 1260 ctggcctttc actactccta cgagcaccaa gacaagatca aggccatcgt ccatgctgag 1320 agtgtcgtgg acgtgatcga gtcctgggac gagtggcctg acatcgagga ggatatcgcc 1380 ctgatcaaga gcgaagaggg cgagaaaatg gtgcttgaga ataacttctt cgtcgagacc 1440 atgctcccaa gcaagatcat gcggaaactg gagcctgagg agttcgctgc ctacctggag 1500 ccattcaagg agaagggcga ggttagacgg cctaccctct cctggcctcg cgagatccct 1560 ctcgttaagg gaggcaagcc cgacgtcgtc cagattgtcc gcaactacaa cgcctacctt 1620 cgggccagcg acgatctgcc taagatgttc atcgagtccg accctgggtt cttttccaac 1680 gctattgtcg agggagctaa gaagttccct aacaccgagt tcgtgaaggt gaagggcctc 1740 cacttcagcc aggaggacgc tccagatgaa atgggtaagt acatcaagag cttcgtggag 1800 cgcgtgctga agaacgagca gaccggtggt gggagcggag gtggcggatc aggtggcgga 1860 ggctccggag ggattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1920 aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1980 cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 2040 aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 2100 gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 2160 ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 2220 gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 2280 aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 2340 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 2400 atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 2460 gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 2520 tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2580 gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2640 cgccttcttg acgagttctt ctgagcggga ctctggggtt cgaaatgacc gaccaagcga 2700 cgcccaacct gccatcacga tggccgcaat aaaatatctt tattttcatt acatctgtgt 2760 gttggttttt tgtgtgaatc gatagcgata aggatcctct ttgcgcttgc gttttccctt 2820 gtccagatag cccagtagct gacattcatc cggggtcagc accgtttctg cggactggct 2880 ttctacgtaa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc 2940 cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 3000 tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 3060 gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 3120 gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 3180 ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 3240 actttcaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 3300 ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 3360 aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 3420 gataacactg cggccaactt acttctgaca actatcggag gaccgaagga gctaaccgct 3480 tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 3540 gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 3600 cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 3660 atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 3720 attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg 3780 ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 3840 gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaattc 3900 gaaatgaccg accaagcgac gcccaaccgg tatcagctca ctcaaaggcg gtaatacggt 3960 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 4020 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 4080 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 4140 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 4200 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 4260 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 4320 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 4380 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 4440 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 4500 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 4560 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 4620 cgcgcagaaa aaaaggattt caagaagatc ctttgatctt ttctacgggg tctgacgctc 4680 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 4740 cctagatcct tttatagtcc ggaaatacag gaacgcacgc tggatggccc ttcgctggga 4800 tggtgaaacc atgaaaaatg gcagcttcag tggattaagt gggggtaatg tggcctgtac 4860 cctctggttg cataggtatt catacggtta aaatttatca ggcgcgattg cggcagtttt 4920 tcgggtggtt tgttgccatt tttacctgtc tgctgccgtg atcgcgctga acgcgtttta 4980 gcggtgcgta caattaaggg attatggtaa atccacttac tgtctgccct cgtagccatc 5040 gagataaacc gcagtactcc ggccacgatg cgtccggcgt agaggatcga gatctaccgg 5100 gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc cccgctgggc 5160 acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac cggtaggcgc 5220 caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc cctagtcagg 5280 aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt 5340 ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt aggcctttgg 5400 ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct gggaaggggt 5460 gggtccgggg gcgggctcag gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc 5520 ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc 5580 tcatctccgg gcctttcgac ctgcagccca agcttggcaa tccggtactg ttggtaaagc 5640 caccatggaa gatgccaaaa acattaagaa gggcccagcg ccattctacc cactcgaaga 5700 cgggaccgcc ggcgagcagc tgcacaaagc catgaagcgc tacgccctgg tgcccggcac 5760 catcgccttt accgacgcac atatcgaggt ggacattacc tacgccgagt acttcgagat 5820 gagcgttcgg ctggcagaag ctatgaagcg ctatgggctg aatacaaacc atcggatcgt 5880 ggtgtgcagc gagaatagct tgcagttctt catgcccgtg ttgggtgccc tgttcatcgg 5940 tgtggctgtg gccccagcta acgacatcta caacgagcgc gagctgctga acagcatggg 6000 catcagccag cccaccgtcg tattcgtgag caagaaaggg ctgcaaaaga tcctcaacgt 6060 gcaaaagaag ctaccgatca tacaaaagat catcatcatg gatagcaaga ccgactacca 6120 gggcttccaa agcatgtaca ccttcgtgac ttcccatttg ccacccggct tcaacgagta 6180 cgacttcgtg cccgagagct tcgaccggga caaaaccatc gccctgatca tgaacagtag 6240 tggcagtacc ggattgccca agggcgtagc cctaccgcac cgcaccgctt gtgtccgatt 6300 cagtcatgcc cgcgacccca tcttcggcaa ccagatcatc cccgacaccg ctatcctcag 6360 cgtggtgcca tttcaccacg gcttcggcat gttcaccacg ctgggctact tgatctgcgg 6420 ctttcgggtc gtgctcatgt accgcttcga ggaggagcta ttcttgcgca gcttgcaaga 6480 ctataagatt caatctgccc tgctggtgcc cacactattt agcttcttcg ctaagagcac 6540 tctcatcgac aagtacgacc taagcaactt gcacgagatc gccagcggcg gggcgccgct 6600 cagcaaggag gtaggtgagg ccgtggccaa acgcttccac ctaccaggca tccgccaggg 6660 ctacggcctg acagaaacaa ccagcgccat tctgatcacc cccgaagggg acgacaagcc 6720 tggcgcagta ggcaaggtgg tgcccttctt cgaggctaag gtggtggact tggacaccgg 6780 taagacactg ggtgtgaacc agcgcggcga gctgtgcgtc cgtggcccca tgatcatgag 6840 cggctacgtt aacaaccccg aggctacaaa cgctctcatc gacaaggacg gctggctgca 6900 cagcggcgac atcgcctact gggacgagga cgagcacttc ttcatcgtgg accggctgaa 6960 gagcctgatc aaatacaagg gctaccaggt agccccagcc gaactggaga gcatcctgct 7020 gcaacacccc aacatcttcg acgccggggt cgccggcctg cccgacgacg atgccggcga 7080 gctgcccgcc gcagtcgtcg tgctggaaca cggtaaaacc atgaccgaga aggagatcgt 7140 ggactatgtg gccagccagg ttacaaccgc caagaagctg cgcggtggtg ttgtgttcgt 7200 ggacgaggtg cctaaaggac tgaccggcaa gttggacgcc cgcaagatcc gcgagattct 7260 cattaaggcc aagaagggcg gcaagatcgc cgtgtaattc tagttgttta aacgagctcg 7320 ctagcctcga gtctagagtc gacctgcagg 7350 <210> 51 <211> 22558 <212> DNA <213> Caenorhabditis elegans <400> 51 aaaacgatct agataatcgc ccgcagagtt gctcgatctg cggagtgaat gtgccgtgcg 60 aacatcgtca tagaagagac agtttgatcg aattaaaagt cgtgcgccgg cccctccaac 120 ttcgaccatg gttggcgcac cgcgcttcac ccagaaaccg tccattcagc agacacctac 180 tggtgatctg ctgatggaat gtcatcttga ggcggatcca caaccaacga tcgcctggca 240 acattctgga aatcttctgg aaccatctgg aagagttgtg cagacactta ccccgttagg 300 aggaagtctg tacaaggcaa cattagtgat caaggaacca aatgccggcg acggtggtgc 360 ctacaaatgc acagcaagaa atcaattggg tgaatcgaac gccaatatca atttgaactt 420 cgctggtgcc ggaggagatg aagccaagtc ccgtggccca tcttttgtcg gaaaaccacg 480 aattattcca aaagatggtg gagctctgat tgtgatggaa tgcaaagtta aaagtgcatc 540 cacaccagtc gcaaaatgga tgaaagatgg agtcccattg agtatgggcg gtctctatca 600 cgccattttc agtgatctcg gagatcaaac ctacttgtgt caactggaaa ttagaggtcc 660 gtcatcatct gacgcaggac aatatcgatg taatattaga aacgatcaag gagaaacgaa 720 tgccaatttg gcattgaatt tcgaagaacc cgatccatcc gaacgtcaag agagaaaaag 780 atccacagct tcaccaagac catcgtcccg tggtccaggt agtcgtccgt cttctccgaa 840 aaaatcaatg aaatcgaggg aaggaactcc aaaacgtacc ctgaaaccaa gagagggttc 900 cccatcgaaa aagttgagat cccgaacttc aaccccagtc aacgaagaag tctctcaatc 960 ggagtcccgc cgatcgagta gaactgataa aatggaagtg gatcaagtat caggtgcatc 1020 gaaacgaaag cctgatggac ttccacctcc gggaggtgat gagaagaagc ttcgagcagg 1080 tagtccctct actcgaaagt ctccatcaag aaagagcgca tcaccaacac catctagaaa 1140 aggaagcagt gctggaggag ctgcttccgg tacgacagga gcatctgcat ctgcaacatc 1200 agcaacatct ggtggatctg catcctctga tgcctcgcgt gacaaataca caaggccgcc 1260 aatcgttctc gaagccagta ggtcccagac tggtcgaatc ggtggatctg tcgttttgga 1320 ggtacaatgg cagtgtcatt catcaacaat tattgagtgg tatagagatg gtacattggt 1380 cagaaattct tccgaatatt cacagtcgtt caatggatca atagctaaac tgcaagtgaa 1440 caagctgacc gaagagaaat cgggtctcta taaatgtcat gcaaagtgtg actatggaga 1500 aggtcaaagc agtgcaatgg tcaaaatcga acagtctgat gtggaagaag aactcatgaa 1560 gcatagaaaa gacgcggagg atgaatatca aaaagaagaa cagaaatcgc agacgcttca 1620 agctgaaacc aaaaagcgag tggcgagacg aagcaagtca aagagtaaga gtccggcacc 1680 ccaagccaaa aagagtacaa catctgaaag tggccgtcaa gaagcttcgg aagtcgaaca 1740 caaaagaagc tcaagtgttc ggcctgatcc agatgaggaa tctcagttgg acgagatccc 1800 aagttcgggt ctgacgatcc cagaggagcg ccgtcgagaa ttattgggtc aggtcggaga 1860 aagtgacgac gaggtatccg agtcgatatc cgaactacca tcattcgccg gaggcaagcc 1920 tcgccgcaag actgatagtc ctccaaagca ggacgatatg ttttctcgcg acactcttct 1980 tcgcaaaacc actacatcca cgaaaaatga gtcgagtact gtagaggaaa agacaaaact 2040 tcgcaaaact gtcaaaaaag tcgatggtga actcgatttc aaagccatgg taaaattgaa 2100 aaaagtaaaa aaagaggagg gtggaaccac cgaaaagtcg ggcttcccac tcgatcatgc 2160 cgattccacg tcatctgtat tgtctcaaga atcgaggtcg agacgcggtt caaatgctcc 2220 atttgcaaaa gatggccttc ctgagcaacc ggcaaacccg tttgcacagc tcaaaaaggt 2280 gaaatctggc gctggtggac tggaaaagtc cgattcaatg gccagtctca agaagcttga 2340 tttaaagaaa ggaaagatcg atgataactc ggatggtgca ttcaaagtac aactgaaaaa 2400 ggttgtaaag aaggaagtta aagagtcgac aatcagtgtg aaagagaaga atggcaccga 2460 atcaggcatc aagaccgagt ttaaaatgga gaaacgtgaa cggaccacat tgcaaaaata 2520 tgagaaaacg gatagtgatg ggtccaagaa ggaggataaa ccaaagaaag tcagcattgc 2580 tccggtttca accaacaaat cgtccgacga tgaaccgtct acgccacgtc accacaaaga 2640 agtcgaagag aagtcgacat cagaagaact caaagcaaaa gtcgctggcc gtcaagtcgg 2700 acaaaaacga aatggcgctc agaagcccga agagcccaaa aatcttttgt cacagattca 2760 attgaagaaa gtgacaaaga aggctcacga cgataccaat gagcttgaag gaatcaaatt 2820 gaaaaaagtg acgacagtgc caaaacacgt cgccgatgat gacagtcaat cggaatccga 2880 gtcacggcgt ggatccgtgt tcggagaact ccgacgtgga tcgcgagctc cgagagactc 2940 tgcagacaat tctcgcagag actccattag acgctctagt atcgacatga gacgtgaatc 3000 tgttcaagaa attcttgaaa agacgtcgac accgctcgtc ccaagcggtg cttcaggcag 3060 tgctccaaaa atcgtcgaag tcccagaaaa cgtcacagtc gttgagaacg aaactgcaat 3120 cctaacgtgc aaagtgtcgg gtagtcccgc ccccactttc cgttggttca aaggtagtcg 3180 tgaagttatc agtggaggtc gcttcaagca tattaccgat ggaaaagaac atactgtggc 3240 gttggcatta cttaagtgcc gatcccagga tgaaggtccc tacaccctga caatcgaaaa 3300 cgtgcatgga accgactcgg ctgacgtcaa actgttggtc acttcggata atggtctcga 3360 tttccgagcc atgctaaaac acagagaatc acaagctggc ttccaaaaag acggagaagg 3420 aggcggtgct ggtggtggtg gcggtgagaa gaagccaatg accgaagccg agagaagaca 3480 gtccctcttc cccggaaaga aggttgaaaa atgggatatt ccacttccag agaagaccgt 3540 tcaacaacag gttgacaaaa tctgtgagtg gaagtgtacc tactcacgtc caaatgccaa 3600 aattcgttgg tacaaggaca gaaaagagat cttctccgga ggtctcaaat acaagatcgt 3660 tatcgaaaag aacgtgtgca ctctgattat caacaatcca gaagtcgatg acaccggaaa 3720 gtacacctgt gaggctaacg gagtaccaac tcatgctcag cttactgtac ttgaaccgcc 3780 gatgaagtac agtttcctga acccgttgcc gaatacacag gagatctacc gtactaagca 3840 agcagtgctc acatgtaaag tgaacacacc acgtgctcca ttggtatggt accgtggaag 3900 caaggctatt caagaaggag atccacgatt cattattgaa aaggatgccg tcggtcgttg 3960 tacacttaca atcaaggaag ttgaggaaga cgatcaagct gaatggactg ctagaatcac 4020 acaagacgtg ttctcaaagg ttcaagtgta cgttgaggag ccacggcata cattcgttgt 4080 tccaatgaag tcgcaaaaag tcaacgaaag tgatttggca acattggaga ctgatgttaa 4140 cgacaaggat gctgaagttg tttggtggca tgatggaaag agaatcgata ttgatggagt 4200 gaaattcaag gttgaatctt caaacagaaa gagaagactt attatcaatg gagctagaat 4260 tgaagatcat ggagagtata agtgtacaac taaggatgat agaactatgg ctcagctcat 4320 cgttgatgct aagaataagt tcatcgttgc tctcaaagac actgaagtta ttgagaagga 4380 tgatgttaca ttgatgtgtc agacaaagga cacaaaaact cctggaattt ggttccgtaa 4440 tggaaaacaa atttccagta tgcccggagg aaagttcgaa actcaatcga gaaacggaac 4500 tcatactctt aaaatcggaa agatcgagat gaacgaggct gatgtttatg aaatcgatca 4560 ggcaggacta cgtggatctt gcaatgtgac tgttctcgag gcagaaaagc gtccaattct 4620 caactggaag ccaaagaaaa tcgaagcaaa ggctggagaa ccatgtgttg tgaaggttcc 4680 attccaaatc aagggaacac gacgtggaga tccaaaggct caaattctga agaatggaaa 4740 gccaatcgat gaagaaatga gaaagctagt tgaagttatt atcaaggatg atgtggctga 4800 gattgttttc aaaaatccac aacttgctga tacaggaaag tgggctctcg aactcggaaa 4860 ctcggctgga acagcacttg ctccattcga gttgttcgtt aaggacaagc cgaaaccacc 4920 aaagggtcca cttgaaacca agaatgttac tgctgaaggt cttgatctcg tctggggaac 4980 tccagatcca gatgagggag ctccagttaa agcatacatc attgaaatgc aagagggaag 5040 aagtggaaac tgggctaaag ttggagagac taagggaaca gacttcaagg ttaaggatct 5100 taaagaacat ggagaataca agttcagagt caaggctctt aatgaatgcg gactctctga 5160 tccactcaca ggagaatctg ttcttgccaa aaatccatac ggcgttcctg gaaaaccaaa 5220 gaacatggac gcaattgatg ttgacaagga tcactgtacc cttgcatggg aaccgccaga 5280 ggaggatgga ggtgctccaa tcactggtta catcattgaa agaagagaga agtccgagaa 5340 agattggcat caagttggac agaccaaacc agattgttgt gaactgactg ataagaaggt 5400 tgtcgaagat aaggaatact tgtacagagt aaaagcagtc aacaaggctg gaccaggaga 5460 cccatgtgat catggaaagc caatcaagat gaaagccaag aaagcttctc cagaattcac 5520 tggtggaggc atcaaggatc ttcgtcttaa ggtcggagaa actatcaagt acgacgttcc 5580 aatttctgga gaaccactcc cagaatgtct ttgggtggtt aatggaaaac cactgaaggc 5640 tgttggaaga gtcaagatgt cttctgaaag aggaaagcat atcatgaaga tcgaaaatgc 5700 agttcgtgct gattccggaa agttcactat cactttgaag aactcttctg gctcatgcga 5760 ctcgaccgcc acggtcactg tcgttggaag accaactcca ccaaagggtc cactcgatat 5820 tgctgatgtt tgtgccgatg gtgcaaccct ttcctggaat cctccagatg atgatggagg 5880 tgatccactc acaggataca tcgttgaagc tcaagatatg gacaacaagg gaaaatacat 5940 tgaagttgga aaggttgatc caaacaccac taccctcaaa gttaatggac tccgtaacaa 6000 gggaaattac aagttccgcg tgaaggcagt caacaacgaa ggagaatctg agccactttc 6060 tgctgatcag tacactcaga tcaaggatcc ttgggatgaa ccaggaaagc ctggaagacc 6120 agaaattacc gatttcgatg cggatagaat tgacattgcc tgggagccac cacacaaaga 6180 tggaggagct ccaatcgagg agtatattgt cgaagttcgt gatccagata ccaaagaatg 6240 gaaggaagtc aagagagttc cagacaccaa tgcatcaatt tctggattga aggaaggaaa 6300 ggaatatcag ttcagagttc gggctgttaa caaggctggg cctggacaac cttccgaacc 6360 atcagagaag caattggcta agccaaaatt catcccggca tggttgaaac acgacaattt 6420 gaaatctatc accgtaaagg ctggagccac tgttcgttgg gaagtcaaaa ttggaggaga 6480 accaattcca gaagtcaaat ggtttaaagg caatcaacaa ctcgaaaacg gaattcaact 6540 tacaattgat actcgcaaaa atgagcacac tattctgtgc attccatctg caatgcgatc 6600 tgatgttgga gagtatcgat tgactgtcaa gaactcgcat ggagctgatg aagagaaggc 6660 taaccttacc gttttggaca gaccaagcaa accaaatggg ccacttgaag tttcagatgt 6720 ctttgaagat aatctgaacc tttcttggaa gccaccagat gatgacggag gtgagccaat 6780 cgaatattat gaagtcgaga agcttgatac tgccactgga agatgggttc catgcgccaa 6840 agttaaggat acgaaggctc atattgatgg tctcaagaag ggacaaacat atcagttccg 6900 tgtcaaggct gtcaataagg aaggagcttc tgatgcattg tctactgata aggacaccaa 6960 agccaagaat ccatatgatg agccaggaaa aaccggaact ccggatgttg tcgactggga 7020 tgctgatcgt gtctcacttg aatgggaacc accaaagtct gacggaggag ctccaatcac 7080 tcaatacgtc attgagaaga agggcaaaca tggaagagac tggcaagaat gcggaaaggt 7140 ttctggagat caaaccaatg ctgagattct tggactcaag gagggagaag agtaccagtt 7200 ccgtgtgaag gctgttaaca aggccggacc gggagaggct tcagacccaa gccgaaaggt 7260 tgttgcaaag ccaagaaact tgaagccatg gattgatcgt gaagcaatga agacgatcac 7320 tatcaaggta ggaaacgatg tggaattcga tgttccagta cgcggagaac caccaccgaa 7380 gaaggaatgg atcttcaatg agaaaccagt cgatgatcaa aagatcagga ttgaaagcga 7440 agactacaag acccgatttg tgctccgtgg agcaactcgc aagcatgctg gtttgtacac 7500 tcttactgct accaacgctt ctggaagcga caaacattcc gttgaggtca ttgtgctcgg 7560 aaaaccatct agcccattgg gacctttgga agtgtcgaat gtctacgaag atcgcgcaga 7620 tttggagtgg aaagtaccag aagatgacgg aggtgctcca attgatcatt atgaaatcga 7680 aaagatggat ttggcaactg gaagatgggt cccatgtgga agaagtgaaa caacaaagac 7740 cacagttcca aatcttcaac ccggacacga atacaaattc cgtgtcagag ctgtgaacaa 7800 ggagggagaa tccgatccac tcacaaccaa caccgcaatc ctcgccaaga acccatacga 7860 ggttccagga aaagttgaca agccggaatt ggtggactgg gataaggatc atgttgatct 7920 tgcatggaat gctccagacg atggtggtgc accaattgaa gctttcgtca ttgaaaagaa 7980 ggataagaat ggacgatggg aagaagctct cgttgttcca ggagatcaga aaacagcaac 8040 tgttccaaat cttaaggagg gagaagaata tcaattcaga atttctgctc gtaacaaggc 8100 tggaactgga gatccttctg atccttctga tcgtgttgtt gcgaagccaa gaaaccttgc 8160 tccaagaatt catcgtgaag atctttctga tacaactgtc aaggtcggag ccactctcaa 8220 gttcattgtt catattgatg gtgagccagc accagatgta acatggtcat tcaatggaaa 8280 aggaatcgga gagagcaagg ctcaaattga aaatgagcca tacatctcga gatttgcttt 8340 gccaaaggca cttcgtaagc aaagtggaaa atataccatc actgcaacca acattaatgg 8400 aactgacagt gtcactatca atatcaaggt aaaaagcaag ccaacgaaac caaagggacc 8460 aatcgaggta actgatgtct tcgaagatcg tgcaactctt gactggaaac caccagagga 8520 tgacggagga gagccaattg agttctatga aattgaaaag atgaacacca aggacggaat 8580 ctgggttcca tgtggacgta gtggagatac ccacttcaca gtcgattcac tcaacaaggg 8640 agatcattac aagttccgtg tcaaggctgt caacagcgaa ggaccttctg atccattgga 8700 aactgaaacc gatattttgg ctaaaaatcc atttgatcgt ccagatagac caggtcgtcc 8760 agagccaact gattgggatt ctgatcatgt tgatctcaag tgggatccac cactttctga 8820 tggcggcgct ccaattgagg agtaccaaat tgagaagaga accaaatacg gaagatggga 8880 accagccatc actgttcctg gcggtcagac aactgcaacc gttccagacc tcacaccaaa 8940 tgaggaatac gaattccgtg ttgttgctgt taacaaggga ggcccatctg atccatctga 9000 tgctagcaag gctgttattg ctaaaccaag aaacttgaag ccacacatcg acagagatgc 9060 tctcaagaat ctgactatca aggctggtca atcaatttcc ttcgatgttc cagtatcagg 9120 agaacctgca ccaacagtca catggcattg gccagacaac agggaaatca gaaatggagg 9180 acgcgtcaag cttgataacc cagaatacca atcaaagctg gttgtgaagc aaatggaacg 9240 tggagacagt ggaactttca ctatcaaagc tgtcaatgca aatggagaag atgaagcaac 9300 tgttaagatc aatgttattg acaagccaac ttctccaaat ggtccattag atgtttccga 9360 tgttcatggt gatcatgtca ctttgaattg gcgtgcacca gatgatgatg gaggtattcc 9420 aattgaaaac tatgtgatcg aaaagtacga tactgcaagt ggaagatggg ttccagctgc 9480 aaaggtcgct ggagataaga ctacagctgt tgttgacggt cttattcctg gacatgaata 9540 taaattccgt gtcgctgccg tcaatgctga aggagagtcc gatccattgg agaccttcgg 9600 aaccacactt gccaaagatc catttgacaa gccaggaaag acaaatgctc ctgaaattac 9660 tgattgggat aaggatcatg ttgaccttga atggaagcca ccagcaaacg acggtggtgc 9720 tccaatcgag gaatacgttg ttgagatgaa ggacgagttc tcgccattct ggaatgacgt 9780 tgctcatgtt ccagctggac aaacgaatgc tactgttgga aatctcaagg aaggatcaaa 9840 gtacgaattc agaatccgtg ccaagaacaa ggcaggattg ggagatccat ctgattcagc 9900 atcagctgtt gcaaaggcta gaaatgttcc accagtcatc gatcgtaact cgattcaaga 9960 aatcaaggtc aaggctggac aagacttctc attgaacatt ccagtcagtg gtgaaccaac 10020 tccaacaatt acttggactt tcgaaggaac accagtcgaa tctgatgatc gtatgaagtt 10080 gaacaatgaa gacggcaaga ctaaattcca tgtgaagaga gctttgcgtt cggatacagg 10140 aacctatatc atcaaggcag agaacgagaa tggaactgac actgctgaag tgaaggttac 10200 tgttcttgat catccatcaa gcccacgtgg acctctcgat gtcactaata ttgtcaagga 10260 tggatgtgat cttgcatgga aggaaccaga agatgatgga ggagctgaaa tcagtcacta 10320 tgtcattgaa aagcaagatg ctgccactgg cagatggact gcttgcggag agagcaagga 10380 taccaacttc cacgttgacg atttgactca agggcatgaa tataaattcc gtgtcaaggc 10440 tgttaacaga catggagatt cggatccatt ggaggctcgt gaagctatta tcgccaagga 10500 tccattcgat cgtgctgata agccaggaac tccagaaatt gtggactggg acaaggatca 10560 tgcagatctc aagtggactc caccagctga tgatggaggt gctccaatcg aaggatatct 10620 cgttgaaatg agaactccat caggagactg ggtaccagct gtcacggttg gagccggtga 10680 gctcactgct acagttgatg gcttgaaacc aggtcagact taccaattcc gtgtcaaggc 10740 tttgaacaag gctggagaat cgactccatc tgatcctagc agaaccatgg ttgctaagcc 10800 acgtcatctt gctccaaaga tcaacagaga tatgtttgtt gctcaaagag ttaaggctgg 10860 tcaaactctt aactttgatg taaatgttga aggagagcca gctccaaaga tcgaatggtt 10920 cttgaacgga tctccattgt catctggtgg aaatacccat atcgacaata acactgacaa 10980 caacaccaag ttgacaacaa agagcactgc tcgtgccgat agtggaaaat acaaaattgt 11040 ggctaccaat gaaagtggaa aagatgaaca tgaggttgat gtcaacattc ttgacatccc 11100 tggtgcacca gaagggccac ttcgtcacaa ggatattacc aaggagagtg ttgtgctgaa 11160 atgggatgaa ccattggatg atggaggttc tccaattacc aactacgtag ttgagaaaca 11220 agaagacgga ggtcgatggg taccatgtgg agaaacatct gatacttctc tgaaggttaa 11280 caaactatcc gaaggacatg aatacaagtt ccgtgtgaaa gcagtaaacc gtcaaggaac 11340 atctgctcca ttgacttctg atcatgcaat tgttgctaag aatccattcg atgaaccaga 11400 tgcaccaact gatgttaccc cagttgattg ggataaggat catgttgatc ttgaatggaa 11460 gccaccagca aacgacggtg gtgcaccaat tgatgcttac atcgttgaga agaaggacaa 11520 gtttggagac tgggttgagt gtgcacgtgt tgatggaaag acaacaaagg caactgctga 11580 taatttgact ccaggagaga cttatcagtt ccgtgtgaag gctgtcaata aggctgggcc 11640 aggaaaacca tctgatccaa caggaaatgt tgttgccaaa ccaagaagaa tggctccaaa 11700 acttaacctc gccggacttt tggatctccg tatcaaggct ggaacaccca tcaagctcga 11760 tatcgcattc gaaggagagc cagccccagt tgctaaatgg aaggccaacg atgcaacaat 11820 cgatacagga gcaagagctg atgttacgaa cacaccaaca tcctcagcaa ttcacatctt 11880 ctctgctgtt cgtggagata ctggagttta caaaatcatt gttgaaaatg agcatggaaa 11940 agatactgct cagtgcaatg ttactgttct tgatgtacca ggaactccag aaggaccact 12000 caagattgac gagatccata aggaaggatg tacattgaac tggaagcctc caactgataa 12060 cggaggaact gatgttcttc actacattgt tgagaagatg gatacttctc gtggaacatg 12120 gcaggaagtc ggaactttcc cagattgtac agccaaggtt aataagcttg ttcctggaaa 12180 ggaatacgca ttccgtgtca aggcagtcaa tcttcaagga gaatcaaaac cattggaagc 12240 tgaagaacca attattgcaa agaatcaatt tgatgttcct gatccagttg acaaaccaga 12300 ggttactgac tgggataagg atagaattga tattaagtgg aacccaactg caaacaatgg 12360 aggagctcca gtcactggat atattgttga gaagaaggag aagggaagcg caatctggac 12420 agaagccgga aagactcctg gaacaacatt cagtgctgat aacctgaaac cgggagttga 12480 atacgagttc cgtgttattg ctgtcaatgc tgcaggacca tctgatccat ccgatccaac 12540 tgacccgcaa atcaccaagg ctcgctactt gaaaccaaag atcttaactg ctagcagaaa 12600 aatcaagata aaggctggat tcactcataa cttggaagtc gatttcattg gagctcccga 12660 tccaactgcc acttggactg ttggagattc tggagcagct cttgctccag aacttcttgt 12720 tgatgccaag agctcgacta cgtcaatatt cttcccatct gctaaacgtg cagacagtgg 12780 aaactacaag ttgaaggtta agaatgagtt gggagaggat gaagctatct tcgaggtcat 12840 tgttcaagat agaccgtctg ctccagaagg accacttgaa gtttctgatg tcactaagga 12900 tagttgtgtt ctcaattgga aaccaccaaa ggatgatgga ggtgctgaaa tcagcaacta 12960 tgtcgttgag aagagagata caaagaccaa cacctgggtt ccagtttctg catttgtcac 13020 tggaacctca atcactgttc caaaactcac ggaaggccac gaatacgagt tccgtgttat 13080 ggctgagaac acctttggta gatctgattc attgaacacc gatgagccag ttcttgcaaa 13140 ggatccattt ggaacaccag gaaagccagg aagaccagaa attgttgata ctgataatga 13200 tcatatcgat atcaaatggg atcctccacg tgacaacggt ggatcaccag ttgatcatta 13260 cgacattgag aggaaggatg caaagactgg acgctggatc aaggttaaca catctccagt 13320 tcaaggtact gcattctcgg atactcgtgt tcaaaagggt catacctatg aataccgtgt 13380 cgttgccgtc aacaaagctg ggccaggaca accatcagat tcgtctgcgg ctgctactgc 13440 taagccaatg catgaggctc cgaagttcga tttggatttg gatggaaagg aattccgtgt 13500 gaaggccgga gaaccattgg ttattactat tccattcact gcatccccac aaccagacat 13560 ttcatggacc aaggagggag gaaaaccatt ggctggagtt gaaacaactg attctcagac 13620 caagttggtt attccatcta ccagaagatc tgattctgga ccagtcaaaa tcaaggccgt 13680 caatccatac ggagaagctg aagcaaacat caagatcaca gttatcgaca aaccaggagc 13740 tccagaaaac attacttacc cagctgtcag cagacacact tgcactctca attgggatgc 13800 tccaaaggac gatggaggcg ccgaaatcgc tggatacaaa attgaatatc aagaagtcgg 13860 gtctcagatt tgggataagg ttcctggact catttccgga actgcttata ctgttcgtgg 13920 acttgagcac ggtcaacaat accgtttcag aatccgcgca gagaatgcag tcggactttc 13980 tgattactgc caaggtgttc cagttgttat caaggatcca ttcgacccac caggtgcacc 14040 aagtactcca gaaatcactg gatacgatac caatcaagta tccctggcat ggaacccacc 14100 aagagacgac ggtggttctc caattttggg atatgtcgtt gaacgttttg agaagagagg 14160 tggcggtgat tgggctccag tcaagatgcc aatggtcaag ggaactgaat gcattgtgcc 14220 aggacttcat gagaatgaaa cctaccaatt ccgagtacgt gccgtgaatg ctgctggaca 14280 tggagaacca agtaacggat ctgagccagt cacctgcaga ccttatgtcg agaaaccagg 14340 tgcaccagat gctccaagag ttggaaagat taccaaaaac tctgctgagc ttacctggaa 14400 tagaccattg agagatggag gtgcaccaat tgatggatac attgttgaaa agaagaagct 14460 tggagataat gattggacca gatgcaatga taaaccagtt cgtgatacag cctttgaagt 14520 caagaatctt ggtgaaaagg aagaatacga gttccgtgtt atcgctgtca atagcgccgg 14580 agaaggtgaa ccatccaagc catccgattt ggtgctcatc gaggaacaac caggacgacc 14640 aatcttcgat atcaacaatc tcaaggatat cactgtccgt gctggagaaa caatccaaat 14700 tcgtattcca tatgctggag gaaatccaaa accaattatt gatctgttca acggaaactc 14760 tccgatcttc gagaacgaga gaactgttgt tgatgtcaat ccaggagaaa tcgttatcac 14820 cactaccgga tcaaagagat cggatgctgg tccatacaag atttctgcca ctaacaaata 14880 cggaaaagat acttgcaagc ttaatgtctt cgttcttgat gctccaggaa aaccaactgg 14940 accaatccgt gctactgaca ttcaagccga tgcaatgacg ctttcatgga gaccaccaaa 15000 ggataatgga ggagatgcta tcaccaatta tgtcgttgaa aagagaactc caggcggtga 15060 ctgggtcact gtcggacatc ctgttggaac aactcttcgt gtccgcaatt tggatgccaa 15120 tactccttac gaattccgtg ttcgcgctga aaatcaatat ggagttggag agccacttga 15180 aactgatgac gcaattgttg ccaagaatcc gttcgatact ccaggagctc caggacaacc 15240 agaagccgtt gaaacttcgg aggaagcaat tacacttcaa tggacaagac caacatctga 15300 tggaggagct ccaattcaag gatatgtgat tgagaagaga gaagtcggat caactgaatg 15360 gacgaaagct gcatttggaa acatccttga cacaaaacat cgtgtcactg gactcactcc 15420 aaagaagacc tacgaattca gagttgcagc ttacaatgca gctggacaag gagaatacag 15480 tgttaactct gttccaatta cagctgataa tgctccaaca agaccgaaga tcaacatggg 15540 aatgcttact cgcgatatcc tcgcttacgc tggagaacgt gcaaagattc ttgttccatt 15600 tgctgcttca cctgctccga aagtcacttt ctcgaagggt gagaataaga tcagcccaac 15660 tgatccaaga gtgaaggttg agtacagtga cttcttggct acattgacga tcgagaagtc 15720 tgaacttact gatggtggac tctactttgt tgaacttgaa aatagtcaag gaagtgattc 15780 tgctagtatc agattgaagg ttgttgataa accagcttca ccacaacaca tccgagtaga 15840 ggatattgca ccagactgct gcactcttta ctggatgcca ccatcatctg atggaggatc 15900 gccaatcaca aactacatcg ttgagaagct tgatcttcgt cattctgatg gaaagtggga 15960 gaaggtttct tcattcgttc gcaatttgaa ctacactgtt ggaggactta tcaaggacaa 16020 ccgttatcgt ttccgtgttc gtgccgagac ccaatacgga gtttcagaac catgtgagct 16080 tgctgatgtc gtcgttgcca agtatcagtt cgaggttcca aatcaaccag aagctccaac 16140 tgttcgcgac aaggactcca cttgggccga gttggaatgg gatccaccaa gagatggagg 16200 atcaaagatc attggatacc aagttcaata cagagatact tcttctggaa gatggatcaa 16260 tgccaagatg gatctttccg aacaatgcca tgctcgtgtc actggacttc gtcaaaatgg 16320 agaatttgaa ttcagaatca ttgcaaagaa tgcagctgga ttctcgaaac catctccacc 16380 atctgaaaga tgtcagctca agtctcgatt tggaccacca ggtccaccaa ttcatgttgg 16440 agccaagtca attggccgca accattgtac aattacctgg atggcgccat tggaagatgg 16500 aggatcaaag atcacaggat acaacgttga aattcgtgaa tacggaagta cattgtggac 16560 tgttgctagc gactataacg ttcgtgaacc tgaattcaca gttgacaaac tcagggagtt 16620 caatgattat gaattccgtg ttgttgcaat caatgctgct ggaaagggaa ttccatctct 16680 tccatctgga ccaatcaaga ttcaggaatc cggtggaagt cgcccacaaa tcgttgtcaa 16740 gccagaagac actgctcaac catacaacag aagagccgtg ttcacttgcg aagctgtcgg 16800 aagaccagaa ccaactgcaa gatggcttag aaatggaaga gaacttccag agagtagcag 16860 atatagattc gaagcaagtg atggagtcta caagttcact atcaaggaag tttgggacat 16920 tgatgctgga gagtacacag tcgaggtgtc caatccatat ggaagcgaca ctgccactgc 16980 taaccttgtt gttcaagctc ccccagtcat cgagaaagat gttccaaaca caattcttcc 17040 aagtggagat cttgttcgtc tgaagattta cttctcggga accgcaccat tccgtcatag 17100 tttggtattg aacagagaag aaattgacat ggatcatcca acaattagaa tagttgaatt 17160 cgatgatcat atcttgatca caattccagc cttatcagtg agagaagccg gacgttacga 17220 gtacaccgtt tccaatgact ctggagaagc taccactgga ttctggctca acgttacagg 17280 acttccagag gctccacaag gaccattgca cattagtaac atcggaccaa gcactgccac 17340 attgtcatgg agaccacctg tcacagatgg aggttcgaag attaccagct atgtcgttga 17400 aaagagagat ctttcaaagg atgaatgggt aactgttaca tcaaacgtca aggacatgaa 17460 ctacatcgtt actggattgt tcgaaaatca cgagtacgaa ttcagagtat ctgctcaaaa 17520 tgagaacgga attggagccc cacttgttag tgagcatcca attattgctc gtcttccatt 17580 cgatccacca acttcaccat tgaacttgga aatcgttcaa gttggaggag actacgtcac 17640 actttcatgg caacgaccat tatctgatgg tggaggtcgc cttcgtggat acattgttga 17700 aaaacaagag gaagagcatg atgaatggtt cagatgcaat cagaacccat ctccaccaaa 17760 taactacaat gttccaaatc tcatcgacgg aagaaagtat agataccgag tatttgctgt 17820 caatgatgca ggactttccg atctagccga gcttgatcaa actttgttcc aagcatccgg 17880 ttctggagaa ggaccaaaga ttgtcagtcc attgagcgat ttgaacgaag aagttggaag 17940 atgtgtcaca tttgagtgtg aaatcagtgg atctccaaga cctgaataca gatggttcaa 18000 gggatgcaag gaacttgttg acaccagcaa gtacactctt attaataagg gagacaagca 18060 agtccttatt atcaatgact taacgtctga tgatgctgat gaatacacat gccgtgccac 18120 caactcttca ggaactcgta gtaccagagc caatttgcgt atcaagacca agccacgtgt 18180 gttcattcca ccaaaatatc atggaggata tgaggcgcag aagggagaaa ctattgagtt 18240 gaagattcca tacaaagcat atccacaagg agaagccaga tggacaaagg atggagagaa 18300 gattgagaac aacagcaagt tcagcatcac tactgatgat aagtttgcta ccctccgaat 18360 ctcgaatgcc agtcgtgagg attatggaga ataccgagtt gtcgttgaga actcagttgg 18420 atctgactct ggaactgtta atgtcactgt cgccgacgta cctgaaccac caagattccc 18480 gattatcgag aacattcttg atgaagctgt catcttatcc tggaagccac cagcacttga 18540 tggaggatcg ttggttacca actataccat tgagaagaga gaggcgatgg gaggatcatg 18600 gagtccatgt gccaagagtc gttacaccta cacaacaatt gaaggacttc gtgctggaaa 18660 gcagtatgaa ttcagaatca ttgctgagaa caaacacgga caatcgaaac catgtgagcc 18720 aacagctcca gttttgattc caggagatga gcgtaaacgc aggcgaggat atgatgttga 18780 tgaacaagga aagattgtac gtggaaaagg aaccgtttct tctaattatg acaactacgt 18840 ttttgatatc tggaagcaat attacccaca accagtagaa atcaagcatg atcatgttct 18900 ggaccactac gatattcatg aagagctcgg aacaggagca tttggagttg tgcacagagt 18960 aactgaaaga gcaactggaa acaactttgc tgcgaaattc gtaatgactc cacatgaatc 19020 tgacaaggaa actgtcagaa aagagattca aaccatgtca gttttgagac acccgacgct 19080 tgtgaacctt catgatgctt tcgaggatga caatgaaatg gtcatgattt acgagttcat 19140 gagtggtgga gaactcttcg agaaggttgc tgatgagcac aataagatga gtgaagatga 19200 agctgttgag tacatgagac aagtctgtaa gggactctgt catatgcatg agaacaacta 19260 cgtacatttg gatttgaagc cagagaacat catgttcaca acgaagagaa gcaacgagct 19320 gaaattgatt gattttggac tcaccgccca tcttgatcca aaacaatccg tcaaggttac 19380 aacaggaact gccgaatttg ccgctccaga agttgccgaa ggcaagccag tcggttatta 19440 caccgatatg tggagcgttg gagttctctc ttacattctt ctttccggac tttcaccatt 19500 tggaggagag aacgatgatg aaacattgag gaatgttaag agctgtgact ggaatatgga 19560 cgattccgct ttctctggaa tctccgaaga cggaaaagat ttcatccgaa agcttcttct 19620 tgctgatcca aataccagaa tgactattca tcaagctttg gagcacccat ggttgacacc 19680 aggaaatgct ccaggacgtg actctcaaat tccaagcagc agatacacta agatccgtga 19740 ttcaatcaag accaaatacg atgcttggcc agaaccactg ccaccacttg gaagaatctc 19800 aaattattca tcattgagaa agcatagacc acaagagtac tcaattcgtg acgccttctg 19860 ggatcgatct gaagctcaac cacgattcat tgtgaagcct tacggaactg aagttggaga 19920 gggacaatct gctaatttct attgcagagt tattgcatct tcaccaccag ttgttacttg 19980 gcataaggat gatagagaat tgaagcagag tgtgaaatat atgaagaggt acaatggaaa 20040 tgattatgga cttaccatta accgagtaaa gggagatgat aagggagaat acacagtccg 20100 tgcaaagaac tcatacggaa ccaaggaaga aattgtattc ttgaatgtta cccgtcactc 20160 tgaaccactc aaattcgagc cattggagcc gatgaagaag gcaccaagtc caccaagagt 20220 tgaagaattc aaggagagaa gatctgcacc cttcttcaca ttccatctca gaaatcgttt 20280 gattcaaaag aaccatcagt gcaaattgac atgttctttg caaggaaacc ctaatccaac 20340 aattgaatgg atgaaggacg gacatccagt tgacgaagat cgtgttcaag tttctttccg 20400 aagtggtgta tgctcacttg agatctttaa tgctcgtgtt gatgacgctg gaacatacac 20460 agtcactgcc accaatgact tgggagttga tgtctccgag tgtgtactca cagttcaaac 20520 taaaggaggt gaaccaattc cacgtgtttc ttcgttcaga ccccgaagag cttatgacac 20580 attatcaact ggaactgatg tcgaaagatc acattcgtat gctgatatga gaagaagatc 20640 ccttattcgt gatgtatcac cagatgtacg atcagccgct gatgatctca agacaaagat 20700 cacaaatgaa cttccatcgt tcacagctca actttcggat tctgaaactg aagttggagg 20760 atctgctgag ttttcggcgg cagtctctgg acaacctgaa ccacttatcg aatggcttca 20820 taatggagaa agaatctcgg aatccgactc aaggttccgt gcctcgtatg ttgctggaaa 20880 agcaacgttg cgaatcagtg acgccaagaa gtcggatgaa ggacaatatc tgtgccgtgc 20940 ttcaaactct gcaggacaag aacaaaccag agcaacattg acagtgaaag gagatcaacc 21000 acttctcaat ggacacgctg gacaggctgt tgaaagtgaa cttcgtgtaa caaagcactt 21060 gggaggagaa attgtgaata atggagagtc agttacattt gaagctagag tgcaaggaac 21120 accagaagaa gtgttatgga tgagaaatgg acaagaattg acaaatggag ataagacaag 21180 catcagtcaa gatggtgaaa cactatcttt cactatcaac tcagcagacg catcagatgc 21240 cggacactac caactggaag ttcgttcaaa aggaacaaat ctcgtatctg ttgcatccct 21300 ggtagtagtt ggagagaaag ctgatcctcc agtcaccagg ctaccatcct ctgtctctgc 21360 tcctctcggc ggatcaacag catttacgat tgaatttgaa aatgttgaag gtctgacagt 21420 acaatggttc cgcggatcgg aaaaaattga aaagaatgaa cgggtcaaat cagtcaagac 21480 cggaaacacc tttaagcttg acattaagaa cgtcgaacag gacgacgacg gcatctatgt 21540 cgccaaagta gtaaaagaga agaaggcaat tgcaaaatat gcggcagctc ttctccttgt 21600 ctaatcatcc tgccaccacc actttaaact tcattatatt tgtatctatt ttctgtagtc 21660 ttcacatcta gcctcctatg tctctttctt ttattttaat ttcaatttcc attctctcct 21720 cctaatttct gaaattttct ccgttttcgc caaatttctt tcgccatccg atattcgtgt 21780 ttgttttatc gttttttttt caatcaagta ataagcccgg cccctgtcaa aacgatgctt 21840 tctttattgt aatcatccaa aattctaatt gatttttctt aacatttttc cctttaaaaa 21900 cacacaaacc tgcttcattg taattttcga gaagtttcag tttttttcaa tgttttccag 21960 caaaacttta caaaatttta agtcaaattt caaaacattt ttctatgatt tatctgtttt 22020 tatttcttca ttttccattt ccttcaatga ttcaagaatt gggacgcttg tttcagaacg 22080 tggaatttta atttcaattg tttctcattt ctccatgatt tctcttttgt ttccatcttt 22140 ttcagtcaga ttttcagttt gggaccctga atctctctga tccactttcc atgattaggt 22200 atcaattctt aatatttgct gattatgctt gaattcggga caaattcttc ataaggttgc 22260 aatttttatg tctatttctt gagtattttt ccaatagctt tagtttggta gactccacat 22320 atcctggtgt tttcttttct cacgattttt tccattgtat gcgttctgaa atttgacttg 22380 aaaattttct gcttcttgta gatgctcaaa aaacttgaaa ttctactgaa actgctcatc 22440 ttctctaaaa actgtaaatc tttcatctag tcagtctgag gtgtttttat ttctctctat 22500 tttctctgga attcaaatgt tgttctaata cataataata gtaaacgaat aatattgt 22558 <210> 52 <211> 7350 <212> DNA <213> Artificial sequence <220> <223> C. elegans Luciferase ( FJ376737.1 Cloning vector pmirGLO, complete sequence) <400> 52 catgcaagct gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac 60 cgctgagcaa taactagcat aaccccttgg ggcggccgct tcgagcagac atgataagat 120 acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg 180 aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca 240 acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag gtttttttaa 300 gcaagtaaaa cctctacaaa tgtggtaaaa tcgaatttta acaaaatatt aacgcttaca 360 atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgcg 420 gatctgcgca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt taggtacctt 480 ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg 540 ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg 600 aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 660 aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca 720 ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc 780 ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa 840 gcttgattct tctgacacaa cagtctcgaa ccaaaggctg gagccaccat ggcttccaag 900 gtgtacgacc ccgagcaacg caaacgcatg atcactgggc ctcagtggtg ggctcgctgc 960 aagcaaatga acgtgctgga ctccttcatc aactactatg attccgagaa gcacgccgag 1020 aacgccgtga tttttctgca tggtaacgct gcctccagct acctgtggag gcacgtcgtg 1080 cctcacatcg agcccgtggc tagatgcatc atccctgatc tgatcggaat gggtaagtcc 1140 ggcaagagcg ggaatggctc atatcgcctc ctggatcact acaagtacct caccgcttgg 1200 ttcgagctgc tgaaccttcc aaagaaaatc atctttgtgg gccacgactg gggggcttgt 1260 ctggcctttc actactccta cgagcaccaa gacaagatca aggccatcgt ccatgctgag 1320 agtgtcgtgg acgtgatcga gtcctgggac gagtggcctg acatcgagga ggatatcgcc 1380 ctgatcaaga gcgaagaggg cgagaaaatg gtgcttgaga ataacttctt cgtcgagacc 1440 atgctcccaa gcaagatcat gcggaaactg gagcctgagg agttcgctgc ctacctggag 1500 ccattcaagg agaagggcga ggttagacgg cctaccctct cctggcctcg cgagatccct 1560 ctcgttaagg gaggcaagcc cgacgtcgtc cagattgtcc gcaactacaa cgcctacctt 1620 cgggccagcg acgatctgcc taagatgttc atcgagtccg accctgggtt cttttccaac 1680 gctattgtcg agggagctaa gaagttccct aacaccgagt tcgtgaaggt gaagggcctc 1740 cacttcagcc aggaggacgc tccagatgaa atgggtaagt acatcaagag cttcgtggag 1800 cgcgtgctga agaacgagca gaccggtggt gggagcggag gtggcggatc aggtggcgga 1860 ggctccggag ggattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1920 aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1980 cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 2040 aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 2100 gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 2160 ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 2220 gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 2280 aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 2340 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 2400 atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 2460 gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 2520 tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2580 gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2640 cgccttcttg acgagttctt ctgagcggga ctctggggtt cgaaatgacc gaccaagcga 2700 cgcccaacct gccatcacga tggccgcaat aaaatatctt tattttcatt acatctgtgt 2760 gttggttttt tgtgtgaatc gatagcgata aggatcctct ttgcgcttgc gttttccctt 2820 gtccagatag cccagtagct gacattcatc cggggtcagc accgtttctg cggactggct 2880 ttctacgtaa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc 2940 cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 3000 tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 3060 gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 3120 gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 3180 ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 3240 actttcaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 3300 ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 3360 aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 3420 gataacactg cggccaactt acttctgaca actatcggag gaccgaagga gctaaccgct 3480 tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 3540 gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 3600 cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 3660 atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 3720 attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg 3780 ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 3840 gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaattc 3900 gaaatgaccg accaagcgac gcccaaccgg tatcagctca ctcaaaggcg gtaatacggt 3960 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 4020 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 4080 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 4140 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 4200 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 4260 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 4320 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 4380 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 4440 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 4500 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 4560 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 4620 cgcgcagaaa aaaaggattt caagaagatc ctttgatctt ttctacgggg tctgacgctc 4680 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 4740 cctagatcct tttatagtcc ggaaatacag gaacgcacgc tggatggccc ttcgctggga 4800 tggtgaaacc atgaaaaatg gcagcttcag tggattaagt gggggtaatg tggcctgtac 4860 cctctggttg cataggtatt catacggtta aaatttatca ggcgcgattg cggcagtttt 4920 tcgggtggtt tgttgccatt tttacctgtc tgctgccgtg atcgcgctga acgcgtttta 4980 gcggtgcgta caattaaggg attatggtaa atccacttac tgtctgccct cgtagccatc 5040 gagataaacc gcagtactcc ggccacgatg cgtccggcgt agaggatcga gatctaccgg 5100 gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc cccgctgggc 5160 acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac cggtaggcgc 5220 caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc cctagtcagg 5280 aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt 5340 ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt aggcctttgg 5400 ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct gggaaggggt 5460 gggtccgggg gcgggctcag gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc 5520 ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc 5580 tcatctccgg gcctttcgac ctgcagccca agcttggcaa tccggtactg ttggtaaagc 5640 caccatggaa gatgccaaaa acattaagaa gggcccagcg ccattctacc cactcgaaga 5700 cgggaccgcc ggcgagcagc tgcacaaagc catgaagcgc tacgccctgg tgcccggcac 5760 catcgccttt accgacgcac atatcgaggt ggacattacc tacgccgagt acttcgagat 5820 gagcgttcgg ctggcagaag ctatgaagcg ctatgggctg aatacaaacc atcggatcgt 5880 ggtgtgcagc gagaatagct tgcagttctt catgcccgtg ttgggtgccc tgttcatcgg 5940 tgtggctgtg gccccagcta acgacatcta caacgagcgc gagctgctga acagcatggg 6000 catcagccag cccaccgtcg tattcgtgag caagaaaggg ctgcaaaaga tcctcaacgt 6060 gcaaaagaag ctaccgatca tacaaaagat catcatcatg gatagcaaga ccgactacca 6120 gggcttccaa agcatgtaca ccttcgtgac ttcccatttg ccacccggct tcaacgagta 6180 cgacttcgtg cccgagagct tcgaccggga caaaaccatc gccctgatca tgaacagtag 6240 tggcagtacc ggattgccca agggcgtagc cctaccgcac cgcaccgctt gtgtccgatt 6300 cagtcatgcc cgcgacccca tcttcggcaa ccagatcatc cccgacaccg ctatcctcag 6360 cgtggtgcca tttcaccacg gcttcggcat gttcaccacg ctgggctact tgatctgcgg 6420 ctttcgggtc gtgctcatgt accgcttcga ggaggagcta ttcttgcgca gcttgcaaga 6480 ctataagatt caatctgccc tgctggtgcc cacactattt agcttcttcg ctaagagcac 6540 tctcatcgac aagtacgacc taagcaactt gcacgagatc gccagcggcg gggcgccgct 6600 cagcaaggag gtaggtgagg ccgtggccaa acgcttccac ctaccaggca tccgccaggg 6660 ctacggcctg acagaaacaa ccagcgccat tctgatcacc cccgaagggg acgacaagcc 6720 tggcgcagta ggcaaggtgg tgcccttctt cgaggctaag gtggtggact tggacaccgg 6780 taagacactg ggtgtgaacc agcgcggcga gctgtgcgtc cgtggcccca tgatcatgag 6840 cggctacgtt aacaaccccg aggctacaaa cgctctcatc gacaaggacg gctggctgca 6900 cagcggcgac atcgcctact gggacgagga cgagcacttc ttcatcgtgg accggctgaa 6960 gagcctgatc aaatacaagg gctaccaggt agccccagcc gaactggaga gcatcctgct 7020 gcaacacccc aacatcttcg acgccggggt cgccggcctg cccgacgacg atgccggcga 7080 gctgcccgcc gcagtcgtcg tgctggaaca cggtaaaacc atgaccgaga aggagatcgt 7140 ggactatgtg gccagccagg ttacaaccgc caagaagctg cgcggtggtg ttgtgttcgt 7200 ggacgaggtg cctaaaggac tgaccggcaa gttggacgcc cgcaagatcc gcgagattct 7260 cattaaggcc aagaagggcg gcaagatcgc cgtgtaattc tagttgttta aacgagctcg 7320 ctagcctcga gtctagagtc gacctgcagg 7350 <210> 53 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 53 augaguuggg ucuaacccau aacu 24 <210> 54 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 54 auggguucgg ucaacccaua acuc 24 <210> 55 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 55 augaaaauuu ugauuuacga auug 24 <210> 56 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 56 aguuaugggu uagacccaac ucau 24 <210> 57 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 57 gaguuauggg uugaccgaac ccau 24 <210> 58 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 58 caauucguaa aucaaaauuu uaau 24 <210> 59 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 59 auguguauag ggaagcuaau c 21 <210> 60 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 60 auguguauag ggaagcuaau c 21 <210> 61 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 61 uauaugaaca uuaauaacug g 21 <210> 62 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 62 gauuagcuuc ccuauacaca u 21 <210> 63 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 63 gauuagcuuc ccuauacaca u 21 <210> 64 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 64 ccaguuauua auguucauau a 21 <210> 65 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 65 tagccgaatt ccgtatgagt ctttgtctat gtatcttcta acaaggatac aatatttagg 60 cttaaaagat ccgttgcg 78 <210> 66 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 66 gtgtagccga agtccgtatg agtcttcgtc tttgtatctt ctaacaagaa tacaatactt 60 aggcttttaa gatctggttg c 81 <210> 67 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 67 gtgtagccga agtccgtacg agtctttgtc tttgtatctt ctaacaagga cacaatactt 60 aggcttttaa gatctggttg cga 83 <210> 68 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 68 gtgtagccga agtccgtacg agtctttgtc tttgtatctt ctaacaagga cacaatactt 60 aggcttttaa gatctggttg cga 83 <210> 69 <211> 151 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 69 tcaaaatggg taacccaact caactcaact cataatcaaa tgagtttagg gttaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgggttggat caacccataa ctcatttaat 120 ttaatgggtg aaattgttaa atgggttaac c 151 <210> 70 <211> 76 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 70 aactcatttg acccatcaac tcatttgagt taaaaatcaa cccattaggg ttcatgggtt 60 gagttgagtt gagttg 76 <210> 71 <211> 76 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 71 aactcatttg acccatcaac tcatttgagt taaaaatcaa cccattaggg ttcatgggtt 60 gagttgagtt gagttg 76 <210> 72 <211> 324 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 72 gaaaaatgtt atttaatacc tgaactttca aaaagtggcc aaattaaccg tgaactctta 60 aaataaccgt tttatacctc aacaaaaagt tgacttctaa tttaatctat aagttatcgt 120 tgacctaacc aaatcgactc accattaaca gtcatgaaca actttcctaa ctgcgtaact 180 aacagctgtt ttcgtcctta aaccaacgat aacgactgtt agcccatgtt ttgtaatggc 240 tgttaggagc gttgttaaga agtgttaacg gtgaatcgat ttgccctgat caacgataac 300 ttataggtta aattagaagt caac 324 <210> 73 <211> 182 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 73 gacaaataaa ttgtaaagtt tttgttgact ttcgaaataa atgacaaagt ttttgttgac 60 ttgtcatttg agtcatgtcg ttaaataggt taacaaaaaa aatttacggc gttaatgtct 120 cgtttatcta ctctgttaga acaaaacaac gtcgtttatt gcagatcatt ttgtctgttg 180 aa 182 <210> 74 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 74 tctgcaagtg aaaacttctt acccttttca tatcctagca gctcagaagt ctttatgtta 60 gttttgaatt gaagtgcttg aat 83 <210> 75 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 75 aactcatttg accaatcaac tcatttgagt caaaaatttt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 76 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 76 tcaaaatgga taactcaact caactcaact cataattaaa tgagtttagg gttaaatgag 60 ttatgggatg acccaactca ttttgttaaa tgggttgggt caacccataa ctcatttaat 120 ttgatgggtt gagttgttaa atgggttaac ccattta 157 <210> 77 <211> 195 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 77 taaatgacaa agtttttgtt gatttgccat ttgagtcatg tcgttaaata gattaacaaa 60 actttttacg atgttaatgt tccgtttatc tgctctatta gaacaaaacg atgtcgttta 120 ttgctagaca aaagacggcg ttttgtctgt tgaaacaaat ttaaacccta aatcctcaaa 180 ttgatttcat tatct 195 <210> 78 <211> 230 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 78 gacaaataaa tcgtaatatt tttgttgact ttctaaataa atgacaaagt ttttgttgat 60 ttgccatttg agtcatgtcg ttaaatagat taacaaaact ttttacgatg ttaatgttcc 120 gtttatctgc tctattagaa caaaacgatg tcgtttattg ctagacaaaa gacggcgttt 180 tgtctgttga aacaaattta aaccctaaat cctcaaattg atttcattat 230 <210> 79 <211> 261 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 79 tttcgaaata aatgacaaag tttttgttga tttcccattt gaatcatgtc gttaaatagg 60 ttaacagaat tattttacgg cgttaatgtc tcgtgtatat gctctgttag aacaaaacga 120 cgtcgtttat tgagagacaa aagaacgtcg ttttgtctgt taaaacaaat ttaaaccctg 180 aatctccaat tcgattttat tatctgcgat tttgaggtca aggtgggtct gtgatttcga 240 gataatgaaa tcgatttggg g 261 <210> 80 <211> 242 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 80 taaatgacaa agtttttgtt gacttgtcat ttaagtcatg tcattagatc ggttaacata 60 attttttacg gcgttaatgt ctcatttatc tcctctgtta gaacaaaaca atgttgttta 120 ttgcggctcg ttttgtttgt tgaaataaat ttaaacccta aatccccaaa tcgacttcaa 180 tatctgcgag tttgaggtca atgtgggtct gtgattttga gataacgaaa tcgatttggg 240 ga 242 <210> 81 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 81 tttcgaaata aatgacaaag tttttgttta cttgccattt gactcatatc gttaaatagg 60 ttaacagatt ttttttacgg cgtt 84 <210> 82 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 82 aataactcat ttgacccatc aactcatttg agtcaaaaat tttaactcat taaagttcat 60 gggttgagtt gagttgagtt g 81 <210> 83 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 83 aactcatttg acccatcaac tcatttaagt caaaattttc aattcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 84 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 84 cccactagct catttgatcc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 85 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 85 acccatcaaa ttaaatgagt tatgggttga cccaactcat tatgttaaat aggttgggtc 60 aacccataac ttatttaatt ctaaa 85 <210> 86 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 86 cccaataact catttgaccc atcaactcat ttaagtcaaa aatttcaact cattagggtt 60 tttgggttga gttgagttga gttg 84 <210> 87 <211> 204 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 87 tttctaaata aatgacaaag tttttgttga cttgtcattt gagtcatgtc gttaaatagg 60 ttgacaaaaa aatttagtcg ttaatgtccc gtttatctgc tctgttagaa caaaacaacg 120 tcctttattg cagagacaaa acaaaatcgt tttgtctcta gaaacaaatt taaaccctaa 180 atccccaaat cgatttcatg atct 204 <210> 88 <211> 212 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 88 ttgttgactt tctaaataaa tgacaaagtt tttgttgact tgtcatttga gtcatgtcgt 60 taaataggtt gacaaaaaaa tttagtcgtt aatgtcccgt ttatctgctc tgttagaaca 120 aaacaacgtc ctttattgca gagacaaaac aaaatcgttt tgtctctaga aacaaattta 180 aaccctaaat ccccaaatcg atttcatgat ct 212 <210> 89 <211> 188 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 89 aataaatgtc aaagtttttg ttaacttgtc atttcagtca tgtcgttaag taggttaaca 60 taattttttt acggcgttaa tgtctcgtgt atcacctctg ttagaacaaa acaacgttgt 120 ttattgcagc tcgttttgtc tgttgaaaca aatataaacc ctaaataccc aaatcgattt 180 cattatct 188 <210> 90 <211> 204 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 90 tttctaaata aatgacaaag tttttgttga cttgccattt gagtcatgtc gttaaataga 60 ttaacaagat tttttacgat gttaatgttc cgtttatttg ctttgttaga acaaaacgat 120 gtcgtttatt gcatacacaa acgacgtcgt tttgtttgtt gaaacaaatt taaactctaa 180 atccccaagt tgattttatt atct 204 <210> 91 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 91 cccaataact catttgaccc atcaactcat ttgagtcaaa aaaaaataac tcattagagt 60 tcatgggttg agttgagttg agttg 85 <210> 92 <211> 228 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 92 aaataaatcg taaagtgttt gttcactttc taaataaatg acaaagtttt tgttgacttg 60 ccatttgagt catgtcgtta aatagattaa caagattttt tacgatgtta atgttccgtt 120 tatttgcttt gttagaacaa aacgatgtcg tttattgcat acacaaacga cgtcgttttg 180 tttgttgaaa caaatttaaa ctctaaatcc ccaagttgat tttattat 228 <210> 93 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 93 gtgtagccgt agtccgtatg agtctttgtc tttgtatctt cgaacaagga tataatactt 60 aggcttttaa gatccagttg cg 82 <210> 94 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 94 gtgtagccgt agtccgtatg agtctttgtc tttgtatctt cgaacaagga tataatactt 60 aggcttttaa gatccagttg cg 82 <210> 95 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 95 gtgtagctga agtccgtatg agtctttgtc tttgtatctt ctaacaagga aacactactt 60 atgcttttat gatccggttg c 81 <210> 96 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 96 gtgtagctga agtccgtatg agtctttgtc tttgtatctt ctaacaagga aacactactt 60 atgcttttat gatccggttg c 81 <210> 97 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 97 tcaaaatggg taacccaact caactcaact cataatcaaa tgagtttagg gttaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgggttgggt caacccataa ctcatttaat 120 ttgatgggtt gagttgttaa atgagttaac ctattta 157 <210> 98 <211> 80 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 98 gtgtagtcga attccgtatg agtctttgtc tttgtatctt ctaacaaggg aacaatacat 60 aggcttttaa gatcaggttg 80 <210> 99 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 99 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttaaattga gttg 84 <210> 100 <211> 80 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 100 gtgtagtcga atttcatatg agtctttgtc tttgtatctt ctaacaaggg aacaatactt 60 aggcttttaa gatcaggttg 80 <210> 101 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 101 gtgtagctga aggccatatg agtctttgta ttgtataatc taacaaggat ataatactta 60 ggcttttaag atgcggttgc g 81 <210> 102 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 102 acccatcaaa ttaaatgagt tatgggttga cccaactcat tttgttaaat gagttgggtc 60 aacccataac tcatttaatt ctaaa 85 <210> 103 <211> 155 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 103 aaaatgggta acccaactca actcaactca taatcaaatg agtttagggt taaatgagtt 60 atgggttgac ccaactcatt ttgttaaatg ggttaggtca acccataact catttaattt 120 gatgggttga gttgttaaat ggattaaccc attta 155 <210> 104 <211> 446 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 104 catgaattag agttgtgaat gtaaaggtat caggtttata tcccatttcg accatttgat 60 caaccaaagc tacggcatca gaaatcctct tactgtgaca gtagccattg agcagcgaag 120 aaagcgtgac aatatcgggc tcatagccga gtttcatcat cttggcaaga acagctaaag 180 caagagagag ctgagagcgt cggcaaaagc agttgatgaa aatactgtat gtgtaaagat 240 catgtgaaat tcccaaagtt tgcatctgct cgccgagaga gatgacaagt tcaaacttgt 300 tcatcttagc aacggcactc aacagtttat tgaattcaac aatggaagga aatggacgag 360 acttgaccat gtcaccgaac agatcaaccg catcatctac cttaataata tcacttagcc 420 tatttctcaa tatctctctg taatca 446 <210> 105 <211> 446 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 105 catgaattag agttgtgaat gtaaaggtat caggtttata tcccatttcg accatttgat 60 caaccaaagc tacggcatca gaaatcctct tactgtgaca gtagccattg agcagcgaag 120 aaagcgtgac aatatcgggc tcatagccga gtttcatcat cttggcaaga acagctaaag 180 caagagagag ctgagagcgt cggcaaaagc agttgatgaa aatactgtat gtgtaaagat 240 catgtgaaat tcccaaagtt tgcatctgct cgccgagaga gatgacaagt tcaaacttgt 300 tcatcttagc aacggcactc aacagtttat tgaattcaac aatggaagga aatggacgag 360 acttgaccat gtcaccgaac agatcaaccg catcatctac cttaataata tcacttagcc 420 tatttctcaa tatctctctg taatca 446 <210> 106 <211> 409 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 106 catgaatcaa agttgtaaat gtgattgtgt caggtctata ccccatttcc accatttgat 60 caaccaaagc tacagcatct gaaatcctct taccgtgaca gtatccattg agaagagaag 120 aaagcgtgac aatgctgggc tcatagccga gtttcatcat cttgccaaga agagctaaag 180 caagagagat ttgagagcgt cggcagaaac agttgatcaa aatattgtaa gtatatagat 240 tatgtgaaat tcctaacctc tgcatcttct cacctagaga gatgacaaga tcaaactttt 300 tcatcttagc aatggcactc aacagtttat tgaactcaaa aatggaaggt aaaggacgtg 360 acttgaccat gccaccgaac aaaccaattg catcatctaa cttcaaatc 409 <210> 107 <211> 443 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 107 catgaatcaa agttgtaaat gtgattgtgt caggtctata ccccatttcc accatttgat 60 caaccaaagc tacagcatct gaaatcctct taccgtgaca gtatccattg agaagagaag 120 aaagcgtgac aatgctgggc tcatagccga gtttcatcat cttgccaaga agagctaaag 180 caagagagat ttgagagcgt cggcagaaac agttgatcaa aatattgtaa gtatatagat 240 tatgtgaaat tcctaacctc tgcatcttct cacctagaga gatgacaaga tcaaactttt 300 tcatcttagc aatggcactc aacagtttat tgaactcaaa aatggaaggt aaaggacgtg 360 acttgaccat gccaccgaac aaaccaattg catcatctaa cttcatacta tgtaacccat 420 ttctcaatat ctctctgtaa tca 443 <210> 108 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 108 aactcatttg acccatcaac tcatttgagt caaaattttc aactcattag ggttcatgag 60 ttgagttgag ttgagttg 78 <210> 109 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 109 catttttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 110 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 110 catttttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 111 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 111 catttttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 112 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 112 catttttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 113 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 113 catttttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 114 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 114 catttttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 115 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 115 aactcatttg acccatcaac tcatttgagt caaaattttg aactcattag agttcatggg 60 ttgagttgaa ttgagttg 78 <210> 116 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 116 cccaataact catttgaccc atcaactcat ttgagtcaaa aatttcaact cattagggtt 60 caaaagttgc gttgagttga gttg 84 <210> 117 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 117 cccaataact catttgaccc atcaactcat ttgagtcaaa attttctaac tcattagagt 60 tcatgagttg agttgagttg agttg 85 <210> 118 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 118 gttaaatgag ttatgggttg atccataact catttaattt gatgggttga gttgttaaat 60 gggttaaccc attta 75 <210> 119 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 119 tcaaaatggg taatccaact caactcaact cataatcaaa tgagtttagg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgggttcggt caacccataa ctcaattaat 120 ttgatggatt gagttggtaa atgagttaac ccattta 157 <210> 120 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 120 tggctccgaa aggaaatctg cggttaaatt acggataaag gacagtgcgg ttcaaataat 60 aacaaaaata tatacataca tatatatatg cagaaaattt cgttactatt tgaaatgcac 120 cgcactgtgc agttcagtca ccatttgaag cctatat 157 <210> 121 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 121 gtgtagccga agtccgtatg agtctttgtc tttgtatctt ctagcaagga tacaatactt 60 aggcttttaa gatctggtta cg 82 <210> 122 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 122 gtgtagccga agtccgtatg agtctttgtc tttgtatctt ctagcaagga tacaatactt 60 aggcttttaa gatctggtta cg 82 <210> 123 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 123 aggcttaaaa gatccgttgc 20 <210> 124 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 124 aggcttttaa gatctggttg c 21 <210> 125 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 125 aggcttttaa gatctggttg c 21 <210> 126 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 126 aggcttttaa gatctggttg c 21 <210> 127 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 127 atgggttgga tcaacccata act 23 <210> 128 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 128 tgggttgagt tgagttgagt tg 22 <210> 129 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 129 tgggttgagt tgagttgagt tg 22 <210> 130 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 130 tgttaagaag tgttaacggt g 21 <210> 131 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 131 ttgaattgaa gtgcttgaat 20 <210> 132 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 132 tgggttgagt tgagttgagt tg 22 <210> 133 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 133 atgggttggg tcaacccata act 23 <210> 134 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 134 tgggttgagt tgagttgagt tg 22 <210> 135 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 135 tgggttgagt tgagttgagt tg 22 <210> 136 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 136 tgggttgagt tgagttgagt tg 22 <210> 137 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 137 ataggttggg tcaacccata act 23 <210> 138 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 138 tgggttgagt tgagttgagt tg 22 <210> 139 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 139 tgggttgagt tgagttgagt tg 22 <210> 140 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 140 aggcttttaa gatccagttg c 21 <210> 141 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 141 aggcttttaa gatccagttg c 21 <210> 142 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 142 atgcttttat gatccggttg c 21 <210> 143 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 143 atgcttttat gatccggttg c 21 <210> 144 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 144 atgggttggg tcaacccata act 23 <210> 145 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 145 aggcttttaa gatcaggttg 20 <210> 146 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 146 tgggttgagt taaattgagt tg 22 <210> 147 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 147 aggcttttaa gatcaggttg 20 <210> 148 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 148 aggcttttaa gatgcggttg c 21 <210> 149 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 149 atgagttggg tcaacccata act 23 <210> 150 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 150 atgggttagg tcaacccata act 23 <210> 151 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 151 tgagttgagt tgagttgagt tg 22 <210> 152 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 152 agatgtggag atcgtgggga tg 22 <210> 153 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 153 agatgtggag atcgtgggga tg 22 <210> 154 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 154 agatgtggag atcgtgggga tg 22 <210> 155 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 155 agatgtggag atcgtgggga tg 22 <210> 156 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 156 agatgtggag atcgtgggga tg 22 <210> 157 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 157 agatgtggag atcgtgggga tg 22 <210> 158 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 158 tgggttgagt tgaattgagt tg 22 <210> 159 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 159 aaagttgcgt tgagttgagt tg 22 <210> 160 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 160 tgagttgagt tgagttgagt tg 22 <210> 161 <211> 25 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 161 atgagttatg ggttgatcca taact 25 <210> 162 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 162 atgggttcgg tcaacccata act 23 <210> 163 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 163 aggcttttaa gatctggtta c 21 <210> 164 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 164 aggcttttaa gatctggtta c 21 <210> 165 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 165 atttgagtca tgtcgttaaa 20 <210> 166 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 166 atttgagtca tgtcgttaaa 20 <210> 167 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 167 atttgagtca tgtcgttaaa 20 <210> 168 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 168 atttgaatca tgtcgttaaa 20 <210> 169 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 169 atttaagtca tgtcattaga 20 <210> 170 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 170 atttgactca tatcgttaaa 20 <210> 171 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 171 atttgagtca tgtcgttaaa 20 <210> 172 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 172 atttgagtca tgtcgttaaa 20 <210> 173 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 173 atttcagtca tgtcgttaag 20 <210> 174 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 174 atttgagtca tgtcgttaaa 20 <210> 175 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 175 atttgagtca tgtcgttaaa 20 <210> 176 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 176 gtgaatgtaa aggtatcagg t 21 <210> 177 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 177 gtgaatgtaa aggtatcagg t 21 <210> 178 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 178 gtaaatgtga ttgtgtcagg tc 22 <210> 179 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 179 gtaaatgtga ttgtgtcagg tc 22 <210> 180 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 180 cagtgcggtt caaataataa c 21 <210> 181 <211> 79 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 181 tagccgtaat ccgtatgagt ctttgtcttt gtatcttcta acaaggatac aatatttagg 60 cttttaagat ctggttgcg 79 <210> 182 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 182 gtgtagccga agtccgtatg agtctttgtc tttgtatcct ctaacaagga tataatactt 60 aggcttttaa gatctggttg c 81 <210> 183 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 183 gtgtagccgt aatccgtatg agtctttgtc tttgtatctt ctaacaagga tacaatattt 60 aggcttttaa gatctggttg cga 83 <210> 184 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 184 gtgtagccga agtccgtatg agtctttgtc tttgtatcct ctaacaagga tataatactt 60 aggcttttaa gatctggttg cga 83 <210> 185 <211> 152 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 185 tcaaaatggg taacccaacc caacccaact cataatcaaa tgagtttatg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgagttgggt ctaacccata actcatttca 120 tttgatgggt tgagttgtta aatgggttaa cc 152 <210> 186 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 186 aactcatttg acccatcaac tcatttgagt caaaaaattt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 187 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 187 aactcatttg acccatcaac tcatttgagt caaaaaattt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 188 <211> 324 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 188 gaaaaatgtt attttatacc tgaactttca aaaagtggcc aaattaaccg tgaatttttg 60 aaatgatcgt tttatacctc aacaaaaagt tgacttctaa tttaacctat aagttatcgt 120 tgacccggcc aaatcgactc accattaaca cttcttaaca gctctcctaa cagcgtaact 180 aacaactgtt tttgtcctta aaccaacaat aacggctgtt aggccatgtt ttgtaacggc 240 tgttaggaac gctgttaagg agtgttaacg gtgagtatat ttggccgggt caacgacaaa 300 ttataggtca aattagaagt caac 324 <210> 189 <211> 182 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 189 gacaaataaa tcgtaaacgt tttgttgact tttgaaataa atgacaaagt ttttgttgac 60 ttgtcatttg agtcatgtcg ttaagtaggt taacataaaa aatttaagac gttaatgtct 120 cgtttatctc ctccgtaaaa acaaaacaac gttgtttatt gaagctcgtt ttgtctgttg 180 aa 182 <210> 190 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 190 tctgcaagtg gaaacttctt acttttatca tatcccatca gctcgaaagt cttgatgtta 60 gttttgaatt gaagtgcttg aat 83 <210> 191 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 191 aactcatttg acccatcaac tcatttgagt caaaaaattt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 192 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 192 tcaaaatggg taacccaacc caacccaact cataatcaaa tgagtttatg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgagttgggt ctaacccata actcatttca 120 tttgatgggt tgagttgtta aatgggttaa ccattta 157 <210> 193 <211> 186 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 193 taaatgacaa agtttatgtt gacttttcat ttgagtcatg tcgttaagta ggttaatata 60 attatttccc ggcgttaagt tctcgtttat ctcctctatt agaacaaaac aacattgttt 120 attgcatctc gttttgtctg ttgaaacaaa tttaaaccct aaatccccaa atcgatttca 180 ttatct 186 <210> 194 <211> 221 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 194 gacaaataaa tcgtaaacgt tttgttgact tttgaaataa atgacaaagt ttttgttgac 60 ttgtcatttg agtcatgtcg ttaagtaggt taacataaaa aatttaagac gttaatgtct 120 cgtttatctc ctccgtaaaa acaaaacaac gttgtttatt gaagctcgtt ttgtctgttg 180 aaacaaattt aaaccctaaa tcctcaaatc gatttcatta t 221 <210> 195 <211> 251 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 195 tttcgaaata aatgacaaag tttttgttga cttgtcattt gagtcatgtc gttaagtagg 60 ttgacataat ttttttacgg cgttaatgtc tcgtttatct cctctgttag aacaaaacaa 120 cgttgtttat tgcagctcgt tttctctatt gaaacaaatt taaaccttaa attcccaaat 180 cgattttatt atctgcgatt ttgaggtcaa tgtgggtatg tgattttgag ataatgaaat 240 cgatttaggg g 251 <210> 196 <211> 242 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 196 taaatgacaa agtttatgtt gacttttcat ttgagtcatg tcgttaagta ggttaatata 60 attatttccc ggcgttaagt tctcgtttat ctcctctatt agaacaaaac aacattgttt 120 attgcatctc gttttgtctg ttgaaacaaa tttaaaccct aaatccccaa atcgatttca 180 ttatctgcga ttttgaggtc aggtgggttt gtgattttga gataatgaaa tcgatatagg 240 ga 242 <210> 197 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 197 tttcgaaata aatgacaaag tttttgttga cttgtcattt gagtcatgtc gttaagtagg 60 ttgacataat ttttttacgg cgtt 84 <210> 198 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 198 aataactcat ttgacccatc aactcatttg agtcaaaaaa tttaactcat tagggttcat 60 gggttgagtt gagttgagtt g 81 <210> 199 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 199 aactcatttg acccatcaac tcatttgagt caaaaaattt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 200 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 200 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 201 <211> 86 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 201 acccatcaaa tgaaatgagt tatgggttga cccaactcat tttgttaaat gagttgggtc 60 taacccataa ctcatttaat cataaa 86 <210> 202 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 202 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 203 <211> 194 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 203 tttcgaaata aatgacaaag tttttgttga cttgtcattt gagtcatgtc gttaagtagg 60 ttgacataat ttttttacgg cgttaatgtc tcgtttatct cctctgttag aacaaaacaa 120 cgttgtttat tgcagctcgt tttctctatt gaaacaaatt taaaccttaa attcccaaat 180 cgattttatt atct 194 <210> 204 <211> 202 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 204 ttgttgactt tcgaaataaa taacaaagtt tttgttgact tgtcatttga gtcatgtcgt 60 taagtaggtt aacaaaaaaa atttacggcg ttaatgtctc ctttatctcc tctgttagaa 120 caaaaaaacg ttgtttattg cagttcgttt tgtctgttga cacaaattta aaccctaaat 180 ccccaaatcg attttattat ct 202 <210> 205 <211> 188 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 205 aataaatgac aaagtttttg ttgacttgtc atttgagtca tgtcgttaag taggttgaca 60 taattttttt acggcgttaa tgtctcgttt atctcctctg ttagaacaaa acaacgttgt 120 ttattgcagc tcgttttctc tattgaaaca aatttaaacc ttaaattccc aaatcgattt 180 tattatct 188 <210> 206 <211> 194 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 206 tttcgaaata aatgacaaag tttttgttga cttgtcattt gagtcatgtc gttaagtagg 60 ttgacataat ttttttacgg cgttaatgtc tcgtttatct cctctgttag aacaaaacaa 120 cgttgtttat tgcagctcgt tttctctatt gaaacaaatt taaaccttaa attcccaaat 180 cgattttatt atct 194 <210> 207 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 207 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 208 <211> 218 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 208 aaataaatcg taaacgtttt gttgactttt gaaataaatg acaaagtttt tgttgacttg 60 tcatttgagt catgtcgtta agtaggttaa cataaaaaat ttaagacgtt aatgtctcgt 120 ttatctcctc cgtaaaaaca aaacaacgtt gtttattgaa gctcgttttg tctgttgaaa 180 caaatttaaa ccctaaatcc tcaaatcgat ttcattat 218 <210> 209 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 209 gtgtagccgt aatccgtatg agtctttgtc tttgtatctt ctaacaagga tacaatattt 60 aggcttttaa gatctggttg cg 82 <210> 210 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 210 gtgtagccga agtccgtatg agtctttgtc tttgtatcct ctaacaagga tataatactt 60 aggcttttaa gatctggttg cg 82 <210> 211 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 211 gtgtagccgt aatccgtatg agtctttgtc tttgtatctt ctaacaagga tacaatattt 60 aggcttttaa gatctggttg c 81 <210> 212 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 212 gtgtagccga agtccgtatg agtctttgtc tttgtatcct ctaacaagga tataatactt 60 aggcttttaa gatctggttg c 81 <210> 213 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 213 tcaaaatggg taacccaacc caacccaact cataatcaaa tgagtttatg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgagttgggt ctaacccata actcatttca 120 tttgatgggt tgagttgtta aatgggttaa ccattta 157 <210> 214 <211> 80 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 214 gtgtagccgt aatccgtatg agtctttgtc tttgtatctt ctaacaagga tacaatattt 60 aggcttttaa gatctggttg 80 <210> 215 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 215 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 216 <211> 80 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 216 gtgtagccgt aatccgtatg agtctttgtc tttgtatctt ctaacaagga tacaatattt 60 aggcttttaa gatctggttg 80 <210> 217 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 217 gtgtagccga agtccgtatg agtctttgtc tttgtatcct ctaacaagga tataatactt 60 aggcttttaa gatctggttg cg 82 <210> 218 <211> 86 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 218 acccatcaaa tgaaatgagt tatgggttga cccaactcat tttgttaaat gagttgggtc 60 taacccataa ctcatttaat cataaa 86 <210> 219 <211> 155 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 219 aaaatgggta acccaaccca acccaactca taatcaaatg agtttatgat taaatgagtt 60 atgggttgac ccaactcatt ttgttaaatg agttgggtct aacccataac tcatttcatt 120 tgatgggttg agttgttaaa tgggttaacc attta 155 <210> 220 <211> 443 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 220 catgaattag agtgttgaat gtgaatgaat cgggctgata tcccatttcc accatctgac 60 caacaagaga tacggcatct gaaatcctat tcccgtgaca gaaaccattg agcagagagt 120 taagcgtgac aatatcgggc tcatagccga gtttcatcat cttggcaaga acagctaaag 180 caagagagag ctgagagcgt cggcagaaac agttgatgag aatactgtat gtgtaaagat 240 tatgtgaaat tcccaaattt tgcatctgct cgccgagaga gatgacaaga tcgaacttgt 300 tcatcttagc aatggcactc aacagtttac tgaactcaac aatcgaaggg aaaggacgag 360 acttgaccat gtcaccgaac agattaaccg catcatctag cttcaaatca tttagcctat 420 ttatcgatat ttttctgtaa tca 443 <210> 221 <211> 443 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 221 catgaattag agtgttgaat gtgaatgaat cgggctgata tcccatttcc accatctgac 60 caacaagaga tacggcatct gaaatcctat tcccgtgaca gaaaccattg agcagagagt 120 taagcgtgac aatatcgggc tcatagccga gtttcatcat cttggcaaga acagctaaag 180 caagagagag ctgagagcgt cggcagaaac agttgatgag aatactgtat gtgtaaagat 240 tatgtgaaat tcccaaattt tgcatctgct cgccgagaga gatgacaaga tcgaacttgt 300 tcatcttagc aatggcactc aacagtttac tgaactcaac aatcgaaggg aaaggacgag 360 acttgaccat gtcaccgaac agattaaccg catcatctag cttcaaatca tttagcctat 420 ttatcgatat ttttctgtaa tca 443 <210> 222 <211> 409 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 222 catgaattag agtgttgaat gtgaatgaat cgggctgata tcccatttcc accatctgac 60 caacaagaga tacggcatct gaaatcctat tcccgtgaca gaaaccattg agcagagagt 120 taagcgtgac aatatcgggc tcatagccga gtttcatcat cttggcaaga acagctaaag 180 caagagagag ctgagagcgt cggcagaaac agttgatgag aatactgtat gtgtaaagat 240 tatgtgaaat tcccaaattt tgcatctgct cgccgagaga gatgacaaga tcgaacttgt 300 tcatcttagc aatggcactc aacagtttac tgaactcaac aatcgaaggg aaaggacgag 360 acttgaccat gtcaccgaac agattaaccg catcatctag cttcaaatc 409 <210> 223 <211> 443 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 223 catgaattag agtgttgaat gtgaatgaat cgggctgata tcccatttcc accatctgac 60 caacaagaga tacggcatct gaaatcctat tcccgtgaca gaaaccattg agcagagagt 120 taagcgtgac aatatcgggc tcatagccga gtttcatcat cttggcaaga acagctaaag 180 caagagagag ctgagagcgt cggcagaaac agttgatgag aatactgtat gtgtaaagat 240 tatgtgaaat tcccaaattt tgcatctgct cgccgagaga gatgacaaga tcgaacttgt 300 tcatcttagc aatggcactc aacagtttac tgaactcaac aatcgaaggg aaaggacgag 360 acttgaccat gtcaccgaac agattaaccg catcatctag cttcaaatca tttagcctat 420 ttatcgatat ttttctgtaa tca 443 <210> 224 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 224 aactcatttg acccatcaac tcatttgagt caaaaaattt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 225 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 225 catctttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 226 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 226 catctttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 227 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 227 catctttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 228 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 228 catctttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 229 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 229 catctttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 230 <211> 75 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 230 catctttgag attttacaca gtagtcatgg agtttttgga agagagaaag tggagatgtg 60 gagatcgtgg ggatg 75 <210> 231 <211> 78 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 231 aactcatttg acccatcaac tcatttgagt caaaaaattt aactcattag ggttcatggg 60 ttgagttgag ttgagttg 78 <210> 232 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 232 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 233 <211> 84 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 233 cccaataact catttgaccc atcaactcat ttgagtcaaa aaatttaact cattagggtt 60 catgggttga gttgagttga gttg 84 <210> 234 <211> 73 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 234 gttaaatgag ttgggtctaa cccataactc atttcatttg atgggttgag ttgttaaatg 60 ggttaaccat tta 73 <210> 235 <211> 157 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 235 tcaaaatggg taacccaacc caacccaact cataatcaaa tgagtttatg attaaatgag 60 ttatgggttg acccaactca ttttgttaaa tgagttgggt ctaacccata actcatttca 120 tttgatgggt tgagttgtta aatgggttaa ccattta 157 <210> 236 <211> 155 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 236 tggctccgaa tggagacgtg cagttcaact gcggataaag tgttgtgcgg ttcaaatagt 60 aacaaaaata tatacataca tatatatgta aagaatttcg ttactatttg aatcgtactg 120 cactgtacgg ttcggtcacc attcgaagcc tatat 155 <210> 237 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 237 gtgtagccgt aatccgtatg agtctttgtc tttgtatctt ctaacaagga tacaatattt 60 aggcttttaa gatctggttg cg 82 <210> 238 <211> 82 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 238 gtgtagccga agtccgtatg agtctttgtc tttgtatcct ctaacaagga tataatactt 60 aggcttttaa gatctggttg cg 82 <210> 239 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 239 aggcttttaa gatctggttg c 21 <210> 240 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 240 aggcttttaa gatctggttg c 21 <210> 241 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 241 aggcttttaa gatctggttg c 21 <210> 242 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 242 aggcttttaa gatctggttg c 21 <210> 243 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 243 atgagttggg tctaacccat aact 24 <210> 244 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 244 tgggttgagt tgagttgagt tggc 24 <210> 245 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 245 tgggttgagt tgagttgagt tggc 24 <210> 246 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 246 tgttaaggag tgttaacggt g 21 <210> 247 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 247 ttgaattgaa gtgcttgaat t 21 <210> 248 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 248 tgggttgagt tgagttgagt tggc 24 <210> 249 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 249 atgagttggg tctaacccat aact 24 <210> 250 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 250 tgggttgagt tgagttgagt tggc 24 <210> 251 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 251 tgggttgagt tgagttgagt tggc 24 <210> 252 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 252 tgggttgagt tgagttgagt tggc 24 <210> 253 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 253 atgagttggg tctaacccat aact 24 <210> 254 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 254 tgggttgagt tgagttgagt tggc 24 <210> 255 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 255 tgggttgagt tgagttgagt tggc 24 <210> 256 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 256 aggcttttaa gatctggttg c 21 <210> 257 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 257 aggcttttaa gatctggttg c 21 <210> 258 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 258 aggcttttaa gatctggttg c 21 <210> 259 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 259 aggcttttaa gatctggttg c 21 <210> 260 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 260 atgagttggg tctaacccat aact 24 <210> 261 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 261 aggcttttaa gatctggttg c 21 <210> 262 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 262 tgggttgagt tgagttgagt tggc 24 <210> 263 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 263 aggcttttaa gatctggttg c 21 <210> 264 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 264 aggcttttaa gatctggttg c 21 <210> 265 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 265 atgagttggg tctaacccat aact 24 <210> 266 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 266 atgagttggg tctaacccat aact 24 <210> 267 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 267 tgggttgagt tgagttgagt tggc 24 <210> 268 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 268 agatgtggag atcgtgggga tg 22 <210> 269 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 269 agatgtggag atcgtgggga tg 22 <210> 270 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 270 agatgtggag atcgtgggga tg 22 <210> 271 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 271 agatgtggag atcgtgggga tg 22 <210> 272 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 272 agatgtggag atcgtgggga tg 22 <210> 273 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 273 agatgtggag atcgtgggga tg 22 <210> 274 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 274 tgggttgagt tgagttgagt tggc 24 <210> 275 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 275 tgggttgagt tgagttgagt tggc 24 <210> 276 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 276 tgggttgagt tgagttgagt tggc 24 <210> 277 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 277 atgagttggg tctaacccat aact 24 <210> 278 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 278 atgagttggg tctaacccat aact 24 <210> 279 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 279 aggcttttaa gatctggttg c 21 <210> 280 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 280 aggcttttaa gatctggttg c 21 <210> 281 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 281 atttgagtca tgtcgttaag 20 <210> 282 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 282 cattcaagga cttctattca g 21 <210> 283 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 283 atttgagtca tgtcgttaag 20 <210> 284 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 284 atttgagtca tgtcgttaag 20 <210> 285 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 285 atttgagtca tgtcgttaag 20 <210> 286 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 286 atttgagtca tgtcgttaag 20 <210> 287 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 287 atttgagtca tgtcgttaag 20 <210> 288 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 288 atttgagtca tgtcgttaag 20 <210> 289 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 289 atttgagtca tgtcgttaag 20 <210> 290 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 290 atttgagtca tgtcgttaag 20 <210> 291 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 291 atttgagtca tgtcgttaag 20 <210> 292 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 292 atttgagtca tgtcgttaag 20 <210> 293 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 293 ttgaatgtga atgaatcggg c 21 <210> 294 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 294 ttgaatgtga atgaatcggg c 21 <210> 295 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 295 ttgaatgtga atgaatcggg c 21 <210> 296 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 296 ttgaatgtga atgaatcggg c 21 <210> 297 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 297 ttgtgcggtt caaatagtaa c 21 <210> 298 <211> 116 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 298 tctactttga tctacaaaaa atgcgcgggg actgatttcg catggttaag aaagcgctga 60 cgtcacaaca tttttgggcg aaaaactccc gcattttttg tagatcaaac cgtcga 116 <210> 299 <211> 66 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 299 cccatagaaa tattttctat gtcaacctct acaacggttg ccgtagttaa attttttctt 60 tgggaa 66 <210> 300 <211> 155 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 300 tgcggcaaat ttgccgaatt tgccgaattt gccgtttgcc gagctcggca aatttcaaaa 60 aagtagattt gccgaatttg ccgtgctcgg caaatattgg aaaaatagat ttgccgaatt 120 tgccgagctc ggcaaatttt gagatttgcc gcaca 155 <210> 301 <211> 122 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 301 tctacgttga tctacaaaaa atgcggcaca gctctcaact gatttcatat ggttaggaac 60 gtgctgacgt cacatttttt cgggcaaaaa tttcccgcat tttttgtaga tcaaaccgcc 120 tg 122 <210> 302 <211> 122 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 302 tacggtttga tctacaaaaa atgcggcaga gatctcaact gatttcgtat ggttaggaac 60 gtgctgacgt cacatttttt tggggaaaaa aatcccgcat tttttgtaga ccaaaccgta 120 at 122 <210> 303 <211> 163 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 303 tgtagtttgt agtccagcag accaatacca aaagctttgg gtctgccaga gactacaaac 60 tacacaaatc actagcagac catacggttt ttttttttgc gtagtttgta gtctagcaga 120 ccgaaaatag gatgcgttgg tctgccacac tacaaactac aaa 163 <210> 304 <211> 126 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 304 cgtacgttga tctacaaaaa atgcgggaat tgttgatcaa ctgatttcgc atggttaaga 60 acgtgctgac gtcacatttt ttggggcgaa aaaaattccc gcattttttg tagatcaaac 120 cgtcaa 126 <210> 305 <211> 112 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 305 tctactttga tctacaaaaa atgcggcgga gttctcaact gattttgcac gtgccgacgt 60 cacattttct tggacaaaaa atccccgcaa tttttgtaga tcaaaccgta cc 112 <210> 306 <211> 123 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 306 tacgtcttga tctacaaaaa atgcggcaga gttctcaact gatttcgtat ggttaggaac 60 gtgctgacgt cacatatttt tgggcaaaaa aactcccgcg ttttttgtag atcacaccgt 120 gaa 123 <210> 307 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 307 ttttttgtag atcaaaccgt cga 23 <210> 308 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 308 gtagttaaat tttttctttg ggaa 24 <210> 309 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 309 aaattttgag atttgccgca ca 22 <210> 310 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 310 ttttttgtag atcaaaccgc ctg 23 <210> 311 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 311 ttttttgtag accaaaccgt aat 23 <210> 312 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 312 tctgccacac tacaaactac aaa 23 <210> 313 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 313 ttttttgtag atcaaaccgt caa 23 <210> 314 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 314 atttttgtag atcaaaccgt acc 23 <210> 315 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 315 ttttttgtag atcacaccgt gaa 23 <210> 316 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 316 tctactttga tctacaaaaa atgc 24 <210> 317 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 317 cccatagaaa tattttctat gtc 23 <210> 318 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 318 tgcggcaaat ttgccgaatt tgc 23 <210> 319 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 319 tctacgttga tctacaaaaa atgc 24 <210> 320 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 320 tacggtttga tctacaaaaa atgc 24 <210> 321 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 321 tgtagtttgt agtccagcag acc 23 <210> 322 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 322 cgtacgttga tctacaaaaa atgc 24 <210> 323 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 323 tctactttga tctacaaaaa atgc 24 <210> 324 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 324 tacgtcttga tctacaaaaa atgc 24 <210> 325 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 325 ggtgaggggt gtgtcccatg ccggtttgat ctacaaaaaa tgcgggagca tagaaaaatc 60 ccgcactttt gtagatcaaa ccgacatggg acaacctgac actgtgttca 110 <210> 326 <211> 65 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 326 cccatagaaa tattttctat gtcaacctct tgtacggttg ctgtagttaa ttttttcttt 60 gggaa 65 <210> 327 <211> 94 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 327 agtcggaggc aggggtgtgc ggcaaatttg ccgaatttgc cgtttgtcga gctcggcaaa 60 ttttgagatt ttccgcacac ccctgatcgg agcc 94 <210> 328 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 328 ggtgaggggt gtgtcccatg ccggtttgat ctacaaaaaa tgcgggagca tagaaaaatc 60 ccgcactttt gtagatcaaa ccgacatggg acaacctgac actgtgttca 110 <210> 329 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 329 ggtgaggggt gtgtcccatg ccggtttgat ctacaaaaaa tgcgggagca tagaaaaatc 60 ccgcactttt gtagatcaaa ccgacatggg acaacctgac actgtgttca 110 <210> 330 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 330 ggtctgctaa ttatttttgt agtttgtagt ctagcagacc aataccaaaa gctttgggtc 60 tgccagacta caaaccacac aaatcactag cagacccttt tttttttttt 110 <210> 331 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 331 ggtgaggggt gtgtcccatg ccggtttgat ctacaaaaaa tgcgggagca tagaaaaatc 60 ccgcactttt gtagatcaaa ccgacatggg acaacctgac actgtgttca 110 <210> 332 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 332 ggtgaggggt gtgtcccatg ccggtttgat ctacaaaaaa tgcgggagca tagaaaaatc 60 ccgcactttt gtagatcaaa ccgacatggg acaacctgac actgtgttca 110 <210> 333 <211> 110 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 333 ggtgaggggt gtgtcccatg ccggtttgat ctacaaaaaa tgcgggagca tagaaaaatc 60 ccgcactttt gtagatcaaa ccgacatggg acaacctgac actgtgttca 110 <210> 334 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 334 acttttgtag atcaaaccga cat 23 <210> 335 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 335 tgtagttaat tttttctttg ggaa 24 <210> 336 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 336 aaattttgag attttccgca ca 22 <210> 337 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 337 acttttgtag atcaaaccga cat 23 <210> 338 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 338 acttttgtag atcaaaccga cat 23 <210> 339 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 339 tctgccagac tacaaaccac aca 23 <210> 340 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 340 acttttgtag atcaaaccga cat 23 <210> 341 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 341 acttttgtag atcaaaccga cat 23 <210> 342 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 342 acttttgtag atcaaaccga cat 23 <210> 343 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 343 gccggtttga tctacaaaaa atgc 24 <210> 344 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 344 cccatagaaa tattttctat gtc 23 <210> 345 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 345 tgcggcaaat ttgccgaatt tgc 23 <210> 346 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 346 gccggtttga tctacaaaaa atgc 24 <210> 347 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 347 gccggtttga tctacaaaaa atgc 24 <210> 348 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 348 tgtagtttgt agtctagcag acc 23 <210> 349 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 349 gccggtttga tctacaaaaa atgc 24 <210> 350 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 350 gccggtttga tctacaaaaa atgc 24 <210> 351 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 351 gccggtttga tctacaaaaa atgc 24 <210> 352 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 352 gtcatgctgt ggccctccag agggaagcgc tttctgttgt ctgaaagaaa acaaagcgct 60 cccctttaga ggtttacggt ttgag 85 <210> 353 <211> 97 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 353 tttttctagt tattaggttg gtgcaaaagt aattgtggtt tttgccatta ctttaaatgg 60 caagaacaac aattactttt gcaccaacct aatagat 97 <210> 354 <211> 101 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 354 gcaagaagat ctcaggctgt cgtcctctag agggaagcac tttctgttgt ctgaaagaaa 60 agaaagtgct tccttttaga gggttaccgt ttgagaaaag c 101 <210> 355 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 355 catgctgtgg ccctccagag ggaagcgctt tctgttgtct gaaagaaaac aaagcgctcc 60 cctttagagg tttacggttt g 81 <210> 356 <211> 70 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 356 actggtgcaa aagtaattgc ggtttttgcc attacttttc ttggcaaaaa ccgcaattac 60 ttgtgcacca 70 <210> 357 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 357 tgtcatgctg tggccctcca gagggaagcg ctttctgttg tctgaaagaa aacaaagcgc 60 tcccctttag aggtttacgg tttgagt 87 <210> 358 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 358 tctgcaggtc ctggtgaacg ccatcatcaa cagtggtccc cgggaggact ccatacgtat 60 tgggcgagcc gagcctgggc cgt 83 <210> 359 <211> 70 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 359 tggtgcaaaa gtaattgcgg tttttgccat taaaggtaaa atggcaatta cttttgtacc 60 aacctatatt 70 <210> 360 <211> 61 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 360 ccctccagag ggaagcgctt tctgttgtct gaaagaaaac aaagcgctcc cctttagagg 60 t 61 <210> 361 <211> 115 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 361 ggggccgagg gccgtccggc gtcccaggcg gggcgccgcg ggaccgccct cgtgtctgtg 60 gcggtgggat cccgcggccg tgttttcctg gtggcccggc cgtgcctgag gtttc 115 <210> 362 <211> 98 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 362 ctctcaccaa gcaagtgcag tggggcttgc tggcttgcac tgtgactccc tctcaccaag 60 caagtgcagt ggggcttgct ggcttgcacc gtgactca 98 <210> 363 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 363 tctgcaggtc ctggtgaacg ccatcatcaa cagtggtccc cgggaggact ccacactcac 60 tgggcgagcc aggatcgtga gac 83 <210> 364 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 364 tctgcaggtc ctggtgaacg ccatcatcaa cagtggtccc cgggaggact ccacacgcat 60 tgggtgcgcc gggactgtga gac 83 <210> 365 <211> 115 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 365 ggggccgagg gccgtccggc gtcccaggcg gggcgccgcg ggaccgccct cgtgtctgtg 60 gcggtgggat cccgcggccg tgttttcctg gtggcccggc cgtgcctgag gtttc 115 <210> 366 <211> 116 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 366 tcaggaggct gaggtggaag gatcgcttga gcctgggagg tcaaggctgc agtgacccga 60 gatcatgcca ctgtactcaa gcctggacta cagagtgaga ccctgtctca aaaacg 116 <210> 367 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 367 tgtcatgctg tggccctcca gagggaagcg ctttctgttg tctgaaagaa aacaaagcgc 60 tcccctttag aggtttacgg tttgagt 87 <210> 368 <211> 93 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 368 ccgtccggca tcctaggcgg gtcgctgcgg gacctccctc gtgtctgtgg cggtgggatc 60 ccgtggccgt gttttcctgg tggcccggcc gtg 93 <210> 369 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 369 tgtcatgctg tggccctcca gagggaagcg ctttctgttg tctgaaagaa aacaaagcgc 60 tcccctttag aggtttacgg tttgagt 87 <210> 370 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 370 tgtcatgctg tggccctcca gagggaagcg ctttctgttg tctgaaagaa aacaaagcgc 60 tcccctttag aggtttacgg tttgagt 87 <210> 371 <211> 180 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 371 accgccgcga ctgcggcggt ggtgggggga gccgcgggga tcgccggagg gccggtcggc 60 gccccgggtg ccgcgcggtg ccgccggggc gtgaggcccc gcgcgtgtgt cccggctgcg 120 gtcggccgcg ctcgaggggt ccccgtggcg tccccttccc cgccggccgc ctttctcgcg 180 <210> 372 <211> 180 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 372 accgccgcga ctgcggcggt ggtgggggga gccgcgggga tcgccggagg gccggtcggc 60 gccccgggtg ccgcgcggtg ccgccggggc gtgaggcccc gcgcgtgtgt cccggctgcg 120 gtcggccgcg ctcgaggggt ccccgtggcg tccccttccc cgccggccgc ctttctcgcg 180 <210> 373 <211> 70 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 373 tgatgcaaaa gtaattgcgg tttttgccat tacttttgca ccaaccttgt agtaacaaaa 60 ggagccagta 70 <210> 374 <211> 61 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 374 tctcgaggaa agaagcactt tctgttgtct gaaagaaaag aaagtgcttc ctttcagagg 60 g 61 <210> 375 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 375 tctcagcctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaagtgc 60 atctttttag aggattacag tttgaga 87 <210> 376 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 376 tctcatgctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaacgcgc 60 ttccctatag agggttaccc tttgaga 87 <210> 377 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 377 tctcaggctg tgtccctcta cagggaagcg ctttctgttg tctgaaagaa aggaaagtgc 60 atccttttag agtgttactg tttgaga 87 <210> 378 <211> 88 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 378 ttattaggtg ggtgcaaagg taattgcagt ttttcccatt attttaattg cgaaaacagc 60 aattaccttt gcaccaacct gatggagt 88 <210> 379 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 379 tctcaagctg tgactgcaaa gggaagccct ttctgttgtc tgaaagaaga gaaagcgctt 60 ccctttgctg gattacggtt tgaga 85 <210> 380 <211> 115 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <220> <221> misc_feature <222> (1)..(67) <223> n is a, c, g, t or u <400> 380 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnngat cccgcggccg tgttttcctg gtggcccggc cgtgcctgag gtttc 115 <210> 381 <211> 61 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 381 tctcgaggaa agaagcactt tctgttgtct gaaagaaaag aaagtgcttc ctttcagagg 60 g 61 <210> 382 <211> 118 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 382 gtagatcatg attgtattag gttggtgcaa aagtaatcgc agtttttgtc attactttca 60 atggcaaaaa cagcgattgc ttttgcacca acctatactt ccttgacata tggacctg 118 <210> 383 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 383 tcaggctgtg accctctaga gggaagcgct ttctgttggc taaaagaaaa gaaagcgctt 60 cccttcagag tgttaacgct ttgag 85 <210> 384 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 384 cctcaggctg tgacactcta gagggaagcg ctttctgttg tctgaaagaa aggaaagtgc 60 atccttttag agtgttactg tttgaga 87 <210> 385 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 385 tctcaggctg tgaccctcca aagggaagaa ctttctgttg tctaaaagaa aagaacgcac 60 ttccctttag agtgttaccg tgtgaga 87 <210> 386 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 386 tcccatgctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaagtgc 60 atccttttag aggtttactg tttgagg 87 <210> 387 <211> 129 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 387 gggatgccac attcagccat tcagcgtaca gtgcctttct caaggaggtg tcgtttatgt 60 gaactaaaat ataaatttca cctttctgag aagagtaatg tacagcatgc actgcatatg 120 tggtgtccc 129 <210> 388 <211> 127 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 388 ggatgccaca ttcagccatt cagcgtacag tgcctttctc aaggaggtgt cgtttatgtg 60 aactaaaata taaatttcac ctttctgaga agagtaatgt acagcatgca ctgcatatgt 120 ggtgtcc 127 <210> 389 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 389 tctcaggctg tgtccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaaatgg 60 ttccctttag agtgttacgc tttgaga 87 <210> 390 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 390 tctcaagctg tgagtctaca aaggaaagcg ctttctgttg tctgaaagaa aagaaatcgc 60 ttccctttgg agtgttacgg tttgaga 87 <210> 391 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 391 ctcaggctgt gaccctctag agggaagcgc tttctgttgg ctaaaagaaa agaaagcgct 60 tcccttcaga gtgttaacgc tttgaga 87 <210> 392 <211> 101 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 392 gcaagatctc aggctgtgac cttctcgagg aaagaagcac tttctgttgt ctgaaagaaa 60 agaaagtgct tcctttcaga gggttacggt ttgagaaaag c 101 <210> 393 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 393 ggtggcccgg ccgtgcctga gg 22 <210> 394 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 394 tgggtgcgcc gggactgtga gac 23 <210> 395 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 395 ggtggcccgg ccgtgcctga gg 22 <210> 396 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 396 aaagtgcttc ctttcagagg g 21 <210> 397 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 397 ggtggcccgg ccgtgcctga gg 22 <210> 398 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 398 aaagtgcttc ctttcagagg g 21 <210> 399 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 399 gaaagcgctt cccttcagag tg 22 <210> 400 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 400 aaagtgcatc cttttagagt gt 22 <210> 401 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 401 aacgcacttc cctttagagt gt 22 <210> 402 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 402 taaatttcac ctttctgaga aga 23 <210> 403 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 403 taaatttcac ctttctgaga aga 23 <210> 404 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 404 gaaatcgctt ccctttggag t 21 <210> 405 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 405 ctccagaggg aagcgctttc tg 22 <210> 406 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 406 aaaagtaatt gtggtttttg cc 22 <210> 407 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 407 cctctagagg gaagcacttt ctg 23 <210> 408 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 408 ctccagaggg aagcgctttc tg 22 <210> 409 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 409 aaaagtaatt gcggtttttg cc 22 <210> 410 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 410 cctccagagg gaagcgcttt c 21 <210> 411 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 411 tctgcaggtc ctggtgaacg ccat 24 <210> 412 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 412 aaaagtaatt gcggtttttg cc 22 <210> 413 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 413 cctccagagg gaagcgcttt c 21 <210> 414 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 414 tgcagtgggg cttgctggct tg 22 <210> 415 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 415 tctgcaggtc ctggtgaacg ccat 24 <210> 416 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 416 tctgcaggtc ctggtgaacg ccat 24 <210> 417 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 417 ctgggaggtc aaggctgcag t 21 <210> 418 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 418 ctccagaggg aagcgctttc tg 22 <210> 419 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 419 aggcgggtcg ctgcgggacc tc 22 <210> 420 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 420 ctccagaggg aagcgctttc tg 22 <210> 421 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 421 ctccagaggg aagcgctttc tg 22 <210> 422 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 422 agccgcgggg atcgccggag g 21 <210> 423 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 423 agccgcgggg atcgccggag g 21 <210> 424 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 424 aaaagtaatt gcggtttttg cc 22 <210> 425 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 425 ctctagaggg aagcgctttc tg 22 <210> 426 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 426 ctctagaggg aagcgctttc tg 22 <210> 427 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 427 ctctacaggg aagcgctttc tg 22 <210> 428 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 428 aaaggtaatt gcagtttttc cc 22 <210> 429 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 429 ctgcaaaggg aagccctttc 20 <210> 430 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 430 aaaagtaatc gcagtttttg tc 22 <210> 431 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 431 ctctagaggg aagcgctttc tg 22 <210> 432 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 432 ctctagaggg aagcgctttc tg 22 <210> 433 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 433 ctctagaggg aagcgctttc tg 22 <210> 434 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 434 cctctagagg gaagcgcttt c 21 <210> 435 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 435 ctacaaagga aagcgctttc tg 22 <210> 436 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 436 ctctagaggg aagcgctttc tg 22 <210> 437 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 437 ctcgaggaaa gaagcacttt ctg 23 <210> 438 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 438 ctcaggctgt gacactctag agggaagcgc tttctgttgt ctgaaagaaa ggaaagtgca 60 tccttttaga gtgttactgt ttgag 85 <210> 439 <211> 97 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 439 aaacaagtta tattaggttg gtgcaaaagt aattgtggtt tttgcctgta aaagtaatgg 60 caaaaaccac agtttctttt gcaccagact aataaag 97 <210> 440 <211> 101 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 440 gcgagaagat ctcatgctgt gactctctgg agggaagcac tttctgttgt ctgaaagaaa 60 acaaagcgct tctctttaga gtgttacggt ttgagaaaag c 101 <210> 441 <211> 81 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 441 catgctgtga ccctctagag ggaagcgctt tctgttgtct gaaagaaaag aaagtgcatc 60 cttttagagg tttactgttt g 81 <210> 442 <211> 70 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 442 tggtgcaaaa gtaattgcgg tttttgccat taaaagtaat gcggccaaaa ctgcagttac 60 ttttgcaccc 70 <210> 443 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 443 tctcaggctg tgtccctcta cagggaagcg ctttctgttg tctgaaagaa aggaaagtgc 60 atccttttag agtgttactg tttgaga 87 <210> 444 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 444 tctgcaggtc ctggtgaacg ccatcatcaa cagtggtccc cgggaggact ccacacgcat 60 tgggcgcgcc gggactgtga gac 83 <210> 445 <211> 70 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 445 tggtgcaaaa gtaattgcgg tttttgccat taaaagtaat gcggccaaaa ctgcagttac 60 ttttgcaccc 70 <210> 446 <211> 61 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 446 ccctctacag ggaagcgctt tctgttgtct gaaagaaaag aaagtgcttc cttttagagg 60 g 61 <210> 447 <211> 115 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 447 ggtgccgagg gccgtccggc atcctaggcg ggtcgctgcg gtacctccct cctgtctgtg 60 gcggtgggat cccgtggccg tgttttcctg gtggcccggc cgtgcctgag gtttc 115 <210> 448 <211> 98 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 448 ctctcaccaa gcaagtgcag tggggcttgc tggcttgcac cgtgactccc tctcaccaag 60 caagtgtcgt ggggcttgct ggcttgcact gtgaagat 98 <210> 449 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 449 tctgcaggtc ctggtgaacg ccatcatcaa cagtggtccc cgggaggact ccacacgcat 60 tgggcgcgcc gggactgtga gac 83 <210> 450 <211> 83 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 450 tctgcaggtc ctggtgaacg ccatcatcaa cagtggtccc cgggaggact ccacacgcat 60 tgggcgcgcc gggactgtga gac 83 <210> 451 <211> 115 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 451 ggtgccgagg gccgtccggc atcctaggcg ggtcgctgcg gtacctccct cctgtctgtg 60 gcggtgggat cccgtggccg tgttttcctg gtggcccggc cgtgcctgag gtttc 115 <210> 452 <211> 116 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 452 tacttgggtg actaaggcag gattgcttga gcctgggagg tcaaggctgc agtgtcgtgg 60 tcacagcttg ctgcagactc gacctcccag gcttaagcaa tcctcctgct cgagtg 116 <210> 453 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 453 tctcaggctg tgtccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaaatgg 60 ttccctttag agtgttacgc tttgaga 87 <210> 454 <211> 93 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 454 ccttccggcg tcccaggcgg ggcgccgcgg gaccgccctc gtgtctgtgg cggtgggatc 60 ccgcggccgt gttttcctgg tggcccggcc atg 93 <210> 455 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 455 tctcatgctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaacgcgc 60 ttccctatag agggttaccc tttgaga 87 <210> 456 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 456 tctcagcctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaagtgc 60 atctttttag aggattacag tttgaga 87 <210> 457 <211> 180 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 457 cgcgactgcg gcggcggtgg tggggggagc cgcggggatc gccgagggcc ggtcggccgc 60 cccgggtgcc gcgcggtgcc gccggcggcg gtgaggcccc gcgcgtgtgt cccggctgcg 120 gtcggccgcg ctcgaggggt ccccgtggcg tccccttccc cgccggccgc ctttctcgcg 180 <210> 458 <211> 180 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 458 cgcgactgcg gcggcggtgg tggggggagc cgcggggatc gccgagggcc ggtcggccgc 60 cccgggtgcc gcgcggtgcc gccggcggcg gtgaggcccc gcgcgtgtgt cccggctgcg 120 gtcggccgcg ctcgaggggt ccccgtggcg tccccttccc cgccggccgc ctttctcgcg 180 <210> 459 <211> 70 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 459 tggtgcaaaa gtaattgcgg tttttgccat taaaagtaat gcggccaaaa ctgcagttac 60 ttttgcaccc 70 <210> 460 <211> 61 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 460 ccctctacag ggaagcgctt tctgttgtct gaaagaaaag aaagtgcttc cttttagagg 60 g 61 <210> 461 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 461 tctcatgctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaacgcgc 60 ttccctatag agggttaccc tttgaga 87 <210> 462 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 462 tctcagcctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaagtgc 60 atctttttag aggattacag tttgaga 87 <210> 463 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 463 tctcatgctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaacgcgc 60 ttccctatag agggttaccc tttgaga 87 <210> 464 <211> 88 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 464 gtattaggtt ggtgcaaagg taattgcagt ttttcccatt taaaatatgg aaaaaaaaat 60 cacaattact tttgcatcaa cctaataa 88 <210> 465 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 465 tctcaagctg tgactgcaaa gggaagccct ttctgttgtc taaaagaaaa gaaagtgctt 60 ccctttggtg aattacggtt tgaga 85 <210> 466 <211> 115 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 466 ggtgccgagg gccgtccggc atcctaggcg ggtcgctgcg gtacctccct cctgtctgtg 60 gcggtgggat cccgtggccg tgttttcctg gtggcccggc cgtgcctgag gtttc 115 <210> 467 <211> 61 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 467 ccctctacag ggaagcgctt tctgttgtct gaaagaaaag aaagtgcttc cttttagagg 60 g 61 <210> 468 <211> 118 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 468 tctgattctg catgtattag gttggtgcaa aagtaatcgc ggtttttgtc attgaaagta 60 atagcaaaaa ctgcaattac ttttgcacca acctaaaagt agtcactgtc ttcagata 118 <210> 469 <211> 85 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 469 ctcaggctgt gaccctctag agggaagcac tttctgttgc ttgaaagaag agaaagcgct 60 tccttttaga ggattactct ttgag 85 <210> 470 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 470 tctcagcctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaaagtgc 60 atctttttag aggattacag tttgaga 87 <210> 471 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 471 tctcgggctg tgactctcca aagggaagaa ttttctcttg tctaaaagaa aagaacgcac 60 ttccctttag agtgttaccg tgtgaga 87 <210> 472 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 472 tcccatgctg tgaccctcta gagggaagca ctttctgttg tctgaaagaa accaaagcgc 60 ttccctttgg agcgttacgg tttgaga 87 <210> 473 <211> 129 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 473 gggatgccac attcagccat tcagcgtaca gtgcctttca cagggaggtg tcatttatgt 60 gaactaaaat ataaatttca cctttctgag aagggtaatg tacagcatgc actgcatatg 120 tggtgtccc 129 <210> 474 <211> 127 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 474 ggatgccaca ttcagccatt cagtgtgcag tgcctttcac agggaggtgt catttatgtg 60 aactaaaata taaatttcac ctttctgaga agggtaatgt acagcatgca ctgcatatgt 120 ggtgtcc 127 <210> 475 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 475 tctcaggctg tgtccctcta cagggaagcg ctttctgttg tctgaaagaa aggaaagtgc 60 atccttttag agtgttactg tttgaga 87 <210> 476 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 476 tctcatgctg tgaccctaca aagggaagca ctttctcttg tccaaaggaa aagaaggcgc 60 ttccctttgg agtgttacgg tttgaga 87 <210> 477 <211> 87 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 477 tctcatgctg tgaccctcta gagggaagcg ctttctgttg tctgaaagaa aagaacgcgc 60 ttccctatag agggttaccc tttgaga 87 <210> 478 <211> 101 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 478 gcgagaagat ctcatgctgt gactctctgg agggaagcac tttctgttgt ctgaaagaaa 60 acaaagcgct tctctttaga gtgttacggt ttgagaaaag c 101 <210> 479 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 479 caaagcgctt ctctttagag tgt 23 <210> 480 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 480 aaagtgcatc cttttagagg tt 22 <210> 481 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 481 tgggcgcgcc gggactgtga gac 23 <210> 482 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 482 aaagtgcttc cttttagagg g 21 <210> 483 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 483 tgggcgcgcc gggactgtga gac 23 <210> 484 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 484 tgggcgcgcc gggactgtga gac 23 <210> 485 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 485 ctgcagactc gacctcccag gc 22 <210> 486 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 486 aaaatggttc cctttagagt gt 22 <210> 487 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 487 gaacgcgctt ccctatagag ggt 23 <210> 488 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 488 aaagtgcatc tttttagagg at 22 <210> 489 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 489 aaagtgcttc cttttagagg g 21 <210> 490 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 490 gaacgcgctt ccctatagag ggt 23 <210> 491 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 491 aaagtgcatc tttttagagg at 22 <210> 492 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 492 gaacgcgctt ccctatagag ggt 23 <210> 493 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 493 aaagtgcttc cttttagagg g 21 <210> 494 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 494 aaagtgcatc tttttagagg at 22 <210> 495 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 495 caaagcgctt ccctttggag c 21 <210> 496 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 496 gaaggcgctt ccctttggag t 21 <210> 497 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 497 gaacgcgctt ccctatagag ggt 23 <210> 498 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 498 caaagcgctt ctctttagag tgt 23 <210> 499 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 499 tctctggagg gaagcacttt ctg 23 <210> 500 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 500 ctctagaggg aagcgctttc tg 22 <210> 501 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 501 cctctacagg gaagcgcttt c 21 <210> 502 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 502 tctgcaggtc ctggtgaacg ccat 24 <210> 503 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 503 cctctacagg gaagcgcttt c 21 <210> 504 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 504 ggtggcccgg ccgtgcctga gg 22 <210> 505 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 505 tgtcgtgggg cttgctggct tg 22 <210> 506 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 506 tctgcaggtc ctggtgaacg ccat 24 <210> 507 <211> 24 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 507 tctgcaggtc ctggtgaacg ccat 24 <210> 508 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 508 ggtggcccgg ccgtgcctga gg 22 <210> 509 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 509 ctgggaggtc aaggctgcag t 21 <210> 510 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 510 ctctagaggg aagcgctttc tg 22 <210> 511 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 511 aggcggggcg ccgcgggacc gc 22 <210> 512 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 512 ctctagaggg aagcgctttc tg 22 <210> 513 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 513 ctctagaggg aagcgctttc tg 22 <210> 514 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 514 cctctacagg gaagcgcttt c 21 <210> 515 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 515 ctctagaggg aagcgctttc tg 22 <210> 516 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 516 ctctagaggg aagcgctttc tg 22 <210> 517 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 517 ctctagaggg aagcgctttc tg 22 <210> 518 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 518 aaaggtaatt gcagtttttc cc 22 <210> 519 <211> 20 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 519 ctgcaaaggg aagccctttc 20 <210> 520 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 520 ggtggcccgg ccgtgcctga gg 22 <210> 521 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 521 cctctacagg gaagcgcttt c 21 <210> 522 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 522 ctctagaggg aagcgctttc tg 22 <210> 523 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 523 ctctagaggg aagcactttc tg 22 <210> 524 <211> 21 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 524 cctctacagg gaagcgcttt c 21 <210> 525 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 525 ctacaaaggg aagcactttc tc 22 <210> 526 <211> 22 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 526 ctctagaggg aagcgctttc tg 22 <210> 527 <211> 23 <212> DNA <213> Artificial sequence <220> <223> oligonucleotide <400> 527 tctctggagg gaagcacttt ctg 23

Claims (50)

  1. 다음을 포함하는 세포 내에서 침묵 활성을 갖는 RNA 분자를 생성하는 방법:
    (a) RNA-유도 침묵 복합체(RNA-induced silencing complex, RISC)와 결합된 RNA 분자를 암호화하는 핵산서열에 대해 완전한 동일성을 포함하지 않는 미리 정해진 서열 상동성 범위를 나타내는 RNA 분자를 암호화하는 핵산 서열을 확인하는 단계;
    (b) 상기 미리 정해진 서열 상동성 범위를 나타내는 상기 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해, 상기 RNA 분자를 암호화하는 상기 핵산 서열의 전사를 결정하는 단계;
    (c) 상기 미리 정해진 서열 상동성 범위를 나타내는 상기 RNA 분자를 암호화하는 전사 가능한 핵산 서열을 선택하기 위해, 상기 미리 정해진 서열 상동성 범위를 나타내는 상기 RNA 분자를 암호화하는 상기 전사 가능한 핵산 서열의 전사체의 작은 RNA로의 가공능력(processability)을 결정하는 단계이고, 여기에서 상기 RNA 분자는 비정상적으로 가공되는 것인, 단계;
    (d) RISC와 결합하고 제 1 표적 RNA에 상보적인 작은(small) RNA로의 가공 능력을 부여하기 위해, 상기 미리 정해진 서열 상동성 범위를 나타내는 상기 비정상적으로 가공된 RNA 분자를 암호화하는 상기 전사 가능한 핵산 서열의 핵산 서열을 변경시키는 단계,
    이에 의해 세포 내에서 침묵 활성을 갖는 RNA분자를 생성하는 단계.
  2. 제 1항에 있어서, 확인된 핵산 서열에 의해 암호화되는 단계 (a)의 상기 RNA 분자가, RISC와 결합되고 및/또는 RISC와 결합된(engaged) 분자로 가공된 RNA 분자에 대해 완전한 동일성을 포함하지 않는 미리 정해진 서열 상동성 범위를 나타낸 것인, 방법.
  3. 제 1항 또는 제 2항에 있어서, 단계 (d)의 가공 능력 부여는 RNA-유도 침묵 복합체(RNA-induced silencing complex, RISC)와 결합된 RNA 분자를 암호화하는 상기 핵산 서열의 핵산 서열에 의해 암호화되는 RNA 분자에 대한 정형적인 가공을 부여하는 것을 포함하는 것인, 방법.
  4. 제 1항 내지 제 3항 중 어느 한 항에 있어서, 단계 (a)의 상기 미리 정해진 서열 상동성 범위를 나타내는 상기 RNA 분자를 암호화하는 상기 핵산 서열의 지놈 위치(genomic location)를 결정하는 단계를 추가로 포함하는 방법.
  5. 제 4항에 있어서, 상기 지놈 위치는 비 암호화 유전자(non-coding gene) 내, 선택적으로 비 암호화된 유전자의 인트론 내에 있는, 방법.
  6. 제 4항에 있어서, 상기 지놈 위치는 암호화된 유전자 내, 선택적으로 암호화된 유전자의 엑손 내, 선택적으로 암호화된 유전자의 비번역 영역(UTR)을 암호화하는 엑손 내, 또는 선택적으로 암호화하는 유전자의 인트론 내에 있는 것인, 방법.
  7. 제 1항 내지 제6항 중 어느 한 항에 있어서, 단계(b) 및/또는 단계(c)는 상기 세포의 지놈에 대한 작은(small) RNA 발현 데이터의 얼라인먼트(alignment) 및 각 지놈의 위치에 맵핑되는 리드(read)의 양을 결정하는 것에 의해 영향을 받는 것인, 방법
  8. 제7항에 있어서, 상기 작은 RNA의 상기 얼라인먼트는 불일치가 없이 상기 세포의 상기 지놈 내의 미리 정해진 위치에 대한 얼라인먼트인, 방법.
  9. 제 1항 내지 제8항 중 어느 한 항에 있어서, 상기 전사 가능한 핵산 서열의 상기 핵산 서열을 변경시키는 단계는 상기 비정상적으로 가공된 RNA 분자의 구조를 부여하고, 이는 상기 RNA 분자를 RISC와 결합된 작은 RNA로 가공하는 결과가 되는 것인, 방법
  10. 제 1항 내지 제9항 중 어느 한 항에 있어서, 상기 미리 정해진 서열 상동성 범위를 나타내는 상기 비정상적으로 가공된 RNA 분자를 암호화하는 상기 전사 가능한 핵산 서열의 상기 핵산 서열을 변경시키는 단계는 상기 제 1 표적 RNA에 대한 결합 부위에 상응하는 핵산 이외의 핵산에서 수행되는 것인, 방법.
  11. 제 1항 내지 제 10항 중 어느 한 항에 있어서, 상기 가공능력이 다이서(Dicer), 아르고노트(Argonaute), tRNA 손상 효소, 및 Piwi-상호작용 RNA(Piwi-interacting RNA, piRNA) 관련 단백질로 이루어진 군으로부터 선택된 세포 뉴클레아제에 의해 수행되는 것인, 방법.
  12. 제 1항 내지 제 11항 중 어느 한 항에 있어서, 단계(d)에서의 변경은 상기 제 1 표적 RNA에 대해 상기 비정상적으로 가공된 RNA 분자에서 침묵 활성을 재활성화하는 DNA 편집제(editing agent)를 세포 내로 도입하여 세포내에서 침묵 활성을 갖는 RNA 분자를 생성하는 것을 포함하는 것인, 방법.
  13. 제 1항 내지 제 12항 중 어느 한 항에 있어서, 세포 내 침묵 활성을 갖는 상기 RNA 분자의 특이성을 변경시키는 단계를 추가로 포함하고, 여기에서 상기 DNA 편집제는 상기 RNA 분자의 침묵 특이성을 관심 표적 RNA(target RNA of interest)에 적용시키며, 상기 관심 표적 RNA는 상기 첫번째 표적 RNA와는 구별되어, 상기 세포 내 상기 침묵 활성을 갖는 상기 RNA 분자의 상기 특이성을 변형시키는 것인, 방법.
  14. 제 1항 내지 제 13항 중 어느 한 항에 있어서, 단계(a)의 RNA 분자를 암호화하는 확인된 핵산 서열이 침묵 활성 및/또는 small 침묵 RNA로의 가공하는이 그것의 2차 구조에 의존하는 침묵 RNA 분자를 암호화하는 유전자와 상동인 것인, 방법.
  15. 제 14항에 있어서, 침묵 활성 및 또는 small 침묵 RNA로의 가공이 2차 구조에 의존적인 silencing RNA 분자는 다음으로 이루어진 군으로부터 선택되는 것인, 방법: 마이크로RNA(microRNA, miRNA), 짧은-헤어핀 RNA(short-hairpin RNA, shRNA), 소형 핵 RNA(small nuclear RNA, snRNA or U-RNA), 소형 핵소체 RNA(small nucleolar RNA, snoRNA), 소형 카잘체 RNA(Small Cajal body RNA, scaRNA), 운반 RNA(transfer RNA, tRNA), 리보솜 RNA(ribosomal RNA, rRNA), 반복-유래 RNA(repeat-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 인자-유래 RNA(autonomous and non-autonomous transposable and retro-transposable element-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 인자 RNA (autonomous and non-autonomous transposable and retro-transposable element RNA) 및 긴 비-암호화 RNA(long non-coding RNA, lncRNA) .
  16. RNA 분자를 RISC와 결합된 작은(small) RNA로 가공하는 결과가 되는, 핵산 서열 변경을 갖는 RNA 분자를 암호화하는 폴리뉴클레오타이드 서열을 포함하는 지놈을 포함하는 유전적으로 변형된 세포로서, 상기 RNA 분자의 상기 가공은 상기 핵산 서열 변경이 없는 동일한 기원의 야생형 세포(wild type cell)에는 존재하는 않는 것인, 유전적으로 변형된 세포.
  17. 제 16항에 있어서, 상기 가공은 정형적인(canonical) 가공인, 유전적으로 변형된 식물체.
  18. 제 16항 또는 제 17항에 있어서, 상기 RNA 분자는 침묵 활성을 갖는, 유전적으로 변형된 세포.
  19. 제 1항 내지 제 13항 중 어느 한 항, 또는 제 16항 내지 제 18항 중 어느 한 항에 있어서, 상기 RNA 분자는 마이크로RNA(microRNA, miRNA), 소형 간섭 RNA(small interfering RNA, siRNA), 짧은-헤어핀 RNA(short-hairpin RNA, shRNA), Piwi-상호작용 RNA(Piwi-interacting RNA, piRNA), 단계적 짧은 간섭 RNA(phased small interfering RNA, phasiRNA), 트랜스-작용 siRNA(trans-acting siRNA, tasiRNA), 운반 RNA 단편(transfer RNA fragment, tRF), 소형 핵 RNA(small nuclear RNA, snRNA), 전이성 및/또는 레트로-전이성 유래 RNA(transposable and/or retro-transpossable derived RNA), 자율 및 비-자율 전이성 및/또는 레트로-전이성 RNA(autonomous and non-autonomous transposable and/or retro-transpossable RNA)으로 이루어진 군으로부터 선택된 것인, 제 1항 내지 제 13항 중 어느 한 항 의 방법, 또는 제 16항 내지 제 18항 중 어느 한 항의 유전적으로 변형된 세포.
  20. 제 1항 내지 제 15항 또는 제 19항 중 어느 한 항에 있어서, 상기 방법은 세포 공여자 올리고뉴클레오타이드로 도입하는 단계를 추가로 포함하는 것인, 방법.
  21. 제 12항 내지 제 15항, 제 19항 또는 제 20항 중 어느 한 항에 있어서, 상기 DNA 편집제(DNA editing agent)는 적어도 하나의 sgRNA를 포함하는 것인, 방법.
  22. 제 12항 내지 제 15항, 제 19항 내지 제 20항 또는 제 21항 중 어느 한 항에 있어서, 상기 DNA 편집제는 엔도뉴클레아제를 포함하지 않는 것인, 방법.
  23. 제 12항 내지 제 15항, 제 19항 내지 제 20항 또는 제 21항 중 어느 한 항에 있어서, 상기 DNA 편집제는 엔도뉴클레아제를 포함하는 것인, 방법.
  24. 제 12항 내지 제 15항 또는 제 19항 내지 제 23항 중 어느 한 항에 있어서, 상기 DNA 편집제는 메가뉴클레아제(meganuclease), zinc finger 뉴클레아제(zinc finger nucleases (ZFN)), 전사-활성 유사 이펙터 뉴클레아제(transcription-activator like effector nuclease, TALEN), CRISPR-엔도뉴클레아제(CRISPR-endonuclease), dCRISRP-엔도뉴클레아제(dCRISPR-endonuclease), 및 호밍 엔도뉴클레아제(homing endonuclease)로 이루어진 군으로부터 선택된 DNA 편집 시스템의 것인, 방법.
  25. 제 23항 또는 제 24항에 있어서, 상기 엔도뉴클레아제는 Cas9을 포함하는 것인, 방법.
  26. 제 12항 내지 제 15항 또는 제 19항 내지 제 25항 중 어느 한 항에 있어서, 상기 DNA 편집제는 DNA, RNA 또는 RNP로서 세포에 적용되는 것인, 방법.
  27. 제 13항 내지 제 15항 또는 제 19항 내지 제 26항 중 어느 한 항에 있어서, 상기 관심 표적 RNA는 상기 세포에 대해 내인성 또는 외인성인 것인, 방법.
  28. 제 13항 내지 제 15항 또는 제 19항 내지 제 27항 중 어느 한 항에 있어서, 상기 RNA 분자의 상기 특이성이 세포 크기, 성장률/억제, 세포 모양, 세포막 완전성, 종양 크기, 종양 형태, 유기체(organism)의 색소 침착, 유기체 크기, 작물 수확량, 대사 프로필(metabolic profile), 과실 특성, 생물학적 스트레스 저항성, 비생물학적 스트레스 저항성, 감염 매개변수 및 염증 매개변수로 이루어진 군으로부터 선택된 적어도 하나의 표현형의 결정에 의해 표현형적으로(phenotypically) 결정되는 것인, 방법.
  29. 제 13항 내지 제 15항 또는 제 19항 내지 제 28항 중 어느 한 항, 또는 제 16항 내지 제 18항 또는 제 19항 중 어느 한 항에 있어서, 상기 세포는 진핵 세포인 것인, 제 13항 내지 제 15항 또는 제 19항 내지 제 28항 중 어느 한 항의 방법, 또는 제 16항 내지 제 18항 또는 제 19항 중 어느 한 항의 유전적으로 변형된 세포.
  30. 제 29항에 있어서, 상기 진핵 세포가 식물, 포유동물, 무척추동물, 곤충, 선충류, 조류(bird), 파충류, 어류, 갑각류, 진균류 및 조류(algae)로 이루어진 군으로부터 선택된 진핵 유기체로부터 얻어진 것인, 방법 또는 유전적으로 변형된 세포.
  31. 제 29항에 있어서, 진핵 세포가 식물 세포인 것인, 방법 또는 유전적으로 변형된 세포.
  32. 제 31항에 있어서, 식물세포가 원형질체인 것인, 방법 또는 유전적으로 변형된 세포.
  33. 제 1항 내지 제 15항 또는 제 19항 내지 제 32항 중 어느 한 항의 방법에 따라 생성된 식물 세포.
  34. 제 33항의 식물 세포를 포함하는 식물체.
  35. 제 34항에 있어서, 상기 식물체는 비형질전환(non-transgenic)인, 식물체.
  36. 다음을 포함하는 표적 유전자의 발현이 감소된 식물체를 생산하는 방법:
    (a) 제 34항 또는 제 35항의 식물체를 육종하는 단계; 및
    (b) 상기 관심 표적 RNA의 발현이 감소된 자손 식물체, 또는 상기 관심 표적 RNA에 대해 상기 RNA 분자의 침묵 특이성을 포함하고, 및 상기 DNA 편집제를 포함하지 않는 자손 식물체를 선택하는 단계,
    이로써 표적 유전자의 발현이 감소된 상기 식물체를 생산하는 단계.
  37. 다음을 포함하는 관심 표적 RNA에 대한 침묵 활성을 갖는 RNA 분자를 포함하는 식물체를 생산하는 방법:
    (a) 제 34항 또는 제 35항의 식물체를 육종하는 단계; 및
    (b) 상기 관심 표적 RNA에 대한 상기 침묵 활성을 갖는 상기 RNA 분자를 포함하는 자손 식물체, 또는 상기 관심 표적 RNA에 대한 침묵 특이성을 포함하고, 및 상기 DNA 편집제를 포함하지 않는 자손 식물체를 선택하는 단계,
    이로써 관심 표적 RNA에 대한 침묵 활성을 갖는 RNA 분자를 포함하는 식물체를 생산하는 단계.
  38. 제 34항 또는 제 35항의 식물체 또는 식물 세포를 생산하는 방법으로서, 번식을 허용하는 조건 하에 상기 식물체 또는 식물 세포를 성장시키는 단계를 포함하는 식물체 또는 식물 세포를 생산하는 방법.
  39. 제 36항 또는 제 37항에 있어서, 상기 육종은 교배 또는 자가 번식을 포함하는 것인, 방법.
  40. 제 34항 또는제 35항 중 어느 한 항의 식물체의 종자, 또는 제 36항 내지 제 39항 중 어느 한 항에 의해 생산된 식물체의 종자.
  41. 제 29항에 있어서, 상기 진핵 세포는 인간 세포인 것인, 방법 또는 유전적으로 변형된 세포.
  42. 제 41항에 있어서, RNA 분자를 암호화하는 상기 핵산 서열은 서열번호 352 내지 392 중 어느 하나에 명시된 핵산 서열로 이루어진 군으로부터 선택된 것인, 방법 또는 유전적으로 변형된 세포.
  43. 제 41항 또는 제 42항에 있어서, 상기 진핵 세포는 전형성능 줄기 세포인 것인, 방법 또는 유전적으로 변형된 세포.
  44. 제 1항 내지 제 15항, 제 19항 내지 제 32항 또는 제 41항 내지 제 43항 중 어느 한 항의 방법에 따라 침묵 활성 및/또는 특이성을 갖는 RNA 분자를 생성하는 단계를 포함하고, 상기 RNA 분자는 질병의 발병 또는 진행과 관련된 유전자의 전사체에 대한 침묵 활성을 포함하며, 이에 의해 대상(subject)를 치료하는 것인, 이를 필요로 하는 대상에서 질병을 치료하는 방법.
  45. 다음을 포함하는 세포 내 제 1 RNA 분자에 침묵 활성을 도입하는 방법:
    (a) 상기 세포 내에서 제 1 핵산 서열을 선택하는 단계, 여기에서:
    i. 상기 제 1 핵산 서열은 세포 내에서 상기 제 1 RNA 분자로 전사 되고;
    ii. 상기 제 1 분자의 서열은 서열 동일성을 제외하고, 제 2 RNA 분자의 서열과 부분적으로 상동성을 가지며; 여기에서 상기 제 2 RNA 분자는 침묵 활성을 갖는 제 3 RNA 분자로 가공할 수 있고; 및 여기에서 상기 제 2 RNA 분자는 상기 세포 내 제 2 핵산 서열에 의해 암호화되며; 및
    iii. 상기 제 1 RNA 분자는 가공할 수 없거나, 또는 제 2 RNA 분자와 다르게 가공할 수 있어, 제 1 RNA 분자는 제 3 RNA 분자와 동일한 성질의 침묵 활성을 갖는 RNA 분자로 가공되지 않고;
    (b) 변경된 제 1 RNA 분자를 암호화하도록 제 1 핵산서열을 변형시키는 단계; 상기 변경된 제 1 RNA 분자를 상기 제 2 RNA 분자가 제 3 RNA 분자로 가공될 수 있는 동일한 방식으로 제 4 RNA로 가공할 수 있는 것으로, 제 4 RNA 분자는 제 3 RNA 분자와 동일한 성질의 침묵 활성을 가지며,
    이로써, 제 1 분자에 침묵 활성을 도입하는 단계.
  46. 제 45항에 있어서, 상기 제 2 분자는 침묵 활성을 갖는 RNA로 가공될 수 있도록 하는 2차 구조를 갖는 RNA 분자이고, 선택적으로 상기 침묵 활성은 RISC와의 결합을 통해 매개되는 것인, 방법.
  47. 제 46항에 있어서, 침묵 활성을 갖는 RNA 로 처리될 수 있는 2차 구조를 갖는 상기 RNA 분자는 다음으로 구성되는 군으로부터 선택되는 것인, 방법: 마이크로 RNA(microRNA, miRNA), 짧은-헤어핀 RNA(short-hairpin RNA, shRNA), 소형 핵 RNA(small nuclear RNA, snRNA or URNA), 소형 핵소체 RNA(small nucleolar RNA, snoRNA), 소형 카잘체 RNA(Small Cajal body RNA, scaRNA), 운반 RNA(transfer RNA, tRNA), 리보솜 RNA(ribosomal RNA, rRNA), 반복-유래 RNA(repeat-derived RNA), 자율 및 비-자율 전이성 및 레트로-전이성 인자-유래 RNA(autonomous and non-autonomous transposable and retro-transposable element-derived RNA), 자율 및 비-자율 전이성 및 레트로 전이성 인자 RNA(autonomous and non-autonomous transposable and retro-transposable element RNA) 및 긴 비-암호화 RNA(long non-coding RNA, lncRNA).
  48. 제 46항에 있어서, 상기 제 1 서열은 변형된 제 1 RNA 분자가 제 4 RNA 분자로 가공될 수 있도록 하는 2차 구조의 결과가 되는 것인, 방법.
  49. 제 48항에 있어서, 상기 제 1 핵산 서열을 변경시키는 단계는 변형된 제 1 RNA 분자가 본질적으로 제 2 RNA 분자와 동일한 2차 구조, 선택적으로 제 2 RNA 분자의 2차 구조와 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9% 또는 100% 동일한 2차 구조를 갖도록 서열을 변형시키는 것을 포함하는 것인, 방법.
  50. 제 45항에 있어서, 상기 제 1 핵산 분자는 인간(H.sapiens)로부터의 유전자이고, 여기에서 유전자는 서열 번호 352 내지 392 중 어느 하나에 언급된 서열을 갖는 유전자로 이루어진 군으로부터 선택된 것인, 방법.
KR1020217033294A 2019-03-14 2020-03-12 기능장애 RNA(dysfunctional RNA) 분자에 침묵 활성(silencing activity) 도입 및 관심 유전자에 대한 특이성(specificity) 변형 KR20210148187A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1903519.5A GB201903519D0 (en) 2019-03-14 2019-03-14 Introducing silencing activity to dysfunctional rna molecules and modifying their specificity against a gene of interest
GB1903519.5 2019-03-14
PCT/IB2020/052248 WO2020183419A1 (en) 2019-03-14 2020-03-12 Introducing silencing activity to dysfunctional rna molecules and modifying their specificity against a gene of interest

Publications (1)

Publication Number Publication Date
KR20210148187A true KR20210148187A (ko) 2021-12-07

Family

ID=66381105

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217033294A KR20210148187A (ko) 2019-03-14 2020-03-12 기능장애 RNA(dysfunctional RNA) 분자에 침묵 활성(silencing activity) 도입 및 관심 유전자에 대한 특이성(specificity) 변형

Country Status (12)

Country Link
US (1) US20220154187A1 (ko)
EP (1) EP3938512A1 (ko)
JP (1) JP2022524866A (ko)
KR (1) KR20210148187A (ko)
CN (1) CN113906138A (ko)
AU (1) AU2020237667A1 (ko)
BR (1) BR112021018159A2 (ko)
CA (1) CA3133198A1 (ko)
GB (1) GB201903519D0 (ko)
IL (1) IL286380A (ko)
SG (1) SG11202109469VA (ko)
WO (1) WO2020183419A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3191387A1 (en) 2020-09-30 2022-04-07 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
CN113430194B (zh) * 2020-11-30 2023-04-07 东北林业大学 一种基于CRISPR/Cas9的白桦基因编辑方法
GB202103256D0 (en) 2021-03-09 2021-04-21 Tropic Biosciences Uk Ltd Method for silencing genes
EP4330400A1 (en) * 2021-04-26 2024-03-06 Gordian Biotechnology, Inc. Compositions and methods for in vivo screening of therapeutics
CN113502351B (zh) * 2021-06-29 2023-11-21 中国人民解放军疾病预防控制中心 一种crRNA及用于CRISPR-Cas12a检测人腺病毒核酸的方法
GB202112865D0 (en) 2021-09-09 2021-10-27 Tropic Biosciences Uk Ltd Resistance to black sigatoka disease in banana
GB202112866D0 (en) 2021-09-09 2021-10-27 Tropic Biosciences Uk Ltd Resistance to fusarium wilt in a banana
CN115029378B (zh) * 2022-06-23 2023-09-15 河北北方学院 一种利用PtrDJ1C基因创制花斑观赏杨树的方法
CN115250913B (zh) * 2022-07-25 2023-06-20 三峡大学 一种盐肤木体细胞胚胎发生与植株再生方法
GB202305021D0 (en) 2023-04-04 2023-05-17 Tropic Biosciences Uk Ltd Methods for generating breaks in a genome
CN116640196B (zh) * 2023-05-10 2024-02-06 山东农业大学 囊泡相关膜蛋白的相关蛋白vap1在抗马铃薯y病毒中的应用

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154600B (nl) 1971-02-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen.
NL154598B (nl) 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
NL154599B (nl) 1970-12-28 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen, alsmede testverpakking.
US3901654A (en) 1971-06-21 1975-08-26 Biological Developments Receptor assays of biologically active compounds employing biologically specific receptors
US3853987A (en) 1971-09-01 1974-12-10 W Dreyer Immunological reagent and radioimmuno assay
US3867517A (en) 1971-12-21 1975-02-18 Abbott Lab Direct radioimmunoassay for antigens and their antibodies
NL171930C (nl) 1972-05-11 1983-06-01 Akzo Nv Werkwijze voor het aantonen en bepalen van haptenen, alsmede testverpakkingen.
US3850578A (en) 1973-03-12 1974-11-26 H Mcconnell Process for assaying for biologically active molecules
US3935074A (en) 1973-12-17 1976-01-27 Syva Company Antibody steric hindrance immunoassay with two antibodies
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4034074A (en) 1974-09-19 1977-07-05 The Board Of Trustees Of Leland Stanford Junior University Universal reagent 2-site immunoradiometric assay using labelled anti (IgG)
US3984533A (en) 1975-11-13 1976-10-05 General Electric Company Electrophoretic method of detecting antigen-antibody reaction
US4098876A (en) 1976-10-26 1978-07-04 Corning Glass Works Reverse sandwich immunoassay
US4879219A (en) 1980-09-19 1989-11-07 General Hospital Corporation Immunoassay utilizing monoclonal high affinity IgM antibodies
CA1192510A (en) 1981-05-27 1985-08-27 Lawrence E. Pelcher Rna plant virus vector or portion thereof, a method of construction thereof, and a method of producing a gene derived product therefrom
JPS6054684A (ja) 1983-09-05 1985-03-29 Teijin Ltd 新規dνa及びハイブリツドdνa
US5011771A (en) 1984-04-12 1991-04-30 The General Hospital Corporation Multiepitopic immunometric assay
US4666828A (en) 1984-08-15 1987-05-19 The General Hospital Corporation Test for Huntington's disease
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
CA1288073C (en) 1985-03-07 1991-08-27 Paul G. Ahlquist Rna transformation vector
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4801531A (en) 1985-04-17 1989-01-31 Biotechnology Research Partners, Ltd. Apo AI/CIII genomic polymorphisms predictive of atherosclerosis
DE122007000007I1 (de) 1986-04-09 2007-05-16 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
GB8608850D0 (en) 1986-04-11 1986-05-14 Diatech Ltd Packaging system
JPS6314693A (ja) 1986-07-04 1988-01-21 Sumitomo Chem Co Ltd 植物ウイルスrnaベクタ−
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
EP0270496B1 (de) 1986-12-05 1993-03-17 Ciba-Geigy Ag Verbessertes Verfahren zur Transformation von pflanzlichen Protoplasten
ES2060646T3 (es) 1987-02-09 1994-12-01 Lubrizol Genetics Inc Virus rna hibrido.
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5693507A (en) 1988-09-26 1997-12-02 Auburn University Genetic engineering of plant chloroplasts
US5272057A (en) 1988-10-14 1993-12-21 Georgetown University Method of detecting a predisposition to cancer by the use of restriction fragment length polymorphism of the gene for human poly (ADP-ribose) polymerase
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5464764A (en) 1989-08-22 1995-11-07 University Of Utah Research Foundation Positive-negative selection methods and vectors
US5192659A (en) 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5486359A (en) 1990-11-16 1996-01-23 Osiris Therapeutics, Inc. Human mesenchymal stem cells
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
ATE398679T1 (de) 1992-07-07 2008-07-15 Japan Tobacco Inc Verfahren zur transformation einer monokotyledon pflanze
US5281521A (en) 1992-07-20 1994-01-25 The Trustees Of The University Of Pennsylvania Modified avidin-biotin technique
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
JP5697297B2 (ja) * 2004-05-14 2015-04-08 ロゼッタ ジノミクス リミテッド マイクロnasおよびその使用
US20060236427A1 (en) * 2004-09-20 2006-10-19 North Carolina State University MicroRNAs (miRNAs) for plant growth and development
WO2006040763A2 (en) 2004-10-12 2006-04-20 Technion Research & Development Foundation Ltd. Isolated primate embryonic cells and methods of generating and using same
WO2007047859A2 (en) 2005-10-18 2007-04-26 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and dna-binding affinity
WO2007048628A2 (en) * 2005-10-28 2007-05-03 Max Planck Gesellschaft Structures of active guide rna molecules and method of selection
BRPI0814244B1 (pt) 2007-06-07 2018-10-09 Agriculture And Agri Food Canada método para obtenção de uma planta geneticamente engenheirada
AU2008308486B2 (en) 2007-10-05 2014-08-07 Corteva Agriscience Llc Methods for transferring molecular substances into plant cells
EP2292176B1 (en) 2009-09-07 2019-01-09 Nobel Biocare Services AG Implantation set
US9518260B2 (en) 2012-02-29 2016-12-13 Benitec Biopharma Limited Pain treatment
JP2016507514A (ja) 2013-01-08 2016-03-10 ベニテック バイオファーマ リミテッド 加齢黄斑変性の処置
LT3036327T (lt) 2013-08-22 2019-06-25 Pioneer Hi-Bred International, Inc. Genomo modifikacijos, panaudojant nukreipiančias polinukleotido/cas endonukleazės sistemas, ir panaudojimo būdai
CA2969619A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
WO2016100333A1 (en) * 2014-12-15 2016-06-23 Syngenta Participations Ag Pesticidal microrna carriers and use thereof
KR20230050424A (ko) * 2017-09-19 2023-04-14 트로픽 바이오사이언시즈 유케이 리미티드 유전자 발현을 침묵시키기 위한 식물의 비-암호화 rna 분자의 특이성 변형

Also Published As

Publication number Publication date
SG11202109469VA (en) 2021-09-29
AU2020237667A1 (en) 2021-09-30
CN113906138A (zh) 2022-01-07
WO2020183419A1 (en) 2020-09-17
IL286380A (en) 2021-10-31
GB201903519D0 (en) 2019-05-01
EP3938512A1 (en) 2022-01-19
CA3133198A1 (en) 2020-09-17
US20220154187A1 (en) 2022-05-19
BR112021018159A2 (pt) 2022-01-18
JP2022524866A (ja) 2022-05-10

Similar Documents

Publication Publication Date Title
KR20210148187A (ko) 기능장애 RNA(dysfunctional RNA) 분자에 침묵 활성(silencing activity) 도입 및 관심 유전자에 대한 특이성(specificity) 변형
US11555199B2 (en) Modifying the specificity of plant non-coding RNA molecules for silencing gene expression
JP7280312B2 (ja) 新規crispr酵素及び系
US20220186219A1 (en) Modifying the specificity of non-coding rna molecules for silencing genes in eukaryotic cells
US20220220494A1 (en) PRODUCTION OF dsRNA IN PLANT CELLS FOR PEST PROTECTION VIA GENE SILENCING
JP2024519600A (ja) 遺伝子のサイレンシング法
US20230374447A1 (en) Dicer-like knock-out plant cells