KR20210045360A - 가이드 rna 설계 및 사용을 위한 방법 및 시스템 - Google Patents

가이드 rna 설계 및 사용을 위한 방법 및 시스템 Download PDF

Info

Publication number
KR20210045360A
KR20210045360A KR1020207036117A KR20207036117A KR20210045360A KR 20210045360 A KR20210045360 A KR 20210045360A KR 1020207036117 A KR1020207036117 A KR 1020207036117A KR 20207036117 A KR20207036117 A KR 20207036117A KR 20210045360 A KR20210045360 A KR 20210045360A
Authority
KR
South Korea
Prior art keywords
grna
grnas
interest
target
gene
Prior art date
Application number
KR1020207036117A
Other languages
English (en)
Inventor
리차드 스토너
트래비스 모리스
데이빗 코난트
Original Assignee
신테고 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신테고 코포레이션 filed Critical 신테고 코포레이션
Publication of KR20210045360A publication Critical patent/KR20210045360A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/53Methods for regulating/modulating their activity reducing unwanted side-effects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 개시내용은 관심 게놈 영역을 혼성화하기 위한 가이드 RNA 세트를 설계하는 방법을 제공한다. 본 개시내용은 적어도 하나의 가이드 RNA 세트로 적어도 하나의 관심 게놈 영역을 편집하는 방법을 추가로 제공한다.

Description

가이드 RNA 설계 및 사용을 위한 방법 및 시스템
관련 출원에 대한 상호 참조
본 출원은 2018년 5월 16일에 출원된 미국 가출원 번호 62/672,437의 이익을 주장하며, 이는 본원에 참조로 포함된다.
배경기술
특정 DNA 서열을 표적화하고 조작하도록 설계된 가공된 뉴클레아제 기술은 세포 및 전체 유기체의 유전자 조작, 표적화된 유전자 결실, 대체 및 복구, 외인성 서열(트랜스진)의 게놈으로의 삽입을 포함한 다수의 상이한 적용에 유용한 기술로 빠르게 채택되고 있다. 게놈 편집 기술의 예는 징크 핑거, 전사 활성화제-유사 이펙터(TALE) 및 클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복부(CRISPR)/CRISPR 연관된(Cas)("CRISPR/Cas") 시스템을 포함한다.
CRISPR/Cas 시스템은 다수의 상이한 유기체에서 유전자 편집 도구로 사용되어 표적 부위에서 파손을 생성하고 이후 유전자좌에 돌연변이를 도입할 수 있다. 유전자 편집 프로세스에는 2개의 주요 성분이 요구될 수 있다: Cas 효소와 같은 엔도뉴클레아제 및 특정 DNA 표적 서열을 인식하기 위한 짧은 RNA 분자. CRISPR/Cas 시스템은, 모든 DNA 표적에 대해 뉴클레아제 효소를 조작하는 대신, 맞춤형 짧은 RNA 분자에 의존하여 Cas 효소를 새로운 DNA 표적 부위로 모집할 수 있다. Cas 효소의 예는 Cas9 및 Cpf1을 포함한다.
CRISPR/Cas 시스템은 게놈 편집 및 전사 조절을 위해 원핵생물 및 진핵생물 시스템에서 사용될 수 있다. 경우에 따라, CRISPR/Cas 시스템은 상이한 유전자 표적에 걸쳐 원치 않는 오프-표적 게놈 편집 및 다양한 편집 효율을 제공할 수 있다.
요약
본 개시내용은 CRISPR/Cas 매개된 유전자 조작을 위해 각각의 표적 올리고뉴클레오티드 서열을 인식하는 하나 이상의 올리고뉴클레오티드(예컨대, RNA 분자)를 설계하는 것과 관련된 기술을 기재하며, 보다 구체적으로, 본 개시내용은 오프-표적 게놈 편집을 최소화하고 편집 효율을 개선하기 위해 관심 종의 전체 게놈에 걸쳐 오프-표적 값을 결정하는 방법을 기재한다. 본 개시내용은 이러한 올리고뉴클레오티드의 설계 및 검증을 수행하기 위한 소프트웨어 및 하드웨어 구성을 기재한다.
특정 실시양태에서, 게놈 내의 관심 게놈 영역에 혼성화 가능한 가이드 RNA(gRNA) 세트를 확인하는 방법으로서, gRNA 세트를 설계하는 단계로서, 여기서 gRNA 세트 내의 각각의 gRNA는 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 복수의 표적 부위 내의 상이한 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 복수의 표적 부위로부터의 표적 부위에 혼성화 가능한 것인 단계를 포함하는 방법이 본원에 기재된다. 일부 실시양태에서, 표적 부위는 상이한 표적 부위로부터 최대 170개의 염기가 떨어져 있다.
일부 실시양태에서, gRNA 세트 내의 적어도 하나의 gRNA의 서열은 관심 게놈 영역에 상보적이다. 일부 실시양태에서, gRNA 세트 내의 적어도 하나의 gRNA의 서열은 관심 게놈 영역에 부분적으로 상보적이다. 일부 실시양태에서, 관심 게놈 영역에 부분적으로 상보적인 gRNA 세트 내의 적어도 하나의 gRNA의 서열은 관심 게놈 영역에 대해 1, 2, 3, 4, 5개, 또는 5개 초과의 미스매치를 포함한다. 일부 실시양태에서, gRNA 세트 내의 각각의 gRNA의 길이는 약 17 내지 약 42개 염기이다. 일부 실시양태에서, gRNA 세트 내의 각각의 gRNA의 길이는 약 20개 염기이다. 일부 실시양태에서, gRNA 세트 내의 각각의 gRNA는 약 20개 염기의 가이드 서열을 포함하고 약 22 내지 약 80개 염기 길이의 불변 영역을 추가로 포함한다. 일부 실시양태에서, gRNA 세트 내의 각각의 gRNA의 가이드 서열은 관심 게놈 영역에 선택적으로 혼성화한다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 100개 염기이다.
일부 실시양태에서, 관심 게놈 영역은 유전자의 코딩 영역을 포함한다. 일부 실시양태에서, 관심 게놈 영역은 유전자의 엑손을 포함한다. 일부 실시양태에서, 관심 게놈 영역은 유전자 패밀리를 포함한다. 일부 실시양태에서, 관심 게놈 영역은 유전자 패밀리로부터의 하나 이상의 코딩 영역을 포함한다. 일부 실시양태에서, 관심 게놈 영역은 게놈의 비코딩 영역을 포함한다. 일부 실시양태에서, 비코딩 영역은 조절 요소이다. 일부 실시양태에서, 조절 요소는 시스-조절 요소 또는 트랜스-조절 요소이다. 일부 실시양태에서, 시스-조절 요소는 프로모터, 인핸서 및 사일런서로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 관심 게놈 영역은 5 kb를 초과하는, 10 kb를 초과하는, 15 kb를 초과하는, 20 kb를 초과하는, 50 kb를 초과하는, 또는 100 kb를 초과하는 범위이다. 일부 실시양태에서, gRNA 세트는 적어도 1, 적어도 2, 적어도 3, 또는 적어도 4개의 gRNA를 포함한다. 일부 실시양태에서, 가이드 RNA 세트로부터의 적어도 하나의 gRNA는 변형을 포함한다. 일부 실시양태에서, 변형은 2-'-O-Cl-알킬, 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-메톡시에틸(2'-MOE), 2'-플루오로(2'-F), 2'-아미노(2'-NH2), 2'-아라비노실(2'-아라비노) 뉴클레오티드, 2'-F-아라비노실(2'-F-아라비노) 뉴클레오티드, 2'-잠금 핵산(LNA) 뉴클레오티드, 2'-잠금해제 핵산(ULNA) 뉴클레오티드, L형의 슈가(L-슈가), 및 4'-티오리보실 뉴클레오티드로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 변형은 포스포로티오에이트, 포스포노카르복실레이트, 티오포스포노카르복실레이트, 알킬포스포네이트, 및 포스포로디티오에이트로 이루어진 군으로부터 선택되는 뉴클레오티드간 연결 변형이다. 일부 실시양태에서, 변형은 2-티오우라실(2-티오U), 2-티오시토신(2-티오C), 4-티오우라실(4-티오U), 6-티오구아닌(6-티오G), 2-아미노아데닌(2-아미노A), 2-아미노퓨린, 슈도우라실, 히포크산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신(5-메틸C), 5-메틸우라실(5-메틸U), 5-히드록시메틸시토신, 5-히드록시메틸우라실, 5,6-데히드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실(5-알릴U), 5-알릴시토신(5-알릴C), 5-아미노알릴우라실(5-아미노알릴U), 5-아미노알릴-시토신(5-아미노알릴C), 무염기 뉴클레오티드, Z 염기, P 염기, 비구조화 핵산(UNA), 이소구아닌(이소G), 이소시토신(이소C), 및 5-메틸-2-피리미딘으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 복수의 표적 부위의 표적 부위는 Cas9, C2c1, C2c3 및 Cpf1로 이루어진 군으로부터 선택되는 뉴클레아제에 대한 PAM 부위에 인접해 있다. 일부 실시양태에서, 뉴클레아제는 Cas9이다. 일부 실시양태에서, 뉴클레아제는 불활성화된 Cas9이다. 일부 실시양태에서, gRNA 세트는 세포에서 관심 게놈 영역 내의 유전자를 녹아웃하도록 설계된다. 일부 실시양태에서, 세포는 인간 1차 세포, 인간 불멸화 세포, 인간 유도 만능 줄기 세포, 마우스 배아 줄기 세포 및 차이니즈 햄스터 난소 세포로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 설계는 컴퓨터에 의해 수행된다. 일부 실시양태에서, 가이드 RNA(gRNA) 세트 내의 각각의 gRNA가 본원에 기재된 임의의 방법에 의해 설계되는 gRNA 세트를 포함하는 키트가 본원에 기재된다.
특정 실시양태에서, 게놈 내의 관심 게놈 영역에 혼성화 가능한 gRNA 세트를 포함하는 키트로서, 여기서 gRNA 세트 내의 각각의 gRNA는 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 복수의 표적 부위 내의 상이한 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 복수의 표적 부위로부터의 표적 부위에 혼성화될 수 있는 것인 키트가 본원에 기재된다. 일부 실시양태에서, 표적 부위는 상이한 표적 부위로부터 최대 170개의 염기가 떨어져 있다. 일부 실시양태에서, gRNA 세트는 적어도 2개, 적어도 3개, 또는 적어도 4개의 gRNA를 포함한다. 일부 실시양태에서, 키트는 Cas9, C2c1, C2c3 및 Cpf1로 이루어진 군으로부터 선택되는 하나 이상의 뉴클레아제를 추가로 포함한다. 일부 실시양태에서, 키트는 복수의 gRNA 세트를 추가로 포함하고, 각각의 gRNA 세트는 게놈 내의 상이한 관심 게놈 영역에 혼성화될 수 있다. 일부 실시양태에서, 하나 이상의 뉴클레아제는 적어도 하나의 gRNA에 커플링된다.
특정 실시양태에서, 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 선택하는 방법으로서, 유전자에 혼성화하는 초기 가이드 RNA 세트의 복수의 가이드 RNA 각각에 대해, 게놈 내의 잠재적인 가이드 RNA 혼성화 부위에 대한 미스매치의 수를 열거함으로써 오프-표적 값을 계산하는 단계를 포함하는 방법이 본원에 기재된다. 일부 실시양태에서, 복수의 gRNA 내의 각각의 gRNA의 길이는 100개 염기이다. 일부 실시양태에서, 복수의 gRNA 내의 각각의 gRNA의 약 20개 염기는 관심 게놈 영역 내의 상이한 표적 부위에 혼성화한다. 일부 실시양태에서, 미스매치의 수는 0이다. 일부 실시양태에서, 미스매치의 수는 1이다. 일부 실시양태에서, 미스매치의 수는 2이다. 일부 실시양태에서, 미스매치의 수는 3이다. 일부 실시양태에서, 계산은 초기 가이드 RNA 세트의 각각의 gRNA에 대한 미스매치 수의 총합을 열거한다. 일부 실시양태에서, 계산은 미스매치의 수를 샤드(shard)로 편성한다.
일부 실시양태에서, 오프-표적 값은 참조 게놈에 대하여 계산된다. 일부 실시양태에서, 참조 게놈은 인간 참조 게놈이다. 일부 실시양태에서, 참조 게놈은 호모 사피엔스(Homo sapiens), 무스 무스쿨루스(Mus musculus), 크리세툴루스 그리세우스(Cricetulus griseus), 라투스 노르베기쿠스(Rattus Norvegicus), 다니오 레리오(Danio rerio), 및 카에노르하브디티스 엘레간스(Caenorhabditis elegans)로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 오프-표적 값은 참조 게놈의 1,000,000 bp에 걸쳐 또는 참조 게놈 전체에서 결정된다. 일부 실시양태에서, 오프-표적 값은 뉴클레아제의 결합 부위의 데이터베이스에 대해 계산된다. 일부 실시양태에서, 뉴클레아제는 Cas9, C2c1, C2c3 및 Cpf1로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 뉴클레아제는 Cas9이다. 일부 실시양태에서, 데이터베이스는 10,000개 초과, 50,000개 초과, 100,000개 초과, 150,000개 초과, 200,000개 초과, 250,000개 초과, 300,000개 초과, 350,000개 초과, 400,000개 초과, 450,000개 초과, 500,000개 초과, 550,000개 초과, 600,000개 초과, 650,000개 초과, 700,000개 초과, 750,000개 초과, 800,000개 초과, 850,000개 초과, 900,000개 초과, 950,000, 또는 1,000,000개 초과의 뉴클레아제 결합 부위를 포함한다. 일부 실시양태에서, 뉴클레아제 결합 부위의 데이터베이스는 25,000,000개 초과, 50,000,000개 초과, 75,000,000개 초과, 100,000,000개 초과, 125,000,000개 초과, 150,000,000개 초과, 175,000,000개 초과, 200,000,000개 초과, 225,000,000개 초과, 250,000,000개 초과, 275,000,000개 초과, 또는 300,000,000개 초과의 뉴클레아제 결합 부위를 포함한다. 일부 실시양태에서, 미스매치의 수를 열거함으로써 오프-표적 값을 계산하는 것은 컴퓨터에 의해 수행된다.
특정 실시양태에서, 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하는 방법으로서, 복수의 유전자 전사체로부터 전사체를 선택하는 단계; 및 초기 gRNA 세트를 확인하는 단계로서, 여기서 초기 gRNA 세트 내의 각각의 gRNA는 선택된 전사체의 유전자 내의 상이한 표적 부위에 혼성화하는 것인 단계를 포함하는 방법이 본원에 기재된다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 17 내지 약 42개 염기이다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 20개 염기이다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA는 약 20개 염기 길이의 가이드 서열 및 약 22개 내지 약 80개 염기 길이의 불변 영역을 포함한다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 가이드 서열은 표적 부위를 선택적으로 혼성화한다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 100개 염기이다. 일부 실시양태에서, 선택된 전사체는 데이터베이스 내의 유전자 중 가장 풍부한 전사체이다. 일부 실시양태에서, 선택된 전사체는 복수의 유전자 전사체 중 가장 긴 전사체이다.
일부 실시양태에서, 방법은 선택된 전사체에 존재하는 유전자에서 코딩 영역을 선택하는 단계를 추가로 포함한다. 일부 실시양태에서, 선택된 코딩 영역은 초기 위치 엑손이다. 일부 실시양태에서, 초기 위치 엑손은 유전자의 전반부에 있다. 일부 실시양태에서, 초기 위치 엑손은 유전자의 제1, 제2, 제3, 제4, 제5 또는 제6 엑손이다. 일부 실시양태에서, 선택된 코딩 영역은 복수의 유전자 전사체에서 가장 풍부한 전사체인 선택된 엑손이다. 일부 실시양태에서, 선택된 엑손은 복수의 전사체에서 하나 이상의 다른 엑손보다 길다. 일부 실시양태에서, 선택된 엑손은 적어도 50 bp, 적어도 55 bp, 적어도 60 bp, 적어도 65 bp, 적어도 70 bp, 또는 적어도 75 bp이다. 일부 실시양태에서, 선택된 엑손은 복수의 전사체에서 길이 및 풍부도(존재량) 둘 다에 기초하여 선택된다.
일부 실시양태에서, 방법은 초기 gRNA 세트의 각각의 gRNA에 대한 오프-표적 값을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 오프-표적 값은 종의 게놈 전체에서 결정된다. 일부 실시양태에서, 게놈은 종의 참조 게놈이다. 일부 실시양태에서, 종의 참조 게놈은 염색체 및 비국지화된 콘티그를 함유하는 완전한 참조 어셈블리이다. 일부 실시양태에서, 방법은 게놈 내의 복수의 표적 부위와 비교하여 초기 gRNA 세트 내의 각각의 gRNA에 대한 미스매치의 수를 열거함으로써 오프-표적 값을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 복수의 표적 부위는 게놈 전체에서 모든 가능한 Cas 뉴클레아제 결합 부위를 포함한다. 일부 실시양태에서, 복수의 표적 부위는 적어도 1000, 10,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 2,000,000 또는 3,000,000개의 표적 부위를 포함한다. 일부 실시양태에서, 복수의 표적 부위는 적어도 100,000,000, 200,000,000, 300,000,000, 400,000,000, 500,000,000, 600,000,000, 700,000,000, 800,000,000, 900,000,000, 1,000,000,000, 또는 1,500,000,000개의 표적 부위를 포함한다. 일부 실시양태에서, 열거(enumerating)는 0, 1, 2, 3 또는 4개의 미스매치를 갖는 초기 가이드 RNA 세트의 각각의 gRNA에 대한 오프-표적 혼성화 영역을 결정하는 것을 포함한다.
일부 실시양태에서, 상이한 표적 부위의 표적 부위는 Cas9, C2c1, C2c3 및 Cpf1로 이루어진 군으로부터 선택되는 뉴클레아제에 대한 PAM 부위에 인접해 있다. 일부 실시양태에서, 뉴클레아제는 Cas9이다. 일부 실시양태에서, PAM 부위는 NGG이다. 일부 실시양태에서, 뉴클레아제는 불활성화된 Cas이다. 일부 실시양태에서, 종은 호모 사피엔스, 무스 무스쿨루스, 크리세툴루스 그리세우스, 라투스 노르베기쿠스, 다니오 레리오, 및 카에노르하브디티스 엘레간스로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 온-표적 효율 역치 및 오프-표적 역치에 기초하여 초기 gRNA 세트로부터 가이드 RNA 서브세트를 선택하는 단계를 추가로 포함한다. 일부 실시양태에서, 초기 gRNA 세트의 각각의 가이드 RNA에 대한 온-표적 효율 역치는 방위각 점수를 계산함으로써 결정된다. 일부 실시양태에서, 방위각 점수는 0.4 초과이다. 일부 실시양태에서, 확인은 방위각 점수 및 오프-표적 혼성화 값의 역치에 기초한다. 일부 실시양태에서, 초기 gRNA 세트는 세포에서 유전자를 녹아웃시킨다. 일부 실시양태에서, 초기 gRNA 세트는 세포 내의 유전자에 돌연변이를 녹인한다.
일부 실시양태에서, 세포는 인간 1차 세포, 인간 불멸화 세포, 인간 유도 만능 줄기 세포, 마우스 배아 줄기 세포, 및 차이니즈 햄스터 난소 세포로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 초기 가이드 RNA 세트 내의 적어도 하나의 가이드 RNA로부터의 적어도 하나의 뉴클레오티드는 변형을 포함한다. 일부 실시양태에서, 변형은 2'-O-C1-4알킬, 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-메톡시에틸(2'-MOE), 2'-플루오로(2'-F), 2'-아미노(2'-NH2), 2'-아라비노실(2'-아라비노) 뉴클레오티드, 2'-F-아라비노실(2'-F-아라비노) 뉴클레오티드, 2'-잠금 핵산(LNA) 뉴클레오티드, 2'-잠금해제 핵산(ULNA) 뉴클레오티드, L형의 슈가(L-슈가), 및 4'-티오리보실 뉴클레오티드로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 변형은 포스포로티오에이트, 포스포노카르복실레이트, 티오포스포노카르복실레이트, 알킬포스포네이트, 및 포스포로디티오에이트로부터 선택되는 군으로부터 선택되는 뉴클레오티드간 연결 변형이다. 일부 실시양태에서, 변형은 2-티오우라실(2-티오U), 2-티오시토신(2-티오C), 4-티오우라실(4-티오U), 6-티오구아닌(6-티오G), 2-아미노아데닌(2-아미노A), 2-아미노퓨린, 슈도우라실, 히포크산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신(5-메틸C), 5-메틸우라실(5-메틸U), 5-히드록시메틸시토신, 5-히드록시메틸우라실, 5,6-데히드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실(5-알릴U), 5-알릴시토신(5-알릴C), 5-아미노알릴우라실(5-아미노알릴U), 5-아미노알릴-시토신(5-아미노알릴C), 무염기 뉴클레오티드, Z 염기, P 염기, 비구조화 핵산(UNA), 이소구아닌(이소G), 이소시토신(이소C), 및 5-메틸-2-피리미딘으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 선택 및 확인은 컴퓨터에 의해 수행된다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA는 초기 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 표적 부위에 혼성화될 수 있다. 일부 실시양태에서, 가이드 RNA(gRNA) 세트 내의 각각의 gRNA가 본원에 기재된 방법에 의해 설계되는 gRNA 세트를 포함하는 키트가 본원에 기재된다.
특정 실시양태에서, 관심 게놈 영역을 편집하는 방법으로서, 관심 게놈 영역을 포함하는 세포 집단을 (i) 관심 게놈 영역을 표적화하는 적어도 2개의 gRNA를 포함하는 gRNA 세트 및 (ii) 뉴클레아제와 접촉시키는 단계를 포함하고; 여기서 적어도 2개의 gRNA를 포함하는 gRNA 세트의 편집 효율은 적어도 2개의 gRNA 각각의 개별 편집 효율보다 높은 것인 방법이 본원에 기재된다. 일부 실시양태에서, 관심 게놈 영역은 유전자의 코딩 영역이다. 일부 실시양태에서, 코딩 영역은 유전자의 엑손이다. 일부 실시양태에서, 관심 게놈 영역은 게놈 내의 비코딩 영역이다. 일부 실시양태에서, 비코딩 영역은 조절 요소이다. 일부 실시양태에서, 조절 요소는 시스-조절 요소 또는 트랜스-조절 요소이다. 일부 실시양태에서, 시스-조절 요소는 프로모터, 인핸서 및 사일런서로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 방법은 세포를 공여자 폴리뉴클레오티드와 접촉시키는 단계를 추가로 포함한다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 세포의 야생형 유전자형에 비해 점 돌연변이, 대립유전자, 태그 또는 외인성 엑손을 포함한다.
일부 실시양태에서, 편집 효율은 접촉 후 비야생형 유전자형을 포함하는 세포 집단 내의 세포의 비율이다. 일부 실시양태에서, 비야생형 유전자형은 유전자의 녹아웃이다. 일부 실시양태에서, 비야생형 유전자형은 야생형 유전자형에 비해 삽입 또는 결실이다. 일부 실시양태에서, 세포 집단에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포는 비야생형 유전자형을 포함한다. 일부 실시양태에서, 적어도 2개의 gRNA의 각각의 gRNA는 관심 게놈 영역에서 상이한 표적 부위에 혼성화한다. 일부 실시양태에서, 적어도 2개의 gRNA의 각각의 gRNA는 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 표적 부위에 혼성화될 수 있다.
일부 실시양태에서, 방법은 복수의 관심 게놈 영역을 표적화하는 복수 세트의 gRNA를 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 복수의 gRNA 세트 각각은 세포 집단의 복수의 서브세트 각각과 접촉된다. 일부 실시양태에서, 복수의 gRNA 세트 각각은 복수의 관심 게놈 영역 내의 상이한 관심 게놈 영역을 표적화한다. 일부 실시양태에서, 세포 집단의 복수의 서브세트의 적어도 50%에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포는 비야생형 유전자형을 포함한다. 일부 실시양태에서, 세포 집단의 복수의 서브세트의의 적어도 70%에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포는 비야생형 유전자형을 포함한다. 일부 실시양태에서, 세포 집단의 복수의 서브세트의 적어도 90%에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포는 비야생형 유전자형을 포함한다.
일부 실시양태에서, 방법은 표현형에 대해 세포 집단을 스크리닝하는 단계를 추가로 포함한다.
특정 실시양태에서, 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하기 위한 컴퓨터 시스템으로서, 하나 이상의 컴퓨터 프로세서; 및 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 시스템으로 하여금 복수의 유전자 전사체로부터 전사체를 선택하고 선택된 전사체의 유전자 내의 복수의 표적 부위로부터의 상이한 표적 부위에 혼성화하는 초기 gRNA 세트를 확인하도록 작동 가능한 명령을 포함하는 비일시적 컴퓨터 판독 가능 매체를 포함하는 컴퓨터 시스템이 본원에 기재된다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 17 내지 약 42개 염기이다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 20개 염기이다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA는 약 20개 염기 길이의 가이드 서열을 포함하고 약 22 내지 약 80 염기 길이의 불변 영역을 추가로 포함한다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 가이드 서열은 유전자에 선택적으로 혼성화한다. 일부 실시양태에서, 초기 gRNA 세트 내의 각각의 gRNA의 길이는 약 100개 염기이다. 일부 실시양태에서, 선택된 전사체는 데이터베이스 내의 유전자 중 가장 풍부한 전사체이다. 일부 실시양태에서, 선택된 전사체는 복수의 유전자 전사체 중 가장 긴 전사체이다.
일부 실시양태에서, 명령은 시스템이 선택된 전사체에 존재하는 유전자 내의 코딩 영역을 선택하게 하여 선택된 코딩 영역을 선택하도록 추가로 작동 가능하다. 일부 실시양태에서, 선택된 코딩 영역은 초기 위치 엑손이다. 일부 실시양태에서, 초기 위치 엑손은 유전자의 전반부에 있다. 일부 실시양태에서, 초기 위치 엑손은 유전자의 제1, 제2, 제3, 제4, 제5 또는 제6 엑손이다. 일부 실시양태에서, 선택된 코딩 영역은 복수의 유전자 전사체에서 가장 풍부한 전사체인 선택된 엑손이다. 일부 실시양태에서, 선택된 엑손은 복수의 전사체에서 하나 이상의 다른 엑손보다 길다. 일부 실시양태에서, 선택된 엑손은 적어도 50 bp, 적어도 55 bp, 적어도 60 bp, 적어도 65 bp, 적어도 70 bp, 또는 적어도 75 bp이다. 일부 실시양태에서, 선택된 엑손은 복수의 전사체의 길이 및 풍부도 둘 다에 기초하여 선택된다. 일부 실시양태에서, 명령은 시스템이 초기 gRNA 세트의 각각의 gRNA에 대한 오프-표적 값을 결정하게 하도록 추가로 작동 가능하다. 일부 실시양태에서, 명령은 시스템이 종의 게놈 전체에서 결정하게 하도록 추가로 작동 가능하다.
일부 실시양태에서, 게놈은 종의 참조 게놈이다. 일부 실시양태에서, 종의 참조 게놈은 염색체 및 비국지화된 콘티그를 포함하는 완전한 참조 어셈블리이다. 일부 실시양태에서, 명령은 게놈 내의 복수의 표적 부위와 비교하여 초기 gRNA 세트 내의 각각의 gRNA에 대한 미스매치의 수를 열거함으로써 시스템이 오프-표적 값을 결정하게 하도록 추가로 작동 가능하다. 일부 실시양태에서, 복수의 표적 부위는 게놈 전체에서 모든 가능한 Cas 뉴클레아제 결합 부위를 포함한다. 일부 실시양태에서, 복수의 표적 부위는 적어도 1000, 10,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 2,000,000, 또는 3,000,000개의 표적 부위를 포함한다. 일부 실시양태에서, 복수의 표적 부위는 적어도 100,000,000, 200,000,000, 300,000,000, 400,000,000, 500,000,000, 600,000,000, 700,000,000, 800,000,000, 900,000,000, 1,000,000,000, 또는 1,500,000,000개의 표적 부위를 포함한다. 일부 실시양태에서, 열거는 0, 1, 2, 3 또는 4개의 미스매치를 갖는 초기 가이드 RNA 세트의 각각의 gRNA에 대한 오프-표적 혼성화 영역을 결정하는 것을 포함한다. 일부 실시양태에서, 복수의 표적 부위의 표적 부위는 Cas9, C2c1, C2c3 및 Cpf1로 이루어진 군으로부터 선택되는 뉴클레아제에 대한 PAM 부위에 인접해 있다. 일부 실시양태에서, 뉴클레아제는 Cas9이다. 일부 실시양태에서, PAM 부위는 NGG이다. 일부 실시양태에서, 종은 호모 사피엔스, 무스 무스쿨루스, 크리세툴루스 그리세우스, 라투스 노르베기쿠스, 다니오 레리오, 및 카에노르하브디티스 엘레간스로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 명령은 시스템이 온-표적 효율 역치 및 오프-표적 역치에 기초하여 초기 gRNA 세트로부터 가이드 RNA 서브세트를 선택하게 하도록 추가로 작동 가능하다. 일부 실시양태에서, 초기 gRNA 세트의 각각의 가이드 RNA에 대한 온-표적 효율 역치는 방위각 점수를 계산함으로써 결정된다. 일부 실시양태에서, 방위각 점수는 0.4 초과이다. 일부 실시양태에서, 명령은 시스템이 방위각 점수 및 오프-표적 혼성화 값의 역치에 기초하여 초기 gRNA 세트를 확인하게 하도록 추가로 작동 가능하다. 일부 실시양태에서, 초기 가이드 RNA 세트 내의 적어도 하나의 가이드 RNA로부터의 적어도 하나의 뉴클레오티드는 변형을 포함한다. 일부 실시양태에서, 변형은 2'-O-Cl-4알킬, 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-메톡시에틸(2'-MOE), 2'-플루오로(2'-F), 2'-아미노(2'-NH2), 2'-아라비노실(2'-아라비노) 뉴클레오티드, 2'-F-아라비노실(2'-F-아라비노) 뉴클레오티드, 2'-잠금 핵산(LNA) 뉴클레오티드, 2'-잠금해제 핵산(ULNA) 뉴클레오티드, L형의 슈가(L-슈가), 및 4'-티오리보실 뉴클레오티드로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 변형은 포스포로티오에이트, 포스포노카르복실레이트, 티오포스포노카르복실레이트, 알킬포스포네이트, 및 포스포로디티오에이트로 이루어진 군으로부터 선택되는 뉴클레오티드간 연결 변형이다. 일부 실시양태에서, 변형은 2-티오우라실(2-티오U), 2-티오시토신(2-티오C), 4-티오우라실(4-티오U), 6-티오구아닌(6-티오G), 2-아미노아데닌(2-아미노A), 2-아미노퓨린, 슈도우라실, 히포크산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신(5-메틸C), 5-메틸우라실(5-메틸U), 5-히드록시메틸시토신, 5-히드록시메틸우라실, 5,6-데히드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실(5-알릴U), 5-알릴시토신(5-알릴C), 5-아미노알릴우라실(5-아미노알릴U), 5-아미노알릴-시토신(5-아미노알릴C), 무염기 뉴클레오티드, Z 염기, P 염기, 비구조화 핵산(UNA), 이소구아닌(이소G), 이소시토신(이소C), 및 5-메틸-2-피리미딘로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 세트 내의 각각의 gRNA는 관심 게놈 영역 내의 상이한 표적 부위에 혼성화될 수 있고; 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 표적 부위에 혼성화될 수 있다.
특정 실시양태에서, 개체의 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA를 설계하는 방법으로서, 개체의 게놈을 사용하여 gRNA 표적 부위 포텐셜을 결정하는 단계; gRNA 표적 부위 포텐셜의 각각의 gRNA 표적 부위 포텐셜에 대해, 예상 가이드 RNA에 대한 오프-표적 값을 결정하는 단계; 및 개선된 효용 지수를 갖는 하나 이상의 가이드 RNA를 확인하는 단계를 포함하는 방법이 본원에 기재된다. 일부 실시양태에서, 하나 이상의 gRNA의 각각의 gRNA의 길이는 약 100개 염기이다. 일부 실시양태에서, 하나 이상의 gRNA의 각각의 gRNA의 약 20개의 염기는 gRNA 표적 부위 포텐셜의 각각의 gRNA 표적 부위 포텐셜에 혼성화될 수 있다. 일부 실시양태에서, 효용 지수는 치료 지수이다. 일부 실시양태에서, 치료 지수는 오프-표적 결합의 감소, 증가된 온-표적 효율, 증가된 녹아웃 효율, 증가된 녹인 효율 또는 CRISPR 간섭의 조정을 포함한다. 일부 실시양태에서, 개체는 인간이다. 일부 실시양태에서, 개체는 병태를 앓는다. 일부 실시양태에서, 개체는 하나 이상의 병태를 앓는 집단 코호트의 일부이다. 일부 실시양태에서, 하나 이상의 병태는 하나 이상의 유형의 암을 포함한다. 일부 실시양태에서, 병태는 암이다.
일부 실시양태에서, 하나 이상의 가이드 RNA는 개체의 세포의 게놈 영역 내의 유전자를 녹아웃하도록 설계된다. 일부 실시양태에서, 하나 이상의 가이드 RNA는 개체의 세포의 게놈 영역 내에 돌연변이를 녹인하도록 설계된다. 일부 실시양태에서, 방법은 개선된 효용 지수를 갖는 하나 이상의 가이드 RNA로 세포를 편집하는 단계를 추가로 포함한다. 일부 실시양태에서, gRNA 표적 부위 포텐셜의 결정 및 하나 이상의 가이드 RNA의 확인은 컴퓨터에 의해 수행된다.
특정 실시양태에서, 개체에 대한 CRISPR 제제의 오프-표적 효과를 평가하는 방법으로서, 개체의 게놈을 사용하여, 컴퓨터 시스템에 의해, 개체의 게놈 내의 잠재적 표적 부위에 대한 미스매치의 수를 열거함으로써 CRISPR 제제의 오프-표적 값을 결정하는 단계를 포함하는 방법이 본원에 기재된다. 일부 실시양태에서, CRISPR 제제는 치료제이다. 일부 실시양태에서, CRISPR 제제는 길이가 약 100개 염기인 가이드 RNA(gRNA)이다. 일부 실시양태에서, gRNA는 표적에 혼성화 가능한 20개의 염기를 포함한다. 일부 실시양태에서, 미스매치의 수는 표적에 혼성화 가능한 20개의 염기 각각에 대해 독립적으로 계산된다.
일부 실시양태에서, 열거는 잠재적 표적 부위로부터의 1, 2, 3, 4 또는 5개의 미스매치 수 중 적어도 2개를 개별적으로 열거하는 것을 포함한다. 일부 실시양태에서, 잠재적 표적 부위의 수는 적어도 1000, 10,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 2,000,000, 또는 3,000,000개이다. 일부 실시양태에서, 방법은 개체의 게놈에서 잠재적 표적 부위에 대한 미스매치의 수를 열거하는 보고서를 출력하는 단계를 추가로 포함한다. 일부 실시양태에서, 출력은 스크린에 디스플레이된다. 일부 실시양태에서, CRISPR 제제의 오프-표적 효과의 평가는 동반 진단으로서 사용된다.
특정 실시양태에서, 예상 gRNA를 검증하는 방법으로서, 컴퓨터 시스템상에서, 게놈 또는 게놈의 일부에서 예상 gRNA에 대한 복수의 오프-표적 부위를 결정하는 단계; 컴퓨터 시스템을 사용하여, 복수의 오프-표적 부위 내의 각각의 오프-표적 부위에 대한 예상 gRNA에 대한 오프-표적 값을 계산하는 단계; 및 컴퓨터 시스템을 사용하여 오프-표적 값을 사용하여 예상 gRNA의 활성을 예측하는 단계를 포함하는 방법이 본원에 기재된다. 일부 실시양태에서, 예측은 온-표적 혼성화 부위 또는 오프-표적 혼성화 부위의 포텐셜을 나열한다. 일부 실시양태에서, 게놈 또는 게놈의 일부는 1,000,000 bp 이상이다. 일부 실시양태에서, 오프-표적 값은 복수의 오프-표적 부위에 대한 gRNA에 대한 미스매치의 수를 계산함으로써 결정된다. 일부 실시양태에서, 미스매치의 수는 0, 1, 2, 3 및/또는 4이다. 일부 실시양태에서, 복수의 오프-표적 부위는 적어도 100,000,000개의 오프-표적 부위를 포함한다.
특정 실시양태에서, 관심 종 및 관심 종으로부터의 관심 유전자를 선택하도록 구성된 사용자 인터페이스 시스템; 관심 유전자에 대한 하나 이상의 가이드 RNA(gRNA) 서열을 확인하도록 구성된 사용자 인터페이스와 통합된 설계 모듈; 선택된 gRNA를 디스플레이하도록 구성된 출력 시스템; 및 하나 이상의 gRNA의 RNA 합성기에 의한 합성을 개시하도록 구성된 활성화 유닛을 포함하는 컴퓨터 시스템이 본원에 기재된다. 일부 실시양태에서, 각각의 gRNA의 길이는 약 20개 염기이다. 일부 실시양태에서, 사용자 인터페이스 시스템은 100, 1000, 10,000, 100,000, 500,000개 이상의 상이한 참조 게놈의 선택을 포함한다. 일부 실시양태에서, 설계 모듈은 오프-표적 값 및 온-표적 효율 점수에 기초하여 gRNA를 선택하도록 구성된다. 일부 실시양태에서, 설계 모듈은 클라우드 내의 참조 게놈에 접근하도록 구성된다. 일부 실시양태에서, 설계 모듈은 10,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 110,000 또는 120,000개 초과의 참조 게놈에 접근하도록 구성된다. 일부 실시양태에서, 사용자 인터페이스는 개체의 게놈의 입력을 얻기 위한 게놈 데이터 수신 모듈을 포함한다. 일부 실시양태에서, 게놈 데이터 수신 모듈은 서버로부터 또는 사용자에 의해 업로드된 파일로부터 개체의 게놈을 수득하도록 구성된다.
특정 실시양태에서, 10,000개 초과의 참조 게놈에 대한 접근을 사용자에게 제공하도록 구성된 인터페이스; 50,000개 초과의 참조 게놈 중 어느 하나의 유전자에 대한 하나 이상의 가이드 RNA를 선택하도록 구성된 소프트웨어; 및 선택된 가이드 RNA를 디스플레이하도록 구성된 출력 시스템을 포함하는 시스템이 본원에 기재된다. 일부 실시양태에서, 시스템은 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 110,000 또는 120,000개 초과의 참조 게놈을 포함한다. 일부 실시양태에서, 시스템은 적어도 하나 이상의 가이드 RNAS의 합성을 활성화하고 개시하도록 구성된 스크립트를 추가로 포함한다.
특정 실시양태에서, 가이드 RNA(gRNA)를 설계하는 방법으로서, 컴퓨터 시스템에 의해 유전자의 1차 전사체를 확인하는 단계; 컴퓨터 시스템에 의해 1차 전사체와 복수의 대체 전사체 사이의 공통 엑손을 확인하는 단계; 컴퓨터 시스템에 의해 공통 엑손 내의 뉴클레아제 표적 부위를 확인하는 단계; 컴퓨터 시스템에 의해 뉴클레아제에 대한 참조 게놈 서열에서 다수의 오프-표적 결합 부위를 계산하여 계산된 뉴클레아제 오프-표적 결합 부위의 수를 산출하고; 컴퓨터 시스템에 의해 온-표적 효율 점수를 계산하여 계산된 온-표적 효율 점수를 산출하는 단계; 및 컴퓨터 시스템에 의해 적어도 하나의 gRNA 서열을 출력하는 단계를 포함하고, 여기서 적어도 하나의 gRNA 서열은 계산된 온-표적 효율이 역치 이상이고 계산된 뉴클레아제 오프-표적 결합 부위의 수가 0인 서열을 포함하는 것인 방법이 본원에 기재된다. 일부 실시양태에서, 방법은 표적 부위에 부분 상보성을 갖는 핵산의 합성을 지시하는 단계를 추가로 포함한다. 일부 실시양태에서, 가이드 RNA(gRNA) 세트 내의 각각의 gRNA가 본원에 기재된 임의의 방법에 의해 설계되는 gRNA 세트를 포함하는 키트가 본원에 기재된다.
특정 실시양태에서, 네트워크를 통해 사용자로부터의 생체중합체 합성 요청을 프로세싱하기 위한 시스템으로서, 네트워크를 통해 사용자의 디지털 컴퓨터와 통신하도록 구성된 통신 인터페이스; 하나 이상의 참조 게놈을 저장하도록 구성된 참조 게놈 데이터베이스; 및 통신 인터페이스 및 데이터베이스에 작동 가능하게 커플링된 하나 이상의 컴퓨터 프로세서를 포함하는 컴퓨터를 포함하고, 여기서 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집합적으로 (a) 통신 인터페이스로부터 네트워크를 통해 사용자의 디지털 컴퓨터로부터의 표적 게놈 정보를 포함하는 생체중합체 합성 요청을 수신하고; (b) 표적 게놈 정보에 상응하는 표적 서열을 확인하기 위해 데이터베이스로부터 하나 이상의 참조 게놈에 대한 표적 게놈 정보를 프로세싱하고; (c) 알고리즘을 실행하여 표적 서열에 적어도 부분적으로 상보적인 가이드 리보핵산(gRNA) 서열의 제1 세트를 생성하고 제1 gRNA 서열 세트 내의 각각의 gRNA 서열에 대한 오프-표적 상보성 점수를 계산하고; (d) 사용자의 디지털 컴퓨터의 그래픽 사용자 인터페이스에 디스플레이하기 위한 역치 이하로 계산된 오프-표적 상보성 점수를 갖는 제2 gRNA 서열 세트를 출력하고; 및 (e) 사용자의 디지털 컴퓨터로부터 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 선택을 수신하도록 구성되는 것인 시스템이 본원에 기재된다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 gRNA 서열을 합성하기 위한 큐(queue)에서 주어진 gRNA 서열을 지시하도록 개별적으로 또는 집합적으로 프로그래밍된다. 일부 실시양태에서, 참조 게놈 데이터베이스 내의 적어도 하나의 게놈은 개체의 맞춤형 게놈이다. 일부 실시양태에서, 참조 게놈 데이터베이스 내의 적어도 하나의 게놈은 병태를 앓는 집단의 맞춤형 게놈 세트이다. 일부 실시양태에서, 참조 게놈은 호모 사피엔스 참조 게놈이다. 일부 실시양태에서, 시스템은 예측된 게놈 서열을 출력하는 것을 추가로 포함하고, 여기서 예측된 게놈 서열은 제2 gRNA 서열 세트로부터의 하나 이상의 gRNA로 표적 게놈 정보를 편집하는 예측된 출력을 나타낸다. 일부 실시양태에서, 예측된 게놈 서열은 게놈 결실을 포함한다. 일부 실시양태에서, 예측된 게놈 서열은 게놈 삽입을 포함한다. 일부 실시양태에서, 계산은 방위각 점수를 계산한다. 일부 실시양태에서, 제2 gRNA 서열 세트는 특정 역치를 초과하는 적어도 2개의 gRNA를 디스플레이한다. 일부 실시양태에서, 참조 게놈 데이터베이스는 적어도 50,000개의 참조 게놈을 포함한다. 일부 실시양태에서, 참조 게놈 데이터베이스는 적어도 12,000개의 참조 게놈을 포함한다.
특정 실시양태에서, 네트워크를 통해 사용자로부터 생체중합체 합성 요청을 프로세싱하는 방법으로서, (a) 컴퓨터 시스템에 의해, 사용자의 디지털 컴퓨터로부터 표적 게놈 정보를 포함하는 생체중합체 합성 요청을 수신하는 단계; (b) 컴퓨터 시스템에 의해, 참조 게놈 데이터베이스로부터의 하나 이상의 참조 게놈에 대한 표적 게놈 정보를 프로세싱하여 표적 게놈 정보에 상응하는 표적 서열을 확인하는 단계; (c) 하나 이상의 컴퓨터 프로세서를 사용하여 알고리즘을 실행하여 (i) 표적 서열에 적어도 부분적으로 상보적인 제1 가이드 리보핵산(gRNA) 서열 세트를 생성하고, (ii) 각각의 gRNA 서열에 대한 제1 gRNA 서열 세트에서 각각의 gRNA 서열에 대한 오프-표적 상보성 점수를 계산하는 단계; (d) 컴퓨터 시스템에 의해, 사용자의 디지털 컴퓨터의 그래픽 사용자 인터페이스에 디스플레이하기 위한 제2 gRNA 서열 세트를 출력하는 단계로서, 여기서 제2 gRNA 서열 세트 각각은 역치 이하의 계산된 오프-표적 상보성 점수를 포함하는 것인 단계; 및 (e) 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 합성에 대한 요청을 사용자의 디지털 컴퓨터로부터 수신하는 단계를 포함하는 방법이 본원에 기재된다.
일부 실시양태에서, 합성 요청을 수신하는 하나 이상의 컴퓨터 프로세서는 합성기에서 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 합성을 지시하도록 개별적으로 또는 집합적으로 프로그래밍된다. 일부 실시양태에서, 참조 게놈 데이터베이스 내의 적어도 하나의 게놈은 개체의 맞춤형 게놈이다. 일부 실시양태에서, 참조 게놈 데이터베이스 내의 적어도 2개의 게놈은 병태를 앓는 집단의 맞춤형 게놈이다. 일부 실시양태에서, 참조 게놈은 호모 사피엔스 참조 게놈이다. 일부 실시양태에서, 방법은 예측된 게놈 서열을 출력하는 단계를 추가로 포함하며, 여기서 예측된 게놈 서열은 제2 gRNA 서열 세트로부터의 하나 이상의 gRNA로 표적 게놈 정보를 편집하는 예측된 출력을 나타낸다. 일부 실시양태에서, 예측된 게놈 서열은 게놈 결실을 포함한다. 일부 실시양태에서, 예측된 게놈 서열은 게놈 삽입을 포함한다. 일부 실시양태에서, 계산은 방위각 점수를 계산한다. 일부 실시양태에서, 제2 gRNA 서열 세트는 특정 역치 이상인 2개 이상의 gRNA를 디스플레이한다. 일부 실시양태에서, 참조 게놈 데이터베이스는 적어도 50,000개의 참조 게놈을 포함한다. 일부 실시양태에서, 참조 게놈 데이터베이스는 적어도 12,000개의 참조 게놈을 포함한다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 하나 이상의 컴퓨터 프로세서가 본원에 기재된 방법 중 임의의 것을 수행하게 하도록 동작 가능한 명령을 포함하는 비일시적 컴퓨터 판독 가능 매체가 본원에 기재된다.
특정 실시양태에서, 하나 이상의 컴퓨터 프로세서에 의해 실행될 때, 네트워크를 통해 사용자로부터 생체중합체 합성 요청을 프로세싱하는 방법을 구현하는 기계 실행 가능 코드를 포함하는 비일시적 컴퓨터 판독 가능 매체가 본원에 기재되며, 방법은 (a) 네트워크를 통해 사용자의 디지털 컴퓨터로부터 표적 게놈 정보를 포함하는 생체중합체 합성 요청을 수신하는 단계; (b) 표적 게놈 정보에 상응하는 표적 서열을 확인하기 위해 참조 게놈 데이터베이스로부터 하나 이상의 참조 게놈에 대한 표적 게놈 정보를 프로세싱하는 단계; (c) 알고리즘을 실행하여 표적 서열에 적어도 부분적으로 상보적인 제1 가이드 리보핵산(gRNA) 서열 세트를 생성하고 제1 gRNA 서열 세트 내의 각각의 gRNA 서열에 대한 오프-표적 상보성 점수를 계산하는 단계; (d) 사용자의 디지털 컴퓨터의 그래픽 사용자 인터페이스에 디스플레이하기 위한 제2 gRNA 서열 세트를 출력하는 단계로서, 여기서 제2 gRNA 서열 세트 각각은 역치 이하의 계산된 오프-표적 상보성 점수를 갖는 것인 단계; 및 (e) 사용자의 디지털 컴퓨터로부터 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 선택을 수신하는 단계를 포함한다.
참조에 의한 통합
본 명세서에 언급된 모든 공개문, 특허 및 특허 출원은 각각의 개별 공개문, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다. 참조로 포함된 공개문 및 특허 또는 특허 출원이 명세서에 함유된 개시내용과 모순되는 한, 명세서는 그러한 모순되는 자료를 대체 및/또는 우선하도록 의도된다.
본 발명의 새로운 특징은 첨부된 청구범위에서 구체적으로 설명된다. 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 다음의 상세한 설명 및 첨부 도면 (또한 "도")을 참조하면 본 발명의 특징 및 이점에 대한 더 나은 이해를 얻을 수 있다.
도 1은 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드를 설계하는 방법의 흐름도의 예를 나타낸다.
도 2는 종의 게놈의 유전자의 복수의 전사체의 표의 예를 나타낸다.
도 3은 하나 이상의 gRNA에 의해 표적화될 전사체의 초기 코딩 영역의 예를 나타낸다.
도 4a는 전사체로부터의 복수의 엑손의 상대적 표현 및 엑손 길이의 플롯의 예를 나타낸다. 도 4b는 가이드 및 그들의 오프-표적 및 온-표적 활성 분석의 예를 나타낸다.
도 5는 게놈 전체에서 복수의 가이드의 오프-표적 값을 계산하기 위한 데이터 프로세싱 아키텍처를 나타낸다.
도 6은 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드를 검증하는 방법의 흐름도의 예를 나타낸다.
도 7a-7d는 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드의 설계를 요청하기 위해 게놈 및 관심 유전자를 선택하기 위한 그래픽 사용자 인터페이스(GUI)의 창의 예를 도시한다. 도 7a는 관심 게놈 및 관심 유전자를 선택하기 전의 창을 도시한다. 도 7b는 타이핑된 입력과 일치하는 게놈의 목록을 나타내는 창을 도시한다. 도 7c는 타이핑된 입력과 일치하는 유전자 목록을 나타내는 창을 도시한다. 도 7d는 관심 게놈, 관심 유전자 및 뉴클레아제를 선택한 후의 창을 도시한다.
도 8은 관심 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드를 설계하는 프로세스를 디스플레이하기 위한 GUI 창의 예를 도시한다.
도 9a-9d는 관심 게놈의 유전자에 혼성화하도록 설계된 하나 이상의 가이드를 디스플레이하기 위한 GUI 창의 예를 도시한다. 도 9a는 하나 이상의 gRNA의 설계의 요약을 나타내는 창을 도시한다. 도 9b는 최상위 gRNA의 선택을 도시한다. 도 9c는 선택된 gRNA에 대한 정보를 나타내는 창을 도시한다. 도 9d는 관심 게놈의 유전자에 혼성화하도록 설계된 추가의 gRNA를 나타내는 창을 도시한다.
도 10a-10e는 설계된 가이드에 대한 세부 정보를 디스플레이하기 위한 GUI 창의 예를 도시한다. 도 10a는 선택된 gRNA의 성능의 요약을 도시한다. 도 10b는 선택된 RNA 가이드 서열과 함께 관심 표적 영역과 상호작용하는 Cas-gRNA 복합체의 개략도를 도시한다. 도 10c는 선택된 PAM 영역과 함께 관심 표적 영역과 상호작용하는 Cas-gRNA 복합체의 개략도를 도시한다. 도 10d는 선택된 표적 서열과 함께 관심 표적 영역과 상호작용하는 Cas-gRNA 복합체의 개략도를 도시한다. 도 10e는 선택된 gRNA의 오프-표적 부위의 목록을 도시한다.
도 11a-11b는 관심 게놈의 유전자에 혼성화하도록 설계된 하나 이상의 가이드 서브세트를 선택 및 취득하기 위한 GUI 창의 예를 도시한다. 도 11a는 gRNA 서브세트의 선택을 나타내는 창을 도시한다. 도 11b는 변형 또는 비변형 gRNA를 주문하기 위한 추가의 선택과 함께 선택된 gRNA를 나타내는 창을 도시한다.
도 12a-12b는 관심 종의 게놈을 선택하고 가이드 성능의 검증을 요청하기 위해 이전에 생성된 가이드 서열을 입력하기 위한 GUI 창의 예를 도시한다. 도 12a는 관심 게놈 및 가이드 서열을 선택하기 전의 창을 도시한다. 도 12b는 관심 게놈 및 가이드 서열을 선택한 후의 창을 도시한다.
도 13a-13b는 가이드의 검증에 대한 상세한 정보를 디스플레이하기 위한 GUI의 창의 예를 도시한다. 도 13a는 미리 결정된 gRNA의 성능의 요약을 도시한다. 도 13b는 미리 결정된 gRNA의 오프-표적 부위의 목록을 도시한다.
도 14는 본원에 제공된 방법을 구현하도록 프로그래밍되거나 달리 구성될 수 있는 컴퓨터 시스템을 도시한다.
도 15는 단일 가이드 RNA 대 다중 가이드 RNA의 편집 효율을 도시한다. 단일 가이드 RNA의 경우 각각의 데이터 포인트는 하나의 형질감염된 sgRNA의 편집 효율 또는 KO 점수를 나타낸다. 다중 가이드의 경우 각각의 데이터 포인트는 3개의 공동형질감염된 sgRNA에 대한 KO 점수를 나타낸다.
도 16은 다중 gRNA 세트에서 가이드 RNA의 간격에 대한 편집 효율 퍼센트를 도시한다.
도 17은 표적화된 유전자의 각각의 쌍에 대해 다중 gRNA를 사용한 이중 녹아웃의 편집 효율 퍼센트를 도시한다.
도 18a-18b는 다중 가이드 녹아웃 설계를 사용하여 배열된 라이브러리의 스크리닝을 도시한다. 도 18a는 기능적 측정을 위한 라이브러리의 스크리닝을 도시한다. 도 18b는 편집 효율을 위한 라이브러리의 스크리닝을 도시한다.
본 발명의 다양한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명을 이탈하지 않으면서 당업자에게 다양한 변경, 변화 및 대체가 발생할 수 있다. 본 명세서에 설명된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
본원에서 사용되는 용어는 특정 경우를 설명하기 위한 것이며 제한하려는 의도가 아니다. 이하의 용어는 당업자에 의한 이들 용어의 이해에 추가하여 본 명세서에서 사용되는 용어의 의미를 설명하기 위해 논의된다. 본원 및 첨부된 청구범위에서 사용되는 바와 같이, 단수 형태는 문맥이 명백하게 달리 지시하지 않는 한 복수 지시 대상을 포함한다. 또한, 임의의 선택적 요소를 배제하도록 청구항이 작성될 수 있다는 점에 유의한다. 따라서, 이 진술은 청구항 요소의 인용 또는 "부정적인" 제한의 사용과 관련하여 "단독으로", "단지" 등과 같은 배타적인 용어의 사용에 대한 선행 근거로 사용되도록 의도된다.
특정 범위는 본원에서 용어 "약"이 앞에 오는 수치와 함께 제시된다. 용어 "약"은 본원에서 이 용어가 선행하는 숫자에 가깝거나 대략적인 숫자 뿐만 아니라 이 용어가 선행하는 정확한 숫자에 대한 문자적 지원을 제공하기 위해 사용된다. 숫자가 구체적으로 인용된 숫자에 가깝거나 대략적인지의 여부를 결정할 때, 가까운 또는 대략적인 인용되지 않은 숫자는 그것이 제시된 맥락에서 구체적으로 인용된 숫자의 실질적인 등가물을 제공하는 숫자일 수 있다. 값의 범위가 제공되는 경우, 문맥이 달리 명백하게 지시하지 않는 한 하한 단위의 10분의 1까지, 그 범위 및 그 언급된 범위 내의 임의의 다른 언급된 또는 중간 값의 상한과 하한 사이의 각각의 중간값은 본원에 기재된 방법 및 조성물 내에 포함되는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고 또한 언급된 범위에서 특별히 배제된 제한에 따라 본원에 기재된 방법 및 조성물 내에 포함된다. 언급된 범위가 제한 중 하나 또는 둘 다를 포함하는 경우, 포함된 제한 중 하나 또는 둘 다를 배제하는 범위도 본원에 기재된 방법 및 조성물에 포함된다.
본원에서 상호교환적으로 사용되는 용어 "폴리뉴클레오티드" 또는 "핵산"은 일반적으로 리보뉴클레오티드 및/또는 데옥시리보뉴클레오티드와 같은 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭할 수 있다. 따라서 이들 용어는 단일 가닥, 이중 가닥 또는 다중 가닥 DNA 또는 RNA, 게놈 DNA, 상보적 DNA(cDNA), 가이드 RNA(gRNA), 메신저 RNA(mRNA), DNA-RNA 혼성화, 또는 퓨린 및 피리미딘 염기 또는 다른 천연, 화학적 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오티드 염기를 포함하는 중합체를 포함하지만 이에 제한되지 않는다. 본원에 사용된 용어 "올리고뉴클레오티드"는 일반적으로 단일 또는 이중 가닥 DNA 또는 RNA의 약 5 내지 약 100개 뉴클레오티드의 폴리뉴클레오티드를 지칭할 수 있다. 그러나, 본 개시내용의 목적을 위해, 올리고뉴클레오티드의 길이에 대한 상한이 없을 수 있다. 일부 경우에서, 올리고뉴클레오티드는 "올리고머" 또는 "올리고"로 알려질 수 있고 유전자로부터 분리되거나 당업계에 공지된 방법에 의해 화학적으로 합성될 수 있다. 용어 "폴리뉴클레오티드" 및 "핵산"은 단일 가닥(예컨대, 센스 또는 안티센스) 및 이중 가닥 폴리뉴클레오티드를 포함하는 것으로 이해되어야 한다.
본원에 사용된 용어 "변형된 뉴클레오티드"는 일반적으로, 자연 발생 염기, 슈가 및/또는 포스포디에스테르 연결 또는 백본 부분에 비해, 뉴클레오티드 포스페이트를 포함하여 염기, 슈가 및/또는 포스포디에스테르 연결 또는 백본 부분 중 하나 이상의 화학 구조에 대해 변형을 갖는 뉴클레오티드를 지칭할 수 있다.
본원에 사용된 용어 "혼성화" 또는 "혼성화하는"은 일반적으로 완전히 또는 부분적으로 상보적인 폴리뉴클레오티드 가닥이 적합한 혼성화 조건 하에서 함께 하여 2개의 성분 가닥이 수소 결합에 의해 합쳐지는 이중 가닥 구조 또는 영역을 형성하는 프로세스를 지칭할 수 있다. 일부 경우에서, 변형된 뉴클레오티드는 혼성화를 허용하거나 촉진하는 수소 결합을 형성할 수 있다. 일부 경우에서, 해당 DNA-표적화 RNA 분자의 단백질 결합 분절의 구아닌(G)은 우라실(U)에 상보적인 것으로 간주될 수 있으며 그 반대의 경우도 마찬가지이다.
본원에 사용된 용어 "절단" 또는 "절단하는"은 일반적으로 폴리뉴클레오티드의 리보실 포스포디에스테르 백본에서 공유 포스포디에스테르 연결의 파괴를 지칭할 수 있다. 용어 "절단" 또는 "절단하는"은 단일 가닥 파손 및 이중 가닥 파손 모두를 초래하는 절단을 포함할 수 있다. 일부 경우에서, 절단으로 인해 둔단 말단 또는 엇갈린 (또는 스티커식) 말단이 생성될 수 있다.
본원에 사용된 용어 "CRISPR/Cas"는 가이드 RNA(gRNA) 및 CRISPR 연관된(Cas) 엔도뉴클레아제를 포함하는 리보핵단백질 복합체를 지칭할 수 있다. 용어 "CRISPR"은 클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복부 및 그의 관련된 시스템을 의미한다. CRISPR은 박테리아 및 고세균이 외래 핵산(예컨대, 바이러스 또는 플라스미드)을 탐지하고 침묵시킬 수 있게 하는 적응 방어 시스템으로 발견되었지만, 다양한 세포 유형에서 서열 특이적 방식으로 폴리뉴클레오티드 편집을 허용하도록 사용하기 위해 적응될 수 있다. 일부 경우에서, CRISPR 시스템의 하나 이상의 요소가 유형 I, 유형 II 또는 유형 III CRISPR 시스템으로부터 유도될 수 있다. CRISPR 유형 II 시스템에서, 가이드 RNA는 Cas와 상호작용하고 Cas 효소의 뉴클레아제 활성을 표적 영역으로 안내할 수 있다. 표적 영역은 "프로토스페이서" 및 "프로토스페이서 인접 모티프"(PAM)를 포함할 수 있으며, 두 도메인 모두 Cas 효소 매개된 활성(예컨대, 절단)에 필요할 수 있다. 프로토스페이서는 표적 부위 (또는 게놈 표적 부위)로 지칭될 수 있다. gRNA는 Cas 효소를 표적 영역으로 안내하기 위해 프로토스페이서(결합 부위)의 반대 가닥과 쌍을 이룰 수 있다(또는 혼성화할 수 있다). PAM 부위는 일반적으로 Cas 효소에 의해 인식되고, 일부 경우에서, Cas 효소 활성에 필요한 짧은 서열을 지칭한다. PAM 부위에 대한 뉴클레오티드의 서열 및 수는 Cas 효소의 유형에 따라 다를 수 있다.
본원에 사용된 용어 "Cas"는 일반적으로 야생형 Cas 단백질, 이의 단편, 또는 이의 돌연변이체 또는 변이체를 지칭할 수 있다.
Cas 단백질은 RNA 유도된 폴리뉴클레오티드 결합 또는 뉴클레아제 활성일 수 있는 CRISPR/Cas 유형 I, 유형 II 또는 유형 III 시스템의 단백질 또는 이로부터 유래된 단백질을 포함할 수 있다. 적합한 Cas 단백질의 예는 CasX, Cas3, Cas4, Cas5, Cas5e (또는 CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9(Csnl 및 Csxl2로도 알려짐), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (또는 CasA), Cse2 (또는 CasB), Cse3 (또는 CasE), Cse4 (또는 CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csz1, Csx15, Csf1, Csf2, Csf3, Csf4, Cu1966, 이의 상동체, 및 이의 변형된 버젼을 포함한다. 일부 경우에서, Cas 단백질은 CRISPR/Cas 유형 V 또는 유형 VI 시스템의 단백질 또는 이로부터 유래된 단백질, 예컨대 Cpf1(Cas12a), C2c1(Cas12b), C2c2, 이의 상동체 및 이의 변형된 버전을 포함할 수 있다. 일부 경우에서, Cas 단백질은 촉매적으로 죽은 또는 불활성 Cas(dCas)일 수 있다.
일부 경우에서, Cas 단백질은 Cas9 단백질일 수 있다. 일부 경우에서, Cas9 단백질에 의해 인식되는 PAM 서열은 NGG일 수 있으며, 여기서 "N"은 임의의 뉴클레오티드이다.
본원에 사용된 용어 "가이드 RNA" 또는 "gRNA"는 일반적으로 Cas 단백질에 결합할 수 있고 표적 폴리뉴클레오티드(예컨대, DNA) 내의 특정 위치에 대한 Cas 단백질의 표적화를 도울 수 있는 RNA 분자 (또는 집합적으로 RNA 분자 그룹)를 지칭할 수 있다. 가이드 RNA는 CRISPR RNA(crRNA) 분절 및 트랜스 활성화 crRNA(tracrRNA) 분절을 포함할 수 있다. 본원에 사용된 용어 "crRNA" 또는 "crRNA 분절"은 폴리뉴클레오티드 표적화 가이드 서열, 줄기 서열, 및 임의적으로 5'-돌출 서열을 포함하는 RNA 분자 또는 이의 부분을 지칭할 수 있다. 용어 "tracrRNA" 또는 "tracrRNA 분절"은 단백질 결합 분절을 포함하는 RNA 분자 또는 이의 일부를 지칭할 수 있다(예컨대, 단백질 결합 분절은 Cas9와 같은 CRISPR 관련된 단백질과 상호작용할 수 있다). 용어 "가이드 RNA"는 단일 가이드 RNA(sgRNA)를 포함할 수 있으며, 여기서 crRNA 분절 및 tracrRNA 분절은 동일한 RNA 분자에 위치된다. 용어 "가이드 RNA"는 또한 집합적으로 2개 이상의 RNA 분자 그룹을 포함할 수 있으며, 여기서 crRNA 분절 및 tracrRNA 분절은 별도의 RNA 분자에 위치된다.
일부 경우에서, CRISPR/Cas 활성은 예컨대 유전자 요법에서 사용되는 바와 같이 부위 특이적(표적화) 방식, 예컨대 유전자 녹아웃(KO), 유전자 녹인(KI), 유전자 편집, 유전자 태그부착 등으로 핵산을 변형시키는 것이 바람직한 임의의 시험관내 또는 생체내 적용에 유용할 수 있다. 핵산은 DNA 또는 RNA일 수 있다. 유전자 요법의 예는 항바이러스, 항병원성 또는 항암 치료제로 질환 치료; 농업에서 유전자 변형된 유기체의 생산; 치료, 진단 또는 연구 목적으로 세포에 의한 대규모 단백질 생산; 유도 만능 줄기 세포(iPS 세포 또는 iPSC)의 유도; 및 결실 또는 대체를 위한 병원체 유전자의 표적화를 포함한다. 일부 경우에서, Cas는 촉매적으로 죽은 또는 불활성 Cas(dCas)일 수 있으며, 생성된 CRISPR/dCas 시스템은 유전자 발현의 서열 특이적 억제(CRISPR 간섭) 또는 활성화(CRISPR 활성화)에 유용할 수 있다.
본원에 사용된 용어 "대상체", "개체" 또는 "환자"는 일반적으로 농장 동물, 반려 동물, 또는 인간, 또는 이의 집합체와 같이 치료를 필요로 하고/하거나 받을 수 있는 전체 유기체 또는 이의 집합체를 지칭할 수 있다. 일부 경우에서, 용어 "대상체"는 세포 또는 이의 세포주일 수 있다.
본원에 사용된 용어 "유전자"는 일반적으로 예컨대 폴리펩티드(예컨대, 단백질)를 코딩하는 뉴클레오티드 서열과 같은 기능적 유전 정보를 코딩하는 뉴클레오티드 서열, 전달 RNA(tRNA), 또는 리보솜 RNA(rRNA)를 지칭할 수 있다. 유전자는 DNA, RNA 또는 다른 뉴클레오티드를 포함할 수 있다.
올리고뉴클레오티드 설계 방법
한 측면에서, 본 개시내용은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하는 방법을 제공한다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 방법은 복수의 유전자 전사체로부터 전사체를 선택하는 단계를 포함할 수 있다. 방법은 선택된 전사체의 유전자 내의 상이한 표적 부위에 혼성화하는 초기 gRNA 세트를 확인하는 단계를 포함할 수 있다. 유전자는 관심 유전자일 수 있다. 관심 게놈 영역은 게놈의 비코딩 영역일 수 있다. 비코딩 영역은 조절 요소일 수 있다. 조절 요소는 시스-조절 요소 또는 트랜스-조절 요소일 수 있다. 시스-조절 요소는 프로모터, 인핸서 또는 사일런서일 수 있다.
종의 게놈 및/또는 종의 참조 게놈을 포함하는 정보는 복수의 데이터베이스로부터 얻을 수 있다. 일부 경우에서, 복수의 데이터베이스는 DNA(DNA-seq) 및/또는 RNA(RNA-seq)로부터의 시퀀싱 데이터를 포함하는 유전자 및/또는 게놈 데이터베이스를 포함할 수 있다. 이러한 게놈 데이터베이스의 예는 GENCODE, NCBI, Ensembl, {APPRIS} 및 NIH 인간 마이크로바이옴 프로젝트를 포함한다. 대안적으로 또는 추가적으로, 개체의 게놈 정보는 23andMe, deCODE 제네틱스(Genetics), 진 바이 진(Gene by Gene), 진 플래니트(Gene Planet), DNA 안세스트리(Ancestry), uBiome, 및 의료 제공자를 포함하지만 이에 제한되지 않는 맞춤형 게놈 데이터베이스로부터 검색될 수 있다. 일부 경우에서, 관심 종의 게놈의 적어도 일부를 포함하는 필요한 정보는 (예컨대, 개인용 컴퓨터와 같은 사용자 디바이스 상의 사용자 인터페이스를 통해) 사용자에 의해 제공될 수 있다.
종의 게놈은 종(예컨대, 세포 또는 유기체)에 존재하는 유전 물질의 일부 또는 완전한 세트를 포함할 수 있다. 종의 예는 포유동물(예컨대, 호모 사피엔스, 무스 무스쿨루스, 크리세툴루스 그리세우스, 라투스 노르베게쿠스(Rattus norvegecus), 판 파니스쿠스(Pan paniscus)), 어류(예컨대, 다니오 레리오, 암피프리온 프레나투스(Amphiprion frenatus)), 곤충(예컨대, 드로소필라 멜라노가스테르(Drosophila melanogaster)), 식물(예컨대, 아라비도프시스 탈리아나(Arabidopsis thaliana)), 회충(예컨대, 카에노르하브디티스 엘레간스), 및 박테리아를 포함한 미생물(예컨대, 에쉐리키아 콜리(Escherichia coli), 락토바실루스 불가리쿠스(Lactobacillus bulgaricus))을 포함하지만 이에 제한되지 않는다. 일부 경우에서, 박테리아는 보충제(예컨대, 배지로서 요거트 중) 및/또는 치료제(예컨대, 병태를 억제 또는 개선하기 위해)로서 개체에 의해 소비되는 균주를 포함할 수 있다. 일부 경우에서, 박테리아는 개체의 신체에 존재하는 균주(예컨대, 인간 마이크로바이옴)를 포함할 수 있다.
게놈의 유전 물질은 DNA 및/또는 RNA일 수 있다. 유전 물질은 유전자 및 유전자간 영역 내의 핵산 서열을 포함할 수 있다. 일부 경우에서, 유전 물질은 염색체의 단위로 표현될 수 있다. 일부 경우에서, 유전 물질은 유전자로부터 전사된 하나 이상의 전사체로 표시될 수 있다. 유전자 및 그의 각각의 하나 이상의 전사체는 하나 이상의 코딩 영역(즉, 엑손)을 포함할 수 있다. 일부 경우에서, 유전자 및 그의 각각의 하나 이상의 전사체는 하나 이상의 유전자내 비코딩 영역(즉, 인트론)을 포함할 수 있다. 하나 이상의 유전자내 비코딩 영역은 코딩 영역 사이에 위치될 수 있다. 일부 경우에서, 유전자는 하나의 전사체를 코딩할 수 있다. 일부 경우에서, 유전자는 복수의 전사체를 코딩하며, 각각의 전사체는 유전자로부터의 엑손 및 인트론의 상이한 변이를 포함한다. 일 예에서, RelA 유전자는 전사 인자 p65를 코딩하고, 호모 사피엔스의 RELA 유전자는 다양한 길이의 적어도 18개의 알려진 전사체: RELA-202, RELA-207, RELA-226, RELA-205, RELA-201, RELA-208, RELA-220, RELA-207, RELA-215, RELA-204, RELA-222, RELA-213, RELA-225, RELA-211, RELA-219, RELA-221, 및 RELA-212를 코딩한다. 따라서, 복수의 전사체는 상이한 수의 뉴클레오티드 염기(폴리뉴클레오티드 길이)를 가질 수 있다. 대안적으로 또는 추가적으로, 복수의 전사체는 상이한 수의 아미노산(폴리펩티드 길이)을 갖는 폴리펩티드(예컨대, 단백질)로 번역될 수 있다. 일부 경우에서, 복수의 전사체 각각은 하나 이상의 다른 전사체에 대해 보고된 상이한 발현 수준(풍부도)을 가질 수 있다.
유전자 혼성화를 위한 초기 gRNA 세트를 확인하기 위해, 복수의 유전자 전사체로부터 전사체를 선택할 수 있다. 일부 경우에서, 선택된 전사체는 복수의 전사체에서 하나 이상의 다른 전사체보다 더 높은 풍부도가 보고될 수 있다. 일부 실시양태에서, 복수의 유전자 전사체의 풍부도는 데이터베이스로부터 결정된다. 선택된 전사체는 복수의 전사체에서 첫 번째, 두 번째, 세 번째, 네 번째 또는 다섯 번째로 가장 높은 풍부도가 보고될 수 있다. 일부 경우에서, 선택된 전사체는 복수의 전사체에서 하나 이상의 다른 전사체보다 적어도 하나의 추가 뉴클레오티드를 가질 수 있다. 선택된 전사체는 복수의 전사체에서 첫 번째, 두 번째, 세 번째, 네 번째, 다섯 번째로 큰 수의 뉴클레오티드를 가질 수 있다. 일부 경우에서, 선택되는 전사체로부터 번역된 폴리펩티드(예컨대, 단백질)는 복수의 전사체에서 하나 이상의 다른 전사체로부터 번역된 하나 이상의 폴리펩티드보다 적어도 하나의 추가 아미노산을 가질 수 있다. 선택된 전사체로부터 번역된 폴리펩티드는 복수의 전사체에서 첫 번째, 두 번째, 세 번째, 네 번째 또는 다섯 번째로 큰 수의 아미노산을 가질 수 있다. 일부 경우에서, 복수의 전사체의 풍부도는 복수의 유전자 전사체로부터 선택된 전사체를 결정하는 데 사용되는 제1 기준일 수 있다.
유전자에 혼성화하기 위한 초기 gRNA 세트를 확인하기 위해, 선택된 전사체에 존재하는 유전자의 코딩 영역이 선택될 수 있다. 유전자가 DNA인 경우, 선택된 코딩 영역은 유전자의 종결자(하류)보다 유전자의 프로모터(상류)에 더 가까울 수 있다. 유전자가 RNA인 경우, 선택된 코딩 영역은 유전자의 3' 말단보다 유전자의 5' 말단에 더 가까울 수 있다. 일부 경우에서, 선택된 코딩 영역은 선택된 전사체 내의 초기 위치 엑손일 수 있다. 초기 위치 엑손은 유전자의 전반부 내에 위치된 엑손일 수 있다. 초기 위치 엑손은 유전자의 제1, 제2, 제3, 제4, 제5, 또는 제6 엑손일 수 있다.
일부 경우에서, 선택된 전사체의 선택된 코딩 영역은 복수의 유전자 전사체 중 하나 이상에 존재하는 하나 이상의 다른 엑손보다 더 높은 유병률을 갖는 엑손일 수 있다. 일부 경우에서, 선택된 전사체의 선택된 엑손은 복수의 전사체 내의 다른 전사체의 약 50%에 함유(공통)될 수 있다. 선택된 전사체의 선택된 엑손은 복수의 전사체 내의 다른 전사체의 적어도 약 40 퍼센트(%), 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 그 이상에 함유될 수 있다. 선택된 전사체의 선택된 엑손은 복수의 전사체 내의 다른 전사체의 최대 약 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 또는 그 이하에 함유될 수 있다. 일부 경우에서, 선택된 전사체의 선택된 엑손은 선택된 전사체에서 다른 엑손보다 적어도 하나의 추가 뉴클레오티드를 가질 수 있다. 일부 경우에서, 선택된 엑손은 적어도 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120개, 또는 그 이상의 뉴클레오티드를 가질 수 있다. 일부 경우에서, 엑손의 유병률 및 뉴클레오티드의 수는 모두 선택된 전사체의 선택된 엑손을 결정하기 위한 기준이 될 수 있다.
초기 gRNA 세트는 본원에서 결합 부위로도 지칭되는 표적 영역에 혼성화하도록 설계될 수 있다. 표적 영역은 종의 게놈 내의 유전자 또는 유전자의 일부일 수 있다. 일부 경우에서, 유전자의 일부가 유전자의 엑손일 수 있다. 엑손은 유전자의 각각의 전사체에서 발견되는 엑손일 수 있다. 엑손은 전술된 기준으로부터 복수의 유전자 전사체 중 선택된 전사체의 선택된 엑손일 수 있다. 일부 경우에서, 초기 gRNA 세트 내의 하나 이상의 gRNA는 단일 가이드 RNA(sgRNA)일 수 있다. 일부 경우에서, sgRNA는 단일 폴리뉴클레오티드 쇄일 수 있다. sgRNA는 혼성화 폴리뉴클레오티드 서열 및 제2 폴리뉴클레오티드 서열을 포함할 수 있다.
혼성화 폴리뉴클레오티드 서열은 유전자의 일부(예컨대, 복수의 유전자 전사체 중 선택된 전사체의 선택된 엑손)에 혼성화할 수 있다. sgRNA의 혼성화 폴리뉴클레오티드 서열은 17 내지 23개 뉴클레오티드 범위일 수 있다. sgRNA의 혼성화 폴리뉴클레오티드 서열은 적어도 17, 18, 19, 20, 21, 22, 23개, 또는 그 이상의 뉴클레오티드일 수 있다. sgRNA의 혼성화 폴리뉴클레오티드 서열은 최대 23, 22, 21, 20, 19, 18, 17개, 또는 그 이하의 뉴클레오티드일 수 있다. 일 예에서, gRNA의 혼성화 폴리뉴클레오티드 서열은 20개 뉴클레오티드이다. 혼성화 폴리뉴클레오티드 서열은 표적 영역에 대해 상보적이거나 부분적으로 상보적일 수 있다. 표적 영역에 상보적인 혼성화 폴리뉴클레오티드 서열은 표적 영역의 서열에 대해 100% 상보성을 갖는 서열을 포함할 수 있다. 표적 영역에 부분적으로 상보적인 gRNA는 표적 영역에 대해 100% 상보적인 서열에 비해 적어도 1, 적어도 2, 적어도 3, 적어도 4 또는 적어도 5개의 미스매치를 갖는 서열을 포함할 수 있다.
단일 폴리뉴클레오티드 쇄 sgRNA의 제2 폴리뉴클레오티드 서열은 Cas 효소와 상호작용(결합)할 수 있다. 제2 폴리뉴클레오티드 서열은 약 80개 뉴클레오티드일 수 있다. 제2 폴리뉴클레오티드 서열은 80개 뉴클레오티드일 수 있다. 제2 폴리뉴클레오티드 서열은 적어도 80개 또는 그 이상의 뉴클레오티드일 수 있다. 제2 폴리뉴클레오티드 서열은 최대 80개 또는 그 이하의 뉴클레오티드일 수 있다.
전반적으로, 단일 폴리뉴클레오티드 쇄 sgRNA는 97 내지 103개 뉴클레오티드 범위일 수 있다. 단일 폴리뉴클레오티드 쇄 sgRNA는 적어도 97, 98, 99, 100, 101, 102, 103개, 또는 그 이상의 뉴클레오티드일 수 있다. 단일 폴리뉴클레오티드 쇄 sgRNA는 최대 103, 102, 101, 100, 99, 98, 97개, 또는 그 이하의 뉴클레오티드일 수 있다. 일 예에서, 단일 폴리뉴클레오티드 쇄 sgRNA는 100개 뉴클레오티드일 수 있다.
일부 경우에서, 초기 gRNA 세트 내의 하나 이상의 gRNA는 CRISPR RNA(crRNA) 분절과 트랜스 활성화 crRNA(tracrRNA) 분절의 복합체(예컨대, 수소 결합을 통함)일 수 있다. crRNA는 혼성화 폴리뉴클레오티드 서열 및 tracrRNA 결합 폴리뉴클레오티드 서열을 포함할 수 있다. 혼성화 폴리뉴클레오티드 서열은 유전자의 일부(예컨대, 복수의 유전자 전사체 중 선택된 전사체의 선택된 엑손)에 혼성화할 수 있다. crRNA의 혼성화 폴리뉴클레오티드 서열은 17 내지 23개 뉴클레오티드 범위일 수 있다. crRNA의 혼성화 폴리뉴클레오티드 서열은 적어도 17, 18, 19, 20, 21, 22, 23개, 또는 그 이상의 뉴클레오티드일 수 있다. crRNA의 혼성화 폴리뉴클레오티드 서열은 최대 23, 22, 21, 20, 19, 18, 17개, 또는 그 이하의 뉴클레오티드일 수 있다. 일 예에서, crRNA의 혼성화 폴리뉴클레오티드 서열은 20개 뉴클레오티드이다. crRNA의 tracrRNA 결합 폴리뉴클레오티드 서열은 22개 뉴클레오티드일 수 있다. crRNA의 tracrRNA 결합 폴리뉴클레오티드 서열은 적어도 22개 또는 그 이상의 뉴클레오티드일 수 있다. crRNA의 tracrRNA 결합 폴리뉴클레오티드 서열은 최대 22개 또는 그 이하의 뉴클레오티드일 수 있다. 전반적으로 crRNA는 39 내지 45개 뉴클레오티드 범위일 수 있다. crRNA는 적어도 39, 40, 41, 42, 43, 44, 45개, 또는 그 이상의 뉴클레오티드일 수 있다. crRNA는 최대 45, 44, 43, 42, 41, 40, 39개, 또는 그 이하의 뉴클레오티드일 수 있다. tracrRNA는 60 내지 80개 뉴클레오티드 범위일 수 있다. tracrRNA는 적어도 60, 61, 62, 63, 64, 66, 68, 70, 72, 74, 76, 78, 80개, 또는 그 이상의 뉴클레오티드일 수 있다. tracrRNA는 최대 80, 79, 78, 77, 76, 74, 72, 70, 68, 66, 64, 62, 60개, 또는 그 이하의 뉴클레오티드일 수 있다. 일 예에서, tracrRNA는 72개 뉴클레오티드일 수 있다. 또 다른 예에서, crRNA의 혼성화 폴리뉴클레오티드 서열은 20개 뉴클레오티드이고, crRNA는 42개 뉴클레오티드이고, 각각의 tracrRNA는 72개 뉴클레오티드이다.
일부 경우에서, 초기 gRNA 세트는 하나 이상의 sgRNA 및 crRNA와 tracrRNA의 하나 이상의 복합체 둘 다를 포함할 수 있다. 대안적으로 또는 추가적으로, 초기 gRNA 세트 내의 하나 이상의 gRNA는 3개 또는 그 이상의 RNA 쇄의 복합체일 수 있다. 3개 또는 그 이상의 RNA 쇄의 복합체의 적어도 하나의 RNA 쇄는 혼성화 폴리뉴클레오티드 서열을 포함할 수 있다. 3개 또는 그 이상의 RNA 쇄의 복합체의 적어도 하나의 RNA 쇄는 Cas 효소 결합 서열을 포함할 수 있다.
gRNA가 관심 게놈 영역의 표적 영역에 혼성화하는 경우, 관심 게놈 영역의 혼성화된 부분은 프로토스페이서(표적 부위), Cas 효소에 의해 인식되는 프로토스페이서 인접 모티프 및 프로토스페이서의 반대 가닥(결합 부위)을 포함하는 표적 영역(또는 표적 유전자좌)일 수 있다. 프로토스페이서의 반대 가닥은 gRNA 혼성화 게놈 영역(서열)일 수 있다. 유전자 내의 gRNA 혼성화 서열은 17 내지 23개 뉴클레오티드 범위일 수 있다. 유전자 내의 gRNA 혼성화 서열은 적어도 17, 18, 19, 20, 21, 22, 23개, 또는 그 이상의 뉴클레오티드일 수 있다. 유전자의 gRNA 혼성화 서열은 최대 23, 22, 21, 20, 19, 18, 17개, 또는 그 이하의 뉴클레오티드일 수 있다.
초기 gRNA 세트 내의 각각의 gRNA는 관심 게놈 영역 내의 그의 각각의 결합 부위(예컨대, 선택된 엑손 내의 결합 부위)에 결합하도록 설계될 수 있다. 그러나, 일부 경우에서, 각각의 gRNA는 또한 PAM 부위를 포함하는 다른 Cas 표적 영역에 결합할 수 있으며, 결과적으로 오프-표적 혼성화 영역에 대한 바람직하지 않은 오프-표적 결합을 초래한다. 따라서, 초기 gRNA 세트의 각각의 gRNA에 대해, 오프-표적 값을 결정할 수 있다. 오프-표적 값은 종의 게놈 전체에서 결정될 수 있다. 일부 경우에서, 오프-표적 값은 종의 참조 게놈(예컨대, 인간 참조 게놈, 마이크로 바이옴 게놈 등) 전체에서 결정될 수 있다. 종의 참조 게놈은 공여자 집합체로부터의 DNA (또는 RNA)의 시퀀싱으로부터 어셈블링된 유전자 세트일 수 있다. 참조 게놈은 하나 이상의 염색체로부터의 유전 물질을 포함할 수 있다. 참조 게놈은 하나 이상의 콘티그(예컨대, 비국지화된 서열 콘티그)를 포함할 수 있다. 각각의 콘티그는 DNA의 연속 영역을 나타내는 겹치는 폴리뉴클레오티드 클론 세트일 수 있다. 일 예에서, 각각의 콘티그는 연속적인 DNA 서열일 수 있다. 오프-표적 값은 게놈 내의 복수의 표적 부위와 비교하여 초기 gRNA 세트 내의 각각의 gRNA에 대한 미스매치의 수를 열거함으로써 결정(예컨대, 계산)될 수 있다. 복수의 표적 부위는 게놈 전체에서 모든 가능한 Cas 뉴클레아제 표적 영역의 프로토스페이서를 포함할 수 있다.
일부 경우에서, 복수의 표적 부위 각각은 PAM 부위에 인접할 수 있다. 일부 경우에서, 복수의 표적 부위 각각은 Cas9, C2c1, C2c3, Cpf1, Cas13b 및 Cas13c로 이루어진 군으로부터 선택되는 뉴클레아제에 대한 PAM 부위에 인접할 수 있다. 일 예에서, Cas 뉴클레아제는 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9(SpCas9)이고, 복수의 표적 부위는 SpCas9의 PAM 부위(NGG, 여기서 "N"은 임의의 뉴클레오티드임)에 인접한 모든 뉴클레오티드 서열을 포함한다. 또 다른 예에서, Cas 뉴클레아제는 나이세리아 메닌기티디스(Neisseria meningitidis)로부터의 Cas9(NmCas9)이고, 복수의 표적 부위는 NmCas9의 PAM 부위(GATT)에 인접한 모든 뉴클레오티드 서열을 포함한다. 이러한 표적 부위를 지향하기 위해, 하나 이상의 뉴클레아제(예컨대, Cas9, C2c1, C2c3, Cpf1, Cas13b, Cas13c 등)가 적어도 하나의 gRNA에 커플링될 수 있다. 적어도 하나의 gRNA는 표적 부위(프로토스페이서)의 반대 가닥인 적어도 하나의 결합 부위에 혼성화하도록 설계될 수 있다.
일 예에서, 박테리아에 대해 보고된 복수의 표적 부위는 적어도 100, 1,000, 10,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000개 또는 그 이상의 표적 부위를 포함할 수 있다. 또 다른 예에서, 인간에 대해 보고된 복수의 표적 부위는 적어도 1000, 10,000, 100,000, 1,000,000, 10,000,000, 20,000,000, 30,000,000, 40,000,000, 50,000,000, 60,000,000, 70,000,000, 80,000,000, 90,000,000, 100,000,000, 200,000,000, 300,000,000개, 또는 그 이상의 표적 부위를 포함할 수 있다. 또 다른 예에서, 식물에 대해 보고된 복수의 표적 부위는 적어도 10,000, 100,000, 1,000,000, 10,000,000, 100,000,000, 200,000,000, 300,000,000, 400,000,000, 500,000,000, 600,000,000, 700,000,000, 800,000,000, 900,000,000, 1,000,000,000, 1,100,000,000, 1,200,000,000, 1,300,000,000, 1,400,000,000, 1,500,000,000개, 또는 그 이상의 표적 부위를 포함할 수 있다.
일부 경우에서, 복수의 표적 부위와 비교하여 각각의 gRNA에 대한 미스매치의 수를 열거하는 것은 0, 1, 2, 3, 4, 5개 또는 그 이상의 수의 미스매치를 갖는 오프-표적 혼성화 영역을 결정하는 것을 포함할 수 있다. 이는 gRNA가 설계된 전체 게놈 또는 이러한 게놈의 일부에서 결정될 수 있다. 게놈은 참조 게놈일 수 있다. 일부 경우에서, 게놈의 일부는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 염색체일 수 있다. 미스매치의 수는 표적에 혼성화 가능한 gRNA(예컨대, 20개 염기의 혼성화 폴리뉴클레오티드 서열을 포함하는 gRNA) 각각에 대해 독립적으로 계산될 수 있다. 열거된 미스매치의 수는 0일 수 있다. 열거된 미스매치의 수는 1일 수 있다. 열거된 미스매치의 수는 2일 수 있다. 열거된 미스매치의 수는 3일 수 있다. 열거된 미스매치의 수는 4일 수 있다. 일부 경우에서, 오프-표적 값을 결정(예컨대, 계산)하는 것은 각각의 초기 gRNA 세트에 대한 미스매치 수의 총합을 열거하는 것을 포함한다. 일부 경우에서, 열거는 표적 부위(잠재적 표적 부위)로부터의 0, 1, 2, 3, 4 또는 5개의 미스매치 수 중 적어도 2개를 별도로 열거하는 것을 포함할 수 있다. 일 예에서, 설계된 gRNA에 대해, 0개의 미스매치(예컨대, gRNA의 모든 뉴클레오티드가 오프-표적 혼성화 영역의 각각의 뉴클레오티드와 전체적으로 쌍을 이룸)를 갖는 1개의 오프-표적 혼성화 영역, 1개의 미스매치를 갖는 3개의 오프-표적 혼성화 영역역, 2개의 미스매치를 갖는 5개의 오프-표적 혼성화 영역, 3개의 미스매치를 갖는 7개의 오프-표적 혼성화 영역, 4개의 미스매치를 갖는 9개의 오프-표적 혼성화 영역이 있을 수 있다. 따라서, 설계된 gRNA의 생성된 오프-표적 값은 [1, 3, 5, 7, 9]로 표시될 수 있다. 또 다른 예에서, 또 다른 설계된 gRNA에 대해, 0개의 미스매치(예컨대, gRNA의 모든 뉴클레오티드가 오프-표적 혼성화 영역의 각각의 뉴클레오티드와 전체적으로 쌍을 이룸)를 갖는 0개의 오프-표적 혼성화 영역, 1개의 미스매치를 갖는 0개의 오프-표적 혼성화 영역역, 2개의 미스매치를 갖는 15개의 오프-표적 혼성화 영역, 3개의 미스매치를 갖는 50개의 오프-표적 혼성화 영역, 4개의 미스매치를 갖는 90개의 오프-표적 혼성화 영역이 있을 수 있다. 따라서, 설계된 gRNA의 생성된 오프-표적 값은 [0, 0, 15, 50, 90]으로 표시될 수 있다.
오프-표적 값은 초기 gRNA 세트로부터 gRNA 서브세트를 선택하기 위한 기준으로 사용될 수 있다. 일부 경우에서, 미스매치 수 중 하나를 역치로 사용하여 초기 gRNA 세트로부터 gRNA 서브세트를 생성할 수 있다. 일 예에서, gRNA 서브세트는 0개의 미스매치를 갖는 어떠한 오프-표적 혼성화 영역도 가질 수 없다. 이러한 경우에, gRNA 서브세트 각각은 [0, #, #, #, #]의 오프-표적 값을 가질 수 있으며, 여기서 "#"은 적어도 0의 임의의 정수를 나타낸다. 또 다른 예에서, gRNA의 서브세트는 0 및 1개의 미스매치를 갖는 오프-표적 혼성화 영역을 가질 수 없다. 이러한 경우에, gRNA 서브세트 각각은 [0, 0, #, #, #]의 오프-표적 값을 가질 수 있으며, 여기서 "#"은 적어도 0의 임의의 정수를 나타낸다. 이론에 구애됨이 없이, 역치를 증가시키면 시험관내 또는 생체내에서 오프-표적 효과의 가능성이 낮은 gRNA 서브세트를 산출할 수 있다.
초기 gRNA 세트의 각각의 gRNA에 대한 온-표적 효율 값을 결정할 수 있다. gRNA의 오프-표적 효율 값은 방위각 점수를 계산함으로써 결정될 수 있다. 방위각 점수는 도엔치(Doench) "규칙 세트 2" 점수화 모델을 기반으로 할 수 있다. 규칙 세트 2 점수화 모델은 하나 이상의 기계 학습 알고리즘을 사용하여 각각의 gRNA의 그의 각각의 표적 영역에 대한 온-표적 활성을 계산할 수 있다. 하나 이상의 기계 학습 알고리즘에 의해 사용되는 파라미터의 예는 다음과 같다: 단일 뉴클레오티드의 위치; 디뉴클레오티드의 위치; 단일 및 디뉴클레오티드의 빈도; gRNA에서 G 및 C 염기의 수; 유전자 내에서 gRNA의 위치; 및 gRNA의 처음 5개, 중간 8개 및 마지막 5개 뉴클레오티드의 용융 온도. 계산 후, 생성된 온-표적 활성(방위각 점수)은 0 내지 1의 범위일 수 있다.
일부 경우에서, 온-표적 효율 값(방위각 점수)은 초기 gRNA 세트로부터 gRNA 서브세트를 선택하는 기준이 될 수 있다. 초기 gRNA 세트로부터의 gRNA 서브세트는 적어도 약 0.2의 온-표적 효율 값을 가질 수 있다. 초기 gRNA 세트로부터의 gRNA 서브세트는 적어도 약 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 또는 그 이상의 온-표적 효율 값을 가질 수 있다. 일 예에서, 초기 gRNA 세트로부터의 gRNA의 서브세트는 0.4 초과의 온-표적 효율 값을 가질 수 있다.
일부 경우에서, gRNA의 온-표적 효율 및 오프-표적 값 모두는 초기 gRNA 세트로부터 gRNA 서브세트를 선택하는 기준이 될 수 있다. 하나의 예에서, gRNA 서브세트를 확인하는 것은 온-표적 효율의 역치(예컨대, 0.4 초과의 방위각 점수) 및 오프-표적 값의 역치(예컨대, 0 또는 1개의 미스매치를 갖는 오프-표적 혼성화 부위가 없음)를 기반으로 할 수 있다. 2개의 기준에 따라, 초기 gRNA 세트 내의 각각의 gRNA에 순위를 매길 수 있다. 초기 gRNA 세트로부터의 gRNA 서브세트는 최상위 gRNA 중 1에서 10까지 포함할 수 있다. 초기 gRNA 세트로부터의 gRNA 서브세트는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상의 최상위 gRNA를 포함할 수 있다. 초기 gRNA 세트로부터의 gRNA 서브세트는 최대 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 그 이하의 최상위 gRNA를 포함할 수 있다.
각각 종의 게놈의 유전자 일부에 혼성화하도록 설계된 초기 gRNA 세트를 사용하여 세포에서 유전자를 녹아웃(KO)할 수 있다. KO는 표적화된 KO일 수 있다. 대안적으로 또는 추가로, 각각 종의 게놈의 유전자 부분을 혼성화하도록 설계된 초기 gRNA 세트를 사용하여 세포에서 유전자에 돌연변이를 녹인(KI)할 수 있다. KI는 표적화된 삽입일 수 있다. 표적 삽입은 공여자 폴리뉴클레오티드의 삽입일 수 있다. 일부 경우에서, 적어도 하나의 CRISPR/Cas 복합체는 적어도 하나의 특이적 gRNA에 의해 표적 영역으로 안내되고 표적 영역을 절단할 수 있다. 일부 예에서, 절단은 삽입 및/또는 결실("indel") 돌연변이 또는 비상동성 말단 연결(NHEJ) 프로세스에 의한 프레임쉬프트를 유도하여 표적 유전자 특이적 KO를 초래할 수 있다. 일부 경우에서, CRISPR/Cas 복합체는 공동 투여된 공여자 폴리뉴클레오티드(단일 또는 이중 가닥)와 함께 특이적 gRNA에 의해 표적 게놈 영역으로 안내될 수 있다. 표적 영역의 절단 후, 상동성 지향적 복구(HDR) 프로세스는 (a) 절단된 표적 뉴클레오티드 서열의 복구 및 (b) 공여자 폴리뉴클레오티드로부터 표적 DNA로의 유전 정보의 전달을 위한 하나 이상의 주형으로서 하나 이상의 공여자 폴리뉴클레오티드를 사용할 수 있다. 유전 정보의 특성에 따라, HDR 프로세스는 표적 유전자 특이적 KO 또는 KI를 산출할 수 있다. HDR 매개된 유전자 KI의 적용 예는 단백질을 코딩하는 핵산 물질, mRNA, 작은 간섭 RNA(siRNA), 태그(예컨대, 6xHis), 리포터 단백질(예컨대, 녹색 형광 단백질), 및 유전자에 대한 조절 서열(예컨대, 프로모터, 폴리아데닐화 신호)의 추가(삽입 또는 대체)를 포함한다.
HDR 프로세스의 경우, 공여자 폴리뉴클레오티드는 카피될 원하는 유전자 편집(서열) 뿐만 아니라 절단된 표적 부위의 바로 상류 및 하류에서 상동성인 양 말단(상동성 아암) 상의 추가 뉴클레오티드 서열을 함유할 수 있다. 일부 경우에서, HDR 프로세스의 효율은 유전자 편집의 크기 및/또는 상동성 아암의 크기에 따라 달라질 수 있다. 대안적으로 또는 추가적으로, HDR 프로세스의 효율은 PAM 부위를 포함하는 Cas 표적 영역의 이용 가능성에 따라 달라질 수 있다. 따라서, (a) 복수의 유전자 및/또는 게놈 데이터베이스로부터 초기 RNA 서열 세트, (b) 온-표적 효율 및/또는 (c) 오프-표적 값을 결정하는 단계를 포함하는 방법을 이용하여 HDR을 위한 공여자 폴리뉴클레오티드 세트를 설계할 수 있다.
본 개시에 따른 CRISPR/cas 시스템은 다양한 세포에서 사용될 수 있다. 세포는 모든 원핵생물 또는 진핵생물의 살아있는 세포, 시험관내 배양을 위한 이들 유기체로부터 유래된 세포주, 동물 또는 식물 기원으로부터의 1차 세포일 수 있다. 진핵생물 세포는 아래에 나열되고 시험관내 배양에 대해 확립된 유기체로부터 유래되는 진균, 식물, 조류 또는 동물 세포 또는 세포주를 지칭할 수 있다. 진균은 아스페르길루스(Aspergillus), 페니실리움(Penicillium), 아크레모니움(Acremonium), 트리코데르마(Trichoderma), 크리소포리움(Chrysoporium), 모르티에렐라(Mortierella), 클루이베로미세스(Kluyveromyces) 또는 피키아(Pichia)의 종일 수 있고; 보다 바람직하게는, 진균은 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 테레우스(Aspergillus terreus), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 시트리눔(Penicillium citrinum), 아크레모니움 크리소게눔(Acremonium Chrysogenum), 트리코데르마 레세이(Trichoderma reesei), 모르티에렐라 알피네(Mortierella alpine), 크리소스포리움 룩크노웬세(Chrysosporium lucknowense), 클루이베로미세스 락티스(Kluyveromyces lactis), 피키아 파스토리스(Pichia pastoris) 또는 피키아 시페리이(Pichia ciferrii)의 종일 수 있다. 식물은 아라비도스피스(Arabidospis), 니코티아나(Nicotiana), 솔라눔(Solanum), 락투카(lactuca), 브라시카(Brassica), 오리자(Oryza), 아스파라구스(Asparagus), 피숨(Pisum), 메디카고(Medicago), 제아(Zea), 호르데움(Hordeum), 세칼레(Secale), 트리티쿰(Triticum), 카프시쿰(Capsicum), 쿠쿠미스(Cucumis), 쿠쿠르비타(Cucurbita), 시트룰리스(Citrullis), 시트루스(Citrus), 소르굼(Sorghum)의 속일 수 있다. 식물은 아라비도스피스 탈리아나(Arabidospis thaliana), 니코티아나 타바쿰(Nicotiana tabaccum), 솔라눔 리코페르시쿰(Solanum lycopersicum), 솔라눔 투베로숨(Solanum tuberosum), 솔라눔 멜론게나(Solanum melongena), 솔라눔 에스쿨렌툼(Solanum esculentum), 락투카 살리바(Lactuca saliva), 브라시카 나푸스(Brassica napus), 브라시카 올레라세아(Brassica oleracea), 브라시카 라파(Brassica rapa), 오리자 글라베리마(Oryza glaberrima), 오리자 사티바(Oryza sativa), 아스파라구스 오피시날리스(Asparagus officinalis), 피숨 사티붐(Pisum sativum), 메디카고 사티바(Medicago sativa), 제아 메이스(zea mays), 호르데움 불가레(Hordeum vulgare), 세칼레 세레알(Secale cereal), 트리티쿠마 에스티붐(Triticuma estivum), 트리티쿰 두룸(Triticum durum), 카프시쿰 사티부스(Capsicum sativus), 쿠쿠르비타 페포(Cucurbita pepo), 시트룰루스 라나투스(Citrullus lanatus), 쿠쿠미스 멜로(Cucumis melo), 시트루스 아우란티폴리아(Citrus aurantifolia), 시트루스 막시마(Citrus maxima), 시트루스 메디카(Citrus medica), 및 시트루스 레티쿨라타(Citrus reticulata)의 종일 수 있다. 동물 세포는 호모(Homo), 라투스(Rattus), 무스(Mus), 크리세툴루스(Cricetulus), 판(Pan), 수스(Sus), 보스(Bos), 다이오(Danio), 카니스(Canis), 펠리스(Felis), 에쿠스(Equus), 살모(Salmo), 온코르힌쿠스(Oncorhynchus), 갈루스(Gallus), 메레아그리스(Meleagris), 드로소필라(Drosophila), 카에노르하브디티스(Caenorhabditis)의 속일 수 있다. 동물 세포는 호모 사피엔스, 라투스 노르베기쿠스, 무스 무스쿨루스, 크리세툴루스 그리세우스, 판 파니스쿠스, 수스 스크로파(Sus scrofa), 보스 타우루스(Bos taurus), 카니스 루푸스(Canis lupus), 크리세툴루스 그리세우스, 다니오 레리오, 펠리스 카투스(Felis catus), 에쿠스 카발루스(Equus caballus), 라투스 노르베게쿠스, 살모 살라르(Salmo salar), 온코르힌쿠스 미키스(Oncorhynchus mykiss), 갈루스 갈루스(Gallus gallus), 멜레아그리스 갈로파보(Meleagris gallopavo), 드로소필라 멜라노가스테르, 및 카에노르하브디티스 엘레간스의 종일 수 있다.
예시적인 세포주는 CHO 세포(예컨대, CHO-K1); HEK293 세포; Caco2 세포; U2-OS 세포; NIH 3T3 세포; NSO 세포; SP2 세포; DG44 세포; K-562 세포, U-937 세포; MC5 세포; IMR90 세포; Jurkat 세포; HepG2 세포; HeLa 세포; HT-1080 세포; HCT-116 세포; Hu-h7 세포; Huvec 세포; 및 Molt 4 세포로 이루어진 군으로부터 선택될 수 있다. 본 개시내용의 범위에 적용 가능한 다른 세포의 예는 줄기 세포, 배아 줄기 세포(ESC) 및 유도 만능 줄기 세포(iPSC)를 포함할 수 있다. 모든 이들 세포주 및/또는 세포는 관심 유전자 또는 단백질을 생산, 발현, 정량화, 검출 및/또는 연구하기 위한 세포주 모델을 제공하기 위해; 및/또는 연구 및 생산 및 비제한적인 예로서 화학, 바이오연료, 치료제 및 농경학과 같은 다양한 분야에서 관심의 생물학적 활성 분자를 스크리닝하기 위해 본 발명의 방법에 의해 변형될 수 있다.
일부 경우에서, 초기 가이드 RNA 세트 내의 적어도 하나의 가이드 RNA로부터의 적어도 하나의 뉴클레오티드가 변형될 수 있다. 적어도 하나의 뉴클레오티드의 변형의 예는 다음을 포함할 수 있다: (a) 5' 말단 변형 또는 3' 말단 변형을 포함하는 말단 변형; (b) 염기의 대체 또는 제거를 포함하는 핵염기 (또는 "염기") 변형; (c) 2', 3' 및/또는 4' 위치에서의 변형을 포함하는 슈가 변형; 및 (d) 포스포디에스테르 연결의 변형 또는 대체를 포함하는 백본 변형. 이론에 구애됨이 없이, 적어도 하나의 뉴클레오티드의 변형은, 예컨대 (a) 개선된 표적 특이성; (b) CRISPR/Cas 복합체의 유효 농도 감소; (c) gRNA의 개선된 안정성(예컨대, 리보뉴클레아제(RNase) 및/또는 데옥시리보뉴클레아제(DNase)에 대한 내성); 및 (d) 감소된 면역원성을 제공할 수 있다. 일 예에서, 초기 가이드 RNA 세트 내의 적어도 하나의 가이드 RNA로부터의 적어도 하나의 뉴클레오티드는 2'-O-메틸 뉴클레오티드일 수 있다. 이러한 변형은 RNase 및/또는 DNase에 의한 공격과 관련하여 gRNA의 안정성을 증가시킬 수 있다.
일부 경우에서, 가이드 RNA에 편입되는 뉴클레오티드 슈가 변형은 2'-O-Cl-4알킬, 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-메톡시에틸("2'-MOE"), 2'-플루오로("2'-F"), 2'-아미노("2'-NH2"), 2'-아라비노실("2'-아라비노") 뉴클레오티드, 2'-F-아라비노실("2'-F-아라비노") 뉴클레오티드, 2'-잠금 핵산("LNA") 뉴클레오티드, 2'-잠금해제 핵산("ULNA") 뉴클레오티드, L형의 슈가("L-슈가"), 및 4'-티오리보실 뉴클레오티드로 이루어진 군으로부터 선택된다. 일부 경우에서, 가이드 RNA에 통합되는 뉴클레오티드간 연결 변형은 포스포로티오에이트 "P(S)"(P(S)), 포스포노카르복실레이트(P(CH2)nCOOR), 예컨대 포스포노아세테이트 "PACE"(P(CH2COO-)), 티오포스포노카르복실레이트((S)P(CH2)nCOOR), 예컨대 티오포스포노아세테이트 "thioPACE"((S)P(CH2)nCOO-)), 알킬포스포네이트(P(C1-3알킬), 예컨대 메틸포스포네이트-P(CH3), 보라노포스포네이트(P(BH3)), 및 포스포로디티오에이트(P(S)2)로 이루어진 군으로부터 선택된다.
일부 경우에서, 가이드 RNA로 편입되는 핵염기("염기") 변형은 2-티오우라실("2-티오U"), 2-티오시토신("2-티오C"), 4-티오우라실("4-티오U"), 6-티오구아닌("6-티오G"), 2-아미노아데닌("2-아미노A"), 2-아미노퓨린, 슈도우라실, 히포크산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신("5-메틸C"), 5-메틸우라실("5-메틸U"), 5-히드록시메틸시토신, 5-히드록시메틸우라실, 5,6-데히드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실("5-알릴U"), 5-알릴시토신("5-알릴C"), 5-아미노알릴우라실("5-아미노알릴U"), 5-아미노알릴-시토신("5-아미노알릴C"), 무염기 뉴클레오티드, Z 염기, P 염기, 비구조화 핵산("UNA"), 이소구아닌("이소G"), 이소시토신("이소C"), 및 5-메틸-2-피리미딘으로 이루어진 군으로부터 선택된다.
일부 경우에서, 하나 이상의 동위원소 변형이 뉴클레오티드 슈가, 핵염기, 포스포디에스테르 연결 및/또는 뉴클레오티드 포스페이트에 도입된다. 이러한 변형은 하나 이상의 15N, 13C, 14C, 중수소, 3H, 32P, 125I, 131I 원자 또는 트레이서로 사용되는 다른 원자 또는 요소를 포함하는 뉴클레오티드를 포함한다.
일부 경우에서, 가이드 RNA에 편입되는 "말단" 변형은 PEG(폴리에틸렌 글리콜), 탄화수소 링커(포함: 헤테로 원자(O, S, N)-치환된 탄화수소 스페이서; 할로-치환된 탄화수소 스페이서; 케토-, 카르복실-, 아미도-, 티오닐-, 카르바모일-, 티오노카르바마오일-함유 탄화수소 스페이서), 스페르민 링커, 예컨대 6-플루오레세인-헥실과 같은 링커에 부착된 형광 염료를 포함하는 염료(예컨대, 플루오레세인, 로다민, 시아닌), 소광제(예컨대, 다브실, BHQ) 및 다른 라벨(예컨대, 비오틴, 디곡시게닌, 아크리딘, 스트렙트아비딘, 아비딘, 펩티드 및/또는 단백질)로 이루어진 군으로부터 선택된다. 일부 경우에서, "말단" 변형은 올리고뉴클레오티드(데옥시뉴클레오티드 및/또는 리보뉴클레오티드 포함), 펩티드, 단백질, 슈가, 올리고당 류, 스테로이드, 지질, 엽산, 비타민 및/또는 다른 분자를 포함하는 다른 분자에 대한 가이드 RNA의 접합 (또는 리게이션)을 포함한다. 일부 경우에서, 가이드 RNA에 편입되는 "말단" 변형은, 예컨대 포스포디에스테르 연결로 편입되고 가이드 RNA 내의 2개의 뉴클레오티드 사이 어디에나 편입될 수 있는 2-(4-부틸아미도플루오레세인)프로판-1,3-디올 비스(포스포디에스테르) 링커와 같은 링커를 통해 가이드 RNA 서열에 내부적으로 위치된다.
일부 경우에서, 관심 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하는 방법을 수행하기 위해 컴퓨터를 사용할 수 있다.
도 1은 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드(예컨대, gRNA)를 설계하는 방법의 흐름도(100)의 예를 나타낸다. 방법은 (a) 하나 이상의 데이터베이스로부터 관심 유전자에 대한 세부 사항을 입수하는 단계(105); (b) 표적 영역(예컨대, 복수의 유전자 전사체 중 선택된 전사체의 엑손)을 찾는 단계(110); (c) 잠재적인 가이드(예컨대, 혼성화 폴리뉴클레오티드 서열을 갖는 하나 이상의 gRNA)를 입수하는 단계(115); (d) 각각의 가이드에 대한 온-표적 값을 산출하는 단계(예컨대, 각각의 가이드에 대한 방위각 점수를 계산)(120); (e) 각각의 가이드에 대한 오프-표적 히트를 산출하는 단계(125); (f) 가능한 오프-표적에 대한 더 많은 세부 사항을 입수하는 단계(예컨대, 게놈에 걸친 복수의 가능한 Cas 표적 영역과 비교하여 각각의 gRNA에 대한 미스매치의 수를 열거)(130); 및 (g) 가이드의 순위화된 목록을 반환하는 단계(135)를 포함한다. (g)에서, 가이드는 온-표적 값 및/또는 오프-표적 값에 의해 순위가 매겨질 수 있다. 일부 경우에서, 단계 (d) 및 (e-f)의 순서를 바꿀 수 있다.
도 2는 종의 게놈의 복수의 유전자 전사체의 표(200)의 예를 나타낸다. 정보는 하나 이상의 데이터베이스로부터 얻을 수 있다. 이 예에서, 관심 유전자는 호모 사피엔스(210)의 RELA(220)이다. RELA에 대해 다수의 전사체(230)가 알려져 있다. 복수의 RELA 전사체는 상이한 수의 뉴클레오티드 염기(232)를 가질 수 있다. 대안적으로 또는 추가적으로, 복수의 전사체는 상이한 수의 아미노산을 갖는 폴리펩티드(예컨대, 단백질)(234)로 번역될 수 있다. 또한, 전사체는 다수의 전사체 내의 하나 이상의 다른 전사체보다 더 높은 풍부도가 보고될 수 있다(나타내지 않음). 전술된 인자 중 하나 이상에 기초하여, 1차 전사체(240)가 선택된다.
도 3은 하나 이상의 gRNA에 의해 표적화될 전사체의 초기 코딩 영역의 예를 나타낸다. 인간 유전자 RELA의 복수의 전사체에서, 1차 전사체(240)를 분석하여 엑손(310)을 포함하는 초기 코딩 영역을 선택한다. 엑손(310)은 또한 복수의 전사체의 다른 전사체의 50 퍼센트(%) 초과에서 발견된다. 그 후, 엑손(310)에 걸친 모든 가능한 Cas 표적 영역을 확인하여 표적화 및 혼성화를 위한 하나 이상의 gRNA를 설계할 수 있다.
도 4a는 전사체로부터의 복수의 엑손의 상대적 표현(410) 및 엑손 길이(420)의 플롯의 예를 나타낸다. 복수의 엑손(위치 1 내지 11)은 1차 전사체(240)로부터 유래한다. 선택된 엑손(310)은 0.9 초과의 상대적 표현 값을 가지며, 이는 동일한 유전자의 다른 전사체의 90% 초과에 존재함을 시사한다. 선택된 엑손(310)의 길이는 또한 100개 초과의 뉴클레오티드이다.
도 4b는 gRNA(450, 452, 454 및 460) 및 그들의 오프-표적 및 온-표적 활성 분석의 예를 나타낸다. 각각의 gRNA에 대한 분석은 권장 브래킷 [A, B, C, D]로 요약되며, 여기서 A는 gRNA가 유전자의 초기 코딩 영역을 표적화하도록 설계되었는지의 여부를 나타내고. B는 의도된 유전자 표적 부위가 복수의 유전자 전사체에서 공통적인지의 여부를 나타내고(즉, 복수의 유전자 전사체 내의 다른 전사체의 50% 초과에서 발견됨); C는 gRNA의 온-표적 활성이 역치(즉, 0.4 초과의 방위각 점수)를 초과하는지의 여부를 나타내고; D는 gRNA의 오프-표적 활성이 역치를 초과하는지의 여부를 나타낸다(즉, 0 및 1 미스매치를 갖는 어떠한 오프-표적 혼성화 영역도 갖지 않음). gRNA가 사용을 위해 선택되기 위해서는 4가지 인자 A에서 D까지 모두 "참(True)"("거짓(False)"과 반대)이어야 한다. 도 4b에서는, gRNA(460)만이 4가지 인자 모두에 대해 참인 것으로 간주된다.
컴퓨터 시스템
본 개시내용의 또 다른 측면은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하기 위해 전술된 방법을 수행하기 위한 컴퓨터 시스템을 제공한다. 본 개시내용의 또 다른 측면은 복수의 관심 게놈 영역 각각에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하기 위해 전술된 방법을 수행하기 위한 컴퓨터 시스템을 제공한다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 컴퓨터 시스템은 복수의 유전자 전사체로부터 전사체를 선택하기 위한 컴퓨터 판독 가능 매체를 포함할 수 있다. 컴퓨터 시스템은 선택된 전사체의 유전자 내의 상이한 표적 부위에 혼성화하는 초기 gRNA 세트를 확인하기 위한 컴퓨터 판독 가능 매체를 포함할 수 있다.
컴퓨터의 컴퓨터 판독 가능 매체는 (예컨대, 사용자 디바이스 상의 사용자 인터페이스를 통해 사용자로부터) 관심 유전자 및 종의 입력을 수신할 수 있다. 컴퓨터 판독 가능 매체는 종의 게놈 및/또는 종의 참조 게놈을 포함하는 정보를 얻기 위해 복수의 데이터베이스와 통신할 수 있다. 일부 경우에서, 컴퓨터 판독 가능 매체는 DNA(DNA-seq) 및/또는 RNA(RNA-seq)로부터의 시퀀싱 데이터를 포함하는 유전자 및/또는 게놈 데이터베이스를 포함하는 복수의 데이터베이스와 통신할 수 있다. 이러한 정보에 기초하여, 컴퓨터 판독 가능 매체는 복수의 유전자 전사체로부터 전사체를 선택할 수 있다. 컴퓨터 판독 가능 매체는 선택된 전사체의 유전자 내의 상이한 표적 부위에 혼성화하는 초기 gRNA 세트를 확인할 수 있다. 대안적으로 또는 추가적으로, 컴퓨터 판독 가능 매체는 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 gRNA를 설계하기 위한 전술된 방법과 관련된 하나 이상의 작업을 수행하도록 구성될 수 있다(예컨대, 하나 이상의 gRNA에 대한 오프-표적 값을 계산). 더욱이, 컴퓨터 판독 가능 매체는 또한 설계 도구의 사용자에 의해 선택되는 생체중합체(예컨대, RNA) 합성기를 자동으로 활성화하기 위한 명령을 포함할 수 있다.
도 5는 게놈 전체에서 복수의 gRNA의 오프-표적 값을 계산하기 위한 데이터 프로세싱 아키텍처(500)를 도시한다. 초기 gRNA 세트 (또는 대안적으로 각각의 gRNA의 각각의 표적 부위 서열 세트)(510)는 컴퓨팅 플랫폼(예컨대, 서버리스 컴퓨팅 플랫폼)의 "마스터" 쿼리(520)에 입력된다. 동시에, 게놈(예컨대, 프로토스페이서 서열 및 PAM 부위를 포함하는 각각의 도메인) 전체에서 모든 가능한 Cas 표적 영역의 데이터베이스는 더 작은 서브세트(또는 "샤드")(505)로 분할된다. 오프-표적 값을 얻기 위해, 마스터 쿼리(520)는 각각의 샤드당 하나씩 추가 "슬레이브" 쿼리(525)를 호출하고, 각각의 슬레이브 쿼리(530)를 각각의 샤드와 비교하여 각각의 gRNA의 미스매치 및 전체 오프-표적 값을 결정한다. 오프-표적 검색 후, 슬레이브 쿼리-샤드 비교 결과는 결과 집계기(540)로 수집된다. 일 예에서, 약 320,000,000개의 Cas 표적 영역의 데이터베이스는 각각 약 2,000,000개의 Cas 표적 영역을 포함하는 161개의 샤드로 분할될 수 있다. 따라서, 마스터 쿼리는 오프-표적 검색을 위해 161개의 슬레이브 쿼리를 호출한다. 데이터 프로세싱 아키텍처(500)를 사용하고 동시에 비교를 실행함으로써 분석의 출력 시간을 줄일 수 있다.
다중 gRNA 시스템
일부 실시양태에서, 본 개시내용은 관심 게놈 영역을 표적화하는 가이드 RNA(gRNA) 세트를 확인하는 방법을 제공한다. gRNA 세트는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 10, 적어도 20, 적어도 50, 적어도 100, 또는 적어도 200개의 gRNA를 포함할 수 있다. gRNA 세트는 2개의 gRNA로 이루어질 수 있다. gRNA 세트는 3개의 gRNA로 이루어질 수 있다. gRNA 세트는 4개의 gRNA로 이루어질 수 있다. 방법은 컴퓨터에서 gRNA 세트를 설계하는 단계를 포함할 수 있다. 세트 내의 각각의 gRNA는 관심 게놈 영역(예컨대, 유전자, 유전자 클러스터, 엑손) 내의 다른 표적 부위에 혼성화될 수 있다.
동일한 관심 게놈 영역을 표적화하는 gRNA 세트 내의 각각의 gRNA의 표적 부위 사이의 거리는 또한 본원에서 가이드간 간격으로 지칭될 수 있다. 가이드간 간격은 gRNA 세트에서 제1 gRNA의 관심 게놈 영역 내의 제1 표적 부위의 3' 말단으로부터 제2 gRNA의 관심 게놈 영역 내의 제2 표적 부위의 5' 말단까지의 염기쌍으로 된 거리일 수 있다. 가이드간 간격은 제1 gRNA의 관심 게놈 영역 내의 표적 부위 및 제2 gRNA의 관심 게놈 영역 내의 표적 부위를 포함하는 염기쌍을 포함하지 않을 수 있다. 가이드간 간격은 참조 게놈을 기반으로 하여 결정될 수 있다. 가이드간 간격은 관심 게놈 영역 내의 순차적인 표적 부위 사이에서 결정될 수 있다. 일 예에서, gRNA 세트에서 gRNA의 관심 게놈 영역 내의 표적 부위 사이의 최소 거리는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기가 떨어져 있다. 또 다른 예에서, gRNA 세트에서 각각의 gRNA의 관심 게놈 영역 내의 표적 부위 사이의 최소 거리는 gRNA 세트로부터의 모든 다른 gRNA의 관심 게놈 영역 내의는 표적 부위로부터 적어도 30개의 염기가 떨어져 있다. 또 다른 예에서, gRNA 세트에서 gRNA의 관심 게놈 영역 내의 표적 부위 사이의 최대 거리는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 최대 150개의 염기가 떨어져 있다. 일부 실시양태에서, 복수의 gRNA 세트 내의 gRNA 세트의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%는 적어도 3개의 gRNA를 포함한다.
편집 효율은 관심 게놈 영역에서 편집된 유전자형을 포함하는 세포의 비율을 나타낼 수 있다. 세포는 적어도 하나의 세트의 gRNA, 뉴클레아제 및 임의적으로 공여자 폴리뉴클레오티드와 접촉된 세포 집단일 수 있다. 편집된 유전자형은 임의의 비야생형 유전자형일 수 있다. 편집된 유전자형은 야생형 유전자형에 비해 삽입 또는 결실을 포함할 수 있다. 편집된 유전자형은 표적 부위에서 CRISPR/Cas 복합체로 인한 이중 가닥 파손의 복구 결과일 수 있다. 편집된 유전자형은 관심 게놈 영역의 녹아웃을 초래할 수 있다. 일부 실시양태에서, 30개 또는 그 이상의 염기의 gRNA 세트에서 각각의 gRNA의 관심 게놈 영역 내의 표적 영역 사이에 최소 거리를 갖는 gRNA 세트는 적어도 50%, 60%, 70%, 또는 80%의 편집 효율을 생성한다. 일부 실시양태에서, 복수의 gRNA 세트는 적어도 50%, 60%, 70% 또는 80%의 평균 편집 효율을 포함한다. 일부 실시양태에서, 복수의 gRNA 세트에서 gRNA 세트의 적어도 50%, 60%, 70%, 80%, 90% 또는 95%는 50% 초과의 평균 편집 효율을 포함한다. 일부 실시양태에서, 복수의 gRNA 세트에서 gRNA 세트의 적어도 50%, 60%, 70%, 80%, 90% 또는 95%는 70% 초과의 평균 편집 효율을 포함한다. 편집 효율은 시퀀싱에 의해 결정될 수 있다. 시퀀싱은 생거(Sanger) 시퀀싱일 수 있다. 시퀀싱은 고처리량 시퀀싱일 수 있다.
세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 10개의 염기가 떨어져 있는 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 관심 게놈 영역 내의 표적 부위로부터 최대 170개의 염기가 떨어져 있는 관심 게놈 영역의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 관심 게놈 영역 내의 표적 부위로부터 최대 1000개의 염기가 떨어져 있는 관심 게놈 영역의 표적 부위에 혼성화될 수 있다. 바람직하게는, gRNA 세트로부터의 각각의 gRNA의 관심 게놈 영역 내의 표적 부위는 세트 내의 임의의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 약 10-170, 30-170, 10-150, 30-150, 10-100, 30-100, 또는 30-1000개 염기로 분리된다. 이러한 배열은 다양한 CRISPR 효소 간의 개선된 KO 특성 및 상승 효과를 가져올 수 있다. 일부 실시양태에서, 관심 게놈 영역의 녹아웃은 관심 게놈 영역의 녹아웃을 달성하기 위해 개별적으로 필요한 각각의 gRNA의 양보다 적은 gRNA 세트 내의 각각의 gRNA의 양을 사용하여 달성된다. 관심 게놈 영역의 녹아웃을 달성하는 데 필요한 gRNA 세트 내의 각각의 gRNA의 양은 관심 게놈 영역의 녹아웃을 달성하는 데 개별적으로 필요한 각각의 gRNA 양의 1/3일 수 있다. 관심 게놈 영역의 녹아웃을 달성하는 데 필요한 gRNA 세트 내의 각각의 gRNA의 양은 관심 게놈 영역의 녹아웃을 달성하는 데 개별적으로 필요한 각각의 gRNA 양의 1/2일 수 있다.
특정 실시양태에서, 복수의 가이드 RNA(gRNA) 세트 내의 각각의 gRNA 세트가 복수의 관심 게놈 영역 내의 상이한 관심 게놈 영역을 표적화하는 복수의 gRNA 세트를 확인하는 방법이 추가로 본원에 기재된다. 복수의 관심 게놈 영역은 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 10개 초과의 관심 게놈 영역을 포함할 수 있다. 방법은 컴퓨터에서 복수의 관심 게놈 영역 각각에 대해 상이한 gRNA 세트를 설계하는 단계를 포함할 수 있다. gRNA 세트 내의 각각의 gRNA는 관심 게놈 영역(예컨대, 유전자, 유전자 클러스터, 엑손) 내의 상이한 표적 부위에 혼성화될 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 10개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 최대 170개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 최대 1000개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 바람직하게는 gRNA 세트로부터의 각각의 gRNA의 관심 게놈 영역 내의 표적 부위는 세트 내의 임의의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 약 10-170, 30-170, 10-150, 30-150, 10-100, 30-100, 또는 30-1000개 염기로 분리된다. 이러한 배열은 다양한 CRISPR 효소 간의 개선된 KO 특성 및 상승 효과를 가져올 수 있다.
컴퓨터는 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법을 수행하기 위한 전술된 컴퓨터 시스템일 수 있다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 관심 게놈 영역은 게놈의 비코딩 영역일 수 있다. 비코딩 영역은 조절 요소일 수 있다. 조절 요소는 시스-조절 요소 또는 트랜스-조절 요소일 수 있다. 시스-조절 요소는 프로모터, 인핸서 또는 사일런서일 수 있다. 확인된 gRNA 세트는 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 gRNA 서브세트일 수 있다. 일부 경우에서, gRNA 세트의 하나 이상의 gRNA는 단일 가이드 RNA(sgRNA)일 수 있다. 일부 경우에서, gRNA 세트의 하나 이상의 gRNA는 CRISPR RNA(crRNA) 분절와 트랜스 활성화 crRNA(tracrRNA) 분절의 복합체(예컨대, 수소 결합을 통함)일 수 있다.
gRNA 세트의 각각의 gRNA는 관심 게놈 영역 내의 상이한 표적 부위에 혼성화하는 폴리뉴클레오티드 서열(혼성화 폴리뉴클레오티드 서열)을 포함할 수 있다. gRNA의 혼성화 폴리뉴클레오티드 서열은 17 내지 23개 뉴클레오티드 범위일 수 있다. gRNA의 혼성화 폴리뉴클레오티드 서열은 적어도 17, 18, 19, 20, 21, 22, 23개, 또는 그 이상의 뉴클레오티드일 수 있다. gRNA의 혼성화 폴리뉴클레오티드 서열은 최대 23, 22, 21, 20, 19, 18, 17개, 또는 그 이하의 뉴클레오티드일 수 있다. 일 예에서, gRNA의 혼성화 폴리뉴클레오티드 서열은 20개 뉴클레오티드이다.
종의 게놈의 유전자는 하나 이상의 전사체를 가질 수 있다. 일 예에서, 유전자는 하나 이상의 전사체로 전사될 수 있다. 하나 이상의 전사체는 하나 이상의 코딩 영역(즉, 엑손) 및/또는 하나 이상의 유전자내 비-코딩 영역(즉, 인트론)을 포함할 수 있다. 일부 경우에서, 관심 게놈 영역은 유전자의 코딩 영역을 포함할 수 있다. 일부 경우에서, 관심 게놈 영역은 유전자의 비코딩 영역을 포함할 수 있다. 일부 경우에서, 관심 게놈 영역은 유전자의 코딩 영역 및 유전자의 비코딩 영역을 포함할 수 있다. 유전자가 DNA인 경우, 유전자의 코딩 영역은 유전자의 종결자(하류)보다 유전자의 프로모터(상류)에 더 가까울 수 있다. 유전자가 RNA인 경우, 유전자의 코딩 영역은 유전자의 3' 말단보다 유전자의 5' 말단에 더 가까울 수 있다. 일부 경우에서, 관심 게놈 영역은 유전자의 엑손을 포함할 수 있다. 관심 게놈 영역은 유전자 내의 초기 위치 엑손일 수 있다. 초기 위치 엑손은 유전자의 전반부에 위치된 엑손일 수 있다. 초기 위치 엑손은 유전자의 제1, 제2, 제3, 제4, 제5, 제6 엑손일 수 있다.
종의 게놈의 유전자는 유전자 패밀리일 수 있고, gRNA 세트에 의해 표적화되는 관심 게놈 영역은 유전자 패밀리를 포함할 수 있다. 일 예에서, 유전자는, RELA, RELB, REL, NFKB1 및 NFKB2를 포함하는 NF-κB(Rel) 패밀리의 유전자이고, 관심 게놈 영역은 5개의 유전자를 포함하는 NF-κB(Rel) 패밀리의 유전자일 수 있다. 또 다른 예에서 페록시레독신 패밀리의 유전자는 PRDX1, PRDX2, PRDX3, PRDX4, PRDX5 및 PRDX6을 포함하고, 관심 게놈 영역은 6개의 유전자를 포함하는 페록시레독신 패밀리의 유전자일 수 있다.
종의 게놈의 유전자는 슈도유전자 중 하나일 수 있다. 슈도유전자는 프로세싱된 슈도유전자, 프로세싱되지 않은 슈도유전자, 단일 슈도유전자 및 슈도-슈도 유전자일 수 있다.
gRNA 세트에 의해 표적화되는 관심 게놈 영역은 유전자 패밀리로부터의 하나 이상의 코딩 영역을 포함할 수 있다. 하나 이상의 코딩 영역의 각각의 코딩 영역은 유전자 패밀리의 0% 내지 100%로 나타낼 수 있다(이에 함유될 수 있다). 하나 이상의 코딩 영역의 각각의 코딩 영역은 적어도 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 그 이상의 유전자 패밀리로 나타낼 수 있다. 하나 이상의 코딩 영역의 각각의 코딩 영역은 최대 100%, 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5%, 또는 그 이하의 유전자 패밀리로 나타낼 수 있다. 일 예에서, 관심 게놈 영역은 유전자 패밀리의 모든 유전자에서 나타나는 하나의 코딩 영역을 포함한다.
일부 경우에서, 게놈 영역은 유전자의 연속적인 폴리뉴클레오티드 분절이다. 관심 게놈 영역은 1,000개 염기 또는 뉴클레오티드(1 kb) 내지 500 kb의 범위일 수 있다다. 관심 게놈 영역은 적어도 1 kb, 5 kb, 10 kb, 15 kb, 20 kb, 50 kb, 100 kb, 500 kb 또는 그 이상일 수 있다. 관심 게놈 영역은 최대 500 kb, 100 kb, 50 kb, 20 kb, 15 kb, 10 kb, 5 kb, 1 kb, 또는 그 이하일 수 있다.
관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 2 내지 200개의 gRNA를 포함할 수 있다. 관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200개 또는 그 이상의 gRNA를 포함할 수 있다. 관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 적어도 2개의 gRNA를 포함할 수 있다. 관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 적어도 3개의 gRNA를 포함할 수 있다. 관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 최대 200, 100, 90, 80, 70, 60, 50, 40, 30, 0, 15, 10, 9, 8, 7, 6, 5, 4개, 3개, 또는 그 이하의 gRNA를 포함할 수 있다. 관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 최대 4개의 gRNA를 포함할 수 있다. 관심 게놈 영역을 표적화하는 확인된 gRNA 세트는 최대 3개의 gRNA를 포함할 수 있다.
관심 게놈 영역을 표적화하는 gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 약 10 내지 200개의 염기(뉴클레오티드)가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 관심 게놈 영역을 표적화하는 gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 약 30 내지 1000개의 염기(뉴클레오티드)가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 관심 게놈 영역을 표적화하는 gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기(뉴클레오티드)가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 10, 15, 20, 25, 30, 25, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200개, 또는 그 이상의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 최대 2000, 1500, 1000, 500, 200, 180, 160, 140, 120, 100, 90, 80, 70, 60, 50, 45, 40, 35, 30, 25, 20, 15, 10개, 또는 그 이하의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다.
gRNA 세트는 gRNA 세트가 CRISPR/Cas 복합체 세트를 세포에서 관심 게놈 영역 내의 상이한 표적 부위로 안내하도록 설계될 수 있다. CRISPR/Cas 복합체는 표적 부위에서 핵산 서열에 파손을 만들 수 있다. 파손은 이중 가닥 파손일 수 있다. 파손은 단일 가닥 파손일 수 있다. 일 예에서, gRNA 세트는 CRISPR/Cas 복합체 세트가 세포에서 관심 게놈 영역 내의 하나 이상의 상이한 표적 부위를 녹아웃(KO)하도록 설계될 수 있다. 녹아웃은 CRISPR/Cas 복합체로 인한 파손의 복구에 의해 도입된 프레임쉬프트 돌연변이의 결과로 발생할 수 있다. 녹아웃은 관심 유전자 내의 엑손이 결실된 결과로 발생할 수 있다. 녹아웃은 관심 게놈 영역에서 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 100, 적어도 1000, 또는 적어도 10,000개의 염기쌍이 결실된 결과로 발생할 수 있다. 녹아웃은 유전자의 기능을 제거할 수 있다.
또 다른 예에서, gRNA 세트는 CRISPR/Cas 복합체 세트가 세포에서 관심 게놈 영역 내의 상이한 표적 부위에서 하나 이상의 돌연변이를 녹인(KI)하도록 설계될 수 있다. CRISPR/Cas 복합체 세트는 KI를 위한 공여자 폴리뉴클레오티드 세트와 함께 공동 투여될 수 있다. 하나 이상의 돌연변이의 녹인은 점 돌연변이, 대립유전자, 태그 또는 외인성 엑손을 게놈으로 도입할 수 있다. 점 돌연변이, 대립유전자, 태그 또는 외인성 엑손은 공여자 폴리뉴클레오티드 상에 위치될 수 있다. 공여자 폴리뉴클레오티드는 본원에 기재된 바와 같이 상동성 지향적 복구(HDR)를 사용하여 게놈에 편입될 수 있다. 하나 이상의 돌연변이의 녹인은 이전에 기능적이지 않은 유전자의 기능을 복원할 수 있다. 하나 이상의 돌연변이의 녹인은 유전자의 기능을 개선할 수 있다. 유전자 기능의 개선은 유전자에 의해 생산되는 단백질의 양의 증가일 수 있다. 녹인은 유전자의 기능을 녹아웃시킬 수 있다.
일부 실시양태에서, 하나 이상의 돌연변이의 녹인은 게놈에 태그를 도입할 수 있다. 태그는 검출 가능한 태그일 수 있다. 검출 가능한 태그는 형광 태그일 수 있다. 검출 가능한 태그는 제한 단편 길이 다형(RFLP)일 수 있다.
일부 실시양태에서, 하나 이상의 돌연변이의 녹인은 게놈에 점 돌연변이를 도입할 수 있다. 점 돌연변이는 관심 게놈 영역에서 핵산의 삽입, 결실 또는 치환일 수 있다. 일부 실시양태에서, 하나 이상의 돌연변이의 녹인은 게놈에 대립유전자를 도입할 수 있다. 대립유전자는 트랜스진일 수 있다.
일부 실시양태에서, 하나 이상의 돌연변이의 녹인은 게놈에 외인성 엑손을 도입할 수 있다. 엑손은 표적 유전자의 내인성 엑손과 적어도 80%, 85%, 90%, 95% 또는 99% 동일할 수 있다. 내인성 엑손은 야생형 엑손일 수 있다. 외인성 엑손은 표적 유전자의 내인성 엑손에 비해 적어도 하나의 돌연변이를 포함하는 엑손일 수 있다. 일부 실시양태에서, 하나 이상의 돌연변이의 녹인은 내인성 엑손을 외인성 엑손으로 대체할 수 있다. 외인성 엑손은 야생형 엑손에 비해 적어도 하나의 돌연변이를 포함할 수 있다. 외인성 엑손은 공여자 폴리뉴클레오티드에 있을 수 있다.
일부 실시양태에서, 방법은 복수의 초기 gRNA 세트를 생성하기 위해 적어도 제2 초기 gRNA 세트를 설계하는 단계를 추가로 포함한다. 방법은 복수의 유전자를 표적화하는 복수의 초기 gRNA 세트를 확인하는 단계를 포함할 수 있으며, 여기서 복수의 초기 gRNA 세트 내의 각각의 초기 gRNA 세트는 복수의 유전자에서 유전자 내의 상이한 표적 부위에 혼성화한다.
다중 gRNA의 키트
본 개시내용의 또 다른 측면은 관심 게놈 영역을 표적화하는 가이드 RNA(gRNA) 세트를 확인하기 위한 전술된 방법에 의해 생성된 복수의 gRNA를 포함하는 키트를 제공한다. 키트는 gRNA 세트를 포함할 수 있다. 세트 내의 각각의 gRNA는 관심 게놈 영역 내의 상이한 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 10개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 가이드 RNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 최대 170개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 가이드 RNA 세트로부터의 모든 다른 가이드 RNA의 관심 게놈 영역 내의 표적 부위로부터 30 내지 1000개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 일부 실시양태에서, gRNA 세트는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 10, 적어도 15, 적어도 20, 또는 적어도 30개의 gRNA를 포함한다.
일부 실시양태에서, 키트는 복수의 관심 게놈 영역 각각에 대해 하나의 gRNA 세트를 포함한다. 본원에 기재된 키트는 관심 게놈 영역 또는 복수의 관심 게놈 영역을 녹아웃시키는 데 사용될 수 있다. 본원에 기재된 키트는 관심 게놈 영역에 공여자 폴리뉴클레오티드를 도입하는 데 사용될 수 있다. 본원에 기재된 키트는 복수의 공여자 폴리뉴클레오티드를 복수의 관심 게놈 영역에 도입하는데 사용될 수 있다.
일부 실시양태에서, 키트는 적어도 하나의 공여자 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 키트는 복수의 관심 게놈 영역 각각에 대해 적어도 하나의 공여자 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 키트는 뉴클레아제를 포함한다. 뉴클레아제는 Cas 단백질일 수 있다. Cas 단백질은, 예컨대 Cas9, C2c1, C2c3 또는 Cpf1과 같은 본원에 기재된 임의의 Cas 단백질일 수 있다. 일부 실시양태에서, 키트는 버퍼와 같은 시약을 포함한다. 버퍼는 트리스 버퍼, 트리스-EDTA(TE) 버퍼, 트리스/보레이트/EDTA(TBE) 버퍼 또는 트리스-아세테이트-EDTA(TAE) 버퍼일 수 있다. 키트는 RNAase가 없는 H2O를 포함할 수 있다. 일부 실시양태에서, 키트는 형질감염 시약을 포함한다. 형질감염제의 예는 리포펙타민TM 및 올리고펙타민TM을 포함하지만 이에 제한되지 않는다.
일부 실시양태에서, 키트는 바이알, 관 등과 같은 하나 이상의 용기를 수용하도록 구획화된 캐리어, 패키지 또는 용기를 포함하고, 각각의 용기(들)는 본원에 기재된 방법에 사용될 분리된 요소 중 하나를 포함한다. 적합한 용기는, 예컨대 병, 바이알, 주사기 및 시험관을 포함한다. 일부 실시양태에서, 용기는 유리 또는 플라스틱과 같은 다양한 재료로 형성된다. 키트는 다중-웰 플레이트를 포함할 수 있다. 다중-웰 플레이트는 4-웰 플레이트, 6-웰 플레이트, 12-웰 플레이트, 24-웰 플레이트, 48-웰 플레이트, 96-웰 플레이트 또는 384-웰 플레이트일 수 있다. 일부 실시양태에서, 다중-웰 플레이트 내의 각각의 웰은 하나의 gRNA를 포함한다. 일부 실시양태에서, 다중-웰 플레이트 내의 각각의 웰은 단일 관심 게놈 영역을 표적화하는 하나의 gRNA 세트를 포함한다. 일부 실시양태에서, 다중-웰 플레이트 내의 각각의 웰은 복수의 관심 게놈 영역을 표적화하는 복수의 gRNA를 포함한다.
일부 실시양태에서, 키트는 하나 이상의 추가 용기를 포함하고, 각각은 본원에 기재된 사용을 위한 상업적 및 사용자 관점에서 바람직한 하나 이상의 다양한 물질(예컨대, 임의적으로 농축된 형태의 시약 및/또는 디바이스)을 포함한다. 이러한 물질의 비제한적인 예는 버퍼, 프라이머, 효소, 희석제, 필터, 캐리어, 패키지, 용기, 바이알 및/또는 내용물 및/또는 사용 지침을 열거하는 튜브 라벨 및 사용 지침을 갖는 패키기 삽입물을 포함하지만 이에 제한되지 않는다. 일부 경우에서, 일련의 지침이 포함된다. 일부 경우에서, 라벨은 용기에 있거나 용기와 연관되어 있다. 라벨을 형성하는 문자, 숫자 또는 다른 문자가 용기 자체에 부착, 성형 또는 에칭되는 경우, 라벨은 용기에 있을 수 있다. 라벨은, 예컨대 패키지 삽입물로서 용기를 유지하는 리셉터클 또는 캐리어 내에 존재하는 경우, 컨테이너와 연관될 수 있다. 라벨은 내용물이 특정 치료 적용을 위해 사용될 것임을 나타내기 위해 사용될 수 있다. 라벨은 본원에 기재된 방법에서와 같이 내용물의 사용에 대한 지시를 나타낼 수 있다.
본 개시내용의 또 다른 측면은 관심 게놈 영역을 표적화하는 가이드 RNA(gRNA)를 확인하기 위한 전술된 방법에 의해 생성된 단일 gRNA를 포함하는 키트를 제공한다. gRNA는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다.
본 개시내용의 또 다른 측면은 관심 게놈 영역에서 변형을 포함하는 복수의 변형된 세포를 포함하는 키트를 제공한다. 복수의 변형된 세포는 세포를 뉴클레아제 및 임의적으로 공여자 폴리뉴클레오티드와 함께 관심 게놈 영역을 표적화하는 가이드 RNA(gRNA) 세트를 확인하기 위해 상술된 방법에 의해 생성된 gRNA 세트와 접촉시킴으로서 생산될 수 있다.
컴퓨터 시스템 알고리즘
본 개시내용의 또 다른 측면은 관심 게놈 영역을 표적화하는 가이드 RNA(gRNA) 세트를 확인하기 위해 전술된 방법을 수행하기 위한 알고리즘을 포함하는 컴퓨터 시스템을 제공한다. 알고리즘은 gRNA 세트를 확인하는 단계를 포함할 수 있다. 알고리즘은 복수의 관심 게놈 영역 각각에 대한 gRNA 세트를 확인하는 단계를 포함할 수 있다. 세트 내의 각각의 gRNA는 관심 게놈 영역 내의 상이한 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 10개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 최대 170개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다. 세트 내의 각각의 gRNA는 gRNA 세트로부터의 적어도 하나의 다른 gRNA의 관심 게놈 영역 내의 표적 부위로부터 30 내자 1000개의 염기가 떨어져 있는 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다.
오프-표적 효율 계산
본 개시내용의 또 다른 측면은 관심 게놈 영역에 혼성화하기 위한 적어도 하나의 가이드 RNA(gRNA)를 선택하는 방법을 제공한다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 방법은, 유전자에 혼성화하는 초기 gRNA 세트의 복수의 gRNA 각각에 대해, 게놈 내의 잠재적인 gRNA 혼성화 부위에 대한 미스매치의 수를 열거함으로써 오프-표적 값을 계산하는 단계를 포함할 수 있다.
방법은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법을 수행하기 위해 컴퓨터 판독 가능 매체를 포함하는 전술된 컴퓨터 시스템을 이용할 수 있다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 컴퓨터 판독 가능 매체는 게놈 내의 잠재적인 gRNA 혼성화 부위에 대한 미스매치의 수를 열거함으로써 오프-표적 값을 계산할 수 있다.
일부 경우에서, 컴퓨터 시스템의 컴퓨터 판독 가능 매체는 오프-표적 값을 계산하고 미스매치의 수를 샤드로 편성할 수 있다. 초기 gRNA 세트의 오프-표적 값 계산 시, 종의 게놈 및/또는 참조 게놈 전체에서 모든 가능한 뉴클레아제(예컨대, Cas 뉴클레아제) 표적 영역을 포함하는 데이터베이스는 가능한 Cas 뉴클레아제 표적 영역의 복수의 "샤드"(서브세트)로 분할(분리)될 수 있다. 초기 gRNA 세트를 각각의 샤드와 비교하여 0, 1, 2, 3 및/또는 4의 미스매치를 열거할 수 있다. 초기 gRNA 세트를 모든 가능한 Cas 뉴클레아제 표적 영역을 포함하는 하나의 데이터베이스와 비교하는 것과는 대조적으로, 초기 gRNA 세트를 가능한 Cas 뉴클레아제 표적 영역 서브세트를 포함하는 각각의 샤드와 동시에 비교하면 오프-표적 값을 계산하는 전체 속도 및 전반적인 성능이 향상될 수 있다.
오프-표적 값은 참조 게놈의 100,000개 염기쌍(bp) 또는 뉴클레오티드 내지 3,000,000,000 bp에 걸쳐 또는 참조 게놈 전체에서 결정될 수 있다. 오프-표적 값은 참조 게놈의 적어도 100,000 bp, 500,000 bp, 1,000,000 bp, 5,000,000 bp, 10,000,000 bp, 50,000,000 bp, 100,000,000 bp, 500,000,000 bp, 1,000,000,000 bp, 2,000,000,000 bp, 3,000,000,000 bp 또는 그 이상에 걸쳐 또는 참조 게놈 전체에서 결정될 수 있다. 오프-표적 값은 참조 게놈의 최대 3,000,000,000 bp, 2,000,000,000 bp, 1,000,000,000 bp, 500,000,000 bp, 100,000,000 bp, 50,000,000 bp, 10,000,000 bp, 5,000,000 bp, 1,000,000 bp, 500,000 bp, 100,000 bp 또는 그 이하에 걸쳐 또는 참조 게놈 전체에서 결정될 수 있다. 일 예에서, 오프-표적 값은 참조 게놈의 1,000,000 bp에 걸쳐 또는 참조 게놈 전체에서 결정될 수 있다.
복수의 게놈 및/또는 참조 게놈의 가능한 뉴클레아제(예컨대, Cas 뉴클레아제) 표적 영역을 포함하는 데이터베이스는 1,000 내지 1,000,000개의 뉴클레아제 결합 부위를 가질 수 있다. 데이터베이스는 적어도 1,000, 10,000, 50,000, 100,000, 150,000, 200,000, 250,000, 300,000, 350,000, 400,000, 450,000, 500,000, 550,000, 600,000, 650,000, 700,000, 750,000, 800,000, 850,000, 900,000, 950,000, 1,000,000개, 또는 그 이상의 뉴클레아제 결합 부위를 가질 수 있다. 데이터베이스는 최대 1,000,000, 950,000, 900,000, 850,000, 800,000, 750,000, 700,000, 650,000, 600,000, 550,000, 500,000, 450,000, 400,000, 350,000, 300,000, 250,000, 200,000, 150,000, 100,000, 50,000, 10,000, 1,000개, 또는 그 이하의 뉴클레아제 결합 부위를 가질 수 있다.
복수의 게놈 및/또는 참조 게놈의 가능한 뉴클레아제(예컨대, Cas 뉴클레아제) 표적 영역을 포함하는 데이터베이스는 10,000,000 내지 300,000,000개의 뉴클레아제 결합 부위를 가질 수 있다. 데이터베이스는 적어도 10,000,000, 25,000,000, 50,000,000, 75,000,000, 100,000,000, 125,000,000, 100,000,000 50,000,000, 175,000,000, 200,000,000, 225,000,000, 250,000,000, 275,000,000, 300,000,000개, 또는 그 이상의 뉴클레아제 결합 부위를 가질 수 있다. 데이터베이스는 최대 300,000,000, 275,000,000, 250,000,000, 225,000,000, 200,000,000, 175,000,000, 100,000,000 50,000,000, 125,000,000, 100,000,000, 75,000,000, 50,000,000, 25,000,000, 10,000,000개, 또는 그 이하의 뉴클레아제 결합 부위를 가질 수 있다.
맞춤형 치료제
본 개시내용의 또 다른 측면은 개체의 관심 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하는 방법을 제공한다. 방법은 gRNA 표적 부위 포텐셜을 결정하기 위해 개체의 게놈을 사용하는 단계를 포함할 수 있다. 방법은 각각의 gRNA 표적 부위 포텐셜에 대해 예상 가이드 RNA에 대한 오프-표적 값을 결정하는 단계를 포함할 수 있다. 방법은 개선된 효용 지수를 갖는 하나 이상의 gRNA를 확인하는 단계를 포함할 수 있다.
일부 경우에서, 방법은 개체 집단의 게놈을 사용하여 gRNA 표적 부위 포텐셜을 결정하는 단계를 포함할 수 있다. 개체 집단의 예는 다양한 연령대의 개체 세트(예컨대, 10, 65세 이상 등), 동일한 병태로 진단된 개체 세트(예컨대, 근이영양증, 파킨슨 질환 등을 갖는 환자 집단), 동일한 질환 치료를 받고 있는 개체 세트(예컨대, 유방암, 전립선암 등으로 진단 및/또는 치료된 대상체의 코호트) 등을 포함한다. 이러한 방법은 각각의 개체, 개체 집단으로부터의 개체 서브세트, 및/또는 전체 개체 집단에 대한 gRNA 표적 부위 포텐셜을 확인할 수 있다.
일부 경우에서, 본원에 기재된 소프트웨어 및 방법은 환자 코호트에 걸쳐 CRISPR 시스템에서 및/또는 특정 환자 인구 통계에서 사용될 수 있는 gRNA를 선택 및/또는 추천하는 데 사용된다. 예컨대, 활성화 또는 불활성화된 엔도뉴클레아제를 갖는 CRISPR 시스템을 포함하는 치료제는 본원의 방법 및 시스템을 사용하여 선택되는 대상체에게 투여될 수 있다. gRNA가 역치를 초과하는 다수의 오프-표적 결합을 초래할 것이라는 결정은 치료를 위한 환자의 선택의 부족 또는 또 다른 치료의 추천을 초래할 것이다. gRNA가 역치보다 적은 다수의 오프-표적 결합을 초래할 것이라는 결정은 치료를 위한 환자의 선택 또는 환자에게 이러한 치료의 추천을 초래할 것이다.
일부 예에서, 본원의 임의의 방법 및 시스템은, 바람직하게는 감소된 오프-표적 값으로, 집단의 하나, 일부 또는 모든 대상체에 존재하거나 집단의 하나, 일부 또는 모든 대상체의 표적 부위에 결합할 수 있는 gRNA를 확인하는 데 사용된다. 이것은 또한 집단의 모든 대상체에 걸쳐 선택된 gRNA에 대한 오프-표적 값의 계산을 커버한다.
참조 어셈블리로부터 설계된 gRNA는 본원에 기재된 임상 연구로부터 유도된 정보를 사용하거나 복수의 개체(예컨대, 적어도 10, 100, 1,000, 10,000 또는 100,000개)로부터의 게놈 정보를 사용하여 평가될 수 있다. 예컨대, 임상 연구는 치료될 상태 및/또는 정상 상태를 갖는 대상체 세트의 게놈을 시퀀싱하고, 상기 개체의 게놈 전체에서 시험 gRNA에 대한 오프-표적 값을 결정하는 것을 수반할 수 있다. 일부 경우에서, 단일 참조 게놈(예컨대, 개체)으로부터 설계된 gRNA는 집단의 하나, 일부 또는 모든 대상체에 걸쳐 그의 오프-표적 활성에 대해 평가될 수 있다. 이는, 예컨대 참조 게놈을 사용하여 새로운 치료제를 설계하고 본원의 방법 및 시스템을 사용하여 대상체, 대상체 세트에서 또는 개체의 집단 또는 인구 통계에 걸쳐 그의 가능한 효율 또는 효능을 평가하기 위해 수행될 수 있다. gRNA는 증가된 안정성, pK, 전달, 감소된 오프-표적 값 또는 감소된 오프-표적 영향을 위해 추가로 변형될 수 있다.
일 예에서, 임상 연구는 치료될 병태 및/또는 정상 상태를 갖는 대상체 세트에서 적어도 하나의 대상체의 게놈을 시퀀싱하고, 적어도 하나의 대상체의 게놈에 기초하여 gRNA를 설계하고, 대상체 세트의 하나, 일부 또는 모든 대상체에 걸쳐 설계된 gRNA에 대한 오프-표적 값을 결정하는 것을 수반한다.
개체의 게놈 영역을 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하기 위해 전술된 방법을 이용할 수 있다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 방법은 (예컨대, 사용자 디바이스 상의 사용자 인터페이스를 통한 사용자 입력으로부터 또는 데이터베이스로부터) 개체의 게놈 및/또는 개체 집단의 게놈을 수신하는 단계를 추가로 포함할 수 있다. 방법은 게놈으로부터 프로토스페이서(표적 부위), 하나 이상의 유형의 Cas 효소에 의해 인식되는 프로토스페이서 인접 모티프(PAM), 및 프로토스페이서의 반대 가닥(결합 부위)을 포함하는 모든 가능한 표적 영역 (또는 표적 유전자좌)을 확인하는 단계를 추가로 포함할 수 있다. 방법은 관심 게놈 영역에서 확인된 표적 영역을 단리하는 단계를 추가로 포함할 수 있다. 단리된 표적 영역은 표적 부위 포텐셜일 수 있다. 일 예에서, 관심 게놈 영역은 부정확하거나 원치 않는 위치에서 유전자 삽입의 위험을 줄이기 위한 개체 또는 개체 집단의 면역 세포의 T 세포 게놈 내의 특정 부위일 수 있다.
방법은 개체 또는 개체 집단의 표적 부위 포텐셜을 혼성화하는 초기 gRNA 세트를 확인하는 단계를 추가로 포함할 수 있다. 방법은 각각의 gRNA의 효용 지수를 결정하기 위해 초기 gRNA 세트의 각각의 gRNA의 오프-표적 값 및/또는 온-표적 효율을 계산하는 단계를 추가로 포함할 수 있다. 일부 경우에서, 효용 지수는 치료 지수일 수 있다. 일부 경우에서, 치료 지수는 오프-표적 값 및/또는 온-표적 효율에 의해 평가될 수 있는 오프-표적 결합의 감소를 포함한다. 따라서, 일부 경우에서, 오프-표적 값의 상이한 역치 및 개방형 표적 효율을 사용하여 개선된 효용 지수를 갖는 하나 이상의 gRNA를 확인할 수 있다. 따라서, 방법은 개선된 효용 지수를 갖는 하나 이상의 gRNA로 세포를 편집하는 단계를 추가로 포함할 수 있다.
일부 경우에서, 치료 지수는 개체 또는 개체 집단의 적어도 하나의 세포에서 오프-표적 결합의 감소 뿐만 아니라 증가된 온-표적 효율, 증가된 녹아웃(KO) 효율, 증가된 녹인(KI) 효율, 또는 CRISPR 간섭의 조정을 포함한다. 일 예에서, 하나 이상의 gRNA는 개체 또는 개체 집단의 세포의 게놈 영역에서 유전자를 KO하도록 설계될 수 있다. 또 다른 예에서, 하나 이상의 gRNA는 개체 또는 개체 집단의 세포의 게놈 영역에서 돌연변이를 KI하도록 설계될 수 있다.
일부 경우에서, 개체는 인간일 수 있다. 일부 경우에서, 개체는 비인간(예컨대, 마우스, 래트 등)일 수 있다. 일부 경우에서, 개체 (또는 개체 집단의 개체)는 질환에 걸릴 수 있다. 병태는 많은 질환 연관된 유전자와 관련되는 것으로 알려 지거나 예측될 수 있으며, 본 개시내용의 하나 이상의 gRNA는 하나 이상의 CRISPR/Cas 시스템을 많은 질환 연관된 유전자로 안내할 수 있다. 많은 질환 연관된 유전자는 비질환 대조군의 조직 또는 세포와 비교하여 질환에 걸린 조직으로부터 유래된 세포에서 비정상 수준의 또는 비정상 형태로 전사 또는 번역 생성물을 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 포함할 수 있다. 예는 비정상적으로 높은 수준으로 발현되는 유전자일 수 있다. 또 다른 예는 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질환의 발생 및/또는 진행과 관련이 있다. 대안적으로 또는 추가적으로, 많은 질환 연관된 유전자는 돌연변이를 보유하는 임의의 유전자를 포함할 수 있다.
많은 질환 연관된 유전자의 예는 알츠하이머 질환, 파킨슨 질환, 다발성 경화증, 척추 근이영양증, 근이영양증, 골수성 세포에 영향을 미치는 질환, 만성 림프구성 백혈병, 다발성 골수종, 악성 종양, 흑색종, 낭포성 섬유증, 혈우병, 겸상 적혈구 질환, 및 유방, 장, 전립선, 중추신경계, 교모세포종 및 육종을 포함한 다양한 기관의 암을 포함한다.
gRNA 표적 부위 포텐셜의 결정 및 하나 이상의 gRNA의 확인 방법은 컴퓨터에 의해 수행될 수 있다. 컴퓨터는 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하기 위한 방법을 수행하기 위한 산출 가능한 매체를 포함하는 전술된 컴퓨터 시스템일 수 있다.
맞춤형 진단제
본 개시내용의 또 다른 측면은 개체에 대한 CRISPR 제제의 오프-표적 효과를 평가하는 방법을 제공한다. 방법은 개체의 게놈을 사용하여 개체의 게놈 내의 잠재적 표적 부위에 대한 미스매치의 수를 열거함으로써 CRISPR 제제의 오프-표적 값을 컴퓨터에 의해 결정하는 단계를 포함한다.
이는, 예컨대 임상 시험 설정에서 임상 시험 또는 치료에 포함되거나 배제될 환자를 선택하는 데 유용할 수 있다. 예컨대, 개인의 게놈이 역치(예컨대, 0, 1, 2, 3 등)보다 큰 수의 오프-표적 결합 부위를 갖는 환자는 임상 시험 또는 치료 요법에서 배제되는 반면, 개인의 게놈이 더 작은 오프-표적 결합 부위를 갖거나 오프-표적 결합 부위가 없는 환자는 임상 시험에 포함되거나 치료를 받는다.
개체에 대한 CRISPR 제제의 오프-표적 효과를 평가하는 방법은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법을 수행하기 위해 컴퓨터 판독 가능 매체를 포함하는 전술된 컴퓨터 시스템을 이용할 수 있다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 방법은 개체의 게놈 내의 잠재적 표적 부위에 대한 미스매치의 수를 열거하는 보고서를 출력하는 단계를 추가로 포함할 수 있다. 일부 경우에서, 출력이 (예컨대, 개인용 컴퓨터와 같은 사용자 디바이스의 사용자 인터페이스를 통해) 스크린에 디스플레이될 수 있다.
CRISPR 제제는 치료제일 수 있다. 치료제는 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 gRNA로부터의 gRNA일 수 있다. gRNA는 CRISPR/Cas 복합체를 표적 영역으로 안내할 수 있다. 치료제는 다수의 세포 유형에서 표적 영역을 변형(예컨대, 삭제, 삽입, 전위, 불활성화, 활성화)하는 것을 포함하는 매우 다양한 유용성을 가질 수 있다. 따라서, 치료제는 유전자 요법, 약물 스크리닝, 질환 진단 및 예후를 포함하지만 이에 제한되지 않는 광범위한 적용을 가질 수 있다.
개체의 게놈에서 잠재적 표적 부위의 수는 1,000 내지 3,000,000개의 범위일 수 있다. 개체의 게놈에서 잠재적 표적 부위의 수는 적어도 1,000, 10,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 2,000,000, 3,000,000개 또는 그 이상일 수 있다. 개체의 게놈에서 잠재적 표적 부위의 수는 최대 3,000,000, 2,000,000, 1,000,000, 900,000, 800,000, 700,000, 600,000, 500,000, 400,000, 300,000, 200,000, 100,000, 10,000, 1,000개, 또는 그 이하일 수 있다.
편집을 위한 고효율 및 정밀 방법
본 개시내용의 한 측면은 세포 또는 세포 집단을 뉴클레아제 및 임의적으로 공여자 폴리뉴클레오티드와 조합하여 하나 이상의 gRNA 세트와 접촉시켜 변형된 세포 집단을 생성하는 단계를 포함하는, 세포 또는 세포 집단을 편집하는 방법을 제공한다. 변형된 세포의 집단은 적어도 하나의 관심 게놈 영역에서 적어도 하나의 편집을 포함할 수 있다. 하나 이상의 gRNA 세트는 본원에 기재된 임의의 방법에 의해 설계될 수 있다. 적어도 하나의 편집은 관심 게놈 영역의 유전자의 녹아웃 또는 관심 게놈 영역의 게놈으로 점 돌연변이, 대립유전자, 태그 또는 외인성 엑손의 녹인을 초래할 수 있다. 본 개시내용의 또 다른 측면은 적어도 하나의 gRNA 세트에 의해 생산된 적어도 하나의 관심 게놈 영역에서 적어도 하나의 편집을 포함하는 세포 또는 변형된 세포 집단을 스크리닝하는 방법을 제공한다. 2개 이상의 gRNA를 포함하는 하나 이상의 gRNA 세트의 편집 효율은 2개 이상의 gRNA 각각의 개별 편집 효율보다 높을 수 있다.
일부 실시양태에서, 세포 집단에서 복수의 관심 게놈 영역을 편집하는 방법은 세포 집단을 (i) 복수의 관심 게놈 영역을 표적화하는 복수의 gRNA 세트 및 (ii) 뉴클레아제와 접촉시키는 단계를 포함하고; 여기서 접촉 후 세포 집단 내의 세포의 적어도 50%는 관심 게놈 영역 각각에서 야생형 유전자형과 상이한 편집된 유전자형을 포함한다. 일부 실시양태에서, 세포 집단에서 복수의 관심 게놈 영역을 편집하는 방법은 세포 집단 서브세트 각각을 (i) 복수의 gRNA 세트 내의 각각의 gRNA 세트가 복수의 관심 게놈 영역으로부터 상이한 관심 게놈 영역을 표적화하는 복수의 gRNA 세트로부터의 gRNA 세트 및 (ii) 뉴클레아제와 접촉시키는 단계를 포함한다. 일부 실시양태에서, 접촉시킨 후 세포 집단 서브세트의 적어도 50%에서 세포의 적어도 80%의 세포는 관심 게놈 영역에서 야생형 유전자형과 상이한 편집된 유전자형을 포함한다. 일부 실시양태에서, 접촉시킨 후 세포 집단 서브세트의 적어도 50%에서 세포의 적어도 70%의 세포는 관심 게놈 영역에서 야생형 유전자형과 상이한 편집된 유전자형을 포함한다. 각각의 gRNA 세트는 3개의 gRNA를 포함할 수 있다. 일부 경우에서, gRNA 세트의 적어도 50%, 60%, 60%, 70%, 80%, 90%, 또는 95%는 적어도 3개의 gRNA를 포함한다. gRNA 세트 내의 각각의 gRNA는 적어도 30개 염기의 가이드간 간격을 포함할 수 있다. gRNA 세트 내의 각각의 gRNA는 gRNA 세트로부터의 다른 모든 gRNA의 표적 부위로부터 적어도 30개 염기인 관심 게놈 영역 내의 표적 부위에 혼성화될 수 있다.
방법은 본원에 기재된 바와 같이 관심 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA) 세트를 설계하는 단계를 포함할 수 있다. 변형된 세포 집단은 적어도 하나의 세포를 포함할 수 있다. 적어도 하나의 세포는 포유동물 세포, 어류 세포, 곤충 세포, 식물 세포 또는 미생물일 수 있다. 미생물은 박테리아일 수 있다. 적어도 하나의 세포는 본원에 기재된 바와 같은 세포주 내의 세포일 수 있다. 적어도 하나의 세포는 종양 세포일 수 있다. 적어도 하나의 세포는 개체로부터 유래될 수 있다.
방법은 세포 또는 세포 집단을 하나 이상의 gRNA 세트 및 뉴클레아제와 접촉시켜 변형된 세포 또는 변형된 세포 집단을 생산하는 단계를 포함할 수 있다. 방법은 세포 또는 세포 집단을 공여자 폴리뉴클레오티드와 접촉시키는 단계를 추가로 포함할 수 있다. 접촉은 하나 이상의 gRNA 세트, 뉴클레아제 또는 뉴클레아제를 코딩하는 폴리뉴클레오티드, 또는 이들의 조합을 세포 또는 세포 집단으로 형질감염시키는 단계를 포함할 수 있다. 일부 실시양태에서, 하나 이상의 gRNA 세트 내의 각각의 gRNA는 형질감염 전에 Cas 단백질과 복합체화되어 Cas-gRNA 복합체(본원에서 CRISPR/Cas 복합체 또는 CRISPR/Cas 시스템으로도 지칭됨)를 생산한다. 일부 실시양태에서, 방법은 적어도 하나의 공여자 폴리뉴클레오티드를 세포 또는 세포 집단으로 형질감염시키는 단계를 추가로 포함한다. 형질감염은 비바이러스 형질감염 또는 바이러스 형질감염일 수 있다. 비바이러스 형질감염은 전기천공, 리포펙션 또는 미세주입일 수 있다. 바이러스 형질감염은 바이러스 벡터의 사용을 포함할 수 있다. 바이러스 벡터는 레트로바이러스 벡터, 아데노바이러스 벡터, 아데노 연관된 바이러스(AAV) 벡터, 알파바이러스 벡터, 백시니아 바이러스 벡터, 헤르페스 심플렉스 바이러스(HSV) 벡터, 렌티바이러스 벡터 또는 레트로바이러스 벡터일 수 있다. 바이러스 벡터는 복제 능력이 있는 바이러스 벡터 또는 복제 능력이 없는 바이러스 벡터일 수 있다.
관심 게놈 영역은 유전자일 수 있다. 유전자는 관심 경로에 있는 유전자일 수 있다. 방법은 복수의 관심 게놈 영역을 표적화하는 단계를 포함할 수 있다. 복수의 관심 게놈 영역은 관심 경로 내의 복수의 유전자를 포함할 수 있다. 복수의 관심 게놈 영역은 복수의 관심 경로 내의 복수의 유전자를 포함할 수 있다. 관심 경로는 대사 경로, 신호 전달 경로 또는 유전자 조절 경로일 수 있다. 관심 경로는 질환과 관련된 경로일 수 있다. 질환은 암일 수 있다. 관심 경로는 관심 분자의 생산에 관련된 경로일 수 있다. 관심 분자는 약리학적 활성을 갖는 분자일 수 있다. 관심 게놈 영역은 게놈의 비코딩 영역일 수 있다. 비코딩 영역은 조절 요소일 수 있다. 조절 요소는 시스-조절 요소 또는 트랜스-조절 요소일 수 있다. 시스-조절 요소는 프로모터, 인핸서 또는 사일런서일 수 있다.
일부 실시양태에서, 방법은 관심 게놈 영역을 표적화하는 gRNA 세트를 변형된 세포 집단 서브세트와 접촉시키는 단계를 포함한다. 일부 실시양태에서, 방법은 관심 게놈 영역을 표적화하는 복수의 gRNA 세트 각각을 변형된 세포 집단의 복수의 서브세트 각각과 접촉시키는 단계를 포함한다. 일 예에서, 변형된 세포 집단의 복수의 서브세트가 다중-웰 플레이트의 각각의 웰에 배치될 수 있다. 다중-웰 플레이트는 4-웰 플레이트, 6-웰 플레이트, 12-웰 플레이트, 24-웰 플레이트, 48-웰 플레이트, 96-웰 플레이트 또는 384-웰 플레이트일 수 있다. 변형된 세포 집단의 서브세트는 적어도 102, 적어도 103, 적어도 104, 적어도 105, 또는 적어도 106개의 세포를 포함할 수 있다. 다중-웰 플레이트의 각각의 웰은 관심 게놈 영역을 표적화하는 gRNA 세트를 추가로 포함할 수 있다. 다중-웰 플레이트의 각각의 웰 내의 각각의 gRNA 세트는 상이한 관심 게놈 영역을 표적화할 수 있다. 복수의 gRNA 세트는 적어도 5개, 적어도 10개, 적어도 20개, 적어도 50개, 또는 적어도 100개의 상이한 관심 게놈 영역을 표적화할 수 있다. 일부 실시양태에서, 접촉은 다중-웰 플레이트의 각각의 웰에서 발생한다.
일부 실시양태에서, 방법은 변형된 세포 집단 또는 변형된 세포 집단의 서브세트를 자극과 접촉시키는 단계를 포함한다. 자극은 추가 제제일 수 있다. 추가 제제는 치료제(예컨대, 항생제, 생물학적 제제 또는 소분자 약물) 또는 변형된 세포에서 질환 상태를 유발하는 제제일 수 있다.
일부 실시양태에서, 방법은 변형된 세포 집단 또는 변형된 세포 집단의 서브세트의 표현형을 검출하는 단계를 포함한다. 표현형은 세포 생존력일 수 있다. 표현형은 gRNA 세트의 편집 효율일 수 있다. 표현형은 변형된 세포 집단 또는 변형된 세포 집단의 서브세트에 의해 생산되는 관심 분자의 양일 수 있다. 관심 분자는 단백질 또는 단백질을 코딩하는 전사체일 수 있다. 일부 실시양태에서, 방법은 변형된 세포 집단 또는 변형된 세포 집단의 서브세트의 태그를 검출하는 단계를 포함한다.
gRNA 검증
본 개시내용의 다른 측면은 예상 gRNA를 검증하는 방법을 제공한다. 방법은 게놈 또는 게놈의 일부에서 예상 gRNA에 대한 다수의 오프-표적 히트를 결정하는 단계를 포함할 수 있다. 방법은 오프-표적 히트의 수를 사용하여 예상 gRNA에 대한 오프-표적 값을 계산하는 단계를 포함할 수 있다. 방법은 오프-표적 값을 사용하여 예상 gRNA의 활성을 예측하는 단계를 포함할 수 있다.
예상 gRNA를 검증하는 방법은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하기 위해 전술된 방법을 이용할 수 있다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 대안적으로 또는 추가적으로, 예상 gRNA를 검증하는 방법은 (1) 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법, (2) 관심 게놈 영역을 표적화하는 gRNA 세트를 확인하는 방법, 및 (3) 관심 게놈 영역에 혼성화하기 위한 적어도 하나의 gRNA를 선택하는 방법을 수행하기 위해 컴퓨터 판독 가능 매체를 포함하는 전술된 컴퓨터 시스템을 추가로 이용할 수 있다.
도 6은 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드(예컨대, gRNA)를 검증하는 방법의 흐름도(600)의 예를 나타낸다. 방법은 (a) 가이드가 존재하는지를 확인하는 단계(예컨대, 사용자에 의해 제공된 gRNA의 상보적 서열이 종의 게놈에 존재하는지를 확인)(605); (b) 커팅 정보를 조사하는 단계(예컨대, 게놈 내의 gRNA의 상보적 서열이 프로토스페이서 인접 모티프(PAM) 부위 옆에 있는지를 확인)(610); (c) gRNA에 대한 온-표적 값을 산출하는 단계(예컨대, gRNA에 대한 방위각 점수를 계산)(615); (d) 각각의 가이드에 대한 오프-표적 히트를 산출하는 단계(620); (e) 가능한 오프-표적에 대한 더 많은 세부 사항을 입수하는 단계(예컨대, 게놈에 걸친 복수의 가능한 Cas 표적 영역과 비교하여 각각의 gRNA에 대한 미스매치의 수를 열거)(625); 및 (f) gRNA 활성의 예측을 반환하는 단계(630)를 포함한다. 일부 경우에서, 단계 (c) 및 (d-e)의 순서를 바꿀 수 있다.
사용자 인터페이스
본 개시내용의 다른 추가 양태는 컴퓨터 시스템을 제공한다. 컴퓨터 시스템은 관심 종 및 관심 종으로부터 관심 유전자를 선택하기 위한 사용자 인터페이스 시스템을 포함할 수 있다. 컴퓨터 시스템은 관심 유전자에 대한 하나 이상의 작은 가이드 RNA(gRNA) 서열을 확인하기 위한 사용자 인터페이스와 통합된 설계 모듈을 포함할 수 있다. 컴퓨터 시스템은 선택된 작은 gRNA 또는 작은 gRNA를 포함하는 gRNA를 디스플레이하기 위한 출력 시스템을 포함할 수 있다. 각각의 작은 gRNA는 각각의 gRNA의 약 20개 염기 또는 뉴클레오티드일 수 있다. 컴퓨터 시스템은 하나 이상의 작은 gRNA의 RNA 합성기에 의해 합성을 시작하기 위한 활성화 유닛을 포함할 수 있다.
컴퓨터 시스템의 설계 모듈은 예상 gRNA를 검증하기 위해 전술된 방법을 수행할 수 있으며, 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하기 위해 전술된 방법을 이용할 수 있다.
사용자 인터페이스 시스템은 100개 내지 500,000개의 상이한 참조 게놈의 선택을 포함할 수 있다. 사용자 인터페이스 시스템은 적어도 100, 1,000, 10,000, 100,000, 500,000개 또는 그 이상의 상이한 참조 게놈의 선택을 포함할 수 있다. 사용자 인터페이스 시스템에는 최대 500,000, 100,000, 10,000, 1,000, 100개 또는 그 이하의 상이한 참조 게놈의 선택을 포함할 수 있다. 상이한 참조 게놈은 클라우드에 저장될 수 있다(예컨대, Amazon Web Services의 하나 이상의 데이터베이스). 컴퓨터 시스템의 설계 모듈은 클라우드의 참조 게놈에 접근할 수 있다.
컴퓨터 시스템의 설계 모듈은 10,000 내지 120,000개의 참조 게놈에 접근할 수 있다. 컴퓨터 시스템의 설계 모듈은 적어도 10,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 110,000, 120,000개, 또는 그 이상의 참조 게놈에 대한 접근할 수 있다. 컴퓨터 시스템의 설계 모듈은 최대 120,000, 110,000, 100,000, 90,000, 80,000, 70,000, 60,000, 50,000, 40,000, 30,000, 20,000, 10,000개, 또는 그 이하의 참조 게놈에 접근할 수 있다.
컴퓨터 시스템의 사용자 인터페이스는 개체의 게놈의 입력을 얻기 위한 게놈 데이터 수신 모듈을 추가로 포함할 수 있다. 게놈 데이터 수신 모듈은 서버(예컨대, 개인 게놈 서비스의 서버)로부터 또는 사용자에 의해 업로드된 파일로부터 개체 게놈 또는 사용자 게놈의 일부를 수득할 수 있다.
도 7a-d는 유전자 혼성화를 위한 하나 이상의 gRNA의 설계를 요청하기 위해 관심 종의 게놈의 유전자를 선택하기 위한 그래픽 사용자 인터페이스(GUI)의 창의 예를 도시한다. 하나 이상의 gRNA는 관심 유전자의 녹아웃을 위해 CRISPR/Cas 시스템을 안내하도록 설계될 수 있다. 도 7a는 사용자가 관심 게놈(710) 및 유전자(720)의 명칭 또는 식별자 번호를 타이핑할 수 있게 하는 녹아웃 가이드 설계를 위한 GUI(700)의 창을 나타낸다. 이 GUI에서, 사용되는 뉴클레아제(730)는 스트렙토코쿠스 피오게네스 Cas9(SpCas9)로 사전 선택된다. 일부 경우에서, 사용자가 관심있는 Cas 효소를 선택할 수 있다. 도 7b는 녹아웃 가이드 설계(700)에 대한 GUI 창을 도시한다. 사용자가 관심 게놈의 이명법의 일부(예컨대, "호모")를 타이핑하면 GUI(700)의 소프트웨어는 사용자에게 속(예컨대, 호모 사피엔스, 712) 또는 종(락토바실루스 호모히오키이(Lactobacillus homohiochii), 714)에서 단어 "호모"를 포함하는 이용 가능한 게놈의 목록을 제안할 수 있다. GUI(700)의 소프트웨어는 동일한 게놈의 상이한 유형도 제안할 수 있다(예컨대, "유전코드 릴리즈(Genecode Release) 26"(712)로부터의 호모 사피엔스 게놈 및 "유전코드 릴리즈 21"(716)로부터의 호모 사피엔스 게놈). 이어서, 사용자는 관심의 올바른 이명법을 선택할 수 있다. 대안적으로 또는 추가적으로, 사용자는 관심의 이명법을 전부 타이핑할 수 있다. 도 7c는 녹아웃 가이드 설계(700)에 대한 GUI의 창을 나타낸다. 사용자가 관심 유전자의 약어 및/또는 전체 명칭의 일부(예컨대, "RE")를 입력 시, GUI(700)의 소프트웨어는 사용자에게 타이핑된 입력(예컨대, "RELA"(722) 또는 "ALYREF"(724))을 포함하는 이용 가능한 유전자 목록을 제안할 수 있다. 이어서, 사용자는 올바른 관심 유전자를 선택할 수 있다. 대안적으로 또는 추가적으로, 사용자는 관심 유전자의 명칭을 전부 타이핑할 수 있다. 도 7d는 녹아웃 가이드 설계(700)에 대한 GUI의 창을 도시한다. 게놈(710), 유전자(720) 및 뉴클레아제(730)가 선택되면, 사용자는 검색 버튼(740)을 클릭하여 GUI의 소프트웨어가 관심 종의 유전자의 게놈에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법을 개시하게 할 수 있다.
도 8은 관심 게놈의 유전자에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 프로세스를 디스플레이하기 위한 GUI의 창(800)의 예를 도시한다. 창(800)은 하나 이상의 gRNA를 설계하는 방법의 단계 목록을 나타낸다. 창은 사용된 단계(810)는 표시하고 나머지 단계는 표시되지 않은 상태(820)로 남겨둠으로써 프로세스를 나타낼 수 있다.
도 9a-d는 관심 게놈의 유전자에 혼성화하도록 설계된 하나 이상의 gRNA를 디스플레이하기 위한 GUI의 창의 예를 도시한다. 도 9a는 GUI의 창(900)을 도시한다. 창(900)은 하나 이상의 gRNA(예컨대, 관심 유전자 내의 다수의 Cas 표적 부위, 유전자 녹아웃에 사용될 수 있는 다수의 최상위 gRNA 등)를 설계한 결과의 요약(910)을 제공한다. 창(900)은 최상위 gRNA(920)의 혼성화 폴리뉴클레오티드 서열을 제공한다. 또한, 창(900)은 하나 이상의 gRNA를 생성하는 데 사용된 유전자(예컨대, RELA 유전자의 엑손 3)의 선택된 코딩 영역(930) 뿐만 아니라 유전자의 선택된 영역(930) 내의 최상위 gRNA(920)의 혼성화 위치(940)의 개략도를 제공한다. 도 9b는 GUI의 창(900)을 도시한다. 사용자가 최상위 gRNA(920)로부터 gRNA(922)를 선택 시, GUI는 유전자의 선택된 코딩 영역(930)에서 선택된 gRNA(922)의 각각의 혼성화 위치(942)를 강조 표시한다. 또한, 도 9c에 나타난 바와 같이, 창(900)은 또한 표적 폴리뉴클레오티드 서열, 종의 게놈 내의 Cas 커팅 부위(절단 부위), 선택된 코딩 영역 위치, 온-표적 값 및 오프-표적 값을 포함하여 선택된 gRNA(922)에 대한 세부 사항(944)을 나타낸다. 도 9d는 GUI의 창(905)을 나타낸다. 창(905)은 관심 게놈의 유전자에 혼성화하도록 설계된 하나 이상의 gRNA로부터의 추가 gRNA를 디스플레이한다. 사용자는 추가 분석 및/또는 취득을 위해 추가 gRNA로부터 적어도 하나를 선택할 수 있다.
도 10a-e는 관심 게놈의 유전자에 혼성화하도록 설계된 gRNA에 대한 상세한 정보를 디스플레이하기 위한 GUI 창의 예를 도시한다. 사용자가 설계된 gRNA(예컨대, 도 9c의 gRNA(922))를 선택 시, 사용자는 도 10a에 나타난 바와 같이 새로운 GUI 창(1000)으로 안내된다. 창(1000)은 선택된 gRNA의 성능에 대한 요약(1010)(예컨대, gRNA의 표적 유전자, 게놈 내의 커팅 부위의 위치 등)을 제공한다. 창(1000)은 또한 분석을 위해 선택되는 선택된 gRNA 서열, 게놈, 유전자 및 뉴클레아제를 포함하는 다른 세부 사항(1020)을 나타낸다. 또한, 창(1000)은 관심 유전자의 표적 영역과 상호작용하게 되는 Cas-gRNA 복합체의 도식(1030)을 나타낸다. 창(1000)은 또한 선택된 gRNA의 오프-표적 부위(1040)의 예를 선택된 gRNA와 각각의 오프-표적 부위 사이의 미스매치의 수, 게놈 내의 오프-표적 부위의 위치, 및 오프-표적 부위를 포함하는 유전자의 명칭을 포함하는 동반하는 정보(도 10e에 나타낸 선택된 gRNA의 추가 오프-표적 부위(1045)의 목록)와 함께 나타낸다. 사용자가 도식(1030)의 상이한 부분을 선택 시, GUI는 도식(1030)의 어느 부분이 RNA 가이드 서열을 디스플레이하고 있는지(도 10b, 1032), 표적 부위(PAM) 내의 프로토스페이서 인접 모티프(PAM) 부위(도 10c, 1034), 및 표적 부위 서열(도 10d, 1036)을 사용자에게 알릴 수 있다.
도 11a-b는 관심 게놈의 유전자에 혼성화하도록 설계된 하나 이상의 gRNA 중 하나의 서브세트를 선택하고 취득하기 위한 GUI의 창의 예를 도시한다. 도 11a는 GUI의 창(900)을 도시한다. 사용자는 최상위 gRNA(920)로부터 gRNA(1110) 서브세트를 선택하고 gRNA(1110) 서브세트의 합성 분자를 취득하기 위해 (1120)을 진행할 수 있다. 도 11b는 사용자가 gRNA(1110) 서브세트의 합성 분자를 취득하기 위해 (1120)을 진행 시 사용자에게 디스플레이되는는 창(1100)을 나타낸다. 창(1100)은 선택된 gRNA의 요약(1130)(예컨대, 선택된 gRNA 및 그들의 의도된 표적 유전자 및 게놈의 수)을 디스플레이한다. 창(1100)은 또한 사용자에게 합성을 위해 변형된 gRNA(1140) 또는 변형되지 않은 gRNA(1145) 중에서 선택할 것을 요청한다. 또한, 창(1100)은 합성을 위해 선택된 gRNA의 최종 요약(1150)을 디스플레이한다. 사용자는 취득 결제를 진행할 수 있다.
도 12a-b는 관심 종의 게놈을 선택하고 가이드 성능의 검증을 요청하기 위해 이전에 생성된 gRNA 서열을 입력하기 위한 GUI 창의 예를 도시한다. gRNA는 유전자 편집을 위해 CRISPR/Cas 시스템을 안내하도록 이전에 설계되었을 수 있다. 도 12a는 gRNA 검증을 위한 GUI(1200)의 창을 나타낸다. GUI를 통해 사용자는 게놈(1210)의 명칭 또는 식별자 번호 및 이전에 결정된 gRNA(1220)의 서열을 타이핑할 수 있다. 이 GUI에서, 사용되는 뉴클레아제(1230)는 스트렙토코쿠스 피오게네스 Cas9(SpCas9)로 사전 선택된다. 일부 경우에서, 사용자는 관심 Cas 효소를 선택할 수 있다. 도 12b에 나타난 바와 같이, 게놈(1215), gRNA 서열(1225) 및 뉴클레아제(1230)가 결정되면, 사용자는 gRNA 서열을 검증하기 위해 (1240)을 진행할 수 있다.
도 13a-b는 관심 게놈의 유전자에 혼성화하도록 설계된 gRNA의 검증에 대한 상세한 정보를 디스플레이하기 위한 GUI 창의 예를 도시한다. 사용자가 미리 결정된 gRNA(예컨대, 도 12b의 gRNA 서열(1225))의 검증을 요청 시, 사용자는 도 13a에 나타난 바와 같이 새로운 GUI 창(1300)으로 안내된다. 창(1300)은 미리 결정된 gRNA의 성능 요약(1310)(예컨대, gRNA의 예측된 표적 유전자, 게놈 내의 절단 부위의 위치 등)을 제공한다. 창(1300)은 또한 분석을 위해 선택된 미리 결정된 gRNA 서열, 게놈 및 뉴클레아제를 포함하는 다른 세부 사항(1320)을 나타낸다. 또한, 창(1300)은 예측된 표적 유전자의 표적 영역과 상호작용하게 되는 Cas-gRNA 복합체의 도식(1330)을 나타낸다. 창(1300)은 또한 도 13b에 나타난 바와 같이 미리 결정된 gRNA의 오프-표적 부위(1340)의 예를 미리 결정된 gRNA와 각각의 오프-표적 부위 사이의 미스매치의 수, 게놈 내의 오프-표적 부위의 위치, 및 오프-표적 부위를 포함하는 동반하는 정보와 함께 나타낸다.
시스템
본 개시내용의 다른 상이한 측면은 (1) 사용자에게 10,000개 초과의 참조 게놈에 대한 접근을 제공하는 인터페이스; (2) 50,000개 초과의 참조 게놈 중 어느 하나의 유전자에 대한 하나 이상의 가이드 RNA(gRNA)를 선택하기 위한 소프트웨어; 및 (3) 선택된 가이드 RNA를 디스플레이하는 출력 시스템을 포함하는 시스템을 제공한다.
시스템은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하는 방법을 수행하기 위한 컴퓨터 판독 가능 매체를 포함하는 전술된 컴퓨터 시스템을 이용할 수 있다.
시스템은 20,000 내지 120,000개의 참조 게놈을 포함할 수 있다. 시스템은 적어도 20,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 110,000, 120,000개, 또는 그 이상의 참조 게놈을 포함할 수 있다. 시스템은 최대 120,000, 110,000, 100,000, 90,000, 80,000, 70,000, 60,000, 50,000, 40,000, 30,000, 20,000개, 또는 그 이하의 참조 게놈을 포함할 수 있다.
시스템은 폴리뉴클레오티드를 합성하는 기계(예컨대, 합성기)를 포함할 수 있다. 소프트웨어는 기계와 통신할 수 있다. 대안적으로 또는 추가로, 시스템은 폴리뉴클레오티드를 합성하는 외부 기계와 통신할 수 있다. 일부 경우에서, 시스템은 gRNA의 합성을 활성화하고 시작하는 스크립트를 추가로 포함할 수 있다. gRNA의 합성은 사용자의 하나 이상의 gRNA 선택에 기반할 수 있다.
본 개시내용은 가이드 RNA(gRNA)를 설계하는 방법을 추가로 제공한다. gRNA를 설계하는 방법은 유전자의 1차 전사체를 확인하는 단계를 포함할 수 있다. gRNA를 설계하는 방법은 1차 전사체와 복수의 대체 전사체 사이의 공통 엑손을 확인하는 단계를 포함할 수 있다. gRNA를 설계하는 방법은 공통 엑손 내에서 뉴클레아제 표적 부위를 확인하는 단계를 포함할 수 있다. gRNA를 설계하는 방법은 참조 게놈 서열과 대조하여 뉴클레아제 표적 부위에 대한 오프-표적 결합 부위의 수를 계산하여 계산된 뉴클레아제 오프-표적 결합 부위의 수를 산출하는 단계를 포함할 수 있다. gRNA를 설계하는 방법은 온-표적 효율 점수를 계산하여 계산된 온-표적 효율 점수를 산출하는 단계를 포함할 수 있다. gRNA를 설계하는 방법은 적어도 하나의 gRNA 서열을 출력하는 단계를 포함할 수 있으며, 여기서 gRNA는 계산된 온-표적 효율이 역치를 초과하고 계산된 뉴클레아제 오프-표적 결합 부위의 수가 0인 서열을 포함한다.
일부 경우에서, gRNA를 설계하는 방법은 표적 부위에 대해 부분 상보성을 갖는 핵산의 합성을 지시하는 단계를 포함할 수 있다. gRNA와 표적 부위 사이의 부분 상보성은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 10개 초과의 뉴클레오티드의 미스매치를 포함할 수 있다.
본 개시내용은 네트워크를 통해 사용자로부터 생체중합체 합성 요청을 프로세싱하기 위한 시스템을 추가로 제공한다. 시스템은 네트워크를 통해 사용자의 디지털 컴퓨터와 통신하도록 구성된 통신 인터페이스를 포함할 수 있다. 시스템은 하나 이상의 참조 게놈을 저장하는 참조 게놈 데이터베이스를 포함할 수 있다. 시스템은 통신 인터페이스 및 데이터베이스에 작동 가능하게 연결된 하나 이상의 컴퓨터 프로세서를 포함하는 컴퓨터를 포함할 수 있다. 하나 이상의 컴퓨터 프로세서는 (a) 네트워크를 통해 통신 인터페이스로부터 사용자의 디지털 컴퓨터로부터 생체중합체 합성 요청을 수신하고, 여기서 생체중합체 합성 요청은 표적 게놈 정보를 포함하고; (b) 표적 게놈 정보에 상응하는 표적 서열을 확인하기 위해 데이터베이스로부터 하나 이상의 참조 게놈과 대조하여 표적 게놈 정보를 프로세싱하고; (c) 알고리즘을 실행하여 표적 서열에 대해 적어도 부분적으로 상보적인 제1 가이드 리보핵산(gRNA) 서열 세트를 생성하고, 제1 gRNA 서열 세트 내의 각각의 gRNA 서열에 대한 오프-표적 상보성 점수를 계산하고; (d) 사용자의 디지털 컴퓨터의 그래픽 사용자 인터페이스에 디스플레이하기 위해 제2 gRNA 서열 세트를 출력하고. 여기서 제2 gRNA 서열 세트는 역치 미만으로 계산된 오프-표적 상보성 점수를 갖고; 및 (e) 사용자의 디지털 컴퓨터로부터 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 선택을 수신하도록 개별적으로 집합적으로 프로그래밍될 수 있다.
일부 경우에서, 하나 이상의 컴퓨터 프로세서는 gRNA 서열을 합성하기 위한 큐에서 주어진 gRNA 서열을 지시하도록 개별적으로 또는 집합적으로 프로그래밍될 수 있다. 일부 경우에서, 참조 게놈 데이터베이스 내의 적어도 하나의 게놈은 개체의 맞춤형 게놈일 수 있다. 일부 경우에서, 참조 게놈 데이터베이스 내의 적어도 하나의 게놈은 병태를 앓는 집단의 맞춤형 게놈 세트일 수 있다. 일부 경우에서, 참조 게놈은 호모 사피엔스 참조 게놈일 수 있다.
일부 경우에서, 하나 이상의 컴퓨터 프로세서는 예측된 게놈 서열을 출력하도록 개별적으로 또는 집합적으로 프로그래밍될 수 있다. 예측된 게놈 서열은 제2 gRNA 서열 세트로부터의 하나 이상의 gRNA로 표적 게놈 정보를 편집하는 예측된 출력을 나타낼 수 있다. 예측된 게놈 서열은 게놈 결실을 포함할 수 있다. 예측된 게놈 서열은 게놈 삽입을 포함한다.
일부 경우에서, 오프-표적 상보성 점수를 계산하는 것은 방위각 점수를 계산하는 것을 포함한다. 일부 경우에서, 제2 gRNA 서열 세트는 특정 역치 초과의 적어도 2개의 gRNA를 디스플레이할 수 있다.
일부 경우에서, 참조 게놈 데이터베이스는 적어도 50,000개의 참조 게놈을 포함할 수 있다. 일부 경우에서, 참조 게놈 데이터베이스는 적어도 120,000개의 참조 게놈을 포함할 수 있다.
본 개시내용은 네트워크를 통해 사용자로부터 생체중합체 합성 요청을 프로세싱하는 방법을 추가로 제공한다. 방법은 (a) 네트워크를 통해 사용자의 디지털 컴퓨터로부터 생체중합체 합성 요청을 수신하는 단계로서, 여기서 생체중합체 합성 요청은 표적 게놈 정보를 포함하는 단계; (b) 표적 게놈 정보에 상응하는 표적 서열을 확인하기 위해 참조 게놈 데이터베이스로부터의 하나 이상의 참조 게놈과 대조하여 표적 게놈 정보를 프로세싱하는 단계; (c) 하나 이상의 컴퓨터 프로세서를 사용하여 알고리즘을 실행하여 (i) 표적 서열에 대해 적어도 부분적으로 상보적인 제1 가이드 리보핵산(gRNA) 서열 세트를 생성하고, (ii) gRNA 서열 각각에 대한 제1 gRNA 서열 세트에서 gRNA 서열 각각에 대한 오프-표적 상보성 점수를 계산하는 단계; (d) 사용자의 디지털 컴퓨터의 그래픽 사용자 인터페이스에 디스플레이하기 위한 제2 gRNA 서열 세트를 출력하는 단계로서, 여기서 제2 gRNA 서열 세트 각각은 역치 미만의 계산된 오프-표적 상보성 점수를 갖는 단계; 및 (e) 사용자의 디지털 컴퓨터로부터 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 합성에 대한 요청을 수신하는 단계를 포함할 수 있다.
일부 경우에서, 컴퓨터 프로그램(예컨대, 컴퓨터 판독 가능 매체)은 컴퓨터네트워크를 통해 사용자로부터 생체중합체 합성 요청을 프로세싱하는 방법을 수행하도록 컴퓨터에 지시하도록 구성될 수 있다.
일부 경우에서, 합성 요청을 수신하는 하나 이상의 컴퓨터 프로세서는 합성기에서 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 합성을 지시하도록 개별적으로 또는 집합적으로 프로그래밍될 수 있다. 일부 경우에서, 참조 게놈 데이터베이스 내의 적어도 하나의 게놈은 개체의 맞춤형 게놈일 수 있다. 일부 경우에서, 참조 게놈 데이터베이스 내의 적어도 2개의 게놈은 병태를 앓는 집단의 맞춤형 게놈일 수 있다. 일부 경우에서, 참조 게놈은 호모 사피엔스 참조 게놈일 수 있다.
일부 경우에서, 방법은 예측된 게놈 서열을 출력하는 단계를 추가로 포함할 수 있다. 예측된 게놈 서열은 제2 gRNA 서열 세트로부터의 하나 이상의 gRNA로 표적 게놈 정보를 편집하는 예측된 출력을 나타낼 수 있다. 일부 경우에서, 예측된 게놈 서열은 게놈 결실을 포함할 수 있다. 일부 경우에서, 예측된 게놈 서열은 게놈 삽입을 포함할 수 있다. 일부 경우에서, 계산은 방위각 점수를 계산할 수 있다. 일부 경우에서, 제2 gRNA 서열 세트는 특정 역치 초과의 적어도 2개의 gRNA를 디스플레이할 수 있다. 일부 경우에서, 참조 게놈 데이터베이스는 적어도 50,000개의 참조 게놈을 포함할 수 있다. 일부 경우에서, 참조 게놈 데이터베이스는 적어도 120,000개의 참조 게놈을 포함할 수 있다.
본 개시내용은 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 네트워크를 통해 사용자로부터 생체중합체 합성 요청을 프로세싱하는 방법을 구현하는 기계 실행 가능 코드를 포함하는 비일시적 컴퓨터 판독 가능 매체를 추가로 제공한다. 방법은 네트워크를 통해 사용자의 디지털 컴퓨터로부터 생체중합체 합성 요청을 수신하는 단계를 포함할 수 있으며, 여기서 생체중합체 합성 요청은 표적 게놈 정보를 포함한다. 방법은 표적 게놈 정보에 상응하는 표적 서열을 확인하기 위해 참조 게놈 데이터베이스로부터의 하나 이상의 참조 게놈과 대조하여 표적 게놈 정보를 프로세싱하는 단계를 포함할 수 있다. 방법은 표적 서열에 적어도 부분적으로 상보적인 제1 가이드 리보핵산(gRNA) 서열 세트를 생성하고, 제1 gRNA 서열 세트 내의 gRNA 서열 각각에 대한 오프-표적 상보성 점수를 계산하도록 알고리즘을 실행하는 단계를 포함할 수 있다. 방법은 사용자의 디지털 컴퓨터의 그래픽 사용자 인터페이스 상에 디스플레이하기 위한 제2 gRNA 서열 세트를 출력하는 단계를 포함할 수 있으며, 여기서 제2 gRNA 서열 세트 각각은 역치 이하의 계산된 오프-표적 상보성 점수를 갖는다. 방법은 사용자의 디지털 컴퓨터로부터 제2 gRNA 서열 세트로부터 주어진 gRNA 서열의 선택을 수신하는 단계를 포함할 수 있다.
컴퓨터 시스템
본 개시내용은 본 개시의 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 본 개시내용의 컴퓨터 시스템은 관심 게놈 영역에 혼성화하기 위한 하나 이상의 가이드 RNA를 설계하는 데 사용될 수 있다. 관심 게놈 영역은 종의 게놈의 유전자일 수 있다. 본원에 기재된 임의의 컴퓨터 시스템으로부터의 정보는 원격 컴퓨터에 보고서를 제공할 수 있다.
도 14는 본 개시내용의 컴퓨터 시스템의 다양한 양상들과 통신하고 조절하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템(1401)을 나타낸다.
컴퓨터 시스템(1401)은, 예컨대 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드 RNA를 설계하거나, 또는 관심 게놈에서 잠재적인 가이드 RNA 혼성화 부위에 대한 미스매치 수를 열거함으로써 오프-표적 값을 계산하는 것과 같이 본 개시내용의 다양한 측면을 조절할 수 있다. 컴퓨터 시스템(1401)은 사용자의 전자 디바이스 또는 전자 디바이스에 대해 원격으로 위치되는 컴퓨터 시스템일 수 있다. 전자 디바이스는 모바일 전자 디바이스일 수 있다.
컴퓨터 시스템(1401)은 단일 코어 또는 다중 코어 프로세서, 또는 병렬 프로세싱을 위한 복수의 프로세서일 수 있는 중앙 프로세싱 디바이스(CPU, 본원에서 또한 "프로세서" 및 "컴퓨터 프로세서")(1405)를 포함한다. 컴퓨터 시스템(1401)은 또한 메모리 또는 메모리 위치(1410)(예컨대, 랜덤 접근 메모리, 읽기 전용 메모리, 플래시 메모리), 전자 저장 유닛(1415)(예컨대, 하드 디스크), 하나 이상의 다른 시스템과 통신하기 위한 통신 인터페이스(1420)(예컨대, 네트워크 어댑터), 및 캐시, 다른 메모리, 데이터 저장 및/또는 전자 디스플레이 어댑터와 같은 주변 디바이스(1425)를 포함한다. 메모리(1410), 저장 유닛(1415), 인터페이스(1420) 및 주변 디바이스(1425)는 마더보드와 같은 통신 버스(실선)를 통해 CPU(1405)와 통신한다. 저장 유닛(1415)은 데이터를 저장하기 위한 데이터 저장 유닛 (또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(1401)은 통신 인터페이스(1420)의 도움으로 컴퓨터 네트워크("네트워크")(1430)에 작동 가능하게 커플링될 수 있다. 네트워크(1430)는 인터넷, 인터넷 및/또는 엑스트라넷, 또는 인트라넷 및/또는 엑스트라 넷(인터넷과 통신)일 수 있다. 일부 경우에서, 네트워크(1430)는 원격통신 및/또는 데이터 네트워크이다. 네트워크(1430)는 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있는 하나 이상의 컴퓨터 서버를 포함할 수 있다. 일부 경우에서, 네트워크(1430)는 컴퓨터 시스템(1401)의 도움으로 컴퓨터 시스템(1401)에 커플링된 디바이스가 클라이언트 또는 서버로 동작하게 할 수 있는 피어-투-피어(peer-to-peer) 네트워크를 구현할 수 있다.
CPU(1405)는 프로그램 또는 소프트웨어로 구현될 수 있는 일련의 기계 판독 가능 명령을 실행할 수 있다. 명령은 메모리(1410)와 같은 메모리 위치에 저장될 수 있다. 명령은 CPU(1405)로 향할 수 있으며, 본 개시내용의 방법을 구현하도록 후속적으로 CPU(1405)를 프로그래밍하거나 다른 방식으로 구성할 수 있다. CPU(1405)에 의해 수행되는 동작의 예는 페치, 디코딩, 실행 및 라이트백(writeback)을 포함할 수 있다.
CPU(1405)는 집적 회로와 같은 회로의 일부일 수 있다. 시스템(1401)의 하나 이상의 다른 성분이 회로에 포함될 수 있다. 일부 경우에서, 회로는 주문형 집적 회로(ASIC)이다.
저장 유닛(1415)은 드라이버, 라이브러리 및 저장된 프로그램과 같은 파일을 저장할 수 있다. 저장 유닛(1415)은 사용자 데이터, 예컨대 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 일부 경우에서, 컴퓨터 시스템(1401)은 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(1401)과 통신하는 원격 서버에 위치되는 것과 같이 컴퓨터 시스템(1401) 외부에 있는 하나 이상의 추가 데이터 저장 유닛을 포함할 수 있다.
컴퓨터 시스템(1401)은 네트워크(1430)를 통해 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예컨대, 컴퓨터 시스템(1401)은 사용자의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예는 개인용 컴퓨터(예컨대, 휴대용 PC), 슬레이트 또는 태블릿 PC(예컨대, Apple® 아이패드, Samsung® 갤럭시 탭), 전화기, 스마트 폰(예컨대, Apple® 아이폰, 안드로이드 지원 디바이스, Blackberry®) 또는 개인용 디지털 어시스턴트를 포함한다. 사용자는 네트워크(1430)를 통해 컴퓨터 시스템(1401)에 접근할 수 있다.
본원에 기재된 방법은, 예컨대 메모리(1410) 또는 전자 저장 유닛(1415)과 같은 컴퓨터 시스템(1401)의 전자 저장 위치에 저장된 기계(예컨대, 컴퓨터 프로세서) 실행 가능 코드에 의해 구현될 수 있다. 기계 실행 가능 또는 기계 판독 가능 코드는 소프트웨어 형태로 제공될 수 있다. 사용 중에, 코드는 프로세서(1405)에 의해 실행될 수 있다. 일부 경우에서, 코드는 저장 유닛(1415)으로부터 검색될 수 있고 프로세서(1405)에 의해 즉시 접근할 수 있도록 메모리(1410)에 저장될 수 있다. 일부 상황에서, 전자 저장 유닛(1415)은 배제될 수 있고, 기계 실행 가능 명령은 메모리(1410)에 저장된다.
코드는 코드를 실행하도록 적응된 프로세서를 갖는 기계와 함께 사용하기 위해 미리 컴파일링되고 구성될 수 있거나, 런타임 동안 컴파일링될 수 있다. 코드는 사전 컴파일링 또는 컴파일링된 방식으로 코드를 실행할 수 있도록 선택될 수 있는 프로그래밍 언어로 제공될 수 있다.
컴퓨터 시스템(1401)과 같은 본원에 제공된 시스템 및 방법의 양태는 프로그래밍으로 구현될 수 있다. 기술의 다양한 측면은 전형적으로 기계 (또는 프로세서) 실행 가능 코드 및/또는 기계 판독 가능 매체의 유형으로 수행되거나 구현되는 관련 데이터 형태의 "제품" 또는 "제조품"으로 간주될 수 있다. 기계 실행 가능 코드는 메모리(예컨대, 읽기 전용 메모리, 랜덤 접근 메모리, 플래시 메모리) 또는 하드 디스크와 같은 전자 저장 유닛에 저장될 수 있다. "저장" 유형 매체는 소프트웨어 프로그래밍을 위해 언제든지 비일시적 저장을 제공할 수 있는 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등과 같은 컴퓨터, 프로세서 등의 유형 메모리, 또는 그의 관련 모듈의 일부 또는 전부를 포함할 수 있다. 소프트웨어의 전부 또는 일부는 때때로 인터넷 또는 다양한 다른 통신 네트워크를 통해 통신될 수 있다. 예컨대, 이러한 통신은 하나의 컴퓨터 또는 프로세서로부터 다른 컴퓨터 또는 프로세서로, 예컨대 관리 서버 또는 호스트 컴퓨터로부터 애플리케이션 서버의 컴퓨터 플랫폼으로 소프트웨어의 로딩을 가능하게 할 수 있다. 따라서, 소프트웨어 요소를 탑재할 수 있는 또 다른 유형의 매체는 유선 및 광학 유선 네트워크 및 다양한 무선 링크를 통해 로컬 디바이스 간의 물리적 인터페이스를 통해 사용되는 것과 같은 광학, 전기 및 전자기파를 포함한다. 유선 또는 무선 링크, 광학 링크 등과 같이 이러한 파동을 전달하는 물리적 요소도 소프트웨어를 탑재한 미디어로 간주될 수 있다. 본원에서 사용되는 바와 같이, 비일시적 유형의 "저장" 매체로 제한되지 않는 한, 컴퓨터 또는 기계 "판독 가능 매체"와 같은 용어는 실행을 위해 프로세서에 명령을 제공하는 데 참여하는 임의의 매체를 지칭한다.
따라서, 컴퓨터 실행 가능 코드와 같은 기계 판독 가능 매체는 유형 저장 매체, 반송파 매체 또는 물리적 전송 매체를 포함하지만 이에 제한되지 않는 다양한 형태를 취할 수 있다. 비휘발성 저장 매체는, 예컨대 도면에 나타낸 데이터베이스 등을 구현하는 데 사용될 수 있는 임의의 컴퓨터(들) 등에 있는 임의의 저장 디바이스와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 저장 매체는 이러한 컴퓨터 플랫폼의 주 메모리와 같은 동적 메모리를 포함한다. 유형의 전송 매체는 동축 케이블; 컴퓨터 시스템 내의 버스를 구성하는 와이어를 포함한 구리 와이어 및 광섬유를 포함한다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 중에 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서, 컴퓨터 판독 가능 매체의 일반적인 형태는, 예컨대 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드 페이퍼 테이프, 구멍 패턴을 갖는 임의의 다른 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 판독할 수 있는 다른 매체를 포함한다. 이들 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서에 전달하는 데 관련될 수 있다.
컴퓨터 시스템(1401)은 사용, 예컨대 관심 종 및 관심 종으로부터의 관심 유전자를 선택하는 능력을 제공하기 위한 사용자 인터페이스(UI)(1440)를 포함하는 전자 디스플레이(1435)를 포함하거나 이와 통신할 수 있다. UI의 예는, 제한 없이, 그래픽 사용자 인터페이스(GUI) 및 웹 기반 사용자 인터페이스를 포함한다.
본 개시내용의 방법 및 시스템은 하나 이상의 알고리즘에 의해 구현될 수 있다. 알고리즘은 중앙 프로세싱 디바이스(1405)에 의해 실행될 때 소프트웨어를 통해 구현될 수 있다. 알고리즘은, 예컨대 종의 관심 게놈 영역에 혼성화하기 위한 하나 이상의 gRNA를 설계하고, 하나 이상의 gRNA 중 적어도 하나의 합성을 활성화하고 시작할 수 있다.
실시예
실시예 1: 다중 가이드 RNA의 사용은 단일 가이드 RNA의 사용보다 더 높은 편집 효율을 달성한다
총 228개의 가이드 RNA가 76개의 유전자에 혼성화하도록 설계되었으며, 유전자당 3개의 가이드 RNA가 설계되었다. 3개의 가이드 RNA의 각각의 세트는 가이드간 간격이 적어도 30 bp이도록 설계되었다. 가이드 RNA를 HEK293 및 MCF7 세포에 도입하여 96-웰 플레이트에서 웰당 35,000개 세포로 시딩하였다. 단일 가이드 편집에 사용된 가이드 RNA는 4.5 μmol에서 형질감염된 반면, 다중 가이드 RNA 사용을 위한 가이드 RNA는 각각 2.25 μmol에서 형질감염되었다. 모든 가이드 RNA는 핵감염을 통해 리보핵단백질(RNP)로 형질감염되었다. 형질감염 전에, 0.5 μmol의 Cas9가 RNP와 복합체화되었다. 형질감염 후 2일에 생성된 세포 유전자형을 생거 시퀀싱을 통해 조사하고, 전체 편집 효율을 ICE(Inference of CRISPR Edits)를 사용하여 분석하였다. 편집 효율 퍼센트는 편집을 위해 gRNA가 설계된 위치에서 비야생형 유전자형을 포함하는 세포의 퍼센트를 나타내는 데 사용되었다. 편집 효율은 유전자당 단일 gRNA 뿐만 아니라 유전자당 3개의 gRNA 세트의 사용에 대해 평가되었다(도 15). 데이터포인트 뒤의 박스플롯은 중앙값, 25/75번째 퍼센트 및 5/95번째 퍼센트를 나타낸다. 이들 결과는 지정된 가이드간 간격을 갖는 3개의 gRNA의 사용이 표적 유전자에 혼성화하는 단일 gRNA의 사용보다 더 높은 편집 효율을 달성한다는 것을 나타내었다(p <1E-15, 만-위트니 U 시험(Mann-Whitney U test).
다중 가이드 sgRNA를 사용한 편집 결과는 가이드 간격의 효과에 대해 추가로 분석되었다. 537개의 gRNA가 179개의 유전자에 혼성화하도록 설계되었으며, 유전자당 3개의 gRNA가 설계되었다. 이들 gRNA는 -20 bp(즉, 완전히 겹침)에서 80 bp 사이의 가이드간 간격으로 설계되었다. 다중 가이드를 위한 가이드 RNA는 각각 2.25 μmol에서 형질감염되었다. 모든 gRNA는 핵감염을 통해 리보핵단백질(RNP)로 형질감염되었다. 형질감염 전에 0.5 μmol Cas9는 RNP와 복합체화되었다. 형질감염 후 2일에 생성된 세포 유전자형을 생거 시퀀싱을 통해 조사하고 전체 편집 효율을 분석하였다. 가이드간 간격(즉, 가이드 사이의 끝에서 시작까지의 거리)이 30개 염기쌍(bp) 초과로 증가함에 따라 전체 편집 효율이 개선되어 75% 미만의 효율은 관찰되지 않았다(도 16).
실시예 2: 다중 가이드 RNA 키트의 조합
9개의 sgRNA를 설계하였다(인간 게놈: 2개의 유전자(단백질 아르기닌 메틸트랜스퍼라제 5(PRMT5) 및 메틸티오아데노신 포스포릴라제(MTAP)) 내의 3개의 표적 영역 각각 뿐만 아니라 아데노 연관된 바이러스 통합 부위 1(AAVS1) 내의 부위를 표적화하기 위한 3개의 sgRNA). 각각의 sgRNA 세트에서, 가이드간 간격은 적어도 30 bp였다. 각각의 쌍별 조합에서 각각의 유전자에 대한 편집 효율은 생거 시퀀싱을 통해 결정되었다(도 17).
5000개의 Hep3B 세포를 96-웰 플레이트에 웰당 시딩하였다. 이들 세포를 Nucleofector™ 기술(Lonza)을 사용하여 쌍을 표적화하는 다중 RNP로 형질감염시키고, 세포 역가를 형질감염 후 24, 48 및 72에 분석하였다. 이들 결과는 단일 형질감염으로 동시에 다수의 게놈 유전자좌에서 편집을 만들 수 있음을 나타낸다.
실시예 3: 배열된 라이브러리 스크리닝
96 웰 플레이트의 92 웰에 웰당 35,000개의 U2OS 세포를 시딩하였다. 92개의 웰 각각은 스크리닝 검정에 의해 표적화되는 총 92개의 상이한 유전자에 대한 적어도 30 bp의 가이드간 간격을 갖는 유전자를 표적화하는 2개 또는 3개의 sgRNA 세트, 및 Cas9 엔도뉴클레아제를 추가로 함유하였다. 세포는 Nucleofector™ 기술(Lonza)을 사용하여 형질감염되었다. 이어서, 세포 생존율을 형질감염 후 6일에 CellTiter-Glo® 발광 세포 생존율 검정 사용하여 평가하였다(도 18a). 추가로, 이들 세포를 형질감염 후 2일에 생거 시퀀싱으로 유전자형을 분석한 다음, ICE(Inference of CRISPR Edits)을 사용하여 분석하여 편집 효율을 결정하였다(도 18b). 동일한 세포 집단의 결과적 유전자형을 평가하는 능력은 풀링된 스크리닝 접근법에 비해 배열된 스크리닝 접근법의 이점일 수 있다.
본 발명의 바람직한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명은 명세서 내에 제공된 특정 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명이 전술된 명세서를 참조하여 설명되었지만, 본원의 실시양태의 설명 및 예시는 제한적인 의미로 해석되지 않는다. 이제 본 발명을 벗어나지 않으면서 다양한 변경, 변화 및 대체가 당업자에게 발생할 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 의존하는 본원에 기재된 특정 묘사, 구성 또는 상대적 비율에 제한되지 않는다는 것을 이해해야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 또한 임의의 이러한 대안, 변형, 변경 또는 등가물을 포함할 것으로 예상된다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위 내의 방법 및 구조 및 그의 등가물이 이에 의해 커버되는 것으로 의도된다.
SEQUENCE LISTING <110> SYNTHEGO CORPORATION <120> METHODS AND SYSTEMS FOR GUIDE RNA DESIGN AND USE <130> 54108-708.601 <140> PCT/US2019/032735 <141> 2019-05-16 <150> 62/672,437 <151> 2018-05-16 <160> 91 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1 aggccugggc uggcucugcc 20 <210> 2 <211> 20 <212> DNA <213> Homo sapiens <400> 2 aggcctgggc tggctctgcc 20 <210> 3 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 3 uccccuggca gagccagccc 20 <210> 4 <211> 20 <212> DNA <213> Homo sapiens <400> 4 tcccctggca gagccagccc 20 <210> 5 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 5 uaggggccag aggccugggc 20 <210> 6 <211> 20 <212> DNA <213> Homo sapiens <400> 6 taggggccag aggcctgggc 20 <210> 7 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 7 cacauagggg ccagaggccu 20 <210> 8 <211> 20 <212> DNA <213> Homo sapiens <400> 8 cacatagggg ccagaggcct 20 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 tggcgcagtg ctgaccttga 20 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 ggcgcagtgc tgaccttgat 20 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 11 cgcagtgctg accttgatgg 20 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 gcagtgctga ccttgatggt 20 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 cagtgctgac cttgatggtg 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 14 tgctgacctt gatggtgggg 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 gctgaccttg atggtggggt 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 cttgatggtg gggtgggtct 20 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 tgatggtggg gtgggtcttg 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 18 gatggtgggg tgggtcttgg 20 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 gtatctgtgc tcctctcgcc 20 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 tatctgtgct cctctcgcct 20 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 ctcgcctggg atgctgcccg 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 gggatgctgc ccgcggagcg 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 23 gcggagcgcc cctcgcactt 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 24 cggagcgccc ctcgcacttg 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 25 agcgcccctc gcacttgtag 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 26 ctcgcacttg tagcggaagc 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 27 tcgcacttgt agcggaagcg 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 28 cgcacttgta gcggaagcgc 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 29 gaagcgcatg ccccgctgct 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 aagcgcatgc cccgctgctt 20 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 31 cgctgcttgg gctgctcaat 20 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 32 gctgcttggg ctgctcaatg 20 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 33 ctgcttgggc tgctcaatga 20 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 34 ctgctcaatg atctccacat 20 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 35 tgctcaatga tctccacata 20 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 36 gctcaatgat ctccacatag 20 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 37 gatctccaca taggggccag 20 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 38 ccacataggg gccagaggcc 20 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 39 cataggggcc agaggcctgg 20 <210> 40 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 40 gaggcctggg ctggctctgc 20 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 41 ggcctgggct ggctctgcca 20 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 gcctgggctg gctctgccag 20 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 43 gggctggctc tgccagggga 20 <210> 44 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 44 ggggacaccg cagccccatt 20 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 45 gacaccgcag ccccattagg 20 <210> 46 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 uccccuggca gaggcagccc 20 <210> 47 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 47 gaucuccaca uaggggccag 20 <210> 48 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 ccaggccucu ggccccuaug 20 <210> 49 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 gcucaaugau cuccacauag 20 <210> 50 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 gauggugggg ugggucuugg 20 <210> 51 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 gcugaccuug augguggggu 20 <210> 52 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 52 ugcugaccuu gauggugggg 20 <210> 53 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 53 cagugcugac cuugauggug 20 <210> 54 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 gcagugcuga ccuugauggu 20 <210> 55 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 55 cgcagugcug accuugaugg 20 <210> 56 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 56 caagacccac cccaccauca 20 <210> 57 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 57 gacaccgcag ccccauuagg 20 <210> 58 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 58 ggggacaccg cagccccauu 20 <210> 59 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 aauggggcug cggugucccc 20 <210> 60 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 uccccuggca gagccagccc 20 <210> 61 <211> 30 <212> DNA <213> Homo sapiens <400> 61 aggcctgggc tggctctgcc aggggacacc 30 <210> 62 <211> 30 <212> DNA <213> Homo sapiens <400> 62 ggtgtcccct ggcagagcca gcccaggcct 30 <210> 63 <211> 20 <212> DNA <213> Homo sapiens <400> 63 ttctctggca gagccagccc 20 <210> 64 <211> 20 <212> DNA <213> Homo sapiens <400> 64 caccctggca gagccagccc 20 <210> 65 <211> 20 <212> DNA <213> Homo sapiens <400> 65 tcccctggca gaggcagcgc 20 <210> 66 <211> 20 <212> DNA <213> Homo sapiens <400> 66 tccccaggca gaagcagccc 20 <210> 67 <211> 20 <212> DNA <213> Homo sapiens <400> 67 tggcctggca aagccagccc 20 <210> 68 <211> 20 <212> DNA <213> Homo sapiens <400> 68 tcccctgaaa cagccagccc 20 <210> 69 <211> 20 <212> DNA <213> Homo sapiens <400> 69 tcccctggca gaggcgcccc 20 <210> 70 <211> 20 <212> DNA <213> Homo sapiens <400> 70 ttcccaggca gagccagcca 20 <210> 71 <211> 20 <212> DNA <213> Homo sapiens <400> 71 tccccaggcc cagccagccc 20 <210> 72 <211> 20 <212> DNA <213> Homo sapiens <400> 72 tcccctggca gagcctggca 20 <210> 73 <211> 20 <212> DNA <213> Homo sapiens <400> 73 ggcactggca gagccagccc 20 <210> 74 <211> 20 <212> DNA <213> Homo sapiens <400> 74 tcccctggca gagaaagcac 20 <210> 75 <211> 20 <212> DNA <213> Homo sapiens <400> 75 gcccttggaa gagccagccc 20 <210> 76 <211> 20 <212> DNA <213> Homo sapiens <400> 76 ttccctggct gagcaagccc 20 <210> 77 <211> 20 <212> DNA <213> Homo sapiens <400> 77 tccccaggca gagccggcct 20 <210> 78 <211> 20 <212> DNA <213> Homo sapiens <400> 78 tcccctctca gtgccagccc 20 <210> 79 <211> 20 <212> DNA <213> Homo sapiens <400> 79 gcccctggca gtgcaagccc 20 <210> 80 <211> 20 <212> DNA <213> Homo sapiens <400> 80 tccccaggca gagcctgcca 20 <210> 81 <211> 20 <212> DNA <213> Homo sapiens <400> 81 tccctgggca gagccagctc 20 <210> 82 <211> 20 <212> DNA <213> Homo sapiens <400> 82 gctcctggca gtgccagccc 20 <210> 83 <211> 20 <212> DNA <213> Homo sapiens <400> 83 tcccgtggca gggtcagccc 20 <210> 84 <211> 20 <212> DNA <213> Homo sapiens <400> 84 tcccctggca ggccctgccc 20 <210> 85 <211> 20 <212> DNA <213> Homo sapiens <400> 85 tcccctgtga gtgccagccc 20 <210> 86 <211> 20 <212> DNA <213> Homo sapiens <400> 86 tcccctggta gggctagccc 20 <210> 87 <211> 20 <212> DNA <213> Homo sapiens <400> 87 tccccgacca gagccagccc 20 <210> 88 <211> 20 <212> DNA <213> Homo sapiens <400> 88 tcctctgaca gggccagccc 20 <210> 89 <211> 20 <212> DNA <213> Homo sapiens <400> 89 tgccctggca aggccagccc 20 <210> 90 <211> 20 <212> DNA <213> Homo sapiens <400> 90 tcacccagca gagccagccc 20 <210> 91 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 91 His His His His His His 1 5

Claims (122)

  1. 게놈 내의 관심 게놈 영역에 혼성화 가능한 가이드 RNA(gRNA) 세트를 확인하는 방법으로서,
    gRNA 세트를 설계하는 단계로서, 여기서 gRNA 세트 내의 각각의 gRNA는, 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 복수의 표적 부위 내의 상이한 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 복수의 표적 부위로부터의 표적 부위에 혼성화 가능한 것인 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 표적 부위가 상이한 표적 부위로부터 최대 170개의 염기가 떨어져 있는 것인 방법.
  3. 제1항에 있어서, gRNA 세트 내의 적어도 하나의 gRNA의 서열이 관심 게놈 영역에 상보적인 방법.
  4. 제1항에 있어서, gRNA 세트 내의 적어도 하나의 gRNA의 서열이 관심 게놈 영역에 부분적으로 상보적인 방법.
  5. 제4항에 있어서, 관심 게놈 영역에 부분적으로 상보적인 gRNA 세트 내의 적어도 하나의 gRNA의 서열이 관심 게놈 영역에 대해 1개, 2개, 3개, 4개, 5개, 또는 5개 초과의 미스매치를 포함하는 것인 방법.
  6. 제1항에 있어서, gRNA 세트 내의 각각의 gRNA는 길이가 약 17 내지 약 42개 염기인 방법.
  7. 제2항에 있어서, gRNA 세트 내의 각각의 gRNA는 길이가 약 20개 염기인 방법.
  8. 제1항에 있어서, gRNA 세트 내의 각각의 gRNA가 약 20개 염기의 가이드 서열을 포함하고 약 22 내지 약 80개 염기 길이의 불변 영역을 추가로 포함하는 것인 방법.
  9. 제8항에 있어서, gRNA 세트 내의 각각의 gRNA의 가이드 서열이 관심 게놈 영역에 선택적으로 혼성화하는 것인 방법.
  10. 제1항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA는 길이가 약 100개 염기인 방법.
  11. 제1항에 있어서, 관심 게놈 영역이 유전자의 코딩 영역을 포함하는 것인 방법.
  12. 제11항에 있어서, 관심 게놈 영역이 유전자의 엑손을 포함하는 것인 방법.
  13. 제1항에 있어서, 관심 게놈 영역이 유전자 패밀리를 포함하는 것인 방법.
  14. 제13항에 있어서, 관심 게놈 영역이 유전자 패밀리로부터의 하나 이상의 코딩 영역을 포함하는 것인 방법.
  15. 제1항에 있어서, 관심 게놈 영역이 게놈의 비코딩 영역을 포함하는 것인 방법.
  16. 제15항에 있어서, 비코딩 영역이 조절 요소인 방법.
  17. 제16항에 있어서, 조절 요소가 시스-조절 요소 또는 트랜스-조절 요소인 방법.
  18. 제17항에 있어서, 시스-조절 요소가 프로모터, 인핸서, 및 사일런서로 이루어진 군으로부터 선택되는 것인 방법.
  19. 제13항에 있어서, 관심 게놈 영역이 5 kb를 초과, 10 kb를 초과, 15 kb를 초과, 20 kb를 초과, 50 kb를 초과, 또는 100 kb를 초과하는 범위인 방법.
  20. 제1항에 있어서, gRNA 세트가 적어도 2, 적어도 3, 또는 적어도 4개의 gRNA를 포함하는 것인 방법.
  21. 제1항에 있어서, 가이드 RNA 세트로부터의 적어도 하나의 gRNA가 변형을 포함하는 것인 방법.
  22. 제21항에 있어서, 변형이 2'-O-Cl-4알킬, 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-메톡시에틸(2'-MOE), 2'-플루오로(2'-F), 2'-아미노(2'-NH2), 2'-아라비노실(2'-아라비노) 뉴클레오티드, 2'-F-아라비노실(2'-F-아라비노) 뉴클레오티드, 2'-잠금 핵산(LNA) 뉴클레오티드, 2'-잠금해제 핵산(ULNA) 뉴클레오티드, L형의 슈가(L-슈가), 및 4'-티오리보실 뉴클레오티드로 이루어진 군으로부터 선택되는 것인 방법.
  23. 제21항에 있어서, 변형이 포스포로티오에이트, 포스포노카르복실레이트, 티오포스포노카르복실레이트, 알킬포스포네이트, 및 포스포로디티오에이트로 이루어진 군으로부터 선택되는 뉴클레오티드간 연결 변형인 방법.
  24. 제21항에 있어서, 변형이 2-티오우라실(2-티오U), 2-티오시토신(2-티오C), 4-티오우라실(4-티오U), 6-티오구아닌(6-티오G), 2-아미노아데닌(2-아미노A), 2-아미노퓨린, 슈도우라실, 히포크산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신(5-메틸C), 5-메틸우라실(5-메틸U), 5-히드록시메틸시토신, 5-히드록시메틸우라실, 5,6-데히드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실(5-알릴U), 5-알릴시토신(5-알릴C), 5-아미노알릴우라실(5-아미노알릴U), 5-아미노알릴-시토신(5-아미노알릴C), 무염기 뉴클레오티드, Z 염기, P 염기, 비구조화 핵산(UNA), 이소구아닌(이소G), 이소시토신(이소C), 및 5-메틸-2-피리미딘으로 이루어진 군으로부터 선택되는 것인 방법.
  25. 제1항에 있어서, 복수의 표적 부위의 표적 부위가 Cas9, C2c1, C2c3, 및 Cpf1로 이루어진 군으로부터 선택되는 뉴클레아제에 대한 PAM 부위에 인접한 것인 방법.
  26. 제25항에 있어서, 뉴클레아제가 Cas9인 방법.
  27. 제25항에 있어서, 뉴클레아제가 불활성화된 Cas9인 방법.
  28. 제25항에 있어서, gRNA 세트가 세포에서 관심 게놈 영역 내의 유전자를 녹아웃하도록 설계되는 것인 방법.
  29. 제28항에 있어서, 세포가 인간 1차 세포, 인간 불멸화 세포, 인간 유도 만능 줄기 세포, 마우스 배아 줄기 세포, 및 차이니즈 햄스터 난소 세포로 이루어진 군으로부터 선택되는 것인 방법.
  30. 제1항에 있어서, 설계는 컴퓨터에 의해 수행되는 것인 방법.
  31. 가이드 RNA(gRNA) 세트를 포함하는 키트로서, gRNA 세트의 각각의 gRNA가 제1항 내지 제29항 중 어느 한 항의 방법에 의해 설계되는 것인 키트.
  32. 게놈 내의 관심 게놈 영역에 혼성화 가능한 gRNA 세트를 포함하는 키트로서, 여기서 gRNA 세트 내의 각각의 gRNA는
    가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 복수의 표적 부위 내의 상이한 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 관심 게놈 영역 내의 복수의 표적 부위로부터의 표적 부위에 혼성화 가능한 것인 키트.
  33. 제32항에 있어서, 표적 부위가 상이한 표적 부위로부터 최대 170개의 염기가 떨어져 있는 것인 키트.
  34. 제32항에 있어서, gRNA 세트가 적어도 2개, 적어도 3개, 또는 적어도 4개의 gRNA를 포함하는 것인 키트.
  35. 제32항에 있어서, Cas9, C2c1, C2c3, 및 Cpf1로 이루어진 군으로부터 선택되는 하나 이상의 뉴클레아제를 추가로 포함하는 키트.
  36. 제32항에 있어서, 복수의 gRNA 세트를 추가로 포함하며, 각각의 gRNA 세트가 게놈 내의 상이한 관심 게놈 영역에 혼성화 가능한 것인 키트.
  37. 제35항에 있어서, 하나 이상의 뉴클레아제가 적어도 하나의 gRNA에 커플링되는 것인 키트.
  38. 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 선택하는 방법으로서,
    유전자에 혼성화하는 초기 가이드 RNA 세트의 복수의 가이드 RNA 각각에 대해, 게놈 내의 잠재적인 가이드 RNA 혼성화 부위에 대한 미스매치의 수를 열거함으로써 오프-표적 값을 계산하는 단계
    를 포함하는 방법.
  39. 제38항에 있어서, 복수의 gRNA 내의 각각의 gRNA는 길이가 100개 염기인 방법.
  40. 제39항에 있어서, 복수의 gRNA 내의 각각의 gRNA의 약 20개 염기가 관심 게놈 영역 내의 상이한 표적 부위에 혼성화하는 것인 방법.
  41. 제38항에 있어서, 미스매치의 수가 0인 방법.
  42. 제38항에 있어서, 미스매치의 수가 1인 방법.
  43. 제39항에 있어서, 미스매치의 수가 2인 방법.
  44. 제43항에 있어서, 미스매치의 수가 3인 방법.
  45. 제38항에 있어서, 계산은 초기 가이드 RNA 세트의 각각의 gRNA에 대한 미스매치의 수의 총합을 열거하는 것인 방법.
  46. 제38항에 있어서, 계산은 미스매치의 수를 샤드로 편성하는 것인 방법.
  47. 제38항에 있어서, 오프-표적 값이 참조 게놈에 대하여 계산되는 것인 방법.
  48. 제47항에 있어서, 참조 게놈이 인간 참조 게놈인 방법.
  49. 제47항에 있어서, 참조 게놈이 호모 사피엔스(Homo sapiens), 무스 무스쿨루스(Mus musculus), 크리세툴루스 그리세우스(Cricetulus griseus), 라투스 노르베기쿠스(Rattus Norvegicus), 다니오 레리오(Danio rerio), 및 카에노르하브디티스 엘레간스(Caenorhabditis elegans)로 이루어진 군으로부터 선택되는 것인 방법.
  50. 제38항에 있어서, 오프-표적 값이 참조 게놈의 1,000,000 bp에 걸쳐 또는 참조 게놈 전체에서 결정되는 것인 방법.
  51. 제38항에 있어서, 오프-표적 값이 뉴클레아제의 결합 부위의 데이터베이스에 대해 계산되는 것인 방법.
  52. 제51항에 있어서, 뉴클레아제가 Cas9, C2c1, C2c3, 및 Cpf1로 이루어진 군으로부터 선택되는 것인 방법.
  53. 제52항에 있어서, 뉴클레아제가 Cas9인 방법.
  54. 제51항에 있어서, 데이터베이스가 10,000개 초과, 50,000개 초과, 100,000개 초과, 150,000개 초과, 200,000개 초과, 250,000개 초과, 300,000개 초과, 350,000개 초과, 400,000개 초과, 450,000개 초과, 500,000개 초과, 550,000개 초과, 600,000개 초과, 650,000개 초과, 700,000개 초과, 750,000개 초과, 800,000개 초과, 850,000개 초과, 900,000개 초과, 950,000개 초과, 또는 1,000,000개 초과의 뉴클레아제 결합 부위를 포함하는 것인 방법.
  55. 제51항에 있어서, 뉴클레아제 결합 부위의 데이터베이스가 25,000,000개 초과, 50,000,000개 초과, 75,000,000개 초과, 100,000,000개 초과, 125,000,000개 초과, 150,000,000개 초과, 175,000,000개 초과, 200,000,000개 초과, 225,000,000개 초과, 250,000,000개 초과, 275,000,000개 초과, 또는 300,000,000개 초과의 뉴클레아제 결합 부위를 포함하는 것인 방법.
  56. 제38항에 있어서, 미스매치의 수를 열거함으로써 오프-표적 값을 계산하는 것은 컴퓨터에 의해 수행되는 것인 방법.
  57. 종의 게놈의 유전자에 혼성화하기 위한 하나 이상의 가이드 RNA(gRNA)를 설계하는 방법으로서,
    복수의 유전자 전사체로부터 전사체를 선택하는 단계; 및
    초기 gRNA 세트를 확인하는 단계로서, 여기서 초기 gRNA 세트 내의 각각의 gRNA는 선택된 전사체의 유전자 내의 상이한 표적 부위에 혼성화하는 것인 단계
    를 포함하는 방법.
  58. 제57항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA는 길이가 약 17 내지 약 42개 염기인 방법.
  59. 제58항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA는 길이가 약 20개 염기인 방법.
  60. 제57항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA가 약 20개 염기의 가이드 서열 및 약 22 내지 약 80개 염기 길이의 불변 영역을 포함하는 것인 방법.
  61. 제60항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA의 가이드 서열이 표적 부위에 선택적으로 혼성화하는 것인 방법.
  62. 제57항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA는 길이가 약 100개 염기인 방법.
  63. 제57항에 있어서, 선택된 전사체가 데이터베이스 내의 유전자의 가장 풍부한 전사체인 방법.
  64. 제57항에 있어서, 선택된 전사체가 유전자의 복수의 전사체의 가장 긴 전사체인 방법.
  65. 제57항에 있어서, 선택된 전사체에 존재하는 유전자에서 코딩 영역을 선택하는 단계를 추가로 포함하는 방법.
  66. 제65항에 있어서, 선택된 코딩 영역이 초기 위치 엑손인 방법.
  67. 제66항에 있어서, 초기 위치 엑손이 유전자의 전반부에 있는 것인 방법.
  68. 제66항에 있어서, 초기 위치 엑손이 유전자의 제1, 제2, 제3, 제4, 제5, 또는 제6 엑손인 방법.
  69. 제65항에 있어서, 선택된 코딩 영역이, 유전자의 복수의 전사체 중의 가장 풍부한 전사체인 선택된 엑손인 방법.
  70. 제69항에 있어서, 선택된 엑손이 복수의 전사체 중의 하나 이상의 다른 엑손보다 긴 것인 방법.
  71. 제69항에 있어서, 선택된 엑손이 적어도 50 bp, 적어도 55 bp, 적어도 60 bp, 적어도 65 bp, 적어도 70 bp, 또는 적어도 75 bp인 방법.
  72. 제69항에 있어서, 선택된 엑손이 복수의 전사체에서 길이 및 풍부도 둘 다에 기초하여 선택되는 것인 방법.
  73. 제57항에 있어서, 초기 gRNA 세트의 각각의 gRNA에 대한 오프-표적 값을 결정하는 단계를 추가로 포함하는 방법.
  74. 제73항에 있어서, 오프-표적 값이 종의 게놈 전체에서 결정되는 것인 방법.
  75. 제74항에 있어서, 게놈이 종의 참조 게놈인 방법.
  76. 제75항에 있어서, 종의 참조 게놈이, 염색체 및 비국지화된 콘티그를 함유하는 완전한 참조 어셈블리인 방법.
  77. 제73항에 있어서, 게놈 내의 복수의 표적 부위와 비교하여 초기 gRNA 세트 내의 각각의 gRNA에 대한 미스매치의 수를 열거함으로써 오프-표적 값을 결정하는 단계를 추가로 포함하는 방법.
  78. 제77항에 있어서, 복수의 표적 부위가 게놈 전체에서 모든 가능한 Cas 뉴클레아제 결합 부위를 포함하는 것인 방법.
  79. 제77항에 있어서, 복수의 표적 부위가 적어도 1000, 10,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 2,000,000, 또는 3,000,000개의 표적 부위를 포함하는 것인 방법.
  80. 제77항에 있어서, 복수의 표적 부위가 적어도 100,000,000, 200,000,000, 300,000,000, 400,000,000, 500,000,000, 600,000,000, 700,000,000, 800,000,000, 900,000,000, 1,000,000,000, 또는 1,500,000,000개의 표적 부위를 포함하는 것인 방법.
  81. 제77항에 있어서, 열거는, 0, 1, 2, 3, 또는 4의 미스매치 수를 갖는 초기 가이드 RNA 세트의 각각의 gRNA에 대한 오프-표적 혼성화 영역을 결정하는 것을 포함하는 것인 방법.
  82. 제57항에 있어서, 상이한 표적 부위의 표적 부위가 Cas9, C2c1, C2c3, 및 Cpf1로 이루어진 군으로부터 선택되는 뉴클레아제에 대한 PAM 부위에 인접한 것인 방법.
  83. 제82항에 있어서, 뉴클레아제가 Cas9인 방법.
  84. 제82항에 있어서, PAM 부위가 NGG인 방법.
  85. 제82항에 있어서, 뉴클레아제가 불활성화된 Cas인 방법.
  86. 제57항에 있어서, 종이 호모 사피엔스, 무스 무스쿨루스, 크리세툴루스 그리세우스, 라투스 노르베기쿠스, 다니오 레리오, 및 카에노르하브디티스 엘레간스로 이루어진 군으로부터 선택되는 것인 방법.
  87. 제57항에 있어서, 온-표적 효율 역치 및 오프-표적 역치에 기초하여 초기 gRNA 세트로부터 가이드 RNA 서브세트를 선택하는 단계를 추가로 포함하는 방법.
  88. 제87항에 있어서, 초기 gRNA 세트의 각각의 가이드 RNA에 대한 온-표적 효율 역치가 방위각 점수를 계산함으로써 결정되는 것인 방법.
  89. 제88항에 있어서, 방위각 점수가 0.4 초과인 방법.
  90. 제88항에 있어서, 확인은 방위각 점수 및 오프-표적 혼성화 값의 역치에 기초하는 것인 방법.
  91. 제57항에 있어서, 초기 gRNA 세트가 세포 내의 유전자를 녹아웃시키는 것인 방법.
  92. 제57항에 있어서, 초기 gRNA 세트가 세포 내의 유전자로 돌연변이를 녹인하는 것인 방법.
  93. 제91항 또는 제92항에 있어서, 세포가 인간 1차 세포, 인간 불멸화 세포, 인간 유도 만능 줄기 세포, 마우스 배아 줄기 세포, 및 차이니즈 햄스터 난소 세포로 이루어진 군으로부터 선택되는 것인 방법.
  94. 제57항에 있어서, 초기 가이드 RNA 세트 내의 적어도 하나의 가이드 RNA로부터의 적어도 하나의 뉴클레오티드가 변형을 포함하는 것인 방법.
  95. 제94항에 있어서, 변형이 2'-O-Cl-4알킬, 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-메톡시에틸(2'-MOE), 2'-플루오로(2'-F), 2'-아미노(2'-NH2), 2'-아라비노실(2'-아라비노) 뉴클레오티드, 2'-F-아라비노실(2'-F-아라비노) 뉴클레오티드, 2'-잠금 핵산(LNA) 뉴클레오티드, 2'-잠금해제 핵산(ULNA) 뉴클레오티드, L형의 슈가(L-슈가), 및 4'-티오리보실 뉴클레오티드로 이루어진 군으로부터 선택되는 것인 방법.
  96. 제94항에 있어서, 변형이 포스포로티오에이트, 포스포노카르복실레이트, 티오포스포노카르복실레이트, 알킬포스포네이트, 및 포스포로디티오에이트로 이루어진 군으로부터 선택되는 뉴클레오티드간 연결 변형인 방법.
  97. 제94항에 있어서, 변형이 2-티오우라실(2-티오U), 2-티오시토신(2-티오C), 4-티오우라실(4-티오U), 6-티오구아닌(6-티오G), 2-아미노아데닌(2-아미노A), 2-아미노퓨린, 슈도우라실, 히포크산틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신(5-메틸C), 5-메틸우라실(5-메틸U), 5-히드록시메틸시토신, 5-히드록시메틸우라실, 5,6-데히드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실(5-알릴U), 5-알릴시토신(5-알릴C), 5-아미노알릴우라실(5-아미노알릴U), 5-아미노알릴-시토신(5-아미노알릴C), 무염기 뉴클레오티드, Z 염기, P 염기, 비구조화 핵산(UNA), 이소구아닌(이소G), 이소시토신(이소C), 및 5-메틸-2-피리미딘으로 이루어진 군으로부터 선택되는 것인 방법.
  98. 제57항에 있어서, 선택 및 확인은 컴퓨터에 의해 수행되는 것인 방법.
  99. 제57항에 있어서, 초기 gRNA 세트 내의 각각의 gRNA가, 초기 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 표적 부위에 혼성화 가능한 것인 방법.
  100. 가이드 RNA(gRNA) 세트를 포함하는 키트로서, gRNA 세트 내의 각각의 gRNA가 제57항 내지 제98항 중 어느 한 항의 방법에 의해 설계되는 것인 키트.
  101. 관심 게놈 영역을 편집하는 방법으로서, 관심 게놈 영역을 포함하는 세포 집단을 (i) 관심 게놈 영역을 표적화하는 적어도 2개의 gRNA를 포함하는 gRNA 세트 및 (ii) 뉴클레아제와 접촉시키는 단계를 포함하고; 여기서 적어도 2개의 gRNA를 포함하는 gRNA 세트의 편집 효율은 적어도 2개의 gRNA 각각의 개별 편집 효율보다 높은 것인 방법.
  102. 제101항에 있어서, 관심 게놈 영역이 유전자의 코딩 영역인 방법.
  103. 제102항에 있어서, 코딩 영역이 유전자의 엑손인 방법.
  104. 제101항에 있어서, 관심 게놈 영역이 게놈 내의 비코딩 영역인 방법.
  105. 제104항에 있어서, 비코딩 영역이 조절 요소인 방법.
  106. 제105항에 있어서, 조절 요소가 시스-조절 요소 또는 트랜스-조절 요소인 방법.
  107. 제106항에 있어서, 시스-조절 요소가 프로모터, 인핸서, 및 사일런서로 이루어진 군으로부터 선택되는 것인 방법.
  108. 제101항에 있어서, 세포를 공여자 폴리뉴클레오티드와 접촉시키는 단계를 추가로 포함하는 방법.
  109. 제108항에 있어서, 공여자 폴리뉴클레오티드가 세포의 야생형 유전자형에 비해 점 돌연변이, 대립유전자, 태그 또는 외인성 엑손을 포함하는 것인 방법.
  110. 제101항에 있어서, 편집 효율이, 접촉 후 비야생형 유전자형을 포함하는 세포 집단 내의 세포의 비율인 방법.
  111. 제110항에 있어서, 비야생형 유전자형이 유전자의 녹아웃인 방법.
  112. 제110항에 있어서, 비야생형 유전자형이 야생형 유전자형에 비해 삽입 또는 결실인 방법.
  113. 제110항에 있어서, 세포 집단 내의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포가 비야생형 유전자형을 포함하는 것인 방법.
  114. 제101항에 있어서, 적어도 2개의 gRNA의 각각의 gRNA가 관심 게놈 영역 내의 상이한 표적 부위에 혼성화하는 것인 방법.
  115. 제114항에 있어서, 적어도 2개의 gRNA의 각각의 gRNA가, 가이드 RNA 세트로부터의 적어도 하나의 다른 가이드 RNA의 표적 부위로부터 적어도 30개의 염기가 떨어져 있는 표적 부위에 혼성화 가능한 것인 방법.
  116. 제101항에 있어서, 복수의 관심 게놈 영역을 표적화하는 복수의 gRNA 세트를 도입하는 단계를 추가로 포함하는 방법.
  117. 제116항에 있어서, 복수의 gRNA 세트 각각이 세포 집단의 복수의 서브세트 각각과 접촉되는 것인 방법.
  118. 제117항에 있어서, 복수의 gRNA 표적 세트 각각이 복수의 관심 게놈 영역 내의 상이한 관심 게놈 영역을 표적화하는 것인 방법.
  119. 제117항에 있어서, 세포 집단의 복수의 서브세트의 적어도 50%에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포가 비야생형 유전자형을 포함하는 것인 방법.
  120. 제117항에 있어서, 세포 집단의 복수의 서브세트의 적어도 70%에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포가 비야생형 유전자형을 포함하는 것인 방법.
  121. 제117항에 있어서, 세포 집단의 복수의 서브세트의 적어도 90%에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%의 세포가 비야생형 유전자형을 포함하는 것인 방법.
  122. 제101항에 있어서, 표현형에 대해 세포 집단을 스크리닝하는 단계를 추가로 포함하는 방법.
KR1020207036117A 2018-05-16 2019-05-16 가이드 rna 설계 및 사용을 위한 방법 및 시스템 KR20210045360A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862672437P 2018-05-16 2018-05-16
US62/672,437 2018-05-16
PCT/US2019/032735 WO2019222545A1 (en) 2018-05-16 2019-05-16 Methods and systems for guide rna design and use

Publications (1)

Publication Number Publication Date
KR20210045360A true KR20210045360A (ko) 2021-04-26

Family

ID=68540760

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207036117A KR20210045360A (ko) 2018-05-16 2019-05-16 가이드 rna 설계 및 사용을 위한 방법 및 시스템

Country Status (7)

Country Link
US (4) US11345932B2 (ko)
EP (1) EP3794130A4 (ko)
JP (2) JP2021523745A (ko)
KR (1) KR20210045360A (ko)
CN (1) CN112654710A (ko)
GB (1) GB2589246A (ko)
WO (1) WO2019222545A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3794130A4 (en) 2018-05-16 2022-07-27 Synthego Corporation METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA

Family Cites Families (209)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5849902A (en) 1996-09-26 1998-12-15 Oligos Etc. Inc. Three component chimeric antisense oligonucleotides
CN1316419C (zh) 2002-08-22 2007-05-16 新加坡科技研究局 从形成模型的共同可能性进行预测
JP4243680B2 (ja) 2003-02-13 2009-03-25 独立行政法人産業技術総合研究所 外来挿入断片選択マーカー
EP1644534A4 (en) 2003-07-03 2006-08-09 Univ California GENOMKARTING OF FUNCTIONAL DNA ELEMENTS AND CELLULAR PROTEINS
EP2325332B1 (en) 2005-08-26 2012-10-31 DuPont Nutrition Biosciences ApS Use of CRISPR associated genes (CAS)
WO2008058291A2 (en) 2006-11-09 2008-05-15 California Institute Of Technology Modular aptamer-regulated ribozymes
US9371348B2 (en) 2006-11-27 2016-06-21 The Trustees Of The University Of Pennsylvania Photocleavable oligonucleotide and uses thereof
US7897737B2 (en) 2006-12-05 2011-03-01 Lasergen, Inc. 3′-OH unblocked, nucleotides and nucleosides, base modified with photocleavable, terminating groups and methods for their use in DNA sequencing
US10155038B2 (en) 2007-02-02 2018-12-18 Yale University Cells prepared by transient transfection and methods of use thereof
JP2010519203A (ja) 2007-02-16 2010-06-03 メルク・シャープ・エンド・ドーム・コーポレイション 生物活性分子の活性を強化するための組成物及び方法
FR2925918A1 (fr) 2007-12-28 2009-07-03 Pasteur Institut Typage et sous-typage moleculaire de salmonella par identification des sequences nucleotidiques variables des loci crispr
US7923562B2 (en) 2008-06-16 2011-04-12 The Board Of Trustees Of The Leland Stanford Junior University Photocleavable linker methods and compositions
US20100104645A1 (en) 2008-06-16 2010-04-29 Bind Biosciences, Inc. Methods for the preparation of targeting agent functionalized diblock copolymers for use in fabrication of therapeutic targeted nanoparticles
US20100087337A1 (en) 2008-09-10 2010-04-08 Bind Biosciences, Inc. High Throughput Fabrication of Nanoparticles
ES2776126T3 (es) 2008-12-15 2020-07-29 Pfizer Nanopartículas de circulación prolongada para la liberación sostenida de agentes terapéuticos
JP5704609B2 (ja) 2009-03-04 2015-04-22 公益財団法人野田産業科学研究所 マンナン加水分解酵素群又はセルロース加水分解酵素群転写制御因子及び該転写制御因子遺伝子
EP2435092A2 (en) 2009-05-27 2012-04-04 Selecta Biosciences, Inc. Nanocarriers possessing components with different rates of release
EA201290497A1 (ru) 2009-12-15 2013-01-30 Байнд Байосайенсиз, Инк. Терапевтические полимерные наночастицы, включающие кортикостероиды, и способы получения таковых
EP3391877A1 (en) 2010-04-08 2018-10-24 The Trustees of Princeton University Preparation of lipid nanoparticles
WO2012092552A1 (en) 2010-12-30 2012-07-05 Selecta Biosciences, Inc. Synthetic nanocarriers with reactive groups that release biologically active agents
EP2663548B1 (en) 2011-01-11 2017-04-05 Alnylam Pharmaceuticals, Inc. Pegylated lipids and their use for drug delivery
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
WO2013065827A1 (ja) 2011-11-04 2013-05-10 国立大学法人埼玉大学 核酸リンカー
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
JP2015527889A (ja) 2012-07-25 2015-09-24 ザ ブロード インスティテュート, インコーポレイテッド 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
JP6620018B2 (ja) 2012-12-06 2019-12-11 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Crisprに基づくゲノム修飾および制御
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
CN105658796B (zh) 2012-12-12 2021-10-26 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
US20140186843A1 (en) 2012-12-12 2014-07-03 Massachusetts Institute Of Technology Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
PT2898075E (pt) 2012-12-12 2016-06-16 Harvard College Manipulação e otimização de sistemas, métodos e composições de enzima melhorados para manipulação de sequências
PT2896697E (pt) 2012-12-12 2015-12-31 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3553174A1 (en) 2012-12-17 2019-10-16 President and Fellows of Harvard College Rna-guided human genome engineering
RU2694686C2 (ru) 2013-03-12 2019-07-16 Е.И.Дюпон Де Немур Энд Компани Способы идентификации вариантных сайтов распознавания для редкощепящих сконструированных средств для индукции двунитевого разрыва, и композиции с ними, и их применения
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
CA2907198C (en) 2013-03-15 2019-12-10 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
WO2014191128A1 (en) 2013-05-29 2014-12-04 Cellectis Methods for engineering t cells for immunotherapy by using rna-guided cas nuclease system
ES2883131T3 (es) 2013-05-29 2021-12-07 Cellectis Métodos para la modificación de células T para inmunoterapia utilizando el sistema de nucleasa CAS guiado por ARN
US10704060B2 (en) 2013-06-05 2020-07-07 Duke University RNA-guided gene editing and gene regulation
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
JP6702858B2 (ja) 2013-06-17 2020-06-03 ザ・ブロード・インスティテュート・インコーポレイテッド ウイルス成分を使用して障害および疾患をターゲティングするためのCRISPR−Cas系および組成物の送達、使用および治療上の適用
EP4166669A1 (en) 2013-07-09 2023-04-19 President and Fellows of Harvard College Multiplex rna-guided genome engineering
EP3022304B1 (en) 2013-07-19 2018-12-26 Larix Biosciences LLC Methods and compositions for producing double allele knock outs
US11060083B2 (en) 2013-07-19 2021-07-13 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
WO2015026887A1 (en) 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company A soybean u6 polymerase iii promoter and methods of use
US9322037B2 (en) * 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
ES2681622T3 (es) 2013-09-18 2018-09-14 Kymab Limited Métodos, células y organismos
WO2015057511A1 (en) 2013-10-14 2015-04-23 Stc.Unm Modular rna regulators and methods
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
US9834791B2 (en) 2013-11-07 2017-12-05 Editas Medicine, Inc. CRISPR-related methods and compositions with governing gRNAS
WO2015079057A2 (en) 2013-11-28 2015-06-04 Haplogen Genomics Gmbh Somatic haploid human cell line
US9546384B2 (en) 2013-12-11 2017-01-17 Regeneron Pharmaceuticals, Inc. Methods and compositions for the targeted modification of a mouse genome
US9994831B2 (en) * 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
WO2015089419A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
SG10201804973TA (en) 2013-12-12 2018-07-30 Broad Inst Inc Compositions and Methods of Use of Crispr-Cas Systems in Nucleotide Repeat Disorders
WO2015089473A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
US20150191744A1 (en) 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
WO2015113063A1 (en) 2014-01-27 2015-07-30 Georgia Tech Research Corporation Methods and systems for identifying crispr/cas off-target sites
DK3105317T3 (en) 2014-02-14 2019-01-14 Cellectis Immunotherapy cells that are genetically engineered to target antigen on both immune cells and pathological cells
US11242525B2 (en) * 2014-03-26 2022-02-08 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating sickle cell disease
CN113215196A (zh) 2014-06-06 2021-08-06 瑞泽恩制药公司 用于修饰所靶向基因座的方法和组合物
EP3155101B1 (en) 2014-06-16 2020-01-29 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
SG11201702066UA (en) 2014-07-21 2017-04-27 Illumina Inc Polynucleotide enrichment using crispr-cas systems
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20160076093A1 (en) 2014-08-04 2016-03-17 University Of Washington Multiplex homology-directed repair
EP4194557A1 (en) 2014-08-06 2023-06-14 Institute for Basic Science Genome editing using campylobacter jejuni crispr/cas system-derived rgen
NZ728437A (en) 2014-08-27 2018-02-23 Caribou Biosciences Inc Methods for increasing cas9-mediated engineering efficiency
WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
EP3204513A2 (en) 2014-10-09 2017-08-16 Life Technologies Corporation Crispr oligonucleotides and gene editing
US20180250424A1 (en) 2014-10-10 2018-09-06 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
WO2016061481A1 (en) 2014-10-17 2016-04-21 The Penn State Research Foundation Methods and compositions for multiplex rna guided genome editing and other rna technologies
WO2016065364A1 (en) 2014-10-24 2016-04-28 Life Technologies Corporation Compositions and methods for enhancing homologous recombination
AU2015339744B2 (en) 2014-10-31 2021-03-25 The Trustees Of The University Of Pennsylvania Altering gene expression in CART cells and uses thereof
US9816080B2 (en) 2014-10-31 2017-11-14 President And Fellows Of Harvard College Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs)
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
US10017825B2 (en) 2014-11-17 2018-07-10 Beth Israel Deaconess Medical Center, Inc. Compositions and methods for characterizing a DNA repair variant polypeptide
US10362771B2 (en) 2014-11-20 2019-07-30 Kyoto University Method for knock-in of DNA into target region of mammalian genome, and cell
PT3221457T (pt) 2014-11-21 2019-06-27 Regeneron Pharma Métodos e composições para modificação genética visada através da utilização de arn guia emparelhados
US20170266320A1 (en) 2014-12-01 2017-09-21 President And Fellows Of Harvard College RNA-Guided Systems for In Vivo Gene Editing
JP7068821B2 (ja) 2014-12-03 2022-05-17 アジレント・テクノロジーズ・インク 化学修飾を有するガイドrna
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
EP3234133B1 (en) 2014-12-18 2020-11-11 Integrated DNA Technologies, Inc. Crispr-based compositions and methods of use
WO2016104716A1 (ja) * 2014-12-26 2016-06-30 国立研究開発法人理化学研究所 遺伝子のノックアウト方法
AU2015373893B2 (en) * 2014-12-31 2021-07-29 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
HRP20231022T1 (hr) 2015-01-28 2023-12-08 Caribou Biosciences, Inc. Hibridni polinukleotidi crispr dna/rna i načini uporabe
ES2880473T5 (es) 2015-01-30 2024-05-09 Univ California Suministro de proteínas en células hematopoyéticas primarias
EA038896B1 (ru) 2015-03-16 2021-11-03 Институт Генетики И Биологии Развития Академии Наук Китая Способ осуществления сайт-направленной модификации растительных геномов с использованием ненаследуемых материалов
US20180112213A1 (en) * 2015-03-25 2018-04-26 Editas Medicine, Inc. Crispr/cas-related methods, compositions and components
AU2016246450B2 (en) 2015-04-06 2022-03-17 Agilent Technologies, Inc. Chemically modified guide RNAs for CRISPR/Cas-mediated gene regulation
JP2018520648A (ja) 2015-05-13 2018-08-02 シアトル チルドレンズ ホスピタル, ディービーエー シアトル チルドレンズ リサーチ インスティテュート 初代細胞におけるエンドヌクレアーゼに基づいた遺伝子編集の向上
WO2016183402A2 (en) 2015-05-13 2016-11-17 President And Fellows Of Harvard College Methods of making and using guide rna for use with cas9 systems
EP3294880A4 (en) 2015-05-15 2018-12-26 Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
WO2016196273A1 (en) 2015-05-29 2016-12-08 Agenovir Corporation Compositions and methods to treat viral infections
US10117911B2 (en) * 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
JP2018516596A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション 抗ウイルスの方法および組成物
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
CA2985714C (en) 2015-06-12 2024-02-06 Lonza Walkersville, Inc. Methods for nuclear reprogramming using synthetic transcription factors
WO2017004261A1 (en) 2015-06-29 2017-01-05 Ionis Pharmaceuticals, Inc. Modified crispr rna and modified single crispr rna and uses thereof
US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
EP4339287A3 (en) 2015-07-31 2024-05-22 Regents Of The University Of Minnesota Modified cells and methods of therapy
US20170165332A1 (en) 2015-08-03 2017-06-15 Batu Biologics, Inc. Gene edited antigen presenting cells
WO2017031483A1 (en) 2015-08-20 2017-02-23 Applied Stemcell, Inc. Nuclease with enhanced efficiency of genome editing
CA2996001A1 (en) 2015-08-25 2017-03-02 Duke University Compositions and methods of improving specificity in genomic engineering using rna-guided endonucleases
US20170152506A1 (en) 2015-08-28 2017-06-01 Batu Biologics, Inc. Inactivation of lymphocyte immunological checkpoints by gene editing
US20170058272A1 (en) 2015-08-31 2017-03-02 Caribou Biosciences, Inc. Directed nucleic acid repair
US10526590B2 (en) 2015-08-31 2020-01-07 Agilent Technologies, Inc. Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
CA3036409C (en) 2015-09-08 2023-07-11 Erik J. Sontheimer Dnase h activity of neisseria meningitidis cas9
WO2017049266A2 (en) 2015-09-18 2017-03-23 The Regents Of The University Of California Methods for autocatalytic genome editing and neutralizing autocatalytic genome editing and compositions thereof
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
WO2017053729A1 (en) 2015-09-25 2017-03-30 The Board Of Trustees Of The Leland Stanford Junior University Nuclease-mediated genome editing of primary cells and enrichment thereof
WO2017053713A1 (en) 2015-09-25 2017-03-30 Tarveda Therapeutics, Inc. Compositions and methods for genome editing
MX2018004808A (es) 2015-10-20 2018-08-01 Pioneer Hi Bred Int Funcion restauradora para un producto genico no funcional mediante sistemas cas guiados y metodos de uso.
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
SG10202107602XA (en) 2015-11-04 2021-08-30 Univ Pennsylvania Methods and compositions for gene editing in hematopoietic stem cells
WO2017081097A1 (en) 2015-11-09 2017-05-18 Ifom Fondazione Istituto Firc Di Oncologia Molecolare Crispr-cas sgrna library
US11306308B2 (en) 2015-11-13 2022-04-19 Massachusetts Institute Of Technology High-throughput CRISPR-based library screening
US20170137845A1 (en) 2015-11-13 2017-05-18 Biogen Methods and compositions for increasing rna activity in a cell
US11905521B2 (en) 2015-11-17 2024-02-20 The Chinese University Of Hong Kong Methods and systems for targeted gene manipulation
EP3383409A4 (en) 2015-12-02 2019-10-02 The Regents of The University of California COMPOSITIONS AND METHODS FOR MODIFYING TARGET NUCLEIC ACID
WO2017093370A1 (en) 2015-12-03 2017-06-08 Technische Universität München T-cell specific genome editing
MX2018006767A (es) 2015-12-04 2019-03-14 Novartis Ag Composiciones y metodos para oncologia inmunologica.
US9771600B2 (en) 2015-12-04 2017-09-26 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
EP3386550B1 (en) 2015-12-07 2021-01-20 Arc Bio, LLC Methods for the making and using of guide nucleic acids
EP3390624A4 (en) 2015-12-18 2019-07-10 The Regents of The University of California MODIFIED POLYPEPTIDES AND METHOD OF USE THEREOF
WO2017115268A1 (en) * 2015-12-28 2017-07-06 Novartis Ag Compositions and methods for the treatment of hemoglobinopathies
US11193127B2 (en) 2016-01-08 2021-12-07 University Of Georgia Research Foundation, Inc. Methods for cleaving DNA and RNA molecules
WO2017123609A1 (en) 2016-01-12 2017-07-20 The Regents Of The University Of California Compositions and methods for enhanced genome editing
CN106967681B (zh) 2016-01-13 2020-06-05 北京马力喏生物科技有限公司 治疗脑胶质母细胞瘤的治疗组合物
CN106967685B (zh) 2016-01-13 2020-06-02 北京马力喏生物科技有限公司 共表达抗EGFRvIII嵌合抗原受体和免疫检查点抑制分子的转基因淋巴细胞及其用途
EP3199632A1 (en) 2016-01-26 2017-08-02 ACIB GmbH Temperature-inducible crispr/cas system
EP3426784A1 (en) 2016-03-11 2019-01-16 Wageningen Universiteit Improved crispr-cpf1 genome editing tool
WO2017155408A1 (en) 2016-03-11 2017-09-14 Erasmus University Medical Center Rotterdam Improved crispr-cas9 genome editing tool
WO2017178590A1 (en) 2016-04-14 2017-10-19 Université de Lausanne Treatment and/or prevention of dna-triplet repeat diseases or disorders
WO2017182468A1 (en) 2016-04-18 2017-10-26 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
WO2017184799A1 (en) 2016-04-21 2017-10-26 Life Technologies Corporation Gene editing reagents with reduced toxicity
US11248216B2 (en) 2016-04-25 2022-02-15 The Regents Of The University Of California Methods and compositions for genomic editing
AU2017261380A1 (en) * 2016-05-06 2018-11-22 Editas Medicine, Inc. Genetically engineered cells and methods of making the same
US20190345483A1 (en) 2016-05-12 2019-11-14 President And Fellows Of Harvard College AAV Split Cas9 Genome Editing and Transcriptional Regulation
RU2021106817A (ru) * 2016-05-20 2021-04-06 Регенерон Фармасьютикалс, Инк. Способы преодоления иммунологической толерантности с использованием множества направляющих рнк
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
US20190177710A1 (en) 2016-06-15 2019-06-13 Toolgen Incorporated Method For Screening Target Specific Nuclease Using Multi-Target System Of On-Target And Off-Target And Use Thereof
WO2017216771A2 (en) * 2016-06-17 2017-12-21 Genesis Technologies Limited Crispr-cas system, materials and methods
WO2018005873A1 (en) 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
CN109844116A (zh) 2016-07-05 2019-06-04 约翰霍普金斯大学 包括使用h1启动子对crispr指导rna的改进的组合物和方法
CN106191062B (zh) 2016-07-18 2019-06-14 广东华南疫苗股份有限公司 一种tcr-/pd-1-双阴性t细胞及其构建方法
JP6958917B2 (ja) 2016-08-10 2021-11-02 国立大学法人 東京医科歯科大学 遺伝子ノックイン細胞の作製方法
WO2018031950A1 (en) 2016-08-12 2018-02-15 Caribou Biosciences, Inc. Protein engineering methods
CN106520824A (zh) * 2016-09-30 2017-03-22 北京大北农科技集团股份有限公司 多靶点编辑系统及其用途
CN110050061A (zh) 2016-10-05 2019-07-23 富士胶片细胞动力公司 从具有MeCP2破坏的诱导多能干细胞生成成熟谱系
US10669539B2 (en) * 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
WO2018067991A1 (en) 2016-10-07 2018-04-12 The Brigham And Women's Hospital, Inc. Modulation of novel immune checkpoint targets
WO2018068257A1 (zh) 2016-10-13 2018-04-19 北京艺妙神州医疗科技有限公司 通用型car-t细胞及其制备方法和用途
CN106637421B (zh) 2016-10-28 2019-12-27 博雅缉因(北京)生物科技有限公司 双sgRNA文库的构建及其应用于高通量功能性筛选研究的方法
KR20240043810A (ko) 2016-11-02 2024-04-03 유니버시타트 바셀 세포 치료에 사용하기 위한 면역학적으로 식별 가능한 세포 표면 변이체
JP2021511776A (ja) 2016-11-03 2021-05-13 ユーヘルス バイオテック,リミテッド 細胞リプログラミングのための方法および組成物
US10648002B2 (en) 2016-11-22 2020-05-12 Regents Of The University Of Minnesota Method for correcting a genetic sequence
WO2018096356A1 (en) 2016-11-28 2018-05-31 Horizon Discovery Limited Methods for conditional gene knock-out
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
WO2018126176A1 (en) 2016-12-30 2018-07-05 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto
US20190352634A1 (en) 2017-01-11 2019-11-21 Oxford University Innovation Limited Crispr rna
WO2018140899A1 (en) * 2017-01-28 2018-08-02 Inari Agriculture, Inc. Novel plant cells, plants, and seeds
SG11201908782XA (en) 2017-03-22 2019-10-30 Univ Kobe Nat Univ Corp Method for converting nucleic acid sequence of cell specifically converting nucleic acid base of targeted dna using cell endogenous dna modifying enzyme, and molecular complex used therein
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11834670B2 (en) 2017-04-19 2023-12-05 Global Life Sciences Solutions Usa Llc Site-specific DNA modification using a donor DNA repair template having tandem repeat sequences
CN109790518A (zh) 2017-05-08 2019-05-21 中国科学院动物研究所 经修饰的t细胞、其制备方法及用途
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US20200157611A1 (en) 2017-06-05 2020-05-21 The Board Of Trustees Of The Leland Stanford Junior University Ribonucleoprotein-based imaging and detection
AU2018283405A1 (en) 2017-06-15 2020-01-16 The Regents Of The University Of California Targeted non-viral DNA insertions
RU2020100919A (ru) 2017-06-20 2021-07-20 Цзянсу Хэнжуй Медсин Ко., Лтд. СПОСОБ НОКАУТИРОВАНИЯ ГЕНА-МИШЕНИ В T-КЛЕТКЕ IN VITRO И crRNA, ПРИМЕНЯЕМАЯ В ДАННОМ СПОСОБЕ
US20200202981A1 (en) 2017-07-07 2020-06-25 The Broad Institute, Inc. Methods for designing guide sequences for guided nucleases
US10805284B2 (en) 2017-07-12 2020-10-13 Logmein, Inc. Federated login for password vault
EP3652320A4 (en) 2017-07-12 2021-04-14 Mayo Foundation for Medical Education and Research MATERIALS AND PROCEDURES FOR EFFICIENT TARGETED KNOCK-IN OR GENERAL REPLACEMENT
CN111263812A (zh) 2017-07-31 2020-06-09 西格马-奥尔德里奇有限责任公司 用于crispr/cas激活系统的合成的指导rna
MX2020001177A (es) * 2017-07-31 2020-09-25 Regeneron Pharma Animales no humanos reporteros de crispr y usos de los mismos.
CN111263810A (zh) 2017-08-22 2020-06-09 纳匹基因公司 使用多核苷酸指导的核酸内切酶的细胞器基因组修饰
CN111356766A (zh) 2017-09-18 2020-06-30 阿迈瑞斯公司 用于遗传工程改造克鲁维酵母宿主细胞的方法
KR20230050424A (ko) 2017-09-19 2023-04-14 트로픽 바이오사이언시즈 유케이 리미티드 유전자 발현을 침묵시키기 위한 식물의 비-암호화 rna 분자의 특이성 변형
US20210363521A1 (en) 2017-11-09 2021-11-25 Vertex Pharmaceuticals Incorporated CRISPR/CAS Systems For Treatment of DMD
WO2019099943A1 (en) 2017-11-16 2019-05-23 Astrazeneca Ab Compositions and methods for improving the efficacy of cas9-based knock-in strategies
WO2019106522A1 (en) 2017-11-28 2019-06-06 Novartis Ag Pooled crispr/cas9 screening in primary cells using guide swap technology
WO2019118948A2 (en) 2017-12-15 2019-06-20 Massachusetts Institute Of Technology Systems and methods for predicting repair outcomes in genetic engineering
EP3724214A4 (en) 2017-12-15 2021-09-01 The Broad Institute Inc. SYSTEMS AND PROCEDURES FOR PREDICTING REPAIR RESULTS IN GENE ENGINEERING
US20200392473A1 (en) * 2017-12-22 2020-12-17 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3732286A4 (en) 2017-12-28 2022-01-05 The J. David Gladstone Institutes, A Testamentary Trust Established under The Will of J. David Gladstone GENERATION OF INDUCED PLURIPOTENT CELLS BY CRISPR ACTIVATION
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
WO2019147275A1 (en) 2018-01-26 2019-08-01 Integrated Dna Technologies, Inc. Crispr-based compositions and methods of use
AU2019222568B2 (en) 2018-02-15 2021-10-14 Sigma-Aldrich Co. Llc Engineered Cas9 systems for eukaryotic genome modification
WO2019204668A1 (en) 2018-04-18 2019-10-24 Casebia Therapeutics Limited Liability Partnership Compositions and methods for knockdown of apo(a) by gene editing for treatment of cardiovascular disease
EP3794130A4 (en) 2018-05-16 2022-07-27 Synthego Corporation METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA
WO2019232494A2 (en) 2018-06-01 2019-12-05 Synthego Corporation Methods and systems for determining editing outcomes from repair of targeted endonuclease mediated cuts
WO2020093025A1 (en) 2018-11-01 2020-05-07 Synthego Corporation Methods for knock-out of a target sequence through introduction of a premature stop codon
EP3914714A4 (en) 2019-01-25 2024-04-10 Synthego Corporation SYSTEMS AND METHODS FOR MODULATING CRISPR ACTIVITY
FR3098353B1 (fr) 2019-07-02 2021-06-18 Psa Automobiles Sa Module de stockage à cellules multiples pré-chargées par des ressorts
WO2021016135A1 (en) 2019-07-19 2021-01-28 Synthego Corporation Stabilized crispr complexes

Also Published As

Publication number Publication date
US11345932B2 (en) 2022-05-31
US11697827B2 (en) 2023-07-11
US20240084331A1 (en) 2024-03-14
JP2024079842A (ja) 2024-06-11
US20190382797A1 (en) 2019-12-19
CN112654710A (zh) 2021-04-13
JP2021523745A (ja) 2021-09-09
EP3794130A1 (en) 2021-03-24
GB202019759D0 (en) 2021-01-27
US20220325300A1 (en) 2022-10-13
US20210180055A1 (en) 2021-06-17
US11802296B2 (en) 2023-10-31
WO2019222545A1 (en) 2019-11-21
EP3794130A4 (en) 2022-07-27
GB2589246A (en) 2021-05-26

Similar Documents

Publication Publication Date Title
US20190295689A1 (en) Methods and systems for identifying crispr/cas off-target sites
Davis et al. RNAi-mediated allelic trans-interaction at the imprinted Rtl1/Peg11 locus
JP7065564B2 (ja) Cas9ニッカーゼ活性を用いて正確なdna切断をもたらすための方法
Chin et al. Correction of a splice-site mutation in the beta-globin gene stimulated by triplex-forming peptide nucleic acids
Raghavan et al. Analysis of the V (D) J recombination efficiency at lymphoid chromosomal translocation breakpoints
CN106834347A (zh) 一种山羊cdk2基因敲除载体及其构建方法
Narayanan et al. In vivo mutagenesis of miRNA gene families using a scalable multiplexed CRISPR/Cas9 nuclease system
JP2024079842A (ja) ガイドrna設計および使用のための方法およびシステム
WO2019232494A2 (en) Methods and systems for determining editing outcomes from repair of targeted endonuclease mediated cuts
WO2020093025A1 (en) Methods for knock-out of a target sequence through introduction of a premature stop codon
Feng et al. CircRNA screening and ceRNA network construction for milk fat metabolism in dairy cows
US11315659B2 (en) Methods and systems for identifying nucleotide-guided nuclease off-target sites
Zhao et al. Evaluation of the effects of sequence length and microsatellite instability on single-guide RNA activity and specificity
Kim et al. Necessity for validation of effectiveness of selected guide RNA in silico for application of CRISPR/Cas9
Wang et al. SNP in pre-miR-1666 decreases mature miRNA expression and is associated with chicken performance
Pulido-Quetglas et al. Designing libraries for pooled CRISPR functional screens of long noncoding RNAs
US20220238181A1 (en) Crispr guide selection
US20230348873A1 (en) Nuclease-mediated nucleic acid modification
US20230227818A1 (en) Clinically applicable characterization of genetic variants by genome editing
Rassoulzadegan et al. DNA-RNA hybrid (R-loop): from a unified picture of the mammalian telomere to the genome-wide
Glenfield Alternative routes to optimal expression levels: evolutionary evidence for competitive endogenous RNAs and dosage compensation by gene duplication
Prokhorova et al. Effect of the Phosphoryl Guanidine Modification in Chimeric DNA–RNA crRNAs on the Activity of the CRISPR-Cas9 System In Vitro
Malig Characterization of R-Loop Formation in Mammalian Genomes Via Single Molecule R-Loop Footprinting Sequencing (SMRF-seq)
KR20240032998A (ko) 신경근육장애를 위한 올리고뉴클레오티드 및 이의 조성물
WO2023225410A2 (en) Systems and methods for assessing risk of genome editing events

Legal Events

Date Code Title Description
E902 Notification of reason for refusal