KR20210102925A - 호밍 엔도뉴클레아제 변이체 - Google Patents

호밍 엔도뉴클레아제 변이체 Download PDF

Info

Publication number
KR20210102925A
KR20210102925A KR1020217020863A KR20217020863A KR20210102925A KR 20210102925 A KR20210102925 A KR 20210102925A KR 1020217020863 A KR1020217020863 A KR 1020217020863A KR 20217020863 A KR20217020863 A KR 20217020863A KR 20210102925 A KR20210102925 A KR 20210102925A
Authority
KR
South Korea
Prior art keywords
onui
amino acid
variant
leu
lys
Prior art date
Application number
KR1020217020863A
Other languages
English (en)
Inventor
조던 자르주르
카일 헤이븐스
콘스탄틴 크라이소스토무
Original Assignee
블루버드 바이오, 인코포레이티드.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 블루버드 바이오, 인코포레이티드. filed Critical 블루버드 바이오, 인코포레이티드.
Publication of KR20210102925A publication Critical patent/KR20210102925A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 개시는 게놈의 폴리뉴클레오티드 서열에 결합하여 이를 절단하도록 리프로그래밍된 호밍 엔도뉴클레아제 변이체 및 megaTAL을 제공한다. 호밍 엔도뉴클레아제 변이체 및 megaTAL은 열안정성 및/또는 활성을 증가시키도록 조작되었다.

Description

호밍 엔도뉴클레아제 변이체
관련 출원에 대한 상호 참조
본 출원은 35 U.S.C. § 119(e)에 의거하여 2018년 12월 10일에 출원된 미국 특허 가출원 제62/777,476호의 이익을 주장하며, 그 전체는 참조로서 본원에 통합된다.
서열 목록에 관한 진술
본 출원과 연관된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며, 참조로서 본 명세서에 통합된다. 서열 목록이 포함된 텍스트 파일의 명칭은 BLBD_110_01WO_ST25.txt이다. 2019년 11월 26일에 생성된 텍스트 파일은 83 KB이며, 본 명세서의 출원과 동시에 EFS-Web을 통해 전자적으로 제출된다.
기술 분야
본 개시는 안정성과 활성이 개선된 게놈 편집 조성물에 관한 것이다. 보다 구체적으로, 본 개시는 개선된 안정성 및/또는 활성을 갖는 뉴클레아제 변이체, 조성물, 및 게놈 편집을 위해 이를 제조하고 사용하는 방법에 관한 것이다.
관련 기술에 대한 설명
3000개의 인간 유전자에서의 돌연변이는 이미 질환 표현형에 연결되어 있으며(www.omim.org/statistics/geneMap), 더 많은 질환 관련 유전자 변이가 획기적으로 빠른 속도로 밝혀지고 있으며, 이들 중 많은 것은 단일유전학 질환 또는 암과 관련이 있다. 메가뉴클레아제, 징크 핑거 뉴클레아제, 전사 활성제-유사 효과기 뉴클레아제, 및 주기적 간격으로 클러스터링된 짧은 회문 반복서열(CRISPR)-연관 뉴클레아제 Cas9와 같은 프로그래밍 가능한 뉴클레아제에 기초한 게놈 편집 전략은 유전적 요소로 질환, 장애, 및 병태를 치료함에 있어 엄청나지만 아직 실현되지 않은 잠재력을 가지고 있다. 뉴클레아제 기반 게놈 편집 도구를 치료 전략으로서 구현하는 데 있어서의 구체적인 제약에는 낮은 게놈 편집 효율, 뉴클레아제 특이성, 뉴클레아제 안정성, 및 전달의 문제가 있지만 이에 한정되지는 않는다. 대부분의 게놈 편집 전략에 대한 현재의 최신 기술은 이들 기준의 일부 또는 전부를 충족시키지 못한다.
본 개시는 일반적으로, 인간 게놈 내의 표적 부위를 절단하는, 개선된 안정성 및 활성을 갖는 megaTAL 및 호밍 엔도뉴클레아제(HE)를 포함하는 조성물 및 이를 사용하는 방법에 부분적으로 관한 것이다. 특정 구현예에서, HE 변이체 및 megaTAL은 효소의 열안정성을 개선하거나 향상시키고/시키거나 효소의 촉매 활성을 개선하도록 조작된다.
다양한 구현예에서, 본 개시는 안정성 및 표적 부위에 대한 결합 및 절단을 개선하도록 조작된, 조작된 호밍 엔도뉴클레아제를 포함하는 폴리펩티드를 부분적으로 고려한다.
다양한 구현예에서, I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 서열번호 1에 제시된 아미노산 서열을 포함하는 부모 I-OnuI HE에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
특정 구현예에서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: I14, A19, V116, F168, D208, N246, 및 L263.
특정 구현예에서, 아미노산 치환은 다음의 아미노산 위치에서의 치환이다: I14, A19, F168, D208, 및 N246.
일부 구현예에서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: K108, K156, S176, E231, V261, E277, 및 G300.
일부 구현예에서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 3개 이상의 아미노산 치환을 포함한다: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 3개 이상의 아미노산 치환을 포함하며: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
추가 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 5개 이상의 아미노산 치환을 포함한다: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 5개 이상의 아미노산 치환을 포함하며: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 10℃ 더 높은 TM50을 갖는다.
일부 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 15℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 20℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 25℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 유전자 내의 부위를 표적화한다: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
다양한 구현예에서, I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
추가의 구현예에서, 부모 I-OnuI HE 아미노산 서열은 서열번호 1에 제시되어 있다.
추가의 구현예에서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: I14, A19, V116, F168, D208, N246, 및 L263.
특정 구현예에서, 아미노산 치환은 다음의 아미노산 위치에서의 치환이다: I14, A19, F168, D208, 및 N246.
특정 구현예에서, I14에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: S, N, M, K, F, D, T, 및 V.
일부 구현예에서, I14에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: T 및 V.
특정 구현예에서, A19에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: C, D, I, L, S, T 및 V.
추가의 구현예에서, A19에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: T 및 V.
특정 구현예에서, V116에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: F, D, A, L 및 I.
특정 구현예에서, V116에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: L 및 I.
특정 구현예에서, F168에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: H, Y, I, V, P, L 및 S.
추가의 구현예에서, F168에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: L 및 S.
일부 구현예에서, D208에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: N, V, Y, 및 E.
특정 구현예에서, D208에 대해 치환된 아미노산은 E이다.
특정 구현예에서, N246에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: H, I, D, R, S, T, V, Y, 및 K.
특정 구현예에서, N246에 대해 치환된 아미노산은 K이다.
추가의 구현예에서, L263에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: H, F, P, T, V, 및 R.
추가의 구현예에서, L263에 대해 치환된 아미노산은 R이다.
추가의 구현예에서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: K108, K156, S176, E231, V261, E277, 및 G300.
특정 구현예에서, K108에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: E, N, Q, R, T, V, 및 M.
특정 구현예에서, K108에 대해 치환된 아미노산은 M이다.
일부 구현예에서, K156에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: N, Q, R, T, V, I, 및 E.
특정 구현예에서, K156에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: I 및 E.
추가의 구현예에서, S176에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: P, N, 및 A.
추가의 구현예에서, S176에 대해 치환된 아미노산은 A이다.
특정 구현예에서, E231에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: D, K, V, 및 G.
특정 구현예에서, E231에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: K 및 G.
특정 구현예에서, V261에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: D, G, I, L, S, T, 및 A.
일부 구현예에서, V261에 대해 치환된 아미노산은 A이다.
특정 구현예에서, E277에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: A, D, G, Q, V, 및 K.
추가의 구현예에서, E277에 대해 치환된 아미노산은 K이다.
추가의 구현예에서, G300에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: S, V, D, C, 및 R.
특정 구현예에서, G300에 대해 치환된 아미노산은 R이다.
추가의 구현예에서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 치환이다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
일부 구현예에서, N31에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: D, H, I, R, K, S, T, 및 Y.
추가의 구현예에서, N31에 대해 치환된 아미노산은 K이다.
특정 구현예에서, N33에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: D, G, H, I, K, S, T, 및 Y.
특정 구현예에서, N33에 대해 치환된 아미노산은 K이다.
특정 구현예에서, K52에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: Q, R, T, Y, N, E, 및 M.
추가의 구현예에서, K52에 대해 치환된 아미노산은 M이다.
특정 구현예에서, Y97에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: F, N, 및 H.
다른 구현예에서, Y97에 대해 치환된 아미노산은 F이다.
특정 구현예에서, K124에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: E, N, R, 및 T.
일부 구현예에서, K124에 대해 치환된 아미노산은 N이다.
특정 구현예에서, K147에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: E, I, N, R, 및 T.
특정 구현예에서, K147에 대해 치환된 아미노산은 I이다.
추가의 구현예에서, I153에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: D, H, K, T, Y, S, V, 및 N.
다른 구현예에서, I153에 대해 치환된 아미노산은 N이다.
특정 구현예에서, K209에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: E, M, N, Q, 및 R.
특정 구현예에서, K209에 대해 치환된 아미노산은 R이다.
추가의 구현예에서, E264에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: A, D, G, K, Q, R, 및 V.
특정 구현예에서, E264에 대해 치환된 아미노산은 K이다.
추가의 구현예에서, D268에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: A, E, G, H, N, V, 및 Y.
특정 구현예에서, D268에 대해 치환된 아미노산은 N이다.
특정 구현예에서, I-OnuI HE 변이체는 3개 이상의 아미노산 치환을 포함한다.
추가의 구현예에서, I-OnuI HE 변이체는 5개 이상의 아미노산 치환을 포함한다.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함한다: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
추가의 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하며: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
일부 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함한다: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하며: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
추가의 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 10℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 15℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 20℃ 더 높은 TM50을 갖는다.
추가의 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 25℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 유전자 내의 부위를 표적화한다: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
다양한 구현예에서, 인간 BCL11A 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
다양한 구현예에서, 인간 PCSK9 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
특정 구현예에서, 인간 PDCD-1 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
일부 구현예에서, 인간 TCRα 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
추가의 구현예에서, 인간 CBLB 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
특정 구현예에서, 인간 CTLA-4 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
특정 구현예에서, 인간 TGFβRII 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
추가의 구현예에서, 인간 TIM3 유전자에서 표적 부위를 절단하는 I-OnuI 호밍 엔도뉴클레아제(HE) 변이체는 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 하나 이상의 아미노산 치환은 부모 I-OnuI HE 변이체와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시킨다.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 3개 이상의 아미노산 치환을 포함한다: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
특정 구현예에서, I-OnuI HE 변이체는 다음의 아미노산 위치에서 아미노산 치환을 포함한다: I14, A19, F168, D208, 및 N246.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하며: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
특정 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서의 5개 이상의 아미노산 치환을 포함한다: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
추가의 구현예에서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하며: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있다: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 10℃ 더 높은 TM50을 갖는다.
일부 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 15℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 20℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 25℃ 더 높은 TM50을 갖는다.
도 1은 CBLB 및 TCRα를 표적화하도록 리프로그래밍된 I-OnuI LHE 및 I-OnuI LHE 변이체에 대한 용융 곡선을 효모 표면 디스플레이 기반 검정을 사용하여 도시한다.
2는 무작위로 돌연변이를 생성시킨 8개의 I-OnuI LHE 변이체를 안정성이 더 큰 순서대로 분류하여 이들의 각 위치에서의 변화율에 대한 적층 막대 그래프를 도시한 것이다. 평균 대비 2 표준 편차보다 더 큰 변화율을 갖는 위치가 식별된다.
도 3a는 부모 BCL11A I-OnuI LHE 변이체 엔도뉴클레아제, 개별 안정화 점 돌연변이(F168S, I14T, N246I, V261A)를 갖는 BCL11A I-OnuI LHE 변이체 엔도뉴클레아제, 및 무작위로 돌연변이를 유발시킨 BCL11A I-OnuI LHE 변이체(안정적인 HE 변이체)에 대한 용융 곡선을 도시한다.
도 3b는 부모 BCL11A I-OnuI LHE 변이체 엔도뉴클레아제, 무작위로 돌연변이를 유발시킨 라이브러리로부터 생성된 BCL11A I-OnuI LHE 변이체의 분류 후 모집단, 및 안정성에 영향을 미치는 아미노산 위치의 집중 돌연변이 유발에 의해 생성된 BCL11A I-OnuI LHE 변이체의 분류 후 모집단에 대한 용융 곡선을 도시한다.
도 3c는 부모 BCL11A I-OnuI LHE 변이체 엔도뉴클레아제 및 BCL11A I-OnuI LHE A5 열안정 변이체에 대한 용융 곡선을 도시한다.
도 4a 내지 도 4c는 A5 열안정성 강화 돌연변이가 PCDC-1(도 4a), CBLB(도 4b), 및 TCRα(도 4c)를 표적으로 하는 I-OnuI LHE 변이체를 안정화시킬 수 있음을 보여준다.
도 5a는 호밍 조정 엔도뉴클레아제 안정성을 평가하는 데 사용된 리포터 작제물의 삽화를 보여준다.
도 5b는 I-OnuI, 부모 BCL11A I-OnuI LHE 변이체, 및 BCL11A I-OnuI LHE A5 변이체의 단백질 발현을 비교하는 웨스턴 블롯을 도시한다.
도 5c는 I-OnuI, 부모 BCL11A I-OnuI LHE 변이체, 및 BCL11A I-OnuI LHE A5 변이체와 비교한 GFP 리포터의 발현 시간 경과를 보여준다.
6은 PDCD-1 megaTAL의 열안정성을 증가시키는 것이 이의 부모 PDCD-1 megaTAL과 비교해 편집 활성을 상당히 증가시킨다는 것을 보여준다.
서열 식별자의 간단한 설명
서열번호 1은 야생형 I-OnuI LAGLIDADG 호밍 엔도뉴클레아제(LHE)의 아미노산 서열이다.
서열번호 2는 야생형 I-OnuI LHE의 아미노산 서열이다.
서열번호 3은 야생형 I-OnuI LHE의 생물학적 활성 단편의 아미노산 서열이다.
서열번호 4는 야생형 I-OnuI LHE의 생물학적 활성 단편의 아미노산 서열이다.
서열번호 5는 야생형 I-OnuI LHE의 생물학적 활성 단편의 아미노산 서열이다.
서열번호 6은 인간 TCRα 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 변이체의 아미노산 서열이다.
서열번호 7은 인간 CBLB 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 변이체의 아미노산 서열이다.
서열번호 8은 인간 BCL11A 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 변이체의 아미노산 서열이다.
서열번호 9 내지 14는 인간 BCL11A 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 열안정 변이체의 아미노산 서열이다.
서열번호 15는 인간 PDCD-1 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 변이체의 아미노산 서열이다.
서열번호 16은 인간 PDCD-1 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 열안정 변이체의 아미노산 서열이다.
서열번호 17은 인간 TCRα 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 열안정 변이체의 아미노산 서열이다.
서열번호 18은 인간 CBLB 유전자 내의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 I-OnuI LHE 열안정 변이체의 아미노산 서열이다.
서열번호 19는 BCL11A I-OnuI HE 변이체를 암호화하는 mRNA이다.
서열번호 20은 BCL11A I-OnuI HE 변이체를 암호화하는 코돈 최적화된 mRNA이다.
서열번호 21은 BCL11A I-OnuI HE 열안정 변이체를 암호화하는 mRNA이다.
서열번호 22는 PDCD-1 megaTAL을 암호화하는 아미노산 서열이다.
서열번호 23은 PDCD-1 megaTAL을 열안정 변이체를 암호화하는 아미노산 서열이다.
서열번호 24 내지 34는 다양한 링커의 아미노산 서열을 제시한다.
서열번호 35 내지 59는 프로테아제 절단 부위 및 자가 절단 폴리펩티드 절단 부위의 아미노산 서열을 제시한다.
전술한 서열에서, X가 존재하는 경우, 이는 임의의 아미노산 또는 아미노산의 부재를 지칭한다.
발명을 실시하기 위한 구체적인 내용
A. 개요
본 개시는 일반적으로 개선된 게놈 편집 조성물 및 이의 사용 방법에 부분적으로 관한 것이다. 게놈 편집 효소는 유전자 성분으로 질환, 장애 및 병태를 치료하는 데 엄청난 가능성을 갖는다. 현재까지, 게놈 내의 표적 부위에 결합하여 이를 절단하도록 조작된 게놈 편집 효소는 짧은 생체내 반감기를 갖고/갖거나 높은 효율로 절단할 수 없다. 임의의 특정 이론에 구속되고자 함이 없이, 본 발명자들은: 호밍 엔도뉴클레아제 스캐폴드가 열안정성과 촉매 활성을 증가시키도록 조작될 수 있고; 효소가 더 큰 열안정성을 갖도록 조작되었을 때, 호밍 엔도뉴클레아제 활성이 예상 외로 증가했다는 것을 발견하였다. 또한, 열안정성 및 활성을 증가시키도록 변경되고 하나의 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 호밍 엔도뉴클레아제의 아미노산 위치는 보존되며, 다른 표적 부위에 결합하여 이를 절단하도록 리프로그래밍된 다른 호밍 엔도뉴클레아제의 열안정성을 증가시키는 데 사용될 수 있다.
다양한 구현예에서 고려되는 게놈 편집 조성물 및 방법은 게놈에 존재하는 표적 서열에 결합하여 이를 절단하도록 설계된, 안정성과 활성이 강화된 뉴클레아제 변이체를 포함한다. 특정 구현예에서 고려되는 뉴클레아제 변이체는 표적 뉴클레오티드 서열에 이중 가닥 절단(double-strand break)을 도입하는 데 사용될 수 있는데, 이중 가닥 절단은 공여자 복구 템플릿과 같은 폴리뉴클레오티드 템플릿이 없을 때 비상동성 말단 접합(NHEJ)에 의해 복구되거나, 공여자 복구 템플릿이 없을 때 상동성 유도 복구(HDR), 즉 상동성 재조합에 의해 복구될 수 있다. 특정 구현예에서 고려되는 뉴클레아제 변이체는 단일 가닥 DNA 절단을 생성하는 니카아제(nickase)로서 설계될 수도 있는데, 단일 가닥 DNA 절단은 공여자 복구 템플릿이 있을 때 상동성 재조합을 사용하거나 세포의 염기 절제 복구(BER) 기계를 사용해 복구될 수 있다. NHEJ는 오류가 발생하기 쉬운 프로세스로서, 유전자 기능을 파괴하는 작은 삽입 및 결실을 빈번하게 형성한다. 상동성 재조합은 복구를 위한 템플릿으로서 상동성 DNA를 필요로 하며, 표적 부위의 측면 영역에 대해 상동성을 갖는 서열이 일측으로 연속되는 바람직한 서열을 함유하는 공여자 DNA를 표적 부위에 도입함으로써 특정되는 수없이 다양한 변형을 생성하는 데 활용될 수 있다.
특정 구현예에서, 호밍 엔도뉴클레아제는 안정성 및/또는 활성을 증가시키는 하나 이상의 아미노산 치환을 포함한다. 특정 구현예에서, 호밍 엔도뉴클레아제는 안정성 및/또는 활성을 증가시키는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상의 아미노산 치환을 포함한다.
특정 구현예에서, 안정성 및/또는 활성을 증가시키는 하나 이상의 아미노산 치환을 포함하는 호밍 엔도뉴클레아제는 megaTAL로서 포맷된다. 특정 구현예에서, megaTAL은 안정성 및/또는 활성을 증가시키는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상의 아미노산 치환을 갖는 호밍 엔도뉴클레아제를 포함한다.
특정 구현예에서, 본원에서 고려되는 조성물은, 안정성 및/또는 활성을 증가시키도록 변형된 호밍 엔도뉴클레아제 변이체 또는 megaTAL, 및 임의로 말단 가공 효소(예: Trex2)를 포함한다.
다양한 구현예에서, 세포 또는 세포의 집단은 안정성 및/또는 활성을 증가시키도록 변형된 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 포함한다.
따라서, 본원에서 고려되는 방법 및 조성물은 기존의 입양 세포 요법과 비교하여 양자 개선을 나타낸다.
재조합(즉, 조작된) DNA, 펩티드 및 올리고뉴클레오티드 합성, 면역검정, 조직 배양, 형질변환(예: 전기천공, 리포펙션), 효소 반응, 정제를 위한 기술 및 관련 기술과 절차는 본 명세서 전반에 걸쳐 인용되고 논의된 것과 같이 미생물학, 분자 생물학, 생화학, 분자 유전학, 세포 생물학, 바이러스학, 및 면역학에 있어서의 다양한 일반적이고 보다 구체적인 참조 문헌에 기술된 바와 같이 수행될 수 있다. 예를 들어, Sambrook 등의 문헌[Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]; [Current Protocols in Molecular Biology (John Wiley and Sons, updated July 2008)]; [Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience]; Glover의 문헌[DNA Cloning: A Practical Approach, vol. I & II (IRL Press, Oxford Univ. Press USA, 1985)]; [Current Protocols in Immunology (Edited by: John E. Coligan, Ada M. Kruisbeek, David H. Margulies, Ethan M. Shevach, Warren Strober 2001 John Wiley & Sons, NY, NY)]; [Real-Time PCR: Current Technology and Applications, Edited by Julie Logan, Kirstin Edwards and Nick Saunders, 2009, Caister Academic Press, Norfolk, UK]; Anand의 문헌[Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992)]; Guthrie와 Fink의 문헌[Guide to Yeast Genetics and Molecular Biology (Academic Press, New York, 1991)]; [Oligonucleotide Synthesis (N. Gait, Ed., 1984)]; [Nucleic Acid The Hybridization (B. Hames & S. Higgins, Eds., 1985)]; [Transcription and Translation (B. Hames & S. Higgins, Eds., 1984)]; [Animal Cell Culture (R. Freshney, Ed., 1986); Perbal, A Practical Guide to Molecular Cloning (1984)]; [Next-Generation Genome Sequencing (Janitz, 2008 Wiley-VCH)]; [PCR Protocols (Methods in Molecular Biology) (Park, Ed., 3rd Edition, 2010 Humana Press)]; [Immobilized Cells And Enzymes (IRL Press, 1986)]; the treatise, [Methods In Enzymology (Academic Press, Inc., N.Y.)]; [Gene Transfer Vectors For Mammalian Cells (J. H. Miller and M. P. Calos eds., 1987, Cold Spring Harbor Laboratory)]; Harlow와 Lane의 문헌[Antibodies, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998)]; [Immunochemical Methods In Cell And Molecular Biology (Mayer and Walker, eds., Academic Press, London, 1987)]; [Handbook Of Experimental Immunology, Volumes I-IV (D. M. Weir andCC Blackwell, eds., 1986)]; Roitt의 문헌[Essential Immunology, 6th Edition, (Blackwell Scientific Publications, Oxford, 1988)]; [Current Protocols in Immunology (Q. E. Coligan, A. M. Kruisbeek, D. H. Margulies, E. M. Shevach and W. Strober, eds., 1991)]; [Annual Review of Immunology]를 비롯하여 Advances in Immunology와 같은 학술지 내의 논문들도 참조한다.
B. 정의
본 개시를 보다 상세히 제시하기에 앞서, 본원에서 사용될 특정 용어의 정의를 제공하는 것이 본 개시를 이해하는 데 도움이 될 수 있다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동등한 임의의 방법 및 물질이 특정 구현예의 실시 또는 시험에 사용될 수 있지만, 조성물, 방법 및 물질의 바람직한 구현예가 본원에 기술된다. 본 개시의 목적을 위해, 다음의 용어가 아래에 정의된다.
단수 표현(관사 "a", "an", 및 "the")은 단수 표현된 문법적 객체의 하나 또는 둘 이상(즉, 적어도 하나, 또는 하나 이상)을 지칭하도록 본원에서 사용된다. 예를 들어, "하나의 요소(an element)"는 하나의 요소 또는 하나 이상의 요소를 의미한다.
대안예(예를 들어, "또는(or)")의 사용은 대안예 중 하나, 둘 다, 또는 이들의 임의의 조합을 의미하는 것으로 이해되어야 한다.
용어 "및/또는(and/or)"은 대안예 중 어느 하나 또는 둘 다를 의미하는 것으로 이해되어야 한다.
본원에서 사용되는 바와 같이, 용어 "약(about)" 또는 "대략(approximately)"은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이에 대해 많게는 15%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1% 만큼 달라지는 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "약(about)" 또는 "대략(approximately)"은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이에 대해 ± 15%, ± 10%, ± 9%, ± 8%, ± 7%, ± 6%, ± 5%, ± 4%, ± 3%, ± 2%, 또는 ± 1% 범위인 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다.
일 구현예에서, 범위(예를 들어, 1 내지 5, 약 1 내지 5, 약 1 내지 약 5)는 범위에 포함되는 각각의 수치 값을 지칭한다. 예를 들어, 하나의 비제한적이고 단지 예시적인 구현예에서, 범위 "1 내지 5"는 또는 1, 2, 3, 4, 5; 또는 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 또는 5.0; 또는 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, 4.0, 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7, 4.8, 4.9, 또는 5.0과 동등하다.
본원에서 사용되는 바와 같이, 용어 "약" 또는 "대략"은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이와 비교해 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상인 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다. 일 구현예에서, "실질적으로 동일한(substantially the same)"은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이와 대략 동일한 효과, 예를 들어 생리학적 효과를 생성하는 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다.
본 명세서 전반에 걸쳐, 문맥이 달리 요구하지 않는 한, "포함하다(comprise, comprises, 및 comprising)"라는 단어는 언급된 단계나 요소 또는 단계나 요소의 군을 포함하는 것을 의미하지만 임의의 다른 단계나 요소 또는 단계나 요소의 군을 배제하지 않는 것으로 이해될 것이다. "이루어지는(consisting of)"이란 "이루어지는"이라는 문구에 이어지는 것 포함하고, 이에 한정됨을 의미한다. 따라서, 문구 "이루어지는"은 열거된 요소가 요구되거나 필수적이며, 다른 요소가 존재할 수 없음을 나타낸다. "본질적으로 이루어지는(consisting essentially of)"이란, 해당 문구에 이어지는 열거된 임의의 요소를 포함하고, 열거된 요소에 대해 본 개시에서 명시된 활성 또는 작용을 방해하거나 이에 기여하지 않는 다른 요소로 제한됨을 의미한다. 따라서, 문구 "본질적으로 이루어지는"은 열거된 요소가 요구되거나 필수적이지만, 열거된 요소의 활성 또는 작용에 중대하게 영향을 미치는 다른 요소는 존재하지 않음을 나타낸다.
본 명세서 전반에 걸쳐 "일 구현예(one embodiment, an embodiment)", "특정 구현예(a particular embodiment, a certain embodiment)", "연관 구현예(a related embodiment)", 또는 "추가 구현예(an additional embodiment 또는 a further embodiment)" 또는 이들의 조합은 구현예와 관련하여 기술된 특정 특징, 구조, 또는 특성이 적어도 하나의 구현예에 포함됨을 의미한다. 따라서, 본 명세서 전반에 걸쳐 다양한 위치에서 나타나는 전술한 문구 모두가 본질적으로 동일한 구현예를 지칭하는 것은 아니다. 또한, 특정 특징, 구조, 또는 특성은 하나 이상의 구현예에서 임의의 적절한 방식으로 조합될 수 있다. 또한, 일 구현에서 특징을 확실하게 언급하는 것(positive recitation)이 특정 구현예에서 해당 특징을 배제하기 위한 기초의 역할을 한다는 것도 이해가 될 것이다.
용어 "생체외(ex vivo)"는 일반적으로 유기체 외부에서 이루어지는 활동, 예컨대 유기체 외부의 인공 환경에서, 바람직하게는 천연 조건의 변경을 최소화한 상태로, 살아있는 조직에서 또는 살아있는 조직을 대상으로 수행되는 실험 또는 측정을 지칭한다. 특정 구현예에서, "생체외" 절차는 유기체로부터 살아있는 세포 또는 조직을 채취하고, 보통은 멸균 조건 하의 실험실 장치에서, 환경에 따라 일반적으로는 수시간 또는 약 24시간 동안(최대 48시간 또는 72시간을 포함함) 이를 배양하거나 조절하는 것을 포함한다. 특정 구현예에서, 이러한 조직 또는 세포는 채취되고 동결된 후에, 생체외 처리를 위해 해동될 수 있다. 살아있는 세포 또는 조직을 사용하여 며칠 이상 지속되는 조직 배양 실험 또는 절차는 일반적으로 "시험관내(in vitro)"로 간주되지만, 특정 구현예에서, 이 용어는 생체외와 상호 교환적으로 사용될 수 있다.
용어 "생체내(in vivo)"는 일반적으로 유기체 내에서 이루어지는 활동을 지칭한다. 일 구현예에서, 세포 게놈은 생체내에서 조작, 편집, 또는 변형된다.
"강화(enhance)" 또는 "촉진(promote)" 또는 "증가(increase)" 또는 "증식(expand)" 또는 "강화(potentiate)"라는 용어는 비히클 또는 대조군에 의해 야기된 반응과 비교하여 더 큰 반응(즉, 생리학적 반응)을 생성, 유도, 또는 유발하는 뉴클레아제 변이체의 능력을 일반적으로 지칭한다. 측정 가능한 반응은 호밍 엔도뉴클레아제 변이체가 유래된 부모 호밍 엔도뉴클레아제 대비 이 호밍 엔도뉴클레아제 변이체의 안정성, 예를 들어, 열안정성, 촉매 활성, 및/또는 결합 친화도의 증가를 포함할 수 있다. "증가된(increased)" 또는 "강화된(enhanced)" 양은 통상적으로 "통계적으로 유의한(statistically significant)" 양이며, 비히클 또는 대조군에 의해 생성된 반응의 1.1, 1.2, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30배 또는 그 이상으로 (예를 들어, 500배, 1000배로) 증가된 것을 포함할 수 있다(1을 초과하는 모든 정수 값 및 정수 값들 사이의 소수점 값, 예를 들어 1.5, 1.6, 1.7, 1.8 등을 포함함).
"감소(decrease 또는 reduce)" 또는 "저하(lower)" 또는 "경감(lessen)" 또는 "약화(abate)" 또는 "절제(ablate)" 또는 "억제(inhibit)" 또는 "감쇠(dampen)"란 일반적으로, 본원에서 고려되는 뉴클레아제 변이체가 비히클 또는 대조군에 의해 야기된 반응과 비교하여 더 적은 반응(즉, 생리학적 반응)을 생성, 유도, 또는 유발하는 능력을 지칭한다. 측정 가능한 반응은, 호밍 엔도뉴클레아제 변이체가 유래된 부모 호밍 엔도뉴클레아제 대비 이 호밍 엔도뉴클레아제 변이체의 가용성, 표적외 결합 친화도, 표적외 절단 특이성의 감소를 포함할 수 있다. "감소된(decreased 또는 reduced)" 양은 통상적으로 "통계적으로 유의한" 양이며, 비히클 또는 대조군에 의해 생성된 반응(기준 반응)의 1.1, 1.2, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30배 또는 그 이상으로 (예를 들어, 500배, 1000배로) 감소된 것을 포함할 수 있다(1을 초과하는 모든 정수 값 및 정수 값들 사이의 소수점 값, 예를 들어 1.5, 1.6, 1.7, 1.8 등을 포함함).
"유지(maintain 또는 maintenance)" 또는 "지속(preserve)" 또는 "변화 없음(no change)" 또는 "실질적인 변화 없음(no substantial change)" 또는 "실질적인 감소 없음(no substantial decrease)"은 일반적으로 비히클 또는 대조군에 의해 야기된 반응과 비교하여 실질적으로 유사하거나 비슷한 생리학적 반응(즉, 하류 효과)을 생성, 유도, 또는 유발하는 뉴클레아제 변이체의 능력을 지칭한다. 비슷한 반응(comparable response)은 기준 반응과 유의하게 다르거나 측정 가능한 차이가 없는 것이다.
본원에서 사용되는 용어 "특이적 결합 친화도(specific binding affinity)" 또는 "특이적 결합(specifically binds 또는 specifically bound)" 또는 "특이적 표적화(specifically targets)"는 하나의 분자가 다른 분자에, 예를 들어, 폴리펩티드의 DNA 결합 도메인이 DNA에, 배경 결합보다 더 큰 결합 친화도로 결합하는 것을 기술한다. 결합 도메인이, 예를 들어 약 105 M-1 이상의 친화도 또는 Ka(즉, 특정 결합 상호작용의 평형 결합 상수; 단위는 1/M임)로 표적 부위에 결합하거나 표적 부위와 결합하는 경우, 결합 도메인은 표적 부위에 "특이적으로 결합"한다. 특정 구현예에서, 결합 도메인은 약 106 M-1, 107 M-1, 108 M-1, 109 M-1, 1010 M-1, 1011 M-1, 1012 M-1, 또는 1013 M-1 이상의 Ka로 표적 부위에 결합한다. "고 친화도(high affinity)" 결합 도메인은 Ka가 적어도 107 M-1, 적어도 108 M-1, 적어도 109 M-1, 적어도 1010 M-1, 적어도 1011 M-1, 적어도 1012 M-1, 적어도 1013 M-1, 또는 그 이상인 결합 도메인들을 지칭한다.
대안적으로, 친화도는 특정 결합 상호작용의 평형 해리 상수(Kd)로서 정의될 수 있으며, 단위는 M이다(예를 들어, 10-5 M 내지 10-13 M, 또는 그 미만). 특정 구현예에서 고려되는, DNA 표적 부위에 대한 하나 이상의 DNA 결합 도메인을 포함하는 뉴클레아제 변이체의 친화도는 효모 세포 표면 디스플레이와 같은 통상적인 기술을 사용하거나, 결합 회합에 의하거나, 표지된 리간드를 사용하는 변위 검정을 사용해 쉽게 결정할 수 있다.
일 구현예에서, 특이적 결합의 친화도는 배경 결합보다 약 2배 더 크거나, 배경 결합보다 약 5배 더 크거나, 배경 결합보다 약 10배 더 크거나, 배경 결합보다 약 20배 더 크거나, 배경 결합보다 약 50배 더 크거나, 배경 결합보다 약 100배 더 크거나, 배경 결합보다 약 1000배 더 크다.
용어 "선택적 결합(selectively binds, selectively bound, 또는 selectively binding)" 또는 "선택적 표적화(selectively targets)"는 복수의 표적외 분자가 있을 때 하나의 분자가 표적 분자에 우선적으로 결합하는 것(표적내 결합하는 것)을 기술한다. 특정 구현예에서, HE 또는 megaTAL은 HE 또는 megaTAL이 표적외 DNA 표적 결합 부위에 결합하는 것보다 약 5, 10, 15, 20, 25, 50, 100, 또는 1000배 더 빈번하게 표적내 DNA 결합 부위에 선택적으로 결합한다.
"표적내(on-target)"는 표적 부위 서열을 지칭한다.
"표적외(off-target)"는 표적 부위 서열과 유사하지만 동일하지 않은 서열을 지칭한다.
"표적 부위" 또는 "표적 서열"은, 결합 및/또는 절단에 충분한 조건이 존재하는 경우, 결합 분자가 결합 및/또는 절단할 핵산의 일부를 정의하는 염색체 핵산 서열 또는 염색체외 핵산 서열이다. 표적 부위 또는 표적 서열 중 한 가닥만을 참조하는 폴리뉴클레오티드 서열 또는 서열번호를 지칭할 때, 뉴클레아제 변이체에 의해 결합 및/또는 절단된 표적 부위 또는 표적 서열은 이중 가닥이고 기준 서열 및 이의 보체를 포함한다는 것이 이해될 것이다. 바람직한 구현예에서, 표적 부위는 인간 PDCD-1 유전자 내의 서열이다.
"단백질 안정성"은 단백질이 본래의 접힌 형태가 될지 변성된(펼쳐지거나 연장된) 상태가 될지를 결정하는 힘의 순 균형을 지칭한다. 단백질이 부분적으로 또는 완전히 펼쳐지면, 세포질 조직(cellular machine)에 의한 분해와 함께 기능 상실을 초래할 수 있다. 폴리펩티드 안정성은 온도, 압력, 및 삼투압 농도를 포함하지만 이에 한정되지 않는 다양한 조건에 대한 반응으로 측정할 수 있다.
"열안정성(thermostability)"은 단백질이 적절히 접히거나 원래의 접힌 형태를 유지하고, 온도 변동에 노출될 때 변성 또는 펼쳐짐에 저항하는 능력을 지칭한다. 이상적이지 않은 온도에서, 단백질은 활성 형태로 효율적으로 접힐 수 없게 되거나 활성 형태로부터 펼쳐지는 경향을 가지게 된다. 열안정성이 증가된 단백질은 열안정성이 덜한 단백질과 비교했을 때 적절하게 접히고 증가된 온도 범위에 걸쳐 활성을 유지하게 된다.
"TM50"은 단백질 양의 50%가 펼쳐지는 온도를 지칭한다. 특정 구현예에서, TM50은 단백질의 양이 50% 최대 활성을 갖는 온도이다. 특정 구현예에서, TM50은 다수의 데이터 포인트를 볼츠만 S자 곡선에 피팅함으로써 결정된 특정 값이다. 하나의 비제한적인 실시예에서, 단백질의 TM50은 약 25℃에서 효모 표면에서 단백질을 발현시키고, 효모를 다수의 웰로 분취하고, 보다 높은 범위의 온도에 노출시키고, 효모를 냉각시킨 다음, 효소의 절단 활성을 측정함으로써 효모 표면 디스플레이 활성 검정에서 측정된다. 온도가 증가함에 따라, 더 많은 단백질이 활성 형태를 상실하므로, 유세포 계측법으로 절단을 측정하기에 충분한 활성을 디스플레이하는 단백질 발현 세포가 더 적어진다. 열 충격을 받지 않은 모집단과 비교했을 때, 효모 디스플레이 모집단의 50%가 활성인 온도가 TM50이다.
"재조합(recombination)"은 2개의 폴리뉴클레오티드 간의 유전자 정보의 교환 과정을 지칭하며, 이에는 비상동성 말단 접합(NHEJ)에 의한 공여자 포획 및 상동성 재조합이 포함되지만 이들로 한정되지는 않는다. 본 개시의 목적을 위해, "상동성 재조합(HR)"은, 예를 들어 상동성 유도 복구(HDR) 메커니즘을 통해 세포에서 이중 가닥 절단이 복구되는 도중에 발생하는 이러한 교환의 특별한 형태를 지칭한다. 이러한 프로세스는 뉴클레오티드 서열 상동성을 필요로 하고, "공여자" 분자를 템플릿으로서 사용하여 "표적" 분자(즉, 이중 가닥 절단을 겪은 분자)를 복구하며, "비-교차성 유전자 전환(non-crossover gene conversion)" 또는 "짧은 경로 유전자 전환(short tract gene conversion)"으로 다양하게 알려져 있는데, 이를 통해 공여자로부터 표적으로 유전자 정보가 전달되기 때문이다. 임의의 특정 이론에 구속되고자 함이 없이, 이러한 전달은 파괴된 표적과 공여자 사이에 형성되는 이종이중가닥 DNA의 불일치 보정, 및/또는 공여자가 표적의 일부가 될 유전 정보 및/또는 관련 과정을 재합성하는 데 사용되는 "합성-의존적 가닥 어닐링"을 포함할 수 있다. 이러한 특별한 HR은 종종 공여자 뉴클레오티드의 일부 또는 전부가 표적 폴리뉴클레오티드에 혼입되도록 표적 분자의 서열의 변경시킨다.
"NHEJ" 또는 "비-상동성 말단 접합"은 공여자 복구 템플릿 또는 상동성 서열이 없을 때 이중 가닥 절단을 해결하는 것을 지칭한다. NHEJ는 절단 부위에서 삽입 및 결실을 생성할 수 있다. NHEJ는 여러 하위 경로에 의해 매개되며, 이들 각각은 구별되는 돌연변이 결과를 갖는다. 고전적인 NHEJ 경로(cNHEJ)는 KU/DNA-PKcs/Lig4/XRCC4 복합체를 필요로 하고, 가공을 최소화한 상태로 말단들을 서로 연결하며, 종종 절단을 정확하게 복구한다. 대안적인 NHEJ 경로(altNHEJ) 또한 dsDNA 절단을 해결하는 데 활성이지만, 이들 경로는 훨씬 더 돌연변이원성이며 종종 삽입 및 결실로 표시된 절단의 부정확한 복구를 초래한다. 임의의 특정 이론에 구속되고자 하는 것은 아니지만, 예를 들어, 엑소뉴클레아제(예: Trex2)와 같은 말단 가공 효소에 의한 dsDNA 절단의 변형은 부정확한 복구 확률을 증가시킬 수 있는 것으로 고려된다.
"절단(cleavage)"은 DNA 분자의 공유 백본의 파단을 지칭한다. 절단은 인산디에스테르 결합의 효소적 가수분해 또는 화학적 가수분해를 포함하지만 이에 한정되지 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단과 이중 가닥 절단이 모두 가능하다. 이중 가닥 절단은 2개의 구별되는 단일 가닥 절단 이벤트의 결과로서 발생할 수 있다. DNA 절단의 결과 뭉툭한 말단 또는 엇갈린 말단이 생성될 수 있다. 특정 구현예에서, 본원에서 고려되는 폴리펩티드 및 뉴클레아제 변이체(예: 호밍 엔도뉴클레아제 변이체, megaTAL 등)가 표적화된 이중 가닥 DNA 절단에 사용된다. 엔도뉴클레아제 절단 인식 부위는 DNA 가닥 중 어느 하나에 있을 수 있다.
"외인성" 분자는, 정상적으로는 세포 내에 존재하지 않지만, 하나 이상의 유전적, 생화학적, 또는 다른 방법에 의해 세포 내로 도입되는 분자이다. 예시적인 외인성 분자는 작은 유기 분자, 단백질, 핵산, 탄수화물, 지질, 당단백, 지단백, 다당류, 상기 분자의 임의의 변형된 유도체, 또는 상기 분자 중 하나 이상을 포함하는 임의의 복합체를 포함하지만, 이들로 한정되지는 않는다. 외인성 분자를 세포 내로 도입하는 방법은 당업자에게 공지되어 있으며, 지질-매개 전달(즉, 중성 및 양이온성 지질을 포함하는 리포좀), 전기천공, 직접 주입, 세포 융합, 유전자총, 바이오폴리머 나노입자, 칼슘 인산염 공동-침강, DEAE-덱스트란-매개 전달, 및 바이러스 벡터-매개 전달을 포함하지만 이들로 한정되지는 않는다.
"내인성" 분자는 특정 환경 조건 하에 특정 발달 단계에서 특정 세포에 정상적으로 존재하는 분자이다. 추가 내인성 분자는 단백질을 포함할 수 있다.
"유전자"는 유전자 산물을 암호화하는 DNA 영역뿐만 아니라, 유전자 산물의 생산을 조절하는 모든 DNA 영역도 지칭하며, 여기서 이러한 조절 서열이 코딩 서열 및/또는 전사 서열에 인접한지 여부는 상관하지 않는다. 유전자는 프로모터 서열, 인핸서, 침묵화제, 절연체, 경계 요소, 종결자, 폴리아데닐화 서열, 전사후 반응 요소, 번역 조절 서열(예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위), 복제 기점, 매트릭스 부착 부위, 및 유전자좌 조절 영역을 포함하지만, 이들로 한정되지는 않는다.
"유전자 발현"은 유전자에 담긴 정보를 유전자 산물로 변환하는 것을 지칭한다. 유전자 산물은 유전자의 직접 전사 산물(예를 들어, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA, 또는 임의의 다른 유형의 RNA)이거나 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 캡핑, 폴리아데닐화, 메틸화, 및 편집과 같은 프로세스에 의해 변형된 RNA, 및 예를 들어 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의해 변형된 단백질을 포함한다.
본원에서 사용되는 바와 같이, 용어 "유전자 조작(genetically engineered)" 또는 "유전자 변형(genetically modified)"은 DNA 또는 RNA 형태의 추가 유전 물질을 세포 내의 총 유전 물질에 염색체 첨가 또는 염색체 외 첨가하는 것을 지칭한다. 유전자 변형은 세포 게놈 내의 특정 부위에 대해 표적화되거나 표적화되지 않을 수 있다. 일 구현예에서, 유전자 변형은 부위 특이적이다. 일 구현예에서, 유전자 변형은 비부위 특이적이다.
본원에서 사용되는 바와 같이, 용어 "게놈 편집"은 세포 게놈 내의 표적 부위에서 유전 물질을 치환, 결실 및/또는 도입하는 것을 지칭하며, 이는 유전자 또는 유전자 산물의 발현 및/또는 기능을 복원, 보정, 파괴, 및/또는 변형시킨다. 특정 구현예에서 고려되는 게놈 편집은 임의로 공여자 복구 템플릿이 있을 때, 하나 이상의 뉴클레아제 변이체를 세포 내로 도입하여 세포 게놈 내의 표적 부위에서 또는 표적 부위의 근위에서 DNA 병변을 생성하는 것을 포함한다.
본원에서 사용되는 바와 같이, 용어 "유전자 요법"은 유전자 또는 유전자 산물의 발현을 복구, 보정, 또는 변형시키기 위해, 또는 치료 폴리펩티드를 발현시키기 위해 추가 유전 물질을 세포 내 총 유전 물질 내로 도입하는 것을 지칭한다. 특정 구현예에서, 유전자 또는 유전자 산물의 발현을 복구, 보정, 파괴, 또는 변형하는 게놈 편집에 의해, 또는 치료 폴리펩티드를 발현할 목적으로, 유전 물질을 세포의 게놈 내로 도입하는 것이 유전자 요법으로 간주된다.
C. 뉴클레아제 변이체
조작된 다양한 뉴클레아제는 임상 환경에서 사용하기에 충분한 안정성이 결여될 수 있다. 본원에서 고려되는 뉴클레아제 변이체는 이전에 불안정했던 효소의 임상적 사용을 가능하게 하기 위해 열안정성 및 효소 활성을 증가시키도록 변형된 것이다. 뉴클레아제 변이체는 표적 부위를 게놈 편집하는 데 적합하며, 하나 이상의 DNA 결합 도메인 및 하나 이상의 DNA 절단 도메인(예를 들어, 하나 이상의 엔도뉴클레아제 및/또는 엑소뉴클레아제 도메인)을 포함하고, 임의로, 본원에서 고려되는 하나 이상의 링커를 포함한다. 조작된 뉴클레아제는 기준 또는 부모 뉴클레아제와 비교하여 열안정성 및/또는 활성을 증가시키는 하나 이상의 아미노산 치환을 포함한다. 용어 "리프로그래밍된 뉴클레아제", "조작된 뉴클레아제" 또는 "뉴클레아제 변이체"는 상호 교환적으로 사용되고, 하나 이상의 DNA 결합 도메인 및 하나 이상의 DNA 절단 도메인을 포함하는 뉴클레아제를 지칭하며, 여기서 뉴클레아제는 이중-가닥 DNA 표적 서열에 결합하여 이를 절단하도록 설계되고 뉴클레아제의 열안정성 및/또는 활성을 증가시키도록 변형된 것이다.
"기준 뉴클레아제" 또는 "부모 뉴클레아제"는 야생형 뉴클레아제, 자연에서 발견되는 뉴클레아제, 또는 후속 뉴클레아제 변이체를 생성하기 위한 기저 활성, 친화도, 특이성, 선택도, 및/또는 안정성을 증가시키도록 변형된 뉴클레아제 또는 변이체를 지칭한다.
특정 구현예에서, 뉴클레아제 변이체는 부모 뉴클레아제에 비해 변이체의 안정성 및/또는 활성을 증가시키는 적어도 1개의 아미노산 치환을 포함한다. 특정 구현예에서, 뉴클레아제 변이체는 부모 뉴클레아제에 비해 변이체의 안정성 및/또는 활성을 증가시키는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 적어도 10개의 아미노산 치환을 포함한다.
뉴클레아제 변이체는 설계될 수 있고/있거나 자연 발생 뉴클레아제 또는 기존의 뉴클레아제 변이체로부터 변형될 수 있다. 바람직한 구현예에서, 뉴클레아제 변이체는 부모 I-OnuI HE 변이체와 비교해 증가된 열안정성 및/또는 효소 활성을 포함한다. 특정 구현예에서 고려되는 뉴클레아제 변이체는 하나 이상의 추가 기능성 도메인, 예를 들어 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제(예: Trex2), 5' 플랩 엔도뉴클레아제, 헬리카제, 템플릿 의존성 DNA 중합효소 활성 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단 가공 효소의 말단 가공 효소 도메인을 추가로 포함할 수 있다.
표적 서열에 결합하여 이를 절단하도록 리프로그래밍되고 증가된 열안정성을 갖도록 조작된 뉴클레아제 변이체의 예시적인 실시예는 호밍 엔도뉴클레아제(메가뉴클레아제) 변이체 및 megaTAL을 포함하지만 이들로 한정되지는 않는다. 특정 구현예에서, 뉴클레아제 변이체는 다음으로 이루어진 군으로부터 선택된 유전자의 표적 부위 또는 서열에 결합하도록 리프로그래밍된다: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
1. 호밍 엔도뉴클레아제(메가뉴클레아제) 변이체
호밍 엔도뉴클레아제(메가뉴클레아제)는 선택된 표적 부위에 결합하여 이를 절단하도록 리프로그래밍될 수 있는 게놈 편집 효소이다. 그러나, 일부 리프로그래밍된 호밍 엔도뉴클레아제는 추가 개발 또는 임상적 사용을 허용하도록 충분히 안정적이지 않았다. 본 발명자들은, 호밍 엔도뉴클레아제 내의 특정 아미노산 위치가 효소의 안정성(예: 열안정성)에 영향을 미친다는 것; 및 추가로, 이들 위치에서의 아미노산의 치환이 효소의 친화도 또는 활성을 희생시키지 않고도, 부모 효소와 비교하여 효소 안정성을 강화시킬 수 있다는 것을 예상 외로 발견하였다.
다양한 구현예에서, 호밍 엔도뉴클레아제 또는 메가뉴클레아제는 표적 부위에 이중 가닥 절단(DSB)를 도입하도록 리프로그래밍되고, 열안정성, 친화도, 특이성, 선택도, 및/또는 및 효소 활성을 증가시키도록 조작된다. 바람직한 구현예에서, 호밍 엔도뉴클레아제는 표적 부위에 결합하여 이를 절단하도록 리프로그래밍되고, 호밍 엔도뉴클레아제가 설계된 효소의 열안정성에 비해 효소의 열안정성을 증가시키도록 조작된다.
"호밍 엔도뉴클레아제(homing endonuclease)" 및 "메가뉴클레아제(meganuclease)"는 상호 교환적으로 사용되며, 12 내지 45개의 염기쌍 절단 부위를 인식하고 서열 및 구조 모티프에 기초하여 일반적으로 5개의 패밀리로 그룹화되는 자연 발생 호밍 엔도뉴클레아제를 지칭한다: LAGLIDADG, GIY-YIG, HNH, His-Cys 박스, 및 PD-(D/E)XK.
"기준 호밍 엔도뉴클레아제", "기준 메가뉴클레아제", "부모 호밍 엔도뉴클레아제" 또는 "부모 메가뉴클레아제"는 야생형 호밍 엔도뉴클레아제, 자연에서 발견된 호밍 엔도뉴클레아제, 또는 후속 호밍 엔도뉴클레아제를 생성하기 위해 기저 활성, 친화도, 및/또는 안정성을 증가시키도록 변형된 호밍 엔도뉴클레아제를 지칭한다.
"조작된 호밍 엔도뉴클레아제", "리프로그래밍된 호밍 엔도뉴클레아제", "호밍 엔도뉴클레아제 변이체", "조작된 메가뉴클레아제", "리프로그래밍된 메가뉴클레아제", 또는 "메가뉴클레아제 변이체"는 하나 이상의 DNA 결합 도메인 및 하나 이상의 DNA 절단 도메인을 포함하는 호밍 엔도뉴클레아제를 지칭하며, 여기서 호밍 엔도뉴클레아제는 DNA 표적 서열에 결합하여 이를 절단하도록 설계되었고/되었거나 부모 또는 자연 발생 호밍 엔도뉴클레아제로부터 변형되었고; 임의로 1회 이상의 친화도, 선택도, 특이성, 및/또는 활성 개선을 거쳤으며; 증가된 열안정성을 갖도록 추가로 변형된 것이다. 호밍 엔도뉴클레아제 변이체는 설계될 수 있고/있거나 자연 발생 호밍 엔도뉴클레아제로부터 또는 다른 호밍 엔도뉴클레아제 변이체로부터 변형될 수 있다. 특정 구현예에서 고려되는 호밍 엔도뉴클레아제 변이체는 하나 이상의 추가 기능성 도메인, 예를 들어 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제(예: Trex2), 5' 플랩 엔도뉴클레아제, 헬리카제, 템플릿 의존성 DNA 중합효소 활성 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단 가공 효소의 말단 가공 효소 도메인을 추가로 포함할 수 있다.
호밍 엔도뉴클레아제 변이체는 자연에서 존재하지 않으며 재조합 DNA 기술에 의하거나 무작위 돌연변이 유발에 의해 수득될 수 있다. 호밍 엔도뉴클레아제 변이체는 자연 발생 호밍 엔도뉴클레아제 또는 호밍 엔도뉴클레아제 변이체에서 하나 이상의 아미노산을 변경시킴으로써, 예를 들어 하나 이상의 아미노산을 돌연변이화, 치환, 추가, 또는 결실함으로써 수득될 수 있다. 특정 구현예에서, 호밍 엔도뉴클레아제 변이체는 선택된 표적 서열에 결합하여 이를 절단하기 위해 DNA 인식 인터페이스에 대한 하나 이상의 아미노산 변경을 포함하고, 열안정성을 증가시키기 위한 하나 이상의 아미노산 치환을 포함한다.
특정 구현예에서 고려되는 호밍 엔도뉴클레아제 변이체는 하나 이상의 링커 및/또는 추가 기능성 도메인, 예를 들어 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제(예: Trex2), 5' 플랩 엔도뉴클레아제, 헬리카제, 템플릿 의존성 DNA 중합효소 활성 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단 가공 효소의 말단 가공 효소 도메인을 추가로 포함할 수 있다. 특정 구현예에서, 호밍 엔도뉴클레아제 변이체는 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제(예: Trex2), 5' 플랩 엔도뉴클레아제, 헬리카제, 템플릿 의존성 DNA 중합효소 활성 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단 가공 효소와 함께 세포 내로 도입된다. 호밍 엔도뉴클레아제 변이체 및 3' 가공 효소는, 예를 들어, 상이한 벡터 또는 별도의 mRNA에 별도로 도입되거나, 예를 들어, 융합 단백질로서 함께 도입되거나, 바이러스 자가 절단 펩티드 또는 IRES 요소에 의해 분리된 폴리시스트론 작제물에 도입될 수 있다.
"DNA 인식 인터페이스"는 핵산 표적 염기뿐만 아니라 인접한 잔기들과도 상호작용하는 호밍 엔도뉴클레아제 아미노산 잔기를 지칭한다. 각각의 호밍 엔도뉴클레아제의 경우, DNA 인식 인터페이스는 측쇄-측쇄 및 측쇄-DNA 접점으로 이루어진 광범위한 네트워크를 포함하는데, 이들 대부분은 특정 핵산 표적 서열을 인식하도록 본질적으로 고유하다. 따라서, 특정 핵산 서열에 상응하는 DNA 인식 인터페이스의 아미노산 서열은 상당히 다양하며, 임의의 천연 또는 호밍 엔도뉴클레아제 변이체의 특징이다. 비제한적인 실시예로서, 특정 구현예에서 고려되는 호밍 엔도뉴클레아제 변이체는 천연 호밍 엔도뉴클레아제(또는 이전에 생성된 호밍 엔도뉴클레아제 변이체)의 DNA 인식 인터페이스에 국소화된 하나 이상의 아미노산 잔기가 다양한 HE 변이체의 라이브러리를 작제함으로써 유래될 수 있다. 라이브러리는 절단 검정을 사용해 각각의 표적 부위에 대한 표적 절단 활성에 대해 스크리닝될 수 있다(예를 들어, Jarjour 등의 문헌[2009. Nuc. Acids Res. 37(20): 6871-6880] 참조).
LAGLIDADG 호밍 엔도뉴클레아제(LHE)는 가장 잘 연구된 호밍 엔도뉴클레아제 계열로서, 주로 녹조류 및 진균류의 고세균류(archaea) 및 소기관 DNA(organella DNA)에서 암호화되고, 가장 높은 전체 DNA 인식 특이성을 나타낸다.
일 구현예에서, 열안정성을 향상시키도록 조작된 리프로그래밍된 LHE 또는 LHE 변이체는 I-OnuI HE 변이체(I-OnuI LHE 변이체)이다. 예를 들어, 서열번호 8-14 및 16-18을 참조한다.
일 구현예에서, 열안정성을 증가시키도록 조작된 리프로그래밍된 I-OnuI HE 또는 I-OnuI HE 변이체는 천연 I-OnuI, I-OnuI HE 변이체, 또는 이의 생물학적 활성 단편(예를 들어, 서열번호 1-8 및 15)으로부터 생성된다. 바람직한 구현예에서, 열안정성을 증가시키도록 조작된 리프로그래밍된 I-OnuI HE 또는 I-OnuI HE 변이체는 기존의 I-OnuI HE 변이체로부터 생성된다. 더욱 더 바람직한 구현예에서, 열안정성을 증가시키도록 조작된 리프로그래밍된 I-OnuI HE 또는 I-OnuI HE 변이체는 기존의 부모 I-OnuI HE 변이체의 열안정성에 비해 효소의 열안정성을 증가시키도록 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개, 또는 그 이상의 아미노산 치환을 포함한다.
특정 구현예에서, I-OnuI HE 변이체는 개별적으로 및 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI 아미노산 서열(서열번호 1-8 및 15), 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 I14, A19, V116, F168, D208, N246, 및 L263의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 또는 7개의 아미노산 치환을 포함한다.
특정 구현예에서, I-OnuI HE 변이체는 개별적으로 및 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI 아미노산 서열(서열번호 1-8 및 15), 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 I14, A19, F168, D208, 및 N246의 아미노산 치환을 포함한다.
특정 구현예에서, I14에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: I14S, I14N, I14M, I14K, I14F, I14D, I14T, 및 I14V. 바람직한 구현예에서, I14에 대한 아미노산 치환은 I14T 또는 I14V이다. 특정 구현예에서, A19에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: A19C, A19D, A19I, A19L, A19S, A19T, 및 A19V. 바람직한 구현예에서, A19V에 대한 아미노산 치환은 A19T 또는 A19V이다. 특정 구현예에서, V116에 대해 치환된 아미노산은 다음으로 이루어진 군으로부터 선택된다: V116F, V116D, V116A, V116L, 및 V116I. 바람직한 구현예에서, V116에 대한 아미노산 치환은 V116L 또는 V116I이다. 특정 구현예에서, F168에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: F168H, F168Y, F168I, F168V, F168P, F168L, 및 F168S. 바람직한 구현예에서, F168에 대한 아미노산 치환은 F168L 및 F168S이다. 특정 구현예에서, D208에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D208N, D208Y, D208V, 및 D208E. 바람직한 구현예에서, D208에 대한 아미노산 치환은 D208E이다. 바람직한 구현예에서, F168에 대한 아미노산 치환은 F168L 및 F168S이다. 특정 구현예에서, N246에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: N246H, N246I, N246D, N246R, N246S, N246T, N246V, N246Y, 및 N246K. 바람직한 구현예에서, N246에 대한 아미노산 치환은 N246K이다. 특정 구현예에서, L263에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L263H, L263F, L263P, L263T, L263V, 및 L263R. 바람직한 구현예에서, L263에 대한 아미노산 치환은 L263R이다.
특정 구현예에서, I-OnuI HE 변이체는 개별적으로 및 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI 아미노산 서열(서열번호 1-8 및 15), 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 K108, K156, S176, E231, V261, E277, 및 G300의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 또는 7개의 아미노산 치환을 포함한다.
특정 구현예에서, K108에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: K108E, K108N, K108Q, K108R, K108T, K108V, 및 K108M. 바람직한 구현예에서, K108에 대한 아미노산 치환은 K108M이다. 특정 구현예에서, K156에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: K156N, K156Q, K156R, K156T, K156V, K156I, 및 K156E. 바람직한 구현예에서, K156에 대한 아미노산 치환은 K156I 또는 K156E이다. 특정 구현예에서, S176에 대해 치환된 아미노산은 S176P, S176N, 또는 S176A이다. 바람직한 구현예에서, S176에 대한 아미노산 치환은 S176A이다. 특정 구현예에서, E231에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: E231D, E231V, E231K, 및 E231G. 바람직한 구현예에서, E231에 대한 아미노산 치환은 E231K 또는 E231G이다. 특정 구현예에서, V261에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V261D, V261G, V261I, V261L, V261S, V261T, 및 V261A. 바람직한 구현예에서, V261에 대한 아미노산 치환은 V261A이다. 특정 구현예에서, E277에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: E277A, E277D, E277G, E277Q, E277V, 및 E277K. 바람직한 구현예에서, E277에 대한 아미노산 치환은 E277K이다. 특정 구현예에서, G300에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G300S, G300V, G300D, G300C, 및 G300R. 바람직한 구현예에서, G300에 대한 아미노산 치환은 G300R이다.
임의의 특정 이론에 구속되고자 함이 없이, 본 발명자들은 특정 표적 서열에 결합하여 이를 절단하도록 리프로그래밍된 각각의 호밍 엔도뉴클레아제가 열안정성에 영향을 미치는 하나 이상의 추가 아미노산 위치에 있을 수 있다는 것도 발견하였다. 특정 구현예에서, I-OnuI HE 변이체는 개별적으로, 및 일부 경우에는 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI 아미노산 서열(서열번호 1-8 및 15), 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 10개의 아미노산 치환을 포함한다.
특정 구현예에서, N31에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: N31D, N31H, N31I, N31R, N31K, N31S, N31T, 및 N31Y. 특정 구현예에서, N31에 대해 치환된 아미노산은 N31K이다. 특정 구현예에서, N33에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: N33D, N33G, N33H, N33I, N33K, N33S, N33T, 및 N33Y. 특정 구현예에서, N33에 대해 치환된 아미노산은 N33K이다. 특정 구현예에서, K52에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: K52Q, K52R, K52T, K52Y, K52N, K52E, 및 K52M. 바람직한 구현예에서, K52에 대한 아미노산 치환은 K52M이다. 특정 구현예에서, Y97에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: Y97H, Y97N, 및 Y97F. 특정 구현예에서, Y97에 대해 치환된 아미노산은 Y97F이다. 특정 구현예에서, K124에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: K124E, K124N, K124R, 및 K124T. 특정 구현예에서, K124에 대해 치환된 아미노산은 K124N이다. 특정 구현예에서, K147에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: K147E, K147I, K147N, K147R, 및 K147T. 특정 구현예에서, K147에 대해 치환된 아미노산은 K147I이다. 특정 구현예에서, I153에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: I153D, I153H, I153K, I153T, I153Y, I153S, I153V, 및 I153N. 바람직한 구현예에서, I153에 대한 아미노산 치환은 I153N이다. 특정 구현예에서, K209에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: K209E, K209M, K209N, K209Q, 및 K209R. 특정 구현예에서, K209에 대해 치환된 아미노산은 K209R이다. 특정 구현예에서, E264에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: E264A, E264D, E264G, E264K, E264Q, E264R, 및 E264V. 특정 구현예에서, E264에 대해 치환된 아미노산은 E264K이다. 특정 구현예에서, D268에 대한 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D268A, D268E, D268G, D268H, D268N, D268V, 및 D268Y. 특정 구현예에서, D268에 대해 치환된 아미노산은 D268N이다.
특정 구현예에서, I-OnuI HE 변이체는 개별적으로 및 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI HE 아미노산 서열(서열번호 1-8 및 15), 또는 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300의 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 또는 14개의 아미노산 치환을 포함한다.
특정 구현예에서, I-OnuI HE 변이체는 개별적으로 및 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI HE 아미노산 서열(서열번호 1-18 및 15), 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300의 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 또는 14개의 아미노산 치환; 및 개별적으로, 일부 경우에는 집합적으로 호밍 엔도뉴클레아제 열안정성을 증가시키는 것으로 확인된, 대표적인 I-OnuI HE 아미노산 서열(서열번호 1-8 및 15), 이의 생물학적 활성 단편, 및/또는 이의 추가 변이체의 아미노산 위치 N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268의 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개의 아미노산 치환을 포함한다.
특정 구현예에서, 표적 서열에 결합하여 이를 절단하는 I-OnuI HE 변이체는 열안정성을 증가시키기 위한 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개의 아미노산 치환을 포함하며, 서열번호 1-18 중 어느 하나에 제시된 아미노산 서열 또는 이의 생물학적 활성 단편과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일하다.
특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI LHE 변이체와 비교하여 증가된 열안정성을 갖는다. 특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE 또는 기준 I-OnuI HE의 TM50보다 약 5℃ 내지 약 35℃ 더 높거나, 약 10℃ 내지 약 35℃ 더 높거나, 약 10℃ 내지 약 30℃ 더 높거나, 약 10℃ 내지 약 25℃ 더 높거나, 약 15℃ 내지 약 35℃ 더 높거나, 약 15℃ 내지 약 30℃ 더 높거나, 약 15℃ 내지 약 25℃ 더 높은 TM50을 갖는다.
특정 구현예에서, I-OnuI HE 변이체는 부모 또는 기준 I-OnuI LHE 변이체와 비교하여 증가된 열안정성을 갖는다. 특정 구현예에서, I-OnuI HE 변이체는 부모 I-OnuI HE 또는 기준 I-OnuI HE의 TM50보다 약 5℃ 더 높거나, 약 6℃ 더 높거나, 약 7℃ 더 높거나, 약 8℃ 더 높거나, 약 9℃ 더 높거나, 약 10℃ 더 높거나, 약 11℃ 더 높거나, 약 12℃ 더 높거나, 약 13℃ 더 높거나, 약 14℃ 더 높거나, 약 15℃ 더 높거나, 약 16℃ 더 높거나, 약 17℃ 더 높거나, 약 18℃ 더 높거나, 약 19℃ 더 높거나, 약 20℃ 더 높거나, 약 21℃ 더 높거나, 약 22℃ 더 높거나, 약 23℃ 더 높거나, 약 24℃ 더 높거나, 약 25℃ 더 높거나, 약 26℃ 더 높거나, 약 27℃ 더 높거나, 약 28℃ 더 높거나, 약 29℃ 더 높거나, 약 30℃ 더 높거나, 약 31℃ 더 높거나, 약 32℃ 더 높거나, 약 33℃ 더 높거나, 약 34℃ 더 높거나, 약 35℃ 더 높은 TM50을 갖는다.
특정 구현예에서, 열안정성을 강화시키기 위한 하나 이상의 돌연변이를 포함하는 I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 유전자의 표적 부위 또는 서열에 결합하도록 리프로그래밍된다: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
2. megaTAL
MegaTAL은 TAL DNA 결합 도메인의 DNA 결합 특성을 호밍 엔도뉴클레아제의 DNA 결합 및 절단 활성과 조합하는 게놈 편집 효소이다. 임의의 특정 이론에 구속되고자 함이 없이, 상대적으로 불안정한 호밍 엔도뉴클레아제가 megaTAL로서 포맷될 때, megaTAL은 본질적으로 안정화되지 않는 것으로 여겨진다. 따라서, 하나 이상의 안정화 돌연변이를 호밍 엔도뉴클레아제 내로 도입하는 것은 상응하는 megaTAL을 유사하게 안정화시킨다.
다양한 구현예에서, megaTAL은 하나 이상의 TAL DNA 결합 도메인 및 표적 부위에 이중 가닥 절단(DSB)를 도입하도록 리프로그래밍되고 효소의 열안정성, 친화도, 특이성, 선택도, 및/또는 및 효소 활성을 증가시키도록 조작된 호밍 엔도뉴클레아제 또는 메가뉴클레아제를 포함한다. 바람직한 구현예에서, 효소의 열안정성을 증가시키도록 조작된 호밍 엔도뉴클레아제를 포함하는 megaTAL의 증가된 열안정성은, 열안정성을 증가시키도록 조작되기 전의 호밍 엔도뉴클레아제를 포함하는 megaTAL의 열안정성에 상대적이다.
"megaTAL"은 TALE DNA 결합 도메인 및 DNA 표적 서열에 결합하여 이를 절단하고 열안정성을 증가시키도록 조작된 호밍 엔도뉴클레아제 변이체를 포함하고, 임의로 하나 이상의 링커 및/또는 추가의 기능적 도메인, 예를 들어, 예를 들어 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제(예: Trex2), 5' 플랩 엔도뉴클레아제, 헬리카제, 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단 가공 효소의 말단 가공 효소 도메인을 포함한다.
"기준 megaTAL" 또는 "부모 megaTAL"은 TALE DNA 결합 도메인 및 야생형 호밍 엔도뉴클레아제, 자연에서 발견되는 호밍 엔도 뉴클레아제, 또는 후속 호밍 엔도뉴클레아제 변이체를 생성하기 위해 기저 활성, 친화도, 및/또는 안정성을 증가시키도록 변형된 호밍 엔도뉴클레아제를 포함하는 megaTAL을 지칭한다.
특정 구현예에서, megaTAL은 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제(예: Trex2), 5' 플랩 엔도뉴클레아제, 헬리카제, 템플릿 의존성 DNA 중합효소 활성 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단 가공 효소와 함께 세포 내로 도입될 수 있다. megaTAL 및 3' 가공 효소는, 예를 들어, 상이한 벡터 또는 별도의 mRNA에 별도로 도입되거나, 예를 들어, 융합 단백질로서 함께 도입되거나, 바이러스 자가 절단 펩티드 또는 IRES 요소에 의해 분리된 폴리시스트론 작제물에 도입될 수 있다.
"TALE DNA 결합 도메인"은 전사 활성제-유사 효과기(TALE 또는 TAL-효과기)의 DNA 결합 부분으로서, 이는 식물 전사체를 조작하기 위한 식물 전사 활성제를 모방한다(예를 들어, Kay 등의 문헌[2007. Science 318:648-651] 참조). 특정 구현예에서 고려되는 TALE DNA 결합 도메인은 새롭게(de novo) 조작되거나, 자연 발생 TALE, 예를 들어, 세균성 점무늬 병균(Xanthomonas campestris pv. vesicatoria), 잔토모나스 가드너리(Xanthomonas gardneri), 잔토모나스 트랜스루센스(Xanthomonas translucens), 잔토모나스 액소노포디스(Xanthomonas axonopodis), 잔토모나스 퍼포란스(Xanthomonas perforans), 잔토모나스 알팔파(Xanthomonas alfalfa), 잔토모나스 시트리(Xanthomonas citri), 잔토모나스 유베시카토리아(Xanthomonas euvesicatoria), 및 잔토모나스 오리재(Xanthomonas oryzae)에서 유래된 AvrBs3, 및 풋마름 병원균(Ralstonia solanacearum)에서 유래된 brg11 및 hpx17로부터 조작된다. DNA 결합 도메인을 유도하고 설계하기 위한 TALE 단백질의 예시적인 실시예는 미국 특허 제9,017,967호 및 동 특허에 인용된 참조 문헌에 개시되어 있으며, 이들 모두는 그 전체가 참조로서 본원에 통합된다.
특정 구현예에서, megaTAL은 하나 이상의 반복 단위를 포함하는 TALE DNA 결합 도메인을 포함하며, 상기 하나 이상의 반복 단위는 TALE DNA 결합 도메인이 상응하는 표적 DNA 서열에 결합하는 데 관여한다. 단일 "반복 단위"(또한 "반복"으로도 지칭됨)는 일반적으로 33~35개 아미노산의 길이이다. 각각의 TALE DNA 결합 도메인 반복 단위는 일반적으로 반복의 위치 12 및/또는 13에서, 반복 가변 이잔기(Repeat Variable Di-Residue, RVD)를 구성하는 1개 또는 2개의 DNA 결합 잔기를 포함한다. 이들 TALE DNA 결합 도메인의 DNA 인식을 위한 천연(정형) 코드는 위치 12 및 13에서의 HD 서열이 시토신(C)에 대한 결합으로 이어지고, NG가 T에 결합하고, NI가 A에 결합하고, NN이 G 또는 A에 결합하고, NG가 T에 결합하도록 결정되었다. 특정 구현예에서, 비-정형(비정형) RVD가 고려된다.
특정 구현예에서 고려되는 특정 megaTAL에 사용하기에 적합한 비-정형 RVD의 예시적인 실시예는 구아닌(G)의 인식을 위한 HH, KH, NH, NK, NQ, RH, RN, SS, NN, SN, KN; 아데닌(A)의 인식을 위한 NI, KI, RI, HI, SI; 티민(T)의 인식을 위한 NG, HG, KG, RG; 시토신(C)의 인식을 이한 RD, SD, HD, ND, KD, YG; A 또는 G의 인식을 위한 NV, HN; 및 A 또는 T 또는 G 또는 C의 인식을 위한 H*, HA, KA, N*, NA, NC, NS, RA, S*를 포함하되 이들로 한정되지는 않으며, 여기서 (*)는 위치 13에서의 아미노산이 없음을 의미한다. 특정 구현예에서 고려되는 특정 megaTAL에서 사용하기에 적합한 RVD의 추가적인 예시적인 실시예는 미국 특허 제8,614,092호에 개시된 것들을 추가로 포함하며, 동 특허는 그 전체가 참조로서 본원에 통합된다.
특정 구현예에서, 본원에서 고려되는 megaTAL은 3 내지 30개의 반복 단위를 포함하는 TALE DNA 결합 도메인을 포함한다. 특정 구현예에서, megaTAL은 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 TALE DNA 결합 도메인 반복 단위를 포함한다. 바람직한 구현예에서, 본원에서 고려되는 megaTAL은 5~15개의 반복 단위, 보다 바람직하게는 7~15개의 반복 단위, 보다 바람직하게는 9~15개의 반복 단위, 및 보다 바람직하게는 9, 10, 11, 12, 13, 14 또는 15개의 반복 단위를 포함하는 TALE DNA 결합 도메인을 포함한다.
특정 구현예에서, 본원에서 고려되는 megaTAL은, 3 내지 30개의 반복 단위 및 TALE 반복 단위 세트의 C 말단에 위치한 20개의 아미노산을 포함하는 추가의 단일 절단된 TALE 반복 단위, 즉 추가의 C 말단 반수-TALE DNA 결합 도메인 반복 단위(아래, 본원의 다른 곳에 개시된 C-캡의 아미노산 -20 내지 -1)를 포함하는 TALE DNA 결합 도메인을 포함한다. 따라서, 특정 구현예에서, 본원에서 고려되는 megaTAL은 3.5 내지 30.5개의 반복 단위를 포함하는 TALE DNA 결합 도메인을 포함한다. 특정 구현예에서, megaTAL은 3.5, 4.5, 5.5, 6.5, 7.5, 8.5, 9.5, 10.5, 11.5, 12.5, 13.5, 14.5, 15.5, 16.5, 17.5, 18.5, 19.5, 20.5, 21.5, 22.5, 23.5, 24.5, 25.5, 26.5, 27.5, 28.5, 29.5, 또는 30.5개의 TALE DNA 결합 도메인 반복 단위를 포함한다. 바람직한 구현예에서, 본원에서 고려되는 megaTAL은 5.5~15.5개의 반복 단위, 보다 바람직하게는 7.5~15.5개의 반복 단위, 보다 바람직하게는 9.5~15.5개의 반복 단위, 및 보다 바람직하게는 9.5, 10.5, 11.5, 12.5, 13.5, 14.5, 또는 15.5개의 반복 단위를 포함하는 TALE DNA 결합 도메인을 포함한다.
특정 구현예에서, megaTAL은 "N-말단 도메인(NTD)" 폴리펩티드, 하나 이상의 TALE 반복 도메인/단위, "C-말단 도메인(CTD)" 폴리펩티드, 및 호밍 엔도뉴클레아제 변이체를 포함하는 TAL 효과기 아키텍쳐를 포함한다. 일부 구현예에서, NTD, TALE 반복, 및/또는 CTD 도메인은 동일한 종으로부터 유래한다. 다른 구현예에서, NTD, TALE 반복, 및/또는 CTD 도메인 중 하나 이상은 상이한 종으로부터 유래한다.
본원에서 사용되는 바와 같이, 용어 "N-말단 도메인(NTD)" 폴리펩티드는 자연 발생 TALE DNA 결합 도메인의 N-말단 부분 또는 단편의 측면에 위치하는 서열을 지칭한다. NTD 서열이 존재하는 경우, NTD 서열은 TALE DNA 결합 도메인 반복 단위가 DNA에 결합하는 능력을 보유하는 한, 임의의 길이일 수 있다. 특정 구현예에서, NTD 폴리펩티드는 TALE DNA 결합 도메인에 대한 N-말단에서 적어도 120개 내지 적어도 140개의 아미노산을 포함한다(0은 가장 N-말단에 있는 반복 단위의 아미노산 1임). 특정 구현예에서, NTD 폴리펩티드는 TALE DNA 결합 도메인에 대한 N-말단에서 적어도 약 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 또는 적어도 140개의 아미노산을 포함한다. 일 구현예에서, 본원에서 고려되는 megaTAL은 잔토모나스 TALE 단백질의 적어도 약 아미노산 +1 내지 +122개 내지 적어도 약 +1 내지 +137개로 이루어진 NTD 폴리펩티드를 포함한다(0은 가장 N-말단에 있는 반복 단위의 아미노산 1임). 특정 구현예에서, NTD 폴리펩티드는 잔토모나스 TALE 단백질의 TALE DNA 결합 도메인에 대한 N-말단에서 적어도 약 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 또는 137개의 아미노산을 포함한다. 일 구현예에서, 본원에서 고려되는 megaTAL은 랄스토니아(Ralstonia) TALE 단백질의 적어도 약 아미노산 +1 내지 +121개로 이루어진 NTD 폴리펩티드를 포함한다(0은 가장 N-말단에 있는 반복 단위의 아미노산 1임). 특정 구현예에서, NTD 폴리펩티드는 랄스토니아 TALE 단백질의 TALE DNA 결합 도메인에 대한 N-말단에서 적어도 약 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 또는 137개의 아미노산을 포함한다.
본원에서 사용되는 바와 같이, 용어 "C-말단 도메인(CTD)" 폴리펩티드는 자연 발생 TALE DNA 결합 도메인의 C-말단 부분 또는 단편의 측면에 위치하는 서열을 지칭한다. CTD 서열이 존재하는 경우, CTD 서열은 TALE DNA 결합 도메인 반복 단위가 DNA에 결합하는 능력을 보유하는 한, 임의의 길이일 수 있다. 특정 구현예에서, CTD 폴리펩티드는 TALE DNA 결합 도메인에 대한 C-말단에서 적어도 20개 내지 적어도 85개의 아미노산을 포함한다(처음 20개의 아미노산은 마지막 C-말단 전체 반복 단위에 대한 C-말단에 있는 반수-반복 단위임). 특정 구현예에서, CTD 폴리펩티드는 TALE DNA 결합 도메인의 마지막 전체 반복 단위에 대한 C-말단에서 적어도 약 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 443, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75 , 76, 77, 78, 79, 80, 81, 82, 83, 84, 또는 적어도 85개의 아미노산을 포함한다. 일 구현예에서, 본원에서 고려되는 megaTAL은 잔토모나스 TALE 단백질의 적어도 약 아미노산 -20 내지 -1개로 이루어진 CTD 폴리펩티드를 포함한다(-20은 마지막 C-말단 전체 반복 단위에 대해 C-말단에 있는 반수-반복 단위의 아미노산 1임). 특정 구현예에서, CTD 폴리펩티드는 잔토모나스 TALE 단백질의 TALE DNA 결합 도메인의 마지막 전체 반복에 대한 C-말단에서 적어도 약 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산을 포함한다. 일 구현예에서, 본원에서 고려되는 megaTAL은 랄스토니아 TALE 단백질의 적어도 약 아미노산 -20 내지 -1개로 이루어진 CTD 폴리펩티드를 포함한다(-20은 마지막 C-말단 전체 반복 단위에 대해 C-말단에 있는 반수-반복 단위의 아미노산 1임). 특정 구현예에서, CTD 폴리펩티드는 랄스토니아 TALE 단백질의 TALE DNA 결합 도메인의 마지막 전체 반복에 대한 C-말단에서 적어도 약 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산을 포함한다.
특정 구현예에서, 본원에서 고려되는 megaTAL은, 표적 서열에 결합하도록 조작된 TALE DNA 결합 도메인, 표적 서열에 결합하여 이를 절단하도록 리프로그래밍되고 효소 안정성 및/또는 활성을 증가시키도록 조작된 호밍 엔도뉴클레아제, 및 임의로 NTD 및/또는 CTD 폴리펩티드(본원의 다른 곳에서 고려되는 하나 이상의 링커 폴리펩티드와 함께 서로 임의로 결합됨)를 포함하는 융합 폴리펩티드를 포함한다. 임의의 특정 이론에 구속되고자 함이 없이, TALE DNA 결합 도메인 및 임의로 NTD 및/또는 CTD 폴리펩티드를 포함하는 megaTAL는 링커 폴리펩티드에 융합되는데, 링커 폴리펩티드는 호밍 엔도뉴클레아제 변이체에 추가로 융합된다는 것이 고려된다. 따라서, TALE DNA 결합 도메인은 호밍 엔도뉴클레아제 변이체의 DNA 결합 도메인에 의해 결합된 표적 서열로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개 뉴클레오티드 이내에 있는 DNA 표적 서열에 결합한다. 이러한 방식으로, 본원에서 고려되는 megaTAL은 특이성 및 게놈 편집의 효율을 증가시킨다.
일 구현예에서, megaTAL은: 호밍 엔도뉴클레아제 변이체; 및 리프로그래밍된 호밍 엔도뉴클레아제의 결합 부위의 상류에서 약 2, 3, 4, 5, 또는 6개의 뉴클레오티드 이내에 있는 뉴클레오티드 서열에 결합하는 TALE DNA 결합 도메인을 포함한다.
특정 구현예에서, 본원에서 고려되는 megaTAL은 하나 이상의 TALE DNA 결합 반복 단위, 및 부모 I-OnuI HE 변이체와 비교하여 증가된 열안정성 및/또는 효소 활성을 포함하는 I-OnuI HE 변이체를 포함한다.
특정 구현예에서, 본원에서 고려되는 megaTAL은 NTD, 하나 이상의 TALE DNA 결합 반복 단위, CTD, 및 부모 I-OnuI HE 변이체와 비교하여 증가된 열안정성 및/또는 효소 활성을 포함하는 I-OnuI HE 변이체를 포함한다.
특정 구현예에서, 본원에서 고려되는 megaTAL은 NTD, 약 9.5 내지 약 15.5개의 TALE DNA 결합 반복 단위, 및 부모 I-OnuI HE 변이체와 비교하여 증가된 열안정성 및/또는 효소 활성을 포함하는 I-OnuI HE 변이체를 포함한다.
특정 구현예에서, 본원에서 고려되는 megaTAL은, 약 122 내지 137개의 아미노산 및 약 9.5, 약 10.5, 약 11.5, 약 12.5, 약 13.5, 약 14.5, 또는 약 15.5개의 결합 반복 단위로 이루어진 NTD; 약 20 내지 약 85개의 아미노산으로 이루어진 CTD; 및 부모 I-OnuI HE 변이체와 비교하여 증가된 열안정성 및/또는 효소 활성을 포함하는 I-OnuI 변이체를 포함한다. 특정 구현예에서, NTD, DNA 결합 도메인, 및 CTD 중 어느 하나, 둘, 또는 전부는 임의의 적절한 조합으로 동일한 종 또는 상이한 종으로부터 설계될 수 있다.
특정 구현예에서, 열안정성을 강화시키기 위한 하나 이상의 돌연변이를 갖는 I-OnuI HE 변이체를 포함하는 megaTAL은 다음으로 이루어진 군으로부터 선택된 유전자의 표적 부위 또는 서열에 결합하도록 리프로그래밍된다: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
3. 말단 가공 효소
특정 구현예에서 고려되는 게놈 편집 조성물 및 방법은 부모 I-OnuI HE 변이체와 비교하여 증가된 열안정성 및/또는 효소 활성을 포함하는 I-OnuI HE 변이체 및 말단 가공 효소의 하나 이상의 사본을 사용해 세포 게놈을 편집하는 단계를 포함한다. 특정 구현예에서, 단일 폴리뉴클레오티드는 링커, 자가 절단 펩티드 서열(예: 2A 서열), 또는 IRES 서열에 의해 분리된, 호밍 엔도뉴클레아제 변이체 및 말단 가공 효소를 암호화한다. 특정 구현예에서, 게놈 편집 조성물은 뉴클레아제 변이체를 암호화하는 폴리뉴클레오티드 및 말단 가공 효소를 암호화하는 별도의 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 게놈 편집 조성물은 자가 절단 펩티드에 의해 분리된 말단 가공 효소의 직렬 카피 외에, 호밍 엔도뉴클레아제 변이체 말단 가공 효소 단일 폴리펩티드 융합체를 암호화하는 폴리뉴클레오티드를 포함한다.
용어 "말단 가공 효소(end-processing enzyme)"는 폴리뉴클레오티드 사슬의 노출된 말단을 변형시키는 효소를 지칭한다. 폴리뉴클레오티드는 이중 가닥 DNA(dsDNA), 단일 가닥 DNA(ssDNA), RNA, DNA 및 RNA의 이중 가닥 하이브리드, 및 합성 DNA(예를 들어, A, C, G, 및 T가 아닌 염기를 함유함)일 수 있다. 말단 가공 효소는 하나 이상의 뉴클레오티드를 첨가하거나, 하나 이상의 뉴클레오티드를 제거하거나, 인산염 기를 제거 또는 변형하고/하거나 하이드록실 기를 제거 또는 변형함으로써, 노출된 폴리뉴클레오티드 사슬 말단을 변형시킬 수 있다. 말단 가공 효소는 엔도뉴클레아제 절단 부위에서 말단을 변형시키거나, (예를 들어, 미세 게이지 바늘의 관통, 가열, 초음파 처리, 미니 비드 텀블링, 및 분무에 의한) 전단, 이온화 방사선, 자외선 방사선, 산소 라디칼, 화학적 가수분해, 및 화학 요법 제제와 같은 다른 화학적 수단 또는 기계적 수단에 의해 생성된 말단을 변형시킬 수 있다.
특정 구현예에서, 특정 구현예에서 고려되는 게놈 편집 조성물 및 방법은 부모 I-OnuI HE 변이체와 비교하여 증가된 열안정성 및/또는 효소 활성을 포함하는 I-OnuI HE 변이체, 또는 metaTAL 및 DNA 말단 가공 효소를 사용해 세포 게놈을 편집하는 단계를 포함한다.
용어 "DNA 말단 가공 효소"는 DNA의 노출된 말단을 변형시키는 효소를 지칭한다. DNA 말단 가공 효소는 뭉툭한 말단 또는 엇갈린 말단(5' 또는 3'이 돌출된 말단)을 변형시킬 수 있다. DNA 말단 가공 효소는 단일 가닥 또는 이중 가닥 DNA를 변형시킬 수 있다. DNA 말단 가공 효소는 엔도뉴클레아제 절단 부위에서 말단을 변형시키거나, (예를 들어, 미세 게이지 바늘의 관통, 가열, 초음파 처리, 미니 비드 텀블링, 및 분무에 의한) 전단, 이온화 방사선, 자외선 방사선, 산소 라디칼, 화학적 가수분해, 및 화학 요법 제제와 같은 다른 화학적 수단 또는 기계적 수단에 의해 생성된 말단을 변형시킬 수 있다. DNA 말단 가공 효소는 하나 이상의 뉴클레오티드를 첨가하거나, 하나 이상의 뉴클레오티드를 제거하거나, 인산염 기를 제거 또는 변형하고/하거나 하이드록실 기를 제거 또는 변형함으로써, 노출된 DNA 말단을 변형시킬 수 있다.
본원에서 고려되는 특정 구현예에 사용하기에 적합한 DNA 말단 가공 효소의 예시적인 실시예는, 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 3'-5' 엑소뉴클레아제, 5' 플랩 엔도뉴클레아제, 헬리카제, 포스파타아제, 가수분해효소, 및 템플릿 독립적 DNA 중합효소를 포함하지만 이들로 한정되지는 않는다.
본원에서 고려되는 특정 구현예에 사용하기에 적합한 DNA 말단 가공 효소의 추가 예시적인 실시예는 Trex2, Trex1, 막관통 도메인이 없는 Trex1, 아폴로(Apollo), 아르테미스(Artemis), DNA2, Exo1, ExoT, ExoIII, Fen1, Fan1, MreII, Rad2, Rad9, TdT(말단 데옥시뉴클레오티딜 전이효소), PNKP, RecE, RecJ, RecQ, 람다 엑소뉴클레아제, Sox, 우두 DNA 중합효소, 엑소뉴클레아제 I, 엑소뉴클레아제 III, 엑소뉴클레아제 VII, NDK1, NDK5, NDK7, NDK8, WRN, T7-엑소뉴클레아제 유전자 6, 조류 골수아세포 바이러스 통합 단백질 (IN), 블룸(Bloom), 안타르틱 포스파타아제(Antartic Phophatase), 알칼리 포스파타아제(Alkaline Phosphatase), 폴리뉴클레오티드 키나아제 (PNK), ApeI, 녹두 뉴클레아제(Mung Bean nuclease), Hex1, TTRAP (TDP2), Sgs1, Sae2, CUP, Pol mu, Pol 람다, MUS81, EME1, EME2, SLX1, SLX4 및 UL-12를 포함하지만 이들로 한정되지는 않는다.
특정 구현예에서, 본원에서 고려되는 세포 게놈을 편집하기 위한 게놈 편집 조성물 및 방법은 I-OnuI HE 변이체 또는 megaTAL 및 엑소뉴클레아제를 포함하는 폴리펩티드를 포함한다. 용어 "엑소뉴클레아제(exonuclease)"는 3' 또는 5' 말단에서 인산디에스테르 결합을 절단하는 가수분해 반응을 통해 폴리뉴클레오티드 사슬의 말단에서 인산디에스테르 결합을 절단하는 효소를 지칭한다.
본원에서 고려되는 특정 구현예에 사용하기에 적합한 엑소뉴클레아제의 예시적인 실시예는 hExoI, 효모(Yeast) ExoI, 대장균(E. coli) ExoI, hTREX2, 마우스 TREX2, 랫트(rat) TREX2, hTREX1, 마우스 TREX1, 랫트(rat) TREX1, 및 랫트(Rat) TREX1을 포함하지만, 이들로 한정되지는 않는다.
특정 구현예에서, DNA 말단 가공 효소는 3'에서 5' 방향으로 엑소뉴클레아제, 바람직하게는 Trex 1 또는 Trex2, 보다 바람직하게는 Trex2, 및 보다 더 바람직하게는 인간 또는 마우스 Trex2 이다.
D. 폴리펩티드
열안정성 및/또는 효소 활성을 증가시키도록 조작된 호밍 엔도뉴클레아제 변이체 및 megaTAL, 및 융합 폴리펩티드를 포함하지만 이들로 한정되지는 않는 다양한 폴리펩티드가 본원에서 고려된다. 바람직한 구현예에서, 폴리펩티드는 서열번호 9-14, 16-18, 22, 및 23 중 어느 하나에 제시된 아미노산 서열을 포함한다. "폴리펩티드", "펩티드", 및 "단백질"은 반대로 명시되지 않는 한, 통상적인 의미에 따라, 즉 아미노산의 서열로서 상호 교환적으로 사용된다. 일 구현예에서, "폴리펩티드"는 융합 폴리펩티드 및 다른 변이체를 포함한다. 폴리펩티드는 잘 알려진 다양한 재조합 기술 및/또는 합성 기술 중 어느 하나를 사용해 제조될 수 있다. 폴리펩티드는 특정 길이로 제한되지 않으며, 예를 들어, 이들은 전장 단백질 서열, 전장 단백질의 단편, 또는 융합 단백질을 포함할 수 있고, 폴리펩티드의 번역 후 변형, 예를 들어, 당질화, 아세틸화, 인산화 등을 비롯하여 당업계에 공지된 다른 변형을 포함할 수 있으며, 자연 발생 및 비자연 발생 변형을 포함할 수 있다.
본원에서 사용되는 바와 같이, "단리된 단백질", "단리된 펩티드" 또는 "단리된 폴리펩티드" 등은 세포 환경으로부터, 또는 세포의 다른 성분과의 결합으로부터 펩티드 또는 폴리펩티드 분자를 시험관내 합성, 단리, 및/또는 정제하는 것을 지칭하며, 이는 생체 내 물질과 유의하게 결합하지 않는다. 특정 구현예에서, 단리된 폴리펩티드는 합성 폴리펩티드, 반합성 폴리펩티드, 또는 재조합 공급원으로부터 수득되거나 유래된 폴리펩티드이다.
폴리펩티드는 "폴리펩티드 변이체"를 포함한다. 폴리펩티드 변이체는 하나 이상의 아미노산이 치환, 결실, 추가 및/또는 삽입되었다는 점에서 자연 발생 폴리펩티드와 상이할 수 있다. 이러한 변이체는 자연적으로 발생할 수 있거나, 예를 들어 상기 폴리펩티드 서열 중 하나 이상의 아미노산을 변형시킴으로써 합성에 의해 생성될 수 있다. 예를 들어, 특정 구현예에서, 열적 안정성을 증가시키는 하나 이상의 치환, 결실, 추가, 및/또는 삽입을 폴리펩티드 내에 도입함으로써 표적 부위에 결합하여 이를 절단하는 호밍 엔도뉴클레아제, megaTAL 등의 생물학적 특성을 개선하는 것이 바람직할 수 있다. 특정 구현예에서, 일반적으로 변이체가 기준 서열의 적어도 하나의 생물학적 활성을 유지하는 경우, 폴리펩티드는 기준 서열과 적어도 약 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 아미노산 동일성을 갖는 폴리펩티드를 포함한다.
바람직한 구현예에서, 폴리펩티드 변이체는 열안정성 및/또는 활성을 증가시키도록 조작된 호밍 엔도뉴클레아제 또는 megaTAL을 포함한다. I-OnuI HE 폴리펩티드 또는 이의 단편은 표적 부위에 결합하여 이를 절단하도록 리프로그래밍될 수 있다. 특정 구현예에서, 리프로그래밍된 I-OnuI HE 변이체는 부모 I-OnuI HE와 비교해 상대적으로 낮은 열안정성 및/또는 활성을 갖는다. 바람직한 구현예에서, I-OnuI 호밍 엔도뉴클레아제 또는 이의 단편은 표적 부위에 결합하여 이를 절단하고, 효소의 열안정성 및/또는 활성을 증가시키도록 조작된다.
폴리펩티드 변이체는 생물학적 활성 "폴리펩티드 단편"을 포함한다. 생물학적 활성 폴리펩티드 단편의 예시적인 실시예는 DNA 결합 도메인, 뉴클레아제 도메인 등을 포함한다. 본원에서 사용되는 바와 같이, 용어 "생물학적 활성 단편" 또는 "최소 생물학적 활성 단편"은 자연 발생 폴리펩티드 활성의 적어도 100%, 적어도 90%, 적어도 80%, 적어도 70%, 적어도 60%, 적어도 50%, 적어도 40%, 적어도 30%, 적어도 20%, 적어도 10%, 또는 적어도 5%를 보유하는 폴리펩티드 단편을 지칭한다. 바람직한 구현예에서, 생물학적 활성은 표적 서열에 대한 결합 친화도 및/또는 절단 활성이다. 특정 구현예에서, 폴리펩티드 단편은 적어도 5 내지 약 1700개 아미노산 길이의 아미노산 사슬을 포함할 수 있다. 특정 구현예에서, 단편은 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700개 또는 더 이상의 아미노산의 길이이다. 특정 구현예에서, 폴리펩티드는 호밍 엔도뉴클레아제 변이체의 생물학적 활성 단편을 포함한다. 특정 구현예에서, 폴리펩티드는 호밍 엔도뉴클레아제 변이체 또는 megaTAL의 생물학적 활성 단편을 포함한다. 특정 구현예에서, 본원에 제시된 폴리펩티드는 "X"로 표시된 하나 이상의 아미노산을 포함할 수 있다. "X"가 아미노산 서열번호에 존재하는 경우, 이는 임의의 아미노산을 지칭한다. 하나 이상의 "X" 잔기는 본원에서 고려되는 특정 서열번호에 제시된 아미노산 서열의 N-말단 및 C-말단에 존재할 수 있다. "X" 아미노산이 존재하지 않는 경우, 서열번호에 제시된 나머지 아미노산 서열이 생물학적 활성 단편으로 간주될 수 있다.
생물학적 활성 단편은 N-말단 절단 및/또는 C-말단 절단을 포함할 수 있다. 특정 구현예에서, 생물학적 활성 단편은, 상응하는 야생형 호밍 엔도뉴클레아제 서열과 비교해, 호밍 엔도뉴클레아제 변이체의 1, 2, 3, 4, 5, 6, 7 또는 8개의 N-말단 아미노산의 결실이 없거나 이를 포함하고, 보다 바람직하게는, 상응하는 야생형 호밍 엔도뉴클레아제 서열과 비교해, 4개의 N-말단 아미노산의 결실이 없거나 이를 포함한다. 특정 구현예에서, 생물학적 활성 단편은, 상응하는 야생형 호밍 엔도뉴클레아제 서열과 비교해, 호밍 엔도뉴클레아제 변이체의 1, 2, 3, 4, 또는 5개의 C-말단 아미노산의 결실이 없거나 이를 포함하고, 보다 바람직하게는, 상응하는 야생형 호밍 엔도뉴클레아제 서열과 비교해, 2개의 C-말단 아미노산의 결실이 없거나 이를 포함한다. 특정 바람직한 구현예에서, 생물학적 활성 단편은 상응하는 야생형 호밍 엔도뉴클레아제 서열과 비교해 호밍 엔도뉴클레아제 변이체의 4개의 N-말단 아미노산 및 2개의 C-말단 아미노산의 결실이 없거나 이를 포함한다.
특정 구현예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실을 포함하고/하거나 C-말단 아미노산 R, G, S, F, V 중 1, 2, 3, 4, 또는 5개의 결실을 포함한다.
특정 구현예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실 또는 치환을 포함하고/하거나 C-말단 아미노산 R, G, S, F, V 중 1, 2, 3, 4, 또는 5개의 결실 또는 치환을 포함한다.
특정 구현예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실을 포함하고/하거나 C-말단 아미노산 F, V 중 1 또는 2개의 결실을 포함한다.
특정 구현예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실 또는 치환을 포함하고/하거나 C-말단 아미노산 F, V 중 1 또는 2개의 결실 또는 치환을 포함한다.
전술한 바와 같이, 폴리펩티드는 아미노산 치환, 결실, 절단, 및 삽입을 포함하는 다양한 방식으로 변경될 수 있다. 이러한 조작을 위한 방법은 일반적으로 당업계에 공지되어 있다. 예를 들어, 기준 폴리펩티드의 아미노산 서열 변이체는 DNA에서의 돌연변이에 의해 제조될 수 있다. 돌연변이 유발 및 뉴클레오티드 서열 변경을 위한 방법은 당업계에 잘 알려져 있다. 예를 들어, Kunkel의 문헌[(1985, Proc. Natl. Acad. Sci. USA. 82: 488-492)], Kunkel 등의 문헌[(1987, Methods in Enzymol, 154: 367-382)], 미국 특허 제4,873,192호, Watson, J. D. 등의 문헌[(Molecular Biology of the Gene, Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987)] 및 그 안에 인용된 참조 문헌을 참조한다. 관심 단백질의 생물학적 활성에 영향을 미치지 않는 적절한 아미노산 치환에 대한 지침은 Dayhoff 등의 모델에서 확인할 수 있다(Dayhoff 등의 문헌[(1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.] 참조).
특정 구현예에서, 변이체는 하나 이상의 보존적 치환을 포함하게 된다. "보존적 치환"은 아미노산이 유사한 특성을 갖는 또 다른 아미노산으로 치환되는 것이므로, 펩티드 화학 분야의 당업자는 폴리펩티드의 이차 구조 및 감수성(hydropathic nature)이 실질적으로 변하지 않을 것으로 예상하게 된다. 변형은 특정 구현예에서 고려되는 폴리뉴클레오티드 및 폴리펩티드의 구조의 변형일 수 있으며, 폴리펩티드는 원하는 특성을 갖는 변이체 또는 유도체 폴리펩티드를 암호화하는 기능적 분자를 적어도 대략 보유하고 여전히 수득하는 폴리펩티드를 포함한다. 폴리펩티드의 아미노산 서열을 변경해서 동등하거나 심지어 개선된 변이체 폴리펩티드를 생성하는 것이 바람직할 때, 예를 들어, 당업자는, 예를 들어, 표 1에 따라, 암호화 DNA 서열의 코돈 중 하나 이상을 바꿀 수 있다.
아미노산 코돈
아미노산 1자
코드
3자
코드
코돈
알라닌 A Ala GCA GCC GCG GCU
시스테인 C Cys UGC UGU
아스파르트산 D Asp GAC GAU
글루탐산 E Glu GAA GAG
페닐알라닌 F Phe UUC UUU
글리신 G Gly GGA GGC GGG GGU
히스티딘 H His CAC CAU
이소류신 I Iso AUA AUC AUU
리신 K Lys AAA AAG
류신 L Leu UUA UUG CUA CUC CUG CUU
메티오닌 M Met AUG
아스파라긴 N Asn AAC AAU
프롤린 P Pro CCA CCC CCG CCU
글루타민 Q Gln CAA CAG
아르기닌 R Arg AGA AGG CGA CGC CGG CGU
세린 S Ser AGC AGU UCA UCC UCG UCU
트레오닌 T Thr ACA ACC ACG ACU
발린 V Val GUA GUC GUG GUU
트립토판 W Trp UGG
티로신 Y Tyr UAC UAU
특정 구현예에서, 생물학적 활성을 손상시키지 않고 치환, 삽입 또는 결실할 수 있는 아미노산 잔기를 결정하는 데 있어서의 지침은 당업계에 잘 알려진 컴퓨터 프로그램, 예를 들어 DNASTAR, DNA Strider, Geneious, Mac Vector, 또는 Vector NTI 소프트웨어를 사용해 확인할 수 있다. 보존적 아미노산 변화는 이들의 측쇄에 관련된 아미노산 군 중 하나의 치환을 포함한다. 자연 발생 아미노산은 일반적으로 다음 4개의 군으로 나누어진다: 산성(아스파르트산염, 글루탐산염) 아미노산, 염기성(리신, 아르기닌, 히스티딘) 아미노산, 비극성(알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판) 아미노산, 및 하전되지 않은 극성(글리신, 아스파라긴, 글루타민, 시스테인, 세린, 트레온, 티로신) 아미노산. 페닐알라닌, 트립토판, 및 티로신은 때때로 방향족 아미노산으로서 함께 분류된다. 펩티드 또는 단백질에서, 아미노산의 적절한 보존적 치환은 당업자에게 공지되어 있고, 일반적으로 생성되는 분자의 생물학적 활성을 변화시키지 않고 이루어질 수 있다. 당업자는 일반적으로, 폴리펩티드의 비필수 영역에서의 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경시키지 않는다는 것을 인식한다(예를 들어, Watson 등의 문헌[Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. Co., p.224] 참조).
일 구현예에서, I-OnuI 변이체는 효소의 열안정성에 영향을 미치는 위치에서 하나 이상의 비보존적 아미노산 치환을 포함한다. 일 구현예에서, I-OnuI 변이체는 효소의 열안정성에 영향을 미치는 위치에서 하나 이상의 보존적 및/또는 비보존적 아미노산 치환을 포함한다.
2개 이상의 폴리펩티드의 발현이 바람직한 특정 구현예에서, 이들을 암호화하는 폴리뉴클레오티드 서열은 본원의 다른 곳에 개시된 바와 같은 IRES 서열에 의해 분리될 수 있다.
특정 구현예에서 고려되는 폴리펩티드는 융합 폴리펩티드를 포함한다. 특정 구현예에서, 융합 폴리펩티드 및 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드가 제공된다. 융합 폴리펩티드 및 융합 단백질은 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 폴리펩티드 분절을 갖는 폴리펩티드를 지칭한다.
또 다른 구현예에서, 2개 이상의 폴리펩티드는 본원의 다른 곳에서 개시된 바와 같은 하나 이상의 자가 절단 폴리펩티드 서열을 포함하는 융합 단백질로서 발현될 수 있다.
일 구현예에서, 본원에서 고려되는 융합 단백질은 하나 이상의 DNA 결합 도메인 및 하나 이상의 뉴클레아제, 및 하나 이상의 링커 및/또는 자가 절단 폴리펩티드를 포함한다.
일 구현예에서, 본원에서 고려되는 융합 단백질은 뉴클레아제 변이체; 링커 또는 자가 절단 펩티드; 및 5'-3' 엑소뉴클레아제, 5'-3' 알칼리 엑소뉴클레아제, 및 3'-5' 엑소뉴클레아제(예를 들어, Trex2)를 포함하되 이들로 한정되지 않는 말단 가공 효소를 포함한다.
융합 폴리펩티드는: 신호 펩티드, 세포 투과성 펩티드 도메인(CPP), DNA 결합 도메인, 뉴클레아제 도메인 등을 포함하되 이들로 한정되지는 않는 하나 이상의 폴리펩티드 도메인 또는 분절; 에피토프 태그(예를 들어, 말토오스 결합 단백질("MBP"), 글루타티온 S 전이효소(GST), HIS6, MYC, FLAG, V5, VSV-G, 및 HA); 폴리펩티드 링커; 및 폴리펩티드 절단 신호를 포함할 수 있다. 융합 폴리펩티드는 일반적으로 C-말단 대 N-말단 결합이지만, C-말단 대 C-말단 결합, N-말단 대 N-말단 결합, 또는 N-말단 대 C-말단 결합일 수도 있다. 특정 구현예에서, 융합 단백질의 폴리펩티드는 임의의 순서를 가질 수 있다. 융합 폴리펩티드 또는 융합 단백질은 융합 폴리펩티드의 바람직한 활성이 보존되는 한, 보존적으로 변형된 변이체, 다형성 변이체, 대립유전자, 돌연변이체, 하위서열, 및 종간 상동체를 포함할 수도 있다. 융합 폴리펩티드는 화학적 합성 방법에 의하거나, 2개의 모이어티 간의 화학적 연결에 의해 생산되거나, 다른 표준 기술을 사용하여 일반적으로 제조될 수 있다. 융합 폴리펩티드를 포함하는 연결된 DNA 서열은 본원의 다른 곳에서 개시된 바와 같이 적절한 전사 또는 번역 조절 요소에 작동 가능하게 연결된다.
융합 폴리펩티드는 폴리펩티드 내의 하나 이상의 폴리펩티드 또는 도메인을 연결하는데 사용될 수 있는 링커를 임의로 포함할 수 있다. 펩티드 링커 서열은, 폴리펩티드 도메인이 원하는 기능을 발휘할 수 있도록 각각의 폴리펩티드가 적절한 2차 및 3차 구조로 접히는 것을 보장하기에 충분한 거리만큼 임의의 2개 이상의 폴리펩티드 성분을 분리하는 데 사용될 수 있다. 이러한 펩티드 링커 서열은 당업계의 표준 기술을 사용하여 융합 폴리펩티드에 통합된다. 적절한 펩티드 링커 서열은 다음 인자에 기초하여 선택될 수 있다: (1) 가요성 연장된 형태를 채택하는 능력; (2) 제1 및 제2 폴리펩티드 상의 기능적 에피토프와 상호작용할 수 있는 이차 구조를 채택할 수 없는 능력; 및 (3) 폴리펩티드 기능적 에피토프와 반응할 수 있는 소수성 잔기 또는 하전된 잔기의 결여. 바람직한 펩티드 링커 서열은 Gly, Asn, 및 Ser 잔기를 함유한다. Thr 및 Ala와 같은 다른 거의 중성 아미노산이 링커 서열에 사용될 수도 있다. 링커로서 유용하게 사용될 수 있는 아미노산 서열은 하기 문헌에 기술되어 있는 것들을 포함한다: Maratea 등의 문헌[Gene 40:39-46, 1985]; Murphy 등의 문헌[Proc. Natl. Acad. Sci. USA 83:8258-8262, 1986]; 미국 특허 제4,935,233호, 및 미국 특허 제4,751,180호. 특정 융합 폴리펩티드 분절이 기능적 도메인을 분리하고 입체 간섭을 방지하는 데 사용될 수 있는 비필수 N-말단 아미노산 영역을 함유하는 경우 링커 서열은 필요하지 않다. 바람직한 링커는 일반적으로 재조합 융합 단백질의 일부로서 합성되는 가요성 아미노산 하위 서열이다. 링커 폴리펩티드는 1 내지 200개 아미노산의 길이, 1 내지 100개 아미노산의 길이, 또는 1 내지 50개 아미노산의 길이일 수 있으며, 그 사이의 모든 정수 값을 포함한다.
예시적인 링커는 다음의 아미노산 서열을 포함하지만 이들로 한정되지는 않는다: 글리신 중합체 (G)n; 글리신-세린 중합체 (G1-5S1-5)n, 여기서 n은 적어도 1, 2, 3, 4, 또는 5의 정수임; 글리신-알라닌 중합체; 알라닌-세린 중합체; GGG (서열번호 24); DGGGS (서열번호 25); TGEKP (서열번호 26) (예를 들어, Liu 등의 문헌[PNAS 5525-5530 (1997)] 참조); GGRR (서열번호 27) (Pomerantz 등의 전술한 1995 문헌); (GGGGS)n 여기서 n = 1, 2, 3, 4 또는 5임 (서열번호 28) (Kim 등의 문헌[PNAS 93, 1156-1160 (1996)]); EGKSSGSGSESKVD (서열번호 29) (Chaudhary 등의 문헌[1990, Proc. Natl. Acad. Sci. U.S.A. 87:1066-1070)]; KESGSVSSEQLAQFRSLD (서열번호 30) (Bird 등의 문헌[1988, Science 242:423-426]), GGRRGGGS (서열번호 31); LRQRDGERP (서열번호 32); LRQKDGGGSERP (서열번호 33); LRQKD(GGGS)2ERP (서열번호 34). 대안적으로, 가요성 링커는 DNA 결합 부위 및 펩티드 자체 둘 다를 모델링할 수 있는 컴퓨터 프로그램(Desjarlais & Berg의 문헌[PNAS 90:2256-2260 (1993)], [PNAS 91:11099-11103 (1994)]) 또는 파지 디스플레이 방법을 사용해 합리적으로 설계될 수 있다.
융합 폴리펩티드는 본원에 기술된 폴리펩티드 도메인들 각각 사이, 또는 내인성 개방 해독 프레임과 공여자 복구 템플릿에 의해 암호화된 폴리펩티드 사이에 폴리펩티드 절단 신호를 추가로 포함할 수 있다. 또한, 폴리펩티드 절단 부위는 임의의 링커 펩티드 서열에 삽입될 수 있다. 예시적인 폴리펩티드 절단 신호는 프로테아제 절단 부위, 뉴클레아제 절단 부위(예를 들어, 희귀 제한 효소 인식 부위, 자가 절단 리보자임 인식 부위), 및 자가 절단 바이러스 올리고펩티드와 같은 폴리펩티드 절단 인식 부위를 포함한다(deFelipe와 Ryan의 문헌[2004, Traffic, 5(8); 616-26] 참조).
적절한 프로테아제 절단 부위 및 자가 절단 펩티드는 당업자에게 공지되어 있다(예를 들어, Ryan 등의 문헌[1997. J. Gener. Virol. 78, 699-722]; Scymczak 등의 문헌[(2004) Nature Biotech. 5, 589-594] 참조). 예시적인 프로테아제 절단 부위는 포티바이러스 NIa 프로테아제(예: 담배 식각 바이러스 프로테아제), 포티바이러스 HC 프로테아제, 포티바이러스 P1 (P35) 프로테아제, 바이오바이러스(byovirus) NIa 프로테아제, 바이오바이러스 RNA-2-암호화된 프로테아제, 아프토바이러스(aphthovirus) L 프로테아제, 엔테로바이러스(enterovirus) 2A 프로테아제, 리노바이러스(rhinovirus) 2A 프로테아제, 피코르나(picorna) 3C 프로테아제, 코모바이러스(comovirus) 24K 프로테아제, 네포바이러스(nepovirus) 24K 프로테아제, RTSV (벼해충 구상 바이러스) 3C-유사 프로테아제, PYVF (파스닙 황색 얼룩 바이러스) 3C-유사 프로테아제, 헤파린, 트롬빈, 인자 Xa, 및 엔테로키나아제의 절단 부위를 포함하지만, 이들로 한정되지는 않는다. EXXYXQ(G/S)(서열번호 35)와 같은 일 구현예에서는 TEV(담배 식각 바이러스) 프로테아제의 절단 부위, 예를 들어, ENLYFQG (서열번호 36) 및 ENLYFQS (서열번호 37)(TEV에 의한 절단은 Q와 G 사이 또는 Q와 S 사이에서 발생함)가 TEV 프로테아제의 높은 절단 엄격성으로 인해 바람직하다(여기서, X는 임의의 아미노산을 나타냄).
특정 구현예에서, 폴리펩티드 절단 신호는 바이러스 자가 절단 펩티드 또는 리보솜 스키핑 서열이다.
리보솜 스키핑 서열의 예시적인 실시예는, 2A 또는 2A-유사 부위, 서열, 또는 도메인을 포함하지만 이들로 한정되지는 않는다(Donnelly 등의 문헌[2001. J. Gen. Virol. 82:1027-1041] 참조). 특정 구현예에서, 바이러스 2A 펩티드는 아프토바이러스 2A 펩티드, 포티바이러스 2A 펩티드, 또는 카디오바이러스 2A 펩티드이다.
일 구현예에서, 바이러스 2A 펩티드는 다음으로 이루어지는 군으로부터 선택된다: 구제역(foot-and-mouth disease) 바이러스(FMDV) 2A 펩티드, 말 비염(equine rhinitis) A 바이러스(ERAV) 2A 펩티드, 토세아 아시그나 바이러스Thosea asigna virus, TaV) 2A 펩티드, 돼지 테스코바이러스-1(PTV-1) 2A 펩티드, 테일로바이러스(Theilovirus) 2A 펩티드, 및 뇌심근염(encephalomyocarditis) 바이러스 2A 펩티드.
2A 부위의 예시적인 실시예가 표 2에 제공되어 있다.
예시적인 2A 부위는 다음의 서열을 포함한다:
서열번호 38 GSGATNFSLLKQAGDVEENPGP
서열번호 39 ATNFSLLKQAGDVEENPGP
서열번호 40 LLKQAGDVEENPGP
서열번호 41 GSGEGRGSLLTCGDVEENPGP
서열번호 42 EGRGSLLTCGDVEENPGP
서열번호 43 LLTCGDVEENPGP
서열번호 44 GSGQCTNYALLKLAGDVESNPGP
서열번호 45 QCTNYALLKLAGDVESNPGP
서열번호 46 LLKLAGDVESNPGP
서열번호 47 GSGVKQTLNFDLLKLAGDVESNPGP
서열번호 48 VKQTLNFDLLKLAGDVESNPGP
서열번호 49 LLKLAGDVESNPGP
서열번호 50 LLNFDLLKLAGDVESNPGP
서열번호 51 TLNFDLLKLAGDVESNPGP
서열번호 52 LLKLAGDVESNPGP
서열번호 53 NFDLLKLAGDVESNPGP
서열번호 54 QLLNFDLLKLAGDVESNPGP
서열번호 55 APVKQTLNFDLLKLAGDVESNPGP
서열번호 56 VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQT
서열번호 57 LNFDLLKLAGDVESNPGP
서열번호 58 LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP
서열번호 59 EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP
E. 폴리뉴클레오티드
특정 구현예에서, 열안정성 및/또는 효소 활성을 증가시키도록 조작된 하나 이상의 호밍 엔도뉴클레아제 변이체 및 megaTAL을 암호화하는 폴리뉴클레오티드, 및 본원에서 고려되는 융합 폴리펩티드가 제공된다. 본원에서 사용되는 바와 같이, 용어 "폴리뉴클레오티드" 또는 "핵산"은 데옥시리보핵산(DNA), 리보핵산(RNA) 및 DNA/RNA 하이브리드를 지칭한다. 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있고 재조합, 합성, 또는 단리된 것일 수 있다. 폴리뉴클레오티드는 전령 RNA 전구체(pre-mRNA), 전령 RNA (mRNA), RNA, 짧은 간섭 RNA (siRNA), 짧은 헤어핀 RNA (shRNA), 마이크로RNA (miRNA), 리보자임, 게놈 RNA (gRNA), 양성 가닥 RNA (RNA(+)), 음성 가닥 RNA (RNA(-)), tracrRNA, crRNA, 단일 안내 RNA (sgRNA), 합성 RNA, 합성 mRNA, 게놈 DNA (gDNA), PCR 증폭된 DNA, 상보성 DNA (cDNA), 합성 DNA, 또는 재조합 DNA를 포함하지만 이들로 한정되지는 않는다. 폴리뉴클레오티드는 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 1000개, 적어도 5000개, 적어도 10000개, 또는 적어도 15000개, 또는 그 이상(모든 중간 길이도 포함함)의 뉴클레오티드(리보뉴클레오티드 또는 데옥시리보뉴클레오티드, 또는 어느 하나의 뉴클레오티드의 변형된 형태)로 이루어진 뉴클레오티드의 다량체 형태를 지칭한다. 이러한 맥락에서, "중간 길이(intermediate length)"는 인용된 값들 사이의 임의의 길이, 예컨대 6, 7, 8, 9 등; 101, 102, 103 등; 151, 152, 153 등; 201, 202, 203 등을 의미한다는 것을 쉽게 이해할 것이다. 특정 구현예에서, 폴리뉴클레오티드 또는 변이체는 기준서열에 대해 적어도 또는 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%,76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는다.
특정 구현예에서, 폴리뉴클레오티드는 코돈 최적화될 수 있다. 본원에서 사용되는 바와 같이, 용어 "코돈 최적화(codon-optimized)"는 폴리펩티드의 발현, 안정성, 및/또는 활성을 증가시키기 위해 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈을 치환하는 것을 지칭한다. 코돈 최적화에 영향을 미치는 인자는 다음 중 하나 이상을 포함하지만, 이들로 한정되지는 않는다: (i) 둘 이상의 유기체 또는 유전자 간의 코돈 편향의 변동 또는 합성으로 작제된 편향 테이블; (ii) 유기체, 유전자, 또는 유전자 세트 내 코돈 편향 정도의 변동; (iii) 맥락을 포함하는 코돈의 체계적인 변동; (iv) 코돈의 복호화 tRNA에 따른 코돈의 변동; (v) 삼중항 전체에서 또는 이중 하나의 위치에서 GC 백분율(%)에 따른 코돈의 변동; (vi) 자연 발생 서열과 같은 기준 서열에 대한 유사성의 정도에 있어서의 변동; (vii) 코돈 빈도 컷오프에서의 변동; (viii) DNA 서열로부터 전사된 mRNA의 구조적 특성; (ix) 코돈 치환 세트 설계의 기초가 되는 DNA 서열의 기능에 대한 사전 지식; (x) 각각의 아미노산에 대한 코돈 세트의 체계적인 변동; 및/또는 (xi) 허위 번역 개시 부위의 단리된 제거.
본원에서 사용되는 바와 같이, 용어 "뉴클레오티드"는 인산화된 당과 N-글리코시드 연결된 헤테로시클릭 질소 염기를 지칭한다. 뉴클레오티드는 천연 염기, 및 당업계에서 인식되는 매우 다양한 변형 염기를 포함하는 것으로 이해된다. 이러한 염기는 일반적으로 뉴클레오티드 당 모이어티의 1' 위치에 위치한다. 뉴클레오티드는 일반적으로 염기, 당, 및 인산염 기를 포함한다. 리보핵산(RNA)에서의 당은 리보오스이고, 데옥시리보핵산(DNA)에서의 당은 데옥시리보오스, 즉, 리보오스에 존재하는 하이드록실기가 결여된 당이다. 예시적인 천연 질소 염기는 퓨린, 아데노신(A)과 구아니딘(G), 및 피리미딘, 시티딘(C)과 티미딘(T)(또는 RNA의 맥락에서는 우라실(U))을 포함한다. 데옥시리보오스의 C-1 원자는 피리미딘의 N-1 또는 퓨린의 N-9에 결합된다. 뉴클레오티드는 일반적으로 1인산염, 2인산염, 또는 3인산염이다. 뉴클레오티드는 변형되지 않거나 당, 인산염, 및/또는 염기 모이어티에서 변형될 수 있다(뉴클레오티드 유사체, 뉴클레오티드 유도체, 변형된 뉴클레오티드, 비천연 뉴클레오티드, 및 비표준 뉴클레오티드로서 상호 교환적으로 또한 지칭됨; 예를 들어, WO 92/07065 및 WO 93/15187 참조). 변형된 핵산 염기의 실시예는 Limbach 등의 문헌[1994, Nucleic Acids Res. 22, 2183-2196]에 요약되어 있다.
뉴클레오티드는 뉴클레오시드의 인산염 에스테르로서 간주될 수도 있는데, 에스테르화는 당의 C-5에 부착된 하이드록실기 상에서 발생한다. 본원에서 사용되는 바와 같이, 용어 "뉴클레오시드"는 당과 N-글리코시드 연결된 헤테로시클릭 질소 염기를 지칭한다. 뉴클레오시드는 천연 염기를 포함하고, 잘 알려진 변형된 염기도 포함하는 것으로 당업계에서 인식된다. 이러한 염기는 일반적으로 뉴클레오시드 당 모이어티의 1' 위치에 위치한다. 뉴클레오시드는 일반적으로 염기 및 당기를 포함한다. 뉴클레오시드는 변형되지 않거나 당, 및/또는 염기 모이어티에서 변형될 수 있다(뉴클레오시드 유사체, 뉴클레오시드 유도체, 변형된 뉴클레오시드, 비천연 뉴클레오시드, 및 비표준 뉴클레오시드로서 상호 교환적으로 또한 지칭됨). 전술한 바와 같이, 변형된 핵산 염기의 실시예는 Limbach 등의 문헌[1994, Nucleic Acids Res. 22, 2183-2196]에 요약되어 있다.
폴리뉴클레오티드의 예시적인 실시예는 서열번호 9-14, 16-18, 22, 및 23을 암호화하는 폴리뉴클레오티드, 및 서열번호 19 및 21에 제시된 폴리뉴클레오티드 서열을 포함하지만 이에 한정되지는 않는다.
다양한 예시적인 구현예에서, 본원에서 고려되는 폴리뉴클레오티드는 호밍 엔도뉴클레아제 변이체, megaTAL, 말단 가공 효소, 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드, 및 본원에서 고려되는 폴리뉴클레오티드를 포함하는 발현 벡터, 바이러스 벡터, 및 전달 플라스미드를 포함하지만 이들로 한정되지는 않는다.
본원에서 사용되는 바와 같이, 용어 "폴리뉴클레오티드 변이체" 및 "변이체" 등은 기준 폴리뉴클레오티드 서열과 실질적인 서열 동일성을 나타내는 폴리뉴클레오티드, 또는 이하에서 정의되는 엄격한 조건 하에서 기준 서열과 혼성화되는 폴리뉴클레오티드를 지칭한다. 이들 용어는 적어도 하나의 뉴클레오티드의 추가, 결실, 치환, 또는 변형에 의해 기준 폴리뉴클레오티드와 구별되는 폴리뉴클레오티드도 포함한다. 따라서, 용어 "폴리뉴클레오티드 변이체" 및 "변이체"는 하나 이상의 뉴클레오티드가 추가 또는 결실되었거나, 변형되었거나, 상이한 뉴클레오티드로 치환된 폴리뉴클레오티드를 포함한다. 이와 관련하여, 돌연변이, 추가, 결실, 및 치환을 포함하는 특정 변경이 기준 폴리뉴클레오티드에 만들어질 수 있고, 이에 의해 변경된 폴리뉴클레오티드가 기준 폴리뉴클레오티드의 생물학적 기능 또는 활성을 보유한다는 것이 당업계에서 잘 이해된다.
일 구현예에서, 폴리뉴클레오티드는 엄격한 조건 하에서 표적 핵산 서열에 혼성화되는 뉴클레오티드 서열을 포함한다. "엄격한 조건" 하에서 혼성화하는 것은, 서로 적어도 60% 동일한 뉴클레오티드 서열이 혼성화 상태를 유지하는 혼성화 프로토콜을 기술하는 것이다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮게 선택된다. Tm은 표적 서열에 상보적인 프로브의 50%가 (정의된 이온 강도, pH, 및 핵산 농도 하에) 평형에서 표적 서열에 혼성화되는 온도이다. 표적 서열은 일반적으로 과량으로 존재하기 때문에, Tm에서, 프로브의 50%가 평형에서 점유된다.
본원에서 사용되는 바와 같이, "서열 동일성" 또는, 예를 들어, "50%가 동일한 서열"을 포함하는 용어는 비교 윈도우 상에서 뉴클레오티드-대-뉴클레오티드 기반 또는 아미노산-대-아미노산 기반으로 서열이 동일한 정도를 지칭한다. 따라서, "서열 동일성의 백분율"은 비교 윈도우 상에서 최적으로 정렬된 2개의 서열을 비교하고; 동일한 핵산 염기(예: A, T, C, G, I) 또는 동일한 아미노산 잔기(예: Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, GLu, Asn, Gln, Cys, 및 Met)가 양 서열에서 발생하는 위치의 수를 결정하여 일치하는 위치의 수를 얻고; 일치된 위치의 수를 비교 윈도우 내의 위치 총수(즉, 윈도우 크기)로 나누고; 그 결과에 100을 곱해서 서열 동일성의 백분율을 얻음으로써 계산될 수 있다. 일반적으로 폴리펩티드 변이체가 기준 폴리펩티드의 적어도 하나의 생물학적 활성을 유지하는 경우, 본원에 기술된 임의의 기준 서열 중 어느 하나와 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는 뉴클레오티드 및 폴리펩티드가 포함된다.
2개 이상의 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 관계를 기술하는 데 사용되는 용어는 "기준 서열", "비교 윈도우", "서열 동일성", "서열 동일성의 백분율", 및 "실질적 동일성"을 포함한다. "기준 서열"은, 뉴클레오티드 및 아미노산 잔기를 포함하여, 적어도 12개의 단량체 단위의 길이이지만, 빈번하게는 15 내지 18개, 및 종종 적어도 25개의 단량체 단위의 길이이다. 2개의 폴리뉴클레오티드는 각각 (1) 2개의 폴리뉴클레오티드들 간에 유사한 서열(즉, 완전한 폴리뉴클레오티드 서열의 단지 일부), 및 (2) 2개의 폴리뉴클레오티드들 간에 발산되는 서열을 포함할 수 있기 때문에, 2개의 (또는 그 이상의) 폴리뉴클레오티드 간의 서열 비교는 일반적으로 "비교 윈도우" 상에서 2개의 폴리뉴클레오티드의 서열을 비교하고, 서열 유사성의 국소 영역을 식별함으로써 수행된다. "비교 윈도우"는 2개의 서열이 최적으로 정렬된 후 동일한 수의 연속 위치에서 하나의 서열을 기준 서열과 비교하는 개념적 구간으로서, 적어도 6개의 연속 위치, 일반적으로는 약 50 내지 약 100개의 위치, 더 일반적으로는 약 100 내지 약 150개의 위치로 이루어진 개념적 구간을 지칭한다. 비교 윈도우는 2개의 서열의 최적 정렬을 위해 기준 서열(추가 또는 결실을 포함하지 않음)과 비교해 약 20% 이하의 추가 또는 결실(즉, 갭)을 포함할 수 있다. 비교 윈도우를 정렬하기 위한 최적의 서열 정렬은, 컴퓨터화된 알고리즘 구현예(575 Science Drive Madison, WI, USA 소재 Genetics Computer Group의 Wisconsin Genetics Software Package Release 7.0에 포함된 GAP, BESTFIT, FASTA, 및 TFASTA)에 의하거나, 선택된 다양한 방법 중 어느 하나에 의해 생성된 검사 및 최상의 정렬(즉, 비교 윈도우 상에서 가장 높은 상동성 백분율을 생성함)에 의해 수행될 수 있다. 예를 들어 Altschul 등의 문헌[1997, Nucl. Acids Res. 25:3389]에 개시된 것과 같은 BLAST 계열 프로그램을 참조할 수도 있다. 서열 분석에 대한 상세한 논의는 Ausubel 등의 문헌[Current Protocols in Molecular Biology, John Wiley & Sons Inc., 1994-1998, Chapter 15] 중 Unit 19.3에서 확인할 수 있다.
본원에서 사용되는 바와 같이, "단리된 폴리뉴클레오티드"는 자연 발생 상태에서 측면에 위치하는 서열로부터 정제된 폴리뉴클레오티드, 예를 들어, 일반적으로 단편에 인접한 서열로부터 제거된 DNA 단편을 지칭한다. 특정 구현예에서, "단리된 폴리뉴클레오티드"는 상보적 DNA(cDNA), 재조합 폴리뉴클레오티드, 합성 폴리뉴클레오티드, 또는 자연에서 존재하지 않고 사람의 손에 의해 만들어진 기타 폴리뉴클레오티드를 지칭한다. 특정 구현예에서, 단리된 폴리뉴클레오티드는 합성 폴리뉴클레오티드, 반합성 폴리뉴클레오티드, 또는 재조합 공급원으로부터 수득되거나 유래된 폴리뉴클레오티드이다.
다양한 구현예에서, 폴리뉴클레오티드는 본원에서 고려되는 폴리펩티드를 암호화하는 mRNA를 포함하며, 이에는 호밍 엔도뉴클레아제 변이체, megaTAL, 및 말단 가공 효소를 포함되지만 이들로 한정되지는 않는다. 특정 구현예에서, mRNA는 캡, 하나 이상의 뉴클레오티드, 및 폴리(A) 꼬리를 포함한다.
본원에서 사용되는 바와 같이, 용어 "5' 캡" 또는 "5' 캡 구조" 또는 "5' 캡 모이어티"는 mRNA의 5' 말단에 통합된 화학적 변형을 지칭한다. 5' 캡은 핵 내보내기, mRNA 안정성, 및 번역에 관여한다.
특정 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 5'-말단에서 전사된 mRNA 분자의 센스 뉴클레오티드와 말단 구아노신 캡 잔기 사이의 5'-ppp-5'-삼인산 결합을 포함하는 5' 캡을 포함한다. 그러면, 이러한 5'-구아닐레이트 캡이 메틸화되어 N7-메틸-구아닐레이트 잔기를 생성할 수 있다.
본원에서 고려되는 mRNA 폴리뉴클레오티드의 특정 구현예에 사용하기에 적합한 5' 캡의 예시적인 실시예는 다음을 포함하지만 이들로 한정되지는 않는다: 메틸화 5' 캡 유사체(예: G(5')ppp(5')G, G(5')ppp(5')C, G(5')ppp(5')A); 메틸화 5' 캡 유사체(예: m7G(5')ppp(5')G, m7G(5')ppp(5')C, 및 m7G(5')ppp(5')A); 이메틸화 5' 캡 유사체(예: m2,7G(5')ppp(5')G, m2,7G(5')ppp(5')C, 및 m2,7G(5')ppp(5')A); 삼메틸화 5' 캡 유사체(예: m2,2,7G(5')ppp(5')G, m2,2,7G(5')ppp(5')C, 및 m2,2,7G(5')ppp(5')A); 이메틸화 대칭 5' 캡 유사체(예: m7G(5')pppm7(5')G, m7G(5')pppm7(5')C, 및 m7G(5')pppm7(5')A); 및 역결합 방지 5' 캡 유사체(예: Anti-Reverse Cap Analog (ARCA) 캡, 지정된 3'O-Me-m7G(5')ppp(5')G, 2'O-Me-m7G(5')ppp(5')G, 2'O-Me-m7G(5')ppp(5')C, 2'O-Me-m7G(5')ppp(5')A, m72'd(5')ppp(5')G, m72'd(5')ppp(5')C, m72'd(5')ppp(5')A, 3'O-Me-m7G(5')ppp(5')C, 3'O-Me-m7G(5')ppp(5')A, m73'd(5')ppp(5')G, m73'd(5')ppp(5')C, m73'd(5')ppp(5')A 및 이들의 사인산 유도체) (예를 들어, Jemielity 등의 문헌[RNA, 9: 1108-1122 (2003)] 참조).
특정 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 5' 캡, 즉 삼인산 브릿지를 통해 제1 전사된 뉴클레오티드의 5' 말단에 연결되어 m7G(5')ppp(5')N을 생성하는 7-메틸 구아닐레이트("m7G")를 포함한다(여기서 N은 임의의 뉴클레오시드임).
일부 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 5' 캡을 포함하며, 여기서 캡은 Cap0 구조(Cap0 구조는 염기 1 및 2에 부착된 리보오스의 2'-O-메틸 잔기가 없음), Cap1 구조(Cap1 구조는 염기 2에 2'-O-메틸 잔기를 가짐), 또는 Cap2 구조(Cap2 구조는 염기 2 및 3 둘 다에 부착된 2'-O-메틸 잔기를 가짐)이다.
일 구현예에서, mRNA는 m7G(5')ppp(5')G 캡을 포함한다.
일 구현예에서, mRNA는 ARCA 캡을 포함한다.
특정 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 하나 이상의 변형된 뉴클레오시드를 포함한다.
일 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형된 뉴클레오시드를 포함한다: 슈도우리딘, 피리딘-4-온 리보뉴클레오티드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카복시메틸-우리딘, 1-카복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 디하이드로우리딘, 디하이드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 4-메톡시-2-티오-슈도우리딘, 5-아자-시티딘, 슈도시티딘, 3-메틸-시티딘, N4-아세틸시티딘, 5-프로밀시티딘, N4-메틸시티딘, 5-하이드록시메틸시티딘, 1-메틸-슈도시티딘, 피롤로-시티딘, 피롤로-슈도시티딘, 2-티오-시티딘, 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-데아자-슈도이소시티딘, 1-메틸-1-데아자-슈도이소시티딘, 제불라린(zebularine), 5-아자-제불라린, 5-메틸-제불라린, 5-아자-2-티오-제불라린, 2-티오-제불라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 4-메톡시-1-메틸-슈도이소시티딘, 2-아미노퓨린, 2,6-디아미노퓨린, 7-데아자-아데닌, 7-데아자-8-아자-아데닌, 7-데아자-2-아미노퓨린, 7-데아자-8-아자-2-아미노퓨린, 7-데아자-2,6-디아미노퓨린, 7-데아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜틸아데노신, N6-(시스-하이드록시이소펜틸)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜틸) 아데노신, N6-글리시닐카바모일아데노신, N6-트레오닐카바모일아데노신, 2-메틸티오-N6-트레오닐 카바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 2-메톡시-아데닌, 이노신, 1-메틸-이노신, 와이오신(wyosine), 와이부토신(wybutosine), 7-데아자-구아노신, 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸리노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신.
일 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형된 뉴클레오시드를 포함한다: 슈도우리딘, 피리딘-4-온 리보뉴클레오시드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카복시메틸-우리딘, 1-카복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 디하이드로우리딘, 디히드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 및 4-메톡시-2-티오-슈도우리딘.
일 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형된 뉴클레오시드를 포함한다: 5-아자-시티딘, 슈도이소시티딘, 3-메틸-시티딘, N4-아세틸시티딘, 5-포르밀시티딘, N4-메틸시티딘, 5-하이드록시메틸시티딘, 1-메틸-슈도이소시티딘, 피롤로-시티딘, 피롤로-슈도이소시티딘, 2-티오-시티딘, 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-데아자-슈도이소시티딘, 1-메틸-1-데아자-슈도이소시티딘, 제불라린, 5-아자-제불라린, 5-메틸-제불라린, 5-아자-2-티오-제불라린, 2-티오-제불라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 및 4-메톡시-1-메틸-슈도이소시티딘.
일 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형된 뉴클레오시드를 포함한다: 2-아미노푸린, 2,6-디아미노퓨린, 7-데아자-아데닌, 7-데아자-8-아자-아데닌, 7-데아자-2-아미노푸린, 7-데아자-8-아자-2-아미노푸린, 7-데아자-2,6-디아미노퓨린, 7-데아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜테닐아데노신, N6-(시스-하이드록시이소펜테닐)아데노신, 2-메틸티오-N6(시스-하이드록시이소펜테닐) 아데노신, N6-글리시닐카바모일아데노신, N6-트레오닐카바모일아데노신, 2-메틸티오-N6-트레오닐 카바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌.
일 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형된 뉴클레오시드를 포함한다: 이노신, 1-메틸-이노신, 와이오신, 와이부토신, 7-데아자-구아노신, 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸리노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신.
일 구현예에서, mRNA는 하나 이상의 슈도우리딘, 하나 이상의 5-메틸-시토신, 및/또는 하나 이상의 5-메틸-시티딘을 포함한다.
일 구현예에서, mRNA는 하나 이상의 슈도우리딘을 포함한다.
일 구현예에서, mRNA는 하나 이상의 5-메틸-시티딘을 포함한다.
일 구현예에서, mRNA는 하나 이상의 5-메틸-시토신을 포함한다.
특정 구현예에서, 호밍 엔도뉴클레아제 변이체 또는 megaTAL을 암호화하는 mRNA는 엑소뉴클레아제 분해로부터 mRNA를 보호하고, mRNA를 안정화시키고, 번역을 용이하게 하는 데 도움을 주는 폴리(A) 꼬리를 포함한다. 특정 구현예에서, mRNA는 3' 폴리(A) 꼬리 구조를 포함한다.
특정 구현예에서, 폴리(A) 꼬리의 길이는 적어도 약 10, 25, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 또는 적어도 약 500개 또는 그 이상의 아데닌 뉴클레오티드이거나 임의의 개재 수의 아데닌 뉴클레오티드이다. 특정 구현예에서, 폴리(A) 꼬리의 길이는 적어도 약 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 202, 203, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 또는 275개 또는 그 이상의 아데닌 뉴클레오티드이다.
특정 구현예에서, 폴리(A) 꼬리의 길이는 약 10 내지 약 500개의 아데닌 뉴클레오티드, 약 50 내지 약 500개의 아데닌 뉴클레오티드, 약 100 내지 약 500개의 아데닌 뉴클레오티드, 약 150 내지 약 500개의 아데닌 뉴클레오티드, 약 200 내지 약 500개의 아데닌 뉴클레오티드, 약 250 내지 약 500개의 아데닌 뉴클레오티드, 약 300 내지 약 500개의 아데닌 뉴클레오티드, 약 50 내지 약 450개의 아데닌 뉴클레오티드, 약 50 내지 약 400개의 아데닌 뉴클레오티드, 약 50 내지 약 350개의 아데닌 뉴클레오티드, 약 100 내지 약 500개의 아데닌 뉴클레오티드, 약 100 내지 약 450개의 아데닌 뉴클레오티드, 약 100 내지 약 400개의 아데닌 뉴클레오티드, 약 100 내지 약 350개의 아데닌 뉴클레오티드, 약 100 내지 약 300개의 아데닌 뉴클레오티드, 약 150 내지 약 500개의 아데닌 뉴클레오티드, 약 150 내지 약 450개의 아데닌 뉴클레오티드, 약 150 내지 약 400개의 아데닌 뉴클레오티드, 약 150 내지 약 350개의 아데닌 뉴클레오티드, 약 150 내지 약 300개의 아데닌 뉴클레오티드, 약 150 내지 약 250개의 아데닌 뉴클레오티드, 약 150 내지 약 200개의 아데닌 뉴클레오티드, 약 200 내지 약 500개의 아데닌 뉴클레오티드, 약 200 내지 약 450개의 아데닌 뉴클레오티드, 약 200 내지 약 400개의 아데닌 뉴클레오티드, 약 200 내지 약 350개의 아데닌 뉴클레오티드, 약 200 내지 약 300개의 아데닌 뉴클레오티드, 약 250 내지 약 500개의 아데닌 뉴클레오티드, 약 250 내지 약 450개의 아데닌 뉴클레오티드, 약 250 내지 약 400개의 아데닌 뉴클레오티드, 약 250 내지 약 350개의 아데닌 뉴클레오티드, 또는 약 250 내지 약 300개의 아데닌 뉴클레오티드 또는 임의의 개재 범위의 아데닌 뉴클레오티드이다.
폴리뉴클레오티드의 배향을 기술하는 용어는 5' (일반적으로 유리 인산염 기를 갖는 폴리뉴클레오티드의 말단) 및 3' (일반적으로 유리 하이드록실(OH)기를 갖는 폴리뉴클레오티드의 말단)을 포함한다. 폴리뉴클레오티드 서열은 5'에서 3' 배향 또는 3'에서 5' 배향으로 주석이 달릴 수 있다. DNA 및 mRNA의 경우, 5'에서 3' 방향으로의 가닥은 "센스", "플러스" 또는 "암호화" 가닥으로 지정되는데, 이는 그 서열이 전령 RNA 전구체(pre-mRNA)의 서열과 동일하기 때문이다[DNA에서는 티민(T)인 대신에 RNA에서는 우라실(U)인 것은 제외함]. DNA 및 mRNA의 경우, RNA 중합효소에 의해 전사된 가닥인 상보성 3'에서 5' 방향으로의 가닥은 "템플릿", "안티센스", "마이너스" 또는 "비코딩" 가닥으로 지정된다. 본원에서 사용되는 바와 같이, 용어 "역방향"은 3'에서 5' 방향으로 작성된 5'에서 3' 방향의 서열, 또는 5'에서 3' 방향으로 작성된 3'에서 5' 방향의 서열을 지칭한다.
용어 "상보성(complementary 및 complementarity)"은 염기쌍 규칙에 의해 관련된 폴리뉴클레오티드(즉, 뉴클레오티드의 서열)를 지칭한다. 예를 들어, DNA 서열 5' A G T C T G 3'의 상보성 가닥은 3' T C A G T A C 5'이다. 후자 서열은 종종 5' 말단이 좌측에 있고 3' 말단이 우측에 있는 5' C A T G A C T 3'과 역 상보체로서 쓰여진다. 역 상보체와 동일한 서열은 회문 서열(palindromic sequence)이라고 한다. 상보성은 "부분적"일 수 있으며, 여기서 핵산의 염기 중 일부만이 염기쌍 규칙에 따라 매칭된다. 또는, 핵산 간에는 "완전한" 또는 "전체" 상보성이 있을 수 있다.
특정 구현예에서 고려되는 폴리뉴클레오티드는, 본원의 다른 곳에서 기술된 바와 같이, 또는 당업계에 알려진 것과 같이, 코딩 서열 자체의 길이에 상관없이 프로모터 및/또는 인핸서, 미번역 영역(UTR), 코작 서열, 폴리아데닐화 신호, 추가 제한 효소 부위, 다중 클로닝 부위, 내부 리보솜 진입 부위(IRES), 재조합효소 인식 부위(예: LoxP, FRT, 및 Att 부위), 종결 코돈, 전사 종결 신호, 전사 후 반응 요소, 및 자가 절단 폴리펩티드를 암호화하는 폴리뉴클레오티드, 에피토프 태그 등과 같은 다른 DNA 서열과 조합될 수 있으므로, 이들의 전체 길이는 상당히 달라질 수 있다. 따라서, 거의 모든 길이의 폴리뉴클레오티드 단편이 사용될 수 있고, 전체 길이는 바람직하게는 제조의 용이성 및 의도된 재조합 DNA 프로토콜에서의 사용의 용이성에 의해 제한될 수 있는 것으로 특정 구현예에서 고려된다.
폴리뉴클레오티드는, 당업계에 공지되어 있고 이용 가능한 잘 확립된 다양한 기술 중 어느 하나를 사용하여 제조, 조작, 발현, 및/또는 전달될 수 있다. 원하는 폴리펩티드를 발현시키기 위해, 폴리펩티드를 암호화하는 뉴클레오티드 서열이 적절한 벡터 내에 삽입될 수 있다. 원하는 폴리펩티드는 폴리펩티드를 암호화하는 mRNA를 세포 내로 전달함으로써 발현될 수도 있다.
벡터의 예시적인 실시예는 플라스미드, 자율 복제 서열, 및 전이 인자(transposable element), 예를 들어, 형질 전환성 요소, 예를 들어, Sleeping Beauty, PiggyBac을 포함하지만 이에 한정되지는 않는다.
벡터의 추가 예시적인 실시예는 플라스미드, 파지미드, 코스미드, 인공 염색체(예컨대 효모 인공 염색체(YAC), 박테리아 인공 염색체(BAC), 또는 P1-유래의 인공 염색체(PAC)), 박테리오파지(예컨대 람다 파지 또는 M13 파지), 및 동물 바이러스를 포함하되 이들로 한정되지는 않는다.
벡터로서 유용한 바이러스의 예시적인 실시예는 레트로바이러스(렌티바이러스 포함), 아데노바이러스, 아데노-연관 바이러스, 헤르페스바이러스(예: 단순 포진 바이러스), 수두바이러스, 바큘로바이러스, 유두종바이러스, 및 파포바바이러스(예: SV40)를 포함하지만 이들로 한정되지는 않는다.
발현 벡터의 예시적인 실시예는 포유류 세포에서의 발현을 위한 pClneo 벡터(Promega); 포유류 세포에서의 렌티바이러스 매개 유전자 전달 및 발현을 위한 pLenti4/V5-DEST??, pLenti6/V5-DEST??, 및 pLenti6.2/V5-GW/lacZ(Invitrogen)를 포함하지만 이에 한정되지는 않는다. 특정 구현예에서, 본원에 개시된 폴리펩티드의 코딩 서열은 포유류 세포에서 폴리펩티드의 발현을 위해 이러한 발현 벡터에 결합될 수 있다.
특정 구현예에서, 벡터는 에피솜 벡터 또는 염색체외에서 유지되는 벡터이다. 본원에서 사용되는 바와 같이, 용어 "에피솜"은 숙주의 염색체 DNA로의 통합 없이 복제할 수 있고, 분열하는 숙주 세포로부터 점진적으로 소실되지 않고 복제할 수 있는 벡터를 지칭하며, 상기 벡터가 염색체외에서 또는 에피솜에서 복제한다는 것을 또한 의미한다.
발현 벡터에 존재하는 "발현 조절 서열", "제어 요소", 또는 "조절 서열"은 벡터의 비번역 영역들이며, 여기에는 전사 및 번역을 수행하기 위해 숙주 세포 단백질과 상호작용하는 5' 및 3' 비번역 영역, 복제의 기원, 선택 카세트, 프로모터, 인핸서, 번역 개시 신호(Shine Dalgarno 서열 또는 코작 서열) 인트론, 전사 후 조절 요소, 폴리아데닐화 서열 등이 포함되지만 이들로 한정되지는 않는다. 이러한 요소는 강도 및 특이성에 있어서 다를 수 있다. 사용된 벡터 시스템 및 숙주에 따라, 유비쿼터스 프로모터 및 유도성 프로모터를 포함하는 임의의 수의 적절한 전사 및 번역 요소가 사용될 수 있다.
용어 "작동 가능하게 연결된"은 기술된 성분이 의도된 방식으로 기능할 수 있게 하는 관계에 있는 병치 상태(juxtaposition)를 지칭한다. 일 구현예에서, 상기 용어는 핵산 발현 조절 서열(예를 들어, 프로모터 및/또는 인핸서)과 제2 폴리뉴클레오티드 서열(예: 관심 폴리뉴클레오티드) 간의 기능적 연결을 지칭하며, 여기서 발현 조절 서열은 제2 서열에 상응하는 핵산의 전사를 유도한다.
이종 핵산 전사체의 효율적인 종결 및 폴리아데닐화를 유도하는 요소는 이종 유전자 발현을 증가시킨다. 전사 종결 신호는 일반적으로 폴리아데닐화 신호의 하류에서 확인된다. 특정 구현예에서, 벡터는 발현될 폴리펩티드를 암호화하는 폴리뉴클레오티드의 3'에 있는 폴리아데닐화 서열을 포함한다. 본원에서 사용되는 용어 "폴리A 부위" 또는 "폴리A 서열"은 RNA 중합효소 II에 의한 초기 RNA 전사의 종결 및 폴리아데닐화 모두를 유도하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 코딩 서열의 3' 말단에 폴리A 꼬리를 첨가함으로써 mRNA 안정성을 촉진할 수 있으므로, 번역 효율의 증가에 기여한다. 절단과 폴리아데닐화는 RNA 내의 폴리(A) 서열에 의해 유도된다. 포유류 mRNA 전구체에 대한 코어 폴리(A) 서열은 절단-폴리아데닐화 부위의 측면에 위치하는 2개의 인식 요소를 갖는다. 일반적으로, 거의 불변인 AAUAAA 육량체가 U 또는 GU 잔기가 풍부한 보다 가변적인 요소로부터 상류로 20 내지 50개의 뉴클레오티드 위치에 놓인다. 초기 전사체의 절단은 이들 두 요소 사이에서 일어나고, 5' 절단 산물에 추가된 최대 250개의 아데노신에 결합된다. 특정 구현예에서, 코어 폴리(A) 서열은 이상적인 폴리A 서열이다(예: AATAAA, ATTAAA, AGTAAA). 특정 구현예에서, 폴리(A) 서열은 SV40 폴리A 서열, 소 성장 호르몬 폴리A 서열(BGHpA), 토끼 β-글로빈 폴리A 서열(rβgpA), 이들의 변이체, 또는 당업계에 공지된 다른 적절한 이종 또는 내인성 폴리A 서열이다. 특정 구현예에서, 폴리(A) 서열은 합성 서열이다.
특정 구현예에서, 하나 이상의 뉴클레아제 변이체, megaTAL, 말단 가공 효소, 또는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드는 비바이러스적인 방법 및 바이러스적인 방법 둘 다에 의해 세포 내로 도입될 수 있다.
용어 "벡터"는 또 다른 핵산 분자를 전달 또는 수송할 수 있는 핵산 분자를 지칭하도록 본원에서 사용된다. 전달된 핵산은 일반적으로 벡터 핵산 분자에 연결, 예를 들어 벡터 핵산 분자에 삽입된다. 벡터는 세포에서 자율 복제를 유도하는 서열을 포함하거나, 숙주 세포 DNA로의 통합을 허용하기에 충분한 서열을 포함할 수 있다. 특정 구현예에서, 비바이러스 벡터는 본원에서 고려되는 하나 이상의 폴리뉴클레오티드를 T 세포에 전달하는 데 사용된다.
비바이러스 벡터의 예시적인 실시예는 플라스미드(예를 들어, DNA 플라스미드 또는 RNA 플라스미드), 트랜스포존(transposon), 코스미드, 및 박테리아 인공 염색체를 포함하지만, 이에 한정되지는 않는다.
특정 구현예에서 고려되는 폴리뉴클레오티드의 비바이러스 전달의 예시적인 방법은: 전기천공, 초음파 처리, 리포펙션, 미세주입, 바이오리스틱스(biolistics), 비로좀(virosome), 리포좀, 면역리포좀, 나노입자, 폴리양이온 또는 지질:핵산 접합체, 네이키드 DNA, 인공 비리온, DEAE-덱스트란 매개 전달, 유전자총, 및 열-충격을 포함하지만, 이들로 한정되지는 않는다.
본원에서 고려되는 특정 구현예에서 사용하기에 적합한 바이러스 벡터 시스템의 예시적인 실시예는 아데노-연관 바이러스(AAV), 레트로바이러스(예: 렌티바이러스), 단순 포진 바이러스, 아데노바이러스, 및 우두 바이러스 벡터를 포함하지만, 이에 한정되지는 않는다.
B. 조성물 및 제형
특정 구현예에서 고려되는 조성물은 본원에서 고려되는 바와 같이, 열안정성 및/또는 효소 활성을 증가시키도록 조작된 하나 이상의 호밍 엔도뉴클레아제 변이체 및 megaTAL, 폴리뉴클레오티드, 이들을 포함하는 벡터, 및 게놈 편집 조성물 및 게놈 편집된 세포 조성물을 포함할 수 있다. 특정 구현예에서 고려되는 게놈 편집 조성물 및 방법은 세포 또는 세포 집단에서 인간 게놈의 표적 부위를 편집하는 데 유용하다.
"단리된 세포"는 비-자연 발생 세포, 예를 들어, 자연에서 존재하지 않는 세포, 변형된 세포, 조작된 세포, 재조합 세포 등으로서, 생체 내 조직 또는 기관으로부터 수득되었고 세포외 기질이 실질적으로 없는 세포를 지칭한다.
본원에서 사용되는 바와 같이, 용어 "세포 모집단"은 임의의 수 및/또는 동종 또는 이종 세포 유형의 조합으로 구성될 수 있는 복수의 세포를 지칭한다.
특정 구현예에서, 게놈 편집 조성물은 배아 줄기 세포 또는 성체 줄기 또는 전구 세포에서 표적 부위를 편집하는 데 사용된다.
특정 구현예에서, 게놈 편집 조성물은 중배엽 줄기 또는 전구 세포, 내배엽 줄기 또는 전구 세포, 및 외배엽 줄기 또는 전구 세포로 이루어진 군으로부터 선택된 줄기 또는 전구 세포의 표적 부위를 편집하는 데 사용된다. 중배엽 줄기 또는 전구 세포의 예시적인 예는 골수 줄기 또는 전구 세포, 탯줄 줄기 또는 전구 세포, 지방 조직 유래 줄기 또는 전구 세포, 조혈 줄기 또는 전구 세포(HSPC), 중간엽 줄기 또는 전구 세포, 근육 줄기 또는 전구 세포, 신장 줄기 또는 전구 세포, 골아세포 줄기 또는 전구 세포, 연골 세포 줄기 또는 전구 세포 등을 포함하지만 이에 한정되지는 않는다. 외배엽 줄기 또는 전구 세포의 예시적인 예는 신경 줄기 또는 전구 세포, 망막 줄기 또는 전구 세포, 피부 줄기 또는 전구 세포 등을 포함하지만 이에 한정되지는 않는다. 내배엽 줄기 또는 전구 세포의 예시적인 예는 간 줄기 또는 전구 세포, 췌장 줄기 또는 전구 세포, 상피 줄기 또는 전구 세포 등을 포함하지만 이에 한정되지는 않는다.
특정 구현예에서, 게놈 편집 조성물은 골 세포, 골 모세포(osteocyte), 지방 세포, 연골 세포, 연골 모세포, 근육 세포, 골격근 세포, 근아세포, 근세포, 평활근 세포, 방광 세포, 골수 세포, 중추신경계(CNS) 세포, 말초 신경계(PNS) 세포, 교세포, 성상세포, 뉴런, 색소 세포, 상피 세포, 피부 세포, 내피 세포, 혈관 내피 세포, 유방 세포, 결장 세포, 식도 세포, 위장 세포, 위 세포, 결장 세포, 두부 세포, 경부 세포, 검 세포, 혀 세포, 신장 세포, 간 세포, 폐 세포, 비인두 세포, 난소 세포, 난포 세포, 자궁경부 세포, 질 세포, 자궁 세포, 췌장 세포, 췌장 실질 세포, 췌장관 세포, 췌장 섬 세포, 전립선 세포, 음경 세포, 생식선 세포, 고환 세포, 조혈 세포, 림프 세포, 또는 골수 세포에서 표적 부위를 편집하는 데 사용된다.
바람직한 구현예에서, 게놈 편집 조성물은 조혈 세포, 예를 들어, 조혈 줄기 세포, 조혈 전구 세포, CD34+ 세포, 면역 효과기 세포, T 세포, NKT 세포, NK 세포 등에서 표적 부위를 편집하는 데 사용된다.
다양한 구현예에서, 본원에서 고려되는 조성물은 열안정성 및/또는 효소 활성을 증가시키도록 조작된 I-OnuI HE 변이체, 및 임의로 말단 가공 효소, 예를 들어 3'-5' 엑소뉴클레아제(Trex2)를 포함한다. I-OnuI HE 변이체는 위에서 개시된 폴리뉴클레오티드 전달 방법, 예를 들어, 전기천공, 지질 나노입자 등을 통해 세포 내로 도입되는 mRNA의 형태일 수 있다. 일 구현예에서, I-OnuI HE 변이체 또는 megaTAL, 및 임의로 3'-5' 엑소뉴클레아제를 암호화하는 mRNA를 포함하는 조성물은 위에서 개시된 폴리뉴클레오티드 전달 방법을 통해 세포에 도입된다. 조성물은 오류 유발성 NHEJ에 의해 게놈 편집된 세포 또는 게놈 편집된 세포의 집단을 생성하는 데 사용될 수 있다.
다양한 구현예에서, 본원에서 고려되는 조성물은 공여자 복구 템플릿을 포함한다. 조성물은 I-OnuI HE 변이체 및 임의로 말단 가공 효소를 발현하거나 발현하게 될 세포에 전달될 수 있다. 일 구현예에서, 조성물은 I-OnuI HE 변이체 또는 megaTAL, 및 임의로 3'-5' 엑소뉴클레아제를 발현하거나 발현하게 될 세포에 전달될 수 있다. 공여자 복구 템플릿이 있을 때 유전자 편집 효소의 발현은 HDR에 의해 게놈 편집된 세포 또는 게놈 편집된 세포의 집단을 생성하는 데 사용될 수 있다.
특정 구현예에서, 조성물은 열안정성 및/또는 효소 활성을 증가시키도록 조작된 하나 이상의 호밍 엔도뉴클레아제 변이체 및 megaTAL, 폴리뉴클레오티드, 이들을 포함하는 벡터를 함유하는 세포를 포함한다. 특정 구현예에서, 세포는 자가조직성(autologous)/자가유발성(autogeneic)("자기(self)") 또는 비자가조직성("비-자기(non-self)", 예를 들어, 동종, 동계, 또는 이종)일 수 있다. 본원에서 사용되는 바와 같이, "자가조직성(autologous)"는 동일한 대상체 유래의 세포를 지칭한다. 본원에서 사용되는 바와 같이, "동종(allogenic)"은 비교 대상 세포와 유전적으로 다른 동일한 종의 세포를 지칭한다. 본원에서 사용되는 바와 같이, "동계(syngeneic)"는 비교 대상 세포와 유전적으로 동일한 상이한 대상체의 세포를 지칭한다. 본원에서 사용되는 바와 같이, "이종(xenogeneic)"은 비교 대상 세포와 다른 종의 세포를 지칭한다. 바람직한 구현예에서, 세포는 포유류 대상체로부터 수득된다. 보다 바람직한 구현예에서, 세포는 영장류 대상체, 임의로 비인간 영장류로부터 수득된다. 가장 바람직한 구현예에서, 세포는 인간 대상체로부터 수득된다.
특정 구현예에서, 본원에서 고려되는 조성물은 세포 집단, I-OnuI HE 변이체, 및 임의로 공여자 복구 템플릿을 포함한다. 특정 구현예에서, 본원에서 고려되는 조성물은 세포 집단, I-OnuI HE 변이체, 말단 가공 효소, 및 임의로 공여자 복구 템플릿을 포함한다. I-OnuI HE 및/또는 말단 가공 효소는 위에서 개시된 폴리뉴클레오티드 전달 방법을 통해 세포 내로 도입되는 mRNA의 형태일 수 있다.
특정 구현예에서, 본원에서 고려되는 조성물은 세포 집단, 효소의 열안정성 및/또는 활성을 증가시키도록 조작된 I-OnuI HE 변이체 또는 megaTAL, 및 임의로 공여자 복구 템플릿을 포함한다. 특정 구현예에서, 본원에서 고려되는 조성물은 세포 집단, I-OnuI HE 변이체 또는 megaTAL, 3'-5' 엑소뉴클레아제, 및 임의로 공여자 복구 템플릿을 포함한다. I-OnuI HE 변이체, megaTAL, 및/또는 3'-5' 엑소뉴클레아제는 위에서 개시된 폴리뉴클레오티드 전달 방법을 통해 세포 내로 도입되는 mRNA의 형태일 수 있다.
본 명세서에 인용된 모든 간행물, 특허 출원, 및 발행된 특허는 각각의 개별 간행물, 특허 출원, 또는 발행된 특허가 구체적으로 그리고 개별적으로 참조에 의해 포함되는 것으로 표시된 것처럼 본원에 참조로서 통합된다.
전술한 구현예들은 이해를 밝힐 목적으로 예시 및 실시예로서 일부 상세히 기술되었지만, 첨부된 청구범위의 사상 또는 범주로부터 벗어나지 않고도 소정의 변경 및 변형이 이루어질 수 있다는 것이 본원에서 고려된 교시에 비추어 당업자에게 쉽게 명백해질 것이다. 하기 실시예들은 단지 예시로서 제공되며, 제한하기 위한 것은 아니다. 당업자는 본질적으로 유사한 결과를 얻기 위해 변경되거나 수정될 수 있는 중요하지 않은 다양한 파라미터를 쉽게 인식할 것이다.
실시예
실시예 1
열안정성을 증가시키는 LADLIDADG 호밍 엔도뉴클레아제에서의
아미노산 위치의 식별
효모 표면 디스플레이 검정을 사용해 LAGLIDADG 호밍 엔도뉴클레아제의 열안정성을 증가시키는 돌연변이를 식별하였다. 먼저, I-OnuI(예: 서열번호 1) 및 조작된 뉴클레아제(예: 서열번호 6 및 7)의 안정성을 측정하였다. 효모에서 뉴클레아제 표면 발현을 유도한 후, 각 효모 집단을 대상으로 15분 동안 여러 온도에서 열충격을 가하고, 여전히 그의 DNA 표적을 절단할 수 있는 뉴클레아제 발현 세포의 백분율을 유세포 계측법으로 측정하였다. 이 검정은 각 엔도뉴클레아제별로 연관된 TM50 값으로 표준 단백질 용융 곡선을 생성한다. 도 1.
안정성을 증가시키는 돌연변이를 식별하기 위해, 다수의 I-OnuI 유래 호밍 엔도뉴클레아제를 대상으로 전체 개방 해독 프레임에 걸쳐 PCR을 통해 무작위 돌연변이 유발을 수행하였다. 이들 돌연변이체 라이브러리를 효모에서 발현시키고, 라이브러리의 TM50 이상에서 열충격 후 활성 뉴클레아제 활동에 대해 분류하였다. 2회의 분류 후, HE 변이체를 PacBio 또는 생어 시퀀싱으로 시퀀싱하여 각 위치에서 돌연변이의 동일성 및 빈도를 결정하였다. 누적 돌연변이 빈도는 적층된 막대 그래프로서 도 2에 도시되어 있고, 각 위치에서 가장 많은 돌연변이는 표 2에 표시되어 있다. 도 3a는 BCL11A(서열번호 8)를 표적으로 하는 부모 I-OnuI HE 변이체, 열안정성에 영향을 미치는 단일 아미노산 치환을 갖는 I-OnuI HE 변이체(서열번호 9-12), 및 무작위 돌연변이 유발로 생성되고 개별 변이체보다 전반적인 TM50이 약간 더 높은 대표적인 I-OnuI HE 변이체(서열번호 13)에 대한 열안정성을 보여준다. 도 3a
실시예 2
조합 I-OnuI HE 안정화 돌연변이는
열안정성을 증가시킨다  
I-OnuI HE 변이체 열안정성을 추가로 증가시키기 위해, 가장 빈번하게 돌연변이된 아미노산 위치를 단일 라이브러리로 조합하였다. BCL11A I-OnuI HE 변이체(서열번호 8)로 시작하여, 잔기 14, 153, 156, 168, 178, 208, 261, 및 300을 퇴화 코돈 및 PCR을 사용해 돌연변이시켰다(하위군 1 돌연변이체 라이브러리). 복제가 상대적으로 용이한 46℃의 온도에서 이러한 라이브러리를 분류함으로써 무작위 돌연변이체 라이브러리의 산물보다 10℃ 더 안정한 변이체 모집단을 생성하였다(도 3b). 하위군 1 돌연변이체 라이브러리(A5, 서열번호 14)로부터의 하나의 대표적인 BCL11A I-OnuI HE 변이체는 부모 I-OnuI HE 변이체와 비교하여 예상치 못한 22℃의 열안정성 증가를 나타냈다(도 3c). 무작위 돌연변이 유발 또는 유도된 돌연변이 유발 중 어느 하나로 유래된 조합 돌연변이는 I-Onu HE 변이체 열안정성을 증가시킨다.
실시예 3
열안정성을 증가시키는 돌연변이는
I-OnuI 변이체 간에 전달될 수 있다
안정화 돌연변이가 리프로그래밍된 각각의 I-OnuI HE 변이체에 대해 고유한지 여부 또는 안정화 돌연변이가 효소 간에 전달될 수 있는지 여부를 결정하기 위해, BCL11A A5 I-OnuI HE 변이체(서열번호 14)에서 유래된 돌연변이를 PDCD-1(서열번호 6), TCRα(서열번호 7), 또는 CBLB(서열번호 15)를 표적으로 하는 I-OnuI HE 변이체에게 전달하였다. 이들 돌연변이에 의해, 인간 PDCD-1 유전자를 표적으로 하는 I-OnuI HE 변이체(서열번호 16)의 TM50은 16℃만큼 증가하였고, 인간 TCRα 유전자를 표적으로 하는 I-OnuI HE 변이체(서열번호 17)의 TM50은 약 14℃만큼 증가하였고, 인간 CBLB 유전자를 표적으로 하는 I-OnuI HE 변이체(서열번호 18)의 TM50은 19℃만큼 증가하였다. 도 4a 내지 도 4c. 열안정성을 증가시키는 돌연변이는 상이한 I-OnuI HE 변이체들 간에 전달될 수 있었다.
실시예 4
증가된 열안정성은 I-OnuI 변이체 발현의
지속시간을 증가시킨다  
I-OnuI HE 변이체 열안정성은 또한 293T 세포에서 효소의 발현을 측정함으로써 평가하였다. 요약하자면, 각각의 I-OnuI HE 변이체를 c-말단 HA 태그에 이어서 형질감염 효율을 추적하기 위한 T2A GFP를 갖는 mRNA로서 포맷하였다(도 5a). mRNA를 시험관 내 전사에 의해 제조하고, 역결합 방지 캡 유사체로 공-전사에 의해 캡핑하고, 폴리(A) 중합효소를 이용해 효소적으로 폴리아데닐화하였다. mRNA를 정제하고, 동일한 양을 293T 세포(단백질 서열번호 2, 8, 14: mRNA 서열번호 19-21) 내로 전기천공하였다. 각각의 시점에, 세포를 대상으로 세포 계측을 수행하여 GFP 발현을 측정했을 뿐 아니라, 웨스턴 블롯 분석을 위해 용해시키고 동결시켰다.
GFP 단백질 발현에 대한 동역학은 각 폴리시스트론 mRNA 별로 유사하였지만; HA 태그된 HE 단백질의 양은 달랐다(도 5b 및 도 5c). 전기천공 후 4시간차에, 안정화된 BCL11A A5 HE 단백질의 양은, 액틴 로딩 대조군에 대해 정규화했을 때, 부모 BCL11A HE 단백질의 양에 비해 유의하게 높았다. 또한, 나중 시점에(예를 들어, 21시간차에), 부모 BCL11A HE 단백질의 양은 검출할 수 없었지만; 대조적으로, BCL11A A5 HE 변이체는 여전히 그의 피크 발현 수준에 근접하였다. 전체적으로, 안정화된 BCL11A A5 HE 변이체는 부모 HE의 거의 2배에 가까운 시간 동안 세포 내에 존재하였다.
실시예 5
열안정성을 증가시키도록 조작된 I-OnuI HE 변이체는
증가된 촉매 활성을 나타낸다  
안정화 돌연변이가 PDCD-1 편집에 미치는 효과는 안정화 돌연변이가 결여된 부모 megaTAL(서열번호 22)의 편집 속도를 안정화 돌연변이를 포함하는 megaTAL(서열번호 23)과 비교함으로써 측정하였다. megaTAL mRNA는 시험관내 전사에 의해 제조하고, 역결합 방지 캡 유사체(ARCA)로 공-전사에 의해 캡핑하고, 폴리(A) 중합효소를 이용해 효소적으로 폴리아데닐화하였다. 정제된 mRNA를 사용해 일차 인간 T 세포에서 PDCD-1 편집 효율을 측정하였다.
2명의 공여자 유래의 일차 인간 말초 혈액 단핵 세포(PBMC)를 항-CD3 및 항-CD28 항체로 활성화시키고 250U IL-2의 존재 하에 배양하였다. 활성화 후 3일차에 세포를 megaTAL mRNA와 함께 전기천공하였다. 형질감염된 T 세포를 추가로 7~10일 동안 증식시키고, PDCD-1 표적 부위에 대한 시퀀싱 및 분해에 의한 인델 추적(Tracking of Indels by Decomposition, TIDE, Brinkman 등의 2014 문헌 참조)을 사용해 편집 효율을 측정하였다(도 6). 안정화 돌연변이가 없는 경우, PDCD-1 megaTAL은 낮은 수준의 편집(<20%)을 나타냈고; 안정화된 PDCD-1 megaTAL은 편집 활성을 거의 80%까지 증가시켰다.
일반적으로, 다음의 청구범위에서, 사용된 용어는 청구범위를 본 명세서 및 청구범위에 개시된 특정 구현예로 제한하는 것으로 해석되어서는 안되며, 이러한 청구범위가 부여되는 등가물의 전체 범위와 함께 모든 가능한 구현예를 포함하는 것으로 해석되어야 한다. 따라서, 청구범위는 본 개시에 의해 제한되지 않는다.
SEQUENCE LISTING <110> bluebird bio, Inc. Jarjour, Jordan Havens, Kyle Chrysostomou, Constantine <120> HOMING ENDONUCLEASE VARIANTS <130> IPA210833-US <150> US 62/777,476 <151> 2018-12-10 <160> 59 <170> PatentIn version 3.5 <210> 1 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <400> 1 Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Met Leu Phe Lys Gln 100 105 110 Ala Phe Cys Val Met Glu Asn Lys Glu His Leu Lys Ile Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Ile Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 290 295 300 <210> 2 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <400> 2 Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 290 295 300 <210> 3 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <220> <221> MOD_RES <222> (1)..(3) <223> Any amino acid or absent <400> 3 Xaa Xaa Xaa Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 290 295 300 <210> 4 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <220> <221> MOD_RES <222> (1)..(4) <223> Any amino acid or absent <220> <221> MOD_RES <222> (302)..(303) <223> Any amino acid or absent <400> 4 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 5 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <220> <221> MOD_RES <222> (302)..(303) <223> Any amino acid or absent <400> 5 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 6 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 6 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg 20 25 30 Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala 165 170 175 Gly Asp Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala 180 185 190 Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile 210 215 220 Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 7 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 7 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn Ala 20 25 30 Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile Val 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu Gln 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro Val 180 185 190 Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile 210 215 220 Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 8 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 8 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn Ala 20 25 30 Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile Val 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu Gln 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro Val 180 185 190 Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile 210 215 220 Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 9 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 9 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Val Leu Ser Ile Gln Asn Arg 20 25 30 Asn Asp Tyr Ala Thr Gly Tyr Arg Ile His Leu Thr Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Asn Asn Thr Gly Asp Asn Leu Val Gln Leu Arg 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Ser Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 10 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 10 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Thr Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Val Leu Ser Ile Gln Asn Arg 20 25 30 Asn Asp Tyr Ala Thr Gly Tyr Arg Ile His Leu Thr Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Asn Asn Thr Gly Asp Asn Leu Val Gln Leu Arg 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 11 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 11 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Val Leu Ser Ile Gln Asn Arg 20 25 30 Asn Asp Tyr Ala Thr Gly Tyr Arg Ile His Leu Thr Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Asn Asn Thr Gly Asp Asn Leu Val Gln Leu Arg 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Ile Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 12 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 12 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Val Leu Ser Ile Gln Asn Arg 20 25 30 Asn Asp Tyr Ala Thr Gly Tyr Arg Ile His Leu Thr Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Asn Asn Thr Gly Asp Asn Leu Val Gln Leu Arg 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Ala Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 13 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 13 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Val Leu Ser Ile Gln Asn Arg 20 25 30 Asn Asp Tyr Ala Thr Gly Tyr Arg Ile His Leu Thr Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Asn Asn Thr Gly Asp Asn Leu Val Gln Leu Arg 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Arg Leu Val Phe Glu Ile Ser Gln His Val Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Ile Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Ala Lys His Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 14 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 14 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Thr Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Val Leu Ser Ile Gln Asn Arg 20 25 30 Asn Asp Tyr Ala Thr Gly Tyr Arg Ile His Leu Thr Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Asn Asn Thr Gly Asp Asn Leu Val Gln Leu Arg 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 290 295 300 <210> 15 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg 20 25 30 Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Met 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val Ser Leu Val 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 290 295 300 <210> 16 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 16 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Thr Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg 20 25 30 Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Met 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val Ser Leu Val 65 70 75 80 Val Tyr Ala Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 290 295 300 <210> 17 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 17 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Thr Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg 20 25 30 Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly Phe Thr Ala 165 170 175 Gly Asp Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala 180 185 190 Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile 210 215 220 Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 290 295 300 <210> 18 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - reprogrammed I-OnuI LHE thermostable variant <220> <221> MOD_RES <222> (1)..(8) <223> Any amino acid or absent <400> 18 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Thr Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn Ala 20 25 30 Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile Val 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu Gln 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro Val 180 185 190 Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile 210 215 220 Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 290 295 300 <210> 19 <211> 1743 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - BCL11A I-OnuI HE variant codon optimized mRNA <400> 19 augggaucac cgccuaagaa gaagagaaaa gugucgagaa gggaaucaau uaacccuugg 60 auccugaccg gcuucgccga cgccgagggg ucauuccucc uccgcauucg caauaauaac 120 aagaguagcg uaggcuacuc uacugagcug ggcuuccaga uuacccucca caacaaggac 180 aagaguaucc uggaaaacau ccagucgacu uggaaggugg gcguaauagc uaacagugga 240 gacaacgcug ugucacucaa agucaccagg uucgaggacc ugaaggugau cauugaccac 300 uucgagaagu acccacugau cacucagaag cugggugacu acaagcuguu caagcaagca 360 uuuucgguga uggagaacaa agagcaccug aaggaaaaug gaauuaagga acuugugcgc 420 aucaaggcca aguugaacug gggacuuacg gaugagcuca agaaagcguu uccugaaaac 480 aucucgaaag agaggagucu gauuaacaag aauaucccua acuucaagug gcuggccggg 540 uucacguccg gggaaggaug cuuuuucguc aaccucauaa aaagcaaguc uaaacuugga 600 gugcaagugc agcugguguu uucaaucacu caacacauca aagacaagaa ccucaugaac 660 ucgcucauca ccuaccuggg uugcggauau aucaaagaga aaaacaaguc agaauuuucc 720 uggcuggauu ucguggugac aaaguucagc gacaucaacg acaagaucau cccgguguuc 780 caggagaaca cccucaucgg cgugaagcug gaggacuucg aagauuggug caagguggcg 840 aagcuuaucg aagaaaagaa gcaccugacc gaguccggac uggacgagau caagaagauc 900 aaacugaaca ugaacaaggg ccggagauau ccauacgaug ucccagauua ugcgcucgag 960 aguggggaag gucgcggcuc cuugcucacc uguggggaug ucgaagaaaa cccagguccc 1020 gcuagcguga gcaagggcga ggagcuguuc accggggugg ugcccauccu ggucgagcug 1080 gacggcgacg uaaacggcca caaguucagc guguccggcg agggcgaggg cgaugccacc 1140 uacggcaagc ugacccugaa guucaucugc accaccggca agcugcccgu gcccuggccc 1200 acccucguga ccacccugac cuacggcgug cagugcuuca gccgcuaccc cgaccacaug 1260 aagcagcacg acuucuucaa guccgccaug cccgaaggcu acguccagga gcgcaccauc 1320 uucuucaagg acgacggcaa cuacaagacc cgcgccgagg ugaaguucga gggcgacacc 1380 cuggugaacc gcaucgagcu gaagggcauc gacuucaagg aggacggcaa cauccugggg 1440 cacaagcugg aguacaacua caacagccac aacgucuaua ucauggccga caagcagaag 1500 aacggcauca aggugaacuu caagauccgc cacaacaucg aggacggcag cgugcagcuc 1560 gccgaccacu accagcagaa cacccccauc ggcgacggcc ccgugcugcu gcccgacaac 1620 cacuaccuga gcacccaguc cgcccugagc aaagacccca acgagaagcg cgaucacaug 1680 guccugcugg aguucgugac cgccgccggg aucacucucg gcauggacga gcuguacaag 1740 uga 1743 <210> 20 <211> 1743 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - BCL11A I-OnuI HE variant mRNA <400> 20 augggaucac cgccuaagaa gaagagaaaa gugucgagaa gggaauccau caacccaugg 60 auucugacug guuucgcuga ugccgaagga agcuucgugc uaaguaucca aaacagaaac 120 gauuaugcua cugguuacag aauucaccug acauuccaaa ucacccugca caacaaggac 180 aaaucgauuc uggagaauau ccagucgacu uggaaggucg gcaaaaucaa uaacacgggc 240 gacaaccucg uccaacugag agucuaccgu uucgaagauu ugaaagugau uaucgaccac 300 uucgagaaau auccgcugau aacacagaaa uugggcgauu acaaguuguu uaaacaggca 360 uucagcguca uggagaacaa agaacaucuu aaggagaaug ggauuaagga gcucguacga 420 aucaaagcua agaugaauug gggucucaau gacgaauuga aaaaagcauu uccagagaac 480 auuagcaaag agcgcccccu uaucaauaag aacauuccga auuucaaaug gcuggcugga 540 uucacaucug gugauggcuc cuucuucgug cgccuaagaa agucuaaugu uaaugcuaga 600 guacgugugc aacugguauu cgagaucuca cagcacauca gagacaagaa ccugaugaau 660 ucauugauaa cauaccuagg cuguggucac aucuacgagg gaaacaaauc ugagcgcagu 720 uggcuccaau ucagaguaga aaaauucagc gauaucaacg acaagaucau uccgguauuc 780 caggaaaaua cucugauugg cgucaaacuc gaggacuuug aagauuggug caagguugcc 840 aaauugaucg aagagaagaa acaccugacc gaauccgguu uggaugagau uaagaaaauc 900 aagcugaaca ugaacaaagg ucguagauau ccauacgaug ucccagauua ugcgcucgag 960 aguggggaag gucgcggcuc cuugcucacc uguggggaug ucgaagaaaa cccagguccc 1020 gcuagcguga gcaagggcga ggagcuguuc accggggugg ugcccauccu ggucgagcug 1080 gacggcgacg uaaacggcca caaguucagc guguccggcg agggcgaggg cgaugccacc 1140 uacggcaagc ugacccugaa guucaucugc accaccggca agcugcccgu gcccuggccc 1200 acccucguga ccacccugac cuacggcgug cagugcuuca gccgcuaccc cgaccacaug 1260 aagcagcacg acuucuucaa guccgccaug cccgaaggcu acguccagga gcgcaccauc 1320 uucuucaagg acgacggcaa cuacaagacc cgcgccgagg ugaaguucga gggcgacacc 1380 cuggugaacc gcaucgagcu gaagggcauc gacuucaagg aggacggcaa cauccugggg 1440 cacaagcugg aguacaacua caacagccac aacgucuaua ucauggccga caagcagaag 1500 aacggcauca aggugaacuu caagauccgc cacaacaucg aggacggcag cgugcagcuc 1560 gccgaccacu accagcagaa cacccccauc ggcgacggcc ccgugcugcu gcccgacaac 1620 cacuaccuga gcacccaguc cgcccugagc aaagacccca acgagaagcg cgaucacaug 1680 guccugcugg aguucgugac cgccgccggg aucacucucg gcauggacga gcuguacaag 1740 uga 1743 <210> 21 <211> 1743 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - BCL11A I-OnuI HE A5 variant mRNA <400> 21 augggaucac cgccuaagaa gaagagaaaa gugucgagaa gggaauccau caacccaugg 60 acucugacug guuucgcuga ugccgaagga agcuucgugc uaaguaucca aaacagaaac 120 gauuaugcua cugguuacag aauucaccug acauuccaaa ucacccugca caacaaggac 180 aaaucgauuc uggagaauau ccagucgacu uggaaggucg gcaaaaucaa uaacacgggc 240 gacaaccucg uccaacugag agucuaccgu uucgaagauu ugaaagugau uaucgaccac 300 uucgagaaau auccgcugau aacacagaaa uugggcgauu acaaauuguu uaaacaggca 360 uucagcguca uggagaacaa agaacaucuu aaggagaaug ggauuaagga gcucguacga 420 aucaaagcua agaugaauug gggucucaau gacgaauuga aaaaagcauu uccagaggug 480 auuagcaggg agcgcccccu uaucaauaag aacauuccga augggaaaug gcuggcugga 540 uucacaucug gugauggcuc cuucuucgug cgccuaagaa agucuaaugu uaaugcuaga 600 guacgugugc aacugguauu cgagaucuca cagcacauca gagauaagaa ccugaugaau 660 ucauugauaa cauaccuagg cuguggucac aucuacgagg gaaacaaauc ugagcgcucu 720 uggcuccaau ucagaguaga aaaauucagc gauaucaaug acaagaucau uccgguauuc 780 caggaaaaua cucugauugg caugaaacuc gaggacuuug aagauuggug caagguugcc 840 aaauugaucg aagagaagaa acaccugacc gaauccgguu uggaugagau uaagaaaauc 900 aagcugaaca ugaacaaaag acguagauau ccauacgaug ucccagauua ugcgcucgag 960 aguggggaag gucgcggcuc cuugcucacc uguggggaug ucgaagaaaa cccagguccc 1020 gcuagcguga gcaagggcga ggagcuguuc accggggugg ugcccauccu ggucgagcug 1080 gacggcgacg uaaacggcca caaguucagc guguccggcg agggcgaggg cgaugccacc 1140 uacggcaagc ugacccugaa guucaucugc accaccggca agcugcccgu gcccuggccc 1200 acccucguga ccacccugac cuacggcgug cagugcuuca gccgcuaccc cgaccacaug 1260 aagcagcacg acuucuucaa guccgccaug cccgaaggcu acguccagga gcgcaccauc 1320 uucuucaagg acgacggcaa cuacaagacc cgcgccgagg ugaaguucga gggcgacacc 1380 cuggugaacc gcaucgagcu gaagggcauc gacuucaagg aggacggcaa cauccugggg 1440 cacaagcugg aguacaacua caacagccac aacgucuaua ucauggccga caagcagaag 1500 aacggcauca aggugaacuu caagauccgc cacaacaucg aggacggcag cgugcagcuc 1560 gccgaccacu accagcagaa cacccccauc ggcgacggcc ccgugcugcu gcccgacaac 1620 cacuaccuga gcacccaguc cgcccugagc aaagacccca acgagaagcg cgaucacaug 1680 guccugcugg aguucgugac cgccgccggg aucacucucg gcauggacga gcuguacaag 1740 uga 1743 <210> 22 <211> 944 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - engineered PDCD-1 megaTAL <400> 22 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 530 535 540 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 545 550 555 560 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 565 570 575 Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala 580 585 590 Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro 595 600 605 Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile 610 615 620 Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala 625 630 635 640 Ile Ser Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp 645 650 655 Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile 660 665 670 Leu Asn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe 675 680 685 Thr Ile Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln 690 695 700 Ser Thr Trp Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val 705 710 715 720 Ser Leu Val Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His 725 730 735 Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu 740 745 750 Phe Lys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu 755 760 765 Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly 770 775 780 Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu 785 790 795 800 Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly 805 810 815 Phe Thr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn 820 825 830 Val Asn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His 835 840 845 Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys 850 855 860 Gly His Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe 865 870 875 880 Arg Val Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe 885 890 895 Gln Glu Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp 900 905 910 Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser 915 920 925 Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 930 935 940 <210> 23 <211> 944 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - engineered PDCD-1 megaTAL <400> 23 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 530 535 540 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 545 550 555 560 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 565 570 575 Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala 580 585 590 Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro 595 600 605 Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile 610 615 620 Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala 625 630 635 640 Ile Ser Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp 645 650 655 Thr Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile 660 665 670 Leu Asn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe 675 680 685 Thr Ile Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln 690 695 700 Ser Thr Trp Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val 705 710 715 720 Ser Leu Val Val Tyr Ala Phe Glu Asp Leu Lys Val Ile Ile Asp His 725 730 735 Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu 740 745 750 Phe Lys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu 755 760 765 Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly 770 775 780 Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu 785 790 795 800 Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly 805 810 815 Phe Thr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn 820 825 830 Val Asn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His 835 840 845 Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys 850 855 860 Gly His Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe 865 870 875 880 Arg Val Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe 885 890 895 Gln Glu Asn Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp 900 905 910 Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser 915 920 925 Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 930 935 940 <210> 24 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 24 Gly Gly Gly 1 <210> 25 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 25 Asp Gly Gly Gly Ser 1 5 <210> 26 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 26 Thr Gly Glu Lys Pro 1 5 <210> 27 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 27 Gly Gly Arg Arg 1 <210> 28 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 28 Gly Gly Gly Gly Ser 1 5 <210> 29 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 29 Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp 1 5 10 <210> 30 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 30 Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser 1 5 10 15 Leu Asp <210> 31 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 31 Gly Gly Arg Arg Gly Gly Gly Ser 1 5 <210> 32 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 32 Leu Arg Gln Arg Asp Gly Glu Arg Pro 1 5 <210> 33 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 33 Leu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg Pro 1 5 10 <210> 34 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 34 Leu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg Pro 1 5 10 15 <210> 35 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Cleavage sequence by TEV protease <220> <221> misc_feature <222> (2)..(3) <223> Xaa is any amino acid <220> <221> misc_feature <222> (5)..(5) <223> Xaa is any amino acid <220> <221> MISC_FEATURE <222> (7)..(7) <223> Xaa = Gly or Ser <400> 35 Glu Xaa Xaa Tyr Xaa Gln Xaa 1 5 <210> 36 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Cleavage sequence by TEV protease <400> 36 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 37 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Cleavage sequence by TEV protease <400> 37 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 38 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 38 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 39 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 39 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 40 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 40 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro 1 5 10 <210> 41 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 41 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 42 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 42 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 43 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 43 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 1 5 10 <210> 44 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 44 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 45 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 45 Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 46 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 46 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 47 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 47 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 48 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 48 Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val 1 5 10 15 Glu Ser Asn Pro Gly Pro 20 <210> 49 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 49 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 50 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 50 Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn 1 5 10 15 Pro Gly Pro <210> 51 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 51 Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn 1 5 10 15 Pro Gly Pro <210> 52 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 52 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 53 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 53 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 1 5 10 15 Pro <210> 54 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 54 Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 55 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 55 Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly 1 5 10 15 Asp Val Glu Ser Asn Pro Gly Pro 20 <210> 56 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 56 Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro 1 5 10 15 Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys 20 25 30 Ile Val Ala Pro Val Lys Gln Thr 35 40 <210> 57 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 57 Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro 1 5 10 15 Gly Pro <210> 58 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 58 Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val 1 5 10 15 Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly 20 25 30 Asp Val Glu Ser Asn Pro Gly Pro 35 40 <210> 59 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 59 Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu 1 5 10 15 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 20 25 30 Pro

Claims (96)

  1. 서열번호 1에 제시된 아미노산 서열을 포함하는 부모 I-OnuI 호밍 엔도뉴클레아제(HE)에 비해 하나 이상의 아미노산 치환을 포함하는 I-OnuI HE 변이체로서, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  2. 제1항에 있어서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: I14, A19, V116, F168, D208, N246, 및 L263.
  3. 제1항에 있어서, I-OnuI HE 변이체는 다음의 아미노산 위치에서 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, F168, D208, 및 N246.
  4. 제1항에 있어서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: K108, K156, S176, E231, V261, E277, 및 G300.
  5. 제1항에 있어서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  6. 제1항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
  7. 제1항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하고: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  8. 제1항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
  9. 제1항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하고: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 10℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  11. 제1항 내지 제9항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 15℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  12. 제1항 내지 제9항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 20℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  13. 제1항 내지 제9항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 25℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 유전자 내의 부위를 표적으로 하는, I-OnuI HE 변이체: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
  15. 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  16. 제15항에 있어서, 부모 I-OnuI HE 아미노산 서열은 서열 번호 1에 제시되는, I-OnuI HE 변이체.
  17. 제15항 또는 제16항에 있어서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: I14, A19, V116, F168, D208, N246, 및 L263.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음의 아미노산 위치에서 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, F168, D208, 및 N246.
  19. 제17항 또는 제18항에 있어서, I14로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: S, N, M, K, F, D, T, 및 V.
  20. 제17항 또는 제18항에 있어서, I14로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: T 및 V.
  21. 제17항 또는 제18항에 있어서, A19로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: C, D, I, L, S, T 및 V.
  22. 제17항 또는 제18항에 있어서, A19로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: T 및 V.
  23. 제17항에 있어서, V116으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: F, D, A, L 및 I.
  24. 제17항에 있어서, V116으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: L 및 I.
  25. 제17항 또는 제18항에 있어서, F168으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: H, Y, I, V, P, L 및 S.
  26. 제17항 또는 제18항에 있어서, F168으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: L 및 S.
  27. 제17항 또는 제18항에 있어서, D208로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: N, V, Y, 및 E.
  28. 제17항 또는 제18항에 있어서, D208로 치환된 아미노산은 E인, I-OnuI HE 변이체:
  29. 제17항 또는 제18항에 있어서, N246으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: H, I, D, R, S, T, V, Y, 및 K.
  30. 제17항 또는 제18항에 있어서, N246으로 치환된 아미노산은 K인, I-OnuI HE 변이체.
  31. 제17항에 있어서, L263으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: H, F, P, T, V, 및 R.
  32. 제17항에 있어서, L263으로 치환된 아미노산은 R인, I-OnuI HE 변이체.
  33. 제15항 또는 제16항에 있어서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: K108, K156, S176, E231, V261, E277, 및 G300.
  34. 제33항에 있어서, K108로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: E, N, Q, R, T, V, 및 M.
  35. 제33항에 있어서, K108로 치환된 아미노산은 M인, I-OnuI HE 변이체.
  36. 제33항에 있어서, K156로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: N, Q, R, T, V, I, 및 E.
  37. 제33항에 있어서, K156로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: I 및 E.
  38. 제33항에 있어서, S176으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: P, N, 및 A.
  39. 제33항에 있어서, S176으로 치환된 아미노산은 A인, I-OnuI HE 변이체.
  40. 제33항에 있어서, E231로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: D, K, V, 및 G.
  41. 제33항에 있어서, E231로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: K 및 G.
  42. 제33항에 있어서, V261로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: D, G, I, L, S, T, 및 A.
  43. 제33항에 있어서, V261로 치환된 아미노산은 A인, I-OnuI HE 변이체.
  44. 제33항에 있어서, E277로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: A, D, G, Q, V, 및 K.
  45. 제33항에 있어서, E277로 치환된 아미노산은 K인, I-OnuI HE 변이체.
  46. 제33항에 있어서, G300으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: S, V, D, C, 및 R.
  47. 제33항에 있어서, G300으로 치환된 아미노산은 R인, I-OnuI HE 변이체.
  48. 제15항 또는 제16항에 있어서, 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  49. 제48항에 있어서, N31로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: D, H, I, R, K, S, T, 및 Y.
  50. 제48항에 있어서, N31로 치환된 아미노산은 K인, I-OnuI HE 변이체.
  51. 제48항에 있어서, N33으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: D, G, H, I, K, S, T, 및 Y.
  52. 제48항에 있어서, N33으로 치환된 아미노산은 K인, I-OnuI HE 변이체.
  53. 제48항에 있어서, K52로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: Q, R, T, Y, N, E, 및 M.
  54. 제48항에 있어서, K52로 치환된 아미노산은 M인, I-OnuI HE 변이체.
  55. 제48항에 있어서, Y97로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: F, N, 및 H.
  56. 제48항에 있어서, Y97로 치환된 아미노산은 F인, I-OnuI HE 변이체.
  57. 제48항에 있어서, K124로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: E, N, R, 및 T.
  58. 제48항에 있어서, K124로 치환된 아미노산은 N인, I-OnuI HE 변이체.
  59. 제48항에 있어서, K147로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: E, I, N, R, 및 T.
  60. 제48항에 있어서, K147로 치환된 아미노산은 I인, I-OnuI HE 변이체.
  61. 제48항에 있어서, I153으로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: D, H, K, T, Y, S, V, 및 N.
  62. 제48항에 있어서, I153으로 치환된 아미노산은 N인, I-OnuI HE 변이체.
  63. 제48항에 있어서, K209로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: E, M, N, Q, 및 R.
  64. 제48항에 있어서, K209로 치환된 아미노산은 R인, I-OnuI HE 변이체.
  65. 제48항에 있어서, E264로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: A, D, G, K, Q, R, 및 V.
  66. 제48항에 있어서, E264로 치환된 아미노산은 K인, I-OnuI HE 변이체.
  67. 제48항에 있어서, D268로 치환된 아미노산은 다음으로 이루어진 군으로부터 선택되는, I-OnuI HE 변이체: A, E, G, H, N, V, 및 Y.
  68. 제48항에 있어서, D268으로 치환된 아미노산은 N인, I-OnuI HE 변이체.
  69. 제15항 내지 제68항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 3개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체.
  70. 제15항 내지 제68항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 5개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체.
  71. 제15항 또는 제16항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
  72. 제15항 또는 제16항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하고: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  73. 제15항 또는 제16항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
  74. 제15항 또는 제16항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하고: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  75. 제15항 내지 제74항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 10℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  76. 제15항 내지 제74항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 15℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  77. 제15항 내지 제74항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 20℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  78. 제15항 내지 제74항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 25℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  79. 제15항 내지 제78항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 유전자 내의 부위를 표적으로 하는, I-OnuI HE 변이체: HBA, HBB, HBG1, HBG2, BCL11A, PCSK9, TCRA, TCRB, B2M, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, CIITA, AHR, PD-1, CTLA4, TIGIT, TGFBR2, LAG-3, TIM-3, BTLA, IL4R, IL6R, CXCR1, CXCR2, IL10R, IL13Rα2, TRAILR1, RCAS1R, 및 FAS.
  80. 인간 BCL11A 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  81. 인간 PCSK9 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  82. 인간 PDCD-1 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  83. 인간 TCRα 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  84. 인간 CBLB 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  85. 인간 CTLA-4 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  86. 인간 TGFβRII 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  87. 인간 TIM3 유전자에서 표적 부위를 절단하는 I-OnuI HE 호밍 엔도뉴클레아제(HE) 변이체로서, 부모 I-OnuI HE 서열에 비해 하나 이상의 아미노산 치환을 포함하되, 하나 이상의 아미노산 치환은 부모 I-OnuI HE와 비교하여 I-OnuI HE 변이체의 열안정성을 증가시키는, I-OnuI HE 변이체.
  88. 제80항 내지 제87항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
  89. 제80항 내지 제87항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음의 아미노산 위치에서 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, F168, D208, 및 N246.
  90. 제80항 또는 제87항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 3개 이상의 아미노산 치환을 포함하고: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  91. 제80항 내지 제87항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하는, I-OnuI HE 변이체: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300.
  92. 제80항 또는 제87항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 5개 이상의 아미노산 치환을 포함하고: I14, A19, K108, V116, K156, F168, S176, D208, E231, N246, V261, L263, E277, 및 G300; 하나 이상의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 아미노산 위치에 있는, I-OnuI HE 변이체: N31, N33, K52, Y97, K124, K147, I153, K209, E264, 및 D268.
  93. 제80항 내지 제92항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 10℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  94. 제80항 내지 제92항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 15℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  95. 제80항 내지 제92항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 20℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
  96. 제80항 내지 제92항 중 어느 한 항에 있어서, I-OnuI HE 변이체는 부모 I-OnuI HE의 TM50보다 적어도 25℃ 더 높은 TM50을 갖는, I-OnuI HE 변이체.
KR1020217020863A 2018-12-10 2019-12-09 호밍 엔도뉴클레아제 변이체 KR20210102925A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862777476P 2018-12-10 2018-12-10
US62/777,476 2018-12-10
PCT/US2019/065211 WO2020123371A2 (en) 2018-12-10 2019-12-09 Homing endonuclease variants

Publications (1)

Publication Number Publication Date
KR20210102925A true KR20210102925A (ko) 2021-08-20

Family

ID=71076132

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217020863A KR20210102925A (ko) 2018-12-10 2019-12-09 호밍 엔도뉴클레아제 변이체

Country Status (9)

Country Link
US (1) US20220119784A1 (ko)
EP (1) EP3893922A4 (ko)
JP (1) JP2022513750A (ko)
KR (1) KR20210102925A (ko)
CN (1) CN113329760A (ko)
AU (1) AU2019397364A1 (ko)
CA (1) CA3122278A1 (ko)
IL (1) IL283720A (ko)
WO (1) WO2020123371A2 (ko)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100086533A1 (en) * 2007-02-19 2010-04-08 Cellectis Laglidadg homing endonuclease variants having novel substrate specificity and use thereof
US20110256607A1 (en) * 2010-04-16 2011-10-20 Georg Hausner Homing endonucleases
WO2011156430A2 (en) * 2010-06-07 2011-12-15 Fred Hutchinson Cancer Research Center Generation and expression of engineered i-onui endonuclease and its homologues and uses thereof
EP3272356A1 (en) * 2012-02-24 2018-01-24 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
EP3487994A4 (en) * 2016-07-25 2020-01-29 Bluebird Bio, Inc. BCL11A HOMING ENDONUCLEASE VERSIONS, COMPOSITIONS AND METHODS OF USE
CA3034094A1 (en) * 2016-08-16 2018-02-22 Bluebird Bio, Inc. Il-10 receptor alpha homing endonuclease variants, compositions, and methods of use
US20190262398A1 (en) * 2016-08-23 2019-08-29 Bluebird Bio, Inc. Tim3 homing endonuclease variants, compositions, and methods of use
IL265045B2 (en) * 2016-09-08 2023-09-01 Bluebird Bio Inc Variants of endonuclease pd-1, compositions and methods of use
US11591582B2 (en) * 2016-10-11 2023-02-28 2Seventy Bio, Inc. TCRα homing endonuclease variants
EP3526334A4 (en) * 2016-10-17 2020-09-30 Bluebird Bio, Inc. TGFBETA R2 ENDONUCLEASE VARIANTS, COMPOSITIONS AND METHODS OF USE
MA48797A (fr) * 2017-05-25 2020-04-08 Bluebird Bio Inc Variants de l'endonucléase cblb , compositions et procédés d'utilisation

Also Published As

Publication number Publication date
CA3122278A1 (en) 2020-06-18
EP3893922A2 (en) 2021-10-20
US20220119784A1 (en) 2022-04-21
WO2020123371A3 (en) 2020-08-20
WO2020123371A2 (en) 2020-06-18
CN113329760A (zh) 2021-08-31
JP2022513750A (ja) 2022-02-09
EP3893922A4 (en) 2022-09-14
IL283720A (en) 2021-07-29
AU2019397364A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
CN115651927B (zh) 编辑rna的方法和组合物
US20190184035A1 (en) Bcl11a homing endonuclease variants, compositions, and methods of use
US20230357736A1 (en) TCRa HOMING ENDONUCLEASE VARIANTS
US20230022146A1 (en) Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
US11779654B2 (en) PCSK9 endonuclease variants, compositions, and methods of use
US20220064651A1 (en) Talen-based and crispr/cas-based gene editing for bruton&#39;s tyrosine kinase
US20240016934A1 (en) Compositions and Methods for Reducing MHC Class II in a Cell
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
KR20210102925A (ko) 호밍 엔도뉴클레아제 변이체
CN116507629A (zh) Rna支架
US20220364123A1 (en) Wiskott-aldrich syndrome gene homing endonuclease variants, compositions, and methods of use
US20210230565A1 (en) Bruton&#39;s tyrosine kinase homing endonuclease variants, compositions, and methods of use
US20240102007A1 (en) Gene editing systems comprising a crispr nuclease and uses thereof
TW202246497A (zh) Cas12i2融合分子及其用途
JP2023548386A (ja) B2mを標的とするrnaガイドを含む組成物及びその使用