KR20230122628A

KR20230122628A - 부위-지향 돌연변이 유발을 위한 조성물 및 방법

Info

Publication number: KR20230122628A
Application number: KR1020237024378A
Authority: KR
Inventors: 조던 자르주르; 앤-레이첼 크로스택
Original assignee: 2세븐티 바이오, 인코포레이티드
Priority date: 2020-12-21
Filing date: 2021-12-16
Publication date: 2023-08-22
Also published as: JP2024503249A; CN116887853A; CA3202889A1; AU2021410632A1; EP4262850A1; WO2022140150A1

Abstract

본 개시내용은 개선된 게놈 편집 조성물 및 이중-가닥 DNA 표적 부위를 편집하기 위한 방법을 제공한다. 본 개시내용은 기술된 조성물 및 방법에 의해 생산된 게놈 편집 세포를 추가로 제공한다.

Description

부위-지향 돌연변이 유발을 위한 조성물 및 방법

관련 출원에 대한 상호 참조

본 출원은 35 U.S.C. § 119(e)에 의거하여 2020년 12월 21일에 출원된 미국 특허 가출원 제63/128,391호의 이익을 주장하며, 그 전체는 참조로서 본원에 통합된다.

서열 목록에 관한 진술

본 출원과 연관된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며, 참조로서 본 명세서에 통합된다. 서열 목록이 포함된 텍스트 파일의 명칭은 BLUE-132PC_ST25.txt이다. 2021년 12월 15일에 생성된 텍스트 파일은 541 KB였으며, 본 명세서의 출원과 동시에 EFS-Web을 통해 전자적으로 제출된다.

기술 분야

본 개시내용은 개선된 게놈 편집 조성물에 관한 것이다. 보다 구체적으로, 본 개시내용은 DNA-결합 도메인 및 엑소뉴클레아제에 연결된 귀소 엔도뉴클레아제 변이체를 포함하는 융합 폴리펩티드, 조성물, 및 세포 내에서 dsDNA의 부위-지향 돌연변이 유발을 위해 이를 사용하는 방법에 관한 것이다.

비교적 최근에 게놈 편집 기술이 급증하면서 거의 모든 진핵 세포 및 포유류에서 게놈 서열을 직접 표적화하고 변형할 가능성이 열렸다. 이러한 기술은, 전사 활성화제-유사 효과기 뉴클레아제(TALEN), 징크-핑거 뉴클레아제(ZFN), 클러스터링된 규칙적인 간격의 짧은 회문 반복부(CRISPR)-Cas-결합된 뉴클레아제, 및 귀소 엔도뉴클레아제(HE)를 포함하지만, 이에 한정되지 않는다. 이들 편집 기술 모두에 공통적인 것은 이들이 표적 뉴클레오티드 서열에서 중단점을 생성하는 반면, 자연 세포 복구 메커니즘은 비-상동성 말단 결합(NHEJ) 또는 상동성-지시적 복구(HDR)에 의해 뉴클레오티드 서열을 재연결하도록 남겨진다는 것이다. 그러나 복구가 항상 완벽한 것은 아니다. 따라서, 최종 생성물은 다양한 유전적 병변 중 어느 하나를 포함하는 뉴클레오티드 서열이다.

유전자 편집 뉴클레아제의 적용으로 인해 가장 빈번하게 관찰되는 유전적 병변은 삽입 및 결실(통상적으로 '삽입결실(indel)'로 지칭됨)이다. 삽입결실은 이중-가닥 DNA 절단(DSB)이 NHEJ DNA 복구 기구에 의해 처리되고 재밀봉될 때 발생한다. NHEJ 삽입결실은 통상적으로, 다양한 상동성 재조합 결과를 향해 DSB를 우회시킬 수 있는 전달된 과량의 상동성 DNA 서열이 없는 경우 유전자 편집 이벤트를 지배한다.

각 유전적 병변의 특이적 특성은 상이한 표현형 결과를 초래할 수 있다. 예를 들어, 임의의 주어진 유전자 병변은 유전자의 총 녹아웃으로부터 기능 획득 또는 상실까지, 표현형에 전혀 영향을 미치지 않는 광범위한 표현형 결과를 초래할 수 있다. 따라서, 유전자 편집 시 상이한 돌연변이를 유도하는 메커니즘을 더 이해하고, 치료적으로 의미있는 유전자 편집을 실행하는 조성물 및 방법을 개발할 필요성이 증가하고 있다.

본 개시내용은 일반적으로, 부분적으로는, DNA-결합 도메인, 인간 유전자에서 표적 부위를 절단하는 귀소 엔도뉴클레아제 변이체, 링커 도메인, 및 엑소뉴클레아제를 포함하는 융합 폴리펩티드, 및 이를 사용하는 방법에 관한 것이다.

일 측면에서, DNA-결합 도메인 및 세포에서 선택된 이중 가닥 DNA(dsDNA) 표적 부위에 결합하여 이를 절단하는 귀소 엔도뉴클레아제(HE) 변이체; 링커 도메인; 및 엑소뉴클레아제 또는 이의 생물학적으로 활성인 단편을 포함하는 융합 폴리펩티드가 제공된다.

특정 실시예에서, 엑소뉴클레아제는 Trex2, ExoI, 또는 ExoX, 또는 이의 생물학적으로 활성인 단편이다. 일부 실시예에서, 엑소뉴클레아제는 ExoX, 또는 이의 생물학적으로 활성인 단편이다. 일부 실시예에서, 엑소뉴클레아제는 ExoI, 또는 이의 생물학적으로 활성인 단편이다. 일부 실시예에서, 엑소뉴클레아제는 Trex2, 또는 이의 생물학적으로 활성인 단편이다.

다양한 실시예에서, 귀소 엔도뉴클레아제는 조작된 귀소 엔도뉴클레아제이다.

다양한 실시예에서, 선택된 dsDNA 표적 부위는 비-천연 귀소 엔도뉴클레아제 표적 부위이다.

다양한 실시예에서, DNA-결합 도메인은 엔도뉴클레아제 dsDNA 표적 부위의 상류에 있는 dsDNA 표적 부위에 결합한다. 일부 실시예에서, DNA-결합 도메인은 TALE DNA-결합 도메인을 포함한다. 일부 실시예에서, TALE DNA 도메인은 약 9.5 TALE 반복 단위 내지 약 15.5 TALE 반복 단위를 포함한다. 일부 실시예에서, TALE DNA 도메인은 약 11.5 TALE 반복 단위 또는 약 12.5 TALE 반복 단위를 포함한다. 일부 실시예에서, DNA-결합 도메인은 징크 핑거 DNA-결합 도메인을 포함한다. 일부 실시예에서, 징크 핑거 DNA-결합 도메인은 2, 3, 4, 5, 6, 7 또는 8개의 징크 핑거 모티프를 포함한다.

다양한 실시예에서, 링커 도메인은 펩티드 링커이다. 일부 실시예에서, 펩티드 링커는 자가-절단 펩티드 링커이다. 일부 실시예에서, 펩티드 링커는 약 4 내지 약 30개의 아미노산을 포함한다. 일부 실시예에서, 펩티드 링커는 약 10 내지 약 16개 아미노산을 포함한다. 일부 실시예에서, 펩티드 링커는 약 12개 아미노산을 포함한다. 일부 실시예에서, 펩티드 링커는 (GGGGS)_1-4 링커(서열번호 117, 150 내지 152)이다. 일부 실시예에서, 펩티드 링커는 (GGGGS)₂ 링커(서열번호 150)를 포함한다.

다양한 실시예에서, HE 변이체는 LAGLIDADG 귀소 엔도뉴클레아제(LHE) 변이체이다. 일부 실시예에서, HE 변이체는 상응하는 야생형 HE와 비교하여 1, 2, 3, 4, 5, 6, 7 또는 8개의 N-말단 아미노산이 결여되어 있다. 일부 실시예에서, HE 변이체는 상응하는 야생형 HE와 비교하여 4개의 N-말단 아미노산이 결여되어 있다. 일부 실시예에서, HE 변이체는 상응하는 야생형 HE와 비교하여 8개의 N-말단 아미노산이 결여되어 있다. 일부 실시예에서, HE 변이체는 상응하는 야생형 HE와 비교하여 1, 2, 3, 4, 또는 5개의 C-말단 아미노산이 결여되어 있다. 일부 실시예에서, HE 변이체는 상응하는 야생형 HE와 비교하여 C-말단 아미노산이 결여되어 있다. 일부 실시예에서, HE 변이체는 상응하는 야생형 HE와 비교하여 2개의 C-말단 아미노산이 결여되어 있다.

특정 실시예에서, HE 변이체는 I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-SceI, I-ScuMI, I-SmaMI, I-SscMI, 및 I-Vdi141I로 이루어진 군으로부터 선택되는 LHE의 변이체이다. 일부 실시예에서,　HE 변이체는 I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, 및 I-SmaMI로 이루어진 군으로부터　선택되는 LHE의 변이체이다. 바람직한 실시예에서, HE 변이체는 I-OnuI LHE 변이체이다.

다양한 실시예에서, HE 표적 부위는 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자 내에 있다. 일부 실시예에서, HE 표적 부위는 하기로 이루어진 군으로부터 선택되는 유전자 내에 있다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), TCRβ, IL10Rα, IL10Rβ, TGFBR1, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, BCL11A, KLF1, SOX6, GATA1, LSD1, 알파 엽산 수용체(FRα), αvβ6 인테그린, B 세포 성숙 항원(BCMA), B7-H3(CD276), B7-H6, 탄산 탈수효소 IX(CAIX), CD16, CD19, CD20, CD22, CD30, CD33, CD37, CD38, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD133, CD138, CD171, 암배아 항원(CEA), C형 렉틴-유사 분자-1(CLL-1), CD2 서브세트 1(CS-1), 콘드로이틴 설페이트 프로테오글리칸 4(CSPG4), 피부 T 세포 림프종-관련 항원 1(CTAGE1), 상피 성장 인자 수용체(EGFR), 상피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP2), 상피 당단백질 40(EGP40), 상피 세포 부착 분자(EPCAM), 에프린 A형 수용체 2(EPHA2), 섬유아세포 활성화 단백질(FAP), Fc 수용체 유사 5(FCRL5), 태아 아세틸콜린에스터라제 수용체(AchR), 강글리오시드 G2(GD2), 강글리오시드 G3(GD3), 글리피칸-3(GPC3), ErbB2를 포함하는 EGFR 패밀리(HER2), IL-11Rα, IL-13Rα2, 카파 암/고환 항원 2(LAGE-1A), 람다, 루이스-Y(LeY), L1 세포 부착 분자(L1-CAM), 흑색종 항원 유전자(MAGE)-A1, MAGE-A3, MAGE-A4, MAGE-A6, MAGEA10, T 세포 1에 의해 인식되는 흑색종 항원(MelanA 또는 MART1), 메소텔린(MSLN), MUC1, MUC16, MHC 클래스 I 사슬 관련 단백질 A(MICA), MHC 클래스 I 사슬 관련 단백질 B(MICB), 신경 세포 부착 분자(NCAM), 암/고환 항원 1(NY-ESO-1), 폴리시알산; 태반-특이적 1(PLAC1), 흑색종에서 우선적으로 발현되는 항원(PRAME), 전립선 줄기 세포 항원(PSCA), 전립선-특이적 막 항원(PSMA), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 윤활막 육종, X 중단점 2(SSX2), 서바이빈, 종양 결합된 당단백질 72(TAG72), 종양 내피 마커 1(TEM1/CD248), 종양 내피 마커 7-관련(TEM7R), TEM5, TEM8, 영양막 당단백질(TPBG), UL16-결합 단백질(ULBP) 1, ULBP2, ULBP3, ULBP4, ULBP5, ULBP6, 혈관 내피 성장 인자 수용체 2(VEGFR2), 및 빌름스 종양 1(WT-1) 유전자. 일부 실시예에서, HE 표적 부위는 하기로 이루어진 군으로부터 선택되는 유전자 내에 있다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC (TCRα), IL10Rα, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, 및 BCL11A 유전자. 일부 실시예에서, HE 표적 부위는 TRAC (TCRα) 유전자, CBL-B 유전자, 또는 PDCD1(PD-1) 유전자 내에 있다. 특정 실시예에서, TCRα 유전자 표적 부위는 서열번호 1에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, CBL-B 유전자 표적 부위는 서열번호 2에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, PD-1 유전자 표적 부위는 서열번호 3에 제시된 아미노산 서열을 포함한다.

다양한 실시예에서, DNA-결합 도메인은 서열번호 4에 제시된 표적 부위를 갖는 TALE DNA-결합 도메인을 포함한다.

다양한 실시예에서, ExoX, 또는 이의 생물학적으로 활성인 단편은 서열번호 109에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, ExoX, 또는 이의 생물학적으로 활성인 단편은 서열번호 109에 제시된 아미노산 서열인 아미노산을 포함한다.

다양한 실시예에서, 융합 폴리펩티드는 서열번호 46, 64, 73, 및 82 중 어느 하나에 제시된 아미노산 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, 융합 폴리펩티드는 서열번호 46, 64, 73, 및 82 중 어느 하나에 제시된 아미노산 서열을 포함한다.

다양한 실시예에서, ExoI, 또는 이의 생물학적으로 활성인 단편은 서열번호 112에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열인 아미노산을 포함한다. 특정 실시예에서, ExoI, 또는 이의 생물학적으로 활성인 단편은 서열번호 112에 제시된 아미노산 서열인 아미노산을 포함한다.

다양한 실시예에서, 융합 폴리펩티드는 서열번호 43에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, 융합 폴리펩티드는 서열번호 43에 제시된 아미노산 서열을 포함한다.

일부 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드가 제공된다. 일부 실시예에서, 폴리뉴클레오티드는 서열번호 44, 62, 71, 및 80 중 어느 하나에 제시된 폴리뉴클레오티드 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 실시예에서, 폴리뉴클레오티드는 서열번호 44, 62, 71, 및 80 중 어느 하나에 제시된 것과 같은 폴리뉴클레오티드 서열을 포함한다.

다양한 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 암호화하는 mRNA가 제공된다. 일부 실시예에서, mRNA는 서열번호 45, 63, 72, 및 81 중 어느 하나에 제시된 것과 같은 RNA 서열에 대해 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 RNA 서열을 포함한다. 특정 실시예에서, mRNA는 서열번호 45, 63, 72, 및 81 중 어느 하나에 제시된 RNA 서열을 포함한다. 일부 실시예에서, mRNA는 서열번호 42에 제시된 RNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 RNA 서열을 포함한다. 특정 실시예에서, mRNA는 서열번호 42 중 어느 하나에 제시된 RNA 서열을 포함한다.

다양한 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 암호화하는 벡터가 제공된다. 일부 실시예에서, 벡터는 본원에서 고려되는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다.

다양한 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 암호화하는 융합 폴리펩티드를 포함하는 세포가 제공된다. 일부 실시예에서, 세포는 본원에서 고려되는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 일부 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 암호화하는 mRNA를 포함한다. 일부 실시예에서, 세포는 본원에서 고려되는 벡터를 포함한다. 일부 실시예에서, 세포는 하나 이상의 변형을 포함한다.

다양한 실시예에서, 세포는 조혈 세포이다. 일부 실시예에서, 세포는 조혈 줄기 또는 전구 세포이다. 일부 실시예에서, 세포는 CD34+ 세포이다. 일부 실시예에서, 세포는 CD133+ 세포이다.

다양한 실시예에서, 세포는 면역 효과기 세포이다. 일부 실시예에서, 면역 효과기 세포는 세포독성 T 림프구(CTL), 종양 침윤 림프구(TIL), 또는 헬퍼 T 세포이다. 일부 실시예에서, 면역 효과기 세포는 T 세포이다. 일부 실시예에서, 면역 효과기 세포는 αβ T 세포, γδ T 세포, 자연 살해(NK) 세포, 또는 자연 살해 T(NKT) 세포이다.

다양한 실시예에서, 본원에서 고려되는 세포 집단이 제공된다.

다양한 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 포함하는 조성물이 제공된다. 일부 실시예에서, 본원에서 고려되는 폴리뉴클레오티드를 포함하는 조성물이 제공된다. 일부 실시예에서, 본원에서 고려되는 mRNA를 포함하는 조성물이 제공된다. 일부 실시예에서, 본원에서 고려되는 벡터를 포함하는 조성물이 제공된다. 일부 실시예에서, 본원에서 고려되는 세포를 포함하는 조성물이 제공된다. 일부 실시예에서, 본원에서 고려되는 세포의 집단을 포함하는 조성물이 제공된다. 특정 실시예에서, 조성물은 약학적으로 허용되는 담체를 포함한다.

또 다른 측면에서, 부위-지향 돌연변이 유발 방법이 제공되며, 상기 방법은 (a) 이중-가닥 DNA(dsDNA) 표적 부위를 선택하는 단계, 및 (b) 본원에서 고려되는 융합 폴리펩티드, 폴리뉴클레오티드, mRNA 또는 벡터를 세포에 도입하는 단계를 포함하며; 상기 융합 펩티드는 세포에서 선택된 dsDNA 표적 절단 부위 근처에 결실 중심 위치를 갖는 방향성 편향 결실을 생성한다.

다양한 실시예에서, 방향성 편향 결실의 50% 초과, 51% 초과, 52% 초과, 53% 초과, 54% 초과, 55% 초과, 56% 초과, 57% 초과, 58% 초과, 59% 초과, 60% 초과, 65% 초과, 70% 초과, 75% 초과, 또는 80% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다.

다양한 실시예에서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 DNA-결합 도메인 표적 부위와 동일한 측면에 있다. 특정 실시예에서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 5’이다.

다양한 실시예에서, 결실의 적어도 50%, 적어도 51%, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 59%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 또는 적어도 80%는 HE 표적 부위 중심 위치로부터 4개 뉴클레오티드보다 더 큰 결실 중심을 갖는다.

다양한 실시예에서, 결실의 적어도 10%, 적어도 11%, 적어도 12%, 적어도 13%, 적어도 14%, 적어도 15%, 적어도 16%, 적어도 17%, 적어도 18%, 적어도 19%, 적어도 20%, 적어도 25%, 적어도 30%, 또는 적어도 35%는 HE 표적 부위 중심 위치로부터 8개 뉴클레오티드보다 더 큰 결실 중심을 갖는다.

다양한 실시예에서, 결실의 적어도 50%, 적어도 51%, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 50%, 적어도 59%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 또는 적어도 80%는 길이가 6 bps 이상이다.

다양한 실시예에서, 결실의 적어도 30%, 적어도 31%, 적어도 32%, 적어도 33%, 적어도 34%, 적어도 35%, 적어도 36%, 적어도 37%, 적어도 38%, 적어도 39%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 또는 적어도 60%는 길이가 12 bps 이상이다.

다양한 실시예에서, 방향성 편향 결실은 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 또는 약 20 뉴클레오티드의 길이를 포함한다.

다양한 실시예에서, 결실은 DNA-결합 도메인 표적 부위 내로 연장된다. 일부 실시예에서, 결실 중심 위치는 DNA-결합 도메인 표적 부위 내에 있다.

다양한 실시예에서, 이러한 방법은 세포 내에 말단 가공 효소, 또는 이의 생물학적으로 활성인 단편을 도입하는 단계를 추가로 포함한다. 일부 실시예에서, 말단-가공 효소, 또는 이의 생물학적으로 활성인 단편은 하기로 이루어진 군으로부터 선택된다: Trex2, Trex1, 막관통 도메인이 없는 Trex1, Apollo, Artemis, DNA2, ExoI, ExoT, ExoIII, ExoX, Fen1, Fan1, MreII, Rad2, Rad9, TdT(말단 데옥시뉴클레오티딜 트랜스퍼라제), PNKP, RecE, RecJ, RecQ, 람다 엑소뉴클레아제, Sox, 우두 DNA 중합효소, 엑소뉴클레아제 I, 엑소뉴클레아제 III, 엑소뉴클레아제 VII, NDK1, NDK5, NDK7, NDK8, WRN, T7-엑소뉴클레아제 유전자 6, 조류 골수아세포 바이러스 통합 단백질(IN), 블룸(Bloom), 안타르틱 포스파타제(Antartic Phophatase), 알칼리 포스파타제(Alkaline Phosphatase), 폴리 뉴클레오티드 키나제(PNK), ApeI, 녹두 뉴클레아제(Mung Bean nuclease), Hex1, TTRAP (TDP2), Sgs1, Sae2, CUP, Pol mu, Pol 람다, MUS81, EME1, EME2, SLX1, SLX4 및 UL-12. 일부 실시예에서, 말단 가공 효소는 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편이다. 특정 실시예에서, 엑소뉴클레아제는 Trex2, 또는 이의 생물학적으로 활성인 단편이다.

다양한 실시예에서, 상기 방법은 시험관 내 방법이다. 다양한 실시예에서, 상기 방법은 생체 외 방법이다. 다양한 실시예에서, 상기 방법은 생체 내 방법이다.

또 다른 측면에서, 질환 또는 이와 관련된 병태의 적어도 하나의 증상을 치료, 예방 또는 개선하는 방법이 제공되며, 이는 대상체로부터 세포 집단을 수확하는 단계; 본원에 고려된 방법에 따라 세포 집단을 편집하는 단계, 및 편집된 세포 집단을 대상체에게 투여하는 단계를 포함한다.

또 다른 측면에서, 이와 관련된 질환 또는 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하기 위한 본원에서 고려되는 세포의 사용이 제공된다.

또 다른 측면에서, 이와 관련된 질환 또는 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하기 위한 본원에서 고려되는 집단의 사용이 제공된다.

또 다른 측면에서, 이와 관련된 질환 또는 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하기 위한 본원에서 고려되는 조성물의 사용이 제공된다.

다양한 실시예에서, 질환 또는 병태는 면역 장애 또는 암이다.

도 1a는 TCRα 뉴클레오티드 서열(TCRα 메가TAL)을 표적화하도록 재프로그래밍된 귀소 엔도뉴클레아제에 연결된 TALE DNA-결합 도메인의 삽화를 도시한다.
도 1b는 TCRα 메가TAL에 대한 차세대 서열분석(NGS)에 의한 삽입결실 활성을 보여준다. 유전자 편집 이벤트의 삽입결실 특성을 함유하는 NGS 데이터 판독물은 그 길이에 따라 표로 작성된다.
도 2는 2개의 상이한 공여자에서, 저 활성 및 고 활성 TCRα 메가TAL 모두에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 보여준다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 3a 내지 3c는 TCRα 메가TAL (도 3a), TCRα 메가TAL-Trex2 융합(도 3b), 및 TCRα 메가TAL + Trex2 공동 발현(도 3c)에 대한 NGS에 의한 삽입결실 활성을 보여준다. 유전자 편집 이벤트의 삽입결실 특성을 함유하는 NGS 데이터 판독물은 그 길이에 따라 표로 작성된다.
도 4는 TCRα 메가TAL, TCRα 메가TAL-Trex2 융합, 및 TCRα 메가TAL + Trex2 공동 발현에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 5는 세포 표면 상의 TCR 알파 및 베타 사슬과 조합되는 CD3 성분에 대한 염색에 의해 평가되는 다양한 Trex2 상동체에 융합된 TCRα 메가TAL의 편집 효율을 나타낸 다음, 유세포 계측 분석을 보여준다.
도 6은 Trex2 상동체에 융합된 TCRα 메가TAL에 대한 NGS에 의한 삽입결실 활성을 보여준다. 유전자 편집 이벤트의 삽입결실 특성을 함유하는 NGS 데이터 판독물은 그 길이에 따라 표로 작성된다.
도 7은 Trex2 오리너구리(platypus), 주머니쥐(opossum), 인간, 및 마우스 동족체에 융합된 TCRα 메가TAL에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 8은 마우스 Trex2의 공동 발현 유무와 상관없이, 엑소뉴클레아제 RAD1, RAD9A, ExoI, ExoX, T5FEN, lanbdaExo, 및 RecJ에 융합된 TCRα 메가TAL의 편집 효율을 보여준다. CD3 발현에 대한 염색 후 유세포 분석으로 평가한 Trex2 상동체.
도 9는 Trex2의 공동 발현 유무와 상관없이, TCRα 메가TAL 단독, 및 엑소뉴클레아제 ExoI 또는 ExoX에 융합된 TCRα 메가TAL에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 보여준다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 10은 고-활성 CBL-B 메가TAL 단독 또는 Trex2 또는 ExoX에 융합된 것에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 11은 저-활성 CBL-B 메가TAL 단독 또는 Trex2 또는 ExoX에 융합된 것에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 12는 PD-1 메가TAL 단독 또는 Trex2 또는 ExoX에 융합된 것에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 13은 도 12에 도시된 실험으로부터 PDCD1 유전자, 22개의 염기쌍 PD-1 메가TAL 표적 부위, 및 13개의 염기 TALE 어레이 결합 부위(서열번호 154 및 159), 및 4개의 대표적인 결실 종(서열번호 155 내지 158 및 160 내지 162)을 도시한다.
도 14는 PD-1 메가TAL 단독 또는 Trex2 또는 ExoX에 융합된 것에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)를 도시한다. 결실 종은 생성된 판독 프레임 카테고리를 나타내도록 암호화된다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 15는 도 14에 도시된 4개의 결실 종 카테고리 각각의 정규화된 분획을 정량화하는 적층된 히스토그램을 도시한다.
도 16은 형질감염 효율을 추적하기 위해 시안 형광 단백질(CFP) 중 하나 또는 둘 다를 암호화하는 폴리-아데닐화 mRNA로 전기천공된 활성화된 일차 인간 T 세포, 및 3개의 가능한 판독 프레임 각각에서 야생형 또는 모의-편집된 PD-1 대립유전자의 유세포 계측 분석을 도시한다.
도 17은 저 편집 TCRα 메가TAL, 고 편집 TCRα 메가TAL(TCRα 2.2)에 대해 NGS에 의해 평가된 삽입결실 위치 분포(“지문”)뿐만 아니라 Trex2 또는 ExoX에 대한 각각의 직접 융합을 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 18은 Trex2 또는 ExoX에 대한 직접적인 융합을 수반하거나 수반하지 않고, 저-편집 TCRα 메가TAL에 대해 알려진 KAT2B 표적 외 부위에서의 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.
도 19는 ExoX에 대한 직접적인 융합을 수반하거나 수반하지 않고 고-편집 TCRα 메가TAL(TCRα 2.2)에 대한 공지된 AC016700.3 표적 외 부위(서열번호 163 및 164)에서의 삽입결실 위치 분포(“지문”)를 도시한다. NGS 데이터는 중단점 중심에서 발생하는 메가TAL에 상대적인 세로 위치와 길이에 따라 표로 작성된다. 삽입은 이 분석에서 제외된다.

서열 식별자의 간단한 설명

서열번호 1 내지 3은 예시적인 귀소 엔도뉴클레아제 표적 부위이다.

서열번호 4는 PD-1 TALE 어레이 표적 부위이다.

서열번호 5 내지 7은 저 활성 TCRα 메가TAL DNA, RNA, 및 단백질 서열이다.

서열번호 8 내지 10은 고 활성 TCRα 메가TAL DNA, RNA, 및 단백질 서열이다.

서열번호 11 내지 13은 저 활성 TCRα 메가TAL-Trex2 DNA, RNA, 및 단백질 서열이다.

서열번호 14 내지 16은 Trex2 엑소뉴클레아제 DNA, RNA, 및 단백질 서열이다.

서열번호 17 내지 55는 Trex2 상동체에 융합된 저 활성 TCRα 메가TAL에 대한 DNA, RNA 및 단백질 서열이다.

서열번호 56 내지 64는 Trex2 또는 ExoX에 대한 융합이 있거나 없는 고 활성 CBL-B 메가TAL에 대한 DNA, RNA, 및 단백질 서열이다.

서열번호 65 내지 73은 Trex2 또는 ExoX에 대한 융합이 있거나 없는 저 활성 CBL-B 메가TAL에 대한 DNA, RNA, 및 단백질 서열이다.

서열번호 74 내지 82는 Trex2 또는 ExoX에 대한 융합이 있거나 없는 PD-1 메가TAL에 대한 DNA, RNA, 및 단백질 서열이다.

서열번호 83은 PD-1을 암호화하는 mRNA 서열이다.

서열번호 84는 코돈 3에서 1 bp 결실을 포함하는 모의-편집된 PD-1 개방 판독 프레임(ORF)을 암호화하는 mRNA 서열이다.

서열번호 85는 코돈 3에서 2 bp 결실을 포함하는 모의-편집된 PD-1 개방 판독 프레임(ORF)을 암호화하는 mRNA 서열이다.

서열번호 86은 코돈 3에서 3 bp 결실을 포함하는 모의-편집된 PD-1 개방 판독 프레임(ORF)을 암호화하는 mRNA 서열이다.

서열번호 87 내지 101은 TCRα, CBL-B, 및 PD-1 귀소 엔도뉴클레아제에 대한 DNA, RNA, 및 단백질 서열이다.

서열번호 102 내지 106은 야생형 I-OnuI 엔도뉴클레아제 및 이들의 부분이다.

서열번호 107 내지 109는 ExoX 엑소뉴클레아제 DNA, RNA, 및 단백질 서열이다.

서열번호 110 내지 112는 ExoI 엑소뉴클레아제 DNA, RNA, 및 단백질 서열이다.

서열번호 113 내지 123은 다양한 링커의 아미노산 서열을 제시한다.

서열번호 124 내지 148은 프로테아제 절단 부위 및 자가 절단 폴리펩티드 절단 부위의 아미노산 서열을 제시한다.

전술한 서열에서, X가 존재하는 경우, 이는 임의의 아미노산 또는 아미노산의 부재를 지칭한다.

발명을 실시하기 위한 구체적인 내용

A. 개요

본 개시는 일반적으로 개선된 게놈 편집 조성물 및 이의 사용 방법에 부분적으로 관한 것이다. 임의의 특정 이론에 구속되고자 함이 없이, 본원에서 고려되는 게놈 편집 조성물은 1) 유전자 편집에 의해 유도된 결실의 크기를 특정 표적 크기로 증가시키고 2) 결실 중심 위치를 편향시키는 데 사용된다. 특정 실시예에서, 결실 중심 위치는 원래 중단점 중심 또는 엔도뉴클레아제 표적 부위 중심에 대해 DNA-결합 도메인 표적 부위와 대부분 동일한 측면에 있다. 특정 실시예에서, 결실 중심 위치는 원래 중단점 중심 또는 엔도뉴클레아제 표적 부위 중심의 5’측에 편향된다. 또한, 중단점에서 또는 중단점에 근접하여 유전적 병변의 크기와 위치를 제어함으로써, 게놈 편집의 표현형 결과, 예를 들어, 조절 DNA 서열의 파괴 및/또는 표적 유전자 발현을 보다 정확하게 제어할 수 있는 것으로 고려된다.

유전자 편집 뉴클레아제의 적용으로 인해 가장 빈번하게 관찰되는 유전적 병변은 NHEJ 삽입결실이다. NHEJ 기구가 재밀봉되고 추가 DNA 절단에 내성을 갖는 주어진 삽입결실에 도달하는 방법에 대해서는 거의 알려져 있지 않으며, 이에 따라 유전자 편집된 대립유전자 풀 내에서 영구 유전자형으로서 응집된다. 그러나, 삽입결실 이벤트는 뉴클레아제 생성 중단점이 발생하는 DNA 서열에서, 그리고 이에 바로 근접한 DNA 서열에서 거의 독점적으로 관찰되는 것으로 알려져 있다. 다양한 뉴클레아제 플랫폼(ZFN, TALEN 및 CRISPR)을 사용한 이전의 연구는 유전자 편집된 대립유전자가 관찰된 삽입결실의 정성적 특성에 대한 일부 일관성 척도를 보여준다는 것을 시사하였다. 이는 유전자 편집 결과를 지배하는 결정적인 생물물리적 및/또는 생화학적 프로세스가 있음을 의미한다. 그러나, 상이한 DNA 표적 부위에 걸쳐 상이한 유전자 편집 뉴클레아제로부터 발생하는 편집된 대립유전자의 관찰된 스펙트럼에는 약간의 미묘한 차이가 있지만, 삽입결실 특성에 영향을 미치는 능력은 여전히 미묘한 것으로 남아 있다.

주어진 삽입결실을 정의하는 정성적 특성은 (i) 삽입되거나 결실된 염기의 수에 있어서의 그의 길이; (ii) 일반적으로 뉴클레아제 표적 부위 또는 중단점에 대해 언급되는, 염색체를 따른 그의 종방향 위치; 및 (iii) 삽입의 경우, 삽입된 서열 길이 및 조성이다. 결실은 가장 현저한 결과이며, 일반적으로 관찰된 이벤트의 90 내지 95%를 포함한다. 이들의 가장 흔히 보고된 크기 특성은 작은 경향이 있고(즉, 그 범위의 하한을 향해 편향된 빈도로 길이가 1 내지 20 염기 쌍임), 이들의 위치 분포는 균등하게 분포되어, DNA 중단점을 덮고 상당한 편향 없이 어느 방향으로든 외측으로 나오는 것으로 밝혀졌다. 이들 특성에 대한 예외는 DNA 중단점의 어느 한 쪽에 위치하는 마이크로상동성(약 3 내지 6 염기쌍 길이의 작은 복제 관)에 의해 유도되는 것으로 흔히 가정된다. 게놈 편집 도구를 적용하는 동안 훨씬 덜 빈번하게 발생하는 삽입의 특성에 관한 보고는 거의 없다. 또한, 각각의 삽입결실 종을 표현형(예를 들어, 이것이 개방 판독 프레임에 미치는 영향 또는 전사 인자 결합 모티프를 파괴하는지 여부)에 관련시키는 유전자형 특성은 잠재적으로 광범위하고 각각의 주어진 적용에 대해 특이적이다.

게놈 편집의 표현형 결과를 정확하게 제어하는 데 유용한 구별되는 편집 패턴(예: 결실)을 갖는 독특한 융합 폴리펩티드가 본원에서 고려된다. 다양한 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 말단-가공 효소(예:, 엑소뉴클레아제)를 포함한다. 특정 실시예에서, 엑소뉴클레아제는 ExoX, ExoI, 또는 이의 생물학적으로 활성인 단편이다. 특정 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인 표적 부위와 동일한 측면에 또는 원래 편집/중단점의 5'에 방향성 편향 결실 중심을 갖는 연장된 유전적 결실을 유도한다. 특정 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인 표적 부위에 의해 포함되는 결실 중심 위치를 생성한다. 특정 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인 표적 부위 내로 연장되는(또는 이에 의해 포함되는) 결실을 생성한다.

특정 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인 및 세포에서 선택된 이중 가닥 DNA(dsDNA) 표적 부위에 결합하여 절단하는 귀소 엔도뉴클레아제(HE) 변이체, 폴리펩티드 링커 및 엑소뉴클레아제(예: ExoX 또는 ExoI), 또는 이의 생물학적으로 활성인 단편을 포함한다.

다양한 실시예에서, 융합 폴리펩티드를 암호화하는 벡터, 폴리뉴클레오티드, mRNA, 또는 cDNA가 고려된다. 다양한 실시예에서, 게놈 편집된 세포가 고려된다. 다양한 실시예에서, 융합 폴리펩티드, 벡터, 폴리뉴클레오티드, mRNA, cDNA 또는 세포를 포함하는 조성물이 고려된다.

다양한 실시예에서, 게놈 편집, 부위-지향 돌연변이 유발, 부위-지향 돌연변이 결실의 길이 증가, 결실 위치 편향, 및 이를 필요로 하는 대상체에서 치료 방법이 고려된다.

따라서, 본원에서 고려되는 조성물 및 방법은 원하는 돌연변이 유발성 결과의 전략적인 제어 및 선택을 가능하게 하기 때문에 기존의 유전자 편집 전략에 비해 상당한 개선을 나타낸다.

재조합((즉, 조작된) DNA, 펩티드 및 올리고뉴클레오티드 합성, 면역검정, 조직 배양, 형질전환((예를 들어, 전기천공, 리포펙션), 효소 반응, 정제를 위한 기술 및 관련 기술과 절차는 본 명세서 전반에 걸쳐 인용되고 논의된 것과 같이 미생물학, 분자 생물학, 생화학, 분자 유전학, 세포 생물학, 바이러스학, 및 면역학에 있어서의 다양한 일반적이고 보다 구체적인 참조 문헌에 기술된 바와 같이 수행될 수 있다. 예를 들어, Sambrook 등., Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; Current Protocols in Molecular Biology (John Wiley and Sons, 2008년 7월 업데이트); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience; Glover, DNA Cloning: A Practical Approach, vol. I & II (IRL Press, Oxford Univ. Press USA, 1985); Current Protocols in Immunology (편집: John E. Coligan, Ada M. Kruisbeek, David H. Margulies, Ethan M. Shevach, Warren Strober 2001 John Wiley & Sons, NY, NY); Real-Time PCR: Current Technology and Applications, Julie Logan, Kirstin Edwards 및 Nick Saunders 편집, 2009, Caister Academic Press, Norfolk, UK; Anand, Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992); Guthrie and Fink, Guide to Yeast Genetics and Molecular Biology (Academic Press, New York, 1991); Oligonucleotide Synthesis (N. Gait 편집, 1984); 핵산 The Hybridization (B. Hames & S. Higgins 편집, 1985); Transcription and Translation (B. Hames & S. Higgins 편집, 1984); Animal Cell Culture (R. Freshney 편집, 1986); Perbal, A Practical Guide to Molecular Cloning (1984); Next-Generation Genome Sequencing (Janitz, 2008 Wiley-VCH); PCR Protocols (Methods in Molecular Biology) (Park 편집, 제3판, 2010 인간a Press); Immobilized Cells And Enzymes (IRL Press, 1986); the treatise, Methods In Enzymology (Academic Press, Inc., N.Y.); Gene Transfer Vectors For Mammalian Cells (J. H. Miller 및 M. P. Calos 편집, 1987, Cold Spring Harbor Laboratory); Harlow and Lane, Antibodies, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998); Immunochemical Methods In Cell And Molecular Biology (Mayer 및 Walker 편집, Academic Press, London, 1987); Handbook Of Experimental Immunology, Volumes I-IV (D. M. Weir 및 CC Blackwell 편집, 1986); Roitt, Essential Immunology, 제6판, (Blackwell Scientific Publications, Oxford, 1988); Current Protocols in Immunology (Q. E. Coligan, A. M. Kruisbeek, D. H. Margulies, E. M. Shevach 및 W. Strober 편집, 1991); Annual Review of Immunology; 및 Advances in Immunology과 같은 저널의 논문을 참조한다.

B. 정의

본 개시를 보다 상세히 제시하기에 앞서, 본원에서 사용될 특정 용어의 정의를 제공하는 것이 본 개시를 이해하는 데 도움이 될 수 있다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 당 기술분야의 숙련자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동등한 임의의 방법 및 물질이 특정 실시예의 실시 또는 시험에 사용될 수 있지만, 조성물, 방법 및 물질의 바람직한 실시예가 본원에 기술된다. 본 개시내용의 목적을 위해, 다음의 용어가 아래에 정의된다. 추가의 정의는 본 개시 전체에 걸쳐 제시되어 있다.

단수 표현(관사 “a”, “an”, 및 “the”)은 단수 표현된 문법적 객체의 하나 또는 둘 이상(즉, 적어도 하나, 또는 하나 이상)을 지칭하도록 본원에서 사용된다. 예를 들어, “일 요소”는 하나의 요소 또는 하나 이상의 요소를 의미한다.

대안예(예를 들어, “또는”)의 사용은 대안예 중 하나, 둘 모두, 또는 이들의 임의의 조합을 의미하는 것으로 이해되어야 한다.

용어 “및/또는”은 대안예 중 어느 하나 또는 둘 모두를 의미하는 것으로 이해되어야 한다.

본원에서 사용되는 용어 “약” 또는 “대략”은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이에 대해 많게는 15%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1% 만큼 달라지는 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다. 본원에서 사용되는 용어 “약” 또는 “대략”은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이에 대해 ± 15%, ± 10%, ± 9%, ± 8%, ± 7%, ± 6%, ± 5%, ± 4%, ± 3%, ± 2%, 또는 ± 1% 범위인 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다.

일 실시예에서, 범위, 예를 들어, 1 내지 5, 약 1 내지 5, 약 1 내지 약 5는 그 범위에 포함되는 각각의 수치 값을 지칭한다. 예를 들어, 하나의 비제한적이고 단지 예시적인 예에서, 범위 “1 내지 5”는 다음의 표현과 동등하다: 1, 2, 3, 4, 5; 또는 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 또는 5.0; 또는 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, 4.0, 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7, 4.8, 4.9, 또는 5.0.

본원에서 사용되는 바와 같이, 용어 “약” 또는 “대략”은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이와 비교해 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상인 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다. 일 실시예에서, “실질적으로 동일한(substantially the same)”은 기준 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이와 대략 동일한 효과, 예를 들어 생리학적 효과를 생성하는 수량, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량, 또는 길이를 지칭한다.

본 명세서 전반에 걸쳐, 문맥이 달리 요구하지 않는 한, 단어 “포함하다”, “포함한다”, 및 “포함하는”은 언급된 단계나 요소 또는 단계나 요소의 군을 포함하는 것을 의미하지만 임의의 다른 단계나 요소 또는 단계나 요소의 군을 배제하지 않는 것으로 이해될 것이다. “~로 이루어지는”은 “~로 이루어지는”이라는 문구와 연결되는 것을 포함하고, 이에 한정됨을 의미한다. 따라서, 문구 “~로 이루어지는”은 열거된 요소가 요구되거나 필수적이며, 다른 요소가 존재할 수 없음을 나타낸다. “~로 본질적으로 이루어지는”은, 해당 문구와 연결되어 열거된 임의의 요소를 포함하고, 열거된 요소에 대해 본 개시에서 명시된 활성 또는 작용을 방해하거나 이에 기여하지 않는 다른 요소로 제한됨을 의미한다. 따라서, 문구 “~로 본질적으로 이루어지는”은 열거된 요소가 요구되거나 필수적이지만, 열거된 요소의 활성 또는 작용에 중대하게 영향을 미치는 다른 요소는 존재하지 않음을 나타낸다.

본 명세서 전반에 걸쳐 “일 실시예”, “하나의 실시예”, “특정 실시예”, “연관된 실시예”, “소정의 실시예”, “추가의 실시예”, 또는 “추가 실시예” 또는 이들의 조합은 해당 실시예와 관련하여 기술된 특정 특징, 구조, 또는 특성이 적어도 하나의 실시예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반에 걸쳐 다양한 위치에서 나타나는 전술한 문구 모두가 본질적으로 동일한 실시예를 지칭하는 것은 아니다. 또한, 특정 특징, 구조, 또는 특성은 하나 이상의 실시예에서 임의의 적절한 방식으로 조합될 수 있다. 또한, 일 실시예에서 특징을 확실하게 언급하는 것(positive recitation)이 특정 실시예에서 해당 특징을 배제하기 위한 기초의 역할을 한다는 것도 이해가 될 것이다.

용어 “생체 외(ex vivo)”는 일반적으로 유기체 외부에서 이루어지는 활동, 예컨대 유기체 외부의 인공 환경에서, 바람직하게는 천연 조건의 변경을 최소화한 상태로, 살아있는 조직에서 또는 살아있는 조직을 대상으로 수행되는 실험 또는 측정을 지칭한다. 특정 실시예에서, “생체 외” 절차는 유기체로부터 살아있는 세포 또는 조직을 채취하고, 보통은 멸균 조건 하의 실험실 장치에서, 환경에 따라 일반적으로는 수시간 또는 약 24시간 동안(최대 48시간 또는 72시간을 포함함) 이를 배양하거나 조절하는 것을 포함한다. 특정 실시예에서, 이러한 조직 또는 세포는 채취되고 동결된 후에, 생체 외 처리를 위해 해동될 수 있다. 살아있는 세포 또는 조직을 사용하여 며칠 이상 지속되는 조직 배양 실험 또는 절차는 일반적으로 “시험관 내(in vitro)”로 간주되지만, 특정 실시예에서, 이 용어는 생체 외와 상호 교환적으로 사용될 수 있다.

용어 “생체 내(in vivo)”는 일반적으로 유기체 내에서 이루어지는 활동을 지칭한다. 일 실시예에서, 세포 게놈은 생체 내에서 조작, 편집, 또는 변형된다.

“강화(enhance)” 또는 “촉진(promote)” 또는 “증가(increase)” 또는 “증식(expand)” 또는 “강화(potentiate)”는 비히클 또는 대조군에 의해 야기된 반응과 비교하여 더 큰 반응(즉, 생리학적 반응)을 생성, 유도, 또는 유발하는 융합 폴리펩티드, 뉴클레아제 변이체, 게놈 편집 조성물, 또는 본원에서 고려되는 게놈 편집된 세포의 능력을 일반적으로 지칭한다. 측정가능한 반응은, 본원의 기술 및 설명의 이해로부터 명백해지는 것들 중에서, 편집 이벤트(예: 삽입결실), 결실, 삽입, 결실 길이, 및/또는 표적 유전자 발현의 증가를 포함할 수 있다. “증가된(increased)” 또는 “강화된(enhanced)” 양은 통상적으로 “통계적으로 유의한(statistically significant)” 양이며, 비히클 또는 대조군에 의해 생성된 반응의 1.1, 1.2, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30배 또는 그 이상으로 (예를 들어, 500배, 1000배로) 증가된 것을 포함할 수 있다(1을 초과하는 모든 정수 값 및 정수 값들 사이의 소수점 값, 예를 들어 1.5, 1.6, 1.7, 1.8 등을 포함함).

“감소(decrease)” 또는 “저하(lower)” 또는 “경감(lessen)” 또는 “감소(reduce)” 또는 “약화(abate)” 또는 “절제(ablate)” 또는 “억제(inhibit)” 또는 “감쇠(dampen)”란 일반적으로, 본원에서 고려되는 융합 폴리펩티드, 뉴클레아제 변이체, 게놈 편집 조성물, 또는 본원에서 고려되는 게놈 편집된 세포가 비히클 또는 대조군에 의해 야기된 반응과 비교하여 더 적은 반응(즉, 생리학적 반응)을 생성, 유도, 또는 유발하는 능력을 지칭한다. 측정가능한 반응은 편집 이벤트(예: 삽입결실), 결실, 삽입, 결실 길이, 표적 유전자 발현, 및/또는 질환과 관련된 하나 이상의 증상의 감소를 포함할 수 있다. “감소된(decreased 또는 reduced)” 양은 통상적으로 “통계적으로 유의한” 양이며, 비히클 또는 대조군에 의해 생성된 반응(기준 반응)의 1.1, 1.2, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30배 또는 그 이상으로 (예를 들어, 500배, 1000배로) 감소된 것을 포함할 수 있다(1을 초과하는 모든 정수 값 및 정수 값들 사이의 소수점 값, 예를 들어 1.5, 1.6, 1.7, 1.8 등을 포함함).

“유지(maintain)” 또는 “지속(preserve)” 또는 “유지(maintenance)” 또는 “변화 없음(no change)” 또는 “실질적인 변화 없음(no substantial change)” 또는 “실질적인 감소 없음(no substantial decrease)”은 일반적으로 비히클 또는 대조군에 의해 야기된 반응과 비교하여 실질적으로 유사하거나 비슷한 생리학적 반응(즉, 하류 효과)을 생성, 유도, 또는 유발하는 융합 폴리펩티드, 뉴클레아제 변이체, 게놈 편집 조성물, 또는 본원에서 고려되는 게놈 편집된 세포의 능력을 지칭한다. 유사한 반응은 기준 반응과 유의하게 다르거나 측정 가능한 차이가 없는 것이다.

본원에서 사용되는 용어 “특이적 결합 친화도(specific binding affinity)” 또는 “특이적 결합(specifically binds 또는 specifically bound)” 또는 “특이적 표적화(specifically targets)”는 하나의 분자가 다른 분자에, 예를 들어, 폴리펩티드의 DNA-결합 도메인이 DNA에, 배경 결합보다 더 큰 결합 친화도로 결합하는 것을 기술한다. 결합 도메인이, 예를 들어 약 10⁵ M^-1 이상의 친화도 또는 K_a( 즉, 특정 결합 상호작용의 평형 결합 상수; 단위는 1/M임)로 표적 부위에 결합하거나 표적 부위와 회합하는 경우, 결합 도메인은 표적 부위에 “특이적으로 결합”한다. 특정 실시예에서, 결합 도메인은 약 10⁶ M^-1, 10⁷ M^-1, 10⁸ M^-1, 10⁹ M^-1, 10¹⁰ M^-1, 10¹¹ M^-1, 10¹² M^-1, 또는 10¹³ M^-1 이상의 K_a로 표적 부위에 결합한다. “고 친화도(high affinity)” 결합 도메인은 K_a가 적어도 10⁷ M^-1, 적어도 10⁸ M^-1, 적어도 10⁹ M^-1, 적어도 10¹⁰ M^-1, 적어도 10¹¹ M^-1, 적어도 10¹² M^-1, 적어도 10¹³ M^-1, 또는 그 이상인 결합 도메인들을 지칭한다.

대안적으로, 친화도는 특정 결합 상호작용의 평형 해리 상수(K_d)로서 정의될 수 있으며, 단위는 M이다(예를 들어, 10^-5 M 내지 10^-13 M, 또는 그 미만). 특정 실시예에서 고려되는, DNA 표적 부위에 대한 하나 이상의 DNA-결합 도메인을 포함하는 뉴클레아제 변이체의 친화도는, 예를 들어, 효모 세포 표면 디스플레이와 같은 통상적인 기술을 사용하거나, 결합 회합에 의하거나, 표지된 리간드를 사용하는 변위 검정을 사용해 쉽게 결정할 수 있다.

일 실시예에서, 특이적 결합의 친화도는 배경 결합보다 약 2배 더 크거나, 배경 결합보다 약 5배 더 크거나, 배경 결합보다 약 10배 더 크거나, 배경 결합보다 약 20배 더 크거나, 배경 결합보다 약 50배 더 크거나, 배경 결합보다 약 100배 더 크거나, 배경 결합보다 약 1000배 더 크다.

용어 “선택적 결합(selectively binds, selectively bound, 또는 selectively binding)” 또는 “선택적 표적화(selectively targets)”는 복수의 표적외 분자가 있을 때 하나의 분자가 표적 분자에 우선적으로 결합하는 것(표적내 결합하는 것)을 기술한다. 특정 실시예에서, HE 또는 메가TAL은 HE 또는 메가TAL이 표적외 DNA 표적 결합 부위에 결합하는 것보다 약 5, 10, 15, 20, 25, 50, 100, 또는 1000배 더 빈번하게 표적내 DNA 결합 부위에 선택적으로 결합한다.

“표적 내”는 표적 부위 서열을 지칭한다.

“표적 외”는 표적 부위 서열과 유사하지만 동일하지 않은 서열을 지칭한다.

“표적 부위” 또는 “표적 서열”은, 결합 및/또는 절단에 충분한 조건이 존재하는 경우, 결합 분자가 결합 및/또는 절단할 핵산의 일부를 정의하는 염색체 핵산 서열 또는 염색체외 핵산 서열이다. 표적 부위 또는 표적 서열 중 한 가닥만을 참조하는 폴리뉴클레오티드 서열 또는 서열번호를 지칭할 때, 뉴클레아제 변이체에 의해 결합 및/또는 절단된 표적 부위 또는 표적 서열은 이중 가닥이고 기준 서열 및 이의 보체를 포함한다는 것이 이해될 것이다. 다양한 실시예에서, 표적 부위는 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및/또는 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자 내에 있다. 특정 실시예에서, 표적 부위는 인간 TRAC 유전자, CBL-B 유전자, 또는 PDCD1 유전자 내의 서열이다.

“재조합”은 2개의 폴리뉴클레오티드 간의 유전자 정보의 교환 과정을 지칭하며, 이에는 비상동성 말단 접합(NHEJ)에 의한 공여자 포획 및 상동성 재조합이 포함되지만 이들로 한정되지는 않는다. 본 개시의 목적을 위해, “상동성 재조합(HR)”은, 예를 들어 상동성 유도 복구(HDR) 메커니즘을 통해 세포에서 이중 가닥 절단이 복구되는 도중에 발생하는 이러한 교환의 특별한 형태를 지칭한다. 이러한 프로세스는 뉴클레오티드 서열 상동성을 필요로 하고, “공여자” 분자를 템플릿으로서 사용하여 “표적” 분자(즉, 이중 가닥 절단을 겪은 분자)를 복구하며, “비-교차성 유전자 전환(non-crossover gene conversion)” 또는 “짧은 경로 유전자 전환(short tract gene conversion)”으로 다양하게 알려져 있는데, 이를 통해 공여자로부터 표적으로 유전자 정보가 전달되기 때문이다. 임의의 특정 이론에 구속되고자 함이 없이, 이러한 전달은 파괴된 표적과 공여자 사이에 형성되는 이종이중가닥 DNA의 불일치 보정, 및/또는 공여자가 표적의 일부가 될 유전 정보 및/또는 관련 과정을 재합성하는 데 사용되는 “합성-의존적 가닥 어닐링”을 포함할 수 있다. 이러한 특별한 HR은 종종 공여자 폴리뉴클레오티드의 일부 또는 전부가 표적 폴리뉴클레오티드에 혼입되도록 표적 분자의 서열의 변경시킨다.

“절단”은 DNA 분자의 공유 골격의 파단을 지칭한다. 절단은 인산디에스테르 결합의 효소적 가수분해 또는 화학적 가수분해를 포함하지만 이에 한정되지 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단과 이중 가닥 절단이 모두 가능하다. 이중 가닥 절단은 2개의 구별되는 단일 가닥 절단 이벤트의 결과로서 발생할 수 있다. DNA 절단의 결과 뭉툭한 말단 또는 엇갈린 말단이 생성될 수 있다. 특정 실시예에서, 폴리펩티드 및 뉴클레아제 변이체, 예를 들어, 귀소 엔도뉴클레아제 변이체, 메가TAL, 및 관련 융합 폴리펩티드,가 표적화된 이중-가닥 DNA 절단에 사용된다. 엔도뉴클레아제 절단 인식 부위는 DNA 가닥 중 어느 하나에 있을 수 있다.

“방향성 편향” 또는 “방향성 편향 결실”은 엔도뉴클레아제에 의해 유도된 이중-가닥 DNA 절단에 반응하여 세포의 내인성 복구 기구에 의해 생성된 결실의 위치를 지칭한다. 결실이 방향성으로 편향되는 경우, 이들은 표적 절단 부위에 대해 5’ 또는 3’ 중 하나 또는 이중-가닥 DNA 절단(중단점 또는 중단점 중심)이 주로 발생한다. 즉, 중단점 중심 또는 표적 부위 중심 위치에 비해 실질적으로 더 많은 결실이 한쪽에서 다른 쪽에 대해 일어날 것이다. 특정 실시예에서, 융합 폴리펩티드는 중단점 중심 또는 HE 표적 부위 중심 위치에 비해, DNA-결합 도메인 표적 부위와 동일한 측면에서 발생하는 방향성 편향 결실을 갖는 유전적 결실을 유도한다. 추가의 실시예에서, 융합 폴리펩티드는 원래 중단점 중심 또는 HE 표적 부위 중심 위치에 대해 5’ 방향으로 편향된 결실 중심을 갖는 유전적 결실을 유도한다. 바람직한 실시예에서, 방향성 편향 결실도 또한 신장된다. 또한, 본원에서 고려되는 융합 단백질에 의해 유도된 방향성 편향 결실 또는 신장의 양은 동일한 엑소뉴클레아제 및 동일한 DNA-결합 도메인 및 동일한 귀소 엔도뉴클레아제를 포함하는 융합 폴리펩티드의 공동 발현에 의해 생성된 결실의 분포 또는 결실의 길이와 비교될 수 있다.

“외인성” 분자는, 정상적으로는 세포 내에 존재하지 않지만, 하나 이상의 유전적, 생화학적, 또는 다른 방법에 의해 세포 내로 도입되는 분자이다. 예시적인 외인성 분자는 작은 유기 분자, 단백질, 핵산, 탄수화물, 지질, 당단백, 지단백, 다당류, 상기 분자의 임의의 변형된 유도체, 또는 전술한 분자 중 하나 이상을 포함하는 임의의 복합체를 포함하지만, 이들로 한정되지는 않는다. 외인성 분자를 세포 내로 도입하는 방법은 당 기술분야의 숙련자에게 공지되어 있으며, 지질-매개 전달(즉, 중성 및 양이온성 지질을 포함하는 리포좀), 전기천공, 직접 주입, 세포 융합, 유전자총, 바이오폴리머 나노입자, 칼슘 인산염 공동-침강, DEAE-덱스트란-매개 전달, 및 바이러스 벡터-매개 전달을 포함하지만 이들로 한정되지는 않는다.

“내인성” 분자는 특정 환경 조건 하에 특정 발달 단계에서 특정 세포에 정상적으로 존재하는 분자이다. 추가 내인성 분자는 단백질을 포함할 수 있다.

“유전자”는 유전자 산물을 암호화하는 DNA 영역뿐만 아니라, 유전자 산물의 생산을 조절하는 모든 DNA 영역도 지칭하며, 여기서 이러한 조절 서열이 코딩 서열 및/또는 전사 서열에 인접한지 여부는 상관하지 않는다. 유전자는 프로모터 서열, 인핸서, 침묵화제, 절연체, 경계 요소, 종결자, 폴리아데닐화 서열, 전사후 반응 요소, 번역 조절 서열(예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위), 복제 기점, 매트릭스 부착 부위, 및 유전자좌 조절 영역을 포함하지만, 이들로 한정되지는 않는다.

“유전자 발현”은 유전자에 담긴 정보를 유전자 산물로 변환하는 것을 지칭한다. 유전자 산물은 유전자의 직접 전사 산물(예를 들어, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA 또는 임의의 다른 유형의 RNA)일 수 있다. 유전자 산물은 캡핑, 폴리아데닐화, 메틸화, 및 편집과 같은 프로세스에 의해 변형된 RNA, 및 예를 들어 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의해 변형된 단백질을 포함한다.

본원에서 사용되는 바와 같이, 용어 “유전자 조작(genetically 조작된)” 또는 “유전자 변형(genetically modified)”은 DNA 또는 RNA 형태의 추가 유전 물질을 세포 내의 총 유전 물질에 염색체 첨가 또는 염색체 외 첨가하는 것을 지칭한다. 유전자 변형은 세포 게놈 내의 특정 부위에 대해 표적화되거나 표적화되지 않을 수 있다. 일 실시예에서, 유전자 변형은 부위-특이적이다. 일 실시예에서, 유전자 변형은 부위-특이적이 아니다.

본원에서 사용되는 바와 같이, 용어 “게놈 편집”은 세포 게놈 내의 표적 부위에서 유전 물질을 치환, 결실 및/또는 도입하는 것을 지칭하며, 이는 유전자 또는 유전자 산물의 발현을 복원, 보정, 파괴, 및/또는 변형시킨다. 특정 실시예에서 고려되는 게놈 편집은 임의로 공여자 복구 템플릿이 있을 때, 하나 이상의 뉴클레아제 변이체를 세포 내로 도입하여 세포 게놈 내의 표적 부위에서 또는 표적 부위의 근위에서 DNA 병변을 생성하는 것을 포함한다.

본원에서 사용되는 바와 같이, 용어 “유전자 요법”은 유전자 또는 유전자 산물의 발현을 복구, 보정, 또는 변형시키기 위해, 또는 치료 폴리펩티드를 발현시키기 위해 추가 유전 물질을 세포 내 총 유전 물질 내로 도입하는 것을 지칭한다. 특정 실시예에서, 유전자 또는 유전자 산물의 발현을 복구, 보정, 파괴, 또는 변형하는 게놈 편집에 의해, 또는 치료 폴리펩티드를 발현할 목적으로, 유전 물질을 세포의 게놈 내로 도입하는 것이 유전자 요법으로 간주된다.

C. 융합 폴리펩티드

표적 부위를 편집하기에 적합한 본원의 특정 실시예에서 고려되는 융합 폴리펩티드는 DNA-결합 도메인, 귀소 엔도뉴클레아제, 및 말단-가공 도메인(예: 엑소뉴클레아제)을 포함한다. 다양한 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인 및 귀소 엔도뉴클레아제 변이체, 폴리펩티드 링커, 및 엑소뉴클레아제(예: ExoX) 또는 이의 생물학적으로 활성인 단편을 포함한다. 특정 실시예에서, 융합 폴리펩티드는 N-말단에서 C-말단 순으로, DNA-결합 도메인, 제1 링커 도메인, 귀소 엔도뉴클레아제 변이체, 제2 링커 도메인, 및 엑소뉴클레아제(예: ExoX) 또는 이의 생물학적으로 활성인 단편을 포함한다.

다양한 실시예에서, DNA-결합 도메인은 TALE DNA-결합 도메인 또는 징크 핑거 DNA-결합 도메인이다.

다양한 실시예에서, 귀소 엔도뉴클레아제 변이체는 조작된 뉴클레아제이다. 용어 “재프로그래밍된 뉴클레아제”, “조작된 뉴클레아제” 또는 “뉴클레아제 변이체”는 상호 교환적으로 사용되고, 하나 이상의 DNA-결합 도메인 및 하나 이상의 DNA 절단 도메인(예를 들어, 뉴클레아제 또는 귀소 엔도뉴클레아제)을 포함하는 뉴클레아제를 지칭하며, 상기 뉴클레아제는 이중-가닥 DNA 표적 서열 또는 부위에 결합하여 이를 절단하도록 부모 또는 자연 발생 뉴클레아제로부터 설계되고/되거나 변형된 것이다. 뉴클레아제 변이체는 설계될 수 있고/있거나 자연 발생 뉴클레아제 또는 이전의 뉴클레아제 변이체로부터 변형될 수 있다. 일부 실시예에서, 뉴클레아제 변이체는 비천연 표적 서열 또는 부위에 결합하여 이를 절단하도록 설계된다.

표적 서열에 결합하여 이를 절단하는 융합 폴리펩티드의 예시적인 예는, 엑소뉴클레아제(예를 들어, ExoX 엑소뉴클레아제) 또는 이의 생물학적으로 활성인 단편에 링커 도메인(예를 들어, 폴리펩티드 링커)에 의해 연결된 메가TAL을 포함하지만, 이에 한정되지 않는다.

바람직한 실시예에서, 융합 폴리펩티드는 유사한 비-융합된/연결된 폴리펩티드, 예를 들어, 세포 내로 함께 도입되는 경우 별도의 메가TAL 및 엑소뉴클레아제에 의해 유도된 결실과 비교하여 위치적으로 편향되고/되거나 신장된 결실을 생성하는 데 유용하다. 특정 실시예에서, 유사한 비-융합된/연결된 폴리펩티드에 의해 유도된 결실에 비해 결실은 보다 방향적으로 편향된다. 보다 구체적인 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 다른 하나에 비해 중단점의 일측에서 실질적으로 더 많은 결실을 생성한다. 예를 들어, 기술된 융합 폴리펩티드는 중단점 또는 뉴클레아제 표적 부위 중심 위치에 대해 결실 중심 5’를 갖는 실질적으로 더 많은 돌연변이 결실을 유도한다.

1. 귀소 엔도뉴클레아제(메가뉴클레아제) 변이체

다양한 실시예에서, 귀소 엔도뉴클레아제 또는 메가뉴클레아제는 표적 유전자 내의 표적 부위에서 이중-가닥 절단(DSB)을 도입하도록 재프로그래밍된다. “귀소 엔도뉴클레아제” 및 “메가뉴클레아제”는 상호 교환적으로 사용되며, 12 내지 45개의 염기쌍 절단 부위(예를 들어, 표적 부위)를 인식하고 서열 및 구조 모티프인 LAGLIDADG, GIY-YIG, HNH, His-Cys 박스, 및 PD-(D/E)XK에 기초하여 일반적으로 5개의 패밀리로 그룹화되는 자연 발생 뉴클레아제를 지칭한다.

“기준 귀소 엔도뉴클레아제” 또는 “기준 메가뉴클레아제”는 야생형 귀소 엔도뉴클레아제 또는 자연에서 발견되는 귀소 엔도뉴클레아제를 지칭한다. 일 실시예에서, “기준 귀소 엔도뉴클레아제”는 기저 활성을 증가시키도록 변형된 야생형 귀소 엔도뉴클레아제를 지칭한다.

“조작된 귀소 엔도뉴클레아제”, “재프로그래밍된 귀소 엔도뉴클레아제”, “귀소 엔도뉴클레아제 변이체”, “조작된 메가뉴클레아제”, “재프로그래밍된 메가뉴클레아제”, 또는 “메가뉴클레아제 변이체”는 하나 이상의 DNA-결합 도메인 및 하나 이상의 DNA 절단 도메인을 포함하는 귀소 엔도뉴클레아제를 지칭하며, 상기 귀소 엔도뉴클레아제는 DNA 표적 서열 또는 부위에 결합하여 이를 절단하도록 부모 또는 자연 발생 귀소 엔도뉴클레아제로부터 설계되고/되거나 변형된 것이다. 귀소 엔도뉴클레아제 변이체는 자연 발생 귀소 엔도뉴클레아제 또는 또 다른 귀소 엔도뉴클레아제 변이체로부터 설계되고/되거나 변형될 수 있다.

귀소 엔도뉴클레아제(HE) 변이체는 자연에서 존재하지 않으며 재조합 DNA 기술에 의하거나 무작위 돌연변이 유발에 의해 수득될 수 있다. HE 변이체는 자연 발생 HE 또는 HE 변이체에서 하나 이상의 아미노산을 변경시킴으로써, 예를 들어 하나 이상의 아미노산을 돌연변이화, 치환, 추가, 또는 결실함으로써 수득될 수 있다. 특정 실시예에서, HE 변이체는 DNA 인식 인터페이스에 대한 하나 이상의 아미노산 변경을 포함한다.

특정 실시예에서 고려되는 HE 변이체는 하나 이상의 링커 및/또는 추가 기능성 도메인, 예를 들어, 5’-3’ 엑소뉴클레아제, 5’-3’ 알칼리 엑소뉴클레아제, 3’-5’ 엑소뉴클레아제(예를 들어, Trex2, ExoI, 또는 ExoX), 5’ 플랩 엔도뉴클레아제, 헬리카제, 템플릿 의존성 DNA 중합효소 활성 또는 템플릿 독립적 DNA 중합효소 활성을 나타내는 말단-가공 효소의 말단 가공 효소 도메인을 추가로 포함할 수 있다. 다양한 실시예에서, 말단-가공 효소에 링커 도메인(예를 들어, 폴리펩티드 링커)에 의해 연결된 HE 변이체를 포함하는 폴리펩티드가 제공된다. 다양한 실시예에서, 말단-가공 효소는 3’-5’ 엑소뉴클레아제 활성을 나타낸다. 특정 실시예에서, 말단-가공 효소는 Trex2, ExoI, 또는 ExoX이다. HE 변이체 및 말단-가공 효소는, 예를 들어, 상이한 벡터 또는 별도의 mRNA에 별도로 도입될 수 있거나, 예를 들어, 융합 단백질로서 함께 도입될 수 있거나, 바이러스 자가-절단 펩티드 또는 IRES 요소에 의해 분리된 폴리시스트론 작제물에 도입될 수 있다.

“DNA 인식 인터페이스”는 핵산 표적 염기뿐만 아니라 인접한 잔기들과도 상호작용하는 HE 아미노산 잔기를 지칭한다. 각각의 HE에 대해, DNA 인식 인터페이스는 측쇄-측쇄 및 측쇄-DNA 접점으로 이루어진 광범위한 네트워크를 포함하는데, 이들 대부분은 특정 핵산 표적 서열을 인식하도록 본질적으로 고유하다. 따라서, 특정 핵산 서열에 상응하는 DNA 인식 인터페이스의 아미노산 서열은 상당히 다양하며, 임의의 천연 또는 HE 변이체의 특징이다. 비제한적인 실시예로서, 특정 실시예에서 고려되는 HE 변이체는 천연 HE(또는 이전에 생성된 HE 변이체)의 DNA 인식 인터페이스에 국소화된 하나 이상의 아미노산 잔기가 다양한 HE 변이체의 라이브러리를 작제함으로써 유래될 수 있다. 라이브러리는 절단 검정을 사용해 각각의 예측된 BTK 표적 부위에 대한 표적 절단 활성에 대해 스크리닝될 수 있다(예를 들어, Jarjour 등, 2009. Nuc. Acids Res. 37(20): 6871-6880 참조).

LAGLIDADG 귀소 엔도뉴클레아제(LHE)는 가장 잘 연구된 귀소 엔도뉴클레아제 계열로서, 주로 녹조류 및 진균류의 고세균류(archaea) 및 소기관 DNA(organella DNA)에서 암호화되고, 가장 높은 전체 DNA 인식 특이성을 나타낸다. LHE는 단백질 사슬 당 1개 또는 2개의 LAGLIDADG 촉매 모티프를 포함하고, 동종이량체 또는 단쇄 단량체로서 각각 기능한다. LAGLIDADG 단백질의 구조적 연구는 αββαββα 접힘을 특징으로 하는 고도로 보존된 코어 구조를 식별하였으며(Stoddard 2005), LAGLIDADG 모티프는 이러한 접힘의 제1 나선에 속한다. LHE의 매우 효율적이고 특이적인 절단은 신규하고 매우 특이적인 엔도뉴클레아제를 유도하기 위한 단백질 스캐폴드를 나타낸다. 그러나, 비-천연 또는 비-정형 표적 부위에 결합하여 이를 절단하도록 조작하는 LHE는 적절한 LHE 스캐폴드의 선택, 표적 유전자좌의 검사, 추정 표적 부위의 선택, 및 표적 부위에서 염기쌍 위치의 최대 2/3에서 그의 DNA 접촉점 및 절단 특이성을 변경시키기 위한 LHE의 광범위한 변경을 필요로 한다.

일 실시예에서, 재프로그래밍된 LHE 또는 LHE 변이체가 설계될 수 있는 LHE는 I-CreI 및 I-SceI를 포함하지만, 이에 한정되지 않는다.

재프로그래밍된 LHE 또는 LHE 변이체가 설계될 수 있는 LHE의 예시적인 예는 I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, 및 I-Vdi141I를 포함하지만 이에 한정되지 않는다.

일 실시예에서, 재프로그래밍된 LHE 또는 LHE 변이체는 I-CpaMI 변이체, I-HjeMI 변이체, I-OnuI 변이체, I-PanMI 변이체, 및 I-SmaMI 변이체로 이루어진 군으로부터 선택된다.

일 실시예에서, 표적 유전자를 표적화하는 재프로그래밍된 I-OnuI LHE 또는 I-OnuI 변이체는 자연 I-OnuI 또는 이의 생물학적으로 활성인 단편(서열번호 102 내지 106)으로부터 생성될 수 있다.

다양한 실시예에서, 표적 유전자는 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및/또는 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자이다.

일 실시예에서, 표적 유전자는 다음으로 이루어진 군으로부터 선택된다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체 (KIR), CCR5, TRAC (TCRα), TCRβ, IL10Rα, IL10Rβ, TGFBR1, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, BCL11A, KLF1, SOX6, GATA1, LSD, 알파 엽산 수용체(FRα), αvβ6 인테그린, B 세포 성숙 항원(BCMA), B7-H3(CD276), B7-H6, 탄산 탈수효소 IX(CAIX), CD16, CD19, CD20, CD22, CD30, CD33, CD37, CD38, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD133, CD138, CD171, 암배아 항원(CEA), C형 렉틴-유사 분자-1(CLL-1), CD2 서브세트 1(CS-1), 콘드로이틴 설페이트 프로테오글리칸 4(CSPG4), 피부 T 세포 림프종-관련 항원 1(CTAGE1), 상피 성장 인자 수용체(EGFR), 상피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP2), 상피 당단백질 40(EGP40), 상피 세포 부착 분자(EPCAM), 에프린 A형 수용체 2(EPHA2), 섬유아세포 활성화 단백질(FAP), Fc 수용체 유사 5(FCRL5), 태아 아세틸콜린에스터라제 수용체(AchR), 강글리오시드 G2(GD2), 강글리오시드 G3(GD3), 글리피칸-3(GPC3), ErbB2를 포함하는 EGFR 패밀리(HER2), IL-11Rα, IL-13Rα2, 카파 암/고환 항원 2(LAGE-1A), 람다, 루이스-Y(LeY), L1 세포 부착 분자(L1-CAM), 흑색종 항원 유전자(MAGE)-A1, MAGE-A3, MAGE-A4, MAGE-A6, MAGEA10, T 세포 1에 의해 인식되는 흑색종 항원(MelanA 또는 MART1), 메소텔린 (MSLN), MUC1, MUC16, MHC 클래스 I 사슬 관련 단백질 A(MICA), MHC 클래스 I 사슬 관련 단백질 B(MICB), 신경 세포 부착 분자(NCAM), 암/고환 항원 1(NY-ESO-1), 폴리시알산; 태반-특이적 1(PLAC1), 흑색종에서 우선적으로 발현되는 항원(PRAME), 전립선 줄기 세포 항원(PSCA), 전립선-특이적 막 항원(PSMA), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 윤활막 육종, X 중단점 2(SSX2), 서바이빈, 종양 결합된 당단백질 72(TAG72), 종양 내피 마커 1(TEM1/CD248), 종양 내피 마커 7-관련(TEM7R), TEM5, TEM8, 영양막 당단백질(TPBG), UL16-결합 단백질(ULBP) 1, ULBP2, ULBP3, ULBP4, ULBP5, ULBP6, 혈관 내피 성장 인자 수용체 2(VEGFR2), 및 빌름스 종양 1(WT-1) 유전자.

특정 실시예에서, 표적 유전자는 다음으로 이루어진 군으로부터 선택된다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC (TCRα), IL10Rα, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, 및 BCL11A 유전자.

특정 실시예에서, 표적 유전자는 TRAC(TCRα), CBL-B, 또는 PDCD1(PD-1) 유전자이다.

일 실시예에서, 표적 유전자는 TRAC 유전자, CBL-B 유전자, 또는 PD-1 유전자이다. 특정 실시예에서, 표적 유전자/부위는 서열번호 1, 2 또는 3에 제시된 뉴클레오티드 서열을 포함한다.

일 실시예에서, 인간 TRAC(TCRα) 유전자를 표적화하는 재프로그래밍된 I-OnuI LHE 또는 I-OnuI 변이체는 기존 I-OnuI 변이체로부터 생성되었다. 일 실시예에서, 재프로그래밍된 I-OnuI LHE는 서열번호 1에 제시된 인간 TRAC 유전자 표적 부위에 대해 생성하였다.

또 다른 실시예에서, 인간 PDCD1(PD-1) 유전자를 표적화하는 재프로그래밍된 I-OnuI LHE 또는 I-OnuI 변이체는 기존 I-OnuI 변이체로부터 생성되었다. 일 실시예에서, 재프로그래밍된 I-OnuI LHE는 서열번호 2에 제시된 인간 PD-1 유전자 표적 부위에 대해 생성되었다.

또 다른 실시예에서, 인간 CBL-B 유전자를 표적화하는 재프로그래밍된 I-OnuI LHE 또는 I-OnuI 변이체는 기존 I-OnuI 변이체로부터 생성되었다. 일 실시예에서, 재프로그래밍된 I-OnuI LHE는 서열번호 3에 제시된 인간 CBL-B 유전자 표적 부위에 대해 생성되었다.

특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE 변이체는 서열번호 89, 92, 95, 98, 101 또는 102 내지 106 중 어느 하나에 제시된 I-OnuI의 DNA 인식 계면에서 하나 이상의 아미노산 치환 또는 변형, 이의 생물학적으로 활성인 단편, 및/또는 이의 추가 변이체를 포함한다.

특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 재프로그래밍된 I-OnuI LHE 또는 I-OnuI 변이체는 DNA 인식 계면에서 하나 이상의 아미노산 치환을 포함한다. 특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE는 I-OnuI의 DNA 인식 계면(Taekuchi 등 2011. Proc Natl Acad Sci U. S. A. 2011 Aug 9; 108(32): 13077-13082) 또는 서열번호 89, 92, 95, 98, 101 또는 102 내지 106에 제시된 I-OnuI LHE 변이체, 또는 이의 추가 변이체와 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 포함한다.

일 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE는 I-OnuI의 DNA 인식 계면(Taekuchi 등 2011. Proc Natl Acad Sci U. S. A. 2011 Aug 9; 108(32): 13077-13082) 또는 서열번호 89, 92, 95, 98, 101 또는 102 내지 106에 제시된 I-OnuI LHE 변이체, 또는 이들의 추가 변이체와 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 97%, 보다 바람직하게는 적어도 99% 서열 동일성을 포함한다.

특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE 변이체는, DNA 인식 계면, 특히 I-OnuI(서열번호 102 내지 106)의 위치 24 내지 50, 68 내지 82, 180 내지 203 및 223 내지 240으로부터 위치한 서브도메인, 서열번호 89, 92, 95, 98, 및 101로 제시된 I-OnuI 변이체, 이들의 생물학적으로 활성인 단편, 및/또는 이들의 추가 변이체에 하나 이상의 아미노산 치환 또는 변형을 포함한다.

특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE 변이체는 다음으로 이루어진 군으로부터 선택된 아미노산 위치에서 DNA 인식 계면에 하나 이상의 아미노산 치환 또는 변형을 포함한다: I-OnuI(서열번호 103 내지 107) 또는 서열번호 89, 92, 95, 98, 및 101로 제시된 I-OnuI 변이체, 이들의 생물학적으로 활성인 단편, 및/또는 이들의 추가 변이체의 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72, 75, 76, 78, 80, 82, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238, 및 240 .

일 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE 변이체는 전체 I-OnuI 서열 내의 임의의 위치에 위치한 추가 위치에서 하나 이상의 아미노산 치환 또는 변형을 포함한다. 치환 및/또는 변형될 수 있는 잔기는 핵산 표적과 접촉하거나, 직접적으로 또는 물 분자를 통해 핵산 골격 또는 뉴클레오티드 염기와 상호작용하는 아미노산을 포함하지만, 이에 한정되지 않는다. 하나의 비제한적인 실시예에서, 표적 유전자에 결합하여 이를 절단하는 본원에서 고려되는 I-OnuI LHE 변이체는 서열번호 102 내지 106의 I-OnuI 또는 서열번호 89, 92, 95, 98, 및 101로 제시된 I-OnuI 변이체, 이들의 생물학적으로 활성인 단편, 및/또는 이들의 추가 변이체의 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 61, 68, 70, 72, 75, 76, 78, 80, 82, 85, 116, 135, 138, 143, 147, 159, 164, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 210, 223, 225, 227, 229, 231, 232, 234, 236, 238, 240, 및 246으로 이루어진 군의 위치로부터 선택되는 적어도 하나의 위치에 하나 이상의 치환 및/또는 변형, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 15개, 바람직하게는 적어도 20개, 보다 바람직하게는 적어도 25개, 보다 바람직하게는 적어도 30개, 보다 더 바람직하게는 적어도 35, 또는 보다 더 바람직하게는 적어도 40개의 치환 및/또는 변형을 포함한다.

특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE 변이체는 서열번호 102 내지 106의 I-OnuI 또는 서열번호 89, 92, 95, 98, 및 101로 제시된 I-OnuI 변이체, 이들의 생물학적으로 활성인 단편, 및/또는 이들의 추가 변이체의 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 61, 68, 70, 72, 75, 76, 78, 80, 82, 85, 116, 135, 138, 143, 147, 159, 164, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 210, 223, 225, 227, 229, 231, 232, 234, 236, 238, 240, 및 246으로 이루어진 군으로부터 선택되는 아미노산위치에 적어도 5개, 적어도 15개, 바람직하게는 적어도 25개, 보다 바람직하게는 적어도 35개, 또는 보다 더 바람직하게는 적어도 40 개 이상의 아미노산 치환을 포함한다.

특정 실시예에서, 표적 유전자에 결합하여 이를 절단하는 I-OnuI LHE 변이체는서열번호 89, 92, 95, 98, 및 101 중 어느 하나에 제시된 아미노산 서열과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 또는 보다 더 바람직하게는 적어도 95% 동일한 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, I-OnuI LHE 변이체는 서열번호 89, 92, 95, 98, 및 101 중 어느 하나에 제시된 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, I-OnuI LHE 변이체는 서열번호 89에 제시된 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, I-OnuI LHE 변이체는 서열번호 92에 제시된 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, I-OnuI LHE 변이체는 서열번호 95에 제시된 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, I-OnuI LHE 변이체는 서열번호 98에 제시된 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, I-OnuI LHE 변이체는 서열번호 101에 제시된 아미노산 서열, 또는 이의 생물학적으로 활성인 단편을 포함한다.

2. DNA-결합 도메인

다양한 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 DNA-결합 도메인을 포함한다. 특정 실시예에서, DNA-결합 도메인은 귀소 엔도뉴클레아제의 N-말단에 위치한다. 특정 실시예에서, 융합 폴리펩티드는, 말단 가공 도메인(예: 엑소뉴클레아제)의 N-말단에 대해 N-말단인, 귀소 엔도뉴클레아제의 N-말단에 대해 위치된 DNA-결합 도메인을 포함한다. 즉, 귀소 엔도뉴클레아제는 DNA-결합 도메인과 엑소뉴클레아제 사이에 끼워진다. 따라서, N-말단에서 C-말단 순서로, 본원에서 고려되는 예시적인 융합 폴리펩티드는 DNA-결합 도메인, 제1 폴리펩티드 링커, 귀소 엔도뉴클레아제, 제2 폴리펩티드 링커, 및 엑소뉴클레아제를 포함한다.

일 측면에서, DNA-결합 도메인은 TALE DNA-결합 도메인을 포함한다. 특정 실시예에서, 융합 폴리펩티드는 메가TAL을 포함한다. “메가TAL”은 표적 유전자 내의 DNA 표적 서열에 결합하여 이를 절단하는 귀소 엔도뉴클레아제 변이체 및 TALE DNA-결합 도메인을 포함하는 폴리펩티드를 지칭하며, 하나 이상의 링커 및/또는 추가 기능성 도메인, 예를 들어 5’-3’ 엑소뉴클레아제, 5’-3’ 알칼리 엑소뉴클레아제, 3’-5’ 엑소뉴클레아제(예를 들어, Trex2), 5’ 플랩 엔도뉴클레아제, 헬리카제, 또는 템플릿-독립적 DNA 중합효소 활성을 나타내는 말단-가공 효소의 말단-가공 효소 도메인을 추가로 포함한다.

다양한 실시예에서, 귀소 엔도뉴클레아제 변이체를 포함하는 메가TAL은 표적 유전자에서의 이중-가닥 절단(DSB)을 도입하도록 재프로그래밍된다. 일부 실시예에서, 귀소 엔도뉴클레아제 변이체를 포함하는 메가TAL은 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및/또는 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자의 표적 서열에 이중 가닥 절단을 도입하도록 재프로그래밍된다. 일부 실시예에서, 귀소 엔도뉴클레아제 변이체를 포함하는 메가TAL은 인간 TRAC 유전자, PD-1 유전자, 또는 CBL-B 유전자(예를 들어, 각각 서열번호 1 내지 3)에서 표적 서열에 이중 가닥 절단을 도입하도록 재프로그래밍된다.

“TALE DNA-결합 도메인”은 전사 활성제-유사 효과기(TALE 또는 TAL-효과기)의 DNA 결합 부분으로서, 이는 식물 전사체를 조작하기 위한 식물 전사 활성제를 모방한다(예를 들어, Kay 등, 2007. Science 318:648-651 참조). 특정 실시예에서 고려되는 TALE DNA-결합 도메인은 조작된 새로운 또는 자연 발생 TALE, 예를 들어잔토모나스 캄페스트리스 pv. 베지카토리아, 잔토모나스 가드네리, 잔토모나스 트랜스루센스, 잔토모나스 악소노포디스, 잔토모나스 퍼포란스, 잔토모나스 알팔파, 잔토모나스 시트리, 잔토모나스 유베지카토리아, 및 잔토모나스 오리재로부터 유래한 AvrBs3 및 랄스토니아 솔라나세아룸으로부터 유래한 brg11 및 hpx17이다. DNA-결합 도메인을 유도하고 설계하기 위한 TALE 단백질의 예시적인 예는 미국 특허 제9,017,967호 및 동 특허에 인용된 참조 문헌에 개시되어 있으며, 이들 모두는 그 전체가 참조로서 본원에 통합된다.

특정 실시예에서, TALE DNA-결합 도메인은 TALE DNA-결합 도메인이 상응하는 표적 DNA 서열에 결합하는 데 관여하는 하나 이상의 반복 단위를 포함한다. 단일 “반복 단위”(또한 “반복”으로도 지칭됨)는 일반적으로 33 내지 35개 아미노산의 길이이다. 각각의 TALE DNA-결합 도메인 반복 단위는 일반적으로 반복의 위치 12 및/또는 13에서, 반복 가변 이잔기(Repeat Variable Di-Residue, RVD)를 구성하는 1개 또는 2개의 DNA 결합 잔기를 포함한다. 이들 TALE DNA-결합 도메인의 DNA 인식을 위한 천연(정형) 코드는 위치 12 및 13에서의 HD 서열이 시토신(C)에 대한 결합으로 이어지고, NG가 T에 결합하고, NI가 A에 결합하고, NN이 G 또는 A에 결합하고, NG가 T에 결합하도록 결정되었다. 특정 실시예에서, 비-정형(비정형) RVD가 고려된다.

특정 실시예에서 고려되는 특정 메가TAL에 사용하기에 적합한 비-정형 RVD의 예시적인 예는 구아닌(G)의 인식을 위한 HH, KH, NH, NK, NQ, RH, RN, SS, NN, SN, KN; 아데닌(A)의 인식을 위한 NI, KI, RI, HI, SI; 티민(T)의 인식을 위한 NG, HG, KG, RG; 시토신(C)의 인식을 위한 RD, SD, HD, ND, KD, YG; A 또는 G의 인식을 위한 NV, HN; 및 A 또는 T 또는 G 또는 C의 인식을 위한 H*, HA, KA, N*, NA, NC, NS, RA, S*를 포함하지만 이에 한정되지 않으며, 여기서 (*)는 위치 13에서의 아미노산이 부재함을 의미한다. 특정 실시예에서 고려되는 특정 메가TAL에서 사용하기에 적합한 RVD의 추가적인 예시적인 예는 미국 특허 제8,614,092호에 개시된 것들을 추가로 포함하며, 동 특허는 그 전체가 참조로서 본원에 통합된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 3 내지 30개의 반복 단위를 포함하는 TALE DNA-결합 도메인을 포함한다. 특정 실시예에서, TALE DNA-결합 도메인은 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 TALE DNA-결합 도메인 반복 단위를 포함한다. 바람직한 실시예에서, TALE DNA-결합 도메인은 5 내지 15개의 반복 단위, 보다 바람직하게는 7 내지 15개의 반복 단위, 보다 바람직하게는 9 내지 15개의 반복 단위, 및 보다 바람직하게는 9, 10, 11, 12, 13, 14 또는 15개의 반복 단위를 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은, 3 내지 30개의 반복 단위 및 TALE 반복 단위 세트의 C 말단에 위치한 20개의 아미노산을 포함하는 추가의 단일 절단된 TALE 반복 단위, 즉 추가의 C 말단 반수-TALE DNA-결합 도메인 반복 단위(아래, 본원의 다른 곳에 개시된 C-캡의 아미노산 -20 내지 -1)를 포함하는 TALE DNA-결합 도메인을 포함한다. 따라서, 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 3.5 내지 30.5개의 반복 단위를 포함하는 TALE DNA-결합 도메인을 포함한다. 특정 실시예에서, 융합 폴리펩티드 또는 메가TAL은 3.5, 4.5, 5.5, 6.5, 7.5, 8.5, 9.5, 10.5, 11.5, 12.5, 13.5, 14.5, 15.5, 16.5, 17.5, 18.5, 19.5, 20.5, 21.5, 22.5, 23.5, 24.5, 25.5, 26.5, 27.5, 28.5, 29.5, 또는 30.5개의 TALE DNA-결합 도메인 반복 단위를 포함한다. 바람직한 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 5.5 내지 15.5개의 반복 단위, 보다 바람직하게는 7.5 내지 15.5개의 반복 단위, 보다 바람직하게는 9.5 내지 15.5개의 반복 단위, 및 보다 바람직하게는 9.5, 10.5, 11.5, 12.5, 13.5, 14.5, 또는 15.5개의 반복 단위를 포함하는 TALE DNA-결합 도메인을 포함한다.

특정 실시예에서, 융합 폴리펩티드 또는 메가TAL은 “N-말단 도메인(NTD)” 폴리펩티드, 하나 이상의 TALE 반복 도메인/단위, “C-말단 도메인(CTD)” 폴리펩티드, 및 귀소 엔도뉴클레아제 변이체를 포함하는 TAL 효과기 아키텍쳐를 포함한다. 일부 실시예에서, NTD, TALE 반복, 및/또는 CTD 도메인은 동일한 종으로부터 유래한다. 다른 실시예에서, NTD, TALE 반복, 및/또는 CTD 도메인 중 하나 이상은 상이한 종으로부터 유래한다.

본원에서 사용되는 바와 같이, 용어 “N-말단 도메인(NTD)” 폴리펩티드는 자연 발생 TALE DNA-결합 도메인의 N-말단 부분 또는 단편의 측면에 위치하는 서열을 지칭한다. NTD 서열이 존재하는 경우, NTD 서열은 TALE DNA-결합 도메인 반복 단위가 DNA에 결합하는 능력을 보유하는 한, 임의의 길이일 수 있다. 특정 실시예에서, NTD 폴리펩티드는 TALE DNA-결합 도메인에 대한 N-말단에서 적어도 120개 내지 적어도 140개의 아미노산을 포함한다(0은 가장 N-말단에 있는 반복 단위의 아미노산 1임). 특정 실시예에서, NTD 폴리펩티드는 TALE DNA-결합 도메인에 대한 N-말단에서 적어도 약 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 또는 적어도 140개의 아미노산을 포함한다. 일 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 잔토모나스 TALE 단백질의 적어도 약 아미노산 +1 내지 +122개 내지 적어도 약 +1 내지 +137개로 이루어진 NTD 폴리펩티드를 포함한다(0은 가장 N-말단에 있는 반복 단위의 아미노산 1임). 특정 실시예에서, NTD 폴리펩티드는 잔토모나스 TALE 단백질의 TALE DNA-결합 도메인에 대한 N-말단에서 적어도 약 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 또는 137개의 아미노산을 포함한다. 일 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 랄스토니아(랄스토니아) TALE 단백질의 적어도 약 아미노산 +1 내지 +121개로 이루어진 NTD 폴리펩티드를 포함한다(0은 가장 N-말단에 있는 반복 단위의 아미노산 1임). 특정 실시예에서, NTD 폴리펩티드는 랄스토니아 TALE 단백질의 TALE DNA-결합 도메인에 대한 N-말단에서 적어도 약 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 또는 137개의 아미노산을 포함한다.

본원에서 사용되는 바와 같이, 용어 “C-말단 도메인(CTD)” 폴리펩티드는 자연 발생 TALE DNA-결합 도메인의 C-말단 부분 또는 단편의 측면에 위치하는 서열을 지칭한다. CTD 서열이 존재하는 경우, CTD 서열은 TALE DNA-결합 도메인 반복 단위가 DNA에 결합하는 능력을 보유하는 한, 임의의 길이일 수 있다. 특정 실시예에서, CTD 폴리펩티드는 TALE DNA-결합 도메인에 대한 C-말단에서 적어도 20개 내지 적어도 85개의 아미노산을 포함한다(처음 20개의 아미노산은 마지막 C-말단 전체 반복 단위에 대한 C-말단에 있는 반수-반복 단위임). 특정 실시예에서, CTD 폴리펩티드는 TALE DNA-결합 도메인의 마지막 전체 반복 단위에 대한 C-말단에서 적어도 약 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 443, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75 , 76, 77, 78, 79, 80, 81, 82, 83, 84, 또는 적어도 85개의 아미노산을 포함한다. 일 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 잔토모나스 TALE 단백질의 적어도 약 아미노산 -20 내지 -1개로 이루어진 CTD 폴리펩티드를 포함한다(-20은 마지막 C-말단 전체 반복 단위에 대해 C-말단에 있는 반수-반복 단위의 아미노산 1임). 특정 실시예에서, CTD 폴리펩티드는 잔토모나스 TALE 단백질의 TALE DNA-결합 도메인의 마지막 전체 반복에 대한 C-말단에서 적어도 약 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산을 포함한다. 일 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 랄스토니아 TALE 단백질의 적어도 약 아미노산 -20 내지 -1개로 이루어진 CTD 폴리펩티드를 포함한다(-20은 마지막 C-말단 전체 반복 단위에 대해 C-말단에 있는 반수-반복 단위의 아미노산 1임). 특정 실시예에서, CTD 폴리펩티드는 랄스토니아 TALE 단백질의 TALE DNA-결합 도메인의 마지막 전체 반복에 대한 C-말단에서 적어도 약 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산을 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은, 표적 서열에 결합하도록 조작된 TALE DNA-결합 도메인, 표적 서열/부위에 결합하여 이를 절단하도록 재프로그래밍된 귀소 엔도뉴클레아제, 및 선택적으로 NTD 및/또는 CTD 폴리펩티드(본원의 다른 곳에서 고려되는 하나 이상의 링커 폴리펩티드와 함께 서로 임의로 결합됨)를 포함하는 융합 폴리펩티드를 포함한다. TALE DNA-결합 도메인 및 선택적으로 NTD 및/또는 CTD 폴리펩티드를 포함하는 융합 폴리펩티드 또는 메가TAL는 링커 폴리펩티드에 융합될 수 있으며, 링커 폴리펩티드는 귀소 엔도뉴클레아제 변이체에 추가로 융합된다는 것이 고려된다. 따라서, TALE DNA-결합 도메인은 귀소 엔도뉴클레아제 변이체의 DNA-결합 도메인에 의해 결합된 표적 서열로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개 뉴클레오티드 이내에 있는 DNA 표적 서열에 결합한다. 이러한 방식으로, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 특이성 및 게놈 편집의 효율을 증가시킨다.

일 실시예에서, 융합 폴리펩티드 또는 메가TAL은: 귀소 엔도뉴클레아제 변이체; 및 재프로그래밍된 귀소 엔도뉴클레아제의 결합/표적 부위의 상류에서 약 4, 5, 또는 6개의 뉴클레오티드, 바람직하게는 6개의 뉴클레오티드 이내에 있는 뉴클레오티드/표적 서열/부위에 결합하는 TALE DNA-결합 도메인을 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 하나 이상의 TALE DNA-결합 반복 단위 및 하기로 이루어진 군으로부터 선택되는 LHE로부터 설계되거나 재프로그래밍된 LHE 변이체를 포함한다: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I 및 이들의 변이체, 또는 바람직하게는 I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI 및 이들의 변이체, 또는 보다 바람직하게는 I-OnuI 및 이들의 변이체.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 NTD, 하나 이상의 TALE DNA-결합 반복 단위, CTD 및 하기로 이루어진 군으로부터 선택되는 LHE 변이체를 포함한다: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I 및 이들의 변이체, 또는 바람직하게는 I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI 및 이들의 변이체, 또는 보다 바람직하게는 I-OnuI 및 이들의 변이체.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 NTD, 약 9.5 내지 약 15.5 TALE DNA-결합 반복 단위, 및 하기로 이루어진 군으로부터 선택되는 LHE 변이체를 포함한다: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I 및 이들의 변이체, 또는 바람직하게는 I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI 및 이들의 변이체, 또는 보다 바람직하게는 I-OnuI 및 이들의 변이체.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은, 약 122개 아미노산 내지 137개 아미노산, 약 9.5개, 약 10.5개, 약 11.5개, 약 12.5개, 약 13.5개, 약 14.5개, 또는 약 15.5개의 결합 반복 단위의 NTD, 약 20개 아미노산 내지 약 85개 아미노산의 CTD, 및 I-OnuI LHE 변이체를 포함한다. 특정 실시예에서, NTD, DNA-결합 도메인, 및 CTD 중 어느 하나, 둘, 또는 전부는 임의의 적절한 조합으로 동일한 종 또는 상이한 종으로부터 설계될 수 있다.

특정 실시예에서, 본원에 고려되는 융합 폴리펩티드 또는 메가TAL은, 약 9.5, 약 10.5, 약 11.5, 약 12.5, 약 13.5, 약 14.5, 또는 약 15.5개 결합 반복 단위를 포함하는 TALE DNA-결합 도메인, 본원의 다른 곳에서 고려되는 귀소 엔도뉴클레아제 변이체, 및 본원의 다른 곳에서 고려되는 말단-가공 도메인(예를 들어, 엑소뉴클레아제), 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 N-말단에서 C-말단 순서로, 약 9.5, 약 10.5, 약 11.5, 약 12.5, 약 13.5, 약 14.5, 또는 약 15.5개 결합 반복 단위를 포함하는 TALE DNA-결합 도메인, 제1 링커 도메인, I-OnuI LHE 변이체, 제2 링커 도메인, 및 말단-가공 효소(예를 들어, 3’에서 5’으로 엑소뉴클레아제) 또는 이의 생물학적으로 활성인 단편을 포함한다. 특정 실시예에서, TALE 결합 반복 중 어느 하나, 둘, 또는 전부는 임의의 적절한 조합으로 동일한 종 또는 상이한 종으로부터 설계될 수 있다. 바람직한 실시예에서, 엑소뉴클레아제는 ExoX 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편이다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 서열번호 서열번호 7, 10, 58, 67, 또는 76 중 어느 하나에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 서열번호 7, 10, 58, 67, 또는 76 중 어느 하나에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-Trex2 융합 단백질은 서열번호 13, 61, 70, 또는 79 중 어느 하나에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-Trex2 융합 단백질은 서열번호 13, 61, 70 또는 79 중 어느 하나에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoX 융합 단백질은 서열번호 46, 64, 73 또는 82 중 어느 하나에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoX 융합 단백질은 서열번호 46, 64, 73 또는 82 중 어느 하나에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoI 융합 단백질은 서열번호 43에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoI 융합 단백질은 서열번호 43에 제시된 아미노산 서열을 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 서열번호 6, 9, 57, 66 또는 75 중 어느 하나에 제시된 mRNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 서열번호 6, 9, 57, 66, 또는 75 중 어느 하나에 제시된 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-Trex2는 서열번호 12, 60, 69, 또는 78 중 어느 하나에 제시된 mRNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-Trex2은 서열번호 12, 60, 69, 또는 78 중 어느 하나에 제시된 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoX는 서열번호 45, 63, 72 또는 81 중 어느 하나에 제시된 mRNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoX는 서열번호 45, 63, 72 또는 81 중 어느 하나에 제시된 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoI는 서열번호 42에 제시된 mRNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 mRNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoI는 서열번호 42에 제시된 mRNA 서열에 의해 암호화된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 서열번호 5, 8, 56, 65, 또는 74 중 어느 하나에 제시된 DNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL은 서열번호 5, 8, 56, 65, 또는 74 중 어느 하나에 제시된 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-Trex2는 서열번호 11, 59, 68, 또는 77 중 어느 하나에 제시된 DNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-Trex2는 서열번호 11, 59, 68, 또는 77 중 어느 하나에 제시된 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL- ExoX는 서열번호 44, 62, 71, 또는 80 중 어느 하나에 제시된 DNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL- ExoX는 서열번호 44, 62, 71, 또는 80 중 어느 하나에 제시된 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoI는 서열번호 41에 제시된 DNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 DNA 서열에 의해 암호화된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드 또는 메가TAL-ExoI는 서열번호 41에 제시된 DNA 서열에 의해 암호화된다.

특정 실시예에서, 메가TAL은 TALE DNA-결합 도메인, 및 서열번호 1 내지 3 중 어느 하나에 제시된 뉴클레오티드 서열에 결합하여 이를 절단하는 I-OnuI LHE 변이체를 포함한다.

또 다른 측면에서, DNA-결합 도메인은 징크 핑거 DNA-결합 도메인을 포함한다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 징크 핑거 DNA-결합 도메인, 본원의 다른 곳에서 고려되는 귀소 엔도뉴클레아제 도메인, 및 본원의 다른 곳에서 고려되는 말단-가공 도메인(예를 들어, 엑소뉴클레아제)을 포함한다.

특정 실시예에서, 징크 핑거 DNA-결합 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 또는 8개 이상의 징크 핑거 모티프를 갖는다. 일반적으로, 단일 징크 핑거 모티프는 약 30개 아미노산의 길이이다. 징크 핑거 모티프는, C₂H₂ 징크 핑거, 및 비-정규 징크 핑거 예컨대, 예를 들어, C₃H 징크 핑거 및 C₄ 징크 핑거 모두를 포함한다.

징크 핑거 DNA-결합 도메인은 임의의 DNA 서열에 결합하도록 조작될 수 있다. 주어진 3 bp DNA 표적 서열에 대한 후보 징크 핑거 DNA-결합 도메인을 식별하였고, 복수의 도메인을 상응하는 복합 DNA 표적 서열에 표적화된 다중-핑거 펩티드에 연결시키기 위한 모듈형 조립 전략을 고안하였다. 당 기술분야에 공지된 다른 적절한 방법을 사용하여, 징크 핑거 DNA-결합 도메인을 암호화하는 핵산, 예를 들어, 파지 디스플레이, 무작위 돌연변이 유발, 조합 라이브러리, 컴퓨터/합리적 설계, 친화도 선택, PCR, cDNA 또는 게놈 라이브러리로부터의 클로닝, 합성 구성 등을 설계하고 작제할 수도 있다. (예를 들어., 미국특허 제5,786,538호; Wu 등, PNAS 92:344-348 (1995); Jamieson 등, Biochemistry 33:5689-5695 (1994); Rebar & Pabo, Science 263:671-673 (1994); Choo & Klug, PNAS 91:11163-11167 (1994); Choo & Klug, PNAS 9 1: 11168-1 1172 (1994); Desjarlais & Berg, PNAS 90:2256-2260 (1993); Desjarlais & Berg, PNAS 89:7345-7349 (1992); Pomerantz 등, Science 267:93-96 (1995); Pomerantz 등, PNAS 92:9752-9756 (1995); Liu 등, PNAS 94:5525-5530 (1997); Griesman & Pabo, Science 275:657-661 (1997); Desjarlais & Berg, PNAS 91:1 1-99-1 1103 (1994)을 참조한다).

개별 징크 핑거 모티프는 3개 또는 4개의 뉴클레오티드 서열에 결합한다. 징크 핑거 결합 도메인이 (예를 들어, 표적 서열에) 결합하도록 조작되는 서열의 길이는 조작된 징크 핑거 DNA-결합 도메인에서 징크 핑거 모티프의 수를 결정할 것이다. 예를 들어, 징크 핑거 모티프가 중첩 하위 부위에 결합하지 않을 때, 6개-뉴클레오티드 표적 서열은 2개-핑거 DNA-결합 도메인에 의해 결합되고; 9개-뉴클레오티드 표적 서열은 3개-핑거 DNA-결합 도메인 의해 결합되는 등이다. 특정 실시예에서, 표적 부위에서의 개별 징크 핑거 모티프에 대한 DNA-결합 부위는 인접할 필요는 없지만, 다중-핑거 결합 도메인에서 징크 핑거 모티프 사이의 링커 서열의 길이 및 성질에 따라 하나 또는 여러 개의 뉴클레오티드에 의해 분리될 수 있다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 하나 이상의 징크 핑거 모티프를 포함하는 징크 핑거 DNA-결합 도메인, 링커, 귀소 엔도뉴클레아제 변이체, 링커, 및 말단-가공 도메인(예를 들어 엑소뉴클레아제)을 포함한다. 특정 실시예에서, 상기 귀소 엔도뉴클레아제는 다음으로 이루어진 군으로부터 선택되는 LHE로부터 설계되거나 재프로그래밍된 LHE 변이체 LHE 변이체이다: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I 및 이들의 변이체, 또는 바람직하게는 I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI 및 이들의 변이체, 또는 보다 바람직하게는 I-OnuI 및 이들의 변이체.

특정 실시예에서, 본원에 고려되는 융합 폴리펩티드는, 2, 3, 4, 5, 6, 7, 또는 8개 또는 그 이상의 징크 핑거 모티프를 포함하는 징크 핑거 DNA-결합 도메인, 본원의 다른 곳에서 고려되는 귀소 엔도뉴클레아제 변이체, 및 본원의 다른 곳에서 고려되는 말단-가공 도메인(예를 들어, 엑소뉴클레아제), 또는 이의 생물학적으로 활성인 단편을 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 N-말단에서 C-말단 순서로, 약 2, 3, 4, 5, 6, 7 또는 8개 또는 그 이상의 징크 핑거 모티프를 포함하는 징크 핑거 DNA-결합 도메인, 제1 링커 도메인, I-OnuI LHE 변이체, 제2 링커 도메인, 및 말단 가공 도메인(예를 들어, 엑소뉴클레아제) 또는 이의 생물학적으로 활성인 단편을 포함한다. 특정 실시예에서, 징크 핑거 모티프의 임의의 하나, 둘, 또는 전부는 임의의 적절한 조합으로 동일한 종 또는 상이한 종으로부터 설계될 수 있다. 바람직한 실시예에서, 엑소뉴클레아제는 ExoX 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편이다.

3. 말단-가공 효소

게놈 편집 조성물(예를 들어, 융합 폴리펩티드) 및 특정 실시예에서 고려되는 방법은 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 말단 가공 효소를 사용하여 세포 게놈을 편집하는 단계를 포함한다. 특정 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체 및 하나 이상의 말단-가공 효소(예를 들어, 엑소뉴클레아제)를 암호화하며, 이들 각각은 링커 도메인(예를 들어 펩티드 링커)에 의해 분리된다.

용어 “말단-가공 효소”는 폴리뉴클레오티드 사슬의 노출된 말단을 변형시키는 효소를 지칭한다. 폴리뉴클레오티드는 이중 가닥 DNA(dsDNA), 단일 가닥 DNA(ssDNA), RNA, DNA 및 RNA의 이중 가닥 하이브리드, 및 합성 DNA(예를 들어, A, C, G, 및 T가 아닌 염기를 함유함)일 수 있다. 말단-가공 효소는 하나 이상의 뉴클레오티드를 첨가하거나, 하나 이상의 뉴클레오티드를 제거하거나, 인산염 기를 제거 또는 변형하고/하거나 하이드록실 기를 제거 또는 변형함으로써, 노출된 폴리뉴클레오티드 사슬 말단을 변형시킬 수 있다. 말단-가공 효소는 엔도뉴클레아제 절단 부위에서 말단을 변형시키거나, (예를 들어, 미세 게이지 바늘의 관통, 가열, 초음파 처리, 미니 비드 텀블링, 및 분무에 의한) 전단, 이온화 방사선, 자외선 방사선, 산소 라디칼, 화학적 가수분해, 및 화학 요법 제제와 같은 다른 화학적 수단 또는 기계적 수단에 의해 생성된 말단을 변형시킬 수 있다.

특정 실시예에서, 특정 실시예에서 고려되는 게놈 편집 조성물 및 방법은 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 DNA 말단-가공 효소를 포함하는 융합 폴리펩티드를 사용하여 세포 게놈을 편집하는 단계를 포함한다.

용어 “DNA 말단-가공 효소”는 DNA의 노출된 말단을 변형시키는 효소를 지칭한다. DNA 말단-가공 효소는 뭉툭한 말단 또는 엇갈린 말단(5’ 또는 3’이 돌출된 말단)을 변형시킬 수 있다. DNA 말단 가공 효소는 단일 가닥 또는 이중 가닥 DNA를 변형시킬 수 있다. DNA 말단 가공 효소는 엔도뉴클레아제 절단 부위에서 말단을 변형시키거나, (예를 들어, 미세 게이지 바늘의 관통, 가열, 초음파 처리, 미니 비드 텀블링, 및 분무에 의한) 전단, 이온화 방사선, 자외선 방사선, 산소 라디칼, 화학적 가수분해, 및 화학 요법 제제와 같은 다른 화학적 수단 또는 기계적 수단에 의해 생성된 말단을 변형시킬 수 있다. DNA 말단 가공 효소는 하나 이상의 뉴클레오티드를 첨가하거나, 하나 이상의 뉴클레오티드를 제거하거나, 인산염 기를 제거 또는 변형하고/하거나 하이드록실 기를 제거 또는 변형함으로써, 노출된 DNA 말단을 변형시킬 수 있다.

본원에서 고려되는 특정 실시예에 사용하기에 적합한 DNA 말단 가공 효소의 예시적인 예는, 5’-3’ 엑소뉴클레아제, 5’-3’ 알칼리 엑소뉴클레아제, 3’-5’ 엑소뉴클레아제, 5’ 플랩 엔도뉴클레아제, 헬리카제, 포스파타아제, 가수분해효소, 및 템플릿 독립적 DNA 중합효소를 포함하지만 이들로 한정되지는 않는다.

본원에서 고려되는 특정 실시예에 사용하기에 적합한 DNA 말단 가공 효소의 추가 예시적인 예는 Trex2, Trex1, 막관통 도메인이 없는 Trex1, 아폴로(Apollo), 아르테미스(Artemis), DNA2, Exo1, ExoT, ExoIII, ExoX, Fen1, Fan1, MreII, Rad2, Rad9, TdT(말단 데옥시뉴클레오티딜 트랜스퍼라제), PNKP, RecE, RecJ, RecQ, 람다 엑소뉴클레아제, Sox, 우두 DNA 중합효소, 엑소뉴클레아제 I, 엑소뉴클레아제 III, 엑소뉴클레아제 VII, NDK1, NDK5, NDK7, NDK8, WRN, T7-엑소뉴클레아제 유전자 6, 조류 골수아세포 바이러스 통합 단백질 (IN), 블룸(Bloom), 안타르틱 포스파타아제(Antartic Phophatase), 알칼리 포스파타아제(Alkaline Phosphatase), 폴리뉴클레오티드 키나제(PNK), ApeI, 녹두 뉴클레아제, Hex1, TTRAP (TDP2), Sgs1, Sae2, CUP, Pol mu, Pol 람다, MUS81, EME1, EME2, SLX1, SLX4 및 UL-12를 포함하지만 이들로 한정되지는 않는다.

특정 실시예에서, 본원에서 고려되는 세포 게놈을 편집하기 위한 게놈 편집 조성물 및 방법은 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 엑소뉴클레아제를 포함하는 융합 폴리펩티드를 포함한다. 용어 “엑소뉴클레아제”는 3’ 또는 5’ 말단에서 인산디에스테르 결합을 절단하는 가수분해 반응을 통해 폴리뉴클레오티드 사슬의 말단에서 인산디에스테르 결합을 절단하는 효소를 지칭한다. 특정 실시예에서, 엑소뉴클레아제는 3´-5´ 엑소뉴클레아제이다. 일부 실시예에서, 엑소뉴클레아제는 ExoX 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편이다. 일부 실시예에서, 엑소뉴클레아제는 ExoI 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편이다. 일부 실시예에서, 엑소뉴클레아제는 Trex2 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편이다.

ExoX는 대장균(E. coli)으로부터의 3’-5’ 분포성 엑소뉴클레아제이며 DnaQ 슈퍼패밀리의 구성원이다. ExoX는 또한 엑소데옥시리보뉴클레아제 10, 엑소데옥시리보뉴클레아제 X, 엑소뉴클레아제 X, 및 Exo X로도 지칭된다. 특정 실시예에서 사용된 예시적인 ExoX 참조 서열 번호는 NP_416358.1; NC_000913.3; WP_000944256.1; NZ_STEB01000009.1AAC74914을 포함하지만 이에 한정되지 않는다.

본원에서 고려되는 바람직한 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 ExoX 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편을 포함한다. 다양한 실시예에서, 융합 폴리펩티드는 링커 도메인(예를 들어, 폴리펩티드 링커)에 의해 ExoX 엑소뉴클레아제에 연결된, DNA-결합 도메인 및 귀소 엔도뉴클레아제 변이체, 또는 이의 생물학적으로 활성인 단편을 포함한다.

다양한 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 85%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 90%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 96%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 97%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 98%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoX는 서열번호 109에 제시된 아미노산 서열과 적어도 99%의 동일성을 갖는 아미노산 서열을 포함한다.

특정 실시예에서, ExoX, 또는 이의 생물학적으로 활성인 단편은 서열번호 109에 제시된 아미노산 서열인 아미노산을 포함한다.

ExoI는 대장균(E. coli)의 3’-5’ 공정 엑소뉴클레아제이며 DnaQ 슈퍼패밀리의 구성원이다. ExoI는 또한 엑소데옥시리보뉴클레아제 I, 엑소뉴클레아제 I, DNA 데옥시리보포스포디에스터라제, 및 dRPase로 지칭된다. 특정 실시예에서 사용된 예시적인 ExoI 참조 서열 번호는 NP_416515.1, NC_000913.3, WP_000980589.1, NZ_LN832404.1을 포함하지만 이에 한정되지 않는다.

본원에서 고려되는 바람직한 실시예에서, 융합 폴리펩티드는 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 ExoI 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편을 포함한다. 다양한 실시예에서, 융합 폴리펩티드는, 링커 도메인(예를 들어 폴리펩티드 링커)에 의해 ExoI 엑소뉴클레아제에 연결된, DNA-결합 도메인 및 귀소 엔도뉴클레아제 변이체, 또는 이의 생물학적으로 활성인 단편을 포함한다.

다양한 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 85%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 90%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 96%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 97%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 98%의 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시예에서, ExoI는 서열번호 112에 제시된 아미노산 서열과 적어도 99%의 동일성을 갖는 아미노산 서열을 포함한다.

특정 실시예에서, ExoI, 또는 이의 생물학적으로 활성인 단편은 서열번호 112에 제시된 아미노산 서열인 아미노산을 포함한다.

D. 표적 부위

특정 실시예에서 고려되는 귀소 엔도뉴클레아제 변이체는 임의의 적절한 표적 서열(예를 들어 인간 게놈 내의 서열)에 결합하도록 설계될 수 있고, 자연적으로 발생하는 뉴클레아제와 비교하여 신규한 결합 특이성을 가질 수 있다. 특정 실시예에서, 표적 부위는 프로모터, 인핸서, 억제자 요소 등을 포함하지만 이에 한정되지 않는 유전자의 조절 영역이다. 특정 실시예에서, 표적 부위는 유전자 또는 스플라이스 부위의 코딩 영역이다. 특정 실시예에서, 뉴클레아제 변이체 및 공여자 복구 템플릿은 치료 폴리뉴클레오티드를 삽입하도록 설계될 수 있다. 특정 실시예에서, 뉴클레아제 변이체 및 공여자 복구 템플릿은 내인성 유전자 조절 요소 또는 발현 조절 서열의 조절 하에 치료 폴리뉴클레오티드를 삽입하도록 설계될 수 있다. 다양한 실시예에서, 뉴클레아제 변이체는 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및/또는 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자에서 표적 서열에 결합하여 이를 절단한다.

면역계 체크포인트 유전자의 예시적인 예는 PD-1, LAG-3, TIM-3, CTLA-4, BTLA, TIGIT, VISTA, 및 KIR을 포함하나 이에 한정되지 않는다.

면역억제 신호전달 성분을 암호화하는 유전자의 예시적인 예는 IL-10Rα, TGFβR1, TGFβR2, AHR, SGK1, TSC2, VHL, A2AR, 및 CBL-B를 포함하지만, 이에 한정되지 않는다.

γ-글로빈 유전자 발현 및 HbF를 억제하는 폴리펩티드의 예시적인 예는 BCL11A, KLF1, SOX6, GATA1, 및 LSD1을 포함하지만, 이들로 한정되지는 않는다.

다양한 실시예에서, 뉴클레아제 변이체는 다음으로 이루어진 군으로부터 선택되는 유전자의 표적 서열에 결합하여 이를 절단한다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), TCRβ, IL10Rα, IL10Rβ, TGFBR1, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, BCL11A, KLF1, SOX6, GATA1, LSD, 알파 엽산 수용체(FRα), αvβ6 인테그린, B 세포 성숙 항원(BCMA), B7-H3 (CD276), B7-H6, 탄산 탈수효소 IX(CAIX), CD16, CD19, CD20, CD22, CD30, CD33, CD37, CD38, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD133, CD138, CD171, 암배아 항원(CEA), C형 렉틴-유사 분자-1(CLL-1), CD2 서브세트 1(CS-1), 콘드로이틴 설페이트 프로테오글리칸 4(CSPG4), 피부 T 세포 림프종-관련 항원 1(CTAGE1), 상피 성장 인자 수용체(EGFR), 상피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP2), 상피 당단백질 40(EGP40), 상피 세포 부착 분자(EPCAM), 에프린 A형 수용체 2(EPHA2), 섬유아세포 활성화 단백질(FAP), Fc 수용체 유사 5(FCRL5), 태아 아세틸콜린에스터라제 수용체(AchR), 강글리오시드 G2(GD2), 강글리오시드 G3(GD3), 글리피칸-3(GPC3), ErbB2를 포함하는 EGFR 패밀리(HER2), IL-11Rα, IL-13Rα2, 카파 암/고환 항원 2(LAGE-1A), 람다, 루이스-Y(LeY), L1 세포 부착 분자(L1-CAM), 흑색종 항원 유전자(MAGE)-A1, MAGE-A3, MAGE-A4, MAGE-A6, MAGEA10, T 세포 1에 의해 인식되는 흑색종 항원(MelanA 또는 MART1), 메소텔린(MSLN), MUC1, MUC16, MHC 클래스 I 사슬 관련 단백질 A(MICA), MHC 클래스 I 사슬 관련 단백질 B(MICB), 신경 세포 부착 분자(NCAM), 암/고환 항원 1(NY-ESO-1), 폴리시알산; 태반-특이적 1(PLAC1), 흑색종에서 우선적으로 발현되는 항원(PRAME), 전립선 줄기 세포 항원(PSCA), 전립선-특이적 막 항원(PSMA), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 윤활막 육종, X 중단점 2(SSX2), 서바이빈, 종양 결합된 당단백질 72(TAG72), 종양 내피 마커 1(TEM1/CD248), 종양 내피 마커 7-관련(TEM7R), TEM5, TEM8, 영양막 당단백질(TPBG), UL16-결합 단백질(ULBP) 1, ULBP2, ULBP3, ULBP4, ULBP5, ULBP6, 혈관 내피 성장 인자 수용체 2(VEGFR2), 및 빌름스 종양 1(WT-1) 유전자.

특정 실시예에서, 표적 유전자는 다음으로 이루어진 군으로부터 선택된다: 세포예정사 단백질 1(PD-1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), IL10Rα, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, 및 BCL11A 유전자.

다양한 실시예에서, 뉴클레아제 변이체는 TRAC 유전자의 표적 서열에 결합하여 이를 절단한다. T-세포 수용체 알파(TRAC) 유전자좌는 인간에서 TRA 유전자에 의해 암호화되는 단백질이다. TRAC는 TRA, IMD7, TCRA, TRA@, TRAC, T-세포 수용체 알파 유전자좌, TCRD, T 세포 수용체 알파 유전자좌, TCRα로도 지칭된다. 이는 더 큰 TCR 단백질(T-세포 수용체)에 알파 사슬을 기여한다. 알파-베타 T 세포 수용체는 면역 반응에 필수적이며 T 림프구의 세포 표면에 존재하는 항원 특이적 수용체이다. 이들은 병원균에 대한 효율적인 T 세포 적응 면역의 전제 조건인 항원 제시 세포(APC)에 의해 표시되는 펩티드-주요 조직적합성(MH)(pMH) 복합체를 인식한다.

특정 실시예에서, 뉴클레아제 변이체는 인간 TCRα 유전자의 불변 영역의 엑손 1에, 바람직하게는 인간 TCRα 유전자의 불변 영역의 엑손 1에서의 서열번호 1에서, 보다 바람직하게는 인간 TCRα 유전자의 불변 영역의 엑손 1에서의 서열번호 1에서의 서열 “ATTC”에서 DSB를 도입한다. 바람직한 실시예에서, TCRα 유전자는 인간 TCRα 유전자이다.

다양한 실시예에서, 귀소 엔도뉴클레아제 변이체는 세포예정사 수용체 1(PD-1) 유전자 내의 표적 서열에 결합하여 이를 절단한다. PD-1은 또한 세포예정사 1(PDCD1), 전신성 홍반성 루푸스 감수성 2(SLEB2), CD279, HPD1, PD1, HPD-L, 및 HSLE1로 지칭된다. PD-1은 공자극 수용체의 B7/CD28 계열의 구성원이다. PD-1 분자는 세포외 리간드 결합 IgV 도메인, 막관통 도메인, 및 면역 티로신-기반 억제 모티프(ITIM) 및 면역 수용체 억제 티로신-기반 전환 모티프(ITSM)와 함께 위치된 잠재적 인산화 부위를 갖는 세포 내 도메인으로 구성된다. PD-1은 T 세포, Treg, 고갈된 T 세포, B 세포, 활성화된 단핵구, 수지상 세포(DC), 자연 살해(NK) 세포 및 자연 살해 T(NKT) 세포에서 발현되는 억제 공동 수용체이다. PD-1은 그 리간드, 세포예정사 리간드 1(PD-L1) 및 세포예정사 리간드 2(PD-L2)에 대한 결합을 통해 T 세포 활성화를 음성으로 조절한다. PD-1 결합은 T 세포 증식, 및 인터페론-γ(IFN-γ), 종양 괴사 인자-α, 및 IL-2 생성을 억제하고, T 세포 생존을 감소시킨다. PD-1 발현은 높은 수준의 자극을 경험한 “고갈된” T 세포의 특징이다. 만성 감염 및 암 동안 발생하는 이러한 고갈 상태는 T-세포 기능장애를 특징으로 하며, 이는 감염 및 종양에 대한 차선의 조절을 초래한다.

특정 실시예에서, 귀소 엔도뉴클레아제 변이체는 PD-1 유전자의 엑손 1에, 바람직하게는 PD-1 유전자의 엑손 1의 서열번호 2에서, 보다 바람직하게는 PD-1 유전자의 엑손 1의 서열번호 2의 서열 “ATCC”에서 이중-가닥 절단을 도입한다. 바람직한 실시예에서, 귀소 엔도뉴클레아제 변이체 또는 메가TAL은 이중-가닥 DNA를 절단하고, 서열번호 2에 제시된 폴리뉴클레오티드 서열에 DSB를 도입한다. 바람직한 실시예에서, PD-1 유전자는 인간 PD-1 유전자이다.

다양한 실시예에서, 귀소 엔도뉴클레아제 변이체는 인간 카시타스 B-계열(Cbl) 림프종 원종양유전자 B(CBLB) 유전자에서 표적 서열에 결합하여 이를 절단한다. CBL은 CBL2; 청소년 골수단핵구성 백혈병(NSLL)을 동반하거나 동반하지 않는 누난 증후군 유사 장애; C-CBL; RING 핑거 단백질 55(RNF55); 취약 부위, 엽산 유형, 희귀, fra (11)(q23.3) (FRA11B); E3 유비퀴틴-단백질 리가제 CBL; Cas-Br-M (뮤린) 환경친화성 레트로바이러스 형질전환 서열; Cbl 원종양유전자, E3 유비퀴틴 단백질 리가제; RING-형 E3 유비퀴틴 트랜스퍼라제 CBL; 카시타스 B-계열 림프종 원종양유전자; 종양유전자 CBL2; 원종양유전자 c-Cbl; 및 신호 전달 단백질 CBL로도 지칭된다.

이 유전자는 RING 핑거 E3 유비퀴틴 리가제를 암호화하는 원종양유전자이다. 암호화된 단백질은 프로테아좀에 의한 분해를 위해 기질을 표적화하는 데 필요한 효소 중 하나이다. 이 단백질은 유비퀴틴 접합 효소(E2)로부터 특정 기질로 유비퀴틴의 전달을 매개한다. 이 단백질은 또한 N-말단 포스포티로신 결합 도메인을 포함하고 있어 수 많은 티로신-인산화 기질과 상호작용하고 프로테아좀 분해를 목표로 삼을 수 있다. CBLB는 T 세포 활성화 및 지속성을 포함하는 많은 신호 전달 경로의 음성 조절자로서 기능한다.

바람직한 실시예에서, 귀소 엔도뉴클레아제 변이체는 CBLB 유전자에서의 표적 부위에 이중 가닥 절단(DSB)을 도입한다. 바람직한 실시예에서, 귀소 엔도뉴클레아제 변이체 또는 메가TAL은 CBLB 유전자의 엑손 6에, 바람직하게는 CBLB 유전자의 엑손 6의 서열번호 3에서, 보다 바람직하게는 CBLB 유전자의 엑손 6의 서열번호 3의 서열 “ATTC”에서 DSB를 도입한다. 바람직한 실시예에서, 귀소 엔도뉴클레아제 변이체는 이중-가닥 DNA를 절단하고, 서열번호 3에 제시된 폴리뉴클레오티드 서열에 DSB를 도입한다. 바람직한 실시예에서, CBLB 유전자는 인간 CBLB 유전자이다.

E. 공여자 복구 템플릿

귀소 엔도뉴클레아제 변이체를 포함하는 융합 폴리펩티드가 표적 서열에서 DSB를 도입하는 데 사용될 수 있고; DSB는 하나 이상의 공여자 복구 템플릿이 있을 때 상동성 유도 복구(HDR) 메커니즘을 통해 복구될 수 있다. 특정 실시예에서, 공여자 복구 템플릿은 게놈 내에 서열을 삽입하는 데 사용된다. 특히 바람직한 실시예에서, 공여자 복구 템플릿은 치료 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 삽입하는 데 사용된다. 특히 바람직한 실시예에서, 공여자 복구 템플릿은 치료 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 삽입하는 데 사용되어, 폴리펩티드의 발현이 내인성 프로모터 및/또는 인핸서의 조절 하에 있다.

다양한 실시예에서, 공여자 복구 템플릿은 공여자 복구 템플릿을 포함하는 아데노-연관 바이러스(AAV), 레트로바이러스, 예를 들어, 렌티바이러스, IDLV, 등, 단순 포진 바이러스, 아데노바이러스, 또는 우두 바이러스 벡터로 세포를 형질도입함으로써 조혈 세포, 예를 들어, 조혈 줄기 또는 전구 세포, 또는 CD34⁺세포 내에 도입된다.

특정 실시예에서, 공여자 복구 템플릿은 DSB 부위의 측면에 위치하는 하나 이상의 상동성 아암을 포함한다.

본원에서 사용되는 바와 같이, 용어 “상동성 아암(homology arm)”은 뉴클레아제에 의해 표적 부위에 도입된 DNA 절단의 측면에 위치하는 DNA 서열과 동일하거나 거의 동일한 공여자 복구 템플릿 내의 핵산 서열을 지칭한다. 일 실시예에서, 공여자 복구 템플릿은 DNA 절단 부위의 5’에 있는 DNA 서열과 동일하거나 거의 동일한 핵산 서열을 포함하는 5’ 상동성 아암을 포함한다. 일 실시예에서, 공여자 복구 템플릿은 DNA 절단 부위의 3’에 있는 DNA 서열과 동일하거나 거의 동일한 핵산 서열을 포함하는 3’ 상동성 아암을 포함한다. 바람직한 실시예에서, 공여자 복구 템플릿은 5’ 상동성 아암 및 3’ 상동성 아암을 포함한다. 공여자 복구 템플릿은 DSB 부위에 바로 인접한 게놈 서열에 대한 상동성, 또는 DSB 부위로부터 임의의 수의 염기쌍 이내에 있는 게놈 서열에 대한 상동성을 포함할 수 있다. 일 실시예에서, 공여자 복구 템플릿은 게놈 서열과 약 5 bp, 약 10 bp, 약 25 bp, 약 50 bp, 약 100 bp, 약 250 bp, 약 500 bp, 약 1000 bp, 약 2500 bp, 약 5000 bp, 약 10000 bp 또는 그 이상 (상동성 서열의 임의의 개재된 길이를 포함함) 상동성인 핵산 서열을 포함한다.

특정 실시예에서 고려되는 적절한 길이의 상동성 아암의 예시적인 예는 독립적으로 선택될 수 있고, 약 100 bp, 약 200 bp, 약 300 bp, 약 400 bp, 약 500 bp, 약 600 bp, 약 700 bp, 약 800 bp, 약 900 bp, 약 1000 bp, 약 1100 bp, 약 1200 bp, 약 1300 bp, 약 1400 bp, 약 1500 bp, 약 1600 bp, 약 1700 bp, 약 1800 bp, 약 1900 bp, 약 2000 bp, 약 2100 bp, 약 2200 bp, 약 2300 bp, 약 2400 bp, 약 2500 bp, 약 2600 bp, 약 2700 bp, 약 2800 bp, 약 2900 bp, 또는 약 3000 bp, 또는 더 긴 (상동성 아암의 개재된 모든 길이를 포함함) 상동성 아암을 포함하지만 이들로 한정되지는 않는다.

적절한 상동성 아암 길이의 추가 예시적인 예는 약 100 bp 내지 약 3000 bp, 약 200 bp 내지 약 3000 bp, 약 300 bp 내지 약 3000 bp, 약 400 bp 내지 약 3000 bp, 약 500 bp 내지 약 3000 bp, 약 500 bp 내지 약 2500 bp, 약 500 bp 내지 약 2000 bp, 약 750 bp 내지 약 2000 bp, 약 750 bp 내지 약 1500 bp, 또는 약 1000 bp 내지 약 1500 bp(상동성 아암의 모든 개재된 길이를 포함함)를 포함하지만 이들로 한정되지는 않는다.

특정 실시예에서, 5’ 및 3’ 상동성 아암의 길이는 약 500 bp 내지 약 1500 bp로부터 독립적으로 선택된다. 일 실시예에서, 5’ 상동성 아암은 약 1500 bp이고, 3’ 상동성 아암은 약 1000 bp이다. 일 실시예에서, 5’ 상동성 아암은 약 200 bp 내지 약 600 bp이고, 3’ 상동성 아암은 약 200 bp 내지 약 600 bp이다. 일 실시예에서, 5’ 상동성 아암은 약 200 bp이고, 3’ 상동성 아암은 약 200 bp이다. 일 실시예에서, 5’ 상동성 아암은 약 300 bp이고, 3’ 상동성 아암은 약 300 bp이다. 일 실시예에서, 5’ 상동성 아암은 약 400 bp이고, 3’ 상동성 아암은 약 400 bp이다. 일 실시예에서, 5’ 상동성 아암은 약 500 bp이고, 3’ 상동성 아암은 약 500 bp이다. 일 실시예에서, 5’ 상동성 아암은 약 600 bp이고, 3’ 상동성 아암은 약 600 bp이다.

F. 폴리펩티드

귀소 엔도뉴클레아제 변이체 및 메가TAL을 포함하지만 이들로 한정되지는 않는 다양한 폴리펩티드가 본원에서 고려된다. 바람직한 실시예에서, 폴리펩티드는 서열번호 7, 10, 13, 19, 22, 25, 28, 31, 34, 37, 40, 43, 46, 49, 52, 55, 58, 61, 64, 67, 70, 73, 76, 79, 82, 89, 92, 95, 98, 및 101 중 어느 하나에 제시된 아미노산 서열을 포함한다. “폴리펩티드”, “폴리펩티드 단편”, “펩티드”, 및 “단백질”은 반대로 명시되지 않는 한, 통상적인 의미에 따라, 즉 아미노산의 서열로서 상호 교환적으로 사용된다. 일 실시예에서, “폴리펩티드”는 융합 폴리펩티드 및 다른 변이체를 포함한다. 폴리펩티드는 잘 알려진 다양한 재조합 기술 및/또는 합성 기술 중 어느 하나를 사용해 제조될 수 있다. 폴리펩티드는 특정 길이로 제한되지 않으며, 예를 들어, 이들은 전장 단백질 서열, 전장 단백질의 단편, 또는 융합 단백질을 포함할 수 있고, 폴리펩티드의 번역 후 변형, 예를 들어, 당질화, 아세틸화, 인산화 등을 비롯하여 당 기술분야에 공지된 다른 변형을 포함할 수 있으며, 자연 발생 및 비자연 발생 변형을 포함할 수 있다.

본원에서 사용되는 바와 같이, “단리된 단백질”, “단리된 펩티드” 또는 “단리된 폴리펩티드” 등은 세포 환경으로부터, 및 세포의 다른 성분과의 결합으로부터 펩티드 또는 폴리펩티드 분자를 시험관 내 합성, 단리, 및/또는 정제하는 것을 지칭하며, 즉, 이는 생체 내 물질과 유의하게 결합하지 않는다.

특정 실시예에서 고려되는 폴리펩티드의 예시적인 예는, 귀소 엔도뉴클레아제 변이체, 메가TAL, 말단-가공 뉴클레아제, 엑소뉴클레아제, 융합 폴리펩티드 및 이들의 변이체를 포함하지만, 이에 한정되지 않는다.

폴리펩티드는 “폴리펩티드 변이체”를 포함한다. 폴리펩티드 변이체는 하나 이상의 아미노산이 치환, 결실, 추가 및/또는 삽입되었다는 점에서 자연 발생 폴리펩티드와 상이할 수 있다. 이러한 변이체는 자연적으로 발생할 수 있거나, 예를 들어 상기 폴리펩티드 서열 중 하나 이상의 아미노산을 변형시킴으로써 합성에 의해 생성될 수 있다. 예를 들어, 특정 실시예에서, 하나 이상의 치환, 결실, 추가, 및/또는 삽입을 폴리펩티드 내에 도입함으로써 표적 부위에 결합하여 이를 절단하는 융합 폴리펩티드, 귀소 엔도뉴클레아제, 메가TAL 등의 생물학적 특성을 개선하는 것이 바람직할 수 있다. 특정 실시예에서, 폴리펩티드는 본원에서 고려된 기준 서열 중 어느 하나에 대해 적어도 약 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 아미노산 동일성을 갖는 폴리펩티드를 포함하며, 일반적으로 여기서 변이체는 기준 서열의 적어도 하나의 생물학적 활성을 유지한다.

폴리펩티드 변이체는 생물학적 활성 “폴리펩티드 단편”을 포함한다. 생물학적 활성 폴리펩티드 단편의 예시적인 예는 DNA-결합 도메인, 뉴클레아제 도메인, 엔도-처리 도메인(예를 들어, 엑소뉴클레아제) 등을 포함한다. 본원에서 사용되는 용어 “생물학적으로 활성인 단편” 또는 “최소 생물학적으로 활성인 단편”은 자연 발생 폴리펩티드 활성의 적어도 100%, 적어도 90%, 적어도 80%, 적어도 70%, 적어도 60%, 적어도 50%, 적어도 40%, 적어도 30%, 적어도 20%, 적어도 10%, 또는 적어도 5%를 보유하는 폴리펩티드 단편을 지칭한다. 바람직한 실시예에서, 생물학적 활성은 표적 서열에 대한 결합 친화도 및/또는 절단 활성이다. 특정 실시예에서, 폴리펩티드 단편은 적어도 5 내지 약 1700개 아미노산 길이의 아미노산 사슬을 포함할 수 있다. 특정 실시예에서, 단편은 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700개 또는 더 이상의 아미노산의 길이이다. 특정 실시예에서, 폴리펩티드는 귀소 엔도뉴클레아제 변이체의 생물학적으로 활성인 단편을 포함한다. 특정 실시예에서, 본원에 제시된 폴리펩티드는 “X”로 표시된 하나 이상의 아미노산을 포함할 수 있다. “X”가 아미노산 서열번호에 존재하는 경우, 이는 임의의 아미노산을 지칭한다. 하나 이상의 “X” 잔기는 본원에서 고려되는 특정 서열번호에 제시된 아미노산 서열의 N-말단 및 C-말단에 존재할 수 있다. “X” 아미노산이 존재하지 않는 경우, 서열번호에 제시된 나머지 아미노산 서열이 생물학적으로 활성인 단편으로 간주될 수 있다.

특정 실시예에서, 폴리펩티드는 귀소 엔도뉴클레아제 변이체, 예를 들어, 서열번호 89, 92, 95, 98, 또는 101, 또는 메가TAL(예를 들어, 서열번호 7, 10, 58, 67, 및 76)의 생물학적으로 활성인 단편을 포함한다. 생물학적으로 활성인 단편은 N-말단 절단 및/또는 C-말단 절단을 포함할 수 있다. 특정 실시예에서, 생물학적으로 활성인 단편은, 상응하는 야생형 귀소 엔도뉴클레아제 서열과 비교해, 귀소 엔도뉴클레아제 변이체의 1, 2, 3, 4, 5, 6, 7 또는 8개의 N-말단 아미노산의 결실이 없거나 이를 포함하고, 보다 바람직하게는, 상응하는 야생형 귀소 엔도뉴클레아제 서열과 비교해, 4개의 N-말단 아미노산의 결실이 없거나 이를 포함한다. 특정 실시예에서, 생물학적으로 활성인 단편은, 상응하는 야생형 귀소 엔도뉴클레아제 서열과 비교해, 귀소 엔도뉴클레아제 변이체의 1, 2, 3, 4, 또는 5개의 C-말단 아미노산의 결실이 없거나 이를 포함하고, 보다 바람직하게는, 상응하는 야생형 귀소 엔도뉴클레아제 서열과 비교해, 2개의 C-말단 아미노산의 결실이 없거나 이를 포함한다. 특정 바람직한 실시예에서, 생물학적으로 활성인 단편은 상응하는 야생형 귀소 엔도뉴클레아제 서열과 비교해 귀소 엔도뉴클레아제 변이체의 4개의 N-말단 아미노산 및 2개의 C-말단 아미노산의 결실이 없거나 이를 포함한다.

특정 실시예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실을 포함하고/하거나; R, G, S, F, V의 1, 2, 3, 4 또는 5개의 C-말단 아미노산의 결실을 포함한다.

특정 실시예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실 또는 치환을 포함하고/하거나; R, G, S, F, V의 1, 2, 3, 4 또는 5개의 C-말단 아미노산의 결실 또는 치환을 포함한다.

특정 실시예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실을 포함하고/하거나; F, V의 1개 또는 2개의 C-말단 아미노산의 결실을 포함한다.

특정 실시예에서, I-OnuI 변이체는 N-말단 아미노산 M, A, Y, M, S, R, R, E 중 1, 2, 3, 4, 5, 6, 7, 또는 8개의 결실 또는 치환을 포함하고/하거나; F, V의 1개 또는 2개의 C-말단 아미노산의 결실 또는 치환을 포함한다.

전술한 바와 같이, 폴리펩티드는 아미노산 치환, 결실, 절단, 및 삽입을 포함하는 다양한 방식으로 변경될 수 있다. 이러한 조작을 위한 방법은 일반적으로 당 기술분야에 공지되어 있다. 예를 들어, 기준 폴리펩티드의 아미노산 서열 변이체는 DNA에서의 돌연변이에 의해 제조될 수 있다. 돌연변이 유발 및 뉴클레오티드 서열 변경을 위한 방법은 당 기술분야에 공지되어 있다. 예를 들어, Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492), Kunkel 등, (1987, Methods in Enzymol, 154: 367-382), 미국 특허 제4,873,192호, Watson, J. D. 등, (Molecular Biology of the Gene, 제4판, Benjamin/Cummings, Menlo Park, Calif., 1987) 및 이에 인용된 문헌을 참조한다. 관심 단백질의 생물학적 활성에 영향을 미치지 않는 적절한 아미노산 치환에 대한 지침은 Dayhoff 등, (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.)의 모델에서 확인될 수 있다.

특정 실시예에서, 변이체는 하나 이상의 보존적 치환을 포함하게 된다. “보존적 치환”은 아미노산이 유사한 특성을 갖는 또 다른 아미노산으로 치환되는 것이므로, 펩티드 화학 분야의 당 기술분야의 숙련자는 폴리펩티드의 이차 구조 및 감수성(hydropathic nature)이 실질적으로 변하지 않을 것으로 예상하게 된다. 변형은 특정 실시예에서 고려되는 폴리뉴클레오티드 및 폴리펩티드의 구조의 변형일 수 있으며, 폴리펩티드는 원하는 특성을 갖는 변이체 또는 유도체 폴리펩티드를 암호화하는 기능적 분자를 적어도 대략 보유하고 여전히 수득하는 폴리펩티드를 포함한다. 폴리펩티드의 아미노산 서열을 변경해서 동등하거나 심지어 개선된 변이체 폴리펩티드를 생성하는 것이 바람직할 때, 예를 들어, 당 기술분야의 숙련자는, 예를 들어, 표 1에 따라, 암호화 DNA 서열의 코돈 중 하나 이상을 바꿀 수 있다.

생물학적 활성을 손상시키지 않고 치환, 삽입, 또는 결실할 수 있는 아미노산 잔기를 결정하는 데 있어서의 지침은 당 기술분야에 잘 알려진 컴퓨터 프로그램, 예를 들어 DNASTAR, DNA Strider, Geneious, Mac 벡터, 또는 Vector NTI 소프트웨어를 사용해 확인할 수 있다. 바람직하게는, 본원에 개시된 단백질 변이체에서의 아미노산 변화는 보존적 아미노산 변화, 즉 유사하게 하전되거나 하전되지 않은 아미노산의 치환이다. 보존적 아미노산 변화는 이들의 측쇄에 관련된 아미노산 군 중 하나의 치환을 포함한다. 자연 발생 아미노산은 일반적으로 다음의 4개의 군으로 나누어진다: 산성(아스파르트산염, 글루탐산염) 아미노산, 염기성(리신, 아르기닌, 히스티딘) 아미노산, 비극성(알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판) 아미노산, 및 하전되지 않은 극성(글리신, 아스파라긴, 글루타민, 시스테인, 세린, 트레온, 티로신) 아미노산. 페닐알라닌, 트립토판, 및 티로신은 때때로 방향족 아미노산으로서 함께 분류된다. 펩티드 또는 단백질에서, 아미노산의 적절한 보존적 치환은 당 기술분야의 숙련자에게 공지되어 있고, 일반적으로 생성되는 분자의 생물학적 활성을 변화시키지 않고 이루어질 수 있다. 당 기술분야의 숙련자는 일반적으로, 폴리펩티드의 비필수 영역에서의 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경시키지 않는다는 것을 인식한다(예를 들어, Watson 등, Molecular Biology of the Gene, 제4판, 1987, The Benjamin/Cummings Pub. Co., p.224 참조).

일 실시예에서, 2개 이상의 폴리펩티드의 발현이 바람직한 경우, 이들을 암호화하는 폴리뉴클레오티드 서열은 본원의 다른 곳에 개시된 바와 같은 IRES 서열에 의해 분리될 수 있다.

특정 실시예에서 고려되는 폴리펩티드는 융합 폴리펩티드, 예를 들어, 서열번호 7, 10, 13, 19, 22, 25, 28, 31, 34, 37, 40, 43, 46, 49, 52, 55, 58, 61, 64, 67, 70, 73, 76, 79, 및 82를 포함한다. 바람직한 실시예에서, 융합 폴리펩티드는 서열번호 46, 64, 73, 및 82 중 어느 하나에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, 융합 폴리펩티드 및 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드가 제공된다. 융합 폴리펩티드 및 융합 단백질은 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 폴리펩티드 분절을 갖는 폴리펩티드를 지칭한다.

또 다른 실시예에서, 2개 이상의 폴리펩티드는 본원의 다른 곳에서 개시된 바와 같은 하나 이상의 자가 절단 폴리펩티드 서열을 포함하는 융합 단백질로서 발현될 수 있다.

일 실시예에서, 본원에서 고려되는 융합 단백질은 하나 이상의 DNA-결합 도메인 및 하나 이상의 뉴클레아제, 및 하나 이상의 링커 및/또는 자가-절단 폴리펩티드를 포함한다.

일 실시예에서, 본원에서 고려되는 융합 단백질은 뉴클레아제 변이체; 링커 또는 자가-절단 펩티드; 및 5´-3´ 엑소뉴클레아제, 5´-3´ 알칼리 엑소뉴클레아제, 및 3´-5´ 엑소뉴클레아제(예를 들어, Trex2, ExoI, 또는 ExoX)를 포함하지만 이에 한정되지 않는 말단-가공 효소를 포함한다.

융합 폴리펩티드는 신호 펩티드, 세포 투과성 펩티드 도메인(CPP), DNA-결합 도메인, 뉴클레아제 도메인, 등, 에피토프 태그(예를 들어, 말토오스 결합 단백질(“MBP”), 글루타티온 S 트랜스퍼라제(GST), HIS6, MYC, FLAG, V5, VSV-G, 및 HA), 폴리펩티드 링커, 및 폴리펩티드 절단 신호를 포함하나 이에 한정되지 않는 하나 이상의 폴리펩티드 도메인 또는 분절을 포함할 수 있다. 융합 폴리펩티드는 일반적으로 C-말단 대 N-말단 결합이지만, C-말단 대 C-말단 결합, N-말단 대 N-말단 결합, 또는 N-말단 대 C-말단 결합일 수도 있다. 특정 실시예에서, 융합 단백질의 폴리펩티드는 임의의 순서를 가질 수 있다. 융합 폴리펩티드 또는 융합 단백질은 융합 폴리펩티드의 바람직한 활성이 보존되는 한, 보존적으로 변형된 변이체, 다형성 변이체, 대립유전자, 돌연변이체, 하위서열, 및 종간 상동체를 포함할 수도 있다. 융합 폴리펩티드는 화학적 합성 방법에 의하거나, 2개의 모이어티 간의 화학적 연결에 의해 생산되거나, 다른 표준 기술을 사용하여 일반적으로 제조될 수 있다. 융합 폴리펩티드를 포함하는 연결된 DNA 서열은 본원의 다른 곳에서 개시된 바와 같이 적절한 전사 또는 번역 조절 요소에 작동 가능하게 연결된다.

융합 폴리펩티드는 폴리펩티드 내의 하나 이상의 폴리펩티드 또는 도메인을 연결하는데 사용될 수 있는 링커를 임의로 포함할 수 있다. 펩티드 링커 서열은, 폴리펩티드 도메인이 원하는 기능을 발휘할 수 있도록 각각의 폴리펩티드가 적절한 2차 및 3차 구조로 접히는 것을 보장하기에 충분한 거리만큼 임의의 2개 이상의 폴리펩티드 성분을 분리하는 데 사용될 수 있다. 이러한 펩티드 링커 서열은 당 기술분야의 표준 기술을 사용하여 융합 폴리펩티드에 통합된다. 적절한 펩티드 링커 서열은 다음의 인자들에 기초하여 선택될 수 있다: (1) 가요성 연장 형태를 채택할 수 있는 이들의 능력; (2) 제1 및 제2 폴리펩티드 상의 기능적 에피토프와 상호작용할 수 있는 이차 구조를 채택할 수 없는 단계; 및 (3) 폴리펩티드 기능성 에피토프와 반응할 수 있는 소수성 또는 하전된 잔기의 결여. 바람직한 펩티드 링커 서열은 Gly, Asn, 및 Ser 잔기를 함유한다. Thr 및 Ala와 같은 다른 거의 중성 아미노산이 링커 서열에 사용될 수도 있다. 링커로서 유용하게 사용될 수 있는 아미노산 서열은 하기 문헌에 개시되어 있는 것들을 포함한다: Maratea 등, Gene 40:39-46, 1985; Murphy 등, Proc. Natl. Acad. Sci. USA 83:8258-8262, 1986; 미국특허 제4,935,233호 및 미국특허 제4,751,180호. 특정 융합 폴리펩티드 분절이 기능적 도메인을 분리하고 입체 간섭을 방지하는 데 사용될 수 있는 비필수 N-말단 아미노산 영역을 함유하는 경우 링커 서열은 필요하지 않다. 바람직한 링커는 일반적으로 재조합 융합 단백질의 일부로서 합성되는 가요성 아미노산 하위 서열이다. 링커 폴리펩티드는 1 내지 200개 아미노산의 길이, 1 내지 100개 아미노산의 길이, 또는 1 내지 50개 아미노산의 길이일 수 있으며, 그 사이의 모든 정수 값을 포함한다.

예시적인 링커는 다음의 아미노산 서열을 포함하지만, 이에 한정되지 않는다: 글리신 중합체(G)_n; 글리신-세린 중합체 (G_1-5S_1-5)_n, 여기에서, n은 적어도 1, 2, 3, 4, 또는 5의 정수이다; 글리신-알라닌 중합체; 알라닌-세린 중합체; GGG (서열번호 113); DGGGS (서열번호 114); TGEKP (서열번호 115) (예를 들어, Liu 등, PNAS 5525-5530 (1997) 참조); GGRR (서열번호 116) (Pomerantz 등 1995, 상기); (GGGGS)_n 여기서 n = 1, 2, 3, 4 또는 5(서열번호 117 및 150 내지 153)(Kim 등, PNAS 93, 1156-1160 (1996.); EGKSSGSGSESKVD (서열번호 118) (Chaudhary 등, 1990, Proc. Natl. Acad. Sci. U.S.A. 87:1066-1070); KESGSVSSEQLAQFRSLD (서열번호 119) (Bird 등, 1988, Science 242:423-426), GGRRGGGS (서열번호 120) LRQRDGERP (서열번호 121); LRQKDGGGSERP (서열번호 122); LRQKD(GGGS)₂ERP (서열번호 123). 대안적으로, 가요성 링커는 DNA-결합 부위 및 펩티드 자체를 모델링할 수 있는 컴퓨터 프로그램을 사용하여 (Desjarlais & Berg, PNAS 90:2256-2260 (1993), PNAS 91:11099-11103 (1994) 또는 파지 디스플레이 방법에 의해 합리적으로 설계될 수 있다.

융합 폴리펩티드는 본원에 기술된 폴리펩티드 도메인들 각각 사이, 또는 내인성 개방 판독 프레임과 공여자 복구 템플릿에 의해 암호화된 폴리펩티드 사이에 폴리펩티드 절단 신호를 추가로 포함할 수 있다. 또한, 폴리펩티드 절단 부위는 임의의 링커 펩티드 서열에 삽입될 수 있다. 예시적인 폴리펩티드 절단 신호는 프로테아제 절단 부위, 뉴클레아제 절단 부위(예를 들어, 희귀 제한 효소 인식 부위, 자가 절단 리보자임 인식 부위), 및 자가 절단 바이러스 올리고펩티드와 같은 폴리펩티드 절단 인식 부위를 포함한다( deFelipe and Ryan, 2004. Traffic, 5(8); 616-26 참조).

적절한 프로테아제 절단 부위 및 자가 절단 펩티드는 당 기술분야의 숙련자에게 공지되어 있다(예를 들어,Ryan 등, 1997. J. Gener. Virol. 78, 699-722; Scymczak 등 (2004) Nature Biotech. 5, 589-594 참조). 예시적인 프로테아제 절단 부위는 포티바이러스 NIa 프로테아제(예를 들어, 담배 식각 바이러스 프로테아제), 포티바이러스 HC 프로테아제, 포티바이러스 P1 (P35) 프로테아제, 바이오바이러스(byovirus) NIa 프로테아제, 바이오바이러스 RNA-2-암호화된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 리노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(벼해충 구상 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 얼룩 바이러스) 3C-유사 프로테아제, 헤파린, 트롬빈, 인자 Xa, 및 엔테로키나제의 절단 부위를 포함하나 이에 한정되지 않는다. 높은 절단 엄격성으로 인해, 일 실시예에서는 TEV(담배 식각 바이러스) 프로테아제 절단 부위, 예를 들어, EXXYXQ(G/S)(서열번호 121), 예를 들어, ENLYFQG(서열번호 122) 및 ENLYFQS(서열번호 123)가 바람직하며, 여기에서 X는 임의의 아미노산을 나타낸다(TEV에 의한 절단은 Q와 G 사이 또는 Q와 S 사이에서 발생함).

특정 실시예에서, 자기 절단 폴리펩티드 부위는 2A 또는 2A-유사 부위, 서열 또는 도메인을 포함한다(Donnelly 등, 2001. J. Gen. Virol. 82:1027-1041). 특정 실시예에서, 바이러스 2A 펩티드는 아프토바이러스 2A 펩티드, 포티바이러스 2A 펩티드, 또는 카디오바이러스 2A 펩티드이다.

일 실시예에서, 바이러스 2A 펩티드는 다음으로 이루어지는 군으로부터 선택된다: 구제역(foot-and-mouth disease) 바이러스(FMDV) 2A 펩티드, 말 비염(equine rhinitis) A 바이러스(ERAV) 2A 펩티드, 토세아 아시그나 바이러스Thosea asigna virus, TaV) 2A 펩티드, 돼지 테스코바이러스-1(PTV-1) 2A 펩티드, 테일로바이러스(Theilovirus) 2A 펩티드, 및 뇌심근염(encephalomyocarditis) 바이러스 2A 펩티드.

2A 부위의 예시적인 예가 표 2에 제공되어 있다.

G. 폴리뉴클레오티드

특정 실시예에서, 본원에서 고려되는 하나 이상의 융합 폴리펩티드, 귀소 엔도뉴클레아제 변이체, 메가TAL, 말단-가공 효소, 및 엑소뉴클레아제를 암호화하는 폴리뉴클레오티드가 제공된다. 본원에서 사용되는 바와 같이, 용어 “폴리뉴클레오티드” 또는 “핵산”은 데옥시리보핵산(DNA), 리보핵산(RNA) 및 DNA/RNA 하이브리드를 지칭한다.

다양한 실시예에서, 폴리뉴클레오티드는 하나 이상의 융합 폴리펩티드, 예를 들어, 서열번호 5, 8, 11, 17, 20, 23, 26, 29, 32, 35, 38, 41, 44, 47, 50, 53, 56, 59, 62, 65, 68, 71, 74, 77, 및 80을 암호화한다. 일부 실시예에서, 하나 이상의 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드는 RNA 폴리뉴클레오티드이다. 일부 실시예에서, 하나 이상의 융합 폴리펩티드를 암호화하는 RNA 폴리뉴클레오티드는 서열번호 6, 9, 12, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 및 81 중 어느 하나에 제시된 서열을 포함한다. 일부 실시예에서, 폴리뉴클레오티드는 서열번호 7, 10, 13, 19, 22, 25, 28, 31, 34, 37, 40, 43, 46, 49, 52, 55, 58, 61, 64, 67, 70, 73, 76, 79, 및 82 중 어느 하나에 제시된 아미노산 서열을 암호화한다.

폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있고 재조합, 합성, 또는 단리된 것일 수 있다. 폴리뉴클레오티드는 다음을 포함하지만 이들로 한정되지는 않는다: 전구체-전령 RNA(pre-mRNA), 전령 RNA(mRNA), 합성 RNA, 합성 mRNA, 게놈 DNA(gDNA), PCR 증폭 DNA, 상보적 DNA(cDNA), 합성 DNA, 및 재조합 DNA. 폴리뉴클레오티드는 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 1000개, 적어도 5000개, 적어도 10000개, 또는 적어도 15000개, 또는 그 이상(모든 중간 길이도 포함함)의 뉴클레오티드(리보뉴클레오티드 또는 데옥시리보뉴클레오티드, 또는 어느 하나의 뉴클레오티드의 변형된 형태)로 이루어진 뉴클레오티드의 다량체 형태를 지칭한다. 이러한 맥락에서, “중간 길이” 는 인용된 값들 사이의 임의의 길이, 예컨대 6, 7, 8, 9, 등, 101, 102, 103, 등; 151, 152, 153 등; 201, 202, 203 등을 의미한다는 것을 용이하게 이해할 것이다. 특정 실시예에서, 폴리뉴클레오티드 또는 변이체는 기준서열에 대해 적어도 또는 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%,76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는다.

특정 실시예에서, 폴리뉴클레오티드는 코돈 최적화될 수 있다. 본원에서 사용되는 용어 “코돈 최적화”는 폴리펩티드의 발현, 안정성, 및/또는 활성을 증가시키기 위해 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈을 치환하는 것을 지칭한다. 코돈 최적화에 영향을 미치는 인자는 다음 중 하나 이상을 포함하지만, 이들로 한정되지는 않는다: (i) 둘 이상의 유기체 또는 유전자 간의 코돈 편향의 변동 또는 합성으로 작제된 편향 테이블; (ii) 유기체, 유전자, 또는 유전자 세트 내 코돈 편향 정도의 변동; (iii) 맥락을 포함하는 코돈의 체계적인 변동; (iv) 코돈의 복호화 tRNA에 따른 코돈의 변동; (v) 삼중항 전체에서 또는 이중 하나의 위치에서 GC %에 따른 코돈의 변동; (vi) 자연 발생 서열과 같은 기준 서열에 대한 유사성의 정도에 있어서의 변동; (vii) 코돈 빈도 컷오프에서의 변동; (viii) DNA 서열로부터 전사된 mRNA의 구조적 특성; (ix) 코돈 치환 세트 설계의 기초가 되는 DNA 서열의 기능에 대한 사전 지식; (x) 각각의 아미노산에 대한 코돈 세트의 체계적인 변동; 및/또는 (xi) 허위 번역 개시 부위의 단리된 제거.

본원에서 사용되는 바와 같이, 용어 “뉴클레오티드”는 인산화된 당과 N-글리코시드 연결된 헤테로시클릭 질소 염기를 지칭한다. 뉴클레오티드는 천연 염기, 및 당 기술분야에서 인식되는 매우 다양한 변형 염기를 포함하는 것으로 이해된다. 이러한 염기는 일반적으로 뉴클레오티드 당 모이어티의 1’ 위치에 위치한다. 뉴클레오티드는 일반적으로 염기, 당, 및 인산염 기를 포함한다. 리보핵산(RNA)에서의 당은 리보오스이고, 데옥시리보핵산(DNA)에서의 당은 데옥시리보오스, 즉, 리보오스에 존재하는 하이드록실기가 결여된 당이다. 예시적인 천연 질소 염기는 퓨린, 아데노신(A)과 구아니딘(G), 및 피리미딘, 시티딘(C)과 티미딘(T)(또는 RNA의 맥락에서는 우라실(U))을 포함한다. 데옥시리보오스의 C-1 원자는 피리미딘의 N-1 또는 퓨린의 N-9에 결합된다. 뉴클레오티드는 일반적으로 1인산염, 2인산염, 또는 3인산염이다. 뉴클레오티드는 변형되지 않거나 당, 인산염, 및/또는 염기 모이어티에서 변형될 수 있다(뉴클레오티드 유사체, 뉴클레오티드 유도체, 변형된 뉴클레오티드, 비천연 뉴클레오티드, 및 비표준 뉴클레오티드로서 상호 교환적으로 또한 지칭됨; 예를 들어, 국제특허공개 WO 92/07065호 및 국제특허공개 WO 93/15187호 참조). 변형된 핵산 염기의 실시예는 Limbach 등(1994, Nucleic Acids Res. 22, 2183-2196)에 요약되어 있다.

뉴클레오티드는 뉴클레오시드의 인산염 에스테르로서 간주될 수도 있는데, 에스테르화는 당의 C-5에 부착된 하이드록실기 상에서 발생한다. 본원에서 사용되는 바와 같이, 용어 “뉴클레오시드”는 당과 N-글리코시드 연결된 헤테로시클릭 질소 염기를 지칭한다. 뉴클레오시드는 천연 염기를 포함하고, 잘 알려진 변형된 염기도 포함하는 것으로 당 기술분야에서 인식된다. 이러한 염기는 일반적으로 뉴클레오시드 당 모이어티의 1’ 위치에 위치한다. 뉴클레오시드는 일반적으로 염기 및 당기를 포함한다. 뉴클레오시드는 변형되지 않거나 당, 및/또는 염기 모이어티에서 변형될 수 있다(뉴클레오시드 유사체, 뉴클레오시드 유도체, 변형된 뉴클레오시드, 비천연 뉴클레오시드, 및 비표준 뉴클레오시드로서 상호 교환적으로 또한 지칭됨). 전술한 바와 같이, 변형된 핵산 염기의 실시예는 Limbach 등(1994, Nucleic Acids Res. 22, 2183-2196)에 요약되어 있다.

폴리뉴클레오티드의 예시적인 예는 하기를 포함하지만 이에 한정되지 않는다: 서열번호 7, 10, 13, 16, 19, 22, 25, 28, 31, 34, 37, 40, 43, 46, 49, 52, 55, 58, 61, 64, 67, 70, 73, 76, 79, 82, 89, 92, 95, 98, 및 101을 암호화하는 폴리뉴클레오티드 및 서열번호 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 32, 33, 35, 36, 38, 39, 41, 42, 44, 45, 47, 48, 50, 51, 53, 54, 56, 57, 59, 60, 62, 63, 65, 66, 68, 69, 71, 72, 74, 75, 77, 78, 80, 81, 87, 88, 90, 91, 93, 94, 96, 97, 99, 및 100로 제시된 폴리뉴클레오티드 서열.

다양한 예시적인 예에서, 본원에서 고려되는 폴리뉴클레오티드는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드, 귀소 엔도뉴클레아제 변이체, 메가TAL, 말단-가공 효소, 엑소뉴클레아제, 및 본원에서 고려되는 폴리뉴클레오티드를 포함하는 발현 벡터, 바이러스 벡터, 및 전달 플라스미드를 포함하지만 이들로 한정되지는 않는다.

본원에서 사용되는 바와 같이, 용어 “폴리뉴클레오티드 변이체” 및 “변이체” 등은 기준 폴리뉴클레오티드 서열과 실질적인 서열 동일성을 나타내는 폴리뉴클레오티드, 또는 이하에서 정의되는 엄격한 조건 하에서 기준 서열과 혼성화되는 폴리뉴클레오티드를 지칭한다. 이들 용어는 적어도 하나의 뉴클레오티드의 추가, 결실, 치환, 또는 변형에 의해 기준 폴리뉴클레오티드와 구별되는 폴리뉴클레오티드도 포함한다. 따라서, 용어 “폴리뉴클레오티드 변이체” 및 “변이체”는 하나 이상의 뉴클레오티드가 추가 또는 결실되었거나, 변형되었거나, 상이한 뉴클레오티드로 치환된 폴리뉴클레오티드를 포함한다. 이와 관련하여, 돌연변이, 추가, 결실, 및 치환을 포함하는 특정 변경이 기준 폴리뉴클레오티드에 만들어질 수 있고, 이에 의해 변경된 폴리뉴클레오티드가 기준 폴리뉴클레오티드의 생물학적 기능 또는 활성을 보유한다는 것이 당업계에서 잘 이해된다.

일 실시예에서, 폴리뉴클레오티드는 엄격한 조건 하에서 표적 핵산 서열에 혼성화되는 뉴클레오티드 서열을 포함한다. “엄격한 조건” 하에서 혼성화하는 것은, 서로 적어도 60% 동일한 뉴클레오티드 서열이 혼성화 상태를 유지하는 혼성화 프로토콜을 기술하는 것이다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮게 선택된다. Tm은 표적 서열에 상보적인 프로브의 50%가 (정의된 이온 강도, pH, 및 핵산 농도 하에) 평형에서 표적 서열에 혼성화되는 온도이다. 표적 서열은 일반적으로 과량으로 존재하기 때문에, Tm에서, 프로브의 50%가 평형에서 점유된다.

본원에서 사용되는 바와 같이, “서열 동일성” 또는, 예를 들어, “50%가 동일한 서열”을 포함하는 용어는 비교 윈도우 상에서 뉴클레오티드-대-뉴클레오티드 기반 또는 아미노산-대-아미노산 기반으로 서열이 동일한 정도를 지칭한다. 따라서, “서열 동일성의 백분율”은 비교 윈도우 상에서 최적으로 정렬된 2개의 서열을 비교하고; 동일한 핵산 염기(예를 들어 A, T, C, G, I) 또는 동일한 아미노산 잔기(예를 들어, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, GLu, Asn, Gln, Cys, 및 Met)가 양 서열에서 발생하는 위치의 수를 결정하여 일치하는 위치의 수를 얻고; 일치된 위치의 수를 비교 윈도우 내의 위치 총수(즉, 윈도우 크기)로 나누고; 그 결과에 100을 곱해서 서열 동일성의 백분율을 얻음으로써 계산될 수 있다. 일반적으로 폴리펩티드 변이체가 기준 폴리펩티드의 적어도 하나의 생물학적 활성을 유지하는 경우, 본원에 기술된 임의의 기준 서열 중 어느 하나와 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는 뉴클레오티드 및 폴리펩티드가 포함된다.

2개 이상의 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 관계를 기술하는 데 사용되는 용어는 “기준 서열”, “비교 윈도우”, “서열 동일성”, “서열 동일성의 백분율”, 및 “실질적 동일성”을 포함한다. “기준 서열”은, 뉴클레오티드 및 아미노산 잔기를 포함하여, 적어도 12개의 단량체 단위의 길이이지만, 빈번하게는 15 내지 18개, 및 종종 적어도 25개의 단량체 단위의 길이이다. 2개의 폴리뉴클레오티드는 각각 (1) 2개의 폴리뉴클레오티드들 간에 유사한 서열(즉, 완전한 폴리뉴클레오티드 서열의 단지 일부), 및 (2) 2개의 폴리뉴클레오티드들 간에 발산되는 서열을 포함할 수 있기 때문에, 2개의 (또는 그 이상의) 폴리뉴클레오티드 간의 서열 비교는 일반적으로 “비교 윈도우” 상에서 2개의 폴리뉴클레오티드의 서열을 비교하고, 서열 유사성의 국소 영역을 식별함으로써 수행된다. “비교 윈도우”는 2개의 서열이 최적으로 정렬된 후 동일한 수의 연속 위치에서 하나의 서열을 기준 서열과 비교하는 개념적 구간으로서, 적어도 6개의 연속 위치, 일반적으로는 약 50 내지 약 100개의 위치, 더 일반적으로는 약 100 내지 약 150개의 위치로 이루어진 개념적 구간을 지칭한다. 비교 윈도우는 2개의 서열의 최적 정렬을 위해 기준 서열(추가 또는 결실을 포함하지 않음)과 비교해 약 20% 이하의 추가 또는 결실(즉, 갭)을 포함할 수 있다. 비교 윈도우를 정렬하기 위한 최적의 서열 정렬은, 컴퓨터화된 알고리즘 구현예(575 Science Drive Madison, WI, USA 소재 Genetics Computer Group의 Wisconsin Genetics Software Package Release 7.0에 포함된 GAP, BESTFIT, FASTA, 및 TFASTA)에 의하거나, 선택된 다양한 방법 중 어느 하나에 의해 생성된 검사 및 최상의 정렬(즉, 비교 윈도우 상에서 가장 높은 상동성 백분율을 생성함)에 의해 수행될 수 있다. 예를 들어 Altschul 등, 1997, Nucl. Acids Res. 25:3389에 개시된 것과 같은 BLAST 계열 프로그램을 또한 참조할 수 있다. 서열 분석에 대한 상세한 논의는 Ausubel 등, Current Protocols in Molecular Biology, John Wiley & Sons Inc., 1994-1998, Chapter 15 중 Unit 19.3에서 확인할 수 있다.

본원에서 사용되는 바와 같이, “단리된 폴리뉴클레오티드”는 자연 발생 상태에서 측면에 위치하는 서열로부터 정제된 폴리뉴클레오티드, 예를 들어, 일반적으로 단편에 인접한 서열로부터 제거된 DNA 단편을 지칭한다. 특정 실시예에서, “단리된 폴리뉴클레오티드”는 상보적 DNA(cDNA), 재조합 폴리뉴클레오티드, 합성 폴리뉴클레오티드, 또는 자연에서 존재하지 않고 사람의 손에 의해 만들어진 기타 폴리뉴클레오티드를 지칭한다.

다양한 실시예에서, 폴리뉴클레오티드는 본원에서 고려되는 폴리펩티드를 암호화하는 mRNA를 포함하며, 이에는 융합 폴리펩티드, 귀소 엔도뉴클레아제 변이체, 메가TAL, 및 말단-가공 효소, 및 엑소뉴클레아제를 포함되지만 이들로 한정되지는 않는다. 특정 실시예에서, mRNA는 캡, 하나 이상의 뉴클레오티드, 및/또는 변형된 뉴클레오티드, 및 폴리(A) 꼬리를 포함한다.

특정 실시예에서, 본원에서 고려되는 mRNA는 엑소뉴클레아제 분해로부터 mRNA를 보호하고, mRNA를 안정화시키고, 번역을 용이하게 하는 데 도움을 주는 폴리(A) 꼬리를 포함한다. 특정 실시예에서, mRNA는 3’ 폴리(A) 꼬리 구조를 포함한다.

특정 실시예에서, 폴리(A) 꼬리의 길이는 적어도 약 10, 25, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 또는 적어도 약 500개 또는 그 이상의 아데닌 뉴클레오티드이거나 임의의 개재 수의 아데닌 뉴클레오티드이다. 특정 실시예에서, 폴리(A) 꼬리의 길이는 적어도 약 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 202, 203, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 또는 275개 또는 그 이상의 아데닌 뉴클레오티드이다.

특정 실시예에서, 폴리(A) 꼬리의 길이는 약 10 내지 약 500개의 아데닌 뉴클레오티드, 약 50 내지 약 500개의 아데닌 뉴클레오티드, 약 100 내지 약 500개의 아데닌 뉴클레오티드, 약 150 내지 약 500개의 아데닌 뉴클레오티드, 약 200 내지 약 500개의 아데닌 뉴클레오티드, 약 250 내지 약 500개의 아데닌 뉴클레오티드, 약 300 내지 약 500개의 아데닌 뉴클레오티드, 약 50 내지 약 450개의 아데닌 뉴클레오티드, 약 50 내지 약 400개의 아데닌 뉴클레오티드, 약 50 내지 약 350개의 아데닌 뉴클레오티드, 약 100 내지 약 500개의 아데닌 뉴클레오티드, 약 100 내지 약 450개의 아데닌 뉴클레오티드, 약 100 내지 약 400개의 아데닌 뉴클레오티드, 약 100 내지 약 350개의 아데닌 뉴클레오티드, 약 100 내지 약 300개의 아데닌 뉴클레오티드, 약 150 내지 약 500개의 아데닌 뉴클레오티드, 약 150 내지 약 450개의 아데닌 뉴클레오티드, 약 150 내지 약 400개의 아데닌 뉴클레오티드, 약 150 내지 약 350개의 아데닌 뉴클레오티드, 약 150 내지 약 300개의 아데닌 뉴클레오티드, 약 150 내지 약 250개의 아데닌 뉴클레오티드, 약 150 내지 약 200개의 아데닌 뉴클레오티드, 약 200 내지 약 500개의 아데닌 뉴클레오티드, 약 200 내지 약 450개의 아데닌 뉴클레오티드, 약 200 내지 약 400개의 아데닌 뉴클레오티드, 약 200 내지 약 350개의 아데닌 뉴클레오티드, 약 200 내지 약 300개의 아데닌 뉴클레오티드, 약 250 내지 약 500개의 아데닌 뉴클레오티드, 약 250 내지 약 450개의 아데닌 뉴클레오티드, 약 250 내지 약 400개의 아데닌 뉴클레오티드, 약 250 내지 약 350개의 아데닌 뉴클레오티드, 또는 약 250 내지 약 300개의 아데닌 뉴클레오티드 또는 임의의 개재 범위의 아데닌 뉴클레오티드이다.

폴리뉴클레오티드의 배향을 기술하는 용어는 5’ (일반적으로 유리 인산염 기를 갖는 폴리뉴클레오티드의 말단) 및 3’ (일반적으로 유리 하이드록실(OH)기를 갖는 폴리뉴클레오티드의 말단)을 포함한다. 폴리뉴클레오티드 서열은 5’에서 3’ 배향 또는 3’에서 5’ 배향으로 주석이 달릴 수 있다. DNA 및 mRNA의 경우, 5’에서 3’ 방향으로의 가닥은 “센스”, “플러스” 또는 “암호화” 가닥으로 지정되는데, 이는 그 서열이 전령 RNA 전구체(pre-mRNA)의 서열과 동일하기 때문이다[DNA에서는 티민(T)인 대신에 RNA에서는 우라실(U)인 것은 제외함]. DNA 및 mRNA의 경우, RNA 중합효소에 의해 전사된 가닥인 상보성 3’에서 5’ 방향으로의 가닥은 “템플릿”, “안티센스”, “마이너스” 또는 “비코딩” 가닥으로 지정된다. 본원에서 사용되는 바와 같이, 용어 “역방향”은 3’에서 5’ 방향으로 작성된 5’에서 3’ 방향의 서열, 또는 5’에서 3’ 방향으로 작성된 3’에서 5’ 방향의 서열을 지칭한다.

용어 “상보성(complementary 및 complementarity)”은 염기쌍 규칙에 의해 관련된 폴리뉴클레오티드(즉, 뉴클레오티드의 서열)를 지칭한다. 예를 들어, DNA 서열 5’ A G T C T G 3’의 상보성 가닥은 3’ T C A G T A C 5’이다. 후자 서열은 종종 5’ 말단이 좌측에 있고 3’ 말단이 우측에 있는 5’ C A T G A C T 3’과 역 상보체로서 쓰여진다. 역 상보체와 동일한 서열은 회문 서열(palindromic sequence)이라고 한다. 상보성은 “부분적”일 수 있으며, 여기서 핵산의 염기 중 일부만이 염기쌍 규칙에 따라 매칭된다. 또는, 핵산 간에는 “완전한” 또는 “전체” 상보성이 있을 수 있다.

본원에서 사용되는 용어 “핵산 카세트” 또는 “발현 카세트”는 RNA에 이어서 폴리펩티드를 발현할 수 있는 벡터 내의 유전자 서열을 지칭한다. 일 실시예에서, 핵산 카세트는 관심 유전자(들), 예를 들어, 관심 폴리뉴클레오티드를 함유한다. 또 다른 실시예에서, 핵산 카세트는 하나 이상의 발현 조절 서열, 예를 들어, 프로모터, 인핸서, 폴리(A) 서열, 및 관심 유전자, 예를 들어, 관심 폴리뉴클레오티드를 함유한다. 벡터는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 또는 그 이상의 핵산 카세트를 포함할 수 있다. 핵산 카세트는, 카세트 내의 핵산이 RNA로 전사될 수 있고, 필요에 따라, 단백질 또는 폴리펩티드로 번역될 수 있고, 형질변환된 세포에서의 활성에 필요한 적절한 번역 후 변형을 거칠 수 있고, 적절한 세포내 구획을 표적화함으로써 생물학적 활성 또는 세포외 구획으로의 분비에 적합한 구획에 전좌될 수 있도록 벡터 내에서 위치적으로 및 순차적으로 배향된다. 바람직하게는, 카세트는 벡터 내로 용이하게 삽입할 수 있도록 구성된 3’ 및 5’ 말단을 가지며, 예를 들어, 각 말단에서 제한 엔도뉴클레아제 부위를 갖는다. 바람직한 실시예에서, 핵산 카세트는 유전적 장애를 치료, 예방, 또는 개선하는 데 사용되는 치료 유전자의 서열을 함유한다. 카세트는 제거될 수 있고, 단일 단위로서 플라스미드 또는 바이러스 벡터 내에 삽입될 수 있다.

폴리뉴클레오티드는 관심 폴리뉴클레오티드를 포함한다. 본원에서 사용되는 바와 같이, 용어 “관심 폴리뉴클레오티드”는 폴리펩티드 또는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 본원에서 고려되는 바와 같이, 억제성 폴리뉴클레오티드의 전사를 위한 템플릿으로서 작용하는 폴리뉴클레오티드를 지칭한다.

또한, 당업자는 유전자 코드 축퇴의 결과로서, 본원에서 고려되는 바와 같이 폴리펩티드 또는 이의 변이체의 단편을 암호화할 수 있는 많은 뉴클레오티드 서열이 존재한다는 것을 이해할 것이다. 이들 폴리뉴클레오티드 중 일부는 임의의 천연 유전자의 뉴클레오티드 서열과 최소한의 상동성을 갖는다. 그럼에도 불구하고, 코돈 사용의 차이로 인해 달라지는 폴리뉴클레오티드, 예를 들어 인간 및/또는 영장류 코돈 선택에 최적화된 폴리뉴클레오티드가 특정 실시예에서 구체적으로 고려된다. 일 실시예에서, 특정 대립유전자 서열을 포함하는 폴리뉴클레오티드가 제공된다. 대립유전자는 뉴클레오티드의 결실, 추가, 및/또는 치환과 같은 하나 이상의 돌연변이의 결과로 변경된 내인성 폴리뉴클레오티드 서열이다.

특정 실시예에서, 관심 폴리뉴클레오티드는 공여자 복구 템플릿을 포함한다.

특정 실시예에서 고려되는 폴리뉴클레오티드는, 본원의 다른 곳에서 기술된 바와 같이, 또는 당 기술분야에 알려진 것과 같이, 코딩 서열 자체의 길이에 상관없이 프로모터 및/또는 인핸서, 미번역 영역(UTR), 코작 서열, 폴리아데닐화 신호, 추가 제한 효소 부위, 다중 클로닝 부위, 내부 리보솜 진입 부위(IRES), 재조합효소 인식 부위(예를 들어, LoxP, FRT, 및 Att 부위), 종결 코돈, 전사 종결 신호, 전사 후 반응 요소, 예를 들어, 우드척 간염 바이러스 전사 후 반응 요소(WPRE), B형 간염 바이러스 전사 후 반응 효소(HPRE), 및 자가-절단 폴리펩티드를 암호화하는 폴리뉴클레오티드, 에피토프 태그 등과 같은 다른 DNA 서열과 조합될 수 있으므로, 이들의 전체 길이는 상당히 달라질 수 있다. 따라서, 거의 모든 길이의 폴리뉴클레오티드 단편이 사용될 수 있고, 전체 길이는 바람직하게는 제조의 용이성 및 의도된 재조합 DNA 프로토콜에서의 사용의 용이성에 의해 제한될 수 있는 것으로 특정 실시예에서 고려된다.

폴리뉴클레오티드는, 당 기술분야에 공지되어 있고 이용 가능한 잘 확립된 다양한 기술 중 어느 하나를 사용하여 제조, 조작, 발현, 및/또는 전달될 수 있다. 원하는 폴리펩티드를 발현시키기 위해, 폴리펩티드를 암호화하는 뉴클레오티드 서열이 적절한 벡터 내에 삽입될 수 있다. 원하는 폴리펩티드는 폴리펩티드를 암호화하는 mRNA를 세포 내로 전달함으로써 발현될 수도 있다.

벡터의 예시적인 예는 플라스미드, 자율 복제 서열, 및 전이 인자(transposable element), 예를 들어, 형질 전환성 요소, 예를 들어, Sleeping Beauty, PiggyBac을 포함하지만 이에 한정되지는 않는다.

벡터의 추가 예시적인 예는 플라스미드, 파지미드, 코스미드, 인공 염색체(예컨대 효모 인공 염색체(YAC), 박테리아 인공 염색체(BAC), 또는 P1-유래의 인공 염색체(PAC)), 박테리오파지(예컨대 람다 파지 또는 M13 파지), 및 동물 바이러스를 포함하되 이들로 한정되지는 않는다.

벡터로서 유용한 바이러스의 예시적인 예는 레트로바이러스(렌티바이러스 포함), 아데노바이러스, 아데노-연관 바이러스, 헤르페스바이러스(예를 들어, 단순 포진 바이러스), 수두바이러스, 바큘로바이러스, 유두종바이러스, 및 파포바바이러스(예를 들어, SV40)를 포함하나 이에 한정되지 않는다.

발현 벡터의 예시적인 예는 포유류 세포에서의 발현을 위한 pClneo 벡터(Promega); 포유류 세포에서의 렌티바이러스 매개 유전자 전달 및 발현을 위한 pLenti4/V5-DEST™, pLenti6/V5-DEST™, 및 pLenti6.2/V5-GW/lacZ(Invitrogen)를 포함하나, 이에 한정되지 않는다. 특정 실시예에서, 본원에 개시된 폴리펩티드의 코딩 서열은 포유류 세포에서 폴리펩티드의 발현을 위해 이러한 발현 벡터에 결합될 수 있다.

특정 실시예에서, 벡터는 에피솜 벡터 또는 염색체외에서 유지되는 벡터이다. 본원에서 사용되는 바와 같이, 용어 “에피솜”은 숙주의 염색체 DNA로의 통합 없이 복제할 수 있고, 분열하는 숙주 세포로부터 점진적으로 소실되지 않고 복제할 수 있는 벡터를 지칭하며, 상기 벡터가 염색체외에서 또는 에피솜에서 복제한다는 것을 또한 의미한다.

발현 벡터에 존재하는 “발현 조절 서열”, “조절 요소”, 또는 “조절 서열”은 벡터의 비번역 영역 - 복제의 기원, 선택 카세트, 프로모터, 인핸서, 번역 개시 신호(Shine Dalgarno 서열 또는 코작 서열) 인트론, 전사 후 조절 요소, 폴리아데닐화 서열, 5’ 및 3’ 비번역 영역 -이며, 여기에는 전사 및 번역을 수행하기 위해 숙주 세포 단백질과 상호작용한다. 이러한 요소는 강도 및 특이성에 있어서 다를 수 있다. 사용된 벡터 시스템 및 숙주에 따라, 유비쿼터스 프로모터 및 유도성 프로모터를 포함하는 임의의 수의 적절한 전사 및 번역 요소가 사용될 수 있다.

특정 실시예에서, 폴리뉴클레오티드는 발현 벡터 및 바이러스 벡터를 포함하나 이에 한정되지 않는 벡터를 포함한다. 벡터는 프로모터 및/또는 인핸서와 같은 하나 이상의 외인성, 내인성, 또는 이종 조절 서열을 포함할 수 있다. “내인성 조절 서열”은 게놈 내의 주어진 유전자와 자연적으로 연결되는 서열이다. “외인성 조절 서열”은 유전자의 전사가 연결된 인핸서/프로모터에 의해 유도되도록 유전자 조작(즉, 분자 생물학적 기술)에 의해 해당 유전자와 나란히 배치되는 서열이다. “이종성 조절 서열”은 유전적으로 조작되는 세포와 상이한 종으로부터 유래된 외인성 서열이다. “합성” 조절 서열은 하나 이상의 내인성 및/또는 외인성 서열의 요소, 및/또는 특정 요법에 대해 최적의 프로모터 및/또는 인핸서 활성을 제공하는 것으로 시험관 내 또는 가상 환경에서 결정된 서열을 포함할 수 있다.

본원에서 사용되는 용어 “프로모터”는 RNA 중합효소가 결합하는 폴리뉴클레오티드(DNA 또는 RNA)의 인식 부위를 지칭한다. RNA 중합효소는 프로모터에 작동 가능하게 연결된 폴리뉴클레오티드를 개시하고 전사한다. 특정 실시예에서, 포유류 세포에서 작동하는 프로모터는 전사가 개시되는 부위로부터 대략 25 내지 30개 염기만큼 상류에 위치한 AT-풍부 영역 및/또는 전사 시작 영역으로부터 70 내지 80개의 염기만큼 상류에 위치한 CNCAAT 영역(여기에서 N은 임의의 뉴클레오티드일 수 있음)서 발견되는 또 다른 서열을 포함한다.

용어 “인핸서”는 전사를 강화할 수 있는 서열을 함유하는 DNA의 분절을 지칭하며, 이는 일부 경우에는 다른 조절 서열에 대한 배향과는 독립적으로 작용할 수 있다. 인핸서는 프로모터 및/또는 다른 인핸서 요소와 협력적으로 또는 부가적으로 작용할 수 있다. 용어 “프로모터/인핸서”는 프로모터 기능과 인핸서 기능 둘 모두를 제공할 수 있는 서열을 함유하는 DNA의 분절을 지칭한다.

용어 “작동 가능하게 연결된”은 기술된 성분이 의도된 방식으로 기능할 수 있게 하는 관계에 있는 병치 상태를 지칭한다. 일 실시예에서, 전술한 용어는 핵산 발현 조절 서열(예를 들어, 프로모터 및/또는 인핸서)과 제2 폴리뉴클레오티드 서열(예를 들어, 관심 폴리뉴클레오티드) 간의 기능적 연결을 지칭하며, 여기에서 발현 조절 서열은 제2 서열에 상응하는 핵산의 전사를 유도한다.

본원에서 사용되는 용어 “구성적 발현 조절 서열”은 작동 가능하게 연결된 서열의 전사를 계속하여 또는 연속적으로 가능하게 하는 프로모터, 인핸서, 또는 프로모터/인핸서를 지칭한다. 구성적 발현 조절 서열은, 매우 다양한 세포 및 조직 유형에서 발현을 가능하게 하는 “유비쿼터스” 프로모터, 인핸서, 또는 프로모터/인핸서이거나, 제한된 범위의 세포 및 조직 유형 각각에서 발현을 가능하게 하는 “세포 특이적”, “세포 유형 특이적”, “세포 계통 특이적”, 또는 “조직 특이적” 프로모터, 인핸서, 또는 프로모터/인핸서일 수 있다.

특정 실시예에서 사용하기에 적합한 예시적인 유비쿼터스 발현 조절 서열은 다음을 포함하나 이에 한정되지 않는다: 사이토메갈로바이러스(CMV) 전초기 프로모터, 바이러스 유인원 바이러스 40 (SV40) (예를 들어, 조기 또는 후기), 물로니 쥣과 백혈병 바이러스(MoMLV) LTR 프로모터, 라우스 육종 바이러스(RSV) LTR, 단순 포진 바이러스(HSV)(티미딘 키나제`) 프로모터, 우두 바이러스에서 유래된 H5, P7.5, 및 P11 프로모터, 짧은 신장 인자 1-알파(EF1a-short) 프로모터, 긴 신장 인자 1-알파(EF1a-long) 프로모터, 조기 성장 반응 1(EGR1), 페리틴 H (FerH), 페리틴 L (FerL), 글리세르알데히드 3-포스페이트 탈수소효소(GAPDH), 진핵생물 번역 개시 인자 4A1(EIF4A1), 열충격 70kDa 단백질 5(HSPA5), 열충격 단백질 90kDa 베타, 구성원 1(HSP90B1), 열충격 단백질 70kDa(HSP70), β-키네신(β-KIN), 인간 ROSA 26 유전자좌(Irions 등, Nature Biotechnology 25, 1477 - 1482 (2007)), 유비퀴틴 C 프로모터(UBC), 포스포글리세레이트 키나제-1(PGK) 프로모터, 거대세포바이러스 인핸서/닭 β-액틴(CAG) 프로모터, β-액틴 프로모터 및 골수 증식성 육종 바이러스 인핸서, 음성 대조군 영역이 결실되고 dl587rev 프라이머 결합 부위가 치환된(MND) 프로모터(Challita 등, J Virol. 69(2):748-55 (1995)).

특정 실시예에서, 세포, 세포 유형, 세포 계통, 또는 조직 특이적 발현 조절 서열을 사용해 바람직한 폴리뉴클레오티드 서열의 세포 유형 특이적, 계통 특이적, 또는 조직 특이적 발현을 달성하는 것(예를 들어, 세포 유형, 세포 계통, 또는 조직의 하위군에서만, 또는 발달의 특정 단계 동안에 폴리펩티드를 암호화하는 특정 핵산을 발현하는 것)이 바람직할 수 있다.

본원에서 사용되는 “조건부 발현”은 다음을 포함하지만 이에 한정되지 않는 임의의 유형의 조건부 발현을 지칭할 수 있다: 유도성 발현; 억제 가능한 발현; 특정 생리학적, 생물학적 또는 질병 상태 등을 갖는 세포 또는 조직에서의 발현. 이러한 정의는 세포 유형 또는 조직 특이적 발현을 배제하도록 의도되지 않는다. 특정 실시예는 관심 폴리뉴클레오티드의 조건부 발현을 제공하는데,예를 들어 발현은 세포, 조직, 유기체 등을 대상으로, 폴리뉴클레오티드의 발현을 유발하거나, 관심 폴리뉴클레오티드에 의해 암호화된 폴리뉴클레오티드의 발현의 증가 또는 감소를 유발하는 치료를 수행하거나 조건을 거치게 함으로써 조절된다.

유도성 프로모터/시스템의 예시적인 예는 스테로이드-유도성 프로모터, 예컨대 글루코코르티코이드 또는 에스트로겐 수용체를 암호화하는 유전자에 대한 프로모터(해당 호르몬으로 치료함으로써 유도 가능함), 메탈로티오닌 프로모터(다양한 중금속으로 치료함으로써 유도 가능함), MX-1 프로모터(인터페론에 의해 유도 가능함), “GeneSwitch” 미페프리스톤-조절 가능 시스템(Sirin 등, 2003, Gene, 323: 67), 큐민산염 유도성 유전자 스위치(WO2002/088346), 테트라시클린 의존성 조절 시스템 등을 포함하지만 이에 한정되지는 않는다.

조건부 발현은 또한 부위 특이적 DNA 재조합효소를 사용함으로써 달성될 수 있다. 특정 실시예에 따르면, 폴리뉴클레오티드는 부위 특이적 재조합효소에 의해 매개되는 재조합을 위한 적어도 하나의 (통상적으로 2개의) 부위를 포함한다. 본원에서 사용되는 용어 “재조합효소” 또는 “부위 특이적 재조합효소”는 하나 이상의 재조합 부위(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상.)와 관련된 재조합 반응에 관여하는 절제 또는 통합 단백질, 효소, 보조인자 또는 연관 단백질을 포함하며, 이는 야생형 단백질(Landy, Current Opinion in Biotechnology 3:699-707 (1993) 참조), 또는 이의 돌연변이체, 유도체(예를 들어, 재조합 단백질 서열 또는 이의 단편을 함유하는 융합 단백질), 단편 및 이들의 변이체일 수 있다. 특정 실시예에서 사용하기에 적합한 재조합효소의 예시적인 예는 Cre, Int, IHF, Xis, Flp, Fis, Hin, Gin, ΦC31, Cin, Tn3 분해제, TndX, XerC, XerD, TnpX, Hjc, Gin, SpCCE1, 및 ParA를 포함하나, 이에 한정되지 않는다.

폴리뉴클레오티드는 매우 다양한 부위 특이적 재조합효소 중 어느 하나에 대한 하나 이상의 재조합 부위를 포함할 수 있다. 부위 특이적 재조합효소에 대한 표적 부위는 벡터, 예를 들어, 레트로바이러스 벡터 또는 렌티바이러스 벡터의 통합에 필요한 임의의 부위에 추가된다는 것을 이해해야 한다. 본원에서 사용되는 용어 “재조합 서열”, “재조합 부위” 또는 “부위 특이적 재조합 부위”는 재조합효소가 인식하고 결합하는 특정 핵산 서열을 지칭한다.

특정 실시예에서, 폴리뉴클레오티드는 하나 이상의 폴리펩티드를 암호화하는 하나 이상의 관심 폴리뉴클레오티드를 포함한다. 특정 실시예에서, 복수의 폴리펩티드 각각의 효율적인 번역을 달성하기 위해, 폴리뉴클레오티드 서열은 하나 이상의 IRES 서열 또는 자가 절단 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열에 의해 분리될 수 있다.

본원에서 사용되는 “내부 리보솜 진입 부위” 또는 “IRES”는, 시스트론(단백질 암호화 영역)의 ATG와 같은 개시 코돈에 대한 직접적인 내부 리보솜 진입을 촉진하여 유전자의 캡-독립적 번역을 유도하는 요소를 지칭한다. 예를 들어, Jackson 등, 1990. Trends Biochem Sci 15(12):477-83) 및 Jackson 및 Kaminski. 1995. RNA 1(10):985-1000을 참조한다. 당 기술분야의 숙련자에 의해 일반적으로 사용되는 IRES의 예는 미국 특허 제6,692,736호에 기술된 것들을 포함한다. 당 기술분야에 공지된 “IRES”의 추가 예는 피코르나바이러스로부터 수득 가능한 IRES(Jackson 등, 1990), 및 예를 들어, 면역글로불린 중쇄 결합 단백질(BiP), 혈관 내피 성장 인자(VEGF)(Huez 등, 1998, Mol. Cell. Biol. 18(11):6178-6190), 섬유아세포 성장 인자 2(FGF-2), 및 인슐린-유사 성장 인자(IGFII), 번역 개시 인자 eIF4G, 및 효모 전사 인자 TFIID 및 HAP4, Novagen으로부터 상업적으로 입수 가능한 뇌근막염 바이러스(EMCV)(Duke 등, 1992, J. Virol 66(3):1602-9)와 같은 바이러스 또는 세포 mRNA 공급원으로부터 수득 가능한 IRES, 및 VEGF IRES(Huez 등, 1998, Mol Cell Biol 18(11):6178-90)을 포함하나 이에 한정되지 않는다. IRES는 피코르나바이러스, 디시스트로바이러스 및 플라비바이러스 종의 바이러스 게놈, 및 HCV, 프렌즈 쥣과 백혈병 바이러스(FrMLV), 및 몰로니 쥣과 백혈병 바이러스(MoMLV)에서도 보고되었다.

특정 실시예에서, 폴리뉴클레오티드는, 공통 코작 서열을 가지며 원하는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 본원에서 사용되는 바와 같이, 용어 “코작 서열”은 리보솜의 작은 서브유닛에 대한 mRNA의 초기 결합을 상당히 용이하게 하고 번역을 증가시키는 짧은 뉴클레오티드 서열을 지칭한다. 공통 코작 서열은 (GCC)RCCATGG(서열번호 149)이고, 여기에서 R은 퓨린(A 또는 G)이다(Kozak, 1986. Cell. 44(2):283-92 및 Kozak, 1987. Nucleic Acids Res. 15(20):8125-48).

이종 핵산 전사체의 효율적인 종결 및 폴리아데닐화를 유도하는 요소는 이종 유전자 발현을 증가시킨다. 전사 종결 신호는 대체로 폴리아데닐화 신호의 하류에서 확인된다. 특정 실시예에서, 벡터는 발현될 폴리펩티드를 암호화하는 폴리뉴클레오티드의 폴리아데닐화 서열 3′을 포함한다. 본원에서 사용되는 용어 “폴리A 부위” 또는 “폴리A 서열”은 RNA 중합효소 II에 의한 초기 RNA 전사의 종결 및 폴리아데닐화 모두를 유도하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 코딩 서열의 3’ 말단에 폴리A 꼬리를 첨가함으로써 mRNA 안정성을 촉진할 수 있으므로, 번역 효율의 증가에 기여한다. 절단과 폴리아데닐화는 RNA 내의 폴리(A) 서열에 의해 유도된다. 포유류 mRNA 전구체에 대한 코어 폴리(A) 서열은 절단-폴리아데닐화 부위의 측면에 위치하는 2개의 인식 요소를 갖는다. 일반적으로, 거의 불변인 AAUAAA 육량체가 U 또는 GU 잔기가 풍부한 보다 가변적인 요소로부터 상류로 20 내지 50개의 뉴클레오티드 위치에 놓인다. 초기 전사체의 절단은 이들 두 요소 사이에서 일어나고, 5’ 절단 산물에 추가된 최대 250개의 아데노신에 결합된다. 특정 실시예에서, 코어 폴리(A) 서열은 이상적인 폴리A 서열이다(예를 들어, AATAAA, ATTAAA, AGTAAA). 특정 실시예에서, 폴리(A) 서열은 SV40 폴리A 서열, 소 성장 호르몬 폴리A 서열(BGHpA), 토끼 β-글로빈 폴리A 서열(rβgpA), 이들의 변이체, 또는 당 기술분야에 공지된 다른 적절한 이종 또는 내인성 폴리A 서열이다.

특정 실시예에서, 하나 이상의 융합 폴리펩티드, 귀소 엔도뉴클레아제 변이체, 메가TAL, 말단-가공 효소, 또는 엑소뉴클레아제를 암호화하는 폴리뉴클레오티드는 비바이러스적인 방법 및 바이러스적인 방법 둘 다에 의해 조혈 세포, 예를 들어, CD34⁺ 세포 내로 도입될 수 있다. 특정 실시예에서, 뉴클레아제 및/또는 공여자 복구 템플릿을 암호화하는 하나 이상의 폴리뉴클레오티드의 전달은 동일한 방법 또는 상이한 방법에 의해 제공되고/되거나 동일한 벡터 또는 상이한 벡터에 의해 제공될 수 있다.

용어 “벡터”는 또 다른 핵산 분자를 전달 또는 수송할 수 있는 핵산 분자를 지칭하도록 본원에서 사용된다. 전달된 핵산은 일반적으로 벡터 핵산 분자에 연결, 예를 들어, 벡터 핵산 분자에 삽입된다. 벡터는 세포에서 자율 복제를 유도하는 서열을 포함하거나, 숙주 세포 DNA로의 통합을 허용하기에 충분한 서열을 포함할 수 있다. 특정 실시예에서, 비-바이러스 벡터는 본원에서 고려되는 하나 이상의 폴리뉴클레오티드를 CD34⁺ 세포에 전달하는 데 사용된다.

비바이러스 벡터의 예시적인 예는 플라스미드(예를 들어, DNA 플라스미드 또는 RNA 플라스미드), 트랜스포존(transposon), 코스미드, 및 박테리아 인공 염색체를 포함하나 이에 한정되지 않는다.

특정 실시예에서 고려되는 폴리뉴클레오티드의 비바이러스 전달의 예시적인 방법은: 전기천공, 초음파 처리, 리포펙션, 미세주입, 바이오리스틱스(biolistics), 비로좀(virosome), 리포좀, 면역리포좀, 나노입자, 폴리양이온 또는 지질:핵산 접합체, 네이키드 DNA, 인공 비리온, DEAE-덱스트란 매개 전달, 유전자총, 및 열-충격을 포함하나 이에 한정되지 않는다.

특정 실시예에서 고려되는 특정 실시예에서 사용하기에 적합한 폴리뉴클레오티드 전달 시스템의 예시적인 예는 Amaxa Biosystems, Maxcyte, Inc., BTX Molecular Delivery Systems, 및 Copernicus Therapeutics Inc.에 의해 제공된 것들을 포함하나 이에 한정되지 않는다. 리포펙션 시약은 상업적으로 판매된다(예를 들어, Transfectam™ 및 Lipofectin™). 폴리뉴클레오티드의 효율적인 수용체 인식 리포펙션에 적합한 양이온성 및 중성 지질은 문헌에 기술되어 있다. 예를 들어, Liu 등 (2003) Gene Therapy. 10:180-187; 및 Balazs 등 (2011) Journal of Drug Delivery. 2011:1-12를 참조한다. 항체-표적화, 박테리아에 의해 유래된, 비생체 나노세포-기반 전달이 또한 특정 실시예에서 고려된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드(예를 들어, DNA 또는 RNA)는 예를 들어 전기천공에 의해 세포 내로 직접 도입될 수 있다. 전기천공 방법에서, 폴리뉴클레오티드, 또는 부위-지향 폴리펩티드 및 폴리뉴클레오티드의 복합체는 전기천공 완충액에서 표적 세포와 혼합 되어 현탁액을 형성한다. 그런 다음, 이러한 현탁액은 최적화된 전압에서 전기적 펄스를 거치게 되는데, 이는 세포막의 인지질 이중층에 일시적인 기공을 생성하여, DNA 및 단백질과 같은 하전된 분자가 기공을 통해 세포 내로 유도될 수 있게 한다. 전기천공을 수행하기 위한 시약 및 장비는 상업적으로 판매된다. 전기천공 매질은 당 기술분야에 공지된 임의의 적절한 매질일 수 있다. 전기천공의 적절한 방법이 이용 가능하며 당 기술분야의 숙련자에게 공지되어 있다.

특정 실시예에서 고려되는 폴리뉴클레오티드를 포함하는 바이러스 벡터는, 후술하는 바와 같이, 일반적으로 전신 투여(예를 들어, 정맥내, 복강내, 근육내, 피하, 또는 두개내 주입) 또는 국소 도포에 의해 개별 환자에게 투여함으로써 생체 내에서 전달될 수 있다. 대안적으로, 벡터는 개별 환자로부터 외식된 세포(예를 들어, 가동화된 말초 혈액, 림프구, 골수 흡인, 조직 생검 등) 또는 범용 공여자 조혈 줄기 세포와 같은 세포에 생체 외에서 전달될 수 있고, 이어서 해당 세포를 환자에게 재이식할 수 있다.

일 실시예에서, 뉴클레아제 변이체 및/또는 공여자 복구 템플릿을 포함하는 바이러스 벡터는 생체 내에서 세포의 형질도입을 위해 유기체에 직접 투여된다. 대안적으로, 네이키드 DNA 또는 mRNA가 투여될 수 있다. 투여는 분자를 도입하여 혈액 또는 조직 세포와 궁극적인 접촉시키는 데 일반적으로 사용되는 경로 중 어느 하나에 의해 이루어지며, 이는 주사, 주입, 국소 도포, 및 전기천공을 포함하나 이에 한정되지 않는다. 이러한 핵산을 투여하는 적절한 방법이 이용 가능하고 당 기술분야의 숙련자에게 잘 알려져 있으며, 하나 이상의 경로가 특정 조성물을 투여하는 데 사용될 수 있지만, 특정 경로는 종종 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.

본원에서 고려되는 특정 실시예에서 사용하기에 적합한 바이러스 벡터 시스템의 예시적인 실시예는 아데노-연관 바이러스(AAV), 레트로바이러스, 단순 포진 바이러스, 아데노바이러스, 및 우두 바이러스 벡터를 포함하지만, 이에 한정되지는 않는다.

H. 게놈 편집된 세포

특정 실시예에서 고려된 방법에 의해 제조되고/되거나 편집된 게놈 편집된 세포가 제공된다. 특정 실시예에서 고려되는 게놈 편집된 세포는 자가조직성(autologous)/자가유발성(autogeneic)(“자기(self)”) 또는 비자가조직성(“비-자기(non-self)”, 예를 들어, 동종, 동계, 또는 이종)일 수 있다. 본원에서 사용되는 “자가조직성”는 동일한 대상체 유래의 세포를 지칭한다. 본원에서 사용되는 “동종”은 비교 대상 세포와 유전적으로 상이한 동일한 종의 세포를 지칭한다. 본원에서 사용되는 “동계”는 비교 대상 세포와 유전적으로 동일한 상이한 대상체의 세포를 지칭한다. 본원에서 사용되는 바와 같이, “이종(xenogeneic)”은 비교 대상 세포와 다른 종의 세포를 지칭한다. 바람직한 실시예에서, 세포는 포유류 대상체로부터 수득된다. 보다 바람직한 실시예에서, 세포는 영장류 대상체, 임의로 비인간 영장류로부터 수득된다. 가장 바람직한 실시예에서, 세포는 인간 대상체로부터 수득된다.

“단리된 세포”는 비-자연 발생 세포, 예를 들어, 자연에서 존재하지 않는 세포, 변형된 세포, 조작된 세포, 재조합 세포 등으로서, 생체 내 조직 또는 기관으로부터 수득되었고 세포외 기질이 실질적으로 없는 세포를 지칭한다.

특정 실시예에서, 세포는 본원에서 고려되는 융합 폴리펩티드, 예를 들어, DNA-결합 도메인 및 세포에서 선택된 이중 가닥 DNA(dsDNA) 표적 부위에 결합하여 이를 절단하는 귀소 엔도뉴클레아제(HE) 변이체, 폴리펩티드 링커, 및 엑소뉴클레아제를 포함하는 융합 폴리펩티드, 또는 이의 생물학적으로 활성인 단편에 의해 편집된다.

다양한 실시예에서, 세포는 본원에서 고려되는 융합 폴리펩티드에 의해 유도된 방향성 편향 결실을 포함한다. 일부 실시예에서, 방향성 편향 결실의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 또는 적어도 80%는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 DNA-결합 도메인 표적 부위와 동일한 측면에 있다. 일부 실시예에서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 5’이다.

다양한 실시예에서, 결실의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 또는 적어도 80%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 다양한 실시예에서, 결실의 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 또는 적어도 35%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다.

다양한 실시예에서, 결실의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 또는 적어도 80%는 길이가 6 bps 이상이다. 다양한 실시예에서, 결실의 적어도 30%, 적어도 31%, 적어도 32%, 적어도 33%, 적어도 34%, 적어도 35%, 적어도 40%, 적어도 55%, 또는 적어도 60%는 길이가 12 bps 이상이다. 특정 실시예에서, 방향성 편향 결실은 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 또는 약 20개 뉴클레오티드 길이를 포함한다.

본원에서 고려되는 조성물 및 방법을 사용하여 게놈이 편집될 수 있는 세포 유형의 예시적인 예는 세포주, 일차 세포, 줄기 세포, 전구 세포, 및 분화된 세포를 포함하지만, 이들로 한정되지는 않는다.

용어 “줄기 세포”는 (1) 장기간 자가-재생, 또는 원래 세포의 적어도 하나의 동일한 카피를 생성할 수 있는 능력, (2) 단일 세포 수준에서 다수의, 및 일부 경우에, 단 하나의, 특화된 세포 유형으로 분화할 수 있는 능력 및 (3) 생체 내 조직의 기능적 재생할 수 있는 능력이 있는 미분화된 세포를 지칭한다. 줄기 세포는 전능성(totipotent), 분화다능성(pluripotent), 다능성(multipotent) 및 올리고/비효능성으로서 이들의 발달 잠재력에 따라 하위 분류된다. “자가-재생”은 변하지 않은 딸 세포를 생산하고 특화된 세포 유형(효능)을 생성하는 고유한 능력을 갖는 세포를 지칭한다. 자가-재생은 두 가지 방식으로 달성될 수 있다. 비대칭 세포 분열은 부모 세포와 동일한 하나의 딸 세포 및 부모 세포와 상이하고 전구 세포 또는 분화된 세포와 상이한 하나의 딸 세포를 생산한다. 대칭 세포 분열은 2개의 동일한 딸 세포를 생산한다. 세포의 “증식” 또는 “팽창”은 대칭적으로 분열하는 세포를 지칭한다.

본원에서 사용되는 바와 같이, 용어 “전구체” 또는 “전구 세포”는 세포가 자가-재생하고 보다 성숙한 세포로 분화하는 능력을 갖는 것을 지칭한다. 많은 전구 세포는 단일 계통을 따라 분화되지만, 상당히 광범위한 증식 능력을 가질 수 있다.

특정 실시예에서, 세포는 일차 세포이다. 본원에서 사용되는 바와 같이, 용어 “일차 세포”는 당 기술분야에서 조직으로부터 단리되고 시험관 내 또는 생체 외 성장을 위해 확립된 세포를 지칭하는 것으로 공지되어 있다. 상응하는 세포는, 만약 있다면, 집단이 배가되는 경우가 거의 없으며, 따라서 연속 세포주와 비교하여 이들이 유래되는 조직의 주요 기능적 성분을 더 대표적으로 나타내므로, 생체 내 상태에 더 대표적인 모델을 나타낸다. 다양한 조직으로부터 샘플을 수득하는 방법 및 일차 세포주를 확립하는 방법은 당 기술분야에 잘 알려져 있다(예를 들어, Jones and Wise, Methods Mol Biol. 1997 참조). 본원에서 고려되는 방법에 사용하기 위한 일차 세포는 제대혈, 태반 혈액, 동원된 말초 혈액 및 골수로부터 유래된다. 일부 실시예에서, 일차 세포는 조혈 줄기 또는 전구 세포이다.

일 실시예에서, 게놈 편집된 세포는 배아 줄기 세포이다. 일 실시예에서, 게놈 편집된 세포는 성체 줄기 또는 전구 세포이다. 일 실시예에서, 게놈 편집된 세포는 일차 세포이다.

바람직한 실시예에서, 게놈 편집된 세포는 조혈 세포, 예를 들어, 조혈 줄기 세포, 조혈 전구 세포, 예컨대 B 세포 전구 세포, 또는 조혈 세포를 포함하는 세포 집단이다.

본원에서 사용되는 바와 같이, 용어 “세포 집단”은 본원의 다른 곳에서 기술된 바와 같이, 임의의 수 및/또는 동종 또는 이종 세포 유형의 조합으로 구성될 수 있는 복수의 세포를 지칭한다. 예를 들어, 조혈 줄기 또는 전구 세포의 형질도입을 위해, 세포 집단은 제대혈, 태반 혈액, 골수, 또는 동원된 말초 혈액으로부터 단리되거나 수득될 수 있다. 세포 집단은 편집될 표적 세포 유형의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 또는 약 100%를 포함할 수 있다. 특정 실시예에서, 조혈 줄기 또는 전구 세포는 당 기술분야에 공지된 방법을 사용하여 이종 세포의 집단으로부터 단리되거나 정제될 수 있다.

조혈 세포를 수득하기 위한 예시적인 공급원은 제대혈, 골수 또는 동원된 말초 혈액을 포함하지만, 이에 한정되지 않는다.

조혈 줄기 세포(HSC)는 유기체의 수명에 걸쳐 성숙한 혈액 세포의 전체 레파토리를 생성할 수 있는 약속된 조혈 전구 세포(HPC)를 생성한다. 용어 “조혈 줄기 세포” 또는 “HSC”는 유기체의 모든 혈액 세포 유형을 유발하는 다분화능 줄기 세포를 지칭하며, 골수(예를 들어, 단핵구 및 대식세포, 호중구, 호염기구, 호산구, 적혈구, 거핵구/혈소판, 수지상 세포), 및 림프계(예를 들어, T-세포, B-세포, NK-세포), 및 당 기술분야에 공지된 다른 것들( Fei, R., 등, 미국특허 제5,635,387호; McGlave, 등, 미국특허 제5,460,964호; Simmons, P., 등, 미국특허 제5,677,136호; Tsukamoto, 등, 미국특허 제5,750,397호; Schwartz, 등, 미국특허 제5,759,793호; DiGuisto, 등, 미국특허 제5,681,599호; Tsukamoto, 등, 미국특허 제5,716,827호)을 포함한다. 치사 방사선조사된 동물 또는 인간에 이식될 때, 조혈 줄기 및 전구 세포는 적혈구, 호중구-대식세포, 거핵세포 및 림프 조혈 세포 풀을 재충진할 수 있다.

본원에서 고려되는 방법 및 조성물과 함께 사용하기에 적합한 조혈 줄기 또는 전구 세포의 추가적인 예시적인 예는 CD34⁺CD38^LoCD90⁺CD45^RA-인 조혈 세포, CD34⁺, CD59⁺, Thy1/CD90⁺, CD38^Lo/-, C-kit/CD117⁺, 및 Lin^(-)인 조혈세포, 및 CD133⁺인 조혈 세포를 포함한다.

바람직한 실시예에서, 조혈 세포는 CD133⁺CD90⁺이다. 바람직한 실시예에서, 조혈 세포는 CD133⁺CD34⁺이다. 바람직한 실시예에서, 조혈 세포는 CD133⁺CD90⁺CD34⁺이다.

본원에서 사용되는 용어 “CD34+ 세포”는 그의 세포 표면 상에서 CD34 단백질을 발현하는 세포를 지칭한다. 본원에서 사용되는 “CD34”는 종종 세포-세포 부착 인자로서 작용하고 림프절 내로 T 세포의 진입에 관여하는 세포 표면 당단백질(예를 들어, 시알로뮤신 단백질)을 지칭한다. CD34+ 세포 집단은 조혈 줄기 세포(HSC)를 함유하는데, 이는 환자에게 투여 시 분화하여 T 세포, NK 세포, NKT 세포, 호중구, 및 단핵구/대식세포 계통의 세포를 포함하는 모든 조혈 계통에 기여한다.

조혈 계층을 특성화하기 위한 다양한 방법이 존재한다. 특성화의 한 가지 방법은 SLAM 코드이다. SLAM(신호전달 림프구 활성화 분자) 계열은, 모두 면역글로불린 유전자 슈퍼패밀리의 하위 집합에 속하고, 원래 T-세포 자극에 관여하는 것으로 여겨지는, 염색체 1(마우스) 상의 단일 유전자좌에 대부분 순차적으로(tandemly) 위치하는 유전자를 갖는 >10개의 분자 군이다. 이 계열은 CD48, CD150, CD244 등을 포함하고, CD150은 확립 구성원이며, 따라서 slamF1, 즉 SLAM 계열 구성원 1로도 불린다. 조혈 계층에 대한 특징적인 SLAM 코드는 조혈 줄기 세포(HSC) - CD150⁺CD48^-CD244^-; 다능성 전구 세포(MPP) - CD150^-CD48^-CD244⁺; 계통-제한 전구 세포(LRP) - CD150^-CD48⁺CD244⁺; 공통 골수성 전구세포(CMP) - lin-SCA-1-c-kit⁺CD34⁺CD16/32^mid; 과립구-대식세포 전구체(GMP) - lin^-SCA-1-c-kit⁺CD34⁺CD16/32^hi; 및 거핵구-에리트로이드 전구세포(MEP) - lin^-SCA-1-c-kit⁺CD34^-CD16/32^low이다.

본원에서 고려되는 조성물 및 방법으로 편집된 바람직한 표적 세포 유형은 조혈 세포, 바람직하게는인간 조혈 세포, 보다 바람직하게는 인간 조혈 줄기 및 전구 세포, 보다 더 바람직하게는 CD34⁺ 인간 조혈 줄기 세포를 포함한다. 본원에서 사용되는 용어 “CD34+ 세포”는 그의 세포 표면 상에서 CD34 단백질을 발현하는 세포를 지칭한다. 본원에서 사용되는 “CD34”는 종종 세포-세포 부착 인자로서 작용하는 세포 표면 당단백질(예를 들어, 시알로뮤신 단백질)을 지칭한다. CD34+는 조혈 줄기 및 전구 세포 둘 다의 세포 표면 마커이다.

일 실시예에서, 게놈 편집된 조혈 세포는 CD150⁺CD48^-CD244^- 세포이다. 일 실시예에서, 게놈 편집된 조혈 세포는 CD34⁺CD133⁺ 세포이다. 일 실시예에서, 게놈 편집된 조혈 세포는 CD133⁺ 세포이다. 일 실시예에서, 게놈 편집된 조혈 세포는 CD34⁺ 세포이다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드는 면역 효과기 세포에서 도입되고 발현된다. “면역 효과기 세포”는 면역 체계의 임의의 세포로서, 하나 이상의 효과기 기능(예를 들어, 세포독성 세포 사멸 활성, 사이토카인 분비, ADCC 및/또는 CDC의 유도)을 갖는다. 본원에서 고려되는 예시적인 면역 효과기 세포는 T 림프구이며, 이에는 T 세포(CTL; CD8+ T 세포), TIL, 및 헬퍼 T 세포(HTL; CD4+ T 세포)가 포함되지만 이들로 한정되지는 않는다. 특정 실시예에서, 세포는 αβ T 세포를 포함한다. 특정 실시예에서, 세포는 γδ T 세포를 포함한다. 일 실시예에서, 면역 효과기 세포는 자연 살해(NK) 세포를 포함한다. 일 실시예에서, 면역 효과기 세포는 자연 살해 T (NKT) 세포를 포함한다.

면역 효과기 세포는 자가조직성(autologous)/자가유발성(autogeneic)(“자기(self)”) 또는 비자가조직성(“비-자기(non-self)”, 예를 들어, 동종, 동계, 또는 이종)일 수 있다. 본원에서 사용되는 “자가조직성”는 동일한 대상체 유래의 세포를 지칭한다. 본원에서 사용되는 “동종”은 비교 대상 세포와 유전적으로 상이한 동일한 종의 세포를 지칭한다. 본원에서 사용되는 “동계”는 비교 대상 세포와 유전적으로 동일한 상이한 대상체의 세포를 지칭한다. 본원에서 사용되는 “이종”은 비교 대상 세포와 상이한 종의 세포를 지칭한다. 바람직한 실시예에서, 세포는 자가조직성이다.

특정 실시예에서 고려되는 융합 폴리펩티드와 함께 사용되는 예시적인 면역 효과기 세포는 T 림프구를 포함한다. 용어 “T 세포” 또는 “T 림프구”는 흉선세포, 미성숙 T 림프구, 성숙 T 림프구, 휴지기 T 림프구, 또는 활성화된 T 림프구를 포함하도록 의도된다. T 세포는 T 헬퍼 (Th) 세포, 예를 들어 T 헬퍼 1(Th1) 또는 T 헬퍼 2(Th2) 세포일 수 있다. T 세포는 헬퍼 T 세포(HTL; CD4+ T 세포) CD4+ T 세포, 세포독성 T 세포(CTL; CD8+ T 세포), CD4+CD8+ T 세포, CD4-CD8- T 세포, 또는 T 세포의 임의의 다른 하위 집합일 수 있다. 특정 실시예에서 사용하기에 적합한 T 세포의 다른 예시적인 집단은 미처리 T 세포(TN), T 기억 줄기 세포(TSCM), 중심 기억 T 세포(TCM), 효과기 기억 T 세포(TEM), 및 효과기 T 세포(TEFF)를 포함한다.

당 기술분야의 숙련자에 의해 이해되는 바와 같이, 본원에서의 융합 폴리펩티드를 갖는 면역 효과기 세포로서 다른 세포가 또한 사용될 수 있다. 특히, 면역 효과기 세포는 또한 NK 세포, NKT 세포, 호중구, 및 대식세포를 포함한다. 면역 효과기 세포는 또한 효과기 세포의 전구 세포를 포함하며, 이러한 전구 세포는 생체 내 또는 시험관 내에서 면역 효과기 세포로 분화되도록 유도될 수 있다. 따라서, 특정 실시예에서, 면역 효과기 세포는, 대상체에서 투여 시 성숙한 면역 효과기 세포로 분화되거나, 성숙한 면역 효과기 세포로 분화되도록 시험관 내에서 유도될 수 있는 제대혈, 골수, 또는 가동화된 말초 혈액으로부터 유래된 세포의 CD34+ 집단 내에 함유된 조혈 줄기 세포(HSC)와 같은 면역 효과기 세포의 전구 세포를 포함한다.

본원에서 고려되는 CAR을 발현하는 면역 효과기 세포를 만드는 방법이 특정 실시예에서 제공된다. 일 실시예에서, 방법은 면역 효과기 세포가 본원에서 고려되는 하나 이상의 CAR을 발현하도록, 개체로부터 단리된 면역 효과기 세포를 형질감염시키거나 형질도입하는 단계를 포함한다. 특정 실시예에서, 면역 효과기 세포는 개체로부터 단리되고, 시험관 내에서 추가 조작 없이 유전자 변형된다. 그런 다음, 이러한 세포는 개체 내로 직접 재투여될 수 있다. 추가의 실시예에서, 면역 효과기 세포는 CAR을 발현하도록 유전적으로 변형되기 전에 시험관 내에서 먼저 활성화되고 자극되어 증식된다. 이와 관련하여, 면역 효과기 세포는 유전적으로 변형(즉, 본원에서 고려되는 CAR을 발현하도록 형질도입되거나 형질감염)되기 전 및/또는 후에 배양될 수 있다.

특정 실시예에서, 세포의 공급원은 본원에서 고려되는 면역 효과기 세포의 시험관 내 조작 또는 유전적 변형 전에 대상체로부터 수득된다. 특정 실시예에서, 변형된 면역 효과기 세포는 T 세포를 포함한다.

특정 실시예에서, PBMC는 본원에서 고려되는 방법을 사용하여 CAR을 발현하도록 직접적으로 유전적으로 변형될 수 있다. 소정의 실시예에서, PBMC의 단리 후, T 림프구는 추가로 단리되고, 소정의 실시예에서, 세포독성 및 헬퍼 T 림프구 둘 모두는 유전자 변형 및/또는 증식 전 또는 후에 미처리, 기억, 및 효과기 T 세포 하위 모집단으로 분류될 수 있다.

T 세포와 같은 면역 효과기 세포는 공지된 방법을 사용하여 단리 후에 유전적으로 변형될 수 있거나, 면역 효과기 세포는 유전적으로 변형되기 전에 시험관 내에서 활성화되고 증식(또는 전구세포의 경우 분화)될 수 있다. 특정 실시예에서, T 세포와 같은 면역 효과기 세포는, 본원에서 고려되는 키메라 항원 수용체(예를 들어, CAR을 암호화하는 핵산, 또는 CAR을 암호화하는 폴리시스트론 메시지를 포함하는 바이러스 벡터로 형질도입됨)로 유전적으로 변형된 다음, 활성화되고 시험관 내에서 증식된다. 다양한 실시예에서, T 세포는, 예를 들어, 미국 특허 제6,352,694호; 제6,534,055호; 제6,905,680호; 제6,692,964호; 제5,858,358호; 제6,887,466호; 제6,905,681호; 제7,144,575호; 제7,067,318호; 제7,172,869호; 제7,232,566호; 제7,175,843호; 제5,883,223호; 제6,905,874호; 제6,797,514호; 제6,867,041호; 및 미국 특허 출원 공개 제20060121005호에 기술된 바와 같은 방법을 사용하여 CAR을 발현하도록 유전자 변형 전 또는 후에 활성화되고 증식될 수 있다.

일 실시예에서, CD34+ 세포는 본원에서 고려되는 핵산 작제물로 형질도입된다. 특정 실시예에서, 형질도입된 CD34+ 세포는 대상체, 일반적으로 세포가 원래 단리된 대상체에게 투여된 후 생체 내에서 성숙한 면역 효과기 세포로 분화된다. 또 다른 실시예에서, CD34+ 세포는, 본원에서 고려되는 것과 같은 CAR, 다음의 사이토카인 중 하나 이상에 노출되기 전 또는 이에 의해 유전적으로 변형된 후 시험관 내에서 자극될 수 있다: 전술한 방법에 따른, Flt-3 리간드(FLT3), 줄기 세포 인자(SCF), 거대핵세포 성장 및 분화 인자(TPO), IL-3 및 IL-6(Asheuer 등, 2004; Imren 등, 2004).

특정 실시예에서, 암의 치료를 위한 변형된 면역 효과기 세포의 집단은 본원에서 고려되는 CAR을 포함한다. 예를 들어, 변형된 면역 효과기 세포의 집단은 본원에 기술된 B 세포 악성 종양으로 진단된 환자(자가 공여자)로부터 수득된 말초 혈액 단핵 세포(PBMC)로부터 제조된다. PBMC는 CD4+, CD8+ 또는 CD4+ 및 CD8+일 수 있는 이종 T 림프구 집단을 형성한다.

PBMC는 또한 NK 세포 또는 NKT 세포와 같은 다른 세포독성 림프구를 포함할 수 있다. 특정 실시예에서 고려되는 CAR의 코딩 서열을 운반하는 발현 벡터는 인간 공여자 T 세포, NK 세포 또는 NKT 세포의 집단에 도입된다. 특정 실시예에서, 발현 벡터를 운반하는 성공적으로 형질도입된 T 세포는 유세포 계측법을 사용하여 분류되어 CD3 양성 T 세포를 단리한 다음, 항-CD3 항체 및/또는 항-CD28 항체 및 IL-2 또는 본원의 다른 곳에서 기술된 바와 같은 당 기술분야에 공지된 임의의 다른 방법을 사용하는 세포 활성화에 추가하여, T 세포를 발현하는 이들 CAR 단백질의 수를 증가시키도록 추가로 증식될 수 있다. 표준 절차는 인간 대상체에서 사용하기 위한 보관 및/또는 제조를 위한 CAR 단백질 T 세포를 발현하는 T 세포의 동결보존에 사용된다. 일 실시예에서, T 세포의 시험관 내 형질도입, 배양 및/또는 증식은 태아 송아지 혈청 및 태아 소 혈청과 같은 비인간 동물 유래 산물의 부재 하에 수행된다. PBMC의 이종 집단은 유전적으로 변형되기 때문에, 생성된 형질도입 세포는 본원에서 고려되는 것와 같이 BCMA 표적화 CAR을 포함하는 변형된 세포의 이종 집단이다.

추가의 실시예에서, 예를 들어, 1, 2, 3, 4, 5개 또는 그 이상의 상이한 발현 벡터의 혼합물은 면역 효과기 세포의 공여자 집단을 유전적으로 변형시키는 데 사용될 수 있으며, 여기에서 각각의 벡터는 본원에서 고려된 바와 같은 상이한 키메라 항원 수용체 단백질을 암호화한다. 생성된 변형된 면역 효과기 세포는 변형된 세포의 혼합 집단을 형성한다.

T 세포를 포함하는, 유전적으로 조작된 세포는 당 기술분야에 공지된 다양한 방법을 사용하여 제조될 수 있으며, 예를 들어, 그 전체가 참조로서 본원에 통합되는 국제특허공개 WO 2016/094304호를 참조한다.

I. 조성물 및 제형

특정 실시예에서 고려되는 조성물은 본원에서 고려되는 바와 같이, 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 이를 포함하는 벡터, 및 게놈 편집 조성물 및 게놈 편집된 세포 조성물을 포함할 수 있다. 특정 실시예에서 고려되는 게놈 편집 조성물 및 방법은 세포 또는 세포 집단에서 표적 부위를 편집하는 데 유용하다.

다양한 실시예에서, 본원에 고려되는 조성물은 DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 말단-가공 효소, 예를 들어, 3´-5´ 엑소뉴클레아제(ExoX)를 융합 폴리펩티드를 포함한다. 뉴클레아제 변이체는 위에서 개시된 폴리뉴클레오티드 전달 방법, 예를 들어, 전기천공, 지질 나노입자 등을 통해 세포 내로 도입되는 mRNA의 형태일 수 있다. 일 실시예에서, 융합 폴리펩티드, 귀소 엔도뉴클레아제 변이체, 및 3´-5´ 엑소뉴클레아제(예를 들어, ExoX)를 암호화하는 mRNA를 포함하는 조성물은 위에서 개시된 폴리뉴클레오티드 전달 방법을 통해 세포에 도입된다.

특정 실시예에서, 본원에서 고려되는 조성물은 세포 집단, 뉴클레아제 변이체 변이체, 및 선택적으로 공여자 복구 템플릿을 포함한다. 특정 실시예에서, 본원에서 고려되는 조성물은 세포 집단, 뉴클레아제 변이체 변이체, 말단-가공 효소, 및 선택적으로 공여자 복구 템플릿을 포함한다. 뉴클레아제 변이체 및/또는 말단-가공 효소는 위에서 개시된 폴리뉴클레오티드 전달 방법을 통해 세포 내로 도입되는 mRNA의 형태일 수 있다. 공여자 복구 템플릿은 또한 별도의 조성물에 의해 세포 내로 도입될 수 있다.

특정 실시예에서, 본원에서 고려되는 조성물은 세포 집단, DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 3´-5´ 엑소뉴클레아제(예를 들어, ExoX) 및 선택적으로, 공여자 복구 템플릿을 포함하는 융합 폴리펩티드를 포함한다. DNA-결합 도메인, 귀소 엔도뉴클레아제 변이체, 및 3´-5´ 엑소뉴클레아제를 포함하는 융합 폴리펩티드는 위에서 개시된 폴리뉴클레오티드 전달 방법을 통해 세포 내로 도입되는 mRNA의 형태일 수 있다. 공여자 복구 템플릿은 또한 별도의 조성물에 의해 세포 내로 도입될 수 있다.

특정 실시예에서, 세포 집단은 조혈 줄기 세포, 조혈 전구 세포, CD133⁺ 세포, CD34⁺세포, 및 면역 효과기 세포를 포함하지만 이에 한정되지 않는 유전적으로 변형된 조혈 세포를 포함한다.

조성물은 약학적 조성물을 포함하지만 이에 한정되지는 않는다. “약학적 조성물”은 세포 또는 동물에게 단독으로 투여하거나 하나 이상의 다른 치료법과 조합하여 투여하도록 약학적으로 허용되는 또는 생리학적으로 허용 가능한 용액으로 제형화된 조성물을 지칭한다. 또한, 원하는 경우, 조성물은, 예를 들어, 사이토카인, 성장 인자, 호르몬, 저분자, 화학요법제, 전구약물, 약물, 항체, 또는 다른 다양한 약학적 활성제와 같은 다른 제제와 병용 투여될 수도 있음을 이해할 것이다. 추가 제제가 조성물의 능력에 악영향을 미치지 않는다면, 조성물에 또한 포함될 수 있는 다른 성분에는 사실상 제한이 없다.

“약학적으로 허용되는”이라는 문구는, 건전한 의학적 판단의 범위 내에서, 과도한 독성, 자극, 알레르기 반응, 또는 다른 문제나 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합하고, 합리적인 이익/위험 비율에 상응하는 화합물, 물질, 조성물, 및/또는 투여 형태를 지칭하도록 본원에서 사용된다.

용어 “약학적으로 허용되는 담체”는 치료 세포가 투여되는 희석제, 애쥬번트, 부형제 또는 비히클을 지칭한다. 약학적 담체의 예시적인 예는 세포 배양 배지, 물, 및 오일과 같은 멸균 액체일 수 있으며, 이에는 석유, 동물, 식물성 또는 합성 기원의 것들, 예컨대 땅콩유, 대두유, 광유, 참기름 등이 포함된다. 식염수 용액 및 수성 덱스트로오스 및 글리세롤 용액도 액체 담체로서, 특히 주사 가능식 용액으로서 사용될 수 있다. 특정 실시예에서 적절한 약학적 부형제는 전분, 포도당, 락토오스, 수크로오스, 젤라틴, 맥아, 벼, 밀가루, 분필, 실리카 겔, 스테아린산나트륨, 글리세롤 모노스테아레이트, 탈크, 염화나트륨, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함한다. 임의의 종래의 배지 또는 제제가 활성 성분과 호환되지 않는 경우를 제외하고, 치료 조성물에서의 이의 용도가 고려된다. 보충 활성 성분도 조성물에 혼입될 수 있다.

일 실시예에서, 약학적으로 허용되는 담체를 포함하는 조성물은 대상체에게 투여하기에 적합하다. 특정 실시예에서, 담체를 포함하는 조성물은 비경구 투여, 예를 들어, 혈관 내(정맥 내 또는 동맥 내), 복강 내, 또는 근육 내 투여에 적합하다. 특정 실시예에서, 약학적으로 허용되는 담체를 포함하는 조성물은 뇌실내, 척수내 또는 척수강내 투여에 적합하다. 약학적으로 허용되는 담체는 멸균 수용액, 세포 배양 배지, 또는 분산액을 포함한다. 약학적 활성 물질용으로 이러한 매체 및 제제를 사용하는 것은 당 기술분야에 잘 알려져 있다. 임의의 종래의 배지 또는 제제가 형질도입된 세포와 호환되지 않는 경우를 제외하고, 치료 조성물에서의 이의 용도가 고려된다.

특정 실시예에서, 본원에 고려되는 조성물은 유전적으로 변형된 조혈 줄기 및/또는 전구 세포 또는 본원에 고려되는 융합 폴리펩티드를 암호화하는 외인성 폴리뉴클레오티드를 포함하는 면역 효과기 세포 및 약학적으로 허용되는 담체를 포함한다.

본원에서 고려되는 세포-기반 조성물을 포함하는 조성물은 비경구 투여 방법에 의해 투여될 수 있다.

약학적으로 허용되는 담체는 치료 중인 인간 대상체에게 투여하기에 적합하도록 충분히 높은 순도 및 충분히 낮은 독성을 가져야 한다. 이는 조성물의 안정성을 추가로 유지하거나 증가시켜야 한다. 약학적으로 허용되는 담체는 액체 또는 고형분일 수 있고, 조성물의 다른 성분과 조합될 때 원하는 벌크, 점조도 등을 제공하도록 계획된 투여 방식을 염두에 두고 선택된다. 예를 들어, 약학적으로 허용되는 담체는, 결합제(예를 들어, 사전 젤라틴화 옥수수 전분, 폴리비닐피롤리돈, 또는 히드록시프로필 메틸셀룰로오스 등), 필러(예를 들어, 락토오스 및 기타 당, 미정질 셀룰로오스, 펙틴, 젤라틴, 황산칼슘, 에틸 셀룰로오스, 폴리아크릴레이트, 인산수소칼슘 등), 윤활제(예를 들어, 스테아린산 마그네슘, 탈크, 실리카, 콜로이드성 이산화규소, 스테아르산, 금속 스테아레이트, 수소화 식물성 오일, 옥수수 전분, 폴리에틸렌 글리콜, 벤조산나트륨, 아세트산나트륨 등), 붕해제(예를 들어, 전분, 전분 글리콜산나트륨 등), 또는 습윤제(예를 들어, 라우릴황산나트륨 등)일 수 있으나, 이에 한정되지 않는다. 본원에서 고려되는 조성물에 적합한 다른 약학적으로 허용되는 담체는 물, 염 용액, 알코올, 폴리에틸렌 글리콜, 젤라틴, 아밀로스, 스테아린산 마그네슘, 탈크, 규산, 점성 파라핀, 히드록시메틸셀룰로오스, 폴리비닐피롤리돈 등을 포함하나 이에 한정되지 않는다.

이러한 담체 용액은 완충제, 희석제 및 다른 적절한 첨가제를 함유할 수도 있다. 본원에서 사용되는 바와 같이, 용어 “완충제”는 pH의 상당한 변화 없이 산 또는 염기를 중화시키는 화학적 구성을 가진 용액 또는 액체를 지칭한다. 본원에서 고려되는 완충제의 예는, Dulbecco의 인산염 완충 식염수(PBS), 링거 용액, 물 중 5% 덱스트로스(D5W), 정상/생리 식염수(0.9% NaCl)를 포함하나 이에 한정되지 않는다.

약학적으로 허용되는 담체는 조성물의 pH를 약 7로 유지하기에 충분한 양으로 존재할 수 있다. 대안적으로, 조성물은 약 6.8 내지 약 7.4, 예를 들어, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3 및 7.4 범위의 pH를 갖는다. 또 다른 실시예에서, 조성물은 약 7.4의 pH를 갖는다.

본원에서 고려되는 조성물은 비독성 약학적으로 허용되는 배지를 포함할 수 있다. 조성물은 현탁액일 수 있다. 본원에서 사용되는 용어 “현탁액”은 세포가 고형 지지체에 부착되지 않는 비접착 조건을 지칭한다. 예를 들어, 현탁액으로서 유지되는 세포는 교반되거나 교반될 수 있고 배양 접시와 같은 지지체에 부착되지 않는다.

특정 실시예에서, 본원에서 고려되는 조성물은 현탁액으로 제형화되며, 이 경우 게놈 편집된 조혈 줄기 및/또는 전구 세포는, 정맥 주사(IV)용 백 등에 담긴 상태로, 허용 가능한 액체 매질 또는 용액, 예를 들어, 식염수 또는 무혈청 매질 내에서 분산된다. 허용 가능한 희석제는 물, PlasmaLyte, 링거 용액, 등장성 염화나트륨(식염수) 용액, 무혈청 세포 배양 배지, 및 극저온 저장에 적합한 배지, 예를 들어, Cryostor® 배지를 포함하나 이에 한정되지 않는다.

특정의 실시예에서, 약학적으로 허용되는 담체는 인간 또는 동물 기원의 천연 단백질이 실질적으로 없고, 게놈 편집된 세포의 집단, 예를 들어, 조혈 줄기 및 전구 세포를 포함하는 조성물을 저장하는 데 적합하다. 치료 조성물은 인간 환자에게 투여되도록 의도되며, 따라서 소 혈청 알부민, 말 혈청, 및 소 태아 혈청과 같은 세포 배양 성분이 실질적으로 없다.

일부 실시예에서, 조성물은 약학적으로 허용되는 세포 배양 배지로 제형화된다. 이러한 조성물은 인간 대상체에게 투여하기에 적합하다. 특정 실시예에서, 약학적으로 허용되는 세포 배양 배지는 무혈청 배지이다.

무혈청 배지는 세럼 함유 배지에 비해 여러 가지 장점을 갖는데, 이에는 단순화되고 더 잘 정의된 조성물, 오염도의 감소, 감염물질의 잠재적 공급원의 제거, 및 낮은 비용이 포함된다. 다양한 실시예에서, 무혈청 배지는 무동물성이며, 임의로 무단백질일 수 있다. 임의로, 배지는 생물 약학적으로 허용되는 재조합 단백질을 함유할 수 있다. “무동물성(animal-free)” 배지는 그 성분이 비-동물 공급원으로부터 유래된 배지를 지칭한다. 재조합 단백질은 무동물성 배지에서 천연 동물 단백질을 대체하며, 영양소는 합성, 식물, 또는 미생물 공급원으로부터 얻는다. 대조적으로, “무단백질(protein-free)” 배지는 실질적으로 단백질이 없는 것으로 정의된다.

특정 조성물에 사용된 무혈청 배지의 예시적인 예는 QBSF-60(Quality Biological, Inc.), StemPro-34(Life 기술), 및 X-VIVO 10을 포함하지만, 이에 한정되지는 않는다.

바람직한 실시예에서, 게놈 편집된 조혈 줄기 및/또는 전구 세포를 포함하는 조성물은 PlasmaLyte에서 제형화된다.

다양한 실시예에서, 조혈 줄기 및/또는 전구 세포를 포함하는 조성물은 동결보존 배지에서 제형화된다. 예를 들어, 동결보존제가 포함된 동결 보존 배지를 사용해 해동 후 높은 세포 생존력 결과를 유지할 수 있다. 특정 조성물에 사용된 동결보존 배지의 예시적인 예는 CryoStor CS10, CryoStor CS5, 및 CryoStor CS2를 포함하지만, 이에 한정되지는 않는다.

일 실시예에서, 조성물은 PlasmaLyte A와 CryoStor CS10을 50:50의 비율로 포함하는 용액으로 제형화된다.

특정 실시예에서, 조성물은 마이코플라스마, 내독소, 및 미생물 오염이 실질적으로 없다. 내독소와 관련하여 “실질적으로 없는”이란 말은 생물학적 제제에 대해 FDA가 허용하는 것보다 세포 투여량당 내독소가 더 적다는 것을 의미하며, 이는 하루당 체중 1 kg당 5 EU의 총 내독소에 상응하며, 평균 체중이 70 kg인 사람의 경우 총 세포 투여량당 350 EU에 상응한다. 특정 실시예에서, 본원에서 고려되는 레트로바이러스 벡터로 형질도입된 조혈 줄기 또는 전구 세포를 포함하는 조성물은 약 0.5 EU/mL 내지 약 5.0 EU/mL, 또는 약 0.5 EU/mL, 1.0 EU/mL, 1.5 EU/mL, 2.0 EU/mL, 2.5 EU/mL, 3.0 EU/mL, 3.5 EU/mL, 4.0 EU/mL, 4.5 EU/mL, 또는 5.0 EU/mL을 함유한다.

특정의 실시예에서, 하나 이상의 재프로그래밍된 뉴클레아제를 암호화하는 하나 이상의 mRNA, 및 선택적으로 말단-가공 효소를 포함하지만 이에 한정되지 않는, 폴리뉴클레오티드의 전달에 적합한 조성물 및 제형이 고려된다.

생체 외 전달을 위한 예시적인 제형은 또한 인산칼슘, 전기천공, 열충격 및 다양한 리포좀 제형(즉, 지질-매개 형질감염)과 같은 당 기술분야에 공지된 다양한 형질감염제의 사용을 포함할 수 있다. 아래에서 더욱 상세히 설명되는 바와 같이, 리포좀은 수성 유체의 분획을 포획하는 지질 이중층이다. DNA는 (이의 전하에 의해) 양이온성 리포좀의 외부 표면에 자발적으로 결합하고, 이들 리포좀은 세포막과 상호 작용할 것이다.

특정 실시예에서, 약학적으로 허용되는 담체 용액의 제형은 다양한 치료 요법에서 본원에 기술된 특정 조성물을 사용하기 위한 적절한 투여 및 치료 요법의 개발하는 것과 마찬가지로 당 기술분야의 숙련자에게 잘 알려져 있으며, 적절한 투여 및 치료 요법에는, 예를 들어, 장내 및 비경구, 예를 들어, 혈관내, 정맥내, 동맥내, 골내, 심실내, 뇌내, 두개내, 척수내, 경막내, 및 골수내 투여 및 제형이 포함된다. 당 기술분야의 숙련자는, 본원에서 고려되는 특정 실시예가, 약학 분야에서 잘 알려져 있고, 예를 들어, 다음 문헌에서 기술된 것들과 같은 다른 제형을 포함할 수 있음을 이해할 것이다: Remington: The Science and Practice of Pharmacy, volume I and volume II. 22^nd Edition. Edited by Loyd V. Allen Jr. Philadelphia, PA: Pharmaceutical Press; 2012, 이는 그 전체가 참조로서 본원에 통합된다.

J. 부위-지향 돌연변이 유발 방법

주어진 결실 또는 삽입(삽입결실)을 정의하는 정성적 특성은 (i) 삽입되거나 결실된 염기의 수에 있어서 그 길이; (ii) 일반적으로 뉴클레아제 표적 부위 또는 중단점에 대해 언급되는, 염색체를 따른 그의 종방향 위치; 및 (iii) 삽입의 경우, 삽입된 서열 길이 및 조성이다. 결실은 가장 현저한 결과이며, 일반적으로 관찰된 이벤트의 90 내지 95%를 포함한다. 이들의 가장 흔히 보고된 크기 특성은 작은 경향이 있고(즉, 그 범위의 하한을 향해 편향된 빈도로 길이가 1 내지 20 염기 쌍임), 이들의 위치 분포는 균등하게 분포되어, 상당한 편향 없이 DNA 중단점을 덮고 어느 방향으로든 외측으로 나오는 것으로 밝혀졌다. 이들 특성에 대한 예외는 DNA 중단점의 어느 한 쪽에 위치하는 마이크로상동성(약 3 내지 6 염기쌍 길이의 작은 복제 관)에 의해 유도되는 것으로 흔히 가정된다. 게놈 편집 도구를 적용하는 동안 훨씬 덜 빈번하게 발생하는 삽입의 특성에 관한 보고는 거의 없다. 또한, 각각의 삽입결실 종을 표현형(예를 들어, 이것이 개방 판독 프레임에 미치는 영향 또는 전사 인자 결합 모티프를 파괴하는지 여부)에 관련시키는 유전자형 특성은 잠재적으로 광범위하고 각각의 주어진 적용에 대해 특이적이다.

조작된 메가TAL 뉴클레아제, 및 DNA-결합 도메인 및 귀소 엔도뉴클레아제를 포함하는 다른 융합 폴리펩티드는 다른 유전자 편집 플랫폼과 구별되는 특징을 갖는다. 예를 들어, 메가TAL은, 재프로그래밍된 귀소 엔도뉴클레아제(HE)에 융합된 모듈형으로 조립된 전사 활성화제-유사 효과기(TALE) 어레이를 포함하는 단량체의 하이브리드 분자이다. 표적 부위에서 HE를 고정하는 TALE 어레이는 대략 6 내지 18 염기쌍의 결합 부위를 인식하도록 크기를 정할 수 있다. 귀소 엔도뉴클레아제는 22 염기쌍 표적 부위를 인식하고 절단한다. 2개의 표적 부위는 길이가 0 내지 약 12 염기쌍일 수 있는 스페이서 영역에 의해 분리된다. 메가TAL 뉴클레아제의 2가지 고유한 특성은 이들의 고유한 조성물로부터 발생한다: (i) TALE 어레이의 고정 메커니즘은 표적 부위의 일 측에 대한 전체 결합 친화도의 고도로 편향된 분포를 제공함; 및 (ii) 귀소 엔도뉴클레아제에 의해 촉매되는 DNA 절단 반응의 생성물은 3’ 돌출된 4 염기쌍 길이의 DNA 말단임 역으로, 징크 핑거 또는 TALE 어레이가 각각 FokI 뉴클레아제에 의해 작동되는 ZFN 및 TALEN은 결합 친화도의 비교적 균일한 분포를 가지며, 5’ 돌출 말단 4개 염기쌍 길이로 생성한다. CRISPR DNA 인식 및 절단의 메커니즘은 DNA 서열 인식 및 친화도 측면에서 근본적으로 구별되지만, DNA 절단의 생성물은 뭉툭한 말단 DNA(Cas9) 또는 5’ 돌출 말단(Cpf1)이다.

유전자 편집 이벤트의 정량적 및 정성적 측면을 평가하기 위해, 본 발명자들은 본원에서 융합 폴리펩티드를 고려하고, 다양한 말단-가공 효소의 공동 전달을 시험하여 편집된 대립유전자에 대한 이들의 영향을 특성화하였다. 또한, 본 발명자들은 인라인 효소 기능에 의해 편집 결과가 어떻게 조작될 수 있는지를 평가하기 위해 다수의 다자족 메가TAL 융합 단백질을 설계하였다.

따라서, 본 발명자들은 놀랍게도, 엑소뉴클레아제에 연결되지 않은 DNA-결합 도메인 및 귀소 엔도뉴클레아제 변이체를 포함하는 융합 폴리펩티드에 비해, 즉, DNA-결합 도메인 / 귀소 엔도뉴클레아제 융합 및 엑소뉴클레아제가 별도로 발현되는 경우에 비해, 링커 도메인(예를 들어, 폴리펩티드 링커)에 의해 엑소뉴클레아제, 특히 Trex2, ExoI, 또는 ExoX에 연결된, DNA-결합 도메인 및 귀소 엔도뉴클레아제 변이체를 포함하는 융합 폴리펩티드가, 세포에서 발현될 때, 신장되고 방향성 편향 결실됨을 발견하였다.

따라서, 이중-가닥 DNA(dsDNA) 표적 부위를 선택하는 단계, 및 본원에 고려된 융합 폴리펩티드, 폴리뉴클레오티드, mRNA, 또는 본원에서 고려되는 융합 폴리펩티드를 암호화하는 벡터를 세포 내에 도입하는 단계를 포함하는, 세포에서의 부위-지향 돌연변이 유발 방법이 제공되며, 여기서 융합 펩티드는 세포에서 선택된 dsDNA 표적 절단 부위 근처에서 결실 중심을 갖는 방향성 편향 결실을 생성한다.

다양한 실시예에서, 이러한 방법은, DNA-결합 도메인 및 세포에서 선택된 이중 가닥 DNA(dsDNA) 표적 부위에 결합하여 이를 절단하는 귀소 엔도뉴클레아제(HE) 변이체; 링커 도메인; 및 엑소뉴클레아제 또는 이의 생물학적으로 활성인 단편을 포함하는 융합 폴리펩티드를 도입하는 단계를 포함한다. 일부 실시예에서, 엑소뉴클레아제는 Trex2, ExoI, 또는 ExoX이다. 일부 실시예에서, DNA-결합 도메인은 TALE DNA-결합 도메인(예를 들어 메가TAL) 또는 징크 핑거 DNA-결합 도메인을 포함한다.

다양한 실시예에서, ExoX, 또는 이의 생물학적으로 활성인 단편은 서열번호 109에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함한다.

다양한 실시예에서, ExoI, 또는 이의 생물학적으로 활성인 단편은 서열번호 112에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열인 아미노산을 포함한다.

다양한 실시예에서, 링커 도메인은 펩티드 링커이다. 일부 실시예에서, 펩티드 링커는 자가-절단 펩티드 링커이다. 일부 실시예에서, 펩티드 링커는 약 4 내지 약 30개의 아미노산을 포함한다. 일부 실시예에서, 펩티드 링커는 (GGGGS)_1-4 링커(서열번호 117 및 150 내지 152)이다.

다양한 실시예에서, HE 변이체는 LAGLIDADG 귀소 엔도뉴클레아제(LHE) 변이체이다. 일부 실시예에서, 상기 HE 변이체는 다음으로 이루어진 군으로부터 선택되는 LHE의 변이체이다: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-SceI, I-ScuMI, I-SmaMI, I-SscMI, 및 I-Vdi141I.

다양한 실시예에서, 고려된 방법은 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자 내의 부위를 표적으로 하는 융합 폴리펩티드를 도입하는 단계를 포함한다. 일부 실시예에서, 표적 부위는 다음으로 이루어진 군으로부터 선택되는 유전자 내에 있다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), TCRβ, IL10Rα, IL10Rβ, TGFBR1, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, BCL11A, KLF1, SOX6, GATA1, LSD1, 알파 엽산 수용체(FRα), αvβ6 인테그린, B 세포 성숙 항원(BCMA), B7-H3(CD276), B7-H6, 탄산 탈수효소 IX(CAIX), CD16, CD19, CD20, CD22, CD30, CD33, CD37, CD38, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD133, CD138, CD171, 암배아 항원(CEA), C형 렉틴-유사 분자-1(CLL-1), CD2 서브세트 1(CS-1), 콘드로이틴 설페이트 프로테오글리칸 4(CSPG4), 피부 T 세포 림프종-관련 항원 1(CTAGE1), 상피 성장 인자 수용체(EGFR), 상피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP2), 상피 당단백질 40(EGP40), 상피 세포 부착 분자(EPCAM), 에프린 A형 수용체 2(EPHA2), 섬유아세포 활성화 단백질(FAP), Fc 수용체 유사 5(FCRL5), 태아 아세틸콜린에스터라제 수용체(AchR), 강글리오시드 G2(GD2), 강글리오시드 G3(GD3), 글리피칸-3(GPC3), ErbB2를 포함하는 EGFR 패밀리(HER2), IL-11Rα, IL-13Rα2, 카파 암/고환 항원 2(LAGE-1A), 람다, 루이스-Y(LeY), L1 세포 부착 분자(L1-CAM), 흑색종 항원 유전자(MAGE)-A1, MAGE-A3, MAGE-A4, MAGE-A6, MAGEA10, T 세포 1에 의해 인식되는 흑색종 항원(MelanA 또는 MART1), 메소텔린(MSLN), MUC1, MUC16, MHC 클래스 I 사슬 관련 단백질 A(MICA), MHC 클래스 I 사슬 관련 단백질 B(MICB), 신경 세포 부착 분자(NCAM), 암/고환 항원 1(NY-ESO-1), 폴리시알산; 태반-특이적 1(PLAC1), 흑색종에서 우선적으로 발현되는 항원(PRAME), 전립선 줄기 세포 항원(PSCA), 전립선-특이적 막 항원(PSMA), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 윤활막 육종, X 중단점 2(SSX2), 서바이빈, 종양 결합된 당단백질 72(TAG72), 종양 내피 마커 1(TEM1/CD248), 종양 내피 마커 7-관련(TEM7R), TEM5, TEM8, 영양막 당단백질(TPBG), UL16-결합 단백질(ULBP) 1, ULBP2, ULBP3, ULBP4, ULBP5, ULBP6, 혈관 내피 성장 인자 수용체 2(VEGFR2), 및 빌름스 종양 1(WT-1) 유전자.

일부 실시예에서, 표적 부위는 다음으로 이루어진 군으로부터 선택된 유전자 내에 있다: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), IL10Rα, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, 및 BCL11A 유전자

다양한 실시예에서, 표적 부위는 TRAC(TCRα) 유전자, CBL-B 유전자, 또는 PDCD1(PD-1) 유전자 내에 있다. 특정 실시예에서, TCRα 유전자 표적 부위는 서열번호 1에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, CBL-B 유전자 표적 부위는 서열번호 2에 제시된 아미노산 서열을 포함한다. 특정 실시예에서, PD-1 유전자 표적 부위는 서열번호 3에 제시된 아미노산 서열을 포함한다.

본 개시내용 전체에 걸쳐 고려되는 바와 같이, 융합 폴리펩티드 및 관련 방법은 선택된 dsDNA 표적 부위에서 세포에 방향성 편향 결실을 생성한다. 다양한 실시예에서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 DNA-결합 도메인 표적 부위와 동일한 측면에 있다. 특정 실시예에서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 5’이다.

다양한 실시예에서, 50%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 51%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 52%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 53%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 54%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 55%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 56%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 57%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 58%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 59%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 60%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 65%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 70%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 75%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다. 일부 실시예에서, 80%를 초과하는 방향성 편향 결실은 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는다.

다양한 실시예에서, 결실의 적어도 50%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 51%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 52%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 53%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 54%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 55%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 56%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 57%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 58%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 59%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 60%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 65%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 70%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 75%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 80%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다.

다양한 실시예에서, 결실의 적어도 10%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 11%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 12%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 13%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 14%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 15%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 16%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 17%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 18%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 19%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 20%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 25%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 30%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다. 일부 실시예에서, 결실의 적어도 35%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는다.

다양한 실시예에서, 결실의 적어도 50%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 51%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 52%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 53%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 54%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 55%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 56%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 57%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 58%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 59%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 60%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 65%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 70%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 75%는 6 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 80%는 6 bps 이상의 길이이다.

다양한 실시예에서, 결실의 적어도 30%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 31%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 32%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 33%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 34%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 35%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 36%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 37%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 38%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 39%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 40%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 45%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 50%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 55%는 12 bps 이상의 길이이다. 일부 실시예에서, 결실의 적어도 60%는 12 bps 이상의 길이이다.

다양한 실시예에서, 방향성 편향 결실은 약 10개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 11개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 12개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 13개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 14개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 15개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 16개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 17개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 18개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 19개의 뉴클레오티드의 길이를 포함한다. 일부 실시예에서, 방향성 편향 결실은 약 20개의 뉴클레오티드의 길이를 포함한다.

다양한 실시예에서, 결실은 DNA-결합 도메인 표적 부위 내로 연장된다. 다양한 실시예에서, 결실 중심 위치는 DNA-결합 도메인 표적 부위 내에 있다.

다양한 실시예에서, 방법은 융합 폴리펩티드 외에, 말단 가공 효소, 또는 이의 생물학적으로 활성인 단편, 또는 폴리뉴클레오티드, RNA, 또는 말단 가공 효소(예를 들어, 엑소뉴클레아제)를 암호화하는 벡터를 세포 내로 도입하는 단계를 추가로 포함한다. 일부 실시예에서, 말단-가공 효소, 또는 이의 생물학적으로 활성인 단편은 하기로 이루어진 군으로부터 선택된다: Trex2, Trex1, 막관통 도메인이 없는 Trex1, Apollo, Artemis, DNA2, ExoI, ExoT, ExoIII, ExoX, Fen1, Fan1, MreII, Rad2, Rad9, TdT(말단 데옥시뉴클레오티딜 트랜스퍼라제), PNKP, RecE, RecJ, RecQ, 람다 엑소뉴클레아제, Sox, 우두 DNA 중합효소, 엑소뉴클레아제 I, 엑소뉴클레아제 III, 엑소뉴클레아제 VII, NDK1, NDK5, NDK7, NDK8, WRN, T7-엑소뉴클레아제 유전자 6, 조류 골수아세포 바이러스 통합 단백질 (IN), 블룸(Bloom), 안타르틱 포스파타제(Antartic Phophatase), 알칼리 포스파타제(Alkaline Phosphatase), 폴리 뉴클레오티드 키나제(PNK), ApeI, 녹두 뉴클레아제, Hex1, TTRAP(TDP2), Sgs1, Sae2, CUP, Pol mu, Pol 람다, MUS81, EME1, EME2, SLX1, SLX4 및 UL-12. 일부 실시예에서, 말단 가공 효소는 엑소뉴클레아제이다. 특정 실시예에서, 엑소뉴클레아제는 Trex2 또는 이의 생물학적으로 활성인 단편이다.

특정 실시예에서, 세포 내 부위-지향 돌연변이 유발의 방법이 제공되며, 상기 방법은 이중-가닥 DNA(dsDNA) 표적 부위를 선택하는 단계, 및 융합 폴리펩티드, 또는 폴리뉴클레오티드, mRNA 또는 본원에서 고려되는 융합 폴리펩티드를 암호화하는 벡터를 세포 내에 도입하는 단계를 포함하며, 여기서 융합 펩티드는 세포 내에서 선택된 dsDNA 표적 절단 부위 근처에 결실 중심을 갖는 방향성 편향 결실을 생성한다.

특정 실시예에서, 이러한 방법은 이중-가닥 DNA(dsDNA) 표적 부위를 선택하는 단계; DNA-결합 도메인 및 세포에서 선택된 이중 가닥 DNA(dsDNA) 표적 부위에 결합하여 이를 절단하는 귀소 엔도뉴클레아제(HE) 변이체, 링커 도메인, 및 ExoI를 포함하는 융합 폴리펩티드, 또는 이의 생물학적으로 활성인 단편을 세포 내에 도입하는 단계; 및 엑소뉴클레아제(예를 들어, Trex2)를 도입하는 단계를 포함하며; 여기서 이러한 방법은 세포 내에서 선택된 dsDNA 표적 절단 부위 근처에 결실 중심을 갖는 방향성 편향 결실을 생성한다.

K. 치료 방법

본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 질환 또는 장애의 예방, 치료 및 완화에 사용되거나, 이와 관련된 질환 또는 증상을 개선하는 데 사용될 수 있다. 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 질환(암, 허혈, 당뇨병성 망막병증, 황반 변성, 류마티스 관절염, 건선, HIV 감염, 겸상 적혈구 빈혈증, 알츠하이머병, 근이영양증, 신경퇴행성 질환, 혈관 질환, 낭성 섬유증, 뇌졸중, 고 IGE 증후군, 혈우병)의 치료, 예방 또는 억제, 또는 암, 허혈, 당뇨병성 망막병증, 황반 변성, 류마티스 관절염, 건선, HIV 감염, 겸상 적혈구 빈혈증, 알츠하이머병, 근이영양증, 신경퇴행성 질환, 혈관 질환, 낭성 섬유증, 뇌졸중, 고 IGE 증후군, 혈우병과 같은 질환 상태 또는 질환과 관련된 증상을 완화하는 방법에서 사용될 수 있다.

일부 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 상 염색체 우성 질환, 예컨대 연골 무형성증, 가성 연골 무형성증, 다수의 골단 이형성증, 연골이형성증, 골형성 부전증, 마르판 증후군, 다지증, 유전성 운동 감각 신경병증 I 및 II(샤르코-마리-투스병), 근긴장 이영양증, 및 신경섬유종증을 치료, 예방 또는 억제하는데 유용하거나, 상 염색체 우성 질환 예컨대 연골 무형성증, 가성 연골 무형성증, 다수의 골단 이형성증, 연골이형성증, 골형성 부전증, 마르판 증후군, 다지증, 유전성 운동 감각 신경병증 I 및 II(샤르코-마리-투스병), 근긴장 이영양증, 및 신경섬유종증과 관련된 질환 상태 또는 증상을 완화하는데 유용하다. 일부 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 유전자의 오조절에 의해 야기되는 질환을 치료, 예방 또는 억제하는 데 유용하다.

바람직한 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 면역 장애 또는 암과 관련된 적어도 하나의 증상을 예방, 치료 및/또는 완화하는 데 사용될 수 있다.

“면역 장애”는 면역계로부터 반응을 유발하는 질환을 지칭한다. 특정 실시예에서, 용어 “면역 장애”는 암, 이식편-대-숙주 질환, 자가면역 질환, 또는 면역결핍증을 지칭한다. 일 실시예에서, 면역 장애는 감염성 질환을 포함한다.

본원에서 사용되는 바와 같이, 용어 “암”은 일반적으로 비정상적인 세포가 조절 없이 분열하고 인접 조직을 침범할 수 있는 질환 또는 병태의 부류에 관한 것이다.

본원에서 사용되는 바와 같이, 용어 “악성”은 종양 세포군이 조절되지 않은 성장(즉, 정상 한계를 초과하는 분열), 침윤(즉, 인접 조직의 침입 및 파괴), 및 전이(즉, 림프 또는 혈액을 통해 신체의 다른 위치로 확산됨) 중 하나 이상을 나타내는 암을 지칭한다.

본원에서 사용되는 용어 “전이”는 암이 신체의 일 부분으로부터 다른 부분으로 확산되는 것을 지칭한다. 확산된 세포에 의해 형성된 종양을 “전이성 종양” 또는 “전이”라고 한다. 전이성 종양은 원래(원발성) 종양에 있는 것들과 유사한 세포를 함유한다.

본원에서 사용되는 용어 “양성” 또는 “비악성”은 더 크게 자랄 수 있지만 신체의 다른 부위로 확산되지 않는 종양을 지칭한다. 양성 종양은 자기 제한적이며, 일반적으로 침입하거나 전이되지 않는다.

“암세포” 또는 “종양 세포”는 암 성장물 또는 조직의 개별 세포를 지칭한다. 종양은 세포의 비정상적인 성장에 의해 형성된 팽윤부 또는 병변을 지칭하며, 이들은 일반적으로 양성, 전악성, 또는 악성일 수 있다. 대부분의 암은 종양을 형성하지만, 예를 들어, 백혈병과 같은 일부는 반드시 종양을 형성하지는 않는다. 종양을 형성하는 암의 경우, 암(세포) 및 종양(세포)이라는 용어는 상호 교환적으로 사용된다. 개체에서의 종양의 양은 “종양 부담(종양 burden)”이며, 이는 종양의 수, 부피, 또는 중량으로서 측정될 수 있다.

“이식편-대-숙주 질환” 또는 “GVHD”는 세포, 조직 또는 고형 장기 이식 후 발생할 수 있는 합병증을 지칭한다. GVHD는 이식된 공여자 세포가 이식 수용자의 신체를 공격하는 줄기 세포 또는 골수 이식 후에 발생할 수 있다. 인간에서 급성 GVHD는 이식 후 약 60일 이내에 발생하며, 세포용해성 림프구의 작용에 의해 피부, 간 및 장에 손상을 초래한다. 만성 GVHD는 나중에 발생하며, 주로 피부에 영향을 미치는 전신 자가면역 질환으로서, B 세포의 다클론 활성화 및 Ig 및 자가항체의 과생산을 초래한다. 고형-장기 이식 이식편-대-숙주 질환(SOT-GVHD)은 두 가지 형태로 발생한다. 보다 흔한 유형은 항체 매개형이며, 여기서 혈액형 O인 공여자의 항체는 혈액형 A, B, 또는 AB형인 수용자에서 수용자의 적혈구를 공격하여 경증의 일시적인 용혈성 빈혈을 초래한다. SOT-GVHD의 제2 형태는 높은 사망률과 관련된 세포 유형이며, 여기서 공여자-유래 T 세포는 면역학적으로 이질적인 숙주 조직에 대한 면역학적 공격을 생성하는데, 가장 흔하게는 피부, 간, 위장관 및 골수에서, 이들 기관의 합병증을 초래한다.

“이식편-대-백혈병” 또는 “GVL”은 골수 또는 말초 혈액과 같은 공여자의 이식된 조직에 존재하는 면역 세포에 의한 사람의 백혈병 세포에 대한 면역 반응을 지칭한다.

“자가면역 질환”은 신체가 자신의 조직의 일부 성분에 대한 면역원성(즉, 면역 체계) 반응을 생성하는 질환을 지칭한다. 즉, 면역 체계는 신체 내의 일부 조직 또는 시스템을 “자기”로서 인식하는 능력을 상실하고, 이를 마치 이물(foreign)인 것처럼 표적화하고 공격한다. 자가면역 질환의 예시적인 예는 비제한적으로 하기를 포함한다: 관절염, 염증성 대장 질환, 하시모토 갑상선염, 그레이브병, 루푸스, 다발성 경화증, 류마티스 관절염, 용혈성 빈혈, 항면역성 갑상선염, 전신성 홍반성 루푸스, 복강 질환, 크론병, 대장염, 당뇨병, 피부경화증, 건선 등.

“면역결핍증”은 환자의 면역 체계가 질환에 의하거나 화학물질의 투여에 의해 손상된 환자의 상태를 의미한다. 이러한 병태는 면역 체계에서 이물질을 방어하는 데 필요한 혈구의 수와 유형을 결핍시킨다. 면역결핍 병태 또는 질환은 당 기술분야에 공지되어 있으며, 예를 들어, AIDS(후천성 면역결핍 증후군), SCID(중증 복합 면역결핍 질환), 선택적 IgA 결핍증, 공통가변성 면역결핍증, X-연관 무감마글로불린혈증, 만성 육아종성 질환, 고-IgM 증후군, 및 비스코트-알드리히 증후군(WAS), 및 당뇨병을 포함한다.

“감염성 질환”은 사람에서 사람으로 또는 유기체에서 유기체로 전염될 수 있는 질환으로서, 미생물 또는 바이러스 물질(예를 들어, 감기)에 의해 야기되는 질환을 지칭한다. 감염성 질환은 당 기술분야에 공지되어 있으며, 예를 들어, 간염, 성병(예를 들어, 클라미디아, 임질), 결핵, HIV/AIDS, 디프테리아, B형 간염, C형 간염, 콜레라 및 인플루엔자를 포함한다.

본원에서 사용되는 바와 같이, 용어 “개체” 및 “대상체”는 흔히 상호 교환적으로 사용되고, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법으로 치료될 수 있는 면역 장애의 증상을 나타내는 임의의 동물을 지칭한다. 적합한 대상체(예를 들어, 환자)는 실험실 동물(예를 들어, 마우스, 랫트, 토끼, 또는 기니피그), 농장 동물, 및 가축 또는 애완동물(예를 들어, 고양이 또는 개)을 포함한다. 비인간 영장류 및 바람직하게는 인간 대상체가 포함된다. 전형적인 대상체는 면역 장애를 앓고 있거나, 이로 진단받았거나, 이에 걸릴 위험이 있는 인간 환자를 포함한다.

본원에서 사용되는 바와 같이, 용어 “환자”는 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법으로 치료될 수 있는 면역 장애로 진단된 대상체를 지칭한다.

본원에서 사용되는 바와 같이, “치료(treatment 또는 treating)”는 질환 또는 병리학적 병태의 증상 또는 병리에 대한 임의의 유익하거나 바람직한 효과를 포함하며, 치료될 질환 또는 병태, 예를 들어 암, 감염 질환, 자가면역 질환, 염증성 질환, 및 면역결핍의 하나 이상의 측정가능한 마커에 있어서 아주 최소한의 감소를 포함할 수 있다. 치료는 선택적으로 질환 또는 병태의 진행의 지연을 포함할 수 있다. “치료”가 반드시 질환 또는 병태, 또는 이와 관련된 증상의 완전한 근절 또는 치유를 나타내는 것은 아니다.

본원에서 사용되는 바와 같이, “예방(prevent 또는 prevented 또는 preventing 등과 같은 유사한 단어)”은 질환 또는 병태, 예를 들어 암, 감염 질환, 자가면역 질환, 염증성 질환, 및 면역결핍의 발병 또는 재발 가능성을 예방, 억제, 또는 감소시키기 위한 접근법을 나타낸다. 이는 또한 질환 또는 병태의 발병 또는 재발을 지연시키거나 질환 또는 병태의 증상의 발생 또는 재발을 지연시키는 것을 지칭한다. 본원에서 사용되는 바와 같이, “예방” 및 유사한 단어는 또한 질환 또는 병태의 발병 또는 재발 전에 질환 또는 병태의 강도, 효과, 증상, 및/또는 부담을 감소시키는 것을 포함한다.

본원에서 사용되는 바와 같이, 문구 “적어도 하나의 증상을 완화시키는 것”은 대상체가 치료받고 있는 질환 또는 병태, 예를 들어 암, 감염 질환, 자가면역 질환, 염증성 질환, 및 면역결핍의 하나 이상의 증상을 감소시키는 것을 지칭한다. 특정 실시예에서, 치료 중인 질환 또는 병태는 암이며, 여기서 완화되는 하나 이상의 증상은 허약, 피로, 호흡 곤란, 쉽게 멍들고 피나는 증상, 잦은 감염, 림프절 비대, (복부 기관 비대로 인한) 복부 팽만감 또는 복통, 뼈 또는 관절의 통증, 골절, 의도치 않은 체중 감소, 식욕 부진, 야간 발한, 지속적인 미열, 및 (신장 기능 장애로 인한) 배뇨 감소를 포함하나 이에 한정되지 않는다.

일 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 암을 치료하는 방법에서 사용된다. 특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 고형 종양 또는 암을 치료하는 방법에서 사용된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 하기를 포함하나 이에 한정되지 않는 고형 종양 또는 암의 치료에서 사용된다: 부신암, 부신피질 암종, 항문암, 충수암, 성상세포종, 비정형 기형/횡문근 종양, 기저 세포 암종, 담관암, 방광암, 골암, 뇌/CNS 암, 유방암, 기관지 종양, 심장 종양, 자궁경부암, 담관암종, 연골육종, 척삭종, 결장암, 대장암, 두개인두종, 관상피내 암종(DCIS), 자궁내막암, 뇌실막세포종, 식도암, 좌골신경모세포종, 유잉 육종, 두개외 생식 세포 종양, 성선 외 생식 세포 종양, 안구암, 난관암, 섬유성 조직육종, 섬유육종, 담낭암, 위암, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 생식 세포 종양, 신경교종, 교모세포종, 두경부암, 혈관모세포종, 간세포암, 하인두암, 안구 내 흑색종, 카포시 육종, 신장암, 후두암, 평활근육종, 구순암, 지방육종, 간암, 폐암, 비소세포 폐암, 폐 유암종, 악성 중피종, 수질 암종, 수모세포종, 수막종, 흑색종, 메르켈 세포 암종, 중간선관 암종, 구강암, 점액육종, 골수이형성 증후군, 골수 증식성 신생물, 비강 및 부비동암, 비인두암, 신경모세포종, 희돌기아교세포종, 구암, 구강암, 구인두암, 골육종, 난소암, 췌장암, 췌장 섬 세포 종양, 유두 암종, 부신경절종, 부갑상선암, 음경암, 인두암, 크롬친화세포종, 송과체종, 뇌하수체 종양, 흉막폐 모세포종, 원발성 복막암, 전립선암, 직장암, 망막아종, 신세포 암종, 신우암 및 요관암, 횡문근육종, 침샘암, 피지선 암종, 피부암, 연조직 육종, 편평 세포 암종, 소세포 폐암, 소장암, 위암, 땀샘 암종, 윤활막종, 고환암, 인후암, 흉선암, 갑상선암, 요도암, 자궁암, 자궁 육종, 질암, 혈관암, 외음부암, 및 빌름스 종양.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 간암, 췌장암, 폐암, 유방암, 방광암, 뇌암, 골암, 갑상선암, 신장암, 또는 피부암을 포함하되 이들로 한정되지 않는 고형 종양 또는 암의 치료에서 사용된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 췌장, 방광 및 폐를 포함하지만 이에 한정되지 않는 다양한 암의 치료에서 사용된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 액체 암 또는 혈액암의 치료에 사용된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 백혈병, 림프종, 및 다발성 골수종을 포함하지만 이에 한정되지 않는 B-세포 악성 종양의 치료에서 사용된다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 하기를 포함하나 이에 한정되지 않는 액상암의 치료에 사용된다: 백혈병, 림프종, 및 다발성 골수종: 급성 림프구성 백혈병(ALL), 급성 골수성 백혈병(AML), 골수모구성 백혈병, 전골수세포성 백혈병, 골수단핵구성 백혈병, 단핵구성 백혈병, 적백혈병, 모세포 백혈병(HCL), 만성 림프구성 백혈병(CLL), 및 만성 골수성 백혈병(CML), 만성 골수단핵구성 백혈병(CMML) 및 진성 적혈구증가증, 호지킨 림프종, 결절성 림프구-우세 호지킨 림프종, 버킷 림프종, 소림프구성 림프종(SLL), 미만성 거대 B-세포 림프종, 여포성 림프종, 면역아구성 대세포 림프종, 전구체 B-림프모구성 림프종, 외투세포 림프종, 변연부 림프종, 균상식육종, 역형성 대세포 림프종, 세자리 증후군, 전구체 T-림프모구성 림프종, 다발성 골수종, 명백한 다발성 골수종, 아급성 다발성 골수종, 형질 세포 백혈병, 비분비성 골수종, IgD 골수종, 골경화성 골수종, 뼈 고립성 형질세포종, 및 골수외 형질세포종.

특정 실시예에서, 방법은 융합 폴리펩티드, 조성물 및/또는 유전적으로 편집된 세포의 치료적 유효량을 이를 필요로 하는 환자에게 투여하는 단계를 포함한다.

특정 실시예에서, 본원에서 고려되는 융합 폴리펩티드, 유전적으로 편집된 세포, 조성물, 및/또는 관련 유전자 편집 방법은 암의 발생 위험이 있는 환자의 치료에 사용된다. 따라서, 특정 실시예는 편집된 세포, 및/또는 조성물의 치료적 유효량을 이를 필요로하는 환자에게 투여하는 단계를 포함하는, 적어도 하나의 암의 증상의 치료 또는 예방 또는 완화를 포함한다.

특정 실시예에서, 질환, 또는 이와 관련된 병태의 적어도 하나의 증상을 치료, 에방, 또는 완화하는 방법이 제공되며, 이는 대상체로부터 세포 집단을 수확하는 단계; 본원에 제공된 유전자 편집/돌연변이 유발 방법에 따라 세포 집단을 편집하는 단계, 및 편집된 세포 집단을 이를 필요로 하는 대상체(예를 들어, 암을 가진 대상체)에게 투여하는 단계를 포함한다.

임상 시험에 의해 적절한 투여량 및 투여 일정이 결정될 수 있지만, 투여량 및 투여 빈도는 환자의 상태, 및 환자의 질환의 유형 및 중증도와 같은 인자에 의해 결정된다.

일 실시예에서, 대상체에게 투여되는 조성물 중 유전적으로 편집된 세포의 양은, 적어도 0.1 x 10⁵ 세포, 적어도 0.5 x 10⁵ 세포, 적어도 1 x 10⁵ 세포, 적어도 5 x 10⁵ 세포, 적어도 1 x 10⁶ 세포, 적어도 0.5 x 10⁷ 세포, 적어도 1 x 10⁷ 세포, 적어도 0.5 x 10⁸ 세포, 적어도 1 x 10⁸ 세포, 적어도 0.5 x 10⁹ 세포, 적어도 1 x 10⁹세포, 적어도 2 x 10⁹ 세포, 적어도 3 x 10⁹ 세포, 적어도 4 x 10⁹ 세포, 적어도 5 x 10⁹ 세포, 또는 적어도 1 x 10¹⁰ 세포이다.

특정 실시예에서, 약 1 x 10⁷ 세포 내지 약 1 x 10⁹ 세포, 약 2 x 10⁷ 세포 내지 약 0.9 x 10⁹ 세포, 약 3 x 10⁷ 세포 내지 약 0.8 x 10⁹ 세포, 약 4 x 10⁷ 세포 내지 약 0.7 x 10⁹ 세포, 약 5 x 10⁷ 세포 내지 약 0.6 x 10⁹ 세포, 또는 약 5 x 10⁷ 세포 내지 약 0.5 x 10⁹ 세포가 대상체에게 투여된다.

일 실시예에서, 대상체에게 투여되는 조성물 유전적으로 편집된 세포의 양은, 적어도 0.1 x 10⁴ 세포/체중 kg, 적어도 0.5 x 10⁴ 세포/체중 kg, 적어도 1 x 10⁴세포/체중 kg, 적어도 5 x 10⁴ 세포/체중 kg, 적어도 1 x 10⁵ 세포/체중 kg, 적어도 0.5 x 10⁶ 세포/체중 kg, 적어도 1 x 10⁶ 세포/체중 kg, 적어도 0.5 x 10⁷ 세포/체중 kg, 적어도 1 x 10⁷ 세포/체중 kg, 적어도 0.5 x 10⁸ 세포/체중 kg, 적어도 1 x 10⁸ 세포/체중 kg, 적어도 2 x 10⁸ 세포/체중 kg, 적어도 3 x 10⁸ 세포/체중 kg, 적어도 4 x 10⁸ 세포/체중 kg, 적어도 5 x 10⁸ 세포/체중 kg, 또는 적어도 1 x 10⁹ 세포/체중 kg이다.

특정 실시예에서, 약 1 x 10⁶ 세포/체중 kg 내지 약 1 x 10⁸ 세포/체중 kg, 약 2 x 10⁶ 세포/체중 kg 내지 약 0.9 x 10⁸ 세포/체중 kg, 약 3 x 10⁶ 세포/체중 kg 내지 약 0.8 x 10⁸ 세포/체중 kg, 약 4 x 10⁶ 세포/체중 kg 내지 약 0.7 x 10⁸ 세포/체중 kg, 약 5 x 10⁶ 세포/체중 kg 내지 약 0.6 x 10⁸ 세포/체중 kg, 또는 약 5 x 10⁶ 세포/체중 kg 내지 약 0.5 x 10⁸ 세포/체중 kg이 대상체에게 투여된다.

당 기술분야의 숙련자는 특정 실시예에서 고려되는 조성물의 다회 투여가 원하는 요법에 영향을 미치기 위해 요구될 수 있음을 인식할 것이다. 예를 들어, 조성물은 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 1년, 2년, 5년, 10년, 또는 그 이상의 기간에 걸쳐 1회, 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회, 또는 10회 이상 투여될 수 있다.

특정 실시예에서 고려되는 조성물의 투여는 에어로졸 흡입, 주사, 섭취, 수혈, 주입 또는 이식을 포함하는 임의의 편리한 방식으로 수행될 수 있다. 바람직한 실시예에서, 조성물은 비강내, 경구, 장내, 또는 비경구 투여된다. 본원에서 사용되는 “비경구 투여” 및 “비경구로 투여되는”이라는 문구는 일반적으로 주사에 의한 장내 및 국소 투여 이외의 투여 방식을 지칭하며, 혈관내, 정맥내, 근육내, 동맥내, 경막내, 관절낭내, 안와내, 종양내, 심장내, 피내, 복강내, 경기관통, 피하, 표피하, 관절내, 피막하, 지주막하, 척수내 및 흉골내 주사 및 주입을 포함하나 이에 한정되지는 않는다. 일 실시예에서, 본원에서 고려되는 조성물은 종양, 림프절, 또는 감염 부위 내로의 직접 주사에 의해 대상체에게 투여된다.

일 실시예에서, 이를 필요로 하는 대상체에게 조성물의 유효량이 투여되어 대상체에서 암에 대한 세포 면역 반응을 증가시킨다. 면역 반응은 감염된 세포를 사멸시킬 수 있는 세포독성 T 세포, 조절 T 세포, 및 헬퍼 T 세포 반응에 의해 매개되는 세포 면역 반응을 포함할 수 있다. B 세포를 활성화하여 항체 생산을 유도할 수 있는 헬퍼 T 세포에 의해 주로 매개되는 체액성 면역 반응이 또한 유도될 수 있다. 당 기술분야에 잘 기술된 조성물에 의해 유도된 면역 반응의 유형을 분석하기 위해 다양한 기술이 사용될 수 있다; 예를 들어, Current Protocols in Immunology, Edited by: John E. Coligan, Ada M. Kruisbeek, David H. Margulies, Ethan M. Shevach, Warren Strober (2001) John Wiley & Sons, NY, N.Y

본 명세서에 인용된 모든 간행물, 특허 출원, 및 발행된 특허는 각각의 개별 간행물, 특허 출원, 또는 발행된 특허가 구체적으로 그리고 개별적으로 참조에 의해 포함되는 것으로 표시된 것처럼 본원에 참조로서 통합된다.

전술한 실시예들은 이해를 밝힐 목적으로 예시 및 실시예로서 일부 상세히 기술되었지만, 첨부된 청구범위의 사상 또는 범주로부터 벗어나지 않고도 소정의 변경 및 변형이 이루어질 수 있다는 것이 본원에서 고려된 교시에 비추어 당 기술분야의 숙련자에게 쉽게 명백해질 것이다. 하기 실시예들은 단지 예시로서 제공되며, 제한하기 위한 것은 아니다. 당 기술분야의 숙련자는 본질적으로 유사한 결과를 얻기 위해 변경되거나 수정될 수 있는 중요하지 않은 다양한 파라미터를 쉽게 인식할 것이다.

예

예 1

메가TAL에 의해 유도된 삽입결실 길이 및 분포의 재현성

TRAC 유전자좌(서열번호 1)에서의 유전자 편집을 모델 시스템으로 사용하여 메가TAL 뉴클레아제에 의해 생성된 삽입결실 이벤트의 특성을 평가하였다. 저/중 효율 메가TAL(예를 들어, 서열번호 5 내지 7)을 이들 연구에 사용하여 편집 속도를 변경시키는 것으로 가정된 임의의 하류 조작에 대한 동적 범위를 제공하였다. 구별되는 PBMC 공여자로부터 활성화되고 증식된 일차 인간 T 세포를 사용하여 여러 개의 독립적인 실험을 수행하였다. PBMC 해동 후, 3 내지 4일의 기간 동안 활성화 및 배양하고, TRAC 유전자좌(TCRα 메가TAL)의 메가TAL 표적화 엑손 1을 암호화하는, 시험관 내 전사, 캡핑 및 폴리-아데닐화된 mRNA를 전기천공하였다. 생성된 세포를 7 내지 10일의 추가의 성장 기간 동안 배양하여 전달된 mRNA의 희석 및 분해와 편집 과정의 완료를 허용하였다. 중합효소 연쇄 반응(PCR)을 사용하여 TRAC 유전자좌를 증폭시키고, 후속하여 PCR 앰플리콘의 심층 서열분석을 통해 메가TAL에 의해 야기된 벌크 편집 이벤트의 특성화를 가능하게 하였다. 편집 이벤트의 크기를 측정하는 빈도 히스토그램이 도 1b에 도시되어 있다. 가장 빈번하게 관찰된 삽입결실 길이는 2 염기쌍 길이(총 이벤트 집단의 누적적으로 약 40 내지 45%를 나타냄)인 반면, 1 염기쌍 결실(약 20%) 및 3, 8 및 9 염기쌍 결실(각각 5 내지 10%)도 높은 빈도로 관찰되었다. 이들 삽입결실 크기 집단의 상대 빈도는 기술적 복제물 및 독립적인 실험에 걸쳐 매우 재현 가능하여, 메가TAL 유전자 편집 동안 삽입결실 길이 분포의 일관성을 예시하였다.

도 1b에 도시된 히스토그램의 각각의 막대는 메가TAL 표적 부위에 대해 동일한 삽입결실 길이를 갖지만 잠재적으로 상이한 위치를 갖는 편집된 대립유전자의 집단을 나타낸다. 도 2는 메가TAL 표적 부위 중단점 중심에 대한 위치적 위치에 따라 도표화된 각각의 고유한 편집 종을 도시한다. 이들 “지문”은 그의 길이(y-축), 위치(x-축), 및 빈도(원 크기)에 따라 각각의 편집된 종을 플롯하여, 각각의 편집된 종의 양적 및 질적 특성을 모두 포착한다. 결실의 위치를 22 염기쌍 귀소 엔도뉴클레아제 표적 부위의 중앙에 대한 중간점 5’(음성) 또는 3’(양성)의 위치로서 계산하였다. 이러한 방식으로, 중단점 중심에 대한 결실 종의 분포는 빈도 및 위치 둘 다의 변화에 대해 모니터링될 수 있다. 구별되는 PBMC 공여자를 사용하고, 저(예를 들어, 서열번호 5 내지 7) 또는 고(서열번호 8 내지 10) 편집 효율을 갖는 TCRα 메가TAL 작제물을 사용하는 독립적인 실험은, 개별 결실 종 - 특정 조성물의 각각의 반복적인 결실 이벤트 -이 재현 가능한 빈도로 발생함을 나타낸다. 따라서, 전체 메가TAL 결실 종 집단은 엔도뉴클레아제 반응의 효소 속도와 매우 일관되고 독립적인 상대적인 정성적 및 정량적 특성을 갖는다.

예 2

Trex2는 메가TAL 편집된 대립유전자를 정성적으로 변경한다

유전자 편집 뉴클레아제와 Three Prime Repair 엑소뉴클레아제-2(Trex2)의 공동 전달은, 특히 3’ 돌출 엔도뉴클레아제 반응 산물로 인한 메가TAL의 유전자 편집 효율을 향상시키는 것으로 이전에 나타났다. 그러나, 편집 결과에 대한 Trex2 공동 전달의 정성적 영향은 철저히 평가되지 않았다. 따라서, 2개의 구별되는 공동 전달 모드의 삽입결실 특성의 평가를 수행하였다; 메가TAL의 C-말단에 대한 Trex2의 직접적인 융합; 독립적인 폴리펩티드로서 Trex2 및 메가TAL의 공동 발현.

활성화된 일차 인간 T 세포 샘플을 TCRα 메가TAL을 암호화하는 시험관 내 전사된, 캡핑 및 폴리-아데틸화된 mRNA(도 3a), TCRα 메가TAL-Trex2 융합을 암호화하는 mRNA(도 3b), 또는 2개의 구별되는 mRNA로서, 하나는 TCRα 메가TAL을 암호화하고 다른 하나는 Trex2를 암호화하는 것(도 3c)으로 전기천공하였다. 생성된 세포를 7 내지 10일의 추가의 성장 기간 동안 배양하여 전달된 mRNA의 희석 및 분해와 편집 과정의 완료를 허용하였다. 중합효소 연쇄 반응(PCR)을 사용하여 TRAC 유전자좌를 증폭시키고, 후속하여 PCR 앰플리콘의 심층 서열분석을 통해 메가TAL에 의해 야기된 벌크 편집 이벤트의 특성화를 가능하게 하였다. 편집 이벤트의 크기를 측정하는 빈도 히스토그램이 도 3a 내지 3c에 도시되어 있다. TCRα 메가TAL(예를 들어, 서열번호 11 내지 13)에 대한 Trex2 엑소뉴클레아제의 직접 융합은 결실 길이 분포의 변화를 초래하였으며, 유의한 백분율의 삽입결실 종을 포함하는 최대 12 염기쌍 길이의 결실을 가져왔다. TCRα 메가TAL 및 Trex2 엑소뉴클레아제(예를 들어, 서열번호 14 내지 16)의 독립적인 공동 발현은 길이 1 내지 4 염기쌍의 결실을 향해서 삽입결실 종의 좁아짐을 초래하였으며, 이는 단일-가닥 3’ 돌출부에 대한 선호도를 갖는 분포성 엑소뉴클레아제 활성의 모델과 일치한다. 각각의 Trex2 전달 시나리오에서, 전체 편집 속도 및 삽입에 대한 결실의 비율은 TCRα 메가TAL 단독의 전달에 비해 증가하였다.

도 4는 도 3a 내지 3c의 각 샘플에 대한 결실 지문 플롯을 도시하며, 각각의 편집된 종의 정량적 및 정성적 특성 모두를 포착한다. 도 2에서와 같이, 결실의 위치를 22 염기쌍 귀소 엔도뉴클레아제 표적 부위의 중앙에 대한 중간점 5’(음성) 또는 3’(양성)의 위치로서 계산하였다. 중단점 중심에 대한 결실 종의 분포는 TCRα 메가TAL, TCRα 메가TAL-Trex2 융합과, TCRα 메가TAL 플러스 Trex2 공동-전달 편집 결과 간의 현저한 차이를 나타냈다(표 3 내지 5 참조). 메가TAL-Trex2 융합에서, 5’ 방향으로 위치가 크게 왜곡된 결실 종의 출현이 관찰되었다. 이러한 패턴은 TALE 어레이와 함께 또는 중단점의 동일한 측면에 시스로 남아 있는 DNA 중단점 말단에서 발생하는 우선적인 엑소뉴클레아제 활성이 있음을 의미한다.

또한, TALE 어레이 결합 부위의 3’ 에지에 대응하는 결실 길이 및 위치의 가파른 강하가 관찰되었다. 그럼에도 불구하고, 우리는 놀랍게도 TALE 결합 부위 내로 연장된 결실 길이를 관찰하였다. 이는 또한, 엑소뉴클레아제 활성과 그 결합 부위에서 TALE의 존재 사이에 상호 배타적인 관계가 존재하며, Trex2가 그의 엑소뉴클레아제 기능을 수행하도록 위치시키는 데 있어서 TALE 어레이의 역할을 추가로 강화함을 의미한다. 그러나, 결실 중심은 TALE 결합 부위 외부에 머물렀다. 반대로, 별도의 폴리펩티드로서의 Trex2 공동 발현은 DNA 중단점에 중심을 둔 1 내지 4 bp 범위의 크기를 갖는 결실 집단을 향해 종 조성물을 변경함에도 불구하고 임의의 실질적인 방향성 왜곡을 야기하지 않았다.

폴리펩티드	TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %	% 중심 편집된 종(중단점 중심 ±2 bp)	비-TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %
TCRa 메가TAL	17.5%	35.01%	45.24%
TCRa 메가TAL-Trex2 융합	62.54%	27.24%	2.42%
TCRa 메가TAL + Trex2 공동 발현	10.80%	77.40%	12.22%

폴리펩티드	6 bp 초과의 결실 %	12 bp 초과의 결실 %
TCRa 메가TAL	17.97%	7.17%
TCRa 메가TAL-Trex2 융합	35.49%	14.21%
TCRa 메가TAL + Trex2 공동 발현	4.66%	0.83%

폴리펩티드	중단점 중심으로부터 4 bp를 초과하는 결실 중심 %	중단점 중심으로부터 8 bp를 초과하는 결실 중심 %
TCRa 메가TAL	13.22%	6.90%
TCRa 메가TAL-Trex2 융합	31.83%	14.21%
TCRa 메가TAL + Trex2 공동 발현	3.51%	2.82%

예 3

Trex2 상동체 편집 대립유전자의 평가

Trex2의 효소 활성이 DNA 복구 기구와의 잠재적으로 혼란스러운 상호 작용과 비교하여, 편집 결과에서 관찰된 변화에 직접적으로 책임이 있음을 확인하기 위해, 여러 Trex2 상동체 ORF를 TCRα 메가TAL(예를 들어, 서열번호 17 내지 34)에 융합시켰다. 활성화된 일차 인간 T 세포 샘플을 이들 융합 단백질을 암호화하는 시험관 내 전사, 캡핑 및 폴리아데닐화된 mRNA로 전기천공한 다음, TCR 복합체의 발현에 대한 유세포 분석 및 삽입결실 특성의 특성화에 의해 표적 부위 편집을 모니터링하였다.

도 5는 많은 Trex2 상동체 융합 단백질이 인간 Trex2 ORF와 유사한 정도로 전체 편집을 향상시켰음을 보여준다. 세포 표면 상의 TCR 알파 및 베타 사슬과 조합되는 CD3 성분에 대한 유세포 계측 염색을 사용하여 편집 효율을 평가하였다. 따라서, CD3 염색을 상실한 세포의 빈도는 TCRα 유전자좌에서의 편집 속도와 상관된다. 도 6에 도시된 바와 같이, 삽입결실 종의 분포에 대한 분석을 통해, 오리너구리, 주머니쥐, 아르마딜로 및 마우스 Trex2 단백질이 TCRα 메가TAL에 융합될 때 인간 Trex2 ORF에 의해 발생하는 특성과 일치하는 특성으로 편집 결과를 유발함을 확인하였다. 참고로, 양 Trex2는 1 내지 4 bp 결실에 대해 풍부한 고유한 삽입결실 스펙트럼을 유발하였으며, 놀랍게도, 1 bp 삽입의 빈도가 높았다.

도 7에 도시된 지문 플롯에 도시된 바와 같이, TCRα 메가TAL-Trex2 상동체 융합 단백질의 결실 특성은 인간 Trex2 단백질에 대해 관찰된 것들을 반영한다. 임의의 특정 이론에 구속되고자 함이 없이, 이러한 데이터는 Trex2 엑소뉴클레아제 활성이 관찰된 결실 특성의 일차 결정인자임을 시사한다. 따라서, 연장된 결실 길이 결과는 다른 DNA 복구 기구와의 상호작용과는 독립적일 가능성이 있다. 양 Trex2 상동체에 대해 관찰된 삽입의 발생 증가는 이러한 변이체가 잠재적으로 잔류 템플릿 독립적인 중합효소 활성과 같은 고유한 효소 메커니즘을 가질 수 있음을 나타낸다. 마지막으로, 결실 크기 및 위치에서 매우 일관되고 날카로운 경계는 염기의 방향성 절제가 결합 부위와 TALE 어레이의 상호작용의 결합 및 해리 동역학 및/또는 입체적 특성에 의해 제한될 수 있음을 추가로 시사한다.

예 4

메가TAL 편집에 고유하게 영향을 미치는 엑소뉴클레아제의 식별

구별되는 기질 특이성 및/또는 가공성 특성을 갖는 다른 엑소뉴클레아제가 유전자 편집 결과를 고유하게 변경시킬 수 있는지 여부를 결정하기 위해, 선택된 엑소뉴클레아제 또는 엑소뉴클레아제 도메인 ORF를 TCRα 메가TAL(예를 들어, 서열번호 35 내지 55)에 융합시키고 유전자 편집 결과에 대한 이들의 영향을 조사하였다. 단독 TCRα 메가TAL 융합 단백질로서 뿐만 아니라 Trex2와의 공동 발현 중에 편집 속도를 조사하였다. 두 시나리오 모두에서 시험에 대한 이론적 근거는 (i) 시험 엑소뉴클레아제에 대한 구별되고 잠재적으로 우선적인 기질을 Trex2 활성이 생산할 수 있게 하기 위한 2배이고; (ii) 시험 엑소뉴클레아제에 의해 의미 있게 처리되는 말단에 대한 프록시로서 Trex2 매개 편집 속도 향상의 손실을 찾기 위해 2배였다. 도 8은 엑소뉴클레아제 스크리닝의 결과를 도시하며, 각각의 샘플은 2회 실행되어 Trex2 공동 발현의 부재(좌측) 또는 존재(우측) 하에 시험된다.

시험된 엑소뉴클레아제 중에서, 대부분은 Trex2에 의한 편집 속도들 또는 편집 속도 향상(메가TAL-엑소뉴클레아제 융합 단독의 전달에 대한 Trex2 샘플 내 CD3 음성 세포의 비율로 측정됨)을 명확하게 변경시키지 않았다. 다수의 전체 편집이 유의하게 감소하였으며, 이는 이들이 단백질 안정성 및/또는 발현에 유의하게 영향을 미칠 수 있음을 나타낸다. ExoI에 대한 TCRα 메가TAL의 융합은 Trex2 향상 비율의 약간의 증가를 초래하였으며, 이는 아마도 이들 2개의 엑소뉴클레아제가 DNA 절단 처리 이벤트를 상승적으로 변형시켰음을 시사한다. 특히, ExoX에 대한 TCRα 메가TAL의 융합은 Trex2 향상의 완전한 손실을 초래하였다.

예 5

메가TAL-ExoI 및 메가TAL-ExoX 편집 프로파일의 평가

도 8에 기술된 유전자 편집 이벤트의 정성적 측면을 더 이해하기 위해, 전술한 바와 같이 앰플리콘 서열분석 및 결실 지문 분석을 수행하였다. TCRα 메가TAL 편집 속도의 패턴에 영향을 미치지 않은 이들 엑소뉴클레아제는 또한 지문 변화를 나타내지 않았다(데이터 미도시). 그러나, 도 9는 ExoI에 대한 TCRα 메가TAL로의 융합이, TCRα 메가TAL 단독에 비해 결실 프로파일을 변경시키지 않았지만, Trex2가 공동 발현되었을 때, 일련의 길고 방향적으로 편향된 결실 이벤트가 출현하였음을 보여준다.

메가TAL-ExoI 융합은 TALE 어레이의 방향으로 편향된 결실 이벤트를 생성한다. 급격하게 분화된 메가TAL-Trex2 융합 결실 이벤트와 대조적으로, 메가TAL-ExoI 결실 이벤트는 더 큰 길이인 것으로 나타났으며, 따라서 TALE 어레이 결합 부위를 넘어 연장된다.

ExoX에 대한 TCRα 메가TAL의 융합은 메가TAL-ExoI 융합으로 관찰된 것과 구별되는 결실 프로파일을 초래하였다. Trex2의 부재 시, TCRα 메가TAL-ExoX 융합은 높은 효율로 길고 방향적으로 편향된 결실을 생성한다. 메가TAL-Trex2 융합 단백질과는 달리, 결실 중심은 주목할 만한 빈도로 TALE 어레이 결합 부위를 넘어서 진행되도록 더 크게 관찰되었다. 메가TAL-ExoX 융합은, 메가TAL-Trex2 융합 단백질에 비해 절단 부위로부터 더 멀리 결실 중심을 갖는 보다 긴 결실을 유도하는 고유한 엑소뉴클레아제 메커니즘을 갖는 것이 가능하다.

도 9에서, Trex2가 TCRα 메가TAL-ExoX 융합과 공동 발현될 때, 편집 이벤트는 거의 탐지할 수 없을 정도로 희귀해졌고, 메가TAL-ExoX 융합으로 명백한 길고 방향적으로 편향된 결실이 고갈되었다.

예 6

메가TAL-ExoX 융합 단백질 편집 프로파일의 추가 평가

TCRα 메가TAL-ExoX 융합을 평가할 때 나타난 관찰된 결실 패턴을 고려하여, 상이한 유전자좌를 표적으로 하는 몇몇 추가의 메가TAL-ExoX 융합 단백질을 시험하였다. 활성화된 일차 인간 T 세포 샘플을, 고-활성 CBL-B 메가TAL, 고-활성 CBL-B 메가TAL-Trex2 융합, 또는 고-활성 CBL-B 메가TAL-ExoX 융합(예를 들어, 서열번호 56 내지 64)을 암호화하는, 시험관 내 전사, 캡핑 및 폴리-아데닐화된 mRNA로 전기천공하였다. 생성된 세포를 7 내지 10일의 추가의 성장 기간 동안 배양하여 전달된 mRNA의 희석 및 분해와 편집 과정의 완료를 허용하였다. 중합효소 연쇄 반응(PCR)을 사용하여 CBL-B 유전자좌를 증폭시키고, 이어서 PCR 앰플리콘의 심층 서열분석을 통해 CBL-B 표적 부위(서열번호 3)에 근접한 편집 속도 및 삽입결실 특성의 특성화를 가능하게 하였다. 도 10은 이들 3개의 고-활성 CBL-B 메가TAL 포맷 각각에 대해 관찰된 결실 지문을 도시한다(표 6 내지 8도 참조). 고-활성 CBL-B 메가TAL은 TCRα 메가TAL과 유사한 결실 종의 분포를 생성하며, 가장 빈번한 이벤트는 1 내지 5 bp 결실이며, 유의한 방향성 편향은 없다. 마찬가지로, 고-활성 CBL-B 메가TAL-Trex2 융합은 결실 종을 연장시키고 5’ 방향으로 이를 크게 왜곡하여, 직교 메가TAL이 TALE 어레이와 함께 또는 중단점의 동일한 측면에 시스로 남아 있는 DNA 중단점 말단에서 발생하는 우선적인 엑소뉴클레아제 활성을 표적화한다는 것을 확인하였다. 또한, 고-활성 CBL-B 메가TAL-Trex2 융합에서 반복되는 것은 TALE 어레이 결합 부위의 3’ 에지에 대응하는 위치 및 결실 길이에서의 가파른 강하였다.

폴리펩티드	TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %	% 중심 편집된 종(중단점 중심 ±2 bp)	비-TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %
고-활성 CBL-B 메가TAL	28.57%	45.13%	18.13%
고-활성 CBL-B 메가TAL-Trex2 융합	74.98%	14.96%	3.16%
고-활성 CBL-B 메가TAL-ExoX 융합	78.41%	11.58%	2.29%

폴리펩티드	6 bp 초과의 결실 %	12 bp 초과의 결실 %
고-활성 CBL-B 메가TAL	46.15%	33.74%
고-활성 CBL-B 메가TAL-Trex2 융합	71.70%	32.60%
고-활성 CBL-B 메가TAL-ExoX 융합	77.83%	56.90%

폴리펩티드	중단점 중심으로부터 4 bp를 초과하는 결실 중심 %	중단점 중심으로부터 8 bp를 초과하는 결실 중심 %
고-활성 CBL-B 메가TAL	18.16%	5.47%
고-활성 CBL-B 메가TAL-Trex2 융합	60.58%	8.22%
고-활성 CBL-B 메가TAL-ExoX 융합	67.23%	28.19%

도 11은 유사한 시리즈의 CBL-B 메가TAL, 메가TAL-Trex2, 및 메가TAL-ExoX 융합 단백질로 처리한 T 세포로부터의 대표적인 결실 지문을 도시하지만, 이들은 몇 배 더 낮은 활성 메가TAL(예를 들어, 서열번호 65 내지 73)을 사용한다. 또한 표 9 내지 11을 참조한다. 이러한 저활성 CBL-B 메가TAL과 메가TAL 융합 단백질을 도 10에 표시된 고활성 대응 단백질과 비교할 때 관찰된 결실 종의 스펙트럼에는 유의한 유사성이 있다. 이는 이들 2개의 엑소뉴클레아제가 메가TAL에 융합될 때 관찰된 고유한 결실 결과가 엔도뉴클레아제 반응의 효소 속도와 무관함을 보여준다. 이러한 결과는 엔도뉴클레아제 발생 파단 당 매우 효율적인 엑소뉴클레아제 처리 속도 모두를 나타내며, 또한 Trex2 및 ExoX가 정성적으로 상이한 메커니즘을 통해 유전자 편집 결과에 구별되고 상이한 효율로 발생하는 단순한 동일한 메커니즘이 아니라는 것을 보여준다.

폴리펩티드	TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %	% 중심 편집된 종(중단점 중심 ±2 bp)	비-TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %
저-활성 CBL-B 메가TAL	31.05%	39.71%	11.91%
저-활성 CBL-B 메가TAL-Trex2 융합	72.84%	14.29%	1.81%
저-활성 CBL-B 메가TAL-ExoX 융합	58.62%	10.34%	5.75%

폴리펩티드	6 bp 초과의 결실 %	12 bp 초과의 결실 %
저-활성 CBL-B 메가TAL	36.82%	26.71%
저-활성 CBL-B 메가TAL-Trex2 융합	68.01%	30.58%
저-활성 CBL-B 메가TAL-ExoX 융합	50.57%	37.93%

폴리펩티드	중단점 중심으로부터 4 bp를 초과하는 결실 중심 %	중단점 중심으로부터 8 bp를 초과하는 결실 중심 %
저-활성 CBL-B 메가TAL	17.33%	5.05%
저-활성 CBL-B 메가TAL-Trex2 융합	57.95%	6.24%
저-활성 CBL-B 메가TAL-ExoX 융합	47.12%	22.99%

PD-1 유전자좌를 표적으로 하는 제3 일련의 효소를 작제하였다. 도 12는 PD-1 메가TAL, PD-1 메가TAL-Trex2 융합, 또는 PD-1 메가TAL-ExoX 융합(예를 들어 서열번호 74 내지 82)을 암호화하는, T 세포로부터 전기천공된 mRNA로부터의 대표적인 결실 지문을 도시한다. 표 12 내지 14를 또한 참조한다. TCRα 및 CBL-B 메가TAL 및 엑소뉴클레아제 융합 단백질에 대해 기술된 바와 같이, 3개의 PD-1 메가TAL 샘플 각각에 대해 관찰된 결실 종은, 그 표적이 PD-1 메가TAL-Trex2 융합 단백질에 노출되었을 때 5’ 방향 및 더 긴 종에서, 독립형 PD-1 메가TAL에서 비방향성의 작은 결실 종을 갖는 일관된 추세를 따랐으며, PD-1 메가TAL-ExoX 융합 단백질로 처리하여 발생하는 종은 더 오래 지속되었다. 시험된 여러 메가TAL에 걸쳐 이들 관찰된 패턴의 지속성은 상이한 엑소뉴클레아제 도메인에 대한 메가TAL 융합 시 발생하는 구별되는 편집 결과의 견고성을 예시한다.

폴리펩티드	TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %	% 중심 편집된 종(중단점 중심 ±2 bp)	비-TAL 측 및 중단점 중심으로부터 2 bp 초과에서의 편집된 종 %
PD-1 메가TAL	22.13%	22.91%	52.62%
PD-1 메가TAL 메가TAL-Trex2 융합	31.95%	53.89%	9.03%
PD-1 메가TAL 메가TAL-ExoX 융합	62.09%	27.27%	4.86%

폴리펩티드	6 bp 초과의 결실 %	12 bp 초과의 결실 %
PD-1 메가TAL	52.42%	40.30%
PD-1 메가TAL 메가TAL-Trex2 융합	49.63%	13.17%
PD-1 메가TAL 메가TAL-ExoX 융합	63.87%	35.47%

폴리펩티드	중단점 중심으로부터 4 bp를 초과하는 결실 중심 %	중단점 중심으로부터 8 bp를 초과하는 결실 중심 %
PD-1 메가TAL	15.48%	9.33%
PD-1 메가TAL 메가TAL-Trex2 융합	14.75%	1.58%
PD-1 메가TAL 메가TAL-ExoX 융합	43.86%	9.83%

예 7

PD-1 메가TAL-ExoX 융합 단백질 편집 프로파일의 평가

도 13은 PDCD1 유전자의 ATG 시작 코돈에 근접하는 PD-1 메가TAL 표적 부위를 도시한다. PDCD1 22 bp PD-1 HE 표적 부위(서열번호 2)는 혈장 막 상에서의 발현을 위해 PD-1을 표적으로 하는 신호 서열의 일부인 이소류신 잔기를 암호화하는 제3 코돈을 대략 중앙에 위치한다. TALE 어레이 결합 부위(서열번호 4)는 ATG 시작 코돈의 5’에 있다. 이러한 표적 부위 배향은 결실 종의 각각의 분포에 따라 PD-1의 발현에 차별적으로 영향을 미치는 구별되는 메가TAL 또는 메가TAL-엑소뉴클레아제 융합 조성물에 대한 가능성을 증가시킨다.

결실 종의 카테고리는 PD-1 ORF에 미치는 영향에 따라 할당되었다: ATG-결실; 프레임 내; 프레임 2; 또는 프레임 3; 각각의 예시적인 결실 유형이 도 13에 도시되어 있다. 도 12에 기술된 PD-1 메가TAL 및 메가TAL-엑소뉴클레아제 융합 단백질 샘플의 경우, 각 결실 종의 프레임 특성을 생물정보적으로 분석하였다. 도 14는 결실 지문 플롯 상에 유전자 편집 종의 프레임 카테고리를 중첩시킴으로써 이러한 분석의 결과를 보여준다. PD-1 메가TAL은 광범위한 결실 종 스펙트럼을 생성하기 때문에, 프레임 특성은 결실 지문 분석에 걸쳐 다소 균일하게 분포되며, ATG-결실 종은 긴 결실이 나타나는 플롯의 상부 수준을 차지한다. 역으로, PD-1 메가TAL-Trex2 융합 단백질은 프레임 내, 프레임 2 및 프레임 3 종의 위치를 이동시킨다. 도 15에 도시된 바와 같이, 종의 각 카테고리의 정규화된 분획이 비교될 때, PD-1 메가TAL 및 PD-1 메가TAL-Trex2 융합은 유의하게 다르지 않다. 이는, ATG 시작 코돈을 통해 도달하는 긴 방향성 결실의 발생이 증가하면서, PD-1 메가TAL로 발생하는 긴(그러나 비-방향성) 결실의 번짐을 효과적으로 대체했기 때문이다.

역으로, PD-1 메가TAL-ExoX 융합 단백질에 의해 야기되는 결실 길이의 증가는 ATG 시작 코돈을 제거하는 결실 종의 분획 비율을 실질적으로 증가시킨다. ATG-결실된 대립유전자의 이러한 증가는 다른 3개의 카테고리에 속하는 종을 생성하는 결실을 희생시키고, 또한 PD-1 메가TAL-ExoX 융합이 PD-1 표면 발현 또는 기능에 영향을 미칠 수 없는 신호 서열의 N-말단 말단에 대한 프레임 내 단일 아미노산 결실과 같은 원하지 않는 PD-1 유전자 편집된 대립유전자를 불균형적으로 소거할 수 있음을 시사한다. 프레임 내 결실이 PDCD1 유전자좌를 기능적으로 비활성화하지 않을 수 있다는 가능성을 평가하기 위해, 활성화된 일차 인간 T 세포 샘플을, 형질감염 효율을 추적하기 위한 시안 형광 단백질(CFP), 및 야생형 또는 세 가지 가능한 판독 프레임 각각에서 모의 편집된 PD-1 대립유전자 둘 모두를 암호화하는 시험관 내 전사, 캡핑 및 폴리-아데닐화된 mRNA로 전기천공하였다. 그런 다음, 도 16에 도시된 형질감염 효율 및 PD-1 단백질 발현을 평가하기 위해 유세포 계측을 수행하였다. 야생형 PD-1 mRNA(서열 번호 83) 전기천공은 높은 수준의 단백질 발현을 유도하였지만, 프레임 2 또는 프레임 3 결실 종을 각각 모방하는, 1 또는 2 염기쌍 결실을 암호화하는 인공 mRNA(서열 번호 84 및 85)는 프레임 외 단백질 전사체를 암호화하는 mRNA에 대해 예상되는 바와 같이 PD-1 단백질 발현을 용이하게 하지 않았다. 대조적으로, PD-1 메가TAL 표적 부위에서 3 염기쌍 결실을 암호화하는 인공 mRNA(서열번호 86)는 높은 수준의 PD-1 표면 발현을 생성하였고, 이를 통해 원칙적으로 일부 PD-1 유전자 편집 대립유전자 종은 표현형적으로 비침투성임을 확인하였다.

예 8

표적 외 유전자좌에서의 편집 평가

표적 외 부위에서 유전자 편집 이벤트의 정성적 측면을 더 이해하기 위해, 저 편집 및 고 편집 TCRα 메가TAL에 특이적인 표적 외 부위에서 앰플리콘 서열분석 및 결실 지문 분석을 수행하였다. PBMC로부터 활성화되고 증식된 일차 인간 T 세포를 저 편집 TCRα 메가TAL, 고 편집 TCRα 메가TAL(TCRα 2.2)을 암호화하는 1.5 ug mRNA로 전기천공했을 뿐만 아니라, 각각의 Trex2에 대한 직접 융합 및 각각의 ExoX에 대한 직접 융합을 수행하였다. 각각의 작제물을 표적 상 유전자좌(도 17; 복제; 하나의 복제체만 표시됨) 또는 그의 표적 외 유전자좌(복제, 하나의 복제체만 표시됨)에서 평가하였다. 7 내지 10일의 성장 기간 후, 게놈 DNA 단리를 위해 세포를 수확하였다. PCR은 KAT2B 표적 외 부위(저 편집 TCRα 메가TAL에 의한 편집에 민감함, 도 18) 또는 2.2 표적 외 부위 AC016700.3(고 편집 TCRα 메가TAL에 의한 편집에 민감함, 도 19)를 포함하는 약 300 염기쌍 영역에 걸쳐 수행되었다. 그런 다음, PCR 앰플리콘을 차세대 서열분석(NGS)에 적용하고, 이들의 빈도(원 크기)뿐만 아니라 이들의 길이(y축) 및 메가TAL 유발된 중단점에 대한 이들의 종방향 위치(x축) 모두에 따라 결실 이벤트를 표로 작성하여 분석하였다. 삽입은 이 분석에서 제외되었다. Trex2에 대한 TCRα 2.2 융합은 편집에 실패하였으므로 지문은 표시되지 않는다. 각각의 TCRα 메가TAL 편집의 패턴에 영향을 미치는 이들 엑소뉴클레아제는 각각의 TCRα 메가TAL의 표적 상 편집 효율에 비해 매우 낮은 편집율을 초래하였고, 지문에서의 변화를 나타냈다. TALE 어레이를 위한 기질이 없기 때문에, 시험된 메가TAL 융합 중 어느 것에 대해서도 편향된 친화도 분포가 있는 것으로 보이지 않는다.

SEQUENCE LISTING <110> 2seventy bio, Inc. Jarjour, Jordan Krostag, Anne-Rachel <120> COMPOSITIONS AND METHODS FOR SITE-DIRECTED MUTAGENESIS <130> BLUE-132.PC <150> US 63/128,391 <151> 2020-12-21 <160> 164 <170> PatentIn version 3.5 <210> 1 <211> 22 <212> DNA <213> Homo sapiens <400> 1 tgtctgccta ttcaccgatt tt 22 <210> 2 <211> 22 <212> DNA <213> Homo sapiens <400> 2 ggcatgcaga tcccacaggc gc 22 <210> 3 <211> 22 <212> DNA <213> Homo sapiens <400> 3 ctgtaagata ttcccatccc ca 22 <210> 4 <211> 14 <212> DNA <213> Homo sapiens <400> 4 tggtggggct gctc 14 <210> 5 <211> 2637 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL DNA construct <400> 5 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgt cttctga 2637 <210> 6 <211> 2637 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL RNA construct <400> 6 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugu cuucuga 2637 <210> 7 <211> 878 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL protein construct <400> 7 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 865 870 875 <210> 8 <211> 2730 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL DNA construct <400> 8 atgggatccg cgccacctaa gaagaaacgc aaagtcgtgg atctacgcac gctcggctac 60 agtcagcagc agcaagagaa gatcaaaccg aaggtgcgtt cgacagtggc gcagcaccac 120 gaggcactgg tgggccatgg gtttacacac gcgcacatcg ttgcgctcag ccaacacccg 180 gcagcgttag ggaccgtcgc tgtcacgtat cagcacataa tcacggcgtt gccagaggcg 240 acacacgaag acatcgttgg cgtcggcaaa cagtggtccg gcgcacgcgc cctggaggcc 300 ttgctcacgg atgcggggga gttgagaggt ccgccgttac agttggacac aggccaactt 360 gtgaagattg caaaacgtgg cggcgtgacc gcaatggagg cagtgcatgc atcgcgcaat 420 gcactgacgg gtgcccccct gaacctgacc ccggaccaag tggtggctat cgccagcaac 480 attggcggca agcaagcgct cgaaacggtg cagcggctgt tgccggtgct gtgccaggac 540 catggcctga ccccggacca agtggtggct atcgccagca acattggcgg caagcaagcg 600 ctcgaaacgg tgcagcggct gttgccggtg ctgtgccagg accatggcct gaccccggac 660 caagtggtgg ctatcgccag caacattggc ggcaagcaag cgctcgaaac ggtgcagcgg 720 ctgttgccgg tgctgtgcca ggaccatggc ctgaccccgg accaagtggt ggctatcgcc 780 agcaacggtg gcggcaagca agcgctcgaa acggtgcagc ggctgttgcc ggtgctgtgc 840 caggaccatg gcctgactcc ggaccaagtg gtggctatcg ccagccacga tggcggcaag 900 caagcgctcg aaacggtgca gcggctgttg ccggtgctgt gccaggacca tggcctgact 960 ccggaccaag tggtggctat cgccagccac gatggcggca agcaagcgct cgaaacggtg 1020 cagcggctgt tgccggtgct gtgccaggac catggcctga ccccggacca agtggtggct 1080 atcgccagca acattggcgg caagcaagcg ctcgaaacgg tgcagcggct gttgccggtg 1140 ctgtgccagg accatggcct gaccccggac caagtggtgg ctatcgccag caacaatggc 1200 ggcaagcaag cgctcgaaac ggtgcagcgg ctgttgccgg tgctgtgcca ggaccatggc 1260 ctgaccccgg accaagtggt ggctatcgcc agcaacggtg gcggcaagca agcgctcgaa 1320 acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg gcctgacccc ggaccaagtg 1380 gtggctatcg ccagcaacaa tggcggcaag caagcgctcg aaacggtgca gcggctgttg 1440 ccggtgctgt gccaggacca tggcctgacc ccggaccaag tggtggctat cgccagcaac 1500 attggcggca agcaagcgct cgaaaccgta caacgtctcc tcccagtact ttgtcaagac 1560 cacgggttga ctccggatca agtcgtcgcg atcgcgagcc atgatggggg gaagcaggcg 1620 ctggaaagca ttgtggccca gctgagccgg cctgatccgg cgttggccgc gttgaccaac 1680 gaccacctcg tcgccttggc ctgcctcggc ggacgtcctg ccatggatgc agtgaaaaag 1740 ggattgccgc acgcgccgga attgatcaga agagtcaatc gccgtattgg cgaacgcacg 1800 tcccatcgcg ttgcgatatc tagagtggga ggaagctcgc gcagagagtc catcaaccca 1860 tggattctga ctggtttcgc tgatgccgaa ggatcattca tactagacat ccgcaaccga 1920 aacaacgaaa gcaacagata ccgaacttcg ctgagattcc agatcaccct gcacaacaag 1980 gacaaatcga ttctggagaa tatccagtcc acttggaagg tcggcaagat cacaaacagc 2040 agtgacagag ccgtcatgct gagggtcacc cgtttcgaag atttgaaagt gattatcgac 2100 cacttcgaga aatatccgct gattacccag aaattgggcg attacaagtt gtttaaacag 2160 gcattcagcg tcatggagaa taaagaacat cttaaggaga atgggattaa ggagctcgta 2220 cgaatcaaag ctaagatgaa ttggggtctc aatgacgaat tgaaaaaagc atttccagag 2280 aacattagca aagagcgccc ccttatcaat aagaacattc cgaatttcaa atggctggct 2340 ggattcacag ctggtgatgg ccatttcggc gtgaatctaa aaaaggtaaa gggcaccgca 2400 aaggtatacg tgggactgag attcgctatc tcacagcaca tcagagacaa gaacctgatg 2460 aattcattga taacatacct aggctgtggt tccatcagag agaagaacaa gtctgagttc 2520 agatggctcg agttcgaagt aaccaaattc agcgatatca acgacaagat cattccggta 2580 ttccaggaaa atactctgat tggcgtcaaa ctcgaggact ttgaagattg gtgcaaggtt 2640 gccaaattga tcgaagagaa gaaacacctg accgaatccg gtttggatga gattaagaaa 2700 atcaagctga acatgaacaa aggtcgttga 2730 <210> 9 <211> 2730 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL RNA construct <400> 9 augggauccg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60 agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120 gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180 gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240 acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300 uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360 gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420 gcacugacgg gugccccccu gaaccugacc ccggaccaag ugguggcuau cgccagcaac 480 auuggcggca agcaagcgcu cgaaacggug cagcggcugu ugccggugcu gugccaggac 540 cauggccuga ccccggacca agugguggcu aucgccagca acauuggcgg caagcaagcg 600 cucgaaacgg ugcagcggcu guugccggug cugugccagg accauggccu gaccccggac 660 caaguggugg cuaucgccag caacauuggc ggcaagcaag cgcucgaaac ggugcagcgg 720 cuguugccgg ugcugugcca ggaccauggc cugaccccgg accaaguggu ggcuaucgcc 780 agcaacggug gcggcaagca agcgcucgaa acggugcagc ggcuguugcc ggugcugugc 840 caggaccaug gccugacucc ggaccaagug guggcuaucg ccagccacga uggcggcaag 900 caagcgcucg aaacggugca gcggcuguug ccggugcugu gccaggacca uggccugacu 960 ccggaccaag ugguggcuau cgccagccac gauggcggca agcaagcgcu cgaaacggug 1020 cagcggcugu ugccggugcu gugccaggac cauggccuga ccccggacca agugguggcu 1080 aucgccagca acauuggcgg caagcaagcg cucgaaacgg ugcagcggcu guugccggug 1140 cugugccagg accauggccu gaccccggac caaguggugg cuaucgccag caacaauggc 1200 ggcaagcaag cgcucgaaac ggugcagcgg cuguugccgg ugcugugcca ggaccauggc 1260 cugaccccgg accaaguggu ggcuaucgcc agcaacggug gcggcaagca agcgcucgaa 1320 acggugcagc ggcuguugcc ggugcugugc caggaccaug gccugacccc ggaccaagug 1380 guggcuaucg ccagcaacaa uggcggcaag caagcgcucg aaacggugca gcggcuguug 1440 ccggugcugu gccaggacca uggccugacc ccggaccaag ugguggcuau cgccagcaac 1500 auuggcggca agcaagcgcu cgaaaccgua caacgucucc ucccaguacu uugucaagac 1560 cacggguuga cuccggauca agucgucgcg aucgcgagcc augauggggg gaagcaggcg 1620 cuggaaagca uuguggccca gcugagccgg ccugauccgg cguuggccgc guugaccaac 1680 gaccaccucg ucgccuuggc cugccucggc ggacguccug ccauggaugc agugaaaaag 1740 ggauugccgc acgcgccgga auugaucaga agagucaauc gccguauugg cgaacgcacg 1800 ucccaucgcg uugcgauauc uagaguggga ggaagcucgc gcagagaguc caucaaccca 1860 uggauucuga cugguuucgc ugaugccgaa ggaucauuca uacuagacau ccgcaaccga 1920 aacaacgaaa gcaacagaua ccgaacuucg cugagauucc agaucacccu gcacaacaag 1980 gacaaaucga uucuggagaa uauccagucc acuuggaagg ucggcaagau cacaaacagc 2040 agugacagag ccgucaugcu gagggucacc cguuucgaag auuugaaagu gauuaucgac 2100 cacuucgaga aauauccgcu gauuacccag aaauugggcg auuacaaguu guuuaaacag 2160 gcauucagcg ucauggagaa uaaagaacau cuuaaggaga augggauuaa ggagcucgua 2220 cgaaucaaag cuaagaugaa uuggggucuc aaugacgaau ugaaaaaagc auuuccagag 2280 aacauuagca aagagcgccc ccuuaucaau aagaacauuc cgaauuucaa auggcuggcu 2340 ggauucacag cuggugaugg ccauuucggc gugaaucuaa aaaagguaaa gggcaccgca 2400 aagguauacg ugggacugag auucgcuauc ucacagcaca ucagagacaa gaaccugaug 2460 aauucauuga uaacauaccu aggcuguggu uccaucagag agaagaacaa gucugaguuc 2520 agauggcucg aguucgaagu aaccaaauuc agcgauauca acgacaagau cauuccggua 2580 uuccaggaaa auacucugau uggcgucaaa cucgaggacu uugaagauug gugcaagguu 2640 gccaaauuga ucgaagagaa gaaacaccug accgaauccg guuuggauga gauuaagaaa 2700 aucaagcuga acaugaacaa aggucguuga 2730 <210> 10 <211> 909 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL protein construct <400> 10 Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg 1 5 10 15 Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val 20 25 30 Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe 35 40 45 Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly 50 55 60 Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala 65 70 75 80 Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg 85 90 95 Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro 100 105 110 Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly 115 120 125 Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly 130 135 140 Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 145 150 155 160 Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 165 170 175 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 180 185 190 Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 195 200 205 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 210 215 220 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 225 230 235 240 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 245 250 255 Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val 260 265 270 Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp 275 280 285 Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu 290 295 300 Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr 305 310 315 320 Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala 325 330 335 Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly 340 345 350 Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys 355 360 365 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp 370 375 380 His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly 385 390 395 400 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys 405 410 415 Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn 420 425 430 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val 435 440 445 Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala 450 455 460 Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu 465 470 475 480 Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala 485 490 495 Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg 500 505 510 Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val 515 520 525 Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile 530 535 540 Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn 545 550 555 560 Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp 565 570 575 Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val 580 585 590 Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg 595 600 605 Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 610 615 620 Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg 625 630 635 640 Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr 645 650 655 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 660 665 670 Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg 675 680 685 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 690 695 700 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 705 710 715 720 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 725 730 735 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 740 745 750 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 755 760 765 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala 770 775 780 Gly Asp Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala 785 790 795 800 Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp 805 810 815 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile 820 825 830 Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr 835 840 845 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 850 855 860 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 865 870 875 880 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 885 890 895 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 900 905 <210> 11 <211> 3372 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2 DNA construct <400> 11 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagctccgaa gcaccgagag ccgaaacctt cgtgttcctc 2700 gacctggaag ccactggcct gcccagtgtg gagcccgaga ttgccgagct gtccctgttc 2760 gccgttcatc ggtcctccct ggaaaaccct gagcacgacg agagcggagc actggtgctg 2820 ccaagggtgc tggacaagct gaccctgtgc atgtgtcccg agcgtccctt cactgccaag 2880 gcatccgaaa tcactggtct gagttcggaa gggctggctc gttgtagaaa ggctggattc 2940 gatggtgccg tggttcggac tttgcaggca ttcctgtcca ggcaggcagg tccaatctgc 3000 ttggtcgccc acaacggttt tgactacgac ttcccactgc tctgtgccga actgcgtcgc 3060 ctgggagcac gccttcctcg ggataccgtg tgcctggaca ccctacccgc tctgcgtgga 3120 ctggacagag cccactcaca cggcactagg gcgagaggac gccagggtta cagcctcggt 3180 tcactgttcc atcggtattt cagggcagag ccttccgcag cccattcagc cgaaggcgat 3240 gtccacacct tgcttctgat cttcctgcat cgtgcagcag aactgctcgc ctgggcagat 3300 gagcaggctc gtggatgggc tcacattgag ccgatgtact tgccacctga tgaccctagc 3360 ctggaagcct ga 3372 <210> 12 <211> 3372 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2 RNA construct <400> 12 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcuccgaa gcaccgagag ccgaaaccuu cguguuccuc 2700 gaccuggaag ccacuggccu gcccagugug gagcccgaga uugccgagcu gucccuguuc 2760 gccguucauc gguccucccu ggaaaacccu gagcacgacg agagcggagc acuggugcug 2820 ccaagggugc uggacaagcu gacccugugc augugucccg agcgucccuu cacugccaag 2880 gcauccgaaa ucacuggucu gaguucggaa gggcuggcuc guuguagaaa ggcuggauuc 2940 gauggugccg ugguucggac uuugcaggca uuccugucca ggcaggcagg uccaaucugc 3000 uuggucgccc acaacgguuu ugacuacgac uucccacugc ucugugccga acugcgucgc 3060 cugggagcac gccuuccucg ggauaccgug ugccuggaca cccuacccgc ucugcgugga 3120 cuggacagag cccacucaca cggcacuagg gcgagaggac gccaggguua cagccucggu 3180 ucacuguucc aucgguauuu cagggcagag ccuuccgcag cccauucagc cgaaggcgau 3240 guccacaccu ugcuucugau cuuccugcau cgugcagcag aacugcucgc cugggcagau 3300 gagcaggcuc guggaugggc ucacauugag ccgauguacu ugccaccuga ugacccuagc 3360 cuggaagccu ga 3372 <210> 13 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2 protein construct <400> 13 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Ala Pro Arg Ala Glu Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Ser Val Glu Pro 900 905 910 Glu Ile Ala Glu Leu Ser Leu Phe Ala Val His Arg Ser Ser Leu Glu 915 920 925 Asn Pro Glu His Asp Glu Ser Gly Ala Leu Val Leu Pro Arg Val Leu 930 935 940 Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Arg Pro Phe Thr Ala Lys 945 950 955 960 Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu Gly Leu Ala Arg Cys Arg 965 970 975 Lys Ala Gly Phe Asp Gly Ala Val Val Arg Thr Leu Gln Ala Phe Leu 980 985 990 Ser Arg Gln Ala Gly Pro Ile Cys Leu Val Ala His Asn Gly Phe Asp 995 1000 1005 Tyr Asp Phe Pro Leu Leu Cys Ala Glu Leu Arg Arg Leu Gly Ala 1010 1015 1020 Arg Leu Pro Arg Asp Thr Val Cys Leu Asp Thr Leu Pro Ala Leu 1025 1030 1035 Arg Gly Leu Asp Arg Ala His Ser His Gly Thr Arg Ala Arg Gly 1040 1045 1050 Arg Gln Gly Tyr Ser Leu Gly Ser Leu Phe His Arg Tyr Phe Arg 1055 1060 1065 Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val His Thr 1070 1075 1080 Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu Leu Leu Ala Trp 1085 1090 1095 Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile Glu Pro Met Tyr 1100 1105 1110 Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala 1115 1120 <210> 14 <211> 747 <212> DNA <213> Homo sapiens <400> 14 atgggatcct gcaggccacc taagaagaaa cgcaaagtct ccgaagcacc gagagccgaa 60 accttcgtgt tcctcgacct ggaagccact ggcctgccca gtgtggagcc cgagattgcc 120 gagctgtccc tgttcgccgt tcatcggtcc tccctggaaa accctgagca cgacgagagc 180 ggagcactgg tgctgccaag ggtgctggac aagctgaccc tgtgcatgtg tcccgagcgt 240 cccttcactg ccaaggcatc cgaaatcact ggtctgagtt cggaagggct ggctcgttgt 300 agaaaggctg gattcgatgg tgccgtggtt cggactttgc aggcattcct gtccaggcag 360 gcaggtccaa tctgcttggt cgcccacaac ggttttgact acgacttccc actgctctgt 420 gccgaactgc gtcgcctggg agcacgcctt cctcgggata ccgtgtgcct ggacacccta 480 cccgctctgc gtggactgga cagagcccac tcacacggca ctagggcgag aggacgccag 540 ggttacagcc tcggttcact gttccatcgg tatttcaggg cagagccttc cgcagcccat 600 tcagccgaag gcgatgtcca caccttgctt ctgatcttcc tgcatcgtgc agcagaactg 660 ctcgcctggg cagatgagca ggctcgtgga tgggctcaca ttgagccgat gtacttgcca 720 cctgatgacc ctagcctgga agcctga 747 <210> 15 <211> 747 <212> RNA <213> Homo sapiens <400> 15 augggauccu gcaggccacc uaagaagaaa cgcaaagucu ccgaagcacc gagagccgaa 60 accuucgugu uccucgaccu ggaagccacu ggccugccca guguggagcc cgagauugcc 120 gagcuguccc uguucgccgu ucaucggucc ucccuggaaa acccugagca cgacgagagc 180 ggagcacugg ugcugccaag ggugcuggac aagcugaccc ugugcaugug ucccgagcgu 240 cccuucacug ccaaggcauc cgaaaucacu ggucugaguu cggaagggcu ggcucguugu 300 agaaaggcug gauucgaugg ugccgugguu cggacuuugc aggcauuccu guccaggcag 360 gcagguccaa ucugcuuggu cgcccacaac gguuuugacu acgacuuccc acugcucugu 420 gccgaacugc gucgccuggg agcacgccuu ccucgggaua ccgugugccu ggacacccua 480 cccgcucugc guggacugga cagagcccac ucacacggca cuagggcgag aggacgccag 540 gguuacagcc ucgguucacu guuccaucgg uauuucaggg cagagccuuc cgcagcccau 600 ucagccgaag gcgaugucca caccuugcuu cugaucuucc ugcaucgugc agcagaacug 660 cucgccuggg cagaugagca ggcucgugga ugggcucaca uugagccgau guacuugcca 720 ccugaugacc cuagccugga agccuga 747 <210> 16 <211> 248 <212> PRT <213> Homo sapiens <400> 16 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Ser Glu Ala 1 5 10 15 Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu 20 25 30 Pro Ser Val Glu Pro Glu Ile Ala Glu Leu Ser Leu Phe Ala Val His 35 40 45 Arg Ser Ser Leu Glu Asn Pro Glu His Asp Glu Ser Gly Ala Leu Val 50 55 60 Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Arg 65 70 75 80 Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu Gly 85 90 95 Leu Ala Arg Cys Arg Lys Ala Gly Phe Asp Gly Ala Val Val Arg Thr 100 105 110 Leu Gln Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile Cys Leu Val Ala 115 120 125 His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys Ala Glu Leu Arg 130 135 140 Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val Cys Leu Asp Thr Leu 145 150 155 160 Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His Gly Thr Arg Ala 165 170 175 Arg Gly Arg Gln Gly Tyr Ser Leu Gly Ser Leu Phe His Arg Tyr Phe 180 185 190 Arg Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val His Thr 195 200 205 Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu Leu Leu Ala Trp Ala 210 215 220 Asp Glu Gln Ala Arg Gly Trp Ala His Ile Glu Pro Met Tyr Leu Pro 225 230 235 240 Pro Asp Asp Pro Ser Leu Glu Ala 245 <210> 17 <211> 3384 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2platypus DNA construct <400> 17 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagctccgaa tcacagaaat gcgaaacctt cgtgttcctc 2700 gacctggaag ccactggcct gcccgatgcg tctccccaga ttgccgaaat ctccctgttc 2760 gccgttcatc ggttctccct ggaacaccct gcgtgggacg atagcggagt accgctgctg 2820 ccaagggtgc tggacaagct gaccctgtgc atgaatcccg agcaaccctt cactcccaag 2880 gcagccaaga tcactggtct gaataacaga tccctgactg ataatagaaa ggcttgtttc 2940 gatgggaccg tggttaaggc tttgcgggag ttcctgtcca ggcaggcaag tccaatctgc 3000 ttggtcgccc acaacggttt tgcctacgac ttcccactgc tcaggaccga actgggtcgc 3060 ctggatgcaa accttcctga gaatacctat tgcctggaca ccctacccgc tctgaaagga 3120 ctggacaaag cccacgatca cggcactagg tcgaatcatg gcaagtctta ccgcctcggt 3180 gatctctaca ggcagtattt cggtgacgat cctaaagcag cccattcagc cgaaggcgat 3240 gtctacacct tggttatggt cttcctgcat cgggcaccag aactgctccg ttgggcaggt 3300 gcggaggctc gttcatggga tgagattagg ccgatgtact ccccaggtcc tcgtagatca 3360 ggtggcagaa ggcatgatgc ctga 3384 <210> 18 <211> 3384 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2platypus RNA construct <400> 18 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcuccgaa ucacagaaau gcgaaaccuu cguguuccuc 2700 gaccuggaag ccacuggccu gcccgaugcg ucuccccaga uugccgaaau cucccuguuc 2760 gccguucauc gguucucccu ggaacacccu gcgugggacg auagcggagu accgcugcug 2820 ccaagggugc uggacaagcu gacccugugc augaaucccg agcaacccuu cacucccaag 2880 gcagccaaga ucacuggucu gaauaacaga ucccugacug auaauagaaa ggcuuguuuc 2940 gaugggaccg ugguuaaggc uuugcgggag uuccugucca ggcaggcaag uccaaucugc 3000 uuggucgccc acaacgguuu ugccuacgac uucccacugc ucaggaccga acugggucgc 3060 cuggaugcaa accuuccuga gaauaccuau ugccuggaca cccuacccgc ucugaaagga 3120 cuggacaaag cccacgauca cggcacuagg ucgaaucaug gcaagucuua ccgccucggu 3180 gaucucuaca ggcaguauuu cggugacgau ccuaaagcag cccauucagc cgaaggcgau 3240 gucuacaccu ugguuauggu cuuccugcau cgggcaccag aacugcuccg uugggcaggu 3300 gcggaggcuc guucauggga ugagauuagg ccgauguacu ccccaggucc ucguagauca 3360 gguggcagaa ggcaugaugc cuga 3384 <210> 19 <211> 1127 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2platypus protein construct <400> 19 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Ser Gln Lys Cys Glu Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Asp Ala Ser Pro 900 905 910 Gln Ile Ala Glu Ile Ser Leu Phe Ala Val His Arg Phe Ser Leu Glu 915 920 925 His Pro Ala Trp Asp Asp Ser Gly Val Pro Leu Leu Pro Arg Val Leu 930 935 940 Asp Lys Leu Thr Leu Cys Met Asn Pro Glu Gln Pro Phe Thr Pro Lys 945 950 955 960 Ala Ala Lys Ile Thr Gly Leu Asn Asn Arg Ser Leu Thr Asp Asn Arg 965 970 975 Lys Ala Cys Phe Asp Gly Thr Val Val Lys Ala Leu Arg Glu Phe Leu 980 985 990 Ser Arg Gln Ala Ser Pro Ile Cys Leu Val Ala His Asn Gly Phe Ala 995 1000 1005 Tyr Asp Phe Pro Leu Leu Arg Thr Glu Leu Gly Arg Leu Asp Ala 1010 1015 1020 Asn Leu Pro Glu Asn Thr Tyr Cys Leu Asp Thr Leu Pro Ala Leu 1025 1030 1035 Lys Gly Leu Asp Lys Ala His Asp His Gly Thr Arg Ser Asn His 1040 1045 1050 Gly Lys Ser Tyr Arg Leu Gly Asp Leu Tyr Arg Gln Tyr Phe Gly 1055 1060 1065 Asp Asp Pro Lys Ala Ala His Ser Ala Glu Gly Asp Val Tyr Thr 1070 1075 1080 Leu Val Met Val Phe Leu His Arg Ala Pro Glu Leu Leu Arg Trp 1085 1090 1095 Ala Gly Ala Glu Ala Arg Ser Trp Asp Glu Ile Arg Pro Met Tyr 1100 1105 1110 Ser Pro Gly Pro Arg Arg Ser Gly Gly Arg Arg His Asp Ala 1115 1120 1125 <210> 20 <211> 3387 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2opossum DNA construct <400> 20 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcgccgaa ttaccgacat gcgaaacctt cgtgttcctc 2700 gacctggaag ccactggcct gcccaatgct catcccgaga ttgccgaaat ctccctgttc 2760 gccattcatc ggttctccct ggaacaccct gagagagacg agagcggaac acttcaactg 2820 ccaagggtgc tggacaagct gaccctgtgc atgtgtcccg agcagaactt cactcccaag 2880 gcatccgaaa tcactggtct gagtaatcag aacctggctg ataatcacaa ggctggattc 2940 aatggtgccg tgattcgggc tttgcgggag ttcctgaaga ggcagaaaag tccaatctgc 3000 ttggtcgccc acaacggttt tgactacgac ttcccactgc tcaggaccga acttcaacgc 3060 ctgggagcag accttcctgg aggaaccgtg tgcctggaca ccctacccgc tctgcgtgga 3120 ctggacaagg tccaccatca cagcactagg gcgtctcatg gaaagaagtc ttacagcctc 3180 ggtaatctct acaggcggta tttcgatgac gagcctcaag cagcccattc agccgaaggc 3240 gatgtctacg ccttggttat ggtcttcctg catcgggcac aagaactgct ccaatgcgta 3300 cagacggagg ctcagaattg ggatgagatt cagccgatgt ataccccacg taagcgtaga 3360 ctgtccggcg gtagcctgga tgcctga 3387 <210> 21 <211> 3387 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2opossum RNA construct <400> 21 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcgccgaa uuaccgacau gcgaaaccuu cguguuccuc 2700 gaccuggaag ccacuggccu gcccaaugcu caucccgaga uugccgaaau cucccuguuc 2760 gccauucauc gguucucccu ggaacacccu gagagagacg agagcggaac acuucaacug 2820 ccaagggugc uggacaagcu gacccugugc augugucccg agcagaacuu cacucccaag 2880 gcauccgaaa ucacuggucu gaguaaucag aaccuggcug auaaucacaa ggcuggauuc 2940 aauggugccg ugauucgggc uuugcgggag uuccugaaga ggcagaaaag uccaaucugc 3000 uuggucgccc acaacgguuu ugacuacgac uucccacugc ucaggaccga acuucaacgc 3060 cugggagcag accuuccugg aggaaccgug ugccuggaca cccuacccgc ucugcgugga 3120 cuggacaagg uccaccauca cagcacuagg gcgucucaug gaaagaaguc uuacagccuc 3180 gguaaucucu acaggcggua uuucgaugac gagccucaag cagcccauuc agccgaaggc 3240 gaugucuacg ccuugguuau ggucuuccug caucgggcac aagaacugcu ccaaugcgua 3300 cagacggagg cucagaauug ggaugagauu cagccgaugu auaccccacg uaagcguaga 3360 cuguccggcg guagccugga ugccuga 3387 <210> 22 <211> 1128 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2opossum protein construct <400> 22 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ala Glu Leu Pro Thr Cys Glu Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Asn Ala His Pro 900 905 910 Glu Ile Ala Glu Ile Ser Leu Phe Ala Ile His Arg Phe Ser Leu Glu 915 920 925 His Pro Glu Arg Asp Glu Ser Gly Thr Leu Gln Leu Pro Arg Val Leu 930 935 940 Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Gln Asn Phe Thr Pro Lys 945 950 955 960 Ala Ser Glu Ile Thr Gly Leu Ser Asn Gln Asn Leu Ala Asp Asn His 965 970 975 Lys Ala Gly Phe Asn Gly Ala Val Ile Arg Ala Leu Arg Glu Phe Leu 980 985 990 Lys Arg Gln Lys Ser Pro Ile Cys Leu Val Ala His Asn Gly Phe Asp 995 1000 1005 Tyr Asp Phe Pro Leu Leu Arg Thr Glu Leu Gln Arg Leu Gly Ala 1010 1015 1020 Asp Leu Pro Gly Gly Thr Val Cys Leu Asp Thr Leu Pro Ala Leu 1025 1030 1035 Arg Gly Leu Asp Lys Val His His His Ser Thr Arg Ala Ser His 1040 1045 1050 Gly Lys Lys Ser Tyr Ser Leu Gly Asn Leu Tyr Arg Arg Tyr Phe 1055 1060 1065 Asp Asp Glu Pro Gln Ala Ala His Ser Ala Glu Gly Asp Val Tyr 1070 1075 1080 Ala Leu Val Met Val Phe Leu His Arg Ala Gln Glu Leu Leu Gln 1085 1090 1095 Cys Val Gln Thr Glu Ala Gln Asn Trp Asp Glu Ile Gln Pro Met 1100 1105 1110 Tyr Thr Pro Arg Lys Arg Arg Leu Ser Gly Gly Ser Leu Asp Ala 1115 1120 1125 <210> 23 <211> 3372 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2sheep DNA construct <400> 23 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagctccaaa ggaccgagag ccaagacctt cgtgttcctc 2700 gacctggaag ccactggcct gcccagtgtt gatcccgaga ttgccgagct gtccctgttc 2760 gccgttcatc ggtcctccct ggaagaccct gagtgcgacg agagcggatc accgctgccg 2820 ccaagggtga tggacaagct gaccctgtgc atgtctccca aatacccctt cactgccaag 2880 gcatccgaaa tcactggtct gagtagggaa gggctgggtc gttgtggaaa ggctggattc 2940 gatgggaccg tggttcggac tttgcaggca ttcctgtcca ggcaggaagg tccagtctgc 3000 ttggtcgccc acaacggttt taactacgac ttcccactgc tctgtaccga actgcgtcgc 3060 ctgggagcac accttcctca agatacaatt tgcctggata ccctagtcgc tcttcaagat 3120 ctggacagag cccacggaca cggcactagg gcgcaaggag gcaagtctta cagcctcggt 3180 tcactgttct gttgctattt ccaggcagag ccttccgcag cccattcagc cgaaggcgat 3240 gtccacacct tgcttatggt cttcctgcat cgtgcagcag aactgctcgc ctgggcagat 3300 gagcaggctc tttcatgggc tcacgttgag ccgatgtacg tgccacctga tgacccaagg 3360 ctggaagact ga 3372 <210> 24 <211> 3372 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2sheep RNA construct <400> 24 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcuccaaa ggaccgagag ccaagaccuu cguguuccuc 2700 gaccuggaag ccacuggccu gcccaguguu gaucccgaga uugccgagcu gucccuguuc 2760 gccguucauc gguccucccu ggaagacccu gagugcgacg agagcggauc accgcugccg 2820 ccaaggguga uggacaagcu gacccugugc augucuccca aauaccccuu cacugccaag 2880 gcauccgaaa ucacuggucu gaguagggaa gggcuggguc guuguggaaa ggcuggauuc 2940 gaugggaccg ugguucggac uuugcaggca uuccugucca ggcaggaagg uccagucugc 3000 uuggucgccc acaacgguuu uaacuacgac uucccacugc ucuguaccga acugcgucgc 3060 cugggagcac accuuccuca agauacaauu ugccuggaua cccuagucgc ucuucaagau 3120 cuggacagag cccacggaca cggcacuagg gcgcaaggag gcaagucuua cagccucggu 3180 ucacuguucu guugcuauuu ccaggcagag ccuuccgcag cccauucagc cgaaggcgau 3240 guccacaccu ugcuuauggu cuuccugcau cgugcagcag aacugcucgc cugggcagau 3300 gagcaggcuc uuucaugggc ucacguugag ccgauguacg ugccaccuga ugacccaagg 3360 cuggaagacu ga 3372 <210> 25 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2sheep protein construct <400> 25 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Lys Gly Pro Arg Ala Lys Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Ser Val Asp Pro 900 905 910 Glu Ile Ala Glu Leu Ser Leu Phe Ala Val His Arg Ser Ser Leu Glu 915 920 925 Asp Pro Glu Cys Asp Glu Ser Gly Ser Pro Leu Pro Pro Arg Val Met 930 935 940 Asp Lys Leu Thr Leu Cys Met Ser Pro Lys Tyr Pro Phe Thr Ala Lys 945 950 955 960 Ala Ser Glu Ile Thr Gly Leu Ser Arg Glu Gly Leu Gly Arg Cys Gly 965 970 975 Lys Ala Gly Phe Asp Gly Thr Val Val Arg Thr Leu Gln Ala Phe Leu 980 985 990 Ser Arg Gln Glu Gly Pro Val Cys Leu Val Ala His Asn Gly Phe Asn 995 1000 1005 Tyr Asp Phe Pro Leu Leu Cys Thr Glu Leu Arg Arg Leu Gly Ala 1010 1015 1020 His Leu Pro Gln Asp Thr Ile Cys Leu Asp Thr Leu Val Ala Leu 1025 1030 1035 Gln Asp Leu Asp Arg Ala His Gly His Gly Thr Arg Ala Gln Gly 1040 1045 1050 Gly Lys Ser Tyr Ser Leu Gly Ser Leu Phe Cys Cys Tyr Phe Gln 1055 1060 1065 Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val His Thr 1070 1075 1080 Leu Leu Met Val Phe Leu His Arg Ala Ala Glu Leu Leu Ala Trp 1085 1090 1095 Ala Asp Glu Gln Ala Leu Ser Trp Ala His Val Glu Pro Met Tyr 1100 1105 1110 Val Pro Pro Asp Asp Pro Arg Leu Glu Asp 1115 1120 <210> 26 <211> 3372 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2armadillo DNA construct <400> 26 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagctcccaa gcaccgcaag ccgaaacctt cgtgttcctc 2700 gacctggaag ccactggcct gcccaatgtt gatcccgaga ttgccgaaat ctccctgttc 2760 gccgttcatc ggtcctccct ggaacaccct gagagagacg aggccggagt acctgtgctg 2820 ccaagggtgc tggacaagct gaccctgtgc atgtctccca ctcgtccctt cactgccaag 2880 gcatccgaaa tcactggtct gagttcggaa gggctggctc gttgtggaaa ggctggattc 2940 gatgatactg cggctcagac tttgcgggca ttcctgggca ggcaggcagg tccactctgc 3000 ttggtcgccc acaacggttt tgactacgac ttcccactgc tcaggaccga acttcaacgc 3060 ctgggagcac gccttccagc gcataccgtg tgcctggaca ccctacccgc tctgcgtgga 3120 ctggacagag cccactcaca cgctactagg gcgcaaggac gcaagggtta cagcctcggt 3180 tcactgttca ggcggtattt ccaggcagag ccttccgcag cccattcagc cgaaggcgat 3240 gtccgcacct tgcttctggt cttcctgcat cgtgcagcag aactgctcgc ctgggcagat 3300 gggcgggctc gttcatgggc tcacattgcg ccgatgtacg cgccaccgga ggcccctagc 3360 ccggaagcct ga 3372 <210> 27 <211> 3372 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2armadillo RNA construct <400> 27 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcucccaa gcaccgcaag ccgaaaccuu cguguuccuc 2700 gaccuggaag ccacuggccu gcccaauguu gaucccgaga uugccgaaau cucccuguuc 2760 gccguucauc gguccucccu ggaacacccu gagagagacg aggccggagu accugugcug 2820 ccaagggugc uggacaagcu gacccugugc augucuccca cucgucccuu cacugccaag 2880 gcauccgaaa ucacuggucu gaguucggaa gggcuggcuc guuguggaaa ggcuggauuc 2940 gaugauacug cggcucagac uuugcgggca uuccugggca ggcaggcagg uccacucugc 3000 uuggucgccc acaacgguuu ugacuacgac uucccacugc ucaggaccga acuucaacgc 3060 cugggagcac gccuuccagc gcauaccgug ugccuggaca cccuacccgc ucugcgugga 3120 cuggacagag cccacucaca cgcuacuagg gcgcaaggac gcaaggguua cagccucggu 3180 ucacuguuca ggcgguauuu ccaggcagag ccuuccgcag cccauucagc cgaaggcgau 3240 guccgcaccu ugcuucuggu cuuccugcau cgugcagcag aacugcucgc cugggcagau 3300 gggcgggcuc guucaugggc ucacauugcg ccgauguacg cgccaccgga ggccccuagc 3360 ccggaagccu ga 3372 <210> 28 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2armadillo protein construct <400> 28 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Gln Ala Pro Gln Ala Glu Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Asn Val Asp Pro 900 905 910 Glu Ile Ala Glu Ile Ser Leu Phe Ala Val His Arg Ser Ser Leu Glu 915 920 925 His Pro Glu Arg Asp Glu Ala Gly Val Pro Val Leu Pro Arg Val Leu 930 935 940 Asp Lys Leu Thr Leu Cys Met Ser Pro Thr Arg Pro Phe Thr Ala Lys 945 950 955 960 Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu Gly Leu Ala Arg Cys Gly 965 970 975 Lys Ala Gly Phe Asp Asp Thr Ala Ala Gln Thr Leu Arg Ala Phe Leu 980 985 990 Gly Arg Gln Ala Gly Pro Leu Cys Leu Val Ala His Asn Gly Phe Asp 995 1000 1005 Tyr Asp Phe Pro Leu Leu Arg Thr Glu Leu Gln Arg Leu Gly Ala 1010 1015 1020 Arg Leu Pro Ala His Thr Val Cys Leu Asp Thr Leu Pro Ala Leu 1025 1030 1035 Arg Gly Leu Asp Arg Ala His Ser His Ala Thr Arg Ala Gln Gly 1040 1045 1050 Arg Lys Gly Tyr Ser Leu Gly Ser Leu Phe Arg Arg Tyr Phe Gln 1055 1060 1065 Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val Arg Thr 1070 1075 1080 Leu Leu Leu Val Phe Leu His Arg Ala Ala Glu Leu Leu Ala Trp 1085 1090 1095 Ala Asp Gly Arg Ala Arg Ser Trp Ala His Ile Ala Pro Met Tyr 1100 1105 1110 Ala Pro Pro Glu Ala Pro Ser Pro Glu Ala 1115 1120 <210> 29 <211> 3372 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2leopard DNA construct <400> 29 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagctccgaa gtaccgagag ccgaaacctt cgtgttcctc 2700 gacctggaag ccactggcct gcccagtatt gatcccgagg ttgccgaaat ctccctgttc 2760 gccgttcatc ggtcctccct ggaaaaccct gacagagacg agagcggagt acctgtgctg 2820 ccaagggtgc tggacaagct gaccctgtgc atgtctcccg agcgtccctt cactgccaag 2880 gcatccgaaa tcactggtct gagttcggat tccctggctc gttgtagaaa ggctggattc 2940 gattcttccg tggttcggac tttgcaggca ttcctgtcca ggcaggaagg tccagtctgc 3000 ttggtcgccc acaacggttt tgactacgac ttcccactgc tctgtaccga actgcgtcgc 3060 ctgggagcac accttccacc ggatacaatt tgcctggaca ccctacccgc tctgcgtgga 3120 ctggacagag cccactcaca cggcactagg gcgcaaggat tcaagggtta cagcctcggt 3180 tcactgttca ggcggtattt ccatgcagag ccttccgcag cccattcagc cgaaggcgat 3240 gtccacacct tgcttatggt cttcctgcat cgtgcagcag aactgctctc ctgggcagat 3300 gagcaggctc gttcatgggc tcgcattaag ccgatgtacg agccaccgga tggccctagc 3360 gtggaagcct ga 3372 <210> 30 <211> 3372 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2leopard RNA construct <400> 30 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcuccgaa guaccgagag ccgaaaccuu cguguuccuc 2700 gaccuggaag ccacuggccu gcccaguauu gaucccgagg uugccgaaau cucccuguuc 2760 gccguucauc gguccucccu ggaaaacccu gacagagacg agagcggagu accugugcug 2820 ccaagggugc uggacaagcu gacccugugc augucucccg agcgucccuu cacugccaag 2880 gcauccgaaa ucacuggucu gaguucggau ucccuggcuc guuguagaaa ggcuggauuc 2940 gauucuuccg ugguucggac uuugcaggca uuccugucca ggcaggaagg uccagucugc 3000 uuggucgccc acaacgguuu ugacuacgac uucccacugc ucuguaccga acugcgucgc 3060 cugggagcac accuuccacc ggauacaauu ugccuggaca cccuacccgc ucugcgugga 3120 cuggacagag cccacucaca cggcacuagg gcgcaaggau ucaaggguua cagccucggu 3180 ucacuguuca ggcgguauuu ccaugcagag ccuuccgcag cccauucagc cgaaggcgau 3240 guccacaccu ugcuuauggu cuuccugcau cgugcagcag aacugcucuc cugggcagau 3300 gagcaggcuc guucaugggc ucgcauuaag ccgauguacg agccaccgga uggcccuagc 3360 guggaagccu ga 3372 <210> 31 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2leopard protein construct <400> 31 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Val Pro Arg Ala Glu Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Ser Ile Asp Pro 900 905 910 Glu Val Ala Glu Ile Ser Leu Phe Ala Val His Arg Ser Ser Leu Glu 915 920 925 Asn Pro Asp Arg Asp Glu Ser Gly Val Pro Val Leu Pro Arg Val Leu 930 935 940 Asp Lys Leu Thr Leu Cys Met Ser Pro Glu Arg Pro Phe Thr Ala Lys 945 950 955 960 Ala Ser Glu Ile Thr Gly Leu Ser Ser Asp Ser Leu Ala Arg Cys Arg 965 970 975 Lys Ala Gly Phe Asp Ser Ser Val Val Arg Thr Leu Gln Ala Phe Leu 980 985 990 Ser Arg Gln Glu Gly Pro Val Cys Leu Val Ala His Asn Gly Phe Asp 995 1000 1005 Tyr Asp Phe Pro Leu Leu Cys Thr Glu Leu Arg Arg Leu Gly Ala 1010 1015 1020 His Leu Pro Pro Asp Thr Ile Cys Leu Asp Thr Leu Pro Ala Leu 1025 1030 1035 Arg Gly Leu Asp Arg Ala His Ser His Gly Thr Arg Ala Gln Gly 1040 1045 1050 Phe Lys Gly Tyr Ser Leu Gly Ser Leu Phe Arg Arg Tyr Phe His 1055 1060 1065 Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val His Thr 1070 1075 1080 Leu Leu Met Val Phe Leu His Arg Ala Ala Glu Leu Leu Ser Trp 1085 1090 1095 Ala Asp Glu Gln Ala Arg Ser Trp Ala Arg Ile Lys Pro Met Tyr 1100 1105 1110 Glu Pro Pro Asp Gly Pro Ser Val Glu Ala 1115 1120 <210> 32 <211> 3372 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2mouse DNA construct <400> 32 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagctccgaa ccgccgagag ccgaaacctt cgtgttcctc 2700 gacctggagg ccactggcct gccgaacatg gacccggaaa ttgccgaaat ctccctgttc 2760 gccgtgcacc ggtcctccct ggaaaaccct gagcgggacg atagcggttc cctggtgctg 2820 cccagggtgc tggacaagct gaccctgtgc atgtgccccg agcgcccctt cactgccaag 2880 gcatccgaaa tcactggtct gagctcggaa tccctgatgc actgcggcaa ggccggattc 2940 aacggcgccg tggtccggac tttgcaggga ttcctgtcca gacaggaggg ccccatctgc 3000 ttggtcgccc acaacggttt tgactacgac ttccccctgc tctgcaccga actgcagcgc 3060 ctgggagccc acctccctca ggacaccgtg tgcctggaca ccctgcccgc actgcgcgga 3120 ctggacagag cccactcaca cggcaccagg gcgcagggac gcaagtccta cagcctcgca 3180 tcactgttcc atcggtattt ccaggccgag ccttccgccg cccattccgc cgaaggggat 3240 gtgcacacct tgcttctgat cttcctgcat cgcgctcccg aactgctggc ctgggcggac 3300 gagcaggccc ggtcctgggc ccacattgag ccgatgtacg tgccgcccga tggacctagc 3360 ctggaagcct ga 3372 <210> 33 <211> 3372 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2mouse RNA construct <400> 33 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcuccgaa ccgccgagag ccgaaaccuu cguguuccuc 2700 gaccuggagg ccacuggccu gccgaacaug gacccggaaa uugccgaaau cucccuguuc 2760 gccgugcacc gguccucccu ggaaaacccu gagcgggacg auagcgguuc ccuggugcug 2820 cccagggugc uggacaagcu gacccugugc augugccccg agcgccccuu cacugccaag 2880 gcauccgaaa ucacuggucu gagcucggaa ucccugaugc acugcggcaa ggccggauuc 2940 aacggcgccg ugguccggac uuugcaggga uuccugucca gacaggaggg ccccaucugc 3000 uuggucgccc acaacgguuu ugacuacgac uucccccugc ucugcaccga acugcagcgc 3060 cugggagccc accucccuca ggacaccgug ugccuggaca cccugcccgc acugcgcgga 3120 cuggacagag cccacucaca cggcaccagg gcgcagggac gcaaguccua cagccucgca 3180 ucacuguucc aucgguauuu ccaggccgag ccuuccgccg cccauuccgc cgaaggggau 3240 gugcacaccu ugcuucugau cuuccugcau cgcgcucccg aacugcuggc cugggcggac 3300 gagcaggccc gguccugggc ccacauugag ccgauguacg ugccgcccga uggaccuagc 3360 cuggaagccu ga 3372 <210> 34 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-Trex2mouse protein construct <400> 34 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Pro Pro Arg Ala Glu Thr 885 890 895 Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Asn Met Asp Pro 900 905 910 Glu Ile Ala Glu Ile Ser Leu Phe Ala Val His Arg Ser Ser Leu Glu 915 920 925 Asn Pro Glu Arg Asp Asp Ser Gly Ser Leu Val Leu Pro Arg Val Leu 930 935 940 Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Arg Pro Phe Thr Ala Lys 945 950 955 960 Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu Ser Leu Met His Cys Gly 965 970 975 Lys Ala Gly Phe Asn Gly Ala Val Val Arg Thr Leu Gln Gly Phe Leu 980 985 990 Ser Arg Gln Glu Gly Pro Ile Cys Leu Val Ala His Asn Gly Phe Asp 995 1000 1005 Tyr Asp Phe Pro Leu Leu Cys Thr Glu Leu Gln Arg Leu Gly Ala 1010 1015 1020 His Leu Pro Gln Asp Thr Val Cys Leu Asp Thr Leu Pro Ala Leu 1025 1030 1035 Arg Gly Leu Asp Arg Ala His Ser His Gly Thr Arg Ala Gln Gly 1040 1045 1050 Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe His Arg Tyr Phe Gln 1055 1060 1065 Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly Asp Val His Thr 1070 1075 1080 Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu Leu Ala Trp 1085 1090 1095 Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro Met Tyr 1100 1105 1110 Val Pro Pro Asp Gly Pro Ser Leu Glu Ala 1115 1120 <210> 35 <211> 3504 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-hsRad1 DNA construct <400> 35 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcgcc gcttctgacc caacagatcc aagacgagga cgatcagtac 2700 agccttgttg ccagccttga caacgtgagg aatctctcca ctatcttgaa agctattcat 2760 ttccgagaac atgccacctg tttcgcaact aagaacggta tcaaagtaac agtggagaat 2820 gcaaagtgtg tgcaagcaaa tgccttcatt caggctggca tcttccaaga gttcaaagtt 2880 caggaagagt ctgttacttt ccgaatcaac ctaactgtcc tcttagactg tttatctatc 2940 ttcggatcaa gtccaatgcc agggacttta actgcactcc gaatgtgtta ccaaggttac 3000 ggataccctt tgatgctgtt cctcgaagaa ggaggagtgg tgacagtctg caagatcaat 3060 acacaggaac cagaggagac cctggacttc gatttctgct ccaccaatgt tatcaacaag 3120 atcattctcc agtcagaagg gctccgtgaa gcattctctg aattggatat gacgagtgaa 3180 gtcctacaga tcaccatgtc tcctgacaag ccttacttca ggttatctac tttcggaaat 3240 gcaggaagtt cccaccttga ctatcccaaa gattctgatt tgatggaggc atttcattgt 3300 aatcagactc aagtgaacag atacaagata tccctactga aaccctctac aaaggcatta 3360 gtcctatctt gtaaggtatc tattcggaca gataacagag gcttcctttc attacagtat 3420 atgattagaa atgaagatgg acaaatctgc tttgtggagt attactgctg ccctgatgag 3480 gaagttcctg aatctgagtc ttga 3504 <210> 36 <211> 3504 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-hsRad1 RNA construct <400> 36 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucgcc gcuucugacc caacagaucc aagacgagga cgaucaguac 2700 agccuuguug ccagccuuga caacgugagg aaucucucca cuaucuugaa agcuauucau 2760 uuccgagaac augccaccug uuucgcaacu aagaacggua ucaaaguaac aguggagaau 2820 gcaaagugug ugcaagcaaa ugccuucauu caggcuggca ucuuccaaga guucaaaguu 2880 caggaagagu cuguuacuuu ccgaaucaac cuaacugucc ucuuagacug uuuaucuauc 2940 uucggaucaa guccaaugcc agggacuuua acugcacucc gaauguguua ccaagguuac 3000 ggauacccuu ugaugcuguu ccucgaagaa ggaggagugg ugacagucug caagaucaau 3060 acacaggaac cagaggagac ccuggacuuc gauuucugcu ccaccaaugu uaucaacaag 3120 aucauucucc agucagaagg gcuccgugaa gcauucucug aauuggauau gacgagugaa 3180 guccuacaga ucaccauguc uccugacaag ccuuacuuca gguuaucuac uuucggaaau 3240 gcaggaaguu cccaccuuga cuaucccaaa gauucugauu ugauggaggc auuucauugu 3300 aaucagacuc aagugaacag auacaagaua ucccuacuga aacccucuac aaaggcauua 3360 guccuaucuu guaagguauc uauucggaca gauaacagag gcuuccuuuc auuacaguau 3420 augauuagaa augaagaugg acaaaucugc uuuguggagu auuacugcug cccugaugag 3480 gaaguuccug aaucugaguc uuga 3504 <210> 37 <211> 1167 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-hsRad1 protein construct <400> 37 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Pro Leu Leu Thr Gln Gln Ile Gln Asp Glu 885 890 895 Asp Asp Gln Tyr Ser Leu Val Ala Ser Leu Asp Asn Val Arg Asn Leu 900 905 910 Ser Thr Ile Leu Lys Ala Ile His Phe Arg Glu His Ala Thr Cys Phe 915 920 925 Ala Thr Lys Asn Gly Ile Lys Val Thr Val Glu Asn Ala Lys Cys Val 930 935 940 Gln Ala Asn Ala Phe Ile Gln Ala Gly Ile Phe Gln Glu Phe Lys Val 945 950 955 960 Gln Glu Glu Ser Val Thr Phe Arg Ile Asn Leu Thr Val Leu Leu Asp 965 970 975 Cys Leu Ser Ile Phe Gly Ser Ser Pro Met Pro Gly Thr Leu Thr Ala 980 985 990 Leu Arg Met Cys Tyr Gln Gly Tyr Gly Tyr Pro Leu Met Leu Phe Leu 995 1000 1005 Glu Glu Gly Gly Val Val Thr Val Cys Lys Ile Asn Thr Gln Glu 1010 1015 1020 Pro Glu Glu Thr Leu Asp Phe Asp Phe Cys Ser Thr Asn Val Ile 1025 1030 1035 Asn Lys Ile Ile Leu Gln Ser Glu Gly Leu Arg Glu Ala Phe Ser 1040 1045 1050 Glu Leu Asp Met Thr Ser Glu Val Leu Gln Ile Thr Met Ser Pro 1055 1060 1065 Asp Lys Pro Tyr Phe Arg Leu Ser Thr Phe Gly Asn Ala Gly Ser 1070 1075 1080 Ser His Leu Asp Tyr Pro Lys Asp Ser Asp Leu Met Glu Ala Phe 1085 1090 1095 His Cys Asn Gln Thr Gln Val Asn Arg Tyr Lys Ile Ser Leu Leu 1100 1105 1110 Lys Pro Ser Thr Lys Ala Leu Val Leu Ser Cys Lys Val Ser Ile 1115 1120 1125 Arg Thr Asp Asn Arg Gly Phe Leu Ser Leu Gln Tyr Met Ile Arg 1130 1135 1140 Asn Glu Asp Gly Gln Ile Cys Phe Val Glu Tyr Tyr Cys Cys Pro 1145 1150 1155 Asp Glu Glu Val Pro Glu Ser Glu Ser 1160 1165 <210> 38 <211> 3870 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-hsRad9a DNA construct <400> 38 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcggcaaa ggagggttct tcagcaggtg gtggcggagc 2700 gggaggacga tagggcaagt gtgtgagcag aagcagccag agggctgggt ctgtggctgc 2760 cctctgacca cgtccctctc cctgctcttc gtggcccaac tctccctccg aacggtgaac 2820 tcctcccgct ctgcctatgc ctgctttctc tttgctccgc tcttcttcca gcaataccag 2880 gcagccactc ctggtcaaga cctgctgcga tgtaagattc tgatgaagtc tttcctgtct 2940 gtcttccgct cactggcgat gctggagaag acggtggaga agtgctgcat ctccctgaat 3000 ggtcggagca gtcgcctggt agtccaactg cattgcaagt tcggcgtgcg gaagactcac 3060 aacctgtcct tccaggactg tgagtccctt caggccgtct ttgacccagc ctcgtgccct 3120 cacatgctcc gagcaccagc acgggttctg ggagaggctg ttctgccctt ctctcctgca 3180 ctggctgaag tgacgctggg cattggccgt ggacgcaggg tcatcctgcg tagttaccac 3240 gaggaggagg cagacagcac tgccaaagcg atggtgactg agatgtgcct tggagaggag 3300 gatttccagc aactacaggc ccaggaagga gttgccatca ctttctgcct caaggagttc 3360 cgagggctcc tgagtttcgc agagtcagca aacttgaatc ttagcattca tttcgatgct 3420 ccaggcaggc cagccatctt caccatcaag gactctttgc tggacggcca ctttgtctta 3480 gccacactct cagacaccga ctcgcactcc caagacctgg gctcaccaga gcgtcaccag 3540 ccagtgcctc aactccaggc tcacagcaca cctcaccctg acgactttgc caatgacgac 3600 attgactctt acatgatagc gatggaaacc actataggca atgagggctc gcgtgtgctg 3660 ccctccattt ccctttcacc tggccctcag cctcccaaga gcccaggacc tcactccgag 3720 gaggaagatg aggctgagcc cagcacagtg cctgggactc ctccacccaa gaagttccgc 3780 tcactgttct tcggctccat cctggctcct gttcgctcac cacagggtcc tagccctgtg 3840 ctggcggaag acagtgaggg tgaaggctga 3870 <210> 39 <211> 3870 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-hsRad9a RNA construct <400> 39 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcggcaaa ggaggguucu ucagcaggug guggcggagc 2700 gggaggacga uagggcaagu gugugagcag aagcagccag agggcugggu cuguggcugc 2760 ccucugacca cgucccucuc ccugcucuuc guggcccaac ucucccuccg aacggugaac 2820 uccucccgcu cugccuaugc cugcuuucuc uuugcuccgc ucuucuucca gcaauaccag 2880 gcagccacuc cuggucaaga ccugcugcga uguaagauuc ugaugaaguc uuuccugucu 2940 gucuuccgcu cacuggcgau gcuggagaag acgguggaga agugcugcau cucccugaau 3000 ggucggagca gucgccuggu aguccaacug cauugcaagu ucggcgugcg gaagacucac 3060 aaccuguccu uccaggacug ugagucccuu caggccgucu uugacccagc cucgugcccu 3120 cacaugcucc gagcaccagc acggguucug ggagaggcug uucugcccuu cucuccugca 3180 cuggcugaag ugacgcuggg cauuggccgu ggacgcaggg ucauccugcg uaguuaccac 3240 gaggaggagg cagacagcac ugccaaagcg auggugacug agaugugccu uggagaggag 3300 gauuuccagc aacuacaggc ccaggaagga guugccauca cuuucugccu caaggaguuc 3360 cgagggcucc ugaguuucgc agagucagca aacuugaauc uuagcauuca uuucgaugcu 3420 ccaggcaggc cagccaucuu caccaucaag gacucuuugc uggacggcca cuuugucuua 3480 gccacacucu cagacaccga cucgcacucc caagaccugg gcucaccaga gcgucaccag 3540 ccagugccuc aacuccaggc ucacagcaca ccucacccug acgacuuugc caaugacgac 3600 auugacucuu acaugauagc gauggaaacc acuauaggca augagggcuc gcgugugcug 3660 cccuccauuu cccuuucacc uggcccucag ccucccaaga gcccaggacc ucacuccgag 3720 gaggaagaug aggcugagcc cagcacagug ccugggacuc cuccacccaa gaaguuccgc 3780 ucacuguucu ucggcuccau ccuggcuccu guucgcucac cacagggucc uagcccugug 3840 cuggcggaag acagugaggg ugaaggcuga 3870 <210> 40 <211> 1289 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-hsRad9a protein construct <400> 40 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Gly Lys Gly Gly Phe Phe Ser Arg 885 890 895 Trp Trp Arg Ser Gly Arg Thr Ile Gly Gln Val Cys Glu Gln Lys Gln 900 905 910 Pro Glu Gly Trp Val Cys Gly Cys Pro Leu Thr Thr Ser Leu Ser Leu 915 920 925 Leu Phe Val Ala Gln Leu Ser Leu Arg Thr Val Asn Ser Ser Arg Ser 930 935 940 Ala Tyr Ala Cys Phe Leu Phe Ala Pro Leu Phe Phe Gln Gln Tyr Gln 945 950 955 960 Ala Ala Thr Pro Gly Gln Asp Leu Leu Arg Cys Lys Ile Leu Met Lys 965 970 975 Ser Phe Leu Ser Val Phe Arg Ser Leu Ala Met Leu Glu Lys Thr Val 980 985 990 Glu Lys Cys Cys Ile Ser Leu Asn Gly Arg Ser Ser Arg Leu Val Val 995 1000 1005 Gln Leu His Cys Lys Phe Gly Val Arg Lys Thr His Asn Leu Ser 1010 1015 1020 Phe Gln Asp Cys Glu Ser Leu Gln Ala Val Phe Asp Pro Ala Ser 1025 1030 1035 Cys Pro His Met Leu Arg Ala Pro Ala Arg Val Leu Gly Glu Ala 1040 1045 1050 Val Leu Pro Phe Ser Pro Ala Leu Ala Glu Val Thr Leu Gly Ile 1055 1060 1065 Gly Arg Gly Arg Arg Val Ile Leu Arg Ser Tyr His Glu Glu Glu 1070 1075 1080 Ala Asp Ser Thr Ala Lys Ala Met Val Thr Glu Met Cys Leu Gly 1085 1090 1095 Glu Glu Asp Phe Gln Gln Leu Gln Ala Gln Glu Gly Val Ala Ile 1100 1105 1110 Thr Phe Cys Leu Lys Glu Phe Arg Gly Leu Leu Ser Phe Ala Glu 1115 1120 1125 Ser Ala Asn Leu Asn Leu Ser Ile His Phe Asp Ala Pro Gly Arg 1130 1135 1140 Pro Ala Ile Phe Thr Ile Lys Asp Ser Leu Leu Asp Gly His Phe 1145 1150 1155 Val Leu Ala Thr Leu Ser Asp Thr Asp Ser His Ser Gln Asp Leu 1160 1165 1170 Gly Ser Pro Glu Arg His Gln Pro Val Pro Gln Leu Gln Ala His 1175 1180 1185 Ser Thr Pro His Pro Asp Asp Phe Ala Asn Asp Asp Ile Asp Ser 1190 1195 1200 Tyr Met Ile Ala Met Glu Thr Thr Ile Gly Asn Glu Gly Ser Arg 1205 1210 1215 Val Leu Pro Ser Ile Ser Leu Ser Pro Gly Pro Gln Pro Pro Lys 1220 1225 1230 Ser Pro Gly Pro His Ser Glu Glu Glu Asp Glu Ala Glu Pro Ser 1235 1240 1245 Thr Val Pro Gly Thr Pro Pro Pro Lys Lys Phe Arg Ser Leu Phe 1250 1255 1260 Phe Gly Ser Ile Leu Ala Pro Val Arg Ser Pro Gln Gly Pro Ser 1265 1270 1275 Pro Val Leu Ala Glu Asp Ser Glu Gly Glu Gly 1280 1285 <210> 41 <211> 4086 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-ExoI DNA construct <400> 41 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcaacgat ggcaagcagc aaagtacatt ccttttccac 2700 gactacgaaa cctttggaac ccaccccgct ctggatcggc cagcacagtt cgctgccata 2760 agaaccgaca acgagttcaa tgtgatcggt gaacccgagg tgttttactg caaacctgcg 2820 gacgattatc tgcctcaacc gggagccgtt ctgattacgg gaattacccc ccaagaagcg 2880 cgtgccaagg gcgaaaatga agctgcattt gccgctagaa tccatagcct gtttactgtt 2940 ccgaagacgt gtatcttggg atacaacaat gtacgctttg atgacgaagt aactcgtaac 3000 gtgttctatc ggaacttcta tgacccttac gcctggagtt ggcagcacga caattctcga 3060 tgggatcttc tggatgtgat gagagcctgc tacgctctca ggccagaggg cattaactgg 3120 cctgagaacg acgatgggct tccgtcattt cgccttgagc atcttaccaa agcgaatggc 3180 atcgaacact ccaatgcaca cgacgctatg gctgatgtct acgcgactat tgcaatggcg 3240 aaattggtca agacaagaca gccgaggttg tttgactacc tgtttacgca tcgaaacaaa 3300 cataagctca tggcactgat agatgtccct caaatgaagc ccctcgttca cgtcagcggt 3360 atgttcggag cgtggagagg aaacacgtcc tgggttgctc ctctggcatg gcatccagag 3420 aacagaaacg cggtaatcat ggtcgatctc gcaggagaca ttagcccact tctcgaattg 3480 gattccgaca ccttgcgaga acgcctttac acagcgaaaa ctgatttggg tgataacgct 3540 gccgtacctg tcaaattggt acatatcaac aaatgtccgg tgctcgcgca agccaacacc 3600 ctgagacctg aagacgcgga tagactgggg ataaaccggc agcactgttt ggataatctc 3660 aagatactca gggagaatcc gcaggtgcgc gaaaaagtcg tagccatctt tgcggaggca 3720 gaaccattta cgccgtctga caatgtagat gctcagttat acaatggctt ctttagtgac 3780 gctgaccgag ctgcgatgaa gattgtgcta gagactgaac cgagaaacct ctctgcattg 3840 gacatcactt ttgtcgataa gcgaatagag aagttgctgt tcaactatcg tgcccgaaac 3900 tttccaggga cactcgatta cgcagagcaa caaaggtggc ttgagcatcg caggcaggtg 3960 tttaccccag agttcttgca gggttacgct gaggagattc aaatgttggc acagcagtat 4020 gcagatgata aggagaaagt cgcgttgctg aaggctctgt ggcaatacgc cgaagagata 4080 gtgtga 4086 <210> 42 <211> 4086 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-ExoI RNA construct <400> 42 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcaacgau ggcaagcagc aaaguacauu ccuuuuccac 2700 gacuacgaaa ccuuuggaac ccaccccgcu cuggaucggc cagcacaguu cgcugccaua 2760 agaaccgaca acgaguucaa ugugaucggu gaacccgagg uguuuuacug caaaccugcg 2820 gacgauuauc ugccucaacc gggagccguu cugauuacgg gaauuacccc ccaagaagcg 2880 cgugccaagg gcgaaaauga agcugcauuu gccgcuagaa uccauagccu guuuacuguu 2940 ccgaagacgu guaucuuggg auacaacaau guacgcuuug augacgaagu aacucguaac 3000 guguucuauc ggaacuucua ugacccuuac gccuggaguu ggcagcacga caauucucga 3060 ugggaucuuc uggaugugau gagagccugc uacgcucuca ggccagaggg cauuaacugg 3120 ccugagaacg acgaugggcu uccgucauuu cgccuugagc aucuuaccaa agcgaauggc 3180 aucgaacacu ccaaugcaca cgacgcuaug gcugaugucu acgcgacuau ugcaauggcg 3240 aaauugguca agacaagaca gccgagguug uuugacuacc uguuuacgca ucgaaacaaa 3300 cauaagcuca uggcacugau agaugucccu caaaugaagc cccucguuca cgucagcggu 3360 auguucggag cguggagagg aaacacgucc uggguugcuc cucuggcaug gcauccagag 3420 aacagaaacg cgguaaucau ggucgaucuc gcaggagaca uuagcccacu ucucgaauug 3480 gauuccgaca ccuugcgaga acgccuuuac acagcgaaaa cugauuuggg ugauaacgcu 3540 gccguaccug ucaaauuggu acauaucaac aaauguccgg ugcucgcgca agccaacacc 3600 cugagaccug aagacgcgga uagacugggg auaaaccggc agcacuguuu ggauaaucuc 3660 aagauacuca gggagaaucc gcaggugcgc gaaaaagucg uagccaucuu ugcggaggca 3720 gaaccauuua cgccgucuga caauguagau gcucaguuau acaauggcuu cuuuagugac 3780 gcugaccgag cugcgaugaa gauugugcua gagacugaac cgagaaaccu cucugcauug 3840 gacaucacuu uugucgauaa gcgaauagag aaguugcugu ucaacuaucg ugcccgaaac 3900 uuuccaggga cacucgauua cgcagagcaa caaagguggc uugagcaucg caggcaggug 3960 uuuaccccag aguucuugca ggguuacgcu gaggagauuc aaauguuggc acagcaguau 4020 gcagaugaua aggagaaagu cgcguugcug aaggcucugu ggcaauacgc cgaagagaua 4080 guguga 4086 <210> 43 <211> 1361 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-ExoI protein construct <400> 43 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Asn Asp Gly Lys Gln Gln Ser Thr 885 890 895 Phe Leu Phe His Asp Tyr Glu Thr Phe Gly Thr His Pro Ala Leu Asp 900 905 910 Arg Pro Ala Gln Phe Ala Ala Ile Arg Thr Asp Asn Glu Phe Asn Val 915 920 925 Ile Gly Glu Pro Glu Val Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu 930 935 940 Pro Gln Pro Gly Ala Val Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala 945 950 955 960 Arg Ala Lys Gly Glu Asn Glu Ala Ala Phe Ala Ala Arg Ile His Ser 965 970 975 Leu Phe Thr Val Pro Lys Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg 980 985 990 Phe Asp Asp Glu Val Thr Arg Asn Val Phe Tyr Arg Asn Phe Tyr Asp 995 1000 1005 Pro Tyr Ala Trp Ser Trp Gln His Asp Asn Ser Arg Trp Asp Leu 1010 1015 1020 Leu Asp Val Met Arg Ala Cys Tyr Ala Leu Arg Pro Glu Gly Ile 1025 1030 1035 Asn Trp Pro Glu Asn Asp Asp Gly Leu Pro Ser Phe Arg Leu Glu 1040 1045 1050 His Leu Thr Lys Ala Asn Gly Ile Glu His Ser Asn Ala His Asp 1055 1060 1065 Ala Met Ala Asp Val Tyr Ala Thr Ile Ala Met Ala Lys Leu Val 1070 1075 1080 Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu Phe Thr His Arg 1085 1090 1095 Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro Gln Met Lys 1100 1105 1110 Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg Gly Asn 1115 1120 1125 Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg Asn 1130 1135 1140 Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu 1145 1150 1155 Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys 1160 1165 1170 Thr Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His 1175 1180 1185 Ile Asn Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro 1190 1195 1200 Glu Asp Ala Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp 1205 1210 1215 Asn Leu Lys Ile Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val 1220 1225 1230 Val Ala Ile Phe Ala Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn 1235 1240 1245 Val Asp Ala Gln Leu Tyr Asn Gly Phe Phe Ser Asp Ala Asp Arg 1250 1255 1260 Ala Ala Met Lys Ile Val Leu Glu Thr Glu Pro Arg Asn Leu Ser 1265 1270 1275 Ala Leu Asp Ile Thr Phe Val Asp Lys Arg Ile Glu Lys Leu Leu 1280 1285 1290 Phe Asn Tyr Arg Ala Arg Asn Phe Pro Gly Thr Leu Asp Tyr Ala 1295 1300 1305 Glu Gln Gln Arg Trp Leu Glu His Arg Arg Gln Val Phe Thr Pro 1310 1315 1320 Glu Phe Leu Gln Gly Tyr Ala Glu Glu Ile Gln Met Leu Ala Gln 1325 1330 1335 Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu Lys Ala Leu 1340 1345 1350 Trp Gln Tyr Ala Glu Glu Ile Val 1355 1360 <210> 44 <211> 3324 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-ExoX DNA construct <400> 44 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcctgcgg atcatagaca cggaaacctg tggactccag 2700 ggtggtatcg tggagatagc cagtgtcgat gtaattgatg ggaaaatcgt aaacccgatg 2760 agccacctcg tccgaccgga taggccgata agtccgcagg ctatggctat acatagaatc 2820 acggaggcta tggtagctga caagccttgg atcgaggacg ttatcccaca ctactatggg 2880 agcgaatggt atgtagcgca caacgcatca tttgataggc gcgtgcttcc cgaaatgcct 2940 ggggagtgga tttgcacaat gaaactcgct cgccgactgt ggcctggtat caagtatagt 3000 aacatggcac tttacaagac ccgcaaactc aacgtacaga cacctccggg tctccaccac 3060 catagggcac tctatgattg ttacataacc gctgctctcc ttatagacat aatgaatacc 3120 tccgggtgga ccgccgaaca aatggcagac ataacgggaa gacctagttt gatgacaacc 3180 tttacatttg gaaagtatcg gggcaaggcg gtgagcgatg tggccgaaag agatcccggt 3240 tatcttagat ggctcttcaa taacttggat tctatgtcac ctgaacttcg ccttaccctg 3300 aagcattacc ttgagaatac ctga 3324 <210> 45 <211> 3324 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-ExoX RNA construct <400> 45 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagccugcgg aucauagaca cggaaaccug uggacuccag 2700 ggugguaucg uggagauagc cagugucgau guaauugaug ggaaaaucgu aaacccgaug 2760 agccaccucg uccgaccgga uaggccgaua aguccgcagg cuauggcuau acauagaauc 2820 acggaggcua ugguagcuga caagccuugg aucgaggacg uuaucccaca cuacuauggg 2880 agcgaauggu auguagcgca caacgcauca uuugauaggc gcgugcuucc cgaaaugccu 2940 ggggagugga uuugcacaau gaaacucgcu cgccgacugu ggccugguau caaguauagu 3000 aacauggcac uuuacaagac ccgcaaacuc aacguacaga caccuccggg ucuccaccac 3060 cauagggcac ucuaugauug uuacauaacc gcugcucucc uuauagacau aaugaauacc 3120 uccgggugga ccgccgaaca aauggcagac auaacgggaa gaccuaguuu gaugacaacc 3180 uuuacauuug gaaaguaucg gggcaaggcg gugagcgaug uggccgaaag agaucccggu 3240 uaucuuagau ggcucuucaa uaacuuggau ucuaugucac cugaacuucg ccuuacccug 3300 aagcauuacc uugagaauac cuga 3324 <210> 46 <211> 1107 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-ExoX protein construct <400> 46 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Leu Arg Ile Ile Asp Thr Glu Thr 885 890 895 Cys Gly Leu Gln Gly Gly Ile Val Glu Ile Ala Ser Val Asp Val Ile 900 905 910 Asp Gly Lys Ile Val Asn Pro Met Ser His Leu Val Arg Pro Asp Arg 915 920 925 Pro Ile Ser Pro Gln Ala Met Ala Ile His Arg Ile Thr Glu Ala Met 930 935 940 Val Ala Asp Lys Pro Trp Ile Glu Asp Val Ile Pro His Tyr Tyr Gly 945 950 955 960 Ser Glu Trp Tyr Val Ala His Asn Ala Ser Phe Asp Arg Arg Val Leu 965 970 975 Pro Glu Met Pro Gly Glu Trp Ile Cys Thr Met Lys Leu Ala Arg Arg 980 985 990 Leu Trp Pro Gly Ile Lys Tyr Ser Asn Met Ala Leu Tyr Lys Thr Arg 995 1000 1005 Lys Leu Asn Val Gln Thr Pro Pro Gly Leu His His His Arg Ala 1010 1015 1020 Leu Tyr Asp Cys Tyr Ile Thr Ala Ala Leu Leu Ile Asp Ile Met 1025 1030 1035 Asn Thr Ser Gly Trp Thr Ala Glu Gln Met Ala Asp Ile Thr Gly 1040 1045 1050 Arg Pro Ser Leu Met Thr Thr Phe Thr Phe Gly Lys Tyr Arg Gly 1055 1060 1065 Lys Ala Val Ser Asp Val Ala Glu Arg Asp Pro Gly Tyr Leu Arg 1070 1075 1080 Trp Leu Phe Asn Asn Leu Asp Ser Met Ser Pro Glu Leu Arg Leu 1085 1090 1095 Thr Leu Lys His Tyr Leu Glu Asn Thr 1100 1105 <210> 47 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-T5FEN DNA construct <400> 47 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcagtaag agctggggga agttcataga ggaggaggaa 2700 gctgaaatgg caagcagacg caatttgatg attgtggacg gcactaatct tggtttcagg 2760 ttcaaacata acaatagtaa gaagccattt gccagcagct atgtttctac gatacaatca 2820 ctggctaaaa gttacagtgc gaggactaca atagtccttg gcgacaaagg caaatcagtg 2880 ttcaggctcg aacatctccc tgaatacaag ggcaaccgcg atgagaagta tgcacagcga 2940 acggaagaag agaaagccct ggacgagcaa ttctttgaat atctcaaaga tgcctttgaa 3000 ctgtgcaaaa ctacatttcc aacctttacc atccggggag ttgaggcaga tgacatggca 3060 gcctacattg taaaactgat agggcacctc tacgaccatg tttggctcat atccactgac 3120 ggagactggg acactttgtt gaccgataaa gtgtcaaggt tctcattcac tactcgtcgg 3180 gaatatcatt tgcgcgatat gtatgaacac cataacgtcg atgacgtgga acaattcatc 3240 tctcttaaag caatcatggg cgatctgggg gacaacatta ggggggttga ggggatcgga 3300 gcgaaaaggg gatacaatat catacgggaa tttggcaacg tccttgacat catcgaccag 3360 ctccccttgc ccggaaagca gaagtacatt caaaacctca acgcttcaga agaactgctc 3420 tttaggaact tgatactggt agacctccca acttactgcg tggatgcaat cgcggcggta 3480 ggacaggacg tgcttgacaa attcacgaag gacatactgg agattgccga acagtga 3537 <210> 48 <211> 3537 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-T5FEN RNA construct <400> 48 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcaguaag agcuggggga aguucauaga ggaggaggaa 2700 gcugaaaugg caagcagacg caauuugaug auuguggacg gcacuaaucu ugguuucagg 2760 uucaaacaua acaauaguaa gaagccauuu gccagcagcu auguuucuac gauacaauca 2820 cuggcuaaaa guuacagugc gaggacuaca auaguccuug gcgacaaagg caaaucagug 2880 uucaggcucg aacaucuccc ugaauacaag ggcaaccgcg augagaagua ugcacagcga 2940 acggaagaag agaaagcccu ggacgagcaa uucuuugaau aucucaaaga ugccuuugaa 3000 cugugcaaaa cuacauuucc aaccuuuacc auccggggag uugaggcaga ugacauggca 3060 gccuacauug uaaaacugau agggcaccuc uacgaccaug uuuggcucau auccacugac 3120 ggagacuggg acacuuuguu gaccgauaaa gugucaaggu ucucauucac uacucgucgg 3180 gaauaucauu ugcgcgauau guaugaacac cauaacgucg augacgugga acaauucauc 3240 ucucuuaaag caaucauggg cgaucugggg gacaacauua gggggguuga ggggaucgga 3300 gcgaaaaggg gauacaauau cauacgggaa uuuggcaacg uccuugacau caucgaccag 3360 cuccccuugc ccggaaagca gaaguacauu caaaaccuca acgcuucaga agaacugcuc 3420 uuuaggaacu ugauacuggu agaccuccca acuuacugcg uggaugcaau cgcggcggua 3480 ggacaggacg ugcuugacaa auucacgaag gacauacugg agauugccga acaguga 3537 <210> 49 <211> 1178 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-T5FEN protein construct <400> 49 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Ser Lys Ser Trp Gly Lys Phe Ile 885 890 895 Glu Glu Glu Glu Ala Glu Met Ala Ser Arg Arg Asn Leu Met Ile Val 900 905 910 Asp Gly Thr Asn Leu Gly Phe Arg Phe Lys His Asn Asn Ser Lys Lys 915 920 925 Pro Phe Ala Ser Ser Tyr Val Ser Thr Ile Gln Ser Leu Ala Lys Ser 930 935 940 Tyr Ser Ala Arg Thr Thr Ile Val Leu Gly Asp Lys Gly Lys Ser Val 945 950 955 960 Phe Arg Leu Glu His Leu Pro Glu Tyr Lys Gly Asn Arg Asp Glu Lys 965 970 975 Tyr Ala Gln Arg Thr Glu Glu Glu Lys Ala Leu Asp Glu Gln Phe Phe 980 985 990 Glu Tyr Leu Lys Asp Ala Phe Glu Leu Cys Lys Thr Thr Phe Pro Thr 995 1000 1005 Phe Thr Ile Arg Gly Val Glu Ala Asp Asp Met Ala Ala Tyr Ile 1010 1015 1020 Val Lys Leu Ile Gly His Leu Tyr Asp His Val Trp Leu Ile Ser 1025 1030 1035 Thr Asp Gly Asp Trp Asp Thr Leu Leu Thr Asp Lys Val Ser Arg 1040 1045 1050 Phe Ser Phe Thr Thr Arg Arg Glu Tyr His Leu Arg Asp Met Tyr 1055 1060 1065 Glu His His Asn Val Asp Asp Val Glu Gln Phe Ile Ser Leu Lys 1070 1075 1080 Ala Ile Met Gly Asp Leu Gly Asp Asn Ile Arg Gly Val Glu Gly 1085 1090 1095 Ile Gly Ala Lys Arg Gly Tyr Asn Ile Ile Arg Glu Phe Gly Asn 1100 1105 1110 Val Leu Asp Ile Ile Asp Gln Leu Pro Leu Pro Gly Lys Gln Lys 1115 1120 1125 Tyr Ile Gln Asn Leu Asn Ala Ser Glu Glu Leu Leu Phe Arg Asn 1130 1135 1140 Leu Ile Leu Val Asp Leu Pro Thr Tyr Cys Val Asp Ala Ile Ala 1145 1150 1155 Ala Val Gly Gln Asp Val Leu Asp Lys Phe Thr Lys Asp Ile Leu 1160 1165 1170 Glu Ile Ala Glu Gln 1175 <210> 50 <211> 3342 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-lambdaExo DNA construct <400> 50 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcactccc gacatcatac tgcaacgaac cggaattgac 2700 gttcgagcgg tcgagcaagg ggatgatgcc tggcataagt tgagacttgg tgtgataact 2760 gcatcagagg tacataatgt cattgcgaag ccccggagcg ggaaaaagtg gcccgacatg 2820 aagatgtcat actttcatac actgctggcc gaggtctgca cgggtgttgc tcccgaggtt 2880 aatgccaaag cacttgcatg gggtaaacag tacgaaaacg acgctcggac cctctttgag 2940 ttcacatctg gtgtgaatgt gacagagagc ccaatcattt accgagacga gagcatgaga 3000 acggcttgca gtcctgatgg cctgtgcagc gacggtaacg gactggagct aaagtgcccg 3060 tttactagcc gagactttat gaagtttagg ctcggtgggt ttgaggccat caagagtgct 3120 tacatggcgc aagtacagta ttccatgtgg gtcactcgca aaaacgcttg gtactttgct 3180 aactatgatc cccgaatgaa gagggagggc ctgcattatg tggtcataga acgggacgaa 3240 aagtatatgg cgagcttcga cgaaattgta ccggagttca tagagaagat ggatgaagca 3300 ctcgccgaga ttgggttcgt ctttggggaa caatggaggt ga 3342 <210> 51 <211> 3342 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-lambdaExo RNA construct <400> 51 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcacuccc gacaucauac ugcaacgaac cggaauugac 2700 guucgagcgg ucgagcaagg ggaugaugcc uggcauaagu ugagacuugg ugugauaacu 2760 gcaucagagg uacauaaugu cauugcgaag ccccggagcg ggaaaaagug gcccgacaug 2820 aagaugucau acuuucauac acugcuggcc gaggucugca cggguguugc ucccgagguu 2880 aaugccaaag cacuugcaug ggguaaacag uacgaaaacg acgcucggac ccucuuugag 2940 uucacaucug gugugaaugu gacagagagc ccaaucauuu accgagacga gagcaugaga 3000 acggcuugca guccugaugg ccugugcagc gacgguaacg gacuggagcu aaagugcccg 3060 uuuacuagcc gagacuuuau gaaguuuagg cucggugggu uugaggccau caagagugcu 3120 uacauggcgc aaguacagua uuccaugugg gucacucgca aaaacgcuug guacuuugcu 3180 aacuaugauc cccgaaugaa gagggagggc cugcauuaug uggucauaga acgggacgaa 3240 aaguauaugg cgagcuucga cgaaauugua ccggaguuca uagagaagau ggaugaagca 3300 cucgccgaga uuggguucgu cuuuggggaa caauggaggu ga 3342 <210> 52 <211> 1113 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-lambdaExo protein construct <400> 52 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Thr Pro Asp Ile Ile Leu Gln Arg 885 890 895 Thr Gly Ile Asp Val Arg Ala Val Glu Gln Gly Asp Asp Ala Trp His 900 905 910 Lys Leu Arg Leu Gly Val Ile Thr Ala Ser Glu Val His Asn Val Ile 915 920 925 Ala Lys Pro Arg Ser Gly Lys Lys Trp Pro Asp Met Lys Met Ser Tyr 930 935 940 Phe His Thr Leu Leu Ala Glu Val Cys Thr Gly Val Ala Pro Glu Val 945 950 955 960 Asn Ala Lys Ala Leu Ala Trp Gly Lys Gln Tyr Glu Asn Asp Ala Arg 965 970 975 Thr Leu Phe Glu Phe Thr Ser Gly Val Asn Val Thr Glu Ser Pro Ile 980 985 990 Ile Tyr Arg Asp Glu Ser Met Arg Thr Ala Cys Ser Pro Asp Gly Leu 995 1000 1005 Cys Ser Asp Gly Asn Gly Leu Glu Leu Lys Cys Pro Phe Thr Ser 1010 1015 1020 Arg Asp Phe Met Lys Phe Arg Leu Gly Gly Phe Glu Ala Ile Lys 1025 1030 1035 Ser Ala Tyr Met Ala Gln Val Gln Tyr Ser Met Trp Val Thr Arg 1040 1045 1050 Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp Pro Arg Met Lys Arg 1055 1060 1065 Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp Glu Lys Tyr Met 1070 1075 1080 Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu Lys Met Asp 1085 1090 1095 Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln Trp Arg 1100 1105 1110 <210> 53 <211> 4398 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-RecJ DNA construct <400> 53 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaacctg accccggacc aagtggtggc tatcgccagc 480 aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag 540 gaccatggcc tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa 600 gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg 660 gaccaagtgg tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aacggtgcag 720 cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc 780 gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg 840 tgccaggacc atggcctgac tccggaccaa gtggtggcta tcgccagcca cgatggcggc 900 aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg 960 actccggacc aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg 1020 gtgcagcggc tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg 1080 gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg 1140 gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacaat 1200 ggcggcaagc aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat 1260 ggcctgaccc cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc 1320 gaaacggtgc agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa 1380 gtggtggcta tcgccagcaa caatggcggc aagcaagcgc tcgaaacggt gcagcggctg 1440 ttgccggtgc tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc 1500 aacattggcg gcaagcaagc gctcgaaagc attgtggccc agctgagccg gcctgatccg 1560 gcgttggccg cgttgaccaa cgaccacctc gtcgccttgg cctgcctcgg cggacgtcct 1620 gccatggatg cagtgaaaaa gggattgccg cacgcgccgg aattgatcag aagagtcaat 1680 cgccgtattg gcgaacgcac gtcccatcgc gttgcgatat ctagagtggg aggaagctct 1740 cgcagagagt ccatcaaccc atggattctg actggtttcg ctgatgccga aggatcattc 1800 atactagaca tccgcaaccg aaacaacgaa agcaacagat accgaacttc gctgagattc 1860 cagatcaccc tgcacaacaa ggacaaatcg attctggaga atatccagtc cacttggaag 1920 gtcggcaaga tcacaaacag cagtgacaga gccgtcatgc tgagggtcac ccgtttcgaa 1980 gatttgaaag tgattatcga ccacttcgag aaatatccgc tgattaccca gaaattgggc 2040 gattacaagt tgtttaaaca ggcattcagc gtcatggaga ataaagaaca tcttaaggag 2100 aatgggatta aggagctcgt acgaatcaaa gctaagatga attggggtct caatgacgaa 2160 ttgaaaaaag catttccaga gaacattagc aaagagcgcc cccttatcaa taagaacatt 2220 ccgaatttca aatggctggc tggattcaca gctggtgaag gctacttcgg cgtgaatcta 2280 aaaaaggtaa agggcaccgc aaaggtatac gtgggactga gattctcaat ctcacagcac 2340 atcagagaca agaacctgat gaattcattg ataacatacc taggctgtgg ttccatctgg 2400 gagaagaaca agtctgagtt cagatggctc gagttcgtcg taaccaaatt cagcgatatc 2460 aacgacaaga tcattccggt attccaggaa aatactctga ttggcgtcaa actcgaggac 2520 tttgaagatt ggtgcaaggt tgccaaattg atcaaagaga agaaacacct gaccgaatcc 2580 ggtttggatg agattaagaa aatcaagctg aacatgaaca aaggtcgtgg tggaggcggt 2640 agcggaggcg gagggtcggc tagcaagcaa caaatccatt tgagacgaag ggaggttgac 2700 gagactgctg atctcccggc tgcggagttg cctccgctat tgcgtcgcct gtacgcctct 2760 cggggtgtac gctccgctca agaactggaa cgatcagtaa agggtatgct gccctggcaa 2820 cagctttccg gggtggagaa ggccgtggag atactataca atgcgttccg agaagggacg 2880 agaatcatag tagttgggga ctttgatgcg gatggcgcga cttccactgc cctgtctgtg 2940 ctggcgatgc ggagtcttgg gtgttccaac atagactacc tcgttccaaa tcggtttgaa 3000 gatggatacg gcctttcacc cgaagttgtg gaccaagccc acgcgagggg agcccaactt 3060 atagtgacag tggataacgg aattagctca catgcaggag tagagcacgc aaggtcactg 3120 ggtatccccg tgattgtcac cgaccatcac ctcccaggag acactttgcc tgctgctgag 3180 gccatcatta accctaatct tagggactgc aactttccta gtaagagtct ggctggggtt 3240 ggagtcgcat tctaccttat gctggccctc cgcacttttc tccgagatca aggctggttt 3300 gatgaacgaa acattgctat cccaaatctt gcagaactcc ttgaccttgt ggctttggga 3360 acagtcgccg atgtcgtgcc gctggacgct aacaatcgga tattgacttg gcaggggatg 3420 tcacgcatcc gtgcgggcaa gtgcaggcca ggtatcaagg cattgttgga agtcgccaac 3480 cgggacgcac aaaaacttgc cgcaagcgac ctcggttttg cacttggtcc tcgccttaac 3540 gcagcgggta gattggatga tatgtccgtg ggcgtggcgc tcttgttgtg cgacaacata 3600 ggtgaagcga gagttcttgc aaatgagttg gacgcgctca atcagactag gaaagagata 3660 gaacaaggaa tgcagatcga ggcactgacc ctttgtgaaa agctggagcg atcacgggat 3720 accttgcctg gaggtctcgc aatgtaccat cctgagtggc atcagggcgt cgtaggtatc 3780 ttggcgtcta ggatcaaaga gaggttccat cgcccagtga ttgcatttgc gccagcaggt 3840 gatggcactc tgaaaggatc tggccgctcc atccaaggtc tccacatgag agatgcactt 3900 gagaggttgg acacacttta cccaggcatg atgttgaaat tcggtgggca cgctatggct 3960 gctggtttga gcttggaaga agataagttc aaactgttcc aacagaggtt cggcgaactg 4020 gtaactgagt ggcttgatcc ttcattgctc caaggtgagg tggtatcaga tgggccactc 4080 agcccagccg aaatgactat ggaagtagcc cagctcctca gagatgcagg tccttggggt 4140 caaatgttcc ccgagccctt gttcgacggg catttcaggt tgctccagca gaggttggta 4200 ggcgagcgcc acctcaaagt gatggtcgaa cctgtaggtg gaggtccgct tctggacgga 4260 attgctttca acgtagacac ggcgctgtgg cccgacaatg gcgttaggga ggtacaactt 4320 gcctacaaac tcgacatcaa cgagtttaga ggtaacagaa gcctccagat catcattgac 4380 aatatctggc ccatttga 4398 <210> 54 <211> 4398 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-RecJ RNA construct <400> 54 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccug accccggacc aagugguggc uaucgccagc 480 aacauuggcg gcaagcaagc gcucgaaacg gugcagcggc uguugccggu gcugugccag 540 gaccauggcc ugaccccgga ccaaguggug gcuaucgcca gcaacauugg cggcaagcaa 600 gcgcucgaaa cggugcagcg gcuguugccg gugcugugcc aggaccaugg ccugaccccg 660 gaccaagugg uggcuaucgc cagcaacauu ggcggcaagc aagcgcucga aacggugcag 720 cggcuguugc cggugcugug ccaggaccau ggccugaccc cggaccaagu gguggcuauc 780 gccagcaacg guggcggcaa gcaagcgcuc gaaacggugc agcggcuguu gccggugcug 840 ugccaggacc auggccugac uccggaccaa gugguggcua ucgccagcca cgauggcggc 900 aagcaagcgc ucgaaacggu gcagcggcug uugccggugc ugugccagga ccauggccug 960 acuccggacc aagugguggc uaucgccagc cacgauggcg gcaagcaagc gcucgaaacg 1020 gugcagcggc uguugccggu gcugugccag gaccauggcc ugaccccgga ccaaguggug 1080 gcuaucgcca gcaacauugg cggcaagcaa gcgcucgaaa cggugcagcg gcuguugccg 1140 gugcugugcc aggaccaugg ccugaccccg gaccaagugg uggcuaucgc cagcaacaau 1200 ggcggcaagc aagcgcucga aacggugcag cggcuguugc cggugcugug ccaggaccau 1260 ggccugaccc cggaccaagu gguggcuauc gccagcaacg guggcggcaa gcaagcgcuc 1320 gaaacggugc agcggcuguu gccggugcug ugccaggacc auggccugac cccggaccaa 1380 gugguggcua ucgccagcaa caauggcggc aagcaagcgc ucgaaacggu gcagcggcug 1440 uugccggugc ugugccagga ccauggccug accccggacc aagugguggc uaucgccagc 1500 aacauuggcg gcaagcaagc gcucgaaagc auuguggccc agcugagccg gccugauccg 1560 gcguuggccg cguugaccaa cgaccaccuc gucgccuugg ccugccucgg cggacguccu 1620 gccauggaug cagugaaaaa gggauugccg cacgcgccgg aauugaucag aagagucaau 1680 cgccguauug gcgaacgcac gucccaucgc guugcgauau cuagaguggg aggaagcucu 1740 cgcagagagu ccaucaaccc auggauucug acugguuucg cugaugccga aggaucauuc 1800 auacuagaca uccgcaaccg aaacaacgaa agcaacagau accgaacuuc gcugagauuc 1860 cagaucaccc ugcacaacaa ggacaaaucg auucuggaga auauccaguc cacuuggaag 1920 gucggcaaga ucacaaacag cagugacaga gccgucaugc ugagggucac ccguuucgaa 1980 gauuugaaag ugauuaucga ccacuucgag aaauauccgc ugauuaccca gaaauugggc 2040 gauuacaagu uguuuaaaca ggcauucagc gucauggaga auaaagaaca ucuuaaggag 2100 aaugggauua aggagcucgu acgaaucaaa gcuaagauga auuggggucu caaugacgaa 2160 uugaaaaaag cauuuccaga gaacauuagc aaagagcgcc cccuuaucaa uaagaacauu 2220 ccgaauuuca aauggcuggc uggauucaca gcuggugaag gcuacuucgg cgugaaucua 2280 aaaaagguaa agggcaccgc aaagguauac gugggacuga gauucucaau cucacagcac 2340 aucagagaca agaaccugau gaauucauug auaacauacc uaggcugugg uuccaucugg 2400 gagaagaaca agucugaguu cagauggcuc gaguucgucg uaaccaaauu cagcgauauc 2460 aacgacaaga ucauuccggu auuccaggaa aauacucuga uuggcgucaa acucgaggac 2520 uuugaagauu ggugcaaggu ugccaaauug aucaaagaga agaaacaccu gaccgaaucc 2580 gguuuggaug agauuaagaa aaucaagcug aacaugaaca aaggucgugg uggaggcggu 2640 agcggaggcg gagggucggc uagcaagcaa caaauccauu ugagacgaag ggagguugac 2700 gagacugcug aucucccggc ugcggaguug ccuccgcuau ugcgucgccu guacgccucu 2760 cgggguguac gcuccgcuca agaacuggaa cgaucaguaa aggguaugcu gcccuggcaa 2820 cagcuuuccg ggguggagaa ggccguggag auacuauaca augcguuccg agaagggacg 2880 agaaucauag uaguugggga cuuugaugcg gauggcgcga cuuccacugc ccugucugug 2940 cuggcgaugc ggagucuugg guguuccaac auagacuacc ucguuccaaa ucgguuugaa 3000 gauggauacg gccuuucacc cgaaguugug gaccaagccc acgcgagggg agcccaacuu 3060 auagugacag uggauaacgg aauuagcuca caugcaggag uagagcacgc aaggucacug 3120 gguauccccg ugauugucac cgaccaucac cucccaggag acacuuugcc ugcugcugag 3180 gccaucauua acccuaaucu uagggacugc aacuuuccua guaagagucu ggcugggguu 3240 ggagucgcau ucuaccuuau gcuggcccuc cgcacuuuuc uccgagauca aggcugguuu 3300 gaugaacgaa acauugcuau cccaaaucuu gcagaacucc uugaccuugu ggcuuuggga 3360 acagucgccg augucgugcc gcuggacgcu aacaaucgga uauugacuug gcaggggaug 3420 ucacgcaucc gugcgggcaa gugcaggcca gguaucaagg cauuguugga agucgccaac 3480 cgggacgcac aaaaacuugc cgcaagcgac cucgguuuug cacuuggucc ucgccuuaac 3540 gcagcgggua gauuggauga uauguccgug ggcguggcgc ucuuguugug cgacaacaua 3600 ggugaagcga gaguucuugc aaaugaguug gacgcgcuca aucagacuag gaaagagaua 3660 gaacaaggaa ugcagaucga ggcacugacc cuuugugaaa agcuggagcg aucacgggau 3720 accuugccug gaggucucgc aauguaccau ccugaguggc aucagggcgu cguagguauc 3780 uuggcgucua ggaucaaaga gagguuccau cgcccaguga uugcauuugc gccagcaggu 3840 gauggcacuc ugaaaggauc uggccgcucc auccaagguc uccacaugag agaugcacuu 3900 gagagguugg acacacuuua cccaggcaug auguugaaau ucggugggca cgcuauggcu 3960 gcugguuuga gcuuggaaga agauaaguuc aaacuguucc aacagagguu cggcgaacug 4020 guaacugagu ggcuugaucc uucauugcuc caaggugagg ugguaucaga ugggccacuc 4080 agcccagccg aaaugacuau ggaaguagcc cagcuccuca gagaugcagg uccuuggggu 4140 caaauguucc ccgagcccuu guucgacggg cauuucaggu ugcuccagca gagguuggua 4200 ggcgagcgcc accucaaagu gauggucgaa ccuguaggug gagguccgcu ucuggacgga 4260 auugcuuuca acguagacac ggcgcugugg cccgacaaug gcguuaggga gguacaacuu 4320 gccuacaaac ucgacaucaa cgaguuuaga gguaacagaa gccuccagau caucauugac 4380 aauaucuggc ccauuuga 4398 <210> 55 <211> 1465 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity TCRalpha megaTAL-RecJ protein construct <400> 55 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val 500 505 510 Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp 515 520 525 His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala 530 535 540 Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn 545 550 555 560 Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val 565 570 575 Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly 580 585 590 Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg Asn 595 600 605 Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr Leu 610 615 620 His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys 625 630 635 640 Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg Val 645 650 655 Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr 660 665 670 Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala 675 680 685 Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys 690 695 700 Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu 705 710 715 720 Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile 725 730 735 Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala Gly 740 745 750 Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala Lys 755 760 765 Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp Lys 770 775 780 Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile Trp 785 790 795 800 Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr Lys 805 810 815 Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr 820 825 830 Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala 835 840 845 Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu 850 855 860 Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly Gly Gly 865 870 875 880 Ser Gly Gly Gly Gly Ser Ala Ser Lys Gln Gln Ile His Leu Arg Arg 885 890 895 Arg Glu Val Asp Glu Thr Ala Asp Leu Pro Ala Ala Glu Leu Pro Pro 900 905 910 Leu Leu Arg Arg Leu Tyr Ala Ser Arg Gly Val Arg Ser Ala Gln Glu 915 920 925 Leu Glu Arg Ser Val Lys Gly Met Leu Pro Trp Gln Gln Leu Ser Gly 930 935 940 Val Glu Lys Ala Val Glu Ile Leu Tyr Asn Ala Phe Arg Glu Gly Thr 945 950 955 960 Arg Ile Ile Val Val Gly Asp Phe Asp Ala Asp Gly Ala Thr Ser Thr 965 970 975 Ala Leu Ser Val Leu Ala Met Arg Ser Leu Gly Cys Ser Asn Ile Asp 980 985 990 Tyr Leu Val Pro Asn Arg Phe Glu Asp Gly Tyr Gly Leu Ser Pro Glu 995 1000 1005 Val Val Asp Gln Ala His Ala Arg Gly Ala Gln Leu Ile Val Thr 1010 1015 1020 Val Asp Asn Gly Ile Ser Ser His Ala Gly Val Glu His Ala Arg 1025 1030 1035 Ser Leu Gly Ile Pro Val Ile Val Thr Asp His His Leu Pro Gly 1040 1045 1050 Asp Thr Leu Pro Ala Ala Glu Ala Ile Ile Asn Pro Asn Leu Arg 1055 1060 1065 Asp Cys Asn Phe Pro Ser Lys Ser Leu Ala Gly Val Gly Val Ala 1070 1075 1080 Phe Tyr Leu Met Leu Ala Leu Arg Thr Phe Leu Arg Asp Gln Gly 1085 1090 1095 Trp Phe Asp Glu Arg Asn Ile Ala Ile Pro Asn Leu Ala Glu Leu 1100 1105 1110 Leu Asp Leu Val Ala Leu Gly Thr Val Ala Asp Val Val Pro Leu 1115 1120 1125 Asp Ala Asn Asn Arg Ile Leu Thr Trp Gln Gly Met Ser Arg Ile 1130 1135 1140 Arg Ala Gly Lys Cys Arg Pro Gly Ile Lys Ala Leu Leu Glu Val 1145 1150 1155 Ala Asn Arg Asp Ala Gln Lys Leu Ala Ala Ser Asp Leu Gly Phe 1160 1165 1170 Ala Leu Gly Pro Arg Leu Asn Ala Ala Gly Arg Leu Asp Asp Met 1175 1180 1185 Ser Val Gly Val Ala Leu Leu Leu Cys Asp Asn Ile Gly Glu Ala 1190 1195 1200 Arg Val Leu Ala Asn Glu Leu Asp Ala Leu Asn Gln Thr Arg Lys 1205 1210 1215 Glu Ile Glu Gln Gly Met Gln Ile Glu Ala Leu Thr Leu Cys Glu 1220 1225 1230 Lys Leu Glu Arg Ser Arg Asp Thr Leu Pro Gly Gly Leu Ala Met 1235 1240 1245 Tyr His Pro Glu Trp His Gln Gly Val Val Gly Ile Leu Ala Ser 1250 1255 1260 Arg Ile Lys Glu Arg Phe His Arg Pro Val Ile Ala Phe Ala Pro 1265 1270 1275 Ala Gly Asp Gly Thr Leu Lys Gly Ser Gly Arg Ser Ile Gln Gly 1280 1285 1290 Leu His Met Arg Asp Ala Leu Glu Arg Leu Asp Thr Leu Tyr Pro 1295 1300 1305 Gly Met Met Leu Lys Phe Gly Gly His Ala Met Ala Ala Gly Leu 1310 1315 1320 Ser Leu Glu Glu Asp Lys Phe Lys Leu Phe Gln Gln Arg Phe Gly 1325 1330 1335 Glu Leu Val Thr Glu Trp Leu Asp Pro Ser Leu Leu Gln Gly Glu 1340 1345 1350 Val Val Ser Asp Gly Pro Leu Ser Pro Ala Glu Met Thr Met Glu 1355 1360 1365 Val Ala Gln Leu Leu Arg Asp Ala Gly Pro Trp Gly Gln Met Phe 1370 1375 1380 Pro Glu Pro Leu Phe Asp Gly His Phe Arg Leu Leu Gln Gln Arg 1385 1390 1395 Leu Val Gly Glu Arg His Leu Lys Val Met Val Glu Pro Val Gly 1400 1405 1410 Gly Gly Pro Leu Leu Asp Gly Ile Ala Phe Asn Val Asp Thr Ala 1415 1420 1425 Leu Trp Pro Asp Asn Gly Val Arg Glu Val Gln Leu Ala Tyr Lys 1430 1435 1440 Leu Asp Ile Asn Glu Phe Arg Gly Asn Arg Ser Leu Gln Ile Ile 1445 1450 1455 Ile Asp Asn Ile Trp Pro Ile 1460 1465 <210> 56 <211> 2733 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL DNA construct <400> 56 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaactta acacccgatc aagtggtagc gatagcgtca 480 aacggcgggg gtaaacaggc tttggagacg gtacagcggt tattgccggt actctgccag 540 gaccacggat tgacaccgga ccaagtggtg gcgattgcgt ccaacaacgg aggcaagcag 600 gcactagaga ctgtccaacg gcttcttccc gttctttgtc aggatcatgg gctaacccct 660 gatcaggtag tcgctatagc ttcaaatgga gggggcaagc aagcactgga gactgttcaa 720 cgactcctgc cagtgctctg ccaagaccac ggacttacac cagatcaagt ggttgctatt 780 gcctccaatg gtggcgggaa acaagcgttg gaaactgtgc agagactgtt acctgtcttg 840 tgtcaagacc acggcctcac gccagatcag gtggtagcca tagcgtcgaa cattggtggt 900 aagcaagccc ttgaaacggt ccagcgtctt ctgccggtgt tgtgccagga ccacggacta 960 acgccggatc aggtcgtagc cattgcttca aatgggggcg gcaaacaggc gctagagaca 1020 gtccagcgcc tcttgcctgt gttatgccag gatcacggct taaccccaga ccaagttgtg 1080 gctattgcat ctaacaatgg tggcaaacaa gccttggaga cagtgcaacg attactgcct 1140 gtcttatgtc aggatcatgg cctgacgccc gatcaggtag tggcaatcgc atctaacatt 1200 ggaggtaagc aagcactgga gactgtccag agattgttac ccgtactatg tcaagatcat 1260 ggtttgacgc ctgatcaggt tgttgcgata gccagcaata acggagggaa acaggctctt 1320 gaaaccgtac agcgacttct cccagtcttg tgccaagatc acgggcttac tcctgatcaa 1380 gtcgtagcta tcgccagcaa taacggtgga aaacaggccc tggaaaccgt acaacgtctc 1440 ctcccagtac tttgtcaaga ccacgggttg actccggatc aagtcgtcgc gatcgcgagc 1500 aatggtgggg ggaagcaggc gctggaaact gttcagagac tgctgcctgt actttgtcag 1560 gaccatggtc tgacacctga ccaagttgtg gcgatagcca gtaatatcgg gggaaaacag 1620 gcactagaga gcattgtggc ccagctgagc cggcctgatc cggcgttggc cgcgttgacc 1680 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgccatgga tgcagtgaaa 1740 aagggattgc cgcacgcgcc ggaattgatc agaagagtca atcgccgtat tggcgaacgc 1800 acgtcccatc gcgttgcgat atctagagtg ggaggaagct cgcgcagaga gtccatcaac 1860 ccatggattc tgactggttt cgctgatgcc gaaggatgct tccgactaga catccgcaac 1920 gcaaacgatt taagagccgg atacagaact agactggcct tcgaaatcgt actgcacaac 1980 aaggacaaat cgattctgga gaatatccag tcgacttgga aggtcggcac aatctacaac 2040 gcgggcgaca acgcagtcag actgcaagtc acacgtttcg aagatttgaa agtgattatc 2100 gaccacttcg agaaatatcc gctgataaca cagaaattgg gcgattacaa gttgtttaaa 2160 caggcattca gcgtcatgga gaacaaagaa catcttaagg agaatgggat taaggagctc 2220 gtacgaatca aagctaagat gaattggggt ctcaatgacg aattgaaaaa agcatttcca 2280 gagaacatta gcaaagagcg ctcccttatc aataagaaca ttccgaatct caaatggctg 2340 gctggattca catctggtga cggctcgttc gtggtggaac taaagaagag aagaagcccc 2400 gtcaaggtag gagtgcggct gcgattcagc atcacccagc acatcagaga caagaacctg 2460 atgaattcat tgataacata cctaggctgt ggtcgtatcg ttgagaataa caaatctgag 2520 cacagttggc tcgaattcat tgtaacaaaa ttcagcgata tcaacgacaa gatcattccg 2580 gtattccagg aaaatactct gattggcgtc aaactcgagg actttgaaga ttggtgcaag 2640 gttgccaaat tgatcgaaga gaagaaacac ctgaccgaat ccggtttgga tgagattaag 2700 aaaatcaagc tgaacatgaa caaaggtcgt tga 2733 <210> 57 <211> 2733 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL RNA construct <400> 57 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaacuua acacccgauc aagugguagc gauagcguca 480 aacggcgggg guaaacaggc uuuggagacg guacagcggu uauugccggu acucugccag 540 gaccacggau ugacaccgga ccaaguggug gcgauugcgu ccaacaacgg aggcaagcag 600 gcacuagaga cuguccaacg gcuucuuccc guucuuuguc aggaucaugg gcuaaccccu 660 gaucagguag ucgcuauagc uucaaaugga gggggcaagc aagcacugga gacuguucaa 720 cgacuccugc cagugcucug ccaagaccac ggacuuacac cagaucaagu gguugcuauu 780 gccuccaaug guggcgggaa acaagcguug gaaacugugc agagacuguu accugucuug 840 ugucaagacc acggccucac gccagaucag gugguagcca uagcgucgaa cauugguggu 900 aagcaagccc uugaaacggu ccagcgucuu cugccggugu ugugccagga ccacggacua 960 acgccggauc aggucguagc cauugcuuca aaugggggcg gcaaacaggc gcuagagaca 1020 guccagcgcc ucuugccugu guuaugccag gaucacggcu uaaccccaga ccaaguugug 1080 gcuauugcau cuaacaaugg uggcaaacaa gccuuggaga cagugcaacg auuacugccu 1140 gucuuauguc aggaucaugg ccugacgccc gaucagguag uggcaaucgc aucuaacauu 1200 ggagguaagc aagcacugga gacuguccag agauuguuac ccguacuaug ucaagaucau 1260 gguuugacgc cugaucaggu uguugcgaua gccagcaaua acggagggaa acaggcucuu 1320 gaaaccguac agcgacuucu cccagucuug ugccaagauc acgggcuuac uccugaucaa 1380 gucguagcua ucgccagcaa uaacggugga aaacaggccc uggaaaccgu acaacgucuc 1440 cucccaguac uuugucaaga ccacggguug acuccggauc aagucgucgc gaucgcgagc 1500 aauggugggg ggaagcaggc gcuggaaacu guucagagac ugcugccugu acuuugucag 1560 gaccaugguc ugacaccuga ccaaguugug gcgauagcca guaauaucgg gggaaaacag 1620 gcacuagaga gcauuguggc ccagcugagc cggccugauc cggcguuggc cgcguugacc 1680 aacgaccacc ucgucgccuu ggccugccuc ggcggacguc cugccaugga ugcagugaaa 1740 aagggauugc cgcacgcgcc ggaauugauc agaagaguca aucgccguau uggcgaacgc 1800 acgucccauc gcguugcgau aucuagagug ggaggaagcu cgcgcagaga guccaucaac 1860 ccauggauuc ugacugguuu cgcugaugcc gaaggaugcu uccgacuaga cauccgcaac 1920 gcaaacgauu uaagagccgg auacagaacu agacuggccu ucgaaaucgu acugcacaac 1980 aaggacaaau cgauucugga gaauauccag ucgacuugga aggucggcac aaucuacaac 2040 gcgggcgaca acgcagucag acugcaaguc acacguuucg aagauuugaa agugauuauc 2100 gaccacuucg agaaauaucc gcugauaaca cagaaauugg gcgauuacaa guuguuuaaa 2160 caggcauuca gcgucaugga gaacaaagaa caucuuaagg agaaugggau uaaggagcuc 2220 guacgaauca aagcuaagau gaauuggggu cucaaugacg aauugaaaaa agcauuucca 2280 gagaacauua gcaaagagcg cucccuuauc aauaagaaca uuccgaaucu caaauggcug 2340 gcuggauuca caucugguga cggcucguuc gugguggaac uaaagaagag aagaagcccc 2400 gucaagguag gagugcggcu gcgauucagc aucacccagc acaucagaga caagaaccug 2460 augaauucau ugauaacaua ccuaggcugu ggucguaucg uugagaauaa caaaucugag 2520 cacaguuggc ucgaauucau uguaacaaaa uucagcgaua ucaacgacaa gaucauuccg 2580 guauuccagg aaaauacucu gauuggcguc aaacucgagg acuuugaaga uuggugcaag 2640 guugccaaau ugaucgaaga gaagaaacac cugaccgaau ccgguuugga ugagauuaag 2700 aaaaucaagc ugaacaugaa caaaggucgu uga 2733 <210> 58 <211> 910 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL protein construct <400> 58 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser 530 535 540 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 545 550 555 560 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 565 570 575 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 580 585 590 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser 595 600 605 Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu 610 615 620 Thr Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn 625 630 635 640 Ala Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile 645 650 655 Val Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr 660 665 670 Trp Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu 675 680 685 Gln Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu 690 695 700 Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys 705 710 715 720 Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly 725 730 735 Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn 740 745 750 Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser 755 760 765 Leu Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr 770 775 780 Ser Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro 785 790 795 800 Val Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg 805 810 815 Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg 820 825 830 Ile Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val 835 840 845 Thr Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu 850 855 860 Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys 865 870 875 880 Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu 885 890 895 Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg 900 905 910 <210> 59 <211> 3474 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL-Trex2 DNA construct <400> 59 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaactta acacccgatc aagtggtagc gatagcgtca 480 aacggcgggg gtaaacaggc tttggagacg gtacagcggt tattgccggt actctgccag 540 gaccacggat tgacaccgga ccaagtggtg gcgattgcgt ccaacaacgg aggcaagcag 600 gcactagaga ctgtccaacg gcttcttccc gttctttgtc aggatcatgg gctaacccct 660 gatcaggtag tcgctatagc ttcaaatgga gggggcaagc aagcactgga gactgttcaa 720 cgactcctgc cagtgctctg ccaagaccac ggacttacac cagatcaagt ggttgctatt 780 gcctccaatg gtggcgggaa acaagcgttg gaaactgtgc agagactgtt acctgtcttg 840 tgtcaagacc acggcctcac gccagatcag gtggtagcca tagcgtcgaa cattggtggt 900 aagcaagccc ttgaaacggt ccagcgtctt ctgccggtgt tgtgccagga ccacggacta 960 acgccggatc aggtcgtagc cattgcttca aatgggggcg gcaaacaggc gctagagaca 1020 gtccagcgcc tcttgcctgt gttatgccag gatcacggct taaccccaga ccaagttgtg 1080 gctattgcat ctaacaatgg tggcaaacaa gccttggaga cagtgcaacg attactgcct 1140 gtcttatgtc aggatcatgg cctgacgccc gatcaggtag tggcaatcgc atctaacatt 1200 ggaggtaagc aagcactgga gactgtccag agattgttac ccgtactatg tcaagatcat 1260 ggtttgacgc ctgatcaggt tgttgcgata gccagcaata acggagggaa acaggctctt 1320 gaaaccgtac agcgacttct cccagtcttg tgccaagatc acgggcttac tcctgatcaa 1380 gtcgtagcta tcgccagcaa taacggtgga aaacaggccc tggaaaccgt acaacgtctc 1440 ctcccagtac tttgtcaaga ccacgggttg actccggatc aagtcgtcgc gatcgcgagc 1500 aatggtgggg ggaagcaggc gctggaaact gttcagagac tgctgcctgt actttgtcag 1560 gaccatggtc tgacacctga ccaagttgtg gcgatagcca gtaatatcgg gggaaaacag 1620 gcactagaga gcattgtggc ccagctgagc cggcctgatc cggcgttggc cgcgttgacc 1680 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgccatgga tgcagtgaaa 1740 aagggattgc cgcacgcgcc ggaattgatc agaagagtca atcgccgtat tggcgaacgc 1800 acgtcccatc gcgttgcgat atctagagtg ggaggaagct cgcgcagaga gtccatcaac 1860 ccatggattc tgactggttt cgctgatgcc gaaggatgct tccgactaga catccgcaac 1920 gcaaacgatt taagagccgg atacagaact agactggcct tcgaaatcgt actgcacaac 1980 aaggacaaat cgattctgga gaatatccag tcgacttgga aggtcggcac aatctacaac 2040 gcgggcgaca acgcagtcag actgcaagtc acacgtttcg aagatttgaa agtgattatc 2100 gaccacttcg agaaatatcc gctgataaca cagaaattgg gcgattacaa gttgtttaaa 2160 caggcattca gcgtcatgga gaacaaagaa catcttaagg agaatgggat taaggagctc 2220 gtacgaatca aagctaagat gaattggggt ctcaatgacg aattgaaaaa agcatttcca 2280 gagaacatta gcaaagagcg ctcccttatc aataagaaca ttccgaatct caaatggctg 2340 gctggattca catctggtga cggctcgttc gtggtggaac taaagaagag aagaagcccc 2400 gtcaaggtag gagtgcggct gcgattcagc atcacccagc acatcagaga caagaacctg 2460 atgaattcat tgataacata cctaggctgt ggtcgtatcg ttgagaataa caaatctgag 2520 cacagttggc tcgaattcat tgtaacaaaa ttcagcgata tcaacgacaa gatcattccg 2580 gtattccagg aaaatactct gattggcgtc aaactcgagg actttgaaga ttggtgcaag 2640 gttgccaaat tgatcgaaga gaagaaacac ctgaccgaat ccggtttgga tgagattaag 2700 aaaatcaagc tgaacatgaa caaaggtcgt ggtggaggcg gtagcggagg cggagggtcg 2760 gctagctccg aagcaccgag agccgaaacc ttcgtgttcc tcgacctgga agccactggc 2820 ctgcccagtg tggagcccga gattgccgag ctgtccctgt tcgccgttca tcggtcctcc 2880 ctggaaaacc ctgagcacga cgagagcgga gcactggtgc tgccaagggt gctggacaag 2940 ctgaccctgt gcatgtgtcc cgagcgtccc ttcactgcca aggcatccga aatcactggt 3000 ctgagttcgg aagggctggc tcgttgtaga aaggctggat tcgatggtgc cgtggttcgg 3060 actttgcagg cattcctgtc caggcaggca ggtccaatct gcttggtcgc ccacaacggt 3120 tttgactacg acttcccact gctctgtgcc gaactgcgtc gcctgggagc acgccttcct 3180 cgggataccg tgtgcctgga caccctaccc gctctgcgtg gactggacag agcccactca 3240 cacggcacta gggcgagagg acgccagggt tacagcctcg gttcactgtt ccatcggtat 3300 ttcagggcag agccttccgc agcccattca gccgaaggcg atgtccacac cttgcttctg 3360 atcttcctgc atcgtgcagc agaactgctc gcctgggcag atgagcaggc tcgtggatgg 3420 gctcacattg agccgatgta cttgccacct gatgacccta gcctggaagc ctga 3474 <210> 60 <211> 3474 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL-Trex2 RNA construct <400> 60 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaacuua acacccgauc aagugguagc gauagcguca 480 aacggcgggg guaaacaggc uuuggagacg guacagcggu uauugccggu acucugccag 540 gaccacggau ugacaccgga ccaaguggug gcgauugcgu ccaacaacgg aggcaagcag 600 gcacuagaga cuguccaacg gcuucuuccc guucuuuguc aggaucaugg gcuaaccccu 660 gaucagguag ucgcuauagc uucaaaugga gggggcaagc aagcacugga gacuguucaa 720 cgacuccugc cagugcucug ccaagaccac ggacuuacac cagaucaagu gguugcuauu 780 gccuccaaug guggcgggaa acaagcguug gaaacugugc agagacuguu accugucuug 840 ugucaagacc acggccucac gccagaucag gugguagcca uagcgucgaa cauugguggu 900 aagcaagccc uugaaacggu ccagcgucuu cugccggugu ugugccagga ccacggacua 960 acgccggauc aggucguagc cauugcuuca aaugggggcg gcaaacaggc gcuagagaca 1020 guccagcgcc ucuugccugu guuaugccag gaucacggcu uaaccccaga ccaaguugug 1080 gcuauugcau cuaacaaugg uggcaaacaa gccuuggaga cagugcaacg auuacugccu 1140 gucuuauguc aggaucaugg ccugacgccc gaucagguag uggcaaucgc aucuaacauu 1200 ggagguaagc aagcacugga gacuguccag agauuguuac ccguacuaug ucaagaucau 1260 gguuugacgc cugaucaggu uguugcgaua gccagcaaua acggagggaa acaggcucuu 1320 gaaaccguac agcgacuucu cccagucuug ugccaagauc acgggcuuac uccugaucaa 1380 gucguagcua ucgccagcaa uaacggugga aaacaggccc uggaaaccgu acaacgucuc 1440 cucccaguac uuugucaaga ccacggguug acuccggauc aagucgucgc gaucgcgagc 1500 aauggugggg ggaagcaggc gcuggaaacu guucagagac ugcugccugu acuuugucag 1560 gaccaugguc ugacaccuga ccaaguugug gcgauagcca guaauaucgg gggaaaacag 1620 gcacuagaga gcauuguggc ccagcugagc cggccugauc cggcguuggc cgcguugacc 1680 aacgaccacc ucgucgccuu ggccugccuc ggcggacguc cugccaugga ugcagugaaa 1740 aagggauugc cgcacgcgcc ggaauugauc agaagaguca aucgccguau uggcgaacgc 1800 acgucccauc gcguugcgau aucuagagug ggaggaagcu cgcgcagaga guccaucaac 1860 ccauggauuc ugacugguuu cgcugaugcc gaaggaugcu uccgacuaga cauccgcaac 1920 gcaaacgauu uaagagccgg auacagaacu agacuggccu ucgaaaucgu acugcacaac 1980 aaggacaaau cgauucugga gaauauccag ucgacuugga aggucggcac aaucuacaac 2040 gcgggcgaca acgcagucag acugcaaguc acacguuucg aagauuugaa agugauuauc 2100 gaccacuucg agaaauaucc gcugauaaca cagaaauugg gcgauuacaa guuguuuaaa 2160 caggcauuca gcgucaugga gaacaaagaa caucuuaagg agaaugggau uaaggagcuc 2220 guacgaauca aagcuaagau gaauuggggu cucaaugacg aauugaaaaa agcauuucca 2280 gagaacauua gcaaagagcg cucccuuauc aauaagaaca uuccgaaucu caaauggcug 2340 gcuggauuca caucugguga cggcucguuc gugguggaac uaaagaagag aagaagcccc 2400 gucaagguag gagugcggcu gcgauucagc aucacccagc acaucagaga caagaaccug 2460 augaauucau ugauaacaua ccuaggcugu ggucguaucg uugagaauaa caaaucugag 2520 cacaguuggc ucgaauucau uguaacaaaa uucagcgaua ucaacgacaa gaucauuccg 2580 guauuccagg aaaauacucu gauuggcguc aaacucgagg acuuugaaga uuggugcaag 2640 guugccaaau ugaucgaaga gaagaaacac cugaccgaau ccgguuugga ugagauuaag 2700 aaaaucaagc ugaacaugaa caaaggucgu gguggaggcg guagcggagg cggagggucg 2760 gcuagcuccg aagcaccgag agccgaaacc uucguguucc ucgaccugga agccacuggc 2820 cugcccagug uggagcccga gauugccgag cugucccugu ucgccguuca ucgguccucc 2880 cuggaaaacc cugagcacga cgagagcgga gcacuggugc ugccaagggu gcuggacaag 2940 cugacccugu gcaugugucc cgagcguccc uucacugcca aggcauccga aaucacuggu 3000 cugaguucgg aagggcuggc ucguuguaga aaggcuggau ucgauggugc cgugguucgg 3060 acuuugcagg cauuccuguc caggcaggca gguccaaucu gcuuggucgc ccacaacggu 3120 uuugacuacg acuucccacu gcucugugcc gaacugcguc gccugggagc acgccuuccu 3180 cgggauaccg ugugccugga cacccuaccc gcucugcgug gacuggacag agcccacuca 3240 cacggcacua gggcgagagg acgccagggu uacagccucg guucacuguu ccaucgguau 3300 uucagggcag agccuuccgc agcccauuca gccgaaggcg auguccacac cuugcuucug 3360 aucuuccugc aucgugcagc agaacugcuc gccugggcag augagcaggc ucguggaugg 3420 gcucacauug agccgaugua cuugccaccu gaugacccua gccuggaagc cuga 3474 <210> 61 <211> 1157 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL-Trex2 protein construct <400> 61 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser 530 535 540 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 545 550 555 560 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 565 570 575 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 580 585 590 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser 595 600 605 Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu 610 615 620 Thr Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn 625 630 635 640 Ala Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile 645 650 655 Val Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr 660 665 670 Trp Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu 675 680 685 Gln Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu 690 695 700 Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys 705 710 715 720 Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly 725 730 735 Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn 740 745 750 Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser 755 760 765 Leu Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr 770 775 780 Ser Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro 785 790 795 800 Val Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg 805 810 815 Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg 820 825 830 Ile Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val 835 840 845 Thr Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu 850 855 860 Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys 865 870 875 880 Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu 885 890 895 Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly 900 905 910 Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Ala Pro Arg Ala 915 920 925 Glu Thr Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Ser Val 930 935 940 Glu Pro Glu Ile Ala Glu Leu Ser Leu Phe Ala Val His Arg Ser Ser 945 950 955 960 Leu Glu Asn Pro Glu His Asp Glu Ser Gly Ala Leu Val Leu Pro Arg 965 970 975 Val Leu Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Arg Pro Phe Thr 980 985 990 Ala Lys Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu Gly Leu Ala Arg 995 1000 1005 Cys Arg Lys Ala Gly Phe Asp Gly Ala Val Val Arg Thr Leu Gln 1010 1015 1020 Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile Cys Leu Val Ala His 1025 1030 1035 Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys Ala Glu Leu Arg 1040 1045 1050 Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val Cys Leu Asp Thr 1055 1060 1065 Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His Gly Thr 1070 1075 1080 Arg Ala Arg Gly Arg Gln Gly Tyr Ser Leu Gly Ser Leu Phe His 1085 1090 1095 Arg Tyr Phe Arg Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly 1100 1105 1110 Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu 1115 1120 1125 Leu Leu Ala Trp Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile 1130 1135 1140 Glu Pro Met Tyr Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala 1145 1150 1155 <210> 62 <211> 3426 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL-ExoX DNA construct <400> 62 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaactta acacccgatc aagtggtagc gatagcgtca 480 aacggcgggg gtaaacaggc tttggagacg gtacagcggt tattgccggt actctgccag 540 gaccacggat tgacaccgga ccaagtggtg gcgattgcgt ccaacaacgg aggcaagcag 600 gcactagaga ctgtccaacg gcttcttccc gttctttgtc aggatcatgg gctaacccct 660 gatcaggtag tcgctatagc ttcaaatgga gggggcaagc aagcactgga gactgttcaa 720 cgactcctgc cagtgctctg ccaagaccac ggacttacac cagatcaagt ggttgctatt 780 gcctccaatg gtggcgggaa acaagcgttg gaaactgtgc agagactgtt acctgtcttg 840 tgtcaagacc acggcctcac gccagatcag gtggtagcca tagcgtcgaa cattggtggt 900 aagcaagccc ttgaaacggt ccagcgtctt ctgccggtgt tgtgccagga ccacggacta 960 acgccggatc aggtcgtagc cattgcttca aatgggggcg gcaaacaggc gctagagaca 1020 gtccagcgcc tcttgcctgt gttatgccag gatcacggct taaccccaga ccaagttgtg 1080 gctattgcat ctaacaatgg tggcaaacaa gccttggaga cagtgcaacg attactgcct 1140 gtcttatgtc aggatcatgg cctgacgccc gatcaggtag tggcaatcgc atctaacatt 1200 ggaggtaagc aagcactgga gactgtccag agattgttac ccgtactatg tcaagatcat 1260 ggtttgacgc ctgatcaggt tgttgcgata gccagcaata acggagggaa acaggctctt 1320 gaaaccgtac agcgacttct cccagtcttg tgccaagatc acgggcttac tcctgatcaa 1380 gtcgtagcta tcgccagcaa taacggtgga aaacaggccc tggaaaccgt acaacgtctc 1440 ctcccagtac tttgtcaaga ccacgggttg actccggatc aagtcgtcgc gatcgcgagc 1500 aatggtgggg ggaagcaggc gctggaaact gttcagagac tgctgcctgt actttgtcag 1560 gaccatggtc tgacacctga ccaagttgtg gcgatagcca gtaatatcgg gggaaaacag 1620 gcactagaga gcattgtggc ccagctgagc cggcctgatc cggcgttggc cgcgttgacc 1680 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgccatgga tgcagtgaaa 1740 aagggattgc cgcacgcgcc ggaattgatc agaagagtca atcgccgtat tggcgaacgc 1800 acgtcccatc gcgttgcgat atctagagtg ggaggaagct cgcgcagaga gtccatcaac 1860 ccatggattc tgactggttt cgctgatgcc gaaggatgct tccgactaga catccgcaac 1920 gcaaacgatt taagagccgg atacagaact agactggcct tcgaaatcgt actgcacaac 1980 aaggacaaat cgattctgga gaatatccag tcgacttgga aggtcggcac aatctacaac 2040 gcgggcgaca acgcagtcag actgcaagtc acacgtttcg aagatttgaa agtgattatc 2100 gaccacttcg agaaatatcc gctgataaca cagaaattgg gcgattacaa gttgtttaaa 2160 caggcattca gcgtcatgga gaacaaagaa catcttaagg agaatgggat taaggagctc 2220 gtacgaatca aagctaagat gaattggggt ctcaatgacg aattgaaaaa agcatttcca 2280 gagaacatta gcaaagagcg ctcccttatc aataagaaca ttccgaatct caaatggctg 2340 gctggattca catctggtga cggctcgttc gtggtggaac taaagaagag aagaagcccc 2400 gtcaaggtag gagtgcggct gcgattcagc atcacccagc acatcagaga caagaacctg 2460 atgaattcat tgataacata cctaggctgt ggtcgtatcg ttgagaataa caaatctgag 2520 cacagttggc tcgaattcat tgtaacaaaa ttcagcgata tcaacgacaa gatcattccg 2580 gtattccagg aaaatactct gattggcgtc aaactcgagg actttgaaga ttggtgcaag 2640 gttgccaaat tgatcgaaga gaagaaacac ctgaccgaat ccggtttgga tgagattaag 2700 aaaatcaagc tgaacatgaa caaaggtcgt ggtggaggcg gtagcggagg cggagggtcg 2760 gctagcctgc ggatcataga cacggaaacc tgtggactcc agggtggtat cgtggagata 2820 gccagtgtcg atgtaattga tgggaaaatc gtaaacccga tgagccacct cgtccgaccg 2880 gataggccga taagtccgca ggctatggct atacatagaa tcacggaggc tatggtagct 2940 gacaagcctt ggatcgagga cgttatccca cactactatg ggagcgaatg gtatgtagcg 3000 cacaacgcat catttgatag gcgcgtgctt cccgaaatgc ctggggagtg gatttgcaca 3060 atgaaactcg ctcgccgact gtggcctggt atcaagtata gtaacatggc actttacaag 3120 acccgcaaac tcaacgtaca gacacctccg ggtctccacc accatagggc actctatgat 3180 tgttacataa ccgctgctct ccttatagac ataatgaata cctccgggtg gaccgccgaa 3240 caaatggcag acataacggg aagacctagt ttgatgacaa cctttacatt tggaaagtat 3300 cggggcaagg cggtgagcga tgtggccgaa agagatcccg gttatcttag atggctcttc 3360 aataacttgg attctatgtc acctgaactt cgccttaccc tgaagcatta ccttgagaat 3420 acctga 3426 <210> 63 <211> 3426 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL-ExoX RNA construct <400> 63 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaacuua acacccgauc aagugguagc gauagcguca 480 aacggcgggg guaaacaggc uuuggagacg guacagcggu uauugccggu acucugccag 540 gaccacggau ugacaccgga ccaaguggug gcgauugcgu ccaacaacgg aggcaagcag 600 gcacuagaga cuguccaacg gcuucuuccc guucuuuguc aggaucaugg gcuaaccccu 660 gaucagguag ucgcuauagc uucaaaugga gggggcaagc aagcacugga gacuguucaa 720 cgacuccugc cagugcucug ccaagaccac ggacuuacac cagaucaagu gguugcuauu 780 gccuccaaug guggcgggaa acaagcguug gaaacugugc agagacuguu accugucuug 840 ugucaagacc acggccucac gccagaucag gugguagcca uagcgucgaa cauugguggu 900 aagcaagccc uugaaacggu ccagcgucuu cugccggugu ugugccagga ccacggacua 960 acgccggauc aggucguagc cauugcuuca aaugggggcg gcaaacaggc gcuagagaca 1020 guccagcgcc ucuugccugu guuaugccag gaucacggcu uaaccccaga ccaaguugug 1080 gcuauugcau cuaacaaugg uggcaaacaa gccuuggaga cagugcaacg auuacugccu 1140 gucuuauguc aggaucaugg ccugacgccc gaucagguag uggcaaucgc aucuaacauu 1200 ggagguaagc aagcacugga gacuguccag agauuguuac ccguacuaug ucaagaucau 1260 gguuugacgc cugaucaggu uguugcgaua gccagcaaua acggagggaa acaggcucuu 1320 gaaaccguac agcgacuucu cccagucuug ugccaagauc acgggcuuac uccugaucaa 1380 gucguagcua ucgccagcaa uaacggugga aaacaggccc uggaaaccgu acaacgucuc 1440 cucccaguac uuugucaaga ccacggguug acuccggauc aagucgucgc gaucgcgagc 1500 aauggugggg ggaagcaggc gcuggaaacu guucagagac ugcugccugu acuuugucag 1560 gaccaugguc ugacaccuga ccaaguugug gcgauagcca guaauaucgg gggaaaacag 1620 gcacuagaga gcauuguggc ccagcugagc cggccugauc cggcguuggc cgcguugacc 1680 aacgaccacc ucgucgccuu ggccugccuc ggcggacguc cugccaugga ugcagugaaa 1740 aagggauugc cgcacgcgcc ggaauugauc agaagaguca aucgccguau uggcgaacgc 1800 acgucccauc gcguugcgau aucuagagug ggaggaagcu cgcgcagaga guccaucaac 1860 ccauggauuc ugacugguuu cgcugaugcc gaaggaugcu uccgacuaga cauccgcaac 1920 gcaaacgauu uaagagccgg auacagaacu agacuggccu ucgaaaucgu acugcacaac 1980 aaggacaaau cgauucugga gaauauccag ucgacuugga aggucggcac aaucuacaac 2040 gcgggcgaca acgcagucag acugcaaguc acacguuucg aagauuugaa agugauuauc 2100 gaccacuucg agaaauaucc gcugauaaca cagaaauugg gcgauuacaa guuguuuaaa 2160 caggcauuca gcgucaugga gaacaaagaa caucuuaagg agaaugggau uaaggagcuc 2220 guacgaauca aagcuaagau gaauuggggu cucaaugacg aauugaaaaa agcauuucca 2280 gagaacauua gcaaagagcg cucccuuauc aauaagaaca uuccgaaucu caaauggcug 2340 gcuggauuca caucugguga cggcucguuc gugguggaac uaaagaagag aagaagcccc 2400 gucaagguag gagugcggcu gcgauucagc aucacccagc acaucagaga caagaaccug 2460 augaauucau ugauaacaua ccuaggcugu ggucguaucg uugagaauaa caaaucugag 2520 cacaguuggc ucgaauucau uguaacaaaa uucagcgaua ucaacgacaa gaucauuccg 2580 guauuccagg aaaauacucu gauuggcguc aaacucgagg acuuugaaga uuggugcaag 2640 guugccaaau ugaucgaaga gaagaaacac cugaccgaau ccgguuugga ugagauuaag 2700 aaaaucaagc ugaacaugaa caaaggucgu gguggaggcg guagcggagg cggagggucg 2760 gcuagccugc ggaucauaga cacggaaacc uguggacucc agggugguau cguggagaua 2820 gccagugucg auguaauuga ugggaaaauc guaaacccga ugagccaccu cguccgaccg 2880 gauaggccga uaaguccgca ggcuauggcu auacauagaa ucacggaggc uaugguagcu 2940 gacaagccuu ggaucgagga cguuauccca cacuacuaug ggagcgaaug guauguagcg 3000 cacaacgcau cauuugauag gcgcgugcuu cccgaaaugc cuggggagug gauuugcaca 3060 augaaacucg cucgccgacu guggccuggu aucaaguaua guaacauggc acuuuacaag 3120 acccgcaaac ucaacguaca gacaccuccg ggucuccacc accauagggc acucuaugau 3180 uguuacauaa ccgcugcucu ccuuauagac auaaugaaua ccuccgggug gaccgccgaa 3240 caaauggcag acauaacggg aagaccuagu uugaugacaa ccuuuacauu uggaaaguau 3300 cggggcaagg cggugagcga uguggccgaa agagaucccg guuaucuuag auggcucuuc 3360 aauaacuugg auucuauguc accugaacuu cgccuuaccc ugaagcauua ccuugagaau 3420 accuga 3426 <210> 64 <211> 1141 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - high activity Cb1-b megaTAL-ExoX protein construct <400> 64 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser 530 535 540 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 545 550 555 560 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 565 570 575 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 580 585 590 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser 595 600 605 Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu 610 615 620 Thr Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn 625 630 635 640 Ala Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile 645 650 655 Val Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr 660 665 670 Trp Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu 675 680 685 Gln Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu 690 695 700 Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys 705 710 715 720 Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly 725 730 735 Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn 740 745 750 Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser 755 760 765 Leu Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr 770 775 780 Ser Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro 785 790 795 800 Val Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg 805 810 815 Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg 820 825 830 Ile Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val 835 840 845 Thr Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu 850 855 860 Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys 865 870 875 880 Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu 885 890 895 Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly 900 905 910 Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Leu Arg Ile Ile Asp Thr 915 920 925 Glu Thr Cys Gly Leu Gln Gly Gly Ile Val Glu Ile Ala Ser Val Asp 930 935 940 Val Ile Asp Gly Lys Ile Val Asn Pro Met Ser His Leu Val Arg Pro 945 950 955 960 Asp Arg Pro Ile Ser Pro Gln Ala Met Ala Ile His Arg Ile Thr Glu 965 970 975 Ala Met Val Ala Asp Lys Pro Trp Ile Glu Asp Val Ile Pro His Tyr 980 985 990 Tyr Gly Ser Glu Trp Tyr Val Ala His Asn Ala Ser Phe Asp Arg Arg 995 1000 1005 Val Leu Pro Glu Met Pro Gly Glu Trp Ile Cys Thr Met Lys Leu 1010 1015 1020 Ala Arg Arg Leu Trp Pro Gly Ile Lys Tyr Ser Asn Met Ala Leu 1025 1030 1035 Tyr Lys Thr Arg Lys Leu Asn Val Gln Thr Pro Pro Gly Leu His 1040 1045 1050 His His Arg Ala Leu Tyr Asp Cys Tyr Ile Thr Ala Ala Leu Leu 1055 1060 1065 Ile Asp Ile Met Asn Thr Ser Gly Trp Thr Ala Glu Gln Met Ala 1070 1075 1080 Asp Ile Thr Gly Arg Pro Ser Leu Met Thr Thr Phe Thr Phe Gly 1085 1090 1095 Lys Tyr Arg Gly Lys Ala Val Ser Asp Val Ala Glu Arg Asp Pro 1100 1105 1110 Gly Tyr Leu Arg Trp Leu Phe Asn Asn Leu Asp Ser Met Ser Pro 1115 1120 1125 Glu Leu Arg Leu Thr Leu Lys His Tyr Leu Glu Asn Thr 1130 1135 1140 <210> 65 <211> 2748 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL DNA construct <400> 65 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaactta acacccgatc aagtggtagc gatagcgtca 480 aacggcgggg gtaaacaggc tttggagacg gtacagcggt tattgccggt actctgccag 540 gaccacggat tgacaccgga ccaagtggtg gcgattgcgt ccaacaacgg aggcaagcag 600 gcactagaga ctgtccaacg gcttcttccc gttctttgtc aggatcatgg gctaacccct 660 gatcaggtag tcgctatagc ttcaaatgga gggggcaagc aagcactgga gactgttcaa 720 cgactcctgc cagtgctctg ccaagaccac ggacttacac cagatcaagt ggttgctatt 780 gcctccaatg gtggcgggaa acaagcgttg gaaactgtgc agagactgtt acctgtcttg 840 tgtcaagacc acggcctcac gccagatcag gtggtagcca tagcgtcgaa cattggtggt 900 aagcaagccc ttgaaacggt ccagcgtctt ctgccggtgt tgtgccagga ccacggacta 960 acgccggatc aggtcgtagc cattgcttca aatgggggcg gcaaacaggc gctagagaca 1020 gtccagcgcc tcttgcctgt gttatgccag gatcacggct taaccccaga ccaagttgtg 1080 gctattgcat ctaacaatgg tggcaaacaa gccttggaga cagtgcaacg attactgcct 1140 gtcttatgtc aggatcatgg cctgacgccc gatcaggtag tggcaatcgc atctaacatt 1200 ggaggtaagc aagcactgga gactgtccag agattgttac ccgtactatg tcaagatcat 1260 ggtttgacgc ctgatcaggt tgttgcgata gccagcaata acggagggaa acaggctctt 1320 gaaaccgtac agcgacttct cccagtcttg tgccaagatc acgggcttac tcctgatcaa 1380 gtcgtagcta tcgccagcaa taacggtgga aaacaggccc tggaaaccgt acaacgtctc 1440 ctcccagtac tttgtcaaga ccacgggttg actccggatc aagtcgtcgc gatcgcgagc 1500 aatggtgggg ggaagcaggc gctggaaact gttcagagac tgctgcctgt actttgtcag 1560 gaccatggtc tgacacctga ccaagttgtg gcgatagcca gtaatatcgg gggaaaacag 1620 gcactagaga gcattgtggc ccagctgagc cggcctgatc cggcgttggc cgcgttgacc 1680 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgccatgga tgcagtgaaa 1740 aagggattgc cgcacgcgcc ggaattgatc agaagagtca atcgccgtat tggcgaacgc 1800 acgtcccatc gcgttgcgat atctagagtg ggaggaagct cgcgcagaga gtccatcaac 1860 ccatggattc tgactggttt cgctgatgcc gaaggatgct tccgactaga catccgcaac 1920 gcaaactcca tgcgtgtaaa atacagaact agactgtcct tcgaaatcgt actgcacaac 1980 aaggacaaat cgattctgga gaatatccag tcgacttgga aggtcggcaa aatcacaaac 2040 tacggcgaca gaggagtccg cctgagagtc ggccgtttcg aagatttgaa agtgattatc 2100 gaccacttcg agaaatatcc gctgataaca cagaaattgg gcgattacaa gttgtttaaa 2160 caggcattca gcgtcatgga gaacaaagaa catcttaagg agaatgggat taaggagctc 2220 gtacgaatca aagctaagat gaattggggt ctcaatgacg aattgaaaaa agcatttcca 2280 gagaacatta gcaaagagcg cccccttatc aataagaaca tccccaattt caaatggctg 2340 gctggattca catctggtga cggctcgttc atggtggaac taatgaagaa taagaataac 2400 gttattgtac gtgtgcgtct gagattctca atctcccagc acatcagaga caagaacctg 2460 atgaattcat tgataacata cctaggctgt ggtcgtatcg ttgagaataa caaatctgag 2520 cacagttggc tcgaattcat tgtaacaaaa ttcagcgata tcaacgacaa gatcattccg 2580 gtattccagg aaaatactct gattggcgtc aaactcgagg actttgaaga ttggtgcaag 2640 gttgccaaat tgatcgaaga gaagaaacac ctgaccgaat ccggtttgga tgagattaag 2700 aaaatcaagc tgaacatgaa caaaggtcgt gtcttcagcg gccgctga 2748 <210> 66 <211> 2748 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL RNA construct <400> 66 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaacuua acacccgauc aagugguagc gauagcguca 480 aacggcgggg guaaacaggc uuuggagacg guacagcggu uauugccggu acucugccag 540 gaccacggau ugacaccgga ccaaguggug gcgauugcgu ccaacaacgg aggcaagcag 600 gcacuagaga cuguccaacg gcuucuuccc guucuuuguc aggaucaugg gcuaaccccu 660 gaucagguag ucgcuauagc uucaaaugga gggggcaagc aagcacugga gacuguucaa 720 cgacuccugc cagugcucug ccaagaccac ggacuuacac cagaucaagu gguugcuauu 780 gccuccaaug guggcgggaa acaagcguug gaaacugugc agagacuguu accugucuug 840 ugucaagacc acggccucac gccagaucag gugguagcca uagcgucgaa cauugguggu 900 aagcaagccc uugaaacggu ccagcgucuu cugccggugu ugugccagga ccacggacua 960 acgccggauc aggucguagc cauugcuuca aaugggggcg gcaaacaggc gcuagagaca 1020 guccagcgcc ucuugccugu guuaugccag gaucacggcu uaaccccaga ccaaguugug 1080 gcuauugcau cuaacaaugg uggcaaacaa gccuuggaga cagugcaacg auuacugccu 1140 gucuuauguc aggaucaugg ccugacgccc gaucagguag uggcaaucgc aucuaacauu 1200 ggagguaagc aagcacugga gacuguccag agauuguuac ccguacuaug ucaagaucau 1260 gguuugacgc cugaucaggu uguugcgaua gccagcaaua acggagggaa acaggcucuu 1320 gaaaccguac agcgacuucu cccagucuug ugccaagauc acgggcuuac uccugaucaa 1380 gucguagcua ucgccagcaa uaacggugga aaacaggccc uggaaaccgu acaacgucuc 1440 cucccaguac uuugucaaga ccacggguug acuccggauc aagucgucgc gaucgcgagc 1500 aauggugggg ggaagcaggc gcuggaaacu guucagagac ugcugccugu acuuugucag 1560 gaccaugguc ugacaccuga ccaaguugug gcgauagcca guaauaucgg gggaaaacag 1620 gcacuagaga gcauuguggc ccagcugagc cggccugauc cggcguuggc cgcguugacc 1680 aacgaccacc ucgucgccuu ggccugccuc ggcggacguc cugccaugga ugcagugaaa 1740 aagggauugc cgcacgcgcc ggaauugauc agaagaguca aucgccguau uggcgaacgc 1800 acgucccauc gcguugcgau aucuagagug ggaggaagcu cgcgcagaga guccaucaac 1860 ccauggauuc ugacugguuu cgcugaugcc gaaggaugcu uccgacuaga cauccgcaac 1920 gcaaacucca ugcguguaaa auacagaacu agacuguccu ucgaaaucgu acugcacaac 1980 aaggacaaau cgauucugga gaauauccag ucgacuugga aggucggcaa aaucacaaac 2040 uacggcgaca gaggaguccg ccugagaguc ggccguuucg aagauuugaa agugauuauc 2100 gaccacuucg agaaauaucc gcugauaaca cagaaauugg gcgauuacaa guuguuuaaa 2160 caggcauuca gcgucaugga gaacaaagaa caucuuaagg agaaugggau uaaggagcuc 2220 guacgaauca aagcuaagau gaauuggggu cucaaugacg aauugaaaaa agcauuucca 2280 gagaacauua gcaaagagcg cccccuuauc aauaagaaca uccccaauuu caaauggcug 2340 gcuggauuca caucugguga cggcucguuc augguggaac uaaugaagaa uaagaauaac 2400 guuauuguac gugugcgucu gagauucuca aucucccagc acaucagaga caagaaccug 2460 augaauucau ugauaacaua ccuaggcugu ggucguaucg uugagaauaa caaaucugag 2520 cacaguuggc ucgaauucau uguaacaaaa uucagcgaua ucaacgacaa gaucauuccg 2580 guauuccagg aaaauacucu gauuggcguc aaacucgagg acuuugaaga uuggugcaag 2640 guugccaaau ugaucgaaga gaagaaacac cugaccgaau ccgguuugga ugagauuaag 2700 aaaaucaagc ugaacaugaa caaaggucgu gucuucagcg gccgcuga 2748 <210> 67 <211> 915 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL protein construct <400> 67 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser 530 535 540 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 545 550 555 560 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 565 570 575 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 580 585 590 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser 595 600 605 Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu 610 615 620 Thr Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn 625 630 635 640 Ala Asn Ser Met Arg Val Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile 645 650 655 Val Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr 660 665 670 Trp Lys Val Gly Lys Ile Thr Asn Tyr Gly Asp Arg Gly Val Arg Leu 675 680 685 Arg Val Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu 690 695 700 Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys 705 710 715 720 Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly 725 730 735 Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn 740 745 750 Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro 755 760 765 Leu Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr 770 775 780 Ser Gly Asp Gly Ser Phe Met Val Glu Leu Met Lys Asn Lys Asn Asn 785 790 795 800 Val Ile Val Arg Val Arg Leu Arg Phe Ser Ile Ser Gln His Ile Arg 805 810 815 Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg 820 825 830 Ile Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val 835 840 845 Thr Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu 850 855 860 Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys 865 870 875 880 Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu 885 890 895 Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 900 905 910 Ser Gly Arg 915 <210> 68 <211> 3474 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL-Trex2 DNA construct <400> 68 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaactta acacccgatc aagtggtagc gatagcgtca 480 aacggcgggg gtaaacaggc tttggagacg gtacagcggt tattgccggt actctgccag 540 gaccacggat tgacaccgga ccaagtggtg gcgattgcgt ccaacaacgg aggcaagcag 600 gcactagaga ctgtccaacg gcttcttccc gttctttgtc aggatcatgg gctaacccct 660 gatcaggtag tcgctatagc ttcaaatgga gggggcaagc aagcactgga gactgttcaa 720 cgactcctgc cagtgctctg ccaagaccac ggacttacac cagatcaagt ggttgctatt 780 gcctccaatg gtggcgggaa acaagcgttg gaaactgtgc agagactgtt acctgtcttg 840 tgtcaagacc acggcctcac gccagatcag gtggtagcca tagcgtcgaa cattggtggt 900 aagcaagccc ttgaaacggt ccagcgtctt ctgccggtgt tgtgccagga ccacggacta 960 acgccggatc aggtcgtagc cattgcttca aatgggggcg gcaaacaggc gctagagaca 1020 gtccagcgcc tcttgcctgt gttatgccag gatcacggct taaccccaga ccaagttgtg 1080 gctattgcat ctaacaatgg tggcaaacaa gccttggaga cagtgcaacg attactgcct 1140 gtcttatgtc aggatcatgg cctgacgccc gatcaggtag tggcaatcgc atctaacatt 1200 ggaggtaagc aagcactgga gactgtccag agattgttac ccgtactatg tcaagatcat 1260 ggtttgacgc ctgatcaggt tgttgcgata gccagcaata acggagggaa acaggctctt 1320 gaaaccgtac agcgacttct cccagtcttg tgccaagatc acgggcttac tcctgatcaa 1380 gtcgtagcta tcgccagcaa taacggtgga aaacaggccc tggaaaccgt acaacgtctc 1440 ctcccagtac tttgtcaaga ccacgggttg actccggatc aagtcgtcgc gatcgcgagc 1500 aatggtgggg ggaagcaggc gctggaaact gttcagagac tgctgcctgt actttgtcag 1560 gaccatggtc tgacacctga ccaagttgtg gcgatagcca gtaatatcgg gggaaaacag 1620 gcactagaga gcattgtggc ccagctgagc cggcctgatc cggcgttggc cgcgttgacc 1680 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgccatgga tgcagtgaaa 1740 aagggattgc cgcacgcgcc ggaattgatc agaagagtca atcgccgtat tggcgaacgc 1800 acgtcccatc gcgttgcgat atctagagtg ggaggaagct cgcgcagaga gtccatcaac 1860 ccatggattc tgactggttt cgctgatgcc gaaggatgct tccgactaga catccgcaac 1920 gcaaactcca tgcgtgtaaa atacagaact agactgtcct tcgaaatcgt actgcacaac 1980 aaggacaaat cgattctgga gaatatccag tcgacttgga aggtcggcaa aatcacaaac 2040 tacggcgaca gaggagtccg cctgagagtc ggccgtttcg aagatttgaa agtgattatc 2100 gaccacttcg agaaatatcc gctgataaca cagaaattgg gcgattacaa gttgtttaaa 2160 caggcattca gcgtcatgga gaacaaagaa catcttaagg agaatgggat taaggagctc 2220 gtacgaatca aagctaagat gaattggggt ctcaatgacg aattgaaaaa agcatttcca 2280 gagaacatta gcaaagagcg cccccttatc aataagaaca tccccaattt caaatggctg 2340 gctggattca catctggtga cggctcgttc atggtggaac taatgaagaa taagaataac 2400 gttattgtac gtgtgcgtct gagattctca atctcccagc acatcagaga caagaacctg 2460 atgaattcat tgataacata cctaggctgt ggtcgtatcg ttgagaataa caaatctgag 2520 cacagttggc tcgaattcat tgtaacaaaa ttcagcgata tcaacgacaa gatcattccg 2580 gtattccagg aaaatactct gattggcgtc aaactcgagg actttgaaga ttggtgcaag 2640 gttgccaaat tgatcgaaga gaagaaacac ctgaccgaat ccggtttgga tgagattaag 2700 aaaatcaagc tgaacatgaa caaaggtcgt ggtggaggcg gtagcggagg cggagggtcg 2760 gctagctccg aagcaccgag agccgaaacc ttcgtgttcc tcgacctgga agccactggc 2820 ctgcccagtg tggagcccga gattgccgag ctgtccctgt tcgccgttca tcggtcctcc 2880 ctggaaaacc ctgagcacga cgagagcgga gcactggtgc tgccaagggt gctggacaag 2940 ctgaccctgt gcatgtgtcc cgagcgtccc ttcactgcca aggcatccga aatcactggt 3000 ctgagttcgg aagggctggc tcgttgtaga aaggctggat tcgatggtgc cgtggttcgg 3060 actttgcagg cattcctgtc caggcaggca ggtccaatct gcttggtcgc ccacaacggt 3120 tttgactacg acttcccact gctctgtgcc gaactgcgtc gcctgggagc acgccttcct 3180 cgggataccg tgtgcctgga caccctaccc gctctgcgtg gactggacag agcccactca 3240 cacggcacta gggcgagagg acgccagggt tacagcctcg gttcactgtt ccatcggtat 3300 ttcagggcag agccttccgc agcccattca gccgaaggcg atgtccacac cttgcttctg 3360 atcttcctgc atcgtgcagc agaactgctc gcctgggcag atgagcaggc tcgtggatgg 3420 gctcacattg agccgatgta cttgccacct gatgacccta gcctggaagc ctga 3474 <210> 69 <211> 3474 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL-Trex2 RNA construct <400> 69 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaacuua acacccgauc aagugguagc gauagcguca 480 aacggcgggg guaaacaggc uuuggagacg guacagcggu uauugccggu acucugccag 540 gaccacggau ugacaccgga ccaaguggug gcgauugcgu ccaacaacgg aggcaagcag 600 gcacuagaga cuguccaacg gcuucuuccc guucuuuguc aggaucaugg gcuaaccccu 660 gaucagguag ucgcuauagc uucaaaugga gggggcaagc aagcacugga gacuguucaa 720 cgacuccugc cagugcucug ccaagaccac ggacuuacac cagaucaagu gguugcuauu 780 gccuccaaug guggcgggaa acaagcguug gaaacugugc agagacuguu accugucuug 840 ugucaagacc acggccucac gccagaucag gugguagcca uagcgucgaa cauugguggu 900 aagcaagccc uugaaacggu ccagcgucuu cugccggugu ugugccagga ccacggacua 960 acgccggauc aggucguagc cauugcuuca aaugggggcg gcaaacaggc gcuagagaca 1020 guccagcgcc ucuugccugu guuaugccag gaucacggcu uaaccccaga ccaaguugug 1080 gcuauugcau cuaacaaugg uggcaaacaa gccuuggaga cagugcaacg auuacugccu 1140 gucuuauguc aggaucaugg ccugacgccc gaucagguag uggcaaucgc aucuaacauu 1200 ggagguaagc aagcacugga gacuguccag agauuguuac ccguacuaug ucaagaucau 1260 gguuugacgc cugaucaggu uguugcgaua gccagcaaua acggagggaa acaggcucuu 1320 gaaaccguac agcgacuucu cccagucuug ugccaagauc acgggcuuac uccugaucaa 1380 gucguagcua ucgccagcaa uaacggugga aaacaggccc uggaaaccgu acaacgucuc 1440 cucccaguac uuugucaaga ccacggguug acuccggauc aagucgucgc gaucgcgagc 1500 aauggugggg ggaagcaggc gcuggaaacu guucagagac ugcugccugu acuuugucag 1560 gaccaugguc ugacaccuga ccaaguugug gcgauagcca guaauaucgg gggaaaacag 1620 gcacuagaga gcauuguggc ccagcugagc cggccugauc cggcguuggc cgcguugacc 1680 aacgaccacc ucgucgccuu ggccugccuc ggcggacguc cugccaugga ugcagugaaa 1740 aagggauugc cgcacgcgcc ggaauugauc agaagaguca aucgccguau uggcgaacgc 1800 acgucccauc gcguugcgau aucuagagug ggaggaagcu cgcgcagaga guccaucaac 1860 ccauggauuc ugacugguuu cgcugaugcc gaaggaugcu uccgacuaga cauccgcaac 1920 gcaaacucca ugcguguaaa auacagaacu agacuguccu ucgaaaucgu acugcacaac 1980 aaggacaaau cgauucugga gaauauccag ucgacuugga aggucggcaa aaucacaaac 2040 uacggcgaca gaggaguccg ccugagaguc ggccguuucg aagauuugaa agugauuauc 2100 gaccacuucg agaaauaucc gcugauaaca cagaaauugg gcgauuacaa guuguuuaaa 2160 caggcauuca gcgucaugga gaacaaagaa caucuuaagg agaaugggau uaaggagcuc 2220 guacgaauca aagcuaagau gaauuggggu cucaaugacg aauugaaaaa agcauuucca 2280 gagaacauua gcaaagagcg cccccuuauc aauaagaaca uccccaauuu caaauggcug 2340 gcuggauuca caucugguga cggcucguuc augguggaac uaaugaagaa uaagaauaac 2400 guuauuguac gugugcgucu gagauucuca aucucccagc acaucagaga caagaaccug 2460 augaauucau ugauaacaua ccuaggcugu ggucguaucg uugagaauaa caaaucugag 2520 cacaguuggc ucgaauucau uguaacaaaa uucagcgaua ucaacgacaa gaucauuccg 2580 guauuccagg aaaauacucu gauuggcguc aaacucgagg acuuugaaga uuggugcaag 2640 guugccaaau ugaucgaaga gaagaaacac cugaccgaau ccgguuugga ugagauuaag 2700 aaaaucaagc ugaacaugaa caaaggucgu gguggaggcg guagcggagg cggagggucg 2760 gcuagcuccg aagcaccgag agccgaaacc uucguguucc ucgaccugga agccacuggc 2820 cugcccagug uggagcccga gauugccgag cugucccugu ucgccguuca ucgguccucc 2880 cuggaaaacc cugagcacga cgagagcgga gcacuggugc ugccaagggu gcuggacaag 2940 cugacccugu gcaugugucc cgagcguccc uucacugcca aggcauccga aaucacuggu 3000 cugaguucgg aagggcuggc ucguuguaga aaggcuggau ucgauggugc cgugguucgg 3060 acuuugcagg cauuccuguc caggcaggca gguccaaucu gcuuggucgc ccacaacggu 3120 uuugacuacg acuucccacu gcucugugcc gaacugcguc gccugggagc acgccuuccu 3180 cgggauaccg ugugccugga cacccuaccc gcucugcgug gacuggacag agcccacuca 3240 cacggcacua gggcgagagg acgccagggu uacagccucg guucacuguu ccaucgguau 3300 uucagggcag agccuuccgc agcccauuca gccgaaggcg auguccacac cuugcuucug 3360 aucuuccugc aucgugcagc agaacugcuc gccugggcag augagcaggc ucguggaugg 3420 gcucacauug agccgaugua cuugccaccu gaugacccua gccuggaagc cuga 3474 <210> 70 <211> 1157 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL-Trex2 protein construct <400> 70 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser 530 535 540 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 545 550 555 560 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 565 570 575 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 580 585 590 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser 595 600 605 Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu 610 615 620 Thr Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn 625 630 635 640 Ala Asn Ser Met Arg Val Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile 645 650 655 Val Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr 660 665 670 Trp Lys Val Gly Lys Ile Thr Asn Tyr Gly Asp Arg Gly Val Arg Leu 675 680 685 Arg Val Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu 690 695 700 Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys 705 710 715 720 Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly 725 730 735 Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn 740 745 750 Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro 755 760 765 Leu Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr 770 775 780 Ser Gly Asp Gly Ser Phe Met Val Glu Leu Met Lys Asn Lys Asn Asn 785 790 795 800 Val Ile Val Arg Val Arg Leu Arg Phe Ser Ile Ser Gln His Ile Arg 805 810 815 Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg 820 825 830 Ile Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val 835 840 845 Thr Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu 850 855 860 Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys 865 870 875 880 Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu 885 890 895 Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly 900 905 910 Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Ala Pro Arg Ala 915 920 925 Glu Thr Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro Ser Val 930 935 940 Glu Pro Glu Ile Ala Glu Leu Ser Leu Phe Ala Val His Arg Ser Ser 945 950 955 960 Leu Glu Asn Pro Glu His Asp Glu Ser Gly Ala Leu Val Leu Pro Arg 965 970 975 Val Leu Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Arg Pro Phe Thr 980 985 990 Ala Lys Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu Gly Leu Ala Arg 995 1000 1005 Cys Arg Lys Ala Gly Phe Asp Gly Ala Val Val Arg Thr Leu Gln 1010 1015 1020 Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile Cys Leu Val Ala His 1025 1030 1035 Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys Ala Glu Leu Arg 1040 1045 1050 Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val Cys Leu Asp Thr 1055 1060 1065 Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His Gly Thr 1070 1075 1080 Arg Ala Arg Gly Arg Gln Gly Tyr Ser Leu Gly Ser Leu Phe His 1085 1090 1095 Arg Tyr Phe Arg Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly 1100 1105 1110 Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Ala Glu 1115 1120 1125 Leu Leu Ala Trp Ala Asp Glu Gln Ala Arg Gly Trp Ala His Ile 1130 1135 1140 Glu Pro Met Tyr Leu Pro Pro Asp Asp Pro Ser Leu Glu Ala 1145 1150 1155 <210> 71 <211> 3426 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL-ExoX DNA construct <400> 71 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaactta acacccgatc aagtggtagc gatagcgtca 480 aacggcgggg gtaaacaggc tttggagacg gtacagcggt tattgccggt actctgccag 540 gaccacggat tgacaccgga ccaagtggtg gcgattgcgt ccaacaacgg aggcaagcag 600 gcactagaga ctgtccaacg gcttcttccc gttctttgtc aggatcatgg gctaacccct 660 gatcaggtag tcgctatagc ttcaaatgga gggggcaagc aagcactgga gactgttcaa 720 cgactcctgc cagtgctctg ccaagaccac ggacttacac cagatcaagt ggttgctatt 780 gcctccaatg gtggcgggaa acaagcgttg gaaactgtgc agagactgtt acctgtcttg 840 tgtcaagacc acggcctcac gccagatcag gtggtagcca tagcgtcgaa cattggtggt 900 aagcaagccc ttgaaacggt ccagcgtctt ctgccggtgt tgtgccagga ccacggacta 960 acgccggatc aggtcgtagc cattgcttca aatgggggcg gcaaacaggc gctagagaca 1020 gtccagcgcc tcttgcctgt gttatgccag gatcacggct taaccccaga ccaagttgtg 1080 gctattgcat ctaacaatgg tggcaaacaa gccttggaga cagtgcaacg attactgcct 1140 gtcttatgtc aggatcatgg cctgacgccc gatcaggtag tggcaatcgc atctaacatt 1200 ggaggtaagc aagcactgga gactgtccag agattgttac ccgtactatg tcaagatcat 1260 ggtttgacgc ctgatcaggt tgttgcgata gccagcaata acggagggaa acaggctctt 1320 gaaaccgtac agcgacttct cccagtcttg tgccaagatc acgggcttac tcctgatcaa 1380 gtcgtagcta tcgccagcaa taacggtgga aaacaggccc tggaaaccgt acaacgtctc 1440 ctcccagtac tttgtcaaga ccacgggttg actccggatc aagtcgtcgc gatcgcgagc 1500 aatggtgggg ggaagcaggc gctggaaact gttcagagac tgctgcctgt actttgtcag 1560 gaccatggtc tgacacctga ccaagttgtg gcgatagcca gtaatatcgg gggaaaacag 1620 gcactagaga gcattgtggc ccagctgagc cggcctgatc cggcgttggc cgcgttgacc 1680 aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgccatgga tgcagtgaaa 1740 aagggattgc cgcacgcgcc ggaattgatc agaagagtca atcgccgtat tggcgaacgc 1800 acgtcccatc gcgttgcgat atctagagtg ggaggaagct cgcgcagaga gtccatcaac 1860 ccatggattc tgactggttt cgctgatgcc gaaggatgct tccgactaga catccgcaac 1920 gcaaactcca tgcgtgtaaa atacagaact agactgtcct tcgaaatcgt actgcacaac 1980 aaggacaaat cgattctgga gaatatccag tcgacttgga aggtcggcaa aatcacaaac 2040 tacggcgaca gaggagtccg cctgagagtc ggccgtttcg aagatttgaa agtgattatc 2100 gaccacttcg agaaatatcc gctgataaca cagaaattgg gcgattacaa gttgtttaaa 2160 caggcattca gcgtcatgga gaacaaagaa catcttaagg agaatgggat taaggagctc 2220 gtacgaatca aagctaagat gaattggggt ctcaatgacg aattgaaaaa agcatttcca 2280 gagaacatta gcaaagagcg cccccttatc aataagaaca tccccaattt caaatggctg 2340 gctggattca catctggtga cggctcgttc atggtggaac taatgaagaa taagaataac 2400 gttattgtac gtgtgcgtct gagattctca atctcccagc acatcagaga caagaacctg 2460 atgaattcat tgataacata cctaggctgt ggtcgtatcg ttgagaataa caaatctgag 2520 cacagttggc tcgaattcat tgtaacaaaa ttcagcgata tcaacgacaa gatcattccg 2580 gtattccagg aaaatactct gattggcgtc aaactcgagg actttgaaga ttggtgcaag 2640 gttgccaaat tgatcgaaga gaagaaacac ctgaccgaat ccggtttgga tgagattaag 2700 aaaatcaagc tgaacatgaa caaaggtcgt ggtggaggcg gtagcggagg cggagggtcg 2760 gctagcctgc ggatcataga cacggaaacc tgtggactcc agggtggtat cgtggagata 2820 gccagtgtcg atgtaattga tgggaaaatc gtaaacccga tgagccacct cgtccgaccg 2880 gataggccga taagtccgca ggctatggct atacatagaa tcacggaggc tatggtagct 2940 gacaagcctt ggatcgagga cgttatccca cactactatg ggagcgaatg gtatgtagcg 3000 cacaacgcat catttgatag gcgcgtgctt cccgaaatgc ctggggagtg gatttgcaca 3060 atgaaactcg ctcgccgact gtggcctggt atcaagtata gtaacatggc actttacaag 3120 acccgcaaac tcaacgtaca gacacctccg ggtctccacc accatagggc actctatgat 3180 tgttacataa ccgctgctct ccttatagac ataatgaata cctccgggtg gaccgccgaa 3240 caaatggcag acataacggg aagacctagt ttgatgacaa cctttacatt tggaaagtat 3300 cggggcaagg cggtgagcga tgtggccgaa agagatcccg gttatcttag atggctcttc 3360 aataacttgg attctatgtc acctgaactt cgccttaccc tgaagcatta ccttgagaat 3420 acctga 3426 <210> 72 <211> 3426 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL-ExoX RNA construct <400> 72 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaacuua acacccgauc aagugguagc gauagcguca 480 aacggcgggg guaaacaggc uuuggagacg guacagcggu uauugccggu acucugccag 540 gaccacggau ugacaccgga ccaaguggug gcgauugcgu ccaacaacgg aggcaagcag 600 gcacuagaga cuguccaacg gcuucuuccc guucuuuguc aggaucaugg gcuaaccccu 660 gaucagguag ucgcuauagc uucaaaugga gggggcaagc aagcacugga gacuguucaa 720 cgacuccugc cagugcucug ccaagaccac ggacuuacac cagaucaagu gguugcuauu 780 gccuccaaug guggcgggaa acaagcguug gaaacugugc agagacuguu accugucuug 840 ugucaagacc acggccucac gccagaucag gugguagcca uagcgucgaa cauugguggu 900 aagcaagccc uugaaacggu ccagcgucuu cugccggugu ugugccagga ccacggacua 960 acgccggauc aggucguagc cauugcuuca aaugggggcg gcaaacaggc gcuagagaca 1020 guccagcgcc ucuugccugu guuaugccag gaucacggcu uaaccccaga ccaaguugug 1080 gcuauugcau cuaacaaugg uggcaaacaa gccuuggaga cagugcaacg auuacugccu 1140 gucuuauguc aggaucaugg ccugacgccc gaucagguag uggcaaucgc aucuaacauu 1200 ggagguaagc aagcacugga gacuguccag agauuguuac ccguacuaug ucaagaucau 1260 gguuugacgc cugaucaggu uguugcgaua gccagcaaua acggagggaa acaggcucuu 1320 gaaaccguac agcgacuucu cccagucuug ugccaagauc acgggcuuac uccugaucaa 1380 gucguagcua ucgccagcaa uaacggugga aaacaggccc uggaaaccgu acaacgucuc 1440 cucccaguac uuugucaaga ccacggguug acuccggauc aagucgucgc gaucgcgagc 1500 aauggugggg ggaagcaggc gcuggaaacu guucagagac ugcugccugu acuuugucag 1560 gaccaugguc ugacaccuga ccaaguugug gcgauagcca guaauaucgg gggaaaacag 1620 gcacuagaga gcauuguggc ccagcugagc cggccugauc cggcguuggc cgcguugacc 1680 aacgaccacc ucgucgccuu ggccugccuc ggcggacguc cugccaugga ugcagugaaa 1740 aagggauugc cgcacgcgcc ggaauugauc agaagaguca aucgccguau uggcgaacgc 1800 acgucccauc gcguugcgau aucuagagug ggaggaagcu cgcgcagaga guccaucaac 1860 ccauggauuc ugacugguuu cgcugaugcc gaaggaugcu uccgacuaga cauccgcaac 1920 gcaaacucca ugcguguaaa auacagaacu agacuguccu ucgaaaucgu acugcacaac 1980 aaggacaaau cgauucugga gaauauccag ucgacuugga aggucggcaa aaucacaaac 2040 uacggcgaca gaggaguccg ccugagaguc ggccguuucg aagauuugaa agugauuauc 2100 gaccacuucg agaaauaucc gcugauaaca cagaaauugg gcgauuacaa guuguuuaaa 2160 caggcauuca gcgucaugga gaacaaagaa caucuuaagg agaaugggau uaaggagcuc 2220 guacgaauca aagcuaagau gaauuggggu cucaaugacg aauugaaaaa agcauuucca 2280 gagaacauua gcaaagagcg cccccuuauc aauaagaaca uccccaauuu caaauggcug 2340 gcuggauuca caucugguga cggcucguuc augguggaac uaaugaagaa uaagaauaac 2400 guuauuguac gugugcgucu gagauucuca aucucccagc acaucagaga caagaaccug 2460 augaauucau ugauaacaua ccuaggcugu ggucguaucg uugagaauaa caaaucugag 2520 cacaguuggc ucgaauucau uguaacaaaa uucagcgaua ucaacgacaa gaucauuccg 2580 guauuccagg aaaauacucu gauuggcguc aaacucgagg acuuugaaga uuggugcaag 2640 guugccaaau ugaucgaaga gaagaaacac cugaccgaau ccgguuugga ugagauuaag 2700 aaaaucaagc ugaacaugaa caaaggucgu gguggaggcg guagcggagg cggagggucg 2760 gcuagccugc ggaucauaga cacggaaacc uguggacucc agggugguau cguggagaua 2820 gccagugucg auguaauuga ugggaaaauc guaaacccga ugagccaccu cguccgaccg 2880 gauaggccga uaaguccgca ggcuauggcu auacauagaa ucacggaggc uaugguagcu 2940 gacaagccuu ggaucgagga cguuauccca cacuacuaug ggagcgaaug guauguagcg 3000 cacaacgcau cauuugauag gcgcgugcuu cccgaaaugc cuggggagug gauuugcaca 3060 augaaacucg cucgccgacu guggccuggu aucaaguaua guaacauggc acuuuacaag 3120 acccgcaaac ucaacguaca gacaccuccg ggucuccacc accauagggc acucuaugau 3180 uguuacauaa ccgcugcucu ccuuauagac auaaugaaua ccuccgggug gaccgccgaa 3240 caaauggcag acauaacggg aagaccuagu uugaugacaa ccuuuacauu uggaaaguau 3300 cggggcaagg cggugagcga uguggccgaa agagaucccg guuaucuuag auggcucuuc 3360 aauaacuugg auucuauguc accugaacuu cgccuuaccc ugaagcauua ccuugagaau 3420 accuga 3426 <210> 73 <211> 1141 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - low activity Cb1-b megaTAL-ExoX protein construct <400> 73 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser 530 535 540 Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr 545 550 555 560 Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met 565 570 575 Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg 580 585 590 Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser 595 600 605 Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu 610 615 620 Thr Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn 625 630 635 640 Ala Asn Ser Met Arg Val Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile 645 650 655 Val Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr 660 665 670 Trp Lys Val Gly Lys Ile Thr Asn Tyr Gly Asp Arg Gly Val Arg Leu 675 680 685 Arg Val Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu 690 695 700 Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys 705 710 715 720 Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly 725 730 735 Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn 740 745 750 Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro 755 760 765 Leu Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr 770 775 780 Ser Gly Asp Gly Ser Phe Met Val Glu Leu Met Lys Asn Lys Asn Asn 785 790 795 800 Val Ile Val Arg Val Arg Leu Arg Phe Ser Ile Ser Gln His Ile Arg 805 810 815 Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg 820 825 830 Ile Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val 835 840 845 Thr Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu 850 855 860 Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys 865 870 875 880 Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu 885 890 895 Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Gly Gly 900 905 910 Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Leu Arg Ile Ile Asp Thr 915 920 925 Glu Thr Cys Gly Leu Gln Gly Gly Ile Val Glu Ile Ala Ser Val Asp 930 935 940 Val Ile Asp Gly Lys Ile Val Asn Pro Met Ser His Leu Val Arg Pro 945 950 955 960 Asp Arg Pro Ile Ser Pro Gln Ala Met Ala Ile His Arg Ile Thr Glu 965 970 975 Ala Met Val Ala Asp Lys Pro Trp Ile Glu Asp Val Ile Pro His Tyr 980 985 990 Tyr Gly Ser Glu Trp Tyr Val Ala His Asn Ala Ser Phe Asp Arg Arg 995 1000 1005 Val Leu Pro Glu Met Pro Gly Glu Trp Ile Cys Thr Met Lys Leu 1010 1015 1020 Ala Arg Arg Leu Trp Pro Gly Ile Lys Tyr Ser Asn Met Ala Leu 1025 1030 1035 Tyr Lys Thr Arg Lys Leu Asn Val Gln Thr Pro Pro Gly Leu His 1040 1045 1050 His His Arg Ala Leu Tyr Asp Cys Tyr Ile Thr Ala Ala Leu Leu 1055 1060 1065 Ile Asp Ile Met Asn Thr Ser Gly Trp Thr Ala Glu Gln Met Ala 1070 1075 1080 Asp Ile Thr Gly Arg Pro Ser Leu Met Thr Thr Phe Thr Phe Gly 1085 1090 1095 Lys Tyr Arg Gly Lys Ala Val Ser Asp Val Ala Glu Arg Asp Pro 1100 1105 1110 Gly Tyr Leu Arg Trp Leu Phe Asn Asn Leu Asp Ser Met Ser Pro 1115 1120 1125 Glu Leu Arg Leu Thr Leu Lys His Tyr Leu Glu Asn Thr 1130 1135 1140 <210> 74 <211> 2835 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL DNA construct <400> 74 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaaccta acccctgatc aggtagtcgc tatagcttca 480 aacaacgggg gcaagcaagc actggagacc gttcaacgac tcctgccagt gctctgccaa 540 gaccacggac ttacgccaga tcaggtggtt gctattgcct ccaacaatgg cgggaaacaa 600 gcgttggaaa ctgtgcagag actgttacct gtcttgtgtc aagaccacgg cctcacgcca 660 gatcaggtgg tagccatagc gtcgaatgga ggtggtaagc aagcccttga aacggtccag 720 cgtcttctgc cggtgttgtg ccaggaccac ggactaacgc cggatcaggt cgtagccatt 780 gcttcaaata acggcggcaa acaggcgcta gagacagtcc agcgcctctt gcctgtgtta 840 tgccaggatc acggcttaac cccagaccaa gttgtggcta ttgcatctaa caatggtggc 900 aaacaagcct tggagacagt gcaacgatta ctgcctgtct tatgtcagga tcatggcctg 960 acgcccgatc aggtagtggc aatcgcatct aataatggag gtaagcaagc actggagact 1020 gtccagagat tgttacccgt actatgtcaa gatcatggtt tgacgcctga tcaggttgtt 1080 gcgatagcca gcaacaacgg agggaaacag gctcttgaaa ccgtacagcg acttctccca 1140 gtcttgtgcc aagatcacgg gcttactcct gatcaagtcg tagctatcgc cagccacgac 1200 ggtgggaaac aggccctgga aaccgtacaa cgtctcctcc cagtactttg tcaagaccac 1260 gggttgactc cggatcaagt cgtcgcgatc gcgagcaatg gaggggggaa gcaggcgctg 1320 gaaactgttc agagactgct gcctgtactt tgtcaggacc atggtctgac acctgaccaa 1380 gttgtggcga tagccagtaa caatggggga aaacaggcac tagagacggt tcaaaggttg 1440 ttgcccgttc tgtgccagga ccacggcttg acaccggatc aggtggtagc tatcgcttca 1500 cacgatggcg gaaaacaggc tttagaaaca gtccaaagac ttctcccagt cctttgtcag 1560 gaccacggat tgactccaga tcaagtcgtt gctattgcaa gtaatggtgg tggtaagcaa 1620 gctttagaaa ccgtacagag gcttttgcca gtgctgtgcc aggaccatgg actgacccct 1680 gatcaagtgg tagcaattgc atctcatgat ggaggaaaac aagctctgga aagcattgtg 1740 gcccagctga gccggcctga tccggcgttg gccgcgttga ccaacgacca cctcgtcgcc 1800 ttggcctgcc tcggcggacg tcctgccatg gatgcagtga aaaagggatt gccgcacgcg 1860 ccggaattga tcagaagagt caatcgccgt attggcgaac gcacgtccca tcgcgttgcg 1920 atatctagag tgggaggaag ctctcgcaga gagtccatca acccatggac tctgactggt 1980 ttcgctgatg ccgaaggatc attcgggcta agcatcctca acagaaacag aggtactgct 2040 agataccaca ctcgactgtc attcacaatc atgctgcaca acaaggacaa atcgattctg 2100 gagaatatcc agtcgacttg gaaggtcggc agcatcctca acaatggcga ccactacgtc 2160 tcgctggtgg tctaccgttt cgaagatttg aaagtgatta tcgaccactt cgagaaatat 2220 ccgctgataa cacagaaatt gggcgattac aagttgttta aacaggcatt cagcgtcatg 2280 gagaacaaag aacatcttaa ggagaatggg attaaggagc tcgtacgaat caaagctaag 2340 atgaattggg gtctcaatga cgaattgaaa aaagcatttc cagaggtgat tagcagggag 2400 cgccccctta tcaataagaa cattccgaat gggaaatggc tggctggatt cacatctggt 2460 gatggctcct tcttcgtgcg cctaagaaag tctaatgtta atgctagagt acgtgtgcaa 2520 ctggtattcg agatctcaca gcacatcaga gacaagaacc tgatgaattc attgataaca 2580 tacctaggct gtggtcacat ctacgaggga aacaaatctg agcgcagttg gctccaattc 2640 agagtagaaa aattcagcga tatcaacgac aagatcattc cggtattcca ggaaaatact 2700 ctgattggca tgaaactcga ggactttgaa gattggtgca aggttgccaa attgatcgaa 2760 gagaagaaac acctgaccga atccggtttg gatgagatta agaaaatcaa gctgaacatg 2820 aacaaaagac gttga 2835 <210> 75 <211> 2835 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL RNA construct <400> 75 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccua accccugauc agguagucgc uauagcuuca 480 aacaacgggg gcaagcaagc acuggagacc guucaacgac uccugccagu gcucugccaa 540 gaccacggac uuacgccaga ucaggugguu gcuauugccu ccaacaaugg cgggaaacaa 600 gcguuggaaa cugugcagag acuguuaccu gucuuguguc aagaccacgg ccucacgcca 660 gaucaggugg uagccauagc gucgaaugga ggugguaagc aagcccuuga aacgguccag 720 cgucuucugc cgguguugug ccaggaccac ggacuaacgc cggaucaggu cguagccauu 780 gcuucaaaua acggcggcaa acaggcgcua gagacagucc agcgccucuu gccuguguua 840 ugccaggauc acggcuuaac cccagaccaa guuguggcua uugcaucuaa caaugguggc 900 aaacaagccu uggagacagu gcaacgauua cugccugucu uaugucagga ucauggccug 960 acgcccgauc agguaguggc aaucgcaucu aauaauggag guaagcaagc acuggagacu 1020 guccagagau uguuacccgu acuaugucaa gaucaugguu ugacgccuga ucagguuguu 1080 gcgauagcca gcaacaacgg agggaaacag gcucuugaaa ccguacagcg acuucuccca 1140 gucuugugcc aagaucacgg gcuuacuccu gaucaagucg uagcuaucgc cagccacgac 1200 ggugggaaac aggcccugga aaccguacaa cgucuccucc caguacuuug ucaagaccac 1260 ggguugacuc cggaucaagu cgucgcgauc gcgagcaaug gaggggggaa gcaggcgcug 1320 gaaacuguuc agagacugcu gccuguacuu ugucaggacc auggucugac accugaccaa 1380 guuguggcga uagccaguaa caauggggga aaacaggcac uagagacggu ucaaagguug 1440 uugcccguuc ugugccagga ccacggcuug acaccggauc aggugguagc uaucgcuuca 1500 cacgauggcg gaaaacaggc uuuagaaaca guccaaagac uucucccagu ccuuugucag 1560 gaccacggau ugacuccaga ucaagucguu gcuauugcaa guaauggugg ugguaagcaa 1620 gcuuuagaaa ccguacagag gcuuuugcca gugcugugcc aggaccaugg acugaccccu 1680 gaucaagugg uagcaauugc aucucaugau ggaggaaaac aagcucugga aagcauugug 1740 gcccagcuga gccggccuga uccggcguug gccgcguuga ccaacgacca ccucgucgcc 1800 uuggccugcc ucggcggacg uccugccaug gaugcaguga aaaagggauu gccgcacgcg 1860 ccggaauuga ucagaagagu caaucgccgu auuggcgaac gcacguccca ucgcguugcg 1920 auaucuagag ugggaggaag cucucgcaga gaguccauca acccauggac ucugacuggu 1980 uucgcugaug ccgaaggauc auucgggcua agcauccuca acagaaacag agguacugcu 2040 agauaccaca cucgacuguc auucacaauc augcugcaca acaaggacaa aucgauucug 2100 gagaauaucc agucgacuug gaaggucggc agcauccuca acaauggcga ccacuacguc 2160 ucgcuggugg ucuaccguuu cgaagauuug aaagugauua ucgaccacuu cgagaaauau 2220 ccgcugauaa cacagaaauu gggcgauuac aaguuguuua aacaggcauu cagcgucaug 2280 gagaacaaag aacaucuuaa ggagaauggg auuaaggagc ucguacgaau caaagcuaag 2340 augaauuggg gucucaauga cgaauugaaa aaagcauuuc cagaggugau uagcagggag 2400 cgcccccuua ucaauaagaa cauuccgaau gggaaauggc uggcuggauu cacaucuggu 2460 gauggcuccu ucuucgugcg ccuaagaaag ucuaauguua augcuagagu acgugugcaa 2520 cugguauucg agaucucaca gcacaucaga gacaagaacc ugaugaauuc auugauaaca 2580 uaccuaggcu guggucacau cuacgaggga aacaaaucug agcgcaguug gcuccaauuc 2640 agaguagaaa aauucagcga uaucaacgac aagaucauuc cgguauucca ggaaaauacu 2700 cugauuggca ugaaacucga ggacuuugaa gauuggugca agguugccaa auugaucgaa 2760 gagaagaaac accugaccga auccgguuug gaugagauua agaaaaucaa gcugaacaug 2820 aacaaaagac guuga 2835 <210> 76 <211> 944 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL protein construct <400> 76 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 530 535 540 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 545 550 555 560 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 565 570 575 Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala 580 585 590 Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro 595 600 605 Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile 610 615 620 Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala 625 630 635 640 Ile Ser Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp 645 650 655 Thr Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile 660 665 670 Leu Asn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe 675 680 685 Thr Ile Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln 690 695 700 Ser Thr Trp Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val 705 710 715 720 Ser Leu Val Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His 725 730 735 Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu 740 745 750 Phe Lys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu 755 760 765 Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly 770 775 780 Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu 785 790 795 800 Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly 805 810 815 Phe Thr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn 820 825 830 Val Asn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His 835 840 845 Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys 850 855 860 Gly His Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe 865 870 875 880 Arg Val Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe 885 890 895 Gln Glu Asn Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp 900 905 910 Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser 915 920 925 Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 930 935 940 <210> 77 <211> 3576 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL-Trex2 DNA construct <400> 77 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaaccta acccctgatc aggtagtcgc tatagcttca 480 aacaacgggg gcaagcaagc actggagacc gttcaacgac tcctgccagt gctctgccaa 540 gaccacggac ttacgccaga tcaggtggtt gctattgcct ccaacaatgg cgggaaacaa 600 gcgttggaaa ctgtgcagag actgttacct gtcttgtgtc aagaccacgg cctcacgcca 660 gatcaggtgg tagccatagc gtcgaatgga ggtggtaagc aagcccttga aacggtccag 720 cgtcttctgc cggtgttgtg ccaggaccac ggactaacgc cggatcaggt cgtagccatt 780 gcttcaaata acggcggcaa acaggcgcta gagacagtcc agcgcctctt gcctgtgtta 840 tgccaggatc acggcttaac cccagaccaa gttgtggcta ttgcatctaa caatggtggc 900 aaacaagcct tggagacagt gcaacgatta ctgcctgtct tatgtcagga tcatggcctg 960 acgcccgatc aggtagtggc aatcgcatct aataatggag gtaagcaagc actggagact 1020 gtccagagat tgttacccgt actatgtcaa gatcatggtt tgacgcctga tcaggttgtt 1080 gcgatagcca gcaacaacgg agggaaacag gctcttgaaa ccgtacagcg acttctccca 1140 gtcttgtgcc aagatcacgg gcttactcct gatcaagtcg tagctatcgc cagccacgac 1200 ggtgggaaac aggccctgga aaccgtacaa cgtctcctcc cagtactttg tcaagaccac 1260 gggttgactc cggatcaagt cgtcgcgatc gcgagcaatg gaggggggaa gcaggcgctg 1320 gaaactgttc agagactgct gcctgtactt tgtcaggacc atggtctgac acctgaccaa 1380 gttgtggcga tagccagtaa caatggggga aaacaggcac tagagacggt tcaaaggttg 1440 ttgcccgttc tgtgccagga ccacggcttg acaccggatc aggtggtagc tatcgcttca 1500 cacgatggcg gaaaacaggc tttagaaaca gtccaaagac ttctcccagt cctttgtcag 1560 gaccacggat tgactccaga tcaagtcgtt gctattgcaa gtaatggtgg tggtaagcaa 1620 gctttagaaa ccgtacagag gcttttgcca gtgctgtgcc aggaccatgg actgacccct 1680 gatcaagtgg tagcaattgc atctcatgat ggaggaaaac aagctctgga aagcattgtg 1740 gcccagctga gccggcctga tccggcgttg gccgcgttga ccaacgacca cctcgtcgcc 1800 ttggcctgcc tcggcggacg tcctgccatg gatgcagtga aaaagggatt gccgcacgcg 1860 ccggaattga tcagaagagt caatcgccgt attggcgaac gcacgtccca tcgcgttgcg 1920 atatctagag tgggaggaag ctctcgcaga gagtccatca acccatggac tctgactggt 1980 ttcgctgatg ccgaaggatc attcgggcta agcatcctca acagaaacag aggtactgct 2040 agataccaca ctcgactgtc attcacaatc atgctgcaca acaaggacaa atcgattctg 2100 gagaatatcc agtcgacttg gaaggtcggc agcatcctca acaatggcga ccactacgtc 2160 tcgctggtgg tctaccgttt cgaagatttg aaagtgatta tcgaccactt cgagaaatat 2220 ccgctgataa cacagaaatt gggcgattac aagttgttta aacaggcatt cagcgtcatg 2280 gagaacaaag aacatcttaa ggagaatggg attaaggagc tcgtacgaat caaagctaag 2340 atgaattggg gtctcaatga cgaattgaaa aaagcatttc cagaggtgat tagcagggag 2400 cgccccctta tcaataagaa cattccgaat gggaaatggc tggctggatt cacatctggt 2460 gatggctcct tcttcgtgcg cctaagaaag tctaatgtta atgctagagt acgtgtgcaa 2520 ctggtattcg agatctcaca gcacatcaga gacaagaacc tgatgaattc attgataaca 2580 tacctaggct gtggtcacat ctacgaggga aacaaatctg agcgcagttg gctccaattc 2640 agagtagaaa aattcagcga tatcaacgac aagatcattc cggtattcca ggaaaatact 2700 ctgattggca tgaaactcga ggactttgaa gattggtgca aggttgccaa attgatcgaa 2760 gagaagaaac acctgaccga atccggtttg gatgagatta agaaaatcaa gctgaacatg 2820 aacaaaagac gtggtggagg cggtagcgga ggcggagggt cggctagctc cgaagcaccg 2880 agagccgaaa ccttcgtgtt cctcgacctg gaagccactg gcctgcccag tgtggagccc 2940 gagattgccg agctgtccct gttcgccgtt catcggtcct ccctggaaaa ccctgagcac 3000 gacgagagcg gagcactggt gctgccaagg gtgctggaca agctgaccct gtgcatgtgt 3060 cccgagcgtc ccttcactgc caaggcatcc gaaatcactg gtctgagttc ggaagggctg 3120 gctcgttgta gaaaggctgg attcgatggt gccgtggttc ggactttgca ggcattcctg 3180 tccaggcagg caggtccaat ctgcttggtc gcccacaacg gttttgacta cgacttccca 3240 ctgctctgtg ccgaactgcg tcgcctggga gcacgccttc ctcgggatac cgtgtgcctg 3300 gacaccctac ccgctctgcg tggactggac agagcccact cacacggcac tagggcgaga 3360 ggacgccagg gttacagcct cggttcactg ttccatcggt atttcagggc agagccttcc 3420 gcagcccatt cagccgaagg cgatgtccac accttgcttc tgatcttcct gcatcgtgca 3480 gcagaactgc tcgcctgggc agatgagcag gctcgtggat gggctcacat tgagccgatg 3540 tacttgccac ctgatgaccc tagcctggaa gcctga 3576 <210> 78 <211> 3576 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL-Trex2 RNA construct <400> 78 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccua accccugauc agguagucgc uauagcuuca 480 aacaacgggg gcaagcaagc acuggagacc guucaacgac uccugccagu gcucugccaa 540 gaccacggac uuacgccaga ucaggugguu gcuauugccu ccaacaaugg cgggaaacaa 600 gcguuggaaa cugugcagag acuguuaccu gucuuguguc aagaccacgg ccucacgcca 660 gaucaggugg uagccauagc gucgaaugga ggugguaagc aagcccuuga aacgguccag 720 cgucuucugc cgguguugug ccaggaccac ggacuaacgc cggaucaggu cguagccauu 780 gcuucaaaua acggcggcaa acaggcgcua gagacagucc agcgccucuu gccuguguua 840 ugccaggauc acggcuuaac cccagaccaa guuguggcua uugcaucuaa caaugguggc 900 aaacaagccu uggagacagu gcaacgauua cugccugucu uaugucagga ucauggccug 960 acgcccgauc agguaguggc aaucgcaucu aauaauggag guaagcaagc acuggagacu 1020 guccagagau uguuacccgu acuaugucaa gaucaugguu ugacgccuga ucagguuguu 1080 gcgauagcca gcaacaacgg agggaaacag gcucuugaaa ccguacagcg acuucuccca 1140 gucuugugcc aagaucacgg gcuuacuccu gaucaagucg uagcuaucgc cagccacgac 1200 ggugggaaac aggcccugga aaccguacaa cgucuccucc caguacuuug ucaagaccac 1260 ggguugacuc cggaucaagu cgucgcgauc gcgagcaaug gaggggggaa gcaggcgcug 1320 gaaacuguuc agagacugcu gccuguacuu ugucaggacc auggucugac accugaccaa 1380 guuguggcga uagccaguaa caauggggga aaacaggcac uagagacggu ucaaagguug 1440 uugcccguuc ugugccagga ccacggcuug acaccggauc aggugguagc uaucgcuuca 1500 cacgauggcg gaaaacaggc uuuagaaaca guccaaagac uucucccagu ccuuugucag 1560 gaccacggau ugacuccaga ucaagucguu gcuauugcaa guaauggugg ugguaagcaa 1620 gcuuuagaaa ccguacagag gcuuuugcca gugcugugcc aggaccaugg acugaccccu 1680 gaucaagugg uagcaauugc aucucaugau ggaggaaaac aagcucugga aagcauugug 1740 gcccagcuga gccggccuga uccggcguug gccgcguuga ccaacgacca ccucgucgcc 1800 uuggccugcc ucggcggacg uccugccaug gaugcaguga aaaagggauu gccgcacgcg 1860 ccggaauuga ucagaagagu caaucgccgu auuggcgaac gcacguccca ucgcguugcg 1920 auaucuagag ugggaggaag cucucgcaga gaguccauca acccauggac ucugacuggu 1980 uucgcugaug ccgaaggauc auucgggcua agcauccuca acagaaacag agguacugcu 2040 agauaccaca cucgacuguc auucacaauc augcugcaca acaaggacaa aucgauucug 2100 gagaauaucc agucgacuug gaaggucggc agcauccuca acaauggcga ccacuacguc 2160 ucgcuggugg ucuaccguuu cgaagauuug aaagugauua ucgaccacuu cgagaaauau 2220 ccgcugauaa cacagaaauu gggcgauuac aaguuguuua aacaggcauu cagcgucaug 2280 gagaacaaag aacaucuuaa ggagaauggg auuaaggagc ucguacgaau caaagcuaag 2340 augaauuggg gucucaauga cgaauugaaa aaagcauuuc cagaggugau uagcagggag 2400 cgcccccuua ucaauaagaa cauuccgaau gggaaauggc uggcuggauu cacaucuggu 2460 gauggcuccu ucuucgugcg ccuaagaaag ucuaauguua augcuagagu acgugugcaa 2520 cugguauucg agaucucaca gcacaucaga gacaagaacc ugaugaauuc auugauaaca 2580 uaccuaggcu guggucacau cuacgaggga aacaaaucug agcgcaguug gcuccaauuc 2640 agaguagaaa aauucagcga uaucaacgac aagaucauuc cgguauucca ggaaaauacu 2700 cugauuggca ugaaacucga ggacuuugaa gauuggugca agguugccaa auugaucgaa 2760 gagaagaaac accugaccga auccgguuug gaugagauua agaaaaucaa gcugaacaug 2820 aacaaaagac gugguggagg cgguagcgga ggcggagggu cggcuagcuc cgaagcaccg 2880 agagccgaaa ccuucguguu ccucgaccug gaagccacug gccugcccag uguggagccc 2940 gagauugccg agcugucccu guucgccguu caucgguccu cccuggaaaa cccugagcac 3000 gacgagagcg gagcacuggu gcugccaagg gugcuggaca agcugacccu gugcaugugu 3060 cccgagcguc ccuucacugc caaggcaucc gaaaucacug gucugaguuc ggaagggcug 3120 gcucguugua gaaaggcugg auucgauggu gccgugguuc ggacuuugca ggcauuccug 3180 uccaggcagg cagguccaau cugcuugguc gcccacaacg guuuugacua cgacuuccca 3240 cugcucugug ccgaacugcg ucgccuggga gcacgccuuc cucgggauac cgugugccug 3300 gacacccuac ccgcucugcg uggacuggac agagcccacu cacacggcac uagggcgaga 3360 ggacgccagg guuacagccu cgguucacug uuccaucggu auuucagggc agagccuucc 3420 gcagcccauu cagccgaagg cgauguccac accuugcuuc ugaucuuccu gcaucgugca 3480 gcagaacugc ucgccugggc agaugagcag gcucguggau gggcucacau ugagccgaug 3540 uacuugccac cugaugaccc uagccuggaa gccuga 3576 <210> 79 <211> 1191 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL-Trex2 protein construct <400> 79 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 530 535 540 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 545 550 555 560 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 565 570 575 Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala 580 585 590 Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro 595 600 605 Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile 610 615 620 Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala 625 630 635 640 Ile Ser Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp 645 650 655 Thr Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile 660 665 670 Leu Asn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe 675 680 685 Thr Ile Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln 690 695 700 Ser Thr Trp Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val 705 710 715 720 Ser Leu Val Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His 725 730 735 Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu 740 745 750 Phe Lys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu 755 760 765 Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly 770 775 780 Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu 785 790 795 800 Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly 805 810 815 Phe Thr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn 820 825 830 Val Asn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His 835 840 845 Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys 850 855 860 Gly His Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe 865 870 875 880 Arg Val Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe 885 890 895 Gln Glu Asn Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp 900 905 910 Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser 915 920 925 Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 930 935 940 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Ser Glu Ala Pro 945 950 955 960 Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu Ala Thr Gly Leu Pro 965 970 975 Ser Val Glu Pro Glu Ile Ala Glu Leu Ser Leu Phe Ala Val His Arg 980 985 990 Ser Ser Leu Glu Asn Pro Glu His Asp Glu Ser Gly Ala Leu Val Leu 995 1000 1005 Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met Cys Pro Glu Arg 1010 1015 1020 Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu Ser Ser Glu 1025 1030 1035 Gly Leu Ala Arg Cys Arg Lys Ala Gly Phe Asp Gly Ala Val Val 1040 1045 1050 Arg Thr Leu Gln Ala Phe Leu Ser Arg Gln Ala Gly Pro Ile Cys 1055 1060 1065 Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys 1070 1075 1080 Ala Glu Leu Arg Arg Leu Gly Ala Arg Leu Pro Arg Asp Thr Val 1085 1090 1095 Cys Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His 1100 1105 1110 Ser His Gly Thr Arg Ala Arg Gly Arg Gln Gly Tyr Ser Leu Gly 1115 1120 1125 Ser Leu Phe His Arg Tyr Phe Arg Ala Glu Pro Ser Ala Ala His 1130 1135 1140 Ser Ala Glu Gly Asp Val His Thr Leu Leu Leu Ile Phe Leu His 1145 1150 1155 Arg Ala Ala Glu Leu Leu Ala Trp Ala Asp Glu Gln Ala Arg Gly 1160 1165 1170 Trp Ala His Ile Glu Pro Met Tyr Leu Pro Pro Asp Asp Pro Ser 1175 1180 1185 Leu Glu Ala 1190 <210> 80 <211> 3528 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL-ExoX DNA construct <400> 80 atgggatcct gcaggccacc taagaagaaa cgcaaagtcg tggatctacg cacgctcggc 60 tacagtcagc agcagcaaga gaagatcaaa ccgaaggtgc gttcgacagt ggcgcagcac 120 cacgaggcac tggtgggcca tgggtttaca cacgcgcaca tcgttgcgct cagccaacac 180 ccggcagcgt tagggaccgt cgctgtcacg tatcagcaca taatcacggc gttgccagag 240 gcgacacacg aagacatcgt tggcgtcggc aaacagtggt ccggcgcacg cgccctggag 300 gccttgctca cggatgcggg ggagttgaga ggtccgccgt tacagttgga cacaggccaa 360 cttgtgaaga ttgcaaaacg tggcggcgtg accgcaatgg aggcagtgca tgcatcgcgc 420 aatgcactga cgggtgcccc cctgaaccta acccctgatc aggtagtcgc tatagcttca 480 aacaacgggg gcaagcaagc actggagacc gttcaacgac tcctgccagt gctctgccaa 540 gaccacggac ttacgccaga tcaggtggtt gctattgcct ccaacaatgg cgggaaacaa 600 gcgttggaaa ctgtgcagag actgttacct gtcttgtgtc aagaccacgg cctcacgcca 660 gatcaggtgg tagccatagc gtcgaatgga ggtggtaagc aagcccttga aacggtccag 720 cgtcttctgc cggtgttgtg ccaggaccac ggactaacgc cggatcaggt cgtagccatt 780 gcttcaaata acggcggcaa acaggcgcta gagacagtcc agcgcctctt gcctgtgtta 840 tgccaggatc acggcttaac cccagaccaa gttgtggcta ttgcatctaa caatggtggc 900 aaacaagcct tggagacagt gcaacgatta ctgcctgtct tatgtcagga tcatggcctg 960 acgcccgatc aggtagtggc aatcgcatct aataatggag gtaagcaagc actggagact 1020 gtccagagat tgttacccgt actatgtcaa gatcatggtt tgacgcctga tcaggttgtt 1080 gcgatagcca gcaacaacgg agggaaacag gctcttgaaa ccgtacagcg acttctccca 1140 gtcttgtgcc aagatcacgg gcttactcct gatcaagtcg tagctatcgc cagccacgac 1200 ggtgggaaac aggccctgga aaccgtacaa cgtctcctcc cagtactttg tcaagaccac 1260 gggttgactc cggatcaagt cgtcgcgatc gcgagcaatg gaggggggaa gcaggcgctg 1320 gaaactgttc agagactgct gcctgtactt tgtcaggacc atggtctgac acctgaccaa 1380 gttgtggcga tagccagtaa caatggggga aaacaggcac tagagacggt tcaaaggttg 1440 ttgcccgttc tgtgccagga ccacggcttg acaccggatc aggtggtagc tatcgcttca 1500 cacgatggcg gaaaacaggc tttagaaaca gtccaaagac ttctcccagt cctttgtcag 1560 gaccacggat tgactccaga tcaagtcgtt gctattgcaa gtaatggtgg tggtaagcaa 1620 gctttagaaa ccgtacagag gcttttgcca gtgctgtgcc aggaccatgg actgacccct 1680 gatcaagtgg tagcaattgc atctcatgat ggaggaaaac aagctctgga aagcattgtg 1740 gcccagctga gccggcctga tccggcgttg gccgcgttga ccaacgacca cctcgtcgcc 1800 ttggcctgcc tcggcggacg tcctgccatg gatgcagtga aaaagggatt gccgcacgcg 1860 ccggaattga tcagaagagt caatcgccgt attggcgaac gcacgtccca tcgcgttgcg 1920 atatctagag tgggaggaag ctctcgcaga gagtccatca acccatggac tctgactggt 1980 ttcgctgatg ccgaaggatc attcgggcta agcatcctca acagaaacag aggtactgct 2040 agataccaca ctcgactgtc attcacaatc atgctgcaca acaaggacaa atcgattctg 2100 gagaatatcc agtcgacttg gaaggtcggc agcatcctca acaatggcga ccactacgtc 2160 tcgctggtgg tctaccgttt cgaagatttg aaagtgatta tcgaccactt cgagaaatat 2220 ccgctgataa cacagaaatt gggcgattac aagttgttta aacaggcatt cagcgtcatg 2280 gagaacaaag aacatcttaa ggagaatggg attaaggagc tcgtacgaat caaagctaag 2340 atgaattggg gtctcaatga cgaattgaaa aaagcatttc cagaggtgat tagcagggag 2400 cgccccctta tcaataagaa cattccgaat gggaaatggc tggctggatt cacatctggt 2460 gatggctcct tcttcgtgcg cctaagaaag tctaatgtta atgctagagt acgtgtgcaa 2520 ctggtattcg agatctcaca gcacatcaga gacaagaacc tgatgaattc attgataaca 2580 tacctaggct gtggtcacat ctacgaggga aacaaatctg agcgcagttg gctccaattc 2640 agagtagaaa aattcagcga tatcaacgac aagatcattc cggtattcca ggaaaatact 2700 ctgattggca tgaaactcga ggactttgaa gattggtgca aggttgccaa attgatcgaa 2760 gagaagaaac acctgaccga atccggtttg gatgagatta agaaaatcaa gctgaacatg 2820 aacaaaagac gtggtggagg cggtagcgga ggcggagggt cggctagcct gcggatcata 2880 gacacggaaa cctgtggact ccagggtggt atcgtggaga tagccagtgt cgatgtaatt 2940 gatgggaaaa tcgtaaaccc gatgagccac ctcgtccgac cggataggcc gataagtccg 3000 caggctatgg ctatacatag aatcacggag gctatggtag ctgacaagcc ttggatcgag 3060 gacgttatcc cacactacta tgggagcgaa tggtatgtag cgcacaacgc atcatttgat 3120 aggcgcgtgc ttcccgaaat gcctggggag tggatttgca caatgaaact cgctcgccga 3180 ctgtggcctg gtatcaagta tagtaacatg gcactttaca agacccgcaa actcaacgta 3240 cagacacctc cgggtctcca ccaccatagg gcactctatg attgttacat aaccgctgct 3300 ctccttatag acataatgaa tacctccggg tggaccgccg aacaaatggc agacataacg 3360 ggaagaccta gtttgatgac aacctttaca tttggaaagt atcggggcaa ggcggtgagc 3420 gatgtggccg aaagagatcc cggttatctt agatggctct tcaataactt ggattctatg 3480 tcacctgaac ttcgccttac cctgaagcat taccttgaga atacctga 3528 <210> 81 <211> 3528 <212> RNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL-ExoX RNA construct <400> 81 augggauccu gcaggccacc uaagaagaaa cgcaaagucg uggaucuacg cacgcucggc 60 uacagucagc agcagcaaga gaagaucaaa ccgaaggugc guucgacagu ggcgcagcac 120 cacgaggcac uggugggcca uggguuuaca cacgcgcaca ucguugcgcu cagccaacac 180 ccggcagcgu uagggaccgu cgcugucacg uaucagcaca uaaucacggc guugccagag 240 gcgacacacg aagacaucgu uggcgucggc aaacaguggu ccggcgcacg cgcccuggag 300 gccuugcuca cggaugcggg ggaguugaga gguccgccgu uacaguugga cacaggccaa 360 cuugugaaga uugcaaaacg uggcggcgug accgcaaugg aggcagugca ugcaucgcgc 420 aaugcacuga cgggugcccc ccugaaccua accccugauc agguagucgc uauagcuuca 480 aacaacgggg gcaagcaagc acuggagacc guucaacgac uccugccagu gcucugccaa 540 gaccacggac uuacgccaga ucaggugguu gcuauugccu ccaacaaugg cgggaaacaa 600 gcguuggaaa cugugcagag acuguuaccu gucuuguguc aagaccacgg ccucacgcca 660 gaucaggugg uagccauagc gucgaaugga ggugguaagc aagcccuuga aacgguccag 720 cgucuucugc cgguguugug ccaggaccac ggacuaacgc cggaucaggu cguagccauu 780 gcuucaaaua acggcggcaa acaggcgcua gagacagucc agcgccucuu gccuguguua 840 ugccaggauc acggcuuaac cccagaccaa guuguggcua uugcaucuaa caaugguggc 900 aaacaagccu uggagacagu gcaacgauua cugccugucu uaugucagga ucauggccug 960 acgcccgauc agguaguggc aaucgcaucu aauaauggag guaagcaagc acuggagacu 1020 guccagagau uguuacccgu acuaugucaa gaucaugguu ugacgccuga ucagguuguu 1080 gcgauagcca gcaacaacgg agggaaacag gcucuugaaa ccguacagcg acuucuccca 1140 gucuugugcc aagaucacgg gcuuacuccu gaucaagucg uagcuaucgc cagccacgac 1200 ggugggaaac aggcccugga aaccguacaa cgucuccucc caguacuuug ucaagaccac 1260 ggguugacuc cggaucaagu cgucgcgauc gcgagcaaug gaggggggaa gcaggcgcug 1320 gaaacuguuc agagacugcu gccuguacuu ugucaggacc auggucugac accugaccaa 1380 guuguggcga uagccaguaa caauggggga aaacaggcac uagagacggu ucaaagguug 1440 uugcccguuc ugugccagga ccacggcuug acaccggauc aggugguagc uaucgcuuca 1500 cacgauggcg gaaaacaggc uuuagaaaca guccaaagac uucucccagu ccuuugucag 1560 gaccacggau ugacuccaga ucaagucguu gcuauugcaa guaauggugg ugguaagcaa 1620 gcuuuagaaa ccguacagag gcuuuugcca gugcugugcc aggaccaugg acugaccccu 1680 gaucaagugg uagcaauugc aucucaugau ggaggaaaac aagcucugga aagcauugug 1740 gcccagcuga gccggccuga uccggcguug gccgcguuga ccaacgacca ccucgucgcc 1800 uuggccugcc ucggcggacg uccugccaug gaugcaguga aaaagggauu gccgcacgcg 1860 ccggaauuga ucagaagagu caaucgccgu auuggcgaac gcacguccca ucgcguugcg 1920 auaucuagag ugggaggaag cucucgcaga gaguccauca acccauggac ucugacuggu 1980 uucgcugaug ccgaaggauc auucgggcua agcauccuca acagaaacag agguacugcu 2040 agauaccaca cucgacuguc auucacaauc augcugcaca acaaggacaa aucgauucug 2100 gagaauaucc agucgacuug gaaggucggc agcauccuca acaauggcga ccacuacguc 2160 ucgcuggugg ucuaccguuu cgaagauuug aaagugauua ucgaccacuu cgagaaauau 2220 ccgcugauaa cacagaaauu gggcgauuac aaguuguuua aacaggcauu cagcgucaug 2280 gagaacaaag aacaucuuaa ggagaauggg auuaaggagc ucguacgaau caaagcuaag 2340 augaauuggg gucucaauga cgaauugaaa aaagcauuuc cagaggugau uagcagggag 2400 cgcccccuua ucaauaagaa cauuccgaau gggaaauggc uggcuggauu cacaucuggu 2460 gauggcuccu ucuucgugcg ccuaagaaag ucuaauguua augcuagagu acgugugcaa 2520 cugguauucg agaucucaca gcacaucaga gacaagaacc ugaugaauuc auugauaaca 2580 uaccuaggcu guggucacau cuacgaggga aacaaaucug agcgcaguug gcuccaauuc 2640 agaguagaaa aauucagcga uaucaacgac aagaucauuc cgguauucca ggaaaauacu 2700 cugauuggca ugaaacucga ggacuuugaa gauuggugca agguugccaa auugaucgaa 2760 gagaagaaac accugaccga auccgguuug gaugagauua agaaaaucaa gcugaacaug 2820 aacaaaagac gugguggagg cgguagcgga ggcggagggu cggcuagccu gcggaucaua 2880 gacacggaaa ccuguggacu ccaggguggu aucguggaga uagccagugu cgauguaauu 2940 gaugggaaaa ucguaaaccc gaugagccac cucguccgac cggauaggcc gauaaguccg 3000 caggcuaugg cuauacauag aaucacggag gcuaugguag cugacaagcc uuggaucgag 3060 gacguuaucc cacacuacua ugggagcgaa ugguauguag cgcacaacgc aucauuugau 3120 aggcgcgugc uucccgaaau gccuggggag uggauuugca caaugaaacu cgcucgccga 3180 cuguggccug guaucaagua uaguaacaug gcacuuuaca agacccgcaa acucaacgua 3240 cagacaccuc cgggucucca ccaccauagg gcacucuaug auuguuacau aaccgcugcu 3300 cuccuuauag acauaaugaa uaccuccggg uggaccgccg aacaaauggc agacauaacg 3360 ggaagaccua guuugaugac aaccuuuaca uuuggaaagu aucggggcaa ggcggugagc 3420 gauguggccg aaagagaucc cgguuaucuu agauggcucu ucaauaacuu ggauucuaug 3480 ucaccugaac uucgccuuac ccugaagcau uaccuugaga auaccuga 3528 <210> 82 <211> 1175 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL-ExoX protein construct <400> 82 Met Gly Ser Cys Arg Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu 1 5 10 15 Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys 20 25 30 Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly 35 40 45 Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu 50 55 60 Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu 65 70 75 80 Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala 85 90 95 Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro 100 105 110 Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly 115 120 125 Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr 130 135 140 Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 145 150 155 160 Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 165 170 175 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 180 185 190 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 195 200 205 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 210 215 220 Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 225 230 235 240 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 245 250 255 Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr 260 265 270 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 275 280 285 Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu 290 295 300 Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu 305 310 315 320 Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln 325 330 335 Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His 340 345 350 Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly 355 360 365 Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln 370 375 380 Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp 385 390 395 400 Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu 405 410 415 Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser 420 425 430 Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro 435 440 445 Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile 450 455 460 Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu 465 470 475 480 Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val 485 490 495 Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln 500 505 510 Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln 515 520 525 Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr 530 535 540 Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro 545 550 555 560 Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu 565 570 575 Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala 580 585 590 Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro 595 600 605 Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile 610 615 620 Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala 625 630 635 640 Ile Ser Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp 645 650 655 Thr Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile 660 665 670 Leu Asn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe 675 680 685 Thr Ile Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln 690 695 700 Ser Thr Trp Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val 705 710 715 720 Ser Leu Val Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His 725 730 735 Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu 740 745 750 Phe Lys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu 755 760 765 Asn Gly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly 770 775 780 Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu 785 790 795 800 Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly 805 810 815 Phe Thr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn 820 825 830 Val Asn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His 835 840 845 Ile Arg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys 850 855 860 Gly His Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe 865 870 875 880 Arg Val Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe 885 890 895 Gln Glu Asn Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp 900 905 910 Cys Lys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser 915 920 925 Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg 930 935 940 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Leu Arg Ile Ile 945 950 955 960 Asp Thr Glu Thr Cys Gly Leu Gln Gly Gly Ile Val Glu Ile Ala Ser 965 970 975 Val Asp Val Ile Asp Gly Lys Ile Val Asn Pro Met Ser His Leu Val 980 985 990 Arg Pro Asp Arg Pro Ile Ser Pro Gln Ala Met Ala Ile His Arg Ile 995 1000 1005 Thr Glu Ala Met Val Ala Asp Lys Pro Trp Ile Glu Asp Val Ile 1010 1015 1020 Pro His Tyr Tyr Gly Ser Glu Trp Tyr Val Ala His Asn Ala Ser 1025 1030 1035 Phe Asp Arg Arg Val Leu Pro Glu Met Pro Gly Glu Trp Ile Cys 1040 1045 1050 Thr Met Lys Leu Ala Arg Arg Leu Trp Pro Gly Ile Lys Tyr Ser 1055 1060 1065 Asn Met Ala Leu Tyr Lys Thr Arg Lys Leu Asn Val Gln Thr Pro 1070 1075 1080 Pro Gly Leu His His His Arg Ala Leu Tyr Asp Cys Tyr Ile Thr 1085 1090 1095 Ala Ala Leu Leu Ile Asp Ile Met Asn Thr Ser Gly Trp Thr Ala 1100 1105 1110 Glu Gln Met Ala Asp Ile Thr Gly Arg Pro Ser Leu Met Thr Thr 1115 1120 1125 Phe Thr Phe Gly Lys Tyr Arg Gly Lys Ala Val Ser Asp Val Ala 1130 1135 1140 Glu Arg Asp Pro Gly Tyr Leu Arg Trp Leu Phe Asn Asn Leu Asp 1145 1150 1155 Ser Met Ser Pro Glu Leu Arg Leu Thr Leu Lys His Tyr Leu Glu 1160 1165 1170 Asn Thr 1175 <210> 83 <211> 870 <212> RNA <213> Homo sapiens <400> 83 augguccaga ucccacaggc gcccuggcca gucgucuggg cggugcuaca acugggcugg 60 cggccaggau gguucuuaga cuccccagac aggcccugga acccccccac cuucucccca 120 gcccugcucg uggugaccga aggggacaac gccaccuuca ccugcagcuu cuccaacaca 180 ucggagagcu ucgugcuaaa cugguaccgc augagcccca gcaaccagac ggacaagcug 240 gccgccuucc ccgaggaccg cagccagccc ggccaggacu gccgcuuccg ugucacacaa 300 cugcccaacg ggcgugacuu ccacaugagc guggucaggg cccggcgcaa ugacagcggc 360 accuaccucu guggggccau cucccuggcc cccaaggcgc agaucaaaga gagccugcgg 420 gcagagcuca gggugacaga gagaagggca gaagugccca cagcccaccc cagccccuca 480 cccaggccag ccggccaguu ccaaacccug gugguuggug ucgugggcgg ccugcugggc 540 agccuggugc ugcuagucug gguccuggcc gucaucugcu cccgggccgc acgagggaca 600 auaggagcca ggcgcaccgg ccagccccug aaggaggacc ccucagccgu gccuguguuc 660 ucuguggacu auggggagcu ggauuuccag uggcgagaga agaccccgga gccccccgug 720 cccugugucc cugagcagac ggaguaugcc accauugucu uuccuagcgg aaugggcacc 780 ucaucccccg cccgcagggg cucagcugac ggcccucgga gugcccagcc acugaggccu 840 gaggauggac acugcucuug gccccucuga 870 <210> 84 <211> 869 <212> RNA <213> Artificial sequence <220> <223> mock-edited PD-1 open reading frame with deletion <400> 84 augguccaga cccacaggcg cccuggccag ucgucugggc ggugcuacaa cugggcuggc 60 ggccaggaug guucuuagac uccccagaca ggcccuggaa cccccccacc uucuccccag 120 cccugcucgu ggugaccgaa ggggacaacg ccaccuucac cugcagcuuc uccaacacau 180 cggagagcuu cgugcuaaac ugguaccgca ugagccccag caaccagacg gacaagcugg 240 ccgccuuccc cgaggaccgc agccagcccg gccaggacug ccgcuuccgu gucacacaac 300 ugcccaacgg gcgugacuuc cacaugagcg uggucagggc ccggcgcaau gacagcggca 360 ccuaccucug uggggccauc ucccuggccc ccaaggcgca gaucaaagag agccugcggg 420 cagagcucag ggugacagag agaagggcag aagugcccac agcccacccc agccccucac 480 ccaggccagc cggccaguuc caaacccugg ugguuggugu cgugggcggc cugcugggca 540 gccuggugcu gcuagucugg guccuggccg ucaucugcuc ccgggccgca cgagggacaa 600 uaggagccag gcgcaccggc cagccccuga aggaggaccc cucagccgug ccuguguucu 660 cuguggacua uggggagcug gauuuccagu ggcgagagaa gaccccggag ccccccgugc 720 ccuguguccc ugagcagacg gaguaugcca ccauugucuu uccuagcgga augggcaccu 780 caucccccgc ccgcaggggc ucagcugacg gcccucggag ugcccagcca cugaggccug 840 aggauggaca cugcucuugg ccccucuga 869 <210> 85 <211> 868 <212> RNA <213> Artificial Sequence <220> <223> mock-edited PD-1 open reading frame with deletion <400> 85 augguccaga ccacaggcgc ccuggccagu cgucugggcg gugcuacaac ugggcuggcg 60 gccaggaugg uucuuagacu ccccagacag gcccuggaac ccccccaccu ucuccccagc 120 ccugcucgug gugaccgaag gggacaacgc caccuucacc ugcagcuucu ccaacacauc 180 ggagagcuuc gugcuaaacu gguaccgcau gagccccagc aaccagacgg acaagcuggc 240 cgccuucccc gaggaccgca gccagcccgg ccaggacugc cgcuuccgug ucacacaacu 300 gcccaacggg cgugacuucc acaugagcgu ggucagggcc cggcgcaaug acagcggcac 360 cuaccucugu ggggccaucu cccuggcccc caaggcgcag aucaaagaga gccugcgggc 420 agagcucagg gugacagaga gaagggcaga agugcccaca gcccacccca gccccucacc 480 caggccagcc ggccaguucc aaacccuggu gguugguguc gugggcggcc ugcugggcag 540 ccuggugcug cuagucuggg uccuggccgu caucugcucc cgggccgcac gagggacaau 600 aggagccagg cgcaccggcc agccccugaa ggaggacccc ucagccgugc cuguguucuc 660 uguggacuau ggggagcugg auuuccagug gcgagagaag accccggagc cccccgugcc 720 cugugucccu gagcagacgg aguaugccac cauugucuuu ccuagcggaa ugggcaccuc 780 aucccccgcc cgcaggggcu cagcugacgg cccucggagu gcccagccac ugaggccuga 840 ggauggacac ugcucuuggc cccucuga 868 <210> 86 <211> 867 <212> RNA <213> Artificial Sequence <220> <223> mock-edited PD-1 open reading frame with deletion <400> 86 augguccagc cacaggcgcc cuggccaguc gucugggcgg ugcuacaacu gggcuggcgg 60 ccaggauggu ucuuagacuc cccagacagg cccuggaacc cccccaccuu cuccccagcc 120 cugcucgugg ugaccgaagg ggacaacgcc accuucaccu gcagcuucuc caacacaucg 180 gagagcuucg ugcuaaacug guaccgcaug agccccagca accagacgga caagcuggcc 240 gccuuccccg aggaccgcag ccagcccggc caggacugcc gcuuccgugu cacacaacug 300 cccaacgggc gugacuucca caugagcgug gucagggccc ggcgcaauga cagcggcacc 360 uaccucugug gggccaucuc ccuggccccc aaggcgcaga ucaaagagag ccugcgggca 420 gagcucaggg ugacagagag aagggcagaa gugcccacag cccaccccag ccccucaccc 480 aggccagccg gccaguucca aacccuggug guuggugucg ugggcggccu gcugggcagc 540 cuggugcugc uagucugggu ccuggccguc aucugcuccc gggccgcacg agggacaaua 600 ggagccaggc gcaccggcca gccccugaag gaggaccccu cagccgugcc uguguucucu 660 guggacuaug gggagcugga uuuccagugg cgagagaaga ccccggagcc ccccgugccc 720 ugugucccug agcagacgga guaugccacc auugucuuuc cuagcggaau gggcaccuca 780 ucccccgccc gcaggggcuc agcugacggc ccucggagug cccagccacu gaggccugag 840 gauggacacu gcucuuggcc ccucuga 867 <210> 87 <211> 891 <212> DNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 87 tctcgcagag agtccatcaa cccatggatt ctgactggtt tcgctgatgc cgaaggatca 60 ttcatactag acatccgcaa ccgaaacaac gaaagcaaca gataccgaac ttcgctgaga 120 ttccagatca ccctgcacaa caaggacaaa tcgattctgg agaatatcca gtccacttgg 180 aaggtcggca agatcacaaa cagcagtgac agagccgtca tgctgagggt cacccgtttc 240 gaagatttga aagtgattat cgaccacttc gagaaatatc cgctgattac ccagaaattg 300 ggcgattaca agttgtttaa acaggcattc agcgtcatgg agaataaaga acatcttaag 360 gagaatggga ttaaggagct cgtacgaatc aaagctaaga tgaattgggg tctcaatgac 420 gaattgaaaa aagcatttcc agagaacatt agcaaagagc gcccccttat caataagaac 480 attccgaatt tcaaatggct ggctggattc acagctggtg aaggctactt cggcgtgaat 540 ctaaaaaagg taaagggcac cgcaaaggta tacgtgggac tgagattctc aatctcacag 600 cacatcagag acaagaacct gatgaattca ttgataacat acctaggctg tggttccatc 660 tgggagaaga acaagtctga gttcagatgg ctcgagttcg tcgtaaccaa attcagcgat 720 atcaacgaca agatcattcc ggtattccag gaaaatactc tgattggcgt caaactcgag 780 gactttgaag attggtgcaa ggttgccaaa ttgatcaaag agaagaaaca cctgaccgaa 840 tccggtttgg atgagattaa gaaaatcaag ctgaacatga acaaaggtcg t 891 <210> 88 <211> 891 <212> RNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 88 ucucgcagag aguccaucaa cccauggauu cugacugguu ucgcugaugc cgaaggauca 60 uucauacuag acauccgcaa ccgaaacaac gaaagcaaca gauaccgaac uucgcugaga 120 uuccagauca cccugcacaa caaggacaaa ucgauucugg agaauaucca guccacuugg 180 aaggucggca agaucacaaa cagcagugac agagccguca ugcugagggu cacccguuuc 240 gaagauuuga aagugauuau cgaccacuuc gagaaauauc cgcugauuac ccagaaauug 300 ggcgauuaca aguuguuuaa acaggcauuc agcgucaugg agaauaaaga acaucuuaag 360 gagaauggga uuaaggagcu cguacgaauc aaagcuaaga ugaauugggg ucucaaugac 420 gaauugaaaa aagcauuucc agagaacauu agcaaagagc gcccccuuau caauaagaac 480 auuccgaauu ucaaauggcu ggcuggauuc acagcuggug aaggcuacuu cggcgugaau 540 cuaaaaaagg uaaagggcac cgcaaaggua uacgugggac ugagauucuc aaucucacag 600 cacaucagag acaagaaccu gaugaauuca uugauaacau accuaggcug ugguuccauc 660 ugggagaaga acaagucuga guucagaugg cucgaguucg ucguaaccaa auucagcgau 720 aucaacgaca agaucauucc gguauuccag gaaaauacuc ugauuggcgu caaacucgag 780 gacuuugaag auuggugcaa gguugccaaa uugaucaaag agaagaaaca ccugaccgaa 840 uccgguuugg augagauuaa gaaaaucaag cugaacauga acaaaggucg u 891 <210> 89 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <220> <221> MOD_RES <222> (1)..(1) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Xaa is any amino acid or absent <400> 89 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg 20 25 30 Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala 165 170 175 Gly Glu Gly Tyr Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala 180 185 190 Lys Val Tyr Val Gly Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile 210 215 220 Trp Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Lys Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 90 <211> 882 <212> DNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 90 tccatcaacc catggattct gactggtttc gctgatgccg aaggatcatt catactagac 60 atccgcaacc gaaacaacga aagcaacaga taccgaactt cgctgagatt ccagatcacc 120 ctgcacaaca aggacaaatc gattctggag aatatccagt ccacttggaa ggtcggcaag 180 atcacaaaca gcagtgacag agccgtcatg ctgagggtca cccgtttcga agatttgaaa 240 gtgattatcg accacttcga gaaatatccg ctgattaccc agaaattggg cgattacaag 300 ttgtttaaac aggcattcag cgtcatggag aataaagaac atcttaagga gaatgggatt 360 aaggagctcg tacgaatcaa agctaagatg aattggggtc tcaatgacga attgaaaaaa 420 gcatttccag agaacattag caaagagcgc ccccttatca ataagaacat tccgaatttc 480 aaatggctgg ctggattcac agctggtgat ggccatttcg gcgtgaatct aaaaaaggta 540 aagggcaccg caaaggtata cgtgggactg agattcgcta tctcacagca catcagagac 600 aagaacctga tgaattcatt gataacatac ctaggctgtg gttccatcag agagaagaac 660 aagtctgagt tcagatggct cgagttcgaa gtaaccaaat tcagcgatat caacgacaag 720 atcattccgg tattccagga aaatactctg attggcgtca aactcgagga ctttgaagat 780 tggtgcaagg ttgccaaatt gatcgaagag aagaaacacc tgaccgaatc cggtttggat 840 gagattaaga aaatcaagct gaacatgaac aaaggtcgtt ga 882 <210> 91 <211> 882 <212> RNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 91 uccaucaacc cauggauucu gacugguuuc gcugaugccg aaggaucauu cauacuagac 60 auccgcaacc gaaacaacga aagcaacaga uaccgaacuu cgcugagauu ccagaucacc 120 cugcacaaca aggacaaauc gauucuggag aauauccagu ccacuuggaa ggucggcaag 180 aucacaaaca gcagugacag agccgucaug cugaggguca cccguuucga agauuugaaa 240 gugauuaucg accacuucga gaaauauccg cugauuaccc agaaauuggg cgauuacaag 300 uuguuuaaac aggcauucag cgucauggag aauaaagaac aucuuaagga gaaugggauu 360 aaggagcucg uacgaaucaa agcuaagaug aauugggguc ucaaugacga auugaaaaaa 420 gcauuuccag agaacauuag caaagagcgc ccccuuauca auaagaacau uccgaauuuc 480 aaauggcugg cuggauucac agcuggugau ggccauuucg gcgugaaucu aaaaaaggua 540 aagggcaccg caaagguaua cgugggacug agauucgcua ucucacagca caucagagac 600 aagaaccuga ugaauucauu gauaacauac cuaggcugug guuccaucag agagaagaac 660 aagucugagu ucagauggcu cgaguucgaa guaaccaaau ucagcgauau caacgacaag 720 aucauuccgg uauuccagga aaauacucug auuggcguca aacucgagga cuuugaagau 780 uggugcaagg uugccaaauu gaucgaagag aagaaacacc ugaccgaauc cgguuuggau 840 gagauuaaga aaaucaagcu gaacaugaac aaaggucguu ga 882 <210> 92 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <220> <221> MOD_RES <222> (1)..(1) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (5)..(5) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (6)..(6) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (7)..(7) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (8)..(8) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Xaa is any amino acid or absent <400> 92 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Ile Leu Asp Ile Arg Asn Arg 20 25 30 Asn Asn Glu Ser Asn Arg Tyr Arg Thr Ser Leu Arg Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Thr Asn Ser Ser Asp Arg Ala Val Met Leu Arg 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ala 165 170 175 Gly Asp Gly His Phe Gly Val Asn Leu Lys Lys Val Lys Gly Thr Ala 180 185 190 Lys Val Tyr Val Gly Leu Arg Phe Ala Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Ser Ile 210 215 220 Arg Glu Lys Asn Lys Ser Glu Phe Arg Trp Leu Glu Phe Glu Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 93 <211> 891 <212> DNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 93 tcgcgcagag agtccatcaa cccatggatt ctgactggtt tcgctgatgc cgaaggatgc 60 ttccgactag acatccgcaa cgcaaactcc atgcgtgtaa aatacagaac tagactgtcc 120 ttcgaaatcg tactgcacaa caaggacaaa tcgattctgg agaatatcca gtcgacttgg 180 aaggtcggca aaatcacaaa ctacggcgac agaggagtcc gcctgagagt cggccgtttc 240 gaagatttga aagtgattat cgaccacttc gagaaatatc cgctgataac acagaaattg 300 ggcgattaca agttgtttaa acaggcattc agcgtcatgg agaacaaaga acatcttaag 360 gagaatggga ttaaggagct cgtacgaatc aaagctaaga tgaattgggg tctcaatgac 420 gaattgaaaa aagcatttcc agagaacatt agcaaagagc gcccccttat caataagaac 480 atccccaatt tcaaatggct ggctggattc acatctggtg acggctcgtt catggtggaa 540 ctaatgaaga ataagaataa cgttattgta cgtgtgcgtc tgagattctc aatctcccag 600 cacatcagag acaagaacct gatgaattca ttgataacat acctaggctg tggtcgtatc 660 gttgagaata acaaatctga gcacagttgg ctcgaattca ttgtaacaaa attcagcgat 720 atcaacgaca agatcattcc ggtattccag gaaaatactc tgattggcgt caaactcgag 780 gactttgaag attggtgcaa ggttgccaaa ttgatcgaag agaagaaaca cctgaccgaa 840 tccggtttgg atgagattaa gaaaatcaag ctgaacatga acaaaggtcg t 891 <210> 94 <211> 891 <212> RNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 94 ucgcgcagag aguccaucaa cccauggauu cugacugguu ucgcugaugc cgaaggaugc 60 uuccgacuag acauccgcaa cgcaaacucc augcguguaa aauacagaac uagacugucc 120 uucgaaaucg uacugcacaa caaggacaaa ucgauucugg agaauaucca gucgacuugg 180 aaggucggca aaaucacaaa cuacggcgac agaggagucc gccugagagu cggccguuuc 240 gaagauuuga aagugauuau cgaccacuuc gagaaauauc cgcugauaac acagaaauug 300 ggcgauuaca aguuguuuaa acaggcauuc agcgucaugg agaacaaaga acaucuuaag 360 gagaauggga uuaaggagcu cguacgaauc aaagcuaaga ugaauugggg ucucaaugac 420 gaauugaaaa aagcauuucc agagaacauu agcaaagagc gcccccuuau caauaagaac 480 auccccaauu ucaaauggcu ggcuggauuc acaucuggug acggcucguu caugguggaa 540 cuaaugaaga auaagaauaa cguuauugua cgugugcguc ugagauucuc aaucucccag 600 cacaucagag acaagaaccu gaugaauuca uugauaacau accuaggcug uggucguauc 660 guugagaaua acaaaucuga gcacaguugg cucgaauuca uuguaacaaa auucagcgau 720 aucaacgaca agaucauucc gguauuccag gaaaauacuc ugauuggcgu caaacucgag 780 gacuuugaag auuggugcaa gguugccaaa uugaucgaag agaagaaaca ccugaccgaa 840 uccgguuugg augagauuaa gaaaaucaag cugaacauga acaaaggucg u 891 <210> 95 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <220> <221> MOD_RES <222> (1)..(1) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Xaa is any amino acid or absent <400> 95 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn Ala 20 25 30 Asn Ser Met Arg Val Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile Val 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Lys Ile Thr Asn Tyr Gly Asp Arg Gly Val Arg Leu Arg 65 70 75 80 Val Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Met Val Glu Leu Met Lys Asn Lys Asn Asn Val 180 185 190 Ile Val Arg Val Arg Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile 210 215 220 Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 96 <211> 891 <212> DNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 96 tcgcgcagag agtccatcaa cccatggatt ctgactggtt tcgctgatgc cgaaggatgc 60 ttccgactag acatccgcaa cgcaaacgat ttaagagccg gatacagaac tagactggcc 120 ttcgaaatcg tactgcacaa caaggacaaa tcgattctgg agaatatcca gtcgacttgg 180 aaggtcggca caatctacaa cgcgggcgac aacgcagtca gactgcaagt cacacgtttc 240 gaagatttga aagtgattat cgaccacttc gagaaatatc cgctgataac acagaaattg 300 ggcgattaca agttgtttaa acaggcattc agcgtcatgg agaacaaaga acatcttaag 360 gagaatggga ttaaggagct cgtacgaatc aaagctaaga tgaattgggg tctcaatgac 420 gaattgaaaa aagcatttcc agagaacatt agcaaagagc gctcccttat caataagaac 480 attccgaatc tcaaatggct ggctggattc acatctggtg acggctcgtt cgtggtggaa 540 ctaaagaaga gaagaagccc cgtcaaggta ggagtgcggc tgcgattcag catcacccag 600 cacatcagag acaagaacct gatgaattca ttgataacat acctaggctg tggtcgtatc 660 gttgagaata acaaatctga gcacagttgg ctcgaattca ttgtaacaaa attcagcgat 720 atcaacgaca agatcattcc ggtattccag gaaaatactc tgattggcgt caaactcgag 780 gactttgaag attggtgcaa ggttgccaaa ttgatcgaag agaagaaaca cctgaccgaa 840 tccggtttgg atgagattaa gaaaatcaag ctgaacatga acaaaggtcg t 891 <210> 97 <211> 891 <212> RNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 97 ucgcgcagag aguccaucaa cccauggauu cugacugguu ucgcugaugc cgaaggaugc 60 uuccgacuag acauccgcaa cgcaaacgau uuaagagccg gauacagaac uagacuggcc 120 uucgaaaucg uacugcacaa caaggacaaa ucgauucugg agaauaucca gucgacuugg 180 aaggucggca caaucuacaa cgcgggcgac aacgcaguca gacugcaagu cacacguuuc 240 gaagauuuga aagugauuau cgaccacuuc gagaaauauc cgcugauaac acagaaauug 300 ggcgauuaca aguuguuuaa acaggcauuc agcgucaugg agaacaaaga acaucuuaag 360 gagaauggga uuaaggagcu cguacgaauc aaagcuaaga ugaauugggg ucucaaugac 420 gaauugaaaa aagcauuucc agagaacauu agcaaagagc gcucccuuau caauaagaac 480 auuccgaauc ucaaauggcu ggcuggauuc acaucuggug acggcucguu cgugguggaa 540 cuaaagaaga gaagaagccc cgucaaggua ggagugcggc ugcgauucag caucacccag 600 cacaucagag acaagaaccu gaugaauuca uugauaacau accuaggcug uggucguauc 660 guugagaaua acaaaucuga gcacaguugg cucgaauuca uuguaacaaa auucagcgau 720 aucaacgaca agaucauucc gguauuccag gaaaauacuc ugauuggcgu caaacucgag 780 gacuuugaag auuggugcaa gguugccaaa uugaucgaag agaagaaaca ccugaccgaa 840 uccgguuugg augagauuaa gaaaaucaag cugaacauga acaaaggucg u 891 <210> 98 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <220> <221> MOD_RES <222> (1)..(1) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Xaa is any amino acid or absent <400> 98 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Cys Phe Arg Leu Asp Ile Arg Asn Ala 20 25 30 Asn Asp Leu Arg Ala Gly Tyr Arg Thr Arg Leu Ala Phe Glu Ile Val 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Thr Ile Tyr Asn Ala Gly Asp Asn Ala Val Arg Leu Gln 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Val Val Glu Leu Lys Lys Arg Arg Ser Pro Val 180 185 190 Lys Val Gly Val Arg Leu Arg Phe Ser Ile Thr Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile 210 215 220 Val Glu Asn Asn Lys Ser Glu His Ser Trp Leu Glu Phe Ile Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 99 <211> 443 <212> DNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 99 ttagcaggga gcgccccctt atcaataaga acattccgaa tgggaaatgg ctggctggat 60 tcacatctgg tgatggctcc ttcttcgtgc gcctaagaaa gtctaatgtt aatgctagag 120 tacgtgtgca actggtattc gagatctcac agcacatcag agacaagaac ctgatgaatt 180 cattgataac atacctaggc tgtggtcaca tctacgaggg aaacaaatct gagcgcagtt 240 ggctccaatt cagagtagaa aaattcagcg atatcaacga caagatcatt ccggtattcc 300 aggaaaatac tctgattggc atgaaactcg aggactttga agattggtgc aaggttgcca 360 aattgatcga agagaagaaa cacctgaccg aatccggttt ggatgagatt aagaaaatca 420 agctgaacat gaacaaaaga cgt 443 <210> 100 <211> 891 <212> RNA <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <400> 100 ucucgcagag aguccaucaa cccauggacu cugacugguu ucgcugaugc cgaaggauca 60 uucgggcuaa gcauccucaa cagaaacaga gguacugcua gauaccacac ucgacuguca 120 uucacaauca ugcugcacaa caaggacaaa ucgauucugg agaauaucca gucgacuugg 180 aaggucggca gcauccucaa caauggcgac cacuacgucu cgcugguggu cuaccguuuc 240 gaagauuuga aagugauuau cgaccacuuc gagaaauauc cgcugauaac acagaaauug 300 ggcgauuaca aguuguuuaa acaggcauuc agcgucaugg agaacaaaga acaucuuaag 360 gagaauggga uuaaggagcu cguacgaauc aaagcuaaga ugaauugggg ucucaaugac 420 gaauugaaaa aagcauuucc agaggugauu agcagggagc gcccccuuau caauaagaac 480 auuccgaaug ggaaauggcu ggcuggauuc acaucuggug auggcuccuu cuucgugcgc 540 cuaagaaagu cuaauguuaa ugcuagagua cgugugcaac ugguauucga gaucucacag 600 cacaucagag acaagaaccu gaugaauuca uugauaacau accuaggcug uggucacauc 660 uacgagggaa acaaaucuga gcgcaguugg cuccaauuca gaguagaaaa auucagcgau 720 aucaacgaca agaucauucc gguauuccag gaaaauacuc ugauuggcau gaaacucgag 780 gacuuugaag auuggugcaa gguugccaaa uugaucgaag agaagaaaca ccugaccgaa 840 uccgguuugg augagauuaa gaaaaucaag cugaacauga acaaaagacg u 891 <210> 101 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> Engineered variant of I-OnuI LHE <220> <221> MOD_RES <222> (1)..(1) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Xaa is any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Xaa is any amino acid or absent <400> 101 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Thr Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg 20 25 30 Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Met 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val Ser Leu Val 65 70 75 80 Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Val Ile Ser Arg Glu Arg Pro Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Gly Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala 180 185 190 Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile 210 215 220 Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Met Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Arg Arg Xaa Xaa 290 295 300 <210> 102 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <400> 102 Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Met Leu Phe Lys Gln 100 105 110 Ala Phe Cys Val Met Glu Asn Lys Glu His Leu Lys Ile Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Ile Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 290 295 300 <210> 103 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <400> 103 Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 290 295 300 <210> 104 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid or absent <400> 104 Xaa Xaa Xaa Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe 290 295 300 <210> 105 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Any amino acid or absent <400> 105 Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 106 <211> 303 <212> PRT <213> Ophiostoma novo-ulmi <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid or absent <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid or absent <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid or absent <220> <221> MOD_RES <222> (4)..(4) <223> Any amino acid or absent <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid or absent <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid or absent <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid or absent <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid or absent <220> <221> MOD_RES <222> (302)..(302) <223> Any amino acid or absent <220> <221> MOD_RES <222> (303)..(303) <223> Any amino acid or absent <400> 106 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr 1 5 10 15 Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn 20 25 30 Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr 35 40 45 Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp 50 55 60 Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys 65 70 75 80 Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys 85 90 95 Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln 100 105 110 Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile 115 120 125 Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp 130 135 140 Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu 145 150 155 160 Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser 165 170 175 Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu 180 185 190 Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp 195 200 205 Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile 210 215 220 Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr 225 230 235 240 Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn 245 250 255 Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val 260 265 270 Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp 275 280 285 Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa 290 295 300 <210> 107 <211> 660 <212> DNA <213> Escherichia coli <400> 107 atgctgcgga tcatagacac ggaaacctgt ggactccagg gtggtatcgt ggagatagcc 60 agtgtcgatg taattgatgg gaaaatcgta aacccgatga gccacctcgt ccgaccggat 120 aggccgataa gtccgcaggc tatggctata catagaatca cggaggctat ggtagctgac 180 aagccttgga tcgaggacgt tatcccacac tactatggga gcgaatggta tgtagcgcac 240 aacgcatcat ttgataggcg cgtgcttccc gaaatgcctg gggagtggat ttgcacaatg 300 aaactcgctc gccgactgtg gcctggtatc aagtatagta acatggcact ttacaagacc 360 cgcaaactca acgtacagac acctccgggt ctccaccacc atagggcact ctatgattgt 420 tacataaccg ctgctctcct tatagacata atgaatacct ccgggtggac cgccgaacaa 480 atggcagaca taacgggaag acctagtttg atgacaacct ttacatttgg aaagtatcgg 540 ggcaaggcgg tgagcgatgt ggccgaaaga gatcccggtt atcttagatg gctcttcaat 600 aacttggatt ctatgtcacc tgaacttcgc cttaccctga agcattacct tgagaatacc 660 <210> 108 <211> 660 <212> RNA <213> Escherichia coli <400> 108 augcugcgga ucauagacac ggaaaccugu ggacuccagg gugguaucgu ggagauagcc 60 agugucgaug uaauugaugg gaaaaucgua aacccgauga gccaccucgu ccgaccggau 120 aggccgauaa guccgcaggc uauggcuaua cauagaauca cggaggcuau gguagcugac 180 aagccuugga ucgaggacgu uaucccacac uacuauggga gcgaauggua uguagcgcac 240 aacgcaucau uugauaggcg cgugcuuccc gaaaugccug gggaguggau uugcacaaug 300 aaacucgcuc gccgacugug gccugguauc aaguauagua acauggcacu uuacaagacc 360 cgcaaacuca acguacagac accuccgggu cuccaccacc auagggcacu cuaugauugu 420 uacauaaccg cugcucuccu uauagacaua augaauaccu ccggguggac cgccgaacaa 480 auggcagaca uaacgggaag accuaguuug augacaaccu uuacauuugg aaaguaucgg 540 ggcaaggcgg ugagcgaugu ggccgaaaga gaucccgguu aucuuagaug gcucuucaau 600 aacuuggauu cuaugucacc ugaacuucgc cuuacccuga agcauuaccu ugagaauacc 660 <210> 109 <211> 220 <212> PRT <213> Escherichia coli <400> 109 Met Leu Arg Ile Ile Asp Thr Glu Thr Cys Gly Leu Gln Gly Gly Ile 1 5 10 15 Val Glu Ile Ala Ser Val Asp Val Ile Asp Gly Lys Ile Val Asn Pro 20 25 30 Met Ser His Leu Val Arg Pro Asp Arg Pro Ile Ser Pro Gln Ala Met 35 40 45 Ala Ile His Arg Ile Thr Glu Ala Met Val Ala Asp Lys Pro Trp Ile 50 55 60 Glu Asp Val Ile Pro His Tyr Tyr Gly Ser Glu Trp Tyr Val Ala His 65 70 75 80 Asn Ala Ser Phe Asp Arg Arg Val Leu Pro Glu Met Pro Gly Glu Trp 85 90 95 Ile Cys Thr Met Lys Leu Ala Arg Arg Leu Trp Pro Gly Ile Lys Tyr 100 105 110 Ser Asn Met Ala Leu Tyr Lys Thr Arg Lys Leu Asn Val Gln Thr Pro 115 120 125 Pro Gly Leu His His His Arg Ala Leu Tyr Asp Cys Tyr Ile Thr Ala 130 135 140 Ala Leu Leu Ile Asp Ile Met Asn Thr Ser Gly Trp Thr Ala Glu Gln 145 150 155 160 Met Ala Asp Ile Thr Gly Arg Pro Ser Leu Met Thr Thr Phe Thr Phe 165 170 175 Gly Lys Tyr Arg Gly Lys Ala Val Ser Asp Val Ala Glu Arg Asp Pro 180 185 190 Gly Tyr Leu Arg Trp Leu Phe Asn Asn Leu Asp Ser Met Ser Pro Glu 195 200 205 Leu Arg Leu Thr Leu Lys His Tyr Leu Glu Asn Thr 210 215 220 <210> 110 <211> 1425 <212> DNA <213> Escherichia coli <400> 110 atgaacgatg gcaagcagca aagtacattc cttttccacg actacgaaac ctttggaacc 60 caccccgctc tggatcggcc agcacagttc gctgccataa gaaccgacaa cgagttcaat 120 gtgatcggtg aacccgaggt gttttactgc aaacctgcgg acgattatct gcctcaaccg 180 ggagccgttc tgattacggg aattaccccc caagaagcgc gtgccaaggg cgaaaatgaa 240 gctgcatttg ccgctagaat ccatagcctg tttactgttc cgaagacgtg tatcttggga 300 tacaacaatg tacgctttga tgacgaagta actcgtaacg tgttctatcg gaacttctat 360 gacccttacg cctggagttg gcagcacgac aattctcgat gggatcttct ggatgtgatg 420 agagcctgct acgctctcag gccagagggc attaactggc ctgagaacga cgatgggctt 480 ccgtcatttc gccttgagca tcttaccaaa gcgaatggca tcgaacactc caatgcacac 540 gacgctatgg ctgatgtcta cgcgactatt gcaatggcga aattggtcaa gacaagacag 600 ccgaggttgt ttgactacct gtttacgcat cgaaacaaac ataagctcat ggcactgata 660 gatgtccctc aaatgaagcc cctcgttcac gtcagcggta tgttcggagc gtggagagga 720 aacacgtcct gggttgctcc tctggcatgg catccagaga acagaaacgc ggtaatcatg 780 gtcgatctcg caggagacat tagcccactt ctcgaattgg attccgacac cttgcgagaa 840 cgcctttaca cagcgaaaac tgatttgggt gataacgctg ccgtacctgt caaattggta 900 catatcaaca aatgtccggt gctcgcgcaa gccaacaccc tgagacctga agacgcggat 960 agactgggga taaaccggca gcactgtttg gataatctca agatactcag ggagaatccg 1020 caggtgcgcg aaaaagtcgt agccatcttt gcggaggcag aaccatttac gccgtctgac 1080 aatgtagatg ctcagttata caatggcttc tttagtgacg ctgaccgagc tgcgatgaag 1140 attgtgctag agactgaacc gagaaacctc tctgcattgg acatcacttt tgtcgataag 1200 cgaatagaga agttgctgtt caactatcgt gcccgaaact ttccagggac actcgattac 1260 gcagagcaac aaaggtggct tgagcatcgc aggcaggtgt ttaccccaga gttcttgcag 1320 ggttacgctg aggagattca aatgttggca cagcagtatg cagatgataa ggagaaagtc 1380 gcgttgctga aggctctgtg gcaatacgcc gaagagatag tgtga 1425 <210> 111 <211> 1425 <212> RNA <213> Escherichia coli <400> 111 augaacgaug gcaagcagca aaguacauuc cuuuuccacg acuacgaaac cuuuggaacc 60 caccccgcuc uggaucggcc agcacaguuc gcugccauaa gaaccgacaa cgaguucaau 120 gugaucggug aacccgaggu guuuuacugc aaaccugcgg acgauuaucu gccucaaccg 180 ggagccguuc ugauuacggg aauuaccccc caagaagcgc gugccaaggg cgaaaaugaa 240 gcugcauuug ccgcuagaau ccauagccug uuuacuguuc cgaagacgug uaucuuggga 300 uacaacaaug uacgcuuuga ugacgaagua acucguaacg uguucuaucg gaacuucuau 360 gacccuuacg ccuggaguug gcagcacgac aauucucgau gggaucuucu ggaugugaug 420 agagccugcu acgcucucag gccagagggc auuaacuggc cugagaacga cgaugggcuu 480 ccgucauuuc gccuugagca ucuuaccaaa gcgaauggca ucgaacacuc caaugcacac 540 gacgcuaugg cugaugucua cgcgacuauu gcaauggcga aauuggucaa gacaagacag 600 ccgagguugu uugacuaccu guuuacgcau cgaaacaaac auaagcucau ggcacugaua 660 gaugucccuc aaaugaagcc ccucguucac gucagcggua uguucggagc guggagagga 720 aacacguccu ggguugcucc ucuggcaugg cauccagaga acagaaacgc gguaaucaug 780 gucgaucucg caggagacau uagcccacuu cucgaauugg auuccgacac cuugcgagaa 840 cgccuuuaca cagcgaaaac ugauuugggu gauaacgcug ccguaccugu caaauuggua 900 cauaucaaca aauguccggu gcucgcgcaa gccaacaccc ugagaccuga agacgcggau 960 agacugggga uaaaccggca gcacuguuug gauaaucuca agauacucag ggagaauccg 1020 caggugcgcg aaaaagucgu agccaucuuu gcggaggcag aaccauuuac gccgucugac 1080 aauguagaug cucaguuaua caauggcuuc uuuagugacg cugaccgagc ugcgaugaag 1140 auugugcuag agacugaacc gagaaaccuc ucugcauugg acaucacuuu ugucgauaag 1200 cgaauagaga aguugcuguu caacuaucgu gcccgaaacu uuccagggac acucgauuac 1260 gcagagcaac aaagguggcu ugagcaucgc aggcaggugu uuaccccaga guucuugcag 1320 gguuacgcug aggagauuca aauguuggca cagcaguaug cagaugauaa ggagaaaguc 1380 gcguugcuga aggcucugug gcaauacgcc gaagagauag uguga 1425 <210> 112 <211> 474 <212> PRT <213> Escherichia coli <400> 112 Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr Glu 1 5 10 15 Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala Ala 20 25 30 Ile Arg Thr Asp Asn Glu Phe Asn Val Ile Gly Glu Pro Glu Val Phe 35 40 45 Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val Leu 50 55 60 Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn Glu 65 70 75 80 Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys Thr 85 90 95 Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr Arg 100 105 110 Asn Val Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp Gln 115 120 125 His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys Tyr 130 135 140 Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly Leu 145 150 155 160 Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu His 165 170 175 Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala Met 180 185 190 Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu Phe 195 200 205 Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro Gln 210 215 220 Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg Gly 225 230 235 240 Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg Asn 245 250 255 Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu Glu 260 265 270 Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr Asp 275 280 285 Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn Lys 290 295 300 Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala Asp 305 310 315 320 Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile Leu 325 330 335 Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala Glu 340 345 350 Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr Asn 355 360 365 Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu Glu 370 375 380 Thr Glu Pro Arg Asn Leu Ser Ala Leu Asp Ile Thr Phe Val Asp Lys 385 390 395 400 Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro Gly 405 410 415 Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg Gln 420 425 430 Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Glu Glu Ile Gln Met 435 440 445 Leu Ala Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu Lys 450 455 460 Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val 465 470 <210> 113 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 113 Gly Gly Gly 1 <210> 114 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 114 Asp Gly Gly Gly Ser 1 5 <210> 115 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 115 Thr Gly Glu Lys Pro 1 5 <210> 116 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 116 Gly Gly Arg Arg 1 <210> 117 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 117 Gly Gly Gly Gly Ser 1 5 <210> 118 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 118 Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp 1 5 10 <210> 119 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 119 Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser 1 5 10 15 Leu Asp <210> 120 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 120 Gly Gly Arg Arg Gly Gly Gly Ser 1 5 <210> 121 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 121 Leu Arg Gln Arg Asp Gly Glu Arg Pro 1 5 <210> 122 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 122 Leu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg Pro 1 5 10 <210> 123 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 123 Leu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg Pro 1 5 10 15 <210> 124 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Cleavage sequence by TEV protease <220> <221> misc_feature <222> (2)..(3) <223> Xaa is any amino acid <220> <221> misc_feature <222> (5)..(5) <223> Xaa is any amino acid <220> <221> MISC_FEATURE <222> (7)..(7) <223> Xaa = Gly or Ser <400> 124 Glu Xaa Xaa Tyr Xaa Gln Xaa 1 5 <210> 125 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Cleavage sequence by TEV protease <400> 125 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 126 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Cleavage sequence by TEV protease <400> 126 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 127 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 127 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 128 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 128 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 129 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 129 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro 1 5 10 <210> 130 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 130 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 131 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 131 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 132 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 132 Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 1 5 10 <210> 133 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 133 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 134 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 134 Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 135 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 135 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 136 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 136 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 137 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 137 Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val 1 5 10 15 Glu Ser Asn Pro Gly Pro 20 <210> 138 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 138 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 139 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 139 Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn 1 5 10 15 Pro Gly Pro <210> 140 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 140 Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn 1 5 10 15 Pro Gly Pro <210> 141 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 141 Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro 1 5 10 <210> 142 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 142 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 1 5 10 15 Pro <210> 143 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 143 Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 144 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 144 Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly 1 5 10 15 Asp Val Glu Ser Asn Pro Gly Pro 20 <210> 145 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 145 Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro 1 5 10 15 Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys 20 25 30 Ile Val Ala Pro Val Lys Gln Thr 35 40 <210> 146 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 146 Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro 1 5 10 15 Gly Pro <210> 147 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 147 Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val 1 5 10 15 Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly 20 25 30 Asp Val Glu Ser Asn Pro Gly Pro 35 40 <210> 148 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Self-cleaving polypeptide comprising 2A site <400> 148 Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu 1 5 10 15 Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly 20 25 30 Pro <210> 149 <211> 10 <212> DNA <213> Unknown <220> <223> Kozak sequence <400> 149 gccrccatgg 10 <210> 150 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 150 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 151 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 151 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 152 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 152 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser 20 <210> 153 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Exemplary linker sequence <400> 153 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 <210> 154 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polynucelotide section <400> 154 ctggtggggc tgctccaggc atgcagatcc cacaggcgcc c 41 <210> 155 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polynucelotide section with deletion <400> 155 ctggtggggc tgctccaggc atgcagccac aggcgccc 38 <210> 156 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polynucelotide section with deletion <400> 156 ctggtggggc tgctccaggc atgcagcaca ggcgccc 37 <210> 157 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polynucelotide section with deletion <400> 157 ctggtggggc tgctccaggc atgcacacag gcgccc 36 <210> 158 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polynucelotide section with deletion <400> 158 ctggtggggc tgctccacag gcgccc 26 <210> 159 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polypeptide section <400> 159 Met Gln Ile Pro Gln Ala Pro 1 5 <210> 160 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polypeptide section with deletion <400> 160 Met Gln Pro Gln Ala Pro 1 5 <210> 161 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polypeptide section with deletion <400> 161 Met Gln His Arg Arg Pro 1 5 <210> 162 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Made in Lab - PD-1 megaTAL polypeptide section with deletion <400> 162 Met His Thr Gly Ala Leu 1 5 <210> 163 <211> 29 <212> DNA <213> Homo sapiens <400> 163 gtggggtatg tgtgtgtccg gggctgccg 29 <210> 164 <211> 21 <212> DNA <213> Homo sapiens <400> 164 aacaaaagcg gctctgagtc t 21

Claims

DNA-결합 도메인 및 세포에서 선택된 이중 가닥 DNA(dsDNA) 표적 부위에 결합하여 이를 절단하는 귀소 엔도뉴클레아제(HE) 변이체; 링커 도메인; 및 엑소뉴클레아제 또는 이의 생물학적으로 활성인 단편을 포함하는, 융합 폴리펩티드.
제1항에 있어서, 엑소뉴클레아제는 Trex2, ExoI, 또는 ExoX, 또는 이의 생물학적으로 활성인 단편인, 융합 폴리펩티드.
제1항에 있어서, 엑소뉴클레아제는 ExoX, 또는 이의 생물학적으로 활성인 단편인, 융합 폴리펩티드.
제1항에 있어서, 엑소뉴클레아제는 ExoI, 또는 이의 생물학적으로 활성인 단편인, 융합 폴리펩티드.
제1항 내지 제4항 중 어느 한 항에 있어서, 귀소 엔도뉴클레아제는 조작된 귀소 엔도뉴클레아제인, 융합 폴리펩티드.
제1항 내지 제5항 중 어느 한 항에 있어서, 선택된 dsDNA 표적 부위는 비-천연 귀소 엔도뉴클레아제 표적 부위인, 융합 폴리펩티드.
제1항 내지 제6항 중 어느 한 항에 있어서, DNA-결합 도메인은 엔도뉴클레아제 dsDNA 표적 부위의 상류에 있는 dsDNA 표적 부위에 결합하는, 융합 폴리펩티드.
제1항 내지 제7항 중 어느 한 항에 있어서, DNA-결합 도메인은 TALE DNA-결합 도메인을 포함하는, 융합 폴리펩티드.
제1항 내지 제8항 중 어느 한 항에 있어서, TALE DNA 도메인은 약 9.5 TALE 반복 단위 내지 약 15.5 TALE 반복 단위를 포함하는, 융합 폴리펩티드.
제1항 내지 제9항 중 어느 한 항에 있어서, TALE DNA 도메인은 11.5 TALE 반복 단위 또는 12.5 TALE 반복 단위를 포함하는, 융합 폴리펩티드.
제1항 내지 제10항 중 어느 한 항에 있어서, DNA-결합 도메인은 징크 핑거 DNA-결합 도메인을 포함하는, 융합 폴리펩티드.
제11항에 있어서, 징크 핑거 DNA-결합 도메인은 2, 3, 4, 5, 6, 7, 또는 8개의 징크 핑거 모티프를 포함하는, 융합 폴리펩티드.
제1항 내지 제12항 중 어느 한 항에 있어서, 링커 도메인은 펩티드 링커인, 융합 폴리펩티드.
제13항에 있어서, 펩티드 링커는 자가-절단 펩티드 링커인, 융합 폴리펩티드.
제13항 또는 제14항에 있어서, 펩티드 링커는 약 4개 내지 약 30개의 아미노산을 포함하는, 융합 폴리펩티드.
제13항 내지 제15항 중 어느 한 항에 있어서, 펩티드 링커는 약 10개 내지 약 16개의 아미노산을 포함하는, 융합 폴리펩티드.
제13항 내지 제16항 중 어느 한 항에 있어서, 펩티드 링커는 약 12개의 아미노산을 포함하는, 융합 폴리펩티드.
제13항 내지 제17항 중 어느 한 항에 있어서, 펩티드 링커는 (GGGGS)_1-4 링커(서열번호 117 및 150 내지 152)인, 융합 폴리펩티드.
제13항 내지 제18항 중 어느 한 항에 있어서, 펩티드 링커는 (GGGGS)₂ 링커(서열번호 150)를 포함하는, 융합 폴리펩티드.
제1항 내지 제19항 중 어느 한 항에 있어서, HE 변이체는 LAGLIDADG 귀소 엔도뉴클레아제(LHE) 변이체인, 융합 폴리펩티드.
제1항 내지 제20항 중 어느 한 항에 있어서, HE 변이체는 상응하는 야생형 HE와 비교하여 1, 2, 3, 4, 5, 6, 7 또는 8개의 N-말단 아미노산이 결여되어 있는, 융합 폴리펩티드.
제1항 내지 제21항 중 어느 한 항에 있어서, HE 변이체는 상응하는 야생형 HE와 비교하여 4개의 N-말단 아미노산이 결여되어 있는, 융합 폴리펩티드.
제1항 내지 제21항 중 어느 한 항에 있어서, HE 변이체는 상응하는 야생형 HE와 비교하여 8개의 N-말단 아미노산이 결여되어 있는, 융합 폴리펩티드.
제1항 내지 제23항 중 어느 한 항에 있어서, HE 변이체는 상응하는 야생형 HE와 비교하여 1, 2, 3, 4 또는 5개의 C-말단 아미노산이 결여되어 있는, 융합 폴리펩티드.
제1항 내지 제24항 중 어느 한 항에 있어서, HE 변이체는 상응하는 야생형 HE와 비교하여 C-말단 아미노산이 결여되어 있는, 융합 폴리펩티드.
제1항 내지 제24항 중 어느 한 항에 있어서, HE 변이체는 상응하는 야생형 HE와 비교하여 2개의 C-말단 아미노산이 결여되어 있는, 융합 폴리펩티드.
제1항 내지 제26항 중 어느 한 항에 있어서, HE 변이체는 하기로 이루어진 군으로부터 선택되는 LHE의 변이체인, 융합 폴리펩티드: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-SceI, I-ScuMI, I-SmaMI, I-SscMI, 및 I-Vdi141I.
제1항 내지 제27항 중 어느 한 항에 있어서, HE 변이체는 하기로 이루어진 군으로부터 선택되는 LHE의 변이체인, 융합 폴리펩티드: I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, 및 I-SmaMI.
제1항 내지 제28항 중 어느 한 항에 있어서, HE 변이체는 I-OnuI LHE 변이체인, 융합 폴리펩티드.
제1항 내지 제29항 중 어느 한 항에 있어서, HE 표적 부위는 면역계 체크포인트 유전자, 글로빈 유전자, γ-글로빈 유전자 발현 및 HbF의 억제에 기여하는 폴리펩티드를 암호화하는 유전자, 또는 면역억제 신호전달 유전자 내에 있는, 융합 폴리펩티드.
제1항 내지 제29항 중 어느 한 항에 있어서, HE 표적 부위는 하기로 이루어진 군으로부터 선택된 유전자 내에 있는, 융합 폴리펩티드: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), TCRβ, IL10Rα, IL10Rβ, TGFBR1, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, BCL11A, KLF1, SOX6, GATA1, LSD1, 알파 엽산 수용체(FRα), αvβ6 인테그린, B 세포 성숙 항원(BCMA), B7-H3(CD276), B7-H6, 탄산 탈수효소 IX(CAIX), CD16, CD19, CD20, CD22, CD30, CD33, CD37, CD38, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD133, CD138, CD171, 암배아 항원(CEA), C형 렉틴-유사 분자-1(CLL-1), CD2 서브세트 1(CS-1), 콘드로이틴 설페이트 프로테오글리칸 4(CSPG4), 피부 T 세포 림프종-관련 항원 1(CTAGE1), 상피 성장 인자 수용체(EGFR), 상피 성장 인자 수용체 변이체 III(EGFRvIII), 상피 당단백질 2(EGP2), 상피 당단백질 40(EGP40), 상피 세포 부착 분자(EPCAM), 에프린 A형 수용체 2(EPHA2), 섬유아세포 활성화 단백질(FAP), Fc 수용체 유사 5(FCRL5), 태아 아세틸콜린에스터라제 수용체(AchR), 강글리오시드 G2(GD2), 강글리오시드 G3(GD3), 글리피칸-3(GPC3), ErbB2를 포함하는 EGFR 패밀리(HER2), IL-11Rα, IL-13Rα2, 카파 암/고환 항원 2(LAGE-1A), 람다, 루이스-Y(LeY), L1 세포 부착 분자(L1-CAM), 흑색종 항원 유전자(MAGE)-A1, MAGE-A3, MAGE-A4, MAGE-A6, MAGEA10, T 세포 1에 의해 인식되는 흑색종 항원(MelanA 또는 MART1), 메소텔린(MSLN), MUC1, MUC16, MHC 클래스 I 사슬 관련 단백질 A(MICA), MHC 클래스 I 사슬 관련 단백질 B(MICB), 신경 세포 부착 분자(NCAM), 암/고환 항원 1(NY-ESO-1), 폴리시알산; 태반-특이적 1(PLAC1), 흑색종에서 우선적으로 발현되는 항원(PRAME), 전립선 줄기 세포 항원(PSCA), 전립선-특이적 막 항원(PSMA), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 윤활막 육종, X 중단점 2(SSX2), 서바이빈, 종양 결합된 당단백질 72(TAG72), 종양 내피 마커 1(TEM1/CD248), 종양 내피 마커 7-관련(TEM7R), TEM5, TEM8, 영양막 당단백질(TPBG), UL16-결합 단백질(ULBP) 1, ULBP2, ULBP3, ULBP4, ULBP5, ULBP6, 혈관 내피 성장 인자 수용체 2(VEGFR2), 및 빌름스 종양 1(WT-1) 유전자.
제1항 내지 제29항 중 어느 한 항에 있어서, HE 표적 부위는 하기로 이루어진 군으로부터 선택된 유전자 내에 있는, 융합 폴리펩티드: 세포예정사 단백질 1(PD-1; PDCD1), 림프구 활성화 유전자 3 단백질(LAG-3), T 세포 면역글로불린 도메인 및 뮤신 도메인 단백질 3(TIM-3), 세포독성 T 림프구 항원-4(CTLA-4), 밴드 T 림프구 감쇠기(BTLA), T 세포 면역글로불린 및 면역수용체 티로신-기반 억제 모티프 도메인(TIGIT), T 세포 활성화의 V-도메인 Ig 억제제(VISTA), 및 킬러 세포 면역글로불린-유사 수용체(KIR), CCR5, TRAC(TCRα), IL10Rα, TGFBR2, CBL-B, PCSK9, AHR, BTK, α-글로빈, β-글로빈, γ-글로빈, 및 BCL11A 유전자.
제1항 내지 제29항 중 어느 한 항에 있어서, HE 표적 부위는 TRAC(TCRα) 유전자, CBL-B 유전자, 또는 PDCD1(PD-1) 유전자 내에 있는, 융합 폴리펩티드.
제33항에 있어서, TCRα 유전자 표적 부위는 서열번호 1에 제시된 아미노산 서열을 포함하거나, CBL-B 유전자 표적 부위는 서열번호 2에 제시된 아미노산 서열을 포함하거나, PD-1 유전자 표적 부위는 서열번호 3에 제시된 아미노산 서열을 포함하는, 융합 폴리펩티드.
제1항 내지 제34항 중 어느 한 항에 있어서, DNA-결합 도메인은 서열번호 4에 제시된 표적 부위를 갖는 TALE DNA-결합 도메인을 포함하는, 융합 폴리펩티드.
제3항 내지 제35항 중 어느 한 항에 있어서, ExoX, 또는 이의 생물학적으로 활성인 단편은 서열번호 109에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열인 아미노산을 포함하는, 융합 폴리펩티드.
제36항에 있어서, ExoX, 또는 이의 생물학적으로 활성인 단편은 서열번호 109에 제시된 아미노산 서열인 아미노산을 포함하는, 융합 폴리펩티드.
제36항에 있어서, 서열번호 46, 64, 73 및 82 중 어느 하나에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 갖는 아미노산 서열을 포함하는, 융합 폴리펩티드.
제36항에 있어서, 서열번호 46, 64, 73, 및 82 중 어느 하나에 제시된 아미노산 서열을 포함하는, 융합 폴리펩티드.
제4항 내지 제35항 중 어느 한 항에 있어서, ExoI, 또는 이의 생물학적으로 활성인 단편은 서열번호 112에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열인 아미노산을 포함하는, 융합 폴리펩티드.
제40항에 있어서, ExoI, 또는 이의 생물학적으로 활성인 단편은 서열번호 112에 제시된 아미노산 서열인 아미노산을 포함하는, 융합 폴리펩티드.
제40항에 있어서, 서열번호 43에 제시된 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 아미노산 서열을 포함하는, 융합 폴리펩티드.
제40항에 있어서, 서열번호 43에 제시된 아미노산 서열을 포함하는, 융합 폴리펩티드.
제1항 내지 제43항 중 어느 한 항의 융합 폴리펩티드를 암호화하는, 폴리뉴클레오티드.
제44항에 있어서, 폴리뉴클레오티드는 서열번호 44, 62, 71, 및 80 중 어느 하나에 제시된 폴리뉴클레오티드 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 뉴클레오티드 서열을 포함하는, 폴리뉴클레오티드.
제44항에 있어서, 폴리뉴클레오티드는 서열번호 44, 62, 71, 및 80 중 어느 하나에 제시된 폴리뉴클레오티드 서열을 포함하는, 폴리뉴클레오티드.
제1항 내지 제43항 중 어느 한 항의 폴리펩티드를 암호화하는, mRNA.
제47항에 있어서, mRNA는 서열번호 45, 63, 72, 및 81 중 어느 하나에 제시된 RNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 RNA 서열을 포함하는, mRNA.
제48항에 있어서, mRNA는 서열번호 45, 63, 72, 및 81 중 어느 하나에 제시된 RNA 서열을 포함하는, mRNA.
제47항에 있어서, mRNA는 서열번호 42에 제시된 RNA 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 동일성을 갖는 RNA 서열을 포함하는, mRNA.
제50항에 있어서, mRNA는 서열번호 42에 제시된 RNA 서열을 포함하는, mRNA.
제1항 내지 제43항 중 어느 한 항의 폴리펩티드를 암호화하는, 벡터.
제44항 내지 제46항 중 어느 한 항의 폴리뉴클레오티드를 포함하는, 벡터.
제1항 내지 제43항 중 어느 한 항의 폴리펩티드를 포함하는, 세포.
제44항 내지 제46항 중 어느 한 항의 폴리뉴클레오티드를 포함하는, 세포.
제47항 내지 제51항 중 어느 한 항의 mRNA를 포함하는, 세포.
제52항 또는 제53항의 벡터를 포함하는, 세포.
제54항 내지 제57항 중 어느 한 항에 있어서, 하나 이상의 게놈 변형을 포함하는, 세포.
제54항 내지 제58항 중 어느 한 항에 있어서, 세포는 조혈 세포인, 세포.
제54항 내지 제59항 중 어느 한 항에 있어서, 세포는 조혈 줄기 세포 또는 전구 세포인, 세포.
제54항 내지 제60항 중 어느 한 항에 있어서, 세포는 CD34+ 세포인, 세포.
제54항 내지 제61항 중 어느 한 항에 있어서, 세포는 CD133+ 세포인, 세포.
제54항 내지 제59항 중 어느 한 항에 있어서, 세포는 면역 효과기 세포인, 세포.
제63항에 있어서, 면역 효과기 세포는 세포독성 T 림프구(CTL), 종양 침윤 림프구(TIL), 또는 헬퍼 T 세포인, 세포.
제63항에 있어서, 면역 효과기 세포는 T 세포인, 세포.
제63 항에 있어서, 면역 효과기 세포는 αβ T 세포, γδ T 세포, 자연 살해(NK) 세포, 또는 자연 살해 T(NKT) 세포인, 세포.
제54항 내지 제66항 중 어느 한 항의 세포를 포함하는, 세포 집단.
제1항 내지 제43항 중 어느 한 항의 융합 폴리펩티드, 제44항 내지 제46항 중 어느 한 항의 폴리뉴클레오티드, 제47항 내지 제51항 중 어느 한 항의 mRNA, 제52항 또는 제53항의 벡터, 제54항 내지 제66항 중 어느 한 항의 세포, 또는 제67항의 세포 집단을 포함하는, 조성물.
제68항에 있어서, 약학적으로 허용되는 담체를 추가로 포함하는, 조성물.
부위-지향 돌연변이 유발 방법으로서,
a) 이중 가닥 DNA(dsDNA) 표적 부위를 선택하는 단계, 및
b) 제1항 내지 제43항 중 어느 한 항의 융합 폴리펩티드, 제44항 내지 제46항 중 어느 한 항의 폴리뉴클레오티드, 제47항 내지 제51항 중 어느 한 항의 mRNA, 제52항 또는 제53항의 벡터를 세포에 도입하는 단계를 포함하고;
상기 융합 펩티드는 세포에서 선택된 dsDNA 표적 절단 부위 근처에 결실 중심을 갖는 방향성 편향 결실을 생성하는, 방법.
제70항에 있어서, 방향성 편향 결실의 50% 초과, 51% 초과, 52% 초과, 53% 초과, 54% 초과, 55% 초과, 56% 초과, 57% 초과, 58% 초과, 59% 초과, 또는 60% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 50% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 55% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 60% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 65% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 70% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 75% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항에 있어서, 방향성 편향 결실의 80% 초과는 HE 표적 부위 중심 위치의 일 측면에 결실 중심 위치를 갖는, 방법.
제70항 내지 제78항 중 어느 한 항에 있어서, 결실 중심 위치는 상기 HE 표적 부위 중심 위치에 대해 DNA-결합 도메인 표적 부위와 동일한 측면에 있는, 방법.
제70항 내지 제79항 중 어느 한 항에 있어서, 결실 중심 위치는 HE 표적 부위 중심 위치에 대해 5’인, 방법.
제70항 내지 제80항 중 어느 한 항에 있어서, 결실의 적어도 50%, 적어도 51%, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 59%, 또는 적어도 60%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제81항 중 어느 한 항에 있어서, 결실의 적어도 50%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제81항 중 어느 한 항에 있어서, 결실의 적어도 55%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제81항 중 어느 한 항에 있어서, 결실의 적어도 65%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제81항 중 어느 한 항에 있어서, 결실의 적어도 70%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제81항 중 어느 한 항에 있어서, 결실의 적어도 75%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제81항 중 어느 한 항에 있어서, 결실의 적어도 80%는 HE 표적 부위 중심 위치로부터 4개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 10%, 적어도 11%, 적어도 12%, 적어도 13%, 적어도 14%, 적어도 15%, 적어도 16%, 적어도 17%, 적어도 18%, 적어도 19%, 또는 적어도 20%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 10%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 15%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 20%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 25%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 30%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제87항 중 어느 한 항에 있어서, 결실의 적어도 35%는 HE 표적 부위 중심 위치로부터 8개 초과의 뉴클레오티드 떨어진 결실 중심을 갖는, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 50%, 적어도 51%, 적어도 52%, 적어도 53%, 적어도 54%, 적어도 55%, 적어도 56%, 적어도 57%, 적어도 58%, 적어도 50%, 적어도 59%, 또는 적어도 60%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 50%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 55%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 60%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 65%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 70%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 75%는 길이가 6 bps 이상인, 방법.
제70항 내지 제94항 중 어느 한 항에 있어서, 결실의 적어도 80%는 길이가 6 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 30%, 적어도 31%, 적어도 32%, 적어도 33%, 적어도 34%, 적어도 35%, 적어도 36%, 적어도 37%, 적어도 38%, 적어도 39%, 또는 적어도 40%는 길이가 12 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 35%는 길이가 12 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 40%는 길이가 12 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 45%는 길이가 12 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 50%는 길이가 12 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 55%는 길이가 12 bps 이상인, 방법.
제70항 내지 제102항 중 어느 한 항에 있어서, 결실의 적어도 60%는 길이가 12 bps 이상인, 방법.
제70항 내지 제109항 중 어느 한 항에 있어서, 방향성 편향 결실은 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 또는 약 20개 뉴클레오티드의 길이를 포함하는, 방법.
제70항 내지 제110항 중 어느 한 항에 있어서, 결실은 DNA-결합 도메인 표적 부위 내로 연장되는, 방법.
제70항 내지 제110항 중 어느 한 항에 있어서, 결실 중심 위치는 DNA-결합 도메인 표적 부위 내에 있는, 방법.
제70항 내지 제112항 중 어느 한 항에 있어서, 말단-가공 효소 또는 이의 생물학적으로 활성인 단편을 세포에 도입하는 단계를 추가로 포함하는, 방법.
제70항 내지 제113항 중 어느 한 항에 있어서, 말단-가공 효소, 또는 이의 생물학적으로 활성인 단편은 하기로 이루어진 군으로부터 선택되는, 방법: Trex2, Trex1, 막관통 도메인이 없는 Trex1, Apollo, Artemis, DNA2, ExoI, ExoT, ExoIII, ExoX, Fen1, Fan1, MreII, Rad2, Rad9, TdT(말단 데옥시뉴클레오티딜 트랜스퍼라제), PNKP, RecE, RecJ, RecQ, 람다 엑소뉴클레아제, Sox, 우두 DNA 중합효소, 엑소뉴클레아제 I, 엑소뉴클레아제 III, 엑소뉴클레아제 VII, NDK1, NDK5, NDK7, NDK8, WRN, T7-엑소뉴클레아제 유전자 6, 조류 골수아세포 바이러스 통합 단백질(IN), 블룸(Bloom), 안타르틱 포스파타제(Antartic Phophatase), 알칼리 포스파타제(Alkaline Phosphatase), 폴리 뉴클레오티드 키나제(PNK), ApeI, 녹두 뉴클레아제, Hex1, TTRAP(TDP2), Sgs1, Sae2, CUP, Pol mu, Pol 람다, MUS81, EME1, EME2, SLX1, SLX4 및 UL-12.
제114항에 있어서, 말단 가공 효소는 엑소뉴클레아제, 또는 이의 생물학적으로 활성인 단편인, 방법.
제115항에 있어서, 엑소뉴클레아제는 Trex2, 또는 이의 생물학적으로 활성인 단편인, 방법.
제70항 내지 제116항 중 어느 한 항에 있어서, 방법은 시험관 내 방법인, 방법.
제70항 내지 제116항 중 어느 한 항에 있어서, 방법은 생체 외 방법인, 방법.
제70항 내지 제116항 중 어느 한 항에 있어서, 방법은 생체 내 방법인, 방법.
질환 또는 이와 관련된 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하는, 방법으로서, 상기 방법은 대상체로부터 세포 집단을 수확하는 단계; 제70항 내지 제119항 중 어느 한 항의 방법에 따른 세포 집단을 편집하는 단계, 및 편집된 세포 집단을 대상체에게 투여하는 단계를 포함하는, 방법.
질환 또는 이와 관련된 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하기 위한, 제54항 내지 제66항 중 어느 한 항의 세포의 사용.
질환 또는 이와 관련된 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하기 위한, 제67항의 세포의 집단의 사용.
질환 또는 이와 관련된 병태의 적어도 하나의 증상을 치료, 예방 또는 완화하기 위한, 제68항 또는 제69항의 조성물의 사용.
제120항 내지 제123항 중 어느 한 항에 있어서, 질환 또는 병태는 면역 장애 또는 암인, 방법 또는 사용.