KR102523318B1

KR102523318B1 - 증진된 ｈＡＴ 패밀리 트랜스포존 매개 유전자 전달 및 연관된 조성물, 시스템, 및 방법

Info

Publication number: KR102523318B1
Application number: KR1020197020507A
Authority: KR
Inventors: 데이빗 라르게스파다; 브랜든 모리아리티; 뷰 웨버; 네일 오토; 샌딥 쿠마르; 리아 호그달
Original assignee: 비-모젠 바이오테크놀로지스, 인크.
Priority date: 2016-12-16
Filing date: 2017-12-15
Publication date: 2023-04-18
Also published as: US20180327726A1; EP3555273A1; US10227574B2; IL267334A; CN110730821A; CN110730821B; US20200339965A1; US11111483B2; US20180216087A1; JP2020501612A; KR20190142313A; AU2017378482A1; JP7275043B2; EP3555273A4; WO2018112415A1; EA201991431A1; US20180245055A1; CA3047313A1; US20220112472A1; US11162084B2

Abstract

본 개시내용은 다양한 TcBuster 트랜스포사제 및 트랜스포존, 시스템, 및 사용 방법을 제공한다.

Description

증진된 ｈＡＴ 패밀리 트랜스포존 매개 유전자 전달 및 연관된 조성물, 시스템, 및 방법

상호 참조

본 출원은 2016년 12월 16일 출원된 미국 가출원 번호 제62/435,522호의 이익을 주장하며, 상기 출원은 그 전문이 본원에서 참조로 포함된다.

본 발명의 배경

트랜스포존으로도 불리는 전위가능 유전 요소는 단일 세포 내에서 한 게놈 위치로부터 또 다른 위치로 이동가능한 DNA 세그먼트이다. 트랜스포존은 그의 전위 기전에 따라 2개의 주요 군으로 나뉠 수 있으며: 전위는 (1) 레트로트랜스포존으로 명명되는 요소에 대한 RNA 중간체의 역전사를 통해, 및 (2) DNA 트랜스포존에 대한 말단 역위 반복부(TIR: terminal inverted repeat) 측면에 위치하는 DNA의 직접적인 전위를 통해 이루어질 수 있다. 활성 트랜스포존은 전위에 필요한 하나 이상의 단백질을 코딩한다. 천연 활성 DNA 트랜스포존은 트랜스포사제 효소 유전자를 보유한다.

hAT 패밀리에서 DNA 트랜스포존은 식물 및 동물에 널리 퍼져있다. Hermes 트랜스포존, Ac 트랜스포존, hobo 트랜스포존, 및 Tol2 트랜스포존을 포함하나, 이에 제한되지 않는 다수의 활성 hAT 트랜스포존 시스템이 확인되었으며, 기능성인 것으로 밝혀졌다. hAT 패밀리는 그의 트랜스포사제의 1차 서열에 기초하여 AC 서브패밀리 및 Buster 서브패밀리로 분류되는 2개의 패밀리로 구성된다. hAT 패밀리의 구성원들은 클래스 II 전위가능 요소에 속한다. 클래스 II 이동성 요소는 전위의 자르고 붙이는 기전을 이용한다. hAT 요소는 유사한 트랜스포사제, 짧은 말단 역위 반복부, 및 게놈 표적의 8개의 염기쌍 중복을 공유한다.

본 발명의 요약

본 개시내용의 한 측면은 전장의(full-length) 서열 번호 1과 70% 이상 동일한 아미노산 서열을 포함하고, 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 가지는 돌연변이체 TcBuster 트랜스포사제를 제공한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가진다.

본 개시내용의 또 다른 측면은 전장의 서열 번호 1과 70% 이상 동일한 아미노산 서열을 포함하고, DNA 결합 및 올리고머화 도메인; 삽입 도메인; Zn-BED 도메인; 또는 이의 조합에 하나 이상의 아미노산 치환을 가지는 돌연변이체 TcBuster 트랜스포사제를 제공한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가진다.

본 개시내용의 추가의 또 다른 측면은 전장의 서열 번호 1과 70% 이상 동일한 아미노산 서열을 포함하고, 하기 표 1로부터의 하나 이상의 아미노산 치환을 가지는 돌연변이체 TcBuster 트랜스포사제를 제공한다.

일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 촉매 도메인 내에 또는 그와 근접한 위치에 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함하고, 하나 이상의 아미노산은 서열 번호 1에 따라 넘버링되었을 때, D223, D289, 또는 E589와 근접하게 위치한다. 일부 실시양태에서, 근접은 약 80, 75, 70, 60, 50, 40, 30, 20, 10, 또는 5개의 아미노산의 거리이다. 일부 실시양태에서, 근접은 약 70 내지 80개의 아미노산의 거리이다.

일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제의 아미노산 서열은 전장의 서열 번호 1과 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상 동일하다.

일부 실시양태에서, 하나 이상의 아미노산 치환은 리신 또는 아르기닌에 대한 치환을 포함한다. 일부 실시양태에서, 하나 이상의 아미노산 치환은 아스파르트산 또는 글루탐산의 중성 아미노산, 리신 또는 아르기닌으로의 치환을 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 하기 표 4로부터의 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 하기 표 2로부터의 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 하기 표 3으로부터의 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 V377T, E469K, 및 D189A를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 K573E 및 E578L을 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 I452K를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 A358K를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 V297K를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 N85S를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 I452F, V377T, E469K, 및 D189A를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 A358K, V377T, E469K, 및 D189A를 포함한다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 V377T, E469K, D189A, K573E 및 E578L을 포함한다.

일부 실시양태에서, 전위 효율은 돌연변이체 TcBuster 트랜스포사제, 및 리포터 카르고 카세트(reporter cargo cassette)를 함유하는 TcBuster 트랜스포존을 세포 집단 내로 도입하는 단계, 및 세포 집단의 게놈에서 리포터 카르고 카세트의 전위를 검출하는 단계를 포함하는 검정법에 의해 측정된다.

본 개시내용의 추가의 또 다른 측면은 TcBuster 트랜스포사제 서열 및 DNA 서열 특이적 결합 도메인을 포함하는 융합 트랜스포사제를 제공한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 전장의 서열 번호 1과 70% 이상의 동일성을 가진다.

일부 실시양태에서, DNA 서열 특이적 결합 도메인은 TALE 도메인, 아연 핑거 도메인, AAV Rep DNA 결합 도메인, 또는 이의 임의 조합을 포함한다. 일부 실시양태에서, DNA 서열 특이적 결합 도메인은 TALE 도메인을 포함한다.

일부 실시양태에서, TcBuster 트랜스포사제 서열은 전장의 서열 번호 1과 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가진다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 DNA 결합 및 올리고머화 도메인; 삽입 도메인; Zn-BED 도메인; 또는 이의 조합에 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 표 1로부터의 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가진다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 촉매 도메인 내에 또는 그와 근접한 위치에 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함하고, 하나 이상의 아미노산 치환은 서열 번호 1에 따라 넘버링되었을 때, D223, D289, 또는 E589와 근접하게 위치한다. 일부 실시양태에서, 근접은 약 80, 75, 70, 60, 50, 40, 30, 20, 10, 또는 5개의 아미노산의 거리이다. 일부 실시양태에서, 근접은 약 70 내지 80개의 아미노산의 거리이다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 표 2로부터의 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 표 3으로부터의 하나 이상의 아미노산 치환을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 V377T, E469K, 및 D189A를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 K573E 및 E578L를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 I452K를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 A358K를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 V297K를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 N85S를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 I452F, V377T, E469K, 및 D189A를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 A358K, V377T, E469K, 및 D189A를 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 서열 번호 1에 따라 넘버링되었을 때, 아미노산 치환 V377T, E469K, D189A, K573E 및 E578L을 포함한다. 일부 실시양태에서, TcBuster 트랜스포사제 서열은 전장의 서열 번호 1과 100%의 동일성을 가진다.

융합 트랜스포사제의 일부 실시양태에서, TcBuster 트랜스포사제 서열 및 DNA 서열 특이적 결합 도메인은 링커에 의해 분리되어 있다. 일부 실시양태에서, 링커는 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 또는 적어도 50개의 아미노산을 포함한다. 일부 실시양태에서, 링커는 서열 번호 9를 포함한다.

본 개시내용의 추가의 또 다른 측면은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제를 코딩하는 폴리뉴클레오티드를 제공한다.

본 개시내용의 추가의 또 다른 측면은 본원에 기술된 바와 같은 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드를 제공한다.

일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 DNA를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 메신저 RNA(mRNA: messenger RNA)를 포함한다. 일부 실시양태에서, mRNA는 화학적으로 변형된 것이다. 일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 DNA 벡터에 존재한다. 일부 실시양태에서, DNA 벡터는 미니서클 플라스미드를 포함한다.

본 개시내용의 추가의 또 다른 측면은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 생산하는 세포를 제공한다. 본 개시내용의 추가의 또 다른 측면은 본원에 기술된 바와 같은 폴리뉴클레오티드를 함유하는 세포를 제공한다.

본 개시내용의 추가의 또 다른 측면은 세포 내로 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제, 및 돌연변이체 TcBuster 트랜스포사제에 의해 인식가능한 트랜스포존을 도입하는 단계를 포함하는 방법을 제공한다.

본 개시내용의 추가의 또 다른 측면은 세포 내로 본원에 기술된 바와 같은 융합 트랜스포사제, 및 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 도입하는 단계를 포함하는 방법을 제공한다.

방법의 일부 실시양태에서, 도입하는 단계는 세포를, 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드와 접촉시키는 것을 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 DNA를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 메신저 RNA(mRNA)를 포함한다. 일부 실시양태에서, mRNA는 화학적으로 변형된 것이다.

방법의 일부 실시양태에서, 도입하는 단계는 세포를, 트랜스포존을 함유하는 DNA 벡터와 접촉시키는 것을 포함한다. 일부 실시양태에서, DNA 벡터는 미니서클 플라스미드를 포함한다. 일부 실시양태에서, 도입하는 단계는 세포를, 트랜스포존, 및 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드, 둘 모두를 함유하는 플라스미드 벡터와 접촉시키는 것을 포함한다. 일부 실시양태에서, 도입하는 단계는 세포를, 정제된 단백질로서의 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제와 접촉시키는 것을 포함한다.

방법의 일부 실시양태에서, 트랜스포존은 2개의 역위 반복부 사이에 위치하는 카르고 카세트를 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 3과 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 3을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 4와 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 4를 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 5와 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 5를 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 6과 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 6을 포함한다. 일부 실시양태에서, 카르고 카세트는 CMV, EFS, MND, EF1α, CAGCs, PGK, UBC, U6, H1, 및 Cumate로 구성된 군으로부터 선택되는 프로모터를 포함한다. 일부 실시양태에서, 카르고 카세트는 CMV 프로모터를 포함한다. 일부 실시양태에서, 카르고 카세트는 정방향으로 존재한다. 일부 실시양태에서, 카르고 카세트는 역방향으로 존재한다. 일부 실시양태에서, 카르고 카세트는 트랜스진을 포함한다. 일부 실시양태에서, 트랜스진은 세포 수용체, 면역 체크포인트 단백질, 사이토카인, 및 이의 임의 조합으로 구성된 군으로부터 선택되는 단백질을 코딩한다. 일부 실시양태에서, 트랜스진은 T 세포 수용체(TCR: T cell receptor), B 세포 수용체(BCR: B cell receptor), 키메라 항원 수용체(CAR: chimeric antigen receptor), 또는 이의 임의 조합으로 구성된 군으로부터 선택되는 세포 수용체를 코딩한다. 일부 실시양태에서, 도입하는 단계는 전기천공, 미세주사, 인산칼슘 침전, 양이온 중합체, 덴드리머, 리포솜, 미세투사 충격법(microprojectile bombardment), 퓨진(fugene), 직접 음파 로딩, 세포 압착법, 광학 형질감염, 원형질체 융합, 임페일펙션(impalefection), 마그네토펙션(magnetofection), 뉴클레오펙션(nucleofection), 또는 이의 임의 조합으로 세포를 형질감염시키는 것을 포함한다. 일부 실시양태에서, 도입하는 단계는 세포를 전기천공시키는 것을 포함한다.

방법의 일부 실시양태에서, 세포는 피험체로부터 단리된 1차 세포이다. 일부 실시양태에서, 피험체는 인간이다. 일부 실시양태에서, 피험체는 질환을 앓는 환자이다. 일부 실시양태에서, 피험체는 암 또는 종양 진단을 받은 피험체이다. 일부 실시양태에서, 세포는 피험체의 혈액으로 단리된 것이다. 일부 실시양태에서, 세포는 1차 면역 세포를 포함한다. 일부 실시양태에서, 세포는 1차 백혈구를 포함한다. 일부 실시양태에서, 세포는 1차 T 세포를 포함한다. 일부 실시양태에서, 1차 T 세포는 감마 델타 T 세포, 헬퍼 T 세포, 기억 T 세포, 자연 살해 T 세포, 이펙터 T 세포, 또는 이의 임의 조합을 포함한다. 일부 실시양태에서, 1차 면역 세포는 CD3+ 세포를 포함한다. 일부 실시양태에서, 세포는 줄기 세포를 포함한다. 일부 실시양태에서, 줄기 세포는 배아 줄기 세포, 조혈 줄기 세포, 표피 줄기 세포, 상피 줄기 세포, 기관지폐포 줄기 세포, 유선 줄기 세포, 중간엽 줄기 세포, 장 줄기 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 정소 세포, 및 이의 임의 조합으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 줄기 세포는 유도 만능 줄기 세포를 포함한다.

본 개시내용의 추가의 또 다른 측면은 (a) 세포 내로 트랜스포존, 및 상기 트랜스포존을 인식하는, 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 도입시켜 유전적으로 변형된 세포를 생성하는 단계; (b) 치료를 필요로 하는 환자에게 유전적으로 변형된 세포를 투여하는 단계를 포함하는 치료 방법을 제공한다. 일부 실시양태에서, 유전적으로 변형된 세포는 트랜스포존에 의해 도입된 트랜스진을 포함한다. 일부 실시양태에서, 환자는 암 또는 종양 진단을 받은 피험체이다. 일부 실시양태에서, 투여하는 단계는 유전적으로 변형된 세포를 환자의 혈관 내로 주입하는 것을 포함한다.

본 개시내용의 추가의 또 다른 측면은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제, 및 상기 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 포함하는, 게놈 편집을 위한 시스템을 제공한다.

본 개시내용의 추가의 또 다른 측면은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드, 및 상기 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 포함하는, 게놈 편집을 위한 시스템을 제공한다.

시스템의 일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 DNA를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 메신저 RNA(mRNA)를 포함한다. 일부 실시양태에서, mRNA는 화학적으로 변형된 것이다. 일부 실시양태에서, 트랜스포존은 DNA 벡터에 존재한다. 일부 실시양태에서, DNA 벡터는 미니서클 플라스미드를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드 및 트랜스포존은 동일한 플라스미드에 존재한다. 일부 실시양태에서, 트랜스포존은 2개의 역위 반복부 사이에 위치하는 카르고 카세트를 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 3과 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 3을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 4와 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 4를 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 5와 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 좌측 역위 반복부는 서열 번호 5를 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 6과 50% 이상, 60% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 또는 99% 이상의 동일성을 가지는 서열을 포함한다. 일부 실시양태에서, 2개의 역위 반복부 중 우측 역위 반복부는 서열 번호 6을 포함한다. 일부 실시양태에서, 카르고 카세트는 CMV, EFS, MND, EF1α, CAGCs, PGK, UBC, U6, H1, 및 Cumate로 구성된 군으로부터 선택되는 프로모터를 포함한다. 일부 실시양태에서, 카르고 카세트는 CMV 프로모터를 포함한다. 일부 실시양태에서, 카르고 카세트는 트랜스진을 포함한다. 일부 실시양태에서, 트랜스진은 세포 수용체, 면역 체크포인트 단백질, 사이토카인, 및 이의 임의 조합으로 구성된 군으로부터 선택되는 단백질을 코딩한다. 일부 실시양태에서, 트랜스진은 T 세포 수용체(TCR), B 세포 수용체(BCR), 키메라 항원 수용체(CAR), 또는 이의 임의 조합으로 구성된 군으로부터 선택되는 세포 수용체를 코딩한다 일부 실시양태에서, 카르고 카세트는 정방향으로 존재한다. 일부 실시양태에서, 카르고 카세트는 역방향으로 존재한다. 카세트는 정방향으로 존재한다. 일부 실시양태에서, 카르고 카세트는 역방향으로 존재한다.

참조에 의한 인용

본 명세서에서 언급된 모든 공개 문헌, 특허, 및 특허 출원은, 마치 각각의 개별 공개 문헌, 특허 및 특허 출원이 참조로 인용되는 것으로 구체적으로 및 개별적으로 명시된 것과 같은 정도로 본원에서 참조로 포함된다. 참조로 포함된 용어가 본원에서 정의된 용어와 상충한다면, 본 명세서가 우선한다.

도면의 간단한 설명
본 발명의 신규한 특징은 특히 첨부된 청구범위에 기술되어 있다. 본 발명의 원리가 이용되는 예시적인 실시양태를 기술하는 하기의 상세한 설명, ?? 하기의 첨부 도면을 참조함으로써 본 발명의 특징 및 장점을 더욱 잘 이해할 수 있게 될 것이다:
도 1은 야생형(WT: wild-type) TcBuster 트랜스포사제 및 예시적인 TcBuster 트랜스포존으로 형질감염된 세포에서의 mCherry 양성 세포의 비율(%)로 측정된 바에 따른, 수개의 예시적인 TcBuster 트랜스포존 벡터 구성체의 전위 효율을 보여주는 것이다.
도 2는 예시적인 TcBuster IR/DR 서열 1 및 서열 2의 뉴클레오티드 서열 비교를 보여주는 것이다.
도 3a는 예시적인 TcBuster 트랜스포존 Tn-8(퓨로-mCherry 카세트 함유; 도 1에 도시) 및 WT TcBuster 트랜스포사제 또는 V596A 돌연변이체 트랜스포사제(V596A 치환 함유)로의 형질감염 후 2주째의 HEK-293T 세포의 대표적인 명시야 및 형광 영상을 보여주는 것이다. 형질감염된 세포를 형질감염 후 2일째 1 ㎍/mL 퓨로마이신을 포함하는 6 웰 플레이트에 플레이팅하고, 고정시키고, 형질감염 후 2주째, 콜로니 정량화를 위해 크리스털 바이올렛으로 염색하였다. 도 3b는 형질감염 후 2주째 6 웰 플레이트 중의 형질감염된 세포 콜로니의 대표적인 사진을 보여주는 것이다. 도 3c는 형질감염 후 2주째의 각 형질감염 조건당 콜로니의 정량화를 보여주는 그래프이다.
도 4는 AC 서브패밀리 중의 트랜스포사제의 번호 대비 TcBuster 트랜스포사제의 아미노산 서열 정렬을 도시한 것이고, 여기서, 오직 아미노산 보존 영역만이 제시되어 있다.
도 5는 Buster 서브패밀리 중의 다른 트랜스포사제 구성원의 번호 대비 TcBuster 트랜스포사제의 아미노산 서열 정렬을 도시한 것이다. 특정 예시적인 아미노산 치환은 단백질 서열 위에 명시되어 있으며, 정렬 위에 제시된 백분율(%)은 TcBuster 서열 내로 치환되는 것으로 고려되는 아미노산을 함유하는 다른 Buster 서브패밀리 구성원의 백분율(%)이고, 아래에 제시된 백분율(%)은 상기 위치에 정규 TcBuster 아미노산을 함유하는 다른 Buster 서브패밀리 구성원의 백분율(%)인 것도 함께 명시되어 있다.
도 6은 TcBuster 트랜스포사제 돌연변이체를 시험하는 데 사용된 예시적인 발현 벡터 pcDNA-DEST40의 벡터 지도를 보여주는 것이다.
도 7은 예시적인 트랜스포사제 돌연변이체와 함께 TcBuster 트랜스포존 Tn-8(도 1에 도시)로 형질감염된 HEK-293T 세포에서의 mCherry 양성 세포의 비율(%)로 측정된 바에 따른, 예시적인 TcBuster 트랜스포사제 돌연변이체의 전위 효율을 정량화한 그래프이다.
도 8은 임의적 링커에 의해 연결된 DNA 서열 특이적 결합 도메인 및 TcBuster 트랜스포사제 서열을 함유하는 한 예시적인 융합 트랜스포사제를 도시한 것이다.
도 9는 상이한 태그를 함유하는 예시적인 트랜스포사제와 함께 TcBuster 트랜스포존 Tn-8(도 1에 도시)로 형질감염된 HEK-293T 세포에서의 mCherry 양성 세포의 비율(%)로 측정된 바에 따른, 상기 태그를 함유하는 예시적인 TcBuster 트랜스포사제의 전위 효율을 정량화한 그래프이다.
도 10a는 GFP 양성 세포의 비율(%)로 측정된 바에 따른, 인간 CD3+ T 세포에서의 예시적인 TcBuster 전위 시스템의 전위 효율을 정량화한 그래프이다. 도 10b는 형질감염 후 2 및 7일째 유세포 분석법에 의한 형질감염된 T 세포의 생존능을 정량화한 그래프이다. 데이터는 펄스 대조군 대비의 것이다.
도 11은 주석이 달린 특정 아미노산과 함께, 야생형 TcBuster 트랜스포사제의 아미노산 서열(서열 번호 1)을 보여주는 것이다.
도 12는 아미노산 치환 D189A/V377T/E469K를 함유하는 돌연변이체 TcBuster 트랜스포사제의 아미노산 서열(서열 번호 78)을 보여주는 것이다.
도 13은 아미노산 치환 D189A/V377T/E469K/I452K를 함유하는 돌연변이체 TcBuster 트랜스포사제의 아미노산 서열(서열 번호 79)을 보여주는 것이다.
도 14는 아미노산 치환 D189A/V377T/E469K/N85S를 함유하는 돌연변이체 TcBuster 트랜스포사제의 아미노산 서열(서열 번호 80)을 보여주는 것이다.
도 15는 아미노산 치환 D189A/V377T/E469K/A358K를 함유하는 돌연변이체 TcBuster 트랜스포사제의 아미노산 서열(서열 번호 81)을 보여주는 것이다.
도 16은 아미노산 치환 D189A/V377T/E469K/K573E/E578L을 함유하는 돌연변이체 TcBuster 트랜스포사제의 아미노산 서열(서열 번호 13)을 보여주는 것이다.

본 발명의 상세한 설명

개요

DNA 트랜스포존은 비반복적인 '자르고 붙이는' 기전을 통해 전위가능하다. 이는 촉매 효소, 즉, 트랜스포사제에 의한 2개의 말단 역위 반복부의 인식을 필요로 하며, 이때, 상기 트랜스포사제는 그의 표적을 절단할 수 있고, 그 결과로, DNA 트랜스포존을 그의 공여자 주형으로부터 유리시킬 수 있다. 절제시, 이어서, DNA 트랜스포존은, 동일한 트랜스포사제에 의해 절단된 수용자 DNA 내로 통합될 수 있다. 그의 천연 구조 중 일부에서, DNA 트랜스포존 측면에 2개의 역위 반복부가 위치하고, DNA 트랜스포존은 전위를 촉진시키는 트랜스포사제를 코딩하는 유전자를 함유할 수 있다.

DNA 트랜스포존을 이용하는 게놈 편집 적용을 위해, 트랜스포사제가, 역위 반복부가 측면에 위치하는 관심 유전자를 함유하는 트랜스포존 DNA로부터 물리적으로 분리되는 2개의 상이한 플라스미드에 기반하는 이원 시스템을 개발할 수 있도록 트랜스포존을 디자인하는 것이 바람직할 수 있다. 트랜스포존 및 트랜스포사제 플라스미드의 표적 세포 내로의 공동 전달은 종래의 자르고 붙이는 기전을 통한 전위를 가능하게 한다.

TcBuster는 DNA 트랜스포존의 hAT 패밀리의 구성원이다. 상기 패밀리의 다른 구성원으로는 슬리핑 뷰티(Sleeping Beauty) 및 PiggBac을 포함한다. 본원에서는 hAT 패밀리 트랜스포존 성분을 사용하여 인간 조혈 및 면역계 세포 내로의 유전자 전달을 증진시키는 시너지 접근법과 관련된 다양한 장치, 시스템 및 방법을 논의한다. 본 개시내용은 개선된 hAT 트랜스포사제, 트랜스포존 벡터 서열, 트랜스포사제 전달 방법, 및 트랜스포존 전달 방법에 관한 것이다. 한 구현에서, 본 연구에서는 과활성 hAT 트랜스포사제 제조를 위한 특이적인, 범용 부위가 확인되었다. 또 다른 구현에서, 게놈 공간을 보존하는 최소 크기의 hAT 트랜스포존 벡터 역위 말단 반복부(ITR: inverted terminal repeat)를 제조하는 방법을 기술한다. 또 다른 구현에서, hAT 패밀리 트랜스포사제를 화학적으로 변형된 시험관내 전사된 mRNA로서 전달하는 개선된 방법을 기술한다. 또 다른 구현에서, 실제로 모든 원핵성 서열은 재조합 방법에서 제거된, "미니어처" DNA 고리로서 hAT 패밀리 트랜스포존 벡터를 전달하는 방법을 기술한다. 또 다른 구현에서, hAT 트랜스포사제에 융합된 전사 활성인자 유사(TAL: transcription activator-like) 도메인을 사용하여 DNA 서열 특이적 결합 도메인을 융합시키는 방법을 기술한다. 이러한 개선을 통해 개별적으로 또는 조합하여 해당 세포 유형으로의 예상 밖의 고수준의 유전자 전달을 달성할 수 있고, 트랜스포존 벡터의 관심 서열로의 전달을 개선시킬 수 있다.

돌연변이체 TcBuster 트랜스포사제

본 개시내용의 한 측면은 돌연변이체 TcBuster 트랜스포사제를 제공한다. 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)와 비교하여 하나 이상의 아미노산 치환을 포함할 수 있다.

돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 70% 이상의 서열 동일성을 가지는 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 서열 동일성을 가지는 아미노산 서열을 포함할 수 있다. 일부 경우에서, 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 98% 이상, 98.5% 이상, 99% 이상, 99.1% 이상, 99.2% 이상, 99.3% 이상, 99.4% 이상, 99.5% 이상, 99.6% 이상, 99.7% 이상, 99.8% 이상, 99.9% 이상, 또는 99.95% 이상의 서열 동일성을 가지는 아미노산 서열을 포함할 수 있다.

돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 상이한 적어도 1개의 아미노산을 가지는 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 상이한 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 아미노산을 가지는 아미노산 서열을 포함할 수 있다. 일부 경우에서, 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 상이한 적어도 5개, 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 또는 적어도 300개, 또는 그 초과의 아미노산을 가지는 아미노산 서열을 포함할 수 있다. 일부 경우에서, 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제(서열 번호 1)의 전장의 서열과 상이한 최대 3개, 최대 6개, 최대 12개, 최대 25개, 최대 35개, 최대 45개, 최대 55개, 최대 65개, 최대 75개, 최대 85개, 최대 95개, 최대 150개, 최대 250개, 또는 최대 350개의 아미노산을 가지는 아미노산 서열을 포함할 수 있다.

도 4에 제시된 바와 같이, 전형적으로, 야생형 TcBuster 트랜스포사제는 N 말단에서 C 말단으로 ZnF-BED 도메인(아미노산 76-98), DNA 결합 및 올리고머화 도메인(아미노산 112-213), 제1 촉매 도메인(아미노산 213-312), 삽입 도메인(아미노산 312-543), 및 제2 도메인(아미노산 583-620) 뿐만 아니라, 상기 주석 달린 도메인 사이에 적어도 4개의 도메인간 영역을 포함하는 것으로 간주될 수 있다. 달리 명시되지 않는 한, 본원에서 사용되는 바, 아미노산에 대하여 번호로 표시된 참조는 모든 서열 번호 1에 따른 것이다. 돌연변이체 TcBuster 트랜스포사제는 상기 도메인, 또는 이의 임의 조합 중 어느 하나에 하나 이상의 아미노산 치환을 포함할 수 있다. 일부 경우에서, 돌연변이체 TcBuster 트랜스포사제는 ZnF-BED 도메인, DNA 결합 및 올리고머화 도메인, 제1 촉매 도메인, 삽입 도메인, 또는 이의 조합에 하나 이상의 아미노산 치환을 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 두 촉매 도메인 중 적어도 하나에 하나 이상의 아미노산 치환을 포함할 수 있다.

예시적인 돌연변이체 TcBuster 트랜스포사제는 표 1로부터의 하나 이상의 아미노산 치환을 포함할 수 있다. 종종, 돌연변이체 TcBuster 트랜스포사제는 표 1로부터의 아미노산 치환 중 적어도 하나를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 표 1로부터의 아미노산 치환 중 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 20개, 적어도 30개, 또는 그 초과를 포함할 수 있다.

예시적인 돌연변이체 TcBuster 트랜스포사제는 표 2로부터의 하나 이상의 아미노산 치환, 또는 치환의 조합을 포함한다. 종종, 돌연변이체 TcBuster 트랜스포사제는 표 2로부터의 아미노산 치환, 또는 치환의 조합 중 적어도 하나를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 표 2로부터의 아미노산 치환, 또는 치환의 조합 중 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 20개, 적어도 30개, 또는 그 초과를 포함할 수 있다.

예시적인 돌연변이체 TcBuster 트랜스포사제는 표 3으로부터의 하나 이상의 아미노산 치환, 또는 치환의 조합을 포함한다. 종종, 돌연변이체 TcBuster 트랜스포사제는 표 3으로부터의 아미노산 치환, 또는 치환의 조합 중 적어도 하나를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 표 3으로부터의 하나 이상의 아미노산 치환, 또는 치환의 조합 중 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 20개, 적어도 30개, 또는 그 초과를 포함할 수 있다.

과활성 돌연변이체 TcBuster 트랜스포사제

본 개시내용의 또 다른 측면은 과활성 돌연변이체 TcBuster 트랜스포사제를 제공하는 것이다. 본원에서 사용되는 바, "과활성" 돌연변이체 TcBuster 트랜스포사제란, 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가지는 임의의 돌연변이체 TcBuster 트랜스포사제를 지칭할 수 있다.

일부 실시양태에서, 과활성 돌연변이체 TcBuster 트랜스포사제는 특정 상황하에서 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가질 수 있다. 예를 들어, 과활성 돌연변이체 TcBuster 트랜스포사제는 특정 유형의 역위 반복부 서열을 가지는 트랜스포존의 전위를 촉매화시키는 데 사용될 때, 야생형 TcBuster 트랜스포사제보다 더 우수한 전위 효율을 가질 수 있다. 다른 유형의 역위 반복부 서열을 가지는 일부 다른 트랜스포존일 경우, 과활성 돌연변이체 TcBuster 트랜스포사제는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가지지 않을 수도 있다. 일부 다른 비제한적 예에서, 과활성 돌연변이체 TcBuster 트랜스포사제는 특정 형질감염 조건하에서 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제와 비교하여 증가된 전위 효율을 가질 수 있다. 제한 없이, 야생형 TcBuster 트랜스포사제와 비교하였을 때, 과활성 돌연변이체 TcBuster 트랜스포사제는 온도가 일반 세포 배양 온도보다 높을 때, 더 우수한 전위 효율을 가질 수 있고; 과활성 돌연변이체 TcBuster 트랜스포사제는 비교적 산성 또는 염기성인 수성 배지 중에서 더 우수한 전위 효율을 가질 수 있고; 과활성 돌연변이체 TcBuster 트랜스포사제는 특정 유형의 형질감염 기술, 예컨대, 전기천공)이 수행될 때, 더 우수한 전위 효율을 가질 수 있다.

전위 효율은 숙주 세포 집단 내로 도입된 트랜스포존 및 트랜스포사제의 양에 의해 정규화된, 숙주 세포 집단 내에서 발생한 성공적인 전위 이벤트의 비율(%)로 측정될 수 있다. 다수의 경우에서, 2개 이상의 트랜스포사제의 전위 효율을 비교할 때, 동일한 트랜스포존 구성체를 동일하거나, 또는 유사한 형질감염 조건하에서의 숙주 세포의 형질감염을 위한 각각의 둘 이상의 트랜스포사제와 쌍을 이루게 한다. 숙주 세포에서의 전위 이벤트의 양은 다양한 접근법에 의해 조사될 수 있다. 예를 들어, 트랜스포존 구성체는 역위 반복부 사이에 위치하는 리포터 유전자를 함유하도록 디자인될 수 있고, 리포터 유전자에 대해 양성인 형질감염된 세포는 성공적인 전위 이벤트가 발생한 세포인 것으로 간주될 수 있으며, 이를 통해 전위 이벤트의 양의 추정치를 제공할 수 있다. 또 다른 비제한적 예는 숙주 세포 게놈을 서열분석하여 트랜스포존의 카세트 카르고의 삽입을 조사하는 것을 포함한다. 일부 실시양태에서, 2개 이상의 상이한 트랜스포존의 전위 효율을 비교할 때, 동일한 트랜스포사제를 동일하거나, 또는 유사한 형질감염 조건하에서의 숙주 세포의 형질감염을 위한 각각의 상이한 트랜스포존과 쌍을 이루게 할 수 있다. 전위 효율을 측정하는 데 유사한 접근법이 이용될 수 있다. 당업자에게 공지된 다른 방법 또한 전위 효율을 비교하는 데 실행될 수 있다.

본원에서는 또한 과활성 돌연변이체 TcBuster 트랜스포사제를 수득하는 방법도 제공한다.

한 예시적인 방법은 아미노산 서열의 순전하를 증가시키기 위해 TcBuster 트랜스포사제의 아미노산을 체계적으로 돌연변이화시키는 것을 포함할 수 있다. 종종, 본 방법은 체계적인 알라닌 스캐닝을 수행하여, 중성 pH에서 음으로 하전된 아스파르트산(D) 또는 글루탐산(E)을 알라닌 잔기로 돌연변이화시키는 단계를 포함할 수 있다. 방법은 중성 pH에서 양으로 하전된 리신(K) 또는 아르기닌(R) 잔기로 체계적으로 돌연변이화시키는 것을 수행하는 것을 포함할 수 있다.

특정 이론으로 제한하지 않으면서, 중성 pH에서에서의 아미노산 서열의 순전하 증가는 TcBuster 트랜스포사제의 전위 효율을 증가시킬 수 있다. 특히, 순전하가 트랜스포사제의 촉매 도메인에 근접할 때, 전위 효율은 증가할 것으로 예상된다. 양으로 하전된 아미노산은 DNA 표적과의 접촉 지점을 형성할 수 있고, 촉매 도메인이 DNA 표적에 대해 작용할 수 있게 허용한다고 간주될 수 있다. 상기 양으로 하전된 아미노산의 손실은 트랜스포사제에서 절제 또는 통합 활성을 감소시킬 수 있다고도 간주될 수 있다.

도 11은 WT TcBuster 트랜스포사제 아미노산 서열을 도시한 것으로, 여기서, DNA와의 접촉 지점일 수 있는 아미노산이 강조 표시되어 있다. 도 11에서, 큰 굵은체로 표시된 것은 촉매 트리아드 아미노산을 나타내고; 박스로 표시된 글시체는 양으로 하전된 아미노산으로 치환되었을 때, 전위를 증가시키는 아미노산을 나타내고; 이탤릭체 소문자로 표시된 것은 상이한 아미노산으로 치환되었을 때, 전위를 감소시키는 양으로 하전된 아미노산을 나타내고; 굵은 이탤릭체로 밑줄로 표시된 것은 양으로 하전된 아미노산으로 치환되었을 때, 전위를 증가시키고, 음으로 하전된 아미노산으로 치환되었을 때, 전위를 감소시키는 아미노산을 나타내고; 밑줄로 표시된 글시체는 Buster 서브패밀리에 대한 단백질 서열 정렬에 기초하여 양으로 하전된 아미노산일 수 있는 아미노산을 나타낸다.

돌연변이체 TcBuster 트랜스포사제는 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함할 수 있다. 종종, 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함하는 돌연변이체 TcBuster 트랜스포사제는 과활성일 수 있다. 종종, 돌연변이체 TcBuster 트랜스포사제는 양으로 하전된 아미노산, 예컨대, 제한하는 것은 아니지만, 리신(K) 또는 아르기닌(R)으로의 하나 이상의 치환을 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 음으로 하전된 아미노산, 예컨대, 제한하는 것은 아니지만, 아스파르트산(D) 또는 글루탐산(E)의 중성 아미노산, 또는 양으로 하전된 아미노산으로의 하나 이상의 치환을 포함할 수 있다.

한 비제한적 예로 촉매 도메인 내에 또는 그와 근접한 위치에 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함하는 돌연변이체 TcBuster 트랜스포사제를 포함한다. 촉매 도메인은 제1 촉매 도메인 또는 제2 촉매 도메인일 수 있다. 촉매 도메인은 또한 트랜스포사제의 두 촉매 도메인 모두를 포함할 수 있다.

본 개시내용의 예시적인 방법은 DNA와 매우 근접하게 위치하거나, 또는 그와 직접 접촉할 것으로 예측되는 아미노산을 돌연변이화시키는 단계를 포함할 수 있다. 상기 아미노산은 hAT 패밀리의 다른 구성원(들)(예컨대, Buster 및/또는 Ac 서브패밀리의 다른 구성원)에서 보존되는 것으로 확인된 치환된 아미노산일 수 있다. DNA와 매우 근접하게 위치하거나, 또는 그와 직접 접촉할 것으로 예측되는 아미노산은 예를 들어, 결정 구조 참조, 구조 예측, 돌연변이 분석, 기능 분석, hAT 패밀리의 다른 구성원과의 정렬, 또는 임의의 다른 적합한 방법에 의해 확인될 수 있다.

특정 이론으로 제한하지 않으면서, TcBuster 트랜스포사제도 hAT 트랜스포사제 패밀리의 다른 구성원과 같이, 트랜스포존의 이동을 촉진시키는 활성 부위일 수 있는 DDE 모티프를 가진다. 산성 잔기의 트리아드인 D223, D289, 및 E589가 활성 부위를 구성하는 것으로 간주된다. DDE 모티프는 2가 금속 이온을 조정할 수 있고, 촉매 반응에서 중요할 수 있다. 일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함할 수 있고, 하나 이상의 아미노산은 서열 번호 1에 따라 넘버링되었을 때, D223, D289, 또는 E589에 근접하게 위치한다.

특정 실시양태에서, 본원에서 제공되는 바와 같은 돌연변이체 TcBuster 트랜스포사제는 촉매 트리아드, 즉, D223, D289, 또는 E589의 파괴는 포함하지 않는다. 돌연변이체 TcBuster 트랜스포사제는 D223, D289, 또는 E589에 어떤 아미노산 치환도 포함하지 않을 수 있다. 돌연변이체 TcBuster 트랜스포사제는 D223, D289, 또는 E589에 아미노산 치환을 포함할 수는 있지만, 상기 치환은 촉매 트리아드가 기여하는 촉매 활성은 파괴시키지 않는다.

일부 경우에서, "근접"이라는 용어는 트랜스포사제의 1차 구조에서 선형 거리의 척도를 지칭할 수 있다. 예를 들어, 야생형 TcBuster 트랜스포사제의 1차 구조에서 D223과 D289 사이의 거리는 66개의 아미노산인 거리이다. 특정 실시양태에서, 근접은 약 70 내지 80개의 아미노산의 거리를 지칭할 수 있다. 다수의 경우에서, 근접은 약 80, 75, 70, 60, 50, 40, 30, 20, 10, 또는 5개의 아미노산의 거리를 지칭할 수 있다.

일부 경우에서, "근접"이라는 용어는 트랜스포사제의 2차 또는 3차 구조에서의, 즉, 트랜스포사제가 그의 3차 구조로 폴딩되었을 때의 공간 관계의 척도를 지칭할 수 있다. 단백질 2차 구조는 단백질의 국부 세그먼트의 3차원 형태를 지칭할 수 있다. 공통된 2차 구조 요소는 알파 나선, 베타 시트, 베타 선회부 및 오메가 루프를 포함한다. 2차 구조 요소는 단백질이 그의 3차원 3차 구조로 폴딩되기 이전의 중간체로서 형성될 수 있다. 단백질 3차 구조는 단백질의 3차원 형상을 지칭할 수 있다. 단백질 3차 구조는 생리적 또는 다른 조건하에서 역학적 구조 변화를 나타낼 수 있다. 3차 구조는 단백질 도메인인, 하나 이상의 단백질 2차 구조와 함께 단일 폴리펩티드 쇄 "백본"을 가질 것이다. 아미노산 측쇄는 여러 방식으로 상호작용하고, 결합할 수 있다. 특정 단백질 내의 측쇄의 상호작용 및 결합이 그의 3차 구조를 결정짓는다. 다수의 구현에서, 근접은 약 1Å, 약 2Å, 약 5Å, 약 8Å, 약 10Å, 약 15Å, 약 20Å, 약 25Å, 약 30Å, 약 35Å, 약 40Å, 약 50Å, 약 60Å, 약 70Å, 약 80Å, 약 90Å, 또는 약 100Å인 거리를 지칭할 수 있다.

중성 pH는 약 7인 pH 값일 수 있다. 종종, 중성 pH는 6.9 내지 7.1, 6.8 내지 7.2, 6.7 내지 7.3, 6.6 내지 7.4, 6.5 내지 7.5, 6.4 내지 7.6, 6.3 내지 7.7, 6.2-7.8, 6.1-7.9, 6.0-8.0, 5-8, 또는 그로부터 도출되는 범위의 pH 값일 수 있다.

서열 번호 1과 비교하여 중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함하는 비제한적인 예시적인 돌연변이체 TcBuster 트랜스포사제는 표 4로부터의 아미노산 치환의 조합 중 적어도 하나를 포함하는 TcBuster 트랜스포사제를 포함한다. 돌연변이체 TcBuster 트랜스포사제는 표 4로부터 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 20개, 적어도 30개, 또는 그 초과의 아미노산 치환을 포함할 수 있다.

일부 실시양태에서, 돌연변이체 TcBuster 트랜스포사제는 서열 번호 1과 비교하여 비중성 pH에서 순전하를 증가시키는 하나 이상의 아미노산 치환을 포함할 수 있다. 일부 경우에서, 촉매 도메인 내에 또는 그와 근접한 위치에서 순전하는 비중성 pH에서 증가된다. 다수의 경우에서, D223, D289, 또는 E589와 근접한 위치에서 순전하는 비중성 pH에서 증가된다. 비중성 pH는 7 미만, 6.5 미만, 6 미만, 5.5 미만, 5 미만, 4.5 미만, 4 미만, 3.5 미만, 3 미만, 2.5 미만, 2 미만, 1.5 미만, 또는 1 미만인 pH 값일 수 있다. 비중성 pH은 또한 7 초과, 7.5 초과, 8 초과, 8.5 초과, 9 초과, 9.5 초과, 또는 10 초과인 pH 값일 수 있다.

한 예시적인 실시양태에서, 방법은 DNA 결합 및 올리고머화 도메인 중의 아미노산을 체계적으로 돌연변이화시키는 것을 포함할 수 있다. 특정 이론으로 제한하지 않으면서, DNA 결합 및 올리고머화 도메인 중의 돌연변이화는 트랜스포사제의 DNA 표적에의 결합 친화도를 증가시킬 수 있고, 올리고머화 활성을 촉진시킬 수 있으며, 결과적으로 전위 효율을 증진시킬 수 있다. 더욱 구체적으로, 본 방법은 DNA 결합 및 올리고머화 도메인(예컨대, 아미노산 112 내지 213) 내에서 또는 그와 근접한 위치에서 아미노산을 하나씩 체계적으로 돌연변이화시키는 것을 포함할 수 있다. 본 방법은 또한 DNA 결합 및 올리고머화 도메인 내에서 또는 그와 근접한 위치에서 하나 이상의 아미노산을 돌연변이화시키는 것을 포함할 수 있다. 본 방법은 또한 DNA 결합 및 올리고머화 도메인 밖의 하나 이상의 아미노산과 함께, DNA 결합 및 올리고머화 도메인 내에서 또는 그와 근접한 위치에서 하나 이상의 아미노산을 돌연변이화시키는 것을 포함할 수 있다.

일부 실시양태에서, 본 방법은 다른 hAT 패밀리 트랜스포사제(Ac, Hermes, Hobo, Tag2, Tam3, Hermes, Restless 및 Tol2)와, 또는 Buster 서브패밀리의 다른 구성원(예컨대, AeBuster1, AeBuster2, AeBuster3, BtBuster1, BtBuster2, CfBuster1, 및 CfBuster2)과의 TcBuster의 다중 서열 정렬에 기초하여 선택된 아미노산 잔기의 합리적인 치환을 수행하는 것을 포함할 수 있다. 특정 이론으로 제한하지 않으면서, 다른 hAT 패밀리 트랜스포사제 사이에서, 특히, 활성인 것들 사이에서 특정 아미노산의 보존은 그가 트랜스포사제의 촉매 활성에 중요하다는 것을 나타내는 것일 수 있다. 그러므로, 야생형 TcBuster 서열(서열 번호 1) 중의 비보존 아미노산을 다른 hAT 패밀리 사이에서 보존되는 아미노산으로 치환시킴으로써 과활성 돌연변이체 TcBuster 트랜스포사제를 수득할 수 있다. 본 방법은 TcBuster의 서열 뿐만 아니라, 다른 hAT 패밀리 트랜스포사제의 서열도 수득하는 단계; 서열을 정렬하고, 다른 hAT 패밀리 트랜스포사제 사이의 상이한 보존되는 카운터파트를 이용하여 TcBuster 트랜스포사제 중의 아미노산을 확인하는 단계; 부위 지정 돌연변이유발을 수행하여 돌연변이(들)를 보유하는 돌연변이체 TcBuster 트랜스포사제를 제조하는 단계를 포함할 수 있다.

과활성 돌연변이체 TcBuster 트랜스포사제는 Buster 서브패밀리의 다른 구성원, 또는 hAT 패밀리의 다른 구성원에의 정렬에 기초하여 하나 이상의 아미노산 치환을 포함할 수 있다. 다수의 경우에서, 하나 이상의 아미노산 치환은 야생형 TcBuster 서열(서열 번호 1)에서 비보존 아미노산의 보존 아미노산으로의 치환일 수 있다. 돌연변이체 TcBuster 트랜스포사제의 비제한적 예로는 표 5로부터의 아미노산 치환 중 적어도 하나를 포함하는 TcBuster 트랜스포사제를 포함한다. 돌연변이체 TcBuster 트랜스포사제는 표 5로부터 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 20개, 적어도 30개, 또는 그 초과의 아미노산 치환을 포함할 수 있다.

또 다른 예시적인 방법은 산성 아미노산을 염기성 아미노산으로 체계적으로 돌연변이화시키는 단계, 및 과활성 돌연변이체 트랜스포사제를 확인하는 단계를 포함할 수 있다.

일부 경우에서, 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 V377T, E469K, 및 D189A를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 K573E 및 E578L을 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 I452K을 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 A358K를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 V297K를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 N85S를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 N85S, V377T, E469K, 및 D189A를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 I452F, V377T, E469K, 및 D189A를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 A358K, V377T, E469K, 및 D189A를 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제는 아미노산 치환 V377T, E469K, D189A, K573E 및 E578L을 포함할 수 있다.

융합 트랜스포사제

본 개시내용의 또 다른 측면은 융합 트랜스포사제를 제공한다. 융합 트랜스포사제는 TcBuster 트랜스포사제 서열 및 DNA 서열 특이적 결합 도메인을 포함할 수 있다.

융합 트랜스포사제의 TcBuster 트랜스포사제 서열은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 중 임의의 것의 아미노산 서열을 포함할 수 있다. 융합 트랜스포사제의 TcBuster 트랜스포사제 서열은 또한 아미노산 서열 서열 번호 1을 가지는 야생형 TcBuster 트랜스포사제의 아미노산 서열을 포함할 수 있다.

본원에 기술된 바와 같은 DNA 서열 특이적 결합 도메인은 특이적 서열 모티프를 함유하는 서열 영역("표적 서열")에 있는 DNA 분자에 결합하도록 적합화된 단백질 도메인을 지칭할 수 있다. 예를 들어, 예시적인 DNA 서열 특이적 결합 도메인은 서열 모티프 TATA에 선택적으로 결합할 수 있는 반면, 또 다른 예시적인 DNA 서열 특이적 결합 도메인은 상이한 서열 모티프 ATGCNTAGAT(N은 A, T, G, 및 C 중 어느 하나를 나타낸다)에 선택적으로 결합할 수 있다.

본원에서 제공되는 바와 같은 융합 트랜스포사제는 트랜스포존의 서열 특이적 삽입을 유도할 수 있다. 예를 들어, DNA 서열 특이적 결합 도메인은 결합 도메인의 결합 특이성에 기초하여 융합 트랜스포사제가 표적 서열에 결합하도록 가이드할 수 있다. 특정 서열 영역으로 국한되거나, 또는 한정되는 것이 융합 트랜스포사제와 트랜스포존 사이의 상호작용을 공간적으로 제한할 수 있으며, 이로써, 촉매화된 전위는 표적 서열과 근접한 위치에 있는 서열 영역으로 제한할 수 있다. DNA 결합 도메인의 크기, 3차원 구조, 및 서열 결합 친화성 뿐만 아니라, DNA 결합 도메인과 TcBuster 트랜스포사제 서열 사이의 공간적 관계, 및 두 도메인 사이의 연결부의 가요성에 의존하여, 실제 전위 부위부터 표적 서열까지의 거리는 달라질 수 있다. 융합 트랜스포사제 구조의 적절한 디자인을 통해 전위는 바람직한 표적 게놈 영역으로 유도될 수 있다.

전위를 위한 표적 게놈 영역은 적용 목적에 따라 임의의 특정 게놈 영역이 될 수 있다. 예를 들어, 종종, 전위를 위해서는 전사 출발 부위를 피하는 것이 바람직할 수 있는데, 그 이유는 세포의 특정의 중요한 내인성 유전자(들)의 발현 수준에 바람직하지 못한, 또는 심지어는 유해한 변화를 초래할 수 있기 때문이다. 융합 트랜스포사제는 전위를 숙주 게놈의 세이프 하버로 표적화할 수 있는 DNA 서열 특이적 결합 도메인을 함유할 수 있다. 세이프 하버의 비제한적 예로는 HPRT, AAVS 부위(예컨대, AAVS1, AAVS2 등), CCR5, 또는 Rosa26을 포함할 수 있다. 세이프 하버 부위란 일반적으로, 그의 사용으로 인해 세포 또는 세포의 건강 및 기능의 게놈 무결성이 파괴되는 효과는 거의 없는 것인, 트랜스진 삽입을 위한 부위를 지칭할 수 있다.

DNA 서열 특이적 결합 도메인은 서열 특이성을 가지는 임의의 DNA 결합 단백질로부터 유래될 수 있거나, 또는 그의 변이체일 수 있다. 다수의 경우에서, DNA 서열 특이적 결합 도메인은 자연적으로 발생된 서열 특이적 DNA 결합 단백질과 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 아미노산 서열을 포함할 수 있다. DNA 서열 특이적 결합 도메인은 자연적으로 발생된 서열 특이적 DNA 결합 단백질과 70% 이상 동일한 아미노산 서열을 포함할 수 있다. 자연적으로 발생된 서열 특이적 DNA 결합 단백질의 비제한적 예로는 각종 기원으로부터의 전사 인자, 특이적 서열 뉴클레아제, 및 바이러스 복제 단백질을 포함하나, 이에 제한되지 않는다. 자연적으로 발생된 서열 특이적 DNA 결합 단백질은 또한 특이적 결합능을 가진, 각종 기원으로부터의 임의의 다른 단백질일 수 있다. DNA 결합 단백질의 선택 및 예측은 예컨대, DP-Bind(http://lcg.rit.albany.edu/dp-bind/) 또는 DNABIND(http://dnabind.szialab.org/)와 같이, 온라인으로 이용가능한 컴퓨터 예측 데이터베이스를 포함하나, 이에 제한되지 않는, 다양한 접근법에 의해 수행될 수 있다.

"전사 인자"라는 용어는, 특이적 DNA 서열에 결합함으로써 DNA에서 메신저 DNA로의 유전 정보의 전사율을 제어하는 단백질을 지칭할 수 있다. 본원에 기술된 융합 트랜스포사제에서 사용될 수 있는 전사 인자는 그가 표적 DNA 분자에 결합하였을 때, 서열 특이성을 부여할 수 있는 한, 원핵성 전사 인자 또는 진핵성 전사 인자에 기초하는 것일 수 있다. 전사 인자 예측 데이터베이스, 예컨대, DBD(http://www.transcriptionfactor.org)는 본원의 개시내용의 적용에 적절한 전사 인자를 선택하는 데 사용될 수 있다.

본원에서 사용되는 바, DNA 서열 특이적 결합 도메인은 자연적으로 발생된 전사 인자로부터의 하나 이상의 DNA 결합 도메인을 포함할 수 있다. 전사 인자의 DNA 결합 도메인의 비제한적 예로는 예컨대, 염기성 헬릭스-루프-헬릭스, 염기성-류신 지퍼(bZIP: basic-leucine zipper), 이분 반응 조절인자의 C 말단 이펙터 도메인, AP2/ERF/GCC 박스, 헬릭스-선회부-헬릭스, 호메오도메인 단백질, 람다 리프레서 유사, srf 유사(혈청 반응 인자: serum response factor), 페어링 박스, 윙드 헬릭스, 아연 핑거, 다중 도메인 Cys2His2(C2H2) 아연 핑거, Zn2/Cys6, 또는 Zn2/Cys8 핵 수용체 아연 핑거와 같은 패밀리에 속하는 DNA 결합 도메인을 포함한다.

DNA 서열 특이적 결합 도메인은 특이적인 DNA 서열에 결합하는, 인공적으로 조작된 아미노산 서열일 수 있다. 상기 인공적으로 디자인된 아미노산 서열의 비제한적 예로는 프레임워크, 예컨대, 전사 활성인자 유사 이펙터 뉴클레아제(TALE) DNA 결합 도메인, 아연 핑거 뉴클레아제, 아데노 연관 바이러스(AAV: adeno associated virus) Rep 단백질, 및 본원에 기술된 바와 같은 임의의 다른 적합한 DNA 결합 단백질에 기초하여 생성된 서열을 포함한다.

천연 TALE는 식물 종의 감염을 지원하는 크산토모나스(Xanthomonas) 박테리아에 의해 분비되는 단백질이다. 천연 TALE는 특이적인 DNA 서열에 결합하고, 숙주 유전자의 발현을 활성화시킴으로써 감염을 지원할 수 있다. 일반적으로, TALE 단백질은, DNA 표적화 특이성을 결정짓는, 중앙 반복 도메인으로 구성되고, 이는 새로 빠르게 합성될 수 있다. TALE는 잔기의 반복 서열을 함유하는 모듈식 DNA 결합 도메인(DBD: DNA-binding domain)을 가진다. 일부 TALE에서, 각각의 반복 영역은 34개의 아미노산을 함유한다. 본원에서 사용되는 바, "TALE 도메인"이라는 용어는 TALE의 모듈식 DBD를 지칭할 수 있다. 각 반복 영역의 12번째 및 13번째 위치에 있는 한 쌍의 잔기가 뉴클레오티드 특이성을 결정지을 수 있고, 이는 반복 가변 이잔기(RVD: repeat variable diresidue)로 지칭된다. 절반 반복부로 명명되는 마지막 반복 영역은 전형적으로 20개의 아미노산으로 말단절단된 것이다. 이들 반복 영역을 조합함으로써 서열 특이적 합성 TALE를 합성할 수 있다. C 말단은 전형적으로 TALE를 핵으로 유도하는, 핵 국재화 신호(NLS: nuclear localization signal) 뿐만 아니라, 전사를 조절하는 기능성 도메인, 예컨대, 산성 활성화 도메인(AD: activation domain)을 함유한다. 내인성 NLS는 유기체 특이적 국재화 신호에 의해 대체될 수 있다. 예를 들어, 시미안 바이러스 큰 T 항원으로부터 유래된 NLS가 포유동물 세포에서 사용될 수 있다. RVD인 HD, NG, NI, 및 NN은 각각 C, T, A, 및 G/A를 표적화한다. RVD, 및 뉴클레오티드에 대한 특정 상황하에서 그의 결합 선호도에 관한 목록은 하기 표 6에서 살펴볼 수 있다. 추가의 TALE RVD 또한 맞춤식 축퇴 TALE-DNA 상호작용에 사용될 수 있다. 예를 들어, NA는 DNA의 4개 염기 모두에 대하여 높은 친화성을 가진다. 추가로, N*(여기서, *는 13번째 잔기가 결실된 RVD이다)는 메틸화된 시토신을 비롯한, 모든 문자의 DNA를 수용할 수 있다. 또한, S*는 임의의 DNA 뉴클레오티드에 결합할 수 있는 능력을 가진다.

특이적인 DNA 서열을 표적화할 수 있도록 TALE를 디자인하는 데 다수의 온라인 도구, 예를 들어, TALE-NT(https://tale-nt.cac.cornell.edu/), 모조 핸드(Mojo hand)(http://www.talendesign.org/)가 이용가능하다. 상업적으로 이용가능한 키트 또한 단백질의 N 말단과 C 말단 사이의 TALE 반복 영역의 맞춤식 어셈블리 생성을 지원할 수 있다. 상기 방법은 맞춤식 DBD를 어셈블리하는 데 사용될 수 있고, 이는 이어서, 기능성 도메인, 예컨대, TcBuster 트랜스포사제 서열을 함유하는 발현 벡터로 클로닝된다.

TALE는 실험실에서 예를 들어, 골든 게이트(Golden Gate) 반응의 분해 및 라이게이션 단계를 타입 II 제한 효소와 조합함으로써 새로 합성될 수 있다. 대안적으로, TALE는 라이게이션 비의존 클로닝(LIC: Ligation-Independent Cloning), 고속 라이게이션 기반 자동화 고체상 고처리량(FLASH: Fast Ligation-based Automatable Solid-phase High-throughput) 어셈블리, 반복 캡팽 형성 어셈블리(ICA: Iterative-Capped Assembly)를 포함하나, 이에 제한되지 않는, 다수의 상이한 접근법에 의해 어셈블리될 수 있다.

아연 핑거(ZF: zinc finger)는 ~3개의 뉴클레오티드로 이루어진 제한된 조합물에 결합할 수 있는 ~30개의 아미노산이다. C2H2 ZF 도메인이 가장 일반적인 유형의 ZF일 수 있고, 이는 진핵 세포에서 가장 풍부하게 발현되는 단백질들 중 하나인 것으로 보인다. ZF는 그의 구조 내의 아연 분자와 배위결합하는, 작고, 기능성이며, 독립적으로 폴딩되는 도메인이다. 각 ZF 중의 아미노산은 특이적인 뉴클레오티드에 대하여 편향된 친화성을 가질 수 있고, 이로써, 각 핑거는 DNA 중 3-4개의 뉴클레오티드를 선택적으로 인식할 수 있다. 다중 ZF는 탠덤 어레이로 배열될 수 있고, DNA 상의 한 세트의 뉴클레오티드를 인식할 수 있다. 상이한 아연 핑거의 조합을 사용함으로써, 게놈 내의 고유한 DNA 서열을 표적화할 수 있다. 다양한 길이의 상이한 ZFP가 생성될 수 있고, 이로써, 가능한 64개의 트리플릿 하위부위 이외의 거의 모든 원하는 DNA 서열 인식이 가능해질 수 있다.

본 개시내용과 관련하여 사용되는 아연 핑거는 확립된 모듈식 어셈블리 핑거, 예컨대, (Barbas)와 동료들에 의해 개발된 모듈식 어셈블리 핑거 도메인 세트, 및 또한 툴젠(ToolGen)에 의한 모듈식 어셈블리 핑거 도메인의 또 다른 세트를 사용하여 생성될 수 있다. 두 도메인 세트 모두, 모든 3 bp GNN, 대부분의 ANN, 다수의 CNN, 및 일부 TNN 트리플릿(여기서, N은 4개의 뉴클레오티드 중 임의의 것일 수 있다)을 포괄한다. 둘 모두 상이한 핑거 세트를 가지며, 이를 통해, 필요에 따라 상이한 ZF 모듈을 찾고, 코딩할 수 있다. 단백질 중 핑거 위치 및 이웃 핑거의 서열을 비롯한, 모듈식 어셈블리의 컨텍스트 의존 효과를 최소화하기 위해 조합적 선별 기반의 올리고머화된 풀 조작(OPEN: oligomerized pool engineering) 전략법 또한 사용될 수 있다. OPEN ZF 어레이는 아연 핑거 컨소시엄 데이터베이스(Zinc Finger Consortium Database)로부터 공개적으로 이용가능하다.

AAV Rep DNA 결합 도메인은 본 개시내용의 대상과 관련하여 사용될 수 있는 또 다른 DNA 서열 특이적 결합 도메인이다. 바이러스 시스 작용 역위 말단 반복부(ITR), 및 트랜스 작용 바이러스 Rep 단백질(Rep)은 헬퍼 바이러스의 부재하에서 숙주 게놈의 AAVS1 부위로의 AAV의 차별적 통합을 매개하는 인자인 것으로 간주된다. AAV Rep 단백질은 AAVS1 부위 중 특이적인 DNA 서열에 결합할 수 있다. 그러므로, 부위 특이적 DNA 결합 도메인은 본원에 기술된 바와 같은 TcBuster 트랜스포사제 도메인과 함께 융합될 수 있다.

본원에서 제공되는 바와 같은 융합 트랜스포사제는 TcBuster 트랜스포사제 서열 및 태그 서열을 포함할 수 있다. 본원에서 제공되는 바와 같은 태그 서열이란, 융합 단백질의 검출 태그로서 사용될 수 있는 임의의 단백질 서열, 예컨대, 제한하는 것은 아니지만, 항체에 의해 인식될 수 있는 리포터 단백질 및 친화성 태그를 지칭할 수 있다. 리포터 단백질로는 형광성 단백질(예컨대, GFP, RFP, mCherry, YFP), β-갈락토시다제(β-gal), 알칼리성 포스파타제(AP: alkaline phosphatase), 클로람페니콜 아세틸 트랜스퍼라제(CAT: chloramphenicol acetyl transferase), 호스래디쉬 퍼옥시다제(HRP: horseradish peroxidase)를 포함하나, 이에 제한되지 않는다. 친화성 태그의 비제한적 예로는 폴리히스티딘(His 태그), 글루타티온 S-트랜스퍼라제(GST: Glutathione S-Transferase), 말토스 결합 단백질(MBP: Maltose Binding Protein), 칼모듈린 결합 펩티드(CBP: Calmodulin Binding Peptide), 인테인-키틴 결합 도메인(인테인-CBD: intein-chitin binding domain), 스트렙트아비딘/비오틴 기반 태그, 에피토프 태그, 예컨대, FLAG, HA, c-myc, T7, Glu-Glu 및 기타 다수를 포함한다.

본원에서 제공되는 바와 같은 융합 트랜스포사제는 어떤 중간 서열도 없이(예컨대, "백-투-백") 함께 융합된, TcBuster 트랜스포사제 서열 및 DNA 서열 특이적 결합 도메인 또는 태그 서열을 포함할 수 있다. 일부 경우에서, 본원에서 제공되는 바와 같은 융합 트랜스포사제는 링커 서열에 의해 연결된 TcBuster 트랜스포사제 서열 및 DNA 서열 특이적 결합 도메인 또는 태그 서열을 포함할 수 있다. 도 8은 링커에 의해 연결된 DNA 서열 특이적 결합 도메인 및 TcBuster 트랜스포사제 서열을 포함하는 예시적인 융합 트랜스포사제의 개략도이다. 예시적인 융합 트랜스포사제에서, 링커는 주로 제1 및 제2 폴리펩티드 사이의 스페이서로서 작용할 수 있다. 링커는 단일 폴리펩티드 내의 다중 도메인을 분리시키는 짧은 아미노산 서열일 수 있다. 링커 서열은 천연 다중 도메인 단백질에 존재하는 링커를 포함할 수 있다. 일부 경우에서, 링커 서열은 인공적으로 생성된 링커를 포함할 수 있다. 링커 서열의 선택은 융합 트랜스포사제의 적용에 기초할 수 있다. 링커 서열은 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 아미노산을 포함할 수 있다. 일부 실시양태에서, 링커 서열은 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 15개 이상, 20개 이상, 또는 50개 이상의 아미노산을 포함할 수 있다. 일부 실시양태에서, 링커 서열은 4개 이하, 5개 이하, 6개 이하, 7개 이하, 8개 이하, 9개 이하, 10개 이하, 11개 이하, 12개 이하, 15개 이하, 20개 이하, 30개 이하, 40개 이하, 50개 이하, 또는 100개 이하의 아미노산을 포함할 수 있다. 특정 경우에서, Gly 및 Ser 잔기로 이루어진 스트레치("GS" 링커), 예컨대, (GGGGS)n(n=2-8), (Gly)₈, GSAGSAAGSGEF, (GGGGS)₄를 사용하는 것이 바람직할 수 있다. 종종, 강성 링커 서열, 예컨대, 제한하는 것은 아니지만, (EAAAK)n (n=2-7), Pro가 풍부한 서열, 예컨대, (XP)n(여기서, X는 임의의 아미노산을 표시한다)을 사용하는 것이 바람직할 수 있다.

본원에서 제공되는 예시적인 융합 트랜스포사제에서, TcBuster 트랜스포사제 서열은 DNA 서열 특이적 결합 도메인 또는 태그 서열의 N 말단에 융합될 수 있다. 대안적으로, TcBuster 트랜스포사제 서열은 DNA 서열 특이적 결합 도메인 또는 태그 서열의 C 말단에 융합될 수 있다. 일부 실시양태에서, 융합 트랜스포사제의 적용에 의존하여, TcBuster 트랜스포사제 및 DNA 서열 특이적 결합 도메인 또는 태그 서열 사이에 제3 도메인 서열 또는 그 후속되는 다른 서열도 존재할 수 있다.

TcBuster 트랜스포존

본 개시내용의 또 다른 측면은 2개의 역위 반복부 사이에 위치하는 카세트 카르고를 포함하는 TcBuster 트랜스포존을 제공한다. TcBuster 트랜스포존은 본원에 기술된 바와 같은 TcBuster 트랜스포사제에 의해 인식될 수 있고, 예컨대, TcBuster 트랜스포사제는 TcBuster 트랜스포존을 인식할 수 있고, DNA 서열 내로의 TcBuster 트랜스포존의 전위를 촉매화시킬 수 있다.

본원에서 상호교환적으로 사용되는 "역위 반복부", "말단 역위 반복부", "역위 말단 반복부"라는 용어는 천연 트랜스포존 중의 트랜스포사제 유전자, 또는 인공적으로 조작된 트랜스포존 중의 카세트 카르고 측면에 위치하는 짧은 서열 반복부를 지칭할 수 있다. 2개의 역위 반복부는 일반적으로 상응하는 트랜스포사제의 존재하에서 트랜스포존의 이동을 위해 요구된다. 본원에 기술된 바와 같은 역위 반복부는 하나 이상의 동향 반복부(DR: direct repeat) 서열을 함유할 수 있다. 상기 서열은 보통 상기 요소의 말단 역위 반복부(TIR) 중에 포매되어 있다. 본원에서 사용되는 바, "카르고 카세트"라는 용어는 TcBuster 트랜스포사제 유전자를 함유하는 역위 반복부 사이의 천연 뉴클레오티드 서열과는 다른 뉴클레오티드 서열을 지칭할 수 있다. 카르고 카세트는 인공적으로 조작된 것일 수 있다.

본원에 기술된 트랜스포존은 IR/DR 서열이 측면에 위치하는 카르고 카세트를 함유할 수 있다. 일부 실시양태에서, 반복부 중 적어도 하나는 1 이상의 동향 반복부를 함유한다. 도 1 및 2에 제시된 바와 같이, 트랜스포존은 IRDR-L-Seq1(서열 번호 3) 및 IRDR-R-Seq1(서열 번호 4)이 측면에 위치하는 카르고 카세트를 함유할 수 있다. 다수의 경우에서, 좌측 역위 반복부는 IRDR-L-Seq1(서열 번호 3)과 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 종종, 우측 역위 반복부는 IRDR-R-Seq1(서열 번호 4)과 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 다른 경우에서, 우측 역위 반복부는 IRDR-L-Seq1(서열 번호 3)과 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 종종, 좌측 역위 반복부는 IRDR-R-Seq1(서열 번호 4)과 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 본원에서 사용되는 바, "좌측" 및 "우측"이라는 용어는 각각 이중 가닥 트랜스포존의 센스 가닥 상에서 카르고 카세트의 5'측 및 3'측을 지칭할 수 있다. 트랜스포존은 IRDR-L-Seq2(서열 번호 5) 및 IRDR-R-Seq2(서열 번호 6)가 측면에 위치하는 카르고 카세트를 함유할 수 있다는 것 또한 가능하다. 다수의 경우에서, 좌측 역위 반복부는 IRDR-L-Seq2(서열 번호 5)와 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 종종, 우측 역위 반복부는 IRDR-R-Seq2(서열 번호 6)와 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 다른 경우에서, 우측 역위 반복부는 IRDR-L-Seq2(서열 번호 5)와 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 종종, 좌측 역위 반복부는 IRDR-R-Seq2(서열 번호 6)와 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 포함할 수 있다. 트랜스포존은 도 2에 제시된 것과 상이한 뉴클레오티드 서열, 또는 당업자에게 공지된 다양한 서열의 조합을 가지는 2개의 역위 반복부가 측면에 위치하는 카르고 카세트를 함유할 수 있다. 본원에 기술된 트랜스포존의 2개의 역위 반복부 중 적어도 하나는 서열 번호 3-6 중 어느 하나와 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100% 동일한 서열을 함유할 수 있다. 본원에 기술된 트랜스포존의 역위 반복부 중 적어도 하나는 서열 번호 3 또는 4와 80% 이상 동일한 서열을 함유할 수 있다. 본원에 기술된 트랜스포존의 역위 반복부 중 적어도 하나는 서열 번호 5 또는 6과 80% 이상 동일한 서열을 함유할 수 있다. 역위 반복부 서열의 선택은 예상 전위 효율, 변형시키고자 하는 세포의 유형, 사용하는 트랜스포사제, 및 다수의 다른 인자에 따라 달라질 수 있다.

다수의 구현에서, 게놈 공간을 보존하는 최소 크기의 트랜스포존 벡터 역위 말단 반복부가 사용될 수 있다. hAT 패밀리 트랜스포존의 ITR은 우측 및 좌측 ITR의 차이에 따라 크게 분기한다. 다수의 경우에서, 단지 100-200개의 뉴클레오티드로만 구성된 더 작은 ITR은 hAT 트랜스포존 벡터에서 더욱 긴 천연 ITR만큼 활성을 띤다. 이들 서열은 일관되게 hAT 패밀리 전위를 매개하는 동안, 단축된다. 이들 더 짧은 ITR은 hAT 트랜스포존 벡터 내의 게놈 공간을 보존할 수 있다.

본원에서 제공되는 트랜스포존의 역위 반복부는 약 50 내지 2,000개의 뉴클레오티드, 약 50 내지 1,000개의 뉴클레오티드, 약 50 내지 800개의 뉴클레오티드, 약 50 내지 600개의 뉴클레오티드, 약 50 내지 500개의 뉴클레오티드, 약 50 내지 400개의 뉴클레오티드, 약 50 내지 350개의 뉴클레오티드, 약 50 내지 300개의 뉴클레오티드, 약 50 내지 250개의 뉴클레오티드, 약 50 내지 200개의 뉴클레오티드, 약 50 내지 180개의 뉴클레오티드, 약 50 내지 160개의 뉴클레오티드, 약 50 내지 140개의 뉴클레오티드, 약 50 내지 120개의 뉴클레오티드, 약 50 내지 110개의 뉴클레오티드, 약 50 내지 100개의 뉴클레오티드, 약 50 내지 90개의 뉴클레오티드, 약 50 내지 80개의 뉴클레오티드, 약 50 내지 70개의 뉴클레오티드, 약 50 내지 60개의 뉴클레오티드, 약 75 내지 750개의 뉴클레오티드, 약 75 내지 450개의 뉴클레오티드, 약 75 내지 325개의 뉴클레오티드, 약 75 내지 250개의 뉴클레오티드, 약 75 내지 150개의 뉴클레오티드, 약 75 내지 95개의 뉴클레오티드, 약 100 내지 500개의 뉴클레오티드, 약 100 내지 400개의 뉴클레오티드, 약 100 내지 350개의 뉴클레오티드, 약 100 내지 300개의 뉴클레오티드, 약 100 내지 250개의 뉴클레오티드, 약 100 내지 220개의 뉴클레오티드, 약 100 내지 200개의 뉴클레오티드이거나, 또는 그로부터 도출되는 임의의 범위에 있을 수 있다.

일부 경우에서, 카르고 카세트는 프로모터, 트랜스진, 또는 이의 조합을 포함할 수 있다. 프로모터 및 트랜스진, 둘 모두를 포함하는 카르고 카세트에서, 트랜스진의 발현은 프로모터에 의해 지시될 수 있다. 프로모터는 당업자에게 이용가능한 임의 유형의 프로모터일 수 있다. TcBuster 트랜스포존에서 사용될 수 있는 프로모터의 비제한적 예로는 EFS, CMV, MND, EF1α, CAGGs, PGK, UBC, U6, H1, 및 Cumate를 포함한다. TcBuster 전위에서 사용하고자 하는 프로모터의 선택은 다수의 인자, 예컨대, 제한하는 것은 아니지만, 프로모터의 발현 효율, 유전적으로 변형시키고자 하는 세포 유형, 및 원하는 트랜스진 발현 수준에 의존하게 될 것이다.

TcBuster 트랜스포존 중의 트랜스진은 임의의 관심 유전자일 수 있고, 당업자에게 이용가능한 것일 수 있다. 트랜스진은 천연 유전자로부터 유래될 수 있거나, 또는 그의 변이체일 수 있거나, 또는 인공적으로 디자인된 것일 수 있다. 트랜스진은 변형시키고자 하는 세포와 동일한 종, 또는 상이한 종으로부터 기원하는 것일 수 있다. 트랜스진은 원핵성 유전자, 또는 진행성 유전자일 수 있다. 종종, 트랜스진은 비인간 동물, 식물, 또는 인간으로부터 유래된 유전자일 수 있다. 트랜스진은 인트론을 포함할 수 있다. 대안적으로, 트랜스진에서 인트론이 제거되거나, 또는 인트론이 존재하지 않을 수 있다.

일부 실시양태에서, 트랜스진은 단백질을 코딩할 수 있다. 예시적인 단백질로는 세포 수용체, 면역 체크포인트 단백질, 사이토카인, 또는 이의 임의 조합을 포함하나, 이에 제한되지 않는다. 종종, 본원에 기술된 바와 같은 세포 수용체로는 T 세포 수용체(TCR), B 세포 수용체(BCR), 키메라 항원 수용체(CAR), 또는 이의 임의 조합을 포함할 수 있지만, 이에 제한되지 않는다.

본원에 기술된 바와 같은 카르고 카세트는 임의 유형의 단백질 생성물을 코딩하는 트랜스진을 함유하는 것이 아니라, 다른 목적에 유용한 것을 함유할 수 있다. 예를 들어, 카르고 카세트는 예를 들어, 숙주 게놈에서 유전자의 엑손에 삽입될 때, 삽입 부위에서 프레임시프트를 생성하는 데 사용될 수 있다. 이는 유전자 생성물의 말단절단 또는 삭제 돌연변이를 초래할 수 있다. 종종, 카르고 카세트는 내인성 게놈 서열을 외인성 뉴클레오티드 서열과 치환하여 숙주 게놈을 변형시키는 데에도 사용될 수 있다.

본원에 기술된 트랜스포존은 정방향 또는 역방향으로 카르고 카세트를 가질 수 있다. 다수의 경우에서, 카르고 카세트는 그 자신의 방향성을 가진다. 예를 들어, 트랜스진을 함유하는 카르고 카세트는 5'에서 3'으로의 코딩 서열을 가질 것이다. 프로모터 및 유전자 삽입을 함유하는 카르고 카세트는 유전자 삽입의 5' 부위 상에 프로모터를 가질 것이다. 본원에서 사용되는 바, "정방향"이라는 용어는 카르고 카세트가 이중 가닥 트랜스포존의 센스 가닥 상에서 그의 방향성을 유지하는 상황을 지칭할 수 있다. 본원에서 사용되는 바, "역방향"이라는 용어는 카르고 카세트가 이중 가닥 트랜스포존의 안티센스 가닥 상에서 그의 방향성을 유지하는 상황을 지칭할 수 있다.

게놈 편집을 위한 시스템 및 사용 방법

본 개시내용의 또 다른 측면은 게놈 편집을 위한 시스템을 제공한다. 시스템은 TcBuster 트랜스포사제 및 TcBuster 트랜스포존을 포함할 수 있다. 시스템은 숙주 세포의 게놈을 편집하는 데, 숙주 세포의 내인성 게놈 영역을 파괴시키거나, 변형시키는 데, 외인성 유전자를 숙주 게놈 내로 삽입하는 데, 내인성 뉴클레오티드 서열을 외인성 뉴클레오티드 서열로 치환시키는 데, 또는 이의 임의 조합을 위해 사용될 수 있다.

게놈 편집을 위한 시스템은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제, 및 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 포함할 수 있다. 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제는 정제된 단백질로서 제공될 수 있다. 단백질 제조 및 정제 기술은 당업자에게 공지되어 있다. 정제된 단백질은 트랜스포존과 상이한 용기 중에 보관될 수 있거나, 또는 동일한 용기 중에 보관될 수 있다.

다수의 경우에서, 게놈 편집을 위한 시스템은 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제, 및 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 코딩하는 폴리뉴클레오티드를 포함할 수 있다. 종종, 본 시스템의 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 DNA를 포함할 수 있다. 대안적으로 또는 추가로, 본 시스템의 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 메신저 RNA(mRNA)를 포함할 수 있다. mRNA는 당업계의 숙련가에게 널리 공지된 다수의 접근법, 예컨대, 제한하는 것은 아니지만, 생체내 전사 및 RNA 정제, 시험관내 전사, 및 드 노보 합성에 의해 제조될 수 있다. 다수의 경우에서, mRNA는 화학적으로 변형된 것일 수 있다. 화학적으로 변형된 mRNA는 분해에 대하여 비변형 또는 천연 mRNA보다 내성을 띨 수 있거나, 또는 더욱 빠르게 분해될 수 있다. 다수의 경우에서, mRNA의 화학적 변형으로 mRNA는 더욱 효율적으로 번역될 수 있다. mRNA의 화학적 변형은 당업자에게 이용가능한 널리 공지된 기술을 이용하여, 또는 상업적 공급업체에 의해 수행될 수 있다.

다수의 적용에서, 안전성은 hAT 트랜스포사제 발현의 지속 기간은 오직 안전한 트랜스포존 전달을 매개하는 데 충분한 정도로만 긴 시간이어야 함을 지시한다. 또한, 트랜스포존 벡터 수준의 높이와 일치하는 hAT 트랜스포사제 발현의 펄스가 최대 유전자 전달을 달성할 수 있다. 시험관내에서 DNA 플라스미드 주형으로부터 RNA 분자를 전사시키는 데 이용가능한 기술을 사용하여 구현된다. RNA 분자는 DNA 카피로부터의 시험관내(예컨대, 무세포) 전사를 위한 다양한 방법을 사용하여 합성될 수 있다. 이를 수행하는 방법은 기술되어 있고, 상업적으로 이용가능하다. 예를 들어, m메세지 머신(mMessage Machine) 시험관내 전사 키트가 라이프 테크놀로리즈(life technologies)를 통해 이용가능하다.

서비스 기준으로 수수료 부과하에 시험관내 전사를 수행할 수 있는 회사도 다수 존재한다. 본 발명자들은 또한 hAT 발현의 경우, 화학적으로 변형된 RNA가 유전자 전달을 특히 잘 수행한다는 것을 발견하였다. 이러한 화학적으로 변형된 RNA는 세포 면역 반응을 유도하지 않고, 또한 세포 면역 반응을 막는 사유 방법을 이용하여 RNA를 생성하였다. 이러한 RNA 제조는 RNA 이량체를 제거하고(Clean-Cap), 세포 반응성(슈도우리딘 도입)은 본 발명자들의 수주에서는 독성을 보이지 않으면서, 인간 T 세포에서 더욱 우수한 일시적인 유전자 발현을 일으킨다(데이터는 제시되지 않음). RNA 분자는, 보통은 대부분에 세포에 대해 비독성인, 기술된 다수의 RNA 형질감염 방법 중 임의의 것을 사용하여 세포 내로 도입될 수 있다. 이를 수행하는 방법은 기술되어 있고, 상업적으로 이용가능하다. 예를 들어, 아막사(Amaxa) 뉴클레오펙터, 네온(Neon) 전기천공 장치, 및 맥스사이트(Maxcyte) 플랫폼이 있다.

본원에 기술된 바와 같은 트랜스포존은 발현 벡터에 존재할 수 있다. 다수의 경우에서, 발현 벡터는 DNA 플라스미드일 수 있다. 종종, 발현 벡터는 미니서클 벡터일 수 있다. 본원에서 사용되는 바, "미니서클 벡터"이라는 용어는, 모두는 아닐지라도, 대개의 원핵성 벡터 부분(예컨대, 원핵성 기원의 제어 서열 또는 비기능성 서열)은 함유하지 않는, 작은 환형 플라스미드 유도체를 지칭할 수 있다. 여러 상황하에서, 형질감염 또는 전기천공에 의해 생성되는 세포에 대한 독성은 본원에 기술된 바와 같은 "미니서클"을 사용함으로써 경감될 수 있다.

미니서클 벡터는 이용가능한, 널리 공지된 분자 클로닝 기술에 의해 제조될 수 있다. 먼저, 박테리아, 예컨대, E. 콜라이(E. coli)에서 '모체 플라스미드'(삽입을 포함하는 박테리아 플라스미드, 예컨대, 트랜스포존 구성체)를 제조한 후, 이어서, 부위 특이적 레콤비나제를 유도할 수 있다. 이어서, 상기 단계 다음으로 삽입체의 양측 말단 모두에서 2개의 레콤비나제-표적 서열을 통해 원핵성 벡터를 절제하고, 생성된 미니서클 벡터를 회수할 수 있다. 정제된 미니서클을 형질감염 또는 리포펙션에 의해 수용자 세포 내로 및 예를 들어, 분사 주사에 의해 분화된 조직 내로 전달할 수 있다. TcBuster 트랜스포존을 함유하는 미니서클의 크기는 약 1.5 kb, 약 2 kb, 약 2.2 kb, 약 2.4 kb, 약 2.6 kb, 약 2.8 kb, 약 3 kb, 약 3.2 kb, 약 3.4 kb, 약 3.6 kb, 약 3.8 kb, 약 4 kb, 약 4.2 kb, 약 4.4 kb, 약 4.6 kb, 약 4.8 kb, 약 5 kb, 약 5.2 kb, 약 5.4 kb, 약 5.6 kb, 약 5.8 kb, 약 6 kb, 약 6.5 kb, 약 7 kb, 약 8 kb, 약 9 kb, 약 10 kb, 약 12 kb, 약 25 kb, 약 50 kb, 또는 상기의 임의의 두 수치 사이의 값일 수 있다. 종종, 본원에서 제공되는 바와 같은 TcBuster 트랜스포존을 함유하는 미니서클의 크기는 2.1 kb 이하, 3.1 kb 이하, 4.1 kb 이하, 4.5 kb 이하, 5.1 kb 이하, 5.5 kb 이하, 6.5 kb 이하, 7.5 kb 이하, 8.5 kb 이하, 9.5 kb 이하, 11 kb 이하, 13 kb 이하, 15 kb 이하, 30 kb 이하, 또는 60 kb 이하일 수 있다.

특정 실시양태에서, 본원에 기술된 바와 같은 시스템은 동일한 발현 벡터, 예컨대, 플라스미드에 존재하는, 본원에 기술된 바와 같은 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제, 및 트랜스포존을 코딩하는 폴리뉴클레오티드를 함유할 수 있다.

본 개시내용의 추가의 또 다른 측면은 유전자 조작 방법을 제공한다. 유전자 조작 방법은 세포 내로 TcBuster 트랜스포사제, 및 TcBuster 트랜스포사제에 의해 인식가능한 트랜스포존을 도입하는 단계를 포함할 수 있다. 유전자 조작 방법은 또한 무세포 환경에서 수행될 수 있다. 무세포 환경에서의 유전자 조작 방법은 TcBuster 트랜스포사제, TcBuster 트랜스포사제에 의해 인식가능한 트랜스포존 및 표적 핵산을 조합하여 용기, 예컨대, 웰 또는 튜브 내로 넣는 단계를 포함할 수 있다.

본원에 기술된 방법은 세포 내로 본원에서 제공되는 돌연변이체 TcBuster 트랜스포사제, 및 돌연변이체 TcBuster 트랜스포사제에 의해 인식가능한 트랜스포존을 도입하는 단계를 포함할 수 있다. 게놈 편집 방법은 세포 내로 본원에서 제공되는 융합 트랜스포사제, 및 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 도입하는 단계를 포함할 수 있다.

돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제는 단백질로서, 또는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드를 통해 세포 내로 도입될 수 있다. 상기 논의된 바와 같이, 폴리뉴클레오티드는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 DNA 또는 mRNA를 포함할 수 있다.

다수의 경우에서, TcBuster 트랜스포사제 또는 융합 트랜스포사제는 단백질로서 숙주 세포 내로 형질감염될 수 있고, 단백질 농도는 0.05 nM 이상, 0.1 nM 이상, 0.2 nM 이상, 0.5 nM 이상, 1 nM 이상, 2 nM 이상, 5 nM 이상, 10 nM 이상, 50 nM 이상, 100 nM 이상, 200 nM 이상, 500 nM 이상, 1 μM 이상, 2 μM 이상, 5 μM 이상, 7.5 μM 이상, 10 μM 이상, 15 μM 이상, 20 μM 이상, 25 μM 이상, 50 μM 이상, 100 μM 이상, 200 μM 이상, 500 μM 이상, 또는 1 μM 이상일 수 있다. 종종, 단백질 농도는 약 1 μM 내지 약 50 μM, 약 2 μM 내지 약 25 μM, 약 5 μM 내지 약 12.5 μM, 또는 약 7.5 μM 내지 약 10 μM일 수 있다.

다수의 경우에서, TcBuster 트랜스포사제 또는 융합 트랜스포사제는 폴리뉴클레오티드를 통해 숙주 세포 내로 형질감염될 수 있고, 폴리뉴클레오티드 농도는 적어도 약 5 ng/ml, 10 ng/ml, 20 ng/ml, 40 ng/ml, 50 ng/ml, 60 ng/ml, 80 ng/ml, 100 ng/ml, 120 ng/ml, 150 ng/ml, 180 ng/ml, 200 ng/ml, 220 ng/ml, 250 ng/ml, 280 ng/ml, 300 ng/ml, 500 ng/ml, 750 ng/ml, 1 ㎍/ml, 2 ㎍/ml, 3 ㎍/ml, 5 ㎍/ml, 50 ㎍/ml, 100 ㎍/ml, 150 ㎍/ml, 200 ㎍/ml, 250 ㎍/ml, 300 ㎍/ml, 350 ㎍/ml, 400 ㎍/ml, 450 ㎍/ml, 500 ㎍/ml, 550 ㎍/ml, 600 ㎍/ml, 650 ㎍/ml, 700 ㎍/ml, 750 ㎍/ml, 또는 800 ㎍/ml일 수 있다. 종종, 폴리뉴클레오티드 농도는 약 5-25 ㎍/ml, 25-50 ㎍/ml, 50-100 ㎍/ml, 100-150 ㎍/ml, 150-200 ㎍/ml, 200-250 ㎍/ml, 250-500 ㎍/ml, 5-800 ㎍/ml, 200-800 ㎍/ml, 250-800 ㎍/ml, 400-800 ㎍/ml, 500-800 ㎍/ml, 또는 그 안에서 도출가능한 임의 범위일 수 있다. 다수의 경우에서, 트랜스포존은 트랜스포사제와는 다른 별개의 발현 벡터에 존재하고, 트랜스포존 농도는 적어도 약 5 ng/ml, 10 ng/ml, 20 ng/ml, 40 ng/ml, 50 ng/ml, 60 ng/ml, 80 ng/ml, 100 ng/ml, 120 ng/ml, 150 ng/ml, 180 ng/ml, 200 ng/ml, 220 ng/ml, 250 ng/ml, 280 ng/ml, 300 ng/ml, 500 ng/ml, 750 ng/ml, 1 ㎍/ml, 2 ㎍/ml, 3 ㎍/ml, 5 ㎍/ml, 50 ㎍/ml, 100 ㎍/ml, 150 ㎍/ml, 200 ㎍/ml, 250 ㎍/ml, 300 ㎍/ml, 350 ㎍/ml, 400 ㎍/ml, 450 ㎍/ml, 500 ㎍/ml, 550 ㎍/ml, 600 ㎍/ml, 650 ㎍/ml, 700 ㎍/ml, 750 ㎍/ml, 또는 800 ㎍/ml일 수 있다. 종종, 트랜스포존 농도는 약 5-25 ㎍/ml, 25-50 ㎍/ml, 50-100 ㎍/ml, 100-150 ㎍/ml, 150-200 ㎍/ml, 200-250 ㎍/ml, 250-500 ㎍/ml, 5-800 ㎍/ml, 200-800 ㎍/ml, 250-800 ㎍/ml, 400-800 ㎍/ml, 500-800 ㎍/ml, 또는 그 안에서 도출가능한 임의 범위일 수 있다. 트랜스포사제를 코딩하는 폴리뉴클레오티드 대비 트랜스포존의 비는 10,000 이하, 5,000 이하, 1000 이하, 500 이하, 200 이하, 100 이하, 50 이하, 20 이하, 10 이하, 5 이하, 2 이하, 1 이하, 0.1 이하, 0.05 이하, 0.01 이하, 0.001 이하, 0.0001 이하, 또는 이의 임의의 둘 사이의 임의 수치일 수도 있다.

일부 다른 경우에서, 트랜스포존 및 트랜스포사제를 코딩하는 폴리뉴클레오티드는 동일한 발현 벡터에 존재하고, 트랜스포존 및 트랜스포사제를 코딩하는 폴리뉴클레오티드, 둘 모두를 함유하는 발현 벡터의 농도는 적어도 약 5 ng/ml, 10 ng/ml, 20 ng/ml, 40 ng/ml, 50 ng/ml, 60 ng/ml, 80 ng/ml, 100 ng/ml, 120 ng/ml, 150 ng/ml, 180 ng/ml, 200 ng/ml, 220 ng/ml, 250 ng/ml, 280 ng/ml, 300 ng/ml, 500 ng/ml, 750 ng/ml, 1 ㎍/ml, 2 ㎍/ml, 3 ㎍/ml, 5 ㎍/ml, 50 ㎍/ml, 100 ㎍/ml, 150 ㎍/ml, 200 ㎍/ml, 250 ㎍/ml, 300 ㎍/ml, 350 ㎍/ml, 400 ㎍/ml, 450 ㎍/ml, 500 ㎍/ml, 550 ㎍/ml, 600 ㎍/ml, 650 ㎍/ml, 700 ㎍/ml, 750 ㎍/ml, 또는 800 ㎍/ml일 수 있다. 종종, 트랜스포존 및 트랜스포사제를 코딩하는 폴리뉴클레오티드, 둘 모두를 함유하는 발현 벡터의 농도는 약 5-25 ㎍/ml, 25-50 ㎍/ml, 50-100 ㎍/ml, 100-150 ㎍/ml, 150-200 ㎍/ml, 200-250 ㎍/ml, 250-500 ㎍/ml, 5-800 ㎍/ml, 200-800 ㎍/ml, 250-800 ㎍/ml, 400-800 ㎍/ml, 500-800 ㎍/ml, 또는 그 안에서 도출가능한 임의 범위다.

일부 경우에서, 전기천공에 의해 세포 내로 도입될 수 있는 폴리핵산의 양은 형질감염 효율 및/또는 세포 생존능을 최적화시킬 수 있도록 달라질 수 있다. 일부 경우에서, 약 100 pg 미만의 핵산이 각 세포 샘플(예컨대, 전기천공되는 하나 이상의 세포)에 첨가될 수 있다. 일부 경우에서, 약 100 pg 이상, 약 200 pg 이상, 약 300 pg 이상, 약 400 pg 이상, 약 500 pg 이상, 약 600 pg 이상, 약 700 pg 이상, 약 800 pg 이상, 약 900 pg 이상, 약 1 ㎍ 이상, 약 1.5 ㎍ 이상, 약 2 ㎍ 이상, 약 2.5 ㎍ 이상, 약 3 ㎍ 이상, 약 3.5 ㎍ 이상, 약 4 ㎍ 이상, 약 4.5 ㎍ 이상, 약 5 ㎍ 이상, 약 5.5 ㎍ 이상, 약 6 ㎍ 이상, 약 6.5 ㎍ 이상, 약 7 ㎍ 이상, 약 7.5 ㎍ 이상, 약 8 ㎍ 이상, 약 8.5 ㎍ 이상, 약 9 ㎍ 이상, 약 9.5 ㎍ 이상, 약 10 ㎍ 이상, 약 11 ㎍ 이상, 약 12 ㎍ 이상, 약 13 ㎍ 이상, 약 14 ㎍ 이상, 약 15 ㎍ 이상, 약 20 ㎍ 이상, 약 25 ㎍ 이상, 약 30 ㎍ 이상, 약 35 ㎍ 이상, 약 40 ㎍ 이상, 약 45 ㎍ 이상, 또는 약 50 ㎍ 이상의 핵산이 각 세포 샘플(예컨대, 전기천공되는 하나 이상의 세포)에 첨가될 수 있다. 예를 들어, 1 ㎍의 dsDNA가 전기천공을 위해 각 세포 샘플에 첨가될 수 있다. 일부 경우에서, 최적의 형질감염 효율 및/또는 세포 생존능을 위해 요구되는 폴리핵산(예컨대, dsDNA)의 양은 세포 유형에 특이적일 수 있다.

본원에 개시된 대상은 광범위한 각종 유형의 숙주 세포의 게놈 편집에서 사용될 수 있다. 바람직한 실시양태에서, 숙주 세포는 진핵 유기체로부터의 것일 수 있다. 일부 실시양태에서, 세포는 포유동물 기원으로부터의 것일 수 있다. 일부 실시양태에서, 세포는 인간 기원으로부터의 것일 수 있다.

일반적으로, 세포는 불멸화 세포주 또는 1차 세포로부터의 것일 수 있다.

본원에서 사용되는 바, "세포주" 및 "불멸화 세포주"라는 용어는 보통은 무한 증식하지 않지만, 돌연변이에 기인하여, 정상적인 세포 노화를 피할 수 있고, 대신, 계속해서 세포 분열을 할 수 있는, 유기체로부터의 세포 집단을 지칭할 수 있다. 본원에서 제공되는 대상은 인간 BC-1 세포, 인간 BJAB 세포, 인간 IM-9 세포, 인간 지요예(Jiyoye) 세포, 인간 K-562 세포, 인간 LCL 세포, 마우스 MPC-11 세포, 인간 라지(Raji) 세포, 인간 라모스(Ramos) 세포, 마우스 라모스 세포, 인간 RPMI8226 세포, 인간 RS4-11 세포, 인간 SKW6.4 세포, 인간 수지상 세포, 마우스 P815 세포, 마우스 RBL-2H3 세포, 인간 HL-60 세포, 인간 NAMALWA 세포, 인간 대식세포 세포, 마우스 RAW 264.7 세포, 인간 KG-1 세포, 마우스 M1 세포, 인간 PBMC 세포, 마우스 BW5147 (T200-A)5.2 세포, 인간 CCRF-CEM 세포, 마우스 EL4 세포, 인간 주르카트(Jurkat) 세포, 인간 SCID.adh 세포, 인간 U-937 세포 또는 이의 세포의 임의 조합을 포함하나, 이에 제한되지 않는, 다양한 일반 확립된 세포주에서 사용될 수 있다.

본원에서 사용되는 바, "1차 세포"라는 용어 및 이의 문법상 등가어는 유기체, 전형적으로, 다세포 유기체, 예컨대, 동물 또는 식물의 살아있는 조직으로부터 직접 채취된 세포를 지칭할 수 있다. 다수의 경우에서, 1차 세포는 시험관내 성장을 위해 확립된 것일 수 있다. 일부 경우에서, 1차 세포는 유기체로부터 단지 제거되었을 뿐, 형질감염 전에 아직은 시험관내 성장을 위해 확립되지는 않은 것일 수 있다. 일부 실시양태에서, 1차 세포는 또한 시험관내에서 확장될 수 있고, 즉, 1차 세포는 또한 유기체로부터 직접 채취된 세포의 증식으로부터 생성된 자손 세포를 포함할 수 있다. 이러한 경우, 자손 세포는 확립된 세포주에서의 세포와 같은 무한 증식 특성을 보이지 않는다. 예를 들어, 숙주 세포는, 형질감염 이전에, T 세포가 T 세포 증식 및 세포 집단의 확장을 초래할 수 있는 자극 인자(들)에 노출된 것인, 인간 1차 T 세포일 수 있다.

유전적으로 변형시키고자 하는 세포는 조직 또는 기관, 예컨대, 제한하는 것은 아니지만, 뇌, 폐, 간, 심장, 비장, 췌장, 소장, 대장, 골격근, 평활근, 피부, 골, 지방 조직, 모발, 갑상선, 기도, 담낭, 신장, 수뇨관, 방광, 동맥, 정맥, 식도, 횡격막, 위, 직장, 부신, 기관지, 귀, 눈, 망막, 생식기, 시상하부, 후두, 코, 혀, 척수, 또는 수뇨관, 자궁, 난소, 정소, 및 이의 임의 조합으로부터의 1차 세포일 수 있다. 특정 실시양태에서, 세포는 혈구, 트리코사이트, 각질형성세포, 생식선 자극 세포, 코르티코트로프성 세포, 갑상선 자극 호르몬 분비 세포, 성장 호르몬 분비 세포, 프로락틴 분비 세포, 크롬친화성 세포, 소포곁 세포, 사구 세포, 멜라닌 세포, 모반 세포, 메르켈 세포, 조상아세포, 백아질아세포, 각막 세포, 망막 뮐러 세포, 망막 색소 상피 세포, 뉴런, 교세포, 뇌실막세포, 송과체세포, 폐포세포, 클라라 세포, 배상 세포, G 세포, D 세포, 장크롬친화성 유사 세포, 위 주세포, 벽세포, 소와 세포, K 세포, D 세포, I 세포, 파네트 세포, 장세포, 미소주름 세포, 간세포, 간 성상 세포, 쓸개세포, 샘꽈리 중심 세포, 췌장 성상 세포, 췌장 α 세포, 췌장 β 세포, 췌장 δ 세포, 췌장 F 세포, 췌장 ε 세포, 갑상선, 부갑상선, 호산성 세포, 요로 상피 세포, 골아세포, 골세포, 연골아세포, 연골세포, 섬유아세포, 섬유세포, 근아세포, 근세포, 근위성세포, 건 세포, 심근 세포, 지방아세포, 지방세포, 카할 사이질 세포, 혈관아세포, 내피 세포, 혈관 사이 세포, 방사구체 세포, 치밀반 세포, 간질 세포, 사이질 세포, 텔로사이트, 단층 상피 세포, 족세포, 신장 근위 세뇨관 솔 가장자리 세포, 세르톨리 세포, 라이디히 세포, 과립막 세포, 페그(peg) 세포, 생식 세포, 정자, 난자, 림프구, 골수양 세포, 내피 전구 세포, 내피 줄기 세포, 혈관아세포, 중간혈관아세포, 혈관주위세포, 벽 세포, 및 이의 임의 조합을 포함할 수 있지만, 이에 제한되지 않는다. 다수의 경우에서, 변형시키고자 하는 세포는 줄기 세포, 예컨대, 제한하는 것은 아니지만, 배아 줄기 세포, 조혈 줄기 세포, 표피 줄기 세포, 상피 줄기 세포, 기관지폐포 줄기 세포, 유선 줄기 세포, 중간엽 줄기 세포, 장 줄기 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 정소 세포, 및 이의 임의 조합일 수 있다. 종종, 세포는 임의의 조직 유형으로부터 유래된 유도 만능 줄기 세포일 수 있다.

일부 실시양태에서, 유전적으로 변형시키고자 하는 세포는 포유동물 세포일 수 있다. 일부 실시양태에서, 세포는 면역 세포일 수 있다. 세포의 비제한적 예로는 B 세포, 호염기구, 수지상 세포, 호산구, 감마 델타 T 세포, 과립구, 헬퍼 T 세포, 랑게르한스 세포, 림프구양 세포, 선천성 림프구양 세포(ILC: innate lymphoid cell), 대식세포, 비만 세포, 거핵구, 기억 T 세포, 단핵구, 골수양 세포, 자연 살해 T 세포, 호중구, 전구 세포, 형질 세포, 전구 세포, 조절 T 세포, T 세포, 흉선세포, 이의 임의의 분화된 또는 탈분화된 세포, 또는 이의 세포의 임의의 혼합물 또는 조합을 포함할 수 있다. 특정 경우에서, 세포는 T 세포일 수 있다. 일부 실시양태에서, 세포는 1차 T 세포일 수 있다. 특정 경우에서, 세포는 항원 제시 세포(APC: antigen-presenting cell)일 수 있다. 일부 실시양태에서, 세포는 1차 APC일 수 있다. 본 개시내용과 관련된 APC는 수지상 세포, 대식세포, B 세포, 다른 비전문 APC, 또는 이의 임의 조합일 수 있다.

일부 실시양태에서, 세포는 ILC(선천성 림프구양 세포)일 수 있고, ILC는 그룹 1 ILC, 그룹 2 ILC, 또는 그룹 3 ILC일 수 있다. 그룹 1 ILC는 일반적으로, 세포내 병원체에 대한 반응으로 1형 사이토카인, 예컨대, IFN-감마 및 TNF-알파를 분비하는, T-bet 전사 인자에 의해 제어되는 세포인 것으로 기술될 수 있다. 그룹 2 ILC는 일반적으로, 세포외 기생충 감염에 대한 반응으로 2형 사이토카인을 생산하는, GATA-3 및 ROR-알파 전사 인자에 의존하는 세포인 것으로 기술될 수 있다. 그룹 3 ILC는 일반적으로, ROR-감마 t 전사 인자에 의해 제어되고, IL-17 및/또는 IL-22을 생산하는 세포인 것으로 기술될 수 있다.

일부 실시양태에서, 세포는 주어진 인자에 대해 양성 또는 음성인 세포일 수 있다. 일부 실시양태에서, 세포는 CD3+ 세포, CD3- 세포, CD5+ 세포, CD5- 세포, CD7+ 세포, CD7- 세포, CD14+ 세포, CD14- 세포, CD8+ 세포, CD8- 세포, CD103+ 세포, CD103- 세포, CD11b+ 세포, CD11b- 세포, BDCA1+ 세포, BDCA1- 세포, L-셀렉틴+ 세포, L-셀렉틴- 세포, CD25+, CD25- 세포, CD27+, CD27- 세포, CD28+ 세포, CD28- 세포, CD44+ 세포, CD44- 세포, CD56+ 세포, CD56- 세포, CD57+ 세포, CD57- 세포, CD62L+ 세포, CD62L- 세포, CD69+ 세포, CD69- 세포, CD45RO+ 세포, CD45RO- 세포, CD127+ 세포, CD127- 세포, CD132+ 세포, CD132- 세포, IL-7+ 세포, IL-7- 세포, IL-15+ 세포, IL-15- 세포, 렉틴 유사 수용체 G1 양성 세포, 렉틴 유사 수용체 G1 음성 세포, 또는 이의 분화된 또는 탈분화된 세포일 수 있다. 세포에 의해 발현되는 인자의 예는 제한하는 것으로 의도되지 않으며, 당업자는 세포가 당업계에 공지된 임의의 인자에 대해 양성 또는 음성일 수 있다는 것을 이해할 것이다. 일부 실시양태에서, 세포는 2개 이상의 인자에 대해 양성일 수 있다. 예를 들어, 세포는 CD4+ 및 CD8+일 수 있다. 일부 실시양태에서, 세포는 2개 이상의 인자에 대해 음성일 수 있다. 예를 들어, 세포는 CD25-, CD44-, 및 CD69-일 수 있다. 일부 실시양태에서, 세포는 하나 이상의 인자에 대해 양성이고, 하나 이상의 인자에 대해 음성일 수 있다. 예를 들어, 세포는 CD4+ 및 CD8-일 수 있다.

본원에 개시된 방법들 중 임의의 것에서 사용되는 세포는 본원에 개시된 세포들 중 임의의 것의 혼합물(예컨대, 2개 이상의 상이한 세포)일 수 있다는 것을 이해하여야 한다. 예를 들어, 본 개시내용의 방법은 세포를 포함할 수 있고, 세포는 CD4+ 세포 및 CD8+ 세포의 혼합물이다. 또 다른 예에서, 본 개시내용의 방법은 세포를 포함할 수 있고, 세포는 CD4+ 세포 및 나이브 세포의 혼합물이다.

본원에서 제공되는 바와 같이, 트랜스포사제 및 트랜스포존은 다수의 접근법을 통해 세포 내로 도입될 수 있다. 본원에서 사용되는 바, "형질감염"이라는 용어 및 이의 문법상 등가어는 일반적으로 핵산을 진핵 세포 내로 도입하는 프로세스를 지칭할 수 있다. 본 대상과 관련하여 사용될 수 있는 형질감염 방법으로는 전기천공, 미세주사, 인산칼슘 침전, 양이온 중합체, 덴드리머, 리포솜, 미세투사 충격법, 퓨진, 직접 음파 로딩, 세포 압착법, 광학 형질감염, 원형질체 융합, 임페일펙션, 마그네토펙션, 뉴클레오펙션, 또는 이의 임의 조합을 포함할 수 있지만, 이에 제한되지 않는다. 다수의 경우에서, 본원에 기술된 트랜스포사제 및 트랜스포존은 전기천공을 통해 숙주 세포 내로 형질감염될 수 있다. 종종, 형질감염은 또한 전기천공 방법의 변형법, 예컨대, (뉴클레오펙터(Nucleofector)TM 기술로도 공지되어 있는) 뉴클레오펙션을 통해서도 수행될 수 있다. 본원에서 사용되는 바, "전기천공"이라는 용어 및 이의 문법상 등가어는 세포막의 투과성을 증가시켜 화학물질, 약물, 또는 DNA가 세포 내로 도입될 수 있도록 하기 위해 전기장을 세포에 인가하는 프로세스를 지칭할 수 있다. 전기천공 동안 전기장은 대개 예컨대, 5 밀리초, 10 밀리초, 및 50 밀리초와 같이, 매우 짧은 기간의 "펄스" 형태로 제공된다. 당업자에 의해 이해되는 바와 같이, 전기천공은 펄스 회전 전기장 사용에 의해 세포 외막에 있는 공극을 일시적으로 개방한다. 시험관내 및 생체내에서의 전기천공을 위해 사용되는 방법 및 장치 또한 널리 공지되어 있다. 전기천공되는 세포 유형 및 세포에 의해 흡수되는 분자의 물리적 특징, 예컨대, 펄스 강도, 펄스 길이, 펄스 수에 의존하여 다양한 전기적 파라미터가 선택될 수 있다.

적용

본 대상, 예컨대, 본원에서 제공되는 조성물(예컨대, 돌연변이체 TcBuster 트랜스포사제, 융합 트랜스포사제, TcBuster 트랜스포존), 시스템 및 방법은 현대 생활의 다양한 측면에서 게놈 편집과 관련된 광범위한 적용에서 사용될 수 있다.

특정 상황하에서, 본원에 기술된 대상의 이점으로는 절감된 비용, 규제적 고려사항, 더 낮은 면역원성 및 더 작은 복잡성을 포함할 수 있지만, 이에 제한되지 않는다. 일부 경우에서, 본 개시내용의 큰 이점은 높은 전위 효율이다. 다수의 경우에서, 본 개시내용의 또 다른 이점은 본원에서 제공되는 전위 시스템은 "조정가능"하다는 점일 수 있고, 예컨대, 전위는 무작위 삽입보다는 엄선된 게놈 영역을 표적화하도록 디자인될 수 있다.

한 비제한적 예는 연구 및 임상적 적용을 위한 유전적으로 변형된 세포를 생성하는 것에 관한 것이다. 예를 들어, 상기 논의된 바와 같이, 유전적으로 변형된 T 세포는 본원에서 제공되는 대상을 사용하여 생성될 수 있고, 이는 사람이 다양한 질환, 예컨대, 제한하는 것은 아니지만, 암 및 감염성 질환과 투병 중인 경우에 그에 도움을 주는 데 사용될 수 있다.

한 특정 예로는 본원에서 제공되는 방법을 이용하여 유전적으로 변형된 1차 백혈구를 생성하고, 유전적으로 변형된 1차 백혈구를 그를 필요로 하는 환자에게 투여하는 것을 포함한다. 유전적으로 변형된 1차 백혈구를 생성하는 것은 백혈구 내로 본원에 기술된 바와 같은 트랜스포존, 및 트랜스포존을 인식할 수 있는 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 도입하여 유전적으로 변형된 백혈구를 생성하는 것을 포함할 수 있다. 다수의 경우에서, 트랜스포존은 트랜스진을 포함할 수 있다. 트랜스진은 세포 수용체, 면역 체크포인트 단백질, 사이토카인, 및 이의 임의 조합일 수 있다. 종종, 세포 수용체는 T 세포 수용체(TCR), B 세포 수용체(BCR), 키메라 항원 수용체(CAR), 또는 이의 임의 조합을 포함할 수 있지만, 이에 제한되지 않는다. 일부 다른 경우에서, 트랜스포존 및 트랜스포사제는 내인성 유전자, 예를 들어, 사이토카인, 면역 체크포인트 단백질, 온코진, 또는 이의 임의 조합을 결실 또는 변형시키도록 디자인된다. 1차 백혈구의 유전적 변형은 환자를 이환된 상태로 만드는 감염성 병원체 또는 암 세포에 대한 면역을 촉진시키도록 디자인될 수 있다.

또 다른 비제한적 예는 농업, 식품 생산, 의약, 및 약제를 위해 유전적으로 변형된 유기체를 생성하는 것에 관한 것이다. 유전적으로 변형될 수 있는 종은 식물 및 동물을 포함하나, 이에 제한되지 않는 것으로 광범위하게 걸쳐 있다. 유전적으로 변형된 유기체, 예컨대, 유전적으로 변형된 작물 또는 가축은 이의 생리적 특성의 다른 측면에서 변형될 수 있다. 식용 작물에서의 예는 특정 해충, 질환, 또는 환경 조건에 대한 내성, 변질 감소, 또는 화학적 처리에 대한 내성(예컨대, 제초제에 대한 내성), 또는 작물의 영양적 프로파일 개선을 포함한다. 비식용 작물에서의 예는 약학 제제 생산, 바이오연료, 및 산업상 유용한 다른 제품 뿐만 아니라, 생물적 복원용인 것을 포함한다. 가축에서의 예는 특정 기생충에 대한 내성, 특정 영양소 생산, 생장률 증가, 및 유생산 증가를 포함한다.

본원에서 사용되는 바, 참조 수치값 및 이의 문법상 등가어와 관련하여 "약"라는 용어 및 이의 문법상 등가어는 값 ± 상기 값의 10%인 범위를 포함할 수 있다. 예를 들어, "약 10"이라는 양은 9 내지 11인 양을 포함한다. 참조 수치값과 관련하여 "약"라는 용어는 또한 값 ± 상기 값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1%인 범위를 포함할 수 있다.

실시예

하기의 본 실시예는 본 개시내용의 범주를 제한하지 않으면서, 기술된 실시양태를 추가로 예시한다.

실시예 1. 재료 및 방법

본 실시예는 예시적인 돌연변이체 TcBuster 트랜스포사제 생성 및 평가에 사용되는 수개의 방법을 기술한다.

TcBuster 돌연변이체 제조를 위한 부위 지정 돌연변이유발

hAT 및 buster 서브패밀리의 뉴클레오티드 서열 및 아미노산 정렬에 의해 추정 과활성 TcBuster(TcB) 트랜스포사제 돌연변이체를 확인하였다. 모든 부위 지정 돌연변이유발을 위해 Q5 부위 지정 돌연변이유발 키트(New England BioLabs)를 사용하였다. PCR 돌연변이유발 후, PCR 생성물을 진JET(GeneJET) PCR 정제 키트(Thermo Fisher Scientific)를 사용하여 정제하였다. 정제된 PCR 생성물의 20 uL 라이게이션 반응을 T4 DNA 리가제(New England BioLabs)를 사용하여 수행하였다. DH10베타 세포에서의 형질전환을 위해 5 uL의 라이게이션 반응물을 사용하였다. 시쿼테크(Sequetech)를 통한 직접 콜로니 서열분석을 사용하여 원하는 돌연변이의 존재에 대해 확인하였다. 돌연변이가 확인된 DNA를 자이모PURE(ZymoPURE) 플라스미드 미니프렙 키트(Zymo Research)를 이용하여 프렙하였다.

HEK-293T 세포에서의 형질감염 효율 측정

형질감염 하루 전, HEK-293T 세포를 6 웰 플레이트의 각 웰당 300,000개의 세포로 플레이팅하였다. 세포를 트랜스IT(TransIT) X2 시약을 사용하여 제조사의 설명서(Mirus Bio)에 따라 500 ng의 mCherry-퓨로마이신 카세트를 보유하는 트랜스포존, 및 62.5 ng TcB 트랜스포사제로 형질감염시켰다. 형질감염 후 2일째, 세포를 DMEM 완전 배지에 삼중으로 6 웰 플레이트의 각 웰당 3,000개의 세포인 밀도로 퓨로마이신(1 ug/mL)과 함께 재플레이팅시키거나, 또는 퓨로마이신 선별 없이 재플레이팅시켰다. 퓨로마이신 처리된 세포의 콜로니 계수에 의해(약물 선별로부터 생존한 각 세포는 콜로니를 형성하였다), 또는 유세포 분석법에 의해 트랜스진의 안정적인 통합을 사정하였다. 콜로니 계수를 위해, 퓨로마이신 선별 후 2주째, DMEM 완전 + 퓨로마이신 배지를 제거하였다. 세포를 1X PBS로 세척하고, 세포를 1x 크리스털 바이올렛 용액으로 10분 동안 염색하였다. 플레이트를 PBS로 2회에 걸쳐 세척하고, 콜로니를 계수하였다.

유세포 분석법 분석을 위해, 약물 선별 없이 성장된 세포에서의 mCherry 형광 검출에 의해 트랜스진의 안정적인 통합을 사정하였다. 형질감염 후 명시된 시점에 형질감염된 세포를 수거하고, 1X PBS로 세척하고, 분석용 RDFII 완충제 200 uL 중에 재현탁시켰다. 노보사이트(Novocyte)(Acea Biosciences)를 사용하여 세포를 분석하고, PE-텍사스 레드(PE-Texas red) 채널을 사용하여 mCherry 발현을 사정하였다.

HEK -293T 세포에서의 TcB 트랜스포사제 돌연변이체의 스크리닝

형질감염 하루 전, HEK-293T 세포를 24 웰 플레이트의 각 웰당 75,000개의 세포로 플레이팅하였다. 세포를 트랜스IT X2 시약을 사용하여 제조사의 설명서(Mirus Bio)에 따라 이중으로 500 ng 트랜스포존 및 125 ng 트랜스포사제로 형질감염시켰다. mCherry 형광 검출에 의해 트랜스진의 안정적인 통합을 사정하였다. 형질감염 후 14일째에 세포를 수거하고, 1X PBS로 세척하고, RDFII 완충제 200 uL 중에 재현탁시켰다. 노보사이트(Acea Biosciences)를 사용하여 세포를 분석하고, PE-텍사스 레드 채널을 사용하여 mCherry 발현을 사정하였다.

CD3+ T 세포에서의 TcBuster 트랜스포존 및 트랜스포사제의 형질감염

류코팩(leukopak)(StemCellTechnologies)으로부터 CD3+ T 세포를 농축시키고, 냉동보존하였다. CD3+ T 세포를 해동시키고, 인간 혈청 및 IL-2, IL-15 및 IL-7 사이토카인으로 보충된 X-비보-15(X-Vivo-15) 배지 중에서 2일 동안 CD3/CD28 다이나비즈(Dynabeads)(ThermoFisher)를 사용하여 활성화시켰다. 형질감염 전, CD3/CD28 비드를 제거하고, 세포를 세척하고, 네온 형질감염 시스템(Neon Transfection system)(ThermoFisher)을 이용하여 TcBuster 트랜스포존(TcBuster 및 슬리핑 뷰티 IR/DR 및 GFP 카르고를 보유하는 미니서클) 및 RNA 형태의 TcBuster 또는 슬리핑 뷰티 트랜스포사제로 전기천공시켰다. 생존능에 대한 대조군으로서, 세포를 DNA 또는 RNA 없이 "펄스" 전기천공시켰다. 전기천공된 세포를 형질감염 후 21일 동안 확장시키고, 유세포 분석법에 의해 GFP 카르고의 안정적인 통합인 이루어진 것에 관한 생존능을 사정하였다. SSC-A vs FSC-A에 의해 생존능을 측정하고, 펄스 단독인 대조군에 대해 표준화하고, 2, 7, 14 및 21일째에 FITC 채널을 이용하여 GFP 발현을 사정하였다.

실시예 2. 예시적인 트랜스포존 구성체

본 연구의 목적은 상이한 예시적인 TcBuster 트랜스포존 구성체의 전위 효율을 조사하는 것이었다. 본 발명자들은 10개의 TcBuster(TcB) 트랜스포존(Tn) 구조(도 1a)를 비교하여 포유동물 세포에서의 이의 전위 효율을 시험하였다. 이들 10개의 TcB Tn은 사용된 프로모터(EFS vs CMV), IR/DR 서열 및 트랜스포존 카르고의 방향에서 차이를 보였다. 각 트랜스포존은 2A에 의해 약물 내성 유전자인 퓨로마이신에 연결된 mCherry를 코딩하는 동일한 카세트를 함유하였고, 이로써, 형질감염된 세포는 형광 및/또는 퓨로마이신을 이용하는 선별에 의해 확인할 수 있었다. HEK-293T 세포를 10개의 TcB Tn 중 하나 및 TcB 야생형 트랜스포사제(비: 1 트랜스포존: 1 트랜스포사제)로 형질감염시켰다. 형질감염 후 10-30일 동안 mCherry 형광 검출에 의해 유세포 분석법에 의해 트랜스진의 안정적인 통합을 사정하였다(도 1b).

실험 조건하에서, 트랜스진 mCherry의 안정적인 발현은 EFS와 비교하여 CMV 프로모터를 사용하였을 때, 크게 증진된 것으로 나타났다. 전위는 서열 1 IR/DR 사용시에만 발생하는 것으로 보였다. 또한, 정방향과 비교하여 역방향의 카르고 전사가 더욱 큰 전위 활성을 촉진시킨 것으로 나타났다.

유세포 분석법에 의하면, TcB Tn-8이 시험된 10개의 Tn 중에서 가장 큰 전위 효율을 보였다. TcB Tn-8의 전위 효율을 확인하기 위해, HEK-293T 세포를 WT 트랜스포사제 또는 V596A 돌연변이체 트랜스포사제와 함께 TcB Tn-8형질감염시켰다. 형질감염 후 2일째, 세포를 DMEM 완전 배지에 삼중으로 6 웰 플레이트의 각 웰당 3,000개의 세포인 밀도로 퓨로마이신(1 ug/mL)과 함께 재플레이팅시켰다. 2주 동안 선별 후, 약물 선별로부터 생존한 각 세포는 콜로니를 형성하였고, 이는 mCherry 발현에 대해 사정하고(도 3a), 계수하여 트랜스진의 안정적인 통합에 대해 확인하였다(도 3b-c). HEK-293T 세포에서의 mCherry 발현 및 퓨로마이신 내성 콜로니에 의해 TcB-Tn 8의 전위 효율을 확인하였다.

실시예 3. 예시적인 트랜스포사제 돌연변이체

본 연구의 목적은 TcBuster 트랜스포사제 돌연변이체를 생성하고, 이의 전위 효율을 조사하는 것이었다.

이를 위해, 본 발명자들은 야생형 TcB 트랜스포사제의 cDNA 및 아미노산 서열을 다른 유사 트랜스포사제와 비교함으로써 컨센서스 서열을 생성하였다. 비교를 위해, 13개의 유사한 트랜스포사제를 정렬하여 슬리핑 뷰티를 소생시키고, 8개의 별개의 유기체로부터의 SPIN 유사 트랜스포사제를 정렬하여 SPIN을 소생시켰다. SPIN 및 TcBuster은 풍부한 hAT 트랜스포사제 패밀리의 한 부분이다.

hAT 트랜스포존 패밀리는 2개 패밀리로 구성되며: AC 서브패밀리는 예컨대, hermes, 및 Tol2를 가지고, Buster 서브패밀리는 예컨대, 예컨대, SPIN 및 TcBuster를 가진다. TcBuster의 아미노산 서열을 AC 및 Buster 서브패밀리 구성원, 둘 모두의 아미노산 서열에 대해 정렬하여, 과활성 치환의 표적일 수 있고, TcBuster에서 보존되지 않는 중요한 아미노산을 확인하였다. AC 서브패밀리 구성원 Hermes, Hobo, Tag2, Tam3, Herves, Restless, 및 Tol2에 대해 TcBuster을 정렬함으로써 본 발명자들은 TcBuster에서 치환될 수 있는, 고보존 영역 내의 아미노산을 확인할 수 있었다(도 4). 추가로, Buster 서브패밀리에 대해 TcBuster을 정렬함으로써 치환될 수 있는 더 많은 개수의 후보 아미노산을 유도하였다(도 5). 하기 표 7에 열거되어 있는 바와 같은 부위 돌연변이를 포함하는 올리고뉴클레오티드를 사용하여 후보 TcB 트랜스포사제 돌연변이체를 생성하였다. 이어서, 돌연변이체 서열을 확인하고, pCDNA-DEST40 발현 벡터를 클로닝하고(도 6), 형질감염 이전에 미니 프렙하였다.

TcB 트랜스포사제 돌연변이체의 전위 효율을 조사하기 위해, HEK-293T 세포를 WT 트랜스포사제 또는 V596A 돌연변이체 트랜스포사제, 또는 후보 트랜스포사제 돌연변이체와 함께 TcB Tn-8(mCherry-퓨로마이신 카세트)로 이중으로 형질감염시켰다. 세포를 (약물 선별 없이) DMEM 배지 중에서 성장시키고, 형질감염 후 14일째 유세포 분석법에 의해 mCherry 발현을 사정하였다. 전위 효율이 야생형 트랜스포사제보다 더 큰 20개 초과의 TcB 트랜스포사제 돌연변이체를 확인할 수 있었다(도 7). 이들 조사된 돌연변이체들 중, 3개의 아미노산 치환, D189A, V377T, 및 E469K의 조합을 함유하는 한 돌연변이체 트랜스포사제는 각각의 단일 치환을 함유하는 돌연변이체와 비교하여 전위 활성을 상당히 증가시켰다는 것을 발견하게 되었다. 전위 활성이 높은 돌연변이체는 또한 그 중에서도 특히 K573E/E578L, I452F, A358K, V297K, N85S, S447E, E247K, 및 Q258T를 포함하였다.

이들 조사된 돌연변이체들 중에서, 촉매 트리아드 아미노산(D234, D289, 및 E589) 중 하나와 근접한 위치에서 양으로 하전된 아미노산, 예컨대, 리신(K) 또는 아르기닌(R)으로 진행된 치환 대부분이 전위를 증가시켰다는 것을 발견하게 되었다. 추가로, 양전하 제거, 또는 음전하 첨가가 전위를 감소시켰다. 상기 데이터는 촉매 도메인에 가까운 아미노산은 특히, 이들 아미노산이 양으로 하전된 아미노산으로 돌연변이화될 때, TcB의 전위 활성을 촉진시키는 데 도움을 수 있다는 것을 제안한다.

과활성 TcBuster 돌연변이체 D189A/V377T/E469K의 아미노산 서열(서열 번호 78)은 도 12에 도시되어 있다. 상기 돌연변이체의 추가적인 돌연변이 분석을 수행할 것이다. 도 13에 도시되어 있는 바와 같이, TcBuster 돌연변이체 D189A/V377T/E469K/I452F(서열 번호 79)를 구성할 것이다. 도 14에 도시되어 있는 바와 같이, TcBuster 돌연변이체 D189A/V377T/E469K/N85S(서열 번호 80)를 구성할 것이다. 도 15에 도시되어 있는 바와 같이, Tc Buster 돌연변이체 D189A/V377T/E469K/S358K(서열 번호 81)를 구성할 것이다. 도 16에 도시되어 있는 바와 같이, Tc Buster 돌연변이체 D189A/V377T/E469K/K573E/E578L(서열 번호 13)을 구성할 것이다. 도 12-도 16에서 각각, TcBuster의 도메인은 하기와 같이 표시되어 있고: ZnF-BED(소문자 글씨체), DNA 결합/올리고머화 도메인(굵은체), 촉매 도메인(밑줄체), 및 삽입 도메인(이탤릭체); 코어 D189A/V377T/E469K 치환은 더욱 큰, 굵은, 이탤릭체의 밑줄체로 표시되어 있고; 추가 치환은 큰, 굵은체로 표시되어 있다. 이들 구성체들을 각각 이미 기술된 바와 같이 시험할 것이며, 이는 야생형 TcBuster와 비교하여 과활성을 보일 것으로 기대된다.

실시예 4. TAG를 함유하는 예시적인 융합 트랜스포사제

본 연구의 목적은 융합 TcBuster 트랜스포사제를 생성하고, 이의 전위 효율을 조사하는 것이었다. 예로서, 단백질 태그, GST 또는 PEST 도메인을 TcBuster 트랜스포사제의 N 말단에 융합시켜 융합 TcBuster 트랜스포사제를 생성하였다. 서열 번호 10에 의해 코딩된, 가요성 링커 GGSGGSGGSGGSGTS(서열 번호 9)를 사용하여 TcBuster 트랜스포사제로부터 GST 도메인/PEST 도메인을 분리시켰다. 상기 가요성 링커의 존재가 융합 단백질의 비특이적 상호작용을 최소화시킬 수 있고, 이로써 이의 활성을 증가시킬 수 있다. 예시적인 융합 트랜스포사제를 상기 기술된 바와 같이 TcB Tn-8과 함께 형질감염시키고, 14일째 전위 효율을 유세포 분석법에 의해 mCherry 발현에 의해 측정하였다. 전위 효율은 GFP 또는 PEST 도메인 태그부착으로 어떤 영향도 받지 않았으며(도 9), 이는 트랜스포사제 DNA 결합 도메인을 융합시켜 TcBuster 카르고를 엄선된 게놈 부위, 예컨대, 세이프 하버 부위로 직접 통합시키는 것이 TcBuster가 더욱 안전한 통합 프로파일을 가질 수 있도록 하는 실행가능한 옵션이 될 수 있다는 시사하는 것이다.

실시예 5. TALE 도메인을 포함하는 예시적인 융합 트랜스포사제

본 연구의 목적은 TALE 도메인을 포함하는 융합 TcBuster 트랜스포사제를 생성하고, 융합 트랜스포사제의 전위 활성을 조사하는 것이다. 인간 게놈의 인간 AAVS1(hAAVS1: human AAVS1) 부위를 표적화하도록 TALE 서열(서열 번호 11)을 디자인한다. 이어서, TALE 서열을 야생형 TcBuster 트랜스포사제(서열 번호 1)의 N 말단에 융합시켜 융합 트랜스포사제를 생성한다. 서열 번호 12에 의해 코딩되는 가요성 링커 Gly4Ser2를 사용하여 TALE 도메인과 트랜스포사제 서열을 분리시킨다. 예시적인 융합 트랜스포사제는 아미노산 서열 서열 번호 8을 가진다.

예시적인 융합 트랜스포사제를 TcB Tn-8과 함께 상기 기술된 바와 같이 전기천공을 이용하여 Hela 세포로 형질감염시킬 것이다. TcB Tn-8은 리포터 유전자 mCherry를 포함한다. 형질감염 후 2일째, mCherry 양성 세포를 계수하는 유세포 분석법에 의해 형질감염 효율을 조사할 수 있다. 추가로, 차세대 서열분석을 수행하여 게놈 중 mCherry 유전자 삽입 부위를 사정하게 될 것이다. 디자인된 TALE 서열이 hAAVS1 부위 근처의 게놈 부위에서의 mCherry 유전자의 표적 삽입을 매개할 수 있을 것으로 예상된다.

실시예 6. 1차 인간 T 세포에서의 전위 효율

본 연구의 목적은 TcBuster 트랜스포존 시스템을 개발하여 1차 CD3+ T 세포를 조작하는 것이었다. 이를 위해, 본 발명자들은 GFP 트랜스진을 보유하는 예시적인 TcBuster 트랜스포존을 미니서클 플라스미드 내로 도입하였다. TcB 미니서클 트랜스포존 및 RNA 트랜스포사제, 예컨대, WT TcBuster 트랜스포사제, 및 실시예 2에 기술된 바와 같은 엄선된 예시적인 돌연변이체를 활성화된 CD3+ T 세포에 전기천공시켰다. 전기천공 후 21일 동안 유세포 분석법에 의해 트랜스진 발현을 모니터링하였다.

형질감염 후 14일째, WT TcBuster 트랜스포사제 및 V596A 돌연변이체 트랜스포사제와 비교하여 예시적인 돌연변이체, V377T/E469K 및 V377T/E469K/D189A를 사용였을 때, TcB 트랜스포존의 전위는 거의 2배 가량 개선된 것으로 나타났다(도 10a). 추가로, 과활성 돌연변이체 V377T/E469K 및 V377T/E469K/D189A 경우의 평균 전위 효율은 SB11(평균 = 8.4)과 비교하였을 때, 각각 2배(평균 = 20.2) 및 3배(평균 = 24.1) 더 효율적인 것으로 나타났다.

이어서, 미니서클 TcB 트랜스포존 및 RNA 트랜스포사제로 전기천공한 후 2일째 CD3+ T 세포의 생존능을 사정하였다. CD3+ T 세포를 TcB 미니서클 및 RNA 트랜스포사제로 형질감염시켰을 때에는 생존능이 중간 정도로 감소되었지만; 세포는 7일째까지 생존능을 빠르게 회복하였다(도 10b). 본 실험은 1차 T 세포의 세포 조작에서 본 개시내용의 일부 실시양태에 따른 TcBuster 트랜스포존 시스템의 능력을 입증한다.

실시예 7. 암 환자 치료를 위한 키메라 항원 수용체 변형된 T 세포의 생성

트랜스포존의 역위 반복부 사이에 키메라 항원 수용체(CAR) 유전자를 보유하도록 상기 언급된 TcB Tn-8 구성체를 함유하는 미니서클 플라스미드를 디자인할 수 있다. CAR은 CD137(T 세포에서 공자극성 수용체 [4-1BB]) 및 CD3 제타(T 세포 항원 수용체의 신호 전달 성분) 신호전달 도메인과 커플링된, B 세포 항원 CD19에 대해 특이성을 가지도록 디자인할 수 있다.

자가 T 세포는 암, 예를 들어, 백혈병 환자의 말초 혈액으로부터 수득하게 될 것이다. 적혈구를 용해시키고, PERCOLL™ 구배를 통해 원심분리하여 단핵구를 고갈시킴으로써 T 세포를 단리시킬 수 있다. 항CD3/항CD28 접합된 비드, 예컨대, DYNABEAD M-450 CD3/CD28T를 사용하여 유세포 분석법에 의해 CD3+ T 세포를 단리시킬 수 있다. 단리된 T 세포를 GMP 가이던스에 따라 표준 조건하에서 배양하게 될 것이다.

1차 T 세포의 유전자 변형을 아미노산 치환 V377T, E469K, D189A, K573E 및 E578L을 포함하는 돌연변이체 TcBuster 트랜스포사제(서열 번호 13) 및 CAR을 포함하는 TcBuster Tn-8 트랜스포사제를 사용하여 상기 기술된 바와 같이 수행하게 될 것이다. T 세포를 돌연변이체 TcBuster 트랜스포사제 및 CAR 함유 Tn-8 트랜스포사제의 존재하에서 전기천공시킬 것이다. 형질감염 후, T 세포를 활성화 및 확장을 위해 면역자극 시약(예컨대, 항CD3 항체 및 IL-2, IL-7, 및 IL-15)으로 처리할 것이다. 형질감염 후 2주째 차세대 서열분석에 의해 형질감염 입증을 수행할 것이다. 치료 요법의 디자인을 돕기 위해, 형질감염된 T 세포에서의 형질감염 효율 및 트랜스진 로드를 측정할 수 있다. 서열분석 결과에 의해 위험한 트랜스진 삽입 부위가 드러나게 되면, 임의의 안전성에 관한 문제를 제거하기 위해 특정의 조치를 취할 수 있을 것이다.

키메라 항원 수용체 변형된 T 세포(CAR-T 세포: antigen receptor modified T cell)의 트랜스진 삽입 및 시험관내 확장을 입증한 후, 암 환자에게로 다시 CAR-T 세포를 임상적으로 바람직한 수준까지 주입하기 시작할 것이다.

주입 용량은 암 병기, 환자의 치료 이력, 및 CBC(전체 혈구 계수: complete blood cell count) 및 치료 당일 환자의 활력 징후를 포함하나, 이에 제한되지 않는, 다수의 인자들에 의해 결정될 것이다. 주입 용량은 질환의 진행, 환자의 반발 반응, 및 다수의 다른 의학적 인자에 의존하여 점증 또는 점감될 수 있다. 그 사이에, 치료 요법 동안, 혈액 및 골수 중 키메라 항원 수용체 T 세포를 검출하기 위해 정량적 중합 효소 연쇄 반응(qPCR: quantitative polymerase-chain-reaction) 분석이 수행될 것이다. 투약 전략법 및 다른 치료 계획에 관한 의학적 의사 결정을 내리는 데 qPCR 분석이 사용될 수 있다.

본 발명의 바람직한 실시양태가 본원에 제시되고 기술되어 있지만, 상기 실시양태는 단지 예로 제공된 것이라는 것은 당업자에게 자명할 것이다. 이에 본 발명으로부서 벗어남 없이 다수의 변형, 변경, 및 치환이 당업자에 의해 이루어질 수 있을 것이다. 본원에 기술된 본 발명의 실시양태에 대한 다양한 대안들이 본 발명을 수행하는 데 사용될 수 있다는 것을 이해하여야 한다. 하기 청구범위가 본 발명의 범주를 정의하고, 이들 청구범위의 범주 내의 방법 및 구조 및 이의 등가물이 청구범위에 의해 포괄되는 것으로 의도된다.

SEQUENCE LISTING <110> B-MOGEN BIOTECHNOLOGIES, INC. <120> ENHANCED HAT FAMILY TRANSPOSON-MEDIATED GENE TRANSFER AND ASSOCIATED COMPOSITIONS, SYSTEMS, AND METHODS <130> 52741-702.601 <140> PCT/US2017/066829 <141> 2017-12-15 <150> 62/435,522 <151> 2016-12-16 <160> 203 <170> PatentIn version 3.5 <210> 1 <211> 636 <212> PRT <213> Tribolium castaneum <400> 1 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Asp Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Glu Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 2 <211> 1911 <212> DNA <213> Tribolium castaneum <400> 2 atgatgttga attggctgaa aagtggaaag cttgaaagtc aatcacagga acagagttcc 60 tgctaccttg agaactctaa ctgcctgcca ccaacgctcg attctacaga tattatcggt 120 gaagagaaca aagctggtac cacctctcgc aagaagcgga aatatgacga ggactatctg 180 aacttcggtt ttacatggac tggcgacaag gatgagccca acggactttg tgtgatttgc 240 gagcaggtag tcaacaattc ctcacttaac ccggccaaac tgaaacgcca tttggacaca 300 aagcatccga cgcttaaagg caagagcgaa tacttcaaaa gaaaatgtaa cgagctcaat 360 caaaagaagc atacttttga gcgatacgta agggacgata acaagaacct cctgaaagct 420 tcttatctcg tcagtttgag aatagctaaa cagggcgagg catataccat agcggagaag 480 ttgatcaagc cttgcaccaa ggatctgaca acttgcgtat ttggagaaaa attcgcgagc 540 aaagttgatc tcgtccccct gtccgacacg actatttcaa ggcgaatcga agacatgagt 600 tacttctgtg aagccgtgct ggtgaacagg ttgaaaaatg ctaaatgtgg gtttacgctg 660 cagatggacg agtcaacaga tgttgccggt cttgcaatcc tgcttgtgtt tgttaggtac 720 atacatgaaa gctcttttga ggaggatatg ttgttctgca aagcacttcc cactcagacg 780 acaggggagg agattttcaa tcttctcaat gcctatttcg aaaagcactc catcccatgg 840 aatctgtgtt accacatttg cacagacggt gccaaggcaa tggtaggagt tattaaagga 900 gtcatagcga gaataaaaaa actcgtccct gatataaaag ctagccactg ttgcctgcat 960 cgccacgctt tggctgtaaa gcgaataccg aatgcattgc acgaggtgct caatgacgct 1020 gttaaaatga tcaacttcat caagtctcgg ccgttgaatg cgcgcgtctt cgctttgctg 1080 tgtgacgatt tggggagcct gcataaaaat cttcttcttc ataccgaagt gaggtggctg 1140 tctagaggaa aggtgctgac ccgattttgg gaactgagag atgaaattag aattttcttc 1200 aacgaaaggg aatttgccgg gaaattgaac gacaccagtt ggttgcaaaa tttggcatat 1260 atagctgaca tattcagtta tctgaatgaa gttaatcttt ccctgcaagg gccgaatagc 1320 acaatcttca aggtaaatag ccgcattaac agtattaaat caaagttgaa gttgtgggaa 1380 gagtgtataa cgaaaaataa cactgagtgt tttgcgaacc tcaacgattt tttggaaact 1440 tcaaacactg cgttggatcc aaacctgaag tctaatattt tggaacatct caacggtctt 1500 aagaacacct ttctggagta ttttccacct acgtgtaata atatctcctg ggtggagaat 1560 cctttcaatg aatgcggtaa cgtcgataca ctcccaataa aagagaggga acaattgatt 1620 gacatacgga ctgatacgac attgaaatct tcattcgtgc ctgatggtat aggaccattc 1680 tggatcaaac tgatggacga atttccagaa attagcaaac gagctgtcaa agagctcatg 1740 ccatttgtaa ccacttacct ctgtgagaaa tcattttccg tctatgtagc cacaaaaaca 1800 aaatatcgaa atagacttga tgctgaagac gatatgcgac tccaacttac tactatccat 1860 ccagacattg acaacctttg taacaacaag caggctcaga aatcccactg a 1911 <210> 3 <211> 458 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 cagtgttctt caacctttgc catccggcgg aaccctttgt cgagatattt ttttttatgg 60 aacccttcat ttagtaatac acccagatga gattttaggg acagctgcgt tgacttgtta 120 cgaacaaggt gagcccgtgc tttggtctag ccaagggcat ggtaaagact atattcgcgg 180 cgttgtgaca atttaccgaa caactccgcg gccgggaagc cgatctcggc ttgaacgaat 240 tgttaggtgg cggtacttgg gtcgatatca aagtgcatca cttcttcccg tatgcccaac 300 tttgtataga gagccactgc gggatcgtca ccgtaatctg cttgcacgta gatcacataa 360 gcaccaagcg cgttggcctc atgcttgagg agattgatga gcgcggtggc aatgccctgc 420 ctccggtgct cgccggagac tgcgagatca tagatata 458 <210> 4 <211> 361 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 4 gatatcaagc ttatcgatac cgtcgacctc gagatttctg aacgattcta ggttaggatc 60 aaacaaaata caatttattt taaaactgta agttaactta cctttgcttg tctaaaccaa 120 aaacaacaac aaaactacga ccacaagtac agttacatat ttttgaaaat taaggttaag 180 tgcagtgtaa gtcaactatg cgaatggata acatgtttca acatgaaact ccgattgacg 240 catgtgcatt ctgaagagcg gcgcggccga cgtctctcga attgaagcaa tgactcgcgg 300 aaccccgaaa gcctttgggt ggaaccctag ggttccgcgg aacacaggtt gaagaacact 360 g 361 <210> 5 <211> 325 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 5 cctgcaggag tgttcttcaa cctttgccat ccggcggaac cctttgtcga gatatttttt 60 tttatggaac ccttcattta gtaatacacc cagatgagat tttagggaca gctgcgttga 120 cttgttacga acaaggtgag cccgtgcttt ggtaataaaa actctaaata agatttaaat 180 ttgcatttat ttaaacaaac tttaaacaaa aagataaata ttccaaataa aataatatat 240 aaaataaaaa ataaaaatta atgacttttt tgcgcttgct tattattgca caaattatca 300 atatcgggat ggatcgttgt ttttt 325 <210> 6 <211> 346 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 6 gagccaattc agcatcatat ttctgaacga ttctaggtta ggatcaaaca aaatacaatt 60 tattttaaaa ctgtaagtta acttaccttt gcttgtctaa acctaaaaca acaacaaaac 120 tacgaccaca agtacagtta catatttttg aaaattaagg ttaagtgcag tgtaagtcaa 180 ctatgcgaat ggataacatg tttcaacatg aaactccgat tgacgcatgt gcattctgaa 240 gagcggcgcg gccgacgtct ctcgaattga agcaatgact cgcggaaccc cgaaagcctt 300 tgggtggaac cctagggttc cgcggaacac aggttgaaga acactg 346 <210> 7 <211> 7143 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900 taagctatca acaagtttgt acaaaaaagc tgaacgagaa acgtaaaatg atataaatat 960 caatatatta aattagattt tgcataaaaa acagactaca taatactgta aaacacaaca 1020 tatccagtca ctatggcggc cgcattaggc accccaggct ttacacttta tgcttccggc 1080 tcgtataatg tgtggatttt gagttaggat ccggcgagat tttcaggagc taaggaagct 1140 aaaatggaga aaaaaatcac tggatatacc accgttgata tatcccaatg gcatcgtaaa 1200 gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg 1260 gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt 1320 attcacattc ttgcccgcct gatgaatgct catccggaat tccgtatggc aatgaaagac 1380 ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact 1440 gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata 1500 tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt 1560 gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac 1620 gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa 1680 ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtctg tgatggcttc 1740 catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg 1800 taaagatctg gatccggctt actaaaagcc agataacagt atgcgtattt gcgcgctgat 1860 ttttgcggta taagaatata tactgatatg tatacccgaa gtatgtcaaa aagaggtgtg 1920 ctatgaagca gcgtattaca gtgacagttg acagcgacag ctatcagttg ctcaaggcat 1980 atatgatgtc aatatctccg gtctggtaag cacaaccatg cagaatgaag cccgtcgtct 2040 gcgtgccgaa cgctggaaag cggaaaatca ggaagggatg gctgaggtcg cccggtttat 2100 tgaaatgaac ggctcttttg ctgacgagaa cagggactgg tgaaatgcag tttaaggttt 2160 acacctataa aagagagagc cgttatcgtc tgtttgtgga tgtacagagt gatattattg 2220 acacgcccgg gcgacggatg gtgatccccc tggccagtgc acgtctgctg tcagataaag 2280 tctcccgtga actttacccg gtggtgcata tcggggatga aagctggcgc atgatgacca 2340 ccgatatggc cagtgtgccg gtctccgtta tcggggaaga agtggctgat ctcagccacc 2400 gcgaaaatga catcaaaaac gccattaacc tgatgttctg gggaatataa atgtcaggct 2460 ccgttataca cagccagtct gcaggtcgac catagtgact ggatatgttg tgttttacag 2520 tattatgtag tctgtttttt atgcaaaatc taatttaata tattgatatt tatatcattt 2580 tacgtttctc gttcagcttt cttgtacaaa gtggttgatc tagagggccc gcggttcgaa 2640 ggtaagccta tccctaaccc tctcctcggt ctcgattcta cgcgtaccgg tcatcatcac 2700 catcaccatt gagtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca 2760 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 2820 ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 2880 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 2940 ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg 3000 tatccccacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 3060 gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 3120 ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 3180 cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 3240 agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 3300 aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 3360 gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 3420 aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 3480 gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 3540 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 3600 caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 3660 attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctctg 3720 cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 3780 agctcccggg agcttgtata tccattttcg gatctgatca agagacagga tgaggatcgt 3840 ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 3900 tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 3960 tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 4020 aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 4080 ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 4140 ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 4200 caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 4260 atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 4320 acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 4380 ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 4440 aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 4500 aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 4560 gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 4620 ttcttgacga gttcttctga gcgggactct ggggttcgcg aaatgaccga ccaagcgacg 4680 cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4740 ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4800 ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 4860 atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 4920 ctcatcaatg tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa 4980 tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 5040 cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 5100 attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 5160 tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 5220 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 5280 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 5340 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 5400 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 5460 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 5520 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 5580 catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 5640 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 5700 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 5760 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 5820 actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 5880 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 5940 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 6000 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 6060 aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 6120 atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 6180 gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 6240 atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 6300 ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 6360 cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 6420 agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 6480 cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 6540 tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 6600 agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 6660 gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 6720 gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 6780 ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 6840 tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 6900 tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 6960 gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 7020 caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 7080 atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 7140 gtc 7143 <210> 8 <211> 2844 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 atgctcgaga tggatccctc cgacgcttcg ccggccgcgc aggtggatct acgcacgctc 60 ggctacagtc agcagcagca agagaagatc aaaccgaagg tgcgttcgac agtggcgcag 120 caccacgagg cactggtggg ccatgggttt acacacgcgc acatcgttgc gctcagccaa 180 cacccggcag cgttagggac cgtcgctgtc acgtatcagc acataatcac ggcgttgcca 240 gaggcgacac acgaagacat cgttggcgtc ggcaaacagt ggtccggcgc acgcgccctg 300 gaggccttgt tgactgatgc tggtgagctt agaggacctc ctttgcaact tgatacaggc 360 cagcttctga aaatcgccaa gaggggtggg gtcaccgcgg tcgaggccgt acacgcctgg 420 agaaatgcac tgaccggggc tcctcttaac ctgaccccag accaggtagt cgcaatcgcg 480 tcaaacggag ggggaaagca agccctggaa accgtgcaaa ggttgttgcc ggtcctttgt 540 caagaccacg gccttacacc ggagcaagtc gtggccattg catcccacga cggtggcaaa 600 caggctcttg agacggttca gagacttctc ccagttctct gtcaagccca cgggctgact 660 cccgatcaag ttgtagcgat tgcgtcgcat gacggaggga aacaagcatt ggagactgtc 720 caacggctcc ttcccgtgtt gtgtcaagcc cacggtttga cgcctgcaca agtggtcgcc 780 atcgcctcca atattggcgg taagcaggcg ctggaaacag tacagcgcct gctgcctgta 840 ctgtgccagg atcatggact gacggccaag ctggccgggg gcgcccccgc cgtgggcggg 900 ggccccaagg ccgccgataa attcgccgcc accatgatgt tgaattggct gaaaagtgga 960 aagcttgaaa gtcaatcaca ggaacagagt tcctgctacc ttgagaactc taactgcctg 1020 ccaccaacgc tcgattctac agatattatc ggtgaagaga acaaagctgg taccacctct 1080 cgcaagaagc ggaaatatga cgaggactat ctgaacttcg gttttacatg gactggcgac 1140 aaggatgagc ccaacggact ttgtgtgatt tgcgagcagg tagtcaacaa ttcctcactt 1200 aacccggcca aactgaaacg ccatttggac acaaagcatc cgacgcttaa aggcaagagc 1260 gaatacttca aaagaaaatg taacgagctc aatcaaaaga agcatacttt tgagcgatac 1320 gtaagggacg ataacaagaa cctcctgaaa gcttcttatc tcgtcagttt gagaatagct 1380 aaacagggcg aggcatatac catagcggag aagttgatca agccttgcac caaggatctg 1440 acaacttgcg tatttggaga aaaattcgcg agcaaagttg atctcgtccc cctgtccgac 1500 acgactattt caaggcgaat cgaagacatg agttacttct gtgaagccgt gctggtgaac 1560 aggttgaaaa atgctaaatg tgggtttacg ctgcagatgg acgagtcaac agatgttgcc 1620 ggtcttgcaa tcctgcttgt gtttgttagg tacatacatg aaagctcttt tgaggaggat 1680 atgttgttct gcaaagcact tcccactcag acgacagggg aggagatttt caatcttctc 1740 aatgcctatt tcgaaaagca ctccatccca tggaatctgt gttaccacat ttgcacagac 1800 ggtgccaagg caatggtagg agttattaaa ggagtcatag cgagaataaa aaaactcgtc 1860 cctgatataa aagctagcca ctgttgcctg catcgccacg ctttggctgt aaagcgaata 1920 ccgaatgcat tgcacgaggt gctcaatgac gctgttaaaa tgatcaactt catcaagtct 1980 cggccgttga atgcgcgcgt cttcgctttg ctgtgtgacg atttggggag cctgcataaa 2040 aatcttcttc ttcataccga agtgaggtgg ctgtctagag gaaaggtgct gacccgattt 2100 tgggaactga gagatgaaat tagaattttc ttcaacgaaa gggaatttgc cgggaaattg 2160 aacgacacca gttggttgca aaatttggca tatatagctg acatattcag ttatctgaat 2220 gaagttaatc tttccctgca agggccgaat agcacaatct tcaaggtaaa tagccgcatt 2280 aacagtatta aatcaaagtt gaagttgtgg gaagagtgta taacgaaaaa taacactgag 2340 tgttttgcga acctcaacga ttttttggaa acttcaaaca ctgcgttgga tccaaacctg 2400 aagtctaata ttttggaaca tctcaacggt cttaagaaca cctttctgga gtattttcca 2460 cctacgtgta ataatatctc ctgggtggag aatcctttca atgaatgcgg taacgtcgat 2520 acactcccaa taaaagagag ggaacaattg attgacatac ggactgatac gacattgaaa 2580 tcttcattcg tgcctgatgg tataggacca ttctggatca aactgatgga cgaatttcca 2640 gaaattagca aacgagctgt caaagagctc atgccatttg taaccactta cctctgtgag 2700 aaatcatttt ccgtctatgt agccacaaaa acaaaatatc gaaatagact tgatgctgaa 2760 gacgatatgc gactccaact tactactatc catccagaca ttgacaacct ttgtaacaac 2820 aagcaggctc agaaatccca ctga 2844 <210> 9 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Thr Ser 1 5 10 15 <210> 10 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 ggaggtagtg gcggtagtgg gggctccggt gggagcggca cctca 45 <210> 11 <211> 863 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 atgctcgaga tggatccctc cgacgcttcg ccggccgcgc aggtggatct acgcacgctc 60 ggctacagtc agcagcagca agagaagatc aaaccgaagg tgcgttcgac agtggcgcag 120 caccacgagg cactggtggg ccatgggttt acacacgcgc acatcgttgc gctcagccaa 180 cacccggcag cgttagggac cgtcgctgtc acgtatcagc acataatcac ggcgttgcca 240 gaggcgacac acgaagacat cgttggcgtc ggcaaacagt ggtccggcgc acgcgccctg 300 gaggccttgt tgactgatgc tggtgagctt agaggacctc ctttgcaact tgatacaggc 360 cagcttctga aaatcgccaa gaggggtggg gtcaccgcgg tcgaggccgt acacgcctgg 420 agaaatgcac tgaccggggc tcctcttaac ctgaccccag accaggtagt cgcaatcgcg 480 tcaaacggag ggggaaagca agccctggaa accgtgcaaa ggttgttgcc ggtcctttgt 540 caagaccacg gccttacacc ggagcaagtc gtggccattg catcccacga cggtggcaaa 600 caggctcttg agacggttca gagacttctc ccagttctct gtcaagccca cgggctgact 660 cccgatcaag ttgtagcgat tgcgtcgcat gacggaggga aacaagcatt ggagactgtc 720 caacggctcc ttcccgtgtt gtgtcaagcc cacggtttga cgcctgcaca agtggtcgcc 780 atcgcctcca atattggcgg taagcaggcg ctggaaacag tacagcgcct gctgcctgta 840 ctgtgccagg atcatggact gac 863 <210> 12 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 ggccaagctg gccgggggcg cccccgccgt gggcgggggc cccaaggccg ccgataaatt 60 cgccgccacc 70 <210> 13 <211> 636 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 13 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Ala Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Thr Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Lys Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Glu Arg Ala Val 565 570 575 Lys Leu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 14 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 14 gatttgcgag gaggtagtca ac 22 <210> 15 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 acacaaagtc cgttgggc 18 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 cgcgtcttcg aattgctgtg tgac 24 <210> 17 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 cgcattcaac ggccgaga 18 <210> 18 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 18 gcgcgtcttc agtttgctgt gtgacg 26 <210> 19 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 gcattcaacg gccgagac 18 <210> 20 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 gcgcgtcttc aagttgctgt gtgacg 26 <210> 21 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 gcattcaacg gccgagac 18 <210> 22 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 caaggtaaat gagcgcatta acagtattaa atc 33 <210> 23 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 23 aagattgtgc tattcggc 18 <210> 24 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 24 cattaacagt tttaaatcaa agttgaag 28 <210> 25 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 25 cggctattta ccttgaag 18 <210> 26 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 26 catcccatgg gaactgtgtt acc 23 <210> 27 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 27 gagtgctttt cgaaatagg 19 <210> 28 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 28 cggtcttgca cagctgcttg tgtttg 26 <210> 29 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 29 gcaacatctg ttgactcg 18 <210> 30 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 gtattttcca gatacgtgta ataatatctc ctg 33 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 31 tccagaaagg tgttcttaag 20 <210> 32 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 32 gtattttcca aatacgtgta ataatatctc c 31 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 33 tccagaaagg tgttcttaag 20 <210> 34 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 34 ctcctgggtg cggaatcctt tcaatg 26 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 35 atattattac acgtaggtgg 20 <210> 36 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 36 gaaattagca cacgagctgt c 21 <210> 37 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 37 tggaaattcg tccatcag 18 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 38 gcaggtagtc agcaattcct cac 23 <210> 39 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 39 tcgcaaatca cacaaagtc 19 <210> 40 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 40 taaaggcaag gacgaatact tcaaaagaaa atgtaac 37 <210> 41 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 41 taaaggcaag gacgaatact tcaaaagaaa atgtaac 37 <210> 42 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 ggacgataac gagaacctcc tga 23 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 43 cttacgtatc gctcaaaagt atg 23 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 44 acgccatttg gcaacaaagc atc 23 <210> 45 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 45 ttcagtttgg ccgggtta 18 <210> 46 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 atacgtaagg gcagataaca agaacc 26 <210> 47 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 47 cgctcaaaag tatgcttc 18 <210> 48 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 taccatagcg gcgaagttga tcaag 25 <210> 49 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 tatgcctcgc cctgttta 18 <210> 50 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 ccccctgtcc gcaacgacta tttc 24 <210> 51 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 acgagatcaa ctttgctc 18 <210> 52 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 52 cgagtcaaca gcagttgccg gtc 23 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 53 tccatctgca gcgtaaac 18 <210> 54 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 gtacatacat gcaagctctt ttg 23 <210> 55 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 55 ctaacaaaca caagcagg 18 <210> 56 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 56 tcataccgaa acgaggtggc tgtc 24 <210> 57 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 57 agaagaagat ttttatgcag g 21 <210> 58 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 58 gatggacgag tggacagatg ttgc 24 <210> 59 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 tgcagcgtaa acccacat 18 <210> 60 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 gggcgaggca tttaccatag cgg 23 <210> 61 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 tgtttagcta ttctcaaact gacgagataa g 31 <210> 62 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 62 atacgtaagg gcagataaca agaacc 26 <210> 63 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 63 cgctcaaaag tatgcttc 18 <210> 64 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 taccatagcg gcgaagttga tcaag 25 <210> 65 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 tatgcctcgc cctgttta 18 <210> 66 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 ccccctgtcc gcaacgacta tttc 24 <210> 67 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 67 acgagatcaa ctttgctc 18 <210> 68 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 68 cgagtcaaca gcagttgccg gtc 23 <210> 69 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 69 tccatctgca gcgtaaac 18 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 70 gtacatacat gcaagctctt ttg 23 <210> 71 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 71 ctaacaaaca caagcagg 18 <210> 72 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 tcataccgaa acgaggtggc tgtc 24 <210> 73 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 73 agaagaagat ttttatgcag g 21 <210> 74 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 74 gatggacgag tggacagatg ttgc 24 <210> 75 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 75 tgcagcgtaa acccacat 18 <210> 76 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 76 gggcgaggca tttaccatag cgg 23 <210> 77 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 77 tgtttagcta ttctcaaact gacgagataa g 31 <210> 78 <211> 636 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 78 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Ala Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Thr Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Lys Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 79 <211> 636 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 79 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Ala Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Thr Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Phe Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Lys Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 80 <211> 636 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 80 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Ser Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Ala Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Thr Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Lys Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 81 <211> 636 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 81 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Ala Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Lys Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Thr Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Lys Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 82 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (5)..(5) <223> a, c, t, or g <400> 82 atgcntagat 10 <210> 83 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MISC_FEATURE <222> (1)..(40) <223> This sequence may encompass 2-8 "Gly Gly Gly Gly Ser" repeating units <400> 83 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser 35 40 <210> 84 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 84 Gly Gly Gly Gly Gly Gly Gly Gly 1 5 <210> 85 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 85 Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe 1 5 10 <210> 86 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 86 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser 20 <210> 87 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MISC_FEATURE <222> (1)..(35) <223> This sequence may encompass 2-7 "Glu Ala Ala Ala Lys" repeating units <400> 87 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 1 5 10 15 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 20 25 30 Ala Ala Lys 35 <210> 88 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 88 Gly Gly Gly Gly Ser Ser 1 5 <210> 89 <211> 7 <212> PRT <213> Tribolium castaneum <400> 89 Arg His Leu Asp Thr Lys His 1 5 <210> 90 <211> 6 <212> PRT <213> Tribolium castaneum <400> 90 Tyr Val Arg Asp Asp Asn 1 5 <210> 91 <211> 7 <212> PRT <213> Tribolium castaneum <400> 91 Glu Ala Tyr Thr Ile Ala Glu 1 5 <210> 92 <211> 6 <212> PRT <213> Tribolium castaneum <400> 92 Gly Glu Lys Phe Ala Ser 1 5 <210> 93 <211> 5 <212> PRT <213> Tribolium castaneum <400> 93 Leu Ser Asp Thr Thr 1 5 <210> 94 <211> 5 <212> PRT <213> Tribolium castaneum <400> 94 Asp Glu Ser Thr Asp 1 5 <210> 95 <211> 5 <212> PRT <213> Tribolium castaneum <400> 95 Arg Tyr Ile His Glu 1 5 <210> 96 <211> 6 <212> PRT <213> Tribolium castaneum <400> 96 Thr Thr Gly Glu Glu Ile 1 5 <210> 97 <211> 7 <212> PRT <213> Tribolium castaneum <400> 97 Val Arg Trp Leu Ser Arg Gly 1 5 <210> 98 <211> 5 <212> PRT <213> Tribolium castaneum <400> 98 Glu Cys Phe Ala Asn 1 5 <210> 99 <211> 5 <212> PRT <213> Tribolium castaneum <400> 99 Lys Glu Arg Glu Gln 1 5 <210> 100 <211> 4 <212> PRT <213> Tribolium castaneum <400> 100 Thr Lys Thr Lys 1 <210> 101 <211> 7 <212> PRT <213> Zea mays <400> 101 Asn His Leu Arg Thr Ser His 1 5 <210> 102 <211> 6 <212> PRT <213> Zea mays <400> 102 Tyr Lys Tyr Asp Glu Val 1 5 <210> 103 <211> 7 <212> PRT <213> Zea mays <400> 103 Tyr Pro Phe Asn Ile Val Glu 1 5 <210> 104 <211> 6 <212> PRT <213> Zea mays <400> 104 Lys Ser Arg Val Thr Ala 1 5 <210> 105 <211> 5 <212> PRT <213> Zea mays <400> 105 Leu Tyr Leu Glu Glu 1 5 <210> 106 <211> 5 <212> PRT <213> Zea mays <400> 106 Asp Met Trp Thr Ser 1 5 <210> 107 <211> 5 <212> PRT <213> Zea mays <400> 107 His Trp Ile Asp Asp 1 5 <210> 108 <211> 6 <212> PRT <213> Zea mays <400> 108 His Thr Gly Gln Arg Leu 1 5 <210> 109 <211> 7 <212> PRT <213> Zea mays <400> 109 Thr Arg Trp Asn Ser Thr Tyr 1 5 <210> 110 <211> 5 <212> PRT <213> Zea mays <400> 110 Lys Tyr Trp Lys Val 1 5 <210> 111 <211> 5 <212> PRT <213> Zea mays <400> 111 Asn Asp Ser Met Asp 1 5 <210> 112 <211> 4 <212> PRT <213> Zea mays <400> 112 Val Val Asp Pro 1 <210> 113 <211> 6 <212> PRT <213> Musca domestica <400> 113 Val Ser Ala Asp Cys Lys 1 5 <210> 114 <211> 7 <212> PRT <213> Musca domestica <400> 114 Arg Pro Phe Ser Ala Val Ser 1 5 <210> 115 <211> 6 <212> PRT <213> Musca domestica <400> 115 Tyr Gly Glu His Val Asn 1 5 <210> 116 <211> 5 <212> PRT <213> Musca domestica <400> 116 Thr Ser Asp Ala Lys 1 5 <210> 117 <211> 5 <212> PRT <213> Musca domestica <400> 117 Asp Leu Trp Thr Asp 1 5 <210> 118 <211> 5 <212> PRT <213> Musca domestica <400> 118 His Tyr His Glu Asn 1 5 <210> 119 <211> 6 <212> PRT <213> Musca domestica <400> 119 Ser Thr Ala Glu Asn Ile 1 5 <210> 120 <211> 7 <212> PRT <213> Musca domestica <400> 120 Thr Arg Trp Asn Ser Thr Tyr 1 5 <210> 121 <211> 5 <212> PRT <213> Musca domestica <400> 121 Ile Ile Trp Glu Glu 1 5 <210> 122 <211> 5 <212> PRT <213> Musca domestica <400> 122 His Asn Ser Ile Asp 1 5 <210> 123 <211> 4 <212> PRT <213> Musca domestica <400> 123 Ile Ile Thr Glu 1 <210> 124 <211> 6 <212> PRT <213> Drosophila melanogaster <400> 124 Val Ser Glu Asn Asp Lys 1 5 <210> 125 <211> 7 <212> PRT <213> Drosophila melanogaster <400> 125 Arg Pro Phe Ser Ala Val Thr 1 5 <210> 126 <211> 6 <212> PRT <213> Drosophila melanogaster <400> 126 Tyr Gly Glu Gln Val Asp 1 5 <210> 127 <211> 5 <212> PRT <213> Drosophila melanogaster <400> 127 Thr Ser Asp Ala Glu 1 5 <210> 128 <211> 5 <212> PRT <213> Drosophila melanogaster <400> 128 Asp Met Trp Thr Asp 1 5 <210> 129 <211> 5 <212> PRT <213> Drosophila melanogaster <400> 129 His Tyr Glu Lys Glu 1 5 <210> 130 <211> 6 <212> PRT <213> Drosophila melanogaster <400> 130 Ser Thr Ala Glu Asn Ile 1 5 <210> 131 <211> 7 <212> PRT <213> Drosophila melanogaster <400> 131 Thr Arg Trp Asn Ser Asn Tyr 1 5 <210> 132 <211> 5 <212> PRT <213> Drosophila melanogaster <400> 132 Lys Ile Trp Met Ala 1 5 <210> 133 <211> 5 <212> PRT <213> Drosophila melanogaster <400> 133 Pro Glu Ser Leu Glu 1 5 <210> 134 <211> 4 <212> PRT <213> Drosophila melanogaster <400> 134 Ile Ile Thr Glu 1 <210> 135 <211> 7 <212> PRT <213> Arabidopsis thaliana <400> 135 Arg His Met Arg Ser Cys Glu 1 5 <210> 136 <211> 5 <212> PRT <213> Arabidopsis thaliana <400> 136 Lys Val Asp Met Met 1 5 <210> 137 <211> 7 <212> PRT <213> Arabidopsis thaliana <400> 137 Leu Pro Tyr Ser Phe Val Glu 1 5 <210> 138 <211> 6 <212> PRT <213> Arabidopsis thaliana <400> 138 Trp Ser Arg Asn Thr Ala 1 5 <210> 139 <211> 5 <212> PRT <213> Arabidopsis thaliana <400> 139 Ile Tyr Glu Arg Glu 1 5 <210> 140 <211> 5 <212> PRT <213> Arabidopsis thaliana <400> 140 Asp Leu Trp Arg Ala 1 5 <210> 141 <211> 5 <212> PRT <213> Arabidopsis thaliana <400> 141 His Tyr Val Asp Val 1 5 <210> 142 <211> 6 <212> PRT <213> Arabidopsis thaliana <400> 142 His Ser Gly Val Ala Ile 1 5 <210> 143 <211> 7 <212> PRT <213> Arabidopsis thaliana <400> 143 Thr Arg Trp Asn Ser Thr Tyr 1 5 <210> 144 <211> 5 <212> PRT <213> Arabidopsis thaliana <400> 144 Lys Tyr Trp Glu Asp 1 5 <210> 145 <211> 5 <212> PRT <213> Arabidopsis thaliana <400> 145 Gln Ser Ser Arg Lys 1 5 <210> 146 <211> 4 <212> PRT <213> Arabidopsis thaliana <400> 146 Val Leu Asn Lys 1 <210> 147 <211> 7 <212> PRT <213> Antirrhinum majus <400> 147 Arg His Leu Thr Ala Lys His 1 5 <210> 148 <211> 6 <212> PRT <213> Antirrhinum majus <400> 148 Trp Arg Tyr Asp Gln Asn 1 5 <210> 149 <211> 7 <212> PRT <213> Antirrhinum majus <400> 149 Leu Pro Phe Ser Phe Ala Gln 1 5 <210> 150 <211> 6 <212> PRT <213> Antirrhinum majus <400> 150 Ile Ser Arg Ala Thr Cys 1 5 <210> 151 <211> 5 <212> PRT <213> Antirrhinum majus <400> 151 Gln Tyr Glu Lys Glu 1 5 <210> 152 <211> 5 <212> PRT <213> Antirrhinum majus <400> 152 Asp Leu Trp Gln Gly 1 5 <210> 153 <211> 5 <212> PRT <213> Antirrhinum majus <400> 153 His Trp Ile Asp Lys 1 5 <210> 154 <211> 6 <212> PRT <213> Antirrhinum majus <400> 154 His Asn Gly Asp Cys Ile 1 5 <210> 155 <211> 7 <212> PRT <213> Antirrhinum majus <400> 155 His Arg Trp Asn Ala Thr Tyr 1 5 <210> 156 <211> 5 <212> PRT <213> Antirrhinum majus <400> 156 Lys Tyr Tyr Lys Lys 1 5 <210> 157 <211> 5 <212> PRT <213> Antirrhinum majus <400> 157 Asn Ala Ser Arg Gly 1 5 <210> 158 <211> 4 <212> PRT <213> Antirrhinum majus <400> 158 Val Leu Thr Asp 1 <210> 159 <211> 7 <212> PRT <213> Anopheles gambiae <400> 159 Arg His Leu Asn Leu Val His 1 5 <210> 160 <211> 6 <212> PRT <213> Anopheles gambiae <400> 160 Ile Asn Ser Glu Thr Lys 1 5 <210> 161 <211> 7 <212> PRT <213> Anopheles gambiae <400> 161 Leu Pro Phe Asn Leu Val Glu 1 5 <210> 162 <211> 6 <212> PRT <213> Anopheles gambiae <400> 162 Pro Thr Arg Lys Ser Leu 1 5 <210> 163 <211> 5 <212> PRT <213> Anopheles gambiae <400> 163 Val Tyr Asn Gln Glu 1 5 <210> 164 <211> 5 <212> PRT <213> Anopheles gambiae <400> 164 Asp Gly Trp Thr Asn 1 5 <210> 165 <211> 5 <212> PRT <213> Anopheles gambiae <400> 165 His Tyr Ile Asp Glu 1 5 <210> 166 <211> 6 <212> PRT <213> Anopheles gambiae <400> 166 His Ser Gly Arg Asn Ile 1 5 <210> 167 <211> 7 <212> PRT <213> Anopheles gambiae <400> 167 Thr Arg Trp Asn Ser Gly Tyr 1 5 <210> 168 <211> 5 <212> PRT <213> Anopheles gambiae <400> 168 Lys Ile Tyr Arg Ser 1 5 <210> 169 <211> 5 <212> PRT <213> Anopheles gambiae <400> 169 Lys Val Ser Lys Asp 1 5 <210> 170 <211> 4 <212> PRT <213> Anopheles gambiae <400> 170 Ile Tyr Ser Glu 1 <210> 171 <211> 7 <212> PRT <213> Tolypocladium inflatum <400> 171 Lys His Leu Arg Asp Ile His 1 5 <210> 172 <211> 6 <212> PRT <213> Tolypocladium inflatum <400> 172 Ile Leu Gly Arg Leu Lys 1 5 <210> 173 <211> 7 <212> PRT <213> Tolypocladium inflatum <400> 173 Leu Pro Phe Arg Leu Ile Glu 1 5 <210> 174 <211> 6 <212> PRT <213> Tolypocladium inflatum <400> 174 Tyr Lys Asp Lys Val Pro 1 5 <210> 175 <211> 5 <212> PRT <213> Tolypocladium inflatum <400> 175 Ile Tyr Asn Gly Ala 1 5 <210> 176 <211> 5 <212> PRT <213> Tolypocladium inflatum <400> 176 Asp Gly Trp Thr Ser 1 5 <210> 177 <211> 5 <212> PRT <213> Tolypocladium inflatum <400> 177 Phe Phe Val Asp Gln 1 5 <210> 178 <211> 6 <212> PRT <213> Tolypocladium inflatum <400> 178 His Thr Gly Asp Asn Leu 1 5 <210> 179 <211> 7 <212> PRT <213> Tolypocladium inflatum <400> 179 Thr Arg Trp Asn Ser Arg His 1 5 <210> 180 <211> 5 <212> PRT <213> Tolypocladium inflatum <400> 180 Glu Tyr Tyr Asp Lys 1 5 <210> 181 <211> 5 <212> PRT <213> Tolypocladium inflatum <400> 181 Ala Ser Ser Arg Thr 1 5 <210> 182 <211> 4 <212> PRT <213> Tolypocladium inflatum <400> 182 Met Val Ser Pro 1 <210> 183 <211> 7 <212> PRT <213> Oryzias latipes <400> 183 Lys His Ile Glu Arg Met His 1 5 <210> 184 <211> 6 <212> PRT <213> Oryzias latipes <400> 184 Val Lys His Val Ser Pro 1 5 <210> 185 <211> 7 <212> PRT <213> Oryzias latipes <400> 185 His Pro Phe Ser Thr Val Asp 1 5 <210> 186 <211> 6 <212> PRT <213> Oryzias latipes <400> 186 Ile Thr Arg Pro Thr Leu 1 5 <210> 187 <211> 5 <212> PRT <213> Oryzias latipes <400> 187 Ala Ala Leu Ile Met 1 5 <210> 188 <211> 5 <212> PRT <213> Oryzias latipes <400> 188 Asp Cys Trp Thr Ala 1 5 <210> 189 <211> 5 <212> PRT <213> Oryzias latipes <400> 189 His Trp Ile Asn Pro 1 5 <210> 190 <211> 6 <212> PRT <213> Oryzias latipes <400> 190 His Thr Phe Glu Val Leu 1 5 <210> 191 <211> 7 <212> PRT <213> Oryzias latipes <400> 191 Thr Arg Trp Asn Ser Thr Phe 1 5 <210> 192 <211> 5 <212> PRT <213> Oryzias latipes <400> 192 Arg Phe Lys His Met 1 5 <210> 193 <211> 5 <212> PRT <213> Oryzias latipes <400> 193 Ser Ser Ser Asp Asp 1 5 <210> 194 <211> 4 <212> PRT <213> Oryzias latipes <400> 194 Leu Phe Ser Pro 1 <210> 195 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 195 Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys Glu Gln Val Val 1 5 10 15 Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg His Leu Asp Thr 20 25 30 Lys His Pro Thr Leu Lys Gly Lys Ser 35 40 <210> 196 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 196 Phe Glu Arg Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser 1 5 10 15 Tyr Leu Val Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile 20 25 30 Ala Glu Lys Leu Ile Lys Pro Cys Thr 35 40 <210> 197 <211> 139 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 197 Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val Asn 1 5 10 15 Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu Ser 20 25 30 Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr Ile 35 40 45 His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu Pro 50 55 60 Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr Phe 65 70 75 80 Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr Asp 85 90 95 Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg Ile 100 105 110 Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His Arg 115 120 125 His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala 130 135 <210> 198 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 198 Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu Asn Ala Arg 1 5 10 15 Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His Lys Asn Leu 20 25 30 Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys Val Leu Thr 35 40 45 Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe Asn Glu 50 55 60 <210> 199 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 199 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 1 5 10 15 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser 20 25 30 <210> 200 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 200 Asn Ser Ile Lys Ser Lys Leu 1 5 <210> 201 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 201 Ile Ser Trp Val Glu Asn Pro 1 5 <210> 202 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 202 Ile Arg Thr Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile 1 5 10 15 Gly Pro Phe Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys 20 25 30 Arg Ala Val Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu 35 40 45 Lys Ser Phe Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg 50 55 60 <210> 203 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 203 Gln Leu Thr Thr Ile His Pro 1 5

Claims

서열 번호 1의 야생형 TcBuster 트랜스포사제와 비교하여, V377T, E469K, D189A, K573E 및 E578L로부터 선택되는 2개 이상의 아미노산 치환의 조합을 포함하는 돌연변이체 TcBuster 트랜스포사제.
제1항에 있어서, 서열 번호 1의 야생형 TcBuster 트랜스포사제와 비교하여, 적어도 5개의 아미노산 치환을 포함하는 돌연변이체 TcBuster 트랜스포사제.
제1항에 있어서, 서열 번호 1에 따라 넘버링되었을 때, 하기로부터 선택되는 치환의 조합을 포함하는 돌연변이체 TcBuster 트랜스포사제:
- V377T, E469K, 및 D189A;
- K573E 및 E578L;
- I452F, V377T, E469K, 및 D189A;
- A358K, V377T, E469K, 및 D189A; 및
- V377T, E469K, D189A, K573E 및 E578L.
제1항 내지 제3항 중 어느 한 항에 있어서, 서열 번호 1에 따라 넘버링되었을 때, N85S, D99A, E247K, 또는 이들의 조합으로부터 선택되는 아미노산 치환을 추가로 포함하는 돌연변이체 TcBuster 트랜스포사제.
제1항의 돌연변이체 TcBuster 트랜스포사제와 DNA 서열 특이적 결합 도메인을 포함하는 융합 트랜스포사제.
제5항에 있어서, DNA 서열 특이적 결합 도메인은 TALE 도메인, 아연 핑거 도메인, AAV Rep DNA 결합 도메인, 또는 이들의 임의의 조합을 포함하는 DNA 서열 특이적 결합 도메인으로부터 선택되는 것인 융합 트랜스포사제.
제5항에 있어서, 돌연변이체 TcBuster 트랜스포사제와 DNA 서열 특이적 결합 도메인은 링커에 의해 분리되어 있고, 링커는 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 또는 적어도 50개의 아미노산을 포함하는 것인 융합 트랜스포사제.
제7항에 있어서, 링커는 서열 번호 9를 포함하는 것인 융합 트랜스포사제.
제1항의 돌연변이체 TcBuster 트랜스포사제 또는 제5항의 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드로서, 폴리뉴클레오티드는 DNA 또는 메신저 RNA(mRNA)를 포함하는 것인 폴리뉴클레오티드.
제9항에 있어서, 화학적으로 변형된 mRNA를 포함하는 것인 폴리뉴클레오티드.
제1항의 돌연변이체 TcBuster 트랜스포사제 또는 제5항의 융합 트랜스포사제를 생산하는 세포로서,
상기 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드로서, DNA 또는 메신저 RNA(mRNA)를 포함하는 폴리뉴클레오티드를 함유하는 세포.
제1항의 돌연변이체 TcBuster 트랜스포사제 또는 제5항의 융합 트랜스포사제, 및 상기 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제에 의해 인식가능한 트랜스포존을 시험관 내(in vitro) 또는 생체 외(ex vivo)에서 세포 내로 도입하는 단계를 포함하는 방법.
제12항에 있어서, 도입하는 단계가, 세포를 돌연변이체 TcBuster 트랜스포사제 또는 융합 트랜스포사제를 코딩하는 폴리뉴클레오티드와 접촉시키는 것을 포함하고, 세포를 트랜스포존을 함유하는 DNA 벡터와 접촉시키는 것을 포함하며,
트랜스포존은 2개의 역위 반복부 사이에 위치하는 카르고 카세트를 포함하며,
- 2개의 역위 반복부 중 좌측 역위 반복부가 서열 번호 3 또는 서열 번호 5를 갖는 서열을 포함하거나; 또는
- 2개의 역위 반복부 중 우측 역위 반복부가 서열 번호 4 또는 서열 번호 6를 갖는 서열을 포함하는 것인 방법.
제13항에 있어서, 카르고 카세트가 CMV, EFS, MND, EF1α, CAGCs, PGK, UBC, U6, H1, 및 Cumate로 구성된 군으로부터 선택되는 프로모터를 포함하는 것인 방법.
제12항에 있어서, 도입하는 단계가, 전기천공, 미세주사, 인산칼슘 침전, 양이온 중합체, 덴드리머, 리포솜, 미세투사 충격법, 퓨진(fugene), 직접 음파 로딩, 세포 압착법, 광학 형질감염, 원형질체 융합, 임페일펙션(impalefection), 마그네토펙션(magnetofection), 뉴클레오펙션(nucleofection), 또는 이들의 임의의 조합으로 세포를 형질감염시키는 것을 포함하는 것인 방법.
제13항에 있어서, 세포는, 피험체로부터 단리된 1차 세포이고, 세포는
- 줄기 세포로서, 배아 줄기 세포, 조혈 줄기 세포, 표피 줄기 세포, 상피 줄기 세포, 기관지폐포 줄기 세포, 유선 줄기 세포, 중간엽 줄기 세포, 장 줄기 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 정소 세포, 및 이들의 임의의 조합으로부터 선택되거나 유도 만능 줄기 세포인 줄기 세포; 또는
- CD3+ 세포일 수 있는, 감마 델타 T 세포, 헬퍼 T 세포, 기억 T 세포, 자연 살해 T 세포, 이펙터 T 세포, 또는 이들의 임의의 조합으로부터 선택되는, 1차 백혈구 또는 1차 T 세포
를 포함하며,
카르고 카세트를 포함하는 트랜스포존이 트랜스진을 포함하는 것인 방법.
제16항에 있어서, 트랜스진은 세포 수용체, 면역 체크포인트 단백질, 사이토카인, 및 이들의 임의의 조합으로 구성된 군으로부터 선택된 단백질을 코딩하고, 세포 수용체는 T 세포 수용체(TCR), B 세포 수용체(BCR), 키메라 항원 수용체(CAR), 및 이들의 임의의 조합으로 구성된 군으로부터 선택되는 것인 방법.
제16항에 있어서, 세포는 피험체의 혈액으로부터 단리되는 것인 방법.
제17항에 있어서, 세포는 피험체의 혈액으로부터 단리되는 것인 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제