KR20220019794A - 표적화된 유전자 편집 작제물 및 이의 사용 방법 - Google Patents
표적화된 유전자 편집 작제물 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR20220019794A KR20220019794A KR1020227000857A KR20227000857A KR20220019794A KR 20220019794 A KR20220019794 A KR 20220019794A KR 1020227000857 A KR1020227000857 A KR 1020227000857A KR 20227000857 A KR20227000857 A KR 20227000857A KR 20220019794 A KR20220019794 A KR 20220019794A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- amino acid
- sequence
- modified
- protein
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Virology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 게놈 내로 외인성 핵산의 부위-특이적 삽입을 개선하는데 사용하기 위한 핵산 작제물을 제공한다. 일부 양태에서 핵산 작제물은 특정 게놈 DNA 서열에 결합하도록 조작된 DNA 결합 단백질을 인코딩하는 제1 폴리뉴클레오타이드 서열, 외인성 핵산을 게놈 내로 삽입할 수 있는 변형된 인테그라제 또는 변형된 트랜스포사제를 포함하는 제2 폴리뉴클레오타이드, 및 두 뉴클레오타이드 사이 링커를 인코딩하는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 작제물은 융합 단백질, 예를 들어, 렌티바이러스 입자에 의해 세포로 전달하기 위한 융합 단백질을 인코딩한다.
Description
전자적으로 제출된 서열 목록 참조
[1] 본 명세서와 함께 제출된 ASCII 텍스트 파일 (이름: 4349.001PC01_Seqlisting_ST25; 크기: 389,120 bytes; 및 생성 일자 : 2020년 6월 11일)로 전자적으로 제출된 서열 목록의 내용은 그 전체가 본 명세서에 참조 문헌으로 포함된다.
[2] 암, 발달 장애 및 일부 감염과 같은 많은 질병에는 유전적 및 후성 유전적 이상이 공통적으로 존재한다. 유전자 치료는 유전적 기능 장애 세포를 교정하여 관련 질병을 치료하기 위해 유전자를 직접 표적화하고 편집하기 위해 세포에 유전 물질을 도입하도록 설계된다. 아연 집게 뉴클레아제 (Zinc finger nuclease, ZFN), Talen 및 Crispr-cas9 유전자 편집 기술은 DNA 편집을 위해 최근에 개발된 도구 중 일부를 나타낸다. 유전 물질을 게놈에 전달하기 위해 전기천공법, 양이온성 지질, 미세주입 또는 바이러스와 같은 방법이 사용되고 있다. 유전자 전달을 위한 현재 전략은 일반적으로 아데노바이러스(adenovirus), 레트로바이러스(retroviruse) 또는 네이키드 DNA 플라스미드(naked DNA plasmid)를 기반으로 한다.
[3] HIV를 포함하는 렌티바이러스는 핵산 전달을 위한 벡터로서 사용될 때 강력한 도구이다. 렌티바이러스는 분열 세포와 비분열 세포를 안정적으로 감염시킬 수 있다. 렌티바이러스 벡터는 숙주 게놈에 무작위로 통합되는 경향이 있으며, 삽입 돌연변이의 위험을 높이는 고도로 전사된 유전자 부위에 종종 통합될 수 있다.
[4] HIV-1 인테그라제는 숙주 게놈에서 바이러스 DNA의 삽입을 촉매한다. 일반적으로, HIV-1 인테그라제는 N-말단 도메인 (NTD), 촉매 코어 도메인 (CCD) 및 C-말단 도메인 (CTD)으로 구성된다. NTD는 중요한 보조 인자로서 Zn2+ 양이온에 결합하고 배위하는데 사용되는 반면, CTD는 DNA 결합에 사용된다. CCD는 촉매 코어를 형성하여, 통합 과정이 촉매된다. 바이러스 벡터가 사용하는 삽입 메커니즘의 문제에는 낮은 효율성과 특이성 부족을 포함하는데, 이것은 의도하지 않은 삽입 돌연변이 유발 및 유전독성을 초래할 수 있다.
[5] 본 발명의 일부 양태는 대상체의 게놈, 예를 들어, 인간 게놈 내의 단일 부위 또는 영역을 편집하는 것을 포함하는, 핵산의 표적화된 편집에 유용한 작제물, 플라스미드, 벡터, 입자, 융합 단백질, 조성물, 방법, 및 키트를 제공한다.
[6] 본 발명의 실시예는 프로그래밍 가능한(programmable) 트랜스포사제 및 인테그라제와 Cas9/아연 집게 단백질의 융합 단백질의 작제물의 성공적인 생성을 타당하게 입증하는 실험 데이터를 제공한다. 게다가, 이러한 작제물은 외인성 핵산 서열을 형질감염된 세포의 게놈 내로 부위-특이적 통합을 야기할 수 있었다. 본 발명자들은 게놈에서 외인성 핵산의 부위-특이적 통합 능력을 가지며 특히 큰 유전자를 포함하는 유전자 치료에 적합한 이러한 유형의 융합 단백질이 생성된 것이 이번이 처음이라고 생각하지만, 이러한 이론에 제한되고자 함은 아니다. 본 발명자들은 또한 특정 표적화된 전위를 수행하는 변형된 과활성 PiggyBac 트랜스포사제를 확인하였다.
[7] 따라서, 본 발명의 양태는 핵산 작제물에 관한 것이며, 여기서 핵산 작제물은
a) 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제1 폴리뉴클레오타이드 서열로서; 여기서 제1 DNA 결합 단백질은 아연 집게 단백질 또는 Cas9 단백질인 것인 서열;
b) 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제2 폴리뉴클레오타이드 서열로서, 여기서 제2 DNA 결합 단백질은
i. 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac, 또는
ii. 인간 면역결핍 바이러스 (HIV) 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제인 것인 서열;
c) 링커를 인코딩하는 핵산을 포함하는 선택적인 폴리뉴클레오타이드 서열;
을 포함하며, 여기서 핵산 작제물은 제1 DNA 결합 단백질, 제2 DNA 결합 단백질, 및 제1 DNA 결합 단백질과 제2 DNA 결합 단백질 사이의 선택적인 링커를 포함하는 융합 단백질을 인코딩하고;
여기서 융합 단백질은 외인성 핵산을 게놈의 특정 부위에 삽입할 수 있다.
[8] 또한 본 명세서에 기재된 핵산 작제물, 벡터 또는 융합 단백질, 및 게놈에 삽입하기 위한 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열을 포함하는 조성물이 제공되며, 이러한 조성물은 패키징 벡터에 함유 또는 결합된다.
[9] 본 발명은 또한 외인성 핵산 서열의 단일 카피 또는 다중 카피를 세포 내로 제어된, 부위-특이적 통합 방법을 제공하며, 상기 방법은 (a) 본 명세서에 기재된 핵산 작제물, 벡터 또는 융합 단백질을 세포에 전달하는 단계, 및 (b) 외인성 핵산을 세포에 전달하는 단계를 포함하고; 여기서 세포의 게놈에서 특정 게놈 DNA 서열에 대한 융합 단백질의 결합은 게놈의 절단 및 게놈 내로 외인성 핵산의 하나 이상의 카피를 세포의 통합을 초래한다.
[10] 또 다른 양태는 아미노산 서열 서열 번호 9를 포함하는 변형된 과활성 PiggyBac 트랜스포사제의 제공에 관한 것이며, 여기서: 위치 245의 아미노산은 A이고, 위치 275의 아미노산은 R 또는 A이고, 위치 277의 아미노산은 R 또는 A이고, 위치 325의 아미노산은 A 또는 G이고, 위치 347의 아미노산은 N 또는 A이고, 위치 351의 아미노산은 E, P 또는 A이고, 위치 372의 아미노산은 R이고, 위치 375의 아미노산은 A이고, 위치 450의 아미노산은 D 또는 N이고, 위치 465의 아미노산은 W 또는 A이고, 위치 560의 아미노산은 T 또는 A이고, 위치 564의 아미노산은 P 또는 S이고, 위치 573의 아미노산은 S 또는 A이고, 위치 592의 아미노산은 G 또는 S이고, 위치 594의 아미노산은 L 또는 F이다.
[11] 일부 구현예에서, (i) Cas9 또는 아연 집게 단백질에 연결된 (ii) 인테그라제, 변형된 인테그라제, 트랜스포사제 또는 변형된 트랜스포사제의 융합 단백질; 및 이를 인코딩하는 핵산 작제물이 제공된다.
[12] 본 발명의 특정 양태는 핵산 작제물에 관한 것이며, 여기서 핵산 작제물은 (a) 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 제1 폴리뉴클레오타이드 서열; (b) 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 제2 폴리뉴클레오타이드 서열로서, 여기서 제2 DNA 결합 단백질은 (i) 인테그라제 또는 야생형 인테그라제에 비해 변형된 변형된 인테그라제 또는 (ii) 트랜스포사제 또는 야생형 트랜스포사제에 비해 변형된 변형된 트랜스포사제; 및 (c) 링커를 인코딩하는 핵산을 포함하는 제3 폴리뉴클레오타이드 서열을 포함하며; 여기서 핵산 작제물은 제1 DNA 결합 단백질, 제2 DNA 결합 단백질, 및 제1 DNA 결합 단백질과 제2 DNA 결합 단백질 사이의 링커를 포함하는 융합 단백질을 인코딩한다.
[13] 일부 구현예에서, 핵산 작제물은 다음을 포함한다: (a) Cas 9 단백질을 인코딩하는 제1 폴리뉴클레오타이드 서열; 및 (b) 트랜스포사제 또는 본 발명의 변형된 과활성 PiggyBac 또는 이의 기능적 단편을 인코딩하는 제2 폴리뉴클레오타이드 서열.
[14] 일부 구현예에서, 핵산 작제물은 다음을 포함한다: (a) 아연 집게 단백질을 인코딩하는 제1 폴리뉴클레오타이드 서열; 및 (b) 인테그라제 또는 본 발명의 변형된 인테그라제 또는 이의 기능적 단편을 인코딩하는 제2 폴리뉴클레오타이드 서열.
[15] 일부 구현예에서, 본 발명은 본 발명의 핵산 작제물을 포함하는 플라스미드, 벡터, 또는 숙주 세포에 관한 것이다.
[16] 본 발명의 일부 양태는 융합 단백질에 관한 것이며, 여기서 융합 단백질은 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질; 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 포함하며, 여기서 제2 DNA 결합 단백질은 인테그라제, 트랜스포사제 또는 변형된 인테그라제 또는 트랜스포사제; 및 제1 단백질과 제2 단백질을 연결하는 링커이다.
[17] 일부 구현예에서, 융합 단백질은 다음을 포함한다: (a) Cas 9 단백질; 및 (b) 과활성 PiggyBac 또는 본 발명의 변형된 과활성 PiggyBac 또는 이의 기능적 단편.
[18] 일부 구현예에서, 융합 단백질은 다음을 포함한다: (a) 아연 집게 단백질; 및 (b) 인테그라제 또는 본 발명의 변형된 인테그라제 또는 이의 기능적 단편.
[19] 본 발명의 일부 양태는 본 발명의 융합 단백질을 포함하는 렌티바이러스 입자에 관한 것이다.
[20] 본 발명의 일부 양태는 외인성 핵산 서열을 유기체의 게놈 DNA 내로 삽입하는 방법에 관한 것이며, 상기 방법은 본 발명의 핵산 작제물 또는 융합 단백질을 포함하는 렌티바이러스 입자를 유기체에 투여하여, 이로 인해 제1 및 제2 DNA 결합 단백질이 특정 게놈 DNA 서열에 결합하고 외인성 핵산을 게놈 DNA 내로 삽입하는 것을 포함하며; 여기서 외인성 핵산은 특정 게놈 DNA 서열에서 통합된다.
[21] 본 발명의 일부 양태는 세포 내로의 외인성 핵산 서열의 단일 카피 또는 다중 카피의 제어된, 부위-특이적 통합 방법에 관한 것이며, 상기 방법은 (a) 본 발명의 융합 단백질을 세포에 전달하는 단계, 및 (b) 외인성 핵산을 세포에 전달하는 단계를 포함하며; 세포의 게놈에서 특정 게놈 DNA 서열에 대한 융합 단백질의 결합은 게놈의 절단 및 게놈 내로 외인성 핵산의 하나 이상의 카피를 세포의 통합을 초래하고; 융합 단백질은 렌티바이러스 입자에 의해 세포로 전달된다.
[22] 본 명세서 및 특허 청구범위 전반에 걸쳐 단어 "포함하다" 및 이의 변형은 다른 기술적 특징, 첨가물, 구성 요소, 또는 단계를 배제하려는 의도가 아니다. 본 발명의 추가적인 목적, 이점 및 특징은 설명을 검토함으로써 당업자에게 명백해질 것이며, 본 발명의 실시에 의해 학습될 수 있다. 게다가, 본 발명은 본 명세서에 기재된 특정 및 바람직한 구현예의 가능한 모든 조합을 포함한다. 하기 실시예 및 도면은 본 발명을 제한하려는 의도 없이 예시의 목적으로 여기에 제공된다.
[23] 도 1A 및 1B는 (도 1A) Cas9-PiggyBac 융합 단백질 (인간 Cas9 (hCas9), 닉카제 Cas9 (nCas9), 또는 멸실 Cas9 (dCas9) 및 과활성 PiggyBac (PB) 트랜스포사제) 및 (도 1B) Cas9-SB100 융합 단백질 (인간 Cas9 (hCas9), 닉카제 Cas9 (nCas9), 또는 멸실 Cas9 (dCas9) 및 과활성 슬리핑 뷰티 (SB100) 트랜스포사제)으로 형질감염 후 외인성 핵산 서열이 게놈에 통합된 세포의 백분율을 도시한다. Cas9의 3' 말단이 GGS 링커 (서열 번호 48, 49)에 의해 각각의 트랜스포사제의 5' 말단에 연결된 벡터를 생성하였다 (hCas9PB, nCas9PB, dCas9PB, hCas9SB, nCas9SB, 및 dCas9SB). 각각의 트랜스포사제의 3' 말단이 GGS 링커 (서열 번호 48, 49)에 의해 Cas9의 5' 말단에 연결된 다른 벡터를 생성하였다 (PBhCas9, PBnCas9, PBdCas9, SBhCas9, SbnCas9, 및 SBdCas9). "PiggyBac" (도 1A) 및 "SB100" (도 1B)는 양성 대조군으로서 사용하였고, RFP (도 1A에서 "에피솜(Episomal) RFP"으로 표시) 및 GFP (도 1B에서 "에피솜 GFP"으로 표시)를 인코딩하는 트랜스포존 단독을 음성 대조군으로서 사용하였다. 도 1C는 상이한 구성으로 PB 및 Cas9으로 전위 활성을 나타내는 도 1A 의 상이한 표현이다.
[24] 도 2A는 Cas9/PB 융합 단백질을 인코딩하는 플라스미드 작제물을 도시한다.
[25] 도 2B는 인간 Cas9-PiggyBac ("표적화된 HCas9") 또는 닉카제 Cas9-PiggyBac ("표적화된 NCas9")으로 형성된 융합 작제물에 의한 게놈 내로 통합된 외인성 핵산 서열을 가지는 세포의 백분율을 도시한다. Cas9의 3' 말단을 링커에 의해 트랜스포사제의 5' 말단에 연결하였다. "비표적화된"은 전체 삽입에 대한 대조군이고 (PiggyBac 단독) "에피솜"은 비통합의 음성 대조군이다 (트랜스포존 단독).
[26] 도 3은 예시적인 ZFP-인테그라제 융합 단백질을 도시한다. ZFP 및 인테그라제는 GGS 서열에 의해 연결된다. NLS는 핵 국소화 서열을 지칭한다.
[27] 도 4는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN (AAVS1)), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN), 및 야생형 인테그라제를 가지는 야생형 인테그라제 렌티바이러스 (LV+IN)의 렌티바이러스 적가를 도시한다. ( ' )는 기술적 복제를 나타낸다.
[28] 도 5는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN), 및 야생형 인테그라제를 가지는 야생형 인테그라제 렌티바이러스 (LV+IN)으로 감염 후 게놈 내로의 통합된 (전체 통합) 외인성 핵산 서열의 세포 백분율을 도시한다. 각 조건에 대해, 왼쪽에서부터 오른쪽으로, 제1 컬럼은 제3일을 지칭하고, 제2 컬럼을 제5일, 제3 컬럼은 제7일을, 제4 컬럼은 제10일을, 및 제5 컬럼은 제12일을 지칭한다.
[29] 도 6 은 대표적인 AAVS1 통합 및 비통합 부위를 가지는 염색체의 이미지를 도시한다. 별 기호는 19번 염색체의 AAVS1 부위를 나타내고, 삼각형 기호는 비표적 통합 부위를 의미하고; 다이아몬드 기호는 표적 통합을 의미한다.
[30] 도 7A는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))에 의해 생성된 바이러스 역가를 도시한다.
[31] 도 7B는 야생형 인테그라제 렌티바이러스 (LV), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))감염시킨 후 게놈 내로 외인성 핵산 서열이 통합된 (전체 통합) 세포 백분율을 나타낸다.
[32] 도 7C는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))감염시킨 후 게놈 내로 외인성 핵산 서열이 통합된 세포 백분율을 나타낸다.
[33] 도 7D는 야생형 인테그라제 렌티바이러스 (LV), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))감염시킨 후 게놈 내로 외인성 핵산 서열이 통합된 세포 백분율을 나타낸다.
[34] 도 8A-8C는 렌티바이러스 역가 (도 8A) 및 제3일 및 제14일의 CAR 발현 세포 % (도 8B)를 도시하고, CD3 발현 세포 %가 도 8C에 도시된다. Jurkat 세포는 다음의 여러 조건의 렌티바이러스로 감염시켰다: 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZFP-IN(TRCa-1), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN). NILV는 역가의 급격한 감소를 나타냈고; 바이러스 생산 세포에서 IN WT 또는 융합 ZNF-IN의 발현과의 트랜스보완은 역가나 통합 능력에 대한 구제 효과가 없었다. 또한, 통합이 TCR 유전자좌 (CD3 단백질 발현)를 향해 표적화될 때 세포는 CD3의 발현을 잃지 않았다. 이것은 특히 이 세포주의 맥락에서 VPR 단백질과 같은 트랜스 보완을 위해 추가적인 요인을 사용할 필요가 있음을 나타낸다.
[35] 도 9A-9B는 WT 렌티바이러스 및 두 개의 상이한 인테그라제 결핍 바이러스 시스템 (NILV 및 TAA, 후자는 렌티바이러스 패키징 플라스미드에서 IN-코딩 영역의 시작 부분에 정지 코돈이 도입되었음을 나타냄) 단독 또는 IN 또는 VPR_IN 융합으로 트랜스보완된 시스템에 대한 역가를 나타낸다. 감염 3일 후 형광 유세포 분석에 의해 역가를 검출하였다 (도 9A). 도 9B는 트랜스보완을 위한 IN에 대한 VPR 단백질 융합의 이점을 보여주는 트랜스보완 통합 기계의 상대적 통합 효율을 도시한다. WT: WT IN으로 생성된 렌티바이러스; NILV: 비통합 IN으로 생성된 렌티바이러스 (촉매 중심에 두 개이 돌연변이 보유); TAA: 단백질이 발현되지 않는 IN 결함 IN으로 생성된 렌티바이러스; +IN: IN으로 트랜스보완된 렌티바이러스 ; +VPR-IN: C-말단 단부에서 VPR에 대해 융합된 IN으로 트랜스보완된 렌티바이러스.
[36] 도 10A는 링커에 의해 융합된 DNA 결합 도메인 및 프로그램밍 가능한 DNA 인식 도메인을 가지는 삽입 도메인에 의해 형성된 핵산 작제물의 도식을 나타낸다. 도 10B는 상이한 배열에서 링커에 의해 연결된 Cas9 및 트랜스포사제의 융합을 나타내는 도식이다.
[37] 도 11은 상이한 링커 크기 및 조성을 사용하여 hyPB에 연결된 Cas9에서의 Cas9 활성의 결과를 나타낸다. Cas9 활성은 gRNA 표적 부위를 시퀀싱하고 CRISPR-GA를 사용하여 인델 빈도를 분석하여 측정하였다. AAVS1 부위를 표적으로 하는 2개의 다른 gRNA를 사용하였다. 사용되는 링커는 서열 번호 50 내지 63이다.
[38] 도 12는 프로그래밍 가능한 트랜스포사제 유전재트랩 전위 효율의 결과를 도시한다. RFP 형광을 형질감염 10일 후 유세포 분석으로 측정하였다. 표적화된 삽입에서 링커의 길이 및 조성물 중요성을 결정하기 위해 상이한 링커를 사용하였다. 2개의 독립적인 실험의 평균이다. 사용되는 링커는 서열 번호 50 내지 63이다.
[39] 도 13은 hcas9_PB 링커의 표적화된 전위의 결과를 도시한다. 2개의 서로 다른 gRNA를 사용하여 분할 GFP 세포주를 사용하여 서로 다른 cas9-PB 링커 구성의 표적화된 전위 효율. GFP 발현은 형질감염 72시간 후 유세포 분석에 의해 측정하였다.
[40] 도 14는 개별 돌연변이체의 검증뿐만 아니라 상이한 hyPB 돌연변이의 라이브러리의 고처리량 분석의 스크리닝을 위해 생성된 분할 GFP 리포터 세포주의 계획을 보여준다. 슬리핑 뷰티 100x 시스템을 사용하여 Hek293T 세포의 게놈에 표적 영역 사이트의 다운스트림인 GFP (Ct-GFP) 코딩 서열의 절반이 뒤따르는 스플라이스 수용체 (SA)를 도입하였다. 이러한 스크리닝을 위해 역 말단 반복부 (ITR) 측면에 있는 PiggyBac 트랜스포존은 도면에 도시된 바와 같이 전체 RPF 발현 카세트와 프로모터, 나머지 절반의 GFP (Nt-GFP) 및 절반의 GFP 단편의 스플라이스 공여체 (SD) 중 하나였다.
[41] 도 15는 hcas9_PB 선택된 돌연변이체의 표적화된 전위의 결과를 도시한다. hcas9_PB D450N 및 hcas9_PB R372A K375A D450의 표적화된 전위 효율 GFP 발현은 형질감염 72시간 후 유세포 분석에 의해 측정하였다. 4 개의 독립적인 실험의 평균이다.
[42] 도 16은 hcas9_PB 선택된 돌연변이체의 무작위 및 표적화된 전위의 결과를 도시한다. hcas9_PB D450N 및 hcas9_PB R372A K375A D450의 표적화된 및 무작위 전위 효율 GFP 발현은 형질감염 72시간 후 유세포분석으로 측정하였고, RFP 발현은 형질감염 후 15일째에 유세포분석으로 측정하였고, 형질감염 48시간 후 RFP 형광에 의해 정규화되어 형질감염 효율로 간주하였다.
[43] 도 17는 상이한 배열에서 링커에 의해 연결된 ZFP 및 트랜스포사제의 융합을 나타내는 도식이다.
[44] 도 18은 ZFP-PB 융합 단백질 표적화된 전위의 결과를 도시한다. N 및 C-말단 형태에서 ZFP_hyPB 또는 ZFP_hyPBD450N의 표적화된 전위 효율. GFP 발현은 형질감염 5일 후 유세포 분석에 의해 측정하였다. 1 회 이상 독립적으로 반복하였다. ZFP_PB: XTEN 링커를 사용한 C-말단 구성의 융합 ZFP 및 hyPB; PB_ZFP: XTEN 링커를 사용한 N-말단 구성의 융합 ZFP 및 hyPB, ZFP_450: XTEN 링커를 사용한 C-말단 구성의 융합 ZFP 및 hyPB (D450N); 450_ZFP: XTEN 링커를 사용한 N-말단 구성의 융합 ZFP 및 hyPB (D450N); hyPB: 변형이 없는 hyPB; 1/2 GFP: 대조군 트랜스포존 단독.
[45] 도 19는 PiggyBac 돌연변이 라이브러리의 스크리닝에 사용된 분석 방법의 도식을 나타낸다.
[46] 도 20에서 모든 라이브러리 변이체가 있는 PiggyBac 1116 bp 영역은 Illumina NGS 기술로 시퀀싱하였다. I7 인덱스 프라이머는 변이체 450 및 465를 제외하고 다른 변이체의 전체 시퀀싱을 허용하는 맞춤형 프라이머로 대체하였다.
[47] 도 21A-21B는 hyPB 라이브러리 다양성 생성의 결과를 보여준다. 도 21A는 정렬 플롯의 예이다. 양성 표적 통합 적중 (GFP 형광)은 게이트 P4에서 선택하고 음성 표적 통합 적중 (GFP 형광 없음)은 게이트 P5에서 선택하였다. 비 생존 세포 및 파편은 DAPI 염색이 있는 이전 게이트에서 음성 선택하였다. 도 21B는 이중 플라스미드 형질감염 효율의 결과를 나타낸다. GFP 및 RFP 플라스미드를 ½ GFP 및 gRNA 형질감염과 동일한 날 및 동일한 조건에서 형질감염시켜 형질감염 효율을 측정하였다. Gate P8은 이중 플라스미드 형질감염을 선택한다. 비 생존 세포 및 파편은 DAPI 염색이 있는 이전 게이트에서 음성 선택하였다.
[48] 도 22A-22K는 양성 적중과 음성을 비교한 라이브러리 스크리닝 분석의 결과를 보여준다. 도 22A-22B: 품질 관리로 대량 라이브러리의 시퀀싱이 표시되었으며; 대부분의 변형은 한 번만 나타났다. 벌크 대표적인 Piggyback 라이브러리의 로고는 다음의 아미노산 위치에 해당하는 위치에 나타났다: 1- R245; 2- R275; 3-R277; 4-G325; 5-N347; 6- S351; 7- R372; 8-K375; 9- R388; 10-T560; 11- S564; 12- S573; 13- M589; 14- S592; 15-F594. 또한, 음성 선택된 세포의 로고는 대량 라이브러리와 유사한 패턴으로 나타났다. 도 22C-22K는 양성 적중의 3개의 독립적인 반복; 양성 로고를 호출하는 변이체 (하단)과 선택 후 Top1 변이체 (상단)에 해당한다. 상위 5개 및 상위 10개 변형에 대한 로고도 나타났다. B, C의 왼쪽 패널에서 양성 대 음성 분류 집단에서 Piggyback 변이체의 상대적 농축이 log2 척도로 표시된다.
[49] 도 23A는 독립적 반복 3의 상위 1 및 상위 3 양성 변이체를 보여준다. 오직 위치 254에 1 개의 아미노산 차이가 존재한다. 도 23B는 3개의 독립적인 반복에서 확인된 3개의 top1 변이체를 보여준다. WT hyPB도 참조용으로 표시된다.
[50] 도 24A는 GFP 양성 대 RFP 양성 세포의 과발현된 변이체를 도시한다 GPF의 클러스터링, 표적 삽입; RPF, 무작위 삽입 및 음성 모집단이 도시된다. 도 24B 및 24C에는 1개 이상의 독립적 반복에서 양성 히트 중에서 발견된 변이체가 도시되어 있다. Rep: 독립적인 실험 반복; Pos: 표적화된 통합을 가지는 양성 세포; Neg: 표적화된 통합이 일어나지 않은 음성 세포.
[51] 도 25는 변이체 공변량의 히스토그램을 도시한다. 이것은 양성 샘플에서 다른 변형과 함께 볼 수 있는 변이를 음성 샘플로 나눈 비율을 보여준다. 라이브러리 디자인에 포함된 변이체 외에도 바이러스 라이브러리 생성 동안 렌티바이러스 레트로트랜스크립타제(retrotranscriptase)에 의해 무작위로 도입된 변이체를 분석하였다. 이러한 새로운 변이체 중 일부는 양성 적중과 연관되어 조합에 대해 표적화된 통합을 수행한다. D450N 및 W465A의 예시
[52] 도 26은 변형된 hyPB가 Cas9와 융합될 때 WT hyPB와 비교하여 표적 통합에서 더 큰 증가를 나타내었음을 보여준다. Cas9는 4GGS 링커 및 리포터 세포주 시스템을 사용하여 hyPB 또는 hyPB의 상이한 돌연변이체 조합 (Unilarge-A: D450N; Unilarge-B: R245A/D450N; Unilarge-C: R245A/G325A/D450N/S573P; Unilarge-D: R245A/G325A/S573P)으로 융합시켰다.
[53] 도 27은 인테그라제 결핍 트랜스 보완의 결과를 도시한다. 2일째에 측정된 바이러스 생산 효율과 7일째에 측정된 통합 능력을 Hek293T 세포의 다양한 시스템에 대해 평가하였다. 웨스턴 블롯은 바이러스 입자에서 IN 트랜스의 존재를 보여주었다. 통합 결핍 바이러스와 트랜스보완된 바이러스의 다른 조건을 Hek293T에 감염시켜 바이러스 생산 효율성과 통합 능력을 평가하였다. 세포는 에피솜 신호가 검출되지 않을 때까지 7일 동안 통과하였고 GFP 신호는 2일, 5일 및 7일에 유세포 분석에 의해 분석하였다. NILV는 생산 시 WT에 대해 폐쇄되므로 시스템마다 다른 생산 효율성이 감지될 수 있다. 모든 경우에 WT-HIV_IN으로 보완 보완을 수행했을 때 통합 활동의 명확한 구조가 분명하였다. IN이 트랜스보완 시스템에 로딩되었다는 증거는 웨스턴 블롯으로 수득하였다. WT: WT IN로 생성된 렌티바이러스 ; NILV: 비통합 IN으로 생성된 렌티바이러스 (촉매 중심에 두 개의 돌연변이 보유); TAA: IN 결함 IN으로 생성된 렌티바이러스 (단백질은 IN 코딩 서열의 시작 부분에 정지 코돈이 존재하여 발현되지 않음), TAAx3: IN 결함 IN으로 생성된 렌티바이러스 (단백질은 IN 코딩 서열의 시작 부분에 3개의 연속적인 정지 코돈이 존재하여 발현되지 않음); Delta-IN: IN의 코딩 서열이 제거된 IN 결함 IN으로 생성된 렌티바이러스; Delta-IN_cPPT: IN의 코딩 서열이 중심 폴리피리미딘 트랙 (cPPT) 서열로 치환된 IN 결함 IN으로 생성된 렌티바이러스; +VPR-IN:C-말단 단부에서 VPR에 대해 융합된 IN으로 보완된 렌티바이러스 트랜스.
[24] 도 2A는 Cas9/PB 융합 단백질을 인코딩하는 플라스미드 작제물을 도시한다.
[25] 도 2B는 인간 Cas9-PiggyBac ("표적화된 HCas9") 또는 닉카제 Cas9-PiggyBac ("표적화된 NCas9")으로 형성된 융합 작제물에 의한 게놈 내로 통합된 외인성 핵산 서열을 가지는 세포의 백분율을 도시한다. Cas9의 3' 말단을 링커에 의해 트랜스포사제의 5' 말단에 연결하였다. "비표적화된"은 전체 삽입에 대한 대조군이고 (PiggyBac 단독) "에피솜"은 비통합의 음성 대조군이다 (트랜스포존 단독).
[26] 도 3은 예시적인 ZFP-인테그라제 융합 단백질을 도시한다. ZFP 및 인테그라제는 GGS 서열에 의해 연결된다. NLS는 핵 국소화 서열을 지칭한다.
[27] 도 4는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN (AAVS1)), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN), 및 야생형 인테그라제를 가지는 야생형 인테그라제 렌티바이러스 (LV+IN)의 렌티바이러스 적가를 도시한다. ( ' )는 기술적 복제를 나타낸다.
[28] 도 5는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN), 및 야생형 인테그라제를 가지는 야생형 인테그라제 렌티바이러스 (LV+IN)으로 감염 후 게놈 내로의 통합된 (전체 통합) 외인성 핵산 서열의 세포 백분율을 도시한다. 각 조건에 대해, 왼쪽에서부터 오른쪽으로, 제1 컬럼은 제3일을 지칭하고, 제2 컬럼을 제5일, 제3 컬럼은 제7일을, 제4 컬럼은 제10일을, 및 제5 컬럼은 제12일을 지칭한다.
[29] 도 6 은 대표적인 AAVS1 통합 및 비통합 부위를 가지는 염색체의 이미지를 도시한다. 별 기호는 19번 염색체의 AAVS1 부위를 나타내고, 삼각형 기호는 비표적 통합 부위를 의미하고; 다이아몬드 기호는 표적 통합을 의미한다.
[30] 도 7A는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))에 의해 생성된 바이러스 역가를 도시한다.
[31] 도 7B는 야생형 인테그라제 렌티바이러스 (LV), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))감염시킨 후 게놈 내로 외인성 핵산 서열이 통합된 (전체 통합) 세포 백분율을 나타낸다.
[32] 도 7C는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))감염시킨 후 게놈 내로 외인성 핵산 서열이 통합된 세포 백분율을 나타낸다.
[33] 도 7D는 야생형 인테그라제 렌티바이러스 (LV), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), AAVS1 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), 및 CCR5 부위에 대해 표적화된 ZFP-IN 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(CCR5))감염시킨 후 게놈 내로 외인성 핵산 서열이 통합된 세포 백분율을 나타낸다.
[34] 도 8A-8C는 렌티바이러스 역가 (도 8A) 및 제3일 및 제14일의 CAR 발현 세포 % (도 8B)를 도시하고, CD3 발현 세포 %가 도 8C에 도시된다. Jurkat 세포는 다음의 여러 조건의 렌티바이러스로 감염시켰다: 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZFP-IN(TRCa-1), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN). NILV는 역가의 급격한 감소를 나타냈고; 바이러스 생산 세포에서 IN WT 또는 융합 ZNF-IN의 발현과의 트랜스보완은 역가나 통합 능력에 대한 구제 효과가 없었다. 또한, 통합이 TCR 유전자좌 (CD3 단백질 발현)를 향해 표적화될 때 세포는 CD3의 발현을 잃지 않았다. 이것은 특히 이 세포주의 맥락에서 VPR 단백질과 같은 트랜스 보완을 위해 추가적인 요인을 사용할 필요가 있음을 나타낸다.
[35] 도 9A-9B는 WT 렌티바이러스 및 두 개의 상이한 인테그라제 결핍 바이러스 시스템 (NILV 및 TAA, 후자는 렌티바이러스 패키징 플라스미드에서 IN-코딩 영역의 시작 부분에 정지 코돈이 도입되었음을 나타냄) 단독 또는 IN 또는 VPR_IN 융합으로 트랜스보완된 시스템에 대한 역가를 나타낸다. 감염 3일 후 형광 유세포 분석에 의해 역가를 검출하였다 (도 9A). 도 9B는 트랜스보완을 위한 IN에 대한 VPR 단백질 융합의 이점을 보여주는 트랜스보완 통합 기계의 상대적 통합 효율을 도시한다. WT: WT IN으로 생성된 렌티바이러스; NILV: 비통합 IN으로 생성된 렌티바이러스 (촉매 중심에 두 개이 돌연변이 보유); TAA: 단백질이 발현되지 않는 IN 결함 IN으로 생성된 렌티바이러스; +IN: IN으로 트랜스보완된 렌티바이러스 ; +VPR-IN: C-말단 단부에서 VPR에 대해 융합된 IN으로 트랜스보완된 렌티바이러스.
[36] 도 10A는 링커에 의해 융합된 DNA 결합 도메인 및 프로그램밍 가능한 DNA 인식 도메인을 가지는 삽입 도메인에 의해 형성된 핵산 작제물의 도식을 나타낸다. 도 10B는 상이한 배열에서 링커에 의해 연결된 Cas9 및 트랜스포사제의 융합을 나타내는 도식이다.
[37] 도 11은 상이한 링커 크기 및 조성을 사용하여 hyPB에 연결된 Cas9에서의 Cas9 활성의 결과를 나타낸다. Cas9 활성은 gRNA 표적 부위를 시퀀싱하고 CRISPR-GA를 사용하여 인델 빈도를 분석하여 측정하였다. AAVS1 부위를 표적으로 하는 2개의 다른 gRNA를 사용하였다. 사용되는 링커는 서열 번호 50 내지 63이다.
[38] 도 12는 프로그래밍 가능한 트랜스포사제 유전재트랩 전위 효율의 결과를 도시한다. RFP 형광을 형질감염 10일 후 유세포 분석으로 측정하였다. 표적화된 삽입에서 링커의 길이 및 조성물 중요성을 결정하기 위해 상이한 링커를 사용하였다. 2개의 독립적인 실험의 평균이다. 사용되는 링커는 서열 번호 50 내지 63이다.
[39] 도 13은 hcas9_PB 링커의 표적화된 전위의 결과를 도시한다. 2개의 서로 다른 gRNA를 사용하여 분할 GFP 세포주를 사용하여 서로 다른 cas9-PB 링커 구성의 표적화된 전위 효율. GFP 발현은 형질감염 72시간 후 유세포 분석에 의해 측정하였다.
[40] 도 14는 개별 돌연변이체의 검증뿐만 아니라 상이한 hyPB 돌연변이의 라이브러리의 고처리량 분석의 스크리닝을 위해 생성된 분할 GFP 리포터 세포주의 계획을 보여준다. 슬리핑 뷰티 100x 시스템을 사용하여 Hek293T 세포의 게놈에 표적 영역 사이트의 다운스트림인 GFP (Ct-GFP) 코딩 서열의 절반이 뒤따르는 스플라이스 수용체 (SA)를 도입하였다. 이러한 스크리닝을 위해 역 말단 반복부 (ITR) 측면에 있는 PiggyBac 트랜스포존은 도면에 도시된 바와 같이 전체 RPF 발현 카세트와 프로모터, 나머지 절반의 GFP (Nt-GFP) 및 절반의 GFP 단편의 스플라이스 공여체 (SD) 중 하나였다.
[41] 도 15는 hcas9_PB 선택된 돌연변이체의 표적화된 전위의 결과를 도시한다. hcas9_PB D450N 및 hcas9_PB R372A K375A D450의 표적화된 전위 효율 GFP 발현은 형질감염 72시간 후 유세포 분석에 의해 측정하였다. 4 개의 독립적인 실험의 평균이다.
[42] 도 16은 hcas9_PB 선택된 돌연변이체의 무작위 및 표적화된 전위의 결과를 도시한다. hcas9_PB D450N 및 hcas9_PB R372A K375A D450의 표적화된 및 무작위 전위 효율 GFP 발현은 형질감염 72시간 후 유세포분석으로 측정하였고, RFP 발현은 형질감염 후 15일째에 유세포분석으로 측정하였고, 형질감염 48시간 후 RFP 형광에 의해 정규화되어 형질감염 효율로 간주하였다.
[43] 도 17는 상이한 배열에서 링커에 의해 연결된 ZFP 및 트랜스포사제의 융합을 나타내는 도식이다.
[44] 도 18은 ZFP-PB 융합 단백질 표적화된 전위의 결과를 도시한다. N 및 C-말단 형태에서 ZFP_hyPB 또는 ZFP_hyPBD450N의 표적화된 전위 효율. GFP 발현은 형질감염 5일 후 유세포 분석에 의해 측정하였다. 1 회 이상 독립적으로 반복하였다. ZFP_PB: XTEN 링커를 사용한 C-말단 구성의 융합 ZFP 및 hyPB; PB_ZFP: XTEN 링커를 사용한 N-말단 구성의 융합 ZFP 및 hyPB, ZFP_450: XTEN 링커를 사용한 C-말단 구성의 융합 ZFP 및 hyPB (D450N); 450_ZFP: XTEN 링커를 사용한 N-말단 구성의 융합 ZFP 및 hyPB (D450N); hyPB: 변형이 없는 hyPB; 1/2 GFP: 대조군 트랜스포존 단독.
[45] 도 19는 PiggyBac 돌연변이 라이브러리의 스크리닝에 사용된 분석 방법의 도식을 나타낸다.
[46] 도 20에서 모든 라이브러리 변이체가 있는 PiggyBac 1116 bp 영역은 Illumina NGS 기술로 시퀀싱하였다. I7 인덱스 프라이머는 변이체 450 및 465를 제외하고 다른 변이체의 전체 시퀀싱을 허용하는 맞춤형 프라이머로 대체하였다.
[47] 도 21A-21B는 hyPB 라이브러리 다양성 생성의 결과를 보여준다. 도 21A는 정렬 플롯의 예이다. 양성 표적 통합 적중 (GFP 형광)은 게이트 P4에서 선택하고 음성 표적 통합 적중 (GFP 형광 없음)은 게이트 P5에서 선택하였다. 비 생존 세포 및 파편은 DAPI 염색이 있는 이전 게이트에서 음성 선택하였다. 도 21B는 이중 플라스미드 형질감염 효율의 결과를 나타낸다. GFP 및 RFP 플라스미드를 ½ GFP 및 gRNA 형질감염과 동일한 날 및 동일한 조건에서 형질감염시켜 형질감염 효율을 측정하였다. Gate P8은 이중 플라스미드 형질감염을 선택한다. 비 생존 세포 및 파편은 DAPI 염색이 있는 이전 게이트에서 음성 선택하였다.
[48] 도 22A-22K는 양성 적중과 음성을 비교한 라이브러리 스크리닝 분석의 결과를 보여준다. 도 22A-22B: 품질 관리로 대량 라이브러리의 시퀀싱이 표시되었으며; 대부분의 변형은 한 번만 나타났다. 벌크 대표적인 Piggyback 라이브러리의 로고는 다음의 아미노산 위치에 해당하는 위치에 나타났다: 1- R245; 2- R275; 3-R277; 4-G325; 5-N347; 6- S351; 7- R372; 8-K375; 9- R388; 10-T560; 11- S564; 12- S573; 13- M589; 14- S592; 15-F594. 또한, 음성 선택된 세포의 로고는 대량 라이브러리와 유사한 패턴으로 나타났다. 도 22C-22K는 양성 적중의 3개의 독립적인 반복; 양성 로고를 호출하는 변이체 (하단)과 선택 후 Top1 변이체 (상단)에 해당한다. 상위 5개 및 상위 10개 변형에 대한 로고도 나타났다. B, C의 왼쪽 패널에서 양성 대 음성 분류 집단에서 Piggyback 변이체의 상대적 농축이 log2 척도로 표시된다.
[49] 도 23A는 독립적 반복 3의 상위 1 및 상위 3 양성 변이체를 보여준다. 오직 위치 254에 1 개의 아미노산 차이가 존재한다. 도 23B는 3개의 독립적인 반복에서 확인된 3개의 top1 변이체를 보여준다. WT hyPB도 참조용으로 표시된다.
[50] 도 24A는 GFP 양성 대 RFP 양성 세포의 과발현된 변이체를 도시한다 GPF의 클러스터링, 표적 삽입; RPF, 무작위 삽입 및 음성 모집단이 도시된다. 도 24B 및 24C에는 1개 이상의 독립적 반복에서 양성 히트 중에서 발견된 변이체가 도시되어 있다. Rep: 독립적인 실험 반복; Pos: 표적화된 통합을 가지는 양성 세포; Neg: 표적화된 통합이 일어나지 않은 음성 세포.
[51] 도 25는 변이체 공변량의 히스토그램을 도시한다. 이것은 양성 샘플에서 다른 변형과 함께 볼 수 있는 변이를 음성 샘플로 나눈 비율을 보여준다. 라이브러리 디자인에 포함된 변이체 외에도 바이러스 라이브러리 생성 동안 렌티바이러스 레트로트랜스크립타제(retrotranscriptase)에 의해 무작위로 도입된 변이체를 분석하였다. 이러한 새로운 변이체 중 일부는 양성 적중과 연관되어 조합에 대해 표적화된 통합을 수행한다. D450N 및 W465A의 예시
[52] 도 26은 변형된 hyPB가 Cas9와 융합될 때 WT hyPB와 비교하여 표적 통합에서 더 큰 증가를 나타내었음을 보여준다. Cas9는 4GGS 링커 및 리포터 세포주 시스템을 사용하여 hyPB 또는 hyPB의 상이한 돌연변이체 조합 (Unilarge-A: D450N; Unilarge-B: R245A/D450N; Unilarge-C: R245A/G325A/D450N/S573P; Unilarge-D: R245A/G325A/S573P)으로 융합시켰다.
[53] 도 27은 인테그라제 결핍 트랜스 보완의 결과를 도시한다. 2일째에 측정된 바이러스 생산 효율과 7일째에 측정된 통합 능력을 Hek293T 세포의 다양한 시스템에 대해 평가하였다. 웨스턴 블롯은 바이러스 입자에서 IN 트랜스의 존재를 보여주었다. 통합 결핍 바이러스와 트랜스보완된 바이러스의 다른 조건을 Hek293T에 감염시켜 바이러스 생산 효율성과 통합 능력을 평가하였다. 세포는 에피솜 신호가 검출되지 않을 때까지 7일 동안 통과하였고 GFP 신호는 2일, 5일 및 7일에 유세포 분석에 의해 분석하였다. NILV는 생산 시 WT에 대해 폐쇄되므로 시스템마다 다른 생산 효율성이 감지될 수 있다. 모든 경우에 WT-HIV_IN으로 보완 보완을 수행했을 때 통합 활동의 명확한 구조가 분명하였다. IN이 트랜스보완 시스템에 로딩되었다는 증거는 웨스턴 블롯으로 수득하였다. WT: WT IN로 생성된 렌티바이러스 ; NILV: 비통합 IN으로 생성된 렌티바이러스 (촉매 중심에 두 개의 돌연변이 보유); TAA: IN 결함 IN으로 생성된 렌티바이러스 (단백질은 IN 코딩 서열의 시작 부분에 정지 코돈이 존재하여 발현되지 않음), TAAx3: IN 결함 IN으로 생성된 렌티바이러스 (단백질은 IN 코딩 서열의 시작 부분에 3개의 연속적인 정지 코돈이 존재하여 발현되지 않음); Delta-IN: IN의 코딩 서열이 제거된 IN 결함 IN으로 생성된 렌티바이러스; Delta-IN_cPPT: IN의 코딩 서열이 중심 폴리피리미딘 트랙 (cPPT) 서열로 치환된 IN 결함 IN으로 생성된 렌티바이러스; +VPR-IN:C-말단 단부에서 VPR에 대해 융합된 IN으로 보완된 렌티바이러스 트랜스.
I. 정의
[54] 본 명세서에서 사용 시 단수 형태 (“a”“an”및 “the”는 문맥이 명백하게 나타내지 않는 한 복수의 참조 대상을 포함한다. 이에 따라, 예를 들어, “제제”의 언급은 단일 제제 및 복수의 제제를 포함한다.
[55] 용어 "핵산", "폴리뉴클레오타이드", 및 "올리고뉴클레오타이드"는 호환적으로 사용되며, 선형 또는 원형의, 그리고 단일- 또는 이중-가닥 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 폴리머를 지칭한다. 본 명세서의 목적을 위해, 상기 용어가 폴리머의 길이와 관련하여 제한하려는 것으로 해석되어서는 안된다. 상기 용어는 천연 뉴클레오타이드, 뿐만 아니라 염기, 당 및/또는 포스페이트 모이어티 (예컨대, 포스포로티오에이트 골격)에서 변형된 뉴클레오타이드의 공지된 유사체를 포함할 수 있다. 일반적으로, 특정 뉴클레오타이드의 유사체는 동일한 염기-쌍 특이성을 가지며; 즉, A의 유사체는 T와 염기-쌍을 이루게 될 것이다.
[56] 용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 아미노산 잔기의 폴리머를 지칭하도록 호환적으로 사용된다. 또한 용어는 하나 이상의 아미노산이 화학적 유사체인 또는 상응하는 자연-발생 아미노산의 변형된 유도체인 아미노산 폴리머에도 적용된다.
[57] 용어 "결합 단백질"은 본 명세서에서 사용 시 또 다른 분자에 비공유적으로 결합할 수 있는 단백질을 지칭한다. 결합 단백질은, 예를 들어, DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질 결합 단백질의 경우에, 그 자체에 결합할 수 있고 (동종이합체, 동종 삼합체, 동종사합체, 등을 형성) 및/또는 상이한 단백질 또는 단백질의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 하나 이상의 유형의 결합 활성을 가질 수 있다. 예를 들어, 아연 집게 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 가진다.
[58] 용어 "아연 집게 단백질(zinc finger protein)"은 본 명세서에서 사용 시 하나 이상의 아연 집게를 통해 서열-특이적 방식으로 DNA에 결합하는 단백질, 또는 큰 단백질 내의 도메인이며, 이는 아연 집게 단백질의 결합 도메인 내의 아미노산 서열 영역이며, 이의 구조는 아연 이온의 배위를 통해 안정화된다. 용어 아연 집게 단백질은 종종 ZFP로 약칭된다.
[59] 용어 “아연-집게 뉴클레아제”는 아연 집게 DNA-결합 도메인을 DNA-절단 도메인에 융합하여 생성된 인공 제한 효소를 지칭한다. 아연 집게 도메인은 특정 원하는 DNA 서열을 표적화하도록 조작될 수 있으며 이를 통해 아연-집게 뉴클레아제가 복잡한 게놈 내의 고유한 서열을 표적을 표적화할 수 있다. 아연 집게 뉴클레아제는 종종 ZFN 또는 ZNP으로 약칭된다.
[60] 용어 "핵산 서열” 또는 “폴리뉴클레오타이드 서열” 또는 “유전자 서열"은 본 명세서에서 사용 시 DNA 또는 RNA일 수 있고; 선형, 원형 또는 분지형일 수 있으며 단일-가닥 또는 이중-가닥일 수 있는 임의의 길이의 뉴클레오타이드 서열을 지칭한다.
[61] 용어 "아미노산 서열" 또는 "폴리펩타이드" 또는 "단백질"은 본 명세서에서 사용 시 아미노산 잔기의 중합체를 지칭한다. 명시되지 않는 한, 아미노산 잔기의 중합체는 임의의 길이일 수 있다.
[62] 용어 "외인성(exogenous)"은 본 명세서에서 사용 시 정상적으로 세포에 존재하지 않지만, 하나 또는 그 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 내부로 도입될 수 있는 분자를 지칭한다. 세포 내 정상적인 존재는 세포의 특정 발생 단계 및 환경 조건과 관련하여 결정된다. 이에 따라, 예를 들어, 근육 세포의 배아 발생기 동안에만 존재하는 분자는 성체 근육 세포에 대한 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 비-열-충격 세포와 관련하여 외인성 분자이다. 외인성 분자는, 예를 들어, 기능부전 내인성 분자의 기능적 형태(version) 또는 정상적으로 기능하는 내인성 분자의 기능부전 형태를 포함할 수 있다.
[63] 대조적으로, "내인성(endogenous)" 분자는 특정 환경 조건 하에서 특정 발생 단계에 있는 특정 세포에 정상적으로 존재하는 분자이다. 예를 들어, 내인성 핵산은 염색체, 미토콘드리아, 클로로플라스트 또는 다른 소기관의 유전체, 또는 자연 발생 에피솜 핵산을 포함할 수 있다. 추가적인 내인성 분자는 단백질, 예를 들면, 전사 인자 및 효소를 포함할 수 있다.
[64] "표적 부위" 또는 "표적 서열"은 결합을 위한 충반한 조건이 존재하는 경우 결합 분자가 결합할 핵산 또는 폴리펩타이드의 일부를 정의하는 서열이다. 예를 들어, 서열 5'-GAATTC-3'는 EcoRI 제한 엔도뉴클레아제의 표적 부위이다.
[65] 용어 "융합"은 본 명세서에서 사용 시 둘 또는 그 이상의 아단위 분자들이 연결, 바람직하게는 공유적으로 연결되어 있는 분자이다. 아단위 분자는 동일한 화학적 유형의 분자일 수 있거나, 상이한 화학적 유형의 분자일 수 있다.
[66] 용어 “융합 단백질”은 본 명세서에서 사용 시 적어도 두 개의 상이한 단백질로부터의 단백질 도메인을 포함하는 하이브리드 폴리펩타이드를 지칭한다. 하나의 단백질은 융합 단백질의 아미노-말단 (N-말단) 부분 또는 카복시-말단 (C-말단) 단백질에 위치하여, 각각 “아미노-말단 융합 단백질” 또는 “카복시-말단 융합 단백질”을 형성할 수 있다.
[67] 용어 "유전자" 또는 "게놈"은 본 명세서에서 사용 시 유전자 생성물을 인코딩하는 DNA 영역, 뿐만 아니라 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지 여부와 관계없이 유전자 생성물의 생성을 조절하는 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 터미네이터, 번역 조절 서열, 가령, 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 슬라이서, 절연체, 경계 요소, 복제 원점, 기질 부착 부위 및 좌위 제어 영역을 포함하지만, 이에 제한되지 않는다.
[68] 용어 “진핵” 세포는 진균 세포 (예컨대, 효모), 식물 세포, 동물 세포, 포유동물 세포 및 사람 세포 (예를 들어, T-세포)를 포함하지만 이에 제한되지 않는다.
[69] 용어 "연결된"은 둘 이상의 구성 요소 (예컨대, 서열 요소)의 병치를 지칭하며, 이러한 구성 요소는 두 가지 구성 요소가 정상적으로 기능하고 구성 요소 중 최소한 하나가 다른 구성 요소 중 최소한 하나에 대해 발휘되는 기능을 매개할 수 있도록 배열된다.
[70] 단백질, 폴리펩타이드 또는 핵산의 "기능적 단편"은, 각각, 서열이 전장 단백질, 폴리펩타이드 또는 핵산과 동일하지 않지만, 전장 단백질, 폴리펩타이드 또는 핵산과 동일한 기능을 유지하는 단백질, 폴리펩타이드 또는 핵산이다. 기능적 단편은 상응하는 본래의 분자와 동일한, 더 많은 또는 더 적은 수의 잔기를 보유할 수 있고, 및/또는 하나 이상의 아미노산 또는 뉴클레오타이드 치환을 포함할 수 있다.
[71] 용어 "형질감염"은 본 명세서에서 사용 시 핵산 (DNA 또는 RNA)를 진핵 또는 원핵 세포 또는 유기체 내로 도입하는 것을 지칭한다.
[72] 용어 "절단"은 본 명세서에서 사용 시 DNA 분자의 공유 골격의 파손을 지칭한다. 절단은 포스포다이에스터 결합(phosphodiester bond)의 효소적 또는 화학적 가수분해를 포함하지만 이에 제한되지 않는 다양한 방법에 의해 개시될 수 있다. 단일-가닥 절단 및 이중-가닥 절단 둘 모두가 가능하며, 이중-가닥 절단은 두 가지 별개의 단일-가닥 절단 사건의 결과로 발생할 수 있다. DNA 절단으로 인해 평활 말단(blunt end)이나 엇갈린 말단(staggered end)이 생성될 수 있다. 특정 구현예에서, 융합 폴리펩타이드는 표적화된 이중-가닥 DNA 절단에 대해 사용된다.
[73] 용어 "인테그라제(integrase)"는 본 명세서에서 사용 시 게놈 물질을 감염된 세포의 DNA, 예를 들어, 게놈 DNA 내로 통합될 수 있게 하는 바이러스에 의해 생성된 효소를 지칭한다.
[74] 용어 "특이성"은 본 명세서에서 사용 시 선택된 서열에 대해 서열 동일성 정도를 공유하는 서열에 선택적으로 결합하는 능력을 지칭한다.
[75] 용어 "삽입", 및 "통합"은 본 명세서에서 사용 시 핵산 서열을 제2 핵산 서열 또는 게놈에 첨가하는 것을 지칭한다.
[76] 본 명세서에서 삽입 또는 통합과 관련하여, 용어 “특이적”, “부위-특이적”, “표적화된” 및 “표적 적중된(on-targeted)”은 제2 핵산 또는 게놈의 특정 부위에 핵산을 삽입하는 것을 지칭하도록 호환적으로 사용된다. 용어 “무작위”, “비표적화된” 및 “표적 외(off-targeted)”는 비특이적이고 의도되지 않은 유전자 삽입을 지칭한다. 용어 “총” 또는 “전체”는 삽입의 전체 수를 지칭한다.
[77] 용어 "돌연변이", 본 명세서에서 사용 시 서열, 예를 들어, 핵산 또는 아미노산 서열 내의 잔기의, 또 다른 잔기로의 치환, 또는 서열 내의 하나 이상의 잔기의 결실 또는 삽입을 지칭한다. 돌연변이는 일반적으로 서열 내의 잔기의 위치에 이어지는 본래의 잔기를 확인함으로써 및 서열 내 새롭게 치환된 잔기의 확인에 의해 본 명세서에 기술된다. 본 명세서에 제공된 아미노산 치환 (돌연변이)를 제공하기 위한 다양한 방법은 기술 분야 내에 잘 알려져있으며, 예를 들어, 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))]를 참조한다.
[78] 용어 "트랜스포사제"는 본 명세서에서 사용 시 트랜스포존의 말단에 결합하고 절단 및 페이스트 메커니즘 또는 복제적 전위 메커니즘에 의해 게놈의 또 다른 부분으로의 이동을 촉매하는 효소를 지칭한다.
[79] 용어 "변형된"은 본 명세서에서 사용 시 상응하는 변형되지 않은 단백질 또는 핵산 서열과 상이한 단백질 또는 핵산 서열을 지칭한다.
[80] 용어 "링커"는 본 명세서에서 사용 시 두 인접한 분자 또는 모이어티를 연결하는 화학적 그룹 또는 분자를 지칭한다.
[81] 용어 "벡터" 및 "플라스미드"는 본 명세서에서 사용 시, 예를 들어, 관심의 제2 폴리뉴클레오타이드를 보유할 수 있고, 예를 들어, 유전자 서열을 표적 세포로 전달할 수 있는 임의의 폴리뉴클레오타이드를 지칭한다. 이에 따라, 이러한 용어는 클로닝, 및 발현 운반체, 뿐만 아니라 통합 벡터를 포함한다. 구체적으로, 용어 "발현 벡터"는 본 명세서에서 사용 시 핵산의 발현을 지시할 수 있는 임의의 폴리뉴클레오타이드를 지칭한다. 일부 양태에서, 용어 "벡터" 및 "플라스미드"는 용어 "핵산 작제물"과 호환적으로 사용된다.
[82] 용어 "동일성 백분율"은 본 명세서에서 사용 시 핵산 서열 또는 아미노산 서열이든, 두 서열의 동일성 백분율을 나타내며, 정렬된 두 서열 간의 일치 정합수(exact match)를 더 짧은 서열의 길이로 나누고 100을 곱한 것이다.
[83] 용어 "재조합" 또는 "조작"은 본 명세서에서 사용 시 인공적으로 생성된 단백질 또는 핵산 서열을 지칭한다.
[84] 용어 “대상체”는 본 명세서에서 사용 시 개별 유기체, 예를 들어, 개별 포유동물을 지칭한다. 일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 대상체는 비-인간 포유동물이다. 일부 구현예에서, 대상체는 비-인간 영장류이다. 일부 구현예에서, 대상체는 설치류이다. 일부 구현예에서, 대상체는 양, 염소, 소, 고양이 또는 개이다. 일부 구현예에서, 대상체는 척추동물, 양서류, 파충류, 어류, 곤충, 파리, 또는 선충이다. 일부 구현예에서, 대상체는 연구 동물이다.
[85] 용어 “치료”, “치료하다”, 및 “치료하는”은 본 명세서에 기재된바와 같이 질병 또는 장애, 또는 이의 하나 이상의 증상의 개시를 역전, 완화, 지연시키거나, 또는 진행을 억제하기 위한 임상적 개입을 지칭한다. 본 명세서에서 사용 시 용어 “치료”, “치료하다”, 및 “치료하는”은 본 명세서에 기재된바와 같이 질병 또는 장애, 또는 이의 하나 이상의 증상의 개시를 역전, 완화, 지연시키거나, 또는 진행을 억제하기 위한 임상적 개입을 지칭한다. 일부 구현예에서, 치료는 하나 이상의 증상이 발생한 후 및/또는 질병이 진단된 후에 투여될 수 있다. 다른 구현예에서, 치료는, 예를 들어, 예방, 발병 가능성 감소, 또는 증상 발병 지연, 발병 또는 질병 진행 억제 등을 위해, 증상의 부재 하에 투여될 수 있다. 예를 들어, 치료는 증상이 개시되기 전 (예를 들어, 증상의 병력에 비추어 및/또는 유전적 또는 다른 감수성 요인에 비추어) 감수성이 있는 개체에게 투여될 수 있다. 치료는, 예를 들어, 증상의 재발을 예방하거나 지연시키기 위해, 증상이 해결된 후에도 지속될 수 있다.
II. 핵산 작제물
[86] 핵산 서열 표적화된 편집, 예를 들어, 게놈 DNA 내로 특이적 변형의 도입 (예를 들어, 외인성 핵산의 삽입)은 인간의 유전 질병을 치료하기 위한 유망한 접근법이다. 이를 위해, 본 발명자들은 원하는 변형을 설치하는데 매우 효율적인 게놈 편집에 사용하기 위한 개선된 핵산 작제물; 최소한의 표적 외 활성; 및 인간 게놈 내의 특정 부위를 정확하게 편집하도록 프로그래밍되는 능력을 제공하는 것을 목표로 한다.
[87] 본 발명의 특정 양태는 게놈 내로 외인성 핵산, 예를 들어, 관심 유전자 (GOI)의 의 부위-특이적 삽입을 개선하는데 사용하기 위한 핵산 작제물에 관한 것이다. 일부 구현예에서, GOI는 치료적 유전자, 예를 들어, 치료적 단백질을 인코딩하는 유전자이다. 관심의 치료적 유전자의 예로는 낭포성 섬유증 질병을 치료하기 위한 CFTR 유전자 (낭포성 섬유증 막횡단 전도도 조절자); 척수성 근위축증 (SMA)을 치료하기 위한 SMN1 유전자 (생존 운동 뉴런 1); 골다공증 및 골절을 예방하기 위한 LRP5 유전자 (LDL 수용체 관련 단백질 5) 변이체 G171V; 및 알츠하이머 소인을 감소시키기 위한 APP 유전자 (아밀로이드 베타 전구체 단백질) 변이체 A673T를 포함한다.
[88] 일부 구현예에서, 삽입을 위한 외인성 핵산 (예를 들어, GOI)는 최대 약 10 kb, 최대 약 15 kb, 최대 약 20kb의 길이, 최대 약 25kb의 길이, 최대 약 30kb의 길이, 최대 약 35kb의 길이, 또는 최대 약 40kb의 길이일 수 있다.
[89] 일부 구현예에서, 외인성 핵산을 게놈 내로 삽입할 수 있는 DNA 결합 단백질을 인코딩하는 폴리뉴클레오타이드 서열은 인테그라제 또는 야생형 인테그라제에 대해 변형된 인테그라제를 포함하며, 삽입을 위한 외인성 핵산은 최대 10 kb, 최대 15 kb, 또는 최대 20kb의 길이, 예를 들어, 약 1 kb 내지 약 20 kb, 약 1 kb 내지 약 19 kb, 약 1 내지 약 18 kb, 약 1 kb 내지 약 17 kb, 약 1 kb 내지 약 16 kb, 또는 약 1 kb 내지 약 15 kb의 길이일 수 있다.
[90] 일부 구현예에서, 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 폴리뉴클레오타이드 서열은 트랜스포사제 또는 야생형 트랜스포사제에 대해 변형된 트랜스포사제를 포함하며, 삽입을 위한 외인성 핵산은 최대 10 kb, 최대 15 kb, 최대 20kb의 길이, 최대 25kb의 길이, 최대 30kb의 길이, 최대 35kb의 길이, 또는 최대 40kb의 길이, 예를 들어, 약 1 kb 내지 약 40 kb, 약 1 kb 내지 약 39 kb, 약 1 내지 약 38 kb, 약 1 kb 내지 약 37 kb, 약 1 kb 내지 약 36 kb, 또는 약 1 kb 내지 약 35 kb의 길이일 수 있다.
[91] 일부 구현예에서, 핵산 작제물은 제1 DNA 결합 단백질을 인코딩하는 폴리뉴클레오타이드 서열, 예를 들어, 유전자 편집 폴리펩타이드, 및 제2 DNA 결합 단백질을 인코딩하는 폴리뉴클레오타이드 서열, 예를 들어, 인테그라제 또는 트랜스포사제를 포함하며, 여기서 핵산 작제물은 융합 단백질로서 제1 및 제2 결합 단백질을 인코딩한다. 일부 구현예에서, 핵산 작제물은 제1 및 제2 결합 단백질 사이의 링커를 인코딩하는 핵산 서열을 추가적으로 포함한다. 일부 구현예에서, 핵산 작제물은 게놈 내로 외인성 핵산의 부위 특이적 삽입을 가능하게 하는 및/또는 촉진하는 융합 단백질을 인코딩한다. 일부 구현예에서, 제1 또는 제2 결합 단백질은 야생형에 대해 변형된 인테그라제이다. 일부 구현예에서, 제1 또는 제2 결합 단백질은 야생형에 대해 변형된 트랜스포사제이다. 일부 구현예는 본 발명의 핵산 작제물을 포함하는 벡터 또는 플라스미드에 관한 것이다. 특정 양태에서, 본 발명의 핵산 작제물은 게놈 내로 핵산, 예를 들어, GOI의 삽입의 특이성을 개선하는 융합 단백질을 인코딩한다. 일부 구현예에서, 융합 단백질 및 외인성 핵산은 렌티바이러스 입자를 사용하여 세포에 전달된다.
[92] 일부 구현예에서, 제1 및 제2 결합 단백질은 별개의 핵산 작제물 상에 있고, 예를 들어, 트랜스포사제 또는 인테그라제 (예를 들어, 야생형에 대해 변형된 트랜스포사제 및/또는 인테그라제)는 Cas9 또는 ZFP로부터 별개의 핵산 작제물 상에 있다.
[93] 특정 양태는 본 명세서에 개시된 핵산 작제물을 포함하는 플라스미드 또는 벡터에 관한 것이다. 일부 구현예에서, 핵산 작제물을 포함하는 플라스미드는 패키징 플라스미드(packaging plasmid)이다. 일부 구현예에서, 핵산 작제물을 포함하는 플라스미드는 캡시드(capsid) 단백질, 예를 들어, gag 및 pol을 인코딩하는 폴리뉴클레오타이드를 추가적으로 포함한다. 일부 구현예에서, (i) 핵산 작제물을 포함하는 플라스미드는 (ii) 바이러스 외피에 대한 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 플라스미드 (외피 플라스미드); 및 (iii) 외인성 핵산 서열 (예를 들어, GOI)를 포함하는 플라스미드와 함께 조합되며, 여기서 조합물이 제조 세포주 (예를 들어, 진핵 세포, 원핵 세포 및/또는 세포주) 내로 도입되는 경우, 외인성 핵산, 예를 들어, GOI를 포함하는 바이러스 입자, 및 제1 및 제2 결합 단백질을 포함하는 융합 단백질이 생성된다.
[94] 일부 구현예에서, (i) 핵산 작제물을 포함하는 플라스미드는 (ii) 핵산 작제물을 포함하는 플라스미드로서, 캡시드 단백질, 예를 들어, gag 및 pol를 인코딩하는 폴리뉴클레오타이드를 추가적으로 포함하는 플라스미드 (패키징 플라스미드, 여기서 패키징 플라스미드는 기능적 인테그라제를 가지지 않음); (iii) 바이러스 외피에 대한 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 플라스미드 (외피 플라스미드) 및 (iv) 외인성 핵산 서열 (예를 들어, GOI)을 포함하는 플라스미드와 조합되며, 여기서 조합물이 제조 세포주 (예를 들어, 진핵 세포, 원핵 세포 및/또는 세포주) 내로 도입되는 경우, 외인성 핵산, 예를 들어, GOI를 포함하는 바이러스 입자, 및 제1 및 제2 결합 단백질을 포함하는 융합 단백질이 생성된다.
[95] 핵산 작제물은 특이적 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 제1 폴리뉴클레오타이드 서열, 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 제2 폴리뉴클레오타이드 서열로서, 여기서 제2 DNA 결합 단백질은 인테그라제 또는 트랜스포사제 (예를 들어, 야생형에 대해 변형된 트랜스포사제 및/또는 인테그라제)인 서열, 및 제1 및 제2 폴리뉴클레오타이드 사이의 링커를 인코딩하는 핵산 서열을 포함하는 제3 폴리뉴클레오타이드 서열을 포함한다. 일부 구현예에서, 제1 DNA 결합 단백질은 아연 집게 단백질 또는 Cas 9 단백질이다.
[96] 일부 구현예에서, 핵산 작제물은 (GGS)n, (GGGGS)n (SEQ ID NO133), (G)n, (EAAAK)n (SEQ ID NO134), XTEN-기반 링커, 또는 (XP)n 모티프, 또는 상기 임의의 조합으로 구성된 군으로부터 선택된 링커를 포함하며, 여기서 n은 독립적으로 1 내지 50의 정수이다. 일부 구현예에서 핵산은 XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩한다. 일부 구현예에서, 링커 핵산 서열은 3 내지 150 개의 뉴클레오타이드 길이이다. 일부 구현예에서, 링커는 12 내지 24 개의 아미노산, 또는 36 내지 72 개의 핵산 길이이다. 일부 구현예에서, 핵산 작제물은 6 내지 120, 6 내지 90, 6 내지 78, 6 내지 72, 9 내지 120, 9 내지 90, 9 내지 78, 9 내지 72, 12 내지 120, 12 내지 90, 12 내지 78, 12 내지 72, 15 내지 120, 15 내지 90, 15 내지 78, 15 내지 72, 18 내지 120, 18 내지 90, 18 내지 78, 18 내지 72, 21 내지 120, 21 내지 90, 21 내지 78, 21 내지 72, 24 내지 120, 24 내지 90, 24 내지 78, 24 내지 72, 27 내지 120, 27 내지 90, 27 내지 78, 27 내지 72, 30 내지 120, 30 내지 90, 30 내지 78, 30 내지 72, 33 내지 120, 33 내지 90, 33 내지 78, 33 내지 72, 36 내지 120, 36 내지 90, 36 내지 78, 또는 36 내지 72 개의 뉴클레오타이드 길이인 링커 핵산 서열을 포함한다. 일부 구현예에서, 링커를 인코딩하는 핵산은 9 내지 150 개의 핵산 길이이다. 일부 구현예에서, 아연 집게 단백질은 GGS 서열을 포함하는 링커와 함께 본 발명의 변형된 인테그라제에 부착될 수 있다. 일부 구현예에서, 링커는 1 내지 50 개의 아미노산 길이이다. 일부 구현예에서, 링커는 3 내지 40, 3 내지 30, 3 내지 29, 3 내지 24, 4 내지 40, 4 내지 30, 4 내지 29, 4 내지 24, 5 내지 40, 5 내지 30, 5 내지 29, 5 내지 24, 6 내지 40, 6 내지 30, 6 내지 29, 6 내지 24, 7 내지 40, 7 내지 30, 7 내지 29, 7 내지 24, 8 내지 40, 8 내지 30, 8 내지 29, 8 내지 24, 9 내지 40, 9 내지 30, 9 내지 29, 9 내지 24, 10 내지 40, 10 내지 30, 10 내지 29, 10 내지 24, 11 내지 40, 11 내지 30, 11 내지 29, 11 내지 24, 12 내지 40, 12 내지 30, 12 내지 29, 또는 12 내지 24 개의 아미노산 길이이다.
[97] 일부 구현예에서 제1 폴리뉴클레오타이드 서열의 3' 말단은 링커를 인코딩하는 핵산에 의해 제2 폴리뉴클레오타이드 서열의 5' 말단에 연결된다. 일부 구현예에서 제1 폴리뉴클레오타이드 서열의 5' 말단은 링커를 인코딩하는 핵산에 의해 제2 폴리뉴클레오타이드 서열의 3' 말단에 연결된다. 일부 구현예에서 Cas 9 단백질의 3' 말단은 링커에 의해 트랜스포사제의 5' 말단에 연결된다. 일부 구현예에서 Cas 9 단백질의 5' 말단은 링커에 의해 트랜스포사제의 3' 말단에 연결된다. 일부 구현예에서 3' 아연 집게 단백질은 링커에 의해 인테그라제의 5' 말단에 연결된다. 일부 구현예에서 5' 아연 집게 단백질은 링커에 의해 인테그라제의 3' 말단에 연결된다.
[98] 일부 구현예에서, 변형된 인테그라제 또는 변형된 트랜스포사제는 Cas9 또는 ZFP로부터의 별개의 플라스미드로부터 발현되었기 때문에 링커가 요구되지 않는다.
[99] 본 발명의 특정 양태는 숙주 세포, 예를 들어, 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 본 발명의 핵산 작제물을 포함하는 벡터 또는 플라스미드 (예를 들어, 발현 벡터 또는 패키징 벡터)에 관한 것이다.
[100] 일부 구현예에서, 핵산 작제물은 (a) 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제1 폴리뉴클레오타이드 서열로서; 여기서 제1 DNA 결합 단백질은 아연 집게 단백질 또는 Cas9 단백질인 것인 서열; (b) 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제2 폴리뉴클레오타이드 서열로서, 여기서 제2 DNA 결합 단백질은 (i) 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac, 또는 (ii) 인간 면역결핍 바이러스 (HIV) 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제인 것인 서열; 및 (c) 링커를 인코딩하는 핵산을 포함하는 선택적인 폴리뉴클레오타이드 서열을 포함하고; 여기서 핵산 작제물은 제1 DNA 결합 단백질, 제2 DNA 결합 단백질, 및 제1 DNA 결합 단백질과 제2 DNA 결합 단백질 사이의 선택적인 링커를 포함하는 융합 단백질을 인코딩하고; 융합 단백질은 외인성 핵산을 게놈의 특정 부위 내로 삽입할 수 있다.
[101] 구현예에서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고; (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 트랜스포사제 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac 트랜스포사제이다.
[102] 또 다른 구현예에서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고; (b) 제2 DNA 결합 단백질은 HIV 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제이다.
[103] 일부 구현예에서, Cas9 단백질은 본 명세서에 기재된 것이며, 구체적으로 인간 Cas9, 닉카제 Cas9 및 멸실(dead) Cas 9로 구성된 군으로부터 선택되며, 더욱 구체적으로 인간 Cas9 또는 닉카제 Cas9이다.
[104] 하나의 구현예에서, dCas9가 사용되는 경우, 제2 DNA 결합 단백질은 Gin, Hin 또는 Tn3 리콤비나제(recombinase) 촉매 도메인 또는 FokI DNA 절단 도메인이 아니다. 이러한 리콤비나제 및 FoKI는 통합할 수 있는 공지된 부위 (게놈의 수용체 서열)을 필요로 하며; 따라서 표적화 부위의 가능성은 훨씬 더 제한적이고; 또한 기능적이기 위해 예를 들어 Gin의 이합체의 형성을 필요로 한다.
[105] 또 다른 구현예에서, 아연 집게 단백질은 본 명세서에 기재된 것이며, 구체적으로 6 개의 결합 도메인을 포함하는 C2H2 아연 집게 단백질이다.
[106] 또 다른 구현예에서, 링커는 본 명세서에 기재된 것이며, 구체적으로 링커는 XTEN 서열 (예를 들어으로서, 서열 번호 61으로서, 서열 번호 60에 의해 인코딩됨) 또는 GGS 서열, 더욱 구체적으로 GGSx3 (서열 번호 49으로서, SEQ ID NO48에 의해 인코딩됨), GGSx4 (서열 번호 51으로서, 서열 번호 50에 의해 인코딩됨), GGSx5 (서열 번호 53으로서, 서열 번호 52에 의해 인코딩됨), GGSx6 (서열 번호 55으로서, 서열 번호 54에 의해 인코딩됨), GGSx7 (서열 번호 57으로서, 서열 번호 56에 의해 인코딩됨) 또는 GGSx8 (서열 번호 59으로서, 서열 번호 58에 의해 인코딩됨)을 포함한다.
[107] 또 다른 구현예에서, 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결된다.
[108] 일부 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 본 명세서에 기재된 것이다. 다른 구현예에서, 변형된 HIV 인테그라제는 본 명세서에 기재된 것이다.
[109] 다른 구현예에서, 링커는 사용되지 않는다. 대신에, 예를 들어, 제1 및/또는 제2 폴리뉴클레오타이드 서열은 제1 및 제2 DNA 결합 단백질을 인코딩하는 핵산을 포함하며, 링커의 기능을 이루는 적어도 하나의 말단에 추가적인 핵산을 추가적으로 포함한다.
[110] 구현예에서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac이고, 여기서 핵산 작제물은 (c) XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩하는 핵산을 포함하는 폴리뉴클레오타이드 서열을 포함하고, 여기서 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결된다.
[111] 하나의 구현예에서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 변형된 과활성 PiggyBac이되, 단 Cas9가 비활성 Cas9 (dcas9)인 경우 링커는 KLAGGAPAVGGGPK (서열 번호 130)이 아니다.
[112] 하나의 구현예에서, a) 제1 DNA 결합 단백질은 아연 집게 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 변형된 과활성 PiggyBac이며, 여기서 아연 집게 단백질은 다중 인식 부위를 인식할 수 있는데, 이는 본 명세서에 설명된 바와 같이 아연 집게 단백질의 결합 도메인이 선택된 서열에 결합하도록 조작될 수 있기 때문이다.
[113] 하나의 구현예에서, a) 제1 DNA 결합 단백질은 아연 집게 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 변형된 과활성 PiggyBac이고, 링커는 XTEN이다.
[114] 하나의 구현예에서, (a) 제1 DNA 결합 단백질은 아연 집게 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 변형된 과활성 PiggyBac이고, 여기서 아연 결합 단백질은 Gal4 DNA 결합 도메인을 가지지 않는다. Gal4는 CGG-N11-CCG에 결합하며, 여기서 N은 임의의 염기일 수 있다. 상기 단백질은 갈락토스를 글루코스로 전환하는데 사용되는 효소를 코딩하는 갈락토스-유도 유전자 예컨대 GAL1, GAL2, GAL7, GAL10, 및 MEL1의 유전자 발현에 대한 양성 조절자이다. 이는 상기 유전자의 (5'-CGGRNNRCYNYNCNCCG-3') (서열 번호 135) 업스트립 활성화 서열 (UAS-G)에서 17 개의 염기쌍 서열을 인식한다. 따라서, Gal4는 짧고 게놈에서 매우 빈번한 서열을 인식하여, 부위 특이적이지 않다. 구체적인 구현예에서, 아연 결합 단백질은 부위-특이적이도록 조작된 Gal4 DNA 결합 도메인을 가진다.
[115] 하나의 구현예에서, (a) 제1 DNA 결합 단백질은 아연 집게 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 변형된 과활성 PiggyBac 트랜스포사제이되, 단 링커는 EFGGGGSGGGGSGGGGSQF (서열 번호 131)가 아니다.
[116] 또 다른 구현예에서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고 (b) 제2 DNA 결합 단백질은 HIV 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제이고, 여기서 핵산 작제물은 (c) XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩하는 핵산을 포함하는 폴리뉴클레오타이드 서열을 포함하고, 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결된다.
[117] 일부 구현예에서, 핵산 작제물은 DNA 또는 RNA 형태이다.
[118] 또한 본 명세서에 제공된 임의의 핵산 작제물을 포함하는 벡터가 본 명세서에 제공된다. 구체적으로, 벡터는 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합하다. 또한 본 명세서에 제공된 임의의 핵산 작제물 또는 벡터를 포함하는 숙주 세포가 본 명세서에 제공된다.
III. 인테그라제 및 변형된 인테그라제
[119] 인테그라제는 바이러스 게놈을 숙주 세포 내로 안정적으로 통합하기 위한 핵심 효소이지만, 야생형 인테그라제에 의한 통합 부위를 예측할 수 없음에 따라 인테그라제는 삽입 돌연변이 유발 (insertional mutagenesis)과도 관련이 있다. 통합은 고도로 전사된 유전자에 대해 바람직한 것으로 나타났으며, 이는 중요한 유전자 및 조절인자의 돌연변이 위험을 증가시킨다. 일반적으로, HIV-1 인테그라제는 N-말단-도메인 (NTD), 촉매 코어- (CCD) 및 C-말단-도메인 (CTD)으로 구성된다. NTD는 중요한 보조 인자로서 Zn2+ 양이온에 결합하고 배위하는데 사용되는 반면, CTD는 DNA 결합에 사용된다. CCD-도메인은 촉매 코어를 형성하여, 통합 과정이 촉매된다. 숙주 세포에 들어가서 바이러스-RNA 게놈의 역전사 후, 4 개의 인테그라제 분자는 사합체를 형성하고 바이러스 DNA의 말단에 부착되며, 이를 인타솜(intasome)이라고 한다. 사전-통합 복합체(pre-integration complex, PIC)는 DNA의 3'OH 말단을 소화하여 5'OH-돌출부를 형성하고, 이는 이후 숙주 DNA에 대한 친핵성 공격에 필요하다. 이러한 PIC의 형성 동안, 복합체는 핵으로 운반된다. 핵으로의 운반 후 PIC는 숙주 DNA와 복합체를 형성하는데, 이를 가닥 전달 복합체(strand transfer complex, STC)라고 한다. 여기서, 바이러스 DNA의 두 3'OH 돌출부 모두 약 5 개의 뉴클레오타이드 공간으로 숙주 DNA 백본의 두 부위를 공격한다. 이로 인해 5 개 뉴클레오타이드의 표적 복제가 발생한다. 친핵성 공격 이후, 바이러스 DNA는 통합되고 숙주-세포 DNA 복구 기구에 의해 단일 가닥 DNA-부분이 복구된다.
[120] 본 발명은 외인성 핵산을 게놈의 특정 부위 내로 삽입하기 위한 인테그라제 및 변형된 인테그라제를 인코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물을 제공한다. 일부 구현예에서, 삽입을 위한 외인성 핵산은 최대 10 kb, 최대 15 kb, 또는 최대 20 kb의 길이, 예를 들어, 약 1 kb 내지 약 20 kb, 약 1 kb 내지 약 19 kb, 약 1 내지 약 18 kb, 약 1 kb 내지 약 17 kb, 약 1 kb 내지 약 16 kb, 또는 약 1 kb 내지 약 15 kb의 길이일 수 있다. 일부 구현예에서, 외인성 핵산을 게놈 내로 삽입할 수 있는 DNA 결합 단백질을 인코딩하는 폴리뉴클레오타이드 서열은 야생형 인테그라제에 대해 변형될 수 있는 인테그라제를 포함하며, 삽입을 위한 외인성 핵산은 최대 10 kb 또는 최대 15 kb의 길이일 수 있다.
[121] 본 명세서의 일부 양태는 본 명세서에 기재된 방법 및 전략을 사용하여 설계된 인테그라제 융합 단백질을 제공한다. 본 명세서의 일부 구현예는 인테그라제 또는 변형된 인테그라제 및/또는 이를 포함하는 융합 단백질을 인코딩하는 핵산을 제공한다. 본 명세서의 일부 구현예는 인테그라제 또는 변형된 인테그라제 및/또는 이를 포함하는 융합 단백질을 인코딩하는 핵산 작제물을 포함하는 플라스미드 또는 발현 벡터를 제공한다.
[122] 본 발명의 인테그라제 또는 변형된 인테그라제는 외인성 핵산을 게놈의 특정 부위 내로 삽입할 수 있는 임의의 인테그라제일 수 있다. 인테그라제의 비제한적 예시로는 HIV 인테그라제, 렌티바이러스 인테그라제, 아데노바이러스 인테그라제, 레트로바이러스 인테그라제, 및 유선 마우스 종양 바이러스 인테그라제를 포함한다. 일부 구현예에서, 인테그라제 (예를 들어, 야생형에 대한 하나 이상의 변형을 포함하는 변형된 인테그라제)는 HIV 인테그라제, 특히 NC_001802.1에 해당하는 HIV 인테그라제 서열 (서열 번호 1 및 2, 각각 아미노산 및 핵산 서열)이다. 일부 구현예에서, 변형된 인테그라제는 야생형 HIV 인테그라제 (서열 번호 1 및 2)에 대해 하나 이상의 변형을 포함한다.
[123] 일부 구현예에서, 인테그라제는 변형된 HIV 인테그라제이다. 변형된 HIV 인테그라제는 서열 번호 1의 아미노산 넘버링에 해당하는 아미노산: 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273으로부터 선택된 하나 이상의 아미노산의 돌연변이를 포함할 수 있다. 변형된 HIV 인테그라제 돌연변이는 표 8에 나열된 하나 이상의 아미노산 변형을 포함할 수 있다. 변형된 HIV 인테그라제 돌연변이는 서열 번호 1 또는 서열 번호 3의 아미노산 넘버링에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R로부터 선택된 하나 이상의 아미노산 변형을 포함할 수 있다.
[124] 일부 구현예에서, 변형된 인테그라제는 예를 들어, 서열 번호 1 또는 서열 번호 4의 아미노산 넘버링에 해당하는 아미노산 94, 117, 119, 120, 124, 및/또는 231에서 DNA 결합을 손상시키는 야생형에 대한 하나 이상의 돌연변이 (예를 들어, G94D, G94E, G94R, G94K, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, A124D, A124E, A124R, A124K , R231G, R231K, R231D, R231E, 및/또는 R231K)를 포함할 수 있다.
[125] 일부 구현예에서, 변형된 인테그라제는 예를 들어, 서열 번호 1 또는 서열 번호 5의 아미노산 넘버링에 해당하는 아미노산 94, 117, 119, 120, 122, 124, 및/또는 231에서 DNA 결합을 향상시키는 야생형에 대한 하나 이상의 돌연변이 (예를 들어, G94D, G94E, G94R, G94K, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, R231G, R231K, R231D, R231E, 및/또는 R231S)를 포함할 수 있다.
[126] 일부 구현예에서, 변형된 인테그라제는 예를 들어, 서열 번호 1 또는 서열 번호 6의 아미노산 넘버링에 해당하는 아미노산 264, 266, 및/또는 273 (예를 들어, K264R, K266R, 및/또는 K273R)에 p300에 의한 인테그라제 아세틸화에 수반되는 야생형에 대한 하나 이상의 돌연변이를 포함할 수 있다.
[127] 일부 구현예에서, 변형된 인테그라제는 예를 들어, 서열 번호 1 또는 서열 번호 7의 아미노산 넘버링에 해당하는 아미노산 10, 13, 64, 116, 128, 152, 168, 및/또는 170 (예를 들어, D10K, E13K, D64A, D64E, D116A, D116E, A128T, E152A, E152D, Q168L, Q168A, 및/또는 E170G)에 레트로바이러스 통합 재조합에 필수적인 고도로 보존된 아미노산에서 하나 이상의 돌연변이를 포함할 수 있다.
[128] 일부 구현예에서, 변형된 인테그라제는 예를 들어, 서열 번호 1 또는 서열 번호 8의 아미노산 넘버링에 해당하는 아미노산 168 (예를 들어, Q168L 또는 Q168A)에 LEDGF/p75와의 상호 작용을 방해하고 염색체 테더링 및 HIV-1 복제를 손상시키는 하나 이상의 돌연변이를 포함할 수 있다.
[129] 일부 구현예에서, 변형된 HIV 인테그라제는 서열 번호 1에 제시된 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상동성인 아미노산 서열을 포함한다. 일부 구현예에서, 변형된 HIV 인테그라제는 서열 번호 1, 3, 4, 5, 6, 7, 또는 8에 대해 본 명세서에 개시된 하나 이상의 변형을 가지는 아미노산 서열을 포함하고, 각각 서열 번호 1, 3, 4, 5, 6, 7, 또는 8에 제시된 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상동성을 유지한다. 일부 구현예에서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제에 비해 게놈으로의 DNA 통합의 높은 특이성을 위해 선택된다.
[130] 본 발명의 특정 양태는 숙주 세포, 예를 들어, 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 본 발명의 인테그라제 또는 변형된 인테그라제를 포함하는 핵산 작제물을 포함하는 벡터 또는 플라스미드 (예를 들어, 발현 벡터 또는 패키징 벡터)에 관한 것이다. 일부 구현예에서, 인테그라제 또는 변형된 인테그라제는 Cas9 또는 아연 집게 단백질과의 융합 단백질로서 발현된다. 일부 구현예에서, 인테그라제 또는 변형된 인테그라제는 별도의 벡터로부터 Cas9 또는 아연 집게 단백질과 공동 발현되지만, 동일한 세포로 전달된다. 일부 구현예에서, 인테그라제 또는 변형된 인테그라제 또는 이를 포함하는 융합 단백질은 세포에 전달하기 위해 렌티바이러스 입자로 패키징된다.
IV. 트랜스포사제 및 변형된 트랜스포사제
[131] 트랜스포존은 전위를 겪을 수 있는 염색체 분절, 예를 들어, 숙주 DNA에 상보적인 서열이 부재하는 경우 전체적으로 전위될 수 있는 DNA이다. 트랜스포존은 인간 세포에서 긴 범위의 DNA 조작을 수행하는데 사용될 수 있다. 포유동물 세포에서 사용되는 일반적인 트랜스포존 시스템으로는 나방 트리코플루시아(Trichoplusia)으로부터 단리된 비활성 트랜스포존, 및 PiggyBac (PB)으로부터 작제된 슬리핑 뷰티 (SB)를 포함한다. PiggyBac은 SB 보다 전위 활성이 높고 흉터없이 절제될 수 있다.
[132] 천연 DNA 트랜스포존은 일반적으로 트랜스포사제 단백질을 코딩하는 단일 유전자를 포함하며, 이는 트랜스포사제 결합 부위를 운반하는 말단 역반복체 (ITR)에 의해 측면에 존재한다. 전위 동안, 트랜스포사제 단백질은 이러한 ITR를 인식하여 절제를 촉매하고 이후 다른 곳에서 무작위 방식으로 요소의 재통합을 촉매한다. 게다가, 이러한 트랜스포존 일부는 이를 2 성분 시스템으로 사용하는 유전자 요법 프로토콜에 사용하도록 조정될 수 있으며, 이러한 시스템에서 플라스미드는 발현 카세트를 포함하여, 여기서 트랜스포존 ITR 사이에 배치된 DNA 서열은 트랜스포사제 효소 또는 시험관 내 합성된 이의 mRNA를 인코딩하는 서열을 포함하는 공동-형질감염된 플라스미드에 의해 지시된 숙주 게놈 내로 도입될 수 있다. 본 발명의 특정 양태에서 트랜스포존-기반은 치료 유전자와 같은 이식유전자의 안정적인 통합 및 지속적인 발현을 효과적으로 매개하는데 사용된다.
[133] 본 발명은 외인성 핵산을 게놈의 특정 부위 내로 삽입하기 위한 트랜스포사제 또는 변형된 트랜스포사제를 인코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물을 제공한다. 일부 구현예에서, 삽입을 위한 외인성 핵산은 최대 20kb의 길이, 최대 25kb의 길이, 최대 30kb의 길이, 또는 최대 40kb의 길이, 예를 들어, 약 1 kb 내지 약 40 kb, 약 1 kb 내지 약 39 kb, 약 1 내지 약 38 kb, 약 1 kb 내지 약 37 kb, 약 1 kb 내지 약 36 kb, 약 1 kb 내지 약 35 kb, 약 1 kb 내지 약 30 kb, 약 1 kb 내지 약 30 kb, 또는 약 1 kb 내지 약 25 kb의 길이일 수 있다. 일부 구현예에서, 외인성 핵산을 게놈 내로 삽입할 수 있는 DNA 결합 단백질을 인코딩하는 폴리뉴클레오타이드 서열은 트랜스포사제 또는 야생형 트랜스포사제에 대해 변형된 트랜스포사제을 포함하며, 삽입을 위한 외인성 핵산은 최대 35 kb 또는 최대 40 kb의 길이일 수 있다.
[134] 본 발명의 트랜스포사제 또는 변형된 트랜스포사제는 외인성 핵산을 게놈의 특정 부위 내로 삽입할 수 있는 임의의 트랜스포사제일 수 있다. 본 명세서의 일부 양태는 본 명세서에 기재된 방법 및 전략을 사용하여 설계된 트랜스포사제 융합 단백질을 제공한다. 본 명세서의 일부 구현예는 이러한 트랜스포사제 또는 변형된 트랜스포사제 및/또는 이를 포함하는 융합 단백질을 인코딩하는 핵산을 제공한다. 본 명세서의 일부 구현예는 트랜스포사제 또는 변형된 트랜스포사제 및/또는 이를 포함하는 융합 단백질을 인코딩하는 핵산 작제물을 포함하는 플라스미드 또는 발현 벡터를 제공한다.
[135] 트랜스포사제의 비제한적인 예로는 프로그 프린스(Frog Prince), 슬리핑 뷰티, 과활성 슬리핑 뷰티, PiggyBac, 및 과활성 PiggyBac를 포함한다. 일부 구현예에서, 트랜스포사제는 서열 번호 9 및 67에 해당하는 과활성 PiggyBac 트랜스포사제이다 (본 명세서에 hyPB 또는 간단하게 PB로도 지칭). 일부 구현예에서, 변형된 트랜스포사제는 과활성 PiggyBac 트랜스포사제 (서열 번호 9)에 대해 하나 이상의 변형을 포함한다.
[136] 일부 구현예에서, 트랜스포사제는 변형된 과활성 PiggyBac 트랜스포사제이다. 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9의 아미노산 넘버링에 해당하는 아미노산: 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594으로부터 선택된 하나 이상의 아미노산의 돌연변이를 포함할 수 있다. 변형된 과활성 PiggyBac 돌연변이는 표 3에 나열된 하나 이상의 아미노산 변형을 포함할 수 있다. 변형된 과활성 PiggyBac 트랜스포사제 돌연변이는 서열 번호 9 또는 서열 번호 10의 아미노산 넘버링에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L으로부터 선택된 아미노산 변형 중 하나 이상을 포함할 수 있다.
[137] 일부 구현예에서, 변형된 트랜스포사제는, 예를 들어, 서열 번호 9 또는 서열 번호 11의 아미노산 넘버링에 해당하는 아미노산 268 및/또는 346에서 보존된 촉매 트라이어드(catalytic triad)에 관여하는 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, D268N 및/또는 D346N)를 포함할 수 있다.
[138] 일부 구현예에서, 변형된 트랜스포사제는 예를 들어, 서열 번호 9 또는 서열 번호 12의 아미노산 넘버링에 해당하는 아미노산 287, 287/290 및/또는 460/461에서 절제에 중요한 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, K287A, K287A/K290A, 및/또는 R460A/K461A)를 포함할 수 있다.
[139] 일부 구현예에서, 변형된 트랜스포사제는 예를 들어, 서열 번호 9 또는 서열 번호 13의 아미노산 넘버링에 해당하는 아미노산 351, 356, 및/또는 379에서 표적 접합에 관여하는 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, S351E, S351P, S351A, 및/또는 K356E)를 포함할 수 있다.
[140] 일부 구현예에서, 변형된 트랜스포사제는 예를 들어 서열 번호 9 또는 서열 번호 14의 아미노산 넘버링에 해당하는 아미노산 560, 564, 571, 573, 589, 592, 및/또는 594에서 통합에 중요한 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, T560A, S564P, S571N, S573A, M589V, S592G, 및/또는 F594L)를 포함할 수 있다.
[141] 일부 구현예에서, 변형된 트랜스포사제는 예를 들어, 서열 번호 9 또는 서열 번호 15의 아미노산 넘버링에 해당하는 아미노산 325, 347, 350, 357 및/또는 465에서 정렬에 관여하는 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, G325A, N347A, N347S, T350A 및/또는 W465A)를 포함할 수 있다.
[142] 일부 구현예에서, 변형된 트랜스포사제는, 예를 들어, 서열 번호 9 또는 서열 번호 16의 아미노산 넘버링에 해당하는 아미노산 576 및/또는 587에서 잘 보존된 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, K576A 및/또는 I587A)를 포함할 수 있다.
[143] 일부 구현예에서, 변형된 트랜스포사제는 예를 들어, 서열 번호 9 또는 서열 번호 17의 아미노산 넘버링에 해당하는 586에서 Zn2+ 결합에 관여하는 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, H586A)를 포함할 수 있다.
[144] 일부 구현예에서, 프로그래밍 가능한 트랜스포사제는 예를 들어, 서열 번호 9 또는 서열 번호 18의 아미노산 넘버링에 해당하는 315, 341, 372, 및/또는 375에서 통합에 관여하는 hyPB에 대한 하나 이상의 돌연변이 (예를 들어, R315A, R341A, R372A, 및/또는 K375A)를 포함할 수 있다.
[145] 일부 구현예에서, 변형된 과활성 PiggyBac은 서열 번호 9에 제시된 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상동성인 아미노산 서열을 포함한다. 일부 구현예에서, 변형된 과활성 PiggyBac은 과활성 PiggyBac에 비해 게놈으로의 DNA 통합의 높은 특이성을 위해 선택된다. 일부 구현예에서, 변형된 과활성 PiggyBac은 서열 번호 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18에 대해 본 명세서에 개시된 하나 이상의 변형을 가지는 아미노산 서열을 포함하고, 각각 서열 번호 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18에 제시된 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상동성을 유지한다.
[146] 일부 구현예에서, 과활성 PiggyBac 트랜스포사제는 서열 번호 67에 대해 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 상동성을 가지는 핵산 서열에 의해 인코딩된다. 일부 구현예에서, SB100 트랜스포사제는 서열 번호 68에 대해 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 상동성을 가지는 핵산 서열에 의해 인코딩된다.
[147] 일부 구현예에서, PB 트랜스포사제는 서열 번호 72에 대해 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 상동성을 가지는 아미노산 서열을 포함한다. 일부 구현예에서, SB100 트랜스포사제는 서열 번호 73에 대해 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 상동성을 가지는 아미노산 서열을 포함한다.
[148] 일부 구현예에서, 변형된 트랜스포사제는 하나 이상의 돌연변이를 포함하는 변형된 슬리핑 뷰티 트랜스포사제이다. 일부 구현예에서, 과활성 슬리핑 뷰티 트랜스포사제 또는 SB100의 하나 이상의 돌연변이는 서열 번호 9 또는 서열 번호 73의 L25F, R36A, I42K, G59D, I212K, N245S, K252A 및 Q271L에 해당한다.
[149] 특정 구현예에서, 변형된 트랜스포사제는 Himar1C9 돌연변이체가 아니다.
[150] 본 발명의 특정 양태는 숙주 세포, 예를 들어, 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 본 발명의 트랜스포사제 또는 변형된 트랜스포사제를 포함하는 핵산 작제물을 포함하는 벡터 또는 플라스미드 (예를 들어, 발현 벡터 또는 패키징 벡터)에 관한 것이다. 일부 구현예에서, 트랜스포사제 또는 변형된 트랜스포사제는 Cas9과의 융합 단백질로서 발현된다. 일부 구현예에서, 트랜스포사제 또는 변형된 트랜스포사제는 별도의 벡터로부터 Cas9와 공동 발현되지만, 동일한 세포로 전달된다. 일부 구현예에서, 트랜스포사제 또는 변형된 트랜스포사제 또는 이를 포함하는 융합 단백질은 세포에 전달하기 위해 렌티바이러스 입자로 패키징된다.
[151] 실시예 20에 나타난 바와 같이, 새롭게 개발된 과활성 PiggyBac 트랜스포사제 돌연변이 라이브러리는 특이적 표적화된 전위를 수행하는 변형된 과활성 PiggyBac을 식별하는데 사용될 수 있다. 양성 표적화된 전위를 가지는 변형된 과활성 PiggyBac은 이러한 라이브러리를 사용하여 식별되었다.
[152] 일부 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9의 아미노산 넘버링에 해당하는 아미노산: 245, 275, 277, 325, 347, 351, 372, 375, 388, 450, 465, 560, 564, 573, 589, 592, 594으로부터 선택된 하나 이상의 아미노산의 돌연변이를 포함할 수 있다.
[153] 일부 구현예에서, 변형된 과활성 PiggyBac 돌연변이는 표 11에 나열된 하나 이상의 아미노산 변형을 포함할 수 있다.
[154] 일부 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제 돌연변이는 서열 번호 9 또는 SEQ ID NO119의 아미노산 넘버링에 해당하는 R245A, R275A, R277A, R275A/R277A, G325A, N347A, N347S, S351E, S351P, S351A, R372A, K375A, R388A, D450N, W465A, T560A, S564P, S573A, M589V, S592G, 또는 F594L으로부터 선택된 아미노산 변형 중 하나 이상을 포함할 수 있다.
[155] 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9 또는 서열 번호 119의 아미노산 넘버링에 해당하는 아미노산 변형 D450을 포함한다.
[156] 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9 또는 서열 번호 119의 아미노산 넘버링에 해당하는 아미노산 변형 R372A, K375A 및 D450을 포함한다.
[157] 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9 또는 서열 번호 119의 아미노산 넘버링에 해당하는 아미노산 변형 R245A 및 D450을 포함한다.
[158] 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9 또는 서열 번호 119의 아미노산 넘버링에 해당하는 아미노산 변형 R245A, G325A, 및 S573P를 포함한다.
[159] 구현예에서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 9 또는 서열 번호 119의 아미노산 넘버링에 해당하는아미노산 변형 R245A, G325A, D450 및 S573P를 포함한다.
[160] 앞서 말한 바와 같이, 본 명세서에 개시된 요소에 융합될 수 있지만, 또한 단독으로 또는 상이한 요소와 조합하여 사용될 수 있는 변형된 과활성 PiggyBac 트랜스포사제가 본 명세서에 제공된다. 상기 트랜스포사제는 본 발명자들에 의해 생성하였다. 이에 따라, 아미노산 서열 서열 번호 9를 포함하는 변형된 과활성 PiggyBac 트랜스포사제가 제공되며, 여기서:
i. 위치 245의 아미노산은 A이고,
ii. 위치 275의 아미노산은 R 또는 A이고,
iii. 위치 277의 아미노산은 R 또는 A이고,
iv. 위치 325의 아미노산은 A 또는 G이고,
v. 위치 347의 아미노산은 N 또는 A이고,
vi. 위치 351의 아미노산은 E, P 또는 A이고,
vii. 위치 372의 아미노산은 R이고,
viii. 위치 375의 아미노산은 A이고,
ix. 위치 450의 아미노산은 D 또는 N이고,
x. 위치 465의 아미노산은 W 또는 A이고,
xi. 위치 560의 아미노산은 T 또는 A이고,
xii. 위치 564의 아미노산은 P 또는 S이고,
xiii. 위치 573의 아미노산은 S 또는 A이고,
xiv. 위치 592의 아미노산은 G 또는 S이고,
xv. 위치 594의 아미노산은 L 또는 F이다.
[161] 일부 구현예에서, 변형된 과활성 PiggyBac은 서열 번호 120, 121, 122, 123, 124, 125, 126, 127, 128, 및 129로 구성된 군으로부터 선택되는 아미노산 서열을 포함한다.
[162] 일부 구현예에서, 변형된 과활성 PiggyBac은 서열 번호 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 또는 129에 대해 본 명세서에 개시된 하나 이상의 변형을 가지는 아미노산 서열을 포함하고, 각각 서열 번호 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 또는 129에 제시된 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상동성을 유지한다. 일부 구현예에서, 변형된 과활성 PiggyBac은 과활성 PiggyBac에 비해 게놈으로의 DNA 통합의 높은 특이성을 위해 선택된다.
[163] 본 발명은 또한, 생체 외 또는 생체 내에서, 구체적으로 유전자 요법에서, 의약으로서 사용하기 위해 본 명세서에 제공된 변형된 과활성 PiggyBac 트랜스포사제에 관한 것이다.
V. CAS9 및 아연 집게 유전자 편집
[164] 현재의 게놈 조작 도구는 조작된 아연 집게 단백질 (ZFP), 전사 활성인자 유사 이펙터 뉴클레아제 (TALEN)를 포함하며, 더욱 최근에는, RNA-가이드 DNA 엔도뉴클레아제 Cas9가 게놈에서 서열-특이적 DNA 절단을 수행한다. 이러한 프로그래밍 가능한 절단은 비-상동 말단 접합 (NHEJ)을 통한 절단 부위의 DNA의 돌연변이 또는 상동성-지정 복구 (HDR)를 통한 절단 부위를 둘러싼 DNA 교체를 초래할 수 있다.
[165] 본 발명의 특정 양태는 특정 게놈 DNA 서열에 결합하도록 조작된 DNA 결합 단백질, 예를 들어, Cas9 및 ZFP을 인코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물에 관한 것이다. 일부 구현예에서, 이러한 DNA 결합 단백질은 유전자 편집을 위해 본 명세서에 개시된 변형된 인테그라제 또는 변형된 트랜스포사제에 융합된다.
i. Cas9
[166] CRISPR-Cas9 시스템은 서열-특이적 이중 가닥 절단 (DSB)을 통해 유전자를 비활성화 또는 변형시키는데 매우 효과적인 도구이다. 이러한 DSB는 세포 DNA 손상 반응 기구에 의해 인식되고 내인성 DSB 복구 경로에 의해 복구될 수 있다. 우세한 복구 경로는 NHEJ (비상동 말단 연결)이며, 이는 종종 프레임시프트 돌연변이를 생성하고 유전자 기능을 방해할 수 있는 작은 삽입 및/또는 결실을 초래한다. 이러한 경로는 유전자 녹아웃 돌연변이를 생성하도록 활용될 수 있다. 택일적으로, 복구 주형의 존재하에, 손상은 상동성-지정 복구 (HDR)에 의해 원활하게 복구될 수 있다. 그러나, 놀라운 발전에도 불구하고, 정확한 유전자 변형을 도입하기 위한 HDR 매개 게놈 편집은 NHEJ 매개 유전자 파괴보다 효율성이 훨씬 낮다. 또한, HDR 경로에 의한 대규모 다중 kb 교체는 어려운 결과를 초래하고, 선택 및/또는 대규모 집단 세포 분류를 필요로 한다. 결과적으로, HDR 경로의 주된 적용은 유전자 내 핵심 영역의 국소적인 대체이다.
[167] 용어 "Cas9" 및 "Cas9 뉴클레아제"는 Cas9 단백질, 또는 이의 단편 (예를 들어, Cas9의 활성 또는 비활성 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA-가이드 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 종종 casn1 뉴클레아제 또는 CRISPR (클러스터형 규칙적 간격의 짧은 회문 반복부)-관련 뉴클레아제로도 지칭된다. CRISPR은 이동성 유전 요소 (바이러스, 전이 요소 및 접합 플라스미드)에 대한 보호를 제공하는 적응 면역 시스템이다. CRISPR 클러스터는 스페이서, 선행 이동 요소에 상보적인 서열 및 표적 침입 핵산을 포함한다. CRISPR 클러스터는 전사되어 CRISPR RNA (crRNA)로 처리된다. 유형 II CRISPR 시스템에서, pre-crRNA의 정확하게 처리하기 위해 트랜스-인코딩된 작은 RNA (tracrRNA), 내인성 리보뉴클레아제 3 (rnc) 및 Cas9 단백질이 필요하다. tracrRNA는 pre-crRNA의 리보뉴클레아제 3-보조(aided) 가공을 위한 가이드로서 역할을 한다. 후속적으로, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 핵산내부분해방식으로(endonucleolytically) 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 핵산내부분해방식으로 절단된 다음, 3 ′-5′핵산외부분해방식으로(exonucleolytically) 트리밍된다. 자연적으로, DNA 결합 및 절단에는 일반적으로 단백질과 두 RNA가 모두 필요하다. 그러나, 단일 가이드 RNA ("sgRNA", 또는 간단히 "gRNA")는 crRNA 및 tracrRNA의 두 양상이 단일 RNA 종으로 통합되도록 하기 위해 조작될 수 있다.
[168] Cas9는 CRISPR 반복 서열에서 짧은 모티프 (PAM 또는 프로토스페이서 인접 모티프)를 인식하여 자기(self) 또는 비-자기(non-self) 구별을 돕는다. Cas9 뉴클레아제 서열 및 구조는 당업자에게 공지되어 있다. Cas9 오르쏘로그는 S. 피오게네스(S. pyogenes) 및 S. 써모필루스(S. thermophilus)를 포함하지만, 이로만 제한되지 않는, 다양한 종에서 설명되어 있다. 추가의 적합한 Cas9 뉴클레아제 및 서열은 본 명세서에 기초하여 당업자에게 명백할 것이며 이러한 Cas9 뉴클레아제 및 서열은 문헌 [Chylinski, et al., "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737]에 개시된 유기체 및 유전자좌로부터의 Cas9 서열을 포함하며; 상기 문헌의 전체 내용은 본 명세서에 참조 문헌으로 포함된다.
[169] 일부 구현예에서, Cas9 뉴클레아제는 비활성 (예를 들어, 비활성화된) DNA 절단 도메인을 가진다. 뉴클레아제-비활성화된 Cas9 단백질은 "dCas9" 단백질 (뉴클레아제-"멸실" Cas9의 경우)로서 호환적으로 지칭될 수 있다. 비활성 DNA 절단 도메인을 가지는 Cas9 단백질 (또는 이의 단편)을 생성하는 방법은 공지되어 있다 (예를 들어, 문헌 [Jinek et al., Science. 337:816-821(2012); Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28; 152(5):1173-83]을 참조하며, 각각의 전체 내용은 본 명세서에 참조 문헌으로 포함).
[170] 예를 들어, Cas9의 DNA 절단 도메인은 두 개의 하위 도메인인, HNH 뉴클레아제 하위 도메인 및 RuvC1 하위 도메인을 포함하는 것으로 공지되어 있다. HNH 하위 도메인은 gRNA에 상보적인 가닥을 절단하는 반면, RuvC1 하위 도메인은 비상보적인 가닥을 절단한다. 이러한 하위 도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H841A는 S. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 비활성화시킨다. Cas9 닉카제는 RuvC 뉴클레아제 도메인의 점 돌연변이 (D10A)에 의해 구별되는 Cas9 뉴클레아제의 변이체이며, DNA에 흠집을 낼 수는 있지만, 절단할 수는 없다.
[171] 용어 "Cas9"는 또한 변이체 및 이의 기능적 단편을 포함한다. 일부 구현예에서, Cas9의 단편을 포함하는 단백질이 제공된다. 예를 들어, 일부 구현예에서, 단백질은 두 Cas9 도메인 중 하나를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인. 일부 구현예에서, Cas9 또는 이의 단편을 포함하는 단백질은 "Cas9 변이체"로서 지칭된다. Cas9 변이체는 Cas9, 또는 이의 단편과 상동성을 공유한다. 예를 들어, Cas9 변이체는 야생형 Cas9에 대해 적어도 약 70% 상동성, 적어도 약 80% 상동성, 적어도 약 90% 상동성, 적어도 약 95% 상동성, 적어도 약 96% 상동성, 적어도 약 97% 상동성, 적어도 약 98% 상동성, 적어도 약 99% 상동성, 적어도 약 99.5% 상동성, 또는 적어도 약 99.9% 상동성일 수 있다. 일부 구현예에서, Cas9 변이체는 Cas9의 단편 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)을 포함하며, 이에 따라 단편은 야생형 Cas9의 상응하는 단편에 대해 적어도 약 70% 상동성, 적어도 약 80% 상동성, 적어도 약 90% 상동성, 적어도 약 95% 상동성, 적어도 약 96% 상동성, 적어도 약 97% 상동성, 적어도 약 98% 상동성, 적어도 약 99% 상동성, 적어도 약 99.5% 상동성, 또는 적어도 약 99.9% 상동성을 가진다. 일부 구현예에서, Cas9는 다음으로부터 유래한 Cas9를 지칭한다: 코리네박테리움 울세란스(Corynebacterium ulcerans) (NCBI 참조: NC_015683.1, NC_017317.1) (서열 번호 19); 코리네박테리움 디프테리아(Corynebacterium diphtheria) (NCBI 참조: NC_016782.1, NC_016786.1) (서열 번호 20); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola)(NCBI 참조: NC_021284.1) (서열 번호 21); 프레보텔라 인터메디아(Prevotella intermedia) (NCBI 참조: NC_017861.1) (서열 번호 22); 스피로플라스마 타이와넨세(Spiroplasma taiwanense) (NCBI 참조: NC_021846.1) (서열 번호 23); 스트렙토코커스 이니애(Streptococcus iniae) (NCBI 참조: NC_021314.1) (서열 번호 24); 벨리엘라 발티카(Belliella baltica) (NCBI 참조: NC_018010.1) (서열 번호 25); 사이크로플렉수스 토르퀴스(Psychroflexus torquisi) (NCBI 참조: NC_018721.1) (SEQ ID NO26); 스트렙토코커스 써모필러스(Streptococcus thermophilus) (NCBI 참조: YP_820832.1) (SEQ ID NO27); 리스테리아 인노쿠아(Listeria innocua) (NCBI 참조: NP_472073.1) (SEQ ID NO28); 캄필로박터 제주니(Campylobacter jejuni) (NCBI 참조: YP_002344900.1) (서열 번호 29); 또는 나이세리아 메닌지티디스(Neisseria. meningitidis) (NCBI 참조: YP_002342100.1) (서열 번호 30).일부 구현예에서, 야생형 Cas9는 스트렙토코커스 피오게네스로부터의 Ca9 (NCBI 참조 서열: NC_017053.1) (서열 번호 31)에 해당한다.
[172] 공지된 Cas9 단백질 가운데, S. 피오게네스 Cas9가 게놈 조작을 위한 도구로서 널리 사용된다. 이러한 Cas9 단백질은 두 개의 별개의 뉴클레아제 도메인을 포함하는 큰, 다중-도메인 단백질이다. 점 돌연변이는 Cas9 내에 도입되어 abolish 뉴클레아제 활성을 없애, sgRNA-프로그래밍된 방식으로 DNA에 결합하는 능력을 여전히 유지하는 멸실 Cas9 (dCas9)를 생성할 수 있다. 원칙적으로, 또 다른 단백질 또는 도메인에 융합될 경우, dCas9는 간단하게 적절한 sgRNA와의 공동 발현에 의해 사실상 임의의 DNA 서열에 대해 해당 단백질을 표적화할 수 있다.
[173] 본 발명은 외인성 핵산을 게놈의 특정 부위 내로 삽입하기 위한 Cas9 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물을 제공한다. 본 명세서의 일부 양태는 Cas9 단백질 및 본 발명의 변형된 인테그라제 또는 변형된 트랜스포사제를 포함하는 융합 단백질을 제공한다. 본 명세서의 일부 구현예는 이러한 Cas9 단백질 또는 융합 단백질을 인코딩하는 핵산을 제공한다. 일부 구현예는 이러한 핵산을 포함하는 플라스미드 또는 발현 벡터를 제공한다.
[174] 본 명세서에 개시된 핵산 작제물에 의해 인코딩된 Cas9는 게놈의 특정 게놈 DNA 서열에 결합할 수 있는 임의의 Cas9일 수 있다. Cas9 단백질의 예로는 인간 Cas9 (hCas9), 닉카제 Cas9 (nCas9), 멸실 Cas9 (dCas9), 스트렙토코커스 피오게네스 Cas9, 스타필로코커스 아우레우스 Cas9, Cas12a, Cas12b, 멸실 Cas9 (dCas9), 변이체 및 이의 기능적 단편을 포함한다. 일부 구현예에서, Cas9는 인간 Cas9 또는 변이체 또는 이의 기능적 단편이다.
[175] 일부 구현예에서, hCas9는 서열 번호 64에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 핵산 서열에 의해 인코딩된다. 일부 구현예에서, nCas9는 서열 번호 65에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 핵산 서열에 의해 인코딩된다. 일부 구현예에서, dCas9는 서열 번호 66에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 핵산 서열에 의해 인코딩된다.
[176] 일부 구현예에서, hCas9는 서열 번호 69에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 아미노산 서열을 포함한다. 일부 구현예에서, nCas9는 서열 번호 70에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 아미노산 서열을 포함한다. 일부 구현예에서, dCas9는 서열 번호 71에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 아미노산 서열을 포함한다.
[177] 본 발명의 특정 양태는 숙주 세포, 예를 들어, 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 Cas9를 포함하는 핵산 작제물을 포함하는 벡터 또는 플라스미드 (예를 들어, 발현 벡터 또는 패키징 벡터)에 관한 것이다. 일부 구현예에서, 핵산 작제물은 본 발명의 변형된 트랜스포사제와의 융합 단백질로서 발현되는 Cas9를 인코딩하는 폴리뉴클레오타이드 서열을 포함한다.
ii. 아연 집게 단백질
[178] 본 발명은 또한 외인성 핵산을 게놈의 특정 부위 내로 삽입하기 위한 아연 집게 단백질 (ZFP)을 인코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물을 제공한다. 본 명세서의 일부 양태는 ZFP 및 본 발명의 변형된 인테그라제 또는 변형된 트랜스포사제를 포함하는 융합 단백질을 제공한다. 본 명세서의 일부 구현예는 이러한 ZFP 또는 융합 단백질을 인코딩하는 핵산을 제공한다. 본 명세서의 일부 구현예는 이러한 인코딩 핵산을 포함하는 플라스미드 또는 발현 벡터를 제공한다.
[179] 본 발명에 사용되는 아연 집게 단백질은 서열-특이적 방식으로 DNA에 결합하는 단백질이다. ZFP는 진핵생물에 고르지 않게 분포되어 있다. ZFP는 DNA 인식, RNA 결합, 및 단백질 결합에 관여하는 것으로 식별되어 있다. 특정 분류의 아연 집게 단백질은 접힌 도메인에서 단백질 백본의 전체 형태를 고려하여 "접힘 그룹(fold group)"에 기초한다. 아연 집게의 가장 흔한 "접힘 그룹"은 C2H2 또는 Cys2His2-유사 ("고전적인 아연 집게"), 트레블 클레프 (treble clef), 및 아연 리본이다. 이러한 단백질의 한 부류 (C2H2 부류)를 특징으로 하는 대표적인 모티프는 -Cys- (X) 2-4 -Cys- ( X) 12 -His- (X) 3-5 -His (여기서 X는 임의의 아미노산)이다.
[180] 본 발명의 ZFP는 게놈의 특정 게놈 DNA 서열에 결합할 수 있는 임의의 ZFP, 변이체 또는 이의 기능적 단편일 수 있다. ZFP의 비제한적인 예로는 C2H2, 개그 너클(gag knuckle), 트레블 클레퍼, 아연 리본, Zn2/Cys6-유사, 또는 TAZ2 도메인-유사, 또는 임의의 이의 조합으로부터 선택된 접힘 그룹 또는 아연 집게 모티프를 포함하는 ZFP를 포함한다. 일부 구현예에서, ZFP는 C2H2 아연 집게 단백질이다. 일부 구현예에서, ZFP는 조작된 ZFP이다.
[181] 조작된 아연 집게 어레이는 DNA 절단 도메인 (보통 FokI의 절단 도메인)에 융합되어 아연 집게 뉴클레아제를 생성할 수 있다. 이러한 아연 집게-FokI 융합은 게놈 조작에 대해 유용한 시약이 되었다.
[182] 본 발명의 ZFP는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 개 이상의 아연 집게 도메인을 포함할 수 있다. ZFP는 2-12, 2-10, 2-8, 3-8, 4-8, 또는 5-8 개의 아연 집게 도메인을 포함할 수 있다. 일부 구현예에서, ZFP는 6 개의 아연 집게 도메인을 포함할 수 있다.
[183] 일반적인 모듈식 어셈블리 공정은 각각 3-염기쌍 DNA 서열을 인식할 수 있는 별도의 아연 집게를 조합하여 3-집게, 4-, 5-, 또는 6-집게 어레이를 생성하는 하는 단계를 포함하며 이는 9 개의 염기쌍 내지 18 개의 염기쌍 길이 범위의 표적 부위를 인식한다. 또 다른 방법은 2-집게 모듈을 사용하여 최대 6개의 개별 아연 집게를 가지는 아연 집게 어레이를 생성하는 것이다.
[184] 일부 구현예에서, ZFP의 결합 도메인은 선택된 서열에 결합하도록 조작될 수 있다. 조작된 아연 집게 결합 도메인은 자연 발생 ZFP에 비해 결합 특이성이 개선될 수 있다. 일부 구현예에서, ZFP를 인코딩하는 핵산 서열은 서열 번호 32, 서열 번호 34, 서열 번호 36, 또는 서열 번호 38에 해당한다. 일부 구현예에서, ZFP의 아미노산 서열은 서열 번호 33, 서열 번호 35, 서열 번호 37, 또는 서열 번호 39에 해당한다. 일부 구현예에서, ZFP는 서열 번호 33, 35, 37 또는 39 중 임의의 서열에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 약 100% 서열 동일성을 가지는 아미노산 서열을 포함한다.
[185] 본 발명의 특정 양태는 숙주 세포, 예를 들어, 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 ZFP를 포함하는 핵산 작제물을 포함하는 벡터 또는 플라스미드 (예를 들어, 발현 벡터 또는 패키징 벡터)에 관한 것이다. 일부 구현예에서, 핵산 작제물은 본 발명의 변형된 인테그라제 또는 변형된 트랜스포사제와의 융합 단백질로서 발현되는 ZFP를 인코딩하는 폴리뉴클레오타이드 서열을 포함한다.
VII. 융합 단백질
[186] 본 발명은 게놈 내로 외인성 핵산의 부위-특이적 삽입을 위한 융합 단백질을 제공한다. 특정 구현예에서, 융합 단백질은 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질, 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질 (여기서 제2 DNA 결합 단백질은 본 명세서의 인테그라제 또는 트랜스포사제임) 및 제1 및 제2 단백질을 연결하는 링커를 포함한다. 일부 구현예에서 제1 DNA 결합 단백질은 Cas9 단백질 또는 아연 집게 단백질이다. 일부 구현예에서 제1 DNA 결합 단백질은 Cas9이며 제2 결합 단백질은 본 명세서에 개시된 변형된 트랜스포사제이고, 여기서 제1 및 제2 결합 단백질은 작제물에서 어느 순서로든 배향될 수 있다. 일부 구현예에서 제1 DNA 결합 단백질은 아연 집게 단백질이며 제2 결합 단백질은 변형된 인테그라제이고, 여기서 제1 및 제2 결합 단백질은 작제물에서 어느 순서로든 배향될 수 있다.
[187] 일부 구현예에서, 융합 단백질은 제1 결합 단백질과 제2 결합 단백질 사이의 링커를 포함하며, 여기서 링커는 (GGS)n, (GGGGS)n (서열 번호 133), (G)n, (EAAAK)n (서열 번호 134), XTEN-기반, 또는 (XP)n 모티프, 또는 상기 링커 중 임의의 조합 (여기서 n은 독립적으로 1 내지 50의 정수)를 포함한다. 일부 구현예에서, 링커는 12 내지 24 개의 아미노산, 또는 36 내지 72 개의 핵산 길이인 핵산 서열에 의해 코딩된다. 일부 구현예에서 링커는 XTEN 서열 또는 GGS 서열을 포함한다. 일부 구현예에서, 융합 단백질은 본 발명의 변형된 인테그라제에 연결된 아연 집게 단백질을 포함하며, 여기서 링커는 GGS 서열 또는 XTEN 서열을 포함하며, 변형된 인테그라제는 링커에 대해 5' 또는 3'일 수 있다. 일부 구현예에서, 융합 단백질은 본 발명의 변형된 트랜스포사제에 연결된 Cas9 단백질을 포함하며, 여기서 링커는 GGS 서열 또는 XTEN 서열을 포함하며, 변형된 트랜스포사제는 링커에 대해 5' 또는 3'일 수 있다. 일부 구현예에서, 링커는 표 1에 나타난 링커이다. 일부 구현예에서, 링커는 서열 번호 49의 아미노산 서열을 포함한다. 일부 구현예에서, 링커는 서열 번호 49, 서열 번호 51, 서열 번호 53, 서열 번호 55, 서열 번호 57, 서열 번호 59, 서열 번호 61, 서열 번호 63, 또는 임의의 이의 조합으로 구성된 군으로부터 선택된 아미노산 서열을 포함한다. 일부 구현예에서, 링커는 서열 번호 48를 포함하는 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 링커는 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 또는 임의의 이의 조합으로 구성된 군으로부터 선택된 서열을 포함하는 핵산 서열에 의해 인코딩된다.
표 1: 링커
[188] 일부 구현예에서, 제1 DNA 결합 단백질의 3' 말단은 링커에 의해 제2 DNA 결합 단백질의 5' 말단에 연결된다. 일부 구현예에서, 제2 DNA 결합 단백질의 3' 말단은 링커에 의해 제1 DNA 결합 단백질의 5' 말단에 연결된다. 일부 구현예에서, Cas 9 단백질의 3' 말단은 링커에 의해 트랜스포사제의 5' 말단에 연결된다. 일부 구현예에서, Cas 9 단백질의 5' 말단은 링커에 의해 트랜스포사제의 3' 말단에 연결된다. 일부 구현예에서, 3' 아연 집게 단백질은 링커에 의해 인테그라제의 5' 말단에 연결된다. 일부 구현예에서, 5' 아연 집게 단백질은 링커에 의해 인테그라제의 3' 말단에 연결된다.
[189] 또한 본 명세서에 제공된 임의의 핵산 작제물의 발현으로부터 수득된 융합 단백질이 본 명세서에 제공된다.
VIII. 숙주 세포/유기체
[190] 일부 구현예에서, 본 발명의 핵산 작제물은 숙주 세포에서 발현된다. 적합한 숙주 세포로는 진핵 및 원핵 세포 및/또는 세포주를 포함하지만, 이에 제한되지 않는다. 이러한 세포로부터 생성된 숙주 세포 또는 세포주의 비제한적인 예로는 COS, CHO (예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예를 들어, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포, 뿐만 아니라 곤충 세포 예컨대 스포도프테라 프루기페르다(Spodoptera fugiperda, Sf), 또는 진균 세포 예컨대 사카로미세스(Saccharomyces), 피키아(Pichia) 및 쉬조사카로마이세스(Schizosaccharomyces)를 포함한다.
[191] 일부 구현예에서, 숙주 세포는 미생물로부터 유래한다. 본 명세서에 개시된 특정 방법에 유용한 미생물로는, 예를 들어, 박테리아 (예를 들어, E coli), 효모 (예를 들어, 사카로미케스 케레비시아이(Saccharomyces cerevisiae)), 및 식물을 포함한다. 숙주 세포는 원핵생물 또는 진핵생물일 수 있다. 일부 구현예에서, 숙주 세포는 진핵생물이다. 적합한 진핵 숙주 세포로는 효모 세포, 곤충 세포, 식물 세포, 진균 세포, 및 조류 세포를 포함하지만, 이에 제한되지 않는다.
[192] 일부 구현예에서, 숙주 세포는 적격 숙주 세포이다. 일부 구현예에서, 숙주 세포는 자연적으로 적격이다. 일부 구현예에서, 숙주 세포는, 예를 들어, 칼슘 클로라이드 및 열 충격을 사용하는 공정에 의해 적격으로 만들어진다. 사용되는 세포는 임의의 적격 세포, 특히 포유동물, 예를 들어 인간 또는 동물의 구체적으로 진핵 세포일 수 있다. 체세포 또는 배아 줄기일 수 있거나 또는 분화될 수 있다. 일부 양태에서, 세포는 293T 세포, 섬유아세포, 간세포, 근육 세포 (골격, 심장, 평활, 혈관 등), 상피 세포의 신경 세포 (뉴런, 신경교 세포, 성상세포), 신장, 안구 등을 포함한다. 또한 , 곤충, 식물 세포, 효모, 또는 원핵 세포를 포함할 수 있다. 추가로, 1차 세포는 뉴클레아제 (예를 들어, ZFN 또는 TALEN) 또는 뉴클레아제 시스템 (예를 들어, CRISPR/Cas)으로 치료한 후 치료될 대상체로 재도입하기 위해 생체 외에서 분리되고 사용될 수 있다. 적합한 1차 세포는 말초 혈액 단핵 세포 (PBMC), 및 CD4+ T 세포 또는 CD8+ T 세포와 같은 T-림프구 (이에 제한되지 않음)와 같은 다른 혈액 세포 서브세트를 포함한다. 적합한 세포는 또한 줄기 세포, 예를 들어 배아 줄기 세포, 유도 만능 줄기 세포, 조혈 줄기 세포 (CD34+), 신경 줄기 세포 및 중간엽 줄기 세포를 포함한다.
[193] 일부 구현예에서, 숙주 세포는 본 명세서에 개시된 핵산 작제물을 포함하는 플라스미드로 형질감염된다. 일부 구현예에서, 핵산 작제물을 포함하는 플라스미드는 패키징 플라스미드이다. 일부 구현예에서, 핵산 작제물을 포함하는 플라스미드는 캡시드(capsid) 단백질, 예를 들어, gag 및 pol을 인코딩하는 폴리뉴클레오타이드를 추가적으로 포함한다. 일부 구현예에서, 숙주 세포는 다음으로 형질감염된다: (i) 숙주 세포에서 조합된 핵산 작제물을 포함하는 플라스미드와 (ii) 바이러스 외피에 대한 단백질 (외피 플라스미드)를 인코딩하는 폴리뉴클레오타이드를 포함하는 플라스미드; 및 (iii) 외인성 핵산 서열 (예를 들어, GOI)을 포함하는 플라스미드, 여기서 외인성 핵산, 예를 들어, GOI를 포함는 바이러스 입자, 및 제1 및 제2 결합 단백질을 포함하는 융합 단백질이 생성된다.
[194] 일부 구현예에서, 숙주 세포는 다음으로 형질감염된다: (i) 핵산 작제물을 포함하는 플라스미드는 (ii) 핵산 작제물을 포함하는 플라스미드로서, 캡시드 단백질, 예를 들어, gag 및 pol를 인코딩하는 폴리뉴클레오타이드를 추가적으로 포함하는 플라스미드 (패키징 플라스미드, 여기서 패키징 플라스미드는 기능적 인테그라제를 가지지 않음); (iii) 바이러스 외피에 대한 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 플라스미드 (외피 플라스미드) 및 (iv) 외인성 핵산 서열 (예를 들어, GOI)을 포함하는 플라스미드와 조합되며, 여기서 외인성 핵산, 예를 들어, GOI를 포함하는 바이러스 입자, 및 제1 및 제2 결합 단백질을 포함하는 융합 단백질이 생성된다.
[195] 추가적인 구현예에서, 벡터, 예를 들어, 본 발며에 따른 렌티바이러스 벡터는 본 발명의 핵산 작제물 및 외인성 핵산에 의해 인코딩된 융합 단백질을 유기체, 예를 들어, 포유동물, 및 더욱 구체적으로 포유 동물의 관심 표적 세포로 전달하기 위해 사용될 수 있다. 본 발명의 융합 단백질을 포함하는 렌티바이러스 벡터는 다양한 세포 유형, 예를 들어, 간세포 (예를 들어 간세포(hepatocyte)), 근육 세포, 뇌 세포, 신장 세포, 망막 세포, 및 조혈 세포를 형질도입할 수 있다. 일부 구현예에서, 본 발명의 표적 세포는 “비분열” 세포이다. 이러한 세포는 정상적으로 분열하지 않는 신경 세포와 같은 세포를 포함한다. 그러나, 본 발명이 비분열 세포 (근육 세포, 백혈구 세포, 비장 세포, 간 세포, 눈 세포, 상피 세포 등을 포함하지만 이에 제한되지 않음)에 제한되는 것으로 의도되지 않는다.
[196] 특정 구현예에서, 패킹된 본 발명의 융합 단백질은, 예를 들어, 유기체의 DNA를 유전자 편집하기 위해 유기체에 투여된다. 일부 구현예에서, 유기체는 인간이다. 일부 구현예에서, 유기체는 비인간 포유동물이다. 일부 구현예에서, 유기체는 비인간 영장류이다. 일부 구현예에서, 유기체는 설치류이다. 일부 구현예에서, 유기체는 양, 염소, 소, 고양이, 또는 개이다. 일부 구현예에서, 유기체는 척추동물, 양서류, 파충류, 어류, 곤충, 파리, 또는 선충이다. 일부 구현예에서, 유기체는 연구용 동물이다. 일부 구현예에서, 유기체는 유전자 조작된, 예를 들어, 유전자 조작된 비인간 대상체이다. 유기체는 어떠한 성별일 수 있고, 임의의 발달 단계일 수 있다.
IX. 게놈 내로의 삽입 방법
[197] 외인성 핵산을 게놈 내로 삽입하는 방법은 기재되어 있다. 예를 들어, 문헌 [Yusa et al. PNAS 4(108):1531-1536 (2011); Feng et al. Nuc. Acid Res. 4(38):1204-1216 (2009); Kettlun et al. Amer. Soc. Gene and Cell Ther. 9(19):1636-1644 (2011); Skipper et al. 20(92):1-23 (2013); Li et al. PNAS 25:E2279-E2287 (2013); Mts et al. Nature Genetics 41(6):753-761 (2009); Mali et al. Nat. Methods 10(10):957-963; Vargas et al. J. Trans. Med. 14(288):1-15 (2016); Gersbach et al. Acc. Chem. Res. 47:2309-2318 (2014); Chandrasegaran et al. Cell Gene Ther. Ins. 3(1):33-41 (2017); Wilson et al. 649:353-363 (2010); Zhao Zhang, et al. Mol Ther Nucleic Acids. 9: 230-241 (2017); Naldini L. EMBO Mol Med. 11(3) (2019); 및 Naldini L, et al. Hum Gene Ther. 27(10):727-728 (2016)]를 참조하며, 상기 문헌 각각은 본 명세서에 참조 문헌으로 포함된다.
[198] 본 발명은 외인성 핵산을 게놈의 특정 부위 내로 삽입하기 위한 융합 단백질을 인코딩하는 핵산 작제물을 제공한다. 본 발명은 또한 외인성 핵산을 게놈의 특정 부위 내로 삽입하기 위한 융합 단백질을 제공한다. 일부 구현예에서 삽입을 위한 외인성 핵산은 최대 5 kb의 길이, 최대 10 kb의 길이, 최대 15 kb의 길이, 20 kb의 길이, 최대 25kb의 길이, 최대 30kb의 길이, 최대 35 kb의 길이, 또는 최대 40 kb의 길이일 수 있다.
[199] 또 다른 구현예에서, 게놈 내로 부위-특이적 핵산 삽입 방법이 제공된다. 일부 구현예에서, 방법은 표적 DNA를 Cas9 및 본 명세서에 기재된 트랜스포사제를 포함하는 임의의 융합 단백질과 접촉시키는 것을 포함한다. 예를 들어, 일부 구현예에서, 방법은 DNA를 (i) Cas9; 및 (ii) 트랜스포사제의 두 개의 연결된 폴리펩타이드를 포함하는 융합 단백질과 접촉시키는 것을 포함하며: 여기서 활성 Cas9는 DNA의 영역, 예를 들어, 게놈 DNA에 혼성화하는 gRNA에 결합한다.
[200] 일부 구현예에서, 방법은 표적 DNA를 Cas9 및 본 명세서에 기재된 인테그라제를 포함하는 임의의 융합 단백질과 접촉시키는 것을 포함한다. 예를 들어, 일부 구현예에서, 방법은 DNA를 (i) Cas9; 및 (ii) 인테그라제의 두 개의 연결된 폴리펩타이드를 포함하는 융합 단백질과 접촉시키는 것을 포함하며: 여기서 활성 Cas9는 DNA의 영역, 예를 들어, 게놈 DNA에 혼성화하는 gRNA에 결합한다.
[201] 일부 구현예에서, 방법은 표적 DNA를 ZFP 및 본 명세서에 기재된 인테그라제를 포함하는 임의의 융합 단백질과 접촉시키는 것을 포함한다. 예를 들어, 일부 구현예에서, 방법은 DNA를 (i) Cas9; 및 (ii) 인테그라제의 두 개의 연결된 폴리펩타이드를 포함하는 융합 단백질과 접촉시키는 것을 포함하며: 여기서 ZFP는 DNA의 영역, 예를 들어, 게놈 DNA에 혼성화한다.
[202] 일부 구현예에서, 융합 단백질은 바이러스 벡터, 예를 들어, 렌티바이러스 입자를 사용하여 표적 DNA, 예를 들어, 게놈 DNA를 포함하는 유기체 및/또는 세포에 전달된다.
X. 렌티바이러스 패키징
[203] 렌티바이러스 패키징 방법이 기재되어 있다. 문헌 [Grandchamp et al. 9(6):1-13 (2014); Voelkel et al. 107(17):7805-7810 (2010); Tan et al. 80(4)1939-1948; Li et al. 9(8):1-9 (2014); Mts et al. Nature Genetics 41(6):753-761 (2009); 및 Robert H Kutner1, et al. NATURE PROTOCOLS 4(4):495 (2009)]를 참조하며, 상기 문헌 각각은 본 명세서에 참조 문헌으로 포함된다.
[204] 일반적으로, 렌티바이러스 전달 시스템은 바이러스 질병을 유발하는데 필요한 유전적 성분을 포함하지 않은 완전한 바이러스를 생산하는데 사용되는 별도의 플라스미드에서 상이한 렌티바이러스 유전자를 가지는 분할 시스템을 사용한다. 예를 들어, 하나의 플라스미드 (외피 플라스미드)는 바이러스 외피 (env)에 대한 단백질을 인코딩할 수 있고; 또 다른 플라스미드 (패키징 플라스미드)는 캡시드 단백질 (예를 들어, gag 및 pol) 및 역전사효소 및/또는 인테그라제와 같은 효소를 인코딩할 수 있고; 관심 유전자 (GOI)를 포함하는 추가적인 플라스미드는 (게놈 통합을 위한) 긴 말단 반복부 및 psi-서열 (유전자를 바이러스 내로 패키징하기 위한 신호를 표시)가 측면에 있다 (전달 플라스미드). 이러한 플라스미드가 동시에 세포 내로 도입되는 경우, 질병을 유발하는데 필요한 바이러스 유전자를 가지지 않고 GOI를 포함하는 바이러스가 생성된다.
[205] 본 발명의 특정 양태에서 본 발명의 렌티바이러스 벡터 (또는 입자)는 분할 시스템, 예를 들어, 트랜스 보완(transcomplementation)시스템 (벡터/패키징 시스템)에 의해, 시험관 내 허용 세포 (예컨대 293T 세포)를, 렌티바이러스 벡터 게놈의 특정 성분, 및, 폴리펩타이드 GAG, POL 및 외피 단백질(들), 또는 레트로바이러스 입자의 형성을 가능하게 하기에 충분한 이러한 폴리펩타이드의 일부를 인코딩하는 gag, pol 및 env 서열을 교차로 제공하는 적어도 하나의 다른 플라스미드를 포함하는 플라스미드로 형질감염시킴으로써 수득될 수 있다.
[206] 예시로서, 숙주 세포는 다음으로 형질감염된다: a) 렌티바이러스 gag 및 pol 서열을 포함하는 패키징 플라스미드, b) 외피 단백질(들) (예컨대 VSV-G)를 인코딩하는 유전자를 포함하는 제2 플라스미드 (외피 발현 플라스미드 또는 유사유형의 env 플라스미드), c) 5' 및 3' LTR 서열 사이에, psi 캡슐화 서열, 및 이식유전자를 포함하는 플라스미드 벡터, 및 d) 본 명세서에 개시된 조작된 융합 단백질을 인코딩하는 핵산 작제물을 포함하는 플라스미드 벡터. 일부 구현예에서, 본 명세서에 개시된 조작된 융합 단백질을 인코딩하는 핵산 작제물은 별도의 플라스미드를 대신하여 패키징 플라스미드에 있다. gag, pol 및 env cDNA를 인코딩하는 핵산은 종래의 기법에 따라 입수가능한 선행 기술 및 데이터베이스로부터 바이러스 유전자 서열로부터 유리하게 제조될 수 있다.
[207] 일부 구현예에서, 렌티바이러스 벡터는 본 명세서에 기재된 핵산 작제물을 포함한다. 일부 구현예에서, 렌티바이러스 벡터는 본 명세서에 기재된 융합 단백질을 포함한다.
[208] 플라스미드에서 사용되는 프로모터는 동일하거나 또는 상이할 수 있다. 일부 구현예에서, 플라스미드 트랜스 보완 시스템에서, 외피 플라스미드 및 플라스미드 벡터는, 각각, 외피 단백질의 gag 및 pol을 촉진하기위해, 벡터 게놈 및 이식유전자의 mRNA가 동일하거나 또는 상이할 수 있는 프로모터이다. 이러한 프로모터는 유리하게는 유비쿼터스 프로모터로부터 선택되고 또는 특이적으로, 예를 들어, 바이러스 프로모터 CMV, TK, RSV LTR 프로모터 및 RNA 폴리머라제 III 프로모터 예컨대 U6 또는 H1 또는 env, gag 및 pol을 인코딩하는 헬퍼 이러스 (즉 아데노바이러스, 바큘로바이러스, 헤르페스 바이러스)의 프로모터부터 선택된다.
[209] 본 발명의 렌티바이러스 벡터의 제조를 위해 본 명세서에 기재된 플라스미드가 숙주 세포 내로 도입될 수 있고 바이러스가 생성되고 수확된다. 적합한 세포로는 진핵 및 원핵 세포 및/또는 세포주를 포함하지만, 이에 제한되지 않는다. 이러한 세포로부터 생성된 세포 또는 세포주의 비제한적인 예로는, 예를 들어, COS, CHO (예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예를 들어, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포 뿐만 아니라 곤충 세포 예컨대 스포도프테라 프루기페르다(Spodoptera fugiperda, Sf), 또는 진균 세포 예컨대 사카로미세스(Saccharomyces), 피키아(Pichia) 및 쉬조사카로마이세스(Schizosaccharomyces)를 포함한다.
[210] 숙주 세포가 플라스미드로 형질감염되고 본 발명의 렌티바이러스 벡터 (또는 입자)가 생성되면, 본 발명의 렌티바이러스 벡터 (또는 입자)는 세포의 상청액으로부터 정제될 수 있다. 농도를 향상시키기 위한 렌티바이러스 벡터의 정제는 임의의 적합한 방법에 의해, 예컨대 밀도 구배 정제 (예를 들어, 세슘 클로라이드 (CsCl))에 의해, 크로마토그래피 기법 (예를 들어, 컬럼 또는 배치 크로마토그래피)에 의해, 또는 초원심분리에 의해 달성될 수 있다. 예를 들어, 본 발명의 벡터는 2 또는 3 개의 CsCl 밀도 구배 정제 단계를 거칠 수 있다. 벡터는, 바람직하게는 세포를 용해시키고, 용해물을 크로마토그래피 수지로에 적용하고, 크로마토그래피 수지로부터 바이러스를 용리하고, 본 발명의 렌티바이러스 벡터를 포함하는 분획을 수집하는 단계를 포함하는 방법을 사용하여 감염된 세포로부터 정제된다.
XI. 전달 방법
[211] 렌티바이러스 벡터의 전달 방법이 기재되어 있다. 예를 들어, 문헌[Vargas et al. J. Trans. Med. 14(288):1-15 (2016); Mali et al. Nat. Methods 10(10):957-963; Mts et al. Nature Genetics 41(6):753-761 (2009); Skipper et al. 20(92):1-23 (2013)]을 참조한다.
[212] 본 발명의 핵산 작제물에 의해 인코딩되는 융합 단백질을 포함하는 렌티바이러스 벡터는 임의의 경로에 의해 대상체에 투여될 수 있다. 일부 구현예에서, 본 발명의 렌티바이러스 벡터는 생체 내 또는 생체 외에서 대상체의 세포에 전달될 수 있다
[213] 일부 구현예에서, 본 발명의 렌티바이러스 벡터는 생체 내로 전달될 수 있다. 일부 구현예에서, 본 발명의 핵산 작제물에 의해 인코딩되는 융합 단백질을 포함하는 렌티바이러스 벡터는 GOI를 전달 및/또는 대상체의 DNA에서 유전적 결함을 표적화하는데 사용될 수 있다. 일부 구현예에서, 렌티바이러스 벡터는 대상체에게 비경구로, 바람직하게 혈관 내로 (정맥 내 포함) 투여된다. 비경구로 투여되는 경우, 벡터는 멸균 수용액 또는 분산액과 같은 주사에 적합한 약제학적 비히클에 제공되는 것이 바람직하다.
[214] 일부 구현예에서, 본 발명의 렌티바이러스 벡터는 생체 외에서 사용될 수 있다.
[215] 일부 구현예에서, 본 발명의 핵산 작제물에 의해 인코딩되는 융합 단백질을 포함하는 렌티바이러스 벡터는 GOI를 전달 및/또는 대상체의 DNA에서 유전적 결함을 표적화하는데 사용될 수 있다. 일부 구현예에서, 세포는 대상체로부터 제거되고 본 발명의 핵산 작제물에 의해 인코딩되는 융합 단백질을 포함하는 렌티바이러스 벡터는 세포의 DNA를 변형시키기 위해 생체 외로 세포에 투여된다. 그런 다음, 변형된 DNA를 운반하는 세포가 확장되어 대상체로 다시 주입된다. 특정 구현예에서, 본 발명의 핵산 작제물에 의해 인코딩되는 융합 단백질을 포함하는 렌티바이러스 벡터는 환자의 자가 T-세포를 유전적으로 변형시켜 종양 항원에 대해 특이적인 CAR를 발현하는 키메라 항원 수용체 (CAR) T-세포 요법에 사용될 수 있다. 추가적인 구현예에서, 변형된 CAR-T 세포가 생체 외에서 확장된 후 환자로 다시 주입된다. 일부 구현예에서, 변경된 T 세포는 보다 구체적으로 암 세포를 표적으로 한다. 항체 요법과는 달리, CAR-T 세포는 생체 내에서 복제할 수 있어, 장기간 지속된다.
[216] 본 발명의 렌티바이러스 벡터 또는 세포를 투여한 후 생체 외에서 변형된 본 발명의 렌티바이러스 벡터 대상체를 사용하여 대상체는 이식유전자의 발현을 검출하기 위해 모니터링된다. 용량 및 치료 기간은 치료되는 병태 또는 질병에 따라 개별적으로 결정된다. 다양한 병태 또는 질병은 본 발명의 벡터에서 관심 유전자의 투여에 의해 생성된 유전자 발현에 기초하여 치료될 수 있다. 본 발명의 방법을 사용하여 전달되는 벡터의 투여량은 숙주 및 사용된 벡터에 의한 원하는 반응에 따라 달라질 것이다.
[217] 일부 유전자 요법 적용에서, 유전자 요법 벡터는 특정 조직 유형에 대해 고도의 특이성을 가지며 전달되는 것이 바람직하다. 따라서, 바이러스 벡터는 바이러스의 외부 표면에 바이러스 외피 단백질과의 융합 단백질로서 리간드를 발현함으로써 주어진 세포 유형에 대해 특이성을 가지도록 변형될 수 있다. 리간드는 관심 세포 유형에 존재하는 것으로 알려진 수용체에 대해 친화력을 가지도록 선택된다.
[218] 본 발명의 양태는 외인성 핵산 서열을 유기체의 게놈 DNA 내로 삽입하는 방법에 관한 것이며, 다음의 단계를 포함한다: 유기체의 게놈에서 특정 게놈 DNA 서열을 식별하는 단계; 본 발명의 핵산 작제물을 포함하는 렌티바이러스 입자를 유기체에 투여하여 특정 게놈 DNA 서열에 결합시키고 외인성 핵산을 게놈 DNA 내로 삽입하는 단계; 여기서 외인성 핵산은 특정 게놈 DNA 서열에 통합된다.
[219] 본 발명의 특정 양태는 또한 외인성 핵산 서열의 단일 카피 또는 다중 카피를 세포 내로 제어된, 부위-특이적 통합 방법에 관한 것이며, 상기 방법은 (a) 본 발명의 핵산 작제물, 벡터 또는 융합 단백질을 세포에 전달하는 단계, 및 (b) 외인성 핵산을 세포에 전달하는 단계를 포함하고; 여기서 세포의 게놈에서 특정 게놈 DNA 서열에 대한 융합 단백질의 결합은 게놈의 절단 및 게놈 내로 외인성 핵산의 하나 이상의 카피를 세포의 통합을 초래한다. 일부 양태에서, 세포로의 전달은 렌티바이러스 입자에 의해 이루어진다.
XII. 사용/적용 방법
[220] 통합 부위에 대해 태스트하고 지시되는 통합을 위한 최상의 기구를 선별하기 위해 몇 가지 전략이 사용될 수 있다.
[221] 본 명세서에 개시된 변형된 인테그라제 및 트랜스포존의 분석을 위해, 프로모터, GFP의 코딩 서열의 절반 및 게놈에서 표적화된 삽입 부위의 다운스트림에 스플라이스 부위 공여자를 가지는 리포터 세포주가 사용될 수 있다. 예를 들어, 렌티바이러스 페이로드는 융합 인테그라제 변이체에 이어 역 스플라이스 부위 수용체 및 GPF의 나머지 절반을 가질 수 있다. GFP의 발현은 직접 삽입이 일어나고 삽입 부위 및 통합된 페이로드로부터 생성된 mRNA를 포함하는 GFP의 스플라이싱이 전체 GFP CDS를 만들어 낼때 발생한다.
[222] VPR 트랜스 보완 시스템은 또한 통합 돌연변이체를 선별 및 비교하는데 사용될 수 있다. 트랜스 보완 시스템은 융합 인테그라제 변이체를 포함하는 렌티바이러스 페이로드의 표적화된 삽입을 위해 사용될 수 있으며, 이는 입자에서 발현되고 로딩될 때 자체 통합을 촉진하여 VPR 융합을 사용하여 바이러스 입자에 로딩될 것이다. 이것은 입자 제조에 사용되는 패키징 벡터에 코딩되는 통합 결함 IN을 교차로 보완할 것이다. 통합 매핑에 사용될 수 있는 다른 방법으로는 including IC, 또는 FISH 프로브를 포함한다. 표적화된 삽입은 또한 TCRa 또는 RFP 표적 중단 또는 표적 스플라이스 사이트 통합에 의한 GFP 활성화로 스크리닝될 수 있다.
[223] 염색질에서 삽입 및 표적 영역의 동시 염색을 위한 FISH 접근 방식의 경우, Hek293T 게놈에서 GOI 트랜스포존을 국소화하기 위한 형광 제자리(in situ) 혼성화가 수행될 수 있다. Hek293T는 1) GOI- 트랜스포존 2) 프로그래밍 가능한 트랜스포사제 및 3) PPP1R12에 대한 gRNA로 형질감염될 수 있다. 프로브는 PPP1R12 유전자, CD46 유전자 (음성 대조군) 및 GOI를 표적화하도록 설계되며, PCR 증폭된 DNA로부터 Nick Translation Mix (Sigma)으로 합성될 수 있다.
[224] 일부 구현예에서, 본 명세서에 개시된 변형된 트랜스포사제 또는 변형된 인테그라제를 포함하는 융합 단백질은 예를 들어, Genetrap 검정에 의해 결정된 바와 같이 상응하는 야생형 단백질을 포함하는 융합 단백질에 비해, 게놈 내로 외인성 핵산의 삽입 특이성을 개선한다. 일부 구현예에서, HEK293T 세포, 또는 임의의 다른 허용가능한 세포는, 다음의 플라스미드 또는 페이로드를 가지는 렌티바이러스 입자로 형질감염 또는 형질도입된다: (i) DNA의 특이적 영역을 표적으로 하는 gRNA를 포함하는 플라스미드, (ii) 변형된 트랜스포사제 융합 단백질 또는 변형된 인테그라제 융합 단백질을 인코딩하는 본 발명의 핵산 작제물을 포함하는 플라스미드, 및 (iii) 프로모터가 결여된 리포터 단백질, 예를 들어, GFP를 인코딩하는 핵산 서열을 포함하는 유전자트랩 플라스미드 . 일부 구현예에서, 유전자트랩 플라스미드는 역반복체를 가지는 트랜스포존을 추가적으로 포함한다.
[225] 일부 구현예에서, GFP 삽입을 포함하는 세포 백분율은 유세포 분석에 의해 결정될 수 있다. 일부 구현예에서, 프로그래밍 가능한 트랜스포사제 융합 단백질은 GFP의 삽입을 포함하는 세포의 백분율을 상응하는 야생형 단백질에 비해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 또는 적어도 30% 증가시킨다. 일부 구현예에서, 프로그래밍 가능한 트랜스포사제 융합 단백질은 GFP의 삽입을 포함하는 세포 백분율을 약 15-30% 증가시킨다.
[226] 일부 구현예에서, 표적화된 부위에서의 삽입 백분율 및 표적 부위에서의 커버리지 백분율 (삽입 부위당 리드 수)는 게놈 DNA 추출 및 바이러스 LTR에 대해 특이적인 올리고뉴클레오타이드를 사용한 표적화된 시퀀싱에 의해 결정될 수 있다. 일부 구현예에서, 변형된 트랜스포사제 융합 단백질은 표적화된 부위에서의 삽입 백분율을 상응하는 야생형 단백질에 비해 적어도 10 배, 적어도 20 배, 적어도 30 배, 적어도 40 배, 적어도 50 배, 적어도 60 배, 적어도 70 배, 적어도 80 배, 적어도 90 배, 또는 적어도 100 배 증가시킨다. 일부 구현예에서, 표적화된 부위에서의 삽입 백분율은 약 10-100 배 증가한다. 일부 구현예에서, 변형된 트랜스포사제 융합 단백질은 표적 부위에서의 커버리지 백분율 (삽입 부위당 리드 수)를 상응하는 야생형 단백질에 비해 적어도 10 배, 적어도 20 배, 적어도 30 배, 적어도 40 배, 적어도 50 배, 적어도 60 배, 적어도 70 배, 적어도 80 배, 적어도 90 배, 적어도 100 배, 적어도 110 배, 적어도 120 배, 적어도 130 배, 적어도 140 배, 적어도 150 배, 적어도 160 배, 적어도 170 배, 적어도 180 배, 적어도 190 배, 또는 적어도 200 배 증가시킨다. 일부 구현예에서, 표적 부위에서의 커버리지 백분율 (삽입 부위당 리드 수)은 적어도 100 배 증가한다.
[227] 일부 구현예에서, 변형된 인테그라제 융합 단백질은 GFP 통합에 의해 정량화된 바와 같이 상응하는 야생형 단백질에 비해 게놈 내로의 외인성 핵산의 삽입 특이성을 개선한다. 일부 구현예에서, 변형된 인테그라제 융합 단백질을 포함하는 렌티바이러스는 HEK293T 세포, 또는 임의의 다른 허용가능한 세포를, (i) GFP를 인코딩하는 핵산 서열을 포함하는 핵산 서열을 포함하는 플라스미드, (ii) 패키징 단백질을 포함하는 플라스미드, (iii) 외피 단백질을 포함하는 플라스미드, 및 (iv) 변형된 인테그라제 융합 단백질을 인코딩하는 핵산 작제물을 포함하는 플라스미드로 형질감염시킴으로써 생성하였다. 렌티바이러스를 포함하는 상청액을 형질감염 후 48 시간에 수집하였다.
[228] 표적화된 삽입을 위해, HEK293T 세포를 변형된 인테그라제 융합 단백질을 포함하는 렌티바이러스로 감염시켰다. 일부 구현예에서, 감염 후 3, 5, 7, 10, 및 12 일에 유세포 분석에 의해 GFP 양성 세포의 백분율을 정량화되었다. 일부 구현예에서, 변형된 인테그라제 융합 단백질은 GFP의 삽입을 포함하는 세포 백분율율 상응하는 야생형 단백질에 비해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 또는 적어도 30% 증가시킨다.
[229] 일부 구현예에서, 표적화된 부위에서의 삽입 백분율 및 표적 부위에서의 커버리지 백분율 (삽입 부위당 리드 수)는 게놈 DNA 추출 및 바이러스 삽입된 LTR에 대해 특이적인 올리고뉴클레오타이드를 사용한 표적화된 시퀀싱에 의해 결정될 수 있다. 일부 구현예에서, 변형된 인테그라제 융합 단백질은 표적화된 부위에서의 삽입 백분율을 상응하는 야생형 단백질에 비해 적어도 10 배, 적어도 20 배, 적어도 30 배, 적어도 40 배, 적어도 50 배, 적어도 60 배, 적어도 70 배, 적어도 80 배, 적어도 90 배, 또는 적어도 100 배 증가시킨다. 일부 구현예에서, 변형된 인테그라제 융합 단백질은 표적 부위에서의 커버리지 백분율 (삽입 부위당 리드 수)를 상응하는 야생형 단백질에 비해 적어도 10 배, 적어도 20 배, 적어도 30 배, 적어도 40 배, 적어도 50 배, 적어도 60 배, 적어도 70 배, 적어도 80 배, 적어도 90 배, 적어도 100 배, 적어도 110 배, 적어도 120 배, 적어도 130 배, 적어도 140 배, 적어도 150 배, 적어도 160 배, 적어도 170 배, 적어도 180 배, 적어도 190 배, 또는 적어도 200 배 증가시킨다.
[230] 본 발명의 융합 단백질을 포함하는 렌티바이러스 벡터의 가능한 적용은 유전자 요법, 즉 임의의 포유동물 세포, 특히 인간 세포에서의 유전자 전달을 포함한다. 간, 췌장, 근육, 심장 등과 같은 말초 기관 또는 중추 기관에 속하는 세포 또는 정지 세포일 수 있다. 유전자 요법은 단백질, 예를 들어 신경 영양 인자, 효소, 전사 인자, 수용체, 등을 발현시키도록 할 수 있다. 본 발명에 따른 렌티바이러스 벡터는 또한 연구 목적에 특히 적합할 수 있다.
[231] 일부 구현예에서, 본 발명의 핵산 작제물, 융합 단백질, 및/또는 렌티바이러스 벡터는 질병을 치료하기 위해 대상체에 투여된다. 일부 구현예에서, 질병은 유전자 요법으로부터 이익을 얻을 수 있는 유전적 장애이다.
[232] 일부 구현예에서, 본 발명에 따른 융합 단백질을 포함하는 렌티바이러스 벡터는 약제로서 사용될 수 있다. 본 발명에 따른 렌티바이러스 벡터는 대상체에서 유전적 질병을 치료하는데 특히 적합할 수 있다.
XIII. 조성물 및 키트
[233] 본 발명은 또한 본 명세서에 기재된 바와 같은 개시된 방법을 수행하기 위한 조성물을 제공한다. 일부 구현예에서, 조성물은 본 명세서에 정의된 바와 같은 핵산 작제물 또는 벡터, 및 패키징 벡터에 포함된 또는 이에 결합된, 게놈에서 삽입을 위한 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열을 포함한다.
[234] 일부 구현예에서, 전달 방법에 따라, 핵산 작제물은 RNA, DNA 또는 단백질의 형태이며, 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열은 RNA 또는 DNA의 형태이다. 구체적으로, 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열은 RNA이 형태이다.
[235] 일부 구현예에서, 조성물은 바이러스를 가지지 않으며, 패키징 벡터는 나노입자 예를 들어 고분자 또는 지질 나노입자이다. 패키징 벡터는 또한 조성물의 요소에 결합된 캐리어일 수 있다. 일부 구현예에서, 조성물은 바이러스 벡터, 구체적으로 렌티바이러스 입자에 포함된다.
[236] 일부 구현예에서, 조성물은 (a) RNA 형태의 본 명세서에 기재된 핵산 작제물 (예를 들어 Cas9 및 트랜스포사제 포함), (b) 필요한 경우, 가이드 RNA (예를 들어 별도의 선형 단일 가닥 RNA 분자로서), 및 (c) 패키징 벡터에 포함된 또는 이에 결합된 (예를 들어 벡터에) DNA 형태의 삽입을 위한 외인성 유전자를 포함하는 폴리뉴클레오타이드를 포함한다.
[237] 일부 구현예에서, 조성물은 (a) 단백질 형태의 본 명세서에 기재된 융합 단백질 (예를 들어 Cas9 및 트랜스포사제 포함), (b) 필요한 경우 가이드 RNA (예를 들어 별도의 선형 단일 가닥 RNA 분자로서), (여기서 융합 단백질 및 가이드 RNA는 리보핵단백질 복합체 (RNP)를 형성하고), 및 (c) 패키징 벡터에 포함된 또는 이에 결합된 (예를 들어 벡터에) DNA 형태의 삽입을 위한 외인성 유전자를 포함하는 폴리뉴클레오타이드를 포함한다.
[238] 일부 구현예에서, 조성물은 (a) DNA의 형태의 본 명세서에 기재된 핵산 작제물 (예를 들어 Cas9 및 트랜스포사제 포함), (b) 필요한 경우 가이드 RNA (예를 들어 별도의 선형 RNA 분자로 또는 벡터 내 DNA로서), 및 (c) 패키징 벡터에 포함된 또는 이에 결합된 (예를 들어 벡터에) DNA 형태의 삽입을 위한 외인성 유전자를 포함하는 폴리뉴클레오타이드를 포함한다.
[239] 일부 구현예에서, 조성물은 (a) 단백질 형태의 본 명세서에 기재된 융합 단백질 (예를 들어 Cas9 및 인테그라제 포함), (b) 필요한 경우 가이드 RNA (예를 들어 융합 단백질과 복합체를 형성한 별도의 RNA 분자), 및 (c) 삽입, 패키징 벡터에 포함된 또는 이에 결합된, 삽입을 위한 외인성 유전자를 포함하는 폴리뉴클레오타이드를 포함한다. 구체적인 구현예에서, 패키징 벡터는 렌티바이러스 입자이다. 일부 구현예에서, (a) 융합 단백질은 gag-pol 또는 VPR (바이러스 단백질 R)에 의해 렌티바이러스 캡시드에 결합된다. 일부 구현예에서, (c) 폴리뉴클레오타이드는 인테그라제의 페이로드로서 RNA의 형태이다.
[240] 구체적인 구현예에서, ZFP가 사용되는 경우, (b) 가이드 RNA는 요구되지 않는다.
[241] 또한 본 명세서에 기재된 바와 같이 개시된 방법을 수행하기 위한 키드가 본 명세서에 의해 제공된다. 키트는 본 명세서에 기재된 핵산 작제물 또는 융합 단백질을 포함할 수 있다. 일부 양태에서, 키트는 본 명세서에 기재된 핵산 작제물 또는 융합 단백질을 포함하는 렌티바이러스 입자를 포함할 수 있다.
[242] 대상 키트는 대상 방법을 실시하기 위해 키트의 구성요소를 사용하기 위한 지침을 추가적으로 포함할 수 있다. 대상 방법을 실시하기 위한 지침은 일반적으로 적합한 기록 매체에 기록된다. 예를 들어, 지침은 종이 또는 플라스틱, 등과 같은 기재에 프린팅될 수 있따. 이와 같이, 지침은 키트의 용기 또는 이의 구성요소의 라벨링 (즉, 패키징 또는 서브패키징과 관련), 등에 패키지 삽입물로서 키트에 존재할 수 있다. 다른 구현예에서, 지침은 적합한 컴퓨터 판독 저장 매체, 예를 들어 CD-ROM, 디스켓, 등에 존재하는 전자 저장 데이터 파일로서 존재한다. 또 다른 구현예에서, 실제 지침은 키트에 존재하지 않지만, 예를 들어 인터넷을 통해 원격 소스로부터 지침을 얻기 위한 수단이 제공된다. 이러한 구현예의 예시는 지침을 볼 수 있고 및/또는 지침을 다운로드할 수 있는 웹 주소를 포함하는 키트이다. 지침과 마찬가지로, 지침을 얻기 위한 상기 수단은 적절한 기재에 기록된다.
XIV. 구현예
[243] E1. 다음을 포함하는 핵산 작제물:
a) 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 제1 폴리뉴클레오타이드 서열;
b) 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 제2 폴리뉴클레오타이드 서열로서, 제2 DNA 결합 단백질은 (i) 야생형 인테그라제에 대해 변형된 인테그라제 또는 (ii) 야생형 트랜스포사제에 대해 변형된 트랜스포사제인 서열; 및
c) 링커를 인코딩하는 핵산을 포함하는 제3 폴리뉴클레오타이드 서열;
여기서 핵산 작제물은 제1 DNA 결합 단백질, 제2 DNA 결합 단백질, 및 제1 DNA 결합 단백질과 제2 DNA 결합 단백질 사이의 링커를 포함하는 융합 단백질을 인코딩하는 것인 핵산 작제물.
[244] E2. 구현예 E1에 있어서, 제2 DNA 결합 단백질은 상응하는 야생형 단백질에 비해 게놈 내로의 외인성 핵산의 삽입 특이성을 개선하도록 변형된 것인 핵산 작제물.
[245] E3. 구현예 E1 또는 E2에 있어서, 삽입을 위한 외인성 핵산은 최대 약 20kb의 길이일 수 있는 것인 핵산 작제물.
[246] E4. 구현예 E1 또는 E3 중 어느 한 구현에에 있어서, 제1 폴리뉴클레오타이드 서열은 아연 집게 단백질, Cas9 단백질, 및 임의의 변이체 또는 이의 기능적 단편으로 구성된 군으로부터 선택되는 단백질을 인코딩하는 것인 핵산 작제물.
[247] E5. 구현예 E4에 있어서, Cas9 단백질은 인간 Cas9, 닉카제 Cas9, 스트렙토코커스 피오게네스 Cas9, 스타필로코커스 아우레우스 Cas9, Cas12a, Cas12b, 및 멸실 Cas 9로 구성된 군으로부터 선택되는 것인 핵산 작제물.
[248] E6. 구현예 E4에 있어서, 아연 집게 단백질은 C2H2 아연 집게 단백질인 것인 핵산 작제물.
[249] E7. 구현예 E1-E6 중 어느 한 구현에에 있어서, 변형된 인테그라제는 변형된 인간 면역결핍 바이러스 (HIV) 인테그라제 또는 이의 기능적 단편인 것인 핵산 작제물.
[250] E8. 구현예 E7에 있어서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 아미노산 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[251] E9. 구현예 E8에 있어서, 변형된 HIV 인테그라제 돌연변이는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R 중 하나 이상을 포함하는 것인 핵산 작제물.
[252] E10. 구현예 E7-E9 중 어느 한 구현에에 있어서, 변형된 HIV 인테그라제는 서열 번호 3에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 핵산 작제물.
[253] E11. 구현예 E1-E6 중 어느 한 구현에에 있어서, 변형된 트랜스포사제는 변형된 프로그 프린스, 변형된 슬리핑 뷰티, 변형된 과활성 슬리핑 뷰티 (SB100X), 변형된 PiggyBac, 변형된 과활성 PiggyBac, 및 임의의 이의 기능적 단편으로 구성된 군으로부터 선택되는 것인 핵산 작제물.
[254] E12. 구현예 E11에 있어서, 변형된 트랜스포사제는 변형된 과활성 PiggyBac 또는 이의 기능적 단편인 것인 핵산 작제물.
[255] E13. 구현예 E12에 있어서, 변형된 과활성 PiggyBac는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 아미노산 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[256] E14. 구현예 E13에 있어서, 변형된 과활성 PiggyBac 돌연변이는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L 중 하나 이상을 포함하는 것인 핵산 작제물.
[257] E15. 구현예 E12-E14 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac은 서열 번호 10에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 핵산 작제물.
[258] E16. 구현예 E1-E15 중 어느 한 구현에에 있어서, 링커는 XTEN 서열 또는 GGS 서열을 포함하는 것인 핵산 작제물.
[259] E17. 구현예 E1-E16 중 어느 한 구현에에 있어서, 링커를 인코딩하는 핵산은 약 9 내지 약 150 개의 핵산 길이인 것인 핵산 작제물.
[260] E18. 구현예 E1-E17 중 어느 한 구현에에 있어서, 제1 폴리뉴클레오타이드 서열의 3' 말단은 핵산 링커에 의해 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물.
[261] E19. 구현예 E1-E17 중 어느 한 구현에에 있어서, 제2 폴리뉴클레오타이드 서열의 3' 말단은 핵산 링커에 의해 제1 폴리뉴클레오타이드 서열의 5' 말단에 연결되는 것인 핵산 작제물.
[262] E20. 구현예 E1-E19 중 어느 한 구현에의 핵산 작제물을 포함하는 벡터로서, 발현 벡터는 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 것인 벡터.
[263] E21. 구현예 E1에 있어서,
a) 제1 폴리뉴클레오타이드 서열은 Cas 9 단백질을 인코딩하고;
b) 제2 폴리뉴클레오타이드 서열은 변형된 과활성 PiggyBac 또는 이의 기능적 단편인 것인 변형된 트랜스포사제를 인코딩하는 것인 핵산 작제물.
[264] E22. 구현예 E21에 있어서, Cas 9 단백질은 인간 Cas 9, 닉카제 Cas 9, 스트렙토코커스 피오게네스 Cas 9, 스타필로코커스 아우레우스 Cas 9, Cas12a, Cas12b, 및 멸실 Cas 9로 구성된 군으로부터 선택되는 것인 핵산 작제물.
[265] E23. 구현예 E21 또는 E22 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 아미노산 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[266] E24. 구현예 E23에 있어서, 변형된 과활성 PiggyBac 돌연변이는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L 중 하나 이상을 포함하는 것인 핵산 작제물.
[267] E25. 구현예 E21 또는 E22 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac은 서열 번호 10에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 핵산 작제물.
[268] E26. 구현예 E21-E25 중 어느 한 구현에에 있어서, 링커를 을인코딩하는 핵산은 XTEN 서열 또는 GGS 서열을 포함하는 것인 핵산 작제물.
[269] E27. 구현예 E21-E26 중 어느 한 구현에에 있어서, 링커를 인코딩하는 핵산은 9 내지 150 개의 핵산 길이인 것인 핵산 작제물.
[270] E28. 구현예 E22-E27 중 어느 한 구현에에 있어서, 제2 폴리뉴클레오타이드 서열의 3' 말단은 링커에 의해 제1 폴리뉴클레오타이드 서열의 5' 말단에 연결되는 것인 핵산 작제물.
[271] E29. 구현예 E1에 있어서,
a) 제1 폴리뉴클레오타이드 서열은 아연 집게 단백질을 인코딩하고;
b) 제2 폴리뉴클레오타이드 서열은 변형된 인테그라제 또는 이의 기능적 단편을 인코딩하는 것인 핵산 작제물.
[272] E30. 구현예 E29에 있어서, 아연 집게 단백질은 C2H2 아연 집게 단백질인 것인 핵산 작제물.
[273] E31. 구현예 E29 또는 E30에 있어서, 변형된 인테그라제는 변형된 인간 면역결핍 바이러스 (HIV) 인테그라제 또는 이의 기능적 단편인 것인 핵산 작제물.
[274] E32. 구현예 E31에 있어서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 아미노산 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[275] E33. 구현예 E32에 있어서, 변형된 HIV 인테그라제 돌연변이는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R 중 하나 이상을 포함하는 것인 핵산 작제물.
[276] E34. 구현예 E31-E33 중 어느 한 구현에에 있어서, 변형된 HIV 인테그라제는 서열 번호 3에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 핵산 작제물.
[277] E35. 구현예 E29-E34 중 어느 한 구현에에 있어서, 링커는 XTEN 서열 또는 GGS 서열을 포함하는 것인 핵산 작제물.
[278] E36. 구현예 E29-E35 중 어느 한 구현에에 있어서, 링커를 인코딩하는 핵산은 9 내지 150 개의 핵산 길이인 것인 핵산 작제물.
[279] E37. 구현예 E29-E37 중 어느 한 구현에에 있어서, 제2 폴리뉴클레오타이드 서열의 3' 말단은 링커에 의해 제1 폴리뉴클레오타이드 서열의 5' 말단에 연결되는 것인 핵산 작제물.
[280] E38. 구현예 E21-E37 중 어느 한 구현에의 핵산 작제물을 포함하는 벡터로서, 발현 벡터는 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 것인 벡터.
[281] E39. 구현예 E1-E38 중 어느 한 구현예의 핵산 작제물 또는 벡터를 포함하는 숙주 세포.
[282] E40. 다음을 포함하는 융합 단백질:
게놈에서 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질;
외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질로서, 여기서 제2 DNA 결합 단백질은 야생형에 대해 변형된 인테그라제 또는 트랜스포사제인 것인 단백질; 및
제1 단백질과 제2 단백질을 연결하는 링커.
[283] E41. 구현예 E40에 있어서, 제2 DNA 결합 단백질은 상응하는 야생형 단백질에 비해 게놈 내로의 외인성 핵산의 삽입 특이성을 개선하도록 변형된 것인 융합 단백질.
[284] E42. 구현예 E40 또는 E41 중 어느 한 구현에에 있어서, 외인성 핵산은 최대 약 20kb의 길이일 수 있는 것인 융합 단백질.
[285] E43. 구현예 E40-E42 중 어느 한 구현에에 있어서, 제1 DNA 결합 단백질은 아연 집게 단백질, Cas 9 단백질, 및 임의의 변이체 또는 이의 기능적 단편 일부로 구성된 군으로부터 선택되는 것인 융합 단백질.
[286] E44. 구현예 E43에 있어서, Cas 9 단백질은 인간 Cas 9, 닉카제 Cas 9, 스트렙토코커스 피오게네스 Cas 9, 스타필로코커스 아우레우스 Cas 9, Cas12a, Cas12b, 및 멸실 Cas 9로 구성된 군으로부터 선택되는 것인 융합 단백질.
[287] E45. 구현예 E43에 있어서, 아연 집게 단백질은 C2H2 아연 집게 단백질인 것인 융합 단백질.
[288] E46. 구현예 E40-E45 중 어느 한 구현에에 있어서, 변형된 인테그라제는 변형된 인간 면역결핍 바이러스 (HIV) 인테그라제 또는 이의 기능적 단편인 것인 융합 단백질.
[289] E47. 구현예 E46에 있어서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 아미노산 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273 중 하나 이상의 돌연변이를 포함하는 것인 융합 단백질.
[290] E48. 구현예 E47에 있어서, 변형된 HIV 인테그라제 돌연변이는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R 중 하나 이상을 포함하는 것인 융합 단백질.
[291] E49. 구현예 E46-E48 중 어느 한 구현에에 있어서, 변형된 HIV 인테그라제는 서열 번호 3에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 융합 단백질.
[292] E50. 구현예 E40-E45 중 어느 한 구현에에 있어서, 변형된 트랜스포사제는 변형된 프로그 프린스, 변형된 슬리핑 뷰티, 변형된 과활성 슬리핑 뷰티 (SB100X), 변형된 PiggyBac, 변형된 과활성 PiggyBac, 및 임의의 이의 기능적 단편으로 구성된 군으로부터 선택되는 것인 융합 단백질.
[293] E51. 구현예 E50에 있어서, 변형된 트랜스포사제는 변형된 과활성 PiggyBac 또는 이의 기능적 단편인 것인 융합 단백질.
[294] E52. 구현예 E51에 있어서, 변형된 과활성 PiggyBac는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 아미노산 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594 중 하나 이상의 돌연변이를 포함하는 것인 융합 단백질.
[295] E53. 구현예 E52에 있어서, 변형된 과활성 PiggyBac 돌연변이는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L 중 하나 이상을 포함하는 것인 융합 단백질.
[296] E54. 구현예 E50-E53 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac은 서열 번호 10에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 융합 단백질.
[297] E55. 구현예 E40-E54 중 어느 한 구현에에 있어서, 링커는 XTEN 서열 또는 GGS 서열을 포함하는 것인 융합 단백질.
[298] E56. 구현예 E40-E55 중 어느 한 구현에에 있어서, 링커는 3 내지 50 개의 아미노산 길이인 것인 융합 단백질.
[299] E57. 구현예 E40에 있어서,
a) 제1 DNA 결합 단백질은 Cas 9 단백질이고;
b) 제2 DNA 결합 단백질은 변형된 과활성 PiggyBac 또는 이의 기능적 단편인 것인 융합 단백질.
[300] E58. 구현예 E57에 있어서, Cas 9 단백질은 인간 Cas 9, 닉카제 Cas 9, 스트렙토코커스 피오게네스 Cas 9, 스타필로코커스 아우레우스 Cas 9, Cas12a, Cas12b, 및 멸실 Cas 9로 구성된 군으로부터 선택되는 것인 융합 단백질.
[301] E59. 구현예 E57 또는 E58 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 아미노산 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594 중 하나 이상의 돌연변이를 포함하는 것인 융합 단백질.
[302] E60. 구현예 E59에 있어서, 변형된 과활성 PiggyBac 돌연변이는 과활성 PiggyBac 서열 (서열 번호 9)의 아미노산 번호에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L 중 하나 이상을 포함하는 것인 융합 단백질.
[303] E61. 구현예 E57-E60 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac은 서열 번호 10에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 융합 단백질.
[304] E62. 구현예 E40에 있어서,
a) 제1 DNA 결합 단백질은 아연 집게 단백질이고;
b) 제2 DNA 결합 단백질은 변형된 인테그라제 또는 이의 기능적 단편인 것인 융합 단백질.
[305] E63. 구현예 E62에 있어서, 아연 집게 단백질은 C2H2 아연 집게 단백질인 것인 융합 단백질.
[306] E64. 구현예 E62 또는 E63 중 어느 한 구현에에 있어서, 변형된 인테그라제는 변형된 인간 면역결핍 바이러스 (HIV) 인테그라제 또는 이의 기능적 단편인 것인 융합 단백질.
[307] E65. 구현예 E64에 있어서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 아미노산 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273 중 하나 이상의 돌연변이를 포함하는 것인 융합 단백질.
[308] E66. 구현예 E65에 있어서, 변형된 HIV 인테그라제 돌연변이는 야생형 HIV 인테그라제 서열 (서열 번호 1)의 아미노산 번호에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R 중 하나 이상을 포함하는 것인 융합 단백질.
[309] E67. 구현예 E62에 있어서, 변형된 HIV 인테그라제는 서열 번호 3에 제시된 서열에 대해 적어도 85%, 적어도 90%, 또는 적어도 95% 상동성인 아미노산 서열을 포함하는 것인 융합 단백질.
[310] E68. 구현예 E57-E67 중 어느 한 구현에에 있어서, 링커는 XTEN 서열 또는 GGS 서열을 포함하는 것인 융합 단백질.
[311] E69. 구현예 E57-E68 중 어느 한 구현에에 있어서, 링커는 3 내지 50 개의 아미노산 길이인 것인 융합 단백질.
[312] E70. 구현예 E40-E69 중 어느 한 구현에에 있어서, 제2 DNA 결합 단백질의 3' 말단은 링커에 의해 제1 DNA 결합 단백질의 5' 말단에 연결되는 것인 융합 단백질.
[313] E71. 구현예 E40-E69 중 어느 하나의 융합 단백질을 포함하는 것인 렌티바이러스 입자.
[314] E72. 유전자 편집을 위한 렌티바이러스 입자의 생성 방법으로서, 숙주 세포에서 다음을 발현시키는 단계를 포함하는 방법:
a) 구현예 E1-E38 중 어느 하나의 핵산 작제물을 포함하는 폴리뉴클레오타이드; 및
b) 렌티바이러스 외피에 대한 단백질을 인코딩하는 폴리뉴클레오타이드.
[315] E73. 구현예 E72에 있어서, c) 외인성 핵산을 포함하는 폴리뉴클레오타이드 서열을 발현시키는 단계를 추가적으로 포함하는 방법.
[316] E74. 구현예 E72 또는 E73 중 어느 한 구현에에 있어서, 핵산 작제물을 포함하는 폴리뉴클레오타이드는 렌티바이러스 캡시드 단백질을 인코딩하는 핵산 서열을 추가적으로 포함하는 것인 방법.
[317] E75. 구현예 E72-E74 중 어느 하나의 구현예에 있어서, 숙주 세포로부터 렌티바이러스 입자를 회수하는 단계를 추가적으로 포함하는 것인 방법.
[318] E76. 구현예 E72-E75 중 어느 하나의 구현예에 있어서, 렌티바이러스 입자를 정제하는 단계를 추가적으로 포함하는 것인 방법.
[319] E77. 외인성 핵산 서열을 유기체의 게놈 DNA 내로 삽입하는 방법으로서, 구현예 E1-E38 중 어느 한 구현예의 핵산 작제물 또는 구현예 E40-E71 중 어느 한 구현예의 융합 단백질을 포함하는 렌티바이러스 입자를 유기체에 투여하여, 이로 인해 제1 및 제2 DNA 결합 단백질이 특정 게놈 DNA 서열에 결합하고 외인성 핵산을 게놈 DNA 내로 삽입하는 것을 포함하며; 여기서 외인성 핵산은 특정 게놈 DNA 서열에서 통합되는 것인 방법.
[320] E78. 다음의 단계를 포함하는, 내로의 외인성 핵산 서열의 단일 카피 또는 다중 카피의 제어된, 부위-특이적 통합 방법:
a) 구현예 E40-E71 중 어느 하나의 구현예의 융합 단백질을 세포에 전달하는 단계, 및
b) 외인성 핵산을 세포에 전달하는 단계;
여기서 세포의 게놈에서 특정 게놈 DNA 서열에 대한 융합 단백질의 결합은 게놈의 절단 및 게놈 내로 외인성 핵산의 하나 이상의 카피를 세포의 통합을 초래하고; 융합 단백질은 렌티바이러스 입자에 의해 세포로 전달되는 것인 방법.
[321] E79. 다음을 포함하는 핵산 작제물:
[322] a) 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제1 폴리뉴클레오타이드 서열로서; 여기서 제1 DNA 결합 단백질은 아연 집게 단백질 또는 Cas9 단백질인 것인 서열;
[323] b) 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제2 폴리뉴클레오타이드 서열로서, 여기서 제2 DNA 결합 단백질은
(i) 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac이거나, 또는
(ii) 인간 면역결핍 바이러스 (HIV) 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제인것인 서열; 및
[324] c) 링커를 인코딩하는 핵산을 포함하는 선택적인 폴리뉴클레오타이드 서열;
[325] 여기서 핵산 작제물은 제1 DNA 결합 단백질, 제2 DNA 결합 단백질, 및 제1 DNA 결합 단백질과 제2 DNA 결합 단백질 사이의 선택적인 링커를 포함하는 융합 단백질을 인코딩하고;
[326] 융합 단백질은 외인성 핵산을 게놈의 특정 부위에 삽입할 수 있는 것인 핵산 작제물.
[327] E80. 구현예 E79에 있어서, Cas9 단백질은 인간 Cas9, 닉카제 Cas9 및 멸실 Cas 9로 구성된 군으로부터 선택되는 것인 핵산 작제물.
[328] E81. 구현예 E79에 있어서, 아연 집게 단백질은 6 개의 도메인을 포함하는 C2H2 아연 집게 단백질인 것인 핵산 작제물.
[329] E82. 구현예 E79-E81 중 어느 한 구현에에 있어서, 링커는 XTEN 서열 또는 GGS 서열을 포함하는 것인 핵산 작제물.
[330] E83. 구현예 E79-E82 중 어느 한 구현에에 있어서, 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물.
[331] E84. 구현예 E79-E83 중 어느 한 구현에에 있어서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고, (b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac이고, 여기서 핵산 작제물은 (c) XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩하는 핵산을 포함하는 폴리뉴클레오타이드 서열을 포함하며, 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물.
[332] E85. 구현예 E79-E83 중 어느 한 구현에에 있어서, (a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고 (b) 제2 DNA 결합 단백질은 HIV 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제이고, 여기서 핵산 작제물은 (c) XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩하는 핵산을 포함하는 폴리뉴클레오타이드 서열을 포함하고, 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물.
[333] E86. 구현예 E79-E84 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 상응하는 아미노산 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[334] E87. 구현예 E86에 있어서, 변형된 과활성 PiggyBac 트랜스포사제 돌연변이는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L로부터 선택된 아미노산 변형 중 하나 이상을 포함하는 것인 핵산 작제물.
[335] E88. 구현예 E79-E84 중 어느 한 구현에에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 해당하는 아미노산 245, 275, 277, 325, 347, 351, 372, 375, 388, 450, 465, 560, 564, 573, 589, 592, 594 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[336] E89. 구현예 E88에 있어서, 변형된 과활성 PiggyBac 트랜스포사제 돌연변이는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 해당하는 R245A, R275A, R277A, R275A/R277A, G325A, N347A, N347S, S351E, S351P, S351A, R372A, K375A, R388A, D450N, W465A, T560A, S564P, S573A, M589V, S592G, 또는 F594L으로부터 선택된 아미노산 변형 중 하나 이상을 포함하는 것인 핵산 작제물.
[337] E90. 구현예 E88에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 아미노산 서열 서열 번호 9를 포함하며, 여기서: 위치 245의 아미노산은 A이고, 위치 275의 아미노산은 R 또는 A이고, 위치 277의 아미노산은 R 또는 A이고, 위치 325의 아미노산은 A 또는 G이고, 위치 347의 아미노산은 N 또는 A이고, 위치 351의 아미노산은 E, P 또는 A이고, 위치 372의 아미노산은 R이고, 위치 375의 아미노산은 A이고, 위치 450의 아미노산은 D 또는 N이고, 위치 465의 아미노산은 W 또는 A이고, 위치 560의 아미노산은 T 또는 A이고, 위치 564의 아미노산은 P 또는 S이고, 위치 573의 아미노산은 S 또는 A이고, 위치 592의 아미노산은 G 또는 S이고, 위치 594의 아미노산은 L 또는 F인 것인 핵산 작제물.
[338] E91. 구현예 E88에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 120, 121, 122, 123, 124, 125, 126, 127, 128, 및 129로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 핵산 작제물.
[339] E92. 구현예 E88에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 및 129으로 구성된 군으로부터 선택된 서열에 대해 적어도 80% 상동성을 가지는 아미노산 서열을 포함하고, 여기서 변형된 과활성 PiggyBac은 과활성 PiggyBac에 비해 게놈 내로의 DNA 통합의 높은 특이성을 나타내는 것인 핵산 작제물.
[340] E93. 구현예 E79-E83 또는 E85 중 어느 한 구현에에 있어서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제의 아미노산 서열 서열 번호 1에 해당하는 아미노산 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
[341] E94. 구현예 E93에 있어서, 변형된 HIV 인테그라제 돌연변이는 야생형 HIV 인테그라제의 아미노산 서열 서열 번호 1에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R 중 하나 이상을 포함하는 것인 핵산 작제물.
[342] E95. 구현예 E79-E95 중 어느 한 구현에의 핵산 작제물을 포함하는 벡터로서, 벡터는 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 것인 벡터.
[343] E96. 구현예 E79-E95 중 어느 하나의 구현예의 핵산 작제물 또는 벡터를 포함하는 숙주 세포.
[344] E97. 구현예 E79-E94 중 어느 하나의 구현예의 핵산 작제물의 발현으로부터 수득된 융합 단백질.
[345] E98. 구현예 E79-E95 또는 E97 중 어느 하나의 구현예의 핵산 작제물, 벡터 또는 융합 단백질, 및 게놈에 삽입하기 위한 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열을 포함하는 조성물로서, 이러한 조성물은 패키징 벡터에 함유 또는 결합되는 것인 조성물.
[346] E99. 구현예 E98에 있어서, 핵산 작제물은 RNA, DNA 또는 단백질의 형태이며, 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열은 DNA 또는 RNA의 형태인 것인 조성물.
[347] E100. 구현예 E98-E99 중 어느 한 구현에에 있어서, 패키징 벡터는 나노입자 또는 렌티바이러스 입자인 것인 조성물.
[348] E101. 외인성 핵산 서열의 단일 카피 또는 다중 카피를 세포 내로 제어된, 부위-특이적 통합 방법으로서, 상기 방법은 (a) E79-E95 또는 E97 중 어느 한 구현예의 핵산 작제물, 벡터 또는 융합 단백질을 세포에 전달하는 단계, 및 (b) 외인성 핵산을 세포에 전달하는 단계를 포함하고; 여기서 세포의 게놈에서 특정 게놈 DNA 서열에 대한 융합 단백질의 결합은 게놈의 절단 및 게놈 내로 외인성 핵산의 하나 이상의 카피를 세포의 통합을 초래하는 것인 방법.
[349] E102. A 아미노산 서열 서열 번호 9를 포함하는 변형된 과활성 PiggyBac 트랜스포사제로서, 여기서: 위치 245의 아미노산은 A이고, 위치 275의 아미노산은 R 또는 A이고, 위치 277의 아미노산은 R 또는 A이고, 위치 325의 아미노산은 A 또는 G이고, 위치 347의 아미노산은 N 또는 A이고, 위치 351의 아미노산은 E, P 또는 A이고, 위치 372의 아미노산은 R이고, 위치 375의 아미노산은 A이고, 위치 450의 아미노산은 D 또는 N이고, 위치 465의 아미노산은 W 또는 A이고, 위치 560의 아미노산은 T 또는 A이고, 위치 564의 아미노산은 P 또는 S이고, 위치 573의 아미노산은 S 또는 A이고, 위치 592의 아미노산은 G 또는 S이고, 위치 594의 아미노산은 L 또는 F인 것인 변형된 과활성 PiggyBac 트랜스포사제.
[350] E103. 구현예 E102에 있어서, 서열 번호 120, 121, 122, 123, 124, 125, 126, 127, 128, 및 129으로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 변형된 과활성 PiggyBac 트랜스포사제.
[351] E104. 구현예 E102에 있어서, 서열 번호 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 및 129으로 구성된 군으로부터 선택된 서열에 대해 적어도 80% 상동성을 가지는 아미노산 서열을 포함하고, 여기서 변형된 과활성 PiggyBac은 과활성 PiggyBac에 비해 게놈 내로의 DNA 통합의 높은 특이성을 나타내는 것인 변형된 과활성 PiggyBac 트랜스포사제.
[352] 본 명세서 전반에 걸쳐 인용될 수 있는 모든 인용 참조 (참조 문헌, 특허, 특허 출원 및 웹사이트 포함)의 내용은 본 명세서에 인용된 참조 문헌과 마찬가지로 모든 목적을 위해 그 전체가 참조에 의해 명시적으로 포함된다. 다음의 실시예는 제한의 목적이 아니라 예시를 위해 제공된다.
실시예
[353] “PB”및 “hyPB”는 과활성 PiggyBac 트랜스포사제를 지칭하도록 호환적으로 사용된다. 하기 실시예 1-3은 프로그래밍 가능한 트랜스포사제 및 Cas9의 융합 단백질의 작제물의 표적화된 통합 관점에서 생성 및 성능에 관한 것이다. 실시예 1에서, Cas9 의 상이한 버전에 융합된 트랜스포사제 과활성 PiggyBac 및 슬리핑 뷰티의 상이한 DNA 작제물을 성공적으로 생성하여, 형질감염된 세포의 게놈 내로 트랜스포존이 통합되도록 하였다. 놀랍게도, PiggyBac 및 Cas9의 작제물은 게놈의 관심 부위 내로 표적화된 통합을 촉진할 수 있었다 (실시예 2). 실시예 3은 게놈 내로의 외인성 핵산 서열 삽입의 특이성을 증가시키기 위해 생성된 변형된 트랜스포사제를 제공한다.
실시예 1: 프로그래밍 가능한 트랜스포사제 융합 단백질의 발현을 위한 DNA 벡터
[354] 본 실험은 트랜스포존 통합의 성능을 위해 뉴클레아제 (h), 닉카제 (n) 및 멸실 (d) Cas9에 대한 과활성 PiggyBac 트랜스포사제 (여기서 hyPB 또는 PB로 지칭) 및 슬리핑 뷰티 (여기서 SB100x로서 지칭)의 융합의 다양한 구성을 테스트 하는 것을 목적으로 한다. 프로그래밍 가능한 트랜스포사제 융합 단백질은 pcDNA3.3-TOPO 발현 벡터 (Invitrogen 플라스미드 백본, Addgene 플라스미드 #41815) 야생형 인간 Cas9 인코딩 DNA 서열 (hCas9), 닉카제 Cas9 (nCas9), 또는 멸실 Cas9 (dCas9) (각각 서열 번호 64-66) 및 과활성 PiggyBac (PB) 또는 과활성 슬리핑 뷰티 (SB100) 트랜스포사제 (각각 서열 번호 67-68)을 통합하여 생성하였다. Cas9의 3' 말단이 GGS 링커를 인코딩하는 핵산 링커 서열 (서열 번호 48)에 의해 트랜스포사제 각각의 5' 말단에 연결된 벡터를 생성하였다 (hCas9PB, nCas9PB, dCas9PB, hCas9SB, nCas9SB, 및 dCas9SB). 트랜스포사제 각각의 3' 말단이 GGS 링커를 인코딩하는 핵산 링커 서열 (서열 번호 48)에 의해 Cas9의 5' 말단에 연결된 다른 벡터를 생성하였다 (PBhCas9, PBnCas9, PBdCas9, SBhCas9, SBnCas9, 및 SBdCas9). 융합 작제물의 요약이 표 2에 제공된다.
표 2. 실시예 1에 의해 생성된 프로그래밍 가능한 트랜스포사제 단백질의 목록
[355] 형질감염 전에 동결된 HEK293T 세포를 37℃에서 빠르게 해동한 다음 5mL 미리 데워진 배지에 재현탁하고 1,000rpm에서 4분 동안 원심분리하여 펠릿화하였다. 펠릿을 새로운 배지에 재현탁하고 ~1.6x106 세포를 새로운 T75 플라스크에 접종하였다. 세포가 95%의 포화도(confluency)에 도달했을 때 트립신을 사용하여 계대하고 40%의 포화도에서 시딩하였다. 세포는 실험에 사용하기 전에 두 번 계대하였다.
[356] 형질감염 실험을 위해 웰당 5x105 HEK293T 세포를 완전 DMEM 배지(Dulbecco의 변형된 독수리 배지(DMEM), 10% 소 태아 혈청, 2mM 글루타민 및 100U 페니실린/0.1mg/mL 스트렙토마이신이 보충됨)가 있는 다중 웰 플레이트에 접종하였다. 형질감염 전에 배지를 2.7mL의 새로운 완전 DMEM 배지로 교체하였다. Opti-MEM I Reduced 혈청 배지를 플라스미드의 각 조합뿐만 아니라 선형 폴리에틸렌이민(PEI 25K) 용액 1mg/mL와 혼합하였다. PEI 25K(μg):전체 DNA(μg)의 3:1 비율을 사용하였다. 두 용액을 혼합하고 실온에서 15분 동안 인큐베이션하였다. 인큐베이션 후, 혼합물 300μL를 세포에 적가하였다. 형질감염 24시간 후, 배지를 새로운 완전 배지로 교체하였다. 유세포 분석 또는 세포 분류 및 DNA 추출을 위해 형질감염 후 세포를 수확하였다.
[357] HEK293T 세포를 표 2로부터 프로그래밍 가능한 트랜스포사제 융합 단백질을 인코딩하는 플라스미드, 통합되는 핵산을 인코딩하는 플라스미드, RFP (적색 형광 단백질) 또는 GFP (녹색 형광 단백질) 트랜스포존, 및 인간 게놈의 AAVS1 부위 (아데노-관련 바이러스 통합 부위 1)에 대해 표적화된 가이드 RNA으로 공동 형질감염시켰다. 과활성 PiggyBac 및 SB100을 양성 대조군으로 사용하였고 트랜스포존 단독은 에피솜 발현 검출 (즉, 삽입되지 않은 플라스미드로부터의 발현)을 위한 음성 대조군으로 사용하였다. 형광은 14일까지 유세포 분석에 의해 분석되었으며, 그 이후에는 에피솜 형광은 검출할 수 없었다. 그런 다음 세포를 GFP 발현에 의해 분류하고 분류 2일 후, 표적 DNA의 통합을 형광 세포의 백분율을 계수함으로써 정량화하였다.
[358] 결과 및 결론: Cas9-PB 융합에 대한 결과가 도 1A 및 도 1C에 도시되며; Cas9-SB100 융합에 대한 결과가 도 1B에 도시된다. 과활성 PiggyBac에 대해 융합된 인간 Cas9 (hCas9PB) 및 과활성 PiggyBac에 대해 융합된 닉카제 Cas9 (nCas9PB)는 형광 세포의 백분율을 14 일 이후 RFP 음성 대조군에 비해 약 8% 증가시켰다 (도 1A, 1C). 따라서, 상기 융합 단백질은 외인성 DNA를 세포 게놈에 성공적으로 통합할 수 있었다. 테스트된 Cas9-슬리핑 뷰티 융합 단백질은 14일 후에 에피솜 GFP 음성 대조군보다 더 많은 형광 세포를 생성할 수 없었다 (도 1B).
실시예 2: 프로그래밍 가능한 트랜스포사제 융합 단백질의 표적화된 전위 효율
[359] 전술한 실시예에 이어, 실시예 1에서 전체 삽입이 가장 우수한 구성으로 (비표적화에 대한) 표적화된 삽입이 있는지 여부를 연구하였. 이를 위해, HEK293T를 hCas9PB 또는 nCas9PB를 인코딩하는 플라스미드 (pSico), 역반복부 및 프로모터가 없는 GFP를 가지는 트랜스포존을 인코딩하는 유전자트랩 플라스미드, 및 AAVS1 부위 또는 인간 게놈 상의 프로모터 이후 CD46 유전자 내의 부위에 대해 표적화된 가이드 RNA (gRNA)로 리포펙타민 3000을 사용하여 공동 형질감염시켰다. Cas9의 3' 말단을 링커 (서열 번호 48)에 의해 트랜스포사제의 5' 말단에 연결하였다. Cas9PB 발현 벡터 구조의 예가 도 2A에 도시되어 있다. 트랜스포사제는 3'과 5' 반복 사이에 스플라이싱 수용체와 프로모터가 없는 GFP를 포함하였다. gRNA와 Cas9는 트랜스포사제가 트랜스포존을 프로모터 영역으로 통합하도록 지시한다. 이 접근법을 사용하면 트랜스포존이 표적 부위에 삽입되는 경우에만 세포가 형광성을 띠게 된다.
[360] 결과 및 결론: GFP 발현 세포의 백분율 정량화는 프로그래밍 가능한 트랜스포사제 융합 단백질 Cas9-PiggyBac (“표적화된 HCas9”) 및 닉카제 Cas9-PiggyBac (“표적화된 NCas9”)이 대조군 "비표적화된" (전체 삽입에 대한 대조군 (PiggyBac 단독)) 및 "에피솜" (비통합의 음성 대조군 (트랜스포존 단독))에 비해 더 높은 표적 DNA의 표적화된 전달을 가지는 것을 나타냈다 (도 2B). 이러한 경우 백그라운드보다 신호의 3배 및 4배가 증가가 상당했고; 특히 모든 세포가 트랜스포존 삽입에 필요한 모든 벡터로 효율적으로 형질전환된 것은 아니라는 점을 고려하였으며; 여기에 사용된 것과 같이 최적화되지 않은 조건에서 hyPB에 대한 무작위 삽입의 효율성은 10-15%이다.
실시예 3: 변형된 과활성 PIGGYBAC 트랜스포사제의 생성
[361] 게놈 내로의 외인성 핵산 서열 삽입의 특이성을 증가시키기 위해 변형된 PiggyBac 트랜스포사제를 생성하였다. 트랜스포사제 아미노산 돌연변이의 목록이 표 3에 제공된다.
표 3. 과활성 PiggyBac 대 과활성 PiggyBac 서열 번호 9에 대한 돌연변이 부위
[362] 하기 실시예 4에서, 아연 집게 단백질 (ZFP)이 관심 유전자의 삽입을 위한 염색체 표적 부위에 결합할 수 있다는 목적으로 여러 작제물을 생성하였다. ZFP는 DNA 결합 단백질로서 Cas9의 대체물을 구성한다. 실시예 5-13은 일반적으로 HIV-1 인테그라제 및 Cas9/ZFP의 융합 단백질 작제물의 표적화된 통합의 관점에서 생성 및 성능과 관련된다. 특히, 실시예 5에서는 ZFP와 인테그라제의 융합 단백질을 생성하였다 실시예 6-10은 실시예 11에서 생성된 인테그라제 융합 단백질과의 통합 기능의 회복을 입증하기 위한 시험관 내 연구의 기초로서 작용하도록 생성된 다양한 인테그라제 결함 패키징 시스템(즉, 비-통합 벡터)을 제공한다. 실시예 12에서, 표적화된 인테그라제 융합 단백질이 표적화된 삽입의 백분율을 증가시키는 것으로 관찰되었다.
실시예 4 표적화된 아연 집게 단백질 (ZFP)의 생성
[363] 목적은 관심 유전자의 삽입을 위한 염색체 표적 부위에 결합하는 여러 ZFP를 생성하는 것이었다. 인간 게놈 상의 AAVS1 부위 (서열 번호 40)를 표적화하기 위해 6 개의 도메인 아연 집게 단백질을 생성하였다. 표적 DNA 서열 및 상응하는 ZFP 나선이 표 4에 나타난다. 표적 부위및 ZFP를 인코딩하는 작제물을 제조하였다 (AAVS1-6d-ZFP). ZFP를 인코딩하는 핵산 및 아미노산 서열은 각각 서열 번호 32 및 33이다.
표 4. AAVS1 표적 부위 및 상응하는 ZFP 나선 목록
실시예 5: ZFP-인테그라제 융합 단백질의 생성
[364] 6개의 도메인(유효한 서열 특이적)을 갖는 ZFP를 갖는 인테라제 융합 단백질이 생성하였다. 부위 특이적 인테그라제를 생성하기 위해, 실시예 4에서 생성된 ZFP (AAVS1-6d-ZFP)를 HIV-1 인테그라제(서열 번호 1) (pZFP-AAVS1-6d-IN)와 함께 pcDNA3.1 발현 벡터에 클로닝하였다. 융합 단백질을 암호화하는 서열은 ZFP와 인테그라제 사이에 N-말단 핵 국소화 신호(서열 번호 47) 및 GGS 링커 서열(서열 번호 48)을 포함한다(도 3).
[365] 추가의 인테그라제 융합 벡터, 예컨대 pZFP-TRCa-IN (서열 번호 38 포함, TRCa 유전자좌를 표적화) 및 pZFP-AAVs1-TEX-IN (TEX 링커 (서열 번호 61) 포함)과 같은 생성하였으며, 이는 유사한 방법을 사용하여 제조하였다.
실시예 6: 결함 인테그라제를 가지는 DNA 벡터의 생성
[366] 인테그라제 결함 포장 시스템은 조작된 인테그라제를 사용한 시험관 내 연구의 기초 역할을 하기 위해 생성하였다. 비통합 패킹 플라스미드 (NILV) psPAX2에서 결함이 있는 인테그라제 작제물을 생성하였다. psPAX2 플라스미드는 단일 N64D 돌연변이 및 이중 N64D/N116D 돌연변이를 가진다. 전체 인테그라제 코딩 영역이 결여된 결실된 인테그라제(ΔIN) 플라스미드를 생성하였다. 인테그라제 코딩 서열 앞에 정지 코돈을 포함하는 비-코딩 플라스미드를 생성하였다 (하기 실시예 8). cPPT/CTS가 없는 DNA 결합 도메인 및 C-말단 도메인을 함유하는 작제물을 포함하는 절단된 인테그라제를 함유하는 플라스미드를 생성하였다 (하기 실시예 10). 일반적인 클로닝 프로토콜은 아래에 간략하게 설명된 대로 따랐다.
KAPA HiFi HotStart 프로토콜
[367] KAPA HiFi HotStart를 사용하는 PCR 실험의 경우, PCR 반응 혼합물은 KAPA HiFi PCR Kit 제조업체의 프로토콜에 따라 제조하였다. KAPA HFi PCR 반응은 Mastercycler Pro로 수행하였다.
플라스미드 DNA 추출
[368] 플라스미드 DNA는 제조사의 프로토콜에 따라 QIAprep Spin Miniprep Kit를 사용하여 추출하였다. 박테리아 배양물을 5,000rpm에서 3분 동안 원심분리하여 수확하였다. 세포 펠릿을 250μL의 버퍼 P1에 재현탁하고 250μL의 버퍼 P2로 튜브를 4-6회 뒤집어 혼합하였다. 350 μL의 버퍼 N3를 첨가하고 튜브를 뒤집어 혼합하였다. 에펜도프 튜브를 12,000rpm에서 10분 동안 원심분리하여 세포 파편과 염색체 DNA를 제거하였다. 상청액을 제공된 QIAprep 스핀 컬럼으로 옮기고 1분 동안 원심분리하였다 (12,000 rpm). 샘플을 0.5mL의 버퍼 PB와 0.75mL의 버퍼 PE로 두 번 세척하고 매번 12,000rpm에서 1분 동안 원심분리하였다. 12000rpm에서 1분 동안 추가로 원심분리하여 잔류 세척 용액 버퍼를 제거하였다. QIAprep 스핀 컬럼을 새로운 1.5ml 미세원심분리 튜브로 옮기고 50μL의 물을 첨가하여 튜브를 1분 동안 방치한 후 12,000rpm에서 1분 원심분리하여 플라스미드를 용리하였따. NanoDrop One으로 농도를 측정하였다.
플라스미드 DNA의 단리 및 정제
[369] 원하는 플라스미드를 함유하는 박테리아 균주 (DH5α 또는 DH10B)를 100 μg/mL 카베니실린을 함유하는 LB 배지에서 밤새 성장시켰다. 제조사의 프로토콜에 따라, NZYTech의 플라스미드 미니 또는 맥시 키트를 사용하여 플라스미드를 단리하였다. 플라스미드는 30 μL (miniprep) 또는 500 μL (maxiprep)의 65℃ 뜨거운 물에서 용리시켰다. 플라스미드는 -20 ℃에서 보관하였다. PCR 정제를 위해 반응 혼합물을 PCR 정제 키트를 사용하여 처리하였다. 30μL, 65℃ 뜨거운 물에서 DNA를 용출시켰다.
DNA 겔 전기영동
[370] 아가로스를 끓여 100mL TAE-완충액에 용해시켰다. 액체 젤에 100mL 아가로스 용액당 4μL 그린세이프(greensafe)를 보충하고 트레이에 부었다. DNA 준비를 시각화하기 위해 DNA를 6x 로딩 염료와 혼합하고 1% 아가로스 겔에 로딩하였다. 또한, 하나의 챔버에는 1mm 겔 레인당 1μL 유전자 사다리를 로딩하였다. 겔을 100V에서 1.5시간 동안 실행하고 반조명기를 사용하여 시각화하였다.
형질전환
[371] DH5α를 사용한 형질전환 실험의 경우, 플라스미드를 제조사의 프로토콜에 따라 50μL DH5α 세포로 형질전환시켰다. s.o.c 배지에서 회수 후, 박테리아를 30초 동안 15,000g에서 펠릿화하고 50μl LB 배지에 재현탁시켰다. 세포를 100 μg/mL 카르베니실린을 함유하는 LB-Agar 플레이트에 도말하고 37℃에서 밤새 인큐베이션하였다. 배양물을 선택하고 100㎍/mL 카베니실린을 함유하는 LB 배지에서 밤새 접종하였다. 액체 배양물은 다시 플라스미드 단리 또는 글리세롤 스톡에 사용하였다. 글리세롤 스톡의 경우 500μL 액체 배양물을 500μL 50% 글리세롤과 혼합하고 -80℃에서 보관하였다.
[372] XL-10 Gold Ultracompetent 세포를 사용한 형질전환 실험의 경우, 먼저 세포를 얼음 위에서 해동하고 45μL의 세포를 미리 냉각된 14 mL Falcon 폴리프로필렌 둥근 바닥 튜브에 추가하였다. 키트와 함께 제공된 2μL의 β혼합물을 세포에 첨가하였다. 튜브의 내용물을 부드럽게 휘젓고 세포를 얼음 위에서 10분 동안 인큐베이션하였다 (2 분마다 소용돌이). 1.5μL의 DpnI 처리된 DNA를 세포의 분취량에 첨가하고 혼합하고 얼음 위에서 30분 동안 인큐베이션하였다. 세포/DNA 혼합물을 튜브에서 42℃에서 30초 동안 열 펄스하였다. 그런 다음 튜브를 얼음 위에서 2분 동안 인큐베이션하였다. 그런 다음 0.5mL의 예열된(42℃) NZY+ 브로쓰를 각 튜브에 첨가한 다음 225-250rpm에서 진탕하면서 37℃에서 1시간 동안 인큐베이션하였다. 이어서, 혼합물을 플라스미드 벡터에 대한 적절한 항생제를 함유하는 한천 플레이트에 플레이팅하였다. DNA 추출을 위해 5개의 콜로니를 선택하고 서열을 확인하였다. 콜로니 1을 선택하고 유지하였다.
실시예 7: PPT 또는 ZFP-변형된 인테그라제 융합 단백질을 포함하는 비-통합 벡터 생성
[373] 인테그라제 (IN) 결함이 있지만 완전히 기능적인 psPAX2 플라스미드를 생성하기 위해, 폴리피리미딘 트랙 도메인 (PPT) (서열 번호 74, 렌티바이러스와 같은 모든 레트로바이러스 RNA 게놈의 후속 이중-가닥 cDNA 형성에 결정적)을 인테그라제 (psPAX2-ΔIN)을 포함하지 않는 psPAX2 벡터에 클로닝하였다. 실시예 4에서 생성된 AAVS1를 표적화하는 합성 아연 집게 작제물 (AAVS1-6d-ZFP-IN)을 psPAX2-ΔIN에 클로닝하였다. 정지 코돈(IN+PPT 및 IN+PPT(STOP))을 가지거나 또는 가지지 않는, 두 개의 다른 정방향 프라이머와 동일한 역방향 프라이머 (서열 번호 75-77)를 PPT에 대해 설계하였다. 핵 국소화 신호를 가지는 것과 가지지 않는, 2 개의 상이한 정방향 프라이머 (서열 번호 78-80) 및 동일한 역방향 프라이머를 AVS1-6d-ZFP-IN에 대해 설계하였다 (AAVS1-6d-ZFP-IN 및 AAVS1-6d-ZFP-IN(-NLS)). 삽입물은 Kappa 표준 조건, 62℃의 어닐링 온도, PPT의 경우 40초, AAVS1-6d-ZFP-IN의 경우 90초의 확장 시간을 사용하여 PCR에 의해 증폭되었다. PCR 산물은 겔 전기영동으로 분리하였다.
[374] 증폭된 산물을 정제하고 1:2.5 백본:삽입의 비율로 5주기로 조립 프로토콜을 수행하였다. 50μL의 컴피턴트 세포를 4μL의 결찰 산물로 형질전환하고 60%의 컴피턴트 세포를 카베니실린 플레이트에 접종하였다. 콜로니의 초기 검증은 제한 소화 및 DNA 겔 전기영동에 의해 결정하였다. 다음의 콜로니를 선택하였다: 콜로니 1 및 2 (IN+PPT F1+R, AAVS1-6d-ZFP-IN F1+R, AAVS1-6d-ZFP-IN(-NLS) F2+R) 및 콜로니 7 및 8 (IN+PPT(STOP) F2+R). 콜로니가 올바른 삽입물을 포함하는지 추가로 확인하기 위해 4mM Mg, 62-STS 및 NEB 표준 taq를 사용하여 콜로니 PCR을 수행하였다.
실시예 8: 정지 코돈의 삽입에 의한 비-통합 벡터의 삽입
[375] 비통합 벡터는 인테그라제 오픈 리딩 프레임(psPAX2-TAA-IN) 이전에 정지 코딩을 삽입하여 생성하였다. psPAX2-TAA-IN은 인테그라제의 시작 부분에서 프로테아제 절단 부위 뒤에 2개의 정지 코돈을 추가하여 부위 지정 돌연변이 유발에 의해 생성하였다. 부위 지정 돌연변이 유발을 위한 PCR 조건을 사용하여 psPAX2-TAA-IN을 생성하였다.
[376] PCR 후, 반응 튜브를 2분 동안 얼음 위에 놓아 냉각시켰다. 그런 다음 1μL DpnI를 각 증폭 반응에 직접 첨가하고 37℃에서 5분 동안 배양하여 모체 (돌연변이되지 않은) 이중 가닥 DNA를 분해하였다.
[377] 플라스미드 DNA를 분해하여 부위 지정 돌연변이 유발이 원치 않는 변형을 일으키지 않았음을 확인하였다. SacI 및 AgeI를 사용한 psPAX2 및 psPAX2-TAA-IN의 소화는 7,500, 1,900 및 1,300bp의 3개 밴드를 생성해야 한다. SacI 및 AgeI를 사용한 psPax2-ΔIN의 소화는 7,500, 1,300 및 800bp의 3개 밴드를 생성해야 한다. 분해 반응이 수행하였고 분해 결과 올바른 밴딩 패턴이 생성하였다.
실시예 9: 야생형 인테그라제 INTO 인테그라제 결함 벡터의 재구성
[378] 목적은 비-통합 벡터가 상이한 형태의 인테그라제 융합 단백질의 발현으로 삽입 활성을 회복할 수 있는지 여부를 확인하는 방법론을 개발하는 것이었다. psPAX2-Δ이 완전히 기능하는지 확인하기 위해 Gibson Assembly를 사용하여 벡터에 인테그라제를 첨가하였다. 백본또한, 어셈블리 사이트가 융합 "IN"을 복제하기에 좋은지 테스트하기 위해 wt-IN은 사이트 앞의 백본에 있는 IN의 추가 N-말단 (거기에 없어야 하는 Leu 포함)으로 복제하였다. 이것은 또한 이 가짜 N-말단 도메인을 피하기 위해 추가 프로테아제 표적 서열로 수행하였다. IN-1, IN-2 및 IN-3 단편을 증폭하기 위해 PCR 반응을 수행하였다.
[379] PCR 증폭 산물은 DNA 겔 전기영동으로 분리하였다. 증폭된 밴드를 정제하고 37℃에서 1:2.5 백본:삽입 및 5 사이클의 비율로 조립을 수행하였다. 50μL 적격 세포를 4μL의 결찰 생성물로 형질전환하고 카베니실린 플레이트에 접종하였다.
[380] IN-3을 포함하는 구성을 생성하기 위해, Gibson Assembly HiFi 1 단계 키트(CRG MM 사용)에 대한 표준 프로토콜에 따라 Gibson 어셈블리를 수행하였다 (SGI-DNA, Inc., www.sgidna.com/products/gibson-assembly-reagents/). 반응 혼합물을 생성하고 50℃에서 1시간 동안 조립하였다. 적격 세포는 2μL의 반응 혼합물로 형질전환시켰다.
[381] 50μL의 컴피턴트 세포를 2μL의 결찰 산물로 형질전환하고 카르베니실린 플레이트에 접종하였다.
실시예 10: C-터미널 도메인 잘린 통합을 포함하는 비-통합 벡터의 생성
[382] C-말단 도메인 (CTD) (서열 번호 74의 핵산 83-118) 및 CppT +CTD (서열 번호 74) 인테그라제 단편을 psPAX2 벡터에 클로닝하였다.
[383] PCR 증폭 산물은 DNA 겔 전기영동으로 분리하였다. CppT+CTD의 결찰은 실시예 9에서 사용된 조건을 사용하여 수행하였다.
[384] 결찰은 65 ℃에서 5주기 동안 수행하였고, 결찰 생성물을 형질전환시켰다. 콜로니가 성장하지 않았다. 다시 결찰 및 형질전환을 수행하고 IN-fw 프라이머(서열 번호 81)로 시퀀싱하여 3개의 콜로니를 확인하였다.
실시예 11: 인테그라제 융합 단백질의 생성
[385] 표적화된 인테그라제 융합 단백질은 pcDNA3.3 발현 벡터에, HIV-1 인테그라제 및 표적화된 ZFP 또는 인간 Cas9 중 하나를 통합하여 생성하였다. ZFP 또는 Cas9의 3' 말단이 핵산 링커에 의해 인테그라제의 5' 말단에 연결된 하나의 벡터를 생성하였다. 인테그라제의 3' 말단이 핵산 링커에 의해 ZFP 또는 Cas9의 5' 말단에 연결된 두 번째 벡터를 생성하였다. 사용된 링커는 13, 16, 19, 22, 25 또는 28개 아미노산 길이 범위의 XTEN 또는 GGS 이었다. ZFP-인테그라제 융합 단백질은 인간 게놈에서 AAVS1 부위 또는 T-세포 수용체 알파(TCRa) 유전자좌를 표적으로 하도록 조작하였다. Cas9-인테그라제 융합 단백질은 인간 게놈의 AAVS1 부위 또는 TCRa 유전자좌를 표적으로 하는 가이드 RNA와 조합하여 사용하였다. 변형된 인테그라제 융합 단백질의 목록이 표 5에 나타난다.
표 5. 실시예 11에 생성된 변형된 인테그라제 융합 단백질의 목록
실시예 12: 표적화된 인테그라제 융합 단백질을 가지는
인테그라제 결함 렌티바이러스의 시스 및 트랜스 보완
[386] 실시예 11의 표적화된 인테그라제 융합 단백질을 사용하여 촉매 도메인(D64V/D116N)에서 2개의 돌연변이를 갖는 IN을 발현하는 비-통합 렌티바이러스의 통합 능력의 결여를 보완하였다. 이러한 실험을 위해, 표적화된 인테그라제 융합 단백질을 pcDNA3.1 벡터에 클로닝하였다. 렌티바이러스는 세포를 pSICO (GFP 발현 페이로드), pmd2.g (VSVG for 외피 발현), pax2 (패키징 단백질 및 인테그라제 포함) 또는 NILV-pax2 (패키징 단백질 포함), 및 야생형 인테그라제 또는 표적화된 인테그라제를 포함하는 pcDNA3.1 벡터로 공동 형질감염시켜 생산하였다 (표 6).
표 6. 표적화된 인테그라제 융합 단백질을 가지는 인테그라제 결함 렌티바이러스의 보완에 대한 조건
[387] 웰당 6x105 HEK293T 세포(계대 8)를 6웰 플레이트에 접종하고 밤새 인큐베이션하였다. 바이러스 생산을 시작하기 5시간 전에 배지를 1:1000 클로로퀸 다이포스페이트 (chloroquine diphosphate, CD; 스톡 = 25mM)를 포함하는 1.7mL 배지로 교체하였다. 플라스미드는 1.6:1.32:0.72:3.32의 몰비(pSICO:pax2:VSVG:wtIN-rescue)로 감염시켰다. PEI(폴리에틸렌이민; 스톡 = 1mg/mL)는 형질감염 시약으로 사용되었으며, 3μL PEI는 형질감염에 사용된 1μg 총 DNA에 사용하였다. DNA를 83μL Opti-MEM 및 83μL PEI에 희석하고 혼합하고 실온에서 15-20분 동안 인큐베이션하였다. 각 형질감염 혼합물을 CD-배지와 함께 세포에 적가하였다. 세포를 밤새 인큐베이션하고 배지를 다음날 2.5mL 새로운 배지로 교체하였다. 다음 날 세포의 상등액을 1,000rpm에서 5분간 원심분리하고 45μM 필터를 통과시켰다. 바이러스를 포함하는 상층액은 -80℃에서 보관하였다.
[388] 첫 번째 단계는 다른 렌티바이러스 패키지가 내용물과 독립적으로 세포를 감염시키는 능력을 유지하는지 확인하는 것이었다. 바이러스 역가를 결정하기 위해 웰당 75,000개의 HEK293T 세포를 6웰 플레이트에 접종하였다. 세포는 1:100 폴리브렌과 이전에 생성된 바이러스 상청액(1:3) 500μL를 포함하는 1mL 배지의 혼합물로 감염시켰다. 다음 날 배지를 교체하였다. 다음 날, 배지를 흡인하고 200μL 트립신을 사용하여 세포를 분리하였다. 800μL의 일반 배지를 첨가하여 반응을 중단시키고 유세포 분석으로 분석하였다. 바이러스 역가는 야생형 인테그라제 렌티바이러스 (LV), 빈 바이러스 입자 (LVO), 비통합 렌티바이러스 (NILV), 야생형 인테그라제를 가지는 비통합 렌티바이러스 (NILV+IN), ZFP-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+ZP-IN(AAVS1)), Cas9-인테그라제 융합 단백질을 가지는 비통합 렌티바이러스 (NILV+Cas-IN), 및 야생형 인테그라제를 가지는 야생형 인테그라제 렌티바이러스 (LV+IN)에 대해 정량화하였다. LV 및 LVO는 각각 양성 및 음성 대조군으로 사용하였다. HEK293T 세포를 감염시키고 GFP 양성 세포의 수를 계수하여 바이러스 역가를 정량하였다(도 4). 결과: 바이러스 역가는 모든 조건에 대해 동일한 규모 내에 있었다.
[389] 다음으로, 표적 인테그라제 융합 단백질의 전체 통합 능력은 표적 삽입물의 유세포 분석 및 차세대 시퀀싱에 의해 결정하였다. HEK293T 세포는 모든 조건에 대해 동일한 감염 다중도로 감염시켰고, GFP 형광은 감염 후 3, 5, 7, 10 및 12일에 모니터링하였다. 감염 7일 후, 세포를 GFP 발현에 의해 분류하였다. 결과: 12일에, 보완되지 않은 NILV로 감염된 세포는 바이러스 생산 능력의 감소를 나타내는 더 작은 백분율의 GFP 발현 세포를 가졌다 (도 5).
[390] 테스트한 인테그라제 융합 단백질의 표적 통합 능력을 평가하기 위해 12일째에 DNeasy 혈액 및 조직 키트 프로토콜 (Qiagen)에 따라 게놈 DNA를 추출하였다. 세포 배양물을 190rpm에서 5분 동안 원심분리하여 수확하였다 (최대 5x105). 펠릿을 200μL PBS (인산염 버퍼 식염수)에 용해하였다. 20μL Proteinase K를 버퍼 AL 200μL와 함께 첨가하였다. 볼텍싱 후, 샘플을 56℃에서 10분 동안 인큐베이션하였다. 200μL 에탄올 (96-100%)을 첨가하고 짧은 볼텍싱 후, 혼합물을 DNeasy Mini 스핀 컬럼으로 옮기고 3mL 수집 튜브에 넣고 8,000rpm에서 1분 동안 원심분리하였다. 스핀 컬럼을 새로운 2mL 수집 튜브로 옮기고 500μL의 버퍼 AW1을 첨가하였다. 튜브를 8,000rpm에서 1분 동안 원심분리하였다. 완충액 AW2에 대해 이 세척 단계를 반복하였다 (3 분 원심분리). 그런 다음, 스핀을 새로운 1.5mL 마이크로 원심분리 튜브에 옮기고 버퍼 AE 200μL를 스핀 컬럼 멤브레인 중앙에 첨가하여 튜브를 1분간 방치하여 DNA를 용출한 후 8,000rpm에서 1분간 원심분리하였다. NanoDrop One으로 게놈 DNA 농도를 정량화하였다.
[391] 바이러스 삽입 LTR에 특이적인 올리고를 사용하여 역 클로닝을 수행하였다. 차세대 표적 시퀀싱은 다음의 파라미터에 의해 분석하였다: R1 및 R2 모두 해당 시퀀싱 프라이머를 포함하는 것과 같은 판독을 필터링하고, 검사를 가장 왼쪽 염기 (프라이머가 가진 만큼의 bp)로 제한하고, 2개의 불일치를 허용하고, 프라이머 서열 (서열번호 82-89)을 트리밍하고, R1 및 R2 모두 해당 LTR 염기를 포함하는 것과 같은 리드를 필터링하고, 리드의 가장 왼쪽 5개 염기로 검사를 제한하고, K=3인 5개의 첫 번째 LTR 염기 (시퀀싱 프라이머 다음)를 사용하고 (서열에 대해 ACTGA가 다음 k-mer: ACT, CTG, TGA 중 하나의 판독에서 존재를 확인함을 의미), 2개의 불일치를 허용하고, 해당 LTR 염기쌍을 트리밍하고, 리드를 참조 게놈에 매핑하고, 적용 범위 검색(삽입 부위당 리드 수), R1과 R2가 겹치는 영역을 2로 나누고, R1과 R2가 겹치지 않으면 삽입 사이트 중 하나만 추가하고, 커버리지 임계값을 적용하고, 참조 게놈의 각 10mb당 커버리지를 계산하고 커버리지 플롯을 수행하고, 각 삽입 부위에 대한 적용 비율을 계산한다. 결과: 표적화된 인테그라제 융합 단백질은 AAVS1 부위 커버리지 및 표적화된 삽입의 백분율을 증가시켰다 (표 7 및 도 6). 표 7에서 볼 수 있는 바와 같이, 삽입이 인테그라제 융합 단백질에 의해 수행될 때 표적 부위에 더 많은 수의 리드가 존재하고; 이를 표적화된 삽입을 나타내는 IN WT와 비교하였다. 도 6은 IN 및 ZFP_IN(AAVS1)에 대한 게놈에서 가장 흔한 표적 부위를 나타낸 것이며; 융합 조건에서만 표적 삽입의 존재를 나타낸다.
표 7. AAVS1 리드 수 및 표적화된 인테그라제 융합 단백질의 표적화된 삽입 백분율
[392] 두 번째 ZFP는 또한 CCR5 유전자 내의 핵산 세그먼트를 표적화하기 위해 생성하였다. 이러한 아연-집게 단백질은 HIV-1 인테그라제에 융합되어 CCR5 표적 인테그라제를 생성하였다. 이러한 ZFP-IN을 포함하는 렌티바이러스를 상기 기재된 바와 같이 생산하였고, HEK293T 세포(NILV+ZP-IN(CCR5))로 형질도입시켰다 (표 6). 결과: NILV+ZP-IN(CCR5)의 바이러스 역가는 LV 및 NILV+IN과 유사하였다 (도 7A). 이러한 작제물은 시험된 다른 ZFP_IN 융합체와 동일한 효율로 바이러스 입자를 생성할 수 있었다 (도 7B 및 C). 부위 특이적 방식으로 DNA를 통합하는 능력은 CCR5에 대해서는 테스트하지 않았다.
[393] 또 다른 실험에서, 6d 표적화 TCRa 유전자좌 및 동일한 부위를 표적화하는 gRNA를 가지는 융합 ZFP-IN에 대해 새로 클로닝된 발현 벡터를 생성하였다 (실시예 11 참조). 이 분석은 야생형 인테그라제와 ZFP-인테그라제 융합이 NILV 용량을 보완하고 CAR-T 카세트의 선택적 통합을 촉진할 수 있는지 여부를 테스트하였다. Jurkat 세포는 모든 TCRa 표적화된 삽입 입자에 대해 동일한 감염 다중도로 감염시켰따. 이러한 실험에서, 바이러스 입자는 표적화된 삽입 후 CD3(TCRa 유전자에 의해 인코딩됨) 단백질 발현의 손실을 초래할 CD19 CAR-T 카세트로 로딩하였다. CD19 양성 및 CD3 음성 세포의 백분율을 시간에 따라 추적하였다. 렌티바이러스 역가는 도 8A에 도시되어 있고, 제3일 및 제14일에 CAR 발현 세포의 %는 도 8B에 도시되어 있다. CD3 발현 세포의 %가 도 8C에 도시되어 있다. 이는 효율적인 IN 트랜스보완을 위한 중요한 요소인 VPR이 없는 경우 이러한 세포주의 맥락에서 트랜스보완이 작동하지 않았음을 나타낸다.
실시예 13: 부위 지정 돌연변이 및 포화 돌연변이 유발에 의한 변형된 인테그라제의 생성
[394] 변형된 HIV-1 인테그라제는 부위 지정 돌연변이 유발 및 포화 돌연변이 유발에 의해 생성하였다. 부위 지향적 돌연변이유발의 경우, 변형된 HIV-1 인테그라제는 부위 지향적 돌연변이유발에 의해 아미노산을 돌연변이시킴으로써 생성될 것이다. QuikChange Lightning Multi Site-Directed Mutagenesis Kit를 사용하며, 프라이머는 제조업체의 권장 사항(서열 번호 90-97)에 따라 설계하였다. 돌연변이될 플라스미드는 약 7,000bp이다. 접근 방식당 약 5개의 콜로니를 시퀀싱에 의해 스크리닝할 것이다. 원하는 플라스미드를 포함하는 콜로니의 글리세롤 스톡을 제조할 것이다.
[395] HIV-1 인테그라제의 포화 돌연변이유발은 상이한 HIV-1 인테그라제 분자의 대규모 조합 라이브러리를 생성하기 위해 수행할 것이다. 프로토콜은 문헌 [Cornell et al., (Biochemistry, 57(5)604-613, 2018)]에서 채택하였다. 돌연변이 부위에 변성된 NNS 서열을 포함하는 여러 정방향 프라이머와 하나의 PCR 반응에서 하나의 역방향 프라이머를 사용할 것이다 (서열 번호 90-97). 전체 플라스미드가 증폭되어 돌연변이된 인테그라제 분자를 생성한다. 프라이머는 68℃의 용융 온도에 최적화될 것이다. 사이클 동안 어닐링 온도는 사이클당 0.3℃씩 증가할 것이다. 아미노산 돌연변이의 목록이 Table 8에 제공된다.
표 8. HIV-1 인테그라제의 돌연변이 부위 대 야생형 HIV-1 인테그라제 aa 서열 NC_001802.1 - NP_705928 (서열 번호 1)
실시예 14: pRRLVPR 통합 구조의 생성 및 HEK293T 세포에서 전이 효율성 테스트
[396] pRRLIN, pRRLVPRIN 및 pRRLINGFP 벡터는 VPR 트랜스보완에 사용하기 위해 생성하였다 (표 9).
표 9. pRRL 작제물
[405] GFP 발현 분석을 사용하여 작제물을 테스트하였다. HEK293T 세포를 pSICO MAXI, pSICO MINI 및 pRRL_INGFP로 형질감염시켜 pRRLINGFP 에피솜 발현을 테스트하였다. 렌티바이러스 생산 세포에서 VPRINGFP 작제물의 발현이 양성으로 검출하였다. 다음으로, HEK293T 세포에서 트랜스 보완의 효율성을 테스트하였다.
[406] LV 배지를 초원심분리하고, 재현탁되도록 방치하고, 세포를 시딩하였다. 감염은 0.6ml(1.5*0.4)의 부피로 수행하였다. 폴리브렌을 첨가하였다. 역가는 세포측정법에 의해 결정하였다. 역가 (1:100)가 도 9에 도시되어 있다.
[407] VPR 트랜스 보완 시스템은 통합을 위해 변형된 인테그라제 서열을 비교하는데 사용하였다.
[408] 하기 실시예 15-19에서, 변형된 과다활성 PiggyBac 트랜스포사제를 갖는 융합 단백질의 상이한 작제물을 생성하였다. 구성체의 전체 및 표적화된 전위 활성이 결정하였고, 특히 hcas9_mutated PB의 작제물에 대한 관련 결과가 나타났다. 돌연변이된 PB 및 ZFP의 융합 단백질 작제물의 생성 및 표적화된 전위 활성 결정에 대한 증거가 또한 제공된다. 다른 링커를 테스트하였고, 테스트한 나머지 링커보다 XTEN의 성능이 더 우수함을 보여준다. 5GGS 및 7GGS도 제대로 작동하여 링커의 길이와 유연성이 성능에 중요한 역할을 함을 나타낸다.
실시예 15: 변형된 과민성 PIGGYBAC 트랜스퍼라제를 가지는 융합 단백질의 생성 및 표적 전이 효율의 측정 방법
형질감염:
[409] Hek293T 세포는 형질감염 당일에 70-80%의 포화도를 달성하기 위해 전날 시딩하였다 (p12 웰 플레이트에서 일반적으로 290,000개 세포). 제조업체의 지침에 따라 리포펙타민 3000 시약을 사용하거나 OptiMem에서 1:3 DNA-PEI 비율의 PEI를 사용하여 형질감염을 수행하였다.
[410] 프로그래밍 가능한 트랜스포사제 (PT), gRNA 및 트랜스포존 플라스미드를 1 PT:2.5 gRNA:2.5 트랜스포존 비율로 함께 형질감염시켰다.
[411] 실험에 따라 원하는 종점까지 세포를 통과시키고 유지하였다.
PB 돌연변이체의 생성:
[412] Quickchange Lightning Agilent 돌연변이 유발 키트의 지침에 따라 부위 지정 돌연변이 유발에 의해 Cas9(hCas9_PB 플라스미드)에 융합된 hyPB 서열에 다양한 돌연변이를 도입하였다. Primer는 QuikChange Primer Design으로 설계되어 다음의 돌연변이를 달성하였다: PB R245A, PB R275-277A, PB R388A, PB S351A, PB W465A, PB R372A-K375A, PB D450N (서열 번호 100-106).
Cas9 활성:
[413] 뉴클레아제 Cas9 및 gRNa 플라스미드가 있는 프로그래밍 가능한 트랜스포사제 플라스미드를 1:2.5 비율로 함께 형질감염시켰다. 48시간 후에 세포를 수확하고 게놈 DNA를 추출하였다. PCR은 gRNA 표적 부위(NGS-aavs fw & NGS-aavs rv, SEQ ID NO 98-99) 주변의 150-200 bp를 표적으로 하는 프라이머로 수행하였다. Illumina 어댑터와 바코드는 두 번째 PCR에 도입되었으며 miseq 시퀀싱은 일반적으로 2x250 Nano 플로우 셀에서 수행하였다. 결과는 CRISPR-GA 웹 도구로 분석하였다.
유전자트랩 분석:
[414] 프로모터가 없는 RFP 트랜스포존은 PPR1alpha 및 CD46 인트론 1을 표적화하는 스플라이싱 수용체 및 gRNA가 U6 프로모터 조절에 따라 설계 및 복제하였다. RFP 형광은 트랜스포존이 표적 영역 또는 다른 프로모터 영역에 우연히 삽입된 경우에만 감지된다. 유전자 트랩 분석을 위해, Hek293T 세포를 유전자 트랩 트랜스포존, 프로그래밍 가능한 트랜스포사제 및 gRNA로 형질감염시키고 RFP 신호를 유세포 분석으로 분석하였다.
분할 GPF 리포터 세포주:
[415] 표적화된 전위 증거 실험을 위해 293T 리포터 세포주를 생산하였다. 간단히 말해, 세포주는 표적 영역(다른 gRNA 및 ZFP 표적 서열 포함)과 스플라이싱 수용체 서열과 GFP 코딩 서열의 절반이 뒤따른다. 이러한 세포주는 과활성 버전의 슬리핑 뷰티 트랜스포사제인 SB100X를 사용하여 리포터 카세트를 무작위로 삽입하여 생성하였다. 프로모터 및 스플라이싱 공여자가 있는 GFP 서열의 전반부가 있는 트랜스포존의 표적화된 도입은 유세포 분석에 의해 검출가능한 GFP 신호에 대한 결과를 가져온다.
[416] 표적 대 무작위 삽입을 평가하기 위해 EF1알파 구성적 프로모터가 선행하는 전체 RFP 서열 및 절반 GFP 서열을 포함하는 두 번째 트랜스포존을 생성하였다. 형질감염 후 약 15일에 에피솜 신호의 양호한 붕괴가 있어 전체 삽입 (RFP 신호) 대 표적 삽입 (GFP 신호)을 분석할 수 있었다.
실시예 16: 변형된 과활성 PIGGYBAC 트랜스포사제를 가지는 융합 단백질의 플라스미드 작제물의 생성
[417] 다른 플라스미드 구성을 복제하여 DNA (cas9, ZNF)를 표적으로 하는 프로그래밍 가능한 요소와 포유류 트랜스포사제 (Piggybac, SB100) 간의 융합을 달성하였다. 2개의 모듈 사이에 있는 링커는 서열 번호 50-63을 갖는 링커 라이브러리로부터 선택된 상이한 작제물에서 가변적이었다. 작제물이 표 10에 나타난다.
표 10. 생성된 융합 단백질 목록
hcas9: cas9 뉴클레아제 인간 코돈 최적화; ncas9: 닉카제 cas9 인간 코돈 최적화; dcas9: 멸실 cas9 인간 코돈 최적화.
실시예 17: 상이한 링커의 전위 효율
[418] Hek 293T 세포는 길이와 구조가 다른 링커 (링커 라이브러리)와 2개의 다른 gRNA(AAVS1 1 및 AAVS1 2)가 있는 hcas9_PB 작제물로 형질감염시켰다. 게놈 DNA는 형질감염 후 48 시간에 추출하였고, 표적 영역은 PCR 증폭하였고 Illumina miseq 시퀀싱으로 시퀀싱하였다.
[419] 결과: 링커 길이와 구조가 다른 작제물은 cas9 뉴클레아제 활성을 방해하지 않는다. 4GGS 링커는 hcas9 활성과 비교하여 두 gRNA 표적 부위 모두에서 더 높은 cas9 활성을 제공한다 (도 11).
실시예 18: 변형된 과활성 PIGGYBAC 트랜스포사제를 가지는 융합 단백질의 표적화된 전위
18.1. 유전자트랩:
[420] hcas9_PB 작제물의 표적화된 전위 활성 (전술된 상이한 링커를 사용하여 hyPB에 연결된 hcas9)은 유전자트랩 트랜스포존을 사용하여 평가하였다. 유전자트램 트랜스포존은 스플라이싱 공여자 뒤의 프로모터 영역에 삽입된 경우에만 발현될 수 있는 스플라이싱 수용체 서열이 선행하는 프로모터 없는 RFP 서열을 포함한다.
[421] Genetrap 트랜스포존은 PPR1 인트론 1 gRNA 및 다양한 링커 작제물을 갖는 프로그래밍 가능한 트랜스포사제로 형질감염시켰다. 결과는 유세포분석기를 사용하여 RFP 형광에 의해 형질감염 10일 후에 분석하였다.
[422] 결과: 표적화된 활성은 야생형 hyPB로 형질감염시킨 조건보다 더 많은 형광을 가지는 hyPB 무작위 삽입과 비교하여 프로그래밍 가능한 트랜스포사제로 형질감염시킨 조건에서 프로그래밍 가능한 트랜스포사제에 의해 증가하였다. 8ggs, XTEN 링커는 다른 링커와 비교하여 Genetrap 표적 활성을 증가시켰다 (도 12).
분할 GFP 리포터 세포주:
[423] 18.2 상이한 링커를 가지는 표적화된 전위 hcas9_PB
[424] hcas9_PB 작제물의 표적화된 전위 활성을 리포터 세포주를 사용하여 평가하였다. 상이한 링커를 갖는 hcas9_PB 작제물을 gRNA AAVS1 3 또는 TCR1알파 및 1/2 GFP 트랜스포존으로 형질감염시켰다. 결과: 상이한 링커 작제물 전위와 관련하여 큰 차이는 인정되지 않았다 (도 13).
[425] 18.3. 선택된 돌연변이체의 표적화된 전위:
[426] PB 450 및 PB 372-375-450은 우수한 표적화된 전위 효율로 인해 추가 표적화된 전위 실험을 위해 선택하였다. 실험은 gRNA aavs1 3 및 tcr 1을 사용하여 앞서 언급한 대로 수행하였다. 결과: hcas9_PB 450 및 hcas9_PB 372-374-450의 표적화된 전위는 hyPB WT 서열을 갖는 hcas9_PB와 비교하여 6 내지 10배 더 높았다. 분리된 플라스미드에서 형질감염된 hcas9 + hyPB는 일부 표적화된 활성을 나타낸 반면 hCas9가 없는 hyPB가 0 활성을 나타내어, 분할 GFP 리포터 세포주가 충분히 특이적이지 않은 Ther 방법의 노이즈에 대해 이 기능을 수행하는 변이체 선택을 위한 강력한 표적 삽입 방법임을 나타낸다 (도 15).
18.4. 선택된 PB 돌연변이체에 대한 표적화된 및 무작위 전위:
[427] 표적 및 무작위 전위는 실시예 19.4에서 선택된 돌연변이체에 대해 앞서 언급한 RFP-GFP 이중 트랜스포존을 사용하여 평가하였다. 적색 형광은 형질 감염 후 (비 에피솜 신호를 보장하기 위해) 약 15일 동안 총 삽입(구성적으로 표현되는 RFP)을 나타내고 GFP 형광은 표적화된 전위를 나타낸다. 결과: 도 16은 무작위 전위와 비교하여 더 높은 표적화된 전위가 wt hyPB 서열을 갖는 hcas9:PB와 비교하여 hcas9_PB D450N 및 hcas9_PB R372A K375A D450 선택된 돌연변이체 둘 모두에서 나타났음을 보여준다. 전체 전위 효율은 돌연변이체 둘 모두에서 더 낮고 표적화된 결과는 도 15와 일치한다.
18.5. 표적화된 전위 ZFP-PB 작제물:
[428] 아연 집게-과활성 PiggyBac 융합 단백질에 대한 작제물을 분할 GFP 리포터 세포주 및 D450N 돌연변이가 있는 hyPB 또는 hyPB에 존재하는 ZFP 표적화 tcr4 서열을 사용하여 클로닝하였다. 실시예 15의 프로토콜에 따라 세포를 ZFP-PB 조합 및 ½ GFP 트랜스포존으로 형질감염시켰다. 형질감염 5일 후에 GFP 신호를 분석하였다. 결과: 모든 작제물에서 백그라운드 (hyPB 무작위 삽입) 위에서 표적화된 전위가 관찰되었다. 결과: 표적화된 전위는 hyPB 및 hyPB D450N 둘 모두에 대한 N-말단 위치의 ZFP에서 더 높다(도 18). 이러한 실험을 위한 ZFP 서열은 각각 서열 번호 117 및 118의 핵산 및 아미노산 서열을 가지는 6개의 핑거 도메인의 단백질에 상응한다.
[429] 하기 실시예 20에서, PB 돌연변이의 라이브러리를 설계하고 양성 표적화된 전위에 대해 변형된 PB를 확인하기 위한 스크리닝 방법에 제출하였다. 양성 표적화된 전위를 가지는 변형된 PB에 대한 일부 적중(hit)를 식별하고 검증하였다.
실시예 20: 과활성 PIGGYBAC 돌연변이 라이브러리 생성 및 FOR 표적화된 전위에 대한 스크리닝
방법:
[430] hyPB 돌연변이 라이브러리는 Twist Biosciences에서 설계 및 구입하였다.
표 11. hyPiggyBac에 대한 돌연변이 부위
스크리닝 방법:
[431] 스크리닝 방법은 cas9와 같은 표적 가능한 DNA 결합 단백질에 연결되고 특이적 표적화된 전위를 수행하는 설계된 돌연변이 라이브러리에서 Piggybac 변이체를 식별하도록 설계하였다. 스크리닝 방법의 도식은 도 19에 도시되어 있다. PB 라이브러리는 Esp3I 효소를 사용하여 골든 게이트 어셈블리에 의해 hcas9 및 XTEN 링커를 포함하는 SIN 전달 렌티바이러스 플라스미드로 클로닝된 후 CMV 프로모터 조절하에 hcas9_XTEN_PB_NLS 융합 단백질을 달성하기 위해 NLS 전에 Esp3I 클로닝 사이트로 클로닝하였다. Invitrogen electroporation의 ElectroMAX™ Stbl4™ 적격 세포 이후 약 6.000.000개의 콜로니를 수확하였고, 플라스미드는 HiPure Maxiprep 키트, LifeTechnologies를 사용하여 maxiprep으로 추출하였다. Addgene의 렌티바이러스 생산 프로토콜을 사용하여 렌티바이러스를 생산하였다 (Addgene에서 구입한 pMD2.G 및 psPAX2 헬퍼 플라스미드 사용). 렌티바이러스를 초원심분리하고 카피 수 분석 qPCR (올리고뉴클레오타이드 서열 번호 107-110 사용)에 의해 적정하였다. 간단히 말해서, 80.000 Hek293T 세포가 전날 p12 웰 플레이트에 접종하였다. 세포를 라이브러리 렌티바이러스의 경우 ½, 1/10, GFP 렌티바이러스의 경우 1/50, 1/100, 1/1000으로 희석하여 라이브러리 렌티바이러스 및 표준 GFP 렌티바이러스로 감염시켰다. 감염 3일 후 유동 세포 계측법에 의해 GFP 신호를 분석하였다. 세포를 수확하고 gDNA를 추출하였다. qPCR 분석은 WPRE 유전자 카피 수를 평가하도록 설계하였으며 RNAse 유전자 카피 수에 의해 정규화하였다.
[432] Hek293T Reporter 세포는 1:1000 폴리브렌을 사용하여 500 cm2 정사각형 접시에서 MOI 0.8로 감염시키고, 10M 세포는 전날 플레이팅하였다. 감염 3-4일 후, 세포를 PEI 1:3을 사용하여 8.1 pmol gRNA AAVS1 플라스미드 및 ½ GFP 트랜스포존으로 형질감염시켰다. 9M 세포를 15 cm 접시에 전날 플레이팅하였다. 형질감염 3-4일 후 세포는 FACSAria 세포계측기(0.70 μm 노즐)를 사용하여 분류하였다. 동일한 몰 농도의 RFP 및 GFP 플라스미드를 사용하여 10cm 플레이트에서 형질감염 대조군을 수행하고 GFP-RFP 양성 세포에 대해 Fortessa 세포계측기에서 분석하였다. 분류 후, gDNA를 직접 추출하였다.
[433] 다양한 시퀀싱 방법을 사용하여 양성 표적화된 전위가 있는 PB 돌연변이를 분석하였다.
PiggyBac 라이브러리 영역 표적화된 시퀀싱:
[434] 모든 라이브러리 변이체가 있는 PiggyBac 1116 bp 영역은 KAPA HiFi Hotstart ReadyMix를 사용하여 프라이머 NGS 클러스터 1 fw 및 NGS 클러스터 2 rv로 PCR 증폭시켰다. Illumina 어댑터 및 바코드를 두 번째 PCR에 추가하고 NEBNext 9 프라이머 및 Illumina 맞춤 바코드를 사용하였다 (서열 번호 111-114). 표적 시퀀싱은 v2 또는 v3 Illumina miseq 플로우 셀에서 수행하였다. I7 인덱스 프라이머는 다양한 변이체의 전체 시퀀싱을 허용하기 위해 맞춤형 프라이머로 대체하였다.
Piggybac 및 cas9 시퀀스 샷건 라이브러리 생성 및 시퀀싱:
[435] GFP 양성 분류된 세포의 게놈 DNA로부터 6000bp PCR을 프라이머 CMV-F 및 SV40 pA rv(서열 번호 115 및 132)로 수행하고 KAPA HiFi HotStart ReadyMix로 cas9 및 PB 서열을 증폭시켰다. 그런 다음 DNA를 Qiagen 겔 추출 키트로 정제하고 Covaris S220 및 마이크로튜브 AFA 섬유 크림프-캡(Crimp-Cap)을 사용하여 500bp로 단편화하였다. Shotgun 라이브러리는 제조업체의 지침에 따라 KAPA 하이퍼프렙 키트로 준비하였다.
결과:
20.1. hyPB 라이브러리 다양성 생성:
[436] ½ GFP 리포터 세포주는 PB 라이브러리 돌연변이가 있는 hcas9_PB를 포함하는 렌티바이러스로 MOI 0.8으로 감염시켰다. 감염 3일 후, 세포를 75-90% 형질감염 효율로 gRNA AAVS1 3 및 ½ GFP 트랜스포존으로 형질감염시켰다.
[437] 첫 번째 실험에서 총 254M의 세포가 분류하였고, 185.757개의 양성 세포를 획득하여, 0.073%의 표적화된 전위 양성 변이체를 나타냈다. 두 번째 실험에서 120M 세포를 분류하고 0.059% 표적화된 전위 양성 변이체를 나타내는 70.974개의 양성 세포를 수득하였다 (도 21A 및 21B).
[438] 게놈 DNA는 양성 및 음성 분류된 세포에서 직접 추출하였다. 수득된 DNA의 ⅔는 표적 시퀀싱 분석을 위해 처리하였고, ⅓는 본 실시예의 섹션 방법에 명시된 바와 같이 샷건 라이브러리 시퀀싱으로 처리하였다.
20.2. 가변 영역의 표적화된 시퀀싱에 의한 hyPB 라이브러리 스크리닝 분석:
[439] Cas9-PB 변이체의 양성 및 음성 세포 분석을 다음과 같이 분석하였다. 표적화된 시퀀싱의 리드는 참조 시퀀스에 대해 매핑하였다. 모든 라이브러리 변이 위치는 두 가지 접근 방식: 정렬된 리드를 사용하여 위치별로, 및 주변 시퀀스의 패턴 일치를 사용하여 시퀀스별로 검색하였다. 모든 변이체 수의 대수 배수 변화는 양성(표적 통합이 있는 GFP 양성 세포)과 음성 샘플 (통합이 발생했는지 여부에 관계없이 비표적 통합 샘플) 사이에서 계산하였고 상위 변이체를 검색하였다. 또한 무작위 통합이 있는 샘플의 음성 선택은 RFP 양성 선택으로 수행하였고; 여기서 트랜스포존이 게놈에 무작위로 삽입되었다.
[440] 결과가 도 22A-22K에 도시되어 있다. 따라서, 변이체 조합 라이브러리의 감독되지 않은 고처리량 스크리닝 접근 방식을 사용하여, 양성 대 음성 세포 집단에서의 존재 비교에 의해 표시된 바와 같이, 고효율로 부위 지정 삽입을 수행할 수 있는 Piggyback에 대한 돌연변이체 컬렉션이 확인하였다.
[441] 다음으로, 반복 1에서 상위 양성 적중의 표적화된 및 무작위 전위는 이전에 언급된 RFP-GFP 이중 트랜스포존을 사용하여 평가하였다. 적색 형광은 형질 감염 후 약 15일 동안 총 삽입(구성적으로 표현되는 RFP)을 나타내고 GFP 형광은 표적화된 전위를 나타낸다.
[442] 결과: 무작위 전위와 비교하여 더 높은 표적화된 전위가 hcas9_PB 및 wt hyPB와 비교하여 반복 1 변이체의 Top1에서 나타났다 (도 23A-23B). 리포터 세포주를 사용한 표적 삽입의 독립적인 검증이 수행되었으며, WT 버전 및 D450N 돌연변이체와 비교하여 상당한 표적 표적 활성이 관찰관찰되었다.
20.3. 과발현된 양성 적중의 식별:
[443] 선별된 음성 변이체에 비해 GPF 모집단에서 과발현된 몇 가지 양성 적중을 스크리닝에서 확인하였다. 그 중 일부는 전체 삽입을 나타내는 RFP 모집단에서도 발견되지 않았으며, 이는 통합 능력의 증가를 나타낸다. 또한 RFP에는 무작위 및 표적화된 통합을 포함한다. 따라서, 고효율로 부위 지정 삽입을 수행할 수 있는 Piggyback에 대한 조합 돌연변이체의 집합이 확인되었다 (도 24A-24C).
20.4. 샷건 시퀀싱에 의한 hyPB 라이브러리 스크리닝 분석:
[444] 샷건 시퀀싱의 경우 참조 시퀀스에 대해 읽기가 매핑하였고 참조에서 모든 변형을 검색하는 변형 호출을 수행하였으며, 양성 및 음성 대립 유전자 수 사이의 유클리드(Euclidean) 및 상관 거리를 계산하였다. 가장 다른 위치가 변형으로 검색하였고; 이러한 변이체 간의 연관성을 계산하였다.
[445] 결과: 라이브러리 디자인에 포함된 변이체 외에도 바이러스 라이브러리 생성 동안 렌티바이러스 레트로트랜스크립타제(retrotranscriptase)에 의해 무작위로 도입된 변이체를 분석하였다. 이러한 새로운 변이체 중 일부는 양성 적중와 연관되어 결합 시 표적 통합을 수행할 수 있으며 표적 통합을 수행하기 위해 hyPB의 변이 버전에서 돌연변이 형태로 존재해야 할 수도 있다. D450N 및 W465A의 예가 도 25에 도시되어 있다.
[446] 실시예 20에서 확인된 돌연변이된 PB 서열은 표 12 (서열번호 120-129)에 나열되어 있다.
20.5. hyPB 라이브러리 스크리닝 검증:
[447] 스크리닝 양성 적중 (Unilarge-A, -B, -C 및 Unilarge-D)에서 확인된 Top1-1에서 볼 수 있는 단일 돌연변이의 여러 조합의 표적화된 및 무작위 전위는 이전에 언급된 RFP-GFP 이중 트랜스포존을 사용하여 평가하였다. 적색 형광은 형질 감염 후 약 15일 동안 총 삽입(구성적으로 표현되는 RFP)을 나타내고 GFP 형광은 표적화된 전위를 나타낸다.
[448] 결과: 모든 경우에, hyPB의 WT 버전에 Cas9-의 융합과 비교할 때, 4GGS 링커와 hyPB의 상이한 돌연변이 조합에 융합된 Cas9에 대해 전체 통합에 비해 표적화된 삽입의 증가가 관찰되었다 (Unilarge-A: D450N; Unilarge-B: R245A/D450N; Unilarge-C: R245A/G325A/D450N/S573P; Unilarge-D: R245A/G325A/S573P). 테스트된 돌연변이 조합 중 일부 (R245A/G325A/D450N/S573P)는 hyPB 융합(Unilarge C)에서 3% 대신 총 통합 이벤트의 최대 30%인 표적 삽입의 큰 증가를 보였습니다 (도 26).
[449] 하기 실시예 21은 상이한 통합 결핍 바이러스 벡터의 발달 상태 및 최상의 트랜스보완 시스템의 개요; 및 IN 융합 단백질과의 상호보완에 대한 데이터를 제공한다.
실시예 21: 상이한 인테그라제 결핍 시스템의 트랜스보완
[450] IN 융합 단백질을 테스트하기 위한 효율적인 트랜스보완시스템을 생성하기 위해, 통합 결핍 바이러스와 트랜스보완된 바이러스의 다른 조건을 Hek293T 및 Jurkats 세포에 감염시켜 바이러스 생산 효율성과 통합 능력을 평가하였다. 세포는 에피솜 신호가 검출되지 않을 때까지 7일 동안 통과하였고 GFP 신호는 2일, 5일 및 7일에 유세포 분석에 의해 분석하였다.
[451] 결과: NILV는 생산 시 WT에 대해 폐쇄되므로 시스템마다 다른 생산 효율성이 감지될 수 있다. 모든 경우에 WT-HIV_IN으로 보완 보완을 수행했을 때 통합 활동의 명확한 구조가 분명하였다. (도 27). IN이 트랜스보완 시스템에 로딩되었다는 증거는 웨스턴 블롯으로 수득하였다.
표 12. 서열. “서열”은 핵산 서열을 나타내고 “서열”은 아미노산 서열을 나타낸다.
SEQUENCE LISTING
<110> Universitat Pompeu Fabra
<120> TARGETED GENE EDITING CONSTRUCTS AND METHODS OF USING THE SAME
<130> 4349.001PC01/TJS/JCA/LXR
<150> US 62/860,186
<151> 2019-06-11
<160> 134
<170> PatentIn version 3.5
<210> 1
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Wildtype HIV-1 integrase amino acid sequence
<400> 1
Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Asp Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly
260 265 270
Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 2
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<223> Wildtype HIV-1 integrase nucleic acid sequence
<400> 2
tttttagatg gaatagataa ggcccaagat gaacatgaga aatatcacag taattggaga 60
gcaatggcta gtgattttaa cctgccacct gtagtagcaa aagaaatagt agccagctgt 120
gataaatgtc agctaaaagg agaagccatg catggacaag tagactgtag tccaggaata 180
tggcaactag attgtacaca tttagaagga aaagttatcc tggtagcagt tcatgtagcc 240
agtggatata tagaagcaga agttattcca gcagaaacag ggcaggaaac agcatatttt 300
cttttaaaat tagcaggaag atggccagta aaaacaatac atactgacaa tggcagcaat 360
ttcaccggtg ctacggttag ggccgcctgt tggtgggcgg gaatcaagca ggaatttgga 420
attccctaca atccccaaag tcaaggagta gtagaatcta tgaataaaga attaaagaaa 480
attataggac aggtaagaga tcaggctgaa catcttaaga cagcagtaca aatggcagta 540
ttcatccaca attttaaaag aaaagggggg attggggggt acagtgcagg ggaaagaata 600
gtagacataa tagcaacaga catacaaact aaagaattac aaaaacaaat tacaaaaatt 660
caaaattttc gggtttatta cagggacagc agaaatccac tttggaaagg accagcaaag 720
ctcctctgga aaggtgaagg ggcagtagta atacaagata atagtgacat aaaagtagtg 780
ccaagaagaa aagcaaagat cattagggat tatggaaaac agatggcagg tgatgattgt 840
gtggcaagta gacaggatga ggattag 867
<210> 3
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified HIV-1 integrase
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa can be Lys, Asp
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa can be Glu, Lys
<220>
<221> misc_feature
<222> (64)..(64)
<223> Xaa can be Ala, Glu, Asp
<220>
<221> misc_feature
<222> (94)..(94)
<223> Xaa can be Asp, Glu, Arg, Lys, Gly
<220>
<221> misc_feature
<222> (116)..(116)
<223> Xaa can be Asp, Ala, Glu
<220>
<221> misc_feature
<222> (117)..(117)
<223> Xaa can be Asp, Glu, Arg, Lys, Asn
<220>
<221> misc_feature
<222> (119)..(119)
<223> Xaa can be Ala, Pro, Thr, Gly, Asp, Glu, Arg, Lys, Ser
<220>
<221> misc_feature
<222> (120)..(120)
<223> Xaa can be Asp, Glu, Arg, Lys, Asn
<220>
<221> misc_feature
<222> (122)..(122)
<223> Xaa can be Lys, Ile, Val, Ala, Arg, Thr
<220>
<221> misc_feature
<222> (124)..(124)
<223> Xaa can be Asp, Glu, Arg, Lys, Ala
<220>
<221> misc_feature
<222> (125)..(125)
<223> Xaa can be Asp, Glu, Arg, Lys, Thr
<220>
<221> misc_feature
<222> (128)..(128)
<223> Xaa can be Ala, Thr
<220>
<221> misc_feature
<222> (152)..(152)
<223> Xaa can be Ala, Asp, Glu
<220>
<221> misc_feature
<222> (168)..(168)
<223> Xaa can be Leu, Ala, Gln
<220>
<221> misc_feature
<222> (170)..(170)
<223> Xaa can be Glu, Gly
<220>
<221> misc_feature
<222> (185)..(185)
<223> Xaa can be Phe, Lys
<220>
<221> misc_feature
<222> (231)..(231)
<223> Xaa can be Arg, Gly, Lys, Asp, Glu, Ser
<220>
<221> misc_feature
<222> (264)..(264)
<223> Xaa can be Lys, Arg
<220>
<221> misc_feature
<222> (266)..(266)
<223> Xaa can be Lys, Arg
<220>
<221> misc_feature
<222> (273)..(273)
<223> Xaa can be Lys, Arg
<400> 3
Phe Leu Asp Gly Ile Asp Lys Ala Gln Xaa Xaa His Xaa Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Xaa
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Xaa Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Xaa Xaa Gly Xaa Xaa Phe Xaa Gly Xaa Xaa Val Arg Xaa
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Xaa Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Xaa Ala Glu His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Xaa Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Xaa Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Xaa Ala Xaa Ile Ile Arg Asp Tyr Gly
260 265 270
Xaa Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 4
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified integrase with impaired DNA binding
<220>
<221> misc_feature
<222> (94)..(94)
<223> Xaa can be Gly, Asp, Glu, Arg, Lys
<220>
<221> misc_feature
<222> (117)..(117)
<223> Xaa can be Asn, Asp, Glu, Arg, Lys
<220>
<221> misc_feature
<222> (119)..(119)
<223> Xaa can be Ser, Ala, Pro, Thr, Gly, Asp, Glu, Arg, Lys
<220>
<221> misc_feature
<222> (120)..(120)
<223> Xaa can be Asn, Asp, Glu, Arg, Lys
<220>
<221> misc_feature
<222> (124)..(124)
<223> Xaa can be Asp, Glu, Arg, Lys
<220>
<221> misc_feature
<222> (125)..(125)
<223> Xaa can be Asp, Glu, Arg, Lys, Thr
<220>
<221> misc_feature
<222> (231)..(231)
<223> Xaa can be Arg, Gly, Lys, Asp, Glu, Ser
<400> 4
Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Xaa Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Asp Xaa Gly Xaa Xaa Phe Thr Gly Xaa Xaa Val Arg Ala
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Xaa Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly
260 265 270
Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 5
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified integrase with enhanced DNA binding
<220>
<221> Misc_feature
<222> (94)..(94)
<223> Xaa can be Gly, Asp, Glu, Arg, Lys
<220>
<221> Misc_feature
<222> (117)..(117)
<223> Xaa can be Asn, Asp, Glu, Arg, Lys
<220>
<221> Misc_feature
<222> (119)..(119)
<223> Xaa can be Ala, Pro, Thr, Gly, Asp, Glu, Arg, Lys, Ser
<220>
<221> Misc_feature
<222> (120)..(120)
<223> Xaa can be Asn, Asp, Glu, Arg, Lys
<220>
<221> Misc_feature
<222> (122)..(122)
<223> Xaa can be Thr, Lys, Ile, Val, Ala, Arg
<220>
<221> Misc_feature
<222> (124)..(124)
<223> Xaa can be Asp, Glu, Arg, Lys, Ala
<220>
<221> Misc_feature
<222> (125)..(125)
<223> Xaa can be Asp, Glu, Arg, Lys, Thr
<220>
<221> Misc_feature
<222> (168)..(168)
<223> Xaa can be Leu, Ala, Gln
<220>
<221> Misc_feature
<222> (231)..(231)
<223> Xaa can be Arg, Gly, Lys, Asp, Glu, Ser
<400> 5
Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Xaa Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Asp Xaa Gly Xaa Xaa Phe Xaa Gly Xaa Xaa Val Arg Ala
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Xaa Ala Glu His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Xaa Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly
260 265 270
Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 6
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified integrase with acetylation mutations
<220>
<221> misc_feature
<222> (264)..(264)
<223> Xaa can be Lys, Arg
<220>
<221> misc_feature
<222> (266)..(266)
<223> Xaa can be Lys, Arg
<220>
<221> misc_feature
<222> (273)..(273)
<223> Xaa can be Lys, Arg
<400> 6
Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Asp Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Xaa Ala Xaa Ile Ile Arg Asp Tyr Gly
260 265 270
Xaa Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 7
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified integrase with mutations in retroviral integrative
recombination
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa can be Asp, Lys
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa can be Glu, Lys
<220>
<221> misc_feature
<222> (64)..(64)
<223> Xaa can be Asp, Ala, Glu
<220>
<221> misc_feature
<222> (116)..(116)
<223> Xaa can be Ala, Glu, Asp
<220>
<221> misc_feature
<222> (128)..(128)
<223> Xaa can be Ala, Thr
<220>
<221> misc_feature
<222> (152)..(152)
<223> Xaa can be Glu, Ala, Asp
<220>
<221> misc_feature
<222> (168)..(168)
<223> Xaa can be Gln, Leu, Ala
<220>
<221> misc_feature
<222> (170)..(170)
<223> Xaa can be Asp, Gly
<400> 7
Phe Leu Asp Gly Ile Asp Lys Ala Gln Xaa Xaa His Xaa Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Xaa
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Xaa Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Xaa
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Xaa Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Xaa Ala Xaa His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly
260 265 270
Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 8
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified integrase with mutations in HIV-1 replication
<220>
<221> misc_feature
<222> (168)..(168)
<223> Xaa can be Gln, Leu, Ala
<400> 8
Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His
1 5 10 15
Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val
20 25 30
Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu
35 40 45
Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp
50 55 60
Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala
65 70 75 80
Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu
85 90 95
Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr
100 105 110
Ile His Thr Asp Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala
115 120 125
Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn
130 135 140
Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys
145 150 155 160
Ile Ile Gly Gln Val Arg Asp Xaa Ala Glu His Leu Lys Thr Ala Val
165 170 175
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly
180 185 190
Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile
195 200 205
Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg
210 215 220
Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys
225 230 235 240
Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp
245 250 255
Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly
260 265 270
Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp
275 280 285
<210> 9
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Hyperactive PiggyBac aa sequence
<400> 9
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 10
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac
<220>
<221> misc_feature
<222> (245)..(245)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (268)..(268)
<223> Wherein amino acid can be Asp, Asn
<220>
<221> misc_feature
<222> (275)..(275)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (277)..(277)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (287)..(287)
<223> Wherein amino acid can be Ala, Lys
<220>
<221> misc_feature
<222> (290)..(290)
<223> Wherein amino acid can be Ala, Lys
<220>
<221> misc_feature
<222> (315)..(315)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (325)..(325)
<223> Wherein amino acid can be Gly, Ala
<220>
<221> misc_feature
<222> (341)..(341)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (346)..(346)
<223> Wherein amino acid can be Asp, Asn
<220>
<221> misc_feature
<222> (347)..(347)
<223> Wherein amino acid can be Asn, Ala, Ser
<220>
<221> misc_feature
<222> (350)..(350)
<223> Wherein amino acid can be Thr, Ala
<220>
<221> misc_feature
<222> (351)..(351)
<223> Xaa can be Ser, Glu, Pro, Ala
<220>
<221> misc_feature
<222> (356)..(356)
<223> Wherein amino acid can be Lys, Glu
<220>
<221> misc_feature
<222> (357)..(357)
<223> Wherein amino acid can be Asn, Ala
<220>
<221> misc_feature
<222> (372)..(372)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (375)..(375)
<223> Wherein amino acid can be Lys, Ala
<220>
<221> misc_feature
<222> (388)..(388)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (409)..(409)
<223> Wherein amino acid can be Lys, Ala
<220>
<221> misc_feature
<222> (412)..(412)
<223> Wherein amino acid can be Lys, Ala
<220>
<221> misc_feature
<222> (432)..(432)
<223> Wherein amino acid can be Lys, Ala
<220>
<221> misc_feature
<222> (460)..(460)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> misc_feature
<222> (461)..(461)
<223> Wherein amino acid can be Ala, Lys
<220>
<221> misc_feature
<222> (465)..(465)
<223> Wherein amino acid can be Trp, Ala
<220>
<221> misc_feature
<222> (560)..(560)
<223> Wherein amino acid can be Thr, Ala
<220>
<221> misc_feature
<222> (564)..(564)
<223> Wherein amino acid can be Ser, Pro
<220>
<221> misc_feature
<222> (571)..(571)
<223> Wherein amino acid can be Asn, Ser
<220>
<221> misc_feature
<222> (573)..(573)
<223> Wherein amino acid can be Ser, Ala
<220>
<221> misc_feature
<222> (576)..(576)
<223> Wherein amino acid can be Lys, Ala
<220>
<221> misc_feature
<222> (586)..(586)
<223> Wherein amino acid can be His, any naturally occuring amino acid
<220>
<221> misc_feature
<222> (587)..(587)
<223> Wherein amino acid can be Ile, Ala
<220>
<221> misc_feature
<222> (589)..(589)
<223> Wherein amino acid can be Met, Val
<220>
<221> misc_feature
<222> (592)..(592)
<223> Wherein amino acid can be Ser, Gly
<220>
<221> misc_feature
<222> (594)..(594)
<223> Wherein amino acid can be Phe, Leu
<400> 10
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 11
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations in the catalytic
triad
<220>
<221> misc_feature
<222> (268)..(268)
<223> Xaa can be Asp, Asn
<220>
<221> misc_feature
<222> (346)..(346)
<223> Xaa can be Asp, Asn
<400> 11
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Xaa Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Xaa Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 12
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations in amino acids that
are critical for excision
<220>
<221> misc_feature
<222> (287)..(287)
<223> Xaa can be Lys, Ala
<220>
<221> misc_feature
<222> (290)..(290)
<223> Xaa can be Lys, Ala
<220>
<221> misc_feature
<222> (460)..(460)
<223> Xaa can be Arg, Ala
<220>
<221> misc_feature
<222> (461)..(461)
<223> Xaa can be Lys, Ala
<400> 12
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Xaa Pro
275 280 285
Ser Xaa Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Xaa Xaa Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 13
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutation that are involved in
target joining
<220>
<221> misc_feature
<222> (351)..(351)
<223> Xaa can be Ser, Glu, Pro, Ala
<220>
<221> misc_feature
<222> (356)..(356)
<223> Xaa can be Lys, Glu
<400> 13
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Xaa Ile
340 345 350
Pro Leu Ala Xaa Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 14
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations that are critical
for integration
<220>
<221> misc_feature
<222> (560)..(560)
<223> Wherein amino acid can be Thr, Ala,
<220>
<221> misc_feature
<222> (564)..(564)
<223> Wherein amino acid can be Ser, Pro
<220>
<221> misc_feature
<222> (571)..(571)
<223> Wherein amino acid can be Asn, Ser
<220>
<221> misc_feature
<222> (573)..(573)
<223> Wherein amino acid can be Ser, Ala
<220>
<221> misc_feature
<222> (589)..(589)
<223> Wherein amino acid can be Met, Val
<220>
<221> misc_feature
<222> (592)..(592)
<223> Wherein amino acid can be Ser, Gly
<220>
<221> misc_feature
<222> (594)..(594)
<223> Wherein amino acid can be Phe, Leu
<400> 14
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 15
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations that are involved in
alignment
<220>
<221> misc_feature
<222> (325)..(325)
<223> Xaa can be Gly, Ala
<220>
<221> misc_feature
<222> (347)..(347)
<223> Xaa can be Asn, Ala, Ser
<220>
<221> misc_feature
<222> (350)..(350)
<223> Xaa can be Thr, Ala
<220>
<221> misc_feature
<222> (465)..(465)
<223> Xaa can be Trp, Ala
<400> 15
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Xaa Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Xaa Trp Phe Xaa Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Xaa Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 16
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations at well conserved
amino acids
<220>
<221> misc_feature
<222> (576)..(576)
<223> Xaa can be lys, Ala
<220>
<221> misc_feature
<222> (587)..(587)
<223> Xaa can be Ile, Ala
<400> 16
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Xaa
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Xaa Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 17
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations involved in Zn2+
binding
<220>
<221> misc_feature
<222> (586)..(586)
<223> Wherein amino acid can be His, any naturally occuring amino acid
<400> 17
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 18
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac with mutations that are involved in
integration
<220>
<221> MISC_FEATURE
<222> (315)..(315)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> MISC_FEATURE
<222> (341)..(341)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> MISC_FEATURE
<222> (372)..(372)
<223> Wherein amino acid can be Arg, Ala
<220>
<221> MISC_FEATURE
<222> (375)..(372)
<223> Wherein amino acid can be Lys, Ala
<400> 18
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 19
<211> 897
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Corynebacterium ulcerans
<400> 19
Met Thr Asn Ala Val Ala Asn His His Val Leu Trp Ala Lys Phe Asp
1 5 10 15
Asn Val Ser Glu Pro Tyr Pro Leu Leu Ala His Leu Leu Asp Thr Ala
20 25 30
Thr Ala Ala Thr Cys Leu Phe Asn His Trp Leu Arg Lys Gly Leu Arg
35 40 45
Asp Arg Leu Ser Thr Glu Leu Gly Pro Asp Ala Glu Lys Ile Leu Gly
50 55 60
Phe Val Ala Gly Ile His Asp Leu Gly Lys Ala Asn Pro Tyr Phe Gln
65 70 75 80
Ala Gln Arg Arg Asn Lys Lys Glu Glu Trp Ile Thr Leu Arg Asp Ala
85 90 95
Ile Gln Lys Ala Gly Phe Pro Leu Ser Asn Gly Thr Ser Ala Leu Phe
100 105 110
Glu Glu Thr Lys Glu Lys Arg Arg His Glu Asn Ile Thr Leu Ser Ile
115 120 125
Leu Gly Trp Glu Ile Thr Lys Phe Leu Gln Val Lys Asp Val Trp Pro
130 135 140
Gln Leu Ala Ile Ile Gly His His Gly Asn Phe Ser Ala Pro Gly Phe
145 150 155 160
Leu Ser Asp Glu Asp Asp Leu Glu Asp Ile Glu Asp Ile Phe Asp Asp
165 170 175
Asn Gly Trp Ser Pro Thr His Glu Leu Leu Val Ser Ser Leu Leu Gln
180 185 190
Ala Val Gly Leu Glu Lys Gln Pro Glu Ile Lys His Ile Ser Pro Ala
195 200 205
Ser Ala Ile Leu Ile Ser Gly Leu Val Val Leu Ala Asp Arg Ile Ala
210 215 220
Ser Gln Ser Glu Met Ala Ser Asp Gly Leu Gln Ala Leu Gln Lys Glu
225 230 235 240
Glu Leu Phe Phe His Gln Pro Glu Lys Trp Ile Ala Asn Arg Lys Ala
245 250 255
Phe Cys Arg Glu Ile Ile Glu Asn Thr Val Gly Thr Tyr His Pro Trp
260 265 270
Glu Ser Glu Ala Ala Gly Ile Arg Ala Val Leu Gly Asp Tyr Glu Pro
275 280 285
Arg Phe Thr Gln Lys Ala Ala Leu Asn Ala Gly Asp Gly Leu Phe Asn
290 295 300
Val Met Glu Thr Thr Gly Ala Gly Lys Thr Glu Ala Ala Leu Leu Arg
305 310 315 320
His Val Lys Arg Lys Glu Arg Leu Leu Phe Phe Leu Pro Thr Gln Ala
325 330 335
Thr Thr Asn Ala Ile Met Asp Arg Ile Gly Lys Ile Phe Asp Gly Thr
340 345 350
Pro Asn Val Ala Ser Leu Ala His Gly Leu Ala Val Thr Glu Asp Phe
355 360 365
Tyr Ala His Pro Ile Leu Pro Val Gln Gly Ser Ser Asp Asp Ala Asn
370 375 380
Tyr Lys Asp Asn Gly Gly Leu Tyr Pro Thr Glu Phe Val Arg Ser Ala
385 390 395 400
Gly Thr Pro Arg Leu Leu Ala Pro Val Cys Val Gly Thr Ile Asp Gln
405 410 415
Ala Leu Met Gly Ala Leu Pro Ser Lys Phe Asn His Leu Arg Leu Leu
420 425 430
Ala Leu Ala Asn Ala His Val Val Val Asp Glu Val His Thr Met Asp
435 440 445
Gln Tyr Gln Ser Glu Leu Met Ser Gly Leu Leu Glu Trp Trp Ser Ala
450 455 460
Thr Asp Thr Pro Val Thr Leu Leu Thr Ala Thr Met Pro Ala Trp Gln
465 470 475 480
Arg Glu Lys Phe His Leu Ser Tyr Thr Gly Lys Asp Pro His Phe Lys
485 490 495
Gly Val Phe Pro Ser Leu Glu Asp Trp Ser Thr Pro Ser Lys Asn Thr
500 505 510
Glu Thr Ser Gln Glu Asn Ile Pro Thr Glu Ala Phe Thr Ile Pro Ile
515 520 525
Asn Ile Asp Lys Ile Ala His Asn Glu Ile Val Asp Ser His Val Gln
530 535 540
Trp Val Ile Glu Gln Arg Lys Leu Phe Pro Gln Ala Arg Ile Gly Ile
545 550 555 560
Ile Cys Asn Thr Val Gly Arg Ala Gln Ser Ile Ala Glu Ala Leu Ala
565 570 575
His Glu Ser Pro Ile Val Leu His Ser Arg Met Thr Ala Gly His Arg
580 585 590
Lys Glu Ala Ala Thr Lys Leu Glu Gln Ala Ile Gly Lys Lys Gly Thr
595 600 605
Ala Asn Ala Thr Leu Val Ile Gly Thr Gln Ala Ile Glu Ala Ser Leu
610 615 620
Asp Ile Asp Leu Asp Leu Leu Arg Thr Glu Leu Cys Pro Ala Pro Ser
625 630 635 640
Leu Ile Gln Arg Ala Gly Arg Leu Trp Arg Arg Leu Asp Pro Gln Arg
645 650 655
Glu Val Arg Val Pro Gly Met Val Gly Lys Lys Leu Thr Ile Ala Val
660 665 670
Val Asp Ser Pro Ser Thr Gly Gln Thr Leu Pro Tyr Leu Arg Ser Gln
675 680 685
Leu Tyr Arg Val Glu Ser Trp Leu Lys Gln Arg Asp Arg Ile Glu Phe
690 695 700
Pro Ala Asp Ile Gln Asp Phe Ile Asp Ala Thr Thr Pro Gly Leu Gln
705 710 715 720
Glu Leu Phe Gln Lys Val Ser Leu Pro Glu Asp Cys Gly Ser Ala Glu
725 730 735
Glu Arg Glu Ala Leu Ala Asp Asp Tyr Leu Asn Glu Val Ala Ser Trp
740 745 750
Val Thr Lys Gln Arg Gln Ala Gly Thr Ser Arg Ile Asp Phe Ala Lys
755 760 765
His Gly Lys Pro Arg Gln Val Leu Ala Ser Asp Cys Val Val Glu Asp
770 775 780
Phe Leu Gln Ile Thr Ser Ala Asn Asn Leu Glu Glu Ser Ala Thr Arg
785 790 795 800
Leu Ile Asp Tyr Pro Ser Ile Ser Ala Ile Leu Cys Asp Pro Thr Gly
805 810 815
Thr Ile Pro Gly Ala Trp Thr Asp Ser Val Glu Lys Leu Ile Ala Ile
820 825 830
Ser Ala Lys Asp Ser Glu Ser Leu Arg Arg Ala Leu Arg Ala Ser Ile
835 840 845
Ser Ile Pro His Ser Lys Lys Phe Leu Pro Ile Thr Ser Arg Glu Ile
850 855 860
Pro Leu Ser Glu Ala Lys Thr Leu Leu Ser Gly Tyr Ser Ala Val His
865 870 875 880
Ile Gln Pro Asp Glu Tyr Asp Leu Gln Ser Gly Leu Lys Gly Pro Gln
885 890 895
Lys
<210> 20
<211> 876
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Corynebacterium diphtheria
<400> 20
Met Asn Pro His Glu Glu Leu Trp Ala Lys Gln Lys Gly Leu Ala Lys
1 5 10 15
Pro Tyr Pro Leu Leu Ala His Leu Leu Asp Ser Ala Ala Val Ala Gly
20 25 30
Ala Leu Trp Asp His Trp Leu Arg Gln Asp Leu Arg Gln Met Phe Ile
35 40 45
Glu Glu Leu Gly Ser Asn Ala Arg Glu Ile Ile Gln Phe Val Val Gly
50 55 60
Ser His Asp Ile Gly Lys Ala Thr Pro Leu Phe Gln Tyr Gln Lys Ala
65 70 75 80
Gln Lys Gly Glu Val Trp Asp Ser Ile Arg Tyr Ala Ile Asp Arg Thr
85 90 95
Gly Arg Tyr Gln Lys Pro Leu Pro Ser Ser Tyr Leu Val Lys Lys Thr
100 105 110
Ser Gly Gly Pro Asn Arg His Glu Gln Trp Ser Ser Phe Ala Ser Lys
115 120 125
Asn Glu Tyr Leu Lys Pro Ser Ala Ala Ala Lys Glu Asn Trp Ile Gly
130 135 140
Leu Ala Ile Gly Gly His His Gly Arg Phe Glu Pro Val Gly Tyr Gly
145 150 155 160
Arg His Gln Arg Lys Ala Ala Glu Asp Leu Ala Lys Ser Gly Trp Ser
165 170 175
Ala Ala Gln Gln Asp Leu Leu Arg Ala Leu Glu Lys Ala Ser Gly Ile
180 185 190
Thr Arg Ala Ser Leu Pro Ser Glu Leu Ser Pro Glu Leu Thr Leu Val
195 200 205
Leu Ser Gly Leu Thr Ile Leu Ala Asp Arg Ile Ser Ser Thr Glu Ser
210 215 220
Phe Val Ile Thr Gly Ala Arg Met Ile Asp Asp Gly Thr Leu His Leu
225 230 235 240
Ala Thr Pro Ile Asp Trp Leu Lys Thr Arg Lys Leu Asp Ser Glu Lys
245 250 255
His Val Ala Lys Thr Val Gly Ile Tyr His Gly Trp Asn Asn His Glu
260 265 270
Ser Ala Ile His Ser Ile Leu Lys Gly Tyr Asp Pro Arg Pro Leu Gln
275 280 285
Thr Ile Ala Leu Gln Asn Gln Val Gly Leu Leu Asn Leu Met Ala Pro
290 295 300
Thr Gly Asn Gly Lys Thr Glu Ala Ala Ile Leu Arg His Ser Leu Lys
305 310 315 320
Glu Asn Asp Arg Leu Ile Phe Leu Leu Pro Thr Gln Ala Thr Ser Asn
325 330 335
Ala Ile Met Arg Arg Val Gln Gly Ile Tyr Ser Asp Thr Pro Asn Ala
340 345 350
Ala Ala Leu Ala His Ser Leu Ala Ser Val Glu Asp Phe Tyr Gln Thr
355 360 365
Pro Leu Ser Val Phe Asp Asp His Tyr Asp Pro Ser Lys Glu Gln Phe
370 375 380
Glu Ser Ser Met Ser Gly Gly Leu Tyr Pro Ser Ser Phe Val Cys Ser
385 390 395 400
Gly Ala Ala Arg Leu Leu Ala Pro Ile Cys Ile Gly Thr Val Asp Gln
405 410 415
Ala Leu Ala Thr Ala Leu Pro Gly Lys Trp Ile His Leu Arg Ile Leu
420 425 430
Ala Leu Ala Asn Ala His Ile Val Ile Asp Glu Val His Thr Leu Asp
435 440 445
His Tyr Gln Thr Ala Leu Leu Glu Asn Ile Leu Pro Ile Leu Ala Lys
450 455 460
Leu Lys Thr Lys Ile Thr Phe Leu Thr Ala Thr Met Pro Ser Trp Gln
465 470 475 480
Arg Thr Lys Leu Leu Thr Ala Tyr Gly Gly Glu Asp Leu Gln Ile Pro
485 490 495
Pro Thr Val Phe Pro Ala Ala Glu Thr Val Leu Pro Gly Gln Phe Asn
500 505 510
Arg Thr Leu Ile Asp Ser Asp Ser Thr Thr Ile Asp Phe Thr Met Glu
515 520 525
Glu Thr Ser Tyr Asp His Leu Val Glu Ser His Val Lys Trp His Gln
530 535 540
Thr Thr Arg Leu Asn Ala Pro His Ala Arg Ile Gly Leu Ile Cys Asn
545 550 555 560
Thr Val Lys Arg Ala Gln Glu Ile Ala Ala Ala Leu Glu Lys Thr Asn
565 570 575
Asp Arg Ile Val Leu Leu His Ser Arg Met Thr Thr Glu His Arg Arg
580 585 590
Arg Ser Ala Glu Leu Leu Glu Ser Leu Leu Gly Pro Asn Gly Asn Arg
595 600 605
Lys Thr Ile Thr Val Val Gly Thr Gln Ala Ile Glu Ala Ser Leu Asp
610 615 620
Ile Asp Leu Asp Ile Leu Arg Thr Glu Leu Cys Pro Ala Pro Ser Leu
625 630 635 640
Val Gln Arg Ala Gly Arg Val Trp Arg Arg Asn Asp Pro Tyr Arg Ser
645 650 655
Ser Arg Ile Thr Ala Asp His Lys Pro Ile Ser Val Val Phe Ile Ala
660 665 670
Glu Ala Lys Asp Trp Gln Val Leu Pro Tyr Leu Arg Ala Glu Thr Ser
675 680 685
Arg Thr Gln Arg Trp Leu Glu Lys His Asn Gln Met Phe Leu Pro Gln
690 695 700
Met Ala Gln Glu Phe Ile Asp Ala Ala Thr Val Asp Leu Asp Thr Ala
705 710 715 720
Thr Ser Glu Met Asp Leu Asp Ala Leu Ala Leu Met Gly Ile His Leu
725 730 735
Met Lys Ala Asp Gly Ala Lys Ala Arg Ile Gln Asp Val Leu Asn Ser
740 745 750
Asp Ser Lys Val Ser Asp Phe Ala Leu Leu Thr Ser Lys Asn Glu Ile
755 760 765
Asp Glu Ala Gln Thr Arg Leu Ile Glu Glu Gly Thr His Leu Arg Ile
770 775 780
Ile Leu Gly Asp Glu Asn Glu Ser Ile Pro Gly Gly Trp Lys His Gly
785 790 795 800
Leu Ser Ser Leu Leu Lys Leu Lys Ala Ser Asp Arg Glu Ser Leu Arg
805 810 815
Thr Ala Leu Leu Ala Ser Ile Pro Leu Leu Val Ser Glu Lys Gln Lys
820 825 830
Gln Leu Leu Tyr Gln His Asn Leu Val Pro Leu Ser Ser Ser Lys Thr
835 840 845
Val Leu Ala Gly Phe Tyr Phe Leu Pro Lys Ala Gln Asn Phe Tyr Ser
850 855 860
Lys Asn Leu Gly Phe Ile Trp Pro Glu Glu Lys Asp
865 870 875
<210> 21
<211> 773
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Spiroplasma syrphidicola
<400> 21
Met Asn Tyr Lys Lys Leu Ile Leu Gly Leu Asp Leu Gly Ile Ala Ser
1 5 10 15
Cys Gly Trp Ala Val Thr Gly Gln Met Glu Asp Gly Asn Trp Val Leu
20 25 30
Asp Asp Phe Gly Val Arg Leu Phe Gln Thr Pro Glu Asn Ser Lys Asp
35 40 45
Gly Thr Thr Asn Ala Ala Ala Arg Arg Leu Lys Arg Gly Ala Arg Arg
50 55 60
Leu Ile Lys Arg Arg Lys Asn Arg Ile Lys Asp Leu Lys Asn Leu Phe
65 70 75 80
Glu Lys Ile Asn Phe Ile Asn Lys Ala Ser Leu Asp Lys Tyr Ile Asn
85 90 95
Glu His Ser Ala Thr Asn Leu Val Glu Asp Phe Asn Arg His Glu Leu
100 105 110
Tyr Asn Pro Tyr Phe Leu Arg Ser Ile Gly Ile Thr Glu Lys Leu Thr
115 120 125
Arg Glu Glu Leu Val Trp Ser Leu Ile His Ile Ala Asn Arg Arg Gly
130 135 140
Tyr Lys Asn Lys Phe Ala Phe Asp Ile Glu Gly Asp Gly Lys Lys Arg
145 150 155 160
Glu Thr Lys Leu Asp Glu Ala Ile Ser Asn Ala Leu Ile Ser Ser Asn
165 170 175
Leu Thr Ile Ser Gln Glu Ile Val Arg Asn Lys Lys Phe Arg Asp Ala
180 185 190
Lys Asn Lys Lys Ala Leu Leu Val Arg Asn Lys Gly Gly Lys Glu Gly
195 200 205
Glu Asn Asn Phe Gln Phe Leu Phe Ala Arg Asp Asp Tyr Lys Lys Glu
210 215 220
Val Asp Leu Leu Leu Ala Lys Gln Ala Lys Phe Tyr Pro Glu Leu Thr
225 230 235 240
Glu Glu Ile Arg Ala Lys Ala Ala Asp Ile Ile Phe Arg Gln Arg Asp
245 250 255
Phe Glu Asp Gly Pro Gly Pro Lys Lys Gln Glu Leu Arg Glu Ile Tyr
260 265 270
Lys Lys Glu Asn Lys Gln Phe Ser Lys Asn Phe Thr Gln Leu Glu Gly
275 280 285
Arg Cys Thr Phe Leu Arg Glu Leu Ser Val Gly Tyr Lys Ser Ser Ile
290 295 300
Leu Phe Asp Leu Phe His Ile Ile Ser Glu Val Ser Lys Ile Ser Lys
305 310 315 320
Tyr Ile Glu Glu Asn Asp Gln Leu Ala Gln Asp Ile Ile Ser Ser Phe
325 330 335
Leu Tyr Asn Glu Ala Gly Lys Lys Gly Lys Thr Leu Leu Lys Glu Ile
340 345 350
Leu Lys Lys His His Ile Asn Asp Asp Ile Phe Asp Thr Asn Ala Tyr
355 360 365
Lys Asn Ile Asp Phe Lys Thr Asn Tyr Leu Asn Leu Leu Lys Glu Val
370 375 380
Phe Gly Asn Asp Val Leu Lys Asn Leu Ser Leu Asn Arg Leu Glu Asp
385 390 395 400
Asn Ile Tyr His Gln Leu Gly Phe Ile Ile His Thr Asn Ile Thr Pro
405 410 415
Glu Arg Lys Glu Lys Ala Ile Asn Gln Trp Leu Leu Glu Asn Asn Ile
420 425 430
Ile Leu Ala Lys Glu Lys Leu Asn Ile Leu Leu Lys Pro Asn Ser Ser
435 440 445
Ile Ser Thr Thr Val Lys Thr Ser Phe Lys Trp Met Ser Ile Ala Ile
450 455 460
Ser Asn Phe Leu Lys Gly Ile Pro Tyr Gly Lys Phe Gln Ala Gln Phe
465 470 475 480
Ile Lys Glu Asp Asn Phe Lys Leu Pro Glu Ser Tyr Ala Lys Gln Tyr
485 490 495
Gln Lys Tyr Leu Thr Gly Glu Lys Thr Phe Glu Met Phe Ala Pro Ile
500 505 510
Ile Asp Pro Asp Leu Trp Arg Asn Pro Ile Val Phe Arg Ala Ile Asn
515 520 525
Gln Ala Arg Lys Val Ile Lys Lys Leu Phe Glu Lys Tyr Thr Phe Ile
530 535 540
Asp Gln Ile Asn Ile Glu Leu Thr Arg Glu Met Gly Leu Ser Phe Ser
545 550 555 560
Asp Arg Lys Lys Val Lys Glu Arg Gln Asp Asp Ser Leu Lys Glu Asn
565 570 575
Ala Lys Ala Lys Glu Phe Leu Met Ala Asn Gly Ile Ile Val Asn Asp
580 585 590
Thr Asn Val Leu Lys Tyr Lys Leu Trp Ile Gln Gln Asn Lys Lys Ser
595 600 605
Leu Tyr Ser Gly Lys Glu Ile Thr Ile Ala Asp Leu Gly Ala Ser Asn
610 615 620
Val Leu Gln Ile Asp His Ile Ile Pro Tyr Ser Lys Leu Ala Asp Asp
625 630 635 640
Ser Phe Asn Asn Lys Val Leu Val Phe Ser Lys Glu Asn Gln Glu Lys
645 650 655
Gly Asn Gln Phe Ala Asp Gln Tyr Val Lys Ser Leu Gly Thr Glu Asn
660 665 670
Tyr Asn Asn Tyr Lys Lys Arg Val Asn Tyr Leu Leu Phe Gln Asn Gln
675 680 685
Ile Asn Gln Lys Lys Ala Glu Tyr Leu Leu Cys Ser Asn Gln Asn Glu
690 695 700
Glu Ile Leu Asn Asp Phe Val Ser Arg Asn Leu Asn Asp Thr Arg Tyr
705 710 715 720
Ile Thr Arg Tyr Val Thr Asn Trp Leu Lys Ala Glu Phe Glu Leu Gln
725 730 735
Ser Arg Phe Gly Leu Ala Lys Pro Lys Ile Met Thr Leu Asn Gly Ala
740 745 750
Ile Thr Ser Arg Phe Arg Arg Thr Trp Leu Arg Asn Ser Pro Trp Gly
755 760 765
Leu Glu Lys Lys Ser
770
<210> 22
<211> 1380
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Prevotella intermedia
<400> 22
Met Lys Arg Ile Leu Gly Leu Asp Leu Gly Thr Thr Ser Ile Gly Trp
1 5 10 15
Ala Leu Val Asn Glu Ala Glu Asn Asn Asn Glu Ala Ser Ser Ile Val
20 25 30
Arg Leu Gly Val Arg Val Asn Pro Leu Thr Val Asp Glu Lys Ser Asn
35 40 45
Phe Glu Lys Gly Lys Ala Ile Thr Thr Asn Ala Asp Arg Gln Leu Arg
50 55 60
His Gly Ala Arg Ile Asn Leu Gln Arg Tyr Lys Leu Arg Arg Gln Asn
65 70 75 80
Leu His Asp Cys Leu Gln Lys Gln Gly Trp Leu Gly Thr Glu Ala Met
85 90 95
Tyr Glu Glu Gly Lys Ala Ser Thr Phe Glu Thr Tyr Lys Leu Arg Ala
100 105 110
Lys Ala Ala Glu Glu Glu Ile Ser Leu His Glu Phe Ala Arg Val Leu
115 120 125
Phe Met Leu Asn Lys Lys Arg Gly Tyr Lys Ser Asn Arg Lys Ala Asn
130 135 140
Asn Lys Glu Asp Gly Gln Leu Phe Asp Gly Met Thr Ile Ala Lys Lys
145 150 155 160
Leu Tyr Glu Glu His Leu Thr Pro Ala Glu Tyr Ser Leu Gln Leu Leu
165 170 175
Asn Lys Gly Lys Lys Phe Thr Gln Gly Tyr Tyr Arg Ser Asp Leu Asn
180 185 190
Ala Glu Leu Glu Arg Ile Trp Asp Glu Gln Lys Lys Tyr Tyr Pro Glu
195 200 205
Ile Leu Thr Asp Glu Phe Lys Gln Gln Leu Glu Gly Lys Thr Lys Thr
210 215 220
Asn Thr Ser Lys Ile Phe Leu Ala Lys Tyr Gly Ile Tyr Ser Ala Asp
225 230 235 240
Leu Lys Gly Leu Asp Arg Lys Phe Gln Pro Leu Lys Trp Arg Val Glu
245 250 255
Ala Leu Gln Gln Gln Val Asp Lys Glu Val Leu Ala Phe Val Ile Ser
260 265 270
Asp Leu Lys Gly Gln Ile Ala Asn Thr Ser Gly Leu Leu Gly Ala Ile
275 280 285
Ser Asp Arg Ser Lys Glu Leu Tyr Phe Asn Lys Gln Thr Val Gly Gln
290 295 300
Tyr Leu Trp Ala Ser Leu Glu Glu Asn Pro His Ile Ser Ile Lys Asn
305 310 315 320
Lys Pro Phe Tyr Arg Gln Asp Tyr Leu Asp Glu Phe Glu Lys Ile Trp
325 330 335
Glu Thr Gln Ala Ala Phe His Lys Gln Leu Thr Pro Glu Leu Lys Gln
340 345 350
Glu Ile Arg Asp Ile Ile Ile Phe Tyr Gln Arg Pro Leu Lys Ser Lys
355 360 365
Lys Ser Leu Ile Ser Val Cys Glu Leu Glu Gln Arg Lys Val Lys Ala
370 375 380
Thr Ile Asp Gly Lys Glu Lys Glu Ile Thr Ile Gly Pro Lys Val Ala
385 390 395 400
Pro Lys Ser Ser Pro Val Phe Gln Glu Phe Arg Ile Trp Gln Asn Leu
405 410 415
Asn Asn Val Leu Leu Ile Asp Asn Asp Thr Asn Glu Lys Arg Pro Leu
420 425 430
Asp Glu Val Glu Arg Asn Leu Leu Tyr Lys Glu Leu Ser Ile Lys Ala
435 440 445
Lys Leu Ser Lys Thr Glu Ala Leu Lys Ile Leu Asn Lys Lys Gly Lys
450 455 460
Gln Trp Asp Leu Asn Tyr Arg Glu Leu Glu Gly Asn Arg Thr Gln Ala
465 470 475 480
Ile Leu Phe Asp Cys Tyr Asn Arg Ile Ile Thr Leu Thr Gly His Glu
485 490 495
Glu Cys Asp Phe Lys Lys Ile Lys Ala Ser Glu Ile Arg His Tyr Val
500 505 510
Ser Thr Ile Phe Lys Asn Leu Gly Phe Ser Thr Glu Ile Leu Asp Phe
515 520 525
Asp Pro Ser Leu Lys Lys His Glu Leu Glu Lys Gln Pro Met Tyr Gln
530 535 540
Leu Trp His Leu Leu Tyr Ser Tyr Glu Ser Asp Asn Ser Arg Thr Gly
545 550 555 560
Asn Glu Ser Leu Leu Arg Lys Leu Glu Thr Thr Phe Gly Phe Pro Glu
565 570 575
Glu Tyr Ala Thr Val Leu Cys Asp Val Val Phe Glu Glu Asp Tyr Gly
580 585 590
Asn Leu Ser Val Lys Ala Met Arg Glu Ile Leu Pro Tyr Leu Gln Ala
595 600 605
Gly Asn Asp Tyr Ser Gln Ala Cys Ala Tyr Ala Gly Tyr Asn His Ser
610 615 620
Arg His Ser Leu Thr Lys Glu Glu Leu Asp Gln Lys Val Tyr Lys Glu
625 630 635 640
Arg Leu Glu Leu Leu Pro Lys Asn Ser Leu Arg Asn Pro Val Val Glu
645 650 655
Lys Ile Leu Asn Gln Met Ile Asn Val Ile Asn Ala Ile Ile Asp Glu
660 665 670
Tyr Gly Lys Pro Asp Glu Ile Arg Ile Glu Met Ala Arg Glu Leu Lys
675 680 685
Ser Ser Ala Ala Asp Arg Lys Lys Thr Thr His Ala Ile Ser Gln Gly
690 695 700
Asn Ala Glu Asn Gln Arg Ile Arg Glu Ile Leu Glu Lys Glu Phe Ser
705 710 715 720
Leu Ser Tyr Ile Ser Arg Asn Asp Ile Ile Lys Tyr Lys Leu Tyr Glu
725 730 735
Glu Leu Glu Pro Asn Tyr Tyr Lys Thr Leu Tyr Ser Asp Thr Tyr Ile
740 745 750
Thr Lys Asp Lys Leu Phe Ser Lys Asp Phe Asp Ile Glu His Ile Ile
755 760 765
Pro Lys Ala Arg Leu Phe Asp Asp Ser Phe Ser Asn Lys Thr Leu Glu
770 775 780
Ala Arg Asn Ile Asn Leu Glu Lys Ser Asn Lys Thr Ala Phe Asp Phe
785 790 795 800
Ile Lys Glu Lys Tyr Gly Glu Asp Gly Ala Glu Ala Tyr Lys Lys Lys
805 810 815
Leu Asp Met Leu Leu Glu Asn Asp Ala Ile Ser Arg Pro Lys Tyr Asn
820 825 830
Asn Leu Leu Arg Ala Glu Ala Asp Ile Pro Ser Asp Phe Ile Asn Arg
835 840 845
Asp Leu Arg Asn Thr Gln Tyr Ile Ala Lys Lys Ala Cys Glu Ile Leu
850 855 860
Gly Glu Leu Val Lys Thr Val Thr Pro Thr Thr Gly Lys Ile Thr Asn
865 870 875 880
Arg Leu Arg Glu Asp Trp Gln Leu Val Asp Val Met Lys Glu Leu Asn
885 890 895
Phe Glu Lys Tyr Glu Lys Leu Gly Leu Thr Glu Ile Val Glu Asp Arg
900 905 910
Asp Gly Arg Lys Ile Lys Arg Ile Lys Asp Trp Thr Lys Arg Asn Asp
915 920 925
His Arg His His Ala Met Asp Ala Leu Ala Ile Ala Phe Thr Lys Pro
930 935 940
Ser Phe Ile Gln Tyr Leu Asn Asn Leu Asn Ala Arg Ser Asn Lys Gly
945 950 955 960
Asp Ser Ile Tyr Ala Ile Glu Asn Lys Glu Leu His Tyr Glu Glu Gly
965 970 975
Lys Leu Arg Phe Asn Ala Pro Ile Pro Val Asn Glu Phe Arg Ala Glu
980 985 990
Ala Lys Arg His Leu Ser Ala Ile Leu Val Ser Ile Lys Ala Lys Asn
995 1000 1005
Lys Val Met Thr Gln Asn Val Asn Lys Ile Lys Thr Lys His Gly
1010 1015 1020
Ile Ile Lys Lys Ile Gln Leu Thr Pro Arg Gly Pro Leu His Asn
1025 1030 1035
Glu Thr Ile Tyr Gly Thr Lys Met Arg Pro Ile Ile Lys Met Val
1040 1045 1050
Lys Val Gly Ala Ala Leu Asp Glu Ala Thr Ile Asn Lys Val Ser
1055 1060 1065
Ser Pro Ala Ile Arg Glu Ala Leu Leu Lys Arg Leu Asn Glu Tyr
1070 1075 1080
Ser Gly Asn Ala Lys Lys Ala Phe Thr Gly Lys Asn Thr Leu Glu
1085 1090 1095
Lys Asn Pro Ile Tyr Leu Asn Ala Gly Arg Thr Lys Thr Val Pro
1100 1105 1110
Ser Leu Val Lys Thr Val Glu Trp Glu Ser Phe His Pro Thr Arg
1115 1120 1125
Lys Leu Ile Asp Lys Asp Leu Asn Val Asp Lys Val Val Asp Lys
1130 1135 1140
Gly Ile Arg Glu Ile Leu Lys Ala Arg Leu Glu Glu Phe Asn Gly
1145 1150 1155
Asp Ala Lys Lys Ala Phe Ser Asn Leu Glu Glu Asn Pro Ile Tyr
1160 1165 1170
Leu Asp Glu Ala Lys Lys Ile Ala Leu Lys Arg Val Ser Ile Glu
1175 1180 1185
Gly Val Leu Ser Ala Ile Pro Leu His Thr Leu Lys Asn Gln Ala
1190 1195 1200
Gly Lys Pro Ile Thr Gly Lys Asp Gly Lys Pro Val Leu Gly Asn
1205 1210 1215
Tyr Val Gln Thr Ser Asn Asn His His Ile Ala Phe Tyr Tyr Asp
1220 1225 1230
Glu Asp Gly Asn Leu Gln Asp Asn Ala Val Ser Phe Phe Glu Ala
1235 1240 1245
Ala Glu Arg Lys Ser Gln Gly Ile Pro Val Ile Asp Lys Asp Tyr
1250 1255 1260
Asn Arg Asp Lys Gly Trp Arg Phe Leu Phe Thr Met Lys Gln Asn
1265 1270 1275
Glu Tyr Phe Val Phe Pro Asn Glu Ala Thr Gly Phe Ile Pro Ser
1280 1285 1290
Glu Val Asp Leu Thr Asp Glu Ala Asn Tyr Gly Ile Ile Ser Pro
1295 1300 1305
Asn Leu Tyr Arg Val Gln Lys Val Ser Arg Ile Asp Lys Gly Thr
1310 1315 1320
Ser Ala Ser Arg Asp Tyr Trp Phe Arg His His Leu Glu Thr Ile
1325 1330 1335
Leu Asn Asp Asp Ala Lys Leu Lys Asn Leu Ala Phe Lys Arg Ile
1340 1345 1350
Arg Gly Leu Leu Glu Leu Lys Asp Ile Ile Lys Val Arg Ile Asn
1355 1360 1365
Ser Thr Gly Lys Ile Val Ala Val Gly Glu Tyr Asp
1370 1375 1380
<210> 23
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Spiroplasma taiwanense
<400> 23
Met Trp Ser Arg Lys Ile Leu Lys Ala Gly Ser Arg Leu Phe Asp Glu
1 5 10 15
Ala Asn Leu Ser Asp Lys Ile Ala Ser Lys Arg Arg Glu Gln Arg Gly
20 25 30
Arg Arg Arg Asn Leu Arg Arg Lys Ile Thr Trp Lys Gln Asp Leu Ile
35 40 45
Asn Leu Phe Val Lys Tyr Asn Phe Leu Gln Lys Glu Asn Asp Phe Tyr
50 55 60
Glu Leu Asp Phe Asn Phe Asp Leu Leu Glu Leu Arg Lys Lys Ala Ile
65 70 75 80
Asn Ser Lys Ile Glu Leu Glu Gln Leu Leu Ile Ile Leu Phe Asn Tyr
85 90 95
Ile Lys His Arg Gly Ser Phe Asn Tyr Arg Glu Asp Leu Ser Glu Leu
100 105 110
Lys Asn Ile Ser Gln Glu Glu Leu Glu Thr Ser Ser Glu Phe Lys Leu
115 120 125
Pro Val Asp Ile Gln Phe Glu Leu Lys Glu Glu Asn Asn Lys Phe Arg
130 135 140
Glu Ile Asn Asn Glu Lys Ser Leu Ile Asn His Glu Trp Tyr Val Lys
145 150 155 160
Glu Ile Asn Leu Ile Leu Asp Ala Gln Ile Glu Asn Lys Leu Ile Asn
165 170 175
Leu Asp Phe Lys Lys Asp Tyr Leu Lys Leu Phe Asn Arg Lys Arg Glu
180 185 190
Tyr Tyr Asp Gly Pro Gly Pro Lys Asp Lys Asn Leu Leu Asn Pro Ser
195 200 205
Lys Tyr Gly Trp Lys Asn Gln Glu Glu Phe Phe Asp Arg Phe Ala Gly
210 215 220
Lys Asp Thr Tyr Asp Ser Lys Glu Gln Arg Ala Pro Lys His Ser Leu
225 230 235 240
Thr Ser Tyr Leu Phe Asn Ile Leu Asn Asp Leu Asn Asn Leu Ser Ile
245 250 255
Asn Gly Asp Arg Asn Gln Leu Thr Tyr Glu Asn Lys Lys Asp Leu Ile
260 265 270
Asn Leu Thr Leu Ile Asn Gln Lys Glu Lys Ala Glu Asn Ile Thr Leu
275 280 285
Lys Lys Ile Ala Lys Tyr Leu Lys Ile Asn Glu Lys Asn Ile Thr Gly
290 295 300
Tyr Arg Leu Lys Pro Asn Ser Asn Glu Ser Ile Phe Thr Val Phe Glu
305 310 315 320
Ser Ala Asn Lys Met Arg Ser Ile Leu Val Lys Asn Asn Lys Ser Ile
325 330 335
Asp Phe Ile Cys Leu Glu Asn Ile Asp Lys Ile Asp Lys Ile Val Asp
340 345 350
Ile Leu Thr Lys Tyr Gln Ser Ile Glu Asp Lys Ser Leu Lys Leu Glu
355 360 365
Glu Leu Asn Phe Asp Phe Phe Asp Lys Glu Thr Cys Glu Lys Leu Ala
370 375 380
Val Ile Ser Leu Thr Gly Thr His Ala Leu Ser Lys Lys Thr Met Ser
385 390 395 400
Lys Leu Ile Glu Glu Met Phe His Asp Asn Leu Asn His Met Glu Ala
405 410 415
Leu Ala Lys Leu Lys Ile Lys Pro Asp Tyr Lys Leu Lys Val Asp Leu
420 425 430
Thr Asn Phe Lys Thr Ile Pro Ile Leu Arg Glu Lys Ile Asn Glu Met
435 440 445
Tyr Ile Ser Pro Val Val Lys Arg Ala Leu Ile Glu Ser Leu Lys Ile
450 455 460
Ile Lys Glu Leu Glu Arg His Phe Lys Asp Phe Glu Ile Lys Asp Ile
465 470 475 480
Val Ile Glu Met Ala Lys Lys Asn Ser Ala Glu Lys Lys Gln Phe Ile
485 490 495
Ser Lys Ile Gln Arg Gln Asn Val Asp Leu Val Lys Lys Leu Ser Asn
500 505 510
Asp Tyr Ser Leu Asp Glu Asn Lys Leu Asn Phe Lys Met Lys Glu Lys
515 520 525
Phe Leu Leu Leu Ser Glu Gln
530 535
<210> 24
<211> 1281
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Streptococcus iniae
<400> 24
Met Arg Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Arg Ile Gln Gly Thr Thr Asp Arg Thr Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Asn Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Thr Arg Arg Arg Tyr Thr Arg Arg Lys Tyr Arg Ile Lys
65 70 75 80
Glu Leu Gln Lys Ile Phe Ser Ser Glu Met Asn Glu Leu Asp Ile Ala
85 90 95
Phe Phe Pro Arg Leu Ser Glu Ser Phe Leu Val Ser Asp Asp Lys Glu
100 105 110
Phe Glu Asn His Pro Ile Phe Gly Asn Leu Lys Asp Glu Ile Thr Tyr
115 120 125
His Asn Asp Tyr Pro Thr Ile Tyr His Leu Arg Gln Thr Leu Ala Asp
130 135 140
Ser Asp Gln Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asn Leu Asp Ser
165 170 175
Glu Asn Thr Asp Val His Val Leu Phe Leu Asn Leu Val Asn Ile Tyr
180 185 190
Asn Asn Leu Phe Glu Glu Asp Ile Val Glu Thr Ala Ser Ile Asp Ala
195 200 205
Glu Lys Ile Leu Thr Ser Lys Thr Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Glu Ile Pro Asn Gln Lys Arg Asn Met Leu Phe Gly Asn
225 230 235 240
Leu Val Ser Leu Ala Leu Gly Leu Thr Pro Asn Phe Lys Thr Asn Phe
245 250 255
Glu Leu Leu Glu Asp Ala Lys Leu Gln Ile Ser Lys Asp Ser Tyr Glu
260 265 270
Glu Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Ile Ala Ala Lys Lys Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Ile Thr Val Lys Gly Ala Ser Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Val Gln Arg Tyr Glu Glu His Gln Gln Asp Leu Ala Leu Leu Lys
325 330 335
Asn Leu Val Lys Lys Gln Ile Pro Glu Lys Tyr Lys Glu Ile Phe Asp
340 345 350
Asn Lys Glu Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Tyr Ile Lys Pro Ile Leu Leu Lys Leu Asp
370 375 380
Gly Thr Glu Lys Leu Ile Ser Lys Leu Glu Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Asn Glu Leu Lys Ala Ile Ile Arg Arg Gln Glu Lys Phe Tyr Pro Phe
420 425 430
Leu Lys Glu Asn Gln Lys Lys Ile Glu Lys Leu Phe Thr Phe Lys Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Asn Gly Gln Ser Ser Phe Ala Trp
450 455 460
Leu Lys Arg Gln Ser Asn Glu Ser Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Gln Glu Ala Ser Ala Arg Ala Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Thr Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Pro Leu Tyr Glu Met Phe Met Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Gln Thr Glu Gly Met Lys Arg Pro Val Phe Leu Ser Ser Glu Asp
530 535 540
Lys Glu Glu Ile Val Asn Leu Leu Phe Lys Lys Glu Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Glu Tyr Phe Ser Lys Met Lys Cys Phe His
565 570 575
Thr Val Thr Ile Leu Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Phe Lys Asp Lys Ala Phe Leu Asp
595 600 605
Asp Glu Ala Asn Gln Asp Ile Leu Glu Glu Ile Val Trp Thr Leu Thr
610 615 620
Leu Phe Glu Asp Gln Ala Met Ile Glu Arg Arg Leu Val Lys Tyr Ala
625 630 635 640
Asp Val Phe Glu Lys Ser Val Leu Lys Lys Leu Lys Lys Arg His Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Gln Lys Leu Ile Asn Gly Ile Lys Asp
660 665 670
Lys Gln Thr Gly Lys Thr Ile Leu Gly Phe Leu Lys Asp Asp Gly Val
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Ser Ser Leu Asp Phe
690 695 700
Ala Lys Ile Ile Lys Asn Glu Gln Glu Lys Thr Ile Lys Asn Glu Ser
705 710 715 720
Leu Glu Glu Thr Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Ile Val Lys Ile Met
740 745 750
Gly Gln Asn Pro Asp Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Ser Thr Met Gln Gly Ile Lys Asn Ser Arg Gln Arg Leu Arg Lys Leu
770 775 780
Glu Glu Val His Lys Asn Thr Gly Ser Lys Ile Leu Lys Glu Tyr Asn
785 790 795 800
Val Ser Asn Thr Gln Leu Gln Ser Asp Arg Leu Tyr Leu Tyr Leu Leu
805 810 815
Gln Asp Gly Lys Asp Met Tyr Thr Gly Lys Glu Leu Asp Tyr Asp Asn
820 825 830
Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ser Phe Ile Lys
835 840 845
Asp Asn Ser Ile Asp Asn Thr Val Leu Thr Thr Gln Ala Ser Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Asn Ile Glu Thr Val Asn Lys Met Lys
865 870 875 880
Ser Phe Trp Tyr Lys Gln Leu Lys Ser Gly Ala Ile Ser Gln Arg Lys
885 890 895
Phe Asp His Leu Thr Lys Ala Glu Arg Gly Ala Leu Ser Asp Phe Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Phe Asn Ser Asn Leu Thr
930 935 940
Glu Asp Ser Lys Ser Asn Arg Asn Val Lys Ile Ile Thr Leu Lys Ser
945 950 955 960
Lys Met Val Ser Asp Phe Arg Lys Asp Phe Gly Phe Tyr Lys Leu Arg
965 970 975
Glu Val Asn Asp Tyr His His Ala Gln Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Leu Lys Lys Tyr Pro Lys Leu Glu Ala Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys His Tyr Asp Leu Ala Lys Leu Met Ile
1010 1015 1020
Gln Pro Asp Ser Ser Leu Gly Lys Ala Thr Thr Arg Met Phe Phe
1025 1030 1035
Tyr Ser Asn Leu Met Asn Phe Phe Lys Lys Glu Ile Lys Leu Ala
1040 1045 1050
Asp Asp Thr Ile Phe Thr Arg Pro Gln Ile Glu Val Asn Thr Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Val Lys Asp Met Gln Thr Ile
1070 1075 1080
Arg Lys Val Met Ser Tyr Pro Gln Val Asn Ile Val Met Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Trp Pro Lys
1100 1105 1110
Gly Asp Ser Asp Lys Leu Ile Ala Arg Lys Lys Ser Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Ile Ile Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Ile Ala Lys Gly Lys Thr Gln Lys Leu Lys
1145 1150 1155
Thr Ile Lys Glu Leu Val Gly Ile Lys Ile Met Glu Gln Asp Glu
1160 1165 1170
Phe Glu Lys Asp Pro Ile Ala Phe Leu Glu Lys Lys Gly Tyr Gln
1175 1180 1185
Asp Ile Gln Thr Ser Ser Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Lys
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Asn Lys Tyr Val
1220 1225 1230
Lys Phe Leu Tyr Leu Ala Ser His Tyr Thr Lys Phe Thr Gly Lys
1235 1240 1245
Glu Glu Asp Arg Glu Lys Lys Arg Ser Tyr Val Glu Ser His Leu
1250 1255 1260
Tyr Tyr Phe Asp Val Arg Leu Ser Gln Val Phe Arg Val Thr Asn
1265 1270 1275
Val Glu Phe
1280
<210> 25
<211> 1352
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Belliella baltica
<400> 25
Met Lys Lys Ile Leu Gly Leu Asp Leu Gly Thr Thr Ser Ile Gly Trp
1 5 10 15
Ala Phe Ile Lys Glu Pro Glu Lys Asp Val Val Gly Ser Glu Ile Val
20 25 30
Asp Met Gly Val Arg Ile Val Pro Leu Ser Ser Asp Glu Glu Asn Asp
35 40 45
Phe Ala Lys Gly Asn Thr Ile Ser Ile Asn Ala Asp Arg Thr Leu Lys
50 55 60
Arg Gly Ala Arg Arg Asn Leu Gln Arg Phe Lys Gln Arg Arg Asn Ala
65 70 75 80
Leu Leu Glu Ile Phe Lys Glu Lys Lys Leu Ile Ser Thr Asn Phe Lys
85 90 95
Tyr Ala Glu Asp Gly Pro Ser Ser Thr Phe Ser Thr Leu Asn Leu Arg
100 105 110
Ala Lys Ala Ala Lys Glu Lys Ile Glu Leu Gln Asp Leu Val Lys Val
115 120 125
Leu Leu Gln Ile Asn Lys Lys Arg Gly Tyr Lys Ser Ser Arg Lys Ala
130 135 140
Lys Ser Glu Glu Asp Asp Gly Ser Ala Ile Asp Ser Met Gly Ile Ala
145 150 155 160
Lys Glu Leu Tyr Glu Asn Asp Leu Thr Pro Gly Gln Trp Val Tyr Glu
165 170 175
Ala Leu Gln Lys Gly Arg Lys Asn Val Pro Asp Phe Tyr Arg Ser Asp
180 185 190
Leu Gln Glu Glu Phe Lys Lys Ile Val Asn Tyr Gln Ser Glu Phe Phe
195 200 205
Pro Asp Ile Phe Asn Ala Ser Phe Val Glu Asp Trp Met Gly Lys Ala
210 215 220
Ser Thr Pro Thr Lys Gln Tyr Phe Asn Lys Lys Gly Val Gln Leu Ala
225 230 235 240
Glu Asn Lys Gly Lys Arg Glu Glu Arg Arg Leu Gln Glu Tyr Lys Trp
245 250 255
Arg Ala Glu Ala Val Asn Phe Lys Ile Asp Leu Ser Glu Ile Ala Leu
260 265 270
Ile Leu Ser Gln Ile Asn Ser Gln Ile Ser Asn Ser Ser Gly Tyr Leu
275 280 285
Gly Ala Ile Ser Asp Arg Ser Lys Glu Leu Tyr Phe Lys Asn Leu Thr
290 295 300
Val Gly Gln Tyr Leu Tyr Gln Gln Ile Lys Lys Asn Pro His Thr Arg
305 310 315 320
Leu Lys Gly Gln Val Phe Tyr Arg Gln Asp Tyr Leu Asp Glu Phe Glu
325 330 335
Arg Ile Trp Ser Val Gln Ser Ser Phe Tyr Pro Gln Leu Asn Asp Ala
340 345 350
Leu Lys Arg Glu Val Arg Asp Ile Thr Ile Phe Phe Gln Arg Arg Leu
355 360 365
Lys Ser Gln Lys His Leu Ile Ser Asn Cys Glu Phe Glu Asp His His
370 375 380
Lys Val Val Pro Lys Ser His Pro Val Phe Gln Glu Phe Arg Ile Trp
385 390 395 400
Gln Asn Leu Asn Asn Leu Leu Leu Ile Lys Lys Asp Asn Leu Asn Glu
405 410 415
Lys Phe Asp Leu Glu Leu Glu Ser Lys Ile Ala Leu Ala Asn Glu Leu
420 425 430
Ala Phe Lys Arg Glu Leu Asn Val Lys Asp Ala Leu Lys Ile Leu Gly
435 440 445
Leu Lys Pro Asn Glu Trp Glu Phe Asn Phe Thr Lys Ile Glu Gly Asn
450 455 460
Arg Thr Asn Gln Ala Phe Phe Asp Ala Phe Ala Lys Ile Ile Glu Leu
465 470 475 480
Glu Asp Gly Glu Pro Ile Asp Leu Gly Asp Leu Lys Ala Asp Asp Ile
485 490 495
Leu Asp Gln Phe Ser Glu Ala Phe Leu Arg Ile Gly Ile Asp Thr Glu
500 505 510
Leu Leu Gln Val Asn Ser Asp Ile Glu Gly Ala Glu Tyr Glu Lys Gln
515 520 525
Ser Tyr Ile Gln Phe Trp His Leu Leu Tyr Ser Ser Glu Asp Asp Gln
530 535 540
Lys Leu Lys Leu Asn Leu Ile Arg Lys Phe Gly Phe Lys Pro Glu His
545 550 555 560
Ala Lys Ile Leu Ala Ser Ile Ser Leu Gln Asp Asp His Ala Ser Leu
565 570 575
Ser Ser Arg Ala Ile Lys Lys Ile Leu Pro His Leu Gln Ser Gly Leu
580 585 590
Ile Tyr Asp Lys Ala Cys Thr Tyr Ala Gly Tyr Asn His Ser Ser Ser
595 600 605
Phe Thr Lys Asp Glu Asn Glu Lys Arg Glu Leu Arg Ala Glu Leu Glu
610 615 620
Leu Leu Lys Lys Asn Ser Leu Arg Asn Pro Val Val Glu Lys Ile Leu
625 630 635 640
Asn Gln Met Ile Asn Val Val Asn Ala Ile Leu Lys Asp Pro Glu Leu
645 650 655
Gly Arg Pro Asp Glu Ile Arg Val Glu Met Ala Arg Glu Leu Lys Ala
660 665 670
Asn Ala Glu Gln Arg Lys Asn Met Thr Ser Asn Ile Ala Ser Ala Thr
675 680 685
Arg Asp His Asp Lys Tyr Arg Glu Ile Leu Lys Ser Glu Phe Gly Leu
690 695 700
Lys Arg Val Thr Lys Asn Asp Leu Leu Arg Tyr Lys Leu Trp Leu Glu
705 710 715 720
Thr Asp Gly Ile Ser Leu Tyr Thr Gly Lys Pro Ile Glu Ala Ser Lys
725 730 735
Leu Phe Ser Lys Glu Tyr Asp Ile Glu His Ile Ile Pro Lys Ala Arg
740 745 750
Leu Phe Asp Asp Ser Phe Ser Asn Lys Thr Ile Cys Glu Arg Gln Leu
755 760 765
Asn Ile Asp Lys Ala Asn Val Thr Ala Phe Ser Phe Leu Gln Asn Lys
770 775 780
Leu Ser Ala Asp Glu Phe Glu Gln Tyr Gln Ser Arg Val Lys Ser Leu
785 790 795 800
Tyr Gly Lys Leu Ser Lys Ala Lys Ile Gln Lys Leu Leu Met Ala Asn
805 810 815
Asp Lys Ile Pro Glu Asp Phe Ile Ala Arg Gln Leu Gln Glu Thr Arg
820 825 830
Tyr Ile Ser Lys Lys Ala Lys Glu Ile Leu Phe Glu Ile Ser Arg Arg
835 840 845
Val Ser Val Thr Thr Gly Thr Ile Thr Asp Lys Leu Arg Glu Asp Trp
850 855 860
Gly Leu Val Glu Ile Met Lys Glu Leu Asn Trp Glu Lys Tyr Asp Lys
865 870 875 880
Leu Gly Leu Thr Tyr Thr Ile Glu Gly Lys His Gly Glu Arg Leu Asn
885 890 895
Lys Ile Lys Asp Trp Ser Lys Arg Asn Asp His Arg His His Ala Met
900 905 910
Asp Ala Leu Thr Val Ala Leu Thr Lys Pro Ala Tyr Ile Gln Tyr Leu
915 920 925
Asn Asn Leu Asn Ala Lys Gly Leu Asn Asn Lys Lys Gly Thr Glu Val
930 935 940
Phe Ala Ile Glu Gln Lys Tyr Leu Lys Arg Glu Asn Gly Lys Leu Cys
945 950 955 960
Phe Ile Pro Pro Ile Glu Asn Ile Arg Ser Glu Ala Lys Lys His Leu
965 970 975
Ser Arg Ile Leu Val Ser Tyr Lys Ala Lys Asn Lys Val Val Thr Ile
980 985 990
Asn Lys Asn Lys Thr Lys Ser Lys Ala Gly Leu Asn Glu Gln Ile Ala
995 1000 1005
Leu Thr Pro Arg Gly Gln Leu His Lys Glu Thr Val Tyr Gly Lys
1010 1015 1020
Ser Phe His Tyr Ser Thr Lys Phe Glu Lys Ile Gly Ala Ser Phe
1025 1030 1035
Asn Val Gln Lys Ile Asn Thr Val Ala Lys Lys Glu Glu Arg Glu
1040 1045 1050
Ala Leu Leu Lys Arg Leu Ala Glu Asn Gly Asn Asp Pro Lys Lys
1055 1060 1065
Ala Phe Thr Gly Lys Asn Thr Leu Asn Lys Met Pro Ile Tyr Leu
1070 1075 1080
Asp Leu Gly Lys Asn Ile Lys Leu Ser Glu Lys Val Lys Thr Val
1085 1090 1095
Val Leu Glu Gln Asn Tyr Thr Ile Arg Lys Asn Ile Asp Pro Asp
1100 1105 1110
Leu Lys Val Asp Lys Val Ile Asp Val Gly Ile Lys Arg Ile Leu
1115 1120 1125
Glu Ser Arg Leu Glu Glu Phe Gly Gly Asn Ala Lys Leu Ala Phe
1130 1135 1140
Ser Asn Leu Glu Glu Asn Pro Ile Trp Leu Asn Lys Glu Lys Gly
1145 1150 1155
Ile Ser Ile Lys Arg Val Lys Ile Ser Gly Val Ser Asn Val Glu
1160 1165 1170
Ser Leu His Val Lys Lys Asp His Phe Gly Glu Pro Ile Leu Asp
1175 1180 1185
Gln Glu Gly Asn Glu Ile Pro Val Asp Phe Val Ser Thr Gly Asn
1190 1195 1200
Asn His His Val Ala Ile Tyr Glu Asp Glu Asn Gly Asn Leu Gln
1205 1210 1215
Glu Glu Val Val Ser Phe Phe Glu Ala Val Val Arg Gln Asn Gln
1220 1225 1230
Gly Leu Pro Ile Ile Lys Lys Asn His Thr Leu Gly Trp Lys Phe
1235 1240 1245
Leu Phe Thr Leu Lys Gln Asn Glu Tyr Phe Val Phe Pro Ser Asp
1250 1255 1260
Asp Phe Val Pro Ala Asp Val Asp Leu Met Asp Glu Gln Asn Tyr
1265 1270 1275
His Leu Ile Ser Pro Asn Leu Phe Arg Val Gln Lys Ile Ala Arg
1280 1285 1290
Lys Asn Tyr Val Phe Asn Asn His Leu Glu Thr Lys Ala Val Asp
1295 1300 1305
Asn Asp Leu Leu Lys Ser Lys Lys Glu Leu Ser Lys Ile Thr Tyr
1310 1315 1320
His Phe Tyr Gln Thr Pro Glu His Leu Arg Gly Ile Ile Lys Ile
1325 1330 1335
Arg Ile Asn His Leu Gly Lys Ile Ile Gln Ile Gly Glu Tyr
1340 1345 1350
<210> 26
<211> 1509
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Psychroflexus torquisI
<400> 26
Met Lys Arg Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly Trp
1 5 10 15
Ser Leu Ile Glu His Asp Phe Lys Asn Lys Gln Gly Gln Ile Glu Gly
20 25 30
Leu Gly Val Arg Ile Ile Pro Met Ser Gln Glu Ile Leu Gly Lys Phe
35 40 45
Asp Ala Gly Gln Ser Ile Ser Gln Thr Ala Asp Arg Thr Lys Tyr Arg
50 55 60
Gly Val Arg Arg Leu Tyr Gln Arg Asp Asn Leu Arg Arg Glu Arg Leu
65 70 75 80
His Arg Val Leu Lys Ile Leu Asp Phe Leu Pro Lys His Tyr Ser Glu
85 90 95
Ser Ile Asp Phe Gln Asp Lys Val Gly Gln Phe Lys Pro Lys Gln Glu
100 105 110
Val Lys Leu Asn Tyr Arg Lys Asn Glu Lys Asn Lys His Glu Phe Val
115 120 125
Phe Met Asn Ser Phe Ile Glu Met Val Ser Glu Phe Lys Asn Ala Gln
130 135 140
Pro Glu Leu Phe Tyr Asn Lys Gly Asn Gly Glu Glu Thr Lys Ile Pro
145 150 155 160
Tyr Asp Trp Thr Leu Tyr Tyr Leu Arg Lys Lys Ala Leu Thr Gln Gln
165 170 175
Ile Thr Lys Glu Glu Leu Ala Trp Leu Ile Leu Asn Phe Asn Gln Lys
180 185 190
Arg Gly Tyr Tyr Gln Leu Arg Gly Glu Asp Ile Asp Glu Asp Lys Asn
195 200 205
Lys Lys Tyr Met Gln Leu Lys Val Asn Asn Leu Ile Asp Ser Gly Ala
210 215 220
Lys Val Lys Gly Lys Val Leu Tyr Asn Val Ile Phe Asp Asn Gly Trp
225 230 235 240
Lys Tyr Glu Lys Gln Ile Val Asn Lys Asp Glu Trp Glu Gly Arg Thr
245 250 255
Lys Glu Phe Ile Ile Thr Thr Lys Thr Leu Lys Asn Gly Asn Ile Lys
260 265 270
Arg Thr Tyr Lys Ala Val Asp Ser Glu Ile Asp Trp Ala Ala Ile Lys
275 280 285
Ala Lys Thr Glu Gln Asp Ile Asn Lys Ala Asn Lys Thr Val Gly Glu
290 295 300
Tyr Ile Tyr Glu Ser Leu Leu Asp Asn Pro Ser Gln Lys Ile Arg Gly
305 310 315 320
Lys Leu Val Lys Thr Ile Glu Arg Lys Phe Tyr Lys Glu Glu Phe Glu
325 330 335
Lys Leu Leu Ser Lys Gln Ile Glu Leu Gln Pro Glu Leu Phe Asn Glu
340 345 350
Ser Leu Tyr Lys Ala Cys Ile Lys Glu Leu Tyr Pro Arg Asn Glu Asn
355 360 365
His Gln Ser Asn Asn Lys Lys Gln Gly Phe Glu Tyr Leu Phe Thr Glu
370 375 380
Asp Ile Ile Phe Tyr Gln Arg Pro Leu Lys Ser Gln Lys Ser Asn Ile
385 390 395 400
Ser Gly Cys Gln Phe Glu His Lys Ile Tyr Lys Gln Lys Asn Lys Lys
405 410 415
Thr Gly Lys Leu Glu Leu Ile Lys Glu Pro Ile Lys Thr Ile Ser Arg
420 425 430
Ser His Pro Leu Phe Gln Glu Phe Arg Ile Trp Gln Trp Leu Gln Asn
435 440 445
Leu Lys Ile Tyr Asn Lys Glu Lys Ile Glu Asn Gly Lys Leu Glu Asp
450 455 460
Val Thr Thr Gln Leu Leu Pro Asn Asn Glu Ala Tyr Val Thr Leu Phe
465 470 475 480
Asp Phe Leu Asn Thr Lys Lys Glu Leu Glu Gln Lys Gln Phe Ile Glu
485 490 495
Tyr Phe Val Lys Lys Lys Leu Ile Asp Lys Lys Glu Lys Glu His Phe
500 505 510
Arg Trp Asn Phe Val Glu Asp Lys Lys Tyr Pro Phe Ser Glu Thr Arg
515 520 525
Ala Gln Phe Leu Ser Arg Leu Ala Lys Val Lys Gly Ile Lys Asn Thr
530 535 540
Glu Asp Phe Leu Asn Lys Asn Thr Gln Val Gly Ser Lys Glu Asn Ser
545 550 555 560
Pro Phe Ile Lys Arg Ile Glu Gln Leu Trp His Ile Ile Tyr Ser Val
565 570 575
Ser Asp Leu Lys Glu Tyr Glu Lys Ala Leu Glu Lys Phe Ala Glu Lys
580 585 590
His Asn Leu Glu Lys Asp Ser Phe Leu Lys Asn Phe Lys Lys Phe Pro
595 600 605
Pro Phe Val Ser Asp Tyr Ala Ser Tyr Ser Lys Lys Ala Ile Ser Lys
610 615 620
Leu Leu Pro Ile Met Arg Met Gly Lys Tyr Trp Ser Glu Ser Ala Val
625 630 635 640
Pro Thr Gln Val Lys Glu Arg Ser Leu Ser Ile Met Glu Arg Val Lys
645 650 655
Val Leu Pro Leu Lys Glu Gly Tyr Ser Asp Lys Asp Leu Ala Asp Leu
660 665 670
Leu Ser Arg Val Ser Asp Asp Asp Ile Pro Lys Gln Leu Ile Lys Ser
675 680 685
Phe Ile Ser Phe Lys Asp Lys Asn Pro Leu Lys Gly Leu Asn Thr Tyr
690 695 700
Gln Ala Asn Tyr Leu Val Tyr Gly Arg His Ser Glu Thr Gly Asp Ile
705 710 715 720
Gln His Trp Lys Thr Pro Glu Asp Ile Asp Arg Tyr Leu Asn Asn Phe
725 730 735
Lys Gln His Ser Leu Arg Asn Pro Ile Val Glu Gln Val Val Met Glu
740 745 750
Thr Leu Arg Val Val Arg Asp Ile Trp Glu His Tyr Gly Asn Asn Glu
755 760 765
Lys Asp Phe Phe Lys Glu Ile His Val Glu Leu Gly Arg Glu Met Lys
770 775 780
Ser Pro Ala Gly Lys Arg Glu Lys Leu Ser Gln Arg Asn Thr Glu Asn
785 790 795 800
Glu Asn Thr Asn His Arg Ile Arg Glu Val Leu Lys Glu Leu Met Asn
805 810 815
Asp Ala Ser Val Glu Gly Gly Val Arg Asp Tyr Ser Pro Ser Gln Gln
820 825 830
Glu Ile Leu Lys Leu Tyr Glu Glu Gly Ile Tyr Gln Asn Pro Asn Thr
835 840 845
Asn Tyr Leu Lys Val Asp Glu Asp Glu Ile Leu Lys Ile Arg Lys Lys
850 855 860
Asn Asn Pro Thr Gln Lys Glu Ile Gln Arg Tyr Lys Leu Trp Leu Glu
865 870 875 880
Gln Gly Tyr Ile Ser Pro Tyr Thr Gly Lys Ile Ile Pro Leu Thr Lys
885 890 895
Leu Phe Thr His Glu Tyr Gln Ile Glu His Ile Ile Pro Gln Ser Arg
900 905 910
Tyr Tyr Asp Asn Ser Leu Gly Asn Lys Ile Ile Cys Glu Ser Glu Val
915 920 925
Asn Glu Asp Lys Asp Asn Lys Thr Ala Tyr Glu Tyr Leu Lys Val Glu
930 935 940
Lys Gly Ser Ile Val Phe Gly His Lys Leu Leu Asn Leu Asp Glu Tyr
945 950 955 960
Glu Ala His Val Asn Lys Tyr Phe Lys Lys Asn Lys Thr Lys Leu Lys
965 970 975
Asn Leu Leu Ser Glu Asp Ile Pro Glu Gly Phe Ile Asn Arg Gln Leu
980 985 990
Asn Asp Ser Arg Tyr Ile Ser Lys Leu Val Lys Gly Leu Leu Ser Asn
995 1000 1005
Ile Val Arg Glu Asn Gly Glu Gln Glu Ala Thr Ser Lys Asn Leu
1010 1015 1020
Ile Pro Val Thr Gly Val Val Thr Ser Lys Leu Lys Gln Asp Trp
1025 1030 1035
Gly Leu Asn Asp Lys Trp Asn Glu Ile Ile Ala Pro Arg Phe Lys
1040 1045 1050
Arg Leu Asn Lys Leu Thr Asn Ser Asn Asp Phe Gly Phe Trp Asp
1055 1060 1065
Asn Asp Ile Asn Ala Phe Arg Ile Gln Val Pro Asp Ser Leu Ile
1070 1075 1080
Lys Gly Phe Ser Lys Lys Arg Ile Asp His Arg His His Ala Leu
1085 1090 1095
Asp Ala Leu Val Val Ala Cys Thr Ser Arg Asn His Thr His Tyr
1100 1105 1110
Leu Ser Ala Leu Asn Ala Glu Asn Lys Asn Tyr Ser Leu Arg Asp
1115 1120 1125
Lys Leu Val Ile Lys Asn Glu Asn Gly Asp Tyr Thr Lys Thr Phe
1130 1135 1140
Gln Ile Pro Trp Gln Gly Phe Thr Ile Glu Ala Lys Asn Asn Leu
1145 1150 1155
Glu Lys Thr Val Val Ser Phe Lys Lys Asn Leu Arg Val Ile Asn
1160 1165 1170
Lys Thr Asn Asn Lys Phe Trp Ser Tyr Lys Asp Glu Asn Gly Asn
1175 1180 1185
Leu Asn Leu Gly Lys Asp Gly Lys Pro Lys Lys Lys Leu Arg Lys
1190 1195 1200
Gln Thr Lys Gly Tyr Asn Trp Ala Ile Arg Lys Pro Leu His Lys
1205 1210 1215
Glu Thr Val Ser Gly Ile Tyr Asn Ile Asn Ala Pro Lys Asn Lys
1220 1225 1230
Ile Ala Thr Ser Val Arg Thr Leu Leu Thr Glu Ile Lys Asn Glu
1235 1240 1245
Lys His Leu Ala Lys Ile Thr Asp Leu Arg Ile Arg Glu Thr Ile
1250 1255 1260
Leu Pro Asn His Leu Lys His Tyr Leu Asn Asn Lys Gly Glu Ala
1265 1270 1275
Asn Phe Ser Glu Ala Phe Ser Gln Gly Gly Ile Glu Asp Leu Asn
1280 1285 1290
Lys Lys Ile Thr Thr Leu Asn Glu Gly Lys Lys His Gln Pro Ile
1295 1300 1305
Tyr Arg Val Lys Ile Phe Glu Val Gly Ser Lys Phe Ser Ile Ser
1310 1315 1320
Glu Asp Glu Asn Ser Ala Lys Ser Lys Lys Tyr Val Glu Ala Ala
1325 1330 1335
Lys Gly Thr Asn Leu Phe Phe Ala Ile Tyr Leu Asp Glu Glu Asn
1340 1345 1350
Lys Lys Arg Asn Tyr Glu Thr Ile Pro Leu Asn Glu Val Ile Thr
1355 1360 1365
His Gln Lys Gln Val Ala Gly Phe Pro Lys Ser Glu Arg Leu Ser
1370 1375 1380
Val Gln Pro Asp Ser Gln Lys Gly Thr Phe Leu Phe Thr Leu Ser
1385 1390 1395
Pro Asn Asp Leu Val Tyr Val Pro Asn Asn Glu Glu Leu Glu Asn
1400 1405 1410
Arg Asp Leu Phe Asn Leu Gly Asn Leu Asn Val Glu Gln Ile Ser
1415 1420 1425
Arg Ile Tyr Lys Phe Thr Asp Ser Ser Asp Lys Thr Cys Asn Phe
1430 1435 1440
Ile Pro Phe Gln Val Ser Lys Leu Ile Phe Asn Leu Lys Lys Lys
1445 1450 1455
Glu Gln Lys Lys Leu Asp Val Asp Phe Ile Ile Gln Asn Glu Phe
1460 1465 1470
Gly Leu Gly Ser Pro Gln Ser Lys Asn Gln Lys Ser Ile Asp Asp
1475 1480 1485
Val Met Ile Lys Glu Lys Cys Ile Lys Leu Lys Ile Asp Arg Leu
1490 1495 1500
Gly Asn Ile Ser Lys Ala
1505
<210> 27
<211> 1388
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Streptococcus thermophilus
<400> 27
Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu
35 40 45
Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala
85 90 95
Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg
100 105 110
Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr
115 120 125
His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp
130 135 140
Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser
165 170 175
Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr
180 185 190
Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu
195 200 205
Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg
210 215 220
Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe
245 250 255
Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp
260 265 270
Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp
275 280 285
Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala
305 310 315 320
Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys
325 330 335
Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys
340 345 350
Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu
370 375 380
Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe
420 425 430
Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp
450 455 460
Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp
465 470 475 480
Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg
515 520 525
Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln
530 535 540
Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr
545 550 555 560
Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly
565 570 575
Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr
580 585 590
Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp
595 600 605
Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile
610 615 620
Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn
625 630 635 640
Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr
645 650 655
Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu
660 665 670
Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys
690 695 700
Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn
705 710 715 720
Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met
740 745 750
Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn
755 760 765
Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg
770 775 780
Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn
785 790 795 800
Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp
805 810 815
Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly
820 825 830
Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile
835 840 845
Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu
850 855 860
Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu
865 870 875 880
Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser
885 890 895
Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu
930 935 940
Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val
945 950 955 960
Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp
965 970 975
Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr
1010 1015 1020
Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala
1040 1045 1050
Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu
1055 1060 1065
Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val
1070 1075 1080
Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val
1085 1090 1095
Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu
1100 1105 1110
Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu
1115 1120 1125
Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly
1130 1135 1140
Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr Val Leu Val Lys Gly
1145 1150 1155
Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu
1160 1165 1170
Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp
1175 1180 1185
Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu
1190 1195 1200
Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly
1205 1210 1215
Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg
1220 1225 1230
Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe
1235 1240 1245
Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn
1250 1255 1260
Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu
1265 1270 1275
Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly
1280 1285 1290
Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp
1295 1300 1305
Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro
1310 1315 1320
Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly
1325 1330 1335
Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr
1340 1345 1350
Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala
1370 1375 1380
Lys Leu Gly Glu Gly
1385
<210> 28
<211> 1334
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Listeria innocua
<400> 28
Met Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met
20 25 30
Lys Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp
35 40 45
Gly Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met
50 55 60
Ala Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser
65 70 75 80
Tyr Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn
85 90 95
Phe Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg
100 105 110
Asn Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr
115 120 125
His Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn
130 135 140
Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr
165 170 175
Gln Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr
180 185 190
Asn Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu
195 200 205
Glu Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg
210 215 220
Lys Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser
225 230 235 240
Ala Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly
245 250 255
Asn Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys
260 265 270
Ala Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile
275 280 285
Gly Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser
290 295 300
Ala Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn
305 310 315 320
Ala Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu
325 330 335
Asp Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His
340 345 350
Tyr Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr
355 360 365
Ile Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met
370 375 380
Thr Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu
385 390 395 400
Lys Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile
405 410 415
Pro His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln
420 425 430
Ala Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser
435 440 445
Leu Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly
450 455 460
Gln Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg
465 470 475 480
Pro Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp
485 490 495
Phe Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn
500 505 510
Val Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn
515 520 525
Glu Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr
530 535 540
Phe Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln
545 550 555 560
Lys Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met
565 570 575
Ser His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn
580 585 590
Ser Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln
595 600 605
Glu Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val
610 615 620
Lys Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu
625 630 635 640
Gln Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu
645 650 655
Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met
660 665 670
Gly Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met
675 680 685
Asn Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser
690 695 700
Asn Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala
705 710 715 720
Asp Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala
725 730 735
Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val
740 745 750
Ser Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg
755 760 765
Glu Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr
770 775 780
Lys Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys
785 790 795 800
Glu His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu
805 810 815
Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp
820 825 830
Ile His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser
835 840 845
Phe Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala
850 855 860
Gly Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg
865 870 875 880
Lys Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser
885 890 895
Lys Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr
900 905 910
Glu Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg
915 920 925
Gln Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr
930 935 940
Glu Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr
945 950 955 960
Leu Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr
965 970 975
Lys Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu
980 985 990
Asn Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu
995 1000 1005
Pro Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys
1010 1015 1020
Ala Asn Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met
1025 1030 1035
Leu Phe Phe Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu
1040 1045 1050
Ile Leu Trp Asp Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met
1055 1060 1065
Ser Tyr Arg Gln Met Asn Ile Val Lys Lys Thr Glu Ile Gln Lys
1070 1075 1080
Gly Glu Phe Ser Lys Ala Thr Ile Lys Pro Lys Gly Asn Ser Ser
1085 1090 1095
Lys Leu Ile Pro Arg Lys Thr Asn Trp Asp Pro Met Lys Tyr Gly
1100 1105 1110
Gly Leu Asp Ser Pro Asn Met Ala Tyr Ala Val Val Ile Glu Tyr
1115 1120 1125
Ala Lys Gly Lys Asn Lys Leu Val Phe Glu Lys Lys Ile Ile Arg
1130 1135 1140
Val Thr Ile Met Glu Arg Lys Ala Phe Glu Lys Asp Glu Lys Ala
1145 1150 1155
Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys Val Leu Ala Lys
1160 1165 1170
Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly Arg Arg Arg
1175 1180 1185
Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln Gln Val
1190 1195 1200
Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn Cys
1205 1210 1215
Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg
1220 1225 1230
Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys
1235 1240 1245
Arg Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu
1250 1255 1260
Phe Glu Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser
1265 1270 1275
Phe Val Asp Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser
1280 1285 1290
Phe Lys Phe Phe Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn
1295 1300 1305
Leu Lys Glu Leu Leu Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr
1310 1315 1320
Gly Leu Tyr Glu Ser Arg Lys Arg Leu Asp Asp
1325 1330
<210> 29
<211> 984
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Campylobacter jejuni
<400> 29
Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp
1 5 10 15
Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe
20 25 30
Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg
35 40 45
Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg
50 55 60
Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr
65 70 75 80
Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly
85 90 95
Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu
100 105 110
Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg
115 120 125
Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala
130 135 140
Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln
145 150 155 160
Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu
165 170 175
Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu
180 185 190
Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe
195 200 205
Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu
210 215 220
Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser
225 230 235 240
His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro
245 250 255
Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile
260 265 270
Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys
275 280 285
Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu
290 295 300
Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu
305 310 315 320
Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys
325 330 335
Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu
340 345 350
Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu
355 360 365
Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser
370 375 380
Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala
385 390 395 400
Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu
405 410 415
Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys
420 425 430
Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr
435 440 445
Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn
450 455 460
Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu
465 470 475 480
Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys
485 490 495
Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys
500 505 510
Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg
515 520 525
Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile
530 535 540
Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile
545 550 555 560
Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu
565 570 575
Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu
580 585 590
Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala
595 600 605
Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr
610 615 620
Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr
625 630 635 640
Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp
645 650 655
Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln
660 665 670
Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser
675 680 685
Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His
690 695 700
Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser
705 710 715 720
Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser
725 730 735
Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys
740 745 750
Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp
755 760 765
Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser
770 775 780
Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln
785 790 795 800
Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys
805 810 815
Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg
820 825 830
Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro
835 840 845
Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val
850 855 860
Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu
865 870 875 880
Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile
885 890 895
Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe
900 905 910
Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe
915 920 925
Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu
930 935 940
Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe
945 950 955 960
Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe
965 970 975
Arg Gln Arg Glu Asp Phe Lys Lys
980
<210> 30
<211> 1082
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Neisseria. meningitidis
<400> 30
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 31
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Streptococcus pyogenes
<400> 31
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu
705 710 715 720
His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 32
<211> 528
<212> PRT
<213> Artificial Sequence
<220>
<223> ZFP nucleic acid sequence
<400> 32
Ala Thr Gly Gly Cys Cys Cys Ala Gly Gly Cys Thr Gly Cys Thr Cys
1 5 10 15
Thr Thr Gly Ala Gly Cys Cys Cys Gly Gly Ala Gly Ala Gly Ala Ala
20 25 30
Ala Cys Cys Cys Thr Ala Cys Ala Ala Gly Thr Gly Cys Cys Cys Gly
35 40 45
Gly Ala Gly Thr Gly Cys Gly Gly Ala Ala Ala Gly Thr Cys Cys Thr
50 55 60
Thr Cys Thr Cys Thr Gly Ala Gly Cys Gly Gly Ala Gly Thr Cys Ala
65 70 75 80
Cys Cys Thr Cys Cys Gly Ala Gly Ala Gly Cys Ala Cys Cys Ala Gly
85 90 95
Cys Gly Gly Ala Cys Thr Cys Ala Thr Ala Cys Gly Gly Gly Cys Gly
100 105 110
Ala Ala Ala Ala Ala Cys Cys Ala Thr Ala Cys Ala Ala Gly Thr Gly
115 120 125
Cys Cys Cys Ala Gly Ala Ala Thr Gly Thr Gly Gly Thr Ala Ala Ala
130 135 140
Thr Cys Thr Thr Thr Thr Thr Cys Thr Cys Gly Gly Gly Cys Thr Gly
145 150 155 160
Ala Cys Ala Ala Cys Cys Thr Gly Ala Cys Thr Gly Ala Ala Cys Ala
165 170 175
Thr Cys Ala Gly Cys Gly Cys Ala Cys Gly Cys Ala Cys Ala Cys Cys
180 185 190
Gly Gly Thr Gly Ala Ala Ala Ala Ala Cys Cys Thr Thr Ala Cys Ala
195 200 205
Ala Gly Thr Gly Thr Cys Cys Ala Gly Ala Gly Thr Gly Thr Gly Gly
210 215 220
Cys Ala Ala Gly Ala Gly Cys Thr Thr Thr Thr Cys Thr Ala Gly Thr
225 230 235 240
Ala Gly Ala Ala Gly Gly Ala Cys Cys Thr Gly Thr Cys Gly Ala Gly
245 250 255
Cys Gly Cys Ala Thr Cys Ala Gly Cys Gly Gly Ala Cys Thr Cys Ala
260 265 270
Cys Ala Cys Cys Gly Gly Cys Gly Ala Ala Ala Ala Ala Cys Cys Cys
275 280 285
Thr Ala Thr Ala Ala Gly Thr Gly Thr Cys Cys Gly Gly Ala Ala Thr
290 295 300
Gly Thr Gly Gly Ala Ala Ala Gly Ala Gly Cys Thr Thr Thr Ala Gly
305 310 315 320
Cys Cys Gly Cys Ala Ala Cys Gly Ala Cys Ala Cys Cys Cys Thr Thr
325 330 335
Ala Cys Thr Gly Ala Ala Cys Ala Cys Cys Ala Gly Cys Gly Ala Ala
340 345 350
Cys Ala Cys Ala Cys Ala Cys Gly Gly Gly Ala Gly Ala Ala Ala Ala
355 360 365
Ala Cys Cys Ala Thr Ala Thr Ala Ala Ala Thr Gly Thr Cys Cys Gly
370 375 380
Gly Ala Ala Thr Gly Thr Gly Gly Cys Ala Ala Ala Ala Gly Thr Thr
385 390 395 400
Thr Thr Ala Gly Thr Cys Gly Gly Ala Gly Thr Gly Ala Thr Ala Ala
405 410 415
Ala Cys Thr Thr Ala Cys Gly Gly Ala Gly Cys Ala Cys Cys Ala Ala
420 425 430
Cys Gly Gly Ala Cys Ala Cys Ala Cys Ala Cys Cys Gly Gly Ala Gly
435 440 445
Ala Gly Ala Ala Gly Cys Cys Ala Thr Ala Thr Ala Ala Gly Thr Gly
450 455 460
Thr Cys Cys Thr Gly Ala Ala Thr Gly Thr Gly Gly Ala Ala Ala Gly
465 470 475 480
Thr Cys Cys Thr Thr Cys Thr Cys Ala Cys Ala Gly Cys Thr Thr Gly
485 490 495
Cys Thr Cys Ala Thr Cys Thr Gly Cys Gly Ala Gly Cys Ala Cys Ala
500 505 510
Thr Cys Ala Gly Cys Gly Cys Ala Cys Ala Cys Ala Cys Ala Cys Cys
515 520 525
<210> 33
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> ZFP amino acid sequence
<400> 33
Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro
1 5 10 15
Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln
20 25 30
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
35 40 45
Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr
50 55 60
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser
65 70 75 80
Arg Arg Thr Cys Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro
85 90 95
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu
100 105 110
Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
115 120 125
Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln
130 135 140
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
145 150 155 160
Ser Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr
165 170 175
<210> 34
<211> 555
<212> DNA
<213> Artificial Sequence
<220>
<223> ZNF-E2C Nucleotide
<400> 34
atggcgcagg cggcgctgga accgggcgaa aaaccgtata aatgcccgga atgcggcaaa 60
agctttagcc gcaaagatag cctggtgcgc catcagcgca cccataccgg cgaaaaaccg 120
tataaatgcc cggaatgcgg caaaagcttt agccagagcg gcgatctgcg ccgccatcag 180
cgcacccata ccggcgaaaa accgtataaa tgcccggaat gcggcaaaag ctttagcgat 240
tgccgcgatc tggcgcgcca tcagcgcacc cataccggcg aaaaaccgta taaatgcccg 300
gaatgcggca aaagctttag ccagagcagc catctggtgc gccatcagcg cacccatacc 360
ggcgaaaaac cgtataaatg cccggaatgc ggcaaaagct ttagcgattg ccgcgatctg 420
gcgcgccatc agcgcaccca taccggcgaa aaaccgtata aatgcccgga atgcggcaaa 480
agctttagcc gcagcgataa actggtgcgc catcagcgca cccataccgg caaaaaaacc 540
agcggccagg cgggc 555
<210> 35
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> ZNF-E2C Aminoacid
<400> 35
Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro
1 5 10 15
Glu Cys Gly Lys Ser Phe Ser Arg Lys Asp Ser Leu Val Arg His Gln
20 25 30
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
35 40 45
Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr
50 55 60
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp
65 70 75 80
Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
85 90 95
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu
100 105 110
Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
115 120 125
Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln
130 135 140
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
145 150 155 160
Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr
165 170 175
Gly Lys Lys Thr Ser Gly Gln Ala Gly
180 185
<210> 36
<211> 555
<212> DNA
<213> Artificial Sequence
<220>
<223> ZNF-E3 Nucleotide
<400> 36
atggcgcagg cggcgctgga accgggcgaa aaaccgtata aatgcccgga atgcggcaaa 60
agctttagcg atccgggcgc gctggtgcgc catcagcgca cccataccgg cgaaaaaccg 120
tataaatgcc cggaatgcgg caaaagcttt agccagagca gccatctggt gcgccatcag 180
cgcacccata ccggcgaaaa accgtataaa tgcccggaat gcggcaaaag ctttagcgat 240
tgccgcgatc tggcgcgcca tcagcgcacc cataccggcg aaaaaccgta taaatgcccg 300
gaatgcggca aaagctttag ccagagcagc catctggtgc gccatcagcg cacccatacc 360
ggcgaaaaac cgtataaatg cccggaatgc ggcaaaagct ttagcgattg ccgcgatctg 420
gcgcgccatc agcgcaccca taccggcgaa aaaccgtata aatgcccgga atgcggcaaa 480
agctttagcc agagcagcca tctggtgcgc catcagcgca cccataccgg caaaaaaacc 540
agcggccagg cgggc 555
<210> 37
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> ZNF-E3 Amino acid
<400> 37
Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro
1 5 10 15
Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln
20 25 30
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
35 40 45
Ser Phe Ser Gln Ser Ser His Leu Val Arg His Gln Arg Thr His Thr
50 55 60
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp
65 70 75 80
Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
85 90 95
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu
100 105 110
Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
115 120 125
Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln
130 135 140
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
145 150 155 160
Ser Phe Ser Gln Ser Ser His Leu Val Arg His Gln Arg Thr His Thr
165 170 175
Gly Lys Lys Thr Ser Gly Gln Ala Gly
180 185
<210> 38
<211> 528
<212> PRT
<213> Artificial Sequence
<220>
<223> ZNF-TRCa Nucleotide
<400> 38
Ala Thr Gly Gly Cys Gly Cys Ala Gly Gly Cys Gly Gly Cys Thr Cys
1 5 10 15
Thr Thr Gly Ala Ala Cys Cys Cys Gly Gly Gly Gly Ala Gly Ala Ala
20 25 30
Ala Cys Cys Cys Thr Ala Thr Ala Ala Ala Thr Gly Cys Cys Cys Thr
35 40 45
Gly Ala Gly Thr Gly Thr Gly Gly Cys Ala Ala Gly Ala Gly Thr Thr
50 55 60
Thr Thr Thr Cys Ala Ala Cys Cys Ala Cys Ala Gly Gly Ala Ala Ala
65 70 75 80
Cys Thr Thr Gly Ala Cys Ala Gly Thr Cys Cys Ala Cys Cys Ala Ala
85 90 95
Cys Gly Gly Ala Cys Cys Cys Ala Cys Ala Cys Cys Gly Gly Cys Gly
100 105 110
Ala Gly Ala Ala Ala Cys Cys Ala Thr Ala Cys Ala Ala Gly Thr Gly
115 120 125
Thr Cys Cys Gly Gly Ala Gly Thr Gly Thr Gly Gly Thr Ala Ala Gly
130 135 140
Thr Cys Thr Thr Thr Cys Thr Cys Ala Ala Gly Thr Cys Cys Thr Gly
145 150 155 160
Cys Cys Gly Ala Cys Cys Thr Thr Ala Cys Cys Ala Gly Ala Cys Ala
165 170 175
Thr Cys Ala Ala Cys Gly Cys Ala Cys Ala Cys Ala Thr Ala Cys Ala
180 185 190
Gly Gly Thr Gly Ala Ala Ala Ala Ala Cys Cys Thr Thr Ala Cys Ala
195 200 205
Ala Gly Thr Gly Cys Cys Cys Ala Gly Ala Gly Thr Gly Cys Gly Gly
210 215 220
Ala Ala Ala Ala Ala Gly Thr Thr Thr Thr Thr Cys Ala Cys Ala Ala
225 230 235 240
Thr Cys Thr Gly Gly Cys Gly Ala Cys Cys Thr Cys Cys Gly Cys Ala
245 250 255
Gly Gly Cys Ala Cys Cys Ala Gly Cys Gly Cys Ala Cys Thr Cys Ala
260 265 270
Cys Ala Cys Cys Gly Gly Thr Gly Ala Ala Ala Ala Ala Cys Cys Ala
275 280 285
Thr Ala Cys Ala Ala Gly Thr Gly Thr Cys Cys Thr Gly Ala Gly Thr
290 295 300
Gly Cys Gly Gly Gly Ala Ala Gly Ala Gly Thr Thr Thr Thr Ala Gly
305 310 315 320
Thr Cys Ala Ala Cys Gly Ala Gly Cys Thr Cys Ala Thr Cys Thr Gly
325 330 335
Gly Ala Gly Cys Gly Ala Cys Ala Cys Cys Ala Ala Ala Gly Gly Ala
340 345 350
Cys Thr Cys Ala Thr Ala Cys Thr Gly Gly Gly Gly Ala Gly Ala Ala
355 360 365
Ala Cys Cys Gly Thr Ala Cys Ala Ala Ala Thr Gly Thr Cys Cys Cys
370 375 380
Gly Ala Ala Thr Gly Thr Gly Gly Gly Ala Ala Gly Ala Gly Cys Thr
385 390 395 400
Thr Cys Thr Cys Thr Ala Cys Cys Ala Ala Gly Ala Ala Thr Thr Cys
405 410 415
Cys Cys Thr Thr Ala Cys Ala Gly Ala Gly Cys Ala Cys Cys Ala Gly
420 425 430
Cys Gly Cys Ala Cys Gly Cys Ala Thr Ala Cys Gly Gly Gly Ala Gly
435 440 445
Ala Gly Ala Ala Gly Cys Cys Gly Thr Ala Thr Ala Ala Gly Thr Gly
450 455 460
Thr Cys Cys Gly Gly Ala Ala Thr Gly Thr Gly Gly Cys Ala Ala Gly
465 470 475 480
Ala Gly Cys Thr Thr Thr Thr Cys Cys Ala Gly Ala Ala Gly Thr Gly
485 490 495
Ala Cys Cys Ala Cys Cys Thr Thr Ala Cys Ala Ala Cys Cys Cys Ala
500 505 510
Cys Cys Ala Gly Ala Gly Gly Ala Cys Gly Cys Ala Cys Ala Cys Cys
515 520 525
<210> 39
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> ZNF-TRCa Aminoacid
<400> 39
Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro
1 5 10 15
Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln
20 25 30
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
35 40 45
Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His Thr
50 55 60
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln
65 70 75 80
Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
85 90 95
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu
100 105 110
Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
115 120 125
Glu Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln
130 135 140
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
145 150 155 160
Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr
165 170 175
<210> 40
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> AAVS1 site
<400> 40
Ala Gly Ala Cys Gly Gly Cys Cys Gly Cys Gly Thr Cys Ala Gly Ala
1 5 10 15
Gly Cys
<210> 41
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger 1
<400> 41
Glu Arg Ser His Leu Arg Glu
1 5
<210> 42
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger 2
<400> 42
Arg Ala Asp Asn Leu Thr Glu
1 5
<210> 43
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger 3
<400> 43
Ser Arg Arg Thr Cys Arg Ala
1 5
<210> 44
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger 4
<400> 44
Arg Asn Asp Thr Leu Thr Glu
1 5
<210> 45
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger 5
<400> 45
Arg Ser Asp Lys Leu Thr Glu
1 5
<210> 46
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger 6
<400> 46
Gln Leu Ala His Leu Arg Ala
1 5
<210> 47
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 47
atggctccaa agaaaaagag gaaagtggga atccacggag tccccgccgc t 51
<210> 48
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> GGS linker Nucleic Acid
<400> 48
ggtggatctg gcggtggatc tggtggcggt 30
<210> 49
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> GGS linker Amino Acid
<400> 49
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
1 5 10
<210> 50
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> GGS4x Linker Nucleic Acid
<400> 50
ggagggagtg gtgggtccgg tggtagtggc ggatcc 36
<210> 51
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> GGS4x Linker Amino Acid
<400> 51
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 52
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> GGS5x Linker Nucleic Acid
<400> 52
ggaggctccg gtgggtctgg tgggagcggt ggtagtggcg gatcc 45
<210> 53
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> GGS5x Linker Amino Acid
<400> 53
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10 15
<210> 54
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> GGS6x Linker Nucleic Acid
<400> 54
ggaggcagtg gtgggagcgg tggttccggg ggtagtggtg gttccggggg atcc 54
<210> 55
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> GGS6x Linker Amino Acid
<400> 55
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser
<210> 56
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> GGS7x Linker Nucleic Acid
<400> 56
ggaggttctg gaggctccgg tgggtccggg ggaagtgggg ggtcaggcgg atcaggagga 60
tcc 63
<210> 57
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> GGS7x Linker Amino Acid
<400> 57
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser
20
<210> 58
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> GGS8x Linker Nucleic Acid
<400> 58
ggaggtagcg gaggttccgg agggagcggc gggagtgggg gaagcggggg aagtggagga 60
tccgggggag gatcc 75
<210> 59
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> GGS8x Linker Amino Acid
<400> 59
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser
20
<210> 60
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker XTEN Nucleic Acid
<400> 60
tccggtagcg aaacaccggg gacttcagaa tcggccaccc cggagtct 48
<210> 61
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker XTEN Amino Acid
<400> 61
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 62
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker B Nucleic Acid
<400> 62
ggaagcgccg gtagtgcggc tgggtctggc gagttc 36
<210> 63
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker B Amino Acid
<400> 63
Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe
1 5 10
<210> 64
<211> 4104
<212> DNA
<213> Artificial Sequence
<220>
<223> human Cas9 (hCas9) nucleic acid
<400> 64
atggacaaga agtactccat tgggctcgat atcggcacaa acagcgtcgg ctgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agac 4104
<210> 65
<211> 4104
<212> DNA
<213> Artificial Sequence
<220>
<223> nickase Cas9 (nCas9) nucleic acid
<400> 65
atggacaaga agtactccat tgggctcgct atcggcacaa acagcgtcgg ctgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac aggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agac 4104
<210> 66
<211> 4104
<212> DNA
<213> Artificial Sequence
<220>
<223> dead Cas9 (dCas9) nucleic acid
<400> 66
atggacaaga agtactccat tgggctcgct atcggcacaa acagcgtcgg ctgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggctgct 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaagcta gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agac 4104
<210> 67
<211> 1782
<212> DNA
<213> Artificial Sequence
<220>
<223> hyperactive PiggyBac (PB) transposase nucleic acid
<400> 67
atgggcagca gcctggacga cgagcacatc ctgagcgccc tgctgcagag cgacgacgag 60
ctggtcggcg aggacagcga cagcgaggtg agcgaccacg tgagcgagga cgacgtgcag 120
tccgacaccg aggaggcctt catcgacgag gtgcacgagg tgcagcctac cagcagcggc 180
tccgagatcc tggacgagca gaacgtgatc gagcagcccg gcagctccct ggccagcaac 240
aggatcctga ccctgcccca gaggaccatc aggggcaaga acaagcactg ctggtccacc 300
tccaagccca ccaggcggag cagggtgtcc gccctgaaca tcgtgagaag ccagaggggc 360
cccaccagga tgtgcaggaa catctacgac cccctgctgt gcttcaagct gttcttcacc 420
gacgagatca tcagcgagat cgtgaagtgg accaacgccg agatcagcct gaagaggcgg 480
gagagcatga cctccgccac cttcagggac accaacgagg acgagatcta cgccttcttc 540
ggcatcctgg tgatgaccgc cgtgaggaag gacaaccaca tgagcaccga cgacctgttc 600
gacagatccc tgagcatggt gtacgtgagc gtgatgagca gggacagatt cgacttcctg 660
atcagatgcc tgaggatgga cgacaagagc atcaggccca ccctgcggga gaacgacgtg 720
ttcacccccg tgagaaagat ctgggacctg ttcatccacc agtgcatcca gaactacacc 780
cctggcgccc acctgaccat cgacgagcag ctgctgggct tcaggggcag gtgccccttc 840
agggtctata tccccaacaa gcccagcaag tacggcatca agatcctgat gatgtgcgac 900
agcggcacca agtacatgat caacggcatg ccctacctgg gcaggggcac ccagaccaac 960
ggcgtgcccc tgggcgagta ctacgtgaag gagctgtcca agcccgtcca cggcagctgc 1020
agaaacatca cctgcgacaa ctggttcacc agcatccccc tggccaagaa cctgctgcag 1080
gagccctaca agctgaccat cgtgggcacc gtgagaagca acaagagaga gatccccgag 1140
gtcctgaaga acagcaggtc caggcccgtg ggcaccagca tgttctgctt cgacggcccc 1200
ctgaccctgg tgtcctacaa gcccaagccc gccaagatgg tgtacctgct gtccagctgc 1260
gacgaggacg ccagcatcaa cgagagcacc ggcaagcccc agatggtgat gtactacaac 1320
cagaccaagg gcggcgtgga caccctggac cagatgtgca gcgtgatgac ctgcagcaga 1380
aagaccaaca ggtggcccat ggccctgctg tacggcatga tcaacatcgc ctgcatcaac 1440
agcttcatca tctacagcca caacgtgagc agcaagggcg agaaggtgca gagccggaaa 1500
aagttcatgc ggaacctgta catgggcctg acctccagct tcatgaggaa gaggctggag 1560
gcccccaccc tgaagagata cctgagggac aacatcagca acatcctgcc caaagaggtg 1620
cccggcacca gcgacgacag caccgaggag cccgtgatga agaagaggac ctactgcacc 1680
tactgtccca gcaagatcag aagaaaggcc agcgccagct gcaagaagtg taagaaggtc 1740
atctgccggg agcacaacat cgacatgtgc cagagctgtt tc 1782
<210> 68
<211> 1020
<212> DNA
<213> Artificial Sequence
<220>
<223> hyperactive Sleeping Beauty (SB100) transposase nucleic acid
<400> 68
atgggaaaat caaaagaaat cagccaagac ctcagaaaaa gaattgtaga cctccacaag 60
tctggttcat ccttgggagc aatttccaaa cgcctggcgg taccacgttc atctgtacaa 120
acaatagtac gcaagtataa acaccatggg accacgcagc cgtcataccg ctcaggaagg 180
agacgcgttc tgtctcctag agatgaacgt actttggtgc gaaaagtgca aatcaatccc 240
agaacaacag caaaggacct tgtgaagatg ctggaggaaa caggtacaaa agtatctata 300
tccacagtaa aacgagtcct atatcgacat aacctgaaag gccactcagc aaggaagaag 360
ccactgctcc aaaaccgaca taagaaagcc agactacggt ttgcaactgc acatggggac 420
aaagatcgta ctttttggag aaatgtcctc tggtctgatg aaacaaaaat agaactgttt 480
ggccataatg accatcgtta tgtttggagg aagaaggggg aggcttgcaa gccgaagaac 540
accatcccaa ccgtgaagca cgggggtggc agcatcatgt tgtgggggtg ctttgctgca 600
ggagggactg gtgcacttca caaaatagat ggcatcatgg acgccgtgca gtatgtggat 660
atattgaagc aacatctcaa gacatcagtc aggaagttaa agcttggtcg caaatgggtc 720
ttccaacacg acaatgaccc caagcatact tccaaagttg tggcaaaatg gcttaaggac 780
aacaaagtca aggtattgga gtggccatca caaagccctg acctcaatcc tatagaaaat 840
ttgtgggcag aactgaaaaa gcgtgtgcga gcaaggaggc ctacaaacct gactcagtta 900
caccagctct gtcaggagga atgggccaaa attcacccaa attattgtgg gaagcttgtg 960
gaaggctacc cgaaacgttt gacccaagtt aaacaattta aaggcaatgc taccaaatac 1020
<210> 69
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> human Cas9 (hCas9) amino acid
<400> 69
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 70
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> nickase Cas9 (nCas9) amino acid
<400> 70
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 71
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> dead Cas9 (dCas9) amino acid
<400> 71
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 72
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> hyperactive PiggyBac (PB) transposase amino acid
<400> 72
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 73
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> hyperactive Sleeping Beauty (SB100) transposase amino acid
<400> 73
Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Arg Ile Val
1 5 10 15
Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu
20 25 30
Ala Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His
35 40 45
His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Val Leu
50 55 60
Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro
65 70 75 80
Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr
85 90 95
Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu
100 105 110
Lys Gly His Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys
115 120 125
Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr
130 135 140
Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys
165 170 175
Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile
180 185 190
Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys
195 200 205
Ile Asp Gly Ile Met Asp Ala Val Gln Tyr Val Asp Ile Leu Lys Gln
210 215 220
His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys
245 250 255
Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg
275 280 285
Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys
290 295 300
Gln Glu Glu Trp Ala Lys Ile His Pro Asn Tyr Cys Gly Lys Leu Val
305 310 315 320
Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn
325 330 335
Ala Thr Lys Tyr
340
<210> 74
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> IN cPPT/CTS domain Nucleic Acid
<400> 74
ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 60
agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaatttt 118
<210> 75
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer GG-cPPT-Fw
<400> 75
Thr Cys Cys Thr Cys Thr Cys Gly Thr Cys Thr Cys Cys Ala Thr Thr
1 5 10 15
Ala Thr Thr Thr Thr Ala Ala Ala Ala Gly Ala Ala Ala Ala Gly Gly
20 25 30
Gly Gly Gly Gly Ala Thr Thr
35
<210> 76
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer GG-cPPT-STOP-Fw
<400> 76
Thr Cys Cys Thr Cys Thr Cys Gly Thr Cys Thr Cys Cys Ala Thr Thr
1 5 10 15
Ala Ala Thr Thr Thr Ala Ala Ala Ala Gly Ala Ala Ala Ala Gly Gly
20 25 30
Gly Gly Gly Gly Ala Thr Thr
35
<210> 77
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer GG-cPPT-Rv
<400> 77
Thr Cys Cys Thr Cys Thr Cys Gly Thr Cys Thr Cys Cys Cys Thr Gly
1 5 10 15
Ala Ala Ala Ala Ala Thr Thr Thr Thr Gly Ala Ala Thr Thr Thr Thr
20 25 30
Thr Gly Thr Ala Ala Thr Thr Thr Gly Thr Thr Thr Thr Thr Gly
35 40 45
<210> 78
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer GG-AAVS1-6d-Fw
<400> 78
Thr Cys Cys Thr Cys Thr Cys Gly Thr Cys Thr Cys Cys Ala Thr Thr
1 5 10 15
Ala Thr Ala Thr Gly Gly Cys Thr Cys Cys Ala Ala Ala Gly Ala Ala
20 25 30
Ala Ala Ala Gly Ala Gly Gly
35
<210> 79
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer GG-AAVS1-6d-Rv
<400> 79
Thr Cys Cys Thr Cys Thr Cys Gly Thr Cys Thr Cys Cys Cys Thr Gly
1 5 10 15
Ala Thr Cys Ala Ala Thr Cys Cys Thr Cys Ala Thr Cys Cys Thr Gly
20 25 30
Thr Cys Thr Ala Cys Thr Thr Gly Cys Cys Ala Cys Ala
35 40 45
<210> 80
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer GG-AAVS1-6d (-NLS)-Fw
<400> 80
Thr Cys Cys Thr Cys Thr Cys Gly Thr Cys Thr Cys Cys Ala Thr Thr
1 5 10 15
Ala Thr Ala Thr Gly Gly Cys Cys Cys Ala Gly Gly Cys Thr Gly Cys
20 25 30
Thr Cys Thr
35
<210> 81
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer IN-Fw
<400> 81
Thr Thr Thr Thr Ala Gly Ala Thr Gly Gly Ala Ala Thr Ala Gly Ala
1 5 10 15
Thr Ala Ala Gly Gly Cys Cys Cys
20
<210> 82
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer XbaI-pSICO_IC-5'Fw1
<400> 82
Cys Thr Ala Gly Cys Thr Cys Thr Ala Gly Ala Thr Gly Gly Cys Thr
1 5 10 15
Ala Ala Cys Thr Ala Gly Gly Gly Ala Ala Cys Cys Cys Ala Cys Thr
20 25 30
<210> 83
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SacI-pSICO_IC-5'Rv1
<400> 83
Cys Thr Ala Gly Cys Gly Ala Gly Cys Thr Cys Cys Cys Ala Gly Gly
1 5 10 15
Cys Thr Cys Ala Gly Ala Thr Cys Thr Gly Gly Thr Cys Thr Ala Ala
20 25 30
Cys
<210> 84
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer XbaI-pSICO_IC-5'Fw2
<400> 84
Cys Thr Ala Gly Cys Thr Cys Thr Ala Gly Ala Cys Thr Ala Ala Cys
1 5 10 15
Thr Ala Gly Gly Gly Ala Ala Cys Cys Cys Ala Cys Thr Gly Cys
20 25 30
<210> 85
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SacI-pSICO_IC-5'Rv2
<400> 85
Cys Cys Thr Cys Thr Cys Thr Ala Thr Gly Gly Gly Cys Ala Gly Thr
1 5 10 15
Cys Thr Ala Gly Cys Gly Ala Gly Cys Thr Cys Cys Thr Gly Gly Thr
20 25 30
Cys Thr Ala Ala Cys Cys Ala Gly Ala Gly Ala Gly Ala Cys Cys Cys
35 40 45
<210> 86
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer XbaI-pSICO_IC-3'Fw1
<400> 86
Cys Thr Ala Gly Cys Thr Cys Thr Ala Gly Ala Thr Cys Cys Cys Thr
1 5 10 15
Cys Ala Gly Ala Cys Cys Cys Thr Thr Thr Thr Ala Gly Thr Cys Ala
20 25 30
<210> 87
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SacI-pSICO_IC-3'Rv1
<400> 87
Cys Thr Ala Gly Cys Gly Ala Gly Cys Thr Cys Cys Ala Ala Cys Ala
1 5 10 15
Gly Ala Cys Gly Gly Gly Cys Ala Cys Ala Cys Ala Cys Thr Ala
20 25 30
<210> 88
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer XbaI-pSICO_IC-3'Fw2
<400> 88
Cys Thr Ala Gly Cys Thr Cys Thr Ala Gly Ala Ala Ala Ala Ala Thr
1 5 10 15
Cys Thr Cys Thr Ala Gly Cys Ala Gly Cys Cys Cys Ala Thr Cys Cys
20 25 30
<210> 89
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SacI-pSICO_IC-3'Rv2
<400> 89
Cys Cys Thr Cys Thr Cys Thr Ala Thr Gly Gly Gly Cys Ala Gly Thr
1 5 10 15
Cys Thr Ala Gly Cys Gly Ala Gly Cys Thr Cys Gly Ala Cys Gly Gly
20 25 30
Gly Cys Ala Cys Ala Cys Ala Cys Thr Ala Cys Thr Thr Gly Ala
35 40 45
<210> 90
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer CCD1-A128T-F
<400> 90
Thr Cys Ala Cys Cys Ala Gly Thr Ala Cys Thr Ala Cys Ala Gly Thr
1 5 10 15
Thr Ala Ala Gly Ala Cys Cys Gly Cys Cys Thr Gly Thr Thr Gly Gly
20 25 30
Thr Gly Gly
35
<210> 91
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer CCD1-A128T-R
<400> 91
Cys Cys Ala Cys Cys Ala Ala Cys Ala Gly Gly Cys Gly Gly Thr Cys
1 5 10 15
Thr Thr Ala Ala Cys Thr Gly Thr Ala Gly Thr Ala Cys Thr Gly Gly
20 25 30
Thr Gly Ala
35
<210> 92
<211> 41
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer CCD2-E170G-F
<400> 92
Ala Cys Ala Gly Gly Thr Ala Ala Gly Ala Gly Ala Thr Cys Ala Gly
1 5 10 15
Gly Cys Thr Gly Gly Cys Cys Ala Thr Cys Thr Thr Ala Ala Gly Ala
20 25 30
Cys Ala Gly Cys Ala Gly Thr Ala Cys
35 40
<210> 93
<211> 41
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer CCD2-E170G-R
<400> 93
Gly Thr Ala Cys Thr Gly Cys Thr Gly Thr Cys Thr Thr Ala Ala Gly
1 5 10 15
Ala Thr Gly Gly Cys Cys Ala Gly Cys Cys Thr Gly Ala Thr Cys Thr
20 25 30
Cys Thr Thr Ala Cys Cys Thr Gly Thr
35 40
<210> 94
<211> 63
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer NTD1-E10/13K-F
<400> 94
Gly Gly Thr Thr Thr Thr Thr Thr Ala Gly Ala Thr Gly Gly Ala Ala
1 5 10 15
Thr Ala Gly Ala Thr Ala Ala Gly Gly Cys Cys Cys Ala Ala Ala Ala
20 25 30
Gly Gly Ala Ala Cys Ala Thr Ala Ala Gly Ala Ala Ala Thr Ala Thr
35 40 45
Cys Ala Cys Ala Gly Thr Ala Ala Thr Thr Gly Gly Ala Gly Ala
50 55 60
<210> 95
<211> 63
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer NTD1-E10/13K-R
<400> 95
Thr Cys Thr Cys Cys Ala Ala Thr Thr Ala Cys Thr Gly Thr Gly Ala
1 5 10 15
Thr Ala Thr Thr Thr Cys Thr Thr Ala Thr Gly Thr Thr Cys Cys Thr
20 25 30
Thr Thr Thr Gly Gly Gly Cys Cys Thr Thr Ala Thr Cys Thr Ala Thr
35 40 45
Thr Cys Cys Ala Thr Cys Thr Ala Ala Ala Ala Ala Ala Cys Cys
50 55 60
<210> 96
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer Solubility-F185K-F
<400> 96
Ala Ala Ala Thr Gly Gly Cys Ala Gly Thr Ala Thr Thr Cys Ala Thr
1 5 10 15
Cys Cys Ala Cys Ala Ala Thr Ala Ala Gly Ala Ala Ala Ala Gly Ala
20 25 30
Ala Ala Ala Gly Gly Gly Gly Gly Gly Ala Thr Thr Gly Gly Gly Gly
35 40 45
Gly
<210> 97
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer Solubility-F185K-R
<400> 97
Cys Cys Cys Cys Cys Ala Ala Thr Cys Cys Cys Cys Cys Cys Thr Thr
1 5 10 15
Thr Thr Cys Thr Thr Thr Thr Cys Thr Thr Ala Thr Thr Gly Thr Gly
20 25 30
Gly Ala Thr Gly Ala Ala Thr Ala Cys Thr Gly Cys Cys Ala Thr Thr
35 40 45
Thr
<210> 98
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer Primer NGS-aavs fw
<400> 98
Ala Cys Ala Cys Thr Cys Thr Thr Thr Cys Cys Cys Thr Ala Cys Ala
1 5 10 15
Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr Cys Cys Gly Ala Thr Cys
20 25 30
Thr Ala Gly Gly Ala Cys Ala Gly Cys Ala Thr Gly Thr Thr Thr Gly
35 40 45
Cys Thr Gly Cys Cys Thr
50
<210> 99
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer NGS-aavs rv
<400> 99
Gly Ala Cys Thr Gly Gly Ala Gly Thr Thr Cys Ala Gly Ala Cys Gly
1 5 10 15
Thr Gly Thr Gly Cys Thr Cys Thr Thr Cys Cys Gly Ala Thr Cys Thr
20 25 30
Gly Cys Thr Cys Cys Ala Gly Gly Ala Ala Ala Thr Gly Gly Gly Gly
35 40 45
Gly Thr Gly
50
<210> 100
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB R245A
<400> 100
Cys Gly Thr Gly Thr Thr Cys Ala Cys Cys Cys Cys Cys Gly Thr Gly
1 5 10 15
Gly Cys Ala Ala Ala Gly Ala Thr Cys Thr Gly Gly Gly Ala Cys Cys
20 25 30
Thr Gly
<210> 101
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB R275-277A
<400> 101
Ala Gly Cys Thr Gly Cys Thr Gly Gly Gly Cys Thr Thr Cys Gly Cys
1 5 10 15
Gly Gly Gly Cys Gly Cys Gly Thr Gly Cys Cys Cys Cys Thr Thr Cys
20 25 30
Ala Gly Gly Gly
35
<210> 102
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB R388A
<400> 102
Gly Ala Ala Cys Ala Gly Cys Ala Gly Gly Thr Cys Cys Gly Cys Gly
1 5 10 15
Cys Cys Cys Gly Thr Gly Gly Gly Cys Ala Cys Cys
20 25
<210> 103
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB S351A
<400> 103
Gly Ala Cys Ala Ala Cys Thr Gly Gly Thr Thr Cys Ala Cys Cys Gly
1 5 10 15
Cys Cys Ala Thr Cys Cys Cys Cys Cys Thr Gly Gly Cys Cys Ala Ala
20 25 30
<210> 104
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB W465A
<400> 104
Gly Ala Ala Ala Gly Ala Cys Cys Ala Ala Cys Ala Gly Gly Gly Cys
1 5 10 15
Gly Cys Cys Cys Ala Thr Gly Gly Cys Cys Cys Thr Gly Cys
20 25 30
<210> 105
<211> 43
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB R372A-K375A
<400> 105
Cys Ala Thr Cys Gly Thr Gly Gly Gly Cys Ala Cys Cys Gly Thr Gly
1 5 10 15
Gly Cys Ala Ala Gly Cys Ala Ala Cys Gly Cys Gly Ala Gly Ala Gly
20 25 30
Ala Gly Ala Thr Cys Cys Cys Cys Gly Ala Gly
35 40
<210> 106
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer PB D450N
<400> 106
Gly Cys Gly Thr Gly Gly Ala Cys Ala Cys Cys Cys Thr Gly Ala Ala
1 5 10 15
Cys Cys Ala Gly Ala Thr Gly Thr Gly Cys Ala Gly Cys
20 25
<210> 107
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SYBR-WPRE-3_Fw
<400> 107
Ala Cys Gly Cys Thr Ala Thr Gly Thr Gly Gly Ala Thr Ala Cys Gly
1 5 10 15
Cys Thr Gly Cys Thr
20
<210> 108
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SYBR-WPRE-3_Rv
<400> 108
Ala Gly Cys Ala Ala Ala Cys Ala Cys Ala Gly Thr Gly Cys Ala Cys
1 5 10 15
Ala Cys Cys Ala Cys
20
<210> 109
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SYBR-RNaseP_Fw
<400> 109
Gly Gly Ala Gly Thr Gly Ala Gly Gly Ala Gly Gly Gly Ala Thr Gly
1 5 10 15
Thr Gly Ala Ala
20
<210> 110
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SYBR-RNaseP_Rv
<400> 110
Ala Thr Thr Gly Ala Gly Gly Gly Cys Ala Cys Thr Gly Gly Ala Ala
1 5 10 15
Ala Thr Thr Gly
20
<210> 111
<211> 68
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer Illumina custom
<400> 111
Ala Ala Thr Gly Ala Thr Ala Cys Gly Gly Cys Gly Ala Cys Cys Ala
1 5 10 15
Cys Cys Gly Ala Gly Ala Thr Cys Thr Ala Cys Ala Cys Ala Gly Cys
20 25 30
Thr Ala Gly Ala Cys Ala Cys Thr Cys Thr Thr Thr Cys Cys Cys Thr
35 40 45
Ala Cys Ala Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr Cys Cys Gly
50 55 60
Ala Thr Cys Thr
65
<210> 112
<211> 64
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer NEBNext Index 9
<400> 112
Cys Ala Ala Gly Cys Ala Gly Ala Ala Gly Ala Cys Gly Gly Cys Ala
1 5 10 15
Thr Ala Cys Gly Ala Gly Ala Thr Cys Thr Gly Ala Thr Cys Gly Thr
20 25 30
Gly Ala Cys Thr Gly Gly Ala Gly Thr Thr Cys Ala Gly Ala Cys Gly
35 40 45
Thr Gly Thr Gly Cys Thr Cys Thr Thr Cys Cys Gly Ala Thr Cys Thr
50 55 60
<210> 113
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer NGS cluster 1 fw
<400> 113
Ala Cys Ala Cys Thr Cys Thr Thr Thr Cys Cys Cys Thr Ala Cys Ala
1 5 10 15
Cys Gly Ala Cys Gly Cys Thr Cys Thr Thr Cys Cys Gly Ala Thr Cys
20 25 30
Thr Cys Thr Gly Cys Gly Gly Gly Ala Gly Ala Ala Cys Gly Ala Cys
35 40 45
Gly Thr Gly Thr Thr
50
<210> 114
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer NGS cluster 2 rv
<400> 114
Gly Ala Cys Thr Gly Gly Ala Gly Thr Thr Cys Ala Gly Ala Cys Gly
1 5 10 15
Thr Gly Thr Gly Cys Thr Cys Thr Thr Cys Cys Gly Ala Thr Cys Thr
20 25 30
Cys Cys Thr Cys Ala Cys Cys Thr Thr Cys Cys Thr Cys Thr Thr Cys
35 40 45
Thr Thr Cys Thr Thr Gly Gly
50 55
<210> 115
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer CMV-F
<400> 115
Cys Thr Gly Cys Ala Gly Cys Gly Cys Gly Gly Gly Gly Ala Thr Cys
1 5 10 15
Thr Cys Ala Thr Gly Cys Thr Gly Gly Ala Gly Thr Thr Cys Thr Thr
20 25 30
Cys Gly Cys Cys Cys Ala Cys Cys Cys Cys
35 40
<210> 116
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer cas9 rv
<400> 116
Cys Ala Cys Cys Thr Thr Cys Cys Thr Cys Thr Thr Cys Thr Thr Cys
1 5 10 15
Thr Thr Gly Gly Gly Gly Thr Cys Ala
20 25
<210> 117
<211> 573
<212> PRT
<213> Artificial Sequence
<220>
<223> ZFP_TCRa4 na sequence
<400> 117
Ala Thr Gly Gly Cys Thr Cys Cys Thr Ala Ala Gly Ala Ala Gly Ala
1 5 10 15
Ala Gly Cys Gly Gly Ala Ala Ala Gly Thr Cys Gly Gly Cys Ala Thr
20 25 30
Ala Cys Ala Cys Gly Gly Ala Gly Thr Gly Cys Cys Thr Gly Cys Thr
35 40 45
Gly Cys Ala Ala Thr Gly Gly Cys Ala Gly Ala Ala Ala Gly Gly Cys
50 55 60
Cys Ala Thr Thr Cys Cys Ala Ala Thr Gly Cys Ala Gly Ala Ala Thr
65 70 75 80
Ala Thr Gly Cys Ala Thr Gly Ala Gly Gly Ala Ala Cys Thr Thr Cys
85 90 95
Thr Cys Ala Gly Ala Thr Cys Gly Cys Ala Gly Thr Ala Ala Cys Cys
100 105 110
Thr Cys Thr Cys Ala Ala Gly Gly Cys Ala Thr Ala Thr Ala Cys Gly
115 120 125
Gly Ala Cys Cys Cys Ala Thr Ala Cys Gly Gly Gly Gly Gly Ala Ala
130 135 140
Ala Ala Ala Cys Cys Ala Thr Thr Thr Gly Cys Cys Thr Gly Thr Gly
145 150 155 160
Ala Thr Ala Thr Ala Thr Gly Thr Gly Gly Cys Cys Gly Cys Ala Ala
165 170 175
Gly Thr Thr Cys Gly Cys Thr Cys Ala Gly Ala Ala Ala Gly Thr Gly
180 185 190
Ala Cys Cys Thr Thr Gly Gly Cys Ala Gly Cys Thr Cys Ala Cys Ala
195 200 205
Cys Thr Ala Ala Gly Ala Thr Thr Cys Ala Cys Ala Cys Ala Cys Ala
210 215 220
Thr Cys Cys Ala Ala Gly Ala Gly Cys Cys Cys Cys Thr Ala Thr Cys
225 230 235 240
Cys Cys Thr Ala Ala Gly Cys Cys Gly Thr Thr Cys Cys Ala Ala Thr
245 250 255
Gly Thr Ala Gly Gly Ala Thr Ala Thr Gly Cys Ala Thr Gly Cys Gly
260 265 270
Ala Ala Ala Cys Thr Thr Cys Thr Cys Thr Gly Ala Thr Cys Gly Gly
275 280 285
Ala Gly Thr Gly Cys Ala Cys Thr Gly Ala Gly Thr Ala Gly Gly Cys
290 295 300
Ala Cys Ala Thr Cys Ala Gly Ala Ala Cys Ala Cys Ala Cys Ala Cys
305 310 315 320
Gly Gly Gly Ala Gly Ala Ala Ala Ala Gly Cys Cys Thr Thr Thr Cys
325 330 335
Gly Cys Thr Thr Gly Cys Gly Ala Thr Ala Thr Cys Thr Gly Cys Gly
340 345 350
Gly Gly Cys Gly Gly Ala Ala Gly Thr Thr Cys Gly Cys Ala Ala Cys
355 360 365
Ala Thr Cys Cys Gly Gly Gly Ala Ala Thr Cys Thr Cys Ala Cys Thr
370 375 380
Cys Gly Cys Cys Ala Thr Ala Cys Gly Ala Ala Ala Ala Thr Ala Cys
385 390 395 400
Ala Cys Ala Cys Thr Gly Gly Cys Ala Gly Cys Cys Ala Ala Ala Ala
405 410 415
Ala Cys Cys Thr Thr Thr Cys Cys Ala Ala Thr Gly Cys Cys Gly Ala
420 425 430
Ala Thr Ala Thr Gly Thr Ala Thr Gly Ala Gly Ala Ala Ala Thr Thr
435 440 445
Thr Thr Ala Gly Cys Thr Ala Cys Ala Gly Ala Ala Gly Thr Thr Cys
450 455 460
Ala Thr Thr Gly Ala Ala Ala Gly Ala Ala Cys Ala Cys Ala Thr Thr
465 470 475 480
Ala Gly Ala Ala Cys Cys Cys Ala Thr Ala Cys Cys Gly Gly Ala Gly
485 490 495
Ala Ala Ala Ala Gly Cys Cys Gly Thr Thr Cys Gly Cys Gly Thr Gly
500 505 510
Cys Gly Ala Thr Ala Thr Cys Thr Gly Cys Gly Gly Thr Cys Gly Gly
515 520 525
Ala Ala Gly Thr Thr Cys Gly Cys Thr Ala Cys Cys Thr Cys Ala Gly
530 535 540
Gly Cys Ala Ala Cys Cys Thr Gly Ala Cys Ala Cys Gly Cys Cys Ala
545 550 555 560
Cys Ala Cys Gly Ala Ala Ala Ala Thr Cys Cys Ala Cys
565 570
<210> 118
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> ZFP_TCRa4 aa sequence
<400> 118
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Ala Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
20 25 30
Ser Asp Arg Ser Asn Leu Ser Arg His Ile Arg Thr His Thr Gly Glu
35 40 45
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Lys Val
50 55 60
Thr Leu Ala Ala His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
65 70 75 80
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg
85 90 95
Ser Ala Leu Ser Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
100 105 110
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Ser Gly Asn Leu Thr
115 120 125
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
130 135 140
Ile Cys Met Arg Asn Phe Ser Tyr Arg Ser Ser Leu Lys Glu His Ile
145 150 155 160
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
165 170 175
Lys Phe Ala Thr Ser Gly Asn Leu Thr Arg His Thr Lys Ile His
180 185 190
<210> 119
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (245)..(245)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (275)..(275)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (277)..(277)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (325)..(325)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (347)..(347)
<223> Wherein amino acid could be Ala, Ser
<220>
<221> MISC_FEATURE
<222> (351)..(351)
<223> Wherein amino acid could be Glu, Pro, Ala
<220>
<221> MISC_FEATURE
<222> (372)..(372)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (375)..(375)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (388)..(388)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein amino acid could be Asn
<220>
<221> MISC_FEATURE
<222> (465)..(465)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (560)..(560)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (564)..(564)
<223> Wherein amino acid could be Pro
<220>
<221> MISC_FEATURE
<222> (573)..(573)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (589)..(589)
<223> Wherein amino acid could be Val
<220>
<221> MISC_FEATURE
<222> (592)..(592)
<223> Wherein amino acid could be Gly
<220>
<221> MISC_FEATURE
<222> (594)..(594)
<223> Wherein amino acid could be Leu
<400> 119
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 120
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Top1 Modified hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (245)..(245)
<223> Wherein amino acid could be Ala
<220>
<221> MISC_FEATURE
<222> (275)..(275)
<223> Wherein amino acid could be Arg, Ala
<220>
<221> MISC_FEATURE
<222> (277)..(277)
<223> Wherein amino acid could be Arg, Ala
<220>
<221> MISC_FEATURE
<222> (325)..(325)
<223> Wherein amino acid could be Ala, Gly
<220>
<221> MISC_FEATURE
<222> (347)..(347)
<223> Wherein amino acid could be Asn, Ala
<220>
<221> MISC_FEATURE
<222> (351)..(351)
<223> Wherein amino acid could be Glu, Pro, Ala
<220>
<221> MISC_FEATURE
<222> (372)..(372)
<223> Wherein amino acid could be Arg
<400> 120
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 121
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Top1.1 Modified hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 121
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Ala Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Ala Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Glu Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Ala Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Pro Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Gly
580 585 590
Cys Leu
<210> 122
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Top1.2 Modified hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 122
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Ala Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Ala Gly Ala Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Ala Trp Phe Thr Pro Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Ala Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Ala
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 123
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Top1.3 Modified hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 123
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Ala Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Ala Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Ala Trp Phe Thr Ala Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Ala Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Ala
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ala Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 124
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Regular modified 1 hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 124
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Ala Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Ala Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 125
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Regular modified 2 hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 125
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Gly
580 585 590
Cys Phe
<210> 126
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Regular modified 3 hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 126
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 127
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Regular modified 4 hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 127
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Ala Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Ala Gly Ala Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Ala Ser Asn Ala Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Leu
<210> 128
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Regular modified 5 hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 128
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Ala Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Ala Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Ser Trp Phe Thr Ala Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Ala Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Ala
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Gly
580 585 590
Cys Phe
<210> 129
<211> 594
<212> PRT
<213> Artificial Sequence
<220>
<223> Regular modified 6 hyperactive PiggyBac aa sequence
<220>
<221> MISC_FEATURE
<222> (450)..(450)
<223> Wherein the amino acid can be Asp, Asn
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> Wherein the amino acid can be Trp, Ala
<400> 129
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Ala Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ala Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Ala Ser Asn Ala Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Ala
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Gly
580 585 590
Cys Phe
<210> 130
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker aa sequence
<400> 130
Lys Leu Ala Gly Gly Ala Pro Ala Val Gly Gly Gly Pro Lys
1 5 10
<210> 131
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker aa sequence
<400> 131
Glu Phe Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gln Phe
<210> 132
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Primer SV40pA-R
<400> 132
Gly Ala Ala Ala Thr Thr Thr Gly Thr Gly Ala Thr Gly Cys Thr Ala
1 5 10 15
Thr Thr Gly Cys
20
<210> 133
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> Wherein the sequence can be repeated 1 to 50 times
<400> 133
Gly Gly Gly Gly Ser
1 5
<210> 134
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> Wherein the sequence can be repeated 1 to 50 times
<400> 134
Glu Ala Ala Ala Lys
1 5
Claims (26)
- 다음을 포함하는 핵산 작제물:
a) 게놈의 특정 게놈 DNA 서열에 결합하도록 조작된 제1 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제1 폴리뉴클레오타이드 서열로서; 여기서 제1 DNA 결합 단백질은 아연 집게 단백질(zinc finger protein) 또는 Cas9 단백질인 것인 서열;
b) 외인성 핵산을 게놈 내로 삽입할 수 있는 제2 DNA 결합 단백질을 인코딩하는 핵산을 포함하는 제2 폴리뉴클레오타이드 서열로서, 여기서 제2 DNA 결합 단백질은
(i) 과활성 PiggyBac 트랜스포사제(hyperactive PiggyBac transposase) 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac이거나, 또는
(ii) 인간 면역결핍 바이러스 (HIV) 인테그라제(integrage), 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제인 것인 서열, 및
c) 링커를 인코딩하는 핵산을 포함하는 선택적인 폴리뉴클레오타이드 서열;
여기서 핵산 작제물은 제1 DNA 결합 단백질, 제2 DNA 결합 단백질, 및 제1 DNA 결합 단백질과 제2 DNA 결합 단백질 사이의 선택적인 링커를 포함하는 융합 단백질을 인코딩하고;
융합 단백질은 외인성 핵산을 게놈의 특정 부위에 삽입할 수 있는 것인 핵산 작제물. - 제1항에 있어서, Cas9 단백질은 인간 Cas9, 닉카제 Cas9 및 멸실(dead) Cas 9로 구성된 군으로부터 선택되는 것인 핵산 작제물.
- 제1항에 있어서, 아연 집게 단백질은 6 개의 도메인을 포함하는 C2H2 아연 집게 단백질인 것인 핵산 작제물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 링커는 XTEN 서열 또는 GGS 서열을 포함하는 것인 핵산 작제물.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물.
- 제1항 내지 제5항 중 어느 한 항에 있어서,
a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 아연 집게 단백질이고,
b) 제2 DNA 결합 단백질은 과활성 PiggyBac 트랜스포사제, 또는 과활성 PiggyBac에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 과활성 PiggyBac이고,
여기서 핵산 작제물은 (c) XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩하는 핵산을 포함하는 폴리뉴클레오타이드 서열을 포함하고,
제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물. - 제1항 내지 제5항 중 어느 한 항에 있어서,
a) 제1 DNA 결합 단백질은 Cas 9 단백질 또는 및 아연 집게 단백질이고,
b) 제2 DNA 결합 단백질은 HIV 인테그라제, 또는 HIV 인테그라제에 비해 외인성 핵산을 게놈에 삽입하는 특이성이 개선된 변형된 HIV 인테그라제이고,
여기서 핵산 작제물은 (c) XTEN 서열 또는 GGS 서열을 포함하는 링커를 인코딩하는 핵산을 포함하는 폴리뉴클레오타이드 서열을 포함하고,
제1 폴리뉴클레오타이드 서열의 3' 말단은 제2 폴리뉴클레오타이드의 5' 말단에 연결되는 것인 핵산 작제물. - 제1항 내지 제6항 중 어느 한 항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 상응하는 아미노산 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592, 및 594 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
- 제8항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제 돌연변이는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 해당하는 R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, 또는 F594L로부터 선택된 아미노산 변형 중 하나 이상을 포함하는 것인 핵산 작제물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 해당하는 아미노산 245, 275, 277, 325, 347, 351, 372, 375, 388, 450, 465, 560, 564, 573, 589, 592, 594 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
- 제10항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제 돌연변이는 과활성 PiggyBac의 아미노산 서열 서열 번호 9에 해당하는 R245A, R275A, R277A, R275A/R277A, G325A, N347A, N347S, S351E, S351P, S351A, R372A, K375A, R388A, D450N, W465A, T560A, S564P, S573A, M589V, S592G, 또는 F594L으로부터 선택된 아미노산 변형 중 하나 이상을 포함하는 것인 핵산 작제물.
- 제10항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 아미노산 서열 서열 번호 9를 포함하며, 여기서:
i. 위치 245의 아미노산은 A이고,
ii. 위치 275의 아미노산은 R 또는 A이고,
iii. 위치 277의 아미노산은 R 또는 A이고,
iv. 위치 325의 아미노산은 A 또는 G이고,
v. 위치 347의 아미노산은 N 또는 A이고,
vi. 위치 351의 아미노산은 E, P 또는 A이고,
vii. 위치 372의 아미노산은 R이고,
viii. 위치 375의 아미노산은 A이고,
ix. 위치 450의 아미노산은 D 또는 N이고,
x. 위치 465의 아미노산은 W 또는 A이고,
xi. 위치 560의 아미노산은 T 또는 A이고,
xii. 위치 564의 아미노산은 P 또는 S이고,
xiii. 위치 573의 아미노산은 S 또는 A이고,
xiv. 위치 592의 아미노산은 G 또는 S이고,
xv. 위치 594의 아미노산은 L 또는 F인 것인 핵산 작제물. - 제10항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 120, 121, 122, 123, 124, 125, 126, 127, 128, 및 129으로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 핵산 작제물.
- 제10항에 있어서, 변형된 과활성 PiggyBac 트랜스포사제는 서열 번호 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 및 129으로 구성된 군으로부터 선택된 서열에 대해 적어도 80% 상동성을 가지는 아미노산 서열을 포함하고, 여기서 변형된 과활성 PiggyBac은 과활성 PiggyBac에 비해 게놈 내로의 DNA 통합의 높은 특이성을 나타내는 것인 핵산 작제물.
- 제1항 내지 제5항 또는 제7항 중 어느 한 항에에 있어서, 변형된 HIV 인테그라제는 야생형 HIV 인테그라제의 아미노산 서열 서열 번호 1에 해당하는 아미노산 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266, 또는 273 중 하나 이상의 돌연변이를 포함하는 것인 핵산 작제물.
- 제15항에 있어서, 변형된 HIV 인테그라제 돌연변이는 야생형 HIV 인테그라제의 아미노산 서열 서열 번호 1에 해당하는 D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, 또는 K273R 중 하나 이상을 포함하는 것인 핵산 작제물.
- 제1항 내지 제16항 중 어느 한 항의 핵산 작제물을 포함하는 벡터로서, 이러한 벡터는 포유동물 세포, 효모 세포, 곤충 세포, 식물 세포, 진균 세포 또는 조류 세포에서의 발현에 적합한 것인 벡터.
- 제1항 내지 제17항 중 어느 한 항의 핵산 작제물 또는 벡터를 포함하는 숙주 세포.
- 제1항 내지 제16항 중 어느 한 항의 핵산 작제물의 발현으로부터 수득된 융합 단백질.
- 제1항 내지 제17항 또는 제19항 중 어느 한 항의 핵산 작제물, 벡터 또는 융합 단백질, 및 게놈에 삽입하기 위한 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열을 포함하는 조성물로서, 이러한 조성물은 패키징 벡터에 함유 또는 결합되는 것인 조성물.
- 제20항에 있어서, 핵산 작제물은 RNA, DNA 또는 단백질의 형태이며, 외인성 핵산을 인코딩하는 폴리뉴클레오타이드 서열은 RNA 또는 DNA의 형태인 것인 조성물.
- 제20항 내지 제21항 중 어느 한 항에 있어서, 패키징 벡터는 나노입자 또는 렌티바이러스 입자인 것인 조성물.
- 다음의 단계를 포함하는, 세포 내로의 외인성 핵산 서열의 단일 카피 또는 다중 카피의 제어된, 부위-특이적 통합 방법:
a) 제1항 내지 제17항 또는 제19항 중 어느 한 항의 핵산 작제물, 벡터 또는 융합 단백질을 세포에 전달하는 단계, 및
b) 외인성 핵산을 세포에 전달하는 단계;
여기서 세포의 게놈에서 특정 게놈 DNA 서열에 대한 융합 단백질의 결합은 게놈의 절단 및 게놈 내로 외인성 핵산의 하나 이상의 카피를 세포의 통합을 초래하는 것인 방법 - 아미노산 서열 서열 번호 9를 포함하는 변형된 과활성 PiggyBac 트랜스포사제로서, 여기서:
i. 위치 245의 아미노산은 A이고,
ii. 위치 275의 아미노산은 R 또는 A이고,
iii. 위치 277의 아미노산은 R 또는 A이고,
iv. 위치 325의 아미노산은 A 또는 G이고,
v. 위치 347의 아미노산은 N 또는 A이고,
vi. 위치 351의 아미노산은 E, P 또는 A이고,
vii. 위치 372의 아미노산은 R이고,
viii. 위치 375의 아미노산은 A이고,
ix. 위치 450의 아미노산은 D 또는 N이고,
x. 위치 465의 아미노산은 W 또는 A이고,
xi. 위치 560의 아미노산은 T 또는 A이고,
xii. 위치 564의 아미노산은 P 또는 S이고,
xiii. 위치 573의 아미노산은 S 또는 A이고,
xiv. 위치 592의 아미노산은 G 또는 S이고,
xv. 위치 594의 아미노산은 L 또는 F인 것인 변형된 과활성 PiggyBac 트랜스포사제. - 제24항에 있어서, 서열 번호 120, 121, 122, 123, 124, 125, 126, 127, 128, 및 129으로 구성된 군으로부터 선택된 아미노산 서열을 포함하는 것인 변형된 과활성 PiggyBac 트랜스포사제.
- 제24항에 있어서, 서열 번호 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 및 129으로 구성된 군으로부터 선택된 서열에 대해 적어도 80% 상동성을 가지는 아미노산 서열을 포함하고, 여기서 변형된 과활성 PiggyBac은 과활성 PiggyBac에 비해 게놈 내로의 DNA 통합의 높은 특이성을 나타내는 것인 변형된 과활성 PiggyBac 트랜스포사제.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962860186P | 2019-06-11 | 2019-06-11 | |
US62/860,186 | 2019-06-11 | ||
PCT/IB2020/055507 WO2020250181A1 (en) | 2019-06-11 | 2020-06-11 | Targeted gene editing constructs and methods of using the same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220019794A true KR20220019794A (ko) | 2022-02-17 |
Family
ID=72178837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227000857A KR20220019794A (ko) | 2019-06-11 | 2020-06-11 | 표적화된 유전자 편집 작제물 및 이의 사용 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220235379A1 (ko) |
EP (1) | EP3983541A1 (ko) |
JP (1) | JP2022540318A (ko) |
KR (1) | KR20220019794A (ko) |
CN (1) | CN114026240A (ko) |
AU (1) | AU2020290790A1 (ko) |
BR (1) | BR112021024828A2 (ko) |
CA (1) | CA3141422A1 (ko) |
IL (1) | IL288794A (ko) |
MX (1) | MX2021015157A (ko) |
WO (1) | WO2020250181A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022129438A1 (en) | 2020-12-16 | 2022-06-23 | Universitat Pompeu Fabra | Programmable transposases and uses thereof |
AU2021399929A1 (en) * | 2020-12-16 | 2023-07-06 | Universitat Pompeu Fabra | Therapeutic lama2 payload for treatment of congenital muscular dystrophy |
JP2024518094A (ja) * | 2021-05-14 | 2024-04-24 | ベクトン・ディキンソン・アンド・カンパニー | 多重非バイアス核酸増幅法 |
IL311782A (en) * | 2021-10-04 | 2024-05-01 | Poseida Therapeutics Inc | Transposases and their uses |
WO2023129940A1 (en) * | 2021-12-30 | 2023-07-06 | Regel Therapeutics, Inc. | Compositions for modulating expression of sodium voltage-gated channel alpha subunit 1 and uses thereof |
WO2023141504A2 (en) * | 2022-01-19 | 2023-07-27 | Genomeminer, Inc. (Formally Tupac Bio, Inc.) | Dcas9-integrase for targeted genome editing |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SI1546322T1 (sl) * | 2002-07-24 | 2011-05-31 | Manoa Biosciences Inc | Vektorji na osnovi transpozona in metode integracije nukleinskih kislin |
EP3277805A1 (en) * | 2015-03-31 | 2018-02-07 | Exeligen Scientific, Inc. | Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism |
US20200377881A1 (en) * | 2017-03-24 | 2020-12-03 | President And Fellows Of Harvard College | Methods of Genome Engineering by Nuclease-Transposase Fusion Proteins |
-
2020
- 2020-06-11 US US17/617,252 patent/US20220235379A1/en active Pending
- 2020-06-11 EP EP20760532.0A patent/EP3983541A1/en active Pending
- 2020-06-11 AU AU2020290790A patent/AU2020290790A1/en active Pending
- 2020-06-11 KR KR1020227000857A patent/KR20220019794A/ko unknown
- 2020-06-11 BR BR112021024828A patent/BR112021024828A2/pt unknown
- 2020-06-11 MX MX2021015157A patent/MX2021015157A/es unknown
- 2020-06-11 WO PCT/IB2020/055507 patent/WO2020250181A1/en unknown
- 2020-06-11 CN CN202080043025.3A patent/CN114026240A/zh active Pending
- 2020-06-11 CA CA3141422A patent/CA3141422A1/en active Pending
- 2020-06-11 JP JP2021574234A patent/JP2022540318A/ja active Pending
-
2021
- 2021-12-08 IL IL288794A patent/IL288794A/en unknown
Also Published As
Publication number | Publication date |
---|---|
BR112021024828A2 (pt) | 2022-01-25 |
AU2020290790A1 (en) | 2022-01-27 |
MX2021015157A (es) | 2022-03-17 |
WO2020250181A1 (en) | 2020-12-17 |
EP3983541A1 (en) | 2022-04-20 |
IL288794A (en) | 2022-02-01 |
CN114026240A (zh) | 2022-02-08 |
US20220235379A1 (en) | 2022-07-28 |
JP2022540318A (ja) | 2022-09-15 |
CA3141422A1 (en) | 2020-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7083364B2 (ja) | 配列操作のための最適化されたCRISPR-Cas二重ニッカーゼ系、方法および組成物 | |
KR20220019794A (ko) | 표적화된 유전자 편집 작제물 및 이의 사용 방법 | |
JP6625971B2 (ja) | 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化 | |
US11530421B2 (en) | Self-inactivating endonuclease-encoding nucleic acids and methods of using the same | |
KR102515049B1 (ko) | Cas9 변이체 및 그의 용도 | |
JP2024023194A (ja) | 肝臓ターゲティングおよび治療のためのCRISPR-Cas系、ベクターおよび組成物の送達および使用 | |
JP2020058349A (ja) | Rnaガイド遺伝子編集及び遺伝子調節 | |
WO2023023515A1 (en) | Persistent allogeneic modified immune cells and methods of use thereof | |
EP4349979A1 (en) | Engineered cas12i nuclease, effector protein and use thereof | |
US20240052371A1 (en) | Programmable transposases and uses thereof | |
RU2752529C9 (ru) | Улучшенные эукариотические клетки для получения белка и способы их получения | |
JP2020191879A (ja) | 細胞の有する二本鎖dnaの標的部位を改変する方法 | |
JP2024501892A (ja) | 新規の核酸誘導型ヌクレアーゼ | |
WO2024121790A2 (en) | Cas12 protein, crispr-cas system and uses thereof | |
WO2024042168A1 (en) | Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases | |
WO2024089629A1 (en) | Cas12 protein, crispr-cas system and uses thereof | |
WO2024042165A2 (en) | Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases | |
KR20240087856A (ko) | 지속성 동종 변형된 면역 세포 및 이의 사용 방법 | |
WO2024052681A1 (en) | Rett syndrome therapy |