KR20230002788A

KR20230002788A - 신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물

Info

Publication number: KR20230002788A
Application number: KR1020227040046A
Authority: KR
Inventors: 타냐 다이겔; 루카스 티. 그레이벅; 브라이언 에드워드 캄바크; 에드워드 세바스찬 레인; 보아즈 피. 레비; 존 케이. 미치; 아드리아나 에스텔라 세데노 코르테스; 보실즈카 타식; 조나단 팅; 홍쿠이 젱
Original assignee: 알렌 인스티튜트
Priority date: 2020-04-21
Filing date: 2021-04-21
Publication date: 2023-01-05
Also published as: EP4139462A2; CA3175993A1; WO2021216778A2; WO2021216778A3; JP2023522708A; US20230159952A1; AU2021261359A1

Abstract

선택된 중추신경계 세포 유형에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물이 기재된다. 특히, 인공 발현 작제물은 글루타메이트성 레이어 5 종뇌외-투사(L5 ET) 뉴런과 같은 신피질 글루타메이트성 레이어 5 뉴런에서 합성 유전자를 선택적으로 발현하고/하거나 유전자 발현을 변형시키는 데 사용될 수 있다.

Description

신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물

관련 출원에 대한 상호 참조

본 출원은 2020년 4월 21일 출원된 미국 가특허 출원 번호 63/013,342에 대한 우선권을 주장하며 본원에 완전히 제시된 것처럼 그 전문이 참조로 본원에 포함된다.

연방 지원 연구 또는 개발에 관한 진술

본 발명은 국립보건원에 의해 수여된 보조금 MH114126 및 MH121274 하에 정부 지원으로 이루어졌다. 정부는 발명에 대한 특정 권리는 갖는다.

서열 목록에 대한 참조

본 출원과 연관된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며 이에 의해 명세서에 참조로 포함된다. 서열 목록을 함유하는 텍스트 파일명은 A166-0024PCT_ST25.txt이다. 텍스트 파일은 211 KB이며, 2021년 4월 21일에 생성되었고, EFS-Web을 통해 전자적으로 제출되고 있다.

개시내용의 분야

본 개시내용은 선택된 중추신경계 세포 유형에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물을 제공한다. 인공 발현 작제물은 레이어 5 글루타메이트성 종뇌외-투사(L5 ET) 뉴런과 같은 신피질 레이어 5 글루타메이트성 뉴런에서 합성 유전자를 선택적으로 발현하거나 또는 유전자 발현을 변형시키는 데 사용될 수 있다.

뇌의 생물학을 완전히 이해하기 위해, 상이한 세포 유형을 구별하고 정의해야 하며, 이들을 추가로 연구하기 위해, 선택적으로 표지하고 교란할 수 있는 인공 발현 작제물을 식별해야 한다. 마우스에서, 재조합효소 구동인자 계열을 사용하여 마커 유전자 발현을 공유하는 세포 집단을 표지하는 데 크게 영향을 미쳤다. 그러나, 높은 특이성을 갖는 세포 유형을 표지하는 이러한 계열의 생성, 유지, 및 사용은 비용이 들 수 있고, 삼중 유전자이식 교배를 빈번하게 필요로 하여, 실험 동물의 낮은 빈도를 산출한다. 또한, 이들 도구는 생식계열 유전자이식 동물을 필요로 하며 따라서 인간에게 적용가능하지 않다.

본 개시내용은 표적화된 중추신경계 세포 집단에서 유전자 발현을 선택적으로 구동하는 인공 발현 작제물을 제공한다. 표적화된 중추신경계 세포 집단은 신피질 글루타메이트성 레이어 5 뉴런, 예컨대 신피질 글루타메이트성 레이어 5 종뇌외-투사(L5 ET) 뉴런을 포함한다. 특정 적용에서, 본 출원의 측면은 예를 들어, 근위축성 측삭 경화증(ALS) 또는 L5 ET 뉴런을 수반하는 다른 신경퇴행성 질환의 맥락에서 상부 운동 뉴런에 치료 페이로드를 전달하는 데 사용될 수 있다.

인공 발현 작제물의 특정 구현예는 L5 글루타메이트성 뉴런 내에서 단백질 발현을 선택적으로 구동하는 다음 인핸서를 활용한다: eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, 및/또는 eHGT_583m.

특정 구현예에서, 인공 인핸서 요소는 인핸서의 연쇄된 코어를 포함한다. 예는 eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 및/또는 eHGT_460m의 연쇄된 코어를 포함한다. 이들 인공 인핸서 요소는 단일 전장 원래(고유) 인핸서와 비교하여 이식유전자 발현의 더 높은 수준 및 더 빠른 개시를 제공할 수 있다.

특정 구현예에서, 인핸서 코어는 서열번호: 45-52 중 임의의 하나에 제시된 바와 같은 서열을 포함한다. 특정 구현예에서, 이들 코어는 연쇄되고 코어 서열의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 갖는다. 서열번호: 53-60은 선택된 인핸서 코어의 3-카피 연쇄체를 제공한다.

인공 발현 작제물의 특정 구현예는 L5 글루타메이트성 뉴런 내에서 단백질 발현을 선택적으로 구동하기 위해 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m을 활용한다.

특정 구현예는 벡터를 포함하는 본원에 기재된 벡터의 특징을 포함하는 인공 발현 작제물을 제공한다: CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024.

본원에 제출된 도면 중 일부는 컬러로 더 잘 이해된다. 출원인은 도면의 컬러 버전을 원본 제출의 일부로 간주하고 이후 절차에서 도면의 컬러 이미지를 제시할 권리를 갖는다.
도 1: 바이러스 도구에 대한 예시적인 인핸서 발견의 개요. 세포 유형-특이적 표지화 도구를 구축하기 위해, 성체 마우스 피질의 세포를 단리할 수 있고 서열분석을 사용한 트랜스포사제-접근가능한 염색질에 대한 단일 세포 검정(scATAC-seq)을 수행할 수 있다. 샘플을 클러스터링하고 단일 세포 RNA 서열분석(scRNA-seq) 데이터세트와 비교하여 클러스터를 식별할 수 있다. 이어서 동일한 전사체 유형과 일치하는 단일 세포를 풀링할 수 있고 게놈을 유형-특이적 추정 인핸서에 대해 검색할 수 있다. 대안적으로, 인간 운동 피질 SNARE-seq 데이터세트를 사용하여 일부 인핸서를 선택하였다(Bakken 등, Nature. 2021 doi: https://doi.org/10.1101/2020.03.31.016972). 선택된 추정 인핸서 영역은 AAV 게놈 백본에서 최소 프로모터의 상류에 클로닝될 수 있으며, 이는 자기-상보성 아데노-연관 바이러스 벡터(scAAV) 또는 재조합 아데노-연관 바이러스 벡터(rAAV)를 생성하는 데 사용될 수 있다. 이들 바이러스 도구는 특이적 신피질 집단을 표지하기 위해 안구뒤로 전달될 수 있다. 일치하는 세포 유형을 갖는 세포에서, 인핸서는 세포 유형-특이적 발현을 구동하기 위해 그들의 동족 전사 인자를 모집한다. 다른 세포에서, 바이러스 게놈이 존재하지만, 전사체는 발현되지 않는다.
도 2a, 2b. (2a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_451m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (2b) AAV 벡터 #CN2249의 6.00E¹¹GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 3a, 3b. (3a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq에 따른 인핸서 eHGT_452m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (3b) AAV 벡터 #CN2250의 1.45E¹²GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 4a-4d. (4a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_453m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (4b) AAV 벡터 #CN2251의 7.00E¹¹GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (4c) PHP.eB　캡시드와 함께 패키지된 CN2251 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_453m 인핸서 구동된 리포터 발현이 시각 피질 영역의 L5 ET 뉴런의 4 가지 유형 모두에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 다음과 같이 읽는다: 169 L2/3 IT VISp Rrad, 168 L2/3 IT VISp Adamts2, 167 L2/3 IT VISp Agmay, 164 L4 IT VISp Rspo1, 163 L5 IT VISp Hsd11b1 Endou, 162 L5 IT VISp Whrn Tox2, 160 L5 IT VISp Batf3, 158 L5 IT VISp Col6a1 Fezf1, 157 L5 IT VISp Col27a1, 154 L6 IT VISp Penk Col27a1, 153 L6 IT VISp Penk Fst, L6 IT VISp Col23a1 Adamts2, 149 L6 IT VISp Col18a1, 146 L6 IT VISp Car3, 144 L5 PT VISp Chrna6, 143 L5 PT VISp Lgr5, 142 L5 PT VISp C1ql2 Ptgfr, 141 L5 PT VISp C1ql2 Cdh13, 140 L5 PT VISp Krt80, 134 L5 NP VISp Trhr Cpne7, 133 L5 NP VISp Trhr Met, L5 CT Nxph2 Sla, 130 L5 CT VISp Krt80 Sla, L5 CT VISp Nxph2.Wls, 127 L5 CT VISp Ctxn3 Brinp3, 126 L5 CT VISp Ctxn3 Sla, 122 L5 CT VISp Gpr139, 120 L6b Col8a1 Rprm, 119 L6b VISp Mup5, 118 L6b VISp Col8a1 Rxfp1, 115 L6b P2ry12, L6b VISp Crh, 110 Lamp5 Krt73, Lamp5 Fam19a1 Pax6, 108 Lamp5 Fam19a1 Tmem182, 106 Lamp5 Ntn1 Npy2r, 105 Lamp5 Plch2 Dock5, 101 Lamp5 Lsp1, 100 Lamp5 Lhx6, Sncg Slc17a8, 96 Sncg Vip Nptx2, 95 Sncg Gpr50, 93 Sncg Vip Itih5, 90 Serpinf1 Clrn1, 89 Serpinf1 Aqp5 Vip, 85 Vip Igfbp6 Car10, 84 Vip Igfbp6 Pltp, Vip Lmo1 Fam159b, Vip Lmo1 Myl1, 79 Vip Igfbp4 Mab21l1, 78 Vip Arhgap36 Hmcn1, 77 Vip Gpc3 Slc18a3, 74 Vip Ptprt Pkp2, 73 Vip Rspo4 Rxfp1 Chat, 71 Vip Lect1 Oxtr, 70 Vip Rspo1 Itga4, 67 Vip Chat Htr1f, 66 Vip Pygm C1ql1, 61 Vip Crispld2 Htr2c, 60 Vip Crispld2 Kcne4, 58 Vip Col15a1 Pde1a, 54 Sst Chodl, 53 Sst Mme Fam114a1, 52 Sst Tac1 Htr1d, 50 Sst Tac1 Tacr3, 49 Sst Calb2 Necab1, 48 Sst Calb2 Pdlim5, 46 Sst Nr2f2 Necab1, 45 Sst Myh8 Etv1, 44 Sst Chrna1 Glra3, 42 Sst Myh8 Fibin, 40 Sst Chrna2 Ptgdr, 39 Sst Tac2 Myn4, 37 Sst Hpse Sema3c, 36 Sst Hpse Cbln4, 34 Sst Crh2 Efemp1, 33 Sst Crh2 4930553C11Rik, 31 Sst Esm1, 29 Sst Tac2 Tacstd2, 28 Sst Rxfp1 Eya1, 27 Sst Rxfp1 Prdm8, 23 Sst Nts, Pvalb Gabrg1, 20 Pvalb Th Sst, 18 Pvalb Calb1 Sst, 17 Pvalb Akr1c18 Ntf3, 16 Pvalb Sema3e Kank4, 14 Pvalb Gpr149 Islr, 11 Pvalb Reln Itm2a, 10 Pvalb Reln Tac1, 9 Pvalb Tpbg, 4 Pvalb Vlpr2, Meis2 Adamts19, 170 Astro Aqp4, 171 OPC Pdgfra Grm5, Oligo Serpinb1a, 174 Oligo Synpr, VLMC Osr1 Cd74, VLMC Osr1 Mc5r, VLMC Spp1 Col15a1, Peri Kcnj8, SMC Acta2, Endo Ctla2a, 및 181 미세아교세포 Siglech. (4d) 인핸서 AAV 벡터 CN2251 혈청형 PHP.eB의 정위 주사 후 64 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 5a-5d. (5a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_459m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (5b) AAV 벡터 #CN2254의 1.00E¹²GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (5c) PHP.eB　캡시드와 함께 패키지된 CN2254 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_459m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 4 가지 유형 중 하나에서만 주로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 기재된 것과 동일하게 읽는다. (5d) 인핸서 AAV 벡터 CN2254 혈청형 PHP.eB의 정위 주사 후 113 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 6a, 6b. (6a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_460m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (6b) AAV 벡터 #CN2255의 6.50E¹¹GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 7a, 7b. (7a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_462m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (7b) AAV 벡터 #CN2256의 6.50E¹¹GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 8a-8d. (8a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_464m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (8b) AAV 벡터 #CN2315의 1.00E¹²GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (8c) PHP.eB　캡시드와 함께 패키지된 CN2315 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_464m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 다중 유형에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 대해 기재된 것과 동일하게 읽는다. (8d) 인핸서 AAV 벡터 CN2315 혈청형 PHP.eB의 정위 주사 후 64 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 9a, 9b. (9a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_461m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (9b) AAV 벡터 #CN2423의 5.00E¹¹GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 10a-10c. (10a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_463m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (10b) AAV 벡터 #CN2424의 7.30E¹¹GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (10c)　PHP.eB　캡시드와 함께 패키지된 CN2424 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_463m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 4 가지 유형 중 하나에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 대해 기재된 것과 동일하게 읽는다. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다.
도 11a, 11b. (11a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_647m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (11b) AAV 벡터 #CN2847의 7.00E¹¹GC의 안구뒤 전달 1.5 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지.　 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론
도 12a-12c. 개시내용을 지원하는 서열. (12a) 본원에 개시된 인핸서 서열. 본원에 기재된 각 인공 발현 작제물은 도 12a에 제공된 인핸서 서열 중 적어도 하나를 포함한다; (12b) (12a)의 인핸서로 생성된 인공 발현 작재물 내에 포함될 수 있는(또는 이에 의해 암호화될 수 있는) 예시적인 구성성분; (12c) (12a)의 인핸서 및 (12b)의 선택된 구성요소로 생성된 대표적인 인공 발현 작제물.

뇌의 생물학을 완전히 이해하기 위해, 상이한 세포 유형을 구별하고 정의해야 하며, 이들을 추가로 연구하기 위해, 선택적으로 표지하고 교란할 수 있는 인공 발현 작제물을 식별해야 한다. Tasic, Curr. Opin. Neurobiol. 50, 242-249 (2018); Zeng & Sanes, Nat. Rev. Neurosci. 18, 530-546 (2017). 마우스에서, 재조합효소 구동인자 계열을 사용하여 마커 유전자 발현을 공유하는 세포 집단을 표지하는 데 크게 영향을 미쳤다. Daigle 등, Cell 174, 465-480.e22 (2018); Taniguchi, 등, Neuron 71, 995-1013 (2011); Gong 등, J. Neurosci. 27, 9817-9823 (2007). 그러나, 높은 특이성을 갖는 세포 유형을 표지하는 이러한 계열의 생성, 유지, 및 사용은 비용이 들 수 있고, 삼중 유전자이식 교배를 빈번하게 필요로 하여, 실험 동물의 낮은 빈도를 산출한다. 또한, 이들 도구는 생식계열 유전자이식 동물을 필요로 하며 따라서 인간에게 적용가능하지 않다.

본 개시내용은 표적화된 중추신경계 세포 집단에서 유전자 발현을 선택적으로 구동하는 인공 발현 작제물을 제공한다. 표적화된 중추신경계 세포 집단은 신피질 글루타메이트성 종뇌외-투사(L5 ET) 뉴런과 같은 신피질 글루타메이트성 레이어 5 뉴런을 포함한다. 특정 적용에서, 본 개시내용의 측면은 예를 들어, 근위축성 측삭 경화증(ALS) 또는 L5 ET 뉴런을 수반하는 다른 신경퇴행성 질환의 맥락에서 상부 운동 뉴런에 치료 페이로드를 전달하는 데 사용될 수 있다.

인공 발현 작제물의 특정 구현예는 L5 ET 뉴런 내에서 유전자 발현을 선택적으로 구동하기 위해 다음 인핸서를 활용한다: eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, 및/또는 eHGT_583m.

특정 구현예에서, 인공 인핸서 요소는 eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 및/또는 eHGT_460m의 연쇄된 코어와 같은 본원에 개시된 인핸서의 연쇄된 코어를 포함한다. 이들 인공 인핸서 요소는 단일 전장 원래(고유) 인핸서와 비교하여 이식유전자 발현의 더 높은 수준 및 더 빠른 개시를 제공한다.

특정 구현예에서, 인핸서 코어는 서열번호: 45-52 중 임의의 하나에 제시된 바와 같은 코어 서열을 포함할 수 있다. 특정 구현예에서, 코어는 연쇄되고 코어의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함한다. 서열번호: 53-60은 선택된 인핸서 코어의 3-카피 연쇄체를 제공한다.

개시내용의 측면은 이제 하기 추가 옵션 및 세부사항으로 설명된다: (i) 선택된 세포 유형에서 유전자의 선택적 발현을 위한 인공 발현 작제물 및 벡터; (ii) 투여용 조성물 (iii) 인공 발현 작제물을 포함한 세포주; (iv) 유전자이식 동물; (v) 사용 방법; (vi) 키트 및 상업용 패키지; (vii) 예시적인 구현예; 및 (viii) 마무리 단락.

(i) 선택된 세포 유형에서 유전자의 선택적 발현을 위한 인공 발현 작제물 및 벡터. 본원에 개시된 인공 발현 작제물은 (i) 표적화된 중추신경계 세포 유형 내에서 코딩 서열의 선택적 발현을 야기하는 인핸서 서열, (ii) 발현되는 코딩 서열, 및 (iii) 프로모터를 포함한다. 인공 발현 작제물은 또한 필요하거나 또는 유익한 경우 다른 조절 요소를 포함할 수 있다.

특정 구현예에서, "인핸서" 또는 "인핸서 요소"는 프로모터와 연관된 전사 수준을 증가시키고 전사될 프로모터 및 코딩 서열에 관해 어느 한 방향으로 기능할 수 있고 전사될 프로모터 또는 코딩 서열에 관해 상류 또는 하류에 위치할 수 있는 시스-작용 서열이다. 인핸서 요소 서열의 기능(들)을 측정하기 위한 당업계에 인식된 방법 및 기술이 있다. 본원에 개시된 인공 발현 작제물 내에서 활용되는 인핸서 서열의 특정 예는 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m 및 연쇄된 코어, 예컨대 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및 3xcore2_eHGT_460m을 포함한다.

특정 구현예에서, 표적화된 중추신경계 세포 유형 인핸서는 표적화된 중추신경계 세포 유형에 의해 독특하게 또는 주로 활용되는 인핸서이다. 표적화된 중추신경계 세포 유형 인핸서는 표적화된 중추신경계 세포 유형에서 유전자의 발현을 향상시키지만 다른 비-표적화된 세포 유형에서 유전자의 발현을 실질적으로 지시하지 않으며, 따라서 세포 유형 특이적 전사 활성을 갖는다.

코딩 서열이 선택된 세포에서 선택적으로 발현되고 다른 세포 유형에서 실질적으로 발현되지 않는 경우, 코딩 서열의 생성물은 선택된 세포 유형에서 우선적으로 발현된다. 특정 구현예에서, 우선적 발현은 참조 세포 유형과 비교하여 50% 초과 발현; 참조 세포 유형과 비교하여 60% 초과 발현; 참조 세포 유형과 비교하여 70% 초과 발현; 참조 세포 유형과 비교하여 80% 초과 발현; 또는 참조 세포 유형과 비교하여 90% 초과 발현이다. 특정 구현예에서, 참조 세포 유형은 비-표적화된 세포를 지칭한다. 비-표적화된 세포는 표적화된 세포와 동일한 해부학적 구조 내에 있을 수 있고/있거나 공통 해부학적 영역으로 투사할 수 있다. 특정 구현예에서, 참조 세포 유형은 표적화된 세포 유형을 포함하는 해부학적 구조와 인접한 해부학적 구조 내에 있다. 특정 구현예에서, 참조 세포 유형은 표적화된 세포와 상이한 유전자 발현 프로파일을 갖는 비-표적화된 세포이다.

특정 구현예에서, 코딩 서열의 생성물은 비-선택된 세포 유형에서 낮은 수준, 예를 들어 생성물이 선택된 세포에서 발현되는 수준의 1% 미만 또는 1%, 2%, 3%, 5%, 10%, 15% 또는 20%로 발현될 수 있다. 특정 구현예에서, 표적화된 중추신경계 세포 유형은 유전자 발현을 구동하도록 본원에 개시된 인핸서에 결합하는 전사 인자의 옳은 조합을 발현하는 유일한 세포 유형이다. 따라서, 특정 구현예에서, 발현은 표적화된 세포 유형 내에서 배타적으로 발생한다.

특정 구현예에서, 표적화된 세포 유형(예를 들어 뉴런, 및/또는 비-뉴런)은 Tasic 등, Nature 563, 72-78 (2018) 및 Hodge 등, Nature 573, 61-68 (2019)에 기재된 것들과 같은 전사 프로파일에 기반하여 식별될 수 있다. 참조를 위해, 세포 유형 및 구별되는 특징에 대한 하기 설명이 또한 제공된다:

신피질 GABA성 하위부류:

ㆍ 모두: GABA 합성 유전자 Gad1/GAD1 및 Gad2/GAD2를 발현한다.

ㆍ Lamp5, Sncg, Serpinf1, 및 Vip: 미골 신경절 융기(CGE) 또는 시각교차앞 구역(POA)의 뉴런 전구체로부터 발달적으로 유래된다.

ㆍ Sst 및 Pvalb: 중앙 신경절 융기(MGE)에서 뉴런 전구체로부터 발달적으로 유래된다.

ㆍ Lamp5: 많은 신피질 레이어, 특히 상부(L1-L2/3)에서 발견되고, 주로 아교세포형 및 단일 꽃다발 형태를 갖는다.

ㆍ Sncg: 많은 신피질 레이어에서 발견되고, Lamp5 및 Vip 세포와 분자 중첩을 갖지만, Lamp5 또는 Vip의 발현이 일관되지 않으며, Sncg의 보다 일관된 발현이 있다.

ㆍ Serpinf1: 많은 신피질 레이어에서 발견되고, Sncg 및 Vip 세포와 분자 중첩을 갖지만, Sncg 또는 Vip의 발현이 일관되지 않으며, Serpinf1의 보다 일관된 발현이 있다.

ㆍ Vip: 많은 신피질 레이어에서 발견되지만, 특히 상부 레이어(L1-L4)에서 빈번하고, 신경전달물질 혈관작용성 장 펩티드(Vip)를 고도로 발현한다.

ㆍ Sst: 많은 신피질 레이어에서 발견되지만, 특히 하부 레이어(L5-L6)에서 빈번하다. 그들은 신경전달물질 소마토스타틴(Sst)을 고도로 발현하고, 시냅스후 뉴런에 수지상 입력을 빈번하게 차단한다. 이 하위부류에는 다른 Sst 뉴런과는 매우 다르지만 Sst를 포함한 일부 공유된 마커 유전자를 발현하는 수면-활성 Sst Chodl 뉴런(이는 또한 Nos1 및 Tacr1을 발현함)이 포함된다. 인간에서, SST 유전자 발현은 종종 레이어 1 LAMP5+ 세포에서 검출된다.

ㆍ Pvalb: 많은 신피질 레이어에서 발견되지만, 특히 하부 레이어(L5-L6)에서 빈번하다. 그들은 칼슘-결합 단백질 파브알부민(Pvalb)을 고도로 발현하고, 신경펩티드 Tac1을 발현하고, 빈번하게 시냅스후 뉴런의 출력을 약화시킨다. 가장 빠르게 급증하는 GABA성 세포는 Pvalb를 강력하게 발현한다. 이 하위부류에는 샹들리에 세포가 포함되며, 이는 독특한, 샹들리에-유사 형태를 가지며 마우스에서 마커 Cpne5 및 Vipr2, 및 인간에서 NOG 및 UNC5B를 발현한다.

ㆍ Meis2: Meis2 유전자를 발현하고, 모든 다른 신피질 GABA성 유형에 의해 발현되는 일부 다른 유전자(예를 들어, Thy1 및 Scn2b)를 발현하지 않는 유일한 신피질 GABA성 유형인 단일 유형에 의해 정의된 독특한 하위부류. 이 유형은 L6b 및 피질하 백질에서 발견된다.

신피질 글루타메이트성 하위부류:

ㆍ 모두: 글루타메이트 전달물질 Slc17a6 및/또는 Slc17a7을 발현한다. 그들은 모두 Snap25를 발현하고 Gad1/Gad2의 발현이 결여되어 있다.

ㆍ L2/3 IT: 주로 레이어 2/3에 상주하고 주로 종뇌내부(피질-피층) 투사가 있다.

ㆍ L4 IT: 주로 레이어 4에 상주하고 주로 국부 또는 종뇌내부(피질-피층) 투사가 있다.

ㆍ L5 IT: 주로 레이어 5에 상주하고 주로 종뇌내부(피질-피층) 투사가 있다. L5a라고도 부른다.

ㆍ L5 ET: 주로 레이어 5에 상주하고 주로 피질-피층하 투사가 있다. L5b 또는 L5 CF(피질원심성) 또는 L5 PT(피라미드 관 투사)라고도 부른다. 이 하위부류는 일차 운동 피질 및 이웃 영역에 위치하고 ALS와 같은 운동 뉴런/운동 장애와 연관된 피질척수 투사 뉴런인 세포를 포함한다. 이 하위부류는 특수한 영역, 예를 들어 베츠(Betz) 세포, 마이네르트(Meynert) 세포, 및 폰 이코노모(von Economo) 세포에서만 발견되는 독특한 하위유형을 포함한 두껍고 촘촘한 피라미드형 뉴런을 포함한다.

ㆍ L5 NP: 주로 레이어 5에 상주하고 주로 근처에 투사가 있다.

ㆍ L6 CT: 주로 레이어 6에 상주하고 주로 피질-시상 투사가 있다.

ㆍ L6 IT: 주로 레이어 6에 상주하고 주로 종뇌내부(피질-피층) 투사가 있다. 이 하위부류에는 전장에서 피질내-투사 세포와 매우 유사한 L6 IT Car3 세포가 포함된다.

ㆍ L6b: 주로 신피질 서브플레이트(L6b)에 상주하며, 국부(세포체 근처) 투사 및 VISp에서 전측 대상으로의 일부 피질-피층 투사, 및 시상으로의 피질-피층하 투사가 있다.

ㆍ CR: L1, 카잘-레찌(Cajal-Retzius) 세포에서 단일 유형에 의해 정의된 독특한 하위부류는 독특한 분자 마커 Lhx5 및 Trp73을 발현한다.

소뇌 푸르기네(Purkinje) 세포: 유일한 투사 뉴런 및 소뇌로부터의 단독 출력인 큰 GABA성 뉴런. 그들의 세포체는 '푸르기네 세포 레이어'라고 불리는 단일 레이어를 형성하고, 그들은 파브알부민을 발현한다.

심부 소뇌 핵 뉴런: 심부 소뇌 핵 구조에 위치한 뉴런. 이들은 유전자 Pvalb를 발현하는 글루타메이트성 및 GABA성 세포를 포함한다.

비-뉴런 하위부류:

ㆍ 성상세포: 마커 Aqp4 및 종종 GFAP를 발현하지만, 뉴런 마커 SNAP25를 발현하지 않는 신경외배엽-유래 교질 세포. 그들은 독특한 별-모양 형태를 가질 수 있고 뇌에서 다른 세포의 대사 지원에 수반된다. 다중 성상세포 형태가 마우스 및 인간에서 관찰된다

ㆍ 희소돌기아교세포: 마커 Sox10을 발현하는 신경외배엽-유래 교질 세포. 이 카테고리는 희소돌기아교세포 전구체 세포(OPC)를 포함한다. 희소돌기아교세포는 뉴런의 수초화를 주로 담당하는 하위부류이다.

ㆍ VLMC: 혈관 연수막 세포(VLMC)는 피질의 외부 레이어를 둘러싸고 마커 유전자 Lum 및 Col1a1을 발현하는 뇌막의 일부다.

ㆍ 혈관주위세포: 마커 유전자 Kcnj8 및 Abcc9를 발현하는 혈관-연관 세포. 혈관주위세포는 내피 세포 주위를 감싸고 모세관 혈류 조절에 중요하며 혈액-뇌 장벽 투과성에 수반된다.

ㆍ SMC: 마커 유전자 Acta2를 발현하는 혈관-연관 세포인 특수한 평활근 세포. SMC는 뇌에서 세동맥을 덮고 혈액-뇌 장벽 투과성에 수반된다.

ㆍ 내피 세포: 뇌의 혈관에 막을 형성하는 세포. 내피 세포는 마커 Tek 및 PDGF-B를 발현한다.

ㆍ 미세아교세포: 뇌-상주 대식세포, 및 뇌 조직과 일시적으로 연관되거나 또는 뇌 해부 방법의 부산물로서 포함될 수 있는 혈관주위 대식세포(PVM)인 조혈-유래 면역 세포. 미세아교세포는 Cx3cr1, Tmem119, 및 PTPRC(CD45)를 발현하는 것으로 알려져 있다.

특정 구현예에서, 코딩 서열은 효과기 요소를 암호화하는 이종 코딩 서열이다. 효과기 요소는 의도된 효과를 달성하도록 발현되고, 실제로 달성하는 서열이다. 효과기 요소의 예는 리포터 유전자/단백질 및 기능성 유전자/단백질을 포함한다.

예시적인 리포터 유전자/단백질은 Addgene ID#s 83894(pAAV-hDlx-Flex-dTomato-Fishell_7), 83895(pAAV-hDlx-Flex-GFP-Fishell_6), 83896(pAAV-hDlx-GiDREADD-dTomato-Fishell-5), 83898(pAAV-mDlx-ChR2-mCherry-Fishell-3), 83899(pAAV-mDlx-GCaMP6f-Fishell-2), 83900(pAAV-mDlx-GFP-Fishell-1), 및 89897(pcDNA3-FLAG-mTET2 (N500))에 의해 발현되는 것들을 포함한다. 예시적인 리포터 유전자는 특히 발현가능한 형광 단백질, 또는 발현가능한 비오틴; 청색 형광 단백질(예를 들어 eBFP, eBFP2, Azurite, mKalama1, GFPuv, Sapphire, T-sapphire); 청록색 형광 단백질(예를 들어 eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan, mTurquoise); 녹색 형광 단백질(예를 들어 GFP, GFP-2, tagGFP, turboGFP, EGFP, Emerald, Azami Green, 단량체성 Azami Green(mAzamigreen), CopGFP, AceGFP, avGFP, ZsGreenl, Oregon Green™(Thermo Fisher Scientific)); 루시퍼라제; 주황색 형광 단백질(mOrange, mKO, Kusabira-Orange, 단량체성 Kusabira-Orange, mTangerine, tdTomato, dTomato); 적색 형광 단백질(mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRuby, mRFP1, DsRed-Express, DsRed2, DsRed-단량체, HcRed-탠덤, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred, Texas Red™(Thermo Fisher Scientific)); 원적외선 형광 단백질(예를 들어, mPlum 및 mNeptune); 황색 형광 단백질(예를 들어, YFP, eYFP, Citrine, SYFP2, Venus, YPet, PhiYFP, ZsYellowl); 및 탠덤 접합체를 암호화하는 것들을 포함할 수 있다.

GFP는 238 개의 아미노산(26.9 kDa)으로 구성되며, 청색 광에 노출될 때 녹색으로 형광으로 내는 해파리 아쿠오레아 빅토리아(Aequorea victoria)/아쿠오레아 아쿠오레아(Aequorea aequorea)/아쿠오레아 포르스칼레아(Aequorea forskalea)로부터 원래 단리된다. 에이. 빅토리아(A. victoria)의 GFP는 395 nm의 파장에서 주요 여기 피크 및 475 nm에서 작은 여기 피크를 갖는다. 이의 방출 피크는 가시 스펙트럼의 하부 녹색 부분에 있는 509 nm에 있다. 바다 팬지(레닐라 레니포르미스(Renilla reniformis))의 GFP는 498 nm에서 단일 주요 여기 피크를 갖는다. 광범위한 용법에 대한 잠재력 및 연구원의 진화하는 요구로 인해, GFP의 많은 상이한 돌연변이체가 조작되었다. 첫번째 주요 개선은 1995년에 Roger Tsien에 의해 Nature에 보고된 단일 점 돌연변이(S65T)였다. 이 돌연변이는 GFP의 스펙트럼 특성을 극적을 개선시켜, 증가된 형광, 광안정성 및 피크 방출을 509 nm에서 유지하면서 488 nm로 주요 여기 피크의 이동을 초래한다. 37℃ 접힘 효율(F64L) 점 돌연변이체를 이 스캐폴드에 첨가하여 향상된 GFP(EGFP)를 산출하였다. EGFP는 9.13X10-21 m²/분자의 광학 단면으로도 알려진 흡광 계수(ε로 나타냄)를 가지며, 55,000 L/(mol

cm)로도 인용된다. 좋지 않은 접힘 펩티드에 융합된 경우에도 GFP가 빠르게 접히고 성숙되게 하는 일련의 돌연변이인 슈퍼폴더 GFP가 2006에 보고되었다.

"황색 형광 단백질"(YFP)은 아쿠오레아 빅토리아에서 유래된 녹색 형광 단백질의 유전적 돌연변이체이다. 이의 여기 피크는 514 nm이고 이의 방출 피크는 527 nm이다.

예시적인 기능성 분자는 기능화 이온 수송체, 세포 수송 단백질, 효소, 전사 인자, 신경전달물질, 칼슘 리포터, 채널로돕신, 가이드 RNA, 뉴클레아제, 또는 디자이너 약물에 의해 배타적으로 활성화되는 디자이너 수용체(DREADD)를 포함한다.

이온 수송체는 세포 막을 가로질러 이온의 수송을 매개하는 막관통 단백질이다. 이들 수송체는 대부분의 세포 유형 전체에 걸쳐 만연하고 세포 흥분성 및 항상성을 조절하는 데 중요하다. 이온 수송체는 활동 전위, 시냅스 전달, 호르몬 분비, 및 근육 수축과 같은 수많은 세포 과정에 참여한다. 살아있는 세포에서 많은 중요한 생물학적 과정은 칼슘(Ca2+),　칼륨(K+), 및　나트륨(Na+) 이온과 같은 양이온을 이러한 이온 채널을 통해 전위하는 것을 수반한다. 특정 구현예에서, 이온 수송체는 전압 개폐 나트륨 채널(예를 들어, SCN1A), 칼륨 채널(예를 들어, KCNQ2), 및 칼슘 채널(예를 들어 CACNA1C))을 포함한다.

예시적인 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 및 신경전달물질은 락타제, 리파제, 헬리카제, 알파-글루코시다제, 아밀라제와 같은 효소; SP1, AP-1, 열 충격 인자 단백질 1, C/EBP(CCAA-T/인핸서 결합 단백질), 및 Oct-1과 같은 전사 인자; 형질전환 성장 인자 수용체 베타 1, 혈소판-유래 성장 인자 수용체, 표피성장 인자 수용체, 혈관 내피 성장 인자 수용체, 및 인터류킨 8 수용체 알파와 같은 수용체; 막 단백질, 클라트린, 다이나민, 카베올린, Rab-4A, 및 Rab-11A와 같은 세포 수송 단백질; 신경 성장 인자(NGF), 혈소판-유래 성장 인자(PDGF), 형질전환 성장 인자 β(TGFβ), 표피성장 인자(EGF), GTPase 및 Hras와 같은 신호전달 분자; 및 코카인 및 암페타민 조절 전사체, 물질 P, 옥시토신, 및 소마토스타틴과 같은 신경전달물질을 포함한다.

특정 구현예에서, 기능성 분자는 칼슘 리포터와 같은 세포 기능 및 상태의 리포터를 포함한다. 세포내 칼슘 농도는 뉴런 활성화, 근육 세포 수축 및 2차 메신저 신호전달을 포함하는 수많은 세포 활성의 중요한 예측인자이다. 세포내 칼슘 수준을 모니터링하는 민감하고 편리한 기술은 유전적으로 암호화된 칼슘 지표(GECI)를 통해서이다. GECI 중에서, GCaMP라고 불리는 녹색 형광 단백질(GFP) 기반 칼슘 센서는 효율적이고 광범위하게 사용되는 도구이다. GCaMP는 원형으로 순열된 GFP의 N- 및 C-말단에 M13 및 칼모듈린 단백질을 융합시켜 형성된다. 일부 GCaMP는 독특한 형광 방출 스펙트럼을 산출한다(Zhao 등, Science, 2011, 333(6051): 1888-1891). 녹색 형광이 있는 예시적인 GECI는 GCaMP3, GCaMP5G, GCaMP6s, GCaMP6m, GCaMP6f, jGCaMP7s, jGCaMP7c, jGCaMP7b, 및 jGCaMP7f를 포함한다. 또한, 적색 형광이 있는 GECI는 jRGECO1a 및 jRGECO1b를 포함한다. GECI를 함유하는 AAV 생성물은 상업적으로 입수가능하다. 예를 들어, Vigene Biosciences는 AAV8-CAG-GCaMP3(카탈로그 번호:BS4-CX3AAV8), AAV8-Syn-FLEX-GCaMP6s-WPRE(카탈로그 번호:BS1-NXSAAV8), AAV8-Syn-FLEX-GCaMP6s-WPRE(카탈로그 번호:BS1-NXSAAV8), AAV9-CAG-FLEX-GCaMP6m-WPRE(카탈로그 번호:BS2-CXMAAV9), AAV9-Syn-FLEX-jGCaMP7s-WPRE(카탈로그 번호:BS12-NXSAAV9), AAV9-CAG-FLEX-jGCaMP7f-WPRE(카탈로그 번호:BS12-CXFAAV9), AAV9-Syn-FLEX-jGCaMP7b-WPRE(카탈로그 번호:BS12-NXBAAV9), AAV9-Syn-FLEX-jGCaMP7c-WPRE(카탈로그 번호:BS12-NXCAAV9), AAV9-Syn-FLEX-NES-jRGECO1a-WPRE(카탈로그 번호:BS8-NXAAAV9), 및 AAV8-Syn-FLEX-NES-jRCaMP1b-WPRE(카탈로그 번호:BS7-NXBAAV8)를 포함한 AAV 생성물을 제공한다.

특정 구현예에서 칼슘 리포터는 유전적으로 암호화된 칼슘 지표 GECI, NTnC; 미오신 경쇄 키나제, GFP, 칼모듈린 키메라; 칼슘 지표 TN-XXL; BRET-기반 자동 발광 칼슘 지표; 및/또는 칼슘 지표 단백질 OeNL(Ca2+)-18u)을 포함한다.

특정 구현예에서, 기능성 분자는 채널로돕신(예를 들어, 채널로돕신-1, 채널로돕신-2, 및 이의 변이체)과 같은 뉴런 활성의 조절자를 포함한다. 채널로돕신은 광 개폐 이온 채널로서 기능하는 레티닐리덴 단백질(로돕신)의 서브패밀리이다. 채널로돕신 1(ChR1) 및 채널로돕신 2(ChR2) 이외에, 채널로돕신의 여러 변이체가 개발되었다. 예를 들어, Lin 등(Biophys J,　2009, 96(5): 1803-14)은 부위 지정 돌연변이유발과 조합된 ChR1 및 ChR2의 막관통 도메인의 키메라를 만드는 것을 설명한다. Zhang 등(Nat Neurosci,　2008, 11(6): 631-3)은 적색 이동　채널로돕신　변이체인 VChR1을 설명한다. VChR1은 광 민감도가 더 낮고 막 수송 및 발현이 좋지 않다. 다른 알려진　채널로돕신　변이체는　Nagel, 등,　Proc Natl Acad Sci USA,　2003, 100(24): 13940-5)에 기재된 ChR2 변이체, ChR2/H134R(Nagel, G., 등,　Curr Biol,　2005, 15(24): 2279-84), 및 ChD/ChEF/ChlEF(Lin, J. Y., 등,　Biophys J,　2009, 96(5): 1803-14)를 포함하며, 이는 청색 광(470 nm)에 의해 활성화되지만 주황색/적색 광에 대한 민감도를 나타내지 않는다. 추가의 변이체는 Lin, Experimental Physiology,　2010, 96.1: 19-25 및 Knopfel 등, The Journal of Neuroscience,　2010, 30(45): 14998-15004)에 기재되어 있다.

특정 구현예에서, 기능성 분자는 DNA 및 RNA 편집 도구 이러한 CRISPR/CAS(예를 들어, 가이드 RNA 및 뉴클레아제, 예컨대 Cas, Cas9 or cpf1)를 포함한다. 기능성 분자는 또한 US 2018/0030425, US 2016/0208243, WO/2017/184768 및 Zetsche 등 (2015) Cell 163: 759-771에 기재된 것들과 같은 조작된 Cpf1; 단일 gRNA(예를 들어, Jinek 등 (2012) Science 337:816-821; Jinek 등 (2013) eLife 2:e00471; Segal (2013) eLife 2:e00563 참조) 또는 편집효소, 가이드 RNA 분자 또는 상동 재조합 공여자 카세트를 포함할 수 있다.

서열은 공개적으로 이용가능하다. 예로서, 락타제(예를 들어, GenBank: EAX11622.1), 리파제(예를 들어, GenBank: AAA60129.1), 헬리카제(예를 들어, GenBank: AMD82207.1), 아밀라제(예를 들어, GenBank: AAA51724.1), 알파-글루코시다제(예를 들어, GenBank: ABI53718.1), 전사 인자 SP1(예를 들어, UniProtKB/Swiss-Prot: P08047.3), 전사 인자 AP-1(예를 들어, NP_002219.1), 열 충격 인자 단백질 1(예를 들어, UniProtKB/Swiss-Prot: Q00613.1), CCAAT/인핸서-결합 단백질(C/EBP) 베타 이소형 a(예를 들어, NP_005185.2), Oct-1(예를 들어, UniProtKB/Swiss-Prot: P14859.2), TGFβ(예를 들어, GenBank: CAF02096.2), 혈소판-유래 성장 인자 수용체(예를 들어, GenBank: AAA60049.1), 표피성장 인자 수용체(예를 들어, GenBank: CAA25240.1), 혈관 내피 성장 인자 수용체(예를 들어, GenBank: AAC16449.2), 인터류킨 8 수용체 알파(예를 들어, GenBank: AAB59436.1), 카베올린(예를 들어, GenBank: CAA79476.1), 다이나민(예를 들어, GenBank: AAA88025.1), 클라트린 중쇄 1 이소형 1(예를 들어, NP_004850.1), 클라트린 중쇄 2 이소형 1(예를 들어, NP_009029.3), 클라트린 경쇄 A 이소형 a(예를 들어, NP_001824.1), 클라트린 경쇄 B 이소형 a(예를 들어, NP_001825.1), ras-관련 단백질 Rab-4A 이소형 1(예를 들어, NP_004569.2), ras-관련 단백질 Rab-11A(예를 들어, UniProtKB/Swiss-Prot: P62491.3), 혈소판-유래 성장 인자(예를 들어, GenBank: AAA60552.1), 형질전환 성장 인자-베타3(예를 들어, GenBank: AAA61161.1), 신경 성장 인자(예를 들어, GenBank: CAA37703.1), EGF(예를 들어, GenBank: CAA34902.2), 코카인 및 암페타민 조절 전사체(쇄 A)(예를 들어, PDB: 1HY9_A), 프로타키키닌-1(예를 들어, UniProtKB - P20366), 옥시토신-뉴로피신 1(예를 들어, UniProtKB - P01178), 소마토스타틴(예를 들어, GenBank: AAH32625.1), 유전적으로 암호화된 녹색 칼슘 지표 NTnC(쇄 A) [합성 작제물](예를 들어, PDB: 5MWC_A), 칼슘 지표 TN-XXL [합성 작제물], (예를 들어, GenBank: ACF93133.1), BRET-기반 자동 발광 칼슘 지표 [합성 작제물](예를 들어, GenBank ADF42668.1), 칼슘 지표 단백질 OeNL(Ca2+)-18u [합성 작제물], ((예를 들어, GenBank BBB18812.1), 미오신 경쇄 키나제, 녹색 형광 단백질, 칼모듈린 키메라(쇄 A) [합성 작제물]((예를 들어, PDB: 3EKJ_A), 채널롭신 1(예를 들어, UniProtKB - F8UVI5), 채널롭신　1(예를 들어, GenBank: AER58217.1), 채널로돕신-2((예를 들어, UniProtKB - B4Y105), 채널 로돕신 2　[합성 작제물]((예를 들어, GenBank: ABO64386.1), CRISPR-연관 단백질(Cas)(예를 들어, GenBank: AKG27598.1), Cas9 [합성 작제물](예를 들어, GenBank: AST09977.1), CRISPR-연관 엔도뉴클레아제 Cpf1(예를 들어, UniProtKB/Swiss-Prot: U2UMQ6.1), 리보뉴클레아제 4 또는 리보뉴클레아제 L(예를 들어, UniProtKB/Swiss-Prot: Q05823.2), 데옥시리보뉴클레아제 II 베타(예를 들어, GenBank: AAF76893.1), 나트륨 채널 단백질 유형 1 서브유닛 알파(예를 들어, UniProtKB - P35498), 칼륨 전압 개폐 채널 서브패밀리 KQT 구성원 2(예를 들어, UniProtKB - O43526), 및 전압-의존적 L-유형 칼슘 채널 서브유닛 알파-1C(예를 들어, UniProtKB - Q13936).

추가의 효과기 요소는 Cre, iCre, dgCre, FlpO, 및 tTA2를 포함한다. iCre는 코돈-개선된 Cre를 지칭한다. dgCre는 G67S 돌연변이를 보유하고 또한 R12Y/Y100I 불안정화 도메인 돌연변이를 포함하도록 변형된 에스케리키아 콜라이(Escherichia coli) K-12 균주 염색체 디하이드로폴레이트 환원요소 유전자(DHFR 또는 folA)의 처음 159 개 아미노산의 N-말단 융합이 있는 향상된 GFP/Cre 재조합효소 융합 유전자를 지칭한다. FlpO는 마우스 세포에서 단백질 발현 및 FRT 재조합 효율을 크게 증가시키는 FLPe의 코돈-최적화된 형태를 지칭한다. Cre/LoxP 시스템과 마찬가지로, FLP/FRT 시스템은 유전자 발현(및 FLP/FRT 시스템에 의해 매개되는 조건부 녹아웃 마우스 생성)을 위해 광범위하게 사용되었다. tTA2는 테트라사이클린 트랜스활성화제를 지칭한다.

예시적인 발현가능한 요소는 효과기 요소, 예를 들어, 비-기능화 또는 결함성 단백질을 포함하지 않는 발현 생성물이다. 특정 구현예에서, 발현가능한 요소는 그들의 기능화 대응물의 효과를 연구하는 방법을 제공할 수 있다. 특정 구현예에서, 발현가능한 요소는 비-기능화이거나 또는 그들을 비-기능화로 만드는 조작된 돌연변이에 기반한 결함성이다. 이들 측면에서, 비-발현가능한 요소는 그들의 기능화 대응물과 가능한 한 구조가 유사하다.

예시적인 자가-절단 펩티드는 하나의 mRNA로부터 2 개 단백질 생산을 야기하는 2A 펩티드를 포함한다. 2A 서열은 짧아서(예를 들어, 20 개 아미노산), 크기 제한된 작제물에서 더 많이 사용하도록 한다. 특정 예는 P2A, T2A, E2A, 및 F2A를 포함한다. 특정 구현예에서, 인공 발현 작제물은 내부 리보솜 진입 부위(IRES) 서열을 포함한다. IRES는 리보솜이 mRNA 분자의 두번째 내부 부위에서 번역을 개시하도록 하여, 하나의 mRNA로부터 2 개 단백질 생산을 야기한다.

본원에 기재된 분자(예를 들어, RNA, 단백질)를 암호화하는 코딩 서열은 공개적으로 이용가능한 데이터베이스 및 간행물로부터 수득될 수 있다. 코딩 서열은 다양한 서열 다형성, 돌연변이, 및/또는 서열 변이체를 추가로 포함할 수 있으며 여기서 이러한 변경은 암호화된 분자의 기능에 영향을 미치지 않는다. 용어 "암호화하다" 또는 "암호화하는"은 단백질과 같은 다른 분자의 합성을 위한 주형으로서 역할을 하는 벡터, 플라스미드, 유전자, cDNA, mRNA와 같은 핵산의 서열 특성을 지칭한다.

용어 "유전자"는 코딩 서열뿐만 아니라 조절 영역 예컨대 프로모터, 인핸서, 절연체, 및/또는 후-조절 요소, 예컨대 종결 영역을 포함할 수 있다. 용어는 추가로 대체 스플라이스 부위로부터 생성된 변이체와 함께, mRNA 전사체로부터 스플라이스된 모든 인트론 및 다른 DNA 서열을 포함할 수 있다. 서열은 또한 참조 서열의 축퇴성 코돈 또는 특정 유기체 또는 세포 유형에서 코돈 선호도를 제공하도록 도입될 수 있는 서열을 포함할 수 있다.

프로모터는 일반 프로모터, 조직-특이적 프로모터, 세포-특이적 프로모터, 및/또는 세포질에 특이적인 프로모터를 포함할 수 있다. 프로모터는 강한 프로모터, 약한 프로모터, 구성적 발현 프로모터, 및/또는 유도성 프로모터를 포함할 수 있다. 유도성 프로모터는 특정 조건, 신호 또는 세포 이벤트에 반응하여 발현을 지시한다. 예를 들어, 프로모터는 프로모터로부터 전사를 이루기 위해 특정 리간드, 소분자, 전사 인자 또는 호르몬 단백질을 필요로 하는 유도성 프로모터일 수 있다. 프로모터의 특정 예는 minBglobin, CMV, minCMV, minCMV^*(minCMV^*는 SacI 제한 부위가 제거된 minCMV임), minRho, minRho^*(minRho^*는 SacI 제한 부위가 제거된 minRho임), SV40 즉시 초기 프로모터, Hsp68 최소 프로모터(proHSP68), 및 라우스 육종 바이러스(RSV) 긴 말단 반복부(LTR) 프로모터를 포함한다. 최소 프로모터는 자체적으로 유전자 발현을 구동하는 활성이 없지만 근위 인핸서 요소에 연결될 때 유전자 발현을 구동하도록 활성화될 수 있다.

특정 구현예에서, 발현 작제물은 벡터 내에 제공된다. 용어 벡터는 발현 작제물과 같은 또 다른 핵산 분자를 전달하거나 또는 수송할 수 있는 핵산 분자를 지칭한다. 전달된 핵산은 일반적으로 벡터 핵산 분자에 연결, 예를 들어, 삽입된다. 벡터는 세포에서 자율 복제를 지시하는 서열을 포함할 수 있거나 또는 숙주 세포 DNA 내에 통합을 허용하는 서열을 포함할 수 있다. 유용한 벡터는 예를 들어, 플라스미드(예를 들어, DNA 플라스미드 또는 RNA 플라스미드), 트랜스포존, 코스미드, 박테리아 인공 염색체, 및 바이러스 벡터를 포함한다.

바이러스 벡터는 세포 내에서 비-천연 핵산 분자의 전달 및 발현을 용이하게 하는 바이러스-유래 구성요소를 포함하는 핵산 분자를 지칭하기 위해 광범위하게 사용된다. 용어 아데노-연관 바이러스 벡터는 주로 AAV로부터 유래된 구조적 및 기능적 유전적 요소, 또는 이의 부분을 함유하는 바이러스 벡터 또는 플라스미드를 지칭한다. 용어 "레트로바이러스 벡터"는 주로 레트로바이러스로부터 유래된 구조적 및 기능적 유전적 요소, 또는 이의 부분을 함유하는 바이러스 벡터 또는 플라스미드를 지칭한다. 용어 "렌티바이러스 벡터"는 주로 렌티바이러스 등으로부터 유래된 구조적 및 기능적 유전적 요소, 또는 이의 부분을 함유하는 바이러스 벡터 또는 플라스미드를 지칭한다. 용어 "하이브리드 벡터"는 하나 초과의 바이러스 유형으로부터의 구조적 및/또는 기능적 유전적 요소를 포함하는 벡터를 지칭한다.

아데노바이러스 벡터는 (a) 인공 발현 작제물의 패키징을 지원하고 (b) 센스 또는 안티센스 배향으로 그 안에 클로닝된 코딩 서열을 발현하기에 충분한 아데노바이러스 서열을 함유하는 작제물을 지칭한다. 재조합 아데노바이러스 벡터는 아데노바이러스의 유전적으로 조작된 형태를 포함한다. 36 kb, 선형, 이중 가닥 DNA 바이러스인 아데노바이러스의 유전적 조직화에 대한 지식은 큰 조각의 아데노바이러스 DNA를 최대 7 kb의 외래 서열로 치환하는 것을 허용한다. 레트로바이러스와 대조적으로, 숙주 세포의 아데노바이러스 감염은 염색체 통합을 초래하지 않는 데 아데노바이러스 DNA가 잠재적인 유전독성 없이 에피솜 방식으로 복제할 수 있기 때문이다. 또한, 아데노바이러스는 구조적으로 안정하고, 광범위한 증폭 후 게놈 재배열이 검출되지 않았다.

아데노바이러스는 중간 크기 게놈, 제작의 용이성, 높은 역가, 넓은 표적 세포 범위, 및 높은 감염성으로 인해 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 양쪽 단부는 100-200 개 염기쌍 도립된 반복부(ITR)를 함유하며, 이는 바이러스 DNA 복제 및 패키징에 필요한 시스 요소이다. 게놈의 초기(E) 및 후기(L) 영역은 바이러스 DNA 복제 개시에 의해 나눠진 상이한 전사 단위를 함유한다. E1 영역(E1A 및 E1B)은 바이러스 게놈 및 몇몇 세포 유전자의 전사 조절을 담당하는 단백질을 암호화한다. E2 영역(E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질 합성을 초래한다. 이들 단백질은 DNA 복제, 후기 유전자 발현, 및 숙주 세포 차단에 수반된다. 대다수의 바이러스 캡시드 단백질을 포함한 후기 유전자의 생성물은 주요 후기 프로모터(MLP)에 의해 비롯된 단일 1차 전사체의 유의한 처리후에만 발현된다. MLP는 감염의 후기 단계 동안 특히 효율적이고, 이 프로모터로부터 비롯된 모든 mRNA는 5'-삼부 리더(TPL) 서열을 보유하여 번역을 위해 선호되는 mRNA로 만든다.

아데노바이러스 벡터가 복제 결함성이거나, 또는 적어도 조건부로 결함성인 요건 이외에, 아데노바이러스 벡터의 속성은 본원에 개시된 특정 구현예의 성공적인 실행에 결정적인 것으로 여겨지지 않는다. 아데노바이러스 42 개의 상이한 알려진 혈청형 또는 하위그룹 A-F 중 임의의 것일 수 있다. 특정 구현예에서, 아데노바이러스 유형 5는 많은 생화학적 및 유전적 정보가 알려져 있고, 역사적으로 아데노바이러스를 벡터로서 이용하는 대부분의 구성에 사용되는 인간 아데노바이러스이므로, 하위그룹 C의 아데노바이러스 유형 5는 특정 구현예에서 사용하기 위한 조건부 복제-결함성 아데노바이러스 벡터를 수득하기 위한 바람직한 출발 물질이다.

나타낸 바와 같이, 전형적인 벡터는 복제 결함성이고 아데노바이러스 E1 영역을 갖지 않을 것이다. 따라서, E1-코딩 서열이 제거된 위치에 관심 유전자를 암호화하는 폴리뉴클레오티드를 도입하는 것이 가장 편리할 것이다. 그러나, 아데노바이러스 서열 내에서 작제물의 삽입 위치는 중요하지 않다. 관심 유전자를 암호화하는 폴리뉴클레오티드는 또한 E3 대체 벡터에서 결실된 E3 영역 대신에 삽입되거나 또는 헬퍼 세포주 또는 헬퍼 바이러스가 E4 결함을 보완하는 E4 영역에 삽입될 수 있다.

아데노-연관 바이러스(AAV)는 아데노바이러스 스톡의 오염으로서 발견된 파보바이러스이다. 이는 임의의 질환과 관련되지 않은 보편적 바이러스이다(항체는 미국 인구의 85%에 존재함). 또한 데펜도바이러스로서 분류되는 데, 이의 복제가 아데노바이러스와 같은 헬퍼 바이러스의 존재에 의존하기 때문이다. 다양한 혈청형이 단리되었으며, 이 중 AAV-2가 가장 특성화된다. AAV는 캡시드 단백질 VP1, VP2 및 VP3 내에 캡슐화되어 20 내지 24 nm 직경의 20면체 비리온을 형성하는 단일 가닥 선형 DNA를 갖는다.

AAV DNA는 4.7 킬로베이스 길이이다. 이는 2 개의 오픈 리딩 프레임을 함유하고 2 개의 ITR에 의해 플랭킹된다. AAV 게놈에 2 개의 주요 유전자가 있다: rep 및 cap. rep 유전자는 바이러스 복제를 담당하는 단백질을 코딩하는 반면, cap은 캡시드 단백질 VP1-3을 코딩한다. 각 ITR은 T-형태 헤어핀 구조를 형성한다. 이들 말단 반복부는 염색체 통합을 위한 AAV의 유일한 필수 시스 구성요소이다. 따라서, AAV는 모든 바이러스 코딩 서열이 제거되고 전달을 위한 유전자 카세트로 대체된 벡터로서 사용될 수 있다. 3 개의 AAV 바이러스 프로모터가 식별되었고 이들의 맵 위치에 따라 p5, p19, 및 p40으로 명명된다. p5 및 p19의 전사는 rep 단백질의 생산을 초래하고, p40의 전사는 캡시드 단백질을 생산한다.

AAV는 그들의 최상의 안전성 프로파일로 인해 그리고 선택된 세포 집단에서 발현을 허용하도록 캡시드 및 게놈을 맞출 수 있기 때문에 본 개시내용 내에서 사용하기 위해 두드러진다. scAAV는 자기-상보성 AAV를 지칭한다. pAAV는 플라스미드 아데노-연관 바이러스를 지칭한다. rAAV는 재조합 아데노-연관 바이러스를 지칭한다.

다른 바이러스 벡터가 또한 이용될 수 있다. 예를 들어, 백시니아 바이러스, 폴리오바이러스 및 헤르페스 바이러스와 같은 바이러스로부터 유래된 벡터가 이용될 수 있다. 그들은 다양한 포유동물 세포에 여러 매력적인 특징을 제공한다.

레트로바이러스는 유전자 전달을 위한 통상적인 도구이다. "레트로바이러스"는 그의 게놈 RNA를 선형 이중 가닥 DNA 카피로 역전사하고 후속적으로 그의 게놈 DNA를 숙주 게놈으로 공유적으로 통합하는 RNA 바이러스를 지칭한다. 일단 바이러스가 숙주 게놈 내에 통합되면, "프로바이러스"로 지칭된다. 프로바이러스는 RNA 폴리머라제 II에 대한 주형으로서 역할을 하고 새로운 바이러스 입자를 생산하는 데 핑료한 구조적 단백질 및 효소를 암호화하는 RNA 분자의 발현을 지시한다.

특정 구현예에서 사용하기에 적합한 예시적인 레트로바이러스는 다음을 포함한다: 몰로니 뮤린 백혈병 바이러스(M-MuLV), 몰로니 뮤린 육종 바이러스(MoMSV), 하비 뮤린 육종 바이러스(HaMuSV), 뮤린 유선 종양 바이러스(MuMTV), 긴팔원숭이 백혈병 바이러스(GaLV), 고양이 백혈병 바이러스(FLV), 스푸마바이러스, 프렌드 뮤린 백혈병 바이러스, 뮤린 줄기 세포 바이러스(MSCV), 라우스 육종 바이러스(RSV), 및 렌티바이러스.

"렌티바이러스"는 복합 레트로바이러스의 그룹(또는 속)을 지칭한다. 예시적인 렌티바이러스는 다음을 포함한다: HIV(인간 면역결핍 바이러스; HIV 유형 1, 및 HIV 유형 2 포함); 비스나-매디 바이러스(VMV); 산양 관절염-뇌염 바이러스(CAEV); 말 전염성 빈혈 바이러스(EIAV); 고양이 면역결핍 바이러스(FIV); 소 면역 결핍 바이러스(BIV); 및 시미안 면역결핍 바이러스(SIV). 특정 구현예에서, HIV 기반 벡터 백본(즉, HIV 시스-작용 서열 요소)이 사용될 수 있다.

일부 벡터의 사용에 대한 안전성 향상은 5' LTR의 U3 영역을 이종 프로모터로 대체하여 바이러스 입자의 생산 동안 바이러스 게놈의 전사를 구동함으로써 제공될 수 있다. 이 목적에 사용될 수 있는 이종 프로모터의 예는 예를 들어, 바이러스 시미안 바이러스 40(SV40)(예를 들어, 초기 또는 후기), 사이토메갈로바이러스(CMV)(예를 들어, 즉시 초기), 몰로니 뮤린 백혈병 바이러스(MoMLV), 라우스 육종 바이러스(RSV), 및 단순 헤르페스 바이러스(HSV)(티미딘 키나제) 프로모터를 포함한다. 전형적인 프로모터는 Tat-독립적 방식으로 높은 수준의 전사를 구동할 수 있다. 이 대체는 바이러스 생산 시스템에 완전한 U3 서열이 없기 때문에 복제-적격 바이러스를 생성하기 위해 재조합 가능성을 줄인다. 특정 구현예에서, 이종 프로모터는 바이러스 게놈이 전사되는 방식을 제어하는 데 추가적인 이점을 갖는다. 예를 들어, 이종 프로모터는 바이러스 게놈의 전부 또는 일부의 전사가 유도 인자가 존재할 때만 발생하도록 유도성일 수 있다. 유도 인자는 하나 이상의 화학적 화합물 또는 숙주 세포가 배양되는 온도 또는 pH와 같은 생리학적 조건을 포함한다.

특정 구현예에서, 바이러스 벡터는 TAR 요소를 포함한다. 용어 "TAR"은 렌티바이러스 LTR의 R 영역에 위치한 "트랜스-활성화 반응" 유전적 요소를 지칭한다. 이 요소는 렌티바이러스 트랜스-활성인자(tat) 유전적 요소와 상호작용하여 바이러스 복제를 향상시킨다. 그러나, 이 요소는 5' LTR의 U3 영역이 이종 프로모터에 의해 대체되는 구현예에서 필요하지 않다.

"R 영역"은 캡핑 기의 시작(즉, 전사의 시작)에서 시작하여 폴리(A) 구역의 시작 직전에 끝나는 레트로바이러스 LTR 내의 영역을 지칭한다. R 영역은 또한 U3 및 U5 영역에 의해 플랭킹되는 것으로 정의된다. R 영역은 게놈의 한쪽 단부에서 다른쪽 단부로 초기 DNA의 전달을 허용하는 역전사 동안 역할을 한다.

특정 구현예에서, 바이러스 벡터에서 이종 서열의 발현은 전사후 조절 요소, 효율적인 폴리아데닐화 부위, 및 임의적으로, 전사 종결 신호를 벡터에 혼입함으로써 증가된다. 다양한 전사후 조절 요소는 이종 핵산의 발현을 증가시킬 수 있다. 예는 우드척 간염 바이러스 전사후 조절 요소(WPRE; Zufferey 등, 1999, J. Virol., 73:2886); B형 간염 바이러스에 존재하는 전사후 조절 요소(HPRE)(Smith 등, Nucleic Acids Res. 26(21):4818-4827, 1998); 기타(Liu 등, 1995, Genes Dev., 9:1766)를 포함한다. 특정 구현예에서, 벡터는 WPRE, WPRE3, 또는 HPRE와 같은 전사후 조절 요소를 포함한다. 특정 구현예에서, 벡터는 WPRE, WPRE3, 또는 HPRE와 같은 전사후 조절 요소가 결여되어 있거나 또는 포함하지 않는다.

이종 핵산 전사체의 효율적인 종결 및 폴리아데닐화를 지시하는 요소는 이종 유전자 발현을 증가시킬 수 있다. 전사 종결 신호는 일반적으로 폴리아데닐화 신호의 하류에서 발견된다. 특정 구현예에서, 벡터는 발현될 분자(예를 들어, 단백질)를 암호화하는 폴리뉴클레오티드의 폴리아데닐화 신호 3'을 포함한다. 용어 "폴리(A) 부위" 또는 "폴리(A) 서열"은 RNA 폴리머라제 II에 의한 초기 RNA 전사체의 종결 및 폴리아데닐화 둘 다를 지시하는 DNA 서열을 나타낸다. 폴리아데닐화 서열은 코딩 서열의 3' 단부에 폴리(A) 꼬리를 첨가함으로써 mRNA 안정성을 촉진시켜, 증가된 번역 효율에 기여할 수 있다. 특정 구현예는 BGHpA 또는 SV40pA를 활용할 수 있다. 특정 구현예에서, 발현 작제물의 바람직한 구현예는 종결인자 요소를 포함한다. 이들 요소는 전사 수준을 향상시키고 작제물에서 다른 플라스미드 서열로의 판독을 최소화하는 역할을 할 수 있다.

특정 구현예에서, 바이러스 벡터는 하나 이상의 절연체 요소를 추가로 포함한다. 절연체 요소는 바이러스 벡터-발현된 서열, 예를 들어, 효과기 요소 또는 발현가능한 요소를 게놈 DNA에 존재하는 시스-작용 요소에 의해 매개되어 전달된 서열의 탈조절된 발현을 야기할 수 있는 통합 부위 효과(즉, 위치 효과; 예를 들어, Burgess-Beusse 등, PNAS., USA, 99:16433, 2002; 및 Zhan 등, Hum. Genet., 109:471, 2001 참조)로부터 보호하는 데 기여할 수 있다. 특정 구현예에서, 바이러스 전달 벡터는 3' LTR에 하나 이상의 절연체 요소를 포함하고 숙주 게놈에 프로바이러스의 통합 시, 프로바이러스는 3' LTR을 복제하여 5' LTR 및 3' LTR 둘 다에 하나 이상의 절연체를 포함한다. 특정 구현예에서 사용하기에 적합한 절연체는 닭 β-글로빈 절연체(Chung 등, Cell 74:505, 1993; Chung 등, PNAS USA 94:575, 1997; 및 Bell 등, Cell 98:387, 1999 참조), SP10 절연체(Abhyankar 등, JBC 282:36143, 2007), 또는 인핸서 차단 절연체로서 기능하는 다른 작은 CTCF 인식 서열(Liu 등, Nature Biotechnology, 33:198, 2015)을 포함한다.

전술한 설명 이상으로, 광범위한 적합한 발현 벡터 유형이 당업자에게 알려질 것이다. 이들은 일반적인 재조합 절차를 위해 설계된 상업적으로 입수가능한 발현 벡터, 예를 들어 세포에서 리포터 유전자의 발현에 필요한 하나 이상의 리포터 유전자 및 조절 요소를 함유하는 플라스미드를 포함할 수 있다. 수많은 벡터가 예를 들어, Invitrogen, Stratagene, Clontech 등으로부터 상업적으로 입수가능하고, 수많은 연관 가이드에 기재되어 있다. 특정 구현예에서, 적합한 발현 벡터는 pUC 또는 Bluescript 플라스미드 시리즈와 같은 포유동물 세포에서 암호화된 유전자의 발현을 지원할 수 있는 임의의 플라스미드, 코스미드 또는 파지 작제물을 포함한다.

본원에 개시된 벡터의 특정 구현예는 다음을 포함한다:

더 큰 벡터 서열 내의 하위구성요소 서열은 당업자에 의해 그리고 본 개시내용의 내용에 기반하여 용이하게 식별될 수 있다(도 12c 참조). 식별가능하고 열거된 하위구성요소 사이의 뉴클레오티드는 작제물의 조립(클로닝)에 사용되는 제한 효소 인식 부위를 반영하고, 일부 경우에, 추가의 뉴클레오티드는 임의의 식별가능한 기능을 전달하지 않는다. 완전한 벡터 서열의 이들 분절은 상이한 클로닝 전략 및/또는 벡터의 사용에 기반하여 조정될 수 있다. 일반적으로, 짧은 6-뉴클레오티드 회문 서열은 벡터 기능에 중요하지 않는 벡터 구성 인공물을 반영한다.

특정 구현예에서 혈액-뇌 장벽(BBB)을 가로지르는 캡시드가 있는 벡터(예를 들어, AAV)가 선택된다. 특정 구현예에서, 벡터는 BBB를 가로지르는 캡시드를 포함하도록 변형된다. 혈액 뇌 장벽을 가로지르는 바이러스 캡시드가 있는 AAV의 예는 AAV9(Gombash 등, Front Mol Neurosci.　2014; 7:81), AAVrh.10(Yang, 등, Mol Ther. 2014; 22(7): 1299-1309), AAV1R6, AAV1R7(Albright 등, Mol Ther.　2018; 26(2): 510), rAAVrh.8(Yang, 등, 상기), AAV-BR1(Marchio 등, EMBO Mol Med. 2016; 8(6): 592), AAV-PHP.S(Chan 등, Nat Neurosci. 2017; 20(8): 1172), AAV-PHP.B(Deverman 등, Nat Biotechnol. 2016; 34(2): 204), AAV-PPS(Chen 등, Nat Med.　2009; 15: 1215), 및 PHP.eB를 포함한다. 특정 구현예에서, PHP.eB 캡시드는 참조로서 AAV9를 사용하여, 잔기 586에서 시작하는 아미노산: S-AQ-A(서열번호: 144)이 S-DGTLAVPFK-A(서열번호: 145)로 바뀌도록 AAV9와 상이하다. 특정 구현예에서, PHP.eb는 서열번호: 85를 지칭한다.

AAV9는 많은 다른 자연 발생 혈청형과 달리, 정맥내 주사 후 BBB를 가로지를 수 있는 자연 발생 AAV 혈청형이다. 이는 중추신경계(CNS)의 큰 섹션을 형질도입하여, 예를 들어, AveXis(AVXS-101, NCT03505099)에 의한 척수근위축증의 치료 및 CLN3 유전자-관련 뉴런 세로이드-리포푸신증(NCT03770572)의 치료를 위한 임상 시험과 관련하여 기재된 바와 같이, 최소 침습적 치료를 허용한다(Naso 등, BioDrugs. 2017; 31(4): 317).

AAVrh.10은 원래 레서스 원숭이로부터 단리되었고 유전자 전달 적용에 사용되는 다른 통상적인 혈청형과 비교할 때 인간에서 낮은 혈청양성을 나타내고(Selot 등, Front Pharmacol. 2017; 8: 441) 임상 시험 LYS-SAF302, LYSOGENE, 및 NCT03612869에서 평가되었다.

키메라 AAV 벡터의 라이브러리로부터 단리된 2 개의 변이체인 AAV1R6 및 AAV1R7(AAVrh.10으로 교환된 AAV1 캡시드 도메인)은 BBB를 가로지르는 능력을 유지하고 유의하게 감소된 간 및 혈관 내피 형질도입을 나타내면서 CNS를 형질도입한다.

또한 레서스 원숭이로부터 단리된 rAAVrh.8은 말초 투여 후 중요한 임상 영역에서 교질 및 뉴런 세포 유형의 전반적 형질도입을 나타내고 또한 다른 벡터와 비교하여 감소된 말초 조직 향성을 나타낸다.

AAV-BR1은 무작위 AAV 디스플레이 펩티드 라이브러리의 생체내 스크리닝 동안 단리된 NRGTEWD(서열번호: 146) 에피토프를 나타내는 AAV2 변이체이다. 이는 최소 표적외 친화도를 갖는 뇌에서 높은 이식유전자 발현에 의해 동반되는 높은 특이성을 나타낸다(간 포함)(

등, EMBO Mol Med. 2016; 8(6): 609).

AAV-PHP.S(Addgene, 매사추세츠주 워터타운 소재)는 7-mer 서열 QAVRTSL(서열번호: 147)을 암호화하고, 장 신경계에서 뉴런을 형질도입하고, 척수 및 뇌간으로 들어가는 말초 감각 구심성 신경을 강력하게 형질도입하는 CREATE 방법으로 생성된 AAV9의 변이체이다.

AAV-PHP.B(Addgene, 매사추세츠주 워터타운 소재)는 7-mer 서열 TLAVPFK(서열번호: 148)를 암호화하는 CREATE 방법으로 생성된 AAV9의 변이체이다. 이는 AAV9보다 더 높은 효율로 CNS 전체에 걸쳐 유전자를 전달하고 대다수의 성상세포 및 뉴런을 다중 CNS 영역에 걸쳐 형질도입한다.

AAV2의 캡시드 내에 DSPAHPS(서열번호: 149) 에피토프를 삽입함으로써 생성된 AAV2 변이체인 AAV-PPS는 AAV2에 비해 극적으로 개선된 뇌 향성을 나타낸다.

혈액 뇌 장벽을 가로지르는 캡시드에 관한 추가 정보를 위해, Chan 등, Nat. Neurosci. 2017 Aug: 20(8): 1172-1179를 참조한다.

(ii) 투여용 조성물. 본 개시내용의 인공 발현 작제물 및 벡터(본원에서 생리학적으로 활성인 구성요소로서 지칭됨)는 세포, 조직 절편, 동물(예를 들어, 마우스, 비-인간 영장류), 또는 인간에게 투여하기에 적합한 담체로 제형화될 수 있다. 본원에 기재된 조성물 내의 생리학적으로 활성인 구성요소는 중성 형태, 유리 염기, 또는 약학적으로 허용되는 염으로 제조될 수 있다.

약제학적으로 허용되는 염은 예를 들어, 염산 또는 인산과 같은 무기 산, 또는 아세트산, 옥살산, 타르타르산, 만델산 등과 같은 유기 산으로 형성된 산 부가 염(단백질의 유리 아미노 기로 형성됨)을 포함한다. 유리 카복실 기로 형성된 염은 또한 예를 들어, 나트륨, 칼륨, 암모늄, 칼슘, 또는 수산화제2철과 같은 무기 염기, 및 이소프로필아민, 트리메틸아민, 히스티딘, 프로카닌 등과 같은 유기 염기로부터 유래될 수 있다.

생리학적으로 활성인 구성요소의 담체는 용매, 분산 매질, 비히클, 코팅, 희석제, 등장제 및 흡수 지연제, 완충제, 용액, 현탁액, 콜로이드 등을 포함할 수 있다. 생리학적으로 활성인 구성요소를 위한 이러한 담체의 사용은 당업계에 잘 알려져 있다. 임의의 통상적인 매질 또는 제제가 생리학적으로 활성인 구성요소와 양립할 수 없는 경우를 제외하고, 본원에 기재된 바와 같은 조성물과 함께 사용될 수 있다.

어구 "약제학적으로 허용되는 담체"는 인간에게 투여될 때, 특정 구현예에서, 정맥내로(예를 들어 안구뒤 망상조직에) 투여될 때 알레르기성 또는 유사한 원치않은 반응을 생산하지 않는 담체를 지칭한다.

특정 구현예에서, 조성물은 하나 이상의 세포, 조직, 또는 기관에 정맥내, 뇌실질내, 안내, 유리체내, 비경구, 피하, 대뇌내-심실, 근육내, 척추강내, 척수내, 복강내, 경구 또는 비강 흡입을 위해, 또는 직접 주사 또는 적용에 의해 제형화될 수 있다.

조성물은 리포솜, 지질, 지질 복합체, 미소구체, 미립자, 나노구체, 및/또는 나노입자를 포함할 수 있다.

리포솜의 형성 및 사용은 일반적으로 당업자에게 알려져 있다. 개선된 혈청 안정성 및 순환 반감기를 갖는 리포솜이 개발되었다(예를 들면, 미국 특허 번호 5,741,516 참조). 또한, 잠재적인 약물 담체로서 리포솜 및 리포솜 유사 제제의 다양한 방법이 기재되었다(예를 들면 미국 특허 번호 5,567,434; 5,552,157; 5,565,213; 5,738,868; 및 5,795,587 참조).

개시내용은 또한 생리학적으로 활성인 구성요소의 약제학적으로 허용되는 나노캡슐 제형을 제공한다. 나노캡슐은 일반적으로 안정하고 재현가능한 방식으로 화합물을 포획할 수 있다(Quintanar-Guerrero 등, Drug Dev Ind Pharm 24(12):1113-1128, 1998; Quintanar-Guerrero 등, Pharm Res. 15(7):1056-1062, 1998; Quintanar-Guerrero 등, J. Microencapsul. 15(1):107-119, 1998; Douglas 등, Crit Rev Ther Drug Carrier Syst 3(3):233-261, 1987). 세포내 중합체 과부하로 인한 부작용을 피하기 위해, 생체내에서 분해될 수 있는 중합체를 사용하여 이러한 초미세 입자를 설계할 수 있다. 이들 요건을 충족하는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 본 개시내용에서 사용하기 위해 고려된다. 이러한 입자는 Couvreur 등, J Pharm Sci 69(2):199-202, 1980; Couvreur 등, Crit Rev Ther Drug Carrier Syst. 5(1)1-20, 1988; zur Muhlen 등, Eur J Pharm Biopharm, 45(2):149-155, 1998; Zambaux 등, J Control Release 50(1-3):31-40, 1998; 및 미국 특허 번호 5,145,684에 기재된 바와 같이 용이하게 제조할 수 있다.

주사용 조성물은 멸균 수용액 또는 분산액 및 멸균 주사용 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함할 수 있다(미국 특허 번호 5,466,468). 주사를 통한 전달의 경우, 형태는 멸균되고 주사기로 전달할 수 있는 정도로 유체이다. 특정 구현예에서, 제조 및 저장 조건 하에 안정하고, 임의적으로 박테리아 및 진균과 같은 미생물의 오염 작용에 대한 하나 이상의 방부제 화합물을 함유한다. 담체는 예를 들어, 물, 에탄올, 폴리올(예를 들어, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 이의 적합한 혼합물, 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어, 레시틴과 같은 코팅을 사용하여, 분산액의 경우 필요한 입자 크기를 유지하여, 및/또는 계면활성제를 사용하여 유지될 수 있다. 미생물 작용의 예방은 다양한 항균제 및/또는 항진균제, 예를 들어, 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 야기될 수 있다. 다양한 구현예에서, 제제는 등장제(들), 예를 들어, 당(들) 또는 염화나트륨을 포함할 것이다. 주사용 조성물의 장기간 흡수는 흡수를 지연시키는 제제, 예를 들어, 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 포함함으로써 달성될 수 있다. 주사용 조성물은 필요한 경우 적합하게 완충될 수 있고, 액체 희석제는 먼저 충분한 염수 또는 글루코스로 등장성으로 만든다.

분산액은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 이의 혼합물 및 오일에서 제조될 수 있다. 나타낸 바와 같이, 저장 및 사용의 일반적인 조건 하에, 이들 제제는 미생물의 성장을 방지하기 위한 방부제를 함유할 수 있다.

멸균 조성물은 생리학적으로 활성인 구성요소를 적절한 양의 용매에 다른 임의적 성분(예를 들어, 상기 열거된 바와 같음)과 함께 혼입한 후, 여과 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 다양한 멸균된 생리학적으로 활성인 구성요소를 기본 분산 매질 및 필요한 다른 성분(예를 들어, 상기 열거된 것들)을 함유하는 멸균 비히클에 혼입함으로써 제조된다. 멸균 주사용 용액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 생리학적으로 활성인 구성요소 및 이의 이전에 멸균 여과된 용액으로부터의 임의의 추가의 원하는 성분의 분말을 산출하는 진공-건조 및 동결-건조 기술일 수 있다.

경구 조성물은 액체 형태, 예를 들어, 용액, 시럽 또는 현탁액일 수 있거나, 또는 사용 전에 물 또는 다른 적합한 비히클로 재구성하기 위한 약물 생성물로서 제시될 수 있다. 이러한 액체 제제는 현탁제(예를 들어, 소르비톨 시럽, 셀룰로스 유도체 또는 수소화 식용 지방); 유화제(예를 들어, 레시틴 또는 아카시아); 비-수성 비히클(예를 들어, 아몬드 오일, 오일 에스테르, 또는 분별 식물성 오일); 및 방부제(예를 들어, 메틸 또는 프로필-p-하이드록시벤조에이트 또는 소르브산)와 같은 약제학적으로 허용되는 첨가제와 함께 통상적인 수단에 의해 제조될 수 있다. 조성물은 예를 들어, 결합제(예를 들어, 예비겔화된 옥수수 전분, 폴리비닐 피롤리돈 또는 하이드록시프로필 메틸셀룰로스); 충전제(예를 들어, 락토스, 미세결정질 셀룰로스 또는 칼슘 수소 포스페이트); 윤활제(예를 들어, 마그네슘 스테아레이트, 활석 또는 실리카); 붕해제(예를 들어, 감자 전분 또는 나트륨 전분 글리콜레이트); 또는 습윤제(예를 들어, 나트륨 라우릴 설페이트)와 같은 약제학적으로 허용되는 부형제와 함께 통상적인 수단에 의해 제조된 정제 또는 캡슐 형태로 취할 수 있다. 정제는 당업계에 잘 알려진 방법에 의해 코팅될 수 있다.

흡입용 조성물은 적합한 추진체, 예를 들어, 디클로로디플루오로메탄, 트리클로로플루오로메탄, 디클로로테트라플루오로에탄, 이산화탄소 또는 다른 적합한 기체를 사용하여 가압 팩 또는 분무기로부터 에어로졸 스프레이 제시 형태로 전달될 수 있다. 가압 에어로졸의 경우 투여량 단위는 계량된 양을 전달하기 위한 밸브를 제공함으로써 결정될 수 있다. 예를 들어, 흡입기 또는 취입기에서 사용하기 위한 젤라틴의 캡슐 및 카트리지는 화합물의 분말 믹스 및 락토스 또는 전분과 같은 적합한 분말 베이스를 함유하여 제형화될 수 있다.

조성물은 또한 마이크로칩 장치(미국 특허 번호 5,797,898), 안과용 제형(Bourlais 등, Prog Retin Eye Res, 17(1):33-58, 1998), 경피 매트릭스(미국 특허 번호 5,770,219 및 미국 특허 번호 5,783,208) 및 피드백-제어 전달(미국 특허 번호 5,697,899)을 포함할 수 있다.

보조 활성 성분이 또한 조성물에 혼입될 수 있다.

전형적으로, 조성물은 생리학적으로 활성인 구성요소의 적어도 0.1% 이상을 포함할 수 있지만, 생리학적으로 활성인 구성요소의 백분율은 물론 달라질 수 있고 편리하게는 총 조성물의 중량 또는 부피의 1 또는 2% 내지 70% 또는 80% 이상 또는 0.5-99%일 수 있다. 자연스럽게, 각 생리학적으로 유용한 조성물 중 생리학적으로 활성인 구성요소의 양은 적합한 투여량이 화합물의 임의의 주어진 단위 용량으로 수득될 수 있는 방식으로 제조될 수 있다. 용해도, 생체이용률, 생물학적 반감기, 투여 경로, 생성물 저장 수명, 뿐만 아니라 다른 약리학적 고려사항과 같은 인자는 이러한 약제학적 제형을 제조하는 분야의 숙련자에 의해 고려될 것이고, 이와 같이 다양한 조성물 및 투여량이 바람직할 수 있다.

특정 구현예에서, 인간에게 투여하기 위해, 조성물은 미국식품의약국(FDA) 또는 다른 국가의 다른 적용가능한 규제 기관에서 요구하는 멸균성, 발열성, 및 일반적인 안전성 및 순도 표준을 충족해야 한다.

(iii) 인공 발현 작제물을 포함한 세포주. 본 개시내용은 본원에 기재된 인공 발현 작제물을 포함한 세포를 포함한다. 인공 발현 작제물로 형질전환된 세포는 신경해부학적 연구, 기능화 및/또는 비-기능화 단백질의 평가, 및 인핸서의 조절 특성을 평가하는 약물 스크린을 포함한 많은 목적을 위해 사용될 수 있다.

다양한 숙주 세포주가 사용될 수 있지만, 특정 구현예에서, 세포는 포유동물 세포이다. 특정 구현예에서, 인공 발현 작제물은 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m 및/또는 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024의 인핸서 및/또는 벡터 서열을 포함하고, 세포주는 인간, 영장류, 또는 뮤린 세포이다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다. 본 개시내용에서 이식유전자유발에 활용될 수 있는 세포주는 또한 래트 또는 마우스 뇌와 같은 살아있는 조직 및 래트 또는 마우스와 같은 동물의 뇌 절편을 포함한 기관형 세포 배양물로부터 유래된 1차 세포주를 포함한다. PC12 세포주(버지니아주 머내서스 소재의 아메리칸 타입 컬쳐 콜렉션, ATCC로부터 입수가능)는 신경 성장 인자(NGF)에 반응하여 다수의 뉴런 마커 단백질을 발현하는 것으로 제시되었다. PC12 세포주는 뉴런 세포주인 것으로 간주되며 본 개시내용에 따라 사용하기에 적당하다. JAR 세포(ATCC로부터 입수가능)는 세로토닌 수송체 유전자와 같은 일부 뉴런 유전자를 발현하는 혈소판 유래 세포주이며, 본원에 기재된 구현예에 따라 사용될 수 있다.

WO 91/13150은 뉴런 세포주를 포함한 다양한 세포주, 및 이들을 생산하는 방법을 기재하고 있다. 유사하게, WO 97/39117은 뉴런 세포주 및 이러한 세포주를 생산하는 방법을 기재하고 있다. 이들 특허 출원에 개시된 뉴런 세포주는 본 개시내용에서 사용하기에 적당하다.

특정 구현예에서, "뉴런"은 뉴런 세포의 것인, 이와 관련된, 또는 이를 포함하는 것을 설명한다. 뉴런 세포는 축색 돌기 및 수지상 돌기의 존재에 의해 정의된다. 용어 "뉴런-특이적"은 뉴런 세포 또는 뉴런 세포에서 유래된 세포에서 발견되거나, 또는 발생하는 활성이지만, 비-뉴런 세포 또는 뉴런 세포로부터 유래되지 않은 세포, 예를 들어 성상세포 또는 희소돌기아교세포와 같은 교질 세포에서 발견되지 않거나 또는 발생하지 않거나, 또는 실질적으로 발견되지 않거나 또는 실질적으로 발생하지 않는 것을 지칭한다.

특정 구현예에서, 마우스 배아 줄기 세포를 포함한 비-뉴런 세포주가 사용될 수 있다. 배양된 마우스 배아 줄기 세포는 플라스미드 작제물로 일시적 형질감염을 사용하여 유전적 작제물의 발현을 분석는 데 사용될 수 있다. 마우스 배아 줄기 세포는 만능성이고 미분화된다. 이들 세포는 백혈병 억제 인자(LIF)에 의해 이 미분화된 상태에서 유지될 수 있다. LIF의 철회는 배아 줄기 세포의 분화를 유도한다. 배양물에서, 줄기 세포는 다양한 분화된 세포 유형을 형성한다. 분화는 조직 특이적 전사 인자의 발현에 의해 야기되어, 인핸서 서열의 기능을 평가할 수 있다(예를 들어 Fiskerstrand 등, FEBS Lett 458: 171-174, 1999 참조).

줄기 세포를 뉴런 세포로 분화하는 방법은 줄기 세포 배양 배지를 염기성 섬유모세포 성장 인자(bFGF) 헤파린, N2 보충물(예를 들어, 트랜스페린, 인슐린, 프로게스테론, 푸트레신, 및 셀리나이트), 라민 및 폴리오르니틴을 포함한 배지로 교체하는 것을 포함한다. 줄기 세포로부터 수초성 희소돌기아교세포를 생산하는 과정은 Hu, 등, 2009, Nat. Protoc. 4:1614-22에 기재되어 있다. Bibel, 등, 2007, Nat. Protoc. 2:1034-43은 줄기 세포로부터 글루타메이트성 뉴런을 생산하는 프로토콜을 기재하고 있은 반면 Chatzi, 등, 2009, Exp. Neurol. 217:407-16은 GABA성 뉴런을 생산하는 절차를 기재하고 있다. 이 절차는 줄기 세포를 모든-트랜스-RA에 3 일 동안 노출시키는 것을 포함한다. B27, bFGF 및 EGF가 보충된 Neurobasal 배지를 포함한 무혈청 뉴런 유도 배지에서 후속 배양 후, 95% GABA 뉴런이 발생한다

미국 공개 번호 2012/0329714는 신경 줄기 세포 수를 증가시키기 위한 프로락틴의 사용을 기재하고 있는 반면 미국 공개 번호 2012/0308530은 뉴런, 성상세포 및 희소돌기아교세포로의 뉴런 분화를 촉진하는 아미노 기를 갖는 배양 표면을 기재하고 있다. 따라서, 신경 줄기 세포의 운명은 다양한 세포외 인자에 의해 제어될 수 있다. 통상적으로 사용되는 인자는 뇌 유래 성장 인자(BDNF; Shetty 및 Turner, 1998, J. Neurobiol. 35:395-425); 섬유모세포 성장 인자(bFGF; 미국 특허 번호 5,766,948; FGF-1, FGF-2); 뉴로트로핀-3(NT-3) 및 뉴로트로핀-4(NT-4); Caldwell, 등, 2001, Nat. Biotechnol. 1;19:475-9); 섬모 신경친화성 인자(CNTF); BMP-2(미국 특허 번호 5,948,428 및 6,001,654); 이소부틸 3-메틸크산틴; 백혈병 억제 성장 인자(LIF; 미국 특허 번호 6,103,530); 소마토스타틴; 암피레굴린; 뉴로트로핀(예를 들어, 사이클릭 아데노신 모노포스페이트; 표피 성장 인자(EGF); 덱사메타손(글루코코르티코이드 호르몬); 포스콜린; GDNF 패밀리 수용체 리간드; 칼륨; 레티노산(미국 특허 번호 6,395,546); 파상풍 독소; 및 형질전환 성장 인자-α 및 TGF-β(미국 특허 번호 5,851,832 및 5,753,506)를 포함한다.

특정 구현예에서, 효모 원-하이브리드 시스템은 또한 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 및 그들의 코어에 대한 전사 인자와 같은 특이적 단백질/DNA 상호작용을 억제하는 화합물을 식별하는 데 사용될 수 있다.

유전자이식 동물이 하기에 기재되어 있다. 세포주는 또한 이러한 유전자이식 동물로부터 유래될 수 있다. 예를 들어, 유전자이식 마우스로부터의 1차 조직 배양물(예를 들어, 또한 하기에 기재된 바와 같음)은 이미 게놈에 통합된 인공 발현 작제물을 갖는 세포주를 제공할 수 있다. (예를 들어 MacKenzie & Quinn, Proc Natl Acad Sci USA 96: 15251-15255, 1999 참조).

(iv) 유전자이식 동물. 개시내용의 또 다른 측면은 유전자이식 동물을 포함하며, 이의 게놈은 이종 코딩 서열에 작동가능하게 연결된 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m을 포함한 인공 발현 작제물을 함유한다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다. 특정 구현예에서, 유전자이식 동물의 게놈은 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함한다. 특정 구현예에서, 비-통합 벡터가 활용되는 경우, 유전자이식 동물은 그의 세포 중 하나 이상 내에 인공 발현 작제물 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m 및/또는 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함한다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다.

유전자이식 동물을 생산하는 상세한 방법은 미국 특허 번호 4,736,866에 기재되어 있다. 유전자이식 동물은 임의의 비인간 종의 것일 수 있지만, 바람직하게는 비인간 영장류(NHP), 양, 말, 소, 돼지, 염소, 개, 고양이, 토끼, 닭, 및 설치류 예컨대 기니 피그, 햄스터, 게르빌, 래트, 마우스, 및 흰족제비를 포함한다.

특정 구현예에서, 유전자이식 동물의 구성은 동일한 게놈 통합 부위의 모든 세포에 존재하는 조작된 작제물을 갖는 유기체를 초래한다. 따라서, 이러한 유전자이식 동물로부터 유래된 세포주는 조작된 작제물이 모든 세포에서 동일한 게놈 통합 부위에 있을 수 있는 만큼 일관성이 있을 것이고 따라서 동일한 위치 효과 변화를 겪을 것이다. 대조적으로, 세포주 또는 1차 세포 배양물에 유전자를 도입하면 작제물의 이종 발현을 일으킬 수 있다. 이 접근법의 단점은 도입된 DNA의 발현이 숙주 동물의 특정 유전적 배경에 의해 영향을 받을 수 있다는 점이다.

세포주와 관련하여 상기 나타낸 바와 같이, 본 개시내용의 인공 발현 작제물은 당업계에 알려진 기술을 사용하여 마우스 배아 줄기 세포를 유전적으로 변형시키는 데 사용될 수 있다. 전형적으로, 인공 발현 작제물은 배양된 뮤린 배아 줄기 세포 내에 도입된다. 그런 다음 형질전환된 ES 세포를 숙주 모체의 배반포에 주사하고 숙주 배아를 모체에 다시 이식한다. 이는 조직이 배양된 세포주에 존재하는 배아 줄기 세포 및 숙주 배아에 존재하는 배아 줄기 세포 둘 다로부터 유래된 세포로 구성된 키메라 마우스를 초래한다. 일반적으로 이식유전자유발에 사용되는 배양된 ES 세포가 유래된 마우스는 형질전환된 세포가 주사될 배아를 갖는 숙주 마우스와 상이한 코트 컬러를 갖도록 선택된다. 그런 다음 키메라 마우스는 변화된 코트 컬러를 가질 것이다. 생식계열 조직이 적어도 부분적으로 유전적으로 변형된 세포로부터 유래되는 한, 이어서 적절한 균주와 교배된 키메라 마우스는 이식유전자를 운반할 자손을 생산할 수 있다.

상기 기재된 전달 방법 이외에, 하기 기술이 또한 인공 발현 작제물을 동물의 표적 세포 또는 선택된 조직 또는 기관, 및 특히 척추동물 포유동물의 세포, 기관, 또는 조직에 전달하는 대안적인 방법으로 고려된다: 초음파영동법(예를 들어, 미국 특허 번호 5,656,016에 기재된 바와 같은 초음파); 골내 주사(미국 특허 번호 5,779,708); 마이크로칩 장치(미국 특허 번호 5,797,898); 안과용 제형(Bourlais 등, Prog Retin Eye Res, 17(1):33-58, 1998); 경피 매트릭스(미국 특허 번호 5,770,219 및 미국 특허 번호 5,783,208); 피드백-제어 전달(미국 특허 번호 5,697,899), 및 개시내용에서 이용가능하고/하거나 다른 곳에 기재된 임의의 다른 전달 방법.

(v) 사용 방법. 특정 구현예에서, 본원에 기재된 생리학적으로 활성인 구성요소를 포함하는 조성물은 생리학적 효과를 초래하기 위해 대상체에게 투여된다.

특정 구현예에서, 개시내용은 조작된 서열에서 해당 인핸서의 하류에 있는 위치에서 부분적으로 또는 전체적으로 암호화된 이종 유전자의 발현을 조절하기 위한 본원에 기재된 인공 발현 작제물의 용도를 포함한다. 따라서, 질환, 기능장애, 또는 장애의 증상을 예방, 치료 또는 개선하기 위한 약제의 조사, 연구, 및 잠재적 개발에서 개시된 인공 발현 작제물의 사용 방법이 본원에 제공된다.

특정 구현예는 선택된 세포 유형에서 유전자의 선택적 발현을 구동하기 위해 본원에 기재된 바와 같은 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m 및/또는 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함하는 인공 발현 작제물을 대상체에게 투여하는 방법을 포함한다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다. 대상체는 단리된 세포, 세포의 네트워크, 조직 절편, 실험 동물, 수의학 동물, 또는 인간일 수 있다.

의학 분야에 잘 알려진 바와 같이, 임의의 하나의 대상체에 대한 투여량은 대상체의 크기, 표면적, 연령, 투여될 특정 화합물, 성별, 투여 시간 및 경로, 일반적 건강, 및 동시 투여되는 다른 약물을 포함한 많은 인자에 따라 달라진다. 개시내용의 화합물에 대한 투여량은 달라질 것이지만, 특정 구현예에서, 용량은 개시내용의 인공 발현 작제물의 10⁵ 내지 10¹⁰⁰ 개 카피일 수 있다. 특정 구현예에서, 정맥내, 뇌실질내, 척수내, 안구뒤, 또는 척추강내 투여를 받는 환자는 인공 발현 작제물의 10⁶ 내지 10²² 개 카피가 주입될 수 있다.

"유효량"은 대상체에서 원하는 생리학적 변화를 초래하는 데 필요한 조성물의 양이다. 유효량은 종종 연구 목적을 위해 투여된다. 본원에 개시된 유효량은 동물 모델 또는 시험관내 검정에서 통계적으로 유의한 효과를 유발할 수 있다.

발현 작제물의 양 및 이러한 조성물의 투여 시간은 본 교시의 이익을 갖는 당업자의 범위 내에 있을 것이다. 그러나, 유효량의 개시된 조성물의 투여는 예를 들어, 대상체에서 효과를 제공하기 위해 충분한 수의 감염성 입자의 단일 주사와 같은 단일 투여에 의해 달성될 수 있다는 가능성이 있다. 대안적으로, 일부 상황에서, 이러한 조성물의 투여를 감독하는 개인에 의해 결정될 수 있는 바와 같이, 비교적 단기간, 또는 비교적 장기간에 걸쳐 인공 발현 작제물 조성물 또는 다른 유전적 작제물의 다중, 또는 연속 투여를 제공하는 것이 바람직할 수 있다. 예를 들어, 포유동물에게 투여되는 감염성 입자의 수는 의도된 효과를 달성하기 위해 필요할 수 있는 만큼 단일 용량으로서 또는 2 회 이상의 투여로 나누어 주어진 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³ 개, 또는 훨씬 더 높은 감염성 입자/ml일 수 있다. 실제로, 특정 구현예에서, 원하는 효과를 달성하기 위해 2 개 이상의 상이한 발현 작제물을 조합하여 투여하는 것이 바람직할 수 있다.

특정 상황에서 피펫, 안구뒤 주사에 의해, 피하로, 안내로, 유리체내로, 비경구로, 피하로, 정맥내로, 뇌실질내로, 대뇌내-심실로, 근육내로, 척추강내로, 척수내로, 복강내로, 경구 또는 비강 흡입에 의해, 또는 하나 이상의 세포, 조직, 또는 기관에 직접 적용 또는 주사에 의해 본원에 개시된 적절하게 제형화된 조성물에 인공 발현 작제물을 전달하는 것이 바람직할 것이다. 투여 방법은 또한 미국 특허 번호 5,543,158; 미국 특허 번호 5,641,515 및 미국 특허 번호 5,399,363에 기재된 바와 같은 양식을 포함할 수 있다.

(vi) 키트 및 상업용 패키지. 키트 및 상업용 패키지는 본원에 기재된 인공 발현 작제물을 함유한다. 인공 발현 작제물은 단리될 수 있다. 특정 구현예에서, 발현 생성물의 구성요소는 서로 단리될 수 있다. 특정 구현예에서, 발현 생성물은 벡터 내에, 바이러스 벡터 내에, 세포 내에, 조직 절편 또는 샘플 내에, 및/또는 유전자이식 동물 내에 있을 수 있다. 이러한 키트는 하나 이상의 시약, 제한 효소, 펩티드, 치료제, 약제학적 화합물, 또는 주사기, 주사제 등과 같은 조성물 전달용 수단을 추가로 포함할 수 있다.

키트 또는 상업용 패키지의 구현예는 또한 예를 들어, 기초 연구, 전기생리학적 연구, 신경해부학적 연구, 및/또는 장애, 질환 또는 병태의 연구 및/또는 치료에 포함된 구성요소의 사용에 관한 지침을 함유할 것이다.

하기 예시적인 구현예는 개시내용의 특정 구현예를 입증하기 위해 포함된다. 당업자는 많은 변화가 본원에 개시된 특정 구현예로 이루어질 수 있고 개시내용의 취지 및 범위를 벗어나지 않고 유사하거나 또는 유사한 결과를 여전히 수득할 수 있음을 본 개시내용에 비추어 인식해야 한다.

(vii) 예시적인 구현예.

1. 본원에 개시된 인핸서의 연쇄된 코어.

2. eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 또는 eHGT_460m 인핸서의 연쇄된 코어.

3. 구현예 1 또는 2에 있어서, 상기 연쇄된 코어가 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 및/또는 서열번호: 52에 제시된 바와 같은 서열을 포함하는 것인, 연쇄된 코어.

4. 구현예 1 또는 2에 있어서, 상기 연쇄된 코어가 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 또는 서열번호: 52에 제시된 바와 같은 서열을 포함하는 것인, 연쇄된 코어.

5. 구현예 1 내지 4 중 어느 한 구현예에 있어서, 상기 연쇄된 코어가 인핸서 코어의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는 것인, 연쇄된 코어.

6. 구현예 5에 있어서, 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 및/또는 서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는, 연쇄된 코어.

7. 구현예 5에 있어서, 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 또는 서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는, 연쇄된 코어.

8. 구현예 5에 있어서,

서열번호: 45의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;

서열번호: 46의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;

서열번호: 47의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;

서열번호: 48의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;

서열번호: 49의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;

서열번호: 50의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;

서열번호: 51의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피; 또는

서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는, 연쇄된 코어.

9. 구현예 5에 있어서, 서열번호: 45의 3 개 카피; 서열번호: 46의 3 개 카피; 서열번호: 47의 3 개 카피; 서열번호: 48의 3 개 카피; 서열번호: 49의 3 개 카피; 서열번호: 50의 3 개 카피; 서열번호: 51의 3 개 카피; 또는 서열번호: 52의 3 개 카피를 포함하는, 연쇄된 코어.

10. 구현예 5에 있어서, 상기 연쇄된 코어가 서열번호: 53; 서열번호: 54; 서열번호: 55; 서열번호: 56; 서열번호: 57; 서열번호: 58; 서열번호: 59; 또는 서열번호: 60을 포함하는 것인, 연쇄된 코어.

11. eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, 및 eHGT_583m으로부터 선택된 단리된 인핸서.

12. (i) 구현예 1 내지 11 중 어느 한 구현예의 인핸서 또는 이의 연쇄된 코어; (ii) 프로모터; 및 (iii) 이종 암호화 서열을 포함하는 인공 발현 작제물.

13. 구현예 12에 있어서, 상기 이종 암호화 서열이 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 인공 발현 작제물.

14. 구현예 13에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 인공 발현 작제물.

15. 구현예 14에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 인공 발현 작제물.

16. 구현예 13 또는 14에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, 디자이너 약물에 의해 배타적으로 활성화되는 디자이너 수용체(DREADD), 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.

17. 구현예 13 내지 16 중 어느 한 구현예에 있어서, 상기 발현가능한 요소는 비-기능성 분자를 포함하는 것인, 인공 발현 작제물.

18. 구현예 17에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.

19. 구현예 12 내지 18 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 혈액 뇌 장벽을 가로지르는 캡시드와 회합되는 것인, 인공 발현 작제물.

20. 구현예 19에 있어서, 상기 캡시드가 PHP.eB, AAV-BR1, AAV-PHP.S, AAV-PHP.B, 또는 AAV-PPS를 포함하는 것인, 인공 발현 작제물.

21. 구현예 12 내지 20 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 스킵핑 요소를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물.

22. 구현예 21에 있어서, 상기 스킵핑 요소가 2A 펩티드 및/또는 내부 리보솜 진입 부위(IRES)를 포함하는 것인, 인공 발현 작제물.

23. 구현예 22에 있어서, 상기 2A 펩티드가 T2A, P2A, E2A, 또는 F2A를 포함하는 것인, 인공 발현 작제물.

24. 구현예 12 내지 23 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 다음으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물: eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 3xcore2_eHGT_460m, AAV, scAAV, rAAv, minBglobin, CMV, minCMV, minRho, minRho^*, 형광 단백질(예를 들어, EGFP, SYFP, SYFP2, GFP), Cre, iCre, dgCre, FlpO, tTA2, SP10, WPRE, WPRE3, 및/또는 BGHpA.

25. 구현예 12 내지 24 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 다음으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물:

eHGT_450m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_457m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_458m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_463m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_692h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_693h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_694h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_695h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_667m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_668m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_696m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_455m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_457h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_603m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_604m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_605m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_661m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_766m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_767m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_768m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_663m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_660m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_665m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_700m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_456m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_698m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_699m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_647m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_648m-minBglobin-이종 코딩 서열 WPRE3-BGHpA;

eHGT_649m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_670m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_697m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_662m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_583m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;

eHGT_450m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_451m-최소 프로모터-이종 코딩 서열- WPRE3-BGHpA;

eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_457m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_458m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_463m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_692h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_693h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_694h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_695h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_667m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_668m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_696m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_455m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_457h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_603m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_604m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_605m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_661m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_766m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_767m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_768m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_663m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_660m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_665m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_700m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_456m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_698m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_699m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_647m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

eHGT_648m- 최소 프로모터 -이종 코딩 서열 WPRE3-BGHpA;

eHGT_649m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;

eHGT_670m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;

eHGT_697m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;

eHGT_662m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;

eHGT_583m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;

3xcore2_eHGT_451m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA; 또는

3xcore2_eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA.

26. 구현예 12 내지 25 중 어느 한 구현예의 인공 발현 작제물을 포함하는 벡터.

27. 구현예 26에 있어서, 상기 벡터가 바이러스 벡터를 포함하는 것인, 벡터.

28. 구현예 26 또는 27에 있어서, 상기 바이러스 벡터가 재조합 아데노-연관 바이러스(AAV) 벡터를 포함하는 것인, 벡터.

29. 적어도 하나의 이종 암호화 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터로서, 상기 이종 암호화 서열은 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m으로부터 선택된 프로모터 및 인핸서의 제어 하에 있는 것인, 아데노-연관 바이러스(AAV) 벡터

30. 구현예 1 내지 29 중 어느 한 구현예의 발현 작제물 또는 벡터를 포함하는 유전자이식 세포.

31. 구현예 30에 있어서, 상기 유전자이식 세포가 L5 글루타메이트성 뉴런인, 유전자이식 세포.

32. 구현예 31에 있어서, 상기 L5 글루타메이트성 뉴런이 L5 ET 뉴런인, 유전자이식 세포.

33. 구현예 1 내지 32 중 어느 한 구현예의 인공 발현 작제물, 벡터, 또는 유전자이식 세포를 포함하는 비-인간 유전자이식 동물.

34. 구현예 33에 있어서, 상기 비-인간 유전자이식 동물이 마우스 또는 비-인간 영장류인, 비-인간 유전자이식 동물.

35. 구현예 1 내지 34 중 어느 한 구현예의 발현 작제물, 벡터, 또는 유전자이식 세포를 포함하는 투여가능한 조성물.

36. 구현예 1 내지 35 중 어느 한 구현예의 인공 발현 작제물, 벡터, 유전자이식 세포, 유전자이식 동물, 및/또는 투여가능한 조성물을 포함하는 키트.

37. 생체내 또는 시험관내 세포 집단 내에서 이종 유전자를 선택적으로 발현하는 방법으로서, 상기 방법은 구현예 35의 투여가능한 조성물을 충분한 투여량 및 충분한 시간 동안 세포 집단을 포함하는 샘플 또는 대상체에 제공하여 세포 집단 내에서 유전자를 선택적으로 발현하는 단계를 포함하는 것인, 방법.

38. 구현예 37에 있어서, 상기 이종 유전자가 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 방법.

39. 구현예 38에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 방법.

40. 구현예 39에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 방법.

41. 구현예 39 또는 40에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.

42. 구현예 37 내지 41 중 어느 한 구현예에 있어서, 상기 발현가능한 요소가 비-기능성 분자를 포함하는 것인, 방법.

43. 구현예 42에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.

44. 구현예 37 내지 43 중 어느 한 구현예에 있어서, 상기 제공하는 단계가 피펫팅을 포함하는 것인, 방법.

45. 구현예 44에 있어서, 상기 피펫팅이 뇌 절편에 대한 것인, 방법.

46. 구현예 45에 있어서, 상기 뇌 절편이 L5 ET 뉴런을 포함하는 것인, 방법.

47. 구현예 45 또는 46에 있어서, 상기 뇌 절편이 뮤린, 인간, 또는 비-인간 영장류인, 방법.

48. 구현예 37 내지 43 중 어느 한 구현예에 있어서, 상기 제공하는 단계가 살아있는 대상체에게 투여하는 것을 포함하는 것인, 방법.

49. 구현예 48에 있어서, 상기 살아있는 대상체가 인간, 비-인간 영장류, 또는 마우스인, 방법.

50. 구현예 48 또는 49에 있어서, 상기 살아있는 대상체에게 투여하는 것이 주사를 통한 것인, 방법.

51. 구현예 50에 있어서, 상기 주사가 정맥내 주사, 뇌 조직 내에 뇌실질내 주사, 뇌실내(ICV) 주사, 대조내(ICM) 주사, 또는 척추강내 주사를 포함하는 것인, 방법.

52. 구현예 48 내지 51 중 어느 한 구현예에 있어서, 상기 살아있는 대상체가 신경퇴행성 질환을 갖는 것인, 방법.

53. 구현예 48 내지 52 중 어느 한 구현예에 있어서, 상기 살아있는 대상체가 ALS 또는 다발성 경화증을 갖는 것인, 방법.

54. CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함하는 인공 발현 작제물.

(viii) 마무리 단락. 본원에 개시되고 참조된 서열의 변이체가 또한 포함된다. 아미노산 잔기가 생물학적 활성을 폐지하지 않고 치환, 삽입, 또는 결실될 수 있는지를 결정하는 지침은 DNASTAR™(위스콘신주 매디슨 소재) 소프트웨어와 같은 당업계에 잘 알려진 컴퓨터 프로그램을 사용하여 찾을 수 있다. 바람직하게는, 본원에 개시된 단백질 변이체에서 아미노산 변화는 보존적 아미노산 변화, 즉, 유사하게 하전 또는 비하전된 아미노산의 치환이다. 보존적 아미노산 변화는 그들의 측쇄와 관련된 아미노산 패밀리 중 하나의 치환을 수반한다.

펩티드 또는 단백질에서, 아미노산의 적합한 보존적 치환은 당업자에게 알려져 있고 일반적으로 생성된 분자의 생물학적 활성을 변경하지 않고 이루어질 수 있다. 당업자는 일반적으로 폴리펩티드의 비-필수 영역에서 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경하지 않음을 인식한다(예를 들어, Watson 등 Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. Co., p. 224 참조). 자연 발생 아미노산은 일반적으로 다음과 같은 보존적 치환 패밀리로 나뉜다: 그룹 1: 알라닌(Ala), 글리신(Gly), 세린(Ser), 및 트레오닌(Thr); 그룹 2: (산성): 아스파르트산(Asp), 및 글루탐산(Glu); 그룹 3: (산성; 또한 극성, 음으로 하전된 잔기 및 그들의 아미드로 분류됨): 아스파라긴(Asn), 글루타민(Gln), Asp, 및 Glu; 그룹 4: Gln 및 Asn; 그룹 5: (염기성; 또한 극성, 양으로 하전된 잔기로 분류됨): 아르기닌(Arg), 리신(Lys), 및 히스티딘(His); 그룹 6(큰 지방족, 비극성 잔기): 이소류신(Ile), 류신(Leu), 메티오닌(Met), 발린(Val) 및 시스테인(Cys); 그룹 7(비하전된 극성): 티로신(Tyr), Gly, Asn, Gln, Cys, Ser, 및 Thr; 그룹 8(큰 방향족 잔기): 페닐알라닌(Phe), 트립토판(Trp), 및 Tyr; 그룹 9(비-극성): 프롤린(Pro), Ala, Val, Leu, Ile, Phe, Met, 및 Trp; 그룹 11(지방족): Gly, Ala, Val, Leu, 및 Ile; 그룹 10(작은 지방족, 비극성 또는 약간 극성 잔기): Ala, Ser, Thr, Pro, 및 Gly; 및 그룹 12(황-함유): Met 및 Cys. 추가의 정보는 Creighton (1984) Proteins, W.H. Freeman and Company에서 찾을 수 있다.

이러한 변화를 만드는 데 있어서, 아미노산의 수치 지수가 고려될 수 있다. 단백질에 상호작용 생물학적 기능을 부여하는 데 있어서 아미노산 수치 지수의 중요성이 일반적으로 당업계에서 이해된다(Kyte 및 Doolittle, 1982, J. Mol. Biol. 157(1), 105-32). 각 아미노산은 그의 소수성 및 전하 특성에 기초하여 수치 지수가 지정되었다(Kyte 및 Doolittle, 1982). 이들 값은 다음과 같다: Ile(+4.5); Val(+4.2); Leu(+3.8); Phe(+2.8); Cys(+2.5); Met(+1.9); Ala(+1.8); Gly(-0.4); Thr(-0.7); Ser(-0.8); Trp(-0.9); Tyr(-1.3); Pro(-1.6); His(-3.2); 글루타메이트(-3.5); Gln(-3.5); 아스파르테이트(-3.5); Asn(-3.5); Lys(-3.9); 및 Arg(-4.5).

특정 아미노산은 유사한 수치 지수 또는 점수를 갖는 다른 아미노산에 의해 치환될 수 있고 유사한 생물학적 활성을 갖는 단백질을 여전히 초래하며, 즉, 생물학적 기능성으로 동등한 단백질을 여전히 수득할 수 있음이 당업계에 알려져 있다. 이러한 변화를 만드는 데 있어서, 수치 지수가 ±2 이내에 있는 아미노산의 치환이 바람직하고, ±1 이내의 것이 특히 바람직하고, ±0.5 이내의 것이 훨씬 더 특히 바람직하다. 또한 유사한 아미노산의 치환은 친수성에 기초하여 효과적으로 이루어질 수 있음이 당업계에서 이해된다.

미국 특허 번호 4,554,101에 상세히 기재된 바와 같이, 하기 친수성 값이 아미노산 잔기에 지정되었다: Arg(+3.0); Lys(+3.0); 아스파르테이트(+3.0±1); 글루타메이트(+3.0±1); Ser(+0.3); Asn(+0.2); Gln(+0.2); Gly(0); Thr(-0.4); Pro(-0.5±1); Ala(-0.5); His(-0.5); Cys(-1.0); Met(-1.3); Val(-1.5); Leu(-1.8); Ile(-1.8); Tyr(-2.3); Phe(-2.5); Trp(-3.4). 아미노산은 유사한 친수성 값을 갖는 또 다른 것으로 치환될 수 있고 생물학적으로 등가물, 및 특히, 면역학적으로 등가인 단백질을 여전히 수득할 수 있음이 이해된다. 이러한 변화에서, 친수성 값이 ±2 이내에 있는 아미노산의 치환이 바람직하고, ±1 이내의 것이 특히 바람직하고, ±0.5 이내의 것이 훨씬 더 특히 바람직하다.

상기 요약된 바와 같이, 아미노산 치환은 아미노산 측쇄 치환기의 상대적 유사성, 예를 들어, 그들의 소수성, 친수성, 전하, 크기 등에 기반할 수 있다.

다른 곳에 나타낸 바와 같이, 유전자 서열의 변이체는 암호화된 생성물의 기능에 통계적으로 유의한 정도로 영향을 미치지 않는 코돈 최적화된 변이체, 서열 다형성, 스플라이스 변이체, 및/또는 돌연변이를 포함할 수 있다.

본원에 개시된 단백질, 핵산, 및 유전자 서열의 변이체는 또한 본원에 개시된 단백질, 핵산, 또는 유전자 서열에 대해 적어도 70% 서열 동일성, 80% 서열 동일성, 85% 서열, 90% 서열 동일성, 95% 서열 동일성, 96% 서열 동일성, 97% 서열 동일성, 98% 서열 동일성, 또는 99% 서열 동일성을 갖는 서열을 포함한다.

"% 서열 동일성"은 서열을 비교함으로써 결정되는, 2 개 이상의 서열 사이의 관계를 지칭한다. 당업계에서, "동일성"은 또한 이러한 서열의 스트링 사이의 일치에 의해 결정된 단백질, 핵산, 또는 유전자 서열 사이의 서열 관련성 정도를 의미한다. "동일성"(종종 "유사성"으로 지칭됨)은 다음에 기재된 것들을 포함하여 알려진 방법에 의해 용이하게 계산될 수 있다: Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., 및 Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. 및 Devereux, J., eds.) Oxford University Press, NY (1992). 동일성을 결정하는 바람직한 방법은 테스트되는 서열 사이의 최적 일치를 제공하도록 설계된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 이용가능한 컴퓨터 프로그램에 성문화된다. 서열 정렬 및 퍼센트 동일성 계산은 LASERGENE 생물정보학 컴퓨터 제품군(DNASTAR, Inc., 위스콘신주 매디슨 소재)의 Megalign 프로그램을 사용하여 수행될 수 있다. 서열의 다중 정렬은 또한 디폴트 매개변수(GAP PENALTY=10, GAP LENGTH PENALTY=10)에 따라 Clustal 정렬 방법(Higgins 및 Sharp CABIOS, 5, 151-153 (1989)을 사용하여 수행될 수 있다. 관련 프로그램은 또한 GCG 프로그램 제품군(Wisconsin Package Version 9.0, Genetics Computer Group (GCG), 위스콘신주 매디슨 소재); BLASTP, BLASTN, BLASTX(Altschul, 등, J. Mol. Biol. 215:403-410 (1990); DNASTAR(DNASTAR, Inc., 위스콘신주 매디슨 소재); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Publisher: Plenum, New York, N.Y.을 포함한다. 본 개시내용의 맥락 내에서 서열 분석 소프트웨어가 분석을 위해 사용되는 경우, 분석 결과는 참조된 프로그램의 "디폴트 값"에 기반함이 이해될 것이다. 본원에 사용된 바와 같은 "디폴트 값"은 처음 초기화될 때 소프트웨어와 함께 원래 로드되는 값 또는 매개변수의 임의의 세트를 의미할 것이다.

변이체는 또한 엄격한 혼성화 조건 하에 본원에 개시된 서열에 혼성화하고 참조 서열과 동일한 기능을 제공하는 핵산 분자를 포함한다. 예시적인 엄격한 혼성화 조건은 50% 포름아미드, 5XSSC(750 mM NaCl, 75 mM 시트르산삼나트륨), 50 mM 인산나트륨(pH 7.6), 5XDenhardt 용액, 10% 덱스트란 설페이트, 및 20 μg/ml 변성된, 전단된 연어 정자 DNA를 포함하는 용액에서 42℃에서 밤새 인큐베이션, 이어서 50℃에서 0.1XSSC에서 필터를 세척을 포함한다. 혼성화 및 신호 검출의 엄격성에서의 변화는 포름아미드 농도(더 낮은 백분율의 포름아미드는 저하된 엄격성을 초래함); 염 조건, 또는 온도의 조작을 통해 주로 달성된다. 예를 들어, 적당히 높은 엄격성 조건은 6XSSPE(20XSSPE=3M NaCl; 0.2M NaH₂PO₄; 0.02M EDTA, pH 7.4), 0.5% SDS, 30% 포름아미드, 100 μg/ml 연어 정자 차단 DNA를 포함하는 용액에서 37℃에서 밤새 인큐베이션; 이어서 50℃에서 1XSSPE, 0.1% SDS로 세척을 포함한다. 또한, 훨씬 더 낮은 엄격성을 달성하기 위해, 엄격한 혼성화 후 수행되는 세척은 더 높은 염 농도(예를 들어 5XSSC)에서 수행될 수 있다. 상기 조건의 변경은 혼성화 실험에서 배경을 억제하는 데 사용되는 대체 차단 시약의 포함 및/또는 교체를 통해 달성될 수 있다. 전형적인 차단 시약은 Denhardt 시약, BLOTTO, 헤파린, 변성된 연어 정자 DNA, 및 상업적으로 입수가능한 독점 제형을 포함한다. 특정 차단 시약의 포함은 호환성 문제로 인해 상기 기재된 혼성화 조건의 변형이 필요할 수 있다.

용어 연쇄된은 쇄 또는 시리즈에 함께 연결하는 것을 설명하는 데 광범위하게 사용된다. 이는 뉴클레오티드 또는 아미노산 서열을 각각 단일 뉴클레오티드 또는 아미노산 서열에 함께 연결하는 것을 설명하는 데 사용된다. 용어 "연쇄시키다" 및 "연쇄된"은 상호교환가능하게 사용될 수 있다.

당업자에 의해 이해되는 바와 같이, 본원에 개시된 각 구현예는 그의 특정 언급된 요소, 단계, 성분 또는 구성요소를 포함하거나, 이로 본질적으로 이루어지거나 또는 이로 이루어질 수 있다. 따라서, 용어 "포함하다" 또는 "포함한"은 "포함하거나, 이로 이루어지거나, 또는 이로 본질적으로 이루어진"을 인용하는 것으로 해석되어야 한다. 이행 용어 "포함하다" 또는 "포함한다"는 명시되지 않은 요소, 단계, 성분, 또는 구성요소가 심지어 다량으로 포함되는 것을 의미하지만 이에 제한되지 않고 포함하는 것을 허용한다. 이행 어구 "로 이루어진"은 명시되지 않은 임의의 요소, 단계, 성분 또는 구성요소를 배제한다. 이행 어구 "로 본질적으로 이루어진"은 구현예의 범위를 명시된 요소, 단계, 성분 또는 구성요소 및 구현예에 실질적으로 영향을 미치지 않는 것들로 제한한다. 물질 효과는 L5 ET 뉴런을 포함한 L5 글루타메이트성 뉴런에서 선택적 발현을 통계적으로 유의하게 감소시킬 것이다.

특정 구현예에서, 인공은 자연 발생하지 않는 것을 의미한다.

달리 나타내지 않는 한, 명세서 및 청구범위에서 사용되는 성분의 양, 분자량과 같은 특성, 반응 조건 등을 표현하는 모든 숫자는 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 달리 반대로 나타내지 않는 한, 명세서 및 첨부된 청구범위에 제시된 수치 매개변수는 본 발명에 의해 수득하려는 원하는 특성에 따라 달라질 수 있는 근사치이다. 최소한으로, 및 청구범위의 범위에 대한 등가 원칙의 적용을 제한하려는 시도로서가 아니라, 각 수치 매개변수는 적어도 보고된 유효 자릿수에 비추어 그리고 일상적인 반올림 기술을 적용함으로써 해석되어야 한다. 추가의 명확성이 필요한 경우, 용어 "약"은 명시된 수치 값 또는 범위와 함께 사용될 때 당업자에 의해 합리적으로 주어진 의미를 가지며, 즉 명시된 값의 ±20%; 명시된 값의 ±19%; 명시된 값의 ±18%; 명시된 값의 ±17%; 명시된 값의 ±16%; 명시된 값의 ±15%; 명시된 값의 ±14%; 명시된 값의 ±13%; 명시된 값의 ±12%; 명시된 값의 ±11%; 명시된 값의 ±10%; 명시된 값의 ±9%; 명시된 값의 ±8%; 명시된 값의 ±7%; 명시된 값의 ±6%; 명시된 값의 ±5%; 명시된 값의 ±4%; 명시된 값의 ±3%; 명시된 값의 ±2%; 또는 명시된 값의 ±1% 범위 내에서 명시된 값 또는 범위보다 다소 많거나 또는 다소 적음을 나타낸다.

본 발명의 광범위한 범위를 제시하는 수치 범위 및 매개변수가 근사치임에도 불구하고, 특정 예에 제시된 수치 값은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치 값은 본질적으로 그들의 각각의 테스트 측정에서 발견된 표준 편차로부터 필연적으로 비롯된 특정 오류를 함유한다.

용어 단수형 및 발명을 설명하는 맥락에서(특히 하기 청구범위의 맥락에서) 사용되는 유사한 지시대상은 달리 본원에 나타내지 않거나 또는 문맥상 명백하게 모순되지 않는 한, 단수형 및 복수형 둘 다를 포괄하는 것으로 해석되어야 한다. 본원에서 값의 범위의 언급은 단지 범위 내에 속하는 각각의 개별 값을 개별적으로 언급하는 약칭 방법으로 제공하도록 의도된다. 달리 본원에 나타내지 않는 한, 각각의 개별 값은 본원에서 개별적으로 인용된 것처럼 명세서에 포함된다. 본원에 기재된 모든 방법은 본원에 달리 나타내지 않거나 또는 문맥상 달리 명백하게 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예, 또는 예시적인 언어(예를 들어, "예컨대")의 사용은 단지 발명을 더 잘 설명하기 위한 것으로 의도되며 달리 청구된 본 발명의 범위에 대한 제한을 제기하지 않는다. 명세서의 어떤 언어도 본 발명의 실행에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되지 않아야 한다.

본원에 개시된 본 발명의 대안적 요소 또는 구현예의 그룹화는 제한으로 해석되어서는 안 된다. 각 그룹 구성원은 개별적으로 또는 그룹의 다른 구성원 또는 본원에서 발견되는 다른 요소와 임의의 조합으로 언급되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성의 이유로 그룹에 포함되거나 또는 이로부터 삭제될 수 있음이 기대된다. 임의의 이러한 포함 또는 삭제가 발생하는 경우, 명세서는 변형된 그룹을 함유하는 것으로 간주되어 첨부된 청구범위에 사용되는 모든 Markush 그룹의 서면 설명을 충족한다.

본 발명의 특정 구현예는 본 발명을 수행하기 위해 발명자에게 알려진 최상의 모드를 포함하여 본원에 기재되어 있다. 물론, 이들 기재된 구현예에 대한 변경은 전술한 설명을 읽을 때 당업자에게 자명하게 될 것이다. 발명자는 숙련자가 이러한 변경을 적절하게 이용하기를 기대하고, 발명자들은 본원에 구체적으로 기재된 것보다 달리 본 발명이 실행되기를 의도한다. 따라서, 본 발명은 적용가능한 법에 의해 허용되는 바에 따라 여기에 첨부된 청구범위에 인용된 주제의 모든 변형 및 등가물을 포함한다. 더욱이, 모든 가능한 이의 변경에서 상기 기재된 요소의 임의의 조합은 본원에 달리 나타내지 않거나 또는 문맥상 달리 명백하게 모순되지 않는 한 본 발명에 의해 포함된다.

또한, 본 명세서 전체에 걸쳐 특허, 인쇄된 간행물, 저널 기사 및 다른 서면 텍스트(본원에 참조된 자료)에 대한 수많은 참조가 이루어졌다. 참조된 자료 각각은 참조된 교시에 대해 그 전문이 참조로 본원에 개별적으로 포함된다.

끝으로, 본원에 개시된 본 발명의 구현예는 본 발명의 원리를 예시하는 것임이 이해되어야 한다. 이용될 수 있는 다른 변형은 본 발명의 범위 내에 있다. 따라서, 제한하려는 것이 아니라 예로서, 본 발명의 대안적 구성이 본원의 교시에 따라 활용될 수 있다. 따라서, 본 발명은 정확히 제시되고 기재된 것으로 제한되지 않는다.

본원에 제시된 상세한 사항은 예로서 그리고 단지 본 발명의 바람직한 구현예의 예시적 논의를 위한 목적으로 제시되며 본 발명의 다양한 구현예의 원리 및 개념적 측면에 대한 가장 유용하고 용이하게 이해되는 설명으로 여겨지는 것을 제공하려는 이유로 제시된다. 이와 관련하여, 본 발명의 기본적인 이해에 필요한 것보다 더 상세하게 본 발명의 구조적 세부사항을 제시하려는 시도가 이루어지지 않았으며, 도면 및/또는 실시예와 함께 취해진 설명은 본 발명의 여러 형태가 실제로 구현될 수 있는 방법을 당업자에게 명백하게 한다.

본 개시내용에 사용되는 정의 및 설명은 하기 실시예에서 달리 명백하고 모호하지 않게 변형되는 한 또는 의미의 적용이 임의의 구성을 무의미하게 만들거나 또는 본질적으로 무의미하게 만드는 경우 임의의 향후 구성을 제어하는 것을 의미하고 의도된다. 용어의 구성이 무의미하거나 또는 본질적으로 무의미하게 만드는 경우, 정의는 Webster's Dictionary, 3rd Edition 또는 Oxford Dictionary of Biochemistry and Molecular Biology(Ed. Anthony Smith, Oxford University Press, Oxford, 2004)와 같은 당업자에게 알려진 사전으로부터 취해야 한다.

SEQUENCE LISTING <110> Allen Institute <120> ARTIFICIAL EXPRESSION CONSTRUCTS FOR SELECTIVELY MODULATING GENE EXPRESSION IN NEOCORTICAL LAYER 5 GLUTAMATERGIC NEURONS <130> A166-0024PCT / AI 20-04PCT <150> US 63/013,342 <151> 2020-04-21 <160> 149 <170> PatentIn version 3.5 <210> 1 <211> 484 <212> DNA <213> Mus musculus <400> 1 ttccgcgtag acctggggta cttttctaag acacccttta ttgtttgttc ctaaccctag 60 ccctgtatcc atgcagcgtt ctccatcacc tatgtaaaac ttagcagatc tgagtcttcc 120 tctgaggaaa caacatcctg tgctgttaga ctgtattttc cgtctccaga ttctctactt 180 cgtcccttcc cccgccccaa tttccctgtc tccagcgagc aatattatct ttcatctgag 240 cctctctccc tgcctccagt gactgcctcc cctgatgaat tctctccggg tgactttggc 300 atttgcatat ttcctcgctt ggatattctg agatgttgga accggagagc aggttgacgc 360 gatcaggtac ttagctgaac gaggctttct cgggaactgc acaaatattt ggagtcgggc 420 atgtgccaat aggcaattaa ttgaaatgtg gacacagcaa gcttccggag gagggaagct 480 gaag 484 <210> 2 <211> 615 <212> DNA <213> Mus musculus <400> 2 gctaaagaca acattggcct gaaattcagg agacctaagt tctagatcaa tctgtggcat 60 ggtcttagac cacagatggg ctttcctgcc tgcatttacc caaagagccc aaagaggaga 120 ccacatgggg taccatggga ctgaccttcc cagttcaaag cttctttaca caacgctgct 180 gaatcacccg ctagctcgct ctcttatcat tccttttcat tcctggaggt aaaaccaacc 240 ttagaatcgt ggagcctgat agactttgaa attggccttc attttaattc tcaagttctt 300 agcatgagag caacattcaa tatggttctg aaatatctca tgcaaaaaag tgccagagtc 360 atagactgaa atatttattt gaatataaat gaactcagat ttgccaaaat gcgctccccc 420 tgttgtcatg gacacagatg cctgcctttc tgatttgcat tttgctctaa tgggtataat 480 gtgtttcagc tcctcattgg tgctgggatt ggatttgaga aactcaccag tccatgagtt 540 cccccaaaat gtcagccagt gggaaacttt tgtgtctttg attctgtttc atctagccag 600 ctggaaacag actgc 615 <210> 3 <211> 669 <212> DNA <213> Mus musculus <400> 3 tgctcagaaa ctggcctcga tgctgtcctg ctttcaccaa ttaataatat atgtggagac 60 cgttctctac tggcatatgt gtgtgcatca cataattata tgtatatatg caatcctttt 120 tcttgttgtc ttttagagtc aattctatat atatattttt tattaagaca tttaaaagtt 180 ccaaagtaaa aataacaaaa tcaaggatac attgactcat ttttattttg tgaggaagaa 240 attttccatt tgtctgtgta attacatttg ctaatttcta aaacaattcc tgggatttat 300 atctatatat gcctcaggaa catacaggga agatcatact gttctctgaa tttcaaatta 360 tgttttctgt tttatttcat gaatttatta tttttctttg tctctgtctg tctctctctg 420 tgtgtatgtg tatgcgtgta tatgcacgca tgtgctgtgc acttgtgtgt atacattttt 480 ttgcacgtga gaagtgtacc tacgaggctg tgcctgggtg tggaagccca gggttggtgg 540 ggaagaccat actccaaggc tctccaacct tattcagtga ggcaggcagt cacatctgtc 600 tgacatttct gatcattaca cgtgtgcagt gggtgtttta tccaccgagc caccttccca 660 gccatggat 669 <210> 4 <211> 721 <212> DNA <213> Mus musculus <400> 4 tcacaaatca gtaagaatta cactccaaaa ataaaacagg gaagggtatt agtatgtgat 60 acgcatggat aaagtagaag aggccaaaaa tacaaagaac cgtaaactca ctagtgatgg 120 aagaaacgct aattaaaata atgagctttc ctgacccttt atcacatggg cacattttca 180 aaggacaaga ctctgctgag gagaacacag aacaggatcc ttcagacaag cttcagcaac 240 caattttagg atgttcttaa atagatcgat tcttctactt tttttaaaaa taacatagat 300 ctgaaaagct ttataacttt tggttttttt ttaaggacca tattaacagc atcttccagt 360 ttttctagag taaatgaata tgtatccctt ttataattaa caatatacat atattcattt 420 tgtaaaaaga ctataaaaat agaagagaaa atgaagagat gtttatttct tttacacgca 480 tcagactaag gccttcagct cagcaggggg cagagtttat catctgtact ctctgaagtg 540 tcacactgcc ctgcctttgt gtgcccttgc ctgtccctct gtgacggtca ccctttcggt 600 tctggcttgg agcctggtca tcagtgcctg gcggcctgtg cctgggctgt gctgagctca 660 tttggtcgtt gtcctagtga tgtgacccta ccttagactt ccccatctct tgaggtggct 720 a 721 <210> 5 <211> 472 <212> DNA <213> Mus musculus <400> 5 acggatgtca agttaggcaa aagtttcata taaatgtggt taaagtaatt ctaaagtttg 60 tttttacatc acagaactga gcaaatgaac aaatgtaatg ataacattgg gagctgatta 120 ttctgagcaa acagcagaga aatccaaatc cagacagttg gggggaaagc cacagctact 180 cagaaaacac actgtgatgg aaaacaacct acaggttatt attagactaa agagacataa 240 aattagatat gccacttcca gagactatag gttagacgat aatatatgct gagtgaagtg 300 ccctgttttg gtaactgcag taaggctgtg tatcagaatg ttcctagcta catatttagg 360 tgtaaagcag agtgagtcaa aatatattcc agggttaaaa aaaaaaaaaa caatctttac 420 ttctcttttc tttaaactaa ataatttcaa ttattctcct atgtttaggg ag 472 <210> 6 <211> 375 <212> DNA <213> Mus musculus <400> 6 gactggaaaa aggtagctat ggcagcctct gcgcctatat tttatccata ttctgatttt 60 gttttccaag gtctcctagt caatcataat ctgaatcaat ggaaatttcc acggataaat 120 aattcatgag acttgaggaa aatgtgtgct agtcctcaat accttataaa atgtattatt 180 cattttgaat tagattaaaa tgtttaaaaa atgctatcta taagacactg tgggagccaa 240 aaaatttata cttctttata aaatccttaa ctgcctggaa ataaactagg tgttaagaga 300 attgaagtta aaacacagaa aaataatccc actctttcat aaactcacaa ctcccaaata 360 atgagaacca aaggt 375 <210> 7 <211> 787 <212> DNA <213> Mus musculus <400> 7 tgactgtgtc atgactctca gtgtctcttt tttccacggt tctgggatca tcatttcttt 60 ctcttcagac agtctagatg agcagccgag tgcttatctt taaggctgac tctagacagc 120 cagttgttat ttcataaatc tgttaaaact caccgtgcaa acaccagcgt tccttagctg 180 accatcctca agcacacgtg gagtgtgacc tctgcttcct tctctcattt cacatattag 240 taatgtgcgt ctatgaatag ttacaagtga gaaagagaaa tggagatttt accatttaat 300 catctccgaa gagaaggtga gaagaaattg agaaaggtaa tttgcatacc atgcataggc 360 attagagaaa gcattttttt tcttaactct ccatttgttt acagatattt ccatatggcc 420 ttttaaaaac ttcaacagag aaattcgaac acaactaact ggaatttcaa ttttcatata 480 aaaccagcat catagatata tatgtagcta ctctcccact tcacattatt cagttagtat 540 attttctaag ctaatttcca atccatttta agactatgta cagctcatat gaggccccca 600 tatgttcgtt cacgttactt tgcatccgtt tacatgatta aaccccaaga acaaatcgat 660 tagaagccaa gagcaaatgc ttttggctcc acattagaaa actcaacaga gaaaccttta 720 caagtgatag tcatctgggt aagagacatg caaacataat taccattatt cgtggactta 780 attccct 787 <210> 8 <211> 759 <212> DNA <213> Mus musculus <400> 8 ttaacttgag gaaatctgcc acaagatgtt ctcaagtgca aatgtctctt gatgcataca 60 cgcatgcatt tctatttaag tatccaacga gaattgtggg gttgaggtag gtattttagc 120 ttataaaaaa aaaatacctt atgagcttat tttggatcat ataaaagtat gagcactttt 180 agaacacttt taataatgca aatcatctct gcatcatcca aatttaatcc atgaacattt 240 agtcatcgtt atcttacatg agtcatatct gtgtccttat tgtcttatct taaatgcatt 300 aattaattcg atagagcatc tataaaaatg aaacgctatt caaaagctgg cccatgacaa 360 gatcagtgtg ttggtttcta tgcctatagt ggtgcaatgg aaggagtgcg ctgtacccca 420 cagactttgt gattgatgag ttgtctactt tattcacaat gaagctaaaa acaatctaac 480 aaccatcagg gtgctacagc agcacagaaa tgactagctc ttttgtgtca agttattgcc 540 ggttgtctta gtcactgtcc gactgatgtg cagagacacc atgactaagg caacgcttat 600 caaagaaaga gtctagttga gagcttgctt gtagttccag aggtttgttt agtctagcat 660 ggtggcacac actgtgctag aacaatattg agagctacaa cctgatctga aaagcagaga 720 gagatagaga cagaaagagg cagagagaca ctggccctg 759 <210> 9 <211> 405 <212> DNA <213> Mus musculus <400> 9 gctggtgggt gggaagagtt tagtaactgc tcaccaatgg tgctgtagac attatcagtt 60 gcaagaagtg ttttaatttc agagaaatta aaatatgcaa aatatgtgtc tctgaatcaa 120 caaaacatgg tgcctcaggt ttccgtatct gtgtgggcct gtttttaggt tttctgttct 180 atctattcct gggcttccac cacactgtgt taatgaggat aactttaaaa tacatcttga 240 tatttagtag agcgcatttc cacgcctgat tcatcacgag caccttaact tgtcttggtt 300 cttctgcgga gatgttggca ccagcttctt cacccgtgac tccagcttct ggggaacctg 360 tgctctcacc cctgccccgc ctgtgcctgc caggcacacc ttaat 405 <210> 10 <211> 647 <212> DNA <213> Mus musculus <400> 10 agttttggaa aaacaccata ctggttattt tcaaataact ctatttcaca acagtatact 60 agaattttat gctaaaatct ttctgtgact ttgtgttcac tgatcaacaa ttcctctttt 120 atgatagcct atgctgtcta ccatctattc caaactttta tgagatcagt aattttagat 180 tatgaatgag tttgatcata tagtacatac ttttgtgtct gctattgcat ttacatagtg 240 acataggctt acaggatatt gtaaatgtca tccctagata catttatgta accttttttt 300 aaaataaaac tctaacaaat gttagttatt gtgcactatg gttttgaata tttgaatttg 360 ctttgctcag atctaaataa cttctgataa gtttggcatt caggaaagag taaatgtaaa 420 tgtagaaatg cttggaatat aaaacaagta atttttgtga taatttttct gaaaatgcta 480 atgtatattt tcagcaggcc tcctttcttg tttagaacag tatatttctt agctttaatt 540 agtacttact ttatatatct atgcatccat ttatagttca gcattagatt gaatatgtat 600 gcatgtatgt atgatttatt tatatttttg tctcccagtc cacaccc 647 <210> 11 <211> 678 <212> DNA <213> Mus musculus <400> 11 gggagatata aacaagaaga aacaggactg aataaatgtg tgcagaagga tcctgtagca 60 gcgtcgttct tcctggccag ttgagcgcgc gcagcactta agattggtgc tcatccatgc 120 ctattcattc ttgtgatgtg ttgtgttaga tattattggt aattattact tagagaggtg 180 gcaaagtagt gaataggtgg aaaggcactg agaccatatt gtcaccgcag ctttggaaaa 240 gaccttctta ttttaactta tgtaattaac catcccaaat ttaccctgat cctcactgga 300 aatgtcttcc ctttcctgat atttaccaca gttttaaaaa gtcttagatg ggtatgcata 360 tttgagaaat acgtagagtt aattagtgcg tagatgtgtt tttaagttgc ataaaacata 420 ttgtgctttg gcatagctcc ctttgtaact tattttagga aaccaagttt gattttgaca 480 acagcattag aagtaaagtg tgtgaagatg atttagaatc catgaatatc cacattgctg 540 aatataatcc ttcctggcta cagagctcct atttctgctc ctgtaagcag ccattcaccc 600 acacttctta aagtaacccc aataaactca ctcattaagt tagattttgg cagtgtcctt 660 ctttgatctg ttgtccgt 678 <210> 12 <211> 633 <212> DNA <213> Mus musculus <400> 12 tttgcttgtg tgccagcagg gaggagcaag aggaattttg tcacttctct ttcactttct 60 tcattatttt aagttggatc tgctgttctg ttcactttta aaatataacc ttcagtattt 120 atgaacgtga ttcatctttt acaatatgtt gtttaacatg aatgcatctt cttcttgcct 180 ttcagtgcat ctttatgcca ttggcagcca caatcaagtg tttccattaa agttcacagt 240 aacagtgcag tgttgtctgt cccaactctg ctaactttta ccacccacta tttagtttta 300 tctaccatgt gaatttattt gtaagatctt ctttctctta tcctagttaa ttatggggag 360 gacttgccag gatattaatt tacatggcaa ttttggataa gttatgcatg tattcatctc 420 ctatatacaa taagtttttc ttgtgaacgt caaaagaaag gataatgcat atgactgtat 480 atgatataaa ctggaatgta atagttgcca ataggatctg aatcaaattt cagtttttaa 540 ctatgttcta tatatctatg tgcatattta tagcatgtgt gacatatgta taatttaaat 600 atttctataa acttatacag aaacaaaata tgt 633 <210> 13 <211> 601 <212> DNA <213> Homo sapiens <400> 13 ctgaagttct gggggcagac cgcaattgct gccacagagc ccctcctggc aggtgcagcc 60 cacaggaaga ccagcaccct ggccacagag acaaaaggtc ttattgactt gcagtaaaaa 120 tgtccttata acctgtccag aacaaaaggg gaggataagg ttcaaccaga caccgaattc 180 agggagacag catcagtcag agctttacca ctgccagcaa ttttgaagct gcccatattt 240 ctgctcaggc aagatgtttt cttgctctga aaccttttag cagatgcaag gtattgctcc 300 gggtgtatcc cagaacacaa gtctttgcta aagtgggtag acagccactt tccttcagag 360 ccagggactg ccctgggagt aaaaccattt ggagagcatt ttatatttgc aaaatgttgc 420 tgtgacatgt tatcatttat tcctttcaac agcgcagtga gattggagag catcctccga 480 tgcactgtac atttgggagg aagagaaagg ataagagccc tgctgattca gtggtggtca 540 ttatcattgt caatggagct gtcactgtta tcgtcatttt cgtttgcggt gaggtatgtg 600 a 601 <210> 14 <211> 518 <212> DNA <213> Homo sapiens <400> 14 agaaagcaag agcaaagggc aggtcttcca ggagagacag acagacaaag aaaaagcaag 60 ggaggtggag agtgtgtgag agagggagtg agaaagggct cagccatttg tctgggcagg 120 tctgcggaac tcaaatccgg ctcatctgca tctcctcaaa taaacttctg ggaagtgaat 180 gcctgaagca ggcagagtgc agagaagtca gcaaatatgt gcgtagtgaa ttccaagcct 240 tctgttccca gctcctggga ggggccgcag tgccttgggg tgtcctgccg tgtctccatc 300 gggtcccctg cctggctgct ctaaccctga ggaatggcct ccattgtggg cctgtggaaa 360 cagggagaag aatctcttat ccagcaggtc tgagggccac aggaacataa gtaacactga 420 agagtgaggc tgatccctgg ggtttgcgcg agcctgcaaa tgcatgattc aacagcactc 480 gcctggtgcc tctgggaggc aagctggatg aggatgtt 518 <210> 15 <211> 613 <212> DNA <213> Homo sapiens <400> 15 agaaatcccc ttccctacct tttatctatc aatcatatct atctatatcc cccaaaactt 60 agctgatact aacaatttaa ggatccccaa tcccaaagca tttagatttt aagacaaata 120 aaacagttgg aatcctggtc ccatggaatt tcagagttgg gagaaagtga agagatttcc 180 tggctaaccc ctgcagttaa cagatggcaa aaagaagtac agagaattgt ctgaagtccc 240 agagcaaggg agtggaagcg cggccgcaac gaggcatgca taagattctg cagaaaccac 300 gttctcccgc ttcacagcgg tctgctcttt tcaggagagc ctgggaaaac ttctgactgt 360 gcaatttgct taaaaacaac agagaaacat catagaagag gatcaattcc tgaccatgca 420 tttgaaatta gacacttaca ggcattccct gcagagtgct ctccactggg gcccagtgga 480 agcagcatca cccatcagcc gctgggggtg gctggtgcca ccaggtcagg cctggagcgg 540 ggcaggagtc tcctcaggct cgatgctctt gacctgctgc tggtgccaag agttagaagc 600 aaagcaccca cca 613 <210> 16 <211> 406 <212> DNA <213> Homo sapiens <400> 16 ttccttggaa cactatttgg catatatgca tattttgggg ctcagtgtct ttcatcgtta 60 tgtttatggt tataatgacc acatctctca cccattagct gtgtggcttt tgaggtcagt 120 aagctattct tcccagagtg cttgacatag ggcctgcggc atggtaaata cccacagttt 180 ttgagtttcc tgtgggttga gcatttagaa tcatctgttt gtttaatcag gacatatttc 240 tccagtacct tcaggggtcc cagtactatg tttaggaact tagccatcac ttgcacagta 300 aacagtatct gtggattttg tcattcaaca aacactgcca ttgttcagtc actcaacaaa 360 cgctgttacg gcatccaccc tggggaaaga agggtctctt ggcaga 406 <210> 17 <211> 335 <212> DNA <213> Mus musculus <400> 17 tccatctttc tgactttagg gccattttta gaatggcctt tgttacccca agattacata 60 aatattcacc caaacttcct ccagtacttt tatggtttcc ttcacaggat ttaattctta 120 aatccatctg gaatgtattt ctgaaaaaaa aaaaaaaagt aaaatagtgc cagctatttt 180 gcttcagagc caatgtttcc taagttgaaa actttagcta tattcagttg tgtgatgtca 240 ttaaagataa taagatttgg gaccagattc tgagttcagt tgcactctct gtatagggta 300 tagaaaatca ttcaactttc tgagaaatgt gcaga 335 <210> 18 <211> 304 <212> DNA <213> Mus musculus <400> 18 acacacacac acacacacac acacaaataa aaacaaaaac aactcttaaa aacctaagaa 60 agggataaat acaacatcaa agactgttgg ggttataaaa catacacatt tatagacatt 120 tccaagatgc tactaaaatt acatacaaat gagtatccaa aatgtcacag aacaaattat 180 tcttgtgcaa cataaacaac tagagagcat agcaaaggaa gcccagacca tgagctttcc 240 cgatctgctt cccaagctaa catatgttgg catccaatcc tgaaaactac agaagacatg 300 aggt 304 <210> 19 <211> 524 <212> DNA <213> Mus musculus <400> 19 tttccagcac tgcaggagtc ttcagtatga agtagaacca gttgggtgac ggggcagaca 60 ctggagacag acagaaaagg ttctaatatc catgttctgt ttgattttgg aaggatgctg 120 aatgctaatc agctttctta ttttaagaaa gactatctta aattattata cttgcctcat 180 atgatttgga ggatgattgc atgctgttcc ctcagcaaac aggagcttag aaaagttttt 240 gaataatttc acaaaaggcc ccaaagtatt ctcagtatga agatggaaat tgggctgagt 300 catcttatct agaggaagta tcagaaaact tcgttgaaat agttttgagt aggcctttgg 360 cacagaagaa gccatgtgga tcagaagtga aaaaaatgac gcttgccaat gcttgcggtg 420 agatctgaca tagagtggcc atctttcggg atgcagtgtt agaatgtgta gtagaaaata 480 aggtggaaga gacgtgttcg gttccatctc aagatttggg ggca 524 <210> 20 <400> 20 000 <210> 21 <211> 700 <212> DNA <213> Mus musculus <400> 21 tgcatggatt ctaagttcct aagaggaatt cagaaaatac caatttttat ttagcatata 60 agataatgtc ttccatcata acattcacaa tcacacacaa acatacacac acacacacat 120 catacttcat tcatattcac tgtattacta tcgtctgcta atcttgccaa ctcttacact 180 gagaaccttt cttgacttaa attatggata tgagagacac tgtgatattt gtttttctcc 240 acctacctct gcttttatat aaggcatatt ccatgcatgc taatgatatt ggagcacaat 300 gtttatgcat gtataatcat atatttcttt cctgtgcctg tgaaatcata gttataacta 360 aatttctttc tcttatgatt ccataaaaaa ttctcaggaa tataaagtat atataagcca 420 aaattctata aaattaataa attatgatga tcagaaaggt acaacaatgt ctttcagaag 480 tctataatga cttttgaccc agcatgttca tgccctacat gctgttagtg aaattaactt 540 tccaattcaa attagtacat tgagttgatt gaacatattt catcgttcac attgactcac 600 actgtgggat tcttataaaa gacaatttcc cttaaatata accagctttt agttttttca 660 tgaaagccag tcccttgtta ctagtgtatt tagatgcatc 700 <210> 22 <211> 640 <212> DNA <213> Homo sapiens <400> 22 ctgtgtctca ggccagaaga ttttctatat tggctggagc ttctgtggga tgcaggcagt 60 ggatgagaag ggaaacgaca gcaaatagag gaagcacaag tctctggcct cagtgttggg 120 tgcacacaaa gcaaatggga gaaggaggag aggggctccc ttcccctgcc ccaaggccca 180 gccaggcagg cccccagcag cctggctgtc tccctccctt gcgggctgga gctgcctctc 240 cgcctctgcc cgcctgatcg gggcagagct cggcttcatg tattattaat agcactgcca 300 gccttcctgt tttcacgctg ataacctgca ggggagggct ggtgggaggg agggagcaag 360 gtggcaaacc ctggagcttc tagggtccct cccccctcag tagagcagct ctgcgggggt 420 tggccccaag tctctaaagt tggtttctag agcctccccc atccaagccc acgggaaggg 480 accagggcct cctaaaggga aatcacatgg gaggttggaa cgtggggtct gggaagggcc 540 ctgttactca atccatctag gacaccaatg gctcaagtca ccttggccct ccccagaggc 600 agaagtgccc atgtctaggg cacatggggc tcagagctga 640 <210> 23 <211> 493 <212> DNA <213> Mus musculus <400> 23 atgtgcatac ctgcctctga gaaggaccaa agtcagatgc actctcaatg taagggcttg 60 ggggtggaac acctcaagtt ccacacacac cccaatctcc tacaggagtt tcctttagag 120 gacctgtctc ctccaagggg ctctgttaga ccaagtggga aagtctctag gaactgactt 180 cagaggtttg gggctgtgcc agtcccgcgg cgcactctgc cacggaggag acctggagct 240 cctgggttgg ccaccttgct ccctgcctcc tcccacctcc tccccagcag gttatcagca 300 tgaaaacagg aaggctggca gtgctattaa taaaacatga agcagagatc tgccccatca 360 ggcagcggag gcaggcggca gctcggcagc cccgagggag ggagagaacc cccgcatctg 420 ggcctgggca ggggtattct cttctcacag atgccacacc ccaggagcca cctccatttt 480 gcgggactgc tgt 493 <210> 24 <211> 466 <212> DNA <213> Mus musculus <400> 24 agctaaccta ccagtcccac cgtgatatct ggatgctgat ataaaggaga atgtatcaaa 60 taatgtaatg cttggaagtt atttgaatct gttattctta agagcacact gatattactc 120 attgtgtgag gcacacaaaa aagatcagaa cacaaaggca tatttgtgct gtgtgtccaa 180 cactgagggg cgggaggagg taatactttt ttggaaaaga caggaaagaa tgaaaataga 240 tggtttgtaa agatagtaag cttgtgggtg gctttttatt tccataatca tggtattatg 300 tttttgtata attttaagaa aaacttatgt taatcagaaa ctttgaataa caccttaaca 360 aaaatgtgct gcacaccgca gccatcccag agaagctaac actcaagatg tcctgttcag 420 gcttcgcgca tttgagtcca gggaagatgt ctctcgttgg caccaa 466 <210> 25 <211> 429 <212> DNA <213> Mus musculus <400> 25 tgctcagggt ctgcaaactt tttcttatgg ttagtacaag aagaatgcat aaacatcaca 60 aaccaaagta cttctttcaa ccaatcaaac aaattatata cagggtaaca cacaaaatca 120 aactgagcaa atctagccaa tgggtcccat atgccacatt tttcatttcc ttattccagc 180 cctcaggaat gtaggtgttt gctctgagta ggcctaccat agtatgtaat tctgctatct 240 tatgcaccga taatttttct tggttcagga gtgtttgatg tatgctccat agttgtctct 300 cattgtgctc tgctgtctca ttgatttctc taaggtttta acaaatttat ccatgtggtt 360 tttctctaat ttgaaatcaa attgcatgtc agacaagaag taatattttt gttggtagtg 420 tactgtggt 429 <210> 26 <211> 633 <212> DNA <213> Mus musculus <220> <221> misc_feature <222> (253)..(253) <223> n is a, c, g, or t <400> 26 tctaaccatg tgtgtttcct ttgaaataat tctatatact ccttttaatg aatttacatt 60 aaatcaatag cttgtattga caactatatt atcatcaaag cataaacaaa actttctttg 120 attccttgct tcagaaggct tgatcatttg tttcccaggg aaatggaata taggtaagga 180 caaagctatt taaacacaat tctctctttt aatgcaaact attacatcat gcagtttatt 240 tatattatga atncaaaatc agggatgaca tatataacat atggacatga atattactct 300 ttagatttca tattaaactt atcagttttt ttttatctca aagcatggaa tcaaattcaa 360 gacacagatg gacacaacat aagtttggaa tggcttttaa atatttttac aggaattttt 420 ccattttggc aaagtattta gtatatagtg agttgcttct atgattatat tagatgtgtt 480 tttgaagaat gttgttttgc taaattattc taacgctcaa tttacattct gaacattttc 540 aatctgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct gcggccgcac 600 gcgttctaac catgtgtgtt tctcttttgg act 633 <210> 27 <211> 440 <212> DNA <213> Mus musculus <400> 27 aacatgtatt tgtggagtgg ctaaattgag atatatcacc ttaaaatcaa ctcccagcaa 60 tttgaagagc acagtaagta agaccttgtt cctaaccaca gtcgccatgc agtgcagtag 120 agcccagatc ttacacttcc tgtgtaactg gagtcttgtg ttctttagcc aagctcttcc 180 cacatgcgag tcattttcaa ttcaaaatac tagttatttt cagtttaaga atcagtctga 240 tttcttgagc atagtgctta tcttatatgg tatggctttc agctccctgg agatttcctg 300 ggtgtgctgc tgtgcctttg cctccaggat aaatgccatg ctgagaagag catgactctg 360 tcagcacagg cagacggtgg aaactttacc tctgcgacct ctctgcagcc tcagggtagc 420 aggggatggc atggtttcat 440 <210> 28 <211> 475 <212> DNA <213> Mus musculus <400> 28 tgtatgccta aagggtttgc ttctatgtta attcccaaca acaatcatga tacttcctta 60 cttctgcagg actaggctgg ctcactagtg aggttttctc caaggatgtg ctccaatatc 120 tgctccacaa tacttaaata gcttcacaat acataaatat ttaagtactc ctctgtaagg 180 agcgttctgt ttccatatgt caaggcagaa tcttcacata aagcatgcat tttgctccct 240 gttttcaatg gttttactct gtagagtttc tcaaattaat tcaataccca ctttaaatta 300 aatggaaact ttaatgctat ggtttgctgt gccatttaga ttttatgtgt tgagatgcaa 360 ttccaactct acttggcacg aagtatagac actgaatcca actatgatgt ataagcaagg 420 gtccttgtga ggtaggtaat gagaatggag cctggaacgt gtaacactgg tgact 475 <210> 29 <211> 547 <212> DNA <213> Mus musculus <400> 29 tgcagattat aattctatgg aaactgactg ttttaaacat aaattttaga cctcttctca 60 aggtgtggca atcctcaaca gcttctggta tgcatagacc acatttgtat tcaccattaa 120 tgcataagaa aaacattttg gttgccagtt tggagctaaa ttgataaatc tgctacaagc 180 atttgtgcat gagtttgtgt gtaaatatgc tttttactta cttaggatga atatacaagg 240 atagcattgt tatattgctt gacatttgca tattcaattt tatagagaat gcacagcaat 300 tttggtatct gtctgtaccc tttcatattt tatgctcaac atttgagtca cttggtttct 360 tggcatcatt atgaattttt aatggtctta cttttaaaaa atatgcttta actcatctta 420 gaattatatc acatttcccc ttccagtctc tcctagacat ccctccctca aacagccctt 480 gtgtgctcct gccttcagtt catagcctgt tttactttat tattattatt gctctctgtg 540 tgtgcac 547 <210> 30 <400> 30 000 <210> 31 <211> 621 <212> DNA <213> Mus musculus <400> 31 gcttctgaat acctccacgc atacactcac ttaaattata aataaacctg aaaagcaatg 60 tagcaaaaat gaaagagatt tctgccacca gcttctataa ttatgtaatc ataatgtttt 120 gaaagttaaa ctcccctttt caacaagaaa attataatat atatgcatat atgcatatat 180 attcacacac ataacatata tttataaatc aatttaaact gcctttgtgc agtgtactag 240 gcaaaagtaa tgtatgtatc tatctctgtg aatgccctct aattctggaa ataaataatg 300 ggacatctca gtattttcaa gaagtctgta agccacaaat aggcttatgc ctattgttct 360 gtcataatta ttaatggtct agtacttggt ctcaagcatg tctggtatgg atgataaaac 420 taagagtcca aaaataggtc ccctgtgatc actatcagga aactcaaaag cacagaattc 480 atggagtatt tctaaccaga aacacaaaca ctacacatac tcatacacat atgtggatat 540 ctgttatata agatgtaact ttatataaaa cccctagtct ggtaatgttc ttaaccttat 600 ctggtgacgt tacatgacac a 621 <210> 32 <211> 312 <212> DNA <213> Mus musculus <400> 32 tactgtccag gccagctttg aacagactct gtattccaga aagactttca gcttgtgctt 60 cttttcccca aacctgcctt gagtagctga catcataggc ttgcactacc aggcctggct 120 taaaatacat actcccaatt tacatatctg atgagtaaca ttctcataga agcacaaaag 180 tacatacatg gattctaata taggttattt tcttgggcat tacacactac agatatacta 240 ttcaatatta tttgtggcct actagagact gagcctaagg ctataaacat gttagtcgtg 300 ctctaccagt ga 312 <210> 33 <211> 768 <212> DNA <213> Mus musculus <400> 33 tggaacttgg gacttctgag cacagggggt ggatggctgg aaatgtgagc agaacccatg 60 gtgtgagaac tgagataagt ttctgctgag gctagcctag aggcacaggt ggtgagacag 120 ctagggcaga acatatcagt gaatagtgta ggatgatgcc acttttaaaa tatttcccgc 180 aatatgaacc aatttctcaa aaggtataaa ttaccataac tctcttaaat acaaaatgag 240 taatctgaat agctgcaaat tgtaagaaaa ttgaacataa tcataaccca tcggcaaaaa 300 taaatctttg gggaaatgcc actttattag agaattctgc tatacatttg atgaatatat 360 tacaaagctt aaaaagctct gtgggtgttc attttgcata ttgaaaacta aaattttata 420 taagctaaaa aaggccaatt gtctctgtct gtctttctgt ctctatctct gtctctctct 480 gtctctctgt ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 540 ctctctccct ttctttttct ctctctgtgt atctaactat tcttcttttg caatttctga 600 aatttcttct ccagggcttt ctttcttcac aagtgtaagc acagcatgtg tgctcccact 660 gccaagatgc tgtgccatgc tataacttct ttttgacatc atatgtagct tatacatatt 720 aaaatttact tcagcactca acagtcacca ctgtcatgac tggaggtt 768 <210> 34 <211> 598 <212> DNA <213> Mus musculus <400> 34 ttggctttcc ttccaagttg tattttggtg aagtttgact cctggaatct cacttctgca 60 ctttagatta gcatacttta aaaaggaaca ttacagtaca atggaaaagt aaagatctgg 120 gttttatctc agctttagtt agtatttata ggaagcatgg attacataaa gagatgacat 180 tatttcagtc tgaaattgat ttgtactata cgacatttca ttttgtttgt gcacattgat 240 tagataattc ctcaaatcag tttgaaaatt tcatctctgt tcatagctga agataaccac 300 caaattgctt ttaactaatt tacataataa gtatagtaga ggtttattct atataaagta 360 tcaaatataa atattcatct caaattctaa aggatttagc aatgtaaatt acttatgaat 420 tacatacaca tttgtattta aatctttttt cacttttatt aaaaatagat ccttttctca 480 tacaatatat cctgattgca gttccctccc ctctactcct cccagttcct tcccacctcc 540 ctttccatct ggatctctct cctattaaag gttggacaga agagatggca ctgcatgt 598 <210> 35 <211> 795 <212> DNA <213> Mus musculus <400> 35 tggttagcac tattttgaat ggacacttct ataaaatttg ttttaaaaac aatatggaag 60 agtcataaga tgtctgggca cagtgccccc agtcaactca tcaatgggat tctggaatcc 120 aaaggttata tggtgtaaaa acacagagag caaaatgcac aaggatcttc atagaaccat 180 aatttttaaa aagcaaacac ttcccccaaa ggagcatgta agacaacttg aaggtattaa 240 aatgggattg tggttttatt agttagagaa catcatgcaa attatattat ctaggcatta 300 taatgcaaac tttaaaagga aatgctcatt atgtaatgtt aagtgaaaaa aatcaggcca 360 taaaatgaaa tgtgcattat gcatgcatat gatgaaaaga caagaaatag ataagaatat 420 gcagaaatac aaatagttgg ctgtggtgtg ggcttctggc ttgttttctg ttttaaagcc 480 attacatcat ctttccaatg acaaactaca ttttaagtta ttgaaaacaa aatctcgtta 540 gccttgtcct tgcataaatt cccagagaac acattattct tgttcccttc tacctctgct 600 acttgtcttt gatttggacc tgctccacct cctcttactt ttcagtcctg aactagatgg 660 aaaaaagaaa tagaccctca ggaaacaagg aagcaaaacc acccaactgt gtggaagccg 720 tgcattcaag ctgcaaacga gtggagtggc ttcaatacct taacttatcc ccattgttgc 780 aaagggagac ccaga 795 <210> 36 <211> 475 <212> DNA <213> Mus musculus <400> 36 tgtatgccta aagggtttgc ttctatgtta attcccaaca acaatcatga tacttcctta 60 cttctgcagg actaggctgg ctcactagtg aggttttctc caaggatgtg ctccaatatc 120 tgctccacaa tacttaaata gcttcacaat acataaatat ttaagtactc ctctgtaagg 180 agcgttctgt ttccatatgt caaggcagaa tcttcacata aagcatgcat tttgctccct 240 gttttcaatg gttttactct gtagagtttc tcaaattaat tcaataccca ctttaaatta 300 aatggaaact ttaatgctat ggtttgctgt gccatttaga ttttatgtgt tgagatgcaa 360 ttccaactct acttggcacg aagtatagac actgaatcca actatgatgt ataagcaagg 420 gtccttgtga ggtaggtaat gagaatggag cctggaacgt gtaacactgg tgact 475 <210> 37 <211> 546 <212> DNA <213> Mus musculus <400> 37 tgcagattat aattctatgg aactgactgt tttaaacata aattttagac ctcttctcaa 60 ggtgtggcaa tcctcaacag cttctggtat gcatagacca catttgtatt caccattaat 120 gcataagaaa aacattttgg ttgccagttt ggagctaaat tgataaatct gctacaagca 180 tttgtgcatg agtttgtgtg taaatatgct ttttacttac ttaggatgaa tatacaagga 240 tagcattgtt atattgcttg acatttgcat attcaatttt atagagaatg cacagcaatt 300 ttggtatctg tctgtaccct ttcatatttt atgctcaaca tttgagtcac ttggtttctt 360 ggcatcatta tgaattttta atggtcttac ttttaaaaaa tatgctttaa ctcatcttag 420 aattatatca catttcccct tccagtctct cctagacatc cctccctcaa acagcccttg 480 tgtgctcctg ccttcagttc atagcctgtt ttactttatt attattattg ctctctgtgt 540 gtgcac 546 <210> 38 <211> 655 <212> DNA <213> Mus musculus <400> 38 tccacttata ccccatcagc atctctatca ttgtctaaga catttttaat ttgaaataaa 60 tggggaaact cattatcatg gcctcaagga aatacagaaa ccaaggattg tccttttagt 120 gcacaggtgt cttctaaatt cacatattct ggatttaaca aggaaaataa aatctgacat 180 aggctgaatt tgaaaatggt aaggatattt ttaactaaac aaaaaaaata ggtaatagaa 240 catttcatat tgaactccca ggatagcatt tatcataatc caccagttga attattcatg 300 cgctgataaa taaccttagc ctccggcaca gtaatcctct cactgaataa tcaccagggc 360 tccctgcccg tggtgttttg ctttacaaca taaattttaa aattattctg tgttggcata 420 catatgtgaa agctcattaa cagatactgg cattctgatt ggtttggcac taaatttaaa 480 ctgttttgga aagaactgaa acactgaagg atatgccatt ctgtttcttt ataccttatc 540 gatgtttcct taacaatcgg ttgagattta tgcatctttt gatagatttt atctgagata 600 gctgatatgc attgtgatga gttccttttt aacgctgtaa tgtttcattg gccct 655 <210> 39 <211> 347 <212> DNA <213> Mus musculus <400> 39 aggcaccact ttaagggcct ttatcattat ccacaacagc agcagcagca tgagtagcat 60 taggaatgcg tttcctcctg tgctttgagg cttacgtagg tctttcttct gcatcgtttc 120 atgaaattct cacaagaaca ctatgaggta ggtgtcagat gtccatttta caggacagaa 180 aagagattaa aaaaaagaga gagagagagg aaaaagggct ttattcaaag ccaagtcagt 240 tcatatgggc agagccagga cttgaacgca ggccccacag tcttaactcc aatattttca 300 gctgccttgg gaacttcttg gaagagccca ttccattttc ctgccat 347 <210> 40 <211> 412 <212> DNA <213> Mus musculus <400> 40 gcggcaggaa tttaaagagg cagaagttca tttcctgtga tttatgggac tttgctgact 60 ttcacgctcc ggttctaggg acagggagac cctccctgcg ggagccgctg ctagagggaa 120 aggcagcgtt ggatcggatg ccggccccag cctgggagac gtgcttcctc tgcagcctgt 180 gatcaggagc gaagtgtaga gaccagaatc gttcagaggc agggctggtc cctgttgatt 240 tatgactcag gcaaacagtc cattcatccg tcagcggctc cacttctatc cccagcttac 300 tggaggcaga agaatgtccc ctggaagtgg tctgagctgc ttcctgtggt ggccccattc 360 ctccgggtgg gggatcctat ttttagaggg ccaccattgc catgaaggtc ca 412 <210> 41 <211> 740 <212> DNA <213> Mus musculus <400> 41 aggacaactt gacttatgca aatgaacaat ataaatttta gaactatgta taaataatta 60 aataagtaca tggacttaca ggaaggaatg aataccttca gagtatgctg tagtatattt 120 cctgaatgta tagattaagc tatataattg tcaatgagct gttgtattac gtataattca 180 gggtttaaac aaaataaaaa tgtgtgcata tgttttatgc aaatgcatgt atttttgaat 240 caatgataat cccacacttt ttataatgat tcatacccgc tcaaagtgat gaaaataatt 300 gacctgtaaa tgtttatttt taagtagaaa aaaatctctg tgaggctcag agaacatgtt 360 gatacagggg gagagggaat gtacagagta gcatgctctt gtaagttgct ccaaggcaac 420 gcatgactac tgcggtcttg acctaacagc tgcacagacc ttcagaagat tgtatccatc 480 tacatttcat tatggagcca agaatggctc atgaaacttc tgccctccct gggagcatgt 540 aggcagttaa tttgaatggt aattttatgt acaaggagat agaatatttt cagtgatgtc 600 accactggtt tgtcacaatg ctttctataa atgcccaaat cctgtaagta ttcttaatga 660 aaaccattga cttacgcact aataggaaat taaagtggaa acagatgttc tatttttatt 720 tatgctgctg tgatcaacac 740 <210> 42 <211> 440 <212> DNA <213> Mus musculus <400> 42 aacatgtatt tgtggagtgg ctaaattgag atatatcacc ttaaaatcaa ctcccagcaa 60 tttgaagagc acagtaagta agaccttgtt cctaaccaca gtcgccatgc agtgcagtag 120 agcccagatc ttacacttcc tgtgtaactg gagtcttgtg ttctttagcc aagctcttcc 180 cacatgcgag tcattttcaa ttcaaaatac tagttatttt cagtttaaga atcagtctga 240 tttcttgagc atagtgctta tcttatatgg tatggctttc agctccctgg agatttcctg 300 ggtgtgctgc tgtgcctttg cctccaggat aaatgccatg ctgagaagag catgactctg 360 tcagcacagg cagacggtgg aaactttacc tttgcgacct ctctgcagcc tcagggtagc 420 aggggatggc atggtttcat 440 <210> 43 <211> 390 <212> DNA <213> Mus musculus <400> 43 tctcaacact aagaaaactg cagtatgaag atatggaatt tgaggccagt ttgagataaa 60 acagaaagat atgagcaaaa gacaaggatg tgagaaacat aaataaaaac tatgcatatt 120 catgaagcac cgcataatag tttcatatgg atacacatcc catgatgttt aaagcaggct 180 tatcattttt atcttttcaa acatttaaca cttatgttaa tatatgtaaa ctcagtcatt 240 tttagccttc tgagagaacc tgcatcattt ttaatcactc ttccgttcag taggattctt 300 gaattattat catagttaac catagctgag taatcaaacc tcaattgtaa atttgaaaat 360 ttacccttct attcttttct tgcaataaaa 390 <210> 44 <211> 711 <212> DNA <213> Mus musculus <400> 44 caacaaacca gggaatctac tgtatagtga agcaggattg tgaaaaggcc attcatataa 60 gagaactcca gatggctgac acagatatgg tagtgttaaa tctttctgat aaccaagagg 120 ctcaagttaa actgagattt ccctttatac actgtgaatc tgtaaacatt acaaccttcc 180 agaataccaa gtactgtcta gactgagaca taagaacctt gttacaaggt gtgtggcttt 240 ctagaatgaa gtcagtttac aatatttgaa aaaaattagt atgcataccc tagacctagc 300 aatggcatct actgttactt tataggtatg ggaactggtg acagataaga ttcaatgtga 360 aaagaatgga taactaaaat atattggaag cacagtatga aataatatgc agtgggtagg 420 tggaatgagt gatgacgtat aactccatgc taactatagt gtggagagaa tgcaaagtac 480 gccagagaac aggatgtatt gttaagtatg taaattaatt ccatgcacat aataagctta 540 cttatttttt caatgacaaa tacatttata tattcaatga catgcatgga aatttctaga 600 atgtctagag cggaggaggg gaaatggatc tgagttcagg aatgaattag caaaagaata 660 aaaaatgcac atgtgaaggt attaacataa ggccttagaa gcctgtgtgt c 711 <210> 45 <211> 265 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_459m enhancer <400> 45 ctatgaatag ttacaagtga gaaagagaaa tggagatttt accatttaat catctccgaa 60 gagaaggtga gaagaaattg agaaaggtaa tttgcatacc atgcataggc attagagaaa 120 gcattttttt tcttaactct ccatttgttt acagatattt ccatatggcc ttttaaaaac 180 ttcaacagag aaattcgaac acaactaact ggaatttcaa ttttcatata aaaccagcat 240 catagatata tatgtagcta ctctc 265 <210> 46 <211> 251 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_453m enhancer <400> 46 attttaggat gttcttaaat agatcgattc ttctactttt tttaaaaata acatagatct 60 gaaaagcttt ataacttttg gttttttttt taaggaccat attaacagca tcttccagtt 120 tttctagagt aaatgaatat gtatcccttt tataattaac aatatacata tattcatttt 180 gtaaaaagac tataaaaata gaagagaaaa tgaagagatg tttatttctt ttacacgcat 240 cagactaagg a 251 <210> 47 <211> 195 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_462m enhancer <400> 47 ctgttctatc tattcctggg cttccaccac actgtgttaa tgaggataac tttaaaatac 60 atcttgatat ttagtagagc gcatttccac gcctgattca tcacgagcac cttaacttgt 120 cttggttctt ctgcggagat gttggcacca gcttcttcac ccgtgactcc agcttctggg 180 gaacctgtgc tctca 195 <210> 48 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_461m enhancer <400> 48 ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 60 cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 120 tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 180 agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 240 <210> 49 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_464m enhancer <400> 49 tttgtgtctg ctattgcatt tacatagtga cataggctta caggatattg taaatgtcat 60 ccctagatac atttatgtaa ccttttttta aaataaaact ctaacaaatg ttagttattg 120 tgcactatgg ttttgaatat ttgaatttgc tttgctcaga tctaaataac ttctgataag 180 tttggcattc aggaaagagt aaatgtaaat gtagaaatgc ttggaat 227 <210> 50 <211> 235 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_452m enhancer <400> 50 cattgactca tttttatttt gtgaggaaga aattttccat ttgtctgtgt aattacattt 60 gctaatttct aaaacaattc ctgggattta tatctatata tgcctcagga acatacaggg 120 aagatcatac tgttctctga atttcaaatt atgttttctg ttttatttca tgaatttatt 180 atttttcttt gtctctgtct gtctctctct gtgtgtatgt gtatgcgtgt atatg 235 <210> 51 <211> 213 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_451m enhancer <400> 51 ttttcattcc tggaggtaaa accaacctta gaatcgtgga gcctgataga ctttgaaatt 60 ggccttcatt ttaattctca agttcttagc atgagagcaa cattcaatat ggttctgaaa 120 tatctcatgc aaaaaagtgc cagagtcata gactgaaata tttatttgaa tataaatgaa 180 ctcagatttg ccaaaatgcg ctccccctgt tgt 213 <210> 52 <211> 278 <212> DNA <213> Artificial Sequence <220> <223> Core of eHGT_460m enhancer <400> 52 catgaacatt tagtcatcgt tatcttacat gagtcatatc tgtgtcctta ttgtcttatc 60 ttaaatgcat taattaattc gatagagcat ctataaaaat gaaacgctat tcaaaagctg 120 gcccatgaca agatcagtgt gttggtttct atgcctatag tggtgcaatg gaaggagtgc 180 gctgtacccc acagactttg tgattgatga gttgtctact ttattcacaa tgaagctaaa 240 aacaatctaa caaccatcag ggtgctacag cagcacag 278 <210> 53 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_459m <400> 53 ctatgaatag ttacaagtga gaaagagaaa tggagatttt accatttaat catctccgaa 60 gagaaggtga gaagaaattg agaaaggtaa tttgcatacc atgcataggc attagagaaa 120 gcattttttt tcttaactct ccatttgttt acagatattt ccatatggcc ttttaaaaac 180 ttcaacagag aaattcgaac acaactaact ggaatttcaa ttttcatata aaaccagcat 240 catagatata tatgtagcta ctctcctatg aatagttaca agtgagaaag agaaatggag 300 attttaccat ttaatcatct ccgaagagaa ggtgagaaga aattgagaaa ggtaatttgc 360 ataccatgca taggcattag agaaagcatt ttttttctta actctccatt tgtttacaga 420 tatttccata tggcctttta aaaacttcaa cagagaaatt cgaacacaac taactggaat 480 ttcaattttc atataaaacc agcatcatag atatatatgt agctactctc ctatgaatag 540 ttacaagtga gaaagagaaa tggagatttt accatttaat catctccgaa gagaaggtga 600 gaagaaattg agaaaggtaa tttgcatacc atgcataggc attagagaaa gcattttttt 660 tcttaactct ccatttgttt acagatattt ccatatggcc ttttaaaaac ttcaacagag 720 aaattcgaac acaactaact ggaatttcaa ttttcatata aaaccagcat catagatata 780 tatgtagcta ctctc 795 <210> 54 <211> 749 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_453m <400> 54 attttaggat gttcttaaat agatcgattc ttctactttt tttaaaaata acatagatct 60 gaaaagcttt ataacttttg gttttttttt taaggaccat attaacagca tcttccagtt 120 tttctagagt aaatgaatat gtatcccttt tataattaac aatatacata tattcatttt 180 gtaaaaagac tataaaaata gaagagaaaa tgaagagatg tttatttctt ttacacgcat 240 cagactaagg aattttagga tgttcttaaa tagatcgatt cttctacttt ttttaaaaat 300 aacatagatc tgaaaagctt tataactttt ggtttttttt ttaaggacca tattaacagc 360 atcttccagt ttttctagag taaatgaata tgtatccctt ttataattaa caatatacat 420 atattcattt tgtaaaaaga ctataaaaat agaagagaaa atgaagagat gtttatttct 480 tttacacgca tcagactaag gaattttagg atgttcttaa atagatcgat tcttctactt 540 tttttaaaaa taacatagat ctgaaaagct ttataacttt tggttttttt tttaaggacc 600 atattaacag catcttccag tttttctaga gtaaatgaat atgtatccct tttataatta 660 acaatataca tatattcatt ttgtaaaaag actataaaaa tagaagagaa aatgaagaga 720 tgtttatttc ttttacacgc atcagacta 749 <210> 55 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_462m <400> 55 ctgttctatc tattcctggg cttccaccac actgtgttaa tgaggataac tttaaaatac 60 atcttgatat ttagtagagc gcatttccac gcctgattca tcacgagcac cttaacttgt 120 cttggttctt ctgcggagat gttggcacca gcttcttcac ccgtgactcc agcttctggg 180 gaacctgtgc tctcactgtt ctatctattc ctgggcttcc accacactgt gttaatgagg 240 ataactttaa aatacatctt gatatttagt agagcgcatt tccacgcctg attcatcacg 300 agcaccttaa cttgtcttgg ttcttctgcg gagatgttgg caccagcttc ttcacccgtg 360 actccagctt ctggggaacc tgtgctctca ctgttctatc tattcctggg cttccaccac 420 actgtgttaa tgaggataac tttaaaatac atcttgatat ttagtagagc gcatttccac 480 gcctgattca tcacgagcac cttaacttgt cttggttctt ctgcggagat gttggcacca 540 gcttcttcac ccgtgactcc agcttctggg gaacctgtgc tctca 585 <210> 56 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_461m <400> 56 ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 60 cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 120 tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 180 agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 240 ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 300 cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 360 tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 420 agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 480 ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 540 cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 600 tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 660 agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 720 <210> 57 <211> 681 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_464m <400> 57 tttgtgtctg ctattgcatt tacatagtga cataggctta caggatattg taaatgtcat 60 ccctagatac atttatgtaa ccttttttta aaataaaact ctaacaaatg ttagttattg 120 tgcactatgg ttttgaatat ttgaatttgc tttgctcaga tctaaataac ttctgataag 180 tttggcattc aggaaagagt aaatgtaaat gtagaaatgc ttggaatttt gtgtctgcta 240 ttgcatttac atagtgacat aggcttacag gatattgtaa atgtcatccc tagatacatt 300 tatgtaacct ttttttaaaa taaaactcta acaaatgtta gttattgtgc actatggttt 360 tgaatatttg aatttgcttt gctcagatct aaataacttc tgataagttt ggcattcagg 420 aaagagtaaa tgtaaatgta gaaatgcttg gaattttgtg tctgctattg catttacata 480 gtgacatagg cttacaggat attgtaaatg tcatccctag atacatttat gtaacctttt 540 tttaaaataa aactctaaca aatgttagtt attgtgcact atggttttga atatttgaat 600 ttgctttgct cagatctaaa taacttctga taagtttggc attcaggaaa gagtaaatgt 660 aaatgtagaa atgcttggaa t 681 <210> 58 <211> 705 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_452m <400> 58 cattgactca tttttatttt gtgaggaaga aattttccat ttgtctgtgt aattacattt 60 gctaatttct aaaacaattc ctgggattta tatctatata tgcctcagga acatacaggg 120 aagatcatac tgttctctga atttcaaatt atgttttctg ttttatttca tgaatttatt 180 atttttcttt gtctctgtct gtctctctct gtgtgtatgt gtatgcgtgt atatgcattg 240 actcattttt attttgtgag gaagaaattt tccatttgtc tgtgtaatta catttgctaa 300 tttctaaaac aattcctggg atttatatct atatatgcct caggaacata cagggaagat 360 catactgttc tctgaatttc aaattatgtt ttctgtttta tttcatgaat ttattatttt 420 tctttgtctc tgtctgtctc tctctgtgtg tatgtgtatg cgtgtatatg cattgactca 480 tttttatttt gtgaggaaga aattttccat ttgtctgtgt aattacattt gctaatttct 540 aaaacaattc ctgggattta tatctatata tgcctcagga acatacaggg aagatcatac 600 tgttctctga atttcaaatt atgttttctg ttttatttca tgaatttatt atttttcttt 660 gtctctgtct gtctctctct gtgtgtatgt gtatgcgtgt atatg 705 <210> 59 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_451m <400> 59 ttttcattcc tggaggtaaa accaacctta gaatcgtgga gcctgataga ctttgaaatt 60 ggccttcatt ttaattctca agttcttagc atgagagcaa cattcaatat ggttctgaaa 120 tatctcatgc aaaaaagtgc cagagtcata gactgaaata tttatttgaa tataaatgaa 180 ctcagatttg ccaaaatgcg ctccccctgt tgtttttcat tcctggaggt aaaaccaacc 240 ttagaatcgt ggagcctgat agactttgaa attggccttc attttaattc tcaagttctt 300 agcatgagag caacattcaa tatggttctg aaatatctca tgcaaaaaag tgccagagtc 360 atagactgaa atatttattt gaatataaat gaactcagat ttgccaaaat gcgctccccc 420 tgttgttttt cattcctgga ggtaaaacca accttagaat cgtggagcct gatagacttt 480 gaaattggcc ttcattttaa ttctcaagtt cttagcatga gagcaacatt caatatggtt 540 ctgaaatatc tcatgcaaaa aagtgccaga gtcatagact gaaatattta tttgaatata 600 aatgaactca gatttgccaa aatgcgctcc ccctgttgt 639 <210> 60 <211> 834 <212> DNA <213> Artificial Sequence <220> <223> 3xcore2_eHGT_460m <400> 60 catgaacatt tagtcatcgt tatcttacat gagtcatatc tgtgtcctta ttgtcttatc 60 ttaaatgcat taattaattc gatagagcat ctataaaaat gaaacgctat tcaaaagctg 120 gcccatgaca agatcagtgt gttggtttct atgcctatag tggtgcaatg gaaggagtgc 180 gctgtacccc acagactttg tgattgatga gttgtctact ttattcacaa tgaagctaaa 240 aacaatctaa caaccatcag ggtgctacag cagcacagca tgaacattta gtcatcgtta 300 tcttacatga gtcatatctg tgtccttatt gtcttatctt aaatgcatta attaattcga 360 tagagcatct ataaaaatga aacgctattc aaaagctggc ccatgacaag atcagtgtgt 420 tggtttctat gcctatagtg gtgcaatgga aggagtgcgc tgtaccccac agactttgtg 480 attgatgagt tgtctacttt attcacaatg aagctaaaaa caatctaaca accatcaggg 540 tgctacagca gcacagcatg aacatttagt catcgttatc ttacatgagt catatctgtg 600 tccttattgt cttatcttaa atgcattaat taattcgata gagcatctat aaaaatgaaa 660 cgctattcaa aagctggccc atgacaagat cagtgtgttg gtttctatgc ctatagtggt 720 gcaatggaag gagtgcgctg taccccacag actttgtgat tgatgagttg tctactttat 780 tcacaatgaa gctaaaaaca atctaacaac catcagggtg ctacagcagc acag 834 <210> 61 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Beta-Globin Minimal Promoter <400> 61 gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt ctg 53 <210> 62 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> minCMV Promoter <400> 62 gaggtaggcg tgtacggtgg gaggcctata taagcagagc tcgtttagtg aaccgtcaga 60 tcgcctgg 68 <210> 63 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> mutated minCMV Promoter <400> 63 gaggtaggcg tgtacggtgg gaggcctata taagcagagc tggtttagtg aaccgtcaga 60 tcgcctgg 68 <210> 64 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> minRho Promoter <400> 64 gattcagccg ggagcttagg gaggggaggt cacttcataa gggcctgggg ggggagttgg 60 agccacgagt cgtccagccg gagccccgtg tggctgagct ccggcctcag aagcatcccc 120 <210> 65 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> minRho* Promoter <400> 65 gattcagccg ggagcttagg gaggggaggt cacttcataa gggcttgggg ggggagttgg 60 agccacgagt cgtccagccg gagccccgtg tggctgtgct ccggcctcag aagcatcccc 120 <210> 66 <211> 867 <212> DNA <213> Artificial Sequence <220> <223> Hsp68 minimal promoter <400> 66 caggaacatc caaactgagc agccggggtc ccccccaccc cccaccccgc cccacgcggc 60 aactttgagc ctgtgctggg acagagcctc tagttcctaa attagtccat gaggtcagag 120 gcagcactgc cattgtaacg cgattggaga ggatcacgtc accggacacg cccccaggca 180 tctccctggg tctcctaaac ttggcgggga gaagttttag cccttaagtt ttagccttta 240 acccccatat tcagaactgt gcgagttggc gaaaccccac aaatcacaac aaactgtaca 300 caacaccgag ctagaggtga tctttcttgt ccattccaca caggccttag taatgcgtcg 360 ccatagcaac agtgtcacta gtagcaccag cacttcccca caccctcccc ctcaggaatc 420 cgtactctcc agtgaacccc agaaacctct ggagagttct ggacaagggc ggaacccaca 480 actccgatta ctcaagggag gcggggaagc tccaccagac gcgaaactgc tggaagattc 540 ctggccccaa ggcctcctcc ggctcgctga ttggcccagc ggagagtggg cggggccggt 600 gaagactcct taaaggcgca gggcggcgag caggtcacca gacgctgaca gctactcaga 660 accaaatctg gttccatcca gagacaagcg aagacaagag aagcagagcg agcggcgcgt 720 tcccgatcct cggccaggac cagccttccc cagagcatcc ctgccgcgga gcgcaacctt 780 cccaggagca tccctgccgc ggagcgcaac tttccccgga gcatccacgc cgcggagcgc 840 agccttccag aagcagagcg cggcgcc 867 <210> 67 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> SYFP2 <400> 67 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 480 ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagct accagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 <210> 68 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> EGFP <400> 68 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 <210> 69 <211> 1299 <212> DNA <213> Artificial Sequence <220> <223> Optimized Flp recombinase (FlpO) <400> 69 atggctccta agaagaagag gaaggtgatg agccagttcg acatcctgtg caagaccccc 60 cccaaggtgc tggtgcggca gttcgtggag agattcgaga ggcccagcgg cgagaagatc 120 gccagctgtg ccgccgagct gacctacctg tgctggatga tcacccacaa cggcaccgcc 180 atcaagaggg ccaccttcat gagctacaac accatcatca gcaacagcct gagcttcgac 240 atcgtgaaca agagcctgca gttcaagtac aagacccaga aggccaccat cctggaggcc 300 agcctgaaga agctgatccc cgcctgggag ttcaccatca tcccttacaa cggccagaag 360 caccagagcg acatcaccga catcgtgtcc agcctgcagc tgcagttcga gagcagcgag 420 gaggccgaca agggcaacag ccacagcaag aagatgctga aggccctgct gtccgagggc 480 gagagcatct gggagatcac cgagaagatc ctgaacagct tcgagtacac cagcaggttc 540 accaagacca agaccctgta ccagttcctg ttcctggcca cattcatcaa ctgcggcagg 600 ttcagcgaca tcaagaacgt ggaccccaag agcttcaagc tggtgcagaa caagtacctg 660 ggcgtgatca ttcagtgcct ggtgaccgag accaagacaa gcgtgtccag gcacatctac 720 tttttcagcg ccagaggcag gatcgacccc ctggtgtacc tggacgagtt cctgaggaac 780 agcgagcccg tgctgaagag agtgaacagg accggcaaca gcagcagcaa caagcaggag 840 taccagctgc tgaaggacaa cctggtgcgc agctacaaca aggccctgaa gaagaacgcc 900 ccctacccca tcttcgctat caagaacggc cctaagagcc acatcggcag gcacctgatg 960 accagctttc tgagcatgaa gggcctgacc gagctgacaa acgtggtggg caactggagc 1020 gacaagaggg cctccgccgt ggccaggacc acctacaccc accagatcac cgccatcccc 1080 gaccactact tcgccctggt gtccaggtac tacgcctacg accccatcag caaggagatg 1140 atcgccctga aggacgagac caaccccatc gaggagtggc agcacatcga gcagctgaag 1200 ggcagcgccg agggcagcat cagatacccc gcctggaacg gcatcatcag ccaggaggtg 1260 ctggactacc tgagcagcta catcaacagg cggatctga 1299 <210> 70 <211> 1056 <212> DNA <213> Artificial Sequence <220> <223> Improved Cre recombinase (iCre) <400> 70 atggtgccca agaagaagag gaaagtctcc aacctgctga ctgtgcacca aaacctgcct 60 gccctccctg tggatgccac ctctgatgaa gtcaggaaga acctgatgga catgttcagg 120 gacaggcagg ccttctctga acacacctgg aagatgctcc tgtctgtgtg cagatcctgg 180 gctgcctggt gcaagctgaa caacaggaaa tggttccctg ctgaacctga ggatgtgagg 240 gactacctcc tgtacctgca agccagaggc ctggctgtga agaccatcca acagcacctg 300 ggccagctca acatgctgca caggagatct ggcctgcctc gcccttctga ctccaatgct 360 gtgtccctgg tgatgaggag aatcagaaag gagaatgtgg atgctgggga gagagccaag 420 caggccctgg cctttgaacg cactgacttt gaccaagtca gatccctgat ggagaactct 480 gacagatgcc aggacatcag gaacctggcc ttcctgggca ttgcctacaa caccctgctg 540 cgcattgccg aaattgccag aatcagagtg aaggacatct cccgcaccga tggtgggaga 600 atgctgatcc acattggcag gaccaagacc ctggtgtcca cagctggtgt ggagaaggcc 660 ctgtccctgg gggttaccaa gctggtggag agatggatct ctgtgtctgg tgtggctgat 720 gaccccaaca actacctgtt ctgccgggtc agaaagaatg gtgtggctgc cccttctgcc 780 acctcccaac tgtccacccg ggccctggaa gggatctttg aggccaccca ccgcctgatc 840 tatggtgcca aggatgactc tgggcagaga tacctggcct ggtctggcca ctctgccaga 900 gtgggtgctg ccagggacat ggccagggct ggtgtgtcca tccctgaaat catgcaggct 960 ggtggctgga ccaatgtgaa cattgtgatg aactacatca gaaacctgga ctctgagact 1020 ggggccatgg tgaggctgct cgaggatggg gactaa 1056 <210> 71 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> SP10 insulator (SP10ins) <400> 71 gaagctaccc ctaacacact attctacaca cagaaaatgc tcttcactag 50 <210> 72 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> 3xSP10ins <400> 72 gaagctaccc ctaacacact attctacaca cagaaaatgc tcttcactag gaagctaccc 60 ctaacacact attctacaca cagaaaatgc tcttcactag gaagctaccc ctaacacact 120 attctacaca cagaaaatgc tcttcactag 150 <210> 73 <211> 246 <212> DNA <213> Artificial Sequence <220> <223> WPRE3 <400> 73 ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 60 ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 120 gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 180 tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 240 ccgtgg 246 <210> 74 <211> 609 <212> DNA <213> Artificial Sequence <220> <223> WPRE <400> 74 gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa 60 ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat 120 tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta 180 tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc 240 aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt 300 ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg 360 ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc 420 ttggctgctc gcctatgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 480 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 540 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca 600 tcgataccg 609 <210> 75 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> BGHpA <400> 75 cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60 ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120 gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180 attgggaaga caatagcagg catg 204 <210> 76 <211> 479 <212> DNA <213> Artificial Sequence <220> <223> HGHpA <400> 76 acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 60 cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 120 ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga 180 caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt 240 ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt 300 tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac 360 ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac 420 cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt 479 <210> 77 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> P2A <400> 77 ggcagcggcg ccaccaactt cagcctgctg aagcaggccg gcgacgtgga ggagaacccc 60 ggccccggag ctagcgga 78 <210> 78 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> T2A <220> <221> MISC_FEATURE <222> (1)..(3) <223> (GlySerGly) residues can be added to the 5' end of the peptide to improve cleavage efficiency <400> 78 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 79 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> E2A <220> <221> MISC_FEATURE <222> (1)..(3) <223> (GlySerGly) residues can be added to the 5' end of the peptide to improve cleavage efficiency <400> 79 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro Pro 20 <210> 80 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> F2A <220> <221> MISC_FEATURE <222> (1)..(3) <223> (GlySerGly) residues can be added to the 5' end of the peptide to improve cleavage efficiency <400> 80 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 81 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Exemplary Plasmid Backbone 1 - Left ITR <400> 81 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 82 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Exemplary Plasmid Backbone 1 - Right ITR <400> 82 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 83 <211> 146 <212> DNA <213> Artificial Sequence <220> <223> Exemplary Plasmid Backbone 2 - Left ITR: <400> 83 catgtcctgc aggcagctgc gcgctcgctc gctcactgag gccgcccggg caaagcccgg 60 gcgtcgggcg acctttggtc gcccggcctc agtgagcgag cgagcgcgca gagagggagt 120 ggccaactcc atcactaggg gttcct 146 <210> 84 <211> 149 <212> DNA <213> Artificial Sequence <220> <223> Exemplary Plasmid Backbone 2 - Right ITR: <400> 84 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag gggcgcctg 149 <210> 85 <211> 743 <212> PRT <213> Artificial Sequence <220> <223> PHP.eB capsid <400> 85 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Asp Gly Thr Leu Ala Val 580 585 590 Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile 595 600 605 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro 625 630 635 640 Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp 660 665 670 Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe 705 710 715 720 Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 86 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV9 VP1 capsid protein <400> 86 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 87 <211> 747 <212> DNA <213> Artificial Sequence <220> <223> tet-Transactivator version 2 (tTA2) <400> 87 atgtctagac tggacaagag caaagtcata aactctgctc tggaattact caatgaagtc 60 ggtatcgaag gcctgacgac aaggaaactc gctcaaaagc tgggagttga gcagcctacc 120 ctgtactggc acgtgaagaa caagcgggcc ctgctcgatg ccctggcaat cgagatgctg 180 gacaggcatc atacccactt ctgccccctg gaaggcgagt catggcaaga ctttctgcgg 240 aacaacgcca agtcattccg ctgtgctctc ctctcacatc gcgacggggc taaagtgcat 300 ctcggcaccc gcccaacaga gaaacagtac gaaaccctgg aaaatcagct cgcgttcctg 360 tgtcagcaag gcttctccct ggagaacgca ctgtacgctc tgtccgccgt gggccacttt 420 acactgggct gcgtattgga ggatcaggag catcaagtag caaaagagga aagagagaca 480 cctaccaccg attctatgcc cccacttctg agacaagcaa ttgagctgtt cgaccatcag 540 ggagccgaac ctgccttcct tttcggcctg gaactaatca tatgtggcct ggagaaacag 600 ctaaagtgcg aaagcggcgg gccggccgac gcccttgacg attttgactt agacatgctc 660 ccagccgatg cccttgacga ctttgacctt gatatgctgc ctgctgacgc tcttgacgat 720 tttgaccttg acatgctccc cgggtaa 747 <210> 88 <211> 189 <212> PRT <213> Homo sapiens <400> 88 Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Gly Val Gly Lys 1 5 10 15 Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr 20 25 30 Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly 35 40 45 Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr 50 55 60 Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys 65 70 75 80 Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His Gln Tyr 85 90 95 Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Asp Asp Val Pro Met Val 100 105 110 Leu Val Gly Asn Lys Cys Asp Leu Ala Ala Arg Thr Val Glu Ser Arg 115 120 125 Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Tyr Ile Glu Thr 130 135 140 Ser Ala Lys Thr Arg Gln Gly Val Glu Asp Ala Phe Tyr Thr Leu Val 145 150 155 160 Arg Glu Ile Arg Gln His Lys Leu Arg Lys Leu Asn Pro Pro Asp Glu 165 170 175 Ser Gly Pro Gly Cys Met Ser Cys Lys Cys Val Leu Ser 180 185 <210> 89 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> GCaMP6m <400> 89 atgggttctc atcatcatca tcatcatggt atggctagca tgactggtgg acagcaaatg 60 ggtcgggatc tgtacgacga tgacgataag gatctcgcca ccatggtcga ctcatcacgt 120 cgtaagtgga ataagacagg tcacgcagtc agagctatag gtcggctgag ctcactcgag 180 aacgtctata tcaaggccga caagcagaag aacggcatca aggcgaactt caagatccgc 240 cacaacatcg aggacggcgg cgtgcagctc gcctaccact accagcagaa cacccccatc 300 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcgtgcagtc caaactttcg 360 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 420 atcactctcg gcatggacga gctgtacaag ggcggtaccg gagggagcat ggtgagcaag 480 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 540 ggccacaagt tcagcgtgtc cggcgagggt gagggcgatg ccacctacgg caagctgacc 600 ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 660 ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 720 ttcaagtccg ccatgcccga aggctacatc caggagcgca ccatcttctt caaggacgac 780 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 840 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 900 aacctgccgg accaactgac tgaagagcag atcgcagaat ttaaagaggc tttctcccta 960 tttgacaagg acggggatgg gacaataaca accaaggagc tggggacggt gatgcggtct 1020 ctggggcaga accccacaga agcagagctg caggacatga tcaatgaagt agatgccgac 1080 ggtgacggca caatcgactt ccctgagttc ctgacaatga tggcaagaaa agggagctac 1140 agggacacgg aagaagaaat tagagaagcg ttcggtgtgt ttgataagga tggcaatggc 1200 tacatcagtg cagcagagct tcgccacgtg atgacaaacc ttggagagaa gttaacagat 1260 gaagaggttg atgaaatgat cagggaagca gacatcgatg gggatggtca ggtaaactac 1320 gaagagtttg tacaaatgat gacagcgaag tga 1353 <210> 90 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> GCaMP6s <400> 90 atgggttctc atcatcatca tcatcatggt atggctagca tgactggtgg acagcaaatg 60 ggtcgggatc tgtacgacga tgacgataag gatctcgcca ccatggtcga ctcatcacgt 120 cgtaagtgga ataagacagg tcacgcagtc agagctatag gtcggctgag ctcactcgag 180 aacgtctata tcaaggccga caagcagaag aacggcatca aggcgaactt ccacatccgc 240 cacaacatcg aggacggcgg cgtgcagctc gcctaccact accagcagaa cacccccatc 300 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcgtgcagtc caaactttcg 360 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 420 atcactctcg gcatggacga gctgtacaag ggcggtaccg gagggagcat ggtgagcaag 480 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 540 ggccacaagt tcagcgtgtc cggcgagggt gagggcgatg ccacctacgg caagctgacc 600 ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 660 ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 720 ttcaagtccg ccatgcccga aggctacatc caggagcgca ccatcttctt caaggacgac 780 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 840 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 900 aacctgccgg accaactgac tgaagagcag atcgcagaat ttaaagaggc tttctcccta 960 tttgacaagg acggggatgg gacaataaca accaaggagc tggggacggt gatgcggtct 1020 ctggggcaga accccacaga agcagagctg caggacatga tcaatgaagt agatgccgac 1080 ggtgacggca caatcgactt ccctgagttc ctgacaatga tggcaagaaa aatgaaatac 1140 agggacacgg aagaagaaat tagagaagcg ttcggtgtgt ttgataagga tggcaatggc 1200 tacatcagtg cagcagagct tcgccacgtg atgacaaacc ttggagagaa gttaacagat 1260 gaagaggttg atgaaatgat cagggaagca gacatcgatg gggatggtca ggtaaactac 1320 gaagagtttg tacaaatgat gacagcgaag tga 1353 <210> 91 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> GCaMP6f <400> 91 atgggttctc atcatcatca tcatcatggt atggctagca tgactggtgg acagcaaatg 60 ggtcgggatc tgtacgacga tgacgataag gatctcgcca ccatggtcga ctcatcacgt 120 cgtaagtgga ataagacagg tcacgcagtc agagctatag gtcggctgag ctcactcgag 180 aacgtctata tcaaggccga caagcagaag aacggcatca aggcgaactt caagatccgc 240 cacaacatcg aggacggcgg cgtgcagctc gcctaccact accagcagaa cacccccatc 300 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcgtgcagtc caaactttcg 360 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 420 atcactctcg gcatggacga gctgtacaag ggcggtaccg gagggagcat ggtgagcaag 480 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 540 ggccacaagt tcagcgtgtc cggcgagggt gagggcgatg ccacctacgg caagctgacc 600 ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 660 ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 720 ttcaagtccg ccatgcccga aggctacatc caggagcgca ccatcttctt caaggacgac 780 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 840 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 900 aacctgccgg accaactgac tgaagagcag atcgcagaat ttaaagagga attctcccta 960 tttgacaagg acggggatgg gacaataaca accaaggagc tggggacggt gatgcggtct 1020 ctggggcaga accccacaga agcagagctg caggacatga tcaatgaagt agatgccgac 1080 ggtgacggca caatcgactt ccctgagttc ctgacaatga tggcaagaaa aatgaaatac 1140 agggacacgg aagaagaaat tagagaagcg ttcggtgtgt ttgataagga tggcaatggc 1200 tacatcagtg cagcagagct tcgccacgtg atgacaaacc ttggagagaa gttaacagat 1260 gaagaggttg atgaaatgat cagggaagca gacatcgatg gggatggtca ggtaaactac 1320 gaagagtttg tacaaatgat gacagcgaag tga 1353 <210> 92 <211> 1842 <212> DNA <213> Artificial Sequence <220> <223> CN2248 <400> 92 gcggccgcac gcgtttccgc gtagacctgg ggtacttttc taagacaccc tttattgttt 60 gttcctaacc ctagccctgt atccatgcag cgttctccat cacctatgta aaacttagca 120 gatctgagtc ttcctctgag gaaacaacat cctgtgctgt tagactgtat tttccgtctc 180 cagattctct acttcgtccc ttcccccgcc ccaatttccc tgtctccagc gagcaatatt 240 atctttcatc tgagcctctc tccctgcctc cagtgactgc ctcccctgat gaattctctc 300 cgggtgactt tggcatttgc atatttcctc gcttggatat tctgagatgt tggaaccgga 360 gagcaggttg acgcgatcag gtacttagct gaacgaggct ttctcgggaa ctgcacaaat 420 atttggagtc gggcatgtgc caataggcaa ttaattgaaa tgtggacaca gcaagcttcc 480 ggaggaggga agctgaagga gctcgggctg ggcataaaag tcagggcaga gccatctatt 540 gcttacattt gcttctggga tccagatctt tcgaagctag cgctaccggt cgccaccatg 600 gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 660 gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 720 aagctgaccc tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 780 gtgaccaccc tgggctacgg cgtgcagtgc ttcgcccgct accccgacca catgaagcag 840 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 900 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 960 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 1020 ctggagtaca actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc 1080 atcaaggcca acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac 1140 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 1200 ctgagctacc agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg 1260 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc 1320 gacggcgcgc cgcggccgcg aattcgatat cataatcaac ctctggatta caaaatttgt 1380 gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 1440 ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 1500 aaatcctggt tagttcttgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 1560 acaggggctc ggctgttggg cactgacaat tccgtggctc gagagatctt cgactgtgcc 1620 ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 1680 tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 1740 gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 1800 caatagcagg catgagatct cacgtgcgga ccgagcggcc gc 1842 <210> 93 <211> 1973 <212> DNA <213> Artificial Sequence <220> <223> CN2249 <400> 93 gcggccgcac gcgtgctaaa gacaacattg gcctgaaatt caggagacct aagttctaga 60 tcaatctgtg gcatggtctt agaccacaga tgggctttcc tgcctgcatt tacccaaaga 120 gcccaaagag gagaccacat ggggtaccat gggactgacc ttcccagttc aaagcttctt 180 tacacaacgc tgctgaatca cccgctagct cgctctctta tcattccttt tcattcctgg 240 aggtaaaacc aaccttagaa tcgtggagcc tgatagactt tgaaattggc cttcatttta 300 attctcaagt tcttagcatg agagcaacat tcaatatggt tctgaaatat ctcatgcaaa 360 aaagtgccag agtcatagac tgaaatattt atttgaatat aaatgaactc agatttgcca 420 aaatgcgctc cccctgttgt catggacaca gatgcctgcc tttctgattt gcattttgct 480 ctaatgggta taatgtgttt cagctcctca ttggtgctgg gattggattt gagaaactca 540 ccagtccatg agttccccca aaatgtcagc cagtgggaaa cttttgtgtc tttgattctg 600 tttcatctag ccagctggaa acagactgcg agctcgggct gggcataaaa gtcagggcag 660 agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 720 tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 780 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 840 ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 900 ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 960 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 1020 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 1080 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1140 tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 1200 agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1260 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1320 acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1380 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1440 acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1500 acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1560 gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1620 cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1680 cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1740 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1800 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 1860 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 1920 gattgggaag acaatagcag gcatgagatc tcacgtgcgg accgagcggc cgc 1973 <210> 94 <211> 2027 <212> DNA <213> Artificial Sequence <220> <223> CN2250 <400> 94 gcggccgcac gcgttgctca gaaactggcc tcgatgctgt cctgctttca ccaattaata 60 atatatgtgg agaccgttct ctactggcat atgtgtgtgc atcacataat tatatgtata 120 tatgcaatcc tttttcttgt tgtcttttag agtcaattct atatatatat tttttattaa 180 gacatttaaa agttccaaag taaaaataac aaaatcaagg atacattgac tcatttttat 240 tttgtgagga agaaattttc catttgtctg tgtaattaca tttgctaatt tctaaaacaa 300 ttcctgggat ttatatctat atatgcctca ggaacataca gggaagatca tactgttctc 360 tgaatttcaa attatgtttt ctgttttatt tcatgaattt attatttttc tttgtctctg 420 tctgtctctc tctgtgtgta tgtgtatgcg tgtatatgca cgcatgtgct gtgcacttgt 480 gtgtatacat ttttttgcac gtgagaagtg tacctacgag gctgtgcctg ggtgtggaag 540 cccagggttg gtggggaaga ccatactcca aggctctcca accttattca gtgaggcagg 600 cagtcacatc tgtctgacat ttctgatcat tacacgtgtg cagtgggtgt tttatccacc 660 gagccacctt cccagccatg gatgagctcg ggctgggcat aaaagtcagg gcagagccat 720 ctattgctta catttgcttc tgggatccag atctttcgaa gctagcgcta ccggtcgcca 780 ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 840 acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 900 acggcaagct gaccctgaag ctgatctgca ccaccggcaa gctgcccgtg ccctggccca 960 ccctcgtgac caccctgggc tacggcgtgc agtgcttcgc ccgctacccc gaccacatga 1020 agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 1080 tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 1140 tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 1200 acaagctgga gtacaactac aacagccaca acgtctatat caccgccgac aagcagaaga 1260 acggcatcaa ggccaacttc aagatccgcc acaacatcga ggacggcggc gtgcagctcg 1320 ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 1380 actacctgag ctaccagtcc aagctgagca aagaccccaa cgagaagcgc gatcacatgg 1440 tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt 1500 aagtcgacgg cgcgccgcgg ccgcgaattc gatatcataa tcaacctctg gattacaaaa 1560 tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 1620 ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 1680 tgtataaatc ctggttagtt cttgccacgg cggaactcat cgccgcctgc cttgcccgct 1740 gctggacagg ggctcggctg ttgggcactg acaattccgt ggctcgagag atcttcgact 1800 gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 1860 gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 1920 agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 1980 gaagacaata gcaggcatga gatctcacgt gcggaccgag cggccgc 2027 <210> 95 <211> 2079 <212> DNA <213> Artificial Sequence <220> <223> CN2251 <400> 95 gcggccgcac gcgttcacaa atcagtaaga attacactcc aaaaataaaa cagggaaggg 60 tattagtatg tgatacgcat ggataaagta gaagaggcca aaaatacaaa gaaccgtaaa 120 ctcactagtg atggaagaaa cgctaattaa aataatgagc tttcctgacc ctttatcaca 180 tgggcacatt ttcaaaggac aagactctgc tgaggagaac acagaacagg atccttcaga 240 caagcttcag caaccaattt taggatgttc ttaaatagat cgattcttct acttttttta 300 aaaataacat agatctgaaa agctttataa cttttggttt ttttttaagg accatattaa 360 cagcatcttc cagtttttct agagtaaatg aatatgtatc ccttttataa ttaacaatat 420 acatatattc attttgtaaa aagactataa aaatagaaga gaaaatgaag agatgtttat 480 ttcttttaca cgcatcagac taaggccttc agctcagcag ggggcagagt ttatcatctg 540 tactctctga agtgtcacac tgccctgcct ttgtgtgccc ttgcctgtcc ctctgtgacg 600 gtcacccttt cggttctggc ttggagcctg gtcatcagtg cctggcggcc tgtgcctggg 660 ctgtgctgag ctcatttggt cgttgtccta gtgatgtgac cctaccttag acttccccat 720 ctcttgaggt ggctagagct cgggctgggc ataaaagtca gggcagagcc atctattgct 780 tacatttgct tctgggatcc agatctttcg aagctagcgc taccggtcgc caccatggtg 840 agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 900 gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 960 ctgaccctga agctgatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 1020 accaccctgg gctacggcgt gcagtgcttc gcccgctacc ccgaccacat gaagcagcac 1080 gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 1140 gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 1200 cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1260 gagtacaact acaacagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 1320 aaggccaact tcaagatccg ccacaacatc gaggacggcg gcgtgcagct cgccgaccac 1380 taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1440 agctaccagt ccaagctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 1500 gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgac 1560 ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc tggattacaa aatttgtgaa 1620 agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 1680 atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 1740 tcctggttag ttcttgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 1800 ggggctcggc tgttgggcac tgacaattcc gtggctcgag agatcttcga ctgtgccttc 1860 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 1920 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 1980 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 2040 tagcaggcat gagatctcac gtgcggaccg agcggccgc 2079 <210> 96 <211> 1830 <212> DNA <213> Artificial Sequence <220> <223> CN2252 <400> 96 gcggccgcac gcgtacggat gtcaagttag gcaaaagttt catataaatg tggttaaagt 60 aattctaaag tttgttttta catcacagaa ctgagcaaat gaacaaatgt aatgataaca 120 ttgggagctg attattctga gcaaacagca gagaaatcca aatccagaca gttgggggga 180 aagccacagc tactcagaaa acacactgtg atggaaaaca acctacaggt tattattaga 240 ctaaagagac ataaaattag atatgccact tccagagact ataggttaga cgataatata 300 tgctgagtga agtgccctgt tttggtaact gcagtaaggc tgtgtatcag aatgttccta 360 gctacatatt taggtgtaaa gcagagtgag tcaaaatata ttccagggtt aaaaaaaaaa 420 aaaacaatct ttacttctct tttctttaaa ctaaataatt tcaattattc tcctatgttt 480 agggaggagc tcgggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540 ttctgggatc cagatctttc gaagctagcg ctaccggtcg ccaccatggt gagcaagggc 600 gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 660 cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 720 aagctgatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 780 ggctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca cgacttcttc 840 aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 900 aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 960 ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 1020 tacaacagcc acaacgtcta tatcaccgcc gacaagcaga agaacggcat caaggccaac 1080 ttcaagatcc gccacaacat cgaggacggc ggcgtgcagc tcgccgacca ctaccagcag 1140 aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagctaccag 1200 tccaagctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 1260 accgccgccg ggatcactct cggcatggac gagctgtaca agtaagtcga cggcgcgccg 1320 cggccgcgaa ttcgatatca taatcaacct ctggattaca aaatttgtga aagattgact 1380 ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 1440 tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggtta 1500 gttcttgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 1560 ctgttgggca ctgacaattc cgtggctcga gagatcttcg actgtgcctt ctagttgcca 1620 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 1680 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 1740 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 1800 tgagatctca cgtgcggacc gagcggccgc 1830 <210> 97 <211> 1733 <212> DNA <213> Artificial Sequence <220> <223> CN2253 <400> 97 gcggccgcac gcgtgactgg aaaaaggtag ctatggcagc ctctgcgcct atattttatc 60 catattctga ttttgttttc caaggtctcc tagtcaatca taatctgaat caatggaaat 120 ttccacggat aaataattca tgagacttga ggaaaatgtg tgctagtcct caatacctta 180 taaaatgtat tattcatttt gaattagatt aaaatgttta aaaaatgcta tctataagac 240 actgtgggag ccaaaaaatt tatacttctt tataaaatcc ttaactgcct ggaaataaac 300 taggtgttaa gagaattgaa gttaaaacac agaaaaataa tcccactctt tcataaactc 360 acaactccca aataatgaga accaaaggtg agctcgggct gggcataaaa gtcagggcag 420 agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 480 tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 540 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 600 ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 660 ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 720 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 780 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 840 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 900 tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 960 agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1020 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1080 acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1140 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1200 acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1260 acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1320 gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1380 cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1440 cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1500 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1560 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 1620 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 1680 gattgggaag acaatagcag gcatgagatc tcacgtgcgg accgagcggc cgc 1733 <210> 98 <211> 2145 <212> DNA <213> Artificial Sequence <220> <223> CN2254 <400> 98 gcggccgcac gcgttgactg tgtcatgact ctcagtgtct cttttttcca cggttctggg 60 atcatcattt ctttctcttc agacagtcta gatgagcagc cgagtgctta tctttaaggc 120 tgactctaga cagccagttg ttatttcata aatctgttaa aactcaccgt gcaaacacca 180 gcgttcctta gctgaccatc ctcaagcaca cgtggagtgt gacctctgct tccttctctc 240 atttcacata ttagtaatgt gcgtctatga atagttacaa gtgagaaaga gaaatggaga 300 ttttaccatt taatcatctc cgaagagaag gtgagaagaa attgagaaag gtaatttgca 360 taccatgcat aggcattaga gaaagcattt tttttcttaa ctctccattt gtttacagat 420 atttccatat ggccttttaa aaacttcaac agagaaattc gaacacaact aactggaatt 480 tcaattttca tataaaacca gcatcataga tatatatgta gctactctcc cacttcacat 540 tattcagtta gtatattttc taagctaatt tccaatccat tttaagacta tgtacagctc 600 atatgaggcc cccatatgtt cgttcacgtt actttgcatc cgtttacatg attaaacccc 660 aagaacaaat cgattagaag ccaagagcaa atgcttttgg ctccacatta gaaaactcaa 720 cagagaaacc tttacaagtg atagtcatct gggtaagaga catgcaaaca taattaccat 780 tattcgtgga cttaattccc tgagctcggg ctgggcataa aagtcagggc agagccatct 840 attgcttaca tttgcttctg ggatccagat ctttcgaagc tagcgctacc ggtcgccacc 900 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 960 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 1020 ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 1080 ctcgtgacca ccctgggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 1140 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 1200 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 1260 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 1320 aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 1380 ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 1440 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 1500 tacctgagct accagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 1560 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 1620 gtcgacggcg cgccgcggcc gcgaattcga tatcataatc aacctctgga ttacaaaatt 1680 tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 1740 gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 1800 tataaatcct ggttagttct tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1860 tggacagggg ctcggctgtt gggcactgac aattccgtgg ctcgagagat cttcgactgt 1920 gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1980 aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 2040 taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2100 agacaatagc aggcatgaga tctcacgtgc ggaccgagcg gccgc 2145 <210> 99 <211> 2117 <212> DNA <213> Artificial Sequence <220> <223> CN2255 <400> 99 gcggccgcac gcgtttaact tgaggaaatc tgccacaaga tgttctcaag tgcaaatgtc 60 tcttgatgca tacacgcatg catttctatt taagtatcca acgagaattg tggggttgag 120 gtaggtattt tagcttataa aaaaaaaata ccttatgagc ttattttgga tcatataaaa 180 gtatgagcac ttttagaaca cttttaataa tgcaaatcat ctctgcatca tccaaattta 240 atccatgaac atttagtcat cgttatctta catgagtcat atctgtgtcc ttattgtctt 300 atcttaaatg cattaattaa ttcgatagag catctataaa aatgaaacgc tattcaaaag 360 ctggcccatg acaagatcag tgtgttggtt tctatgccta tagtggtgca atggaaggag 420 tgcgctgtac cccacagact ttgtgattga tgagttgtct actttattca caatgaagct 480 aaaaacaatc taacaaccat cagggtgcta cagcagcaca gaaatgacta gctcttttgt 540 gtcaagttat tgccggttgt cttagtcact gtccgactga tgtgcagaga caccatgact 600 aaggcaacgc ttatcaaaga aagagtctag ttgagagctt gcttgtagtt ccagaggttt 660 gtttagtcta gcatggtggc acacactgtg ctagaacaat attgagagct acaacctgat 720 ctgaaaagca gagagagata gagacagaaa gaggcagaga gacactggcc ctggagctcg 780 ggctgggcat aaaagtcagg gcagagccat ctattgctta catttgcttc tgggatccag 840 atctttcgaa gctagcgcta ccggtcgcca ccatggtgag caagggcgag gagctgttca 900 ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 960 tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ctgatctgca 1020 ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgggc tacggcgtgc 1080 agtgcttcgc ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1140 ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1200 gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1260 acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1320 acgtctatat caccgccgac aagcagaaga acggcatcaa ggccaacttc aagatccgcc 1380 acaacatcga ggacggcggc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 1440 gcgacggccc cgtgctgctg cccgacaacc actacctgag ctaccagtcc aagctgagca 1500 aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 1560 tcactctcgg catggacgag ctgtacaagt aagtcgacgg cgcgccgcgg ccgcgaattc 1620 gatatcataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 1680 atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 1740 cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttagtt cttgccacgg 1800 cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 1860 acaattccgt ggctcgagag atcttcgact gtgccttcta gttgccagcc atctgttgtt 1920 tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1980 taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 2040 gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatga gatctcacgt 2100 gcggaccgag cggccgc 2117 <210> 100 <211> 1763 <212> DNA <213> Artificial Sequence <220> <223> CN2256 <400> 100 gcggccgcac gcgtgctggt gggtgggaag agtttagtaa ctgctcacca atggtgctgt 60 agacattatc agttgcaaga agtgttttaa tttcagagaa attaaaatat gcaaaatatg 120 tgtctctgaa tcaacaaaac atggtgcctc aggtttccgt atctgtgtgg gcctgttttt 180 aggttttctg ttctatctat tcctgggctt ccaccacact gtgttaatga ggataacttt 240 aaaatacatc ttgatattta gtagagcgca tttccacgcc tgattcatca cgagcacctt 300 aacttgtctt ggttcttctg cggagatgtt ggcaccagct tcttcacccg tgactccagc 360 ttctggggaa cctgtgctct cacccctgcc ccgcctgtgc ctgccaggca caccttaatg 420 agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg 480 atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc 540 tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 600 tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga 660 tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg 720 gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 780 ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 840 agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 900 gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 960 gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga 1020 tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc 1080 ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc 1140 tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 1200 ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc 1260 gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 1320 ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 1380 ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg 1440 ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg 1500 gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct 1560 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1620 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1680 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgagatc 1740 tcacgtgcgg accgagcggc cgc 1763 <210> 101 <211> 2005 <212> DNA <213> Artificial Sequence <220> <223> CN2315 <400> 101 gcggccgcac gcgtagtttt ggaaaaacac catactggtt attttcaaat aactctattt 60 cacaacagta tactagaatt ttatgctaaa atctttctgt gactttgtgt tcactgatca 120 acaattcctc ttttatgata gcctatgctg tctaccatct attccaaact tttatgagat 180 cagtaatttt agattatgaa tgagtttgat catatagtac atacttttgt gtctgctatt 240 gcatttacat agtgacatag gcttacagga tattgtaaat gtcatcccta gatacattta 300 tgtaaccttt ttttaaaata aaactctaac aaatgttagt tattgtgcac tatggttttg 360 aatatttgaa tttgctttgc tcagatctaa ataacttctg ataagtttgg cattcaggaa 420 agagtaaatg taaatgtaga aatgcttgga atataaaaca agtaattttt gtgataattt 480 ttctgaaaat gctaatgtat attttcagca ggcctccttt cttgtttaga acagtatatt 540 tcttagcttt aattagtact tactttatat atctatgcat ccatttatag ttcagcatta 600 gattgaatat gtatgcatgt atgtatgatt tatttatatt tttgtctccc agtccacacc 660 cgagctcggg ctgggcataa aagtcagggc agagccatct attgcttaca tttgcttctg 720 ggatccagat ctttcgaagc tagcgctacc ggtcgccacc atggtgagca agggcgagga 780 gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 840 gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagct 900 gatctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgggcta 960 cggcgtgcag tgcttcgccc gctaccccga ccacatgaag cagcacgact tcttcaagtc 1020 cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 1080 caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 1140 gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 1200 cagccacaac gtctatatca ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa 1260 gatccgccac aacatcgagg acggcggcgt gcagctcgcc gaccactacc agcagaacac 1320 ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagct accagtccaa 1380 gctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 1440 cgccgggatc actctcggca tggacgagct gtacaagtaa gtcgacggcg cgccgcggcc 1500 gcgaattcga tatcataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 1560 tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 1620 tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttagttct 1680 tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 1740 gggcactgac aattccgtgg ctcgagagat cttcgactgt gccttctagt tgccagccat 1800 ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc 1860 tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg 1920 ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgaga 1980 tctcacgtgc ggaccgagcg gccgc 2005 <210> 102 <211> 2036 <212> DNA <213> Artificial Sequence <220> <223> CN2423 <400> 102 gcggccgcac gcgtgggaga tataaacaag aagaaacagg actgaataaa tgtgtgcaga 60 aggatcctgt agcagcgtcg ttcttcctgg ccagttgagc gcgcgcagca cttaagattg 120 gtgctcatcc atgcctattc attcttgtga tgtgttgtgt tagatattat tggtaattat 180 tacttagaga ggtggcaaag tagtgaatag gtggaaaggc actgagacca tattgtcacc 240 gcagctttgg aaaagacctt cttattttaa cttatgtaat taaccatccc aaatttaccc 300 tgatcctcac tggaaatgtc ttccctttcc tgatatttac cacagtttta aaaagtctta 360 gatgggtatg catatttgag aaatacgtag agttaattag tgcgtagatg tgtttttaag 420 ttgcataaaa catattgtgc tttggcatag ctccctttgt aacttatttt aggaaaccaa 480 gtttgatttt gacaacagca ttagaagtaa agtgtgtgaa gatgatttag aatccatgaa 540 tatccacatt gctgaatata atccttcctg gctacagagc tcctatttct gctcctgtaa 600 gcagccattc acccacactt cttaaagtaa ccccaataaa ctcactcatt aagttagatt 660 ttggcagtgt ccttctttga tctgttgtcc gtgagctcgg gctgggcata aaagtcaggg 720 cagagccatc tattgcttac atttgcttct gggatccaga tctttcgaag ctagcgctac 780 cggtcgccac catggtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 840 tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 900 atgccaccta cggcaagctg accctgaagc tgatctgcac caccggcaag ctgcccgtgc 960 cctggcccac cctcgtgacc accctgggct acggcgtgca gtgcttcgcc cgctaccccg 1020 accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 1080 gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 1140 gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 1200 tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc accgccgaca 1260 agcagaagaa cggcatcaag gccaacttca agatccgcca caacatcgag gacggcggcg 1320 tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 1380 ccgacaacca ctacctgagc taccagtcca agctgagcaa agaccccaac gagaagcgcg 1440 atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 1500 tgtacaagta agtcgacggc gcgccgcggc cgcgaattcg atatcataat caacctctgg 1560 attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 1620 gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 1680 tctcctcctt gtataaatcc tggttagttc ttgccacggc ggaactcatc gccgcctgcc 1740 ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gctcgagaga 1800 tcttcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 1860 ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 1920 cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 1980 gaggattggg aagacaatag caggcatgag atctcacgtg cggaccgagc ggccgc 2036 <210> 103 <211> 1991 <212> DNA <213> Artificial Sequence <220> <223> CN2424 <400> 103 gcggccgcac gcgttttgct tgtgtgccag cagggaggag caagaggaat tttgtcactt 60 ctctttcact ttcttcatta ttttaagttg gatctgctgt tctgttcact tttaaaatat 120 aaccttcagt atttatgaac gtgattcatc ttttacaata tgttgtttaa catgaatgca 180 tcttcttctt gcctttcagt gcatctttat gccattggca gccacaatca agtgtttcca 240 ttaaagttca cagtaacagt gcagtgttgt ctgtcccaac tctgctaact tttaccaccc 300 actatttagt tttatctacc atgtgaattt atttgtaaga tcttctttct cttatcctag 360 ttaattatgg ggaggacttg ccaggatatt aatttacatg gcaattttgg ataagttatg 420 catgtattca tctcctatat acaataagtt tttcttgtga acgtcaaaag aaaggataat 480 gcatatgact gtatatgata taaactggaa tgtaatagtt gccaatagga tctgaatcaa 540 atttcagttt ttaactatgt tctatatatc tatgtgcata tttatagcat gtgtgacata 600 tgtataattt aaatatttct ataaacttat acagaaacaa aatatgtgag ctcgggctgg 660 gcataaaagt cagggcagag ccatctattg cttacatttg cttctgggat ccagatcttt 720 cgaagctagc gctaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg 780 tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 840 gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc tgcaccaccg 900 gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc gtgcagtgct 960 tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 1020 gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 1080 aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 1140 aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 1200 atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaaca 1260 tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 1320 gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg agcaaagacc 1380 ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 1440 tcggcatgga cgagctgtac aagtaagtcg acggcgcgcc gcggccgcga attcgatatc 1500 ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 1560 ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 1620 gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 1680 tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 1740 ccgtggctcg agagatcttc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 1800 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 1860 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 1920 caggacagca agggggagga ttgggaagac aatagcaggc atgagatctc acgtgcggac 1980 cgagcggccg c 1991 <210> 104 <211> 1959 <212> DNA <213> Artificial Sequence <220> <223> CN2690 <400> 104 gcggccgcac gcgtctgaag ttctgggggc agaccgcaat tgctgccaca gagcccctcc 60 tggcaggtgc agcccacagg aagaccagca ccctggccac agagacaaaa ggtcttattg 120 acttgcagta aaaatgtcct tataacctgt ccagaacaaa aggggaggat aaggttcaac 180 cagacaccga attcagggag acagcatcag tcagagcttt accactgcca gcaattttga 240 agctgcccat atttctgctc aggcaagatg ttttcttgct ctgaaacctt ttagcagatg 300 caaggtattg ctccgggtgt atcccagaac acaagtcttt gctaaagtgg gtagacagcc 360 actttccttc agagccaggg actgccctgg gagtaaaacc atttggagag cattttatat 420 ttgcaaaatg ttgctgtgac atgttatcat ttattccttt caacagcgca gtgagattgg 480 agagcatcct ccgatgcact gtacatttgg gaggaagaga aaggataaga gccctgctga 540 ttcagtggtg gtcattatca ttgtcaatgg agctgtcact gttatcgtca ttttcgtttg 600 cggtgaggta tgtgagagct cgggctgggc ataaaagtca gggcagagcc atctattgct 660 tacatttgct tctgggatcc agatctttcg aagctagcgc taccggtcgc caccatggtg 720 agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 780 gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 840 ctgaccctga agctgatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 900 accaccctgg gctacggcgt gcagtgcttc gcccgctacc ccgaccacat gaagcagcac 960 gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 1020 gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 1080 cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1140 gagtacaact acaacagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 1200 aaggccaact tcaagatccg ccacaacatc gaggacggcg gcgtgcagct cgccgaccac 1260 taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1320 agctaccagt ccaagctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 1380 gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgac 1440 ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc tggattacaa aatttgtgaa 1500 agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 1560 atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 1620 tcctggttag ttcttgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 1680 ggggctcggc tgttgggcac tgacaattcc gtggctcgag agatcttcga ctgtgccttc 1740 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 1800 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 1860 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 1920 tagcaggcat gagatctcac gtgcggaccg agcggccgc 1959 <210> 105 <211> 1876 <212> DNA <213> Artificial Sequence <220> <223> CN2695 <400> 105 gcggccgcac gcgtagaaag caagagcaaa gggcaggtct tccaggagag acagacagac 60 aaagaaaaag caagggaggt ggagagtgtg tgagagaggg agtgagaaag ggctcagcca 120 tttgtctggg caggtctgcg gaactcaaat ccggctcatc tgcatctcct caaataaact 180 tctgggaagt gaatgcctga agcaggcaga gtgcagagaa gtcagcaaat atgtgcgtag 240 tgaattccaa gccttctgtt cccagctcct gggaggggcc gcagtgcctt ggggtgtcct 300 gccgtgtctc catcgggtcc cctgcctggc tgctctaacc ctgaggaatg gcctccattg 360 tgggcctgtg gaaacaggga gaagaatctc ttatccagca ggtctgaggg ccacaggaac 420 ataagtaaca ctgaagagtg aggctgatcc ctggggtttg cgcgagcctg caaatgcatg 480 attcaacagc actcgcctgg tgcctctggg aggcaagctg gatgaggatg ttgagctcgg 540 gctgggcata aaagtcaggg cagagccatc tattgcttac atttgcttct gggatccaga 600 tctttcgaag ctagcgctac cggtcgccac catggtgagc aagggcgagg agctgttcac 660 cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 720 gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagc tgatctgcac 780 caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgggct acggcgtgca 840 gtgcttcgcc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 900 cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 960 cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 1020 cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 1080 cgtctatatc accgccgaca agcagaagaa cggcatcaag gccaacttca agatccgcca 1140 caacatcgag gacggcggcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 1200 cgacggcccc gtgctgctgc ccgacaacca ctacctgagc taccagtcca agctgagcaa 1260 agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 1320 cactctcggc atggacgagc tgtacaagta agtcgacggc gcgccgcggc cgcgaattcg 1380 atatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 1440 tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 1500 ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttagttc ttgccacggc 1560 ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 1620 caattccgtg gctcgagaga tcttcgactg tgccttctag ttgccagcca tctgttgttt 1680 gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 1740 aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 1800 tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgag atctcacgtg 1860 cggaccgagc ggccgc 1876 <210> 106 <211> 1971 <212> DNA <213> Artificial Sequence <220> <223> CN2691 <400> 106 gcggccgcac gcgtagaaat ccccttccct accttttatc tatcaatcat atctatctat 60 atcccccaaa acttagctga tactaacaat ttaaggatcc ccaatcccaa agcatttaga 120 ttttaagaca aataaaacag ttggaatcct ggtcccatgg aatttcagag ttgggagaaa 180 gtgaagagat ttcctggcta acccctgcag ttaacagatg gcaaaaagaa gtacagagaa 240 ttgtctgaag tcccagagca agggagtgga agcgcggccg caacgaggca tgcataagat 300 tctgcagaaa ccacgttctc ccgcttcaca gcggtctgct cttttcagga gagcctggga 360 aaacttctga ctgtgcaatt tgcttaaaaa caacagagaa acatcataga agaggatcaa 420 ttcctgacca tgcatttgaa attagacact tacaggcatt ccctgcagag tgctctccac 480 tggggcccag tggaagcagc atcacccatc agccgctggg ggtggctggt gccaccaggt 540 caggcctgga gcggggcagg agtctcctca ggctcgatgc tcttgacctg ctgctggtgc 600 caagagttag aagcaaagca cccaccagag ctcgggctgg gcataaaagt cagggcagag 660 ccatctattg cttacatttg cttctgggat ccagatcttt cgaagctagc gctaccggtc 720 gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 780 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 840 acctacggca agctgaccct gaagctgatc tgcaccaccg gcaagctgcc cgtgccctgg 900 cccaccctcg tgaccaccct gggctacggc gtgcagtgct tcgcccgcta ccccgaccac 960 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 1020 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 1080 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 1140 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcaccgc cgacaagcag 1200 aagaacggca tcaaggccaa cttcaagatc cgccacaaca tcgaggacgg cggcgtgcag 1260 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 1320 aaccactacc tgagctacca gtccaagctg agcaaagacc ccaacgagaa gcgcgatcac 1380 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 1440 aagtaagtcg acggcgcgcc gcggccgcga attcgatatc ataatcaacc tctggattac 1500 aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 1560 tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 1620 tccttgtata aatcctggtt agttcttgcc acggcggaac tcatcgccgc ctgccttgcc 1680 cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggctcg agagatcttc 1740 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 1800 cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 1860 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 1920 ttgggaagac aatagcaggc atgagatctc acgtgcggac cgagcggccg c 1971 <210> 107 <211> 1764 <212> DNA <213> Artificial Sequence <220> <223> CN2692 <400> 107 gcggccgcac gcgtttcctt ggaacactat ttggcatata tgcatatttt ggggctcagt 60 gtctttcatc gttatgttta tggttataat gaccacatct ctcacccatt agctgtgtgg 120 cttttgaggt cagtaagcta ttcttcccag agtgcttgac atagggcctg cggcatggta 180 aatacccaca gtttttgagt ttcctgtggg ttgagcattt agaatcatct gtttgtttaa 240 tcaggacata tttctccagt accttcaggg gtcccagtac tatgtttagg aacttagcca 300 tcacttgcac agtaaacagt atctgtggat tttgtcattc aacaaacact gccattgttc 360 agtcactcaa caaacgctgt tacggcatcc accctgggga aagaagggtc tcttggcaga 420 gagctcgggc tgggcataaa agtcagggca gagccatcta ttgcttacat ttgcttctgg 480 gatccagatc tttcgaagct agcgctaccg gtcgccacca tggtgagcaa gggcgaggag 540 ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 600 ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagctg 660 atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgggctac 720 ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 780 gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 840 aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 900 ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 960 agccacaacg tctatatcac cgccgacaag cagaagaacg gcatcaaggc caacttcaag 1020 atccgccaca acatcgagga cggcggcgtg cagctcgccg accactacca gcagaacacc 1080 cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcta ccagtccaag 1140 ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 1200 gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc gccgcggccg 1260 cgaattcgat atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 1320 cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 1380 gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttagttctt 1440 gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 1500 ggcactgaca attccgtggc tcgagagatc ttcgactgtg ccttctagtt gccagccatc 1560 tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 1620 ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 1680 gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgagat 1740 ctcacgtgcg gaccgagcgg ccgc 1764 <210> 108 <211> 1693 <212> DNA <213> Artificial Sequence <220> <223> CN2944 <400> 108 gcggccgcac gcgttccatc tttctgactt tagggccatt tttagaatgg cctttgttac 60 cccaagatta cataaatatt cacccaaact tcctccagta cttttatggt ttccttcaca 120 ggatttaatt cttaaatcca tctggaatgt atttctgaaa aaaaaaaaaa aagtaaaata 180 gtgccagcta ttttgcttca gagccaatgt ttcctaagtt gaaaacttta gctatattca 240 gttgtgtgat gtcattaaag ataataagat ttgggaccag attctgagtt cagttgcact 300 ctctgtatag ggtatagaaa atcattcaac tttctgagaa atgtgcagag agctcgggct 360 gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg atccagatct 420 ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg 480 ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc 540 cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga tctgcaccac 600 cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg 660 cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga 720 aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc 780 cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt 840 caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt 900 ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga tccgccacaa 960 catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga 1020 cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc tgagcaaaga 1080 ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac 1140 tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc gaattcgata 1200 tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 1260 tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 1320 ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg ccacggcgga 1380 actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 1440 ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct gttgtttgcc 1500 cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 1560 atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 1620 ggcaggacag caagggggag gattgggaag acaatagcag gcatgagatc tcacgtgcgg 1680 accgagcggc cgc 1693 <210> 109 <211> 1662 <212> DNA <213> Artificial Sequence <220> <223> CN2886 <400> 109 gcggccgcac gcgtacacac acacacacac acacacacaa ataaaaacaa aaacaactct 60 taaaaaccta agaaagggat aaatacaaca tcaaagactg ttggggttat aaaacataca 120 catttataga catttccaag atgctactaa aattacatac aaatgagtat ccaaaatgtc 180 acagaacaaa ttattcttgt gcaacataaa caactagaga gcatagcaaa ggaagcccag 240 accatgagct ttcccgatct gcttcccaag ctaacatatg ttggcatcca atcctgaaaa 300 ctacagaaga catgaggtga gctcgggctg ggcataaaag tcagggcaga gccatctatt 360 gcttacattt gcttctggga tccagatctt tcgaagctag cgctaccggt cgccaccatg 420 gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 480 gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 540 aagctgaccc tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 600 gtgaccaccc tgggctacgg cgtgcagtgc ttcgcccgct accccgacca catgaagcag 660 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 720 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 780 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 840 ctggagtaca actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc 900 atcaaggcca acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac 960 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 1020 ctgagctacc agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg 1080 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc 1140 gacggcgcgc cgcggccgcg aattcgatat cataatcaac ctctggatta caaaatttgt 1200 gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 1260 ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 1320 aaatcctggt tagttcttgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 1380 acaggggctc ggctgttggg cactgacaat tccgtggctc gagagatctt cgactgtgcc 1440 ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 1500 tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 1560 gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 1620 caatagcagg catgagatct cacgtgcgga ccgagcggcc gc 1662 <210> 110 <211> 1882 <212> DNA <213> Artificial Sequence <220> <223> CN2755 <400> 110 gcggccgcac gcgttttcca gcactgcagg agtcttcagt atgaagtaga accagttggg 60 tgacggggca gacactggag acagacagaa aaggttctaa tatccatgtt ctgtttgatt 120 ttggaaggat gctgaatgct aatcagcttt cttattttaa gaaagactat cttaaattat 180 tatacttgcc tcatatgatt tggaggatga ttgcatgctg ttccctcagc aaacaggagc 240 ttagaaaagt ttttgaataa tttcacaaaa ggccccaaag tattctcagt atgaagatgg 300 aaattgggct gagtcatctt atctagagga agtatcagaa aacttcgttg aaatagtttt 360 gagtaggcct ttggcacaga agaagccatg tggatcagaa gtgaaaaaaa tgacgcttgc 420 caatgcttgc ggtgagatct gacatagagt ggccatcttt cgggatgcag tgttagaatg 480 tgtagtagaa aataaggtgg aagagacgtg ttcggttcca tctcaagatt tgggggcaga 540 gctcgggctg ggcataaaag tcagggcaga gccatctatt gcttacattt gcttctggga 600 tccagatctt tcgaagctag cgctaccggt cgccaccatg gtgagcaagg gcgaggagct 660 gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 720 cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagctgat 780 ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgggctacgg 840 cgtgcagtgc ttcgcccgct accccgacca catgaagcag cacgacttct tcaagtccgc 900 catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 960 gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1020 catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1080 ccacaacgtc tatatcaccg ccgacaagca gaagaacggc atcaaggcca acttcaagat 1140 ccgccacaac atcgaggacg gcggcgtgca gctcgccgac cactaccagc agaacacccc 1200 catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagctacc agtccaagct 1260 gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1320 cgggatcact ctcggcatgg acgagctgta caagtaagtc gacggcgcgc cgcggccgcg 1380 aattcgatat cataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 1440 taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 1500 tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tagttcttgc 1560 cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg 1620 cactgacaat tccgtggctc gagagatctt cgactgtgcc ttctagttgc cagccatctg 1680 ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 1740 cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 1800 gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgagatct 1860 cacgtgcgga ccgagcggcc gc 1882 <210> 111 <400> 111 000 <210> 112 <211> 2058 <212> DNA <213> Artificial Sequence <220> <223> CN2938 <400> 112 gcggccgcac gcgttgcatg gattctaagt tcctaagagg aattcagaaa ataccaattt 60 ttatttagca tataagataa tgtcttccat cataacattc acaatcacac acaaacatac 120 acacacacac acatcatact tcattcatat tcactgtatt actatcgtct gctaatcttg 180 ccaactctta cactgagaac ctttcttgac ttaaattatg gatatgagag acactgtgat 240 atttgttttt ctccacctac ctctgctttt atataaggca tattccatgc atgctaatga 300 tattggagca caatgtttat gcatgtataa tcatatattt ctttcctgtg cctgtgaaat 360 catagttata actaaatttc tttctcttat gattccataa aaaattctca ggaatataaa 420 gtatatataa gccaaaattc tataaaatta ataaattatg atgatcagaa aggtacaaca 480 atgtctttca gaagtctata atgacttttg acccagcatg ttcatgccct acatgctgtt 540 agtgaaatta actttccaat tcaaattagt acattgagtt gattgaacat atttcatcgt 600 tcacattgac tcacactgtg ggattcttat aaaagacaat ttcccttaaa tataaccagc 660 ttttagtttt ttcatgaaag ccagtccctt gttactagtg tatttagatg catcgagctc 720 gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt ctgggatcca 780 gatctttcga agctagcgct accggtcgcc accatggtga gcaagggcga ggagctgttc 840 accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 900 gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc 960 accaccggca agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcgtg 1020 cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 1080 cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 1140 cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 1200 gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 1260 aacgtctata tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc 1320 cacaacatcg aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc 1380 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gctaccagtc caagctgagc 1440 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 1500 atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt 1560 cgatatcata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 1620 tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 1680 gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttagt tcttgccacg 1740 gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact 1800 gacaattccg tggctcgaga gatcttcgac tgtgccttct agttgccagc catctgttgt 1860 ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 1920 ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 1980 ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg agatctcacg 2040 tgcggaccga gcggccgc 2058 <210> 113 <211> 1998 <212> DNA <213> Artificial Sequence <220> <223> CN2239 <400> 113 gcggccgcac gcgtctgtgt ctcaggccag aagattttct atattggctg gagcttctgt 60 gggatgcagg cagtggatga gaagggaaac gacagcaaat agaggaagca caagtctctg 120 gcctcagtgt tgggtgcaca caaagcaaat gggagaagga ggagaggggc tcccttcccc 180 tgccccaagg cccagccagg caggccccca gcagcctggc tgtctccctc ccttgcgggc 240 tggagctgcc tctccgcctc tgcccgcctg atcggggcag agctcggctt catgtattat 300 taatagcact gccagccttc ctgttttcac gctgataacc tgcaggggag ggctggtggg 360 agggagggag caaggtggca aaccctggag cttctagggt ccctcccccc tcagtagagc 420 agctctgcgg gggttggccc caagtctcta aagttggttt ctagagcctc ccccatccaa 480 gcccacggga agggaccagg gcctcctaaa gggaaatcac atgggaggtt ggaacgtggg 540 gtctgggaag ggccctgtta ctcaatccat ctaggacacc aatggctcaa gtcaccttgg 600 ccctccccag aggcagaagt gcccatgtct agggcacatg gggctcagag ctgagagctc 660 gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt ctgggatcca 720 gatctttcga agctagcgct accggtcgcc accatggtga gcaagggcga ggagctgttc 780 accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 840 gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc 900 accaccggca agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcgtg 960 cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 1020 cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 1080 cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 1140 gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 1200 aacgtctata tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc 1260 cacaacatcg aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc 1320 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gctaccagtc caagctgagc 1380 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 1440 atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt 1500 cgatatcata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 1560 tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 1620 gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttagt tcttgccacg 1680 gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact 1740 gacaattccg tggctcgaga gatcttcgac tgtgccttct agttgccagc catctgttgt 1800 ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 1860 ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 1920 ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg agatctcacg 1980 tgcggaccga gcggccgc 1998 <210> 114 <211> 1851 <212> DNA <213> Artificial Sequence <220> <223> CN2410 <400> 114 gcggccgcac gcgtatgtgc atacctgcct ctgagaagga ccaaagtcag atgcactctc 60 aatgtaaggg cttgggggtg gaacacctca agttccacac acaccccaat ctcctacagg 120 agtttccttt agaggacctg tctcctccaa ggggctctgt tagaccaagt gggaaagtct 180 ctaggaactg acttcagagg tttggggctg tgccagtccc gcggcgcact ctgccacgga 240 ggagacctgg agctcctggg ttggccacct tgctccctgc ctcctcccac ctcctcccca 300 gcaggttatc agcatgaaaa caggaaggct ggcagtgcta ttaataaaac atgaagcaga 360 gatctgcccc atcaggcagc ggaggcaggc ggcagctcgg cagccccgag ggagggagag 420 aacccccgca tctgggcctg ggcaggggta ttctcttctc acagatgcca caccccagga 480 gccacctcca ttttgcggga ctgctgtgag ctcgggctgg gcataaaagt cagggcagag 540 ccatctattg cttacatttg cttctgggat ccagatcttt cgaagctagc gctaccggtc 600 gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 660 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 720 acctacggca agctgaccct gaagctgatc tgcaccaccg gcaagctgcc cgtgccctgg 780 cccaccctcg tgaccaccct gggctacggc gtgcagtgct tcgcccgcta ccccgaccac 840 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 900 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 960 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 1020 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcaccgc cgacaagcag 1080 aagaacggca tcaaggccaa cttcaagatc cgccacaaca tcgaggacgg cggcgtgcag 1140 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 1200 aaccactacc tgagctacca gtccaagctg agcaaagacc ccaacgagaa gcgcgatcac 1260 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 1320 aagtaagtcg acggcgcgcc gcggccgcga attcgatatc ataatcaacc tctggattac 1380 aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 1440 tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 1500 tccttgtata aatcctggtt agttcttgcc acggcggaac tcatcgccgc ctgccttgcc 1560 cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggctcg agagatcttc 1620 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 1680 cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 1740 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 1800 ttgggaagac aatagcaggc atgagatctc acgtgcggac cgagcggccg c 1851 <210> 115 <211> 1824 <212> DNA <213> Artificial Sequence <220> <223> CN2411 <400> 115 gcggccgcac gcgtagctaa cctaccagtc ccaccgtgat atctggatgc tgatataaag 60 gagaatgtat caaataatgt aatgcttgga agttatttga atctgttatt cttaagagca 120 cactgatatt actcattgtg tgaggcacac aaaaaagatc agaacacaaa ggcatatttg 180 tgctgtgtgt ccaacactga ggggcgggag gaggtaatac ttttttggaa aagacaggaa 240 agaatgaaaa tagatggttt gtaaagatag taagcttgtg ggtggctttt tatttccata 300 atcatggtat tatgtttttg tataatttta agaaaaactt atgttaatca gaaactttga 360 ataacacctt aacaaaaatg tgctgcacac cgcagccatc ccagagaagc taacactcaa 420 gatgtcctgt tcaggcttcg cgcatttgag tccagggaag atgtctctcg ttggcaccaa 480 gagctcgggc tgggcataaa agtcagggca gagccatcta ttgcttacat ttgcttctgg 540 gatccagatc tttcgaagct agcgctaccg gtcgccacca tggtgagcaa gggcgaggag 600 ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 660 ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagctg 720 atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgggctac 780 ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 840 gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 900 aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 960 ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 1020 agccacaacg tctatatcac cgccgacaag cagaagaacg gcatcaaggc caacttcaag 1080 atccgccaca acatcgagga cggcggcgtg cagctcgccg accactacca gcagaacacc 1140 cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcta ccagtccaag 1200 ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 1260 gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc gccgcggccg 1320 cgaattcgat atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 1380 cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 1440 gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttagttctt 1500 gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 1560 ggcactgaca attccgtggc tcgagagatc ttcgactgtg ccttctagtt gccagccatc 1620 tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 1680 ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 1740 gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgagat 1800 ctcacgtgcg gaccgagcgg ccgc 1824 <210> 116 <211> 1787 <212> DNA <213> Artificial Sequence <220> <223> CN2412 <400> 116 gcggccgcac gcgttgctca gggtctgcaa actttttctt atggttagta caagaagaat 60 gcataaacat cacaaaccaa agtacttctt tcaaccaatc aaacaaatta tatacagggt 120 aacacacaaa atcaaactga gcaaatctag ccaatgggtc ccatatgcca catttttcat 180 ttccttattc cagccctcag gaatgtaggt gtttgctctg agtaggccta ccatagtatg 240 taattctgct atcttatgca ccgataattt ttcttggttc aggagtgttt gatgtatgct 300 ccatagttgt ctctcattgt gctctgctgt ctcattgatt tctctaaggt tttaacaaat 360 ttatccatgt ggtttttctc taatttgaaa tcaaattgca tgtcagacaa gaagtaatat 420 ttttgttggt agtgtactgt ggtgagctcg ggctgggcat aaaagtcagg gcagagccat 480 ctattgctta catttgcttc tgggatccag atctttcgaa gctagcgcta ccggtcgcca 540 ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 600 acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 660 acggcaagct gaccctgaag ctgatctgca ccaccggcaa gctgcccgtg ccctggccca 720 ccctcgtgac caccctgggc tacggcgtgc agtgcttcgc ccgctacccc gaccacatga 780 agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 840 tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 900 tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 960 acaagctgga gtacaactac aacagccaca acgtctatat caccgccgac aagcagaaga 1020 acggcatcaa ggccaacttc aagatccgcc acaacatcga ggacggcggc gtgcagctcg 1080 ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 1140 actacctgag ctaccagtcc aagctgagca aagaccccaa cgagaagcgc gatcacatgg 1200 tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt 1260 aagtcgacgg cgcgccgcgg ccgcgaattc gatatcataa tcaacctctg gattacaaaa 1320 tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 1380 ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 1440 tgtataaatc ctggttagtt cttgccacgg cggaactcat cgccgcctgc cttgcccgct 1500 gctggacagg ggctcggctg ttgggcactg acaattccgt ggctcgagag atcttcgact 1560 gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 1620 gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 1680 agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 1740 gaagacaata gcaggcatga gatctcacgt gcggaccgag cggccgc 1787 <210> 117 <211> 1991 <212> DNA <213> Artificial Sequence <220> <223> CN2963 <220> <221> misc_feature <222> (267)..(267) <223> n is a, c, g, or t <400> 117 gcggccgcac gcgttctaac catgtgtgtt tcctttgaaa taattctata tactcctttt 60 aatgaattta cattaaatca atagcttgta ttgacaacta tattatcatc aaagcataaa 120 caaaactttc tttgattcct tgcttcagaa ggcttgatca tttgtttccc agggaaatgg 180 aatataggta aggacaaagc tatttaaaca caattctctc ttttaatgca aactattaca 240 tcatgcagtt tatttatatt atgaatncaa aatcagggat gacatatata acatatggac 300 atgaatatta ctctttagat ttcatattaa acttatcagt ttttttttat ctcaaagcat 360 ggaatcaaat tcaagacaca gatggacaca acataagttt ggaatggctt ttaaatattt 420 ttacaggaat ttttccattt tggcaaagta tttagtatat agtgagttgc ttctatgatt 480 atattagatg tgtttttgaa gaatgttgtt ttgctaaatt attctaacgc tcaatttaca 540 ttctgaacat tttcaatctg agcgcgcaga gagggagtgg ccaactccat cactaggggt 600 tcctgcggcc gcacgcgttc taaccatgtg tgtttctctt ttggactgag ctcgggctgg 660 gcataaaagt cagggcagag ccatctattg cttacatttg cttctgggat ccagatcttt 720 cgaagctagc gctaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg 780 tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 840 gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc tgcaccaccg 900 gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc gtgcagtgct 960 tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 1020 gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 1080 aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 1140 aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 1200 atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaaca 1260 tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 1320 gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg agcaaagacc 1380 ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 1440 tcggcatgga cgagctgtac aagtaagtcg acggcgcgcc gcggccgcga attcgatatc 1500 ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 1560 ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 1620 gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 1680 tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 1740 ccgtggctcg agagatcttc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 1800 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 1860 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 1920 caggacagca agggggagga ttgggaagac aatagcaggc atgagatctc acgtgcggac 1980 cgagcggccg c 1991 <210> 118 <211> 1798 <212> DNA <213> Artificial Sequence <220> <223> CN2623 <400> 118 gcggccgcac gcgtaacatg tatttgtgga gtggctaaat tgagatatat caccttaaaa 60 tcaactccca gcaatttgaa gagcacagta agtaagacct tgttcctaac cacagtcgcc 120 atgcagtgca gtagagccca gatcttacac ttcctgtgta actggagtct tgtgttcttt 180 agccaagctc ttcccacatg cgagtcattt tcaattcaaa atactagtta ttttcagttt 240 aagaatcagt ctgatttctt gagcatagtg cttatcttat atggtatggc tttcagctcc 300 ctggagattt cctgggtgtg ctgctgtgcc tttgcctcca ggataaatgc catgctgaga 360 agagcatgac tctgtcagca caggcagacg gtggaaactt tacctctgcg acctctctgc 420 agcctcaggg tagcagggga tggcatggtt tcatgagctc gggctgggca taaaagtcag 480 ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga agctagcgct 540 accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 600 ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 660 cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca agctgcccgt 720 gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc 780 cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 840 gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 900 gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 960 catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcaccgccga 1020 caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg aggacggcgg 1080 cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 1140 gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca acgagaagcg 1200 cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 1260 gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata atcaacctct 1320 ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 1380 atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 1440 tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca tcgccgcctg 1500 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggctcgaga 1560 gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1620 ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1680 cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 1740 gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga gcggccgc 1798 <210> 119 <211> 1833 <212> DNA <213> Artificial Sequence <220> <223> CN2624 <400> 119 gcggccgcac gcgttgtatg cctaaagggt ttgcttctat gttaattccc aacaacaatc 60 atgatacttc cttacttctg caggactagg ctggctcact agtgaggttt tctccaagga 120 tgtgctccaa tatctgctcc acaatactta aatagcttca caatacataa atatttaagt 180 actcctctgt aaggagcgtt ctgtttccat atgtcaaggc agaatcttca cataaagcat 240 gcattttgct ccctgttttc aatggtttta ctctgtagag tttctcaaat taattcaata 300 cccactttaa attaaatgga aactttaatg ctatggtttg ctgtgccatt tagattttat 360 gtgttgagat gcaattccaa ctctacttgg cacgaagtat agacactgaa tccaactatg 420 atgtataagc aagggtcctt gtgaggtagg taatgagaat ggagcctgga acgtgtaaca 480 ctggtgactg agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt 540 tgcttctggg atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag 600 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 660 ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 720 ctgaagctga tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 780 ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc 840 ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 900 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 960 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1020 aactacaaca gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc 1080 aacttcaaga tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag 1140 cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac 1200 cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1260 gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg 1320 ccgcggccgc gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg 1380 actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 1440 ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 1500 ttagttcttg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1560 cggctgttgg gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg 1620 ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1680 cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1740 tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1800 gcatgagatc tcacgtgcgg accgagcggc cgc 1833 <210> 120 <211> 1905 <212> DNA <213> Artificial Sequence <220> <223> CN2601 <400> 120 gcggccgcac gcgttgcaga ttataattct atggaaactg actgttttaa acataaattt 60 tagacctctt ctcaaggtgt ggcaatcctc aacagcttct ggtatgcata gaccacattt 120 gtattcacca ttaatgcata agaaaaacat tttggttgcc agtttggagc taaattgata 180 aatctgctac aagcatttgt gcatgagttt gtgtgtaaat atgcttttta cttacttagg 240 atgaatatac aaggatagca ttgttatatt gcttgacatt tgcatattca attttataga 300 gaatgcacag caattttggt atctgtctgt accctttcat attttatgct caacatttga 360 gtcacttggt ttcttggcat cattatgaat ttttaatggt cttactttta aaaaatatgc 420 tttaactcat cttagaatta tatcacattt ccccttccag tctctcctag acatccctcc 480 ctcaaacagc ccttgtgtgc tcctgccttc agttcatagc ctgttttact ttattattat 540 tattgctctc tgtgtgtgca cgagctcggg ctgggcataa aagtcagggc agagccatct 600 attgcttaca tttgcttctg ggatccagat ctttcgaagc tagcgctacc ggtcgccacc 660 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 720 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 780 ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 840 ctcgtgacca ccctgggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 900 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 960 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 1020 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 1080 aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 1140 ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 1200 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 1260 tacctgagct accagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 1320 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 1380 gtcgacggcg cgccgcggcc gcgaattcga tatcataatc aacctctgga ttacaaaatt 1440 tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 1500 gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 1560 tataaatcct ggttagttct tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1620 tggacagggg ctcggctgtt gggcactgac aattccgtgg ctcgagagat cttcgactgt 1680 gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1740 aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 1800 taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 1860 agacaatagc aggcatgaga tctcacgtgc ggaccgagcg gccgc 1905 <210> 121 <400> 121 000 <210> 122 <211> 1979 <212> DNA <213> Artificial Sequence <220> <223> CN2843 <400> 122 gcggccgcac gcgtgcttct gaatacctcc acgcatacac tcacttaaat tataaataaa 60 cctgaaaagc aatgtagcaa aaatgaaaga gatttctgcc accagcttct ataattatgt 120 aatcataatg ttttgaaagt taaactcccc ttttcaacaa gaaaattata atatatatgc 180 atatatgcat atatattcac acacataaca tatatttata aatcaattta aactgccttt 240 gtgcagtgta ctaggcaaaa gtaatgtatg tatctatctc tgtgaatgcc ctctaattct 300 ggaaataaat aatgggacat ctcagtattt tcaagaagtc tgtaagccac aaataggctt 360 atgcctattg ttctgtcata attattaatg gtctagtact tggtctcaag catgtctggt 420 atggatgata aaactaagag tccaaaaata ggtcccctgt gatcactatc aggaaactca 480 aaagcacaga attcatggag tatttctaac cagaaacaca aacactacac atactcatac 540 acatatgtgg atatctgtta tataagatgt aactttatat aaaaccccta gtctggtaat 600 gttcttaacc ttatctggtg acgttacatg acacagagct cgggctgggc ataaaagtca 660 gggcagagcc atctattgct tacatttgct tctgggatcc agatctttcg aagctagcgc 720 taccggtcgc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 780 tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 840 gcgatgccac ctacggcaag ctgaccctga agctgatctg caccaccggc aagctgcccg 900 tgccctggcc caccctcgtg accaccctgg gctacggcgt gcagtgcttc gcccgctacc 960 ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 1020 agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 1080 agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 1140 acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcaccgccg 1200 acaagcagaa gaacggcatc aaggccaact tcaagatccg ccacaacatc gaggacggcg 1260 gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 1320 tgcccgacaa ccactacctg agctaccagt ccaagctgag caaagacccc aacgagaagc 1380 gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 1440 agctgtacaa gtaagtcgac ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc 1500 tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 1560 tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 1620 ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc atcgccgcct 1680 gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggctcgag 1740 agatcttcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 1800 tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 1860 tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 1920 ggggaggatt gggaagacaa tagcaggcat gagatctcac gtgcggaccg agcggccgc 1979 <210> 123 <211> 1670 <212> DNA <213> Artificial Sequence <220> <223> CN2851 <400> 123 gcggccgcac gcgttactgt ccaggccagc tttgaacaga ctctgtattc cagaaagact 60 ttcagcttgt gcttcttttc cccaaacctg ccttgagtag ctgacatcat aggcttgcac 120 taccaggcct ggcttaaaat acatactccc aatttacata tctgatgagt aacattctca 180 tagaagcaca aaagtacata catggattct aatataggtt attttcttgg gcattacaca 240 ctacagatat actattcaat attatttgtg gcctactaga gactgagcct aaggctataa 300 acatgttagt cgtgctctac cagtgagagc tcgggctggg cataaaagtc agggcagagc 360 catctattgc ttacatttgc ttctgggatc cagatctttc gaagctagcg ctaccggtcg 420 ccaccatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc 480 tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca 540 cctacggcaa gctgaccctg aagctgatct gcaccaccgg caagctgccc gtgccctggc 600 ccaccctcgt gaccaccctg ggctacggcg tgcagtgctt cgcccgctac cccgaccaca 660 tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca 720 tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca 780 ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg 840 ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcaccgcc gacaagcaga 900 agaacggcat caaggccaac ttcaagatcc gccacaacat cgaggacggc ggcgtgcagc 960 tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca 1020 accactacct gagctaccag tccaagctga gcaaagaccc caacgagaag cgcgatcaca 1080 tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca 1140 agtaagtcga cggcgcgccg cggccgcgaa ttcgatatca taatcaacct ctggattaca 1200 aaatttgtga aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat 1260 acgctgcttt aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct 1320 ccttgtataa atcctggtta gttcttgcca cggcggaact catcgccgcc tgccttgccc 1380 gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggctcga gagatcttcg 1440 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 1500 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 1560 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 1620 tgggaagaca atagcaggca tgagatctca cgtgcggacc gagcggccgc 1670 <210> 124 <211> 2126 <212> DNA <213> Artificial Sequence <220> <223> CN2853 <400> 124 gcggccgcac gcgttggaac ttgggacttc tgagcacagg gggtggatgg ctggaaatgt 60 gagcagaacc catggtgtga gaactgagat aagtttctgc tgaggctagc ctagaggcac 120 aggtggtgag acagctaggg cagaacatat cagtgaatag tgtaggatga tgccactttt 180 aaaatatttc ccgcaatatg aaccaatttc tcaaaaggta taaattacca taactctctt 240 aaatacaaaa tgagtaatct gaatagctgc aaattgtaag aaaattgaac ataatcataa 300 cccatcggca aaaataaatc tttggggaaa tgccacttta ttagagaatt ctgctataca 360 tttgatgaat atattacaaa gcttaaaaag ctctgtgggt gttcattttg catattgaaa 420 actaaaattt tatataagct aaaaaaggcc aattgtctct gtctgtcttt ctgtctctat 480 ctctgtctct ctctgtctct ctgtctctct ctctctctct ctctctctct ctctctctct 540 ctctctctct ctctctctct ccctttcttt ttctctctct gtgtatctaa ctattcttct 600 tttgcaattt ctgaaatttc ttctccaggg ctttctttct tcacaagtgt aagcacagca 660 tgtgtgctcc cactgccaag atgctgtgcc atgctataac ttctttttga catcatatgt 720 agcttataca tattaaaatt tacttcagca ctcaacagtc accactgtca tgactggagg 780 ttgagctcgg gctgggcata aaagtcaggg cagagccatc tattgcttac atttgcttct 840 gggatccaga tctttcgaag ctagcgctac cggtcgccac catggtgagc aagggcgagg 900 agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca 960 agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagc 1020 tgatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgggct 1080 acggcgtgca gtgcttcgcc cgctaccccg accacatgaa gcagcacgac ttcttcaagt 1140 ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 1200 acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga 1260 agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca 1320 acagccacaa cgtctatatc accgccgaca agcagaagaa cggcatcaag gccaacttca 1380 agatccgcca caacatcgag gacggcggcg tgcagctcgc cgaccactac cagcagaaca 1440 cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc taccagtcca 1500 agctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg 1560 ccgccgggat cactctcggc atggacgagc tgtacaagta agtcgacggc gcgccgcggc 1620 cgcgaattcg atatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta 1680 ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc 1740 atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttagttc 1800 ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 1860 tgggcactga caattccgtg gctcgagaga tcttcgactg tgccttctag ttgccagcca 1920 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 1980 ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 2040 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgag 2100 atctcacgtg cggaccgagc ggccgc 2126 <210> 125 <211> 1956 <212> DNA <213> Artificial Sequence <220> <223> CN2860 <400> 125 gcggccgcac gcgtttggct ttccttccaa gttgtatttt ggtgaagttt gactcctgga 60 atctcacttc tgcactttag attagcatac tttaaaaagg aacattacag tacaatggaa 120 aagtaaagat ctgggtttta tctcagcttt agttagtatt tataggaagc atggattaca 180 taaagagatg acattatttc agtctgaaat tgatttgtac tatacgacat ttcattttgt 240 ttgtgcacat tgattagata attcctcaaa tcagtttgaa aatttcatct ctgttcatag 300 ctgaagataa ccaccaaatt gcttttaact aatttacata ataagtatag tagaggttta 360 ttctatataa agtatcaaat ataaatattc atctcaaatt ctaaaggatt tagcaatgta 420 aattacttat gaattacata cacatttgta tttaaatctt ttttcacttt tattaaaaat 480 agatcctttt ctcatacaat atatcctgat tgcagttccc tcccctctac tcctcccagt 540 tccttcccac ctccctttcc atctggatct ctctcctatt aaaggttgga cagaagagat 600 ggcactgcat gtgagctcgg gctgggcata aaagtcaggg cagagccatc tattgcttac 660 atttgcttct gggatccaga tctttcgaag ctagcgctac cggtcgccac catggtgagc 720 aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 780 aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 840 accctgaagc tgatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 900 accctgggct acggcgtgca gtgcttcgcc cgctaccccg accacatgaa gcagcacgac 960 ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 1020 gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 1080 atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 1140 tacaactaca acagccacaa cgtctatatc accgccgaca agcagaagaa cggcatcaag 1200 gccaacttca agatccgcca caacatcgag gacggcggcg tgcagctcgc cgaccactac 1260 cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 1320 taccagtcca agctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 1380 ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta agtcgacggc 1440 gcgccgcggc cgcgaattcg atatcataat caacctctgg attacaaaat ttgtgaaaga 1500 ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg 1560 cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc 1620 tggttagttc ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 1680 gctcggctgt tgggcactga caattccgtg gctcgagaga tcttcgactg tgccttctag 1740 ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 1800 tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 1860 ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag 1920 caggcatgag atctcacgtg cggaccgagc ggccgc 1956 <210> 126 <211> 2153 <212> DNA <213> Artificial Sequence <220> <223> CN2828 <400> 126 gcggccgcac gcgttggtta gcactatttt gaatggacac ttctataaaa tttgttttaa 60 aaacaatatg gaagagtcat aagatgtctg ggcacagtgc ccccagtcaa ctcatcaatg 120 ggattctgga atccaaaggt tatatggtgt aaaaacacag agagcaaaat gcacaaggat 180 cttcatagaa ccataatttt taaaaagcaa acacttcccc caaaggagca tgtaagacaa 240 cttgaaggta ttaaaatggg attgtggttt tattagttag agaacatcat gcaaattata 300 ttatctaggc attataatgc aaactttaaa aggaaatgct cattatgtaa tgttaagtga 360 aaaaaatcag gccataaaat gaaatgtgca ttatgcatgc atatgatgaa aagacaagaa 420 atagataaga atatgcagaa atacaaatag ttggctgtgg tgtgggcttc tggcttgttt 480 tctgttttaa agccattaca tcatctttcc aatgacaaac tacattttaa gttattgaaa 540 acaaaatctc gttagccttg tccttgcata aattcccaga gaacacatta ttcttgttcc 600 cttctacctc tgctacttgt ctttgatttg gacctgctcc acctcctctt acttttcagt 660 cctgaactag atggaaaaaa gaaatagacc ctcaggaaac aaggaagcaa aaccacccaa 720 ctgtgtggaa gccgtgcatt caagctgcaa acgagtggag tggcttcaat accttaactt 780 atccccattg ttgcaaaggg agacccagag agctcgggct gggcataaaa gtcagggcag 840 agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 900 tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 960 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 1020 ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 1080 ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 1140 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 1200 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 1260 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1320 tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 1380 agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1440 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1500 acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1560 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1620 acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1680 acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1740 gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1800 cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1860 cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1920 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1980 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 2040 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 2100 gattgggaag acaatagcag gcatgagatc tcacgtgcgg accgagcggc cgc 2153 <210> 127 <211> 1833 <212> DNA <213> Artificial Sequence <220> <223> CN2870 <400> 127 gcggccgcac gcgttgtatg cctaaagggt ttgcttctat gttaattccc aacaacaatc 60 atgatacttc cttacttctg caggactagg ctggctcact agtgaggttt tctccaagga 120 tgtgctccaa tatctgctcc acaatactta aatagcttca caatacataa atatttaagt 180 actcctctgt aaggagcgtt ctgtttccat atgtcaaggc agaatcttca cataaagcat 240 gcattttgct ccctgttttc aatggtttta ctctgtagag tttctcaaat taattcaata 300 cccactttaa attaaatgga aactttaatg ctatggtttg ctgtgccatt tagattttat 360 gtgttgagat gcaattccaa ctctacttgg cacgaagtat agacactgaa tccaactatg 420 atgtataagc aagggtcctt gtgaggtagg taatgagaat ggagcctgga acgtgtaaca 480 ctggtgactg agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt 540 tgcttctggg atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag 600 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 660 ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 720 ctgaagctga tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 780 ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc 840 ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 900 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 960 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1020 aactacaaca gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc 1080 aacttcaaga tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag 1140 cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac 1200 cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1260 gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg 1320 ccgcggccgc gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg 1380 actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 1440 ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 1500 ttagttcttg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1560 cggctgttgg gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg 1620 ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1680 cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1740 tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1800 gcatgagatc tcacgtgcgg accgagcggc cgc 1833 <210> 128 <211> 1904 <212> DNA <213> Artificial Sequence <220> <223> CN2871 <400> 128 gcggccgcac gcgttgcaga ttataattct atggaactga ctgttttaaa cataaatttt 60 agacctcttc tcaaggtgtg gcaatcctca acagcttctg gtatgcatag accacatttg 120 tattcaccat taatgcataa gaaaaacatt ttggttgcca gtttggagct aaattgataa 180 atctgctaca agcatttgtg catgagtttg tgtgtaaata tgctttttac ttacttagga 240 tgaatataca aggatagcat tgttatattg cttgacattt gcatattcaa ttttatagag 300 aatgcacagc aattttggta tctgtctgta ccctttcata ttttatgctc aacatttgag 360 tcacttggtt tcttggcatc attatgaatt tttaatggtc ttacttttaa aaaatatgct 420 ttaactcatc ttagaattat atcacatttc cccttccagt ctctcctaga catccctccc 480 tcaaacagcc cttgtgtgct cctgccttca gttcatagcc tgttttactt tattattatt 540 attgctctct gtgtgtgcac gagctcgggc tgggcataaa agtcagggca gagccatcta 600 ttgcttacat ttgcttctgg gatccagatc tttcgaagct agcgctaccg gtcgccacca 660 tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg 720 gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg 780 gcaagctgac cctgaagctg atctgcacca ccggcaagct gcccgtgccc tggcccaccc 840 tcgtgaccac cctgggctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc 900 agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 960 tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg 1020 tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca 1080 agctggagta caactacaac agccacaacg tctatatcac cgccgacaag cagaagaacg 1140 gcatcaaggc caacttcaag atccgccaca acatcgagga cggcggcgtg cagctcgccg 1200 accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact 1260 acctgagcta ccagtccaag ctgagcaaag accccaacga gaagcgcgat cacatggtcc 1320 tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaag 1380 tcgacggcgc gccgcggccg cgaattcgat atcataatca acctctggat tacaaaattt 1440 gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 1500 ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 1560 ataaatcctg gttagttctt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 1620 ggacaggggc tcggctgttg ggcactgaca attccgtggc tcgagagatc ttcgactgtg 1680 ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 1740 ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 1800 aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 1860 gacaatagca ggcatgagat ctcacgtgcg gaccgagcgg ccgc 1904 <210> 129 <211> 2013 <212> DNA <213> Artificial Sequence <220> <223> CN2847 <400> 129 gcggccgcac gcgttccact tataccccat cagcatctct atcattgtct aagacatttt 60 taatttgaaa taaatgggga aactcattat catggcctca aggaaataca gaaaccaagg 120 attgtccttt tagtgcacag gtgtcttcta aattcacata ttctggattt aacaaggaaa 180 ataaaatctg acataggctg aatttgaaaa tggtaaggat atttttaact aaacaaaaaa 240 aataggtaat agaacatttc atattgaact cccaggatag catttatcat aatccaccag 300 ttgaattatt catgcgctga taaataacct tagcctccgg cacagtaatc ctctcactga 360 ataatcacca gggctccctg cccgtggtgt tttgctttac aacataaatt ttaaaattat 420 tctgtgttgg catacatatg tgaaagctca ttaacagata ctggcattct gattggtttg 480 gcactaaatt taaactgttt tggaaagaac tgaaacactg aaggatatgc cattctgttt 540 ctttatacct tatcgatgtt tccttaacaa tcggttgaga tttatgcatc ttttgataga 600 ttttatctga gatagctgat atgcattgtg atgagttcct ttttaacgct gtaatgtttc 660 attggccctg agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt 720 tgcttctggg atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag 780 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 840 ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 900 ctgaagctga tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 960 ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc 1020 ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 1080 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 1140 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1200 aactacaaca gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc 1260 aacttcaaga tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag 1320 cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac 1380 cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1440 gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg 1500 ccgcggccgc gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg 1560 actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 1620 ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 1680 ttagttcttg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1740 cggctgttgg gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg 1800 ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1860 cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1920 tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1980 gcatgagatc tcacgtgcgg accgagcggc cgc 2013 <210> 130 <211> 1705 <212> DNA <213> Artificial Sequence <220> <223> CN2686 <400> 130 gcggccgcac gcgtaggcac cactttaagg gcctttatca ttatccacaa cagcagcagc 60 agcatgagta gcattaggaa tgcgtttcct cctgtgcttt gaggcttacg taggtctttc 120 ttctgcatcg tttcatgaaa ttctcacaag aacactatga ggtaggtgtc agatgtccat 180 tttacaggac agaaaagaga ttaaaaaaaa gagagagaga gaggaaaaag ggctttattc 240 aaagccaagt cagttcatat gggcagagcc aggacttgaa cgcaggcccc acagtcttaa 300 ctccaatatt ttcagctgcc ttgggaactt cttggaagag cccattccat tttcctgcca 360 tgagctcggg ctgggcataa aagtcagggc agagccatct attgcttaca tttgcttctg 420 ggatccagat ctttcgaagc tagcgctacc ggtcgccacc atggtgagca agggcgagga 480 gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 540 gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagct 600 gatctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgggcta 660 cggcgtgcag tgcttcgccc gctaccccga ccacatgaag cagcacgact tcttcaagtc 720 cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 780 caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 840 gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 900 cagccacaac gtctatatca ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa 960 gatccgccac aacatcgagg acggcggcgt gcagctcgcc gaccactacc agcagaacac 1020 ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagct accagtccaa 1080 gctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 1140 cgccgggatc actctcggca tggacgagct gtacaagtaa gtcgacggcg cgccgcggcc 1200 gcgaattcga tatcataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 1260 tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 1320 tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttagttct 1380 tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 1440 gggcactgac aattccgtgg ctcgagagat cttcgactgt gccttctagt tgccagccat 1500 ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc 1560 tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg 1620 ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgaga 1680 tctcacgtgc ggaccgagcg gccgc 1705 <210> 131 <211> 1770 <212> DNA <213> Artificial Sequence <220> <223> CN2687 <400> 131 gcggccgcac gcgtgcggca ggaatttaaa gaggcagaag ttcatttcct gtgatttatg 60 ggactttgct gactttcacg ctccggttct agggacaggg agaccctccc tgcgggagcc 120 gctgctagag ggaaaggcag cgttggatcg gatgccggcc ccagcctggg agacgtgctt 180 cctctgcagc ctgtgatcag gagcgaagtg tagagaccag aatcgttcag aggcagggct 240 ggtccctgtt gatttatgac tcaggcaaac agtccattca tccgtcagcg gctccacttc 300 tatccccagc ttactggagg cagaagaatg tcccctggaa gtggtctgag ctgcttcctg 360 tggtggcccc attcctccgg gtgggggatc ctatttttag agggccacca ttgccatgaa 420 ggtccagagc tcgggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 480 ttctgggatc cagatctttc gaagctagcg ctaccggtcg ccaccatggt gagcaagggc 540 gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 600 cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 660 aagctgatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 720 ggctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca cgacttcttc 780 aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 840 aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 900 ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 960 tacaacagcc acaacgtcta tatcaccgcc gacaagcaga agaacggcat caaggccaac 1020 ttcaagatcc gccacaacat cgaggacggc ggcgtgcagc tcgccgacca ctaccagcag 1080 aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagctaccag 1140 tccaagctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 1200 accgccgccg ggatcactct cggcatggac gagctgtaca agtaagtcga cggcgcgccg 1260 cggccgcgaa ttcgatatca taatcaacct ctggattaca aaatttgtga aagattgact 1320 ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 1380 tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggtta 1440 gttcttgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 1500 ctgttgggca ctgacaattc cgtggctcga gagatcttcg actgtgcctt ctagttgcca 1560 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 1620 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 1680 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 1740 tgagatctca cgtgcggacc gagcggccgc 1770 <210> 132 <211> 2098 <212> DNA <213> Artificial Sequence <220> <223> CN2878 <400> 132 gcggccgcac gcgtaggaca acttgactta tgcaaatgaa caatataaat tttagaacta 60 tgtataaata attaaataag tacatggact tacaggaagg aatgaatacc ttcagagtat 120 gctgtagtat atttcctgaa tgtatagatt aagctatata attgtcaatg agctgttgta 180 ttacgtataa ttcagggttt aaacaaaata aaaatgtgtg catatgtttt atgcaaatgc 240 atgtattttt gaatcaatga taatcccaca ctttttataa tgattcatac ccgctcaaag 300 tgatgaaaat aattgacctg taaatgttta tttttaagta gaaaaaaatc tctgtgaggc 360 tcagagaaca tgttgataca gggggagagg gaatgtacag agtagcatgc tcttgtaagt 420 tgctccaagg caacgcatga ctactgcggt cttgacctaa cagctgcaca gaccttcaga 480 agattgtatc catctacatt tcattatgga gccaagaatg gctcatgaaa cttctgccct 540 ccctgggagc atgtaggcag ttaatttgaa tggtaatttt atgtacaagg agatagaata 600 ttttcagtga tgtcaccact ggtttgtcac aatgctttct ataaatgccc aaatcctgta 660 agtattctta atgaaaacca ttgacttacg cactaatagg aaattaaagt ggaaacagat 720 gttctatttt tatttatgct gctgtgatca acacgagctc gggctgggca taaaagtcag 780 ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga agctagcgct 840 accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 900 ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 960 cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca agctgcccgt 1020 gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc 1080 cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 1140 gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 1200 gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 1260 catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcaccgccga 1320 caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg aggacggcgg 1380 cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 1440 gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca acgagaagcg 1500 cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 1560 gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata atcaacctct 1620 ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 1680 atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 1740 tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca tcgccgcctg 1800 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggctcgaga 1860 gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1920 ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1980 cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 2040 gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga gcggccgc 2098 <210> 133 <211> 1798 <212> DNA <213> Artificial Sequence <220> <223> CN2946 <400> 133 gcggccgcac gcgtaacatg tatttgtgga gtggctaaat tgagatatat caccttaaaa 60 tcaactccca gcaatttgaa gagcacagta agtaagacct tgttcctaac cacagtcgcc 120 atgcagtgca gtagagccca gatcttacac ttcctgtgta actggagtct tgtgttcttt 180 agccaagctc ttcccacatg cgagtcattt tcaattcaaa atactagtta ttttcagttt 240 aagaatcagt ctgatttctt gagcatagtg cttatcttat atggtatggc tttcagctcc 300 ctggagattt cctgggtgtg ctgctgtgcc tttgcctcca ggataaatgc catgctgaga 360 agagcatgac tctgtcagca caggcagacg gtggaaactt tacctttgcg acctctctgc 420 agcctcaggg tagcagggga tggcatggtt tcatgagctc gggctgggca taaaagtcag 480 ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga agctagcgct 540 accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 600 ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 660 cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca agctgcccgt 720 gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc 780 cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 840 gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 900 gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 960 catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcaccgccga 1020 caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg aggacggcgg 1080 cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 1140 gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca acgagaagcg 1200 cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 1260 gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata atcaacctct 1320 ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 1380 atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 1440 tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca tcgccgcctg 1500 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggctcgaga 1560 gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1620 ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1680 cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 1740 gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga gcggccgc 1798 <210> 134 <211> 1748 <212> DNA <213> Artificial Sequence <220> <223> CN2943 <400> 134 gcggccgcac gcgttctcaa cactaagaaa actgcagtat gaagatatgg aatttgaggc 60 cagtttgaga taaaacagaa agatatgagc aaaagacaag gatgtgagaa acataaataa 120 aaactatgca tattcatgaa gcaccgcata atagtttcat atggatacac atcccatgat 180 gtttaaagca ggcttatcat ttttatcttt tcaaacattt aacacttatg ttaatatatg 240 taaactcagt catttttagc cttctgagag aacctgcatc atttttaatc actcttccgt 300 tcagtaggat tcttgaatta ttatcatagt taaccatagc tgagtaatca aacctcaatt 360 gtaaatttga aaatttaccc ttctattctt ttcttgcaat aaaagagctc gggctgggca 420 taaaagtcag ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga 480 agctagcgct accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg 540 tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 600 agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca 660 agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg 720 cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 780 acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 840 tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 900 aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 960 tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg 1020 aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 1080 ccgtgctgct gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca 1140 acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 1200 gcatggacga gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata 1260 atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 1320 cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 1380 tggctttcat tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca 1440 tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg 1500 tggctcgaga gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 1560 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 1620 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 1680 gacagcaagg gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga 1740 gcggccgc 1748 <210> 135 <211> 2069 <212> DNA <213> Artificial Sequence <220> <223> CN3319 <400> 135 gcggccgcac gcgtcaacaa accagggaat ctactgtata gtgaagcagg attgtgaaaa 60 ggccattcat ataagagaac tccagatggc tgacacagat atggtagtgt taaatctttc 120 tgataaccaa gaggctcaag ttaaactgag atttcccttt atacactgtg aatctgtaaa 180 cattacaacc ttccagaata ccaagtactg tctagactga gacataagaa ccttgttaca 240 aggtgtgtgg ctttctagaa tgaagtcagt ttacaatatt tgaaaaaaat tagtatgcat 300 accctagacc tagcaatggc atctactgtt actttatagg tatgggaact ggtgacagat 360 aagattcaat gtgaaaagaa tggataacta aaatatattg gaagcacagt atgaaataat 420 atgcagtggg taggtggaat gagtgatgac gtataactcc atgctaacta tagtgtggag 480 agaatgcaaa gtacgccaga gaacaggatg tattgttaag tatgtaaatt aattccatgc 540 acataataag cttacttatt ttttcaatga caaatacatt tatatattca atgacatgca 600 tggaaatttc tagaatgtct agagcggagg aggggaaatg gatctgagtt caggaatgaa 660 ttagcaaaag aataaaaaat gcacatgtga aggtattaac ataaggcctt agaagcctgt 720 gtgtcgagct cgggctgggc ataaaagtca gggcagagcc atctattgct tacatttgct 780 tctgggatcc agatctttcg aagctagcgc taccggtcgc caccatggtg agcaagggcg 840 aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc 900 acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga 960 agctgatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccctgg 1020 gctacggcgt gcagtgcttc gcccgctacc ccgaccacat gaagcagcac gacttcttca 1080 agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca 1140 actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc 1200 tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact 1260 acaacagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc aaggccaact 1320 tcaagatccg ccacaacatc gaggacggcg gcgtgcagct cgccgaccac taccagcaga 1380 acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agctaccagt 1440 ccaagctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga 1500 ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgac ggcgcgccgc 1560 ggccgcgaat tcgatatcat aatcaacctc tggattacaa aatttgtgaa agattgactg 1620 gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 1680 atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttag 1740 ttcttgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc 1800 tgttgggcac tgacaattcc gtggctcgag agatcttcga ctgtgccttc tagttgccag 1860 ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 1920 gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 1980 ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 2040 gagatctcac gtgcggaccg agcggccgc 2069 <210> 136 <211> 2147 <212> DNA <213> Artificial Sequence <220> <223> CN2918 <400> 136 gcggccgcac gcgtctatga atagttacaa gtgagaaaga gaaatggaga ttttaccatt 60 taatcatctc cgaagagaag gtgagaagaa attgagaaag gtaatttgca taccatgcat 120 aggcattaga gaaagcattt tttttcttaa ctctccattt gtttacagat atttccatat 180 ggccttttaa aaacttcaac agagaaattc gaacacaact aactggaatt tcaattttca 240 tataaaacca gcatcataga tatatatgta gctactctcc tatgaatagt tacaagtgag 300 aaagagaaat ggagatttta ccatttaatc atctccgaag agaaggtgag aagaaattga 360 gaaaggtaat ttgcatacca tgcataggca ttagagaaag catttttttt cttaactctc 420 catttgttta cagatatttc catatggcct tttaaaaact tcaacagaga aattcgaaca 480 caactaactg gaatttcaat tttcatataa aaccagcatc atagatatat atgtagctac 540 tctcctatga atagttacaa gtgagaaaga gaaatggaga ttttaccatt taatcatctc 600 cgaagagaag gtgagaagaa attgagaaag gtaatttgca taccatgcat aggcattaga 660 gaaagcattt tttttcttaa ctctccattt gtttacagat atttccatat ggccttttaa 720 aaacttcaac agagaaattc gaacacaact aactggaatt tcaattttca tataaaacca 780 gcatcataga tatatatgta gctactctcg agctcgggct gggcataaaa gtcagggcag 840 agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 900 tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 960 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 1020 ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 1080 ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 1140 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 1200 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 1260 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1320 tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 1380 agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1440 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1500 acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1560 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1620 acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1680 acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1740 gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1800 cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1860 cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1920 tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1980 accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 2040 tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 2100 gattgggaag acaatagcag gcatgcacgt gcggaccgag cggccgc 2147 <210> 137 <211> 2105 <212> DNA <213> Artificial Sequence <220> <223> CN3018 <400> 137 gcggccgcac gcgtaatttt aggatgttct taaatagatc gattcttcta ctttttttaa 60 aaataacata gatctgaaaa gctttataac ttttggtttt ttttttaagg accatattaa 120 cagcatcttc cagtttttct agagtaaatg aatatgtatc ccttttataa ttaacaatat 180 acatatattc attttgtaaa aagactataa aaatagaaga gaaaatgaag agatgtttat 240 ttcttttaca cgcatcagac taaggaattt taggatgttc ttaaatagat cgattcttct 300 acttttttta aaaataacat agatctgaaa agctttataa cttttggttt tttttttaag 360 gaccatatta acagcatctt ccagtttttc tagagtaaat gaatatgtat cccttttata 420 attaacaata tacatatatt cattttgtaa aaagactata aaaatagaag agaaaatgaa 480 gagatgttta tttcttttac acgcatcaga ctaaggaatt ttaggatgtt cttaaataga 540 tcgattcttc tacttttttt aaaaataaca tagatctgaa aagctttata acttttggtt 600 ttttttttaa ggaccatatt aacagcatct tccagttttt ctagagtaaa tgaatatgta 660 tcccttttat aattaacaat atacatatat tcattttgta aaaagactat aaaaatagaa 720 gagaaaatga agagatgttt atttctttta cacgcatcag actaagggag ctcgggctgg 780 gcataaaagt cagggcagag ccatctattg cttacatttg cttctgggat ccagatcttt 840 cgaagctagc gctaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg 900 tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 960 gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc tgcaccaccg 1020 gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc gtgcagtgct 1080 tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 1140 gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 1200 aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 1260 aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 1320 atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaaca 1380 tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 1440 gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg agcaaagacc 1500 ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 1560 tcggcatgga cgagctgtac aagtaagtcg acggcgcgcc gcggccgcga attcgatatc 1620 ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 1680 ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 1740 gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 1800 tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 1860 ccgtggctcg agagatcttc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 1920 tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 1980 gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 2040 caggacagca agggggagga ttgggaagac aatagcaggc atgcacgtgc ggaccgagcg 2100 gccgc 2105 <210> 138 <211> 1937 <212> DNA <213> Artificial Sequence <220> <223> CN3030 <400> 138 gcggccgcac gcgtctgttc tatctattcc tgggcttcca ccacactgtg ttaatgagga 60 taactttaaa atacatcttg atatttagta gagcgcattt ccacgcctga ttcatcacga 120 gcaccttaac ttgtcttggt tcttctgcgg agatgttggc accagcttct tcacccgtga 180 ctccagcttc tggggaacct gtgctctcac tgttctatct attcctgggc ttccaccaca 240 ctgtgttaat gaggataact ttaaaataca tcttgatatt tagtagagcg catttccacg 300 cctgattcat cacgagcacc ttaacttgtc ttggttcttc tgcggagatg ttggcaccag 360 cttcttcacc cgtgactcca gcttctgggg aacctgtgct ctcactgttc tatctattcc 420 tgggcttcca ccacactgtg ttaatgagga taactttaaa atacatcttg atatttagta 480 gagcgcattt ccacgcctga ttcatcacga gcaccttaac ttgtcttggt tcttctgcgg 540 agatgttggc accagcttct tcacccgtga ctccagcttc tggggaacct gtgctctcag 600 agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg 660 atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc 720 tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 780 tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga 840 tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg 900 gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 960 ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 1020 agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 1080 gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 1140 gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga 1200 tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc 1260 ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc 1320 tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 1380 ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc 1440 gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 1500 ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 1560 ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg 1620 ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg 1680 gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct 1740 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1800 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1860 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgcacgt 1920 gcggaccgag cggccgc 1937 <210> 139 <211> 2072 <212> DNA <213> Artificial Sequence <220> <223> CN3027 <400> 139 gcggccgcac gcgtccgcag ctttggaaaa gaccttctta ttttaactta tgtaattaac 60 catcccaaat ttaccctgat cctcactgga aatgtcttcc ctttcctgat atttaccaca 120 gttttaaaaa gtcttagatg ggtatgcata tttgagaaat acgtagagtt aattagtgcg 180 tagatgtgtt tttaagttgc ataaaacata ttgtgctttg gcatagctcc ctttgtaact 240 tattttagga aaccccgcag ctttggaaaa gaccttctta ttttaactta tgtaattaac 300 catcccaaat ttaccctgat cctcactgga aatgtcttcc ctttcctgat atttaccaca 360 gttttaaaaa gtcttagatg ggtatgcata tttgagaaat acgtagagtt aattagtgcg 420 tagatgtgtt tttaagttgc ataaaacata ttgtgctttg gcatagctcc ctttgtaact 480 tattttagga aaccccgcag ctttggaaaa gaccttctta ttttaactta tgtaattaac 540 catcccaaat ttaccctgat cctcactgga aatgtcttcc ctttcctgat atttaccaca 600 gttttaaaaa gtcttagatg ggtatgcata tttgagaaat acgtagagtt aattagtgcg 660 tagatgtgtt tttaagttgc ataaaacata ttgtgctttg gcatagctcc ctttgtaact 720 tattttagga aaccgagctc gggctgggca taaaagtcag ggcagagcca tctattgctt 780 acatttgctt ctgggatcca gatctttcga agctagcgct accggtcgcc accatggtga 840 gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg 900 taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc 960 tgaccctgaa gctgatctgc accaccggca agctgcccgt gccctggccc accctcgtga 1020 ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc cgaccacatg aagcagcacg 1080 acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg 1140 acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc 1200 gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg 1260 agtacaacta caacagccac aacgtctata tcaccgccga caagcagaag aacggcatca 1320 aggccaactt caagatccgc cacaacatcg aggacggcgg cgtgcagctc gccgaccact 1380 accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga 1440 gctaccagtc caagctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg 1500 agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag taagtcgacg 1560 gcgcgccgcg gccgcgaatt cgatatcata atcaacctct ggattacaaa atttgtgaaa 1620 gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 1680 tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 1740 cctggttagt tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 1800 gggctcggct gttgggcact gacaattccg tggctcgaga gatcttcgac tgtgccttct 1860 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 1920 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 1980 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 2040 agcaggcatg cacgtgcgga ccgagcggcc gc 2072 <210> 140 <211> 2033 <212> DNA <213> Artificial Sequence <220> <223> CN3032 <400> 140 gcggccgcac gcgttttgtg tctgctattg catttacata gtgacatagg cttacaggat 60 attgtaaatg tcatccctag atacatttat gtaacctttt tttaaaataa aactctaaca 120 aatgttagtt attgtgcact atggttttga atatttgaat ttgctttgct cagatctaaa 180 taacttctga taagtttggc attcaggaaa gagtaaatgt aaatgtagaa atgcttggaa 240 ttttgtgtct gctattgcat ttacatagtg acataggctt acaggatatt gtaaatgtca 300 tccctagata catttatgta accttttttt aaaataaaac tctaacaaat gttagttatt 360 gtgcactatg gttttgaata tttgaatttg ctttgctcag atctaaataa cttctgataa 420 gtttggcatt caggaaagag taaatgtaaa tgtagaaatg cttggaattt tgtgtctgct 480 attgcattta catagtgaca taggcttaca ggatattgta aatgtcatcc ctagatacat 540 ttatgtaacc tttttttaaa ataaaactct aacaaatgtt agttattgtg cactatggtt 600 ttgaatattt gaatttgctt tgctcagatc taaataactt ctgataagtt tggcattcag 660 gaaagagtaa atgtaaatgt agaaatgctt ggaatgagct cgggctgggc ataaaagtca 720 gggcagagcc atctattgct tacatttgct tctgggatcc agatctttcg aagctagcgc 780 taccggtcgc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 840 tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 900 gcgatgccac ctacggcaag ctgaccctga agctgatctg caccaccggc aagctgcccg 960 tgccctggcc caccctcgtg accaccctgg gctacggcgt gcagtgcttc gcccgctacc 1020 ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 1080 agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 1140 agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 1200 acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcaccgccg 1260 acaagcagaa gaacggcatc aaggccaact tcaagatccg ccacaacatc gaggacggcg 1320 gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 1380 tgcccgacaa ccactacctg agctaccagt ccaagctgag caaagacccc aacgagaagc 1440 gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 1500 agctgtacaa gtaagtcgac ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc 1560 tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 1620 tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 1680 ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc atcgccgcct 1740 gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggctcgag 1800 agatcttcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 1860 tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 1920 tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 1980 ggggaggatt gggaagacaa tagcaggcat gcacgtgcgg accgagcggc cgc 2033 <210> 141 <211> 2057 <212> DNA <213> Artificial Sequence <220> <223> CN3015 <400> 141 gcggccgcac gcgtcattga ctcattttta ttttgtgagg aagaaatttt ccatttgtct 60 gtgtaattac atttgctaat ttctaaaaca attcctggga tttatatcta tatatgcctc 120 aggaacatac agggaagatc atactgttct ctgaatttca aattatgttt tctgttttat 180 ttcatgaatt tattattttt ctttgtctct gtctgtctct ctctgtgtgt atgtgtatgc 240 gtgtatatgc attgactcat ttttattttg tgaggaagaa attttccatt tgtctgtgta 300 attacatttg ctaatttcta aaacaattcc tgggatttat atctatatat gcctcaggaa 360 catacaggga agatcatact gttctctgaa tttcaaatta tgttttctgt tttatttcat 420 gaatttatta tttttctttg tctctgtctg tctctctctg tgtgtatgtg tatgcgtgta 480 tatgcattga ctcattttta ttttgtgagg aagaaatttt ccatttgtct gtgtaattac 540 atttgctaat ttctaaaaca attcctggga tttatatcta tatatgcctc aggaacatac 600 agggaagatc atactgttct ctgaatttca aattatgttt tctgttttat ttcatgaatt 660 tattattttt ctttgtctct gtctgtctct ctctgtgtgt atgtgtatgc gtgtatatgg 720 agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg 780 atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc 840 tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 900 tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga 960 tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg 1020 gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 1080 ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 1140 agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 1200 gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 1260 gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga 1320 tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc 1380 ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc 1440 tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 1500 ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc 1560 gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 1620 ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 1680 ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg 1740 ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg 1800 gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct 1860 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1920 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1980 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgcacgt 2040 gcggaccgag cggccgc 2057 <210> 142 <211> 1991 <212> DNA <213> Artificial Sequence <220> <223> CN3012 <400> 142 gcggccgcac gcgtttttca ttcctggagg taaaaccaac cttagaatcg tggagcctga 60 tagactttga aattggcctt cattttaatt ctcaagttct tagcatgaga gcaacattca 120 atatggttct gaaatatctc atgcaaaaaa gtgccagagt catagactga aatatttatt 180 tgaatataaa tgaactcaga tttgccaaaa tgcgctcccc ctgttgtttt tcattcctgg 240 aggtaaaacc aaccttagaa tcgtggagcc tgatagactt tgaaattggc cttcatttta 300 attctcaagt tcttagcatg agagcaacat tcaatatggt tctgaaatat ctcatgcaaa 360 aaagtgccag agtcatagac tgaaatattt atttgaatat aaatgaactc agatttgcca 420 aaatgcgctc cccctgttgt ttttcattcc tggaggtaaa accaacctta gaatcgtgga 480 gcctgataga ctttgaaatt ggccttcatt ttaattctca agttcttagc atgagagcaa 540 cattcaatat ggttctgaaa tatctcatgc aaaaaagtgc cagagtcata gactgaaata 600 tttatttgaa tataaatgaa ctcagatttg ccaaaatgcg ctccccctgt tgtgagctcg 660 ggctgggcat aaaagtcagg gcagagccat ctattgctta catttgcttc tgggatccag 720 atctttcgaa gctagcgcta ccggtcgcca ccatggtgag caagggcgag gagctgttca 780 ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 840 tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ctgatctgca 900 ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgggc tacggcgtgc 960 agtgcttcgc ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1020 ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1080 gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1140 acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1200 acgtctatat caccgccgac aagcagaaga acggcatcaa ggccaacttc aagatccgcc 1260 acaacatcga ggacggcggc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 1320 gcgacggccc cgtgctgctg cccgacaacc actacctgag ctaccagtcc aagctgagca 1380 aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 1440 tcactctcgg catggacgag ctgtacaagt aagtcgacgg cgcgccgcgg ccgcgaattc 1500 gatatcataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 1560 atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 1620 cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttagtt cttgccacgg 1680 cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 1740 acaattccgt ggctcgagag atcttcgact gtgccttcta gttgccagcc atctgttgtt 1800 tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1860 taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 1920 gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc acgtgcggac 1980 cgagcggccg c 1991 <210> 143 <211> 2186 <212> DNA <213> Artificial Sequence <220> <223> CN3024 <400> 143 gcggccgcac gcgtcatgaa catttagtca tcgttatctt acatgagtca tatctgtgtc 60 cttattgtct tatcttaaat gcattaatta attcgataga gcatctataa aaatgaaacg 120 ctattcaaaa gctggcccat gacaagatca gtgtgttggt ttctatgcct atagtggtgc 180 aatggaagga gtgcgctgta ccccacagac tttgtgattg atgagttgtc tactttattc 240 acaatgaagc taaaaacaat ctaacaacca tcagggtgct acagcagcac agcatgaaca 300 tttagtcatc gttatcttac atgagtcata tctgtgtcct tattgtctta tcttaaatgc 360 attaattaat tcgatagagc atctataaaa atgaaacgct attcaaaagc tggcccatga 420 caagatcagt gtgttggttt ctatgcctat agtggtgcaa tggaaggagt gcgctgtacc 480 ccacagactt tgtgattgat gagttgtcta ctttattcac aatgaagcta aaaacaatct 540 aacaaccatc agggtgctac agcagcacag catgaacatt tagtcatcgt tatcttacat 600 gagtcatatc tgtgtcctta ttgtcttatc ttaaatgcat taattaattc gatagagcat 660 ctataaaaat gaaacgctat tcaaaagctg gcccatgaca agatcagtgt gttggtttct 720 atgcctatag tggtgcaatg gaaggagtgc gctgtacccc acagactttg tgattgatga 780 gttgtctact ttattcacaa tgaagctaaa aacaatctaa caaccatcag ggtgctacag 840 cagcacagga gctcgggctg ggcataaaag tcagggcaga gccatctatt gcttacattt 900 gcttctggga tccagatctt tcgaagctag cgctaccggt cgccaccatg gtgagcaagg 960 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1020 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1080 tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1140 tgggctacgg cgtgcagtgc ttcgcccgct accccgacca catgaagcag cacgacttct 1200 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1260 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1320 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1380 actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc atcaaggcca 1440 acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac cactaccagc 1500 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagctacc 1560 agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1620 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc gacggcgcgc 1680 cgcggccgcg aattcgatat cataatcaac ctctggatta caaaatttgt gaaagattga 1740 ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 1800 tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 1860 tagttcttgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 1920 ggctgttggg cactgacaat tccgtggctc gagagatctt cgactgtgcc ttctagttgc 1980 cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2040 actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2100 attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 2160 catgcacgtg cggaccgagc ggccgc 2186 <210> 144 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Change from AAV9 to PHP.eB <400> 144 Ser Ala Gln Ala 1 <210> 145 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Change from AAV9 to PHP.eB <400> 145 Ser Asp Gly Thr Leu Ala Val Pro Phe Lys Ala 1 5 10 <210> 146 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> AAV-BR1 <400> 146 Asn Arg Gly Thr Glu Trp Asp 1 5 <210> 147 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> AAV-PHP.S <400> 147 Gln Ala Val Arg Thr Ser Leu 1 5 <210> 148 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> AAV-PHP.B <400> 148 Thr Leu Ala Val Pro Phe Lys 1 5 <210> 149 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> AAV-PPS <400> 149 Asp Ser Pro Ala His Pro Ser 1 5

Claims

(i) eHGT_453m, eHGT_450m, eHGT_451m, eHGT_452m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 또는 3xcore2_eHGT_460m으로부터 선택된 인핸서; (ii) 프로모터; 및 (iii) 이종 암호화 서열을 포함하는 인공 발현 작제물.
제1항에 있어서, 상기 이종 암호화 서열이 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 인공 발현 작제물.
제2항에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 인공 발현 작제물.
제3항에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 인공 발현 작제물.
제3항에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, 디자이너 약물에 의해 배타적으로 활성화되는 디자이너 수용체(DREADD), 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.
제2항에 있어서, 상기 발현가능한 요소가 비-기능성 분자를 포함하는 것인, 인공 발현 작제물.
제6항에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.
제1항에 있어서, 상기 인공 발현 작제물이 혈액 뇌 장벽을 가로지르는 캡시드와 회합하는 것인, 인공 발현 작제물.
제8항에 있어서, 상기 캡시드가 PHP.eB, AAV-BR1, AAV-PHP.S, AAV-PHP.B, 또는 AAV-PPS를 포함하는 것인, 인공 발현 작제물.
제1항에 있어서, 상기 인공 발현 작제물이 스킵핑 요소를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물.
제10항에 있어서, 상기 스킵핑 요소가 2A 펩티드 및/또는 내부 리보솜 진입 부위(IRES)를 포함하는 것인, 인공 발현 작제물.
제11항에 있어서, 상기 2A 펩티드가 T2A, P2A, E2A, 또는 F2A를 포함하는 것인, 인공 발현 작제물.
제1항에 있어서, 상기 인공 발현 작제물이 eHGT_453m, eHGT_450m, eHGT_451m, eHGT_452m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 3xcore2_eHGT_460m, AAV, scAAV, rAAv, minBglobin, CMV, minCMV, minRho, minRho^*, 형광 단백질(예를 들어, EGFP, SYFP, SYFP2, GFP), Cre, iCre, dgCre, FlpO, tTA2, SP10, WPRE, WPRE3, 및/또는 BGHpA으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물.
제1항에 있어서, 상기 인공 발현 작제물이 다음으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물:
eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_450m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_458m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_463m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_692h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_693h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_694h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_695h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_667m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_668m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_696m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_455m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_603m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_604m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_605m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_661m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_766m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_767m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_768m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_663m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_660m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_665m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_700m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_456m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_698m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_699m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_647m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_648m-minBglobin-이종 코딩 서열 WPRE3-BGHpA;
eHGT_649m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_670m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_697m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_662m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_583m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_450m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_451m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_458m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_463m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_692h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_693h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_694h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_695h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_667m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_668m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_696m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_455m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_603m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_604m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_605m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_661m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_766m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_767m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_768m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_663m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_660m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_665m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_700m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_456m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_698m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_699m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_647m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_648m- 최소 프로모터 -이종 코딩 서열 WPRE3-BGHpA;
eHGT_649m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_670m- 최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_697m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_662m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_583m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_451m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA; 또는
3xcore2_eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA.
제1항의 인공 발현 작제물을 포함하는 벡터.
제15항에 있어서, 상기 벡터가 바이러스 벡터를 포함하는 것인, 벡터.
제15항에 있어서, 상기 바이러스 벡터가 재조합 아데노-연관 바이러스(AAV) 벡터를 포함하는 것인, 벡터.
적어도 하나의 이종 암호화 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터로서, 상기 이종 암호화 서열은 eHGT_453m, eHGT_450m, eHGT_451m, eHGT_452m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m으로부터 선택된 프로모터 및 인핸서의 제어 하에 있는 것인, 아데노-연관 바이러스(AAV) 벡터.
제1항의 인공 발현 작제물을 포함하는 유전자이식 세포.
제19항에 있어서, 상기 유전자이식 세포가 L5 ET 뉴런인, 유전자이식 세포.
제1항의 인공 발현 작제물을 포함하는 비-인간 유전자이식 동물.
제21항에 있어서, 상기 비-인간 유전자이식 동물이 마우스 또는 비-인간 영장류인, 비-인간 유전자이식 동물.
제1항의 인공 발현 작제물을 포함하는 투여가능한 조성물.
제1항의 인공 발현 작제물을 포함하는 키트.
생체내 또는 시험관내 세포 집단 내에서 이종 유전자를 선택적으로 발현하는 방법으로서, 상기 방법은 제23항의 투여가능한 조성물을 충분한 투여량 및 충분한 시간 동안 세포 집단을 포함하는 샘플 또는 대상체에게 제공하여 세포 집단 내에서 유전자를 선택적으로 발현하는 단계를 포함하는 것인, 방법.
제25항에 있어서, 상기 이종 유전자가 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 방법.
제26항에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 방법.
제27항에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 방법.
제27항에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.
제26항에 있어서, 상기 발현가능한 요소가 비-기능성 분자를 포함하는 것인, 방법.
제30항에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.
제25항에 있어서, 상기 제공하는 단계가 피펫팅을 포함하는 것인, 방법.
제32항에 있어서, 상기 피펫팅이 뇌 절편에 대한 것인, 방법.
제33항에 있어서, 상기 뇌 절편이 L5 ET 뉴런을 포함하는 것인, 방법.
제33항에 있어서, 상기 뇌 절편이 뮤린, 인간, 또는 비-인간 영장류인, 방법.
제25항에 있어서, 상기 제공하는 단계가 살아있는 대상체에게 투여하는 것을 포함하는 것인, 방법.
제36항에 있어서, 상기 살아있는 대상체가 인간, 비-인간 영장류, 또는 마우스인, 방법.
제36항에 있어서, 상기 살아있는 대상체에게 투여하는 것이 주사를 통한 것인, 방법.
제38항에 있어서, 상기 주사가 정맥내 주사, 뇌 조직 내에 뇌실질내 주사, 뇌실내(ICV) 주사, 대조내(ICM) 주사, 또는 척추강내 주사를 포함하는 것인, 방법.
제36항에 있어서, 상기 살아있는 대상체가 신경퇴행성 질환을 갖는 것인, 방법.
제36항에 있어서, 상기 살아있는 대상체가 근위축성 측삭 경화증(ALS) 또는 다발성 경화증을 갖는 것인, 방법.
CN2251, CN2248, CN2249, CN2250, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 또는 CN3024를 포함하는 인공 발현 작제물.
eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 또는 eHGT_460m 인핸서의 연쇄된 코어(concatenated core).
제43항에 있어서, 상기 연쇄된 코어가 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 또는 서열번호: 52에 제시된 서열을 갖는 것인, 연쇄된 코어.
제43항에 있어서, 상기 연쇄된 코어가 인핸서 코어의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 갖는 것인, 연쇄된 코어.
제43항에 있어서,
서열번호: 45의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 46, 서열번호: 47의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 48의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 49의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 50의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 51의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피, 또는
서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 갖는, 연쇄된 코어.
제43항에 있어서, 서열번호: 45의 3 개 카피; 서열번호: 46의 3 개 카피; 서열번호: 47의 3 개 카피; 서열번호: 48의 3 개 카피; 서열번호: 49의 3 개 카피; 서열번호: 50의 3 개 카피; 서열번호: 51의 3 개 카피; 또는 서열번호: 52의 3 개 카피를 갖는, 연쇄된 코어.
제43항에 있어서, 상기 연쇄된 코어가 서열번호: 53; 서열번호: 54; 서열번호: 55; 서열번호: 56; 서열번호: 57; 서열번호: 58; 서열번호: 59; 또는 서열번호: 60에 제시된 바와 같은 서열을 갖는 것인, 연쇄된 코어.