KR20230002788A - 신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물 - Google Patents
신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물 Download PDFInfo
- Publication number
- KR20230002788A KR20230002788A KR1020227040046A KR20227040046A KR20230002788A KR 20230002788 A KR20230002788 A KR 20230002788A KR 1020227040046 A KR1020227040046 A KR 1020227040046A KR 20227040046 A KR20227040046 A KR 20227040046A KR 20230002788 A KR20230002788 A KR 20230002788A
- Authority
- KR
- South Korea
- Prior art keywords
- ehgt
- wpre3
- bghpa
- coding sequence
- heterologous coding
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Public Health (AREA)
- Neurosurgery (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Neurology (AREA)
- Medicinal Chemistry (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Psychiatry (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Hospice & Palliative Care (AREA)
- Epidemiology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Prostheses (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
선택된 중추신경계 세포 유형에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물이 기재된다. 특히, 인공 발현 작제물은 글루타메이트성 레이어 5 종뇌외-투사(L5 ET) 뉴런과 같은 신피질 글루타메이트성 레이어 5 뉴런에서 합성 유전자를 선택적으로 발현하고/하거나 유전자 발현을 변형시키는 데 사용될 수 있다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 4월 21일 출원된 미국 가특허 출원 번호 63/013,342에 대한 우선권을 주장하며 본원에 완전히 제시된 것처럼 그 전문이 참조로 본원에 포함된다.
연방 지원 연구 또는 개발에 관한 진술
본 발명은 국립보건원에 의해 수여된 보조금 MH114126 및 MH121274 하에 정부 지원으로 이루어졌다. 정부는 발명에 대한 특정 권리는 갖는다.
서열 목록에 대한 참조
본 출원과 연관된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며 이에 의해 명세서에 참조로 포함된다. 서열 목록을 함유하는 텍스트 파일명은 A166-0024PCT_ST25.txt이다. 텍스트 파일은 211 KB이며, 2021년 4월 21일에 생성되었고, EFS-Web을 통해 전자적으로 제출되고 있다.
개시내용의 분야
본 개시내용은 선택된 중추신경계 세포 유형에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물을 제공한다. 인공 발현 작제물은 레이어 5 글루타메이트성 종뇌외-투사(L5 ET) 뉴런과 같은 신피질 레이어 5 글루타메이트성 뉴런에서 합성 유전자를 선택적으로 발현하거나 또는 유전자 발현을 변형시키는 데 사용될 수 있다.
뇌의 생물학을 완전히 이해하기 위해, 상이한 세포 유형을 구별하고 정의해야 하며, 이들을 추가로 연구하기 위해, 선택적으로 표지하고 교란할 수 있는 인공 발현 작제물을 식별해야 한다. 마우스에서, 재조합효소 구동인자 계열을 사용하여 마커 유전자 발현을 공유하는 세포 집단을 표지하는 데 크게 영향을 미쳤다. 그러나, 높은 특이성을 갖는 세포 유형을 표지하는 이러한 계열의 생성, 유지, 및 사용은 비용이 들 수 있고, 삼중 유전자이식 교배를 빈번하게 필요로 하여, 실험 동물의 낮은 빈도를 산출한다. 또한, 이들 도구는 생식계열 유전자이식 동물을 필요로 하며 따라서 인간에게 적용가능하지 않다.
본 개시내용은 표적화된 중추신경계 세포 집단에서 유전자 발현을 선택적으로 구동하는 인공 발현 작제물을 제공한다. 표적화된 중추신경계 세포 집단은 신피질 글루타메이트성 레이어 5 뉴런, 예컨대 신피질 글루타메이트성 레이어 5 종뇌외-투사(L5 ET) 뉴런을 포함한다. 특정 적용에서, 본 출원의 측면은 예를 들어, 근위축성 측삭 경화증(ALS) 또는 L5 ET 뉴런을 수반하는 다른 신경퇴행성 질환의 맥락에서 상부 운동 뉴런에 치료 페이로드를 전달하는 데 사용될 수 있다.
인공 발현 작제물의 특정 구현예는 L5 글루타메이트성 뉴런 내에서 단백질 발현을 선택적으로 구동하는 다음 인핸서를 활용한다: eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, 및/또는 eHGT_583m.
특정 구현예에서, 인공 인핸서 요소는 인핸서의 연쇄된 코어를 포함한다. 예는 eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 및/또는 eHGT_460m의 연쇄된 코어를 포함한다. 이들 인공 인핸서 요소는 단일 전장 원래(고유) 인핸서와 비교하여 이식유전자 발현의 더 높은 수준 및 더 빠른 개시를 제공할 수 있다.
특정 구현예에서, 인핸서 코어는 서열번호: 45-52 중 임의의 하나에 제시된 바와 같은 서열을 포함한다. 특정 구현예에서, 이들 코어는 연쇄되고 코어 서열의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 갖는다. 서열번호: 53-60은 선택된 인핸서 코어의 3-카피 연쇄체를 제공한다.
인공 발현 작제물의 특정 구현예는 L5 글루타메이트성 뉴런 내에서 단백질 발현을 선택적으로 구동하기 위해 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m을 활용한다.
특정 구현예는 벡터를 포함하는 본원에 기재된 벡터의 특징을 포함하는 인공 발현 작제물을 제공한다: CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024.
본원에 제출된 도면 중 일부는 컬러로 더 잘 이해된다. 출원인은 도면의 컬러 버전을 원본 제출의 일부로 간주하고 이후 절차에서 도면의 컬러 이미지를 제시할 권리를 갖는다.
도 1: 바이러스 도구에 대한 예시적인 인핸서 발견의 개요. 세포 유형-특이적 표지화 도구를 구축하기 위해, 성체 마우스 피질의 세포를 단리할 수 있고 서열분석을 사용한 트랜스포사제-접근가능한 염색질에 대한 단일 세포 검정(scATAC-seq)을 수행할 수 있다. 샘플을 클러스터링하고 단일 세포 RNA 서열분석(scRNA-seq) 데이터세트와 비교하여 클러스터를 식별할 수 있다. 이어서 동일한 전사체 유형과 일치하는 단일 세포를 풀링할 수 있고 게놈을 유형-특이적 추정 인핸서에 대해 검색할 수 있다. 대안적으로, 인간 운동 피질 SNARE-seq 데이터세트를 사용하여 일부 인핸서를 선택하였다(Bakken 등, Nature. 2021 doi: https://doi.org/10.1101/2020.03.31.016972). 선택된 추정 인핸서 영역은 AAV 게놈 백본에서 최소 프로모터의 상류에 클로닝될 수 있으며, 이는 자기-상보성 아데노-연관 바이러스 벡터(scAAV) 또는 재조합 아데노-연관 바이러스 벡터(rAAV)를 생성하는 데 사용될 수 있다. 이들 바이러스 도구는 특이적 신피질 집단을 표지하기 위해 안구뒤로 전달될 수 있다. 일치하는 세포 유형을 갖는 세포에서, 인핸서는 세포 유형-특이적 발현을 구동하기 위해 그들의 동족 전사 인자를 모집한다. 다른 세포에서, 바이러스 게놈이 존재하지만, 전사체는 발현되지 않는다.
도 2a, 2b. (2a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_451m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (2b) AAV 벡터 #CN2249의 6.00E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 3a, 3b. (3a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq에 따른 인핸서 eHGT_452m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (3b) AAV 벡터 #CN2250의 1.45E12 GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 4a-4d. (4a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_453m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (4b) AAV 벡터 #CN2251의 7.00E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (4c) PHP.eB 캡시드와 함께 패키지된 CN2251 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_453m 인핸서 구동된 리포터 발현이 시각 피질 영역의 L5 ET 뉴런의 4 가지 유형 모두에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 다음과 같이 읽는다: 169 L2/3 IT VISp Rrad, 168 L2/3 IT VISp Adamts2, 167 L2/3 IT VISp Agmay, 164 L4 IT VISp Rspo1, 163 L5 IT VISp Hsd11b1 Endou, 162 L5 IT VISp Whrn Tox2, 160 L5 IT VISp Batf3, 158 L5 IT VISp Col6a1 Fezf1, 157 L5 IT VISp Col27a1, 154 L6 IT VISp Penk Col27a1, 153 L6 IT VISp Penk Fst, L6 IT VISp Col23a1 Adamts2, 149 L6 IT VISp Col18a1, 146 L6 IT VISp Car3, 144 L5 PT VISp Chrna6, 143 L5 PT VISp Lgr5, 142 L5 PT VISp C1ql2 Ptgfr, 141 L5 PT VISp C1ql2 Cdh13, 140 L5 PT VISp Krt80, 134 L5 NP VISp Trhr Cpne7, 133 L5 NP VISp Trhr Met, L5 CT Nxph2 Sla, 130 L5 CT VISp Krt80 Sla, L5 CT VISp Nxph2.Wls, 127 L5 CT VISp Ctxn3 Brinp3, 126 L5 CT VISp Ctxn3 Sla, 122 L5 CT VISp Gpr139, 120 L6b Col8a1 Rprm, 119 L6b VISp Mup5, 118 L6b VISp Col8a1 Rxfp1, 115 L6b P2ry12, L6b VISp Crh, 110 Lamp5 Krt73, Lamp5 Fam19a1 Pax6, 108 Lamp5 Fam19a1 Tmem182, 106 Lamp5 Ntn1 Npy2r, 105 Lamp5 Plch2 Dock5, 101 Lamp5 Lsp1, 100 Lamp5 Lhx6, Sncg Slc17a8, 96 Sncg Vip Nptx2, 95 Sncg Gpr50, 93 Sncg Vip Itih5, 90 Serpinf1 Clrn1, 89 Serpinf1 Aqp5 Vip, 85 Vip Igfbp6 Car10, 84 Vip Igfbp6 Pltp, Vip Lmo1 Fam159b, Vip Lmo1 Myl1, 79 Vip Igfbp4 Mab21l1, 78 Vip Arhgap36 Hmcn1, 77 Vip Gpc3 Slc18a3, 74 Vip Ptprt Pkp2, 73 Vip Rspo4 Rxfp1 Chat, 71 Vip Lect1 Oxtr, 70 Vip Rspo1 Itga4, 67 Vip Chat Htr1f, 66 Vip Pygm C1ql1, 61 Vip Crispld2 Htr2c, 60 Vip Crispld2 Kcne4, 58 Vip Col15a1 Pde1a, 54 Sst Chodl, 53 Sst Mme Fam114a1, 52 Sst Tac1 Htr1d, 50 Sst Tac1 Tacr3, 49 Sst Calb2 Necab1, 48 Sst Calb2 Pdlim5, 46 Sst Nr2f2 Necab1, 45 Sst Myh8 Etv1, 44 Sst Chrna1 Glra3, 42 Sst Myh8 Fibin, 40 Sst Chrna2 Ptgdr, 39 Sst Tac2 Myn4, 37 Sst Hpse Sema3c, 36 Sst Hpse Cbln4, 34 Sst Crh2 Efemp1, 33 Sst Crh2 4930553C11Rik, 31 Sst Esm1, 29 Sst Tac2 Tacstd2, 28 Sst Rxfp1 Eya1, 27 Sst Rxfp1 Prdm8, 23 Sst Nts, Pvalb Gabrg1, 20 Pvalb Th Sst, 18 Pvalb Calb1 Sst, 17 Pvalb Akr1c18 Ntf3, 16 Pvalb Sema3e Kank4, 14 Pvalb Gpr149 Islr, 11 Pvalb Reln Itm2a, 10 Pvalb Reln Tac1, 9 Pvalb Tpbg, 4 Pvalb Vlpr2, Meis2 Adamts19, 170 Astro Aqp4, 171 OPC Pdgfra Grm5, Oligo Serpinb1a, 174 Oligo Synpr, VLMC Osr1 Cd74, VLMC Osr1 Mc5r, VLMC Spp1 Col15a1, Peri Kcnj8, SMC Acta2, Endo Ctla2a, 및 181 미세아교세포 Siglech. (4d) 인핸서 AAV 벡터 CN2251 혈청형 PHP.eB의 정위 주사 후 64 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 5a-5d. (5a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_459m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (5b) AAV 벡터 #CN2254의 1.00E12GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (5c) PHP.eB 캡시드와 함께 패키지된 CN2254 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_459m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 4 가지 유형 중 하나에서만 주로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 기재된 것과 동일하게 읽는다. (5d) 인핸서 AAV 벡터 CN2254 혈청형 PHP.eB의 정위 주사 후 113 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 6a, 6b. (6a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_460m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (6b) AAV 벡터 #CN2255의 6.50E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 7a, 7b. (7a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_462m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (7b) AAV 벡터 #CN2256의 6.50E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 8a-8d. (8a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_464m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (8b) AAV 벡터 #CN2315의 1.00E12GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (8c) PHP.eB 캡시드와 함께 패키지된 CN2315 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_464m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 다중 유형에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 대해 기재된 것과 동일하게 읽는다. (8d) 인핸서 AAV 벡터 CN2315 혈청형 PHP.eB의 정위 주사 후 64 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 9a, 9b. (9a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_461m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (9b) AAV 벡터 #CN2423의 5.00E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 10a-10c. (10a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_463m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (10b) AAV 벡터 #CN2424의 7.30E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (10c) PHP.eB 캡시드와 함께 패키지된 CN2424 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_463m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 4 가지 유형 중 하나에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 대해 기재된 것과 동일하게 읽는다. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다.
도 11a, 11b. (11a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_647m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (11b) AAV 벡터 #CN2847의 7.00E11 GC의 안구뒤 전달 1.5 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론
도 12a-12c. 개시내용을 지원하는 서열. (12a) 본원에 개시된 인핸서 서열. 본원에 기재된 각 인공 발현 작제물은 도 12a에 제공된 인핸서 서열 중 적어도 하나를 포함한다; (12b) (12a)의 인핸서로 생성된 인공 발현 작재물 내에 포함될 수 있는(또는 이에 의해 암호화될 수 있는) 예시적인 구성성분; (12c) (12a)의 인핸서 및 (12b)의 선택된 구성요소로 생성된 대표적인 인공 발현 작제물.
도 1: 바이러스 도구에 대한 예시적인 인핸서 발견의 개요. 세포 유형-특이적 표지화 도구를 구축하기 위해, 성체 마우스 피질의 세포를 단리할 수 있고 서열분석을 사용한 트랜스포사제-접근가능한 염색질에 대한 단일 세포 검정(scATAC-seq)을 수행할 수 있다. 샘플을 클러스터링하고 단일 세포 RNA 서열분석(scRNA-seq) 데이터세트와 비교하여 클러스터를 식별할 수 있다. 이어서 동일한 전사체 유형과 일치하는 단일 세포를 풀링할 수 있고 게놈을 유형-특이적 추정 인핸서에 대해 검색할 수 있다. 대안적으로, 인간 운동 피질 SNARE-seq 데이터세트를 사용하여 일부 인핸서를 선택하였다(Bakken 등, Nature. 2021 doi: https://doi.org/10.1101/2020.03.31.016972). 선택된 추정 인핸서 영역은 AAV 게놈 백본에서 최소 프로모터의 상류에 클로닝될 수 있으며, 이는 자기-상보성 아데노-연관 바이러스 벡터(scAAV) 또는 재조합 아데노-연관 바이러스 벡터(rAAV)를 생성하는 데 사용될 수 있다. 이들 바이러스 도구는 특이적 신피질 집단을 표지하기 위해 안구뒤로 전달될 수 있다. 일치하는 세포 유형을 갖는 세포에서, 인핸서는 세포 유형-특이적 발현을 구동하기 위해 그들의 동족 전사 인자를 모집한다. 다른 세포에서, 바이러스 게놈이 존재하지만, 전사체는 발현되지 않는다.
도 2a, 2b. (2a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_451m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (2b) AAV 벡터 #CN2249의 6.00E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 3a, 3b. (3a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq에 따른 인핸서 eHGT_452m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (3b) AAV 벡터 #CN2250의 1.45E12 GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 4a-4d. (4a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_453m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (4b) AAV 벡터 #CN2251의 7.00E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (4c) PHP.eB 캡시드와 함께 패키지된 CN2251 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_453m 인핸서 구동된 리포터 발현이 시각 피질 영역의 L5 ET 뉴런의 4 가지 유형 모두에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 다음과 같이 읽는다: 169 L2/3 IT VISp Rrad, 168 L2/3 IT VISp Adamts2, 167 L2/3 IT VISp Agmay, 164 L4 IT VISp Rspo1, 163 L5 IT VISp Hsd11b1 Endou, 162 L5 IT VISp Whrn Tox2, 160 L5 IT VISp Batf3, 158 L5 IT VISp Col6a1 Fezf1, 157 L5 IT VISp Col27a1, 154 L6 IT VISp Penk Col27a1, 153 L6 IT VISp Penk Fst, L6 IT VISp Col23a1 Adamts2, 149 L6 IT VISp Col18a1, 146 L6 IT VISp Car3, 144 L5 PT VISp Chrna6, 143 L5 PT VISp Lgr5, 142 L5 PT VISp C1ql2 Ptgfr, 141 L5 PT VISp C1ql2 Cdh13, 140 L5 PT VISp Krt80, 134 L5 NP VISp Trhr Cpne7, 133 L5 NP VISp Trhr Met, L5 CT Nxph2 Sla, 130 L5 CT VISp Krt80 Sla, L5 CT VISp Nxph2.Wls, 127 L5 CT VISp Ctxn3 Brinp3, 126 L5 CT VISp Ctxn3 Sla, 122 L5 CT VISp Gpr139, 120 L6b Col8a1 Rprm, 119 L6b VISp Mup5, 118 L6b VISp Col8a1 Rxfp1, 115 L6b P2ry12, L6b VISp Crh, 110 Lamp5 Krt73, Lamp5 Fam19a1 Pax6, 108 Lamp5 Fam19a1 Tmem182, 106 Lamp5 Ntn1 Npy2r, 105 Lamp5 Plch2 Dock5, 101 Lamp5 Lsp1, 100 Lamp5 Lhx6, Sncg Slc17a8, 96 Sncg Vip Nptx2, 95 Sncg Gpr50, 93 Sncg Vip Itih5, 90 Serpinf1 Clrn1, 89 Serpinf1 Aqp5 Vip, 85 Vip Igfbp6 Car10, 84 Vip Igfbp6 Pltp, Vip Lmo1 Fam159b, Vip Lmo1 Myl1, 79 Vip Igfbp4 Mab21l1, 78 Vip Arhgap36 Hmcn1, 77 Vip Gpc3 Slc18a3, 74 Vip Ptprt Pkp2, 73 Vip Rspo4 Rxfp1 Chat, 71 Vip Lect1 Oxtr, 70 Vip Rspo1 Itga4, 67 Vip Chat Htr1f, 66 Vip Pygm C1ql1, 61 Vip Crispld2 Htr2c, 60 Vip Crispld2 Kcne4, 58 Vip Col15a1 Pde1a, 54 Sst Chodl, 53 Sst Mme Fam114a1, 52 Sst Tac1 Htr1d, 50 Sst Tac1 Tacr3, 49 Sst Calb2 Necab1, 48 Sst Calb2 Pdlim5, 46 Sst Nr2f2 Necab1, 45 Sst Myh8 Etv1, 44 Sst Chrna1 Glra3, 42 Sst Myh8 Fibin, 40 Sst Chrna2 Ptgdr, 39 Sst Tac2 Myn4, 37 Sst Hpse Sema3c, 36 Sst Hpse Cbln4, 34 Sst Crh2 Efemp1, 33 Sst Crh2 4930553C11Rik, 31 Sst Esm1, 29 Sst Tac2 Tacstd2, 28 Sst Rxfp1 Eya1, 27 Sst Rxfp1 Prdm8, 23 Sst Nts, Pvalb Gabrg1, 20 Pvalb Th Sst, 18 Pvalb Calb1 Sst, 17 Pvalb Akr1c18 Ntf3, 16 Pvalb Sema3e Kank4, 14 Pvalb Gpr149 Islr, 11 Pvalb Reln Itm2a, 10 Pvalb Reln Tac1, 9 Pvalb Tpbg, 4 Pvalb Vlpr2, Meis2 Adamts19, 170 Astro Aqp4, 171 OPC Pdgfra Grm5, Oligo Serpinb1a, 174 Oligo Synpr, VLMC Osr1 Cd74, VLMC Osr1 Mc5r, VLMC Spp1 Col15a1, Peri Kcnj8, SMC Acta2, Endo Ctla2a, 및 181 미세아교세포 Siglech. (4d) 인핸서 AAV 벡터 CN2251 혈청형 PHP.eB의 정위 주사 후 64 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 5a-5d. (5a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_459m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (5b) AAV 벡터 #CN2254의 1.00E12GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (5c) PHP.eB 캡시드와 함께 패키지된 CN2254 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_459m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 4 가지 유형 중 하나에서만 주로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 기재된 것과 동일하게 읽는다. (5d) 인핸서 AAV 벡터 CN2254 혈청형 PHP.eB의 정위 주사 후 113 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 6a, 6b. (6a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_460m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (6b) AAV 벡터 #CN2255의 6.50E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 7a, 7b. (7a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_462m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (7b) AAV 벡터 #CN2256의 6.50E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 8a-8d. (8a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_464m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (8b) AAV 벡터 #CN2315의 1.00E12GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (8c) PHP.eB 캡시드와 함께 패키지된 CN2315 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_464m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 다중 유형에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 대해 기재된 것과 동일하게 읽는다. (8d) 인핸서 AAV 벡터 CN2315 혈청형 PHP.eB의 정위 주사 후 64 일에 원숭이 일차 운동 피질의 고정된 뇌 절편에서 고유 SYFP2 형광의 표면형광 현미경검사 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 500 μm.
도 9a, 9b. (9a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_461m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (9b) AAV 벡터 #CN2423의 5.00E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론.
도 10a-10c. (10a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_463m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (10b) AAV 벡터 #CN2424의 7.30E11GC의 안구뒤 전달 2 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 기준자: 100 미크론. (10c) PHP.eB 캡시드와 함께 패키지된 CN2424 바이러스의 안구뒤 주사 후 마우스 뇌의 시각 피질 영역으로부터 분류된 SYPF2+ 세포의 단일 세포 전사체 프로파일의 맵핑. 최종 엽에 맵핑된 세포의 수는 계통도 아래의 막대 플롯에 제시된다. 전사체 세포 유형은 하단에 제시된다. 이 데이터는 eHGT_463m 인핸서 구동된 리포터 발현이 시각 피질 영역에서 L5 ET 뉴런의 4 가지 유형 중 하나에서 선택적으로 발생함을 나타낸다. 하단에 있는 텍스트는 왼쪽에서 오른쪽으로 도 4c에 대해 기재된 것과 동일하게 읽는다. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다.
도 11a, 11b. (11a) 세포 부류 및 하위부류에 의한 상응하는 단일 세포 ATAC-seq 피크에 따른 인핸서 eHGT_647m(음영 표시된 영역)에 대한 마우스 게놈 좌표. 화살표는 L5 ET 뉴런 하위부류에 대한 열린 염색질 피크를 나타낸다. (11b) AAV 벡터 #CN2847의 7.00E11 GC의 안구뒤 전달 1.5 개월 후 시각 피질에서 고유 SYFP2 발현을 나타내는 표면형광 현미경사진 이미지. 게놈 좌표는 Hg38 구축용이며 사진 출처는 UCSC 게놈 브라우저이다. 기준자: 100 미크론
도 12a-12c. 개시내용을 지원하는 서열. (12a) 본원에 개시된 인핸서 서열. 본원에 기재된 각 인공 발현 작제물은 도 12a에 제공된 인핸서 서열 중 적어도 하나를 포함한다; (12b) (12a)의 인핸서로 생성된 인공 발현 작재물 내에 포함될 수 있는(또는 이에 의해 암호화될 수 있는) 예시적인 구성성분; (12c) (12a)의 인핸서 및 (12b)의 선택된 구성요소로 생성된 대표적인 인공 발현 작제물.
뇌의 생물학을 완전히 이해하기 위해, 상이한 세포 유형을 구별하고 정의해야 하며, 이들을 추가로 연구하기 위해, 선택적으로 표지하고 교란할 수 있는 인공 발현 작제물을 식별해야 한다. Tasic, Curr. Opin. Neurobiol. 50, 242-249 (2018); Zeng & Sanes, Nat. Rev. Neurosci. 18, 530-546 (2017). 마우스에서, 재조합효소 구동인자 계열을 사용하여 마커 유전자 발현을 공유하는 세포 집단을 표지하는 데 크게 영향을 미쳤다. Daigle 등, Cell 174, 465-480.e22 (2018); Taniguchi, 등, Neuron 71, 995-1013 (2011); Gong 등, J. Neurosci. 27, 9817-9823 (2007). 그러나, 높은 특이성을 갖는 세포 유형을 표지하는 이러한 계열의 생성, 유지, 및 사용은 비용이 들 수 있고, 삼중 유전자이식 교배를 빈번하게 필요로 하여, 실험 동물의 낮은 빈도를 산출한다. 또한, 이들 도구는 생식계열 유전자이식 동물을 필요로 하며 따라서 인간에게 적용가능하지 않다.
본 개시내용은 표적화된 중추신경계 세포 집단에서 유전자 발현을 선택적으로 구동하는 인공 발현 작제물을 제공한다. 표적화된 중추신경계 세포 집단은 신피질 글루타메이트성 종뇌외-투사(L5 ET) 뉴런과 같은 신피질 글루타메이트성 레이어 5 뉴런을 포함한다. 특정 적용에서, 본 개시내용의 측면은 예를 들어, 근위축성 측삭 경화증(ALS) 또는 L5 ET 뉴런을 수반하는 다른 신경퇴행성 질환의 맥락에서 상부 운동 뉴런에 치료 페이로드를 전달하는 데 사용될 수 있다.
인공 발현 작제물의 특정 구현예는 L5 ET 뉴런 내에서 유전자 발현을 선택적으로 구동하기 위해 다음 인핸서를 활용한다: eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, 및/또는 eHGT_583m.
특정 구현예에서, 인공 인핸서 요소는 eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 및/또는 eHGT_460m의 연쇄된 코어와 같은 본원에 개시된 인핸서의 연쇄된 코어를 포함한다. 이들 인공 인핸서 요소는 단일 전장 원래(고유) 인핸서와 비교하여 이식유전자 발현의 더 높은 수준 및 더 빠른 개시를 제공한다.
특정 구현예에서, 인핸서 코어는 서열번호: 45-52 중 임의의 하나에 제시된 바와 같은 코어 서열을 포함할 수 있다. 특정 구현예에서, 코어는 연쇄되고 코어의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함한다. 서열번호: 53-60은 선택된 인핸서 코어의 3-카피 연쇄체를 제공한다.
인공 발현 작제물의 특정 구현예는 L5 글루타메이트성 뉴런 내에서 단백질 발현을 선택적으로 구동하기 위해 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m을 활용한다.
특정 구현예는 벡터를 포함하는 본원에 기재된 벡터의 특징을 포함하는 인공 발현 작제물을 제공한다: CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024.
개시내용의 측면은 이제 하기 추가 옵션 및 세부사항으로 설명된다: (i) 선택된 세포 유형에서 유전자의 선택적 발현을 위한 인공 발현 작제물 및 벡터; (ii) 투여용 조성물 (iii) 인공 발현 작제물을 포함한 세포주; (iv) 유전자이식 동물; (v) 사용 방법; (vi) 키트 및 상업용 패키지; (vii) 예시적인 구현예; 및 (viii) 마무리 단락.
(i) 선택된 세포 유형에서 유전자의 선택적 발현을 위한 인공 발현 작제물 및 벡터. 본원에 개시된 인공 발현 작제물은 (i) 표적화된 중추신경계 세포 유형 내에서 코딩 서열의 선택적 발현을 야기하는 인핸서 서열, (ii) 발현되는 코딩 서열, 및 (iii) 프로모터를 포함한다. 인공 발현 작제물은 또한 필요하거나 또는 유익한 경우 다른 조절 요소를 포함할 수 있다.
특정 구현예에서, "인핸서" 또는 "인핸서 요소"는 프로모터와 연관된 전사 수준을 증가시키고 전사될 프로모터 및 코딩 서열에 관해 어느 한 방향으로 기능할 수 있고 전사될 프로모터 또는 코딩 서열에 관해 상류 또는 하류에 위치할 수 있는 시스-작용 서열이다. 인핸서 요소 서열의 기능(들)을 측정하기 위한 당업계에 인식된 방법 및 기술이 있다. 본원에 개시된 인공 발현 작제물 내에서 활용되는 인핸서 서열의 특정 예는 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m 및 연쇄된 코어, 예컨대 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및 3xcore2_eHGT_460m을 포함한다.
특정 구현예에서, 표적화된 중추신경계 세포 유형 인핸서는 표적화된 중추신경계 세포 유형에 의해 독특하게 또는 주로 활용되는 인핸서이다. 표적화된 중추신경계 세포 유형 인핸서는 표적화된 중추신경계 세포 유형에서 유전자의 발현을 향상시키지만 다른 비-표적화된 세포 유형에서 유전자의 발현을 실질적으로 지시하지 않으며, 따라서 세포 유형 특이적 전사 활성을 갖는다.
코딩 서열이 선택된 세포에서 선택적으로 발현되고 다른 세포 유형에서 실질적으로 발현되지 않는 경우, 코딩 서열의 생성물은 선택된 세포 유형에서 우선적으로 발현된다. 특정 구현예에서, 우선적 발현은 참조 세포 유형과 비교하여 50% 초과 발현; 참조 세포 유형과 비교하여 60% 초과 발현; 참조 세포 유형과 비교하여 70% 초과 발현; 참조 세포 유형과 비교하여 80% 초과 발현; 또는 참조 세포 유형과 비교하여 90% 초과 발현이다. 특정 구현예에서, 참조 세포 유형은 비-표적화된 세포를 지칭한다. 비-표적화된 세포는 표적화된 세포와 동일한 해부학적 구조 내에 있을 수 있고/있거나 공통 해부학적 영역으로 투사할 수 있다. 특정 구현예에서, 참조 세포 유형은 표적화된 세포 유형을 포함하는 해부학적 구조와 인접한 해부학적 구조 내에 있다. 특정 구현예에서, 참조 세포 유형은 표적화된 세포와 상이한 유전자 발현 프로파일을 갖는 비-표적화된 세포이다.
특정 구현예에서, 코딩 서열의 생성물은 비-선택된 세포 유형에서 낮은 수준, 예를 들어 생성물이 선택된 세포에서 발현되는 수준의 1% 미만 또는 1%, 2%, 3%, 5%, 10%, 15% 또는 20%로 발현될 수 있다. 특정 구현예에서, 표적화된 중추신경계 세포 유형은 유전자 발현을 구동하도록 본원에 개시된 인핸서에 결합하는 전사 인자의 옳은 조합을 발현하는 유일한 세포 유형이다. 따라서, 특정 구현예에서, 발현은 표적화된 세포 유형 내에서 배타적으로 발생한다.
특정 구현예에서, 표적화된 세포 유형(예를 들어 뉴런, 및/또는 비-뉴런)은 Tasic 등, Nature 563, 72-78 (2018) 및 Hodge 등, Nature 573, 61-68 (2019)에 기재된 것들과 같은 전사 프로파일에 기반하여 식별될 수 있다. 참조를 위해, 세포 유형 및 구별되는 특징에 대한 하기 설명이 또한 제공된다:
신피질 GABA성 하위부류:
ㆍ 모두: GABA 합성 유전자 Gad1/GAD1 및 Gad2/GAD2를 발현한다.
ㆍ Lamp5, Sncg, Serpinf1, 및 Vip: 미골 신경절 융기(CGE) 또는 시각교차앞 구역(POA)의 뉴런 전구체로부터 발달적으로 유래된다.
ㆍ Sst 및 Pvalb: 중앙 신경절 융기(MGE)에서 뉴런 전구체로부터 발달적으로 유래된다.
ㆍ Lamp5: 많은 신피질 레이어, 특히 상부(L1-L2/3)에서 발견되고, 주로 아교세포형 및 단일 꽃다발 형태를 갖는다.
ㆍ Sncg: 많은 신피질 레이어에서 발견되고, Lamp5 및 Vip 세포와 분자 중첩을 갖지만, Lamp5 또는 Vip의 발현이 일관되지 않으며, Sncg의 보다 일관된 발현이 있다.
ㆍ Serpinf1: 많은 신피질 레이어에서 발견되고, Sncg 및 Vip 세포와 분자 중첩을 갖지만, Sncg 또는 Vip의 발현이 일관되지 않으며, Serpinf1의 보다 일관된 발현이 있다.
ㆍ Vip: 많은 신피질 레이어에서 발견되지만, 특히 상부 레이어(L1-L4)에서 빈번하고, 신경전달물질 혈관작용성 장 펩티드(Vip)를 고도로 발현한다.
ㆍ Sst: 많은 신피질 레이어에서 발견되지만, 특히 하부 레이어(L5-L6)에서 빈번하다. 그들은 신경전달물질 소마토스타틴(Sst)을 고도로 발현하고, 시냅스후 뉴런에 수지상 입력을 빈번하게 차단한다. 이 하위부류에는 다른 Sst 뉴런과는 매우 다르지만 Sst를 포함한 일부 공유된 마커 유전자를 발현하는 수면-활성 Sst Chodl 뉴런(이는 또한 Nos1 및 Tacr1을 발현함)이 포함된다. 인간에서, SST 유전자 발현은 종종 레이어 1 LAMP5+ 세포에서 검출된다.
ㆍ Pvalb: 많은 신피질 레이어에서 발견되지만, 특히 하부 레이어(L5-L6)에서 빈번하다. 그들은 칼슘-결합 단백질 파브알부민(Pvalb)을 고도로 발현하고, 신경펩티드 Tac1을 발현하고, 빈번하게 시냅스후 뉴런의 출력을 약화시킨다. 가장 빠르게 급증하는 GABA성 세포는 Pvalb를 강력하게 발현한다. 이 하위부류에는 샹들리에 세포가 포함되며, 이는 독특한, 샹들리에-유사 형태를 가지며 마우스에서 마커 Cpne5 및 Vipr2, 및 인간에서 NOG 및 UNC5B를 발현한다.
ㆍ Meis2: Meis2 유전자를 발현하고, 모든 다른 신피질 GABA성 유형에 의해 발현되는 일부 다른 유전자(예를 들어, Thy1 및 Scn2b)를 발현하지 않는 유일한 신피질 GABA성 유형인 단일 유형에 의해 정의된 독특한 하위부류. 이 유형은 L6b 및 피질하 백질에서 발견된다.
신피질 글루타메이트성 하위부류:
ㆍ 모두: 글루타메이트 전달물질 Slc17a6 및/또는 Slc17a7을 발현한다. 그들은 모두 Snap25를 발현하고 Gad1/Gad2의 발현이 결여되어 있다.
ㆍ L2/3 IT: 주로 레이어 2/3에 상주하고 주로 종뇌내부(피질-피층) 투사가 있다.
ㆍ L4 IT: 주로 레이어 4에 상주하고 주로 국부 또는 종뇌내부(피질-피층) 투사가 있다.
ㆍ L5 IT: 주로 레이어 5에 상주하고 주로 종뇌내부(피질-피층) 투사가 있다. L5a라고도 부른다.
ㆍ L5 ET: 주로 레이어 5에 상주하고 주로 피질-피층하 투사가 있다. L5b 또는 L5 CF(피질원심성) 또는 L5 PT(피라미드 관 투사)라고도 부른다. 이 하위부류는 일차 운동 피질 및 이웃 영역에 위치하고 ALS와 같은 운동 뉴런/운동 장애와 연관된 피질척수 투사 뉴런인 세포를 포함한다. 이 하위부류는 특수한 영역, 예를 들어 베츠(Betz) 세포, 마이네르트(Meynert) 세포, 및 폰 이코노모(von Economo) 세포에서만 발견되는 독특한 하위유형을 포함한 두껍고 촘촘한 피라미드형 뉴런을 포함한다.
ㆍ L5 NP: 주로 레이어 5에 상주하고 주로 근처에 투사가 있다.
ㆍ L6 CT: 주로 레이어 6에 상주하고 주로 피질-시상 투사가 있다.
ㆍ L6 IT: 주로 레이어 6에 상주하고 주로 종뇌내부(피질-피층) 투사가 있다. 이 하위부류에는 전장에서 피질내-투사 세포와 매우 유사한 L6 IT Car3 세포가 포함된다.
ㆍ L6b: 주로 신피질 서브플레이트(L6b)에 상주하며, 국부(세포체 근처) 투사 및 VISp에서 전측 대상으로의 일부 피질-피층 투사, 및 시상으로의 피질-피층하 투사가 있다.
ㆍ CR: L1, 카잘-레찌(Cajal-Retzius) 세포에서 단일 유형에 의해 정의된 독특한 하위부류는 독특한 분자 마커 Lhx5 및 Trp73을 발현한다.
소뇌 푸르기네(Purkinje) 세포: 유일한 투사 뉴런 및 소뇌로부터의 단독 출력인 큰 GABA성 뉴런. 그들의 세포체는 '푸르기네 세포 레이어'라고 불리는 단일 레이어를 형성하고, 그들은 파브알부민을 발현한다.
심부 소뇌 핵 뉴런: 심부 소뇌 핵 구조에 위치한 뉴런. 이들은 유전자 Pvalb를 발현하는 글루타메이트성 및 GABA성 세포를 포함한다.
비-뉴런 하위부류:
ㆍ 성상세포: 마커 Aqp4 및 종종 GFAP를 발현하지만, 뉴런 마커 SNAP25를 발현하지 않는 신경외배엽-유래 교질 세포. 그들은 독특한 별-모양 형태를 가질 수 있고 뇌에서 다른 세포의 대사 지원에 수반된다. 다중 성상세포 형태가 마우스 및 인간에서 관찰된다
ㆍ 희소돌기아교세포: 마커 Sox10을 발현하는 신경외배엽-유래 교질 세포. 이 카테고리는 희소돌기아교세포 전구체 세포(OPC)를 포함한다. 희소돌기아교세포는 뉴런의 수초화를 주로 담당하는 하위부류이다.
ㆍ VLMC: 혈관 연수막 세포(VLMC)는 피질의 외부 레이어를 둘러싸고 마커 유전자 Lum 및 Col1a1을 발현하는 뇌막의 일부다.
ㆍ 혈관주위세포: 마커 유전자 Kcnj8 및 Abcc9를 발현하는 혈관-연관 세포. 혈관주위세포는 내피 세포 주위를 감싸고 모세관 혈류 조절에 중요하며 혈액-뇌 장벽 투과성에 수반된다.
ㆍ SMC: 마커 유전자 Acta2를 발현하는 혈관-연관 세포인 특수한 평활근 세포. SMC는 뇌에서 세동맥을 덮고 혈액-뇌 장벽 투과성에 수반된다.
ㆍ 내피 세포: 뇌의 혈관에 막을 형성하는 세포. 내피 세포는 마커 Tek 및 PDGF-B를 발현한다.
ㆍ 미세아교세포: 뇌-상주 대식세포, 및 뇌 조직과 일시적으로 연관되거나 또는 뇌 해부 방법의 부산물로서 포함될 수 있는 혈관주위 대식세포(PVM)인 조혈-유래 면역 세포. 미세아교세포는 Cx3cr1, Tmem119, 및 PTPRC(CD45)를 발현하는 것으로 알려져 있다.
특정 구현예에서, 코딩 서열은 효과기 요소를 암호화하는 이종 코딩 서열이다. 효과기 요소는 의도된 효과를 달성하도록 발현되고, 실제로 달성하는 서열이다. 효과기 요소의 예는 리포터 유전자/단백질 및 기능성 유전자/단백질을 포함한다.
예시적인 리포터 유전자/단백질은 Addgene ID#s 83894(pAAV-hDlx-Flex-dTomato-Fishell_7), 83895(pAAV-hDlx-Flex-GFP-Fishell_6), 83896(pAAV-hDlx-GiDREADD-dTomato-Fishell-5), 83898(pAAV-mDlx-ChR2-mCherry-Fishell-3), 83899(pAAV-mDlx-GCaMP6f-Fishell-2), 83900(pAAV-mDlx-GFP-Fishell-1), 및 89897(pcDNA3-FLAG-mTET2 (N500))에 의해 발현되는 것들을 포함한다. 예시적인 리포터 유전자는 특히 발현가능한 형광 단백질, 또는 발현가능한 비오틴; 청색 형광 단백질(예를 들어 eBFP, eBFP2, Azurite, mKalama1, GFPuv, Sapphire, T-sapphire); 청록색 형광 단백질(예를 들어 eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan, mTurquoise); 녹색 형광 단백질(예를 들어 GFP, GFP-2, tagGFP, turboGFP, EGFP, Emerald, Azami Green, 단량체성 Azami Green(mAzamigreen), CopGFP, AceGFP, avGFP, ZsGreenl, Oregon Green™(Thermo Fisher Scientific)); 루시퍼라제; 주황색 형광 단백질(mOrange, mKO, Kusabira-Orange, 단량체성 Kusabira-Orange, mTangerine, tdTomato, dTomato); 적색 형광 단백질(mKate, mKate2, mPlum, DsRed 단량체, mCherry, mRuby, mRFP1, DsRed-Express, DsRed2, DsRed-단량체, HcRed-탠덤, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred, Texas Red™(Thermo Fisher Scientific)); 원적외선 형광 단백질(예를 들어, mPlum 및 mNeptune); 황색 형광 단백질(예를 들어, YFP, eYFP, Citrine, SYFP2, Venus, YPet, PhiYFP, ZsYellowl); 및 탠덤 접합체를 암호화하는 것들을 포함할 수 있다.
GFP는 238 개의 아미노산(26.9 kDa)으로 구성되며, 청색 광에 노출될 때 녹색으로 형광으로 내는 해파리 아쿠오레아 빅토리아(Aequorea victoria)/아쿠오레아 아쿠오레아(Aequorea aequorea)/아쿠오레아 포르스칼레아(Aequorea forskalea)로부터 원래 단리된다. 에이. 빅토리아(A. victoria)의 GFP는 395 nm의 파장에서 주요 여기 피크 및 475 nm에서 작은 여기 피크를 갖는다. 이의 방출 피크는 가시 스펙트럼의 하부 녹색 부분에 있는 509 nm에 있다. 바다 팬지(레닐라 레니포르미스(Renilla reniformis))의 GFP는 498 nm에서 단일 주요 여기 피크를 갖는다. 광범위한 용법에 대한 잠재력 및 연구원의 진화하는 요구로 인해, GFP의 많은 상이한 돌연변이체가 조작되었다. 첫번째 주요 개선은 1995년에 Roger Tsien에 의해 Nature에 보고된 단일 점 돌연변이(S65T)였다. 이 돌연변이는 GFP의 스펙트럼 특성을 극적을 개선시켜, 증가된 형광, 광안정성 및 피크 방출을 509 nm에서 유지하면서 488 nm로 주요 여기 피크의 이동을 초래한다. 37℃ 접힘 효율(F64L) 점 돌연변이체를 이 스캐폴드에 첨가하여 향상된 GFP(EGFP)를 산출하였다. EGFP는 9.13X10-21 m2/분자의 광학 단면으로도 알려진 흡광 계수(ε로 나타냄)를 가지며, 55,000 L/(molcm)로도 인용된다. 좋지 않은 접힘 펩티드에 융합된 경우에도 GFP가 빠르게 접히고 성숙되게 하는 일련의 돌연변이인 슈퍼폴더 GFP가 2006에 보고되었다.
"황색 형광 단백질"(YFP)은 아쿠오레아 빅토리아에서 유래된 녹색 형광 단백질의 유전적 돌연변이체이다. 이의 여기 피크는 514 nm이고 이의 방출 피크는 527 nm이다.
예시적인 기능성 분자는 기능화 이온 수송체, 세포 수송 단백질, 효소, 전사 인자, 신경전달물질, 칼슘 리포터, 채널로돕신, 가이드 RNA, 뉴클레아제, 또는 디자이너 약물에 의해 배타적으로 활성화되는 디자이너 수용체(DREADD)를 포함한다.
이온 수송체는 세포 막을 가로질러 이온의 수송을 매개하는 막관통 단백질이다. 이들 수송체는 대부분의 세포 유형 전체에 걸쳐 만연하고 세포 흥분성 및 항상성을 조절하는 데 중요하다. 이온 수송체는 활동 전위, 시냅스 전달, 호르몬 분비, 및 근육 수축과 같은 수많은 세포 과정에 참여한다. 살아있는 세포에서 많은 중요한 생물학적 과정은 칼슘(Ca2+), 칼륨(K+), 및 나트륨(Na+) 이온과 같은 양이온을 이러한 이온 채널을 통해 전위하는 것을 수반한다. 특정 구현예에서, 이온 수송체는 전압 개폐 나트륨 채널(예를 들어, SCN1A), 칼륨 채널(예를 들어, KCNQ2), 및 칼슘 채널(예를 들어 CACNA1C))을 포함한다.
예시적인 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 및 신경전달물질은 락타제, 리파제, 헬리카제, 알파-글루코시다제, 아밀라제와 같은 효소; SP1, AP-1, 열 충격 인자 단백질 1, C/EBP(CCAA-T/인핸서 결합 단백질), 및 Oct-1과 같은 전사 인자; 형질전환 성장 인자 수용체 베타 1, 혈소판-유래 성장 인자 수용체, 표피성장 인자 수용체, 혈관 내피 성장 인자 수용체, 및 인터류킨 8 수용체 알파와 같은 수용체; 막 단백질, 클라트린, 다이나민, 카베올린, Rab-4A, 및 Rab-11A와 같은 세포 수송 단백질; 신경 성장 인자(NGF), 혈소판-유래 성장 인자(PDGF), 형질전환 성장 인자 β(TGFβ), 표피성장 인자(EGF), GTPase 및 Hras와 같은 신호전달 분자; 및 코카인 및 암페타민 조절 전사체, 물질 P, 옥시토신, 및 소마토스타틴과 같은 신경전달물질을 포함한다.
특정 구현예에서, 기능성 분자는 칼슘 리포터와 같은 세포 기능 및 상태의 리포터를 포함한다. 세포내 칼슘 농도는 뉴런 활성화, 근육 세포 수축 및 2차 메신저 신호전달을 포함하는 수많은 세포 활성의 중요한 예측인자이다. 세포내 칼슘 수준을 모니터링하는 민감하고 편리한 기술은 유전적으로 암호화된 칼슘 지표(GECI)를 통해서이다. GECI 중에서, GCaMP라고 불리는 녹색 형광 단백질(GFP) 기반 칼슘 센서는 효율적이고 광범위하게 사용되는 도구이다. GCaMP는 원형으로 순열된 GFP의 N- 및 C-말단에 M13 및 칼모듈린 단백질을 융합시켜 형성된다. 일부 GCaMP는 독특한 형광 방출 스펙트럼을 산출한다(Zhao 등, Science, 2011, 333(6051): 1888-1891). 녹색 형광이 있는 예시적인 GECI는 GCaMP3, GCaMP5G, GCaMP6s, GCaMP6m, GCaMP6f, jGCaMP7s, jGCaMP7c, jGCaMP7b, 및 jGCaMP7f를 포함한다. 또한, 적색 형광이 있는 GECI는 jRGECO1a 및 jRGECO1b를 포함한다. GECI를 함유하는 AAV 생성물은 상업적으로 입수가능하다. 예를 들어, Vigene Biosciences는 AAV8-CAG-GCaMP3(카탈로그 번호:BS4-CX3AAV8), AAV8-Syn-FLEX-GCaMP6s-WPRE(카탈로그 번호:BS1-NXSAAV8), AAV8-Syn-FLEX-GCaMP6s-WPRE(카탈로그 번호:BS1-NXSAAV8), AAV9-CAG-FLEX-GCaMP6m-WPRE(카탈로그 번호:BS2-CXMAAV9), AAV9-Syn-FLEX-jGCaMP7s-WPRE(카탈로그 번호:BS12-NXSAAV9), AAV9-CAG-FLEX-jGCaMP7f-WPRE(카탈로그 번호:BS12-CXFAAV9), AAV9-Syn-FLEX-jGCaMP7b-WPRE(카탈로그 번호:BS12-NXBAAV9), AAV9-Syn-FLEX-jGCaMP7c-WPRE(카탈로그 번호:BS12-NXCAAV9), AAV9-Syn-FLEX-NES-jRGECO1a-WPRE(카탈로그 번호:BS8-NXAAAV9), 및 AAV8-Syn-FLEX-NES-jRCaMP1b-WPRE(카탈로그 번호:BS7-NXBAAV8)를 포함한 AAV 생성물을 제공한다.
특정 구현예에서 칼슘 리포터는 유전적으로 암호화된 칼슘 지표 GECI, NTnC; 미오신 경쇄 키나제, GFP, 칼모듈린 키메라; 칼슘 지표 TN-XXL; BRET-기반 자동 발광 칼슘 지표; 및/또는 칼슘 지표 단백질 OeNL(Ca2+)-18u)을 포함한다.
특정 구현예에서, 기능성 분자는 채널로돕신(예를 들어, 채널로돕신-1, 채널로돕신-2, 및 이의 변이체)과 같은 뉴런 활성의 조절자를 포함한다. 채널로돕신은 광 개폐 이온 채널로서 기능하는 레티닐리덴 단백질(로돕신)의 서브패밀리이다. 채널로돕신 1(ChR1) 및 채널로돕신 2(ChR2) 이외에, 채널로돕신의 여러 변이체가 개발되었다. 예를 들어, Lin 등(Biophys J, 2009, 96(5): 1803-14)은 부위 지정 돌연변이유발과 조합된 ChR1 및 ChR2의 막관통 도메인의 키메라를 만드는 것을 설명한다. Zhang 등(Nat Neurosci, 2008, 11(6): 631-3)은 적색 이동 채널로돕신 변이체인 VChR1을 설명한다. VChR1은 광 민감도가 더 낮고 막 수송 및 발현이 좋지 않다. 다른 알려진 채널로돕신 변이체는 Nagel, 등, Proc Natl Acad Sci USA, 2003, 100(24): 13940-5)에 기재된 ChR2 변이체, ChR2/H134R(Nagel, G., 등, Curr Biol, 2005, 15(24): 2279-84), 및 ChD/ChEF/ChlEF(Lin, J. Y., 등, Biophys J, 2009, 96(5): 1803-14)를 포함하며, 이는 청색 광(470 nm)에 의해 활성화되지만 주황색/적색 광에 대한 민감도를 나타내지 않는다. 추가의 변이체는 Lin, Experimental Physiology, 2010, 96.1: 19-25 및 Knopfel 등, The Journal of Neuroscience, 2010, 30(45): 14998-15004)에 기재되어 있다.
특정 구현예에서, 기능성 분자는 DNA 및 RNA 편집 도구 이러한 CRISPR/CAS(예를 들어, 가이드 RNA 및 뉴클레아제, 예컨대 Cas, Cas9 or cpf1)를 포함한다. 기능성 분자는 또한 US 2018/0030425, US 2016/0208243, WO/2017/184768 및 Zetsche 등 (2015) Cell 163: 759-771에 기재된 것들과 같은 조작된 Cpf1; 단일 gRNA(예를 들어, Jinek 등 (2012) Science 337:816-821; Jinek 등 (2013) eLife 2:e00471; Segal (2013) eLife 2:e00563 참조) 또는 편집효소, 가이드 RNA 분자 또는 상동 재조합 공여자 카세트를 포함할 수 있다.
서열은 공개적으로 이용가능하다. 예로서, 락타제(예를 들어, GenBank: EAX11622.1), 리파제(예를 들어, GenBank: AAA60129.1), 헬리카제(예를 들어, GenBank: AMD82207.1), 아밀라제(예를 들어, GenBank: AAA51724.1), 알파-글루코시다제(예를 들어, GenBank: ABI53718.1), 전사 인자 SP1(예를 들어, UniProtKB/Swiss-Prot: P08047.3), 전사 인자 AP-1(예를 들어, NP_002219.1), 열 충격 인자 단백질 1(예를 들어, UniProtKB/Swiss-Prot: Q00613.1), CCAAT/인핸서-결합 단백질(C/EBP) 베타 이소형 a(예를 들어, NP_005185.2), Oct-1(예를 들어, UniProtKB/Swiss-Prot: P14859.2), TGFβ(예를 들어, GenBank: CAF02096.2), 혈소판-유래 성장 인자 수용체(예를 들어, GenBank: AAA60049.1), 표피성장 인자 수용체(예를 들어, GenBank: CAA25240.1), 혈관 내피 성장 인자 수용체(예를 들어, GenBank: AAC16449.2), 인터류킨 8 수용체 알파(예를 들어, GenBank: AAB59436.1), 카베올린(예를 들어, GenBank: CAA79476.1), 다이나민(예를 들어, GenBank: AAA88025.1), 클라트린 중쇄 1 이소형 1(예를 들어, NP_004850.1), 클라트린 중쇄 2 이소형 1(예를 들어, NP_009029.3), 클라트린 경쇄 A 이소형 a(예를 들어, NP_001824.1), 클라트린 경쇄 B 이소형 a(예를 들어, NP_001825.1), ras-관련 단백질 Rab-4A 이소형 1(예를 들어, NP_004569.2), ras-관련 단백질 Rab-11A(예를 들어, UniProtKB/Swiss-Prot: P62491.3), 혈소판-유래 성장 인자(예를 들어, GenBank: AAA60552.1), 형질전환 성장 인자-베타3(예를 들어, GenBank: AAA61161.1), 신경 성장 인자(예를 들어, GenBank: CAA37703.1), EGF(예를 들어, GenBank: CAA34902.2), 코카인 및 암페타민 조절 전사체(쇄 A)(예를 들어, PDB: 1HY9_A), 프로타키키닌-1(예를 들어, UniProtKB - P20366), 옥시토신-뉴로피신 1(예를 들어, UniProtKB - P01178), 소마토스타틴(예를 들어, GenBank: AAH32625.1), 유전적으로 암호화된 녹색 칼슘 지표 NTnC(쇄 A) [합성 작제물](예를 들어, PDB: 5MWC_A), 칼슘 지표 TN-XXL [합성 작제물], (예를 들어, GenBank: ACF93133.1), BRET-기반 자동 발광 칼슘 지표 [합성 작제물](예를 들어, GenBank ADF42668.1), 칼슘 지표 단백질 OeNL(Ca2+)-18u [합성 작제물], ((예를 들어, GenBank BBB18812.1), 미오신 경쇄 키나제, 녹색 형광 단백질, 칼모듈린 키메라(쇄 A) [합성 작제물]((예를 들어, PDB: 3EKJ_A), 채널롭신 1(예를 들어, UniProtKB - F8UVI5), 채널롭신 1(예를 들어, GenBank: AER58217.1), 채널로돕신-2((예를 들어, UniProtKB - B4Y105), 채널 로돕신 2 [합성 작제물]((예를 들어, GenBank: ABO64386.1), CRISPR-연관 단백질(Cas)(예를 들어, GenBank: AKG27598.1), Cas9 [합성 작제물](예를 들어, GenBank: AST09977.1), CRISPR-연관 엔도뉴클레아제 Cpf1(예를 들어, UniProtKB/Swiss-Prot: U2UMQ6.1), 리보뉴클레아제 4 또는 리보뉴클레아제 L(예를 들어, UniProtKB/Swiss-Prot: Q05823.2), 데옥시리보뉴클레아제 II 베타(예를 들어, GenBank: AAF76893.1), 나트륨 채널 단백질 유형 1 서브유닛 알파(예를 들어, UniProtKB - P35498), 칼륨 전압 개폐 채널 서브패밀리 KQT 구성원 2(예를 들어, UniProtKB - O43526), 및 전압-의존적 L-유형 칼슘 채널 서브유닛 알파-1C(예를 들어, UniProtKB - Q13936).
추가의 효과기 요소는 Cre, iCre, dgCre, FlpO, 및 tTA2를 포함한다. iCre는 코돈-개선된 Cre를 지칭한다. dgCre는 G67S 돌연변이를 보유하고 또한 R12Y/Y100I 불안정화 도메인 돌연변이를 포함하도록 변형된 에스케리키아 콜라이(Escherichia coli) K-12 균주 염색체 디하이드로폴레이트 환원요소 유전자(DHFR 또는 folA)의 처음 159 개 아미노산의 N-말단 융합이 있는 향상된 GFP/Cre 재조합효소 융합 유전자를 지칭한다. FlpO는 마우스 세포에서 단백질 발현 및 FRT 재조합 효율을 크게 증가시키는 FLPe의 코돈-최적화된 형태를 지칭한다. Cre/LoxP 시스템과 마찬가지로, FLP/FRT 시스템은 유전자 발현(및 FLP/FRT 시스템에 의해 매개되는 조건부 녹아웃 마우스 생성)을 위해 광범위하게 사용되었다. tTA2는 테트라사이클린 트랜스활성화제를 지칭한다.
예시적인 발현가능한 요소는 효과기 요소, 예를 들어, 비-기능화 또는 결함성 단백질을 포함하지 않는 발현 생성물이다. 특정 구현예에서, 발현가능한 요소는 그들의 기능화 대응물의 효과를 연구하는 방법을 제공할 수 있다. 특정 구현예에서, 발현가능한 요소는 비-기능화이거나 또는 그들을 비-기능화로 만드는 조작된 돌연변이에 기반한 결함성이다. 이들 측면에서, 비-발현가능한 요소는 그들의 기능화 대응물과 가능한 한 구조가 유사하다.
예시적인 자가-절단 펩티드는 하나의 mRNA로부터 2 개 단백질 생산을 야기하는 2A 펩티드를 포함한다. 2A 서열은 짧아서(예를 들어, 20 개 아미노산), 크기 제한된 작제물에서 더 많이 사용하도록 한다. 특정 예는 P2A, T2A, E2A, 및 F2A를 포함한다. 특정 구현예에서, 인공 발현 작제물은 내부 리보솜 진입 부위(IRES) 서열을 포함한다. IRES는 리보솜이 mRNA 분자의 두번째 내부 부위에서 번역을 개시하도록 하여, 하나의 mRNA로부터 2 개 단백질 생산을 야기한다.
본원에 기재된 분자(예를 들어, RNA, 단백질)를 암호화하는 코딩 서열은 공개적으로 이용가능한 데이터베이스 및 간행물로부터 수득될 수 있다. 코딩 서열은 다양한 서열 다형성, 돌연변이, 및/또는 서열 변이체를 추가로 포함할 수 있으며 여기서 이러한 변경은 암호화된 분자의 기능에 영향을 미치지 않는다. 용어 "암호화하다" 또는 "암호화하는"은 단백질과 같은 다른 분자의 합성을 위한 주형으로서 역할을 하는 벡터, 플라스미드, 유전자, cDNA, mRNA와 같은 핵산의 서열 특성을 지칭한다.
용어 "유전자"는 코딩 서열뿐만 아니라 조절 영역 예컨대 프로모터, 인핸서, 절연체, 및/또는 후-조절 요소, 예컨대 종결 영역을 포함할 수 있다. 용어는 추가로 대체 스플라이스 부위로부터 생성된 변이체와 함께, mRNA 전사체로부터 스플라이스된 모든 인트론 및 다른 DNA 서열을 포함할 수 있다. 서열은 또한 참조 서열의 축퇴성 코돈 또는 특정 유기체 또는 세포 유형에서 코돈 선호도를 제공하도록 도입될 수 있는 서열을 포함할 수 있다.
프로모터는 일반 프로모터, 조직-특이적 프로모터, 세포-특이적 프로모터, 및/또는 세포질에 특이적인 프로모터를 포함할 수 있다. 프로모터는 강한 프로모터, 약한 프로모터, 구성적 발현 프로모터, 및/또는 유도성 프로모터를 포함할 수 있다. 유도성 프로모터는 특정 조건, 신호 또는 세포 이벤트에 반응하여 발현을 지시한다. 예를 들어, 프로모터는 프로모터로부터 전사를 이루기 위해 특정 리간드, 소분자, 전사 인자 또는 호르몬 단백질을 필요로 하는 유도성 프로모터일 수 있다. 프로모터의 특정 예는 minBglobin, CMV, minCMV, minCMV*(minCMV*는 SacI 제한 부위가 제거된 minCMV임), minRho, minRho*(minRho*는 SacI 제한 부위가 제거된 minRho임), SV40 즉시 초기 프로모터, Hsp68 최소 프로모터(proHSP68), 및 라우스 육종 바이러스(RSV) 긴 말단 반복부(LTR) 프로모터를 포함한다. 최소 프로모터는 자체적으로 유전자 발현을 구동하는 활성이 없지만 근위 인핸서 요소에 연결될 때 유전자 발현을 구동하도록 활성화될 수 있다.
특정 구현예에서, 발현 작제물은 벡터 내에 제공된다. 용어 벡터는 발현 작제물과 같은 또 다른 핵산 분자를 전달하거나 또는 수송할 수 있는 핵산 분자를 지칭한다. 전달된 핵산은 일반적으로 벡터 핵산 분자에 연결, 예를 들어, 삽입된다. 벡터는 세포에서 자율 복제를 지시하는 서열을 포함할 수 있거나 또는 숙주 세포 DNA 내에 통합을 허용하는 서열을 포함할 수 있다. 유용한 벡터는 예를 들어, 플라스미드(예를 들어, DNA 플라스미드 또는 RNA 플라스미드), 트랜스포존, 코스미드, 박테리아 인공 염색체, 및 바이러스 벡터를 포함한다.
바이러스 벡터는 세포 내에서 비-천연 핵산 분자의 전달 및 발현을 용이하게 하는 바이러스-유래 구성요소를 포함하는 핵산 분자를 지칭하기 위해 광범위하게 사용된다. 용어 아데노-연관 바이러스 벡터는 주로 AAV로부터 유래된 구조적 및 기능적 유전적 요소, 또는 이의 부분을 함유하는 바이러스 벡터 또는 플라스미드를 지칭한다. 용어 "레트로바이러스 벡터"는 주로 레트로바이러스로부터 유래된 구조적 및 기능적 유전적 요소, 또는 이의 부분을 함유하는 바이러스 벡터 또는 플라스미드를 지칭한다. 용어 "렌티바이러스 벡터"는 주로 렌티바이러스 등으로부터 유래된 구조적 및 기능적 유전적 요소, 또는 이의 부분을 함유하는 바이러스 벡터 또는 플라스미드를 지칭한다. 용어 "하이브리드 벡터"는 하나 초과의 바이러스 유형으로부터의 구조적 및/또는 기능적 유전적 요소를 포함하는 벡터를 지칭한다.
아데노바이러스 벡터는 (a) 인공 발현 작제물의 패키징을 지원하고 (b) 센스 또는 안티센스 배향으로 그 안에 클로닝된 코딩 서열을 발현하기에 충분한 아데노바이러스 서열을 함유하는 작제물을 지칭한다. 재조합 아데노바이러스 벡터는 아데노바이러스의 유전적으로 조작된 형태를 포함한다. 36 kb, 선형, 이중 가닥 DNA 바이러스인 아데노바이러스의 유전적 조직화에 대한 지식은 큰 조각의 아데노바이러스 DNA를 최대 7 kb의 외래 서열로 치환하는 것을 허용한다. 레트로바이러스와 대조적으로, 숙주 세포의 아데노바이러스 감염은 염색체 통합을 초래하지 않는 데 아데노바이러스 DNA가 잠재적인 유전독성 없이 에피솜 방식으로 복제할 수 있기 때문이다. 또한, 아데노바이러스는 구조적으로 안정하고, 광범위한 증폭 후 게놈 재배열이 검출되지 않았다.
아데노바이러스는 중간 크기 게놈, 제작의 용이성, 높은 역가, 넓은 표적 세포 범위, 및 높은 감염성으로 인해 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 양쪽 단부는 100-200 개 염기쌍 도립된 반복부(ITR)를 함유하며, 이는 바이러스 DNA 복제 및 패키징에 필요한 시스 요소이다. 게놈의 초기(E) 및 후기(L) 영역은 바이러스 DNA 복제 개시에 의해 나눠진 상이한 전사 단위를 함유한다. E1 영역(E1A 및 E1B)은 바이러스 게놈 및 몇몇 세포 유전자의 전사 조절을 담당하는 단백질을 암호화한다. E2 영역(E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질 합성을 초래한다. 이들 단백질은 DNA 복제, 후기 유전자 발현, 및 숙주 세포 차단에 수반된다. 대다수의 바이러스 캡시드 단백질을 포함한 후기 유전자의 생성물은 주요 후기 프로모터(MLP)에 의해 비롯된 단일 1차 전사체의 유의한 처리후에만 발현된다. MLP는 감염의 후기 단계 동안 특히 효율적이고, 이 프로모터로부터 비롯된 모든 mRNA는 5'-삼부 리더(TPL) 서열을 보유하여 번역을 위해 선호되는 mRNA로 만든다.
아데노바이러스 벡터가 복제 결함성이거나, 또는 적어도 조건부로 결함성인 요건 이외에, 아데노바이러스 벡터의 속성은 본원에 개시된 특정 구현예의 성공적인 실행에 결정적인 것으로 여겨지지 않는다. 아데노바이러스 42 개의 상이한 알려진 혈청형 또는 하위그룹 A-F 중 임의의 것일 수 있다. 특정 구현예에서, 아데노바이러스 유형 5는 많은 생화학적 및 유전적 정보가 알려져 있고, 역사적으로 아데노바이러스를 벡터로서 이용하는 대부분의 구성에 사용되는 인간 아데노바이러스이므로, 하위그룹 C의 아데노바이러스 유형 5는 특정 구현예에서 사용하기 위한 조건부 복제-결함성 아데노바이러스 벡터를 수득하기 위한 바람직한 출발 물질이다.
나타낸 바와 같이, 전형적인 벡터는 복제 결함성이고 아데노바이러스 E1 영역을 갖지 않을 것이다. 따라서, E1-코딩 서열이 제거된 위치에 관심 유전자를 암호화하는 폴리뉴클레오티드를 도입하는 것이 가장 편리할 것이다. 그러나, 아데노바이러스 서열 내에서 작제물의 삽입 위치는 중요하지 않다. 관심 유전자를 암호화하는 폴리뉴클레오티드는 또한 E3 대체 벡터에서 결실된 E3 영역 대신에 삽입되거나 또는 헬퍼 세포주 또는 헬퍼 바이러스가 E4 결함을 보완하는 E4 영역에 삽입될 수 있다.
아데노-연관 바이러스(AAV)는 아데노바이러스 스톡의 오염으로서 발견된 파보바이러스이다. 이는 임의의 질환과 관련되지 않은 보편적 바이러스이다(항체는 미국 인구의 85%에 존재함). 또한 데펜도바이러스로서 분류되는 데, 이의 복제가 아데노바이러스와 같은 헬퍼 바이러스의 존재에 의존하기 때문이다. 다양한 혈청형이 단리되었으며, 이 중 AAV-2가 가장 특성화된다. AAV는 캡시드 단백질 VP1, VP2 및 VP3 내에 캡슐화되어 20 내지 24 nm 직경의 20면체 비리온을 형성하는 단일 가닥 선형 DNA를 갖는다.
AAV DNA는 4.7 킬로베이스 길이이다. 이는 2 개의 오픈 리딩 프레임을 함유하고 2 개의 ITR에 의해 플랭킹된다. AAV 게놈에 2 개의 주요 유전자가 있다: rep 및 cap. rep 유전자는 바이러스 복제를 담당하는 단백질을 코딩하는 반면, cap은 캡시드 단백질 VP1-3을 코딩한다. 각 ITR은 T-형태 헤어핀 구조를 형성한다. 이들 말단 반복부는 염색체 통합을 위한 AAV의 유일한 필수 시스 구성요소이다. 따라서, AAV는 모든 바이러스 코딩 서열이 제거되고 전달을 위한 유전자 카세트로 대체된 벡터로서 사용될 수 있다. 3 개의 AAV 바이러스 프로모터가 식별되었고 이들의 맵 위치에 따라 p5, p19, 및 p40으로 명명된다. p5 및 p19의 전사는 rep 단백질의 생산을 초래하고, p40의 전사는 캡시드 단백질을 생산한다.
AAV는 그들의 최상의 안전성 프로파일로 인해 그리고 선택된 세포 집단에서 발현을 허용하도록 캡시드 및 게놈을 맞출 수 있기 때문에 본 개시내용 내에서 사용하기 위해 두드러진다. scAAV는 자기-상보성 AAV를 지칭한다. pAAV는 플라스미드 아데노-연관 바이러스를 지칭한다. rAAV는 재조합 아데노-연관 바이러스를 지칭한다.
다른 바이러스 벡터가 또한 이용될 수 있다. 예를 들어, 백시니아 바이러스, 폴리오바이러스 및 헤르페스 바이러스와 같은 바이러스로부터 유래된 벡터가 이용될 수 있다. 그들은 다양한 포유동물 세포에 여러 매력적인 특징을 제공한다.
레트로바이러스는 유전자 전달을 위한 통상적인 도구이다. "레트로바이러스"는 그의 게놈 RNA를 선형 이중 가닥 DNA 카피로 역전사하고 후속적으로 그의 게놈 DNA를 숙주 게놈으로 공유적으로 통합하는 RNA 바이러스를 지칭한다. 일단 바이러스가 숙주 게놈 내에 통합되면, "프로바이러스"로 지칭된다. 프로바이러스는 RNA 폴리머라제 II에 대한 주형으로서 역할을 하고 새로운 바이러스 입자를 생산하는 데 핑료한 구조적 단백질 및 효소를 암호화하는 RNA 분자의 발현을 지시한다.
특정 구현예에서 사용하기에 적합한 예시적인 레트로바이러스는 다음을 포함한다: 몰로니 뮤린 백혈병 바이러스(M-MuLV), 몰로니 뮤린 육종 바이러스(MoMSV), 하비 뮤린 육종 바이러스(HaMuSV), 뮤린 유선 종양 바이러스(MuMTV), 긴팔원숭이 백혈병 바이러스(GaLV), 고양이 백혈병 바이러스(FLV), 스푸마바이러스, 프렌드 뮤린 백혈병 바이러스, 뮤린 줄기 세포 바이러스(MSCV), 라우스 육종 바이러스(RSV), 및 렌티바이러스.
"렌티바이러스"는 복합 레트로바이러스의 그룹(또는 속)을 지칭한다. 예시적인 렌티바이러스는 다음을 포함한다: HIV(인간 면역결핍 바이러스; HIV 유형 1, 및 HIV 유형 2 포함); 비스나-매디 바이러스(VMV); 산양 관절염-뇌염 바이러스(CAEV); 말 전염성 빈혈 바이러스(EIAV); 고양이 면역결핍 바이러스(FIV); 소 면역 결핍 바이러스(BIV); 및 시미안 면역결핍 바이러스(SIV). 특정 구현예에서, HIV 기반 벡터 백본(즉, HIV 시스-작용 서열 요소)이 사용될 수 있다.
일부 벡터의 사용에 대한 안전성 향상은 5' LTR의 U3 영역을 이종 프로모터로 대체하여 바이러스 입자의 생산 동안 바이러스 게놈의 전사를 구동함으로써 제공될 수 있다. 이 목적에 사용될 수 있는 이종 프로모터의 예는 예를 들어, 바이러스 시미안 바이러스 40(SV40)(예를 들어, 초기 또는 후기), 사이토메갈로바이러스(CMV)(예를 들어, 즉시 초기), 몰로니 뮤린 백혈병 바이러스(MoMLV), 라우스 육종 바이러스(RSV), 및 단순 헤르페스 바이러스(HSV)(티미딘 키나제) 프로모터를 포함한다. 전형적인 프로모터는 Tat-독립적 방식으로 높은 수준의 전사를 구동할 수 있다. 이 대체는 바이러스 생산 시스템에 완전한 U3 서열이 없기 때문에 복제-적격 바이러스를 생성하기 위해 재조합 가능성을 줄인다. 특정 구현예에서, 이종 프로모터는 바이러스 게놈이 전사되는 방식을 제어하는 데 추가적인 이점을 갖는다. 예를 들어, 이종 프로모터는 바이러스 게놈의 전부 또는 일부의 전사가 유도 인자가 존재할 때만 발생하도록 유도성일 수 있다. 유도 인자는 하나 이상의 화학적 화합물 또는 숙주 세포가 배양되는 온도 또는 pH와 같은 생리학적 조건을 포함한다.
특정 구현예에서, 바이러스 벡터는 TAR 요소를 포함한다. 용어 "TAR"은 렌티바이러스 LTR의 R 영역에 위치한 "트랜스-활성화 반응" 유전적 요소를 지칭한다. 이 요소는 렌티바이러스 트랜스-활성인자(tat) 유전적 요소와 상호작용하여 바이러스 복제를 향상시킨다. 그러나, 이 요소는 5' LTR의 U3 영역이 이종 프로모터에 의해 대체되는 구현예에서 필요하지 않다.
"R 영역"은 캡핑 기의 시작(즉, 전사의 시작)에서 시작하여 폴리(A) 구역의 시작 직전에 끝나는 레트로바이러스 LTR 내의 영역을 지칭한다. R 영역은 또한 U3 및 U5 영역에 의해 플랭킹되는 것으로 정의된다. R 영역은 게놈의 한쪽 단부에서 다른쪽 단부로 초기 DNA의 전달을 허용하는 역전사 동안 역할을 한다.
특정 구현예에서, 바이러스 벡터에서 이종 서열의 발현은 전사후 조절 요소, 효율적인 폴리아데닐화 부위, 및 임의적으로, 전사 종결 신호를 벡터에 혼입함으로써 증가된다. 다양한 전사후 조절 요소는 이종 핵산의 발현을 증가시킬 수 있다. 예는 우드척 간염 바이러스 전사후 조절 요소(WPRE; Zufferey 등, 1999, J. Virol., 73:2886); B형 간염 바이러스에 존재하는 전사후 조절 요소(HPRE)(Smith 등, Nucleic Acids Res. 26(21):4818-4827, 1998); 기타(Liu 등, 1995, Genes Dev., 9:1766)를 포함한다. 특정 구현예에서, 벡터는 WPRE, WPRE3, 또는 HPRE와 같은 전사후 조절 요소를 포함한다. 특정 구현예에서, 벡터는 WPRE, WPRE3, 또는 HPRE와 같은 전사후 조절 요소가 결여되어 있거나 또는 포함하지 않는다.
이종 핵산 전사체의 효율적인 종결 및 폴리아데닐화를 지시하는 요소는 이종 유전자 발현을 증가시킬 수 있다. 전사 종결 신호는 일반적으로 폴리아데닐화 신호의 하류에서 발견된다. 특정 구현예에서, 벡터는 발현될 분자(예를 들어, 단백질)를 암호화하는 폴리뉴클레오티드의 폴리아데닐화 신호 3'을 포함한다. 용어 "폴리(A) 부위" 또는 "폴리(A) 서열"은 RNA 폴리머라제 II에 의한 초기 RNA 전사체의 종결 및 폴리아데닐화 둘 다를 지시하는 DNA 서열을 나타낸다. 폴리아데닐화 서열은 코딩 서열의 3' 단부에 폴리(A) 꼬리를 첨가함으로써 mRNA 안정성을 촉진시켜, 증가된 번역 효율에 기여할 수 있다. 특정 구현예는 BGHpA 또는 SV40pA를 활용할 수 있다. 특정 구현예에서, 발현 작제물의 바람직한 구현예는 종결인자 요소를 포함한다. 이들 요소는 전사 수준을 향상시키고 작제물에서 다른 플라스미드 서열로의 판독을 최소화하는 역할을 할 수 있다.
특정 구현예에서, 바이러스 벡터는 하나 이상의 절연체 요소를 추가로 포함한다. 절연체 요소는 바이러스 벡터-발현된 서열, 예를 들어, 효과기 요소 또는 발현가능한 요소를 게놈 DNA에 존재하는 시스-작용 요소에 의해 매개되어 전달된 서열의 탈조절된 발현을 야기할 수 있는 통합 부위 효과(즉, 위치 효과; 예를 들어, Burgess-Beusse 등, PNAS., USA, 99:16433, 2002; 및 Zhan 등, Hum. Genet., 109:471, 2001 참조)로부터 보호하는 데 기여할 수 있다. 특정 구현예에서, 바이러스 전달 벡터는 3' LTR에 하나 이상의 절연체 요소를 포함하고 숙주 게놈에 프로바이러스의 통합 시, 프로바이러스는 3' LTR을 복제하여 5' LTR 및 3' LTR 둘 다에 하나 이상의 절연체를 포함한다. 특정 구현예에서 사용하기에 적합한 절연체는 닭 β-글로빈 절연체(Chung 등, Cell 74:505, 1993; Chung 등, PNAS USA 94:575, 1997; 및 Bell 등, Cell 98:387, 1999 참조), SP10 절연체(Abhyankar 등, JBC 282:36143, 2007), 또는 인핸서 차단 절연체로서 기능하는 다른 작은 CTCF 인식 서열(Liu 등, Nature Biotechnology, 33:198, 2015)을 포함한다.
전술한 설명 이상으로, 광범위한 적합한 발현 벡터 유형이 당업자에게 알려질 것이다. 이들은 일반적인 재조합 절차를 위해 설계된 상업적으로 입수가능한 발현 벡터, 예를 들어 세포에서 리포터 유전자의 발현에 필요한 하나 이상의 리포터 유전자 및 조절 요소를 함유하는 플라스미드를 포함할 수 있다. 수많은 벡터가 예를 들어, Invitrogen, Stratagene, Clontech 등으로부터 상업적으로 입수가능하고, 수많은 연관 가이드에 기재되어 있다. 특정 구현예에서, 적합한 발현 벡터는 pUC 또는 Bluescript 플라스미드 시리즈와 같은 포유동물 세포에서 암호화된 유전자의 발현을 지원할 수 있는 임의의 플라스미드, 코스미드 또는 파지 작제물을 포함한다.
본원에 개시된 벡터의 특정 구현예는 다음을 포함한다:
더 큰 벡터 서열 내의 하위구성요소 서열은 당업자에 의해 그리고 본 개시내용의 내용에 기반하여 용이하게 식별될 수 있다(도 12c 참조). 식별가능하고 열거된 하위구성요소 사이의 뉴클레오티드는 작제물의 조립(클로닝)에 사용되는 제한 효소 인식 부위를 반영하고, 일부 경우에, 추가의 뉴클레오티드는 임의의 식별가능한 기능을 전달하지 않는다. 완전한 벡터 서열의 이들 분절은 상이한 클로닝 전략 및/또는 벡터의 사용에 기반하여 조정될 수 있다. 일반적으로, 짧은 6-뉴클레오티드 회문 서열은 벡터 기능에 중요하지 않는 벡터 구성 인공물을 반영한다.
특정 구현예에서 혈액-뇌 장벽(BBB)을 가로지르는 캡시드가 있는 벡터(예를 들어, AAV)가 선택된다. 특정 구현예에서, 벡터는 BBB를 가로지르는 캡시드를 포함하도록 변형된다. 혈액 뇌 장벽을 가로지르는 바이러스 캡시드가 있는 AAV의 예는 AAV9(Gombash 등, Front Mol Neurosci. 2014; 7:81), AAVrh.10(Yang, 등, Mol Ther. 2014; 22(7): 1299-1309), AAV1R6, AAV1R7(Albright 등, Mol Ther. 2018; 26(2): 510), rAAVrh.8(Yang, 등, 상기), AAV-BR1(Marchio 등, EMBO Mol Med. 2016; 8(6): 592), AAV-PHP.S(Chan 등, Nat Neurosci. 2017; 20(8): 1172), AAV-PHP.B(Deverman 등, Nat Biotechnol. 2016; 34(2): 204), AAV-PPS(Chen 등, Nat Med. 2009; 15: 1215), 및 PHP.eB를 포함한다. 특정 구현예에서, PHP.eB 캡시드는 참조로서 AAV9를 사용하여, 잔기 586에서 시작하는 아미노산: S-AQ-A(서열번호: 144)이 S-DGTLAVPFK-A(서열번호: 145)로 바뀌도록 AAV9와 상이하다. 특정 구현예에서, PHP.eb는 서열번호: 85를 지칭한다.
AAV9는 많은 다른 자연 발생 혈청형과 달리, 정맥내 주사 후 BBB를 가로지를 수 있는 자연 발생 AAV 혈청형이다. 이는 중추신경계(CNS)의 큰 섹션을 형질도입하여, 예를 들어, AveXis(AVXS-101, NCT03505099)에 의한 척수근위축증의 치료 및 CLN3 유전자-관련 뉴런 세로이드-리포푸신증(NCT03770572)의 치료를 위한 임상 시험과 관련하여 기재된 바와 같이, 최소 침습적 치료를 허용한다(Naso 등, BioDrugs. 2017; 31(4): 317).
AAVrh.10은 원래 레서스 원숭이로부터 단리되었고 유전자 전달 적용에 사용되는 다른 통상적인 혈청형과 비교할 때 인간에서 낮은 혈청양성을 나타내고(Selot 등, Front Pharmacol. 2017; 8: 441) 임상 시험 LYS-SAF302, LYSOGENE, 및 NCT03612869에서 평가되었다.
키메라 AAV 벡터의 라이브러리로부터 단리된 2 개의 변이체인 AAV1R6 및 AAV1R7(AAVrh.10으로 교환된 AAV1 캡시드 도메인)은 BBB를 가로지르는 능력을 유지하고 유의하게 감소된 간 및 혈관 내피 형질도입을 나타내면서 CNS를 형질도입한다.
또한 레서스 원숭이로부터 단리된 rAAVrh.8은 말초 투여 후 중요한 임상 영역에서 교질 및 뉴런 세포 유형의 전반적 형질도입을 나타내고 또한 다른 벡터와 비교하여 감소된 말초 조직 향성을 나타낸다.
AAV-BR1은 무작위 AAV 디스플레이 펩티드 라이브러리의 생체내 스크리닝 동안 단리된 NRGTEWD(서열번호: 146) 에피토프를 나타내는 AAV2 변이체이다. 이는 최소 표적외 친화도를 갖는 뇌에서 높은 이식유전자 발현에 의해 동반되는 높은 특이성을 나타낸다(간 포함)( 등, EMBO Mol Med. 2016; 8(6): 609).
AAV-PHP.S(Addgene, 매사추세츠주 워터타운 소재)는 7-mer 서열 QAVRTSL(서열번호: 147)을 암호화하고, 장 신경계에서 뉴런을 형질도입하고, 척수 및 뇌간으로 들어가는 말초 감각 구심성 신경을 강력하게 형질도입하는 CREATE 방법으로 생성된 AAV9의 변이체이다.
AAV-PHP.B(Addgene, 매사추세츠주 워터타운 소재)는 7-mer 서열 TLAVPFK(서열번호: 148)를 암호화하는 CREATE 방법으로 생성된 AAV9의 변이체이다. 이는 AAV9보다 더 높은 효율로 CNS 전체에 걸쳐 유전자를 전달하고 대다수의 성상세포 및 뉴런을 다중 CNS 영역에 걸쳐 형질도입한다.
AAV2의 캡시드 내에 DSPAHPS(서열번호: 149) 에피토프를 삽입함으로써 생성된 AAV2 변이체인 AAV-PPS는 AAV2에 비해 극적으로 개선된 뇌 향성을 나타낸다.
혈액 뇌 장벽을 가로지르는 캡시드에 관한 추가 정보를 위해, Chan 등, Nat. Neurosci. 2017 Aug: 20(8): 1172-1179를 참조한다.
(ii) 투여용 조성물. 본 개시내용의 인공 발현 작제물 및 벡터(본원에서 생리학적으로 활성인 구성요소로서 지칭됨)는 세포, 조직 절편, 동물(예를 들어, 마우스, 비-인간 영장류), 또는 인간에게 투여하기에 적합한 담체로 제형화될 수 있다. 본원에 기재된 조성물 내의 생리학적으로 활성인 구성요소는 중성 형태, 유리 염기, 또는 약학적으로 허용되는 염으로 제조될 수 있다.
약제학적으로 허용되는 염은 예를 들어, 염산 또는 인산과 같은 무기 산, 또는 아세트산, 옥살산, 타르타르산, 만델산 등과 같은 유기 산으로 형성된 산 부가 염(단백질의 유리 아미노 기로 형성됨)을 포함한다. 유리 카복실 기로 형성된 염은 또한 예를 들어, 나트륨, 칼륨, 암모늄, 칼슘, 또는 수산화제2철과 같은 무기 염기, 및 이소프로필아민, 트리메틸아민, 히스티딘, 프로카닌 등과 같은 유기 염기로부터 유래될 수 있다.
생리학적으로 활성인 구성요소의 담체는 용매, 분산 매질, 비히클, 코팅, 희석제, 등장제 및 흡수 지연제, 완충제, 용액, 현탁액, 콜로이드 등을 포함할 수 있다. 생리학적으로 활성인 구성요소를 위한 이러한 담체의 사용은 당업계에 잘 알려져 있다. 임의의 통상적인 매질 또는 제제가 생리학적으로 활성인 구성요소와 양립할 수 없는 경우를 제외하고, 본원에 기재된 바와 같은 조성물과 함께 사용될 수 있다.
어구 "약제학적으로 허용되는 담체"는 인간에게 투여될 때, 특정 구현예에서, 정맥내로(예를 들어 안구뒤 망상조직에) 투여될 때 알레르기성 또는 유사한 원치않은 반응을 생산하지 않는 담체를 지칭한다.
특정 구현예에서, 조성물은 하나 이상의 세포, 조직, 또는 기관에 정맥내, 뇌실질내, 안내, 유리체내, 비경구, 피하, 대뇌내-심실, 근육내, 척추강내, 척수내, 복강내, 경구 또는 비강 흡입을 위해, 또는 직접 주사 또는 적용에 의해 제형화될 수 있다.
조성물은 리포솜, 지질, 지질 복합체, 미소구체, 미립자, 나노구체, 및/또는 나노입자를 포함할 수 있다.
리포솜의 형성 및 사용은 일반적으로 당업자에게 알려져 있다. 개선된 혈청 안정성 및 순환 반감기를 갖는 리포솜이 개발되었다(예를 들면, 미국 특허 번호 5,741,516 참조). 또한, 잠재적인 약물 담체로서 리포솜 및 리포솜 유사 제제의 다양한 방법이 기재되었다(예를 들면 미국 특허 번호 5,567,434; 5,552,157; 5,565,213; 5,738,868; 및 5,795,587 참조).
개시내용은 또한 생리학적으로 활성인 구성요소의 약제학적으로 허용되는 나노캡슐 제형을 제공한다. 나노캡슐은 일반적으로 안정하고 재현가능한 방식으로 화합물을 포획할 수 있다(Quintanar-Guerrero 등, Drug Dev Ind Pharm 24(12):1113-1128, 1998; Quintanar-Guerrero 등, Pharm Res. 15(7):1056-1062, 1998; Quintanar-Guerrero 등, J. Microencapsul. 15(1):107-119, 1998; Douglas 등, Crit Rev Ther Drug Carrier Syst 3(3):233-261, 1987). 세포내 중합체 과부하로 인한 부작용을 피하기 위해, 생체내에서 분해될 수 있는 중합체를 사용하여 이러한 초미세 입자를 설계할 수 있다. 이들 요건을 충족하는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 본 개시내용에서 사용하기 위해 고려된다. 이러한 입자는 Couvreur 등, J Pharm Sci 69(2):199-202, 1980; Couvreur 등, Crit Rev Ther Drug Carrier Syst. 5(1)1-20, 1988; zur Muhlen 등, Eur J Pharm Biopharm, 45(2):149-155, 1998; Zambaux 등, J Control Release 50(1-3):31-40, 1998; 및 미국 특허 번호 5,145,684에 기재된 바와 같이 용이하게 제조할 수 있다.
주사용 조성물은 멸균 수용액 또는 분산액 및 멸균 주사용 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함할 수 있다(미국 특허 번호 5,466,468). 주사를 통한 전달의 경우, 형태는 멸균되고 주사기로 전달할 수 있는 정도로 유체이다. 특정 구현예에서, 제조 및 저장 조건 하에 안정하고, 임의적으로 박테리아 및 진균과 같은 미생물의 오염 작용에 대한 하나 이상의 방부제 화합물을 함유한다. 담체는 예를 들어, 물, 에탄올, 폴리올(예를 들어, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 이의 적합한 혼합물, 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어, 레시틴과 같은 코팅을 사용하여, 분산액의 경우 필요한 입자 크기를 유지하여, 및/또는 계면활성제를 사용하여 유지될 수 있다. 미생물 작용의 예방은 다양한 항균제 및/또는 항진균제, 예를 들어, 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 야기될 수 있다. 다양한 구현예에서, 제제는 등장제(들), 예를 들어, 당(들) 또는 염화나트륨을 포함할 것이다. 주사용 조성물의 장기간 흡수는 흡수를 지연시키는 제제, 예를 들어, 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 포함함으로써 달성될 수 있다. 주사용 조성물은 필요한 경우 적합하게 완충될 수 있고, 액체 희석제는 먼저 충분한 염수 또는 글루코스로 등장성으로 만든다.
분산액은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 이의 혼합물 및 오일에서 제조될 수 있다. 나타낸 바와 같이, 저장 및 사용의 일반적인 조건 하에, 이들 제제는 미생물의 성장을 방지하기 위한 방부제를 함유할 수 있다.
멸균 조성물은 생리학적으로 활성인 구성요소를 적절한 양의 용매에 다른 임의적 성분(예를 들어, 상기 열거된 바와 같음)과 함께 혼입한 후, 여과 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 다양한 멸균된 생리학적으로 활성인 구성요소를 기본 분산 매질 및 필요한 다른 성분(예를 들어, 상기 열거된 것들)을 함유하는 멸균 비히클에 혼입함으로써 제조된다. 멸균 주사용 용액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 생리학적으로 활성인 구성요소 및 이의 이전에 멸균 여과된 용액으로부터의 임의의 추가의 원하는 성분의 분말을 산출하는 진공-건조 및 동결-건조 기술일 수 있다.
경구 조성물은 액체 형태, 예를 들어, 용액, 시럽 또는 현탁액일 수 있거나, 또는 사용 전에 물 또는 다른 적합한 비히클로 재구성하기 위한 약물 생성물로서 제시될 수 있다. 이러한 액체 제제는 현탁제(예를 들어, 소르비톨 시럽, 셀룰로스 유도체 또는 수소화 식용 지방); 유화제(예를 들어, 레시틴 또는 아카시아); 비-수성 비히클(예를 들어, 아몬드 오일, 오일 에스테르, 또는 분별 식물성 오일); 및 방부제(예를 들어, 메틸 또는 프로필-p-하이드록시벤조에이트 또는 소르브산)와 같은 약제학적으로 허용되는 첨가제와 함께 통상적인 수단에 의해 제조될 수 있다. 조성물은 예를 들어, 결합제(예를 들어, 예비겔화된 옥수수 전분, 폴리비닐 피롤리돈 또는 하이드록시프로필 메틸셀룰로스); 충전제(예를 들어, 락토스, 미세결정질 셀룰로스 또는 칼슘 수소 포스페이트); 윤활제(예를 들어, 마그네슘 스테아레이트, 활석 또는 실리카); 붕해제(예를 들어, 감자 전분 또는 나트륨 전분 글리콜레이트); 또는 습윤제(예를 들어, 나트륨 라우릴 설페이트)와 같은 약제학적으로 허용되는 부형제와 함께 통상적인 수단에 의해 제조된 정제 또는 캡슐 형태로 취할 수 있다. 정제는 당업계에 잘 알려진 방법에 의해 코팅될 수 있다.
흡입용 조성물은 적합한 추진체, 예를 들어, 디클로로디플루오로메탄, 트리클로로플루오로메탄, 디클로로테트라플루오로에탄, 이산화탄소 또는 다른 적합한 기체를 사용하여 가압 팩 또는 분무기로부터 에어로졸 스프레이 제시 형태로 전달될 수 있다. 가압 에어로졸의 경우 투여량 단위는 계량된 양을 전달하기 위한 밸브를 제공함으로써 결정될 수 있다. 예를 들어, 흡입기 또는 취입기에서 사용하기 위한 젤라틴의 캡슐 및 카트리지는 화합물의 분말 믹스 및 락토스 또는 전분과 같은 적합한 분말 베이스를 함유하여 제형화될 수 있다.
조성물은 또한 마이크로칩 장치(미국 특허 번호 5,797,898), 안과용 제형(Bourlais 등, Prog Retin Eye Res, 17(1):33-58, 1998), 경피 매트릭스(미국 특허 번호 5,770,219 및 미국 특허 번호 5,783,208) 및 피드백-제어 전달(미국 특허 번호 5,697,899)을 포함할 수 있다.
보조 활성 성분이 또한 조성물에 혼입될 수 있다.
전형적으로, 조성물은 생리학적으로 활성인 구성요소의 적어도 0.1% 이상을 포함할 수 있지만, 생리학적으로 활성인 구성요소의 백분율은 물론 달라질 수 있고 편리하게는 총 조성물의 중량 또는 부피의 1 또는 2% 내지 70% 또는 80% 이상 또는 0.5-99%일 수 있다. 자연스럽게, 각 생리학적으로 유용한 조성물 중 생리학적으로 활성인 구성요소의 양은 적합한 투여량이 화합물의 임의의 주어진 단위 용량으로 수득될 수 있는 방식으로 제조될 수 있다. 용해도, 생체이용률, 생물학적 반감기, 투여 경로, 생성물 저장 수명, 뿐만 아니라 다른 약리학적 고려사항과 같은 인자는 이러한 약제학적 제형을 제조하는 분야의 숙련자에 의해 고려될 것이고, 이와 같이 다양한 조성물 및 투여량이 바람직할 수 있다.
특정 구현예에서, 인간에게 투여하기 위해, 조성물은 미국식품의약국(FDA) 또는 다른 국가의 다른 적용가능한 규제 기관에서 요구하는 멸균성, 발열성, 및 일반적인 안전성 및 순도 표준을 충족해야 한다.
(iii) 인공 발현 작제물을 포함한 세포주. 본 개시내용은 본원에 기재된 인공 발현 작제물을 포함한 세포를 포함한다. 인공 발현 작제물로 형질전환된 세포는 신경해부학적 연구, 기능화 및/또는 비-기능화 단백질의 평가, 및 인핸서의 조절 특성을 평가하는 약물 스크린을 포함한 많은 목적을 위해 사용될 수 있다.
다양한 숙주 세포주가 사용될 수 있지만, 특정 구현예에서, 세포는 포유동물 세포이다. 특정 구현예에서, 인공 발현 작제물은 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m 및/또는 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024의 인핸서 및/또는 벡터 서열을 포함하고, 세포주는 인간, 영장류, 또는 뮤린 세포이다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다. 본 개시내용에서 이식유전자유발에 활용될 수 있는 세포주는 또한 래트 또는 마우스 뇌와 같은 살아있는 조직 및 래트 또는 마우스와 같은 동물의 뇌 절편을 포함한 기관형 세포 배양물로부터 유래된 1차 세포주를 포함한다. PC12 세포주(버지니아주 머내서스 소재의 아메리칸 타입 컬쳐 콜렉션, ATCC로부터 입수가능)는 신경 성장 인자(NGF)에 반응하여 다수의 뉴런 마커 단백질을 발현하는 것으로 제시되었다. PC12 세포주는 뉴런 세포주인 것으로 간주되며 본 개시내용에 따라 사용하기에 적당하다. JAR 세포(ATCC로부터 입수가능)는 세로토닌 수송체 유전자와 같은 일부 뉴런 유전자를 발현하는 혈소판 유래 세포주이며, 본원에 기재된 구현예에 따라 사용될 수 있다.
WO 91/13150은 뉴런 세포주를 포함한 다양한 세포주, 및 이들을 생산하는 방법을 기재하고 있다. 유사하게, WO 97/39117은 뉴런 세포주 및 이러한 세포주를 생산하는 방법을 기재하고 있다. 이들 특허 출원에 개시된 뉴런 세포주는 본 개시내용에서 사용하기에 적당하다.
특정 구현예에서, "뉴런"은 뉴런 세포의 것인, 이와 관련된, 또는 이를 포함하는 것을 설명한다. 뉴런 세포는 축색 돌기 및 수지상 돌기의 존재에 의해 정의된다. 용어 "뉴런-특이적"은 뉴런 세포 또는 뉴런 세포에서 유래된 세포에서 발견되거나, 또는 발생하는 활성이지만, 비-뉴런 세포 또는 뉴런 세포로부터 유래되지 않은 세포, 예를 들어 성상세포 또는 희소돌기아교세포와 같은 교질 세포에서 발견되지 않거나 또는 발생하지 않거나, 또는 실질적으로 발견되지 않거나 또는 실질적으로 발생하지 않는 것을 지칭한다.
특정 구현예에서, 마우스 배아 줄기 세포를 포함한 비-뉴런 세포주가 사용될 수 있다. 배양된 마우스 배아 줄기 세포는 플라스미드 작제물로 일시적 형질감염을 사용하여 유전적 작제물의 발현을 분석는 데 사용될 수 있다. 마우스 배아 줄기 세포는 만능성이고 미분화된다. 이들 세포는 백혈병 억제 인자(LIF)에 의해 이 미분화된 상태에서 유지될 수 있다. LIF의 철회는 배아 줄기 세포의 분화를 유도한다. 배양물에서, 줄기 세포는 다양한 분화된 세포 유형을 형성한다. 분화는 조직 특이적 전사 인자의 발현에 의해 야기되어, 인핸서 서열의 기능을 평가할 수 있다(예를 들어 Fiskerstrand 등, FEBS Lett 458: 171-174, 1999 참조).
줄기 세포를 뉴런 세포로 분화하는 방법은 줄기 세포 배양 배지를 염기성 섬유모세포 성장 인자(bFGF) 헤파린, N2 보충물(예를 들어, 트랜스페린, 인슐린, 프로게스테론, 푸트레신, 및 셀리나이트), 라민 및 폴리오르니틴을 포함한 배지로 교체하는 것을 포함한다. 줄기 세포로부터 수초성 희소돌기아교세포를 생산하는 과정은 Hu, 등, 2009, Nat. Protoc. 4:1614-22에 기재되어 있다. Bibel, 등, 2007, Nat. Protoc. 2:1034-43은 줄기 세포로부터 글루타메이트성 뉴런을 생산하는 프로토콜을 기재하고 있은 반면 Chatzi, 등, 2009, Exp. Neurol. 217:407-16은 GABA성 뉴런을 생산하는 절차를 기재하고 있다. 이 절차는 줄기 세포를 모든-트랜스-RA에 3 일 동안 노출시키는 것을 포함한다. B27, bFGF 및 EGF가 보충된 Neurobasal 배지를 포함한 무혈청 뉴런 유도 배지에서 후속 배양 후, 95% GABA 뉴런이 발생한다
미국 공개 번호 2012/0329714는 신경 줄기 세포 수를 증가시키기 위한 프로락틴의 사용을 기재하고 있는 반면 미국 공개 번호 2012/0308530은 뉴런, 성상세포 및 희소돌기아교세포로의 뉴런 분화를 촉진하는 아미노 기를 갖는 배양 표면을 기재하고 있다. 따라서, 신경 줄기 세포의 운명은 다양한 세포외 인자에 의해 제어될 수 있다. 통상적으로 사용되는 인자는 뇌 유래 성장 인자(BDNF; Shetty 및 Turner, 1998, J. Neurobiol. 35:395-425); 섬유모세포 성장 인자(bFGF; 미국 특허 번호 5,766,948; FGF-1, FGF-2); 뉴로트로핀-3(NT-3) 및 뉴로트로핀-4(NT-4); Caldwell, 등, 2001, Nat. Biotechnol. 1;19:475-9); 섬모 신경친화성 인자(CNTF); BMP-2(미국 특허 번호 5,948,428 및 6,001,654); 이소부틸 3-메틸크산틴; 백혈병 억제 성장 인자(LIF; 미국 특허 번호 6,103,530); 소마토스타틴; 암피레굴린; 뉴로트로핀(예를 들어, 사이클릭 아데노신 모노포스페이트; 표피 성장 인자(EGF); 덱사메타손(글루코코르티코이드 호르몬); 포스콜린; GDNF 패밀리 수용체 리간드; 칼륨; 레티노산(미국 특허 번호 6,395,546); 파상풍 독소; 및 형질전환 성장 인자-α 및 TGF-β(미국 특허 번호 5,851,832 및 5,753,506)를 포함한다.
특정 구현예에서, 효모 원-하이브리드 시스템은 또한 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 및 그들의 코어에 대한 전사 인자와 같은 특이적 단백질/DNA 상호작용을 억제하는 화합물을 식별하는 데 사용될 수 있다.
유전자이식 동물이 하기에 기재되어 있다. 세포주는 또한 이러한 유전자이식 동물로부터 유래될 수 있다. 예를 들어, 유전자이식 마우스로부터의 1차 조직 배양물(예를 들어, 또한 하기에 기재된 바와 같음)은 이미 게놈에 통합된 인공 발현 작제물을 갖는 세포주를 제공할 수 있다. (예를 들어 MacKenzie & Quinn, Proc Natl Acad Sci USA 96: 15251-15255, 1999 참조).
(iv) 유전자이식 동물. 개시내용의 또 다른 측면은 유전자이식 동물을 포함하며, 이의 게놈은 이종 코딩 서열에 작동가능하게 연결된 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m을 포함한 인공 발현 작제물을 함유한다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다. 특정 구현예에서, 유전자이식 동물의 게놈은 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함한다. 특정 구현예에서, 비-통합 벡터가 활용되는 경우, 유전자이식 동물은 그의 세포 중 하나 이상 내에 인공 발현 작제물 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m 및/또는 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함한다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다.
유전자이식 동물을 생산하는 상세한 방법은 미국 특허 번호 4,736,866에 기재되어 있다. 유전자이식 동물은 임의의 비인간 종의 것일 수 있지만, 바람직하게는 비인간 영장류(NHP), 양, 말, 소, 돼지, 염소, 개, 고양이, 토끼, 닭, 및 설치류 예컨대 기니 피그, 햄스터, 게르빌, 래트, 마우스, 및 흰족제비를 포함한다.
특정 구현예에서, 유전자이식 동물의 구성은 동일한 게놈 통합 부위의 모든 세포에 존재하는 조작된 작제물을 갖는 유기체를 초래한다. 따라서, 이러한 유전자이식 동물로부터 유래된 세포주는 조작된 작제물이 모든 세포에서 동일한 게놈 통합 부위에 있을 수 있는 만큼 일관성이 있을 것이고 따라서 동일한 위치 효과 변화를 겪을 것이다. 대조적으로, 세포주 또는 1차 세포 배양물에 유전자를 도입하면 작제물의 이종 발현을 일으킬 수 있다. 이 접근법의 단점은 도입된 DNA의 발현이 숙주 동물의 특정 유전적 배경에 의해 영향을 받을 수 있다는 점이다.
세포주와 관련하여 상기 나타낸 바와 같이, 본 개시내용의 인공 발현 작제물은 당업계에 알려진 기술을 사용하여 마우스 배아 줄기 세포를 유전적으로 변형시키는 데 사용될 수 있다. 전형적으로, 인공 발현 작제물은 배양된 뮤린 배아 줄기 세포 내에 도입된다. 그런 다음 형질전환된 ES 세포를 숙주 모체의 배반포에 주사하고 숙주 배아를 모체에 다시 이식한다. 이는 조직이 배양된 세포주에 존재하는 배아 줄기 세포 및 숙주 배아에 존재하는 배아 줄기 세포 둘 다로부터 유래된 세포로 구성된 키메라 마우스를 초래한다. 일반적으로 이식유전자유발에 사용되는 배양된 ES 세포가 유래된 마우스는 형질전환된 세포가 주사될 배아를 갖는 숙주 마우스와 상이한 코트 컬러를 갖도록 선택된다. 그런 다음 키메라 마우스는 변화된 코트 컬러를 가질 것이다. 생식계열 조직이 적어도 부분적으로 유전적으로 변형된 세포로부터 유래되는 한, 이어서 적절한 균주와 교배된 키메라 마우스는 이식유전자를 운반할 자손을 생산할 수 있다.
상기 기재된 전달 방법 이외에, 하기 기술이 또한 인공 발현 작제물을 동물의 표적 세포 또는 선택된 조직 또는 기관, 및 특히 척추동물 포유동물의 세포, 기관, 또는 조직에 전달하는 대안적인 방법으로 고려된다: 초음파영동법(예를 들어, 미국 특허 번호 5,656,016에 기재된 바와 같은 초음파); 골내 주사(미국 특허 번호 5,779,708); 마이크로칩 장치(미국 특허 번호 5,797,898); 안과용 제형(Bourlais 등, Prog Retin Eye Res, 17(1):33-58, 1998); 경피 매트릭스(미국 특허 번호 5,770,219 및 미국 특허 번호 5,783,208); 피드백-제어 전달(미국 특허 번호 5,697,899), 및 개시내용에서 이용가능하고/하거나 다른 곳에 기재된 임의의 다른 전달 방법.
(v) 사용 방법. 특정 구현예에서, 본원에 기재된 생리학적으로 활성인 구성요소를 포함하는 조성물은 생리학적 효과를 초래하기 위해 대상체에게 투여된다.
특정 구현예에서, 개시내용은 조작된 서열에서 해당 인핸서의 하류에 있는 위치에서 부분적으로 또는 전체적으로 암호화된 이종 유전자의 발현을 조절하기 위한 본원에 기재된 인공 발현 작제물의 용도를 포함한다. 따라서, 질환, 기능장애, 또는 장애의 증상을 예방, 치료 또는 개선하기 위한 약제의 조사, 연구, 및 잠재적 개발에서 개시된 인공 발현 작제물의 사용 방법이 본원에 제공된다.
특정 구현예는 선택된 세포 유형에서 유전자의 선택적 발현을 구동하기 위해 본원에 기재된 바와 같은 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m 및/또는 CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함하는 인공 발현 작제물을 대상체에게 투여하는 방법을 포함한다. 개시된 인핸서 코어의 1, 2, 4, 5, 6, 7, 8, 9, 또는 10 개 카피 연쇄체가 또한 사용될 수 있다. 대상체는 단리된 세포, 세포의 네트워크, 조직 절편, 실험 동물, 수의학 동물, 또는 인간일 수 있다.
의학 분야에 잘 알려진 바와 같이, 임의의 하나의 대상체에 대한 투여량은 대상체의 크기, 표면적, 연령, 투여될 특정 화합물, 성별, 투여 시간 및 경로, 일반적 건강, 및 동시 투여되는 다른 약물을 포함한 많은 인자에 따라 달라진다. 개시내용의 화합물에 대한 투여량은 달라질 것이지만, 특정 구현예에서, 용량은 개시내용의 인공 발현 작제물의 105 내지 10100 개 카피일 수 있다. 특정 구현예에서, 정맥내, 뇌실질내, 척수내, 안구뒤, 또는 척추강내 투여를 받는 환자는 인공 발현 작제물의 106 내지 1022 개 카피가 주입될 수 있다.
"유효량"은 대상체에서 원하는 생리학적 변화를 초래하는 데 필요한 조성물의 양이다. 유효량은 종종 연구 목적을 위해 투여된다. 본원에 개시된 유효량은 동물 모델 또는 시험관내 검정에서 통계적으로 유의한 효과를 유발할 수 있다.
발현 작제물의 양 및 이러한 조성물의 투여 시간은 본 교시의 이익을 갖는 당업자의 범위 내에 있을 것이다. 그러나, 유효량의 개시된 조성물의 투여는 예를 들어, 대상체에서 효과를 제공하기 위해 충분한 수의 감염성 입자의 단일 주사와 같은 단일 투여에 의해 달성될 수 있다는 가능성이 있다. 대안적으로, 일부 상황에서, 이러한 조성물의 투여를 감독하는 개인에 의해 결정될 수 있는 바와 같이, 비교적 단기간, 또는 비교적 장기간에 걸쳐 인공 발현 작제물 조성물 또는 다른 유전적 작제물의 다중, 또는 연속 투여를 제공하는 것이 바람직할 수 있다. 예를 들어, 포유동물에게 투여되는 감염성 입자의 수는 의도된 효과를 달성하기 위해 필요할 수 있는 만큼 단일 용량으로서 또는 2 회 이상의 투여로 나누어 주어진 107, 108, 109, 1010, 1011, 1012, 1013 개, 또는 훨씬 더 높은 감염성 입자/ml일 수 있다. 실제로, 특정 구현예에서, 원하는 효과를 달성하기 위해 2 개 이상의 상이한 발현 작제물을 조합하여 투여하는 것이 바람직할 수 있다.
특정 상황에서 피펫, 안구뒤 주사에 의해, 피하로, 안내로, 유리체내로, 비경구로, 피하로, 정맥내로, 뇌실질내로, 대뇌내-심실로, 근육내로, 척추강내로, 척수내로, 복강내로, 경구 또는 비강 흡입에 의해, 또는 하나 이상의 세포, 조직, 또는 기관에 직접 적용 또는 주사에 의해 본원에 개시된 적절하게 제형화된 조성물에 인공 발현 작제물을 전달하는 것이 바람직할 것이다. 투여 방법은 또한 미국 특허 번호 5,543,158; 미국 특허 번호 5,641,515 및 미국 특허 번호 5,399,363에 기재된 바와 같은 양식을 포함할 수 있다.
(vi) 키트 및 상업용 패키지. 키트 및 상업용 패키지는 본원에 기재된 인공 발현 작제물을 함유한다. 인공 발현 작제물은 단리될 수 있다. 특정 구현예에서, 발현 생성물의 구성요소는 서로 단리될 수 있다. 특정 구현예에서, 발현 생성물은 벡터 내에, 바이러스 벡터 내에, 세포 내에, 조직 절편 또는 샘플 내에, 및/또는 유전자이식 동물 내에 있을 수 있다. 이러한 키트는 하나 이상의 시약, 제한 효소, 펩티드, 치료제, 약제학적 화합물, 또는 주사기, 주사제 등과 같은 조성물 전달용 수단을 추가로 포함할 수 있다.
키트 또는 상업용 패키지의 구현예는 또한 예를 들어, 기초 연구, 전기생리학적 연구, 신경해부학적 연구, 및/또는 장애, 질환 또는 병태의 연구 및/또는 치료에 포함된 구성요소의 사용에 관한 지침을 함유할 것이다.
하기 예시적인 구현예는 개시내용의 특정 구현예를 입증하기 위해 포함된다. 당업자는 많은 변화가 본원에 개시된 특정 구현예로 이루어질 수 있고 개시내용의 취지 및 범위를 벗어나지 않고 유사하거나 또는 유사한 결과를 여전히 수득할 수 있음을 본 개시내용에 비추어 인식해야 한다.
(vii) 예시적인 구현예.
1. 본원에 개시된 인핸서의 연쇄된 코어.
2. eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 또는 eHGT_460m 인핸서의 연쇄된 코어.
3. 구현예 1 또는 2에 있어서, 상기 연쇄된 코어가 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 및/또는 서열번호: 52에 제시된 바와 같은 서열을 포함하는 것인, 연쇄된 코어.
4. 구현예 1 또는 2에 있어서, 상기 연쇄된 코어가 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 또는 서열번호: 52에 제시된 바와 같은 서열을 포함하는 것인, 연쇄된 코어.
5. 구현예 1 내지 4 중 어느 한 구현예에 있어서, 상기 연쇄된 코어가 인핸서 코어의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는 것인, 연쇄된 코어.
6. 구현예 5에 있어서, 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 및/또는 서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는, 연쇄된 코어.
7. 구현예 5에 있어서, 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 또는 서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는, 연쇄된 코어.
8. 구현예 5에 있어서,
서열번호: 45의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;
서열번호: 46의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;
서열번호: 47의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;
서열번호: 48의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;
서열번호: 49의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;
서열번호: 50의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피;
서열번호: 51의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피; 또는
서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 포함하는, 연쇄된 코어.
9. 구현예 5에 있어서, 서열번호: 45의 3 개 카피; 서열번호: 46의 3 개 카피; 서열번호: 47의 3 개 카피; 서열번호: 48의 3 개 카피; 서열번호: 49의 3 개 카피; 서열번호: 50의 3 개 카피; 서열번호: 51의 3 개 카피; 또는 서열번호: 52의 3 개 카피를 포함하는, 연쇄된 코어.
10. 구현예 5에 있어서, 상기 연쇄된 코어가 서열번호: 53; 서열번호: 54; 서열번호: 55; 서열번호: 56; 서열번호: 57; 서열번호: 58; 서열번호: 59; 또는 서열번호: 60을 포함하는 것인, 연쇄된 코어.
11. eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, 및 eHGT_583m으로부터 선택된 단리된 인핸서.
12. (i) 구현예 1 내지 11 중 어느 한 구현예의 인핸서 또는 이의 연쇄된 코어; (ii) 프로모터; 및 (iii) 이종 암호화 서열을 포함하는 인공 발현 작제물.
13. 구현예 12에 있어서, 상기 이종 암호화 서열이 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 인공 발현 작제물.
14. 구현예 13에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 인공 발현 작제물.
15. 구현예 14에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 인공 발현 작제물.
16. 구현예 13 또는 14에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, 디자이너 약물에 의해 배타적으로 활성화되는 디자이너 수용체(DREADD), 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.
17. 구현예 13 내지 16 중 어느 한 구현예에 있어서, 상기 발현가능한 요소는 비-기능성 분자를 포함하는 것인, 인공 발현 작제물.
18. 구현예 17에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.
19. 구현예 12 내지 18 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 혈액 뇌 장벽을 가로지르는 캡시드와 회합되는 것인, 인공 발현 작제물.
20. 구현예 19에 있어서, 상기 캡시드가 PHP.eB, AAV-BR1, AAV-PHP.S, AAV-PHP.B, 또는 AAV-PPS를 포함하는 것인, 인공 발현 작제물.
21. 구현예 12 내지 20 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 스킵핑 요소를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물.
22. 구현예 21에 있어서, 상기 스킵핑 요소가 2A 펩티드 및/또는 내부 리보솜 진입 부위(IRES)를 포함하는 것인, 인공 발현 작제물.
23. 구현예 22에 있어서, 상기 2A 펩티드가 T2A, P2A, E2A, 또는 F2A를 포함하는 것인, 인공 발현 작제물.
24. 구현예 12 내지 23 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 다음으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물: eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 3xcore2_eHGT_460m, AAV, scAAV, rAAv, minBglobin, CMV, minCMV, minRho, minRho*, 형광 단백질(예를 들어, EGFP, SYFP, SYFP2, GFP), Cre, iCre, dgCre, FlpO, tTA2, SP10, WPRE, WPRE3, 및/또는 BGHpA.
25. 구현예 12 내지 24 중 어느 한 구현예에 있어서, 상기 인공 발현 작제물이 다음으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물:
eHGT_450m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_458m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_463m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_692h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_693h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_694h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_695h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_667m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_668m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_696m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_455m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_603m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_604m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_605m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_661m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_766m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_767m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_768m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_663m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_660m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_665m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_700m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_456m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_698m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_699m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_647m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_648m-minBglobin-이종 코딩 서열 WPRE3-BGHpA;
eHGT_649m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_670m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_697m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_662m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_583m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_450m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_451m-최소 프로모터-이종 코딩 서열- WPRE3-BGHpA;
eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_458m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_463m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_692h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_693h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_694h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_695h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_667m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_668m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_696m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_455m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_603m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_604m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_605m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_661m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_766m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_767m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_768m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_663m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_660m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_665m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_700m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_456m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_698m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_699m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_647m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_648m- 최소 프로모터 -이종 코딩 서열 WPRE3-BGHpA;
eHGT_649m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_670m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_697m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_662m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_583m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_451m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA; 또는
3xcore2_eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA.
26. 구현예 12 내지 25 중 어느 한 구현예의 인공 발현 작제물을 포함하는 벡터.
27. 구현예 26에 있어서, 상기 벡터가 바이러스 벡터를 포함하는 것인, 벡터.
28. 구현예 26 또는 27에 있어서, 상기 바이러스 벡터가 재조합 아데노-연관 바이러스(AAV) 벡터를 포함하는 것인, 벡터.
29. 적어도 하나의 이종 암호화 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터로서, 상기 이종 암호화 서열은 eHGT_450m, eHGT_451m, eHGT_452m, eHGT_453m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m으로부터 선택된 프로모터 및 인핸서의 제어 하에 있는 것인, 아데노-연관 바이러스(AAV) 벡터
30. 구현예 1 내지 29 중 어느 한 구현예의 발현 작제물 또는 벡터를 포함하는 유전자이식 세포.
31. 구현예 30에 있어서, 상기 유전자이식 세포가 L5 글루타메이트성 뉴런인, 유전자이식 세포.
32. 구현예 31에 있어서, 상기 L5 글루타메이트성 뉴런이 L5 ET 뉴런인, 유전자이식 세포.
33. 구현예 1 내지 32 중 어느 한 구현예의 인공 발현 작제물, 벡터, 또는 유전자이식 세포를 포함하는 비-인간 유전자이식 동물.
34. 구현예 33에 있어서, 상기 비-인간 유전자이식 동물이 마우스 또는 비-인간 영장류인, 비-인간 유전자이식 동물.
35. 구현예 1 내지 34 중 어느 한 구현예의 발현 작제물, 벡터, 또는 유전자이식 세포를 포함하는 투여가능한 조성물.
36. 구현예 1 내지 35 중 어느 한 구현예의 인공 발현 작제물, 벡터, 유전자이식 세포, 유전자이식 동물, 및/또는 투여가능한 조성물을 포함하는 키트.
37. 생체내 또는 시험관내 세포 집단 내에서 이종 유전자를 선택적으로 발현하는 방법으로서, 상기 방법은 구현예 35의 투여가능한 조성물을 충분한 투여량 및 충분한 시간 동안 세포 집단을 포함하는 샘플 또는 대상체에 제공하여 세포 집단 내에서 유전자를 선택적으로 발현하는 단계를 포함하는 것인, 방법.
38. 구현예 37에 있어서, 상기 이종 유전자가 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 방법.
39. 구현예 38에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 방법.
40. 구현예 39에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 방법.
41. 구현예 39 또는 40에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.
42. 구현예 37 내지 41 중 어느 한 구현예에 있어서, 상기 발현가능한 요소가 비-기능성 분자를 포함하는 것인, 방법.
43. 구현예 42에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.
44. 구현예 37 내지 43 중 어느 한 구현예에 있어서, 상기 제공하는 단계가 피펫팅을 포함하는 것인, 방법.
45. 구현예 44에 있어서, 상기 피펫팅이 뇌 절편에 대한 것인, 방법.
46. 구현예 45에 있어서, 상기 뇌 절편이 L5 ET 뉴런을 포함하는 것인, 방법.
47. 구현예 45 또는 46에 있어서, 상기 뇌 절편이 뮤린, 인간, 또는 비-인간 영장류인, 방법.
48. 구현예 37 내지 43 중 어느 한 구현예에 있어서, 상기 제공하는 단계가 살아있는 대상체에게 투여하는 것을 포함하는 것인, 방법.
49. 구현예 48에 있어서, 상기 살아있는 대상체가 인간, 비-인간 영장류, 또는 마우스인, 방법.
50. 구현예 48 또는 49에 있어서, 상기 살아있는 대상체에게 투여하는 것이 주사를 통한 것인, 방법.
51. 구현예 50에 있어서, 상기 주사가 정맥내 주사, 뇌 조직 내에 뇌실질내 주사, 뇌실내(ICV) 주사, 대조내(ICM) 주사, 또는 척추강내 주사를 포함하는 것인, 방법.
52. 구현예 48 내지 51 중 어느 한 구현예에 있어서, 상기 살아있는 대상체가 신경퇴행성 질환을 갖는 것인, 방법.
53. 구현예 48 내지 52 중 어느 한 구현예에 있어서, 상기 살아있는 대상체가 ALS 또는 다발성 경화증을 갖는 것인, 방법.
54. CN2248, CN2249, CN2250, CN2251, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 및/또는 CN3024를 포함하는 인공 발현 작제물.
(viii) 마무리 단락. 본원에 개시되고 참조된 서열의 변이체가 또한 포함된다. 아미노산 잔기가 생물학적 활성을 폐지하지 않고 치환, 삽입, 또는 결실될 수 있는지를 결정하는 지침은 DNASTAR™(위스콘신주 매디슨 소재) 소프트웨어와 같은 당업계에 잘 알려진 컴퓨터 프로그램을 사용하여 찾을 수 있다. 바람직하게는, 본원에 개시된 단백질 변이체에서 아미노산 변화는 보존적 아미노산 변화, 즉, 유사하게 하전 또는 비하전된 아미노산의 치환이다. 보존적 아미노산 변화는 그들의 측쇄와 관련된 아미노산 패밀리 중 하나의 치환을 수반한다.
펩티드 또는 단백질에서, 아미노산의 적합한 보존적 치환은 당업자에게 알려져 있고 일반적으로 생성된 분자의 생물학적 활성을 변경하지 않고 이루어질 수 있다. 당업자는 일반적으로 폴리펩티드의 비-필수 영역에서 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경하지 않음을 인식한다(예를 들어, Watson 등 Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. Co., p. 224 참조). 자연 발생 아미노산은 일반적으로 다음과 같은 보존적 치환 패밀리로 나뉜다: 그룹 1: 알라닌(Ala), 글리신(Gly), 세린(Ser), 및 트레오닌(Thr); 그룹 2: (산성): 아스파르트산(Asp), 및 글루탐산(Glu); 그룹 3: (산성; 또한 극성, 음으로 하전된 잔기 및 그들의 아미드로 분류됨): 아스파라긴(Asn), 글루타민(Gln), Asp, 및 Glu; 그룹 4: Gln 및 Asn; 그룹 5: (염기성; 또한 극성, 양으로 하전된 잔기로 분류됨): 아르기닌(Arg), 리신(Lys), 및 히스티딘(His); 그룹 6(큰 지방족, 비극성 잔기): 이소류신(Ile), 류신(Leu), 메티오닌(Met), 발린(Val) 및 시스테인(Cys); 그룹 7(비하전된 극성): 티로신(Tyr), Gly, Asn, Gln, Cys, Ser, 및 Thr; 그룹 8(큰 방향족 잔기): 페닐알라닌(Phe), 트립토판(Trp), 및 Tyr; 그룹 9(비-극성): 프롤린(Pro), Ala, Val, Leu, Ile, Phe, Met, 및 Trp; 그룹 11(지방족): Gly, Ala, Val, Leu, 및 Ile; 그룹 10(작은 지방족, 비극성 또는 약간 극성 잔기): Ala, Ser, Thr, Pro, 및 Gly; 및 그룹 12(황-함유): Met 및 Cys. 추가의 정보는 Creighton (1984) Proteins, W.H. Freeman and Company에서 찾을 수 있다.
이러한 변화를 만드는 데 있어서, 아미노산의 수치 지수가 고려될 수 있다. 단백질에 상호작용 생물학적 기능을 부여하는 데 있어서 아미노산 수치 지수의 중요성이 일반적으로 당업계에서 이해된다(Kyte 및 Doolittle, 1982, J. Mol. Biol. 157(1), 105-32). 각 아미노산은 그의 소수성 및 전하 특성에 기초하여 수치 지수가 지정되었다(Kyte 및 Doolittle, 1982). 이들 값은 다음과 같다: Ile(+4.5); Val(+4.2); Leu(+3.8); Phe(+2.8); Cys(+2.5); Met(+1.9); Ala(+1.8); Gly(-0.4); Thr(-0.7); Ser(-0.8); Trp(-0.9); Tyr(-1.3); Pro(-1.6); His(-3.2); 글루타메이트(-3.5); Gln(-3.5); 아스파르테이트(-3.5); Asn(-3.5); Lys(-3.9); 및 Arg(-4.5).
특정 아미노산은 유사한 수치 지수 또는 점수를 갖는 다른 아미노산에 의해 치환될 수 있고 유사한 생물학적 활성을 갖는 단백질을 여전히 초래하며, 즉, 생물학적 기능성으로 동등한 단백질을 여전히 수득할 수 있음이 당업계에 알려져 있다. 이러한 변화를 만드는 데 있어서, 수치 지수가 ±2 이내에 있는 아미노산의 치환이 바람직하고, ±1 이내의 것이 특히 바람직하고, ±0.5 이내의 것이 훨씬 더 특히 바람직하다. 또한 유사한 아미노산의 치환은 친수성에 기초하여 효과적으로 이루어질 수 있음이 당업계에서 이해된다.
미국 특허 번호 4,554,101에 상세히 기재된 바와 같이, 하기 친수성 값이 아미노산 잔기에 지정되었다: Arg(+3.0); Lys(+3.0); 아스파르테이트(+3.0±1); 글루타메이트(+3.0±1); Ser(+0.3); Asn(+0.2); Gln(+0.2); Gly(0); Thr(-0.4); Pro(-0.5±1); Ala(-0.5); His(-0.5); Cys(-1.0); Met(-1.3); Val(-1.5); Leu(-1.8); Ile(-1.8); Tyr(-2.3); Phe(-2.5); Trp(-3.4). 아미노산은 유사한 친수성 값을 갖는 또 다른 것으로 치환될 수 있고 생물학적으로 등가물, 및 특히, 면역학적으로 등가인 단백질을 여전히 수득할 수 있음이 이해된다. 이러한 변화에서, 친수성 값이 ±2 이내에 있는 아미노산의 치환이 바람직하고, ±1 이내의 것이 특히 바람직하고, ±0.5 이내의 것이 훨씬 더 특히 바람직하다.
상기 요약된 바와 같이, 아미노산 치환은 아미노산 측쇄 치환기의 상대적 유사성, 예를 들어, 그들의 소수성, 친수성, 전하, 크기 등에 기반할 수 있다.
다른 곳에 나타낸 바와 같이, 유전자 서열의 변이체는 암호화된 생성물의 기능에 통계적으로 유의한 정도로 영향을 미치지 않는 코돈 최적화된 변이체, 서열 다형성, 스플라이스 변이체, 및/또는 돌연변이를 포함할 수 있다.
본원에 개시된 단백질, 핵산, 및 유전자 서열의 변이체는 또한 본원에 개시된 단백질, 핵산, 또는 유전자 서열에 대해 적어도 70% 서열 동일성, 80% 서열 동일성, 85% 서열, 90% 서열 동일성, 95% 서열 동일성, 96% 서열 동일성, 97% 서열 동일성, 98% 서열 동일성, 또는 99% 서열 동일성을 갖는 서열을 포함한다.
"% 서열 동일성"은 서열을 비교함으로써 결정되는, 2 개 이상의 서열 사이의 관계를 지칭한다. 당업계에서, "동일성"은 또한 이러한 서열의 스트링 사이의 일치에 의해 결정된 단백질, 핵산, 또는 유전자 서열 사이의 서열 관련성 정도를 의미한다. "동일성"(종종 "유사성"으로 지칭됨)은 다음에 기재된 것들을 포함하여 알려진 방법에 의해 용이하게 계산될 수 있다: Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., 및 Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. 및 Devereux, J., eds.) Oxford University Press, NY (1992). 동일성을 결정하는 바람직한 방법은 테스트되는 서열 사이의 최적 일치를 제공하도록 설계된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 이용가능한 컴퓨터 프로그램에 성문화된다. 서열 정렬 및 퍼센트 동일성 계산은 LASERGENE 생물정보학 컴퓨터 제품군(DNASTAR, Inc., 위스콘신주 매디슨 소재)의 Megalign 프로그램을 사용하여 수행될 수 있다. 서열의 다중 정렬은 또한 디폴트 매개변수(GAP PENALTY=10, GAP LENGTH PENALTY=10)에 따라 Clustal 정렬 방법(Higgins 및 Sharp CABIOS, 5, 151-153 (1989)을 사용하여 수행될 수 있다. 관련 프로그램은 또한 GCG 프로그램 제품군(Wisconsin Package Version 9.0, Genetics Computer Group (GCG), 위스콘신주 매디슨 소재); BLASTP, BLASTN, BLASTX(Altschul, 등, J. Mol. Biol. 215:403-410 (1990); DNASTAR(DNASTAR, Inc., 위스콘신주 매디슨 소재); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Publisher: Plenum, New York, N.Y.을 포함한다. 본 개시내용의 맥락 내에서 서열 분석 소프트웨어가 분석을 위해 사용되는 경우, 분석 결과는 참조된 프로그램의 "디폴트 값"에 기반함이 이해될 것이다. 본원에 사용된 바와 같은 "디폴트 값"은 처음 초기화될 때 소프트웨어와 함께 원래 로드되는 값 또는 매개변수의 임의의 세트를 의미할 것이다.
변이체는 또한 엄격한 혼성화 조건 하에 본원에 개시된 서열에 혼성화하고 참조 서열과 동일한 기능을 제공하는 핵산 분자를 포함한다. 예시적인 엄격한 혼성화 조건은 50% 포름아미드, 5XSSC(750 mM NaCl, 75 mM 시트르산삼나트륨), 50 mM 인산나트륨(pH 7.6), 5XDenhardt 용액, 10% 덱스트란 설페이트, 및 20 μg/ml 변성된, 전단된 연어 정자 DNA를 포함하는 용액에서 42℃에서 밤새 인큐베이션, 이어서 50℃에서 0.1XSSC에서 필터를 세척을 포함한다. 혼성화 및 신호 검출의 엄격성에서의 변화는 포름아미드 농도(더 낮은 백분율의 포름아미드는 저하된 엄격성을 초래함); 염 조건, 또는 온도의 조작을 통해 주로 달성된다. 예를 들어, 적당히 높은 엄격성 조건은 6XSSPE(20XSSPE=3M NaCl; 0.2M NaH2PO4; 0.02M EDTA, pH 7.4), 0.5% SDS, 30% 포름아미드, 100 μg/ml 연어 정자 차단 DNA를 포함하는 용액에서 37℃에서 밤새 인큐베이션; 이어서 50℃에서 1XSSPE, 0.1% SDS로 세척을 포함한다. 또한, 훨씬 더 낮은 엄격성을 달성하기 위해, 엄격한 혼성화 후 수행되는 세척은 더 높은 염 농도(예를 들어 5XSSC)에서 수행될 수 있다. 상기 조건의 변경은 혼성화 실험에서 배경을 억제하는 데 사용되는 대체 차단 시약의 포함 및/또는 교체를 통해 달성될 수 있다. 전형적인 차단 시약은 Denhardt 시약, BLOTTO, 헤파린, 변성된 연어 정자 DNA, 및 상업적으로 입수가능한 독점 제형을 포함한다. 특정 차단 시약의 포함은 호환성 문제로 인해 상기 기재된 혼성화 조건의 변형이 필요할 수 있다.
용어 연쇄된은 쇄 또는 시리즈에 함께 연결하는 것을 설명하는 데 광범위하게 사용된다. 이는 뉴클레오티드 또는 아미노산 서열을 각각 단일 뉴클레오티드 또는 아미노산 서열에 함께 연결하는 것을 설명하는 데 사용된다. 용어 "연쇄시키다" 및 "연쇄된"은 상호교환가능하게 사용될 수 있다.
당업자에 의해 이해되는 바와 같이, 본원에 개시된 각 구현예는 그의 특정 언급된 요소, 단계, 성분 또는 구성요소를 포함하거나, 이로 본질적으로 이루어지거나 또는 이로 이루어질 수 있다. 따라서, 용어 "포함하다" 또는 "포함한"은 "포함하거나, 이로 이루어지거나, 또는 이로 본질적으로 이루어진"을 인용하는 것으로 해석되어야 한다. 이행 용어 "포함하다" 또는 "포함한다"는 명시되지 않은 요소, 단계, 성분, 또는 구성요소가 심지어 다량으로 포함되는 것을 의미하지만 이에 제한되지 않고 포함하는 것을 허용한다. 이행 어구 "로 이루어진"은 명시되지 않은 임의의 요소, 단계, 성분 또는 구성요소를 배제한다. 이행 어구 "로 본질적으로 이루어진"은 구현예의 범위를 명시된 요소, 단계, 성분 또는 구성요소 및 구현예에 실질적으로 영향을 미치지 않는 것들로 제한한다. 물질 효과는 L5 ET 뉴런을 포함한 L5 글루타메이트성 뉴런에서 선택적 발현을 통계적으로 유의하게 감소시킬 것이다.
특정 구현예에서, 인공은 자연 발생하지 않는 것을 의미한다.
달리 나타내지 않는 한, 명세서 및 청구범위에서 사용되는 성분의 양, 분자량과 같은 특성, 반응 조건 등을 표현하는 모든 숫자는 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 달리 반대로 나타내지 않는 한, 명세서 및 첨부된 청구범위에 제시된 수치 매개변수는 본 발명에 의해 수득하려는 원하는 특성에 따라 달라질 수 있는 근사치이다. 최소한으로, 및 청구범위의 범위에 대한 등가 원칙의 적용을 제한하려는 시도로서가 아니라, 각 수치 매개변수는 적어도 보고된 유효 자릿수에 비추어 그리고 일상적인 반올림 기술을 적용함으로써 해석되어야 한다. 추가의 명확성이 필요한 경우, 용어 "약"은 명시된 수치 값 또는 범위와 함께 사용될 때 당업자에 의해 합리적으로 주어진 의미를 가지며, 즉 명시된 값의 ±20%; 명시된 값의 ±19%; 명시된 값의 ±18%; 명시된 값의 ±17%; 명시된 값의 ±16%; 명시된 값의 ±15%; 명시된 값의 ±14%; 명시된 값의 ±13%; 명시된 값의 ±12%; 명시된 값의 ±11%; 명시된 값의 ±10%; 명시된 값의 ±9%; 명시된 값의 ±8%; 명시된 값의 ±7%; 명시된 값의 ±6%; 명시된 값의 ±5%; 명시된 값의 ±4%; 명시된 값의 ±3%; 명시된 값의 ±2%; 또는 명시된 값의 ±1% 범위 내에서 명시된 값 또는 범위보다 다소 많거나 또는 다소 적음을 나타낸다.
본 발명의 광범위한 범위를 제시하는 수치 범위 및 매개변수가 근사치임에도 불구하고, 특정 예에 제시된 수치 값은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치 값은 본질적으로 그들의 각각의 테스트 측정에서 발견된 표준 편차로부터 필연적으로 비롯된 특정 오류를 함유한다.
용어 단수형 및 발명을 설명하는 맥락에서(특히 하기 청구범위의 맥락에서) 사용되는 유사한 지시대상은 달리 본원에 나타내지 않거나 또는 문맥상 명백하게 모순되지 않는 한, 단수형 및 복수형 둘 다를 포괄하는 것으로 해석되어야 한다. 본원에서 값의 범위의 언급은 단지 범위 내에 속하는 각각의 개별 값을 개별적으로 언급하는 약칭 방법으로 제공하도록 의도된다. 달리 본원에 나타내지 않는 한, 각각의 개별 값은 본원에서 개별적으로 인용된 것처럼 명세서에 포함된다. 본원에 기재된 모든 방법은 본원에 달리 나타내지 않거나 또는 문맥상 달리 명백하게 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예, 또는 예시적인 언어(예를 들어, "예컨대")의 사용은 단지 발명을 더 잘 설명하기 위한 것으로 의도되며 달리 청구된 본 발명의 범위에 대한 제한을 제기하지 않는다. 명세서의 어떤 언어도 본 발명의 실행에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되지 않아야 한다.
본원에 개시된 본 발명의 대안적 요소 또는 구현예의 그룹화는 제한으로 해석되어서는 안 된다. 각 그룹 구성원은 개별적으로 또는 그룹의 다른 구성원 또는 본원에서 발견되는 다른 요소와 임의의 조합으로 언급되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성의 이유로 그룹에 포함되거나 또는 이로부터 삭제될 수 있음이 기대된다. 임의의 이러한 포함 또는 삭제가 발생하는 경우, 명세서는 변형된 그룹을 함유하는 것으로 간주되어 첨부된 청구범위에 사용되는 모든 Markush 그룹의 서면 설명을 충족한다.
본 발명의 특정 구현예는 본 발명을 수행하기 위해 발명자에게 알려진 최상의 모드를 포함하여 본원에 기재되어 있다. 물론, 이들 기재된 구현예에 대한 변경은 전술한 설명을 읽을 때 당업자에게 자명하게 될 것이다. 발명자는 숙련자가 이러한 변경을 적절하게 이용하기를 기대하고, 발명자들은 본원에 구체적으로 기재된 것보다 달리 본 발명이 실행되기를 의도한다. 따라서, 본 발명은 적용가능한 법에 의해 허용되는 바에 따라 여기에 첨부된 청구범위에 인용된 주제의 모든 변형 및 등가물을 포함한다. 더욱이, 모든 가능한 이의 변경에서 상기 기재된 요소의 임의의 조합은 본원에 달리 나타내지 않거나 또는 문맥상 달리 명백하게 모순되지 않는 한 본 발명에 의해 포함된다.
또한, 본 명세서 전체에 걸쳐 특허, 인쇄된 간행물, 저널 기사 및 다른 서면 텍스트(본원에 참조된 자료)에 대한 수많은 참조가 이루어졌다. 참조된 자료 각각은 참조된 교시에 대해 그 전문이 참조로 본원에 개별적으로 포함된다.
끝으로, 본원에 개시된 본 발명의 구현예는 본 발명의 원리를 예시하는 것임이 이해되어야 한다. 이용될 수 있는 다른 변형은 본 발명의 범위 내에 있다. 따라서, 제한하려는 것이 아니라 예로서, 본 발명의 대안적 구성이 본원의 교시에 따라 활용될 수 있다. 따라서, 본 발명은 정확히 제시되고 기재된 것으로 제한되지 않는다.
본원에 제시된 상세한 사항은 예로서 그리고 단지 본 발명의 바람직한 구현예의 예시적 논의를 위한 목적으로 제시되며 본 발명의 다양한 구현예의 원리 및 개념적 측면에 대한 가장 유용하고 용이하게 이해되는 설명으로 여겨지는 것을 제공하려는 이유로 제시된다. 이와 관련하여, 본 발명의 기본적인 이해에 필요한 것보다 더 상세하게 본 발명의 구조적 세부사항을 제시하려는 시도가 이루어지지 않았으며, 도면 및/또는 실시예와 함께 취해진 설명은 본 발명의 여러 형태가 실제로 구현될 수 있는 방법을 당업자에게 명백하게 한다.
본 개시내용에 사용되는 정의 및 설명은 하기 실시예에서 달리 명백하고 모호하지 않게 변형되는 한 또는 의미의 적용이 임의의 구성을 무의미하게 만들거나 또는 본질적으로 무의미하게 만드는 경우 임의의 향후 구성을 제어하는 것을 의미하고 의도된다. 용어의 구성이 무의미하거나 또는 본질적으로 무의미하게 만드는 경우, 정의는 Webster's Dictionary, 3rd Edition 또는 Oxford Dictionary of Biochemistry and Molecular Biology(Ed. Anthony Smith, Oxford University Press, Oxford, 2004)와 같은 당업자에게 알려진 사전으로부터 취해야 한다.
SEQUENCE LISTING
<110> Allen Institute
<120> ARTIFICIAL EXPRESSION CONSTRUCTS FOR SELECTIVELY MODULATING GENE
EXPRESSION IN NEOCORTICAL LAYER 5 GLUTAMATERGIC NEURONS
<130> A166-0024PCT / AI 20-04PCT
<150> US 63/013,342
<151> 2020-04-21
<160> 149
<170> PatentIn version 3.5
<210> 1
<211> 484
<212> DNA
<213> Mus musculus
<400> 1
ttccgcgtag acctggggta cttttctaag acacccttta ttgtttgttc ctaaccctag 60
ccctgtatcc atgcagcgtt ctccatcacc tatgtaaaac ttagcagatc tgagtcttcc 120
tctgaggaaa caacatcctg tgctgttaga ctgtattttc cgtctccaga ttctctactt 180
cgtcccttcc cccgccccaa tttccctgtc tccagcgagc aatattatct ttcatctgag 240
cctctctccc tgcctccagt gactgcctcc cctgatgaat tctctccggg tgactttggc 300
atttgcatat ttcctcgctt ggatattctg agatgttgga accggagagc aggttgacgc 360
gatcaggtac ttagctgaac gaggctttct cgggaactgc acaaatattt ggagtcgggc 420
atgtgccaat aggcaattaa ttgaaatgtg gacacagcaa gcttccggag gagggaagct 480
gaag 484
<210> 2
<211> 615
<212> DNA
<213> Mus musculus
<400> 2
gctaaagaca acattggcct gaaattcagg agacctaagt tctagatcaa tctgtggcat 60
ggtcttagac cacagatggg ctttcctgcc tgcatttacc caaagagccc aaagaggaga 120
ccacatgggg taccatggga ctgaccttcc cagttcaaag cttctttaca caacgctgct 180
gaatcacccg ctagctcgct ctcttatcat tccttttcat tcctggaggt aaaaccaacc 240
ttagaatcgt ggagcctgat agactttgaa attggccttc attttaattc tcaagttctt 300
agcatgagag caacattcaa tatggttctg aaatatctca tgcaaaaaag tgccagagtc 360
atagactgaa atatttattt gaatataaat gaactcagat ttgccaaaat gcgctccccc 420
tgttgtcatg gacacagatg cctgcctttc tgatttgcat tttgctctaa tgggtataat 480
gtgtttcagc tcctcattgg tgctgggatt ggatttgaga aactcaccag tccatgagtt 540
cccccaaaat gtcagccagt gggaaacttt tgtgtctttg attctgtttc atctagccag 600
ctggaaacag actgc 615
<210> 3
<211> 669
<212> DNA
<213> Mus musculus
<400> 3
tgctcagaaa ctggcctcga tgctgtcctg ctttcaccaa ttaataatat atgtggagac 60
cgttctctac tggcatatgt gtgtgcatca cataattata tgtatatatg caatcctttt 120
tcttgttgtc ttttagagtc aattctatat atatattttt tattaagaca tttaaaagtt 180
ccaaagtaaa aataacaaaa tcaaggatac attgactcat ttttattttg tgaggaagaa 240
attttccatt tgtctgtgta attacatttg ctaatttcta aaacaattcc tgggatttat 300
atctatatat gcctcaggaa catacaggga agatcatact gttctctgaa tttcaaatta 360
tgttttctgt tttatttcat gaatttatta tttttctttg tctctgtctg tctctctctg 420
tgtgtatgtg tatgcgtgta tatgcacgca tgtgctgtgc acttgtgtgt atacattttt 480
ttgcacgtga gaagtgtacc tacgaggctg tgcctgggtg tggaagccca gggttggtgg 540
ggaagaccat actccaaggc tctccaacct tattcagtga ggcaggcagt cacatctgtc 600
tgacatttct gatcattaca cgtgtgcagt gggtgtttta tccaccgagc caccttccca 660
gccatggat 669
<210> 4
<211> 721
<212> DNA
<213> Mus musculus
<400> 4
tcacaaatca gtaagaatta cactccaaaa ataaaacagg gaagggtatt agtatgtgat 60
acgcatggat aaagtagaag aggccaaaaa tacaaagaac cgtaaactca ctagtgatgg 120
aagaaacgct aattaaaata atgagctttc ctgacccttt atcacatggg cacattttca 180
aaggacaaga ctctgctgag gagaacacag aacaggatcc ttcagacaag cttcagcaac 240
caattttagg atgttcttaa atagatcgat tcttctactt tttttaaaaa taacatagat 300
ctgaaaagct ttataacttt tggttttttt ttaaggacca tattaacagc atcttccagt 360
ttttctagag taaatgaata tgtatccctt ttataattaa caatatacat atattcattt 420
tgtaaaaaga ctataaaaat agaagagaaa atgaagagat gtttatttct tttacacgca 480
tcagactaag gccttcagct cagcaggggg cagagtttat catctgtact ctctgaagtg 540
tcacactgcc ctgcctttgt gtgcccttgc ctgtccctct gtgacggtca ccctttcggt 600
tctggcttgg agcctggtca tcagtgcctg gcggcctgtg cctgggctgt gctgagctca 660
tttggtcgtt gtcctagtga tgtgacccta ccttagactt ccccatctct tgaggtggct 720
a 721
<210> 5
<211> 472
<212> DNA
<213> Mus musculus
<400> 5
acggatgtca agttaggcaa aagtttcata taaatgtggt taaagtaatt ctaaagtttg 60
tttttacatc acagaactga gcaaatgaac aaatgtaatg ataacattgg gagctgatta 120
ttctgagcaa acagcagaga aatccaaatc cagacagttg gggggaaagc cacagctact 180
cagaaaacac actgtgatgg aaaacaacct acaggttatt attagactaa agagacataa 240
aattagatat gccacttcca gagactatag gttagacgat aatatatgct gagtgaagtg 300
ccctgttttg gtaactgcag taaggctgtg tatcagaatg ttcctagcta catatttagg 360
tgtaaagcag agtgagtcaa aatatattcc agggttaaaa aaaaaaaaaa caatctttac 420
ttctcttttc tttaaactaa ataatttcaa ttattctcct atgtttaggg ag 472
<210> 6
<211> 375
<212> DNA
<213> Mus musculus
<400> 6
gactggaaaa aggtagctat ggcagcctct gcgcctatat tttatccata ttctgatttt 60
gttttccaag gtctcctagt caatcataat ctgaatcaat ggaaatttcc acggataaat 120
aattcatgag acttgaggaa aatgtgtgct agtcctcaat accttataaa atgtattatt 180
cattttgaat tagattaaaa tgtttaaaaa atgctatcta taagacactg tgggagccaa 240
aaaatttata cttctttata aaatccttaa ctgcctggaa ataaactagg tgttaagaga 300
attgaagtta aaacacagaa aaataatccc actctttcat aaactcacaa ctcccaaata 360
atgagaacca aaggt 375
<210> 7
<211> 787
<212> DNA
<213> Mus musculus
<400> 7
tgactgtgtc atgactctca gtgtctcttt tttccacggt tctgggatca tcatttcttt 60
ctcttcagac agtctagatg agcagccgag tgcttatctt taaggctgac tctagacagc 120
cagttgttat ttcataaatc tgttaaaact caccgtgcaa acaccagcgt tccttagctg 180
accatcctca agcacacgtg gagtgtgacc tctgcttcct tctctcattt cacatattag 240
taatgtgcgt ctatgaatag ttacaagtga gaaagagaaa tggagatttt accatttaat 300
catctccgaa gagaaggtga gaagaaattg agaaaggtaa tttgcatacc atgcataggc 360
attagagaaa gcattttttt tcttaactct ccatttgttt acagatattt ccatatggcc 420
ttttaaaaac ttcaacagag aaattcgaac acaactaact ggaatttcaa ttttcatata 480
aaaccagcat catagatata tatgtagcta ctctcccact tcacattatt cagttagtat 540
attttctaag ctaatttcca atccatttta agactatgta cagctcatat gaggccccca 600
tatgttcgtt cacgttactt tgcatccgtt tacatgatta aaccccaaga acaaatcgat 660
tagaagccaa gagcaaatgc ttttggctcc acattagaaa actcaacaga gaaaccttta 720
caagtgatag tcatctgggt aagagacatg caaacataat taccattatt cgtggactta 780
attccct 787
<210> 8
<211> 759
<212> DNA
<213> Mus musculus
<400> 8
ttaacttgag gaaatctgcc acaagatgtt ctcaagtgca aatgtctctt gatgcataca 60
cgcatgcatt tctatttaag tatccaacga gaattgtggg gttgaggtag gtattttagc 120
ttataaaaaa aaaatacctt atgagcttat tttggatcat ataaaagtat gagcactttt 180
agaacacttt taataatgca aatcatctct gcatcatcca aatttaatcc atgaacattt 240
agtcatcgtt atcttacatg agtcatatct gtgtccttat tgtcttatct taaatgcatt 300
aattaattcg atagagcatc tataaaaatg aaacgctatt caaaagctgg cccatgacaa 360
gatcagtgtg ttggtttcta tgcctatagt ggtgcaatgg aaggagtgcg ctgtacccca 420
cagactttgt gattgatgag ttgtctactt tattcacaat gaagctaaaa acaatctaac 480
aaccatcagg gtgctacagc agcacagaaa tgactagctc ttttgtgtca agttattgcc 540
ggttgtctta gtcactgtcc gactgatgtg cagagacacc atgactaagg caacgcttat 600
caaagaaaga gtctagttga gagcttgctt gtagttccag aggtttgttt agtctagcat 660
ggtggcacac actgtgctag aacaatattg agagctacaa cctgatctga aaagcagaga 720
gagatagaga cagaaagagg cagagagaca ctggccctg 759
<210> 9
<211> 405
<212> DNA
<213> Mus musculus
<400> 9
gctggtgggt gggaagagtt tagtaactgc tcaccaatgg tgctgtagac attatcagtt 60
gcaagaagtg ttttaatttc agagaaatta aaatatgcaa aatatgtgtc tctgaatcaa 120
caaaacatgg tgcctcaggt ttccgtatct gtgtgggcct gtttttaggt tttctgttct 180
atctattcct gggcttccac cacactgtgt taatgaggat aactttaaaa tacatcttga 240
tatttagtag agcgcatttc cacgcctgat tcatcacgag caccttaact tgtcttggtt 300
cttctgcgga gatgttggca ccagcttctt cacccgtgac tccagcttct ggggaacctg 360
tgctctcacc cctgccccgc ctgtgcctgc caggcacacc ttaat 405
<210> 10
<211> 647
<212> DNA
<213> Mus musculus
<400> 10
agttttggaa aaacaccata ctggttattt tcaaataact ctatttcaca acagtatact 60
agaattttat gctaaaatct ttctgtgact ttgtgttcac tgatcaacaa ttcctctttt 120
atgatagcct atgctgtcta ccatctattc caaactttta tgagatcagt aattttagat 180
tatgaatgag tttgatcata tagtacatac ttttgtgtct gctattgcat ttacatagtg 240
acataggctt acaggatatt gtaaatgtca tccctagata catttatgta accttttttt 300
aaaataaaac tctaacaaat gttagttatt gtgcactatg gttttgaata tttgaatttg 360
ctttgctcag atctaaataa cttctgataa gtttggcatt caggaaagag taaatgtaaa 420
tgtagaaatg cttggaatat aaaacaagta atttttgtga taatttttct gaaaatgcta 480
atgtatattt tcagcaggcc tcctttcttg tttagaacag tatatttctt agctttaatt 540
agtacttact ttatatatct atgcatccat ttatagttca gcattagatt gaatatgtat 600
gcatgtatgt atgatttatt tatatttttg tctcccagtc cacaccc 647
<210> 11
<211> 678
<212> DNA
<213> Mus musculus
<400> 11
gggagatata aacaagaaga aacaggactg aataaatgtg tgcagaagga tcctgtagca 60
gcgtcgttct tcctggccag ttgagcgcgc gcagcactta agattggtgc tcatccatgc 120
ctattcattc ttgtgatgtg ttgtgttaga tattattggt aattattact tagagaggtg 180
gcaaagtagt gaataggtgg aaaggcactg agaccatatt gtcaccgcag ctttggaaaa 240
gaccttctta ttttaactta tgtaattaac catcccaaat ttaccctgat cctcactgga 300
aatgtcttcc ctttcctgat atttaccaca gttttaaaaa gtcttagatg ggtatgcata 360
tttgagaaat acgtagagtt aattagtgcg tagatgtgtt tttaagttgc ataaaacata 420
ttgtgctttg gcatagctcc ctttgtaact tattttagga aaccaagttt gattttgaca 480
acagcattag aagtaaagtg tgtgaagatg atttagaatc catgaatatc cacattgctg 540
aatataatcc ttcctggcta cagagctcct atttctgctc ctgtaagcag ccattcaccc 600
acacttctta aagtaacccc aataaactca ctcattaagt tagattttgg cagtgtcctt 660
ctttgatctg ttgtccgt 678
<210> 12
<211> 633
<212> DNA
<213> Mus musculus
<400> 12
tttgcttgtg tgccagcagg gaggagcaag aggaattttg tcacttctct ttcactttct 60
tcattatttt aagttggatc tgctgttctg ttcactttta aaatataacc ttcagtattt 120
atgaacgtga ttcatctttt acaatatgtt gtttaacatg aatgcatctt cttcttgcct 180
ttcagtgcat ctttatgcca ttggcagcca caatcaagtg tttccattaa agttcacagt 240
aacagtgcag tgttgtctgt cccaactctg ctaactttta ccacccacta tttagtttta 300
tctaccatgt gaatttattt gtaagatctt ctttctctta tcctagttaa ttatggggag 360
gacttgccag gatattaatt tacatggcaa ttttggataa gttatgcatg tattcatctc 420
ctatatacaa taagtttttc ttgtgaacgt caaaagaaag gataatgcat atgactgtat 480
atgatataaa ctggaatgta atagttgcca ataggatctg aatcaaattt cagtttttaa 540
ctatgttcta tatatctatg tgcatattta tagcatgtgt gacatatgta taatttaaat 600
atttctataa acttatacag aaacaaaata tgt 633
<210> 13
<211> 601
<212> DNA
<213> Homo sapiens
<400> 13
ctgaagttct gggggcagac cgcaattgct gccacagagc ccctcctggc aggtgcagcc 60
cacaggaaga ccagcaccct ggccacagag acaaaaggtc ttattgactt gcagtaaaaa 120
tgtccttata acctgtccag aacaaaaggg gaggataagg ttcaaccaga caccgaattc 180
agggagacag catcagtcag agctttacca ctgccagcaa ttttgaagct gcccatattt 240
ctgctcaggc aagatgtttt cttgctctga aaccttttag cagatgcaag gtattgctcc 300
gggtgtatcc cagaacacaa gtctttgcta aagtgggtag acagccactt tccttcagag 360
ccagggactg ccctgggagt aaaaccattt ggagagcatt ttatatttgc aaaatgttgc 420
tgtgacatgt tatcatttat tcctttcaac agcgcagtga gattggagag catcctccga 480
tgcactgtac atttgggagg aagagaaagg ataagagccc tgctgattca gtggtggtca 540
ttatcattgt caatggagct gtcactgtta tcgtcatttt cgtttgcggt gaggtatgtg 600
a 601
<210> 14
<211> 518
<212> DNA
<213> Homo sapiens
<400> 14
agaaagcaag agcaaagggc aggtcttcca ggagagacag acagacaaag aaaaagcaag 60
ggaggtggag agtgtgtgag agagggagtg agaaagggct cagccatttg tctgggcagg 120
tctgcggaac tcaaatccgg ctcatctgca tctcctcaaa taaacttctg ggaagtgaat 180
gcctgaagca ggcagagtgc agagaagtca gcaaatatgt gcgtagtgaa ttccaagcct 240
tctgttccca gctcctggga ggggccgcag tgccttgggg tgtcctgccg tgtctccatc 300
gggtcccctg cctggctgct ctaaccctga ggaatggcct ccattgtggg cctgtggaaa 360
cagggagaag aatctcttat ccagcaggtc tgagggccac aggaacataa gtaacactga 420
agagtgaggc tgatccctgg ggtttgcgcg agcctgcaaa tgcatgattc aacagcactc 480
gcctggtgcc tctgggaggc aagctggatg aggatgtt 518
<210> 15
<211> 613
<212> DNA
<213> Homo sapiens
<400> 15
agaaatcccc ttccctacct tttatctatc aatcatatct atctatatcc cccaaaactt 60
agctgatact aacaatttaa ggatccccaa tcccaaagca tttagatttt aagacaaata 120
aaacagttgg aatcctggtc ccatggaatt tcagagttgg gagaaagtga agagatttcc 180
tggctaaccc ctgcagttaa cagatggcaa aaagaagtac agagaattgt ctgaagtccc 240
agagcaaggg agtggaagcg cggccgcaac gaggcatgca taagattctg cagaaaccac 300
gttctcccgc ttcacagcgg tctgctcttt tcaggagagc ctgggaaaac ttctgactgt 360
gcaatttgct taaaaacaac agagaaacat catagaagag gatcaattcc tgaccatgca 420
tttgaaatta gacacttaca ggcattccct gcagagtgct ctccactggg gcccagtgga 480
agcagcatca cccatcagcc gctgggggtg gctggtgcca ccaggtcagg cctggagcgg 540
ggcaggagtc tcctcaggct cgatgctctt gacctgctgc tggtgccaag agttagaagc 600
aaagcaccca cca 613
<210> 16
<211> 406
<212> DNA
<213> Homo sapiens
<400> 16
ttccttggaa cactatttgg catatatgca tattttgggg ctcagtgtct ttcatcgtta 60
tgtttatggt tataatgacc acatctctca cccattagct gtgtggcttt tgaggtcagt 120
aagctattct tcccagagtg cttgacatag ggcctgcggc atggtaaata cccacagttt 180
ttgagtttcc tgtgggttga gcatttagaa tcatctgttt gtttaatcag gacatatttc 240
tccagtacct tcaggggtcc cagtactatg tttaggaact tagccatcac ttgcacagta 300
aacagtatct gtggattttg tcattcaaca aacactgcca ttgttcagtc actcaacaaa 360
cgctgttacg gcatccaccc tggggaaaga agggtctctt ggcaga 406
<210> 17
<211> 335
<212> DNA
<213> Mus musculus
<400> 17
tccatctttc tgactttagg gccattttta gaatggcctt tgttacccca agattacata 60
aatattcacc caaacttcct ccagtacttt tatggtttcc ttcacaggat ttaattctta 120
aatccatctg gaatgtattt ctgaaaaaaa aaaaaaaagt aaaatagtgc cagctatttt 180
gcttcagagc caatgtttcc taagttgaaa actttagcta tattcagttg tgtgatgtca 240
ttaaagataa taagatttgg gaccagattc tgagttcagt tgcactctct gtatagggta 300
tagaaaatca ttcaactttc tgagaaatgt gcaga 335
<210> 18
<211> 304
<212> DNA
<213> Mus musculus
<400> 18
acacacacac acacacacac acacaaataa aaacaaaaac aactcttaaa aacctaagaa 60
agggataaat acaacatcaa agactgttgg ggttataaaa catacacatt tatagacatt 120
tccaagatgc tactaaaatt acatacaaat gagtatccaa aatgtcacag aacaaattat 180
tcttgtgcaa cataaacaac tagagagcat agcaaaggaa gcccagacca tgagctttcc 240
cgatctgctt cccaagctaa catatgttgg catccaatcc tgaaaactac agaagacatg 300
aggt 304
<210> 19
<211> 524
<212> DNA
<213> Mus musculus
<400> 19
tttccagcac tgcaggagtc ttcagtatga agtagaacca gttgggtgac ggggcagaca 60
ctggagacag acagaaaagg ttctaatatc catgttctgt ttgattttgg aaggatgctg 120
aatgctaatc agctttctta ttttaagaaa gactatctta aattattata cttgcctcat 180
atgatttgga ggatgattgc atgctgttcc ctcagcaaac aggagcttag aaaagttttt 240
gaataatttc acaaaaggcc ccaaagtatt ctcagtatga agatggaaat tgggctgagt 300
catcttatct agaggaagta tcagaaaact tcgttgaaat agttttgagt aggcctttgg 360
cacagaagaa gccatgtgga tcagaagtga aaaaaatgac gcttgccaat gcttgcggtg 420
agatctgaca tagagtggcc atctttcggg atgcagtgtt agaatgtgta gtagaaaata 480
aggtggaaga gacgtgttcg gttccatctc aagatttggg ggca 524
<210> 20
<400> 20
000
<210> 21
<211> 700
<212> DNA
<213> Mus musculus
<400> 21
tgcatggatt ctaagttcct aagaggaatt cagaaaatac caatttttat ttagcatata 60
agataatgtc ttccatcata acattcacaa tcacacacaa acatacacac acacacacat 120
catacttcat tcatattcac tgtattacta tcgtctgcta atcttgccaa ctcttacact 180
gagaaccttt cttgacttaa attatggata tgagagacac tgtgatattt gtttttctcc 240
acctacctct gcttttatat aaggcatatt ccatgcatgc taatgatatt ggagcacaat 300
gtttatgcat gtataatcat atatttcttt cctgtgcctg tgaaatcata gttataacta 360
aatttctttc tcttatgatt ccataaaaaa ttctcaggaa tataaagtat atataagcca 420
aaattctata aaattaataa attatgatga tcagaaaggt acaacaatgt ctttcagaag 480
tctataatga cttttgaccc agcatgttca tgccctacat gctgttagtg aaattaactt 540
tccaattcaa attagtacat tgagttgatt gaacatattt catcgttcac attgactcac 600
actgtgggat tcttataaaa gacaatttcc cttaaatata accagctttt agttttttca 660
tgaaagccag tcccttgtta ctagtgtatt tagatgcatc 700
<210> 22
<211> 640
<212> DNA
<213> Homo sapiens
<400> 22
ctgtgtctca ggccagaaga ttttctatat tggctggagc ttctgtggga tgcaggcagt 60
ggatgagaag ggaaacgaca gcaaatagag gaagcacaag tctctggcct cagtgttggg 120
tgcacacaaa gcaaatggga gaaggaggag aggggctccc ttcccctgcc ccaaggccca 180
gccaggcagg cccccagcag cctggctgtc tccctccctt gcgggctgga gctgcctctc 240
cgcctctgcc cgcctgatcg gggcagagct cggcttcatg tattattaat agcactgcca 300
gccttcctgt tttcacgctg ataacctgca ggggagggct ggtgggaggg agggagcaag 360
gtggcaaacc ctggagcttc tagggtccct cccccctcag tagagcagct ctgcgggggt 420
tggccccaag tctctaaagt tggtttctag agcctccccc atccaagccc acgggaaggg 480
accagggcct cctaaaggga aatcacatgg gaggttggaa cgtggggtct gggaagggcc 540
ctgttactca atccatctag gacaccaatg gctcaagtca ccttggccct ccccagaggc 600
agaagtgccc atgtctaggg cacatggggc tcagagctga 640
<210> 23
<211> 493
<212> DNA
<213> Mus musculus
<400> 23
atgtgcatac ctgcctctga gaaggaccaa agtcagatgc actctcaatg taagggcttg 60
ggggtggaac acctcaagtt ccacacacac cccaatctcc tacaggagtt tcctttagag 120
gacctgtctc ctccaagggg ctctgttaga ccaagtggga aagtctctag gaactgactt 180
cagaggtttg gggctgtgcc agtcccgcgg cgcactctgc cacggaggag acctggagct 240
cctgggttgg ccaccttgct ccctgcctcc tcccacctcc tccccagcag gttatcagca 300
tgaaaacagg aaggctggca gtgctattaa taaaacatga agcagagatc tgccccatca 360
ggcagcggag gcaggcggca gctcggcagc cccgagggag ggagagaacc cccgcatctg 420
ggcctgggca ggggtattct cttctcacag atgccacacc ccaggagcca cctccatttt 480
gcgggactgc tgt 493
<210> 24
<211> 466
<212> DNA
<213> Mus musculus
<400> 24
agctaaccta ccagtcccac cgtgatatct ggatgctgat ataaaggaga atgtatcaaa 60
taatgtaatg cttggaagtt atttgaatct gttattctta agagcacact gatattactc 120
attgtgtgag gcacacaaaa aagatcagaa cacaaaggca tatttgtgct gtgtgtccaa 180
cactgagggg cgggaggagg taatactttt ttggaaaaga caggaaagaa tgaaaataga 240
tggtttgtaa agatagtaag cttgtgggtg gctttttatt tccataatca tggtattatg 300
tttttgtata attttaagaa aaacttatgt taatcagaaa ctttgaataa caccttaaca 360
aaaatgtgct gcacaccgca gccatcccag agaagctaac actcaagatg tcctgttcag 420
gcttcgcgca tttgagtcca gggaagatgt ctctcgttgg caccaa 466
<210> 25
<211> 429
<212> DNA
<213> Mus musculus
<400> 25
tgctcagggt ctgcaaactt tttcttatgg ttagtacaag aagaatgcat aaacatcaca 60
aaccaaagta cttctttcaa ccaatcaaac aaattatata cagggtaaca cacaaaatca 120
aactgagcaa atctagccaa tgggtcccat atgccacatt tttcatttcc ttattccagc 180
cctcaggaat gtaggtgttt gctctgagta ggcctaccat agtatgtaat tctgctatct 240
tatgcaccga taatttttct tggttcagga gtgtttgatg tatgctccat agttgtctct 300
cattgtgctc tgctgtctca ttgatttctc taaggtttta acaaatttat ccatgtggtt 360
tttctctaat ttgaaatcaa attgcatgtc agacaagaag taatattttt gttggtagtg 420
tactgtggt 429
<210> 26
<211> 633
<212> DNA
<213> Mus musculus
<220>
<221> misc_feature
<222> (253)..(253)
<223> n is a, c, g, or t
<400> 26
tctaaccatg tgtgtttcct ttgaaataat tctatatact ccttttaatg aatttacatt 60
aaatcaatag cttgtattga caactatatt atcatcaaag cataaacaaa actttctttg 120
attccttgct tcagaaggct tgatcatttg tttcccaggg aaatggaata taggtaagga 180
caaagctatt taaacacaat tctctctttt aatgcaaact attacatcat gcagtttatt 240
tatattatga atncaaaatc agggatgaca tatataacat atggacatga atattactct 300
ttagatttca tattaaactt atcagttttt ttttatctca aagcatggaa tcaaattcaa 360
gacacagatg gacacaacat aagtttggaa tggcttttaa atatttttac aggaattttt 420
ccattttggc aaagtattta gtatatagtg agttgcttct atgattatat tagatgtgtt 480
tttgaagaat gttgttttgc taaattattc taacgctcaa tttacattct gaacattttc 540
aatctgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct gcggccgcac 600
gcgttctaac catgtgtgtt tctcttttgg act 633
<210> 27
<211> 440
<212> DNA
<213> Mus musculus
<400> 27
aacatgtatt tgtggagtgg ctaaattgag atatatcacc ttaaaatcaa ctcccagcaa 60
tttgaagagc acagtaagta agaccttgtt cctaaccaca gtcgccatgc agtgcagtag 120
agcccagatc ttacacttcc tgtgtaactg gagtcttgtg ttctttagcc aagctcttcc 180
cacatgcgag tcattttcaa ttcaaaatac tagttatttt cagtttaaga atcagtctga 240
tttcttgagc atagtgctta tcttatatgg tatggctttc agctccctgg agatttcctg 300
ggtgtgctgc tgtgcctttg cctccaggat aaatgccatg ctgagaagag catgactctg 360
tcagcacagg cagacggtgg aaactttacc tctgcgacct ctctgcagcc tcagggtagc 420
aggggatggc atggtttcat 440
<210> 28
<211> 475
<212> DNA
<213> Mus musculus
<400> 28
tgtatgccta aagggtttgc ttctatgtta attcccaaca acaatcatga tacttcctta 60
cttctgcagg actaggctgg ctcactagtg aggttttctc caaggatgtg ctccaatatc 120
tgctccacaa tacttaaata gcttcacaat acataaatat ttaagtactc ctctgtaagg 180
agcgttctgt ttccatatgt caaggcagaa tcttcacata aagcatgcat tttgctccct 240
gttttcaatg gttttactct gtagagtttc tcaaattaat tcaataccca ctttaaatta 300
aatggaaact ttaatgctat ggtttgctgt gccatttaga ttttatgtgt tgagatgcaa 360
ttccaactct acttggcacg aagtatagac actgaatcca actatgatgt ataagcaagg 420
gtccttgtga ggtaggtaat gagaatggag cctggaacgt gtaacactgg tgact 475
<210> 29
<211> 547
<212> DNA
<213> Mus musculus
<400> 29
tgcagattat aattctatgg aaactgactg ttttaaacat aaattttaga cctcttctca 60
aggtgtggca atcctcaaca gcttctggta tgcatagacc acatttgtat tcaccattaa 120
tgcataagaa aaacattttg gttgccagtt tggagctaaa ttgataaatc tgctacaagc 180
atttgtgcat gagtttgtgt gtaaatatgc tttttactta cttaggatga atatacaagg 240
atagcattgt tatattgctt gacatttgca tattcaattt tatagagaat gcacagcaat 300
tttggtatct gtctgtaccc tttcatattt tatgctcaac atttgagtca cttggtttct 360
tggcatcatt atgaattttt aatggtctta cttttaaaaa atatgcttta actcatctta 420
gaattatatc acatttcccc ttccagtctc tcctagacat ccctccctca aacagccctt 480
gtgtgctcct gccttcagtt catagcctgt tttactttat tattattatt gctctctgtg 540
tgtgcac 547
<210> 30
<400> 30
000
<210> 31
<211> 621
<212> DNA
<213> Mus musculus
<400> 31
gcttctgaat acctccacgc atacactcac ttaaattata aataaacctg aaaagcaatg 60
tagcaaaaat gaaagagatt tctgccacca gcttctataa ttatgtaatc ataatgtttt 120
gaaagttaaa ctcccctttt caacaagaaa attataatat atatgcatat atgcatatat 180
attcacacac ataacatata tttataaatc aatttaaact gcctttgtgc agtgtactag 240
gcaaaagtaa tgtatgtatc tatctctgtg aatgccctct aattctggaa ataaataatg 300
ggacatctca gtattttcaa gaagtctgta agccacaaat aggcttatgc ctattgttct 360
gtcataatta ttaatggtct agtacttggt ctcaagcatg tctggtatgg atgataaaac 420
taagagtcca aaaataggtc ccctgtgatc actatcagga aactcaaaag cacagaattc 480
atggagtatt tctaaccaga aacacaaaca ctacacatac tcatacacat atgtggatat 540
ctgttatata agatgtaact ttatataaaa cccctagtct ggtaatgttc ttaaccttat 600
ctggtgacgt tacatgacac a 621
<210> 32
<211> 312
<212> DNA
<213> Mus musculus
<400> 32
tactgtccag gccagctttg aacagactct gtattccaga aagactttca gcttgtgctt 60
cttttcccca aacctgcctt gagtagctga catcataggc ttgcactacc aggcctggct 120
taaaatacat actcccaatt tacatatctg atgagtaaca ttctcataga agcacaaaag 180
tacatacatg gattctaata taggttattt tcttgggcat tacacactac agatatacta 240
ttcaatatta tttgtggcct actagagact gagcctaagg ctataaacat gttagtcgtg 300
ctctaccagt ga 312
<210> 33
<211> 768
<212> DNA
<213> Mus musculus
<400> 33
tggaacttgg gacttctgag cacagggggt ggatggctgg aaatgtgagc agaacccatg 60
gtgtgagaac tgagataagt ttctgctgag gctagcctag aggcacaggt ggtgagacag 120
ctagggcaga acatatcagt gaatagtgta ggatgatgcc acttttaaaa tatttcccgc 180
aatatgaacc aatttctcaa aaggtataaa ttaccataac tctcttaaat acaaaatgag 240
taatctgaat agctgcaaat tgtaagaaaa ttgaacataa tcataaccca tcggcaaaaa 300
taaatctttg gggaaatgcc actttattag agaattctgc tatacatttg atgaatatat 360
tacaaagctt aaaaagctct gtgggtgttc attttgcata ttgaaaacta aaattttata 420
taagctaaaa aaggccaatt gtctctgtct gtctttctgt ctctatctct gtctctctct 480
gtctctctgt ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 540
ctctctccct ttctttttct ctctctgtgt atctaactat tcttcttttg caatttctga 600
aatttcttct ccagggcttt ctttcttcac aagtgtaagc acagcatgtg tgctcccact 660
gccaagatgc tgtgccatgc tataacttct ttttgacatc atatgtagct tatacatatt 720
aaaatttact tcagcactca acagtcacca ctgtcatgac tggaggtt 768
<210> 34
<211> 598
<212> DNA
<213> Mus musculus
<400> 34
ttggctttcc ttccaagttg tattttggtg aagtttgact cctggaatct cacttctgca 60
ctttagatta gcatacttta aaaaggaaca ttacagtaca atggaaaagt aaagatctgg 120
gttttatctc agctttagtt agtatttata ggaagcatgg attacataaa gagatgacat 180
tatttcagtc tgaaattgat ttgtactata cgacatttca ttttgtttgt gcacattgat 240
tagataattc ctcaaatcag tttgaaaatt tcatctctgt tcatagctga agataaccac 300
caaattgctt ttaactaatt tacataataa gtatagtaga ggtttattct atataaagta 360
tcaaatataa atattcatct caaattctaa aggatttagc aatgtaaatt acttatgaat 420
tacatacaca tttgtattta aatctttttt cacttttatt aaaaatagat ccttttctca 480
tacaatatat cctgattgca gttccctccc ctctactcct cccagttcct tcccacctcc 540
ctttccatct ggatctctct cctattaaag gttggacaga agagatggca ctgcatgt 598
<210> 35
<211> 795
<212> DNA
<213> Mus musculus
<400> 35
tggttagcac tattttgaat ggacacttct ataaaatttg ttttaaaaac aatatggaag 60
agtcataaga tgtctgggca cagtgccccc agtcaactca tcaatgggat tctggaatcc 120
aaaggttata tggtgtaaaa acacagagag caaaatgcac aaggatcttc atagaaccat 180
aatttttaaa aagcaaacac ttcccccaaa ggagcatgta agacaacttg aaggtattaa 240
aatgggattg tggttttatt agttagagaa catcatgcaa attatattat ctaggcatta 300
taatgcaaac tttaaaagga aatgctcatt atgtaatgtt aagtgaaaaa aatcaggcca 360
taaaatgaaa tgtgcattat gcatgcatat gatgaaaaga caagaaatag ataagaatat 420
gcagaaatac aaatagttgg ctgtggtgtg ggcttctggc ttgttttctg ttttaaagcc 480
attacatcat ctttccaatg acaaactaca ttttaagtta ttgaaaacaa aatctcgtta 540
gccttgtcct tgcataaatt cccagagaac acattattct tgttcccttc tacctctgct 600
acttgtcttt gatttggacc tgctccacct cctcttactt ttcagtcctg aactagatgg 660
aaaaaagaaa tagaccctca ggaaacaagg aagcaaaacc acccaactgt gtggaagccg 720
tgcattcaag ctgcaaacga gtggagtggc ttcaatacct taacttatcc ccattgttgc 780
aaagggagac ccaga 795
<210> 36
<211> 475
<212> DNA
<213> Mus musculus
<400> 36
tgtatgccta aagggtttgc ttctatgtta attcccaaca acaatcatga tacttcctta 60
cttctgcagg actaggctgg ctcactagtg aggttttctc caaggatgtg ctccaatatc 120
tgctccacaa tacttaaata gcttcacaat acataaatat ttaagtactc ctctgtaagg 180
agcgttctgt ttccatatgt caaggcagaa tcttcacata aagcatgcat tttgctccct 240
gttttcaatg gttttactct gtagagtttc tcaaattaat tcaataccca ctttaaatta 300
aatggaaact ttaatgctat ggtttgctgt gccatttaga ttttatgtgt tgagatgcaa 360
ttccaactct acttggcacg aagtatagac actgaatcca actatgatgt ataagcaagg 420
gtccttgtga ggtaggtaat gagaatggag cctggaacgt gtaacactgg tgact 475
<210> 37
<211> 546
<212> DNA
<213> Mus musculus
<400> 37
tgcagattat aattctatgg aactgactgt tttaaacata aattttagac ctcttctcaa 60
ggtgtggcaa tcctcaacag cttctggtat gcatagacca catttgtatt caccattaat 120
gcataagaaa aacattttgg ttgccagttt ggagctaaat tgataaatct gctacaagca 180
tttgtgcatg agtttgtgtg taaatatgct ttttacttac ttaggatgaa tatacaagga 240
tagcattgtt atattgcttg acatttgcat attcaatttt atagagaatg cacagcaatt 300
ttggtatctg tctgtaccct ttcatatttt atgctcaaca tttgagtcac ttggtttctt 360
ggcatcatta tgaattttta atggtcttac ttttaaaaaa tatgctttaa ctcatcttag 420
aattatatca catttcccct tccagtctct cctagacatc cctccctcaa acagcccttg 480
tgtgctcctg ccttcagttc atagcctgtt ttactttatt attattattg ctctctgtgt 540
gtgcac 546
<210> 38
<211> 655
<212> DNA
<213> Mus musculus
<400> 38
tccacttata ccccatcagc atctctatca ttgtctaaga catttttaat ttgaaataaa 60
tggggaaact cattatcatg gcctcaagga aatacagaaa ccaaggattg tccttttagt 120
gcacaggtgt cttctaaatt cacatattct ggatttaaca aggaaaataa aatctgacat 180
aggctgaatt tgaaaatggt aaggatattt ttaactaaac aaaaaaaata ggtaatagaa 240
catttcatat tgaactccca ggatagcatt tatcataatc caccagttga attattcatg 300
cgctgataaa taaccttagc ctccggcaca gtaatcctct cactgaataa tcaccagggc 360
tccctgcccg tggtgttttg ctttacaaca taaattttaa aattattctg tgttggcata 420
catatgtgaa agctcattaa cagatactgg cattctgatt ggtttggcac taaatttaaa 480
ctgttttgga aagaactgaa acactgaagg atatgccatt ctgtttcttt ataccttatc 540
gatgtttcct taacaatcgg ttgagattta tgcatctttt gatagatttt atctgagata 600
gctgatatgc attgtgatga gttccttttt aacgctgtaa tgtttcattg gccct 655
<210> 39
<211> 347
<212> DNA
<213> Mus musculus
<400> 39
aggcaccact ttaagggcct ttatcattat ccacaacagc agcagcagca tgagtagcat 60
taggaatgcg tttcctcctg tgctttgagg cttacgtagg tctttcttct gcatcgtttc 120
atgaaattct cacaagaaca ctatgaggta ggtgtcagat gtccatttta caggacagaa 180
aagagattaa aaaaaagaga gagagagagg aaaaagggct ttattcaaag ccaagtcagt 240
tcatatgggc agagccagga cttgaacgca ggccccacag tcttaactcc aatattttca 300
gctgccttgg gaacttcttg gaagagccca ttccattttc ctgccat 347
<210> 40
<211> 412
<212> DNA
<213> Mus musculus
<400> 40
gcggcaggaa tttaaagagg cagaagttca tttcctgtga tttatgggac tttgctgact 60
ttcacgctcc ggttctaggg acagggagac cctccctgcg ggagccgctg ctagagggaa 120
aggcagcgtt ggatcggatg ccggccccag cctgggagac gtgcttcctc tgcagcctgt 180
gatcaggagc gaagtgtaga gaccagaatc gttcagaggc agggctggtc cctgttgatt 240
tatgactcag gcaaacagtc cattcatccg tcagcggctc cacttctatc cccagcttac 300
tggaggcaga agaatgtccc ctggaagtgg tctgagctgc ttcctgtggt ggccccattc 360
ctccgggtgg gggatcctat ttttagaggg ccaccattgc catgaaggtc ca 412
<210> 41
<211> 740
<212> DNA
<213> Mus musculus
<400> 41
aggacaactt gacttatgca aatgaacaat ataaatttta gaactatgta taaataatta 60
aataagtaca tggacttaca ggaaggaatg aataccttca gagtatgctg tagtatattt 120
cctgaatgta tagattaagc tatataattg tcaatgagct gttgtattac gtataattca 180
gggtttaaac aaaataaaaa tgtgtgcata tgttttatgc aaatgcatgt atttttgaat 240
caatgataat cccacacttt ttataatgat tcatacccgc tcaaagtgat gaaaataatt 300
gacctgtaaa tgtttatttt taagtagaaa aaaatctctg tgaggctcag agaacatgtt 360
gatacagggg gagagggaat gtacagagta gcatgctctt gtaagttgct ccaaggcaac 420
gcatgactac tgcggtcttg acctaacagc tgcacagacc ttcagaagat tgtatccatc 480
tacatttcat tatggagcca agaatggctc atgaaacttc tgccctccct gggagcatgt 540
aggcagttaa tttgaatggt aattttatgt acaaggagat agaatatttt cagtgatgtc 600
accactggtt tgtcacaatg ctttctataa atgcccaaat cctgtaagta ttcttaatga 660
aaaccattga cttacgcact aataggaaat taaagtggaa acagatgttc tatttttatt 720
tatgctgctg tgatcaacac 740
<210> 42
<211> 440
<212> DNA
<213> Mus musculus
<400> 42
aacatgtatt tgtggagtgg ctaaattgag atatatcacc ttaaaatcaa ctcccagcaa 60
tttgaagagc acagtaagta agaccttgtt cctaaccaca gtcgccatgc agtgcagtag 120
agcccagatc ttacacttcc tgtgtaactg gagtcttgtg ttctttagcc aagctcttcc 180
cacatgcgag tcattttcaa ttcaaaatac tagttatttt cagtttaaga atcagtctga 240
tttcttgagc atagtgctta tcttatatgg tatggctttc agctccctgg agatttcctg 300
ggtgtgctgc tgtgcctttg cctccaggat aaatgccatg ctgagaagag catgactctg 360
tcagcacagg cagacggtgg aaactttacc tttgcgacct ctctgcagcc tcagggtagc 420
aggggatggc atggtttcat 440
<210> 43
<211> 390
<212> DNA
<213> Mus musculus
<400> 43
tctcaacact aagaaaactg cagtatgaag atatggaatt tgaggccagt ttgagataaa 60
acagaaagat atgagcaaaa gacaaggatg tgagaaacat aaataaaaac tatgcatatt 120
catgaagcac cgcataatag tttcatatgg atacacatcc catgatgttt aaagcaggct 180
tatcattttt atcttttcaa acatttaaca cttatgttaa tatatgtaaa ctcagtcatt 240
tttagccttc tgagagaacc tgcatcattt ttaatcactc ttccgttcag taggattctt 300
gaattattat catagttaac catagctgag taatcaaacc tcaattgtaa atttgaaaat 360
ttacccttct attcttttct tgcaataaaa 390
<210> 44
<211> 711
<212> DNA
<213> Mus musculus
<400> 44
caacaaacca gggaatctac tgtatagtga agcaggattg tgaaaaggcc attcatataa 60
gagaactcca gatggctgac acagatatgg tagtgttaaa tctttctgat aaccaagagg 120
ctcaagttaa actgagattt ccctttatac actgtgaatc tgtaaacatt acaaccttcc 180
agaataccaa gtactgtcta gactgagaca taagaacctt gttacaaggt gtgtggcttt 240
ctagaatgaa gtcagtttac aatatttgaa aaaaattagt atgcataccc tagacctagc 300
aatggcatct actgttactt tataggtatg ggaactggtg acagataaga ttcaatgtga 360
aaagaatgga taactaaaat atattggaag cacagtatga aataatatgc agtgggtagg 420
tggaatgagt gatgacgtat aactccatgc taactatagt gtggagagaa tgcaaagtac 480
gccagagaac aggatgtatt gttaagtatg taaattaatt ccatgcacat aataagctta 540
cttatttttt caatgacaaa tacatttata tattcaatga catgcatgga aatttctaga 600
atgtctagag cggaggaggg gaaatggatc tgagttcagg aatgaattag caaaagaata 660
aaaaatgcac atgtgaaggt attaacataa ggccttagaa gcctgtgtgt c 711
<210> 45
<211> 265
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_459m enhancer
<400> 45
ctatgaatag ttacaagtga gaaagagaaa tggagatttt accatttaat catctccgaa 60
gagaaggtga gaagaaattg agaaaggtaa tttgcatacc atgcataggc attagagaaa 120
gcattttttt tcttaactct ccatttgttt acagatattt ccatatggcc ttttaaaaac 180
ttcaacagag aaattcgaac acaactaact ggaatttcaa ttttcatata aaaccagcat 240
catagatata tatgtagcta ctctc 265
<210> 46
<211> 251
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_453m enhancer
<400> 46
attttaggat gttcttaaat agatcgattc ttctactttt tttaaaaata acatagatct 60
gaaaagcttt ataacttttg gttttttttt taaggaccat attaacagca tcttccagtt 120
tttctagagt aaatgaatat gtatcccttt tataattaac aatatacata tattcatttt 180
gtaaaaagac tataaaaata gaagagaaaa tgaagagatg tttatttctt ttacacgcat 240
cagactaagg a 251
<210> 47
<211> 195
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_462m enhancer
<400> 47
ctgttctatc tattcctggg cttccaccac actgtgttaa tgaggataac tttaaaatac 60
atcttgatat ttagtagagc gcatttccac gcctgattca tcacgagcac cttaacttgt 120
cttggttctt ctgcggagat gttggcacca gcttcttcac ccgtgactcc agcttctggg 180
gaacctgtgc tctca 195
<210> 48
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_461m enhancer
<400> 48
ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 60
cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 120
tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 180
agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 240
<210> 49
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_464m enhancer
<400> 49
tttgtgtctg ctattgcatt tacatagtga cataggctta caggatattg taaatgtcat 60
ccctagatac atttatgtaa ccttttttta aaataaaact ctaacaaatg ttagttattg 120
tgcactatgg ttttgaatat ttgaatttgc tttgctcaga tctaaataac ttctgataag 180
tttggcattc aggaaagagt aaatgtaaat gtagaaatgc ttggaat 227
<210> 50
<211> 235
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_452m enhancer
<400> 50
cattgactca tttttatttt gtgaggaaga aattttccat ttgtctgtgt aattacattt 60
gctaatttct aaaacaattc ctgggattta tatctatata tgcctcagga acatacaggg 120
aagatcatac tgttctctga atttcaaatt atgttttctg ttttatttca tgaatttatt 180
atttttcttt gtctctgtct gtctctctct gtgtgtatgt gtatgcgtgt atatg 235
<210> 51
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_451m enhancer
<400> 51
ttttcattcc tggaggtaaa accaacctta gaatcgtgga gcctgataga ctttgaaatt 60
ggccttcatt ttaattctca agttcttagc atgagagcaa cattcaatat ggttctgaaa 120
tatctcatgc aaaaaagtgc cagagtcata gactgaaata tttatttgaa tataaatgaa 180
ctcagatttg ccaaaatgcg ctccccctgt tgt 213
<210> 52
<211> 278
<212> DNA
<213> Artificial Sequence
<220>
<223> Core of eHGT_460m enhancer
<400> 52
catgaacatt tagtcatcgt tatcttacat gagtcatatc tgtgtcctta ttgtcttatc 60
ttaaatgcat taattaattc gatagagcat ctataaaaat gaaacgctat tcaaaagctg 120
gcccatgaca agatcagtgt gttggtttct atgcctatag tggtgcaatg gaaggagtgc 180
gctgtacccc acagactttg tgattgatga gttgtctact ttattcacaa tgaagctaaa 240
aacaatctaa caaccatcag ggtgctacag cagcacag 278
<210> 53
<211> 795
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_459m
<400> 53
ctatgaatag ttacaagtga gaaagagaaa tggagatttt accatttaat catctccgaa 60
gagaaggtga gaagaaattg agaaaggtaa tttgcatacc atgcataggc attagagaaa 120
gcattttttt tcttaactct ccatttgttt acagatattt ccatatggcc ttttaaaaac 180
ttcaacagag aaattcgaac acaactaact ggaatttcaa ttttcatata aaaccagcat 240
catagatata tatgtagcta ctctcctatg aatagttaca agtgagaaag agaaatggag 300
attttaccat ttaatcatct ccgaagagaa ggtgagaaga aattgagaaa ggtaatttgc 360
ataccatgca taggcattag agaaagcatt ttttttctta actctccatt tgtttacaga 420
tatttccata tggcctttta aaaacttcaa cagagaaatt cgaacacaac taactggaat 480
ttcaattttc atataaaacc agcatcatag atatatatgt agctactctc ctatgaatag 540
ttacaagtga gaaagagaaa tggagatttt accatttaat catctccgaa gagaaggtga 600
gaagaaattg agaaaggtaa tttgcatacc atgcataggc attagagaaa gcattttttt 660
tcttaactct ccatttgttt acagatattt ccatatggcc ttttaaaaac ttcaacagag 720
aaattcgaac acaactaact ggaatttcaa ttttcatata aaaccagcat catagatata 780
tatgtagcta ctctc 795
<210> 54
<211> 749
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_453m
<400> 54
attttaggat gttcttaaat agatcgattc ttctactttt tttaaaaata acatagatct 60
gaaaagcttt ataacttttg gttttttttt taaggaccat attaacagca tcttccagtt 120
tttctagagt aaatgaatat gtatcccttt tataattaac aatatacata tattcatttt 180
gtaaaaagac tataaaaata gaagagaaaa tgaagagatg tttatttctt ttacacgcat 240
cagactaagg aattttagga tgttcttaaa tagatcgatt cttctacttt ttttaaaaat 300
aacatagatc tgaaaagctt tataactttt ggtttttttt ttaaggacca tattaacagc 360
atcttccagt ttttctagag taaatgaata tgtatccctt ttataattaa caatatacat 420
atattcattt tgtaaaaaga ctataaaaat agaagagaaa atgaagagat gtttatttct 480
tttacacgca tcagactaag gaattttagg atgttcttaa atagatcgat tcttctactt 540
tttttaaaaa taacatagat ctgaaaagct ttataacttt tggttttttt tttaaggacc 600
atattaacag catcttccag tttttctaga gtaaatgaat atgtatccct tttataatta 660
acaatataca tatattcatt ttgtaaaaag actataaaaa tagaagagaa aatgaagaga 720
tgtttatttc ttttacacgc atcagacta 749
<210> 55
<211> 585
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_462m
<400> 55
ctgttctatc tattcctggg cttccaccac actgtgttaa tgaggataac tttaaaatac 60
atcttgatat ttagtagagc gcatttccac gcctgattca tcacgagcac cttaacttgt 120
cttggttctt ctgcggagat gttggcacca gcttcttcac ccgtgactcc agcttctggg 180
gaacctgtgc tctcactgtt ctatctattc ctgggcttcc accacactgt gttaatgagg 240
ataactttaa aatacatctt gatatttagt agagcgcatt tccacgcctg attcatcacg 300
agcaccttaa cttgtcttgg ttcttctgcg gagatgttgg caccagcttc ttcacccgtg 360
actccagctt ctggggaacc tgtgctctca ctgttctatc tattcctggg cttccaccac 420
actgtgttaa tgaggataac tttaaaatac atcttgatat ttagtagagc gcatttccac 480
gcctgattca tcacgagcac cttaacttgt cttggttctt ctgcggagat gttggcacca 540
gcttcttcac ccgtgactcc agcttctggg gaacctgtgc tctca 585
<210> 56
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_461m
<400> 56
ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 60
cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 120
tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 180
agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 240
ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 300
cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 360
tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 420
agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 480
ccgcagcttt ggaaaagacc ttcttatttt aacttatgta attaaccatc ccaaatttac 540
cctgatcctc actggaaatg tcttcccttt cctgatattt accacagttt taaaaagtct 600
tagatgggta tgcatatttg agaaatacgt agagttaatt agtgcgtaga tgtgttttta 660
agttgcataa aacatattgt gctttggcat agctcccttt gtaacttatt ttaggaaacc 720
<210> 57
<211> 681
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_464m
<400> 57
tttgtgtctg ctattgcatt tacatagtga cataggctta caggatattg taaatgtcat 60
ccctagatac atttatgtaa ccttttttta aaataaaact ctaacaaatg ttagttattg 120
tgcactatgg ttttgaatat ttgaatttgc tttgctcaga tctaaataac ttctgataag 180
tttggcattc aggaaagagt aaatgtaaat gtagaaatgc ttggaatttt gtgtctgcta 240
ttgcatttac atagtgacat aggcttacag gatattgtaa atgtcatccc tagatacatt 300
tatgtaacct ttttttaaaa taaaactcta acaaatgtta gttattgtgc actatggttt 360
tgaatatttg aatttgcttt gctcagatct aaataacttc tgataagttt ggcattcagg 420
aaagagtaaa tgtaaatgta gaaatgcttg gaattttgtg tctgctattg catttacata 480
gtgacatagg cttacaggat attgtaaatg tcatccctag atacatttat gtaacctttt 540
tttaaaataa aactctaaca aatgttagtt attgtgcact atggttttga atatttgaat 600
ttgctttgct cagatctaaa taacttctga taagtttggc attcaggaaa gagtaaatgt 660
aaatgtagaa atgcttggaa t 681
<210> 58
<211> 705
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_452m
<400> 58
cattgactca tttttatttt gtgaggaaga aattttccat ttgtctgtgt aattacattt 60
gctaatttct aaaacaattc ctgggattta tatctatata tgcctcagga acatacaggg 120
aagatcatac tgttctctga atttcaaatt atgttttctg ttttatttca tgaatttatt 180
atttttcttt gtctctgtct gtctctctct gtgtgtatgt gtatgcgtgt atatgcattg 240
actcattttt attttgtgag gaagaaattt tccatttgtc tgtgtaatta catttgctaa 300
tttctaaaac aattcctggg atttatatct atatatgcct caggaacata cagggaagat 360
catactgttc tctgaatttc aaattatgtt ttctgtttta tttcatgaat ttattatttt 420
tctttgtctc tgtctgtctc tctctgtgtg tatgtgtatg cgtgtatatg cattgactca 480
tttttatttt gtgaggaaga aattttccat ttgtctgtgt aattacattt gctaatttct 540
aaaacaattc ctgggattta tatctatata tgcctcagga acatacaggg aagatcatac 600
tgttctctga atttcaaatt atgttttctg ttttatttca tgaatttatt atttttcttt 660
gtctctgtct gtctctctct gtgtgtatgt gtatgcgtgt atatg 705
<210> 59
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_451m
<400> 59
ttttcattcc tggaggtaaa accaacctta gaatcgtgga gcctgataga ctttgaaatt 60
ggccttcatt ttaattctca agttcttagc atgagagcaa cattcaatat ggttctgaaa 120
tatctcatgc aaaaaagtgc cagagtcata gactgaaata tttatttgaa tataaatgaa 180
ctcagatttg ccaaaatgcg ctccccctgt tgtttttcat tcctggaggt aaaaccaacc 240
ttagaatcgt ggagcctgat agactttgaa attggccttc attttaattc tcaagttctt 300
agcatgagag caacattcaa tatggttctg aaatatctca tgcaaaaaag tgccagagtc 360
atagactgaa atatttattt gaatataaat gaactcagat ttgccaaaat gcgctccccc 420
tgttgttttt cattcctgga ggtaaaacca accttagaat cgtggagcct gatagacttt 480
gaaattggcc ttcattttaa ttctcaagtt cttagcatga gagcaacatt caatatggtt 540
ctgaaatatc tcatgcaaaa aagtgccaga gtcatagact gaaatattta tttgaatata 600
aatgaactca gatttgccaa aatgcgctcc ccctgttgt 639
<210> 60
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xcore2_eHGT_460m
<400> 60
catgaacatt tagtcatcgt tatcttacat gagtcatatc tgtgtcctta ttgtcttatc 60
ttaaatgcat taattaattc gatagagcat ctataaaaat gaaacgctat tcaaaagctg 120
gcccatgaca agatcagtgt gttggtttct atgcctatag tggtgcaatg gaaggagtgc 180
gctgtacccc acagactttg tgattgatga gttgtctact ttattcacaa tgaagctaaa 240
aacaatctaa caaccatcag ggtgctacag cagcacagca tgaacattta gtcatcgtta 300
tcttacatga gtcatatctg tgtccttatt gtcttatctt aaatgcatta attaattcga 360
tagagcatct ataaaaatga aacgctattc aaaagctggc ccatgacaag atcagtgtgt 420
tggtttctat gcctatagtg gtgcaatgga aggagtgcgc tgtaccccac agactttgtg 480
attgatgagt tgtctacttt attcacaatg aagctaaaaa caatctaaca accatcaggg 540
tgctacagca gcacagcatg aacatttagt catcgttatc ttacatgagt catatctgtg 600
tccttattgt cttatcttaa atgcattaat taattcgata gagcatctat aaaaatgaaa 660
cgctattcaa aagctggccc atgacaagat cagtgtgttg gtttctatgc ctatagtggt 720
gcaatggaag gagtgcgctg taccccacag actttgtgat tgatgagttg tctactttat 780
tcacaatgaa gctaaaaaca atctaacaac catcagggtg ctacagcagc acag 834
<210> 61
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Beta-Globin Minimal Promoter
<400> 61
gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt ctg 53
<210> 62
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> minCMV Promoter
<400> 62
gaggtaggcg tgtacggtgg gaggcctata taagcagagc tcgtttagtg aaccgtcaga 60
tcgcctgg 68
<210> 63
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> mutated minCMV Promoter
<400> 63
gaggtaggcg tgtacggtgg gaggcctata taagcagagc tggtttagtg aaccgtcaga 60
tcgcctgg 68
<210> 64
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> minRho Promoter
<400> 64
gattcagccg ggagcttagg gaggggaggt cacttcataa gggcctgggg ggggagttgg 60
agccacgagt cgtccagccg gagccccgtg tggctgagct ccggcctcag aagcatcccc 120
<210> 65
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> minRho* Promoter
<400> 65
gattcagccg ggagcttagg gaggggaggt cacttcataa gggcttgggg ggggagttgg 60
agccacgagt cgtccagccg gagccccgtg tggctgtgct ccggcctcag aagcatcccc 120
<210> 66
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<223> Hsp68 minimal promoter
<400> 66
caggaacatc caaactgagc agccggggtc ccccccaccc cccaccccgc cccacgcggc 60
aactttgagc ctgtgctggg acagagcctc tagttcctaa attagtccat gaggtcagag 120
gcagcactgc cattgtaacg cgattggaga ggatcacgtc accggacacg cccccaggca 180
tctccctggg tctcctaaac ttggcgggga gaagttttag cccttaagtt ttagccttta 240
acccccatat tcagaactgt gcgagttggc gaaaccccac aaatcacaac aaactgtaca 300
caacaccgag ctagaggtga tctttcttgt ccattccaca caggccttag taatgcgtcg 360
ccatagcaac agtgtcacta gtagcaccag cacttcccca caccctcccc ctcaggaatc 420
cgtactctcc agtgaacccc agaaacctct ggagagttct ggacaagggc ggaacccaca 480
actccgatta ctcaagggag gcggggaagc tccaccagac gcgaaactgc tggaagattc 540
ctggccccaa ggcctcctcc ggctcgctga ttggcccagc ggagagtggg cggggccggt 600
gaagactcct taaaggcgca gggcggcgag caggtcacca gacgctgaca gctactcaga 660
accaaatctg gttccatcca gagacaagcg aagacaagag aagcagagcg agcggcgcgt 720
tcccgatcct cggccaggac cagccttccc cagagcatcc ctgccgcgga gcgcaacctt 780
cccaggagca tccctgccgc ggagcgcaac tttccccgga gcatccacgc cgcggagcgc 840
agccttccag aagcagagcg cggcgcc 867
<210> 67
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> SYFP2
<400> 67
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 480
ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagct accagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 68
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> EGFP
<400> 68
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 69
<211> 1299
<212> DNA
<213> Artificial Sequence
<220>
<223> Optimized Flp recombinase (FlpO)
<400> 69
atggctccta agaagaagag gaaggtgatg agccagttcg acatcctgtg caagaccccc 60
cccaaggtgc tggtgcggca gttcgtggag agattcgaga ggcccagcgg cgagaagatc 120
gccagctgtg ccgccgagct gacctacctg tgctggatga tcacccacaa cggcaccgcc 180
atcaagaggg ccaccttcat gagctacaac accatcatca gcaacagcct gagcttcgac 240
atcgtgaaca agagcctgca gttcaagtac aagacccaga aggccaccat cctggaggcc 300
agcctgaaga agctgatccc cgcctgggag ttcaccatca tcccttacaa cggccagaag 360
caccagagcg acatcaccga catcgtgtcc agcctgcagc tgcagttcga gagcagcgag 420
gaggccgaca agggcaacag ccacagcaag aagatgctga aggccctgct gtccgagggc 480
gagagcatct gggagatcac cgagaagatc ctgaacagct tcgagtacac cagcaggttc 540
accaagacca agaccctgta ccagttcctg ttcctggcca cattcatcaa ctgcggcagg 600
ttcagcgaca tcaagaacgt ggaccccaag agcttcaagc tggtgcagaa caagtacctg 660
ggcgtgatca ttcagtgcct ggtgaccgag accaagacaa gcgtgtccag gcacatctac 720
tttttcagcg ccagaggcag gatcgacccc ctggtgtacc tggacgagtt cctgaggaac 780
agcgagcccg tgctgaagag agtgaacagg accggcaaca gcagcagcaa caagcaggag 840
taccagctgc tgaaggacaa cctggtgcgc agctacaaca aggccctgaa gaagaacgcc 900
ccctacccca tcttcgctat caagaacggc cctaagagcc acatcggcag gcacctgatg 960
accagctttc tgagcatgaa gggcctgacc gagctgacaa acgtggtggg caactggagc 1020
gacaagaggg cctccgccgt ggccaggacc acctacaccc accagatcac cgccatcccc 1080
gaccactact tcgccctggt gtccaggtac tacgcctacg accccatcag caaggagatg 1140
atcgccctga aggacgagac caaccccatc gaggagtggc agcacatcga gcagctgaag 1200
ggcagcgccg agggcagcat cagatacccc gcctggaacg gcatcatcag ccaggaggtg 1260
ctggactacc tgagcagcta catcaacagg cggatctga 1299
<210> 70
<211> 1056
<212> DNA
<213> Artificial Sequence
<220>
<223> Improved Cre recombinase (iCre)
<400> 70
atggtgccca agaagaagag gaaagtctcc aacctgctga ctgtgcacca aaacctgcct 60
gccctccctg tggatgccac ctctgatgaa gtcaggaaga acctgatgga catgttcagg 120
gacaggcagg ccttctctga acacacctgg aagatgctcc tgtctgtgtg cagatcctgg 180
gctgcctggt gcaagctgaa caacaggaaa tggttccctg ctgaacctga ggatgtgagg 240
gactacctcc tgtacctgca agccagaggc ctggctgtga agaccatcca acagcacctg 300
ggccagctca acatgctgca caggagatct ggcctgcctc gcccttctga ctccaatgct 360
gtgtccctgg tgatgaggag aatcagaaag gagaatgtgg atgctgggga gagagccaag 420
caggccctgg cctttgaacg cactgacttt gaccaagtca gatccctgat ggagaactct 480
gacagatgcc aggacatcag gaacctggcc ttcctgggca ttgcctacaa caccctgctg 540
cgcattgccg aaattgccag aatcagagtg aaggacatct cccgcaccga tggtgggaga 600
atgctgatcc acattggcag gaccaagacc ctggtgtcca cagctggtgt ggagaaggcc 660
ctgtccctgg gggttaccaa gctggtggag agatggatct ctgtgtctgg tgtggctgat 720
gaccccaaca actacctgtt ctgccgggtc agaaagaatg gtgtggctgc cccttctgcc 780
acctcccaac tgtccacccg ggccctggaa gggatctttg aggccaccca ccgcctgatc 840
tatggtgcca aggatgactc tgggcagaga tacctggcct ggtctggcca ctctgccaga 900
gtgggtgctg ccagggacat ggccagggct ggtgtgtcca tccctgaaat catgcaggct 960
ggtggctgga ccaatgtgaa cattgtgatg aactacatca gaaacctgga ctctgagact 1020
ggggccatgg tgaggctgct cgaggatggg gactaa 1056
<210> 71
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> SP10 insulator (SP10ins)
<400> 71
gaagctaccc ctaacacact attctacaca cagaaaatgc tcttcactag 50
<210> 72
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> 3xSP10ins
<400> 72
gaagctaccc ctaacacact attctacaca cagaaaatgc tcttcactag gaagctaccc 60
ctaacacact attctacaca cagaaaatgc tcttcactag gaagctaccc ctaacacact 120
attctacaca cagaaaatgc tcttcactag 150
<210> 73
<211> 246
<212> DNA
<213> Artificial Sequence
<220>
<223> WPRE3
<400> 73
ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 60
ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 120
gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 180
tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 240
ccgtgg 246
<210> 74
<211> 609
<212> DNA
<213> Artificial Sequence
<220>
<223> WPRE
<400> 74
gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa 60
ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat 120
tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta 180
tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc 240
aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt 300
ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg 360
ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc 420
ttggctgctc gcctatgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 480
ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 540
tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca 600
tcgataccg 609
<210> 75
<211> 204
<212> DNA
<213> Artificial Sequence
<220>
<223> BGHpA
<400> 75
cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180
attgggaaga caatagcagg catg 204
<210> 76
<211> 479
<212> DNA
<213> Artificial Sequence
<220>
<223> HGHpA
<400> 76
acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 60
cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 120
ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga 180
caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt 240
ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt 300
tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac 360
ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac 420
cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt 479
<210> 77
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> P2A
<400> 77
ggcagcggcg ccaccaactt cagcctgctg aagcaggccg gcgacgtgga ggagaacccc 60
ggccccggag ctagcgga 78
<210> 78
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> T2A
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> (GlySerGly) residues can be added to the 5' end of the peptide to
improve cleavage efficiency
<400> 78
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 79
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> E2A
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> (GlySerGly) residues can be added to the 5' end of the peptide to
improve cleavage efficiency
<400> 79
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro Pro
20
<210> 80
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> F2A
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> (GlySerGly) residues can be added to the 5' end of the peptide to
improve cleavage efficiency
<400> 80
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 81
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary Plasmid Backbone 1 - Left ITR
<400> 81
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 82
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary Plasmid Backbone 1 - Right ITR
<400> 82
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc t 141
<210> 83
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary Plasmid Backbone 2 - Left ITR:
<400> 83
catgtcctgc aggcagctgc gcgctcgctc gctcactgag gccgcccggg caaagcccgg 60
gcgtcgggcg acctttggtc gcccggcctc agtgagcgag cgagcgcgca gagagggagt 120
ggccaactcc atcactaggg gttcct 146
<210> 84
<211> 149
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary Plasmid Backbone 2 - Right ITR:
<400> 84
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag gggcgcctg 149
<210> 85
<211> 743
<212> PRT
<213> Artificial Sequence
<220>
<223> PHP.eB capsid
<400> 85
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Asp Gly Thr Leu Ala Val
580 585 590
Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile
595 600 605
Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
610 615 620
Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro
625 630 635 640
Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile
645 650 655
Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp
660 665 670
Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val
675 680 685
Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro
690 695 700
Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe
705 710 715 720
Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr
725 730 735
Arg Tyr Leu Thr Arg Asn Leu
740
<210> 86
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV9 VP1 capsid protein
<400> 86
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 87
<211> 747
<212> DNA
<213> Artificial Sequence
<220>
<223> tet-Transactivator version 2 (tTA2)
<400> 87
atgtctagac tggacaagag caaagtcata aactctgctc tggaattact caatgaagtc 60
ggtatcgaag gcctgacgac aaggaaactc gctcaaaagc tgggagttga gcagcctacc 120
ctgtactggc acgtgaagaa caagcgggcc ctgctcgatg ccctggcaat cgagatgctg 180
gacaggcatc atacccactt ctgccccctg gaaggcgagt catggcaaga ctttctgcgg 240
aacaacgcca agtcattccg ctgtgctctc ctctcacatc gcgacggggc taaagtgcat 300
ctcggcaccc gcccaacaga gaaacagtac gaaaccctgg aaaatcagct cgcgttcctg 360
tgtcagcaag gcttctccct ggagaacgca ctgtacgctc tgtccgccgt gggccacttt 420
acactgggct gcgtattgga ggatcaggag catcaagtag caaaagagga aagagagaca 480
cctaccaccg attctatgcc cccacttctg agacaagcaa ttgagctgtt cgaccatcag 540
ggagccgaac ctgccttcct tttcggcctg gaactaatca tatgtggcct ggagaaacag 600
ctaaagtgcg aaagcggcgg gccggccgac gcccttgacg attttgactt agacatgctc 660
ccagccgatg cccttgacga ctttgacctt gatatgctgc ctgctgacgc tcttgacgat 720
tttgaccttg acatgctccc cgggtaa 747
<210> 88
<211> 189
<212> PRT
<213> Homo sapiens
<400> 88
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His Gln Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Asp Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Ala Ala Arg Thr Val Glu Ser Arg
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Tyr Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Gly Val Glu Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Gln His Lys Leu Arg Lys Leu Asn Pro Pro Asp Glu
165 170 175
Ser Gly Pro Gly Cys Met Ser Cys Lys Cys Val Leu Ser
180 185
<210> 89
<211> 1353
<212> DNA
<213> Artificial Sequence
<220>
<223> GCaMP6m
<400> 89
atgggttctc atcatcatca tcatcatggt atggctagca tgactggtgg acagcaaatg 60
ggtcgggatc tgtacgacga tgacgataag gatctcgcca ccatggtcga ctcatcacgt 120
cgtaagtgga ataagacagg tcacgcagtc agagctatag gtcggctgag ctcactcgag 180
aacgtctata tcaaggccga caagcagaag aacggcatca aggcgaactt caagatccgc 240
cacaacatcg aggacggcgg cgtgcagctc gcctaccact accagcagaa cacccccatc 300
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcgtgcagtc caaactttcg 360
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 420
atcactctcg gcatggacga gctgtacaag ggcggtaccg gagggagcat ggtgagcaag 480
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 540
ggccacaagt tcagcgtgtc cggcgagggt gagggcgatg ccacctacgg caagctgacc 600
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 660
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 720
ttcaagtccg ccatgcccga aggctacatc caggagcgca ccatcttctt caaggacgac 780
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 840
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 900
aacctgccgg accaactgac tgaagagcag atcgcagaat ttaaagaggc tttctcccta 960
tttgacaagg acggggatgg gacaataaca accaaggagc tggggacggt gatgcggtct 1020
ctggggcaga accccacaga agcagagctg caggacatga tcaatgaagt agatgccgac 1080
ggtgacggca caatcgactt ccctgagttc ctgacaatga tggcaagaaa agggagctac 1140
agggacacgg aagaagaaat tagagaagcg ttcggtgtgt ttgataagga tggcaatggc 1200
tacatcagtg cagcagagct tcgccacgtg atgacaaacc ttggagagaa gttaacagat 1260
gaagaggttg atgaaatgat cagggaagca gacatcgatg gggatggtca ggtaaactac 1320
gaagagtttg tacaaatgat gacagcgaag tga 1353
<210> 90
<211> 1353
<212> DNA
<213> Artificial Sequence
<220>
<223> GCaMP6s
<400> 90
atgggttctc atcatcatca tcatcatggt atggctagca tgactggtgg acagcaaatg 60
ggtcgggatc tgtacgacga tgacgataag gatctcgcca ccatggtcga ctcatcacgt 120
cgtaagtgga ataagacagg tcacgcagtc agagctatag gtcggctgag ctcactcgag 180
aacgtctata tcaaggccga caagcagaag aacggcatca aggcgaactt ccacatccgc 240
cacaacatcg aggacggcgg cgtgcagctc gcctaccact accagcagaa cacccccatc 300
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcgtgcagtc caaactttcg 360
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 420
atcactctcg gcatggacga gctgtacaag ggcggtaccg gagggagcat ggtgagcaag 480
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 540
ggccacaagt tcagcgtgtc cggcgagggt gagggcgatg ccacctacgg caagctgacc 600
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 660
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 720
ttcaagtccg ccatgcccga aggctacatc caggagcgca ccatcttctt caaggacgac 780
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 840
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 900
aacctgccgg accaactgac tgaagagcag atcgcagaat ttaaagaggc tttctcccta 960
tttgacaagg acggggatgg gacaataaca accaaggagc tggggacggt gatgcggtct 1020
ctggggcaga accccacaga agcagagctg caggacatga tcaatgaagt agatgccgac 1080
ggtgacggca caatcgactt ccctgagttc ctgacaatga tggcaagaaa aatgaaatac 1140
agggacacgg aagaagaaat tagagaagcg ttcggtgtgt ttgataagga tggcaatggc 1200
tacatcagtg cagcagagct tcgccacgtg atgacaaacc ttggagagaa gttaacagat 1260
gaagaggttg atgaaatgat cagggaagca gacatcgatg gggatggtca ggtaaactac 1320
gaagagtttg tacaaatgat gacagcgaag tga 1353
<210> 91
<211> 1353
<212> DNA
<213> Artificial Sequence
<220>
<223> GCaMP6f
<400> 91
atgggttctc atcatcatca tcatcatggt atggctagca tgactggtgg acagcaaatg 60
ggtcgggatc tgtacgacga tgacgataag gatctcgcca ccatggtcga ctcatcacgt 120
cgtaagtgga ataagacagg tcacgcagtc agagctatag gtcggctgag ctcactcgag 180
aacgtctata tcaaggccga caagcagaag aacggcatca aggcgaactt caagatccgc 240
cacaacatcg aggacggcgg cgtgcagctc gcctaccact accagcagaa cacccccatc 300
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcgtgcagtc caaactttcg 360
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 420
atcactctcg gcatggacga gctgtacaag ggcggtaccg gagggagcat ggtgagcaag 480
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 540
ggccacaagt tcagcgtgtc cggcgagggt gagggcgatg ccacctacgg caagctgacc 600
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 660
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 720
ttcaagtccg ccatgcccga aggctacatc caggagcgca ccatcttctt caaggacgac 780
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 840
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 900
aacctgccgg accaactgac tgaagagcag atcgcagaat ttaaagagga attctcccta 960
tttgacaagg acggggatgg gacaataaca accaaggagc tggggacggt gatgcggtct 1020
ctggggcaga accccacaga agcagagctg caggacatga tcaatgaagt agatgccgac 1080
ggtgacggca caatcgactt ccctgagttc ctgacaatga tggcaagaaa aatgaaatac 1140
agggacacgg aagaagaaat tagagaagcg ttcggtgtgt ttgataagga tggcaatggc 1200
tacatcagtg cagcagagct tcgccacgtg atgacaaacc ttggagagaa gttaacagat 1260
gaagaggttg atgaaatgat cagggaagca gacatcgatg gggatggtca ggtaaactac 1320
gaagagtttg tacaaatgat gacagcgaag tga 1353
<210> 92
<211> 1842
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2248
<400> 92
gcggccgcac gcgtttccgc gtagacctgg ggtacttttc taagacaccc tttattgttt 60
gttcctaacc ctagccctgt atccatgcag cgttctccat cacctatgta aaacttagca 120
gatctgagtc ttcctctgag gaaacaacat cctgtgctgt tagactgtat tttccgtctc 180
cagattctct acttcgtccc ttcccccgcc ccaatttccc tgtctccagc gagcaatatt 240
atctttcatc tgagcctctc tccctgcctc cagtgactgc ctcccctgat gaattctctc 300
cgggtgactt tggcatttgc atatttcctc gcttggatat tctgagatgt tggaaccgga 360
gagcaggttg acgcgatcag gtacttagct gaacgaggct ttctcgggaa ctgcacaaat 420
atttggagtc gggcatgtgc caataggcaa ttaattgaaa tgtggacaca gcaagcttcc 480
ggaggaggga agctgaagga gctcgggctg ggcataaaag tcagggcaga gccatctatt 540
gcttacattt gcttctggga tccagatctt tcgaagctag cgctaccggt cgccaccatg 600
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 660
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 720
aagctgaccc tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 780
gtgaccaccc tgggctacgg cgtgcagtgc ttcgcccgct accccgacca catgaagcag 840
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 900
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 960
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 1020
ctggagtaca actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc 1080
atcaaggcca acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac 1140
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 1200
ctgagctacc agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg 1260
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc 1320
gacggcgcgc cgcggccgcg aattcgatat cataatcaac ctctggatta caaaatttgt 1380
gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 1440
ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 1500
aaatcctggt tagttcttgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 1560
acaggggctc ggctgttggg cactgacaat tccgtggctc gagagatctt cgactgtgcc 1620
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 1680
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 1740
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 1800
caatagcagg catgagatct cacgtgcgga ccgagcggcc gc 1842
<210> 93
<211> 1973
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2249
<400> 93
gcggccgcac gcgtgctaaa gacaacattg gcctgaaatt caggagacct aagttctaga 60
tcaatctgtg gcatggtctt agaccacaga tgggctttcc tgcctgcatt tacccaaaga 120
gcccaaagag gagaccacat ggggtaccat gggactgacc ttcccagttc aaagcttctt 180
tacacaacgc tgctgaatca cccgctagct cgctctctta tcattccttt tcattcctgg 240
aggtaaaacc aaccttagaa tcgtggagcc tgatagactt tgaaattggc cttcatttta 300
attctcaagt tcttagcatg agagcaacat tcaatatggt tctgaaatat ctcatgcaaa 360
aaagtgccag agtcatagac tgaaatattt atttgaatat aaatgaactc agatttgcca 420
aaatgcgctc cccctgttgt catggacaca gatgcctgcc tttctgattt gcattttgct 480
ctaatgggta taatgtgttt cagctcctca ttggtgctgg gattggattt gagaaactca 540
ccagtccatg agttccccca aaatgtcagc cagtgggaaa cttttgtgtc tttgattctg 600
tttcatctag ccagctggaa acagactgcg agctcgggct gggcataaaa gtcagggcag 660
agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 720
tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 780
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 840
ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 900
ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 960
acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 1020
ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 1080
acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1140
tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 1200
agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1260
agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1320
acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1380
acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1440
acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1500
acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1560
gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1620
cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1680
cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1740
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1800
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 1860
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 1920
gattgggaag acaatagcag gcatgagatc tcacgtgcgg accgagcggc cgc 1973
<210> 94
<211> 2027
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2250
<400> 94
gcggccgcac gcgttgctca gaaactggcc tcgatgctgt cctgctttca ccaattaata 60
atatatgtgg agaccgttct ctactggcat atgtgtgtgc atcacataat tatatgtata 120
tatgcaatcc tttttcttgt tgtcttttag agtcaattct atatatatat tttttattaa 180
gacatttaaa agttccaaag taaaaataac aaaatcaagg atacattgac tcatttttat 240
tttgtgagga agaaattttc catttgtctg tgtaattaca tttgctaatt tctaaaacaa 300
ttcctgggat ttatatctat atatgcctca ggaacataca gggaagatca tactgttctc 360
tgaatttcaa attatgtttt ctgttttatt tcatgaattt attatttttc tttgtctctg 420
tctgtctctc tctgtgtgta tgtgtatgcg tgtatatgca cgcatgtgct gtgcacttgt 480
gtgtatacat ttttttgcac gtgagaagtg tacctacgag gctgtgcctg ggtgtggaag 540
cccagggttg gtggggaaga ccatactcca aggctctcca accttattca gtgaggcagg 600
cagtcacatc tgtctgacat ttctgatcat tacacgtgtg cagtgggtgt tttatccacc 660
gagccacctt cccagccatg gatgagctcg ggctgggcat aaaagtcagg gcagagccat 720
ctattgctta catttgcttc tgggatccag atctttcgaa gctagcgcta ccggtcgcca 780
ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 840
acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 900
acggcaagct gaccctgaag ctgatctgca ccaccggcaa gctgcccgtg ccctggccca 960
ccctcgtgac caccctgggc tacggcgtgc agtgcttcgc ccgctacccc gaccacatga 1020
agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 1080
tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 1140
tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 1200
acaagctgga gtacaactac aacagccaca acgtctatat caccgccgac aagcagaaga 1260
acggcatcaa ggccaacttc aagatccgcc acaacatcga ggacggcggc gtgcagctcg 1320
ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 1380
actacctgag ctaccagtcc aagctgagca aagaccccaa cgagaagcgc gatcacatgg 1440
tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt 1500
aagtcgacgg cgcgccgcgg ccgcgaattc gatatcataa tcaacctctg gattacaaaa 1560
tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 1620
ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 1680
tgtataaatc ctggttagtt cttgccacgg cggaactcat cgccgcctgc cttgcccgct 1740
gctggacagg ggctcggctg ttgggcactg acaattccgt ggctcgagag atcttcgact 1800
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 1860
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 1920
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 1980
gaagacaata gcaggcatga gatctcacgt gcggaccgag cggccgc 2027
<210> 95
<211> 2079
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2251
<400> 95
gcggccgcac gcgttcacaa atcagtaaga attacactcc aaaaataaaa cagggaaggg 60
tattagtatg tgatacgcat ggataaagta gaagaggcca aaaatacaaa gaaccgtaaa 120
ctcactagtg atggaagaaa cgctaattaa aataatgagc tttcctgacc ctttatcaca 180
tgggcacatt ttcaaaggac aagactctgc tgaggagaac acagaacagg atccttcaga 240
caagcttcag caaccaattt taggatgttc ttaaatagat cgattcttct acttttttta 300
aaaataacat agatctgaaa agctttataa cttttggttt ttttttaagg accatattaa 360
cagcatcttc cagtttttct agagtaaatg aatatgtatc ccttttataa ttaacaatat 420
acatatattc attttgtaaa aagactataa aaatagaaga gaaaatgaag agatgtttat 480
ttcttttaca cgcatcagac taaggccttc agctcagcag ggggcagagt ttatcatctg 540
tactctctga agtgtcacac tgccctgcct ttgtgtgccc ttgcctgtcc ctctgtgacg 600
gtcacccttt cggttctggc ttggagcctg gtcatcagtg cctggcggcc tgtgcctggg 660
ctgtgctgag ctcatttggt cgttgtccta gtgatgtgac cctaccttag acttccccat 720
ctcttgaggt ggctagagct cgggctgggc ataaaagtca gggcagagcc atctattgct 780
tacatttgct tctgggatcc agatctttcg aagctagcgc taccggtcgc caccatggtg 840
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 900
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 960
ctgaccctga agctgatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 1020
accaccctgg gctacggcgt gcagtgcttc gcccgctacc ccgaccacat gaagcagcac 1080
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 1140
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 1200
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1260
gagtacaact acaacagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 1320
aaggccaact tcaagatccg ccacaacatc gaggacggcg gcgtgcagct cgccgaccac 1380
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1440
agctaccagt ccaagctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 1500
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgac 1560
ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc tggattacaa aatttgtgaa 1620
agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 1680
atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 1740
tcctggttag ttcttgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 1800
ggggctcggc tgttgggcac tgacaattcc gtggctcgag agatcttcga ctgtgccttc 1860
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 1920
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 1980
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 2040
tagcaggcat gagatctcac gtgcggaccg agcggccgc 2079
<210> 96
<211> 1830
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2252
<400> 96
gcggccgcac gcgtacggat gtcaagttag gcaaaagttt catataaatg tggttaaagt 60
aattctaaag tttgttttta catcacagaa ctgagcaaat gaacaaatgt aatgataaca 120
ttgggagctg attattctga gcaaacagca gagaaatcca aatccagaca gttgggggga 180
aagccacagc tactcagaaa acacactgtg atggaaaaca acctacaggt tattattaga 240
ctaaagagac ataaaattag atatgccact tccagagact ataggttaga cgataatata 300
tgctgagtga agtgccctgt tttggtaact gcagtaaggc tgtgtatcag aatgttccta 360
gctacatatt taggtgtaaa gcagagtgag tcaaaatata ttccagggtt aaaaaaaaaa 420
aaaacaatct ttacttctct tttctttaaa ctaaataatt tcaattattc tcctatgttt 480
agggaggagc tcgggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgggatc cagatctttc gaagctagcg ctaccggtcg ccaccatggt gagcaagggc 600
gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 660
cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 720
aagctgatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 780
ggctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca cgacttcttc 840
aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 900
aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 960
ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 1020
tacaacagcc acaacgtcta tatcaccgcc gacaagcaga agaacggcat caaggccaac 1080
ttcaagatcc gccacaacat cgaggacggc ggcgtgcagc tcgccgacca ctaccagcag 1140
aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagctaccag 1200
tccaagctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 1260
accgccgccg ggatcactct cggcatggac gagctgtaca agtaagtcga cggcgcgccg 1320
cggccgcgaa ttcgatatca taatcaacct ctggattaca aaatttgtga aagattgact 1380
ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 1440
tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggtta 1500
gttcttgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 1560
ctgttgggca ctgacaattc cgtggctcga gagatcttcg actgtgcctt ctagttgcca 1620
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 1680
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 1740
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 1800
tgagatctca cgtgcggacc gagcggccgc 1830
<210> 97
<211> 1733
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2253
<400> 97
gcggccgcac gcgtgactgg aaaaaggtag ctatggcagc ctctgcgcct atattttatc 60
catattctga ttttgttttc caaggtctcc tagtcaatca taatctgaat caatggaaat 120
ttccacggat aaataattca tgagacttga ggaaaatgtg tgctagtcct caatacctta 180
taaaatgtat tattcatttt gaattagatt aaaatgttta aaaaatgcta tctataagac 240
actgtgggag ccaaaaaatt tatacttctt tataaaatcc ttaactgcct ggaaataaac 300
taggtgttaa gagaattgaa gttaaaacac agaaaaataa tcccactctt tcataaactc 360
acaactccca aataatgaga accaaaggtg agctcgggct gggcataaaa gtcagggcag 420
agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 480
tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 540
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 600
ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 660
ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 720
acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 780
ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 840
acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 900
tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 960
agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1020
agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1080
acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1140
acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1200
acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1260
acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1320
gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1380
cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1440
cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1500
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1560
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 1620
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 1680
gattgggaag acaatagcag gcatgagatc tcacgtgcgg accgagcggc cgc 1733
<210> 98
<211> 2145
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2254
<400> 98
gcggccgcac gcgttgactg tgtcatgact ctcagtgtct cttttttcca cggttctggg 60
atcatcattt ctttctcttc agacagtcta gatgagcagc cgagtgctta tctttaaggc 120
tgactctaga cagccagttg ttatttcata aatctgttaa aactcaccgt gcaaacacca 180
gcgttcctta gctgaccatc ctcaagcaca cgtggagtgt gacctctgct tccttctctc 240
atttcacata ttagtaatgt gcgtctatga atagttacaa gtgagaaaga gaaatggaga 300
ttttaccatt taatcatctc cgaagagaag gtgagaagaa attgagaaag gtaatttgca 360
taccatgcat aggcattaga gaaagcattt tttttcttaa ctctccattt gtttacagat 420
atttccatat ggccttttaa aaacttcaac agagaaattc gaacacaact aactggaatt 480
tcaattttca tataaaacca gcatcataga tatatatgta gctactctcc cacttcacat 540
tattcagtta gtatattttc taagctaatt tccaatccat tttaagacta tgtacagctc 600
atatgaggcc cccatatgtt cgttcacgtt actttgcatc cgtttacatg attaaacccc 660
aagaacaaat cgattagaag ccaagagcaa atgcttttgg ctccacatta gaaaactcaa 720
cagagaaacc tttacaagtg atagtcatct gggtaagaga catgcaaaca taattaccat 780
tattcgtgga cttaattccc tgagctcggg ctgggcataa aagtcagggc agagccatct 840
attgcttaca tttgcttctg ggatccagat ctttcgaagc tagcgctacc ggtcgccacc 900
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 960
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 1020
ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 1080
ctcgtgacca ccctgggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 1140
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 1200
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 1260
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 1320
aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 1380
ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 1440
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 1500
tacctgagct accagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 1560
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 1620
gtcgacggcg cgccgcggcc gcgaattcga tatcataatc aacctctgga ttacaaaatt 1680
tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 1740
gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 1800
tataaatcct ggttagttct tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1860
tggacagggg ctcggctgtt gggcactgac aattccgtgg ctcgagagat cttcgactgt 1920
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1980
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 2040
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2100
agacaatagc aggcatgaga tctcacgtgc ggaccgagcg gccgc 2145
<210> 99
<211> 2117
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2255
<400> 99
gcggccgcac gcgtttaact tgaggaaatc tgccacaaga tgttctcaag tgcaaatgtc 60
tcttgatgca tacacgcatg catttctatt taagtatcca acgagaattg tggggttgag 120
gtaggtattt tagcttataa aaaaaaaata ccttatgagc ttattttgga tcatataaaa 180
gtatgagcac ttttagaaca cttttaataa tgcaaatcat ctctgcatca tccaaattta 240
atccatgaac atttagtcat cgttatctta catgagtcat atctgtgtcc ttattgtctt 300
atcttaaatg cattaattaa ttcgatagag catctataaa aatgaaacgc tattcaaaag 360
ctggcccatg acaagatcag tgtgttggtt tctatgccta tagtggtgca atggaaggag 420
tgcgctgtac cccacagact ttgtgattga tgagttgtct actttattca caatgaagct 480
aaaaacaatc taacaaccat cagggtgcta cagcagcaca gaaatgacta gctcttttgt 540
gtcaagttat tgccggttgt cttagtcact gtccgactga tgtgcagaga caccatgact 600
aaggcaacgc ttatcaaaga aagagtctag ttgagagctt gcttgtagtt ccagaggttt 660
gtttagtcta gcatggtggc acacactgtg ctagaacaat attgagagct acaacctgat 720
ctgaaaagca gagagagata gagacagaaa gaggcagaga gacactggcc ctggagctcg 780
ggctgggcat aaaagtcagg gcagagccat ctattgctta catttgcttc tgggatccag 840
atctttcgaa gctagcgcta ccggtcgcca ccatggtgag caagggcgag gagctgttca 900
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 960
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ctgatctgca 1020
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgggc tacggcgtgc 1080
agtgcttcgc ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1140
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1200
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1260
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1320
acgtctatat caccgccgac aagcagaaga acggcatcaa ggccaacttc aagatccgcc 1380
acaacatcga ggacggcggc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 1440
gcgacggccc cgtgctgctg cccgacaacc actacctgag ctaccagtcc aagctgagca 1500
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 1560
tcactctcgg catggacgag ctgtacaagt aagtcgacgg cgcgccgcgg ccgcgaattc 1620
gatatcataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 1680
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 1740
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttagtt cttgccacgg 1800
cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 1860
acaattccgt ggctcgagag atcttcgact gtgccttcta gttgccagcc atctgttgtt 1920
tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1980
taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 2040
gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatga gatctcacgt 2100
gcggaccgag cggccgc 2117
<210> 100
<211> 1763
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2256
<400> 100
gcggccgcac gcgtgctggt gggtgggaag agtttagtaa ctgctcacca atggtgctgt 60
agacattatc agttgcaaga agtgttttaa tttcagagaa attaaaatat gcaaaatatg 120
tgtctctgaa tcaacaaaac atggtgcctc aggtttccgt atctgtgtgg gcctgttttt 180
aggttttctg ttctatctat tcctgggctt ccaccacact gtgttaatga ggataacttt 240
aaaatacatc ttgatattta gtagagcgca tttccacgcc tgattcatca cgagcacctt 300
aacttgtctt ggttcttctg cggagatgtt ggcaccagct tcttcacccg tgactccagc 360
ttctggggaa cctgtgctct cacccctgcc ccgcctgtgc ctgccaggca caccttaatg 420
agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg 480
atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc 540
tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 600
tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga 660
tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg 720
gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 780
ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 840
agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 900
gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 960
gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga 1020
tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc 1080
ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc 1140
tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 1200
ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc 1260
gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 1320
ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 1380
ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg 1440
ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg 1500
gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct 1560
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1620
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1680
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgagatc 1740
tcacgtgcgg accgagcggc cgc 1763
<210> 101
<211> 2005
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2315
<400> 101
gcggccgcac gcgtagtttt ggaaaaacac catactggtt attttcaaat aactctattt 60
cacaacagta tactagaatt ttatgctaaa atctttctgt gactttgtgt tcactgatca 120
acaattcctc ttttatgata gcctatgctg tctaccatct attccaaact tttatgagat 180
cagtaatttt agattatgaa tgagtttgat catatagtac atacttttgt gtctgctatt 240
gcatttacat agtgacatag gcttacagga tattgtaaat gtcatcccta gatacattta 300
tgtaaccttt ttttaaaata aaactctaac aaatgttagt tattgtgcac tatggttttg 360
aatatttgaa tttgctttgc tcagatctaa ataacttctg ataagtttgg cattcaggaa 420
agagtaaatg taaatgtaga aatgcttgga atataaaaca agtaattttt gtgataattt 480
ttctgaaaat gctaatgtat attttcagca ggcctccttt cttgtttaga acagtatatt 540
tcttagcttt aattagtact tactttatat atctatgcat ccatttatag ttcagcatta 600
gattgaatat gtatgcatgt atgtatgatt tatttatatt tttgtctccc agtccacacc 660
cgagctcggg ctgggcataa aagtcagggc agagccatct attgcttaca tttgcttctg 720
ggatccagat ctttcgaagc tagcgctacc ggtcgccacc atggtgagca agggcgagga 780
gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 840
gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagct 900
gatctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgggcta 960
cggcgtgcag tgcttcgccc gctaccccga ccacatgaag cagcacgact tcttcaagtc 1020
cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 1080
caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 1140
gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 1200
cagccacaac gtctatatca ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa 1260
gatccgccac aacatcgagg acggcggcgt gcagctcgcc gaccactacc agcagaacac 1320
ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagct accagtccaa 1380
gctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 1440
cgccgggatc actctcggca tggacgagct gtacaagtaa gtcgacggcg cgccgcggcc 1500
gcgaattcga tatcataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 1560
tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 1620
tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttagttct 1680
tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 1740
gggcactgac aattccgtgg ctcgagagat cttcgactgt gccttctagt tgccagccat 1800
ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc 1860
tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg 1920
ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgaga 1980
tctcacgtgc ggaccgagcg gccgc 2005
<210> 102
<211> 2036
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2423
<400> 102
gcggccgcac gcgtgggaga tataaacaag aagaaacagg actgaataaa tgtgtgcaga 60
aggatcctgt agcagcgtcg ttcttcctgg ccagttgagc gcgcgcagca cttaagattg 120
gtgctcatcc atgcctattc attcttgtga tgtgttgtgt tagatattat tggtaattat 180
tacttagaga ggtggcaaag tagtgaatag gtggaaaggc actgagacca tattgtcacc 240
gcagctttgg aaaagacctt cttattttaa cttatgtaat taaccatccc aaatttaccc 300
tgatcctcac tggaaatgtc ttccctttcc tgatatttac cacagtttta aaaagtctta 360
gatgggtatg catatttgag aaatacgtag agttaattag tgcgtagatg tgtttttaag 420
ttgcataaaa catattgtgc tttggcatag ctccctttgt aacttatttt aggaaaccaa 480
gtttgatttt gacaacagca ttagaagtaa agtgtgtgaa gatgatttag aatccatgaa 540
tatccacatt gctgaatata atccttcctg gctacagagc tcctatttct gctcctgtaa 600
gcagccattc acccacactt cttaaagtaa ccccaataaa ctcactcatt aagttagatt 660
ttggcagtgt ccttctttga tctgttgtcc gtgagctcgg gctgggcata aaagtcaggg 720
cagagccatc tattgcttac atttgcttct gggatccaga tctttcgaag ctagcgctac 780
cggtcgccac catggtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 840
tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 900
atgccaccta cggcaagctg accctgaagc tgatctgcac caccggcaag ctgcccgtgc 960
cctggcccac cctcgtgacc accctgggct acggcgtgca gtgcttcgcc cgctaccccg 1020
accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 1080
gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 1140
gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 1200
tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc accgccgaca 1260
agcagaagaa cggcatcaag gccaacttca agatccgcca caacatcgag gacggcggcg 1320
tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 1380
ccgacaacca ctacctgagc taccagtcca agctgagcaa agaccccaac gagaagcgcg 1440
atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 1500
tgtacaagta agtcgacggc gcgccgcggc cgcgaattcg atatcataat caacctctgg 1560
attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 1620
gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 1680
tctcctcctt gtataaatcc tggttagttc ttgccacggc ggaactcatc gccgcctgcc 1740
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gctcgagaga 1800
tcttcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 1860
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 1920
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 1980
gaggattggg aagacaatag caggcatgag atctcacgtg cggaccgagc ggccgc 2036
<210> 103
<211> 1991
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2424
<400> 103
gcggccgcac gcgttttgct tgtgtgccag cagggaggag caagaggaat tttgtcactt 60
ctctttcact ttcttcatta ttttaagttg gatctgctgt tctgttcact tttaaaatat 120
aaccttcagt atttatgaac gtgattcatc ttttacaata tgttgtttaa catgaatgca 180
tcttcttctt gcctttcagt gcatctttat gccattggca gccacaatca agtgtttcca 240
ttaaagttca cagtaacagt gcagtgttgt ctgtcccaac tctgctaact tttaccaccc 300
actatttagt tttatctacc atgtgaattt atttgtaaga tcttctttct cttatcctag 360
ttaattatgg ggaggacttg ccaggatatt aatttacatg gcaattttgg ataagttatg 420
catgtattca tctcctatat acaataagtt tttcttgtga acgtcaaaag aaaggataat 480
gcatatgact gtatatgata taaactggaa tgtaatagtt gccaatagga tctgaatcaa 540
atttcagttt ttaactatgt tctatatatc tatgtgcata tttatagcat gtgtgacata 600
tgtataattt aaatatttct ataaacttat acagaaacaa aatatgtgag ctcgggctgg 660
gcataaaagt cagggcagag ccatctattg cttacatttg cttctgggat ccagatcttt 720
cgaagctagc gctaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg 780
tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 840
gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc tgcaccaccg 900
gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc gtgcagtgct 960
tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 1020
gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 1080
aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 1140
aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 1200
atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaaca 1260
tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 1320
gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg agcaaagacc 1380
ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 1440
tcggcatgga cgagctgtac aagtaagtcg acggcgcgcc gcggccgcga attcgatatc 1500
ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 1560
ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 1620
gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 1680
tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 1740
ccgtggctcg agagatcttc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 1800
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 1860
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 1920
caggacagca agggggagga ttgggaagac aatagcaggc atgagatctc acgtgcggac 1980
cgagcggccg c 1991
<210> 104
<211> 1959
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2690
<400> 104
gcggccgcac gcgtctgaag ttctgggggc agaccgcaat tgctgccaca gagcccctcc 60
tggcaggtgc agcccacagg aagaccagca ccctggccac agagacaaaa ggtcttattg 120
acttgcagta aaaatgtcct tataacctgt ccagaacaaa aggggaggat aaggttcaac 180
cagacaccga attcagggag acagcatcag tcagagcttt accactgcca gcaattttga 240
agctgcccat atttctgctc aggcaagatg ttttcttgct ctgaaacctt ttagcagatg 300
caaggtattg ctccgggtgt atcccagaac acaagtcttt gctaaagtgg gtagacagcc 360
actttccttc agagccaggg actgccctgg gagtaaaacc atttggagag cattttatat 420
ttgcaaaatg ttgctgtgac atgttatcat ttattccttt caacagcgca gtgagattgg 480
agagcatcct ccgatgcact gtacatttgg gaggaagaga aaggataaga gccctgctga 540
ttcagtggtg gtcattatca ttgtcaatgg agctgtcact gttatcgtca ttttcgtttg 600
cggtgaggta tgtgagagct cgggctgggc ataaaagtca gggcagagcc atctattgct 660
tacatttgct tctgggatcc agatctttcg aagctagcgc taccggtcgc caccatggtg 720
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 780
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 840
ctgaccctga agctgatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 900
accaccctgg gctacggcgt gcagtgcttc gcccgctacc ccgaccacat gaagcagcac 960
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 1020
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 1080
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1140
gagtacaact acaacagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc 1200
aaggccaact tcaagatccg ccacaacatc gaggacggcg gcgtgcagct cgccgaccac 1260
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1320
agctaccagt ccaagctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 1380
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgac 1440
ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc tggattacaa aatttgtgaa 1500
agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 1560
atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 1620
tcctggttag ttcttgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 1680
ggggctcggc tgttgggcac tgacaattcc gtggctcgag agatcttcga ctgtgccttc 1740
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 1800
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 1860
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 1920
tagcaggcat gagatctcac gtgcggaccg agcggccgc 1959
<210> 105
<211> 1876
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2695
<400> 105
gcggccgcac gcgtagaaag caagagcaaa gggcaggtct tccaggagag acagacagac 60
aaagaaaaag caagggaggt ggagagtgtg tgagagaggg agtgagaaag ggctcagcca 120
tttgtctggg caggtctgcg gaactcaaat ccggctcatc tgcatctcct caaataaact 180
tctgggaagt gaatgcctga agcaggcaga gtgcagagaa gtcagcaaat atgtgcgtag 240
tgaattccaa gccttctgtt cccagctcct gggaggggcc gcagtgcctt ggggtgtcct 300
gccgtgtctc catcgggtcc cctgcctggc tgctctaacc ctgaggaatg gcctccattg 360
tgggcctgtg gaaacaggga gaagaatctc ttatccagca ggtctgaggg ccacaggaac 420
ataagtaaca ctgaagagtg aggctgatcc ctggggtttg cgcgagcctg caaatgcatg 480
attcaacagc actcgcctgg tgcctctggg aggcaagctg gatgaggatg ttgagctcgg 540
gctgggcata aaagtcaggg cagagccatc tattgcttac atttgcttct gggatccaga 600
tctttcgaag ctagcgctac cggtcgccac catggtgagc aagggcgagg agctgttcac 660
cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 720
gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagc tgatctgcac 780
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgggct acggcgtgca 840
gtgcttcgcc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 900
cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 960
cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 1020
cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 1080
cgtctatatc accgccgaca agcagaagaa cggcatcaag gccaacttca agatccgcca 1140
caacatcgag gacggcggcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 1200
cgacggcccc gtgctgctgc ccgacaacca ctacctgagc taccagtcca agctgagcaa 1260
agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 1320
cactctcggc atggacgagc tgtacaagta agtcgacggc gcgccgcggc cgcgaattcg 1380
atatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 1440
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 1500
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttagttc ttgccacggc 1560
ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 1620
caattccgtg gctcgagaga tcttcgactg tgccttctag ttgccagcca tctgttgttt 1680
gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 1740
aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 1800
tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgag atctcacgtg 1860
cggaccgagc ggccgc 1876
<210> 106
<211> 1971
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2691
<400> 106
gcggccgcac gcgtagaaat ccccttccct accttttatc tatcaatcat atctatctat 60
atcccccaaa acttagctga tactaacaat ttaaggatcc ccaatcccaa agcatttaga 120
ttttaagaca aataaaacag ttggaatcct ggtcccatgg aatttcagag ttgggagaaa 180
gtgaagagat ttcctggcta acccctgcag ttaacagatg gcaaaaagaa gtacagagaa 240
ttgtctgaag tcccagagca agggagtgga agcgcggccg caacgaggca tgcataagat 300
tctgcagaaa ccacgttctc ccgcttcaca gcggtctgct cttttcagga gagcctggga 360
aaacttctga ctgtgcaatt tgcttaaaaa caacagagaa acatcataga agaggatcaa 420
ttcctgacca tgcatttgaa attagacact tacaggcatt ccctgcagag tgctctccac 480
tggggcccag tggaagcagc atcacccatc agccgctggg ggtggctggt gccaccaggt 540
caggcctgga gcggggcagg agtctcctca ggctcgatgc tcttgacctg ctgctggtgc 600
caagagttag aagcaaagca cccaccagag ctcgggctgg gcataaaagt cagggcagag 660
ccatctattg cttacatttg cttctgggat ccagatcttt cgaagctagc gctaccggtc 720
gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 780
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 840
acctacggca agctgaccct gaagctgatc tgcaccaccg gcaagctgcc cgtgccctgg 900
cccaccctcg tgaccaccct gggctacggc gtgcagtgct tcgcccgcta ccccgaccac 960
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 1020
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 1080
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 1140
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcaccgc cgacaagcag 1200
aagaacggca tcaaggccaa cttcaagatc cgccacaaca tcgaggacgg cggcgtgcag 1260
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 1320
aaccactacc tgagctacca gtccaagctg agcaaagacc ccaacgagaa gcgcgatcac 1380
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 1440
aagtaagtcg acggcgcgcc gcggccgcga attcgatatc ataatcaacc tctggattac 1500
aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 1560
tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 1620
tccttgtata aatcctggtt agttcttgcc acggcggaac tcatcgccgc ctgccttgcc 1680
cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggctcg agagatcttc 1740
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 1800
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 1860
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 1920
ttgggaagac aatagcaggc atgagatctc acgtgcggac cgagcggccg c 1971
<210> 107
<211> 1764
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2692
<400> 107
gcggccgcac gcgtttcctt ggaacactat ttggcatata tgcatatttt ggggctcagt 60
gtctttcatc gttatgttta tggttataat gaccacatct ctcacccatt agctgtgtgg 120
cttttgaggt cagtaagcta ttcttcccag agtgcttgac atagggcctg cggcatggta 180
aatacccaca gtttttgagt ttcctgtggg ttgagcattt agaatcatct gtttgtttaa 240
tcaggacata tttctccagt accttcaggg gtcccagtac tatgtttagg aacttagcca 300
tcacttgcac agtaaacagt atctgtggat tttgtcattc aacaaacact gccattgttc 360
agtcactcaa caaacgctgt tacggcatcc accctgggga aagaagggtc tcttggcaga 420
gagctcgggc tgggcataaa agtcagggca gagccatcta ttgcttacat ttgcttctgg 480
gatccagatc tttcgaagct agcgctaccg gtcgccacca tggtgagcaa gggcgaggag 540
ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 600
ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagctg 660
atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgggctac 720
ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 780
gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 840
aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 900
ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 960
agccacaacg tctatatcac cgccgacaag cagaagaacg gcatcaaggc caacttcaag 1020
atccgccaca acatcgagga cggcggcgtg cagctcgccg accactacca gcagaacacc 1080
cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcta ccagtccaag 1140
ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 1200
gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc gccgcggccg 1260
cgaattcgat atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 1320
cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 1380
gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttagttctt 1440
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 1500
ggcactgaca attccgtggc tcgagagatc ttcgactgtg ccttctagtt gccagccatc 1560
tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 1620
ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 1680
gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgagat 1740
ctcacgtgcg gaccgagcgg ccgc 1764
<210> 108
<211> 1693
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2944
<400> 108
gcggccgcac gcgttccatc tttctgactt tagggccatt tttagaatgg cctttgttac 60
cccaagatta cataaatatt cacccaaact tcctccagta cttttatggt ttccttcaca 120
ggatttaatt cttaaatcca tctggaatgt atttctgaaa aaaaaaaaaa aagtaaaata 180
gtgccagcta ttttgcttca gagccaatgt ttcctaagtt gaaaacttta gctatattca 240
gttgtgtgat gtcattaaag ataataagat ttgggaccag attctgagtt cagttgcact 300
ctctgtatag ggtatagaaa atcattcaac tttctgagaa atgtgcagag agctcgggct 360
gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg atccagatct 420
ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg 480
ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc 540
cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga tctgcaccac 600
cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg 660
cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga 720
aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc 780
cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt 840
caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt 900
ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga tccgccacaa 960
catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga 1020
cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc tgagcaaaga 1080
ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac 1140
tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc gaattcgata 1200
tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 1260
tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 1320
ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg ccacggcgga 1380
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 1440
ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct gttgtttgcc 1500
cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 1560
atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 1620
ggcaggacag caagggggag gattgggaag acaatagcag gcatgagatc tcacgtgcgg 1680
accgagcggc cgc 1693
<210> 109
<211> 1662
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2886
<400> 109
gcggccgcac gcgtacacac acacacacac acacacacaa ataaaaacaa aaacaactct 60
taaaaaccta agaaagggat aaatacaaca tcaaagactg ttggggttat aaaacataca 120
catttataga catttccaag atgctactaa aattacatac aaatgagtat ccaaaatgtc 180
acagaacaaa ttattcttgt gcaacataaa caactagaga gcatagcaaa ggaagcccag 240
accatgagct ttcccgatct gcttcccaag ctaacatatg ttggcatcca atcctgaaaa 300
ctacagaaga catgaggtga gctcgggctg ggcataaaag tcagggcaga gccatctatt 360
gcttacattt gcttctggga tccagatctt tcgaagctag cgctaccggt cgccaccatg 420
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 480
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 540
aagctgaccc tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 600
gtgaccaccc tgggctacgg cgtgcagtgc ttcgcccgct accccgacca catgaagcag 660
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 720
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 780
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 840
ctggagtaca actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc 900
atcaaggcca acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac 960
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 1020
ctgagctacc agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg 1080
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc 1140
gacggcgcgc cgcggccgcg aattcgatat cataatcaac ctctggatta caaaatttgt 1200
gaaagattga ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct 1260
ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat 1320
aaatcctggt tagttcttgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 1380
acaggggctc ggctgttggg cactgacaat tccgtggctc gagagatctt cgactgtgcc 1440
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 1500
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 1560
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 1620
caatagcagg catgagatct cacgtgcgga ccgagcggcc gc 1662
<210> 110
<211> 1882
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2755
<400> 110
gcggccgcac gcgttttcca gcactgcagg agtcttcagt atgaagtaga accagttggg 60
tgacggggca gacactggag acagacagaa aaggttctaa tatccatgtt ctgtttgatt 120
ttggaaggat gctgaatgct aatcagcttt cttattttaa gaaagactat cttaaattat 180
tatacttgcc tcatatgatt tggaggatga ttgcatgctg ttccctcagc aaacaggagc 240
ttagaaaagt ttttgaataa tttcacaaaa ggccccaaag tattctcagt atgaagatgg 300
aaattgggct gagtcatctt atctagagga agtatcagaa aacttcgttg aaatagtttt 360
gagtaggcct ttggcacaga agaagccatg tggatcagaa gtgaaaaaaa tgacgcttgc 420
caatgcttgc ggtgagatct gacatagagt ggccatcttt cgggatgcag tgttagaatg 480
tgtagtagaa aataaggtgg aagagacgtg ttcggttcca tctcaagatt tgggggcaga 540
gctcgggctg ggcataaaag tcagggcaga gccatctatt gcttacattt gcttctggga 600
tccagatctt tcgaagctag cgctaccggt cgccaccatg gtgagcaagg gcgaggagct 660
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 720
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagctgat 780
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgggctacgg 840
cgtgcagtgc ttcgcccgct accccgacca catgaagcag cacgacttct tcaagtccgc 900
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 960
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1020
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1080
ccacaacgtc tatatcaccg ccgacaagca gaagaacggc atcaaggcca acttcaagat 1140
ccgccacaac atcgaggacg gcggcgtgca gctcgccgac cactaccagc agaacacccc 1200
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagctacc agtccaagct 1260
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1320
cgggatcact ctcggcatgg acgagctgta caagtaagtc gacggcgcgc cgcggccgcg 1380
aattcgatat cataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 1440
taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 1500
tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tagttcttgc 1560
cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg 1620
cactgacaat tccgtggctc gagagatctt cgactgtgcc ttctagttgc cagccatctg 1680
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 1740
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 1800
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgagatct 1860
cacgtgcgga ccgagcggcc gc 1882
<210> 111
<400> 111
000
<210> 112
<211> 2058
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2938
<400> 112
gcggccgcac gcgttgcatg gattctaagt tcctaagagg aattcagaaa ataccaattt 60
ttatttagca tataagataa tgtcttccat cataacattc acaatcacac acaaacatac 120
acacacacac acatcatact tcattcatat tcactgtatt actatcgtct gctaatcttg 180
ccaactctta cactgagaac ctttcttgac ttaaattatg gatatgagag acactgtgat 240
atttgttttt ctccacctac ctctgctttt atataaggca tattccatgc atgctaatga 300
tattggagca caatgtttat gcatgtataa tcatatattt ctttcctgtg cctgtgaaat 360
catagttata actaaatttc tttctcttat gattccataa aaaattctca ggaatataaa 420
gtatatataa gccaaaattc tataaaatta ataaattatg atgatcagaa aggtacaaca 480
atgtctttca gaagtctata atgacttttg acccagcatg ttcatgccct acatgctgtt 540
agtgaaatta actttccaat tcaaattagt acattgagtt gattgaacat atttcatcgt 600
tcacattgac tcacactgtg ggattcttat aaaagacaat ttcccttaaa tataaccagc 660
ttttagtttt ttcatgaaag ccagtccctt gttactagtg tatttagatg catcgagctc 720
gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt ctgggatcca 780
gatctttcga agctagcgct accggtcgcc accatggtga gcaagggcga ggagctgttc 840
accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 900
gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc 960
accaccggca agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcgtg 1020
cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 1080
cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 1140
cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 1200
gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 1260
aacgtctata tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc 1320
cacaacatcg aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc 1380
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gctaccagtc caagctgagc 1440
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 1500
atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt 1560
cgatatcata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 1620
tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 1680
gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttagt tcttgccacg 1740
gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact 1800
gacaattccg tggctcgaga gatcttcgac tgtgccttct agttgccagc catctgttgt 1860
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 1920
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 1980
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg agatctcacg 2040
tgcggaccga gcggccgc 2058
<210> 113
<211> 1998
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2239
<400> 113
gcggccgcac gcgtctgtgt ctcaggccag aagattttct atattggctg gagcttctgt 60
gggatgcagg cagtggatga gaagggaaac gacagcaaat agaggaagca caagtctctg 120
gcctcagtgt tgggtgcaca caaagcaaat gggagaagga ggagaggggc tcccttcccc 180
tgccccaagg cccagccagg caggccccca gcagcctggc tgtctccctc ccttgcgggc 240
tggagctgcc tctccgcctc tgcccgcctg atcggggcag agctcggctt catgtattat 300
taatagcact gccagccttc ctgttttcac gctgataacc tgcaggggag ggctggtggg 360
agggagggag caaggtggca aaccctggag cttctagggt ccctcccccc tcagtagagc 420
agctctgcgg gggttggccc caagtctcta aagttggttt ctagagcctc ccccatccaa 480
gcccacggga agggaccagg gcctcctaaa gggaaatcac atgggaggtt ggaacgtggg 540
gtctgggaag ggccctgtta ctcaatccat ctaggacacc aatggctcaa gtcaccttgg 600
ccctccccag aggcagaagt gcccatgtct agggcacatg gggctcagag ctgagagctc 660
gggctgggca taaaagtcag ggcagagcca tctattgctt acatttgctt ctgggatcca 720
gatctttcga agctagcgct accggtcgcc accatggtga gcaagggcga ggagctgttc 780
accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 840
gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc 900
accaccggca agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcgtg 960
cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 1020
cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 1080
cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 1140
gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 1200
aacgtctata tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc 1260
cacaacatcg aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc 1320
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gctaccagtc caagctgagc 1380
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 1440
atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt 1500
cgatatcata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 1560
tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 1620
gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttagt tcttgccacg 1680
gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact 1740
gacaattccg tggctcgaga gatcttcgac tgtgccttct agttgccagc catctgttgt 1800
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 1860
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 1920
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg agatctcacg 1980
tgcggaccga gcggccgc 1998
<210> 114
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2410
<400> 114
gcggccgcac gcgtatgtgc atacctgcct ctgagaagga ccaaagtcag atgcactctc 60
aatgtaaggg cttgggggtg gaacacctca agttccacac acaccccaat ctcctacagg 120
agtttccttt agaggacctg tctcctccaa ggggctctgt tagaccaagt gggaaagtct 180
ctaggaactg acttcagagg tttggggctg tgccagtccc gcggcgcact ctgccacgga 240
ggagacctgg agctcctggg ttggccacct tgctccctgc ctcctcccac ctcctcccca 300
gcaggttatc agcatgaaaa caggaaggct ggcagtgcta ttaataaaac atgaagcaga 360
gatctgcccc atcaggcagc ggaggcaggc ggcagctcgg cagccccgag ggagggagag 420
aacccccgca tctgggcctg ggcaggggta ttctcttctc acagatgcca caccccagga 480
gccacctcca ttttgcggga ctgctgtgag ctcgggctgg gcataaaagt cagggcagag 540
ccatctattg cttacatttg cttctgggat ccagatcttt cgaagctagc gctaccggtc 600
gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 660
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 720
acctacggca agctgaccct gaagctgatc tgcaccaccg gcaagctgcc cgtgccctgg 780
cccaccctcg tgaccaccct gggctacggc gtgcagtgct tcgcccgcta ccccgaccac 840
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 900
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 960
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 1020
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcaccgc cgacaagcag 1080
aagaacggca tcaaggccaa cttcaagatc cgccacaaca tcgaggacgg cggcgtgcag 1140
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 1200
aaccactacc tgagctacca gtccaagctg agcaaagacc ccaacgagaa gcgcgatcac 1260
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 1320
aagtaagtcg acggcgcgcc gcggccgcga attcgatatc ataatcaacc tctggattac 1380
aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 1440
tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 1500
tccttgtata aatcctggtt agttcttgcc acggcggaac tcatcgccgc ctgccttgcc 1560
cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggctcg agagatcttc 1620
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 1680
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 1740
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 1800
ttgggaagac aatagcaggc atgagatctc acgtgcggac cgagcggccg c 1851
<210> 115
<211> 1824
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2411
<400> 115
gcggccgcac gcgtagctaa cctaccagtc ccaccgtgat atctggatgc tgatataaag 60
gagaatgtat caaataatgt aatgcttgga agttatttga atctgttatt cttaagagca 120
cactgatatt actcattgtg tgaggcacac aaaaaagatc agaacacaaa ggcatatttg 180
tgctgtgtgt ccaacactga ggggcgggag gaggtaatac ttttttggaa aagacaggaa 240
agaatgaaaa tagatggttt gtaaagatag taagcttgtg ggtggctttt tatttccata 300
atcatggtat tatgtttttg tataatttta agaaaaactt atgttaatca gaaactttga 360
ataacacctt aacaaaaatg tgctgcacac cgcagccatc ccagagaagc taacactcaa 420
gatgtcctgt tcaggcttcg cgcatttgag tccagggaag atgtctctcg ttggcaccaa 480
gagctcgggc tgggcataaa agtcagggca gagccatcta ttgcttacat ttgcttctgg 540
gatccagatc tttcgaagct agcgctaccg gtcgccacca tggtgagcaa gggcgaggag 600
ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 660
ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagctg 720
atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgggctac 780
ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 840
gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 900
aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 960
ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 1020
agccacaacg tctatatcac cgccgacaag cagaagaacg gcatcaaggc caacttcaag 1080
atccgccaca acatcgagga cggcggcgtg cagctcgccg accactacca gcagaacacc 1140
cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcta ccagtccaag 1200
ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 1260
gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc gccgcggccg 1320
cgaattcgat atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 1380
cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 1440
gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttagttctt 1500
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 1560
ggcactgaca attccgtggc tcgagagatc ttcgactgtg ccttctagtt gccagccatc 1620
tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 1680
ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 1740
gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgagat 1800
ctcacgtgcg gaccgagcgg ccgc 1824
<210> 116
<211> 1787
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2412
<400> 116
gcggccgcac gcgttgctca gggtctgcaa actttttctt atggttagta caagaagaat 60
gcataaacat cacaaaccaa agtacttctt tcaaccaatc aaacaaatta tatacagggt 120
aacacacaaa atcaaactga gcaaatctag ccaatgggtc ccatatgcca catttttcat 180
ttccttattc cagccctcag gaatgtaggt gtttgctctg agtaggccta ccatagtatg 240
taattctgct atcttatgca ccgataattt ttcttggttc aggagtgttt gatgtatgct 300
ccatagttgt ctctcattgt gctctgctgt ctcattgatt tctctaaggt tttaacaaat 360
ttatccatgt ggtttttctc taatttgaaa tcaaattgca tgtcagacaa gaagtaatat 420
ttttgttggt agtgtactgt ggtgagctcg ggctgggcat aaaagtcagg gcagagccat 480
ctattgctta catttgcttc tgggatccag atctttcgaa gctagcgcta ccggtcgcca 540
ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 600
acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 660
acggcaagct gaccctgaag ctgatctgca ccaccggcaa gctgcccgtg ccctggccca 720
ccctcgtgac caccctgggc tacggcgtgc agtgcttcgc ccgctacccc gaccacatga 780
agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 840
tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 900
tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 960
acaagctgga gtacaactac aacagccaca acgtctatat caccgccgac aagcagaaga 1020
acggcatcaa ggccaacttc aagatccgcc acaacatcga ggacggcggc gtgcagctcg 1080
ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 1140
actacctgag ctaccagtcc aagctgagca aagaccccaa cgagaagcgc gatcacatgg 1200
tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt 1260
aagtcgacgg cgcgccgcgg ccgcgaattc gatatcataa tcaacctctg gattacaaaa 1320
tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 1380
ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 1440
tgtataaatc ctggttagtt cttgccacgg cggaactcat cgccgcctgc cttgcccgct 1500
gctggacagg ggctcggctg ttgggcactg acaattccgt ggctcgagag atcttcgact 1560
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 1620
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 1680
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 1740
gaagacaata gcaggcatga gatctcacgt gcggaccgag cggccgc 1787
<210> 117
<211> 1991
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2963
<220>
<221> misc_feature
<222> (267)..(267)
<223> n is a, c, g, or t
<400> 117
gcggccgcac gcgttctaac catgtgtgtt tcctttgaaa taattctata tactcctttt 60
aatgaattta cattaaatca atagcttgta ttgacaacta tattatcatc aaagcataaa 120
caaaactttc tttgattcct tgcttcagaa ggcttgatca tttgtttccc agggaaatgg 180
aatataggta aggacaaagc tatttaaaca caattctctc ttttaatgca aactattaca 240
tcatgcagtt tatttatatt atgaatncaa aatcagggat gacatatata acatatggac 300
atgaatatta ctctttagat ttcatattaa acttatcagt ttttttttat ctcaaagcat 360
ggaatcaaat tcaagacaca gatggacaca acataagttt ggaatggctt ttaaatattt 420
ttacaggaat ttttccattt tggcaaagta tttagtatat agtgagttgc ttctatgatt 480
atattagatg tgtttttgaa gaatgttgtt ttgctaaatt attctaacgc tcaatttaca 540
ttctgaacat tttcaatctg agcgcgcaga gagggagtgg ccaactccat cactaggggt 600
tcctgcggcc gcacgcgttc taaccatgtg tgtttctctt ttggactgag ctcgggctgg 660
gcataaaagt cagggcagag ccatctattg cttacatttg cttctgggat ccagatcttt 720
cgaagctagc gctaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg 780
tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 840
gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc tgcaccaccg 900
gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc gtgcagtgct 960
tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 1020
gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 1080
aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 1140
aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 1200
atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaaca 1260
tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 1320
gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg agcaaagacc 1380
ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 1440
tcggcatgga cgagctgtac aagtaagtcg acggcgcgcc gcggccgcga attcgatatc 1500
ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 1560
ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 1620
gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 1680
tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 1740
ccgtggctcg agagatcttc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 1800
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 1860
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 1920
caggacagca agggggagga ttgggaagac aatagcaggc atgagatctc acgtgcggac 1980
cgagcggccg c 1991
<210> 118
<211> 1798
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2623
<400> 118
gcggccgcac gcgtaacatg tatttgtgga gtggctaaat tgagatatat caccttaaaa 60
tcaactccca gcaatttgaa gagcacagta agtaagacct tgttcctaac cacagtcgcc 120
atgcagtgca gtagagccca gatcttacac ttcctgtgta actggagtct tgtgttcttt 180
agccaagctc ttcccacatg cgagtcattt tcaattcaaa atactagtta ttttcagttt 240
aagaatcagt ctgatttctt gagcatagtg cttatcttat atggtatggc tttcagctcc 300
ctggagattt cctgggtgtg ctgctgtgcc tttgcctcca ggataaatgc catgctgaga 360
agagcatgac tctgtcagca caggcagacg gtggaaactt tacctctgcg acctctctgc 420
agcctcaggg tagcagggga tggcatggtt tcatgagctc gggctgggca taaaagtcag 480
ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga agctagcgct 540
accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 600
ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 660
cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca agctgcccgt 720
gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc 780
cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 840
gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 900
gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 960
catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcaccgccga 1020
caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg aggacggcgg 1080
cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 1140
gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca acgagaagcg 1200
cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 1260
gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata atcaacctct 1320
ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 1380
atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 1440
tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca tcgccgcctg 1500
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggctcgaga 1560
gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1620
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1680
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 1740
gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga gcggccgc 1798
<210> 119
<211> 1833
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2624
<400> 119
gcggccgcac gcgttgtatg cctaaagggt ttgcttctat gttaattccc aacaacaatc 60
atgatacttc cttacttctg caggactagg ctggctcact agtgaggttt tctccaagga 120
tgtgctccaa tatctgctcc acaatactta aatagcttca caatacataa atatttaagt 180
actcctctgt aaggagcgtt ctgtttccat atgtcaaggc agaatcttca cataaagcat 240
gcattttgct ccctgttttc aatggtttta ctctgtagag tttctcaaat taattcaata 300
cccactttaa attaaatgga aactttaatg ctatggtttg ctgtgccatt tagattttat 360
gtgttgagat gcaattccaa ctctacttgg cacgaagtat agacactgaa tccaactatg 420
atgtataagc aagggtcctt gtgaggtagg taatgagaat ggagcctgga acgtgtaaca 480
ctggtgactg agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt 540
tgcttctggg atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag 600
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 660
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 720
ctgaagctga tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 780
ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc 840
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 900
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 960
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1020
aactacaaca gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc 1080
aacttcaaga tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag 1140
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac 1200
cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1260
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg 1320
ccgcggccgc gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg 1380
actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 1440
ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 1500
ttagttcttg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1560
cggctgttgg gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg 1620
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1680
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1740
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1800
gcatgagatc tcacgtgcgg accgagcggc cgc 1833
<210> 120
<211> 1905
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2601
<400> 120
gcggccgcac gcgttgcaga ttataattct atggaaactg actgttttaa acataaattt 60
tagacctctt ctcaaggtgt ggcaatcctc aacagcttct ggtatgcata gaccacattt 120
gtattcacca ttaatgcata agaaaaacat tttggttgcc agtttggagc taaattgata 180
aatctgctac aagcatttgt gcatgagttt gtgtgtaaat atgcttttta cttacttagg 240
atgaatatac aaggatagca ttgttatatt gcttgacatt tgcatattca attttataga 300
gaatgcacag caattttggt atctgtctgt accctttcat attttatgct caacatttga 360
gtcacttggt ttcttggcat cattatgaat ttttaatggt cttactttta aaaaatatgc 420
tttaactcat cttagaatta tatcacattt ccccttccag tctctcctag acatccctcc 480
ctcaaacagc ccttgtgtgc tcctgccttc agttcatagc ctgttttact ttattattat 540
tattgctctc tgtgtgtgca cgagctcggg ctgggcataa aagtcagggc agagccatct 600
attgcttaca tttgcttctg ggatccagat ctttcgaagc tagcgctacc ggtcgccacc 660
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 720
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 780
ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 840
ctcgtgacca ccctgggcta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 900
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 960
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 1020
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 1080
aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 1140
ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 1200
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 1260
tacctgagct accagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 1320
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 1380
gtcgacggcg cgccgcggcc gcgaattcga tatcataatc aacctctgga ttacaaaatt 1440
tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 1500
gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 1560
tataaatcct ggttagttct tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1620
tggacagggg ctcggctgtt gggcactgac aattccgtgg ctcgagagat cttcgactgt 1680
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1740
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 1800
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 1860
agacaatagc aggcatgaga tctcacgtgc ggaccgagcg gccgc 1905
<210> 121
<400> 121
000
<210> 122
<211> 1979
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2843
<400> 122
gcggccgcac gcgtgcttct gaatacctcc acgcatacac tcacttaaat tataaataaa 60
cctgaaaagc aatgtagcaa aaatgaaaga gatttctgcc accagcttct ataattatgt 120
aatcataatg ttttgaaagt taaactcccc ttttcaacaa gaaaattata atatatatgc 180
atatatgcat atatattcac acacataaca tatatttata aatcaattta aactgccttt 240
gtgcagtgta ctaggcaaaa gtaatgtatg tatctatctc tgtgaatgcc ctctaattct 300
ggaaataaat aatgggacat ctcagtattt tcaagaagtc tgtaagccac aaataggctt 360
atgcctattg ttctgtcata attattaatg gtctagtact tggtctcaag catgtctggt 420
atggatgata aaactaagag tccaaaaata ggtcccctgt gatcactatc aggaaactca 480
aaagcacaga attcatggag tatttctaac cagaaacaca aacactacac atactcatac 540
acatatgtgg atatctgtta tataagatgt aactttatat aaaaccccta gtctggtaat 600
gttcttaacc ttatctggtg acgttacatg acacagagct cgggctgggc ataaaagtca 660
gggcagagcc atctattgct tacatttgct tctgggatcc agatctttcg aagctagcgc 720
taccggtcgc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 780
tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 840
gcgatgccac ctacggcaag ctgaccctga agctgatctg caccaccggc aagctgcccg 900
tgccctggcc caccctcgtg accaccctgg gctacggcgt gcagtgcttc gcccgctacc 960
ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 1020
agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 1080
agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 1140
acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcaccgccg 1200
acaagcagaa gaacggcatc aaggccaact tcaagatccg ccacaacatc gaggacggcg 1260
gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 1320
tgcccgacaa ccactacctg agctaccagt ccaagctgag caaagacccc aacgagaagc 1380
gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 1440
agctgtacaa gtaagtcgac ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc 1500
tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 1560
tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 1620
ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc atcgccgcct 1680
gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggctcgag 1740
agatcttcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 1800
tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 1860
tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 1920
ggggaggatt gggaagacaa tagcaggcat gagatctcac gtgcggaccg agcggccgc 1979
<210> 123
<211> 1670
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2851
<400> 123
gcggccgcac gcgttactgt ccaggccagc tttgaacaga ctctgtattc cagaaagact 60
ttcagcttgt gcttcttttc cccaaacctg ccttgagtag ctgacatcat aggcttgcac 120
taccaggcct ggcttaaaat acatactccc aatttacata tctgatgagt aacattctca 180
tagaagcaca aaagtacata catggattct aatataggtt attttcttgg gcattacaca 240
ctacagatat actattcaat attatttgtg gcctactaga gactgagcct aaggctataa 300
acatgttagt cgtgctctac cagtgagagc tcgggctggg cataaaagtc agggcagagc 360
catctattgc ttacatttgc ttctgggatc cagatctttc gaagctagcg ctaccggtcg 420
ccaccatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc 480
tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca 540
cctacggcaa gctgaccctg aagctgatct gcaccaccgg caagctgccc gtgccctggc 600
ccaccctcgt gaccaccctg ggctacggcg tgcagtgctt cgcccgctac cccgaccaca 660
tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca 720
tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca 780
ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg 840
ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcaccgcc gacaagcaga 900
agaacggcat caaggccaac ttcaagatcc gccacaacat cgaggacggc ggcgtgcagc 960
tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca 1020
accactacct gagctaccag tccaagctga gcaaagaccc caacgagaag cgcgatcaca 1080
tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca 1140
agtaagtcga cggcgcgccg cggccgcgaa ttcgatatca taatcaacct ctggattaca 1200
aaatttgtga aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat 1260
acgctgcttt aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct 1320
ccttgtataa atcctggtta gttcttgcca cggcggaact catcgccgcc tgccttgccc 1380
gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggctcga gagatcttcg 1440
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 1500
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 1560
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 1620
tgggaagaca atagcaggca tgagatctca cgtgcggacc gagcggccgc 1670
<210> 124
<211> 2126
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2853
<400> 124
gcggccgcac gcgttggaac ttgggacttc tgagcacagg gggtggatgg ctggaaatgt 60
gagcagaacc catggtgtga gaactgagat aagtttctgc tgaggctagc ctagaggcac 120
aggtggtgag acagctaggg cagaacatat cagtgaatag tgtaggatga tgccactttt 180
aaaatatttc ccgcaatatg aaccaatttc tcaaaaggta taaattacca taactctctt 240
aaatacaaaa tgagtaatct gaatagctgc aaattgtaag aaaattgaac ataatcataa 300
cccatcggca aaaataaatc tttggggaaa tgccacttta ttagagaatt ctgctataca 360
tttgatgaat atattacaaa gcttaaaaag ctctgtgggt gttcattttg catattgaaa 420
actaaaattt tatataagct aaaaaaggcc aattgtctct gtctgtcttt ctgtctctat 480
ctctgtctct ctctgtctct ctgtctctct ctctctctct ctctctctct ctctctctct 540
ctctctctct ctctctctct ccctttcttt ttctctctct gtgtatctaa ctattcttct 600
tttgcaattt ctgaaatttc ttctccaggg ctttctttct tcacaagtgt aagcacagca 660
tgtgtgctcc cactgccaag atgctgtgcc atgctataac ttctttttga catcatatgt 720
agcttataca tattaaaatt tacttcagca ctcaacagtc accactgtca tgactggagg 780
ttgagctcgg gctgggcata aaagtcaggg cagagccatc tattgcttac atttgcttct 840
gggatccaga tctttcgaag ctagcgctac cggtcgccac catggtgagc aagggcgagg 900
agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca 960
agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagc 1020
tgatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgggct 1080
acggcgtgca gtgcttcgcc cgctaccccg accacatgaa gcagcacgac ttcttcaagt 1140
ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 1200
acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga 1260
agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca 1320
acagccacaa cgtctatatc accgccgaca agcagaagaa cggcatcaag gccaacttca 1380
agatccgcca caacatcgag gacggcggcg tgcagctcgc cgaccactac cagcagaaca 1440
cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc taccagtcca 1500
agctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg 1560
ccgccgggat cactctcggc atggacgagc tgtacaagta agtcgacggc gcgccgcggc 1620
cgcgaattcg atatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta 1680
ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc 1740
atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttagttc 1800
ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 1860
tgggcactga caattccgtg gctcgagaga tcttcgactg tgccttctag ttgccagcca 1920
tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 1980
ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 2040
gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgag 2100
atctcacgtg cggaccgagc ggccgc 2126
<210> 125
<211> 1956
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2860
<400> 125
gcggccgcac gcgtttggct ttccttccaa gttgtatttt ggtgaagttt gactcctgga 60
atctcacttc tgcactttag attagcatac tttaaaaagg aacattacag tacaatggaa 120
aagtaaagat ctgggtttta tctcagcttt agttagtatt tataggaagc atggattaca 180
taaagagatg acattatttc agtctgaaat tgatttgtac tatacgacat ttcattttgt 240
ttgtgcacat tgattagata attcctcaaa tcagtttgaa aatttcatct ctgttcatag 300
ctgaagataa ccaccaaatt gcttttaact aatttacata ataagtatag tagaggttta 360
ttctatataa agtatcaaat ataaatattc atctcaaatt ctaaaggatt tagcaatgta 420
aattacttat gaattacata cacatttgta tttaaatctt ttttcacttt tattaaaaat 480
agatcctttt ctcatacaat atatcctgat tgcagttccc tcccctctac tcctcccagt 540
tccttcccac ctccctttcc atctggatct ctctcctatt aaaggttgga cagaagagat 600
ggcactgcat gtgagctcgg gctgggcata aaagtcaggg cagagccatc tattgcttac 660
atttgcttct gggatccaga tctttcgaag ctagcgctac cggtcgccac catggtgagc 720
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 780
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 840
accctgaagc tgatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 900
accctgggct acggcgtgca gtgcttcgcc cgctaccccg accacatgaa gcagcacgac 960
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 1020
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 1080
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 1140
tacaactaca acagccacaa cgtctatatc accgccgaca agcagaagaa cggcatcaag 1200
gccaacttca agatccgcca caacatcgag gacggcggcg tgcagctcgc cgaccactac 1260
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 1320
taccagtcca agctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 1380
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta agtcgacggc 1440
gcgccgcggc cgcgaattcg atatcataat caacctctgg attacaaaat ttgtgaaaga 1500
ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg 1560
cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc 1620
tggttagttc ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 1680
gctcggctgt tgggcactga caattccgtg gctcgagaga tcttcgactg tgccttctag 1740
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 1800
tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 1860
ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag 1920
caggcatgag atctcacgtg cggaccgagc ggccgc 1956
<210> 126
<211> 2153
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2828
<400> 126
gcggccgcac gcgttggtta gcactatttt gaatggacac ttctataaaa tttgttttaa 60
aaacaatatg gaagagtcat aagatgtctg ggcacagtgc ccccagtcaa ctcatcaatg 120
ggattctgga atccaaaggt tatatggtgt aaaaacacag agagcaaaat gcacaaggat 180
cttcatagaa ccataatttt taaaaagcaa acacttcccc caaaggagca tgtaagacaa 240
cttgaaggta ttaaaatggg attgtggttt tattagttag agaacatcat gcaaattata 300
ttatctaggc attataatgc aaactttaaa aggaaatgct cattatgtaa tgttaagtga 360
aaaaaatcag gccataaaat gaaatgtgca ttatgcatgc atatgatgaa aagacaagaa 420
atagataaga atatgcagaa atacaaatag ttggctgtgg tgtgggcttc tggcttgttt 480
tctgttttaa agccattaca tcatctttcc aatgacaaac tacattttaa gttattgaaa 540
acaaaatctc gttagccttg tccttgcata aattcccaga gaacacatta ttcttgttcc 600
cttctacctc tgctacttgt ctttgatttg gacctgctcc acctcctctt acttttcagt 660
cctgaactag atggaaaaaa gaaatagacc ctcaggaaac aaggaagcaa aaccacccaa 720
ctgtgtggaa gccgtgcatt caagctgcaa acgagtggag tggcttcaat accttaactt 780
atccccattg ttgcaaaggg agacccagag agctcgggct gggcataaaa gtcagggcag 840
agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 900
tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 960
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 1020
ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 1080
ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 1140
acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 1200
ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 1260
acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1320
tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 1380
agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1440
agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1500
acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1560
acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1620
acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1680
acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1740
gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1800
cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1860
cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1920
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1980
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 2040
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 2100
gattgggaag acaatagcag gcatgagatc tcacgtgcgg accgagcggc cgc 2153
<210> 127
<211> 1833
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2870
<400> 127
gcggccgcac gcgttgtatg cctaaagggt ttgcttctat gttaattccc aacaacaatc 60
atgatacttc cttacttctg caggactagg ctggctcact agtgaggttt tctccaagga 120
tgtgctccaa tatctgctcc acaatactta aatagcttca caatacataa atatttaagt 180
actcctctgt aaggagcgtt ctgtttccat atgtcaaggc agaatcttca cataaagcat 240
gcattttgct ccctgttttc aatggtttta ctctgtagag tttctcaaat taattcaata 300
cccactttaa attaaatgga aactttaatg ctatggtttg ctgtgccatt tagattttat 360
gtgttgagat gcaattccaa ctctacttgg cacgaagtat agacactgaa tccaactatg 420
atgtataagc aagggtcctt gtgaggtagg taatgagaat ggagcctgga acgtgtaaca 480
ctggtgactg agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt 540
tgcttctggg atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag 600
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 660
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 720
ctgaagctga tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 780
ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc 840
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 900
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 960
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1020
aactacaaca gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc 1080
aacttcaaga tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag 1140
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac 1200
cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1260
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg 1320
ccgcggccgc gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg 1380
actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 1440
ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 1500
ttagttcttg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1560
cggctgttgg gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg 1620
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1680
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1740
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1800
gcatgagatc tcacgtgcgg accgagcggc cgc 1833
<210> 128
<211> 1904
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2871
<400> 128
gcggccgcac gcgttgcaga ttataattct atggaactga ctgttttaaa cataaatttt 60
agacctcttc tcaaggtgtg gcaatcctca acagcttctg gtatgcatag accacatttg 120
tattcaccat taatgcataa gaaaaacatt ttggttgcca gtttggagct aaattgataa 180
atctgctaca agcatttgtg catgagtttg tgtgtaaata tgctttttac ttacttagga 240
tgaatataca aggatagcat tgttatattg cttgacattt gcatattcaa ttttatagag 300
aatgcacagc aattttggta tctgtctgta ccctttcata ttttatgctc aacatttgag 360
tcacttggtt tcttggcatc attatgaatt tttaatggtc ttacttttaa aaaatatgct 420
ttaactcatc ttagaattat atcacatttc cccttccagt ctctcctaga catccctccc 480
tcaaacagcc cttgtgtgct cctgccttca gttcatagcc tgttttactt tattattatt 540
attgctctct gtgtgtgcac gagctcgggc tgggcataaa agtcagggca gagccatcta 600
ttgcttacat ttgcttctgg gatccagatc tttcgaagct agcgctaccg gtcgccacca 660
tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg 720
gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg 780
gcaagctgac cctgaagctg atctgcacca ccggcaagct gcccgtgccc tggcccaccc 840
tcgtgaccac cctgggctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc 900
agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 960
tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg 1020
tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca 1080
agctggagta caactacaac agccacaacg tctatatcac cgccgacaag cagaagaacg 1140
gcatcaaggc caacttcaag atccgccaca acatcgagga cggcggcgtg cagctcgccg 1200
accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact 1260
acctgagcta ccagtccaag ctgagcaaag accccaacga gaagcgcgat cacatggtcc 1320
tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaag 1380
tcgacggcgc gccgcggccg cgaattcgat atcataatca acctctggat tacaaaattt 1440
gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 1500
ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 1560
ataaatcctg gttagttctt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 1620
ggacaggggc tcggctgttg ggcactgaca attccgtggc tcgagagatc ttcgactgtg 1680
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 1740
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 1800
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 1860
gacaatagca ggcatgagat ctcacgtgcg gaccgagcgg ccgc 1904
<210> 129
<211> 2013
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2847
<400> 129
gcggccgcac gcgttccact tataccccat cagcatctct atcattgtct aagacatttt 60
taatttgaaa taaatgggga aactcattat catggcctca aggaaataca gaaaccaagg 120
attgtccttt tagtgcacag gtgtcttcta aattcacata ttctggattt aacaaggaaa 180
ataaaatctg acataggctg aatttgaaaa tggtaaggat atttttaact aaacaaaaaa 240
aataggtaat agaacatttc atattgaact cccaggatag catttatcat aatccaccag 300
ttgaattatt catgcgctga taaataacct tagcctccgg cacagtaatc ctctcactga 360
ataatcacca gggctccctg cccgtggtgt tttgctttac aacataaatt ttaaaattat 420
tctgtgttgg catacatatg tgaaagctca ttaacagata ctggcattct gattggtttg 480
gcactaaatt taaactgttt tggaaagaac tgaaacactg aaggatatgc cattctgttt 540
ctttatacct tatcgatgtt tccttaacaa tcggttgaga tttatgcatc ttttgataga 600
ttttatctga gatagctgat atgcattgtg atgagttcct ttttaacgct gtaatgtttc 660
attggccctg agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt 720
tgcttctggg atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag 780
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 840
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 900
ctgaagctga tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 960
ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc 1020
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 1080
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 1140
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 1200
aactacaaca gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc 1260
aacttcaaga tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag 1320
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac 1380
cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 1440
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg 1500
ccgcggccgc gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg 1560
actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 1620
ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 1680
ttagttcttg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1740
cggctgttgg gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg 1800
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1860
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1920
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1980
gcatgagatc tcacgtgcgg accgagcggc cgc 2013
<210> 130
<211> 1705
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2686
<400> 130
gcggccgcac gcgtaggcac cactttaagg gcctttatca ttatccacaa cagcagcagc 60
agcatgagta gcattaggaa tgcgtttcct cctgtgcttt gaggcttacg taggtctttc 120
ttctgcatcg tttcatgaaa ttctcacaag aacactatga ggtaggtgtc agatgtccat 180
tttacaggac agaaaagaga ttaaaaaaaa gagagagaga gaggaaaaag ggctttattc 240
aaagccaagt cagttcatat gggcagagcc aggacttgaa cgcaggcccc acagtcttaa 300
ctccaatatt ttcagctgcc ttgggaactt cttggaagag cccattccat tttcctgcca 360
tgagctcggg ctgggcataa aagtcagggc agagccatct attgcttaca tttgcttctg 420
ggatccagat ctttcgaagc tagcgctacc ggtcgccacc atggtgagca agggcgagga 480
gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 540
gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagct 600
gatctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgggcta 660
cggcgtgcag tgcttcgccc gctaccccga ccacatgaag cagcacgact tcttcaagtc 720
cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 780
caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 840
gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 900
cagccacaac gtctatatca ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa 960
gatccgccac aacatcgagg acggcggcgt gcagctcgcc gaccactacc agcagaacac 1020
ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagct accagtccaa 1080
gctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 1140
cgccgggatc actctcggca tggacgagct gtacaagtaa gtcgacggcg cgccgcggcc 1200
gcgaattcga tatcataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 1260
tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 1320
tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttagttct 1380
tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 1440
gggcactgac aattccgtgg ctcgagagat cttcgactgt gccttctagt tgccagccat 1500
ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc 1560
tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg 1620
ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgaga 1680
tctcacgtgc ggaccgagcg gccgc 1705
<210> 131
<211> 1770
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2687
<400> 131
gcggccgcac gcgtgcggca ggaatttaaa gaggcagaag ttcatttcct gtgatttatg 60
ggactttgct gactttcacg ctccggttct agggacaggg agaccctccc tgcgggagcc 120
gctgctagag ggaaaggcag cgttggatcg gatgccggcc ccagcctggg agacgtgctt 180
cctctgcagc ctgtgatcag gagcgaagtg tagagaccag aatcgttcag aggcagggct 240
ggtccctgtt gatttatgac tcaggcaaac agtccattca tccgtcagcg gctccacttc 300
tatccccagc ttactggagg cagaagaatg tcccctggaa gtggtctgag ctgcttcctg 360
tggtggcccc attcctccgg gtgggggatc ctatttttag agggccacca ttgccatgaa 420
ggtccagagc tcgggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 480
ttctgggatc cagatctttc gaagctagcg ctaccggtcg ccaccatggt gagcaagggc 540
gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 600
cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 660
aagctgatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 720
ggctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca cgacttcttc 780
aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 840
aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 900
ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 960
tacaacagcc acaacgtcta tatcaccgcc gacaagcaga agaacggcat caaggccaac 1020
ttcaagatcc gccacaacat cgaggacggc ggcgtgcagc tcgccgacca ctaccagcag 1080
aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagctaccag 1140
tccaagctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 1200
accgccgccg ggatcactct cggcatggac gagctgtaca agtaagtcga cggcgcgccg 1260
cggccgcgaa ttcgatatca taatcaacct ctggattaca aaatttgtga aagattgact 1320
ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 1380
tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggtta 1440
gttcttgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 1500
ctgttgggca ctgacaattc cgtggctcga gagatcttcg actgtgcctt ctagttgcca 1560
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 1620
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 1680
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 1740
tgagatctca cgtgcggacc gagcggccgc 1770
<210> 132
<211> 2098
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2878
<400> 132
gcggccgcac gcgtaggaca acttgactta tgcaaatgaa caatataaat tttagaacta 60
tgtataaata attaaataag tacatggact tacaggaagg aatgaatacc ttcagagtat 120
gctgtagtat atttcctgaa tgtatagatt aagctatata attgtcaatg agctgttgta 180
ttacgtataa ttcagggttt aaacaaaata aaaatgtgtg catatgtttt atgcaaatgc 240
atgtattttt gaatcaatga taatcccaca ctttttataa tgattcatac ccgctcaaag 300
tgatgaaaat aattgacctg taaatgttta tttttaagta gaaaaaaatc tctgtgaggc 360
tcagagaaca tgttgataca gggggagagg gaatgtacag agtagcatgc tcttgtaagt 420
tgctccaagg caacgcatga ctactgcggt cttgacctaa cagctgcaca gaccttcaga 480
agattgtatc catctacatt tcattatgga gccaagaatg gctcatgaaa cttctgccct 540
ccctgggagc atgtaggcag ttaatttgaa tggtaatttt atgtacaagg agatagaata 600
ttttcagtga tgtcaccact ggtttgtcac aatgctttct ataaatgccc aaatcctgta 660
agtattctta atgaaaacca ttgacttacg cactaatagg aaattaaagt ggaaacagat 720
gttctatttt tatttatgct gctgtgatca acacgagctc gggctgggca taaaagtcag 780
ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga agctagcgct 840
accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 900
ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 960
cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca agctgcccgt 1020
gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc 1080
cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 1140
gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 1200
gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 1260
catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcaccgccga 1320
caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg aggacggcgg 1380
cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 1440
gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca acgagaagcg 1500
cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 1560
gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata atcaacctct 1620
ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 1680
atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 1740
tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca tcgccgcctg 1800
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggctcgaga 1860
gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1920
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1980
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 2040
gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga gcggccgc 2098
<210> 133
<211> 1798
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2946
<400> 133
gcggccgcac gcgtaacatg tatttgtgga gtggctaaat tgagatatat caccttaaaa 60
tcaactccca gcaatttgaa gagcacagta agtaagacct tgttcctaac cacagtcgcc 120
atgcagtgca gtagagccca gatcttacac ttcctgtgta actggagtct tgtgttcttt 180
agccaagctc ttcccacatg cgagtcattt tcaattcaaa atactagtta ttttcagttt 240
aagaatcagt ctgatttctt gagcatagtg cttatcttat atggtatggc tttcagctcc 300
ctggagattt cctgggtgtg ctgctgtgcc tttgcctcca ggataaatgc catgctgaga 360
agagcatgac tctgtcagca caggcagacg gtggaaactt tacctttgcg acctctctgc 420
agcctcaggg tagcagggga tggcatggtt tcatgagctc gggctgggca taaaagtcag 480
ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga agctagcgct 540
accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 600
ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 660
cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca agctgcccgt 720
gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc 780
cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 840
gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 900
gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 960
catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcaccgccga 1020
caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg aggacggcgg 1080
cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 1140
gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca acgagaagcg 1200
cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 1260
gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata atcaacctct 1320
ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 1380
atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 1440
tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca tcgccgcctg 1500
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggctcgaga 1560
gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1620
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1680
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 1740
gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga gcggccgc 1798
<210> 134
<211> 1748
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2943
<400> 134
gcggccgcac gcgttctcaa cactaagaaa actgcagtat gaagatatgg aatttgaggc 60
cagtttgaga taaaacagaa agatatgagc aaaagacaag gatgtgagaa acataaataa 120
aaactatgca tattcatgaa gcaccgcata atagtttcat atggatacac atcccatgat 180
gtttaaagca ggcttatcat ttttatcttt tcaaacattt aacacttatg ttaatatatg 240
taaactcagt catttttagc cttctgagag aacctgcatc atttttaatc actcttccgt 300
tcagtaggat tcttgaatta ttatcatagt taaccatagc tgagtaatca aacctcaatt 360
gtaaatttga aaatttaccc ttctattctt ttcttgcaat aaaagagctc gggctgggca 420
taaaagtcag ggcagagcca tctattgctt acatttgctt ctgggatcca gatctttcga 480
agctagcgct accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg 540
tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 600
agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca 660
agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcgtg cagtgcttcg 720
cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 780
acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 840
tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 900
aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 960
tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg 1020
aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 1080
ccgtgctgct gcccgacaac cactacctga gctaccagtc caagctgagc aaagacccca 1140
acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 1200
gcatggacga gctgtacaag taagtcgacg gcgcgccgcg gccgcgaatt cgatatcata 1260
atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 1320
cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 1380
tggctttcat tttctcctcc ttgtataaat cctggttagt tcttgccacg gcggaactca 1440
tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg 1500
tggctcgaga gatcttcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 1560
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 1620
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 1680
gacagcaagg gggaggattg ggaagacaat agcaggcatg agatctcacg tgcggaccga 1740
gcggccgc 1748
<210> 135
<211> 2069
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3319
<400> 135
gcggccgcac gcgtcaacaa accagggaat ctactgtata gtgaagcagg attgtgaaaa 60
ggccattcat ataagagaac tccagatggc tgacacagat atggtagtgt taaatctttc 120
tgataaccaa gaggctcaag ttaaactgag atttcccttt atacactgtg aatctgtaaa 180
cattacaacc ttccagaata ccaagtactg tctagactga gacataagaa ccttgttaca 240
aggtgtgtgg ctttctagaa tgaagtcagt ttacaatatt tgaaaaaaat tagtatgcat 300
accctagacc tagcaatggc atctactgtt actttatagg tatgggaact ggtgacagat 360
aagattcaat gtgaaaagaa tggataacta aaatatattg gaagcacagt atgaaataat 420
atgcagtggg taggtggaat gagtgatgac gtataactcc atgctaacta tagtgtggag 480
agaatgcaaa gtacgccaga gaacaggatg tattgttaag tatgtaaatt aattccatgc 540
acataataag cttacttatt ttttcaatga caaatacatt tatatattca atgacatgca 600
tggaaatttc tagaatgtct agagcggagg aggggaaatg gatctgagtt caggaatgaa 660
ttagcaaaag aataaaaaat gcacatgtga aggtattaac ataaggcctt agaagcctgt 720
gtgtcgagct cgggctgggc ataaaagtca gggcagagcc atctattgct tacatttgct 780
tctgggatcc agatctttcg aagctagcgc taccggtcgc caccatggtg agcaagggcg 840
aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc 900
acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga 960
agctgatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccctgg 1020
gctacggcgt gcagtgcttc gcccgctacc ccgaccacat gaagcagcac gacttcttca 1080
agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca 1140
actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc 1200
tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact 1260
acaacagcca caacgtctat atcaccgccg acaagcagaa gaacggcatc aaggccaact 1320
tcaagatccg ccacaacatc gaggacggcg gcgtgcagct cgccgaccac taccagcaga 1380
acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agctaccagt 1440
ccaagctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga 1500
ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgac ggcgcgccgc 1560
ggccgcgaat tcgatatcat aatcaacctc tggattacaa aatttgtgaa agattgactg 1620
gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 1680
atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttag 1740
ttcttgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc 1800
tgttgggcac tgacaattcc gtggctcgag agatcttcga ctgtgccttc tagttgccag 1860
ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 1920
gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 1980
ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 2040
gagatctcac gtgcggaccg agcggccgc 2069
<210> 136
<211> 2147
<212> DNA
<213> Artificial Sequence
<220>
<223> CN2918
<400> 136
gcggccgcac gcgtctatga atagttacaa gtgagaaaga gaaatggaga ttttaccatt 60
taatcatctc cgaagagaag gtgagaagaa attgagaaag gtaatttgca taccatgcat 120
aggcattaga gaaagcattt tttttcttaa ctctccattt gtttacagat atttccatat 180
ggccttttaa aaacttcaac agagaaattc gaacacaact aactggaatt tcaattttca 240
tataaaacca gcatcataga tatatatgta gctactctcc tatgaatagt tacaagtgag 300
aaagagaaat ggagatttta ccatttaatc atctccgaag agaaggtgag aagaaattga 360
gaaaggtaat ttgcatacca tgcataggca ttagagaaag catttttttt cttaactctc 420
catttgttta cagatatttc catatggcct tttaaaaact tcaacagaga aattcgaaca 480
caactaactg gaatttcaat tttcatataa aaccagcatc atagatatat atgtagctac 540
tctcctatga atagttacaa gtgagaaaga gaaatggaga ttttaccatt taatcatctc 600
cgaagagaag gtgagaagaa attgagaaag gtaatttgca taccatgcat aggcattaga 660
gaaagcattt tttttcttaa ctctccattt gtttacagat atttccatat ggccttttaa 720
aaacttcaac agagaaattc gaacacaact aactggaatt tcaattttca tataaaacca 780
gcatcataga tatatatgta gctactctcg agctcgggct gggcataaaa gtcagggcag 840
agccatctat tgcttacatt tgcttctggg atccagatct ttcgaagcta gcgctaccgg 900
tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 960
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 1020
ccacctacgg caagctgacc ctgaagctga tctgcaccac cggcaagctg cccgtgccct 1080
ggcccaccct cgtgaccacc ctgggctacg gcgtgcagtg cttcgcccgc taccccgacc 1140
acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 1200
ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 1260
acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1320
tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcacc gccgacaagc 1380
agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcggcgtgc 1440
agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1500
acaaccacta cctgagctac cagtccaagc tgagcaaaga ccccaacgag aagcgcgatc 1560
acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1620
acaagtaagt cgacggcgcg ccgcggccgc gaattcgata tcataatcaa cctctggatt 1680
acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 1740
gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 1800
cctccttgta taaatcctgg ttagttcttg ccacggcgga actcatcgcc gcctgccttg 1860
cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggct cgagagatct 1920
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 1980
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 2040
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 2100
gattgggaag acaatagcag gcatgcacgt gcggaccgag cggccgc 2147
<210> 137
<211> 2105
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3018
<400> 137
gcggccgcac gcgtaatttt aggatgttct taaatagatc gattcttcta ctttttttaa 60
aaataacata gatctgaaaa gctttataac ttttggtttt ttttttaagg accatattaa 120
cagcatcttc cagtttttct agagtaaatg aatatgtatc ccttttataa ttaacaatat 180
acatatattc attttgtaaa aagactataa aaatagaaga gaaaatgaag agatgtttat 240
ttcttttaca cgcatcagac taaggaattt taggatgttc ttaaatagat cgattcttct 300
acttttttta aaaataacat agatctgaaa agctttataa cttttggttt tttttttaag 360
gaccatatta acagcatctt ccagtttttc tagagtaaat gaatatgtat cccttttata 420
attaacaata tacatatatt cattttgtaa aaagactata aaaatagaag agaaaatgaa 480
gagatgttta tttcttttac acgcatcaga ctaaggaatt ttaggatgtt cttaaataga 540
tcgattcttc tacttttttt aaaaataaca tagatctgaa aagctttata acttttggtt 600
ttttttttaa ggaccatatt aacagcatct tccagttttt ctagagtaaa tgaatatgta 660
tcccttttat aattaacaat atacatatat tcattttgta aaaagactat aaaaatagaa 720
gagaaaatga agagatgttt atttctttta cacgcatcag actaagggag ctcgggctgg 780
gcataaaagt cagggcagag ccatctattg cttacatttg cttctgggat ccagatcttt 840
cgaagctagc gctaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg 900
tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg 960
gcgagggcga gggcgatgcc acctacggca agctgaccct gaagctgatc tgcaccaccg 1020
gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gggctacggc gtgcagtgct 1080
tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag 1140
gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg 1200
aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 1260
aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct 1320
atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaaca 1380
tcgaggacgg cggcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 1440
gccccgtgct gctgcccgac aaccactacc tgagctacca gtccaagctg agcaaagacc 1500
ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc 1560
tcggcatgga cgagctgtac aagtaagtcg acggcgcgcc gcggccgcga attcgatatc 1620
ataatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg 1680
ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc 1740
gtatggcttt cattttctcc tccttgtata aatcctggtt agttcttgcc acggcggaac 1800
tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 1860
ccgtggctcg agagatcttc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 1920
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 1980
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 2040
caggacagca agggggagga ttgggaagac aatagcaggc atgcacgtgc ggaccgagcg 2100
gccgc 2105
<210> 138
<211> 1937
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3030
<400> 138
gcggccgcac gcgtctgttc tatctattcc tgggcttcca ccacactgtg ttaatgagga 60
taactttaaa atacatcttg atatttagta gagcgcattt ccacgcctga ttcatcacga 120
gcaccttaac ttgtcttggt tcttctgcgg agatgttggc accagcttct tcacccgtga 180
ctccagcttc tggggaacct gtgctctcac tgttctatct attcctgggc ttccaccaca 240
ctgtgttaat gaggataact ttaaaataca tcttgatatt tagtagagcg catttccacg 300
cctgattcat cacgagcacc ttaacttgtc ttggttcttc tgcggagatg ttggcaccag 360
cttcttcacc cgtgactcca gcttctgggg aacctgtgct ctcactgttc tatctattcc 420
tgggcttcca ccacactgtg ttaatgagga taactttaaa atacatcttg atatttagta 480
gagcgcattt ccacgcctga ttcatcacga gcaccttaac ttgtcttggt tcttctgcgg 540
agatgttggc accagcttct tcacccgtga ctccagcttc tggggaacct gtgctctcag 600
agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg 660
atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc 720
tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 780
tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga 840
tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg 900
gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 960
ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 1020
agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 1080
gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 1140
gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga 1200
tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc 1260
ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc 1320
tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 1380
ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc 1440
gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 1500
ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 1560
ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg 1620
ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg 1680
gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct 1740
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1800
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1860
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgcacgt 1920
gcggaccgag cggccgc 1937
<210> 139
<211> 2072
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3027
<400> 139
gcggccgcac gcgtccgcag ctttggaaaa gaccttctta ttttaactta tgtaattaac 60
catcccaaat ttaccctgat cctcactgga aatgtcttcc ctttcctgat atttaccaca 120
gttttaaaaa gtcttagatg ggtatgcata tttgagaaat acgtagagtt aattagtgcg 180
tagatgtgtt tttaagttgc ataaaacata ttgtgctttg gcatagctcc ctttgtaact 240
tattttagga aaccccgcag ctttggaaaa gaccttctta ttttaactta tgtaattaac 300
catcccaaat ttaccctgat cctcactgga aatgtcttcc ctttcctgat atttaccaca 360
gttttaaaaa gtcttagatg ggtatgcata tttgagaaat acgtagagtt aattagtgcg 420
tagatgtgtt tttaagttgc ataaaacata ttgtgctttg gcatagctcc ctttgtaact 480
tattttagga aaccccgcag ctttggaaaa gaccttctta ttttaactta tgtaattaac 540
catcccaaat ttaccctgat cctcactgga aatgtcttcc ctttcctgat atttaccaca 600
gttttaaaaa gtcttagatg ggtatgcata tttgagaaat acgtagagtt aattagtgcg 660
tagatgtgtt tttaagttgc ataaaacata ttgtgctttg gcatagctcc ctttgtaact 720
tattttagga aaccgagctc gggctgggca taaaagtcag ggcagagcca tctattgctt 780
acatttgctt ctgggatcca gatctttcga agctagcgct accggtcgcc accatggtga 840
gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg 900
taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc 960
tgaccctgaa gctgatctgc accaccggca agctgcccgt gccctggccc accctcgtga 1020
ccaccctggg ctacggcgtg cagtgcttcg cccgctaccc cgaccacatg aagcagcacg 1080
acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg 1140
acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc 1200
gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg 1260
agtacaacta caacagccac aacgtctata tcaccgccga caagcagaag aacggcatca 1320
aggccaactt caagatccgc cacaacatcg aggacggcgg cgtgcagctc gccgaccact 1380
accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga 1440
gctaccagtc caagctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg 1500
agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag taagtcgacg 1560
gcgcgccgcg gccgcgaatt cgatatcata atcaacctct ggattacaaa atttgtgaaa 1620
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 1680
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 1740
cctggttagt tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 1800
gggctcggct gttgggcact gacaattccg tggctcgaga gatcttcgac tgtgccttct 1860
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 1920
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 1980
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 2040
agcaggcatg cacgtgcgga ccgagcggcc gc 2072
<210> 140
<211> 2033
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3032
<400> 140
gcggccgcac gcgttttgtg tctgctattg catttacata gtgacatagg cttacaggat 60
attgtaaatg tcatccctag atacatttat gtaacctttt tttaaaataa aactctaaca 120
aatgttagtt attgtgcact atggttttga atatttgaat ttgctttgct cagatctaaa 180
taacttctga taagtttggc attcaggaaa gagtaaatgt aaatgtagaa atgcttggaa 240
ttttgtgtct gctattgcat ttacatagtg acataggctt acaggatatt gtaaatgtca 300
tccctagata catttatgta accttttttt aaaataaaac tctaacaaat gttagttatt 360
gtgcactatg gttttgaata tttgaatttg ctttgctcag atctaaataa cttctgataa 420
gtttggcatt caggaaagag taaatgtaaa tgtagaaatg cttggaattt tgtgtctgct 480
attgcattta catagtgaca taggcttaca ggatattgta aatgtcatcc ctagatacat 540
ttatgtaacc tttttttaaa ataaaactct aacaaatgtt agttattgtg cactatggtt 600
ttgaatattt gaatttgctt tgctcagatc taaataactt ctgataagtt tggcattcag 660
gaaagagtaa atgtaaatgt agaaatgctt ggaatgagct cgggctgggc ataaaagtca 720
gggcagagcc atctattgct tacatttgct tctgggatcc agatctttcg aagctagcgc 780
taccggtcgc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 840
tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 900
gcgatgccac ctacggcaag ctgaccctga agctgatctg caccaccggc aagctgcccg 960
tgccctggcc caccctcgtg accaccctgg gctacggcgt gcagtgcttc gcccgctacc 1020
ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 1080
agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 1140
agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 1200
acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcaccgccg 1260
acaagcagaa gaacggcatc aaggccaact tcaagatccg ccacaacatc gaggacggcg 1320
gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 1380
tgcccgacaa ccactacctg agctaccagt ccaagctgag caaagacccc aacgagaagc 1440
gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 1500
agctgtacaa gtaagtcgac ggcgcgccgc ggccgcgaat tcgatatcat aatcaacctc 1560
tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 1620
tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 1680
ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc atcgccgcct 1740
gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggctcgag 1800
agatcttcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 1860
tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 1920
tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 1980
ggggaggatt gggaagacaa tagcaggcat gcacgtgcgg accgagcggc cgc 2033
<210> 141
<211> 2057
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3015
<400> 141
gcggccgcac gcgtcattga ctcattttta ttttgtgagg aagaaatttt ccatttgtct 60
gtgtaattac atttgctaat ttctaaaaca attcctggga tttatatcta tatatgcctc 120
aggaacatac agggaagatc atactgttct ctgaatttca aattatgttt tctgttttat 180
ttcatgaatt tattattttt ctttgtctct gtctgtctct ctctgtgtgt atgtgtatgc 240
gtgtatatgc attgactcat ttttattttg tgaggaagaa attttccatt tgtctgtgta 300
attacatttg ctaatttcta aaacaattcc tgggatttat atctatatat gcctcaggaa 360
catacaggga agatcatact gttctctgaa tttcaaatta tgttttctgt tttatttcat 420
gaatttatta tttttctttg tctctgtctg tctctctctg tgtgtatgtg tatgcgtgta 480
tatgcattga ctcattttta ttttgtgagg aagaaatttt ccatttgtct gtgtaattac 540
atttgctaat ttctaaaaca attcctggga tttatatcta tatatgcctc aggaacatac 600
agggaagatc atactgttct ctgaatttca aattatgttt tctgttttat ttcatgaatt 660
tattattttt ctttgtctct gtctgtctct ctctgtgtgt atgtgtatgc gtgtatatgg 720
agctcgggct gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctggg 780
atccagatct ttcgaagcta gcgctaccgg tcgccaccat ggtgagcaag ggcgaggagc 840
tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 900
tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagctga 960
tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgggctacg 1020
gcgtgcagtg cttcgcccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 1080
ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 1140
agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 1200
gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 1260
gccacaacgt ctatatcacc gccgacaagc agaagaacgg catcaaggcc aacttcaaga 1320
tccgccacaa catcgaggac ggcggcgtgc agctcgccga ccactaccag cagaacaccc 1380
ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagctac cagtccaagc 1440
tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 1500
ccgggatcac tctcggcatg gacgagctgt acaagtaagt cgacggcgcg ccgcggccgc 1560
gaattcgata tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 1620
ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 1680
ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttagttcttg 1740
ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg 1800
gcactgacaa ttccgtggct cgagagatct tcgactgtgc cttctagttg ccagccatct 1860
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1920
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1980
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgcacgt 2040
gcggaccgag cggccgc 2057
<210> 142
<211> 1991
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3012
<400> 142
gcggccgcac gcgtttttca ttcctggagg taaaaccaac cttagaatcg tggagcctga 60
tagactttga aattggcctt cattttaatt ctcaagttct tagcatgaga gcaacattca 120
atatggttct gaaatatctc atgcaaaaaa gtgccagagt catagactga aatatttatt 180
tgaatataaa tgaactcaga tttgccaaaa tgcgctcccc ctgttgtttt tcattcctgg 240
aggtaaaacc aaccttagaa tcgtggagcc tgatagactt tgaaattggc cttcatttta 300
attctcaagt tcttagcatg agagcaacat tcaatatggt tctgaaatat ctcatgcaaa 360
aaagtgccag agtcatagac tgaaatattt atttgaatat aaatgaactc agatttgcca 420
aaatgcgctc cccctgttgt ttttcattcc tggaggtaaa accaacctta gaatcgtgga 480
gcctgataga ctttgaaatt ggccttcatt ttaattctca agttcttagc atgagagcaa 540
cattcaatat ggttctgaaa tatctcatgc aaaaaagtgc cagagtcata gactgaaata 600
tttatttgaa tataaatgaa ctcagatttg ccaaaatgcg ctccccctgt tgtgagctcg 660
ggctgggcat aaaagtcagg gcagagccat ctattgctta catttgcttc tgggatccag 720
atctttcgaa gctagcgcta ccggtcgcca ccatggtgag caagggcgag gagctgttca 780
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 840
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ctgatctgca 900
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgggc tacggcgtgc 960
agtgcttcgc ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1020
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1080
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1140
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1200
acgtctatat caccgccgac aagcagaaga acggcatcaa ggccaacttc aagatccgcc 1260
acaacatcga ggacggcggc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 1320
gcgacggccc cgtgctgctg cccgacaacc actacctgag ctaccagtcc aagctgagca 1380
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 1440
tcactctcgg catggacgag ctgtacaagt aagtcgacgg cgcgccgcgg ccgcgaattc 1500
gatatcataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 1560
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 1620
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttagtt cttgccacgg 1680
cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 1740
acaattccgt ggctcgagag atcttcgact gtgccttcta gttgccagcc atctgttgtt 1800
tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1860
taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 1920
gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc acgtgcggac 1980
cgagcggccg c 1991
<210> 143
<211> 2186
<212> DNA
<213> Artificial Sequence
<220>
<223> CN3024
<400> 143
gcggccgcac gcgtcatgaa catttagtca tcgttatctt acatgagtca tatctgtgtc 60
cttattgtct tatcttaaat gcattaatta attcgataga gcatctataa aaatgaaacg 120
ctattcaaaa gctggcccat gacaagatca gtgtgttggt ttctatgcct atagtggtgc 180
aatggaagga gtgcgctgta ccccacagac tttgtgattg atgagttgtc tactttattc 240
acaatgaagc taaaaacaat ctaacaacca tcagggtgct acagcagcac agcatgaaca 300
tttagtcatc gttatcttac atgagtcata tctgtgtcct tattgtctta tcttaaatgc 360
attaattaat tcgatagagc atctataaaa atgaaacgct attcaaaagc tggcccatga 420
caagatcagt gtgttggttt ctatgcctat agtggtgcaa tggaaggagt gcgctgtacc 480
ccacagactt tgtgattgat gagttgtcta ctttattcac aatgaagcta aaaacaatct 540
aacaaccatc agggtgctac agcagcacag catgaacatt tagtcatcgt tatcttacat 600
gagtcatatc tgtgtcctta ttgtcttatc ttaaatgcat taattaattc gatagagcat 660
ctataaaaat gaaacgctat tcaaaagctg gcccatgaca agatcagtgt gttggtttct 720
atgcctatag tggtgcaatg gaaggagtgc gctgtacccc acagactttg tgattgatga 780
gttgtctact ttattcacaa tgaagctaaa aacaatctaa caaccatcag ggtgctacag 840
cagcacagga gctcgggctg ggcataaaag tcagggcaga gccatctatt gcttacattt 900
gcttctggga tccagatctt tcgaagctag cgctaccggt cgccaccatg gtgagcaagg 960
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1020
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1080
tgaagctgat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1140
tgggctacgg cgtgcagtgc ttcgcccgct accccgacca catgaagcag cacgacttct 1200
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1260
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1320
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1380
actacaacag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc atcaaggcca 1440
acttcaagat ccgccacaac atcgaggacg gcggcgtgca gctcgccgac cactaccagc 1500
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagctacc 1560
agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1620
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaagtc gacggcgcgc 1680
cgcggccgcg aattcgatat cataatcaac ctctggatta caaaatttgt gaaagattga 1740
ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 1800
tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 1860
tagttcttgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 1920
ggctgttggg cactgacaat tccgtggctc gagagatctt cgactgtgcc ttctagttgc 1980
cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2040
actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2100
attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 2160
catgcacgtg cggaccgagc ggccgc 2186
<210> 144
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Change from AAV9 to PHP.eB
<400> 144
Ser Ala Gln Ala
1
<210> 145
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Change from AAV9 to PHP.eB
<400> 145
Ser Asp Gly Thr Leu Ala Val Pro Phe Lys Ala
1 5 10
<210> 146
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV-BR1
<400> 146
Asn Arg Gly Thr Glu Trp Asp
1 5
<210> 147
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV-PHP.S
<400> 147
Gln Ala Val Arg Thr Ser Leu
1 5
<210> 148
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV-PHP.B
<400> 148
Thr Leu Ala Val Pro Phe Lys
1 5
<210> 149
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV-PPS
<400> 149
Asp Ser Pro Ala His Pro Ser
1 5
Claims (48)
- (i) eHGT_453m, eHGT_450m, eHGT_451m, eHGT_452m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 또는 3xcore2_eHGT_460m으로부터 선택된 인핸서; (ii) 프로모터; 및 (iii) 이종 암호화 서열을 포함하는 인공 발현 작제물.
- 제1항에 있어서, 상기 이종 암호화 서열이 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 인공 발현 작제물.
- 제2항에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 인공 발현 작제물.
- 제3항에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 인공 발현 작제물.
- 제3항에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, 디자이너 약물에 의해 배타적으로 활성화되는 디자이너 수용체(DREADD), 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.
- 제2항에 있어서, 상기 발현가능한 요소가 비-기능성 분자를 포함하는 것인, 인공 발현 작제물.
- 제6항에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 인공 발현 작제물.
- 제1항에 있어서, 상기 인공 발현 작제물이 혈액 뇌 장벽을 가로지르는 캡시드와 회합하는 것인, 인공 발현 작제물.
- 제8항에 있어서, 상기 캡시드가 PHP.eB, AAV-BR1, AAV-PHP.S, AAV-PHP.B, 또는 AAV-PPS를 포함하는 것인, 인공 발현 작제물.
- 제1항에 있어서, 상기 인공 발현 작제물이 스킵핑 요소를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물.
- 제10항에 있어서, 상기 스킵핑 요소가 2A 펩티드 및/또는 내부 리보솜 진입 부위(IRES)를 포함하는 것인, 인공 발현 작제물.
- 제11항에 있어서, 상기 2A 펩티드가 T2A, P2A, E2A, 또는 F2A를 포함하는 것인, 인공 발현 작제물.
- 제1항에 있어서, 상기 인공 발현 작제물이 eHGT_453m, eHGT_450m, eHGT_451m, eHGT_452m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 3xcore2_eHGT_460m, AAV, scAAV, rAAv, minBglobin, CMV, minCMV, minRho, minRho*, 형광 단백질(예를 들어, EGFP, SYFP, SYFP2, GFP), Cre, iCre, dgCre, FlpO, tTA2, SP10, WPRE, WPRE3, 및/또는 BGHpA으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물.
- 제1항에 있어서, 상기 인공 발현 작제물이 다음으로부터 선택된 특징 세트를 포함하거나 또는 암호화하는 것인, 인공 발현 작제물:
eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_450m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_458m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_463m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_692h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_693h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_694h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_695h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_667m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_668m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_696m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_455m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457h-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_603m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_604m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_605m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_661m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_766m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_767m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_768m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_663m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_660m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_665m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_700m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_456m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_698m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_699m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_647m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_648m-minBglobin-이종 코딩 서열 WPRE3-BGHpA;
eHGT_649m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_670m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_697m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_662m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_583m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_459m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_453m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_462m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_461m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_464m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_452m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_451m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_460m-minBglobin-이종 코딩 서열-WPRE3-BGHpA;
eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_450m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_451m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_458m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_463m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_692h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_693h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_694h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_695h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_667m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_668m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_696m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_455m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_457h-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_603m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_604m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_605m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_661m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_766m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_767m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_768m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_663m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_660m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_665m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_700m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_456m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_698m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_699m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_647m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_648m- 최소 프로모터 -이종 코딩 서열 WPRE3-BGHpA;
eHGT_649m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_670m- 최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
eHGT_697m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_662m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
eHGT_583m- 최소 프로모터 -이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_459m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_453m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_462m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_461m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_464m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_452m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA;
3xcore2_eHGT_451m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA; 또는
3xcore2_eHGT_460m-최소 프로모터-이종 코딩 서열-WPRE3-BGHpA. - 제1항의 인공 발현 작제물을 포함하는 벡터.
- 제15항에 있어서, 상기 벡터가 바이러스 벡터를 포함하는 것인, 벡터.
- 제15항에 있어서, 상기 바이러스 벡터가 재조합 아데노-연관 바이러스(AAV) 벡터를 포함하는 것인, 벡터.
- 적어도 하나의 이종 암호화 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터로서, 상기 이종 암호화 서열은 eHGT_453m, eHGT_450m, eHGT_451m, eHGT_452m, eHGT_457m, eHGT_458m, eHGT_459m, eHGT_460m, eHGT_462m, eHGT_464m, eHGT_461m, eHGT_463m, eHGT_692h, eHGT_693h, eHGT_694h, eHGT_695h, eHGT_667m, eHGT_668m, eHGT_696m, eHGT_455m, eHGT_457h, eHGT_603m, eHGT_604m, eHGT_605m, eHGT_661m, eHGT_766m, eHGT_767m, eHGT_768m, eHGT_663m, eHGT_660m, eHGT_665m, eHGT_700m, eHGT_456m, eHGT_698m, eHGT_699m, eHGT_647m, eHGT_648m, eHGT_649m, eHGT_670m, eHGT_697m, eHGT_662m, eHGT_583m, 3xcore2_eHGT_459m, 3xcore2_eHGT_453m, 3xcore2_eHGT_462m, 3xcore2_eHGT_461m, 3xcore2_eHGT_464m, 3xcore2_eHGT_452m, 3xcore2_eHGT_451m, 및/또는 3xcore2_eHGT_460m으로부터 선택된 프로모터 및 인핸서의 제어 하에 있는 것인, 아데노-연관 바이러스(AAV) 벡터.
- 제1항의 인공 발현 작제물을 포함하는 유전자이식 세포.
- 제19항에 있어서, 상기 유전자이식 세포가 L5 ET 뉴런인, 유전자이식 세포.
- 제1항의 인공 발현 작제물을 포함하는 비-인간 유전자이식 동물.
- 제21항에 있어서, 상기 비-인간 유전자이식 동물이 마우스 또는 비-인간 영장류인, 비-인간 유전자이식 동물.
- 제1항의 인공 발현 작제물을 포함하는 투여가능한 조성물.
- 제1항의 인공 발현 작제물을 포함하는 키트.
- 생체내 또는 시험관내 세포 집단 내에서 이종 유전자를 선택적으로 발현하는 방법으로서, 상기 방법은 제23항의 투여가능한 조성물을 충분한 투여량 및 충분한 시간 동안 세포 집단을 포함하는 샘플 또는 대상체에게 제공하여 세포 집단 내에서 유전자를 선택적으로 발현하는 단계를 포함하는 것인, 방법.
- 제25항에 있어서, 상기 이종 유전자가 효과기 요소 또는 발현가능한 요소를 암호화하는 것인, 방법.
- 제26항에 있어서, 상기 효과기 요소가 리포터 단백질 또는 기능성 분자를 포함하는 것인, 방법.
- 제27항에 있어서, 상기 리포터 단백질이 형광 단백질을 포함하는 것인, 방법.
- 제27항에 있어서, 상기 기능성 분자가 기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.
- 제26항에 있어서, 상기 발현가능한 요소가 비-기능성 분자를 포함하는 것인, 방법.
- 제30항에 있어서, 상기 비-기능성 분자가 비-기능성 이온 수송체, 효소, 전사 인자, 수용체, 막 단백질, 세포 수송 단백질, 신호전달 분자, 신경전달물질, 칼슘 리포터, 채널로돕신, CRISPR/CAS 분자, 편집효소, 가이드 RNA 분자, 상동 재조합 공여자 카세트, DREADD, 성장 인자, 또는 생존-촉진 유전자를 포함하는 것인, 방법.
- 제25항에 있어서, 상기 제공하는 단계가 피펫팅을 포함하는 것인, 방법.
- 제32항에 있어서, 상기 피펫팅이 뇌 절편에 대한 것인, 방법.
- 제33항에 있어서, 상기 뇌 절편이 L5 ET 뉴런을 포함하는 것인, 방법.
- 제33항에 있어서, 상기 뇌 절편이 뮤린, 인간, 또는 비-인간 영장류인, 방법.
- 제25항에 있어서, 상기 제공하는 단계가 살아있는 대상체에게 투여하는 것을 포함하는 것인, 방법.
- 제36항에 있어서, 상기 살아있는 대상체가 인간, 비-인간 영장류, 또는 마우스인, 방법.
- 제36항에 있어서, 상기 살아있는 대상체에게 투여하는 것이 주사를 통한 것인, 방법.
- 제38항에 있어서, 상기 주사가 정맥내 주사, 뇌 조직 내에 뇌실질내 주사, 뇌실내(ICV) 주사, 대조내(ICM) 주사, 또는 척추강내 주사를 포함하는 것인, 방법.
- 제36항에 있어서, 상기 살아있는 대상체가 신경퇴행성 질환을 갖는 것인, 방법.
- 제36항에 있어서, 상기 살아있는 대상체가 근위축성 측삭 경화증(ALS) 또는 다발성 경화증을 갖는 것인, 방법.
- CN2251, CN2248, CN2249, CN2250, CN2252, CN2253, CN2254, CN2255, CN2256, CN2315, CN2423, CN2424, CN2690, CN2695, CN2691, CN2692, CN2944, CN2886, CN2755, CN2938, CN2239, CN2410, CN2411, CN2412, CN2963, CN2623, CN2624, CN2601, CN2843, CN2851, CN2853, CN2860, CN2828, CN2870, CN2871, CN2847, CN2686, CN2687, CN2878, CN2946, CN2943, CN3319, CN2918, CN3018, CN3030, CN3027, CN3032, CN3015, CN3012, 또는 CN3024를 포함하는 인공 발현 작제물.
- eHGT_459m, eHGT_453m, eHGT_462m, eHGT_461m, eHGT_464m, eHGT_452m, eHGT_451m, 또는 eHGT_460m 인핸서의 연쇄된 코어(concatenated core).
- 제43항에 있어서, 상기 연쇄된 코어가 서열번호: 45, 서열번호: 46, 서열번호: 47, 서열번호: 48, 서열번호: 49, 서열번호: 50, 서열번호: 51, 또는 서열번호: 52에 제시된 서열을 갖는 것인, 연쇄된 코어.
- 제43항에 있어서, 상기 연쇄된 코어가 인핸서 코어의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 갖는 것인, 연쇄된 코어.
- 제43항에 있어서,
서열번호: 45의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 46, 서열번호: 47의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 48의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 49의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 50의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피,
서열번호: 51의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피, 또는
서열번호: 52의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 카피를 갖는, 연쇄된 코어. - 제43항에 있어서, 서열번호: 45의 3 개 카피; 서열번호: 46의 3 개 카피; 서열번호: 47의 3 개 카피; 서열번호: 48의 3 개 카피; 서열번호: 49의 3 개 카피; 서열번호: 50의 3 개 카피; 서열번호: 51의 3 개 카피; 또는 서열번호: 52의 3 개 카피를 갖는, 연쇄된 코어.
- 제43항에 있어서, 상기 연쇄된 코어가 서열번호: 53; 서열번호: 54; 서열번호: 55; 서열번호: 56; 서열번호: 57; 서열번호: 58; 서열번호: 59; 또는 서열번호: 60에 제시된 바와 같은 서열을 갖는 것인, 연쇄된 코어.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063013342P | 2020-04-21 | 2020-04-21 | |
US63/013,342 | 2020-04-21 | ||
PCT/US2021/028489 WO2021216778A2 (en) | 2020-04-21 | 2021-04-21 | Artificial expression constructs for selectively modulating gene expression in neocortical layer 5 glutamatergic neurons |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230002788A true KR20230002788A (ko) | 2023-01-05 |
Family
ID=78269916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227040046A KR20230002788A (ko) | 2020-04-21 | 2021-04-21 | 신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230159952A1 (ko) |
EP (1) | EP4139462A2 (ko) |
JP (1) | JP2023522708A (ko) |
KR (1) | KR20230002788A (ko) |
AU (1) | AU2021261359A1 (ko) |
CA (1) | CA3175993A1 (ko) |
WO (1) | WO2021216778A2 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4413142A1 (en) * | 2021-10-05 | 2024-08-14 | Allen Institute | Artificial expression constructs for modulating gene expression in the cerebellum and a secondary cell type |
WO2023245013A2 (en) * | 2022-06-13 | 2023-12-21 | Allen Institute | Artificial expression constructs for modulating gene expression in non-neuronal central nervous system cells |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2019358806A1 (en) * | 2018-10-08 | 2021-05-20 | Allen Institute | Artificial expression constructs for selectively modulating gene expression in interneurons |
US20210348135A1 (en) * | 2018-10-12 | 2021-11-11 | Genzyme Corporation | Generation of improved human pah for treatment of severe pku by liver-directed gene replacement therapy |
AU2020223367A1 (en) * | 2019-02-15 | 2021-10-07 | Allen Institute | Artificial expression constructs for selectively modulating gene expression in selected neuronal cell populations |
-
2021
- 2021-04-21 KR KR1020227040046A patent/KR20230002788A/ko unknown
- 2021-04-21 AU AU2021261359A patent/AU2021261359A1/en active Pending
- 2021-04-21 WO PCT/US2021/028489 patent/WO2021216778A2/en unknown
- 2021-04-21 JP JP2022563930A patent/JP2023522708A/ja active Pending
- 2021-04-21 US US17/996,910 patent/US20230159952A1/en active Pending
- 2021-04-21 CA CA3175993A patent/CA3175993A1/en active Pending
- 2021-04-21 EP EP21793682.2A patent/EP4139462A2/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4139462A2 (en) | 2023-03-01 |
CA3175993A1 (en) | 2021-10-28 |
WO2021216778A2 (en) | 2021-10-28 |
WO2021216778A3 (en) | 2021-12-16 |
JP2023522708A (ja) | 2023-05-31 |
US20230159952A1 (en) | 2023-05-25 |
AU2021261359A1 (en) | 2022-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102604159B1 (ko) | 조직 선택적 트랜스진 발현 | |
KR20200107949A (ko) | 조작된 dna 결합 단백질 | |
US20220249703A1 (en) | Artificial expression constructs for selectively modulating gene expression in selected neuronal cell populations | |
JP2022513339A (ja) | 介在ニューロンにおける遺伝子発現を選択的に調節するための人工発現構築物 | |
KR20230002788A (ko) | 신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물 | |
KR20210082205A (ko) | 레트로바이러스 인테그라제-Cas9 융합 단백질을 이용한 유도된 비상동 DNA 삽입에 의한 게놈 편집 | |
WO2021195591A2 (en) | Artificial expression constructs for selectively modulating gene expression in non-neuronal brain cells | |
US20240254514A1 (en) | Artificial expression constructs for modulating gene expression in neurons within the thalamus | |
CN113874512A (zh) | 诱导毛细胞分化的组合物和方法 | |
CN114144203A (zh) | 源于显性变异基因的疾患的治疗剂 | |
US20240018543A1 (en) | Artificial expression constructs for modulating gene expression in chandelier cells | |
US20230212608A1 (en) | Artificial expression constructs for selectively modulating gene expression in inhibitory neocortical neurons | |
WO2023108021A1 (en) | Artificial expression constructs for modulating gene expression in neocortical layer 4 or layer 5 intratelencephalic neurons | |
JP2024537165A (ja) | 小脳と第2の種類の細胞において遺伝子発現を調節するための人工発現コンストラクト | |
WO2023245013A2 (en) | Artificial expression constructs for modulating gene expression in non-neuronal central nervous system cells | |
KR20240000580A (ko) | 레트로바이러스 인테그라제-Cas 융합 단백질을 이용한 직접 비상동 DNA 삽입에 의한 게놈 편집 및 치료 방법 | |
KR20240145526A (ko) | Cas-형질전환 마우스 배아 줄기 세포 및 마우스 및 이것의 용도 |