KR20210104661A - 인테인 단백질 및 이의 용도 - Google Patents
인테인 단백질 및 이의 용도 Download PDFInfo
- Publication number
- KR20210104661A KR20210104661A KR1020217014221A KR20217014221A KR20210104661A KR 20210104661 A KR20210104661 A KR 20210104661A KR 1020217014221 A KR1020217014221 A KR 1020217014221A KR 20217014221 A KR20217014221 A KR 20217014221A KR 20210104661 A KR20210104661 A KR 20210104661A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- intein
- glu
- lys
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/33—Alteration of splicing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Virology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Ophthalmology & Optometry (AREA)
- Hematology (AREA)
- Diabetes (AREA)
- Epidemiology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 특히 5Kb보다 큰 유전자의 효과적인 유전자 요법을 허용하는 작제물, 벡터, 상대적 숙주 세포 및 약학적 조성물에 관한 것이다.
Description
본 발명은 특히 5 kb보다 큰 코딩 서열(CDS)을 갖는 유전자의 돌연변이로 인한 질병에 대해 효과적인 유전자 요법을 허용하는 작제물, 벡터, 상대적 숙주 세포 및 약학적 조성물에 관한 것이다.
아데노 관련 바이러스(AAV) 벡터를 사용한 유전자 요법은 인간에게 안전하고 효과적이다. AAV 기반 유전자 요법 제품은 최근 몇 년간 미국 및 유럽 둘 모두에서 유전적 대사 및 실명 질병에 대해 승인된 한편, 안과학에서 혈액학, 근골격 및 대사 장애에 이르는 다양한 치료 분야의 질병에 대한 AAV 기반 유전자 요법 접근법에 대한 임상 시험이 계속 증가하고 있다.
그러나, AAV 벡터 화물 용량의 한계는 5 kb보다 큰 코딩 서열(CDS)을 가진 유전자(본원에서 큰 유전자로도 언급됨)의 돌연변이로 인한 질병에 대한 AAV 기반 요법의 개발을 방해한다.
큰 유전자의 돌연변이로 인한 유전 질병(하기 표 1에 나열됨)은 특히 DMD 유전자의 돌연변이로 인한 뒤시엔느 근육 디스트로피, CFTR 유전자의 돌연변이로 인한 낭성섬유증, F8 유전자의 돌연변이로 인한 혈우병 A, DYSF 유전자의 돌연변이로 인한 디스펄린병증(dysferlinopathy), PKD 유전자의 돌연변이로 인한 다낭신장병, ATP7B 유전자의 돌연변이로 인한 윌슨병, HTT 유전자의 돌연변이로 인한 헌팅턴병, NPC1 유전자의 돌연변이로 인한 니먼-픽 C형을 포함한다.
표 1: 큰 유전자의 돌연변이로 인한 유전 질병
또한, 몇 가지 유전 망막 변성(IRD)은 하기 표 2에 나열된 것처럼 큰 유전자의 돌연변이로 인한 것이다. IRD는 유럽 및 미국에서 3000명 중 약 1명에 영향을 미친다(58).
가장 빈번하고 심각한 IRD 중에는 1/2,000의 전체 세계 유병률로 가장 흔하게는 단일 유전성 질환으로 유전되고(1), 전세계적으로 실명의 주요 원인인 망막색소변성(RP), 레버 선천성 흑암시(LCA) 및 스타가르트병(STGD)이다. IRD를 유발하는 돌연변이의 대부분은 망막의 신경세포 광수용체(PR), 간상체 및/또는 추상체에서 발현되는 유전자에서 발생한다(2).
유전자 요법은 IRD 치료에 큰 가능성을 갖는다. 유전적 형태의 실명에 대한 최초의 아데노-관련 바이러스(AAV) 벡터 기반 유전자 요법 제품이 2017년 12월에 승인되었다(3). 또한, 희귀한 형태의 실명 및 일반적 형태의 실명의 유전자 요법을 위한 다수의 다른 AAV 기반 제품이 현재 임상 개발 중에 있다(4). 현재까지 AAV가 망막에 가장 효율적인 유전자 요법 비히클을 대표한다는 것은 이제 널리 확립되어 있지만(4,5), 이의 제한된 화물 용량은 트랜스진(transgene)뿐만 아니라 이의 발현에 필요한 시스 조절 요소를 포함하는 5 kb 크기를 초과하는 DNA 서열의 전달에 필요한 조건에서의 이의 사용을 방해했다(6).
5kb 크기를 초과하는 질병 유전자의 예는 하기 표 2에 요약되어 있다.
표 2: 5kb 크기를 초과하는 질병 유전자
스타가르트병(STGD; MIM#248200)은 PR 외부 분절에 위치된 모든 트랜스 망막 수송체를 인코딩하는 ABCA4 유전자(CDS: 6822 bp)의 돌연변이에 의해 유발되는 유전성 황반 변성의 가장 흔한 형태이며(7); 어셔 증후군 IB형(USH1B; MIM#276900)은 망막 내의 PR 및 RPE 둘 모두에서 발현되는 액틴 기반 모터인 색다른 MY07A를 인코딩하는 MY07A 유전자(CDS: 6648 bp)(8)의 돌연변이에 의해 유발되는 가장 심각한 형태의 RP 및 난청이다(9-11).
추상체-간상체 디스트로피 3형, 노란점안저, 연령-관련 황반 변성 2형, 조기 발병 중증 망막 디스트로피 및 색소성 망막염 19형이 또한 ABCA4 돌연변이와 관련(본원에서 ABCA4-관련 질병으로 언급됨)된다.
본 발명자 및 다른 사람들은 각각이 큰 트랜스진 발현 카세트의 코딩 서열(CDS)의 단편을 함유하는 이중(최대 9 kb)(6, 12, 13) 또는 삼중(최대 14 kb)(14) AAV 벡터를 사용하여 상기 제한이 극복될 수 있음을 제시하였다. 이중 및 삼중 AAV 벡터는 AAV 유전체의 콘카테머화(concatemerization) 및 재조합을 활용하여 다수의 AAV 벡터에 의해 공동 감염된 세포에서 전장 유전체를 재구성한다. 그러나, 대부분의 유전 망막 질병에 대한 주요 치료 표적인 광수용체에서 이중 또는 삼중 AAV 벡터로 달성된 트랜스진 발현의 효율은 단일 AAV 벡터로 달성된 것보다 낮다(6, 14, 15). 이는 적절한 DNA 콘카테머 형성, 이종성 mRNA의 안정성 및 벡터의 접합을 통한 스플라이싱 효율을 포함하여 효율적인 형질도입에 필요한 다양한 제한 단계로 인한 것일 수 있다.
본 발명자는 W02014/170480호 및 문헌[Colella et al (15)]에서 스플라이싱(트랜스-스플라이싱), 상동성 재조합(중복) 또는 둘의 조합(하이브리드)에 의해 큰 유전자를 재구성하는 이중 AAV 벡터, 이중 트랜스 스플라이싱 및 하이브리브 벡터가 유전 망막 변성의 치료에 특히 효율적이라는 발견을 제시하였다. 또한, 문헌[Maddalena et al. (14)]은 최대 14 kb의 유전자에 대한 삼중 AAV 벡터 접근법을 입증하였다. 그러나, 이중 또는 삼중 AAV 벡터로 달성된 트랜스진 발현의 효율은 단일 AAV 벡터로 달성된 것보다 낮다(6, 13, 14). 이는 적절한 DNA 콘카테머 형성, 이종성 mRNA의 안정성 및 벡터의 접합을 통한 스플라이싱 효율을 포함하여 효율적인 형질도입에 필요한 다양한 제한 단계로 인한 것일 수 있다. 또한, 삼중 AAV 벡터 전략은 치료적 접근법에 필요한 임계 값 미만의 유전자 발현 수준을 생성한다.
따라서, 효과적인 유전자 요법을 위해 큰 유전자 발현을 재구성하는 데 활용될 수 있는 작제물 및 벡터가 여전히 필요하다.
본 발명자는 이제 짧은 분할-인테인(split-intein)이 측면에 있는 리포터 또는 큰 치료 단백질의 단편 중 하나를 각각 인코딩하는 다중 AAV 벡터의 전달이 시험관 내 또는 생체 내 둘 모두에서 단백질 트랜스-스플라이싱(trans-splicing) 및 전장 단백질 재구성을 발생시키는 것을 발견하였다.
인테인은 숙주 단백질 내에서 전사되고 번역된 유전 요소이며, 이는 에너지 공급, 외인성 숙주 특이적 프로테아제 또는 보조 인자의 부재하에서 최종 단백질 생성물에서 아미노산 변형을 남기지 않고 단백질 인트론과 유사하게 자가 절제된다(16, 17, 27, 28). 인테인 활성은 효율적인 트랜스-스플라이싱이 발생하기 위해 필요한 라이게이션 접합을 둘러싸는 특정 펩티드 서열(N- 및 C-엑스테인으로 언급됨)과 함께 상황 의존적이며, 이 중 가장 중요한 것은 C-엑스테인의 첫 번째 잔기로서 티올 또는 하이드록실기(즉, Cys, Ser 또는 Thr)를 함유하는 아미노산이다(18). 분할-인테인은 2개의 숙주 단백질의 말단에서 2개의 개별 폴리펩티드로 발현되는 인테인의 서브셋이며, 이들의 트랜스-스플라이싱을 촉매하여 하나의 더 큰 폴리펩티드의 생성을 발생시킨다(19). 분할-인테인을 포함하는 인테인은 단백질 정제 및 라벨링 단계(19, 20)뿐만 아니라 널리 사용되는 CRISPR/Cas9 유전체 편집 뉴클레아제(21, 22)의 재구성을 포함하는 생명공학 적용에서 널리 사용된다.
인자 VIII 유전자를 포함하는 치료 유전자의 발현을 재구성하기 위해 인테인 기반 단백질 스플라이싱을 활용하려는 여러 시도가 이루어졌으며, 여기서 인자 VIII의 시네코시스티스 종(Synechocystis sp)(Ssp) DnaB 인테인-융합 중쇄 및 경쇄 유전자가 세포 배양 및 동물 모델에서 인자 VIII의 재구성으로 이어지는 것으로 입증되었다(23, 24). 유사하게, 고도로 기능적인 형태의 디스트로핀 유전자가 시험관 내 및 생체 내에서 발현되며, 여기서 6.3-kb 베커 디스트로핀(Becker dystrophin) 유전자는 2개의 AAV 벡터로 분할되고, 각각의 절반이 융합되어 시네코시스티스 종 PCC 6803(Ssp) DnaB 인테인 또는 로도써무스 마리누스(Rhodothermus marinus)(Rma) DnaB 인테인으로부터 획득된 분할 인테인에 융합되었다(25). 또한, 분할-인테인(즉, N. 푼크티포르메(N. punctiforme) DnaE 분할 인테인) 매개 단백질 트랜스-스플라이싱 전략은 심장 세포에 있는 2개의 개별 단편으로부터의 L-형 칼슘 채널의 큰 포어 형성 서브유닛을 재구성하는 것으로 보고되었다(26). US 6,544,786호에는 디스트로핀 미니유전자를 전달하기 위한 분할 인테인의 사용을 추가로 보고한다.
본 발명자는 큰 전장 단백질을 이들의 단편화 후 2개 또는 3개의 분할-인테인이 측면에 있는 폴리펩티드(이의 코딩 서열은 단일 AAV 벡터에 적합화됨)로 재구성하기 위해 단백질 트랜스-스플라이싱을 매개하기 위해 분할-인테인의 고유한 능력을 이용하였다.
따라서, 본 발명은 인테인 매개 트랜스-스플라이싱을 촉진하고, 기능성 단백질을 재구성하기 위해 분할 인테인에 융합된 상기 큰 단백질의 2개 이상의 단편을 표적 세포에 제공함으로써 큰 세포 단백질 재구성을 구현한다.
본 발명은 유전자, 특히 5 kb를 초과하는 코딩 영역을 갖는 유전자의 돌연변이로 인한 질병에 대한 AAV 벡터를 사용한 유전자 요법을 제공한다.
분할-인테인에 의해 매개되는 단백질 트랜스-스플라이싱이 단백질을 재구성하기 위해 단일 세포 유기체에 의해 사용된다는 발견에 기초하여, 본 발명자는 각각 짧은 분할-인테인이 측면에 있는 리포터 또는 큰 치료 단백질의 단편 중 하나를 인코딩하여 시험관 내 및 생체 내에서 단백질 트랜스-스플라이싱 및 전장 단백질 재구성을 발생시키는 다중 AAV 벡터를 작제하였다.
유리하게는, 본 발명에 의해 달성된 질병 단백질의 AAV 기반 단백질 트랜스-스플라이싱 매개 재구성은 당 분야에 공지된 큰 단백질에 대한 AAV 기반 방법보다 더 많은 양의 표적 단백질의 발현을 제공하였다. 이는 적절한 DNA 콘카테머(concatemer) 형성, 이종성 mRNA의 안정성 및 벡터의 접합을 가로지른 스플라이싱 효율을 포함하여 이중 벡터 기반 시스템의 효율적인 형질도입에 필요한 다양한 제한 단계를 극복했기 때문일 것이다.
본 발명은 세포에서 코딩 서열을 발현시키기 위한 벡터 시스템을 제공하며, 상기 코딩 서열은 제1 부분(CDS1), 제2 부분(CDS2) 및 선택적으로 제3 부분(CDS3)으로 구성되고, 상기 벡터 시스템은,
a) - 상기 코딩 서열의 상기 제1 부분(CDS1),
- N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
b) - 상기 코딩 서열의 상기 제2 부분(CDS2),
- C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터를 포함하고;
여기서, 제1 벡터 및 제2 벡터는 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물이 단백질 스플라이싱에 의해 생성되고;
또는
상기 벡터 시스템은,
a') - 상기 코딩 서열의 상기 제1 부분(CDS1),
- 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
b') - 상기 코딩 서열의 상기 제2 부분(CDS2),
- 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열;
- 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 3' 말단에 위치하는, 제3 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터; 및
c') - 상기 코딩 서열의 상기 제3 부분(CDS3)
- 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS3의 5' 말단에 위치하는, 제4 인테인 뉴클레오티드 서열을 포함하는, 제3 벡터를 포함하고;
여기서, 제1 인테인 뉴클레오티드 서열은 제3 인테인 뉴클레오티드 서열과 상이하고, 제2 인테인 서열은 제4 인테인 뉴클레오티드 서열과 상이하며, 여기서 제1 벡터, 제2 벡터, 제3 벡터가 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물은 단백질 트랜스-스플라이싱에 의해 생성된다.
바람직하게는, 벡터 시스템에서, 제1 인테인, 제2 인테인, 제3 인테인 및 제4 인테인은 분할 인테인을 인코딩하고, 바람직하게는 상기 분할 인테인은 150개 아미노산의 최대 길이를 갖고, 더욱 바람직하게는 상기 분할 인테인은 DnaE 또는 DnaB 인테인이다.
본 발명에 따르면, 인테인은 단백질 스플라이싱으로 공지된 과정에서 자신을 절제하고 나머지 부분(엑스테인(extein))과 펩티드 결합으로 연결할 수 있는 단백질의 세그먼트이다. 세그먼트는 내부 단백질 서열의 경우 "인테인", 외부 단백질 서열의 경우 "엑스테인"으로 언급되며, 업스트림 엑스테인은 "N-엑스테인"으로 언급되고, 다운스트림 엑스테인은 "C-엑스테인"으로 언급되고, 업스트림 인테인은 "N-인테인"으로 언급되고, 다운스트림 인테인은 "C-인테인"으로 언급된다.
따라서, 본 발명의 맥락에서, N-인테인은 제1 폴리펩티드의 N-말단에 위치(및 이와 융합)한 인테인 단편이고, C-인테인은 제2 폴리펩티드의 C-말단에 위치(및 이와 융합)한 인테인 단편이며, 여기서 2개의 폴리펩티드의 발현시, 2개의 인테인 단편은 단백질 트랜스 스플라이싱을 겪고 결합되어 완전한 인테인을 형성하고, 2개의 폴리펩티드가 결합되고, 여기서 2개의 폴리펩티드가 전장 단백질을 형성하는 경우, 상기 전장 단백질은 재구성된다.
본 발명에 따르면, 제1 인테인 서열은 N-인테인 서열이고, 제2 인테인 서열은 C-인테인 서열이며, 여기서 상기 N-인테인 및 상기 C-인테인은 바람직하게는 동일한 인테인 또는 분할 인테인 유전자로부터 유래된다. 대안적으로, 상기 N-인테인 및 상기 C-인테인은 자연적으로 트랜스 스플라이싱 반응을 겪을 수 있거나 그렇게 하도록 변형된 2개의 상이한 인테인 유전자로부터 유래된다. 따라서, 동일한 유전자는 동일한 유기체 또는 상이한 유기체로부터의 것일 수 있다. 예를 들어, 널리 사용되는 분할 인테인은 상이한 유기체로부터의 DnaE 유전자로부터 유래된다. 본 발명에 따르면, 관심 단백질의 코딩 서열이 2개의 부분으로 분할되는 경우, N-인테인 코딩 서열은 관심 단백질의 N-말단 부분을 코딩하는 서열과 인 프레임(in frame)으로 융합되고; C-인테인 코딩 서열은 관심 서열의 C-말단 부분을 코딩하는 서열과 인 프레임으로 융합된다. 2개의 전구체 융합 단백질의 발현시, 인테인은 자가촉매 절제를 겪고, 라이게이션된 엑스테인, 예를 들어, 관심 있는 재구성된 단백질을 형성한다.
본 발명에 따르면, 관심 단백질의 코딩 서열은 3개의 부분으로 분할될 수 있다. 따라서, 제1 인테인 서열은 N-인테인 서열이고, 제2 인테인 서열은 C-인테인 서열이며, 여기서 제1 인테인 코딩 서열은 C-말단에서 인 프레임으로 관심 단백질의 N-부분을 코딩하는 서열에 융합되고, 제2 인테인 코딩 서열은 인 프레임으로 관심 단백질의 중간 부분을 코딩하는 서열의 N-말단에 융합된다. 따라서, 상기 N-인테인 및 상기 C-인테인은 바람직하게는 동일한 인테인 또는 분할 인테인 유전자로부터 유래된다. 대안적으로, 상기 N-인테인 및 상기 C-인테인은 자연적으로 트랜스 스플라이싱 반응을 겪을 수 있거나 그렇게 하도록 변형된 2개의 상이한 인테인 유전자로부터 유래된다. 따라서, 동일한 유전자는 동일한 유기체 또는 상이한 유기체로부터의 것일 수 있다. 현재 구성 내에서, 제3 인테인은 관심 단백질의 중간 부분의 C-말단을 코딩하는 서열에 인 프레임으로 융합된 N-인테인 코딩 서열이고, 제4 인테인은 관심 단백질의 C-부분의 N-말단을 코딩하는 서열에 인 프레임으로 융합된 C-인테인 코딩 서열이다. 따라서, 상기 제3 및 제4 인테인은 바람직하게는 동일한 인테인 또는 분할 인테인 유전자로부터 유래된다. 대안적으로, 상기 N-인테인 및 상기 C-인테인은 자연적으로 트랜스 스플라이싱 반응을 겪을 수 있거나 그렇게 하도록 변형된 2개의 상이한 인테인 유전자로부터 유래된다. 따라서, 동일한 유전자는 동일한 유기체 또는 상이한 유기체로부터의 것일 수 있다. 본 발명의 범위 내에서, 상기 제1 및 제2 인테인 및 상기 제3 및 제4 인테인은 상이한 인테인 유전자로부터 유래되고, 제1 인테인은 제2 인테인에 선택적으로 결합하는 반면, 제3 인테인은 제4 인테인에 선택적으로 결합한다.
본 발명에서, 제1 벡터, 제2 벡터 및 선택적으로 제3 벡터가 세포에 삽입되는 경우, 적어도 2개의 융합 단백질 또는 3개의 융합 단백질이 형성되고, 상기 2개의 융합 단백질 또는 3개의 융합 단백질이 접촉하는 경우, 코딩 서열의 단백질 생성물이 생성된다. 접촉 단계는 C-인테인에 대한 N-인테인의 결합을 허용하는 조건하에서 수행된다.
본 발명에서, 제1 벡터, 제2 벡터 및 제3 벡터가 세포에 삽입되는 경우, 3개의 독립적인 폴리펩티드가 생성되고, 전장 단백질이 트랜스-스플라이싱을 통해 생성된다. 3개의 AAV 인테인 벡터 개발의 핵심은 상이한 인테인, 즉, DnaE 및 DnaB의 사용이었으며, 따라서 이는 교차 반응하지 않아 제1 및 제3 벡터에 의해 생성된 폴리펩티드 사이의 부적절한 트랜스-스플라이싱을 방지한다.
본 발명의 바람직한 구현예에 따르면, 세포에서 관심 유전자의 코딩 서열을 발현하기 위한 벡터 시스템은 2개의 벡터를 포함하며, 각각의 벡터는 인테인 서열이 측면에 있는 상기 코딩 서열의 일부를 포함하고, 상기 코딩 서열의 5' 말단은 N-인테인의 서열에 의해 3' 말단에 측면에 있고, 관심 유전자의 코딩 서열의 3' 말단은 C-인테인의 서열에 의해 측면에 있어, 둘 모두의 벡터가 세포에서 발현되는 경우, 2개의 융합 단백질이 생성되고, 자발적인 트랜스-스플라이싱 반응의 결과로서 관심 전장 단백질이 생성된다.
본 발명의 추가의 바람직한 구현예에 따르면, 세포에서 관심 유전자의 코딩 서열을 발현하기 위한 벡터 시스템은 3개의 벡터를 포함하며, 각각의 벡터는 인테인 서열이 측면에 있는 상기 코딩 서열의 일부를 포함하고, 상기 코딩 서열은 상기 코딩 서열의 5' 말단이 제1 N-인테인의 서열에 의해 3' 말단에 측면에 있도록 3개의 부분으로 나뉘고; 상기 코딩 서열의 중간 부분은 제1 C-인테인에 의해 5' 말단에 그리고 제2 N-인테인에 의해 3' 말단에 측면에 존재하고; 상기 코딩 서열의 3' 부분은 제2 C-인테인에 의해 5' 말단에 측면에 있어, 3개 모두의 벡터가 세포에서 발현되는 경우, 3개의 융합 단백질이 생성되고, 관심 전장 단백질이 자발적 트랜스-스플라이싱 반응의 결과로서 생성되며, 여기서 제1 N-인테인은 제1 C-인테인과 반응하고, 제2 N-인테인은 제2 C-인테인과 반응한다.
본 발명의 분할 인테인은 하나의 유전자에 의해 인코딩될 수 있으며, 이는 이후 2개의 개별 인테인 단편, 예를 들어, 분할 인테인을 인코딩하도록 조작되고; 대안적으로, 천연 발생 분할 인테인은 2개의 별개의 유전자에 의해 인코딩되고; 예를 들어, 시아노박테리아에서, DNA 중합효소 III의 촉매 서브유닛인 DnaE는 2개의 별개의 유전자인 dnaE-n 및 dnaE-c에 의해 인코딩된다. 본 발명 내에서 바람직한 인테인은 인테인 단백질(예를 들어, 미니 인테인)으로부터 유래된 인테인 또는 트랜스-스플라이싱 반응을 통해 인테인 단백질을 형성하는 분할 인테인이며, 이는 150 aa 이하의 길이이다.
본 발명의 분할 인테인은 천연 발생 인테인 또는 SEQ ID No. 1 내지 14(동족체)와 100%, 98%, 80%, 75%, 70%, 65%, 60%, 55%, 50% 동일할 수 있으며, 상기 인테인은 트랜스-스플라이싱 반응을 겪는 능력을 보유한다. 본 발명의 범위 내에는 트랜스-스플라이싱 활성을 유지하는 천연 발생 또는 변형 인테인의 단편 또는 변이체가 있다.
편리하게는, 본 발명의 분할 인테인은 상이한 유기체로부터 분리된 동일 유전자로부터 유래될 수 있다. 바람직한 인테인 유전자는 Dna B 및 Dna E이다.
바람직한 구현예에서, 본 발명의 인테인은 노스톡 푼크티포르메(Nostoc punctiforme)(Npu) 시네코시스티스 종(Synechocystis sp.) PCC6803(Ssp), 피쉐렐라 종(Fischerella sp.) PCC 9605, 사이토네마 톨리포트리코이데스(Scytonema tolypothrichoides), 시아노박테리아 박테리움(Cyanobacteria bacterium) SW_9_47_5, 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 플라겔리포르메(Nostoc flagelliforme), 크로코스파에라 왓소니이(Crocosphaera watsonii) WH 8502, 크로오콕시디오프시스 쿠바나(Chroococcidiopsis cubana) CCALA 043, 트리코데스미움 에리트라에움(Trichodesmium erythraeum)을 포함하는 시아노박테리아로부터의 DnaE 유전자(예를 들어, DNA 중합효소 III 서브유닛 알파)로부터 유래된 분할 인테인이고; 바람직하게는, 본 발명의 인테인은 노스톡 푼크티포르메 또는 시네코시스티스 종 PCC6803으로부터 분리된 Dna E 유전자로부터 유래된다.
추가의 바람직한 구현예에서, 본 발명의 인테인은, 예를 들어, (59)에 기재된 R. 마리누스(R. marinus)(Rma), 시네코시스티스 종 PC6803 (Ssp), 포르피라 푸르푸레아(Porphyra purpurea) 엽록체(Ppu)를 포함하는 시아노박테리아로부터의 DnaB 유전자로부터 유래된 분할 인테인이다.
바람직하게는,
- 제1 인테인 뉴클레오티드 서열은 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제2 인테인 뉴클레오티드 서열은 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제3 인테인 뉴클레오티드 서열은 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제4 인테인 뉴클레오티드 서열은 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩한다.
바람직하게는, 제1 또는 제3 인테인이 SEQ ID 1인 경우, 제2 또는 제4는 SEQ ID 2이거나; 제1 또는 제3 인테인이 SEQ ID 3인 경우, 제2 또는 제4 인테인은 SEQ ID 4이거나; 제1 또는 제3 인테인이 SEQ ID 5인 경우, 제2 또는 제4는 SEQ ID 6이거나; 제1 또는 제3 인테인이 SEQ ID 7인 경우, 제2 또는 제4는 SEQ ID 8이거나; 제1 또는 제3 인테인이 SEQ ID 9인 경우, 제2 또는 제4는 SEQ ID 10이거나; 제1 또는 제3 인테인이 SEQ ID 11인 경우, 제2 또는 제4는 SEQ ID 12이다.
바람직하게는, 제1 인테인이 SEQ ID 1이고, 제2 인테인이 SEQ ID 2인 경우, 제3 인테인은 SEQ ID 1이 아니고, 제4 인테인은 SEQ ID 2가 아니고; 바람직하게는 제1 인테인이 SEQ ID 3이고, 제2 인테인이 SEQ ID 4인 경우, 제3 인테인은 SEQ ID 3가 아니고, 제4 인테인은 SEQ ID 4가 아니고; 바람직하게는 제1 인테인이 SEQ ID 5이고, 제2 인테인이 SEQ ID 6인 경우, 제3 인테인은 SEQ ID 5가 아니고, 제4 인테인은 SEQ ID 6이 아니고; 바람직하게는 제1 인테인이 SEQ ID 7이고, 제2 인테인이 SEQ ID 8인 경우, 제3 인테인은 SEQ ID 7이 아니고, 제4 인테인은 SEQ ID 8이 아니고; 바람직하게는 제1 인테인이 SEQ ID 9이고, 제2 인테인이 SEQ ID 10인 경우, 제3 인테인은 SEQ ID 9가 아니고, 제4 인테인은 SEQ ID 10이 아니고; 바람직하게는 제1 인테인이 SEQ ID 11이고, 제2 인테인이 SEQ ID 12인 경우, 제3 인테인은 SEQ ID 11이 아니고, 제4 인테인은 SEQ ID 12가 아니다.
특정 구현예에서, 제1 인테인은 SEQ ID 1이고, 제2 인테인은 SEQ ID 2이고, 제3 인테인은 SEQ ID 3이고, 제4 인테인은 SEQ ID 4이거나; 제1 인테인은 SEQ ID 5이고, 제2 인테인은 SEQ ID 6이고, 제3 인테인은 SEQ ID 3이고, 제4 인테인은 SEQ ID 4이다.
바람직한 구현예에서, 제1 벡터, 제2 벡터 및 제3 벡터는 코딩 서열의 상기 제1 부분(CDS1) 또는 코딩 서열의 상기 제2 부분(CDS2) 또는 코딩 서열의 상기 제3 부분(CDS3)의 5' 말단 부분에 작동 가능하게 연결된 프로모터 서열을 추가로 포함한다.
바람직한 프로모터는 전사 프로모터 활성을 보유하는 단편 및 변이체를 포함하는 편재성, 인공 또는 조직 특이적 프로모터이다. 특히 바람직한 프로모터는 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1), 광수용체간 레티노이드 결합 단백질 프로모터(IRBP), 로돕신 프로모터(RHO), 난황상 황반 디스트로피 2 프로모터(VMD2), 로돕신 키나제 프로모터(RK)를 포함하는 광수용체 특이적 프로모터이고; 추가의 특히 바람직한 프로모터는 MCK, MYODI를 포함하는 근육 특이적 프로모터; 티록신 결합 글로불린(TBG), 하이브리드 간 특이적 프로모터(HLP)를 포함하는 간 특이적 프로모터(67); hSYNl, CaMKIla를 포함하는 뉴런 특이적 프로모터; Ksp-카드헤린16, NKCC2를 포함하는 신장 특이적 프로모터이다. 본 발명에 따른 편재성 프로모터는, 예를 들어, 편재성 사이토메갈로바이러스(CMV)(32) 및 짧은 CMV(33) 프로모터이다. 본 발명의 범위 내의 보다 바람직한 프로모터는 GRK1, TBG, CaMKIla, Ksp-카드헤린16이다.
여전히 바람직한 구현예에서, 제1 벡터, 제2 벡터 및 제3 벡터는 5'-말단 반복(5'-TR) 뉴클레오티드 서열 및 3'-말단 반복(3'-TR) 뉴클레오티드 서열을 추가로 포함하고, 바람직하게는 5'-TR은 5'-역 말단 반복(5'-ITR) 뉴클레오티드 서열이고, 3'-TR은 3'-역 말단 반복(3'-ITR) 뉴클레오티드 서열이다.
여전히 바람직한 구현예에서, 제1 벡터, 제2 벡터 및 제3 벡터는 아데닐중합체형성 신호 뉴클레오티드 서열을 추가로 포함한다.
여전히 바람직한 구현예에서, 코딩 서열은 인코딩된 단백질 생성물의 구조적 도메인 또는 기능적 도메인 내에 속하지 않는 친핵체 아미노산으로 구성된 위치에서 제1 부분, 제2 부분 및 선택적으로 제3 부분으로 분할되며, 여기서 친핵체 아미노산은 세린, 트레오닌 또는 시스테인으로부터 선택된다.
바람직하게는, 제1 벡터, 제2 벡터 및 제3 벡터 중 적어도 하나는 코딩 서열에 작동 가능하게 연결된 적어도 하나의 인핸서 또는 조절 뉴클레오티드 서열을 추가로 포함한다.
선택적으로, 제1 벡터, 제2 벡터 및 제3 벡터 중 적어도 하나는 재구성된 인테인 단백질의 안정성을 감소시키기 위해 적어도 하나의 분해 신호를 추가로 포함한다.
바람직하게는, 상기 분해 신호는 CL1 데그론(degron) 또는 PB29 데그론이다. 보다 바람직하게는, 상기 분해 신호는 ecDHFR 또는 이의 단편이고, 바람직하게는 ecDHFR 분해 신호는 본원에 기재된 바와 같이 내부 데그론으로 기능하는 변이체 DHFR이다. 가장 바람직하게는, 단편은 ecDHFR의 분해 특성을 보유하고, 바람직하게는 내부 데그론으로 기능하는 변이체 DHFR의 특성을 보유하고, 바람직하게는 단편은 미니 ecDHFR이며, 여기서 미니 ecDHFR은 내부 데그론으로 기능하는 변이체이다.
바람직하게는, 코딩 서열은 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애는 망막 변성, 대사 장애, 혈액 장애, 신경퇴행성 장애, 청력 상실, 채널병증, 폐질환, 근육병증, 심장병, 근육 디스트로피이다.
여전히 바람직하게는, 코딩 서열은 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애는 망막 변성이고, 바람직하게는 망막 변성은 유전되며, 바람직하게는 병리 또는 질병은 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반 디스트로피, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택된다. 보다 바람직하게는, 코딩 서열은 ABCA4, MY07A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1 또는 길이가 5kb를 초과하는 코딩 서열을 갖는 이의 단편 또는 이의 오쏠로그(ortholog) 또는 이의 미니유전자, 즉, 유전자가 야생형 유전자 단편과 동일한 방식으로 자체를 발현하는 데 필요한 하나 이상의 엑손 및 조절 요소를 포함하는 최소 유전자 단편으로 구성된 군으로부터 선택되는 유전자의 코딩 서열이다.
또한 바람직하게는, 코딩 서열은 근육 디스트로피, 예를 들어, 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병을 교정할 수 있는 단백질을 인코딩한다.
보다 바람직하게는, 코딩 서열은 ABCA4, MY07A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1 또는 길이가 5kb를 초과하는 코딩 서열을 갖는 이의 단편 또는 이의 오쏠로그 또는 이의 미니유전자, 즉, 유전자가 야생형 유전자 단편과 동일한 방식으로 자체를 발현하는 데 필요한 하나 이상의 제어 영역을 포함하는 최소 유전자 단편으로 구성된 군으로부터 선택되는 유전자의 코딩 서열이다.
여전히 바람직하게는, 코딩 서열은 DMD, CFTR, F8, ATP7B, PAH, DYSF, MECP2, PKD, NPC1, HTT 또는 길이가 5kb를 초과하는 코딩 서열을 갖는 이의 단편 또는 이의 오쏠로그 또는 이의 미니유전자, 즉, 유전자가 야생형 유전자 단편과 동일한 방식으로 자체를 발현하는 데 필요한 하나 이상의 조절 요소를 포함하는 최소 유전자 단편으로 구성된 군으로부터 선택되는 유전자의 코딩 서열이다.
본 발명의 특히 바람직한 구현예에서, 코딩 서열은 ABCA4 유전자를 인코딩한다. 바람직하게는, 상기 코딩 서열은 상기 ABCA4 단백질의 aa Cys1150, Ser1168, Ser1090에 상응하는 뉴클레오티드에서 분할되고, 분할 인테인은 분할 지점에 삽입된다.
추가의 바람직한 구현예에서, 코딩 서열은 CEP290 유전자를 인코딩한다. 바람직하게는, 상기 코딩 서열은 aa Cys1076; Ser1275에 상응하는 뉴클레오티드에서 분할된다. 보다 바람직하게는, 상기 코딩 서열은 상기 CEP290 단백질의 aa Cys929 및 1474; Ser 453 및 Cys1474에 해당하는 뉴클레오티드 서열에서 분할되고, 2개의 분할 인테인은 분할 지점에 삽입된다.
EGFP SEQ ID No. 15
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다. 분할 Cys.71(굵은 글씨)
ABCA4 SEQ ID No. 16
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다.
분할 세트1 Cys.1150 (굵은 글씨)
분할 세트2 Ser.1168 (밑줄이 있는 글씨)
분할 세트3 Ser.1090(이탤릭체)
CEP290 SEQ ID No. 17
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다.
분할 세트1 Cys.1076 (굵은 글씨)
분할 세트2-3 Ser.1275 (밑줄이 있는 글씨)
분할 세트4 Cys.929 및 Cys.1474 (이탤릭체)
F8 SEQ ID No. 18
c-엑스테인의 제1 아미노산은 서열 내에서 강조된다.
분할 세트1 Cys.1312
(밑줄이 있는 글씨) 세트 분할 세트2 Ser.984(굵은 글씨)
ecDHFR SEQ ID No. 19
미니 ecDHFR SEQ ID No. 20
바람직한 구현예에서, 본 발명의 벡터 시스템은,
a) 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 코딩 서열(CDS1)의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1)의 5' 말단 부분;
- N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터: 및
b) 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS2)의 3' 말단 부분; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터를 포함하거나,
a') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 코딩 서열(CDS1')의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1')의 5' 말단 부분;
- 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터; 및
b') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS2')의 제2 부분; 및
- 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열;
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터; 및
c') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS3')의 제3 부분; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제3 벡터를 포함한다.
바람직하게는, 상기 제1, 제2 및 제3 벡터는 독립적으로 바이러스 벡터, 바람직하게는 아데노바이러스 벡터 또는 아데노-관련 바이러스(AAV) 벡터이고, 바람직하게는 상기 제1, 제2 및 제3 아데노-관련 바이러스(AAV) 벡터는 동일하거나 상이한 AAV 혈청형으로부터 선택되고, 바람직하게는 혈청형은 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9, 혈청형 7m8, 혈청형 sh10; 혈청형 2(quad Y-F)로부터 선택된다.
본 발명은 또한 상기 정의된 바와 같은 벡터 시스템으로 형질전환된 숙주 세포를 제공한다.
바람직하게는, 벡터 시스템 또는 숙주 세포는 의학적 용도를 위한 것이고, 바람직하게는 유전자 요법에 사용하기 위한 것이고, 바람직하게는 망막 변성, 대사 장애, 혈액 장애, 신경퇴행성 장애, 청력 손실, 채널병증, 폐질환, 근육병증, 심장병, 황반 디스트로피를 특징으로 하는 병리 또는 질병의 치료 및/또는 예방에서 사용하기 위한 것이다.
바람직하게는, 망막 변성은 유전되며, 바람직하게는 병리 또는 질병은 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반 디스트로피, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택된다.
바람직하게는, 벡터 시스템 또는 숙주 세포는 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병의 예방 및/또는 치료에서 사용하기 위한 것이다.
본 발명은 또한 본 발명의 벡터 시스템 또는 숙주 세포 및 약학적으로 허용되는 비히클을 포함하는 약학적 조성물을 제공한다.
도 1: AAV 인테인은 이중 AAV보다 높은 수준으로 그리고 단일 AAV로 달성된 수준까지 시험관 내 및 마우스 및 돼지 망막 모두에서 EGFP를 재구성한다.
(a) AAV 인테인 매개 단백질 트랜스-스플라이싱의 도식 표현. ITR: AAV2 역 말단 반복; CDS: 코딩 서열; : 3x플래그 태그; 폴리A: 아데닐중합체형성 신호.
(b) 전장 또는 AAV 인테인 CMV-EGFP 플라스미드로 형질감염된 HEK293의 용해질의 웨스턴 블롯(WB) 분석. pEGFP: 전장 EGFP 플라스미드; pAAV I+II : AAV-EGFP I+II 인테인 플라스미드; pAAV I : 단일 AAV-EGFP I 인테인 플라스미드; pAAV II : 단일 AAV-EGFP II 인테인 플라스미드; Neg: 형질감염되지 않은 세포. 화살표는 전장 EGFP 단백질(EGFP), EGFP 단백질의 N- 및 C-말단 반쪽(각각 B 및 A), 및 전장 EGFP 단백질로부터 절제된 재구성된 인테인(C)을 나타낸다. WB는 n=3 독립 실험을 나타낸다.
(c) 단일, 인테인 또는 이중 AAV2/2-CMV-EGFP 벡터로 감염된 HEK293의 용해질의 WB 분석. WB는 n=5 독립 실험을 나타낸다.
(d) AAV2/8-CMV-EGFP 인테인 벡터로 망막하 주사된 C57BL/6J 마우스로부터의 망막 냉동절편. 스케일 바: 50 μm. RPE: 망막 색소 상피; OS: 외부 세그먼트; ONL: 외부 핵층.
(e-f) 단일 인테인 또는 이중 AAV2/8-GRK1-EGFP 벡터로 망막하 주사된 C57BL/6J 마우스(e) 또는 대형 백색 돼지(f)로부터의 망막 냉동절편. 스케일 바: 50 μm
(e); 200 μm (f). OS: 외부 세그먼트; ONL: 외부 핵층.
(g) 배양 293일에 AAV2/2-GRK1-EGFP-인테인 벡터로 감염된 망막 오르가노이드의 형광 분석. 스케일 바: 100 μm.
도 2: AAV 인테인의 최적화는 큰 ABCA4 및 CEP290 단백질의 적절한 재구성을 허용한다.
(a-b) AAV-shCMV-ABCA4 또는 -CEP290 인테인 플라스미드의 상이한 세트(각각 세트 1 및 세트 5)로 형질감염된 HEK293으로부터의 용해질의 웨스턴 블롯(WB) 분석. 사용된 다양한 세트의 도식 표현은 도 16에 도시되어 있다. WB는 n=3 독립 실험을 나타낸다.
(c-d) AAV-shCMV-ABCA4(c) 또는 AAV-shCMV-CEP290(d) 인테인 플라스미드로 형질감염된 HeLa 세포의 면역형광 분석의 대표 이미지. pABCA4(c) 또는 pCEP290(d): 전장 발현 카세트를 포함하는 플라스미드; pAAV 인테인: AAV-인테인 플라스미드(c에서 세트 1 또는 d에서 세트 5); I+II+III: AAV I+II+III 인테인 플라스미드; I+II: AAV I+II 인테인 플라스미드; I+III: AAV I+III 인테인 플라스미드; II+III: AAV II+III 인테인 플라스미드; I: 단일 AAV I 인테인 플라스미드; II: 단일 AAV II 인테인 플라스미드; III: 단일 AAV III 인테인 플라스미드; Neg: 형질감염되지 않은 세포.
세포는 c에서 3x플래그 및 VAP-B(세포질그물 마커) 및 TGN46(트랜스-골지 네트워크 마커) 또는 d에서 아세틸화 튜불린(미세관의 마커)에 대해 염색되었다. 백색 화살표는 도 18에서 더 높은 배율로 제시된 세포를 가리킨다.
도 3: AAV 인테인은 이중 AAV 벡터보다 더 효율적으로 큰 ABCA4 및 CEP290 단백질을 재구성한다.
이중 또는 인테인 AAV2/2-shCMV-ABCA4(a) 또는 -CEP290(b) 벡터로 감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석.
AAV 인테인: AAV-ABCA4(세트 1, a) 또는 -CEP290(세트 5, b) 인테인 벡터; I+II+III: AAV I+II+III 인테인 벡터; I+II: AAV I+II 인테인 벡터; I+III: AAV I+III 인테인 벡터; II+III: AAV II+III 인테인 벡터; I: 단일 AAV I 인테인 벡터; II: 단일 AAV II 인테인 벡터; III: 단일 AAV III 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터.
(a) 화살표는 전장 ABCA4 단백질을 나타내고, a: AAV I에서 유래된 단백질 생성물; B: AAV II로부터 유래된 단백질 생성물을 나타낸다. * 잠재적으로 상이한 번역 후 변형을 갖는 단백질 생성물.
(b) 화살표는 전장 CEP290 단백질을 나타내고, a: AAV II+III로부터 유래된 단백질 생성물; b: AAV I+II로부터 유래된 단백질 생성물; c: AAV II로부터 유래된 단백질 생성물; d: AAV III로부터 유래된 단백질 생성물; e: AAV I으로부터 유래된 단백질 생성물. WB는 n=3 독립 실험을 나타낸다.
도 4: AAV 인테인은 마우스, 돼지 및 인간 광수용체에서 큰 단백질을 치료 수준으로 재구성한다.
(a-c) 이중 또는 인테인 AAV2/8-GRK1-ABCA4(a, c) 또는 -CEP290(b) 벡터(각각 세트 1 및 세트 5)가 주사된 야생형 마우스(a, b) 또는 대형 백색 돼지(c)로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터 또는 PBS.
(d) AAV2/2-GRK1-ABCA4 인테인 벡터로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 WB 분석. AAV 인테인: AAV-ABCA4 인테인 벡터; Neg: 감염되지 않은 오르가노이드; -/-: STGD1 환자로부터 유래된 오르가노이드.
(a, c, d) 화살표는 전장 ABCA4 단백질(ABCA4)을 나타내고, a: AAV I에서 유래된 단백질 생성물; b: AAV II로부터 유래된 단백질 생성물을 나타낸다. * 잠재적으로 상이한 번역 후 변형을 갖는 단백질 생성물.
(b) 화살표는 전장 CEP290 단백질(CEP290)을 모두 나타내고; a: AAV II+III로부터 유래된 단백질 생성물 및 d: AAV III로부터 유래된 단백질 생성물.
도 5: AAV 인테인의 망막하 투여는 유전성 망막 변성의 마우스 모델의 망막 표현형을 개선한다.
(a) AAV 인테인으로 처리된 Abca4-/- 마우스의 RPE에서 리포푸신(lipofuscin)이 차지하는 평균 영역의 정량화. 각각의 도트는 각각의 눈에 대해 측정된 평균 값을 나타낸다. 각각의 그룹에 대한 리포푸신 영역의 평균 값이 그래프에 표시된다. +/+ 또는 +/-: 대조 주사된 Abca4+/+ 또는 +/- 눈(PBS); -/-: 음성 대조군 주사된 Abca4-/- 눈(AAV I ABCA4 또는 AAV II ABCA4 또는 PBS); -/- AAV 인테인: AAV 인테인 벡터가 주사된 Abca4-/- 눈(세트 1). * ANOVA p 값 <0.05; *** ANOVA p 값 <0.001.
(b) AAV2/8-GRK1-CEP290 인테인 벡터(AAV 인테인, 세트 5)가 망막하 주사되거나 음성 대조군(Neg; 즉 AAV I+II 또는 AAV II+III 또는 PBS)이 주사된 야생형의 주사되지 않은 rd16 마우스로부터의 망막 섹션의 대표 이미지. 스케일 바: 25 μm. 각각의 이미지에서 측정된 ONL의 두께는 수직의 흑색 선으로 표시된다. RPE: 망막 색소 상피; ONL: 외부 핵층; INL: 내부 핵층; GCL: 신경절 세포층.
(c) AAV2/8-GRK1-CEP290 인테인 벡터(AAV 인테인, 세트 5)가 망막하 주사되거나 음성 대조군(Neg; 즉 AAV I+II 또는 AAV II+III 또는 PBS)이 주사된 야생형의 주사되지 않은 마우스 및 rd16 마우스로부터의 눈의 대표 이미지. 백색 원은 동공을 정의한다.
도 6: 큰 단백질의 단백질 트랜스-스플라이싱 매개 재구성의 도식 표현.
큰 유전자의 코딩 서열(CDS)은 2개의 반쪽(5' 및 3')으로 분할되고, 역 말단 반복(ITR)이 측면에 있으며, 이는 2개의 AAV 캡시드로 별도로 패키징된다. 동일 세포의 공동 형질도입시, 단백질 수준에서 2개의 반쪽을 결합하여 전장 단백질 발현을 재구성하기 위해 상이한 메커니즘이 활용된다. 5'-벡터는 5' CDS, 5' 인테인(n-인테인) 및 데그론을 포함하는 반면, 3'-벡터는 3'CDS 및 3' 인테인(c-인테인)을 포함하며; 둘 모두의 벡터는 프로모터 및 폴리A를 포함한다. 2개의 절반 폴리펩티드의 쌍형성은 인테인 자기-이식을 통해 매개되며; 숙주 단백질로부터의 이후의 인테인 자가-절제는 전장 단백질 재구성을 발생시킨다. 데그론은 이제 절제된 인테인에 포매되며, 프로테아좀에 의해 신속하게 유비퀴틴화되고 분해된다.
도 7: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 EGFP 발현.
ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 EGFP 단백질(EGFP), 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 8: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 ABCA4 발현.
ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 ABCA4 단백질(ABCA4), 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 9: 인테인 DnaE-ecDHFR 발현은 TMP-의존적이다.
ecDHFR을 함유하거나(pAAV 인테인+ecDHFR) 함유하지 않는(pAAV 인테인) AAV_ABCA4 인테인 플라스미드로 형질감염되고, 증가된 용량의 트리메트로핀(Trimetrophin)(1 내지 50 )으로 처리된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않는(DnaE) 절제된 인테인을 나타낸다.
도 10: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 EGFP 발현.
미니 ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 EGFP 단백질(EGFP), 데그론을 함유하거나(DnaE+미니 ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 11. 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 ABCA4 발현.
미니 ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 ABCA4 단백질(ABCA4), 데그론을 함유하거나(DnaE+미니 ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 12: 단일 AAV I 또는 AAV II 인테인 플라스미드가 아닌 AAV I+II로 형질감염된 HEK293 세포에서의 EGFP 형광.
전장 또는 인테인 CMV-EGFP 플라스미드로 형질감염된 HEK293 세포의 형광 분석. pEGFP: 전장 EGFP 발현 카세트를 포함하는 플라스미드; pAAV I+II : AAV I+II 인테인 플라스미드; pAAV I : 단일 AAV-EGFP I 인테인 플라스미드; pAAV II : 단일 AAV II 인테인 플라스미드; Neg: 형질감염되지 않은 세포. 스케일 바: 100 μm.
도 13: 전장 단백질에 대한 인테인은 종에 따라 다르다.
AAV-CMV-EGFP(a) 또는 AAV-GRK1-EGFP 인테인 벡터(b-c)로 감염된 HEK293 세포(a), C57BL/6J 마우스(b) 및 대형 백색 돼지 망막(c)으로부터의 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터로 감염된 세포(a) 또는 AAV 인테인 벡터로 주사된 눈(b, c); Neg: 감염되지 않은 세포(a) 또는 PBS로 주사된 눈(b, c). 화살표는 전장 EGFP 단백질(EGFP) 및 절제된 인테인(DnaE) 둘 모두를 나타낸다.
도 14: 인간 iPSCs-유래 3D 망막 오르가노이드의 특성규명.
(a) 배양 183일에 망막 오르가노이드의 광학 현미경 분석.
(b) 성숙한 광수용체 마커에 대한 항체를 사용한 면역형광 분석. 스케일 바: 100 μm.
(c) AAV2/2-CMV-EGFP 및 AAV2/2-IRBP-DsRed 벡터 둘 모두로 감염된 망막 오르가노이드의 형광 분석. 스케일 바: 100 μm.
(d) 배양 230일에 망막 오르가노이드의 표면으로부터 돌출된 외부 세그먼트-유사 구조가 관찰되었다. 삽입된 도면은 방사형 구조를 갖는 외부 세그먼트(OS) 유사 구조의 존재를 나타낸다. NR: 신경 망막; RPE: 망막 색소 상피.
(e) 주사 전자 현미경 분석은 내부 세그먼트(IS), 연결 섬모(CC) 및 외부 세그먼트(OS)-유사 구조의 존재를 나타낸다. 스케일 바: 4 μm.
(f) 전자 현미경 분석은 외부 제한 막(*), 중심소체(C), 기저 소체(BB), 연결 섬모(CC) 및 외부 세그먼트의 스케치(OS)의 존재를 나타낸다. 삽입된 도면은 OS에서 조직화되지 않은 막 디스크의 존재를 나타낸다. 스케일 바: 500 nm.
D: 배양일.
도 15: 인간 3D 망막 오르가노이드에서 전장 단백질에 비해 낮은 인테인.
AAV2/2-GRK1-EGFP 인테인 벡터로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; Neg: 감염되지 않은 오르가노이드. 화살표는 전장 EGFP 단백질(EGFP) 및 절제된 인테인(DnaE) 둘 모두를 나타낸다.
도 16: AAV-ABCA4 및 -CEP290 인테인의 다양한 세트의 도식 표현.
(a) AAV-ABCA4-인테인 작제물. (작제물에 의해 예시된 세트 1-2) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: Npu의 DnaE로부터의 c-인테인; (세트 3) n-mDnaE: Npu의 돌연변이된 DnaE(mNpu)로부터의 n-인테인; c-mDnaE: mNpu의 DnaE 로부터의 c-인테인.
(b) AAV-CEP290-인테인 작제물. (세트 1) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: Npu의 DnaE로부터의 c-인테인; sh폴리A: 짧은 합성 폴리A; (세트 2) n-DnaE: mNpu의 DnaE로부터의 n-인테인; c-DnaE: mNpu의 DnaE로부터의 c-인테인; (세트 3) n-mDnaE: mNpu의 DnaE로부터의 n-인테인; c-mDnaE: mNpu의 DnaE로부터의 c-인테인; (세트 4) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: AAV I과 AAV II 사이의 Npu의 DnaE로부터의 c-인테인; n-DnaB: 로도써무스 마리누스(Rma)의 DnaB로부터의 N-인테인; c-DnaB: AAV II와 AAV III 사이의 Rma의 DnaE로부터의 c-인테인; wpre: 우드척(Woodchuck) 간염 바이러스 전사 후 조절 요소. (세트 5) n-mDnaE: mNpu의 DnaE로부터의 n-인테인; c-mDnaE: AAV I과 AAV II 사이의 mNpu의 DnaE로부터의 c-인테인; n-DnaB: 로도써무스 마리누스(Rma)의 DnaB로부터의 n-인테인; c-DnaB: AAV II와 AAV III 사이의 Rma의 DnaE로부터의 c-인테인; wpre: 우드척 간염 바이러스 전사 후 조절 요소. (a-b) ITR: AAV2 역 말단 반복; : 3x플래그 태그; 프로모터: 시험관 내 실험을 위한 짧은 CMV 및 생체 내 실험을 위한 인간 G-단백질 결합 수용체(GRK1) 프로모터; 폴리A: 유인원 바이러스 40 아데닐중합체형성 신호(ABCA4의 경우, a) 및 소 성장 호르몬 아데닐중합체형성 신호(CEP290의 경우, b). 각각의 세트의 분할 지점의 아미노산이 도면에 도시된다. 예측된 단백질 분자량은 각각의 AAV 벡터 아래에 도시된다.
도 17: 이종 N- 및 C-인테인의 조합은 시험관 내에서 검출 가능한 EGFP 단백질 재구성을 발생시키지 않는다.
전장 또는 인테인 AAV-CMV-EGFP 플라스미드로 형질감염된 HEK293 세포의 형광 분석. N+C-DnaE: DnaE로부터의 인테인에 융합된 AAV I+II; N+C-DnaB: DnaB으로부터의 인테인에 융합된 AAV I+II; N+C-mDnaE: mDnaE로부터의 분할-인테인에 융합된 AAV I+II; N-DnaE+C-DnaB: DnaE로부터의 n-인테인에 융합된 AAV I 및 DnaB로부터의 c-인테인에 융합된 AAV II; N-DnaB+C-DnaE: DnaB로부터의 n-인테인에 융합된 AAV I 및 DnaE로부터의 c-인테인에 융합된 AAV II; N-mDnaE+C-DnaB: mDnaE로부터의 n-인테인에 융합된 AAV I 및 DnaB로부터의 c-인테인에 융합된 AAV II; N-DnaB+C-mDnaE: DnaB로부터의 n-인테인에 융합된 AAV I 및 mDnaE로부터의 c-인테인에 융합된 AAV II; pEGFP: 전장 EGFP 발현 카세트를 포함하는 플라스미드; Neg: 형질감염되지 않은 세포. 스케일 바: 100 μm.
도 18: CEP290은 미세소관을 따라 정렬한다.
도 2d로부터의 단일 세포의 확대. 전장 CEP290 발현 카세트(pCEP290)를 포함하는 플라스미드 또는 CEP290 인테인 플라스미드(세트 5, pAAV I+II+III)로 형질감염된 HeLa 세포의 면역형광 분석. 세포는 3x플래그 및 아세틸화 튜불린(미세소관의 마커)에 대해 염색되었다. 스케일 바: 50 μm.
짧은-CMV-ABCA4(세트 1, a) 또는 -CEP290(세트 5, b)을 인코딩하는 전장 또는 AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석.
(a) pABCA4: 전장 ABCA4 발현 카세트; 세트 1: ABCA4 (Cys.1150)-인테인 플라스미드.
(b) pCEP290: 전장 CEP290 발현 카세트; 세트 5: CEP290(Ser.453 및 Cys.1474)-인테인 플라스미드.
Neg: AAV EGFP 플라스미드. WB는 n=3 독립 실험을 나타낸다.
도 19: AAV 인테인 플라스미드의 형질감염은 전장 발현 카세트를 갖는 단일 플라스미드의 형질감염보다 더 적은 양으로 ABCA4 및 CEP290 단백질을 재구성한다.
짧은-CMV-ABCA4(a) 또는 -CEP290(b)을 인코딩하는 전장 또는 AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. (a) pABCA4: 전장 ABCA4 발현 카세트; 세트 1: ABCA4 (Cys.1150)-인테인 플라스미드. (b) pCEP290: 전장 CEP290 발현 카세트; 세트 5: CEP290(Ser.453 및 Cys.1474)-인테인 플라스미드. Neg: AAV EGFP 플라스미드. WB는 n=3 독립 실험을 나타낸다.
도 20: AAV 인테인 벡터의 망막하 전달은 마우스 망막에서 ABCA4 발현을 발생시킨다.
이중 또는 인테인 AAV2/8-GRK1-ABCA4 벡터(세트 1)가 주사된 야생형 마우스로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터.
도 21: AAV 인테인은 내인성 Abca4의 약 10%를 재구성한다.
AAV2/8-GRK1-ABCA4 인테인 벡터(세트 1)가 주사된 Abca4 +/- 또는 Abca4 -/- 마우스로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. mAbca4: Abca4 +/- 망막; AAV 인테인: AAV 인테인 주사된 망막; Neg: 주사되지 않은 망막. 겔 #2 및 #3에 로딩된 Abca4+/-로부터의 망막 용해질은 동일하다. 내인성에 비한 AAV 인테인 ABCA4 발현의 백분율은 각각의 레인 아래에 도시된다.
도 22: AAV 인테인은 인간 망막 오르가노이드에서 전장 ABCA4 단백질을 재구성한다.
AAV2/2-GRK1-ABCA4 인테인 벡터(세트 1)로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 웨스턴 블롯 분석. AAV 인테인: AAV 인테인 벡터; Neg: 감염되지 않은 오르가노이드. -/-: STGD1 환자로부터 유래된 오르가노이드; +/+: 건강한 공여자로부터 유래된 오르가노이드.
도 23: AAV 인테인 벡터의 망막하 투여는 Abca4 -/- 마우스에서 리포푸신(lipofuscin) 축적을 감소시킨다.
음성 대조군(Neg) 또는 AAV 인테인 벡터(세트 1)가 주사된 야생형 및 Abca4-/- 마우스의 RPE에서 리포푸신 과립을 제시하는 투과 전자 현미경 분석의 대표적 사진. 백색 화살표는 리포푸신 과립을 나타낸다; M: 미토콘드리아.
도 24: 마우스에서 AAV 인테인 벡터의 망막하 전달은 ONL 두께를 변형시키지 않는다.
AAV 인테인 벡터, 관련되지 않은 AAV 벡터(AAV neg) 또는 PBS로 망막하 주사된 C57BL/6J 마우스 눈의 스펙트럼 도메인 광학 간섭 단층촬영 분석. 흑색 막대는 AAV-ABCA4 인테인 벡터(세트 1), 및 이들의 상응하는 대조군으로 주사 후 6개월의 눈을 나타내고; 백색 막대는 AAV-CEP290 인테인 벡터(세트 5), 및 이들의 상응하는 대조군으로 주사 후 4.5개월의 눈을 나타낸다. 데이터는 평균 ± s.e로 표시된다. 평균 값은 해당 막대 위에 표시된다.
도 25. AAV 인테인 벡터는 전장 야생형 F8을 전달할 수 있다.
a) 단일 AAV B-도메인 결실 변이체 3 인자 VIII(F8-V3) 및 AAV F8 인테인 벡터의 도식표현.
F8 유전자의 코딩 서열은 2개의 반쪽(5' 및 3' F8)로 분할되고, 역 말단 반복(ITR)이 측면에 있으며, 이는 2개의 AAV 캡시드로 별도로 패키징된다. 5'-벡터는 5' F8 및 5' 인테인(n-DnaE)을 포함하는 반면, 3'-벡터는 3' F8 및 3' 인테인(c-DnaE)을 포함하며; 둘 모두의 벡터는 HLP 프로모터 및 합성 폴리A를 포함한다. V3, 변이체 3; SS, 신호 서열.
b) F8 인테인은 단일 특대 AAV F8-V3와 달리 정의된 벡터 유전체를 사용하여 AAV 캡시드로 적절하게 패키징된다.
HLP 프로모터에 특이적인 프로브를 사용한 벡터 유전체 온전성의 서던 블롯 분석은 AAV F8 인테인 벡터에 존재하지 않는 특대 AAV F8-V3에서 트렁케이션된 생성물을 나타내었다. Neg, 음성 대조군.
c) AAV F8 인테인 벡터는 주사 후 8주에 혈우병 A 넉아웃 마우스의 출혈 표현형의 약간의 보정을 제시한다.
AAV F8 인테인(둘 모두 분할 지점) 주사 후 8주에 혈우병 A 넉아웃 마우스의 혈장 샘플의 aPTT 분석은 PBS 주사 대조군에 비해 약간의 표현형 보정을 제시한다. aPTT, 활성화된 부분 트롬보플라스틴 시간.
(a) AAV 인테인 매개 단백질 트랜스-스플라이싱의 도식 표현. ITR: AAV2 역 말단 반복; CDS: 코딩 서열; : 3x플래그 태그; 폴리A: 아데닐중합체형성 신호.
(b) 전장 또는 AAV 인테인 CMV-EGFP 플라스미드로 형질감염된 HEK293의 용해질의 웨스턴 블롯(WB) 분석. pEGFP: 전장 EGFP 플라스미드; pAAV I+II : AAV-EGFP I+II 인테인 플라스미드; pAAV I : 단일 AAV-EGFP I 인테인 플라스미드; pAAV II : 단일 AAV-EGFP II 인테인 플라스미드; Neg: 형질감염되지 않은 세포. 화살표는 전장 EGFP 단백질(EGFP), EGFP 단백질의 N- 및 C-말단 반쪽(각각 B 및 A), 및 전장 EGFP 단백질로부터 절제된 재구성된 인테인(C)을 나타낸다. WB는 n=3 독립 실험을 나타낸다.
(c) 단일, 인테인 또는 이중 AAV2/2-CMV-EGFP 벡터로 감염된 HEK293의 용해질의 WB 분석. WB는 n=5 독립 실험을 나타낸다.
(d) AAV2/8-CMV-EGFP 인테인 벡터로 망막하 주사된 C57BL/6J 마우스로부터의 망막 냉동절편. 스케일 바: 50 μm. RPE: 망막 색소 상피; OS: 외부 세그먼트; ONL: 외부 핵층.
(e-f) 단일 인테인 또는 이중 AAV2/8-GRK1-EGFP 벡터로 망막하 주사된 C57BL/6J 마우스(e) 또는 대형 백색 돼지(f)로부터의 망막 냉동절편. 스케일 바: 50 μm
(e); 200 μm (f). OS: 외부 세그먼트; ONL: 외부 핵층.
(g) 배양 293일에 AAV2/2-GRK1-EGFP-인테인 벡터로 감염된 망막 오르가노이드의 형광 분석. 스케일 바: 100 μm.
도 2: AAV 인테인의 최적화는 큰 ABCA4 및 CEP290 단백질의 적절한 재구성을 허용한다.
(a-b) AAV-shCMV-ABCA4 또는 -CEP290 인테인 플라스미드의 상이한 세트(각각 세트 1 및 세트 5)로 형질감염된 HEK293으로부터의 용해질의 웨스턴 블롯(WB) 분석. 사용된 다양한 세트의 도식 표현은 도 16에 도시되어 있다. WB는 n=3 독립 실험을 나타낸다.
(c-d) AAV-shCMV-ABCA4(c) 또는 AAV-shCMV-CEP290(d) 인테인 플라스미드로 형질감염된 HeLa 세포의 면역형광 분석의 대표 이미지. pABCA4(c) 또는 pCEP290(d): 전장 발현 카세트를 포함하는 플라스미드; pAAV 인테인: AAV-인테인 플라스미드(c에서 세트 1 또는 d에서 세트 5); I+II+III: AAV I+II+III 인테인 플라스미드; I+II: AAV I+II 인테인 플라스미드; I+III: AAV I+III 인테인 플라스미드; II+III: AAV II+III 인테인 플라스미드; I: 단일 AAV I 인테인 플라스미드; II: 단일 AAV II 인테인 플라스미드; III: 단일 AAV III 인테인 플라스미드; Neg: 형질감염되지 않은 세포.
세포는 c에서 3x플래그 및 VAP-B(세포질그물 마커) 및 TGN46(트랜스-골지 네트워크 마커) 또는 d에서 아세틸화 튜불린(미세관의 마커)에 대해 염색되었다. 백색 화살표는 도 18에서 더 높은 배율로 제시된 세포를 가리킨다.
도 3: AAV 인테인은 이중 AAV 벡터보다 더 효율적으로 큰 ABCA4 및 CEP290 단백질을 재구성한다.
이중 또는 인테인 AAV2/2-shCMV-ABCA4(a) 또는 -CEP290(b) 벡터로 감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석.
AAV 인테인: AAV-ABCA4(세트 1, a) 또는 -CEP290(세트 5, b) 인테인 벡터; I+II+III: AAV I+II+III 인테인 벡터; I+II: AAV I+II 인테인 벡터; I+III: AAV I+III 인테인 벡터; II+III: AAV II+III 인테인 벡터; I: 단일 AAV I 인테인 벡터; II: 단일 AAV II 인테인 벡터; III: 단일 AAV III 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터.
(a) 화살표는 전장 ABCA4 단백질을 나타내고, a: AAV I에서 유래된 단백질 생성물; B: AAV II로부터 유래된 단백질 생성물을 나타낸다. * 잠재적으로 상이한 번역 후 변형을 갖는 단백질 생성물.
(b) 화살표는 전장 CEP290 단백질을 나타내고, a: AAV II+III로부터 유래된 단백질 생성물; b: AAV I+II로부터 유래된 단백질 생성물; c: AAV II로부터 유래된 단백질 생성물; d: AAV III로부터 유래된 단백질 생성물; e: AAV I으로부터 유래된 단백질 생성물. WB는 n=3 독립 실험을 나타낸다.
도 4: AAV 인테인은 마우스, 돼지 및 인간 광수용체에서 큰 단백질을 치료 수준으로 재구성한다.
(a-c) 이중 또는 인테인 AAV2/8-GRK1-ABCA4(a, c) 또는 -CEP290(b) 벡터(각각 세트 1 및 세트 5)가 주사된 야생형 마우스(a, b) 또는 대형 백색 돼지(c)로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터 또는 PBS.
(d) AAV2/2-GRK1-ABCA4 인테인 벡터로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 WB 분석. AAV 인테인: AAV-ABCA4 인테인 벡터; Neg: 감염되지 않은 오르가노이드; -/-: STGD1 환자로부터 유래된 오르가노이드.
(a, c, d) 화살표는 전장 ABCA4 단백질(ABCA4)을 나타내고, a: AAV I에서 유래된 단백질 생성물; b: AAV II로부터 유래된 단백질 생성물을 나타낸다. * 잠재적으로 상이한 번역 후 변형을 갖는 단백질 생성물.
(b) 화살표는 전장 CEP290 단백질(CEP290)을 모두 나타내고; a: AAV II+III로부터 유래된 단백질 생성물 및 d: AAV III로부터 유래된 단백질 생성물.
도 5: AAV 인테인의 망막하 투여는 유전성 망막 변성의 마우스 모델의 망막 표현형을 개선한다.
(a) AAV 인테인으로 처리된 Abca4-/- 마우스의 RPE에서 리포푸신(lipofuscin)이 차지하는 평균 영역의 정량화. 각각의 도트는 각각의 눈에 대해 측정된 평균 값을 나타낸다. 각각의 그룹에 대한 리포푸신 영역의 평균 값이 그래프에 표시된다. +/+ 또는 +/-: 대조 주사된 Abca4+/+ 또는 +/- 눈(PBS); -/-: 음성 대조군 주사된 Abca4-/- 눈(AAV I ABCA4 또는 AAV II ABCA4 또는 PBS); -/- AAV 인테인: AAV 인테인 벡터가 주사된 Abca4-/- 눈(세트 1). * ANOVA p 값 <0.05; *** ANOVA p 값 <0.001.
(b) AAV2/8-GRK1-CEP290 인테인 벡터(AAV 인테인, 세트 5)가 망막하 주사되거나 음성 대조군(Neg; 즉 AAV I+II 또는 AAV II+III 또는 PBS)이 주사된 야생형의 주사되지 않은 rd16 마우스로부터의 망막 섹션의 대표 이미지. 스케일 바: 25 μm. 각각의 이미지에서 측정된 ONL의 두께는 수직의 흑색 선으로 표시된다. RPE: 망막 색소 상피; ONL: 외부 핵층; INL: 내부 핵층; GCL: 신경절 세포층.
(c) AAV2/8-GRK1-CEP290 인테인 벡터(AAV 인테인, 세트 5)가 망막하 주사되거나 음성 대조군(Neg; 즉 AAV I+II 또는 AAV II+III 또는 PBS)이 주사된 야생형의 주사되지 않은 마우스 및 rd16 마우스로부터의 눈의 대표 이미지. 백색 원은 동공을 정의한다.
도 6: 큰 단백질의 단백질 트랜스-스플라이싱 매개 재구성의 도식 표현.
큰 유전자의 코딩 서열(CDS)은 2개의 반쪽(5' 및 3')으로 분할되고, 역 말단 반복(ITR)이 측면에 있으며, 이는 2개의 AAV 캡시드로 별도로 패키징된다. 동일 세포의 공동 형질도입시, 단백질 수준에서 2개의 반쪽을 결합하여 전장 단백질 발현을 재구성하기 위해 상이한 메커니즘이 활용된다. 5'-벡터는 5' CDS, 5' 인테인(n-인테인) 및 데그론을 포함하는 반면, 3'-벡터는 3'CDS 및 3' 인테인(c-인테인)을 포함하며; 둘 모두의 벡터는 프로모터 및 폴리A를 포함한다. 2개의 절반 폴리펩티드의 쌍형성은 인테인 자기-이식을 통해 매개되며; 숙주 단백질로부터의 이후의 인테인 자가-절제는 전장 단백질 재구성을 발생시킨다. 데그론은 이제 절제된 인테인에 포매되며, 프로테아좀에 의해 신속하게 유비퀴틴화되고 분해된다.
도 7: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 EGFP 발현.
ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 EGFP 단백질(EGFP), 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 8: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 ABCA4 발현.
ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 ABCA4 단백질(ABCA4), 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 9: 인테인 DnaE-ecDHFR 발현은 TMP-의존적이다.
ecDHFR을 함유하거나(pAAV 인테인+ecDHFR) 함유하지 않는(pAAV 인테인) AAV_ABCA4 인테인 플라스미드로 형질감염되고, 증가된 용량의 트리메트로핀(Trimetrophin)(1 내지 50 )으로 처리된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 데그론을 함유하거나(DnaE + ecDHFR) 함유하지 않는(DnaE) 절제된 인테인을 나타낸다.
도 10: 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 EGFP 발현.
미니 ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 EGFP 단백질(EGFP), 데그론을 함유하거나(DnaE+미니 ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 11. 분해 신호가 있거나 없는 AAV 인테인 벡터로부터의 시험관 내 ABCA4 발현.
미니 ecDHFR을 함유하거나(+) 함유하지 않는(-) AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. 화살표는 전장 ABCA4 단백질(ABCA4), 데그론을 함유하거나(DnaE+미니 ecDHFR) 함유하지 않은(DnaE) 절제된 인테인을 나타낸다.
도 12: 단일 AAV I 또는 AAV II 인테인 플라스미드가 아닌 AAV I+II로 형질감염된 HEK293 세포에서의 EGFP 형광.
전장 또는 인테인 CMV-EGFP 플라스미드로 형질감염된 HEK293 세포의 형광 분석. pEGFP: 전장 EGFP 발현 카세트를 포함하는 플라스미드; pAAV I+II : AAV I+II 인테인 플라스미드; pAAV I : 단일 AAV-EGFP I 인테인 플라스미드; pAAV II : 단일 AAV II 인테인 플라스미드; Neg: 형질감염되지 않은 세포. 스케일 바: 100 μm.
도 13: 전장 단백질에 대한 인테인은 종에 따라 다르다.
AAV-CMV-EGFP(a) 또는 AAV-GRK1-EGFP 인테인 벡터(b-c)로 감염된 HEK293 세포(a), C57BL/6J 마우스(b) 및 대형 백색 돼지 망막(c)으로부터의 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터로 감염된 세포(a) 또는 AAV 인테인 벡터로 주사된 눈(b, c); Neg: 감염되지 않은 세포(a) 또는 PBS로 주사된 눈(b, c). 화살표는 전장 EGFP 단백질(EGFP) 및 절제된 인테인(DnaE) 둘 모두를 나타낸다.
도 14: 인간 iPSCs-유래 3D 망막 오르가노이드의 특성규명.
(a) 배양 183일에 망막 오르가노이드의 광학 현미경 분석.
(b) 성숙한 광수용체 마커에 대한 항체를 사용한 면역형광 분석. 스케일 바: 100 μm.
(c) AAV2/2-CMV-EGFP 및 AAV2/2-IRBP-DsRed 벡터 둘 모두로 감염된 망막 오르가노이드의 형광 분석. 스케일 바: 100 μm.
(d) 배양 230일에 망막 오르가노이드의 표면으로부터 돌출된 외부 세그먼트-유사 구조가 관찰되었다. 삽입된 도면은 방사형 구조를 갖는 외부 세그먼트(OS) 유사 구조의 존재를 나타낸다. NR: 신경 망막; RPE: 망막 색소 상피.
(e) 주사 전자 현미경 분석은 내부 세그먼트(IS), 연결 섬모(CC) 및 외부 세그먼트(OS)-유사 구조의 존재를 나타낸다. 스케일 바: 4 μm.
(f) 전자 현미경 분석은 외부 제한 막(*), 중심소체(C), 기저 소체(BB), 연결 섬모(CC) 및 외부 세그먼트의 스케치(OS)의 존재를 나타낸다. 삽입된 도면은 OS에서 조직화되지 않은 막 디스크의 존재를 나타낸다. 스케일 바: 500 nm.
D: 배양일.
도 15: 인간 3D 망막 오르가노이드에서 전장 단백질에 비해 낮은 인테인.
AAV2/2-GRK1-EGFP 인테인 벡터로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; Neg: 감염되지 않은 오르가노이드. 화살표는 전장 EGFP 단백질(EGFP) 및 절제된 인테인(DnaE) 둘 모두를 나타낸다.
도 16: AAV-ABCA4 및 -CEP290 인테인의 다양한 세트의 도식 표현.
(a) AAV-ABCA4-인테인 작제물. (작제물에 의해 예시된 세트 1-2) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: Npu의 DnaE로부터의 c-인테인; (세트 3) n-mDnaE: Npu의 돌연변이된 DnaE(mNpu)로부터의 n-인테인; c-mDnaE: mNpu의 DnaE 로부터의 c-인테인.
(b) AAV-CEP290-인테인 작제물. (세트 1) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: Npu의 DnaE로부터의 c-인테인; sh폴리A: 짧은 합성 폴리A; (세트 2) n-DnaE: mNpu의 DnaE로부터의 n-인테인; c-DnaE: mNpu의 DnaE로부터의 c-인테인; (세트 3) n-mDnaE: mNpu의 DnaE로부터의 n-인테인; c-mDnaE: mNpu의 DnaE로부터의 c-인테인; (세트 4) n-DnaE: Npu의 DnaE로부터의 n-인테인; c-DnaE: AAV I과 AAV II 사이의 Npu의 DnaE로부터의 c-인테인; n-DnaB: 로도써무스 마리누스(Rma)의 DnaB로부터의 N-인테인; c-DnaB: AAV II와 AAV III 사이의 Rma의 DnaE로부터의 c-인테인; wpre: 우드척(Woodchuck) 간염 바이러스 전사 후 조절 요소. (세트 5) n-mDnaE: mNpu의 DnaE로부터의 n-인테인; c-mDnaE: AAV I과 AAV II 사이의 mNpu의 DnaE로부터의 c-인테인; n-DnaB: 로도써무스 마리누스(Rma)의 DnaB로부터의 n-인테인; c-DnaB: AAV II와 AAV III 사이의 Rma의 DnaE로부터의 c-인테인; wpre: 우드척 간염 바이러스 전사 후 조절 요소. (a-b) ITR: AAV2 역 말단 반복; : 3x플래그 태그; 프로모터: 시험관 내 실험을 위한 짧은 CMV 및 생체 내 실험을 위한 인간 G-단백질 결합 수용체(GRK1) 프로모터; 폴리A: 유인원 바이러스 40 아데닐중합체형성 신호(ABCA4의 경우, a) 및 소 성장 호르몬 아데닐중합체형성 신호(CEP290의 경우, b). 각각의 세트의 분할 지점의 아미노산이 도면에 도시된다. 예측된 단백질 분자량은 각각의 AAV 벡터 아래에 도시된다.
도 17: 이종 N- 및 C-인테인의 조합은 시험관 내에서 검출 가능한 EGFP 단백질 재구성을 발생시키지 않는다.
전장 또는 인테인 AAV-CMV-EGFP 플라스미드로 형질감염된 HEK293 세포의 형광 분석. N+C-DnaE: DnaE로부터의 인테인에 융합된 AAV I+II; N+C-DnaB: DnaB으로부터의 인테인에 융합된 AAV I+II; N+C-mDnaE: mDnaE로부터의 분할-인테인에 융합된 AAV I+II; N-DnaE+C-DnaB: DnaE로부터의 n-인테인에 융합된 AAV I 및 DnaB로부터의 c-인테인에 융합된 AAV II; N-DnaB+C-DnaE: DnaB로부터의 n-인테인에 융합된 AAV I 및 DnaE로부터의 c-인테인에 융합된 AAV II; N-mDnaE+C-DnaB: mDnaE로부터의 n-인테인에 융합된 AAV I 및 DnaB로부터의 c-인테인에 융합된 AAV II; N-DnaB+C-mDnaE: DnaB로부터의 n-인테인에 융합된 AAV I 및 mDnaE로부터의 c-인테인에 융합된 AAV II; pEGFP: 전장 EGFP 발현 카세트를 포함하는 플라스미드; Neg: 형질감염되지 않은 세포. 스케일 바: 100 μm.
도 18: CEP290은 미세소관을 따라 정렬한다.
도 2d로부터의 단일 세포의 확대. 전장 CEP290 발현 카세트(pCEP290)를 포함하는 플라스미드 또는 CEP290 인테인 플라스미드(세트 5, pAAV I+II+III)로 형질감염된 HeLa 세포의 면역형광 분석. 세포는 3x플래그 및 아세틸화 튜불린(미세소관의 마커)에 대해 염색되었다. 스케일 바: 50 μm.
짧은-CMV-ABCA4(세트 1, a) 또는 -CEP290(세트 5, b)을 인코딩하는 전장 또는 AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석.
(a) pABCA4: 전장 ABCA4 발현 카세트; 세트 1: ABCA4 (Cys.1150)-인테인 플라스미드.
(b) pCEP290: 전장 CEP290 발현 카세트; 세트 5: CEP290(Ser.453 및 Cys.1474)-인테인 플라스미드.
Neg: AAV EGFP 플라스미드. WB는 n=3 독립 실험을 나타낸다.
도 19: AAV 인테인 플라스미드의 형질감염은 전장 발현 카세트를 갖는 단일 플라스미드의 형질감염보다 더 적은 양으로 ABCA4 및 CEP290 단백질을 재구성한다.
짧은-CMV-ABCA4(a) 또는 -CEP290(b)을 인코딩하는 전장 또는 AAV 인테인 플라스미드로 형질감염된 HEK293 세포로부터의 용해질의 웨스턴 블롯(WB) 분석. (a) pABCA4: 전장 ABCA4 발현 카세트; 세트 1: ABCA4 (Cys.1150)-인테인 플라스미드. (b) pCEP290: 전장 CEP290 발현 카세트; 세트 5: CEP290(Ser.453 및 Cys.1474)-인테인 플라스미드. Neg: AAV EGFP 플라스미드. WB는 n=3 독립 실험을 나타낸다.
도 20: AAV 인테인 벡터의 망막하 전달은 마우스 망막에서 ABCA4 발현을 발생시킨다.
이중 또는 인테인 AAV2/8-GRK1-ABCA4 벡터(세트 1)가 주사된 야생형 마우스로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. AAV 인테인: AAV 인테인 벡터; 이중 AAV: 이중 AAV 벡터; Neg: AAV-EGFP 벡터.
도 21: AAV 인테인은 내인성 Abca4의 약 10%를 재구성한다.
AAV2/8-GRK1-ABCA4 인테인 벡터(세트 1)가 주사된 Abca4 +/- 또는 Abca4 -/- 마우스로부터의 망막 용해질의 웨스턴 블롯(WB) 분석. mAbca4: Abca4 +/- 망막; AAV 인테인: AAV 인테인 주사된 망막; Neg: 주사되지 않은 망막. 겔 #2 및 #3에 로딩된 Abca4+/-로부터의 망막 용해질은 동일하다. 내인성에 비한 AAV 인테인 ABCA4 발현의 백분율은 각각의 레인 아래에 도시된다.
도 22: AAV 인테인은 인간 망막 오르가노이드에서 전장 ABCA4 단백질을 재구성한다.
AAV2/2-GRK1-ABCA4 인테인 벡터(세트 1)로 감염된 인간 iPSCs-유래 3D 망막 오르가노이드로부터의 용해질의 웨스턴 블롯 분석. AAV 인테인: AAV 인테인 벡터; Neg: 감염되지 않은 오르가노이드. -/-: STGD1 환자로부터 유래된 오르가노이드; +/+: 건강한 공여자로부터 유래된 오르가노이드.
도 23: AAV 인테인 벡터의 망막하 투여는 Abca4 -/- 마우스에서 리포푸신(lipofuscin) 축적을 감소시킨다.
음성 대조군(Neg) 또는 AAV 인테인 벡터(세트 1)가 주사된 야생형 및 Abca4-/- 마우스의 RPE에서 리포푸신 과립을 제시하는 투과 전자 현미경 분석의 대표적 사진. 백색 화살표는 리포푸신 과립을 나타낸다; M: 미토콘드리아.
도 24: 마우스에서 AAV 인테인 벡터의 망막하 전달은 ONL 두께를 변형시키지 않는다.
AAV 인테인 벡터, 관련되지 않은 AAV 벡터(AAV neg) 또는 PBS로 망막하 주사된 C57BL/6J 마우스 눈의 스펙트럼 도메인 광학 간섭 단층촬영 분석. 흑색 막대는 AAV-ABCA4 인테인 벡터(세트 1), 및 이들의 상응하는 대조군으로 주사 후 6개월의 눈을 나타내고; 백색 막대는 AAV-CEP290 인테인 벡터(세트 5), 및 이들의 상응하는 대조군으로 주사 후 4.5개월의 눈을 나타낸다. 데이터는 평균 ± s.e로 표시된다. 평균 값은 해당 막대 위에 표시된다.
도 25. AAV 인테인 벡터는 전장 야생형 F8을 전달할 수 있다.
a) 단일 AAV B-도메인 결실 변이체 3 인자 VIII(F8-V3) 및 AAV F8 인테인 벡터의 도식표현.
F8 유전자의 코딩 서열은 2개의 반쪽(5' 및 3' F8)로 분할되고, 역 말단 반복(ITR)이 측면에 있으며, 이는 2개의 AAV 캡시드로 별도로 패키징된다. 5'-벡터는 5' F8 및 5' 인테인(n-DnaE)을 포함하는 반면, 3'-벡터는 3' F8 및 3' 인테인(c-DnaE)을 포함하며; 둘 모두의 벡터는 HLP 프로모터 및 합성 폴리A를 포함한다. V3, 변이체 3; SS, 신호 서열.
b) F8 인테인은 단일 특대 AAV F8-V3와 달리 정의된 벡터 유전체를 사용하여 AAV 캡시드로 적절하게 패키징된다.
HLP 프로모터에 특이적인 프로브를 사용한 벡터 유전체 온전성의 서던 블롯 분석은 AAV F8 인테인 벡터에 존재하지 않는 특대 AAV F8-V3에서 트렁케이션된 생성물을 나타내었다. Neg, 음성 대조군.
c) AAV F8 인테인 벡터는 주사 후 8주에 혈우병 A 넉아웃 마우스의 출혈 표현형의 약간의 보정을 제시한다.
AAV F8 인테인(둘 모두 분할 지점) 주사 후 8주에 혈우병 A 넉아웃 마우스의 혈장 샘플의 aPTT 분석은 PBS 주사 대조군에 비해 약간의 표현형 보정을 제시한다. aPTT, 활성화된 부분 트롬보플라스틴 시간.
유전자 요법
지난 10년 동안, 유전자 요법은 수백 건의 임상 시험에서 질병 치료에 적용되었다. 인간 세포에 유전자를 전달하기 위해 다양한 도구가 개발되었으며; 그 중, 아데노-관련 바이러스를 포함하는 유전자 조작 바이러스가 현재 유전자 전달을 위한 가장 인기 있는 도구 중 하나이다. 대부분의 시스템은 관심 유전자를 수용할 수 있는 벡터 및 감염성 바이러스 입자를 함유하는 벡터의 생성을 허용하는 바이러스 구조 단백질 및 효소를 제공할 수 있는 헬퍼 세포를 함유한다. 아데노-관련 바이러스는 뉴클레오티드 및 아미노산 서열, 유전체 구조, 병원성 및 숙주 범위가 상이한 바이러스 계열이다. 이러한 다양성은 상이한 치료적 적용을 개발하기 위해 상이한 생물학적 특징을 갖는 바이러스를 사용할 기회를 제공한다. 임의의 전달 도구와 마찬가지로, 효율성, 특정 조직 또는 세포 유형을 표적으로 하는 능력, 관심 유전자의 발현 및 아데노-관련 바이러스 기반 시스템의 안정성은 유전자 요법의 성공적인 적용에 중요하다. 최근 몇 년 동안 이들 연구 분야에 많은 노력을 기울였다. 유전자 발현을 변경시키고, 전달을 표적화하고, 바이러스 역가를 개선시키고, 안전성을 증가시키기 위해 아데노-관련 바이러스 기반 벡터 및 헬퍼 세포에 대해 다양한 변형이 이루어졌다. 본 발명은 단일 아데노-관련 바이러스 기반 벡터에 대해 제한 화물을 초과하는 크기로 관심 유전자를 효율적으로 전달하는 작용을 한다는 점에서 상기 설계 과정의 개선을 나타낸다. 바이러스는 유전자 전달을 위한 논리적 도구이다. 이들은 세포 내부에서 복제하며, 따라서 세포에 진입하여 세포 기계를 사용하여 이들의 유전자를 발현하는 메커니즘을 진화시켰다. 바이러스 기반 유전자 전달의 개념은 관심 유전자를 발현할 수 있도록 바이러스를 조작하는 것이다. 특정 적용 및 바이러스의 유형에 따라, 대부분의 바이러스 벡터는 숙주에서 야생형 바이러스로 자유롭게 복제하는 능력을 방해하는 돌연변이를 함유한다. 유전자 전달을 위한 바이러스 벡터를 생성하기 위해 여러 상이한 계열로부터의 바이러스가 변형되었다. 이들 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 바이러스, 단순 헤르페스 바이러스, 피코르나바이러스 및 알파바이러스를 포함한다. 본 발명은 바람직하게는 아데노-관련 바이러스를 사용한다. 따라서, 유전자 전달을 위한 바이러스 기반 벡터는 비제한적으로 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 슈도타이핑된 AAV 벡터, 헤르페스 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 배큘로바이러스 벡터를 포함한다.
유전자 전달을 위한 이상적인 아데노-관련 바이러스 기반 벡터는 효율적이고, 세포 특이적이고, 조절되고, 안전해야 한다. 전달 효율은 치료의 효능을 결정할 수 있으므로 중요하다. 현재의 노력은 아데노-관련 바이러스 벡터로 세포 유형 특이적 감염 및 유전자 발현을 달성하는 것을 목표로 한다. 또한, 요법은 오래 지속되거나 조절된 발현을 요구할 수 있으므로 관심 유전자의 발현을 조절하기 위해 아데노-관련 바이러스 벡터가 개발되고 있다. 대부분의 바이러스는 병원체이거나 병원성 잠재성을 가지므로 안전성은 바이러스 유전자 전달의 주요 문제이다.
아데노-관련 바이러스(AAV)는 인간 및 일부 다른 영장류 종을 감염시키는 작은 바이러스이다. AAV는 현재 질병을 유발하는 것으로 공지되어 있지 않으므로 결과적으로 바이러스는 매우 가벼운 면역 반응을 유발한다. AAV를 사용한 유전자 요법 벡터는 분열 세포 및 정지 세포 둘 모두를 감염시킬 수 있으며, 숙주 세포의 유전체로의 통합 없이 염색체외 상태로 지속될 수 있다. 이들 특징은 AAV를 유전자 요법을 위한 바이러스 벡터를 생성하고, 동종 인간 질병 모델을 생성하기 위한 매우 매력적인 후보로 만든다.
야생형 AAV는 다수의 특징으로 인해 유전자 요법 연구자로부터 상당한 관심을 끌었다. 이들 중 가장 중요한 것은 바이러스의 병원성의 명백한 결핍이다. 이는 또한 분열하지 않는 세포를 감염시킬 수 있으며, 인간 염색체 19의 특정 부위(AAVS1으로 지정됨)에서 숙주 세포 유전체에 안정적으로 통합하는 능력을 갖는다. 상기 특징은 무작위 삽입 및 돌연변이유발의 위협을 나타내고, 때때로 암의 발달이 후속되는 레트로바이러스보다 다소 더 예측 가능하게 만든다. AAV 유전체는 언급된 부위에 가장 빈번히 통합되는 반면, 유전체로의 무작위 통합은 무시할 수 있는 빈도로 발생한다. 그러나, 유전자 요법 벡터로서의 AAV의 개발은 벡터의 DNA에서 rep 및 cap를 제거함으로써 이러한 통합 능력을 제거하였다. 단일 가닥 벡터 DNA가 숙주 세포 DNA 중합효소 복합체에 의해 이중 가닥 DNA로 전환된 후 핵에서 콘카타머 형성을 돕는 역 말단 반복(ITR) 사이에 유전자의 전사를 유도하는 프로모터와 함께 원하는 유전자가 삽입된다. AAV 기반 유전자 요법 벡터는 숙주 세포 핵에서 에피솜 콘카타머를 형성한다. 분열하지 않는 세포에서, 이들 콘카테머는 숙주 세포의 수명 동안 온전하게 유지된다. 분열 세포에서, 에피솜 DNA는 숙주 세포 DNA와 함께 복제되지 않으므로 AAV DNA는 세포 분열을 통해 상실된다. 숙주 유전체로의 AAV DNA의 무작위 통합은 검출 가능하지만 매우 낮은 빈도로 발생한다. AAV는 또한 매우 낮은 면역원성을 나타내며, 겉보기에는 중화 항체의 생성에 제한되는 것으로 보이나, 이들은 명확하게 정의된 세포독성 반응을 유도하지 않는다. 정지 세포를 감염시키는 능력과 함께 상기 특징은 인간 유전자 요법을 위한 벡터로서의 아데노바이러스에 비한 이들의 우위를 나타낸다.
AAV 유전체, 전사체 및 단백체
AAV 유전체는 약 4.7 킬로베이스 길이인 양성-센스 또는 음성-센스의 단일 가닥 데옥시리보핵산(ssDNA)의 구축이다. 유전체는 DNA 가닥의 양 말단에 역 말단 반복(ITR), 및 2개의 오픈 리딩 프레임(ORF)인 rep 및 cap을 포함한다. 전자는 AAV 수명 주기에 필요한 Rep 단백질을 인코딩하는 4개의 중복 유전자로 구성되며, 후자는 함께 상호작용하여 정20면체 대칭의 캡시드를 형성하는 VP1, VP2 및 VP3의 캡시드 단백질의 중복 뉴클레오티드 서열을 함유한다.
ITR 서열
역 말단 반복(ITR) 서열은 각각 145개의 염기를 포함한다. 이들은 AAV 유전체의 효율적인 증식에 필요한 것으로 나타났던 이들의 대칭으로 인해 그렇게 명명되었다. 이들 서열의 또 다른 특성은 헤어핀을 형성하는 이들의 능력이며, 이는 제2 DNA 가닥의 프리메이스(primase) 독립적 합성을 허용하는 소위 자가-프라이밍에 기여한다. ITR은 또한 숙주 세포 유전체(인간의 19번째 염색체)로의 AAV DNA의 통합 및 이로부터의 구조 둘 모두뿐만 아니라 완전히 조립된 데옥시리보뉴클레아제 내성 AAV 입자의 생성과 조합된 AAV DNA의 효율적인 캡시드화(encapsidation)에 필요한 것으로 나타났다.
유전자 요법과 관련하여, ITR은 치료 유전자 옆에서 시스(cis)로 필요한 유일한 서열인 것으로 보이며: 구조(cap) 및 패키징(rep) 유전자는 트랜스(trans)로 전달될 수 있다. 이러한 가정하에, 리포터 또는 치료 유전자를 함유하는 재조합 AAV(rAAV) 벡터의 효율적인 생성을 위한 많은 방법이 확립되었다. 그러나, ITR이 효과적인 복제 및 캡시드화를 위해 시스로 필요한 유일한 요소는 아니라는 것이 또한 공개되었다. 몇몇 연구 그룹은 rep 유전자의 코딩 서열 내에서 시스-작용 Rep-의존 요소(cis-acting Rep-dependent element; CARE)로 지정된 서열을 확인하였다. CARE는 시스로 존재하는 경우 복제 및 캡시드화를 강화하는 것으로 나타났다.
AAV 혈청형
현재까지, 수십 개의 상이한 AAV 변이체(혈청형)이 확인되고 분류되었다(60). 공지된 모든 혈청형은 다수의 다양한 조직 유형의 세포를 감염시킬 수 있다. 조직 특이성은 캡시드 혈청형에 의해 결정되며, 향성 범위를 변경시키기 위한 AAV 벡터의 슈도타이핑(pseudotyping)이 아마도 요법에서의 이들의 사용에 중요할 것이다. 슈도타이핑된 AAV 벡터는 제2 AAV 혈청형의 캡시드에 하나의 AAV 혈청형의 유전체를 함유하는 것이며; 예를 들어, AAV2/8 벡터는 AAV8 캡시드 및 AAV2 유전체를 함유한다(61). 상기 벡터는 또한 키메라 벡터로 공지되어 있다.
혈청형 2
혈청형 2(AAV2)는 지금까지 가장 광범위하게 조사되었다. AAV2는 골격근, 뉴런, 혈관 평활근 세포 및 간세포에 대한 천연 향성을 제시한다. AAV2에 대한 3개의 세포 수용체가 설명되었다: 헤파란 설페이트 프로테오글리칸(HSPG), avβ5 인테그린 및 섬유모세포 성장 인자 수용체 1(FGFR-1). 첫 번째는 일차 수용체로 기능하는 반면, 후자의 2개는 공동-수용체 활성을 가지며, AAV가 수용체-매개 세포내이입에 의해 세포로 진입할 수 있게 한다. 이들 연구 결과는 큐, 한다 등(Qju, Handa et al.)에 의해 논란이 되었다. HSPG는 일차 수용체로 기능하지만, 세포 외 기질에서의 이의 풍부는 AAV 입자를 청소하고 감염 효율을 손상시킬 수 있다.
바이러스의 혈청형 2(AAV-2)가 건강한 세포를 해치지 않고 암세포를 명백히 사멸시키는 것으로 연구에서 나타났다. 펜실베니아 주립 의과 대학의 면역학 및 미생물학 교수인 크레이그 마이어스(Craig Meyers)는 "우리의 결과는 대부분의 인구를 감염시키나 공지된 병적인 영향은 없는 아데노-관련 바이러스 2형이 다수의 유형의 암세포를 사멸시키지만 건강한 세포에는 영향을 미치지 않음을 시사한다"라고 말했다. 이는 새로운 항암제로 이어질 수 있다.
기타 혈청형
AAV2는 다양한 AAV 기반 연구에서 가장 인기 있는 혈청형이지만, 다른 혈청형이 유전자 전달 벡터로서 더 효과적일 수 있는 것으로 밝혀졌다. 예를 들어, AAV6는 기도 상피 세포를 감염시키는 데 훨씬 나은 것으로 나타나고, AAV7은 뮤린 골격근 세포의 매우 높은 형질도입 비율을 나타내고(AAV1 및 AAV5와 유사하게), AAV8은 간세포 및 광수용체를 형질도입하는 데 탁월하며, AAV1 및 5는 혈관 내피 세포로의 유전자 전달에서 매우 효율적인 것으로 나타났다. 뇌에서, 대부분의 AAV 혈청형은 신경 향성을 나타내는 반면 AAV5는 또한 별아교세포를 형질도입한다. AAV1 및 AAV2의 하이브리드인 AAV6는 또한 AAV2보다 낮은 면역원성을 나타낸다.
혈청형은 결합된 수용체에 따라 상이할 수 있다. 예를 들어, AAV4 및 AAV5 형질도입은 가용성 시알산(이들 혈청형 각각에 대한 상이한 형태)에 의해 억제될 수 있으며, AAV5는 혈소판 유래 성장 인자 수용체를 통해 세포로 진입하는 것으로 나타났다. 4중 티로신 돌연변이체 또는 AAV 2/7m8과 같은 신규한 AAV 변이체는 작은 동물 모델에서 유리체로부터 외부 망막을 형질도입하는 것으로 나타났다(62, 63). 또 다른 AAV 돌연변이체는 ShH1O로 명명되었으며, 이는 유리체 내 투여 후 개선된 아교세포 향성을 갖는 AAV6 변이체이다. 망막에 대한 특히 유리한 향성을 갖는 추가 AAV 돌연변이체는 AAV2(quad Y-F)이다(65).
본 발명의 유전자 전달 비히클은 환자에게 투여될 수 있다. 상기 투여는 "생체 내" 투여 또는 "생체 외" 투여일 수 있다. 숙련된 작업자는 적절한 투여량 비율을 결정할 수 있다. 용어 "투여된"은 바이러스 또는 비-바이러스 기술에 의한 전달을 포함한다. 바이러스 전달 메커니즘은 상기 설명된 바와 같이 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 헤르페스 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터 및 배큘로바이러스 벡터 등을 포함하나 이에 제한되지는 않는다.
비-바이러스 전달 시스템은 DNA 형질감염, 예를 들어, 전기천공, 지질 매개 형질감염, 압축 DNA-매개 형질감염; 리포솜, 면역리포솜, 리포펙틴, 양이온성 안면 양친매성 분자(CFA) 및 이들의 조합을 포함한다.
본 발명에 따른 벡터 시스템에 의한 하나 이상의 치료 유전자의 전달은 단독으로 또는 다른 치료 또는 치료의 성분과 조합하여 사용될 수 있다.
약학적 조성물
본 발명은 또한 유전자 요법에 의해 개체를 치료하기 위한 약학적 조성물을 제공하며, 여기서 조성물은 하나 이상의 전달 가능한 치료 및/또는 진단 트랜스진(들) 또는 이에 의해 생성되거나 이로부터 획득된 바이러스 입자를 포함하는 치료적 유효량의 본 발명의 벡터/작제물 또는 숙주 세포를 포함한다. 약학적 조성물은 인간 또는 동물용일 수 있다. 전형적으로, 의사는 개별 대상체에게 가장 적합할 실제 투여량을 결정할 것이며, 이는 특정 개인의 연령, 체중 및 반응에 따라 달라질 것이다. 조성물은 선택적으로 약학적으로 허용되는 담체, 희석제, 부형제 또는 애쥬번트를 포함할 수 있다. 약학적 담체, 부형제 또는 희석제의 선택은 의도된 투여 경로 및 표준 약학적 실시와 관련하여 선택될 수 있다. 약학적 조성물은 담체, 부형제 또는 희석제로서 또는 이에 더하여 임의의 적합한 결합제(들), 윤활제(들), 현탁제(들), 코팅제(들), 가용화제(들), 및 표적 부위로의 바이러스 진입을 돕거나 증가시킬 수 있는 기타 담체 제제(예를 들어, 지질 전달 시스템)를 포함할 수 있다. 적절한 경우, 약학적 조성물은 좌약 또는 페서리 형태의 흡입, 국소적으로 로션, 용액, 크림, 연고 또는 더스팅 파우더(dusting powder)의 형태로, 피부 패치의 사용에 의해, 경구적으로 전분 또는 락토스와 같은 부형제를 함유하는 정제 형태, 또는 단독으로 또는 부형제와 혼합하여 캡슐 또는 오뷸(ovule), 또는 착향제 또는 착색제를 함유하는 엘릭서, 용액 또는 현탁액 형태로 투여될 수 있으며; 바람직하게는 이들은 비경구적으로, 예를 들어, 해면 내, 정맥 내, 근육 내 또는 피하 주사될 수 있다. 비경구 투여를 위해, 조성물은 다른 물질, 예를 들어, 용액을 혈액과 등장성으로 만들기에 충분한 염 또는 단당류를 함유할 수 있는 멸균 수용액 형태로 가장 잘 사용될 수 있다. 협측 또는 설하 투여를 위해, 조성물은 통상적인 방식으로 제형화될 수 있는 정제 또는 로젠지 형태로 투여될 수 있다.
바람직한 제형은 결막낭에 국소적으로 또는 결막하로 투여되고, 바람직하게는 1일 내지 6개월 동안, 바람직하게는 1일 내지 30일 동안, 바람직하게는 하루에 1 내지 10회 투여되는 것이다.
바람직한 투여는 전방으로의 투여, 유리체 내 주사, 망막 하 주사, 안구근처(parabulbar) 및/또는 안구뒤 주사, 기질내 각막 주사이다.
바람직하게는, 본 발명의 약학적 조성물은 국소 안구 사용을 위한 것이며, 따라서 안과용 조성물이다.
본 발명에 따른 벡터 시스템은 임의의 편리한 경로에 의해 투여될 수 있으나, 바람직한 투여 경로는 안구 표면에 국소적으로, 특히 각막에 국소적으로 투여되는 것이다. 더욱 더 바람직한 경로는 결막낭으로의 점적주입이다.
의료용으로 눈으로 국소 투여될 안과용 조성물의 생성을 위한 벡터 시스템의 사용이 본 발명의 특정 목적이다.
보다 일반적으로, 본 발명의 하나의 바람직한 구현예는 선택적으로 하나 이상의 약학적으로 허용되는 첨가제(예를 들어, 희석제 또는 담체)와 함께 벡터 시스템을 포함하는 눈의 국소, 표면 또는 제한된 영역 및/또는 눈의 부속기에 국소 적용을 위해 제형화된 조성물이다.
본원에서 사용되는 용어 "비히클", "희석제", "담체" 및 "첨가제"는 상호 교환 가능하다.
본 발명의 안과용 조성물은 약학적으로 허용되고 눈에 내약성이고 활성 원리와 상용성인 안과용 담체를 함께 포함하는 용액, 에멀젼 또는 현탁액(점안제), 연고, 젤, 에어로졸, 미스트 또는 리니멘트의 형태일 수 있다.
또한, 지연 방출을 위한 안과 투여를 위한 특정 경로, 예를 들어, 결막낭에 위치하거나 컨택트 렌즈에 위치할 안구 침식성 삽입물 또는 중합체 막 "저장소" 시스템이 본 발명의 범위 내이다.
본 발명의 안과용 조성물은 국소 투여될 수 있으며, 예를 들어, 조성물은 전달되고, 눈 및/또는 눈의 부속기와 직접 접촉한다.
본 발명의 적어도 하나의 벡터 시스템을 함유하는 약학적 조성물은, 예를 들어, 문헌[Remington: The Science and Practice of Pharmacy 1995, edited by E. W. Martin, Mack Publishing Company, 19th edition, Easton, Pa]에 기재된 바와 같은 임의의 통상적인 기술에 의해 제조될 수 있다.
일 구현예에서, 조성물은 액체가 되도록 제형화되며, 여기서 벡터 시스템은 용액 또는 현탁액에 있을 수 있다. 조성물은 점안제, 인공 눈물, 눈 세척제 또는 셀룰로스 에테르(예를 들어, 메틸셀룰로스)와 같은 액체 담체를 포함하는 컨택트 렌즈 흡착제와 같은 국소 적용에 적합한 임의의 액체 형태로 제형화될 수 있다.
바람직하게는, 액체는 수성 액체이다. 또한, 액체가 멸균인 것이 바람직하다. 멸균은, 예를 들어, 임의의 통상적인 방법, 예를 들어, 여과, 조사 또는 가열에 의해 또는 무균 조건하에서 제조 공정을 수행함으로써 부여될 수 있다.
액체는 하나 이상의 친유성 비히클을 포함할 수 있다.
본 발명의 일 구현예에서, 조성물은 연고로 제형화된다. 바람직하게는, 연고 내의 하나의 담체는 바셀린 담체일 수 있다.
약학적으로 허용되는 비히클은 일반적으로 특정 제형, 의도된 투여 경로 등에 따라 선택되어야 하는 임의의 통상적으로 사용되는 약학적으로 허용되는 비히클일 수 있다. 또한, 약학적으로 허용되는 비히클은, 예를 들어, 인터넷 주소 http://www.fda.gov/cder/drug/iig/default.htm에서 이용 가능한 FDA "비활성 성분 목록"으로부터의 임의의 허용되는 첨가제일 수 있다.
적어도 하나의 약학적으로 허용되는 희석제 또는 담체는 완충액일 수 있다. 일부 목적을 위해, 조성물이 5 내지 9 범위의 pH, 예를 들어, pH 5 내지 6, pH 6 내지 8 또는 pH 7 내지 7.5로 용액을 완충할 수 있는 완충액을 포함하는 것이 종종 바람직하다.
그러나, 본 발명의 다른 구현예에서, 약학적 조성물은 완충액을 전혀 포함하지 않거나, 마이크로몰 양의 완충액만을 포함할수 있다. 완충액은, 예를 들어, TRIS, 아세테이트, 글루타메이트, 락테이트, 말레에이트, 타르트레이트, 포스페이트, 시트레이트, 보레이트, 카르보네이트, 글리시네이트, 히스티딘, 글리신, 숙시네이트 및 트리에탄올아민 완충액으로 구성된 군으로부터 선택될 수 있다. 그러므로, 완충액은 K2HP04, Na2HP04 또는 소듐 시트레이트일 수 있다.
바람직한 구현예에서, 완충액은 TRIS 완충액이다. TRIS 완충액은, 예를 들어, 트로메타민 USP, THAM, 트리즈마(Trizma), 트리스아민(Trisamine), 트리스 아미노(Tris amino) 및 트로메타몰을 포함하는 트로메타민에 대해 다양한 다른 명칭으로 공지되어 있다. TRIS라는 명칭은 상기 언급된 모든 명칭을 포함한다.
또한, 완충액은, 예를 들어, 비경구 사용, 특히 약학적 제형이 비경구 사용을 위한 것인 경우 USP 상용성 완충액으로부터 선택될 수 있다. 예를 들어, 완충액은 일염기 산, 예를 들어, 아세트산, 벤조산, 글루콘산, 글리세르산 및 락트산, 이염기산, 예를 들어, 아코니트산, 아디프산, 아스코르브산, 탄산, 글루탐산, 말산, 숙신산 및 타르타르산, 다염기산, 예를 들어, 시트르산 및 인산 및 염기, 예를 들어, 암모니아, 디에탄올아민, 글리신, 트리에탄올아민 및 TRIS로 구성된 군으로부터 선택될 수 있다.
조성물은 보존제, 예를 들어, 티메로살, 클로로부탄올, 벤즈알코늄 클로라이드, 또는 클로르헥시딘, 완충제, 예를 들어, 포스페이트, 보레이트, 카르보네이트 및 시트레이트, 및 증점제, 예를 들어, 고분자량 카르복시 비닐 중합체, 예를 들어, B. F. Goodrich Chemical Company의 상표인 카르보폴의 명칭으로 시판되는 것, 하이드록시메틸셀룰로스 및 폴리비닐 알콜을 함유할 수 있으며, 이들은 모두 선행 기술에 따른다.
본 발명의 일부 구현예에서, 약학적으로 허용되는 첨가제는 안정화제를 포함한다. 안정화제는, 예를 들어, 세제, 아미노산, 지방산, 중합체, 다가 알콜, 금속 이온, 환원제, 킬레이트제 또는 항산화제일 수 있으나, 임의의 다른 적합한 안정화제가 또한 본 발명과 함께 사용될 수 있다. 예를 들어, 안정화제는 폴록사머, 트윈-20(Tween-20), 트윈-40, 트윈-60, 트윈-80, Brij, 금속 이온, 아미노산, 폴리에틸렌 글리콜, 트리톤(Triton) 및 아스코르브산으로 구성된 군으로부터 선택될 수 있다.
또한, 안정화제는 아미노산, 예를 들어, 글리신, 알라닌, 아르기닌, 류신, 글루탐산 및 아스파르트산, 계면화성제, 예를 들어, 폴리소르베이트 20, 폴리소르베이트 80 및 폴록사머 407, 지방산, 예를 들어, 포스파티딜 콜린 에탄올아민 및 아세틸트립토파네이트, 중합체, 예를 들어, 폴리에틸렌 글리콜 및 폴리비닐피롤리돈, 다가 알콜, 예를 들어, 소르비톨, 만니톨, 글리세린, 수크로스, 글루코스, 프로필렌 글리콜, 에틸렌 글리콜, 락토스 및 트레할로스, 항산화제, 예를 들어, 아스코르브산, 시스테인 HCL, 티오글리세롤, 티오글리콜산, 티오소르비톨 및 글루타티온, 환원제, 예를 들어, 여러 티올, 킬레이트제, 예를 들어, EDTA 염, 글루탐산 및 아스파르트산으로 구성된 군으로부터 선택될 수 있다.
약학적으로 허용되는 첨가제는 등장성 염, 고장성 염, 저장성 염, 완충액 및 안정화제로 구성된 군으로부터 선택된 하나 이상을 포함할 수 있다.
바람직한 구현예에서, 보존제와 같은 다른 약학적 부형제가 존재한다. 일 구현예에서, 상기 보존제는 파라벤, 비제한적인 예로, 메틸 파라하이드록시벤조에이트 또는 프로필 파라하이드록시벤조에이트이다.
본 발명의 일부 구현예에서, 약학적으로 허용되는 첨가제는 점액용해제(예를 들어, N-아세틸 시스테인), 히알루론산, 사이클로덱스트린, 석유를 포함한다.
안구 또는 부속기 조직으로의 국소 조성물의 경피 전달을 촉진하고 진척시키기 위해 본 발명의 약학적 조성물에 혼입될 수 있는 예시적 화합물은 알콜(에탄올, 프로판올 및 노난올), 지방 알콜(라우릴 알콜), 지방산(발레르산, 카프로산 및 카프르산), 지방산 에스테르(이소프로필 미리스테이트 및 이소프로필 n-헥사노에이트), 알킬 에스테르(에틸 아세테이트 및 부틸 아세테이트), 폴리올(프로필렌 글리콜, 프로판디온 및 헥산트리올), 설폭시드(디메틸설폭시드 및 데실메틸설폭시드), 아미드(우레아, 디메틸아세트아미드 및 피롤리돈 유도체), 계면활성제(소듐 라우릴 설페이트, 세틸트리메틸암모늄 브로마이드, 폴락사머, 스팬, 트윈, 담즙염 및 레시틴), 테르펜(d-리모넨, 알파-테르펜올, 1,8-시네올 및 멘톤), 및 알카논(N-헵탄 및 N-노난)을 포함하나, 이에 제한되지는 않는다. 또한, 국소 투여되는 조성물은 카드헤린 길항제, 셀렉틴 길항제 및 인테그린 길항제를 포함하나, 이에 제한되지는 않는 표면 접착 분자 조절제를 포함할 수 있다.
또한, 안과 용액은 결막낭에서 약제의 체류를 개선시키기 위해 증점제, 예를 들어, 하이드록시메틸셀룰로스, 하이드록시에틸셀룰로스, 하이드록시프로필메틸셀룰로스, 메틸셀룰로스, 폴리비닐피롤리돈 등을 함유할 수 있다.
일 구현예에서, 본 발명에 따라 사용하기 위한 벡터 시스템은 안과적으로 허용되는 보존제, 계면활성제, 점도 향상제, 침투 향상제, 완충제, 소듐 클로라이드 및 수성의 멸균 안과용 현탁액 또는 용액을 형성시키기 위한 물과 조합될 수 있다. 안과용 용액은 벡터 시스템의 용해를 돕기 위해 안과적으로 허용되는 계면활성제를 추가로 포함할 수 있다. 벡터 시스템을 생리학적으로 허용되는 등장성 수성 완충액에 용해시켜 안과용 용액 제형이 제조될 수 있다.
멸균의 안과용 연고 제형을 제조하기 위해, 벡터 시스템은 무기질유, 액체 라놀린 또는 백색 바셀린과 같은 적절한 비히클에서 보존제와 조합될 수 있다. 멸균 안과용 젤 제형은 유사한 안과용 제조물에 대해 공개된 제형에 따라, 예를 들어, 카르보폴-940 등의 조합으로부터 제조된 친수성 염기에 벡터 시스템을 현탁시킴으로써 제조될 수 있으며; 보존제 및 긴장성 제제가 혼입될 수 있다.
바람직하게는, 본 발명의 제형은 국소 치료를 위한 치료적 유효량의 벡터 시스템; 조성물의 국소 적용시 벡터 시스템과 관련된 불편함을 감소시키기에 효과적인 상기 조성물의 물에서 가용성인 유도체의 양과 상기 조성물의 0.05 중량/부피 % 사이의 양으로 존재하는 잔틴 유도체로서, 상기 잔틴 유도체가 테오필린, 카페인, 테오브로민 및 이들의 혼합물로 구성된 군으로부터 선택되는, 잔틴 유도체; 안과용 보존제; 및 등장성, 수성, 비자극성 안과용 조성물을 제공하기 위한 완충제를 포함하는 눈으로의 국소 적용을 위한 수성의 비자극성 안과용 조성물이다.
약물 전달 장치
일 구현예에서, 본 발명은 적어도 벡터 시스템 및 약학적으로 상용성인 중합체로 구성된 약물 전달 장치를 포함한다. 예를 들어, 조성물은 상기 중합체에 혼입되거나 코팅된다. 조성물은 화학적으로 결합되거나 중합체에 의해 물리적으로 포획된다. 중합체는 소수성이거나 친수성이다. 중합체 장치는 다수의 물리적 배열을 포함한다. 중합체 장치의 예시적인 물리적 형태는 필름, 스캐폴드, 챔버, 구체, 미세구, 스텐트 또는 기타 구조를 포함하나, 이에 제한되지는 않는다. 중합체 장치는 내부 및 외부 표면을 갖는다. 장치는 하나 이상의 내부 챔버를 갖는다. 이들 챔버는 하나 이상의 조성물을 함유한다. 장치는 하나 이상의 화학적으로 구별되는 단량체의 중합체를 함유한다. 장치의 서브유닛 또는 단량체는 시험관 내 또는 생체 내에서 중합된다.
바람직한 구현예에서, 본 발명은 중합체 및 상기 중합체 내에 또는 상에 혼입된 생리활성 조성물을 포함하는 장치를 포함하고, 상기 조성물은 벡터 시스템을 포함하고, 상기 장치는 안구 표면 조직, 안구 표면 조직과 접촉한 부속기 조직, 유체 충전된 안구 또는 부속기 강, 또는 안구 또는 부속기 강에 이식되거나 이에 주사된다.
장치가 형성될 수 있는 예시적인 점막접착성 다중음이온성 천연 또는 반합성 중합체는 폴리갈락투론산, 히알루론산, 카르복시메틸아밀로스, 카르복시메틸키틴, 콘드로이틴 설페이트, 헤파린 설페이트 및 메소글리칸을 포함하나 이에 제한되지는 않는다. 일 구현예에서, 장치는 선택적으로 전체 또는 부분적으로 생분해될 수 있는 생체적합성 중합체 매트릭스를 포함한다. 하이드로겔은 적합한 중합체 매트릭스 물질의 일 예이다. 하이드로겔을 형성할 수 있는 물질의 예는 폴리락트산, 폴리글리콜산, PLGA 중합체, 알기네이트 및 알기네이트 유도체, 젤라틴, 콜라겐, 아가로스, 천연 및 합성 다당류, 폴리아미노산, 예를 들어, 폴리펩티드, 특히 폴리(리신), 폴리에스테르, 예를 들어, 폴리하이드록시부티레이트 및 폴리-.엡실론.-카프롤락톤, 폴리무수물; 폴리포스파진, 폴리비닐 알콜), 폴리(알킬렌 옥사이드), 특히 폴리(에틸렌 옥사이드), 폴리(알릴아민)(PAM), 폴리(아크릴레이트), 변형된 스티렌 중합체, 예를 들어, 폴리(4-아미노메틸스티렌), 플루로닉 폴리올, 폴리옥사머, 폴리(우론산), 폴리(비닐피롤리돈) 및 상기의 공중합체, 예를 들어, 그라프트 공중합체를 포함한다. 또 다른 구현예에서, 스캐폴드는 다양한 합성 중합체 및 천연 발생 중합체, 비제한적인 예로, 콜라겐, 피브린, 히알루론산, 아가로스 및 라미닌 풍부 젤로부터 제작될 수 있다.
하이드로겔에 대한 하나의 바람직한 물질은 알기네이트 또는 변형된 알기네이트 물질이다. 알기네이트 분자는 중합체 사슬에 따라 비율 및 순차적 분포가 다양한 (1-4)-결합된 β-D-만누론산(M 단위) 및 L-글루론산(G 단위) 단량체로 구성된다. 알기네이트 다당류는 2가 양이온(예를 들어, Ca+2, Mg+2, Ba+2)에 대해 강한 친화성을 갖고 이들 분자에 노출되는 경우 안정적인 하이드로겔을 형성하는 중합전해질 시스템이다.
장치는 국소, 결막하, 또는 공막위 공간, 피하 또는 관내 투여된다. 특히, 장치는 안구 조직의 표면 위 또는 바로 아래에 배치된다. 대안적으로, 장치는 누관 또는 눈물샘 내부에 배치된다. 중합체 내로 또는 중합체 상에 혼입된 조성물은 장치로부터 방출되거나 확산된다.
일 구현예에서, 조성물은 컨택트 렌즈 또는 약물 전달 장치 내로 또는 컨택트 렌즈 또는 약물 전달 장치 상에 혼입되며, 여기서 하나 이상의 분자가 렌즈 또는 장치로부터 확산되거나 일시적으로 제어되는 방식으로 방출된다. 이러한 구현예에서, 컨택트 렌즈 조성물은, 예를 들어, 렌즈가 시력 교정에 필요한 경우 안구 표면에 남아 있거나, 컨택트 렌즈가 시간의 함수로서 용해되어 조성물을 밀접하게 병치된 조적으로 동시에 방출한다. 유사하게, 약물 전달 장치는 다양한 구현예에서 선택적으로 생분해성이거나 영구적이다.
예를 들어, 조성물은 상기 렌즈에 혼입되거나 코팅된다. 조성물은 화학적으로 결합되거나 컨택트 렌즈 중합체에 의해 물리적으로 포획된다. 대안적으로, 색상 첨가제는 치료 약물 조성물과 동일한 속도로 방출되는 중합체 조성물에 화학적으로 결합되거나 물리적으로 포획되어, 색상 첨가제의 강도의 변화는 중합체 내에 결합되거나 포획되어 남아 있는 치료 약물 조성물의 양 또는 용량의 변화를 나타낸다. 대안적으로 또는 추가로, 자외선(UV) 흡수제는 컨택트 렌즈 중합체 내에 화학적으로 결합되거나 물리적으로 포획된다. 컨택트 렌즈는 소수성이거나 친수성이다.
본 발명의 조성물을 전달하기 위한 수단으로 소수성 렌즈를 제작하는 데 사용되는 예시적 물질은 아메포콘 A(amefocon A), 암실포콘 A(amsilfocon A), 아퀼라포콘 A(aquilafocon A), 아르포콘 A(arfocon A), 카부포콘 A(cabufocon A), 카부포콘 B, 카르보실포콘 A(carbosilfocon A), 크릴포콘 A(crilfocon A), 크릴포콘 B, 디메포콘 A(dimefocon A), 엔플루포콘 A(enflufocon A), 엔플로포콘 B(enflofocon B), 에리포콘 A(erifocon A), 플루로포콘 A(flurofocon A), 플루실포콘 A(flusilfocon A), 플루실포콘 B, 플루실포콘 C, 플루실포콘 D, 플루실포콘 E, 헥사포콘 A(hexafocon A), 호포콘 A(hofocon A), 하이부포콘 A(hybufocon A), 이타비스플루오로포콘 A(itabisfluorofocon A), 이타플루오로포콘 A(itafluorofocon A), 이타포콘 A(itafocon A), 이타포콘 B, 콜포콘 A(kolfocon A), 콜포콘 B, 콜포콘 C, 콜포콘 D, 로티포콘 A(lotifocon A), 로티포콘 B, 로티포콘 C, 멜라포콘 A(melafocon A), 미가포콘 A(migafocon A), 네포콘 A(nefocon A), 네포콘 B, 네포콘 C, 온시포콘 A(onsifocon A), 오프리포콘 A(oprifocon A), 옥시플루플로콘 A(oxyfluflocon A), 파플루포콘 B(paflufocon B), 파플루포콘 C, 파플루포콘 D, 파플루포콘 E, 파플루포콘 F, 파시포콘 A(pasifocon A), 파시포콘 B, 파시포콘 C, 파시포콘 D, 파시포콘 E, 페무포콘 A(pemufocon A), 포로포콘 A(porofocon A), 포로포콘 B, 로플루포콘 A(roflufocon A), 로플루포콘 B, 로플루포콘 C, 로플루포콘 D, 로플루포콘 E, 로실포콘 A(rosilfocon A), 사타포콘 A(satafocon A), 시플루포콘 A(siflufocon A), 실라포콘 A(silafocon A), 스테라포콘 A(sterafocon A), 술포콘 A(sulfocon A), 술포콘 B, 텔라포콘 A(telafocon A), 티실포콘 A(tisilfocon A), 톨로포콘 A(tolofocon A), 트리포콘 A(trifocon A), 유니포콘 A(unifocon A), 비나포콘 A(vinafocon A) 및 윌로포콘 A(wilofocon A)를 포함하나 이에 제한되지는 않는다. 본 발명의 조성물을 전달하기 위한 수단으로 친수성 렌즈를 제작하는 데 사용되는 예시적 물질은 아바필콘 A(abafilcon A), 아코필콘 A(acofilcon A), 아코필콘 B, 아쿠아필콘 A(acquafilcon A), 알로필콘 A(alofilcon A), 알파필콘(alphafilcon A), 암필콘 A(amfilcon A), 아스티필콘 A(astifilcon A), 아틀라필콘 A(atlafilcon A), 발라필콘 A(balafilcon A), 비스필콘 A(bisfilcon A), 부필콘 A(bufilcon A), 콤필콘 A(comfilcon A), 크로필콘 A(crofilcon A), 사이클로필콘 A(cyclofilcon A), 다르필콘 A(darfilcon A), 델타필콘 A(deltafilcon A), 델타필콘 B, 디메필콘 A(dimefilcon A), 드록스필콘 A(droxfilcon A), 엘라스토필콘 A(elastofilcon A), 엡실필콘 A(epsilfilcon A), 에스테리필콘 A(esterifilcon A), 에타필콘 A(etafilcon A), 포코필콘 A(focofilcon A), 갈리필콘 A(galyfilcon A), 겐필콘 A(genfilcon A), 고바필콘 A(govafilcon A), 헤필콘 A(hefilcon A), 헤필콘 B, 헤필콘 C, 힐라필콘 A(hilafilcon A), 힐라필콘 B, 히옥시필콘 A(hioxifilcon A), 히옥시필콘 B, 히옥시필콘 C, 하이드로필콘 A(hydrofilcon A), 레네필콘 A(lenefilcon A), 리크리필콘 A(licryfilcon A), 리크리필콘 B, 리도필콘 A(lidofilcon A), 리도필콘 B, 로트라필콘 A(lotrafilcon A), 로트라필콘 B, 마필콘 A(mafilcon A), 메사필콘 A(mesafilcon A), 메타필콘 B(methafilcon B), 미파필콘 A(mipafilcon A), 넬피콘 A(nelfilcon A), 네트라필콘 A(netrafilcon A), 오쿠필콘 A(ocufilcon A), 오쿠필콘 B, C, 오쿠필콘 D, 오쿠필콘 E, 오필콘 A(ofilcon A), 오마필콘 A(omafilcon A), 옥시필콘 A(oxyfilcon A), 펜타필콘 A(pentafilcon A), 퍼필콘 A(perfilcon A), 페바필콘 A(pevafilcon A), 펨필콘 A(phemfilcon A), 폴리마콘(polymacon), 세노필콘 A(senofilcon A), 실라필콘 A(silafilcon A), 실록시필콘 A(siloxyfilcon A), 서필콘 A(surfilcon A), 테필콘 A(tefilcon A), 테트라필콘 A(tetrafilcon A), 트릴필콘 A(trilfilcon A), 비필콘 A(vifilcon A), 비필콘 B 및 자일로필콘 A(xylofilcon A)를 포함하나 이에 제한되지는 않는다.
본 발명의 범위 내에는 겔 또는 겔-유사 물질, 크림 또는 점성 에멀젼으로 제형화된 조성물이다. 상기 조성물은 조성물의 점도를 향상시키기 위해 적어도 하나의 겔화 성분, 중합체 또는 다른 적합한 제제를 포함하는 것이 바람직하다. 치료되는 영역에 해로운 영향을 미치지 않고 피부, 눈 또는 점액으로의 국소 투여를 위한 조성물 및 약학적 조성물의 제형에서 적용할 수 있는 당업자에게 공지된 임의의 겔화 성분이 사용될 수 있다. 예를 들어, 겔화 성분은 아크릴산, 카르보머, 카르복시폴리메틸렌, 예를 들어, 상표 카르보폴(예를 들어, 카르보폴 940)로 B. F. Goodrich에 의해 시판되는 물질, 폴리에틸렌-폴리프로필렌글리콜, 예를 들어, 상표 폴록사머(예를 들어, 폴록사머 188)로 BASF에 의해 시판되는 물질, 셀룰로스 유도체, 예를 들어, 하이드록시프로필 셀룰로스, 하이드록시에틸 셀룰로스, 하이드록시에틸렌 셀룰로스, 메틸 셀룰로스, 카르복시메틸 셀룰로스, 알긴산-프로필렌 글리콜 에스테르, 폴리비닐피롤리돈, 비검(마그네슘 알루미늄 실리케이트), 페물렌(Pemulen), 시물겔(Simulgel)(예를 들어, 시물겔 600, 시물겔 EG 및 시물겔 NS), 카피겔(Capigel), 콜라팩스(Colafax), 플라스돈(plasdone) 등 및 이들의 혼합물의 군으로부터 선택될 수 있다.
본 발명에 따른 겔 또는 겔-유사물질은, 예를 들어, 10% w/w 미만의 물, 예를 들어, 20% w/w 미만의 물, 예를 들어, 적어도 20%의 w/w 물, 예를 들어, 적어도 30% w/w의 물, 예를 들어, 적어도 40% w/w의 물, 예를 들어, 적어도 50% w/w의 물, 예를 들어, 적어도 75% w/w의 물, 예를 들어, 적어도 90% w/w의 물, 예를 들어, 적어도 95% w/w의 물을 포함한다. 바람직하게는, 상기 물은 탈이온수이다.
본 발명의 겔-유사 물질은 하이드로겔, 물 또는 다른 수성 매질에서 분산액으로서 형성된 콜로이드 겔을 포함한다. 따라서, 하이드로겔은 분산된 상(콜로이드)이 연속상(즉, 물)과 조합하여 점성 젤리 유사 제품, 예를 들어, 응고된 실리식산을 생성하는 콜로이드의 형성시 형성된다. 하이드로겔은 화학적 또는 물리적 결합을 통해 가교된 친수성 중합체 사슬의 3차원 네트워크이다. 중합체 사슬의 친수성 특성으로 인해, 하이드로겔은 물을 흡수하고 팽창한다. 팽창 과정은 가교되지 않은 친수성 중합체의 용해도와 동일하다. 정의에 따라, 물은 하이드로겔의 전체 중량(또는 부피)의 적어도 10%를 구성한다.
하이드로겔의 예는 합성 중합체, 예를 들어, 폴리하이드록시 에틸 메타크릴레이트, 및 화학적으로 또는 물리적으로 가교된 폴리비닐 알콜, 폴리아크릴아미드, 폴리(N-비닐 피롤리돈), 폴리에틸렌 옥사이드, 및 가수분해된 폴리아크릴로니트릴을 포함한다. 유기 중합체인 하이드로겔의 예는 공유 또는 이온 가교된 다당류 기반 하이드로겔, 예를 들어, 알기네이트, 펙틴, 카르복시메틸 셀룰로스, 헤파린, 히알루로네이트 및 키틴으로부터의 하이드로겔, 키토산, 풀루란, 겔란 및 잔탄의 다가 금속염을 포함한다. 본 발명의 실험에서 사용되는 특정 하이드로겔은 셀룰로스 화합물(즉, 하이드록시프로필메틸셀룰로스[HPMC]) 및 고분자량 히알루론산(HA)이었다.
히알루론산은 다양한 신체 조직에 의해 제조된 다당류이다. 미국 특허 5,166,331호에는 안구 내 유체에 대한 대체물 및 국소 안과용 약물 담체로서 사용하기 위한 히알루론산의 다양한 분획의 정제가 논의되어 있다. 히알루론산의 안구 용도를 논의하는 다른 미국 특허 출원은 일련 번호 11/859,627호; 11/952,927호; 10/966,764호; 11/741,366호; 및 11/039,192호를 포함한다. 안구 내 사용을 위한 거대분자의 제형이 공지되어 있다. 예를 들어, 미국 특허 출원 일련 번호 11/370,301호; 11/364,687호; 60/721,600호; 11/116,698호 및 60/567,423호; 11/695,527호를 참조한다. 다양한 활성제의 사용은 고점도 히알루론산이며 이로 공지되어 있다. 예를 들어, 미국 특허 출원 일련 번호 10/966,764호; 11/091,977호; 11/354,415호; 60/519,237호; 60/530,062호; 및 11/695,527호를 참조한다.
WO2010048086호에 기재된 바와 같은 지속 방출 제형은 본 발명의 범위 내이다.
당업자는 숙주 세포로의 폴리뉴클레오티드 또는 벡터의 통합을 위한 표준 방법, 예를 들어, 형질감염, 리포펙션, 전기천공, 미세주입, 바이러스 감염, 열 충격, 막 또는 세포 융합의 화학적 투과화 후 형질전환을 잘 인지한다.
본원에서 사용되는 용어 "숙주 세포 또는 유전적으로 조작된 숙주 세포"는 이전에 설명된 작제물 또는 벡터로 형질도입되거나, 형질전환되거나, 형질감염된 숙주 세포에 관한 것이다.
적절한 숙주 세포의 대표적인 예로서, 박테리아 세포, 예를 들어, E. 콜리, 스트렙토마이세스(Streptomyces), 살모넬라 티피무리움(Salmonella typhimurium), 진균 세포, 예를 들어, 효모, 곤충 세포, 예를 들어, Sf9, 동물 세포, 예를 들어, CHO 또는 COS, 식물 세포 등을 언급할 수 있다. 적절한 숙주의 선택은 본원의 교시로부터 당업자의 범위 내에 있는 것으로 간주된다. 바람직하게는, 상기 숙주 세포는 동물 세포, 가장 바람직하게는 인간 세포이다. 본 발명은 본원에 기재된 임의의 재조합 발현 벡터를 포함하는 숙주 세포를 추가로 제공한다. 숙주 세포는 배양된 세포 또는 일차 세포일 수 있고, 즉, 유기체, 예를 들어, 인간으로부터 직접 분리될 수 있다. 숙주 세포는 부착 세포 또는 현탁 세포일 수 있고, 즉, 현탁액에서 성장하는 세포일 수 있다. 적합한 숙주 세포는 당 분야에 공지되어 있으며, 예를 들어, DH5α, E. 콜리 세포, 차이니즈 햄스터(Chinese hamster) 난소 세포, 원숭이 VERO 세포, COS 세포, HEK293 세포 등을 포함한다.
생체 외 유전자 요법의 경우, 숙주 세포는 환자로부터 분리된 세포, 예를 들어, 조혈 줄기 세포일 수 있으며, 이는 트랜스진의 도입시 이를 필요로 하는 상기 환자에 재도입된다.
AAV 기반 바이러스 전달 시스템
AAV 벡터의 작제는 당업자에게 공지된 절차에 따르고 기술을 사용하여 수행될 수 있다. 아데노-관련 바이러스 벡터 작제 및 요법에서의 사용을 위한 이론 및 실행은 여러 과학 및 특허 간행물에 예시되어 있다(다음 참고문헌은 본원에 참조로서 포함된다: Flotte TR. Adeno-associated virus-based gene therapy for inherited disorders. Pediatr Res. 2005 Dec;58(6):1143-7; Goncalves MA. Adeno-associated virus: from defective virus to effective vector, Virol J. 2005 May 6;2:43; Surace EM, Auricchio A. Adeno-associated viral vectors for retinal gene transfer. Prog Retin Eye Res. 2003 Nov;22(6):705-19; Mandel RJ, Manfredsson FP, Foust KD, Rising A, Reimsnider S, Nash K, Burger C. Recombinant adeno-associated viral vectors as therapeutic agents to treat neurological disorders. Mol Ther. 2006 Mar;13(3):463-83).
AAV 벡터를 함유하는 약학적 조성물의 적합한 투여 형태는 주사 가능한 용액 또는 현탁액, 눈 로션 및 안과용 연고를 포함하나 이에 제한되지는 않는다. 바람직한 구현예에서, AAV 벡터는 척추강 내 주사에 의해 투여된다. 특히 바람직한 구현예에서, AAV 벡터는 망막 하 주사에 의해, 전방 또는 안구뒤 공간 및 유리체 내에서 투여된다. 바람직하게는, 바이러스 벡터는 망막 하 접근법을 통해 전달된다(문헌[Bennicelli J, et al Mol Ther. 2008 Jan 22; Reversal of Blindness in Animal Models of Leber Congenital Amaurosis Using Optimized AAV2-mediated Gene Transfer]에 기재된 바와 같음).
요법에 사용하기 위한 바이러스의 용량은 투여 경로, 질병의 중증도, 환자의 일반적인 상태 및 기타 임상 파라미터에 따라 사례를 기준으로 결정되어야 한다. 일반적으로, 적합한 투여량은 108 내지 1013 vg (벡터 유전체)/눈으로 다양할 것이다.
인테인
인테인은 단백질 스플라이싱으로 공지된 과정에서 자신을 절제하고 나머지 부분(엑스테인)과 펩티드 결합으로 연결할 수 있는 단백질의 세그먼트이다. 세그먼트는 내부 단백질 서열의 경우 "인테인"으로, 외부 단백질 서열의 경우 "엑스테인"으로 언급되며, 업스트림 엑스테인은 "N-엑스테인"으로 언급되고, 다운스트림 엑스테인은 "C-엑스테인"으로 언급된다. 단백질 스플라이싱 과정의 생성물은 성숙 단백질 및 인테인의 2개의 안정적인 단백질이다.
인테인은 또한 본원에서 "분할-인테인"으로 언급되는 2개의 별개로 전사되고 번역되는 유전자에 의해 인코딩된 2개의 단편으로 존재한다.
본 발명의 인테인은 (66)에 개시된 New England Biolabs Intein 데이터베이스에 나열된 분할 인테인을 포함하나 이에 제한되지는 않는다.
분할 인테인은 미니 인테인을 생성하기 위해 먼저 귀소 엔도뉴클레아제 도메인 서열을 제거함으로써 인테인으로부터 시작하여 생성될 수 있다. 상기 미니 인테인은 이후 공지된 결정 구조의 인테인과의 단백질 서열 정렬을 통해 설계된 하나 이상의 부위에서 분할되어 분할 인테인을 생성할 수 있으며, 본 발명의 개시에 포함된 프로토콜에 따라 트랜스-스플라이싱 활성에 대해 검정될 수 있다.
분할 인테인은 합리적 설계에 기초한 인테인 서열의 부위 특이적 돌연변이유발 또는 변형, 및/또는 기능 선택, 파지 디스플레이 및 리보솜 디스플레이와 같은 방법을 사용한 유도 진화를 통해 활성, 효율, 일반성 및 안정성을 포함하는 바람직한 특징에서 추가로 개선될 수 있다.
분할 인테인의 예는 2개의 별개의 유전자인 dnaE-n 및 dnaE-c에 의해 인코딩된 시아노박테리아에서 DNA 중합효소 III의 촉매 서브유닛인 DnaE로부터 유래된 인테인이다. dnaE-n 유전자에 의해 인코딩된 인테인은 본원에서 "N-인테인"으로 언급된다. dnaE-c 유전자에 의해 인코딩된 인테인은 본원에서 "C-인테인"으로 언급된다. 일반적으로, 분할 인테인의 N-부분은 "N-인테인"으로 언급되고, 분할 인테인의 C-부분은 "C-인테인"으로 언급된다. 분할 인테인은 트랜스로 자가 회합하고 단백질-스플라이싱 활성을 촉매한다(본원에서 "트랜스-스플라이싱").
본 발명의 분할 인테인의 추가 예는 Npu-DnaE-n 뉴틀레오티드 서열에 의해 코딩된 SEQ ID 1 및 Npu-DnaE-c 뉴클레오티드 서열에 의해 코딩된 SEQ. ID 2로 하기 표 3에 표시된 노스톡 푼크티포르메(Nostoc punctiforme)(Npu)로부터의 DnaE의 인테인(27, 28); Rma-DnaB-n 뉴클레오티드 서열에 의해 코딩된 SEQ ID 4 및 Rma-DnaB-c 뉴클레오티드 서열에 의해 코딩된 SEQ ID 5로 하기 표에 표시된 로도써무스 마리누스(Rhodothermus marinus)(Rma)로부터의 DnaB의 인테인(29); N-인테인이 NpU(SEQ. IDs 5)의 DnaE로부터 유래되고, C-인테인이 시네코시스티스 종(Synechocystis species) 균주 PCC6803(Ssp(SEQ ID 6)로부터 각각 유래되는 돌연변이된 N- 및 C-인테인(30); 하기 표에서 각각 SEQ ID 13 및 14에 포함된 시네코시스티스 종 균주 PCC6803 N-인테인 및 C-인테인을 포함한다. 다른 인테인 시스템이 또한 사용될 수 있다. 예를 들어, dnaE 인테인, Cfa-N 및 Cfa-C 인테인 쌍에 기초한 합성 고속 인테인이 기재되었다(예를 들어, (31) 및 WO 2017/132580호, 본원에 참조로서 포함됨). Ssp GyrB 인테인, Ssp DnaX 인테인, Ter DnaE3 인테인, Ter ThyX 인테인 및 Cne Prp8 인테인을 포함하는 추가 인테인은 미국 특허 번호 8,394,604호에 기재되었다. 본 발명의 내의 추가 인테인은 WO2018071868호에 개시된 인테인이며, 여기서 인테인의 첫 번째 쌍은 하기 표에 나열되고, SEQ ID 9(N-인테인) 및 SEQ ID 10(C-인테인)으로 명명되고; 인테인의 두 번째 쌍은, 예를 들어, SEQ ID 11 및 SEQ ID 12에 나열된다.
대안적으로, 인테인 시스템은 리간드(예를 들어, 소분자, 예를 들어, 4-하이드록시타목시펜, 펩티드, 단백질, 폴리뉴클레오티드, 아미노산 및 뉴클레오티드)의 부재하에서 단백질 스플라이싱 활성을 나타내지 않거나 최소의 단백질 스플라이싱 활성을 나타내는 리간드-의존성 인테인일 수 있다. 리간드-의존성 인테인은, 예를 들어, 본원에 참조로서 포함되는 U.S. 2014/0065711 A1호에 기재된 것을 포함한다.
표 3. 본 발명의 분할 인테인의 예
본원에 기재된 바와 같이, 트랜스-스플라이싱 활성을 유지하면서 상이한 유기체로부터의 동일한 유전자로부터 유래된 인테인이 본 발명의 범위 내이다. 비제한적인 예로서, DNA-E 분할 인테인은 노스톡 푼크티포르메(Npu) 시네코시스티스 종 PCC6803(Ssp), 피쉐렐라 종 PCC 9605, 사이토네마 톨리포트리코이데스, 시아노박테리아 박테리움 SW_9_47_5, 노둘라리아 스푸미게나, 노스톡 플라겔리포르메, 크로코스파에라 왓소니이 WH 8502, 크로오콕시디오프시스 쿠바나 CCALA 043, 트리코데스미움 에리트라에움을 포함하는 시아노박테리아로부터의 DnaE 유전자(예를 들어, DNA 중합효소 III 서브유닛 알파)의 분할 인테인으로부터 유래될 수 있다. 추가 예로서, DNA-B 분할 인테인은, 예를 들어, (59)에 기재된 R. 마리누스(Rma), 시네코시스티스 종 PC6803(Ssp), 포르피라 푸르푸레아 엽록체(Ppu)를 포함하는 시아노박테리아로부터의 DnaB 유전자로부터 유래될 수 있다.
따라서, 본 발명의 분할 인테인은 천연 발생 인테인과 100%, 98%, 80%, 75%, 70%, 65%, 50% 동일할 수 있으며, 상기 인테인은 트랜스-스플라이싱 반응을 겪는 능력을 보유한다. 본 발명의 범위 내에는 트랜스-스플라이싱 활성을 유지하는 천연 발생 또는 변형 인테인의 단편이 있다.
예를 들어, Npu(노스톡 푼티포르메(Nostoc puntiforme)) DnaE와 시네코시스티스 종 PCC6803 N-인테인 사이의 정렬;
및 Npu(노스톡 푼티포르메) DnaE와 시네코시스티스 종 PCC6803 C-인테인 사이의 정렬을 참조한다:
따라서, 트랜스-스플라이싱 활성을 보유하는 본 발명의 인테인의 분할 인테인 변이체 및 단편이 또한 본 발명의 범위 내이다.
흥미롭게도, 인테인은 스플라이싱 활성을 보장하는 기능적 특징을 보존한 것이 보고되었다. 특히, 4개의 인테인 모티프가 확인되었다(이들의 컨센서스 서열에 대해서는 하기 참조): 블록 A-H(Pietrokovski 1994 및 Perler 1997) 및 블록 N2 및 N4(Pietrokovski 1998). 인테인 블록 A, N2, B, N4, F 및 G는 단백질 스플라이싱에 관여한다. 블록 C, D, E, H는 엔도뉴클레아제 도메인에 존재하며, 이는 분할 인테인이 부재한다. 따라서, 분할 인테인은 트랜스-스플라이싱 활성에 필수적인 보존된 모티프를 보유한다. ([Perler, F. B. (2002). InBase, the Intein Database. Nucleic Acids Res. 30, 383-384.]에 개시된 인테인 데이터베이스)
단일 잔기는 불변이지만, 블록 A의 Ser 및 Cys, 블록 B의 His, 블록 G의 His, Asn 및 Ser/Cys/Thr은 스플라이싱 모티프에서 가장 보존된 잔기이다.
본 발명의 인테인의 정렬:
나열된 모든 N-인테인의 CLUSTAL W 정렬:
나열된 모든 C-인테인의 CLUSTAL 2.1 다중 서열 정렬:
요약하면, 인테인 활성은 효율적인 트랜스-스플라이싱이 발생하기 위해 필요한 라이게이션 접합을 둘러싸는 특정 펩티드 서열(N- 및 C-엑스테인으로 언급됨)과 함께 상황 의존적이며, 이 중 가장 중요한 것은 C-엑스테인의 첫 번째 잔기로서 친핵성 티올 또는 하이드록실기(즉, Cys, Ser 또는 Thr)를 함유하는 아미노산이다.
본 발명자는 생체 내에서 큰 단백질을 재구성하기 위해 인테인 매개 단백질 트랜스플라이싱을 사용하였다. 인테인 유전자 서열에 의해 인코딩된 분할 인테인은 전구체 폴리펩티드로 생성되며, 이는 이들의 구조적 보완을 통해 단백질 트랜스-스플라이싱 반응을 재조립하고 촉매할 수 있다.
단백질 트랜스-스플라이싱의 맥락에서, N-인테인 유전자는 관심 단백질의 N-말단 부분을 코딩하는 서열과 인 프레임으로 융합되고; C-인테인 유전자는 관심 서열의 C-말단 부분을 코딩하는 서열과 인 프레임으로 융합된다. 2개의 전구체 융합 단백질의 발현시, 인테인은 자가촉매 절제를 겪고, 라이게이션된 엑스테인, 예를 들어, 관심 있는 재구성된 단백질을 형성한다.
따라서, 관심 단백질의 재구성은 상기 단백질을 2개 또는 3개의 단편으로 분할하는 것을 필요로 하며, 이들의 코딩 서열은 N- 또는 C-인테인에 융합되고 프로모터의 제어하에 있는 AAV 벡터로 개별적으로 클로닝된다. 각각의 단백질에 대한 분할 지점은 C-엑스테인에서 제1 잔기로서 접합 지점(예를 들어, 친핵성 티올 또는 하이드록실기를 함유하는 아미노산(즉, Cys, Ser 또는 Thr)의 존재)에서의 아미노산 요구사항뿐만 아니라 각각의 인테인-폴리펩티드 전구체 폴리펩티드 및 생성된 재구성된 단백질의 적절한 단백질 폴딩 및 안정성을 선호하기 위해 중요한 단백질 도메인의 온전성의 보존을 고려하여 선택된다.
특히 주목할 만한 것은, 본 발명자는 2개의 관심 단백질 내에서 접합 지점을 선택하였다: 단백질 ABCA4는 아미노산 Cys1150, Ser1168, Ser1090에서 분할되고, 분할 인테인은 분할 지점에 삽입된다. CEP290 단백질은 aa Cys1076, Ser1275, Cys929 및 1474; Ser 453 및 Cys1474에서 분할된다.
분해 신호
조절된 단백질 분해는 미스폴딩되거나, 응집되거나, 달리 비정상적인 단백질로부터 세포를 보호하고, 또한 생체 내에서 단명하도록 진화하고, 주로 유비퀴틴(Ub)-프로테아좀 시스템(UPS) 및 자가포식-리소좀 경로에 의해 매개되는 단백질의 수준을 제어하며, 분자 샤페론이 둘 모두의 시스템의 일부이다.
분해 신호는 단백질 분해 경로의 표적이 되도록 하여 반감기가 감소하는 단백질의 특징이다. 특히, N-데그론 및 C-데그론은 주요 결정인자가 각각 세포 단백질의 N-말단 및 C-말단 잔기인 분해 신호이다. N-데그론 및 C-데그론은 다양한 범위로 인접 서열 모티프 및 또한 폴리유비퀴틸화 부위로 작용하는 내부 리신 잔기를 포함한다.
본 발명의 의미 내에서, 내부 데그론은 N-말단 또는 C-말단이 아닌 단백질 서열 내부에 위치한 분해 신호로 정의되며, 이의 기능적으로 필수적으로 요소는 N-말단 잔기 또는 C-말단 잔기를 포함하지 않고 단백질 분해를 매개한다.
데그론 경로는 단백질분해 시스템의 세트를 포함하며 이의 통합 특징은 N- 또는 C- 또는 내부-데그론을 함유하는 단백질을 인식하는 이들의 능력이며 이에 의해 26S 프로테아솜 또는 자가포식에 의해 이들 단백질의 분해를 유발한다.
E. 콜리 디하이드로폴레이트 환원효소(ecDHFR)는 디하이드로폴레이트의 원핵생물 1차 대사의 여러 단계에 필수적인 보조인자인 테트라하이드로폴레이트로의 환원을 촉매하는 159-잔기 효소이다. DHFR의 다수의 억제제가 약물로 개발되었으며, 상기 억제제 중 하나인 트리메토프림(TMP)은 포유동물 DHFR보다 훨씬 더 강력하게 ecDHFR을 억제한다. 이러한 큰 치료 윈도우는 포유동물 세포에서 TMP를 "생물학적 침묵"으로 만든다. ecDHFR-TMP 상호작용의 특이성은 TMP의 상업적 이용가능성 및 매력적인 약리학적 특성과 결합되어 이러한 단백질-리간드 쌍을 분해 시스템으로 개발하는 데 이상적으로 만든다(69). 따라서, 단백질 내에서 DHFR 아미노산 서열, 바람직하게는 ecDHFR 아미노산 서열의 존재는 단백질 분해를 발생시키는 프로테아솜 시스템에 대한 표적 신호로서 기능한다. TMP의 존재하에서, 상기 단백질은 안정화된다.
편리하게는, 이와모토 등(Iwamoto et al.)에 의해 개발된 점 돌연변이를 갖는 ecDHFR 유래 데그론 신호는 N-말단 또는 내부 위치 내에 위치하는 경우에만 기능적 활성(예를 들어, 융합 단백질의 분해)을 부여하는 3개의 아미노산 돌연변이 R12Y, Y100I 및 G67S(69)를 포함한다.
가장 짧은 활성 펩티드를 확인한 본 발명자에 의해 ecDHFR-유래 데그론에 대한 추가 개선이 이루어졌다. 편리하게는, 더 짧은 서열은 동일한 AAV 벡터 내에서 더 긴 코딩 서열을 적합화하는 것을 허용한다.
본 발명의 내에서, ecDHFR 유래 데그론은 비활성인 인테인의 N-말단에 융합되었다. 단백질 트랜스플라이싱 시, 데그론은 재구성된 인테인 내에 위치하며, 이의 분해를 매개한다.
본 발명의 ecDHFR은 WT ecDHFR, 돌연변이체 DHFR, 전장 ecDHFR, 더 짧은 scDHFR이다.
DHFR은 105 내지 159 aa 길이일 수 있으며, 여기서 단축은 C-말단에서 발생한다.
ecDHFR E. 콜리 유래, 야생형
뉴클레오티드 서열: (623 nt) SEQ ID No. 27
아미노산 서열:
ecDHFR E. 콜리 유래, 내부 데그론 돌연변이체(159 aa)
굵은 글씨의 돌연변이 위치 - SEQ ID No. 29
ecDHFR E. 콜리 유래, 야생형, 최소 활성 단편
뉴클레오티드 서열: SEQ ID No. 30
ecDHFR E. 콜리 유래, 내부 데그론 돌연변이체 pe, 최소 활성 단편 (104 aa)
(굵은 글씨의 돌연변이 위치) SEQ IN No. 32
서열
본 발명의 코딩 서열은 포유동물 세포, 바람직하게는 포유동물 망막 세포, 특히 광수용체 세포, 또는 간세포, 근육 세포, 심장 세포, 신경 세포, 신장 세포, 내피 세포에서 이의 발현을 조절할 수 있는 선택적으로 인트론 서열이 뒤따르는 프로모터 서열에 작동 가능하게 연결될 수 있다. 예시적인 프로모터는 편재성, 인공 또는 조직 특이적 프로모터, 예를 들어, 전사 프로모터 활성을 보유하는 이의 단편 및 변이체, 예를 들어, 광수용체 특이적 프로모터, 예를 들어, 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1), 광수용체간 레티노이드 결합 단백질 프로모터(IRBP), 로돕신 프로모터(RHO), 난황상 황반 디스트로피 2 프로모터(VMD2), 로돕신 키나제 프로모터(RK); 근육 특이적 프로모터, 예를 들어, MCK, MYODI; 간 특이적 프로모터, 예를 들어, 티록신 결합 글로불린(TBG), 하이브리드 간 특이적 프로모터(HLP)(67); 뉴런 특이적 프로모터, 예를 들어, hSYN1, CaMKIIa; 신장 특이적 프로모터, 예를 들어, Ksp-카드헤린16, NKCC2를 포함하나, 이에 제한되지는 않는다. 본 발명에 따른 편재성 프로모터는, 예를 들어, 편재성 사이토메갈로바이러스(CMV)(32) 및 짧은 CMV(33) 프로모터이다.
본 발명의 목적을 위해, 바람직하게는 본원에 개시된 서열, 또는 유전 부호의 축퇴성으로 인해 동일한 아미노산 서열을 인코딩하는 서열로부터 각각 선택되는 EGFP(YP_009062989), ABCA4 및 CEP290의 코딩 서열은 포유동물 망막 세포, 특히 광수용체 세포에서의 이의 발현을 조절할수 있는 프로모터 서열에 기능적으로 연결된다.
예시적인 아데닐중합체형성 신호는 소 성장 호르몬 아데닐중합체형성 신호(bGHpA), 인간 베타 글로빈 아데닐중합체형성 신호 또는 짧은 합성 버전(68), SV40 아데닐중합체형성 신호, 또는 다른 천연 발생 또는 인공 아데닐중합체형성 신호를 포함하나, 이에 제한되지는 않는다.
본 발명은 재구성된 인테인 단백질의 안정성을 감소시키기 위해 분해 신호의 뉴클레오티드 서열의 사용을 제공한다. 편리하게는, 최대 효과를 유지하기 위해 하나 이상의 서열이 반복될 수 있다.
본 발명에 따른 적합한 분해 신호는 (i) 미스폴딩된 단백질과 구조적 유사성을 공유하고, 따라서 유비퀴틴화 시스템에 의해 인지되는 C-말단 불안정화 펩티드인 짧은 데그론 CL1, (ii) 공여 단백질의 N-말단에서의 융합이 직접 단백질 분해 또는 N-말단 규칙 경로를 통한 분해 둘 모두를 매개하는 유비퀴틴, (iii) CL1 데그론과 유사하게 본원 및 (69)에 기재된 바와 같은 유비퀴틴 경로의 효소, 변이체 ecDHFR 및 이의 단편에 의해 인지되는 구조에서 폴딩되는 것으로 예측되는 9개 아미노산 길이의 펩티드인 N-말단 PB29 데그론, 특히 N-말단 또는 내부 위치 내에 위치하는 경우에만 기능적 활성(예를 들어, 융합 단백질의 분해)을 부여하는 3개의 아미노산 돌연변이인 R12Y, Y100I 및 G67S를 포함하는 점 돌연변이를 갖는 ecDHFR 유래 데그론 신호를 포함한다.
예시적인 분해 신호는 참조로서 본원에 포함되는 WO 201613932호에 기재되어 있다.
당업자는 용이하게 인지될 수 있는 바와 같이 실험실의 숙련된 장인이 인위적으로 생성할 수 있는 변이체에 더하여 자연에서 발견되는 단백질의 다수의 변이체 서열이 있을 수 있다. 본 발명의 폴리뉴클레오티드 및 폴리펩티드는 본원에서 구체적으로 예시된 것뿐만 아니라 변이체가 원하는 기능적 활성을 유지하는 한 이의 임의의 천연 변이체뿐만 아니라 인위적으로 생성될 수 있는 임의의 변이체를 포함한다. 또한, 변이체 폴리펩티드가 본원에 구체적으로 예시된 폴리펩티드와 실질적으로 동일한 관련 기능 활성을 유지하는 한 폴리펩티드의 서열 내에서의 아미노산 치환, 첨가 또는 결실을 제외하고 본원에 예시된 폴리펩티드의 동일한 아미노산 서열을 갖는 폴리펩티드가 본 발명의 범위 내이다. 예를 들어, 폴리펩티드의 기능에 영향을 미치지 않는 폴리펩티드 내의 보존적 아미노산 치환은 본 발명의 범위 내일 것이다. 따라서, 본원에 개시된 폴리펩티드는 구체적으로 예시된 서열의 상기 논의된 바와 같은 변이체 및 단편을 포함하는 것으로 이해되어야 한다. 본 발명은 본원에 개시된 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다. 이들 뉴클레오티드 서열은 본원에 제시된 단백질 및 아미노산 서열의 지식을 갖는 당업자에 의해 용이하게 작제될 수 있다. 당업자에 의해 인지되는 바와 같이, 유전 부호의 축퇴성은 장인이 특정 폴리펩티드 또는 단백질을 인코딩하는 다양한 뉴클레오티드 서열을 작제하는 것을 가능하게 한다. 특정 뉴클레오티드 서열의 선택은, 예를 들어, 특정 발현 시스템 또는 숙주 세포의 코돈 사용에 좌우될 수 있다. 대상 폴리펩티드에 구체적으로 예시된 것 이외의 아미노산의 치환을 갖는 폴리펩티드가 또한 본 발명의 범위 내에서 고려된다. 예를 들어, 치환된 아미노산을 갖는 폴리펩티드가 아미노산이 치환되지 않은 폴리펩티드와 실질적으로 동일한 활성을 보유하는 한 비-천연 아미노산은 본 발명의 폴리펩티드의 아미노산을 대체할 수 있다. 비-천연 아미노산의 예는 오르니틴, 시트룰린, 하이드록시프롤린, 호모세린, 페닐글리신, 타우린, 요오도티로신, 2,4-디아미노부티르산, a-아미노 이소부티르산, 4-아미노부티르산, 2-아미노 부티르산, γ-아미노 부티르산, ε-아미노 헥산산, 6-아미노 헥산산, 2-아미노 이소부티르산, 3-아미노 프로피온산, 노르류신, 노르발린, 사르코신, 호모시트룰린, 시스테산, τ-부틸글리신, τ-부틸알라닌, 페닐글리신, 사이클로헥실알라닌, β-알라닌, 플루오로-아미노산, 디자이너 아미노산(designer amino acid), 예를 들어, β-메틸 아미노산, C-메틸 아미노산, N-메틸 아미노산, 및 일반적으로 아미노산 유사체를 포함하나, 이에 제한되지는 않는다. 비-천연 아미노산은 또한 유도체화된 측면 기를 갖는 아미노산을 포함한다. 더욱이, 단백질의 임의의 아미노산은 D(우회전) 형태 또는 L(좌회전) 형태일 수 있다. 아미노산은 일반적으로 비극성, 하전되지 않은 극성, 염기성 및 산성의 부류로 분류될 수 있다. 한 부류의 아미노산을 갖는 폴리펩티드가 동일한 부류의 또 다른 아미노산으로 대체되는 보존적 치환은 치환을 갖는 폴리펩티드가 치환을 갖지 않는 폴리펩티드와 실질적으로 동일한 생물학적 활성을 여전히 보유하는 한 본 발명의 범위 내에 속한다. 표 4는 각각의 부류에 속하는 아미노산의 예의 목록을 제공한다.
표 4. 각각의 부류에 속하는 아미노산의 예의 목록
변이체 폴리뉴클레오티드가 본원에 구체적으로 예시된 폴리뉴클레오티드와 실질적으로 동일한 관련 기능적 활성을 보유하는 한(예를 들어, 이들은 예시된 폴리뉴클레오티드에 의해 인코딩되는 것과 동일한 아미노산 서열 또는 동일한 기능적 활성을 갖는 단백질을 인코딩함) 폴리뉴클레오티드의 서열 내에서 뉴클레오티드 치환, 첨가 또는 결실을 제외하고 본원에 예시된 폴리뉴클레오티드의 동일한 뉴클레오티드 서열을 갖는 폴리뉴클레오티드가 또한 본 발명의 범위 내이다. 따라서, 본원에 개시된 폴리뉴클레오티드는 구체적으로 예시된 서열의 상기 논의된 바와 같은 변이체 및 단편을 포함하는 것으로 이해되어야 한다.
본 발명은 표준의 엄격한 조건 및 표준 방법(Maniatis, T. et al, 1982) 하에서 서열과의 하이브리드화를 허용하도록 본 발명의 폴리뉴클레오티드 서열과 충분히 상동성인 서열을 갖는 폴리뉴클레오티드 분자를 또한 고려한다. 본원에 기재된 폴리뉴클레오티드는 또한 본원에 예시된 것과 보다 특정한 동일성 및/또는 유사성 범위의 관점에서 정의될 수 있다. 서열 동일성은 전형적으로 60% 초과, 바람직하게는 75% 초과, 더욱 바람직하게는 80% 초과, 더욱 더 바람직하게는 90% 초과일 것이고, 95% 초과일 수 있다. 서열의 동일성 및/또는 유사성은 본원에 예시된 서열과 비교하여 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 또는 그 초과일 수 있다. 달리 명시되지 않는 한, 본원에서 사용되는 바와 같은 2개의 서열의 서열 동일성 및/또는 유사성 백분율은 칼린 및 알트슐(Karlin and Altschul)(1993)에서와 같이 변형된 칼린 및 알트슐(1990)의 알고리즘을 사용하여 결정될 수 있다. 상기 알고리즘은 알트슐 등(1990)의 NBLAST 및 XBLAST 프로그램에 통합되어 있다. BLAST 검색은 NBLAST 프로그램, 스코어 = 100, 단어길이 = 12로 수행하여 원하는 서열 동일성 백분율을 갖는 서열을 획득할 수 있다. 비교 목적을 위해 갭이 있는 정렬을 획득하기 위해, 문헌[Altschul et al., (1997)]에 기재된 바와 같은 Gapped BLAST가 사용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 각각의 프로그램(NBLAST 및 XBLAST)의 디폴트 파라미터가 사용될 수 있다. NCBI/N1H 웹사이트를 참조한다.
본 발명의 플라스미드
EGFP
p915_pAAV2.1-TBG-5' EGFP 인테인 (SEQ IN No. 33)
TBG 프로모터: 굵은 글씨 (seq B)
5' EGFP: 밑줄 (seq C)
3x플래그: 이탤릭체 (seq E)
WPRE: 이탤릭체 밑줄 (seq F)
Bgh 폴리A: 굵은 글씨 밑줄 (seq G)
p917_pAAV2.1-TBG-3' EGFP 인테인
5' ITR (seq A)
TBG 프로모터 (seq B)
C-인테인 Npu DnaE (seq I) SEQ ID No. 34
3' EGFP (seq L) SEQ IN No. 35
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p914_pAAV2.1-CMV-5' EGFP 인테인
5' ITR (seq A)
CMV 프로모터 (seq M) SEQ ID No. 36
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p916_pAAV2.1-CMV-3' EGFP 인테인
5' ITR (seq A)
CMV 프로모터 (seq M)
C-인테인 Npu DnaE (seq I)
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p932_pAAV2.1-GRK-5' EGFP 인테인
5' ITR (seq A)
GRK1 프로모터 (seq N) SEQ ID No. 37
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p933_pAAV2.1-GRK1-3' EGFP 인테인
5' ITR (seq A)
GRK1 프로모터 (seq N)
C-인테인 Npu DnaE (seq I)
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p36 pAAV2.1-CMV-5' EGFP 인테인_ecDHFR
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
ecDHFR (seq O) SEQ ID No. 38
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p37 pAAV2.1-CMV-5' EGFP 인테인_미니 ecDHFR
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
미니 ecDHFR (seq P) SEQ ID No. 39
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p902_pAAV2.1-CMV-5' EGFR 인테인 DnaB
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 RmaDnaB (seq Q) SEQ ID No. 40
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p903_pAAV2.1-CMV-3' EGFR 인테인 DnaB
5' ITR (seq A)
CMV 프로모터 (seq M)
C-인테인 Rma DnaB (seq R) SEQ ID No. 41
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1256_pAAV2.1-CMV-5' EGFR 인테인 mDnaE
5' ITR (seq A)
CMV 프로모터 (seq M)
5' EGFP (seq C)
N-인테인 mDnaE (seq S) SEQ ID No. 42
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1257 pAAV2.1-CMV-3' EGFR 인테인 mDnaE
5' ITR (seq A)
CMV 프로모터 (seq M)
C-인테인 mDnaE (seq T) SEQ ID No. 43
3' EGFP (seq L)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
CEP290
p1005 pAAV2.1-CMV260-5' CEP290 인테인 (세트 1)
5' ITR (seq A)
CMV260 (seq U) SEQ ID No. 44
5' CEP290: SEQ ID No. 45
N-인테인 DnaE (seq D)
3x플래그 (seq E)
sh폴리A (seq V) SEQ ID No. 46
3' ITR (seq H)
p1093 pAAV2.1-CMV260-3' CEP290 인테인 (세트 1)
5' ITR (seq A)
CMV260 (seq U)
3' CEP290: SEQ ID No. 47
C-인테인 DnaE (seq I)
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1065 pAAV2.1-CMV260-5' CEP290 인테인 (세트 2)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 48
N-인테인 DnaE (seq D)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1067 pAAV2.1-CMV260-3' CEP290 인테인 (세트 2)
5' ITR (seq A)
CMV260 (seq U)
3' CEP290: SEQ ID No. 49
C-인테인 DnaE (seq I)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1087 pAAV2.1-CMV260-5' CEP290 인테인 (세트 3)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 50
N-인테인 mDnaE (seq S)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1088 pAAV2.1-CMV260-3' CEP290 인테인 (세트 3)
5' ITR (seq A)
CMV260 (seq U)
3' CEP290: SEQ ID No. 51
C-인테인 mDnaE (seq T)
3x플래그 (seq E)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1182 pAAV2.1-CMV260-5' CEP290 인테인 (세트 4)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 52
N-인테인 DnaE (seq D)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1183 pAAV2.1-CMV260-CEP290 바디 인테인 (세트 4)
5' ITR (seq A)
CMV260 (seq U)
C-인테인 DnaE (seq I)
CEP290 바디: SEQ ID No. 53
N-인테인 Rma DnaB (seq Q)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1181 pAAV2.1-CMV260-3' CEP290 인테인 (세트 4/세트 5)
5' ITR (seq A)
CMV260 (seq U)
C-인테인 Rma DnaB (seq R)
3' SEP290: SEQ ID No. 54
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1179 pAAV2.1-CMV260-5' CEP290 인테인 (세트 5)
5' ITR (seq A)
CMV260 (seq U)
5' CEP290: SEQ ID No. 55
N-인테인 mDnaE (seq S)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1180 pAAV2.1-CMV260-CEP290 바디 인테인 (세트 5)
5' ITR (seq A)
CMV260 (seq U)
C-인테인 mDnaE (seq T)
CEP290 바디: SEQ ID No. 56
N-인테인 Rma DnaB (seq Q)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1152 pAAV2.1-GRK1-5' CEP290 인테인 (세트 5)
5' ITR (seq A)
GRK1 프로모터 (seq N)
5' CEP290: SEQ ID No. 57
N-인테인 mDnaE (seq S)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1153 pAAV2.1-GRK-CEP290 바디 인테인 (세트 5)
5' ITR (seq A)
GRK1 프로모터 (seq N)
C-인테인 mDnaE (seq T)
CEP290 바디: SEQ ID No. 58
N-인테인 Rma DnaB (seq Q)
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
p1156 pAAV2.1-GRK1-3' CEP290 인테인 (세트 5)
5' ITR (seq A)
GRK1 프로모터 (seq N)
C-인테인 Rma DnaB (seq R)
3' CEP290: SEQ ID No. 59
3x플래그 (seq E)
WPRE (seq F)
Bgh 폴리A (seq G)
3' ITR (seq H)
pzac-GRK1-5' ABCA4 인테인 (세트 1) SEQ ID No. 60
5' ITR (seq A)
GRK1: 굵은 글씨
5' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-GRK1-3' ABCA4 인테인 (세트 1) SEQ ID No. 61
5' ITR (seq A)
GRK1: 굵은 글씨
3' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-CMV260-5' ABCA4 인테인 (세트 1) SEQ ID No. 62
5' ITR (seq A)
CMV260: 굵은 글씨
5' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-CMV260-3' ABCA4 인테인 (세트 1) SEQ ID No. 63
5' ITR (seq A)
CMV260: 굵은 글씨
3' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
p38 pAAV2.1-CMV260-5' ABCA4 인테인_ecDHFR (세트 1)
5' ITR (seq A)
CMV260 (seq U)
5' ABCA4 (세트 1로부터)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
ecDHFR (seq O)
WPRE (seq F)
SV40 폴리A (seq W)
3' ITR (seq H)
p39 pAAV2.1-CMV260-5' ABCA4 인테인_미니 ecDHFR (세트 1)
5' ITR (seq A)
CMV260 (seq U)
5' ABCA4 (세트 1로부터)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
미니 ecDHFR (seq P)
WPRE (seq F)
SV40 폴리A (seq W)
3' ITR (seq H)
p40 pAAV2.1-GRK1-5' ABCA4 인테인_ecDHFR (세트 1)
5' ITR (seq A)
GRK1 (seq N)
5' ABCA4 (세트 1로부터)
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
ecDHFR (seq O)
WPRE (seq F)
SV40 폴리A (seq W)
3' ITR (seq H)
p41 pAAV2.1-GRK1-5' ABCA4 인테인_미니 ecDHFR (세트 1) SEQ ID No. 64
5' ITR (seq A)
GRK1: 굵은 글씨
5' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-CMV260-5' ABCA4 인테인 (세트 2) SEQ ID No. 65
5' ITR (seq A)
CMV260: 굵은 글씨
5' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-CMV260-3' ABCA4 인테인 (세트 2) SEQ ID No. 66
5' ITR (seq A)
CMV260: 굵은 글씨
3' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-CMV260-5' ABCA4 인테인 (세트 3) SEQ ID No. 67
5' ITR (seq A)
CMV260: 굵은 글씨
5' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
pzac-CMV260-3' ABCA4 인테인 (세트 3) SEQ ID No. 68
5' ITR (seq A)
CMV260: 굵은 글씨
3' ABCA4: 밑줄
3x플래그: 이탤릭체
SV40: 굵은 글씨 밑줄
3' ITR (seq H)
p836 (IRBP_DsRed) SEQ ID No. 69
5' ITR (seq A)
IRBP 굵은 글씨
WPRE: 이탤릭체 밑줄
DsRed 밑줄
BghpA: 굵은 글씨 밑줄
3' ITR (seq H)
p1232 pAAV2.1_HLP_5' F8 인테인 (세트 1)
5' ITR (seq A)
HLP 프로모터 (seq J) SEQ ID No. 70
F8 신호 서열 (seq K) SEQ ID No. 71
5' F8: SEQ ID No. 72
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1389 pAAV2.1_HLP_3' F8 인테인 (세트 1)
5' ITR (seq A)
HLP 프로모터 (seq J)
F8 신호 서열 (seq K)
C-인테인 Npu DnaE (seq I)
3' F8:SEQ ID No. 73
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1207 pAAV2.1_HLP_5' F8 인테인 (세트 2)
5' ITR (seq A)
HLP 프로모터 (seq J)
F8 신호 서열 (seq K)
5' F8 (세트 2): SEQ ID No. 74
N-인테인 Npu DnaE (seq D)
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
p1388 pAAV2.1_HLP_3' F8 인테인 (세트 2)
5' ITR (seq A)
HLP 프로모터 (seq J)
F8 신호 서열 (seq K)
C-인테인 Npu DnaE (seq I)
3' F8: SEQ ID No. 75
3x플래그 (seq E)
sh폴리A (seq V)
3' ITR (seq H)
본 발명은 이제 비제한적인 예에 의해 예시될 것이다.
재료 및 방법
AAV 벡터 플라스미드의 생성
AAV 벡터 생성에 사용되는 플라스미드는 AAV 혈청형 2의 ITR을 함유하는 pAAV2.1(36) 또는 pZac(37) 플라스미드로부터 유래되었다. AAV 인테인 플라스미드는 도 1a 및 도 S5에 상술된 바와 같이 설계되었다. EGFP 단백질은 아미노산(a.a.) C71에서 분할되었다. ABCA4 단백질은 a.a. C1150(세트 1), a.a. S1168(세트 2) 및 a.a. C1090(세트 3)에서 큰 세포질 도메인 CD1(34, 35)에서 분할되었다. a.a. C1150(세트 1) 및 S1168(세트 2)은 공지된 ABCA4 기능과 관련되지 않은 영역에 속하지만, C1090은 a.a. 929에서 a.a. 1148에 걸쳐 있는 ABCA4 뉴클레오티드 결합 도메인에 포함된다. 모든 CEP290 분할 지점은 코일드-코일(coiled-coil) 도메인에 속하며(36): CEP290이 2개의 폴리펩티드로 분할된 경우, 이는 a.a. C1076(세트 1) 또는 S1275(세트 2-3)에서 발생했으며, 3개의 폴리펩티드로 분할된 경우, 이는 a.a. C929 및 C1474(세트 4) 또는 a.a. S453 및 C1474(세트 5)에 존재하였다.
플라스미드에 포함된 인테인은 노스톡 푼크티포르메(Npu)로부터의 DnaE의 인테인(27, 28), 또는 Npu 및 시네코시스티스 종 균주 PCC6803(Ssp) 각각의 DnaE로부터의 돌연변이된 N- 및 C-인테인으로 구성된 인테인(30), 또는 로도써무스 마리누스(Rma)로부터의 DnaB의 인테인(29)이었다. 연구에 사용된 플라스미드는 편재성 사이토메갈로바이러스(CMV)(38) 및 짧은 CMV(39) 프로모터 또는 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1) 40 프로모터의 제어 하에 있었다. EGFP 및 CEP290을 인코딩하는 플라스미드는 소 성장 호르몬 아데닐중합체형성 신호(bGHpA)를 포함한 반면, ABCA4를 인코딩하는 플라스미드는 유인원 바이러스 40(SV40) 아데닐중합체형성 신호를 포함하였다.
AAV 벡터 생성 및 특성규명
AAV 벡터는 이미 설명된 바와 같이 HEK293 세포의 삼중 형질감염에 의해 TIGEM AAV 벡터 코어에 의해 생성되었다(14, 41). 인테인 서열을 포함하거나 포함하지 않는 AAV 벡터 사이에 벡터 수율의 차이는 관찰되지 않았다.
세포의 형질강m 및 AAV 감염
HEK293 세포는 이미 기재된 바와 같이 칼슘 포스페이트 방법(1 μg의 각각의 플라스미드/6웰 플레이트 포맷의 웰)을 사용하여 유지되고 형질감염되었다(14). 도 S9에 기재된 실험을 위해, 1 μg의 AAV 인테인 플라스미드에 함유된 동일한 수의 분자에 해당하는 전장 유전자를 인코딩하는 플라스미드의 양을 사용하였다. 각각의 웰에서 형질감염된 DNA의 전체량은 필요한 경우 스크램블 플라스미드의 첨가에 의해 동일하게 유지하였다.
도 2c 및 2d의 실험에 사용된 HeLa 세포를 Lipofectamine LTX(Invitrogen)를 사용하여 형질감염시켰다(1 또는 0.5 μg의 각각의 플라스미드/24웰 플레이트 포맷의 웰). AAV 감염을 이미 기재된 바와 같이 수행하였다(14).
iPSC 및 망막 분화 배양
인간 유도 다능성 줄기 세포(iPSC)는 (42)에 기재된 방법을 사용하여 피부 생검에서 배양된 섬유모세포에서 유래되었다. STGD1 세포주는 (43)에 또한 기재된 ABCA4 화합물 이형접한 변이체 c.4892T>C 및 c.4539+2001G>A, 또는 화합물 이형접합 변이체 c.[2919-?_3328+?del; 4462T>C] 및 c.5196+1137G>A를 가졌다. c.[2919-?_3328+?del; 4462T>C]는 2개의 변이체로 구성된 대립유전자이다. c.2919-? 3328+?del은 엑손 20, 21 및 22뿐만 아니라 인트론 19 및 22의 공지되지 않은 세그먼트의 결실을 구성한다. 이러한 결실은 c.4462T>C를 갖는 시스 입체형태에서 발견되었다. iPSC는 mTeSR™배지(#85850; Stem cell technologies)를 함유하는 마트리겔(#354277, Corning® Matrigel® hESC-Qualified Matrix; Corning, NY)-코팅된 6웰 플레이트에서 유지시켰다. 2-6분 동안 0.5 mM EDTA(#AM9260G; Ambion)를 사용하여 약 80% 컨플루언스에서 세포를 계대배양하였다. 망막 분화는 이전에 기재된 프로토콜의 조합을 기반으로 하였다(44, 45). 간단히 말해서, iPSC를 RevitaCell Supplement(#A-2644501; Gibco, ThermoFisher) 및 1% 마트리겔을 함유하는 V-바닥 96웰 플레이트(9,000 세포/웰)에 플레이팅하여 응집체 형성을 유도하였다. 이후, 응집체를 배양하여 (46)에 보고된 바와 같이 3D 망막 오르가노이드를 생성시켰다.
웨스턴 블롯 분석 및 ELISA
샘플(HEK293 세포, 망막 및 망막 오르가노이드)을 RIPA 완충액에 용해시켜 EGFP, ABCA4 및 CEP290 단백질을 추출하였다. 용해 완충액에 프로테아제 억제제(완전 프로테아제 억제제 칵테일 정제; Roche, Basel, Switzerland) 및 1 mM 페닐메틸설포닐을 보충하였다. 용해 후, ABCA4 샘플을 2 M 우레아가 보충된 1X Laemmli 샘플 완충액에서 15분 동안 37℃에서 변성시켰다. EGFP 및 CEP290 샘플을 1X Laemmli 샘플 완충액에서 5분 동안 99℃에서 변성시켰다. 용해질을 12%(EGFP 샘플의 경우) 또는 6%(ABCA4 및 CEP290 샘플의 경우) SDS-폴리아크릴아미드 겔 전기영동으로 분리하였다. 면역블로팅에 사용된 항체는 다음과 같았다: EGFP, ABCA4 및 CEP290 단백질을 검출하기 위한 항-3x플래그(1:1000, A8592; Sigma-Aldrich, Saint Louis, MO, USA); ABCA4를 검출하기 위한 항-ABCA4(1:500, LS-C87292; LifeSpan BioSciences, Inc. Seattle, USA); 항-필라민 A(1:1000, #4762; Cell Signaling Technology, Danvers, MA, USA); 시험관 내 실험에서 로딩 대조군으로 사용되는 β-액틴인 필라민 A를 검출하기 위한 항-β-액틴(1:1000, NB600-501; Novus Biological LLC, Littleton, CO, USA); 생체 내 실험에서 로딩 대조군으로 사용되는 디스펄린(Dysferlin)을 검출하기 위한 항-디스펄린(1:500, Dysferlin, clone Ham1/7B6, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). 웨스턴 블롯에 의해 검출된 EGFP, ABCA4 및 CEP290 밴드의 정량화는 ImageJ 소프트웨어(무료 다운로드는 http://rsbweb.nih.gov/ij/에서 이용 가능함)를 사용하여 수행하였다.
도 21에 제시된 실험을 위해, AAV 인테인 벡터가 주사된 Abca4 -/- 마우스 및 대조군 한배새끼 Abca4 +/- 마우스 둘 모두로부터의 망막 용해질을 상기 기재된 바와 같이 30 의 용해 완충액에서 용해시키고, 25 또는 5 의 용해질을 각각 항-ABCA4 항체(LS-C87292; 에피토프 보존: 인간 ABCA4의 경우 100%; 뮤린 Abca4의 경우 86%)를 사용한 웨스턴 블롯에 사용하였다. ImageJ 소프트웨어를 사용하여 밴드 강도의 정량화에 의해 측정된 망막 용해질에서의 ABCA4의 양을 이후 아크릴아미드 겔에 로딩된 망막 용해질의 부피로 표준화하였다. 도 9의 실험에서, HEK293 세포를 도면에 보고된 바와 같이 증가된 용량의 트리메토프림(T7883, Sigma-Aldrich)으로 매일 처리하였다.
ELISA는 Max Discovery Green Fluorescent Protein Kit ELISA(Bioo Scientific Corporation, Austin, TX, USA)를 사용하여 세포 또는 마우스 및 돼지 망막 용해질에서 수행하였다.
rAAV 벡터 DNA의 서던 블롯 분석.
DNA를 1.5 내지 6 x 1010 바이러스 입자(GC로 측정됨)로부터 추출하였다. 패키징되지 않은 유전체를 분해하기 위해, 벡터 용액을 37℃에서 2시간 동안 50 mM Tris, pH 7.5 및 1 mM MgCl2를 함유하는 300 μl의 전체 부피에서 30 μl의 DNase(Roche)와 함께 인큐베이션하였다. 이후, DNase를 50 mM EDTA로 비활성화시킨 후, 프로테이나제 K 및 2.5% N-라우릴-사르코실 용액과 함께 1시간 동안 50℃에서 인큐베이션하여 캡시드를 용해시켰다. DNA를 페놀-클로로포름으로 2회 추출하고, 2 부피의 에탄올 100% 및 10% 소듐 아세테이트(3 M) 및 1 의 글리코겐(20 )으로 침전시켰다. 알칼리성 아가로스 겔 전기영동을 이전에 기재된 바와 같이 수행하였다(Sambrook, J., and Russell, D.W. 2001. Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory Press. Cold Spring Harbor, New York, USA. 999 pp). 5102 bp의 밴드를 생성하기 위해 Smal를 이용한 pF8-V3의 이중 분해에 의해 마커를 생성시켰다. HLP 프로모터에 특이적인 프로브를 사용하였다.
활성화된 부분 트롬보플라스틴 시간(aPTT)
9개 부분의 혈액을 안구 뒤 후퇴에 의해 완충된 트리소듐 시트레이트 0.109M(BD, Franklin Lakes, NJ, USA)의 한 부분으로 수집하였다. 15분 동안 13000 rpm에서 샘플을 원심분리하여 혈장을 분리하였다.
면역침전 및 액체 크로마토그래피/질량 분광법 분석
세포를 100 mm 플레이트(1x107 세포/플레이트)에 플레이팅하고, 칼슘 포스페이트 방법(20 μg의 각각의 플라스미드/플레이트)을 사용하여 AAV-EGFP 또는 ABCA4 인테인 플라스미드로 현탁액에서 형질감염시켰다. 세포를 형질감염 72시간 후에 수확하고, EGFP 및 ABCA4 단백질 둘 모두를 제조업체 지침에 따라 항-플래그 M2 자기 비드(M8823; Sigma-Aldrich)를 사용하여 면역침전시켰다. 단백질을 37℃에서 4M 우레아가 보충된 샘플 완충액에서 15분 동안 인큐베이션하여 비드로부터 용리시켰다. 이후, 단백질을 12%(EGFP의 경우) 또는 6%(ABCA4의 경우) SDS-폴리아크릴아미드 겔 전기영동에 로딩하였다. 쿠마시 블루(Coomassie Blue)로 염색한 후 절단된 26 및 30개의 단백질 밴드(각각 AAV-EGFP 및 ABCA4 인테인 플라스미드로 2회 및 3회 독립적으로 형질감염된 HEK293 세포로부터)를 단백질 시퀀싱(Creative proteomics, Shirley, NY)에 사용하였다. 간단히 말해서, 트립신, 키모트립신, Glu-C, Arg-C, Asp-N 및 Lys-N의 효소 각각에 의한 분해를 위해 3개의 겔 슬라이드를 사용하였다. ABCA4를 분해하기 위해 펩신을 추가로 사용하였다. 생성된 펩티드는 탠덤 질량 분광법(tandem Mass Spectrometry)(나노 LC-MS/MS) 분석과 결합된 나노스케일 액체 크로마토그래피를 사용하여 확인하고 정량하였다. 획득된 질량 분광법 데이터를 PEAKS STUDIO 8.5를 사용하여 분석하였다. 본 발명자는 EGFP 및 ABCA4 단백질 둘 모두에 대해 100%의 단백질 서열 적용범위를 달성하였다.
동물 모델
동물을 TIGEM 동물 시설(Naples)에 수용하고, 12시간 명/암 주기로 유지하였다. C57BL/6J 마우스를 Envigo(Italy)에서 구입하였다.
알비노 Abca4 -/- 마우스를 BALB/c 마우스(Rpe65 Leu450에 대해 동형접합)와의 연속 교배 및 역교배를 통해 생성시키고, 근친교배를 유지하였다. BXD24/TyJ-Cep290rd16/J(rd16으로 언급됨) 마우스는 The Jackson Laboratory(JAX stock #000031)에서 수입되었다. rd16 마우스는 엑손 35-39를 포함하는 897 bp의 인-프레임 결실을 갖는다(46). 동형접합 암컷과 동형접합 수컷을 교배시켜 마우스를 유지시켰다. 혈우병 마우스 B6;129S-F8tm1Kaz/J(F8tm1으로 언급됨)를 The Jackson Laboratory(JAX stock #004424)에서 수입하였다. F8tm1 마우스는 엑손 16의 3' 말단의 7 bp 및 인트론 16의 5' 말단의 286 bp를 포함하여 293 bp의 서열을 대체하는 네오마이신 내성 카세트를 갖는다. 마우스 콜로니는 동형접합 암컷과 반접합체 수컷을 교배함으로써 유지시켰다.
이러한 연구에 사용된 대형 백색 암컷 돼지(Azienda Agricola Pasotti, Imola, Italy)는 이탈리아 국립 돼지 사육 협회(Italian National Pig Breeders' Association)의 LWHerd Book에 순종으로 등록되었으며, Centro di Biotecnologie A.O.R.N. Antonio Cardarelli (Naples, Italy)에서 사육되었고, 12시간의 명/암 주기로 유지시켰다.
마우스 및 돼지에서의 AAV 벡터의 망막하 주사
이러한 연구를 안과 및 시력 연구에서의 동물 사용에 대한 시력 및 안과 연구 협회 성명 및 동물 절차에 대한 이탈리아 보건부 규정에 따라 수행하였다. 마우스에 대한 모든 절차는 2015년 3월 6일에 이탈리아 보건부; 보건, 동물 보건, 영양 및 식품 안전과의 승인을 받았다.
마우스 및 돼지에서의 망막하 주사를 이전에 기재된 바와 같이 수행하였다(예를 들어, 14). 마우스 눈에 1 μl 또는 0.5 μl(rd16 새끼의 경우)의 벡터 용액을 주사하였다. AAV2/8 용량은 결과 섹션에 기재된 바와 같이 다양한 마우스 실험에서 다양하였다. 돼지 눈에 100 μl의 AAV2/8 벡터 용액의 2개의 인접한 망막하 수포를 주사하였다. AAV2/8 용량은 2x10^11 GC의 각각의 벡터/눈이었고, 따라서 2개의 AAV 벡터의 공동 주입은 4x10^11 GC/눈의 전체 용량을 발생시켰다.
조직학, 광학 및 형광 현미경검사
조직학적 섹션에서 EGFP 발현을 평가하기 위해, C57BL/6J 마우스 및 대형 백색 돼지 둘 모두로부터의 망막 오르가노이드, 눈을 고정시키고, 이전에 기재된 바와 같이 섹션화하였다. DAPI(Vector Lab Inc., Peterborough, UK)가 있는 Vectashield가 장착된 EGFP 양성 냉동절편을 적절한 여기 및 검출 설정을 사용하여 공초점 LSM-700 현미경(Carl Zeiss, Oberkochen, Germany)에서 분석하고, 40x 배율로 획득하였다. 적녹 색맹의 유병률로 인해, 적색 및 녹색의 존재를 함께 피하기 위해, 원본 이미지의 색이 도 14에서 수정되었다.
AAV CEP290 인테인 벡터가 주사된 rd16 마우스에서 외부 핵층의 두께를 평가하기 위해, 눈을 밤새 4% 파라포름알데하이드(PFA)에서 고정시킨 후, 연속 에탄올에서 탈수시킨 후, 파라핀 블록에 포매시켰다. rd16 마우스(10 μm)의 연속 단면을 수평 경선을 따라 절단하고, 슬라이드에 점진적으로 분포하고, 헤마톡실린 및 에오신(H&E)으로 염색하였다. 이후, 섹션을 현미경(Leica Microsystems GmbH; DM5000)으로 분석하고, 20x 배율로 획득하였다. 각각의 눈에 대해, 눈의 중앙 영역에 있는 슬라이스의 시간적 주입 측면으로부터의 하나의 이미지를 분석에 사용하였다. ImageJ 소프트웨어의 "프리핸드 라인(freehand line)"을 사용하여 유전자형/치료 그룹에 마스킹된 작업자에 의해 각각의 이미지에서 ONL 두께의 3회 측정을 획득하였다.
면역형광 분석
ABCA4 또는 CEP290 AAV 인테인 플라스미드로 형질감염된 HeLa 세포를 형질감염 후 24시간에 10분 동안 4% PFA에 고정시켰다. 세포를 30분 동안 차단 완충액(PBS 중 0.05% 사포닌, 0.5% BSA, 50mM NH4Cl, 0.02%NaN3, pH7.2)에서 차단한 후, 다음과 같이 인큐베이션하였다:
- ABCA4 단백질을 검출하기 위해 항-플래그 M2 항체(F1804, Sigma-Aldrich); 세포질그물을 염색하기 위해 항-VAP-B 항체[Antonella De Matteis lab에서 생산됨((47)] 및 트랜스-골지 네트워크를 염색하기 위해 TGN46(AHP-499, Serotech)로 1시간 동안. PBS에서 세척 후, 세포를 30분 동안 2차 항체와 인큐베이션하였다: 항-플래그, -VAP-B 및 -TGN46 항체 각각에 대해 특이적인 염소 항-마우스 Alexa Fluor 568; 염소 항-토끼 Alexa Fluor 488, 당나귀 항-양 Alexa Fluor 633.
- CEP290 단백질을 검출하기 위해 항-플래그 항체(F7425, Sigma-Aldrich), 및 미세소관을 염색하기 위해 항-아세틸화 튜불린 항체(T6793, Sigma-Aldrich)로 밤새. PBS에서 세척 후, 세포를 1시간 동안 적절한 2차 항체와 함께 인큐베이션하였다: 각각 항-플래그 및 -Ac-튜불린 항체에 특이적인 염소 항-토끼 Alexa Fluor 594 및 당나귀 항-마우스 Alexa Fluor 488.
핵을 DAPI로 염색하였다. 적녹 색맹의 유병률로 인해, 적색 및 녹색의 존재를 함께 피하기 위해, 원본 이미지의 색이 도 2 c-d 및 도 18 모두에서 수정되었다.
인간 망막 오르가노이드의 면역형광에 사용되는 항체는 다음과 같다:
항-인간 추상체-어레스틴(arrestin)(CAR)(50, 51)(1:10000, 'Luminaire founders' hCAR; Dr Cheryl M. Craft, Doheny Eye Institute, Los Angeles, CA, USA로부터의 선물); 항-옵신, 레드/그린(1:200, AB5405; Merck Millipore, Darmstadt, Germania); 항-레코베린(anti-Recoverin)(1:500, AB5585; Merck Millipore); 항-CRX(A-9, 1:250, sc377138; Santa Cruz Biotechnology, Dallas, Texas, USA); 항-로돕신(1D4, 1:200, ab5417, Abcam, Cambridge, MA, USA).
투과 및 주사 전자 현미경 분석
전자 현미경(EM) 분석을 위해, AAV 망막하 주사 후 3개월에 Abca4 -/- 마우스를 밤새 어둡게 적응시킨 후, 눈을 수확하였다. 눈을 18시간 동안 0.1 M PHEM 완충액 pH 6.9 중 0.2% 글루타르알데하이드(GA) - 2% PFA에 고정시킨 후, 0.1 M PHEM 완충액으로 헹구었다. 이후, 눈을 광학 현미경 하에서 절개하여 아이컵(eyecup)의 시간적 주입 영역을 선택하였다. 이후, 아이컵의 상기 부분을 2.3 M 수크로스가 주입된 12% 젤라틴에 포매시켰다. 냉동절편(60 nm)을 액체 질소에서 동결시키고, Leica Ultramicrotome EM FC7(Leica Microsystems)을 사용하여 절단하였다. 다양한 실험 그룹에 대한 데이터 속성의 편향을 피하기 위해, iTEM 소프트웨어(Olympus SYS, Hamburg, Germany)를 사용하여 유전자형/치료 그룹에 마스킹된 작업자에 의해 망막 색소 상피에서 리포푸신 과립이 차지하는 영역의 측정을 수행하였다. 각각의 필드에서 각각의 리포푸신 과립의 영역은 iTEM 소프트웨어의 '프리 핸드 폴리곤' 도구를 사용하여 적어도 20개의 상이한 이미지(25 μm2 영역)에서 측정하였다.
주사 전자 현미경(SEM) 분석을 위해, 망막 오르가노이드를 GA에 고정하고, Os04로 염색하고, 에탄올에서 탈수하고, 임계점 건조 절차를 사용하여 건조시켰다. 이후, 건조된 표본을 SEM 표본 스텁(stub)에 장착하고, 얇은 층의 금으로 코팅하였다. 표본의 표면 3차원 구성을 분석하고, 이미지를 JEOL 6700F 주사 전자 현미경(JEOL Ltd., Tokyo, Japan)을 사용하여 획득하였다.
미세구조 분석을 위해, 망막 오르가노이드를 0.2 M PHEM 완충액 pH 7.3 중 2% PFA 및 1% GA의 혼합물로 밤새 고정시켰다. 고정 후, 표본을 이전에 기재된 바와 같이 사후-고정시켰다. 이후, 이들을 탈수시키고, 에폭시 수지에 포매시키고, 72시간 동안 60℃에서 중합시켰다. 얇은 연속 60 nm 섹션을 Leica EM UC7 박절기에서 절단하였다.
EM 이미지를 VELETTA CCD 디지털 카메라(FEI, Eindhoven, The Netherlands)가 장착된 FEI Tecnai-12 전자 현미경을 사용하여 획득하였다.
전기생리학 기록 및 스펙트럼 도메인 광학 간섭 단층촬영
기능적 및 형태학적 분석을 이미 기재된 바와 같이 수행하였다(14).
동공 광 반응
rd16 마우스로부터의 동공 광 반응을 전하-결합 장치 NikonDlH 디지털 카메라(Topcon Biomedical Systems, Oakland, NJ)에 연결된 TRC-50IX 망막 카메라를 사용하여 어두운 조건에서 기록하였다. 마우스를 대략 10초 동안 10 럭스 광 자극에 노출시키고, IMAGEnet 소프트웨어(Topcon Biomedical Systems)를 사용하여 눈 당 하나의 사진을 획득하였다. 각각의 눈에 대해, 동공 직경을 눈 직경(측두에서 비강까지)으로 표준화하였다.
통계 분석
일원 ANOVA 검사(지표 검사) 또는 크루스칼-왈리스(Kruskal-Wallis) 순위 합계 검사(비-지표 검사)를 수행하여 종속 변수에 대한 2개 이상의 그룹의 독립 변수 사이의 통계적으로 유의한 차이가 있는지 결정하였다. P-값은 다음과 같다: 시험관 내(p 크루스칼-왈리스(Kruskal-Wallis) = 0.006036), 마우스 망막(p ANOVA = 0.00585), 및 돼지 망막(p 크루스칼-왈리스 = 0.009005)에서의 EGFP 단백질 정량을 위한 ELISA 검정;
도 5a(p ANOVA = 0.00585); 도 5b(p 크루스칼-왈리스 = 5.547E-5); 도 5c(p ANOVA=5.81E-10); ERG 분석(a- 및 b-파 진폭 둘 모두에 대해 분석된 모든 휘도에서 p ANOVA 또는 p 크루스칼-왈리스 > 0.05); 도 S14의 OCT 분석(ABCA4의 경우 p ANOVA = 0.52 및 CEP290의 경우 p ANOVA = 0.965). 그룹의 평균 사이의 다중 쌍별-비교로 결정된 그룹 사이의 통계적으로 유의한 차이는 다음과 같다: 시험관 내(단일 AAV 대 이중 AAV = 0.012; AAV 인테인 대 이중 AAV = 0.012; 단일 AAV 대 AAV 인테인 = 0.222), 마우스 망막(단일 AAV 대 이중 AAV = 0.0044; AAV 인테인 대 이중 AAV = 0.3754; 단일 AAV 대 AAV 인테인 = 0.0561) 및 돼지 망막(단일 AAV 대 이중 AAV = 0.012; AAV 인테인 대 이중 AAV = 0.012; 단일 AAV 대 AAV 인테인 = 0.841)에서의 EGFP 단백질 정량화를 위한 ELISA 검정; 도 5a: +/+ 대 -/- AAV 인테인 = 0.4530; +/+ 대 -/- = 0.0002; 도 5b: 야생형 대 rd16 AAV 인테인 = 0.00131; 도 5c: 야생형 대 rd16 AAV 인테인 1E-07; 야생형 대 rdl6 neg < IE-06.
실시예
실시예 1. AAV-EGFP 인테인은 시험관 내에서 전장 단백질을 재구성한다.
본 발명자는 망막에서 인테인 매개 단백질 트랜스-스플라이싱의 효율을 시험하였다; 2개의 AAV 벡터를 생성시켰으며, 각각은 노스톡 푼크티포르메[Npu 도 1a]로부터의 DnaE 분할-인테인의 N- 및 C-말단 절반에 각각 융합된 리포터 EGFP 단백질의 N- 또는 C-말단 절반을 인코딩한다. EGFP 단백질은 아미노산(a.a.) C71에서 분할되었다. 각각의 AAV 벡터는 적절한 조절 요소(즉, 프로모터 및 소 성장 호르몬 아데닐중합체형성 신호(bGHpA) 및 삼중 플래그 태그(3x플래그))를 포함하여 둘 모두의 절반뿐만 아니라 전장의 재구성된 EGFP 단백질의 검출을 허용하였다(도 1a).
AAV-EGFP Dna E 인테인 플라스미드를 사용하여 인간 배아 신장 293(HEK293) 세포를 형질감염시키고, 단일 N- 및 C-말단 절반뿐만 아니라 전장 EGFP 단백질의 생성을 평가하였다. 도 12에 제시된 바와 같이 전장 EGFP를 인코딩하는 단일 AAV 플라스미드로 형질감염된 세포에서 관찰된 것과 동등한 EGFP 형광은 AAV-EGFP 인테인 플라스미드로 공동 형질감염된 세포에서 검출되었지만, 단일 N- 및 C-말단 AAV-EGFP 인테인 플라스미드로 공동 형질감염된 세포에서 검출되지 않았다. 도 1b에 제시된 바와 같이 성숙 단백질에서 스플라이싱된 DnaE 인테인(약 17 kDa)과 함께 예상 크기(약 28 kDa)의 트랜스-스플라이싱된 EGFP 단백질의 존재를 둘 모두의 AAV-EGFP 인테인 플라스미드의 공동 형질감염 후에만 HEK293 세포 용해질의 웨스턴 블롯(WB) 분석에 의해 확인하였다. 또한, 밴드 강도의 정량화는 AAV 인테인 플라스미드로부터의 EGFP 단백질 양이 단일 AAV 플라스미드에서 관찰된 것의 76 ± 37%(n= 3의 독립적인 실험)임을 나타내었다. 단백질 재구성의 정확성을 정의하기 위해, EGFP를 AAV-EGFP 인테인 플라스미드로 형질감염된 HEK293 세포로부터 면역정제하였고, 액체 크로마토그래피-질량 분광법(LC-MS) 분석을 수행하여 이의 단백질 서열을 정의하였다. 이러한 샘플의 단백질분해성 분해로부터 획득된 3539 펩티드(이 중 7개가 분할 지점을 포함함(표 5))는 전체 단백질을 포함하였고, AAV 인테인 플라스미드에 의해 재구성된 EGFP의 아미노산 서열이 야생형 EGFP의 것과 정확히 일치함을 확인하였다.
표 5. EGFP 분할 지점을 포함하는 펩티드.
C = 시스테인 71
실시예 2. AAV-EGFP 인테인은 시험관 내에서 이중 AAV 벡터보다 효율적이다.
AAV 인테인 벡터에서 EGFP 단백질 재구성을 확인하기 위해, HEK293 세포를 AAV2/2-CMV-EGFP DnaE 인테인 또는 동일한 발현 카세트를 포함한 단일 및 이중 AAV 벡터로 감염시켰다. 이중 벡터가 완전한 DNA 또는 단백질 재조합을 겪는다고 가정하는 3개의 시스템 사이의 유사한 용량을 의미하는 5x10^4 유전체 카피(GC)/세포의 각각의 벡터의 감염 다중도(m.o.i). EGFP 양을 정확하게 정량하기 위해, 감염 후 72시간에 세포 용해질을 수확하였다. EGFP 발현을 WB 및 효소 결합 면역흡착 검정(ELISA) 둘 모두에 의해 평가하였다: AAV 인테인 벡터로 획득된 EGFP 발현은 단일 AAV로 달성된 것의 대략 절반(단일 AAV = 0.735 ± 0.2 ng EGFP/μg 전체 용해질, n=5의 독립적 실험; AAV 인테인 = 0.403 ± 0.04 ng EGFP/μg 전체 용해질, n=5의 독립적 실험) 및 도 1c에 제시된 바와 같이 이중 AAV 벡터로 획득된 것보다 10배(이중 AAV = 0.046 ± 0.01 ng EGFP/μg 전체 용해질, n=5의 독립적 실험) 더 높았다. 또한, 절제된 인테인의 것에 비한 전장 EGFP의 강도를 WB로 정량화하였고; 이들의 상대적 풍부함은 1:0.2(n=6의 독립적 실험, 도 13a)인 것으로 밝혀졌다.
실시예 3. AAV-EGFP 인테인 벡터의 망막하 투여는 마우스 및 돼지 망막 둘 모두에서 효율적인 전장 단백질 재구성을 발생시킨다.
AAV 인테인-매개 트랜스-스플라이싱이 망막에서 전장 단백질 발현을 재구성하는지의 여부를 조사하기 위해, 4주령 C57BL/6J 마우스에 AAV2/8-CMV-EGFP Dna E 인테인 벡터(각각의 벡터의 용량/눈: 5.8x10^9 GC)를 망막하 주사하였다. 눈을 1개월 후에 수확하고, 현미경 분석으로 분석하였다. EGFP 형광은 망막 색소 상피의 모든 눈에서, 가장 중요하게는 광수용체에서 검출되었다(도 1d). 광수용체에서의 단일 및 이중 AAV의 것에 대해 AAV 인테인으로부터의 트랜스진 발현을 비교하기 위해, 광수용체 특이적 인간 G 단백질 결합 수용체 키나제 1(GRK1) 프로모터의 제어 하에서 EGFP를 인코딩하는 AAV2/8 벡터를 4주령 C57BL/6J 마우스에 망막하 주사하였다(각각의 벡터의 용량/눈: 5x10^9 GC). 눈을 주사 1개월 후에 수확하고, 형광 현미경, ELISA 또는 WB로 분석하였다.
EGFP 형광을 도 1e에서 관찰된 바와 같이 모든 세트의 벡터가 주사된 눈의 광수용체 세포층에서 검출되었다. ELISA에 의한 EGFP 단백질 양의 정확한 정량화는 AAV 인테인이 단일 AAV보다 덜 효율적이고, 이중 AAV보다 약 3배 더 효율적으로 EGFP 단백질을 재구성하였음을 확인하였다(단일 AAV = 8.41 ± 2.48 ng EGFP/망막, n=5 눈; AAV 인테인 = 3.72 ± 0.85 ng EGFP/망막, n=7 눈; 이중 AAV = 1.38 ± 0.43 ng EGFP/망막, n=7 눈). WB 밴드 강도의 정량화 후 절제된 인테인에 대한 전장 EGFP의 상대량은 1:3(n=14 분석된 눈, 도 13b)이었다.
이후, 본 발명자는 돼지 망막에서 광수용체를 형질도입할 때 AAV 인테인 벡터의 효율성을 평가하였고, 이는 이의 크기 및 구조로 인해 바이러스 벡터 형질도입을 평가하는 우수한 전임상 모델이다(48). 따라서, 대형 백색 돼지에 단일 인테인 및 이중 AAV2/8-GRK1-EGFP 벡터(각각의 벡터의 용량/눈: 2x10^11 GC, 2개의 인접한 망막하 수포를 통해 전달됨)를 망막하 주사하였다. 눈을 주사 1개월 후에 수확하고, 형광 현미경, ELISA 또는 WB로 분석하였다. 특히, 광수용체 세포층에서 AAV 인테인 매개 EGFP 단백질 재구성은 EGFP 형광에 의해 평가된 바와 같이 이중 AAV에 의해 매개된 것보다 높았고 단일 AAV 벡터와 구별할 수 없었다(도 1f). 망막 용해질에서 EGFP의 정확한 정량화는 AAV 인테인이 단백질을 단일 AAV로 달성한 것과 유사하고 이중 AAV 벡터로 획득된 것보다 약 3배 더 높은 양으로 재구성하는 것을 확인하였다(단일 AAV = 247.5 ± 45.1 ng EGFP/망막, n= 5 눈; AAV 인테인 = 227.0 ± 15.7 ng EGFP/망막, n=5 눈; 이중 AAV = 82.3 ± 9.6 ng EGFP/망막, n=5 눈). WB 밴드 강도의 정량화 후 절제된 인테인에 대한 전장 EGFP의 상대량은 1:2(n=8 눈, 도 13c)이었다.
실시예 4. 전장 EGFP는 3D 인간 망막 오르가노이드에서 AAV 매개 단백질 트랜스-스플라이싱에 의해 재구성된다.
인간 망막을 대표하는 추가 전임상 모델로서, 본 발명자는 인간 유도 다능성 줄기 세포(iPSC)로부터 3D 망막 오르가노이드를 생성시켰다(49, 50). 6개월된 오르가노이드(도 14a)는 도 14b에 제시된 바와 같이 성숙 광수용체 마커에 의해 염색된 세포를 함유하였고; 오르가노이드는 형광 분석에 의해 도 14c에 제시된 바와 같이 광수용체 특이적 프로모터를 갖는 AAV2 벡터, 즉, AAV2/2 CMV EGFP 및 AAV2/2 IRBP DsRed 벡터에 의해 성공적으로 형질도입되었다. 광학(도 14d) 및 전자(도 14e-f) 현미경은 광수용체 외부 세그먼트의 버드(bud)의 존재를 제시한다. AAV-GRK1-EGFP 인테인 벡터(각각의 벡터의 용량/오르가노이드: 1x10^12 GC)와 함께 30일 동안 인큐베이션된 9개월된 3D 인간 망막 오르가노이드는 EGFP 형광을 제시한다(도 1g). 망막 오르가노이드 용해질의 WB 분석(도 15)은 밴드 강도 정량화(n = 4 오르가노이드) 후 절제된 인테인보다 약 5배 더 풍부한 전장 EGFP 발현을 확인한다.
실시예 5. 큰 단백질의 인테인 매개 트랜스스플라이싱(효율적인 AAV 인테인 매개 단백질 트랜스-스플라이싱을 위해 최적의 ABCA4 및 CEP90 분할 지점의 확인이 필요함)
단백질 트랜스-스플라이싱이 큰 치료 단백질을 재구성하는 메커니즘으로 개발될 수 있는지의 여부를 시험하기 위해, 본 발명자는 AAV-ABCA4 및 -CEP290 인테인 벡터를 개발하였다.
ABCA4 및 CEP290을 2개(AAV I, AAV II) 또는 3개(AAV I, AAV II, AAV III)의 단편으로 분할하였고, 이의 코딩 서열은 단일 AAV 벡터에서 개별적으로 클로닝되었고, 도 16에 제시된 바와 같이 분할-인테인 N- 및 C-말단의 코딩 서열에 융합되었다. AAV 인테인 벡터는 편재성 짧은 CMV[(shCMV), 모든 세트에 대해] 또는 GRK1 프로모터(ABCA4에 대해 세트 1 및 CEP290에 대해 세트 5)를 포함하였다.
각각의 단백질에 대한 분할 지점은 효율적인 단백질 트랜스-스플라이싱을 위한 접합 지점에서의 아미노산 잔기 요구사항(18, 51)뿐만 아니라 각각의 독립적인 폴리펩티드 및 이에 따른 최종 재구성된 단백질의 적절한 폴딩 및 안정성을 선호하는 중요 단백질 도메인의 온전성의 보존 둘 모두를 고려하여 선택하였다. 추가 분할-인테인을 또한 고려하였다. 단백질이 3개의 폴리펩티드(세트 4 및 5, 도 16b)로 분할된 CEP290 세트를 우드척 간염 바이러스 전사 후 조절 요소[WPRE, (52)]의 포함을 허용하도록 생성시켜 트랜스진 발현을 증가시켰다. 생성된 전장 단백질의 양을 감소시킬 수 있는 AAV I과 AAV III 사이의 원치 않는 트랜스-스플라이싱을 방지하기 위해, 세트 4 및 5는 2개의 분할 접합에서 2개의 상이한 분할-인테인, 특히 로도써무스 마리누스로부터의 DnaB 인테인 및 야생형 DnaE 인테인 또는 본 발명자가 교차 반응하지 않는 것을 제시하는 돌연변이된 DnaE 인테인을 포함하였다(도 17).
본 발명자는 HEK293 세포의 형질감염 후 ABCA4 및 CEP290을 재구성하는 AAV 인테인 플라스미드의 각각의 세트의 능력을 비교하였다. 형질감염 72시간 후 세포 용해질의 WB 분석은 예상 크기의 전장 ABCA4 및 CEP290 단백질(각각 약 250 kDa 및 약 290 kDa)이 다양한 효율로 AAV 인테인 플라스미드의 각각의 세트로부터 재구성된 것을 나타내었다(도 2a-b). 세트 1 및 5는 각각 ABCA4 및 CEP290 단백질 재구성에 가장 효율적인 것으로 밝혀졌으며, 따라서 모든 후속 실험에 사용하였다.
단백질 재구성의 정확성을 정의하기 위해, 본 발명자는 세트 1로 형질감염된 HEK293 세포로부터의 ABCA4를 면역정제하고, LC-MS 분석을 수행하여 이의 단백질 서열을 정의하였다. 이러한 샘플의 단백질분해성 분해로부터 획득된 3108 펩티드(이 중 22개가 분할 지점을 포함함(표 6))는 전체 단백질을 포함하였고, AAV 인테인 플라스미드에 의해 재구성된 ABCA4의 아미노산 서열이 야생형 ABCA4의 것과 정확히 일치함을 확인하였다. AAV 인테인에 의해 재구성된 ABCA4의 아미노산 서열은 야생형 ABCA4의 것과 일치한다. AAV 인테인에서 재구성된 ABCA4의 액체 크로마토그래피-질량 분광법 분석에서 확인된 야생형 ABCA4 서열과 펩티드 사이의 정렬을 수행하였다.
표 6. ABCA4 분할 지점을 포함하는 펩티드.
N.B.: C : 시스테인 1150
이후, 본 발명자는 상이한 인테인 함유 플라스미드의 단백질 생성물의 세포 내 국소화를 전장 단백질의 국소화와 비교하여 이들을 평가하였다. 전장 ABCA4는 배양된 세포주에서 발현시 세포질그물(ER)에 위치하는 것으로 공지되어 있다(53, 54). 세트 1로부터의 2개의 ABCA4 폴리펩티드는 ER에서 공동 국소화하는 것으로 밝혀진 반면, 트랜스-골지 네트워크에서는 공동국소화가 밝혀지지 않았다(도 2c). AAV 인테인 플라스미드로 공동 형질감염된 세포뿐만 아니라 전장 ABCA4 단백질을 인코딩하는 플라스미드로 형질감염된 세포에서 유사한 국소화가 관찰되었고, 따라서 이는 세포주에서 외인적으로 발현된 ABCA4의 ER에서의 우세한 국소화를 확인한다.
CEP290의 경우, 전장 단백질이 우세한 점 모양 및 작은 원섬유 패턴을 갖는 혼합 분포 패턴을 나타내는 것으로 보고되었다(55). CEP290의 세포하 표적화를 담당하는 도메인의 해부는 N-말단 도메인(a.a. 1-362)이 막과 상호작용하는 이의 능력으로 인해 단백질을 소포 구조로 표적화하는 반면, 단백질의 미오신-꼬리 상동성 도메인의 많은 부분을 포함하는 CEP290의 C-말단 근처의 영역은 미세소관 결합(a.a. 580-2479)을 매개하고, 트렁케이션된 형태로 발현되는 경우 아세틸화된 튜불린(Ac-Tub)과 일치하는 현저한 원섬유 분포를 갖는 것을 나타내었다. 드리바스 등(Drivas et al.)과 일치하여, AAV I, II 또는 III 인테인 플라스미드로 단독으로 형질감염되거나 AAV I+II, AAV I+III 및 AAV II+III로 공동 형질감염된 HeLa 세포에 대한 면역형광 분석은 AAV I 및 AAV II로부터의 생성물이 우세한 점상 패턴을 갖는 반면 AAV III(단백질의 미오신-꼬리 상동성 도메인을 포함함)로부터의 것은 원섬유 패턴을 나타내고 Ac-tub에 완전히 공존하는 유일한 것임을 나타내었다(도 2d). 따라서, AAV I+II로부터의 생성물은 우세한 점상 패턴을 갖는 반면, AAV I+III 및 AAV II+III로부터의 것은 조합된 미세소관 원섬유 및 점상 패턴을 갖는다. 3개의 AAV CEP290 인테인 플라스미드로 공동 형질감염된 세포는 전장 CEP290 단백질을 인코딩하는 플라스미드로 형질감염된 세포에서 관찰된 신호와 동등한 미세소관을 따라 부분적으로 정렬된 우세한 점상 신호를 나타내었다(도 2d 및 도 18).
이후, 본 발명자는 AAV-ABCA4 및 -CEP290 인테인 플라스미드의 최상의 세트로 획득된 단백질의 양을 상응하는 전장 단백질을 인코딩하는 단일 AAV 플라스미드로부터 획득된 것과 비교하였다. 이를 위해, HEK293 세포를 동일한 등몰량의 단일 또는 AAV 인테인 플라스미드로 형질감염시키고, 형질감염 72시간 후에 세포 용해질을 WB로 분석하였다(도 19). 밴드 강도의 정량화는 AAV 인테인 플라스미드로부터의 ABCA4 및 CEP290 발현이 각각 상응하는 단일 AAV 플라스미드로 관찰된 것의 61 ± 4%(n= 3의 독립적 실험) 및 58 ± 4%(n= 3의 독립적 실험)인 것을 나타내었다.
실시예 6. AAV 인테인 벡터는 시험관 내 및 망막에서 큰 치료 단백질의 발현을 매개한다.
본 발명자는 AAV 인테인 매개 큰 단백질 재구성의 효율을 시험관 내 및 마우스 및 돼지 망막 모두에서 이중 AAV 벡터의 효율과 비교하였다. HEK293 세포를 ABCA4(세트 1) 또는 CEP290(세트 5)(m.o.i: 5x10^4 GC/각각의 벡터의 세포)을 인코딩하는 AAV2/2 이중 또는 인테인 벡터로 감염시키고, 세포 용해질을 WB에 의해 72시간 후에 분석하였다. 도 3a 및 3b에 제시된 바와 같이, AAV-ABCA4 및 -CEP290 인테인 벡터 둘 모두는 이중 AAV 벡터보다 더 효율적으로 큰 단백질 재구성을 매개하였다. 예상된 바와 같이, 전장 단백질에 더하여, 단일 AAV 인테인 벡터(ABCA4 및 CEP290 둘 모두의 경우) 또는 AAV II와 AAV III 사이에서 발생하는 트랜스-스플라이싱(CEP290의 경우)으로부터 유래된 더 짧은 폴리펩티드가 관찰되었다(도 3a 및 3b).
또한, 4주령 야생형 마우스에 이중 벡터(각각의 ABCA4 벡터의 용량/눈: 3.3x10^9 GC, 각각의 CEP290 벡터의 용량/눈: 1.1x10^9 GC)와 비교하여 AAV-GRK1-ABCA4 또는 -CEP290 인테인(각각 세트 1 및 5)을 망막하 주사하였다. 동물을 주사 후 4-7주에 희생시키고, 망막 용해질에서의 단백질 발현을 WB로 평가하였다. 전장 단백질은 AAV-ABCA4 인테인 주사된 눈의 10/11(91%)(도 4a 및 20) 및 AAV-CEP290 인테인 주사된 눈의 5/10(50%)(도 4b)에서 검출되었다. 반대로, 전장 단백질 발현은 ABCA4 및 CEP290 이중 AAV 벡터가 주사된 눈의 5/9(56%) 및 0/5에서 각각 명백하였다. 시험관 내에서 관찰된 것과 유사하게, 단일 AAV 인테인 벡터(ABCA4 및 CEP290 둘 모두의 경우) 및 AAV II와 AAV III 사이에서 발생하는 트랜스-스플라이싱(CEP290의 경우)으로부터 유래된 폴리펩티드가 검출되었다(도 4a 및 4b).
내인성에 비해 AAV 인테인에 의해 매개된 단백질 재구성의 효율을 조사하기 위해, 1-4개월령 Abca4 -/- 마우스에 AAV-GRK1-ABCA4 인테인 벡터(세트 1)(각각의 ABCA4 벡터의 용량/눈: 5.5x10^9 GC)를 망막하 주사하였다. 한달 후, 영향을 받지 않은 Abca4 -/- 마우스 및 AAV 인테인 주사된 Abca4 -/- 마우스로부터의 망막 용해질에서의 ABCA4 발현을 뮤린 및 인간 ABCA4 둘 모두를 인지하는 항체를 사용하여 WB에 의해 분석하였다(도 21). AAV 인테인 ABCA4 발현은 내인성 ABCA4의 8,6 ± 1,3%인 것으로 밝혀졌다.
임상적으로 관련된 돼지 망막에서의 효율적인 큰 단백질 재구성을 확인하기 위해, 대형 백색 돼지에게 AAV2/8-GRK1-ABCA4 인테인(세트 1) 또는 이중 벡터(각각의 벡터의 용량/눈: 2x10^11 GC, 2개의 인접한 망막하 수포를 통해 전달됨)를 망막하 주사하였고, 주사 1개월 후 단백질 발현을 WB로 분석하였다. 특히, AAV 인테인은 이중 AAV 벡터보다 더 효율적으로 전장 ABCA4 단백질을 재구성하는 것으로 밝혀졌다(도 4c).
마지막으로, 121일의 배양에서 건강한 개인 또는 STGD1 환자의 iPSC로부터의 인간 망막 오르가노이드[광수용체 성숙이 시작되는 경우(20)]를 AAV2/2-GRK1-ABCA4 인테인 벡터(세트 1)(각각의 벡터의 용량/오르가노이드: 1x10^12 GC)로 감염시켰다. 오르가노이드는 감염 후 20 내지 40일 사이에 용해되었고, WB로 분석하였다. 예상 크기의 ABCA4는 모든 감염된 오르가노이드에서 검출되었다(도 4d 및 도 22; 정상 대조군 및 STGD1 오르가노이드로부터 각각 n=3 및 n=4).
실시예 7. AAV 인테인 벡터의 망막하 투여는 STGD1 및 LCA10 마우스 모델의 망막 표현형을 개선시킨다.
AAV 인테인 벡터로 획득된 광수용체 형질도입이 치료적으로 관련될 수 있는지의 여부를 결정하기 위해, 이들을 STGD1(Abca4 -/- ) 및 LCA10(rd16)의 마우스 모델의 망막에서 시험하였다.
1개월령 Abca4 -/- 마우스에 AAV2/8-GRK1-ABCA4 인테인 벡터(세트 1)(각각의 벡터의 용량/눈: 4.3-4.8x10^9 GC)를 망막하 주사하였다. 3개월 후 눈을 수확하고, Abca4 -/- 마우스의 망막 색소 상피(RPE)에 축적되는 리포푸신의 양을 측정하기 위해 망막 초박막 섹션의 투과 전자 현미경 분석을 수행하였다(56, 57). 특히, RPE 리포푸신 축적은 AAV 인테인 벡터가 주사된 Abca4 -/- 눈에서 유의하게 감소하였지만, 음성 대조군 주입 눈에서는 그렇지 않았다(p 값 = 0.0163; 도 5a 및 도 23).
병행하여, 4-6일령 rd16 마우스에 AAV2/8-GRK1-CEP290 인테인 벡터(세트 5)(각각의 벡터의 용량/눈: 5.5x10^8 GC)를 망막하 주사하였다. 주사 1개월 후 망막 섹션의 현미경 분석은 광수용체 핵을 포함하는 외핵 층(ONL)의 두께가 점진적 망막 변성의 결과(55)로서 야생형 마우스에 비해 rd16 마우스에서 유의하게 감소한 것을 나타내었다(p 값 = 0.00048; 도 5b). 특히, AAV 인테인 벡터가 주사된 rd16 망막의 ONL 두께는 음성 대조군이 주사된 rd16 망막의 것보다 유의하게 더 높았다(약 60%, p 값 = 0.00281)(도 5b). 따라서, 동공 광 반응(PLR)에 기초한 망막 기능 시험은 음성 대조군이 주사된 rd16 눈에서보다 AAV 인테인 벡터가 주사된 rd16 마우스에서 유의하게 더 높은 동공 수축(약 20%, p 값 = 0.00073)을 나타내었다(도 5c).
또한, 본 발명자는 망막에서 AAV 인테인 벡터의 안전성을 조사하였다. 이를 위해, 야생형 C57BL/6J 마우스에 AAV2/8-GRK1-ABCA4 또는 -CEP290 인테인 벡터(각각 세트 1 및 5)(각각의 ABCA4 벡터의 용량/눈: 4.3x10^9 GC; 각각의 CEP290 벡터의 용량/눈: 1.1x10^9 GC)를 망막하 주사하고, 망막 전기 활성을 주사 후 6 및 4.5개월에 각각 간츠펠드(Ganzfeld) 망막전위도(ERG)에 의해 측정하였다. 둘 모두의 연구에서, a- 및 b-파 진폭은 AAV 인테인 벡터(ABCA4 및 CEP290에 대해 각각 n=14-15 및 n=11)가 주사된 마우스 눈과 음성 대조군 AAV 벡터(ABCA4 및 CEP290에 대해 각각 n=8 및 n=5) 또는 PBS(ABCA4 및 CEP290에 대해 각각n=6-7 및 n=6)가 주사된 눈 사이에서 유사하였다. 유사하게, 광학 간섭 단층촬영에 의해 측정된 ONL의 두께는 AAV 인테인-, 음성 대조군- 및 PBS-주사된 눈 사이에서 유사하였다(도 24).
실시예 8. 안전한 AAV 인테인 매개 큰 유전자 전달
AAV 인테인을 주사한 야생형 마우스에서 명백한 독성의 징후가 관찰되지 않았지만, 본 발명자는 일단 절제된 인테인 내에 포매시 융합된 단백질을 신속한 유비퀴틴화 및 이후의 프로테아좀 파괴로 유도하는 데그론의 트랜스-스플라이싱 시스템 내의 포함을 평가하였다(도 6). 기재된 데그론 대부분은 N- 또는 C-말단 위치(즉, CL1, SMN, CIITA, ODC)에서 기능적이며, 이들 데그론은 단일 숙주 단백질의 분해로 이어지기 때문에 N- 또는 C-인테인에 융합될 수 없으며 따라서 단백질 트랜스-스플라이싱(PTS) 반응에 관여할 필요가 있는 폴리펩티드를 뺀다. 따라서, 본 발명자는 N- 또는 내부 위치에서만 기능적 활성을 부여하는 3개의 아미노산 돌연변이인 R12Y, Y100I 및 G67S(69)를 포함하는 E. 콜리로부터의 디하이드로폴레이트 환원효소의 돌연변이 형태(ecDHFR)를 선택하였다.
절제된 인테인의 양을 감소시키는 데 있어서 ecDHFR의 효율을 시험하기 위해, 본 발명자는 Npu DnaE 및 ecDHFR(pAAV2.1-CMV-5' EGFP 인테인_ecDHFR)의 N-말단 절반에 융합된 EGFP의 N-말단 절반을 인코딩하는 AAV 벡터를 생성시켰다. 따라서, 데그론은 비활성화되어야 하는 C-말단 끝에 존재할 것이다. 벡터 II와 조합된 AAV-EGFP-ecDHFR 인테인 플라스미드(Npu DnaE의 C-말단 절반에 융합된 EGFP의 C-말단 절반(pAAV2.1-CMV-3' EGFP 인테인)을 인코딩함)를 HEK293 세포를 형질감염시키는 데 사용하였고, 전장 EGFP 단백질 및 절제된 인테인의 생성을 평가하였다. AAV 인테인과 비교하여 유사한 단백질 수준을 갖는 트랜스-스플라이싱된 EGFP 단백질이 WB 분석에 의해 검출되었다. 또한, 절제된 인테인의 양은 AAV-EGFP-ecDHFR 인테인 플라스미드의 공동형질감염 후 HEK293 세포 용해질에서 상당히 감소하였다(도 7). 이후, 발명자는 큰 ABCA4 단백질(pAAV2.1-CMV260-5' ABCA4 인테인_ecDHFR)에 동일한 전략을 적용하기로 결정하였다. EGFP에 관해서, 이들은 AAV-ABCA4-인테인과 비교하여 AAV-ABCA4-ecDHFR 인테인 플라스미드로부터의 전장 ABCA4의 유사한 양을 발견하였다(도 8a). 중요하게는, 절제된 인테인의 완전한 소멸이 관찰되었다(도 8b).
본 발명자가 ecDHFR 매개 DnaE 분해를 관찰하고 있음을 증명하기 위해, 세포를 트리메토프림(TMP)으로 처리하였다. TMP는 ecDHFR에 결합하여 단백질이 분해되는 것을 방지하여 융합 단백질이 분해를 피할 수 있도록 하는 항생제이다(69). AAV-ABCA4-ecDHFR 인테인 플라스미드로 공동 형질감염된 HEK293 세포를 증가된 용량의 TMP로 처리하고, DnaE 인테인이 더 이상 분해되지 않고, TMP는 용량 의존적 방식으로 ecDHFR을 안정화시킴을 발견하였고, 이는 DnaE 인테인의 감소가 ecDHFR에 의해 매개됨을 의미한다(도 9).
(인테인에 추가하여) 벡터에 데그론을 포함하는 한 가지 제한은 AAV의 클로닝 능력이 추가로 감소하여 일부 적용에 대해 특대 AAV 벡터를 생성한다는 것이다. 실제로, ecDHFR은 159aa 길이이다. 따라서, 본 발명자는 N- 또는 내부 위치에서의 활성에 중요한 것으로 보고된 아미노산을 보유하는 105 aa의 더 짧은 ecDHFR 변이체를 설계하였다. 본 발명자는 EGFP 및 ABCA4 인테인 플라스미드 둘 모두에서의 이러한 미니 ecDHFR(pAAV2.1-CMV-5' EGFP 인테인_미니 ecDHFR; pAAV2.1-CMV260- 5' ABCA4 인테인_미니 cDHFR)을 시험하였다. AAV-EGFP- 또는 ABCA4-미니 ecDHFR 인테인 플라스미드의 공동 형질감염시, 이들은 AAV 인테인 플라스미드와 비교하여 유사한 전장 단백질 발현(도 10 및 11a) 및 DnaE 인테인의 강한 감소(도 10 및 11b)를 발견하였다.
이들 결과는 PTS 시스템에서의 ecDHFR 또는 미니 ecDHFR의 포함이 단백질 트랜스-스플라이싱 및 치료 단백질 생성의 효능에 유의하게 영향을 주지 않고 선택적인 인테인 분해를 매개하는 것을 시사하였다.
실시예 9. 간에서의 인테인 매개 단백질 트랜스-스플라이싱
간에서의 인테인 매개 단백질 트랜스-스플라이싱의 효율을 시험하기 위해, 노스톡 푼크티포르메로부터의 DnaE 분할-인테인의 N- 및 C-말단 절반에 융합된 리포터 EGFP 단백질의 N- 또는 C-말단 절반을 각각 인코딩하는 2개의 AAV 벡터를 생성시켰다.
5주령의 C57/BL6 마우스에 간 특이적 인간 티록신 결합 글로불린(TBG) 프로모터(각각의 벡터의 용량/kg: 5 x 1011 GC)를 갖는 AAV2/8 벡터를 안구 뒤 주사하였다. 주사 후 4주에 간을 수확하고, 항-3x플래그 항체를 이용한 웨스턴 블롯에 의한 분석을 위해 용해시켜 EGFP-3x플래그 및 인테인-3x플래그를 검출하였다. EGFP 밴드 강도의 정량화는 AAV 인테인이 약 6-7배 더 많은 단백질 양으로 이중 AAV보다 간을 더 효율적으로 형질도입한다는 것을 나타내었다.
실시예 10. AAV 인테인 벡터는 혈우병 A에 영향을 받은 큰 F8 유전자를 전달하는 데 사용될 수 있다.
혈우병 A에서 돌연변이된 F8 유전자는 이의 야생형 형태의 단일 AAV에 의해 전달되기에는 너무 크다(약 7 kb). 이 때문에, 유전자의 B-도메인 결실(BDD) 형태만이 AAV 유전자 요법의 맥락에서 적합화되었다. 최근에, BDD-F8 및 짧은 간-특이적 프로모터 및 폴리A 신호 모두를 포함하는 5 kb 발현 카세트가 AAV5에 패키징되었고, 마우스 및 시노몰구스 원숭이(70)뿐만 아니라 HemA 환자(71)에서 FVIII의 치료 수준을 발생시키는 것으로 나타났다. 그러나, 이러한 벡터의 유전체는 약간 특대이며, 이종성의 트렁케이션된 유전체의 라이브러리로서 AAV 캡시드에 패키징되어 표적 세포에서 재구성시 효과적인 형질도입을 발생시킨다. 특대 AAV 벡터의 효율은 정상 크기에 비해 낮으며, 이종성의 트렁케이션된 유전체를 갖는 상기 생성물의 품질은 상용화를 향한 추가 개발을 배제할 수 있다.
제한된 AAV 화물 용량을 극복하기 위해, 각각 분할 Npu DnaE 인테인이 측면에 있는 큰 FVIII 단백질의 2개의 절반 중 하나를 인코딩하는 일정한 크기의 유전체를 갖는 2개의 별개의 AAV 벡터를 포함하는 단백질 트랜스-스플라이싱 전략을 설계하였다.
야생형 F8 유전자를 B 도메인에서 2개의 상이한 분할 지점, 즉 세트 1 및 세트 2로 분할하였다. 짧은 합성 폴리A와 함께 간 특이적 하이브리드 간 프로모터(HLP) 하에서 F8 인테인 벡터를 생성시켰다(도 25a). 벡터 유전체는 서던 블롯에 의해 제시된 바와 같이 이들의 특대 AAV BDD-F8 대조군과 달리 AAV 캡시드로 적절히 패키징되었다(도 25b).
전략의 치료적 관련성을 결정하기 위해, AAV2/8 F8 인테인 벡터를 안구 뒤 주입(각각의 벡터의 용량/동물: 4-5 x 1011 GC)을 통해 7-8주령 혈우병 A 넉아웃 마우스에 전신 주사하였다. 주사 8주 후 혈장의 aPTT(활성화된 부분 트롬보플라스틴 시간) 분석은 특대 단일 AAV BDD-F8 대조군과 동일한 수준이 아니지만 출혈 표현형의 약간의 수정을 나타내었다(도 25c).
참고문헌
SEQUENCE LISTING
<110> Fondazione Telethon
<120> Intein proteins and uses thereof
<130> PCT 141280
<150> EP18200490.3
<151> 2018-10-15
<150> EP19169116.1
<151> 2019-04-12
<160> 95
<170> PatentIn version 3.5
<210> 1
<211> 102
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 1
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 2
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 2
Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
20 25 30
Ala Ser Asn
35
<210> 3
<211> 106
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 3
Cys Leu Ala Gly Asp Thr Leu Ile Thr Leu Ala Asp Gly Arg Arg Val
1 5 10 15
Pro Ile Arg Glu Leu Val Ser Gln Gln Asn Phe Ser Val Trp Ala Leu
20 25 30
Asn Pro Gln Thr Tyr Arg Leu Glu Arg Ala Arg Val Ser Arg Ala Phe
35 40 45
Cys Thr Gly Ile Lys Pro Val Tyr Arg Leu Thr Thr Arg Leu Gly Arg
50 55 60
Ser Ile Arg Ala Thr Ala Asn His Arg Phe Leu Thr Pro Gln Gly Trp
65 70 75 80
Lys Arg Val Asp Glu Leu Gln Pro Gly Asp Tyr Leu Ala Leu Pro Arg
85 90 95
Arg Ile Pro Thr Ala Ser Thr Pro Thr Leu
100 105
<210> 4
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 4
Ala Ala Ala Cys Pro Glu Leu Arg Gln Leu Ala Gln Ser Asp Val Tyr
1 5 10 15
Trp Asp Pro Ile Val Ser Ile Glu Pro Asp Gly Val Glu Glu Val Phe
20 25 30
Asp Leu Thr Val Pro Gly Pro His Asn Phe Val Ala Asn Asp Ile Ile
35 40 45
Ala His Asn
50
<210> 5
<211> 102
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 5
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Ile Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Met Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 6
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 6
Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp
1 5 10 15
Ile Gly Leu Pro Gln Tyr His Asn Phe Leu Leu Ala Asn Gly Ala Ile
20 25 30
Ala Ala Asn
35
<210> 7
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 7
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr
20 25 30
Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His
35 40 45
Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln
85 90 95
Val Asp Gly Leu Pro
100
<210> 8
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 8
Val Lys Ile Ile Ser Arg Lys Ser Leu Gly Thr Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Lys Asn Gly Leu Val
20 25 30
Ala Ser Asn
35
<210> 9
<211> 102
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 9
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 10
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 10
Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
20 25 30
Ala Ser Asn
35
<210> 11
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 11
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr
20 25 30
Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His
35 40 45
Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln
85 90 95
Val Asp Gly Leu Pro
100
<210> 12
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 12
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val Lys Ile Ile Ser Arg Lys Ser Leu Gly Thr Gln Asn Val Tyr
20 25 30
Asp Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Lys Asn Gly Leu
35 40 45
Val Ala Ser Asn
50
<210> 13
<211> 123
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 13
Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser
20 25 30
Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser
50 55 60
Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln
65 70 75 80
Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr
85 90 95
Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn His Arg Leu
100 105 110
Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys
115 120
<210> 14
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 14
Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp
1 5 10 15
Ile Gly Leu Pro Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala Ile
20 25 30
Ala Ala Asn Cys
35
<210> 15
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 15
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Asp
225 230 235 240
Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys
245 250 255
Asp Asp Asp Asp Lys
260
<210> 16
<211> 2293
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 16
Met Gly Phe Val Arg Gln Ile Gln Leu Leu Leu Trp Lys Asn Trp Thr
1 5 10 15
Leu Arg Lys Arg Gln Lys Ile Arg Phe Val Val Glu Leu Val Trp Pro
20 25 30
Leu Ser Leu Phe Leu Val Leu Ile Trp Leu Arg Asn Ala Asn Pro Leu
35 40 45
Tyr Ser His His Glu Cys His Phe Pro Asn Lys Ala Met Pro Ser Ala
50 55 60
Gly Met Leu Pro Trp Leu Gln Gly Ile Phe Cys Asn Val Asn Asn Pro
65 70 75 80
Cys Phe Gln Ser Pro Thr Pro Gly Glu Ser Pro Gly Ile Val Ser Asn
85 90 95
Tyr Asn Asn Ser Ile Leu Ala Arg Val Tyr Arg Asp Phe Gln Glu Leu
100 105 110
Leu Met Asn Ala Pro Glu Ser Gln His Leu Gly Arg Ile Trp Thr Glu
115 120 125
Leu His Ile Leu Ser Gln Phe Met Asp Thr Leu Arg Thr His Pro Glu
130 135 140
Arg Ile Ala Gly Arg Gly Ile Arg Ile Arg Asp Ile Leu Lys Asp Glu
145 150 155 160
Glu Thr Leu Thr Leu Phe Leu Ile Lys Asn Ile Gly Leu Ser Asp Ser
165 170 175
Val Val Tyr Leu Leu Ile Asn Ser Gln Val Arg Pro Glu Gln Phe Ala
180 185 190
His Gly Val Pro Asp Leu Ala Leu Lys Asp Ile Ala Cys Ser Glu Ala
195 200 205
Leu Leu Glu Arg Phe Ile Ile Phe Ser Gln Arg Arg Gly Ala Lys Thr
210 215 220
Val Arg Tyr Ala Leu Cys Ser Leu Ser Gln Gly Thr Leu Gln Trp Ile
225 230 235 240
Glu Asp Thr Leu Tyr Ala Asn Val Asp Phe Phe Lys Leu Phe Arg Val
245 250 255
Leu Pro Thr Leu Leu Asp Ser Arg Ser Gln Gly Ile Asn Leu Arg Ser
260 265 270
Trp Gly Gly Ile Leu Ser Asp Met Ser Pro Arg Ile Gln Glu Phe Ile
275 280 285
His Arg Pro Ser Met Gln Asp Leu Leu Trp Val Thr Arg Pro Leu Met
290 295 300
Gln Asn Gly Gly Pro Glu Thr Phe Thr Lys Leu Met Gly Ile Leu Ser
305 310 315 320
Asp Leu Leu Cys Gly Tyr Pro Glu Gly Gly Gly Ser Arg Val Leu Ser
325 330 335
Phe Asn Trp Tyr Glu Asp Asn Asn Tyr Lys Ala Phe Leu Gly Ile Asp
340 345 350
Ser Thr Arg Lys Asp Pro Ile Tyr Ser Tyr Asp Arg Arg Thr Thr Ser
355 360 365
Phe Cys Asn Ala Leu Ile Gln Ser Leu Glu Ser Asn Pro Leu Thr Lys
370 375 380
Ile Ala Trp Arg Ala Ala Lys Pro Leu Leu Met Gly Lys Ile Leu Tyr
385 390 395 400
Thr Pro Asp Ser Pro Ala Ala Arg Arg Ile Leu Lys Asn Ala Asn Ser
405 410 415
Thr Phe Glu Glu Leu Glu His Val Arg Lys Leu Val Lys Ala Trp Glu
420 425 430
Glu Val Gly Pro Gln Ile Trp Tyr Phe Phe Asp Asn Ser Thr Gln Met
435 440 445
Asn Met Ile Arg Asp Thr Leu Gly Asn Pro Thr Val Lys Asp Phe Leu
450 455 460
Asn Arg Gln Leu Gly Glu Glu Gly Ile Thr Ala Glu Ala Ile Leu Asn
465 470 475 480
Phe Leu Tyr Lys Gly Pro Arg Glu Ser Gln Ala Asp Asp Met Ala Asn
485 490 495
Phe Asp Trp Arg Asp Ile Phe Asn Ile Thr Asp Arg Thr Leu Arg Leu
500 505 510
Val Asn Gln Tyr Leu Glu Cys Leu Val Leu Asp Lys Phe Glu Ser Tyr
515 520 525
Asn Asp Glu Thr Gln Leu Thr Gln Arg Ala Leu Ser Leu Leu Glu Glu
530 535 540
Asn Met Phe Trp Ala Gly Val Val Phe Pro Asp Met Tyr Pro Trp Thr
545 550 555 560
Ser Ser Leu Pro Pro His Val Lys Tyr Lys Ile Arg Met Asp Ile Asp
565 570 575
Val Val Glu Lys Thr Asn Lys Ile Lys Asp Arg Tyr Trp Asp Ser Gly
580 585 590
Pro Arg Ala Asp Pro Val Glu Asp Phe Arg Tyr Ile Trp Gly Gly Phe
595 600 605
Ala Tyr Leu Gln Asp Met Val Glu Gln Gly Ile Thr Arg Ser Gln Val
610 615 620
Gln Ala Glu Ala Pro Val Gly Ile Tyr Leu Gln Gln Met Pro Tyr Pro
625 630 635 640
Cys Phe Val Asp Asp Ser Phe Met Ile Ile Leu Asn Arg Cys Phe Pro
645 650 655
Ile Phe Met Val Leu Ala Trp Ile Tyr Ser Val Ser Met Thr Val Lys
660 665 670
Ser Ile Val Leu Glu Lys Glu Leu Arg Leu Lys Glu Thr Leu Lys Asn
675 680 685
Gln Gly Val Ser Asn Ala Val Ile Trp Cys Thr Trp Phe Leu Asp Ser
690 695 700
Phe Ser Ile Met Ser Met Ser Ile Phe Leu Leu Thr Ile Phe Ile Met
705 710 715 720
His Gly Arg Ile Leu His Tyr Ser Asp Pro Phe Ile Leu Phe Leu Phe
725 730 735
Leu Leu Ala Phe Ser Thr Ala Thr Ile Met Leu Cys Phe Leu Leu Ser
740 745 750
Thr Phe Phe Ser Lys Ala Ser Leu Ala Ala Ala Cys Ser Gly Val Ile
755 760 765
Tyr Phe Thr Leu Tyr Leu Pro His Ile Leu Cys Phe Ala Trp Gln Asp
770 775 780
Arg Met Thr Ala Glu Leu Lys Lys Ala Val Ser Leu Leu Ser Pro Val
785 790 795 800
Ala Phe Gly Phe Gly Thr Glu Tyr Leu Val Arg Phe Glu Glu Gln Gly
805 810 815
Leu Gly Leu Gln Trp Ser Asn Ile Gly Asn Ser Pro Thr Glu Gly Asp
820 825 830
Glu Phe Ser Phe Leu Leu Ser Met Gln Met Met Leu Leu Asp Ala Ala
835 840 845
Val Tyr Gly Leu Leu Ala Trp Tyr Leu Asp Gln Val Phe Pro Gly Asp
850 855 860
Tyr Gly Thr Pro Leu Pro Trp Tyr Phe Leu Leu Gln Glu Ser Tyr Trp
865 870 875 880
Leu Gly Gly Glu Gly Cys Ser Thr Arg Glu Glu Arg Ala Leu Glu Lys
885 890 895
Thr Glu Pro Leu Thr Glu Glu Thr Glu Asp Pro Glu His Pro Glu Gly
900 905 910
Ile His Asp Ser Phe Phe Glu Arg Glu His Pro Gly Trp Val Pro Gly
915 920 925
Val Cys Val Lys Asn Leu Val Lys Ile Phe Glu Pro Cys Gly Arg Pro
930 935 940
Ala Val Asp Arg Leu Asn Ile Thr Phe Tyr Glu Asn Gln Ile Thr Ala
945 950 955 960
Phe Leu Gly His Asn Gly Ala Gly Lys Thr Thr Thr Leu Ser Ile Leu
965 970 975
Thr Gly Leu Leu Pro Pro Thr Ser Gly Thr Val Leu Val Gly Gly Arg
980 985 990
Asp Ile Glu Thr Ser Leu Asp Ala Val Arg Gln Ser Leu Gly Met Cys
995 1000 1005
Pro Gln His Asn Ile Leu Phe His His Leu Thr Val Ala Glu His
1010 1015 1020
Met Leu Phe Tyr Ala Gln Leu Lys Gly Lys Ser Gln Glu Glu Ala
1025 1030 1035
Gln Leu Glu Met Glu Ala Met Leu Glu Asp Thr Gly Leu His His
1040 1045 1050
Lys Arg Asn Glu Glu Ala Gln Asp Leu Ser Gly Gly Met Gln Arg
1055 1060 1065
Lys Leu Ser Val Ala Ile Ala Phe Val Gly Asp Ala Lys Val Val
1070 1075 1080
Ile Leu Asp Glu Pro Thr Ser Gly Val Asp Pro Tyr Ser Arg Arg
1085 1090 1095
Ser Ile Trp Asp Leu Leu Leu Lys Tyr Arg Ser Gly Arg Thr Ile
1100 1105 1110
Ile Met Ser Thr His His Met Asp Glu Ala Asp Leu Leu Gly Asp
1115 1120 1125
Arg Ile Ala Ile Ile Ala Gln Gly Arg Leu Tyr Cys Ser Gly Thr
1130 1135 1140
Pro Leu Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr
1145 1150 1155
Leu Val Arg Lys Met Lys Asn Ile Gln Ser Gln Arg Lys Gly Ser
1160 1165 1170
Glu Gly Thr Cys Ser Cys Ser Ser Lys Gly Phe Ser Thr Thr Cys
1175 1180 1185
Pro Ala His Val Asp Asp Leu Thr Pro Glu Gln Val Leu Asp Gly
1190 1195 1200
Asp Val Asn Glu Leu Met Asp Val Val Leu His His Val Pro Glu
1205 1210 1215
Ala Lys Leu Val Glu Cys Ile Gly Gln Glu Leu Ile Phe Leu Leu
1220 1225 1230
Pro Asn Lys Asn Phe Lys His Arg Ala Tyr Ala Ser Leu Phe Arg
1235 1240 1245
Glu Leu Glu Glu Thr Leu Ala Asp Leu Gly Leu Ser Ser Phe Gly
1250 1255 1260
Ile Ser Asp Thr Pro Leu Glu Glu Ile Phe Leu Lys Val Thr Glu
1265 1270 1275
Asp Ser Asp Ser Gly Pro Leu Phe Ala Gly Gly Ala Gln Gln Lys
1280 1285 1290
Arg Glu Asn Val Asn Pro Arg His Pro Cys Leu Gly Pro Arg Glu
1295 1300 1305
Lys Ala Gly Gln Thr Pro Gln Asp Ser Asn Val Cys Ser Pro Gly
1310 1315 1320
Ala Pro Ala Ala His Pro Glu Gly Gln Pro Pro Pro Glu Pro Glu
1325 1330 1335
Cys Pro Gly Pro Gln Leu Asn Thr Gly Thr Gln Leu Val Leu Gln
1340 1345 1350
His Val Gln Ala Leu Leu Val Lys Arg Phe Gln His Thr Ile Arg
1355 1360 1365
Ser His Lys Asp Phe Leu Ala Gln Ile Val Leu Pro Ala Thr Phe
1370 1375 1380
Val Phe Leu Ala Leu Met Leu Ser Ile Val Ile Pro Pro Phe Gly
1385 1390 1395
Glu Tyr Pro Ala Leu Thr Leu His Pro Trp Ile Tyr Gly Gln Gln
1400 1405 1410
Tyr Thr Phe Phe Ser Met Asp Glu Pro Gly Ser Glu Gln Phe Thr
1415 1420 1425
Val Leu Ala Asp Val Leu Leu Asn Lys Pro Gly Phe Gly Asn Arg
1430 1435 1440
Cys Leu Lys Glu Gly Trp Leu Pro Glu Tyr Pro Cys Gly Asn Ser
1445 1450 1455
Thr Pro Trp Lys Thr Pro Ser Val Ser Pro Asn Ile Thr Gln Leu
1460 1465 1470
Phe Gln Lys Gln Lys Trp Thr Gln Val Asn Pro Ser Pro Ser Cys
1475 1480 1485
Arg Cys Ser Thr Arg Glu Lys Leu Thr Met Leu Pro Glu Cys Pro
1490 1495 1500
Glu Gly Ala Gly Gly Leu Pro Pro Pro Gln Arg Thr Gln Arg Ser
1505 1510 1515
Thr Glu Ile Leu Gln Asp Leu Thr Asp Arg Asn Ile Ser Asp Phe
1520 1525 1530
Leu Val Lys Thr Tyr Pro Ala Leu Ile Arg Ser Ser Leu Lys Ser
1535 1540 1545
Lys Phe Trp Val Asn Glu Gln Arg Tyr Gly Gly Ile Ser Ile Gly
1550 1555 1560
Gly Lys Leu Pro Val Val Pro Ile Thr Gly Glu Ala Leu Val Gly
1565 1570 1575
Phe Leu Ser Asp Leu Gly Arg Ile Met Asn Val Ser Gly Gly Pro
1580 1585 1590
Ile Thr Arg Glu Ala Ser Lys Glu Ile Pro Asp Phe Leu Lys His
1595 1600 1605
Leu Glu Thr Glu Asp Asn Ile Lys Val Trp Phe Asn Asn Lys Gly
1610 1615 1620
Trp His Ala Leu Val Ser Phe Leu Asn Val Ala His Asn Ala Ile
1625 1630 1635
Leu Arg Ala Ser Leu Pro Lys Asp Arg Ser Pro Glu Glu Tyr Gly
1640 1645 1650
Ile Thr Val Ile Ser Gln Pro Leu Asn Leu Thr Lys Glu Gln Leu
1655 1660 1665
Ser Glu Ile Thr Val Leu Thr Thr Ser Val Asp Ala Val Val Ala
1670 1675 1680
Ile Cys Val Ile Phe Ser Met Ser Phe Val Pro Ala Ser Phe Val
1685 1690 1695
Leu Tyr Leu Ile Gln Glu Arg Val Asn Lys Ser Lys His Leu Gln
1700 1705 1710
Phe Ile Ser Gly Val Ser Pro Thr Thr Tyr Trp Val Thr Asn Phe
1715 1720 1725
Leu Trp Asp Ile Met Asn Tyr Ser Val Ser Ala Gly Leu Val Val
1730 1735 1740
Gly Ile Phe Ile Gly Phe Gln Lys Lys Ala Tyr Thr Ser Pro Glu
1745 1750 1755
Asn Leu Pro Ala Leu Val Ala Leu Leu Leu Leu Tyr Gly Trp Ala
1760 1765 1770
Val Ile Pro Met Met Tyr Pro Ala Ser Phe Leu Phe Asp Val Pro
1775 1780 1785
Ser Thr Ala Tyr Val Ala Leu Ser Cys Ala Asn Leu Phe Ile Gly
1790 1795 1800
Ile Asn Ser Ser Ala Ile Thr Phe Ile Leu Glu Leu Phe Glu Asn
1805 1810 1815
Asn Arg Thr Leu Leu Arg Phe Asn Ala Val Leu Arg Lys Leu Leu
1820 1825 1830
Ile Val Phe Pro His Phe Cys Leu Gly Arg Gly Leu Ile Asp Leu
1835 1840 1845
Ala Leu Ser Gln Ala Val Thr Asp Val Tyr Ala Arg Phe Gly Glu
1850 1855 1860
Glu His Ser Ala Asn Pro Phe His Trp Asp Leu Ile Gly Lys Asn
1865 1870 1875
Leu Phe Ala Met Val Val Glu Gly Val Val Tyr Phe Leu Leu Thr
1880 1885 1890
Leu Leu Val Gln Arg His Phe Phe Leu Ser Gln Trp Ile Ala Glu
1895 1900 1905
Pro Thr Lys Glu Pro Ile Val Asp Glu Asp Asp Asp Val Ala Glu
1910 1915 1920
Glu Arg Gln Arg Ile Ile Thr Gly Gly Asn Lys Thr Asp Ile Leu
1925 1930 1935
Arg Leu His Glu Leu Thr Lys Ile Tyr Pro Gly Thr Ser Ser Pro
1940 1945 1950
Ala Val Asp Arg Leu Cys Val Gly Val Arg Pro Gly Glu Cys Phe
1955 1960 1965
Gly Leu Leu Gly Val Asn Gly Ala Gly Lys Thr Thr Thr Phe Lys
1970 1975 1980
Met Leu Thr Gly Asp Thr Thr Val Thr Ser Gly Asp Ala Thr Val
1985 1990 1995
Ala Gly Lys Ser Ile Leu Thr Asn Ile Ser Glu Val His Gln Asn
2000 2005 2010
Met Gly Tyr Cys Pro Gln Phe Asp Ala Ile Asp Glu Leu Leu Thr
2015 2020 2025
Gly Arg Glu His Leu Tyr Leu Tyr Ala Arg Leu Arg Gly Val Pro
2030 2035 2040
Ala Glu Glu Ile Glu Lys Val Ala Asn Trp Ser Ile Lys Ser Leu
2045 2050 2055
Gly Leu Thr Val Tyr Ala Asp Cys Leu Ala Gly Thr Tyr Ser Gly
2060 2065 2070
Gly Asn Lys Arg Lys Leu Ser Thr Ala Ile Ala Leu Ile Gly Cys
2075 2080 2085
Pro Pro Leu Val Leu Leu Asp Glu Pro Thr Thr Gly Met Asp Pro
2090 2095 2100
Gln Ala Arg Arg Met Leu Trp Asn Val Ile Val Ser Ile Ile Arg
2105 2110 2115
Glu Gly Arg Ala Val Val Leu Thr Ser His Ser Met Glu Glu Cys
2120 2125 2130
Glu Ala Leu Cys Thr Arg Leu Ala Ile Met Val Lys Gly Ala Phe
2135 2140 2145
Arg Cys Met Gly Thr Ile Gln His Leu Lys Ser Lys Phe Gly Asp
2150 2155 2160
Gly Tyr Ile Val Thr Met Lys Ile Lys Ser Pro Lys Asp Asp Leu
2165 2170 2175
Leu Pro Asp Leu Asn Pro Val Glu Gln Phe Phe Gln Gly Asn Phe
2180 2185 2190
Pro Gly Ser Val Gln Arg Glu Arg His Tyr Asn Met Leu Gln Phe
2195 2200 2205
Gln Val Ser Ser Ser Ser Leu Ala Arg Ile Phe Gln Leu Leu Leu
2210 2215 2220
Ser His Lys Asp Ser Leu Leu Ile Glu Glu Tyr Ser Val Thr Gln
2225 2230 2235
Thr Thr Leu Asp Gln Val Phe Val Asn Phe Ala Lys Gln Gln Thr
2240 2245 2250
Glu Ser His Asp Leu Pro Leu His Pro Arg Ala Ala Gly Ala Ser
2255 2260 2265
Arg Gln Ala Gln Asp Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys
2270 2275 2280
Asp His Asp Ile Asp Tyr Lys Asp Asp Asp
2285 2290
<210> 17
<211> 2501
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 17
Met Pro Pro Asn Ile Asn Trp Lys Glu Ile Met Lys Val Asp Pro Asp
1 5 10 15
Asp Leu Pro Arg Gln Glu Glu Leu Ala Asp Asn Leu Leu Ile Ser Leu
20 25 30
Ser Lys Val Glu Val Asn Glu Leu Lys Ser Glu Lys Gln Glu Asn Val
35 40 45
Ile His Leu Phe Arg Ile Thr Gln Ser Leu Met Lys Met Lys Ala Gln
50 55 60
Glu Val Glu Leu Ala Leu Glu Glu Val Glu Lys Ala Gly Glu Glu Gln
65 70 75 80
Ala Lys Phe Glu Asn Gln Leu Lys Thr Lys Val Met Lys Leu Glu Asn
85 90 95
Glu Leu Glu Met Ala Gln Gln Ser Ala Gly Gly Arg Asp Thr Arg Phe
100 105 110
Leu Arg Asn Glu Ile Cys Gln Leu Glu Lys Gln Leu Glu Gln Lys Asp
115 120 125
Arg Glu Leu Glu Asp Met Glu Lys Glu Leu Glu Lys Glu Lys Lys Val
130 135 140
Asn Glu Gln Leu Ala Leu Arg Asn Glu Glu Ala Glu Asn Glu Asn Ser
145 150 155 160
Lys Leu Arg Arg Glu Asn Lys Arg Leu Lys Lys Lys Asn Glu Gln Leu
165 170 175
Cys Gln Asp Ile Ile Asp Tyr Gln Lys Gln Ile Asp Ser Gln Lys Glu
180 185 190
Thr Leu Leu Ser Arg Arg Gly Glu Asp Ser Asp Tyr Arg Ser Gln Leu
195 200 205
Ser Lys Lys Asn Tyr Glu Leu Ile Gln Tyr Leu Asp Glu Ile Gln Thr
210 215 220
Leu Thr Glu Ala Asn Glu Lys Ile Glu Val Gln Asn Gln Glu Met Arg
225 230 235 240
Lys Asn Leu Glu Glu Ser Val Gln Glu Met Glu Lys Met Thr Asp Glu
245 250 255
Tyr Asn Arg Met Lys Ala Ile Val His Gln Thr Asp Asn Val Ile Asp
260 265 270
Gln Leu Lys Lys Glu Asn Asp His Tyr Gln Leu Gln Val Gln Glu Leu
275 280 285
Thr Asp Leu Leu Lys Ser Lys Asn Glu Glu Asp Asp Pro Ile Met Val
290 295 300
Ala Val Asn Ala Lys Val Glu Glu Trp Lys Leu Ile Leu Ser Ser Lys
305 310 315 320
Asp Asp Glu Ile Ile Glu Tyr Gln Gln Met Leu His Asn Leu Arg Glu
325 330 335
Lys Leu Lys Asn Ala Gln Leu Asp Ala Asp Lys Ser Asn Val Met Ala
340 345 350
Leu Gln Gln Gly Ile Gln Glu Arg Asp Ser Gln Ile Lys Met Leu Thr
355 360 365
Glu Gln Val Glu Gln Tyr Thr Lys Glu Met Glu Lys Asn Thr Cys Ile
370 375 380
Ile Glu Asp Leu Lys Asn Glu Leu Gln Arg Asn Lys Gly Ala Ser Thr
385 390 395 400
Leu Ser Gln Gln Thr His Met Lys Ile Gln Ser Thr Leu Asp Ile Leu
405 410 415
Lys Glu Lys Thr Lys Glu Ala Glu Arg Thr Ala Glu Leu Ala Glu Ala
420 425 430
Asp Ala Arg Glu Lys Asp Lys Glu Leu Val Glu Ala Leu Lys Arg Leu
435 440 445
Lys Asp Tyr Glu Ser Gly Val Tyr Gly Leu Glu Asp Ala Val Val Glu
450 455 460
Ile Lys Asn Cys Lys Asn Gln Ile Lys Ile Arg Asp Arg Glu Ile Glu
465 470 475 480
Ile Leu Thr Lys Glu Ile Asn Lys Leu Glu Leu Lys Ile Ser Asp Phe
485 490 495
Leu Asp Glu Asn Glu Ala Leu Arg Glu Arg Val Gly Leu Glu Pro Lys
500 505 510
Thr Met Ile Asp Leu Thr Glu Phe Arg Asn Ser Lys His Leu Lys Gln
515 520 525
Gln Gln Tyr Arg Ala Glu Asn Gln Ile Leu Leu Lys Glu Ile Glu Ser
530 535 540
Leu Glu Glu Glu Arg Leu Asp Leu Lys Lys Lys Ile Arg Gln Met Ala
545 550 555 560
Gln Glu Arg Gly Lys Arg Ser Ala Thr Ser Gly Leu Thr Thr Glu Asp
565 570 575
Leu Asn Leu Thr Glu Asn Ile Ser Gln Gly Asp Arg Ile Ser Glu Arg
580 585 590
Lys Leu Asp Leu Leu Ser Leu Lys Asn Met Ser Glu Ala Gln Ser Lys
595 600 605
Asn Glu Phe Leu Ser Arg Glu Leu Ile Glu Lys Glu Arg Asp Leu Glu
610 615 620
Arg Ser Arg Thr Val Ile Ala Lys Phe Gln Asn Lys Leu Lys Glu Leu
625 630 635 640
Val Glu Glu Asn Lys Gln Leu Glu Glu Gly Met Lys Glu Ile Leu Gln
645 650 655
Ala Ile Lys Glu Met Gln Lys Asp Pro Asp Val Lys Gly Gly Glu Thr
660 665 670
Ser Leu Ile Ile Pro Ser Leu Glu Arg Leu Val Asn Ala Ile Glu Ser
675 680 685
Lys Asn Ala Glu Gly Ile Phe Asp Ala Ser Leu His Leu Lys Ala Gln
690 695 700
Val Asp Gln Leu Thr Gly Arg Asn Glu Glu Leu Arg Gln Glu Leu Arg
705 710 715 720
Glu Ser Arg Lys Glu Ala Ile Asn Tyr Ser Gln Gln Leu Ala Lys Ala
725 730 735
Asn Leu Lys Ile Asp His Leu Glu Lys Glu Thr Ser Leu Leu Arg Gln
740 745 750
Ser Glu Gly Ser Asn Val Val Phe Lys Gly Ile Asp Leu Pro Asp Gly
755 760 765
Ile Ala Pro Ser Ser Ala Ser Ile Ile Asn Ser Gln Asn Glu Tyr Leu
770 775 780
Ile His Leu Leu Gln Glu Leu Glu Asn Lys Glu Lys Lys Leu Lys Asn
785 790 795 800
Leu Glu Asp Ser Leu Glu Asp Tyr Asn Arg Lys Phe Ala Val Ile Arg
805 810 815
His Gln Gln Ser Leu Leu Tyr Lys Glu Tyr Leu Ser Glu Lys Glu Thr
820 825 830
Trp Lys Thr Glu Ser Lys Thr Ile Lys Glu Glu Lys Arg Lys Leu Glu
835 840 845
Asp Gln Val Gln Gln Asp Ala Ile Lys Val Lys Glu Tyr Asn Asn Leu
850 855 860
Leu Asn Ala Leu Gln Met Asp Ser Asp Glu Met Lys Lys Ile Leu Ala
865 870 875 880
Glu Asn Ser Arg Lys Ile Thr Val Leu Gln Val Asn Glu Lys Ser Leu
885 890 895
Ile Arg Gln Tyr Thr Thr Leu Val Glu Leu Glu Arg Gln Leu Arg Lys
900 905 910
Glu Asn Glu Lys Gln Lys Asn Glu Leu Leu Ser Met Glu Ala Glu Val
915 920 925
Cys Glu Lys Ile Gly Cys Leu Gln Arg Phe Lys Glu Met Ala Ile Phe
930 935 940
Lys Ile Ala Ala Leu Gln Lys Val Val Asp Asn Ser Val Ser Leu Ser
945 950 955 960
Glu Leu Glu Leu Ala Asn Lys Gln Tyr Asn Glu Leu Thr Ala Lys Tyr
965 970 975
Arg Asp Ile Leu Gln Lys Asp Asn Met Leu Val Gln Arg Thr Ser Asn
980 985 990
Leu Glu His Leu Glu Cys Glu Asn Ile Ser Leu Lys Glu Gln Val Glu
995 1000 1005
Ser Ile Asn Lys Glu Leu Glu Ile Thr Lys Glu Lys Leu His Thr
1010 1015 1020
Ile Glu Gln Ala Trp Glu Gln Glu Thr Lys Leu Gly Asn Glu Ser
1025 1030 1035
Ser Met Asp Lys Ala Lys Lys Ser Ile Thr Asn Ser Asp Ile Val
1040 1045 1050
Ser Ile Ser Lys Lys Ile Thr Met Leu Glu Met Lys Glu Leu Asn
1055 1060 1065
Glu Arg Gln Arg Ala Glu His Cys Gln Lys Met Tyr Glu His Leu
1070 1075 1080
Arg Thr Ser Leu Lys Gln Met Glu Glu Arg Asn Phe Glu Leu Glu
1085 1090 1095
Thr Lys Phe Ala Glu Leu Thr Lys Ile Asn Leu Asp Ala Gln Lys
1100 1105 1110
Val Glu Gln Met Leu Arg Asp Glu Leu Ala Asp Ser Val Ser Lys
1115 1120 1125
Ala Val Ser Asp Ala Asp Arg Gln Arg Ile Leu Glu Leu Glu Lys
1130 1135 1140
Asn Glu Met Glu Leu Lys Val Glu Val Ser Lys Leu Arg Glu Ile
1145 1150 1155
Ser Asp Ile Ala Arg Arg Gln Val Glu Ile Leu Asn Ala Gln Gln
1160 1165 1170
Gln Ser Arg Asp Lys Glu Val Glu Ser Leu Arg Met Gln Leu Leu
1175 1180 1185
Asp Tyr Gln Ala Gln Ser Asp Glu Lys Ser Leu Ile Ala Lys Leu
1190 1195 1200
His Gln His Asn Val Ser Leu Gln Leu Ser Glu Ala Thr Ala Leu
1205 1210 1215
Gly Lys Leu Glu Ser Ile Thr Ser Lys Leu Gln Lys Met Glu Ala
1220 1225 1230
Tyr Asn Leu Arg Leu Glu Gln Lys Leu Asp Glu Lys Glu Gln Ala
1235 1240 1245
Leu Tyr Tyr Ala Arg Leu Glu Gly Arg Asn Arg Ala Lys His Leu
1250 1255 1260
Arg Gln Thr Ile Gln Ser Leu Arg Arg Gln Phe Ser Gly Ala Leu
1265 1270 1275
Pro Leu Ala Gln Gln Glu Lys Phe Ser Lys Thr Met Ile Gln Leu
1280 1285 1290
Gln Asn Asp Lys Leu Lys Ile Met Gln Glu Met Lys Asn Ser Gln
1295 1300 1305
Gln Glu His Arg Asn Met Glu Asn Lys Thr Leu Glu Met Glu Leu
1310 1315 1320
Lys Leu Lys Gly Leu Glu Glu Leu Ile Ser Thr Leu Lys Asp Thr
1325 1330 1335
Lys Gly Ala Gln Lys Val Ile Asn Trp His Met Lys Ile Glu Glu
1340 1345 1350
Leu Arg Leu Gln Glu Leu Lys Leu Asn Arg Glu Leu Val Lys Asp
1355 1360 1365
Lys Glu Glu Ile Lys Tyr Leu Asn Asn Ile Ile Ser Glu Tyr Glu
1370 1375 1380
Arg Thr Ile Ser Ser Leu Glu Glu Glu Ile Val Gln Gln Asn Lys
1385 1390 1395
Phe His Glu Glu Arg Gln Met Ala Trp Asp Gln Arg Glu Val Asp
1400 1405 1410
Leu Glu Arg Gln Leu Asp Ile Phe Asp Arg Gln Gln Asn Glu Ile
1415 1420 1425
Leu Asn Ala Ala Gln Lys Phe Glu Glu Ala Thr Gly Ser Ile Pro
1430 1435 1440
Asp Pro Ser Leu Pro Leu Pro Asn Gln Leu Glu Ile Ala Leu Arg
1445 1450 1455
Lys Ile Lys Glu Asn Ile Arg Ile Ile Leu Glu Thr Arg Ala Thr
1460 1465 1470
Cys Lys Ser Leu Glu Glu Lys Leu Lys Glu Lys Glu Ser Ala Leu
1475 1480 1485
Arg Leu Ala Glu Gln Asn Ile Leu Ser Arg Asp Lys Val Ile Asn
1490 1495 1500
Glu Leu Arg Leu Arg Leu Pro Ala Thr Ala Glu Arg Glu Lys Leu
1505 1510 1515
Ile Ala Glu Leu Gly Arg Lys Glu Met Glu Pro Lys Ser His His
1520 1525 1530
Thr Leu Lys Ile Ala His Gln Thr Ile Ala Asn Met Gln Ala Arg
1535 1540 1545
Leu Asn Gln Lys Glu Glu Val Leu Lys Lys Tyr Gln Arg Leu Leu
1550 1555 1560
Glu Lys Ala Arg Glu Glu Gln Arg Glu Ile Val Lys Lys His Glu
1565 1570 1575
Glu Asp Leu His Ile Leu His His Arg Leu Glu Leu Gln Ala Asp
1580 1585 1590
Ser Ser Leu Asn Lys Phe Lys Gln Thr Ala Trp Asp Leu Met Lys
1595 1600 1605
Gln Ser Pro Thr Pro Val Pro Thr Asn Lys His Phe Ile Arg Leu
1610 1615 1620
Ala Glu Met Glu Gln Thr Val Ala Glu Gln Asp Asp Ser Leu Ser
1625 1630 1635
Ser Leu Leu Val Lys Leu Lys Lys Val Ser Gln Asp Leu Glu Arg
1640 1645 1650
Gln Arg Glu Ile Thr Glu Leu Lys Val Lys Glu Phe Glu Asn Ile
1655 1660 1665
Lys Leu Gln Leu Gln Glu Asn His Glu Asp Glu Val Lys Lys Val
1670 1675 1680
Lys Ala Glu Val Glu Asp Leu Lys Tyr Leu Leu Asp Gln Ser Gln
1685 1690 1695
Lys Glu Ser Gln Cys Leu Lys Ser Glu Leu Gln Ala Gln Lys Glu
1700 1705 1710
Ala Asn Ser Arg Ala Pro Thr Thr Thr Met Arg Asn Leu Val Glu
1715 1720 1725
Arg Leu Lys Ser Gln Leu Ala Leu Lys Glu Lys Gln Gln Lys Ala
1730 1735 1740
Leu Ser Arg Ala Leu Leu Glu Leu Arg Ala Glu Met Thr Ala Ala
1745 1750 1755
Ala Glu Glu Arg Ile Ile Ser Ala Thr Ser Gln Lys Glu Ala His
1760 1765 1770
Leu Asn Val Gln Gln Ile Val Asp Arg His Thr Arg Glu Leu Lys
1775 1780 1785
Thr Gln Val Glu Asp Leu Asn Glu Asn Leu Leu Lys Leu Lys Glu
1790 1795 1800
Ala Leu Lys Thr Ser Lys Asn Arg Glu Asn Ser Leu Thr Asp Asn
1805 1810 1815
Leu Asn Asp Leu Asn Asn Glu Leu Gln Lys Lys Gln Lys Ala Tyr
1820 1825 1830
Asn Lys Ile Leu Arg Glu Lys Glu Glu Ile Asp Gln Glu Asn Asp
1835 1840 1845
Glu Leu Lys Arg Gln Ile Lys Arg Leu Thr Ser Gly Leu Gln Gly
1850 1855 1860
Lys Pro Leu Thr Asp Asn Lys Gln Ser Leu Ile Glu Glu Leu Gln
1865 1870 1875
Arg Lys Val Lys Lys Leu Glu Asn Gln Leu Glu Gly Lys Val Glu
1880 1885 1890
Glu Val Asp Leu Lys Pro Met Lys Glu Lys Asn Ala Lys Glu Glu
1895 1900 1905
Leu Ile Arg Trp Glu Glu Gly Lys Lys Trp Gln Ala Lys Ile Glu
1910 1915 1920
Gly Ile Arg Asn Lys Leu Lys Glu Lys Glu Gly Glu Val Phe Thr
1925 1930 1935
Leu Thr Lys Gln Leu Asn Thr Leu Lys Asp Leu Phe Ala Lys Ala
1940 1945 1950
Asp Lys Glu Lys Leu Thr Leu Gln Arg Lys Leu Lys Thr Thr Gly
1955 1960 1965
Met Thr Val Asp Gln Val Leu Gly Ile Arg Ala Leu Glu Ser Glu
1970 1975 1980
Lys Glu Leu Glu Glu Leu Lys Lys Arg Asn Leu Asp Leu Glu Asn
1985 1990 1995
Asp Ile Leu Tyr Met Arg Ala His Gln Ala Leu Pro Arg Asp Ser
2000 2005 2010
Val Val Glu Asp Leu His Leu Gln Asn Arg Tyr Leu Gln Glu Lys
2015 2020 2025
Leu His Ala Leu Glu Lys Gln Phe Ser Lys Asp Thr Tyr Ser Lys
2030 2035 2040
Pro Ser Ile Ser Gly Ile Glu Ser Asp Asp His Cys Gln Arg Glu
2045 2050 2055
Gln Glu Leu Gln Lys Glu Asn Leu Lys Leu Ser Ser Glu Asn Ile
2060 2065 2070
Glu Leu Lys Phe Gln Leu Glu Gln Ala Asn Lys Asp Leu Pro Arg
2075 2080 2085
Leu Lys Asn Gln Val Arg Asp Leu Lys Glu Met Cys Glu Phe Leu
2090 2095 2100
Lys Lys Glu Lys Ala Glu Val Gln Arg Lys Leu Gly His Val Arg
2105 2110 2115
Gly Ser Gly Arg Ser Gly Lys Thr Ile Pro Glu Leu Glu Lys Thr
2120 2125 2130
Ile Gly Leu Met Lys Lys Val Val Glu Lys Val Gln Arg Glu Asn
2135 2140 2145
Glu Gln Leu Lys Lys Ala Ser Gly Ile Leu Thr Ser Glu Lys Met
2150 2155 2160
Ala Asn Ile Glu Gln Glu Asn Glu Lys Leu Lys Ala Glu Leu Glu
2165 2170 2175
Lys Leu Lys Ala His Leu Gly His Gln Leu Ser Met His Tyr Glu
2180 2185 2190
Ser Lys Thr Lys Gly Thr Glu Lys Ile Ile Ala Glu Asn Glu Arg
2195 2200 2205
Leu Arg Lys Glu Leu Lys Lys Glu Thr Asp Ala Ala Glu Lys Leu
2210 2215 2220
Arg Ile Ala Lys Asn Asn Leu Glu Ile Leu Asn Glu Lys Met Thr
2225 2230 2235
Val Gln Leu Glu Glu Thr Gly Lys Arg Leu Gln Phe Ala Glu Ser
2240 2245 2250
Arg Gly Pro Gln Leu Glu Gly Ala Asp Ser Lys Ser Trp Lys Ser
2255 2260 2265
Ile Val Val Thr Arg Met Tyr Glu Thr Lys Leu Lys Glu Leu Glu
2270 2275 2280
Thr Asp Ile Ala Lys Lys Asn Gln Ser Ile Thr Asp Leu Lys Gln
2285 2290 2295
Leu Val Lys Glu Ala Thr Glu Arg Glu Gln Lys Val Asn Lys Tyr
2300 2305 2310
Asn Glu Asp Leu Glu Gln Gln Ile Lys Ile Leu Lys His Val Pro
2315 2320 2325
Glu Gly Ala Glu Thr Glu Gln Gly Leu Lys Arg Glu Leu Gln Val
2330 2335 2340
Leu Arg Leu Ala Asn His Gln Leu Asp Lys Glu Lys Ala Glu Leu
2345 2350 2355
Ile His Gln Ile Glu Ala Asn Lys Asp Gln Ser Gly Ala Glu Ser
2360 2365 2370
Thr Ile Pro Asp Ala Asp Gln Leu Lys Glu Lys Ile Lys Asp Leu
2375 2380 2385
Glu Thr Gln Leu Lys Met Ser Asp Leu Glu Lys Gln His Leu Lys
2390 2395 2400
Glu Glu Ile Lys Lys Leu Lys Lys Glu Leu Glu Asn Phe Asp Pro
2405 2410 2415
Ser Phe Phe Glu Glu Ile Glu Asp Leu Lys Tyr Asn Tyr Lys Glu
2420 2425 2430
Glu Val Lys Lys Asn Ile Leu Leu Glu Glu Lys Val Lys Lys Leu
2435 2440 2445
Ser Glu Gln Leu Gly Val Glu Leu Thr Ser Pro Val Ala Ala Ser
2450 2455 2460
Glu Glu Phe Glu Asp Glu Glu Glu Ser Pro Val Asn Phe Pro Ile
2465 2470 2475
Tyr Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile
2480 2485 2490
Asp Tyr Lys Asp Asp Asp Asp Lys
2495 2500
<210> 18
<211> 2351
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 18
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe
980 985 990
Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala
995 1000 1005
Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser
1010 1015 1020
Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser
1025 1030 1035
Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu
1040 1045 1050
Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg
1055 1060 1065
Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met
1070 1075 1080
Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln
1085 1090 1095
Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met
1100 1105 1110
Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile
1115 1120 1125
Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro
1130 1135 1140
Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu
1145 1150 1155
Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys
1160 1165 1170
Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro
1175 1180 1185
Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu
1190 1195 1200
Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu
1205 1210 1215
Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile
1220 1225 1230
His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu
1235 1240 1245
Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr
1250 1255 1260
Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn
1265 1270 1275
Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu
1280 1285 1290
Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu
1295 1300 1305
Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln
1310 1315 1320
Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg
1325 1330 1335
Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp
1340 1345 1350
Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro
1355 1360 1365
Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala
1370 1375 1380
Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser
1385 1390 1395
Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser
1400 1405 1410
Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe
1415 1420 1425
Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys
1430 1435 1440
Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys
1445 1450 1455
Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly
1460 1465 1470
Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser
1475 1480 1485
Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp
1490 1495 1500
Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His
1505 1510 1515
Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser
1520 1525 1530
Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr
1535 1540 1545
Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val
1550 1555 1560
Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser
1565 1570 1575
Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln
1580 1585 1590
Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys
1595 1600 1605
Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys
1610 1615 1620
Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys
1625 1630 1635
Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg
1640 1645 1650
Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu
1655 1660 1665
Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1670 1675 1680
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile
1685 1690 1695
Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
1700 1705 1710
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
1715 1720 1725
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
1730 1735 1740
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
1745 1750 1755
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
1760 1765 1770
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
1775 1780 1785
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser
1790 1795 1800
Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly
1805 1810 1815
Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
1820 1825 1830
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu
1835 1840 1845
Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu
1850 1855 1860
Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
1865 1870 1875
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
1880 1885 1890
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp
1895 1900 1905
Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
1910 1915 1920
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His
1925 1930 1935
Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1940 1945 1950
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
1955 1960 1965
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1970 1975 1980
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1985 1990 1995
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
2000 2005 2010
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
2015 2020 2025
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
2030 2035 2040
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
2045 2050 2055
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
2060 2065 2070
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
2075 2080 2085
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
2090 2095 2100
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
2105 2110 2115
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
2120 2125 2130
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
2135 2140 2145
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
2150 2155 2160
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
2165 2170 2175
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
2180 2185 2190
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
2195 2200 2205
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
2210 2215 2220
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
2225 2230 2235
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
2240 2245 2250
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
2255 2260 2265
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
2270 2275 2280
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
2285 2290 2295
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
2300 2305 2310
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
2315 2320 2325
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
2330 2335 2340
Gly Cys Glu Ala Gln Asp Leu Tyr
2345 2350
<210> 19
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 19
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu
100 105 110
Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr
115 120 125
Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp
130 135 140
Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg
145 150 155
<210> 20
<211> 105
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 20
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Ile Glu Gln Phe Leu Pro
100 105
<210> 21
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 21
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu
100
<210> 22
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 22
Cys Leu Ser Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Pro Ile Gly
1 5 10 15
Lys Ile Val Ile Cys Val Tyr Ser Val Asp Gly Tyr Thr Gln Ala Gln
20 25 30
Trp His Asp Arg Gly Glu Gln Glu Val Glu Tyr Glu Asp Gly Ser Ile
35 40 45
Arg Ala Thr Asp His Phe Thr Asp Gln Leu Ile Glu Ile Phe Arg Leu
50 55 60
Asp Leu Asn
65
<210> 23
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 23
Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser
20 25 30
Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser
50 55 60
Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln
65 70 75 80
Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr
85 90 95
Leu Glu Asn Ile
100
<210> 24
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 24
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn
35
<210> 25
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 25
Met Lys Arg Leu Gly Gln Asp Ile Gly Asp His Asn Phe Leu Asn Gly
1 5 10 15
Ile Ala Asn
<210> 26
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 26
Met Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe
1 5 10 15
Asp Ile Gly Leu Pro Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala
20 25 30
Ile Ala Ala Asn
35
<210> 27
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 27
atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60
tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120
atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180
ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240
atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300
cagttcctgc ccaaggccca gaagctgtac ctgacccaca tcgacgccga ggtggagggc 360
gacacccact tccccgacta cgagcccgac gactgggaga gcgtgttcag cgagttccac 420
gacgccgacg cccagaacag ccacagctac tgcttcgaga tcctggagag gaggtga 477
<210> 28
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 28
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asp Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Tyr Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu
100 105 110
Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr
115 120 125
Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp
130 135 140
Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg
145 150 155
<210> 29
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 29
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu
100 105 110
Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr
115 120 125
Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp
130 135 140
Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg
145 150 155
<210> 30
<211> 315
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 30
atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60
tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120
atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180
ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240
atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300
cagttcctgc cctga 315
<210> 31
<211> 105
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 31
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Arg Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asp Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Gly Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Tyr Glu Gln Phe Leu Pro
100 105
<210> 32
<211> 105
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 32
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Ile Glu Gln Phe Leu Pro
100 105
<210> 33
<211> 2665
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 33
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240
caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300
caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420
ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480
tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540
aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600
tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660
taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720
ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780
gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840
taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900
tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960
aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080
cggccgccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 1140
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 1200
ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 1260
ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cctgagctac gagaccgaga 1320
tcctgaccgt ggagtacggc ctgctgccca tcggcaagat cgtggagaag cggatcgagt 1380
gcaccgtgta cagcgtggac aacaacggca acatctacac ccagcccgtg gcccagtggc 1440
acgaccgggg cgagcaggag gtgttcgagt actgcctgga ggacggcagc ctgatccggg 1500
ccaccaagga ccacaagttc atgaccgtgg acggccagat gctgcccatc gacgagatct 1560
tcgagcggga gctggacctg atgcgggtgg acaacctgcc caacgactac aaagaccatg 1620
acggtgatta taaagatcat gacatcgact acaaggatga cgatgacaag tgaaagcttg 1680
gatccaatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 1740
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 1800
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 1860
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 1920
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 1980
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 2040
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa gctgacgtcc tttccatggc 2100
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 2160
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 2220
gtcttcgaga tctgcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 2280
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 2340
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 2400
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggact cgagttaagg 2460
gcgaattccc gattaggatc ttcctagagc atggctacgt agataagtag catggcgggt 2520
taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 2580
gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 2640
cctcagtgag cgagcgagcg cgcag 2665
<210> 34
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 34
atgatcaaga tcgccacccg gaagtacctg ggcaagcaga acgtgtacga catcggcgtg 60
gagcgggacc acaacttcgc cctgaagaac ggcttcatcg ccagcaat 108
<210> 35
<211> 507
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 35
tgcttcagcc gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc 60
gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc 120
gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac 180
ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa cagccacaac 240
gtctatatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatccgccac 300
aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc 360
gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa 420
gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc 480
actctcggca tggacgagct gtacaag 507
<210> 36
<211> 583
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 36
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgg tttagtgaac cgt 583
<210> 37
<211> 301
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 37
ctagtgggcc ccagaagcct ggtggttgtt tgtccttctc aggggaaaag tgaggcggcc 60
ccttggagga aggggccggg cagaatgatc taatcggatt ccaagcagct caggggattg 120
tctttttcta gcaccttctt gccactccta agcgtcctcc gtgaccccgg ctgggattta 180
gcctggtgct gtgtcagccc cgggctccca ggggcttccc agtggtcccc aggaaccctc 240
gacagggcca gggcgtctct ctcgtccagc aagggcaggg acgggccaca ggcaagggcg 300
c 301
<210> 38
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 38
atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60
tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120
atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180
ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240
atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300
cagttcctgc ccaaggccca gaagctgtac ctgacccaca tcgacgccga ggtggagggc 360
gacacccact tccccgacta cgagcccgac gactgggaga gcgtgttcag cgagttccac 420
gacgccgacg cccagaacag ccacagctac tgcttcgaga tcctggagag gaggtga 477
<210> 39
<211> 315
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 39
atcagcctga tcgccgccct ggccgtggac tacgtgatcg gcatggagaa cgccatgccc 60
tggaacctgc ccgccgacct ggcctggttc aagaggaaca ccctgaacaa gcccgtgatc 120
atgggcaggc acacctggga gagcatcggc aggcccctgc ccggcaggaa gaacatcatc 180
ctgagcagcc agcccagcac cgacgacagg gtgacctggg tgaagagcgt ggacgaggcc 240
atcgccgcct gcggcgacgt gcccgagatc atggtgatcg gcggcggcag ggtgatcgag 300
cagttcctgc cctga 315
<210> 40
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 40
tgcctggccg gcgacaccct gatcaccctg gccgacggca ggagggtgcc catcagggag 60
ctggtgagcc agcagaactt cagcgtgtgg gccctgaacc cccagaccta caggctggag 120
agggccaggg tgagcagggc cttctgcacc ggcatcaagc ccgtgtacag gctgaccacc 180
aggctgggca ggagcatcag ggccaccgcc aaccacaggt tcctgacccc ccagggctgg 240
aagagggtgg acgagctgca gcccggcgac tacctggccc tgcccaggag gatccccacc 300
gccagcaccc ccaccctg 318
<210> 41
<211> 156
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 41
atggccgccg cctgccccga gctgaggcag ctggcccaga gcgacgtgta ctgggacccc 60
atcgtgagca tcgagcccga cggcgtggag gaggtgttcg acctgaccgt gcccggcccc 120
cacaacttcg tggccaacga catcatcgcc cacaac 156
<210> 42
<211> 306
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 42
tgcctgagct acgacaccga gatcctgacc gtggagtacg gcatcctgcc catcggcaag 60
atcgtggaga agaggatcga gtgcaccgtg tacagcgtgg acaacaacgg caacatctac 120
acccagcccg tggcccagtg gcacgacagg ggcgagcagg aggtgttcga gtactgcctg 180
gaggacggca gcctgatcag ggccaccaag gaccacaagt tcatgaccgt ggacggccag 240
atgatgccca tcgacgagat cttcgagagg gagctggacc tgatgagggt ggacaacctg 300
cccaac 306
<210> 43
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 43
atggtgaagg tgatcggcag gaggagcctg ggcgtgcaga ggatcttcga catcggcctg 60
ccccagtacc acaacttcct gctggccaac ggcgccatcg ccgccaac 108
<210> 44
<211> 270
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 44
ctagcgttga cattgattat tgactagtac ggtaaatggc ccgcctggct gatgactcac 60
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 120
aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 180
gtgtacggtg ggaggtctat ataagcagag ctggtttagt gaactagaga acccactgct 240
tactggcttc tcgagattcc accatggcgc 270
<210> 45
<211> 3225
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 45
atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60
caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120
aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180
atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240
gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300
gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360
gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420
gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480
aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540
attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600
gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660
gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720
aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780
aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840
tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900
ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960
gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020
gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080
gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140
aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200
ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260
aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320
ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380
gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440
atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500
gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560
agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620
gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680
caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740
gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800
aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860
agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920
gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980
atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040
agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100
ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160
gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220
gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280
aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340
aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400
ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460
ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520
aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580
tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640
gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700
acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760
ttgttgtcaa tggaggctga agtttgtgaa aaaattgggt gtttgcaaag atttaaggaa 2820
atggccattt tcaagattgc agctctccaa aaagttgtag ataatagtgt ttctttgtct 2880
gaactagaac tggctaataa acagtacaat gaactgactg ctaagtacag ggacatcttg 2940
caaaaagata atatgcttgt tcaaagaaca agtaacttgg aacacctgga gtgtgaaaac 3000
atctccttaa aagaacaagt ggagtctata aataaagaac tggagattac caaggaaaaa 3060
cttcacacta ttgaacaagc ctgggaacag gaaactaaat taggtaatga atctagcatg 3120
gataaggcaa agaaatcaat aaccaacagt gacattgttt ccatttcaaa aaaaataact 3180
atgctggaaa tgaaggaatt aaatgaaagg cagcgggctg aacat 3225
<210> 46
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 46
aattcaataa aagatcttta ttttcattag atctgtgtgt tggttttttg tgtgcggcc 59
<210> 47
<211> 4212
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 47
tgtcaaaaaa tgtatgaaca cttacggact tcgttaaagc aaatggagga acgtaatttt 60
gaattggaaa ccaaatttgc tgagcttacc aaaatcaatt tggatgcaca gaaggtggaa 120
cagatgttaa gagatgaatt agctgatagt gtgagcaagg cagtaagtga tgctgatagg 180
caacggattc tagaattaga gaagaatgaa atggaactaa aagttgaagt gtcaaaactg 240
agagagattt ctgatattgc cagaagacaa gttgaaattt tgaatgcaca acaacaatct 300
agggacaagg aagtagagtc cctcagaatg caactgctag actatcaggc acagtctgat 360
gaaaagtcgc tcattgccaa gttgcaccaa cataatgtct ctcttcaact gagtgaggct 420
actgctcttg gtaagttgga gtcaattaca tctaaactgc agaagatgga ggcctacaac 480
ttgcgcttag agcagaaact tgatgaaaaa gaacaggctc tctattatgc tcgtttggag 540
ggaagaaaca gagcaaaaca tctgcgccaa acaattcagt ctctacgacg acagtttagt 600
ggagctttac ccttggcaca acaggaaaag ttctccaaaa caatgattca actacaaaat 660
gacaaactta agataatgca agaaatgaaa aattctcaac aagaacatag aaatatggag 720
aacaaaacat tggagatgga attaaaatta aagggcctgg aagagttaat aagcacttta 780
aaggatacca aaggagccca aaaggtaatc aactggcata tgaaaataga agaacttcgt 840
cttcaagaac ttaaactaaa tcgggaatta gtcaaggata aagaagaaat aaaatatttg 900
aataacataa tttctgaata tgaacgtaca atcagcagtc ttgaagaaga aattgtgcaa 960
cagaacaagt ttcatgaaga aagacaaatg gcctgggatc aaagagaagt tgacctggaa 1020
cgccaactag acatttttga ccgtcagcaa aatgaaatac taaatgcggc acaaaagttt 1080
gaagaagcta caggatcaat ccctgaccct agtttgcccc ttccaaatca acttgagatc 1140
gctctaagga aaattaagga gaacattcga ataattctag aaacacgggc aacttgcaaa 1200
tcactagaag agaaactaaa agagaaagaa tctgctttaa ggttagcaga acaaaatata 1260
ctgtcaagag acaaagtaat caatgaactg aggcttcgat tgcctgccac tgcagaaaga 1320
gaaaagctca tagctgagct aggcagaaaa gagatggaac caaaatctca ccacacattg 1380
aaaattgctc atcaaaccat tgcaaacatg caagcaaggt taaatcaaaa agaagaagta 1440
ttaaagaagt atcaacgtct tctagaaaaa gccagagagg agcaaagaga aattgtgaag 1500
aaacatgagg aagaccttca tattcttcat cacagattag aactacaggc tgatagttca 1560
ctaaataaat tcaaacaaac ggcttgggat ttaatgaaac agtctcccac tccagttcct 1620
accaacaagc attttattcg tctggctgag atggaacaga cagtagcaga acaagatgac 1680
tctctttcct cactcttggt caaactaaag aaagtatcac aagatttgga gagacaaaga 1740
gaaatcactg aattaaaagt aaaagaattt gaaaatatca aattacagct tcaagaaaac 1800
catgaagatg aagtgaaaaa agtaaaagcg gaagtagagg atttaaagta tcttctggac 1860
cagtcacaaa aggagtcaca gtgtttaaaa tctgaacttc aggctcaaaa agaagcaaat 1920
tcaagagctc caacaactac aatgagaaat ctagtagaac ggctaaagag ccaattagcc 1980
ttgaaggaga aacaacagaa agcacttagt cgggcacttt tagaactccg ggcagaaatg 2040
acagcagctg ctgaagaacg tattatttct gcaacttctc aaaaagaggc ccatctcaat 2100
gttcaacaaa tcgttgatcg acatactaga gagctaaaga cacaagttga agatttaaat 2160
gaaaatcttt taaaattgaa agaagcactt aaaactagta aaaacagaga aaactcacta 2220
actgataatt tgaatgactt aaataatgaa ctgcaaaaga aacaaaaagc ctataataaa 2280
atacttagag agaaagagga aattgatcaa gagaatgatg aactgaaaag gcaaattaaa 2340
agactaacca gtggattaca gggcaaaccc ctgacagata ataaacaaag tctaattgaa 2400
gaactccaaa ggaaagttaa aaaactagag aaccaattag agggaaaggt ggaggaagta 2460
gacctaaaac ctatgaaaga aaagaatgct aaagaagaat taattaggtg ggaagaaggt 2520
aaaaagtggc aagccaaaat agaaggaatt cgaaacaagt taaaagagaa agagggggaa 2580
gtctttactt taacaaagca gttgaatact ttgaaggatc tttttgccaa agccgataaa 2640
gagaaactta ctttgcagag gaaactaaaa acaactggca tgactgttga tcaggttttg 2700
ggaatacgag ctttggagtc agaaaaagaa ttggaagaat taaaaaagag aaatcttgac 2760
ttagaaaatg atatattgta tatgagggcc caccaagctc ttcctcgaga ttctgttgta 2820
gaagatttac atttacaaaa tagatacctc caagaaaaac ttcatgcttt agaaaaacag 2880
ttttcaaagg atacatattc taagccttca atttcaggaa tagagtcaga tgatcattgt 2940
cagagagaac aggagcttca gaaggaaaac ttgaagttgt catctgaaaa tattgaactg 3000
aaatttcagc ttgaacaagc aaataaagat ttgccaagat taaagaatca agtcagagat 3060
ttgaaggaaa tgtgtgaatt tcttaagaaa gaaaaagcag aagttcagcg gaaacttggc 3120
catgttagag ggtctggtag aagtggaaag acaatcccag aactggaaaa aaccattggt 3180
ttaatgaaaa aagtagttga aaaagtccag agagaaaatg aacagttgaa aaaagcatca 3240
ggaatattga ctagtgaaaa aatggctaat attgagcagg aaaatgaaaa attgaaggct 3300
gaattagaaa aacttaaagc tcatcttggg catcagttga gcatgcacta tgaatccaag 3360
accaaaggca cagaaaaaat tattgctgaa aatgaaaggc ttcgtaaaga acttaaaaaa 3420
gaaactgatg ctgcagagaa attacggata gcaaagaata atttagagat attaaatgag 3480
aagatgacag ttcaactaga agagactggt aagagattgc agtttgcaga aagcagaggt 3540
ccacagcttg aaggtgctga cagtaagagc tggaaatcca ttgtggttac aagaatgtat 3600
gaaaccaagt taaaagaatt ggaaactgat attgccaaaa aaaatcaaag cattactgac 3660
cttaaacagc ttgtaaaaga agcaacagag agagaacaaa aagttaacaa atacaatgaa 3720
gaccttgaac aacagattaa gattcttaaa catgttcctg aaggtgctga gacagagcaa 3780
ggccttaaac gggagcttca agttcttaga ttagctaatc atcagctgga taaagagaaa 3840
gcagaattaa tccatcagat agaagctaac aaggaccaaa gtggagctga aagcaccata 3900
cctgatgctg atcaactaaa ggaaaaaata aaagatctag agacacagct caaaatgtca 3960
gatctagaaa agcagcattt gaaggaggaa ataaagaagc tgaaaaaaga actggaaaat 4020
tttgatcctt cattttttga agaaattgaa gatcttaagt ataattacaa ggaagaagtg 4080
aagaagaata ttctcttaga agagaaggta aaaaaacttt cagaacaatt gggagttgaa 4140
ttaactagcc ctgttgctgc ttctgaagag tttgaagatg aagaagaaag tcctgttaat 4200
ttccccattt ac 4212
<210> 48
<211> 3822
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 48
atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60
caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120
aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180
atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240
gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300
gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360
gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420
gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480
aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540
attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600
gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660
gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720
aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780
aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840
tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900
ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960
gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020
gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080
gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140
aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200
ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260
aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320
ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380
gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440
atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500
gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560
agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620
gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680
caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740
gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800
aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860
agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920
gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980
atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040
agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100
ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160
gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220
gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280
aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340
aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400
ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460
ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520
aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580
tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640
gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700
acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760
ttgttgtcaa tggaggctga agtttgtgaa aaaattgggt gtttgcaaag atttaaggaa 2820
atggccattt tcaagattgc agctctccaa aaagttgtag ataatagtgt ttctttgtct 2880
gaactagaac tggctaataa acagtacaat gaactgactg ctaagtacag ggacatcttg 2940
caaaaagata atatgcttgt tcaaagaaca agtaacttgg aacacctgga gtgtgaaaac 3000
atctccttaa aagaacaagt ggagtctata aataaagaac tggagattac caaggaaaaa 3060
cttcacacta ttgaacaagc ctgggaacag gaaactaaat taggtaatga atctagcatg 3120
gataaggcaa agaaatcaat aaccaacagt gacattgttt ccatttcaaa aaaaataact 3180
atgctggaaa tgaaggaatt aaatgaaagg cagcgggctg aacattgtca aaaaatgtat 3240
gaacacttac ggacttcgtt aaagcaaatg gaggaacgta attttgaatt ggaaaccaaa 3300
tttgctgagc ttaccaaaat caatttggat gcacagaagg tggaacagat gttaagagat 3360
gaattagctg atagtgtgag caaggcagta agtgatgctg ataggcaacg gattctagaa 3420
ttagagaaga atgaaatgga actaaaagtt gaagtgtcaa aactgagaga gatttctgat 3480
attgccagaa gacaagttga aattttgaat gcacaacaac aatctaggga caaggaagta 3540
gagtccctca gaatgcaact gctagactat caggcacagt ctgatgaaaa gtcgctcatt 3600
gccaagttgc accaacataa tgtctctctt caactgagtg aggctactgc tcttggtaag 3660
ttggagtcaa ttacatctaa actgcagaag atggaggcct acaacttgcg cttagagcag 3720
aaacttgatg aaaaagaaca ggctctctat tatgctcgtt tggagggaag aaacagagca 3780
aaacatctgc gccaaacaat tcagtctcta cgacgacagt tt 3822
<210> 49
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 49
agtggagctt tacccttggc acaacaggaa aagttctcca aaacaatgat tcaactacaa 60
aatgacaaac ttaagataat gcaagaaatg aaaaattctc aacaagaaca tagaaatatg 120
gagaacaaaa cattggagat ggaattaaaa ttaaagggcc tggaagagtt aataagcact 180
ttaaaggata ccaaaggagc ccaaaaggta atcaactggc atatgaaaat agaagaactt 240
cgtcttcaag aacttaaact aaatcgggaa ttagtcaagg ataaagaaga aataaaatat 300
ttgaataaca taatttctga atatgaacgt acaatcagca gtcttgaaga agaaattgtg 360
caacagaaca agtttcatga agaaagacaa atggcctggg atcaaagaga agttgacctg 420
gaacgccaac tagacatttt tgaccgtcag caaaatgaaa tactaaatgc ggcacaaaag 480
tttgaagaag ctacaggatc aatccctgac cctagtttgc cccttccaaa tcaacttgag 540
atcgctctaa ggaaaattaa ggagaacatt cgaataattc tagaaacacg ggcaacttgc 600
aaatcactag aagagaaact aaaagagaaa gaatctgctt taaggttagc agaacaaaat 660
atactgtcaa gagacaaagt aatcaatgaa ctgaggcttc gattgcctgc cactgcagaa 720
agagaaaagc tcatagctga gctaggcaga aaagagatgg aaccaaaatc tcaccacaca 780
ttgaaaattg ctcatcaaac cattgcaaac atgcaagcaa ggttaaatca aaaagaagaa 840
gtattaaaga agtatcaacg tcttctagaa aaagccagag aggagcaaag agaaattgtg 900
aagaaacatg aggaagacct tcatattctt catcacagat tagaactaca ggctgatagt 960
tcactaaata aattcaaaca aacggcttgg gatttaatga aacagtctcc cactccagtt 1020
cctaccaaca agcattttat tcgtctggct gagatggaac agacagtagc agaacaagat 1080
gactctcttt cctcactctt ggtcaaacta aagaaagtat cacaagattt ggagagacaa 1140
agagaaatca ctgaattaaa agtaaaagaa tttgaaaata tcaaattaca gcttcaagaa 1200
aaccatgaag atgaagtgaa aaaagtaaaa gcggaagtag aggatttaaa gtatcttctg 1260
gaccagtcac aaaaggagtc acagtgttta aaatctgaac ttcaggctca aaaagaagca 1320
aattcaagag ctccaacaac tacaatgaga aatctagtag aacggctaaa gagccaatta 1380
gccttgaagg agaaacaaca gaaagcactt agtcgggcac ttttagaact ccgggcagaa 1440
atgacagcag ctgctgaaga acgtattatt tctgcaactt ctcaaaaaga ggcccatctc 1500
aatgttcaac aaatcgttga tcgacatact agagagctaa agacacaagt tgaagattta 1560
aatgaaaatc ttttaaaatt gaaagaagca cttaaaacta gtaaaaacag agaaaactca 1620
ctaactgata atttgaatga cttaaataat gaactgcaaa agaaacaaaa agcctataat 1680
aaaatactta gagagaaaga ggaaattgat caagagaatg atgaactgaa aaggcaaatt 1740
aaaagactaa ccagtggatt acagggcaaa cccctgacag ataataaaca aagtctaatt 1800
gaagaactcc aaaggaaagt taaaaaacta gagaaccaat tagagggaaa ggtggaggaa 1860
gtagacctaa aacctatgaa agaaaagaat gctaaagaag aattaattag gtgggaagaa 1920
ggtaaaaagt ggcaagccaa aatagaagga attcgaaaca agttaaaaga gaaagagggg 1980
gaagtcttta ctttaacaaa gcagttgaat actttgaagg atctttttgc caaagccgat 2040
aaagagaaac ttactttgca gaggaaacta aaaacaactg gcatgactgt tgatcaggtt 2100
ttgggaatac gagctttgga gtcagaaaaa gaattggaag aattaaaaaa gagaaatctt 2160
gacttagaaa atgatatatt gtatatgagg gcccaccaag ctcttcctcg agattctgtt 2220
gtagaagatt tacatttaca aaatagatac ctccaagaaa aacttcatgc tttagaaaaa 2280
cagttttcaa aggatacata ttctaagcct tcaatttcag gaatagagtc agatgatcat 2340
tgtcagagag aacaggagct tcagaaggaa aacttgaagt tgtcatctga aaatattgaa 2400
ctgaaatttc agcttgaaca agcaaataaa gatttgccaa gattaaagaa tcaagtcaga 2460
gatttgaagg aaatgtgtga atttcttaag aaagaaaaag cagaagttca gcggaaactt 2520
ggccatgtta gagggtctgg tagaagtgga aagacaatcc cagaactgga aaaaaccatt 2580
ggtttaatga aaaaagtagt tgaaaaagtc cagagagaaa atgaacagtt gaaaaaagca 2640
tcaggaatat tgactagtga aaaaatggct aatattgagc aggaaaatga aaaattgaag 2700
gctgaattag aaaaacttaa agctcatctt gggcatcagt tgagcatgca ctatgaatcc 2760
aagaccaaag gcacagaaaa aattattgct gaaaatgaaa ggcttcgtaa agaacttaaa 2820
aaagaaactg atgctgcaga gaaattacgg atagcaaaga ataatttaga gatattaaat 2880
gagaagatga cagttcaact agaagagact ggtaagagat tgcagtttgc agaaagcaga 2940
ggtccacagc ttgaaggtgc tgacagtaag agctggaaat ccattgtggt tacaagaatg 3000
tatgaaacca agttaaaaga attggaaact gatattgcca aaaaaaatca aagcattact 3060
gaccttaaac agcttgtaaa agaagcaaca gagagagaac aaaaagttaa caaatacaat 3120
gaagaccttg aacaacagat taagattctt aaacatgttc ctgaaggtgc tgagacagag 3180
caaggcctta aacgggagct tcaagttctt agattagcta atcatcagct ggataaagag 3240
aaagcagaat taatccatca gatagaagct aacaaggacc aaagtggagc tgaaagcacc 3300
atacctgatg ctgatcaact aaaggaaaaa ataaaagatc tagagacaca gctcaaaatg 3360
tcagatctag aaaagcagca tttgaaggag gaaataaaga agctgaaaaa agaactggaa 3420
aattttgatc cttcattttt tgaagaaatt gaagatctta agtataatta caaggaagaa 3480
gtgaagaaga atattctctt agaagagaag gtaaaaaaac tttcagaaca attgggagtt 3540
gaattaacta gccctgttgc tgcttctgaa gagtttgaag atgaagaaga aagtcctgtt 3600
aatttcccca tttac 3615
<210> 50
<211> 3822
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 50
atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60
caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120
aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180
atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240
gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300
gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360
gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420
gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480
aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540
attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600
gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660
gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720
aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780
aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840
tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900
ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960
gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020
gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080
gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140
aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200
ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260
aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320
ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380
gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440
atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500
gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560
agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620
gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680
caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740
gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800
aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860
agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920
gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980
atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040
agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100
ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160
gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220
gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280
aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340
aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400
ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460
ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520
aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580
tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640
gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700
acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760
ttgttgtcaa tggaggctga agtttgtgaa aaaattgggt gtttgcaaag atttaaggaa 2820
atggccattt tcaagattgc agctctccaa aaagttgtag ataatagtgt ttctttgtct 2880
gaactagaac tggctaataa acagtacaat gaactgactg ctaagtacag ggacatcttg 2940
caaaaagata atatgcttgt tcaaagaaca agtaacttgg aacacctgga gtgtgaaaac 3000
atctccttaa aagaacaagt ggagtctata aataaagaac tggagattac caaggaaaaa 3060
cttcacacta ttgaacaagc ctgggaacag gaaactaaat taggtaatga atctagcatg 3120
gataaggcaa agaaatcaat aaccaacagt gacattgttt ccatttcaaa aaaaataact 3180
atgctggaaa tgaaggaatt aaatgaaagg cagcgggctg aacattgtca aaaaatgtat 3240
gaacacttac ggacttcgtt aaagcaaatg gaggaacgta attttgaatt ggaaaccaaa 3300
tttgctgagc ttaccaaaat caatttggat gcacagaagg tggaacagat gttaagagat 3360
gaattagctg atagtgtgag caaggcagta agtgatgctg ataggcaacg gattctagaa 3420
ttagagaaga atgaaatgga actaaaagtt gaagtgtcaa aactgagaga gatttctgat 3480
attgccagaa gacaagttga aattttgaat gcacaacaac aatctaggga caaggaagta 3540
gagtccctca gaatgcaact gctagactat caggcacagt ctgatgaaaa gtcgctcatt 3600
gccaagttgc accaacataa tgtctctctt caactgagtg aggctactgc tcttggtaag 3660
ttggagtcaa ttacatctaa actgcagaag atggaggcct acaacttgcg cttagagcag 3720
aaacttgatg aaaaagaaca ggctctctat tatgctcgtt tggagggaag aaacagagca 3780
aaacatctgc gccaaacaat tcagtctcta cgacgacagt tt 3822
<210> 51
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 51
agtggagctt tacccttggc acaacaggaa aagttctcca aaacaatgat tcaactacaa 60
aatgacaaac ttaagataat gcaagaaatg aaaaattctc aacaagaaca tagaaatatg 120
gagaacaaaa cattggagat ggaattaaaa ttaaagggcc tggaagagtt aataagcact 180
ttaaaggata ccaaaggagc ccaaaaggta atcaactggc atatgaaaat agaagaactt 240
cgtcttcaag aacttaaact aaatcgggaa ttagtcaagg ataaagaaga aataaaatat 300
ttgaataaca taatttctga atatgaacgt acaatcagca gtcttgaaga agaaattgtg 360
caacagaaca agtttcatga agaaagacaa atggcctggg atcaaagaga agttgacctg 420
gaacgccaac tagacatttt tgaccgtcag caaaatgaaa tactaaatgc ggcacaaaag 480
tttgaagaag ctacaggatc aatccctgac cctagtttgc cccttccaaa tcaacttgag 540
atcgctctaa ggaaaattaa ggagaacatt cgaataattc tagaaacacg ggcaacttgc 600
aaatcactag aagagaaact aaaagagaaa gaatctgctt taaggttagc agaacaaaat 660
atactgtcaa gagacaaagt aatcaatgaa ctgaggcttc gattgcctgc cactgcagaa 720
agagaaaagc tcatagctga gctaggcaga aaagagatgg aaccaaaatc tcaccacaca 780
ttgaaaattg ctcatcaaac cattgcaaac atgcaagcaa ggttaaatca aaaagaagaa 840
gtattaaaga agtatcaacg tcttctagaa aaagccagag aggagcaaag agaaattgtg 900
aagaaacatg aggaagacct tcatattctt catcacagat tagaactaca ggctgatagt 960
tcactaaata aattcaaaca aacggcttgg gatttaatga aacagtctcc cactccagtt 1020
cctaccaaca agcattttat tcgtctggct gagatggaac agacagtagc agaacaagat 1080
gactctcttt cctcactctt ggtcaaacta aagaaagtat cacaagattt ggagagacaa 1140
agagaaatca ctgaattaaa agtaaaagaa tttgaaaata tcaaattaca gcttcaagaa 1200
aaccatgaag atgaagtgaa aaaagtaaaa gcggaagtag aggatttaaa gtatcttctg 1260
gaccagtcac aaaaggagtc acagtgttta aaatctgaac ttcaggctca aaaagaagca 1320
aattcaagag ctccaacaac tacaatgaga aatctagtag aacggctaaa gagccaatta 1380
gccttgaagg agaaacaaca gaaagcactt agtcgggcac ttttagaact ccgggcagaa 1440
atgacagcag ctgctgaaga acgtattatt tctgcaactt ctcaaaaaga ggcccatctc 1500
aatgttcaac aaatcgttga tcgacatact agagagctaa agacacaagt tgaagattta 1560
aatgaaaatc ttttaaaatt gaaagaagca cttaaaacta gtaaaaacag agaaaactca 1620
ctaactgata atttgaatga cttaaataat gaactgcaaa agaaacaaaa agcctataat 1680
aaaatactta gagagaaaga ggaaattgat caagagaatg atgaactgaa aaggcaaatt 1740
aaaagactaa ccagtggatt acagggcaaa cccctgacag ataataaaca aagtctaatt 1800
gaagaactcc aaaggaaagt taaaaaacta gagaaccaat tagagggaaa ggtggaggaa 1860
gtagacctaa aacctatgaa agaaaagaat gctaaagaag aattaattag gtgggaagaa 1920
ggtaaaaagt ggcaagccaa aatagaagga attcgaaaca agttaaaaga gaaagagggg 1980
gaagtcttta ctttaacaaa gcagttgaat actttgaagg atctttttgc caaagccgat 2040
aaagagaaac ttactttgca gaggaaacta aaaacaactg gcatgactgt tgatcaggtt 2100
ttgggaatac gagctttgga gtcagaaaaa gaattggaag aattaaaaaa gagaaatctt 2160
gacttagaaa atgatatatt gtatatgagg gcccaccaag ctcttcctcg agattctgtt 2220
gtagaagatt tacatttaca aaatagatac ctccaagaaa aacttcatgc tttagaaaaa 2280
cagttttcaa aggatacata ttctaagcct tcaatttcag gaatagagtc agatgatcat 2340
tgtcagagag aacaggagct tcagaaggaa aacttgaagt tgtcatctga aaatattgaa 2400
ctgaaatttc agcttgaaca agcaaataaa gatttgccaa gattaaagaa tcaagtcaga 2460
gatttgaagg aaatgtgtga atttcttaag aaagaaaaag cagaagttca gcggaaactt 2520
ggccatgtta gagggtctgg tagaagtgga aagacaatcc cagaactgga aaaaaccatt 2580
ggtttaatga aaaaagtagt tgaaaaagtc cagagagaaa atgaacagtt gaaaaaagca 2640
tcaggaatat tgactagtga aaaaatggct aatattgagc aggaaaatga aaaattgaag 2700
gctgaattag aaaaacttaa agctcatctt gggcatcagt tgagcatgca ctatgaatcc 2760
aagaccaaag gcacagaaaa aattattgct gaaaatgaaa ggcttcgtaa agaacttaaa 2820
aaagaaactg atgctgcaga gaaattacgg atagcaaaga ataatttaga gatattaaat 2880
gagaagatga cagttcaact agaagagact ggtaagagat tgcagtttgc agaaagcaga 2940
ggtccacagc ttgaaggtgc tgacagtaag agctggaaat ccattgtggt tacaagaatg 3000
tatgaaacca agttaaaaga attggaaact gatattgcca aaaaaaatca aagcattact 3060
gaccttaaac agcttgtaaa agaagcaaca gagagagaac aaaaagttaa caaatacaat 3120
gaagaccttg aacaacagat taagattctt aaacatgttc ctgaaggtgc tgagacagag 3180
caaggcctta aacgggagct tcaagttctt agattagcta atcatcagct ggataaagag 3240
aaagcagaat taatccatca gatagaagct aacaaggacc aaagtggagc tgaaagcacc 3300
atacctgatg ctgatcaact aaaggaaaaa ataaaagatc tagagacaca gctcaaaatg 3360
tcagatctag aaaagcagca tttgaaggag gaaataaaga agctgaaaaa agaactggaa 3420
aattttgatc cttcattttt tgaagaaatt gaagatctta agtataatta caaggaagaa 3480
gtgaagaaga atattctctt agaagagaag gtaaaaaaac tttcagaaca attgggagtt 3540
gaattaacta gccctgttgc tgcttctgaa gagtttgaag atgaagaaga aagtcctgtt 3600
aatttcccca tttac 3615
<210> 52
<211> 2784
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 52
atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60
caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120
aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180
atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240
gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300
gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360
gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420
gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480
aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540
attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600
gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660
gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720
aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780
aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840
tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900
ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960
gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020
gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080
gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140
aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200
ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260
aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320
ttagttgagg ctctgaagag gttaaaagat tatgaatcgg gagtatatgg tttagaagat 1380
gctgtcgttg aaataaagaa ttgtaaaaac caaattaaaa taagagatcg agagattgaa 1440
atattaacaa aggaaatcaa taaacttgaa ttgaagatca gtgatttcct tgatgaaaat 1500
gaggcactta gagagcgtgt gggccttgaa ccaaagacaa tgattgattt aactgaattt 1560
agaaatagca aacacttaaa acagcagcag tacagagctg aaaaccagat tcttttgaaa 1620
gagattgaaa gtctagagga agaacgactt gatctgaaaa aaaaaattcg tcaaatggct 1680
caagaaagag gaaaaagaag tgcaacttca ggattaacca ctgaggacct gaacctaact 1740
gaaaacattt ctcaaggaga tagaataagt gaaagaaaat tggatttatt gagcctcaaa 1800
aatatgagtg aagcacaatc aaagaatgaa tttctttcaa gagaactaat tgaaaaagaa 1860
agagatttag aaaggagtag gacagtgata gccaaatttc agaataaatt aaaagaatta 1920
gttgaagaaa ataagcaact tgaagaaggt atgaaagaaa tattgcaagc aattaaggaa 1980
atgcagaaag atcctgatgt taaaggagga gaaacatctc taattatccc tagccttgaa 2040
agactagtta atgctataga atcaaagaat gcagaaggaa tctttgatgc gagtctgcat 2100
ttgaaagccc aagttgatca gcttaccgga agaaatgaag aattaagaca ggagctcagg 2160
gaatctcgga aagaggctat aaattattca cagcagttgg caaaagctaa tttaaagata 2220
gaccatcttg aaaaagaaac tagtctttta cgacaatcag aaggatcgaa tgttgttttt 2280
aaaggaattg acttacctga tgggatagca ccatctagtg ccagtatcat taattctcag 2340
aatgaatatt taatacattt gttacaggaa ctagaaaata aagaaaaaaa gttaaagaat 2400
ttagaagatt ctcttgaaga ttacaacaga aaatttgctg taattcgtca tcaacaaagt 2460
ttgttgtata aagaatacct aagtgaaaag gagacctgga aaacagaatc taaaacaata 2520
aaagaggaaa agagaaaact tgaggatcaa gtccaacaag atgctataaa agtaaaagaa 2580
tataataatt tgctcaatgc tcttcagatg gattcggatg aaatgaaaaa aatacttgca 2640
gaaaatagta ggaaaattac tgttttgcaa gtgaatgaaa aatcacttat aaggcaatat 2700
acaaccttag tagaattgga gcgacaactt agaaaagaaa atgagaagca aaagaatgaa 2760
ttgttgtcaa tggaggctga agtt 2784
<210> 53
<211> 1635
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 53
tgtgaaaaaa ttgggtgttt gcaaagattt aaggaaatgg ccattttcaa gattgcagct 60
ctccaaaaag ttgtagataa tagtgtttct ttgtctgaac tagaactggc taataaacag 120
tacaatgaac tgactgctaa gtacagggac atcttgcaaa aagataatat gcttgttcaa 180
agaacaagta acttggaaca cctggagtgt gaaaacatct ccttaaaaga acaagtggag 240
tctataaata aagaactgga gattaccaag gaaaaacttc acactattga acaagcctgg 300
gaacaggaaa ctaaattagg taatgaatct agcatggata aggcaaagaa atcaataacc 360
aacagtgaca ttgtttccat ttcaaaaaaa ataactatgc tggaaatgaa ggaattaaat 420
gaaaggcagc gggctgaaca ttgtcaaaaa atgtatgaac acttacggac ttcgttaaag 480
caaatggagg aacgtaattt tgaattggaa accaaatttg ctgagcttac caaaatcaat 540
ttggatgcac agaaggtgga acagatgtta agagatgaat tagctgatag tgtgagcaag 600
gcagtaagtg atgctgatag gcaacggatt ctagaattag agaagaatga aatggaacta 660
aaagttgaag tgtcaaaact gagagagatt tctgatattg ccagaagaca agttgaaatt 720
ttgaatgcac aacaacaatc tagggacaag gaagtagagt ccctcagaat gcaactgcta 780
gactatcagg cacagtctga tgaaaagtcg ctcattgcca agttgcacca acataatgtc 840
tctcttcaac tgagtgaggc tactgctctt ggtaagttgg agtcaattac atctaaactg 900
cagaagatgg aggcctacaa cttgcgctta gagcagaaac ttgatgaaaa agaacaggct 960
ctctattatg ctcgtttgga gggaagaaac agagcaaaac atctgcgcca aacaattcag 1020
tctctacgac gacagtttag tggagcttta cccttggcac aacaggaaaa gttctccaaa 1080
acaatgattc aactacaaaa tgacaaactt aagataatgc aagaaatgaa aaattctcaa 1140
caagaacata gaaatatgga gaacaaaaca ttggagatgg aattaaaatt aaagggcctg 1200
gaagagttaa taagcacttt aaaggatacc aaaggagccc aaaaggtaat caactggcat 1260
atgaaaatag aagaacttcg tcttcaagaa cttaaactaa atcgggaatt agtcaaggat 1320
aaagaagaaa taaaatattt gaataacata atttctgaat atgaacgtac aatcagcagt 1380
cttgaagaag aaattgtgca acagaacaag tttcatgaag aaagacaaat ggcctgggat 1440
caaagagaag ttgacctgga acgccaacta gacatttttg accgtcagca aaatgaaata 1500
ctaaatgcgg cacaaaagtt tgaagaagct acaggatcaa tccctgaccc tagtttgccc 1560
cttccaaatc aacttgagat cgctctaagg aaaattaagg agaacattcg aataattcta 1620
gaaacacggg caact 1635
<210> 54
<211> 3018
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 54
tgcaaatcac tagaagagaa actaaaagag aaagaatctg ctttaaggtt agcagaacaa 60
aatatactgt caagagacaa agtaatcaat gaactgaggc ttcgattgcc tgccactgca 120
gaaagagaaa agctcatagc tgagctaggc agaaaagaga tggaaccaaa atctcaccac 180
acattgaaaa ttgctcatca aaccattgca aacatgcaag caaggttaaa tcaaaaagaa 240
gaagtattaa agaagtatca acgtcttcta gaaaaagcca gagaggagca aagagaaatt 300
gtgaagaaac atgaggaaga ccttcatatt cttcatcaca gattagaact acaggctgat 360
agttcactaa ataaattcaa acaaacggct tgggatttaa tgaaacagtc tcccactcca 420
gttcctacca acaagcattt tattcgtctg gctgagatgg aacagacagt agcagaacaa 480
gatgactctc tttcctcact cttggtcaaa ctaaagaaag tatcacaaga tttggagaga 540
caaagagaaa tcactgaatt aaaagtaaaa gaatttgaaa atatcaaatt acagcttcaa 600
gaaaaccatg aagatgaagt gaaaaaagta aaagcggaag tagaggattt aaagtatctt 660
ctggaccagt cacaaaagga gtcacagtgt ttaaaatctg aacttcaggc tcaaaaagaa 720
gcaaattcaa gagctccaac aactacaatg agaaatctag tagaacggct aaagagccaa 780
ttagccttga aggagaaaca acagaaagca cttagtcggg cacttttaga actccgggca 840
gaaatgacag cagctgctga agaacgtatt atttctgcaa cttctcaaaa agaggcccat 900
ctcaatgttc aacaaatcgt tgatcgacat actagagagc taaagacaca agttgaagat 960
ttaaatgaaa atcttttaaa attgaaagaa gcacttaaaa ctagtaaaaa cagagaaaac 1020
tcactaactg ataatttgaa tgacttaaat aatgaactgc aaaagaaaca aaaagcctat 1080
aataaaatac ttagagagaa agaggaaatt gatcaagaga atgatgaact gaaaaggcaa 1140
attaaaagac taaccagtgg attacagggc aaacccctga cagataataa acaaagtcta 1200
attgaagaac tccaaaggaa agttaaaaaa ctagagaacc aattagaggg aaaggtggag 1260
gaagtagacc taaaacctat gaaagaaaag aatgctaaag aagaattaat taggtgggaa 1320
gaaggtaaaa agtggcaagc caaaatagaa ggaattcgaa acaagttaaa agagaaagag 1380
ggggaagtct ttactttaac aaagcagttg aatactttga aggatctttt tgccaaagcc 1440
gataaagaga aacttacttt gcagaggaaa ctaaaaacaa ctggcatgac tgttgatcag 1500
gttttgggaa tacgagcttt ggagtcagaa aaagaattgg aagaattaaa aaagagaaat 1560
cttgacttag aaaatgatat attgtatatg agggcccacc aagctcttcc tcgagattct 1620
gttgtagaag atttacattt acaaaataga tacctccaag aaaaacttca tgctttagaa 1680
aaacagtttt caaaggatac atattctaag ccttcaattt caggaataga gtcagatgat 1740
cattgtcaga gagaacagga gcttcagaag gaaaacttga agttgtcatc tgaaaatatt 1800
gaactgaaat ttcagcttga acaagcaaat aaagatttgc caagattaaa gaatcaagtc 1860
agagatttga aggaaatgtg tgaatttctt aagaaagaaa aagcagaagt tcagcggaaa 1920
cttggccatg ttagagggtc tggtagaagt ggaaagacaa tcccagaact ggaaaaaacc 1980
attggtttaa tgaaaaaagt agttgaaaaa gtccagagag aaaatgaaca gttgaaaaaa 2040
gcatcaggaa tattgactag tgaaaaaatg gctaatattg agcaggaaaa tgaaaaattg 2100
aaggctgaat tagaaaaact taaagctcat cttgggcatc agttgagcat gcactatgaa 2160
tccaagacca aaggcacaga aaaaattatt gctgaaaatg aaaggcttcg taaagaactt 2220
aaaaaagaaa ctgatgctgc agagaaatta cggatagcaa agaataattt agagatatta 2280
aatgagaaga tgacagttca actagaagag actggtaaga gattgcagtt tgcagaaagc 2340
agaggtccac agcttgaagg tgctgacagt aagagctgga aatccattgt ggttacaaga 2400
atgtatgaaa ccaagttaaa agaattggaa actgatattg ccaaaaaaaa tcaaagcatt 2460
actgacctta aacagcttgt aaaagaagca acagagagag aacaaaaagt taacaaatac 2520
aatgaagacc ttgaacaaca gattaagatt cttaaacatg ttcctgaagg tgctgagaca 2580
gagcaaggcc ttaaacggga gcttcaagtt cttagattag ctaatcatca gctggataaa 2640
gagaaagcag aattaatcca tcagatagaa gctaacaagg accaaagtgg agctgaaagc 2700
accatacctg atgctgatca actaaaggaa aaaataaaag atctagagac acagctcaaa 2760
atgtcagatc tagaaaagca gcatttgaag gaggaaataa agaagctgaa aaaagaactg 2820
gaaaattttg atccttcatt ttttgaagaa attgaagatc ttaagtataa ttacaaggaa 2880
gaagtgaaga agaatattct cttagaagag aaggtaaaaa aactttcaga acaattggga 2940
gttgaattaa ctagccctgt tgctgcttct gaagagtttg aagatgaaga agaaagtcct 3000
gttaatttcc ccatttac 3018
<210> 55
<211> 1356
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 55
atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60
caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120
aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180
atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240
gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300
gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360
gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420
gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480
aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540
attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600
gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660
gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720
aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780
aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840
tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900
ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960
gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020
gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080
gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140
aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200
ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260
aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320
ttagttgagg ctctgaagag gttaaaagat tatgaa 1356
<210> 56
<211> 3063
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 56
tcgggagtat atggtttaga agatgctgtc gttgaaataa agaattgtaa aaaccaaatt 60
aaaataagag atcgagagat tgaaatatta acaaaggaaa tcaataaact tgaattgaag 120
atcagtgatt tccttgatga aaatgaggca cttagagagc gtgtgggcct tgaaccaaag 180
acaatgattg atttaactga atttagaaat agcaaacact taaaacagca gcagtacaga 240
gctgaaaacc agattctttt gaaagagatt gaaagtctag aggaagaacg acttgatctg 300
aaaaaaaaaa ttcgtcaaat ggctcaagaa agaggaaaaa gaagtgcaac ttcaggatta 360
accactgagg acctgaacct aactgaaaac atttctcaag gagatagaat aagtgaaaga 420
aaattggatt tattgagcct caaaaatatg agtgaagcac aatcaaagaa tgaatttctt 480
tcaagagaac taattgaaaa agaaagagat ttagaaagga gtaggacagt gatagccaaa 540
tttcagaata aattaaaaga attagttgaa gaaaataagc aacttgaaga aggtatgaaa 600
gaaatattgc aagcaattaa ggaaatgcag aaagatcctg atgttaaagg aggagaaaca 660
tctctaatta tccctagcct tgaaagacta gttaatgcta tagaatcaaa gaatgcagaa 720
ggaatctttg atgcgagtct gcatttgaaa gcccaagttg atcagcttac cggaagaaat 780
gaagaattaa gacaggagct cagggaatct cggaaagagg ctataaatta ttcacagcag 840
ttggcaaaag ctaatttaaa gatagaccat cttgaaaaag aaactagtct tttacgacaa 900
tcagaaggat cgaatgttgt ttttaaagga attgacttac ctgatgggat agcaccatct 960
agtgccagta tcattaattc tcagaatgaa tatttaatac atttgttaca ggaactagaa 1020
aataaagaaa aaaagttaaa gaatttagaa gattctcttg aagattacaa cagaaaattt 1080
gctgtaattc gtcatcaaca aagtttgttg tataaagaat acctaagtga aaaggagacc 1140
tggaaaacag aatctaaaac aataaaagag gaaaagagaa aacttgagga tcaagtccaa 1200
caagatgcta taaaagtaaa agaatataat aatttgctca atgctcttca gatggattcg 1260
gatgaaatga aaaaaatact tgcagaaaat agtaggaaaa ttactgtttt gcaagtgaat 1320
gaaaaatcac ttataaggca atatacaacc ttagtagaat tggagcgaca acttagaaaa 1380
gaaaatgaga agcaaaagaa tgaattgttg tcaatggagg ctgaagtttg tgaaaaaatt 1440
gggtgtttgc aaagatttaa ggaaatggcc attttcaaga ttgcagctct ccaaaaagtt 1500
gtagataata gtgtttcttt gtctgaacta gaactggcta ataaacagta caatgaactg 1560
actgctaagt acagggacat cttgcaaaaa gataatatgc ttgttcaaag aacaagtaac 1620
ttggaacacc tggagtgtga aaacatctcc ttaaaagaac aagtggagtc tataaataaa 1680
gaactggaga ttaccaagga aaaacttcac actattgaac aagcctggga acaggaaact 1740
aaattaggta atgaatctag catggataag gcaaagaaat caataaccaa cagtgacatt 1800
gtttccattt caaaaaaaat aactatgctg gaaatgaagg aattaaatga aaggcagcgg 1860
gctgaacatt gtcaaaaaat gtatgaacac ttacggactt cgttaaagca aatggaggaa 1920
cgtaattttg aattggaaac caaatttgct gagcttacca aaatcaattt ggatgcacag 1980
aaggtggaac agatgttaag agatgaatta gctgatagtg tgagcaaggc agtaagtgat 2040
gctgataggc aacggattct agaattagag aagaatgaaa tggaactaaa agttgaagtg 2100
tcaaaactga gagagatttc tgatattgcc agaagacaag ttgaaatttt gaatgcacaa 2160
caacaatcta gggacaagga agtagagtcc ctcagaatgc aactgctaga ctatcaggca 2220
cagtctgatg aaaagtcgct cattgccaag ttgcaccaac ataatgtctc tcttcaactg 2280
agtgaggcta ctgctcttgg taagttggag tcaattacat ctaaactgca gaagatggag 2340
gcctacaact tgcgcttaga gcagaaactt gatgaaaaag aacaggctct ctattatgct 2400
cgtttggagg gaagaaacag agcaaaacat ctgcgccaaa caattcagtc tctacgacga 2460
cagtttagtg gagctttacc cttggcacaa caggaaaagt tctccaaaac aatgattcaa 2520
ctacaaaatg acaaacttaa gataatgcaa gaaatgaaaa attctcaaca agaacataga 2580
aatatggaga acaaaacatt ggagatggaa ttaaaattaa agggcctgga agagttaata 2640
agcactttaa aggataccaa aggagcccaa aaggtaatca actggcatat gaaaatagaa 2700
gaacttcgtc ttcaagaact taaactaaat cgggaattag tcaaggataa agaagaaata 2760
aaatatttga ataacataat ttctgaatat gaacgtacaa tcagcagtct tgaagaagaa 2820
attgtgcaac agaacaagtt tcatgaagaa agacaaatgg cctgggatca aagagaagtt 2880
gacctggaac gccaactaga catttttgac cgtcagcaaa atgaaatact aaatgcggca 2940
caaaagtttg aagaagctac aggatcaatc cctgacccta gtttgcccct tccaaatcaa 3000
cttgagatcg ctctaaggaa aattaaggag aacattcgaa taattctaga aacacgggca 3060
act 3063
<210> 57
<211> 1356
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 57
atgccaccta atataaactg gaaagaaata atgaaagttg acccagatga cctgccccgt 60
caagaagaac tggcagataa tttattgatt tccttatcca aggtggaagt aaatgagcta 120
aaaagtgaaa agcaagaaaa tgtgatacac cttttcagaa ttactcagtc actaatgaag 180
atgaaagctc aagaagtgga gctggctttg gaagaagtag aaaaagctgg agaagaacaa 240
gcaaaatttg aaaatcaatt aaaaactaaa gtaatgaaac tggaaaatga actggagatg 300
gctcagcagt ctgcaggtgg acgagatact cggtttttac gtaatgaaat ttgccaactt 360
gaaaaacaat tagaacaaaa agatagagaa ttggaggaca tggaaaagga gttggagaaa 420
gagaagaaag ttaatgagca attggctctt cgaaatgagg aggcagaaaa tgaaaacagc 480
aaattaagaa gagagaacaa acgtctaaag aaaaagaatg aacaactttg tcaggatatt 540
attgactacc agaaacaaat agattcacag aaagaaacac ttttatcaag aagaggggaa 600
gacagtgact accgatcaca gttgtctaaa aaaaactatg agcttatcca atatcttgat 660
gaaattcaga ctttaacaga agctaatgag aaaattgaag ttcagaatca agaaatgaga 720
aaaaatttag aagagtctgt acaggaaatg gagaagatga ctgatgaata taatagaatg 780
aaagctattg tgcatcagac agataatgta atagatcagt taaaaaaaga aaacgatcat 840
tatcaacttc aagtgcagga gcttacagat ctcctgaaat caaaaaatga agaagatgat 900
ccaattatgg tagctgtcaa tgcaaaagta gaagaatgga agctaatttt gtcttctaaa 960
gatgatgaaa ttattgagta tcagcaaatg ttacataacc taagggagaa acttaagaat 1020
gctcagcttg atgctgataa aagtaatgtt atggctctac agcagggtat acaggaacga 1080
gacagtcaaa ttaagatgct caccgaacaa gtagaacaat atacaaaaga aatggaaaag 1140
aatacttgta ttattgaaga tttgaaaaat gagctccaaa gaaacaaagg tgcttcaacc 1200
ctttctcaac agactcatat gaaaattcag tcaacgttag acattttaaa agagaaaact 1260
aaagaggctg agagaacagc tgaactggct gaggctgatg ctagggaaaa ggataaagag 1320
ttagttgagg ctctgaagag gttaaaagat tatgaa 1356
<210> 58
<211> 3063
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 58
tcgggagtat atggtttaga agatgctgtc gttgaaataa agaattgtaa aaaccaaatt 60
aaaataagag atcgagagat tgaaatatta acaaaggaaa tcaataaact tgaattgaag 120
atcagtgatt tccttgatga aaatgaggca cttagagagc gtgtgggcct tgaaccaaag 180
acaatgattg atttaactga atttagaaat agcaaacact taaaacagca gcagtacaga 240
gctgaaaacc agattctttt gaaagagatt gaaagtctag aggaagaacg acttgatctg 300
aaaaaaaaaa ttcgtcaaat ggctcaagaa agaggaaaaa gaagtgcaac ttcaggatta 360
accactgagg acctgaacct aactgaaaac atttctcaag gagatagaat aagtgaaaga 420
aaattggatt tattgagcct caaaaatatg agtgaagcac aatcaaagaa tgaatttctt 480
tcaagagaac taattgaaaa agaaagagat ttagaaagga gtaggacagt gatagccaaa 540
tttcagaata aattaaaaga attagttgaa gaaaataagc aacttgaaga aggtatgaaa 600
gaaatattgc aagcaattaa ggaaatgcag aaagatcctg atgttaaagg aggagaaaca 660
tctctaatta tccctagcct tgaaagacta gttaatgcta tagaatcaaa gaatgcagaa 720
ggaatctttg atgcgagtct gcatttgaaa gcccaagttg atcagcttac cggaagaaat 780
gaagaattaa gacaggagct cagggaatct cggaaagagg ctataaatta ttcacagcag 840
ttggcaaaag ctaatttaaa gatagaccat cttgaaaaag aaactagtct tttacgacaa 900
tcagaaggat cgaatgttgt ttttaaagga attgacttac ctgatgggat agcaccatct 960
agtgccagta tcattaattc tcagaatgaa tatttaatac atttgttaca ggaactagaa 1020
aataaagaaa aaaagttaaa gaatttagaa gattctcttg aagattacaa cagaaaattt 1080
gctgtaattc gtcatcaaca aagtttgttg tataaagaat acctaagtga aaaggagacc 1140
tggaaaacag aatctaaaac aataaaagag gaaaagagaa aacttgagga tcaagtccaa 1200
caagatgcta taaaagtaaa agaatataat aatttgctca atgctcttca gatggattcg 1260
gatgaaatga aaaaaatact tgcagaaaat agtaggaaaa ttactgtttt gcaagtgaat 1320
gaaaaatcac ttataaggca atatacaacc ttagtagaat tggagcgaca acttagaaaa 1380
gaaaatgaga agcaaaagaa tgaattgttg tcaatggagg ctgaagtttg tgaaaaaatt 1440
gggtgtttgc aaagatttaa ggaaatggcc attttcaaga ttgcagctct ccaaaaagtt 1500
gtagataata gtgtttcttt gtctgaacta gaactggcta ataaacagta caatgaactg 1560
actgctaagt acagggacat cttgcaaaaa gataatatgc ttgttcaaag aacaagtaac 1620
ttggaacacc tggagtgtga aaacatctcc ttaaaagaac aagtggagtc tataaataaa 1680
gaactggaga ttaccaagga aaaacttcac actattgaac aagcctggga acaggaaact 1740
aaattaggta atgaatctag catggataag gcaaagaaat caataaccaa cagtgacatt 1800
gtttccattt caaaaaaaat aactatgctg gaaatgaagg aattaaatga aaggcagcgg 1860
gctgaacatt gtcaaaaaat gtatgaacac ttacggactt cgttaaagca aatggaggaa 1920
cgtaattttg aattggaaac caaatttgct gagcttacca aaatcaattt ggatgcacag 1980
aaggtggaac agatgttaag agatgaatta gctgatagtg tgagcaaggc agtaagtgat 2040
gctgataggc aacggattct agaattagag aagaatgaaa tggaactaaa agttgaagtg 2100
tcaaaactga gagagatttc tgatattgcc agaagacaag ttgaaatttt gaatgcacaa 2160
caacaatcta gggacaagga agtagagtcc ctcagaatgc aactgctaga ctatcaggca 2220
cagtctgatg aaaagtcgct cattgccaag ttgcaccaac ataatgtctc tcttcaactg 2280
agtgaggcta ctgctcttgg taagttggag tcaattacat ctaaactgca gaagatggag 2340
gcctacaact tgcgcttaga gcagaaactt gatgaaaaag aacaggctct ctattatgct 2400
cgtttggagg gaagaaacag agcaaaacat ctgcgccaaa caattcagtc tctacgacga 2460
cagtttagtg gagctttacc cttggcacaa caggaaaagt tctccaaaac aatgattcaa 2520
ctacaaaatg acaaacttaa gataatgcaa gaaatgaaaa attctcaaca agaacataga 2580
aatatggaga acaaaacatt ggagatggaa ttaaaattaa agggcctgga agagttaata 2640
agcactttaa aggataccaa aggagcccaa aaggtaatca actggcatat gaaaatagaa 2700
gaacttcgtc ttcaagaact taaactaaat cgggaattag tcaaggataa agaagaaata 2760
aaatatttga ataacataat ttctgaatat gaacgtacaa tcagcagtct tgaagaagaa 2820
attgtgcaac agaacaagtt tcatgaagaa agacaaatgg cctgggatca aagagaagtt 2880
gacctggaac gccaactaga catttttgac cgtcagcaaa atgaaatact aaatgcggca 2940
caaaagtttg aagaagctac aggatcaatc cctgacccta gtttgcccct tccaaatcaa 3000
cttgagatcg ctctaaggaa aattaaggag aacattcgaa taattctaga aacacgggca 3060
act 3063
<210> 59
<211> 3018
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 59
tgcaaatcac tagaagagaa actaaaagag aaagaatctg ctttaaggtt agcagaacaa 60
aatatactgt caagagacaa agtaatcaat gaactgaggc ttcgattgcc tgccactgca 120
gaaagagaaa agctcatagc tgagctaggc agaaaagaga tggaaccaaa atctcaccac 180
acattgaaaa ttgctcatca aaccattgca aacatgcaag caaggttaaa tcaaaaagaa 240
gaagtattaa agaagtatca acgtcttcta gaaaaagcca gagaggagca aagagaaatt 300
gtgaagaaac atgaggaaga ccttcatatt cttcatcaca gattagaact acaggctgat 360
agttcactaa ataaattcaa acaaacggct tgggatttaa tgaaacagtc tcccactcca 420
gttcctacca acaagcattt tattcgtctg gctgagatgg aacagacagt agcagaacaa 480
gatgactctc tttcctcact cttggtcaaa ctaaagaaag tatcacaaga tttggagaga 540
caaagagaaa tcactgaatt aaaagtaaaa gaatttgaaa atatcaaatt acagcttcaa 600
gaaaaccatg aagatgaagt gaaaaaagta aaagcggaag tagaggattt aaagtatctt 660
ctggaccagt cacaaaagga gtcacagtgt ttaaaatctg aacttcaggc tcaaaaagaa 720
gcaaattcaa gagctccaac aactacaatg agaaatctag tagaacggct aaagagccaa 780
ttagccttga aggagaaaca acagaaagca cttagtcggg cacttttaga actccgggca 840
gaaatgacag cagctgctga agaacgtatt atttctgcaa cttctcaaaa agaggcccat 900
ctcaatgttc aacaaatcgt tgatcgacat actagagagc taaagacaca agttgaagat 960
ttaaatgaaa atcttttaaa attgaaagaa gcacttaaaa ctagtaaaaa cagagaaaac 1020
tcactaactg ataatttgaa tgacttaaat aatgaactgc aaaagaaaca aaaagcctat 1080
aataaaatac ttagagagaa agaggaaatt gatcaagaga atgatgaact gaaaaggcaa 1140
attaaaagac taaccagtgg attacagggc aaacccctga cagataataa acaaagtcta 1200
attgaagaac tccaaaggaa agttaaaaaa ctagagaacc aattagaggg aaaggtggag 1260
gaagtagacc taaaacctat gaaagaaaag aatgctaaag aagaattaat taggtgggaa 1320
gaaggtaaaa agtggcaagc caaaatagaa ggaattcgaa acaagttaaa agagaaagag 1380
ggggaagtct ttactttaac aaagcagttg aatactttga aggatctttt tgccaaagcc 1440
gataaagaga aacttacttt gcagaggaaa ctaaaaacaa ctggcatgac tgttgatcag 1500
gttttgggaa tacgagcttt ggagtcagaa aaagaattgg aagaattaaa aaagagaaat 1560
cttgacttag aaaatgatat attgtatatg agggcccacc aagctcttcc tcgagattct 1620
gttgtagaag atttacattt acaaaataga tacctccaag aaaaacttca tgctttagaa 1680
aaacagtttt caaaggatac atattctaag ccttcaattt caggaataga gtcagatgat 1740
cattgtcaga gagaacagga gcttcagaag gaaaacttga agttgtcatc tgaaaatatt 1800
gaactgaaat ttcagcttga acaagcaaat aaagatttgc caagattaaa gaatcaagtc 1860
agagatttga aggaaatgtg tgaatttctt aagaaagaaa aagcagaagt tcagcggaaa 1920
cttggccatg ttagagggtc tggtagaagt ggaaagacaa tcccagaact ggaaaaaacc 1980
attggtttaa tgaaaaaagt agttgaaaaa gtccagagag aaaatgaaca gttgaaaaaa 2040
gcatcaggaa tattgactag tgaaaaaatg gctaatattg agcaggaaaa tgaaaaattg 2100
aaggctgaat tagaaaaact taaagctcat cttgggcatc agttgagcat gcactatgaa 2160
tccaagacca aaggcacaga aaaaattatt gctgaaaatg aaaggcttcg taaagaactt 2220
aaaaaagaaa ctgatgctgc agagaaatta cggatagcaa agaataattt agagatatta 2280
aatgagaaga tgacagttca actagaagag actggtaaga gattgcagtt tgcagaaagc 2340
agaggtccac agcttgaagg tgctgacagt aagagctgga aatccattgt ggttacaaga 2400
atgtatgaaa ccaagttaaa agaattggaa actgatattg ccaaaaaaaa tcaaagcatt 2460
actgacctta aacagcttgt aaaagaagca acagagagag aacaaaaagt taacaaatac 2520
aatgaagacc ttgaacaaca gattaagatt cttaaacatg ttcctgaagg tgctgagaca 2580
gagcaaggcc ttaaacggga gcttcaagtt cttagattag ctaatcatca gctggataaa 2640
gagaaagcag aattaatcca tcagatagaa gctaacaagg accaaagtgg agctgaaagc 2700
accatacctg atgctgatca actaaaggaa aaaataaaag atctagagac acagctcaaa 2760
atgtcagatc tagaaaagca gcatttgaag gaggaaataa agaagctgaa aaaagaactg 2820
gaaaattttg atccttcatt ttttgaagaa attgaagatc ttaagtataa ttacaaggaa 2880
gaagtgaaga agaatattct cttagaagag aaggtaaaaa aactttcaga acaattggga 2940
gttgaattaa ctagccctgt tgctgcttct gaagagtttg aagatgaaga agaaagtcct 3000
gttaatttcc ccatttac 3018
<210> 60
<211> 4908
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 60
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360
ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420
ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480
ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540
cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600
ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgcc atgggcttcg 660
tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 720
gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 780
atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 840
caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 900
gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 960
gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1020
gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1080
agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa gaaacactga 1140
cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1200
ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1260
cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1320
cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1380
tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1440
gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1500
ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1560
tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1620
gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1680
actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1740
gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1800
aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 1860
cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 1920
ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 1980
acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2040
tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2100
agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2160
acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg gtcctggata 2220
agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2280
aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2340
caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2400
ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2460
tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2520
tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2580
acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2640
tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2700
agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2760
gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 2820
tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 2880
ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 2940
gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3000
accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3060
ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3120
tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3180
tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3240
actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3300
aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3360
cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3420
ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3480
cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3540
acaatggagc tgggaaaacc accaccttgt ccatcctgac gggtctgttg ccaccaacct 3600
ctgggactgt gctcgttggg ggaagggaca ttgaaaccag cctggatgca gtccggcaga 3660
gccttggcat gtgtccacag cacaacatcc tgttccacca cctcacggtg gctgagcaca 3720
tgctgttcta tgcccagctg aaaggaaagt cccaggagga ggcccagctg gagatggaag 3780
ccatgttgga ggacacaggc ctccaccaca agcggaatga agaggctcag gacctatcag 3840
gtggcatgca gagaaagctg tcggttgcca ttgcctttgt gggagatgcc aaggtggtga 3900
ttctggacga acccacctct ggggtggacc cttactcgag acgctcaatc tgggatctgc 3960
tcctgaagta tcgctcaggc agaaccatca tcatgtccac tcaccacatg gacgaggccg 4020
acctccttgg ggaccgcatt gccatcattg cccagggaag gctctactgc tcaggcaccc 4080
cactcttcct gaagaactgc ctgagctacg agaccgagat cctgaccgtg gagtacggcc 4140
tgctgcccat cggcaagatc gtggagaagc ggatcgagtg caccgtgtac agcgtggaca 4200
acaacggcaa catctacacc cagcccgtgg cccagtggca cgaccggggc gagcaggagg 4260
tgttcgagta ctgcctggag gacggcagcc tgatccgggc caccaaggac cacaagttca 4320
tgaccgtgga cggccagatg ctgcccatcg acgagatctt cgagcgggag ctggacctga 4380
tgcgggtgga caacctgccc aacgactaca aagaccatga cggtgattat aaagatcatg 4440
acatcgacta caaggatgac gatgacaagt gagcggccgc ttcgagcaga catgataaga 4500
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 4560
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 4620
aacaacaatt gcattcattt tatgtttcag gttcaggggg agatgtggga ggttttttaa 4680
agcaagtaaa acctctacaa atgtggtaaa atcgataagg atcttcctag agcatggcta 4740
cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4800
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4860
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4908
<210> 61
<211> 4634
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 61
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtggg ccccagaagc 360
ctggtggttg tttgtccttc tcaggggaaa agtgaggcgg ccccttggag gaaggggccg 420
ggcagaatga tctaatcgga ttccaagcag ctcaggggat tgtctttttc tagcaccttc 480
ttgccactcc taagcgtcct ccgtgacccc ggctgggatt tagcctggtg ctgtgtcagc 540
cccgggctcc caggggcttc ccagtggtcc ccaggaaccc tcgacagggc cagggcgtct 600
ctctcgtcca gcaagggcag ggacgggcca caggcaaggg cgcggccgca tgatcaagat 660
cgccacccgg aagtacctgg gcaagcagaa cgtgtacgac atcggcgtgg agcgggacca 720
caacttcgcc ctgaagaacg gcttcatcgc cagcaattgc tttggcacag gcttgtactt 780
aaccttggtg cgcaagatga aaaacatcca gagccaaagg aaaggcagtg aggggacctg 840
cagctgctcg tctaagggtt tctccaccac gtgtccagcc cacgtcgatg acctaactcc 900
agaacaagtc ctggatgggg atgtaaatga gctgatggat gtagttctcc accatgttcc 960
agaggcaaag ctggtggagt gcattggtca agaacttatc ttccttcttc caaataagaa 1020
cttcaagcac agagcatatg ccagcctttt cagagagctg gaggagacgc tggctgacct 1080
tggtctcagc agttttggaa tttctgacac tcccctggaa gagatttttc tgaaggtcac 1140
ggaggattct gattcaggac ctctgtttgc gggtggcgct cagcagaaaa gagaaaacgt 1200
caacccccga cacccctgct tgggtcccag agagaaggct ggacagacac cccaggactc 1260
caatgtctgc tccccagggg cgccggctgc tcacccagag ggccagcctc ccccagagcc 1320
agagtgccca ggcccgcagc tcaacacggg gacacagctg gtcctccagc atgtgcaggc 1380
gctgctggtc aagagattcc aacacaccat ccgcagccac aaggacttcc tggcgcagat 1440
cgtgctcccg gctacctttg tgtttttggc tctgatgctt tctattgtta tccctccttt 1500
tggcgaatac cccgctttga cccttcaccc ctggatatat gggcagcagt acaccttctt 1560
cagcatggat gaaccaggca gtgagcagtt cacggtactt gcagacgtcc tcctgaataa 1620
gccaggcttt ggcaaccgct gcctgaagga agggtggctt ccggagtacc cctgtggcaa 1680
ctcaacaccc tggaagactc cttctgtgtc cccaaacatc acccagctgt tccagaagca 1740
gaaatggaca caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg agaagctcac 1800
catgctgcca gagtgccccg agggtgccgg gggcctcccg cccccccaga gaacacagcg 1860
cagcacggaa attctacaag acctgacgga caggaacatc tccgacttct tggtaaaaac 1920
gtatcctgct cttataagaa gcagcttaaa gagcaaattc tgggtcaatg aacagaggta 1980
tggaggaatt tccattggag gaaagctccc agtcgtcccc atcacggggg aagcacttgt 2040
tgggttttta agcgaccttg gccggatcat gaatgtgagc gggggcccta tcactagaga 2100
ggcctctaaa gaaatacctg atttccttaa acatctagaa actgaagaca acattaaggt 2160
gtggtttaat aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg cccacaacgc 2220
catcttacgg gccagcctgc ctaaggacag gagccccgag gagtatggaa tcaccgtcat 2280
tagccaaccc ctgaacctga ccaaggagca gctctcagag attacagtgc tgaccacttc 2340
agtggatgct gtggttgcca tctgcgtgat tttctccatg tccttcgtcc cagccagctt 2400
tgtcctttat ttgatccagg agcgggtgaa caaatccaag cacctccagt ttatcagtgg 2460
agtgagcccc accacctact gggtaaccaa cttcctctgg gacatcatga attattccgt 2520
gagtgctggg ctggtggtgg gcatcttcat cgggtttcag aagaaagcct acacttctcc 2580
agaaaacctt cctgcccttg tggcactgct cctgctgtat ggatgggcgg tcattcccat 2640
gatgtaccca gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg ctttatcttg 2700
tgctaatctg ttcatcggca tcaacagcag tgctattacc ttcatcttgg aattatttga 2760
gaataaccgg acgctgctca ggttcaacgc cgtgctgagg aagctgctca ttgtcttccc 2820
ccacttctgc ctgggccggg gcctcattga ccttgcactg agccaggctg tgacagatgt 2880
ctatgcccgg tttggtgagg agcactctgc aaatccgttc cactgggacc tgattgggaa 2940
gaacctgttt gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc tgctggtcca 3000
gcgccacttc ttcctctccc aatggattgc cgagcccact aaggagccca ttgttgatga 3060
agatgatgat gtggctgaag aaagacaaag aattattact ggtggaaata aaactgacat 3120
cttaaggcta catgaactaa ccaagattta tccaggcacc tccagcccag cagtggacag 3180
gctgtgtgtc ggagttcgcc ctggagagtg ctttggcctc ctgggagtga atggtgccgg 3240
caaaacaacc acattcaaga tgctcactgg ggacaccaca gtgacctcag gggatgccac 3300
cgtagcaggc aagagtattt taaccaatat ttctgaagtc catcaaaata tgggctactg 3360
tcctcagttt gatgcaatcg atgagctgct cacaggacga gaacatcttt acctttatgc 3420
ccggcttcga ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga gtattaagag 3480
cctgggcctg actgtctacg ccgactgcct ggctggcacg tacagtgggg gcaacaagcg 3540
gaaactctcc acagccatcg cactcattgg ctgcccaccg ctggtgctgc tggatgagcc 3600
caccacaggg atggaccccc aggcacgccg catgctgtgg aacgtcatcg tgagcatcat 3660
cagagaaggg agggctgtgg tcctcacatc ccacagcatg gaagaatgtg aggcactgtg 3720
tacccggctg gccatcatgg taaagggcgc ctttcgatgt atgggcacca ttcagcatct 3780
caagtccaaa tttggagatg gctatatcgt cacaatgaag atcaaatccc cgaaggacga 3840
cctgcttcct gacctgaacc ctgtggagca gttcttccag gggaacttcc caggcagtgt 3900
gcagagggag aggcactaca acatgctcca gttccaggtc tcctcctcct ccctggcgag 3960
gatcttccag ctcctcctct cccacaagga cagcctgctc atcgaggagt actcagtcac 4020
acagaccaca ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg aaagtcatga 4080
cctccctctg caccctcgag ctgctggagc cagtcgacaa gcccaggacg actacaaaga 4140
ccatgacggt gattataaag atcatgacat cgactacaag gatgacgatg acaagtgagc 4200
ggccgcttcg agcagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa 4260
tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca 4320
ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc 4380
agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt ggtaaaatcg 4440
ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 4500
tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4560
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4620
gagcgagcgc gcag 4634
<210> 62
<211> 4875
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 62
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360
attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540
atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600
ccaccatggc ggccgccatg ggcttcgtga gacagataca gcttttgctc tggaagaact 660
ggaccctgcg gaaaaggcaa aagattcgct ttgtggtgga actcgtgtgg cctttatctt 720
tatttctggt cttgatctgg ttaaggaatg ccaacccgct ctacagccat catgaatgcc 780
atttccccaa caaggcgatg ccctcagcag gaatgctgcc gtggctccag gggatcttct 840
gcaatgtgaa caatccctgt tttcaaagcc ccaccccagg agaatctcct ggaattgtgt 900
caaactataa caactccatc ttggcaaggg tatatcgaga ttttcaagaa ctcctcatga 960
atgcaccaga gagccagcac cttggccgta tttggacaga gctacacatc ttgtcccaat 1020
tcatggacac cctccggact cacccggaga gaattgcagg aagaggaatt cgaataaggg 1080
atatcttgaa agatgaagaa acactgacac tatttctcat taaaaacatc ggcctgtctg 1140
actcagtggt ctaccttctg atcaactctc aagtccgtcc agagcagttc gctcatggag 1200
tcccggacct ggcgctgaag gacatcgcct gcagcgaggc cctcctggag cgcttcatca 1260
tcttcagcca gagacgcggg gcaaagacgg tgcgctatgc cctgtgctcc ctctcccagg 1320
gcaccctaca gtggatagaa gacactctgt atgccaacgt ggacttcttc aagctcttcc 1380
gtgtgcttcc cacactccta gacagccgtt ctcaaggtat caatctgaga tcttggggag 1440
gaatattatc tgatatgtca ccaagaattc aagagtttat ccatcggccg agtatgcagg 1500
acttgctgtg ggtgaccagg cccctcatgc agaatggtgg tccagagacc tttacaaagc 1560
tgatgggcat cctgtctgac ctcctgtgtg gctaccccga gggaggtggc tctcgggtgc 1620
tctccttcaa ctggtatgaa gacaataact ataaggcctt tctggggatt gactccacaa 1680
ggaaggatcc tatctattct tatgacagaa gaacaacatc cttttgtaat gcattgatcc 1740
agagcctgga gtcaaatcct ttaaccaaaa tcgcttggag ggcggcaaag cctttgctga 1800
tgggaaaaat cctgtacact cctgattcac ctgcagcacg aaggatactg aagaatgcca 1860
actcaacttt tgaagaactg gaacacgtta ggaagttggt caaagcctgg gaagaagtag 1920
ggccccagat ctggtacttc tttgacaaca gcacacagat gaacatgatc agagataccc 1980
tggggaaccc aacagtaaaa gactttttga ataggcagct tggtgaagaa ggtattactg 2040
ctgaagccat cctaaacttc ctctacaagg gccctcggga aagccaggct gacgacatgg 2100
ccaacttcga ctggagggac atatttaaca tcactgatcg caccctccgc cttgtcaatc 2160
aatacctgga gtgcttggtc ctggataagt ttgaaagcta caatgatgaa actcagctca 2220
cccaacgtgc cctctctcta ctggaggaaa acatgttctg ggccggagtg gtattccctg 2280
acatgtatcc ctggaccagc tctctaccac cccacgtgaa gtataagatc cgaatggaca 2340
tagacgtggt ggagaaaacc aataagatta aagacaggta ttgggattct ggtcccagag 2400
ctgatcccgt ggaagatttc cggtacatct ggggcgggtt tgcctatctg caggacatgg 2460
ttgaacaggg gatcacaagg agccaggtgc aggcggaggc tccagttgga atctacctcc 2520
agcagatgcc ctacccctgc ttcgtggacg attctttcat gatcatcctg aaccgctgtt 2580
tccctatctt catggtgctg gcatggatct actctgtctc catgactgtg aagagcatcg 2640
tcttggagaa ggagttgcga ctgaaggaga ccttgaaaaa tcagggtgtc tccaatgcag 2700
tgatttggtg tacctggttc ctggacagct tctccatcat gtcgatgagc atcttcctcc 2760
tgacgatatt catcatgcat ggaagaatcc tacattacag cgacccattc atcctcttcc 2820
tgttcttgtt ggctttctcc actgccacca tcatgctgtg ctttctgctc agcaccttct 2880
tctccaaggc cagtctggca gcagcctgta gtggtgtcat ctatttcacc ctctacctgc 2940
cacacatcct gtgcttcgcc tggcaggacc gcatgaccgc tgagctgaag aaggctgtga 3000
gcttactgtc tccggtggca tttggatttg gcactgagta cctggttcgc tttgaagagc 3060
aaggcctggg gctgcagtgg agcaacatcg ggaacagtcc cacggaaggg gacgaattca 3120
gcttcctgct gtccatgcag atgatgctcc ttgatgctgc tgtctatggc ttactcgctt 3180
ggtaccttga tcaggtgttt ccaggagact atggaacccc acttccttgg tactttcttc 3240
tacaagagtc gtattggctt ggcggtgaag ggtgttcaac cagagaagaa agagccctgg 3300
aaaagaccga gcccctaaca gaggaaacgg aggatccaga gcacccagaa ggaatacacg 3360
actccttctt tgaacgtgag catccagggt gggttcctgg ggtatgcgtg aagaatctgg 3420
taaagatttt tgagccctgt ggccggccag ctgtggaccg tctgaacatc accttctacg 3480
agaaccagat caccgcattc ctgggccaca atggagctgg gaaaaccacc accttgtcca 3540
tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 3600
aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 3660
tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 3720
aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 3780
ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 3840
cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt 3900
actcgagacg ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca 3960
tgtccactca ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc 4020
agggaaggct ctactgctca ggcaccccac tcttcctgaa gaactgcctg agctacgaga 4080
ccgagatcct gaccgtggag tacggcctgc tgcccatcgg caagatcgtg gagaagcgga 4140
tcgagtgcac cgtgtacagc gtggacaaca acggcaacat ctacacccag cccgtggccc 4200
agtggcacga ccggggcgag caggaggtgt tcgagtactg cctggaggac ggcagcctga 4260
tccgggccac caaggaccac aagttcatga ccgtggacgg ccagatgctg cccatcgacg 4320
agatcttcga gcgggagctg gacctgatgc gggtggacaa cctgcccaac gactacaaag 4380
accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat gacaagtgag 4440
cggccgcttc gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga 4500
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4560
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4620
cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 4680
gataaggatc ttcctagagc atggctacgt agataagtag catggcgggt taatcattaa 4740
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4800
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4860
cgagcgagcg cgcag 4875
<210> 63
<211> 4602
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 63
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360
attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540
atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600
ccaccatggc ggccgccatg atcaagatcg ccacccggaa gtacctgggc aagcagaacg 660
tgtacgacat cggcgtggag cgggaccaca acttcgccct gaagaacggc ttcatcgcca 720
gcaattgctt tggcacaggc ttgtacttaa ccttggtgcg caagatgaaa aacatccaga 780
gccaaaggaa aggcagtgag gggacctgca gctgctcgtc taagggtttc tccaccacgt 840
gtccagccca cgtcgatgac ctaactccag aacaagtcct ggatggggat gtaaatgagc 900
tgatggatgt agttctccac catgttccag aggcaaagct ggtggagtgc attggtcaag 960
aacttatctt ccttcttcca aataagaact tcaagcacag agcatatgcc agccttttca 1020
gagagctgga ggagacgctg gctgaccttg gtctcagcag ttttggaatt tctgacactc 1080
ccctggaaga gatttttctg aaggtcacgg aggattctga ttcaggacct ctgtttgcgg 1140
gtggcgctca gcagaaaaga gaaaacgtca acccccgaca cccctgcttg ggtcccagag 1200
agaaggctgg acagacaccc caggactcca atgtctgctc cccaggggcg ccggctgctc 1260
acccagaggg ccagcctccc ccagagccag agtgcccagg cccgcagctc aacacgggga 1320
cacagctggt cctccagcat gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc 1380
gcagccacaa ggacttcctg gcgcagatcg tgctcccggc tacctttgtg tttttggctc 1440
tgatgctttc tattgttatc cctccttttg gcgaataccc cgctttgacc cttcacccct 1500
ggatatatgg gcagcagtac accttcttca gcatggatga accaggcagt gagcagttca 1560
cggtacttgc agacgtcctc ctgaataagc caggctttgg caaccgctgc ctgaaggaag 1620
ggtggcttcc ggagtacccc tgtggcaact caacaccctg gaagactcct tctgtgtccc 1680
caaacatcac ccagctgttc cagaagcaga aatggacaca ggtcaaccct tcaccatcct 1740
gcaggtgcag caccagggag aagctcacca tgctgccaga gtgccccgag ggtgccgggg 1800
gcctcccgcc cccccagaga acacagcgca gcacggaaat tctacaagac ctgacggaca 1860
ggaacatctc cgacttcttg gtaaaaacgt atcctgctct tataagaagc agcttaaaga 1920
gcaaattctg ggtcaatgaa cagaggtatg gaggaatttc cattggagga aagctcccag 1980
tcgtccccat cacgggggaa gcacttgttg ggtttttaag cgaccttggc cggatcatga 2040
atgtgagcgg gggccctatc actagagagg cctctaaaga aatacctgat ttccttaaac 2100
atctagaaac tgaagacaac attaaggtgt ggtttaataa caaaggctgg catgccctgg 2160
tcagctttct caatgtggcc cacaacgcca tcttacgggc cagcctgcct aaggacagga 2220
gccccgagga gtatggaatc accgtcatta gccaacccct gaacctgacc aaggagcagc 2280
tctcagagat tacagtgctg accacttcag tggatgctgt ggttgccatc tgcgtgattt 2340
tctccatgtc cttcgtccca gccagctttg tcctttattt gatccaggag cgggtgaaca 2400
aatccaagca cctccagttt atcagtggag tgagccccac cacctactgg gtaaccaact 2460
tcctctggga catcatgaat tattccgtga gtgctgggct ggtggtgggc atcttcatcg 2520
ggtttcagaa gaaagcctac acttctccag aaaaccttcc tgcccttgtg gcactgctcc 2580
tgctgtatgg atgggcggtc attcccatga tgtacccagc atccttcctg tttgatgtcc 2640
ccagcacagc ctatgtggct ttatcttgtg ctaatctgtt catcggcatc aacagcagtg 2700
ctattacctt catcttggaa ttatttgaga ataaccggac gctgctcagg ttcaacgccg 2760
tgctgaggaa gctgctcatt gtcttccccc acttctgcct gggccggggc ctcattgacc 2820
ttgcactgag ccaggctgtg acagatgtct atgcccggtt tggtgaggag cactctgcaa 2880
atccgttcca ctgggacctg attgggaaga acctgtttgc catggtggtg gaaggggtgg 2940
tgtacttcct cctgaccctg ctggtccagc gccacttctt cctctcccaa tggattgccg 3000
agcccactaa ggagcccatt gttgatgaag atgatgatgt ggctgaagaa agacaaagaa 3060
ttattactgg tggaaataaa actgacatct taaggctaca tgaactaacc aagatttatc 3120
caggcacctc cagcccagca gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct 3180
ttggcctcct gggagtgaat ggtgccggca aaacaaccac attcaagatg ctcactgggg 3240
acaccacagt gacctcaggg gatgccaccg tagcaggcaa gagtatttta accaatattt 3300
ctgaagtcca tcaaaatatg ggctactgtc ctcagtttga tgcaatcgat gagctgctca 3360
caggacgaga acatctttac ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg 3420
aaaaggttgc aaactggagt attaagagcc tgggcctgac tgtctacgcc gactgcctgg 3480
ctggcacgta cagtgggggc aacaagcgga aactctccac agccatcgca ctcattggct 3540
gcccaccgct ggtgctgctg gatgagccca ccacagggat ggacccccag gcacgccgca 3600
tgctgtggaa cgtcatcgtg agcatcatca gagaagggag ggctgtggtc ctcacatccc 3660
acagcatgga agaatgtgag gcactgtgta cccggctggc catcatggta aagggcgcct 3720
ttcgatgtat gggcaccatt cagcatctca agtccaaatt tggagatggc tatatcgtca 3780
caatgaagat caaatccccg aaggacgacc tgcttcctga cctgaaccct gtggagcagt 3840
tcttccaggg gaacttccca ggcagtgtgc agagggagag gcactacaac atgctccagt 3900
tccaggtctc ctcctcctcc ctggcgagga tcttccagct cctcctctcc cacaaggaca 3960
gcctgctcat cgaggagtac tcagtcacac agaccacact ggaccaggtg tttgtaaatt 4020
ttgctaaaca gcagactgaa agtcatgacc tccctctgca ccctcgagct gctggagcca 4080
gtcgacaagc ccaggacgac tacaaagacc atgacggtga ttataaagat catgacatcg 4140
actacaagga tgacgatgac aagtgagcgg ccgcttcgag cagacatgat aagatacatt 4200
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4260
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4320
aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 4380
taaaacctct acaaatgtgg taaaatcgat aaggatcttc ctagagcatg gctacgtaga 4440
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 4500
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 4560
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ag 4602
<210> 64
<211> 4955
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 64
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gctagcctag tgggccccag aagcctggtg gttgtttgtc cttctcaggg 180
gaaaagtgag gcggcccctt ggaggaaggg gccgggcaga atgatctaat cggattccaa 240
gcagctcagg ggattgtctt tttctagcac cttcttgcca ctcctaagcg tcctccgtga 300
ccccggctgg gatttagcct ggtgctgtgt cagccccggg ctcccagggg cttcccagtg 360
gtccccagga accctcgaca gggccagggc gtctctctcg tccagcaagg gcagggacgg 420
gccacaggca agggcggccg ccatgggctt cgtgagacag atacagcttt tgctctggaa 480
gaactggacc ctgcggaaaa ggcaaaagat tcgctttgtg gtggaactcg tgtggccttt 540
atctttattt ctggtcttga tctggttaag gaatgccaac ccgctctaca gccatcatga 600
atgccatttc cccaacaagg cgatgccctc agcaggaatg ctgccgtggc tccaggggat 660
cttctgcaat gtgaacaatc cctgttttca aagccccacc ccaggagaat ctcctggaat 720
tgtgtcaaac tataacaact ccatcttggc aagggtatat cgagattttc aagaactcct 780
catgaatgca ccagagagcc agcaccttgg ccgtatttgg acagagctac acatcttgtc 840
ccaattcatg gacaccctcc ggactcaccc ggagagaatt gcaggaagag gaattcgaat 900
aagggatatc ttgaaagatg aagaaacact gacactattt ctcattaaaa acatcggcct 960
gtctgactca gtggtctacc ttctgatcaa ctctcaagtc cgtccagagc agttcgctca 1020
tggagtcccg gacctggcgc tgaaggacat cgcctgcagc gaggccctcc tggagcgctt 1080
catcatcttc agccagagac gcggggcaaa gacggtgcgc tatgccctgt gctccctctc 1140
ccagggcacc ctacagtgga tagaagacac tctgtatgcc aacgtggact tcttcaagct 1200
cttccgtgtg cttcccacac tcctagacag ccgttctcaa ggtatcaatc tgagatcttg 1260
gggaggaata ttatctgata tgtcaccaag aattcaagag tttatccatc ggccgagtat 1320
gcaggacttg ctgtgggtga ccaggcccct catgcagaat ggtggtccag agacctttac 1380
aaagctgatg ggcatcctgt ctgacctcct gtgtggctac cccgagggag gtggctctcg 1440
ggtgctctcc ttcaactggt atgaagacaa taactataag gcctttctgg ggattgactc 1500
cacaaggaag gatcctatct attcttatga cagaagaaca acatcctttt gtaatgcatt 1560
gatccagagc ctggagtcaa atcctttaac caaaatcgct tggagggcgg caaagccttt 1620
gctgatggga aaaatcctgt acactcctga ttcacctgca gcacgaagga tactgaagaa 1680
tgccaactca acttttgaag aactggaaca cgttaggaag ttggtcaaag cctgggaaga 1740
agtagggccc cagatctggt acttctttga caacagcaca cagatgaaca tgatcagaga 1800
taccctgggg aacccaacag taaaagactt tttgaatagg cagcttggtg aagaaggtat 1860
tactgctgaa gccatcctaa acttcctcta caagggccct cgggaaagcc aggctgacga 1920
catggccaac ttcgactgga gggacatatt taacatcact gatcgcaccc tccgccttgt 1980
caatcaatac ctggagtgct tggtcctgga taagtttgaa agctacaatg atgaaactca 2040
gctcacccaa cgtgccctct ctctactgga ggaaaacatg ttctgggccg gagtggtatt 2100
ccctgacatg tatccctgga ccagctctct accaccccac gtgaagtata agatccgaat 2160
ggacatagac gtggtggaga aaaccaataa gattaaagac aggtattggg attctggtcc 2220
cagagctgat cccgtggaag atttccggta catctggggc gggtttgcct atctgcagga 2280
catggttgaa caggggatca caaggagcca ggtgcaggcg gaggctccag ttggaatcta 2340
cctccagcag atgccctacc cctgcttcgt ggacgattct ttcatgatca tcctgaaccg 2400
ctgtttccct atcttcatgg tgctggcatg gatctactct gtctccatga ctgtgaagag 2460
catcgtcttg gagaaggagt tgcgactgaa ggagaccttg aaaaatcagg gtgtctccaa 2520
tgcagtgatt tggtgtacct ggttcctgga cagcttctcc atcatgtcga tgagcatctt 2580
cctcctgacg atattcatca tgcatggaag aatcctacat tacagcgacc cattcatcct 2640
cttcctgttc ttgttggctt tctccactgc caccatcatg ctgtgctttc tgctcagcac 2700
cttcttctcc aaggccagtc tggcagcagc ctgtagtggt gtcatctatt tcaccctcta 2760
cctgccacac atcctgtgct tcgcctggca ggaccgcatg accgctgagc tgaagaaggc 2820
tgtgagctta ctgtctccgg tggcatttgg atttggcact gagtacctgg ttcgctttga 2880
agagcaaggc ctggggctgc agtggagcaa catcgggaac agtcccacgg aaggggacga 2940
attcagcttc ctgctgtcca tgcagatgat gctccttgat gctgctgtct atggcttact 3000
cgcttggtac cttgatcagg tgtttccagg agactatgga accccacttc cttggtactt 3060
tcttctacaa gagtcgtatt ggcttggcgg tgaagggtgt tcaaccagag aagaaagagc 3120
cctggaaaag accgagcccc taacagagga aacggaggat ccagagcacc cagaaggaat 3180
acacgactcc ttctttgaac gtgagcatcc agggtgggtt cctggggtat gcgtgaagaa 3240
tctggtaaag atttttgagc cctgtggccg gccagctgtg gaccgtctga acatcacctt 3300
ctacgagaac cagatcaccg cattcctggg ccacaatgga gctgggaaaa ccaccacctt 3360
gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 3420
cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 3480
cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 3540
gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 3600
caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 3660
cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 3720
cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 3780
catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 3840
tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gcctgagcta 3900
cgagaccgag atcctgaccg tggagtacgg cctgctgccc atcggcaaga tcgtggagaa 3960
gcggatcgag tgcaccgtgt acagcgtgga caacaacggc aacatctaca cccagcccgt 4020
ggcccagtgg cacgaccggg gcgagcagga ggtgttcgag tactgcctgg aggacggcag 4080
cctgatccgg gccaccaagg accacaagtt catgaccgtg gacggccaga tgctgcccat 4140
cgacgagatc ttcgagcggg agctggacct gatgcgggtg gacaacctgc ccaacgacta 4200
caaagaccat gacggtgatt ataaagatca tgacatcgac tacaaggatg acgatgacaa 4260
gatcagcctg atcgccgccc tggccgtgga ctacgtgatc ggcatggaga acgccatgcc 4320
ctggaacctg cccgccgacc tggcctggtt caagaggaac accctgaaca agcccgtgat 4380
catgggcagg cacacctggg agagcatcgg caggcccctg cccggcagga agaacatcat 4440
cctgagcagc cagcccagca ccgacgacag ggtgacctgg gtgaagagcg tggacgaggc 4500
catcgccgcc tgcggcgacg tgcccgagat catggtgatc ggcggcggca gggtgatcga 4560
gcagttcctg ccctgattcg agcagacatg ataagataca ttgatgagtt tggacaaacc 4620
acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 4680
tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 4740
tttcaggttc agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt 4800
ggtaaaatcg ataaggatcc aattgaggaa cccctagtga tggagttggc cactccctct 4860
ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4920
gcccgggcgg cctcagtgag cgagcgagcg cgcag 4955
<210> 65
<211> 4929
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 65
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360
attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540
atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600
ccaccatggc ggccgccatg ggcttcgtga gacagataca gcttttgctc tggaagaact 660
ggaccctgcg gaaaaggcaa aagattcgct ttgtggtgga actcgtgtgg cctttatctt 720
tatttctggt cttgatctgg ttaaggaatg ccaacccgct ctacagccat catgaatgcc 780
atttccccaa caaggcgatg ccctcagcag gaatgctgcc gtggctccag gggatcttct 840
gcaatgtgaa caatccctgt tttcaaagcc ccaccccagg agaatctcct ggaattgtgt 900
caaactataa caactccatc ttggcaaggg tatatcgaga ttttcaagaa ctcctcatga 960
atgcaccaga gagccagcac cttggccgta tttggacaga gctacacatc ttgtcccaat 1020
tcatggacac cctccggact cacccggaga gaattgcagg aagaggaatt cgaataaggg 1080
atatcttgaa agatgaagaa acactgacac tatttctcat taaaaacatc ggcctgtctg 1140
actcagtggt ctaccttctg atcaactctc aagtccgtcc agagcagttc gctcatggag 1200
tcccggacct ggcgctgaag gacatcgcct gcagcgaggc cctcctggag cgcttcatca 1260
tcttcagcca gagacgcggg gcaaagacgg tgcgctatgc cctgtgctcc ctctcccagg 1320
gcaccctaca gtggatagaa gacactctgt atgccaacgt ggacttcttc aagctcttcc 1380
gtgtgcttcc cacactccta gacagccgtt ctcaaggtat caatctgaga tcttggggag 1440
gaatattatc tgatatgtca ccaagaattc aagagtttat ccatcggccg agtatgcagg 1500
acttgctgtg ggtgaccagg cccctcatgc agaatggtgg tccagagacc tttacaaagc 1560
tgatgggcat cctgtctgac ctcctgtgtg gctaccccga gggaggtggc tctcgggtgc 1620
tctccttcaa ctggtatgaa gacaataact ataaggcctt tctggggatt gactccacaa 1680
ggaaggatcc tatctattct tatgacagaa gaacaacatc cttttgtaat gcattgatcc 1740
agagcctgga gtcaaatcct ttaaccaaaa tcgcttggag ggcggcaaag cctttgctga 1800
tgggaaaaat cctgtacact cctgattcac ctgcagcacg aaggatactg aagaatgcca 1860
actcaacttt tgaagaactg gaacacgtta ggaagttggt caaagcctgg gaagaagtag 1920
ggccccagat ctggtacttc tttgacaaca gcacacagat gaacatgatc agagataccc 1980
tggggaaccc aacagtaaaa gactttttga ataggcagct tggtgaagaa ggtattactg 2040
ctgaagccat cctaaacttc ctctacaagg gccctcggga aagccaggct gacgacatgg 2100
ccaacttcga ctggagggac atatttaaca tcactgatcg caccctccgc cttgtcaatc 2160
aatacctgga gtgcttggtc ctggataagt ttgaaagcta caatgatgaa actcagctca 2220
cccaacgtgc cctctctcta ctggaggaaa acatgttctg ggccggagtg gtattccctg 2280
acatgtatcc ctggaccagc tctctaccac cccacgtgaa gtataagatc cgaatggaca 2340
tagacgtggt ggagaaaacc aataagatta aagacaggta ttgggattct ggtcccagag 2400
ctgatcccgt ggaagatttc cggtacatct ggggcgggtt tgcctatctg caggacatgg 2460
ttgaacaggg gatcacaagg agccaggtgc aggcggaggc tccagttgga atctacctcc 2520
agcagatgcc ctacccctgc ttcgtggacg attctttcat gatcatcctg aaccgctgtt 2580
tccctatctt catggtgctg gcatggatct actctgtctc catgactgtg aagagcatcg 2640
tcttggagaa ggagttgcga ctgaaggaga ccttgaaaaa tcagggtgtc tccaatgcag 2700
tgatttggtg tacctggttc ctggacagct tctccatcat gtcgatgagc atcttcctcc 2760
tgacgatatt catcatgcat ggaagaatcc tacattacag cgacccattc atcctcttcc 2820
tgttcttgtt ggctttctcc actgccacca tcatgctgtg ctttctgctc agcaccttct 2880
tctccaaggc cagtctggca gcagcctgta gtggtgtcat ctatttcacc ctctacctgc 2940
cacacatcct gtgcttcgcc tggcaggacc gcatgaccgc tgagctgaag aaggctgtga 3000
gcttactgtc tccggtggca tttggatttg gcactgagta cctggttcgc tttgaagagc 3060
aaggcctggg gctgcagtgg agcaacatcg ggaacagtcc cacggaaggg gacgaattca 3120
gcttcctgct gtccatgcag atgatgctcc ttgatgctgc tgtctatggc ttactcgctt 3180
ggtaccttga tcaggtgttt ccaggagact atggaacccc acttccttgg tactttcttc 3240
tacaagagtc gtattggctt ggcggtgaag ggtgttcaac cagagaagaa agagccctgg 3300
aaaagaccga gcccctaaca gaggaaacgg aggatccaga gcacccagaa ggaatacacg 3360
actccttctt tgaacgtgag catccagggt gggttcctgg ggtatgcgtg aagaatctgg 3420
taaagatttt tgagccctgt ggccggccag ctgtggaccg tctgaacatc accttctacg 3480
agaaccagat caccgcattc ctgggccaca atggagctgg gaaaaccacc accttgtcca 3540
tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 3600
aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 3660
tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 3720
aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 3780
ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 3840
cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctctggg gtggaccctt 3900
actcgagacg ctcaatctgg gatctgctcc tgaagtatcg ctcaggcaga accatcatca 3960
tgtccactca ccacatggac gaggccgacc tccttgggga ccgcattgcc atcattgccc 4020
agggaaggct ctactgctca ggcaccccac tcttcctgaa gaactgcttt ggcacaggct 4080
tgtacttaac cttggtgcgc aagatgaaaa acatccagtg cctgagctac gagaccgaga 4140
tcctgaccgt ggagtacggc ctgctgccca tcggcaagat cgtggagaag cggatcgagt 4200
gcaccgtgta cagcgtggac aacaacggca acatctacac ccagcccgtg gcccagtggc 4260
acgaccgggg cgagcaggag gtgttcgagt actgcctgga ggacggcagc ctgatccggg 4320
ccaccaagga ccacaagttc atgaccgtgg acggccagat gctgcccatc gacgagatct 4380
tcgagcggga gctggacctg atgcgggtgg acaacctgcc caacgactac aaagaccatg 4440
acggtgatta taaagatcat gacatcgact acaaggatga cgatgacaag tgagcggccg 4500
cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4560
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4620
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4680
gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4740
gatcttccta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacaa 4800
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4860
cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4920
agcgcgcag 4929
<210> 66
<211> 4548
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 66
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360
attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540
atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600
ccaccatggc ggccgccatg atcaagatcg ccacccggaa gtacctgggc aagcagaacg 660
tgtacgacat cggcgtggag cgggaccaca acttcgccct gaagaacggc ttcatcgcca 720
gcaatagcca aaggaaaggc agtgagggga cctgcagctg ctcgtctaag ggtttctcca 780
ccacgtgtcc agcccacgtc gatgacctaa ctccagaaca agtcctggat ggggatgtaa 840
atgagctgat ggatgtagtt ctccaccatg ttccagaggc aaagctggtg gagtgcattg 900
gtcaagaact tatcttcctt cttccaaata agaacttcaa gcacagagca tatgccagcc 960
ttttcagaga gctggaggag acgctggctg accttggtct cagcagtttt ggaatttctg 1020
acactcccct ggaagagatt tttctgaagg tcacggagga ttctgattca ggacctctgt 1080
ttgcgggtgg cgctcagcag aaaagagaaa acgtcaaccc ccgacacccc tgcttgggtc 1140
ccagagagaa ggctggacag acaccccagg actccaatgt ctgctcccca ggggcgccgg 1200
ctgctcaccc agagggccag cctcccccag agccagagtg cccaggcccg cagctcaaca 1260
cggggacaca gctggtcctc cagcatgtgc aggcgctgct ggtcaagaga ttccaacaca 1320
ccatccgcag ccacaaggac ttcctggcgc agatcgtgct cccggctacc tttgtgtttt 1380
tggctctgat gctttctatt gttatccctc cttttggcga ataccccgct ttgacccttc 1440
acccctggat atatgggcag cagtacacct tcttcagcat ggatgaacca ggcagtgagc 1500
agttcacggt acttgcagac gtcctcctga ataagccagg ctttggcaac cgctgcctga 1560
aggaagggtg gcttccggag tacccctgtg gcaactcaac accctggaag actccttctg 1620
tgtccccaaa catcacccag ctgttccaga agcagaaatg gacacaggtc aacccttcac 1680
catcctgcag gtgcagcacc agggagaagc tcaccatgct gccagagtgc cccgagggtg 1740
ccgggggcct cccgcccccc cagagaacac agcgcagcac ggaaattcta caagacctga 1800
cggacaggaa catctccgac ttcttggtaa aaacgtatcc tgctcttata agaagcagct 1860
taaagagcaa attctgggtc aatgaacaga ggtatggagg aatttccatt ggaggaaagc 1920
tcccagtcgt ccccatcacg ggggaagcac ttgttgggtt tttaagcgac cttggccgga 1980
tcatgaatgt gagcgggggc cctatcacta gagaggcctc taaagaaata cctgatttcc 2040
ttaaacatct agaaactgaa gacaacatta aggtgtggtt taataacaaa ggctggcatg 2100
ccctggtcag ctttctcaat gtggcccaca acgccatctt acgggccagc ctgcctaagg 2160
acaggagccc cgaggagtat ggaatcaccg tcattagcca acccctgaac ctgaccaagg 2220
agcagctctc agagattaca gtgctgacca cttcagtgga tgctgtggtt gccatctgcg 2280
tgattttctc catgtccttc gtcccagcca gctttgtcct ttatttgatc caggagcggg 2340
tgaacaaatc caagcacctc cagtttatca gtggagtgag ccccaccacc tactgggtaa 2400
ccaacttcct ctgggacatc atgaattatt ccgtgagtgc tgggctggtg gtgggcatct 2460
tcatcgggtt tcagaagaaa gcctacactt ctccagaaaa ccttcctgcc cttgtggcac 2520
tgctcctgct gtatggatgg gcggtcattc ccatgatgta cccagcatcc ttcctgtttg 2580
atgtccccag cacagcctat gtggctttat cttgtgctaa tctgttcatc ggcatcaaca 2640
gcagtgctat taccttcatc ttggaattat ttgagaataa ccggacgctg ctcaggttca 2700
acgccgtgct gaggaagctg ctcattgtct tcccccactt ctgcctgggc cggggcctca 2760
ttgaccttgc actgagccag gctgtgacag atgtctatgc ccggtttggt gaggagcact 2820
ctgcaaatcc gttccactgg gacctgattg ggaagaacct gtttgccatg gtggtggaag 2880
gggtggtgta cttcctcctg accctgctgg tccagcgcca cttcttcctc tcccaatgga 2940
ttgccgagcc cactaaggag cccattgttg atgaagatga tgatgtggct gaagaaagac 3000
aaagaattat tactggtgga aataaaactg acatcttaag gctacatgaa ctaaccaaga 3060
tttatccagg cacctccagc ccagcagtgg acaggctgtg tgtcggagtt cgccctggag 3120
agtgctttgg cctcctggga gtgaatggtg ccggcaaaac aaccacattc aagatgctca 3180
ctggggacac cacagtgacc tcaggggatg ccaccgtagc aggcaagagt attttaacca 3240
atatttctga agtccatcaa aatatgggct actgtcctca gtttgatgca atcgatgagc 3300
tgctcacagg acgagaacat ctttaccttt atgcccggct tcgaggtgta ccagcagaag 3360
aaatcgaaaa ggttgcaaac tggagtatta agagcctggg cctgactgtc tacgccgact 3420
gcctggctgg cacgtacagt gggggcaaca agcggaaact ctccacagcc atcgcactca 3480
ttggctgccc accgctggtg ctgctggatg agcccaccac agggatggac ccccaggcac 3540
gccgcatgct gtggaacgtc atcgtgagca tcatcagaga agggagggct gtggtcctca 3600
catcccacag catggaagaa tgtgaggcac tgtgtacccg gctggccatc atggtaaagg 3660
gcgcctttcg atgtatgggc accattcagc atctcaagtc caaatttgga gatggctata 3720
tcgtcacaat gaagatcaaa tccccgaagg acgacctgct tcctgacctg aaccctgtgg 3780
agcagttctt ccaggggaac ttcccaggca gtgtgcagag ggagaggcac tacaacatgc 3840
tccagttcca ggtctcctcc tcctccctgg cgaggatctt ccagctcctc ctctcccaca 3900
aggacagcct gctcatcgag gagtactcag tcacacagac cacactggac caggtgtttg 3960
taaattttgc taaacagcag actgaaagtc atgacctccc tctgcaccct cgagctgctg 4020
gagccagtcg acaagcccag gacgactaca aagaccatga cggtgattat aaagatcatg 4080
acatcgacta caaggatgac gatgacaagt gagcggccgc ttcgagcaga catgataaga 4140
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 4200
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 4260
aacaacaatt gcattcattt tatgtttcag gttcaggggg agatgtggga ggttttttaa 4320
agcaagtaaa acctctacaa atgtggtaaa atcgataagg atcttcctag agcatggcta 4380
cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4440
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4500
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4548
<210> 67
<211> 4695
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 67
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360
attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540
atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600
ccaccatggc ggccgccatg ggcttcgtga gacagataca gcttttgctc tggaagaact 660
ggaccctgcg gaaaaggcaa aagattcgct ttgtggtgga actcgtgtgg cctttatctt 720
tatttctggt cttgatctgg ttaaggaatg ccaacccgct ctacagccat catgaatgcc 780
atttccccaa caaggcgatg ccctcagcag gaatgctgcc gtggctccag gggatcttct 840
gcaatgtgaa caatccctgt tttcaaagcc ccaccccagg agaatctcct ggaattgtgt 900
caaactataa caactccatc ttggcaaggg tatatcgaga ttttcaagaa ctcctcatga 960
atgcaccaga gagccagcac cttggccgta tttggacaga gctacacatc ttgtcccaat 1020
tcatggacac cctccggact cacccggaga gaattgcagg aagaggaatt cgaataaggg 1080
atatcttgaa agatgaagaa acactgacac tatttctcat taaaaacatc ggcctgtctg 1140
actcagtggt ctaccttctg atcaactctc aagtccgtcc agagcagttc gctcatggag 1200
tcccggacct ggcgctgaag gacatcgcct gcagcgaggc cctcctggag cgcttcatca 1260
tcttcagcca gagacgcggg gcaaagacgg tgcgctatgc cctgtgctcc ctctcccagg 1320
gcaccctaca gtggatagaa gacactctgt atgccaacgt ggacttcttc aagctcttcc 1380
gtgtgcttcc cacactccta gacagccgtt ctcaaggtat caatctgaga tcttggggag 1440
gaatattatc tgatatgtca ccaagaattc aagagtttat ccatcggccg agtatgcagg 1500
acttgctgtg ggtgaccagg cccctcatgc agaatggtgg tccagagacc tttacaaagc 1560
tgatgggcat cctgtctgac ctcctgtgtg gctaccccga gggaggtggc tctcgggtgc 1620
tctccttcaa ctggtatgaa gacaataact ataaggcctt tctggggatt gactccacaa 1680
ggaaggatcc tatctattct tatgacagaa gaacaacatc cttttgtaat gcattgatcc 1740
agagcctgga gtcaaatcct ttaaccaaaa tcgcttggag ggcggcaaag cctttgctga 1800
tgggaaaaat cctgtacact cctgattcac ctgcagcacg aaggatactg aagaatgcca 1860
actcaacttt tgaagaactg gaacacgtta ggaagttggt caaagcctgg gaagaagtag 1920
ggccccagat ctggtacttc tttgacaaca gcacacagat gaacatgatc agagataccc 1980
tggggaaccc aacagtaaaa gactttttga ataggcagct tggtgaagaa ggtattactg 2040
ctgaagccat cctaaacttc ctctacaagg gccctcggga aagccaggct gacgacatgg 2100
ccaacttcga ctggagggac atatttaaca tcactgatcg caccctccgc cttgtcaatc 2160
aatacctgga gtgcttggtc ctggataagt ttgaaagcta caatgatgaa actcagctca 2220
cccaacgtgc cctctctcta ctggaggaaa acatgttctg ggccggagtg gtattccctg 2280
acatgtatcc ctggaccagc tctctaccac cccacgtgaa gtataagatc cgaatggaca 2340
tagacgtggt ggagaaaacc aataagatta aagacaggta ttgggattct ggtcccagag 2400
ctgatcccgt ggaagatttc cggtacatct ggggcgggtt tgcctatctg caggacatgg 2460
ttgaacaggg gatcacaagg agccaggtgc aggcggaggc tccagttgga atctacctcc 2520
agcagatgcc ctacccctgc ttcgtggacg attctttcat gatcatcctg aaccgctgtt 2580
tccctatctt catggtgctg gcatggatct actctgtctc catgactgtg aagagcatcg 2640
tcttggagaa ggagttgcga ctgaaggaga ccttgaaaaa tcagggtgtc tccaatgcag 2700
tgatttggtg tacctggttc ctggacagct tctccatcat gtcgatgagc atcttcctcc 2760
tgacgatatt catcatgcat ggaagaatcc tacattacag cgacccattc atcctcttcc 2820
tgttcttgtt ggctttctcc actgccacca tcatgctgtg ctttctgctc agcaccttct 2880
tctccaaggc cagtctggca gcagcctgta gtggtgtcat ctatttcacc ctctacctgc 2940
cacacatcct gtgcttcgcc tggcaggacc gcatgaccgc tgagctgaag aaggctgtga 3000
gcttactgtc tccggtggca tttggatttg gcactgagta cctggttcgc tttgaagagc 3060
aaggcctggg gctgcagtgg agcaacatcg ggaacagtcc cacggaaggg gacgaattca 3120
gcttcctgct gtccatgcag atgatgctcc ttgatgctgc tgtctatggc ttactcgctt 3180
ggtaccttga tcaggtgttt ccaggagact atggaacccc acttccttgg tactttcttc 3240
tacaagagtc gtattggctt ggcggtgaag ggtgttcaac cagagaagaa agagccctgg 3300
aaaagaccga gcccctaaca gaggaaacgg aggatccaga gcacccagaa ggaatacacg 3360
actccttctt tgaacgtgag catccagggt gggttcctgg ggtatgcgtg aagaatctgg 3420
taaagatttt tgagccctgt ggccggccag ctgtggaccg tctgaacatc accttctacg 3480
agaaccagat caccgcattc ctgggccaca atggagctgg gaaaaccacc accttgtcca 3540
tcctgacggg tctgttgcca ccaacctctg ggactgtgct cgttggggga agggacattg 3600
aaaccagcct ggatgcagtc cggcagagcc ttggcatgtg tccacagcac aacatcctgt 3660
tccaccacct cacggtggct gagcacatgc tgttctatgc ccagctgaaa ggaaagtccc 3720
aggaggaggc ccagctggag atggaagcca tgttggagga cacaggcctc caccacaagc 3780
ggaatgaaga ggctcaggac ctatcaggtg gcatgcagag aaagctgtcg gttgccattg 3840
cctttgtggg agatgccaag gtggtgattc tggacgaacc cacctgcctg agctacgaca 3900
ccgagatcct gaccgtggag tacggcatcc tgcccatcgg caagatcgtg gagaagagga 3960
tcgagtgcac cgtgtacagc gtggacaaca acggcaacat ctacacccag cccgtggccc 4020
agtggcacga caggggcgag caggaggtgt tcgagtactg cctggaggac ggcagcctga 4080
tcagggccac caaggaccac aagttcatga ccgtggacgg ccagatgatg cccatcgacg 4140
agatcttcga gagggagctg gacctgatga gggtggacaa cctgcccaac gactacaaag 4200
accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat gacaagtgag 4260
cggccgcttc gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga 4320
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4380
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4440
cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 4500
gataaggatc ttcctagagc atggctacgt agataagtag catggcgggt taatcattaa 4560
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4620
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4680
cgagcgagcg cgcag 4695
<210> 68
<211> 4782
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 68
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcgtt gacattgatt 360
attgactagt acggtaaatg gcccgcctgg ctgatgactc acggggattt ccaagtctcc 420
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 480
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 540
atataagcag agctggttta gtgaactaga gaacccactg cttactggct tctcgagatt 600
ccaccatggc ggccgccatg gtgaaggtga tcggcaggag gagcctgggc gtgcagagga 660
tcttcgacat cggcctgccc cagtaccaca acttcctgct ggccaacggc gccatcgccg 720
ccaactctgg ggtggaccct tactcgagac gctcaatctg ggatctgctc ctgaagtatc 780
gctcaggcag aaccatcatc atgtccactc accacatgga cgaggccgac ctccttgggg 840
accgcattgc catcattgcc cagggaaggc tctactgctc aggcacccca ctcttcctga 900
agaactgctt tggcacaggc ttgtacttaa ccttggtgcg caagatgaaa aacatccaga 960
gccaaaggaa aggcagtgag gggacctgca gctgctcgtc taagggtttc tccaccacgt 1020
gtccagccca cgtcgatgac ctaactccag aacaagtcct ggatggggat gtaaatgagc 1080
tgatggatgt agttctccac catgttccag aggcaaagct ggtggagtgc attggtcaag 1140
aacttatctt ccttcttcca aataagaact tcaagcacag agcatatgcc agccttttca 1200
gagagctgga ggagacgctg gctgaccttg gtctcagcag ttttggaatt tctgacactc 1260
ccctggaaga gatttttctg aaggtcacgg aggattctga ttcaggacct ctgtttgcgg 1320
gtggcgctca gcagaaaaga gaaaacgtca acccccgaca cccctgcttg ggtcccagag 1380
agaaggctgg acagacaccc caggactcca atgtctgctc cccaggggcg ccggctgctc 1440
acccagaggg ccagcctccc ccagagccag agtgcccagg cccgcagctc aacacgggga 1500
cacagctggt cctccagcat gtgcaggcgc tgctggtcaa gagattccaa cacaccatcc 1560
gcagccacaa ggacttcctg gcgcagatcg tgctcccggc tacctttgtg tttttggctc 1620
tgatgctttc tattgttatc cctccttttg gcgaataccc cgctttgacc cttcacccct 1680
ggatatatgg gcagcagtac accttcttca gcatggatga accaggcagt gagcagttca 1740
cggtacttgc agacgtcctc ctgaataagc caggctttgg caaccgctgc ctgaaggaag 1800
ggtggcttcc ggagtacccc tgtggcaact caacaccctg gaagactcct tctgtgtccc 1860
caaacatcac ccagctgttc cagaagcaga aatggacaca ggtcaaccct tcaccatcct 1920
gcaggtgcag caccagggag aagctcacca tgctgccaga gtgccccgag ggtgccgggg 1980
gcctcccgcc cccccagaga acacagcgca gcacggaaat tctacaagac ctgacggaca 2040
ggaacatctc cgacttcttg gtaaaaacgt atcctgctct tataagaagc agcttaaaga 2100
gcaaattctg ggtcaatgaa cagaggtatg gaggaatttc cattggagga aagctcccag 2160
tcgtccccat cacgggggaa gcacttgttg ggtttttaag cgaccttggc cggatcatga 2220
atgtgagcgg gggccctatc actagagagg cctctaaaga aatacctgat ttccttaaac 2280
atctagaaac tgaagacaac attaaggtgt ggtttaataa caaaggctgg catgccctgg 2340
tcagctttct caatgtggcc cacaacgcca tcttacgggc cagcctgcct aaggacagga 2400
gccccgagga gtatggaatc accgtcatta gccaacccct gaacctgacc aaggagcagc 2460
tctcagagat tacagtgctg accacttcag tggatgctgt ggttgccatc tgcgtgattt 2520
tctccatgtc cttcgtccca gccagctttg tcctttattt gatccaggag cgggtgaaca 2580
aatccaagca cctccagttt atcagtggag tgagccccac cacctactgg gtaaccaact 2640
tcctctggga catcatgaat tattccgtga gtgctgggct ggtggtgggc atcttcatcg 2700
ggtttcagaa gaaagcctac acttctccag aaaaccttcc tgcccttgtg gcactgctcc 2760
tgctgtatgg atgggcggtc attcccatga tgtacccagc atccttcctg tttgatgtcc 2820
ccagcacagc ctatgtggct ttatcttgtg ctaatctgtt catcggcatc aacagcagtg 2880
ctattacctt catcttggaa ttatttgaga ataaccggac gctgctcagg ttcaacgccg 2940
tgctgaggaa gctgctcatt gtcttccccc acttctgcct gggccggggc ctcattgacc 3000
ttgcactgag ccaggctgtg acagatgtct atgcccggtt tggtgaggag cactctgcaa 3060
atccgttcca ctgggacctg attgggaaga acctgtttgc catggtggtg gaaggggtgg 3120
tgtacttcct cctgaccctg ctggtccagc gccacttctt cctctcccaa tggattgccg 3180
agcccactaa ggagcccatt gttgatgaag atgatgatgt ggctgaagaa agacaaagaa 3240
ttattactgg tggaaataaa actgacatct taaggctaca tgaactaacc aagatttatc 3300
caggcacctc cagcccagca gtggacaggc tgtgtgtcgg agttcgccct ggagagtgct 3360
ttggcctcct gggagtgaat ggtgccggca aaacaaccac attcaagatg ctcactgggg 3420
acaccacagt gacctcaggg gatgccaccg tagcaggcaa gagtatttta accaatattt 3480
ctgaagtcca tcaaaatatg ggctactgtc ctcagtttga tgcaatcgat gagctgctca 3540
caggacgaga acatctttac ctttatgccc ggcttcgagg tgtaccagca gaagaaatcg 3600
aaaaggttgc aaactggagt attaagagcc tgggcctgac tgtctacgcc gactgcctgg 3660
ctggcacgta cagtgggggc aacaagcgga aactctccac agccatcgca ctcattggct 3720
gcccaccgct ggtgctgctg gatgagccca ccacagggat ggacccccag gcacgccgca 3780
tgctgtggaa cgtcatcgtg agcatcatca gagaagggag ggctgtggtc ctcacatccc 3840
acagcatgga agaatgtgag gcactgtgta cccggctggc catcatggta aagggcgcct 3900
ttcgatgtat gggcaccatt cagcatctca agtccaaatt tggagatggc tatatcgtca 3960
caatgaagat caaatccccg aaggacgacc tgcttcctga cctgaaccct gtggagcagt 4020
tcttccaggg gaacttccca ggcagtgtgc agagggagag gcactacaac atgctccagt 4080
tccaggtctc ctcctcctcc ctggcgagga tcttccagct cctcctctcc cacaaggaca 4140
gcctgctcat cgaggagtac tcagtcacac agaccacact ggaccaggtg tttgtaaatt 4200
ttgctaaaca gcagactgaa agtcatgacc tccctctgca ccctcgagct gctggagcca 4260
gtcgacaagc ccaggacgac tacaaagacc atgacggtga ttataaagat catgacatcg 4320
actacaagga tgacgatgac aagtgagcgg ccgcttcgag cagacatgat aagatacatt 4380
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4440
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4500
aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 4560
taaaacctct acaaatgtgg taaaatcgat aaggatcttc ctagagcatg gctacgtaga 4620
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 4680
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 4740
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ag 4782
<210> 69
<211> 1983
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 69
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ctagtagcac agtgtctggc atgtagcagg aactaaaata atggcagtga 180
ttaatgttat gatatgcaga cacaacacag caagataaga tgcaatgtac cttctgggtc 240
aaaccaccct ggccactcct ccccgatacc cagggttgat gtgcttgaat tagacaggat 300
taaaggctta ctggagctgg aagccttgcc ccaactcagg agtttagccc cagaccttct 360
gtccaccagc gcggccgacc ggccaagggc gaattctgca gatatccatc acactggcat 420
ggatagcact gagaacgtca tcaagccctt catgcgcttc aaggtgcaca tggagggctc 480
cgtgaacggc cacgagttcg agatcgaggg cgagggcgag ggcaagccct acgagggcac 540
ccagaccgcc aagctgcagg tgaccaaggg cggccccctg cccttcgcct gggacatcct 600
gtccccccag ttccagtacg gctccaaggt gtacgtgaag caccccgccg acatccccga 660
ctacaagaag ctgtccttcc ccgagggctt caagtgggag cgcgtgatga acttcgagga 720
cggcggcgtg gtgaccgtga cccaggactc ctccctgcag gacggcacct tcatctacca 780
cgtgaagttc atcggcgtga acttcccctc cgacggcccc gtaatgcaga agaagactct 840
gggctgggag ccctccaccg agcgcctgta cccccgcgac ggcgtgctga agggcgagat 900
ccacaaggcg ctgaagctga agggcggcgg ccactacctg gtggagttca agtcaatcta 960
catggccaag aagcccgtga agctgcccgg ctactactac gtggactcca agctggacat 1020
cacctcccac aacgaggact acaccgtggt ggagcagtac gagcgcgccg aggcccgcca 1080
ccacctgttc cagtagaatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 1140
tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 1200
tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttgctgtc 1260
tctttatgag gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca ctgtgtttgc 1320
tgacgcaacc cccactggtt ggggcattgc caccacctgt cagctccttt ccgggacttt 1380
cgctttcccc ctccctattg ccacggcgga actcatcgcc gcctgccttg cccgctgctg 1440
gacaggggct cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga agctgacgtc 1500
ctttccatgg ctgctcgcct gtgttgccac ctggattctg cgcgggacgt ccttctgcta 1560
cgtcccttcg gccctcaatc cagcggacct tccttcccgc ggcctgctgc cggctctgcg 1620
gcctcttccg cgtcttcggc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 1680
ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 1740
aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 1800
gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggaaggaacc 1860
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 1920
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 1980
cag 1983
<210> 70
<211> 251
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 70
tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga 60
gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 120
tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 180
cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg 240
ggacagtgaa t 251
<210> 71
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 71
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt 57
<210> 72
<211> 3876
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 72
gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60
ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120
aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180
atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240
tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300
gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360
agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420
ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480
catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540
gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600
gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660
gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720
tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780
ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840
catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900
atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960
gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020
gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080
gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140
acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200
gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260
aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320
gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380
ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440
actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500
tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560
ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620
agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680
caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740
gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800
gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860
gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920
agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980
aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040
tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100
ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160
gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220
agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280
attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340
aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400
catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460
tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520
ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580
gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640
acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700
acaagttcct taggaccccc aagtatgcca gttcattatg atagtcaatt agataccact 2760
ctatttggca aaaagtcatc tccccttact gagtctggtg gacctctgag cttgagtgaa 2820
gaaaataatg attcaaagtt gttagaatca ggtttaatga atagccaaga aagttcatgg 2880
ggaaaaaatg tatcgtcaac agagagtggt aggttattta aagggaaaag agctcatgga 2940
cctgctttgt tgactaaaga taatgcctta ttcaaagtta gcatctcttt gttaaagaca 3000
aacaaaactt ccaataattc agcaactaat agaaagactc acattgatgg cccatcatta 3060
ttaattgaga atagtccatc agtctggcaa aatatattag aaagtgacac tgagtttaaa 3120
aaagtgacac ctttgattca tgacagaatg cttatggaca aaaatgctac agctttgagg 3180
ctaaatcata tgtcaaataa aactacttca tcaaaaaaca tggaaatggt ccaacagaaa 3240
aaagagggcc ccattccacc agatgcacaa aatccagata tgtcgttctt taagatgcta 3300
ttcttgccag aatcagcaag gtggatacaa aggactcatg gaaagaactc tctgaactct 3360
gggcaaggcc ccagtccaaa gcaattagta tccttaggac cagaaaaatc tgtggaaggt 3420
cagaatttct tgtctgagaa aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac 3480
gtaggactca aagagatggt ttttccaagc agcagaaacc tatttcttac taacttggat 3540
aatttacatg aaaataatac acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag 3600
aaggaaacat taatccaaga gaatgtagtt ttgcctcaga tacatacagt gactggcact 3660
aagaatttca tgaagaacct tttcttactg agcactaggc aaaatgtaga aggttcatat 3720
gacggggcat atgctccagt acttcaagat tttaggtcat taaatgattc aacaaataga 3780
acaaagaaac acacagctca tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg 3840
ggaaatcaaa ccaagcaaat tgtagagaaa tatgca 3876
<210> 73
<211> 3120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 73
tgcaccacaa ggatatctcc taatacaagc cagcagaatt ttgtcacgca acgtagtaag 60
agagctttga aacaattcag actcccacta gaagaaacag aacttgaaaa aaggataatt 120
gtggatgaca cctcaaccca gtggtccaaa aacatgaaac atttgacccc gagcaccctc 180
acacagatag actacaatga gaaggagaaa ggggccatta ctcagtctcc cttatcagat 240
tgccttacga ggagtcatag catccctcaa gcaaatagat ctccattacc cattgcaaag 300
gtatcatcat ttccatctat tagacctata tatctgacca gggtcctatt ccaagacaac 360
tcttctcatc ttccagcagc atcttataga aagaaagatt ctggggtcca agaaagcagt 420
catttcttac aaggagccaa aaaaaataac ctttctttag ccattctaac cttggagatg 480
actggtgatc aaagagaggt tggctccctg gggacaagtg ccacaaattc agtcacatac 540
aagaaagttg agaacactgt tctcccgaaa ccagacttgc ccaaaacatc tggcaaagtt 600
gaattgcttc caaaagttca catttatcag aaggacctat tccctacgga aactagcaat 660
gggtctcctg gccatctgga tctcgtggaa gggagccttc ttcagggaac agagggagcg 720
attaagtgga atgaagcaaa cagacctgga aaagttccct ttctgagagt agcaacagaa 780
agctctgcaa agactccctc caagctattg gatcctcttg cttgggataa ccactatggt 840
actcagatac caaaagaaga gtggaaatcc caagagaagt caccagaaaa aacagctttt 900
aagaaaaagg ataccatttt gtccctgaac gcttgtgaaa gcaatcatgc aatagcagca 960
ataaatgagg gacaaaataa gcccgaaata gaagtcacct gggcaaagca aggtaggact 1020
gaaaggctgt gctctcaaaa cccaccagtc ttgaaacgcc atcaacggga aataactcgt 1080
actactcttc agtcagatca agaggaaatt gactatgatg ataccatatc agttgaaatg 1140
aagaaggaag attttgacat ttatgatgag gatgaaaatc agagcccccg cagctttcaa 1200
aagaaaacac gacactattt tattgctgca gtggagaggc tctgggatta tgggatgagt 1260
agctccccac atgttctaag aaacagggct cagagtggca gtgtccctca gttcaagaaa 1320
gttgttttcc aggaatttac tgatggctcc tttactcagc ccttataccg tggagaacta 1380
aatgaacatt tgggactcct ggggccatat ataagagcag aagttgaaga taatatcatg 1440
gtaactttca gaaatcaggc ctctcgtccc tattccttct attctagcct tatttcttat 1500
gaggaagatc agaggcaagg agcagaacct agaaaaaact ttgtcaagcc taatgaaacc 1560
aaaacttact tttggaaagt gcaacatcat atggcaccca ctaaagatga gtttgactgc 1620
aaagcctggg cttatttctc tgatgttgac ctggaaaaag atgtgcactc aggcctgatt 1680
ggaccccttc tggtctgcca cactaacaca ctgaaccctg ctcatgggag acaagtgaca 1740
gtacaggaat ttgctctgtt tttcaccatc tttgatgaga ccaaaagctg gtacttcact 1800
gaaaatatgg aaagaaactg cagggctccc tgcaatatcc agatggaaga tcccactttt 1860
aaagagaatt atcgcttcca tgcaatcaat ggctacataa tggatacact acctggctta 1920
gtaatggctc aggatcaaag gattcgatgg tatctgctca gcatgggcag caatgaaaac 1980
atccattcta ttcatttcag tggacatgtg ttcactgtac gaaaaaaaga ggagtataaa 2040
atggcactgt acaatctcta tccaggtgtt tttgagacag tggaaatgtt accatccaaa 2100
gctggaattt ggcgggtgga atgccttatt ggcgagcatc tacatgctgg gatgagcaca 2160
ctttttctgg tgtacagcaa taagtgtcag actcccctgg gaatggcttc tggacacatt 2220
agagattttc agattacagc ttcaggacaa tatggacagt gggccccaaa gctggccaga 2280
cttcattatt ccggatcaat caatgcctgg agcaccaagg agcccttttc ttggatcaag 2340
gtggatctgt tggcaccaat gattattcac ggcatcaaga cccagggtgc ccgtcagaag 2400
ttctccagcc tctacatctc tcagtttatc atcatgtata gtcttgatgg gaagaagtgg 2460
cagacttatc gaggaaattc cactggaacc ttaatggtct tctttggcaa tgtggattca 2520
tctgggataa aacacaatat ttttaaccct ccaattattg ctcgatacat ccgtttgcac 2580
ccaactcatt atagcattcg cagcactctt cgcatggagt tgatgggctg tgatttaaat 2640
agttgcagca tgccattggg aatggagagt aaagcaatat cagatgcaca gattactgct 2700
tcatcctact ttaccaatat gtttgccacc tggtctcctt caaaagctcg acttcacctc 2760
caagggagga gtaatgcctg gagacctcag gtgaataatc caaaagagtg gctgcaagtg 2820
gacttccaga agacaatgaa agtcacagga gtaactactc agggagtaaa atctctgctt 2880
accagcatgt atgtgaagga gttcctcatc tccagcagtc aagatggcca tcagtggact 2940
ctcttttttc agaatggcaa agtaaaggtt tttcagggaa atcaagactc cttcacacct 3000
gtggtgaact ctctagaccc accgttactg actcgctacc ttcgaattca cccccagagt 3060
tgggtgcacc agattgccct gaggatggag gttctgggct gcgaggcaca ggacctctac 3120
<210> 74
<211> 2892
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 74
gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60
ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120
aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180
atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240
tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300
gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360
agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420
ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480
catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540
gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600
gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660
gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720
tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780
ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840
catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900
atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960
gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020
gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080
gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140
acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200
gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260
aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320
gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380
ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440
actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500
tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560
ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620
agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680
caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740
gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800
gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860
gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920
agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980
aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040
tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100
ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160
gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220
agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280
attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340
aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400
catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460
tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520
ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580
gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640
acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700
acaagttcct taggaccccc aagtatgcca gttcattatg atagtcaatt agataccact 2760
ctatttggca aaaagtcatc tccccttact gagtctggtg gacctctgag cttgagtgaa 2820
gaaaataatg attcaaagtt gttagaatca ggtttaatga atagccaaga aagttcatgg 2880
ggaaaaaatg ta 2892
<210> 75
<211> 4104
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 75
tcgtcaacag agagtggtag gttatttaaa gggaaaagag ctcatggacc tgctttgttg 60
actaaagata atgccttatt caaagttagc atctctttgt taaagacaaa caaaacttcc 120
aataattcag caactaatag aaagactcac attgatggcc catcattatt aattgagaat 180
agtccatcag tctggcaaaa tatattagaa agtgacactg agtttaaaaa agtgacacct 240
ttgattcatg acagaatgct tatggacaaa aatgctacag ctttgaggct aaatcatatg 300
tcaaataaaa ctacttcatc aaaaaacatg gaaatggtcc aacagaaaaa agagggcccc 360
attccaccag atgcacaaaa tccagatatg tcgttcttta agatgctatt cttgccagaa 420
tcagcaaggt ggatacaaag gactcatgga aagaactctc tgaactctgg gcaaggcccc 480
agtccaaagc aattagtatc cttaggacca gaaaaatctg tggaaggtca gaatttcttg 540
tctgagaaaa acaaagtggt agtaggaaag ggtgaattta caaaggacgt aggactcaaa 600
gagatggttt ttccaagcag cagaaaccta tttcttacta acttggataa tttacatgaa 660
aataatacac acaatcaaga aaaaaaaatt caggaagaaa tagaaaagaa ggaaacatta 720
atccaagaga atgtagtttt gcctcagata catacagtga ctggcactaa gaatttcatg 780
aagaaccttt tcttactgag cactaggcaa aatgtagaag gttcatatga cggggcatat 840
gctccagtac ttcaagattt taggtcatta aatgattcaa caaatagaac aaagaaacac 900
acagctcatt tctcaaaaaa aggggaggaa gaaaacttgg aaggcttggg aaatcaaacc 960
aagcaaattg tagagaaata tgcatgcacc acaaggatat ctcctaatac aagccagcag 1020
aattttgtca cgcaacgtag taagagagct ttgaaacaat tcagactccc actagaagaa 1080
acagaacttg aaaaaaggat aattgtggat gacacctcaa cccagtggtc caaaaacatg 1140
aaacatttga ccccgagcac cctcacacag atagactaca atgagaagga gaaaggggcc 1200
attactcagt ctcccttatc agattgcctt acgaggagtc atagcatccc tcaagcaaat 1260
agatctccat tacccattgc aaaggtatca tcatttccat ctattagacc tatatatctg 1320
accagggtcc tattccaaga caactcttct catcttccag cagcatctta tagaaagaaa 1380
gattctgggg tccaagaaag cagtcatttc ttacaaggag ccaaaaaaaa taacctttct 1440
ttagccattc taaccttgga gatgactggt gatcaaagag aggttggctc cctggggaca 1500
agtgccacaa attcagtcac atacaagaaa gttgagaaca ctgttctccc gaaaccagac 1560
ttgcccaaaa catctggcaa agttgaattg cttccaaaag ttcacattta tcagaaggac 1620
ctattcccta cggaaactag caatgggtct cctggccatc tggatctcgt ggaagggagc 1680
cttcttcagg gaacagaggg agcgattaag tggaatgaag caaacagacc tggaaaagtt 1740
ccctttctga gagtagcaac agaaagctct gcaaagactc cctccaagct attggatcct 1800
cttgcttggg ataaccacta tggtactcag ataccaaaag aagagtggaa atcccaagag 1860
aagtcaccag aaaaaacagc ttttaagaaa aaggatacca ttttgtccct gaacgcttgt 1920
gaaagcaatc atgcaatagc agcaataaat gagggacaaa ataagcccga aatagaagtc 1980
acctgggcaa agcaaggtag gactgaaagg ctgtgctctc aaaacccacc agtcttgaaa 2040
cgccatcaac gggaaataac tcgtactact cttcagtcag atcaagagga aattgactat 2100
gatgatacca tatcagttga aatgaagaag gaagattttg acatttatga tgaggatgaa 2160
aatcagagcc cccgcagctt tcaaaagaaa acacgacact attttattgc tgcagtggag 2220
aggctctggg attatgggat gagtagctcc ccacatgttc taagaaacag ggctcagagt 2280
ggcagtgtcc ctcagttcaa gaaagttgtt ttccaggaat ttactgatgg ctcctttact 2340
cagcccttat accgtggaga actaaatgaa catttgggac tcctggggcc atatataaga 2400
gcagaagttg aagataatat catggtaact ttcagaaatc aggcctctcg tccctattcc 2460
ttctattcta gccttatttc ttatgaggaa gatcagaggc aaggagcaga acctagaaaa 2520
aactttgtca agcctaatga aaccaaaact tacttttgga aagtgcaaca tcatatggca 2580
cccactaaag atgagtttga ctgcaaagcc tgggcttatt tctctgatgt tgacctggaa 2640
aaagatgtgc actcaggcct gattggaccc cttctggtct gccacactaa cacactgaac 2700
cctgctcatg ggagacaagt gacagtacag gaatttgctc tgtttttcac catctttgat 2760
gagaccaaaa gctggtactt cactgaaaat atggaaagaa actgcagggc tccctgcaat 2820
atccagatgg aagatcccac ttttaaagag aattatcgct tccatgcaat caatggctac 2880
ataatggata cactacctgg cttagtaatg gctcaggatc aaaggattcg atggtatctg 2940
ctcagcatgg gcagcaatga aaacatccat tctattcatt tcagtggaca tgtgttcact 3000
gtacgaaaaa aagaggagta taaaatggca ctgtacaatc tctatccagg tgtttttgag 3060
acagtggaaa tgttaccatc caaagctgga atttggcggg tggaatgcct tattggcgag 3120
catctacatg ctgggatgag cacacttttt ctggtgtaca gcaataagtg tcagactccc 3180
ctgggaatgg cttctggaca cattagagat tttcagatta cagcttcagg acaatatgga 3240
cagtgggccc caaagctggc cagacttcat tattccggat caatcaatgc ctggagcacc 3300
aaggagccct tttcttggat caaggtggat ctgttggcac caatgattat tcacggcatc 3360
aagacccagg gtgcccgtca gaagttctcc agcctctaca tctctcagtt tatcatcatg 3420
tatagtcttg atgggaagaa gtggcagact tatcgaggaa attccactgg aaccttaatg 3480
gtcttctttg gcaatgtgga ttcatctggg ataaaacaca atatttttaa ccctccaatt 3540
attgctcgat acatccgttt gcacccaact cattatagca ttcgcagcac tcttcgcatg 3600
gagttgatgg gctgtgattt aaatagttgc agcatgccat tgggaatgga gagtaaagca 3660
atatcagatg cacagattac tgcttcatcc tactttacca atatgtttgc cacctggtct 3720
ccttcaaaag ctcgacttca cctccaaggg aggagtaatg cctggagacc tcaggtgaat 3780
aatccaaaag agtggctgca agtggacttc cagaagacaa tgaaagtcac aggagtaact 3840
actcagggag taaaatctct gcttaccagc atgtatgtga aggagttcct catctccagc 3900
agtcaagatg gccatcagtg gactctcttt tttcagaatg gcaaagtaaa ggtttttcag 3960
ggaaatcaag actccttcac acctgtggtg aactctctag acccaccgtt actgactcgc 4020
taccttcgaa ttcaccccca gagttgggtg caccagattg ccctgaggat ggaggttctg 4080
ggctgcgagg cacaggacct ctac 4104
<210> 76
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 76
Gly Val Gln Cys Phe Ser Arg
1 5
<210> 77
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 77
Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val
1 5 10 15
Gln Cys Phe Ser Arg Tyr
20
<210> 78
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 78
Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg
1 5 10 15
<210> 79
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 79
Thr Tyr Gly Val Gln Cys Phe Ser Arg
1 5
<210> 80
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 80
Tyr Gly Val Gln Cys Phe Ser Arg
1 5
<210> 81
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 81
Val Gln Cys Phe Ser Arg
1 5
<210> 82
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 82
Gln Cys Phe Ser Arg
1 5
<210> 83
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 83
Lys Asn Cys Phe Gly Thr
1 5
<210> 84
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 84
Lys Asn Cys Phe Gly Thr Gly Leu
1 5
<210> 85
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 85
Lys Asn Cys Phe Gly Thr Gly Leu Tyr
1 5
<210> 86
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 86
Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu
1 5 10
<210> 87
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 87
Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr
1 5 10
<210> 88
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 88
Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr Leu
1 5 10
<210> 89
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 89
Leu Tyr Cys Ser Gly Thr Pro Leu Phe Leu Lys Asn Cys
1 5 10
<210> 90
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 90
Tyr Cys Ser Gly Thr Pro Leu Phe Leu Lys Asn Cys Phe
1 5 10
<210> 91
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 91
Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr Leu Val Arg
1 5 10
<210> 92
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 92
Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr Leu Val Arg Lys Met
1 5 10 15
<210> 93
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 93
Ile Ala Ile Ile Ala Gln Gly Arg Leu Tyr Cys Ser Gly Thr Pro Leu
1 5 10 15
Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr
20 25
<210> 94
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 94
Gln Gly Arg Leu Tyr Cys Ser Gly Thr Pro Leu Phe Leu Lys Asn Cys
1 5 10 15
Phe Gly Thr Gly Leu Tyr Leu Thr Leu Val Arg Lys Met Lys Asn Ile
20 25 30
Gln Ser Gln Arg
35
<210> 95
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 95
Gly Thr Pro Leu Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu
1 5 10 15
Thr Leu Val Arg Lys Met Lys Asn Ile Gln Ser Gln Arg Lys Gly Ser
20 25 30
Glu Gly Thr Cys Ser Cys Ser Ser
35 40
Claims (23)
- 세포에서 코딩 서열을 발현시키기 위한 벡터 시스템으로서, 상기 코딩 서열이 제1 부분(CDS1), 제2 부분(CDS2) 및 선택적으로 제3 부분(CDS3)으로 구성되고, 상기 벡터 시스템이,
a) - 상기 코딩 서열의 상기 제1 부분(CDS1),
- N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
b) - 상기 코딩 서열의 상기 제2 부분(CDS2),
- C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터를 포함하고:
여기서, 제1 벡터 및 제2 벡터가 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물이 단백질 스플라이싱에 의해 생성되고;
또는
상기 벡터 시스템이,
a') - 상기 코딩 서열의 상기 제1 부분(CDS1),
- 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS1의 3' 말단에 위치하는, 제1 인테인 뉴클레오티드 서열을 포함하는, 제1 벡터; 및
b') - 상기 코딩 서열의 상기 제2 부분(CDS2),
- 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 5' 말단에 위치하는, 제2 인테인 뉴클레오티드 서열;
- 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS2의 3' 말단에 위치하는, 제3 인테인 뉴클레오티드 서열을 포함하는, 제2 벡터; 및
c') - 상기 코딩 서열의 상기 제3 부분(CDS3)
- 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열로서, 상기 서열이 CDS3의 5' 말단에 위치하는, 제4 인테인 뉴클레오티드 서열을 포함하는, 제3 벡터를 포함하고;
여기서, 제1 인테인 뉴클레오티드 서열이 제3 인테인 뉴클레오티드 서열과 상이하고, 제2 인테인 서열이 제4 인테인 뉴클레오티드 서열과 상이하며, 여기서 제1 벡터, 제2 벡터, 제3 벡터가 세포에 삽입되는 경우, 코딩 서열의 단백질 생성물이 단백질 트랜스-스플라이싱에 의해 생성되는,
벡터 시스템. - 제1항에 있어서, 제1 인테인, 제2 인테인, 제3 인테인 및 제4 인테인이 분할 인테인을 인코딩하고, 바람직하게는 상기 분할 인테인이 150개 아미노산의 최대 길이를 갖고, 더욱 바람직하게는 상기 분할 인테인이 DnaE 또는 DnaB 인테인인 벡터 시스템.
- 제1항 또는 제2항에 있어서,
- 제1 인테인 뉴클레오티드 서열이 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제2 인테인 뉴클레오티드 서열이 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제3 인테인 뉴클레오티드 서열이 SEQ ID No 1, 3, 5, 7, 9, 11, 13으로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하고;
- 제4 인테인 뉴클레오티드 서열이 SEQ ID No 2, 4, 6, 8, 10, 12, 14로 구성된 군으로부터 선택되는 인테인 또는 이의 변이체 또는 이의 단편 또는 이의 동족체를 인코딩하는,
벡터 시스템. - 제1항 내지 제3항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터가 코딩 서열의 상기 제1 부분(CDS1) 또는 코딩 서열의 상기 제2 부분(CDS2) 또는 코딩 서열의 상기 제3 부분(CDS3)의 5' 말단 부분에 작동 가능하게 연결된 프로모터 서열을 추가로 포함하는 벡터 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터가 5'-말단 반복(5'-TR) 뉴클레오티드 서열 및 3'-말단 반복(3'-TR) 뉴클레오티드 서열을 추가로 포함하고, 바람직하게는 5'-TR이 5'-역 말단 반복(5'-ITR) 뉴클레오티드 서열이고, 3'-TR이 3'-역 말단 반복(3'-ITR) 뉴클레오티드 서열인 벡터 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터가 아데닐중합체형성 신호 뉴클레오티드 서열을 추가로 포함하고/하거나, 제1 벡터 또는 제2 벡터 또는 제3 벡터 중 적어도 하나가 분해 신호를 코딩하는 뉴클레오티드 서열을 추가로 포함하는 벡터 시스템.
- 제6항에 있어서, 분해 신호가 CL1, PB29, SMN, CIITA, ODc, ecDHFR 또는 이들의 단편으로 구성된 군으로부터 선택되는 벡터 시스템.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 코딩 서열이 인코딩된 단백질 생성물의 구조적 도메인 또는 기능적 도메인 내에 속하지 않는 친핵체 아미노산으로 구성된 위치에서 제1 부분, 제2 부분 및 선택적으로 제3 부분으로 분할되며, 상기 친핵체 아미노산이 세린, 트레오닌 또는 시스테인으로부터 선택되는 벡터 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 제1 벡터, 제2 벡터 및 제3 벡터 중 적어도 하나가 코딩 서열에 작동 가능하게 연결된 적어도 하나의 인핸서 또는 조절 뉴클레오티드 서열을 추가로 포함하는 벡터 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 코딩 서열이 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애는 망막 변성, 대사 장애, 혈액 장애, 신경퇴행성 장애, 청력 상실, 채널병증, 폐질환, 근육병증, 심장병인 벡터 시스템.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 코딩 서열이 병리학적 상태 또는 장애를 교정할 수 있는 단백질을 인코딩하며, 바람직하게는 장애가 망막 변성이고, 바람직하게는 망막 변성이 유전되며, 바람직하게는 병리 또는 질병이 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반이상증, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택되는, 벡터 시스템.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 코딩 서열이 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병을 교정할 수 있는 단백질을 인코딩하는 벡터 시스템.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 코딩 서열이 ABCA4, MY07A, CEP290, CDH23, EYS, PCDH15, CACNA1, SNRNP200, RP1, PRPF8, RP1L1, ALMS1, USH2A, GPR98, HMCN1으로 구성된 군으로부터 선택되는 유전자의 코딩 서열인 벡터 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 코딩 서열이 DMD, CFTR, F8, ATP7B, PAH, DYSF, MECP2, PKD, NPC1 HTT로 구성된 군으로부터 선택되는 유전자의 코딩 서열인 벡터 시스템.
- 제1항 내지 제14항 중 어느 한 항에 있어서,
a) 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 코딩 서열(CDS1)의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1)의 5' 말단 부분;
- N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터; 및
b) 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS2)의 3' 말단 부분; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터를 포함하거나;
a') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 코딩 서열(CDS1')의 5' 말단 부분으로서, 상기 5' 말단 부분이 상기 프로모터에 작동가능하게 연결되고 그 제어 하에 있는, 코딩 서열(CDS1')의 5' 말단 부분;
- 제1 N-인테인을 코딩하는 제1 인테인 뉴클레오티드 서열; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제1 벡터; 및
b') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 제1 C-인테인을 코딩하는 제2 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS2')의 제2 부분; 및
- 제2 N-인테인을 코딩하는 제3 인테인 뉴클레오티드 서열;
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제2 벡터; 및
c') 5'-3' 방향으로,
- 5'-역 말단 반복(5'-ITR) 서열;
- 프로모터 서열;
- 제2 C-인테인을 코딩하는 제4 인테인 뉴클레오티드 서열;
- 코딩 서열(CDS3')의 제3 부분; 및
- 3'-역 말단 반복(3'-ITR) 서열을 포함하는, 제3 벡터를 포함하는,
벡터 시스템. - 제1항 내지 제15항 중 어느 한 항에 있어서, 코딩 서열이 ABCA4 유전자를 인코딩하고, 바람직하게는, 상기 코딩 서열이 ABCA4 단백질의 aa Cys1150, Ser1168, Ser1090에 상응하는 뉴클레오티드에서 분할되고, 분할 인테인이 분할 지점에 삽입되거나, 코딩 서열이 CEP290 유전자를 인코딩하고, 바람직하게는, 상기 코딩 서열이 CEP290 단백질의 aa Cys1076; Ser1275에 상응하는 뉴클레오티드에서 분할되고, 바람직하게는, CEP290 유전자를 인코딩하는 코딩 서열이 상기 CEP290 단백질의 aa Cys929 및 1474; Ser 453 및 Cys1474에 상응하는 뉴클레오티드 서열에서 분할되고, 2개의 분할 인테인이 분할 지점에 삽입되는, 벡터 시스템.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 제1, 제2 및 제3 벡터가 독립적으로 바이러스 벡터, 바람직하게는 아데노바이러스 벡터 또는 아데노-관련 바이러스(AAV) 벡터이고, 바람직하게는 상기 제1, 제2 및 제3 아데노-관련 바이러스(AAV) 벡터가 동일하거나 상이한 AAV 혈청형으로부터 선택되고, 바람직하게는 혈청형이 혈청형 2, 혈청형 8, 혈청형 5, 혈청형 7 또는 혈청형 9, 혈청형 7m8, 혈청형 sh10; 혈청형 2(quad Y-F)로부터 선택되는, 벡터 시스템.
- 제1항 내지 제17항 중 어느 한 항에 따른 벡터 시스템으로 형질전환된 숙주 세포.
- 의료 용도를 위한 제1항 내지 제17항 중 어느 한 항에 따른 벡터 시스템 또는 제18항에 따른 숙주 세포.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 유전자 요법에 사용하고, 바람직하게는 망막 변성, 대사 장애, 혈액 장애, 신경변성 장애, 청력 상실, 채널병증, 폐질환, 근육병증, 심장병을 특징으로 하는 병리 또는 질병의 치료 및/또는 예방에 사용하기 위한 벡터 시스템 또는 숙주 세포.
- 제20항에 있어서, 망막 변성이 유전되며, 바람직하게는 병리 또는 질병이 색소성 망막염(RP), 레버 선천성 흑암시(LCA), 스타가르트병(STGD), 어셔병(USH), 알스트롬 증후군, 선천성 비진행성 야맹증(CSNB), 황반 디스트로피, 잠복 황반이상증, ABCA4 유전자의 돌연변이에 의해 유발되는 질병으로 구성된 군으로부터 선택되는 벡터 시스템 또는 숙주 세포.
- 제20항에 있어서, 뒤시엔느 근육 디스트로피, 낭성섬유증, 혈우병 A, 윌슨병, 페닐케톤뇨증, 디스펄린병증, 레트 증후군, 다낭신장병, 니먼-픽 C형, 헌팅턴병의 예방 및/또는 치료에서 사용하기 위한 벡터 시스템 또는 숙주 세포.
- 제1항 내지 제17항 중 어느 한 항에 따른 벡터 시스템 또는 제18항에 따른 숙주 세포 및 약학적으로 허용되는 비히클을 포함하는 약학적 조성물.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18200490.3 | 2018-10-15 | ||
EP18200490 | 2018-10-15 | ||
EP19169116.1 | 2019-04-12 | ||
EP19169116 | 2019-04-12 | ||
PCT/EP2019/078020 WO2020079034A2 (en) | 2018-10-15 | 2019-10-15 | Intein proteins and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210104661A true KR20210104661A (ko) | 2021-08-25 |
Family
ID=68234008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217014221A KR20210104661A (ko) | 2018-10-15 | 2019-10-15 | 인테인 단백질 및 이의 용도 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20210371878A1 (ko) |
EP (1) | EP3867387A2 (ko) |
JP (1) | JP2022512718A (ko) |
KR (1) | KR20210104661A (ko) |
CN (1) | CN113348249A (ko) |
AU (1) | AU2019360372A1 (ko) |
BR (1) | BR112021007221A2 (ko) |
CA (1) | CA3116606A1 (ko) |
IL (1) | IL282362A (ko) |
MX (1) | MX2021004391A (ko) |
SG (1) | SG11202103886XA (ko) |
WO (1) | WO2020079034A2 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021209574A1 (en) | 2020-04-15 | 2021-10-21 | Fondazione Telethon | Constructs comprising inteins |
WO2022056440A1 (en) * | 2020-09-14 | 2022-03-17 | President And Fellows Of Harvard College | Dual-aav vector delivery of pcdh15 and uses thereof |
WO2023004125A2 (en) * | 2021-07-23 | 2023-01-26 | University Of Washington | Generation of large proteins by co-delivery of multiple vectors |
WO2023070527A1 (zh) * | 2021-10-29 | 2023-05-04 | 上海鑫湾生物科技有限公司 | 一种条件控制的可剪接嵌合抗原受体分子及其应用 |
CN114854694A (zh) * | 2022-04-29 | 2022-08-05 | 四川轻化工大学 | 一种高通量筛选新冠药物的荧光素酶互补体系及其构建方法与应用 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3919208A (en) | 1973-10-09 | 1975-11-11 | Yeda Res & Dev | 7-(Cyanomethylaryl)acetamide-cephalosporin derivatives |
US5166331A (en) | 1983-10-10 | 1992-11-24 | Fidia, S.P.A. | Hyaluronics acid fractions, methods for the preparation thereof, and pharmaceutical compositions containing same |
AU7895700A (en) * | 1999-10-15 | 2001-04-30 | Dalhousie University | Method and vector for producing and transferring trans-spliced peptides |
US8394604B2 (en) | 2008-04-30 | 2013-03-12 | Paul Xiang-Qin Liu | Protein splicing using short terminal split inteins |
US20100098772A1 (en) | 2008-10-21 | 2010-04-22 | Allergan, Inc. | Drug delivery systems and methods for treating neovascularization |
US9200045B2 (en) | 2011-03-11 | 2015-12-01 | President And Fellows Of Harvard College | Small molecule-dependent inteins and uses thereof |
AU2012314355B2 (en) * | 2011-09-28 | 2018-01-18 | Zera Intein Protein Solutions, S.L. | Split inteins and uses thereof |
US9197705B2 (en) | 2013-04-12 | 2015-11-24 | Samsung Electronics Co., Ltd. | Method and apparatus for supporting driving using wireless communication network and system thereof |
ES2704677T3 (es) | 2013-04-18 | 2019-03-19 | Fond Telethon | Suministro eficaz de genes grandes por vectores de AAV duales |
NL2013235B1 (en) | 2014-07-22 | 2016-08-16 | Douwe Egberts Bv | Pad for use in a machine for preparing at least one part of a single beverage serving, system including a machine and method for preparing at least one part of a single beverage serving with such a system. |
DK3212778T3 (da) * | 2014-10-28 | 2019-11-04 | Agrivida Inc | Fremgangsmåder og sammensætninger til stabilisering af trans-splejsning af intein-modificerede proteaser |
EP3265571B1 (en) * | 2015-03-03 | 2022-04-13 | Fondazione Telethon | Multiple vector system and uses thereof |
FI3408292T3 (fi) * | 2016-01-29 | 2023-06-30 | Univ Princeton | Jaettuja inteiinejä, joilla on poikkeuksellinen silmukoitumisaktiivisuus |
CA2968112A1 (en) | 2016-05-26 | 2017-11-26 | Op-Hygiene Ip Gmbh | Dispenser servicing in a multiple washroom facility |
KR20190020745A (ko) * | 2016-06-15 | 2019-03-04 | 옥스포드 유니버시티 이노베이션 리미티드 | Abc4a를 발현시키기 위한 이중 중첩 아데노-관련 바이러스 벡터 시스템 |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
-
2019
- 2019-10-15 EP EP19783968.1A patent/EP3867387A2/en active Pending
- 2019-10-15 MX MX2021004391A patent/MX2021004391A/es unknown
- 2019-10-15 BR BR112021007221-7A patent/BR112021007221A2/pt unknown
- 2019-10-15 JP JP2021521008A patent/JP2022512718A/ja active Pending
- 2019-10-15 CA CA3116606A patent/CA3116606A1/en active Pending
- 2019-10-15 KR KR1020217014221A patent/KR20210104661A/ko unknown
- 2019-10-15 AU AU2019360372A patent/AU2019360372A1/en active Pending
- 2019-10-15 WO PCT/EP2019/078020 patent/WO2020079034A2/en unknown
- 2019-10-15 US US17/285,356 patent/US20210371878A1/en active Pending
- 2019-10-15 CN CN201980081288.0A patent/CN113348249A/zh active Pending
- 2019-10-15 SG SG11202103886XA patent/SG11202103886XA/en unknown
-
2021
- 2021-04-18 IL IL282362A patent/IL282362A/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2020079034A2 (en) | 2020-04-23 |
AU2019360372A1 (en) | 2021-06-03 |
IL282362A (en) | 2021-06-30 |
CN113348249A (zh) | 2021-09-03 |
WO2020079034A3 (en) | 2020-06-18 |
MX2021004391A (es) | 2021-08-16 |
CA3116606A1 (en) | 2020-04-23 |
EP3867387A2 (en) | 2021-08-25 |
BR112021007221A2 (pt) | 2021-08-10 |
US20210371878A1 (en) | 2021-12-02 |
JP2022512718A (ja) | 2022-02-07 |
SG11202103886XA (en) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210104661A (ko) | 인테인 단백질 및 이의 용도 | |
JP7011467B2 (ja) | ミスフォールドタンパク質の分解のための組成物及び方法 | |
CN107530399B (zh) | 治疗分子在体外和体内的有效递送 | |
Welch et al. | Actin polymerization is induced by Arp 2/3 protein complex at the surface of Listeria monocytogenes | |
KR102240180B1 (ko) | 다중 벡터 시스템 및 이의 용도 | |
JP2016028604A (ja) | IL−4Rαに結合する涙液リポカリンムテイン | |
JP2024023183A (ja) | 設計されたメガヌクレアーゼを使用した網膜色素変性症の治療 | |
Mercier et al. | The amphipathic alpha helices of the Toxoplasma protein GRA2 mediate postsecretory membrane association | |
US20230151385A1 (en) | Selectable marker proteins, expression vectors, engineered cells and extracellular vesicles for the production of virus-like particles for therapeutic and prophylactic applications | |
CN115461082A (zh) | 用于治疗遗传性黄斑变性的组合物和方法 | |
JP2023504773A (ja) | 眼遺伝子送達のためのaavベクター変異体 | |
CN113874512A (zh) | 诱导毛细胞分化的组合物和方法 | |
CN112601454B (zh) | 用于治疗杜兴肌营养不良的组合物和方法 | |
KR20210057720A (ko) | Clrn1 관련된 청력 손실 및/또는 시력 손실의 치료 방법 | |
JP2001258578A (ja) | 新規FabD | |
US20230064326A1 (en) | OPTOGENETIC COMPOSITIONS COMPRISING A CBh PROMOTER SEQUENCE AND METHODS FOR USE | |
KR20240023126A (ko) | 망막 장애 | |
WO2023143366A1 (zh) | 变异型腺相关病毒及其在疾病治疗中的应用 | |
CN112522276B (zh) | 一种emc1核苷酸序列及其应用 | |
KR20240023127A (ko) | 망막 장애 | |
CN117813321A (zh) | 视网膜病症 | |
US20210290727A1 (en) | MODULATION OF mTORCI ACTIVITY AND AUTOPHAGY VIA CIB2-RHEB INTERACTION | |
CN117043324A (zh) | 用于治疗先天性肌营养不良的治疗性lama2载荷 | |
KR20240005950A (ko) | 벡터 시스템 | |
KR20230125806A (ko) | 선천성 근이영양증의 치료를 위한 치료용 lama2 페이로드 |